VIRTUAL ARENA AI

Produção Acadêmica (Subset Tech/AI)

Recorte técnico da produção acadêmica indexada: áreas de concentração e lacuna ciência→mercado.

Apenas Tech29/05/2026 15:12 UTC (2min atrás)
54.957papers no subset·31.041IA·2.797Brasil
📄
Total de Artigos
54.957
arXiv + outras fontes
7 fontes
🔬
Artigos de IA
31.041
Visão + ML + IA + PLN
56%
🇧🇷
Brasil
2.797
autores BR · somente tech
5.1%
📚
Últimos 90 Dias
38.338
artigos recentes
+210.8%

Tendência de Publicação

Comparação entre os últimos 90 dias e os 90 dias anteriores

210.8%
Últimos 90 dias
38.338
90 dias anteriores
12.334

Fontes de Dados

75%
20%
FonteVolume%Papel no PipelineCobertura
arXiv
40.99974.6%Base global de preprints●●●●○
OpenAlex
10.88319.8%Enriquecimento multi-disciplinar●●●○○
OpenAlex University
1.7093.1%Repositório institucional●●○○○
OpenAlex Brazil
8011.5%Cobertura Brasil●●○○○
semantic-scholar
3860.7%●○○○○
openalex_dissertations_br
1690.3%●○○○○
BDTD
100.0%Teses e dissertações BR●○○○○

Foco Brasil

Cobertura por Fonte
Total Brasil · tech2.797
autores BR · filtro tech/IA aplicado
OpenAlex Brazil801
indexados via OpenAlex
BDTD (teses/dissertações): 10 itens — base insuficiente para gráfico; integração parcial em andamento.
Assimetria de Cobertura

De 2.797 papers brasileiros, apenas 801 estão indexados via OpenAlex e 10 via BDTD. A cobertura real do Brasil é parcial e enviesada para CS/Physics via arXiv.

⚠ Ausência de indexação ≠ ausência de produção. Repositórios institucionais de 15 universidades ainda não estão totalmente integrados.

Áreas de Pesquisa

Ranking por volume de publicações. Visão Computacional lidera, seguida por Aprendizado de Máquina. (contagem por categoria primária arXiv — difere do painel "Pesquisa vs Mercado" abaixo, que usa taxonomy_bridge e produz volumes menores)

Visão Computacionalcs.CV
10.643
Aprendizado de Máquinacs.LG
9.511
PLN e Linguística Computacionalcs.CL
5.508
Inteligência Artificialcs.AI
5.379
Robóticacs.RO
3.439
Ciência da Computação (Geral)Computer science
2.500
Criptografia e Segurançacs.CR
1.188
ML Estatísticostat.ML
820
Outras áreas (12)
3.779

Papers por Instituição

⚠ Dados institucionais com defasagem de ~48 dias (OpenAlex). Counts de papers são acumulados historicamente.

#InstituiçãoPapers%
1Universidade de São Paulo
35411.1%
2National University of Singapore
31710.0%
3Universidade Estadual de Campinas (UNICAMP)
2487.8%
4Universidade Federal de Pernambuco
2216.9%
5Centre National de la Recherche Scientifique
2146.7%
6KU Leuven
2136.7%
7ETH Zurich
1966.2%
8Universidade Federal de Minas Gerais
1936.1%
9Universidade Federal Fluminense
1895.9%
10Universidade Federal de Santa Catarina
1885.9%
11Universidade Federal da Bahia
1785.6%
12Delft University of Technology
1775.6%
13Universidade Federal do Ceará
1735.4%
14Nagoya University
1635.1%
15Universidade Federal do Rio Grande do Sul
1605.0%

Pesquisa vs Mercado

Cada linha compara o volume de papers (pesquisa) com o volume de vagas (mercado) via taxonomy_bridge v0.1. Os volumes de artigos aqui são menores que os totais de "Áreas de Pesquisa" acima porque taxonomy_bridge usa matching semântico por tema — não conta a categoria arXiv inteira.

Pesquisa (artigos)
Mercado (vagas)
Full Stack
1.1K/34.8K
Machine Learning
30.4K/2.7K
GenAI / LLMs
21.4K/66
MLOps
16.0K/63
Frontend / HCI
998/9.9K
Distributed Computing
906/6.0K
Cybersecurity
1.7K/3.9K
Data Engineering
879/2.6K
QA/Testing
1.1K/164
UX/UI Design
998/117
Research→Market Gap

31.041 artigos de IA representam a maior concentração de produção acadêmica. A taxa de conversão pesquisa→vagas permanece estruturalmente baixa.

E1Robotics (cs.RO) é a 5ª área em artigos mas praticamente não aparece em vagas.
E2Software Engineering tem volume alto de vagas comparado a papers.
CSGenAI/LLMs tem alta produção acadêmica (21.4K artigos via taxonomy_bridge) mas poucas vagas explícitas (66), sugerindo que o matching por título subestima a demanda real.
Metodologia e Limitações
Cobertura

arXiv domina com ~79%. Viés para CS/Physics. Medicina, engenharia e humanidades sub-representadas.

Taxonomia

taxonomy_bridge v0.1 com matching por arxiv_category e job_keyword (regex word-boundary). Cobertura inicial — temas estreitos podem ter matching fraco.

Limitação principal

Sem dados de citação/impacto para artigos do arXiv. Artigos brasileiros frequentemente sem instituição identificada (campo NULL).

Fonte dominante

arXiv (75%)

Termos Mais Frequentes

LLM (10.195)Computer science (9.539)Multimodal (4.084)Reinforcement Learning (3.863)Artificial intelligence (3.406)Diffusion Models (3.203)Engineering (1.199)Process (computing) (979)Work (physics) (868)Medicine (863)Context (archaeology) (841)Key (lock) (831)Physics (796)Machine learning (774)Mathematics (738)