VIRTUAL ARENA AI

Producción Académica (Subset Tech/AI)

Recorte técnico de la producción académica indexada: áreas de concentración y brecha ciencia→mercado.

Solo Tech2026-05-29 15:48 UTC (2m ago)
54.957papers en subset·31.041IA·2797Brasil
📄
Total de Artículos
54.957
arXiv + otras fuentes
7 fuentes
🔬
Artículos de IA
31.041
Visión + ML + IA + PLN
56%
🇧🇷
Brasil
2797
autores BR · solo tech
5.1%
📚
Últimos 90 Días
38.338
artículos recientes
+210.8%

Tendencia de Publicación

Comparación entre los últimos 90 días y los 90 días anteriores

210.8%
Últimos 90 días
38.338
90 días anteriores
12.334

Fuentes de Datos

75%
20%
FuenteVolumen%Papel en el PipelineCobertura
arXiv
40.99974.6%Base global de preprints●●●●○
OpenAlex
10.88319.8%Enriquecimiento multidisciplinar●●●○○
OpenAlex University
17093.1%Repositorio institucional●●○○○
OpenAlex Brazil
8011.5%Cobertura Brasil●●○○○
semantic-scholar
3860.7%●○○○○
openalex_dissertations_br
1690.3%●○○○○
BDTD
100.0%Tesis y disertaciones BR●○○○○

Foco Brasil

Cobertura por Fuente
Total Brasil · tech2797
autores BR · filtro tech/IA aplicado
OpenAlex Brazil801
indexados vía OpenAlex
BDTD (teses/dissertações): 10 ítems — base insuficiente para gráfico; integración parcial en curso.
Asimetría de Cobertura

De 2797 papers brasileños, solo 801 están indexados vía OpenAlex y 10 vía BDTD. La cobertura real de Brasil es parcial y sesgada hacia CS/Physics vía arXiv.

⚠ Ausencia de indexación ≠ ausencia de producción. Repositorios institucionales de 15 universidades aún no están totalmente integrados.

Áreas de Investigación

Ranking por volumen de publicaciones. Visión por Computadora lidera, seguida por Aprendizaje Automático. (recuento por categoría primaria arXiv — difiere de "Investigación vs Mercado" abajo, que usa taxonomy_bridge y tiene volúmenes menores)

Computer Visioncs.CV
10.643
Machine Learningcs.LG
9511
NLP & Computational Ling.cs.CL
5508
Artificial Intelligencecs.AI
5379
Roboticscs.RO
3439
Computer Science (General)Computer science
2500
Cryptography & Securitycs.CR
1188
Statistical MLstat.ML
820
Otras áreas (12)
3779

Papers por Institución

⚠ Datos institucionales con ~48 días de retraso (OpenAlex). Los conteos de papers son acumulados históricos.

#InstituciónPapers%
1Universidade de São Paulo
35411.1%
2National University of Singapore
31710.0%
3Universidade Estadual de Campinas (UNICAMP)
2487.8%
4Universidade Federal de Pernambuco
2216.9%
5Centre National de la Recherche Scientifique
2146.7%
6KU Leuven
2136.7%
7ETH Zurich
1966.2%
8Universidade Federal de Minas Gerais
1936.1%
9Universidade Federal Fluminense
1895.9%
10Universidade Federal de Santa Catarina
1885.9%
11Universidade Federal da Bahia
1785.6%
12Delft University of Technology
1775.6%
13Universidade Federal do Ceará
1735.4%
14Nagoya University
1635.1%
15Universidade Federal do Rio Grande do Sul
1605.0%

Investigación vs Mercado

Cada fila compara el volumen de papers (investigación) con vacantes (mercado) via taxonomy_bridge v0.1. Los volúmenes de artículos aquí son menores que los totales de "Áreas de Investigación" porque taxonomy_bridge usa matching semántico por tema.

Investigación (artículos)
Mercado (vacantes)
Full Stack
1.1K/34.8K
Machine Learning
30.4K/2.7K
GenAI / LLMs
21.4K/66
MLOps
16.0K/63
Frontend / HCI
998/9.9K
Distributed Computing
906/6.0K
Cybersecurity
1.7K/3.9K
Data Engineering
879/2.6K
QA/Testing
1.1K/164
UX/UI Design
998/117
Research→Market Gap

31.041 artículos de IA representan la mayor concentración de producción académica. La tasa de conversión investigación→vacantes permanece estructuralmente baja.

E1Robotics (cs.RO) es la 5ª área en artículos pero apenas aparece en vacantes.
E2Software Engineering tiene alto volumen de vacantes comparado con artículos.
CSGenAI/LLMs tiene alta producción académica (21.4K artículos via taxonomy_bridge) pero pocas vacantes explícitas (66), sugiriendo que el matching por título subestima la demanda real.
Metodología y Limitaciones
Cobertura

arXiv domina con ~79%. Sesgo hacia CS/Physics. Medicina, ingeniería y humanidades subrepresentadas.

Taxonomía

taxonomy_bridge v0.1 con matching por arxiv_category y job_keyword (regex word-boundary). Cobertura inicial — temas específicos pueden tener matching débil.

Limitación principal

Sin datos de citación/impacto para artículos de arXiv. Artículos brasileños frecuentemente sin institución identificada (campo NULL).

Fuente dominante

arXiv (75%)

Términos Más Frecuentes

LLM (10.195)Computer science (9539)Multimodal (4084)Reinforcement Learning (3863)Artificial intelligence (3406)Diffusion Models (3203)Engineering (1199)Process (computing) (979)Work (physics) (868)Medicine (863)Context (archaeology) (841)Key (lock) (831)Physics (796)Machine learning (774)Mathematics (738)