El Instituto Tecnológico de Massachusetts (MIT) ha puesto en línea MathNet, una base de datos verificada que reúne más de 30 000 problemas y sus soluciones de nivel olímpico. El portal está disponible sin coste para cualquier usuario que quiera consultar o reutilizar el material.
Compilación y verificación
El proyecto partió de la localización de 1 595 volúmenes, que suman más de 25 000 páginas, procedentes de 47 países, 17 idiomas y 143 competiciones internacionales. Un equipo de 30 evaluadores de distintas naciones revisó cada problema y su solución, asegurando que solo se incluyan cuadernillos oficiales revisados por pares.
Un repositorio unificado
Hasta ahora los problemas olímpicos estaban dispersos en archivos nacionales y en colecciones privadas. MathNet los agrupa en una única plataforma, lo que facilita la búsqueda y la comparación entre ejercicios de distintas regiones. Este enfoque permite a los docentes y a los estudiantes acceder a material que antes era difícil de obtener.
Benchmark multimodal para IA
Los investigadores del MIT presentaron MathNet como benchmark multimodal en la Conferencia Internacional sobre Representaciones del Aprendizaje (ICLR 2026) en Brasil. El objetivo es medir no solo la capacidad de cálculo de los modelos, sino también su razonamiento, recuperación de información y transferencia de conocimientos entre problemas.
Los primeros ensayos mostraron que modelos avanzados como GPT‑5 y Gemini‑3.1‑Pro alcanzan un 69,3 % de éxito en la prueba de 6 400 problemas. La precisión disminuye cuando aparecen figuras complejas o idiomas menos frecuentes, lo que evidencia limitaciones importantes.
Dificultades en la recuperación de equivalencias
Los sistemas de IA apenas aciertan en menos del 5 % de los casos al intentar encontrar un problema estructuralmente equivalente en el primer intento. Este dato subraya la brecha entre la capacidad de razonamiento humano y la de los algoritmos actuales.
Impacto para la comunidad educativa
Al estar abierto, MathNet se convierte en una herramienta de estudio para alumnos de bachillerato y universitarios que se preparan para olimpiadas de matemáticas. Además, los profesores pueden diseñar ejercicios basados en casos reales y actualizar sus materiales con facilidad.
Uso por parte de investigadores
Los científicos de aprendizaje automático pueden entrenar y validar sus modelos con un conjunto de datos homogéneo y exhaustivo. La disponibilidad de soluciones oficiales permite comparar resultados de forma rigurosa y reproducir experimentos sin ambigüedades.
Retos futuros para la IA
Los autores del proyecto advierten que los modelos deben mejorar su capacidad de abstracción y de reconocimiento visual para superar la barrera actual. El próximo objetivo es elevar la tasa de éxito por encima del 80 % mediante arquitecturas híbridas que integren razonamiento simbólico y aprendizaje profundo.
Perspectivas de desarrollo
El MIT planea actualizar MathNet cada año, incorporando nuevos problemas de competiciones recientes y ampliando la cobertura de idiomas. Esta renovación continua mantendrá el benchmark relevante y fomentará la innovación en IA matemática.
Llamado a la comunidad
Los desarrolladores y académicos están invitados a utilizar MathNet como base para nuevos experimentos y a compartir sus hallazgos en foros especializados. La colaboración abierta acelerará el progreso tanto en la enseñanza de la matemática como en la creación de sistemas de IA más competentes.
MathNet abre una puerta inédita para el estudio y la investigación matemática, al tiempo que plantea un reto claro a la IA: superar el 70 % de aciertos y acercarse al nivel de los mejores estudiantes humanos. El futuro de la matemática olímpica y de la inteligencia artificial está, ahora, más interconectado que nunca.