La IA en matemáticas avanzadas ha alcanzado un hito histórico. Los modelos AlphaProof y AlphaGeometry 2 de Google DeepMind han resuelto problemas de la Olimpiada Internacional de Matemáticas (IMO) a nivel de medallista de plata. Este logro demuestra el potencial de la inteligencia artificial para abordar desafíos matemáticos complejos. Los sistemas de IA resolvieron 4 de 6 problemas propuestos, obteniendo una puntuación de 28 sobre 42. El avance abre nuevas posibilidades en la resolución de problemas matemáticos y el descubrimiento científico.
Un hito en el razonamiento matemático
Los sistemas de IA de Google DeepMind han resuelto 4 de los 6 problemas propuestos en la IMO 2024, obteniendo una puntuación de 28 sobre 42. Este resultado es equivalente a una medalla de plata en la competición, quedando a solo un punto del umbral de la medalla de oro. Este es un gran éxito para la IA en matemáticas avanzadas.
¿Por qué es importante? Este logro demuestra el potencial de la IA para abordar problemas matemáticos complejos al nivel de los mejores matemáticos jóvenes del mundo.
Cómo funciona el sistema
El éxito se basa en la combinación de dos modelos:
- AlphaProof: Un nuevo sistema para razonamiento formal que:
- Se entrena a sí mismo para probar teoremas matemáticos.
- Utiliza el lenguaje formal Lean.
- Combina un modelo de lenguaje pre-entrenado con el algoritmo de aprendizaje por refuerzo AlphaZero.
- AlphaGeometry 2: Una versión mejorada del sistema original que:
- Es un sistema híbrido neurosimbólico.
- Se basa en el modelo de lenguaje Gemini.
- Ha sido entrenado con una cantidad significativamente mayor de datos sintéticos.
Rendimiento impresionante
- AlphaProof resolvió dos problemas de álgebra y uno de teoría de números.
- AlphaGeometry 2 solucionó el problema de geometría.
- Uno de los problemas fue resuelto en minutos, mientras que otros requirieron hasta tres días.
Evaluación y validación
Las soluciones fueron evaluadas por matemáticos destacados, incluyendo al ganador de la Medalla Fields, el profesor Sir Timothy Gowers, quien quedó impresionado por la capacidad del programa para generar construcciones no obvias.
Implicaciones futuras
Este avance sugiere un potencial creciente para la IA en:
- La resolución de problemas matemáticos complejos.
- El descubrimiento de nuevos conocimientos en ciencia y tecnología.
Desafíos pendientes
A pesar del éxito, quedan retos por superar:
- Dos problemas de combinatoria no pudieron ser resueltos.
- El tiempo de resolución para algunos problemas fue significativamente mayor que el permitido en la competición humana.
Conclusión
El logro de Google DeepMind marca un hito en la capacidad de la IA para el razonamiento matemático avanzado. Aunque aún hay camino por recorrer, este avance nos acerca a un futuro donde la IA podría desempeñar un papel crucial en el progreso científico y tecnológico.
Las principales familias de IA incluyen: los modelos Transformers, destacados en procesamiento de lenguaje; los modelos de difusión, enfocados en generación de imágenes; y el aprendizaje por refuerzo, que permite a las IAs como AlphaProof aprender estrategias mediante interacción con el entorno y permite entrenarse a ellas mismas y automejorarse.
AlphaProof de Google DeepMind, en la IMO 2024, acertó cuatro de seis problemas matemáticos complejos, un rendimiento comparable al de los mejores humanos. El problema 5, donde falló, ofrece valiosas lecciones para mejorar la IA, tema que abordaré en un futuro artículo.
Comentarios