Gemini es una inteligencia artificial innovadora desarrollada por Google y DeepMind. Se integrará directamente en las aplicaciones de Google y viene en tres modelos: Ultra, Pro y Nano. Gemini es multimodal, puede reconocer imágenes y hablar en tiempo real. Con una puntuación del 90%, Gemini Ultra es el primer modelo de IA que supera a los expertos humanos en el benchmark MMLU.
Características de Gemini
Gemini tiene capacidades de próxima generación como:
- el razonamiento sofisticado,
- la multimodalidad y
- la codificación avanzada.
Es superior en matemáticas y codificación en comparación con ChatGPT (GPT-4), que no puede realizar matemáticas. Gemini tiene una increíble comprensión de la ciencia. Puede encontrar y extraer investigaciones de miles de documentos de investigación.
Como Gemini es multimodal, no solo puede entender el texto, sino también los gráficos a través de imágenes.
Modelos de Gemini
Gemini viene en tres tamaños: Ultra para tareas complejas, Pro para escalar en una variedad de tareas y Nano para tareas eficientes en el dispositivo. Pro estará en los productos de Google a través de Bard a partir de hoy. Ultra se lanzará a principios del próximo año. Nano estará disponible en Pixel.
Rendimiento de Gemini
El rendimiento de Gemini Ultra supera los resultados actuales de vanguardia en 30 de los 32 benchmarks utilizados en la investigación y desarrollo de LLM. Gemini Pro estará disponible de forma gratuita en Bard y en todas las aplicaciones de Google hoy. En seis de los ocho benchmarks, Gemini Pro superó a GPT-3.5, lo que lo convierte en ‘el chatbot gratuito más potente del mercado hoy’. Gemini Nano ahora alimenta las características generativas de IA en el dispositivo para Pixel 8 Pro.
Una última idea
Gemini es una inteligencia artificial multimodal prometedora que mejora las habilidades de razonamiento de los modelos de lenguaje, permitiendo abordar problemas complejos y multietapa. Su capacidad para reconocer contenido escrito a mano, verificar el razonamiento y generar LATEX a partir de instrucciones muestra un gran potencial para construir agentes generalistas que puedan enfrentar desafíos más difíciles en diversos dominios.
Recordemos que LaTeX es un sistema de escritura y preparación de documentos que permite trabajar con formatos estandarizados. Permite escribir un artículo o tesis completa, y definir o cambiar el estilo al final para adaptarlo al medio. La mayoría de las revistas científicas y congresos proveen un archivo de estilo para utilizar en LaTeX, por lo que no tenemos que preocuparnos de si estamos definiendo el formato correctamente
Enlaces:
- Informe técnico - https://storage.googleapis.com/deepmind-media/gemini/gemini_1_report.pdf
- Acceso a Gemini (accesible de momento solo en inglés y fuera de Europa) - https://bard.google.com/chat









Comentarios