Todos hemos oído la expresión «aprender de los mejores«. En el mundo de la inteligencia artificial (IA), esto es más cierto que nunca.
Los modelos de lenguaje de menor tamaño (LLMs) están mejorando sus capacidades al aprender de los grandes modelos fundacionales (LFMs), tal como un pequeño pez sigue a un pez más grande y sabio para aprender de sus habilidades.
Descubre cómo Orca, un modelo de IA en desarrollo, está cambiando el juego al imitar el proceso de razonamiento de los LFMs.
Aprendizaje por imitación: la clave del éxito
El aprendizaje por imitación ha sido un enfoque reciente para mejorar las habilidades de los LLMs. Estos modelos más pequeños aprenden al observar las salidas generadas por los LFMs, imitando sus movimientos y habilidades. Sin embargo, hay desafíos, como la falta de señales de imitación sólidas y la sobreestimación de las capacidades de los modelos pequeños.
Orca: siguiendo los pasos de los gigantes
Para superar estos desafíos, se ha desarrollado Orca, un modelo de 13 mil millones de parámetros que aprende a imitar el proceso de razonamiento de los LFMs. Orca se nutre de las señales ricas de GPT-4, como rastros de explicación, procesos de pensamiento paso a paso y otras instrucciones complejas, guiado por la asistencia del maestro de ChatGPT.
Datos de imitación: la base del aprendizaje
Orca utiliza datos de imitación a gran escala y diversos, con un muestreo y selección cuidadosos. Los resultados son sorprendentes: Orca supera a modelos afinados convencionales, como Vicuna-13B, en un 100% en pruebas de razonamiento complejas como Big-Bench Hard (BBH) y en un 42% en AGIEval.
Rivalizando con los mejores
Orca alcanza la paridad con ChatGPT en el índice BBH y muestra un rendimiento competitivo en exámenes profesionales y académicos como SAT, LSAT, GRE y GMAT, aunque todavía sigue a GPT-4.
La sabiduría de aprender de los demás
Como bien dijo Confucio, «Cuando veo a una persona virtuosa, trato de seguirla. Cuando veo a una persona no virtuosa, me examino a mí mismo«. La IA sigue este principio al aprender de modelos más avanzados. Imagina que la IA es como un niño aprendiendo a caminar.
Al principio, el niño observa a los adultos y trata de imitar sus movimientos. Con el tiempo, el niño perfecciona su habilidad y se convierte en un caminante seguro. Del mismo modo, los LLMs aprenden de los LFMs y mejoran sus habilidades paso a paso.
La investigación sugiere que aprender de las explicaciones paso a paso, ya sea generadas por humanos o modelos de IA más avanzados, es una dirección prometedora para mejorar las capacidades y habilidades de los modelos. Al aprender de los mejores, los LLMs pueden mejorar y expandir sus habilidades, beneficiando a la humanidad con soluciones más accesibles y eficientes.
Comentarios