Todos hemos oído hablar de los modelos de lenguaje de última generación como GPT-4, pero ¿qué pasa si te dijera que hay un nuevo modelo en la ciudad que está llevando las cosas al siguiente nivel?
Hoy, voy a presentarte a Gorilla, un modelo LLaMA afinado que supera a GPT-4 en la escritura de llamadas API.
¿Estás listo para sumergirte en este emocionante avance?
El nacimiento de un gigante: Gorilla y su potencial
Gorilla es un modelo de lenguaje basado en LLaMA que ha sido cuidadosamente afinado para mejorar su capacidad de escribir llamadas API. Puedes aprender más sobre Gorilla en su artículo publicado. Este increíble avance no solo permite identificar la API adecuada, sino que también mejora la habilidad de los modelos de lenguaje de última generación (LLMs) para interactuar con herramientas externas y completar tareas específicas.
Hay un enorme potencial en LLMs como Gorilla para seguir mejorando las capacidades en LLMs y reducir los problemas relacionados con la alucinación y la fiabilidad.
¿Cómo funciona Gorilla?

Esquema de funcionamiento de Gorilla
El funcionamiento de Gorilla se divide en dos partes principales. La primera parte muestra cómo se entrena el modelo, mientras que la segunda parte muestra cómo realiza la inferencia (ya sea utilizando recuperación o enfoque de «zero-shot«).
Esta capa adicional es esencial para mejorar la fiabilidad y la efectividad de los LLMs que interactúan con herramientas e información externas.
Recordemos que el aprendizaje zero-shot es un enfoque de aprendizaje automático en el que un modelo aprende a clasificar objetos o datos sin haber visto ejemplos de todas las clases posibles. En lugar de eso, el modelo utiliza información adicional, como descripciones de las clases, para hacer predicciones.
Comparando Gorilla con otros modelos de lenguaje
Gorilla ha sido comparado con otros LLMs notables como ChatGPT, GPT-4, LLaMA y Claude en términos de precisión y reducción de errores de alucinación. La comparación se realizó utilizando enfoques como el «zero-shot», BM25 retriever, GPT-retriever y más.
Los resultados de Gorilla son impresionantes, especialmente en el rendimiento en los diferentes hubs de modelos utilizados, como TorchHub, TensorHub y HuggingFace. Gorilla muestra un fuerte rendimiento en todos ellos.
El poder del retriever: Aumentando la precisión y reduciendo alucinaciones
La evaluación de Gorilla también demuestra cómo el retriever puede contribuir a aumentar la precisión y reducir las alucinaciones. Los resultados son sólidos en las diferentes APIs, lo que indica que Gorilla realmente está cambiando las reglas del juego en el ámbito de los modelos de lenguaje.
El futuro de Gorilla y su impacto en el mundo de la IA
Los autores de Gorilla tienen la intención de liberar el código y el conjunto de datos para este trabajo. Si esto sucede, será realmente emocionante experimentar con este nuevo modelo y explorar sus posibilidades. Al igual que un maestro pintor que ha perfeccionado su técnica, Gorilla ofrece un nuevo enfoque en la interacción entre los modelos de lenguaje y las herramientas externas, abriendo un sinfín de oportunidades para el futuro de la inteligencia artificial.
Comentarios