General

AutoGen: permite aplicaciones de IA de próxima generación mediante conversaciones de agentes múltiples

0

Qué es AutoGen?

AutoGen es un nuevo proyecto de Microsoft Research que permite a los desarrolladores construir equipos de agentes de IA multi-tarea para lograr casi cualquier objetivo. Estos agentes de IA pueden escribir y ejecutar código, criticarse mutuamente, planear, adoptar diferentes roles y personalidades, y más.

En qué se diferencia de otros sistemas de IA

Lo que hace único a AutoGen es su capacidad para ejecutar iteraciones automatizadas y ejecutar código en un entorno contenedorizado.

Iteraciones automatizadas

Trabajar con una sola IA como ChatGPT produce alucinaciones, código incorrecto y no seguir instrucciones adecuadamente. Lo típico es que el usuario humano proporcione retroalimentación para que la IA entienda y corrija sus errores. Sin embargo, con AutoGen o cualquier marco multi-agente, se puede habilitar a otra IA para proporcionar comentarios, acortando el ciclo de comentarios y permitiendo menos trabajo por parte del usuario humano.

Este ciclo de retroalimentación es especialmente frecuente al usar IA para escribir código. El primer intento de escribir código con frecuencia contiene errores o bugs, pero ejecutar el código es la única forma de encontrar esos problemas. Tradicionalmente esto lo hacía el usuario humano, pero ahora, con AutoGen, otro agente de IA puede ejecutar ese código en nombre del usuario humano. Cuando surgen errores, el agente de IA puede alimentar ese error nuevamente en la IA original y pedirle que actualice el código para abordar el problema. Ahora, todo ese proceso de retroalimentación se automatiza por completo y es rápido.

Ejecución de código

Uno de los elementos más esenciales de AutoGen es su capacidad para ejecutar código en un entorno contenedorizado. Esto es esencialmente lo que es el Intérprete de código de ChatGPT, pero esto es completamente gratuito y de código abierto. Además, con múltiples agentes de IA trabajando juntos, pueden usar herramientas como bibliotecas de Python.

Por ejemplo, se puede dar a los agentes de IA la tarea de crear un gráfico de precios de acciones de TSLA. Los agentes intentarán hacerlo usando Python, y rápidamente se darán cuenta de que necesitan una biblioteca de gráficos, que luego instalarán en un entorno aislado y luego usarán para escribir el gráfico. Todo sucede de manera fluida y automatizada, con el usuario solo dando retroalimentación cuando sea necesario.

Ejemplo de chat de agentes

También puede reutilizar código que se ha ejecutado correctamente, con múltiples opciones para lograrlo. AutoGen tiene almacenamiento en caché integrado, lo que ayuda a reducir el costo de usar ChatGPT para alimentar AutoGen. Pero por supuesto, también se pueden usar modelos de código abierto, sobre lo cual profundizaré a continuación.

AutoGen también tiene dockerización integrada, todo lo que necesita hacer es instalar el módulo Docker Python, y está activado de forma predeterminada. Recomiendan usar Docker, lo cual es comprensible dado que de lo contrario se permite a la IA escribir y ejecutar código en su servidor.

Por qué es importante

Reemplazo tipo «plug and play» de la API de ChatGPT

Una característica muy pasada por alto (al menos por mí) de AutoGen es su capacidad de «reemplazo tipo plug and play» de la API de ChatGPT. Al principio no entendí por qué esto era tan valioso, pero ahora tiene mucho sentido. También es extraño porque no parece relacionarse con la IA en absoluto, pero lo incluyeron como una característica importante. Supongo que se dieron cuenta después de construir la parte de agentes de AutoGen que casualmente habían construido muchas funciones fantásticas sobre la API de ChatGPT.

Incluso si no planea usar AutoGen para construir agentes de IA o equipos de agentes, el encapsulamiento de la API de ChatGPTs vale la pena usar solo. Por ejemplo, tiene lógica de reintento integrada, almacenamiento en caché, conmutación por error de modelo, soporte de modelos múltiples y más. Y no solo tiene que usar modelos de OpenAI, puede configurar fácilmente un servicio local que ejecute un modelo de código abierto e insertarlo en la cadena de modelos en su aplicación AutoGen, más sobre esto en la siguiente sección.

Compatibilidad con modelos de código abierto

Una de las mejores características de AutoGen es la capacidad de usar modelos de código abierto. Tampoco tiene que elegir entre código abierto y código cerrado, en su lugar, puede asignar diferentes agentes para usar diferentes modelos, dando el poder de GPT4 a los casos de uso más complejos y modelos menos sofisticados a otros casos de uso.

Aunque me encanta el soporte de código abierto, AutoGen puede ser un proyecto desafiante para que los modelos de código abierto lo alimenten. Esto se debe a la complejidad extrema de AutoGen y el aprovechamiento de las llamadas a funciones, que tienden a funcionar mejor con GPT4 (incluso GPT3.5 no funciona bien con las llamadas a funciones).

Sin embargo, tengo confianza en que los modelos de código abierto seguirán mejorando, y surgirán modelos específicos bien ajustados que sean excelentes para casos de uso estrechos, lo cual encajaría perfectamente con la capacidad de AutoGen de asignar modelos a agentes específicos para tareas particulares.

Conclusión

AutoGen es un emocionante nuevo proyecto de IA que permite la automatización iterativa y la ejecución de código. Tiene muchas características útiles más allá de la IA, como su capacidad de reemplazo de API de ChatGPT y su soporte multi-modelo. AutoGen hará que sea mucho más fácil y rápido aprovechar el poder de la IA para una amplia gama de casos de uso, incluido el desarrollo de software. Seguiré explorando y compartiendo más sobre este innovador proyecto en el futuro.

https://github.com/microsoft/autogen

DimensionIA

Zhipu AI: la empresa emergente de inteligencia artificial que desafía a OpenAI con una inversión de $340M

Previous article

Diseño de chips con inteligencia artificial: el fututo está aquí

Next article

Comentarios

Leave a reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Login/Sign up