0

¡Buenas noticias para los desarrolladores!

Ahora pueden integrar los modelos de ChatGPT y Whisper en sus aplicaciones y productos a través de una simple API. Esto significa que pueden mejorar la funcionalidad y la experiencia del usuario con estas potentes herramientas de lenguaje natural.

¡Aprovecha esta oportunidad para llevar tus proyectos al siguiente nivel!

Los desarrolladores ahora pueden acceder a las capacidades de lenguaje natural de vanguardia de ChatGPT y Whisper (¡no solo para chat!) y la conversión de voz a texto a través de una API. Además, gracias a una serie de optimizaciones en todo el sistema, en OPENAI ha logrado una reducción del 90% en los costos de ChatGPT desde diciembre, y ahora pasan esos ahorros a los usuarios de la API. Los desarrolladores pueden utilizar el modelo grande Whisper large-v2 de código abierto en la API con resultados mucho más rápidos y rentables. Los usuarios de la API de ChatGPT pueden esperar mejoras continuas en el modelo y la opción de elegir una capacidad dedicada para un control más profundo sobre los modelos.

Ejemplos de usos de esta API

SNAPCHAT

Hace unos días, Snap Inc., el creador de Snapchat, presentó My AI para Snapchat+. La función experimental se ejecuta en la API de ChatGPT. My AI ofrece a los usuarios de Snapchat un chatbot amigable y personalizable al alcance de su mano que ofrece recomendaciones e incluso puede escribir un haiku para amigos en segundos. Snapchat, donde la comunicación y el intercambio de mensajes son un comportamiento diario, cuenta con 750 millones de usuarios activos mensuales.

INSTACART

Instacart está mejorando la aplicación de Instacart para permitir que los clientes hagan preguntas relacionadas con la comida y obtengan respuestas inspiradoras y comercializables. Esto utiliza ChatGPT junto con la inteligencia artificial propia de Instacart y los datos de productos de sus más de 75,000 tiendas afiliadas para ayudar a los clientes a descubrir ideas para objetivos de compra abiertos como «¿Cómo puedo hacer excelentes tacos de pescado?» o «¿Qué es un almuerzo saludable para mis hijos?» Instacart planea lanzar «Ask Instacart» más adelante este año.

SPEAK

Speak es una aplicación de aprendizaje de idiomas impulsada por IA centrada en crear el mejor camino hacia la fluidez oral. Son la aplicación de inglés de más rápido crecimiento en Corea del Sur y ya están utilizando la API de Whisper para alimentar un nuevo producto de compañero de conversación impulsado por IA y llevarlo rápidamente al resto del mundo. La precisión a nivel humano de Whisper para estudiantes de idiomas de todos los niveles desbloquea la verdadera práctica de conversación abierta y comentarios altamente precisos.

¿Cuáles son los costos?

Aquí está la buena noticia. La familia de modelos ChatGPT lanzada por OPENAI, gpt-3.5-turbo, es el mismo modelo utilizado en el producto ChatGPT. Se cotiza a $0.002 por 1,000 tokens, lo que es 10 veces más barato que otros modelos existentes de GPT-3.5.

¿Cómo funciona la API?:

Normalmente, los modelos GPT procesan texto no estructurado que se representa para el modelo como una secuencia de «tokens». En cambio, los modelos ChatGPT procesan una secuencia de mensajes junto con metadatos. (Para aquellos que estén interesados: por debajo del capó, la entrada sigue siendo representada para el modelo como una secuencia de «tokens» que el modelo procesa; el formato crudo utilizado por el modelo es un nuevo formato llamado Lenguaje de Marcado de Chat («ChatML»).)

¿Y qué pasa con Whisper?

Whisper es el modelo de conversión de voz a texto lanzado por OpenAI al dominio público en septiembre de 2022, que ha recibido grandes elogios de la comunidad de desarrolladores, pero que también puede ser difícil de implementar. Ahora hemos hecho disponible el modelo large-v2 a través de nuestra API, lo que brinda acceso bajo demanda conveniente a un precio de $0.006/minuto. Además, nuestra pila de servidores altamente optimizados garantiza un rendimiento más rápido en comparación con otros servicios.

La API de Whisper está disponible a través de nuestros puntos finales de transcripción (transcribe en el idioma original) o traducción (transcribe al inglés), y acepta una variedad de formatos (m4a, mp3, mp4, mpeg, mpga, wav, webm).

OpenAI está superando a la competencia al ofrecer productos a precios muy reducidos, lo que implica que sus competidores tendrán que reducir costos para poder competir en condiciones similares y ser mínimamente competitivos. OpenAI fue pionero en la irrupción de modelos de lenguaje, que sorprendieron tanto a expertos como a no expertos, y además están avanzando a una velocidad impresionante para obstaculizar a posibles competidores..

 

DimensionIA

La voz artificial: una tecnología revolucionaria

Previous article

El impresionante plan de YouTube para conquistar el mundo con IA

Next article

You may also like

Comentarios

Leave a reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

More in General