Según Cointelegraph, el desarrollador de inteligencia artificial OpenAI introdujo varias actualizaciones a sus modelos a principios de octubre, destinadas a mejorar las capacidades de conversación y el reconocimiento de imágenes. El 1 de octubre, OpenAI anunció cuatro nuevas herramientas diseñadas para facilitar a los desarrolladores la creación de sus modelos de IA.
Una actualización importante es la API en tiempo real, que permite a los desarrolladores crear aplicaciones de voz generadas por IA utilizando un único mensaje. Esta herramienta admite experiencias multimodales de baja latencia mediante la transmisión de entradas y salidas de audio, lo que permite conversaciones naturales similares al modo de voz avanzado de ChatGPT. Anteriormente, los desarrolladores tenían que combinar varios modelos para lograr estas experiencias, lo que generaba una mayor latencia para las aplicaciones en tiempo real, como las conversaciones de voz a voz. Con la capacidad de transmisión de la API en tiempo real, los desarrolladores ahora pueden habilitar interacciones naturales e inmediatas, como los asistentes de voz. La API funciona en GPT-4, lanzado en mayo de 2024, que puede razonar a través de audio, visión y texto en tiempo real.
Otra actualización incluye una herramienta de ajuste fino para desarrolladores, que les permite mejorar las respuestas de la IA generadas a partir de imágenes y entradas de texto. Los afinadores finos basados en imágenes mejoran la capacidad de la IA para comprender imágenes, mejorando así las capacidades de búsqueda visual y detección de objetos. Este proceso implica retroalimentación humana, donde se proporcionan ejemplos de respuestas buenas y malas a la IA. Además, OpenAI ha introducido la "destilación de modelos" y el "almacenamiento en caché de indicaciones", que permiten que los modelos más pequeños aprendan de los más grandes y reducen los costos y el tiempo de desarrollo al reutilizar el texto ya procesado.
Las capacidades avanzadas de los modelos de OpenAI son un factor de venta importante, ya que una parte sustancial de los ingresos de la empresa proviene de empresas que crean sus propias aplicaciones basadas en la tecnología de OpenAI. Según Reuters, OpenAI prevé que sus ingresos aumenten a 11.600 millones de dólares el próximo año, frente a los 3.700 millones de dólares estimados para 2024.