Conecta con nosotros

A Fondo

OpenAI presenta GPT-4o, multimodal, rapidísimo y para todos

Publicado

el

OpenAI presenta GPT-4o, multimodal, rapidísimo y para todos

Hace ya días que esperamos el evento que OpenAI había programado para hoy. La semana pasada, además, se empezaron a extender los rumores sobre la posible presentación, hoy, de su propio buscador basado en inteligencia artificial, y la también reciente aparición de un modelo denominado GPT2 (no confundir con GPT-2), nos hizo pensar a muchos que hoy podría ser el día elegido por la compañía para presentar la próxima gran evolución de GPT, su más que exitoso LLM.

Sin embargo, probablemente para bajar un poco el suflé que se estaba formando, el propio CEO de la compañía, Sam Altman, publicó un tweet en el que desmentía ambas posibilidades, es decir, que ni GPT-buscador ni GPT-5, por lo que nos quedó claro que las novedades apuntan a circunscribirse, al menos principalmente, a ChatGPT y a GPT-4. Esto, de primeras, resultaba un poco decepcionante, aunque claro, no podíamos contar con que fuera o no fuera interesante hasta la celebración del evento.

Pues bien, el evento ya ha tenido lugar y, por lo tanto, ya podemos contarte todo lo que han presentado. Y sí, es cierto que no ha supuesto la presentación de GPT-5, pero sí que hemos tenido un nuevo modelo, GPT-4o (letra o de «omni», no cero), que supone un salto muy, muy importante con con respecto a GPT-4, pese a que ambos compartan una base común.

¿Y qué es lo que hace que GPT-4o sea tan interesante? Pues la clave está en la o, en omni, y es que hablamos de un modelo que es capaz de procesar, de manera nativa, texto, imagen y sonido. Y sí, es cierto que ya hemos visto chatbots que son capaces de gestionar estos tres tipos de información, pero hasta ahora lo han hecho combinando distintos modelos (aunque esto no es algo que resulte visible al usuario). Ahora, con este nuevo modelo de OpenAI, un único modelo gestionará los tres tipos de información, lo que se traduce en una mayor eficiencia, además de una reducción en la latencia, al eliminar las interacciones entre los distintos modelos.

Esta combinación de fuentes en un solo modelo, sumada a las optimizaciones que encontramos en GPT-4o frente a GPT-4, se traduce en un funcionamiento que supera, por mucho, lo que estamos acostumbrados a ver. En la última parte de la (corta) presentación, hemos podido ver algunas demos técnicas (puedes encontrar el vídeo completo más abajo), y verás que nos encontramos frente a un salto evolutivo de ChatGPT más que considerable.

Aunque ya se pueden apreciar en dichas pruebas, OpenAI pone números a la mejora de rendimiento y reducción de latencia que llega con GPT-4o. Un ejemplo claro de ello lo encontramos en las respuestas a entradas de audio, que podían acumular latencias promedio de 2,8 segundos con GPT-3.5) y de 5,4 segundos con GPT-4, y que ahora bajan a una media de 320 milisegundos, lo que no solo acelera los procesos, también proporciona un nivel de interacción bastante más natural con el chatbot.

Llegados a este punto, es probable que estés pensando que esto hace que ChatGPT Plus resulte todavía más interesante, pero aquí viene otra de las sorpresas que nos reservaba OpenAI esta tarde, y es que ChatGPT se actualizará a GPT-4o para todos los usuarios, también para los gratuitos. Lo hará, eso sí, con un límite de mensajes (no se ha especificado si será diario o de mayor periodicidad) y, claro, que las cuentas Plus tendrán límites bastante más altos. No obstante, proporcionar acceso a este nuevo modelo a todos los usuarios es, sin duda, algo a valorar muy positivamente.

El despliegue se inicia hoy mismo pero será progresivo. OpenAI afirma que se completará «en unas semanas«, sin dar una fecha concreta. No obstante, parece que sus planes pasan por que sea un movimiento rápido. En este punto, no obstante, aún tendremos que ver si los diversos marcos regulatorios afectan a su llegada a determinados territorios, como puede ser el caso de la Unión Europea.

Con la llegada de GPT-4o ChatGPT también mejora, de manera significativa, en lo referido a sus capacidades lingüísticas. El nuevo modelo de OpenAI admite más de 50 idiomas, y además se ha reducido sustancialmente el número de tokens necesarios para gestionar los textos en los mismos, una mejora de eficiencia pero que también se traducirá en un importante ahorro para aquellos usuarios que no vayan a emplear este modelo a través de ChatGPT.

Y es que, sí, como ya habrías imaginado, y habrás deducido por el final del párrafo anterior, GPT-4o también estará disponible a través de la API de OpenAI, es decir, que los desarrolladores podrán emplear este modelo en sus proyectos. Eso sí, tampoco se han publicado de momento las tarifas para el uso del mismo, y este será un aspecto interesante, dada su capacidad de procesar tanto texto como imagen y sonido.

OpenAI mejora las cuentas gratuitas de ChatGPT

La llegada de GPT-4o a todas las cuentas, incluidas las gratuitas, ya supone una gran noticia para los usuarios de estas últimas, pero OpenAI se guardaba aún más sorpresas, tantas que, en realidad, casi podemos decir que han sido, junto con el nuevo modelo, las grandes protagonistas de la presentación. Estas son las novedades para las mismas:

  • GPT-4: como ya indicaba al principio, en lo referido a su capacidad de análisis y respuesta GPT-4o comparte raíz con GPT-4. De este modo, cuando los usuarios de cuentas gratuitas empleen el nuevo modelo, podrán dar el salto desde GPT -3.5, que es la versión del LLM disponible para estas cuentas.
  • Respuestas de modelo y web: hasta ahora, la conexión de ChatGPT con Internet era una función exclusiva para las cuentas Plus. Sin embargo, y también de la mano del nuevo modelo, las cuentas gratuitas podrán obtener resultados basados en información de Internet, y no solo en la de entrenamiento del modelo.
  • Datos: disponible hasta ahora solo para las cuentas Enterprise, con esta función los usuarios podrán subir datos para que ChatGPT los analice, les proporcione las conclusiones que están buscando y, además, también para crear gráficos en base a los mismos.
  • Fotos: dado que GPT-4o es multimodal, los usuarios del modo gratuito de ChatGPT tendrán también la opción de subir al chatbot sus propias imágenes para que éste las analice en función de nuestros prompts.
  • Archivos: al igual que será posible subir imágenes para que sean analizadas, también podremos hacer lo mismo con archivos, que podrán ser analizados para que el chatbot nos ofrezca un resumen o los reescriba en función de nuestras indicaciones.
  • GPTs y GPT Store: OpenAI presentó el año pasado su tienda de GPTs, es decir, de chatbots basados en su modelo pero personalizados en base a múltiples parámetros. Hasta ahora también era una función exclusiva para las cuentas de pago, pero ahora las cuentas gratuitas también podrán emplearlos.
  • Memoria: esta es una de las novedades más recientes del chatbot, de la que ya te hablamos cuando fue anunciada, el pasado mes de febrero.

OpenAI presenta GPT-4o, multimodal, rapidísimo y para todos

ChatGPT Desktop

La otra gran novedad de esta presentación ha sido el anuncio, el esperado anuncio, de que ChatGPT finalmente contará con una aplicación de escritorio para Windows y macOS. Inicialmente, eso sí, esta aplicación solo estará disponible para los usuarios de cuentas Plus y para macOS, pero los planes de OpenAI pasan por extender su alcance a más usuarios en las próximas semanas, y a publicar también una versión para Windows en algún momento de este año.

Al integrarse en el sistema operativo, la aplicación de escritorio de OpenAI no solo ofrece un acceso más rápido al chatbot, también permite una interacción bastante más rápida entre lo que ocurre en nuestro sistema y la herramienta. No obstante, uno de los puntos que se han mencionado en la presentación es que la aplicación no tiene acceso al contenido que se está mostrando en pantalla, para tranquilidad de quienes, con todo el sentido del mundo, se hayan podido preocupar ante dicha posibilidad.

Eso sí, en caso de que queramos compartir dicho contenido, de manera puntual, la aplicación sí que nos permite realizar una captura de pantalla para enviarla al chatbot, así como, claro, copiar contenido de cualquier otra aplicación y pegarlo en ChatGPT desktop, una operación que ya es común en muchos casos de uso, y que ahora resultará más rápida gracias a la aplicación instalada en local. El diseño de la app se ajusta, también, al rediseño que ha experimentado la interfaz web, y que ahora es más limpia.

Así, aunque como ya adelanto Altman en su tweet, no hemos tenido ni buscador ni GTP-5, lo cierto es ha sido una presentación muy interesante, con un nuevo modelo que apunta a marcar un antes y un después. Así, ahora habrá que ver cuál es la respuesta por parte de sus principales rivales, pero por ahora parece que OpenAI se ha vuelto a poner a la cabeza.

Si me dieran una cana por cada contenido que he escrito relacionado con la tecnología... pues sí, tendría las canas que tengo. Por lo demás, música, fotografía, café, un eReader a reventar y una isla desierta. ¿Te vienes?

Lo más leído