martes, 30 de julio de 2024

OpenAI empieza a desplegar una de las funciones más esperadas (y revolucionarias) de ChatGPT: el nuevo modo de voz

OpenAI empieza a desplegar una de las funciones más esperadas (y revolucionarias) de ChatGPT: el nuevo modo de voz

OpenAI nos sorprendió en mayo de este año con el anuncio de un modo de voz al más puro estilo ‘Her’ para ChatGPT. La compañía de liderada por Sam Altman prometió en este momento que la novedad llegaría en “las próximas semanas”, pero un mes más tarde anunció que necesitaba un poco más de tiempo para abordar algunos desafíos de seguridad.

Los días han pasado y el esperado nuevo modo de voz ya está aquí. Nos estamos ante un lanzamiento masivo de una versión final, sino de un despliegue bastante contenido de una versión alfa para usuarios de ChatGPT Plus. El mismos se desarrollará hasta agosto, mes en el que todos los usuarios del mencionado plan de pago deberían tener acceso a la función.

A la espera de las capacidades de visión

Si eres uno de los usuarios elegidos para probar el nuevo modo de voz, recibirás un mensaje en la aplicación. Una vez activado, podrás interactuar con ChatGPT impulsado con GPT-4o de manera mucho más natural. Recordemos que una de las mejoras frente al modo de voz original es que es posible interrumpirle y que, además, puede tener conversaciones emocionales.

A nivel un poco más técnico, el modo de voz original funcionaba de manera muy diferente. Uno convertía la voz en texto, GPT-4 procesaba ese texto y la respuesta se convertía nuevamente en voz. GPT-4o es un modelo multimodal, por lo que todo se procesa directamente. ¿La consecuencia? Como hemos visto, es una latencia extremadamente baja.

Openai Modo Voz Portada Openai Modo Voz Portada

Una buena noticia es que no estará limitado únicamente al idioma inglés. OpenAI dice que ha probado el modo de voz con más de 45 idiomas. Sin embargo, hay ciertos cambios en relación a lo que vimos el día de la presentación. Pese a su capacidad para reproducir otras voces, al menos de momento, hay solo cuatro voces disponibles (Juniper, Breeze, Cove y Ember).

Sky, la voz que se parecía a la de Scarlett Johansson, no estará disponible. La actriz que dio vida a Samantha en la película ‘Her’, se había mostrado "conmocionada, enfadada e incrédula” tras escuchar una voz tan similar a la suya en ChatGPT. Johansson había rechazado una oferta de Altman para poner su voz en el famoso chatbot de inteligencia artificial.

En la demostración de hace meses vimos a ChatGPT ayudando con la tarea a unos niños o describiendo lo que había en una habitación a medida que los empleados de OpenAI conversaban fluidamente. Estas funciones están impulsadas por las capacidades de visión de GPT-4o, pero la firma dice que “llegarán en una fecha posterior”.

Imágenes | OpenAI

En Xataka | Los creadores de Instagram podrán chatear con todos sus seguidores. Pero no lo harán ellos, sino sus bots



via Robótica e IA - Xataka https://ift.tt/a7zXG6x

No hay comentarios:

Publicar un comentario