miércoles, 20 de septiembre de 2023

Midjourney y Stable Diffusion tienen competencia: OpenAI anuncia un mejoradísimo DALL·E 3 integrado a ChatGPT Plus

Midjourney y Stable Diffusion tienen competencia: OpenAI anuncia un mejoradísimo DALL·E 3 integrado a ChatGPT Plus

Han pasado más de dos años desde que OpenAI presentara DALL·E. En 2021, aquel modelo de generación de inteligencia artificial (IA) nos sorprendía por su gran capacidad para generar estupendas imágenes a partir de texto. Estábamos presenciando en directo lo que se convertiría en una carrera que involucraba a varios participantes.

Alternativas como Midjourney y Stable Diffusion aparecieron en escena muy cerca de la llegada de una versión renovada de la propuesta impulsada por la compañía dirigida por Sam Altman, DALL·E 2, y en el último tiempo fueron superándola considerablemente. OpenAI no está dispuesta a perder posiciones, así que ha presentado DALL·E 3.

DALL·E 3, da un enorme salto de calidad y se integra a ChatGPT

Resultaba un tanto curioso pensar que una compañía líder en el mercado de la IA como OpenAI había empezado a perder terreno con su generador de imágenes. DALL·E 2 no era malo, ni mucho menos, pero en este mundo tan dinámico en el que vivimos se había quedado atrás en calidad, versatilidad y arrastraba algunos problemas.

El momento de volver a posicionarse a la vanguardia de modelos de IA para entornos visuales creativos parece que ha llegado para OpenAI. Con DALL·E 3 no solo se abordan algunas de las falencias más notables del modelo anterior (y de los modelos en general), sino que también se lo integra al famoso chatbot conversacional ChatGPT.

Banana Banana Prompt utilizado: “A vibrant yellow banana-shaped couch sits in a cozy living room, its curve cradling a pile of colorful cushions. on the wooden floor, a patterned rug adds a touch of eclectic charm, and a potted plant sits in the corner, reaching towards the sunlight filtering through the window”

Lo último de OpenAI en generación de imágenes por IA nos presenta la posibilidad de aprovechar al máximo las indicaciones complejas. Sabemos que los ‘prompts’ son clave para obtener los resultados que queremos (tenemos una guía de estos para Midjourney), pero la escenas no siempre son tan precisas como nos imaginamos.

Coffee Coffee Prompt utilizado: “A 3D render of a coffee mug placed on a window sill during a stormy day. The storm outside the window is reflected in the coffee, with miniature lightning bolts and turbulent waves seen inside the mug. The room is dimly lit, adding to the dramatic atmosphere”

Este es uno de los puntos que se pretende solucionar. DALL· E 3 será más cuidadoso a la hora de representar con precisión escenas de objetos específicos. Entonces, ¿tendremos que ser unos auténticos “prompt engineers” para aprovechar al máximo todas sus ventajas? Aparentemente no, y aquí es donde entra en juego ChatGPT.

Al estar integrado en ChatGPT Plus y ChatGPT Enterprise, los usuarios del chatbot podrán pedirle con indicaciones textuales menos elaboradas desde el punto de vista técnico qué es lo que quieren ver. Así se elimina uno de los obstáculos más grandes para aprovechar al máximo esta tecnología desde el punto de vista creativo.

En este momento, está disponible para uso interno (solo para investigadores en calidad de evaluación). No obstante, a partir de octubre se podrá utilizar directamente desde los mencionados chatbots. Recordemos, eso sí, que se trata de alternativas de pago. ChatGPT, la versión gratuita, no tendrá este complemento. 

Imágenes: OpenAI

En Xataka: Google Bard se integra en Gmail, Drive o Maps para planificar tus vacaciones (o encontrarte trabajo)



via Robótica e IA - Xataka https://ift.tt/4CYczEr

No hay comentarios:

Publicar un comentario