Robótica Divulgativa: Adobe Firefly intentó competir con Midjourney: salió mal (pero por una buena razón)

viernes, 7 de abril de 2023

Adobe Firefly intentó competir con Midjourney: salió mal (pero por una buena razón)

Las dos imágenes de aquí arriba están creadas con el mismo prompt. Uno destinado a retratar a Super Mario en una calle poca iluminada con un charco al lado. A la izquierda está el resultado generado por Adobe Firefly. A la derecha, la generada con Midjourney v5.

El generador de imágenes por IA de Adobe acaba de debutar y el resultado, aunque curioso, no es el esperado. Un usuario ha demostrado que el motor de Adobe es claramente inferior al de Midjourney, pero hay una buena razón para ello.

Jim Fan (@DrJimFan) es un ingeniero que trabaja en la división de IA de NVIDIA y antes trabajó para OpenAI y Google en ese ámbito. En su cuenta de Twitter ha publicado un reciente hilo comparando el resultado de aplicar el mismo prompt en Adobe Firefly y en Midjourney, y los resultados son singulares.

Just got access to Adobe Firefly! How does the world's leading creative tool maker fare against MidJourney, a self-funded 11-person team?

Let's check it out. Left is Firefly and right is MidJourney V5. Prompt in "ALT" button on lower-left corner.

Deadpool posing on a car. 1/🧵 pic.twitter.com/p5b3NTZNlW
— Jim Fan (@DrJimFan) April 3, 2023

Como ocurre con Super Mario, la interpretación que Adobe Firefly hace del personaje de Deadpool es extraña. Intentó con un tercer personaje famoso.

Same prompt as above but for Pikachu. Again, somehow Firefly does not fully get these famous characters. Maybe a training data copyright issue?

Prompt and MJ image credits to @LinusEkenstam @vitomotiv.

3/ pic.twitter.com/g69zVjJigX
— Jim Fan (@DrJimFan) April 3, 2023

Al tratar de sustituir a Super Mario por Pikachu ocurrió lo mismo: la imagen generada por Adobe Firefly era llamativa pero el protagonista de la imagen tenía poco que ver con Pikachu, que por ejemplo sí aparecía muy bien representado en la imagen generado por Midjourney v5.

Next, who is the better portrait photographer?

Photo of a large crowd of commuters in Tokyo, sharply focused faces, but it's the woman in red that commands your attention. Warm glow, elegance.

Prompt & MJ image credit: @nickfloats

4/ pic.twitter.com/FWtLKB7y1o
— Jim Fan (@DrJimFan) April 3, 2023

Al intentar generar una foto de una mujer en medio de una gran multitud, las diferencias fueron mucho más patentes, aunque aquí es evidente que el prompt no debió ser bien entendido por Adobe Firefly, que creó una perspectiva totalmente distinta.

Now let's do some mobile app icon design. Does Firefly even know what an app icon is?

iOS app icon, Sci-fi planet landscape with skeuomorphic style.

Prompt & MJ image credit: @followmarcos

6/ pic.twitter.com/fb1vJxf3ma
— Jim Fan (@DrJimFan) April 3, 2023

Fan intentó crear un icono para una aplicación móvil. Debía describir una escena de ciencia ficción con un paisaje en el que apareciera un planeta. Adobe Firefly no pareció entender que lo que buscaba era un icono, y no una imagen completa.

The "human finger" test is becoming the new visual Turing Test. It's the final moat that Diffusion needs to conquer to become truly sentient 🤣.

A stunning young Jamaican woman wearing white retrofuturistic sequin Gucci gown, standing in the desert.

Credit: @nickfloats

7/ pic.twitter.com/Dusi6Sgsoj
— Jim Fan (@DrJimFan) April 3, 2023

Mucho más contundente fue el resultado de pedirle a ambas plataformas que crearan una imagen fotográfica de una modelo en medio del desierto con un vestido futurista.

Captura De Pantalla 2023 04 04 A Las 17 09 33

¿Qué ha pasado con la cara de la modelo? ¿Y con sus manos?

Al comparar en detalle las imágenes vemos como la de Adobe Firefly, que de lejos no está tan mal, hace aguas en la cara de la modelo y, cómo no, en las manos. Midjourney, no obstante, resuelve ambos problemas de forma asombrosa.

Finally, a landscape photo. It turns out to be an easy task that both Firefly and MJ excel.

Red Ferrari F40 in Dandelions at the Lake Seealpsee.

Prompt & MJ image credit: @heyBarsee

8/ pic.twitter.com/4mp9heT7rW
— Jim Fan (@DrJimFan) April 3, 2023

La última prueba dejó por fin en buen lugar a Adobe Firefly, que ofreció un resultado especialmente notable y comparable en gran medida al que logró Midjourney, que aplicó ese estilo fotorrealista que tanto está llamando la atención en su última versión.

Como explicaba Fan, los prompts utilizados favorecen a Midjourney, pero intentó aplicar algunas variaciones sin éxito. El problema de Adobe Firefly es en realidad otro.

La realidad es que Adobe Firefly ha sido entrenado únicamente con imágenes de Adobe Stock, la base de imágenes de Adobe, y con imágenes totalmente licenciadas y sin problemas de derecho intelectual.

Eso hace que Adobe esté totalmente libre de posibles demandas legales, algo que no ocurre con plataformas como Midjourney o Stable Diffusion, que han entrenado a sus IAs generativas con todo tipo de imágenes y que han tenido que afrontar ya denuncias.

Ese desde luego es un punto a favor de Adobe Firefly, que puede que no compita con Midjourney en ciertos escenarios, pero que desde luego se podrá usar sin miedo a represalias legales.

Imagen: Jim Fan

En Xataka | Resolviendo el talón de Aquiles de las inteligencias artificiales: por qué no saben dibujar manos humanas

via Robótica e IA - Xataka https://ift.tt/aIPf8CE

Robótica Divulgativa

viernes, 7 de abril de 2023

Adobe Firefly intentó competir con Midjourney: salió mal (pero por una buena razón)

No hay comentarios:

Publicar un comentario