Robótica Divulgativa: El nuevo Midjourney V5 es aún más alucinante que sus predecesores. Y por fin, manos (casi) realistas

jueves, 16 de marzo de 2023

El nuevo Midjourney V5 es aún más alucinante que sus predecesores. Y por fin, manos (casi) realistas

Que el ritmo no pare. Si el martes conocíamos a GPT-4 y sus capacidades renovadas, hace una hora se anunciaba el lanzamiento de Midjourney V5, una versión aún más potente de este motor de IA generativa de imágenes. Los que ya han podido probarlo y publicar los resultados alucinan. Nosotros trambién.

Midjourne V5. El nuevo motor cuenta según sus creadores con "mucha mayor calidad de imagen, salidas más diversas, rangos estilíticos más amplios, soporte para texturas, formatos de imagen más anchos, mejores prompts para imágenes, y rango dinámico más amplio", entre otras mejoras.

street style photo of a young woman, red gucci jacket, blue gucci shirt, wide shot, natural lighting, soho, shot on Agfa Vista 200, 4k --ar 16:9

v4 (left) v5 (right) pic.twitter.com/I80Bd0EEyP
— Nick St. Pierre (@nickfloats) March 15, 2023

Resultados alucinantes. Son muchos los usuarios que han compartido imágenes creadas con Midjourney V5 o pequeñas comparativas en las que se mostraba el resultado en Midjourney V4 y el nuevo Midjourne V5. Aquí incluimos algunas del hilo creado por Nick St. Pierre, diseñador que está explorando esas opciones. Si las imágenes de su predecesor ya eran espectaculares, aquí el motor va un poco más allá y aporta aún más realismo. Algunas imágenes son ya casi imposibles de distinguir de imágenes reales.

Crowd Shot

1960s street style photo of a crowd of young women standing on a sailboat, wearing dior dresses made of silk, pearl necklaces, sunset over the ocean, shot on Agfa Vista 200, 4k --ar 16:9 pic.twitter.com/cEacab3T8m
— Nick St. Pierre (@nickfloats) March 15, 2023

Más objetivo. El subrreddit /r/midjourney cuenta con más información sobre esta versión, que según los detalles publicados hace que Midjourney V5 sea menos subjetivo en su comprensión de los prompts. "Los detalles tienen más probabilidad de ser correctos y habrá menos texto no deseado", se explica en esa información.

1990s era, photo of a young man, sitting, mechanical keyboard, working, desk, 1990s CRT monitor, monstera, 1 glass of oj, juice, wide shot, side view, natural lighting, home, polaroid, 4k --ar 16:9

v4 (left) v5 (right) pic.twitter.com/iMvG5z81mU
— Nick St. Pierre (@nickfloats) March 15, 2023

Los buenos prompts importan más que nunca. Los creadores de Midjourney revelan que la nueva versión es especialmente sensible a las entradas de texto, así que más que nunca lo importante es ser muy específico con lo que queremos y dar el máximo detalle posible para no encontrarnos con decepciones. Los prompts cortos pueden no funcionar tan bien como antes debido a esto.

Street style photo, Closeup shot, Nike Air Force 1 slytherin collab, unique Colorway, snake skin, hogwarts, natural lighting, original, unique, 4k --ar 16:9 pic.twitter.com/5mZihLHc4D
— Nick St. Pierre (@nickfloats) March 15, 2023

Mejor entrenado. Midjourney V5 es el segundo modelo entrenado con el supercluster de IA de sus creadores y lleva en desarrollo cinco meses. Sus responsables afirman que usa arquitecturas de redes neuronales "significativamente diferentes" y nuevas técnicas estéticas.

5 fingers in Midjourney v5. pic.twitter.com/tEYWIdwcSg
— Smoke-away (@SmokeAwayyy) March 16, 2023

Manos al fin (casi) realistas. Otro de los avances que se parece haber logrado —aunque los responsables no lo mencionan específicamente— es el de las manos que aparecen en las imágenes generadas, y que mejoran mucho: suelen contar con los cinco dedos bien representados, por ejemplo. Es cierto que Midjourney V5 sigue cometiendo fallos en algunas imágenes desafiantes, pero desde luego el avance es notable en este sentido.

Midjourney v5

lots of hands together --s 11 --v 5 pic.twitter.com/hdTdU8cNfo
— Roman Pshichenko (@romechenko) March 16, 2023

Esto no es el final. Aún así, destacan, "este no es el paso final". Eso deja claro que la evolución de Midjourney sigue su marcha imparable junto al de otras plataformas como Stable Diffusion o DALL-E 2. Mientras todas estas plataformas avanzan, eso sí, seguimos esperando al "Midjourney del vídeo", que por el momento parece resistirse a aparecer.

Imagen: Charismactivist

via Robótica e IA - Xataka https://ift.tt/atIRrPo

Robótica Divulgativa

jueves, 16 de marzo de 2023

El nuevo Midjourney V5 es aún más alucinante que sus predecesores. Y por fin, manos (casi) realistas

No hay comentarios:

Publicar un comentario