jueves, 16 de marzo de 2023

El nuevo Midjourney V5 es aún más alucinante que sus predecesores. Y por fin, manos (casi) realistas

El nuevo Midjourney V5 es aún más alucinante que sus predecesores. Y por fin, manos (casi) realistas

Que el ritmo no pare. Si el martes conocíamos a GPT-4 y sus capacidades renovadas, hace una hora se anunciaba el lanzamiento de Midjourney V5, una versión aún más potente de este motor de IA generativa de imágenes. Los que ya han podido probarlo y publicar los resultados alucinan. Nosotros trambién.

Midjourne V5. El nuevo motor cuenta según sus creadores con "mucha mayor calidad de imagen, salidas más diversas, rangos estilíticos más amplios, soporte para texturas, formatos de imagen más anchos, mejores prompts para imágenes, y rango dinámico más amplio", entre otras mejoras.

Resultados alucinantes. Son muchos los usuarios que han compartido imágenes creadas con Midjourney V5 o pequeñas comparativas en las que se mostraba el resultado en Midjourney V4 y el nuevo Midjourne V5.  Aquí incluimos algunas del hilo creado por Nick St. Pierre, diseñador que está explorando esas opciones. Si las imágenes de su predecesor ya eran espectaculares, aquí el motor va un poco más allá y aporta aún más realismo. Algunas imágenes son ya casi imposibles de distinguir de imágenes reales.

Más objetivo. El subrreddit /r/midjourney cuenta con más información sobre esta versión, que según los detalles publicados hace que Midjourney V5 sea menos subjetivo en su comprensión de los prompts. "Los detalles tienen más probabilidad de ser correctos y habrá menos texto no deseado", se explica en esa información.

Los buenos prompts importan más que nunca. Los creadores de Midjourney revelan que la nueva versión es especialmente sensible a las entradas de texto, así que más que nunca lo importante es ser muy específico con lo que queremos y dar el máximo detalle posible para no encontrarnos con decepciones. Los prompts cortos pueden no funcionar tan bien como antes debido a esto.

Mejor entrenado. Midjourney V5 es el segundo modelo entrenado con el supercluster de IA de sus creadores y lleva en desarrollo cinco meses. Sus responsables afirman que usa arquitecturas de redes neuronales "significativamente diferentes" y nuevas técnicas estéticas.

Manos al fin (casi) realistas. Otro de los avances que se parece haber logrado —aunque los responsables no lo mencionan específicamente— es el de las manos que aparecen en las imágenes generadas, y que mejoran mucho: suelen contar con los cinco dedos bien representados, por ejemplo. Es cierto que Midjourney V5 sigue cometiendo fallos en algunas imágenes desafiantes, pero desde luego el avance es notable en este sentido.

Esto no es el final. Aún así, destacan, "este no es el paso final". Eso deja claro que la evolución de Midjourney sigue su marcha imparable junto al de otras plataformas como Stable Diffusion o DALL-E 2. Mientras todas estas plataformas avanzan, eso sí, seguimos esperando al "Midjourney del vídeo", que por el momento parece resistirse a aparecer.

Imagen: Charismactivist



via Robótica e IA - Xataka https://ift.tt/atIRrPo

No hay comentarios:

Publicar un comentario