miércoles, 15 de febrero de 2023

Las IA generativas se enfrentan al mismo problema que Miguel Ángel hace 500 años: dibujar bien manos humanas

Las IA generativas se enfrentan al mismo problema que Miguel Ángel hace 500 años: dibujar bien manos humanas

Cuando el Papa Julio II le encargó aquel trabajo a Miguel Ángel, el joven genio no se sentía preparado. "Yo soy escultor", le dijo —ya era célebre entonces por la Pietá y por su inmenso David de cinco metros—, "no pintor". Era el año 1508, y el reto era enorme: pintar el techo de la Capilla Sixtina.

"Qué raro", pensó el Papa. "¿Por qué me lo habrá recomendado entonces Bramante?". La razón era clara. Donato Bramante, arquitecto jefe del Papa a cargo de la Basílica de San Pedro, era enemigo acérrimo del florentino, y solo quería verle fracasar.

Captura De Pantalla 2023 02 14 A Las 15 45 08

Cuando Miguel Ángel terminó la obra cuatro años después, Bramante seguramente se tiró de los pelos. Aquella obra convirtió a Miguel Ángel en una leyenda del renacimiento, y de aquel trabajo destacaba especialmente una escena del Antiguo Testamento: "La creación de Adán", en la cual aparece la mano de Dios dándole la vida a Adán en un gesto en el que su mano casi toca la del primer hombre. El fresco se ha convertido en una de las obras de arte más apreciadas y reconocibles del mundo, y la creó alguien que ni siquiera se consideraba un buen pintor y que seguramente tuvo que dominar como nadie el difícil arte de dibujar y pintar manos.

Ese desafío ha llegado a nuestros días y ha demostrado convertirse en un singular obstáculo no ya para artistas de carne y hueso, sino para todas todas las inteligencias artificiales creativas como DALL-E 2, Stable Diffusion o Midjourney que están causando sensación desde su lanzamiento. Todas ellas, eso sí, se tropiezan con el mismo problema. Cuando dibujan manos, suelen hacerlo terriblemente mal. ¿Por qué?

Dibujar y pintar manos es un desafío 

Eso es lo que hemos tratado de averiguar en Xataka, donde hemos hablado con dos expertos en disciplinas muy distintas. En primer lugar, con Javier Arizabalo García, un artista cuyas pinturas de manos son absolutamente prodigiosas. Lo podemos comprobar en su cuenta de Instagram, donde muestra muchos de sus trabajos y demuestra esa misma obsesión que el mismo Miguel Ángel parece haber contagiado a generaciones de artistas.

Javierarizabalo

Como Javier nos comentaba, "las manos son muy complejas. La cara también es muy complicada". La razón, como explicaba el artista, es que "estamos muy habituados a verlas y reconocerlas", aunque en su caro las caras son más complicadas que las manos: "estas últimas pueden salirte más estrechas o más gordas y no pasa nada".

Él mismo ha estado en contacto con personas que están trabajando en el ámbito de las inteligencias artificiales generativas, y nos explicaba cómo "los ejemplos que he visto sacan información de fotografías y hacen una especie de composición. Falta tiempo para que haya generadores de imágenes que logren no tener fallos al crear manos, pero diría que no mucho". No tiene claro cuál puede ser el problema, pero sí que "todos los que pretenden ser algoy dominan el dibujo tienen que tener muy en cuenta el tema de las manos, ya que éstas pueden dirigir la mirada mediante signos y lograr que nos fijemos en puntos significativos del cuadro, como el rostro".

Hay más historias de manos en la historia del arte. Una singular es la que conocen bien en la Biblioteca Real del Castillo de Windsor, donde guardan como el tesoro que es el llamado 'Estudio de las manos' que Leonardo da Vinci creó unos años antes, en 1474.

Hands Leonardo
'Estudio de las manos', de Leonardo da Vinci.

El genio renacentista estaba fascinado con la corrección anatómica y el efecto de las luces y las sombras, y en sus manos, tanto en ese dibujo como en otras muchas obras. En la Gioconda, por ejemplo, se teoriza con el hecho de que la Mona Lisa estuviera embarazada, tanto por la posición de las manos como por la técnica que reveló detalles desconocidos de la obra. Leonardo, otro icono del renacentismo, sabía muy bien lo que importaban las manos, y lo difícil que era pintarlas.

Esa dificultad es como decíamos patente en los motores de inteligencia artificial generativa, que una vez tras otra muestran creaciones fantásticas en muchos apartados, pero terribles a la hora de representar las manos. Aunque alguna vez "aciertan" con el resultado, en muchas ocasiones las manos creadas son o bien deformes, o bien inverosímiles por la posición o longitud de los dedos.

Javilopez

Lo sabe bien nuestro segundo experto, Javier López López (@javilop), que lleva tiempo experimentando con este tipo de plataformas. Las ha usado de hecho para su obra 'El cántico de Cthulhu', una novela ilustrada en la que el texto es totalmente suyo, pero que además hace uso de imágenes generadas por inteligencia artificial. Su trabajo con dichos sistemas acabó provocando que junto al libro crease una guía de IAs generativas.

Al preguntarle por los problemas con las manos, este experto lo tiene claro: "una de las cosas que más canta son las manos. Los ojos a veces también cuesta que salgan bien en las imágenes". Como ocurre con nuestro primer protagonista, "no se sabe muy bien por qué. Las manos son muy complejas", pero tiene una teoría. "En los datasets no están bien etiquetadas. A las IAs se las entrena con conjuntos de imágenes que suelen estar mal etiquetadas, y de hecho lo raro es que funcionen. Hay una realidad adicional aquí: es más fácil que la mano parezca real en una imagen con una persona que en una imagen con 20 personas".

 

Es una teoría plausible que se complementa con lo que también decía Javier Arizabalo sobre el aprendizaje de los artistas. "Todos los ejercicios de dibujo que realizamos a lo largo del tiempo consiguen que metamos en nuestra memoria “cómo es una mano” o “cómo es un rostro”. Cuando haces algo te puede llamar la atención que un detalle no está bien por esa memoria que tienes de muchos ejercicios. Gracias a ellos llegas a ese tipo de habilidad, a visualizar algo que te llama la atención porque no lo ves bien, porque no funciona".

Por qué Mickey Mouse tiene cuatro dedos en cada mano

De hecho, reconocía, las cosas son ahora mucho más fáciles para los artistas con la fotografía. Antes los artistas "tenían que tener un conocimiento espacial y una memoria de poses del cuerpo humano y de las manos", que según Arizabalo es algo que por ejemplo entrenan los artistas del mundo del cómic a otra escala. "A base de entrenamiento puedes dibujar una mano o un brazo en todas sus posiciones".

Manos Javier
Algunas de las obras creadas por Javier Arizabalo García con las manos como protagonistas.

La dificultad de dibujar manos es una realidad entre artistas y dibujantes en todo tipo de géneros. EsCarolota ya comentaba en Verne hace años como dibujar manos "es un suplicio". Las manos han sido protagonistas en obras tan conocidas como la célebre 'Manos dibujando' de Escher o las 'Manos en oración' de Alberto Durero que se han convertido en la representación del rezo más utilizada y reproducida en todo el mundo.

Hace años YouTube ya estaba llena de vídeos que enseñan a dibujar manos, y ahora TikTok le ha tomado el relevo, pero si hay una prueba clara de cómo las manos son todo un reto, esa es la de los dibujos animados: la mayoría de los personajes que vemos en películas y series de animación tienen manos con cuatro dedos.

Hay excepciones, claro, pero el propio Walt Disney lo tuvo claro. Como explica el libro 'A Mickey Mouse reader', la decisión de dibujar las manos del célebre ratón con cuatro dedos era económica: ahorraba tiempo a los dibujantes y también costes de producción.

Esa dificultad planteada por artistas y animadores parecen haberla heredado motores como DALL·E 2, Midjourney o Stable Diffusion, porque como dice López, todos ellos "tienen muchísimos fallos. Por ejemplo, de coherencia. Si les pides que te dibujen tres personas, una niña de 10 años sobre un pony, un abuelo de 70 volando y un hombre pelirrojo gordo sobre una tabla de surf, no lo van a conseguir. Hay demasiada información y demasiado compleja. Sin embargo, si les dices que dibujen un retrato de una mujer japonesa con estilo fotográfico, te lo hacen perfecto".

Y aún así, aclaraba López, "esto no es la punta del iceberg. Ni siquiera estamos viendo el iceberg. Es una tecnología que está en pañales, y que a día de hoy ya da resultados increíbles". Precisamente por eso nos recuerda que siendo tan joven "es normal que tenga fallos, y lo raro es que haya ido tan rápido y que sea así de impresionante".

La historia del arte también está repleta de curiosidades al respecto: un singular estudio de 2014 mostraba cómo en el renacimiento apareció un curioso fenómeno: muchos artistas pintaban dedos meñiques amorfos.

Captura De Pantalla 2023 02 08 A Las 17 33 13
Fuente: Journal of the Royal Society of Medicine.

Aquello era al parecer una moda que por ejemplo aparece en las obras de diversos pintores de la escuela renacentista flamenca e italiana. Las conclusiones de los investigadores parecen plantear que había dos corrientes entre los artistas: una que trataba de modificar la realidad para hacerla más bella y agradable a la vista, y otra, más cruda, que trataba de incluir el dolor y las deformidades para representar la condición humana.

Las máquinas aprenderán

Lo cierto es que como señalan en ese estudio, los artistas del renacimiento usaban ciertos trucos para obtener figuras ideales. El citado 'David' de Miguel Ángel tiene la cara y las manos de tamaño exagerado en comparación al resto del cuerpo: el objetivo era simbolizar su capacidad de acción y su intelecto.

Captura De Pantalla 2023 02 08 A Las 17 39 32
'David' de Miguel Ángel.

Lo mismo ocurre con la también maravillosa 'Pietà'. Este artista también hizo que las manos de la Virgen fueran de mayor tamaño que las de Jesucristo para incluir el cuerpo de Cristo en una pirámide que estuviese en armonía con la pirámide que formaban la virgen y su vestido.

En el caso de las máquinas, las cosas no están tan claras: teniendo en cuenta que suelen entender bien otras partes de la anatomía, la dificultad para representar las manos es desde luego un misterio. El usuario de Twitter @ticzod_fognet confesaba que llevaba tiempo reflexionando sobre el arte generado por IA, y que creía tener respuesta.

Según explicaba en un hilo en Twitter, el problema es que no era posible representar el caos y la aleatoriedad que suponen los grados de libertad de los dedos. "Morfológicamente", afirmaba, "son tan complejas como objeto como el cuerpo humano completo".

En BuzzFeed se pusieron en contacto con los creadores de Stability AI, la empresa responsable del motor Stable Diffusion. Según los responsables de este motor de IA generativa, "en general, se entiende que en los conjuntos de datos de IA, las imágenes humanas muestran las manos de forma menos visible que los rostros. Las manos también tienden a ser mucho más pequeñas en las imágenes de origen, ya que son relativamente poco visibles en gran tamaño".

No parece una respuesta especialmente reveladora, pero una cosa es cierta: al ritmo que evoluciona esta tecnología, puede que pronto nos olvidemos de que creaban mal las manos, algo que también apuntaba Javier López "Yo creo que lo conseguirán arreglar quizás dentro de seis meses", comentaba confiado.

Manos Ias
Mismo prompt para las tres plataformas, mismos resultados horripilantes.

Había también una última pregunta obligada para Javier Arizabalo: si él veía estos motores de inteligencia artificial generativa como una amenaza para su trabajo y el de otros aristas. Como él nos explicaba, muchas personas "valoran el trabajo artesanal. No tiene que ser perfecto, no es de una máquina, frío, sino que es es un trabajo que contiene errores. Yo creo que la valoración es diferente". Además, añadía algo importante de esas obras humanas:

"Por mucho que vea fotografías que parecen perfectas, yo siempre valoro mucho más un trabajo manual. Es diferente a ese otro aspecto más frío, más automatizado, más perfecto hasta cierto punto. Yo no me siento amenazado o en peligro: siempre habrá gente que valorará el trabajo con mis características, con mi impronta, con todas mis experiencias. Mi pensamiento no es estrictamente lineal ni racional, hay cuestiones de energía, de cómo me siento en ese momento, por eso cada obra es única".

Imagen: Reddit



via Robótica e IA - Xataka https://ift.tt/y74Qzi1

No hay comentarios:

Publicar un comentario