Aunque Mark Zuckerberg ya había adelantado el lanzamiento un mes antes, fue en de julio de 2023 cuando Meta anunció el lanzamiento de Llama 2. Desde el principio nos lo vendieron como una especie de "ChatGPT Open Source", y la empresa no ha parado de presumir de ello, pero hay un problema.
Que Llama 2 no es Open Source.
No lo es al menos en el sentido estricto de la definición. En el sitio web oficial los responsables de Meta indicaban desde el primer momento que Llama 2 era Open Source y gratuito para uso comercial y de investigación.
Al descargarlo obtienes el código del modelo, los pesos aplicados a su red neuronal, el código de evaluación y la documentación. Sin embargo, Los responsables de la Open Source Initiative dejaron claro dos días después del lanzamiento que Llama 2 no podía ser considerado totalmente Open Source:
"Meta confunde «Open Source» con «recursos disponibles para algunos usuarios en determinadas condiciones», dos cosas muy distintas".
Como destacaban en esa aclaración, Llama 2 no cumple con la Definición Open Source (OSD) que entre otros requisitos impone que no haya restricciones contra personas, grupos o campos de actividad específicos.
Sin embargo, la licencia utilizada en los modelos y el código de Llama impone restricciones en su uso comercial para ciertos usuarios: si tu producto está basado en Llama y tienes más de 700 millones de usuarios mensuales activos, necesitas pagarle una licencia a Meta.
Eso desde luego limita mucho los escenarios en los que se superará ese requisito, pero aquí Meta se protege las espaldas si ese teórico producto crece mucho. Imaginad que alguien crea una alternativa a ChatGPT basada en Llama. Inicialmente no tendrá que pagar nada a Meta, pero si el producto se vuelve viral y acaba teniendo una adopción masiva, eso obligará a contratar una licencia y pagar por ella.
Además de ello, en Meta no comparten los datos usados para entrenarlos —la transparencia en este sentido es nula en la industria— ni el código utilizado para entrenarlo. En la OSI celebraron que Meta estuviese "reduciendo las barreras para acceder a potentes sistemas de IA", pero criticaban ese conflictivo uso del término Open Source.
No hay modelos de IA totalmente Open Source
Lo cierto es que aun sin ser "completamente" Open Source, Llama 2 logró convertirse en referente para desarrolladores. Algunos de ellos, no obstante, quisieron advertir de los peligros de basar su trabajo en modelos con limitaciones de uso.
La tabla creada por un grupo de investigadores holandeses es una excelente forma de apreciar el grado de apertura de los modelos de IA. Es mucho más larga, por cierto, podéis pinchar en la imagen para ir a la fuente. Fuente: FAccT'24.
El grupo de investigadores de la Universidad de Radboud en Nijmegen, Países Bajos, publicó una tabla fantástica. En ella se califican 14 características de diversos modelos en base a su apertura, y gracias a ella es posible saber qué modelos cumplen más (o menos) con la definición pura de Open Source. Llama 2 no lo hacía, pero es que en realidad ninguna cumple los requisitos de esta exigente tabla.
La tabla se ha ido actualizando con los nuevos modelos que se han publicado, y eso incluye al último modelo de Meta, Llama 3. En esta última versión Meta ha tenido algo más de cuidado a la hora de presumir de que el modelo es Open Source, aunque en su licencia se aplican los mismos términos que en la del modelo anterior.
En la parte baja de la tabla están tanto LlaMA 2 como Llama 3 y, en última posición, con prácticamente todos los campos con la etiqueta de "cerrado", ChatGPT-3.5.
En el sitio web oficial sí habla de que está "abiertamente disponible", pero en el artículo adicional en su blog sí indicaron que era Open Source, pero como ocurre con Llama 2, lo es solo parcialmente.
Tanto a uno como a otro se los consideran modelos de "pesos abiertos" ("open weights") porque proporciona información sobre cómo se realizan sus cálculos. En la tabla de los investigadores de Países Bajos, eso sí, ambas están situadas de las últimas.
Peor aún es lo de ChatGPT, que suspende en apertura de forma contundente, algo irónico teniendo en cuenta que está desarrollado por OpenAI. Elon Musk lleva tiempo tratando enfrentado a esta empresa, y no dudó en exigirles que cambiaran el nombre y luego gastó una broma en Twitter al respecto.
La realidad es que la transparencia en este ámbito es muy limitada, e incluso modelos que presumen de ser Open Source no lo son nunca del todo. Lo demuestran tanto Llama 2 como Llama 3, pero a pesar de ello, Meta ha logrado autoproclamarse defensor de la filosofía Open Source.
Y por el camino, por cierto, ha redimido la imagen de Mark Zuckerberg. Lo indican en The New York Times: el CEO de Facebook, otrora vilipendiado e interrogado por los escándalos de privacidad de la red social, es ahora apreciado por los desarrolladores.
Lo ha conseguido gracias a Llama 2, que se ha descargado 180 millones de veces y permite a investigadores, académicos, startups y pequeños desarrolladores adentrarse en el mundo de la IA con unos recursos de partida notables. Llama 3 parece ir por el mismo camino, y ya está triunfando en Hugging Face. Allí es posible usarlo de forma sencilla y ya ha sido descargado un millón de veces en apenas un mes.
Mark Zuckerberg y Meta tienen desde luego mucho que agradecer al mundo Open Source. Aunque su uso del término no sea del todo correcto.
Imagen | Anthony Quintano
En Xataka | Yann LeCun, responsable de IA en Meta, lo tiene claro: los modelos como ChatGPT no lograrán igualar la inteligencia humana
via Robótica e IA - Xataka https://ift.tt/cVSsu4M