viernes, 19 de abril de 2024

Meta lanza Llama 3 y refuerza su asistente de IA, Meta AI. El objetivo es claro: ganarle la partida a ChatGPT

Meta lanza Llama 3 y refuerza su asistente de IA, Meta AI. El objetivo es claro: ganarle la partida a ChatGPT

Hace un año la compañía creada por Mark Zuckerberg no parecía especialmente interesada en el ámbito de la inteligencia artificial. El metaverso parecía centrar toda su atención, pero en realidad su división de IA estaba trabajando duro. En los últimos meses esos esfuerzos han dado su fruto, y hoy la compañía ha hecho un anuncio que puede ponerla a la vanguardia en el popular segmento de los grandes modelos de lenguaje en los que OpenAI, Microsoft o Google también compiten.

Con elle de llama. La primera versión de LlaMA, lanzada en febrero de 2023, pasó algo desapercibida, pero ocurrió justo lo contrario en julio de 2023, cuando los ingenieros de Meta presentaron LlaMA 2 (más tarde escrito Llama 2). La empresa se diferenció de la competencia por usar un modelo Open Source —aunque no lo es del todo— y se convirtió en pilar para un gran número de desarrollos paralelos basados en ese modelo. De hecho, fue también especialmente interesante porque cualquiera podía descargarlo para tener su "ChatGPT propio" funcionando desde su PC.

Llega Llama 3. Los esfuerzos de Meta se han ido incrementando y ahora presentan Llama 3, la última gran versión de su modelo fundaciónal "Open Source". Según la compañía, Llama 3 supera a otros modelos similares en diversos benchmarks y destaca especialmente como asistente para programar. Las comillas del "Open Source" son importantes: el desarrollo usa una "licencia comunitaria" que como en casos anteriores no es exactamente lo mismo —aunque se parezca bastante— al Open Source.

Dos versiones iniciales. Llama 3 está disponible actualmente en dos versiones, 8B y 70B con 8.000 y 70.000 millones de parámetros respectivamente. Ambos se pueden descargar desde Meta con registro previo, y ambas versiones están a su vez disponibles en dos vertientes: una pre-entrenada (el modelo crudo que predice el siguiente token a generar) y una pulida para seguir las instrucciones de los usuarios. Ambas tienen un límite de contexto de 8.192 tokens, modesto si lo comparamos con propuestas como la de Claude 3 Opus, que admite ventanas de contexto de 200.000 tokens. El modelo puede generar imágenes además de texto.

Entrenamiento voraz. Meta entrenó ambos modelos en un gigantesco cluster con 24.000 GPUs. En el caso del modelo 70B, Zuckerberg comentó en una entrevista con Dwarkesh Patel que ese entrenamiento podía haber seguido y esa variante podía haber sido mejor, pero prefieron pasar a entrenar nuevos desarrollos y ofrecer esa versión 70B que a pesar de todo no estaba "saturada" por el entrenamiento tras "ingerir" 15 billones de tokens. "Probablemente podríamos haberla alimentado con más tokens y se hubiera vuelto algo mejor", explicó Zuckerberg.

Un gigantesco modelo 400B multimodal a la vista. Además de los modelos de Llama 3 de 8B y 70B, en Meta están preparando una versión espectacular 400B con 400.000 millones de parámetros que según algunos expertos estará a la altura de GPT-4 Turbo, Claude 3 Opus o Gemini Ultra e varios benchmarks. Ese modelo soportará entrada y salida multimodal, esto es, tanto texto como imágenes.

Bench Bench

Meta presume de rendimiento. Aunque es difícil saber si un modelo de IA es realmente mejor que otro, en Meta han proporcionado los resultados del comportamiento de sus modelos Llama 3 de 8B y 70B en diversas pruebas de rendimiento sintético, y en casi todas ellas estos modelos superan a versiones comparables como Mistral 7B, Gemini Pro 1.5 o Claude 3 Sonnet.

Meta AI se refuerza con Llama 3 y estrena versión web. El primer gran beneficiado de este lanzamiento es el chatbot de la compañía, llamado Meta AI. Este desarrollo se lanzó en septiembre de 2023, y debutó como asistente integrado en WhatsApp, Facebook, o Instagram. Ahora llega la versión web en www.meta.ai, y tanto en ella como en esos asistentes integrados el chatbot está basado en Llama 3.

Meta Ai Meta Ai El nuevo asistente de Meta AI ya tiene versión web, y su funcionamiento es calcado al de otros rivales como ChatGPT, Copilot, Gemini o Claude.

De momento Meta AI no está en España (ni en español). Es posible usar el chatbot en la web sin registro, pero por ejemplo para algunas opciones como la de generar imágenes será necesario acceder con una cuenta de Facebook. Meta.ai está disponible en inglés en EEUU y una docena de países más, pero como afirman en Meta, "solo acabamos de empezar" y se espera que la opción pronto se expanda a otras regiones. De momento no está disponible en España, y en nuestras breves pruebas —se puede acceder con VPN, como sucedía con otros lanzamientos similares en los meses pasados— hemos podido comprobar que su comportamiento era comparable al de ChatGPT.

Captura De Pantalla 2024 04 19 A Las 9 21 06 Captura De Pantalla 2024 04 19 A Las 9 21 06 La versión web contestó de forma bastante precisa a nuestras breves preguntas sobre los campeones de los mundiales de fútbol, aunque cometió algún desliz. Francia, por ejemplo, no fue subcampeona en 1986 (fue Alemania).

Objetivo: ganar a ChatGPT (y al resto). El segmento de los chatbots de IA se anima ahora más que nunca y tenemos ante nosotros una nueva e interesante propuesta que lo es más precisamente por su filosofía "casi" Open Source y porque podrá ser utilizado como base para desarrollos paralelos. La posibilidad de contar con una versión web que usar tanto desde el PC como desde el móvil —y no solo como asistente integrado en las apps de Meta— es el otro punto destacado de un lanzamiento que aumenta la presión contra ChatGPT, referente absoluto en este mercado pero que poco a poco va estando acorralado ante unas alternativas que mejoran a pasos agigantados.

En Xataka | Meta, IBM y otras forman The AI Alliance. Su objetivo: defender el desarrollo de modelos de IA Open Source



via Robótica e IA - Xataka https://ift.tt/w0XCo57

No hay comentarios:

Publicar un comentario