Robótica Divulgativa: Anthropic quiere desafiar la hegemonía de ChatGPT: Claude 3 es multimodal y puede absorber 150.000 palabras por consulta

lunes, 4 de marzo de 2024

Anthropic quiere desafiar la hegemonía de ChatGPT: Claude 3 es multimodal y puede absorber 150.000 palabras por consulta

Cuando nos hablan de un chatbot de inteligencia artificial puede que se nos venga a la mente ChatGPT, pero esta no es la única herramienta que tenemos a nuestra disposición en la actualidad. En los últimos meses hemos visto aparecer en escena alternativas como Gemini de Google, Le Chat de Mistral AI y Claude de Anthropic. Este último, precisamente, acaba de actualizarse con tres modelos de última generación.

La compañía estadounidense ha anunciado Claude 3 Haiku, Claude 3 Sonnet y Claude 3 Opus. Estamos hablando de una serie de propuestas que, según prometen sus creadores, llegan con mayor capacidad para abordar tareas complejas, generar contenido, responder a consultas científicas y resolver problemas matemáticos. Además, la familia de modelos Claude 3 ahora tiene capacidades de visión artificial.

Claude 3 supera en varios benchmarks de referencia a GPT-4 y Gemini 1.0

Uno de los recursos que tiene la industria para medir la capacidad de los modelos de IA son los benchmarks. GPT-4, el modelo de OpenAI que impulsa productos como ChatGPT Plus y Microsoft Copilot, ha destacado durante mucho tiempo, pero los modelos de compañías rivales parecen estar acercándosele. Claude dice que su modelo más potente supera a sus pares en la mayoría de las pruebas de referencia.

En la imagen de abajo podemos ver una tabla compartida por Anthropic donde se compara la capacidad entre modelos. Claude 3 Opus muestra una mejor capacidad en los benchmarks de conocimiento experto a nivel de pregrado (MMLU), el razonamiento experto a nivel de posgrado (GPQA), matemáticas básicas (GSM8K) entre otros. Además, aseguran, tiene “niveles casi humanos de compresión y fluidez”.

Claude 3 frente a modelos rivales

Claude 3 Sonnet y Claude 3 Haiku son modelos más pequeños. El primero se presenta como una propuesta que busca el equilibro entre rendimiento y velocidad, y que puede ser utilizado para tareas de marketing, generación de código y análisis de texto. El segundo es el más compacto y rápido, pensado para responder a solicitudes sencillas como moderación de contenido, logística e inventarios.

La familia Claude 3, como señalamos arriba, es multimodal. Esto quiere decir que podremos cargar imágenes, documentos con gráficos otro tipo de archivos para análisis y obtención de respuestas. Cabe señalar que el chatbot Claude no tiene la capacidad de genera imágenes, algo que sí es posible hacer, por ejemplo, en Copilot. En este último caso lo que ha hecho Microsoft es integrar DALL·E para admitir esta característica.

Otra de las grandes novedades de los nuevos modelos de Anthropic es la ventana de contexto. En todos los casos se ofrece una ventana de contexto de 200.000 tokens. A mayor cantidad de tokens, mayor es la capacidad del modelo para absorber información en una consulta. Claude 3, sobre el papel, admite aproximadamente 150.000 palabras por consulta, lo que equivale a enviar la novela ‘Moby Dick’ completa.

Anthropic ha querido destacarse en el apartado de ventana de contexto desde un principio. La versión anterior del modelo tenía una ventana de contexto de 100.000 tokens. GPT-4, en su versión estándar, ofrece una ventana de contexto de 8.000 tokens, aunque también hay una versión especial de 32.000 tokens y la llamada GPT-4 Turbo de 128.000 tokens. Gemini 1.5, recordemos, tiene una ventana estándar de 128.000 tokens.

Pero hay más en relación a los tokens. Cuando Google presentó Gemini 1.5 el pasado 15 de febrero dijo que habían alcanzado de manera experimental la ventana de contexto más ambiciosa: hasta 1 millón de tokens por solicitud. Anthropic apunta en la misma dirección. Dicen que sus modelos pueden aceptar solicitudes que “superen 1 millón de tokens”, pero esto estará disponible para “clientes seleccionados”.

¿Cómo probar el Claude 3 de Anthropic?

Claude 3 Opus y Claude Sonnet ya están disponible en 159 países, incluido España (Haiku llegará más adelante). Podemos acceder a los nuevos modelos a través del chatbot Claude y de la API. El chatbot es accesibles a través de claude.ai/chat. Para acceder hay que registrarse y, al igual que otras alternativas del mercado, permite su utilización de manera gratuita con limitaciones. También existe una versión de pago (20 dólares al mes) que promete una mejor experiencia.

En Xataka

GPT-4 acaba de volver obsoletos los exámenes tradicionales (y eso incluye los de nivel universitario)

Los modelos de nueva generación de Anthropic también están disponibles a través de la API y de la plataforma en la nube Google Cloud. En este caso hablamos de la opción avanzada de acceder a ellos que sirve para impulsar otras aplicaciones o proyectos. En ambos casos se trata de opciones de pago cuyo precio varía de acuerdo al modelo elegido y al uso del mismo.

Imágenes | Anthropic (1, 2, 3) | Google

En Xataka | NVIDIA está en alerta: su competidor chino más fuerte ya tiene un chip para IA tan potente o más que la GPU A100

via Robótica e IA - Xataka https://ift.tt/KDImawV

Robótica Divulgativa

lunes, 4 de marzo de 2024

Anthropic quiere desafiar la hegemonía de ChatGPT: Claude 3 es multimodal y puede absorber 150.000 palabras por consulta

Claude 3 supera en varios benchmarks de referencia a GPT-4 y Gemini 1.0

¿Cómo probar el Claude 3 de Anthropic?

No hay comentarios:

Publicar un comentario