viernes, 17 de mayo de 2024

Google I/O 2024: todas las novedades sobre Gemini, Android 15 y sus grandes avances en IA

Google I/O 2024: todas las novedades sobre Gemini, Android 15 y sus grandes avances en IA

El Google I/O 2024 ha sido uno de los eventos más importantes del año, dejándonos sobre la mesa la propuesta de Google en inteligencia artificial para el futuro más cercano. Se celebró tan solo unos días después del gran anuncio de GPT-4o, y nos ha dejado novedades para Android, WearOS, Android Automotive y todo aquel dispositivo que pueda alimentarse de Gemini, la familia de modelos IA de Google.

En Xataka hemos recopilado todas las novedades que se presentaron en el Google I/O 2024, desde las mejoras en su familia de modelos hasta todas las novedades que irán llegando a Android cuando aterrice la versión estable de Android 15.

Gemini 1.5 Pro y Gemini Flash

Gemini Gemini

Google nos habló de todas las mejoras que recibe la familia Gemini para este 2024. En primer lugar tenemos Gemini Flash, su modelo más ligero. Es, dentro de la familia Gemini, la solución más rápida y de menor latencia, ejecutado de forma local en los dispositivos (será ideal como alternativa a Gemini Nano en un futuro).  Aquellas aplicaciones que necesiten una respuesta rápida y no tanto un modelo más denso, podrán recurrir a Flash.

Además de introducir al nuevo miembro de la familia, Google nos habló de las mejoras que llegarían a Gemini 1.5 Pro. La primera de ellas es la velocidad de cálculo. 1.5 Pro será capaz de analizar documentos de gran tamaño: archivos de hasta 1.500 páginas en total, resumen de hasta 100 correos electrónicos de forma simultánea, una hora de vídeo o bases de código de más de 30.000 líneas.

También será más inteligente a la hora de comprender imágenes y será capaz de realizar planificaciones al detalle y en tiempo real de viajes, basándose en la información de nuestros correos, vuelos, calendario y más.

Project Astra

El naming con Google no es una tarea fácil de entender, pero vamos allá. Cuando hablamos de la familia de modelos de IA de Google hablamos de Gemini. Y Gemini ahora se compone de:

  • Gemini Flash (modelo ligero).
  • Gemini Nano (modelo no tan ligero, es el que se usa actualmente en móviles).
  • Gemini Pro (modelo más potente que nano).
  • Gemini Ultra (a priori, donde Google centrará los máximos esfuerzos. El modelo más potente).
  • Gemini Live (este no es un modelo en sí, es el nombre que recibe la interfaz conversacional que veremos integrada en apps móviles).
  • Gemini Advanced: suscripción de pago de Google que incluye acceso a la familia completa.


Por si no fuera poco con este lío, Google nos habló de 'Project Astra'. ¿Y qué es esto? Un proyecto con el que quieren "desarrollar agentes de IA universales que puedan ser útiles en nuestra vida cotidiana". Es la materialización de los planes de Google para crear un asistente perfecto, que recuerde lo que ve y lo que oye, con baja latencia, y con distintos tonos de voz.

Este 'Her' de Google acabará integrado en Gemini (como el asistente de voz que están probando para remplazar a Google Assistant, que también se llama Gemini), por lo que al final acabará siendo, como todo lo demás, Gemini. De hecho, una de las integraciones más interesantes que vimos fue la de Project Astra funcionando en unas gafas: una muestra de lo que nos vendrá en el futuro.

Veo e Imagen 3

Google Google Un paisaje fotorrealista. Imagen: Google.

Durante el I/O Google también anuncio tanto Veo como Imagen 3, las evoluciones de sus modelos de texto a imagen / texto a vídeo. Quieren competir así con con Midjourney, el futuro Sora y compañía.

Imagen 3 es la evolución de Imagen 2, y ha mejorado la interpretación del lenguaje natural, así como la capacidad de añadir detalles muy específicos a partir de prompts muy extensos.

Veo es el modelo de vídeo generativo más grande de Google hasta la fecha, y permite crear clips con resolución Full HD (1080p) de más de un minuto de duración. También puede crear timelapses y es capaz de aplicar todo tipo de técnicas cinematográficas. 

Mejoras por IA en la Búsqueda de Google

La búsqueda de Google fue otro de los grandes protagonistas del I/O. Bajo una característica llamada "AI Overviews", Google nos mostró una función de su buscador para mostrar resultados generados por IA. Esta función estará disponible primero en Estados Unidos, aunque podemos probarla a través de Google Labs si utilizamos una VPN. 

Novedades en Android

En lo respectivo a Android, hubo novedades relacionadas tanto con el sistema operativo como con aplicaciones relativas al mismo.

Imagen | Google

En Xataka | La película "Her", hecha realidad: la gente está empezando a tener relaciones con sus bots de IA



via Robótica e IA - Xataka https://ift.tt/jVGeQ6W

No hay comentarios:

Publicar un comentario