martes, 22 de octubre de 2024

Me he acostumbrado a averiguar qué son las cosas que me encuentro por la calle usando IA. Y es una mejora bastante guay

Me he acostumbrado a averiguar qué son las cosas que me encuentro por la calle usando IA. Y es una mejora bastante guay

Es curioso lo rápido que la IA se ha integrado en nuestro día a día. El que más y el que menos ha hecho alguna cosa con ChatGPT, ha generado una imagen con Bing o ha usado la IA de su móvil para reescribir un párrafo y hacerlo más formal. Es curioso. Normalmente la tecnología tarda tiempo en calar en los usuarios, pero la IA ha entrado como un elefante en una cacharrería. Y en mi caso, un uso que he encontrado particularmente útil ha sido como guía turístico.

De viaje con la IA. Este verano hice una ruta por Budapest, Viena y Praga. No tengo ni la más mínima idea de húngaro ni checo y manejo el francés a medias, así que como podrás imaginar el móvil ha sido un gran aliado. Lo ha sido siempre, realmente, es uno de mis pilares a la hora de buscar rutas, sitios para comer, paradas de bus y metro, etc., pero este año decidí, además, darle una oportunidad a la IA.

¿Cómo? Usándola para identificar cosas. Google Lens siempre ha estado ahí, pero Google Gemini lleva la experiencia un paso más allá. Uno de los principales usos que le di fue traducir. Pero no te hablo de meter texto a mano o dictarlo, no. Si algo permite la IA es ser todo lo vago que quieras y obtener un buen resultado, así que bastaba con echarle una foto al cartel y adjuntarla con un claro y directo "qué dice aquí en español".

Uso de Gemini como traductor | Imagen: Xataka Uso de Gemini como traductor | Imagen: Xataka Uso de Gemini como traductor | Imagen: Xataka

La IA no solo lo traducía, sino que daba algo de contexto de lo que estaba mirando. Es decir, no hace falta que me diga "parece un menú de un restaurante" cuando tengo el menú literalmente en una mano y la bebida en la otra, pero si estoy mirando un cartel por la calle, o una señal, la cosa cambia. La imagen superior es el mejor ejemplo. Ese extra de contexto y la posibilidad de ampliar información aporta más que una simple traducción.

¿Y eso qué es? Por norma general, cuando mi pareja y yo vamos de viaje vamos un poco con el flow. Tenemos sitios vistos de antemano, pero nos gusta perdernos y descubrir la ciudad andando. Si vas a Budapest verás el Bastión de los Pescadores, el Parlamento, el Puente de las Cadenas o los baños termales, lo normal, pero si paseas por la Plaza Jozsef Nador verás un edificio enorme, vigilado y sin un solo cartel (que yo viera), pero precioso.

Con una sola foto mal hecha, Google Gemini ha sido capaz de adivinar qué estaba mirando | Imagen: Xataka Con una sola foto mal hecha, Google Gemini ha sido capaz de adivinar qué estaba mirando | Imagen: Xataka Con una sola foto mal hecha, Google Gemini ha sido capaz de adivinar qué estaba mirando | Imagen: Xataka

Lo único que tuve que hace para averiguar qué era fue echarle una foto a la fachada. Y ni siquiera una foto completa, sino una foto en vertical tirada mal y pronto. Esa foto la envié a Google Gemini con un modesto "Qué es este edificio" y en un par de segundos descubrí que era el edificio del Ministerio de Finanzas de Hungría, su historia y algunos datos curiosos.

Un poco más adelante, en la Plaza de la Libertad, hay un monumento a las víctimas de la ocupación alemana. Si lo buscas en Wikipedia verás su descripción y una mínima información sobre la polémica alrededor de su colocación. Esta estatua muestra al arcángel San Gabriel, símbolo de Hungría, siendo atacado por un águila imperial, símbolo de la Alemania Nazi. Esta simbología fue duramente criticada porque parece olvidarse de que Hungría colaboró activamente en la deportación de 450.000 judíos húngaros a campos de exterminio durante la guerra.

El Memoria a las Víctimas de la Ocupación Alemana en Budapest | Imagen: Xataka El Memoria a las Víctimas de la Ocupación Alemana en Budapest | Imagen: Xataka El Memoria a las Víctimas de la Ocupación Alemana en Budapest | Imagen: Xataka

Eso no viene en el cartel que hay frente al monumento. Me enteré gracias a que le pregunté a Google Gemini si había habido alguna polémica con su colocación, ya que delante del monumento había otros pequeños monumentos hechos por la gente con más fotos y texto que hablaban, precisamente, de la polémica. Textos que, por cierto, también pude traducir y comprender mejor gracias a la IA.

Resumen de la polémica con el monumento hecho por Google Gemini | Imagen: Xataka Resumen de la polémica con el monumento hecho por Google Gemini | Imagen: Xataka Resumen de la polémica con el monumento hecho por Google Gemini | Imagen: Xataka

¿Y con comida? Realmente, con la comida me da más o menos igual porque al fin y al cabo, sé lo que estoy pidiendo. Aunque ojo, que preguntar por una receta o los ingredientes de un plato nunca está demás. Sea como fuere, a lo que voy. Durante un viaje a Turquía, tras la cena el camarero nos trajo un té. No conseguía localizar el sabor, aunque me era extrañamente familiar.

Le hice una foto al vaso, la que podéis ver bajo estas líneas. Es, posiblemente, la foto más genérica que te puedas imaginar de un vaso con un líquido oscuro dentro que bien podría ser un café mal hecho o un té genérico. Pues teniendo en cuenta los detalles del plato y del vaso, la IA consiguió descubrir que era un vaso de té turco (çay) que realmente es una especie de té negro.

Google Gemini extrae de una foto de un vaso de té tan simple como esta que es, realmente, té turco | Imagen: Xataka Google Gemini extrae de una foto de un vaso de té tan simple como esta que es, realmente, té turco | Imagen: Xataka Google Gemini extrae de una foto de un vaso de té tan simple como esta que es, realmente, té turco | Imagen: Xataka

Pero sigo sin fiarme del todo. Aunque la inmensa mayoría de veces, sobre todo si son cuestiones simples, la IA suele funcionar perfectamente, yo no termino de fiarme del todo. No tendría fe ciega en algo generado por IA, al menos en cosas importantes. No confiaría un párrafo de un artículo o un correo importante a una IA, pero para este tipo de cosas que, en última instancia, son para alimentar la curiosidad, me parece excepcional.

Su uso es sencillo, mucho más que escribir en Google "edificio blanco grande plaza XX de ciudad YY" o "estatua ZZ" significado". Todos sabemos hacer una foto, todos sabemos escribir en un chat. ¿No es más fácil hacerlo así? Cierto es que sigue habiendo margen de mejora, que siempre tienes esa duda de si la IA habrá alucinado en su respuesta o no, pero es con este tipo de cosas con las que te das cuenta de la utilidad real, práctica, de la IA en el mundo real.

Imágenes | Xataka

En Xataka | La mega-guía de 71 herramientas de inteligencia artificial: dime para qué la necesitas y te digo qué IAs son las mejores



via Robótica e IA - Xataka https://ift.tt/DBVHdvj

No hay comentarios:

Publicar un comentario