domingo, 19 de marzo de 2023

Los asistentes de voz fueron una vez la gran promesa de la IA. Hoy no son más que el patito feo

Los asistentes de voz fueron una vez la gran promesa de la IA. Hoy no son más que el patito feo

¿Recuerdan al iPhone 4s? Fue una de las actualizaciones más tenues del iPhone en sus —sintámonos viejos— 16 años de historia. Apenas cambiaba nada importante respecto al 4… salvo que incluía, en exclusividad, a Siri.

Visto con perspectiva, fue una puesta a punto bastante pírrica, pero en aquel momento, Siri nos obnubiló. Sus vídeos demostrativos, la mayor especialidad de Apple, inducían a pensar que el futuro pasaba por algo así: asistentes virtuales basados en la voz. Como el que Google no tardó en presentar o como el que Amazon decidió usar como piedra angular de su ecosistema digital.

En mi caso, recuerdo pensar “...y esto en 2011, a saber cómo estamos dentro de otros diez años”. No han pasado diez, sino doce, y lo que suena es un acorde triste de trompeta: Siri no ha evolucionado al mismo nivel, ni de lejos, que el resto de productos de Apple, ni de lo que lo ha hecho la industria tecnológica en general.

Su competencia tampoco está mucho mejor. Sobre todo, por agravio comparativo.

Están ahí, pero ni crecen demasiado ni emocionan a nadie

No es que Siri, Alexa o Google —o bueno, sobre todo Siri— no hayan evolucionado en estos años. Es que no resulta fiable recurrir a un asistente así en demasiadas circunstancias ni tiene profundidad real. Cuántas veces hemos zanjado una interacción tras escuchar “Esto es lo que he encontrado en Internet sobre…”.

Microsoft también presentó Cortana para cambiarlo todo integrándola en Windows, tanto para ordenadores como para móviles, con escasa trayectoria y nula relevancia. Murió en 2021.

Ahora suena prosaico pensar que Microsoft no va a incorporar parte de la tecnología de GPT-4 y sucesivos a una interfaz conversacional en su ecosistema, no solo de generación y síntesis de texto escrito. Podíamos dudar de Ballmer, pero de la visión estratégica de Nadella no duda nadie. Lo mismo que pensar que Google no va a hacer lo propio con Bard tras su anuncio de una IA generativa integrada en Workspace.

El problema para los asistentes de voz es que hace 10 años estábamos alucinados, hace 5 ya andábamos algo desencantados, pero con la esperanza de los altavoces inteligentes que estaban a punto de llegar; y ahora nadie habla de ellos, porque OpenAI, Microsoft, Google y unos pocos más monopolizan esa conversación. Están ahí, se usan, cumplen un papel, pero ni crecen demasiado ni emocionan a nadie. El impacto del asistente de voz no está muy lejos del de contar con un conector algo más rápido.

De Amazon sabemos que una buena parte de los despidos que anunció recientemente van a recaer sobre la plantilla que se encarga de Alexa, que más allá del entusiasmo inicial ha acabado siendo usada mayoritariamente para poner temporizadores y pedirle algo de música. Y no para usos más avanzados que no pudiéramos hacer hace una década.

Ni hablemos de para acostumbrarnos a comprar compulsivamente con la voz, algo que hubiese rentabilizado mejor su enorme apuesta por esta tecnología. El hardware, habitualmente vendido a precios irrisorios, tampoco suena a un gran negocio por sí mismo. Ha sido muy habitual encontrar Echo Dot por 20 euros. Si a 20 euros le quitamos el IVA, el envío, el embalado, los materiales, el ensamblado… ¿Qué le queda a Amazon?

La suerte de los ingenieros de Google encargados de sus sistemas operativos para entornos domésticos no ha sido mucho mejor. Según The New York Times, un 16% de ellos han caído en la lista de despidos, que solo afectó al 6% de su plantilla.

En la acera de enfrente, OpenAI ha conseguido que su interfaz conversacional cale desde el primer día, ayudando a multitud de profesiones a hacer su trabajo más eficiente y rápido, desde programadores hasta periodistas pasando por abogados o creativos. Midjourney o Stable Diffusion han logrado lo propio en la creación visual como un producto de resultados inmediatos.

Los asistentes de voz coparon titulares hablando sobre sus posibilidades futuras y se fueron deshinchando con el paso del tiempo hasta limitarse a unos usos básicos que han evolucionado poco. La nueva oleada de herramientas basadas en IA logra que se hable de ellas por sus posibilidades del presente, no del futuro.

Un año es un mundo para lo que puede evolucionar ChatGPT o Midjourney, pero una década ha servido para que Siri, Alexa o el asistente de Google evolucionen poco.

En Xataka | "Nos equivocamos": la IA de OpenAI era demasiado abierta, así que en GPT-4 impera el secretismo absoluto

Imagen destacada | Omid Armin en Unsplash.



via Robótica e IA - Xataka https://ift.tt/j49FvT6

No hay comentarios:

Publicar un comentario