miércoles, 2 de octubre de 2024

Microsoft era totalmente esclava de OpenAI para sus opciones de IA. Eso acaba de empezar a cambiar

Microsoft era totalmente esclava de OpenAI para sus opciones de IA. Eso acaba de empezar a cambiar

Ayer Microsoft presentó una avalancha de novedades con las que ha potenciado más que nunca su apuesta por la inteligencia artificial de cara al usuario final. Entre ellas hay varias, eso sí, que no dependen de ella, y eso es significativo.

Recall es de Microsoft. Como explican en la documentación de Microsoft, Recall hace uso de Windows Copilot Runtime, un componente que a su vez hace uso del modelo Phi desarrollado por la propia Microsoft. Estamos por tanto ante una función interesante y que depende de tecnología desarrollada por la propia empresa.

Copilot Vision también lo parece. Otra de las funciones más interesantes presentadas ayer fue Copilot Vision, que permite "ver" lo que tu ves en el navegador. De momento solo en Edge y solo en ciertos sitios web, pero gracias a eso puedes preguntarle al navegador por esos contenidos. Esta característica podría estar basada —Microsoft no lo detalla— en Phi-3.5-Vision-Instruct, un modelo ligero precisamente orientado a este tipo de función.

Think Deeper es o1. Esta opción de Copilot Labs permite acceder a una versión de Copilot que "razona" y que se toma su tiempo para intentar cometer menos errores en sus respuestas. Mustafa Suleyman, máximo responsable de la división de IA en Microsoft, explicaba en Wired que esta opción está basada en o1 (Strawberry), aunque destaca que han personalizado ese modelo para ajustarlo a la experiencia que ofrece Copilot.

Copilot Voice es (probablemente) GPT-4o. Hace unos meses OpenAI comenzó a mostrar cómo GPT-4o era capaz de conversar con nosotros con voces sintéticas que parecen casi humanas. Ahora esa capacidad llega a Copilot Voice, que es en esencia eso mismo, pero con otro nombre. Precisamente ayer OpenAI lanzaba en su conferencia para desarrolladores su Realtime API, con la que los desarrolladores pueden crear rápidas experiencias "voz a voz"  para sus aplicaciones. Copilot Voice es precisamente eso, y aunque Microsoft no lo ha confirmado —sí lo comienza a usar en Azure—, parece estar basada en esta API.

Microsoft mueve ficha. Todo esto demuestra que aunque Microsoft es el gran aliado e inversor de OpenAI, está tratando de no depender (tanto) de ella. Es una estrategia previsible y razonable: aprovecha su actual alianza para integrar los modelos de IA más avanzados en su catálogo de productos, pero en paralelo desarrolla sus propios modelos y comienza a integrarlos poco a poco.

Apple hace algo parecido. La estrategia de Apple es hasta cierto punto similar: en su caso las limitadas funciones de Apple Intelligence están basadas en tecnología propia, pero el usuario puede acceder a ChatGPT, el chatbot de OpenAI, si lo desea. Es evidente que Apple —cuya obsesión por el control absoluto es bien conocida— no quiere depender de nadie, aunque de momento eso recorta las opciones que su plataforma de IA puede ofrecer.

OpenAI necesita hacerse indispensable. En el otro lado tenemos a una OpenAI que está en desventaja: no tiene su propio sistema operativo para PCs o móviles como sí lo tienen Microsoft, Google o Apple. Eso la obliga a seguir tratando de ser la referencia en el campo de la IA para que estas empresas la sigan necesitando, al menos para según qué ámbitos. El reto está ahí, pero es evidente que esas tres empresas —como otras— están trabajando en sus propios modelos de IA, y eso le va a poner las cosas cada vez más difícil a los de Sam Altman.

En Xataka | Hasta ahora Microsoft y OpenAI habían sido grandes aliados. Hasta ahora



via Robótica e IA - Xataka https://ift.tt/THWCfZx

No hay comentarios:

Publicar un comentario