martes, 1 de octubre de 2024

La Raspberry Pi AI Camera es más que una cámara: es un módulo para experimentar con proyectos de visión artificial

La Raspberry Pi AI Camera es más que una cámara: es un módulo para experimentar con proyectos de visión artificial

En 2013 los responsables de Raspberry Pi Foundation lanzaron al mercado sus primeros módulos de cámara. Dicho modelo se mejoró en 2016 y luego de nuevo en 2020, pero ahora la empresa ha ido un paso más allá con el lanzamiento de la Raspberry Pi AI Camera.

Este accesorio va más allá de lo que fueron sus antecesores, sobre todo porque está pensado para quienes pretenden experimentar con proyectos de visión artificial usando todo tipo de sistemas de inteligencia artificial. Aunque es posible acceder a proyectos de este tipo sin este modelo, sus prestaciones invitan a ir un paso más allá en este terreno.

Lo demuestra el principal componente del accesorio, el Sony IMX500 Intelligent Vision Sensor. Este sensor de 12,3 Mpíxeles es más que un sensor porque integra un microcontrolador RP2040. El sensor es capaz de captar imágenes con una resolución de hasta 4.506 x 3.040 píxeles pero la resolución para las imágenes que se procesan por IA es de 640x640.

Imx Imx Es fácil poner en marcha proyectos con objetos reconocidos por la red neuronal.

Este componente se encarga de la gestión del firmware con el se comunica el sensor con la Raspberry Pi al que lo conectamos. Lo importante aquí es que el Sony IMX500 tiene además su propia NPU y realiza todo el trabajo computacional para los modelos de IA, y mientras la CPU de las Raspberry Pi queda liberada de cualquier proceso de ese tipo.

El módulo es compatible con cualquier Raspberry Pi —incluida la Pi Zero, que tan solo consume 2 W— y hay una detallada documentación en el sitio web del producto que permite explorar algunos de los escenarios en los que podemos usar este tipo de módulo.

Incluso podremos aprovechar la información disponible en AITrios, el proyecto conjunto de Sony y The Raspberry Foundation para aprovechar el sensor IMX500 para todo tipo de proyectos.

A partir de ahí, por supuesto, las posibilidades son múltiples, y estamos por lo tanto ante un elemento de lo más interesante si queremos introducirnos en el ámbito de la IA utilizada en escenarios de visión artificial.

El precio de la Raspberry Pi AI Camera es de 70 dólares. Es notablemente más alto que el de la Raspberry Pi Camera 3, por ejemplo (25 dólares), pero hay que tener en cuenta que el nuevo modelo es, como decíamos, mucho más que un sensor.

En Xataka | Raspberry Pi 5 ya tiene un nuevo modelo. Uno más barato que persigue la estela del "ordenador de los 25 dólares"



via Robótica e IA - Xataka https://ift.tt/URcAbnj

Microsoft anuncia una avalancha de opciones de IA para Windows 11. En la UE no podremos catarlas

Microsoft anuncia una avalancha de opciones de IA para Windows 11. En la UE no podremos catarlas

Microsoft ha presentado hoy un importante conjunto de opciones de IA que estarán disponibles gradualmente para los usuarios de PCs con Windows y PCs Copilot+.

Entre todas ellas destaca sin duda Recall, la polémica "memoria fotográfica" cuyo lanzamiento acabó siendo retrasado por problemas de privacidad. El gigante de Redmond ha mostrado funciones interesantes, sin duda, pero lo ha hecho dejando claro que el despliegue de estas funciones será lento.

En la Unión Europea, por ejemplo, no tendremos de momento acceso a dichas funciones de inteligencia artificial, algo que vuelve a plantear esa IA a dos velocidades. Sea como fuere, las novedades están aquí. Conozcámoslas.

Nuevas experiencias, o quizás no tan nuevas

Esta particular avalancha de novedades llega, eso sí, con muchas que se esperaban desde hace tiempo y con otras que son una adaptación de lo que ya habíamos visto por parte de otros desarrolladores.

Recall Settings Recall Settings

Aun así la propuesta es llamativa, y destaca en primer lugar por el lanzamiento en versión preliminar —Microsoft recalca esto— de Recall, la nueva tecnología de IA que permite encontrar todo lo que hemos hecho con nuestro PC.

Microsoft tuvo que cancelar el lanzamiento inicial de Recall debido a las críticas con la seguridad y la privacidad, pero en estos meses han trabajado para corregir esos problemas y ahora aseguran que los usuarios pueden estar tranquilos al usar Recall.

Además de Recall, en Microsoft llegan opciones interesantes que no obstante ya habíamos visto por parte de otros servicios o plataformas de IA. La primera de ellas es Click to Do (versión preliminar), que funciona de forma muy similar al "Rodear para buscar" de Google.

Click To Do Click To Do

Al activarlo se nos dan una serie de opciones sobre lo que aparece en pantalla: podremos intentar obtener ayuda sobre cierta parte de la pantalla con la búsqueda visual de Bing —básicamente, lo mismo que hacemos con Google Lens—, pero también desenfocar el fondo de una imagen o borrar objetos en Windows Fotos —como hacemos en el borrador mágico de Android—.

Click to Do es capaz de entender el contenido sobre el que queremos trabajar, y por ejemplo permitirá también reescribir textos con otro tono, resumirlos o explicarlos de forma clara.

Semantic Search Semantic Search

La búsqueda de Windows mejorada es otra de las novedads de Microsoft. Con ella será posible encontrar documentos, parámetros de configuración o fotos usando lenguaje natural, preguntando como si estuviéramos pidiéndoselo a una persona.

¿Que necesitamos rescatar las fotos de aquella barbacoa? Fácil: basta con introducir como término de búsqueda "barbacoa" en el buscador de Windows Fotos o el explorador de archivos y este nuevo buscador semántico localizará esas imágenes relacionadas con esa búsqueda. Es una función similar a la que plantea Apple Intelligence, por ejemplo.

Super Resolution In Photos Super Resolution In Photos

Hay también interesantes herramientas de postprocesado de imágenes. La primera es Super Resolution, que encontraremos en Windows Fotos y que permite "afinar" la definición de las fotos borrosas o desenfocadas. Es de nuevo un efecto conocido y que por ejemplo potenció el servicio de IA Magnific comprado por Freepik.

Generative Erase In Paint Generative Erase In Paint

La segunda es Generative Fill and Erase, una nueva función de IA integrada en Paint que permitirá, a partir de una imagen, añadir o borrar información con prompts de texto que la modificarán para generar una imagen derivada que se ajuste a lo que queremos.

Copilot Labs, el futuro de la IA de Microsoft

La firma de Redmond también ha aprovechado para lanzar Copilot Labs, una forma interesante de ofrecer herramientas de IA de forma experimental para recolectar opiniones y críticas y a partir de ahí desarrollar más esos productos o quizás cancelarlos.

Copilot Copilot

Una de los primeros experimentos de Copilot Labs es Think Deeper, que es en esencia un competidor del nuevo modelo o1 de OpenAI. Según Microsoft Think Deeper permite que su chatbot, Copilot, pueda "razonar en problemas más complejos".

Tardará más tiempo en responder —como sucede con o1—, pero teóricamente ofrecerá respuestas más detalladas y en las que cometerá menos errores.

También llega Copilot Vision, un sistema con el que permites que Copilot vea lo que tú ves y te de opciones a partir de esa "percepción". En Microsoft ponen el ejemplo del navegador: con Copilot Vision el sistema puede entender el sitio web que estamos viendo y podemos hacerle preguntas sobre el contenido o ayudarnos a navegar en esa página.

Aquí Microsoft asegura que ha tenido especial cuidado para evitar suspicacias y problemas de privacidad. Copilot Vision está desactivado por defecto, y de momento nada de lo que reconoce este sistema se almacena o usa para el entrenamiento. Además se bloquea su uso en sitios con muros de pago o contenido sensible.

Otro de los elementos prometedores de este nuevo elenco de soluciones es Copilot Voice, que permite interactuar con el chatbot de Microsoft a través de la voz, en la línea de lo que permite por ejemplo GPT-4o de OpenAI.

Disponibilidad: muchas novedades que de momento solo disfrutarán unos pocos

Las nuevas opciones llegarán a partir de octubre, y lo harán en primer lugar para los miembros del programa Windows Insider. A partir de ahí se irán desplegando en una serie de dispositivos en distintas fases a partir de noviembre.

Copilot 2 Copilot 2

En Microsoft aseguran que irán informando del estado de cada características cuando esté a punto de llegar al mercado, incluyendo tanto la región como el tipo de chips para los que estará disponible.

El citado despliegue de esas opciones se producirá a los PC Copilot+ de dos formas: Recall, Click to do y la búsqueda mejorada de Windows llegarán con actualizaciones del sistema operativo. Sin embargo, otras opciones como Super Resolution en Windows Fotos y Generative Fill and Erase en Paint llegarán mediante actualizaciones de estas aplicaciones en Microsoft Store.

Hay que tener en cuenta que las opciones de IA no estarán disponibles en la Unión Europea de momento, y de hecho esa disponibilidad es limitada:

  • Copilot Voice: estará disponible en inglés, en EEUU, Canadá, Nueva Zelanda, Reino Unido y Australia. Se expandirá a más regiones e idiomas "pronto".
  • Copilot Daily estará disponible en EEUU y el Reino Unido. Se expandirá a más regiones e idiomas "pronto".
  • Copilot Vision formará parte de Copilot Labs "pronto" y estará disponible solo para un número limitado de suscriptores de Copilot Pro en EEUU.
  • Think Deeper está ya disponible para un número limitado de suscriptores de Copilot Pro en EEUU.

Además de todo esto, Microsoft ha anunciado la actualización Windows 11 2024, también llamada Windows 11 versión 24H2. Esta versión incluye "elementos fundacionales" necesarios para las nuevas opciones de IA, pero además integra otras mejoras como el soporte para Wi-Fi 7 o un sistema mejorado de eficiencia energética. 

Esta actualización también irá llegando de forma progresiva a nuestros PCs y portátiles, aunque en cualquier momento podremos tratar de acceder a ella desde el apartado de actualizaciones de Windows 11.

En Xataka | La Ley de IA europea entra en vigor: así se va a aplicar la primera regulación de inteligencia artificial del mundo



via Robótica e IA - Xataka https://ift.tt/Ix73Khq

El de Apple y OpenAI iba a ser un matrimonio de conveniencia. Son tan diferentes que ni eso ha sido posible

El de Apple y OpenAI iba a ser un matrimonio de conveniencia. Son tan diferentes que ni eso ha sido posible

La decisión de Apple de no invertir en OpenAI pese a que había estado considerándolo es un cartel de neón que habla de las enormes diferencias entre ambas empresas. En varios niveles.

La panorámica. Mientras que otras grandes tecnológicas como Microsoft y NVIDIA están apostando muy fuerte por OpenAI, Apple ha decidido quedarse al margen. Es un síntoma más de su estrategia, que prioriza la estabilidad y la privacidad incluso en la carrera desenfrenada por liderar la IA generativa.

Si escoger un socio comercial o invertir en una compañía es el equivalente empresarial a casarse, ni como matrimonio de conveniencia ha habido forma de que Apple y OpenAI se entiendan. Demasiado diferentes.

Entre líneas:

  1. El legado de Cook. La decisión de no invertir en OpenAI muestra la filosofía de Tim Cook, que ha hecho de Apple una empresa estable, cautelosa y predecible... en contraste con el carácter volátil y experimental de la IA actual.
  2. Distintos liderazgos. La estabilidad y fiabilidad de Apple parte de un liderazgo sólido y estable, el de Cook. El liderazgo de OpenAI es un perpetuo terremoto que ha ido perdiendo a casi todos sus fundadores y piezas clave en muy poco tiempo.
  3. Privacidad como diferenciador. Los modelos de IA requieren cantidades descomunales de información personal para ser entrenador, algo que no entronca con el discurso de Apple sobre la privacidad.
  4. Riesgos legales. Ya hemos visto varias demandas contra empresas de IA por el uso indebido de datos para entrenar sus modelos. Eso tampoco encaja en absoluto con la cautela de Apple.

En detalle. Apple ha construido una parte de su marca en torno a la privacidad. Cook llegó a decir en 2018 que es "un derecho humano fundamental".

Además, en los trece años que lleva Cook al frente de la empresa ha habido un giro: de una Apple que asumía riesgos para sorprender a su público a una Apple continuista y estable que rara vez asume apuestas arriesgadas.

Por otro lado, la IA generativa representa un campo de rapidísima evolución, algo que se aleja del enfoque de Cook, mucho más metódico y dando pasos lentos hasta llegar a su próxima propuesta comercial. Cook no es un hombre hecho para "moverse rápido y romper cosas". OpenAI sí.

El contraste. Competidores como Microsoft han entrado de lleno en la IA generativa, asumiendo riesgos incluso legales o financieros. Amazon hizo una doble gran inversión en Anthropic. Google hasta flirteó con romper con su propio legado para llevar los resultados sintéticos a su buscador.

Apple, en cambio, mantiene una postura más conservadora, apostando por un desarrollo gradual, incluso bajo el riesgo de quedarse demasiado atrás.

En Xataka | Mark Zuckerberg explica en dos minutos por qué las Big Tech van a seguir gastando dinero en IA como si no hubiera mañana

Imagen destacada | Xataka con Midjourney



via Robótica e IA - Xataka https://ift.tt/Dg9FwYh

Huawei está intentando erradicar a NVIDIA de las tecnológicas chinas. Su chip Ascend 910C para IA es su arma

Huawei está intentando erradicar a NVIDIA de las tecnológicas chinas. Su chip Ascend 910C para IA es su arma

Hasta la llegada del paquete de sanciones a China aprobado por EEUU que entró en vigor el 16 de noviembre de 2023, NVIDIA acaparaba algo más del 90% del mercado chino de los chips para inteligencia artificial (IA). Sin embargo, después de esa fecha su posición de liderazgo se está viendo comprometida. El Gobierno chino está destinando una gran cantidad de recursos al desarrollo de sus propios equipos de litografía, y también a la puesta a punto de sus propios chips de vanguardia para aplicaciones de IA.

Las compañías chinas que están enfrascadas en el desarrollo de su propio hardware para este escenario de uso se cuentan por decenas. MetaX, Alibaba, Biren Technology, Moore Threads, Innosilicon, Zhaoxin, Iluvatar CoreX, DenglinAI o Vast AI Tech son algunas de las más importantes, pero una brilla con más intensidad que todas las demás: Huawei. A esta empresa le va bien en el mercado chino (factura anualmente unos 7.000 millones de dólares solo en China), y el debilitamiento de NVIDIA le viene de perlas.

Y es que Huawei tiene listas sus propias GPU para IA, los chips Ascend AI, desde hace más de cinco años. Durante este periodo de tiempo ha ido refinándolas e incrementando sus capacidades con el propósito de igualar o, incluso, superar el rendimiento de los chips A100 y H100 de NVIDIA. Según algunos analistas, como los de la empresa china iFly Tek, la potencia bruta de sus GPU iguala la de los chips de NVIDIA, pero siguen estando un paso por detrás si nos ceñimos a su rendimiento en un escenario de uso real.

Huawei ya se está abriendo paso entre las tecnológicas chinas

Para Huawei la coyuntura actual representa una oportunidad inmejorable a la hora de reforzar su presencia en su propio país. Sin embargo, tanto esta compañía como las demás empresas chinas se enfrentan a un gran desafío que no les va a poner fácil hacerse con el mercado que hasta ahora ha dominado NVIDIA: la mayor parte de los proyectos de IA que se están desarrollando dentro y fuera de China están implementados sobre CUDA (Compute Unified Device Architecture). Esta tecnología aglutina el compilador y las herramientas de desarrollo utilizados por los programadores para desarrollar su software para las GPU de NVIDIA.

Buena parte de las empresas de tecnología chinas está buscando alternativas a los chips de NVIDIA, y Huawei está aprovechando la ocasión para hacerles llegar muestras de su GPU Ascend 910C para pruebas

Huawei tiene CANN (Compute Architecture for Neural Networks), que es su alternativa a CUDA, pero existe entre los analistas un consenso que defiende que esta plataforma aún está muy lejos de las capacidades que tiene la tecnología de NVIDIA en el proceso de entrenamiento de los modelos de IA. Dadas las circunstancias Huawei solo tiene una opción si quiere reforzarse en el mercado chino de los chips para IA: refinar CANN y ofrecer a los clientes de NVIDIA la posibilidad de trasladar sus modelos y sus datos a su propio ecosistema de una manera sencilla.

Es justo lo que parece estar haciendo. No obstante, esta compañía china tiene un aliado muy valioso para abrirse camino: su GPU para IA Ascend 910C. Buena parte de las empresas de tecnología chinas está buscando alternativas a los chips de NVIDIA, y Huawei está aprovechando la ocasión para hacerles llegar muestras de su GPU Ascend 910C para pruebas. Este chip es una revisión mejorada del Ascend 910B, que, según la propia Huawei, tiene una potencia equiparable al A100 de NVIDIA, por lo que parece razonable prever que el 910C es si cabe aún más potente.

Reuters asegura que ByteDance planea entrenar un nuevo modelo de IA con chips de Huawei, lo que confirma el interés que parecen tener las tecnológicas chinas en las soluciones que les está proponiendo su compatriota. Eric Xu Zhijun, presidente rotativo de Huawei, ha confirmado que su compañía ha puesto en marcha dos nuevas divisiones durante los últimos cinco años para ofrecer otra opción que pueda encajar con las necesidades de infraestructura de IA que tienen las empresas. "Es poco probable que EEUU levante sus restricciones a China pronto, lo que nos ha dado la oportunidad de ofrecer recursos de computación en la nube", sentencia Zhijun con convicción.

Imagen | Huawei

Más información | SCMP | Reuters

En Xataka | Huawei se queda sola: tres empresas taiwanesas están bajo presión por "ayudarla" a construir fábricas de chips en China



via Robótica e IA - Xataka https://ift.tt/Aoz1y6N