miércoles, 7 de febrero de 2024

Premio Fronteras del Conocimiento en Tecnologías al investigador que enseñó a ver a los robots

Los robots quieren cambiarnos la vida. A día de hoy, empresas de todo el mundo están desarrollando dispositivos, en ocasiones con forma humana, capaces de cumplir con todo tipo de tareas y profesiones. Igual pueden ser camareros que asistentes médicos . Incluso los hay que quieren convertirse en astronautas. Las posibilidades de esta tecnología son casi ilimitadas. Aspira a transformar el mundo, y, además, rápido. Por eso no es raro que el Premio Fundación BBVA Fronteras del Conocimiento en Tecnologías de la Información y la Comunicación haya sido concedido, en su XVI edición y dotado con 400.000 euros, al profesor Takeo Kanade por desarrollar fundamentos matemáticos en los que se basan las capacidades que poseen hoy los ordenadores y los robots para «comprender e interpretar imágenes y escenas visuales», de acuerdo con el jurado. «Me siento muy honrado de haber sido seleccionado para el prestigioso Premio Fronteras del Conocimiento y de que mi nombre se añada a la lista de los ilustres nombres de anteriores galardonados», ha declarado el profesor Kanade. «Como demuestra el hecho de que el córtex visual ocupe el área dominante del cerebro humano, la visión o el procesamiento de la información visual proporciona al ser humano el canal de información más rico e importante para la comprensión y la comunicación. La inteligencia artificial y los robots con capacidades de visión por ordenador similares o incluso mejores contribuyen a mejorar nuestras vidas. Veo muchas oportunidades», ha explicado haciendo referencia a su campo de trabajo. Noticias Relacionadas estandar No Ojo con la IA: así la han utilizado para robarle 24 millones de euros a una empresa ABC De acuerdo con la institución, si hoy ya existen vehículos capaces de conducir de forma autónoma , robots que asisten a los cirujanos en toda clase de operaciones o sistemas de reconocimiento facial con los que accedemos a nuestros teléfonos móviles a las contribuciones de este investigador japonés, catedrático de Informática y Robótica de la Universidad Carnegie Mellon (Pittsburgh, EEUU). A lo largo de las últimas cuatro décadas, el profesor Kanade, remarca el jurado del premio, «ha sido pionero en el estudio científico de la visión artificial», al crear «los algoritmos fundacionales para la comprensión de imágenes, el procesamiento del movimiento y la percepción robótica». Sus contribuciones «no sólo han dado forma a las disciplinas científicas de la inteligencia artificial (IA) y la robótica, sino que también han transformado significativamente el mundo tecnológico en el que vivimos», concluye el jurado. «La robótica se basa en la visión artificial para la percepción. De hecho, podemos definir la robótica como la conexión inteligente entre percepción y acción. Sin percepción, un robot no puede actuar en un entorno imprevisto y no estructurado. Por ejemplo, no podríamos construir ningún vehículo autónomo sin visión, para que sea capaz de evitar colisiones«, ha señalado el profesor Oussama Khatib, catedrático de Ciencias de la Computación y director del Laboratorio de Robótica en la Universidad de Stanford (Estados Unidos) y miembro del jurado. «El profesor Kanade desplazó las fronteras del conocimiento en este campo de una manera que nadie había logrado anteriormente, y la escuela de pensamiento que fundó ha sido muy importante para el desarrollo de la visión artificial y sus aplicaciones en la percepción robótica», ha zanjado Khatib. Robots que ven Kanade revolucionó el campo de la visión artificial en tres dimensiones, al desarrollar algoritmos mucho más rápidos que los que existían hasta entonces y posibilitando por tanto un gran número de aplicaciones prácticas. Al igual que las personas y los animales necesitamos dos ojos para tener información de profundidad, la visión artificial en tres dimensiones solo es posible si se integran las imágenes procedentes de al menos dos cámaras. Sin embargo, los primeros algoritmos de visión artificial estaban pensados para procesar una sola imagen, y aplicarlos para integrar varias imágenes era un proceso demasiado lento como para utilizarse en la práctica. Para procesar un vídeo grabado con una sola cámara (es decir, en dos dimensiones) y reconocer de manera automática las imágenes que contiene, puede ser factible analizar fotograma a fotograma para reconstruir los objetos que contiene y después deducir cómo se mueven estos objetos. Computar el movimiento de los puntos de la imagen, llamado flujo óptico, de manera precisa y rápida es fundamental para comprimir vídeos, así como para que un robot se pueda orientar en el entorno. Sin embargo, este método es del todo inviable si cada fotograma procede de la integración de las imágenes grabadas por varias cámaras, ya que requiere una capacidad de computación excesiva. Kanade se dio cuenta de que, en lugar de integrar cada fotograma y después rastrear el movimiento de los objetos, sería mucho más rápido aprovechar la información del movimiento de los objetos que graba cada cámara para comprender cómo se mueve la imagen incluso antes de realizar la integración entre los vídeos de todas las cámaras. «Una vez que entendemos esto, ya no necesitamos enviar toda la información del color ni del vídeo, sino que basta con enviar simplemente el movimiento», ha explicado. Junto con su doctorando Bruce Lucas, desarrolló un nuevo método para estimar el flujo óptico en 1981. El método, que desde entonces se conoce como método de Lucas-Kanade, capta también las formas de los objetos y permite deducir la velocidad y dirección de su movimiento. «Esa es la base de la codificación de vídeo, y mi algoritmo de flujo óptico se usa para prácticamente cualquier técnica de compresión de datos de imágenes en movimiento», afirma el galardonado. Aun así, las imágenes tridimensionales requieren una capacidad de computación mucho mayor que las de dos dimensiones, y Kanade también desarrolló una manera de simplificar drásticamente los cálculos que debe realizar el ordenador para procesarlas. Su contribución, realizada junto con su doctorando Carlo Tomasi y publicada en el International Journal of Computer Vision en 1992, hizo factible que los ordenadores de la época trabajaran con imágenes tridimensionales. «Este logro requirió un entendimiento excelente de las matemáticas, un gran rigor al resolver problemas, y también una cierta creatividad en la manera de emplear las herramientas matemáticas para resolver problemas físicos», apunta Khatib. Coches sin conductor Gracias a las técnicas que propuso Kanade, en 1995 dos investigadores de la Universidad de Carnegie Mellon recorrieron Estados Unidos de costa a costa por autopista en uno de los primeros vehículos autónomos jamás construidos, accionando manualmente el acelerador y el freno, pero sin apenas tocar el volante. El profesor también ha trabajado en el desarrollo de helicópteros autónomos y sus técnicas están presentes en drones y robots con capacidad de visión. En 2001 la emisión televisiva de mayor audiencia en Estados Unidos, la final de la Super Bowl, presentó un avance técnico en el campo de la visión artificial, denominado Eye Vision, que cambió para siempre la forma de retransmitir el deporte. Los métodos de Kanade permitieron obtener imágenes de la escena desde un punto de vista en el que no se ha colocado ninguna cámara, también era capaz de reconstruir cualquier perspectiva a partir de un vídeo grabado por una cámara en movimiento. La visión artificial también se ha convertido en una tecnología clave en la cirugía robótica, un campo que se ha expandido en buena medida gracias a las técnicas desarrolladas por Kanade. El investigador desarrolló con su equipo el primer sistema robotizado para la cirugía de prótesis de cadera, llamado HipNav, que logró una precisión mucho mayor en la colocación de la prótesis, disminuyendo el riesgo de efectos secundarios. Además, gracias en buena medida a las contribuciones de Kanade, hoy ya es posible diseñar robots capaces de realizar algunas pruebas médicas sencillas, como ciertas ecografías, y detectar zonas sospechosas de presentar patologías. Mejorar la vida Mirando al futuro, Kanade confía en que su trabajo pueda contribuir en los próximos años al desarrollo de «tecnologías para mejorar la calidad de vida», en particular a través de robots y dispositivos que «ayuden a las personas mayores o con discapacidad a vivir de manera independiente». Al mismo tiempo, admite que le preocupa el posible uso perverso que pueda hacerse de algunas tecnologías desarrolladas gracias a sus contribuciones. «Odio ver cómo se está aplicando la inteligencia artificial y la visión artificial a fenómenos como los vídeos falsos (deepfakes)», lamenta. En todo caso, Kanade confía en que la tecnología permita detectar los vídeos generados artificialmente, para evitar su uso malintencionado: «Debería ser fácil poder certificar si una imagen es auténtica o falsa, y colocar una marca de agua para identificar los fraudes. En cualquier caso, me entristece que esta tecnología pueda tener un potencial para hacer daño, debido al mal uso que algunos quieran hacer de ella».

via Tecnología https://ift.tt/92DGB6e

No hay comentarios:

Publicar un comentario