Si nos preguntasen por algún chatbot de Microsoft, el primero que nos vendría a la mente sería Tay, el polémico bot lanzado en 2016 que se volvió racista a fuerza de conversar con trolls en Twitter. Sin embargo, si nos hablasen de otro llamado XiaoIce tendríamos más problemas a la hora de situarlo.
El motivo de ello es que XiaoIce, pese a llevar ya cuatro años en activo, hasta hace poco ha estado disponible únicamente para el mercado chino, si bien el gran tamaño de éste (y el hecho de ser accesible desde plataformas tan distintas como WeChat, QQ, Weibo, Meipai, Facebook Messenger o LINE) lo ha convertido por sí sólo en uno de los chatbots más populares del mundo.
Ahora, un equipo de investigadores de Microsoft ha publicado un artículo académico en el que desvela los secretos de su funcionamiento de XiaoIce. En él, nos desvelan que su principal misión es la de convertirse en "una IA con la que los usuarios sean capaces de establecer conexiones emocionales a largo plazo", una característica que no sólo distingue a XiaoIce de los primeros chatbots sociales (como Eliza), sino también de otros asistentes como Cortana.
XiaoIce cuenta con tres componentes principales:
- Cociente de inteligencia: Habilidades de diálogo específicas, como poder responder preguntas, recomendar preguntas, contar historias, etc.
- Cociente emocional: Factor que incluye tanto la empatía (capacidad de predecir rasgos sobre el usuario individual con el que XiaoIce está conversando); y habilidades sociales (personalización de las respuestas al usuario).
- Personalidad: "Está diseñada para parecer una chica de 18 años, confiable, simpática y con sentido del humor".
Un chatbot centrado en la empatía
La compañía explicaba recientemente en un comunicado que su chatbot representa "sólo una pequeña parte de un marco masivo y multidimensional de IA que utiliza continuamente técnicas de aprendizaje profundo para absorber la clase de datos que desarrolla su coeficiente emocional. [...] está utilizando sus interacciones con los humanos para adquirir habilidades sociales, comportamiento y conocimientos humanos".
Harry Shum, vicepresidente ejecutivo de Inteligencia Artificial e Investigación de Microsoft, afirmaba el mes pasado que "cuando nos comunicamos, usamos el tono de voz, el juego de palabras y el humor, cosas que son muy difíciles de entender para las computadoras" y a las que deberemos dar respuesta si queremos ser capaces de trabajar conjuntamente con la IA.
Di Li, responsable del desarrollo de XiaoIce en el Centro de Tecnología y Software de Asia de Microsoft, explica que
"Para crear un marco de AI, debes elegir [tener en cuenta] el coeficiente intelectual (IQ), el emocional (EQ) o ambos. Y en ese caso, debes elegir con cuál empezar: nosotros elegimos centrarnos primero en el EQ y luego en el IQ".
Efectivamente, cuando lanzaron el proyecto Xiaoice, descartaron deliberadamente los datos basados en las solicitudes de hechos y cifras realizadas por los usuarios, prefiriendo centrarse en datos que ayudarían a "construir una 'personalidad'" capaz de ayudar a despertar la empatía de los usuarios. "Este tipo de datos es muy valioso para nosotros".
El 70% de las respuestas de XiaoIce proviene de sus propias conversaciones pasadas
Los investigadores de Microsoft desvelan que la compañía diseña XiaoIce para optimizar su rendimiento en un métrica llamada "Turnos de Conversación por Sesión" o CPS; esto es, "el número promedio de turnos de conversación entre el chatbot y el usuario a lo largo de una sesión conversacional".
La idea de fondo es que, para Microsoft, la longitud de las conversaciones parecen ser un indicativo de satisfacción del usuario, por lo que un CPS alto sería positivo.
Así, desde su lanzamiento hasta el pasado mes de mayo, XiaoIce generó más de 30.000 millones de turnos de conversación (hasta mayo de 2018). "Hoy en día, el 70% de las respuestas de XiaoIce derivan de [datos extraídos de] sus propias conversaciones pasadas", afirman los investigadores.
Para ellos, esto constituye un ejemplo del modo en que las las aplicaciones de inteligencia artificial pueden convertirse en generadores de datos de gran calado y, en última instancia, evitar la dependencia de fuentes externas de datos datos externos.
Aunque este chatbot sigue extrayendo datos de toda una serie de fuentes (datasets públicos, servicios online, páginas web) y utilizándolos para valorar la calidad de los datos de la propia aplicación, es previsible que ésta mejore paralelamente al crecimiento de su base de usuarios.
Lo mismo ocurrirá con la cantidad de temas que abordan estos datos (que los investigadores aún califican como "baja" porque "muchos de los temas nuevos o menos discutidos en los foros de Internet no están incluidos").
Imagen | Microsoft
via Magazine - robotica-e-ia http://bit.ly/2BD0STW
No hay comentarios:
Publicar un comentario