jueves, 13 de febrero de 2020

El MIT ha desarrollado una inteligencia artificial que edita las frases anticuadas en los artículos de la Wikipedia

El MIT ha desarrollado una inteligencia artificial que edita las frases anticuadas en los artículos de la Wikipedia

La Wikipedia, como wiki que es, es una plataforma colaborativa. Cualquier persona, entre comillas, puede editarla para añadir información, verificar un hecho, añadir una fuente o, por supuesto, actualizar un dato desfasado. No es una tarea sencilla, porque la Wikipedia tiene más de seis millones de artículos en inglés y 40 millones si sumamos todos los idiomas. Editar datos anticuados de todos ellos puede ser una tarea muy tediosa para los colaboradores humanos, pero no para una inteligencia artificial.

Eso es, precisamente, lo que ha desarrollado el MIT, un sistema que se podría usar para "actualizar inconsistencias factuales en los artículos de la Wikipedia, reduciendo el tiempo y el esfuerzo de los editores humanos que hacen este trabajo manualmente". Pensemos que la Wikipedia tiene artículos con cifras, cargos o ubicaciones que pueden ser cambiantes, por lo que la IA podría "estar pendiente" de estos cambios y actualizarlos automáticamente, aunque por ahora, el sistema requiere de cierta intervención humana.

Cambios en los datos manteniendo el lenguaje humano

Pantalla principal de la Wikipedia

Los investigadores explican que se trata de un sistema de generación de texto que "señala y reemplaza información específica en frases relevantes de Wikipedia", pero "manteniendo el lenguaje similar a la forma en la que los humanos escriben y editan". En un futuro, creen que existe la posibilidad de crear un sistema completamente automático que detecte las informaciones obsoletas y las actualice manualmente, pero por el momento se necesita de la intervención humana.

¿En qué sentido? En que para que el sistema funcione, el usuario debe escribir en una interfaz una oración no necesariamente estructurada con la información actualizada, supongamos "XX persona tiene 30 años". Introducido el dato, el sistema buscaría la página a la que se refiere la información, que sería en este caso la biografía de esa persona, y actualizaría el dato, reescribiendo la frase tal y como lo haría un humano. En pocas palabras, la IA es una especie de bot de automatización.

Precisamente por eso no es el primero, ya que existen bots que hacen ediciones automáticas en la Wikipedia. La clave explica Darsh Shah, uno de los autores principales del artículo, es que esos bots se basan "en reglas", es decir, que si tal palabra malsonante se pone en un artículo, sea eliminada, por ejemplo. La tarea de editar un artículo en la Wikipedia, explica Shah, "requiere razonar sobre partes contradictorias en dos frases y generar un texto coherente".

Los autores ponen el siguiente ejemplo. Supongamos que tenemos la frase:

"El Fondo A considera que 28 de sus 42 participaciones minoritarias en empresas operativas son de particular importancia para el grupo"

Y que el dato debe cambiarse por lo siguiente:

"El Fondo A considera que 23 de sus 43 participaciones minoritarias son significativas.

Hay que cambiar dos datos: 28 y 42 por 23 y 43. ¿Qué haría el sistema? Buscar el artículo del Fondo A y cambiarlos automáticamente, manteniendo la estructura de la frase y, por lo tanto, la concordancia del texto. Para conseguirlo, el sistema ha sido entrenado con un conjunto de datos basado en pares de oraciones: una reclamación y una frase relevante de la Wikipedia. Cada par fue etiquetado como "De acuerdo", "En desacuerdo" o "neutral".

El modelo analizó, en función de cómo estaban etiquetados los pares, qué palabras de la frase de la Wikipedia contradecían a las de la reclamación, reduciendo el número de palabras al mínimo (en el caso anterior, los datos 28 y 42) para ser lo más neutral posible. Hecho esto, un sistema de codificador-decodificar generaba la frase final.

¿El resultado? Según los investigadores, su modelo era más preciso al hacer actualizaciones factuales que otros sistemas de generación de textos (no identificados en el artículo). En otra prueba, unas personas puntuaron el modelo sobre cinco basándose en las frases resultantes y la nota fue de 4 puntos en las actualizaciones de los hechos y de 3,85 en la gramática.

Vía | Engadget
Imagen | Wikimedia Commons con licencia CC BY-SA 3.0



via Magazine - robotica-e-ia https://ift.tt/39uSi9i

No hay comentarios:

Publicar un comentario