lunes, 22 de marzo de 2021

Cuando traducimos un idioma con género neutro como el euskera o el húngaro, Google asume el masculino o femenino

Cuando traducimos un idioma con género neutro como el euskera o el húngaro, Google asume el masculino o femenino

El sesgo de los algoritmos es un fenómeno bien estudiado. Lo hemos visto por ejemplo en la búsqueda de imágenes al escribir "cocinar" donde los resultados son principalmente de mujeres. Ahora, a través de Reddit, vemos otro llamativo caso donde el algoritmo de Google toma la decisión de asumir el género.

Cuando nos vamos a Google Translate y decidimos traducir una frase de un idioma con pronombres neutros, como es el caso del euskera, el húngaro o el checo, Google coloca en nuestro idioma el pronombre "él" o "ella" en función del contexto. Algo que también ocurre con el inglés y el resto de idiomas donde hay un pronombre diferente para el masculino y el femenino.

Cuál es la explicación detrás del sesgo del traductor de Google

En el ejemplo del húngaro que vemos en Reddit se escribe un párrafo construido alrededor del pronombre "ő", que sirve para referirse de manera genérica a los dos sexos. Sin embargo, tanto en la traducción al español como al inglés se ve que "ellas son bellas" y "ellos inteligentes". De igual manera que "ella cocina" y "él es profesor". Una particularidad que no tiene por qué ser cierta en el idioma original.

La traducción es simplemente un ejemplo y cualquier usuario puede abrir Google Translate y probar su propia frase. El algoritmo de Google Translate elegirá masculino o femenino y asumirá en cada momento lo más apropiado.

Euskera En lenguas como el euskera, que también disponen de pronombres neutros, también ocurre esta diferenciación de género en el momento de traducir.

El caso es llamativo, pero no debería sorprendernos. Simplemente estamos ante un caso directo de cómo los algoritmos únicamente son un reflejo de la sociedad.

La inteligencia artificial de Google Translate, así como la de la mayoría de sistemas, se basa en la correlación. En este caso, únicamente están mostrando el género más habitual que han encontrado en la red. Si Google decide colocar el masculino junto a profesor es porque detecta que en el idioma donde se está traduciendo ese es el caso más habitual.

La posición de Google respecto a los sesgos de su algoritmo es que sus "resultados de búsqueda son un reflejo del contenido de toda la web, incluida la frecuencia con la que aparecen este tipo de términos y la forma en que se describen en la web. Esto significa que a veces las desagradables descripciones de temas delicados pueden afectar los resultados de la búsqueda de imágenes que aparecen para una consulta determinada", aunque apuntan que "estos resultados no reflejan las propias opiniones o creencias de Google".

En Xataka | Google entiende lo imposible: por qué cuando buscamos "Aguanchu bi fri" sale el vídeo que queríamos de Queen



via Robótica e IA - Xataka https://ift.tt/318B4ME

No hay comentarios:

Publicar un comentario