El espíritu del idioma español está impregnado de sesgos de género. Los artículos determinados e indeterminados, los adjetivos calificativos y demostrativos, los pronombres personales demostrativos y posesivos. Y por supuesto los sustantivos están obligados a determinar el género. Cada cosa nombrada en español conlleva una masculinidad o feminidad.
Los planes iniciales de Google para emprender la ardua tarea de ofrecer traducciones sin sesgos de género en su traductor comenzaron en 2018. Google Translate dejaría de asignar un género específico a la traducción de palabras que son de género neutro en un idioma. En las traducciones de inglés a español, traducir por ejemplo algo como «a journalist» que es neutro en inglés, se traducía como «un periodista» al español.
Puedes leer: Tangle Marketplaces de IOTA es polígota y tiene el sócalo abierto
La primera opción ha sido ofrecer traducciones para género femenino y masculino a la vez, indicando que la traducción distingue por género. Hoy, esos planes enfocados en los sesgos de género en el Machine Learning han avanzado un poco más. Romina Stella, directora de producto de Google Research en una entrevista de Genbeta explica sus progresos.
Complejos sesgos de género
Dos han sido los avances más importantes en esta dirección. El primero es que Google Translate ya no solo ofrece traducciones que distinguen por género para palabras únicas, sino para frases completas desde inglés a español.
Por ejemplo, para una frase como «my friend is a programmer» en la que no se sabe el género de ese amigo, porque en inglés tanto «friend» como «programmer» son de genero neutro, el traductor ofrece dos frases de respuesta: «mi amiga es programadora» o «mi amigo es programador».
El segundo gran avance aún no ha sido aplicado a las traducciones inglés español. Este se basa básicamente en cambiar el modelo de machine learning a la hora de generar esas dos opciones. Stella explica que el modelo viejo generaba las dos opciones y se verificaba que fuesen iguales y de alta calidad.
Sin embargo, muchas veces esas opciones se perdían porque el modelo generaba traducciones que no eran exactamente iguales. El modelo nuevo genera una sola traducción, ya sea masculina o femenina. Mientras otro modelo de machine learning se encarga de reescribir esa traducción con el otro género.
La ventaja es que poder reescribir las traducciones en lugar de tener que generarlas todas, hace que se puedan ofrecer las que distinguen por género para muchísimas más frases. Esto es algo que por ahora funciona solo con finlandés, persa, húngaro, y turco a inglés. E español aún usa el modelo viejo, pero la idea es reemplazarlo con este pronto.
Español complicado
La directora explica que el español es mucho más complicado porque hay muchísimas más palabras que varían por género, no solo los términos que se refieren a personas. «En español todo varía, varían los artículos, los adjetivos. En inglés de alguna manera es un poco más fácil porque la cantidad de términos que varían es un poco más reducida».
En el caso del traductor el tema de los sesgos de género resulta desafiante porque necesitan aprender cómo se manejan en cada idioma. Y aunque en inglés parecería que «they y them» son los pronombre más usados para referirse al género neutro, hay muchos pronombres diferentes que pueden usarse para gente que no se identifica con género masculino o femenino.
«En español es bastante más complejo, vemos el uso de la ‘x’, vemos el uso de la @, vemos el uso de la ‘e’. Vemos gente intentando evitar los sesgos de género a pesar de lo difícil que es en un español que tiene tanto género». Es algo en lo que están pensando, pero que simplemente no han podido resolver.
Puedes leer: ¿Cómo se explica la violencia racista en la policía de EE.UU.?
Google consulta con muchísimos especialistas para esto, muchos son lingüistas, pero como comenta Stella, ni ellos lo entienden todo. Necesitan aprender no solo cómo funciona el idioma sino cómo se usa. El español es hablado por una enorme cantidad de países, y cada uno tiene sus propias particularidades. La visión de las personas y las sociedades sobre los temas de género también es sumamente distinta en la mayoría de ellos.