El Traductor de Google ha ampliado significativamente su soporte de idiomas, incorporando más de 110 nuevas lenguas de todo el mundo. Entre estas se incluyen varios dialectos y lenguas indígenas de Latinoamérica como el K’iche’ y el Ta Yol Mam (Guatemala y México), el Náhuatl, Maya y Zapoteco (México), el Q’eqchi’ (México y Belice), y el Hunsrik (Brasil).
Ampliación de Idiomas con PaLM 2
Utilizando PaLM 2, su modelo de lenguaje de gran tamaño, Google ha logrado esta expansión con el uso de inteligencia artificial. Esta actualización representa la mayor incorporación de idiomas en la historia de Google Traductor, lo que destaca el compromiso de la empresa con la preservación y promoción de la diversidad lingüística y cultural en un mundo globalizado.
Preservación de la Diversidad Lingüística
Incluir idiomas y dialectos menos conocidos o en peligro de extinción ayuda a asegurar que estas lenguas no se pierdan. También proporciona a los hablantes acceso a herramientas tecnológicas que les permiten comunicarse y compartir su cultura. En México, por ejemplo, se hablan 68 lenguas además del español, con casi seis millones de mexicanos hablando alguna de las 364 variantes lingüísticas asociadas a estas lenguas.
En Brasil, se hablan más de 150 idiomas, aunque solo el portugués es oficial. Cinco de estas lenguas indígenas tienen más de 10,000 hablantes, según el Instituto Brasileño de Geografía y Estadística (IBGE).
Impacto en la Participación Cívica
La herramienta también facilita la comunicación en idiomas locales, permitiendo una mayor participación en procesos cívicos y políticos. Las comunidades pueden involucrarse más efectivamente en debates y decisiones que afectan sus vidas, fortaleciendo la democracia y la representación inclusiva.
Tecnología de Traducción Automática Zero-Shot
Desde 2022, el Traductor de Google utiliza la traducción automática Zero-Shot, un modelo de aprendizaje automático que permite a la plataforma realizar traducciones a un idioma sin haber visto ejemplos previos. Esta tecnología agiliza la incorporación de nuevos lenguajes para llegar a más comunidades.
“Los idiomas tienen una enorme cantidad de variaciones: variedades regionales, dialectos y diferentes reglas de ortografía. De hecho, muchos idiomas no tienen una norma única, por lo que es imposible elegir una variedad ‘correcta'”, explicó Google en un comunicado. “Por ejemplo, el romaní es un idioma con muchos dialectos en toda Europa. Nuestros modelos generan texto lo más parecido posible al romaní vacalo (o vlax) del sur, una variedad comúnmente utilizada en Internet. Sin embargo, también mezcla elementos de otros dialectos. Gracias a nuestras alianzas con lingüistas expertos y hablantes nativos, seguimos logrando un gran progreso en este campo. A medida que la tecnología avance, continuaremos brindando soporte a más variedades gramaticales y reglas ortográficas”.