Google Translate está agregando 24 nuevos idiomas, y todo gracias al aprendizaje automático

Como parte de Google I/O 2022, la compañía reveló sus últimos cambios en Google Translate, incluida la adición de 24 nuevos idiomas. Estos no son los idiomas más comunes del mundo, pero algunos son utilizados por millones de personas en todo el mundo. Por ejemplo, el idioma más utilizado que se agregará pronto es Bhojpuri, que se usa en el norte de India, Nepal y Fiji. Según el censo de India de 2011, al menos 51 millones de personas usan el idioma.

Según la investigación de Google, el idioma menos utilizado de esta última actualización es el sánscrito, que utilizan unas 20.000 personas en la India. Estos nuevos idiomas son los primeros que la compañía ha agregado al servicio utilizando su tecnología de traducción automática Zero-Shot. Es un modelo de aprendizaje automático que puede aprender a traducir palabras a otro idioma sin tener que ver ningún ejemplo. Google no ha compartido detalles sobre cómo funciona esto, pero es una tecnología de la que la compañía ha estado hablando desde 2016.

ANDROIDPOLICE VÍDEO DEL DÍA

Junto con la tecnología, Google ha solicitado la ayuda de hablantes nativos y lingüistas para ayudar a refinar las traducciones. Sin embargo, Google nota que esto está abierto a problemas, al decir, «si bien esta tecnología es impresionante, no es perfecta». Los idiomas se encuentran a continuación y las estadísticas provienen de las estimaciones de popularidad de Google en todo el mundo.

● Asamés, utilizado por alrededor de 25 millones de personas en el noreste de India

● Aymara, utilizado por cerca de dos millones de personas en Bolivia, Chile y Perú

● Bambara, utilizado por unos 14 millones de personas en Malí

● Bhojpuri, utilizado por unos 50 millones de personas en el norte de la India, Nepal y Fiji

● Dhivehi, utilizado por unas 300.000 personas en las Maldivas

● Dogri, utilizado por unos tres millones de personas en el norte de la India

● Ewe, utilizado por unos siete millones de personas en Ghana y Togo

● Guaraní, utilizado por alrededor de siete millones de personas en Paraguay y Bolivia, Argentina y Brasil

● Ilocano, utilizado por unos 10 millones de personas en el norte de Filipinas

● Konkani, utilizado por cerca de dos millones de personas en el centro de la India

● Krio, utilizado por unos cuatro millones de personas en Sierra Leona

● kurdo (shoran), utilizado por unos ocho millones de personas, principalmente en Irak

● Lingala, utilizado por unos 45 millones de personas en la República Democrática del Congo, la República del Congo, la República Centroafricana, Angola y la República de Sudán del Sur

● Luganda, utilizado por unos 20 millones de personas en Uganda y Ruanda

● Maithili, utilizado por unos 34 millones de personas en el norte de la India

● Meiteilon (Manipuri), utilizado por cerca de dos millones de personas en el noreste de la India

● Mizo, utilizado por unas 830.000 personas en el noreste de India

● Oromo, utilizado por unos 37 millones de personas en Etiopía y Kenia

● Quechua, utilizado por unos 10 millones de personas en Perú, Bolivia, Ecuador y los países vecinos

● Sánscrito, utilizado por unas 20.000 personas en la India

● Sepedi, utilizado por unos 14 millones de personas en Sudáfrica

● Tigrinya, utilizado por unos ocho millones de personas en Eritrea y Etiopía

● Tsonga, utilizado por unos siete millones de personas en Esuatini, Mozambique, Sudáfrica y

Zimbabue

● Twi, utilizado por alrededor de 11 millones de personas en Ghana

Todavía no sabemos cuándo veremos los idiomas aparecer en Google Translate, pero esperamos que se implementen gradualmente en el servicio en una fecha posterior.

La nueva función de búsqueda del lanzador de Android 13 te permite anclar consultas recientes a tu pantalla de inicio

Leer siguiente

Sobre el Autor