Les nouvelles langues vont du bhojpuri, qui est parlé par pas moins de 50 millions de personnes dans le nord de l’Inde, au Népal et aux Fidji, au dhiveri avec ses quelque 300 000 locuteurs aux Maldives. Cette décision porte désormais à 133 le nombre total de langues disponibles sur Google Translate. La société affirme que les nouvelles langues représentent également une étape technique, expliquant qu’elles utilisent un modèle d’apprentissage automatique qui apprend à « traduire dans une autre langue sans jamais voir d’exemple ».
Plusieurs autres langues africaines étaient déjà disponibles, notamment l’Amharique, le Haoussa et le Somali. Dans le passé, le logiciel utilisé pour traduire et apprendre à améliorer l’interprétation était alimenté par de la ressource déjà traduite. Il existe une quantité importante et croissante de textes dans les langues les plus parlées et les plus utilisées, mais ce n’est pas le cas pour beaucoup d’autres.
Google souligne que ces nouveaux ajouts reposent sur un nouveau logiciel qui ne nécessite pas de référence à des exemples précédents. En 2020, Google Translate a ajouté cinq nouvelles langues à la plate-forme dans ce qui était alors sa première extension au cours des dernières années.
Les nouvelles langues africaines qui sont concernées sont :
* le Bambara – parlé au Mali
* l’Ewe – parlé au Ghana et au Togo
* le Krio – parlé en Sierra Leone
* le Lingala – parlé dans une grande partie de l’Afrique centrale, y compris en République démocratique du Congo
* le Luganda – parlé en Ouganda et au Rwanda
* l’Oromo – parlé en Ethiopie
* le Sepedi – parlé en Afrique du Sud
* le Tigrinya – parlé en Erythrée et en Ethiopie
* le Tsonga – langue parlée en Afrique du Sud
* le Twi – langue parlée au Ghana