
Kantonesisch, Patois und Wolof: Der Google Übersetzer lernt 110 neue Sprachen

Mit 110 neuen Sprachen hat Google das größte Update für sein Übersetzungs-Tool Google Translate angekündigt.
Mit der Hilfe von KI, genauer dem Language Model PaLM 2, erweitert Google die Fähigkeiten seines Übersetzers deutlich. Zu den bisherigen 133 Sprachen kommen 110 neue hinzu. Diese werden von 614 Millionen Menschen gesprochen und reichen von Kantonesisch bis zu Manx, das nur auf der Isle of Man gesprochen wird.
Von Weltsprachen mit über 100 Millionen Nutzerinnen bis zu regionalen Dialekten
Etwa ein Viertel der neu hinzugefügten Sprachen stammt aus Afrika, wie der Softwareentwickler Isaac Caswell aus dem Translate-Team von Google in einem offiziellen Blogpost schreibt.
Caswell pickt sich mehrere Sprachen heraus und verrät Details zu ihnen. So sei Kantonesisch die am meisten nachgefragte Sprache für Google Translate gewesen. Das Problem sei gewesen, genug brauchbares Trainingsmaterial zu haben, da die Sprache im Schriftlichen viele Überschneidungen mit Mandarin habe. Die gälische Sprache Manx sei 1974 auf der Isle auf Man mit dem letzten Native-Speaker gestorben. Nach einer Wiederbelebung würden nun aber mehrere tausend Menschen auf der Insel die Sprache wieder beherrschen.
Bei einigen Sprachen musste Google auch Kompromisse eingehen. So habe Romanes viele verschiedene Dialekte in Europa. Die Übersetzungen seien am nächsten am südlichen Vlax-Romani dran, das online viel genutzt werde, enthalte aber auch Elemente des nördlichen Vlax- und des Balkan-Romani. PaLM 2 sei eine wichtige Hilfe dabei gewesen, dem Übersetzer neue Sprachen beizubringen, die nahe mit bereits vorhandenen Sprachen verwandt seien. Als Beispiel nennt Caswell die kreolischen Sprachen der Seychellen und von Mauritius.

Quelle: ArnoldPlaton, CC BY-SA 3.0, Wikipedia
Die Liste mit den 110 neuen Sprachen findest du hier. Beim Blick darauf fallen mir neben den bereits erwähnten Sprachen Balinesisch, Färöisch, Jamaikanisches Patois, Tschetschenisch und mit Punjabi die wichtigste Sprache Pakistans auf. Bist du in Italien unterwegs, kannst du Google Translate demnächst für Ligurisch, Lombardisch, Sizilianisch oder Venetisch nutzen. In Frankreich kommt Bretonisch hinzu und Limburgisch (Südniederfränkisch) im Dreiländereck von Deutschland, Belgien und den Niederlanden.
Die neuen Sprachen sollen in den nächsten Tagen translate.google.com sowie den Google-Übersetzer-Apps in Android und iOS zur Verfügung stehen.
Alle 110 neuen Sprachen von Google Translate
Über welche der neuen Sprachen freust du dich am meisten?
Abkhaz
Acehnese
Acholi
Afar
Alur
Avar
Awadhi
Balinese
Baluchi
Baoulé
Bashkir
Batak Karo
Batak Simalungun
Batak Toba
Bemba
Betawi
Bikol
Breton
Buryat
Cantonese
Chamorro
Chechen
Chuukese
Chuvash
Crimean Tatar
Dari
Dinka
Dombe
Dyula
Dzongkha
Faroese
Fijian
Fon
Friulian
Fulani
Ga
Hakha Chin
Hiligaynon
Hunsrik
Iban
Jamaican Patois
Jingpo
Kalaallisut
Kanuri
Kapampangan
Khasi
Kiga
Kikongo
Kituba
Kokborok
Komi
Latgalian
Ligurian
Limburgish
Lombard
Luo
Madurese
Makassar
Malay (Jawi)
Mam
Manx
Marshallese
Marwadi
Mauritian Creole
Meadow Mari
Minang
Nahuatl (Eastern Huasteca)
Ndau
Ndebele (South)
Nepalbhasa (Newari)
NKo
Nuer
Occitan
Ossetian
Pangasinan
Papiamento
Portuguese (Portugal)
Punjabi (Shahmukhi)
Q'eqchi'
Romani
Rundi
Sami (North)
Sango
Santali
Seychellois Creole
Shan
Sicilian
Silesian
Susu
Swati
Tahitian
Tamazight
Tamazight (Tifinagh)
Tetum
Tibetan
Tiv
Tok Pisin
Tongan
Tswana
Tulu
Tumbuka
Tuvan
Udmurt
Venda
Venetian
Waray
Wolof
Yakut
Yucatec Maya
Zapotec


Als Grundschüler saß ich noch mit vielen Mitschülern bei einem Freund im Wohnzimmer, um auf der Super NES zu spielen. Inzwischen bekomme ich die neueste Technik direkt in die Hände und teste sie für euch. In den letzten Jahren bei Curved, Computer Bild und Netzwelt, nun bei Digitec und Galaxus.