• Rocco Clark

#Facebook übersetzt 100 Sprachen live

Bisherige Algorithmen mussten immer Englisch als einen Zwischenschritt verwenden und die endgültige Übersetzung aus dieser Sprache ableiten. Das neue System liefert laut Facebook deutlich bessere Ergebnisse.

Foto: Unsplash.com/@brett_jordan

System lernt durch Übersetzung


"Wir wollen mit dem Übersetzungssystem, das wir bereits haben, tatsächlich die Nachfrage von Usern auf der ganzen Welt befriedigen. Es gibt viele Regionen, in denen Menschen eine Vielzahl von Sprachen sprechen, jedoch ist keine davon Englisch. Aber die existierenden Systeme verlassen sich stark auf englischsprachige Daten", zitiert "Engadget" Facebook-AI-Forscherin Angela Fan. Zwei Drittel der täglichen Facebook-Postings seien in einer anderen Sprache als Englisch.


Für die neue KI hat Facebook einen Datensatz aus 7,5 Mrd. Sätzen aus 100 verschiedenen Sprachen verwendet. Damit haben die Forscher ein neues Modell trainiert, das diese Sprachen ineinander übersetzen kann und durch jede Übersetzung mehr lernt. Facebook hat M2M-100 mit dem sogenannten "BLEU"-Algorithmus überprüft, der digital übersetzte Texte nach ihrer Qualität bewertet. Dabei hat die KI auf Englisch basierende Systeme übertroffen.


Oft nicht genug Daten vorhanden


Laut Fan ist noch unklar, ob die KI künftig alle der ungefähr 6.200 weltweiten Sprachen beherrschen wird. Bei weitverbreiteten Sprachen sind genug Datensätze vorhanden, um eine verlässliche Übersetzung zu ermöglichen. Beispielsweise bei regionalen Dialekten sei das nicht so einfach. Facebook AI will den Algorithmus in die Social-Media-Plattform integrieren. Das Unternehmen stellt den Datensatz und das verwendete Modell auch quelloffen auf GitHub zur Verfügung.