Übersetzen mit ChatGPT&Co. II – Praxisbeispiel Arabisch: Bundesverband der Dolmetscher und Übersetzer e.V.

Eisberg voraus:

Warum sich KI-Übersetzung nach wie vor mit Arabisch so schwer tut

Mai 23, 2024

Bild: katiekk2 – Fotolia/AdobeStock

Das Sprachenspektrum maschineller Übersetzungssysteme wächst ständig, und mit ihm das blinde Vertrauen in die erzeugten Ergebnisse. Dabei wird gern übersehen, dass sich die Erfolgsmeldungen der KI-Anbieter meist auf Kombinationen mit der englischen Sprache beziehen. Doch Sprache ist nicht gleich Sprache, und die Qualität des maschinellen Outputs variiert nach wie vor immens. Dr. Daniel Falk erläutert, warum sich die KI immer noch mit der fünfstärksten Sprache der Welt so schwer tut – und warum der prüfende Expertenblick auch (bzw. gerade) bei Übersetzungen aus der Maschine im Zweifelsfall Standard sein sollte.

Als Mitte der 2010er Jahre die ersten Programme zur neuronalen maschinellen Übersetzung (NMÜ) auf den Markt kamen, zeigte sich zunächst ein Muster, das auch schon bei früheren technischen Neuerungen in der Übersetzungsbranche – etwa bei der Einführung von CAT-Tools – zu beobachten war: In großen Sprachen und Sprachkombinationen wie Englisch, Französisch, Deutsch oder Spanisch setzte sich die Technologie deutlich schneller durch als in kleinen und außereuropäischen Sprachen. So wie wir Arabisch-Übersetzer über Jahre die zunehmende Verbreitung von fachspezifischer Software wie Trados Studio oder MemoQ und anderen Systemen verfolgen konnten und uns bei der Anwendung noch lange mit den „Kinderkrankheiten“ herumschlagen mussten (falsch verbundene arabische Buchstaben, verkehrte Laufrichtung, zerhacktes Layout...), so waren auch die ersten Ergebnisse der NMÜ-Systeme Anlass für Spott und viele lustige Anekdoten.

Das hat sich längst geändert. Die Übersetzungsergebnisse aus dem Arabischen oder ins Arabische sind in einigen Bereichen auf sehr gutem Niveau angelangt. Bei Texten mit einfacher Syntax oder beispielsweise Nachrichtenmeldungen sind die Fehler überschaubar geworden. Seit Januar 2024 bietet selbst der DeepL-Übersetzer Arabisch als Übersetzungssprache an und insbesondere in den arabischen Golfstaaten wird an großen Sprachmodellen speziell für Arabisch geforscht.

Auf der anderen Seite ist der Einsatz von KI-Übersetzern für Arabisch in vielen Fällen immer noch höchst riskant, da die Systeme nach wie vor fehleranfällig sind. Insbesondere drei Ursachen sorgen im Zusammenspiel dafür, dass der Output maschineller Übersetzungssysteme bei Arabisch-Übersetzungen in einigen Fällen qualitativ deutlich schlechter ist als bei anderen Sprachen:

sprachkulturelle Besonderheiten aufgrund der Komplexität der arabischen Sprache,
die Heterogenität des arabischen Sprachraums und
die Art und Menge des verfügbaren Trainingsmaterials für KI-Systeme.

Schrift, Syntax, uneinheitliche Interpunktion: sprachkulturelle Besonderheiten

KI-Systeme übersetzen Texte, indem sie in einer Ausgangssprache Muster erkennen und daraus sprachliche Muster für den Zieltext berechnen und ausgeben. Insoweit funktioniert die neuronale maschinelle Übersetzung für alle Sprachen gleich. Allerdings liegen beim Arabischen gleich mehrere sprachimmanente Besonderheiten vor, durch die die Zahl der potenziell möglichen Muster deutlich höher ist als bei anderen Sprachen.

Das fängt schon bei der arabischen Schrift an: Das arabische Alphabet besteht überwiegend aus Konsonanten. Lediglich die drei langen Vokale (a, i und u) werden überhaupt geschrieben. Die kurzen Vokale, Diphthonge oder Verdoppelungszeichen für einzelne Konsonanten muss der vorgebildete Leser in den Text „hineinlesen“. Wer Grammatik und Vokabular des Hocharabischen beherrscht, für den ist das auch weiter kein Problem, und das können inzwischen auch neuronale Netzwerke. Problematisch wird es, wenn sich aus dem Schriftbild verschiedene Lesarten und damit unterschiedliche Bedeutungsvarianten eines Wortes ergeben. Beispielsweise kann das Wort mit der Konsonantenwurzel „q-d-m“ (قدم) in neun verschiedenen Varianten gelesen werden. „qadama“, „qaddama“, „quddima“, „qudima“, „qadam“, „qadm“, „qidm“, „qidam“, „qudum“. Viele der neun Varianten tragen wiederum mehrere Bedeutungen, dazu können z. B. mit Präfixen weitere Bedeutungen hinzukommen. Daher spielen beim Lesen, Verstehen und Übersetzen arabischer Texte Weltwissen und Kontext eine große Rolle. Die Konsonantenschrift sorgt übrigens auch dafür, dass Tippfehler – mit entsprechenden Missverständnissen wie im oben genannten Fall – noch schneller passieren können als bei anderen Schriften, denn schon ein Buchstabe kann einen großen Bedeutungsunterschied machen. Es war möglicherweise eben ein solcher Tippfehler, der Anfang Mai 2024 in Bayern zur irrtümlichen Evakuierung eines Regionalzugs mit 80 Personen geführt hat.

Hinzu kommt, dass arabische Texte eine „großzügige“ Syntax aufweisen. Die Wortstellung ist relativ frei, Interpunktion wird uneinheitlich oder gar nicht verwendet und je nach Textsorte können sich einzelne Sätze über ganze Seiten hinziehen. Dadurch ergibt sich häufig der Fall, dass mehrere Interpretationen und damit unterschiedliche Übersetzungsvarianten ein und derselben Textstellen möglich sind. Als professioneller Übersetzer mache ich diese Ambiguitäten transparent, recherchiere den Kontext, stelle Rückfragen und gebe im Zweifelsfall – z. B. bei juristischen Texten – in der Fußnote Varianten an, die im Gesamtkontext auch Sinn ergeben könnten. Die Maschine entscheidet sich einfach für eine Variante.

Heterogenität des Sprachraums: Arabisch ist nicht gleich Arabisch

Der arabische Sprachraum erstreckt sich von Marokko im Westen bis zum Oman im Osten über 22 Staaten mit knapp 400 Millionen Muttersprachlern. Dabei ist Arabisch nicht gleich Arabisch: Von Region zu Region gibt es unterschiedliche Sprachgewohnheiten und es haben sich eigene Terminologien (z. B. bei der Benennung von Institutionen oder in der Rechtsterminologie) herausgebildet. Dabei sprechen wir nur von der formalen Hochsprache, dem Modernen Hocharabischen, das überwiegend im schriftlichen Bereich und bei formellen Anlässen verwendet wird.

Zusätzlich kompliziert wird es durch die bekannte arabische Diglossie-Situation: Im mündlichen Sprachgebrauch und teilweise auch im informellen schriftlichen Bereich werden von der Hochsprache stark abweichende Dialekte verwendet, die sich von Land zu Land und innerhalb größerer Länder auch von Stadt zu Stadt deutlich unterscheiden und für die es keinerlei normative Regelwerke gibt, was zu schnellem Sprachwandel führt. Beispielsweise wird in sozialen Medien und Messengerdiensten in unterschiedlichsten arabischen Dialekten geschrieben, ohne dass orthografische Sprachregeln für ein Mindestmaß an Einheitlichkeit sorgen würden.

Bei geschriebenen arabischen Dialekten zeigen KI-System unter Laborbedingungen (einheitliche Schreibweise, festgelegter Dialekt, bekannter Kontext) zwar akzeptable Ergebnisse, in der Realität des digitalen arabischen Sprachraums (Kommunikation unterschiedlicher Dialektmuttersprachler, uneinheitliche Schreibweisen, Weglassen von Diakritika etc.), sind KI-Übersetzer aber höchst fehleranfällig. Das wirkt sich auch auf die Qualität der Trainingsdaten aus.

Verfügbarkeit und Qualität des Trainingsmaterials

Die KI-basierte maschinelle Übersetzung ist immer dann besonders gut, wenn Trainingsmaterial in ausreichender Menge und Qualität zur Verfügung stand. Auch hier gibt es besondere Umstände im arabischen Sprachraum: Zum einen ist die Digitalisierung in vielen arabischen Ländern noch nicht so weit fortgeschritten wie etwa im europäischen Sprachraum, insbesondere in jenen Regionen, die unter bewaffneten Konflikten und Bürgerkriegen leiden oder in denen große Bevölkerungsanteile in Armut leben und daher mit ihrem Sprachgebrauch nur wenig digital in Erscheinung treten. Hier stehen viele arabische Texte gar nicht digital und damit als Trainingsmaterial für KI-Modelle zur Verfügung.

Andere arabische Staaten, z. B. in der Golfregion, weisen zwar einen hohen Digitalisierungsgrad auf, allerdings ist hier die Rolle des Arabischen deutlich eingeschränkt, da – mit Ausnahme von Saudi-Arabien – die Bevölkerung mehrheitlich aus nicht-arabischsprachigen Migranten besteht und gleichzeitig Englisch die vorherrschende Verkehrs-, Handels- und Bildungssprache ist. So gibt es in manchen Themengebieten ganz allgemein überhaupt nicht genügend arabische Texte. Beispiel Medizin: Während medizinische Informationen für Laien in großer Menge auf Arabisch im Internet verfügbar sind, gibt es nur relativ wenige medizinische Fachartikel, da an den medizinischen Fakultäten in der arabischen Welt häufig auf Englisch oder Französisch gelehrt und geforscht wird.

Exemplarisch zeigt sich die Problematik der mangelnden Verfügbarkeit von gutem Trainingsmaterial für KI-Übersetzer an der Entwicklung des ersten arabischen großen Sprachmodell „Jais“ in den Vereinigten Arabischen Emiraten. Da nicht genügend arabisches Textmaterial zur Verfügung stand, wurde stattdessen auf englische „Token“ zurückgegriffen und dieses technisch in das arabische Trainingsmaterial integriert. Dadurch wird der jedoch ohnehin durch die morphologische Komplexität der Sprache anspruchsvollere neuronale Übersetzungsvorgang zusätzlich verkompliziert. Ein Beispiel: Man kann einen ganzen deutschen Satz in einem einzigen arabischen Wort ausdrücken: وسنكتبه lässt sich mit „und wir werden es schreiben“ übersetzen. Das flektierte Verb wird mit zwei Präfixen und einem Suffix versehen. Mit dem ersten Präfix wird die Konjunktion „und“ markiert und mit dem zweiten das Futur ausgedrückt. Das Suffix schließlich markiert das Objekt „es“. Gleichzeitig wird im Arabischen das Personalpronomen „wir“ weggelassen und muss bei einer Übersetzung aus der entsprechend flektierten Verbform entnommen werden. Für den maschinellen Trainings- und Übersetzungsprozess bedeutet das, dass die arabischen Wörter im Wortschatz nicht eins zu eins repräsentiert werden können. Das Übersetzungsprogramm muss zu jedem Wort und seiner kontextualen Einbettung zusätzlich alle möglichen Suffixe, Präfixe und Infixe mitberücksichtigen, was den Trainingsvorgang verlängert und die nötige Rechenleistung erhöht. Einzelwörter müssen in morphologische Elemente aufsplittet werden (Detokenisierung). Geschieht dies alles noch dazu über den Umweg über Englisch als Relaissprache, steigt das Fehlerrisiko weiter. Zudem sind bei arabischem Trainingsmaterial weitere, dem eigentlichen Übersetzungsvorgang vorgelagerte technische Schritte nötig, zum Beispiel die Normalisierung der unterschiedlichen Buchstabenschreibweisen je nach Position im jeweiligen Wort.

Erschwerend kommt schließlich noch hinzu, dass große Teile der auf Arabisch verfügbaren digitalen Inhalte gar nicht auf Hocharabisch vorliegen, da – wie schon erwähnt – in den sozialen Medien in einer Vielzahl unterschiedlicher arabischer Dialekte kommuniziert wird, für die es keine einheitlich geregelte Schreibweise gibt. Dabei entstehen zahlreiche Zwischenformen: Gebildete Schreiber rücken ihren Sprachstil durch den Schreibvorgang etwas näher an das Hocharabische heran. Andere wiederum schreiben den Dialekt so, wie sie ihn aussprechen. Oft vermischen sich auch unterschiedliche regionale Dialekte, denn im Netz kommen häufig Nutzer aus unterschiedlichen arabischen Ländern und Regionen zusammen. Teilweise wird auch gar nicht mit arabischen Buchstaben, sondern mit dem sogenannten „Arabizi“-Alphabet geschrieben – einer Kombination lateinischer Buchstaben und Ziffern, die für spezifisch arabische Laute umfunktioniert wurden. Das Problem ist, dass hier ebenfalls keine einheitlich festgelegten Transkriptionsregeln existieren. Auch all dies kann die Qualität des KI-Outputs bei Übersetzungen in die und aus der arabischen Sprache deutlich mindern.

Fazit

Die beschriebene Situation bedeutet selbstredend nicht, dass maschinelle Übersetzungen aus dem Arabischen und ins Arabische unmöglich sind, und natürlich hat auch jede andere Sprache ihre Eigenheiten. Die genannten Ursachen können jedoch erklären, warum die Ergebnisse von KI-Übersetzern bei Arabisch deutlich fehleranfälliger sind als bei anderen Sprachen. Neuronale Maschinenübersetzung wird ein zunehmend wichtigeres Werkzeug, auch für Übersetzungen Arabisch<>Deutsch werden. In bestimmten Fällen kann eine maschinelle Vorübersetzung sinnvoll sein und die Arbeit professioneller Übersetzerinnen und Übersetzer erleichtern. Es ist aber zu erwarten, dass diese Entwicklung bei Arabisch eher inkrementell verläuft als in großen Schritten. Womöglich wird die Übersetzungsqualität nie das Niveau anderer Sprachkombinationen erreichen. Denn die sprachstrukturellen Besonderheiten und Eigenheiten des arabischen Sprachraums bleiben bestehen.

Dr. Daniel Falk studierte Arabistik, Politikwissenschaft und Konferenzdolmetschen mit anschließender Promotion am Orientalischen Institut der Universität Leipzig. Seit 2014 arbeitet er als Übersetzer und Dolmetscher für Arabisch und beleuchtet als Fachautor in seinem Blog sowie u.a. für die Fachzeitschrift MDÜ translationsspezifische Fragestellungen zur arabischen Sprache. Im vorliegenden Beitrag hat er seine Erkenntnisse zum Stand maschineller und KI-Übersetzung aus früheren Artikeln fortgeschrieben.

Eisberg voraus:

Warum sich KI-Übersetzung nach wie vor mit Arabisch so schwer tut

Schrift, Syntax, uneinheitliche Interpunktion: sprachkulturelle Besonderheiten

Heterogenität des Sprachraums: Arabisch ist nicht gleich Arabisch

Verfügbarkeit und Qualität des Trainingsmaterials

Fazit

Leistungen

Dolmetscher Übersetzer

Seminar-
Angebot

Top-News

Auftraggeber

Sprachmittler

Presse/Medien

Der Beruf

Service

Schrift, Syntax, uneinheitliche Interpunktion: sprachkulturelle Besonderheiten

Heterogenität des Sprachraums: Arabisch ist nicht gleich Arabisch

Verfügbarkeit und Qualität des Trainingsmaterials

Fazit

Leistungen

Dolmetscher Übersetzer

Seminar-Angebot

Top-News

Auftraggeber

Sprachmittler

Presse/Medien

Der Beruf

Service

Seminar-
Angebot