Maschinelle Übersetzung
Maschinelle Übersetzung (MÜ oder MT für engl. machine translation), auch automatische Übersetzung, bezeichnet die Übersetzung von Texten zwischen zwei Sprachen mithilfe eines Computerprogrammes. MÜ ist ein Teilbereich der künstlichen Intelligenz.
Während die menschliche Übersetzung Gegenstand der angewandten Sprachwissenschaft ist, wird MÜ vor allem in der Informatik und Computerlinguistik erforscht. Schon für die ersten Computer Ende der 40er Jahre wurden MÜ-Anwendungen geschrieben. MÜ gilt als die Königsdisziplin der Computerlinguistik.
Menschheitstraum
Das Verstehen einer Sprache, ohne sie gelernt zu haben, ist ein alter Menschheitstraum (Turmbau zu Babel, J. Bechers numerische Interlingua, Babelfisch, Pfingstwunder, Science Fiction-Geschichten). Die Erfindung der Computer in Kombination mit der Beschäftigung mit dem Phänomen Sprache als wissenschaftlicher Disziplin (Sprachwissenschaft) haben zum ersten Mal einen konkreten Weg zur Erfüllung dieses Traums geöffnet.
Geschichte
Bis zum heutigen Tag hat das militärische Interesse den Weg der MÜ entscheidend geprägt. Eines der frühesten Projekte war ein Russisch-Englisch-Übersetzungsprogramm für das US-Militär. Trotz seiner anekdotenhaft schlechten Qualität (Englisch: "der Geist ist willig, aber das Fleisch ist schwach" wurde angeblich zu Russisch: "der Wodka ist gut, aber das Steak ist schlecht") genoss das Programm hohe Popularität unter US-Militärs, die sich zum ersten Mal ohne den Umweg über Dritte (Dolmetscher und Übersetzer) selbst zumindest eine Idee vom Inhalt russischer Dokumente verschaffen konnten.
Der 1966 für das Pentagon erstellte "ALPAC"-Bericht bescheinigte der MÜ grundsätzliche Unrealisierbarkeit und brachte mit einem Schlag die Forschung für fast 20 Jahre praktisch ganz zum Erliegen. Erst in den 80er Jahren begannen Elektrokonzerne wie die Siemens AG ("Metal"-Projekt) erneut mit der Forschung. In der gleichen Zeit initiierte die japanische Regierung das Fünfte-Generation-Projekt, bei dem MÜ von Englisch in Japanisch zunächst auf der Basis der Programmiersprache Prolog implementiert wurde. Die enge Zusammenarbeit zwischen Universitäten, Elektrokonzernen und Regierung führte zu den weltweit ersten kommerziellen MÜ-Programmen für PCs und hat Japan in die Führungsposition der MÜ-Forschung weltweit gebracht.
Der Crash der dotcom-Firmen 2000-2001 hat auch viele kleinere MÜ-Firmen in den Ruin getrieben. Heutzutage sind in der MÜ-Software-Industrie weltweit schätzungsweise nur 10-20 Firmen aktiv (viele Programme sind lizenziert, so dass der falsche Eindruck einer größeren Vielfalt entsteht), so dass sich die Entwicklung großenteils an den Universitäten abspielt.
Derzeit wird weltweit nur etwa 1 % des gesamten Umsatzes auf dem Übersetzungs-Markt mit MÜ-Anwendungen erzielt.
Gründe für den ansteigenden Bedarf:
- Viele Texte sind heute digital verfügbar (also leicht für den Computer zu verarbeiten).
- Die Globalisierung erfordert die Übertragung von immer mehr Texten in immer mehr Sprachen (der Markt für Übersetzung verdoppelt sich alle vier Jahre), während die Popularität des Berufs des Übersetzers/Dolmetschers stagniert.
- Gerade von nur wenigen Westeuropäern/Amerikanern gesprochene beziehungsweise für diese schwierig zu erlernende Sprachen aus Regionen, deren Bewohner ihrerseits kaum westliche Sprachen sprechen, werden immer wichtiger:
- kommerziell wichtig: die ostasiatischen Sprachen Chinesisch, Koreanisch und Japanisch; sowie Thai.
- militärisch wichtig: Sprachen der internationalen Konfliktregionen, vor allem mit Beteiligung des US-Militärs. 2003 haben gleich mehrere US-Software-Firmen Übersetzungsprogramme für Arabisch und sogar Paschtu (Sprache in Afghanistan) herausgebracht. Ebenfalls 2003 hat die DARPA einen Blind-Wettbewerb für eine unbekannte Ausgangssprache durchgeführt.
Übersetzungs-Methoden
Alle MÜ-Systeme benutzen (in Datei-Form vorliegende) zweisprachige Wörterbücher und haben Module zumindest für grundsätzliche Grammatikregeln. Die einzelnen Methoden unterscheiden sich dennoch erheblich.
Die wichtigsten Methoden/Herangehensweisen der MÜ sind:
- direkte MÜ. Die Wörter des Quelltextes werden mit dem Wörterbuch Wort für Wort und in der gleichen Reihenfolge in die Zielsprache übertragen. Anschließend werden Satzstellung und Flexion nach den Regeln der Zielsprache angepasst. Dies ist die älteste und einfachste MÜ-Methode, die beispielsweise auch obigem Russisch-Englisch-System zugrundelag.
- Transfer. Die Transfer-Methode ist die klassische MÜ-Methode mit drei Schritten: Analyse, Transfer, Generation. Der zweite Schritt hat der ganzen Methode den Namen gegeben. Zunächst wird die grammatische Struktur des Quelltextes analysiert, oft in einer Baumstruktur. Dann werden in zwei getrennten Prozessen Wörter einerseits und grammatische Regeln andererseits in die Zielsprache übertragen (=transferiert). Schließlich werden in der Zielsprache die Wörter in die Regeln eingesetzt und so der Zieltext erzeugt (=generiert).
- Interlingua. Die grammatische Information des Quelltextes wird zunächst in einer neutralen "Zwischensprache" (=Interlingua) ausgedrückt. Die grammatische Information in der Zielsprache wird aus dieser Zwischensprache erzeugt. Die Interlingua-Methode ist hilfreich bei komplexen Ausdrücken. So kann man deutsch "Wenn ich arbeiten würde, würde ich mir ein Auto kaufen." nicht mit einer Transfer-Regel würde-->would übersetzen. "*If I would work, I would buy a car.", weil auf Englisch if-Sätze would nicht erlauben. In der Interlingua würde die würde-Information abstrakt als "Irreales Konditional" weitergegeben und im Englischen je nach dem Satzkontext mit oder ohne would realisiert.
- EBMT (steht für Example-Based Machine Translation, beispielbasierte MÜ). Das Kernstück eines EBMT-System ist ein Translation Memory, in dem häufig wiederkehrende Sätze oder Redewendungen mit ihren jeweiligen Übersetzungen gespeichert werden. Statistisch wird (mit Information-Retrieval-Methoden) berechnet, wie ähnlich alle Einträge des Translation Memory jeweils einem Satz des Quelltextes sind. Aus der Kombination der Übersetzung der ähnlichsten Sätze wird die Übersetzung generiert.
- SBMT (steht für Statistics-Based Machine Translation, statistische MÜ). Vor der eigentlichen Übersetzung analysiert ein Programm ein möglichst großes und breitgefächertes Corpus von zweisprachigen Texten (oft zum Beispiel die Bibel). Dabei werden Wörter und grammatische Formen aufgrund ihrer Häufigkeit und Nähe im Text einander zugeordnet und somit ein Wörterbuch sowie Grammatikübertragungsregeln extrahiert. Auf dieser Basis werden nun Texte übersetzt. Die SBMT ist in letzter Zeit sehr populär, weil sie keinerlei Kenntnis der beteiligten Sprachen voraussetzt. Aus dem gleichen Grund ist die Übersetzungsqualität auch meist sehr schlecht. Das Computerprogramm erledigt die Extraktion von Wörtern und Regeln automatisch, vorausgesetzt man füttert ihn mit einem großen Corpus. SBMT wird beispielsweise vom Pentagon für die Sprachen favorisiert, für die man schnell ein MÜ-System braucht, ohne Zeit für das Zusammentragen von Regeln durch Menschen zu haben.
- HAMT (steht für Human-Aided Machine Translation, MÜ mit menschlicher Hilfe). Anstatt die Übersetzung 100 % dem Computer zu überlassen, wird der menschliche Benutzer gebeten, mehrdeutige oder schwierig zu übersetzende Konstruktionen selbst zu übersetzen oder zu vermeiden (so genannte "Kontrollierte Sprache"). Dies kann im voraus geschehen, indem der Benutzer beispielsweise lange Sätze in kurze Sätze unterteilt, oder in Interaktion, zum Beispiel indem das Programm den Benutzer bittet, die gewünschte Bedeutung eines Wortes auszuwählen.
Die meisten Systeme in der Praxis sind eine Mischung aus mehreren Methoden (oft Dominanz des Transfersystems mit Interlingua und EBMT-Elementen).
Warum ist die Qualität oft so miserabel?
Ergebnisse von MÜ-Programmen sind in vielen Fällen falsch und darüber hinaus oft unbeabsichtigt erheiternd. Um diesen Effekt zu sehen, genügt es praktisch, irgendeinen willkürlich ausgewählten Text einer Fremdsprache von einer kostenlosen Übersetzungsmaschine wie bei Google in die eigene Muttersprache übersetzen zu lassen.
Wie bewertet man MÜ-Qualität? (Evaluation)
Anstatt des intuitiven und wenig aussagekräftigen Eindrucks "diese Übersetzung ist miserabel" benutzt die MÜ-Forschung die Evaluation, die skalierte Bewertung der Übersetzungsqualität. MÜ-Übersetzungen werden zunächst pro Satz bewertet; die normalisierte Summe der Sätze ist die Qualität des ganzen Textes. In den meisten Fällen wird die Bewertung per Hand von einem Muttersprachler der Zielsprache durchgeführt und in einer Kennziffer ausgedrückt. In Japan wird oft eine fünfstellige Skala mit 0-4 Punkten verwendet:
- 4 Punkte: Sehr gut verständlich bis perfekt; kein offensichtlicher Fehler. +
- 3 Punkte: Ein bis zwei falsche Wörter; sonst gut verständlich.
- 2 Punkte: Mit gutem Willen kann man sich ungefähr denken, was ursprünglich gemeint war.
- 1 Punkt: Der Satz wird in einem anderen als dem gemeinten Sinn verstanden (wenn überhaupt). Das liegt oft an teilweise oder ganz falscher Grammatik-Übersetzung (Struktur). +
- 0 Punkte: Der Satz ergibt keinen Sinn; sieht aus wie eine zufällig zusammengewürfelte, chaotische Anordnung von Wörtern.
Für große Übersetzungen benutzen MÜ-Forscher neuerdings auch automatische Evaluations-Algorithmen wie den Bleu-Score, die allerdings der menschlichen Urteilskraft unterlegen sind.
Zu hohe Erwartungen?
Die Volksmeinung hat gegenüber MÜ eine ähnliche Position wie gegenüber einem anderem Menschheitstraum, die Heilung von Krebs. Der Wissenschaft wird grundsätzlich zugetraut, den Traum in absehbarer Zeit vollständig zu verwirklichen ("das muss doch möglich sein"); dagegen erscheint der tatsächliche Fortschritt in der Forschung ernüchternd und unbefriedigend.
Dabei ist eine der Bedingungen für eine funktionierende MÜ, dass die menschliche Fähigkeit "Sprache" umfassend und detailliert verstanden und beschrieben wird (-> wie soll sie der Computer verstehen, wenn sie nicht einmal der Mensch selbst versteht?). Das aber kann noch lange dauern. Die meisten Sprachwissenschaftler gehen davon aus, dass das vollständige Begreifen von "Sprache" ein vollständiges Begreifen der menschlichen Intelligenz insgesamt impliziert. Perfekte MÜ müsste also den menschlichen Geist selbst simulieren.
Rückschläge in der Praxis
Dass MÜ-Qualität oft unbefriedigend ist, hat auch noch handfestere, teilweise behebbare Ursachen:
- "Billigprogramme". Viele bewerten den Stand der MÜ aufgrund kostenloser MÜ-Tools, die zum Beispiel im Internet auf Yahoo oder Google verfügbar sind. Oft handelt es sich hier um abgespeckte oder ältere Versionen von sonst kostenpflichtigen (und besseren) Programmen, oder um eigens schnell (und schlecht) erstellten Programmen.
- Benutzer kennt Ausgangssprache. Gerade bei Übersetzungen zwischen westlichen Sprachen versteht der Benutzer oft die Quellsprache bis zu einem gewissen Grad selbst und ist so empfindlicher gegenüber Abweichungen als jemand, der ausschließlich auf die Übersetzung angewiesen wäre.
- Sprachstil. Jeder Sprachstil hat Besonderheiten, die teilweise noch nicht einmal in der Linguistik beschrieben wurden. MÜ-Systeme gehen meist von der geschriebenen Zeitungssprache aus. Besonders schlechte Ergebnisse liefert MÜ von literarischer Sprache (beispielsweise viele Metaphern), von gesprochene Sprache (Verbmobil ist daran gescheitert) oder auch von technischen Texten (die berüchtigten japanischen Gebrauchsanleitungen).
- Mangelnde Interdisziplinarität. MÜ gehört eigentlich zur Computerlinguistik, aber die meisten Forscher kommen aus den zwei Mutterbereichen dieser Fachrichtung, entweder aus der Informatik oder aus der Sprachwissenschaft, ohne sich genügend Fachkenntnisse in der jeweils anderen Disziplin anzueignen. Während Linguisten oft die Programmierpraxis fehlt, fehlt Informatikern oft die Bereitschaft zur Beschäftigung mit dem Phänomen "Sprache". Aus diesem Grund liegt den meisten MÜ-Anwendungen ein strukturalistisches Sprachmodell zugrunde, das die Erkenntnisse in der Linguistik in den letzten 50 Jahren eher unberücksichtigt lässt.
- Kein Austausch zwischen Industrie und Akademik. Kommerzielle MÜ-Firmen beschäftigen oft lieber reine Programmierer, die sich das Fachwissen "vor Ort" aneignen sollen, als MÜ-Forscher von den Universitäten, die teilweise das Image haben, sich auf unwichtige Details zu versteifen.
- Zu kleines und/oder fehlerhaftes Wörterbuch. Mit den Veränderungen in Gesellschaft und Wissenschaft nimmt ein Wortschatz jeden Tag rasant zu; außerdem haben viele Wörter mehrere Bedeutungen (Homonyme), die durch Kontext-Analyse disambiguiert werden könnten. Wörterbuch-Mängel wie im Anfangsbeispiel Russisch-Englisch sind zu einem überraschend großen Teil für die schlechte Übersetzungsqualität verantwortlich. Die größten MÜ-Programme haben Wörterbücher mit mehreren Millionen Einträgen und einem vielfachen an Bedeutungsunterscheidungen. Die detaillierte und vor allem fehlerfreie Erstellung solcher großen Wörterbücher für MÜ-Anwendungen durch Lexikographen stellt für kleinere Firmen einfach einen zu kostspieligen Aufwand dar.
- Mangelnde Transfer-Regeln. Viele grammatische Phänomene sind anders oder existieren nicht einmal in anderen Sprachen (siehe unten). Die Lösung dieser Probleme erfordert oft eine Art Grundlagenforschung; diesen Aufwand suchen MÜ-Firmen natürlich zu vermeiden.
Grammatische Problemgebiete (Diversionen)
In keinem MÜ-System wird jede grammatische Regel angewendet beziehungsweise analysiert. Vielmehr wird oft auf free rides vertraut. Free rides (kostenlose Mitnahme) bedeutet, dass ein Phänomen ohne spezifische Analyse zufällig in der anderen Sprache ähnlich realisiert wird (und damit nur die Wörter übersetzt werden müssen), so beim Artikel: der, die, das wird sowieso fast immer zu the im Englischen, fast nie zu a, also scheint eine Extra-Analyse als "bestimmter Artikel" überflüssig. Dass aber auch zwischen Deutsch und Englisch free rides scheitern können, zeigt der obige if-Satz mit "würde". Zwischen entfernteren Sprachen, zum Beispiel Chinesisch-Deutsch sind free rides oft nicht mal auf der Wortebene eine sichere Bank.
Viele komplexe Grammatik-Phänomene sind von der MÜ noch gar nicht oder nur in Ansätzen erforscht und realisiert. Für sie sind free rides die einzige, oft fatale, Lösung. Solche Phänomene sind (Auswahl):
- Artikel. Die germanischen und romanischen Sprachen haben Artikel, viele andere Sprachen dagegen nicht. Bei Übersetzung aus einer anderen Sprache muss der jeweils richtige Artikel quasi "aus dem Nichts" generiert werden -- aber eben nicht in allen Fällen.
- Zusammengesetzte Nomina. In Sprachen wie Deutsch oder Japanisch kann die genaue Beziehung zwischen Nomina untereinander "kaschiert" werden, indem man sie einfach nebeneinander stellt. In anderen Sprachen muss die Beziehung explizit gemacht werden. Beispiel: Donaudampfschifffahrtsgesellschaftskapitän = "Ein Kapitän, der bei einer Gesellschaft arbeitet, deren Geschäft Schifffahrt auf der Donau ist"
- Relativpronomen. Die meisten Sprachen haben gar kein oder nur ein einziges Relativpronomen. Bei Übersetzung in Deutsch (der, die, das) oder Englisch muss aber ausdifferenziert werden.
Probleme in Bezug auf Weltwissen
Wer einen Text übersetzen will, der muss eine Menge Wissen über die Welt an den Text herantragen. Beispielsweise sollte jemand der einen Text übersetzen will, in dem es um Fahrkartenautomaten geht, darüber informiert sein, wie der Bus- und der Schienenverkehr organisiert sind. Bei der Übersetzung von Sätzen nun tauchen immer viele Übersetzungsmöglichkeiten auf. Ein menschlicher Übersetzer wird aufgrund seines Weltwissens viele der theoretisch möglichen Übersetzungen ausschließen können. Er wird sich sagen: "Diese Übersetzung kann nicht richtig sein, weil ja bekannt ist, dass der Busfahrer keinen Fahrschein lösen muss." Das Computersystem wird jedoch über dieses Wissen nicht verfügen. Alle Versuche, Weltwissen so aufzubereiten, dass es von Computern genutzt werden kann, haben zu Regelwerken geführt, die sehr schnell unüberschaubar umfangreich geworden sind.
Weiterhin: Man kann den fünften Satz eines Textes oft nur verstehen, wenn man die vorhergehenden Sätze gelesen und verstanden hat. Es ist immer möglich, dass die ersten Sätze Hinweise geliefert haben, ohne die die Informationen der nachfolgenden Sätze nicht richtig eingeordnet werden können. Ein System für die automatische Übersetzung von Texten müsste daher imstande sein, den Informationsgehalt von eingelesenen Sätzen herauszufiltern und intern abzulegen. Auch in diesem Fall gilt jedoch: Versuche, die Informationen aus eingelesenen Texten in einem Computersystem abzulegen, führen zu unüberschaubar großen und komplexen Modellen.
Selbst wenn es möglich wäre, Weltwissen in computerverwertbarer Form in Modellen abzulegen und wenn es möglich wäre, Computerprogramme zu schreiben, die aus Texten die wichtigsten Informationen herausziehen und abspeichern - es wäre immer noch vollkommen ungeklärt, wie man ein Computersystem so programmiert, dass es beim Übersetzungsprozess "die richtigen Fragen stellt", den eigenen Datenbestand auf sinnvolle Weise durchsucht und zu übersetzungsrelevanten Fakten findet.
Weblinks
- Babelfish Altavista (Volltextübersetzungstool)
- Linguatec Personal Translator (Volltextübersetzungstool)
- Webtranslate (Übersetzungsportal von digital publishing und Lingenio)