Zum Inhalt springen

Maschinelle Übersetzung

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 1. Juni 2004 um 14:00 Uhr durch 62.167.190.184 (Diskussion) (Zwobot - Kat - Bot-unterstützte Begriffsklärung: Germanisch). Sie kann sich erheblich von der aktuellen Version unterscheiden.


Maschinelle Übersetzung (MÜ oder MT für engl. machine translation), auch Automatische Übersetzung, bezeichnet die Übersetzung von Texten zwischen zwei Sprachen mithilfe eines Computerprogrammes. MÜ ist ein Teilbereich der Künstlichen Intelligenz.

Während die menschliche Übersetzung Gegenstand der Sprachwissenschaft ist, wird MÜ vor allem in der Informatik erforscht. Schon für die ersten Computer Ende der 40er Jahre wurden MÜ-Anwendungen geschrieben.

Menschheitstraum

Das Verstehen einer Sprache, ohne sie gelernt zu haben, ist ein alter Menschheitstraum (Turmbau zu Babel, Babelfisch, Pfingstwunder, Science Fiction-Geschichten). Die Erfindung der Computer in Kombination mit der Beschäftigung mit dem Phänomen Sprache als wissenschaftliche Disziplin (Sprachwissenschaft) haben zum ersten Mal einen konkreten Weg zur Erfüllung dieses Traums geöffnet.


Geschichte

Bis zum heutigen Tag hat das militärische Interesse den Weg der MÜ entscheidend geprägt. Eines der frühesten Projekte war ein Russisch-Englisch-Übersetzungsprogramm für das US-Militär. Trotz seiner anekdotenhaft schlechten Qualität (Englisch: "der Geist ist willig, aber das Fleisch ist schwach" wurde angeblich zu Russisch: "der Wodka ist gut, aber das Steak ist schlecht") genoss das Programm hohe Popularität unter US-Militärs, die sich zum ersten Mal ohne den Umweg über Dritte (Dolmetscher und Übersetzer) selbst zumindest eine Idee vom Inhalt russischer Dokumente verschaffen konnten.

Der 1966 für das Pentagon erstellte "ALPAC"-Bericht bescheinigte der MÜ grundsätzliche Unrealisierbarkeit und brachte mit einem Schlag die Forschung für fast 20 Jahre praktisch ganz zum Erliegen. Erst in den 80er Jahren begannen Elektrokonzerne wie die Siemens AG ("Metal"-Projekt) erneut mit der Forschung. In der gleichen Zeit initiierte die japanische Regierung das Fünfte-Generation-Projekt, bei dem MÜ von Englisch in Japanisch zunächst auf der Basis der Programmiersprache Prolog implementiert wurde. Die enge Zusammenarbeit zwischen Universitäten, Elektrokonzernen und Regierung führte zu den weltweit ersten kommerziellen MÜ-Programmen für PCs und hat Japan in die Führungsposition der MÜ-Forschung weltweit gebracht.

Der Crash der dotcom-Firmen 2000-2001 hat auch viele kleinere MÜ-Firmen in den Ruin getrieben. Heutzutage sind in der MÜ-Software-Industrie weltweit schätzungsweise nur 10-20 Firmen aktiv (viele Programme sind lizenziert, so dass der falsche Eindruck einer grösseren Vielfalt entsteht), so dass sich die Entwicklung grossenteils an den Universitäten abspielt.

Derzeit wird weltweit nur ca. 1% des gesamten Umsatzes auf dem Übersetzungs-Markt mit MÜ-Anwendungen erzielt. In den 00er Jahren hat der Bedarf an einsetzbaren MÜ-Anwendungen stark zu genommen.

Gründe für den ansteigenden Bedarf:

  • Praktisch alle Texte sind heute digital verfügbar (also leicht für den Computer zu verarbeiten).
  • Die Globalisierung erfordert die Übertragung von immer mehr Texten in immer mehr Sprachen (der Markt für Übersetzung verdoppelt sich alle vier Jahre), während die Popularität des Berufs des Übersetzers/Dolmetschers stagniert.
  • Gerade von nur wenig Westeuropäern/Amerikanern gesprochene bzw. für diese schwierig zu erlernende Sprachen aus Regionen, der Bewohner ihrerseits kaum westliche Sprachen sprechen, werden immer wichtiger:
    • kommerziell wichtig: die ostasiatischen Sprachen Chinesisch, Koreanisch und Japanisch; sowie Thai.
    • militärisch wichtig: Sprachen der internationalen Konfliktregionen, vor allem mit Beteiligung des US-Militärs. 2003 haben gleich mehrere US-Software-Firmen Übersetzungsprogramme für Arabisch und sogar Paschtu (Sprache in Afghanistan) herausgebracht. Ebenfalls 2003 hat die DARPA einen Blind-Wettbewerb für eine unbekannte Ausgangssprache durchgeführt.

Wie funktioniert MÜ? (Methoden)

Alle MÜ-Systeme benutzen (in Datei-Form) zweisprachige Wörterbücher und haben Module zumindest für grundsätzliche Grammatikregeln. Die einzelnen Methoden unterscheiden sich dennoch erheblich.

Die wichtigsten Methoden/Herangehensweisen der MÜ sind:

  • direkte MÜ. Die Wörter des Quelltextes werden mit dem Wörterbuch Wort für Wort und in der gleichen Reihenfolge in die Zielsprache übertragen. Anschliessend werden Satzstellung und Flexion nach den Regeln der Zielsprache angepasst. Dies ist die älteste und einfachste MÜ-Methode, die z.B. auch obigem Russisch-Englisch-System zugrundelag.
  • Transfer. Die Transfer-Methode ist die klassische MÜ-Methode mit drei Schritten: Analyse, Transfer, Generation. Der zweite Schritt hat der ganzen Methode den Namen gegeben. Zunächst wird die grammatische Struktur des Quelltextes analysiert, oft in einer Baumstruktur. Dann werden in zwei getrennten Prozessen Wörter einerseits und grammatische Regeln andererseits in die Zielsprache übertragen (=transferiert). Schliesslich werden in der Zielsprache die Wörter in die Regeln eingesetzt und so der Zieltext erzeugt (=generiert).
  • Interlingua. Die grammatische Information des Quelltextes wird zunächst in einer neutralen "Zwischensprache" (=Interlingua) ausgedrückt. Die grammatische Information in der Zielsprache wird aus dieser Zwischensprache erzeugt. Die Interlingua-Methode ist hilfreich bei komplexen Ausdrücken. So kann man dt. "Wenn ich arbeiten würde, würde ich mir ein Auto kaufen." nicht mit einer Transfer-Regel würde-->would übersetzen. "*If I would work, I would buy a car.", weil in engl. if-Sätze would nicht erlauben. In der Interlingua würde die würde-Information abstrakt als "Irreales Konditional" weitergegeben und im Englischen je nach dem Satzkontext mit oder ohne would realisiert.
  • EBMT (steht für Example-Based Machine Translation, Beispielbasierte MÜ). Das Kernstück eines EBMT-System ist ein Translation Memory, in dem häufig wiederkehrende Sätze oder Redewendungen mit ihren jeweiligen Übersetzungen gespeichert werden. Statistisch wird (mit Information Retrieval-Methoden) berechnet, wie ähnlich alle Einträge des Translation Memory jeweils einem Satz des Quelltextes sind. Aus der Kombination der Übersetzung der ähnlichsten Sätze wird die Übersetzung generiert.
  • SBMT (steht für Statistics-Based Machine Translation, Statistische MÜ). Vor der eigentlichen Übersetzung analysiert ein Programm einen möglichst grossen und breitgefächerten Corpus von zweisprachigen Texten (oft z.B. die Bibel). Dabei werden Wörter und grammatische Formen aufgrund ihrer Häufigkeit und Nähe im Text einander zugeordnet und somit ein Wörterbuch sowie Grammatikübertragungsregeln extrahiert. Auf dieser Basis werden nun Texte übersetzt. Die SBMT ist in letzter Zeit sehr populär, weil sie keinerlei Kenntnis der beteiligten Sprachen voraussetzt. Aus dem gleichen Grund ist die Übersetzungsqualität auch meist sehr schlecht. Das Computerprogramm erledigt die Extraktion von Wörtern und Regeln automatisch, vorausgesetzt man füttert ihm einen grossen Corpus. SBMT wird vom z.B. Pentagon für die Sprachen favorisiert, für die man schnell ein MÜ-System braucht, ohne Zeit für das Zusammentragen von Regeln durch Menschen zu haben.
  • HAMT (steht für Human-Aided Machine Translation, MÜ mit menschlicher Hilfe). Anstatt die Übersetzung 100% dem Computer zu überlassen, wird der menschliche Benutzer gebeten, mehrdeutige oder schwierig zu übersetzende Konstruktionen selbst zu übersetzen oder zu vermeiden. Dies kann im voraus geschehen, indem der Benutzer z.B. lange Sätze in kurze Sätze unterteilt, oder in Interaktion, z.B. indem das Programm den Computer bittet, die gewünschte Bedeutung eines Wortes auszuwählen.

Die meisten Systeme in der Praxis sind eine Mischung aus mehreren Methoden (oft Dominanz des Transfersystems mit Interlingua und EBMT-Elementen).

Warum ist die Qualität oft so miserabel?

Ergebnisse von MÜ-Programmen sind in vielen Fällen falsch und darüber hinaus oft unbeabsichtigt erheiternd. Um diesen Effekt zu sehen, genügt es praktisch, irgendeinen willkürlich ausgewählten Text einer Fremdsprache von einer kostenlosen Übersetzungsmaschine wie auf Google in die eigene Muttersprache übersetzen zu lassen.

Wie bewertet man MÜ-Qualität? (Evaluation)

Die Evaluation, die Bewertung der Übersetzungsqualität, ist zentral für die MÜ-Forschung. MÜ-Übersetzungen werden zunächst pro Satz bewertet; die normalisierte Summe der Sätze ist die Qualität des ganzen Textes. In den meisten Fällen wird die Bewertung per Hand von einem Muttersprachler der Zielsprache durchgeführt und in einer Kennziffer ausgedrückt. In Japan wird oft eine fünfstellige Skala mit 0-4 Punkten verwendet:

  • 4 Punkte: Sehr gut verständlich bis perfekt; kein offensichtlicher Fehler.
  • 3 Punkte: Ein bis zwei falsche Wörter; sonst gut verständlich.
  • 2 Punkte: Mit gutem Willen kann man sich ungefähr denken, was ursprünglich gemeint war.
  • 1 Punkt: Der Satz wird in einem anderen als dem gemeinten Sinn verstanden (wenn überhaupt). Das liegt oft an teilweise oder ganz falscher Grammatik-Übersetzung (Struktur).
  • 0 Punkte: Der Satz macht keinen Sinn; sieht aus wie eine zufällig zusammengewürfelte, chaotische Anordnung von Wörtern.

Für grosse Übersetzungen benutzen MÜ-Forscher neuerdings auch automatische Evaluations-Algorithmen wie den Bleu-Score, die allerdings der menschlichen Urteilskraft unterlegen sind.

Zu hohe Erwartungen?

Die Volksmeinung hat gegenüber MÜ eine ähnliche Position wie gegenüber einem anderem Menschheitstraum, die Heilung von Krebs. Der Wissenschaft wird grundsätzlich zugetraut, den Traum in absehbarer Zeit vollständig zu verwirklichen ("das muss doch möglich sein"); dagegen erscheint der tatsächliche Fortschritt in der Forschung ernüchternd und unbefriedigend.

Dabei ist eine der Bedingungen für eine funktionierende MÜ, dass die menschliche Fähigkeit "Sprache" umfassend und detailliert verstanden und beschrieben wird (-> wie soll sie der Computer verstehen, wenn sie nicht einmal der Mensch selbst versteht?). Das aber kann noch lange dauern. Die meisten Sprachwissenschaftler gehen davon aus, dass das vollständige Begreifen von "Sprache" ein vollständiges Begreifen der menschlichen Intelligenz insgesamt impliziert. Perfekte MÜ müsste also den menschlichen Geist selbst simulieren.

Rückschläge in der Praxis

Dass MÜ-Qualität oft unbefriedigend ist, hat auch noch handfestere, teilweise behebbare Ursachen:

  • "Billigprogramme". Viele bewerten den Stand der MÜ aufgrund kostenloser MÜ-Tools, die z.B. im Internet auf Yahoo oder Google verfügbar sind. Oft handelt es sich hier um abgespeckte oder ältere Versionen von sonst kostenpflichtigen (und besseren) Programmen, oder um eigens schnell (und schlecht) erstellten Programmen.
  • Benutzer kennt Ausgangssprache. Gerade bei Übersetzungen zwischen westlichen Sprachen versteht der Benutzer oft die Quellsprache bis zu einem gewissen Grad selbst und ist so empfindlicher gegenüber Abweichungen als jemand, der ausschliesslich auf die Übersetzung angewiesen wäre.
  • Sprachstil. Jeder Sprachstil hat Besonderheiten, die teilweise noch nicht einmal in der Linguistik beschrieben wurden. MÜ-Systeme gehen meist von der geschriebenen Zeitungssprache aus. Besonders schlechte Ergebnisse liefert MÜ von literarischer Sprache (z.B. viele Metaphern), von gesprochene Sprache (Verbmobil ist daran gescheitert) oder auch von technischen Texten (die berüchtigten japanischen Gebrauchsanleitungen).
  • Mangelnde Interdisziplinarität. MÜ gehört eigentlich zur Computerlinguistik, aber die meisten Forscher kommen aus den zwei Mutterbereichen dieser Fachrichtung, entweder aus der Informatik oder aus der Sprachwissenschaft, ohne sich genügend Fachkenntnisse in der jeweils anderen Disziplin anzueignen. Während Linguisten oft die Programmierpraxis fehlt, fehlt Informatikern oft die Bereitschaft zur Beschäftigung mit dem Phänomen "Sprache". Aus diesem Grund liegt den meisten MÜ-Anwendungen ein strukturalistisches Sprachmodell zugrunde, das die Erkenntnisse in der Linguistik in den letzten 50 Jahren eher unberücksichtigt lässt.
  • Kein Austausch zwischen Industrie und Akademik. Kommerzielle MÜ-Firmen beschäftigen oft lieber reine Programmierer, die sich das Fachwissen "vor Ort" aneignen sollen, als MÜ-Forscher von den Universitäten, die teilweise das Image haben, sich auf unwichtige Details zu versteifen.
  • Zu kleines Wörterbuch. Mit den Veränderungen in Gesellschaft und Wissenschaft nimmt ein Wortschatz jeden Tag rasant zu; ausserdem haben viele Wörter mehrere Bedeutungen (Homonyme), die durch Kontext-Analyse disambiguiert werden könnten. Wörterbuch-Mängel wie im Anfangsbeispiel Russisch-Englisch sind zu einem überraschend grossen Teil für die schlechte Übersetzungsqualität verantwortlich. Die grössten MÜ-Programme haben Wörterbücher mit mehreren Millionen Einträgen und einem vielfachen an Bedeutungsunterscheidungen. Die detaillierte Erstellung solcher grossen Wörterbücher für MÜ-Anwendungen durch Lexikographen stellt für kleinere Firmen einfach einen zu kostspieligen Aufwand dar.
  • Mangelnde Transfer-Regeln. Viele grammatische Phänomene sind anders oder existieren nicht einmal in anderen Sprachen (siehe unten). Die Lösung dieser Probleme erfordert oft eine Art Grundlagenforschung; diesen Aufwand suchen MÜ-Firmen natürlich zu vermeiden.

Grammatische Problemgebiete (Diversionen)

In keinem MÜ-System wird jede grammatische Regel angewendet bzw. analysiert. Vielmehr wird oft auf free rides vertraut. Free rides (kostenlose Mitnahme) bedeutet, dass ein Phänomen ohne spezifische Analyse zufällig in der anderen Sprache ähnlich realisiert wird (und damit nur die Wörter übersetzt werden müssen), so beim Artikel: der, die, das wird sowieso fast immer zu the in Englisch, fast nie zu a, also scheint eine Extra-Analyse als "bestimmter Artikel" überflüssig. Dass aber auch zwischen Deutsch und Englisch free rides scheitern können, zeigt der obige if-Satz mit "würde". Zwischen entfernteren Sprachen, z.B. Chinesisch-Deutsch sind free rides oft nicht mal auf der Wortebene eine sichere Bank.

Viele komplexe Grammatik-Phänomene sind von der MÜ noch gar nicht oder nur in Ansätzen erforscht und realisiert. Für sie sind free rides die einzige, oft fatale, Lösung. Solche Phänomene sind (Auswahl):

  • Artikel. Nur die germanischen und romanischen Sprachen haben Artikel. Bei Übersetzung aus einer anderen Sprache muss ein Artikel quasi "aus dem Nichts" generiert werden.
  • Zusammengesetzte Nomina. In Sprachen wie Deutsch oder Japanisch kann die Beziehung zwischen Nomina untereinander "kaschiert" werden, indem man sie einfach nebeneinander stellt. In anderen Sprachen muss die Beziehung explizit gemacht werden. Z.B. Donaudampfschifffahrtsgesellschaftskapitän = "Ein Kapitän, der bei einer Gesellschaft arbeitet, deren Geschäft Schifffahrt auf der Donau ist"
  • Relativpronomen. Die meisten Sprachen haben gar kein oder nur ein einziges Relativpronomen. Bei Übersetzung in Deutsch (der, die, das) oder Englisch muss aber ausdifferenziert werden.
  • Tempus/Modalität. Jede Sprache hat ihr eigenes System, um zu sagen, dass ein Satz in der Vergangenheit passiert oder ein Befehl ist. In europäischen Sprachen wird dies oft mit Verb und Adverb realisiert.