Zum Inhalt springen

European Advanced Multilingual Information System

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 12. Mai 2007 um 10:25 Uhr durch 84.149.192.208 (Diskussion). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Das European Advanced Multilingual Information System, Akronym Euramis, wurde als Übersetzungsunterstützungssystem für den Sprachendienst der Europäischen Union entwickelt (u.a. von der EP Electronic Publishing GmbH in Nürnberg unter Leitung von Dr. Klemens Waldhör). Die Softwareentwicklung startete 1995. Euramis wurde hauptsächlich in der Programmiersprache C als Client/Server System entwickelt. Das System umfasste schliesslich etwa eine Million Zeilen C-Code. Der Server lief auf einer Unix-Maschine, der Zugriff von Client Seite erfolgte über Windows PCs. Der Server wurde später auch nach Windows portiert.

Die Kernkomponenten umfassen ein Translation Memory System, einen Phrasenübersetzer sowie die Anbindung an das maschinelle Übersetzungssystem des Sprachendienstes sowie eine Vielzahl von Unetrstützungswerkzeugen, z.B. Konkordanzwerkzeugen. Die Übersetzer selbst arbeiteten entweder mit einem eigen entwickelten Pivot-Editor oder in einer Umgebung wie Trados. EURAMIS war als Client Server System eines der ersten Übersetzungssysteme, die konsequent nach diesem Paradigma entworfen und entwickelt wurden. Ebenso war es vom kern her multilingual ausgerichtet, es konnte von jeder in jeder Sprache übersetzt werden. Intern wurde das Unicode-Format zur Zeichendarstellung verwendet. Auch damit war das System ein Vorreiter in diesem Bereich. Für die unscharfe Suche wurde eine sehr effiziente Datenbanksuche entwickelt.

Kern von Euramis war die Entwicklung eines SGML basierten "Pivot-Formates", das als Austauschformat zwischen den Anwendungen und den verwendeten Dokumentenformaten verwendet wurde (z.B. WinWord, ASCII, WordPerfect, SGML etc.). Dieses Format diente dann als Vorbild für Standards im Übersetzungsbereich, wie etwa XLIFF und TMX.

Ein Hauptgrund für die Entwicklung von Euramis war - neben der zum Entwicklungszeitpunkt mangelnden Perfomanz der Windows basierenden existierenden Systeme - auch die Notwendigkeit, die große Anzahl an übersetzten Dokumenten des Sprachendienstes effizient wieder verwenden zu können sowie die Erweiterung der EU um neue Mitglieder und damit Sprachen. Dies führte am Ende zu einem der weltweit größten Translation Memory Datenbanken, das trotz seiner Millionen EInträge sehr performant arbeitete.

Der Kernprozess war in mehrere Phasen gegliedert: Im ersten Schritt wurde das Dokument (z.B. vom Übersetzer) an den Euramis-Server geschickt (per E-Mail bzw. bei Euramis-Interface, in dem die unterschiedlichen Dienst definiert werden konnten), am Server in das Pivot-Format konvertiert, anschliessend um die aus dem TM stammenden Übersetzungen, den maschinellen Übersetzungen oder Phrasenübersetzungen angereichert. Diese Dokument wurde an den Übersetzer per E-Mail zurückgeschickt und vom ihm bearbeitet = übersetzt. Anschliessend wurde das so übersetzte Pivot-Dokument an den Server zurückgeschickt und wieder in das Orginalformat konvertiert. Neue Übersetzungen wurde in die zentrale Datenbank eingefügt bzw. geändert.

Euramis wurde in unterschiedlichen Varianten weiterentwickelt, u.a. für SUN als SunTrans. Viele der Grundideen finden sich in existierenden Systemen wieder, z.B. Araya.

Literatur: