Das Verwendungsniveau und die Verlässlichkeit der maschinellen Übersetzung

Immer nur Versprechen. Und noch keine wahrhaftigen Neuheiten!

Den Erstübersetzer ersetzen: die Revision eines übersetzten Textes, ohne die Ausgangssprache „zu kennen“
Ende der 80er Jahre war die Hoffnung bezüglich maschineller Übersetzung (MÜ), d.h. bezüglich einer komplett von einer Software übernommenen Übersetzung sehr hoch und weit verbreitet. Und natürlich ist hier nicht die Rede von computergestützter Übersetzung mit Translation Memory-Systemen (TM-Systemen), in welcher Trados, gefolgt von Transit, Déjà Vu, Star und anderen Produkten der Marktführer ist. Die computergestützte Übersetzung (TM) wird Tag für Tag von einem Großteil der professionellen Übersetzer genutzt.
Nach ungefähr fünfzehn Jahren, in denen sich die technische Revolution verselbstständigt hat (von informatisierter Buchführung bis hin zu Internettechnologien), sollte man sich fragen wo nun das Benutzungsniveau und die Verlässlichkeit der maschinellen Übersetzung steht. Und vor allen Dingen zu welchen Ergebnissen man im Vergleich zu den ursprünglichen und grundsätzlichen Erwartungen man heute kommen kann. Kann ein Erstübersetzer wegfallen, so dass der Übersetzer den von der Software übersetzten Text nur noch überprüfen und evtl. korrigieren muss?
Die doppelte Konferenz, die Teleport am 9. März 2005 zum Thema maschinelle Übersetzung in Brüssel organisiert hat, war eine gute Gelegenheit Antworten auf diese Fragen zu finden. Die beiden Redner, Dominique Orban von der Firma REVER und Joseph Bonet von der Europäischen

Die Progression der Seitenanzahl der von der Europäischen Union mit Hilfe von maschineller Übersetzung übersetzten Seiten ist zustandbeschreibend.

Kommission haben ihrerseits jeweils die Themen „Linguistische Datenverarbeitung“ und „Machine Translation in a production environment – Das Beispiel der Europäischen Kommission“ vorgestellt. In kurzer Zusammenfassung (siehe Kasten) haben sie folgende Antworten gegeben.

Die Verwendung von maschineller Übersetzung ist immer weiter verbreitet, aber ihre Verlässlichkeit stagniert
Die Anwendungsbereiche der maschinellen Übersetzung haben sich auf bemerkenswerte Weise vervielfältigt, so dass sogar das Konzept einer neuen Industrie entstanden ist: die „Linguistische Datenverarbeitung“ (laut Definition von Dominique Orban „die Gesamtheit aller Forschungsaktivitäten, der Entwicklung und der Vermarktung von Produkten und Dienstleistungen, welche auf der automatischen Verarbeitung von Sprache basieren“). Die Nachforschungen der Brüsseler Agentur Vandijk, welche seit mehr als 20 Jahren Übersetzungsvorgänge, vor allem für die EU analysiert, wurden im Detail vorgestellt. Auf diese Art und Weise konnten neun Marktbereiche bestimmt werden:

  • Dokument-Management
  • Inhalts-Management
  • Produktion und Verlag
  • Linguistische Ressourcen
  • Intelligente Suchmaschinen
  • e-Business
  • Übersetzungen
  • e-Learning
  • sprechende, multimodale Benutzeroberflächen
Von der Verwendung für die Bedienung von Maschinen und von Autos, bis hin zur juristischen Übersetzung der öffentlichen Institutionen kann man die Bandbreite der Marktnachfrage ablesen. Aber leider muss man eine niveaubezogene relative Stagnation der Leistung der maschinellen Übersetzung konstatieren. Der Fortschritt in diesem Bereich ist seit den 80ern belanglos.

Der Fortschritt ist nämlich an das Feedback derjenigen Übersetzer, die maschinell übersetzte Texte korrigieren gebunden. Die künstliche Intelligenz der Maschinen wird durch Korrektur, d.h. durch das Hinzufügen von semantischen, orthosyntaktischen und lexikalischen Verbesserungen in der Software bereichert.

Privatunternehmer können sich die Forschung in maschineller Übersetzung nicht erlauben
Es klingt vielleicht paradox, aber der Lernprozess der „machine translation“ folgt den gleichen pädagogischen Prinzipien wie die Entwicklung der menschlichen Intelligenz und des menschlichen Wissens: Man muss korrigieren und wiederholen, das ist alles.
Aber dies wiederum erfordert eine große Investition an Zeit und an Arbeit in das Feedback (siehe Kasten), was wiederum in Bezug auf die Personalkosten sehr kostspielig ist. Welches private Unternehmen ist in der Lage die dementsprechenden Investitionen im R&D-Bereich zu tätigen?
Im Laufe der letzten zwanzig Jahre, gab es eine Woge von mehr oder wenig naiven und ehrlichen Versuchen, neue Systeme für maschinelle Übersetzung zu entwickeln. Alle diese Versuche haben jedoch, wie so vieles, ein jähes Ende gefunden, so dass die Weiterentwicklung eingestellt wurde. Man denke nur an die zahlreichen Initiativen der Universitäten, Bundesländer, Regionen und der Unternehmen aus dem sprachlichen Sektor, welche sich allesamt auf dieses Abenteuer eingelassen haben.
Während die Nachfrage unaufhörlich steigt, versinkt das Angebot (seitens der linguistischen Datenverarbeitung) in finanziellen Schwierigkeiten, insbesondere in Schwierigkeiten, die aus den angesprochenen beträchtlichen Investitionen resultierenden.
Die Hoffnung, die wir in die maschinelle Übersetzung setzen bleibt, aber seine Anwendung bleibt (noch) zu sehr eingeschränkt.

 

Die maschinelle Übersetzung wird niemals den Übersetzer ersetzen, aber…

Systran: maschinelle Übersetzung dank Spionage

   

Die Verständlichkeit von maschinellen Übersetzungen liegt bei mehr als 95%
Zu Anfang der 90er Jahre war die Hauptniederlassung Eurologos-Brüssel in Belgien Reseller im privaten Firmensektor von Systran, einem System für maschinelle Übersetzung. Die gegenwärtige Europäische Union war (und bleibt) der Eigentümer von Systran für den privaten Sektor.
Systran ist immer noch das weltweit leistungsstärkste Machine Translation-System für viele Sprachenkombinationen. Seine Leistung entspringt der Feedback-Arbeit, die das amerikanische Verteidigungsministerium (und anschließend das Soyuz-Projekt für Apollo) vollbracht hat, um bereits seit den 60ern – denn da haben die Vereinigten Staaten Systran seinem ungarischen Erfinder, Peter Toma abgekauft – die russischen Radiokommunikationen auszuspionieren. Hierdurch hat die Russisch-Englische Sprachenkombination eine Leistungsfähigkeit von ungefähr 96% erreicht (bereits bei 90% wird der übersetzte Text nahezu unverständlich), was sie einem linguistischen Qualitätsniveau näher bringt, ab dem die Korrektur des Englischen (Zielsprache) ohne Kenntnis des Russischen (Ausgangssprache) möglich ist.

Die Benediktinerarbeit des Feedbacks und die Sabotage der Maschinenstürmer
Natürlich ist die dazu symmetrische Sprachenkombination Englisch-Russisch weniger leistungsfähig, da die Benediktinerarbeit der Korrektur nicht geleistet worden ist. Auf dieser Basis

ruhen zahlreiche Hoffnungen bezüglich der maschinellen Übersetzung, die die Übersetzer von der mühseligen (und langwierigen) Arbeit der Erstübersetzung befreit hätte: Somit hätten sich Übersetzer umgehend in Korrekturleser und Copywriter der editierten Texten verwandelt, und dies auf einem hohen Niveau zu niedrigen Preisen. Die Frage, die oft gestellt wird ist, warum die EU seit fast 30 Jahren nicht 5 bis 10% seines Übersetzerheeres (davon allein 1200 bei der Europäischen Kommission) zur maschinellen Übersetzung und zur Feedbackarbeit abgestellt hat. Denn dann hätten wir heutzutage schon über viele verschiedene gut funktionstüchtige Sprachkombinationen verfügen können. Die kulturelle Sabotage der Übersetzung mit Systran war in den 70ern und 80ern seitens der Übersetzer jedoch stark ausgeprägt. Dem Vorbild der Maschinenstürmer folgend haben sich die englischen Obskurantisten gegen die Dampflokomotive aufgelehnt, ja sie sogar gestürmt, da sie auf die Arbeit zerstörerisch einwirke...

Eine Graphik der in der Europäischen Union am häufigsten verwendeten Sprachenkombinationen.

EUROLOGOS GROUP OFFICES.
TRANSLATING AND PUBLISHING WHERE THE LANGUAGES ARE SPOKEN

Eurologos Newsletter APRIL - MAI 2005