KÜNSTLICHE INTELLIGENZ UND NEUE TECHNOLOGIEN: DIE MODERNE ECKE DER ÜBERSETZUNG?
Seit einigen Jahren verbreiten Google mit Translate, Microsoft und andere Web-Giganten statistische maschinelle Übersetzungen: Aus Halbkomikern wurden maschinelle Übersetzungen, die zwar nicht perfekt sind, manchmal auch brauchbare Produkte, vor allem wenn sie durch entsprechende menschliche Eingriffe angepasst werden.
Im Jahr 2011 sagte der Zukunftsforscher und Kybernetiker Ray Kurzweil in einem Interview mit der Huffington Post voraus, dass maschinelle Übersetzung bis 2029 den Menschen ersetzen kann.
Seit Sommer 2016 ist die neuronale maschinelle Übersetzung erschienen.
Was passierte?
Am 26. September 2016 kündigte Google Brain, die Forschungsgruppe für Anwendungen der künstlichen Intelligenz, die Veröffentlichung eines neuen, auf neuronalen Netzwerken basierenden maschinellen Übersetzungssystems an. Am 17. Oktober machte Systran eine ähnliche Ankündigung und am 15. November informierte Microsofts Blog, dass Microsoft Translator nun auch in einer "neuronalen Version" verfügbar ist. Im Mai 2017 kündigte Facebook an, dass es sich in Richtung Faltungsneuronale Netze weiterentwickeln wolle. Diese wären neunmal schneller im Training als die rekurrenten neuronalen Netze, die stattdessen ab Juni 2016 quasi auf dem Etikett auf den Plattformen des Konzerns Facebook, Instagram und Workplace eingeführt wurden. Inzwischen investieren auch andere Computergiganten wie Apple, Amazon und Baidu in künstliche Intelligenz.
Es wird behauptet, dass diese Technologie in der Lage wäre, Übersetzungen zu produzieren, die viel genauer und vergleichbar mit der menschlichen Übersetzung sind.
Es scheint, dass die Arbeit der Zukunft, nicht nur die der Übersetzer, von künstlicher Intelligenz (dank ihrer Fähigkeit, selbst zu lernen, also durch sogenanntes maschinelles Lernen) und von Robotern und Anwendungen bewältigt werden wird, mit allen wirtschaftlichen und sozialen Konsequenzen, die dies mit sich bringt.
Die Maschinen beginnen zu "denken" und sind dazu bestimmt, menschliche Arbeit auch bei als komplex geltenden Tätigkeiten zu ersetzen.
So sind Google und Tesla bei der Entwicklung von fahrerlosen Autos weit voraus, die eine Revolution der individuellen Mobilität vorwegnehmen. Wird es in unserer nahen Zukunft noch Taxifahrer geben?
Was ist Artificial Intelligence?
Künstliche Intelligenz ist die Disziplin, die Möglichkeiten zur Reproduktion der komplexesten mentalen Prozesse durch den Einsatz von Computern untersucht. Um dies zu erreichen, verwendet sie Systeme, die die Erfassung und Verarbeitung von Daten und Informationen (sowohl von außen als auch in organisierter Weise im System enthalten) auf der Grundlage entsprechender Modelle beinhalten.
Die künstliche Intelligenz hat sich heute von der Idee verabschiedet, ein vorkonstituiertes System von Regeln und Daten nach symbolischer Logik aufzubauen, um Maschinen die Interaktion mit der realen Welt zu ermöglichen.
Die besten Ergebnisse liefern heute Systeme mit maschinellem Lernen, bei denen die Maschinen in der Praxis aus realen Daten lernen und ihre Arbeitsweise danach ausrichten.
Deep Learning ist die Bezeichnung für eine bestimmte Klasse von Algorithmen für maschinelles automatisches Lernen, die neuronale Netze verwendet.
Statistische Übersetzung und neuronale Übersetzung: das Beispiel von Google
Statistische automatische Übersetzer, wie z. B. das "alte" Google Translate, sind "Phrase-Based Machine Translation"-Systeme, die über mehr oder weniger große Datenbanken mit sprachlichen Übereinstimmungen von einer Sprache in eine andere verfügen, plus vorinstallierte Regeln für jedes Sprachpaar.
Mit diesen Systemen wurde ein Satz nach Fragmenten, Wortgruppen oder Wörtern übersetzt, die auf den Google-Servern in riesigen mehrsprachigen Korpora gefunden wurden, ähnlich wie bei der Suche in den Übersetzungsspeichern eines CAT-Tools.
Das Ergebnis wurde dann vom System nachjustiert, wobei die Übersetzung mit Wörterbüchern interpoliert wurde und sprachübergreifende Modelle verwendet wurden, um die korrekte Konstruktion des Satzes in den verschiedenen Sprachen zurückzugeben.
Die Ausgabe war immer gut: sehr gut für mehrere Sprachen, aber ausreichend oder schlecht für einige Sprachen (insbesondere Deutsch und Finnisch, unter den europäischen Sprachen). Mit Abweichungen manchmal aufgrund von Interpunktion, Wortstellung und mehr, die eine Reihe von Empfehlungen zur Vorbearbeitung des Textes hervorgerufen haben.
In jedem Fall war der nächste Satz derjenige, der von vorne begann und das Ergebnis (gut oder schlecht) der Übersetzung des vorherigen Satzes nicht berücksichtigte.
Die Besonderheit von neuronalen Netzwerken ist ihre Fähigkeit, Daten aus großen unstrukturierten Mengen in kleinere Mengen mit hoher semantischer Dichte zu transformieren. Bei der neuronalen maschinellen Übersetzung liest das System, wie Google erklärt, den Originaltext Wort für Wort und übersetzt ihn Wort für Wort, wobei es versucht, die Verteilung der Wörter des gelesenen Originaltextes und ihre Beziehung zu jedem übersetzten Wort zu gewichten.
Das System analysiert den gesamten Satz als eine zu übersetzende Einheit, wobei es den Kontext beibehält und auch Sequenzen mit Interpunktion und komplexer grammatikalischer Artikulation sowie Absätze mit abgeschlossener Bedeutung zu übersetzen vermag.
Die bisher beobachtete Verbesserung der Übersetzungsgenauigkeit ist überraschend und soll im Laufe der Zeit durch maschinelles Lernen verbessert werden, im Gegensatz zu früheren Systemen, die geschlossene Systeme waren.
Warum und wofür werden noch menschliche Übersetzer benötigt?
Wird die Automatisierung von Übersetzungen jeglicher Art den Übersetzer überflüssig machen? Wahrscheinlich nicht, oder zumindest nicht bald. Allerdings werden sich neue Wege und Praktiken in der interlingualen Kommunikation entwickeln und neue Kenntnisse und Fähigkeiten erfordern, die erlernt werden müssen... Lassen Sie uns versuchen, einige davon aufzuzählen.
Übersetzer werden natürlich über ein hohes Maß an technologischem Fachwissen verfügen müssen. Sie werden eine Kultur, Schreibfähigkeiten und tiefgreifende linguistische und sektorale Kenntnisse haben müssen, um die Schwierigkeiten und die Qualität der Texte einschätzen zu können. Sie müssen in der Lage sein, große Mengen an Texten in begrenzter Zeit zu bearbeiten. Sie werden in der Lage sein müssen, zu beurteilen, ob es sinnvoll ist, automatisch zu übersetzen, den Umfang des Post-Editings einzuschätzen, einen Text vor seiner Übersetzung einem Pre-Editing zu unterziehen, Übersetzungen zu schreiben (kontrolliertes Schreiben), TA-Systeme zu trainieren oder sie an spezielle Bedürfnisse anzupassen.
Übersetzer werden zu Managern von mehrsprachigen Übersetzungs- oder Editionsprojekten. Ein bisschen 'Lektoren, Redakteure, Projektmanager, aber vor allem immer mehr Korrektoren. Vor und nach der Übersetzung, die von der Maschine durchgeführt wird. Das ist ja kein ganz neues Thema, aber es wird jetzt deutlich. Seit einiger Zeit bedeutet das Schreiben von Texten die Interaktion mit einer Vielzahl von Technologien und digitalen Speichern (Wörterbücher, Glossare, Datenbanken, Korpora, Suchmaschinen usw.).
Da der Haupteffekt der technologischen Revolution die enorme Zunahme unserer Möglichkeiten zur Datenspeicherung war, besteht ein großer Teil der Tätigkeit des Übersetzers in der Suche nach geeigneten Quellen (Memories) vor dem Schreiben und in verschiedenen Formen der intralinguistischen Übersetzung oder Adaption (Revision, Korrektur von Segmenten, Nachbearbeitung usw.) nach dem Schreiben.
So besteht die Arbeit des Übersetzers seit Jahren zu einem großen Teil aus dem Zusammensetzen (Kopieren und Einfügen) von Fragmenten, die aus irgendeiner Art von digitalem Gedächtnis gewonnen wurden: Textteile, Ausdrücke oder Begriffe, die aus früheren Arbeiten, Suchmaschinenergebnissen, elektronischen Wörterbüchern, Glossaren, terminologischen Datenbanken, parallelen Korpora, die im Internet gefunden wurden, Bitext, Translation Memories oder auch aus Vorübersetzungen, die von maschinellen Übersetzungssystemen bereitgestellt wurden. Der Flickenteppich oder "Satzsalat" aus all den Segmenten und Fragmenten, die durch eine solche Arbeitsweise entstehen, muss dann in der Nachübersetzungs- bzw. Revisionsphase unter Berücksichtigung des geforderten Genauigkeitsgrades geordnet werden.
Die Frage ist: Helfen die aktuellen Übersetzungskurs-Programme, diese Fähigkeiten zu entwickeln? Wenn man sich ein wenig umschaut, lautet die Antwort, dass es für die Ausbilder zukünftiger Übersetzer definitiv noch viel zu tun gibt.