Neues von der Machine Translation in der Microsoft Knowledge Base

Schon lange Zeit bietet Microsoft technische Artikel in der Microsoft Knowledge Base unter https://support.microsoft.com an. Da diese Artikel naturgemäß zuerst in englischer Sprache erscheinen, übersetzt ein Team bei Microsoft die Artikel in ein Vielzahl anderer Sprachen. Darüber können wir jedoch nur einen Bruchteil der aller Informationen zeitnah lokalisiert zur Verfügung stellen. Deshalb gibt es eine kleine Combobox auf der rechten Seite, mit der man eine maschinelle Übersetzung des Artikels aufrufen kann.

image

Die Qualität der maschinellen Übersetzung schwankt natürlich zwischen “erstaunlich gut” bis hin zu “absolut unbrauchbar”. Berühmt wurde die Stilblüte Wiener Schnitzel an Stelle von Pacific Rim. Ursache war Machine Learning: Zum Trainieren der Übersetzungsengine nahm man manuell übersetzte, technische Artikel wie zum Beispiel Hilfetexte von Programmen, TechNet, etc. Nun stand in der Hilfe von Windows XP als Erläuterung zur Nutzung von Filtern im Find-Befehl:

Using the find command

To use find as a filter command, you must include a less than sign (<) and the string or text on which you want to search. By default, find searches are case-sensitive. For example, the following command finds occurrences of the string "Pacific Rim" in the file Trade.txt:

find "Pacific Rim" < trade.txt

Der deutsche Artikel enthielt eine auch thematisch angepasste Übersetzung:

Im folgenden Beispiel wird mit dem Befehl find nach jedem Vorkommen der Zeichenfolge "Wiener Schnitzel" in der Datei Essen.txt gesucht:

find "Wiener Schnitzel" < Essen.txt

Der Gedankenschluß, Pacific RIM mit Wiener Schnitzel gleichzusetzen, war dann durchaus logisch für Computer. Trotz dieser und anderer Probleme hilft die automatische Übersetztung unserer Artikel unseren Kunden, die nicht der englischen Sprache mächtig sind, im großen und ganzen weiter. Die deutschen Bewertungen der automatisch übersetzten Artikel sind im Durchschnitt signifikant besser als die der früher rein englischsprachigen Artikel.

image

Da aber viele Kunden neben der maschinellen Übersetzung oftmals das englischsprachige Original zum Vergleichen nachschlugen, haben wir eine Änderung implementiert, die diese Auswahl zusätzlich anbietet. Auch dank der Verbreitung von Bildschirmen im 16:9- und 16:10-Format kan man so ganz einfach beide Versionen im Vergleich nebeneinander anzeigen lassen:

image