Computergestütztes Hilfsmittel (Ref-Spell-Checker) für ein Verfahren zur Erstellung von Dokumenten
Die vorliegende Erfindung betrifft ein computergestütztes Hilfsmittel für ein Verfahren zur Erstellung von Dokumenten gemäss Oberbegriff des Anspruchs 1.
Verfahren zur Erstellung von fremdsprachigen Dokumenten finden ihre Anwendung ganz allgemein in der Kommunikationstechnologie und insbesondere in technischen Bereichen, wie beispielsweise in der Fahrzeugindustrie, Maschinenindustrie oder Uhrenindustrie, wo Bedienungsanleitungen, Ersatzteilkataloge, Serviceanleitungen und viele andere Dokumentationen in mehrere Sprachen übersetzt werden. Derartige Dokumentationen wurden bisher im Wesentlichen von Übersetzern in eine andere Sprache übersetzt, anschliessend von anderen Fachpersonen mit einem vorgegebenen Layout versehen und von weiteren Fach- personen gedruckt bzw. publiziert. Es versteht sich, dass diese Vorgehensweise viel Zeit und Geld kostet.
Es ist deshalb das allgemeine Bestreben in der Kommunikationstechnologie, das Erstellen von Publikationen in verschiedenen Sprachen zu automatisieren. Technische Dokumentationen dieser Art enthalten viele Wiederholungen und eigenen sich deshalb, in einer Termino- logie-Datenbank abgelegt zu werden, um die Übersetzer von Routinearbeiten zu entlasten.
So sind verschiedene Terminologie-Datenbanken bekannt, welche spezielle Begriffe auf den angesprochenen Gebieten verwalten und den Übersetzungsprozess bei der Erstellung von mehrsprachigen Publikationen rationalisieren. Die dazu verwendeten Computerprogramme machen Gebrauch vom sogenannten Delta-Prinzip, d.h. dass bei der Übersetzung von nur wenig geänderten Dokumenten lediglich die Teile der Dokumentation manuell bearbeitet werden müssen, welche neu eingebracht worden sind. So lassen sich technische Dokumentationen schneller und kostengünstiger erstellen. Weiterentwicklungen dieser computerunterstützten Übersetzungstechnik sind im Stand, Querverbindungen zwischen einzelnen Publika- tionen, bspw. zwischen einem Ersatzteilkatalog und einer Service-Anleitung, herzustellen.
Zur Steigerung der Bearbeitungseffizienz und Übersetzungsqualität, insbesondere der konsequenten Verwendung einer fachspezifischen Terminologie, werden heute bei der Übersetzung von Texten maschinenunterstützte Verfahren verwendet, welche als Machine Transla- tion Systems oder Translation Memory Systems bekannt sind. Ein derartiges Translation Memory System ist bspw. aus der EP 1 349 079 oder der EP 0 952 532 bekannt und beruht darauf, einmal erbrachte Übersetzungsarbeiten automatisch wieder zur Verfügung zu stellen,
insbesondere übersetzte Begriffe, Sätze oder ganze Textsegmente. Dabei können auch nur teilweise zutreffende Textpassagen aus dem Translation Memory zur Wiederverwendung vorgeschlagen werden. Bei der Machine Translation-Technik wird im Wesentlichen über die Kombination von Syntax- und/oder Semantik-Analyse eine automatische Übersetzung ma- schinell generiert. Ein derartiges Verfahren wird bspw. in der WO 99/57651 oder WO 02/093416 beschrieben.
Die zu bearbeitenden Originaltexte, im folgenden auch Quelltexte genannt, werden in bekannter Weise mit Hilfe von unterschiedlichen Layoutgeneratoren (DTP-Programme, wie Word®, QuarkXPress®, FrameMaker®, etc.) erstellt. Diese Layoutgeneratoren verwenden wiederum produktspezifische Hilfsmittel, z.B. Satz- oder Layoutprogramme. Die mit Hilfe der Machine Translation oder Translation Memory Systeme übersetzten Originaltexte werden in der Regel direkt wieder als Dokumentationen, d.h. Printmedien, elektronische Publikationen oder als maschinenlesbare Information ausgegeben. Dabei liegen die zu übersetzenden Texte meist in einem proprietären Format vor, typischerweise in einem maschinenlesbaren Code.
Die auf diese Weise generierten Texte erfüllen jedoch nur ausnahmsweise die Anforderungen an ein sprachlich konsistent übersetztes Dokument. Mit den Übersetzungssystemen bekannter Art lässt sich insbesondere nicht vermeiden, dass die Schreibweise bestimmter Ausdrücke, bspw. Ref-Spell-Checker, im neu erzeugten Text in anderer Form geschrieben wird, bspw. StarTerm oder Starterm oder Star-Term oder STARterm. Mit den bekannten Translation Memory Systemen können solche Situationen nicht gemeistert werden. Es ist deshalb Aufgabe der vorliegenden Erfindung ein computergestütztes Hilfsmittel zu schaffen, welches es erlaubt, derartige Unzulänglichkeiten der bekannten Übersetzungssysteme zu überwinden. Es ist insbesondere Ziel der vorliegenden Erfindung ein Hilfsmittel zu schaffen, mit welchem die Konsistenz der Schreibweise einzelner Begriffe innerhalb eines Dokumentes gewährleistet werden kann, d.h. voneinander abweichende Schreibweisen desselben Ausdrucks erkennen und abgleichen kann.
Es wird deshalb vorgeschlagen ein im Folgenden als Ref-Spell-Checker bezeichnetes Verfahren vorzusehen, mit welchem sich die rechte Schreibweise resp. die Rechtschreibung in einem möglicherweise auch mehrsprachigen Dokument anhand freigegebener Referenztexte prüfen lässt. Dazu soll zwischen einem zu prüfenden Dokument und einem freigegebenen Referenzmaterial eine einheitliche Schreibweise bei der Schnittmenge der gemeinsamen Ausdrücke hergestellt werden. So soll sichergestellt werden, dass bspw. der Ausdruck Star-
Term in demselben Dokument nicht auch in der Form Star-Term geschrieben und verwendet wird.
Erfindungsgemäss wird die gestellte Aufgabe mit einem computergestützten Hilfsmittel (Ref- Spell-Checker) gelöst, welches die Merkmalen des Anspruchs 1 aufweist. Insbesondere wird ein computergestütztes Verfahren vorgeschlagen, mit welchem eine dokumentenübergrei- fende Konsistenz in der Schreibweise ausgewählter Ausdrücke anhand eines vorgegebenen Matrixkorpus hergestellt wird.
Die Vorteile des vorliegenden Hilfsmittels sind dem Fachmann unmittelbar ersichtlich und sind insbesondere darin zu sehen, dass durch die Verwendung des erfindungsgemässen Hilfsmittels die inkonsistente Verwendung von bestimmten Ausdrücken bei der automatischen Übersetzung eliminiert und damit die maschinengestützte Generierung einer Zielpublikation zu besseren Übersetzungsergebnissen führt. Damit reduziert sich auch der Aufwand für die jeweiligen Sachbearbeiter.
Im Folgenden soll die Erfindung anhand eines Ausführungsbeispiels und mit Hilfe der Figur näher erläutert werden. Es zeigt:
Fig. 1 ein Flussdiagramm zum erfindungsgemässen Verfahren.
Diese Figur macht deutlich, wie mit dem erfindungsgemässen Hilfsmittel (Ref-Spell-Checker) ein zu prüfendes Dokument 1 mit geeignetem Referenzmaterial 2 verglichen wird und dem Übersetzer eine interaktive Unterstützung zur Verfügung gestellt wird. Das vorliegende Ver- fahren funktioniert nach dem Prinzip einer assoziativen Zuordnung des zu prüfenden Textes mit geeignetem Referenzmaterial. Vorteilhafterweise sollte für den Abgleich zwischen dem Referenzmaterial 2 und dem zu prüfenden Dokument 1 das Referenzmaterial 2 thematisch so ausgewählt werden, dass dieses für den zu prüfenden Text verwendbar ist. Dadurch kann vermieden werden, dass Ausdrücke mit weitgehend identischer Schreibweise, jedoch aus divergenten thematischen Feldern miteinander verglichen werden. So würde bspw. ein korrekt verwendeter englischsprachiger Ausdruck „automatic driver" in einem zu prüfenden Dokument aus dem Fahrzeugtechnik beim Abgleichen mit Referenzmaterial 2 aus dem nautischen Bereich, irrtümlich als Inkonsistenz gegenüber dem Ausdruck „automatic dϊver" angezeigt. Als Inkonsistenzen werden hier definierte Abweichungen in ausgewählten Doku- menten von einer in einem Referenzdokument oder einem Korpus von Referenzdokumenten verbindlich festgelegte Schreibweise verstanden. Nach dem erfindungsgemässen Verfahren wird das Hilfsprogramm (Ref-Spell-Checker) über eine Schaltfläche im Anwenderprogramm
3 aktiviert und der Datenabgleich an der aktuellen Cursor-position im Dokument 1 gestartet. Der Datenabgleich erfolgt für den Benutzer unsichtbar im Bildschirmhintergrund 4. Inkonsi- stenzen werden der Reihe nach durch eine Rückmeldung auf dem Bildschirm in einem Dialogfenster 5 angezeigt. Gleichzeitig erscheint in dem Dialogfenster das vom Ref-Spell- Checker im Referenzmaterial gefundene Konzept in der schreibgeprüften Variante. Dieser Vorschlag kann vom Bearbeiter über einen manuellen Befehl für das Prüfdokument übernommen oder ignoriert werden. Inkonsistnzen, die zum ersten Mal angezeigt werden, lassen sich über einen manuellen Befehl in ein zunächst leeres, temporäres Benutzerwörterbuch 6 aufnehmen. Wiederholen sich die gleichen Inkonsistenzen im selbem Dokument, werden sie nicht jedesmal in einem Dialogfenster angezeigt. Über einen manuellen Befehl ersetzt der vorliegende Ref-Spell-Checker dann alle identischen Wiederholungen derselben Inkonsi- stenz. Die aufgefundenen Fehler lassen sich in einem Log-File 7 zu Auswertungszwecken aufzeichnen.