-
Die
vorliegende Erfindung bezieht sich auf eine Vorrichtung und ein
Verfahren zum Zugreifen auf eine Datenbank, z.B. von der Art, welche
in maschinenlesbaren Wörterbüchern verwendet
wird, wie monolinguale bzw. einsprachige Wörterbücher, Thesauren, Enzyklopädien und
bilinguale bzw. zweisprachige Wörterbücher.
-
Solch
eine Datenbank ist typischerweise indiziert unter Verwendung eines
einzelnen Worts, welches ein Anfangswort bzw. eine Spitzmarke bzw. Schlagwort
genannt wird.
-
JP-A-6243162
bezieht sich auf ein Maschinenübersetzungssystem
umfassend ein OCR, um ein Dokument einzugeben. Das Dokument wird
in Morpheme aufgeteilt durch eine morphologische Analyse zur Verarbeitung.
Ein "part of speech"- bzw. "Teil der Sprache"-Inferenzverfahren
wird verwendet, basierend auf den vorhergehenden zwei Wörtern in dem
Morphem, um die Wahrscheinlichkeit der Geeignetheit einer Übersetzung
zu berechnen.
-
EP 0 262 938 offenbart ein
System zum Übertragen
von Phrasen bzw. Sätzen
von einer ersten Sprache in eine zweite Sprache. Das System weist
einen Speicher auf, welcher eine Sammlung von Phrasen in der zweiten
Sprache beinhaltet, und versucht zu identifizieren, welche dieser
Phrasen jeder eingegebenen Phrase in der ersten Sprache entspricht.
Insbesondere versucht das System eine relativ geringe Anzahl von
Schlüsselwörtern zu
erkennen zum Charakterisieren der Eingabephrase, um die entsprechenden
Ausgabephrasen zu identifizieren und eine relativ schnelle Übersetzung
bereitzustellen.
-
US 5 181 163 offenbart eine
Technik zum Erzeugen oder Aktualisieren von Einträgen in einem Zusammentreffens-
bzw. Gemeinsamauftretungswörterbuch
(engt.: "cooccurence
dictioanry"). Solch ein
Wörterbuch
enthält
eine Liste von Wortpaaren, welche gemeinsam auftreten in einer bestimmten syntaktischen
Beziehung in einer natürlichen
Sprache. Solche Wörterbücher werden
in manchen Maschinenübersetzungssystemen
verwendet zum Über setzen
von einer ersten Sprache in eine zweite Sprache und stellen Information über die
erste Sprache bereit. Ein gegebener Text wird syntaktisch analysiert
und das Ergebnis wird analysiert bezüglich der Mehrdeutigkeit von
Paaren von Wörtern,
welche die gewünschte
semantische Beziehung aufweisen. Paare von Wörtern, welche frei von Mehrdeutigkeit sind,
werden dann verwendet, um Einträge
zu erzeugen oder zu aktualisieren.
-
"Dictionary access
method with word occurrence",
IBM Technical Disclosure Bulletin, Vol. 38, Nr. 8, August 1995,
Seiten 365–6
offenbart ein neues Wörterbuchformat
und ein Verfahren des Zugreifens auf das Wörterbuch. Jeder Eintrag für jedes
Wort enthält
zusätzlich
zu einer Definition für
jede mögliche Bedeutung,
jegliche andere Wörter,
welche assoziiert sind mit dem "Schlag"-Wort, wenn es verwendet
wird, um diese Bedeutung zu haben. Auf das Wörterbuch wird mit dem Schlagwort
zugegriffen und der Text, welcher das Schlagwort enthält, wird überprüft auf das
Vorhandensein der assoziierten Wörter.
Wenn vorhanden, werden die assoziierten Wörter und Definitionen an den
Kopf der Liste für
diesen Eintrag verschoben.
-
Gemäß eines
ersten Aspekts der vorliegenden Erfindung, wird ein Verfahren bereitgestellt
zum Zugreifen auf eine Datenbank, umfassend eine Mehrzahl von Einträgen, wobei
jeder Eintrag einen Haupteintrag, welcher ein Schlagwort bzw. Anfangswort
bzw. eine Spitzmarke beinhaltet, umfasst und zumindest einer der
Einträge
einen ersten Nebeneintrag umfasst, welcher eine Mehrzahl von Sätzen bzw. Gruppen
von Wörtern
beinhaltet, von welchen jeder bzw. jedes mit dem Schlagwort assoziiert
werden kann, wobei das Verfahren die Schritte umfasst:
- (i) Eingeben des Abschnitts von Text umfassend eine Mehrzahl
von Wörtern;
- (ii) Lokalisieren des Eintrags, dessen Haupteintrag das Schlagwort
beinhaltet, welches einem ausgewählten
Wort des Abschnitts von Text entspricht;
- (iii) wo der lokalisierte Eintrag einen ersten Nebeneintrag
aufweist, welcher eine Mehrzahl von Sätzen bzw. Gruppen von Wörtern beinhaltet, Auswählen aus
dem ersten Nebeneintrag einer Gruppe von Wörtern, von welchen zumindest
ein Wort vorhanden ist in zumindest einem Teil des Abschnitts von
Text;
- (iv) Zuweisen zu der ausgewählten
Gruppe eines Präferenzwerts,
welcher bestimmt wird als eine Funktion der Wörter in der Gruppe; und
- (v) Wiederholen der Schritte (ii) bis (iv) für jedes Wort des Abschnitts
von Text.
-
Vorzugsweise
umfasst der Abschnitt von Text einen grammatikalisch vollständigen Abschnitt.
-
Vorzugsweise
umfasst der zumindest Teil des Abschnitts von Text N Wörter an
jeder Seite des ausgewählten
Worts, wobei N eine ganze Zahl größer oder gleich eins ist.
-
Die
Funktion kann der Kardinalität
der Gruppe entsprechen oder einer Eigenschaft von einem oder mehreren
Wörtern
in der Gruppe, wie die Wahrscheinlichkeit deren einzelnen oder gemeinsamen Auftretens.
-
Alternativ
oder zusätzlich
kann die Funktion der Wahrscheinlichkeit oder Frequenz der Verwendung
der Gruppe entsprechen.
-
In
einer Ausführungsform
ist die Datenbank ein mehrsprachiges Wörterbuch, wobei die Haupteinträge und die
ersten Nebeneinträge
Quellsprachenwörter
beinhalten, und jeder Eintrag weiter einen zweiten Nebeneintrag
umfasst, welcher zumindest eine Zielsprachenübersetzung des Schlagworts
beinhaltet. Das Mehrsprachenwörterbuch
kann ein umkehrbares zweisprachiges Wörterbuch sein.
-
Vorzugsweise
ist jede Zielsprachenübersetzung
assoziiert mit einer entsprechenden Gruppe von Wörtern in dem assoziierten ersten
Nebeneintrag. Weiter bevorzugt umfasst das Verfahren weiter die
Schritte des Auswählens
einer der Zielsprachenübersetzungen
und Sperren bzw. Verhindern der Auswahl einer Übersetzung von jedem Wort,
welcher in der Gruppe von Wörtern,
welche mit der ausgewählten Übersetzung
assoziiert ist bzw. sind, enthalten ist. Am meisten bevorzugt umfasst
das Verfahren den Schritt des Auswählens der Zielsprachenübersetzungen
für die
Wörter
des Abschnitts von Text in absteigender Reihenfolge der Präferenzwerte.
-
Vorzugsweise
umfasst das Verfahren die weiteren Schritte des Nichtauswählens der
ausgewählten
der Zielsprachenübersetzungen,
Nichtsperrens bzw.
-
Entsperrens
der Auswahl einer Übersetzung von
jedem Wort, welches in der Gruppe von Wörtern enthalten ist, welche
mit der ausgewählten Übersetzung
assoziiert ist bzw. sind, Auswählens
einer anderen der Zielsprachenübersetzungen
und Sperrens der Auswahl einer Übersetzung
von jedem Wort, welches in der Gruppe von Wörtern enthalten ist, welche mit
der ausgewählten
anderen Übersetzung
assoziiert ist bzw. sind.
-
Die
Datenbank kann ein maschinenlesbares Wörterbuch, ein Thesaurus oder
eine Enzyklopädie oder
ein Multimediawörterbuch
sein. Der maschinenlesbare Thesaurus kann ein umkehrbarer maschinenlesbarer
Thesaurus sein. Dem lokalisierten Eintrag kann im Wesentlichen dieselbe
linguistische Beugung gegeben werden, wie dem zumindest einem Wort,
welches in dem zumindest Teil des Abschnitts von Text vorhanden
ist. Die Datenbank kann auf einer CD-ROM gespeichert sein.
-
Gemäß eines
zweiten Aspekts der vorliegenden Erfindung wird eine Vorrichtung
bereitgestellt zum Zugreifen auf eine Datenbank, umfassend eine Mehrzahl
von Einträgen,
wobei jeder Eintrag einen Haupteintrag, welcher ein Schlagwort beinhaltet,
umfasst und zumindest einer der Einträge einen Nebeneintrag umfasst,
welcher eine Mehrzahl von Sätzen bzw.
Gruppen von Wörtern
beinhaltet, von welchen jeder bzw. jedes mit dem Schlagwort assoziiert
werden kann, wobei die Vorrichtung umfasst:
- (i)
eine Eingabeeinrichtung zum Eingeben eines Abschnitts von Text umfassend
eine Mehrzahl von Wörtern;
- (ii) eine Einrichtung zum Lokalisieren des Eintrags, dessen
Haupteintrag das Schlagwort beinhaltet, welches einem Wort des Abschnitts
von Text entspricht;
- (iii) eine Einrichtung zum Auswählen aus jedem ersten Nebeneintrag
eines Satzes bzw. der Gruppe von Wörtern, von welchen zumindest
ein Wort vorhanden ist in zumindest einem Teil des Abschnitts von
Text, wo der lokalisierte Eintrag einen ersten Nebeneintrag aufweist,
welcher eine Mehrzahl von Gruppen von Wörtern beinhaltet; und
- (iv) eine Zuweisungseinrichtung zum Zuweisen zu jeder ausgewählten Gruppe
eines Präferenzwerts als
eine Funktion der Wörter
in der Gruppe.
-
Vorzugsweise
umfasst der Abschnitt von Text einen grammatikalisch vollständigen Abschnitt.
-
Vorzugsweise
umfasst der zumindest Teil des Abschnitts von Text N Wörter an
jeder Seite des ausgewählten
Worts, wobei N eine ganze Zahl größer oder gleich eins ist.
-
Die
Funktion kann der Kardinalität
der Gruppe entsprechen, oder Eigenschaften von einem oder mehreren
Wörtern
in der Gruppe, wie die Wahrscheinlichkeit deren einzelnen oder gemeinsamen Auftretens.
-
Alternativ
oder zusätzlich
kann die Funktion der Wahrscheinlichkeit oder Frequenz der Verwendung
der Gruppe entsprechen.
-
In
einer Ausführungsform
ist die Datenbank ein elektronisches mehrsprachiges Wörterbuch,
wobei die Haupteinträge
und die ersten Nebeneinträge Quellsprachenwörter beinhalten,
und jeder Eintrag weiter einen zweiten Nebeneintrag umfasst, welcher zumindest
eine Zielsprachenübersetzung
des Schlagworts beinhaltet. Das Mehrsprachenwörterbuch kann ein umkehrbares
zweisprachiges Wörterbuch
sein.
-
Vorzugsweise
ist jede Zielsprachenübersetzung
assoziiert mit einer entsprechenden Gruppe von Wörtern in dem assoziierten ersten
Nebeneintrag. Weiter bevorzugt ist eine Einrichtung bereitgestellt
zum Auswählen
einer der Zielsprachenübersetzungen
und Sperren der Auswahl einer Übersetzung von
jedem Wort, welches in der Gruppe von Wörtern, welche mit der ausgewählten Übersetzung
assoziiert ist bzw. sind, enthalten ist. Am meisten bevorzugt wird
eine Einrichtung bereitgestellt zum Auswählen der Zielsprachenübersetzungen
für die
Wörter
des Abschnitts von Text in absteigender Reihenfolge der Präferenzwerte.
-
Vorzugsweise
ist eine Einrichtung zum Nichtauswählen der ausgewählten der
Zielsprachenübersetzungen
bereitgestellt, Nichtsperren der Auswahl einer Übersetzung von jedem Wort,
welches in der Gruppe von Wörtern
enthalten ist, welche mit der ausgewählten Übersetzung assoziiert ist bzw.
sind, Auswählen
einer anderen der Zielsprachenübersetzungen
und Sperren der Auswahl einer Übersetzung von
jedem Wort, welches in der Gruppe von Wörtern enthalten ist, welche
mit der ausgewählten
anderen Übersetzung
assoziiert ist bzw. sind.
-
Die
Datenbank kann ein maschinenlesbares Wörterbuch, Thesaurus, Enzyklopädie oder
Multimediawörterbuch
sein. Der maschinenlesbare Thesaurus kann ein umkehrbarer maschinenlesbarer
Thesaurus sein. Eine Erzeugungseinrichtung kann vorgesehen sein,
um dem lokalisierten Eintrag im Wesentlichen dieselbe linguistische
Beugung zu geben, wie dem zumindest einen Wort, welches in dem zumindest
Teil des Abschnitts von Text vorhanden ist. Die Datenbank kann auf
einer CD-ROM gespeichert sein.
-
Es
ist somit möglich,
eine Vorrichtung und ein Verfahren zum Zugreifen auf eine Datenbank
bereitzustellen, welche Einträge
erhalten, welche passend sind bezüglich einer bestimmten Anfrage
und dem Kontext.
-
Die
vorliegende Erfindung wird nun beispielhaft beschrieben mit Bezug
auf die begleitenden Zeichnungen, in welchen:
-
1 ein
Beispiel einer Datenstruktur gemäß einer
Ausführungsform
der vorliegenden Erfindung zeigt;
-
2 eine
Vorrichtung gemäß einer
Ausführungsform
der vorliegenden Erfindung zeigt;
-
3 ein
Flussdiagramm eines Verfahrens gemäß einer Ausführungsform
der vorliegenden Erfindung zur Verwendung mit der Vorrichtung von 2 ist;
-
4 ein
Flussdiagramm ist, welches einen Schritt des in 3 gezeigten
Verfahrens in größerem Detail
zeigt;
-
5 und 6 die
Datenstruktur von 1 beinhaltend Beispieldaten
zeigen;
-
7 einen
Nachschlagepuffer gemäß des Verfahrens
von 3 darstellt;
-
8 ein
Beispiel des Nachschlagepuffers von 7 in Übereinstimmung
mit einer anderen Ausführungsform
der vorliegenden Erfindung bezüglich
zweisprachiger Wörterbücher zeigt.
-
Die
Datenstruktur von 1 wird verwendet, um die verschiedenen
Einträge
in einer Datenbank 28 zu speichern (siehe 2).
Jeder Eintrag umfasst einen Haupteintrag beinhaltend ein Schlagwort 1 und einen
ersten Nebeneintrag 2, welcher Sätze bzw. Gruppen von Wörtern (Gruppe,
bis Gruppe3) umfasst, welche mit dem Schlagwort 1 assoziiert
werden können,
um eine linguistische Konstruktion bzw. einen linguistischen Aufbau
auszubilden. Wenn keine Gruppen von Wörtern, welche mit dem Schlagwort 1 kombiniert
werden können,
vorhanden sind, ist nichts in dem ersten Nebeneintrag 2 gespeichert.
Die Datenstruktur weist ebenfalls einen zweiten Nebeneintrag 3 auf,
welcher Definitionen Def1, Def2,
Def3 oder Zielsprachenübersetzungen, welche entsprechenden
Kombinationen des Schlagworts 1 und den Gruppen von Wörtern in
dem ersten Nebeneintrag 2 entsprechen, umfasst.
-
Die
Vorrichtung von 2 umfasst einen Eingabeanschluss
bzw. ein Eingabeendgerät 21 zum Eingeben
eines Abschnitts von Text, welcher abgefragt oder übersetzt
werden soll in eine Zielsprache. Alternativ kann eine andere Einrichtung,
welche einen Abschnitt von Text, z.B. ein Spracherkennungssystem
oder ein optischer Buchstabenleser bzw. Optical Character Reader
(OCR), verwendet werden. Das Eingabeendgerät 21 ist mit einem
Nachschlagepuffer 23 über
ein Reduktionsmodul 22 verbunden zum Segmentieren und Reduzieren
des Abschnitts von Text. Der Nachschlagepuffer 23 speichert
temporär
den Abschnitt von Text, welcher durch das Reduktionsmodul 22 segmentiert
und reduziert wurde, und ist mit einem Suchmodul 25 und
einem ersten Auswahlmodul 24 verbunden, wobei das Suchmodul 25 ebenfalls
mit einer Datenbank 28 verbunden ist. Das Suchmodul 25 und
der Nachschlagepuffer 23 sind mit einem zweiten Auswahlmodul 26 verbunden.
Der Nachschlagepuffer 23 ist ebenfalls mit einer Ausgabeeinrichtung 27,
z.B. einer Anzeige oder einem Drucker, verbunden über ein
Filtermodul 29, ein Neuanordnungsmodul 30 und
ein Erzeugungsmodul 31.
-
Die
vorstehend beschriebene Vorrichtung kann in Hardware oder Software
implementiert sein und integriert sein in ein elektronisches einsprachiges
Wörterbuch,
Thesaurus, Enzyklopädie,
zweisprachiges Wörterbuch
oder jede andere Vorrichtung, welche die Datenbank auf der Basis
eines Abschnitts von eingegebenem Text, z.B. von einem CD-ROM-System
durchsucht.
-
Bezug
nehmend auf 3, wird beim Betrieb ein grammatikalisch
vollständiger
Abschnitt von Text, z.B. ein Ausdruck, ein Halbsatz bzw. abhängiger Satz
oder ein Satz wie "John
made good use of his knowledge" durch
einen Nutzer (nicht gezeigt) eingegeben (Schritt S1) unter Verwendung
des Eingabeendgeräts 21.
Die Wörter,
welche den Abschnitt von Text umfassen, werden segmentiert oder
aufgebrochen in Wörter,
und zu ihren assoziierten Schlagwörtern (oder indizierten Begriffen)
reduziert, z.B. durch eine morphologische Analyse durch das Reduktionsmodul 22 (Schritt
S2). In dem Fall von "John made
good use of ist knowledge" ist
es nur notwendig, das Wort "made" zu "make" zu ändern. Der
reduzierte Text wird dann zu dem Nachschlagepuffer 23 übertragen
(S3). Das erste Wort in dem Nachschlagepuffer 23 wird dann
ausgewählt
durch das erste Auswahlmodul 24 (Schritt S4) und in der
Datenbank 28 gesucht durch das Suchmodul 25 (Schritt
S5). Wenn ein Eintrag gefunden wird, wird der Eintrag in dem Nachschlagepuffer
gespeichert und kommentiert bzw. vermerkt. Dieser Schritt des Suchens,
Speicherns und Kommentierens bzw. Vermerkens wird weiter im Folgenden
beschrieben.
-
Der
Nachschlagepuffer 23 wird dann überprüft auf nicht gesuchte Wörter (Schritt
S7) und wenn nicht gesuchte Wörter
existieren, werden sie wiederum ausgewählt (Schritt S8) und in der
Datenbank 28 gesucht (Schritt S5). Sobald alle Wörter in
dem Nachschlagepuffer 23 gesucht wurden, werden die Ergebnisse
zu dem Filtermodul 29, dem Neuanordnungsmodul 30 und
dem Erzeugungsmodul 31 gesendet, bevor sie angezeigt werden
oder an ein Anzeigemodul gesendet werden zum Abfragen durch den
Nutzer (Schritt S9).
-
Die
morphologische Analyse, welche durch das Reduktionsmodul 22 (Schritt
S2) durchgeführt wird,
reduziert nicht einfach ein Wort zu einem entsprechenden Infinitiv,
z.B. "made" zu "make", aber assoziiert
andere linguistische Information mit dem reduzierten Wort; z.B.
kann "made" reduziert werden auf "make past". Die zusätzliche
linguistische Information wird beibehalten, für den Fall, wo die Datenbank
ein Thesaurus oder ein zweisprachiges Wörterbuch ist. In solchen Fällen kann
es notwendig sein, ein gebeugtes Wort von der verfügbaren linguistischen
Information zu rekonstruieren, z.B. kann "make use of" reduziert werden auf "make past use of". Wenn die Datenbank
ein Thesaurus ist, kann der Eintrag, welcher gefunden wird für "made use of", das englische Wort "utilize", konvertiert werden
zu "utilize past"; das Erzeugungsmodul 31 führt solch eine
Umwandlung durch durch Anpassen des "past"-Zusatzes
an "utilize" um "utilized" zu erzeugen (wenn
durch den Nutzer benötigt).
Die Verwendung des Erzeugungsmoduls 31 sollte nicht auf
Fälle beschränkt sein,
in welchen die Datenbank ein Thesaurus ist.
-
Das
Filtermodul 29 kann mehr als einen Filter umfassen, z.B.
einen "Zusatzfilter" und/oder einen "Kontextfilter". Der Zusatzfilter
kann Zusätze
wie "past" (vorstehend beschrieben)
von dem Ergebnis bzw. den Ergebnissen, welche bzw. welches ausgegeben
werden soll bzw. sollen, entfernen. Zum Beispiel wird anstatt des
Anzeigens von "utilized
past" das Wort "utilize" einfach ausgegeben.
Der Kontextfilter wird verwendet, wenn benötigt durch den Nutzer, um Wörter von
dem Nachschlagepuffer 23 anzuzeigen, welche für eine Suche
relevant sind. Zum Beispiel, um die Übersetzung eines einzelnen
Worts in einem Satz zu bestätigen,
kann der Nutzer nur die Wörter
in dem Nachschlagepuffer 23 wollen, welche relevant sind
für die Übersetzung
des einzelnen Worts, welche angezeigt werden soll.
-
Das
Neuanordnungsmodul 30 ordnet die Suchergebnisse oder "Ziel-"Wörter neu, z.B. in einer Übersetzung,
um die geeignetste Wortreihenfolge zu erhalten. Ein Beispiel von
diesem ist "John
made good use of his knowledge" kann übersetzt
werden ins Französische
als "John bien utiliser
son connaisance".
Jedoch wäre
eine geeignetere und intuitivere Reihenfolge "John utiliser bien son connaisance".
-
Das
Suchen bzw. Durchsuchen der Datenbank 23, Speichern von
Einträgen
und Kommentieren (Schritt S5) wird nun mit Bezug auf 4 beschrieben.
-
Ein
Eintrag wird von der Datenbank 28 ausgewählt (Schritt
S10) und das Schlagwort 1 des Eintrags wird verglichen
mit dem Wort, welches aus dem Nachschlagepuffer 23 ausgewählt wurde,
zum Suchen (Schritt S11) durch das Suchmodul 25.
-
Wenn
eine Übereinstimmung
gefunden wird, wird der erste Nebeneintrag überprüft, um sicherzustellen, ob
er Einträge
enthält
oder nicht (Schritt S11a). Wenn kein Eintrag existiert, wird keine
weitere Maßnahme
durchgeführt,
und die Suche der Datenbank ist beendet bezüglich des aus dem Nachschlagepuffer 23 ausgewählten Worts.
Wenn, jedoch, ein Eintrag existiert, wird eine Gruppe von Wörtern aus dem
ersten Nebeneintrag ausgewählt
(Schritt S12) und der Nachschlagepuffer 23 wird durchsucht (Schritt
S13) durch das zweite Auswahlmodul 26 bezüglich der
Anwesenheit von diesen Wörtern
in dem Nachschlagepuffer 23. Wenn all die Wörter in
der Gruppe von Wörtern
in dem Nachschlagepuffer 23 gefunden werden, wird der erste
Nebeneintrag 2 überprüft, um sicherzustellen,
ob Gruppen von Wörtern übrig sind,
welche nicht gesucht wurden in dem Nachschlagepuffer 23 (Schritt
S14). Wenn Gruppen von Wörtern
existieren, welche noch nicht gesucht wurden, wird jede Gruppe von
Wörtern
wiederum ausgewählt
(Schritt S15) und gesucht (Schritt S13) bis keine ungesuchten Gruppen
von Wörtern
in dem ersten Nebeneintrag 2 verbleiben. Wenn beim Durchführen des
Schritts S13 eine Übereinstimmung
gefunden wird, werden das Schlagwort und die Gruppe von Wörtern in
dem ersten Nebeneintrag kommentiert und gespeichert (Schritt S16)
zur Anzeige durch die Ausgabeeinrichtung 27 oder Manipulation
durch den Nutzer. Die Suche gegen die Gruppe von Wörtern in
dem ersten Nebeneintrag 2 wird dann weitergeführt (Schritte
S14, S15, S13) bis keine ungesuchten Gruppen von Wörtern verbleiben.
-
Wenn
beim Vergleichen der Schlagwörter (Schritt
S11) eine Übereinstimmung
nicht gefunden wird zwischen dem Schlagwort 1 des bei Schritt
S10 ausgewählten
Eintrags und dem Wort aus dem Nachschlagepuffer 23, welcher
gesucht werden soll, wird die Datenbank 28 überprüft, um sicherzustellen,
ob irgendwelche Einträge
existieren deren Schlagwörter nicht
verglichen wurden mit dem zu suchenden Wort (Schritt S17). Wenn
keine ungesuchten Einträge
in der Datenbank 28 verbleiben, wird die Suche beendet.
Jedoch, wenn ungesuchte Einträge
in der Datenbank 28 verbleiben, wird ein anderer Eintrag
durch das Suchmodul 25 ausgewählt (Schritt S18) und gesucht
(Schritt S11). Es sollte beachtet werden, in dem Fall, wenn die
Datenbank 28 einzigartige Schlagworteinträge beinhaltet,
z.B. eine Enzyklopädie,
wird die Suche beendet, sobald das aus dem Nachschlagepuffer 23 ausgewählte Wort
gefunden ist (ohne Suchen irgendwelcher verbleibender, nicht gesuchter Einträge in der
Datenbank 28).
-
Bezug
nehmend auf 7, wenn der Beispielinhalt des
Nachschlagepuffers 23"John
make good use of his knowledge" gesucht
wird, wenn das Wort "make" gefunden wird, werden
vier mögliche Definitionen
gefunden, welche das Schlagwort 1 "make" beinhalten
("make", "make-up", "make it to", "make the grade"), wie aus 5 gesehen
werden kann. Jedoch ist nur eine der Definitionen geeignet, da die
anderen Gruppen von Wörtern
nicht in dem Nachschlagepuffer 23 vorhanden sind. Ähnlich wird das
Wort "good" nachgeschlagen und
dann das Wort "use". Zu diesem Zeitpunkt,
werden fünf
mögliche Gruppen
von Wörtern
für das
Wort "use" gefunden (siehe 6)
("use" [noun], "use" [verb], "use to", "use up", "make use of"), von welchen nur
drei geeignet sind aufgrund ihres Vorhandenseins in dem Nachschlagepuffer 23,
wobei der bemerkenswerteste von diesen der Eintrag "make use of" ist. Der Nachschlagepuffer 23 wird
aktualisiert mit den geeigneten Datenbankeinträgen, welche kommentiert werden mit
den Wörtern
in dem Nachschlagepuffer 23, auf welche sie sich beziehen.
-
Sobald
dies durchgeführt
wurde, kann ein Nutzer jedes Wort wiederum abfragen, z.B. mit der Hilfe
einer grafischen Nutzerschnittstelle bzw. Graphical User Interface
(GUI). Jedes Wort des Abschnitts von Text wird durch die GUI angezeigt.
Wenn ein Wort in dem Abschnitt von Text durch den Nutzer abgefragt
wird, wird der Nachfragepuffer 23 überprüft, um jegliche Kommentierungen
(Schlagwortzeiger) zu finden, welche mit dem abgefragten Wort assoziiert
sind. Der Nachschlagepuffer 23 wird dann gesucht bezüglich der
Anwesenheit von jeglichen kommentierten Einträgen, welche zu dem abgefragten
Wort zeigen. In dem Fall des Worts "make" in dem
vorliegenden Beispiel, wird ein Schlagwortzeiger gefunden für das Wort "make" und ein Wortzeiger wird
gefunden für
die Konstruktion "make
use of" ("use2,5").
-
Die
Wörter
können
in der Reihenfolge des Vorzugs gelistet werden, wobei das Kriterium
für den Vorzug
die Anzahl von Wörtern
in der Gruppe von Wörtern
in dem ersten Nebeneintrag 2 ist; wobei größere Nummern
einen höheren
Vorzug anzeigen würden.
Somit kann für
einen Eintrag, welcher nur das Schlagwort umfasst, der Vorzugswert
gleich eins sein. Wenn es X Anzahl von Wörtern in einer Gruppe, welche
mit dem Schlagwort assoziiert ist, gibt, kann ein Vorzugswert von
(X + 1) für
diese Gruppe gegeben werden. Wo die Gruppen oder Kombinationen von
Wörtern
angezeigt werden zur Nutzerauswahl, können sie in absteigender Reihenfolge
von Vorzugswerten angezeigt werden.
-
Bezug
nehmend auf 8, kann das vorstehende Beispiel
ausgeweitet werden, um zweisprachige oder mehrsprachige Wörterbücher zu
umfassen. Dem Nutzer kann die Option des Auswählens einer Zielsprache gegeben
werden.
-
Wie
vorher, wird der Abschnitt von Text auf Wörter und Schlagwörter reduziert
und dann zu dem Nachschlagepuffer 23 übertragen. Jedes Wort wird gesucht
und mögliche Übersetzungen
(Datenbankeinträge)
für jedes
Wort werden in dem Nachschlagepuffer 23 gespeichert und,
wo geeignet, werden die Einträge
kommentiert auf welche Wörter
in dem Nachschlagepuffer 23 sie sich beziehen.
-
Als
ein Beispiel, wird die Übersetzung
des Satzes "John
make good use of his knowledge" ins Französische wie
folgt ausgeführt.
Zunächst
wird jedes Wort reduziert auf sein Wörterbuchschlagwort, d.h. "John make good use
of his knowledge",
und an den Nachschlagpuffer 23 übertragen. Jedes Wort in dem
Nachschlagepuffer 23 wird in einem Wörterbuch (der Datenbank 28)
gesucht. Die möglichen Übersetzungen
(Einträge)
für jedes
Wort werden unterhalb der entsprechenden Wörter in der Tabelle in 8 gezeigt.
Die tiefgestellten Nummern repräsentieren eine
Kommentierung bezüglich
welche Wörter
in dem Nachschlagepuffer 23 einem besonderen französischen
Wort entsprechen. Zum Beispiel bezieht sich das Verb "utiliser" ebenfalls auf die
Wörter "make" und "of" zusätzlich zu
dem Wort "use".
-
Sobald
alle möglichen Übersetzungen
für jedes
Wort in dem Abschnitt von Text gefunden wurden, kann der Nutzer
die Ergebnisse abfragen. Es ist möglich, dem Benutzer eine Aufzählung von
allen konsistenten Alternativen bereitzustellen, aber es ist bevorzugt,
ein Menü von
Alternativen für
jedes Wort bereitzustellen, da dies die Anzahl von zu listenden Alternativen
reduziert.
-
Wenn
der Nutzer eine Übersetzung
auswählt,
welche dem Schlagwort entspricht und eine Gruppe beinhaltend zumindest
ein Wort von dem ersten Nebeneintrag, kann eine Auswahl von Übersetzungen
von jedem Wort, welches in der Gruppe beinhaltet ist, gehemmt werden,
da solche Wörter
bereits abgedeckt wurden durch die ausgewählte Übersetzung. Wenn der Nutzer
entscheidet, diese Übersetzung
abzuwählen
bzw. nicht auszuwählen
und einer andere Übersetzung
auszuwählen,
wird die Hemmung bzw. Blockierung entfernt und wenn die andere Übersetzung
sich auf einen Satz bzw. eine Gruppe, welche zumindest ein Wort
beinhaltet, bezieht, dann wird die Übersetzung des oder jedes Worts
der Gruppe wiederum blockiert bzw. gehemmt.
-
Obwohl
solch eine Auswahl manuell durchgeführt werden kann, ist es möglich, Auswahlen
automatisch durchzuführen,
wo den verschiedenen Gruppen von Wörtern Vorzugswerte zugewiesen wurden.
Zum Beispiel können
all die Wörter
verwendet werden, um auf das Wörterbuch
zuzugreifen, um eine oder mehrere Kombinationen entsprechend jedem
Wort zu ermöglichen.
Diese Kombinationen sind in absteigender Reihenfolge des Vorzugs
angeordnet und die höchste
Präferenzkombination
wird ursprünglich
ausgewählt.
Wörter,
welche in der Gruppe enthalten sind, welche mit dem relevanten Schlagwort
assoziiert ist, werden dann blockiert vom weiteren Teilnehmen in
dem Verfahren. Aus den verbleibenden verfügbaren Gruppen von Wörtern, wird
diejenige mit dem höchsten
Vorzugswert ausgewählt, usw.
Solch eine Technik kann verändert
werden bei einem mehrsprachigen Wörterbuch, um eine Grundform
einer automatischen Übersetzung
bereitzustellen, obwohl eine weitere Intervention bzw. ein weiterer
Eingriff wohl benötigt
werden kann, um eine endgültige Übersetzung
zu erzeugen. Zum Beispiel, um auf das Wörterbuch zuzugreifen, können die
in dem Nachschlagepuffer eingetragenen Wörter zunächst auf Grundformen reduziert
worden sein. Zum Beispiel, können
Verben in die Infinitivform verändert worden
sein und Substantive können
Einzahl gemacht worden sein. Die ursprüngliche Übersetzung kann ebenfalls Grundformen
beinhalten, so dass z.B. Verben dekliniert werden müssen, bevor
ein erster Anlauf bei einer endgültigen Übersetzung
vollendet ist.
-
Der
Nutzer kann in dieses Verfahren intervenieren, z.B., um Gruppen
oder Kombinationen von Wörtern
mit niedrigeren Vorzugswerten auszuwählen. Jedoch stellt das System
sicher, dass ein Wort in dem Abschnitt von Text nicht zweimal verwendet
werden kann, um Inkonsistenzen zu vermeiden.
-
Das
mehrsprachige Wörterbuch
kann ein umkehrbares Wörterbuch
sein, z.B. zum Übersetzen vom
Englischen ins Französische.
Ein Beispiel eines Eintrags ist:
Make *use of <=> * utiliser
wo "use" das englische Schlagwort
ist, welches mit einer Anzahl von ersten Nebeneinträgen assoziiert ist,
wie vorstehend beschrieben, und ein zweiter Nebeneintrag von "utiliser", und "utiliser" das französische Schlagwort
ist, welches keine ersten Nebeneinträge aufweist, aber einen zweiten
Nebeneintrag von "make
use of". Somit,
wenn es gefunden wurde in dem Kontext von "make" und "of", kann "make use of" übersetzt werden als "utiliser". Ähnlich kann "utiliser", wenn gefunden, übersetzt
werden als "make
use of".
-
Wenn
die Datenbank ein Thesaurus ist, können die Datenbankeinträge sein:
*make
use of <=> utilise
*make
(verb) <=> construct
*make
(noun) <=> trademark
*use
(verb) <=> employ
-
Das
Sternchen bezeichnet ein Schlagwort und die Wörter auf der rechten Seite
von dem <=>-Symbol sind zweite
Nebeneinträge.
Die Wörter auf
der linken Seite, welche nicht mit einem Sternchen markiert sind,
und welche nicht in Klammern sind, sind erste Nebeneinträge.
-
Die
Schlagwörter
können
ebenfalls kommentiert sein, um die Eigenschaften des Worts zu beschreiben.
Beispiele von Kommentierungen sind vorstehend in Klammern gezeigt.
-
Zusätzlich kann
der Thesaurus ein umkehrbarer Thesaurus sein analog zu dem vorstehend
beschriebenen umkehrbaren Wörterbuch.
-
Eine
alternative Anwendung der Datenbank ist ein Verwendungsprüfer. In
solch einer Anwendung kann der zweite Nebeneintrag eine Folge von
Text beinhalten. Zum Beispiel:
*make use of <=> "consider using just 'use'''
-
Wenn
die Datenbank ein einsprachiges Wörterbuch ist, kann der zweite
Nebeneintrag einen Zeiger beinhalten, z.B.
*make use of <=> p245
wo p245
ein Zeiger oder ein Index ist zu einem Eintrag in einem Wörterbuch,
welches z.B. in einem Speicher oder einer CD-ROM gespeichert ist.
Solche Zeiger können
auf verschiedene Typen von Einträgen
zeigen, z.B. Text, Ton oder Filme. Zusätzlich können Wörter, Text und Zeiger gleichzeitig
als zweite Nebeneinträge
gespeichert werden. Die Datenbank 28 kann deshalb eine
Multimediaenzyklopädie
sein.