-
Hintergrund
-
Gebiet
-
Das
offenbarte und beanspruchte Konzept betrifft im Allgemeinen tragbare
bzw. handgehaltene elektronische Vorrichtungen (handheld electronic
devices) und insbesondere eine tragbare elektronische Vorrichtung,
die eine reduzierte Tastatur und eine Text-Eingabe-Disambiguierungsfunktion
hat, die Kontextdaten verwenden kann.
-
Hintergrundinformation
-
Zahlreiche
Typen von tragbaren elektronischen Vorrichtungen sind bekannt. Beispiele
derartiger tragbarer elektronischer Vorrichtungen umfassen zum Beispiel
persönliche Datenassistenten (PDAs – personal
data assistants), tragbare Computer, Zweiweg-Pager, zellulare Telefone
und dergleichen. Viele tragbare elektronische Vorrichtungen weisen
auch eine drahtlose Kommunikationsfähigkeit auf, obwohl viele
derartige tragbare elektronische Vorrichtungen unabhängige
Vorrichtungen sind, die ohne Kommunikation mit anderen Vorrichtungen
funktional sind.
-
Derartige
tragbare elektronische Vorrichtungen sollen im Allgemeinen tragbar
sein und haben folglich eine relativ kompakte Konfiguration, in
der Tasten und andere Eingabestrukturen häufig mehrfache
Funktionen unter bestimmten Um ständen durchführen
oder anderweitig mehrere Aspekte oder Eigenschaften zugewiesen haben.
Mit Fortschritten in der Technologie werden tragbare elektronische
Vorrichtungen hergestellt, um immer kleinere Formfaktoren zu haben,
und dennoch eine immer größere Anzahl von Anwendungen
und Eigenschaften darauf zu haben. In der Praxis können
die Tasten eines Tastaturfelds nur auf eine bestimmte kleine Größe
verringert werden, bevor die Tasten relativ unbrauchbar werden.
Um eine Texteingabe zu ermöglichen, muss jedoch ein Tastaturfeld
zum Beispiel zur Eingabe aller sechsundzwanzig Buchstaben des lateinischen
Alphabets sowie einer passenden Interpunktion und anderer Symbole
fähig sein.
-
Eine
Art des Vorsehens von zahlreichen Buchstaben in einem kleinen Raum
war, eine „reduzierte Tastatur" vorzusehen, in der mehrere
Buchstaben, Symbole und/oder Zahlen und dergleichen, jeder gegebenen
Taste zugewiesen werden. Zum Beispiel umfasst ein Tasten(touch-tone)-Telefon
ein reduziertes Tastaturfeld durch Vorsehen von zwölf Tasten,
von denen zehn Zahlen darauf haben und von diesen zehn Tasten haben
acht lateinische Buchstaben zugewiesen. Zum Beispiel umfasst eine
der Tasten die Zahl „2" sowie die Buchstaben „A", „B"
und „C". Andere bekannte reduzierte Tastaturen umfassten
andere Anordnungen für Tasten, Buchstaben, Symbole, Zahlen
und dergleichen. Da eine einzige Betätigung einer derartigen
Taste von dem Benutzer vorgesehen sein kann, sich möglicherweise
auf einen der Buchstaben „A", „B" und „C"
zu beziehen und sich möglicherweise auch auf die Zahl „2"
beziehen soll, ist die Eingabe im Allgemeinen eine vieldeutige (ambiguous)
Eingabe und bedarf eines Typs einer Disambiguierung, um für
Texteingabezwecke nützlich zu sein.
-
Um
einem Benutzer zu ermöglichen, die mehrfachen Buchstaben,
Zahlen und dergleichen auf jeder gegebenen Taste zu verwenden, wurden
zahlreiche Tastenanschlags-Interpretationssysteme vorgesehen. Zum
Beispiel ermöglicht ein „Mehrfach-Tippen(multi-tap)"-System
einem Benutzer, im Wesentlichen eindeutig ein bestimmtes Zeichen
auf einer Taste zu spezifizieren durch Drücken derselben
Taste mehrere Male, äquivalent zu der Position des gewünschten
Zeichens auf der Taste. Ein anderes beispielhaftes Tastenanschlags-Interpretationssystem umfasst
ein Tasten-„Chording", von dem verschiedene Typen existieren.
Zum Beispiel kann ein bestimmtes Zeichen eingegeben werden durch
Drücken zweier Tasten hintereinander oder durch Drücken
und Halten einer ersten Taste, während eine zweite Taste gedrückt
wird. Ein weiteres beispielhaftes Tastenanschlags-Interpretationssystem
ist eine „Drücken-und-Halten/Drücken-und-Freigabe"-Interpretationsfunktion,
in der eine gegebene Taste ein erstes Resultat liefert, wenn die
Taste betätigt und sofort losgelassen wird, und ein zweites
Resultat liefert, wenn die Taste für eine kurze Zeitdauer
betätigt und gehalten wird. Ein weiteres Tastenanschlags-Interpretationssystem,
das eingesetzt wurde, ist eine Software-basierte Text-Disambiguierungsfunktion.
In solch einem System drückt ein Benutzer typischerweise Tasten,
denen ein oder mehrere Zeichen zugewiesen wurden, im Allgemeinen
wird jede Taste ein Mal für jeden gewünschten
Buchstaben gedrückt, und die Disambiguierungs-Software
versucht, die beabsichtigte Eingabe vorauszusagen. Zahlreiche derartige Systeme
wurden vorgeschlagen und während viele für ihre
beabsichtigten Zwecken im Allgemeinen effektiv waren, existieren
weiter Defizite.
-
Es
wäre wünschenswert, eine verbesserte tragbare
elektronische Vorrichtung mit einer reduzierten Tastatur vorzusehen,
die versucht, eine QWERTY-Tastatur-Erfahrung oder eine andere bestimmte Tastaturerfahrung
zu imitieren. Solch eine verbesserte tragbare elektronische Vorrichtung
kann auch wünschenswerterweise konfiguriert werden mit
ausreichenden Eigenschaften, um eine Texteingabe und andere Aufgaben
mit relativer Mühelosigkeit zu ermöglichen.
-
KURZE BESCHREIBUNG DER ZEICHNUNGEN
-
Ein
vollständiges Verständnis des offenbarten und
beanspruchten Konzepts kann aus der folgenden Beschreibung gewonnen
werden, wenn in Verbindung mit den beigefügten Zeichnungen
gelesen, wobei:
-
1 eine
Draufsicht auf eine verbesserte tragbare elektronische Vorrichtung
gemäß dem offenbarten und beanspruchten Konzept
ist;
-
2 eine
schematische Darstellung der verbesserten tragbaren elektronischen
Vorrichtung der 1 ist;
-
2A eine
schematische Darstellung eines Teils der tragbaren elektronischen
Vorrichtung von 2 ist;
-
3A, 3B und 3C ein
beispielhaftes Flussdiagramm sind, das bestimmte Aspekte einer Disambiguierungsfunktion
darstellt, die auf der tragbaren elektronischen Vorrichtung der 1 ausgeführt
werden kann;
-
4 ein
weiteres beispielhaftes Flussdiagramm ist, das bestimmte Aspekte
eines Lernverfahrens darstellt, das auf der tragbaren elektronischen Vorrichtung
ausgeführt werden kann;
-
5 eine
beispielhafte Ausgabe während eines Texteingabebetriebs
ist;
-
6 eine
weitere beispielhafte Ausgabe während eines anderen Teils
des Texteingabebetriebes ist;
-
7 eine
weitere beispielhafte Ausgabe während eines anderen Teils
des Texteingabebetriebes ist;
-
8 eine
weitere beispielhafte Ausgabe während eines anderen Teils
des Texteingabebetriebes ist;
-
9 ein
beispielhaftes Flussdiagramm ist, das die Verwendung von Kontextdaten
während eines Texteingabebetriebes darstellt.
-
Ähnliche
Ziffern beziehen sich auf ähnliche Teile in der Spezifikation.
-
BESCHREIBUNG
-
Eine
verbesserte tragbare elektronische Vorrichtung
4 wird allgemein
in der
1 gezeigt und wird schematisch in der
2 dargestellt.
Die beispielhafte tragbare elektronische Vorrichtung
4 umfasst
ein Gehäuse
6, auf dem eine Prozessoreinheit angebracht
ist, die eine Eingabevorrichtung
8, eine Ausgabevorrichtung
12,
einen Prozessor
16 und einen Speicher
20 umfasst
und zumindest eine erste Routine. Der Prozessor
16 kann
zum Beispiel und ohne Einschränkung ein Mikroprozessor
(μP) sein und reagiert auf Eingaben von der Eingabevorrichtung
8 und
liefert Ausgabesignale an die Ausgabevorrichtung
12. Der
Prozessor
16 ist auch mit dem Speicher
20 verbunden.
Der Prozessor
16 und der Speicher
20 bilden zusammen
eine Prozessorvorrichtung. Beispiele von tragbaren elektronischen
Vorrichtungen sind in den
U.S.-Patenten
Nr. 6,452,588 und
6,489,950 enthalten.
-
Wie
aus der 1 offensichtlich ist, umfasst die
Eingabevorrichtung 8 ein Tastaturfeld 24 und ein Thumbwheel 32.
Wie detaillierter unten beschrieben wird, ist das Tastaturfeld 24 in
der beispielhaften Form einer reduzierten QWERTY-Tastatur einschließlich
einer Vielzahl von Tasten 28, die als Eingabeelemente dienen.
Es wird jedoch angemerkt, dass das Tastaturfeld 24 andere
Konfigurationen haben kann, wie eine AZERTY-Tastatur, eine QWERTZ-Tastatur
oder eine andere Tastaturanordnung, ob momentan bekannt oder unbekannt
und entweder reduziert oder nicht reduziert. Wie hierin eingesetzt,
sollen der Ausdruck „reduziert" und Variationen davon in
dem Kontext einer Tastatur, eines Tastaturfelds oder einer anderen
Anordnung von Eingabeelementen breit auf eine Anordnung verweisen, in
der zumindest einem der Eingabeelemente eine Vielzahl von linguistischen
Elementen zugewiesen ist, wie zum Beispiel Zeichen in dem Satz von
lateinischen Buchstaben, wobei eine Betätigung des zumindest
einen der Eingabeelemente, ohne eine andere Eingabe in Kombination
damit, eine vieldeutige Eingabe ist, da sie mehr als eines der Vielzahl
der zugewiesenen linguistischen Ele mente betreffen kann. Wie hierin
eingesetzt, sollen der Ausdruck „linguistisches Element"
und Variationen davon breit auf jedes Element verweisen, das selbst
ein Sprachobjekt sein kann oder aus welchem ein Sprachobjekt konstruiert, identifiziert
oder anderweitig erhalten werden kann, und umfasst folglich zum
Beispiel und ohne Einschränkung Zeichen, Buchstaben, Anschläge,
Ideogramme, Phoneme, Morpheme, Zahlen und dergleichen. Wie hierin
eingesetzt, sollen der Ausdruck „Sprachobjekt" und Variationen
davon breit auf jeden Typ von Objekt verweisen, der aus einem oder
mehreren linguistischen Elementen konstruiert, identifiziert oder
anderweitig erhalten werden kann, die alleine oder in Kombination
verwendet werden können, um Text zu erzeugen, und das umfasst
zum Beispiel und ohne Einschränkung Wörter, Abkürzungen, Symbole,
Ideogramme und dergleichen.
-
Die
Systemarchitektur der tragbaren elektronischen Vorrichtung 4 ist
vorteilhafterweise organisiert, um unabhängig von dem spezifischen
Layout des Tastaturfelds 24 betriebsfähig zu sein.
Demgemäß kann die Systemarchitektur der tragbaren
elektronischen Vorrichtung 4 in Verbindung mit praktisch jedem
Tastaturfeld-Layout eingesetzt werden, im Wesentlichen ohne eine
bedeutsame Änderung in der Systemarchitektur zu erfordern.
Es wird weiter angemerkt, dass bestimmte der Eigenschaften, die
hierin dargelegt werden, entweder auf einer oder auf beiden einer
reduzierten Tastatur und einer nicht reduzierten Tastatur verwendbar
sind.
-
Die
Tasten 28 sind auf einer Vorderseite des Gehäuses 6 angeordnet
und das Thumbwheel 32 ist an einer Seite des Gehäuses 6 angeordnet.
Das Thumbwheel 32 kann als ein weiteres Eingabeelement
dienen und ist sowohl drehbar, wie durch den Pfeil 34 angezeigt
wird, um Auswahleingaben an den Prozessor 16 zu liefern,
und kann auch gedrückt werden in eine Richtung im Allgemeinen
zum Gehäuse 6 hin, wie durch den Pfeil 38 angezeigt
wird, um eine andere Auswahleingabe an den Prozessor 16 zu
liefern.
-
Wie
in 1 weiter gesehen werden kann, umfassen viele der
Tasten 28 eine Anzahl von darauf angeordneten linguistischen
Elementen 48. Wie hierin eingesetzt, soll der Ausdruck „eine
Anzahl von" und Variationen davon breit auf jede Quantität
verweisen, einschließlich einer Quantität von
eins. In der beispielhaften Darstellung des Tastaturfelds 24 umfassen
viele der Tasten 28 zwei zugewiesene linguistische Elemente,
wie Umfassen eines ersten linguistischen Elements 52 und
eines zweiten linguistischen Elements 56.
-
Eine
der Tasten 28 des Tastaturfelds 24 umfasst als
die Zeichen 48 davon die Buchstaben „Q" und „W",
und eine angrenzende Taste 28 umfasst als die Zeichen 48 davon
die Buchstaben „E" und „R". Es ist zu sehen, dass
die Anordnung der Zeichen 48 auf den Tasten 28 des
Tastaturfelds 24 im Allgemeinen eine QWERTY-Anordnung ist,
wenngleich viele der Tasten 28 zwei der Zeichen 28 umfassen.
-
Die
Ausgabevorrichtung 12 umfasst eine Anzeige 60,
auf der eine Ausgabe 64 vorgesehen werden kann. Eine beispielhafte
Ausgabe 64 wird auf der Anzeige 60 in der 1 dargestellt.
Die Ausgabe 64 umfasst eine Textkomponente 68 und
eine Varianten-Komponente 72. Die Varianten-Komponente 72 umfasst
einen Standard-Teil 76 und einen Varianten-Teil 80.
Die Anzeige umfasst auch ein Caret-Zeichen 84, das im Allgemeinen
darstellt, wo die nächste Eingabe von Eingabevorrichtung 8 empfangen wird.
-
Die
Textkomponente 68 der Ausgabe 64 liefert eine
Darstellung des Standard-Teils 76 der Ausgabe 64 an
einer Position auf der Anzeige 60, wo der Text eingegeben
wird. Die Varianten-Komponente 72 wird im Allgemeinen in
der Nähe der Textkomponente 68 angeordnet und
liefert, zusätzlich zu der standardmäßigen
vorgeschlagenen Ausgabe 76, eine Darstellung der verschiedenen
alternativen Textwahlmöglichkeiten, d. h. Alternativen
zu der standardmäßigen vorgeschlagenen Ausgabe 76,
die durch eine Eingabe-Disambiguierungsfunktion in Reaktion auf eine
Eingabesequenz von Tastenbetätigungen der Tasten 28 vorgeschlagen
werden.
-
Wie
detaillierter unten beschrieben wird, wird der Standard-Teil 76 durch
die Disambiguierungsfunktion vorgeschlagen als die wahrscheinlichste
disambiguierte Interpretation der vieldeutigen Eingabe, die durch
den Benutzer vorgesehen ist. Der Varianten-Teil 80 umfasst
eine vorgegebene Quantität von alternativen vorgeschlagenen
Interpretationen derselben vieldeutigen Eingabe, aus denen der Benutzer
wählen kann, wenn gewünscht. Es wird angemerkt,
dass der beispielhafte Varianten-Teil 80 hierin dargestellt
wird als sich vertikal unter den Standard-Teil 76 erstreckend,
aber es ist offensichtlich, dass zahlreich andere Anordnungen vorgesehen werden
können.
-
Der
Speicher 20 wird schematisch in der 2A dargestellt.
Der Speicher 20 kann jeder einer Vielzahl von Typen von
internen und/oder externen Speichermedien sein, wie, ohne Einschränkung, RAM,
ROM, EPROM(s), EEPROM(s) und dergleichen, die ein Speicherregister
zur Datenspeicherung vorsehen, wie in der Art eines internen Speicherbereichs
eines Computers, und kann ein volatiler Speicher oder ein nicht-volatiler
Speicher sein. Der Speicher 20 umfasst zusätzlich
eine Anzahl von Routinen, die allgemein mit dem Bezugzeichen 22 dargestellt werden,
für die Verarbeitung von Daten. Die Routinen 22 können
in jeder einer Vielzahl von Formen sein, wie, ohne Einschränkung,
Software, Firmware und dergleichen. Wie detaillierter unten erklärt
wird, umfassen die Routinen 22 die vorher erwähnte
Disambiguierungsfunktion als eine Anwendung sowie andere Routinen.
-
Wie
aus der 2A zu verstehen ist, umfasst
der Speicher 20 zusätzlich Daten, die in einer Anzahl
von Tabellen, Sätzen, Listen und/oder anderweitig gespeichert
und/oder organisiert sind. Spezifisch umfasst der Speicher 20 eine
generische Wortliste 88, eine „neue Wörter"-Datenbank 92,
eine andere Datenquelle 99 und eine Kontextdaten-Tabelle 49.
-
In
den verschiedenen Bereichen des Speichers 20 ist eine Anzahl
von Sprachobjekten 100 und Häufigkeitsobjekten 104 gespeichert.
Die Sprachobjekte 100 gehören im Allgemeinen jeweils
zu einem zugehörigen Häufigkeitsobjekt 104.
Die Sprachobjekte 100 umfassen in dem vorliegenden beispielhaften
Ausführungsbeispiel eine Vielzahl von Wortobjekten 108 und
eine Vielzahl von N-Gramm-Objekten 112. Die Wortobjekte 108 sind
allgemein repräsentativ für komplette Wörter
in der Sprache oder kundenspezifische Wörter, die in dem
Speicher 20 gespeichert sind. Wenn zum Beispiel die in
dem Speicher gespeicherte Sprache zum Beispiel Englisch ist, repräsentiert
im Allgemeinen jedes Wortobjekt 108 ein Wort in der englischen
Sprache oder repräsentiert ein kundenspezifisches Wort.
-
Zu
im Wesentlichen jedem Wortobjekt 108 gehört ein
Häufigkeitsobjekt 104, das einen Häufigkeitswert
hat, der die relative Häufigkeit innerhalb der relevanten
Sprache des gegebenen Wortes anzeigt, das durch das Wortobjekt 108 repräsentiert
wird. In dieser Hinsicht umfasst die generische Wortliste 88 einen
Korpus von Wortobjekten 108 und zugehörigen Häufigkeitsobjekten 104,
die zusammen eine breite Vielfalt von Wörtern und ihre
relative Häufigkeit in einer gegebenen Umgangssprache von
zum Beispiel einer gegebenen Sprache darstellen. Die generische Wortliste 88 kann
auf eine einer breiten Vielfalt von Arten abgeleitet werden, wie
durch Analysieren zahlreicher Texte und anderer Sprachquellen, um
die verschiedenen Wörter innerhalb der Sprachquellen sowie
ihre relativen Wahrscheinlichkeiten, d. h. relativen Häufigkeiten,
des Auftretens der verschiedenen Wörter in den Sprachquellen
zu bestimmen.
-
Die
N-Gramm-Objekte 112, die in der generischen Wortliste 88 gespeichert
sind, sind kurze Ketten von Zeichen in der relevanten Sprache, typischerweise
zum Beispiel ein bis drei Zeichen in der Länge und repräsentieren
typischerweise Wortfragmente in der relevanten Sprache, obwohl bestimmte
der N-Gramm-Objekte 112 zusätzlich selbst Wörter
sein können. Jedoch zu dem Ausmaß, dass ein N-Gramm-Objekt 112 auch
ein Wort in der relevanten Sprache ist, wird das selbe Wort wahrscheinlich
separat gespeichert als ein Wortobjekt 108 in der generischen
Wortliste 88. Wie hier eingesetzt, sollen der Ausdruck „Kette
(string)" und Variationen davon breit auf ein Objekt verweisen,
das ein oder mehrere Zeichen oder Komponenten hat, und kann sich
auf eines eines kompletten Wortes, eines Fragments eines Wortes,
eines kundenspezifischen Wortes oder eines Ausdrucks und dergleichen
beziehen.
-
In
dem vorliegenden beispielhaften Ausführungsbeispiel der
tragbaren elektronischen Vorrichtung 4 umfassen die N-Gramm-Objekte 112 1-Gramm-Objekte,
d. h. Ketten- bzw. String-Objekte, die ein Zeichen in der Länge
sind, 2-Gramm-Objekte, d. h. String-Objekte, die zwei Zeichen in
der Länge sind, und 3-Gramm-Objekte, d. h. String-Objekte,
die drei Zeichen in der Länge sind, die kollektiv als N-Gramme 112 bezeichnet
werden. Im Wesentlichen gehört jedes N-Gramm-Objekt 112 in
der generischen Wortliste 88 ähnlich zu einem
zugehörigen Häufigkeitsobjekt 104, das
in der generischen Wortliste 88 gespeichert ist, aber das
Häufigkeitsobjekt 104, das zu einem gegebenen
N-Gramm-Objekt 112 gehört, hat einen Häufigkeitswert,
der die relative Wahrscheinlichkeit anzeigt, dass der Zeichen-String, der
durch das bestimmte N-Gramm-Objekt 112 repräsentiert
wird, an jeder Position in jedem Wort der relevanten Sprache existiert.
Die N-Gramm-Objekte 112 und die zugehörigen Häufigkeitsobjekte 104 sind ein
Teil des Korpus der generischen Wortliste 88 und werden
auf eine Art erlangt, die ähnlich ist zu der Art, auf die
das Wortobjekt 108 und die zugehörigen Häufigkeitsobjekte 104 erlangt
werden, obwohl die Analyse, die bei der Erlangung der N-Gramm-Objekte 112 durchgeführt
wird, etwas unterschiedlich ist, da sie eine Analyse der verschiedenen
Zeichen-Strings in den verschiedenen Wörter umfasst, statt
sich hauptsächlich auf das relative Auftreten eines gegebenen
Wortes zu verlassen.
-
Das
vorliegende beispielhafte Ausführungsbeispiel der tragbaren
elektronischen Vorrichtung 4, deren beispielhafte Sprache
die englische Sprache ist, umfasst sechsundzwanzig 1-Gramm-N-Gramm-Objekte 112,
d. h. ein 1-Gramm-Objekt für jeden der sechsundzwanzig Buchstaben
im lateinischen Alphabet, auf dem die englische Sprache basiert,
und umfasst weiter 676 2-Gramm-N-Gramm-Objekte 112, d.
h. sechsundzwanzig hoch zwei, wodurch jede zwei-Buchstaben-Permutation
der sechsundzwanzig Buchstaben in dem lateinischen Alphabet dargestellt
wird.
-
Die
N-Gramm-Objekte 112 umfassen auch eine bestimmte Quantität
von 3-Gramm-N-Gramm-Objekten 112, primär diejenigen,
die eine relativ hohe Häufigkeit in der relevanten Sprache
haben. Das beispielhafte Ausführungsbeispiel der tragbaren
elektronischen Vorrichtung 4 umfasst weniger als alle der
Drei-Buchstaben-Permutationen der sechsundzwanzig Buchstaben des
lateinischen Alphabets aufgrund von Berücksichtigungen einer
Datenspeichergröße und auch, da die 2-Gramm-N-Gramm-Objekte 112 bereits
eine bedeutsame Menge von Information hinsichtlich der relevanten
Sprache liefern können. Wie detaillierter unten dargelegt
wird, liefern die N-Gramm-Objekte 112 und ihre zugehörigen
Häufigkeitsobjekte 104 Häufigkeitsdaten,
die Zeichen-Strings zugeschrieben werden können, für
die ein entsprechendes Wortobjekt 108 nicht identifiziert
werden kann oder nicht identifiziert wurde, und wird typischerweise
als eine Rückfall-Datenquelle eingesetzt, obwohl dies nicht
exklusiv der Fall sein muss.
-
In
dem vorliegenden beispielhaften Ausführungsbeispiel werden
die Sprachobjekte 100 und die Häufigkeitsobjekte 104 im
Wesentlichen unberührt in der generischen Wortliste 88 gepflegt,
was bedeutet, dass das grundlegende Sprachenlexikon in der generischen
Wortliste 88 im Wesentlichen unverändert bleibt,
und die Lernen-Funktionen, die von der tragbaren elektronischen
Vorrichtung 4 vorgesehen werden und die unten beschrieben
werden, funktionieren in Verbindung mit anderen Objekten, die im
Allgemeinen woanders in dem Speicher 20 gespeichert sind, wie
zum Beispiel in der „neue Wörter"-Datenbank 92.
-
Die „neue
Wörter"-Datenbank 92 speichert zusätzliche
Wortobjekte 108 und zugehörige Häufigkeitsobjekte 104,
um einem Benutzer eine kundenspezifische Erfahrung zu liefern, in
der Wörter und dergleichen, die relativ häufiger
von einem Benutzer benutzt werden, relativ höhere Häufigkeitswerte
haben, als ansonsten in der generischen Wortliste 88 reflektiert
wird. Insbesondere umfasst die „neue Wörter"-Datenbank 92 Wortobjekte 108,
die Benutzer-definiert sind und die im Allgemeinen nicht unter den Wortobjekten 108 der
generischen Wortliste 88 zu finden sind. Jedes Wortobjekt 108 in
der „neue Wörter"-Datenbank 92 hat zugehörig
ein zugehöriges Häufigkeitsobjekt 104,
das auch in der „neue Wörter"-Datenbank 92 gespeichert
ist.
-
Die 3A, 3B und 3C zeigen
auf eine beispielhafte Art und Weise den allgemeinen Betrieb bestimmter
Aspekte der Disambiguierungsfunktion der tragbaren elektronischen
Vorrichtung 4. Zusätzliche Merkmale, Funktionen
und dergleichen werden anderswo dargestellt und beschrieben.
-
Eine
Eingabe wird erfasst, wie bei 204, und die Eingabe kann
jeder Typ einer Betätigung oder ein anderer Betrieb hinsichtlich
jedes Teils der Eingabevorrichtung 8 sein. Eine typische
Eingabe umfasst zum Beispiel eine Betätigung einer Taste 28 mit
einer Anzahl von Zeichen 48 darauf, oder jeder andere Typ einer
Betätigung oder Manipulation der Eingabevorrichtung 8.
-
Die
Disambiguierungsfunktion bestimmt dann, wie bei 212, ob
die aktuelle Eingabe eine Bedieneingabe, wie eine Auswahl-Eingabe,
eine Begrenzungszeichen- bzw. Delimiter-Eingabe, eine Bewegungs-Eingabe,
eine Umschalt-Eingabe oder zum Beispiel eine andere Eingabe ist,
die keine Betätigung einer Taste 28 darstellt,
die eine Anzahl von Zeichen 48 darauf hat. Wenn bei 212 festgestellt
wird, dass die Eingabe keine Bedieneingabe ist, geht die Verarbeitung
bei 216 weiter durch Hinzufügen der Eingabe zu
der aktuellen Eingabe-Sequenz, die bereits eine Eingabe umfassen
kann oder nicht.
-
Viele
der bei 204 erfassten Eingaben werden eingesetzt bei der
Erzeugung von Eingabe-Sequenzen, bei denen die Disambiguierungsfunktion
ausgeführt wird. Eine Eingabe-Sequenz wird in jeder „Sitzung"
mit jeder Betätigung einer Taste 28 mit einer Anzahl
von Zeichen 48 darauf aufgebaut. Da eine Eingabe-Sequenz
typischerweise aus zumindest einer Betätigung einer Taste 28 mit
einer Vielzahl von Zeichen 48 darauf besteht, ist die Eingabe-Sequenz vieldeutig.
Wenn zum Beispiel ein Wort vollständig ist, wird die aktuelle
Sitzung beendet und eine neue Sitzung wird initiiert.
-
Eine
Eingabe-Sequenz wird stufenweise auf der tragbaren elektronischen
Vorrichtung 4 aufgebaut mit jeder aufeinander folgenden
Betätigung einer Taste 28 während jeder
gegebenen Sitzung. Spezifisch wird, sobald eine Delimiter-Eingabe
während einer gegebenen Sitzung erfasst wird, die Sitzung
beendet und eine neue Sitzung wird initiiert. Jede Eingabe, die
aus einer Betätigung einer der Tasten 28 mit einer
damit verbundenen Anzahl von Zeichen 48 resultiert, wird
sequentiell zu der aktuellen Eingabe-Sequenz hinzugefügt.
Da die Eingabe-Sequenz während einer gegebenen Sitzung
wächst, wird die Disambiguierungsfunktion im Allgemeinen
mit jeder Betätigung einer Taste 28 ausgeführt,
d. h. und hinsichtlich der gesamten Eingabe-Sequenz eingegeben.
Anders ausgedrückt, in einer gegebenen Sitzung wird versucht,
die wachsende Eingabe-Sequenz als eine Einheit durch die Disambiguierungsfunktion
zu disambiguieren mit jeder nachfolgenden Betätigung der
verschiedenen Tasten 28.
-
Sobald
eine aktuelle Eingabe, die eine letzte Betätigung einer
der Tasten 28 mit einer Anzahl der dazu gehörenden
Zeichen 48 darstellt, zu der aktuellen Eingabe-Sequenz
in der aktuellen Sitzung hinzugefügt wurde, wie bei 216 in
der 3A, erzeugt die Disambiguierungsfunktion, wie
bei 220, im Wesentlichen alle Permutationen der Zeichen 48,
die den verschiedenen Tasten 28 zugewiesen werden, die
getätigt wurden bei der Erzeugung der Eingabe-Sequenz. In
dieser Hinsicht beziehen sich „Permutationen" auf die verschiedenen
Strings, die aus den Zeichen 48 jeder gedrückten
Taste 28 resultieren können, begrenzt durch die
Reihenfolge, in der die Tasten 28 betätigt wurden.
Die verschiedenen Permutationen der Zeichen in der Eingabe-Sequenz
werden als Präfixobjekte eingesetzt.
-
Wenn
zum Beispiel die aktuelle Eingabe-Sequenz in der aktuellen Sitzung
die vieldeutige Eingabe der Tasten „AS" und „OP"
ist, sind die verschiedenen Permutationen des ersten Zeichens 52 und
des zweiten Zeichens 56 von jeder der zwei Tasten 28, wenn
betrachtet in der Reihenfolge, in der die Tasten 28 betätigt
wurden, „SO", „SP", „AP" und „AO"
und jedes von diesen ist ein Präfixobjekt, das erzeugt
wird, wie bei 220, hinsichtlich der aktuellen Eingabe-Sequenz.
Wie detaillierter unten erklärt, versucht die Disambiguierungsfunktion,
für jedes Präfixobjekt eines der Wortobjekte 108 zu
identifizieren, für welches das Präfixobjekt ein
Präfix sein würde.
-
Für
jedes erzeugte Präfixobjekt wird der Speicher 20 konsultiert,
wie bei 224, um, wenn möglich, für jedes
Präfixobjekt eines der Wortobjekte 108 in dem
Speicher 20 zu identifizieren, das dem Präfixobjekt
entspricht, was bedeutet, dass die Sequenz der Buchstaben, die durch
das Präfixobjekt dargestellt wird, entweder ein Präfix
des identifizierten Wortobjektes 108 ist oder im Wesentlichen
identisch zu der Gesamtheit des Wortobjektes 108 ist. Weiter ist
in dieser Hinsicht das Wortobjekt 108, das zu identifizieren
versucht wird, das Wortobjekt 108 mit der höchsten
Häufigkeit. Das heißt, die Disambiguierungsfunktion
versucht, das Wortobjekt 108 zu identifizieren, das dem
Präfixobjekt entspricht und das auch zu einem Häufigkeitsobjekt 104 gehört,
das einen relativ höheren Häufigkeitswert hat
als alle der anderen Häufigkeitsobjekte 104, die
zu den anderen Wortobjekten 108 gehören, die dem
Präfixobjekt entsprechen.
-
Es
wird in dieser Hinsicht angemerkt, dass die Wortobjekte 108 in
der generischen Wortliste 88 im Allgemeinen in Datentabellen
organisiert sind, die den ersten zwei Buchstaben von verschiedenen Wörtern
entsprechen. Zum Beispiel würde die Datentabelle, die mit
dem Präfix „CO" verbunden ist, alle der Wörter
umfassen wie „CODE", „COIN", „COMMUNICATION"
und dergleichen. Abhängig von der Quantität von
Wortobjekten 108 in einer gegebenen Datentabelle kann die
Datentabelle zusätzlich Teil-Datentabellen umfassen, in
denen Wortobjekte 108 durch Präfixe organisiert
sind, die drei Zeichen oder mehr in der Länge sind. Weiter
mit dem vorangehenden Beispiel, wenn die „CO"-Datentabelle
zum Beispiel mehr als 256 Wortobjekte 108 umfassen würde,
würde die „CO"-Datentabelle zusätzlich
eine oder mehrere Teil-Datentabellen von Wortobjekten 108 umfassen,
die den am häufigsten erscheinenden Dreibuchstaben-Präfixen
entsprechen. Auf beispielhafte Weise kann somit die „CO"-Datentabelle
auch eine „COM"-Teil-Datentabelle und eine „CON"-Teil-Datentabelle
umfassen. Wenn eine Teil-Datentabelle mehr als die vorgegebene Anzahl von
Wortobjekten 108 umfasst, zum Beispiel eine Quantität
von 256, kann die Teil-Datentabelle weitere Teil-Datentabellen umfassen,
die gemäß Präfixen mit vier Buchstaben
organisiert werden. Es wird angemerkt, dass die oben erwähnte
Quantität von 256 der Wortobjekte 108 dem höchsten
numerischen Wert entspricht, der in einem Byte des Speichers 20 gespeichert
werden kann.
-
Demgemäß wird,
wenn bei 224 versucht wird, jedes Präfixobjekt
zu verwenden, um ein entsprechendes Wortobjekt 108 zu identifizieren,
und zum Beispiel das vorliegende Präfixobjekt „AP"
ist, die „AP"-Datentabelle konsultiert. Da alle der Wortobjekte 108 in
der „AP"-Datentabelle dem Präfixobjekt „AP"
entsprechen, wird das Wortobjekt 108 in der „AP"-Datentabelle
identifiziert, zu dem ein Häufigkeitsobjekt 104 gehört,
das einen Häufigkeitswert hat, der relativ höher
ist als einer der anderen Häufigkeitsobjekte 104 in
der „AP"-Datentabelle. Das identifizierte Wortobjekt 108 und
das zugehörige Häufigkeitsobjekt 104 werden
dann in einem Resultat-Register gespeichert, das als ein Resultat
der verschiedenen Vergleiche der erzeugten Präfixobjekte
mit den Inhalten des Speichers 20 dient.
-
Es
wird angemerkt, dass eines oder mehrere oder vielleicht alle der
Präfixobjekte Präfixobjekte sind, für
die ein entsprechendes Wortobjekt 108 nicht in dem Speicher 20 identifiziert
wird. Derartige Präfixobjekte werden betrachtet als verwaiste
Präfixobjekte und werden separat gespeichert oder werden anderweitig
für möglichen zukünftigen Gebrauch behalten.
In dieser Hinsicht wird angemerkt, dass viele oder alle der Präfixobjekte
verwaiste Objekt werden können, wenn zum Beispiel der Benutzer
versucht, ein neues Wort einzugeben, oder zum Beispiel, wenn der
Benutzer falsch getippt hat und kein Wort der falsch getippten Eingabe
entspricht.
-
Die
Verarbeitung geht weiter, wie bei 232, wo doppelte Wortobjekte 108 mit
relativ niedrigeren Häufigkeitswerten aus dem Ergebnis
gelöscht werden. Ein solches doppeltes Wortobjekt 108 kann
zum Beispiel erzeugt werden durch die andere Datenquelle 99.
-
Sobald
die doppelten Wortobjekte 108 und die zugehörigen
Häufigkeitsobjekte 104 bei 232 entfernt
wurden, verzweigt sich die Verarbeitung, wie bei 234, zu
einem Teilsystem in 9, unten beschrieben, wobei
die Notwendigkeit zur Untersuchung von Kontextdaten evaluiert wird.
Sobald die Kontextdaten evaluiert sind, wie in 9,
kehrt die Verarbeitung zurück zu 236, wie in 3C,
wobei die verbleibenden Präfixobjekte in einem Ausgabesatz
in abnehmender Reihenfolge des Häufigkeitswerts angeordnet
werden.
-
Wenn
festgestellt wird, wie bei 240, dass die Markierung gesetzt
wurde, was bedeutet, dass ein Benutzer eine Auswahl-Eingabe gemacht
hat, entweder durch eine Express-Auswahl-Eingabe oder durch eine
Umschalt-Eingabe einer Bewegungs-Eingabe, dann wird die standardmäßige
Ausgabe 76 betrachtet als „versperrt (locked)",
was bedeutet, dass die gewählte Variante das standardmäßige
Präfix bis zum Ende der Sitzung ist. Wenn bei 240 festgestellt wird,
dass die Markierung gesetzt wurde, geht die Verarbeitung weiter
zu 244, wo die Inhalte des Ausgabesatzes geändert
werden, wenn erforderlich, um als die standardmäßige
Ausgabe 76 eine Ausgabe zu liefern, die das gewählte
Präfixobjekt umfasst, ob es einem Wortobjekt 108 entspricht
oder eine künstliche Variante ist. In dieser Hinsicht ist
anzumerken, dass die Markierung mehrere Male während einer
Sitzung gesetzt werden kann, in diesem Fall wird das gewählte
Präfix, das zu dem Zurückstellen der Markierung gehört,
danach die „gesperrte" standardmäßige
Ausgabe 76 bis zu dem Ende der Sitzung oder bis eine andere
Auswahl-Eingabe erfasst wird.
-
Die
Verarbeitung geht dann weiter, wie bei 248, zu einem Ausgabeschritt,
nach dem eine Ausgabe 64 erzeugt wird, wie oben beschrieben.
Die Verarbeitung geht dann weiter bei 204, wo eine zusätzliche Eingabe
erfasst wird. Wenn andererseits bei 240 festgestellt wird,
dass die Markierung nicht gesetzt ist, geht die Verarbeitung direkt
zu 248 ohne Änderung der Inhalte des Ausgabesatzes
bei 244.
-
Wenn
die erfasste Eingabe bestimmt wird, wie bei 212, als eine
Bedieneingabe, dann geht die Verarbeitung weiter, um die spezifische
Eigenschaft der Bedieneingabe festzustellen. Wenn zum Beispiel festgestellt
wird, wie bei 252, dass die aktuelle Eingabe eine Auswahl-Eingabe
ist, geht die Verarbeitung bei 254 weiter, wo die Markierung
gesetzt wird. Dann kehrt die Verarbeitung zurück zur Erfassung
von zusätzlichen Eingaben, wie bei 204.
-
Wenn
festgestellt wird, wie bei 260, dass die Eingabe eine Delimiter-
bzw. Begrenzungs-Eingabe ist, geht die Verarbeitung bei 264 weiter,
wo die aktuelle Sitzung beendet wird und die Verarbeitung übergeben
wird, wie bei 266, an das Lernen-Funktion-Teilsystem, wie
bei 404 der 4. Eine Delimiter-Eingabe umfasst
zum Beispiel die Betätigung einer <Leerzeichen (SPACE)>-Taste 116, die sowohl ein Delimiter-Symbol
eingeben als auch ein Leerzeichen am Ende des Wortes hinzufügen
würde, eine Betätigung der <ENTER>-Taste,
die ähnlich eine Delimiter-Eingabe eingeben kann und ein
Leerzeichen eingeben kann, und durch eine Translation des Thumbwheels 32,
wie wird durch den Pfeil 38 angezeigt, die eine Delimiter-Eingabe
eingeben kann, ohne zusätzlich ein Leerzeichen einzugeben.
-
Es
wird zuerst festgestellt, wie bei 408, ob die standardmäßige
Ausgabe zum Zeitpunkt der Erfassung der Demiliter-Eingabe bei 260 mit
einem Wortobjekt 108 in dem Speicher 20 übereinstimmt. Wenn
nicht, bedeutet dies, dass die standardmäßige Ausgabe
eine Benutzer-erzeugte Ausgabe ist, die zu der „neue Wörter"-Datenbank 92 für
zukünftigen Gebrauch hinzugefügt werden sollte.
Unter solch einem Umstand geht dann die Verarbeitung weiter zu 412, wo
die standardmäßige Ausgabe in der „neue
Wörter"-Datenbank 92 als ein neues Wortobjekt 108 ge speichert
wird. Zusätzlich wird ein Häufigkeitsobjekt 104 in
der „neue Wörter"-Datenbank 92 gespeichert und
zugeordnet zu dem vorher erwähnten neuen Wortobjekt 108.
Dem neuen Häufigkeitsobjekt 104 wird ein relativ
hoher Häufigkeitswert gegeben, typischerweise in dem oberen
Viertel oder Drittel eines vorgegebenen Bereichs von möglichen
Häufigkeitswerten.
-
In
dieser Hinsicht wird Häufigkeitsobjekten 104 ein
absoluter Häufigkeitswert im Allgemeinen in dem Bereich
von null bis 65,535 gegeben. Der Maximalwert stellt die größte
Anzahl dar, die in zwei Bytes des Speichers 20 gespeichert
werden kann. Dem neuen Häufigkeitsobjekt 104,
das in der „neue Wörter"-Datenbank 92 gespeichert
wird, wird ein absoluter Häufigkeitswert in oberen Viertel
oder Drittels dieses Bereichs zugewiesen, besonders, da das neue Wort
von einem Benutzer verwendet wurde und wahrscheinlich wieder verwendet
wird.
-
In
weiterer Hinsicht zu dem Häufigkeitsobjekt 104 wird
angemerkt, dass in einer gegebenen Datentabelle, wie der oben erwähnten „CO"-Datentabelle, der
absolute Häufigkeitswert nur für das Häufigkeitsobjekt 104 gespeichert
wird, das den höchsten Häufigkeitswert in der
Datentabelle hat. Alle anderen Häufigkeitsobjekte 104 in
der gleichen Datentabelle haben Häufigkeitswerte gespeichert
als Prozentwerte, normalisiert zu dem vorher erwähnten
maximalen absoluten Häufigkeitswert. Das heißt,
nach Identifikation des Häufigkeitsobjektes 104 mit
dem höchsten Häufigkeitswert in einer gegebenen
Datentabelle, wird allen anderen Häufigkeitsobjekten 104 in
der gleichen Datentabelle ein Prozentsatz des absoluten Maximalwerts
zugewiesen, der das Verhältnis des relativ kleineren absoluten
Häufigkeitswertes eines bestimmten Häufigkeitsobjektes 104 zu
dem absoluten Häufigkeitswert des vorher erwähnten
Häufigkeitsobjektes 104 mit dem höchsten
Wert darstellt. Vorteilhafterweise können derartige Prozentsatzwerte
in einem einzelnen Byte des Speichers gespeichert werden, wodurch
Speicherplatz in der tragbaren elektronischen Vorrichtung 4 gespart
wird.
-
Nach
der Erzeugung des neuen Wortobjekts 108 und des neuen Häufigkeitsobjekts 104 und
deren Speicherung in der „neue Wörter"-Datenbank 92 wird die
Verarbeitung zu 420 übergeben, wo der Lernenprozess
beendet wird. Die Verarbeitung kehrt dann zum Hauptprozess zurück,
wie bei 204. Wenn bei 408 festgestellt wird, dass
das Wortobjekt 108 in der standardmäßigen
Ausgabe 76 mit einem Wortobjekt 108 in dem Speicher 20 übereinstimmt,
dann kehrt die Verarbeitung direkt zu dem Hauptprozess bei 204 zurück.
-
Weiter
hinsichtlich der Identifikation verschiedener Wortobjekte 108 zur
Entsprechung mit erzeugten Präfixobjekten wird angemerkt,
dass der Speicher 20 eine Anzahl von zusätzlichen
Datenquellen 99 zusätzlich zu der generischen
Wortliste 88 und der „neue Wörter"-Datenbank 92 umfassen kann,
die alle als linguistische Quellen betrachtet werden können.
Es ist offensichtlich, dass der Speicher 20 jede Anzahl
anderer Datenquellen 99 umfassen kann. Die anderen Datenquellen 99 können
zum Beispiel eine Adressdatenbank, eine Kurztext-Datenbank oder
jede andere Datenquelle ohne Einschränkung umfassen. Eine
beispielhafte Kurztext-Datenbank kann, zum Beispiel, Sätze
von Wörtern oder Ausdrücken oder anderen Daten
umfassen, die jeweils zum Beispiel zu einem Zeichen-String gehören, der
abgekürzt werden kann. Zum Beispiel kann eine Kurztext-Datenbank
den String „br" mit dem Satz von Wörtern „Best
Regards" verbinden, mit der Absicht, dass ein Benutzer den String „br"
schreiben kann und die Ausgabe „Best Regards" empfangen
kann.
-
Wenn
versucht wird, Wortobjekte 108 zu identifizieren, die einem
gegebenen Präfixobjekt entsprechen, kann die tragbare elektronische
Vorrichtung 4 alle Datenquellen in dem Speicher 20 abfragen.
Zum Beispiel kann die tragbare elektronische Vorrichtung 4 die
generische Wortliste 88, die „neue Wörter"-Datenbank 92 und
die anderen Datenquellen 99 abfragen, um Wortobjekte 108 zu
identifizieren, die dem Präfixobjekt entsprechen. Die Inhalte
der anderen Datenquellen 99 können behandelt werden
als Wortobjekte 108, und der Prozessor 16 kann
Häufigkeitsobjekte 104 erzeugen, die derartigen
Wortobjekten 108 zugeteilt werden und welchen ein Häufigkeitswert
zugewiesen werden kann in zum Beispiel dem oberen Drittel oder Viertel
des vorher erwähnten Häufigkeitsbereichs. Unter
der Annahme, dass der zugewiesene Häufigkeitswert hoch
genug ist, wird der String „br" zum Beispiel typischerweise
an die Anzeige 60 ausgegeben. Wenn eine Delimiter-Eingabe hinsichtlich
des Teils des Ausgabe erfasst wird, der die Verbindung zu dem Wortobjekt 108 in
der Kurztext-Datenbank hat, zum Beispiel „br", würde
der Benutzer die Ausgabe „Best Regards" empfangen, wobei
offensichtlich ist, dass der Benutzer auch eine Auswahl-Eingabe
als den beispielhaften String „br" eingegeben haben könnte.
-
Die
Inhalte von einer der anderen Datenquellen 99 können
behandelt werden als Wortobjekte 108 und können
zu erzeugten Häufigkeitsobjekten 104 gehören,
die den zugewiesenen Häufigkeitswert in dem vorher erwähnten
oberen Teil des Häufigkeitsbereichs haben. Nachdem derartige
Wortobjekte 108 identifiziert sind, kann die neue Wort-Lernen-Funktion,
wenn geeignet, auf derartigen Wortobjekten 108 auf die
oben dargelegte Art handeln.
-
Wenn
festgestellt wird, wie bei 268, dass die aktuelle Eingabe
eine Bewegungs-Eingabe ist, wie eingesetzt wird, wenn ein Benutzer
versucht, ein Objekt zu editieren, entweder ein beendetes Wort oder ein
Präfixobjekt in der aktuellen Sitzung, wird das Caret-Zeichen 84 auf
die gewünschte Position verschoben, wie bei 272,
und die Markierung wird gesetzt, wie bei 276. Die Verarbeitung
kehrt dann dahin zurück, wo zusätzliche Eingaben
erfasst werden können, wie bei 204.
-
In
dieser Hinsicht ist es offensichtlich, dass verschiedene Typen von
Bewegungs-Eingaben von der Eingabevorrichtung 8 erfasst
werden können. Zum Beispiel kann eine Rotation des Thumbwheels 32,
wie durch den Pfeil 34 der 1 angezeigt,
eine Bewegungs-Eingabe liefern. In dem Fall, in dem solch eine Bewegungs-Eingabe
erfasst wird, wie in dem Umstand einer editierenden Eingabe, wird
die Bewegungs-Eingabe zusätzlich als eine Auswahl-Eingabe
erfasst. Demgemäß und wie es der Fall ist mit
einer Auswahl-Eingabe, wie bei 252 erfasst wird, ist die
gewählte Variante effektiv gesperrt (locked) hinsichtlich
des Standard-Teils 76 der Ausgabe 64. Jede Standard-Ausgabe 76 während
der gleichen Sitzung umfasst notwendigerweise die vorher gewählte
Variante.
-
In
dem vorliegenden beispielhaften Ausführungsbeispiel der
tragbaren elektronischen Vorrichtung 4 ist, wenn festgestellt
wird, wie bei 252, dass die Eingabe keine Auswahl-Eingabe
ist, und festgestellt wird, wie bei 260, dass die Eingabe
keine Delimiter-Eingabe ist, und weiter festgestellt wie, wie bei 268,
dass die Eingabe keine Bewegungs-Eingabe ist, in dem aktuellen beispielhaften
Ausführungsbeispiel der tragbaren elektronischen Vorrichtung 4 die
einzige verbleibende Bedieneingabe im Allgemeinen eine Erfassung
der <LÖSCHEN(DELETE)>-Taste 86 der Tasten 28 des
Tastaturfelds 24. Bei Erfassung der <DELETE>-Taste 86 wird das letzte Zeichen
der standardmäßigen Ausgabe gelöscht,
wie bei 280. Die Verarbeitung kehrt danach zurück
zu 204, wo eine zusätzliche Eingabe erfasst werden
kann.
-
Eine
beispielhafte Eingabe-Sequenz wird in den 1 und 5–8 dargestellt.
In diesem Beispiel versucht der Benutzer, das Wort „APPLOADER"
einzugeben, und dieses Wort ist momentan nicht in dem Speicher 20 gespeichert.
In 1 hat der Benutzer bereits die „AS"-Taste 28 eingegeben. Da
die Datentabellen in dem Speicher 20 entsprechend zwei-Buchstaben-Präfixen
organisiert sind, werden die Inhalte der Ausgabe 64 nach
dem ersten Tastenanschlag von den N-Gramm-Objekten 112 in dem
Speicher erlangt. Der erste Tastenanschlag „AS" entspricht
einem ersten N-Gramm-Objekt 112 „S" und einem
zugehörigen Häufigkeitsobjekt 104, sowie
einem anderen N-Gramm-Objekt 112 „A" und einem
zugehörigen Häufigkeitsobjekt 104. Während das
Häufigkeitsobjekt 104, das zu „S" gehört,
einen Häufigkeitswert hat, der größer
ist als der des Häufigkeitsobjektes 104, das zu „A"
gehört, wird angemerkt, dass „A" selbst ein vollständiges
Wort ist. Ein vollständiges Wort wird immer als die standardmäßige Ausgabe 76 gegenüber
anderer Präfixobjekte geliefert, die nicht mit vollständigen
Wörtern übereinstim men, unabhängig eines
zugehörigen Häufigkeitswerts. Somit ist in der 1 der
Standard-Teil 76 der Ausgabe 64 „A".
-
In
der 5 hat der Benutzer zusätzlich die „OP"-Taste 28 eingegeben.
Die Varianten werden in der 5 dargestellt.
Da das Präfixobjekt „SO" auch ein Wort ist, wird
es als die standardmäßige Ausgabe 76 geliefert.
In der 6 hat der Benutzer wieder die „OP"-Taste 28 eingegeben
und hat auch die „L"-Taste 28 eingegeben. Es wird
angemerkt, dass die beispielhafte „L"-Taste 28,
die hier dargestellt wird, nur das einzelne Zeichen 48 „L"
umfasst.
-
Es
wird in dem vorliegenden Beispiel angenommen, dass keine Bedieneingaben
bis jetzt erfasst wurden. Die standardmäßige Ausgabe 76 ist „APPL",
wie dem Wort „APPLE" entsprechen würde. Das Präfix „APPL"
wird sowohl in der Textkomponente 68 sowie in dem Standard-Teil 76 der
Varianten-Komponente 72 dargestellt. Verschiedene Präfixobjekte
in dem Varianten-Teil 80 umfassen „APOL", wie
dem Wort „APOLOGIZE" entsprechen würde, und das
Präfix „SPOL", das dem Wort „SPOLIATION" entsprechen
würde.
-
Es
wird insbesondere angemerkt, dass die zusätzlichen Varianten „AOOL", „AOPL", „SOPL"
und „SOOL" auch als Varianten 80 in der Varianten-Komponente 72 dargestellt
werden. Da kein Wortobjekt 108 diesen Präfixobjekten
entspricht, werden die Präfixobjekte als verwaiste Präfixobjekte
betrachtet, für die kein entsprechendes Wortobjekt 108 identifiziert
wurde. In dieser Hinsicht kann es für die Varianten-Komponente 72 wünschenswert
sein, eine spezifische Quantität von Eintragungen zu umfassen,
und im Falle des vorliegenden beispielhaften Ausführungsbeispiels
ist die Quantität sieben Eintragungen. Nach dem Erlangen
des Resultats bei 224, wenn die Quantität von
Präfixobjekten in dem Resultat weniger ist als die vorgegebene
Quantität, versucht die Disambiguierungsfunktion, zusätzliche
Ausgaben zu liefern, bis die vorgegebene Anzahl von Ausgaben geliefert
ist.
-
In
der 7 hat der Benutzer zusätzlich die „OP"-Taste 28 eingegeben.
Unter diesem Umstand und wie in 7 zu sehen
ist, wurde der Standard-Teil 76 der Ausgabe 64 das
Präfixobjekt „APOLO", wie es dem Wort „APOLOGIZE"
entsprechen würde, während unmittelbar vor der
aktuellen Eingabe der Standard-Teil 76 der Ausgabe 64 der 6 „APPL"
war, wie dem Wort „APPLE" entsprechen würde. Wieder
unter der Annahme, dass keine Bedieneingaben erfasst wurden, entspricht
das standardmäßige Präfixobjekt in der 7 nicht
dem vorhergehenden standardmäßigen Präfixobjekt
der 6. Somit wird die erste künstliche Variante „APOLP"
erzeugt und dieser wird in dem aktuellen Beispiel eine bevorzugte
Position gegeben. Die oben angeführte künstliche
Variante „APOLP" wird erzeugt durch Löschen des
letzten Zeichens des Standard-Präfixobjekts „APOLO"
und durch Liefern stattdessen eines entgegengesetzten Zeichens 48 der Taste 28,
die das letzte Zeichen des Standard-Teils 76 der Ausgabe 64 erzeugte,
was in dem aktuellen Beispiel der 7 „P"
ist, so dass die oben angeführte künstliche Variante „APOLP"
ist.
-
Ferner,
da die vorhergehende Standard-Ausgabe „APPL" einem Wortobjekt 108 entsprach,
wie dem Wortobjekt 108, das dem Wort „APPLE" entspricht,
und da mit der Hinzufügung der aktuellen Eingabe die vorhergehende
Standard-Ausgabe „APPL" nicht länger einem Wortobjekt 108 entspricht, werden
zwei zusätzliche künstliche Varianten erzeugt.
Eine künstliche Variante ist „APPLP" und die andere
künstliche Variante ist „APPLO", und diese entsprechen
der vorhergehenden standardmäßigen Ausgabe „APPL"
plus den Zeichen 48 der Taste 28, die betätigt
wurde, um die aktuelle Eingabe zu erzeugen. Diese künstlichen
Varianten werden ähnlich als Teil des Varianten-Teils 80 der
Ausgabe 64 ausgegeben.
-
Wie
in 7 gesehen werden kann, scheint der Standard-Teil 76 der
Ausgabe 64 „APOLO" nicht länger mit dem übereinzustimmen,
was als ein Präfix für „APPLOADER" benötigt
würde, und der Benutzer erwartet wahrscheinlich, dass das
gewünschte Wort „APPLOADER" noch nicht in dem
Speicher 20 gespeichert ist. Somit liefert der Benutzer
eine Auswahl-Eingabe, wie durch Scrollen mit dem Thumbwheel 32,
bis der Varianten-String „APPLO" hervorgehoben ist. Der
Benutzer fährt dann mit der Eingabe fort und gibt die „AS"-Taste
ein.
-
Die
Ausgabe 64 einer solchen Aktion wird in der 8 dargestellt.
Hier ist der String „APPLOA" der Standard-Teil 76 der
Ausgabe 64. Da der Varianten-String „APPLO" der
Standard-Teil 76 der Ausgabe 64 (nicht ausdrücklich
hierin dargestellt) als ein Resultat der Auswahl-Eingabe wurde hinsichtlich
des Varianten-Strings „APPLO" und da der Varianten-String „APPLO"
nicht einem Wortobjekt 108 entspricht, wurden die Zeichen-Strings „APPLOA"
und „APPLOS" als künstliche Varianten erzeugt.
Zusätzlich, da der vorhergehende Standard der 7, „APOLO",
vorher einem Wortobjekt 108 entsprochen hat, aber jetzt
nicht länger dem Standard-Teil 76 der Ausgabe 64 der 8 entspricht,
wurden auch die zusätzlichen künstlichen Varianten
von „APOLOA" und „APOLOS" erzeugt. Derartigen
künstlichen Varianten wird eine bevorzugte Position gegenüber
den drei angezeigten verwaisten Präfixobjekten gegeben.
-
Da
die aktuelle Eingabe-Sequenz in dem Beispiel nicht mehr einem Wortobjekt 108 entspricht, werden
die Teile des Verfahrens, die den Versuch betreffen, entsprechende
Wortobjekte 108 zu finden, nicht mit weiteren Eingaben
für die aktuelle Sitzung ausgeführt. Das heißt,
da kein Wortobjekt 108 der aktuellen Eingabe-Sequenz entspricht,
entsprechen weitere Eingaben ebenfalls keinem Wortobjekt 108. Ein
Vermeiden der Suche des Speichers 20 nach derartigen nicht
existierenden Wortobjekten 108 spart Zeit und vermeidet
vergeudete Verarbeitungsbemühungen.
-
Da
der Benutzer zu schreiben fortfährt, gibt der Benutzer
schließlich erfolgreich das Wort „APPLOADER" ein
und gibt eine Delimiter-Eingabe ein. Bei Erfassen der Delimiter-Eingabe
nach der Eingabe von „APPLOADER", wird die Lernen-Funktion
initiiert. Da das Wort „APPLOADER" nicht einem Wortobjekt 108 in
dem Speicher 20 entspricht, wird ein neues Wortobjekt 108 erzeugt,
das „APPLOADER" entspricht, und wird in der „neue
Wörter"-Datenbank 92 gespei chert, zusammen mit
einem entsprechenden neuen Häufigkeitsobjekt 104,
dem eine absolute Häufigkeit beispielsweise in dem oberen
Drittel oder Viertel des möglichen Häufigkeitsbereichs
gegeben wird. In dieser Hinsicht wird angemerkt, dass die „neue
Wörter"-Datenbank 92 im Allgemeinen in zwei-Zeichen-Präfix-Datentabellen
organisiert ist, die denen ähnlich sind, die in der generischen
Wortliste 88 zu finden sind. Somit wird dem neuen Häufigkeitsobjekt 104 zuerst
ein absoluter Häufigkeitswert zugewiesen, aber bei Speicherung
wird der absolute Häufigkeitswert, wenn es nicht der Maximalwert
in dieser Datentabelle ist, geändert, um einen normalisierten Häufigkeitswert-Prozentsatz
zu umfassen, normalisiert auf das, was der maximale Häufigkeitswert
in dieser Datentabelle ist.
-
Es
wird angemerkt, dass das Layout der Zeichen 48 auf den
Tasten 28 in 1 ein beispielhaftes Zeichen-Layout
ist, das eingesetzt wird, wenn die beabsichtigte primäre
Sprache, die auf der tragbaren elektronischen Vorrichtung 4 verwendet
wird, zum Beispiel Englisch ist. Andere Layouts, die diese Zeichen 48 und/oder
andere Zeichen umfassen, können verwendet werden abhängig
von der beabsichtigten primären Sprache und jedem Sprachenvorzug
in der Herstellung der Sprachobjekte 100.
-
Wie
anderweitig hier erwähnt, wird ein vollständiges
Wort, das während eines Disambiguierungszyklus identifiziert
wird, immer als eine Standard-Ausgabe 76 vorgesehen bevorzugt
zu anderen Präfixobjekten, die nicht mit vollständigen
Wörtern übereinstimmen, unabhängig eines
zugehörigen Häufigkeitswerts. Das heißt,
ein Wortobjekt 108, das einer vieldeutigen Eingabe entspricht
und eine Länge hat, die gleich ist zu der der vieldeutigen
Eingabe, wird an einer Position von Priorität über
andere Präfixobjekte ausgegeben. Wie hier verwendet, sollen der
Ausdruck „Länge" und Variationen davon eine Quantität
von Elementen betreffen, aus denen ein Objekt besteht, wie die Quantität
der linguistischen Elemente, aus denen ein Sprachobjekt 100 besteht.
-
Wenn
mehr als ein vollständiges Wort während eines
Disambiguierungszyklus identifiziert wird, können alle
vollständigen Wörter ausgegeben werden in Reihenfolge
einer abnehmenden Häufigkeit zueinander, wobei jedes an
einer Prioritätsposition gegenüber den Präfixobjekten
ist, die repräsentativ sind für unvollständige
Wörter. Jedoch kann es in bestimmten Umständen
wünschenswert sein, zusätzliche Daten einzusetzen,
wenn verfügbar, um die vollständigen Wörter
auf eine Weise zu priorisieren, die für den Benutzer vorteilhafter
ist.
-
Die
tragbare elektronische Vorrichtung 4 umfasst folglich vorteilhafterweise
die Kontextdaten-Tabelle 49, die in dem Speicher 20 gespeichert
ist. Die beispielhafte Kontextdaten-Tabelle 49 hat eine
Anzahl von vieldeutigen Wörtern und zugehörige
Kontextdaten gespeichert.
-
Spezifisch
weist die Kontextdaten-Tabelle 49 eine Anzahl von Schlüssel-Objekten 47 und,
zugehörig zu jedem Schlüssel-Objekt 47,
eine Anzahl zugehöriger Kontextwert-Objekte 51 auf.
In dem vorliegenden beispielhaften Ausführungsbeispiel,
in dem die englische Sprache auf der tragbaren elektronischen Vorrichtung 4 eingesetzt
wird, ist jedes Schlüssel-Objekt 47 ein Wortobjekt 108.
Das heißt, ein Schlüssel-Objekt 47 in
der Kontextdaten-Tabelle 49 wird auch als ein Wortobjekt 108 in
einer aus der generischen Wort-Liste 88, der „neue
Wörter"-Datenbank 92 und der anderen Datenquellen 99 gespeichert.
Jedes Schlüssel-Objekt 47 hat zugeordnet ein oder
mehrere Kontextwert-Objekte 51, die jeweils ein bestimmtes
Kontextdatenelement darstellen. Wenn ein Schlüssel-Objekt 47 während
eines Zyklus der Disambiguierung in Bezug auf eine vieldeutige Eingabe identifiziert
wird und wenn ein Kontextwert-Objekt 51, das zu dem Schlüssel-Objekt 47 gehört,
mit einem Kontext der vieldeutigen Eingabe übereinstimmt, wird
das Wortobjekt 108, das dem Schlüssel-Objekt 47 entspricht,
als eine Standard-Wort-Ausgabe an der Text-Komponente 68 und
an dem Standard-Teil 76 der Varianten-Komponente 72 ausgegeben.
In anderen Ausführungsbeispielen ist jedoch offensichtlich,
dass die Schlüssel-Objekte 47 in anderen Formen
als in der Form von Wortobjekten 108 sein können.
-
Die
Inhalte der Kontextdaten-Tabelle 49 werden erlangt durch
Analysieren der Sprachobjekte 100 und des Datenkorpus,
aus denen die Sprachobjekte 100 und die Häufigkeitsobjekte 104 erlangt
wurden. Zuerst werden die Sprachobjekte 100 analysiert,
um vieldeutige Wortobjekte 108 zu identifizieren. Ein Satz
vieldeutiger Wortobjekte 108 ist repräsentativ für
eine Vielzahl von vollständigen Wörtern, die jeweils
aus derselben vieldeutigen Eingabe gebildet werden, wie zum Beispiel
die Wörter „TOP" und „TOO", die jeweils
aus der vieldeutigen Eingabe <TY><OP><OP> gebildet werden. Jedes
vieldeutige Wortobjekt 108 hat ein zugehöriges
Häufigkeitsobjekt 104. In einem gegebenen Satz
von vieldeutigen Wortobjekten 108, ist jedes vieldeutige
Wortobjekt 108, das ein Häufigkeitsobjekt 104 hat
mit einem Häufigkeitswert, der geringer ist als der höchste
in dem Satz, ein Kandidaten-Schlüssel-Objekt 47.
Das heißt, in einem gegebenen Satz von vieldeutigen Wortobjekten 108 sind
alle vieldeutigen Wortobjekte 108 Kandidaten-Schlüssel-Objekte 47,
außer das vieldeutige Wortobjekt 108 mit einem
zugehörigen Häufigkeitsobjekt 104, das
den relativ höchsten Häufigkeitswert in dem Satz
hat. Dies ist aufgrunddessen, wie detaillierter anderweitig hier
erläutert wird, da die erwartete Situation, in der Kontextdaten
während einer Texteingabe relevant sind, die ist, wenn
eine Vielzahl von vieldeutigen Wortobjekten 108 in einem
Disambiguierungszyklus identifiziert werden, und ein weniger häufiges
vieldeutiges Wortobjekt 108 wird wünschenswert
ausgegeben an einer relativ bevorzugten Position, da es eine passendere
Lösung in einem bestimmten Kontext ist.
-
Sobald
die Kandidaten-Schlüssel-Objekte 47 identifiziert
sind, wird der Datenkorpus analysiert, um alle gültigen
Kontextdaten für die Kandidaten-Schlüssel-Objekte 47 zu
identifizieren. Gültige Kontextdaten ist jeder bestimmte
Kontext, in dem ein statistisch signifikantes Auftreten eines bestimmten
Schlüssel-Objekts 47 auftritt.
-
Ein
beispielhafter Kontext ist der, in dem ein bestimmtes vieldeutiges
Wort, in einem statistisch signifikanten Ausmaß, einem
bestimmten Wort folgt. Zum Bei spiel und weiter mit dem obigen Beispiel, kann
festgestellt werden, dass das Schlüsselwort „TOP"
auftritt, in einem statistisch signifikanten Ausmaß, nach
dem Kontext-Wort „TABLE" und nach dem Kontext-Wort „HILL".
Abhängig von der Konfiguration der Kontextdaten-Tabelle 49,
kann solch ein Kontext auf ein bestimmtes Wort begrenzt sein, das
einem bestimmten vieldeutigen Wort unmittelbar vorangeht, oder er
kann ein bestimmtes Wort umfassen, das einem bestimmten vieldeutigen
Wort nach einem, zwei, drei oder mehreren Wörtern vorangeht.
Das heißt, das vieldeutige Schlüsselwort „TOP"
kann in einem statistisch bedeutenden Ausmaß auftreten,
wenn es unmittelbar dem Kontextwort „TABLE" folgt, aber
das gleiche vieldeutige Schlüsselwort „TOP" kann
in einem statistisch bedeutenden Ausmaß auftreten, wenn
es dem Kontextwort „HILL" unmittelbar oder nach zwei, drei
oder vier Wörtern folgt. In solch einem Umstand wird das
vieldeutige Wortobjekt 108 „TOP" als ein Schlüssel-Objekt 47 gespeichert
und die Wortobjekte 108 „TABLE" und „HILL"
werden als zwei zugehörige Kontextwert-Objekte 51 gespeichert.
-
Ein
weiterer beispielhafter Kontext ist der, in dem ein bestimmtes vieldeutiges
Wort, in einem statistisch signifikanten Ausmaß, ein erstes
Wort in einem Satz ist. In solch einer Situation kann der identifizierte
Kontext der sein, in dem das bestimmte vieldeutige Wort, in einem
statistisch signifikanten Ausmaß, einem oder mehreren bestimmten
Interpunktionszeichen folgt, wie dem Punkt „.", dem Fragezeichen „?"
und dem Ausrufezeichen „!". In solch einer Situation ist
das Kontextwert-Objekt 51 das bestimmte Interpunktionssymbol,
wobei jedes solche statistisch signifikante Interpunktionssymbol
ein separates Kontextwert-Objekt 51 ist.
-
Ein
weiterer beispielhafter Kontext ist der, in dem ein bestimmtes vieldeutiges
Wort, in einem statistisch bedeutenden Ausmaß, einer anderen
Eingabe folgt, die in einem vorgegebenen Format ist. In solch einer
Situation kann der identifizierte Kontext zum Beispiel der sein,
in dem das bestimmte vieldeutige Wort, in einem statistisch signifikanten
Ausmaß, einer Eingabe folgt, die eine bestimmte Anord nung von
numerischen Komponenten hat. Zum Beispiel kann ein numerisch angezeigtes
Datum in einem der folgenden Formate angezeigt werden: NN/NN/NNNN oder
NN/NN/NN oder N/NN/NNNN oder N/NN/NN oder N/N/NNNN oder N/N/NN oder
andere Formate, wobei sich „N" auf eine arabische Ziffer
bezieht und "/„ kann sich auf jedes eines bestimmten Symbols
beziehen, einen Delimiter bzw. Begrenzer, oder eine „Null",
wie ein <SPACE> bzw. Leerzeichen oder nichts.
Als solches kann festgestellt werden, dass ein bestimmtes vieldeutiges
Wort, in einem statistisch signifikanten Ausmaß, einer
anderen Eingabe folgt, die in einem von einem oder mehrerer der
Formate NN/NN/NNNN oder NN/NN/NN oder N/NN/NNNN oder N/NN/NN oder
N/N/NNNN oder N/N/NN ist. Wieder kann das bestimmte vieldeutige
Wort der formatierten Eingabe unmittelbar folgen oder kann zwei, drei
oder mehrere Wörter hinter der formatierten Eingabe folgen.
In solch einer Situation ist das Kontextwert-Objekt 51 eine
Repräsentation des bestimmten Formats, wobei jedes derartiges
statistisch signifikante Format ein getrenntes Kontextwert-Objekt 51 ist.
-
Spezifischer,
die Kontextwert-Objekte 51 können jeweils gespeichert
werden als ein Hash, d. h. ein ganzzahliger Wert, der aus einer
mathematischen Manipulation resultiert. Zum Beispiel werden die
zwei Kontextwert-Objekte 51 „TABLE" und „HILL",
während sie Wortobjekte 108 sind, in der Kontextdaten-Tabelle 49 als
Hashes der Wörter „TABLE" und „HILL"
gespeichert. Die Schlüssel-Objekte 47, wie das
Wort „TOP", können ebenfalls jeweils als Hash
gespeichert werden.
-
Die
drei Kontextwert-Objekte 51 „.", „?"
und „!" werden jeweils als ein Hash gespeichert, d. h.
ein ganzzahliger Wert, der mehr in der Eigenschaft einer Markierung
bzw. eines Flags ist, d. h. ein ganzzahliger Wert, der für
ein Interpunktionssymbol selbst repräsentativ ist oder
einen Wert hat, der unterschiedlich ist zu dem Hash eines der sechsundzwanzig
lateinischen Buchstaben. Die Kontextwertobjekte 51 in der
Eigenschaft von vorgegebenen Formaten konnten ähnlich gespeichert
werden.
-
Während
einer Texteingabe behält das Disambiguierungssystem in
einem temporären Speicher-Register einen Hash einer Anzahl
der Eingaben bei, die der aktuellen vieldeutigen Eingabe vorangehen.
Zum Beispiel, wenn der Benutzer versucht, den Ausdruck „CLIMB
THE HILL AND REACH THE TOP" einzugeben, berechnet und speichert
die Disambiguierungs-Routine 22 einen Hash von jedem von
einem oder mehreren der Wörter „CLIMB", „THE", „HILL", „AND", „REACH",
und „THE" als Eingabewerte 53, bevor der Benutzer
die Reihe von Tastenanschlägen <TY><OP><OP> eingibt,
die in den vieldeutigen Wörtern „TOO" und „TOP"
resultieren. Der Speicher 20 kann konfiguriert werden,
nur eine bestimmte Quantität solcher Eingabewerte 53 zu
speichern, die auf einer „first-in-first-out"-Basis ersetzt werden,
wenn zusätzliche Wörter eingegeben werden. Wenn
zum Beispiel der Speicher nur die letzten vier Eingaben als Eingabewerte 53 speichert,
sind die vier Eingabewerte, die zu dem Zeitpunkt existieren, wenn
der Benutzer die Tastenanschläge für das Wort „TOP"
eingibt, Hashes der Wörter „HILL", „AND", „REACH"
und „THE". In anderen Systemen zum Beispiel kann die Disambiguierungs-Routine
als einen Eingabewert nur die eine Eingabe speichern, die unmittelbar
der aktuellen Eingabe vorangeht.
-
Sobald
der Benutzer die Reihe von Tastenanschlägen <TY><OP><OP> eingibt, bestimmt
die Disambiguierungs-Routine, dass die zwei Wortobjekte 108 „TOO"
und „TOP" jeweils der Reihe von Tastenanschlägen <TY><OP><OP> entsprechen und eine
gleiche Länge haben, und stellt folglich fest, dass die
zwei Wortobjekte 108 „TOO" und „TOP"
vieldeutige Wörter repräsentieren. Wenn angenommen wird,
dass das vieldeutige Wortobjekt 108 „TOO" ein zugehöriges
Häufigkeitsobjekt 104 hat, das einen Häufigkeitswert
hat, der höher als der des Häufigkeitsobjekts 104 ist,
das zu dem vieldeutigen Wortobjekt 108 „TOP" gehört,
konsultiert die Disambiguierungs-Routine 22 die Kontextdaten-Tabelle 49,
um festzustellen, ob der bereits eingegebene Text einen Kontext
liefert, wobei es angemessen ist, das Wortobjekt 108 „TOP"
an einer Position einer höheren Priorität als
das höhere Häufigkeits-Wortobjekt 108 „TOO"
auszugeben.
-
Spezifisch
sucht die Disambiguierungs-Routine 22, ob die Kontextdaten-Tabelle 49 ein
Schlüssel-Objekt 47 gespeichert hat, das mit dem
Wortobjekt 108 „TOP" übereinstimmt. Wenn
solch ein Schlüssel-Objekt 47 gefunden wird, werden
die verschiedenen Kontextwert-Objekten 51, die zu dem Schlüssel-Objekt 47 „TOP"
gehören, mit jedem der Eingabewerte 53 verglichen,
die in dem vorliegenden Beispiel Hashes der Wörter „HILL", „AND", „REACH" und „THE"
sind, um festzustellen, ob irgendwelche der Kontextwert-Objekte 51 mit
irgendwelchen der Eingabewerte 53 übereinstimmen
oder nicht. Wie hier eingesetzt, sollen der Ausdruck „übereinstimmen"
und Variationen davon weit jeden Typ einer vorgegebenen Äquivalenz,
Entsprechung, Zugehörigkeit und dergleichen betreffen,
deren Existenz zwischen zwei oder mehreren Objekten festgestellt
werden kann. Da eines der Kontextwert-Objekte 51, die zu
dem Schlüssel-Objekt 47 „TOP" gehören,
ein Hash des Wortobjekts 108 „HILL" ist, und da
einer der Eingabewerte 53 ein Hash des vorher eingegebenen
Worts „HILL" ist, wird bei einem Vergleich festgestellt,
dass die beiden Hashes übereinstimmen auf der Basis einer
Gleichheit. Als ein Ergebnis wird das Schlüssel-Objekt 47,
d. h. das vieldeutige Wortobjekt 108, „TOP" ausgegeben
an einer Position von Priorität in Bezug auf das vieldeutige
Wortobjekt 108 „TOO", obwohl das vieldeutige Wortobjekt 108 „TOO" eine
relativ höhere Häufigkeit hat.
-
Die
Disambiguierungs-Routine 22 speichert als Eingabewerte 53 auch
Hashes, die repräsentativ sind für Interpunktionssymbole
und Nicht-Wort-Eingaben, zur Verwendung im Vergleich mit Kontextwert-Objekten 51 auf
die gleiche Weise. Dies ist nützlich bei einer Suche nach
Kontexten, wobei die Kontextwert-Objekte 51 repräsentativ
sind für Interpunktionszeichen, vorgegebene Formate und
dergleichen. Wenn zum Beispiel das vorgegebene Format ein Datumsformat
ist, wie oben vorgeschlagen, wird ein zugehöriges Schlüsselobjekt 47 an
einer bevorzugten Position ausgegeben, wenn ihm eine Eingabe in
der Form eines Datums vorangeht. Es ist offensichtlich, dass zahlreich
andere Typen von vordefinierten Formaten eingesetzt werden können,
wie ein anderes Datumsformat, wie „Monat Datum, Jahr" oder „Datum
Monat Jahr", Zeitformate und jeder andere Typ eines vorgegebenen
Formats, wenn als ein statistisch bedeutender Kontext festgestellt.
Es ist auch offensichtlich, dass zahlreiche andere Typen von Kontexten
mit der Disambiguierungs-Routine 22 identifiziert, gespeichert
und eingesetzt werden können, ohne von dem vorliegenden
Konzept abzuweichen.
-
Das
vorliegende System ist insbesondere vorteilhaft aufgrund seiner
Flexibilität. Es erfordert nicht die Einrichtung von umfassenden „Regeln"
für eine Priorisierung von Wörtern in Kontexten.
Stattdessen hat jedes weniger häufige vieldeutige Wort zugehörige
statistisch signifikante Kontextdaten, was der tragbaren elektronischen
Vorrichtung 4 ermöglicht, für die Bedürfnisse
des Benutzers anpassungsfähig und anpassbar zu sein.
-
Kurz
zusammengefasst, folglich, und allgemein dargestellt in 9 als
abzweigend von dem Hauptprozess bei 234 in 3A,
stellt die Disambiguierungs-Routine 22 fest, wie bei 604,
ob zumindest zwei der Wortobjekte 108, die bei 224 in 3A identifiziert
werden und gespeichert sind in dem Ergebnis, jeweils eine Länge
haben, die gleich ist zu der der vieldeutigen Eingabe, und folglich
vieldeutige Wortobjekte 108 sind, oder nicht. Wenn nicht,
kehrt die Verarbeitung zurück, wie bei 608, zu
dem Hauptprozess bei 236 in 3C. Wenn
bei 604 festgestellt wird, dass das Ergebnis zumindest
zwei vieldeutige Wortobjekte 108 umfasst, geht die Verarbeitung
weiter zu 612, wo festgestellt wird, ob ein Schlüssel-Objekt 47,
das einem der vieldeutigen Wortobjekte 108, außer
dem Wortobjekt 108 mit höchster Häufigkeit, entspricht,
in der Kontextdaten-Tabelle 49 gespeichert ist oder nicht.
Wenn nicht, kehrt die Verarbeitung zurück, wie bei 608,
zu dem Hauptprozess bei 236 in 3C.
-
Wenn
bei 612 festgestellt wird, dass ein entsprechendes Schlüssel-Objekt 47 existiert,
dann geht die Verarbeitung weiter, wie bei 616, wo die
Kontextwert-Objekte 51, die zu dem identifizierten Schlüssel-Objekt 47 gehören,
jeweils mit den gespeicherten Eingabewerten 53 verglichen
werden, um zu identifizieren, ob ein Schlüssel-Objekt 47 und
ein Eingabewert 53 übereinstimmen oder nicht.
Wenn keine übereinstimmen, kehrt die Verarbeitung zurück,
wie bei 608, zu dem Hauptprozess bei 236 in 3C. Wenn
jedoch festgestellt wird bei 616, dass Schlüssel-Objekt 47 und
ein Eingabewert 53 übereinstimmen, dann wird das
Wortobjekt 108, das dem Schlüssel-Objekt 47 entspricht,
ausgegeben, wie bei 620, an einer Position von Priorität
in Bezug auf das häufigste vieldeutige Wortobjekt 108,
das bei 604 identifiziert wird. Die Verarbeitung kehrt
dann zurück, wie bei 608, zu dem Hauptprozess
bei 236 in 3C.
-
Die
Disambiguierungs-Routine 22 ist zusätzlich vorteilhafterweise
konfiguriert, um bestimmte Kontextdaten zu lernen. Spezifisch kann
die Disambiguierungs-Routine 22 die Kontextdaten des vorangehenden
Wort-Typs identifizieren, wenn ein Benutzer bei zwei getrennten
Gelegenheiten ein bestimmtes weniger bevorzugtes vieldeutiges Wortobjekt 108 in
demselben Kontext auswählt.
-
Zum
Beispiel können bei einer ersten Gelegenheit eine Vielzahl
von vieldeutigen Wortobjekten 108 ausgegeben werden als
Reaktion auf eine erste vieldeutige Eingabe, und ein Benutzer kann
ein bestimmtes weniger bevorzugtes vieldeutiges Wortobjekt 108 auswählen.
In solch einem Umstand werden das gewählte weniger bevorzugte
vieldeutige Wortobjekt 108 und der spezifische Kontext
als eine Eingabe in einer Kandidatendatendatei gespeichert.
-
Wenn
bei einer zweiten Gelegenheit eine Vielzahl von vieldeutigen Wortobjekten 108 ausgegeben
werden als Reaktion auf eine zweite vieldeutige Eingabe und wenn
der Benutzer ein weniger bevorzugtes vieldeutiges Wortobjekt 108 auswählt,
werden das weniger bevorzugte vieldeutige Wortobjekt 108 und
der Kontext mit den verschiedenen Eingaben in der Kandidatendatendatei
verglichen. Wenn eine Eingabe in der Kandidatendatendatei gefunden
wird, die mit dem weniger bevorzugten vieldeutigen Wortobjekt 108 und
dem Kontext der zweiten vieldeutigen Eingabe übereinstimmt,
wird die Eingabe aus der Kandidatendatendatei zu der Kontextdaten-Tabelle 49 verschoben.
Die neu gespeicherte Eingabe in der Kontextdaten-Tabelle 49 kann
danach eingesetzt werden, wie oben dargelegt.
-
Es
wird jedoch angemerkt, dass die Kandidatendatendatei ein Datenpuffer
mit begrenzter Kapazität ist. Wenn zusätzliche
Eingaben zu der Kandidatendatendatei hinzugefügt werden,
werden ältere Eingaben, die nicht zu der Kontextdaten-Tabelle 49 verschoben
wurden, gelöscht auf einer „first-in-first-out"-Basis.
Die begrenzte Größe der Kandidatendatendatei fügt
somit zu der Kontext-Lernenfunktion so etwas wie eine Benutzungshäufigkeits-Begrenzung
hinzu. Das heißt, abhängig von einer Benutzung,
kann eine Eingabe in die Kandidatendatendatei entweder zu der Kontextdaten-Tabelle 49 verschoben
werden oder kann aus der Kandidatendatendatei entfernt werden, um
für zusätzliche Eingaben Platz zu machen. Wenn
die Eingabe zu der Kontextdaten-Tabelle 49 verschoben wird,
zeigt dies an, dass der Benutzer das bestimmte weniger bevorzugte
vieldeutige Wortobjekt 108 in dem bestimmten Kontext mit
genügender Häufigkeit wünscht, um dessen
Speicherung als gültige Kontextdaten zu gewährleisten.
Andererseits zeigt ein Löschen der Kandidateneingabe, um
Platz zu schaffen für zusätzliche Kandidateneingaben,
dass die Kandidateneingabe nicht mit ausreichender Regelmäßigkeit
oder Häufigkeit verwendet wurde, um zu gewährleisten,
dass sie gespeichert wird als gelernte gültige Kontextdaten
in der Kontextdaten-Tabelle 49.
-
Das
gewählte weniger bevorzugte vieldeutige Wortobjekt 108 wird
als ein Schlüssel-Objekt 47 in der Kontextdaten-Tabelle 49 gespeichert,
wenn solch ein Schlüssel-Objekt 47 noch nicht
existiert. Zusätzlich wird ein Hash des vorhergehenden
Wort-Kontextes als ein Kontextwert-Objekt 51 gespeichert
und dem vorher erwähnten Schlüssel-Objekt 47 zugeordnet.
In dieser Hinsicht kann der vorhergehende Wort-Kontext einfach das
unmittelbar vorangehende Wort sein. Es ist jedoch offensichtlich,
dass der Kontext möglicherweise einer sein kann, in dem
ein bestimmtes Kontext-Wort um zwei, drei oder mehr Wörter
dem vieldeutigen Wortobjekt 108 vorangeht, für das
der Kontext gelernt wird. Derartiger Kontext kann vorteilhafterweise
gelernt werden für Wortobjekte 108 in der „neue
Wörter"- Datenbank 92 und in jeder anderen Datenquelle
in dem Speicher 20. Es ist auch offensichtlich, dass andere
Typen von Kontexten durch die Disambiguierungs-Routine 22 gelernt
werden können.
-
Außerdem
können gelernte Kontextdaten verlernt werden. Zum Beispiel
können ein bestimmtes Schlüssel-Objekt 47 und
ein entsprechendes bestimmtes Kontextwert-Objekt 51 zu
der Kontextdaten-Tabelle 49 über die vorher erwähnte
Lernenfunktion hinzugefügt werden. An einem Punkt in der
Zukunft kann der Benutzer in dem bestimmten Kontext beginnen, eine
Ausgabe zu bevorzugen, die vorher eine Standard-Ausgabe war, zugunsten
dessen ein weniger bevorzugtes vieldeutiges Wortobjekt 108 bei zwei
Gelegenheiten gewählt wurde und als Kontextdaten gespeichert
wurde. Wenn dies bei zwei Gelegenheiten geschieht, werden das vorher
gelernte bestimmte Schlüssel-Objekt 47 und das
entsprechende bestimmte Kontextwert-Objekt 51 vorteilhafterweise verlernt,
d. h. aus der Kontextdaten-Tabelle 49 gelöscht.
Das heißt, das System arbeitet, als wenn das vorher gelernte
bestimmte Schlüssel-Objekt 47 und das entsprechende
bestimmte Kontextwert-Objekt 51 als keine gültigen
Kontextdaten bestimmt werden. Dies vermeidet die Verwendung von
Kontextdaten, die nicht gewünscht sind oder die als ungültig
angesehen werden.
-
Während
spezifische Ausführungsbeispiele des offenbarten und beanspruchten
Konzepts im Detail beschrieben wurden, ist für Fachleute
offensichtlich, dass verschiedene Modifikationen und Alternativen
zu jenen Details hinsichtlich der gesamten Lehren der Offenbarung
entwickelt werden können. Demgemäß sollen
die bestimmten Anordnungen, die offenbart werden, nur illustrativ
und nicht begrenzend sein hinsichtlich des Umfangs des offenbarten
und beanspruchten Konzepts, dem der volle Umfang der angefügten
Ansprüche und jedes und alle Äquivalente davon
gegeben werden soll.
-
Eine
tragbare elektronische Vorrichtung umfasst eine reduzierte QWERTY-Tastatur
und ist mit einer Disambiguierungs-Software versehen, die betriebsfähig
ist, eine Texteingabe zu disambiguieren. Zusätzlich zum
Identifizieren und Ausgeben von Repräsentationen von Sprachobjekten,
die in dem Speicher gespeichert sind und die einer Texteingabe entsprechen,
kann die Vorrichtung Kontextdaten in bestimmten Umständen
verwenden, um eine Ausgabe zu priorisieren und neue Kontextdaten
zu lernen.
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste
der vom Anmelder aufgeführten Dokumente wurde automatisiert
erzeugt und ist ausschließlich zur besseren Information
des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen
Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt
keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Patentliteratur
-
- - US 6452588 [0019]
- - US 6489950 [0019]