-
HINTERGRUND
-
Gebiet
-
Das
offenbarte und beanspruchte Konzept betrifft im Allgemeinen tragbare
bzw. handgehaltene elektronische Vorrichtungen (handheld electronic
devices) und insbesondere eine tragbare elektronische Vorrichtung,
die eine reduzierte Tastatur und eine „zusammengesetzter
Text"- bzw. Kompositum-Eingabe-Disambiguierungsfunktion hat, und
betrifft auch ein zugehöriges Verfahren.
-
Hintergrundinformation
-
Zahlreiche
Typen von tragbaren elektronischen Vorrichtungen sind bekannt. Beispiele
derartiger tragbarer elektronischer Vorrichtungen umfassen zum Beispiel
persönliche Datenassistenten (PDAs – personal
data assistants), tragbare Computer, Zweiweg-Pager, zellulare Telefone
und dergleichen. Viele tragbare elektronische Vorrichtungen weisen
auch eine drahtlose Kommunikationsfähigkeit auf, obwohl viele
derartige tragbare elektronische Vorrichtungen unabhängige
Vor richtungen sind, die ohne Kommunikation mit anderen Vorrichtungen
funktional sind.
-
Derartige
tragbare elektronische Vorrichtungen sollen im Allgemeinen tragbar
sein und haben folglich eine relativ kompakte Konfiguration, in
der Tasten und andere Eingabestrukturen häufig mehrfache
Funktionen unter bestimmten Umständen durchführen
oder anderweitig mehrere Aspekte oder Eigenschaften zugewiesen haben.
Mit Fortschritten in der Technologie werden tragbare elektronische
Vorrichtungen hergestellt, um immer kleinere Formfaktoren zu haben,
und dennoch eine immer größere Anzahl von Anwendungen
und Eigenschaften darauf zu haben. In der Praxis können
die Tasten eines Tastaturfelds nur auf eine bestimmte kleine Größe
verringert werden, bevor die Tasten relativ unbrauchbar werden.
Um eine Texteingabe zu ermöglichen, muss jedoch ein Tastaturfeld
zum Beispiel zur Eingabe aller sechsundzwanzig Buchstaben des lateinischen
Alphabets sowie einer passenden Interpunktion und anderer Symbole
fähig sein.
-
Eine
Art des Vorsehens von zahlreichen Buchstaben in einem kleinen Raum
war, eine „reduzierte Tastatur" vorzusehen, in der mehrere
Buchstaben, Symbole und/oder Zahlen und dergleichen, jeder gegebenen
Taste zugewiesen werden. Zum Beispiel umfasst ein Tastentouch-tone)-Telefon
ein reduziertes Tastaturfeld durch Vorsehen von zwölf Tasten, von
denen zehn Zahlen darauf haben und von diesen zehn Tasten haben
acht lateinische Buchstaben zugewiesen. Zum Beispiel umfasst eine
der Tasten die Zahl „2" sowie die Buchstaben „A", „B"
und „C". Andere bekannte reduzierte Tastaturen umfassten
andere Anordnungen für Tasten, Buchstaben, Symbole, Zahlen
und dergleichen. Da eine einzige Betätigung einer derartigen
Taste von dem Benutzer vorgesehen sein kann, sich möglicherweise
auf einen der Buchstaben „A", „B" und „C"
zu beziehen und sich möglicherweise auch auf die Zahl „2"
beziehen soll, ist die Eingabe im Allgemeinen eine vieldeutige (ambiguous)
Eingabe und bedarf eines Typs einer Disambiguierung, um für
Texteingabezwecke nützlich zu sein.
-
Um
einem Benutzer zu ermöglichen, die mehrfachen Buchstaben,
Zahlen und dergleichen auf jeder gegebenen Taste zu verwenden, wurden
zahlreiche Tastenanschlags-Interpretationssysteme vorgesehen. Zum
Beispiel ermöglicht ein „Mehrfach-Tippen(multi-tap)"-System
einem Benutzer, im Wesentlichen eindeutig ein bestimmtes Zeichen
auf einer Taste zu spezifizieren durch Drücken derselben
Taste mehrere Male, äquivalent zu der Position des gewünschten
Zeichens auf der Taste. Zum Beispiel drückt auf der vorher
erwähnten Telefontaste, welche die Buchstaben „ABC"
umfasst, und wenn der Benutzer wünscht, den Buchstaben „C"
zu spezifizieren, der Benutzer die Taste drei Mal. Während
solche Mehrfach-Tippen-Systeme im Allgemeinen effektiv waren für
ihre vorgesehenen Zwecke, können sie trotzdem eine relativ
große Anzahl von Tasteneingaben erfordern, im Vergleich
zu der Anzahl von Zeichen, die schließlich ausgegeben werden.
-
Ein
anderes beispielhaftes Tastenanschlags-Interpretationssystem umfasst
ein Tasten-„Chording", von dem verschiedene Typen existieren.
Zum Beispiel kann ein bestimmtes Zeichen eingegeben werden durch
Drücken zweier Tasten hintereinander oder durch Drücken
und Halten einer ersten Taste, während eine zweite Taste
gedrückt wird. Ein weiteres beispielhaftes Tastenanschlags-Interpretationssystem
ist eine „Drücken-und-Halten/Drücken-und-Freigabe"-Interpretationsfunktion,
in der eine gegebene Taste ein erstes Resultat liefert, wenn die
Taste betätigt und sofort losgelassen wird, und ein zweites
Resultat liefert, wenn die Taste für eine kurze Zeitdauer
betätigt und gehalten wird. Während diese Systeme
ebenfalls für ihre beabsichtigten Zwecke im Allgemeinen
effektiv sind, haben derartige Systeme auch ihre eigenen eindeutigen
Nachteile.
-
Ein
weiteres Tastenanschlags-Interpretationssystem, das eingesetzt wurde,
ist eine Software-basierte Text-Disambiguierungsfunktion. In solch einem
System drückt ein Benutzer typischerweise Tasten, denen
ein oder mehrere Zeichen zugewiesen wurden, im Allgemeinen wird
jede Taste ein Mal für jeden gewünschten Buchstaben
gedrückt, und die Disambiguierungs-Software versucht, die
beabsichtigte Eingabe vorauszusagen. Zahlreiche derartige Systeme
wurden vorgeschlagen und während viele für ihre
beabsichtigten Zwecken im Allgemeinen effektiv waren, existieren
weiterhin Defizite.
-
Es
wäre wünschenswert, eine verbesserte tragbare
elektronische Vorrichtung mit einer reduzierten Tastatur vorzusehen,
die versucht, eine QWERTY-Tastatur-Erfahrung oder eine andere bestimmte Tastaturerfahrung
zu imitieren. Solch eine verbesserte tragbare elektronische Vorrichtung
kann auch wünschenswerterweise konfiguriert werden mit
ausreichenden Eigenschaften, um eine Texteingabe und andere Aufgaben
mit relativer Mühelosigkeit zu ermöglichen.
-
KURZE BESCHREIBUNG DER ZEICHNUNGEN
-
Ein
vollständiges Verständnis kann aus der folgenden
Beschreibung gewonnen werden, wenn in Verbindung mit den beigefügten
Zeichnungen gelesen, wobei:
-
1 eine
Draufsicht auf eine verbesserte tragbare elektronische Vorrichtung
gemäß dem offenbarten und beanspruchten Konzept
ist;
-
2 eine
schematische Darstellung der verbesserten tragbaren elektronischen
Vorrichtung der 1 ist;
-
2A eine
schematische Darstellung eines Teils der tragbaren elektronischen
Vorrichtung von 2 ist;
-
3A und 3B ein
beispielhaftes Flussdiagramm zeigen, das bestimmte Aspekte einer
Disambiguierungsfunktion darstellt, die auf der tragbaren elektronischen
Vorrichtung der 1 ausgeführt werden
kann;
-
4 ein
weiteres beispielhaftes Flussdiagramm ist, das bestimmte Aspekte
einer Disambiguierungsfunktion darstellt, die auf der tragbaren elektronischen
Vorrichtung ausgeführt werden kann, wodurch dem Benutzer
bestimmte Ausgabevarianten geliefert werden können;
-
5A und 5B ein
weiteres beispielhaftes Flussdiagramm zeigen, das bestimmte Aspekte eines
Lern-Verfahrens darstellt, das auf der tragbaren elektronischen
Vorrichtung ausgeführt werden kann;
-
6 ein
weiteres beispielhaftes Flussdiagramm ist, das bestimmte Aspekte
eines Verfahrens darstellt, durch das verschiedene Anzeigeformate auf
der tragbaren elektronischen Vorrichtung vorgesehen werden können;
-
7 eine
beispielhafte Ausgabe während eines Texteingabebetriebs
ist;
-
8 eine
weitere beispielhafte Ausgabe während eines anderen Teils
des Texteingabebetriebes ist;
-
9 eine
weitere beispielhafte Ausgabe während eines anderen Teils
des Texteingabebetriebes ist;
-
10 eine
weitere beispielhafte Ausgabe während eines anderen Teils
des Texteingabebetriebes ist;
-
11 eine
beispielhafte Ausgabe auf der tragbaren elektronischen Vorrichtung
während eines anderen Texteingabebetriebes ist;
-
12 eine
beispielhafte Ausgabe ist, die in einem Fall geliefert werden kann,
wenn die Disambiguierungsfunktion der tragbaren elektronischen Vorrichtung
deaktiviert wurde;
-
13 eine
schematische Darstellung einer vieldeutigen Eingabe in die tragbare
elektronische Vorrichtung von 1 ist;
-
13A eine schematische Darstellung der vieldeutigen
Eingabe von 13 gemäß einer
Kompositum-Lösung ist;
-
13B eine schematische Darstellung der vieldeutigen
Eingabe von 13 gemäß einer
weiteren Kompositum-Lösung ist;
-
13C eine schematische Darstellung der vieldeutigen
Eingabe von 13 gemäß einer
weiteren Kompositum-Lösung ist;
-
13D eine schematische Darstellung der vieldeutigen
Eingabe von 13 gemäß einer
weiteren Kompositum-Lösung ist;
-
13E eine schematische Darstellung der vieldeutigen
Eingabe von 13 gemäß einer
weiteren Kompositum-Lösung ist;
-
13F eine schematische Darstellung der vieldeutigen
Eingabe von 13 gemäß einer
weiteren Kompositum-Lösung ist;
-
13G eine schematische Darstellung der vieldeutigen
Eingabe von 13 gemäß einer
weiteren Kompositum-Lösung ist;
-
14 eine
schematische Darstellung einer Ausgabe einer Darstellung zumindest
eines Teils einer Kompositum-Lösung ist;
-
15A, 15B und 15C weitere beispielhafte Flussdiagramme sind,
die bestimmte Aspekte eines Verfahrens darstellen, das auf der tragbaren
elektronischen Vorrichtung ausgeführt werden kann; und
-
16 eine
schematische Darstellung einer weiteren vieldeutigen Eingabe in
die tragbare elektronische Vorrichtung von 1 ist.
-
Ähnliche
Ziffern beziehen sich auf ähnliche Teile in der Spezifikation.
-
BESCHREIBUNG
-
Eine
verbesserte tragbare elektronische Vorrichtung
4 wird allgemein
in der
1 gezeigt und wird schematisch in der
2 dargestellt.
Die beispielhafte tragbare elektronische Vorrichtung
4 umfasst
ein Gehäuse
6, auf dem eine Prozessoreinheit angebracht
ist, die eine Eingabevorrichtung
8, eine Ausgabevorrichtung
12,
einen Prozessor
16 und einen Speicher
20 umfasst
und zumindest eine erste Routine. Der Prozessor
16 kann
zum Beispiel und ohne Einschränkung ein Mikroprozessor
(μP) sein und reagiert auf Eingaben von der Eingabevorrichtung
8 und
liefert Ausgabesignale an die Ausgabevorrichtung
12. Der
Prozessor
16 ist auch mit dem Speicher
20 verbunden.
Der Prozessor
16 und der Speicher
20 bilden zusammen
eine Prozessorvorrichtung. Beispiele von tragbaren elektronischen
Vorrichtungen sind in den
U.S.-Patenten
Nr. 6,452,588 und
6,489,950 enthalten.
-
Wie
aus der 1 offensichtlich ist, umfasst die
Eingabevorrichtung 8 ein Tastaturfeld 24 und ein Thumbwheel 32.
Wie detaillierter unten beschrieben wird, ist das Tastaturfeld 24 in
der beispielhaften Form einer reduzierten QWERTY-Tastatur einschließlich
einer Vielzahl von Tasten 28, die als Eingabeelemente dienen.
Es wird jedoch angemerkt, dass das Tastaturfeld 24 andere
Konfigurationen haben kann, wie eine AZERTY-Tastatur, eine QWERTZ-Tastatur
oder eine andere Tastaturanordnung, ob momentan bekannt oder unbekannt
und entweder reduziert oder nicht reduziert. Wie hierin eingesetzt,
sollen der Ausdruck „reduziert" und Variationen davon in
dem Kontext einer Tastatur, eines Tastaturfelds oder einer anderen
Anordnung von Eingabeelementen breit auf eine Anordnung verweisen, in
der zumindest einem der Eingabeelemente eine Vielzahl von linguistischen
Elementen zugewiesen ist, wie zum Beispiel Zeichen in dem Satz von
lateinischen Buchstaben, wobei eine Betätigung des zumindest
einen der Eingabeelemente, ohne eine andere Eingabe in Kombination
damit, eine vieldeutige Eingabe ist, da sie mehr als eines der Vielzahl
der zugewiesenen linguistischen Elemente betreffen kann. Wie hierin
eingesetzt, sollen der Ausdruck „linguistisches Element"
und Variationen davon breit auf jedes Element verweisen, das selbst
ein Sprachobjekt sein kann oder aus welchem ein Sprachobjekt konstruiert, identifiziert
oder anderweitig erhalten werden kann, und umfasst folglich zum
Beispiel und ohne Einschränkung Zeichen, Buchstaben, Anschläge,
Ideogramme, Phoneme, Morpheme, Zahlen und dergleichen. Wie hierin
eingesetzt, sollen der Aus druck „Sprachobjekt" und Variationen
davon breit auf jeden Typ von Objekt verweisen, der aus einem oder
mehreren linguistischen Elementen konstruiert, identifiziert oder
anderweitig erhalten werden kann, die alleine oder in Kombination
verwendet werden können, um Text zu erzeugen, und das umfasst
zum Beispiel und ohne Einschränkung Wörter, Abkürzungen, Symbole,
Ideogramme und dergleichen.
-
Die
Systemarchitektur der tragbaren elektronischen Vorrichtung 4 ist
vorteilhafterweise organisiert, um unabhängig von dem spezifischen
Layout des Tastaturfelds 24 betriebsfähig zu sein.
Demgemäß kann die Systemarchitektur der tragbaren
elektronischen Vorrichtung 4 in Verbindung mit praktisch jedem
Tastaturfeld-Layout eingesetzt werden, im Wesentlichen ohne eine
bedeutsame Änderung in der Systemarchitektur zu erfordern.
Es wird weiter angemerkt, dass bestimmte der Eigenschaften, die
hierin dargelegt werden, entweder auf einer oder auf beiden einer
reduzierten Tastatur und einer nicht reduzierten Tastatur verwendbar
sind.
-
Die
Tasten 28 sind auf einer Vorderseite des Gehäuses 6 angeordnet
und das Thumbwheel 32 ist an einer Seite des Gehäuses 6 angeordnet.
Das Thumbwheel 32 kann als ein weiteres Eingabeelement
dienen und ist sowohl drehbar, wie durch den Pfeil 34 angezeigt
wird, um Auswahleingaben an den Prozessor 16 zu liefern,
und kann auch gedrückt werden in eine Richtung im Allgemeinen
zum Gehäuse 6 hin, wie durch den Pfeil 38 angezeigt
wird, um eine andere Auswahleingabe an den Prozessor 16 zu
liefern.
-
Unter
den Tasten 28 des Tastaturfelds 24 sind eine <NÄCHSTE
(NEXT)>-Taste 40 und
ein <EINGABE (ENTER)>-Taste 44.
Die <NEXT>-Taste 40 kann
gedrückt werden, um eine Auswahl-Eingabe an den Prozessor 16 zu
liefern und liefert im Wesentlichen dieselbe Auswahl-Eingabe, wie
sie von einer Rotations-Eingabe des Thumbwheels 32 geliefert wird.
Da die <NEXT>-Taste 40 angren zend
an eine Anzahl von anderen Tasten 28 des Tastaturfelds 24 vorgesehen
ist, kann der Benutzer eine Auswahl-Eingabe an den Prozessor 16 liefern
im Wesentlichen ohne die Hände des Benutzers während
eines Texteingabebetriebes weg von dem Tastaturfeld 24 zu bewegen.
Wie detaillierter unten beschrieben wird, umfasst die <NEXT>-Taste 40 zusätzlich
und vorteilhafterweise eine darauf angeordnete Grafik 42,
und unter bestimmten Umständen zeigt die Ausgabevorrichtung 12 auch
eine angezeigte Grafik 46 darauf an, um die <NEXT>-Taste 40 zu
identifizieren, die in der Lage ist, eine Auswahl-Eingabe an den
Prozessor 16 zu liefern. In dieser Hinsicht ist die angezeigte Grafik 46 der
Ausgabevorrichtung 12 im Wesentlichen ähnlich
zu der Grafik 42 auf der <NEXT>-Taste und identifiziert
folglich die <NEXT>-Taste 40 als
fähig, eine wünschenswerte Auswahl-Eingabe an
den Prozessor 16 zu liefern.
-
Wie
in 1 weiter gesehen werden kann, umfassen viele der
Tasten 28 eine Anzahl von darauf angeordneten linguistischen
Elementen 48. Wie hierin eingesetzt, soll der Ausdruck „eine
Anzahl von" und Variationen davon breit auf jede Quantität,
einschließlich einer Quantität von eins, verweisen
und kann in bestimmten Umständen hierin auch auf eine Quantität
von Null verweisen. In der beispielhaften Darstellung des Tastaturfelds 24 umfassen
viele der Tasten 28 zwei linguistische Elemente darauf,
wie Umfassen eines ersten linguistischen Elements 52 und
eines zweiten linguistischen Elements 56.
-
Eine
der Tasten 28 des Tastaturfelds 24 umfasst als
die Zeichen 48 davon die Buchstaben „Q" und „W",
und eine angrenzende Taste 28 umfasst als die Zeichen 48 davon
die Buchstaben „E" und „R". Es ist zu sehen, dass
die Anordnung der Zeichen 48 auf den Tasten 28 des
Tastaturfelds 24 im Allgemeinen eine QWERTY-Anordnung ist,
wenngleich viele der Tasten 28 zwei der Zeichen 28 umfassen.
-
Die
Ausgabevorrichtung 12 umfasst eine Anzeige 60,
auf der eine Ausgabe 64 vorgesehen werden kann. Eine beispielhafte
Ausgabe 64 wird auf der Anzeige 60 in der 1 dargestellt.
Die Ausgabe 64 umfasst eine Textkomponente 68 und
eine Varianten-Komponente 72. Die Varianten-Komponente 72 umfasst
einen Standard-Teil 76 und einen Varianten-Teil 80.
Die Anzeige umfasst auch ein Caret-Zeichen 84, das im Allgemeinen
darstellt, wo die nächste Eingabe von Eingabevorrichtung 8 empfangen wird.
-
Die
Textkomponente 68 der Ausgabe 64 liefert eine
Darstellung des Standard-Teils 76 der Ausgabe 64 an
einer Position auf der Anzeige 60, wo der Text eingegeben
wird. Die Varianten-Komponente 72 wird im Allgemeinen in
der Nähe der Textkomponente 68 angeordnet und
liefert, zusätzlich zu der standardmäßigen
vorgeschlagenen Ausgabe 76, eine Darstellung der verschiedenen
alternativen Textwahlmöglichkeiten, d. h. Alternativen
zu der standardmäßigen vorgeschlagenen Ausgabe 76,
die durch eine Eingabe-Disambiguierungsfunktion in Reaktion auf eine
Eingabesequenz von Tastenbetätigungen der Tasten 28 vorgeschlagen
werden.
-
Wie
detaillierter unten beschrieben wird, wird der Standard-Teil 76 durch
die Disambiguierungsfunktion vorgeschlagen als die wahrscheinlichste
disambiguierte Interpretation der vieldeutigen Eingabe, die durch
den Benutzer vorgesehen ist. Der Varianten-Teil 80 umfasst
eine vorgegebene Quantität von alternativen vorgeschlagenen
Interpretationen derselben vieldeutigen Eingabe, aus denen der Benutzer
wählen kann, wenn gewünscht. Die angezeigte Grafik 46 wird
typischerweise vorgesehen in der Varianten-Komponente 72 in
der Nähe des Varianten-Teils 80, obwohl offensichtlich
ist, dass die angezeigte Grafik 46 an anderen Positionen
und auf andere Arten vorgesehen werden kann. Es wird auch angemerkt,
dass der beispielhafte Varianten-Teil 80 hierin dargestellt
wird als sich vertikal unter den Standard-Teil 76 erstreckend,
aber es ist offensichtlich, dass zahlreich andere Anordnungen vorgesehen werden
können.
-
Unter
den Tasten 28 des Tastaturfelds 24 ist zusätzlich
eine <LÖSCHEN
(DELETE)>-Taste 86, die
vorgesehen werden kann, um eine Texteingabe zu löschen.
Wie detaillierter unten beschrieben wird, kann die <DELETE>-Taste 86 auch
eingesetzt werden, wenn eine Alternativeingabe an den Prozessor 16 geliefert
wird zur Verwendung durch die Disambiguierungsfunktion.
-
Der
Speicher 20 wird schematisch in der 2A dargestellt.
Der Speicher 20 kann jeder einer Vielzahl von Typen von
internen und/oder externen Speichermedien sein, wie, ohne Einschränkung, RAM,
ROM, EPROM(s), EEPROM(s) und dergleichen, die ein Speicherregister
zur Datenspeicherung vorsehen, wie in der Art eines internen Speicherbereichs
eines Computers, und kann ein volatiler Speicher oder ein nicht-volatiler
Speicher sein. Der Speicher 20 umfasst zusätzlich
eine Anzahl von Routinen, die allgemein mit dem Bezugszeichen 22 dargestellt werden,
für die Verarbeitung von Daten. Die Routinen 22 können
in jeder einer Vielzahl von Formen sein, wie, ohne Einschränkung,
Software, Firmware und dergleichen. Wie detaillierter unten erklärt
wird, umfassen die Routinen 22 die vorher erwähnte
Disambiguierungsfunktion als eine Anwendung sowie andere Routinen.
-
Wie
aus der 2A zu verstehen ist, umfasst
der Speicher 20 zusätzlich Daten, die in einer Anzahl
von Tabellen, Sätzen, Listen und/oder anderweitig gespeichert
und/oder organisiert sind. Spezifisch umfasst der Speicher 20 eine
generische Wortliste 88, eine „neue Wörter"-Datenbank 92 und
eine Häufigkeits-Lernen-Datenbank 96. In den verschiedenen
Bereichen des Speichers 20 ist eine Anzahl von Sprachobjekten 100 und
Häufigkeitsobjekten 104 gespeichert. Die Sprachobjekte 100 gehören
im Allgemeinen jeweils zu einem zugehörigen Häufigkeitsobjekt 104.
Die Sprachobjekte 100 umfassen in dem vorliegenden beispielhaften
Ausführungsbeispiel eine Vielzahl von Wortobjekten 108 und
eine Vielzahl von N-Gramm-Objekten 112. Die Wortobjekte 108 sind
allgemein repräsentativ für komplette Wörter
in der Sprache oder kundenspezifische Wörter, die in dem
Speicher 20 gespeichert sind. Wenn zum Beispiel die in
dem Speicher gespeicherte Sprache zum Beispiel Englisch ist, repräsentiert
im Allgemeinen jedes Wortobjekt 108 ein Wort in der englischen
Sprache oder repräsentiert ein kundenspezifisches Wort.
-
Zu
im Wesentlichen jedem Wortobjekt 108 gehört ein
Häufigkeitsobjekt 104, das einen Häufigkeitswert
hat, der die relative Häufigkeit innerhalb der relevanten
Sprache des gegebenen Wortes anzeigt, das durch das Wortobjekt 108 repräsentiert
wird. In dieser Hinsicht umfasst die generische Wortliste 88 einen
Korpus von Wortobjekten 108 und zugehörigen Häufigkeitsobjekten 104,
die zusammen eine breite Vielfalt von Wörtern und ihre
relative Häufigkeit in einer gegebenen Umgangssprache von
zum Beispiel einer gegebenen Sprache darstellen. Die generische Wortliste 88 kann
auf eine einer breiten Vielfalt von Arten abgeleitet werden, wie
durch Analysieren zahlreicher Texte und anderer Sprachquellen, um
die verschiedenen Wörter innerhalb der Sprachquellen sowie
ihre relativen Wahrscheinlichkeiten, d. h. relativen Häufigkeiten,
des Auftretens der verschiedenen Wörter in den Sprachquellen
zu bestimmen.
-
Die
N-Gramm-Objekte 112, die in der generischen Wortliste 88 gespeichert
sind, sind kurze Ketten von Zeichen in der relevanten Sprache, typischerweise
zum Beispiel ein bis drei Zeichen in der Länge und repräsentieren
typischerweise Wortfragmente in der relevanten Sprache, obwohl bestimmte
der N-Gramm-Objekte 112 zusätzlich selbst Wörter
sein können. Jedoch zu dem Ausmaß, dass ein N-Gramm-Objekt 112 auch
ein Wort in der relevanten Sprache ist, wird dasselbe Wort wahrscheinlich
separat gespeichert als ein Wortobjekt 108 in der generischen
Wortliste 88. Wie hier eingesetzt, sollen der Ausdruck „Kette
(string)" und Variationen davon breit auf ein Objekt verweisen,
das ein oder mehrere Zeichen oder Komponenten hat, und kann sich
auf eines eines kompletten Wortes, eines Fragments eines Wortes,
eines kundenspezifischen Wortes oder eines Ausdrucks und dergleichen
beziehen.
-
In
dem vorliegenden beispielhaften Ausführungsbeispiel der
tragbaren elektronischen Vorrichtung 4 umfassen die N-Gramm-Objekte 112 1-Gramm-Objekte,
d. h. Ketten- bzw. String-Objekte, die ein Zeichen in der Länge
sind, 2-Gramm-Objekte, d. h. String-Objekte, die zwei Zeichen in
der Länge sind, und 3-Gramm-Objekte, d. h. String-Objekte,
die drei Zeichen in der Länge sind, die kollektiv als N-Gramme 112 bezeichnet
werden. Im Wesentlichen gehört jedes N-Gramm-Objekt 112 in
der generischen Wortliste 88 ähnlich zu einem
zugehörigen Häufigkeitsobjekt 104, das
in der generischen Wortliste 88 gespeichert ist, aber das
Häufigkeitsobjekt 104, das zu einem gegebenen
N-Gramm-Objekt 112 gehört, hat einen Häufigkeitswert,
der die relative Wahrscheinlichkeit anzeigt, dass der Zeichen-String, der
durch das bestimmte N-Gramm-Objekt 112 repräsentiert
wird, an jeder Position in jedem Wort der relevanten Sprache existiert.
Die N-Gramm-Objekte 112 und die zugehörigen Häufigkeitsobjekte 104 sind ein
Teil des Korpus der generischen Wortliste 88 und werden
auf eine Art erlangt, die ähnlich ist zu der Art, auf die
das Wortobjekt 108 und die zugehörigen Häufigkeitsobjekte 104 erlangt
werden, obwohl die Analyse, die bei der Erlangung der N-Gramm-Objekte 112 durchgeführt
wird, etwas unterschiedlich ist, da sie eine Analyse der verschiedenen
Zeichen-Strings in den verschiedenen Wörter umfasst, statt
sich hauptsächlich auf das relative. Auftreten eines gegebenen
Wortes zu verlassen.
-
Das
vorliegende beispielhafte Ausführungsbeispiel der tragbaren
elektronischen Vorrichtung 4, deren beispielhafte Sprache
die englische Sprache ist, umfasst sechsundzwanzig 1-Gramm-N-Gramm-Objekte 112,
d. h. ein 1-Gramm-Objekt für jeden der sechsundzwanzig Buchstaben
im lateinischen Alphabet, auf dem die englische Sprache basiert,
und umfasst weiter 676 2-Gramm-N-Gramm-Objekte 112, d.
h. sechsundzwanzig hoch zwei, wodurch jede zwei-Buchstaben- Permutation
der sechsundzwanzig Buchstaben in dem lateinischen Alphabet dargestellt
wird.
-
Die
N-Gramm-Objekte 112 umfassen auch eine bestimmte Quantität
von 3-Gramm-N-Gramm-Objekten 112, primär diejenigen,
die eine relativ hohe Häufigkeit in der relevanten Sprache
haben. Das beispielhafte Ausführungsbeispiel der tragbaren
elektronischen Vorrichtung 4 umfasst weniger als alle der
Drei-Buchstaben-Permutationen der sechsundzwanzig Buchstaben des
lateinischen Alphabets aufgrund von Berücksichtigungen einer
Datenspeichergröße und auch, da die 2-Gramm-N-Gramm-Objekte 112 bereits
eine bedeutsame Menge von Information hinsichtlich der relevanten
Sprache liefern können. Wie detaillierter unten dargelegt
wird, liefern die N-Gramm-Objekte 112 und ihre zugehörigen
Häufigkeitsobjekte 104 Häufigkeitsdaten,
die Zeichen-Strings zugeschrieben werden können, für
die ein entsprechendes Wortobjekt 108 nicht identifiziert
werden kann oder nicht identifiziert wurde, und wird typischerweise
als eine Rückfall-Datenquelle eingesetzt, obwohl dies nicht
exklusiv der Fall sein muss.
-
In
dem vorliegenden beispielhaften Ausführungsbeispiel werden
die Sprachobjekte 100 und die Häufigkeitsobjekte 104 im
Wesentlichen unberührt in der generischen Wortliste 88 gepflegt,
was bedeutet, dass der grundlegende Sprachenkorpus in der generischen
Wortliste 88 im Wesentlichen unverändert bleibt,
und die Lernen-Funktionen, die von der tragbaren elektronischen
Vorrichtung 4 vorgesehen werden und die unten beschrieben
werden, funktionieren in Verbindung mit anderen Objekten, die im
Allgemeinen woanders in dem Speicher 20 gespeichert sind, wie
zum Beispiel in der „neue Wörter"-Datenbank 92 und
der Häufigkeits-Lernen-Datenbank 96.
-
Die „neue
Wörter"-Datenbank 92 und die Häufigkeits-Lernen-Datenbank 96 speichern
zusätzliche Wortobjekte 108 und zugehörige
Häufigkeitsobjekte 104, um einem Benutzer eine
kundenspezifische Erfahrung zu liefern, in der Wörter und
dergleichen, die relativ häufiger von einem Benutzer benutzt werden,
relativ höhere Häufigkeitswerte haben, als ansonsten
in der generischen Wortliste 88 reflektiert wird. Insbesondere
umfasst die „neue Wörter"-Datenbank 92 Wortobjekte 108,
die Benutzer-definiert sind und die im Allgemeinen nicht unter den
Wortobjekten 108 der generischen Wortliste 88 zu
finden sind. Jedes Wortobjekt 108 in der „neue
Wörter"-Datenbank 92 hat zugehörig ein
zugehöriges Häufigkeitsobjekt 104, das
auch in der „neue Wörter"-Datenbank 92 gespeichert
ist. Die Häufigkeits-Lernen-Datenbank 96 speichert
Wortobjekte 108 und zugehörige Häufigkeitsobjekte 104,
die eine relativ häufigere Benutzung derartiger Wörter
durch einen Benutzer anzeigen, als in der generischen Wortliste 88 reflektiert
würde. Somit sehen die „neue Wörter"-Datenbank 92 und
die Häufigkeits-Lernen-Datenbank 96 zwei Lernen-Funktionen
vor, das heißt, sie liefern zusammen die Fähigkeit,
neue Wörter zu lernen, sowie die Fähigkeit, geänderte
Häufigkeitswerte für bekannte Wörter
zu lernen.
-
Die 3A und 3B zeigen
auf eine beispielhafte Art und Weise den allgemeinen Betrieb bestimmter
Aspekte der Disambiguierungsfunktion der tragbaren elektronischen
Vorrichtung 4. Zusätzliche Merkmale, Funktionen
und dergleichen werden anderswo dargestellt und beschrieben.
-
Eine
Eingabe wird erfasst, wie bei 204, und die Eingabe kann
jeder Typ einer Betätigung oder ein anderer Betrieb hinsichtlich
jedes Teils der Eingabevorrichtung 8 sein. Eine typische
Eingabe umfasst zum Beispiel eine Betätigung einer Taste 28 mit
einer Anzahl von Zeichen 48 darauf, oder jeder andere Typ einer
Betätigung oder Manipulation der Eingabevorrichtung 8.
-
Bei
Erfassung einer Eingabe bei 204 wird ein Timer bei 208 zurückgestellt.
Die Verwendung des Timers wird detaillierter unten beschrieben.
-
Die
Disambiguierungsfunktion bestimmt dann, wie bei 212, ob
die aktuelle Eingabe eine Bedieneingabe, wie eine Auswahl-Eingabe,
eine Begrenzungszeichen- bzw. Delimiter-Eingabe, eine Bewegungs-Eingabe,
eine Umschalt-Eingabe oder zum Beispiel eine andere Eingabe ist,
die keine Betätigung einer Taste 28 darstellt,
die eine Anzahl von Zeichen 48 darauf hat. Wenn bei 212 festgestellt
wird, dass die Eingabe keine Bedieneingabe ist, geht die Verarbeitung
bei 216 weiter durch Hinzufügen der Eingabe zu
der aktuellen Eingabe-Sequenz, die bereits eine Eingabe umfassen
kann oder nicht.
-
Viele
der bei 204 erfassten Eingaben werden eingesetzt bei der
Erzeugung von Eingabe-Sequenzen, bei denen die Disambiguierungsfunktion
ausgeführt wird. Eine Eingabe-Sequenz wird in jeder „Sitzung"
mit jeder Betätigung einer Taste 28 mit einer Anzahl
von Zeichen 48 darauf aufgebaut. Da eine Eingabe-Sequenz
typischerweise aus zumindest einer Betätigung einer Taste 28 mit
einer Vielzahl von Zeichen 48 darauf besteht, ist die Eingabe-Sequenz vieldeutig.
Wenn zum Beispiel ein Wort vollständig ist, wird die aktuelle
Sitzung beendet und eine neue Sitzung wird initiiert.
-
Eine
Eingabe-Sequenz wird stufenweise auf der tragbaren elektronischen
Vorrichtung 4 aufgebaut mit jeder aufeinander folgenden
Betätigung einer Taste 28 während jeder
gegebenen Sitzung. Spezifisch wird, sobald eine Delimiter-Eingabe
während einer gegebenen Sitzung erfasst wird, die Sitzung
beendet und eine neue Sitzung wird initiiert. Jede Eingabe, die
aus einer Betätigung einer der Tasten 28 mit einer
damit verbundenen Anzahl von Zeichen 48 resultiert, wird
sequentiell zu der aktuellen Eingabe-Sequenz hinzugefügt.
Da die Eingabe-Sequenz während einer gegebenen Sitzung
wächst, wird die Disambiguierungsfunktion im Allgemeinen
mit jeder Betätigung einer Taste 28 ausgeführt,
d. h. und hinsichtlich der gesamten Eingabe-Sequenz eingegeben.
Anders ausgedrückt, in einer gegebenen Sitzung wird versucht,
die wachsende Eingabe-Sequenz als eine Einheit durch die Disambiguierungsfunktion
zu disambiguieren mit jeder nachfolgenden Betätigung der
verschiedenen Tasten 28.
-
Sobald
eine aktuelle Eingabe, die eine letzte Betätigung einer
der Tasten 28 mit einer Anzahl der dazu gehörenden
Zeichen 48 darstellt, zu der aktuellen Eingabe-Sequenz
in der aktuellen Sitzung hinzugefügt wurde, wie bei 216 in
der 3A, erzeugt die Disambiguierungsfunktion, wie
bei 220, im Wesentlichen alle Permutationen der Zeichen 48,
die den verschiedenen Tasten 28 zugewiesen werden, die
getätigt wurden bei der Erzeugung der Eingabe-Sequenz. In
dieser Hinsicht beziehen sich „Permutationen" auf die verschiedenen
Strings, die aus den Zeichen 48 jeder gedrückten
Taste 28 resultieren können, begrenzt durch die
Reihenfolge, in der die Tasten 28 betätigt wurden.
Die verschiedenen Permutationen der Zeichen in der Eingabe-Sequenz
werden als Präfixobjekte eingesetzt.
-
Wenn
zum Beispiel die aktuelle Eingabe-Sequenz in der aktuellen Sitzung
die vieldeutige Eingabe der Tasten „AS" und „OP"
ist, sind die verschiedenen Permutationen des ersten Zeichens 52 und
des zweiten Zeichens 56 von jeder der zwei Tasten 28, wenn
betrachtet in der Reihenfolge, in der die Tasten 28 betätigt
wurden, „SO", „SP", „AP" und „AO"
und jedes von diesen ist ein Präfixobjekt, das erzeugt
wird, wie bei 220, hinsichtlich der aktuellen Eingabe-Sequenz.
Wie detaillierter unten erklärt, versucht die Disambiguierungsfunktion,
für jedes Präfixobjekt eines der Wortobjekte 108 zu
identifizieren, für welches das Präfixobjekt ein
Präfix sein würde.
-
Für
jedes erzeugte Präfixobjekt wird der Speicher 20 konsultiert,
wie bei 224, um, wenn möglich, für jedes
Präfixobjekt eines der Wortobjekte 108 in dem
Speicher 20 zu identifizieren, das dem Präfixobjekt
entspricht, was bedeutet, dass die Sequenz der Buchstaben, die durch
das Präfixobjekt dargestellt wird, entweder ein Präfix
des identifizierten Wortobjektes 108 ist oder im Wesentlichen
identisch zu der Gesamtheit des Wortobjektes 108 ist. Weiter ist
in dieser Hinsicht das Wortobjekt 108, das zu identifizieren
versucht wird, das Wortobjekt 108 mit der höchsten
Häufigkeit. Das heißt, die Disambiguierungsfunktion
versucht, das Wortobjekt 108 zu identifizieren, das dem
Präfixobjekt entspricht und das auch zu einem Häufigkeitsobjekt 104 gehört,
das einen relativ höheren Häufigkeitswert hat
als alle der anderen Häufigkeitsobjekte 104, die
zu den anderen Wortobjekten 108 gehören, die dem
Präfixobjekt entsprechen.
-
Es
wird in dieser Hinsicht angemerkt, dass die Wortobjekte 108 in
der generischen Wortliste 88 im Allgemeinen in Datentabellen
organisiert sind, die den ersten zwei Buchstaben von verschiedenen Wörtern
entsprechen. Zum Beispiel würde die Datentabelle, die mit
dem Präfix „CO" verbunden ist, alle der Wörter
umfassen wie „CODE", „COIN", „COMMUNICATION"
und dergleichen. Abhängig von der Quantität von
Wortobjekten 108 in einer gegebenen Datentabelle kann die
Datentabelle zusätzlich Teil-Datentabellen umfassen, in
denen Wortobjekte 108 durch Präfixe organisiert
sind, die drei Zeichen oder mehr in der Länge sind. Weiter
mit dem vorangehenden Beispiel, wenn die „CO"-Datentabelle
zum Beispiel mehr als 256 Wortobjekte 108 umfassen würde,
würde die „CO"-Datentabelle zusätzlich
eine oder mehrere Teil-Datentabellen von Wortobjekten 108 umfassen,
die den am häufigsten erscheinenden Dreibuchstaben-Präfixen
entsprechen. Auf beispielhafte Weise kann somit die „CO"-Datentabelle
auch eine „COM"-Teil-Datentabelle und eine „CON"-Teil-Datentabelle
umfassen. Wenn eine Teil-Datentabelle mehr als die vorgegebene Anzahl von
Wortobjekten 108 umfasst, zum Beispiel eine Quantität
von 256, kann die Teil-Datentabelle weitere Teil-Datentabellen umfassen,
die gemäß Präfixen mit vier Buchstaben
organisiert werden. Es wird angemerkt, dass die oben erwähnte
Quantität von 256 der Wortobjekte 108 dem höchsten
numerischen Wert entspricht, der in einem Byte des Speichers 20 gespeichert
werden kann.
-
Demgemäß wird,
wenn bei 224 versucht wird, jedes Präfixobjekt
zu verwenden, um ein entsprechendes Wortobjekt 108 zu identifizieren,
und zum Beispiel das vorliegende Präfixobjekt „AP"
ist, die „AP"-Datentabelle konsultiert. Da alle der Wortobjekte 108 in
der „AP"-Datentabelle dem Präfixobjekt „AP"
entsprechen, wird das Wortobjekt 108 in der „AP"-Datentabelle
identifiziert, zu dem ein Häufigkeitsobjekt 104 gehört,
das einen Häufigkeitswert hat, der relativ höher
ist als einer der anderen Häufigkeitsobjekte 104 in
der „AP"-Datentabelle. Das identifizierte Wortobjekt 108 und
das zugehörige Häufigkeitsobjekt 104 werden
dann in einem Resultat-Register gespeichert, das als ein Resultat
der verschiedenen Vergleiche der erzeugten Präfixobjekte
mit den Inhalten des Speichers 20 dient.
-
Es
wird angemerkt, dass eines oder mehrere oder vielleicht alle der
Präfixobjekte Präfixobjekte sind, für
die ein entsprechendes Wortobjekt 108 nicht in dem Speicher 20 identifiziert
wird. Derartige Präfixobjekte werden betrachtet als verwaiste
Präfixobjekte und werden separat gespeichert oder werden anderweitig
für möglichen zukünftigen Gebrauch behalten.
In dieser Hinsicht wird angemerkt, dass viele oder alle der Präfixobjekte
verwaiste Objekt werden können, wenn zum Beispiel der Benutzer
versucht, ein neues Wort einzugeben, oder zum Beispiel, wenn der
Benutzer falsch getippt hat und kein Wort der falsch getippten Eingabe
entspricht.
-
Sobald
das Resultat bei 224 erlangt wird, bestimmt die Disambiguierungsfunktion,
wie bei 225, ob zumindest ein Sprachobjekt 100 als
einem Präfixobjekt entsprechend identifiziert wurde. Wenn
nicht geht die Verarbeitung weiter, wie bei 226, wo sich
die Verarbeitung verzweigt zu 15A,
was detaillierter an anderer Stelle hierin diskutiert wird. Wenn
bei 225 festgestellt wird, dass zumindest ein Sprachobjekt 100 als
einem Präfixobjekt entsprechend identifiziert wurde, geht
die Verarbeitung weiter bei 228, wo die Disambiguierungsroutine
beginnt, festzustellen, ob künstliche Varianten erzeugt
werden sollen.
-
Um
die Erfordernis für künstliche Varianten zu bestimmen,
verzweigt sich bei 228 der Prozess, wie bei 230,
zu dem „künstliche Variante"-Prozess, der allgemein
in 4 dargestellt wird und mit der Ziffer 304 beginnt.
Die Disambiguierungsfunktion stellt dann fest, wie bei 308,
ob eines der Präfixobjekte in dem Resultat dem entspricht,
was die standardmäßige Ausgabe 76 vor
der Erfassung der aktuellen Tasten-Eingabe gewesen ist. Wenn ein
Präfixobjekt in dem Resultat der vorhergehenden standardmäßigen
Ausgabe entspricht, bedeutet dies, dass die aktuelle Eingabe-Sequenz
einem Wortobjekt 108 entspricht und notwendigerweise die
vorhergehende standardmäßige Ausgabe auch einem
Wortobjekt 108 während des vorhergehenden Disambiguierungszyklusses
in der aktuellen Sitzung entsprochen hat.
-
Wenn
bei 308 bestimmt wird, dass ein Präfixobjekt in
dem Resultat dem entspricht, was die standardmäßige
Ausgabe 76 war vor der Erfassung der aktuellen Tasteneingabe,
ist der nächste Punkt der Analyse, festzustellen, wie bei 310,
ob die vorhergehende standardmäßige Ausgabe die
standardmäßige Ausgabe gemacht wurde aufgrund
einer Auswahl-Eingabe, wie es das Setzen einer Markierung (flag)
verursacht hätte, wie bei 254 der 3B,
was unten detaillierter diskutiert wird. In dem Fall, dass die vorhergehende
standardmäßige Ausgabe nicht das Resultat einer
Auswahl-Eingabe war, was bedeutet, dass keine Markierung gesetzt
wurde, sind keine künstlichen Varianten erforderlich, und
der Prozess kehrt, wie bei 312, zu dem Hauptprozess bei 232 zurück.
Wenn jedoch bei 310 festgestellt wird, dass die vorhergehende
standardmäßige Ausgabe das Resultat einer Auswahl-Eingabe
war, dann werden künstliche Varianten erzeugt, wie bei 316.
-
Spezifischer
umfasst jede der künstlichen Varianten, die bei 316 erzeugt
werden, die vorhergehende standardmäßige Ausgabe
plus eines der Zeichen 48, die der Taste 28 der
aktuellen Eingabe zugewiesen sind. Somit werden, wenn die Taste 28 der aktuellen
Eingabe zwei Zeichen hat, d. h. ein erstes Zeichen 52 und
ein zweites Zeichen 56, zwei künstliche Varianten
bei 316 erzeugt. Eine der künstlichen Varianten
umfasst die vorhergehende standardmäßige Ausgabe
plus das erste Zeichen 52. Die andere künstliche
Variante umfasst die vorhergehende standardmäßige
Ausgabe plus das zweite Zeichen 56.
-
Wenn
jedoch bei 308 festgestellt wird, dass keines der Präfixobjekte
in dem Resultat der vorhergehenden standardmäßigen
Ausgabe entspricht, ist es als nächstes notwendig, zu bestimmen,
wie bei 314, ob die vorhergehende standardmäßige
Ausgabe einem Wortobjekt 108 während des vorhergehenden
Disambiguierungszyklus in der aktuellen Sitzung entsprochen hat.
Wenn die Antwort auf die Abfrage bei 314 nein ist, ist
es weiter notwendig, zu bestimmen, wie bei 318, ob die
vorhergehende standardmäßige Ausgabe zur standardmäßigen
Ausgabe gemacht wurde aufgrund einer Auswahl-Eingabe, wie es das
Setzen der Markierung verursachen würde. In dem Fall, dass
die vorhergehende standardmäßige Ausgabe nicht
das Resultat einer Auswahl-Eingabe war, sind keine künstlichen
Varianten erforderlich und der Prozess kehrt zurück, wie
bei 312, zu dem Hauptprozess bei 232.
-
Wenn
jedoch bei 318 festgestellt wird, dass die vorhergehende
standardmäßige Ausgabe das Resultat einer Auswahl-Eingabe
war, dann ist es als nächstes notwendig, zu bestimmen,
wie bei 319, ob die standardmäßige Vorauswahl-Ausgabe,
d. h. was die standardmäßige Ausgabe war vor der
Auswahl-Eingabe, die bei 318 identifiziert wird, einem Wortobjekt 108 entspricht.
Wenn dem so ist, werden künstliche Varianten erzeugt, wie
bei 321, für die standardmäßige
Vorauswahl-Ausgabe plus jedes der linguistischen Elemente, die der
Taste 28 der aktuellen Eingabe zugewiesen sind. Die Verarbeitung
geht dann weiter zu 316, wo künstliche Varianten
erzeugt werden für die vorherige standardmäßige
Ausgabe plus die linguistischen Elemente, die der Taste 28 der aktuellen
Eingabe zugewiesen sind. Alternativ, wenn bei 319 bestimmt
wird, dass die standardmäßige Vorauswahl-Ausgabe
keinem Wortobjekt 108 entspricht, geht die Verarbeitung
direkt weiter zu 316, wo künstliche Varianten
erzeugt werden für die vorherige standardmäßige
Ausgabe plus die linguistischen Elemente, die der Taste 28 der
aktuellen Eingabe zugewiesen sind.
-
Wenn
andererseits festgestellt wird, dass die Antwort auf die Abfrage
bei 314 ja ist, was bedeutet, dass die vorhergehende standardmäßige
Ausgabe einem Wortobjekt entsprochen hat, aber mit der aktuellen
Eingabe die vorhergehende standardmäßige Ausgabe
kombiniert mit der aktuellen Eingabe keinem Wortobjekt 108 mehr
entspricht, werden künstliche Varianten erzeugt, wiederum
wie bei 316.
-
Nachdem
die künstlichen Varianten bei 316 erzeugt werden,
bestimmt das Verfahren dann, wie bei 320, ob das Resultat überhaupt
Präfixobjekte umfasst. Wenn nicht, kehrt die Verarbeitung,
wie bei 312, zu dem Hauptprozess bei 232 zurück.
Wenn jedoch bei 320 festgestellt wird, dass das Resultat
zumindest ein erstes Präfixobjekt umfasst, was bedeutet,
dass die aktuelle Eingabe-Sequenz einem Wortobjekt 108 entspricht,
wird die Verarbeitung zu 324 übergeben, wo eine
zusätzliche künstliche Variante erzeugt wird.
Spezifisch, das Präfixobjekt des Resultats, zu dem das
Häufigkeitsobjekt 104 gehört, das den
relativ höchsten Häufigkeitswert unter den anderen
Häufigkeitsobjekten 104 in dem Resultat hat, wird identifiziert,
und die künstliche Variante wird erzeugt durch Löschen
des letzten Zeichens aus dem identifizierten Präfixobjekt
und dessen Ersetzen mit einem entgegengesetzten Zeichen 48 auf
der gleichen Taste 28 der aktuellen Eingabe, welches das
letzte Zeichen 48 des identifizierten Präfixobjektes
erzeugte. In dem Falle, dass die spezifische Taste 28 mehr
als zwei zugewiesene Zeichen 48 hat, wird jedes solche entgegengesetzte
Zeichen 48 verwendet, um eine zusätzliche künstliche
Variante zu erzeugen.
-
Sobald
die Notwendigkeit für künstliche Varianten identifiziert
wurde, wie bei 228, und derartige künstliche Varianten
erzeugt wurden, wie in der 4 und wie oben
beschrieben, geht die Verarbeitung weiter, wie bei 232,
wo doppelte Wortobjekte 108, die zu relativ niedrigeren
Häufigkeitswerten gehören, aus dem Resultat gelöscht
werden. Solch ein doppeltes Wortobjekt 108 kann zum Beispiel
durch die Häufigkeits-Lernen-Datenbank 96 erzeugt
werden, wie detaillierter unten dargelegt wird. Wenn ein Wortobjekt 108 in
dem Resultat mit einer der künstlichen Varianten übereinstimmt,
werden das Wortobjekt 108 und sein zugehöriges
Häufigkeitsobjekt 104 im Allgemeinen aus dem Resultat
entfernt, da der künstlichen Variante ein bevorzugter Status
in der Ausgabe 64 zugewiesen wird, wahrscheinlich in einer
Position bevorzugt zu jedem Wortobjekt 108, das identifiziert
worden sein könnte.
-
Sobald
die doppelten Wortobjekte 108 und die zugehörigen
Häufigkeitsobjekte 104 bei 232 entfernt
wurden, werden die restlichen Präfixobjekte angeordnet,
wie bei 236, in einem Ausgabesatz in abnehmender Reihenfolge
des Häufigkeitswerts. Die verwaisten Präfixobjekte,
die oben erwähnt werden, können ebenfalls zu dem
Ausgabesatz hinzugefügt werden, wenngleich an Positionen
eines relativ niedrigeren Häufigkeitswerts als jedes Präfixobjekt,
für das ein entsprechendes Wortobjekt 108 gefunden wurde.
Es ist auch notwendig, sicherzugehen, dass die künstlichen
Varianten, wenn sie erzeugt wurden, an einer bevorzugten Position
in dem Ausgabesatz gesetzt werden. Es ist offensichtlich, dass künstlichen
Varianten eine Präferenzposition gegeben werden kann, aber
nicht unbedingt muss, d. h. eine relativ höhere Priorität
oder Häufigkeit zugewiesen als Präfixobjekten
des Resultats.
-
Wenn
festgestellt wird, wie bei 240, dass die Markierung gesetzt
wurde, was bedeutet, dass ein Benutzer eine Auswahl-Eingabe gemacht
hat, entweder durch eine Express-Auswahl-Eingabe oder durch eine
Umschalt-Eingabe einer Bewegungs-Eingabe, dann wird die standardmäßige
Ausgabe 76 betrachtet als „versperrt (locked)",
was bedeutet, dass die gewählte Variante das standardmäßige
Präfix bis zum Ende der Sitzung ist. Wenn bei 240 festgestellt wird,
dass die Markierung gesetzt wurde, geht die Verarbeitung bei 244 weiter,
wo die Inhalte des Ausgabe satzes geändert werden, wenn
erforderlich, um als die standardmäßige Ausgabe 76 eine
Ausgabe zu liefern, die das gewählte Präfixobjekt
umfasst, ob es einem Wortobjekt 108 entspricht oder eine
künstliche Variante ist. In dieser Hinsicht ist anzumerken,
dass die Markierung mehrere Male während einer Sitzung gesetzt
werden kann, in diesem Fall wird das gewählte Präfix,
das zu dem Zurückstellen der Markierung gehört,
danach die „gesperrte" standardmäßige
Ausgabe 76 bis zu dem Ende der Sitzung ist oder bis eine andere
Auswahl-Eingabe erfasst wird.
-
Die
Verarbeitung geht dann weiter, wie bei 248, zu einem Ausgabe-Schritt,
wonach eine Ausgabe 64 erzeugt wird, wie oben beschrieben.
Spezifischer, die Verarbeitung geht weiter, wie bei 250,
zu dem Teilsystem, das allgemein in der 6 dargestellt
wird und unten beschrieben wird. Danach geht die Verarbeitung weiter
bei 204, wo eine zusätzliche Eingabe erfasst wird.
Andererseits, wenn bei 240 festgestellt wird, dass die
Markierung nicht gesetzt wurde, dann geht die Verarbeitung direkt
zu 248 ohne eine Änderung der Inhalte des Ausgabe-Satzes
bei 244.
-
Die
tragbare elektronische Vorrichtung 4 kann derart konfiguriert
sein, dass ein verwaistes Präfixobjekt, das in einer Ausgabe 64 enthalten
ist, aber nicht mit der folgenden Eingabe gewählt wird, suspendiert
wird. Dies kann begrenzt werden auf verwaiste Präfixobjekte,
die in dem Varianten-Teil 80 erscheinen, oder kann auf
verwaiste Präfixobjekte überall in der Ausgabe 64 zutreffen.
Die tragbare elektronische Vorrichtung 4 kann auch konfiguriert sein,
um ähnlich künstliche Varianten in ähnlichen Umständen
zu suspendieren. Ein Grund für eine derartige Suspension
ist, dass jedes derartige verwaiste Präfixobjekt und/oder
künstliche Variante, wie geeignet, eine Quantität
von nachfolgenden verwaisten Präfixobjekten verteilen kann,
gleich zu der Quantität von Zeichen 48 auf einer
Taste 28 der nächsten Eingabe. Das heißt,
jeder Nachkomme umfasst das verwaiste Eltern-Präfixobjekt
oder die künstliche Variante plus eines der Zeichen 48 der
Taste 28 der nächsten Eingabe. Da verwaiste Präfixobjekte
und künstliche Varianten im Wesentlichen keine Entsprechung zu
einem Wortobjekt 108 haben, haben auch erzeugte Nachkommenobjekte
von verwaisten Eltern-Präfixobjekten und künstlichen
Varianten ebenfalls keine Entsprechung zu einem Wortobjekt 108.
Derartige suspendierte verwaiste Präfixobjekte und/oder
künstliche Varianten können als suspendiert betrachtet werden,
im Vergleich zu vollständig eliminiert, da derartige suspendierte
verwaiste Präfixobjekte und/oder künstliche Varianten
später wieder als Eltern eines erzeugten verwaisten Präfixobjekts
und/oder künstlicher Varianten erscheinen können,
wie unten erläutert wird.
-
Wenn
die erfasste Eingabe bestimmt wird, wie bei 212, als eine
Bedieneingabe, dann geht die Verarbeitung weiter, um die spezifische
Eigenschaft der Bedieneingabe festzustellen. Wenn zum Beispiel festgestellt
wird, wie bei 252, dass die aktuelle Eingabe eine Auswahl-Eingabe
ist, geht die Verarbeitung bei 254 weiter. Bei 254 werden
das Wortobjekt 108 und das zugehörige Häufigkeitsobjekt 104 des
Standard-Teils 76 der Ausgabe 64, sowie das Wortobjekt 108 und
das zugehörige Häufigkeitsobjekt 104 des Teils
der Varianten-Ausgabe 80, die durch die Auswahl-Eingabe
gewählt wurden, in einem temporären Lernen-Datenregister
gespeichert. Zusätzlich wird die Markierung gesetzt. Dann
kehrt die Verarbeitung zurück zur Erfassung von zusätzlichen
Eingaben, wie bei 204.
-
Wenn
festgestellt wird, wie bei 260, dass die Eingabe eine Delimiter-Eingabe
ist, geht die Verarbeitung bei 264 weiter, wo die aktuelle
Sitzung beendet wird und die Verarbeitung übergeben wird,
wie bei 266, an das Lernen-Funktion-Teilsystem, wie bei 404 der 5A.
Eine Delimiter-Eingabe umfasst zum Beispiel die Betätigung
einer <LEERZEICHEN (SPACE)>-Taste 116,
die sowohl ein Delimiter-Symbol eingeben als auch ein Leerzeichen
am Ende des Wortes hinzufügen würde, eine Betätigung
der <ENTER>-Taste 44,
die ähnlich eine Delimiter-Eingabe eingeben kann und ein
Leerzeichen eingeben kann, und durch eine Translation des Thumbwheels 32,
wie wird durch den Pfeil 38 angezeigt, die eine Delimiter-Eingabe
eingeben kann, ohne zusätzlich ein Leerzeichen einzugeben.
-
Es
wird zuerst festgestellt, wie bei 408, ob die standardmäßige
Ausgabe zum Zeitpunkt der Erfassung der Demiliter-Eingabe bei 260 mit
einem Wortobjekt 108 in dem Speicher 20 übereinstimmt. Wenn
nicht, bedeutet dies, dass die standardmäßige Ausgabe
eine Benutzer-erzeugte Ausgabe ist, die zu der „neue Wörter"-Datenbank 92 für
zukünftigen Gebrauch hinzugefügt werden sollte.
Unter solch einem Umstand geht dann die Verarbeitung weiter zu 412, wo
die standardmäßige Ausgabe in der „neue
Wörter"-Datenbank 92 als ein neues Wortobjekt 108 gespeichert
wird. Zusätzlich wird ein Häufigkeitsobjekt 104 in
der „neue Wörter"-Datenbank 92 gespeichert und
zugeordnet zu dem vorher erwähnten neuen Wortobjekt 108.
Dem neuen Häufigkeitsobjekt 104 wird ein relativ
hoher Häufigkeitswert gegeben, typischerweise in dem oberen
Viertel oder Drittel eines vorgegebenen Bereichs von möglichen
Häufigkeitswerten.
-
In
dieser Hinsicht wird Häufigkeitsobjekten 104 ein
absoluter Häufigkeitswert im Allgemeinen in dem Bereich
von null bis 65,535 gegeben. Der Maximalwert stellt die größte
Anzahl dar, die in zwei Bytes des Speichers 20 gespeichert
werden kann. Dem neuen Häufigkeitsobjekt 104,
das in der „neue Wörter"-Datenbank 92 gespeichert
wird, wird ein absoluter Häufigkeitswert in oberen Viertel
oder Drittels dieses Bereichs zugewiesen, besonders, da das neue Wort
von einem Benutzer verwendet wurde und wahrscheinlich wieder verwendet
wird.
-
In
weiterer Hinsicht zu dem Häufigkeitsobjekt 104 wird
angemerkt, dass in einer gegebenen Datentabelle, wie der oben erwähnten „CO"-Datentabelle, der
absolute Häufigkeitswert nur für das Häufigkeitsobjekt 104 gespeichert
wird, das den höchsten Häufigkeitswert in der
Datentabelle hat. Alle anderen Häufigkeitsobjekte 104 in
der gleichen Datentabelle haben Häufigkeitswerte gespeichert
als Prozentwerte, normalisiert zu dem vorher erwähnten
maximalen absoluten Häufigkeitswert. Das heißt,
nach Identifikation des Häufigkeitsobjektes 104 mit
dem höchsten Häufigkeitswert in einer gegebenen
Datentabelle, wird allen anderen Häufigkeitsobjekten 104 in
der gleichen Datentabelle ein Prozentsatz des absoluten Maximalwerts
zugewiesen, der das Verhältnis des relativ kleineren absoluten
Häufigkeitswertes eines bestimmten Häufigkeitsobjektes 104 zu
dem absoluten Häufigkeitswert des vorher erwähnten
Häufigkeitsobjektes 104 mit dem höchsten
Wert darstellt. Vorteilhafterweise können derartige Prozentsatzwerte
in einem einzelnen Byte des Speichers gespeichert werden, wodurch
Speicherplatz in der tragbaren elektronischen Vorrichtung 4 gespart
wird.
-
Nach
der Erzeugung des neuen Wortobjekts 108 und des neuen Häufigkeitsobjekts 104 und
deren Speicherung in der „neue Wörter"-Datenbank 92 wird die
Verarbeitung zu 420 übergeben, wo der Lernenprozess
beendet wird. Die Verarbeitung kehrt dann zum Hauptprozess zurück,
wie bei 204.
-
Wenn
bei 408 festgestellt wird, dass das Wortobjekt 108 in
der standardmäßigen Ausgabe 76 mit einem
Wortobjekt 108 in dem Speicher 20 übereinstimmt,
dann fährt die Verarbeitung bei 416 fort, wo bestimmt
wird, ob die vorher erwähnte Markierung gesetzt wurde,
wie es geschieht bei der Erfassung einer Auswahl-Eingabe und Umschalt-Eingabe oder
einer Bewegungs-Eingabe, auf beispielhafte Weise. Wenn festgestellt
wird, dass die Markierung nicht gesetzt wurde, bedeutet dies, dass
der Benutzer keine Präferenz für ein Varianten-Präfixobjekt
gegenüber einem standardmäßigen Präfixobjekt
ausgedrückt hat, und es entstand keine Notwendigkeit für
ein Häufigkeits-Lernen. Unter solch einem Umstand fährt
die Verarbeitung bei 420 fort, wo der Lernenprozess beendet
wird. Dann kehrt die Verarbeitung zu dem Hauptprozess bei 204 zurück.
-
Wenn
jedoch bei 416 festgestellt wird, dass die Markierung gesetzt
wurde, ruft der Prozessor 20 aus dem temporären
Lernen-Datenregister die zuletzt gespeicherten Standard- und Varianten-Wortobjekte 108 ab,
zusammen mit ihren zuge hörigen Häufigkeitsobjekten 104.
Es wird dann festgestellt, wie bei 428, ob die Standard-
und Varianten-Wortobjekte 108 vorher einer Häufigkeits-Lernen-Operation
unterzogen wurden. Dieses kann festgestellt werden zum Beispiel
durch Bestimmen, ob das Varianten-Wortobjekt 108 und das
zugehörige Häufigkeitsobjekt 104 aus
der Häufigkeits-Lernen-Datenbank 96 erlangt wurden.
Wenn die Standard- und Varianten-Wortobjekte 108 nicht
vorher einer Häufigkeits-Lernen-Operation unterzogen wurden,
geht die Verarbeitung weiter, wie bei 432, wo das Varianten-Wortobjekt 108 in
der Häufigkeits-Lernen-Datenbank 96 gespeichert
wird und ein revidiertes Häufigkeitsobjekt 104 erzeugt
wird, das einen Häufigkeitswert hat, der größer
ist als der des Häufigkeitsobjektes 104, das vorher
zu dem Varianten-Wortobjekt 108 gehörte. In dem
vorliegenden beispielhaften Umstand, d. h. wo das Standard-Wortobjekt 108 und
das Varianten-Wortobjekt 108 ihre erste Häufigkeits-Lernen-Operation
erfahren, kann dem revidierten Häufigkeitsobjekt 104 zum
Beispiel ein Häufigkeitswert gegeben werden, der gleich
der Summe ist des Häufigkeitswertes des Häufigkeitsobjektes 104,
das vorher zu dem Varianten-Wortobjekt 108 gehörte,
plus die Hälfte der Differenz zwischen dem Häufigkeitswert
des Häufigkeitsobjektes 104, das zu dem Standard-Wortobjekt 108 gehört,
und dem Häufigkeitswert des Häufigkeitsobjektes 104,
das vorher zu dem Varianten-Wortobjekt 108 gehörte.
Nach der Speicherung des Varianten-Wortobjektes 108 und
des revidierten Häufigkeitsobjektes 104 in der
Häufigkeits-Lernen-Datenbank 96, fährt
die Verarbeitung bei 420 fort, wo der Lernenprozess beendet
wird und die Verarbeitung kehrt zu dem Hauptprozess zurück, wie
bei 204.
-
Wenn
bei 428 festgestellt wird, dass das Standard-Wortobjekt 108 und
das Varianten-Wortobjekt 108 vorher einer Häufigkeits-Lernen-Operation unterzogen
wurden, geht die Verarbeitung weiter zu 436, wo dem revidierten
Häufigkeitswert 104 stattdessen ein Häufigkeitswert
gegeben wird, der höher als der Häufigkeitswert
des Häufigkeitsobjektes 104 ist, der zu dem Standard-Wortobjekt 108 gehört. Nach
Speicherung des Varianten-Wortobjektes 108 und des revidierten
Häufig keitsobjektes 104 in der Häufigkeits-Lernen-Datenbank 96,
geht die Verarbeitung weiter zu 420, wo der Lernenprozess
beendet wird, und dann kehrt die Verarbeitung zu dem Hauptprozess
zurück, wie bei 204.
-
Weiter
hinsichtlich der Lernen-Funktion wird angemerkt, dass die Lernen-Funktion
zusätzlich erfasst, ob sowohl das Standard-Wortobjekt 108 als auch
das Varianten-Wortobjekt 104 aus der Häufigkeits-Lernen-Datenbank 96 erlangt
wurden. In dieser Hinsicht werden, wenn Wortobjekte 108 identifiziert werden,
wie bei 224, für eine Entsprechung mit erzeugten
Präfixobjekten, alle der Datenquellen in dem Speicher für
derartige entsprechende Wortobjekte 108 und entsprechende
Häufigkeitsobjekte 104 abgefragt. Da die Häufigkeits-Lernen-Datenbank 96 Wortobjekte 108 speichert,
die auch entweder in der generischen Wortliste 88 oder
in der „neue Wörter"-Datenbank 92 gespeichert
sind, sind das Wortobjekt 108 und das zugehörige
Häufigkeitsobjekt 104, die aus der Häufigkeits-Lernen-Datenbank 96 erlangt
werden, typischerweise Duplikate von Wortobjekten 108,
die bereits aus der generischen Wortliste 88 oder der „neue
Wörter"-Datenbank 92 erlangt wurden. Jedoch hat
das zugehörige Häufigkeitsobjekt 104,
das aus der Häufigkeits-Lernen-Datenbank 96 erlangt
wird, typischerweise einen Häufigkeitswert, der größer
ist als der des zugehörigen Häufigkeitsobjektes 104,
das aus der generischen Wortliste 88 erlangt wurde. Dies
reflektiert die Eigenschaft der Häufigkeits-Lernen-Datenbank 96 als
Verleihen einem häufig verwendeten Wortobjekt 108 einen
relativ größeren Häufigkeitswert als
es anderweitig in der generischen Wortliste 88 haben würde.
-
Es
kann folglich gesehen werden, dass die Lernen-Funktion, die in den 5A and 5B gezeigt
wird und oben beschrieben wird, im Allgemeinen nicht initiiert wird,
bis eine Delimiter-Eingabe erfasst wird, was bedeutet, dass ein
Lernen nur einmal pro Sitzung stattfindet. Zusätzlich,
wenn die letzte standardmäßige Ausgabe nicht ein
Benutzer-definiertes neues Wort ist, sind die Wortobjekte 108,
die der Häufigkeits-Lernen-Funktion unterzogen werden, die
Wortobjekte 108, die zu der standardmäßigen Ausgabe 76 und
der gewählten Varianten-Ausgabe 80 gehörten
zu dem Zeitpunkt, als die Auswahl stattfand, anstatt notwendigerweise
zu dem Objekt gehörend, das schließlich als die
standardmäßige Ausgabe am Ende der Sitzung resultierte.
Auch wenn zahlreiche lernbare Ereignisse während einer
einzelnen Sitzung auftreten, arbeitet die Häufigkeits-Lernen-Funktion
nur auf den Wortobjekten 108, die zu dem letzten lernbaren
Ereignis gehören, d. h. ein Auswahl-Ereignis, ein Umschalt-Ereignis
oder ein Bewegungs-Ereignis, vor Beendigung der aktuellen Sitzung.
-
Weiter
hinsichtlich der Identifikation verschiedener Wortobjekte 108 zur
Entsprechung mit erzeugten Präfixobjekten wird angemerkt,
dass der Speicher 20 eine Anzahl von zusätzlichen
Datenquellen 99 zusätzlich zu der generischen
Wortliste 88, der „neue Wörter"-Datenbank 92 und
der Häufigkeits-Lernen-Datenbank 96 umfassen kann,
die alle als linguistische Quellen betrachtet werden können. Zwei
weitere beispielhafte Datenquellen 99 werden in der 2A dargestellt,
wobei offensichtlich ist, dass der Speicher 20 jede Anzahl
anderer Datenquellen 99 umfassen kann. Die anderen Datenquellen 99 können
zum Beispiel eine Adressdatenbank, eine Kurztext-Datenbank oder
jede andere Datenquelle ohne Einschränkung umfassen. Eine
beispielhafte Kurztext-Datenbank kann, zum Beispiel, Sätze von
Wörtern oder Ausdrücken oder anderen Daten umfassen,
die jeweils zum Beispiel zu einem Zeichen-String gehören,
der abgekürzt werden kann. Zum Beispiel kann eine Kurztext-Datenbank
den String „br" mit dem Satz von Wörtern „Best
Regards" verbinden, mit der Absicht, dass ein Benutzer den String „br"
schreiben kann und die Ausgabe „Best Regards" empfangen
kann.
-
Wenn
versucht wird, Wortobjekte 108 zu identifizieren, die einem
gegebenen Präfixobjekt entsprechen, kann die tragbare elektronische
Vorrichtung 4 alle Datenquellen in dem Speicher 20 abfragen.
Zum Beispiel kann die tragbare elektronische Vorrichtung 4 die
generische Wortliste 88, die „neue Wörter"-Datenbank 92,
die Häufigkeits-Lernen-Datenbank 96 und die anderen
Datenquellen 99 abfra gen, um Wortobjekte 108 zu
identifizieren, die dem Präfixobjekt entsprechen. Die Inhalte
der anderen Datenquellen 99 können behandelt werden
als Wortobjekte 108, und der Prozessor 16 kann
Häufigkeitsobjekte 104 erzeugen, die derartigen
Wortobjekten 108 zugeteilt werden und welchen ein Häufigkeitswert
zugewiesen werden kann in zum Beispiel dem oberen Drittel oder Viertel
des vorher erwähnten Häufigkeitsbereichs. Unter
der Annahme, dass der zugewiesene Häufigkeitswert hoch
genug ist, wird der String „br" zum Beispiel typischerweise
an die Anzeige 60 ausgegeben. Wenn eine Delimiter-Eingabe hinsichtlich
des Teils des Ausgabe erfasst wird, der die Verbindung zu dem Wortobjekt 108 in
der Kurztext-Datenbank hat, zum Beispiel „br", würde
der Benutzer die Ausgabe „Best Regards" empfangen, wobei
offensichtlich ist, dass der Benutzer auch eine Auswahl-Eingabe
als den beispielhaften String „br" eingegeben haben könnte.
-
Die
Inhalte von einer der anderen Datenquellen 99 können
behandelt werden als Wortobjekte 108 und können
zu erzeugten Häufigkeitsobjekten 104 gehören,
die den zugewiesenen Häufigkeitswert in dem vorher erwähnten
oberen Teil des Häufigkeitsbereichs haben. Nachdem derartige
Wortobjekte 108 identifiziert sind, kann die neue Wort-Lernen-Funktion,
wenn geeignet, auf derartigen Wortobjekten 108 auf die
oben dargelegte Art handeln.
-
Wieder
unter Betrachtung der 3A, wenn die Verarbeitung zu
dem Filterschritt fortfährt, wie bei 232, und
die doppelten Wortobjekte 108 und die zugehörigen
Häufigkeitsobjekte 104, die relativ niedrigere
Häufigkeitswerte haben, gefiltert werden, können
die restlichen Resultate ein Varianten-Wortobjekt 108 und
ein Standard-Wortobjekt 108 umfassen, die beide aus der
Häufigkeits-Lernen-Datenbank 96 erlangt wurden.
In solch einer Situation kann vorgesehen werden, dass, wenn ein
Benutzer wiederholt und alternativ ein Wort statt das andere Wort
verwendet, mit der Zeit die Häufigkeitsobjekte 104,
die zu derartigen Wörtern gehören, weit über
den vorher erwähnten maximalen absoluten Häufigkeitswert
hinaus für ein Häufigkeitsobjekt 104 zunehmen.
Demgemäß speichert, wenn fest gestellt wird, dass
das Standard-Wortobjekt 108 und das Varianten-Wortobjekt 108 in
der Lernen-Funktion aus der Häufigkeits-Lernen-Datenbank 96 erlangt
wurden, anstatt das Varianten-Wortobjekt 108 in der Häufigkeits-Lernen-Datenbank 96 zu
speichern und mit einem Häufigkeitsobjekt 104 zu
verbinden, das einen relativ erhöhten Häufigkeitswert
hat, die Lernen-Funktion stattdessen das Standard-Wortobjekt 108 und
verbindet es mit einem revidierten Häufigkeitsobjekt 104,
das einen Häufigkeitswert hat, der relativ niedriger als
der des Häufigkeitsobjektes 104 ist, das zu dem
Varianten-Wortobjekt 108 gehört. Ein derartiges
Schema vermeidet vorteilhaft übermäßige
und nicht notwendige Zunahmen des Häufigkeitswertes.
-
Wenn
festgestellt wird, wie bei 268, dass die aktuelle Eingabe
eine Bewegungs-Eingabe ist, wie eingesetzt wird, wenn ein Benutzer
versucht, ein Objekt zu editieren, entweder ein beendetes Wort oder ein
Präfixobjekt in der aktuellen Sitzung, wird das Caret-Zeichen 84 auf
die gewünschte Position verschoben, wie bei 272,
und die Markierung wird gesetzt, wie bei 276. Die Verarbeitung
kehrt dann dahin zurück, wo zusätzliche Eingaben
erfasst werden können, wie bei 204.
-
In
dieser Hinsicht ist es offensichtlich, dass verschiedene Typen von
Bewegungs-Eingaben von der Eingabevorrichtung 8 erfasst
werden können. Zum Beispiel kann eine Rotation des Thumbwheels 32,
wie durch den Pfeil 34 der 1 angezeigt,
eine Bewegungs-Eingabe liefern, wie die Betätigung der <NEXT>-Taste 40 oder
eine andere derartige Eingabe, möglicherweise in Verbindung
mit anderen Vorrichtungen in der Eingabevorrichtung 8.
In dem Fall, in dem solch eine Bewegungs-Eingabe erfasst wird, wie
in dem Umstand einer editierenden Eingabe, wird die Bewegungs-Eingabe
zusätzlich als eine Auswahl-Eingabe erfasst. Demgemäß und
wie es der Fall ist mit einer Auswahl-Eingabe, wie bei 252 erfasst
wird, ist die gewählte Variante effektiv gesperrt (locked)
hinsichtlich des Standard-Teils 76 der Ausgabe 64.
Jede Standard-Ausgabe 76 während der gleichen
Sitzung umfasst notwendigerweise die vorher gewählte Variante.
-
In
dem Kontext des Editieren jedoch ist das bestimmte angezeigte Objekt,
das editiert wird, effektiv gesperrt, außer hinsichtlich
des Zeichens, das editiert wird. In dieser Hinsicht werden somit
die anderen Zeichen des editierten Objekts, d. h. die Zeichen, die nicht
editiert werden, beibehalten und als ein Kontext zum Identifizieren
zusätzlicher Wortobjekte 108 und dergleichen,
die dem editierten Objekt entsprechen, eingesetzt. Wo dies nicht
der Fall ist, würde ein Benutzer, der einen Buchstaben
in der Mitte eines Wortes zu editieren versucht, als eine neue Ausgabe 64 zahlreiche
Objekte sehen, die wenig oder keine Ähnlichkeit aufweisen
zu den Zeichen des editierten Objekts, da bei Fehlen des Beibehalten
eines derartigen Kontexts, ein gänzlich neuer Satz von
Präfixobjekten erzeugt worden wäre, einschließlich
aller Permutationen der Zeichen der verschiedenen Tastenanschläge des
editierten Objekts. Neue Wortobjekte 108 wären identifiziert
worden als entsprechend zu den neuen Präfixobjekten, die
alle die Ausgabe 64 signifikant ändern können
nur durch das Editieren eines einzelnen Zeichens. Durch Beibehalten
der anderen Zeichen, die aktuell in dem editierten Objekt sind,
und Einsetzen derartiger anderer Zeichen, wie Kontextinformation,
kann der Benutzer sehr viel einfacher ein Wort editieren, das auf
der Anzeige 60 dargestellt wird.
-
In
dem vorliegenden beispielhaften Ausführungsbeispiel der
tragbaren elektronischen Vorrichtung 4 ist, wenn festgestellt
wird, wie bei 252, dass die Eingabe keine Auswahl-Eingabe
ist, und festgestellt wird, wie bei 260, dass die Eingabe
keine Delimiter-Eingabe ist, und weiter festgestellt wie, wie bei 268,
dass die Eingabe keine Bewegungs-Eingabe ist, in dem aktuellen beispielhaften
Ausführungsbeispiel der tragbaren elektronischen Vorrichtung 4 die
einzige verbleibende Bedieneingabe im Allgemeinen eine Erfassung
der <LÖSCHEN
(DELETE)>-Taste 86 der Tasten 28 des
Tastaturfelds 24. Bei Erfassung der <DELETE>-Taste 86 wird das letzte Zeichen
der standardmäßigen Ausgabe gelöscht,
wie bei 280. An diesem Punkt wartet die Verarbeitung im
Allgemeinen, bis eine andere Eingabe erfasst wird, wie bei 284.
Es wird dann festgestellt, wie bei 288, ob die neue Eingabe,
die bei 284 erfasst wird, dieselbe wie die letzte Eingabe
ist, die mit dem letzten Zeichen zusammenhängt, das gerade
bei 280 gelöscht wurde. Wenn dem so ist, ist die
standardmäßige Ausgabe 76 dieselbe wie
die vorhergehende standardmäßige Ausgabe, außer
dass das letzte Zeichen das entgegengesetzte Zeichen der Tastenbetätigung
ist, die das letzte Zeichen erzeugt hat. Dann geht die Verarbeitung
weiter zu 292, wo Lernen-Daten, d. h. das Wortobjekt 108 und
das zugehörige Häufigkeitsobjekt 104,
die zu der vorhergehenden standardmäßigen Ausgabe 76 gehören,
sowie das Wortobjekt 108 und das zugehörige Häufigkeitsobjekt 104,
die zu der neuen standardmäßigen Ausgabe 76 gehören,
in dem temporären Lernen-Datenregister gespeichert werden
und die Markierung gesetzt wird. Solch eine Tastenfolge, d. h. eine
Eingabe, die <DELETE>-Taste 86 und
die gleiche Eingabe wie zuvor, ist eine Umschalt-Eingabe. Solch
eine Umschalt-Eingabe ersetzt das standardmäßige
letzte Zeichen mit einem entgegengesetzten letzten Zeichen der Taste 28,
die das letzte Zeichen 48 der standardmäßigen
Ausgabe 76 erzeugte. Die Umschalt-Eingabe wird als eine Auswahl-Eingabe
behandelt für Zwecke der Blockierung bzw. Sperrung der
standardmäßigen Ausgabe 76 für
die aktuelle Sitzung und löst auch die Markierung aus,
welche die Lernen-Funktion bei Erfassung einer Delimiter-Eingabe
bei 260 initiiert.
-
Wenn
es sich jedoch erweist, dass das System bei 288 erfasst,
dass die neue Eingabe, die bei 284 erfasst wird, unterschiedlich
als die Eingabe unmittelbar vor der Erfassung der <DELETE>-Taste 86 ist,
fährt die Verarbeitung bei 212 fort, wo bestimmt wird,
ob die Eingabe entweder eine Bedieneingabe oder eine Eingabe einer
Taste ist, die ein oder mehrere Zeichen 48 hat, und die
Verarbeitung fährt danach fort.
-
Es
wird auch angemerkt, dass, wenn der Hauptprozess das Ausgabestadium
bei 248 erreicht, ein zusätzlicher Prozess initiiert
wird, der feststellt, ob die Varianten-Komponente 72 der
Ausgabe 64 initiiert werden soll. Eine Verarbeitung der
zusätzlichen Funktion wird initiiert von 250 an
dem Element 504 der 6. Zuerst gibt
das Verfahren bei 508 die Textkomponente 68 der
Ausgabe 64 an die Anzeige 60 aus. Eine weitere
Verarbeitung stellt fest, ob die Varianten-Komponente 72 angezeigt
werden soll oder nicht.
-
Spezifisch
wird festgestellt, wie bei 512, ob die Varianten-Komponente 72 bereits
während der aktuellen Sitzung angezeigt wurde. Wenn die
Varianten-Komponente 72 bereits angezeigt wurde, geht die
Verarbeitung bei 516 weiter, wo die neue Varianten-Komponente 72 angezeigt
wird, die aus dem aktuellen Disambiguierungszyklus in der aktuellen
Sitzung resultiert. Die Verarbeitung kehrt dann zu einem Beendigungspunkt
bei 520 zurück, danach kehrt die Verarbeitung
zu dem Hauptprozess bei 204 zurück. Wenn jedoch
bei 512 festgestellt wird, dass die Varianten-Komponente 72 noch
nicht während der aktuellen Sitzung angezeigt wurde, geht
die Verarbeitung weiter, wie bei 524, um festzustellen,
ob die vergangene Zeit zwischen der aktuellen Eingabe und der unmittelbar
vorhergehenden Eingabe langer als eine vorgegebene Dauer ist. Wenn
sie länger ist, dann geht die Verarbeitung bei 516 weiter,
wo die Varianten-Komponente 72 angezeigt wird, und die
Verarbeitung kehrt, durch 520, zu dem Hauptprozess zurück,
wie bei 204. Wenn jedoch bei 524 festgestellt wird,
dass die vergangene Zeit zwischen der aktuellen Eingabe und der
unmittelbar vorhergehenden Eingabe kürzer als die vorgegebene
Dauer ist, wird die Varianten-Komponente 72 nicht angezeigt,
und die Verarbeitung kehrt zu dem Beendigungspunkt bei 520 zurück,
danach kehrt die Verarbeitung zu dem Hauptprozess zurück,
wie bei 204.
-
Vorteilhafterweise
wird folglich, wenn ein Benutzer Tastenanschläge relativ
schnell eingibt, die Varianten-Komponente 72 nicht an die
Anzeige 60 ausgegeben, wo sie ansonsten wahrscheinlich
eine visuelle Ablenkung für einen Benutzer verursachen würde,
der versucht, Tastenanschläge schnell einzugeben. Wenn
jederzeit während einer gegebenen Sitzung die Varianten-Komponente 72 an
die Anzeige 60 ausgegeben wird, wie wenn die Zeit zwischen
aufeinander folgenden Eingaben die vorgegebene Dauer übersteigt,
wird die Varianten-Komponente 72 weiterhin während
dieser Sitzung angezeigt. Bei der Initiierung einer neuen Sitzung
wird jedoch die Varianten-Komponente 72 von der Anzeige
zurückgehalten, wenn der Benutzer konsistent Tastenanschläge relativ
schnell eingibt.
-
Eine
beispielhafte Eingabe-Sequenz wird in den 1 und 7–11 dargestellt.
In diesem Beispiel versucht der Benutzer, das Wort „APPLOADER"
einzugeben, und dieses Wort ist momentan nicht in dem Speicher 20 gespeichert.
In 1 hat der Benutzer bereits die „AS"-Taste 28 eingegeben. Da
die Datentabellen in dem Speicher 20 entsprechend zwei-Buchstaben-Präfixen
organisiert sind, werden die Inhalte der Ausgabe 64 nach
dem ersten Tastenanschlag von den N-Gramm-Objekten 112 in dem
Speicher erlangt. Der erste Tastenanschlag „AS" entspricht
einem ersten N-Gramm-Objekt 112 „S" und einem
zugehörigen Häufigkeitsobjekt 104, sowie
einem anderen N-Gramm-Objekt 112 „A" und einem
zugehörigen Häufigkeitsobjekt 104. Während das
Häufigkeitsobjekt 104, das zu „S" gehört,
einen Häufigkeitswert hat, der größer
ist als der des Häufigkeitsobjektes 104, das zu „A"
gehört, wird angemerkt, dass „A" selbst ein vollständiges
Wort ist. Ein vollständiges Wort wird immer als die standardmäßige Ausgabe 76 gegenüber
anderer Präfixobjekte geliefert, die nicht mit vollständigen
Wörtern übereinstimmen, unabhängig eines
zugehörigen Häufigkeitswerts. Somit ist in der 1 der
Standard-Teil 76 der Ausgabe 64 „A".
-
In
der 7 hat der Benutzer zusätzlich die „OP"-Taste 28 eingegeben.
Die Varianten werden in der 7 dargestellt.
Da das Präfixobjekt „SO" auch ein Wort ist, wird
es als die standardmäßige Ausgabe 76 geliefert.
In der 8 hat der Benutzer wieder die „OP"-Taste 28 eingegeben
und hat auch die „L"-Taste 28 eingegeben. Es wird
angemerkt, dass die beispielhafte „L"-Taste 28,
die hier dargestellt wird, nur das einzelne Zeichen 48 „L"
umfasst.
-
Es
wird in dem vorliegenden Beispiel angenommen, dass keine Bedieneingaben
bis jetzt erfasst wurden. Die standardmäßige Ausgabe 76 ist „APPL",
wie dem Wort „APPLE" entsprechen würde. Das Präfix „APPL"
wird sowohl in der Textkomponente 68 sowie in dem Standard-Teil 76 der
Varianten-Komponente 72 dargestellt. Verschiedene Präfixobjekte
in dem Varianten-Teil 80 umfassen „APOL", wie
dem Wort „APOLOGIZE" entsprechen würde, und das
Präfix „SPOL", das dem Wort „SPOLIATION" entsprechen
würde.
-
Es
wird insbesondere angemerkt, dass die zusätzlichen Varianten „AOOL", „AOPL", „SOPL"
und „SOOL" auch als Varianten 80 in der Varianten-Komponente 72 dargestellt
werden. Da kein Wortobjekt 108 diesen Präfixobjekten
entspricht, werden die Präfixobjekte als verwaiste Präfixobjekte
betrachtet, für die kein entsprechendes Wortobjekt 108 identifiziert
wurde. In dieser Hinsicht kann es für die Varianten-Komponente 72 wünschenswert
sein, eine spezifische Quantität von Eintragungen zu umfassen,
und im Falle des vorliegenden beispielhaften Ausführungsbeispiels
ist die Quantität sieben Eintragungen. Nach dem Erlangen
des Resultats bei 224, wenn die Quantität von
Präfixobjekten in dem Resultat weniger ist als die vorgegebene
Quantität, versucht die Disambiguierungsfunktion, zusätzliche
Ausgaben zu liefern, bis die vorgegebene Anzahl von Ausgaben geliefert
ist. In Ermangelung der künstlichen Varianten, die erzeugt
werden, werden die zusätzlichen Varianten-Eintragungen
von verwaisten Präfixobjekten geliefert. Es wird jedoch
angemerkt, dass, wenn künstliche Varianten erzeugt wurden,
sie wahrscheinlich einen Ort der Präferenz gegenüber
derartiger verwaister Präfixobjekte besetzt haben, und
möglicherweise auch gegenüber den Präfixobjekten
des Resultats.
-
Es
wird weiter angemerkt, dass derartige verwaiste Präfixobjekte
verwaiste Nachkommen-Präfixobjekte von suspendierten verwaisten
Eltern-Präfixobjekten und/oder künstlichen Varianten
sein können. Derartige verwaiste Nachkommen- Präfixobjekte können
wiederum ausgegeben werden abhängig von einer Häufigkeitsklassifizierung,
wie unten erklärt, oder anderweitig geordnet.
-
Die
verwaisten Präfixobjekte werden in der Reihenfolge einer
absteigenden Häufigkeit unter Verwendung der N-Gramm-Objekte 112 und
der zugehörigen Häufigkeitsobjekte 104 geordnet.
Da die verwaisten Präfixobjekte kein entsprechendes Wortobjekt 108 mit
einem zugehörigen Häufigkeitsobjekt 104 haben,
müssen die Häufigkeitsobjekte 104, die mit
den verschiedenen N-Gramm-Objekten 112 verbunden sind,
als ein Ersatz eingesetzt werden.
-
Unter
Verwendung der N-Gramm-Objekte 112 versucht die Disambiguierungsfunktion
zuerst, festzustellen, ob ein N-Gramm-Objekt 112, das zum Beispiel
drei Zeichen hat, eine Übereinstimmung für zum
Beispiel die letzten drei Zeichen eines verwaisten Präfixobjektes
ist. Das Beispiel von drei Zeichen wird gegeben, da das beispielhafte
Ausführungsbeispiel der tragbaren elektronischen Vorrichtung 4 N-Gramm-Objekte 112 umfasst,
die ein beispielhaftes Maximum der drei Zeichen in der Länge
sind, aber es ist offensichtlich, dass, wenn der Speicher 20 N-Gramm-Objekte
mit vier Zeichen in der Länge oder länger umfasst,
die Disambiguierungsfunktion typischerweise zuerst versucht, festzustellen,
ob ein N-Gramm-Objekt mit der größten Länge
in dem Speicher 20 mit der gleichen Quantität
von Zeichen am Ende eines verwaisten Präfixobjektes übereinstimmt.
-
Wenn
nur ein Präfixobjekt auf solch eine Art und Weise einem
N-Gramm-Objekt 112 mit drei Zeichen entspricht, wird ein
derartiges verwaistes Präfixobjekt zuerst unter den verschiedenen
verwaisten Präfixobjekten in der Varianten-Ausgabe 80 verzeichnet.
Wenn zusätzliche verwaiste Präfixobjekte mit N-Gramm-Objekten 112 mit
drei Zeichen übereinstimmen, dann werden die Häufigkeitsobjekte 104, die
zu derartigen identifizierten N-Gramm-Objekten 112 gehören,
analysiert und die übereinstimmenden verwaisten Präfixobjekte
werden unter sich selbst in der Reihenfolge einer abnehmenden Häufigkeit
geordnet.
-
Wenn
festgestellt wird, dass keine Übereinstimmung mit einem
N-Gramm-Objekt 112 mit drei Zeichen erlangt werden kann,
dann werden N-Gramm-Objekte 112 mit zwei Zeichen eingesetzt. Da
der Speicher 20 alle Permutationen von N-Gramm-Objekten 112 mit
zwei Zeichen umfasst, können zwei letzte Zeichen jedes
verwaisten Präfixobjekts mit einem entsprechenden N-Gramm-Objekt 112 mit
zwei Zeichen abgeglichen werden. Nachdem derartige Übereinstimmungen
erzielt wurden, werden die Häufigkeitsobjekte 104,
die zu derartigen identifizierten N-Gramm-Objekten 112 gehören,
analysiert und die verwaisten Präfixobjekte werden unter
sich selbst in absteigender Folge des Häufigkeitswertes der
Häufigkeitsobjekte 104 geordnet, die zu den identifizierten
N-Gramm-Objekten 112 gehörten. Es wird weiter
angemerkt, dass künstliche Varianten ähnlich unter
sich selbst angeordnet werden können unter Verwendung der
N-Gramm-Objekte 112 und der zugehörigen Häufigkeitsobjekte 104.
-
In
der 9 hat der Benutzer zusätzlich die „OP"-Taste 28 eingegeben.
Unter diesem Umstand und wie in 9 zu sehen
ist, wurde der Standard-Teil 76 der Ausgabe 64 das
Präfixobjekt „APOLO", wie es dem Wort „APOLOGIZE"
entsprechen würde, während unmittelbar vor der
aktuellen Eingabe der Standard-Teil 76 der Ausgabe 64 der 8 „APPL"
war, wie dem Wort „APPLE" entsprechen würde. Wieder
unter der Annahme, dass keine Bedieneingaben erfasst wurden, entspricht
das standardmäßige Präfixobjekt in der 9 nicht
dem vorhergehenden standardmäßigen Präfixobjekt
der 8. Somit wird die erste künstliche Variante „APOLP"
erzeugt und dieser wird in dem aktuellen Beispiel eine bevorzugte
Position gegeben. Die oben angeführte künstliche
Variante „APOLP" wird erzeugt durch Löschen des
letzten Zeichens des Standard-Präfixobjekts „APOLO"
und durch Liefern stattdessen eines entgegengesetzten Zeichens 48 der Taste 28,
die das letzte Zeichen des Standard-Teils 76 der Ausgabe 64 erzeugte,
was in dem aktuellen Beispiel der 9 „P"
ist, so dass die oben angeführte künstliche Variante „APOLP"
ist.
-
Ferner,
da die vorhergehende Standard-Ausgabe „APPL" einem Wortobjekt 108 entsprach,
wie dem Wortobjekt 108, das dem Wort „APPLE" entspricht,
und da mit der Hinzufügung der aktuellen Eingabe die vorhergehende
Standard-Ausgabe „APPL" nicht länger einem Wortobjekt 108 entspricht, werden
zwei zusätzliche künstliche Varianten erzeugt.
Eine künstliche Variante ist „APPLP" und die andere
künstliche Variante ist „APPLO", und diese entsprechen
der vorhergehenden standardmäßigen Ausgabe „APPL"
plus den Zeichen 48 der Taste 28, die betätigt
wurde, um die aktuelle Eingabe zu erzeugen. Diese künstlichen
Varianten werden ähnlich als Teil des Varianten-Teils 80 der
Ausgabe 64 ausgegeben.
-
Wie
in 9 gesehen werden kann, scheint der Standard-Teil 76 der
Ausgabe 64 „APOLO" nicht langer mit dem übereinzustimmen,
was als ein Präfix für „APPLOADER" benötigt
würde, und der Benutzer erwartet wahrscheinlich, dass das
gewünschte Wort „APPLOADER" noch nicht in dem
Speicher 20 gespeichert ist. Somit liefert der Benutzer
eine Auswahl-Eingabe, wie durch Scrollen mit dem Thumbwheel 32 oder
durch Betätigen der <NEXT>-Taste 40,
bis der Varianten-String „APPLO" hervorgehoben ist. Der
Benutzer fährt dann mit der Eingabe fort und gibt die „AS"-Taste
ein.
-
Die
Ausgabe 64 einer solchen Aktion wird in der 10 dargestellt.
Hier ist der String „APPLOA" der Standard-Teil 76 der
Ausgabe 64. Da der Varianten-String „APPLO" der
Standard-Teil 76 der Ausgabe 64 (nicht ausdrücklich
hierin dargestellt) als ein Resultat der Auswahl-Eingabe wurde hinsichtlich
des Varianten-Strings „APPLO" und da der Varianten-String „APPLO"
nicht einem Wortobjekt 108 entspricht, wurden die Zeichen-Strings „APPLOA"
und „APPLOS" als künstliche Varianten erzeugt.
Zusätzlich, da der vorhergehende Standard der 9, „APOLO",
vorher einem Wortobjekt 108 entsprochen hat, aber jetzt
nicht länger dem Standard-Teil 76 der Ausgabe 64 der 10 entspricht,
wurden auch die zusätzlichen künstlichen Varianten
von „APOLOA" und „APOLOS” erzeugt. Derartigen
künstlichen Varianten wird eine bevorzugte Position gegenüber
den drei angezeigten verwaisten Präfixobjekten gegeben.
-
Da
die aktuelle Eingabe-Sequenz in dem Beispiel nicht mehr einem Wortobjekt 108 entspricht, werden
die Teile des Verfahrens, die den Versuch betreffen, entsprechende
Wortobjekte 108 zu finden, nicht mit weiteren Eingaben
für die aktuelle Sitzung ausgeführt. Das heißt,
da kein Wortobjekt 108 der aktuellen Eingabe-Sequenz entspricht,
entsprechen weitere Eingaben ebenfalls keinem Wortobjekt 108. Ein
Vermeiden der Suche des Speichers 20 nach derartigen nicht
existierenden Wortobjekten 108 spart Zeit und vermeidet
vergeudete Verarbeitungsbemühungen.
-
Da
der Benutzer zu schreiben fortfährt, gibt der Benutzer
schließlich erfolgreich das Wort „APPLOADER" ein
und gibt eine Delimiter-Eingabe ein. Bei Erfassen der Delimiter-Eingabe
nach der Eingabe von „APPLOADER", wird die Lernen-Funktion
initiiert. Da das Wort „APPLOADER" nicht einem Wortobjekt 108 in
dem Speicher 20 entspricht, wird ein neues Wortobjekt 108 erzeugt,
das „APPLOADER" entspricht, und wird in der „neue
Wörter"-Datenbank 92 gespeichert, zusammen mit
einem entsprechenden neuen Häufigkeitsobjekt 104,
dem eine absolute Häufigkeit beispielsweise in dem oberen
Drittel oder Viertel des möglichen Häufigkeitsbereichs
gegeben wird. In dieser Hinsicht wird angemerkt, dass die „neue
Wörter"-Datenbank 92 und die Häufigkeits-Lernen-Datenbank 96 im
Allgemeinen in zwei-Zeichen-Präfix-Datentabellen organisiert
sind, die denen ähnlich sind, die in der generischen Wortliste 88 zu
finden sind. Somit wird dem neuen Häufigkeitsobjekt 104 zuerst
ein absoluter Häufigkeitswert zugewiesen, aber bei Speicherung
wird der absolute Häufigkeitswert, wenn es nicht der Maximalwert
in dieser Datentabelle ist, geändert, um einen normalisierten
Häufig keitswert-Prozentsatz zu umfassen, normalisiert auf
das, was der maximale Häufigkeitswert in dieser Datentabelle
ist.
-
Als
ein nachfolgendes Beispiel in der 11 versucht
der Benutzer, das Wort „APOLOGIZE" einzugeben. Der Benutzer
hat die Tastenfolge „AS" „OP" „OP" „L" „OP"
eingegeben. Da „APPLOADER" jetzt als ein Wortobjekt 108 zu
der „neue Wörter"-Datenbank 92 hinzugefügt
wurde und einem Häufigkeitsobjekt 104 zugeteilt
wurde, das einen relativ hohen Häufigkeitswert hat, wird
das Präfixobjekt „APPLO", das „APPLOADER"
entspricht, angezeigt als der Standard-Teil 76 der Ausgabe 64 gegenüber
dem Varianten-Präfixobjekt „APOLO", das dem gewünschten
Wort „APOLOGIZE" entspricht. Da das Wort „APOLOGIZE"
einem Wortobjekt 108 entspricht, das zumindest in der generischen
Wortliste 88 gespeichert ist, kann der Benutzer einfach
fortfahren, Tastenanschläge einzugeben, die den zusätzlichen Buchstaben „GIZE"
entsprechen, welche die Buchstaben in dem Wort „APOLOGIZE"
sind, die dem Präfixobjekt „APOLO" folgen, um
das Wort „APOLOGIZE" zu erhalten. Alternativ kann der Benutzer,
wenn er die Ausgabe 64 sieht, die in der 11 dargestellt wird,
eine Auswahl-Eingabe eingeben, um positiv das Varianten-Präfixobjekt „APOLO"
zu wählen. In einem solchen Umstand wird die Lernen-Funktion
ausgelöst bei Erfassung eines Delimiter-Symbols, und das
Wortobjekt 108, das dem Zeichen-String „APOLO"
zu dem Zeitpunkt entsprochen hat, an dem die Auswahl-Eingabe gemacht
wurde, wird in der Häufigkeits-Lernen-Datenbank 92 gespeichert
und wird einem revidierten Häufigkeitsobjekt 104 zugeordnet, das
einen relativ höheren Häufigkeitswert hat, das ähnlich
in der Häufigkeits-Lernen-Datenbank 92 gespeichert
wird.
-
Eine
zusätzliches Merkmal der tragbaren elektronischen Vorrichtung 4 wird
allgemein in der 12 dargestellt. Unter einigen
Umständen ist es wünschenswert, dass die Disambiguierungsfunktion deaktiviert
wird. Zum Beispiel, wenn gewünscht wird, ein Passwort einzugeben,
ist eine Disambiguierung typischerweise relativ lästiger
als während einer herkömmlichen Texteingabe. Somit,
wenn der Systemfokus auf der Komponente ist, die dem Passwortfeld entspricht,
zeigt die Komponente der API an, dass eine spezielle Verarbeitung
verlangt wird, und die API deaktiviert die Disambiguierungsfunktion
und aktiviert stattdessen zum Beispiel ein Mehrfach-Tippen-Eingabe-Interpretationssystem.
Alternativ können andere Eingabe-Interpretationssysteme
ein Chording-System umfassen oder ein Drücken-und-Halten/Drücken-und-Freigabe-Interpretationssystem.
Somit kann, während eine Eingabe, wenn die Disambiguierungsfunktion
aktiv ist, eine vieldeutige Eingabe ist, durch Aktivieren des alternativen
Interpretationssystems, wie das beispielhafte Mehrfach-Tippen-System,
jede Eingabe zum großen Teil eindeutig sein.
-
Wie
aus der 12 zu sehen ist, wird jede eindeutige
Eingabe während eines sehr kurzen Zeitabschnitts in dem
Passwortfeld 120 angezeigt und wird dann ersetzt mit einer
anderen Ausgabe, wie dem Sternchen. Das Zeichen „R" wird
angezeigt gezeigt, wobei offensichtlich ist, dass eine derartige
Anzeige nur während eines sehr kurzen Zeitabschnitts ist.
-
Wie
in den 1 und 7–11 gesehen
werden kann, umfasst die Ausgabe 64 die angezeigte Grafik 46 nahe
dem unteren Ende der Varianten-Komponente 72, und dass
die angezeigte Grafik 46 sehr ähnlich zu der Grafik 42 der <NEXT>-Taste 40 ist.
Eine derartige Darstellung liefert eine Anzeige an den Benutzer,
welche der Tasten 28 des Tastaturfelds 24 gedrückt
werden können, um eine Varianten-Ausgabe zu wählen.
Die Darstellung der angezeigten Grafik 46 liefert eine
Verbindung zwischen der Ausgabe 64 und der <NEXT>-Taste 40 in
dem Speicher des Benutzers. Zusätzlich, wenn der Benutzer
die <NEXT>-Taste 40 einsetzt,
um eine Auswahl-Eingabe zu liefern, kann der Benutzer die <NEXT>-Taste 40 betätigen,
ohne die Hände des Benutzers weg von der Position zu bewegen,
welche die Hände inne hatten in Bezug auf das Gehäuse 6 während
der Texteingabe, was nicht-notwendige Handbewegungen reduziert,
die erforderlich sind, wenn ein Be nutzer eine Hand bewegen muss,
um das Thumbwheel 32 zu betätigen. Dies spart
Zeit und Mühe.
-
Es
wird auch angemerkt, dass das System das Bestehen bestimmter vordefinierter
Symbole als Delimiter-Signale erfassen kann, wenn kein Wortobjekt 108 dem
Texteintrag entspricht, der das Symbol umfasst. Wenn zum Beispiel
der Benutzer wünscht, die Eingabe „one-off" einzugeben,
kann der Benutzer beginnen durch Eingabe der Tastenfolge „OP" „BN" „ER" „ZX" „OP",
wobei die „ZX"-Betätigung sich auf das Bindestrichsymbol
beziehen soll, das darauf angeordnet ist. Alternativ, statt des
Tippens der „ZX"-Taste kann der Benutzer einen <ALT>-Eintrag betätigen,
um den Bindestrich eindeutig anzuzeigen.
-
Unter
der Annahme, dass der Speicher 20 nicht bereits ein Wortobjekt 108 von „one-off"
umfasst, erfasst die Disambiguierungsfunktion den Bindestrich als
eine Delimiter-Eingabe. Somit werden die Tasteneintragungen, die
der Delimiter-Eingabe vorangehen, von den Tasteneintragungen abgegrenzt,
die auf die Delimiter-Eingabe folgen. Somit wird die gewünschte
Eingabe als zwei getrennte Wörter gesucht, d. h. „ONE"
und „OFF" mit dem Bindestrich dazwischen. Dies erleichtert
eine Verarbeitung durch eine engere Identifizierung, was gesucht werden
soll.
-
Die
tragbare elektronische Vorrichtung 4 kann auch konfiguriert
sein, um vorgeschlagene Kompositum-Lösungen für
eine vieldeutige Eingabe zu identifizieren und vorzusehen. Zum Beispiel
kann ein Benutzer versuchen, das Wort „highschool" einzugeben,
von dem gesagt werden kann, dass es ein zusammengesetzter Sprachausdruck
(Kompositum) ist, der die Wörter „high" und „school"
aufweist. Wenn angenommen wird, dass das Wort „highschool"
nicht bereits als ein Sprachobjekt 100 in dem Speicher 20 gespeichert
ist, kann die tragbare elektronische Vorrichtung 4 auf
Schwierigkeiten treffen beim Versuch, solch eine vieldeutige Eingabe
zu disambiguieren. Vorteilhafterweise ist folglich die tragbare
elekt ronische Vorrichtung 4 konfiguriert, Kompositum-Lösungen
unter bestimmten Umständen zu suchen.
-
Allgemein
ausgedrückt, versucht die tragbare elektronische Vorrichtung 4,
an einer Position mit einer relativ höheren Priorität,
d. h. am Anfang einer Liste, eine oder mehrere vorgeschlagene Ausgabe(n)
zu identifizieren und auszugeben, die repräsentativ sind
für zumindest einen Teil eines Sprachobjekts 100,
der einer vieldeutigen Eingabe in ihrer Gesamtheit entspricht. Das
heißt Einzelwort-Lösungen werden als bevorzugt
betrachtet gegenüber Kompositum-Lösungen. Jedoch
können Kompositum-Lösungen identifiziert und ausgegeben
werden als Lösungen, die relativ weniger bevorzugt sind
als Einzelwort-Lösungen, die aber mehr bevorzugt sind als
Lösungen, die künstliche Varianten umfassen. Auf
beispielhafte Weise kann folglich die tragbare elektronische Vorrichtung 4,
als Reaktion auf eine vieldeutige Eingabe, eine Ausgabe vorsehen,
die eine Vielzahl von Lösungen aufweist, mit einer Anzahl
von Lösungen, die Einzelwort-Lösungen entsprechen
und an einer Position mit höchster Priorität ausgegeben
werden, wobei eine Anzahl von Kompositum-Lösungen an einer
Position mit relativ gemäßigter Priorität
ausgegeben wird, und wobei eine Anzahl von Lösungen auf
künstlichen Varianten basieren, die an einer Position einer
relativ niedrigen Priorität ausgegeben werden. Die Quantität
von Resultaten kann angepasst werden basierend auf Benutzerpräferenz
und kann folglich weniger als alle Resultate umfassen, die oben
erwähnt werden.
-
Es
wird angemerkt, dass eine Kompositum-Lösung typischerweise
repräsentativ ist für zwei oder mehr Sprachobjekte 100,
was bedeutet, dass Kompositum-Lösungen repräsentativ
sein können für ein Paar von Sprachobjekten 100 und/oder
repräsentativ sein können für drei oder
mehr Sprachobjekte 100. Zu Zwecken der Einfachheit bei
der Darstellung einiger der Aspekte des offenbarten und beanspruchten
Konzepts, wird ein erster Satz von Beispielen, die unten dargestellt
werden, hinsichtlich Kompositum-Lösungen beschrieben, die
repräsenta tiv sind für zwei Sprachobjekte 100.
Wie detaillierter unten dargelegt wird, existieren jedoch dieselben
Aspekte in Kompositum-Lösungen und können aus
den Kompositum-Lösungen erlangt werden, die repräsentativ sind
für drei oder mehr Sprachobjekte 100.
-
Wie
allgemein in den 13–13D dargestellt, wird eine beispielhafte vieldeutige
Eingabe 607 (13) gezeigt als umfassend sieben
Eingabeelementbetätigungen, die durch die umrandeten Ziffern
1 bis 7 dargestellt werden. Die Disambiguierungsroutine 22 versucht
zuerst, ein oder mehrere Sprachobjekte 100 zu identifizieren,
die der vieldeutigen Eingabe in ihrer Gesamtheit entsprechen. Das heißt,
die Disambiguierungsroutine 22 versucht, Sprachobjekte 100 zu
identifizieren, die sieben oder mehr linguistische Elemente haben
und die der gesamten vieldeutigen Eingabe 607 entsprechen.
Abhängig von der vieldeutigen Eingabe 607 ist
es möglich, dass kein solches entsprechendes Sprachobjekt 100 in
dem Speicher 20 identifiziert werden kann.
-
Abhängig
von der vieldeutigen Eingabe 607 kann die Disambiguierungsroutine 22 zusätzlich
versuchen, die vieldeutige Eingabe 607 als eine Kompositum-Eingabe
zu interpretieren. In dem dargestellten beispielhaften Ausführungsbeispiel
sucht die Disambiguierungsroutine 22 Kompositum-Lösungen,
wenn ein Sprachobjekt 100 identifiziert wird, das einem
ersten Teil der vieldeutigen Eingabe 607 entspricht und eine
Länge hat, die zu der Länge des ersten Teils gleich
ist. Wie hierin eingesetzt, sollen der Ausdruck „Länge"
und Variationen davon breit auf eine Quantität von Elementen
verweisen, aus denen ein Objekt besteht, wie die Quantität
von linguistischen Elementen, aus denen ein Sprachobjekt 100 besteht.
-
Die
Disambiguierungsroutine 22 sucht Kompositum-Lösungen
als Reaktion auf eine vieldeutige Eingabe, wenn ein Anfangsteil
der vieldeutigen Eingabe als derselbe wie ein Sprachobjekt 100 in
dem Speicher 20 festgestellt wird. In dem hier gezeigten Beispiel
beginnt solch ein „Anfangsteil" mit der ersten Eingabeelement-Betätigung
der vieldeutigen Eingabe 607 und endet vor der letzten
Eingabeelement-Betätigung, obgleich Variationen möglich
sind.
-
Wenn
zum Beispiel angenommen wird, dass ein Benutzer, der die vieldeutige
Eingabe 607 eingibt, versucht, das Wort „highschool"
einzugeben, hätte die Disambiguierungsroutine 22 bereits
an verschiedenen Punkten während der Eingabe der vieldeutigen
Eingabe 607 erkannt, dass verschiedene Anfangsteile der
vieldeutigen Eingabe 607 verschiedenen Sprachobjekten 100 entsprechen
und eine gleiche Länge haben. Wie allgemein in 13A gezeigt wird, während der Eingabe
der vieldeutigen Eingabe 607, hätte die Disambiguierungsroutine 22 erkannt, dass
die ersten zwei Eingabeelement-Betätigungen, nämlich <GH> und <UI>, d. h. ein erster
Teil 611A, ein Anfangsteil ist, der dem Sprachobjekt 100 für „hi" und
die gleiche Länge wie dieses hat. Solche Erkennung würde
stattgefunden haben mit der zweiten Eingabeelement-Betätigung.
-
Wenn
der erste Teil 611A identifiziert wurde als ein komplettes
Wort darstellend, wie durch ein Sprachobjekt 100 dargestellt,
würde die Disambiguierungsroutine 22 folglich
versuchen, ein weiteres Sprachobjekt 100 zu identifizieren,
das einem anderen Teil der vieldeutigen Eingabe 607 entspricht, nachfolgend
auf den ersten Teil 611A. Es wird wiederholt, dass einige
der Beispiele, die hier dargestellt werden, hinsichtlich Zweikomponenten-Kompositum-Lösungen
aus Gründen der Einfachheit beschrieben werden, und in
dem vorliegenden Beispiel versucht folglich die Disambiguierungsroutine 22,
ein Sprachobjekt 100 zu identifizieren, das einem zweiten
Teil 615A der vieldeutigen Eingabe 607 entspricht.
Ein derartiger zweiter Teil 615A würde Betätigungen
der Tasten 28 <GH> <GH> <AS> <CV> und <GH> nachfolgend auf den
ersten Teil 611A aufweisen. Wenn angenommen wird, dass
kein Sprachobjekt 100 in dem Speicher 20 gefunden
werden kann, das einem solchen zweite Teil 615A entspricht,
würde die Zweikomponenten-Kompositum-Lösung, die auf
die Art und Weise gesucht wird, die allgemein in der 13A gezeigt wird, fehlschlagen. Es wird zur Vollständigkeit
angeführt, dass eine oder mehrere Kompositum-Lösungen,
die repräsentativ sind für drei oder mehr Sprachobjekte 100,
potentiell für die vieldeutige Eingabe 607 gefunden
werden können, aber hierin nicht gezeigt werden.
-
Die
Disambiguierungsroutine 22 würde zusätzlich
gemerkt haben, dass die ersten drei Eingabeelement-Betätigungen,
d. h. <GB> <UI> <GH>, ein anderer erster
Teil 611B der vieldeutigen Eingabe 607 sind, der
einem Sprachobjekt 100 in dem Speicher 20 entspricht
und eine gleiche Länge hat, spezifisch das Sprachobjekt 100 für
das Wort „hug", wie allgemein in der 13B gezeigt wird. Die Disambiguierungsroutine 22 versucht
folglich, ein Sprachobjekt 100 in dem Speicher 20 zu
identifizieren, das einem zweiten Teil 615B der vieldeutigen
Eingabe 607 entspricht, d. h. <GB> <AS> <CV> <GB>. Wenn angenommen wird,
dass ein Sprachobjekt 100 in dem Speicher 20 für
das englische Wort „hachure" existiert, interpretiert die
Disambiguierungsroutine die vieldeutige Eingabe 607 als
möglicherweise eine versuchte Eingabe des Kompositums „hughachure". Das
heißt, eine mögliche Kompositum-Lösung
für die vieldeutige Eingabe 607 würde
repräsentativ sein für das Sprachobjekt 100 für „hug"
und das Sprachobjekt 100 für „hachure".
-
Wie
detaillierter unten beschrieben wird und wie in der 14 dargestellt
wird, kann die tragbare elektronische Vorrichtung 4 „hughhach"
als eine Darstellung 619B der Kompositum-Lösung „hughachure" ausgeben,
wobei eine solche Darstellung 619B eine Darstellung des
Sprachobjekts 100 für „hug" und eine Darstellung
eines Teils des Sprachobjekts 100 für „hachure"
aufweist. Diese Darstellung 619B wird auch schematisch
in der 13B dargestellt.
-
Ähnlich
und wie allgemein in der 13C dargestellt,
erkennt die Disambiguierungsroutine 22, dass die ersten
vier Eingabeelement-Betätigungen der vieldeuti gen Eingabe 607 ebenfalls
ein erster Teil 611C der vieldeutigen Eingabe 607 sind,
die einem Sprachobjekt 100 in dem Speicher 20 entspricht
und eine gleiche Länge hat, spezifisch für das
Wort „high". Die Disambiguierungsroutine 22 versucht folglich,
ein Sprachobjekt 100 in dem Speicher 20 zu identifizieren,
das einem zweiten Teil 615C der vieldeutigen Eingabe 607 entspricht,
der dem ersten Teil 611C nachfolgt. Spezifisch bestimmt
die Disambiguierungsroutine 22, dass der zweite Teil 615C,
d. h. <AS> <CV> <GH>, dem Sprachobjekt 100 für
das Wort „school" entspricht. Die Disambiguierungsroutine 22 kann
dann zusätzlich bestimmen, dass die vieldeutige Eingabe 607 ein
Versuch durch den Benutzer sein kann, das Kompositum „highschool"
einzugeben, wodurch die Kompositum-Lösung „high"
plus „school" erzeugt wird. Die Vorrichtung kann „highsch" als
Darstellung 619C solch einer Kompositum-Lösung
ausgeben. Die Darstellung 619C wird schematisch in der 13C dargestellt.
-
Außerdem
und wie allgemein in der 13D dargestellt
wird, kann die Disambiguierungsroutine 22 bestimmen, dass
die ersten fünf Eingabeelement-Betätigungen einen
anderen ersten Teil 611D darstellen, der dem Sprachobjekt 100 für
das Wort „highs" entspricht und eine gleiche Länge
hat. Die Disambiguierungsroutine versucht folglich auch, ein zweites
Sprachobjekt 100 zu identifizieren, das einem zweiten Teil 615D der
vieldeutigen Eingabe 607 entspricht, der dem ersten Teil 611D nachfolgt
Zum Beispiel kann die Disambiguierungsroutine das Sprachobjekt 100 für
das Wort „choice" identifizieren als dem zweiten Teil 615D entsprechend.
Die Disambiguierungsroutine 22 würde folglich
die vieldeutige Eingabe 607 als möglicherweise
ein Versuch durch den Benutzer interpretieren, das Kompositum „highschoice"
einzugeben durch Erzeugen der Kompositum-Lösung „highs"
plus „choice". Die tragbare elektronische Vorrichtung 4 kann „highsch"
als Darstellung 619D der Kompositum-Lösung „highs"
plus „choice" ausgeben, wobei angemerkt werden soll, dass
diese Darstellung 619D die selbe wie die Darstellung 619B ist,
wobei die Darstellungen 619B und 619D folglich ausgegeben
werden als eine einzelne Variante, um eine nicht wünschenswerte
Verdopplung zu vermeiden.
-
Um
die Erzeugung von Kompositum-Lösungen zu begrenzen, die
eine sehr niedrige Wahrscheinlichkeit oder keine Wahrscheinlichkeit
haben, das zu sein, was ein Benutzer eingeben möchte, führt die
Disambiguierungsroutine 22 zusätzlich eine Analyse
der Kombination der Sprachobjekte 100 durch, die eine Kompositum-Lösung
bilden. Spezifisch und wie allgemein in den 13B, 13C und 13D dargestellt
wird, wird zumindest ein Verbindungsobjekt 639B, 639C und 639D für
jede Kompositum-Lösung erzeugt. In dem Beispiel, das dargestellt
wird in den 13B, 13C und 13D, ist das Verbindungsobjekt einer Kompositum-Lösung das
letzte linguistische Element des einen Sprachobjekts, gefolgt von
dem ersten linguistischen Element des angrenzenden Sprachobjekts.
So ist das Verbindungsobjekt 639B der Kompositum-Lösung „hug" plus „hachure"
die linguistische Elementzeichenkette „hg". Ähnlich
ist das Verbindungsobjekt 639C der Kompositum-Lösung „high"
plus „school" die linguistische Elementzeichenkette „hs". Ähnlich
ist das Verbindungsobjekt 639D der Kompositum-Lösung „highs"
plus „choice" die linguistische Elementzeichenkette „sc".
-
Jedes
Verbindungsobjekt 639B, 639C und 639D,
etc., soll mit einem oder mehreren N-Gramm-Objekten 112 in
dem Speicher 20 verglichen werden. Dies gibt der Disambiguierungsroutine 22 eine
Gelegenheit, geeignete Schritte zu unternehmen, wenn das Verbindungsobjekt 639B, 639C und 639D,
etc., eine sehr geringe Häufigkeit hat oder nicht-existent
ist in der vorliegenden Sprache. In dem vorliegenden Beispiel sind
die Verbindungsobjekte 639B, 639C und 639D jeweils
zwei linguistische Elemente in der Länge und werden folglich
jeweils mit einer Anzahl der 2-Gramm-Objekte verglichen.
-
Wenn
ein bestimmtes Verbindungsobjekt einem N-Gramm-Objekt 112 entspricht,
das zu einem Häufigkeitsobjekt 104 gehört
mit einem relativ niedrigen Häufigkeitswert, wie ein Häufigkeitswert
unterhalb einer vorbestimmten Schwelle, würde dies anzeigen,
dass die bestimmte Kompositum-Lösung, aus der das bestimmte
Verbindungsobjekt abgeleitet wurde, extrem unwahrscheinlich die
Eingabe ist, die von dem Benutzer gewünscht wird. Das heißt,
da der Häufigkeitswert eines Häufigkeitsobjekts 104,
das zu einem N-Gramm-Objekt 112 gehört, die relative Wahrscheinlichkeit
anzeigt, dass die Zeichenfolge, die durch dieses bestimmte N-Gramm-Objekt 112 dargestellt
wird, an einer Position in einem Wort der relevanten Sprache existiert,
zeigt die Entsprechung eines N-Gramms 112 mit niedriger
Wahrscheinlichkeit mit einem Verbindungsobjekt eine Kompositum-Lösung
mit niedriger Wahrscheinlichkeit an.
-
Ähnlich,
wenn kein N-Gramm-Objekt 112 gefunden werden kann, das
einem bestimmten Verbindungsobjekt entspricht, würde dies
auch eine Kompositum-Lösung mit niedriger Wahrscheinlichkeit oder
null Wahrscheinlichkeit anzeigen. In dem vorliegenden beispielhaften
Ausführungsbeispiel hat der Speicher 20 darin
alle der Zwei-Buchstaben-Permutationen der sechsundzwanzig lateinischen
Buchstaben gespeichert. Somit wird in der vorliegenden beispielhaften
Konfiguration ein 2-Gramm-Objekt allgemein immer identifiziert als
einem Verbindungsobjekt mit einer Länge von zwei linguistischen
Elementen entsprechend. Wie jedoch unten erläutert wird,
kann ein Verbindungsobjekt mehr als zwei linguistische Elemente
in der Länge sein und das beispielhafte Ausführungsbeispiel
der tragbaren elektronischen Vorrichtung 4 hat weniger
als alle Drei-Buchstaben-Permutation der sechsundzwanzig lateinischen Buchstaben.
In einigen Umständen ist es folglich möglich,
dass ein N-Gramm-Objekt 112 nicht gefunden werden kann,
das einem bestimmten Verbindungsobjekt entspricht. Es wird auch
angemerkt, dass in anderen Ausführungsbeispielen die tragbare elektronische
Vorrichtung weniger als alle der Zwei-Buchstaben-Permutationen der
sechsundzwanzig lateinischen Buchstaben darin gespeichert haben
kann, und ein Fehlen einer N- Gramm-Entsprechung mit einem Verbindungsobjekt
kann in dieser Situation genauso auftreten.
-
In
dem vorliegenden beispielhaften Ausführungsbeispiel weist
die Disambiguierungsroutine 22 einer gegebenen Kompositum-Lösung
den Häufigkeitswert des N-Gramm-Objektes 112 zu,
der als entsprechend dem Verbindungsobjekt der Kompositum-Lösung
identifiziert wird. Wenn kein entsprechendes N-Gramm-Objekt 112 identifiziert
wird, wird ein Häufigkeitswert von null zugewiesen. Die
Disambiguierungsroutine 22 kann die Kompositum-Lösungen
in abnehmender Reihenfolge des Häufigkeitswertes anordnen.
Wenn der Häufigkeitswert einer Kompositum-Lösung
null ist oder unterhalb einer vorbestimmten Schwelle ist, kann die
Disambiguierungsroutine zum Beispiel die Kompositum-Lösung von
einer Ausgabe unterdrücken oder kann sie an einer Position
mit relativ niedriger Wahrscheinlichkeit ausgeben.
-
In
dem vorliegenden Beispiel ist die linguistische Elementzeichenkette „gh", „hs"
und „se" der Verbindungsobjekte 639B, 639C und 639D unwahrscheinlich
von einer unerwünscht niedrigen Wahrscheinlichkeit und
die entsprechenden Kompositum-Lösungen sollen folglich
unwahrscheinlich von einer Ausgabe unterdrückt werden.
Andererseits würde ein Verbindungsobjekt in Form der linguistischen
Zeichenkette „qg" wahrscheinlich darin resultieren, dass
die entsprechende Kompositum-Lösung unterdrückt
wird oder zumindest in einer Position mit relativ niedriger Priorität
ausgegeben wird.
-
Um
die Erzeugung von Kompositum-Lösungen zu begrenzen, die
eine sehr niedrige Wahrscheinlichkeit haben das zu sein, was ein
Benutzer eingeben möchte, begrenzt die Disambiguierungsroutine 22 zusätzlich
die Datenquellen, aus denen zweite und nachfolgende Sprachobjekte 100 einer Kompositum-Lösung
identifiziert werden können. Zum Beispiel ist die generische
Wortliste 88 eine Daten quelle, die im Wesentlichen unberührt
ist und darin verschiedene Sprachobjekte 100 gespeichert
hat. Die generische Wortliste 88 kann die Quelle von einigen
der linguistischen Objekte 100 sein, aus denen eine Kompositum-Lösung
besteht. Andererseits hat die „neue Wörter"-Datenbank 92 zum
Beispiel darin Sprachobjekte 100 gespeichert, die für
kundenspezifische Wörter repräsentativ sind, und
die Inhalte der „neue Wörter"-Datenbank 92 können
sich ändern. Während die „neue Wörter"-Datenbank 92 die
Quelle eines ersten Sprachobjekts 100 einer Kompositum-Lösung
sein kann, ist die „neue Wörter"-Datenbank 92 in
dem vorliegenden beispielhaften Ausführungsbeispiel keine
Quelle eins zweiten oder nachfolgenden Sprachobjekts 100 einer
Kompositum-Lösung.
-
Es
wird weiter gemerkt, dass ein Alphabet auf der tragbaren elektronischen
Vorrichtung 4 alle linguistischen Elemente aufweist, die
auf der tragbaren elektronischen Vorrichtung 4 verfügbar
sind. Das Alphabet weist auf ein Kernalphabet und ein erweitertes
Alphabet. In dem vorliegenden beispielhaften Ausführungsbeispiel
besteht das Kernalphabet aus sechsundzwanzig lateinischen Buchstaben.
Die Sprachobjekte in der generischen Wortliste bestehen nur aus
den linguistischen Elementen des Kernalphabets. Das erweiterte Alphabet
weist linguistische Elemente außer den sechsundzwanzig
lateinischen Buchstaben auf. Das linguistische Element in dem erweiterten
Alphabet kann somit Zeichen in nicht-lateinischen Sprachen umfassen
und kann zusätzlich oder alternativ lateinische Buchstaben
mit diakritischen Zeichen umfassen, wie den lateinischen Buchstaben „U"
mit einem Umlaut, somit „Ü". In dieser Hinsicht
kann die „neue Wörter"-Datenbank 92 ein
Sprachobjekt 100 umfassen, das repräsentativ ist
für das Wort „MÜNCHEN", und ein anderes
Sprachobjekt 100, das repräsentativ ist für
das Wort „ÜBER".
-
Bei
der Disambiguierung einer vieldeutigen Eingabe sucht die Disambiguierungsroutine,
zumindest anfangs, in allen Datenquellen auf der tragbaren elektronischen
Vorrichtung 4, um Sprachobjekte 100 zu identifizieren,
die der vieldeutigen Eingabe entsprechen. Wenn jedoch festgestellt
wird, dass kein einziges Sprachobjekt 100 der gesamten
vieldeutigen Eingabe entspricht, aber dass ein Anfangsteil der vieldeutigen
Eingabe einem Sprachobjekt 100 entspricht und die gleiche
Länge hat, sucht die Disambiguierungsroutine 22 nur
in der generischen Wortliste 88, d. h. eine statische Datenquelle,
nach Sprachobjekten 100, die Teilen der vieldeutigen Eingabe
entsprechen können, die deren Anfangsteil folgen. Somit
wäre es, abhängig von der vieldeutigen Eingabe, für
die tragbare elektronische Vorrichtung 4 möglich, „ÜBERGENIUS"
als eine Kompositum-Lösung zu identifizieren. Das heißt,
das Sprachobjekt 100 für „ÜBER"
kann in der „neue Wörter"-Datenbank 92 identifiziert
worden sein, und das Sprachobjekt 100 für „GENIUS"
kann in der generischen Wortliste 88 identifiziert worden
sein. Es ist jedoch für es nicht möglich, „GOLDMÜNCHEN"
als eine Kompositum-Lösung zu identifizieren, wenn ein
Benutzer die Tasten <GH> <OP> <L> <DF> <M> <UI> betätigt während
einer beabsichtigten Eingabe des Wortes „GOLDMINE". Das
heißt, während das Sprachobjekt 100 für „GOLD"
in der generischen Wortliste 88 identifiziert werden kann,
würde das Sprachobjekt 100 für „MÜNCHEN"
nicht als ein zweites oder nachfolgendes Wort solch einer Kompositum-Lösung
identifiziert werden, da nur die generische Wortliste 88 überprüft wird
bei der Suche solcher zweiten oder folgenden Wörter, und
das Sprachobjekt 100 für „MÜNCHEN"
in dem vorliegenden Beispiel wird in der „neue Wörter"-Datenbank 92 gespeichert.
-
Allgemein,
als Reaktion auf eine vieldeutige Eingabe, werden alle erzeugten
Kompositum-Lösungen an einer Position einer relativ niedrigeren
Priorität ausgegeben als ein Sprachobjekt 100,
das der gesamten vieldeutigen Eingabe entspricht. Die Kompositum-Lösungen
werden selbst angeordnet und ausgegeben in abnehmender Reihenfolge
der Priorität entsprechend der zunehmenden Quantität
von Sprachobjekten 100 darin. Das heißt, eine
Kompositum-Lösung, die aus zwei Sprachobjekten 100 besteht,
wird an einer Position einer relativ höheren Priorität
ausgegeben als eine Kompositum-Lösung, die aus drei Sprachobjekten 100 besteht,
und so weiter.
-
Wenn
eine Vielzahl von Kompositum-Lösungen jeweils aus der selben
Quantität von Sprachobjekten 100 besteht, wie
das Beispiel, das in den 13–13D dargestellt wird, wobei die Kompositum-Lösungen
jeweils aus zwei Sprachobjekten 100 bestehen, wird ein
Längenidentitätswert für jede derartige
Kompositum-Lösung berechnet. Die Längenidentitätsberechnung
hängt davon ab, ob die Kompositum-Lösung aus zwei
Sprachobjekten 100 besteht oder aus drei oder mehr Sprachobjekten 100 besteht.
-
Wenn
eine Kompositum-Lösung aus zwei Sprachobjekten 100 besteht,
kann gesagt werden, dass die vieldeutige Eingabe einen ersten Teil
und einen zweiten Teil umfasst. Der Unterschied bezüglich der
Länge zwischen dem ersten Teil und dem zweiten Teil wird
festgestellt als die Längenidentität für
die Kompositum-Lösung. Auf beispielhafte Weise hat die Kompositum-Lösung
der 13B eine Längenidentität
mit einem Wert 1, die Kompositum-Lösung in der 13C hat auch eine Längenidentität
mit einem Wert 1 und die Kompositum-Lösung in der 13D hat eine Längenidentität
mit einem Wert 3.
-
Wenn
die Kompositum-Lösung aus drei oder mehr Sprachobjekten 100 besteht,
kann gesagt werden, dass die vieldeutige Eingabe drei oder mehr
Teile aufweist. In solch einer Situation ist die Längenidentität
der Kompositum-Lösung die Summe jedes Längenunterschieds
zwischen einem gegebenen Teil der vieldeutigen Eingabe, der eine
gegebene Länge hat, und dem Teil der vieldeutigen Eingabe,
der die nächstgrößte Länge kürzer
als die gegebene Länge hat. Zum Beispiel kann die vieldeutige
Eingabe 607 der 13 zu
der Erzeugung von drei Kompositum-Lösungen geführt
haben, die jeweils aus drei Sprachobjekten bestehen, wie in den 13E, 13F und 13G dargelegt wird.
-
In
der 13E ist ein erster Teil 611E der vieldeutigen
Eingabe 607 drei linguistische Elemente in der Länge,
ein zweiter Teil 615E ist zwei linguistische Ele mente in
der Länge, und ein dritter Teil 657E ist zwei
linguistische Elemente in der Länge. Der Unterschied in
der Länge zwischen dem längsten Teil, d. h. der
erste Teil 611E mit drei linguistischen Elemente in der
Länge, und dem Teil, der die nächstgrößte
Länge hat, d. h. einer der zweiten und dritten Teile 615E und 657E mit
jeweils zwei linguistischen Elemente in der Länge, ist
1. Es gibt einen Null-Unterschied in der Länge zwischen
den zweiten und dritten Teilen 615E und 657E.
So ist 1 plus null gleich 1 und der berechnete Wert der Längenidentität
für die Kompositum-Lösung ist 1, wobei eine Darstellung
eines Teils schematisch mit der Ziffer 619E dargestellt
wird.
-
Es
wird angemerkt, dass die 13E ein erstes
Verbindungsobjekt 639E und ein zweites Verbindungsobjekt 659E darstellt,
erzeugt für die Kompositum-Lösung davon. Wenn
eines der Verbindungsobjekte 639E und 659E einem
N-Gramm 112 entspricht, das zu einem Häufigkeitsobjekt 104 gehört,
das einen Häufigkeitswert unterhalb einer vorbestimmten
Schwelle hat, oder wenn kein entsprechendes N-Gramm 112 gefunden
werden kann für eines der Verbindungsobjekte 639E und 659E,
wird die Kompositum-Lösung wahrscheinlich unterdrückt
und nicht ausgegeben.
-
In
der 13F ist ein erster Teil 611F der vieldeutigen
Eingabe 607 drei linguistische Elemente in der Länge,
ein zweiter Teil 615F ist drei linguistische Elemente in
der Länge, und ein dritter Teil 657F ist ein linguistisches
Element in der Länge. Es gibt keinen Unterschied in der
Länge zwischen den ersten und zweiten Teilen 611F und 615F,
die jeweils die längsten Teile sind. Der Unterschied in
der Länge zwischen einem der längsten Teile, d.
h. den ersten und zweiten Teilen 611F und 615F,
die jeweils drei linguistischen Elemente in der Länge sind,
und dem Teil, der die nächstgrößte Länge
hat, d. h. der dritte Teil 657F mit einem linguistischen
Element, ist 2. Somit ist null plus 2 gleich 2 und der berechnete
Wert der Längenidentität für die Kompositum-Lösung,
wobei eine Darstellung eines Teils davon schematisch mit der Ziffer 619F dargestellt
wird, ist 2.
-
In
der 13G ist ein erster Teil 611G der vieldeutigen
Eingabe 607 zwei linguistische Elemente in der Länge,
ein zweiter Teil 615G ist vier linguistische Elemente in
der Länge, und ein dritter Teil 657G ist ein linguistisches
Element in der Länge. Der Unterschied in der Länge
zwischen dem längsten Teil, d. h. dem zweiten Teil 615F mit
vier linguistischen Elemente in der Länge, und dem Teil,
der die nächstgrößte Länge kürzer
als diese Länge hat, d. h. der erste Teil 611G mit
einer Länge von zwei linguistischen Elementen, ist 2. Der
Unterschied in der Länge zwischen dem ersten Teil 611F mit
zwei linguistischen Elemente in der Länge und dem Teil,
der die nächstgrößte Länge kürzer
als diese Länge hat, d. h. der dritte Teil 657F mit
einem linguistischen Element in der Länge, ist 1. Somit
ist 2 plus 1 gleich 3, und der berechnete Wert der Längenidentität
für die Kompositum-Lösung, wobei eine Darstellung
eines Teils davon schematisch mit der Ziffer 619G dargestellt
wird, ist 3.
-
Die
Vielzahl der Kompositum-Lösungen, die jeweils bestehen
aus der selben Quantität von Sprachobjekten 100,
werden dann in Bezug zueinander in abnehmender Reihenfolge der Priorität
entsprechend dem zunehmenden berechneten Wert der Längenidentität
ausgegeben. Es wird angemerkt, dass gesagt werden kann, dass die
Kompositum-Lösungen einen progressiv geringeren „Grad"
einer „Längenidentität" haben, wenn die
berechnete Längenidentität im Wert zunimmt.
-
Wenn
eine Vielzahl der Kompositum-Lösungen, die aus der gleichen
Quantität von Sprachobjekten 100 bestehen, zusätzlich
den gleichen berechneten Längenidentitätswert
haben, wird diesen Kompositum-Lösungen ein Kompositum-Häufigkeitswert
zugewiesen. Der Kompositum-Häufigkeitswert einer Kompositum-Lösung
ist, in dem vorliegenden Beispiel, ein Durchschnitt der Häufigkeitswerte
der Häufigkeitsobjekte 104, die zu den Sprachobjekten 100 der
Kompositum-Lösung gehören. Alternativ kann der
Kompositum-Häufigkeitswert als der Häufigkeitswert
des letzten Sprachobjekts 100 der Kompositum-Lösung
definiert werden oder kann alternativ in anderen geeigneten Weisen
definiert werden. Unabhängig von der spezifischen Weise,
wie ein Kompositum-Häufigkeitswert festgestellt wird, werden
solche Kompositum-Lösungen in Bezug zueinander in abnehmender
Reihenfolge der Priorität entsprechend dem abnehmenden
Kompositum-Häufigkeitswert ausgegeben.
-
In
dieser Hinsicht wird angemerkt, dass dieser Kompositum-Häufigkeitswert
anders ist als der Häufigkeitswert, der zu der Kompositum-Lösung
gehört, als ein Resultat eines Vergleichs eines Verbindungsobjekts
davon mit den N-Gramm-Objekten 112. Eine Kompositum-Lösung,
die aus drei oder mehr Sprachobjekten 100 besteht, hat
eine Vielzahl von dafür erzeugten Verbindungsobjekten,
zum Beispiel. Wenn eines der Verbindungsobjekte einer Kompositum-Lösung
eine Wahrscheinlichkeit von null oder eine Wahrscheinlichkeit unterhalb
einer vorbestimmten Schwelle anzeigt, wird in dem vorliegenden beispielhaften
Ausführungsbeispiel eine solche Kompositum-Lösung
unwahrscheinlich überhaupt ausgegeben und folglich nicht
in Betracht gezogen bei der Anordnung von Darstellungen der Kompositum-Lösungen
in einer Prioritätsreihenfolge zur Ausgabe.
-
In
dem Beispiel der 13–13D hat die Disambiguierungsroutine 22 festgestellt,
dass kein Sprachobjekt 100 der gesamten vieldeutigen Eingabe 607 entspricht,
hat aber festgestellt, dass die vieldeutige Eingabe 607 einen
Versuch durch den Benutzer darstellen könnte, eine von
drei möglichen Komposita einzugeben, wobei jedes Kompositum
aus zwei Sprachobjekten 100 besteht. Es wird angemerkt,
dass das Beispiel der 13E–13G nicht weiter betrachtet wird. Die Disambiguierungsroutine 22 gibt
folglich zumindest einige der möglichen Kompositum-Lösungen
aus, wie allgemein in der 14 gezeigt
wird.
-
Die
verschiedenen Kompositum-Lösungen der 13B–13D,
die jeweils aus zwei Sprachobjekten 100 bestehen, werden
in einer Reihenfolge entsprechend dem Algorithmus ausgegeben, der oben
beschrieben wird. Alle Lösungen, die aus einem einzelnen
Sprachobjekt 100 entsprechend der gesamten vieldeutigen
Eingabe 607 resultieren, werden an einer Position der relativ
höchsten Priorität in der Reihenfolge eines abnehmenden
Häufigkeitswertes ausgegeben. In dem vorliegenden Beispiel
wurden keine solchen einzelnen Sprachobjekte 100 gefunden,
die der vieldeutigen Eingabe 607 entsprechen.
-
Darstellungen
von verschiedenen Kompositum-Lösungen der 13B–13D,
die jeweils aus zwei Sprachobjekten 100 bestehen, werden
entsprechend einem abnehmenden Grad der Längenidentität
ausgegeben. Das heißt, wie oben erwähnt, die Kompositum-Lösungen
werden in der Reihenfolge eines zunehmenden berechneten Wertes der
Längenidentität ausgegeben. In dem vorliegenden
Beispiel werden Darstellungen der Kompositum-Lösungen der 13B und 13C jeweils
an einer Position der relativ höheren Priorität
ausgegeben als die Kompositum-Lösung der 13D.
-
Es
wird jedoch angemerkt, dass die Kompositum-Lösungen von
den 13B und 13C beide
eine Längenidentität mit einem Wert von 1 haben. Die
Kompositum-Lösungen, die den gleichen Längenidentitätswert
haben, werden folglich unter sich selbst entsprechend dem verringerten
Kompositum-Häufigkeitswert ausgegeben.
-
Wenn
zum Beispiel angenommen wird, dass der Häufigkeitswert
des Sprachobjekts 100 für „hug" 25,000
ist und dass der Häufigkeitswert des Sprachobjekts 100 für „hachure"
2000 ist, werden die zwei Häufigkeitswerte summiert und
durch zwei geteilt, um einen Kompositum-Häufigkeitswert
von 13,500 für die Kompositum-Lösung der 13B zu erlangen. Wenn weiter angenommen wird, dass
der Häufigkeitswert des Sprachobjekts 100 für „high"
26,000 ist und dass der Häufigkeitswert des Sprachobjekts 100 für „school"
14,000 ist, werden die zwei Häufigkeitswerte summiert und
durch zwei geteilt, um einen Kompositum-Häufigkeitswert
von 20,000 zu erhalten. Da 20,000 größer als 13,500
ist, wird die Kompositum-Lösung 619 „HIGHSCH"
ausgegeben mit einer relativ höheren Priorität
als die Kompositum-Lösung 623 „HUGHACH".
Es wird angemerkt, dass die Kompositum-Lösung für 13D typischerweise an einer Position von relativ
niedrigerer Priorität als die Kompositum-Lösung 623 „HUGHACH"
ausgegeben wird, gleichwohl ist die Kompositum-Lösung für 13D dieselbe wie die Kompositum-Lösung 619 „HIGHSCH".
Die Kompositum-Lösung für 13D wird
folglich nicht ausgegeben, da sie eine doppelte Kompositum-Lösung
für die vieldeutige Eingabe 607 darstellt.
-
Ein
beispielhaftes Flussdiagramm eines Verfahrens wird allgemein in
den 15A–15C gezeigt. Zu Zwecken der Klarheit betrifft
das Flussdiagramm der 15A–15C die beispielhafte Situation, die allgemein
in den 13B–13D gezeigt wird, wobei die drei Kompositum-Lösungen
jeweils aus zwei Sprachobjekten 100 bestehen. Somit wird
der typische erste Schritt in der allgemeinen Analyse, die hierin
dargelegt wird, wobei Kompositum-Lösungen, die aus relativ
weniger Quantitäten von Sprachobjekten 100 bestehen,
an Positionen mit relativ höherer Priorität gesetzt
werden als andere Kompositum-Lösungen, die aus relativ
größeren Quantitäten von Sprachobjekten 100 bestehen,
in dem vorliegenden Beispiel vermieden.
-
Wie
anderweitig hierin erwähnt, wird festgestellt, wie bei 255 in
der 3A, ob Sprachobjekte 100 identifiziert
wurden als einer vieldeutigen Eingabe entsprechend. Wenn nicht,
verzweigt sich die Verarbeitung, wie bei 226, zu 15A für ein Teilsystem.
-
Es
wird dann festgestellt, wie bei 713, ob ein Sprachobjekt
bereits identifiziert wurde, das einem ersten Teil der vieldeutigen
Eingabe entspricht und das eine Länge hat, die gleich der
Länge eines solchen ersten Teils ist, oder nicht. Wenn
nicht, kehrt die Verarbeitung zu dem Hauptprozess bei 228 zurück, wo
die Notwendigkeit für künstliche Varianten festgestellt
werden kann.
-
Wenn
jedoch bei 713 festgestellt wird, dass ein Sprachobjekt
vorher identifiziert wurde, das einem ersten Teil der vieldeutigen
Eingabe entspricht und eine gleiche Länge hat, geht die
Verarbeitung weiter, wie bei 717, wo festgestellt wird,
ob ein zweites Sprachobjekt einem zweiten Teil der vieldeutigen Eingabe
nachfolgend auf den ersten Teil entspricht. Wenn bei 717 festgestellt
wird, dass solch ein zweites Sprachobjekt identifiziert wurde, geht
die Verarbeitung weiter, wie bei 721, wo eine Längenidentität für
die Kompositum-Lösung bestimmt wird und Häufigkeitswerte
für die ersten und zweiten Sprachobjekte erlangt werden.
-
Wenn
jedoch bei 717 festgestellt wird, dass ein zweites Sprachobjekt
nicht identifiziert werden kann als dem zweiten Teil der vieldeutigen
Eingabe entsprechend, der dem ersten Teil nachfolgt, geht die Verarbeitung
weiter, wie bei 725, wo festgestellt wird, ob ein Suffixteil
der vieldeutigen Eingabe, der auf den ersten Teil der vieldeutigen
Eingabe nachfolgt, konsistent ist zu einem Suffixobjekt, das in
dem Speicher 20 gespeichert ist. In dieser Hinsicht wird
angemerkt, dass bestimmte Sprachen als analytische Sprachen angesehen
werden und bestimmte Sprachen als synthetische Sprachen angesehen
werden. In einer analytischen Sprache sind Zusammensetzungen einfach Elemente,
die miteinander verbunden sind ohne zusätzliche Zeichen
oder Markierungen. Englisch ist zum Beispiel eine analytische Sprache.
-
Andererseits
besteht die deutsche Zusammensetzung kapitänspatent aus
den Lexemen kapitän und patent, verbunden durch die Genitivfallmarkierung
s. In der deutschen Sprache kann die Genitivfallmarkierung s möglicherweise
ein Suffixobjekt aus einer Anzahl von vorbestimmten Suffixobjekten sein,
die in dem Speicher 20 gespeichert sind.
-
Somit,
wenn bei 717 festgestellt wird, dass kein zweites Sprachobjekt
dem zweiten Teil der vieldeutigen Eingabe nachfolgend auf den ersten
Teil der vieldeutigen Eingabe entspricht, geht die Verarbeitung
weiter zu 725, wo festgestellt wird, ob ein Teil der vieldeutigen
Eingabe, der dem ersten Teil der vieldeutigen Eingabe folgt, d.
h. ein Suffixteil, zu einem Suffixobjekt in dem Speicher 20 konsistent
ist.
-
Wenn
zum Beispiel eine vieldeutige Eingabe <JK> <AS> <OP> <UI> <TY> <AS> <BN> <AS> <OP> <AS> <TY> <ER> <BN> ist,
würde die Disambiguierungsroutine 22 bei 713 feststellen,
dass die ersten sieben Eingabeelement-Betätigungen, d.
h. <JK> <AS> <OP> <UI> <TY> <AS> <BN>, identifiziert werden
als einen ersten Teil der vieldeutigen Eingabe darstellend, der
dem Sprachobjekt 100 für „kapitän"
entspricht und die gleiche Länge hat. In dem vorliegenden
Beispiel wird angenommen, dass die Disambiguierungsroutine 22 bei 717 festgestellt hat,
dass kein Sprachobjekt 100 dem Teil der vieldeutigen Eingabe
entspricht, der solch einem erstem Teil nachfolgt, d. h. kein Sprachobjekt 100 für <AS> <OP> <AS> <TY> <ER> <BN> existiert.
-
Die
beispielhafte Disambiguierungsroutine 22 würde
dann bestimmen, wie bei 725, ob die Eingabeelement-Betätigung <AS> nachfolgend auf den ersten
Teil der vieldeutigen Eingabe, d. h. <JK> <AS> <OP> <UI> <TY> <AS> <BN>,
einen Suffixteil darstellt, der zu einem Suffixobjekt in dem Speicher 20 konsistent
ist. In dem vorliegenden Beispiel wird angenommen, dass die Genitivfallmarkierung
s ein Suffixobjekt ist, das in dem Speicher 20 gespeichert
ist. Die Disambiguierungsroutine würde folglich bei 725 bestimmen,
dass die Eingabeelement-Betätigung <AS> der
Genitivfallmarkierung s entspricht, was bedeutet, dass die Eingabeelement-Betätigung <AS> konsistent ist zu
einem Suffixobjekt in dem Speicher 20.
-
Wenn
ja, dann geht die Verarbeitung weiter, wie bei 729, wo
festgestellt wird, ob ein Sprachobjekt 100 einem zweiten
Teil der vieldeutigen Eingabe nachfolgend auf den identifizierten
Suffixteil entspricht oder nicht. Das heißt, die Disambiguierungsroutine 22 bestimmt,
ob ein Sprachobjekt 100 gefunden werden kann oder nicht,
das <OP> <AS> <TY> <ER> <BN> entspricht. In dem
vorliegenden Beispiel würde die Disambiguierungsroutine 22 feststellen, dass
das Sprachobjekt 100 für „patent" solch
einem zweiten Teil der vieldeutigen Eingabe entspricht, der dem
Suffixteil der vieldeutigen Eingabe nachfolgt. Wenn ja, geht die
Verarbeitung weiter bei 733, wo eine Längenidentität
für die Kompositum-Lösung bestimmt wird, und Häufigkeitswerte
für die Häufigkeitsobjekte erlangt werden, die
verwendet werden, um die Kompositum-Lösung zu erlangen.
-
Spezifisch
ist die Längenidentität für eine Kompositum-Lösung,
die ein Suffixobjekt umfasst, der Unterschied in der Länge
zwischen einem erweiterten ersten Teil, d. h. der erste Teil plus
der Suffixteil, und dem zweiten Teil. In dem vorliegenden Beispiel
ist die Länge von kapitäns acht Buchstaben, und
die Länge von Paten ist fünf Buchstaben. Somit hat
die Längenidentität für die Kompositum-Lösung „kapitänspatent"
einen Wert von 3. Die erlangten Häufigkeitswerte sind die
für die Sprachobjekte 100 für kapitän
und für patent.
-
Es
kann bei 725 festgestellt werden, dass kein Suffixobjekt
in dem Speicher 20 einem Teil der vieldeutigen Eingabe
entspricht, der dem ersten Teil folgt. Es kann bei 729 alternativ
festgestellt werden, dass kein Sprachobjekt 100 einem zweiten
Teil der vieldeutigen Eingabe nachfolgend auf einen Suffixteil der
vieldeutigen Eingabe entspricht, der bei 725 identifiziert
wird. In jeder Situation schlägt eine versuchte Kompositum-Lösung
fehl, und die Verarbeitung geht weiter zu 737.
-
Sobald
eine Kompositum-Lösung identifiziert wird oder fehlschlägt,
wie oben beschrieben, geht die Verarbeitung weiter, wie bei 737,
wo bestimmt wird, ob andere Sprachobjekte 100 identifiziert
wurden, die einem ersten Teil der vieldeutigen Eingabe entsprechen
und die eine Länge haben, die gleich zu dem ersten Teil
ist. In dieser Hinsicht können solche anderen Sprachobjekte 100 alternative
Sprachobjekte 100 sein, die für den gleichen ersten
Teil identifiziert wurden, wie wenn die Sprachobjekte 100 für „hug"
und für „gig" erste Sprachobjekte 100 sind,
die jeweils demselben ersten Teil 611B der vieldeutigen
Eingabe 607 der 13B entsprechen
und eine gleiche Länge wie dieser haben, d. h. die ersten
drei Eingabeelement-Betätigungen. Alternativ können
die zusätzlichen Sprachobjekte 100 andere Sprachobjekte 100 sein,
die einem anderen ersten Teil der vieldeutigen Eingabe entsprechen,
wie in der Art, wie das Sprachobjekt 100 für „hi"
einem ersten Zwei-Zeichen-Teil 611A der vieldeutigen Eingabe 607 entspricht
und eine gleiche Länge wie dieser hat, und das Sprachobjekt 100 für „hug"
einem ersten Drei-Zeichen-Teil 611B der vieldeutigen Eingabe 607 entspricht
und eine gleiche Länge wie dieser hat. Wenn bei 737 festgestellt
wird, dass ein anderes erstes Sprachobjekt 100 identifiziert
wurde, für das die Kompositum-Verarbeitung noch nicht durchgeführt
wurde, geht die Verarbeitung weiter zu 717, wo zum Beispiel
festgestellt wird, ob ein zweites Sprachobjekt 100 einem zweiten
Teil der vieldeutigen Eingabe nachfolgend dem ersten Teil der vieldeutigen
Eingabe entspricht, für den das andere erste Sprachobjekt 100 identifiziert
wurde.
-
Wenn
bei 737 festgestellt wird, dass keine solchen anderen ersten
Sprachobjekte identifiziert wurden, was bedeutet, dass alle möglichen
Kompositum-Lösungen identifiziert wurden, geht die Verarbeitung
weiter, wie bei 741, wo die Kompositum-Lösungen
ausgegeben werden in einer Reihenfolge eines abnehmenden Grads der
Längenidentität, d. h. in einer zunehmenden Reihenfolge
des Wertes der Längenidentität der verschiedenen
Kompositum-Lösungen. Entsprechend einer solchen Ausgabe
wird bestimmt, wie bei 745, ob Kompositum-Lösungen eine gleiche
Längenidentität haben. Wenn dem so ist, geht die
Verarbeitung weiter, wie bei 749, wo die Häufigkeitswerte
der Sprachobjekte, von denen die Kompositum-Lösungen abgeleitet
wurden, gemittelt werden, um einen Kompositum-Häufigkeitswert
für jede solche Kompositum-Lösung zu erhalten.
Solche Kompositum-Lösungen gleicher Längenidentität
werden spezifischer, wie bei 753, in Reihenfolge eines abnehmenden
Häufigkeitswertes an der Position ausgegeben, die der Längenidentität
solcher Kompositum-Lösungen entspricht. Dann geht die Verarbeitung
weiter, wie bei 701, wo zusätzliche Eingabeelement-Betätigungen
der vieldeutigen Eingabe erfasst werden können.
-
Es
wird angemerkt, dass ein Suffixteil einer vieldeutigen Eingabe nicht
auf eine einzelne Eingabeelement-Betätigung begrenzt ist
und dass eine Vielzahl von Eingabeelement-Betätigungen
als ein Suffixteil analysiert werden können, um festzustellen, ob
ein solcher Suffixteil zu einem vorbestimmten Suffixobjekt in dem
Speicher 20 konsistent ist. Es wird weiter angemerkt, dass
ein Verbindungsobjekt, das in dem Kontext eines identifizierten
Suffixteils erzeugt wird, den Suffixteil zusätzlich zu
dem letzten linguistischen Element des vorhergehenden Sprachobjekts und
zu dem ersten linguistischen Element des nachfolgenden Sprachobjekts
aufweist. Außerdem wird angemerkt, dass Suffixteile in
dem Kontext von Kompositum-Lösungen identifiziert und eingesetzt
werden können, die drei oder mehr Sprachobjekte 100 aufweisen,
und nicht begrenzt werden müssen auf Positionen, die unmittelbar
einem ersten Sprachobjekt 100 in einer Kompositum-Lösung
nachfolgen, wobei angemerkt wird, dass Suffixteile identifiziert und
eingesetzt werden können nachfolgend auf zweite und folgende
Sprachobjekte 100 einer Kompositum-Lösung.
-
Es
wird weiter angemerkt, dass die Disambiguierungsroutine 22 eingesetzt
werden kann, um Kompositum-Lösungen zu identifizieren,
wenn die vieldeutige Eingabe eine explizit trennende Eingabe umfasst.
Zum Beispiel kann eine vieldeutige Eingabe 807 einen ersten
Teil 827 umfassen, gefolgt von einer trennenden Einga be 831,
gefolgt von einem zweiten Teil 835. In solch einem Umstand
versucht die Disambiguierungsroutine, ein Sprachobjekt 100 zu identifizieren,
das dem zweiten Teil 835 der vieldeutigen Eingabe 807 entspricht,
unabhängig davon, ob ein Sprachobjekt 100 identifiziert
wurde, das dem ersten Teil 827 entspricht und eine gleiche
Länge zu der Länge des ersten Teils 827 hat.
In anderen Worten, der Benutzer signalisiert an die Disambiguierungsroutine,
dass der erste Teil 827 als eine erste Komponente einer
Kompositum-Eingabe behandelt werden soll, und ein derartiges Signal
wird von dem Benutzer durch die Eingabe der trennenden Eingabe 831 geliefert.
Es wird angemerkt, dass solch eine trennende Eingabe 831 von
dem Benutzer geliefert werden kann, wenn ein Sprachobjekt 100 identifiziert wurde,
das dem ersten Teil 827 entspricht und eine gleiche Länge
dazu hat, wenn kein solches Sprachobjekt 100 identifiziert
wurde und/oder wenn die Ausgabe für den ersten Teil 827 das
Resultat einer künstlichen Variante war.
-
Während
spezifische Ausführungsbeispiele des offenbarten und beanspruchten
Konzepts im Detail beschrieben wurden, ist für Fachleute
offensichtlich, dass verschiedene Modifikationen und Alternativen
zu jenen Details hinsichtlich der gesamten Lehren der Offenbarung
entwickelt werden können. Demgemäß sollen
die bestimmten Anordnungen, die offenbart werden, nur illustrativ
und nicht begrenzend sein hinsichtlich des Umfangs des offenbarten
und beanspruchten Konzepts, dem der volle Umfang der angefügten
Ansprüche und jede und alle Äquivalente davon
gegeben werden soll.
-
ZUSAMMENFASSUNG
-
Eine
tragbare elektronische Vorrichtung umfasst eine reduzierte QWERTY-Tastatur
und ist mit einer Disambiguierungs-Software versehen, die betriebsfähig
ist, eine Kompositum-Eingabe zu disambiguieren. Die Vorrichtung
kann Sprachobjekte in dem Speicher zusammensetzen, um Kompositum-Lösungen
zu erzeugen. Die Vorrichtung kann die Kombinationen von Sprachobjekten
hinsichtlich N-Gramm-Daten analysieren, die auf der Vorrichtung gespeichert
sind, um ein Vorschlagen von Kompositum-Lösungen niedriger
Wahrscheinlichkeit zu vermeiden.
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste
der vom Anmelder aufgeführten Dokumente wurde automatisiert
erzeugt und ist ausschließlich zur besseren Information
des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen
Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt
keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Patentliteratur
-
- - US 6452588 [0035]
- - US 6489950 [0035]