DE112006003646T5

DE112006003646T5 - Tragbare elektronische Vorrichtung und Verfahren zur Disambiguierung einer Kompositum-Eingabe, das N-Gramm-Daten einsetzt, um eine Erzeugung von Kompositum-Lösungen niedriger Wahrscheinlichkeit zu begrenzen

Info

Publication number: DE112006003646T5
Application number: DE112006003646T
Authority: DE
Inventors: Vadim Waterloo FUX; Michael Waterloo Elizarov
Original assignee: Research in Motion Ltd
Current assignee: BlackBerry Ltd
Priority date: 2006-01-13
Filing date: 2006-12-01
Publication date: 2008-11-20
Also published as: GB2449016B; GB2449016A; US20100153096A1; US20120310631A1; GB0814808D0; US8090572B2; CA2635009C; US8265926B2; US7698128B2; CA2635009A1; US8515740B2; US20070168176A1; WO2007079565A1; US20120072205A1

Abstract

Verfahren zur Ermöglichung einer Eingabe in eine tragbare elektronische Vorrichtung mit einer Eingabevorrichtung, einer Ausgabevorrichtung und einem Speicher, der eine Vielzahl von Sprachobjekten und eine Vielzahl von Häufigkeitsobjekten gespeichert hat, wobei zumindest einige der Sprachobjekte jeweils zu einem zugehörigen Häufigkeitsobjekt gehören, wobei zumindest einige der Sprachobjekte jeweils eine Anzahl von linguistischen Elementen aufweisen, wobei die Eingabevorrichtung eine Vielzahl von Eingabeelementen aufweist, wobei zumindest einigen der Eingabeelemente jeweils eine Vielzahl der linguistischen Elemente zugewiesen ist, wobei das Verfahren aufweist:
Erfassen einer vieldeutigen Eingabe;
Erzeugen einer Anzahl von Kompositum-Lösungen, für jede Kompositum-Lösung, durch Identifizieren eines Sprachobjekts, das einem Anfangsteil der vieldeutigen Eingabe entspricht und eine Länge hat, die gleich ist zu der Länge des Anfangsteils, und Identifizieren eines anderen Sprachobjekts, das einem anderen Teil der vieldeutigen Eingabe entspricht;
für zumindest eine erste Kompositum-Lösung, Erzeugen eines Verbindungsobjekts, das ein linguistisches Endelement des Sprachobjekts und ein linguistisches Anfangselement des anderen Sprachobjekts...

Description

HINTERGRUND
Gebiet
Das offenbarte und beanspruchte Konzept betrifft im Allgemeinen tragbare bzw. handgehaltene elektronische Vorrichtungen (handheld electronic devices) und insbesondere eine tragbare elektronische Vorrichtung, die eine reduzierte Tastatur und eine „zusammengesetzter Text"- bzw. Kompositum-Eingabe-Disambiguierungsfunktion hat, und betrifft auch ein zugehöriges Verfahren.
Hintergrundinformation
Zahlreiche Typen von tragbaren elektronischen Vorrichtungen sind bekannt. Beispiele derartiger tragbarer elektronischer Vorrichtungen umfassen zum Beispiel persönliche Datenassistenten (PDAs – personal data assistants), tragbare Computer, Zweiweg-Pager, zellulare Telefone und dergleichen. Viele tragbare elektronische Vorrichtungen weisen auch eine drahtlose Kommunikationsfähigkeit auf, obwohl viele derartige tragbare elektronische Vorrichtungen unabhängige Vor richtungen sind, die ohne Kommunikation mit anderen Vorrichtungen funktional sind.
Derartige tragbare elektronische Vorrichtungen sollen im Allgemeinen tragbar sein und haben folglich eine relativ kompakte Konfiguration, in der Tasten und andere Eingabestrukturen häufig mehrfache Funktionen unter bestimmten Umständen durchführen oder anderweitig mehrere Aspekte oder Eigenschaften zugewiesen haben. Mit Fortschritten in der Technologie werden tragbare elektronische Vorrichtungen hergestellt, um immer kleinere Formfaktoren zu haben, und dennoch eine immer größere Anzahl von Anwendungen und Eigenschaften darauf zu haben. In der Praxis können die Tasten eines Tastaturfelds nur auf eine bestimmte kleine Größe verringert werden, bevor die Tasten relativ unbrauchbar werden. Um eine Texteingabe zu ermöglichen, muss jedoch ein Tastaturfeld zum Beispiel zur Eingabe aller sechsundzwanzig Buchstaben des lateinischen Alphabets sowie einer passenden Interpunktion und anderer Symbole fähig sein.
Eine Art des Vorsehens von zahlreichen Buchstaben in einem kleinen Raum war, eine „reduzierte Tastatur" vorzusehen, in der mehrere Buchstaben, Symbole und/oder Zahlen und dergleichen, jeder gegebenen Taste zugewiesen werden. Zum Beispiel umfasst ein Tastentouch-tone)-Telefon ein reduziertes Tastaturfeld durch Vorsehen von zwölf Tasten, von denen zehn Zahlen darauf haben und von diesen zehn Tasten haben acht lateinische Buchstaben zugewiesen. Zum Beispiel umfasst eine der Tasten die Zahl „2" sowie die Buchstaben „A", „B" und „C". Andere bekannte reduzierte Tastaturen umfassten andere Anordnungen für Tasten, Buchstaben, Symbole, Zahlen und dergleichen. Da eine einzige Betätigung einer derartigen Taste von dem Benutzer vorgesehen sein kann, sich möglicherweise auf einen der Buchstaben „A", „B" und „C" zu beziehen und sich möglicherweise auch auf die Zahl „2" beziehen soll, ist die Eingabe im Allgemeinen eine vieldeutige (ambiguous) Eingabe und bedarf eines Typs einer Disambiguierung, um für Texteingabezwecke nützlich zu sein.
Um einem Benutzer zu ermöglichen, die mehrfachen Buchstaben, Zahlen und dergleichen auf jeder gegebenen Taste zu verwenden, wurden zahlreiche Tastenanschlags-Interpretationssysteme vorgesehen. Zum Beispiel ermöglicht ein „Mehrfach-Tippen(multi-tap)"-System einem Benutzer, im Wesentlichen eindeutig ein bestimmtes Zeichen auf einer Taste zu spezifizieren durch Drücken derselben Taste mehrere Male, äquivalent zu der Position des gewünschten Zeichens auf der Taste. Zum Beispiel drückt auf der vorher erwähnten Telefontaste, welche die Buchstaben „ABC" umfasst, und wenn der Benutzer wünscht, den Buchstaben „C" zu spezifizieren, der Benutzer die Taste drei Mal. Während solche Mehrfach-Tippen-Systeme im Allgemeinen effektiv waren für ihre vorgesehenen Zwecke, können sie trotzdem eine relativ große Anzahl von Tasteneingaben erfordern, im Vergleich zu der Anzahl von Zeichen, die schließlich ausgegeben werden.
Ein anderes beispielhaftes Tastenanschlags-Interpretationssystem umfasst ein Tasten-„Chording", von dem verschiedene Typen existieren. Zum Beispiel kann ein bestimmtes Zeichen eingegeben werden durch Drücken zweier Tasten hintereinander oder durch Drücken und Halten einer ersten Taste, während eine zweite Taste gedrückt wird. Ein weiteres beispielhaftes Tastenanschlags-Interpretationssystem ist eine „Drücken-und-Halten/Drücken-und-Freigabe"-Interpretationsfunktion, in der eine gegebene Taste ein erstes Resultat liefert, wenn die Taste betätigt und sofort losgelassen wird, und ein zweites Resultat liefert, wenn die Taste für eine kurze Zeitdauer betätigt und gehalten wird. Während diese Systeme ebenfalls für ihre beabsichtigten Zwecke im Allgemeinen effektiv sind, haben derartige Systeme auch ihre eigenen eindeutigen Nachteile.
Ein weiteres Tastenanschlags-Interpretationssystem, das eingesetzt wurde, ist eine Software-basierte Text-Disambiguierungsfunktion. In solch einem System drückt ein Benutzer typischerweise Tasten, denen ein oder mehrere Zeichen zugewiesen wurden, im Allgemeinen wird jede Taste ein Mal für jeden gewünschten Buchstaben gedrückt, und die Disambiguierungs-Software versucht, die beabsichtigte Eingabe vorauszusagen. Zahlreiche derartige Systeme wurden vorgeschlagen und während viele für ihre beabsichtigten Zwecken im Allgemeinen effektiv waren, existieren weiterhin Defizite.
Es wäre wünschenswert, eine verbesserte tragbare elektronische Vorrichtung mit einer reduzierten Tastatur vorzusehen, die versucht, eine QWERTY-Tastatur-Erfahrung oder eine andere bestimmte Tastaturerfahrung zu imitieren. Solch eine verbesserte tragbare elektronische Vorrichtung kann auch wünschenswerterweise konfiguriert werden mit ausreichenden Eigenschaften, um eine Texteingabe und andere Aufgaben mit relativer Mühelosigkeit zu ermöglichen.
KURZE BESCHREIBUNG DER ZEICHNUNGEN
Ein vollständiges Verständnis kann aus der folgenden Beschreibung gewonnen werden, wenn in Verbindung mit den beigefügten Zeichnungen gelesen, wobei:
1 eine Draufsicht auf eine verbesserte tragbare elektronische Vorrichtung gemäß dem offenbarten und beanspruchten Konzept ist;
2 eine schematische Darstellung der verbesserten tragbaren elektronischen Vorrichtung der 1 ist;
2A eine schematische Darstellung eines Teils der tragbaren elektronischen Vorrichtung von 2 ist;
3A und 3B ein beispielhaftes Flussdiagramm zeigen, das bestimmte Aspekte einer Disambiguierungsfunktion darstellt, die auf der tragbaren elektronischen Vorrichtung der 1 ausgeführt werden kann;
4 ein weiteres beispielhaftes Flussdiagramm ist, das bestimmte Aspekte einer Disambiguierungsfunktion darstellt, die auf der tragbaren elektronischen Vorrichtung ausgeführt werden kann, wodurch dem Benutzer bestimmte Ausgabevarianten geliefert werden können;
5A und 5B ein weiteres beispielhaftes Flussdiagramm zeigen, das bestimmte Aspekte eines Lern-Verfahrens darstellt, das auf der tragbaren elektronischen Vorrichtung ausgeführt werden kann;
6 ein weiteres beispielhaftes Flussdiagramm ist, das bestimmte Aspekte eines Verfahrens darstellt, durch das verschiedene Anzeigeformate auf der tragbaren elektronischen Vorrichtung vorgesehen werden können;
7 eine beispielhafte Ausgabe während eines Texteingabebetriebs ist;
8 eine weitere beispielhafte Ausgabe während eines anderen Teils des Texteingabebetriebes ist;
9 eine weitere beispielhafte Ausgabe während eines anderen Teils des Texteingabebetriebes ist;
10 eine weitere beispielhafte Ausgabe während eines anderen Teils des Texteingabebetriebes ist;
11 eine beispielhafte Ausgabe auf der tragbaren elektronischen Vorrichtung während eines anderen Texteingabebetriebes ist;
12 eine beispielhafte Ausgabe ist, die in einem Fall geliefert werden kann, wenn die Disambiguierungsfunktion der tragbaren elektronischen Vorrichtung deaktiviert wurde;
13 eine schematische Darstellung einer vieldeutigen Eingabe in die tragbare elektronische Vorrichtung von 1 ist;
13A eine schematische Darstellung der vieldeutigen Eingabe von 13 gemäß einer Kompositum-Lösung ist;
13B eine schematische Darstellung der vieldeutigen Eingabe von 13 gemäß einer weiteren Kompositum-Lösung ist;
13C eine schematische Darstellung der vieldeutigen Eingabe von 13 gemäß einer weiteren Kompositum-Lösung ist;
13D eine schematische Darstellung der vieldeutigen Eingabe von 13 gemäß einer weiteren Kompositum-Lösung ist;
13E eine schematische Darstellung der vieldeutigen Eingabe von 13 gemäß einer weiteren Kompositum-Lösung ist;
13F eine schematische Darstellung der vieldeutigen Eingabe von 13 gemäß einer weiteren Kompositum-Lösung ist;
13G eine schematische Darstellung der vieldeutigen Eingabe von 13 gemäß einer weiteren Kompositum-Lösung ist;
14 eine schematische Darstellung einer Ausgabe einer Darstellung zumindest eines Teils einer Kompositum-Lösung ist;
15A, 15B und 15C weitere beispielhafte Flussdiagramme sind, die bestimmte Aspekte eines Verfahrens darstellen, das auf der tragbaren elektronischen Vorrichtung ausgeführt werden kann; und
16 eine schematische Darstellung einer weiteren vieldeutigen Eingabe in die tragbare elektronische Vorrichtung von 1 ist.
Ähnliche Ziffern beziehen sich auf ähnliche Teile in der Spezifikation.
BESCHREIBUNG
Eine verbesserte tragbare elektronische Vorrichtung 4 wird allgemein in der 1 gezeigt und wird schematisch in der 2 dargestellt. Die beispielhafte tragbare elektronische Vorrichtung 4 umfasst ein Gehäuse 6, auf dem eine Prozessoreinheit angebracht ist, die eine Eingabevorrichtung 8, eine Ausgabevorrichtung 12, einen Prozessor 16 und einen Speicher 20 umfasst und zumindest eine erste Routine. Der Prozessor 16 kann zum Beispiel und ohne Einschränkung ein Mikroprozessor (μP) sein und reagiert auf Eingaben von der Eingabevorrichtung 8 und liefert Ausgabesignale an die Ausgabevorrichtung 12. Der Prozessor 16 ist auch mit dem Speicher 20 verbunden. Der Prozessor 16 und der Speicher 20 bilden zusammen eine Prozessorvorrichtung. Beispiele von tragbaren elektronischen Vorrichtungen sind in den U.S.-Patenten Nr. 6,452,588 und 6,489,950 enthalten.
Wie aus der 1 offensichtlich ist, umfasst die Eingabevorrichtung 8 ein Tastaturfeld 24 und ein Thumbwheel 32. Wie detaillierter unten beschrieben wird, ist das Tastaturfeld 24 in der beispielhaften Form einer reduzierten QWERTY-Tastatur einschließlich einer Vielzahl von Tasten 28, die als Eingabeelemente dienen. Es wird jedoch angemerkt, dass das Tastaturfeld 24 andere Konfigurationen haben kann, wie eine AZERTY-Tastatur, eine QWERTZ-Tastatur oder eine andere Tastaturanordnung, ob momentan bekannt oder unbekannt und entweder reduziert oder nicht reduziert. Wie hierin eingesetzt, sollen der Ausdruck „reduziert" und Variationen davon in dem Kontext einer Tastatur, eines Tastaturfelds oder einer anderen Anordnung von Eingabeelementen breit auf eine Anordnung verweisen, in der zumindest einem der Eingabeelemente eine Vielzahl von linguistischen Elementen zugewiesen ist, wie zum Beispiel Zeichen in dem Satz von lateinischen Buchstaben, wobei eine Betätigung des zumindest einen der Eingabeelemente, ohne eine andere Eingabe in Kombination damit, eine vieldeutige Eingabe ist, da sie mehr als eines der Vielzahl der zugewiesenen linguistischen Elemente betreffen kann. Wie hierin eingesetzt, sollen der Ausdruck „linguistisches Element" und Variationen davon breit auf jedes Element verweisen, das selbst ein Sprachobjekt sein kann oder aus welchem ein Sprachobjekt konstruiert, identifiziert oder anderweitig erhalten werden kann, und umfasst folglich zum Beispiel und ohne Einschränkung Zeichen, Buchstaben, Anschläge, Ideogramme, Phoneme, Morpheme, Zahlen und dergleichen. Wie hierin eingesetzt, sollen der Aus druck „Sprachobjekt" und Variationen davon breit auf jeden Typ von Objekt verweisen, der aus einem oder mehreren linguistischen Elementen konstruiert, identifiziert oder anderweitig erhalten werden kann, die alleine oder in Kombination verwendet werden können, um Text zu erzeugen, und das umfasst zum Beispiel und ohne Einschränkung Wörter, Abkürzungen, Symbole, Ideogramme und dergleichen.
Die Systemarchitektur der tragbaren elektronischen Vorrichtung 4 ist vorteilhafterweise organisiert, um unabhängig von dem spezifischen Layout des Tastaturfelds 24 betriebsfähig zu sein. Demgemäß kann die Systemarchitektur der tragbaren elektronischen Vorrichtung 4 in Verbindung mit praktisch jedem Tastaturfeld-Layout eingesetzt werden, im Wesentlichen ohne eine bedeutsame Änderung in der Systemarchitektur zu erfordern. Es wird weiter angemerkt, dass bestimmte der Eigenschaften, die hierin dargelegt werden, entweder auf einer oder auf beiden einer reduzierten Tastatur und einer nicht reduzierten Tastatur verwendbar sind.
Die Tasten 28 sind auf einer Vorderseite des Gehäuses 6 angeordnet und das Thumbwheel 32 ist an einer Seite des Gehäuses 6 angeordnet. Das Thumbwheel 32 kann als ein weiteres Eingabeelement dienen und ist sowohl drehbar, wie durch den Pfeil 34 angezeigt wird, um Auswahleingaben an den Prozessor 16 zu liefern, und kann auch gedrückt werden in eine Richtung im Allgemeinen zum Gehäuse 6 hin, wie durch den Pfeil 38 angezeigt wird, um eine andere Auswahleingabe an den Prozessor 16 zu liefern.
Unter den Tasten 28 des Tastaturfelds 24 sind eine <NÄCHSTE (NEXT)>-Taste 40 und ein <EINGABE (ENTER)>-Taste 44. Die <NEXT>-Taste 40 kann gedrückt werden, um eine Auswahl-Eingabe an den Prozessor 16 zu liefern und liefert im Wesentlichen dieselbe Auswahl-Eingabe, wie sie von einer Rotations-Eingabe des Thumbwheels 32 geliefert wird. Da die <NEXT>-Taste 40 angren zend an eine Anzahl von anderen Tasten 28 des Tastaturfelds 24 vorgesehen ist, kann der Benutzer eine Auswahl-Eingabe an den Prozessor 16 liefern im Wesentlichen ohne die Hände des Benutzers während eines Texteingabebetriebes weg von dem Tastaturfeld 24 zu bewegen. Wie detaillierter unten beschrieben wird, umfasst die <NEXT>-Taste 40 zusätzlich und vorteilhafterweise eine darauf angeordnete Grafik 42, und unter bestimmten Umständen zeigt die Ausgabevorrichtung 12 auch eine angezeigte Grafik 46 darauf an, um die <NEXT>-Taste 40 zu identifizieren, die in der Lage ist, eine Auswahl-Eingabe an den Prozessor 16 zu liefern. In dieser Hinsicht ist die angezeigte Grafik 46 der Ausgabevorrichtung 12 im Wesentlichen ähnlich zu der Grafik 42 auf der <NEXT>-Taste und identifiziert folglich die <NEXT>-Taste 40 als fähig, eine wünschenswerte Auswahl-Eingabe an den Prozessor 16 zu liefern.
Wie in 1 weiter gesehen werden kann, umfassen viele der Tasten 28 eine Anzahl von darauf angeordneten linguistischen Elementen 48. Wie hierin eingesetzt, soll der Ausdruck „eine Anzahl von" und Variationen davon breit auf jede Quantität, einschließlich einer Quantität von eins, verweisen und kann in bestimmten Umständen hierin auch auf eine Quantität von Null verweisen. In der beispielhaften Darstellung des Tastaturfelds 24 umfassen viele der Tasten 28 zwei linguistische Elemente darauf, wie Umfassen eines ersten linguistischen Elements 52 und eines zweiten linguistischen Elements 56.
Eine der Tasten 28 des Tastaturfelds 24 umfasst als die Zeichen 48 davon die Buchstaben „Q" und „W", und eine angrenzende Taste 28 umfasst als die Zeichen 48 davon die Buchstaben „E" und „R". Es ist zu sehen, dass die Anordnung der Zeichen 48 auf den Tasten 28 des Tastaturfelds 24 im Allgemeinen eine QWERTY-Anordnung ist, wenngleich viele der Tasten 28 zwei der Zeichen 28 umfassen.
Die Ausgabevorrichtung 12 umfasst eine Anzeige 60, auf der eine Ausgabe 64 vorgesehen werden kann. Eine beispielhafte Ausgabe 64 wird auf der Anzeige 60 in der 1 dargestellt. Die Ausgabe 64 umfasst eine Textkomponente 68 und eine Varianten-Komponente 72. Die Varianten-Komponente 72 umfasst einen Standard-Teil 76 und einen Varianten-Teil 80. Die Anzeige umfasst auch ein Caret-Zeichen 84, das im Allgemeinen darstellt, wo die nächste Eingabe von Eingabevorrichtung 8 empfangen wird.
Die Textkomponente 68 der Ausgabe 64 liefert eine Darstellung des Standard-Teils 76 der Ausgabe 64 an einer Position auf der Anzeige 60, wo der Text eingegeben wird. Die Varianten-Komponente 72 wird im Allgemeinen in der Nähe der Textkomponente 68 angeordnet und liefert, zusätzlich zu der standardmäßigen vorgeschlagenen Ausgabe 76, eine Darstellung der verschiedenen alternativen Textwahlmöglichkeiten, d. h. Alternativen zu der standardmäßigen vorgeschlagenen Ausgabe 76, die durch eine Eingabe-Disambiguierungsfunktion in Reaktion auf eine Eingabesequenz von Tastenbetätigungen der Tasten 28 vorgeschlagen werden.
Wie detaillierter unten beschrieben wird, wird der Standard-Teil 76 durch die Disambiguierungsfunktion vorgeschlagen als die wahrscheinlichste disambiguierte Interpretation der vieldeutigen Eingabe, die durch den Benutzer vorgesehen ist. Der Varianten-Teil 80 umfasst eine vorgegebene Quantität von alternativen vorgeschlagenen Interpretationen derselben vieldeutigen Eingabe, aus denen der Benutzer wählen kann, wenn gewünscht. Die angezeigte Grafik 46 wird typischerweise vorgesehen in der Varianten-Komponente 72 in der Nähe des Varianten-Teils 80, obwohl offensichtlich ist, dass die angezeigte Grafik 46 an anderen Positionen und auf andere Arten vorgesehen werden kann. Es wird auch angemerkt, dass der beispielhafte Varianten-Teil 80 hierin dargestellt wird als sich vertikal unter den Standard-Teil 76 erstreckend, aber es ist offensichtlich, dass zahlreich andere Anordnungen vorgesehen werden können.
Unter den Tasten 28 des Tastaturfelds 24 ist zusätzlich eine <LÖSCHEN (DELETE)>-Taste 86, die vorgesehen werden kann, um eine Texteingabe zu löschen. Wie detaillierter unten beschrieben wird, kann die <DELETE>-Taste 86 auch eingesetzt werden, wenn eine Alternativeingabe an den Prozessor 16 geliefert wird zur Verwendung durch die Disambiguierungsfunktion.
Der Speicher 20 wird schematisch in der 2A dargestellt. Der Speicher 20 kann jeder einer Vielzahl von Typen von internen und/oder externen Speichermedien sein, wie, ohne Einschränkung, RAM, ROM, EPROM(s), EEPROM(s) und dergleichen, die ein Speicherregister zur Datenspeicherung vorsehen, wie in der Art eines internen Speicherbereichs eines Computers, und kann ein volatiler Speicher oder ein nicht-volatiler Speicher sein. Der Speicher 20 umfasst zusätzlich eine Anzahl von Routinen, die allgemein mit dem Bezugszeichen 22 dargestellt werden, für die Verarbeitung von Daten. Die Routinen 22 können in jeder einer Vielzahl von Formen sein, wie, ohne Einschränkung, Software, Firmware und dergleichen. Wie detaillierter unten erklärt wird, umfassen die Routinen 22 die vorher erwähnte Disambiguierungsfunktion als eine Anwendung sowie andere Routinen.
Wie aus der 2A zu verstehen ist, umfasst der Speicher 20 zusätzlich Daten, die in einer Anzahl von Tabellen, Sätzen, Listen und/oder anderweitig gespeichert und/oder organisiert sind. Spezifisch umfasst der Speicher 20 eine generische Wortliste 88, eine „neue Wörter"-Datenbank 92 und eine Häufigkeits-Lernen-Datenbank 96. In den verschiedenen Bereichen des Speichers 20 ist eine Anzahl von Sprachobjekten 100 und Häufigkeitsobjekten 104 gespeichert. Die Sprachobjekte 100 gehören im Allgemeinen jeweils zu einem zugehörigen Häufigkeitsobjekt 104. Die Sprachobjekte 100 umfassen in dem vorliegenden beispielhaften Ausführungsbeispiel eine Vielzahl von Wortobjekten 108 und eine Vielzahl von N-Gramm-Objekten 112. Die Wortobjekte 108 sind allgemein repräsentativ für komplette Wörter in der Sprache oder kundenspezifische Wörter, die in dem Speicher 20 gespeichert sind. Wenn zum Beispiel die in dem Speicher gespeicherte Sprache zum Beispiel Englisch ist, repräsentiert im Allgemeinen jedes Wortobjekt 108 ein Wort in der englischen Sprache oder repräsentiert ein kundenspezifisches Wort.
Zu im Wesentlichen jedem Wortobjekt 108 gehört ein Häufigkeitsobjekt 104, das einen Häufigkeitswert hat, der die relative Häufigkeit innerhalb der relevanten Sprache des gegebenen Wortes anzeigt, das durch das Wortobjekt 108 repräsentiert wird. In dieser Hinsicht umfasst die generische Wortliste 88 einen Korpus von Wortobjekten 108 und zugehörigen Häufigkeitsobjekten 104, die zusammen eine breite Vielfalt von Wörtern und ihre relative Häufigkeit in einer gegebenen Umgangssprache von zum Beispiel einer gegebenen Sprache darstellen. Die generische Wortliste 88 kann auf eine einer breiten Vielfalt von Arten abgeleitet werden, wie durch Analysieren zahlreicher Texte und anderer Sprachquellen, um die verschiedenen Wörter innerhalb der Sprachquellen sowie ihre relativen Wahrscheinlichkeiten, d. h. relativen Häufigkeiten, des Auftretens der verschiedenen Wörter in den Sprachquellen zu bestimmen.
Die N-Gramm-Objekte 112, die in der generischen Wortliste 88 gespeichert sind, sind kurze Ketten von Zeichen in der relevanten Sprache, typischerweise zum Beispiel ein bis drei Zeichen in der Länge und repräsentieren typischerweise Wortfragmente in der relevanten Sprache, obwohl bestimmte der N-Gramm-Objekte 112 zusätzlich selbst Wörter sein können. Jedoch zu dem Ausmaß, dass ein N-Gramm-Objekt 112 auch ein Wort in der relevanten Sprache ist, wird dasselbe Wort wahrscheinlich separat gespeichert als ein Wortobjekt 108 in der generischen Wortliste 88. Wie hier eingesetzt, sollen der Ausdruck „Kette (string)" und Variationen davon breit auf ein Objekt verweisen, das ein oder mehrere Zeichen oder Komponenten hat, und kann sich auf eines eines kompletten Wortes, eines Fragments eines Wortes, eines kundenspezifischen Wortes oder eines Ausdrucks und dergleichen beziehen.
In dem vorliegenden beispielhaften Ausführungsbeispiel der tragbaren elektronischen Vorrichtung 4 umfassen die N-Gramm-Objekte 112 1-Gramm-Objekte, d. h. Ketten- bzw. String-Objekte, die ein Zeichen in der Länge sind, 2-Gramm-Objekte, d. h. String-Objekte, die zwei Zeichen in der Länge sind, und 3-Gramm-Objekte, d. h. String-Objekte, die drei Zeichen in der Länge sind, die kollektiv als N-Gramme 112 bezeichnet werden. Im Wesentlichen gehört jedes N-Gramm-Objekt 112 in der generischen Wortliste 88 ähnlich zu einem zugehörigen Häufigkeitsobjekt 104, das in der generischen Wortliste 88 gespeichert ist, aber das Häufigkeitsobjekt 104, das zu einem gegebenen N-Gramm-Objekt 112 gehört, hat einen Häufigkeitswert, der die relative Wahrscheinlichkeit anzeigt, dass der Zeichen-String, der durch das bestimmte N-Gramm-Objekt 112 repräsentiert wird, an jeder Position in jedem Wort der relevanten Sprache existiert. Die N-Gramm-Objekte 112 und die zugehörigen Häufigkeitsobjekte 104 sind ein Teil des Korpus der generischen Wortliste 88 und werden auf eine Art erlangt, die ähnlich ist zu der Art, auf die das Wortobjekt 108 und die zugehörigen Häufigkeitsobjekte 104 erlangt werden, obwohl die Analyse, die bei der Erlangung der N-Gramm-Objekte 112 durchgeführt wird, etwas unterschiedlich ist, da sie eine Analyse der verschiedenen Zeichen-Strings in den verschiedenen Wörter umfasst, statt sich hauptsächlich auf das relative. Auftreten eines gegebenen Wortes zu verlassen.
Das vorliegende beispielhafte Ausführungsbeispiel der tragbaren elektronischen Vorrichtung 4, deren beispielhafte Sprache die englische Sprache ist, umfasst sechsundzwanzig 1-Gramm-N-Gramm-Objekte 112, d. h. ein 1-Gramm-Objekt für jeden der sechsundzwanzig Buchstaben im lateinischen Alphabet, auf dem die englische Sprache basiert, und umfasst weiter 676 2-Gramm-N-Gramm-Objekte 112, d. h. sechsundzwanzig hoch zwei, wodurch jede zwei-Buchstaben- Permutation der sechsundzwanzig Buchstaben in dem lateinischen Alphabet dargestellt wird.
Die N-Gramm-Objekte 112 umfassen auch eine bestimmte Quantität von 3-Gramm-N-Gramm-Objekten 112, primär diejenigen, die eine relativ hohe Häufigkeit in der relevanten Sprache haben. Das beispielhafte Ausführungsbeispiel der tragbaren elektronischen Vorrichtung 4 umfasst weniger als alle der Drei-Buchstaben-Permutationen der sechsundzwanzig Buchstaben des lateinischen Alphabets aufgrund von Berücksichtigungen einer Datenspeichergröße und auch, da die 2-Gramm-N-Gramm-Objekte 112 bereits eine bedeutsame Menge von Information hinsichtlich der relevanten Sprache liefern können. Wie detaillierter unten dargelegt wird, liefern die N-Gramm-Objekte 112 und ihre zugehörigen Häufigkeitsobjekte 104 Häufigkeitsdaten, die Zeichen-Strings zugeschrieben werden können, für die ein entsprechendes Wortobjekt 108 nicht identifiziert werden kann oder nicht identifiziert wurde, und wird typischerweise als eine Rückfall-Datenquelle eingesetzt, obwohl dies nicht exklusiv der Fall sein muss.
In dem vorliegenden beispielhaften Ausführungsbeispiel werden die Sprachobjekte 100 und die Häufigkeitsobjekte 104 im Wesentlichen unberührt in der generischen Wortliste 88 gepflegt, was bedeutet, dass der grundlegende Sprachenkorpus in der generischen Wortliste 88 im Wesentlichen unverändert bleibt, und die Lernen-Funktionen, die von der tragbaren elektronischen Vorrichtung 4 vorgesehen werden und die unten beschrieben werden, funktionieren in Verbindung mit anderen Objekten, die im Allgemeinen woanders in dem Speicher 20 gespeichert sind, wie zum Beispiel in der „neue Wörter"-Datenbank 92 und der Häufigkeits-Lernen-Datenbank 96.
Die „neue Wörter"-Datenbank 92 und die Häufigkeits-Lernen-Datenbank 96 speichern zusätzliche Wortobjekte 108 und zugehörige Häufigkeitsobjekte 104, um einem Benutzer eine kundenspezifische Erfahrung zu liefern, in der Wörter und dergleichen, die relativ häufiger von einem Benutzer benutzt werden, relativ höhere Häufigkeitswerte haben, als ansonsten in der generischen Wortliste 88 reflektiert wird. Insbesondere umfasst die „neue Wörter"-Datenbank 92 Wortobjekte 108, die Benutzer-definiert sind und die im Allgemeinen nicht unter den Wortobjekten 108 der generischen Wortliste 88 zu finden sind. Jedes Wortobjekt 108 in der „neue Wörter"-Datenbank 92 hat zugehörig ein zugehöriges Häufigkeitsobjekt 104, das auch in der „neue Wörter"-Datenbank 92 gespeichert ist. Die Häufigkeits-Lernen-Datenbank 96 speichert Wortobjekte 108 und zugehörige Häufigkeitsobjekte 104, die eine relativ häufigere Benutzung derartiger Wörter durch einen Benutzer anzeigen, als in der generischen Wortliste 88 reflektiert würde. Somit sehen die „neue Wörter"-Datenbank 92 und die Häufigkeits-Lernen-Datenbank 96 zwei Lernen-Funktionen vor, das heißt, sie liefern zusammen die Fähigkeit, neue Wörter zu lernen, sowie die Fähigkeit, geänderte Häufigkeitswerte für bekannte Wörter zu lernen.
Die 3A und 3B zeigen auf eine beispielhafte Art und Weise den allgemeinen Betrieb bestimmter Aspekte der Disambiguierungsfunktion der tragbaren elektronischen Vorrichtung 4. Zusätzliche Merkmale, Funktionen und dergleichen werden anderswo dargestellt und beschrieben.
Eine Eingabe wird erfasst, wie bei 204, und die Eingabe kann jeder Typ einer Betätigung oder ein anderer Betrieb hinsichtlich jedes Teils der Eingabevorrichtung 8 sein. Eine typische Eingabe umfasst zum Beispiel eine Betätigung einer Taste 28 mit einer Anzahl von Zeichen 48 darauf, oder jeder andere Typ einer Betätigung oder Manipulation der Eingabevorrichtung 8.
Bei Erfassung einer Eingabe bei 204 wird ein Timer bei 208 zurückgestellt. Die Verwendung des Timers wird detaillierter unten beschrieben.
Die Disambiguierungsfunktion bestimmt dann, wie bei 212, ob die aktuelle Eingabe eine Bedieneingabe, wie eine Auswahl-Eingabe, eine Begrenzungszeichen- bzw. Delimiter-Eingabe, eine Bewegungs-Eingabe, eine Umschalt-Eingabe oder zum Beispiel eine andere Eingabe ist, die keine Betätigung einer Taste 28 darstellt, die eine Anzahl von Zeichen 48 darauf hat. Wenn bei 212 festgestellt wird, dass die Eingabe keine Bedieneingabe ist, geht die Verarbeitung bei 216 weiter durch Hinzufügen der Eingabe zu der aktuellen Eingabe-Sequenz, die bereits eine Eingabe umfassen kann oder nicht.
Viele der bei 204 erfassten Eingaben werden eingesetzt bei der Erzeugung von Eingabe-Sequenzen, bei denen die Disambiguierungsfunktion ausgeführt wird. Eine Eingabe-Sequenz wird in jeder „Sitzung" mit jeder Betätigung einer Taste 28 mit einer Anzahl von Zeichen 48 darauf aufgebaut. Da eine Eingabe-Sequenz typischerweise aus zumindest einer Betätigung einer Taste 28 mit einer Vielzahl von Zeichen 48 darauf besteht, ist die Eingabe-Sequenz vieldeutig. Wenn zum Beispiel ein Wort vollständig ist, wird die aktuelle Sitzung beendet und eine neue Sitzung wird initiiert.
Eine Eingabe-Sequenz wird stufenweise auf der tragbaren elektronischen Vorrichtung 4 aufgebaut mit jeder aufeinander folgenden Betätigung einer Taste 28 während jeder gegebenen Sitzung. Spezifisch wird, sobald eine Delimiter-Eingabe während einer gegebenen Sitzung erfasst wird, die Sitzung beendet und eine neue Sitzung wird initiiert. Jede Eingabe, die aus einer Betätigung einer der Tasten 28 mit einer damit verbundenen Anzahl von Zeichen 48 resultiert, wird sequentiell zu der aktuellen Eingabe-Sequenz hinzugefügt. Da die Eingabe-Sequenz während einer gegebenen Sitzung wächst, wird die Disambiguierungsfunktion im Allgemeinen mit jeder Betätigung einer Taste 28 ausgeführt, d. h. und hinsichtlich der gesamten Eingabe-Sequenz eingegeben. Anders ausgedrückt, in einer gegebenen Sitzung wird versucht, die wachsende Eingabe-Sequenz als eine Einheit durch die Disambiguierungsfunktion zu disambiguieren mit jeder nachfolgenden Betätigung der verschiedenen Tasten 28.
Sobald eine aktuelle Eingabe, die eine letzte Betätigung einer der Tasten 28 mit einer Anzahl der dazu gehörenden Zeichen 48 darstellt, zu der aktuellen Eingabe-Sequenz in der aktuellen Sitzung hinzugefügt wurde, wie bei 216 in der 3A, erzeugt die Disambiguierungsfunktion, wie bei 220, im Wesentlichen alle Permutationen der Zeichen 48, die den verschiedenen Tasten 28 zugewiesen werden, die getätigt wurden bei der Erzeugung der Eingabe-Sequenz. In dieser Hinsicht beziehen sich „Permutationen" auf die verschiedenen Strings, die aus den Zeichen 48 jeder gedrückten Taste 28 resultieren können, begrenzt durch die Reihenfolge, in der die Tasten 28 betätigt wurden. Die verschiedenen Permutationen der Zeichen in der Eingabe-Sequenz werden als Präfixobjekte eingesetzt.
Wenn zum Beispiel die aktuelle Eingabe-Sequenz in der aktuellen Sitzung die vieldeutige Eingabe der Tasten „AS" und „OP" ist, sind die verschiedenen Permutationen des ersten Zeichens 52 und des zweiten Zeichens 56 von jeder der zwei Tasten 28, wenn betrachtet in der Reihenfolge, in der die Tasten 28 betätigt wurden, „SO", „SP", „AP" und „AO" und jedes von diesen ist ein Präfixobjekt, das erzeugt wird, wie bei 220, hinsichtlich der aktuellen Eingabe-Sequenz. Wie detaillierter unten erklärt, versucht die Disambiguierungsfunktion, für jedes Präfixobjekt eines der Wortobjekte 108 zu identifizieren, für welches das Präfixobjekt ein Präfix sein würde.
Für jedes erzeugte Präfixobjekt wird der Speicher 20 konsultiert, wie bei 224, um, wenn möglich, für jedes Präfixobjekt eines der Wortobjekte 108 in dem Speicher 20 zu identifizieren, das dem Präfixobjekt entspricht, was bedeutet, dass die Sequenz der Buchstaben, die durch das Präfixobjekt dargestellt wird, entweder ein Präfix des identifizierten Wortobjektes 108 ist oder im Wesentlichen identisch zu der Gesamtheit des Wortobjektes 108 ist. Weiter ist in dieser Hinsicht das Wortobjekt 108, das zu identifizieren versucht wird, das Wortobjekt 108 mit der höchsten Häufigkeit. Das heißt, die Disambiguierungsfunktion versucht, das Wortobjekt 108 zu identifizieren, das dem Präfixobjekt entspricht und das auch zu einem Häufigkeitsobjekt 104 gehört, das einen relativ höheren Häufigkeitswert hat als alle der anderen Häufigkeitsobjekte 104, die zu den anderen Wortobjekten 108 gehören, die dem Präfixobjekt entsprechen.
Es wird in dieser Hinsicht angemerkt, dass die Wortobjekte 108 in der generischen Wortliste 88 im Allgemeinen in Datentabellen organisiert sind, die den ersten zwei Buchstaben von verschiedenen Wörtern entsprechen. Zum Beispiel würde die Datentabelle, die mit dem Präfix „CO" verbunden ist, alle der Wörter umfassen wie „CODE", „COIN", „COMMUNICATION" und dergleichen. Abhängig von der Quantität von Wortobjekten 108 in einer gegebenen Datentabelle kann die Datentabelle zusätzlich Teil-Datentabellen umfassen, in denen Wortobjekte 108 durch Präfixe organisiert sind, die drei Zeichen oder mehr in der Länge sind. Weiter mit dem vorangehenden Beispiel, wenn die „CO"-Datentabelle zum Beispiel mehr als 256 Wortobjekte 108 umfassen würde, würde die „CO"-Datentabelle zusätzlich eine oder mehrere Teil-Datentabellen von Wortobjekten 108 umfassen, die den am häufigsten erscheinenden Dreibuchstaben-Präfixen entsprechen. Auf beispielhafte Weise kann somit die „CO"-Datentabelle auch eine „COM"-Teil-Datentabelle und eine „CON"-Teil-Datentabelle umfassen. Wenn eine Teil-Datentabelle mehr als die vorgegebene Anzahl von Wortobjekten 108 umfasst, zum Beispiel eine Quantität von 256, kann die Teil-Datentabelle weitere Teil-Datentabellen umfassen, die gemäß Präfixen mit vier Buchstaben organisiert werden. Es wird angemerkt, dass die oben erwähnte Quantität von 256 der Wortobjekte 108 dem höchsten numerischen Wert entspricht, der in einem Byte des Speichers 20 gespeichert werden kann.
Demgemäß wird, wenn bei 224 versucht wird, jedes Präfixobjekt zu verwenden, um ein entsprechendes Wortobjekt 108 zu identifizieren, und zum Beispiel das vorliegende Präfixobjekt „AP" ist, die „AP"-Datentabelle konsultiert. Da alle der Wortobjekte 108 in der „AP"-Datentabelle dem Präfixobjekt „AP" entsprechen, wird das Wortobjekt 108 in der „AP"-Datentabelle identifiziert, zu dem ein Häufigkeitsobjekt 104 gehört, das einen Häufigkeitswert hat, der relativ höher ist als einer der anderen Häufigkeitsobjekte 104 in der „AP"-Datentabelle. Das identifizierte Wortobjekt 108 und das zugehörige Häufigkeitsobjekt 104 werden dann in einem Resultat-Register gespeichert, das als ein Resultat der verschiedenen Vergleiche der erzeugten Präfixobjekte mit den Inhalten des Speichers 20 dient.
Es wird angemerkt, dass eines oder mehrere oder vielleicht alle der Präfixobjekte Präfixobjekte sind, für die ein entsprechendes Wortobjekt 108 nicht in dem Speicher 20 identifiziert wird. Derartige Präfixobjekte werden betrachtet als verwaiste Präfixobjekte und werden separat gespeichert oder werden anderweitig für möglichen zukünftigen Gebrauch behalten. In dieser Hinsicht wird angemerkt, dass viele oder alle der Präfixobjekte verwaiste Objekt werden können, wenn zum Beispiel der Benutzer versucht, ein neues Wort einzugeben, oder zum Beispiel, wenn der Benutzer falsch getippt hat und kein Wort der falsch getippten Eingabe entspricht.
Sobald das Resultat bei 224 erlangt wird, bestimmt die Disambiguierungsfunktion, wie bei 225, ob zumindest ein Sprachobjekt 100 als einem Präfixobjekt entsprechend identifiziert wurde. Wenn nicht geht die Verarbeitung weiter, wie bei 226, wo sich die Verarbeitung verzweigt zu 15A, was detaillierter an anderer Stelle hierin diskutiert wird. Wenn bei 225 festgestellt wird, dass zumindest ein Sprachobjekt 100 als einem Präfixobjekt entsprechend identifiziert wurde, geht die Verarbeitung weiter bei 228, wo die Disambiguierungsroutine beginnt, festzustellen, ob künstliche Varianten erzeugt werden sollen.
Um die Erfordernis für künstliche Varianten zu bestimmen, verzweigt sich bei 228 der Prozess, wie bei 230, zu dem „künstliche Variante"-Prozess, der allgemein in 4 dargestellt wird und mit der Ziffer 304 beginnt. Die Disambiguierungsfunktion stellt dann fest, wie bei 308, ob eines der Präfixobjekte in dem Resultat dem entspricht, was die standardmäßige Ausgabe 76 vor der Erfassung der aktuellen Tasten-Eingabe gewesen ist. Wenn ein Präfixobjekt in dem Resultat der vorhergehenden standardmäßigen Ausgabe entspricht, bedeutet dies, dass die aktuelle Eingabe-Sequenz einem Wortobjekt 108 entspricht und notwendigerweise die vorhergehende standardmäßige Ausgabe auch einem Wortobjekt 108 während des vorhergehenden Disambiguierungszyklusses in der aktuellen Sitzung entsprochen hat.
Wenn bei 308 bestimmt wird, dass ein Präfixobjekt in dem Resultat dem entspricht, was die standardmäßige Ausgabe 76 war vor der Erfassung der aktuellen Tasteneingabe, ist der nächste Punkt der Analyse, festzustellen, wie bei 310, ob die vorhergehende standardmäßige Ausgabe die standardmäßige Ausgabe gemacht wurde aufgrund einer Auswahl-Eingabe, wie es das Setzen einer Markierung (flag) verursacht hätte, wie bei 254 der 3B, was unten detaillierter diskutiert wird. In dem Fall, dass die vorhergehende standardmäßige Ausgabe nicht das Resultat einer Auswahl-Eingabe war, was bedeutet, dass keine Markierung gesetzt wurde, sind keine künstlichen Varianten erforderlich, und der Prozess kehrt, wie bei 312, zu dem Hauptprozess bei 232 zurück. Wenn jedoch bei 310 festgestellt wird, dass die vorhergehende standardmäßige Ausgabe das Resultat einer Auswahl-Eingabe war, dann werden künstliche Varianten erzeugt, wie bei 316.
Spezifischer umfasst jede der künstlichen Varianten, die bei 316 erzeugt werden, die vorhergehende standardmäßige Ausgabe plus eines der Zeichen 48, die der Taste 28 der aktuellen Eingabe zugewiesen sind. Somit werden, wenn die Taste 28 der aktuellen Eingabe zwei Zeichen hat, d. h. ein erstes Zeichen 52 und ein zweites Zeichen 56, zwei künstliche Varianten bei 316 erzeugt. Eine der künstlichen Varianten umfasst die vorhergehende standardmäßige Ausgabe plus das erste Zeichen 52. Die andere künstliche Variante umfasst die vorhergehende standardmäßige Ausgabe plus das zweite Zeichen 56.
Wenn jedoch bei 308 festgestellt wird, dass keines der Präfixobjekte in dem Resultat der vorhergehenden standardmäßigen Ausgabe entspricht, ist es als nächstes notwendig, zu bestimmen, wie bei 314, ob die vorhergehende standardmäßige Ausgabe einem Wortobjekt 108 während des vorhergehenden Disambiguierungszyklus in der aktuellen Sitzung entsprochen hat. Wenn die Antwort auf die Abfrage bei 314 nein ist, ist es weiter notwendig, zu bestimmen, wie bei 318, ob die vorhergehende standardmäßige Ausgabe zur standardmäßigen Ausgabe gemacht wurde aufgrund einer Auswahl-Eingabe, wie es das Setzen der Markierung verursachen würde. In dem Fall, dass die vorhergehende standardmäßige Ausgabe nicht das Resultat einer Auswahl-Eingabe war, sind keine künstlichen Varianten erforderlich und der Prozess kehrt zurück, wie bei 312, zu dem Hauptprozess bei 232.
Wenn jedoch bei 318 festgestellt wird, dass die vorhergehende standardmäßige Ausgabe das Resultat einer Auswahl-Eingabe war, dann ist es als nächstes notwendig, zu bestimmen, wie bei 319, ob die standardmäßige Vorauswahl-Ausgabe, d. h. was die standardmäßige Ausgabe war vor der Auswahl-Eingabe, die bei 318 identifiziert wird, einem Wortobjekt 108 entspricht. Wenn dem so ist, werden künstliche Varianten erzeugt, wie bei 321, für die standardmäßige Vorauswahl-Ausgabe plus jedes der linguistischen Elemente, die der Taste 28 der aktuellen Eingabe zugewiesen sind. Die Verarbeitung geht dann weiter zu 316, wo künstliche Varianten erzeugt werden für die vorherige standardmäßige Ausgabe plus die linguistischen Elemente, die der Taste 28 der aktuellen Eingabe zugewiesen sind. Alternativ, wenn bei 319 bestimmt wird, dass die standardmäßige Vorauswahl-Ausgabe keinem Wortobjekt 108 entspricht, geht die Verarbeitung direkt weiter zu 316, wo künstliche Varianten erzeugt werden für die vorherige standardmäßige Ausgabe plus die linguistischen Elemente, die der Taste 28 der aktuellen Eingabe zugewiesen sind.
Wenn andererseits festgestellt wird, dass die Antwort auf die Abfrage bei 314 ja ist, was bedeutet, dass die vorhergehende standardmäßige Ausgabe einem Wortobjekt entsprochen hat, aber mit der aktuellen Eingabe die vorhergehende standardmäßige Ausgabe kombiniert mit der aktuellen Eingabe keinem Wortobjekt 108 mehr entspricht, werden künstliche Varianten erzeugt, wiederum wie bei 316.
Nachdem die künstlichen Varianten bei 316 erzeugt werden, bestimmt das Verfahren dann, wie bei 320, ob das Resultat überhaupt Präfixobjekte umfasst. Wenn nicht, kehrt die Verarbeitung, wie bei 312, zu dem Hauptprozess bei 232 zurück. Wenn jedoch bei 320 festgestellt wird, dass das Resultat zumindest ein erstes Präfixobjekt umfasst, was bedeutet, dass die aktuelle Eingabe-Sequenz einem Wortobjekt 108 entspricht, wird die Verarbeitung zu 324 übergeben, wo eine zusätzliche künstliche Variante erzeugt wird. Spezifisch, das Präfixobjekt des Resultats, zu dem das Häufigkeitsobjekt 104 gehört, das den relativ höchsten Häufigkeitswert unter den anderen Häufigkeitsobjekten 104 in dem Resultat hat, wird identifiziert, und die künstliche Variante wird erzeugt durch Löschen des letzten Zeichens aus dem identifizierten Präfixobjekt und dessen Ersetzen mit einem entgegengesetzten Zeichen 48 auf der gleichen Taste 28 der aktuellen Eingabe, welches das letzte Zeichen 48 des identifizierten Präfixobjektes erzeugte. In dem Falle, dass die spezifische Taste 28 mehr als zwei zugewiesene Zeichen 48 hat, wird jedes solche entgegengesetzte Zeichen 48 verwendet, um eine zusätzliche künstliche Variante zu erzeugen.
Sobald die Notwendigkeit für künstliche Varianten identifiziert wurde, wie bei 228, und derartige künstliche Varianten erzeugt wurden, wie in der 4 und wie oben beschrieben, geht die Verarbeitung weiter, wie bei 232, wo doppelte Wortobjekte 108, die zu relativ niedrigeren Häufigkeitswerten gehören, aus dem Resultat gelöscht werden. Solch ein doppeltes Wortobjekt 108 kann zum Beispiel durch die Häufigkeits-Lernen-Datenbank 96 erzeugt werden, wie detaillierter unten dargelegt wird. Wenn ein Wortobjekt 108 in dem Resultat mit einer der künstlichen Varianten übereinstimmt, werden das Wortobjekt 108 und sein zugehöriges Häufigkeitsobjekt 104 im Allgemeinen aus dem Resultat entfernt, da der künstlichen Variante ein bevorzugter Status in der Ausgabe 64 zugewiesen wird, wahrscheinlich in einer Position bevorzugt zu jedem Wortobjekt 108, das identifiziert worden sein könnte.
Sobald die doppelten Wortobjekte 108 und die zugehörigen Häufigkeitsobjekte 104 bei 232 entfernt wurden, werden die restlichen Präfixobjekte angeordnet, wie bei 236, in einem Ausgabesatz in abnehmender Reihenfolge des Häufigkeitswerts. Die verwaisten Präfixobjekte, die oben erwähnt werden, können ebenfalls zu dem Ausgabesatz hinzugefügt werden, wenngleich an Positionen eines relativ niedrigeren Häufigkeitswerts als jedes Präfixobjekt, für das ein entsprechendes Wortobjekt 108 gefunden wurde. Es ist auch notwendig, sicherzugehen, dass die künstlichen Varianten, wenn sie erzeugt wurden, an einer bevorzugten Position in dem Ausgabesatz gesetzt werden. Es ist offensichtlich, dass künstlichen Varianten eine Präferenzposition gegeben werden kann, aber nicht unbedingt muss, d. h. eine relativ höhere Priorität oder Häufigkeit zugewiesen als Präfixobjekten des Resultats.
Wenn festgestellt wird, wie bei 240, dass die Markierung gesetzt wurde, was bedeutet, dass ein Benutzer eine Auswahl-Eingabe gemacht hat, entweder durch eine Express-Auswahl-Eingabe oder durch eine Umschalt-Eingabe einer Bewegungs-Eingabe, dann wird die standardmäßige Ausgabe 76 betrachtet als „versperrt (locked)", was bedeutet, dass die gewählte Variante das standardmäßige Präfix bis zum Ende der Sitzung ist. Wenn bei 240 festgestellt wird, dass die Markierung gesetzt wurde, geht die Verarbeitung bei 244 weiter, wo die Inhalte des Ausgabe satzes geändert werden, wenn erforderlich, um als die standardmäßige Ausgabe 76 eine Ausgabe zu liefern, die das gewählte Präfixobjekt umfasst, ob es einem Wortobjekt 108 entspricht oder eine künstliche Variante ist. In dieser Hinsicht ist anzumerken, dass die Markierung mehrere Male während einer Sitzung gesetzt werden kann, in diesem Fall wird das gewählte Präfix, das zu dem Zurückstellen der Markierung gehört, danach die „gesperrte" standardmäßige Ausgabe 76 bis zu dem Ende der Sitzung ist oder bis eine andere Auswahl-Eingabe erfasst wird.
Die Verarbeitung geht dann weiter, wie bei 248, zu einem Ausgabe-Schritt, wonach eine Ausgabe 64 erzeugt wird, wie oben beschrieben. Spezifischer, die Verarbeitung geht weiter, wie bei 250, zu dem Teilsystem, das allgemein in der 6 dargestellt wird und unten beschrieben wird. Danach geht die Verarbeitung weiter bei 204, wo eine zusätzliche Eingabe erfasst wird. Andererseits, wenn bei 240 festgestellt wird, dass die Markierung nicht gesetzt wurde, dann geht die Verarbeitung direkt zu 248 ohne eine Änderung der Inhalte des Ausgabe-Satzes bei 244.
Die tragbare elektronische Vorrichtung 4 kann derart konfiguriert sein, dass ein verwaistes Präfixobjekt, das in einer Ausgabe 64 enthalten ist, aber nicht mit der folgenden Eingabe gewählt wird, suspendiert wird. Dies kann begrenzt werden auf verwaiste Präfixobjekte, die in dem Varianten-Teil 80 erscheinen, oder kann auf verwaiste Präfixobjekte überall in der Ausgabe 64 zutreffen. Die tragbare elektronische Vorrichtung 4 kann auch konfiguriert sein, um ähnlich künstliche Varianten in ähnlichen Umständen zu suspendieren. Ein Grund für eine derartige Suspension ist, dass jedes derartige verwaiste Präfixobjekt und/oder künstliche Variante, wie geeignet, eine Quantität von nachfolgenden verwaisten Präfixobjekten verteilen kann, gleich zu der Quantität von Zeichen 48 auf einer Taste 28 der nächsten Eingabe. Das heißt, jeder Nachkomme umfasst das verwaiste Eltern-Präfixobjekt oder die künstliche Variante plus eines der Zeichen 48 der Taste 28 der nächsten Eingabe. Da verwaiste Präfixobjekte und künstliche Varianten im Wesentlichen keine Entsprechung zu einem Wortobjekt 108 haben, haben auch erzeugte Nachkommenobjekte von verwaisten Eltern-Präfixobjekten und künstlichen Varianten ebenfalls keine Entsprechung zu einem Wortobjekt 108. Derartige suspendierte verwaiste Präfixobjekte und/oder künstliche Varianten können als suspendiert betrachtet werden, im Vergleich zu vollständig eliminiert, da derartige suspendierte verwaiste Präfixobjekte und/oder künstliche Varianten später wieder als Eltern eines erzeugten verwaisten Präfixobjekts und/oder künstlicher Varianten erscheinen können, wie unten erläutert wird.
Wenn die erfasste Eingabe bestimmt wird, wie bei 212, als eine Bedieneingabe, dann geht die Verarbeitung weiter, um die spezifische Eigenschaft der Bedieneingabe festzustellen. Wenn zum Beispiel festgestellt wird, wie bei 252, dass die aktuelle Eingabe eine Auswahl-Eingabe ist, geht die Verarbeitung bei 254 weiter. Bei 254 werden das Wortobjekt 108 und das zugehörige Häufigkeitsobjekt 104 des Standard-Teils 76 der Ausgabe 64, sowie das Wortobjekt 108 und das zugehörige Häufigkeitsobjekt 104 des Teils der Varianten-Ausgabe 80, die durch die Auswahl-Eingabe gewählt wurden, in einem temporären Lernen-Datenregister gespeichert. Zusätzlich wird die Markierung gesetzt. Dann kehrt die Verarbeitung zurück zur Erfassung von zusätzlichen Eingaben, wie bei 204.
Wenn festgestellt wird, wie bei 260, dass die Eingabe eine Delimiter-Eingabe ist, geht die Verarbeitung bei 264 weiter, wo die aktuelle Sitzung beendet wird und die Verarbeitung übergeben wird, wie bei 266, an das Lernen-Funktion-Teilsystem, wie bei 404 der 5A. Eine Delimiter-Eingabe umfasst zum Beispiel die Betätigung einer <LEERZEICHEN (SPACE)>-Taste 116, die sowohl ein Delimiter-Symbol eingeben als auch ein Leerzeichen am Ende des Wortes hinzufügen würde, eine Betätigung der <ENTER>-Taste 44, die ähnlich eine Delimiter-Eingabe eingeben kann und ein Leerzeichen eingeben kann, und durch eine Translation des Thumbwheels 32, wie wird durch den Pfeil 38 angezeigt, die eine Delimiter-Eingabe eingeben kann, ohne zusätzlich ein Leerzeichen einzugeben.
Es wird zuerst festgestellt, wie bei 408, ob die standardmäßige Ausgabe zum Zeitpunkt der Erfassung der Demiliter-Eingabe bei 260 mit einem Wortobjekt 108 in dem Speicher 20 übereinstimmt. Wenn nicht, bedeutet dies, dass die standardmäßige Ausgabe eine Benutzer-erzeugte Ausgabe ist, die zu der „neue Wörter"-Datenbank 92 für zukünftigen Gebrauch hinzugefügt werden sollte. Unter solch einem Umstand geht dann die Verarbeitung weiter zu 412, wo die standardmäßige Ausgabe in der „neue Wörter"-Datenbank 92 als ein neues Wortobjekt 108 gespeichert wird. Zusätzlich wird ein Häufigkeitsobjekt 104 in der „neue Wörter"-Datenbank 92 gespeichert und zugeordnet zu dem vorher erwähnten neuen Wortobjekt 108. Dem neuen Häufigkeitsobjekt 104 wird ein relativ hoher Häufigkeitswert gegeben, typischerweise in dem oberen Viertel oder Drittel eines vorgegebenen Bereichs von möglichen Häufigkeitswerten.
In dieser Hinsicht wird Häufigkeitsobjekten 104 ein absoluter Häufigkeitswert im Allgemeinen in dem Bereich von null bis 65,535 gegeben. Der Maximalwert stellt die größte Anzahl dar, die in zwei Bytes des Speichers 20 gespeichert werden kann. Dem neuen Häufigkeitsobjekt 104, das in der „neue Wörter"-Datenbank 92 gespeichert wird, wird ein absoluter Häufigkeitswert in oberen Viertel oder Drittels dieses Bereichs zugewiesen, besonders, da das neue Wort von einem Benutzer verwendet wurde und wahrscheinlich wieder verwendet wird.
In weiterer Hinsicht zu dem Häufigkeitsobjekt 104 wird angemerkt, dass in einer gegebenen Datentabelle, wie der oben erwähnten „CO"-Datentabelle, der absolute Häufigkeitswert nur für das Häufigkeitsobjekt 104 gespeichert wird, das den höchsten Häufigkeitswert in der Datentabelle hat. Alle anderen Häufigkeitsobjekte 104 in der gleichen Datentabelle haben Häufigkeitswerte gespeichert als Prozentwerte, normalisiert zu dem vorher erwähnten maximalen absoluten Häufigkeitswert. Das heißt, nach Identifikation des Häufigkeitsobjektes 104 mit dem höchsten Häufigkeitswert in einer gegebenen Datentabelle, wird allen anderen Häufigkeitsobjekten 104 in der gleichen Datentabelle ein Prozentsatz des absoluten Maximalwerts zugewiesen, der das Verhältnis des relativ kleineren absoluten Häufigkeitswertes eines bestimmten Häufigkeitsobjektes 104 zu dem absoluten Häufigkeitswert des vorher erwähnten Häufigkeitsobjektes 104 mit dem höchsten Wert darstellt. Vorteilhafterweise können derartige Prozentsatzwerte in einem einzelnen Byte des Speichers gespeichert werden, wodurch Speicherplatz in der tragbaren elektronischen Vorrichtung 4 gespart wird.
Nach der Erzeugung des neuen Wortobjekts 108 und des neuen Häufigkeitsobjekts 104 und deren Speicherung in der „neue Wörter"-Datenbank 92 wird die Verarbeitung zu 420 übergeben, wo der Lernenprozess beendet wird. Die Verarbeitung kehrt dann zum Hauptprozess zurück, wie bei 204.
Wenn bei 408 festgestellt wird, dass das Wortobjekt 108 in der standardmäßigen Ausgabe 76 mit einem Wortobjekt 108 in dem Speicher 20 übereinstimmt, dann fährt die Verarbeitung bei 416 fort, wo bestimmt wird, ob die vorher erwähnte Markierung gesetzt wurde, wie es geschieht bei der Erfassung einer Auswahl-Eingabe und Umschalt-Eingabe oder einer Bewegungs-Eingabe, auf beispielhafte Weise. Wenn festgestellt wird, dass die Markierung nicht gesetzt wurde, bedeutet dies, dass der Benutzer keine Präferenz für ein Varianten-Präfixobjekt gegenüber einem standardmäßigen Präfixobjekt ausgedrückt hat, und es entstand keine Notwendigkeit für ein Häufigkeits-Lernen. Unter solch einem Umstand fährt die Verarbeitung bei 420 fort, wo der Lernenprozess beendet wird. Dann kehrt die Verarbeitung zu dem Hauptprozess bei 204 zurück.
Wenn jedoch bei 416 festgestellt wird, dass die Markierung gesetzt wurde, ruft der Prozessor 20 aus dem temporären Lernen-Datenregister die zuletzt gespeicherten Standard- und Varianten-Wortobjekte 108 ab, zusammen mit ihren zuge hörigen Häufigkeitsobjekten 104. Es wird dann festgestellt, wie bei 428, ob die Standard- und Varianten-Wortobjekte 108 vorher einer Häufigkeits-Lernen-Operation unterzogen wurden. Dieses kann festgestellt werden zum Beispiel durch Bestimmen, ob das Varianten-Wortobjekt 108 und das zugehörige Häufigkeitsobjekt 104 aus der Häufigkeits-Lernen-Datenbank 96 erlangt wurden. Wenn die Standard- und Varianten-Wortobjekte 108 nicht vorher einer Häufigkeits-Lernen-Operation unterzogen wurden, geht die Verarbeitung weiter, wie bei 432, wo das Varianten-Wortobjekt 108 in der Häufigkeits-Lernen-Datenbank 96 gespeichert wird und ein revidiertes Häufigkeitsobjekt 104 erzeugt wird, das einen Häufigkeitswert hat, der größer ist als der des Häufigkeitsobjektes 104, das vorher zu dem Varianten-Wortobjekt 108 gehörte. In dem vorliegenden beispielhaften Umstand, d. h. wo das Standard-Wortobjekt 108 und das Varianten-Wortobjekt 108 ihre erste Häufigkeits-Lernen-Operation erfahren, kann dem revidierten Häufigkeitsobjekt 104 zum Beispiel ein Häufigkeitswert gegeben werden, der gleich der Summe ist des Häufigkeitswertes des Häufigkeitsobjektes 104, das vorher zu dem Varianten-Wortobjekt 108 gehörte, plus die Hälfte der Differenz zwischen dem Häufigkeitswert des Häufigkeitsobjektes 104, das zu dem Standard-Wortobjekt 108 gehört, und dem Häufigkeitswert des Häufigkeitsobjektes 104, das vorher zu dem Varianten-Wortobjekt 108 gehörte. Nach der Speicherung des Varianten-Wortobjektes 108 und des revidierten Häufigkeitsobjektes 104 in der Häufigkeits-Lernen-Datenbank 96, fährt die Verarbeitung bei 420 fort, wo der Lernenprozess beendet wird und die Verarbeitung kehrt zu dem Hauptprozess zurück, wie bei 204.
Wenn bei 428 festgestellt wird, dass das Standard-Wortobjekt 108 und das Varianten-Wortobjekt 108 vorher einer Häufigkeits-Lernen-Operation unterzogen wurden, geht die Verarbeitung weiter zu 436, wo dem revidierten Häufigkeitswert 104 stattdessen ein Häufigkeitswert gegeben wird, der höher als der Häufigkeitswert des Häufigkeitsobjektes 104 ist, der zu dem Standard-Wortobjekt 108 gehört. Nach Speicherung des Varianten-Wortobjektes 108 und des revidierten Häufig keitsobjektes 104 in der Häufigkeits-Lernen-Datenbank 96, geht die Verarbeitung weiter zu 420, wo der Lernenprozess beendet wird, und dann kehrt die Verarbeitung zu dem Hauptprozess zurück, wie bei 204.
Weiter hinsichtlich der Lernen-Funktion wird angemerkt, dass die Lernen-Funktion zusätzlich erfasst, ob sowohl das Standard-Wortobjekt 108 als auch das Varianten-Wortobjekt 104 aus der Häufigkeits-Lernen-Datenbank 96 erlangt wurden. In dieser Hinsicht werden, wenn Wortobjekte 108 identifiziert werden, wie bei 224, für eine Entsprechung mit erzeugten Präfixobjekten, alle der Datenquellen in dem Speicher für derartige entsprechende Wortobjekte 108 und entsprechende Häufigkeitsobjekte 104 abgefragt. Da die Häufigkeits-Lernen-Datenbank 96 Wortobjekte 108 speichert, die auch entweder in der generischen Wortliste 88 oder in der „neue Wörter"-Datenbank 92 gespeichert sind, sind das Wortobjekt 108 und das zugehörige Häufigkeitsobjekt 104, die aus der Häufigkeits-Lernen-Datenbank 96 erlangt werden, typischerweise Duplikate von Wortobjekten 108, die bereits aus der generischen Wortliste 88 oder der „neue Wörter"-Datenbank 92 erlangt wurden. Jedoch hat das zugehörige Häufigkeitsobjekt 104, das aus der Häufigkeits-Lernen-Datenbank 96 erlangt wird, typischerweise einen Häufigkeitswert, der größer ist als der des zugehörigen Häufigkeitsobjektes 104, das aus der generischen Wortliste 88 erlangt wurde. Dies reflektiert die Eigenschaft der Häufigkeits-Lernen-Datenbank 96 als Verleihen einem häufig verwendeten Wortobjekt 108 einen relativ größeren Häufigkeitswert als es anderweitig in der generischen Wortliste 88 haben würde.
Es kann folglich gesehen werden, dass die Lernen-Funktion, die in den 5A and 5B gezeigt wird und oben beschrieben wird, im Allgemeinen nicht initiiert wird, bis eine Delimiter-Eingabe erfasst wird, was bedeutet, dass ein Lernen nur einmal pro Sitzung stattfindet. Zusätzlich, wenn die letzte standardmäßige Ausgabe nicht ein Benutzer-definiertes neues Wort ist, sind die Wortobjekte 108, die der Häufigkeits-Lernen-Funktion unterzogen werden, die Wortobjekte 108, die zu der standardmäßigen Ausgabe 76 und der gewählten Varianten-Ausgabe 80 gehörten zu dem Zeitpunkt, als die Auswahl stattfand, anstatt notwendigerweise zu dem Objekt gehörend, das schließlich als die standardmäßige Ausgabe am Ende der Sitzung resultierte. Auch wenn zahlreiche lernbare Ereignisse während einer einzelnen Sitzung auftreten, arbeitet die Häufigkeits-Lernen-Funktion nur auf den Wortobjekten 108, die zu dem letzten lernbaren Ereignis gehören, d. h. ein Auswahl-Ereignis, ein Umschalt-Ereignis oder ein Bewegungs-Ereignis, vor Beendigung der aktuellen Sitzung.
Weiter hinsichtlich der Identifikation verschiedener Wortobjekte 108 zur Entsprechung mit erzeugten Präfixobjekten wird angemerkt, dass der Speicher 20 eine Anzahl von zusätzlichen Datenquellen 99 zusätzlich zu der generischen Wortliste 88, der „neue Wörter"-Datenbank 92 und der Häufigkeits-Lernen-Datenbank 96 umfassen kann, die alle als linguistische Quellen betrachtet werden können. Zwei weitere beispielhafte Datenquellen 99 werden in der 2A dargestellt, wobei offensichtlich ist, dass der Speicher 20 jede Anzahl anderer Datenquellen 99 umfassen kann. Die anderen Datenquellen 99 können zum Beispiel eine Adressdatenbank, eine Kurztext-Datenbank oder jede andere Datenquelle ohne Einschränkung umfassen. Eine beispielhafte Kurztext-Datenbank kann, zum Beispiel, Sätze von Wörtern oder Ausdrücken oder anderen Daten umfassen, die jeweils zum Beispiel zu einem Zeichen-String gehören, der abgekürzt werden kann. Zum Beispiel kann eine Kurztext-Datenbank den String „br" mit dem Satz von Wörtern „Best Regards" verbinden, mit der Absicht, dass ein Benutzer den String „br" schreiben kann und die Ausgabe „Best Regards" empfangen kann.
Wenn versucht wird, Wortobjekte 108 zu identifizieren, die einem gegebenen Präfixobjekt entsprechen, kann die tragbare elektronische Vorrichtung 4 alle Datenquellen in dem Speicher 20 abfragen. Zum Beispiel kann die tragbare elektronische Vorrichtung 4 die generische Wortliste 88, die „neue Wörter"-Datenbank 92, die Häufigkeits-Lernen-Datenbank 96 und die anderen Datenquellen 99 abfra gen, um Wortobjekte 108 zu identifizieren, die dem Präfixobjekt entsprechen. Die Inhalte der anderen Datenquellen 99 können behandelt werden als Wortobjekte 108, und der Prozessor 16 kann Häufigkeitsobjekte 104 erzeugen, die derartigen Wortobjekten 108 zugeteilt werden und welchen ein Häufigkeitswert zugewiesen werden kann in zum Beispiel dem oberen Drittel oder Viertel des vorher erwähnten Häufigkeitsbereichs. Unter der Annahme, dass der zugewiesene Häufigkeitswert hoch genug ist, wird der String „br" zum Beispiel typischerweise an die Anzeige 60 ausgegeben. Wenn eine Delimiter-Eingabe hinsichtlich des Teils des Ausgabe erfasst wird, der die Verbindung zu dem Wortobjekt 108 in der Kurztext-Datenbank hat, zum Beispiel „br", würde der Benutzer die Ausgabe „Best Regards" empfangen, wobei offensichtlich ist, dass der Benutzer auch eine Auswahl-Eingabe als den beispielhaften String „br" eingegeben haben könnte.
Die Inhalte von einer der anderen Datenquellen 99 können behandelt werden als Wortobjekte 108 und können zu erzeugten Häufigkeitsobjekten 104 gehören, die den zugewiesenen Häufigkeitswert in dem vorher erwähnten oberen Teil des Häufigkeitsbereichs haben. Nachdem derartige Wortobjekte 108 identifiziert sind, kann die neue Wort-Lernen-Funktion, wenn geeignet, auf derartigen Wortobjekten 108 auf die oben dargelegte Art handeln.
Wieder unter Betrachtung der 3A, wenn die Verarbeitung zu dem Filterschritt fortfährt, wie bei 232, und die doppelten Wortobjekte 108 und die zugehörigen Häufigkeitsobjekte 104, die relativ niedrigere Häufigkeitswerte haben, gefiltert werden, können die restlichen Resultate ein Varianten-Wortobjekt 108 und ein Standard-Wortobjekt 108 umfassen, die beide aus der Häufigkeits-Lernen-Datenbank 96 erlangt wurden. In solch einer Situation kann vorgesehen werden, dass, wenn ein Benutzer wiederholt und alternativ ein Wort statt das andere Wort verwendet, mit der Zeit die Häufigkeitsobjekte 104, die zu derartigen Wörtern gehören, weit über den vorher erwähnten maximalen absoluten Häufigkeitswert hinaus für ein Häufigkeitsobjekt 104 zunehmen. Demgemäß speichert, wenn fest gestellt wird, dass das Standard-Wortobjekt 108 und das Varianten-Wortobjekt 108 in der Lernen-Funktion aus der Häufigkeits-Lernen-Datenbank 96 erlangt wurden, anstatt das Varianten-Wortobjekt 108 in der Häufigkeits-Lernen-Datenbank 96 zu speichern und mit einem Häufigkeitsobjekt 104 zu verbinden, das einen relativ erhöhten Häufigkeitswert hat, die Lernen-Funktion stattdessen das Standard-Wortobjekt 108 und verbindet es mit einem revidierten Häufigkeitsobjekt 104, das einen Häufigkeitswert hat, der relativ niedriger als der des Häufigkeitsobjektes 104 ist, das zu dem Varianten-Wortobjekt 108 gehört. Ein derartiges Schema vermeidet vorteilhaft übermäßige und nicht notwendige Zunahmen des Häufigkeitswertes.
Wenn festgestellt wird, wie bei 268, dass die aktuelle Eingabe eine Bewegungs-Eingabe ist, wie eingesetzt wird, wenn ein Benutzer versucht, ein Objekt zu editieren, entweder ein beendetes Wort oder ein Präfixobjekt in der aktuellen Sitzung, wird das Caret-Zeichen 84 auf die gewünschte Position verschoben, wie bei 272, und die Markierung wird gesetzt, wie bei 276. Die Verarbeitung kehrt dann dahin zurück, wo zusätzliche Eingaben erfasst werden können, wie bei 204.
In dieser Hinsicht ist es offensichtlich, dass verschiedene Typen von Bewegungs-Eingaben von der Eingabevorrichtung 8 erfasst werden können. Zum Beispiel kann eine Rotation des Thumbwheels 32, wie durch den Pfeil 34 der 1 angezeigt, eine Bewegungs-Eingabe liefern, wie die Betätigung der <NEXT>-Taste 40 oder eine andere derartige Eingabe, möglicherweise in Verbindung mit anderen Vorrichtungen in der Eingabevorrichtung 8. In dem Fall, in dem solch eine Bewegungs-Eingabe erfasst wird, wie in dem Umstand einer editierenden Eingabe, wird die Bewegungs-Eingabe zusätzlich als eine Auswahl-Eingabe erfasst. Demgemäß und wie es der Fall ist mit einer Auswahl-Eingabe, wie bei 252 erfasst wird, ist die gewählte Variante effektiv gesperrt (locked) hinsichtlich des Standard-Teils 76 der Ausgabe 64. Jede Standard-Ausgabe 76 während der gleichen Sitzung umfasst notwendigerweise die vorher gewählte Variante.
In dem Kontext des Editieren jedoch ist das bestimmte angezeigte Objekt, das editiert wird, effektiv gesperrt, außer hinsichtlich des Zeichens, das editiert wird. In dieser Hinsicht werden somit die anderen Zeichen des editierten Objekts, d. h. die Zeichen, die nicht editiert werden, beibehalten und als ein Kontext zum Identifizieren zusätzlicher Wortobjekte 108 und dergleichen, die dem editierten Objekt entsprechen, eingesetzt. Wo dies nicht der Fall ist, würde ein Benutzer, der einen Buchstaben in der Mitte eines Wortes zu editieren versucht, als eine neue Ausgabe 64 zahlreiche Objekte sehen, die wenig oder keine Ähnlichkeit aufweisen zu den Zeichen des editierten Objekts, da bei Fehlen des Beibehalten eines derartigen Kontexts, ein gänzlich neuer Satz von Präfixobjekten erzeugt worden wäre, einschließlich aller Permutationen der Zeichen der verschiedenen Tastenanschläge des editierten Objekts. Neue Wortobjekte 108 wären identifiziert worden als entsprechend zu den neuen Präfixobjekten, die alle die Ausgabe 64 signifikant ändern können nur durch das Editieren eines einzelnen Zeichens. Durch Beibehalten der anderen Zeichen, die aktuell in dem editierten Objekt sind, und Einsetzen derartiger anderer Zeichen, wie Kontextinformation, kann der Benutzer sehr viel einfacher ein Wort editieren, das auf der Anzeige 60 dargestellt wird.
In dem vorliegenden beispielhaften Ausführungsbeispiel der tragbaren elektronischen Vorrichtung 4 ist, wenn festgestellt wird, wie bei 252, dass die Eingabe keine Auswahl-Eingabe ist, und festgestellt wird, wie bei 260, dass die Eingabe keine Delimiter-Eingabe ist, und weiter festgestellt wie, wie bei 268, dass die Eingabe keine Bewegungs-Eingabe ist, in dem aktuellen beispielhaften Ausführungsbeispiel der tragbaren elektronischen Vorrichtung 4 die einzige verbleibende Bedieneingabe im Allgemeinen eine Erfassung der <LÖSCHEN (DELETE)>-Taste 86 der Tasten 28 des Tastaturfelds 24. Bei Erfassung der <DELETE>-Taste 86 wird das letzte Zeichen der standardmäßigen Ausgabe gelöscht, wie bei 280. An diesem Punkt wartet die Verarbeitung im Allgemeinen, bis eine andere Eingabe erfasst wird, wie bei 284. Es wird dann festgestellt, wie bei 288, ob die neue Eingabe, die bei 284 erfasst wird, dieselbe wie die letzte Eingabe ist, die mit dem letzten Zeichen zusammenhängt, das gerade bei 280 gelöscht wurde. Wenn dem so ist, ist die standardmäßige Ausgabe 76 dieselbe wie die vorhergehende standardmäßige Ausgabe, außer dass das letzte Zeichen das entgegengesetzte Zeichen der Tastenbetätigung ist, die das letzte Zeichen erzeugt hat. Dann geht die Verarbeitung weiter zu 292, wo Lernen-Daten, d. h. das Wortobjekt 108 und das zugehörige Häufigkeitsobjekt 104, die zu der vorhergehenden standardmäßigen Ausgabe 76 gehören, sowie das Wortobjekt 108 und das zugehörige Häufigkeitsobjekt 104, die zu der neuen standardmäßigen Ausgabe 76 gehören, in dem temporären Lernen-Datenregister gespeichert werden und die Markierung gesetzt wird. Solch eine Tastenfolge, d. h. eine Eingabe, die <DELETE>-Taste 86 und die gleiche Eingabe wie zuvor, ist eine Umschalt-Eingabe. Solch eine Umschalt-Eingabe ersetzt das standardmäßige letzte Zeichen mit einem entgegengesetzten letzten Zeichen der Taste 28, die das letzte Zeichen 48 der standardmäßigen Ausgabe 76 erzeugte. Die Umschalt-Eingabe wird als eine Auswahl-Eingabe behandelt für Zwecke der Blockierung bzw. Sperrung der standardmäßigen Ausgabe 76 für die aktuelle Sitzung und löst auch die Markierung aus, welche die Lernen-Funktion bei Erfassung einer Delimiter-Eingabe bei 260 initiiert.
Wenn es sich jedoch erweist, dass das System bei 288 erfasst, dass die neue Eingabe, die bei 284 erfasst wird, unterschiedlich als die Eingabe unmittelbar vor der Erfassung der <DELETE>-Taste 86 ist, fährt die Verarbeitung bei 212 fort, wo bestimmt wird, ob die Eingabe entweder eine Bedieneingabe oder eine Eingabe einer Taste ist, die ein oder mehrere Zeichen 48 hat, und die Verarbeitung fährt danach fort.
Es wird auch angemerkt, dass, wenn der Hauptprozess das Ausgabestadium bei 248 erreicht, ein zusätzlicher Prozess initiiert wird, der feststellt, ob die Varianten-Komponente 72 der Ausgabe 64 initiiert werden soll. Eine Verarbeitung der zusätzlichen Funktion wird initiiert von 250 an dem Element 504 der 6. Zuerst gibt das Verfahren bei 508 die Textkomponente 68 der Ausgabe 64 an die Anzeige 60 aus. Eine weitere Verarbeitung stellt fest, ob die Varianten-Komponente 72 angezeigt werden soll oder nicht.
Spezifisch wird festgestellt, wie bei 512, ob die Varianten-Komponente 72 bereits während der aktuellen Sitzung angezeigt wurde. Wenn die Varianten-Komponente 72 bereits angezeigt wurde, geht die Verarbeitung bei 516 weiter, wo die neue Varianten-Komponente 72 angezeigt wird, die aus dem aktuellen Disambiguierungszyklus in der aktuellen Sitzung resultiert. Die Verarbeitung kehrt dann zu einem Beendigungspunkt bei 520 zurück, danach kehrt die Verarbeitung zu dem Hauptprozess bei 204 zurück. Wenn jedoch bei 512 festgestellt wird, dass die Varianten-Komponente 72 noch nicht während der aktuellen Sitzung angezeigt wurde, geht die Verarbeitung weiter, wie bei 524, um festzustellen, ob die vergangene Zeit zwischen der aktuellen Eingabe und der unmittelbar vorhergehenden Eingabe langer als eine vorgegebene Dauer ist. Wenn sie länger ist, dann geht die Verarbeitung bei 516 weiter, wo die Varianten-Komponente 72 angezeigt wird, und die Verarbeitung kehrt, durch 520, zu dem Hauptprozess zurück, wie bei 204. Wenn jedoch bei 524 festgestellt wird, dass die vergangene Zeit zwischen der aktuellen Eingabe und der unmittelbar vorhergehenden Eingabe kürzer als die vorgegebene Dauer ist, wird die Varianten-Komponente 72 nicht angezeigt, und die Verarbeitung kehrt zu dem Beendigungspunkt bei 520 zurück, danach kehrt die Verarbeitung zu dem Hauptprozess zurück, wie bei 204.
Vorteilhafterweise wird folglich, wenn ein Benutzer Tastenanschläge relativ schnell eingibt, die Varianten-Komponente 72 nicht an die Anzeige 60 ausgegeben, wo sie ansonsten wahrscheinlich eine visuelle Ablenkung für einen Benutzer verursachen würde, der versucht, Tastenanschläge schnell einzugeben. Wenn jederzeit während einer gegebenen Sitzung die Varianten-Komponente 72 an die Anzeige 60 ausgegeben wird, wie wenn die Zeit zwischen aufeinander folgenden Eingaben die vorgegebene Dauer übersteigt, wird die Varianten-Komponente 72 weiterhin während dieser Sitzung angezeigt. Bei der Initiierung einer neuen Sitzung wird jedoch die Varianten-Komponente 72 von der Anzeige zurückgehalten, wenn der Benutzer konsistent Tastenanschläge relativ schnell eingibt.
Eine beispielhafte Eingabe-Sequenz wird in den 1 und 7–11 dargestellt. In diesem Beispiel versucht der Benutzer, das Wort „APPLOADER" einzugeben, und dieses Wort ist momentan nicht in dem Speicher 20 gespeichert. In 1 hat der Benutzer bereits die „AS"-Taste 28 eingegeben. Da die Datentabellen in dem Speicher 20 entsprechend zwei-Buchstaben-Präfixen organisiert sind, werden die Inhalte der Ausgabe 64 nach dem ersten Tastenanschlag von den N-Gramm-Objekten 112 in dem Speicher erlangt. Der erste Tastenanschlag „AS" entspricht einem ersten N-Gramm-Objekt 112 „S" und einem zugehörigen Häufigkeitsobjekt 104, sowie einem anderen N-Gramm-Objekt 112 „A" und einem zugehörigen Häufigkeitsobjekt 104. Während das Häufigkeitsobjekt 104, das zu „S" gehört, einen Häufigkeitswert hat, der größer ist als der des Häufigkeitsobjektes 104, das zu „A" gehört, wird angemerkt, dass „A" selbst ein vollständiges Wort ist. Ein vollständiges Wort wird immer als die standardmäßige Ausgabe 76 gegenüber anderer Präfixobjekte geliefert, die nicht mit vollständigen Wörtern übereinstimmen, unabhängig eines zugehörigen Häufigkeitswerts. Somit ist in der 1 der Standard-Teil 76 der Ausgabe 64 „A".
In der 7 hat der Benutzer zusätzlich die „OP"-Taste 28 eingegeben. Die Varianten werden in der 7 dargestellt. Da das Präfixobjekt „SO" auch ein Wort ist, wird es als die standardmäßige Ausgabe 76 geliefert. In der 8 hat der Benutzer wieder die „OP"-Taste 28 eingegeben und hat auch die „L"-Taste 28 eingegeben. Es wird angemerkt, dass die beispielhafte „L"-Taste 28, die hier dargestellt wird, nur das einzelne Zeichen 48 „L" umfasst.
Es wird in dem vorliegenden Beispiel angenommen, dass keine Bedieneingaben bis jetzt erfasst wurden. Die standardmäßige Ausgabe 76 ist „APPL", wie dem Wort „APPLE" entsprechen würde. Das Präfix „APPL" wird sowohl in der Textkomponente 68 sowie in dem Standard-Teil 76 der Varianten-Komponente 72 dargestellt. Verschiedene Präfixobjekte in dem Varianten-Teil 80 umfassen „APOL", wie dem Wort „APOLOGIZE" entsprechen würde, und das Präfix „SPOL", das dem Wort „SPOLIATION" entsprechen würde.
Es wird insbesondere angemerkt, dass die zusätzlichen Varianten „AOOL", „AOPL", „SOPL" und „SOOL" auch als Varianten 80 in der Varianten-Komponente 72 dargestellt werden. Da kein Wortobjekt 108 diesen Präfixobjekten entspricht, werden die Präfixobjekte als verwaiste Präfixobjekte betrachtet, für die kein entsprechendes Wortobjekt 108 identifiziert wurde. In dieser Hinsicht kann es für die Varianten-Komponente 72 wünschenswert sein, eine spezifische Quantität von Eintragungen zu umfassen, und im Falle des vorliegenden beispielhaften Ausführungsbeispiels ist die Quantität sieben Eintragungen. Nach dem Erlangen des Resultats bei 224, wenn die Quantität von Präfixobjekten in dem Resultat weniger ist als die vorgegebene Quantität, versucht die Disambiguierungsfunktion, zusätzliche Ausgaben zu liefern, bis die vorgegebene Anzahl von Ausgaben geliefert ist. In Ermangelung der künstlichen Varianten, die erzeugt werden, werden die zusätzlichen Varianten-Eintragungen von verwaisten Präfixobjekten geliefert. Es wird jedoch angemerkt, dass, wenn künstliche Varianten erzeugt wurden, sie wahrscheinlich einen Ort der Präferenz gegenüber derartiger verwaister Präfixobjekte besetzt haben, und möglicherweise auch gegenüber den Präfixobjekten des Resultats.
Es wird weiter angemerkt, dass derartige verwaiste Präfixobjekte verwaiste Nachkommen-Präfixobjekte von suspendierten verwaisten Eltern-Präfixobjekten und/oder künstlichen Varianten sein können. Derartige verwaiste Nachkommen- Präfixobjekte können wiederum ausgegeben werden abhängig von einer Häufigkeitsklassifizierung, wie unten erklärt, oder anderweitig geordnet.
Die verwaisten Präfixobjekte werden in der Reihenfolge einer absteigenden Häufigkeit unter Verwendung der N-Gramm-Objekte 112 und der zugehörigen Häufigkeitsobjekte 104 geordnet. Da die verwaisten Präfixobjekte kein entsprechendes Wortobjekt 108 mit einem zugehörigen Häufigkeitsobjekt 104 haben, müssen die Häufigkeitsobjekte 104, die mit den verschiedenen N-Gramm-Objekten 112 verbunden sind, als ein Ersatz eingesetzt werden.
Unter Verwendung der N-Gramm-Objekte 112 versucht die Disambiguierungsfunktion zuerst, festzustellen, ob ein N-Gramm-Objekt 112, das zum Beispiel drei Zeichen hat, eine Übereinstimmung für zum Beispiel die letzten drei Zeichen eines verwaisten Präfixobjektes ist. Das Beispiel von drei Zeichen wird gegeben, da das beispielhafte Ausführungsbeispiel der tragbaren elektronischen Vorrichtung 4 N-Gramm-Objekte 112 umfasst, die ein beispielhaftes Maximum der drei Zeichen in der Länge sind, aber es ist offensichtlich, dass, wenn der Speicher 20 N-Gramm-Objekte mit vier Zeichen in der Länge oder länger umfasst, die Disambiguierungsfunktion typischerweise zuerst versucht, festzustellen, ob ein N-Gramm-Objekt mit der größten Länge in dem Speicher 20 mit der gleichen Quantität von Zeichen am Ende eines verwaisten Präfixobjektes übereinstimmt.
Wenn nur ein Präfixobjekt auf solch eine Art und Weise einem N-Gramm-Objekt 112 mit drei Zeichen entspricht, wird ein derartiges verwaistes Präfixobjekt zuerst unter den verschiedenen verwaisten Präfixobjekten in der Varianten-Ausgabe 80 verzeichnet. Wenn zusätzliche verwaiste Präfixobjekte mit N-Gramm-Objekten 112 mit drei Zeichen übereinstimmen, dann werden die Häufigkeitsobjekte 104, die zu derartigen identifizierten N-Gramm-Objekten 112 gehören, analysiert und die übereinstimmenden verwaisten Präfixobjekte werden unter sich selbst in der Reihenfolge einer abnehmenden Häufigkeit geordnet.
Wenn festgestellt wird, dass keine Übereinstimmung mit einem N-Gramm-Objekt 112 mit drei Zeichen erlangt werden kann, dann werden N-Gramm-Objekte 112 mit zwei Zeichen eingesetzt. Da der Speicher 20 alle Permutationen von N-Gramm-Objekten 112 mit zwei Zeichen umfasst, können zwei letzte Zeichen jedes verwaisten Präfixobjekts mit einem entsprechenden N-Gramm-Objekt 112 mit zwei Zeichen abgeglichen werden. Nachdem derartige Übereinstimmungen erzielt wurden, werden die Häufigkeitsobjekte 104, die zu derartigen identifizierten N-Gramm-Objekten 112 gehören, analysiert und die verwaisten Präfixobjekte werden unter sich selbst in absteigender Folge des Häufigkeitswertes der Häufigkeitsobjekte 104 geordnet, die zu den identifizierten N-Gramm-Objekten 112 gehörten. Es wird weiter angemerkt, dass künstliche Varianten ähnlich unter sich selbst angeordnet werden können unter Verwendung der N-Gramm-Objekte 112 und der zugehörigen Häufigkeitsobjekte 104.
In der 9 hat der Benutzer zusätzlich die „OP"-Taste 28 eingegeben. Unter diesem Umstand und wie in 9 zu sehen ist, wurde der Standard-Teil 76 der Ausgabe 64 das Präfixobjekt „APOLO", wie es dem Wort „APOLOGIZE" entsprechen würde, während unmittelbar vor der aktuellen Eingabe der Standard-Teil 76 der Ausgabe 64 der 8 „APPL" war, wie dem Wort „APPLE" entsprechen würde. Wieder unter der Annahme, dass keine Bedieneingaben erfasst wurden, entspricht das standardmäßige Präfixobjekt in der 9 nicht dem vorhergehenden standardmäßigen Präfixobjekt der 8. Somit wird die erste künstliche Variante „APOLP" erzeugt und dieser wird in dem aktuellen Beispiel eine bevorzugte Position gegeben. Die oben angeführte künstliche Variante „APOLP" wird erzeugt durch Löschen des letzten Zeichens des Standard-Präfixobjekts „APOLO" und durch Liefern stattdessen eines entgegengesetzten Zeichens 48 der Taste 28, die das letzte Zeichen des Standard-Teils 76 der Ausgabe 64 erzeugte, was in dem aktuellen Beispiel der 9 „P" ist, so dass die oben angeführte künstliche Variante „APOLP" ist.
Ferner, da die vorhergehende Standard-Ausgabe „APPL" einem Wortobjekt 108 entsprach, wie dem Wortobjekt 108, das dem Wort „APPLE" entspricht, und da mit der Hinzufügung der aktuellen Eingabe die vorhergehende Standard-Ausgabe „APPL" nicht länger einem Wortobjekt 108 entspricht, werden zwei zusätzliche künstliche Varianten erzeugt. Eine künstliche Variante ist „APPLP" und die andere künstliche Variante ist „APPLO", und diese entsprechen der vorhergehenden standardmäßigen Ausgabe „APPL" plus den Zeichen 48 der Taste 28, die betätigt wurde, um die aktuelle Eingabe zu erzeugen. Diese künstlichen Varianten werden ähnlich als Teil des Varianten-Teils 80 der Ausgabe 64 ausgegeben.
Wie in 9 gesehen werden kann, scheint der Standard-Teil 76 der Ausgabe 64 „APOLO" nicht langer mit dem übereinzustimmen, was als ein Präfix für „APPLOADER" benötigt würde, und der Benutzer erwartet wahrscheinlich, dass das gewünschte Wort „APPLOADER" noch nicht in dem Speicher 20 gespeichert ist. Somit liefert der Benutzer eine Auswahl-Eingabe, wie durch Scrollen mit dem Thumbwheel 32 oder durch Betätigen der <NEXT>-Taste 40, bis der Varianten-String „APPLO" hervorgehoben ist. Der Benutzer fährt dann mit der Eingabe fort und gibt die „AS"-Taste ein.
Die Ausgabe 64 einer solchen Aktion wird in der 10 dargestellt. Hier ist der String „APPLOA" der Standard-Teil 76 der Ausgabe 64. Da der Varianten-String „APPLO" der Standard-Teil 76 der Ausgabe 64 (nicht ausdrücklich hierin dargestellt) als ein Resultat der Auswahl-Eingabe wurde hinsichtlich des Varianten-Strings „APPLO" und da der Varianten-String „APPLO" nicht einem Wortobjekt 108 entspricht, wurden die Zeichen-Strings „APPLOA" und „APPLOS" als künstliche Varianten erzeugt. Zusätzlich, da der vorhergehende Standard der 9, „APOLO", vorher einem Wortobjekt 108 entsprochen hat, aber jetzt nicht länger dem Standard-Teil 76 der Ausgabe 64 der 10 entspricht, wurden auch die zusätzlichen künstlichen Varianten von „APOLOA" und „APOLOS” erzeugt. Derartigen künstlichen Varianten wird eine bevorzugte Position gegenüber den drei angezeigten verwaisten Präfixobjekten gegeben.
Da die aktuelle Eingabe-Sequenz in dem Beispiel nicht mehr einem Wortobjekt 108 entspricht, werden die Teile des Verfahrens, die den Versuch betreffen, entsprechende Wortobjekte 108 zu finden, nicht mit weiteren Eingaben für die aktuelle Sitzung ausgeführt. Das heißt, da kein Wortobjekt 108 der aktuellen Eingabe-Sequenz entspricht, entsprechen weitere Eingaben ebenfalls keinem Wortobjekt 108. Ein Vermeiden der Suche des Speichers 20 nach derartigen nicht existierenden Wortobjekten 108 spart Zeit und vermeidet vergeudete Verarbeitungsbemühungen.
Da der Benutzer zu schreiben fortfährt, gibt der Benutzer schließlich erfolgreich das Wort „APPLOADER" ein und gibt eine Delimiter-Eingabe ein. Bei Erfassen der Delimiter-Eingabe nach der Eingabe von „APPLOADER", wird die Lernen-Funktion initiiert. Da das Wort „APPLOADER" nicht einem Wortobjekt 108 in dem Speicher 20 entspricht, wird ein neues Wortobjekt 108 erzeugt, das „APPLOADER" entspricht, und wird in der „neue Wörter"-Datenbank 92 gespeichert, zusammen mit einem entsprechenden neuen Häufigkeitsobjekt 104, dem eine absolute Häufigkeit beispielsweise in dem oberen Drittel oder Viertel des möglichen Häufigkeitsbereichs gegeben wird. In dieser Hinsicht wird angemerkt, dass die „neue Wörter"-Datenbank 92 und die Häufigkeits-Lernen-Datenbank 96 im Allgemeinen in zwei-Zeichen-Präfix-Datentabellen organisiert sind, die denen ähnlich sind, die in der generischen Wortliste 88 zu finden sind. Somit wird dem neuen Häufigkeitsobjekt 104 zuerst ein absoluter Häufigkeitswert zugewiesen, aber bei Speicherung wird der absolute Häufigkeitswert, wenn es nicht der Maximalwert in dieser Datentabelle ist, geändert, um einen normalisierten Häufig keitswert-Prozentsatz zu umfassen, normalisiert auf das, was der maximale Häufigkeitswert in dieser Datentabelle ist.
Als ein nachfolgendes Beispiel in der 11 versucht der Benutzer, das Wort „APOLOGIZE" einzugeben. Der Benutzer hat die Tastenfolge „AS" „OP" „OP" „L" „OP" eingegeben. Da „APPLOADER" jetzt als ein Wortobjekt 108 zu der „neue Wörter"-Datenbank 92 hinzugefügt wurde und einem Häufigkeitsobjekt 104 zugeteilt wurde, das einen relativ hohen Häufigkeitswert hat, wird das Präfixobjekt „APPLO", das „APPLOADER" entspricht, angezeigt als der Standard-Teil 76 der Ausgabe 64 gegenüber dem Varianten-Präfixobjekt „APOLO", das dem gewünschten Wort „APOLOGIZE" entspricht. Da das Wort „APOLOGIZE" einem Wortobjekt 108 entspricht, das zumindest in der generischen Wortliste 88 gespeichert ist, kann der Benutzer einfach fortfahren, Tastenanschläge einzugeben, die den zusätzlichen Buchstaben „GIZE" entsprechen, welche die Buchstaben in dem Wort „APOLOGIZE" sind, die dem Präfixobjekt „APOLO" folgen, um das Wort „APOLOGIZE" zu erhalten. Alternativ kann der Benutzer, wenn er die Ausgabe 64 sieht, die in der 11 dargestellt wird, eine Auswahl-Eingabe eingeben, um positiv das Varianten-Präfixobjekt „APOLO" zu wählen. In einem solchen Umstand wird die Lernen-Funktion ausgelöst bei Erfassung eines Delimiter-Symbols, und das Wortobjekt 108, das dem Zeichen-String „APOLO" zu dem Zeitpunkt entsprochen hat, an dem die Auswahl-Eingabe gemacht wurde, wird in der Häufigkeits-Lernen-Datenbank 92 gespeichert und wird einem revidierten Häufigkeitsobjekt 104 zugeordnet, das einen relativ höheren Häufigkeitswert hat, das ähnlich in der Häufigkeits-Lernen-Datenbank 92 gespeichert wird.
Eine zusätzliches Merkmal der tragbaren elektronischen Vorrichtung 4 wird allgemein in der 12 dargestellt. Unter einigen Umständen ist es wünschenswert, dass die Disambiguierungsfunktion deaktiviert wird. Zum Beispiel, wenn gewünscht wird, ein Passwort einzugeben, ist eine Disambiguierung typischerweise relativ lästiger als während einer herkömmlichen Texteingabe. Somit, wenn der Systemfokus auf der Komponente ist, die dem Passwortfeld entspricht, zeigt die Komponente der API an, dass eine spezielle Verarbeitung verlangt wird, und die API deaktiviert die Disambiguierungsfunktion und aktiviert stattdessen zum Beispiel ein Mehrfach-Tippen-Eingabe-Interpretationssystem. Alternativ können andere Eingabe-Interpretationssysteme ein Chording-System umfassen oder ein Drücken-und-Halten/Drücken-und-Freigabe-Interpretationssystem. Somit kann, während eine Eingabe, wenn die Disambiguierungsfunktion aktiv ist, eine vieldeutige Eingabe ist, durch Aktivieren des alternativen Interpretationssystems, wie das beispielhafte Mehrfach-Tippen-System, jede Eingabe zum großen Teil eindeutig sein.
Wie aus der 12 zu sehen ist, wird jede eindeutige Eingabe während eines sehr kurzen Zeitabschnitts in dem Passwortfeld 120 angezeigt und wird dann ersetzt mit einer anderen Ausgabe, wie dem Sternchen. Das Zeichen „R" wird angezeigt gezeigt, wobei offensichtlich ist, dass eine derartige Anzeige nur während eines sehr kurzen Zeitabschnitts ist.
Wie in den 1 und 7–11 gesehen werden kann, umfasst die Ausgabe 64 die angezeigte Grafik 46 nahe dem unteren Ende der Varianten-Komponente 72, und dass die angezeigte Grafik 46 sehr ähnlich zu der Grafik 42 der <NEXT>-Taste 40 ist. Eine derartige Darstellung liefert eine Anzeige an den Benutzer, welche der Tasten 28 des Tastaturfelds 24 gedrückt werden können, um eine Varianten-Ausgabe zu wählen. Die Darstellung der angezeigten Grafik 46 liefert eine Verbindung zwischen der Ausgabe 64 und der <NEXT>-Taste 40 in dem Speicher des Benutzers. Zusätzlich, wenn der Benutzer die <NEXT>-Taste 40 einsetzt, um eine Auswahl-Eingabe zu liefern, kann der Benutzer die <NEXT>-Taste 40 betätigen, ohne die Hände des Benutzers weg von der Position zu bewegen, welche die Hände inne hatten in Bezug auf das Gehäuse 6 während der Texteingabe, was nicht-notwendige Handbewegungen reduziert, die erforderlich sind, wenn ein Be nutzer eine Hand bewegen muss, um das Thumbwheel 32 zu betätigen. Dies spart Zeit und Mühe.
Es wird auch angemerkt, dass das System das Bestehen bestimmter vordefinierter Symbole als Delimiter-Signale erfassen kann, wenn kein Wortobjekt 108 dem Texteintrag entspricht, der das Symbol umfasst. Wenn zum Beispiel der Benutzer wünscht, die Eingabe „one-off" einzugeben, kann der Benutzer beginnen durch Eingabe der Tastenfolge „OP" „BN" „ER" „ZX" „OP", wobei die „ZX"-Betätigung sich auf das Bindestrichsymbol beziehen soll, das darauf angeordnet ist. Alternativ, statt des Tippens der „ZX"-Taste kann der Benutzer einen <ALT>-Eintrag betätigen, um den Bindestrich eindeutig anzuzeigen.
Unter der Annahme, dass der Speicher 20 nicht bereits ein Wortobjekt 108 von „one-off" umfasst, erfasst die Disambiguierungsfunktion den Bindestrich als eine Delimiter-Eingabe. Somit werden die Tasteneintragungen, die der Delimiter-Eingabe vorangehen, von den Tasteneintragungen abgegrenzt, die auf die Delimiter-Eingabe folgen. Somit wird die gewünschte Eingabe als zwei getrennte Wörter gesucht, d. h. „ONE" und „OFF" mit dem Bindestrich dazwischen. Dies erleichtert eine Verarbeitung durch eine engere Identifizierung, was gesucht werden soll.
Die tragbare elektronische Vorrichtung 4 kann auch konfiguriert sein, um vorgeschlagene Kompositum-Lösungen für eine vieldeutige Eingabe zu identifizieren und vorzusehen. Zum Beispiel kann ein Benutzer versuchen, das Wort „highschool" einzugeben, von dem gesagt werden kann, dass es ein zusammengesetzter Sprachausdruck (Kompositum) ist, der die Wörter „high" und „school" aufweist. Wenn angenommen wird, dass das Wort „highschool" nicht bereits als ein Sprachobjekt 100 in dem Speicher 20 gespeichert ist, kann die tragbare elektronische Vorrichtung 4 auf Schwierigkeiten treffen beim Versuch, solch eine vieldeutige Eingabe zu disambiguieren. Vorteilhafterweise ist folglich die tragbare elekt ronische Vorrichtung 4 konfiguriert, Kompositum-Lösungen unter bestimmten Umständen zu suchen.
Allgemein ausgedrückt, versucht die tragbare elektronische Vorrichtung 4, an einer Position mit einer relativ höheren Priorität, d. h. am Anfang einer Liste, eine oder mehrere vorgeschlagene Ausgabe(n) zu identifizieren und auszugeben, die repräsentativ sind für zumindest einen Teil eines Sprachobjekts 100, der einer vieldeutigen Eingabe in ihrer Gesamtheit entspricht. Das heißt Einzelwort-Lösungen werden als bevorzugt betrachtet gegenüber Kompositum-Lösungen. Jedoch können Kompositum-Lösungen identifiziert und ausgegeben werden als Lösungen, die relativ weniger bevorzugt sind als Einzelwort-Lösungen, die aber mehr bevorzugt sind als Lösungen, die künstliche Varianten umfassen. Auf beispielhafte Weise kann folglich die tragbare elektronische Vorrichtung 4, als Reaktion auf eine vieldeutige Eingabe, eine Ausgabe vorsehen, die eine Vielzahl von Lösungen aufweist, mit einer Anzahl von Lösungen, die Einzelwort-Lösungen entsprechen und an einer Position mit höchster Priorität ausgegeben werden, wobei eine Anzahl von Kompositum-Lösungen an einer Position mit relativ gemäßigter Priorität ausgegeben wird, und wobei eine Anzahl von Lösungen auf künstlichen Varianten basieren, die an einer Position einer relativ niedrigen Priorität ausgegeben werden. Die Quantität von Resultaten kann angepasst werden basierend auf Benutzerpräferenz und kann folglich weniger als alle Resultate umfassen, die oben erwähnt werden.
Es wird angemerkt, dass eine Kompositum-Lösung typischerweise repräsentativ ist für zwei oder mehr Sprachobjekte 100, was bedeutet, dass Kompositum-Lösungen repräsentativ sein können für ein Paar von Sprachobjekten 100 und/oder repräsentativ sein können für drei oder mehr Sprachobjekte 100. Zu Zwecken der Einfachheit bei der Darstellung einiger der Aspekte des offenbarten und beanspruchten Konzepts, wird ein erster Satz von Beispielen, die unten dargestellt werden, hinsichtlich Kompositum-Lösungen beschrieben, die repräsenta tiv sind für zwei Sprachobjekte 100. Wie detaillierter unten dargelegt wird, existieren jedoch dieselben Aspekte in Kompositum-Lösungen und können aus den Kompositum-Lösungen erlangt werden, die repräsentativ sind für drei oder mehr Sprachobjekte 100.
Wie allgemein in den 13–13D dargestellt, wird eine beispielhafte vieldeutige Eingabe 607 (13) gezeigt als umfassend sieben Eingabeelementbetätigungen, die durch die umrandeten Ziffern 1 bis 7 dargestellt werden. Die Disambiguierungsroutine 22 versucht zuerst, ein oder mehrere Sprachobjekte 100 zu identifizieren, die der vieldeutigen Eingabe in ihrer Gesamtheit entsprechen. Das heißt, die Disambiguierungsroutine 22 versucht, Sprachobjekte 100 zu identifizieren, die sieben oder mehr linguistische Elemente haben und die der gesamten vieldeutigen Eingabe 607 entsprechen. Abhängig von der vieldeutigen Eingabe 607 ist es möglich, dass kein solches entsprechendes Sprachobjekt 100 in dem Speicher 20 identifiziert werden kann.
Abhängig von der vieldeutigen Eingabe 607 kann die Disambiguierungsroutine 22 zusätzlich versuchen, die vieldeutige Eingabe 607 als eine Kompositum-Eingabe zu interpretieren. In dem dargestellten beispielhaften Ausführungsbeispiel sucht die Disambiguierungsroutine 22 Kompositum-Lösungen, wenn ein Sprachobjekt 100 identifiziert wird, das einem ersten Teil der vieldeutigen Eingabe 607 entspricht und eine Länge hat, die zu der Länge des ersten Teils gleich ist. Wie hierin eingesetzt, sollen der Ausdruck „Länge" und Variationen davon breit auf eine Quantität von Elementen verweisen, aus denen ein Objekt besteht, wie die Quantität von linguistischen Elementen, aus denen ein Sprachobjekt 100 besteht.
Die Disambiguierungsroutine 22 sucht Kompositum-Lösungen als Reaktion auf eine vieldeutige Eingabe, wenn ein Anfangsteil der vieldeutigen Eingabe als derselbe wie ein Sprachobjekt 100 in dem Speicher 20 festgestellt wird. In dem hier gezeigten Beispiel beginnt solch ein „Anfangsteil" mit der ersten Eingabeelement-Betätigung der vieldeutigen Eingabe 607 und endet vor der letzten Eingabeelement-Betätigung, obgleich Variationen möglich sind.
Wenn zum Beispiel angenommen wird, dass ein Benutzer, der die vieldeutige Eingabe 607 eingibt, versucht, das Wort „highschool" einzugeben, hätte die Disambiguierungsroutine 22 bereits an verschiedenen Punkten während der Eingabe der vieldeutigen Eingabe 607 erkannt, dass verschiedene Anfangsteile der vieldeutigen Eingabe 607 verschiedenen Sprachobjekten 100 entsprechen und eine gleiche Länge haben. Wie allgemein in 13A gezeigt wird, während der Eingabe der vieldeutigen Eingabe 607, hätte die Disambiguierungsroutine 22 erkannt, dass die ersten zwei Eingabeelement-Betätigungen, nämlich <GH> und <UI>, d. h. ein erster Teil 611A, ein Anfangsteil ist, der dem Sprachobjekt 100 für „hi" und die gleiche Länge wie dieses hat. Solche Erkennung würde stattgefunden haben mit der zweiten Eingabeelement-Betätigung.
Wenn der erste Teil 611A identifiziert wurde als ein komplettes Wort darstellend, wie durch ein Sprachobjekt 100 dargestellt, würde die Disambiguierungsroutine 22 folglich versuchen, ein weiteres Sprachobjekt 100 zu identifizieren, das einem anderen Teil der vieldeutigen Eingabe 607 entspricht, nachfolgend auf den ersten Teil 611A. Es wird wiederholt, dass einige der Beispiele, die hier dargestellt werden, hinsichtlich Zweikomponenten-Kompositum-Lösungen aus Gründen der Einfachheit beschrieben werden, und in dem vorliegenden Beispiel versucht folglich die Disambiguierungsroutine 22, ein Sprachobjekt 100 zu identifizieren, das einem zweiten Teil 615A der vieldeutigen Eingabe 607 entspricht. Ein derartiger zweiter Teil 615A würde Betätigungen der Tasten 28 <GH> <GH> <AS> <CV> und <GH> nachfolgend auf den ersten Teil 611A aufweisen. Wenn angenommen wird, dass kein Sprachobjekt 100 in dem Speicher 20 gefunden werden kann, das einem solchen zweite Teil 615A entspricht, würde die Zweikomponenten-Kompositum-Lösung, die auf die Art und Weise gesucht wird, die allgemein in der 13A gezeigt wird, fehlschlagen. Es wird zur Vollständigkeit angeführt, dass eine oder mehrere Kompositum-Lösungen, die repräsentativ sind für drei oder mehr Sprachobjekte 100, potentiell für die vieldeutige Eingabe 607 gefunden werden können, aber hierin nicht gezeigt werden.
Die Disambiguierungsroutine 22 würde zusätzlich gemerkt haben, dass die ersten drei Eingabeelement-Betätigungen, d. h. <GB> <UI> <GH>, ein anderer erster Teil 611B der vieldeutigen Eingabe 607 sind, der einem Sprachobjekt 100 in dem Speicher 20 entspricht und eine gleiche Länge hat, spezifisch das Sprachobjekt 100 für das Wort „hug", wie allgemein in der 13B gezeigt wird. Die Disambiguierungsroutine 22 versucht folglich, ein Sprachobjekt 100 in dem Speicher 20 zu identifizieren, das einem zweiten Teil 615B der vieldeutigen Eingabe 607 entspricht, d. h. <GB> <AS> <CV> <GB>. Wenn angenommen wird, dass ein Sprachobjekt 100 in dem Speicher 20 für das englische Wort „hachure" existiert, interpretiert die Disambiguierungsroutine die vieldeutige Eingabe 607 als möglicherweise eine versuchte Eingabe des Kompositums „hughachure". Das heißt, eine mögliche Kompositum-Lösung für die vieldeutige Eingabe 607 würde repräsentativ sein für das Sprachobjekt 100 für „hug" und das Sprachobjekt 100 für „hachure".
Wie detaillierter unten beschrieben wird und wie in der 14 dargestellt wird, kann die tragbare elektronische Vorrichtung 4 „hughhach" als eine Darstellung 619B der Kompositum-Lösung „hughachure" ausgeben, wobei eine solche Darstellung 619B eine Darstellung des Sprachobjekts 100 für „hug" und eine Darstellung eines Teils des Sprachobjekts 100 für „hachure" aufweist. Diese Darstellung 619B wird auch schematisch in der 13B dargestellt.
Ähnlich und wie allgemein in der 13C dargestellt, erkennt die Disambiguierungsroutine 22, dass die ersten vier Eingabeelement-Betätigungen der vieldeuti gen Eingabe 607 ebenfalls ein erster Teil 611C der vieldeutigen Eingabe 607 sind, die einem Sprachobjekt 100 in dem Speicher 20 entspricht und eine gleiche Länge hat, spezifisch für das Wort „high". Die Disambiguierungsroutine 22 versucht folglich, ein Sprachobjekt 100 in dem Speicher 20 zu identifizieren, das einem zweiten Teil 615C der vieldeutigen Eingabe 607 entspricht, der dem ersten Teil 611C nachfolgt. Spezifisch bestimmt die Disambiguierungsroutine 22, dass der zweite Teil 615C, d. h. <AS> <CV> <GH>, dem Sprachobjekt 100 für das Wort „school" entspricht. Die Disambiguierungsroutine 22 kann dann zusätzlich bestimmen, dass die vieldeutige Eingabe 607 ein Versuch durch den Benutzer sein kann, das Kompositum „highschool" einzugeben, wodurch die Kompositum-Lösung „high" plus „school" erzeugt wird. Die Vorrichtung kann „highsch" als Darstellung 619C solch einer Kompositum-Lösung ausgeben. Die Darstellung 619C wird schematisch in der 13C dargestellt.
Außerdem und wie allgemein in der 13D dargestellt wird, kann die Disambiguierungsroutine 22 bestimmen, dass die ersten fünf Eingabeelement-Betätigungen einen anderen ersten Teil 611D darstellen, der dem Sprachobjekt 100 für das Wort „highs" entspricht und eine gleiche Länge hat. Die Disambiguierungsroutine versucht folglich auch, ein zweites Sprachobjekt 100 zu identifizieren, das einem zweiten Teil 615D der vieldeutigen Eingabe 607 entspricht, der dem ersten Teil 611D nachfolgt Zum Beispiel kann die Disambiguierungsroutine das Sprachobjekt 100 für das Wort „choice" identifizieren als dem zweiten Teil 615D entsprechend. Die Disambiguierungsroutine 22 würde folglich die vieldeutige Eingabe 607 als möglicherweise ein Versuch durch den Benutzer interpretieren, das Kompositum „highschoice" einzugeben durch Erzeugen der Kompositum-Lösung „highs" plus „choice". Die tragbare elektronische Vorrichtung 4 kann „highsch" als Darstellung 619D der Kompositum-Lösung „highs" plus „choice" ausgeben, wobei angemerkt werden soll, dass diese Darstellung 619D die selbe wie die Darstellung 619B ist, wobei die Darstellungen 619B und 619D folglich ausgegeben werden als eine einzelne Variante, um eine nicht wünschenswerte Verdopplung zu vermeiden.
Um die Erzeugung von Kompositum-Lösungen zu begrenzen, die eine sehr niedrige Wahrscheinlichkeit oder keine Wahrscheinlichkeit haben, das zu sein, was ein Benutzer eingeben möchte, führt die Disambiguierungsroutine 22 zusätzlich eine Analyse der Kombination der Sprachobjekte 100 durch, die eine Kompositum-Lösung bilden. Spezifisch und wie allgemein in den 13B, 13C und 13D dargestellt wird, wird zumindest ein Verbindungsobjekt 639B, 639C und 639D für jede Kompositum-Lösung erzeugt. In dem Beispiel, das dargestellt wird in den 13B, 13C und 13D, ist das Verbindungsobjekt einer Kompositum-Lösung das letzte linguistische Element des einen Sprachobjekts, gefolgt von dem ersten linguistischen Element des angrenzenden Sprachobjekts. So ist das Verbindungsobjekt 639B der Kompositum-Lösung „hug" plus „hachure" die linguistische Elementzeichenkette „hg". Ähnlich ist das Verbindungsobjekt 639C der Kompositum-Lösung „high" plus „school" die linguistische Elementzeichenkette „hs". Ähnlich ist das Verbindungsobjekt 639D der Kompositum-Lösung „highs" plus „choice" die linguistische Elementzeichenkette „sc".
Jedes Verbindungsobjekt 639B, 639C und 639D, etc., soll mit einem oder mehreren N-Gramm-Objekten 112 in dem Speicher 20 verglichen werden. Dies gibt der Disambiguierungsroutine 22 eine Gelegenheit, geeignete Schritte zu unternehmen, wenn das Verbindungsobjekt 639B, 639C und 639D, etc., eine sehr geringe Häufigkeit hat oder nicht-existent ist in der vorliegenden Sprache. In dem vorliegenden Beispiel sind die Verbindungsobjekte 639B, 639C und 639D jeweils zwei linguistische Elemente in der Länge und werden folglich jeweils mit einer Anzahl der 2-Gramm-Objekte verglichen.
Wenn ein bestimmtes Verbindungsobjekt einem N-Gramm-Objekt 112 entspricht, das zu einem Häufigkeitsobjekt 104 gehört mit einem relativ niedrigen Häufigkeitswert, wie ein Häufigkeitswert unterhalb einer vorbestimmten Schwelle, würde dies anzeigen, dass die bestimmte Kompositum-Lösung, aus der das bestimmte Verbindungsobjekt abgeleitet wurde, extrem unwahrscheinlich die Eingabe ist, die von dem Benutzer gewünscht wird. Das heißt, da der Häufigkeitswert eines Häufigkeitsobjekts 104, das zu einem N-Gramm-Objekt 112 gehört, die relative Wahrscheinlichkeit anzeigt, dass die Zeichenfolge, die durch dieses bestimmte N-Gramm-Objekt 112 dargestellt wird, an einer Position in einem Wort der relevanten Sprache existiert, zeigt die Entsprechung eines N-Gramms 112 mit niedriger Wahrscheinlichkeit mit einem Verbindungsobjekt eine Kompositum-Lösung mit niedriger Wahrscheinlichkeit an.
Ähnlich, wenn kein N-Gramm-Objekt 112 gefunden werden kann, das einem bestimmten Verbindungsobjekt entspricht, würde dies auch eine Kompositum-Lösung mit niedriger Wahrscheinlichkeit oder null Wahrscheinlichkeit anzeigen. In dem vorliegenden beispielhaften Ausführungsbeispiel hat der Speicher 20 darin alle der Zwei-Buchstaben-Permutationen der sechsundzwanzig lateinischen Buchstaben gespeichert. Somit wird in der vorliegenden beispielhaften Konfiguration ein 2-Gramm-Objekt allgemein immer identifiziert als einem Verbindungsobjekt mit einer Länge von zwei linguistischen Elementen entsprechend. Wie jedoch unten erläutert wird, kann ein Verbindungsobjekt mehr als zwei linguistische Elemente in der Länge sein und das beispielhafte Ausführungsbeispiel der tragbaren elektronischen Vorrichtung 4 hat weniger als alle Drei-Buchstaben-Permutation der sechsundzwanzig lateinischen Buchstaben. In einigen Umständen ist es folglich möglich, dass ein N-Gramm-Objekt 112 nicht gefunden werden kann, das einem bestimmten Verbindungsobjekt entspricht. Es wird auch angemerkt, dass in anderen Ausführungsbeispielen die tragbare elektronische Vorrichtung weniger als alle der Zwei-Buchstaben-Permutationen der sechsundzwanzig lateinischen Buchstaben darin gespeichert haben kann, und ein Fehlen einer N- Gramm-Entsprechung mit einem Verbindungsobjekt kann in dieser Situation genauso auftreten.
In dem vorliegenden beispielhaften Ausführungsbeispiel weist die Disambiguierungsroutine 22 einer gegebenen Kompositum-Lösung den Häufigkeitswert des N-Gramm-Objektes 112 zu, der als entsprechend dem Verbindungsobjekt der Kompositum-Lösung identifiziert wird. Wenn kein entsprechendes N-Gramm-Objekt 112 identifiziert wird, wird ein Häufigkeitswert von null zugewiesen. Die Disambiguierungsroutine 22 kann die Kompositum-Lösungen in abnehmender Reihenfolge des Häufigkeitswertes anordnen. Wenn der Häufigkeitswert einer Kompositum-Lösung null ist oder unterhalb einer vorbestimmten Schwelle ist, kann die Disambiguierungsroutine zum Beispiel die Kompositum-Lösung von einer Ausgabe unterdrücken oder kann sie an einer Position mit relativ niedriger Wahrscheinlichkeit ausgeben.
In dem vorliegenden Beispiel ist die linguistische Elementzeichenkette „gh", „hs" und „se" der Verbindungsobjekte 639B, 639C und 639D unwahrscheinlich von einer unerwünscht niedrigen Wahrscheinlichkeit und die entsprechenden Kompositum-Lösungen sollen folglich unwahrscheinlich von einer Ausgabe unterdrückt werden. Andererseits würde ein Verbindungsobjekt in Form der linguistischen Zeichenkette „qg" wahrscheinlich darin resultieren, dass die entsprechende Kompositum-Lösung unterdrückt wird oder zumindest in einer Position mit relativ niedriger Priorität ausgegeben wird.
Um die Erzeugung von Kompositum-Lösungen zu begrenzen, die eine sehr niedrige Wahrscheinlichkeit haben das zu sein, was ein Benutzer eingeben möchte, begrenzt die Disambiguierungsroutine 22 zusätzlich die Datenquellen, aus denen zweite und nachfolgende Sprachobjekte 100 einer Kompositum-Lösung identifiziert werden können. Zum Beispiel ist die generische Wortliste 88 eine Daten quelle, die im Wesentlichen unberührt ist und darin verschiedene Sprachobjekte 100 gespeichert hat. Die generische Wortliste 88 kann die Quelle von einigen der linguistischen Objekte 100 sein, aus denen eine Kompositum-Lösung besteht. Andererseits hat die „neue Wörter"-Datenbank 92 zum Beispiel darin Sprachobjekte 100 gespeichert, die für kundenspezifische Wörter repräsentativ sind, und die Inhalte der „neue Wörter"-Datenbank 92 können sich ändern. Während die „neue Wörter"-Datenbank 92 die Quelle eines ersten Sprachobjekts 100 einer Kompositum-Lösung sein kann, ist die „neue Wörter"-Datenbank 92 in dem vorliegenden beispielhaften Ausführungsbeispiel keine Quelle eins zweiten oder nachfolgenden Sprachobjekts 100 einer Kompositum-Lösung.
Es wird weiter gemerkt, dass ein Alphabet auf der tragbaren elektronischen Vorrichtung 4 alle linguistischen Elemente aufweist, die auf der tragbaren elektronischen Vorrichtung 4 verfügbar sind. Das Alphabet weist auf ein Kernalphabet und ein erweitertes Alphabet. In dem vorliegenden beispielhaften Ausführungsbeispiel besteht das Kernalphabet aus sechsundzwanzig lateinischen Buchstaben. Die Sprachobjekte in der generischen Wortliste bestehen nur aus den linguistischen Elementen des Kernalphabets. Das erweiterte Alphabet weist linguistische Elemente außer den sechsundzwanzig lateinischen Buchstaben auf. Das linguistische Element in dem erweiterten Alphabet kann somit Zeichen in nicht-lateinischen Sprachen umfassen und kann zusätzlich oder alternativ lateinische Buchstaben mit diakritischen Zeichen umfassen, wie den lateinischen Buchstaben „U" mit einem Umlaut, somit „Ü". In dieser Hinsicht kann die „neue Wörter"-Datenbank 92 ein Sprachobjekt 100 umfassen, das repräsentativ ist für das Wort „MÜNCHEN", und ein anderes Sprachobjekt 100, das repräsentativ ist für das Wort „ÜBER".
Bei der Disambiguierung einer vieldeutigen Eingabe sucht die Disambiguierungsroutine, zumindest anfangs, in allen Datenquellen auf der tragbaren elektronischen Vorrichtung 4, um Sprachobjekte 100 zu identifizieren, die der vieldeutigen Eingabe entsprechen. Wenn jedoch festgestellt wird, dass kein einziges Sprachobjekt 100 der gesamten vieldeutigen Eingabe entspricht, aber dass ein Anfangsteil der vieldeutigen Eingabe einem Sprachobjekt 100 entspricht und die gleiche Länge hat, sucht die Disambiguierungsroutine 22 nur in der generischen Wortliste 88, d. h. eine statische Datenquelle, nach Sprachobjekten 100, die Teilen der vieldeutigen Eingabe entsprechen können, die deren Anfangsteil folgen. Somit wäre es, abhängig von der vieldeutigen Eingabe, für die tragbare elektronische Vorrichtung 4 möglich, „ÜBERGENIUS" als eine Kompositum-Lösung zu identifizieren. Das heißt, das Sprachobjekt 100 für „ÜBER" kann in der „neue Wörter"-Datenbank 92 identifiziert worden sein, und das Sprachobjekt 100 für „GENIUS" kann in der generischen Wortliste 88 identifiziert worden sein. Es ist jedoch für es nicht möglich, „GOLDMÜNCHEN" als eine Kompositum-Lösung zu identifizieren, wenn ein Benutzer die Tasten <GH> <OP> <L> <DF> <M> <UI> betätigt während einer beabsichtigten Eingabe des Wortes „GOLDMINE". Das heißt, während das Sprachobjekt 100 für „GOLD" in der generischen Wortliste 88 identifiziert werden kann, würde das Sprachobjekt 100 für „MÜNCHEN" nicht als ein zweites oder nachfolgendes Wort solch einer Kompositum-Lösung identifiziert werden, da nur die generische Wortliste 88 überprüft wird bei der Suche solcher zweiten oder folgenden Wörter, und das Sprachobjekt 100 für „MÜNCHEN" in dem vorliegenden Beispiel wird in der „neue Wörter"-Datenbank 92 gespeichert.
Allgemein, als Reaktion auf eine vieldeutige Eingabe, werden alle erzeugten Kompositum-Lösungen an einer Position einer relativ niedrigeren Priorität ausgegeben als ein Sprachobjekt 100, das der gesamten vieldeutigen Eingabe entspricht. Die Kompositum-Lösungen werden selbst angeordnet und ausgegeben in abnehmender Reihenfolge der Priorität entsprechend der zunehmenden Quantität von Sprachobjekten 100 darin. Das heißt, eine Kompositum-Lösung, die aus zwei Sprachobjekten 100 besteht, wird an einer Position einer relativ höheren Priorität ausgegeben als eine Kompositum-Lösung, die aus drei Sprachobjekten 100 besteht, und so weiter.
Wenn eine Vielzahl von Kompositum-Lösungen jeweils aus der selben Quantität von Sprachobjekten 100 besteht, wie das Beispiel, das in den 13–13D dargestellt wird, wobei die Kompositum-Lösungen jeweils aus zwei Sprachobjekten 100 bestehen, wird ein Längenidentitätswert für jede derartige Kompositum-Lösung berechnet. Die Längenidentitätsberechnung hängt davon ab, ob die Kompositum-Lösung aus zwei Sprachobjekten 100 besteht oder aus drei oder mehr Sprachobjekten 100 besteht.
Wenn eine Kompositum-Lösung aus zwei Sprachobjekten 100 besteht, kann gesagt werden, dass die vieldeutige Eingabe einen ersten Teil und einen zweiten Teil umfasst. Der Unterschied bezüglich der Länge zwischen dem ersten Teil und dem zweiten Teil wird festgestellt als die Längenidentität für die Kompositum-Lösung. Auf beispielhafte Weise hat die Kompositum-Lösung der 13B eine Längenidentität mit einem Wert 1, die Kompositum-Lösung in der 13C hat auch eine Längenidentität mit einem Wert 1 und die Kompositum-Lösung in der 13D hat eine Längenidentität mit einem Wert 3.
Wenn die Kompositum-Lösung aus drei oder mehr Sprachobjekten 100 besteht, kann gesagt werden, dass die vieldeutige Eingabe drei oder mehr Teile aufweist. In solch einer Situation ist die Längenidentität der Kompositum-Lösung die Summe jedes Längenunterschieds zwischen einem gegebenen Teil der vieldeutigen Eingabe, der eine gegebene Länge hat, und dem Teil der vieldeutigen Eingabe, der die nächstgrößte Länge kürzer als die gegebene Länge hat. Zum Beispiel kann die vieldeutige Eingabe 607 der 13 zu der Erzeugung von drei Kompositum-Lösungen geführt haben, die jeweils aus drei Sprachobjekten bestehen, wie in den 13E, 13F und 13G dargelegt wird.
In der 13E ist ein erster Teil 611E der vieldeutigen Eingabe 607 drei linguistische Elemente in der Länge, ein zweiter Teil 615E ist zwei linguistische Ele mente in der Länge, und ein dritter Teil 657E ist zwei linguistische Elemente in der Länge. Der Unterschied in der Länge zwischen dem längsten Teil, d. h. der erste Teil 611E mit drei linguistischen Elemente in der Länge, und dem Teil, der die nächstgrößte Länge hat, d. h. einer der zweiten und dritten Teile 615E und 657E mit jeweils zwei linguistischen Elemente in der Länge, ist 1. Es gibt einen Null-Unterschied in der Länge zwischen den zweiten und dritten Teilen 615E und 657E. So ist 1 plus null gleich 1 und der berechnete Wert der Längenidentität für die Kompositum-Lösung ist 1, wobei eine Darstellung eines Teils schematisch mit der Ziffer 619E dargestellt wird.
Es wird angemerkt, dass die 13E ein erstes Verbindungsobjekt 639E und ein zweites Verbindungsobjekt 659E darstellt, erzeugt für die Kompositum-Lösung davon. Wenn eines der Verbindungsobjekte 639E und 659E einem N-Gramm 112 entspricht, das zu einem Häufigkeitsobjekt 104 gehört, das einen Häufigkeitswert unterhalb einer vorbestimmten Schwelle hat, oder wenn kein entsprechendes N-Gramm 112 gefunden werden kann für eines der Verbindungsobjekte 639E und 659E, wird die Kompositum-Lösung wahrscheinlich unterdrückt und nicht ausgegeben.
In der 13F ist ein erster Teil 611F der vieldeutigen Eingabe 607 drei linguistische Elemente in der Länge, ein zweiter Teil 615F ist drei linguistische Elemente in der Länge, und ein dritter Teil 657F ist ein linguistisches Element in der Länge. Es gibt keinen Unterschied in der Länge zwischen den ersten und zweiten Teilen 611F und 615F, die jeweils die längsten Teile sind. Der Unterschied in der Länge zwischen einem der längsten Teile, d. h. den ersten und zweiten Teilen 611F und 615F, die jeweils drei linguistischen Elemente in der Länge sind, und dem Teil, der die nächstgrößte Länge hat, d. h. der dritte Teil 657F mit einem linguistischen Element, ist 2. Somit ist null plus 2 gleich 2 und der berechnete Wert der Längenidentität für die Kompositum-Lösung, wobei eine Darstellung eines Teils davon schematisch mit der Ziffer 619F dargestellt wird, ist 2.
In der 13G ist ein erster Teil 611G der vieldeutigen Eingabe 607 zwei linguistische Elemente in der Länge, ein zweiter Teil 615G ist vier linguistische Elemente in der Länge, und ein dritter Teil 657G ist ein linguistisches Element in der Länge. Der Unterschied in der Länge zwischen dem längsten Teil, d. h. dem zweiten Teil 615F mit vier linguistischen Elemente in der Länge, und dem Teil, der die nächstgrößte Länge kürzer als diese Länge hat, d. h. der erste Teil 611G mit einer Länge von zwei linguistischen Elementen, ist 2. Der Unterschied in der Länge zwischen dem ersten Teil 611F mit zwei linguistischen Elemente in der Länge und dem Teil, der die nächstgrößte Länge kürzer als diese Länge hat, d. h. der dritte Teil 657F mit einem linguistischen Element in der Länge, ist 1. Somit ist 2 plus 1 gleich 3, und der berechnete Wert der Längenidentität für die Kompositum-Lösung, wobei eine Darstellung eines Teils davon schematisch mit der Ziffer 619G dargestellt wird, ist 3.
Die Vielzahl der Kompositum-Lösungen, die jeweils bestehen aus der selben Quantität von Sprachobjekten 100, werden dann in Bezug zueinander in abnehmender Reihenfolge der Priorität entsprechend dem zunehmenden berechneten Wert der Längenidentität ausgegeben. Es wird angemerkt, dass gesagt werden kann, dass die Kompositum-Lösungen einen progressiv geringeren „Grad" einer „Längenidentität" haben, wenn die berechnete Längenidentität im Wert zunimmt.
Wenn eine Vielzahl der Kompositum-Lösungen, die aus der gleichen Quantität von Sprachobjekten 100 bestehen, zusätzlich den gleichen berechneten Längenidentitätswert haben, wird diesen Kompositum-Lösungen ein Kompositum-Häufigkeitswert zugewiesen. Der Kompositum-Häufigkeitswert einer Kompositum-Lösung ist, in dem vorliegenden Beispiel, ein Durchschnitt der Häufigkeitswerte der Häufigkeitsobjekte 104, die zu den Sprachobjekten 100 der Kompositum-Lösung gehören. Alternativ kann der Kompositum-Häufigkeitswert als der Häufigkeitswert des letzten Sprachobjekts 100 der Kompositum-Lösung definiert werden oder kann alternativ in anderen geeigneten Weisen definiert werden. Unabhängig von der spezifischen Weise, wie ein Kompositum-Häufigkeitswert festgestellt wird, werden solche Kompositum-Lösungen in Bezug zueinander in abnehmender Reihenfolge der Priorität entsprechend dem abnehmenden Kompositum-Häufigkeitswert ausgegeben.
In dieser Hinsicht wird angemerkt, dass dieser Kompositum-Häufigkeitswert anders ist als der Häufigkeitswert, der zu der Kompositum-Lösung gehört, als ein Resultat eines Vergleichs eines Verbindungsobjekts davon mit den N-Gramm-Objekten 112. Eine Kompositum-Lösung, die aus drei oder mehr Sprachobjekten 100 besteht, hat eine Vielzahl von dafür erzeugten Verbindungsobjekten, zum Beispiel. Wenn eines der Verbindungsobjekte einer Kompositum-Lösung eine Wahrscheinlichkeit von null oder eine Wahrscheinlichkeit unterhalb einer vorbestimmten Schwelle anzeigt, wird in dem vorliegenden beispielhaften Ausführungsbeispiel eine solche Kompositum-Lösung unwahrscheinlich überhaupt ausgegeben und folglich nicht in Betracht gezogen bei der Anordnung von Darstellungen der Kompositum-Lösungen in einer Prioritätsreihenfolge zur Ausgabe.
In dem Beispiel der 13–13D hat die Disambiguierungsroutine 22 festgestellt, dass kein Sprachobjekt 100 der gesamten vieldeutigen Eingabe 607 entspricht, hat aber festgestellt, dass die vieldeutige Eingabe 607 einen Versuch durch den Benutzer darstellen könnte, eine von drei möglichen Komposita einzugeben, wobei jedes Kompositum aus zwei Sprachobjekten 100 besteht. Es wird angemerkt, dass das Beispiel der 13E–13G nicht weiter betrachtet wird. Die Disambiguierungsroutine 22 gibt folglich zumindest einige der möglichen Kompositum-Lösungen aus, wie allgemein in der 14 gezeigt wird.
Die verschiedenen Kompositum-Lösungen der 13B–13D, die jeweils aus zwei Sprachobjekten 100 bestehen, werden in einer Reihenfolge entsprechend dem Algorithmus ausgegeben, der oben beschrieben wird. Alle Lösungen, die aus einem einzelnen Sprachobjekt 100 entsprechend der gesamten vieldeutigen Eingabe 607 resultieren, werden an einer Position der relativ höchsten Priorität in der Reihenfolge eines abnehmenden Häufigkeitswertes ausgegeben. In dem vorliegenden Beispiel wurden keine solchen einzelnen Sprachobjekte 100 gefunden, die der vieldeutigen Eingabe 607 entsprechen.
Darstellungen von verschiedenen Kompositum-Lösungen der 13B–13D, die jeweils aus zwei Sprachobjekten 100 bestehen, werden entsprechend einem abnehmenden Grad der Längenidentität ausgegeben. Das heißt, wie oben erwähnt, die Kompositum-Lösungen werden in der Reihenfolge eines zunehmenden berechneten Wertes der Längenidentität ausgegeben. In dem vorliegenden Beispiel werden Darstellungen der Kompositum-Lösungen der 13B und 13C jeweils an einer Position der relativ höheren Priorität ausgegeben als die Kompositum-Lösung der 13D.
Es wird jedoch angemerkt, dass die Kompositum-Lösungen von den 13B und 13C beide eine Längenidentität mit einem Wert von 1 haben. Die Kompositum-Lösungen, die den gleichen Längenidentitätswert haben, werden folglich unter sich selbst entsprechend dem verringerten Kompositum-Häufigkeitswert ausgegeben.
Wenn zum Beispiel angenommen wird, dass der Häufigkeitswert des Sprachobjekts 100 für „hug" 25,000 ist und dass der Häufigkeitswert des Sprachobjekts 100 für „hachure" 2000 ist, werden die zwei Häufigkeitswerte summiert und durch zwei geteilt, um einen Kompositum-Häufigkeitswert von 13,500 für die Kompositum-Lösung der 13B zu erlangen. Wenn weiter angenommen wird, dass der Häufigkeitswert des Sprachobjekts 100 für „high" 26,000 ist und dass der Häufigkeitswert des Sprachobjekts 100 für „school" 14,000 ist, werden die zwei Häufigkeitswerte summiert und durch zwei geteilt, um einen Kompositum-Häufigkeitswert von 20,000 zu erhalten. Da 20,000 größer als 13,500 ist, wird die Kompositum-Lösung 619 „HIGHSCH" ausgegeben mit einer relativ höheren Priorität als die Kompositum-Lösung 623 „HUGHACH". Es wird angemerkt, dass die Kompositum-Lösung für 13D typischerweise an einer Position von relativ niedrigerer Priorität als die Kompositum-Lösung 623 „HUGHACH" ausgegeben wird, gleichwohl ist die Kompositum-Lösung für 13D dieselbe wie die Kompositum-Lösung 619 „HIGHSCH". Die Kompositum-Lösung für 13D wird folglich nicht ausgegeben, da sie eine doppelte Kompositum-Lösung für die vieldeutige Eingabe 607 darstellt.
Ein beispielhaftes Flussdiagramm eines Verfahrens wird allgemein in den 15A–15C gezeigt. Zu Zwecken der Klarheit betrifft das Flussdiagramm der 15A–15C die beispielhafte Situation, die allgemein in den 13B–13D gezeigt wird, wobei die drei Kompositum-Lösungen jeweils aus zwei Sprachobjekten 100 bestehen. Somit wird der typische erste Schritt in der allgemeinen Analyse, die hierin dargelegt wird, wobei Kompositum-Lösungen, die aus relativ weniger Quantitäten von Sprachobjekten 100 bestehen, an Positionen mit relativ höherer Priorität gesetzt werden als andere Kompositum-Lösungen, die aus relativ größeren Quantitäten von Sprachobjekten 100 bestehen, in dem vorliegenden Beispiel vermieden.
Wie anderweitig hierin erwähnt, wird festgestellt, wie bei 255 in der 3A, ob Sprachobjekte 100 identifiziert wurden als einer vieldeutigen Eingabe entsprechend. Wenn nicht, verzweigt sich die Verarbeitung, wie bei 226, zu 15A für ein Teilsystem.
Es wird dann festgestellt, wie bei 713, ob ein Sprachobjekt bereits identifiziert wurde, das einem ersten Teil der vieldeutigen Eingabe entspricht und das eine Länge hat, die gleich der Länge eines solchen ersten Teils ist, oder nicht. Wenn nicht, kehrt die Verarbeitung zu dem Hauptprozess bei 228 zurück, wo die Notwendigkeit für künstliche Varianten festgestellt werden kann.
Wenn jedoch bei 713 festgestellt wird, dass ein Sprachobjekt vorher identifiziert wurde, das einem ersten Teil der vieldeutigen Eingabe entspricht und eine gleiche Länge hat, geht die Verarbeitung weiter, wie bei 717, wo festgestellt wird, ob ein zweites Sprachobjekt einem zweiten Teil der vieldeutigen Eingabe nachfolgend auf den ersten Teil entspricht. Wenn bei 717 festgestellt wird, dass solch ein zweites Sprachobjekt identifiziert wurde, geht die Verarbeitung weiter, wie bei 721, wo eine Längenidentität für die Kompositum-Lösung bestimmt wird und Häufigkeitswerte für die ersten und zweiten Sprachobjekte erlangt werden.
Wenn jedoch bei 717 festgestellt wird, dass ein zweites Sprachobjekt nicht identifiziert werden kann als dem zweiten Teil der vieldeutigen Eingabe entsprechend, der dem ersten Teil nachfolgt, geht die Verarbeitung weiter, wie bei 725, wo festgestellt wird, ob ein Suffixteil der vieldeutigen Eingabe, der auf den ersten Teil der vieldeutigen Eingabe nachfolgt, konsistent ist zu einem Suffixobjekt, das in dem Speicher 20 gespeichert ist. In dieser Hinsicht wird angemerkt, dass bestimmte Sprachen als analytische Sprachen angesehen werden und bestimmte Sprachen als synthetische Sprachen angesehen werden. In einer analytischen Sprache sind Zusammensetzungen einfach Elemente, die miteinander verbunden sind ohne zusätzliche Zeichen oder Markierungen. Englisch ist zum Beispiel eine analytische Sprache.
Andererseits besteht die deutsche Zusammensetzung kapitänspatent aus den Lexemen kapitän und patent, verbunden durch die Genitivfallmarkierung s. In der deutschen Sprache kann die Genitivfallmarkierung s möglicherweise ein Suffixobjekt aus einer Anzahl von vorbestimmten Suffixobjekten sein, die in dem Speicher 20 gespeichert sind.
Somit, wenn bei 717 festgestellt wird, dass kein zweites Sprachobjekt dem zweiten Teil der vieldeutigen Eingabe nachfolgend auf den ersten Teil der vieldeutigen Eingabe entspricht, geht die Verarbeitung weiter zu 725, wo festgestellt wird, ob ein Teil der vieldeutigen Eingabe, der dem ersten Teil der vieldeutigen Eingabe folgt, d. h. ein Suffixteil, zu einem Suffixobjekt in dem Speicher 20 konsistent ist.
Wenn zum Beispiel eine vieldeutige Eingabe <JK> <AS> <OP> <UI> <TY> <AS> <BN> <AS> <OP> <AS> <TY> <ER> <BN> ist, würde die Disambiguierungsroutine 22 bei 713 feststellen, dass die ersten sieben Eingabeelement-Betätigungen, d. h. <JK> <AS> <OP> <UI> <TY> <AS> <BN>, identifiziert werden als einen ersten Teil der vieldeutigen Eingabe darstellend, der dem Sprachobjekt 100 für „kapitän" entspricht und die gleiche Länge hat. In dem vorliegenden Beispiel wird angenommen, dass die Disambiguierungsroutine 22 bei 717 festgestellt hat, dass kein Sprachobjekt 100 dem Teil der vieldeutigen Eingabe entspricht, der solch einem erstem Teil nachfolgt, d. h. kein Sprachobjekt 100 für <AS> <OP> <AS> <TY> <ER> <BN> existiert.
Die beispielhafte Disambiguierungsroutine 22 würde dann bestimmen, wie bei 725, ob die Eingabeelement-Betätigung <AS> nachfolgend auf den ersten Teil der vieldeutigen Eingabe, d. h. <JK> <AS> <OP> <UI> <TY> <AS> <BN>, einen Suffixteil darstellt, der zu einem Suffixobjekt in dem Speicher 20 konsistent ist. In dem vorliegenden Beispiel wird angenommen, dass die Genitivfallmarkierung s ein Suffixobjekt ist, das in dem Speicher 20 gespeichert ist. Die Disambiguierungsroutine würde folglich bei 725 bestimmen, dass die Eingabeelement-Betätigung <AS> der Genitivfallmarkierung s entspricht, was bedeutet, dass die Eingabeelement-Betätigung <AS> konsistent ist zu einem Suffixobjekt in dem Speicher 20.
Wenn ja, dann geht die Verarbeitung weiter, wie bei 729, wo festgestellt wird, ob ein Sprachobjekt 100 einem zweiten Teil der vieldeutigen Eingabe nachfolgend auf den identifizierten Suffixteil entspricht oder nicht. Das heißt, die Disambiguierungsroutine 22 bestimmt, ob ein Sprachobjekt 100 gefunden werden kann oder nicht, das <OP> <AS> <TY> <ER> <BN> entspricht. In dem vorliegenden Beispiel würde die Disambiguierungsroutine 22 feststellen, dass das Sprachobjekt 100 für „patent" solch einem zweiten Teil der vieldeutigen Eingabe entspricht, der dem Suffixteil der vieldeutigen Eingabe nachfolgt. Wenn ja, geht die Verarbeitung weiter bei 733, wo eine Längenidentität für die Kompositum-Lösung bestimmt wird, und Häufigkeitswerte für die Häufigkeitsobjekte erlangt werden, die verwendet werden, um die Kompositum-Lösung zu erlangen.
Spezifisch ist die Längenidentität für eine Kompositum-Lösung, die ein Suffixobjekt umfasst, der Unterschied in der Länge zwischen einem erweiterten ersten Teil, d. h. der erste Teil plus der Suffixteil, und dem zweiten Teil. In dem vorliegenden Beispiel ist die Länge von kapitäns acht Buchstaben, und die Länge von Paten ist fünf Buchstaben. Somit hat die Längenidentität für die Kompositum-Lösung „kapitänspatent" einen Wert von 3. Die erlangten Häufigkeitswerte sind die für die Sprachobjekte 100 für kapitän und für patent.
Es kann bei 725 festgestellt werden, dass kein Suffixobjekt in dem Speicher 20 einem Teil der vieldeutigen Eingabe entspricht, der dem ersten Teil folgt. Es kann bei 729 alternativ festgestellt werden, dass kein Sprachobjekt 100 einem zweiten Teil der vieldeutigen Eingabe nachfolgend auf einen Suffixteil der vieldeutigen Eingabe entspricht, der bei 725 identifiziert wird. In jeder Situation schlägt eine versuchte Kompositum-Lösung fehl, und die Verarbeitung geht weiter zu 737.
Sobald eine Kompositum-Lösung identifiziert wird oder fehlschlägt, wie oben beschrieben, geht die Verarbeitung weiter, wie bei 737, wo bestimmt wird, ob andere Sprachobjekte 100 identifiziert wurden, die einem ersten Teil der vieldeutigen Eingabe entsprechen und die eine Länge haben, die gleich zu dem ersten Teil ist. In dieser Hinsicht können solche anderen Sprachobjekte 100 alternative Sprachobjekte 100 sein, die für den gleichen ersten Teil identifiziert wurden, wie wenn die Sprachobjekte 100 für „hug" und für „gig" erste Sprachobjekte 100 sind, die jeweils demselben ersten Teil 611B der vieldeutigen Eingabe 607 der 13B entsprechen und eine gleiche Länge wie dieser haben, d. h. die ersten drei Eingabeelement-Betätigungen. Alternativ können die zusätzlichen Sprachobjekte 100 andere Sprachobjekte 100 sein, die einem anderen ersten Teil der vieldeutigen Eingabe entsprechen, wie in der Art, wie das Sprachobjekt 100 für „hi" einem ersten Zwei-Zeichen-Teil 611A der vieldeutigen Eingabe 607 entspricht und eine gleiche Länge wie dieser hat, und das Sprachobjekt 100 für „hug" einem ersten Drei-Zeichen-Teil 611B der vieldeutigen Eingabe 607 entspricht und eine gleiche Länge wie dieser hat. Wenn bei 737 festgestellt wird, dass ein anderes erstes Sprachobjekt 100 identifiziert wurde, für das die Kompositum-Verarbeitung noch nicht durchgeführt wurde, geht die Verarbeitung weiter zu 717, wo zum Beispiel festgestellt wird, ob ein zweites Sprachobjekt 100 einem zweiten Teil der vieldeutigen Eingabe nachfolgend dem ersten Teil der vieldeutigen Eingabe entspricht, für den das andere erste Sprachobjekt 100 identifiziert wurde.
Wenn bei 737 festgestellt wird, dass keine solchen anderen ersten Sprachobjekte identifiziert wurden, was bedeutet, dass alle möglichen Kompositum-Lösungen identifiziert wurden, geht die Verarbeitung weiter, wie bei 741, wo die Kompositum-Lösungen ausgegeben werden in einer Reihenfolge eines abnehmenden Grads der Längenidentität, d. h. in einer zunehmenden Reihenfolge des Wertes der Längenidentität der verschiedenen Kompositum-Lösungen. Entsprechend einer solchen Ausgabe wird bestimmt, wie bei 745, ob Kompositum-Lösungen eine gleiche Längenidentität haben. Wenn dem so ist, geht die Verarbeitung weiter, wie bei 749, wo die Häufigkeitswerte der Sprachobjekte, von denen die Kompositum-Lösungen abgeleitet wurden, gemittelt werden, um einen Kompositum-Häufigkeitswert für jede solche Kompositum-Lösung zu erhalten. Solche Kompositum-Lösungen gleicher Längenidentität werden spezifischer, wie bei 753, in Reihenfolge eines abnehmenden Häufigkeitswertes an der Position ausgegeben, die der Längenidentität solcher Kompositum-Lösungen entspricht. Dann geht die Verarbeitung weiter, wie bei 701, wo zusätzliche Eingabeelement-Betätigungen der vieldeutigen Eingabe erfasst werden können.
Es wird angemerkt, dass ein Suffixteil einer vieldeutigen Eingabe nicht auf eine einzelne Eingabeelement-Betätigung begrenzt ist und dass eine Vielzahl von Eingabeelement-Betätigungen als ein Suffixteil analysiert werden können, um festzustellen, ob ein solcher Suffixteil zu einem vorbestimmten Suffixobjekt in dem Speicher 20 konsistent ist. Es wird weiter angemerkt, dass ein Verbindungsobjekt, das in dem Kontext eines identifizierten Suffixteils erzeugt wird, den Suffixteil zusätzlich zu dem letzten linguistischen Element des vorhergehenden Sprachobjekts und zu dem ersten linguistischen Element des nachfolgenden Sprachobjekts aufweist. Außerdem wird angemerkt, dass Suffixteile in dem Kontext von Kompositum-Lösungen identifiziert und eingesetzt werden können, die drei oder mehr Sprachobjekte 100 aufweisen, und nicht begrenzt werden müssen auf Positionen, die unmittelbar einem ersten Sprachobjekt 100 in einer Kompositum-Lösung nachfolgen, wobei angemerkt wird, dass Suffixteile identifiziert und eingesetzt werden können nachfolgend auf zweite und folgende Sprachobjekte 100 einer Kompositum-Lösung.
Es wird weiter angemerkt, dass die Disambiguierungsroutine 22 eingesetzt werden kann, um Kompositum-Lösungen zu identifizieren, wenn die vieldeutige Eingabe eine explizit trennende Eingabe umfasst. Zum Beispiel kann eine vieldeutige Eingabe 807 einen ersten Teil 827 umfassen, gefolgt von einer trennenden Einga be 831, gefolgt von einem zweiten Teil 835. In solch einem Umstand versucht die Disambiguierungsroutine, ein Sprachobjekt 100 zu identifizieren, das dem zweiten Teil 835 der vieldeutigen Eingabe 807 entspricht, unabhängig davon, ob ein Sprachobjekt 100 identifiziert wurde, das dem ersten Teil 827 entspricht und eine gleiche Länge zu der Länge des ersten Teils 827 hat. In anderen Worten, der Benutzer signalisiert an die Disambiguierungsroutine, dass der erste Teil 827 als eine erste Komponente einer Kompositum-Eingabe behandelt werden soll, und ein derartiges Signal wird von dem Benutzer durch die Eingabe der trennenden Eingabe 831 geliefert. Es wird angemerkt, dass solch eine trennende Eingabe 831 von dem Benutzer geliefert werden kann, wenn ein Sprachobjekt 100 identifiziert wurde, das dem ersten Teil 827 entspricht und eine gleiche Länge dazu hat, wenn kein solches Sprachobjekt 100 identifiziert wurde und/oder wenn die Ausgabe für den ersten Teil 827 das Resultat einer künstlichen Variante war.
Während spezifische Ausführungsbeispiele des offenbarten und beanspruchten Konzepts im Detail beschrieben wurden, ist für Fachleute offensichtlich, dass verschiedene Modifikationen und Alternativen zu jenen Details hinsichtlich der gesamten Lehren der Offenbarung entwickelt werden können. Demgemäß sollen die bestimmten Anordnungen, die offenbart werden, nur illustrativ und nicht begrenzend sein hinsichtlich des Umfangs des offenbarten und beanspruchten Konzepts, dem der volle Umfang der angefügten Ansprüche und jede und alle Äquivalente davon gegeben werden soll.
ZUSAMMENFASSUNG
Eine tragbare elektronische Vorrichtung umfasst eine reduzierte QWERTY-Tastatur und ist mit einer Disambiguierungs-Software versehen, die betriebsfähig ist, eine Kompositum-Eingabe zu disambiguieren. Die Vorrichtung kann Sprachobjekte in dem Speicher zusammensetzen, um Kompositum-Lösungen zu erzeugen. Die Vorrichtung kann die Kombinationen von Sprachobjekten hinsichtlich N-Gramm-Daten analysieren, die auf der Vorrichtung gespeichert sind, um ein Vorschlagen von Kompositum-Lösungen niedriger Wahrscheinlichkeit zu vermeiden.
ZITATE ENTHALTEN IN DER BESCHREIBUNG
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
Zitierte Patentliteratur

- US 6452588 [0035]
- US 6489950 [0035]

Claims

Verfahren zur Ermöglichung einer Eingabe in eine tragbare elektronische Vorrichtung mit einer Eingabevorrichtung, einer Ausgabevorrichtung und einem Speicher, der eine Vielzahl von Sprachobjekten und eine Vielzahl von Häufigkeitsobjekten gespeichert hat, wobei zumindest einige der Sprachobjekte jeweils zu einem zugehörigen Häufigkeitsobjekt gehören, wobei zumindest einige der Sprachobjekte jeweils eine Anzahl von linguistischen Elementen aufweisen, wobei die Eingabevorrichtung eine Vielzahl von Eingabeelementen aufweist, wobei zumindest einigen der Eingabeelemente jeweils eine Vielzahl der linguistischen Elemente zugewiesen ist, wobei das Verfahren aufweist: Erfassen einer vieldeutigen Eingabe; Erzeugen einer Anzahl von Kompositum-Lösungen, für jede Kompositum-Lösung, durch Identifizieren eines Sprachobjekts, das einem Anfangsteil der vieldeutigen Eingabe entspricht und eine Länge hat, die gleich ist zu der Länge des Anfangsteils, und Identifizieren eines anderen Sprachobjekts, das einem anderen Teil der vieldeutigen Eingabe entspricht; für zumindest eine erste Kompositum-Lösung, Erzeugen eines Verbindungsobjekts, das ein linguistisches Endelement des Sprachobjekts und ein linguistisches Anfangselement des anderen Sprachobjekts aufweist, und Bestimmen, dass zumindest eines aus: das Verbindungsobjekt einem Sprachobjekt entspricht, das zu einem Häufigkeitsobjekt gehört mit einem Häufigkeitswert unter einer vorgegebenen Schwelle, und kein Sprachobjekt dem Verbindungsobjekt entspricht; Ausgeben einer Darstellung jeder von zumindest einigen der Kompositum-Lösungen, wobei jede Darstellung eine Darstellung des Sprachobjekts und eine Darstellung von zumindest einem Teil des anderen Sprachobjekts aufweist; und zumindest eines aus: Ausgeben einer Darstellung der zumindest ersten Kompositum-Lösung an einer Position relativ geringerer Priorität als eine Darstellung einer anderen Kompositum-Lösung, und Unterdrücken von der Ausgabe die zumindest erste Kompositum-Lösung.
Verfahren gemäß Anspruch 1, wobei die Sprachobjekte eine Anzahl von Wortobjekten und eine Anzahl von N-Gramm-Objekten aufweisen, das weiter aufweist Bestimmen, als Treffen der Bestimmung, dass zumindest eines aus: das Verbindungsobjekt einem N-Gramm-Objekt entspricht, das zu einem Häufigkeitsobjekt gehört mit einem Häufigkeitswert unter einer vorgegebenen Schwelle, und kein N-Gramm-Objekt dem Verbindungsobjekt entspricht.
Verfahren gemäß Anspruch 1, das weiter aufweist ein Bestimmen, dass ein Zwischenteil der vieldeutigen Eingabe, nachfolgend auf den Anfangsteil, konsistent ist zu einem Suffixobjekt aus einer Anzahl von vorgegebenen Suffixobjekten in dem Speicher, Einsetzen als den anderen Teil der vieldeutigen Eingabe den Teil der vieldeutigen Eingabe, der dem Zwischenteil folgt, und Erzeugen als das Verbindungsobjekt ein Objekt, welches das linguistische Endelement des Sprachobjekts, das Suffixobjekt und das linguistische Anfangselement des anderen Sprachobjekts aufweist.
Tragbare elektronische Vorrichtung, die aufweist: eine Eingabevorrichtung, die eine Vielzahl von Eingabeelementen aufweist, wobei zumindest einige der Eingabeelemente jeweils eine Vielzahl von linguistischen Elementen zugewiesen haben; eine Ausgabevorrichtung; eine Prozessorvorrichtung, die einen Prozessor und einen Speicher aufweist, der eine Vielzahl von Sprachobjekten und eine Vielzahl von Häufigkeitsobjekten gespeichert hat, wobei zumindest einige der Sprachobjekte jeweils zu einem zugehörigen Häufigkeitsobjekt gehören, wobei zumindest einige der Sprachobjekte jeweils eine Anzahl von linguistischen Elementen aufweisen, wobei die Prozessorvorrichtung strukturiert ist, eine vieldeutige Eingabe zu erfassen, und weiter strukturiert ist, eine Anzahl von Kompositum-Lösungen zu erzeugen durch, für jede Kompositum-Lösung, Identifizieren eines Sprachobjekts, das einem Anfangsteil der vieldeutigen Eingabe entspricht und eine Länge hat, die gleich ist zu der Länge des Anfangsteils, und Identifizieren eines anderen Sprachobjekts, das einem anderen Teil der vieldeutigen Eingabe entspricht, wobei für zumindest eine erste Kompositum-Lösung die Prozessorvorrichtung strukturiert ist, ein Verbindungsobjekts zu erzeugen, das ein linguistisches Endelement des Sprachobjekts und ein linguistisches Anfangselement des anderen Sprachobjekts aufweist, und zu bestimmen, dass zumindest eines aus: das Verbindungsobjekt einem Sprachobjekt entspricht, das zu einem Häufigkeitsobjekt gehört mit einem Häufigkeitswert unter einer vorgegebenen Schwelle, und kein Sprachobjekt dem Verbindungsobjekt entspricht; wobei die Ausgabevorrichtung strukturiert ist, eine Darstellung jeder von zumindest einigen der Kompositum-Lösungen auszugeben, wobei jede Darstellung eine Darstellung des Sprachobjekts und eine Darstellung von zumindest einem Teil des anderen Sprachobjekts aufweist; und die Prozessorvorrichtung strukturiert ist, zumindest eines aus: ein Signal zu erzeugen, das eine Darstellung der zumindest ersten Kompositum-Lösung an einer Position relativ geringerer Priorität als eine Darstellung einer anderen Kompositum-Lösung ausgibt, und die zumindest erste Kompositum-Lösung von der Ausgabe zu unterdrücken.
Tragbare elektronische Vorrichtung gemäß Anspruch 4, wobei die Sprachobjekte eine Anzahl von Wortobjekten und eine Anzahl von N-Gramm-Objekten aufweisen, und wobei die Prozessorvorrichtung strukturiert ist, als treffen der Bestimmung, zu bestimmen, dass zumindest eines aus: das Verbindungsobjekt einem N-Gramm-Objekt entspricht, das zu einem Häufigkeitsobjekt gehört mit einem Häufigkeitswert unter einer vorgegebenen Schwelle, und kein N-Gramm-Objekt dem Verbindungsobjekt entspricht.
Tragbare elektronische Vorrichtung gemäß Anspruch 4, wobei die Prozessorvorrichtung strukturiert ist, zu bestimmen, dass ein Zwischenteil der vieldeutigen Eingabe, nachfolgend auf den Anfangsteil, konsistent ist zu einem Suffixobjekt aus einer Anzahl von vorgegebenen Suffixobjekten in dem Speicher, als den anderen Teil der vieldeutigen Eingabe den Teil der vieldeutigen Eingabe einzusetzen, der dem Zwischenteil folgt, und als das Verbindungsobjekt ein Objekt zu erzeugen, welches das linguistische Endelement des Sprachobjekts, das Suffixobjekt und das linguistische Anfangselement des anderen Sprachobjekts aufweist.