DE112007000847T5

DE112007000847T5 - Tragbare elektronische Vorrichtung und Verfahren zum Lernen von Kontextdaten während einer Disambiguierung einer Texteingabe

Info

Publication number: DE112007000847T5
Application number: DE112007000847T
Authority: DE
Inventors: Vadim Waterloo FUX
Original assignee: Research in Motion Ltd
Current assignee: BlackBerry Ltd
Priority date: 2006-04-06
Filing date: 2007-01-26
Publication date: 2009-02-19
Also published as: GB2451038A; US8417855B2; CA2647938C; WO2007112543A1; US8065453B2; US7477165B2; CA2647938A1; US20080010054A1; US20120035916A1; GB2451038B; US20070250650A1; GB0820122D0; US8677038B2; US20130187859A1; US20130307782A2

Abstract

Verfahren zur Ermöglichung einer Eingabe in eine tragbare elektronische Vorrichtung eines Typs, der eine Eingabevorrichtung, eine Ausgabevorrichtung und eine Prozessorvorrichtung umfasst, die einen Speicher aufweist, der eine Vielzahl von Objekten gespeichert hat, einschließlich einer Vielzahl von Sprachobjekten und einer Anzahl von Kontextwerten, wobei zumindest einige der Sprachobjekte jeweils zumindest einen ersten Kontextwert zugewiesen haben,
wobei die Eingabevorrichtung eine Vielzahl von Eingabeelementen aufweist, wobei zumindest einigen der Eingabeelemente jeweils eine Vielzahl von linguistischen Elementen zugewiesen ist, wobei das Verfahren aufweist:
Erfassen einer ersten Eingabe;
Ausgeben als eine erste Ausgabe eine Interpretation der ersten Eingabe;
Erfassen als eine zweite Eingabe eine vieldeutige Eingabe, die eine Anzahl von Eingabeelementbetätigungen aufweist;
Ausgeben zumindest eines Teils von jedem eines ersten Sprachobjekts und eines zweiten Sprachobjekts als vorgeschlagene Interpretationen der vieldeutigen Eingabe, wobei der zumindest Teil des ersten Sprachobjekts ausgegeben wird an einer Position von Präferenz hinsichtlich des zumindest Teils des...

Description

Hintergrund
Gebiet
Das offenbarte und beanspruchte Konzept betrifft im Allgemeinen tragbare bzw. handgehaltene elektronische Vorrichtungen (handheld electronic devices) und insbesondere eine tragbare elektronische Vorrichtung, die eine reduzierte Tastatur und eine Text-Eingabe-Disambiguierungsfunktion hat, die Kontextdaten verwenden kann.
Hintergrundinformation
Zahlreiche Typen von tragbaren elektronischen Vorrichtungen sind bekannt. Beispiele derartiger tragbarer elektronischer Vorrichtungen umfassen zum Beispiel persönliche Datenassistenten (PDAs – personal data assistants), tragbare Computer, Zweiweg-Pager, zellulare Telefone und dergleichen. Viele tragbare elektronische Vorrichtungen weisen auch eine drahtlose Kommunikationsfähigkeit auf, obwohl viele derartige tragbare elektronische Vorrichtungen unabhängige Vorrichtungen sind, die ohne Kommunikation mit anderen Vorrichtungen funktional sind.
Derartige tragbare elektronische Vorrichtungen sollen im Allgemeinen tragbar sein und haben folglich eine relativ kompakte Konfiguration, in der Tasten und andere Eingabestrukturen häufig mehrfache Funktionen unter bestimmten Um ständen durchführen oder anderweitig mehrere Aspekte oder Eigenschaften zugewiesen haben. Mit Fortschritten in der Technologie werden tragbare elektronische Vorrichtungen hergestellt, um immer kleinere Formfaktoren zu haben, und dennoch eine immer größere Anzahl von Anwendungen und Eigenschaften darauf zu haben. In der Praxis können die Tasten eines Tastaturfelds nur auf eine bestimmte kleine Größe verringert werden, bevor die Tasten relativ unbrauchbar werden. Um eine Texteingabe zu ermöglichen, muss jedoch ein Tastaturfeld zum Beispiel zur Eingabe aller sechsundzwanzig Buchstaben des lateinischen Alphabets sowie einer passenden Interpunktion und anderer Symbole fähig sein.
Eine Art des Vorsehens von zahlreichen Buchstaben in einem kleinen Raum war, eine „reduzierte Tastatur" vorzusehen, in der mehrere Buchstaben, Symbole und/oder Zahlen und dergleichen, jeder gegebenen Taste zugewiesen werden. Zum Beispiel umfasst ein Tasten(touch-tone)-Telefon ein reduziertes Tastaturfeld durch Vorsehen von zwölf Tasten, von denen zehn Zahlen darauf haben und von diesen zehn Tasten haben acht lateinische Buchstaben zugewiesen. Zum Beispiel umfasst eine der Tasten die Zahl „2" sowie die Buchstaben „A", „B" und „C". Andere bekannte reduzierte Tastaturen umfassten andere Anordnungen für Tasten, Buchstaben, Symbole, Zahlen und dergleichen. Da eine einzige Betätigung einer derartigen Taste von dem Benutzer vorgesehen sein kann, sich möglicherweise auf einen der Buchstaben „A", „B" und „C" zu beziehen und sich möglicherweise auch auf die Zahl „2" beziehen soll, ist die Eingabe im Allgemeinen eine vieldeutige (ambiguous) Eingabe und bedarf eines Typs einer Disambiguierung, um für Texteingabezwecke nützlich zu sein.
Um einem Benutzer zu ermöglichen, die mehrfachen Buchstaben, Zahlen und dergleichen auf jeder gegebenen Taste zu verwenden, wurden zahlreiche Tastenanschlags-Interpretationssysteme vorgesehen. Zum Beispiel ermöglicht ein „Mehrfach-Tippen(multi-tap)"-System einem Benutzer, im Wesentlichen eindeutig ein bestimmtes Zeichen auf einer Taste zu spezifizieren durch Drücken derselben Taste mehrere Male, äquivalent zu der Position des gewünschten Zeichens auf der Taste. Ein anderes beispielhaftes Tastenanschlags-Interpretationssystem umfasst ein Tasten-„Chording", von dem verschiedene Typen existieren. Zum Beispiel kann ein bestimmtes Zeichen eingegeben werden durch Drücken zweier Tasten hintereinander oder durch Drücken und Halten einer ersten Taste, während eine zweite Taste gedrückt wird. Ein weiteres beispielhaftes Tastenanschlags-Interpretationssystem ist eine „Drücken-und-Halten/Drücken-und-Freigabe"-Interpretationsfunktion, in der eine gegebene Taste ein erstes Resultat liefert, wenn die Taste betätigt und sofort losgelassen wird, und ein zweites Resultat liefert, wenn die Taste für eine kurze Zeitdauer betätigt und gehalten wird. Ein weiteres Tastenanschlags-Interpretationssystem, das eingesetzt wurde, ist eine Software-basierte Text-Disambiguierungsfunktion. In solch einem System drückt ein Benutzer typischerweise Tasten, denen ein oder mehrere Zeichen zugewiesen wurden, im Allgemeinen wird jede Taste ein Mal für jeden gewünschten Buchstaben gedrückt, und die Disambiguierungs-Software versucht, die beabsichtigte Eingabe vorauszusagen. Zahlreiche derartige Systeme wurden vorgeschlagen und während viele für ihre beabsichtigten Zwecken im Allgemeinen effektiv waren, existieren weiter Defizite.
Es wäre wünschenswert, eine verbesserte tragbare elektronische Vorrichtung mit einer reduzierten Tastatur vorzusehen, die versucht, eine QWERTY-Tastatur-Erfahrung oder eine andere bestimmte Tastaturerfahrung zu imitieren. Solch eine verbesserte tragbare elektronische Vorrichtung kann auch wünschenswerterweise konfiguriert werden mit ausreichenden Eigenschaften, um eine Texteingabe und andere Aufgaben mit relativer Mühelosigkeit zu ermöglichen.
KURZE BESCHREIBUNG DER ZEICHNUNGEN
Ein vollständiges Verständnis des offenbarten und beanspruchten Konzepts kann aus der folgenden Beschreibung gewonnen werden, wenn in Verbindung mit den beigefügten Zeichnungen gelesen, wobei:
1 eine Draufsicht auf eine verbesserte tragbare elektronische Vorrichtung gemäß dem offenbarten und beanspruchten Konzept ist;
2 eine schematische Darstellung der verbesserten tragbaren elektronischen Vorrichtung der 1 ist;
2A eine schematische Darstellung eines Teils der tragbaren elektronischen Vorrichtung von 2 ist;
3A, 3B und 3C ein beispielhaftes Flussdiagramm sind, das bestimmte Aspekte einer Disambiguierungsfunktion darstellt, die auf der tragbaren elektronischen Vorrichtung der 1 ausgeführt werden kann;
4 ein weiteres beispielhaftes Flussdiagramm ist, das bestimmte Aspekte eines Lernverfahrens darstellt, das auf der tragbaren elektronischen Vorrichtung ausgeführt werden kann;
5 eine beispielhafte Ausgabe während eines Texteingabebetriebs ist;
6 eine weitere beispielhafte Ausgabe während eines anderen Teils des Texteingabebetriebes ist;
7 eine weitere beispielhafte Ausgabe während eines anderen Teils des Texteingabebetriebes ist;
8 eine weitere beispielhafte Ausgabe während eines anderen Teils des Texteingabebetriebes ist;
9 ein beispielhaftes Flussdiagramm ist, das die Verwendung von Kontextdaten während eines Texteingabebetriebes darstellt.
Ähnliche Ziffern beziehen sich auf ähnliche Teile in der Spezifikation.
BESCHREIBUNG
Eine verbesserte tragbare elektronische Vorrichtung 4 wird allgemein in der 1 gezeigt und wird schematisch in der 2 dargestellt. Die beispielhafte tragbare elektronische Vorrichtung 4 umfasst ein Gehäuse 6, auf dem eine Prozessoreinheit angebracht ist, die eine Eingabevorrichtung 8, eine Ausgabevorrichtung 12, einen Prozessor 16 und einen Speicher 20 umfasst und zumindest eine erste Routine. Der Prozessor 16 kann zum Beispiel und ohne Einschränkung ein Mikroprozessor (μP) sein und reagiert auf Eingaben von der Eingabevorrichtung 8 und liefert Ausgabesignale an die Ausgabevorrichtung 12. Der Prozessor 16 ist auch mit dem Speicher 20 verbunden. Der Prozessor 16 und der Speicher 20 bilden zusammen eine Prozessorvorrichtung. Beispiele von tragbaren elektronischen Vorrichtungen sind in den U.S.-Patenten Nr. 6,452,588 und 6,489,950 enthalten.
Wie aus der 1 offensichtlich ist, umfasst die Eingabevorrichtung 8 ein Tastaturfeld 24 und ein Thumbwheel 32. Wie detaillierter unten beschrieben wird, ist das Tastaturfeld 24 in der beispielhaften Form einer reduzierten QWERTY-Tastatur einschließlich einer Vielzahl von Tasten 28, die als Eingabeelemente dienen. Es wird jedoch angemerkt, dass das Tastaturfeld 24 andere Konfigurationen haben kann, wie eine AZERTY-Tastatur, eine QWERTZ-Tastatur oder eine andere Tastaturanordnung, ob momentan bekannt oder unbekannt und entweder reduziert oder nicht reduziert. Wie hierin eingesetzt, sollen der Ausdruck „reduziert" und Variationen davon in dem Kontext einer Tastatur, eines Tastaturfelds oder einer anderen Anordnung von Eingabeelementen breit auf eine Anordnung verweisen, in der zumindest einem der Eingabeelemente eine Vielzahl von linguistischen Elementen zugewiesen ist, wie zum Beispiel Zeichen in dem Satz von lateinischen Buchstaben, wobei eine Betätigung des zumindest einen der Eingabeelemente, ohne eine andere Eingabe in Kombination damit, eine vieldeutige Eingabe ist, da sie mehr als eines der Vielzahl der zugewiesenen linguistischen Ele mente betreffen kann. Wie hierin eingesetzt, sollen der Ausdruck „linguistisches Element" und Variationen davon breit auf jedes Element verweisen, das selbst ein Sprachobjekt sein kann oder aus welchem ein Sprachobjekt konstruiert, identifiziert oder anderweitig erhalten werden kann, und umfasst folglich zum Beispiel und ohne Einschränkung Zeichen, Buchstaben, Anschläge, Ideogramme, Phoneme, Morpheme, Zahlen und dergleichen. Wie hierin eingesetzt, sollen der Ausdruck „Sprachobjekt" und Variationen davon breit auf jeden Typ von Objekt verweisen, der aus einem oder mehreren linguistischen Elementen konstruiert, identifiziert oder anderweitig erhalten werden kann, die alleine oder in Kombination verwendet werden können, um Text zu erzeugen, und das umfasst zum Beispiel und ohne Einschränkung Wörter, Abkürzungen, Symbole, Ideogramme und dergleichen.
Die Systemarchitektur der tragbaren elektronischen Vorrichtung 4 ist vorteilhafterweise organisiert, um unabhängig von dem spezifischen Layout des Tastaturfelds 24 betriebsfähig zu sein. Demgemäß kann die Systemarchitektur der tragbaren elektronischen Vorrichtung 4 in Verbindung mit praktisch jedem Tastaturfeld-Layout eingesetzt werden, im Wesentlichen ohne eine bedeutsame Änderung in der Systemarchitektur zu erfordern. Es wird weiter angemerkt, dass bestimmte der Eigenschaften, die hierin dargelegt werden, entweder auf einer oder auf beiden einer reduzierten Tastatur und einer nicht reduzierten Tastatur verwendbar sind.
Die Tasten 28 sind auf einer Vorderseite des Gehäuses 6 angeordnet und das Thumbwheel 32 ist an einer Seite des Gehäuses 6 angeordnet. Das Thumbwheel 32 kann als ein weiteres Eingabeelement dienen und ist sowohl drehbar, wie durch den Pfeil 34 angezeigt wird, um Auswahleingaben an den Prozessor 16 zu liefern, und kann auch gedrückt werden in eine Richtung im Allgemeinen zum Gehäuse 6 hin, wie durch den Pfeil 38 angezeigt wird, um eine andere Auswahleingabe an den Prozessor 16 zu liefern.
Wie in 1 weiter gesehen werden kann, umfassen viele der Tasten 28 eine Anzahl von darauf angeordneten linguistischen Elementen 48. Wie hierin eingesetzt, soll der Ausdruck „eine Anzahl von" und Variationen davon breit auf jede Quantität verweisen, einschließlich einer Quantität von eins. In der beispielhaften Darstellung des Tastaturfelds 24 umfassen viele der Tasten 28 zwei zugewiesene linguistische Elemente, wie Umfassen eines ersten linguistischen Elements 52 und eines zweiten linguistischen Elements 56.
Eine der Tasten 28 des Tastaturfelds 24 umfasst als die Zeichen 48 davon die Buchstaben „Q" und „W", und eine angrenzende Taste 28 umfasst als die Zeichen 48 davon die Buchstaben „E" und „R". Es ist zu sehen, dass die Anordnung der Zeichen 48 auf den Tasten 28 des Tastaturfelds 24 im Allgemeinen eine QWERTY-Anordnung ist, wenngleich viele der Tasten 28 zwei der Zeichen 28 umfassen.
Die Ausgabevorrichtung 12 umfasst eine Anzeige 60, auf der eine Ausgabe 64 vorgesehen werden kann. Eine beispielhafte Ausgabe 64 wird auf der Anzeige 60 in der 1 dargestellt. Die Ausgabe 64 umfasst eine Textkomponente 68 und eine Varianten-Komponente 72. Die Varianten-Komponente 72 umfasst einen Standard-Teil 76 und einen Varianten-Teil 80. Die Anzeige umfasst auch ein Caret-Zeichen 84, das im Allgemeinen darstellt, wo die nächste Eingabe von Eingabevorrichtung 8 empfangen wird.
Die Textkomponente 68 der Ausgabe 64 liefert eine Darstellung des Standard-Teils 76 der Ausgabe 64 an einer Position auf der Anzeige 60, wo der Text eingegeben wird. Die Varianten-Komponente 72 wird im Allgemeinen in der Nähe der Textkomponente 68 angeordnet und liefert, zusätzlich zu der standardmäßigen vorgeschlagenen Ausgabe 76, eine Darstellung der verschiedenen alternativen Textwahlmöglichkeiten, d. h. Alternativen zu der standardmäßigen vorgeschlagenen Ausgabe 76, die durch eine Eingabe-Disambiguierungsfunktion in Reaktion auf eine Eingabesequenz von Tastenbetätigungen der Tasten 28 vorgeschlagen werden.
Wie detaillierter unten beschrieben wird, wird der Standard-Teil 76 durch die Disambiguierungsfunktion vorgeschlagen als die wahrscheinlichste disambiguierte Interpretation der vieldeutigen Eingabe, die durch den Benutzer vorgesehen ist. Der Varianten-Teil 80 umfasst eine vorgegebene Quantität von alternativen vorgeschlagenen Interpretationen derselben vieldeutigen Eingabe, aus denen der Benutzer wählen kann, wenn gewünscht. Es wird angemerkt, dass der beispielhafte Varianten-Teil 80 hierin dargestellt wird als sich vertikal unter den Standard-Teil 76 erstreckend, aber es ist offensichtlich, dass zahlreich andere Anordnungen vorgesehen werden können.
Der Speicher 20 wird schematisch in der 2A dargestellt. Der Speicher 20 kann jeder einer Vielzahl von Typen von internen und/oder externen Speichermedien sein, wie, ohne Einschränkung, RAM, ROM, EPROM(s), EEPROM(s) und dergleichen, die ein Speicherregister zur Datenspeicherung vorsehen, wie in der Art eines internen Speicherbereichs eines Computers, und kann ein volatiler Speicher oder ein nicht-volatiler Speicher sein. Der Speicher 20 umfasst zusätzlich eine Anzahl von Routinen, die allgemein mit dem Bezugzeichen 22 dargestellt werden, für die Verarbeitung von Daten. Die Routinen 22 können in jeder einer Vielzahl von Formen sein, wie, ohne Einschränkung, Software, Firmware und dergleichen. Wie detaillierter unten erklärt wird, umfassen die Routinen 22 die vorher erwähnte Disambiguierungsfunktion als eine Anwendung sowie andere Routinen.
Wie aus der 2A zu verstehen ist, umfasst der Speicher 20 zusätzlich Daten, die in einer Anzahl von Tabellen, Sätzen, Listen und/oder anderweitig gespeichert und/oder organisiert sind. Spezifisch umfasst der Speicher 20 eine generische Wortliste 88, eine „neue Wörter"-Datenbank 92, eine andere Datenquelle 99 und eine Kontextdaten-Tabelle 49.
In den verschiedenen Bereichen des Speichers 20 ist eine Anzahl von Sprachobjekten 100 und Häufigkeitsobjekten 104 gespeichert. Die Sprachobjekte 100 gehören im Allgemeinen jeweils zu einem zugehörigen Häufigkeitsobjekt 104. Die Sprachobjekte 100 umfassen in dem vorliegenden beispielhaften Ausführungsbeispiel eine Vielzahl von Wortobjekten 108 und eine Vielzahl von N-Gramm-Objekten 112. Die Wortobjekte 108 sind allgemein repräsentativ für komplette Wörter in der Sprache oder kundenspezifische Wörter, die in dem Speicher 20 gespeichert sind. Wenn zum Beispiel die in dem Speicher gespeicherte Sprache zum Beispiel Englisch ist, repräsentiert im Allgemeinen jedes Wortobjekt 108 ein Wort in der englischen Sprache oder repräsentiert ein kundenspezifisches Wort.
Zu im Wesentlichen jedem Wortobjekt 108 gehört ein Häufigkeitsobjekt 104, das einen Häufigkeitswert hat, der die relative Häufigkeit innerhalb der relevanten Sprache des gegebenen Wortes anzeigt, das durch das Wortobjekt 108 repräsentiert wird. In dieser Hinsicht umfasst die generische Wortliste 88 einen Korpus von Wortobjekten 108 und zugehörigen Häufigkeitsobjekten 104, die zusammen eine breite Vielfalt von Wörtern und ihre relative Häufigkeit in einer gegebenen Umgangssprache von zum Beispiel einer gegebenen Sprache darstellen. Die generische Wortliste 88 kann auf eine einer breiten Vielfalt von Arten abgeleitet werden, wie durch Analysieren zahlreicher Texte und anderer Sprachquellen, um die verschiedenen Wörter innerhalb der Sprachquellen sowie ihre relativen Wahrscheinlichkeiten, d. h. relativen Häufigkeiten, des Auftretens der verschiedenen Wörter in den Sprachquellen zu bestimmen.
Die N-Gramm-Objekte 112, die in der generischen Wortliste 88 gespeichert sind, sind kurze Ketten von Zeichen in der relevanten Sprache, typischerweise zum Beispiel ein bis drei Zeichen in der Länge und repräsentieren typischerweise Wortfragmente in der relevanten Sprache, obwohl bestimmte der N-Gramm-Objekte 112 zusätzlich selbst Wörter sein können. Jedoch zu dem Ausmaß, dass ein N-Gramm-Objekt 112 auch ein Wort in der relevanten Sprache ist, wird das selbe Wort wahrscheinlich separat gespeichert als ein Wortobjekt 108 in der generischen Wortliste 88. Wie hier eingesetzt, sollen der Ausdruck „Kette (string)" und Variationen davon breit auf ein Objekt verweisen, das ein oder mehrere Zeichen oder Komponenten hat, und kann sich auf eines eines kompletten Wortes, eines Fragments eines Wortes, eines kundenspezifischen Wortes oder eines Ausdrucks und dergleichen beziehen.
In dem vorliegenden beispielhaften Ausführungsbeispiel der tragbaren elektronischen Vorrichtung 4 umfassen die N-Gramm-Objekte 112 1-Gramm-Objekte, d. h. Ketten- bzw. String-Objekte, die ein Zeichen in der Länge sind, 2-Gramm-Objekte, d. h. String-Objekte, die zwei Zeichen in der Länge sind, und 3-Gramm-Objekte, d. h. String-Objekte, die drei Zeichen in der Länge sind, die kollektiv als N-Gramme 112 bezeichnet werden. Im Wesentlichen gehört jedes N-Gramm-Objekt 112 in der generischen Wortliste 88 ähnlich zu einem zugehörigen Häufigkeitsobjekt 104, das in der generischen Wortliste 88 gespeichert ist, aber das Häufigkeitsobjekt 104, das zu einem gegebenen N-Gramm-Objekt 112 gehört, hat einen Häufigkeitswert, der die relative Wahrscheinlichkeit anzeigt, dass der Zeichen-String, der durch das bestimmte N-Gramm-Objekt 112 repräsentiert wird, an jeder Position in jedem Wort der relevanten Sprache existiert. Die N-Gramm-Objekte 112 und die zugehörigen Häufigkeitsobjekte 104 sind ein Teil des Korpus der generischen Wortliste 88 und werden auf eine Art erlangt, die ähnlich ist zu der Art, auf die das Wortobjekt 108 und die zugehörigen Häufigkeitsobjekte 104 erlangt werden, obwohl die Analyse, die bei der Erlangung der N-Gramm-Objekte 112 durchgeführt wird, etwas unterschiedlich ist, da sie eine Analyse der verschiedenen Zeichen-Strings in den verschiedenen Wörter umfasst, statt sich hauptsächlich auf das relative Auftreten eines gegebenen Wortes zu verlassen.
Das vorliegende beispielhafte Ausführungsbeispiel der tragbaren elektronischen Vorrichtung 4, deren beispielhafte Sprache die englische Sprache ist, umfasst sechsundzwanzig 1-Gramm-N-Gramm-Objekte 112, d. h. ein 1-Gramm-Objekt für jeden der sechsundzwanzig Buchstaben im lateinischen Alphabet, auf dem die englische Sprache basiert, und umfasst weiter 676 2-Gramm-N-Gramm-Objekte 112, d. h. sechsundzwanzig hoch zwei, wodurch jede zwei-Buchstaben-Permutation der sechsundzwanzig Buchstaben in dem lateinischen Alphabet dargestellt wird.
Die N-Gramm-Objekte 112 umfassen auch eine bestimmte Quantität von 3-Gramm-N-Gramm-Objekten 112, primär diejenigen, die eine relativ hohe Häufigkeit in der relevanten Sprache haben. Das beispielhafte Ausführungsbeispiel der tragbaren elektronischen Vorrichtung 4 umfasst weniger als alle der Drei-Buchstaben-Permutationen der sechsundzwanzig Buchstaben des lateinischen Alphabets aufgrund von Berücksichtigungen einer Datenspeichergröße und auch, da die 2-Gramm-N-Gramm-Objekte 112 bereits eine bedeutsame Menge von Information hinsichtlich der relevanten Sprache liefern können. Wie detaillierter unten dargelegt wird, liefern die N-Gramm-Objekte 112 und ihre zugehörigen Häufigkeitsobjekte 104 Häufigkeitsdaten, die Zeichen-Strings zugeschrieben werden können, für die ein entsprechendes Wortobjekt 108 nicht identifiziert werden kann oder nicht identifiziert wurde, und wird typischerweise als eine Rückfall-Datenquelle eingesetzt, obwohl dies nicht exklusiv der Fall sein muss.
In dem vorliegenden beispielhaften Ausführungsbeispiel werden die Sprachobjekte 100 und die Häufigkeitsobjekte 104 im Wesentlichen unberührt in der generischen Wortliste 88 gepflegt, was bedeutet, dass das grundlegende Sprachenlexikon in der generischen Wortliste 88 im Wesentlichen unverändert bleibt, und die Lernen-Funktionen, die von der tragbaren elektronischen Vorrichtung 4 vorgesehen werden und die unten beschrieben werden, funktionieren in Verbindung mit anderen Objekten, die im Allgemeinen woanders in dem Speicher 20 gespeichert sind, wie zum Beispiel in der „neue Wörter"-Datenbank 92.
Die „neue Wörter"-Datenbank 92 speichert zusätzliche Wortobjekte 108 und zugehörige Häufigkeitsobjekte 104, um einem Benutzer eine kundenspezifische Erfahrung zu liefern, in der Wörter und dergleichen, die relativ häufiger von einem Benutzer benutzt werden, relativ höhere Häufigkeitswerte haben, als ansonsten in der generischen Wortliste 88 reflektiert wird. Insbesondere umfasst die „neue Wörter"-Datenbank 92 Wortobjekte 108, die Benutzer-definiert sind und die im Allgemeinen nicht unter den Wortobjekten 108 der generischen Wortliste 88 zu finden sind. Jedes Wortobjekt 108 in der „neue Wörter"-Datenbank 92 hat zugehörig ein zugehöriges Häufigkeitsobjekt 104, das auch in der „neue Wörter"-Datenbank 92 gespeichert ist.
Die 3A, 3B und 3C zeigen auf eine beispielhafte Art und Weise den allgemeinen Betrieb bestimmter Aspekte der Disambiguierungsfunktion der tragbaren elektronischen Vorrichtung 4. Zusätzliche Merkmale, Funktionen und dergleichen werden anderswo dargestellt und beschrieben.
Eine Eingabe wird erfasst, wie bei 204, und die Eingabe kann jeder Typ einer Betätigung oder ein anderer Betrieb hinsichtlich jedes Teils der Eingabevorrichtung 8 sein. Eine typische Eingabe umfasst zum Beispiel eine Betätigung einer Taste 28 mit einer Anzahl von Zeichen 48 darauf, oder jeder andere Typ einer Betätigung oder Manipulation der Eingabevorrichtung 8.
Die Disambiguierungsfunktion bestimmt dann, wie bei 212, ob die aktuelle Eingabe eine Bedieneingabe, wie eine Auswahl-Eingabe, eine Begrenzungszeichen- bzw. Delimiter-Eingabe, eine Bewegungs-Eingabe, eine Umschalt-Eingabe oder zum Beispiel eine andere Eingabe ist, die keine Betätigung einer Taste 28 darstellt, die eine Anzahl von Zeichen 48 darauf hat. Wenn bei 212 festgestellt wird, dass die Eingabe keine Bedieneingabe ist, geht die Verarbeitung bei 216 weiter durch Hinzufügen der Eingabe zu der aktuellen Eingabe-Sequenz, die bereits eine Eingabe umfassen kann oder nicht.
Viele der bei 204 erfassten Eingaben werden eingesetzt bei der Erzeugung von Eingabe-Sequenzen, bei denen die Disambiguierungsfunktion ausgeführt wird. Eine Eingabe-Sequenz wird in jeder „Sitzung" mit jeder Betätigung einer Taste 28 mit einer Anzahl von Zeichen 48 darauf aufgebaut. Da eine Eingabe-Sequenz typischerweise aus zumindest einer Betätigung einer Taste 28 mit einer Vielzahl von Zeichen 48 darauf besteht, ist die Eingabe-Sequenz vieldeutig. Wenn zum Beispiel ein Wort vollständig ist, wird die aktuelle Sitzung beendet und eine neue Sitzung wird initiiert.
Eine Eingabe-Sequenz wird stufenweise auf der tragbaren elektronischen Vorrichtung 4 aufgebaut mit jeder aufeinander folgenden Betätigung einer Taste 28 während jeder gegebenen Sitzung. Spezifisch wird, sobald eine Delimiter-Eingabe während einer gegebenen Sitzung erfasst wird, die Sitzung beendet und eine neue Sitzung wird initiiert. Jede Eingabe, die aus einer Betätigung einer der Tasten 28 mit einer damit verbundenen Anzahl von Zeichen 48 resultiert, wird sequentiell zu der aktuellen Eingabe-Sequenz hinzugefügt. Da die Eingabe-Sequenz während einer gegebenen Sitzung wächst, wird die Disambiguierungsfunktion im Allgemeinen mit jeder Betätigung einer Taste 28 ausgeführt, d. h. und hinsichtlich der gesamten Eingabe-Sequenz eingegeben. Anders ausgedrückt, in einer gegebenen Sitzung wird versucht, die wachsende Eingabe-Sequenz als eine Einheit durch die Disambiguierungsfunktion zu disambiguieren mit jeder nachfolgenden Betätigung der verschiedenen Tasten 28.
Sobald eine aktuelle Eingabe, die eine letzte Betätigung einer der Tasten 28 mit einer Anzahl der dazu gehörenden Zeichen 48 darstellt, zu der aktuellen Eingabe-Sequenz in der aktuellen Sitzung hinzugefügt wurde, wie bei 216 in der 3A, erzeugt die Disambiguierungsfunktion, wie bei 220, im Wesentlichen alle Permutationen der Zeichen 48, die den verschiedenen Tasten 28 zugewiesen werden, die getätigt wurden bei der Erzeugung der Eingabe-Sequenz. In dieser Hinsicht beziehen sich „Permutationen" auf die verschiedenen Strings, die aus den Zeichen 48 jeder gedrückten Taste 28 resultieren können, begrenzt durch die Reihenfolge, in der die Tasten 28 betätigt wurden. Die verschiedenen Permutationen der Zeichen in der Eingabe-Sequenz werden als Präfixobjekte eingesetzt.
Wenn zum Beispiel die aktuelle Eingabe-Sequenz in der aktuellen Sitzung die vieldeutige Eingabe der Tasten „AS" und „OP" ist, sind die verschiedenen Permutationen des ersten Zeichens 52 und des zweiten Zeichens 56 von jeder der zwei Tasten 28, wenn betrachtet in der Reihenfolge, in der die Tasten 28 betätigt wurden, „SO", „SP", „AP" und „AO" und jedes von diesen ist ein Präfixobjekt, das erzeugt wird, wie bei 220, hinsichtlich der aktuellen Eingabe-Sequenz. Wie detaillierter unten erklärt, versucht die Disambiguierungsfunktion, für jedes Präfixobjekt eines der Wortobjekte 108 zu identifizieren, für welches das Präfixobjekt ein Präfix sein würde.
Für jedes erzeugte Präfixobjekt wird der Speicher 20 konsultiert, wie bei 224, um, wenn möglich, für jedes Präfixobjekt eines der Wortobjekte 108 in dem Speicher 20 zu identifizieren, das dem Präfixobjekt entspricht, was bedeutet, dass die Sequenz der Buchstaben, die durch das Präfixobjekt dargestellt wird, entweder ein Präfix des identifizierten Wortobjektes 108 ist oder im Wesentlichen identisch zu der Gesamtheit des Wortobjektes 108 ist. Weiter ist in dieser Hinsicht das Wortobjekt 108, das zu identifizieren versucht wird, das Wortobjekt 108 mit der höchsten Häufigkeit. Das heißt, die Disambiguierungsfunktion versucht, das Wortobjekt 108 zu identifizieren, das dem Präfixobjekt entspricht und das auch zu einem Häufigkeitsobjekt 104 gehört, das einen relativ höheren Häufigkeitswert hat als alle der anderen Häufigkeitsobjekte 104, die zu den anderen Wortobjekten 108 gehören, die dem Präfixobjekt entsprechen.
Es wird in dieser Hinsicht angemerkt, dass die Wortobjekte 108 in der generischen Wortliste 88 im Allgemeinen in Datentabellen organisiert sind, die den ersten zwei Buchstaben von verschiedenen Wörtern entsprechen. Zum Beispiel würde die Datentabelle, die mit dem Präfix „CO" verbunden ist, alle der Wörter umfassen wie „CODE", „COIN", „COMMUNICATION" und dergleichen. Abhängig von der Quantität von Wortobjekten 108 in einer gegebenen Datentabelle kann die Datentabelle zusätzlich Teil-Datentabellen umfassen, in denen Wortobjekte 108 durch Präfixe organisiert sind, die drei Zeichen oder mehr in der Länge sind. Weiter mit dem vorangehenden Beispiel, wenn die „CO"-Datentabelle zum Beispiel mehr als 256 Wortobjekte 108 umfassen würde, würde die „CO"-Datentabelle zusätzlich eine oder mehrere Teil-Datentabellen von Wortobjekten 108 umfassen, die den am häufigsten erscheinenden Dreibuchstaben-Präfixen entsprechen. Auf beispielhafte Weise kann somit die „CO"-Datentabelle auch eine „COM"-Teil-Datentabelle und eine „CON"-Teil-Datentabelle umfassen. Wenn eine Teil-Datentabelle mehr als die vorgegebene Anzahl von Wortobjekten 108 umfasst, zum Beispiel eine Quantität von 256, kann die Teil-Datentabelle weitere Teil-Datentabellen umfassen, die gemäß Präfixen mit vier Buchstaben organisiert werden. Es wird angemerkt, dass die oben erwähnte Quantität von 256 der Wortobjekte 108 dem höchsten numerischen Wert entspricht, der in einem Byte des Speichers 20 gespeichert werden kann.
Demgemäß wird, wenn bei 224 versucht wird, jedes Präfixobjekt zu verwenden, um ein entsprechendes Wortobjekt 108 zu identifizieren, und zum Beispiel das vorliegende Präfixobjekt „AP" ist, die „AP"-Datentabelle konsultiert. Da alle der Wortobjekte 108 in der „AP"-Datentabelle dem Präfixobjekt „AP" entsprechen, wird das Wortobjekt 108 in der „AP"-Datentabelle identifiziert, zu dem ein Häufigkeitsobjekt 104 gehört, das einen Häufigkeitswert hat, der relativ höher ist als einer der anderen Häufigkeitsobjekte 104 in der „AP"-Datentabelle. Das identifizierte Wortobjekt 108 und das zugehörige Häufigkeitsobjekt 104 werden dann in einem Resultat-Register gespeichert, das als ein Resultat der verschiedenen Vergleiche der erzeugten Präfixobjekte mit den Inhalten des Speichers 20 dient.
Es wird angemerkt, dass eines oder mehrere oder vielleicht alle der Präfixobjekte Präfixobjekte sind, für die ein entsprechendes Wortobjekt 108 nicht in dem Speicher 20 identifiziert wird. Derartige Präfixobjekte werden betrachtet als verwaiste Präfixobjekte und werden separat gespeichert oder werden anderweitig für möglichen zukünftigen Gebrauch behalten. In dieser Hinsicht wird angemerkt, dass viele oder alle der Präfixobjekte verwaiste Objekt werden können, wenn zum Beispiel der Benutzer versucht, ein neues Wort einzugeben, oder zum Beispiel, wenn der Benutzer falsch getippt hat und kein Wort der falsch getippten Eingabe entspricht.
Die Verarbeitung geht weiter, wie bei 232, wo doppelte Wortobjekte 108 mit relativ niedrigeren Häufigkeitswerten aus dem Ergebnis gelöscht werden. Ein solches doppeltes Wortobjekt 108 kann zum Beispiel erzeugt werden durch die andere Datenquelle 99.
Sobald die doppelten Wortobjekte 108 und die zugehörigen Häufigkeitsobjekte 104 bei 232 entfernt wurden, verzweigt sich die Verarbeitung, wie bei 234, zu einem Teilsystem in 9, unten beschrieben, wobei die Notwendigkeit zur Untersuchung von Kontextdaten evaluiert wird. Sobald die Kontextdaten evaluiert sind, wie in 9, kehrt die Verarbeitung zurück zu 236, wie in 3C, wobei die verbleibenden Präfixobjekte in einem Ausgabesatz in abnehmender Reihenfolge des Häufigkeitswerts angeordnet werden.
Wenn festgestellt wird, wie bei 240, dass die Markierung gesetzt wurde, was bedeutet, dass ein Benutzer eine Auswahl-Eingabe gemacht hat, entweder durch eine Express-Auswahl-Eingabe oder durch eine Umschalt-Eingabe einer Bewegungs-Eingabe, dann wird die standardmäßige Ausgabe 76 betrachtet als „versperrt (locked)", was bedeutet, dass die gewählte Variante das standardmäßige Präfix bis zum Ende der Sitzung ist. Wenn bei 240 festgestellt wird, dass die Markierung gesetzt wurde, geht die Verarbeitung weiter zu 244, wo die Inhalte des Ausgabesatzes geändert werden, wenn erforderlich, um als die standardmäßige Ausgabe 76 eine Ausgabe zu liefern, die das gewählte Präfixobjekt umfasst, ob es einem Wortobjekt 108 entspricht oder eine künstliche Variante ist. In dieser Hinsicht ist anzumerken, dass die Markierung mehrere Male während einer Sitzung gesetzt werden kann, in diesem Fall wird das gewählte Präfix, das zu dem Zurückstellen der Markierung gehört, danach die „gesperrte" standardmäßige Ausgabe 76 bis zu dem Ende der Sitzung oder bis eine andere Auswahl-Eingabe erfasst wird.
Die Verarbeitung geht dann weiter, wie bei 248, zu einem Ausgabeschritt, nach dem eine Ausgabe 64 erzeugt wird, wie oben beschrieben. Die Verarbeitung geht dann weiter bei 204, wo eine zusätzliche Eingabe erfasst wird. Wenn andererseits bei 240 festgestellt wird, dass die Markierung nicht gesetzt ist, geht die Verarbeitung direkt zu 248 ohne Änderung der Inhalte des Ausgabesatzes bei 244.
Wenn die erfasste Eingabe bestimmt wird, wie bei 212, als eine Bedieneingabe, dann geht die Verarbeitung weiter, um die spezifische Eigenschaft der Bedieneingabe festzustellen. Wenn zum Beispiel festgestellt wird, wie bei 252, dass die aktuelle Eingabe eine Auswahl-Eingabe ist, geht die Verarbeitung bei 254 weiter, wo die Markierung gesetzt wird. Dann kehrt die Verarbeitung zurück zur Erfassung von zusätzlichen Eingaben, wie bei 204.
Wenn festgestellt wird, wie bei 260, dass die Eingabe eine Delimiter- bzw. Begrenzungs-Eingabe ist, geht die Verarbeitung bei 264 weiter, wo die aktuelle Sitzung beendet wird und die Verarbeitung übergeben wird, wie bei 266, an das Lernen-Funktion-Teilsystem, wie bei 404 der 4. Eine Delimiter-Eingabe umfasst zum Beispiel die Betätigung einer <Leerzeichen (SPACE)>-Taste 116, die sowohl ein Delimiter-Symbol eingeben als auch ein Leerzeichen am Ende des Wortes hinzufügen würde, eine Betätigung der <ENTER>-Taste, die ähnlich eine Delimiter-Eingabe eingeben kann und ein Leerzeichen eingeben kann, und durch eine Translation des Thumbwheels 32, wie wird durch den Pfeil 38 angezeigt, die eine Delimiter-Eingabe eingeben kann, ohne zusätzlich ein Leerzeichen einzugeben.
Es wird zuerst festgestellt, wie bei 408, ob die standardmäßige Ausgabe zum Zeitpunkt der Erfassung der Demiliter-Eingabe bei 260 mit einem Wortobjekt 108 in dem Speicher 20 übereinstimmt. Wenn nicht, bedeutet dies, dass die standardmäßige Ausgabe eine Benutzer-erzeugte Ausgabe ist, die zu der „neue Wörter"-Datenbank 92 für zukünftigen Gebrauch hinzugefügt werden sollte. Unter solch einem Umstand geht dann die Verarbeitung weiter zu 412, wo die standardmäßige Ausgabe in der „neue Wörter"-Datenbank 92 als ein neues Wortobjekt 108 ge speichert wird. Zusätzlich wird ein Häufigkeitsobjekt 104 in der „neue Wörter"-Datenbank 92 gespeichert und zugeordnet zu dem vorher erwähnten neuen Wortobjekt 108. Dem neuen Häufigkeitsobjekt 104 wird ein relativ hoher Häufigkeitswert gegeben, typischerweise in dem oberen Viertel oder Drittel eines vorgegebenen Bereichs von möglichen Häufigkeitswerten.
In dieser Hinsicht wird Häufigkeitsobjekten 104 ein absoluter Häufigkeitswert im Allgemeinen in dem Bereich von null bis 65,535 gegeben. Der Maximalwert stellt die größte Anzahl dar, die in zwei Bytes des Speichers 20 gespeichert werden kann. Dem neuen Häufigkeitsobjekt 104, das in der „neue Wörter"-Datenbank 92 gespeichert wird, wird ein absoluter Häufigkeitswert in oberen Viertel oder Drittels dieses Bereichs zugewiesen, besonders, da das neue Wort von einem Benutzer verwendet wurde und wahrscheinlich wieder verwendet wird.
In weiterer Hinsicht zu dem Häufigkeitsobjekt 104 wird angemerkt, dass in einer gegebenen Datentabelle, wie der oben erwähnten „CO"-Datentabelle, der absolute Häufigkeitswert nur für das Häufigkeitsobjekt 104 gespeichert wird, das den höchsten Häufigkeitswert in der Datentabelle hat. Alle anderen Häufigkeitsobjekte 104 in der gleichen Datentabelle haben Häufigkeitswerte gespeichert als Prozentwerte, normalisiert zu dem vorher erwähnten maximalen absoluten Häufigkeitswert. Das heißt, nach Identifikation des Häufigkeitsobjektes 104 mit dem höchsten Häufigkeitswert in einer gegebenen Datentabelle, wird allen anderen Häufigkeitsobjekten 104 in der gleichen Datentabelle ein Prozentsatz des absoluten Maximalwerts zugewiesen, der das Verhältnis des relativ kleineren absoluten Häufigkeitswertes eines bestimmten Häufigkeitsobjektes 104 zu dem absoluten Häufigkeitswert des vorher erwähnten Häufigkeitsobjektes 104 mit dem höchsten Wert darstellt. Vorteilhafterweise können derartige Prozentsatzwerte in einem einzelnen Byte des Speichers gespeichert werden, wodurch Speicherplatz in der tragbaren elektronischen Vorrichtung 4 gespart wird.
Nach der Erzeugung des neuen Wortobjekts 108 und des neuen Häufigkeitsobjekts 104 und deren Speicherung in der „neue Wörter"-Datenbank 92 wird die Verarbeitung zu 420 übergeben, wo der Lernenprozess beendet wird. Die Verarbeitung kehrt dann zum Hauptprozess zurück, wie bei 204. Wenn bei 408 festgestellt wird, dass das Wortobjekt 108 in der standardmäßigen Ausgabe 76 mit einem Wortobjekt 108 in dem Speicher 20 übereinstimmt, dann kehrt die Verarbeitung direkt zu dem Hauptprozess bei 204 zurück.
Weiter hinsichtlich der Identifikation verschiedener Wortobjekte 108 zur Entsprechung mit erzeugten Präfixobjekten wird angemerkt, dass der Speicher 20 eine Anzahl von zusätzlichen Datenquellen 99 zusätzlich zu der generischen Wortliste 88 und der „neue Wörter"-Datenbank 92 umfassen kann, die alle als linguistische Quellen betrachtet werden können. Es ist offensichtlich, dass der Speicher 20 jede Anzahl anderer Datenquellen 99 umfassen kann. Die anderen Datenquellen 99 können zum Beispiel eine Adressdatenbank, eine Kurztext-Datenbank oder jede andere Datenquelle ohne Einschränkung umfassen. Eine beispielhafte Kurztext-Datenbank kann, zum Beispiel, Sätze von Wörtern oder Ausdrücken oder anderen Daten umfassen, die jeweils zum Beispiel zu einem Zeichen-String gehören, der abgekürzt werden kann. Zum Beispiel kann eine Kurztext-Datenbank den String „br" mit dem Satz von Wörtern „Best Regards" verbinden, mit der Absicht, dass ein Benutzer den String „br" schreiben kann und die Ausgabe „Best Regards" empfangen kann.
Wenn versucht wird, Wortobjekte 108 zu identifizieren, die einem gegebenen Präfixobjekt entsprechen, kann die tragbare elektronische Vorrichtung 4 alle Datenquellen in dem Speicher 20 abfragen. Zum Beispiel kann die tragbare elektronische Vorrichtung 4 die generische Wortliste 88, die „neue Wörter"-Datenbank 92 und die anderen Datenquellen 99 abfragen, um Wortobjekte 108 zu identifizieren, die dem Präfixobjekt entsprechen. Die Inhalte der anderen Datenquellen 99 können behandelt werden als Wortobjekte 108, und der Prozessor 16 kann Häufigkeitsobjekte 104 erzeugen, die derartigen Wortobjekten 108 zugeteilt werden und welchen ein Häufigkeitswert zugewiesen werden kann in zum Beispiel dem oberen Drittel oder Viertel des vorher erwähnten Häufigkeitsbereichs. Unter der Annahme, dass der zugewiesene Häufigkeitswert hoch genug ist, wird der String „br" zum Beispiel typischerweise an die Anzeige 60 ausgegeben. Wenn eine Delimiter-Eingabe hinsichtlich des Teils des Ausgabe erfasst wird, der die Verbindung zu dem Wortobjekt 108 in der Kurztext-Datenbank hat, zum Beispiel „br", würde der Benutzer die Ausgabe „Best Regards" empfangen, wobei offensichtlich ist, dass der Benutzer auch eine Auswahl-Eingabe als den beispielhaften String „br" eingegeben haben könnte.
Die Inhalte von einer der anderen Datenquellen 99 können behandelt werden als Wortobjekte 108 und können zu erzeugten Häufigkeitsobjekten 104 gehören, die den zugewiesenen Häufigkeitswert in dem vorher erwähnten oberen Teil des Häufigkeitsbereichs haben. Nachdem derartige Wortobjekte 108 identifiziert sind, kann die neue Wort-Lernen-Funktion, wenn geeignet, auf derartigen Wortobjekten 108 auf die oben dargelegte Art handeln.
Wenn festgestellt wird, wie bei 268, dass die aktuelle Eingabe eine Bewegungs-Eingabe ist, wie eingesetzt wird, wenn ein Benutzer versucht, ein Objekt zu editieren, entweder ein beendetes Wort oder ein Präfixobjekt in der aktuellen Sitzung, wird das Caret-Zeichen 84 auf die gewünschte Position verschoben, wie bei 272, und die Markierung wird gesetzt, wie bei 276. Die Verarbeitung kehrt dann dahin zurück, wo zusätzliche Eingaben erfasst werden können, wie bei 204.
In dieser Hinsicht ist es offensichtlich, dass verschiedene Typen von Bewegungs-Eingaben von der Eingabevorrichtung 8 erfasst werden können. Zum Beispiel kann eine Rotation des Thumbwheels 32, wie durch den Pfeil 34 der 1 angezeigt, eine Bewegungs-Eingabe liefern. In dem Fall, in dem solch eine Bewegungs-Eingabe erfasst wird, wie in dem Umstand einer editierenden Eingabe, wird die Bewegungs-Eingabe zusätzlich als eine Auswahl-Eingabe erfasst. Demgemäß und wie es der Fall ist mit einer Auswahl-Eingabe, wie bei 252 erfasst wird, ist die gewählte Variante effektiv gesperrt (locked) hinsichtlich des Standard-Teils 76 der Ausgabe 64. Jede Standard-Ausgabe 76 während der gleichen Sitzung umfasst notwendigerweise die vorher gewählte Variante.
In dem vorliegenden beispielhaften Ausführungsbeispiel der tragbaren elektronischen Vorrichtung 4 ist, wenn festgestellt wird, wie bei 252, dass die Eingabe keine Auswahl-Eingabe ist, und festgestellt wird, wie bei 260, dass die Eingabe keine Delimiter-Eingabe ist, und weiter festgestellt wie, wie bei 268, dass die Eingabe keine Bewegungs-Eingabe ist, in dem aktuellen beispielhaften Ausführungsbeispiel der tragbaren elektronischen Vorrichtung 4 die einzige verbleibende Bedieneingabe im Allgemeinen eine Erfassung der <LÖSCHEN(DELETE)>-Taste 86 der Tasten 28 des Tastaturfelds 24. Bei Erfassung der <DELETE>-Taste 86 wird das letzte Zeichen der standardmäßigen Ausgabe gelöscht, wie bei 280. Die Verarbeitung kehrt danach zurück zu 204, wo eine zusätzliche Eingabe erfasst werden kann.
Eine beispielhafte Eingabe-Sequenz wird in den 1 und 5–8 dargestellt. In diesem Beispiel versucht der Benutzer, das Wort „APPLOADER" einzugeben, und dieses Wort ist momentan nicht in dem Speicher 20 gespeichert. In 1 hat der Benutzer bereits die „AS"-Taste 28 eingegeben. Da die Datentabellen in dem Speicher 20 entsprechend zwei-Buchstaben-Präfixen organisiert sind, werden die Inhalte der Ausgabe 64 nach dem ersten Tastenanschlag von den N-Gramm-Objekten 112 in dem Speicher erlangt. Der erste Tastenanschlag „AS" entspricht einem ersten N-Gramm-Objekt 112 „S" und einem zugehörigen Häufigkeitsobjekt 104, sowie einem anderen N-Gramm-Objekt 112 „A" und einem zugehörigen Häufigkeitsobjekt 104. Während das Häufigkeitsobjekt 104, das zu „S" gehört, einen Häufigkeitswert hat, der größer ist als der des Häufigkeitsobjektes 104, das zu „A" gehört, wird angemerkt, dass „A" selbst ein vollständiges Wort ist. Ein vollständiges Wort wird immer als die standardmäßige Ausgabe 76 gegenüber anderer Präfixobjekte geliefert, die nicht mit vollständigen Wörtern übereinstim men, unabhängig eines zugehörigen Häufigkeitswerts. Somit ist in der 1 der Standard-Teil 76 der Ausgabe 64 „A".
In der 5 hat der Benutzer zusätzlich die „OP"-Taste 28 eingegeben. Die Varianten werden in der 5 dargestellt. Da das Präfixobjekt „SO" auch ein Wort ist, wird es als die standardmäßige Ausgabe 76 geliefert. In der 6 hat der Benutzer wieder die „OP"-Taste 28 eingegeben und hat auch die „L"-Taste 28 eingegeben. Es wird angemerkt, dass die beispielhafte „L"-Taste 28, die hier dargestellt wird, nur das einzelne Zeichen 48 „L" umfasst.
Es wird in dem vorliegenden Beispiel angenommen, dass keine Bedieneingaben bis jetzt erfasst wurden. Die standardmäßige Ausgabe 76 ist „APPL", wie dem Wort „APPLE" entsprechen würde. Das Präfix „APPL" wird sowohl in der Textkomponente 68 sowie in dem Standard-Teil 76 der Varianten-Komponente 72 dargestellt. Verschiedene Präfixobjekte in dem Varianten-Teil 80 umfassen „APOL", wie dem Wort „APOLOGIZE" entsprechen würde, und das Präfix „SPOL", das dem Wort „SPOLIATION" entsprechen würde.
Es wird insbesondere angemerkt, dass die zusätzlichen Varianten „AOOL", „AOPL", „SOPL" und „SOOL" auch als Varianten 80 in der Varianten-Komponente 72 dargestellt werden. Da kein Wortobjekt 108 diesen Präfixobjekten entspricht, werden die Präfixobjekte als verwaiste Präfixobjekte betrachtet, für die kein entsprechendes Wortobjekt 108 identifiziert wurde. In dieser Hinsicht kann es für die Varianten-Komponente 72 wünschenswert sein, eine spezifische Quantität von Eintragungen zu umfassen, und im Falle des vorliegenden beispielhaften Ausführungsbeispiels ist die Quantität sieben Eintragungen. Nach dem Erlangen des Resultats bei 224, wenn die Quantität von Präfixobjekten in dem Resultat weniger ist als die vorgegebene Quantität, versucht die Disambiguierungsfunktion, zusätzliche Ausgaben zu liefern, bis die vorgegebene Anzahl von Ausgaben geliefert ist.
In der 7 hat der Benutzer zusätzlich die „OP"-Taste 28 eingegeben. Unter diesem Umstand und wie in 7 zu sehen ist, wurde der Standard-Teil 76 der Ausgabe 64 das Präfixobjekt „APOLO", wie es dem Wort „APOLOGIZE" entsprechen würde, während unmittelbar vor der aktuellen Eingabe der Standard-Teil 76 der Ausgabe 64 der 6 „APPL" war, wie dem Wort „APPLE" entsprechen würde. Wieder unter der Annahme, dass keine Bedieneingaben erfasst wurden, entspricht das standardmäßige Präfixobjekt in der 7 nicht dem vorhergehenden standardmäßigen Präfixobjekt der 6. Somit wird die erste künstliche Variante „APOLP" erzeugt und dieser wird in dem aktuellen Beispiel eine bevorzugte Position gegeben. Die oben angeführte künstliche Variante „APOLP" wird erzeugt durch Löschen des letzten Zeichens des Standard-Präfixobjekts „APOLO" und durch Liefern stattdessen eines entgegengesetzten Zeichens 48 der Taste 28, die das letzte Zeichen des Standard-Teils 76 der Ausgabe 64 erzeugte, was in dem aktuellen Beispiel der 7 „P" ist, so dass die oben angeführte künstliche Variante „APOLP" ist.
Ferner, da die vorhergehende Standard-Ausgabe „APPL" einem Wortobjekt 108 entsprach, wie dem Wortobjekt 108, das dem Wort „APPLE" entspricht, und da mit der Hinzufügung der aktuellen Eingabe die vorhergehende Standard-Ausgabe „APPL" nicht länger einem Wortobjekt 108 entspricht, werden zwei zusätzliche künstliche Varianten erzeugt. Eine künstliche Variante ist „APPLP" und die andere künstliche Variante ist „APPLO", und diese entsprechen der vorhergehenden standardmäßigen Ausgabe „APPL" plus den Zeichen 48 der Taste 28, die betätigt wurde, um die aktuelle Eingabe zu erzeugen. Diese künstlichen Varianten werden ähnlich als Teil des Varianten-Teils 80 der Ausgabe 64 ausgegeben.
Wie in 7 gesehen werden kann, scheint der Standard-Teil 76 der Ausgabe 64 „APOLO" nicht länger mit dem übereinzustimmen, was als ein Präfix für „APPLOADER" benötigt würde, und der Benutzer erwartet wahrscheinlich, dass das gewünschte Wort „APPLOADER" noch nicht in dem Speicher 20 gespeichert ist. Somit liefert der Benutzer eine Auswahl-Eingabe, wie durch Scrollen mit dem Thumbwheel 32, bis der Varianten-String „APPLO" hervorgehoben ist. Der Benutzer fährt dann mit der Eingabe fort und gibt die „AS"-Taste ein.
Die Ausgabe 64 einer solchen Aktion wird in der 8 dargestellt. Hier ist der String „APPLOA" der Standard-Teil 76 der Ausgabe 64. Da der Varianten-String „APPLO" der Standard-Teil 76 der Ausgabe 64 (nicht ausdrücklich hierin dargestellt) als ein Resultat der Auswahl-Eingabe wurde hinsichtlich des Varianten-Strings „APPLO" und da der Varianten-String „APPLO" nicht einem Wortobjekt 108 entspricht, wurden die Zeichen-Strings „APPLOA" und „APPLOS" als künstliche Varianten erzeugt. Zusätzlich, da der vorhergehende Standard der 7, „APOLO", vorher einem Wortobjekt 108 entsprochen hat, aber jetzt nicht länger dem Standard-Teil 76 der Ausgabe 64 der 8 entspricht, wurden auch die zusätzlichen künstlichen Varianten von „APOLOA" und „APOLOS" erzeugt. Derartigen künstlichen Varianten wird eine bevorzugte Position gegenüber den drei angezeigten verwaisten Präfixobjekten gegeben.
Da die aktuelle Eingabe-Sequenz in dem Beispiel nicht mehr einem Wortobjekt 108 entspricht, werden die Teile des Verfahrens, die den Versuch betreffen, entsprechende Wortobjekte 108 zu finden, nicht mit weiteren Eingaben für die aktuelle Sitzung ausgeführt. Das heißt, da kein Wortobjekt 108 der aktuellen Eingabe-Sequenz entspricht, entsprechen weitere Eingaben ebenfalls keinem Wortobjekt 108. Ein Vermeiden der Suche des Speichers 20 nach derartigen nicht existierenden Wortobjekten 108 spart Zeit und vermeidet vergeudete Verarbeitungsbemühungen.
Da der Benutzer zu schreiben fortfährt, gibt der Benutzer schließlich erfolgreich das Wort „APPLOADER" ein und gibt eine Delimiter-Eingabe ein. Bei Erfassen der Delimiter-Eingabe nach der Eingabe von „APPLOADER", wird die Lernen-Funktion initiiert. Da das Wort „APPLOADER" nicht einem Wortobjekt 108 in dem Speicher 20 entspricht, wird ein neues Wortobjekt 108 erzeugt, das „APPLOADER" entspricht, und wird in der „neue Wörter"-Datenbank 92 gespei chert, zusammen mit einem entsprechenden neuen Häufigkeitsobjekt 104, dem eine absolute Häufigkeit beispielsweise in dem oberen Drittel oder Viertel des möglichen Häufigkeitsbereichs gegeben wird. In dieser Hinsicht wird angemerkt, dass die „neue Wörter"-Datenbank 92 im Allgemeinen in zwei-Zeichen-Präfix-Datentabellen organisiert ist, die denen ähnlich sind, die in der generischen Wortliste 88 zu finden sind. Somit wird dem neuen Häufigkeitsobjekt 104 zuerst ein absoluter Häufigkeitswert zugewiesen, aber bei Speicherung wird der absolute Häufigkeitswert, wenn es nicht der Maximalwert in dieser Datentabelle ist, geändert, um einen normalisierten Häufigkeitswert-Prozentsatz zu umfassen, normalisiert auf das, was der maximale Häufigkeitswert in dieser Datentabelle ist.
Es wird angemerkt, dass das Layout der Zeichen 48 auf den Tasten 28 in 1 ein beispielhaftes Zeichen-Layout ist, das eingesetzt wird, wenn die beabsichtigte primäre Sprache, die auf der tragbaren elektronischen Vorrichtung 4 verwendet wird, zum Beispiel Englisch ist. Andere Layouts, die diese Zeichen 48 und/oder andere Zeichen umfassen, können verwendet werden abhängig von der beabsichtigten primären Sprache und jedem Sprachenvorzug in der Herstellung der Sprachobjekte 100.
Wie anderweitig hier erwähnt, wird ein vollständiges Wort, das während eines Disambiguierungszyklus identifiziert wird, immer als eine Standard-Ausgabe 76 vorgesehen bevorzugt zu anderen Präfixobjekten, die nicht mit vollständigen Wörtern übereinstimmen, unabhängig eines zugehörigen Häufigkeitswerts. Das heißt, ein Wortobjekt 108, das einer vieldeutigen Eingabe entspricht und eine Länge hat, die gleich ist zu der der vieldeutigen Eingabe, wird an einer Position von Priorität über andere Präfixobjekte ausgegeben. Wie hier verwendet, sollen der Ausdruck „Länge" und Variationen davon eine Quantität von Elementen betreffen, aus denen ein Objekt besteht, wie die Quantität der linguistischen Elemente, aus denen ein Sprachobjekt 100 besteht.
Wenn mehr als ein vollständiges Wort während eines Disambiguierungszyklus identifiziert wird, können alle vollständigen Wörter ausgegeben werden in Reihenfolge einer abnehmenden Häufigkeit zueinander, wobei jedes an einer Prioritätsposition gegenüber den Präfixobjekten ist, die repräsentativ sind für unvollständige Wörter. Jedoch kann es in bestimmten Umständen wünschenswert sein, zusätzliche Daten einzusetzen, wenn verfügbar, um die vollständigen Wörter auf eine Weise zu priorisieren, die für den Benutzer vorteilhafter ist.
Die tragbare elektronische Vorrichtung 4 umfasst folglich vorteilhafterweise die Kontextdaten-Tabelle 49, die in dem Speicher 20 gespeichert ist. Die beispielhafte Kontextdaten-Tabelle 49 hat eine Anzahl von vieldeutigen Wörtern und zugehörige Kontextdaten gespeichert.
Spezifisch weist die Kontextdaten-Tabelle 49 eine Anzahl von Schlüssel-Objekten 47 und, zugehörig zu jedem Schlüssel-Objekt 47, eine Anzahl zugehöriger Kontextwert-Objekte 51 auf. In dem vorliegenden beispielhaften Ausführungsbeispiel, in dem die englische Sprache auf der tragbaren elektronischen Vorrichtung 4 eingesetzt wird, ist jedes Schlüssel-Objekt 47 ein Wortobjekt 108. Das heißt, ein Schlüssel-Objekt 47 in der Kontextdaten-Tabelle 49 wird auch als ein Wortobjekt 108 in einer aus der generischen Wort-Liste 88, der „neue Wörter"-Datenbank 92 und der anderen Datenquellen 99 gespeichert. Jedes Schlüssel-Objekt 47 hat zugeordnet ein oder mehrere Kontextwert-Objekte 51, die jeweils ein bestimmtes Kontextdatenelement darstellen. Wenn ein Schlüssel-Objekt 47 während eines Zyklus der Disambiguierung in Bezug auf eine vieldeutige Eingabe identifiziert wird und wenn ein Kontextwert-Objekt 51, das zu dem Schlüssel-Objekt 47 gehört, mit einem Kontext der vieldeutigen Eingabe übereinstimmt, wird das Wortobjekt 108, das dem Schlüssel-Objekt 47 entspricht, als eine Standard-Wort-Ausgabe an der Text-Komponente 68 und an dem Standard-Teil 76 der Varianten-Komponente 72 ausgegeben. In anderen Ausführungsbeispielen ist jedoch offensichtlich, dass die Schlüssel-Objekte 47 in anderen Formen als in der Form von Wortobjekten 108 sein können.
Die Inhalte der Kontextdaten-Tabelle 49 werden erlangt durch Analysieren der Sprachobjekte 100 und des Datenkorpus, aus denen die Sprachobjekte 100 und die Häufigkeitsobjekte 104 erlangt wurden. Zuerst werden die Sprachobjekte 100 analysiert, um vieldeutige Wortobjekte 108 zu identifizieren. Ein Satz vieldeutiger Wortobjekte 108 ist repräsentativ für eine Vielzahl von vollständigen Wörtern, die jeweils aus derselben vieldeutigen Eingabe gebildet werden, wie zum Beispiel die Wörter „TOP" und „TOO", die jeweils aus der vieldeutigen Eingabe <TY><OP><OP> gebildet werden. Jedes vieldeutige Wortobjekt 108 hat ein zugehöriges Häufigkeitsobjekt 104. In einem gegebenen Satz von vieldeutigen Wortobjekten 108, ist jedes vieldeutige Wortobjekt 108, das ein Häufigkeitsobjekt 104 hat mit einem Häufigkeitswert, der geringer ist als der höchste in dem Satz, ein Kandidaten-Schlüssel-Objekt 47. Das heißt, in einem gegebenen Satz von vieldeutigen Wortobjekten 108 sind alle vieldeutigen Wortobjekte 108 Kandidaten-Schlüssel-Objekte 47, außer das vieldeutige Wortobjekt 108 mit einem zugehörigen Häufigkeitsobjekt 104, das den relativ höchsten Häufigkeitswert in dem Satz hat. Dies ist aufgrunddessen, wie detaillierter anderweitig hier erläutert wird, da die erwartete Situation, in der Kontextdaten während einer Texteingabe relevant sind, die ist, wenn eine Vielzahl von vieldeutigen Wortobjekten 108 in einem Disambiguierungszyklus identifiziert werden, und ein weniger häufiges vieldeutiges Wortobjekt 108 wird wünschenswert ausgegeben an einer relativ bevorzugten Position, da es eine passendere Lösung in einem bestimmten Kontext ist.
Sobald die Kandidaten-Schlüssel-Objekte 47 identifiziert sind, wird der Datenkorpus analysiert, um alle gültigen Kontextdaten für die Kandidaten-Schlüssel-Objekte 47 zu identifizieren. Gültige Kontextdaten ist jeder bestimmte Kontext, in dem ein statistisch signifikantes Auftreten eines bestimmten Schlüssel-Objekts 47 auftritt.
Ein beispielhafter Kontext ist der, in dem ein bestimmtes vieldeutiges Wort, in einem statistisch signifikanten Ausmaß, einem bestimmten Wort folgt. Zum Bei spiel und weiter mit dem obigen Beispiel, kann festgestellt werden, dass das Schlüsselwort „TOP" auftritt, in einem statistisch signifikanten Ausmaß, nach dem Kontext-Wort „TABLE" und nach dem Kontext-Wort „HILL". Abhängig von der Konfiguration der Kontextdaten-Tabelle 49, kann solch ein Kontext auf ein bestimmtes Wort begrenzt sein, das einem bestimmten vieldeutigen Wort unmittelbar vorangeht, oder er kann ein bestimmtes Wort umfassen, das einem bestimmten vieldeutigen Wort nach einem, zwei, drei oder mehreren Wörtern vorangeht. Das heißt, das vieldeutige Schlüsselwort „TOP" kann in einem statistisch bedeutenden Ausmaß auftreten, wenn es unmittelbar dem Kontextwort „TABLE" folgt, aber das gleiche vieldeutige Schlüsselwort „TOP" kann in einem statistisch bedeutenden Ausmaß auftreten, wenn es dem Kontextwort „HILL" unmittelbar oder nach zwei, drei oder vier Wörtern folgt. In solch einem Umstand wird das vieldeutige Wortobjekt 108 „TOP" als ein Schlüssel-Objekt 47 gespeichert und die Wortobjekte 108 „TABLE" und „HILL" werden als zwei zugehörige Kontextwert-Objekte 51 gespeichert.
Ein weiterer beispielhafter Kontext ist der, in dem ein bestimmtes vieldeutiges Wort, in einem statistisch signifikanten Ausmaß, ein erstes Wort in einem Satz ist. In solch einer Situation kann der identifizierte Kontext der sein, in dem das bestimmte vieldeutige Wort, in einem statistisch signifikanten Ausmaß, einem oder mehreren bestimmten Interpunktionszeichen folgt, wie dem Punkt „.", dem Fragezeichen „?" und dem Ausrufezeichen „!". In solch einer Situation ist das Kontextwert-Objekt 51 das bestimmte Interpunktionssymbol, wobei jedes solche statistisch signifikante Interpunktionssymbol ein separates Kontextwert-Objekt 51 ist.
Ein weiterer beispielhafter Kontext ist der, in dem ein bestimmtes vieldeutiges Wort, in einem statistisch bedeutenden Ausmaß, einer anderen Eingabe folgt, die in einem vorgegebenen Format ist. In solch einer Situation kann der identifizierte Kontext zum Beispiel der sein, in dem das bestimmte vieldeutige Wort, in einem statistisch signifikanten Ausmaß, einer Eingabe folgt, die eine bestimmte Anord nung von numerischen Komponenten hat. Zum Beispiel kann ein numerisch angezeigtes Datum in einem der folgenden Formate angezeigt werden: NN/NN/NNNN oder NN/NN/NN oder N/NN/NNNN oder N/NN/NN oder N/N/NNNN oder N/N/NN oder andere Formate, wobei sich „N" auf eine arabische Ziffer bezieht und "/„ kann sich auf jedes eines bestimmten Symbols beziehen, einen Delimiter bzw. Begrenzer, oder eine „Null", wie ein <SPACE> bzw. Leerzeichen oder nichts. Als solches kann festgestellt werden, dass ein bestimmtes vieldeutiges Wort, in einem statistisch signifikanten Ausmaß, einer anderen Eingabe folgt, die in einem von einem oder mehrerer der Formate NN/NN/NNNN oder NN/NN/NN oder N/NN/NNNN oder N/NN/NN oder N/N/NNNN oder N/N/NN ist. Wieder kann das bestimmte vieldeutige Wort der formatierten Eingabe unmittelbar folgen oder kann zwei, drei oder mehrere Wörter hinter der formatierten Eingabe folgen. In solch einer Situation ist das Kontextwert-Objekt 51 eine Repräsentation des bestimmten Formats, wobei jedes derartiges statistisch signifikante Format ein getrenntes Kontextwert-Objekt 51 ist.
Spezifischer, die Kontextwert-Objekte 51 können jeweils gespeichert werden als ein Hash, d. h. ein ganzzahliger Wert, der aus einer mathematischen Manipulation resultiert. Zum Beispiel werden die zwei Kontextwert-Objekte 51 „TABLE" und „HILL", während sie Wortobjekte 108 sind, in der Kontextdaten-Tabelle 49 als Hashes der Wörter „TABLE" und „HILL" gespeichert. Die Schlüssel-Objekte 47, wie das Wort „TOP", können ebenfalls jeweils als Hash gespeichert werden.
Die drei Kontextwert-Objekte 51 „.", „?" und „!" werden jeweils als ein Hash gespeichert, d. h. ein ganzzahliger Wert, der mehr in der Eigenschaft einer Markierung bzw. eines Flags ist, d. h. ein ganzzahliger Wert, der für ein Interpunktionssymbol selbst repräsentativ ist oder einen Wert hat, der unterschiedlich ist zu dem Hash eines der sechsundzwanzig lateinischen Buchstaben. Die Kontextwertobjekte 51 in der Eigenschaft von vorgegebenen Formaten konnten ähnlich gespeichert werden.
Während einer Texteingabe behält das Disambiguierungssystem in einem temporären Speicher-Register einen Hash einer Anzahl der Eingaben bei, die der aktuellen vieldeutigen Eingabe vorangehen. Zum Beispiel, wenn der Benutzer versucht, den Ausdruck „CLIMB THE HILL AND REACH THE TOP" einzugeben, berechnet und speichert die Disambiguierungs-Routine 22 einen Hash von jedem von einem oder mehreren der Wörter „CLIMB", „THE", „HILL", „AND", „REACH", und „THE" als Eingabewerte 53, bevor der Benutzer die Reihe von Tastenanschlägen <TY><OP><OP> eingibt, die in den vieldeutigen Wörtern „TOO" und „TOP" resultieren. Der Speicher 20 kann konfiguriert werden, nur eine bestimmte Quantität solcher Eingabewerte 53 zu speichern, die auf einer „first-in-first-out"-Basis ersetzt werden, wenn zusätzliche Wörter eingegeben werden. Wenn zum Beispiel der Speicher nur die letzten vier Eingaben als Eingabewerte 53 speichert, sind die vier Eingabewerte, die zu dem Zeitpunkt existieren, wenn der Benutzer die Tastenanschläge für das Wort „TOP" eingibt, Hashes der Wörter „HILL", „AND", „REACH" und „THE". In anderen Systemen zum Beispiel kann die Disambiguierungs-Routine als einen Eingabewert nur die eine Eingabe speichern, die unmittelbar der aktuellen Eingabe vorangeht.
Sobald der Benutzer die Reihe von Tastenanschlägen <TY><OP><OP> eingibt, bestimmt die Disambiguierungs-Routine, dass die zwei Wortobjekte 108 „TOO" und „TOP" jeweils der Reihe von Tastenanschlägen <TY><OP><OP> entsprechen und eine gleiche Länge haben, und stellt folglich fest, dass die zwei Wortobjekte 108 „TOO" und „TOP" vieldeutige Wörter repräsentieren. Wenn angenommen wird, dass das vieldeutige Wortobjekt 108 „TOO" ein zugehöriges Häufigkeitsobjekt 104 hat, das einen Häufigkeitswert hat, der höher als der des Häufigkeitsobjekts 104 ist, das zu dem vieldeutigen Wortobjekt 108 „TOP" gehört, konsultiert die Disambiguierungs-Routine 22 die Kontextdaten-Tabelle 49, um festzustellen, ob der bereits eingegebene Text einen Kontext liefert, wobei es angemessen ist, das Wortobjekt 108 „TOP" an einer Position einer höheren Priorität als das höhere Häufigkeits-Wortobjekt 108 „TOO" auszugeben.
Spezifisch sucht die Disambiguierungs-Routine 22, ob die Kontextdaten-Tabelle 49 ein Schlüssel-Objekt 47 gespeichert hat, das mit dem Wortobjekt 108 „TOP" übereinstimmt. Wenn solch ein Schlüssel-Objekt 47 gefunden wird, werden die verschiedenen Kontextwert-Objekten 51, die zu dem Schlüssel-Objekt 47 „TOP" gehören, mit jedem der Eingabewerte 53 verglichen, die in dem vorliegenden Beispiel Hashes der Wörter „HILL", „AND", „REACH" und „THE" sind, um festzustellen, ob irgendwelche der Kontextwert-Objekte 51 mit irgendwelchen der Eingabewerte 53 übereinstimmen oder nicht. Wie hier eingesetzt, sollen der Ausdruck „übereinstimmen" und Variationen davon weit jeden Typ einer vorgegebenen Äquivalenz, Entsprechung, Zugehörigkeit und dergleichen betreffen, deren Existenz zwischen zwei oder mehreren Objekten festgestellt werden kann. Da eines der Kontextwert-Objekte 51, die zu dem Schlüssel-Objekt 47 „TOP" gehören, ein Hash des Wortobjekts 108 „HILL" ist, und da einer der Eingabewerte 53 ein Hash des vorher eingegebenen Worts „HILL" ist, wird bei einem Vergleich festgestellt, dass die beiden Hashes übereinstimmen auf der Basis einer Gleichheit. Als ein Ergebnis wird das Schlüssel-Objekt 47, d. h. das vieldeutige Wortobjekt 108, „TOP" ausgegeben an einer Position von Priorität in Bezug auf das vieldeutige Wortobjekt 108 „TOO", obwohl das vieldeutige Wortobjekt 108 „TOO" eine relativ höhere Häufigkeit hat.
Die Disambiguierungs-Routine 22 speichert als Eingabewerte 53 auch Hashes, die repräsentativ sind für Interpunktionssymbole und Nicht-Wort-Eingaben, zur Verwendung im Vergleich mit Kontextwert-Objekten 51 auf die gleiche Weise. Dies ist nützlich bei einer Suche nach Kontexten, wobei die Kontextwert-Objekte 51 repräsentativ sind für Interpunktionszeichen, vorgegebene Formate und dergleichen. Wenn zum Beispiel das vorgegebene Format ein Datumsformat ist, wie oben vorgeschlagen, wird ein zugehöriges Schlüsselobjekt 47 an einer bevorzugten Position ausgegeben, wenn ihm eine Eingabe in der Form eines Datums vorangeht. Es ist offensichtlich, dass zahlreich andere Typen von vordefinierten Formaten eingesetzt werden können, wie ein anderes Datumsformat, wie „Monat Datum, Jahr" oder „Datum Monat Jahr", Zeitformate und jeder andere Typ eines vorgegebenen Formats, wenn als ein statistisch bedeutender Kontext festgestellt. Es ist auch offensichtlich, dass zahlreiche andere Typen von Kontexten mit der Disambiguierungs-Routine 22 identifiziert, gespeichert und eingesetzt werden können, ohne von dem vorliegenden Konzept abzuweichen.
Das vorliegende System ist insbesondere vorteilhaft aufgrund seiner Flexibilität. Es erfordert nicht die Einrichtung von umfassenden „Regeln" für eine Priorisierung von Wörtern in Kontexten. Stattdessen hat jedes weniger häufige vieldeutige Wort zugehörige statistisch signifikante Kontextdaten, was der tragbaren elektronischen Vorrichtung 4 ermöglicht, für die Bedürfnisse des Benutzers anpassungsfähig und anpassbar zu sein.
Kurz zusammengefasst, folglich, und allgemein dargestellt in 9 als abzweigend von dem Hauptprozess bei 234 in 3A, stellt die Disambiguierungs-Routine 22 fest, wie bei 604, ob zumindest zwei der Wortobjekte 108, die bei 224 in 3A identifiziert werden und gespeichert sind in dem Ergebnis, jeweils eine Länge haben, die gleich ist zu der der vieldeutigen Eingabe, und folglich vieldeutige Wortobjekte 108 sind, oder nicht. Wenn nicht, kehrt die Verarbeitung zurück, wie bei 608, zu dem Hauptprozess bei 236 in 3C. Wenn bei 604 festgestellt wird, dass das Ergebnis zumindest zwei vieldeutige Wortobjekte 108 umfasst, geht die Verarbeitung weiter zu 612, wo festgestellt wird, ob ein Schlüssel-Objekt 47, das einem der vieldeutigen Wortobjekte 108, außer dem Wortobjekt 108 mit höchster Häufigkeit, entspricht, in der Kontextdaten-Tabelle 49 gespeichert ist oder nicht. Wenn nicht, kehrt die Verarbeitung zurück, wie bei 608, zu dem Hauptprozess bei 236 in 3C.
Wenn bei 612 festgestellt wird, dass ein entsprechendes Schlüssel-Objekt 47 existiert, dann geht die Verarbeitung weiter, wie bei 616, wo die Kontextwert-Objekte 51, die zu dem identifizierten Schlüssel-Objekt 47 gehören, jeweils mit den gespeicherten Eingabewerten 53 verglichen werden, um zu identifizieren, ob ein Schlüssel-Objekt 47 und ein Eingabewert 53 übereinstimmen oder nicht. Wenn keine übereinstimmen, kehrt die Verarbeitung zurück, wie bei 608, zu dem Hauptprozess bei 236 in 3C. Wenn jedoch festgestellt wird bei 616, dass Schlüssel-Objekt 47 und ein Eingabewert 53 übereinstimmen, dann wird das Wortobjekt 108, das dem Schlüssel-Objekt 47 entspricht, ausgegeben, wie bei 620, an einer Position von Priorität in Bezug auf das häufigste vieldeutige Wortobjekt 108, das bei 604 identifiziert wird. Die Verarbeitung kehrt dann zurück, wie bei 608, zu dem Hauptprozess bei 236 in 3C.
Die Disambiguierungs-Routine 22 ist zusätzlich vorteilhafterweise konfiguriert, um bestimmte Kontextdaten zu lernen. Spezifisch kann die Disambiguierungs-Routine 22 die Kontextdaten des vorangehenden Wort-Typs identifizieren, wenn ein Benutzer bei zwei getrennten Gelegenheiten ein bestimmtes weniger bevorzugtes vieldeutiges Wortobjekt 108 in demselben Kontext auswählt.
Zum Beispiel können bei einer ersten Gelegenheit eine Vielzahl von vieldeutigen Wortobjekten 108 ausgegeben werden als Reaktion auf eine erste vieldeutige Eingabe, und ein Benutzer kann ein bestimmtes weniger bevorzugtes vieldeutiges Wortobjekt 108 auswählen. In solch einem Umstand werden das gewählte weniger bevorzugte vieldeutige Wortobjekt 108 und der spezifische Kontext als eine Eingabe in einer Kandidatendatendatei gespeichert.
Wenn bei einer zweiten Gelegenheit eine Vielzahl von vieldeutigen Wortobjekten 108 ausgegeben werden als Reaktion auf eine zweite vieldeutige Eingabe und wenn der Benutzer ein weniger bevorzugtes vieldeutiges Wortobjekt 108 auswählt, werden das weniger bevorzugte vieldeutige Wortobjekt 108 und der Kontext mit den verschiedenen Eingaben in der Kandidatendatendatei verglichen. Wenn eine Eingabe in der Kandidatendatendatei gefunden wird, die mit dem weniger bevorzugten vieldeutigen Wortobjekt 108 und dem Kontext der zweiten vieldeutigen Eingabe übereinstimmt, wird die Eingabe aus der Kandidatendatendatei zu der Kontextdaten-Tabelle 49 verschoben. Die neu gespeicherte Eingabe in der Kontextdaten-Tabelle 49 kann danach eingesetzt werden, wie oben dargelegt.
Es wird jedoch angemerkt, dass die Kandidatendatendatei ein Datenpuffer mit begrenzter Kapazität ist. Wenn zusätzliche Eingaben zu der Kandidatendatendatei hinzugefügt werden, werden ältere Eingaben, die nicht zu der Kontextdaten-Tabelle 49 verschoben wurden, gelöscht auf einer „first-in-first-out"-Basis. Die begrenzte Größe der Kandidatendatendatei fügt somit zu der Kontext-Lernenfunktion so etwas wie eine Benutzungshäufigkeits-Begrenzung hinzu. Das heißt, abhängig von einer Benutzung, kann eine Eingabe in die Kandidatendatendatei entweder zu der Kontextdaten-Tabelle 49 verschoben werden oder kann aus der Kandidatendatendatei entfernt werden, um für zusätzliche Eingaben Platz zu machen. Wenn die Eingabe zu der Kontextdaten-Tabelle 49 verschoben wird, zeigt dies an, dass der Benutzer das bestimmte weniger bevorzugte vieldeutige Wortobjekt 108 in dem bestimmten Kontext mit genügender Häufigkeit wünscht, um dessen Speicherung als gültige Kontextdaten zu gewährleisten. Andererseits zeigt ein Löschen der Kandidateneingabe, um Platz zu schaffen für zusätzliche Kandidateneingaben, dass die Kandidateneingabe nicht mit ausreichender Regelmäßigkeit oder Häufigkeit verwendet wurde, um zu gewährleisten, dass sie gespeichert wird als gelernte gültige Kontextdaten in der Kontextdaten-Tabelle 49.
Das gewählte weniger bevorzugte vieldeutige Wortobjekt 108 wird als ein Schlüssel-Objekt 47 in der Kontextdaten-Tabelle 49 gespeichert, wenn solch ein Schlüssel-Objekt 47 noch nicht existiert. Zusätzlich wird ein Hash des vorhergehenden Wort-Kontextes als ein Kontextwert-Objekt 51 gespeichert und dem vorher erwähnten Schlüssel-Objekt 47 zugeordnet. In dieser Hinsicht kann der vorhergehende Wort-Kontext einfach das unmittelbar vorangehende Wort sein. Es ist jedoch offensichtlich, dass der Kontext möglicherweise einer sein kann, in dem ein bestimmtes Kontext-Wort um zwei, drei oder mehr Wörter dem vieldeutigen Wortobjekt 108 vorangeht, für das der Kontext gelernt wird. Derartiger Kontext kann vorteilhafterweise gelernt werden für Wortobjekte 108 in der „neue Wörter"- Datenbank 92 und in jeder anderen Datenquelle in dem Speicher 20. Es ist auch offensichtlich, dass andere Typen von Kontexten durch die Disambiguierungs-Routine 22 gelernt werden können.
Außerdem können gelernte Kontextdaten verlernt werden. Zum Beispiel können ein bestimmtes Schlüssel-Objekt 47 und ein entsprechendes bestimmtes Kontextwert-Objekt 51 zu der Kontextdaten-Tabelle 49 über die vorher erwähnte Lernenfunktion hinzugefügt werden. An einem Punkt in der Zukunft kann der Benutzer in dem bestimmten Kontext beginnen, eine Ausgabe zu bevorzugen, die vorher eine Standard-Ausgabe war, zugunsten dessen ein weniger bevorzugtes vieldeutiges Wortobjekt 108 bei zwei Gelegenheiten gewählt wurde und als Kontextdaten gespeichert wurde. Wenn dies bei zwei Gelegenheiten geschieht, werden das vorher gelernte bestimmte Schlüssel-Objekt 47 und das entsprechende bestimmte Kontextwert-Objekt 51 vorteilhafterweise verlernt, d. h. aus der Kontextdaten-Tabelle 49 gelöscht. Das heißt, das System arbeitet, als wenn das vorher gelernte bestimmte Schlüssel-Objekt 47 und das entsprechende bestimmte Kontextwert-Objekt 51 als keine gültigen Kontextdaten bestimmt werden. Dies vermeidet die Verwendung von Kontextdaten, die nicht gewünscht sind oder die als ungültig angesehen werden.
Während spezifische Ausführungsbeispiele des offenbarten und beanspruchten Konzepts im Detail beschrieben wurden, ist für Fachleute offensichtlich, dass verschiedene Modifikationen und Alternativen zu jenen Details hinsichtlich der gesamten Lehren der Offenbarung entwickelt werden können. Demgemäß sollen die bestimmten Anordnungen, die offenbart werden, nur illustrativ und nicht begrenzend sein hinsichtlich des Umfangs des offenbarten und beanspruchten Konzepts, dem der volle Umfang der angefügten Ansprüche und jedes und alle Äquivalente davon gegeben werden soll.
Eine tragbare elektronische Vorrichtung umfasst eine reduzierte QWERTY-Tastatur und ist mit einer Disambiguierungs-Software versehen, die betriebsfähig ist, eine Texteingabe zu disambiguieren. Zusätzlich zum Identifizieren und Ausgeben von Repräsentationen von Sprachobjekten, die in dem Speicher gespeichert sind und die einer Texteingabe entsprechen, kann die Vorrichtung Kontextdaten in bestimmten Umständen verwenden, um eine Ausgabe zu priorisieren und neue Kontextdaten zu lernen.
ZITATE ENTHALTEN IN DER BESCHREIBUNG
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
Zitierte Patentliteratur

- US 6452588 [0019]
- US 6489950 [0019]

Claims

Verfahren zur Ermöglichung einer Eingabe in eine tragbare elektronische Vorrichtung eines Typs, der eine Eingabevorrichtung, eine Ausgabevorrichtung und eine Prozessorvorrichtung umfasst, die einen Speicher aufweist, der eine Vielzahl von Objekten gespeichert hat, einschließlich einer Vielzahl von Sprachobjekten und einer Anzahl von Kontextwerten, wobei zumindest einige der Sprachobjekte jeweils zumindest einen ersten Kontextwert zugewiesen haben, wobei die Eingabevorrichtung eine Vielzahl von Eingabeelementen aufweist, wobei zumindest einigen der Eingabeelemente jeweils eine Vielzahl von linguistischen Elementen zugewiesen ist, wobei das Verfahren aufweist: Erfassen einer ersten Eingabe; Ausgeben als eine erste Ausgabe eine Interpretation der ersten Eingabe; Erfassen als eine zweite Eingabe eine vieldeutige Eingabe, die eine Anzahl von Eingabeelementbetätigungen aufweist; Ausgeben zumindest eines Teils von jedem eines ersten Sprachobjekts und eines zweiten Sprachobjekts als vorgeschlagene Interpretationen der vieldeutigen Eingabe, wobei der zumindest Teil des ersten Sprachobjekts ausgegeben wird an einer Position von Präferenz hinsichtlich des zumindest Teils des zweiten Sprachobjekts; Erfassen einer Auswahl des zumindest Teils des zweiten Sprachobjekts; Erfassen einer anderen ersten Eingabe; Ausgeben als eine andere erste Ausgabe eine Interpretation der anderen ersten Eingabe, wobei die erste Ausgabe und die andere erste Ausgabe gleich sind; Erfassen als eine andere zweite Eingabe eine andere vieldeutige Eingabe, die eine andere Anzahl von Eingabeelementbetätigungen aufweist; Ausgeben zumindest eines Teils von jedem eines anderen ersten Sprachobjekts und eines anderen zweiten Sprachobjekts als vorgeschlagene Interpretationen der anderen vieldeutigen Eingabe, wobei der zumindest Teil des anderen ersten Sprachobjekts ausgegeben wird an einer Position von Präferenz hinsichtlich des zumindest Teils des anderen zweiten Sprachobjekts, wobei das zweite Sprachobjekt und das andere zweite Sprachobjekt gleich sind; Erfassen einer Auswahl des zumindest Teils des anderen zweiten Sprachobjekts und als Reaktion darauf: Speichern zumindest eine aus einer Repräsentation der anderen ersten Eingabe und einer Repräsentation der anderen ersten Ausgabe als einen Kontextwert, Zuordnen des Kontextwerts zu dem anderen zweiten Sprachobjekt.
Verfahren gemäß Anspruch 1, das weiter aufweist: Erfassen einer zusätzlichen ersten Eingabe; Ausgeben einer zusätzlichen ersten Ausgabe als eine Interpretation der zusätzlichen ersten Eingabe; Erfassen als eine zusätzliche zweite Eingabe eine zusätzliche vieldeutige Eingabe, die eine zusätzliche Anzahl von Eingabeelementbetätigungen aufweist; Erzeugen eines Ausgabesatzes, der zumindest einen Teil von jedem eines zusätzlichen ersten Sprachobjekts und eines zusätzlichen zweiten Sprachobjekts als vorgeschlagene Interpretationen der zusätzlichen vieldeutigen Eingabe aufweist, wobei das zweite Sprachobjekt und das zusätzliche zweite Sprachobjekt gleich sind; Bestimmen, dass zumindest eine aus einer Repräsentation der zusätzlichen ersten Eingabe und einer Repräsentation der zusätzlichen ersten Ausgabe mit dem Kontextwert übereinstimmt; und als Reaktion auf die Bestimmung, Ausgeben des zumindest Teils des zusätzlichen zweiten Sprachobjekts an einer Position von Präferenz hinsichtlich des zumindest Teils des zusätzlichen ersten Sprachobjekts.
Verfahren gemäß Anspruch 2, das weiter aufweist: Identifizieren als das zusätzliche erste Sprachobjekt ein Wortobjekt, das repräsentativ ist für ein relativ häufigeres vieldeutiges Wort; Identifizieren als das zusätzliche zweite Sprachobjekt ein Wortobjekt, das repräsentativ ist für ein relativ weniger häufiges vieldeutiges Wort; und Bestimmen als die Bestimmung, dass das weniger häufige vieldeutige Wort, in dem Kontext der zusätzlichen ersten Ausgabe, an einer Position von Präferenz zu dem relativ häufigeren vieldeutigen Wort ausgegeben werden soll.
Verfahren gemäß Anspruch 2, das weiter aufweist: Erfassen einer Auswahl des zumindest Teils des zusätzlichen ersten Sprachobjekts; und als Reaktion auf das Erfassen einer Auswahl, Löschen des Kontextwertes.
Verfahren gemäß Anspruch 1, das weiter aufweist: Identifizieren als das erste Sprachobjekt ein Sprachobjekt mit einer Länge, die gleich ist zu der der vieldeutigen Eingabe; Identifizieren als das zweite Sprachobjekt ein Sprachobjekt mit einer Länge, die gleich ist zu der der vieldeutigen Eingabe; Identifizieren als das andere erste Sprachobjekt ein Sprachobjekt mit einer Länge, die gleich ist zu der der anderen vieldeutigen Eingabe; Identifizieren als das andere zweite Sprachobjekt ein Sprachobjekt mit einer Lange, die gleich ist zu der der anderen vieldeutigen Eingabe; und als Reaktion darauf, Initiieren des Speicherns und des Zuordnens.
Tragbare elektronische Vorrichtung, die aufweist eine Eingabevorrichtung, eine Prozessorvorrichtung und eine Ausgabevorrichtung, wobei die Eingabevorrichtung eine Anzahl von Eingabeelementen aufweist, wobei die Prozessorvorrichtung einen Prozessor und einen Speicher aufweist, der eine Vielzahl von Objekten gespeichert hat, die eine Vielzahl von Sprachobjekten und eine Anzahl von Kontextwerten aufweisen, wobei zumindest einige der Sprachobjekte jeweils zumindest einen ersten Kontextwert zugewiesen haben, wobei der Speicher eine Anzahl von Routinen gespeichert hat, die, wenn durch den Prozessor ausgeführt, die tragbare elektronische Vorrichtung veranlassen, angepasst zu werden, um Operationen durchzuführen, die aufweisen: Erfassen einer ersten Eingabe; Ausgeben als eine erste Ausgabe eine Interpretation der ersten Eingabe; Erfassen als eine zweite Eingabe eine vieldeutige Eingabe, die eine Anzahl von Eingabeelementbetätigungen aufweist; Ausgeben zumindest eines Teils von jedem eines ersten Sprachobjekts und eines zweiten Sprachobjekts als vorgeschlagene Interpretationen der vieldeutigen Eingabe, wobei der zumindest Teil des ersten Sprachobjekts ausgegeben wird an einer Position von Präferenz hinsichtlich des zumindest Teils des zweiten Sprachobjekts; Erfassen einer Auswahl des zumindest Teils des zweiten Sprachobjekts; Erfassen einer anderen ersten Eingabe; Ausgeben als eine andere erste Ausgabe eine Interpretation der anderen ersten Eingabe, wobei die erste Ausgabe und die andere erste Ausgabe gleich sind; Erfassen als eine andere zweite Eingabe eine andere vieldeutige Eingabe, die eine andere Anzahl von Eingabeelementbetätigungen aufweist; Ausgeben zumindest eines Teils von jedem eines anderen ersten Sprachobjekts und eines anderen zweiten Sprachobjekts als vorgeschlagene Interpretationen der anderen vieldeutigen Eingabe, wobei der zumindest Teil des anderen ersten Sprachobjekts ausgegeben wird an einer Position von Präferenz hinsichtlich des zumindest Teils des anderen zweiten Sprachobjekts, wobei das zweite Sprachobjekt und das andere zweite Sprachobjekt gleich sind; Erfassen einer Auswahl des zumindest Teils des anderen zweiten Sprachobjekts und als Reaktion darauf: Speichern zumindest eine aus einer Repräsentation der anderen ersten Eingabe und einer Repräsentation der anderen ersten Ausgabe als einen Kontextwert, Zuordnen des Kontextwerts zu dem anderen zweiten Sprachobjekt.
Tragbare elektronische Vorrichtung gemäß Anspruch 6, wobei die Operationen weiter aufweisen: Erfassen einer zusätzlichen ersten Eingabe; Ausgeben einer zusätzlichen ersten Ausgabe als eine Interpretation der zusätzlichen ersten Eingabe; Erfassen als eine zusätzliche zweite Eingabe eine zusätzliche vieldeutige Eingabe, die eine zusätzliche Anzahl von Eingabeelementbetätigungen aufweist; Erzeugen eines Ausgabesatzes, der zumindest einen Teil von jedem eines zusätzlichen ersten Sprachobjekts und eines zusätzlichen zweiten Sprachobjekts als vorgeschlagene Interpretationen der zusätzlichen vieldeutigen Eingabe aufweist, wobei das zweite Sprachobjekt und das zusätzliche zweite Sprachobjekt gleich sind; Bestimmen, dass zumindest eine aus einer Repräsentation der zusätzlichen ersten Eingabe und einer Repräsentation der zusätzlichen ersten Ausgabe mit dem Kontextwert übereinstimmt; und als Reaktion auf die Bestimmung, Ausgeben des zumindest Teils des zusätzlichen zweiten Sprachobjekts an einer Position von Präferenz hinsichtlich des zumindest Teils des zusätzlichen ersten Sprachobjekts.
Tragbare elektronische Vorrichtung gemäß Anspruch 7, wobei die Operationen weiter aufweisen: Identifizieren als das zusätzliche erste Sprachobjekt ein Wortobjekt, das repräsentativ ist für ein relativ häufigeres vieldeutiges Wort; Identifizieren als das zusätzliche zweite Sprachobjekt ein Wortobjekt, das repräsentativ ist für ein relativ weniger häufiges vieldeutiges Wort; und Bestimmen als die Bestimmung, dass das weniger häufige vieldeutige Wort, in dem Kontext der zusätzlichen ersten Ausgabe, an einer Position von Präferenz zu dem relativ häufigeren vieldeutigen Wort ausgegeben werden soll.
Tragbare elektronische Vorrichtung gemäß Anspruch 7, wobei die Operationen weiter aufweisen: Erfassen einer Auswahl des zumindest Teils des zusätzlichen ersten Sprachobjekts; und als Reaktion auf das Erfassen einer Auswahl, Löschen des Kontextwertes.
Tragbare elektronische Vorrichtung gemäß Anspruch 6, wobei die Operationen weiter aufweisen: Identifizieren als das erste Sprachobjekt ein Sprachobjekt mit einer Länge, die gleich ist zu der der vieldeutigen Eingabe; Identifizieren als das zweite Sprachobjekt ein Sprachobjekt mit einer Länge, die gleich ist zu der der vieldeutigen Eingabe; Identifizieren als das andere erste Sprachobjekt ein Sprachobjekt mit einer Länge, die gleich ist zu der der anderen vieldeutigen Eingabe; Identifizieren als das andere zweite Sprachobjekt ein Sprachobjekt mit einer Länge, die gleich ist zu der der anderen vieldeutigen Eingabe; und als Reaktion darauf, Initiieren des Speicherns und des Zuordnens.