DE112007000856B4 - Tragbare elektronische Vorrichtung und Verfahren zum Verwenden von Kontextdaten zur Disambiguierung einer Texteingabe - Google Patents

Tragbare elektronische Vorrichtung und Verfahren zum Verwenden von Kontextdaten zur Disambiguierung einer Texteingabe Download PDF

Info

Publication number
DE112007000856B4
DE112007000856B4 DE112007000856.3T DE112007000856T DE112007000856B4 DE 112007000856 B4 DE112007000856 B4 DE 112007000856B4 DE 112007000856 T DE112007000856 T DE 112007000856T DE 112007000856 B4 DE112007000856 B4 DE 112007000856B4
Authority
DE
Germany
Prior art keywords
input
word
objects
ambiguous
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE112007000856.3T
Other languages
English (en)
Other versions
DE112007000856T5 (de
Inventor
Vadim Fux
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Malikie Innovations Ltd Ie
Original Assignee
Research in Motion Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Research in Motion Ltd filed Critical Research in Motion Ltd
Publication of DE112007000856T5 publication Critical patent/DE112007000856T5/de
Application granted granted Critical
Publication of DE112007000856B4 publication Critical patent/DE112007000856B4/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/274Converting codes to words; Guess-ahead of partial word inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0237Character input methods using prediction or retrieval techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Machine Translation (AREA)
  • Input From Keyboards Or The Like (AREA)
  • Telephone Function (AREA)

Abstract

Verfahren zur Ermöglichung einer Eingabe in eine tragbare elektronische Vorrichtung, die eine Eingabevorrichtung, eine Ausgabevorrichtung und eine Prozessorvorrichtung umfasst, die einen Speicher aufweist, der eine Vielzahl von Objekten gespeichert hat, einschließlich einer Vielzahl von Sprachobjekten, einer Vielzahl von Häufigkeitsobjekten und einer Anzahl von Kontextwerten, wobei zumindest einige der Sprachobjekte jeweils ein Häufigkeitsobjekt mit einem Häufigkeitswert zugewiesen haben, wobei zumindest einige der Sprachobjekte jeweils zumindest einen Kontextwert zugewiesen haben, wobei ein Kontextwert ein Hash eines Sprachobjekts ist, wobei die Eingabevorrichtung eine Vielzahl von Eingabeelementen aufweist, wobei zumindest einigen der Eingabeelemente jeweils eine Vielzahl von linguistischen Elementen zugewiesen ist, wobei das Verfahren aufweist: Erfassen einer ersten Eingabe; Ausgeben als eine erste Ausgabe eines ersten Sprachobjekts als eine Interpretation der ersten Eingabe; Speichern eines Hashwertes des ersten Sprachobjekts in dem Speicher; Erfassen als eine zweite Eingabe eine vieldeutige Eingabe, die eine Anzahl von Eingabeelementbetätigungen aufweist; Bestimmen, dass ein bestimmtes Sprachobjekt, das ein bestimmtes Häufigkeitsobjekt mit einem bestimmten Häufigkeitswert zugewiesen hat, der vieldeutigen Eingabe entspricht, wobei das bestimmte Sprachobjekt eine Länge hat, die zu derjenigen der vieldeutigen Eingabe gleich ist; ...

Description

  • Hintergrund
  • Gebiet
  • Das offenbarte und beanspruchte Konzept betrifft im Allgemeinen tragbare bzw. handgehaltene elektronische Vorrichtungen (handheld electronic devices) und insbesondere eine tragbare elektronische Vorrichtung, die eine reduzierte Tastatur und eine Text-Eingabe-Disambiguierungsfunktion hat, die Kontextdaten verwenden kann.
  • Hintergrundinformation
  • Zahlreiche Typen von tragbaren elektronischen Vorrichtungen sind bekannt. Beispiele derartiger tragbarer elektronischer Vorrichtungen umfassen zum Beispiel persönliche Datenassistenten (PDAs – personal data assistants), tragbare Computer, Zweiweg-Pager, zellulare Telefone und dergleichen. Viele tragbare elektronische Vorrichtungen weisen auch eine drahtlose Kommunikationsfähigkeit auf, obwohl viele derartige tragbare elektronische Vorrichtungen unabhängige Vorrichtungen sind, die ohne Kommunikation mit anderen Vorrichtungen funktional sind.
  • Derartige tragbare elektronische Vorrichtungen sollen im Allgemeinen tragbar sein und haben folglich eine relativ kompakte Konfiguration, in der Tasten und andere Eingabestrukturen häufig mehrfache Funktionen unter bestimmten Umständen durchführen oder anderweitig mehrere Aspekte oder Eigenschaften zugewiesen haben. Mit Fortschritten in der Technologie werden tragbare elektronische Vorrichtungen hergestellt, um immer kleinere Formfaktoren zu haben, und dennoch eine immer größere Anzahl von Anwendungen und Eigenschaften darauf zu haben. In der Praxis können die Tasten eines Tastaturfelds nur auf eine bestimmte kleine Größe verringert werden, bevor die Tasten relativ unbrauchbar werden. Um eine Texteingabe zu ermöglichen, muss jedoch ein Tastaturfeld zum Beispiel zur Eingabe aller sechsundzwanzig Buchstaben des lateinischen Alphabets sowie einer passenden Interpunktion und anderer Symbole fähig sein.
  • Eine Art des Vorsehen von zahlreichen Buchstaben in einem kleinen Raum war, eine „reduzierte Tastatur” vorzusehen, in der mehrere Buchstaben, Symbole und/oder Zahlen und dergleichen, jeder gegebenen Taste zugewiesen werden. Zum Beispiel umfasst ein Tasten(touch-tone)-Telefon ein reduziertes Tastaturfeld durch Vorsehen von zwölf Tasten, von denen zehn Zahlen darauf haben und von diesen zehn Tasten haben acht lateinische Buchstaben zugewiesen. Zum Beispiel umfasst eine der Tasten die Zahl „2” sowie die Buchstaben „A”, „B” und „C”. Andere bekannte reduzierte Tastaturen umfassten andere Anordnungen für Tasten, Buchstaben, Symbole, Zahlen und dergleichen. Da eine einzige Betätigung einer derartigen Taste von dem Benutzer vorgesehen sein kann, sich möglicherweise auf einen der Buchstaben „A”, „B” und „C” zu beziehen und sich möglicherweise auch auf die Zahl „2” beziehen soll, ist die Eingabe im Allgemeinen eine vieldeutige (ambiguous) Eingabe und bedarf eines Typs einer Disambiguierung, um für Texteingabezwecke nützlich zu sein.
  • Um einem Benutzer zu ermöglichen, die mehrfachen Buchstaben, Zahlen und dergleichen auf jeder gegebenen Taste zu verwenden, wurden zahlreiche Tastenanschlags-Interpretationssysteme vorgesehen. Zum Beispiel ermöglicht ein „Mehrfach-Tippen(multi-tap)”-System einem Benutzer, im Wesentlichen eindeutig ein bestimmtes Zeichen auf einer Taste zu spezifizieren durch Drücken derselben Taste mehrere Male, äquivalent zu der Position des gewünschten Zeichen auf der Taste. Ein anderes beispielhaftes Tastenanschlags-Interpretationssystem umfasst ein Tasten-„Chording”, von dem verschiedene Typen existieren. Zum Beispiel kann ein bestimmtes Zeichen eingegeben werden durch Drücken zweier Tasten hintereinander oder durch Drücken und Halten einer ersten Taste, während eine zweite Taste gedrückt wird. Ein weiteres beispielhaftes Tastenanschlags-Interpretationssystem ist eine „Drücken-und-Halten/Drücken-und-Freigabe”-Interpretationsfunktion, in der eine gegebene Taste ein erstes Resultat liefert, wenn die Taste betätigt und sofort losgelassen wird, und ein zweites Resultat liefert, wenn die Taste für eine kurze Zeitdauer betätigt und gehalten wird. Ein weiteres Tastenanschlags-Interpretationssystem, das eingesetzt wurde, ist eine Software-basierte Text-Disambiguierungsfunktion. In solch einem System drückt ein Benutzer typischerweise Tasten, denen ein oder mehrere Zeichen zugewiesen wurden, im Allgemeinen wird jede Taste ein Mal für jeden gewünschten Buchstaben gedrückt, und die Disambiguierungs-Software versucht, die beabsichtigte Eingabe vorauszusagen. Zahlreiche derartige Systeme wurden vorgeschlagen und während viele für ihre beabsichtigten Zwecken im Allgemeinen effektiv waren, existieren weiter Defizite.
  • Es wäre wünschenswert, eine verbesserte tragbare elektronische Vorrichtung mit einer reduzierten Tastatur vorzusehen, die versucht, eine QWERTY-Tastatur-Erfahrung oder eine andere bestimmte Tastaturerfahrung zu imitieren. Solch eine verbesserte tragbare elektronische Vorrichtung kann auch wünschenswerterweise konfiguriert werden mit ausreichenden Eigenschaften, um eine Texteingabe und andere Aufgaben mit relativer Mühelosigkeit zu ermöglichen.
  • Die US 5,818,437 offenbart eine Disambiguierung für eine reduzierte Tastatur.
  • J. Matiasek, M. Baroni: „Exploiting long distance collocational relations in predictive typing”, in Proceedings of the EACL Workshop on Language Modeling for Text Entry Methods, Budapest, Hungany, pp. 1–8, 2003 schlägt ein Hinzufügen einer Komponente zur Prognose aufgrund von Kollokation zu einem prognosebasierten Eingabesystem vor.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • Ein vollständiges Verständnis des offenbarten und beanspruchten Konzepts kann aus der folgenden Beschreibung gewonnen werden, wenn in Verbindung mit den beigefügten Zeichnungen gelesen, wobei:
  • 1 eine Draufsicht auf eine verbesserte tragbare elektronische Vorrichtung gemäß dem offenbarten und beanspruchten Konzept ist;
  • 2 eine schematische Darstellung der verbesserten tragbaren elektronischen Vorrichtung der 1 ist;
  • 2A eine schematische Darstellung eines Teils der tragbaren elektronischen Vorrichtung von 2 ist;
  • 3A, 3B und 3C ein beispielhaftes Flussdiagramm sind, das bestimmte Aspekte einer Disambiguierungsfunktion darstellt, die auf der tragbaren elektronischen Vorrichtung der 1 ausgeführt werden kann;
  • 4 ein weiteres beispielhaftes Flussdiagramm ist, das bestimmte Aspekte eines Lernverfahrens darstellt, das auf der tragbaren elektronischen Vorrichtung ausgeführt werden kann;
  • 5 eine beispielhafte Ausgabe während eines Texteingabebetriebs ist;
  • 6 eine weitere beispielhafte Ausgabe während eines anderen Teils des Texteingabebetriebes ist;
  • 7 eine weitere beispielhafte Ausgabe während eines anderen Teils des Texteingabebetriebes ist;
  • 8 eine weitere beispielhafte Ausgabe während eines anderen Teils des Texteingabebetriebes ist;
  • 9 ein beispielhaftes Flussdiagramm ist, das die Verwendung von Kontextdaten während eines Texteingabebetriebes darstellt.
  • Ähnliche Ziffern beziehen sich auf ähnliche Teile in der Spezifikation.
  • BESCHREIBUNG
  • Eine verbesserte tragbare elektronische Vorrichtung 4 wird allgemein in der 1 gezeigt und wird schematisch in der 2 dargestellt. Die beispielhafte tragbare elektronische Vorrichtung 4 umfasst ein Gehäuse 6, auf dem eine Prozessoreinheit angebracht ist, die eine Eingabevorrichtung 8, eine Ausgabevorrichtung 12, einen Prozessor 16 und einen Speicher 20 umfasst und zumindest eine erste Routine. Der Prozessor 16 kann zum Beispiel und ohne Einschränkung ein Mikroprozessor (μP) sein und reagiert auf Eingaben von der Eingabevorrichtung 8 und liefert Ausgabesignale an die Ausgabevorrichtung 12. Der Prozessor 16 ist auch mit dem Speicher 20 verbunden. Der Prozessor 16 und der Speicher 20 bilden zusammen eine Prozessorvorrichtung. Beispiele von tragbaren elektronischen Vorrichtungen sind in den U.S.-Patenten Nr. 6,452,588 und 6,489,950 enthalten.
  • Wie aus der 1 offensichtlich ist, umfasst die Eingabevorrichtung 8 ein Tastaturfeld 24 und ein Thumbwheel 32. Wie detaillierter unten beschrieben wird, ist das Tastaturfeld 24 in der beispielhaften Form einer reduzierten QWERTY-Tastatur einschließlich einer Vielzahl von Tasten 28, die als Eingabeelemente dienen. Es wird jedoch angemerkt, dass das Tastaturfeld 24 andere Konfigurationen haben kann, wie eine AZERTY-Tastatur, eine QWERTZ-Tastatur oder eine andere Tastaturanordnung, ob momentan bekannt oder unbekannt und entweder reduziert oder nicht reduziert. Wie hierin eingesetzt, sollen der Ausdruck „reduziert” und Variationen davon in dem Kontext einer Tastatur, eines Tastaturfelds oder einer anderen Anordnung von Eingabeelementen breit auf eine Anordnung verweisen, in der zumindest einem der Eingabeelemente eine Vielzahl von linguistischen Elementen zugewiesen ist, wie zum Beispiel Zeichen in dem Satz von lateinischen Buchstaben, wobei eine Betätigung des zumindest einen der Eingabeelemente, ohne eine andere Eingabe in Kombination damit, eine vieldeutige Eingabe ist, da sie mehr als eines der Vielzahl der zugewiesenen linguistischen Elemente betreffen kann. Wie hierin eingesetzt, sollen der Ausdruck „linguistisches Element” und Variationen davon breit auf jedes Element verweisen, das selbst ein Sprachobjekt sein kann oder aus welchem ein Sprachobjekt konstruiert, identifiziert oder anderweitig erhalten werden kann, und umfasst folglich zum Beispiel und ohne Einschränkung Zeichen, Buchstaben, Anschläge, Ideogramme, Phoneme, Morpheme, Zahlen und dergleichen. Wie hierin eingesetzt, sollen der Ausdruck „Sprachobjekt” und Variationen davon breit auf jeden Typ von Objekt verweisen, der aus einem oder mehreren linguistischen Elementen konstruiert, identifiziert oder anderweitig erhalten werden kann, die alleine oder in Kombination verwendet werden können, um Text zu erzeugen, und das umfasst zum Beispiel und ohne Einschränkung Wörter, Abkürzungen, Symbole, Ideogramme und dergleichen.
  • Die Systemarchitektur der tragbaren elektronischen Vorrichtung 4 ist vorteilhafterweise organisiert, um unabhängig von dem spezifischen Layout des Tastaturfelds 24 betriebsfähig zu sein. Demgemäß kann die Systemarchitektur der tragbaren elektronischen Vorrichtung 4 in Verbindung mit praktisch jedem Tastaturfeld-Layout eingesetzt werden, im Wesentlichen ohne eine bedeutsame Änderung in der Systemarchitektur zu erfordern. Es wird weiter angemerkt, dass bestimmte der Eigenschaften, die hierin dargelegt werden, entweder auf einer oder auf beiden einer reduzierten Tastatur und einer nicht reduzierten Tastatur verwendbar sind.
  • Die Tasten 28 sind auf einer Vorderseite des Gehäuses 6 angeordnet und das Thumbwheel 32 ist an einer Seite des Gehäuses 6 angeordnet. Das Thumbwheel 32 kann als ein weiteres Eingabeelement dienen und ist sowohl drehbar, wie durch den Pfeil 34 angezeigt wird, um Auswahleingaben an den Prozessor 16 zu liefern, und kann auch gedrückt werden in eine Richtung im Allgemeinen zum Gehäuse 6 hin, wie durch den Pfeil 38 angezeigt wird, um eine andere Auswahleingabe an den Prozessor 16 zu liefern.
  • Wie in 1 weiter gesehen werden kann, umfassen viele der Tasten 28 eine Anzahl von darauf angeordneten linguistischen Elementen 48. Wie hierin eingesetzt, soll der Ausdruck „eine Anzahl von” und Variationen davon breit auf jede Quantität verweisen, einschließlich einer Quantität von eins. In der beispielhaften Darstellung des Tastaturfelds 24 umfassen viele der Tasten 28 zwei zugewiesene linguistische Elemente, wie Umfassen eines ersten linguistischen Elements 52 und eines zweiten linguistischen Elements 56.
  • Eine der Tasten 28 des Tastaturfelds 24 umfasst als die Zeichen 48 davon die Buchstaben „Q” und „W”, und eine angrenzende Taste 28 umfasst als die Zeichen 48 davon die Buchstaben „E” und „R”. Es ist zu sehen, dass die Anordnung der Zeichen 48 auf den Tasten 28 des Tastaturfelds 24 im Allgemeinen eine QWERTY-Anordnung ist, wenngleich viele der Tasten 28 zwei der Zeichen 28 umfassen.
  • Die Ausgabevorrichtung 12 umfasst eine Anzeige 60, auf der eine Ausgabe 64 vorgesehen werden kann. Eine beispielhafte Ausgabe 64 wird auf der Anzeige 60 in der 1 dargestellt. Die Ausgabe 64 umfasst eine Textkomponente 68 und eine Varianten-Komponente 72. Die Varianten-Komponente 72 umfasst einen Standard-Teil 76 und einen Varianten-Teil 80. Die Anzeige umfasst auch ein Caret-Zeichen 84, das im Allgemeinen darstellt, wo die nächste Eingabe von Eingabevorrichtung 8 empfangen wird.
  • Die Textkomponente 68 der Ausgabe 64 liefert eine Darstellung des Standard-Teils 76 der Ausgabe 64 an einer Position auf der Anzeige 60, wo der Text eingegeben wird. Die Varianten-Komponente 72 wird im Allgemeinen in der Nähe der Textkomponente 68 angeordnet und liefert, zusätzlich zu der standardmäßigen vorgeschlagenen Ausgabe 76, eine Darstellung der verschiedenen alternativen Textwahlmöglichkeiten, d. h. Alternativen zu der standardmäßigen vorgeschlagenen Ausgabe 76, die durch eine Eingabe-Disambiguierungsfunktion in Reaktion auf eine Eingabesequenz von Tastenbetätigungen der Tasten 28 vorgeschlagen werden.
  • Wie detaillierter unten beschrieben wird, wird der Standard-Teil 76 durch die Disambiguierungsfunktion vorgeschlagen als die wahrscheinlichste disambiguierte Interpretation der vieldeutigen Eingabe, die durch den Benutzer vorgesehen ist. Der Varianten-Teil 80 umfasst eine vorgegebene Quantität von alternativen vorgeschlagenen Interpretationen derselben vieldeutigen Eingabe, aus denen der Benutzer wählen kann, wenn gewünscht. Es wird angemerkt, dass der beispielhafte Varianten-Teil 80 hierin dargestellt wird als sich vertikal unter den Standard-Teil 76 erstreckend, aber es ist offensichtlich, dass zahlreich andere Anordnungen vorgesehen werden können.
  • Der Speicher 20 wird schematisch in der 2A dargestellt. Der Speicher 20 kann jeder einer Vielzahl von Typen von internen und/oder externen Speichermedien sein, wie, ohne Einschränkung, RAM, ROM, EPROM(s), EEPROM(s) und dergleichen, die ein Speicherregister zur Datenspeicherung vorsehen, wie in der Art eines internen Speicherbereichs eines Computers, und kann ein volatiler Speicher oder ein nicht-volatiler Speicher sein. Der Speicher 20 umfasst zusätzlich eine Anzahl von Routinen, die allgemein mit dem Bezugszeichen 22 dargestellt werden, für die Verarbeitung von Daten. Die Routinen 22 können in jeder einer Vielzahl von Formen sein, wie, ohne Einschränkung, Software, Firmware und dergleichen. Wie detaillierter unten erklärt wird, umfassen die Routinen 22 die vorher erwähnte Disambiguierungsfunktion als eine Anwendung sowie andere Routinen.
  • Wie aus der 2A zu verstehen ist, umfasst der Speicher 20 zusätzlich Daten, die in einer Anzahl von Tabellen, Sätzen, Listen und/oder anderweitig gespeichert und/oder organisiert sind. Spezifisch umfasst der Speicher 20 eine generische Wortliste 88, eine „neue Wörter”-Datenbank 92, eine andere Datenquelle 99 und eine Kontextdaten-Tabelle 49.
  • In den verschiedenen Bereichen des Speichers 20 ist eine Anzahl von Sprachobjekten 100 und Häufigkeitsobjekten 104 gespeichert. Die Sprachobjekte 100 gehören im Allgemeinen jeweils zu einem zugehörigen Häufigkeitsobjekt 104. Die Sprachobjekte 100 umfassen in dem vorliegenden beispielhaften Ausführungsbeispiel eine Vielzahl von Wortobjekten 108 und eine Vielzahl von N-Gramm-Objekten 112. Die Wortobjekte 108 sind allgemein repräsentativ für komplette Wörter in der Sprache oder kundenspezifische Wörter, die in dem Speicher 20 gespeichert sind. Wenn zum Beispiel die in dem Speicher gespeicherte Sprache zum Beispiel Englisch ist, repräsentiert im Allgemeinen jedes Wortobjekt 108 ein Wort in der englischen Sprache oder repräsentiert ein kundenspezifisches Wort.
  • Zu im Wesentlichen jedem Wortobjekt 108 gehört ein Häufigkeitsobjekt 104, das einen Häufigkeitswert hat, der die relative Häufigkeit innerhalb der relevanten Sprache des gegebenen Wortes anzeigt, das durch das Wortobjekt 108 repräsentiert wird. In dieser Hinsicht umfasst die generische Wortliste 88 einen Korpus von Wortobjekten 108 und zugehörigen Häufigkeitsobjekten 104, die zusammen eine breite Vielfalt von Wörtern und ihre relative Häufigkeit in einer gegebenen Umgangssprache von zum Beispiel einer gegebenen Sprache darstellen. Die generische Wortliste 88 kann auf eine einer breiten Vielfalt von Arten abgeleitet werden, wie durch Analysieren zahlreicher Texte und anderer Sprachquellen, um die verschiedenen Wörter innerhalb der Sprachquellen sowie ihre relativen Wahrscheinlichkeiten, d. h. relativen Häufigkeiten, des Auftretens der verschiedenen Wörter in den Sprachquellen zu bestimmen.
  • Die N-Gramm-Objekte 112, die in der generischen Wortliste 88 gespeichert sind, sind kurze Ketten von Zeichen in der relevanten Sprache, typischerweise zum Beispiel ein bis drei Zeichen in der Länge und repräsentieren typischerweise Wortfragmente in der relevanten Sprache, obwohl bestimmte der N-Gramm-Objekte 112 zusätzlich selbst Wörter sein können. Jedoch zu dem Ausmaß, dass ein N-Gramm-Objekt 112 auch ein Wort in der relevanten Sprache ist, wird dasselbe Wort wahrscheinlich separat gespeichert als ein Wortobjekt 108 in der generischen Wortliste 88. Wie hier eingesetzt, sollen der Ausdruck „Kette (string)” und Variationen davon breit auf ein Objekt verweisen, das ein oder mehrere Zeichen oder Komponenten hat, und kann sich auf eines eines kompletten Wortes, eines Fragments eines Wortes, eines kundenspezifischen Wortes oder eines Ausdrucks und dergleichen beziehen.
  • In dem vorliegenden beispielhaften Ausführungsbeispiel der tragbaren elektronischen Vorrichtung 4 umfassen die N-Gramm-Objekte 112 1-Gramm-Objekte, d. h. Ketten- bzw. String-Objekte, die ein Zeichen in der Länge sind, 2-Gramm-Objekte, d. h. String-Objekte, die zwei Zeichen in der Länge sind, und 3-Gramm-Objekte, d. h. String-Objekte, die drei Zeichen in der Länge sind, die kollektiv als N-Gramme 112 bezeichnet werden. Im Wesentlichen gehört jedes N-Gramm-Objekt 112 in der generischen Wortliste 88 ähnlich zu einem zugehörigen Häufigkeitsobjekt 104, das in der generischen Wortliste 88 gespeichert ist, aber das Häufigkeitsobjekt 104, das zu einem gegebenen N-Gramm-Objekt 112 gehört, hat einen Häufigkeitswert, der die relative Wahrscheinlichkeit anzeigt, dass der Zeichen-String, der durch das bestimmte N-Gramm-Objekt 112 repräsentiert wird, an jeder Position in jedem Wort der relevanten Sprache existiert. Die N-Gramm-Objekte 112 und die zugehörigen Häufigkeitsobjekte 104 sind ein Teil des Korpus der generischen Wortliste 88 und werden auf eine Art erlangt, die ähnlich ist zu der Art, auf die das Wortobjekt 108 und die zugehörigen Häufigkeitsobjekte 104 erlangt werden, obwohl die Analyse, die bei der Erlangung der N-Gramm-Objekte 112 durchgeführt wird, etwas unterschiedlich ist, da sie eine Analyse der verschiedenen Zeichen-Strings in den verschiedenen Wörter umfasst, statt sich hauptsächlich auf das relative Auftreten eines gegebenen Wortes zu verlassen.
  • Das vorliegende beispielhafte Ausführungsbeispiel der tragbaren elektronischen Vorrichtung 4, deren beispielhafte Sprache die englische Sprache ist, umfasst sechsundzwanzig 1-Gramm-N-Gramm-Objekte 112, d. h. ein 1-Gramm-Objekt für jeden der sechsundzwanzig Buchstaben im lateinischen Alphabet, auf dem die englische Sprache basiert, und umfasst weiter 676 2-Gramm-N-Gramm-Objekte 112, d. h. sechsundzwanzig hoch zwei, wodurch jede zwei-Buchstaben-Permutation der sechsundzwanzig Buchstaben in dem lateinischen Alphabet dargestellt wird.
  • Die N-Gramm-Objekte 112 umfassen auch eine bestimmte Quantität von 3-Gramm-N-Gramm-Objekten 112, primär diejenigen, die eine relativ hohe Häufigkeit in der relevanten Sprache haben. Das beispielhafte Ausführungsbeispiel der tragbaren elektronischen Vorrichtung 4 umfasst weniger als alle der Drei-Buchstaben-Permutationen der sechsundzwanzig Buchstaben des lateinischen Alphabets aufgrund von Berücksichtigungen einer Datenspeichergröße und auch, da die 2-Gramm-N-Gramm-Objekte 112 bereits eine bedeutsame Menge von Information hinsichtlich der relevanten Sprache liefern können. Wie detaillierter unten dargelegt wird, liefern die N-Gramm-Objekte 112 und ihre zugehörigen Häufigkeitsobjekte 104 Häufigkeitsdaten, die Zeichen-Strings zugeschrieben werden können, für die ein entsprechendes Wortobjekt 108 nicht identifiziert werden kann oder nicht identifiziert wurde, und wird typischerweise als eine Rückfall-Datenquelle eingesetzt, obwohl dies nicht exklusiv der Fall sein muss.
  • In dem vorliegenden beispielhaften Ausführungsbeispiel werden die Sprachobjekte 100 und die Häufigkeitsobjekte 104 im Wesentlichen unberührt in der generischen Wortliste 88 gepflegt, was bedeutet, dass das grundlegende Sprachenlexikon in der generischen Wortliste 88 im Wesentlichen unverändert bleibt, und die Lernen-Funktionen, die von der tragbaren elektronischen Vorrichtung 4 vorgesehen werden und die unten beschrieben werden, funktionieren in Verbindung mit anderen Objekten, die im Allgemeinen woanders in dem Speicher 20 gespeichert sind, wie zum Beispiel in der „neue Wörter”-Datenbank 92.
  • Die „neue Wörter”-Datenbank 92 speichert zusätzliche Wortobjekte 108 und zugehörige Häufigkeitsobjekte 104, um einem Benutzer eine kundenspezifische Erfahrung zu liefern, in der Wörter und dergleichen, die relativ häufiger von einem Benutzer benutzt werden, relativ höhere Häufigkeitswerte haben, als ansonsten in der generischen Wortliste 88 reflektiert wird. Insbesondere umfasst die „neue Wörter”-Datenbank 92 Wortobjekte 108, die Benutzer-definiert sind und die im Allgemeinen nicht unter den Wortobjekten 108 der generischen Wortliste 88 zu finden sind. Jedes Wortobjekt 108 in der „neue Wörter”-Datenbank 92 hat zugehörig ein zugehöriges Häufigkeitsobjekt 104, das auch in der „neue Wörter”-Datenbank 92 gespeichert ist.
  • Die 3A, 3B und 3C zeigen auf eine beispielhafte Art und Weise den allgemeinen Betrieb bestimmter Aspekte der Disambiguierungsfunktion der tragbaren elektronischen Vorrichtung 4. Zusätzliche Merkmale, Funktionen und dergleichen werden anderswo dargestellt und beschrieben.
  • Eine Eingabe wird erfasst, wie bei 204, und die Eingabe kann jeder Typ einer Betätigung oder ein anderer Betrieb hinsichtlich jedes Teils der Eingabevorrichtung 8 sein. Eine typische Eingabe umfasst zum Beispiel eine Betätigung einer Taste 28 mit einer Anzahl von Zeichen 48 darauf, oder jeder andere Typ einer Betätigung oder Manipulation der Eingabevorrichtung 8.
  • Die Disambiguierungsfunktion bestimmt dann, wie bei 212, ob die aktuelle Eingabe eine Bedieneingabe, wie eine Auswahl-Eingabe, eine Begrenzungszeichen- bzw. Delimiter-Eingabe, eine Bewegungs-Eingabe, eine Umschalt-Eingabe oder zum Beispiel eine andere Eingabe ist, die keine Betätigung einer Taste 28 darstellt, die eine Anzahl von Zeichen 48 darauf hat. Wenn bei 212 festgestellt wird, dass die Eingabe keine Bedieneingabe ist, geht die Verarbeitung bei 216 weiter durch Hinzufügen der Eingabe zu der aktuellen Eingabe-Sequenz, die bereits eine Eingabe umfassen kann oder nicht.
  • Viele der bei 204 erfassten Eingaben werden eingesetzt bei der Erzeugung von Eingabe-Sequenzen, bei denen die Disambiguierungsfunktion ausgeführt wird. Eine Eingabe-Sequenz wird in jeder „Sitzung” mit jeder Betätigung einer Taste 28 mit einer Anzahl von Zeichen 48 darauf aufgebaut. Da eine Eingabe-Sequenz typischerweise aus zumindest einer Betätigung einer Taste 28 mit einer Vielzahl von Zeichen 48 darauf besteht, ist die Eingabe-Sequenz vieldeutig. Wenn zum Beispiel ein Wort vollständig ist, wird die aktuelle Sitzung beendet und eine neue Sitzung wird initiiert.
  • Eine Eingabe-Sequenz wird stufenweise auf der tragbaren elektronischen Vorrichtung 4 aufgebaut mit jeder aufeinander folgenden Betätigung einer Taste 28 während jeder gegebenen Sitzung. Spezifisch wird, sobald eine Delimiter-Eingabe während einer gegebenen Sitzung erfasst wird, die Sitzung beendet und eine neue Sitzung wird initiiert. Jede Eingabe, die aus einer Betätigung einer der Tasten 28 mit einer damit verbundenen Anzahl von Zeichen 48 resultiert, wird sequentiell zu der aktuellen Eingabe-Sequenz hinzugefügt. Da die Eingabe-Sequenz während einer gegebenen Sitzung wächst, wird die Disambiguierungsfunktion im Allgemeinen mit jeder Betätigung einer Taste 28 ausgeführt, d. h. und hinsichtlich der gesamten Eingabe-Sequenz eingegeben. Anders ausgedrückt, in einer gegebenen Sitzung wird versucht, die wachsende Eingabe-Sequenz als eine Einheit durch die Disambiguierungsfunktion zu disambiguieren mit jeder nachfolgenden Betätigung der verschiedenen Tasten 28.
  • Sobald eine aktuelle Eingabe, die eine letzte Betätigung einer der Tasten 28 mit einer Anzahl der dazu gehörenden Zeichen 48 darstellt, zu der aktuellen Eingabe-Sequenz in der aktuellen Sitzung hinzugefügt wurde, wie bei 216 in der 3A, erzeugt die Disambiguierungsfunktion, wie bei 220, im Wesentlichen alle Permutationen der Zeichen 48, die den verschiedenen Tasten 28 zugewiesen werden, die getätigt wurden bei der Erzeugung der Eingabe-Sequenz. In dieser Hinsicht beziehen sich „Permutationen” auf die verschiedenen Strings, die aus den Zeichen 48 jeder gedrückten Taste 28 resultieren können, begrenzt durch die Reihenfolge, in der die Tasten 28 betätigt wurden. Die verschiedenen Permutationen der Zeichen in der Eingabe-Sequenz werden als Präfixobjekte eingesetzt.
  • Wenn zum Beispiel die aktuelle Eingabe-Sequenz in der aktuellen Sitzung die vieldeutige Eingabe der Tasten „AS” und „OP” ist, sind die verschiedenen Permutationen des ersten Zeichens 52 und des zweiten Zeichens 56 von jeder der zwei Tasten 28, wenn betrachtet in der Reihenfolge, in der die Tasten 28 betätigt wurden, „SO”, „SP”, „AP” und „AO” und jedes von diesen ist ein Präfixobjekt, das erzeugt wird, wie bei 220, hinsichtlich der aktuellen Eingabe-Sequenz. Wie detaillierter unten erklärt, versucht die Disambiguierungsfunktion, für jedes Präfixobjekt eines der Wortobjekte 108 zu identifizieren, für welches das Präfixobjekt ein Präfix sein würde.
  • Für jedes erzeugte Präfixobjekt wird der Speicher 20 konsultiert, wie bei 224, um, wenn möglich, für jedes Präfixobjekt eines der Wortobjekte 108 in dem Speicher 20 zu identifizieren, das dem Präfixobjekt entspricht, was bedeutet, dass die Sequenz der Buchstaben, die durch das Präfixobjekt dargestellt wird, entweder ein Präfix des identifizierten Wortobjektes 108 ist oder im Wesentlichen identisch zu der Gesamtheit des Wortobjektes 108 ist. Weiter ist in dieser Hinsicht das Wortobjekt 108, das zu identifizieren versucht wird, das Wortobjekt 108 mit der höchsten Häufigkeit. Das heißt, die Disambiguierungsfunktion versucht, das Wortobjekt 108 zu identifizieren, das dem Präfixobjekt entspricht und das auch zu einem Häufigkeitsobjekt 104 gehört, das einen relativ höheren Häufigkeitswert hat als alle der anderen Häufigkeitsobjekte 104, die zu den anderen Wortobjekten 108 gehören, die dem Präfixobjekt entsprechen.
  • Es wird in dieser Hinsicht angemerkt, dass die Wortobjekte 108 in der generischen Wortliste 88 im Allgemeinen in Datentabellen organisiert sind, die den ersten zwei Buchstaben von verschiedenen Wörtern entsprechen. Zum Beispiel würde die Datentabelle, die mit dem Präfix „CO” verbunden ist, alle der Wörter umfassen wie „CODE”, „COIN”, „COMMUNICATION” und dergleichen. Abhängig von der Quantität von Wortobjekten 108 in einer gegebenen Datentabelle kann die Datentabelle zusätzlich Teil-Datentabellen umfassen, in denen Wortobjekte 108 durch Präfixe organisiert sind, die drei Zeichen oder mehr in der Länge sind. Weiter mit dem vorangehenden Beispiel, wenn die „CO”-Datentabelle zum Beispiel mehr als 256 Wortobjekte 108 umfassen würde, würde die „CO”-Datentabelle zusätzlich eine oder mehrere Teil-Datentabellen von Wortobjekten 108 umfassen, die den am häufigsten erscheinenden Dreibuchstaben-Präfixen entsprechen. Auf beispielhafte Weise kann somit die „CO”-Datentabelle auch eine „COM”-Teil-Datentabelle und eine „CON”-Teil-Datentabelle umfassen. Wenn eine Teil-Datentabelle mehr als die vorgegebene Anzahl von Wortobjekten 108 umfasst, zum Beispiel eine Quantität von 256, kann die Teil-Datentabelle weitere Teil-Datentabellen umfassen, die gemäß Präfixen mit vier Buchstaben organisiert werden. Es wird angemerkt, dass die oben erwähnte Quantität von 256 der Wortobjekte 108 dem höchsten numerischen Wert entspricht, der in einem Byte des Speichers 20 gespeichert werden kann.
  • Demgemäß wird, wenn bei 224 versucht wird, jedes Präfixobjekt zu verwenden, um ein entsprechendes Wortobjekt 108 zu identifizieren, und zum Beispiel das vorliegende Präfixobjekt „AP” ist, die „AP”-Datentabelle konsultiert. Da alle der Wortobjekte 108 in der „AP”-Datentabelle dem Präfixobjekt „AP” entsprechen, wird das Wortobjekt 108 in der „AP”-Datentabelle identifiziert, zu dem ein Häufigkeitsobjekt 104 gehört, das einen Häufigkeitswert hat, der relativ höher ist als einer der anderen Häufigkeitsobjekte 104 in der „AP”-Datentabelle. Das identifizierte Wortobjekt 108 und das zugehörige Häufigkeitsobjekt 104 werden dann in einem Resultat-Register gespeichert, das als ein Resultat der verschiedenen Vergleiche der erzeugten Präfixobjekte mit den Inhalten des Speichers 20 dient.
  • Es wird angemerkt, dass eines oder mehrere oder vielleicht alle der Präfixobjekte Präfixobjekte sind, für die ein entsprechendes Wortobjekt 108 nicht in dem Speicher 20 identifiziert wird. Derartige Präfixobjekte werden betrachtet als verwaiste Präfixobjekte und werden separat gespeichert oder werden anderweitig für möglichen zukünftigen Gebrauch behalten. In dieser Hinsicht wird angemerkt, dass viele oder alle der Präfixobjekte verwaiste Objekt werden können, wenn zum Beispiel der Benutzer versucht, ein neues Wort einzugeben, oder zum Beispiel, wenn der Benutzer falsch getippt hat und kein Wort der falsch getippten Eingabe entspricht.
  • Die Verarbeitung geht weiter, wie bei 232, wo doppelte Wortobjekte 108 mit relativ niedrigeren Häufigkeitswerten aus dem Ergebnis gelöscht werden. Ein solches doppeltes Wortobjekt 108 kann zum Beispiel erzeugt werden durch die andere Datenquelle 99.
  • Sobald die doppelten Wortobjekte 108 und die zugehörigen Häufigkeitsobjekte 104 bei 232 entfernt wurden, verzweigt sich die Verarbeitung, wie bei 234, zu einem Teilsystem in 9, unten beschrieben, wobei die Notwendigkeit zur Untersuchung von Kontextdaten evaluiert wird. Sobald die Kontextdaten evaluiert sind, wie in 9, kehrt die Verarbeitung zurück zu 236, wie in 3C, wobei die verbleibenden Präfixobjekte in einem Ausgabesatz in abnehmender Reihenfolge des Häufigkeitswerts angeordnet werden.
  • Wenn festgestellt wird, wie bei 240, dass die Markierung gesetzt wurde, was bedeutet, dass ein Benutzer eine Auswahl-Eingabe gemacht hat, entweder durch eine Express-Auswahl-Eingabe oder durch eine Umschalt-Eingabe einer Bewegungs-Eingabe, dann wird die standardmäßige Ausgabe 76 betrachtet als „versperrt (locked)”, was bedeutet, dass die gewählte Variante das standardmäßige Präfix bis zum Ende der Sitzung ist. Wenn bei 240 festgestellt wird, dass die Markierung gesetzt wurde, geht die Verarbeitung weiter zu 244, wo die Inhalte des Ausgabesatzes geändert werden, wenn erforderlich, um als die standardmäßige Ausgabe 76 eine Ausgabe zu liefern, die das gewählte Präfixobjekt umfasst, ob es einem Wortobjekt 108 entspricht oder eine künstliche Variante ist. In dieser Hinsicht ist anzumerken, dass die Markierung mehrere Male während einer Sitzung gesetzt werden kann, in diesem Fall wird das gewählte Präfix, das zu dem Zurückstellen der Markierung gehört, danach die „gesperrte” standardmäßige Ausgabe 76 bis zu dem Ende der Sitzung oder bis eine andere Auswahl-Eingabe erfasst wird.
  • Die Verarbeitung geht dann weiter, wie bei 248, zu einem Ausgabeschritt, nach dem eine Ausgabe 64 erzeugt wird, wie oben beschrieben. Die Verarbeitung geht dann weiter bei 204, wo eine zusätzliche Eingabe erfasst wird. Wenn andererseits bei 240 festgestellt wird, dass die Markierung nicht gesetzt ist, geht die Verarbeitung direkt zu 248 ohne Änderung der Inhalte des Ausgabesatzes bei 244.
  • Wenn die erfasste Eingabe bestimmt wird, wie bei 212, als eine Bedieneingabe, dann geht die Verarbeitung weiter, um die spezifische Eigenschaft der Bedieneingabe festzustellen. Wenn zum Beispiel festgestellt wird, wie bei 252, dass die aktuelle Eingabe eine Auswahl-Eingabe ist, geht die Verarbeitung bei 254 weiter, wo die Markierung gesetzt wird. Dann kehrt die Verarbeitung zurück zur Erfassung von zusätzlichen Eingaben, wie bei 204.
  • Wenn festgestellt wird, wie bei 260, dass die Eingabe eine Delimiter- bzw. Begrenzungs-Eingabe ist, geht die Verarbeitung bei 264 weiter, wo die aktuelle Sitzung beendet wird und die Verarbeitung übergeben wird, wie bei 266, an das Lernen-Funktion-Teilsystem, wie bei 404 der 4. Eine Delimiter-Eingabe umfasst zum Beispiel die Betätigung einer <Leerzeichen(SPACE)>-Taste 116, die sowohl ein Delimiter-Symbol eingeben als auch ein Leerzeichen am Ende des Wortes hinzufügen würde, eine Betätigung der <ENTER>-Taste, die ähnlich eine Delimiter-Eingabe eingeben kann und ein Leerzeichen eingeben kann, und durch eine Translation des Thumbwheels 32, wie wird durch den Pfeil 38 angezeigt, die eine Delimiter-Eingabe eingeben kann, ohne zusätzlich ein Leerzeichen einzugeben.
  • Es wird zuerst festgestellt, wie bei 408, ob die standardmäßige Ausgabe zum Zeitpunkt der Erfassung der Demiliter-Eingabe bei 260 mit einem Wortobjekt 108 in dem Speicher 20 übereinstimmt. Wenn nicht, bedeutet dies, dass die standardmäßige Ausgabe eine Benutzer-erzeugte Ausgabe ist, die zu der „neue Wörter”-Datenbank 92 für zukünftigen Gebrauch hinzugefügt werden sollte. Unter solch einem Umstand geht dann die Verarbeitung weiter zu 412, wo die standardmäßige Ausgabe in der „neue Wörter”-Datenbank 92 als ein neues Wortobjekt 108 gespeichert wird. Zusätzlich wird ein Häufigkeitsobjekt 104 in der „neue Wörter”-Datenbank 92 gespeichert und zugeordnet zu dem vorher erwähnten neuen Wortobjekt 108. Dem neuen Häufigkeitsobjekt 104 wird ein relativ hoher Häufigkeitswert gegeben, typischerweise in dem oberen Viertel oder Drittel eines vorgegebenen Bereichs von möglichen Häufigkeitswerten.
  • In dieser Hinsicht wird Häufigkeitsobjekten 104 ein absoluter Häufigkeitswert im Allgemeinen in dem Bereich von null bis 65,535 gegeben. Der Maximalwert stellt die größte Anzahl dar, die in zwei Bytes des Speichers 20 gespeichert werden kann. Dem neuen Häufigkeitsobjekt 104, das in der „neue Wörter”-Datenbank 92 gespeichert wird, wird ein absoluter Häufigkeitswert in oberen Viertel oder Drittels dieses Bereichs zugewiesen, besonders, da das neue Wort von einem Benutzer verwendet wurde und wahrscheinlich wieder verwendet wird.
  • In weiterer Hinsicht zu dem Häufigkeitsobjekt 104 wird angemerkt, dass in einer gegebenen Datentabelle, wie der oben erwähnten „CO”-Datentabelle, der absolute Häufigkeitswert nur für das Häufigkeitsobjekt 104 gespeichert wird, das den höchsten Häufigkeitswert in der Datentabelle hat. Alle anderen Häufigkeitsobjekte 104 in der gleichen Datentabelle haben Häufigkeitswerte gespeichert als Prozentwerte, normalisiert zu dem vorher erwähnten maximalen absoluten Häufigkeitswert. Das heißt, nach Identifikation des Häufigkeitsobjektes 104 mit dem höchsten Häufigkeitswert in einer gegebenen Datentabelle, wird allen anderen Häufigkeitsobjekten 104 in der gleichen Datentabelle ein Prozentsatz des absoluten Maximalwerts zugewiesen, der das Verhältnis des relativ kleineren absoluten Häufigkeitswertes eines bestimmten Häufigkeitsobjektes 104 zu dem absoluten Häufigkeitswert des vorher erwähnten Häufigkeitsobjektes 104 mit dem höchsten Wert darstellt. Vorteilhafterweise können derartige Prozentsatzwerte in einem einzelnen Byte des Speichers gespeichert werden, wodurch Speicherplatz in der tragbaren elektronischen Vorrichtung 4 gespart wird.
  • Nach der Erzeugung des neuen Wortobjekts 108 und des neuen Häufigkeitsobjekts 104 und deren Speicherung in der „neue Wörter”-Datenbank 92 wird die Verarbeitung zu 420 übergeben, wo der Lernenprozess beendet wird. Die Verarbeitung kehrt dann zum Hauptprozess zurück, wie bei 204. Wenn bei 408 festgestellt wird, dass das Wortobjekt 108 in der standardmäßigen Ausgabe 76 mit einem Wortobjekt 108 in dem Speicher 20 übereinstimmt, dann kehrt die Verarbeitung direkt zu dem Hauptprozess bei 204 zurück.
  • Weiter hinsichtlich der Identifikation verschiedener Wortobjekte 108 zur Entsprechung mit erzeugten Präfixobjekten wird angemerkt, dass der Speicher 20 eine Anzahl von zusätzlichen Datenquellen 99 zusätzlich zu der generischen Wortliste 88 und der „neue Wörter”-Datenbank 92 umfassen kann, die alle als linguistische Quellen betrachtet werden können. Es ist offensichtlich, dass der Speicher 20 jede Anzahl anderer Datenquellen 99 umfassen kann. Die anderen Datenquellen 99 können zum Beispiel eine Adressdatenbank, eine Kurztext-Datenbank oder jede andere Datenquelle ohne Einschränkung umfassen. Eine beispielhafte Kurztext-Datenbank kann, zum Beispiel, Sätze von Wörtern oder Ausdrücken oder anderen Daten umfassen, die jeweils zum Beispiel zu einem Zeichen-String gehören, der abgekürzt werden kann. Zum Beispiel kann eine Kurztext-Datenbank den String „br” mit dem Satz von Wörtern „Best Regards” verbinden, mit der Absicht, dass ein Benutzer den String „br” schreiben kann und die Ausgabe „Best Regards” empfangen kann.
  • Wenn versucht wird, Wortobjekte 108 zu identifizieren, die einem gegebenen Präfixobjekt entsprechen, kann die tragbare elektronische Vorrichtung 4 alle Datenquellen in dem Speicher 20 abfragen. Zum Beispiel kann die tragbare elektronische Vorrichtung 4 die generische Wortliste 88, die „neue Wörter”-Datenbank 92 und die anderen Datenquellen 99 abfragen, um Wortobjekte 108 zu identifizieren, die dem Präfixobjekt entsprechen. Die Inhalte der anderen Datenquellen 99 können behandelt werden als Wortobjekte 108, und der Prozessor 16 kann Häufigkeitsobjekte 104 erzeugen, die derartigen Wortobjekten 108 zugeteilt werden und welchen ein Häufigkeitswert zugewiesen werden kann in zum Beispiel dem oberen Drittel oder Viertel des vorher erwähnten Häufigkeitsbereichs. Unter der Annahme, dass der zugewiesene Häufigkeitswert hoch genug ist, wird der String „br” zum Beispiel typischerweise an die Anzeige 60 ausgegeben. Wenn eine Delimiter-Eingabe hinsichtlich des Teils des Ausgabe erfasst wird, der die Verbindung zu dem Wortobjekt 108 in der Kurztext-Datenbank hat, zum Beispiel „br”, würde der Benutzer die Ausgabe „Best Regards” empfangen, wobei offensichtlich ist, dass der Benutzer auch eine Auswahl-Eingabe als den beispielhaften String „br” eingegeben haben könnte.
  • Die Inhalte von einer der anderen Datenquellen 99 können behandelt werden als Wortobjekte 108 und können zu erzeugten Häufigkeitsobjekten 104 gehören, die den zugewiesenen Häufigkeitswert in dem vorher erwähnten oberen Teil des Häufigkeitsbereichs haben. Nachdem derartige Wortobjekte 108 identifiziert sind, kann die neue Wort-Lernen-Funktion, wenn geeignet, auf derartigen Wortobjekten 108 auf die oben dargelegte Art handeln.
  • Wenn festgestellt wird, wie bei 268, dass die aktuelle Eingabe eine Bewegungs-Eingabe ist, wie eingesetzt wird, wenn ein Benutzer versucht, ein Objekt zu editieren, entweder ein beendetes Wort oder ein Präfixobjekt in der aktuellen Sitzung, wird das Caret-Zeichen 84 auf die gewünschte Position verschoben, wie bei 272, und die Markierung wird gesetzt, wie bei 276. Die Verarbeitung kehrt dann dahin zurück, wo zusätzliche Eingaben erfasst werden können, wie bei 204.
  • In dieser Hinsicht ist es offensichtlich, dass verschiedene Typen von Bewegungs-Eingaben von der Eingabevorrichtung 8 erfasst werden können. Zum Beispiel kann eine Rotation des Thumbwheels 32, wie durch den Pfeil 34 der 1 angezeigt, eine Bewegungs-Eingabe liefern. In dem Fall, in dem solch eine Bewegungs-Eingabe erfasst wird, wie in dem Umstand einer editierenden Eingabe, wird die Bewegungs-Eingabe zusätzlich als eine Auswahl-Eingabe erfasst. Demgemäß und wie es der Fall ist mit einer Auswahl-Eingabe, wie bei 252 erfasst wird, ist die gewählte Variante effektiv gesperrt (locked) hinsichtlich des Standard-Teils 76 der Ausgabe 64. Jede Standard-Ausgabe 76 während der gleichen Sitzung umfasst notwendigerweise die vorher gewählte Variante.
  • In dem vorliegenden beispielhaften Ausführungsbeispiel der tragbaren elektronischen Vorrichtung 4 ist, wenn festgestellt wird, wie bei 252, dass die Eingabe keine Auswahl-Eingabe ist, und festgestellt wird, wie bei 260, dass die Eingabe keine Delimiter-Eingabe ist, und weiter festgestellt wie, wie bei 268, dass die Eingabe keine Bewegungs-Eingabe ist, in dem aktuellen beispielhaften Ausführungsbeispiel der tragbaren elektronischen Vorrichtung 4 die einzige verbleibende Bedieneingabe im Allgemeinen eine Erfassung der <LÖSCHEN(DELETE)>-Taste 86 der Tasten 28 des Tastaturfelds 24. Bei Erfassung der <DELETE>-Taste 86 wird das letzte Zeichen der standardmäßigen Ausgabe gelöscht, wie bei 280. Die Verarbeitung kehrt danach zurück zu 204, wo eine zusätzliche Eingabe erfasst werden kann.
  • Eine beispielhafte Eingabe-Sequenz wird in den 1 und 58 dargestellt. In diesem Beispiel versucht der Benutzer, das Wort „APPLOADER” einzugeben, und dieses Wort ist momentan nicht in dem Speicher 20 gespeichert. In 1 hat der Benutzer bereits die „AS”-Taste 28 eingegeben. Da die Datentabellen in dem Speicher 20 entsprechend zwei-Buchstaben-Präfixen organisiert sind, werden die Inhalte der Ausgabe 64 nach dem ersten Tastenanschlag von den N-Gramm-Objekten 112 in dem Speicher erlangt. Der erste Tastenanschlag „AS” entspricht einem ersten N-Gramm-Objekt 112 „S” und einem zugehörigen Häufigkeitsobjekt 104, sowie einem anderen N-Gramm-Objekt 112 „A” und einem zugehörigen Häufigkeitsobjekt 104. Während das Häufigkeitsobjekt 104, das zu „S” gehört, einen Häufigkeitswert hat, der größer ist als der des Häufigkeitsobjektes 104, das zu „A” gehört, wird angemerkt, dass „A” selbst ein vollständiges Wort ist. Ein vollständiges Wort wird immer als die standardmäßige Ausgabe 76 gegenüber anderer Präfixobjekte geliefert, die nicht mit vollständigen Wörtern übereinstimmen, unabhängig eines zugehörigen Häufigkeitswerts. Somit ist in der 1 der Standard-Teil 76 der Ausgabe 64 „A”.
  • In der 5 hat der Benutzer zusätzlich die „OP”-Taste 28 eingegeben. Die Varianten werden in der 5 dargestellt. Da das Präfixobjekt „SO” auch ein Wort ist, wird es als die standardmäßige Ausgabe 76 geliefert. In der 6 hat der Benutzer wieder die „OP”-Taste 28 eingegeben und hat auch die „L”-Taste 28 eingegeben. Es wird angemerkt, dass die beispielhafte „L”-Taste 28, die hier dargestellt wird, nur das einzelne Zeichen 48 „L” umfasst.
  • Es wird in dem vorliegenden Beispiel angenommen, dass keine Bedieneingaben bis jetzt erfasst wurden. Die standardmäßige Ausgabe 76 ist „APPL”, wie dem Wort „APPLE” entsprechen würde. Das Präfix „APPL” wird sowohl in der Textkomponente 68 sowie in dem Standard-Teil 76 der Varianten-Komponente 72 dargestellt. Verschiedene Präfixobjekte in dem Varianten-Teil 80 umfassen „APOL”, wie dem Wort „APOLOGIZE” entsprechen würde, und das Präfix „SPOL”, das dem Wort „SPOLIATION” entsprechen würde.
  • Es wird insbesondere angemerkt, dass die zusätzlichen Varianten „AOOL”, „AOPL”, „SOPL” und „SOOL” auch als Varianten 80 in der Varianten-Komponente 72 dargestellt werden. Da kein Wortobjekt 108 diesen Präfixobjekten entspricht, werden die Präfixobjekte als verwaiste Präfixobjekte betrachtet, für die kein entsprechendes Wortobjekt 108 identifiziert wurde. In dieser Hinsicht kann es für die Varianten-Komponente 72 wünschenswert sein, eine spezifische Quantität von Eintragungen zu umfassen, und im Falle des vorliegenden beispielhaften Ausführungsbeispiels ist die Quantität sieben Eintragungen. Nach dem Erlangen des Resultats bei 224, wenn die Quantität von Präfixobjekten in dem Resultat weniger ist als die vorgegebene Quantität, versucht die Disambiguierungsfunktion, zusätzliche Ausgaben zu liefern, bis die vorgegebene Anzahl von Ausgaben geliefert ist.
  • In der 7 hat der Benutzer zusätzlich die „OP”-Taste 28 eingegeben. Unter diesem Umstand und wie in 7 zu sehen ist, wurde der Standard-Teil 76 der Ausgabe 64 das Präfixobjekt „APOLO”, wie es dem Wort „APOLOGIZE” entsprechen würde, während unmittelbar vor der aktuellen Eingabe der Standard-Teil 76 der Ausgabe 64 der 6 „APPL” war, wie dem Wort „APPLE” entsprechen würde. Wieder unter der Annahme, dass keine Bedieneingaben erfasst wurden, entspricht das standardmäßige Präfixobjekt in der 7 nicht dem vorhergehenden standardmäßigen Präfixobjekt der 6. Somit wird die erste künstliche Variante „APOLP” erzeugt und dieser wird in dem aktuellen Beispiel eine bevorzugte Position gegeben. Die oben angeführte künstliche Variante „APOLP” wird erzeugt durch Löschen des letzten Zeichens des Standard-Präfixobjekts „APOLO” und durch Liefern stattdessen eines entgegengesetzten Zeichens 48 der Taste 28, die das letzte Zeichen des Standard-Teils 76 der Ausgabe 64 erzeugte, was in dem aktuellen Beispiel der 7 „P” ist, so dass die oben angeführte künstliche Variante „APOLP” ist.
  • Ferner, da die vorhergehende Standard-Ausgabe „APPL” einem Wortobjekt 108 entsprach, wie dem Wortobjekt 108, das dem Wort „APPLE” entspricht, und da mit der Hinzufügung der aktuellen Eingabe die vorhergehende Standard-Ausgabe „APPL” nicht länger einem Wortobjekt 108 entspricht, werden zwei zusätzliche künstliche Varianten erzeugt. Eine künstliche Variante ist „APPLP” und die andere künstliche Variante ist „APPLO”, und diese entsprechen der vorhergehenden standardmäßigen Ausgabe „APPL” plus den Zeichen 48 der Taste 28, die betätigt wurde, um die aktuelle Eingabe zu erzeugen. Diese künstlichen Varianten werden ähnlich als Teil des Varianten-Teils 80 der Ausgabe 64 ausgegeben.
  • Wie in 7 gesehen werden kann, scheint der Standard-Teil 76 der Ausgabe 64 „APOLO” nicht länger mit dem übereinzustimmen, was als ein Präfix für „APPLOADER” benötigt würde, und der Benutzer erwartet wahrscheinlich, dass das gewünschte Wort „APPLOADER” noch nicht in dem Speicher 20 gespeichert ist. Somit liefert der Benutzer eine Auswahl-Eingabe, wie durch Scrollen mit dem Thumbwheel 32, bis der Varianten-String „APPLO” hervorgehoben ist. Der Benutzer fährt dann mit der Eingabe fort und gibt die „AS”-Taste ein.
  • Die Ausgabe 64 einer solchen Aktion wird in der 8 dargestellt. Hier ist der String „APPLOA” der Standard-Teil 76 der Ausgabe 64. Da der Varianten-String „APPLO” der Standard-Teil 76 der Ausgabe 64 (nicht ausdrücklich hierin dargestellt) als ein Resultat der Auswahl-Eingabe wurde hinsichtlich des Varianten-Strings „APPLO” und da der Varianten-String „APPLO” nicht einem Wortobjekt 108 entspricht, wurden die Zeichen-Strings „APPLOA” und „APPLOS” als künstliche Varianten erzeugt. Zusätzlich, da der vorhergehende Standard der 7, „APOLO”, vorher einem Wortobjekt 108 entsprochen hat, aber jetzt nicht länger dem Standard-Teil 76 der Ausgabe 64 der 8 entspricht, wurden auch die zusätzlichen künstlichen Varianten von „APOLOA” und „APOLOS” erzeugt. Derartigen künstlichen Varianten wird eine bevorzugte Position gegenüber den drei angezeigten verwaisten Präfixobjekten gegeben.
  • Da die aktuelle Eingabe-Sequenz in dem Beispiel nicht mehr einem Wortobjekt 108 entspricht, werden die Teile des Verfahrens, die den Versuch betreffen, entsprechende Wortobjekte 108 zu finden, nicht mit weiteren Eingaben für die aktuelle Sitzung ausgeführt. Das heißt, da kein Wortobjekt 108 der aktuellen Eingabe-Sequenz entspricht, entsprechen weitere Eingaben ebenfalls keinem Wortobjekt 108. Ein Vermeiden der Suche des Speichers 20 nach derartigen nicht existierenden Wortobjekten 108 spart Zeit und vermeidet vergeudete Verarbeitungsbemühungen.
  • Da der Benutzer zu schreiben fortfährt, gibt der Benutzer schließlich erfolgreich das Wort „APPLOADER” ein und gibt eine Delimiter-Eingabe ein. Bei Erfassen der Delimiter-Eingabe nach der Eingabe von „APPLOADER”, wird die Lernen-Funktion initiiert. Da das Wort „APPLOADER” nicht einem Wortobjekt 108 in dem Speicher 20 entspricht, wird ein neues Wortobjekt 108 erzeugt, das „APPLOADER” entspricht, und wird in der „neue Wörter”-Datenbank 92 gespeichert, zusammen mit einem entsprechenden neuen Häufigkeitsobjekt 104, dem eine absolute Häufigkeit beispielsweise in dem oberen Drittel oder Viertel des möglichen Häufigkeitsbereichs gegeben wird. In dieser Hinsicht wird angemerkt, dass die „neue Wörter”-Datenbank 92 im Allgemeinen in zwei-Zeichen-Präfix-Datentabellen organisiert ist, die denen ähnlich sind, die in der generischen Wortliste 88 zu finden sind. Somit wird dem neuen Häufigkeitsobjekt 104 zuerst ein absoluter Häufigkeitswert zugewiesen, aber bei Speicherung wird der absolute Häufigkeitswert, wenn es nicht der Maximalwert in dieser Datentabelle ist, geändert, um einen normalisierten Häufigkeitswert-Prozentsatz zu umfassen, normalisiert auf das, was der maximale Häufigkeitsweit in dieser Datentabelle ist.
  • Es wird angemerkt, dass das Layout der Zeichen 48 auf den Tasten 28 in 1 ein beispielhaftes Zeichen-Layout ist, das eingesetzt wird, wenn die beabsichtigte primäre Sprache, die auf der tragbaren elektronischen Vorrichtung 4 verwendet wird, zum Beispiel Englisch ist. Andere Layouts, die diese Zeichen 48 und/oder andere Zeichen umfassen, können verwendet werden abhängig von der beabsichtigten primären Sprache und jedem Sprachenvorzug in der Herstellung der Sprachobjekte 100.
  • Wie anderweitig hier erwähnt, wird ein vollständiges Wort, das während eines Disambiguierungszyldus identifiziert wird, immer als eine Standard-Ausgabe 76 vorgesehen bevorzugt zu anderen Präfixobjekten, die nicht mit vollständigen Wörtem überreinstimmen, unabhängig eines zugehörigen Häufigkeitswerts. Das heißt, ein Wortobjekt 108, das einer vieldeutigen Eingabe entspricht und eine Länge hat, die zu der der vieldeutigen Eingabe gleich ist, wird an einer Position von Priorität über andere Präfixobjekte ausgegeben. Wie hier verwendet, sollen der Ausdruck „Länge” und Variationen davon eine Quantität von Elementen betreffen, aus denen ein Objekt besteht, wie die Quantität der linguistischen Elemente, aus denen ein Sprachobjekt 100 besteht.
  • Wenn mehr als ein vollständiges Wort während eines Disambiguierungszyklus identifiziert wird, können alle vollständigen Wörter ausgegeben werden in Reihenfolge einer abnehmenden Häufigkeit zueinander, wobei jedes an einer Prioritätsposition gegenüber den Präfixobjekten ist, die repräsentativ sind für unvollständige Wörter. Jedoch kann es in bestimmten Umständen wünschenswert sein, zusätzliche Daten einzusetzen, wenn verfügbar, um die vollständigen Wörter auf eine Weise zu priorisieren, die für den Benutzer vorteilhafter ist.
  • Die tragbare elektronische Vorrichtung 4 umfasst folglich vorteilhafterweise die Kontextdaten-Tabelle 49, die in dem Speicher 20 gespeichert ist. Die beispielhafte Kontextdaten-Tabelle 49 hat eine Anzahl von vieldeutigen Wörtern und zugehörige Kontextdaten gespeichert.
  • Spezifisch weist die Kontextdaten-Tabelle 49 eine Anzahl von Schlüssel-Objekten 47 und, zugehörig zu jedem Schlüssel-Objekt 47, eine Anzahl zugehöriger Kontextwert-Objekte 51 auf. In dem vorliegenden beispielhaften Ausführungsbeispiel, in dem die englische Sprache auf der tragbaren elektronischen Vorrichtung 4 eingesetzt wird, ist jedes Schlüssel-Objekt 47 ein Wortobjekt 108. Das heißt, ein Schlüssel-Objekt 47 in der Kontextdaten-Tabelle 49 wird auch als ein Wortobjekt 108 in einer aus der generischen Wort-Liste 88, der „neue Wörter”-Datenbank 92 und der anderen Datenquellen 99 gespeichert. Jedes Schlüssel-Objekt 47 hat zugeordnet ein oder mehrere Kontextwert-Objekte 51, die jeweils ein bestimmtes Kontextdatenelement darstellen. Wenn ein Schlüssel-Objekt 47 während eines Zyklus der Disambiguierung in Bezug auf eine vieldeutige Eingabe identifiziert wird und wenn ein Kontextwert-Objekt 51, das zu dem Schlüssel-Objekt 47 gehört, mit einem Kontext der vieldeutigen Eingabe übereinstimmt, wird das Wortobjekt 108, das dem Schlüssel-Objekt 47 entspricht, als eine Standard-Wort-Ausgabe an der Text-Komponente 68 und an dem Standard-Teil 76 der Varianten-Komponente 72 ausgegeben. In anderen Ausführungsbeispielen ist jedoch offensichtlich, dass die Schlüssel-Objekte 47 in anderen Formen als in der Form von Wortobjekten 108 sein können.
  • Die Inhalte der Kontextdaten-Tabelle 49 werden erlangt durch Analysieren der Sprachobjekte 100 und des Datenkorpus, aus denen die Sprachobjekte 100 und die Häufigkeitsobjekte 104 erlangt wurden. Zuerst werden die Sprachobjekte 100 analysiert, um vieldeutige Wortobjekte 108 zu identifizieren. Ein Satz vieldeutiger Wortobjekte 108 ist repräsentativ für eine Vielzahl von vollständigen Wörtern, die jeweils aus derselben vieldeutigen Eingabe gebildet werden, wie zum Beispiel die Wörter „TOP” und „TOO”, die jeweils aus der vieldeutigen Eingabe <TY> <OP> <OP> gebildet werden. Jedes vieldeutige Wortobjekt 108 hat ein zugehöriges Häufigkeitsobjekt 104. In einem gegebenen Satz von vieldeutigen Wortobjekten 108, ist jedes vieldeutige Wortobjekt 108, das ein Häufigkeitsobjekt 104 hat mit einem Häufigkeitswert, der geringer ist als der höchste in dem Satz, ein Kandidaten-Schlüssel-Objekt 47. Das heißt, in einem gegebenen Satz von vieldeutigen Wortobjekten 108 sind alle vieldeutigen Wortobjekte 108 Kandidaten-Schlüssel-Objekte 47, außer das vieldeutige Wortobjekt 108 mit einem zugehörigen Häufigkeitsobjekt 104, das den relativ höchsten Häufigkeitswert in dem Satz hat. Dies ist aufgrunddessen, wie detaillierter anderweitig hier erläutert wird, da die erwartete Situation, in der Kontextdaten während einer Texteingabe relevant sind, die ist, wenn eine Vielzahl von vieldeutigen Wortobjekten 108 in einem Disambiguierungszyklus identifiziert werden, und ein weniger häufiges vieldeutiges Wortobjekt 108 wird wünschenswert ausgegeben an einer relativ bevorzugten Position, da es eine passendere Lösung in einem bestimmten Kontext ist.
  • Sobald die Kandidaten-Schlüssel-Objekte 47 identifiziert sind, wird der Datenkorpus analysiert, um alle gültigen Kontextdaten für die Kandidaten-Schlüssel-Objekte 47 zu identifizieren. Gültige Kontextdaten ist jeder bestimmte Kontext, in dem ein statistisch signifikantes Auftreten eines bestimmten Schlüssel-Objekts 47 auftritt.
  • Ein beispielhafter Kontext ist der, in dem ein bestimmtes vieldeutiges Wort, in einem statistisch signifikanten Ausmaß, einem bestimmten Wort folgt. Zum Beispiel und weiter mit dem obigen Beispiel, kann festgestellt werden, dass das Schlüsselwort „TOP” auftritt, in einem statistisch signifikanten Ausmaß, nach dem Kontext-Wort „TABLE” und nach dem Kontext-Wort „HILL”. Abhängig von der Konfiguration der Kontextdaten-Tabelle 49, kann solch ein Kontext auf ein bestimmtes Wort begrenzt sein, das einem bestimmten vieldeutigen Wort unmittelbar vorangeht, oder er kann ein bestimmtes Wort umfassen, das einem bestimmten vieldeutigen Wort nach einem, zwei, drei oder mehreren Wörtern vorangeht. Das heißt, das vieldeutige Schlüsselwort „TOP” kann in einem statistisch bedeutenden Ausmaß auftreten, wenn es unmittelbar dem Kontextwort „TABLE” folgt, aber das gleiche vieldeutige Schlüsselwort „TOP” kann in einem statistisch bedeutenden Ausmaß auftreten, wenn es dem Kontextwort „HILL” unmittelbar oder nach zwei, drei oder vier Wörtern folgt. In solch einem Umstand wird das vieldeutige Wortobjekt 108 „TOP” als ein Schlüssel-Objekt 47 gespeichert und die Wortobjekte 108 „TABLE” und „HILL” werden als zwei zugehörige Kontextwert-Objekte 51 gespeichert.
  • Ein weiterer beispielhafter Kontext ist der, in dem ein bestimmtes vieldeutiges Wort, in einem statistisch signifikanten Ausmaß, ein erstes Wort in einem Satz ist. In solch einer Situation kann der identifizierte Kontext der sein, in dem das bestimmte vieldeutige Wort, in einem statistisch signifikanten Ausmaß, einem oder mehreren bestimmten Interpunktionszeichen folgt, wie dem Punkt „.”, dem Fragezeichen „?” und dem Ausrufezeichen „!”. In solch einer Situation ist das Kontextwert-Objekt 51 das bestimmte Interpunktionssymbol, wobei jedes solche statistisch signifikante Interpunktionssymbol ein separates Kontextwert-Objekt 51 ist.
  • Ein weiterer beispielhafter Kontext ist der, in dem ein bestimmtes vieldeutiges Wort, in einem statistisch bedeutenden Ausmaß, einer anderen Eingabe folgt, die in einem vorgegebenen Format ist. In solch einer Situation kann der identifizierte Kontext zum Beispiel der sein, in dem das bestimmte vieldeutige Wort, in einem statistisch signifikanten Ausmaß, einer Eingabe folgt, die eine bestimmte Anordnung von numerischen Komponenten hat. Zum Beispiel kann ein numerisch angezeigtes Datum in einem der folgenden Formate angezeigt werden: NN/NN/NNNN oder NN/NN/NN oder N/NN/NNNN oder N/NN/NN oder N/N/NNNN oder N/N/NN oder andere Formate, wobei sich „N” auf eine arabische Ziffer bezieht und ”/„ kann sich auf jedes eines bestimmten Symbols beziehen, einen Delimiter bzw. Begrenzer, oder eine „Null”, wie ein <SPACE> bzw. Leerzeichen oder nichts. Als solches kann festgestellt werden, dass ein bestimmtes vieldeutiges Wort, in einem statistisch signifikanten Ausmaß, einer anderen Eingabe folgt, die in einem von einem oder mehrerer der Formate NN/NN/NNNN oder NN/NN/NN oder N/NN/NNNN oder N/NN/NN oder N/N/NNNN oder N/N/NN ist. Wieder kann das bestimmte vieldeutige Wort der formatierten Eingabe unmittelbar folgen oder kann zwei, drei oder mehrere Wörter hinter der formatierten Eingabe folgen. In solch einer Situation ist das Kontextwert-Objekt 51 eine Repräsentation des bestimmten Formats, wobei jedes derartige statistisch signifikante Format ein getrenntes Kontextwert-Objekt 51 ist.
  • Konkret werden die Kontextwert-Objekte 51 jeweils als ein Hash, d. h. ein ganzzahliger Wert, gespeichert, der aus einer mathematischen Manipulation resultiert. Zum Beispiel werden die zwei Kontextwert-Objekte 51 „TABLE” und „HILL”, während sie Wortobjekte 108 sind, in der Kontextdaten-Tabelle 49 als Hashes der Wörter „TABLE” und „HILL” gespeichert. Die Schlüssel-Objekte 47, wie das Wort „TOP”, können ebenfalls jeweils als Hash gespeichert werden.
  • Die drei Kontextwert-Objekte 51 „.”, „?” und „!” werden jeweils als ein Hash gespeichert, d. h. ein ganzzahliger Wert, der mehr in der Eigenschaft einer Markierung bzw. eines Flags ist, d. h. ein ganzzahliger Wert, der für ein Interpunktionssymbol selbst repräsentativ ist oder einen Wert hat, der unterschiedlich ist zu dem Hash eines der sechsundzwanzig lateinischen Buchstaben. Die Kontextwertobjekte 51 in der Eigenschaft von vorgegebenen Formaten konnten ähnlich gespeichert werden.
  • Während einer Texteingabe behält das Disambiguierungssystem in einem temporären Speicher-Register einen Hash einer Anzahl der Eingaben bei, die der aktuellen vieldeutigen Eingabe vorangehen. Zum Beispiel, wenn der Benutzer versucht, den Ausdruck „CLIMB THE HILL AND REACH THE TOP” einzugeben, berechnet und speichert die Disambiguierungs-Routine 22 einen Hash von jedem von einem oder mehreren der Wörter „CLIMB”, „THE”, „HILL”, „AND”, „REACH”, und „THE” als Eingabewerte 53, bevor der Benutzer die Reihe von Tastenanschlägen <TY> <OP> <OP> eingibt, die in den vieldeutigen Wörtern „TOO” und „TOP” resultieren. Der Speicher 20 kann konfiguriert werden, nur eine bestimmte Quantität solcher Eingabewerte 53 zu speichern, die auf einer „first-in-first-out”-Basis ersetzt werden, wenn zusätzliche Wörter eingegeben werden. Wenn zum Beispiel der Speicher nur die letzten vier Eingaben als Eingabewerte 53 speichert, sind die vier Eingabewerte, die zu dem Zeitpunkt existieren, wenn der Benutzer die Tastenanschläge für das Wort „TOP” eingibt, Hashes der Wörter „HILL”, „AND”, „REACH” und „THE”. In anderen Systemen zum Beispiel kann die Disambiguierungs-Routine als einen Eingabewert nur die eine Eingabe speichern, die unmittelbar der aktuellen Eingabe vorangeht.
  • Sobald der Benutzer die Reihe von Tastenanschlägen <TY> <OP> <OP> eingibt, bestimmt die Disambiguierungs-Routine, dass die zwei Wortobjekte 108 „TOO” und „TOP” jeweils der Reihe von Tastenanschlägen <TY> <OP> <OP> entsprechen und eine gleiche Länge haben, und stellt folglich fest, dass die zwei Wortobjekte 108 „TOO” und „TOP” vieldeutige Wörter repräsentieren. Wenn angenommen wird, dass das vieldeutige Wortobjekt 108 „TOO” ein zugehöriges Häufigkeitsobjekt 104 hat, das einen Häufigkeitswert hat, der höher als der des Häufigkeitsobjekts 104 ist, das zu dem vieldeutigen Wortobjekt 108 „TOP” gehört, konsultiert die Disambiguierungs-Routine 22 die Kontextdaten-Tabelle 49, um festzustellen, ob der bereits eingegebene Text einen Kontext liefert, wobei es angemessen ist, das Wortobjekt 108 „TOP” an einer Position einer höheren Priorität als das höhere Häufigkeits-Wortobjekt 108 „TOO” auszugeben.
  • Spezifisch sucht die Disambiguierungs-Routine 22, ob die Kontextdaten-Tabelle 49 ein Schlüssel-Objekt 47 gespeichert hat, das mit dem Wortobjekt 108 „TOP” übereinstimmt. Wenn solch ein Schlüssel-Objekt 47 gefunden wird, werden die verschiedenen Kontextwert-Objekten 51, die zu dem Schlüssel-Objekt 47 „TOP” gehören, mit jedem der Eingabewerte 53 verglichen, die in dem vorliegenden Beispiel Hashes der Wörter „HILL”, „AND”, „REACH” und „THE” sind, um festzustellen, ob irgendwelche der Kontextwert-Objekte 51 mit irgendwelchen der Eingabewerte 53 übereinstimmen oder nicht. Wie hier eingesetzt, sollen der Ausdruck „übereinstimmen” und Variationen davon weit jeden Typ einer vorgegebenen Äquivalenz, Entsprechung, Zugehörigkeit und dergleichen betreffen, deren Existenz zwischen zwei oder mehreren Objekten festgestellt werden kann. Da eines der Kontextwert-Objekte 51, die zu dem Schlüssel-Objekt 47 „TOP” gehören, ein Hash des Wortobjekts 108 „HILL” ist, und da einer der Eingabewerte 53 ein Hash des vorher eingegebenen Worts „HILL” ist, wird bei einem Vergleich festgestellt, dass die beiden Hashes übereinstimmen auf der Basis einer Gleichheit. Als ein Ergebnis wird das Schlüssel-Objekt 47, d. h. das vieldeutige Wortobjekt 108, „TOP” ausgegeben an einer Position von Priorität in Bezug auf das vieldeutige Wortobjekt 108 „TOO”, obwohl das vieldeutige Wortobjekt 108 „TOO” eine relativ höhere Häufigkeit hat.
  • Die Disambiguierungs-Routine 22 speichert als Eingabewerte 53 auch Hashes, die repräsentativ sind für Interpunktionssymbole und Nicht-Wort-Eingaben, zur Verwendung im Vergleich mit Kontextwert-Objekten 51 auf die gleiche Weise. Dies ist nützlich bei einer Suche nach Kontexten, wobei die Kontextwert-Objekte 51 repräsentativ sind für Interpunktionszeichen, vorgegebene Formate und dergleichen. Wenn zum Beispiel das vorgegebene Format ein Datumsformat ist, wie oben vorgeschlagen, wird ein zugehöriges Schlüsselobjekt 47 an einer bevorzugten Position ausgegeben, wenn ihm eine Eingabe in der Form eines Datums vorangeht. Es ist offensichtlich, dass zahlreich andere Typen von vordefinierten Formaten eingesetzt werden können, wie ein anderes Datumsformat, wie „Monat Datum, Jahr” oder „Datum Monat Jahr”, Zeitformate und jeder andere Typ eines vorgegebenen Formats, wenn als ein statistisch bedeutender Kontext festgestellt. Es ist auch offensichtlich, dass zahlreiche andere Typen von Kontexten mit der Disambiguierungs-Routine 22 identifiziert, gespeichert und eingesetzt werden können, ohne von dem vorliegenden Konzept abzuweichen.
  • Das vorliegende System ist insbesondere vorteilhaft aufgrund seiner Flexibilität. Es erfordert nicht die Einrichtung von umfassenden „Regeln” für eine Priorisierung von Wörtern in Kontexten. Stattdessen hat jedes weniger häufige vieldeutige Wort zugehörige statistisch signifikante Kontextdaten, was der tragbaren elektronischen Vorrichtung 4 ermöglicht, für die Bedürfnisse des Benutzers anpassungsfähig und anpassbar zu sein.
  • Kurz zusammengefasst, folglich, und allgemein dargestellt in 9 als abzweigend von dem Hauptprozess bei 234 in 3A, stellt die Disambiguierungs-Routine 22 fest, wie bei 604, ob zumindest zwei der Wortobjekte 108, die bei 224 in 3A identifiziert werden und gespeichert sind in dem Ergebnis, jeweils eine Länge haben, die zu der der vieldeutigen Eingabe gleich ist, und folglich vieldeutige Wortobjekte 108 sind, oder nicht. Wenn nicht, kehrt die Verarbeitung zurück, wie bei 608, zu dem Hauptprozess bei 236 in 3C. Wenn bei 604 festgestellt wird, dass das Ergebnis zumindest zwei vieldeutige Wortobjekte 108 umfasst, geht die Verarbeitung weiter zu 612, wo festgestellt wird, oh ein Schlüssel-Objekt 47, das einem der vieldeutigen Wortobjekte 108, außer dem Wortobjekt 108 mit höchster Häufigkeit, entspricht, in der Kontextdaten-Tabelle 49 gespeichert ist oder nicht. Wenn nicht, kehrt die Verarbeitung zurück, wie bei 608, zu dem Hauptprozess bei 236 in 3C.
  • Wenn bei 612 festgestellt wird, dass ein entsprechendes Schlüssel-Objekt 47 existiert, dann geht die Verarbeitung weiter, wie bei 616, wo die Kontextwert-Objekte 51, die zu dem identifizierten Schlüssel-Objekt 47 gehören, jeweils mit den gespeicherten Eingabewerten 53 verglichen werden, um zu identifizieren, ob ein Schlüssel-Objekt 47 und ein Eingabewert 53 übereinstimmen oder nicht. Wenn keine übereinstimmen, kehrt die Verarbeitung zurück, wie bei 608, zu dem Hauptprozess bei 236 in 3C. Wenn jedoch festgestellt wird bei 616, dass Schlüssel-Objekt 47 und ein Eingabewert 53 übereinstimmen, dann wird das Wortobjekt 108, das dem Schlüssel-Objekt 47 entspricht, ausgegeben, wie bei 620, an einer Position von Priorität in Bezug auf das häufigste vieldeutige Wortobjekt 108, das bei 604 identifiziert wird. Die Verarbeitung kehrt dann zurück, wie bei 608, zu dem Hauptprozess bei 236 in 3C.
  • Die Disambiguierungs-Routine 22 ist zusätzlich vorteilhafterweise konfiguriert, um bestimmte Kontextdaten zu lernen. Spezifisch kann die Disambiguierungs-Routine 22 die Kontextdaten des vorangehenden Wort-Typs identifizieren, wenn ein Benutzer bei zwei getrennten Gelegenheiten ein bestimmtes weniger bevorzugtes vieldeutiges Wortobjekt 108 in demselben Kontext auswählt.
  • Zum Beispiel können bei einer ersten Gelegenheit eine Vielzahl von vieldeutigen Wortobjekten 108 ausgegeben werden als Reaktion auf eine erste vieldeutige Eingabe, und ein Benutzer kann ein bestimmtes weniger bevorzugtes vieldeutiges Wortobjekt 108 auswählen. In solch einem Umstand werden das gewählte weniger bevorzugte vieldeutige Wortobjekt 108 und der spezifische Kontext als eine Eingabe in einer Kandidatendatendatei gespeichert.
  • Wenn bei einer zweiten Gelegenheit eine Vielzahl von vieldeutigen Wortobjekten 108 ausgegeben werden als Reaktion auf eine zweite vieldeutige Eingabe und wenn der Benutzer ein weniger bevorzugtes vieldeutiges Wortobjekt 108 auswählt, werden das weniger bevorzugte vieldeutige Wortobjekt 108 und der Kontext mit den verschiedenen Eingaben in der Kandidatendatendatei verglichen. Wenn eine Eingabe in der Kandidatendatendatei gefunden wird, die mit dem weniger bevorzugten vieldeutigen Wortobjekt 108 und dem Kontext der zweiten vieldeutigen Eingabe übereinstimmt, wird die Eingabe aus der Kandidatendatendatei zu der Kontextdaten-Tabelle 49 verschoben. Die neu gespeicherte Eingabe in der Kontextdaten-Tabelle 49 kann danach eingesetzt werden, wie oben dargelegt.
  • Es wird jedoch angemerkt, dass die Kandidatendatendatei ein Datenpuffer mit begrenzter Kapazität ist. Wenn zusätzliche Eingaben zu der Kandidatendatendatei hinzugefügt werden, werden ältere Eingaben, die nicht zu der Kontextdaten-Tabelle 49 verschoben wurden, gelöscht auf einer „first-in-first-out”-Basis. Die begrenzte Größe der Kandidatendatendatei fügt somit zu der Kontext-Lernenfunktion so etwas wie eine Benutzungshäufigkeits-Begrenzung hinzu. Das heißt, abhängig von einer Benutzung, kann eine Eingabe in die Kandidatendatendatei entweder zu der Kontextdaten-Tabelle 49 verschoben werden oder kann aus der Kandidatendatendatei entfernt werden, um für zusätzliche Eingaben Platz zu machen. Wenn die Eingabe zu der Kontextdaten-Tabelle 49 verschoben wird, zeigt dies an, dass der Benutzer das bestimmte weniger bevorzugte vieldeutige Wortobjekt 108 in dem bestimmten Kontext mit genügender Häufigkeit wünscht, um dessen Speicherung als gültige Kontextdaten zu gewährleisten. Andererseits zeigt ein Löschen der Kandidateneingabe, um Platz zu schaffen für zusätzliche Kandidateneingaben, dass die Kandidateneingabe nicht mit ausreichender Regelmäßigkeit oder Häufigkeit verwendet wurde, um zu gewährleisten, dass sie gespeichert wird als gelernte gültige Kontextdaten in der Kontextdaten-Tabelle 49.
  • Das gewählte weniger bevorzugte vieldeutige Wortobjekt 108 wird als ein Schlüssel-Objekt 47 in der Kontextdaten-Tabelle 49 gespeichert, wenn solch ein Schlüssel-Objekt 47 noch nicht existiert. Zusätzlich wird ein Hash des vorhergehenden Wort-Kontextes als ein Kontextwert-Objekt 51 gespeichert und dem vorher erwähnten Schlüssel-Objekt 47 zugeordnet. In dieser Hinsicht kann der vorhergehende Wort-Kontext einfach das unmittelbar vorangehende Wort sein. Es ist jedoch offensichtlich, dass der Kontext möglicherweise einer sein kann, in dem ein bestimmtes Kontext-Wort um zwei, drei oder mehr Wörter dem vieldeutigen Wortobjekt 108 vorangeht, für das der Kontext gelernt wird. Derartiger Kontext kann vorteilhafterweise gelernt werden für Wortobjekte 108 in der „neue Wörter”-Datenbank 92 und in jeder anderen Datenquelle in dem Speicher 20. Es ist auch offensichtlich, dass andere Typen von Kontexten durch die Disambiguierungs-Routine 22 gelernt werden können.
  • Außerdem können gelernte Kontextdaten verlernt werden. Zum Beispiel können ein bestimmtes Schlüssel-Objekt 47 und ein entsprechendes bestimmtes Kontextwert-Objekt 51 zu der Kontextdaten-Tabelle 49 über die vorher erwähnte Lernenfunktion hinzugefügt werden. An einem Punkt in der Zukunft kann der Benutzer in dem bestimmten Kontext beginnen, eine Ausgabe zu bevorzugen, die vorher eine Standard-Ausgabe war, zugunsten dessen ein weniger bevorzugtes vieldeutiges Wortobjekt 108 bei zwei Gelegenheiten gewählt wurde und als Kontextdaten gespeichert wurde. Wenn dies bei zwei Gelegenheiten geschieht, werden das vorher gelernte bestimmte Schlüssel-Objekt 47 und das entsprechende bestimmte Kontextwert-Objekt 51 vorteilhafterweise verlernt, d. h. aus der Kontextdaten-Tabelle 49 gelöscht. Das heißt, das System arbeitet, als wenn das vorher gelernte bestimmte Schlüssel-Objekt 47 und das entsprechende bestimmte Kontextwert-Objekt 51 als keine gültigen Kontextdaten bestimmt werden. Dies vermeidet die Verwendung von Kontextdaten, die nicht gewünscht sind oder die als ungültig angesehen werden.
  • Während spezifische Ausführungsbeispiele des offenbarten und beanspruchten Konzepts im Detail beschrieben wurden, ist für Fachleute offensichtlich, dass verschiedene Modifikationen und Alternativen zu jenen Details hinsichtlich der gesamten Lehren der Offenbarung entwickelt werden können. Demgemäß sollen die bestimmten Anordnungen, die offenbart werden, nur illustrativ und nicht begrenzend sein hinsichtlich des Umfangs des offenbarten und beanspruchten Konzepts, dem der volle Umfang der angefügten Ansprüche und jedes und alle Äquivalente davon gegeben werden soll.

Claims (16)

  1. Verfahren zur Ermöglichung einer Eingabe in eine tragbare elektronische Vorrichtung, die eine Eingabevorrichtung, eine Ausgabevorrichtung und eine Prozessorvorrichtung umfasst, die einen Speicher aufweist, der eine Vielzahl von Objekten gespeichert hat, einschließlich einer Vielzahl von Sprachobjekten, einer Vielzahl von Häufigkeitsobjekten und einer Anzahl von Kontextwerten, wobei zumindest einige der Sprachobjekte jeweils ein Häufigkeitsobjekt mit einem Häufigkeitswert zugewiesen haben, wobei zumindest einige der Sprachobjekte jeweils zumindest einen Kontextwert zugewiesen haben, wobei ein Kontextwert ein Hash eines Sprachobjekts ist, wobei die Eingabevorrichtung eine Vielzahl von Eingabeelementen aufweist, wobei zumindest einigen der Eingabeelemente jeweils eine Vielzahl von linguistischen Elementen zugewiesen ist, wobei das Verfahren aufweist: Erfassen einer ersten Eingabe; Ausgeben als eine erste Ausgabe eines ersten Sprachobjekts als eine Interpretation der ersten Eingabe; Speichern eines Hashwertes des ersten Sprachobjekts in dem Speicher; Erfassen als eine zweite Eingabe eine vieldeutige Eingabe, die eine Anzahl von Eingabeelementbetätigungen aufweist; Bestimmen, dass ein bestimmtes Sprachobjekt, das ein bestimmtes Häufigkeitsobjekt mit einem bestimmten Häufigkeitswert zugewiesen hat, der vieldeutigen Eingabe entspricht, wobei das bestimmte Sprachobjekt eine Länge hat, die zu derjenigen der vieldeutigen Eingabe gleich ist; Bestimmen, dass ein anderes Sprachobjekt, das ein anderes Häufigkeitsobjekt mit einem anderen Häufigkeitswert, der höher ist als der bestimmte Häufigkeitswert, zugewiesen hat, der vieldeutigen Eingabe entspricht, wobei das andere Sprachobjekt eine Länge hat, die zu derjenigen der vieldeutigen Eingabe gleich ist; Bestimmen, dass ein Kontextwert, der zu dem bestimmten Sprachobjekt gehört, mit dem gespeicherten Hashwert des ersten Sprachobjekts übereinstimmt; und Ausgeben des bestimmten Sprachobjekts als eine bevorzugte Interpretation der vieldeutigen Eingabe an einer Standardausgabeposition.
  2. Verfahren gemäß Anspruch 1, das weiter aufweist Verwenden als den Kontextwert eine Repräsentation eines aus einem Wort und einer Interpunktion.
  3. Verfahren gemäß Anspruch 1, das weiter aufweist Verwenden als den Kontextwert eine Repräsentation einer Eingabe in einem vorgegebenen Format.
  4. Verfahren gemäß Anspruch 3, das weiter aufweist Verwenden als die Repräsentation einer Eingabe in einem vorgegebenen Format eine Repräsentation einer Eingabe in einem aus einem Datumsformat und einem Zeitformat.
  5. Verfahren gemäß Anspruch 3, das weiter aufweist Verwenden als die Repräsentation einer Eingabe in einem vorgegebenen Format eine Repräsentation einer Eingabe mit einer vorgegebenen Anordnung von numerischen Komponenten.
  6. Verfahren gemäß Anspruch 1, das weiter aufweist Erfassen als die erste Eingabe einen oder mehrere einer Vielzahl von Worteingaben, die der zweiten Eingabe vorangehen.
  7. Verfahren gemäß Anspruch 1, das weiter aufweist, als Reaktion auf das Bestimmen des bestimmten Sprachobjekts und des Bestimmens des anderen Sprachobjekts, Initiieren des Bestimmens.
  8. Verfahren gemäß Anspruch 1, das weiter aufweist: Identifizieren als das bestimmte Sprachobjekt ein Wortobjekt, das repräsentativ ist für ein relativ weniger häufiges vieldeutiges Wort; Identifizieren als das andere Sprachobjekt ein Wortobjekt, das repräsentativ ist für ein relativ häufigeres vieldeutiges Wort; und Bestimmen als die Bestimmung, dass das weniger häufige vieldeutige Wort, in dem Kontext der ersten Ausgabe, ausgegeben werden sollte an einer Position von Präferenz gegenüber dem häufigeren vieldeutigen Wort.
  9. Tragbare elektronische Vorrichtung, die aufweist eine Eingabevorrichtung, eine Prozessorvorrichtung und eine Ausgabevorrichtung, wobei die Eingabevorrichtung eine Anzahl von Eingabeelementen aufweist, wobei die Prozessorvorrichtung einen Prozessor und einen Speicher aufweist, der eine Vielzahl von Objekten gespeichert hat, die eine Vielzahl von Sprachobjekten, eine Vielzahl von Häufigkeitsobjekten und eine Anzahl von Kontextwerten aufweisen, wobei zumindest einige der Sprachobjekte jeweils ein Häufigkeitsobjekt mit einem Häufigkeitswert zugewiesen haben, wobei zumindest einige der Sprachobjekte jeweils zumindest einen Kontextwert zugewiesen haben, wobei ein Kontextwert ein Hash eines Sprachobjekts ist, wobei der Speicher eine Anzahl von Routinen gespeichert hat, die, wenn durch den Prozessor ausgeführt, die tragbare elektronische Vorrichtung veranlassen, angepasst zu werden, um Operationen durchzuführen, die aufweisen: Erfassen einer ersten Eingabe und einer zweiten Eingabe, wobei die zweite Eingabe eine vieldeutige Eingabe aufweist, die eine Anzahl von Eingabeelementbetätigungen aufweist; Ausgeben als eine erste Ausgabe eines ersten Sprachobjekts als eine Interpretation der ersten Eingabe; Speichern eines Hashwertes des ersten Sprachobjekts in dem Speicher; Bestimmen, dass ein bestimmtes Sprachobjekt, das ein bestimmtes Häufigkeitsobjekt mit einem bestimmten Häufigkeitswert zugewiesen hat, der vieldeutigen Eingabe entspricht, wobei das bestimmte Sprachobjekt eine Länge hat, die zu derjenigen der vieldeutigen Eingabe gleich ist; Bestimmen, dass ein anderes Sprachobjekt, das ein anderes Häufigkeitsobjekt mit einem anderen Häufigkeitswert, der höher ist als der bestimmte Häufigkeitswert, zugewiesen hat, der vieldeutigen Eingabe entspricht, wobei das andere Sprachobjekt eine Länge hat, die zu derjenigen der vieldeutigen Eingabe gleich ist; Bestimmen, dass ein Kontextwert, der zu dem bestimmten Sprachobjekt gehört, mit dem gespeicherten Hashwert des ersten Sprachobjekts übereinstimmt; und Ausgeben des bestimmten Sprachobjekts als eine bevorzugte Interpretation der vieldeutigen Eingabe in einer Standardausgabeposition.
  10. Tragbare elektronische Vorrichtung gemäß Anspruch 9, wobei die Operationen weiter aufweisen Verwenden als den Kontextwert eine Repräsentation eines aus einem Wort und einer Interpunktion.
  11. Tragbare elektronische Vorrichtung gemäß Anspruch 9, wobei die Operationen weiter aufweisen Verwenden als den Kontextwert eine Repräsentation einer Eingabe in einem vorgegebenen Format.
  12. Tragbare elektronische Vorrichtung gemäß Anspruch 11, wobei die Operationen weiter aufweisen Verwenden als die Repräsentation einer Eingabe in einem vorgegebenen Format eine Repräsentation einer Eingabe in einem aus einem Datumsformat und einem Zeitformat.
  13. Tragbare elektronische Vorrichtung gemäß Anspruch 11, wobei die Operationen weiter aufweisen Verwenden als die Repräsentation einer Eingabe in einem vorgegebenen Format eine Repräsentation einer Eingabe mit einer vorgegebenen Anordnung von numerischen Komponenten.
  14. Tragbare elektronische Vorrichtung gemäß Anspruch 9, wobei die Operationen weiter aufweisen Erfassen als die erste Eingabe einen oder mehrere einer Vielzahl von Worteingaben, die der zweiten Eingabe vorangehen.
  15. Tragbare elektronische Vorrichtung gemäß Anspruch 9, wobei die Operationen weiter aufweisen, als Reaktion auf das Bestimmen des bestimmten Sprachobjekts und des Bestimmens des anderen Sprachobjekts, Initiieren des Bestimmens.
  16. Tragbare elektronische Vorrichtung gemäß Anspruch 9, wobei die Operationen weiter aufweisen: Identifizieren als das bestimmte Sprachobjekt ein Wortobjekt, das repräsentativ ist für ein relativ weniger häufiges vieldeutiges Wort; Identifizieren als das andere Sprachobjekt ein Wortobjekt, das repräsentativ ist für ein relativ häufigeres vieldeutiges Wort; und Bestimmen als die Bestimmung, dass das weniger häufige vieldeutige Wort, in dem Kontext der ersten Ausgabe, ausgegeben werden sollte an einer Position von Präferenz gegenüber dem häufigeren vieldeutigen Wort.
DE112007000856.3T 2006-04-06 2007-01-26 Tragbare elektronische Vorrichtung und Verfahren zum Verwenden von Kontextdaten zur Disambiguierung einer Texteingabe Active DE112007000856B4 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/399,641 2006-04-06
US11/399,641 US8065135B2 (en) 2006-04-06 2006-04-06 Handheld electronic device and method for employing contextual data for disambiguation of text input
PCT/CA2007/000102 WO2007112542A1 (en) 2006-04-06 2007-01-26 Handheld electronic device and method for employing contextual data for disambiguation of text input

Publications (2)

Publication Number Publication Date
DE112007000856T5 DE112007000856T5 (de) 2009-02-12
DE112007000856B4 true DE112007000856B4 (de) 2014-09-25

Family

ID=38563023

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112007000856.3T Active DE112007000856B4 (de) 2006-04-06 2007-01-26 Tragbare elektronische Vorrichtung und Verfahren zum Verwenden von Kontextdaten zur Disambiguierung einer Texteingabe

Country Status (5)

Country Link
US (2) US8065135B2 (de)
CA (1) CA2647934C (de)
DE (1) DE112007000856B4 (de)
GB (1) GB2451036B (de)
WO (1) WO2007112542A1 (de)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8103499B2 (en) * 2007-03-22 2012-01-24 Tegic Communications, Inc. Disambiguation of telephone style key presses to yield Chinese text using segmentation and selective shifting
US8384671B2 (en) * 2008-01-07 2013-02-26 Mark Shkolnikov Split QWERTY keyboard with reduced number of keys
JP5434586B2 (ja) * 2009-12-29 2014-03-05 オムロン株式会社 単語認識方法および単語認識用のプログラムならびに情報処理装置
JP2011238129A (ja) * 2010-05-12 2011-11-24 Sony Corp 端末装置、電子機器、アクセスキーの割り当て方法及びプログラム
US8972241B2 (en) 2012-04-30 2015-03-03 Blackberry Limited Electronic device and method for a bidirectional context-based text disambiguation
WO2013163717A1 (en) * 2012-04-30 2013-11-07 Research In Motion Limited Electronic device and method for a bidirectional context-based text disambiguation

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5818437A (en) * 1995-07-26 1998-10-06 Tegic Communications, Inc. Reduced keyboard disambiguating computer
DE112005001283T5 (de) * 2004-06-02 2007-10-31 Research In Motion Ltd., Waterloo Tragbare elektronische Vorrichtung mit Textdisambiguierung

Family Cites Families (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5050212A (en) * 1990-06-20 1991-09-17 Apple Computer, Inc. Method and apparatus for verifying the integrity of a file stored separately from a computer
US6400996B1 (en) * 1999-02-01 2002-06-04 Steven M. Hoffberg Adaptive pattern recognition based control system and method
JP3270783B2 (ja) * 1992-09-29 2002-04-02 ゼロックス・コーポレーション 複数の文書検索方法
US5576954A (en) * 1993-11-05 1996-11-19 University Of Central Florida Process for determination of text relevancy
US6734881B1 (en) * 1995-04-18 2004-05-11 Craig Alexander Will Efficient entry of words by disambiguation
US5826260A (en) * 1995-12-11 1998-10-20 International Business Machines Corporation Information retrieval system and method for displaying and ordering information based on query element contribution
TW422952B (en) * 1996-05-22 2001-02-21 Sega Enterprises Kk A display device and a method of electronic document
US7158960B2 (en) * 1996-06-04 2007-01-02 Informative, Inc. Asynchronous network collaboration method and apparatus
JP3819078B2 (ja) 1996-07-18 2006-09-06 勝行 戸津 無反動クラッチ機構を内蔵した電動回転工具
US5664896A (en) * 1996-08-29 1997-09-09 Blumberg; Marvin R. Speed typing apparatus and method
US5953541A (en) * 1997-01-24 1999-09-14 Tegic Communications, Inc. Disambiguating system for disambiguating ambiguous input sequences by displaying objects associated with the generated input sequences in the order of decreasing frequency of use
US6005495A (en) * 1997-02-27 1999-12-21 Ameritech Corporation Method and system for intelligent text entry on a numeric keypad
EP1018069B1 (de) * 1997-09-25 2002-07-24 Tegic Communications, Inc. System zur unterdrückung der vieldeutigkeit in einer verringerten tastatur
US6489950B1 (en) 1998-06-26 2002-12-03 Research In Motion Limited Hand-held electronic device with auxiliary input device
US6278442B1 (en) 1998-06-26 2001-08-21 Research In Motion Limited Hand-held electronic device with a keyboard optimized for use with the thumbs
US6636162B1 (en) * 1998-12-04 2003-10-21 America Online, Incorporated Reduced keyboard text input system for the Japanese language
US8938688B2 (en) * 1998-12-04 2015-01-20 Nuance Communications, Inc. Contextual prediction of user words and user actions
US7679534B2 (en) 1998-12-04 2010-03-16 Tegic Communications, Inc. Contextual prediction of user words and user actions
GB2347239B (en) 1999-02-22 2003-09-24 Nokia Mobile Phones Ltd A communication terminal having a predictive editor application
GB2347247A (en) 1999-02-22 2000-08-30 Nokia Mobile Phones Ltd Communication terminal with predictive editor
US6204848B1 (en) 1999-04-14 2001-03-20 Motorola, Inc. Data entry apparatus having a limited number of character keys and method
US6493702B1 (en) * 1999-05-05 2002-12-10 Xerox Corporation System and method for searching and recommending documents in a collection using share bookmarks
EP1192716B1 (de) * 1999-05-27 2009-09-23 Tegic Communications, Inc. Tastatursystem mit automatischer korrektur
JP2002092261A (ja) * 2000-09-13 2002-03-29 Yamaha Corp コンテンツ評価方法
US6882869B1 (en) 2000-12-19 2005-04-19 Cisco Technology, Inc. Device, methods, and user interface for providing optimized entry of alphanumeric text
GB0103053D0 (en) * 2001-02-07 2001-03-21 Nokia Mobile Phones Ltd A communication terminal having a predictive text editor application
US20020126097A1 (en) * 2001-03-07 2002-09-12 Savolainen Sampo Jussi Pellervo Alphanumeric data entry method and apparatus using reduced keyboard and context related dictionaries
US7385591B2 (en) 2001-03-31 2008-06-10 Microsoft Corporation Out-of-vocabulary word determination and user interface for text input via reduced keypad keys
US7117144B2 (en) 2001-03-31 2006-10-03 Microsoft Corporation Spell checking for text input via reduced keypad keys
US7103534B2 (en) * 2001-03-31 2006-09-05 Microsoft Corporation Machine learning contextual approach to word determination for text input via reduced keypad keys
US20020156617A1 (en) * 2001-04-20 2002-10-24 Aretakis Jon Andrew Electonic speaking dictionary: a simple device for finding, pronounincing, and defining a word
JP4037100B2 (ja) * 2001-12-13 2008-01-23 沖電気工業株式会社 コール受付システム
US7111248B2 (en) * 2002-01-15 2006-09-19 Openwave Systems Inc. Alphanumeric information input method
KR20050025147A (ko) 2002-03-22 2005-03-11 소니 에릭슨 모빌 커뮤니케이션즈 에이비 전자 통신 장치로의 텍스트 입력
DE10235548B4 (de) 2002-03-25 2012-06-28 Agere Systems Guardian Corp. Verfahren und Vorrichtung für die Prädiktion einer Textnachrichteneingabe
US20040030540A1 (en) * 2002-08-07 2004-02-12 Joel Ovil Method and apparatus for language processing
US7783486B2 (en) * 2002-11-22 2010-08-24 Roy Jonathan Rosser Response generator for mimicking human-computer natural language conversation
US7171498B2 (en) 2003-01-09 2007-01-30 Sony Computer Entertainment America Inc. Alphanumeric keyboard input system using a game controller
US20040153975A1 (en) 2003-02-05 2004-08-05 Williams Roland E. Text entry mechanism for small keypads
US20040249631A1 (en) * 2003-03-28 2004-12-09 Theresa Harris Methods and systems for credit card-size electronic dictionary configurable as a bookmark
US20050192802A1 (en) * 2004-02-11 2005-09-01 Alex Robinson Handwriting and voice input with automatic correction
US20050182617A1 (en) * 2004-02-17 2005-08-18 Microsoft Corporation Methods and systems for providing automated actions on recognized text strings in a computer-generated document
US7327484B2 (en) * 2004-03-19 2008-02-05 Sharp Kabushiki Kaisha Data processing apparatus for imparting priority to either nullification of processed data or processing of non-processed data
WO2005103641A2 (en) 2004-04-16 2005-11-03 Gavin Steele Automatic sampling manifold
EP1603022A1 (de) 2004-06-02 2005-12-07 2012244 Ontario Inc. Tragbares elektronisches Gerät mit Prädiktive-Texteingabe
US7333085B2 (en) 2004-06-02 2008-02-19 Research In Motion Limited Handheld electronic device with text disambiguation
US8036878B2 (en) * 2005-05-18 2011-10-11 Never Wall Treuhand GmbH Device incorporating improved text input mechanism
JP2007052397A (ja) * 2005-07-21 2007-03-01 Denso Corp 操作装置
US7941316B2 (en) * 2005-10-28 2011-05-10 Microsoft Corporation Combined speech and alternate input modality to a mobile device
US7525452B2 (en) * 2006-01-13 2009-04-28 Research In Motion Limited Handheld electronic device and method for disambiguation of text input providing suppression of low probability artificial variants
US7818315B2 (en) * 2006-03-13 2010-10-19 Microsoft Corporation Re-ranking search results based on query log
US7477165B2 (en) 2006-04-06 2009-01-13 Research In Motion Limited Handheld electronic device and method for learning contextual data during disambiguation of text input
US7599712B2 (en) 2006-09-27 2009-10-06 Palm, Inc. Apparatus and methods for providing directional commands for a mobile computing device
US9092418B2 (en) * 2007-03-30 2015-07-28 Blackberry Limted Use of a suffix-changing spell check algorithm for a spell check function, and associated handheld electronic device
US20080255846A1 (en) * 2007-04-13 2008-10-16 Vadim Fux Method of providing language objects by indentifying an occupation of a user of a handheld electronic device and a handheld electronic device incorporating the same
US7669122B2 (en) * 2007-11-19 2010-02-23 O'dell Robert Barry Using input of rhyming characters for computer text entry of Chinese characters
US7697534B1 (en) * 2008-04-18 2010-04-13 Cisco Technology, Inc. Virtual private LAN service networks with mixed mode network devices

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5818437A (en) * 1995-07-26 1998-10-06 Tegic Communications, Inc. Reduced keyboard disambiguating computer
DE112005001283T5 (de) * 2004-06-02 2007-10-31 Research In Motion Ltd., Waterloo Tragbare elektronische Vorrichtung mit Textdisambiguierung

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MATIASEK, Johannes; BARONI, Marco. Exploiting long distance collocational relations in predictive typing. In: Proceedings of the 2003 EACL Workshop on Language Modeling for Text Entry Methods. Association for Computational Linguistics, S. 1-8. [onlinde] URL: http://clic.cimec.unitn.it/marco/publications/eacl03.pdf [abgerufen am 16.10.2012] *
Nestor GARAY-VITORIA, Julio ABASCAL: Text Prediction Systems: A Survey; @ Springer-Verlag 2005, doi: 10.1007/s10209-005-0005-9 *

Also Published As

Publication number Publication date
US20070239425A1 (en) 2007-10-11
GB2451036A (en) 2009-01-14
US8065135B2 (en) 2011-11-22
US20120029905A1 (en) 2012-02-02
GB2451036B (en) 2011-10-12
WO2007112542A1 (en) 2007-10-11
GB0820120D0 (en) 2008-12-10
DE112007000856T5 (de) 2009-02-12
CA2647934C (en) 2012-04-03
CA2647934A1 (en) 2007-10-11
US8612210B2 (en) 2013-12-17

Similar Documents

Publication Publication Date Title
DE112007000854B4 (de) Tragbare elektronische Vorrichtung, die eine Lernfunktion vorsieht zur Erleichterung einer Korrektur einer fehlerhaften Texteingabe in einer Umgebung eines Textes, der mehrere sequentielle Betätigungen derselben Taste erfordert, und zugehöriges Verfahren
DE112007000847T5 (de) Tragbare elektronische Vorrichtung und Verfahren zum Lernen von Kontextdaten während einer Disambiguierung einer Texteingabe
DE112005001284B4 (de) Tragbare elektronische Vorrichtung mit Textdisambiguierung
DE112006003659T5 (de) Tragbare elektronische Vorrichtung und Verfahren zum Disambiguieren einer Texteingabe und Vorsehen eines Schreibweiseersatzes
DE112006002315B4 (de) Textdisambiguierung, die eine dynamische Expansion von Tastenzuordnungen ermöglicht
DE69806780T2 (de) System zur unterdrückung der vieldeutigkeit in einer verringerten tastatur
DE112007000855T5 (de) Tragbare elektronische Vorrichtung und Verfahren zur Durchführung einer Rechtschreibprüfung während einer Texteingabe und zum Vorsehen eines Rechtschreibprüfungs-Lern-Merkmals
DE112007000727T5 (de) Tragbare elektronische Vorrichtung und Verfahren zur Durchführung einer Rechtschreibprüfung während einer Texteingabe und zum Integrieren der Ausgabe der Rechtschreibprüfung in die Ausgabe einer Disambiguierung
DE112007000848T5 (de) Tragbare elektronische Vorrichtung und Verfahren zur Durchführung einer optimierten Rechtschreibprüfung während einer Texteingabe durch Vorsehen einer sequentiell angeordneten Reihe von Rechtschreibprüfalgorithmen
DE112007000728B4 (de) Tragbare elektronische Vorrichtung zum Vorsehen einer vorgeschlagenen korrigierten Eingabe als Reaktion auf eine fehlerhafte Texteingabe in einer Umgebung eines Textes, der mehrere sequentielle Betätigungen derselben Taste erfordert, und zugehöriges Verfahren
DE112006003651T5 (de) Tragbare elektronische Vorrichtung und Verfahren zur Disambiguierung einer Texteingabe zur Unterdrückung von künstlichen Varianten mit geringer Wahrscheinlichkeit
DE60038195T2 (de) Übertragungsendgerät mit vorhersagendem Editor
DE69808498T2 (de) System zur reduzierung der vieldeutigkeit einer eingeschrängten tastatur
DE60035527T2 (de) Ein Mobiltelefon mit vorhersagender Editor-Anwendung
DE112005001283T5 (de) Tragbare elektronische Vorrichtung mit Textdisambiguierung
DE112006003650T5 (de) Tragbare elektronische Vorrichtung und Verfahren zur Disambiguierung einer Kompositum-Eingabe bei Einsatz unterschiedlicher Gruppierungen von Datenquellen, um unterschiedliche Teile einer Eingabe zu disambiguieren
DE112005001282T5 (de) Tragbare elektronische Vorrichtung mit Textdisambiguierung
DE112005001316T5 (de) Tragbare elektronische Vorrichtung mit Textdisambiguierung
DE112007000856B4 (de) Tragbare elektronische Vorrichtung und Verfahren zum Verwenden von Kontextdaten zur Disambiguierung einer Texteingabe
DE112006003658T5 (de) Disambiguierung einer Kompositum-Eingabe mit priorisierten Lösungen
DE112005001314T5 (de) Tragbare elektronische Vorrichtung mit Textdisambiguierung
DE112006003660T5 (de) Tragbare elektronische Vorrichtung und Verfahren zur Disambiguierung einer Texteingabe, die/das künstliche Varianten vorsieht, die aus Zeichen in einem Kernalphabet bestehen
DE112005002100T5 (de) System und Verfahren für multilinguale Texteinabe in einer tragbaren elektronischen Vorrichtung
DE112008001975B4 (de) Disambiguierung von Wörtern mit Buchstaben und Symbolen
DE112006003649T5 (de) Tragbare elektronische Vorrichtung und Verfahren zur Disambiguierung einer Kompositum-Eingabe und zur Priorisierung von Kompositum-Lösungen gemäß einer Vollständigkeit von Textkomponenten

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8128 New person/name/address of the agent

Representative=s name: MERH-IP, 80336 MUENCHEN

R018 Grant decision by examination section/examining division
R082 Change of representative

Representative=s name: MERH-IP MATIAS ERNY REICHL HOFFMANN, DE

R081 Change of applicant/patentee

Owner name: BLACKBERRY LIMITED, WATERLOO, CA

Free format text: FORMER OWNER: RESEARCH IN MOTION LTD., WATERLOO, ONTARIO, CA

Effective date: 20140925

R082 Change of representative

Representative=s name: MERH-IP MATIAS ERNY REICHL HOFFMANN, DE

Effective date: 20140925

Representative=s name: MERH-IP MATIAS ERNY REICHL HOFFMANN PATENTANWA, DE

Effective date: 20140925

R020 Patent grant now final
R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G06F0017270000

Ipc: G06F0040200000

R081 Change of applicant/patentee

Owner name: MALIKIE INNOVATIONS LTD., IE

Free format text: FORMER OWNER: BLACKBERRY LIMITED, WATERLOO, ONTARIO, CA

R082 Change of representative