DE112006004015T5 - Verfahren zum Identifizieren der Sprache von Text in einer handgehaltenen bzw. tragbaren elektronischen Vorrichtung und eine tragbare elektronische Vorrichtung, die dies aufweist - Google Patents

Verfahren zum Identifizieren der Sprache von Text in einer handgehaltenen bzw. tragbaren elektronischen Vorrichtung und eine tragbare elektronische Vorrichtung, die dies aufweist Download PDF

Info

Publication number
DE112006004015T5
DE112006004015T5 DE112006004015T DE112006004015T DE112006004015T5 DE 112006004015 T5 DE112006004015 T5 DE 112006004015T5 DE 112006004015 T DE112006004015 T DE 112006004015T DE 112006004015 T DE112006004015 T DE 112006004015T DE 112006004015 T5 DE112006004015 T5 DE 112006004015T5
Authority
DE
Germany
Prior art keywords
text
language
electronic device
linguistic
objects
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE112006004015T
Other languages
English (en)
Inventor
Vadim Waterloo FUX
Sergey Waterloo Kolomiets
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BlackBerry Ltd
Original Assignee
Research in Motion Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Research in Motion Ltd filed Critical Research in Motion Ltd
Publication of DE112006004015T5 publication Critical patent/DE112006004015T5/de
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/263Language identification

Abstract

Verfahren zum Identifizieren der Sprache von Text in einer handgehaltenen bzw. tragbaren elektronischen Vorrichtung mit zumindest einer Anwendung zum Empfangen von Text von einer Quelle, die extern zu der tragbaren elektronischen Vorrichtung ist, und eine Vielzahl von Indikator-Listen verfügbar hat, wobei jede Indikator-Liste eine Anzahl von linguistischen Objekten aufweist, die eine vorgewählte Sprache anzeigen und die in einer anderen Sprache sind als die linguistischen Objekte der anderen Indikator-Listen, wobei das Verfahren aufweist:
Analysieren des Texts, um zumindest vorläufig eine Codierung des Texts zu bestimmen; und
Vergleichen von linguistischen Objekten des Texts mit zumindest einigen der linguistischen Objekte von zumindest einigen der Indikator-Listen, um die Sprache des Texts zu identifizieren und die Codierung des Texts zu verifizieren.

Description

  • HINTERGRUND
  • Technisches Gebiet
  • Aspekte der Offenbarung betreffen ein Identifizieren der Sprache von Text in einer tragbaren elektronischen Vorrichtung.
  • Hintergrundinformation
  • Erzeugen von Text in einer handgehaltenen bzw. tragbaren elektronischen Vorrichtung, Beispiele davon umfassen zum Beispiel persönliche Datenassistenten (PDA – personal data assistants), handgehaltene Computer, Zweiweg-Pager, zellulare Telefone, Text-Messaging-Vorrichtungen und dergleichen, ist ein komplexer Prozess geworden. Dies ist zumindest teilweise aufgrund des Trends, diese tragbaren elektronischen Vorrichtungen kleiner und leichter zu machen. Eine Begrenzung, diese kleiner zu machen, war die physikalische Größe der Tastatur, wenn die Tasten direkt durch menschliche Finger betätigt werden sollen. Allgemein gab es zwei Ansätze zur Lösung dieses Problems. Einer ist, die Tastatur mit den zehn Ziffern, die mobilen Telefonen eigen ist, für eine Texteingabe anzupassen. Dies erfordert, dass jede Taste eine Eingabe mehrerer Buchstaben unterstützt. Der zweite Ansatz versucht, die herkömmliche vollständige Tastatur, wie die QWERTY-Tastatur, zu verkleinern, durch Verdopplung von Buchstaben, um die Anzahl der Tasten zu reduzieren. In beiden Fällen ist die Eingabe, die durch Betä tigung einer Taste erzeugt wird, die mehrere Buchstaben repräsentiert, vieldeutig. Verschiedene Schemen wurden entwickelt, um Eingaben von diesen Tasten mit mehreren Buchstaben zu disambiguieren.
  • Ein Problem besteht hinsichtlich tragbaren elektronischen Vorrichtungen, die ein vollständiges Tastaturfeld oder ein verringertes Tastaturfeld haben, darin, dass die Vorrichtung nicht immer exakt die Sprache des empfangenen Texts identifizieren kann, da eine Anzahl von Sprachen dieselbe Codierung benutzen. Somit besteht das Potential für Verarbeitungsfehler in der tragbaren elektronischen Vorrichtung bei der Bestimmung der Identität der Sprache des E-Mails. Wenn die tragbare elektronische Vorrichtung die Sprache der E-Mail nicht exakt identifizieren kann, können die Buchstaben der E-Mail dem Endbenutzer falsch angezeigt werden, oder die tragbare elektronische Vorrichtung kann linguistische Elemente der E-Mail der falschen Liste von allgemein verwendeten linguistischen Elementen hinzufügen, die aus der Liste für eine Disambiguierung verwendet werden.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • 1 ist eine Vorderansicht einer beispielhaften tragbaren elektronischen Vorrichtung, die Aspekte der offenbarten und beanspruchten Konzepte umfasst;
  • 2 ist eine Vorderansicht einer alternativen beispielhaften tragbaren elektronischen Vorrichtung, die Aspekte der offenbarten und beanspruchten Konzepte umfasst;
  • 3 ist ein Funktionsdiagramm in Blockform, das Aspekte der offenbarten und beanspruchten Konzepte darstellt; und
  • 4 ist ein Flussdiagramm, das eine Operation von Aspekten der offenbarten und beanspruchten Konzepte darstellt.
  • BESCHREIBUNG
  • Ein Aspekt der offenbarten und beanspruchten Konzepte ist, die Sprache von Text zu identifizieren und die Codierung des Texts zu verifizieren, um Verarbeitungsfehler in einer tragbaren elektronischen Vorrichtung zu minimieren. Eine beispielhafte externe Quelle von Text ist E-Mail-Messaging. Zusätzliche nichtbegrenzende Beispiele umfassen SMS (Short Message Service), MMS (Multi-Media Service) und Instant Messaging.
  • Insbesondere betreffen Aspekte der offenbarten und beanspruchten Konzepte ein Verfahren zum Identifizieren der Sprache von Text in einer tragbaren elektronischen Vorrichtung. Die tragbare elektronische Vorrichtung hat zumindest eine Anwendung zum Empfangen von Text von einer Quelle, die extern zu der tragbaren elektronischen Vorrichtung ist. Die tragbare elektronische Vorrichtung hat dafür verfügbar eine Vielzahl von Indikator-Listen, wobei jede Indikator-Liste eine Anzahl von linguistischen Objekten umfasst, die eine vorgewählte Sprache anzeigen und die in einer anderen Sprache sind als die linguistischen Objekte der anderen Indikator-Listen. Das allgemeine Verfahren der offenbarten und beanspruchten Konzepte umfasst ein Analysieren des Texts, um zumindest vorläufig eine Codierung des Texts zu bestimmen und ein Vergleichen von linguistischen Objekten des Texts mit zumindest einigen der linguistischen Objekte von zumindest einigen der Indikator-Listen, um die Sprache des Texts zu identifizieren und die Codierung des Texts zu verifizieren.
  • Aspekte der offenbarten und beanspruchten Konzepte umfassen auch eine tragbare elektronische Vorrichtung mit einer Verarbeitungsvorrichtung. Die Verarbeitungsvorrichtung hat einen Prozessor und einen Speicher. In dem Speicher ist zumindest eine Anwendung gespeichert zum Empfangen von Text von einer Quelle, die extern zu der tragbaren elektronischen Vorrichtung ist. In dem Speicher ist auch eine Vielzahl von Indikator-Listen gespeichert, wobei jede Indikator-Liste eine Anzahl von linguistischen Objekten umfasst, die eine vorgewählte Sprache anzeigen und die in einer anderen Sprache als die linguistischen Objekte der anderen Indikator-Listen sind. Der Speicher hat eine Anzahl von Routinen gespeichert, die, wenn durch den Prozessor ausgeführt, die tragbare elektronische Vorrichtung veranlassen, Operationen durchzuführen. Die allgemeine Eigenschaft der Operationen kann bezeichnet werden als Analysieren des Texts, um zumindest vorläufig eine Codierung des Texts zu bestimmen, und ein Vergleichen von linguistischen Objekten des Texts mit zumindest einigen der linguistischen Objekten von zumindest einigen der Indikator-Listen, um die Sprache des Texts zu identifizieren und die Codierung des Texts zu verifizieren.
  • 1 zeigt eine drahtlose tragbare elektronische Vorrichtung 1, die aber nur ein Beispiel eines Typs einer tragbaren elektronischen Vorrichtung ist, auf die Aspekte der offenbarten und beanspruchten Konzepte angewendet werden können. Die beispielhafte tragbare elektronische Vorrichtung 1 umfasst eine Eingabevorrichtung 3 in der Form einer Tastatur 5 und eines Thumbwheel 7, die verwendet werden, um die Funktionen der tragbaren elektronischen Vorrichtung 1 zu steuern und Text und andere Eingaben zu erzeugen. Die Tastatur 5 besteht aus einer reduzierten QWERTY-Tastatur, in der die meisten der Tasten 9 verwendet werden, um zwei Buchstaben des Alphabets einzugeben. Es wird jedoch angemerkt, dass die Tastatur 5 andere Konfigurationen haben kann, wie eine AZERTY-Tastatur, eine QWERTZ-Tastatur oder eine andere Tastaturanordnung, ob momentan bekannt oder unbekannt, und entweder reduziert oder nicht reduziert. So ist anfangs die Eingabe, die erzeugt wird durch Drücken einer dieser Tasten, dadurch vieldeutig, dass unbestimmt ist, welcher Buchstaben beabsichtigt war. Verschiedene Schemen wurden entwickelt zum Disambiguieren der Eingaben, die durch diese Tasten 9 erzeugt werden, denen mehrere Buchstaben zur Eingabe zugewiesen sind. Die Eingabe, die durch die Tastatur 5 und das Thumbwheel 7 vorgesehen sind, werden auf einer Anzeige 11 angezeigt, wie weithin bekannt ist.
  • 2 zeigt eine alternative drahtlose tragbare elektronische Vorrichtung 1, die aber nur ein anderes Beispiel eines Typs einer tragbaren elektronischen Vorrich tung ist, auf die Aspekte der offenbarten und beanspruchten Konzepte angewendet werden können. Elemente, die in 2 präsentiert werden, die zu den Elementen in 1 ähnlich sind, werden in 2 mit derselben Elementnummer bezeichnet. Die beispielhafte tragbare elektronische Vorrichtung 1 umfasst eine Eingabevorrichtung 3 in der Form einer Tastatur 5 und eines Navigations-Tools 8, das verwendet wird, um die Funktionen der tragbaren elektronischen Vorrichtung 1 zu steuern und Text und andere Eingaben zu erzeugen. Die Tastatur 5 besteht aus einer reduzierten QWERTY-Tastatur, in der die meisten der Tasten 9 verwendet werden, um zwei Buchstaben des Alphabets einzugeben. Es wird jedoch angemerkt, dass die Tastatur 5 andere Konfigurationen haben kann, wie eine AZERTY-Tastatur, eine QWERTZ-Tastatur oder eine andere Tastaturanordnung, ob momentan bekannt oder unbekannt, und entweder reduziert oder nicht reduziert. So ist anfangs die Eingabe, die durch Drücken einer der Tasten erzeugt wird, insofern vieldeutig, da unbestimmt ist, welcher Buchstaben beabsichtigt war. Verschiedene Schemen wurden für ein Disambiguieren der Eingaben entwickelt, die durch die Tasten 9 erzeugt werden, denen mehrere Buchstaben zur Eingabe zugewiesen sind. Weiter mit 2, die tragbare elektronische Vorrichtung 1 umfasst auch das Navigations-Tool 8. In diesem bestimmten Ausführungsbeispiel ist das Navigations-Tool 8 ein Trackball 10, der rotiert werden kann, wodurch die Navigation eines Cursors, der auf einer Anzeige 11 angezeigt wird, in verschiedene Richtungen ermöglicht wird, einschließlich nach oben, unten, links, rechts und jede mögliche Kombination daraus. Außerdem kann der Trackball 10 auch gedrückt werden. Wenn der Trackball 10 gedrückt wird, wird eine Auswahl getroffen basierend auf der aktuellen Position des Cursors. Wenn sich zum Beispiel der Cursor über einem gegebenen Programmsymbol befindet, wird dieses Programm gestartet, wenn der Trackball 10 gedrückt wird. Die Eingabe, die durch die Tastatur 5 und den Trackball 10 vorgesehen wird, wird auf der Anzeige 11 angezeigt.
  • Es sollte jedoch angemerkt werden, dass, trotzdem 2 das Navigations-Tool 8 darstellt als auf der Vorderseite der tragbaren elektronischen Vorrichtung 1 angeordnet, das Navigations-Tool 8 auch an einer Seite der tragbaren elektronischen Vorrichtung 1 in der Form des Thumbwheels 7 angeordnet sein kann, wie in 1 gezeigt. Das Thumbwheel 7 von 1, rotiert und gedrückt werden kann, kann an der Seite der tragbaren elektronischen Vorrichtung 1 von 1 anstatt des Trackballs 10 angeordnet sein. Eine Rotation des Thumbwheels 7 kann eine Navigations-Eingabe liefern, während ein Drücken des Thumbwheels 7 eine Auswahl-Eingabe liefern kann. Demgemäß kann eine Rotation des Thumbwheels 7 den Cursor über ein bestimmtes Programm-Symbol navigieren, während ein Drücken des Thumbwheels 7 mit dem Cursor über einem bestimmten Programm-Symbol das Programm starten kann.
  • Weiter zu 3, die Eingabevorrichtung 3 liefert Tastenanschlagseingaben an eine Verarbeitungsvorrichtung 13, die, zum Beispiel und nicht darauf beschränkt, einen Speicher, ein Betriebssystem, einen Prozessor, eine Java Virtual Machine, eine Laufzeitumgebung oder dergleichen umfassen kann. Die tragbaren elektronischen Vorrichtungen 1 von 12 implementieren jeweils eine Vielzahl von Anwendungen 17. Diese Anwendungen können, zum Beispiel und nicht darauf beschränkt, ein Adressbuch 19, E-Mail 21, einen Kalender 23, ein Memo 25 und zusätzliche Anwendungen umfassen, wie zum Beispiel Rechtschreibprüfung und eine Telefonanwendung. Im Allgemeinen erfordern diese Anwendungen 17 eine Texteingabe, die durch ein Texteingabeverfahren 27 implementiert wird, die einen Teil eines Eingabe-Systems 15 bildet.
  • Verschiedene Typen von Texteingabeverfahren 27 können verwendet werden, die Listen 29 einsetzen, um die Erzeugung von Text zu erleichtern. Zum Beispiel verwendet in der beispielhaften tragbaren elektronischen Vorrichtung, in der die reduzierte QWERTY-Tastatur vieldeutige Eingaben erzeugt, das Texteingabeverfahren 27 eine Software, um progressiv die mögliche Kombination von Buchstaben zu begrenzen, die durch eine spezifizierte Sequenz von Tastenanschlägen beabsichtigt sein kann. Eine derartige „Disambiguierungs"-Software ist bekannt. Typischerweise setzen solche Systeme eine Vielzahl von Listen 29 von linguistischen Objekten ein. Mit linguistischen Objekten sind Wörter und in einigen Spra chen Ideogramme gemeint. Die Tastenanschläge geben linguistische Elemente ein, die in dem Fall von Wörtern Buchstaben oder Zeichen im Alphabet sind, und in dem Fall der Ideogramme Anschläge (strokes) sind, die das Ideogramm bilden. Die Listen 29 von Sprachobjekten können auch Abkürzungen und Text-Shortcuts umfassen, die allgemein bekannt werden mit einer wachsenden Verwendung von verschiedenen Arten von Text-Messaging. Listen 29, die durch das beispielhafte Disambiguierungs-Texteingabeverfahren 27 verwendet werden können, können eine generische Liste 31 und eine neue Liste 33 umfassen. Zusätzliche Listen 35 können „gelernte Wörter"- und „spezielle Wörter"-Listen umfassen, wie technische Begriffe. Andere Typen von Texteingabeverfahren 27 können, zum Beispiel und nicht darauf beschränkt, Voraussage- bzw. Prädiktionsprogramme umfassen, die ein Wort antizipieren, das von einem Benutzer beabsichtigt ist, während es eingegeben wird und dadurch vervollständigen, können ebenfalls Wörter-Listen verwenden. Solch ein Voraussageprogramm kann mit einer vollständigen Tastatur verwendet werden.
  • Bekannte Disambiguierungsprogramme können Verwendungshäufigkeiten den linguistischen Objekten, wie Wörtern oder Ideogrammen, in den Listen 29 zuweisen, die sie verwenden, um das linguistische Objekt zu bestimmen, das von dem Benutzer beabsichtigt ist. Verwendungshäufigkeiten können anfangs zugewiesen werden basierend auf Statistiken einer allgemeinen Verwendung und können dann durch tatsächliche Verwendung modifiziert werden. Es ist bekannt, dass Disambiguierungsprogramme „gelernte" linguistische Objekte, wie Wörter, aufnehmen, die nicht in den anfänglichen Listen 29 waren, sondern durch den Benutzer eingefügt werden, um die Ausgabe 37 zu dem beabsichtigten neuen Wort zu steuern. Es ist bekannt, solchen gelernten Wörtern eine anfängliche Verwendungshäufigkeit zuzuweisen, die in der Nähe des oberen Endes des Bereichs von Verwendungshäufigkeiten ist. Diese anfängliche Verwendungshäufigkeit wird dann durch tatsächliche Verwendung modifiziert wie bei den anfangs eingefügten Wörtern.
  • Eine Quelle für zusätzliche linguistische Objekten ist durch E-Mail 21. Es ist nicht nur wahrscheinlich, dass neue Sprachobjekte, die in ankommender E-Mail 21 enthalten sind, durch den Benutzer verwendet werden, um eine Antwort oder andere E-Mail-Antworten zu erzeugen, derartige neue linguistische Objekte können auch linguistische Objekte sein, die der Benutzer verwenden möchte bei der Erzeugung anderer Texteingaben.
  • Ein Problem, das mit einer Verwendung von neuen linguistischen Elementen verbunden ist, die durch E-Mail 21 empfangen werden, ist, dass Verarbeitungsfehler in den tragbaren elektronischen Vorrichtungen 1 von 12 auftreten bei einer Identifizierung der Sprache des Texts, der empfangen wird. Typischerweise werden Quantitäten von Text in verschiedenen Sprachen durch E-Mail übertragen mit einer vorgewählten Codierung, die dann durch die tragbare elektronische Vorrichtung 1 in den Text übersetzt wird, der auf der Anzeige 11 der tragbaren elektronischen Vorrichtung 1 angezeigt wird. Codierung bezieht sich auf die Codierung, die eingesetzt wird, um E-Mail an die tragbare elektronische Vorrichtung 1 zu übertragen. Codierungsbeispiele umfassen, zum Beispiel und nicht darauf beschränkt, Unicode, ASCII und dergleichen. Leider benutzen bestimmte Sprachen dieselbe Codierung bei Buchstaben, Wörtern oder Ideogrammen und das Potential für Verarbeitungsfehler existiert in der tragbaren elektronischen Vorrichtung 1 bei der Bestimmung der Identität der Sprache der E-Mail 21.
  • 4 zeigt ein Flussdiagramm einer Routine 39 zum Identifizieren der Sprache von Text in der tragbaren elektronischen Vorrichtung 1. Die Prozessorvorrichtung 13 der tragbaren elektronischen Vorrichtung 1 hat einen Prozessor und einen Speicher. In dem Speicher gespeichert ist zumindest eine Anwendung zum Empfangen von Text von einer Quelle, die extern ist zu der tragbaren elektronischen Vorrichtung 1. In dem Speicher ist auch eine Vielzahl von Indikator-Listen 41 gespeichert, wobei jede Indikator-Liste 41 eine Anzahl von linguistischen Objekten umfasst, die eine vorgewählte Sprache anzeigen und die in einer anderen Sprache sind als die linguistischen Objekte der anderen Indikator-Listen 41. Jede Indikator-Liste 41 kann einen Satz der am häufigsten gefundenen linguistischen Objekte der vorgewählten Sprache der Indikator-Liste 41 enthalten. Zum Beispiel kann die Indikator-Liste 41 20 oder mehr linguistische Objekte haben, die in dem Speicher gespeichert sind. Die linguistischen Objekte können, zum Beispiel und nicht darauf beschränkt, Wörter oder Ideogramme sein. Auch können die verschiedenen Sprachen aus unterschiedlichen Dialekten einer gleichen Sprache bestehen, die in einem Land oder mehreren Ländern verwendet wird.
  • Die ankommenden E-Mails 43 werden in eine Warteschlange 45 zur Verarbeitung platziert, wie durch die Verarbeitungsbelastung auf der tragbaren elektronischen Vorrichtung 1 möglich. Eine Verarbeitung beginnt mit einem Abtasten der E-Mail, um die Nachricht in Text zu parsen 47. Die geparste bzw. analysierte Nachricht wird dann bei 49 gefiltert, um unerwünschte Komponenten, wie Zahlen, Daten und dergleichen, zu entfernen. Zumindest ein Teil der Nachricht wird dann analysiert 51 auf die Verwendungshäufigkeit von Buchstaben in dem Text, um zumindest vorläufig eine Codierung des Texts zu bestimmen. Codierungsbeispiele umfassen, zum Beispiel und nicht darauf beschränkt, Unicode, ASCII und dergleichen. Die Codierung des Texts kann die Sprache des Texts vorschreiben, aber in anderen Umständen benutzt eine Vielzahl von Sprachen dieselbe Codierung für verschiedene Buchstaben, Wörter oder Ideogramme, was zu Verarbeitungsproblemen in der tragbaren elektronischen Vorrichtung 1 führt.
  • In der Routine 39 werden linguistische Objekte des Texts dann verglichen 53 mit zumindest einigen der linguistischen Objekte der Indikator-Listen 41, um die Sprache des Texts zu identifizieren und die Codierung des Texts zu verifizieren. In bestimmten Instanzen können die linguistischen Objekte des Texts verglichen werden 53 mit zumindest einigen der linguistischen Objekte aller Indikator-Listen 41. Die tragbare elektronische Vorrichtung 1 bestimmt 55 dann, ob ein Verhältnis der Menge der linguistischen Objekte des Texts, die auch in einer gegebenen Indikator-Liste 41 zu finden sind, zu der Gesamtmenge von linguistischen Objekten des Texts einen vorgewählten Schwellenwert erreicht. Wenn zum Beispiel die linguistischen Objekte des Texts auch in einer bestimmten Indikator-Liste 41 mit einem Anteil von 10% oder mehr sind, bestimmt 55 die Routine 39, dass die Sprache des Texts die vorgewählte Sprache einer bestimmten Indikator-Liste 41 ist. Die Identifikation einer Sprache würde verifizieren, dass die Codierung des Texts bei 51 richtig analysiert wurde. Wenn zum Beispiel die linguistischen Objekte des Texts in einer bestimmten Indikator-Liste 41 mit einem Anteil von weniger als 10% sind, bestimmt die Routine 39, dass die Sprache des Texts noch nicht identifiziert wurde. Wenn keine Sprache für den Text identifiziert werden kann, stellt die Routine 39 fest, dass die Codierung des Texts nicht genau bestimmt wurde, somit werden die linguistischen Objekte des Texts weitergeleitet, um nochmals analysiert 51 oder verglichen 53 zu werden.
  • Sobald die Routine 39 bestimmt, dass die Sprache des Texts die vorgewählte Sprache einer bestimmten Indikator-Liste 41 ist, kann die Routine 39 enden. Sobald die Sprache richtig bestimmt worden ist, können die linguistischen Objekte des Texts zu Listen 29 hinzugefügt werden, die das Erzeugen von Text in verschiedenen Disambiguierungsschemen erleichtern. In bestimmten Umständen, sobald die Sprache richtig bestimmt worden ist, können die linguistischen Objekte des Texts auf einer Anzeige 11 angezeigt werden. Zum Beispiel ist in bestimmten Sprachen die Codierung von bestimmten Buchstaben oder Ideogrammen dieselbe. Ein Benutzer der tragbaren elektronischen Vorrichtung 1 in Japan wird es wahrscheinlich nicht schätzen, wenn er chinesische Schriftzeichen auf der Anzeige 11 sieht, da der Prozessor die Fähigkeit nicht hatte, zwischen der Codierung eines japanischen und eines chinesischen Ideogramms zu unterscheiden.
  • Das obige Verfahren identifiziert die Sprache in einer empfangenen E-Mail. Zusätzlich zu dem Identifizieren der Sprache von E-Mails, kann auch anderer Text, der von Quellen außerhalb der tragbaren elektronischen Vorrichtung 1 empfangen wird, nach neuen Wörtern durchsucht werden. Dies kann ein Identifizieren der Sprache umfassen, die in Instant Messages, SMS (short message service), MMS (multimedia service) und dergleichen verwendet wird.
  • Während spezifische Ausführungsbeispiele der offenbarten und beanspruchten Konzepte im Detail beschrieben wurden, ist für Fachleute offensichtlich, dass verschiedene Modifikationen und Alternativen zu diesen Details hinsichtlich der gesamten Lehren der Offenbarung entwickelt werden können. Dementsprechend sollen die bestimmten offenbarten Anordnungen nur illustrativen Zwecken dienen und nicht einschränkend hinsichtlich des Umfangs der offenbarten und beanspruchten Konzepte, dem der volle Umfang der angefügten Ansprüche und alle Äquivalente davon gegeben werden soll.
  • ZUSAMMENFASSUNG
  • Eine tragbare elektronische Vorrichtung hat zumindest eine Anwendung zum Empfangen von Text von einer Quelle, die extern zu der tragbaren Vorrichtung ist. Die tragbare Vorrichtung hat auch verfügbar eine Vielzahl von Indikator-Listen, wobei jede Indikator-Liste eine Anzahl von linguistischen Objekten aufweist, die eine vorgewählte Sprache anzeigen und die in einer anderen Sprache sind als die linguistischen Objekte der anderen Indikator-Listen. Die tragbare Vorrichtung analysiert den Text, um zumindest vorläufig eine Codierung des Texts zu bestimmen, und vergleicht linguistische Objekte des Texts mit zumindest einigen der linguistischen Objekte von zumindest einigen der Indikator-Listen, um die Sprache des Texts zu identifizieren und die Codierung des Texts zu verifizieren.

Claims (24)

  1. Verfahren zum Identifizieren der Sprache von Text in einer handgehaltenen bzw. tragbaren elektronischen Vorrichtung mit zumindest einer Anwendung zum Empfangen von Text von einer Quelle, die extern zu der tragbaren elektronischen Vorrichtung ist, und eine Vielzahl von Indikator-Listen verfügbar hat, wobei jede Indikator-Liste eine Anzahl von linguistischen Objekten aufweist, die eine vorgewählte Sprache anzeigen und die in einer anderen Sprache sind als die linguistischen Objekte der anderen Indikator-Listen, wobei das Verfahren aufweist: Analysieren des Texts, um zumindest vorläufig eine Codierung des Texts zu bestimmen; und Vergleichen von linguistischen Objekten des Texts mit zumindest einigen der linguistischen Objekte von zumindest einigen der Indikator-Listen, um die Sprache des Texts zu identifizieren und die Codierung des Texts zu verifizieren.
  2. Verfahren gemäß Anspruch 1, das weiter aufweist Analysieren einer Verwendungshäufigkeit von Buchstaben in dem Text, um zumindest vorläufig die Codierung des Texts zu bestimmen.
  3. Verfahren gemäß Anspruch 1, das weiter aufweist Bestimmen eines Verhältnisses von linguistischen Objekten des Texts zu den linguistischen Objekten von jeder von zumindest einigen der Indikator-Listen.
  4. Verfahren gemäß Anspruch 3, das weiter aufweist Bestimmen, dass der Anteil von linguistischen Objekten des Texts, die auch in einer bestimmten Indi kator-List sind, eine vorgegebene Schwelle übersteigt, und, als Reaktion darauf, Bestimmen, dass die Sprache des Texts die vorgewählte Sprache einer bestimmten Indikator-Liste ist.
  5. Verfahren gemäß Anspruch 1, wobei das Vergleichen ein Prüfen der linguistischen Objekte des Texts mit zumindest einigen der linguistischen Objekte von allen der Indikator-Listen aufweist.
  6. Verfahren gemäß Anspruch 1, wobei die tragbare elektronische Vorrichtung die Vielzahl von Indikator-Listen gespeichert hat, wobei jede Indikator-Liste linguistische Objekte aufweist, welche die vorgewählte Sprache anzeigen, und wobei die linguistischen Objekte, welche die vorgewählte Sprache anzeigen, einen Satz der am häufigsten gefundenen linguistischen Objekte der vorgewählten Sprache der Indikator-Liste aufweisen.
  7. Verfahren gemäß Anspruch 1, wobei die tragbare elektronische Vorrichtung die Vielzahl von Indikator-Listen gespeichert hat, wobei jede Indikator-Liste linguistische Objekte aufweist, welche die vorgewählte Sprache anzeigen, die in einer anderen Sprache sind als die linguistischen Objekte der anderen Indikator-Listen, und wobei die andere Sprache einen unterschiedlichen Dialekt einer gleichen Sprache aufweist, die in einem Land oder mehreren Ländern verwendet wird.
  8. Verfahren gemäß Anspruch 1, das weiter aufweist Bestimmen, dass die Indikator-Listen nicht diese Sprache des Texts identifizieren und, als Reaktion darauf, Anwenden einer alternativen Codierung auf den Text und Vergleichen von linguistischen Objekten des Texts mit zumindest einigen der linguistischen Objekte von zumindest einigen der Indikator-Listen, um die Sprache des Texts zu identifizieren und die alternative Codierung des Texts zu verifizieren.
  9. Verfahren gemäß Anspruch 8, wobei die alternative Codierung bestimmt wird durch wiederholtes Analysieren des Texts, um zumindest vorläufig eine alternative Codierung des Texts zu bestimmen.
  10. Verfahren gemäß Anspruch 8, wobei das Bestimmen weiter aufweist ein Berechnen, dass der Anteil der linguistischen Objekte des Texts, die auch in einer bestimmten Indikator-Liste sind, nicht die vorgegebene Schwelle übersteigt.
  11. Verfahren gemäß Anspruch 1, das weiter aufweist Einsetzen eines Hinzufügens von linguistischen Objekten des Texts zu einer Liste, um die Erzeugung von Text zu erleichtern.
  12. Verfahren gemäß Anspruch 1, das weiter aufweist Anzeigen von linguistischen Objekten des Texts auf einer Anzeige einer tragbaren elektronischen Vorrichtung.
  13. Tragbare elektronische Vorrichtung, die eine Verarbeitungsvorrichtung aufweist, die einen Prozessor und einen Speicher aufweist, der gespeichert hat zumindest eine Anwendung zum Empfangen von Text von einer Quelle, die extern ist zu der tragbaren elektronischen Vorrichtung, und eine Vielzahl von Indikator-Listen, wobei jede Indikator-Liste eine Anzahl von linguistischen Objekten aufweist, die eine vorgewählte Sprache anzeigen und die in einer anderen Sprache sind als die linguistischen Objekte der anderen Indikator-Listen, wobei der Speicher eine Anzahl von Routinen gespeichert hat, die bei Ausführung durch den Prozessor die tragbare elektronische Vorrichtung veranlassen, Operationen durchzuführen, die aufweisen: Analysieren des Texts, um zumindest vorläufig eine Codierung des Texts zu bestimmen; und Vergleichen von linguistischen Objekten des Texts mit zumindest einigen der linguistischen Objekte von zumindest einigen der Indikator-Listen, um die Sprache des Texts zu identifizieren und die Codierung des Texts zu verifizieren.
  14. Tragbare elektronische Vorrichtung gemäß Anspruch 13, die weiter aufweist Analysieren einer Verwendungshäufigkeit von Buchstaben in dem Text, um zumindest vorläufig die Codierung des Texts zu bestimmen.
  15. Tragbare elektronische Vorrichtung gemäß Anspruch 13, die weiter aufweist Bestimmen eines Verhältnisses von linguistischen Objekten des Texts zu den linguistischen Objekten von jeder von zumindest einigen der Indikator-Listen.
  16. Tragbare elektronische Vorrichtung gemäß Anspruch 15, die weiter aufweist Bestimmen, dass der Anteil von linguistischen Objekten des Texts, die auch in einer bestimmten Indikator-List sind, eine vorgegebene Schwelle übersteigt, und, als Reaktion darauf, Bestimmen, dass die Sprache des Texts die vorgewählte Sprache einer bestimmten Indikator-Liste ist.
  17. Tragbare elektronische Vorrichtung gemäß Anspruch 13, wobei das Vergleichen ein Prüfen der linguistischen Objekte des Texts mit zumindest einigen der linguistischen Objekte von allen der Indikator-Listen aufweist.
  18. Tragbare elektronische Vorrichtung gemäß Anspruch 13, wobei die tragbare elektronische Vorrichtung die Vielzahl von Indikator-Listen gespeichert hat, wobei jede Indikator-Liste linguistische Objekte aufweist, welche die vorgewählte Sprache anzeigen, und wobei die linguistischen Objekte, welche die vorgewählte Sprache anzeigen, einen Satz der am häufigsten gefundenen linguistischen Objekte der vorgewählten Sprache der Indikator-Liste aufweisen.
  19. Tragbare elektronische Vorrichtung gemäß Anspruch 13, wobei die tragbare elektronische Vorrichtung die Vielzahl von Indikator-Listen gespeichert hat, wobei jede Indikator-Liste linguistische Objekte aufweist, welche die vorgewählte Sprache anzeigen, die in einer anderen Sprache sind als die linguistischen Objekte der anderen Indikator-Listen, und wobei die andere Sprache einen unterschiedli chen Dialekt einer gleichen Sprache aufweist, die in einem Land oder mehreren Ländern verwendet wird.
  20. Tragbare elektronische Vorrichtung gemäß Anspruch 13, die weiter aufweist Bestimmen, dass die Indikator-Listen nicht diese Sprache des Texts identifizieren und, als Reaktion darauf, Anwenden einer alternativen Codierung auf den Text und Vergleichen von linguistischen Objekten des Texts mit zumindest einigen der linguistischen Objekte von zumindest einigen der Indikator-Listen, um die Sprache des Texts zu identifizieren und die alternative Codierung des Texts zu verifizieren.
  21. Tragbare elektronische Vorrichtung gemäß Anspruch 20, wobei die alternative Codierung bestimmt wird durch wiederholtes Analysieren des Texts, um zumindest vorläufig eine alternative Codierung des Texts zu bestimmen.
  22. Tragbare elektronische Vorrichtung gemäß Anspruch 20, wobei das Bestimmen weiter aufweist ein Berechnen, dass der Anteil der linguistischen Objekte des Texts, die auch in einer bestimmten Indikator-Liste sind, nicht die vorgegebene Schwelle übersteigt.
  23. Tragbare elektronische Vorrichtung gemäß Anspruch 13, die weiter aufweist Einsetzen eines Hinzufügens von linguistischen Objekten des Texts zu einer Liste, um die Erzeugung von Text zu erleichtern.
  24. Tragbare elektronische Vorrichtung gemäß Anspruch 13, die weiter aufweist Anzeigen von linguistischen Objekten des Texts auf einer Anzeige einer tragbaren elektronischen Vorrichtung.
DE112006004015T 2006-09-01 2006-09-01 Verfahren zum Identifizieren der Sprache von Text in einer handgehaltenen bzw. tragbaren elektronischen Vorrichtung und eine tragbare elektronische Vorrichtung, die dies aufweist Ceased DE112006004015T5 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CA2006/001448 WO2008025123A1 (en) 2006-09-01 2006-09-01 Method for identifying language of text in a handheld electronic device and a handheld electronic device incorporating the same

Publications (1)

Publication Number Publication Date
DE112006004015T5 true DE112006004015T5 (de) 2009-07-02

Family

ID=39135451

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112006004015T Ceased DE112006004015T5 (de) 2006-09-01 2006-09-01 Verfahren zum Identifizieren der Sprache von Text in einer handgehaltenen bzw. tragbaren elektronischen Vorrichtung und eine tragbare elektronische Vorrichtung, die dies aufweist

Country Status (4)

Country Link
CA (1) CA2661559C (de)
DE (1) DE112006004015T5 (de)
GB (1) GB2454147B (de)
WO (1) WO2008025123A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9672209B2 (en) 2012-06-21 2017-06-06 International Business Machines Corporation Dynamic translation substitution

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111160015B (zh) * 2019-12-24 2024-03-05 北京明略软件系统有限公司 一种实现文本分析的方法、装置、计算机存储介质及终端

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003125001A (ja) * 2001-10-19 2003-04-25 Matsushita Graphic Communication Systems Inc 電子メール通信装置及び電子メール通信方法
US7865355B2 (en) * 2004-07-30 2011-01-04 Sap Aktiengesellschaft Fast text character set recognition
US7996208B2 (en) * 2004-09-30 2011-08-09 Google Inc. Methods and systems for selecting a language for text segmentation

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9672209B2 (en) 2012-06-21 2017-06-06 International Business Machines Corporation Dynamic translation substitution
US9678951B2 (en) 2012-06-21 2017-06-13 International Business Machines Corporation Dynamic translation substitution
US10289682B2 (en) 2012-06-21 2019-05-14 International Business Machines Corporation Dynamic translation substitution

Also Published As

Publication number Publication date
GB0903317D0 (en) 2009-04-08
GB2454147B (en) 2014-03-12
CA2661559C (en) 2013-07-16
WO2008025123A1 (en) 2008-03-06
GB2454147A (en) 2009-04-29
CA2661559A1 (en) 2008-03-06

Similar Documents

Publication Publication Date Title
DE112007000854B4 (de) Tragbare elektronische Vorrichtung, die eine Lernfunktion vorsieht zur Erleichterung einer Korrektur einer fehlerhaften Texteingabe in einer Umgebung eines Textes, der mehrere sequentielle Betätigungen derselben Taste erfordert, und zugehöriges Verfahren
DE60318181T2 (de) Automatische Einstellung eines Tastatureingabemodus als Antwort auf eine ankommende Textnachricht
US8213719B2 (en) Editing 2D structures using natural input
DE112007000727T5 (de) Tragbare elektronische Vorrichtung und Verfahren zur Durchführung einer Rechtschreibprüfung während einer Texteingabe und zum Integrieren der Ausgabe der Rechtschreibprüfung in die Ausgabe einer Disambiguierung
DE112007000847T5 (de) Tragbare elektronische Vorrichtung und Verfahren zum Lernen von Kontextdaten während einer Disambiguierung einer Texteingabe
DE112007000855T5 (de) Tragbare elektronische Vorrichtung und Verfahren zur Durchführung einer Rechtschreibprüfung während einer Texteingabe und zum Vorsehen eines Rechtschreibprüfungs-Lern-Merkmals
DE112007000848T5 (de) Tragbare elektronische Vorrichtung und Verfahren zur Durchführung einer optimierten Rechtschreibprüfung während einer Texteingabe durch Vorsehen einer sequentiell angeordneten Reihe von Rechtschreibprüfalgorithmen
US20070174771A1 (en) Digital user interface for inputting Indic scripts
CN101286155A (zh) 用于输入法编辑器集成的方法和系统
DE112006003659T5 (de) Tragbare elektronische Vorrichtung und Verfahren zum Disambiguieren einer Texteingabe und Vorsehen eines Schreibweiseersatzes
US20080065369A1 (en) Method for identifying language of text in a handheld electronic device and a handheld electronic device incorporating the same
DE112007000728B4 (de) Tragbare elektronische Vorrichtung zum Vorsehen einer vorgeschlagenen korrigierten Eingabe als Reaktion auf eine fehlerhafte Texteingabe in einer Umgebung eines Textes, der mehrere sequentielle Betätigungen derselben Taste erfordert, und zugehöriges Verfahren
DE112006003651T5 (de) Tragbare elektronische Vorrichtung und Verfahren zur Disambiguierung einer Texteingabe zur Unterdrückung von künstlichen Varianten mit geringer Wahrscheinlichkeit
DE112006003650T5 (de) Tragbare elektronische Vorrichtung und Verfahren zur Disambiguierung einer Kompositum-Eingabe bei Einsatz unterschiedlicher Gruppierungen von Datenquellen, um unterschiedliche Teile einer Eingabe zu disambiguieren
DE102014101042A1 (de) Modifizieren einer Eingabestifteingabe oder -reaktion unter Verwendung einer gefolgerten Bewegung
DE102014101026A1 (de) Eingabestiftkurzschrift
CN110929520A (zh) 非命名实体对象抽取方法、装置、电子设备及存储介质
DE102014101027A1 (de) Eingabestift mit Lexikon-Sharing
EP1715433A1 (de) Zeichenanzeigeverfahren
DE112007000856B4 (de) Tragbare elektronische Vorrichtung und Verfahren zum Verwenden von Kontextdaten zur Disambiguierung einer Texteingabe
DE112008001975B4 (de) Disambiguierung von Wörtern mit Buchstaben und Symbolen
DE112006003660T5 (de) Tragbare elektronische Vorrichtung und Verfahren zur Disambiguierung einer Texteingabe, die/das künstliche Varianten vorsieht, die aus Zeichen in einem Kernalphabet bestehen
DE112006001078T5 (de) Verfahren zum Erzeugen von Text in einer tragbaren elektronischen Vorrichtung und eine tragbare elektronische Vorrichtung, die dies enthält
DE112008001805T5 (de) Zeichenwert-Anordnung auf einer handgehaltenen bzw. tragbaren Tastatur
DE112006003649T5 (de) Tragbare elektronische Vorrichtung und Verfahren zur Disambiguierung einer Kompositum-Eingabe und zur Priorisierung von Kompositum-Lösungen gemäß einer Vollständigkeit von Textkomponenten

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8128 New person/name/address of the agent

Representative=s name: MAHLER, P., DIPL.-PHYS., PAT.-ANW., 22397 HAMBURG

R016 Response to examination communication
R002 Refusal decision in examination/registration proceedings
R003 Refusal decision now final

Effective date: 20131219