JP5372148B2 - モバイルデバイス上で日本語テキストを処理する方法およびシステム - Google Patents
モバイルデバイス上で日本語テキストを処理する方法およびシステム Download PDFInfo
- Publication number
- JP5372148B2 JP5372148B2 JP2011516899A JP2011516899A JP5372148B2 JP 5372148 B2 JP5372148 B2 JP 5372148B2 JP 2011516899 A JP2011516899 A JP 2011516899A JP 2011516899 A JP2011516899 A JP 2011516899A JP 5372148 B2 JP5372148 B2 JP 5372148B2
- Authority
- JP
- Japan
- Prior art keywords
- starting point
- text
- matching
- items
- natural starting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/018—Input/output arrangements for oriental characters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/274—Converting codes to words; Guess-ahead of partial word inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
- G06F40/129—Handling non-Latin characters, e.g. kana-to-kanji conversion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/53—Processing of non-Latin text
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Telephone Function (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本願は、共に2008年7月3日に出願された、米国仮出願第61/078,293号(名称「IMPROVED METHOD FOR SEARCHING JAPANESE TEXT USING A MOBILE DEVICE」)および米国仮出願第61/078,299号(名称「IMPROVED METHOD OF WORD SELECTION FOR JAPANESE TEXT ENTRY ON A MOBILE DEVICE」)の利益を主張する。
表記される日本語は、概して、いくつかの異なる文字セットからの文字の組み合わせである。特に、日本人は、表語文字表記体系、2つの個別の表音文字体系に加えて、ラテン文字、アラビア数字、および他の言語から取り入れられた他の記号を使用する。ひらがなおよびかたかなと呼ばれる2つの生来の文字体系は、文字(かなと呼ばれる)を使用して音節を表す。ひらがなおよびかたかなは、合計でおよそ90文字である。漢字と呼ばれる文字セットは、単語または単語の部分を表す、何千もの表語文字から成る。
本願発明は、例えば、以下の項目を提供する。
(項目1)
モバイルデバイスを介して複数の項目を検索するためのコンピュータ実装方法であって、該複数の項目のうちの個別の項目は、日本語テキスト部分を特徴とし、該コンピュータ実装方法は、
日本語テキストにより特徴付けられる項目を識別するためにモバイルデバイス上で検索クエリを受信することと、
該受信した検索クエリに基づいてテキスト検索語を生成することと、
該テキスト検索語に基づいて、一式の項目から複数の一致項目を決定することであって、該複数の一致項目の各々は、該テキスト検索語に対応する一致テキストを有する日本語テキスト部分を含む、ことと、
該複数の一致項目について、
該日本語テキスト部分内の開始点を決定することと、
該開始点に対する該一致テキストの位置を決定することと、
該開始点に対する該決定した位置に基づいて、該複数の一致項目の中の該一致項目の優先順位を決定することと、
該決定した優先順位に基づいて順序付けられる一致項目のリストを提供することと
を含む、コンピュータ実装方法。
(項目2)
前記一式の項目は、メディアファイル、アドレス帳入力、文書ファイル、またはアプリケーションのうちの少なくとも1つを含む、項目1に記載のコンピュータ実装方法。
(項目3)
前記開始点を決定することは、
前記日本語テキスト部分内の句読点を識別することと、
該識別した句読点に近接する該開始点の位置を特定することと
を含む、項目1に記載のコンピュータ実装方法。
(項目4)
前記開始点を決定することは、
前記日本語テキスト部分内の文字体系の変化を識別することと、
該識別した文字体系の変化における該開始点の位置を特定することと
を含む、項目1に記載のコンピュータ実装方法。
(項目5)
前記開始点を決定することは、
前記日本語テキスト部分内の電話番号の形式を有する文字列を識別することと、
該識別した文字列に近接する該開始点の位置を特定することと
を含む、項目1に記載のコンピュータ実装方法。
(項目6)
前記優先順位を決定することは、
前記一致テキストから該一致テキストの前の最も近い開始点までの文字数距離を計算することと、
該計算した文字数距離に基づいて該優先順位を決定することと
を含む、項目1に記載のコンピュータ実装方法。
(項目7)
前記優先順位を決定することはさらに、前記一致テキストが前記日本語テキスト部分の先頭にある場合、一致項目により高い優先度を割り当てることを含む、項目1に記載のコンピュータ実装方法。
(項目8)
前記開始点を決定することはさらに、前記日本語テキスト部分内で第1の開始点および第2の開始点を決定することを含み、前記優先順位を決定することはさらに、前記一致テキストが該第1の開始点と該第2の開始点との間のテキスト全てを含む場合、前記一致項目により高い優先度を割り当てることを含む、項目1に記載の方法。
(項目9)
モバイルデバイスから複数の項目を検索するためのシステムであって、
ユーザ検索クエリに基づいて検索語を生成するように構成される変換コンポーネントと、
該生成した検索語に基づいて、該モバイルデバイスを介してアクセス可能な複数の一致項目の位置を特定するように構成される検索コンポーネントであって、該複数の一致項目の各々は、該検索語に対応する一致日本語テキストを含むテキストフィールドを含む、検索コンポーネントと、
該複数の一致項目の各々の該テキストフィールド内の開始点を決定するように構成される開始点決定コンポーネントと、
該決定した開始点と、該複数の一致項目の各々に対する該一致日本語テキストとの間の距離を計算するように構成される距離計算コンポーネントと、
該計算した距離に基づいて該複数の一致項目の順序を決定し、該決定した順序に基づいて該複数の一致項目の少なくともいくつかをユーザに出力するように構成される、順序付けコンポーネントと
を備える、システム。
(項目10)
前記複数の一致項目は、メディアファイル、アドレス帳入力、文書ファイル、画像ファイル、またはアプリケーションのうちの少なくとも1つを含む、項目9に記載のシステム。
(項目11)
前記開始点決定コンポーネントは、
前記テキストフィールド内で句読点を識別することと、
前記識別した句読点に近接する前記開始点の位置を特定することと
によって、前記開始点を決定するように構成される、項目9に記載のシステム。
(項目12)
前記開始点決定コンポーネントは、
前記テキストフィールド内の文字体系の変化を識別することと、
前記識別した文字体系の変化における前記開始点の位置を特定することと
によって、前記開始点を決定するように構成される、項目9に記載のシステム。
(項目13)
前記開始点決定コンポーネントは、
前記テキストフィールド内の電話番号を示す文字列を識別することと、
前記識別した文字列に近接する前記開始点の位置を特定することと
によって、前記開始点を決定するように構成される、項目9に記載のシステム。
(項目14)
前記順序付けコンポーネントは、
前記一致テキストから該一致テキストの前の最も近い開始点までの文字数距離を計算することと、
該計算した文字数距離に基づいて前記優先順位を決定することと
によって、該順位を決定するように構成される、項目9に記載のシステム。
(項目15)
前記順位を決定することはさらに、前記一致する日本語テキストが前記テキストフィールドの先頭にある場合、一致項目により高い優先度を割り当てることを含む、項目9に記載のシステム。
(項目16)
モバイルデバイスを介してアクセス可能な一式の項目の中で検索するように、該モバイルデバイスのプロセッサを制御するための命令を含む、コンピュータ読み取り可能記憶媒体であって、該一式の項目の個別の項目は、日本語テキストを特徴とし、
日本語テキストにより特徴付けられる項目を識別するように該モバイルデバイス上で検索クエリを受信することと、
該受信した検索クエリに基づいてテキスト検索語を生成することと、
該テキスト検索語に基づいて、該一式の項目から複数の一致項目を決定することであって、該複数の一致項目の各々は、該テキスト検索語に対応する一致テキストを有する日本語テキスト部分を含む、ことと、
該複数の一致項目の各々について、
該日本語テキスト部分内の開始点を決定することと、
該開始点に対する該一致テキストの位置を決定することと、
該開始点に対する該決定した位置に基づいて、該複数の一致項目の中の該一致項目の優先順位を決定することと、
該決定した優先順位に基づいて順位付けられる、一致項目のリストを提供することと
を含む方法による、コンピュータ読み取り可能記憶媒体。
(項目17)
前記一式の項目は、メディアファイル、アドレス帳入力、文書ファイル、またはアプリケーションのうちの少なくとも1つを含む、項目16に記載のコンピュータ読み取り可能記憶媒体。
(項目18)
前記開始点を決定することは、
前記日本語テキスト部分内の句読点を識別することと、
該識別した句読点に近接する該開始点の位置を特定することと
を含む、項目16に記載のコンピュータ読み取り可能記憶媒体。
(項目19)
前記開始点を決定することは、
前記日本語テキスト部分内の文字体系の変化を識別することと、
該識別した文字体系の変化における前記開始点の位置を特定することと
を含む、項目16に記載のコンピュータ読み取り可能記憶媒体。
(項目20)
前記開始点を決定することは、
前記日本語テキスト部分内の電話番号の形式を有する文字列を識別することと、
該識別した文字列に近接する前記開始点の位置を特定することと
を含む、項目16に記載のコンピュータ読み取り可能記憶媒体。
(項目21)
前記優先順位を決定することは、
前記一致テキストから該一致テキストの前の最も近い開始点までの文字数距離を計算することと、
前記計算した文字数距離に基づいて前記優先順位を決定することと
を含む、項目16に記載のコンピュータ読み取り可能記憶媒体。
(項目22)
前記優先順位を決定することはさらに、前記一致テキストが前記日本語テキスト部分の先頭にある場合、一致項目により高い優先度を割り当てることを含む、項目16に記載のコンピュータ読み取り可能記憶媒体。
(項目23)
前記開始点を決定することはさらに、前記日本語テキスト部分内で第1の開始点および第2の開始点を決定することを含み、前記優先順位を決定することはさらに、前記一致テキストが前記第1の開始点と前記第2の開始点との間のテキストの全てを含む場合、前記一致項目により高い優先度を割り当てることを含む、項目16に記載のコンピュータ読み取り可能記憶媒体。
図2は、日本語テキストを処理するための好適なモバイルデバイス200の正面図である。図2に示されるように、モバイルデバイス200は、筐体201、複数の押しボタン202、方向キーパッド204(例えば、5方向キー)マイク205、スピーカー206、および筐体201により支えられるディスプレイ210を含むことができる。モバイルデバイス200はまた、PDA電話、セルラフォン、スマートフォン、ポータブルメディアプレーヤ、ポータブルゲーム機、ポータブル電子メールデバイス(例えば、Blackberry)、または他のモバイル通信デバイスに概して見られる、他のマイク、送受信機、写真センサ、および/または他の演算コンポーネントも含むことができる。
日本語のモバイルデバイスのための予測テキスト入力を提供するためのシステムおよび方法が開示される(以下、「テキスト入力システム」または「システム」と参照される)。以下に詳細が説明されるように、数字キーパッドを有する日本語のモバイルデバイスのユーザの場合、テキスト入力は、概して2段階のプロセスである。第1段階において、モバイルデバイスは、ユーザ入力を1つ以上の読みに変換し、これがユーザに表示される。第2段階において、モバイルデバイスは、選択された読みに対応する見出し語のリストを表示する。ユーザは、次いで、第2のリストから、所望の見出し語を選択する。本明細書において開示されるテキスト入力システムは、このプロセスを単一段階に短縮する。ユーザ入力を受信した後、テキスト入力システムは、受信した入力に対応する全ての読みを決定する。テキスト入力システムは、次いで、可能な読みの全てに対応する、一式の一致見出し語を決定し、一式の見出し語の部分または全てをユーザに表示する。テキスト入力システムは、対応する読みに応じて、見出し語をグループ化することができる。代替として、システムは、ユーザが選択する可能性がより高い見出し語の予想に基づいた順序で見出し語を表示してもよく、可能性が高い一致は、可能性が低い一致よりもリストの上位に表示される。システムはまた、最も可能性が高い見出し語だけを表示し、可能性が低い結果を隠すように構成されてもよい。
・読みリスト内のインデックス(例えば、システムは、ユーザの入力に一致する可能性が高い読みの見出し語を多く表示する場合がある)。
・見出し語リストのインデックス(例えば、システムは、任意の特定の読みに関連する見出し語の数を限定して表示する場合がある)。
・キーシーケンスが有効なローマ字であるかどうか。
・読みが単語リストにあるかどうか(例えば、システムは、システムの単語リストまたは辞書で検出されない読みの見出し語を表示しない場合がある)。
・読みが地域修正に基づいて生成されたかどうか。
・読みがつづり修正に基づいて生成されたかどうか。
・読みが単語補完に基づいて生成されたかどうか。
組み合わせリスト605を生成するために、システムは、各使用可能な見出し語に対する上記の因子のうち1つ以上に、数値を割り当てることができる。数値は、各因子が見出し語により満たされるかどうかに基づいていてもよく、または、数値は、見出し語に対する因子の実際の値に基づいていてもよい(例えば、インデックス値に基づく因子の場合)。各因子は、因子の認識される重要度に応じて加重されてもよく、各見出し語に対する総合的な関連点数は、全ての関連する因子の加重された数値を合計することにより計算される。システムは、次いで、関連点数をしきい関連値に比較することにより、組み合わせリストに対して可能性が高い見出し語を決定することができる。システムは、読みに応じて(図6に示されるように)グループ内に可能性が高い見出し語を含む組み合わせリストを表示する。上記のように、残りの見出し語は、次いで、組み合わせリスト内の、可能性が高い見出し語が表示された後に表示される。代替として、組み合わせリストの項目は、総合的な関連点数により順序付け(つまり、順位付け)されてもよい。
モバイルデバイス上で日本語テキストを入力することに加えて、ユーザはまた、モバイルデバイス上で特定のテキストを検索かつ検出することを望む場合がある。ユーザに特定のテキストの場所をより容易に特定することを可能にするように、モバイルデバイスを介して日本語テキストを検索するためのシステムおよび方法が開示される(以下、「検索システム」または「システム」と参照される)。検索システムは、モバイルデバイス上のキーパッドまたはキーボードを経由してユーザ入力を受信し、入力を一式の検索語に変換する。一部の実施形態において、システムは、上記のテキスト入力システムを使用して、入力を見出し語に変換する。しかしながら、特定のシーケンスを選択するために見出し語のリストをユーザに提供する代わりに、システムは、生成したリストを一式の検索語として使用する。検索語を生成した後、システムは、一致項目を検出するために、モバイルデバイスによりアクセス可能な項目の中でテキストフィールドを検索する。次いで、システムは、各一致項目のテキストフィールド内で1つ以上の自然な開始点を決定する。以下に詳細を説明するように、開始点は、テキストフィールドの先頭、および文字セット内の句読点または変化の位置を含むことができる。開始点を決定した後、システムは、各一致項目の一致テキストと自然な開始点との間の距離を決定する。システムは、次いで、計算された距離、および一致の配列、項目の種類、項目がその前に使用された回数等の他の要素に基づいて、順番付けた一式の検索結果を提供する。一部の実施形態において、システムは、複数の検索語を使用して結果のリストを生成する。次いで、複数の検索語の各々に対する距離および他の因子を組み合わせることによって順序付けが決定される。
・日本語表記において、単語リストおよび文法規則を使用する特殊なアルゴリズム(「セグメント化エンジン」と呼ばれる)が、自然な開始点を推論するために使用され得る。
・句読点、または2つの文字体系の間の変化(例えば、かな文字と漢字との間、または漢字とアラビア数字との間)等、自然な開始点を識別するために単純なパターンが使用され得る。例えば、<缶ビール、たこ焼き>という語句には、「缶ビール」および「たこ焼き」の単語を明示的に区分する、カンマが存在する。自然な開始点を識別するために単純なパターンを使用すると、日本語の文に存在する可能性がある自然な開始点全てのサブセットを識別することができるだけでなく、演算リソースが限定されたモバイルデバイス上に実装するコストが軽減される。
・電話番号は、自然な開始点の別の例である。電話番号は各国において既定の形式を有し、検索システムが使用して開始点を決定することができる。例えば、(206)234−5678のような米国の電話番号の場合、電話番号の中の数字ではない文字は、自然な開始点を決定するために使用され得る。このように、「234」および「456」の検索はどちらも電話番号には一致するが、「234」の検索の一致は、番号の自然な開始点で発生するため、より有意であると考えられる。
・一致がフィールドの開始に合致するかどうか(例えば、システムは、フィールド内の自然な開始点にある一致よりも、フィールドの開始にある一致のほうがより関連性が高いと考える場合がある)。
・一致が単語の開始に合致するかどうか。
・一致した項目の種類(例えば、項目は電話番号または曲名かどうか)。
・一致のいずれかが、一次フィールドまたは二次フィールドにあるかどうか(例えば、システムは、会社名または市町村の一致よりも、連絡先の名前の一致のほうがより関連性が高いと考える場合がある)。
・検索語が、自然な開始点と次の隣接の自然な開始点との間のテキストの全てに一致したかどうか、または開始点の間のテキストの部分だけに一致したかどうか。
・一致した項目が以前に使用されたことがあるかどうか(つまり、一致した項目は、以前、検索結果からユーザにより選択されたかどうか)。
・一致した項目が使用された回数(つまり、一致した項目が検索結果からユーザによってこれまでに選択された回数)。
検索結果の順序を決定するために、検索結果の各項目について、検索システムは、各因子が検索結果により満たされるかどうかに基づいて、上記の因子のうちの1つ以上に数値を割り当てることができる。各因子は、因子の認識される重要度に応じて加重されてもよく、各項目に対する総合的な関連点数は、全ての関連する因子の加重された数値を合計することにより計算される。検索結果の項目は、次いで、総合的な関連点数別にリスト(つまり、順位付け)される。
一式の検索後を決定した後、プロセスはブロック1106に進み、検索システムは、決定された一式の検索語に対応する一式の検索結果を生成する。一部の実装において、システムは、モバイルデバイスおよび検索時に関連の遠隔場所を直接検索して一致項目を検出する。他の実施形態において、システムは、項目のデータベースまたは他のそれまでに生成されたインデックスを使用して検索を実行する。インデックスは、項目に関連する1つ以上のテキストフィールドの内容等、各項目の情報を含む。例えば、システムは、モバイルデバイス上またはモバイルデバイスによりアクセス可能な遠隔場所に格納されたメディアファイルのタイトルまたは詳細情報を格納するインデックスに依存してもよい。
Claims (15)
- モバイルデバイスを介して複数の項目を検索するためのコンピュータ実装方法であって、該複数の項目のうちの個別の項目は、日本語テキスト部分によって特徴付けられ、該コンピュータ実装方法は、
日本語テキストによって特徴付けられる項目を識別するためにモバイルデバイス上で検索クエリを受信することと、
該受信された検索クエリに基づいて一式の検索語を生成することと、
テキスト情報を格納する1つ以上のテキストフィールドを検索することにより、該検索語に一致する複数の一致項目を見い出すことと、
該複数の一致項目の各々について、
各一致項目が配置されている該テキストフィールド内の1つ以上の自然な開始点を決定することと、
自然な開始点に対する該一致項目の距離を決定することと、
各一致項目と自然な開始点との間の距離に基づいて順序付けられる一致項目のリストを提供することと
を含む、コンピュータ実装方法。 - 前記一式の一致項目は、メディアファイル、アドレス帳入力、文書ファイル、またはアプリケーションのうちの少なくとも1つを含む、請求項1に記載のコンピュータ実装方法。
- 前記自然な開始点を決定することは、
前記日本語テキスト部分内の句読点を識別することと、
該識別された句読点に近接する該自然な開始点の位置を特定することと
を含む、請求項1に記載のコンピュータ実装方法。 - 前記自然な開始点を決定することは、
前記日本語テキスト部分内の文字体系の変化を識別することと、
該識別された文字体系の変化における該自然な開始点の位置を特定することと
を含む、請求項1に記載のコンピュータ実装方法。 - 前記自然な開始点を決定することは、
前記日本語テキスト部分内の電話番号の形式を有する文字列を識別することと、
該識別された文字列に近接する該自然な開始点の位置を特定することと
を含む、請求項1に記載のコンピュータ実装方法。 - モバイルデバイスから複数の項目を検索するためのシステムであって、該システムは、
ユーザ検索クエリに基づいて一式の検索語を生成するように構成されている変換コンポーネントと、
テキスト情報を格納する1つ以上のテキストフィールドを検索することにより、該検索語に一致する複数の一致項目を見い出すように構成されている検索コンポーネントと、
各一致項目が配置されている該テキストフィールド内の1つ以上の自然な開始点を決定するように構成されている開始点決定コンポーネントと、
自然な開始点に対する該一致項目の距離を計算するように構成されている距離計算コンポーネントと、
各一致項目と自然な開始点との間の距離に基づいて順序付けられる一致項目のリストを表示するように構成されているディスプレイと
を備える、システム。 - 前記複数の一致項目は、メディアファイル、アドレス帳入力、文書ファイル、画像ファイル、またはアプリケーションのうちの少なくとも1つを含む、請求項6に記載のシステム。
- 前記開始点決定コンポーネントは、
前記テキストフィールド内で句読点を識別することと、
前記識別された句読点に近接する前記自然な開始点の位置を特定することと
によって、前記自然な開始点を決定するように構成されている、請求項6に記載のシステム。 - 前記開始点決定コンポーネントは、
前記テキストフィールド内の文字体系の変化を識別することと、
前記識別された文字体系の変化における前記自然な開始点の位置を特定することと
によって、前記自然な開始点を決定するように構成されている、請求項6に記載のシステム。 - 前記開始点決定コンポーネントは、
前記テキストフィールド内の電話番号を示す文字列を識別することと、
前記識別された文字列に近接する前記自然な開始点の位置を特定することと
によって、前記自然な開始点を決定するように構成されている、請求項6に記載のシステム。 - モバイルデバイスを介してアクセス可能な一式の項目の中で検索することを方法によって行うように、該モバイルデバイスのプロセッサを制御するための命令を含むコンピュータ読み取り可能な記憶媒体であって、該一式の項目のうちの個別の項目は、日本語テキストによって特徴付けられ、
該方法は、
日本語テキストによって特徴付けられる項目を識別するように該モバイルデバイス上で検索クエリを受信することと、
該受信された検索クエリに基づいて一式の検索語を生成することと、
テキスト情報を格納する1つ以上のテキストフィールドを検索することにより、該検索語に一致する複数の一致項目を見い出すことと、
該複数の一致項目の各々について、
各一致項目が配置されている該テキストフィールド内の1つ以上の自然な開始点を決定することと、
自然な開始点に対する該一致項目の距離を決定することと、
各一致項目と自然な開始点との間の距離に基づいて順序付けられる一致項目のリストを提供することと
を含む、コンピュータ読み取り可能な記憶媒体。 - 前記一式の一致項目は、メディアファイル、アドレス帳入力、文書ファイル、またはアプリケーションのうちの少なくとも1つを含む、請求項11に記載のコンピュータ読み取り可能な記憶媒体。
- 前記自然な開始点を決定することは、
前記日本語テキスト部分内の句読点を識別することと、
該識別された句読点に近接する該自然な開始点の位置を特定することと
を含む、請求項11に記載のコンピュータ読み取り可能な記憶媒体。 - 前記自然な開始点を決定することは、
前記日本語テキスト部分内の文字体系の変化を識別することと、
該識別された文字体系の変化における前記自然な開始点の位置を特定することと
を含む、請求項11に記載のコンピュータ読み取り可能な記憶媒体。 - 前記自然な開始点を決定することは、
前記日本語テキスト部分内の電話番号の形式を有する文字列を識別することと、
該識別された文字列に近接する前記自然な開始点の位置を特定することと
を含む、請求項11に記載のコンピュータ読み取り可能な記憶媒体。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US7829908P | 2008-07-03 | 2008-07-03 | |
US7829308P | 2008-07-03 | 2008-07-03 | |
US61/078,293 | 2008-07-03 | ||
US61/078,299 | 2008-07-03 | ||
PCT/US2009/049730 WO2010003155A1 (en) | 2008-07-03 | 2009-07-06 | Methods and systems for processing japanese text on a mobile device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011527058A JP2011527058A (ja) | 2011-10-20 |
JP5372148B2 true JP5372148B2 (ja) | 2013-12-18 |
Family
ID=41466354
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011516899A Expired - Fee Related JP5372148B2 (ja) | 2008-07-03 | 2009-07-06 | モバイルデバイス上で日本語テキストを処理する方法およびシステム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20100121870A1 (ja) |
JP (1) | JP5372148B2 (ja) |
WO (1) | WO2010003155A1 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9189472B2 (en) | 2009-03-30 | 2015-11-17 | Touchtype Limited | System and method for inputting text into small screen devices |
GB0905457D0 (en) | 2009-03-30 | 2009-05-13 | Touchtype Ltd | System and method for inputting text into electronic devices |
US9424246B2 (en) | 2009-03-30 | 2016-08-23 | Touchtype Ltd. | System and method for inputting text into electronic devices |
US10191654B2 (en) | 2009-03-30 | 2019-01-29 | Touchtype Limited | System and method for inputting text into electronic devices |
GB201016385D0 (en) | 2010-09-29 | 2010-11-10 | Touchtype Ltd | System and method for inputting text into electronic devices |
GB0917753D0 (en) | 2009-10-09 | 2009-11-25 | Touchtype Ltd | System and method for inputting text into electronic devices |
GB201003628D0 (en) | 2010-03-04 | 2010-04-21 | Touchtype Ltd | System and method for inputting text into electronic devices |
GB201200643D0 (en) | 2012-01-16 | 2012-02-29 | Touchtype Ltd | System and method for inputting text |
EP2698725A4 (en) * | 2011-04-11 | 2014-12-24 | Nec Casio Mobile Comm Ltd | INFORMATION INPUT DEVICE |
US9026428B2 (en) | 2012-10-15 | 2015-05-05 | Nuance Communications, Inc. | Text/character input system, such as for use with touch screens on mobile phones |
JP5897711B2 (ja) * | 2012-12-06 | 2016-03-30 | 楽天株式会社 | 入力支援装置、入力支援方法、及び入力支援プログラム |
GB201610984D0 (en) | 2016-06-23 | 2016-08-10 | Microsoft Technology Licensing Llc | Suppression of input images |
Family Cites Families (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5924452B2 (ja) * | 1980-09-22 | 1984-06-09 | 株式会社日立製作所 | 日本文入力装置 |
JPH0594436A (ja) * | 1990-10-10 | 1993-04-16 | Fuji Xerox Co Ltd | 文書処理装置 |
JP2849263B2 (ja) * | 1992-02-20 | 1999-01-20 | 富士通エフ・アイ・ピー株式会社 | キーワード拡張検索システム |
JPH0954781A (ja) * | 1995-08-17 | 1997-02-25 | Oki Electric Ind Co Ltd | 文書検索システム |
US5778361A (en) * | 1995-09-29 | 1998-07-07 | Microsoft Corporation | Method and system for fast indexing and searching of text in compound-word languages |
JP2001505330A (ja) * | 1996-08-22 | 2001-04-17 | ルノー・アンド・オスピー・スピーチ・プロダクツ・ナームローゼ・ベンノートシャープ | テキストストリーム中の単語の切れ目を与える方法及び装置 |
JPH1125098A (ja) * | 1997-06-24 | 1999-01-29 | Internatl Business Mach Corp <Ibm> | 情報処理装置、リンク先ファイルの取得方法および記憶媒体 |
US5999950A (en) * | 1997-08-11 | 1999-12-07 | Webtv Networks, Inc. | Japanese text input method using a keyboard with only base kana characters |
US6098086A (en) * | 1997-08-11 | 2000-08-01 | Webtv Networks, Inc. | Japanese text input method using a limited roman character set |
US6646573B1 (en) * | 1998-12-04 | 2003-11-11 | America Online, Inc. | Reduced keyboard text input system for the Japanese language |
US6636162B1 (en) * | 1998-12-04 | 2003-10-21 | America Online, Incorporated | Reduced keyboard text input system for the Japanese language |
US6407754B1 (en) * | 1998-12-15 | 2002-06-18 | International Business Machines Corporation | Method, system and computer program product for controlling the graphical display of multi-field text string objects |
US6496844B1 (en) * | 1998-12-15 | 2002-12-17 | International Business Machines Corporation | Method, system and computer program product for providing a user interface with alternative display language choices |
US6411948B1 (en) * | 1998-12-15 | 2002-06-25 | International Business Machines Corporation | Method, system and computer program product for automatically capturing language translation and sorting information in a text class |
US6389386B1 (en) * | 1998-12-15 | 2002-05-14 | International Business Machines Corporation | Method, system and computer program product for sorting text strings |
JP2000259629A (ja) * | 1999-03-11 | 2000-09-22 | Hitachi Ltd | 形態素解析方法およびその装置 |
CN1168068C (zh) * | 1999-03-25 | 2004-09-22 | 松下电器产业株式会社 | 语音合成系统与语音合成方法 |
US7725307B2 (en) * | 1999-11-12 | 2010-05-25 | Phoenix Solutions, Inc. | Query engine for processing voice based queries including semantic decoding |
JP2001325252A (ja) * | 2000-05-12 | 2001-11-22 | Sony Corp | 携帯端末及びその情報入力方法、辞書検索装置及び方法、媒体 |
BE1013637A6 (nl) * | 2000-08-07 | 2002-05-07 | Smet Francis De | Werkwijze voor het opzoeken van informatie op het internet. |
JP3820878B2 (ja) * | 2000-12-06 | 2006-09-13 | 日本電気株式会社 | 情報検索装置,スコア決定装置,情報検索方法,スコア決定方法及びプログラム記録媒体 |
US7200558B2 (en) * | 2001-03-08 | 2007-04-03 | Matsushita Electric Industrial Co., Ltd. | Prosody generating device, prosody generating method, and program |
US20030023426A1 (en) * | 2001-06-22 | 2003-01-30 | Zi Technology Corporation Ltd. | Japanese language entry mechanism for small keypads |
US7152056B2 (en) * | 2002-04-19 | 2006-12-19 | Dow Jones Reuters Business Interactive, Llc | Apparatus and method for generating data useful in indexing and searching |
US7174288B2 (en) * | 2002-05-08 | 2007-02-06 | Microsoft Corporation | Multi-modal entry of ideogrammatic languages |
US7523102B2 (en) * | 2004-06-12 | 2009-04-21 | Getty Images, Inc. | Content search in complex language, such as Japanese |
US20060085761A1 (en) * | 2004-10-19 | 2006-04-20 | Microsoft Corporation | Text masking provider |
US7376648B2 (en) * | 2004-10-20 | 2008-05-20 | Oracle International Corporation | Computer-implemented methods and systems for entering and searching for non-Roman-alphabet characters and related search systems |
US7263658B2 (en) * | 2004-10-29 | 2007-08-28 | Charisma Communications, Inc. | Multilingual input method editor for ten-key keyboards |
JP2007042069A (ja) * | 2005-06-30 | 2007-02-15 | Sony Corp | 情報処理装置,情報処理方法および情報処理プログラム |
US8666928B2 (en) * | 2005-08-01 | 2014-03-04 | Evi Technologies Limited | Knowledge repository |
US20070118533A1 (en) * | 2005-09-14 | 2007-05-24 | Jorey Ramer | On-off handset search box |
JP4082520B2 (ja) * | 2005-10-07 | 2008-04-30 | クオリティ株式会社 | 個人情報探索プログラム |
US7756859B2 (en) * | 2005-12-19 | 2010-07-13 | Intentional Software Corporation | Multi-segment string search |
WO2008052205A2 (en) * | 2006-10-27 | 2008-05-02 | Jumptap, Inc. | Combined algorithmic and editorial-reviewed mobile content search results |
JP4888071B2 (ja) * | 2006-11-15 | 2012-02-29 | 富士通株式会社 | プログラム、コピーアンドペースト処理方法、装置及び記録媒体 |
CN101206659B (zh) * | 2006-12-15 | 2013-09-18 | 谷歌股份有限公司 | 自动搜索查询校正 |
US8838659B2 (en) * | 2007-10-04 | 2014-09-16 | Amazon Technologies, Inc. | Enhanced knowledge repository |
-
2009
- 2009-07-06 US US12/498,338 patent/US20100121870A1/en not_active Abandoned
- 2009-07-06 WO PCT/US2009/049730 patent/WO2010003155A1/en active Application Filing
- 2009-07-06 JP JP2011516899A patent/JP5372148B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
WO2010003155A1 (en) | 2010-01-07 |
JP2011527058A (ja) | 2011-10-20 |
US20100121870A1 (en) | 2010-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5372148B2 (ja) | モバイルデバイス上で日本語テキストを処理する方法およびシステム | |
US9715489B2 (en) | Displaying a prediction candidate after a typing mistake | |
US8117540B2 (en) | Method and device incorporating improved text input mechanism | |
US9606634B2 (en) | Device incorporating improved text input mechanism | |
US9715333B2 (en) | Methods and systems for improved data input, compression, recognition, correction, and translation through frequency-based language analysis | |
US9798717B2 (en) | Human-to-mobile interfaces | |
EP1950669B1 (en) | Device incorporating improved text input mechanism using the context of the input | |
US20090193334A1 (en) | Predictive text input system and method involving two concurrent ranking means | |
US8099416B2 (en) | Generalized language independent index storage system and searching method | |
EP2109046A1 (en) | Predictive text input system and method involving two concurrent ranking means | |
KR20020053784A (ko) | 문자 입력 방법 및 이를 이용한 정보통신 서비스 방법 | |
KR20120006503A (ko) | 개선된 텍스트 입력 | |
KR20130001261A (ko) | 이동 전화의 터치 스크린과 함께 사용하기 위한 다중 모드 문자 입력 시스템 | |
US20080300861A1 (en) | Word formation method and system | |
KR101130206B1 (ko) | 입력 순서와 무관한 문자 입력 메커니즘을 제공하는 방법, 기기 및 컴퓨터 프로그램 제품 | |
EP1923796B1 (en) | Method and device incorporating improved text input mechanism | |
US8730176B2 (en) | Handheld electronic device including automatic preferred selection of a punctuation, and associated method | |
WO2012015021A1 (en) | Stroke and structure input method and system | |
JP2001243221A (ja) | 電子機器の文字入力方法と文字入力システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120214 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121011 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121018 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130117 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130124 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130215 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130222 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130312 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130821 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130917 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |