JP2009020866A - タイミング・シーケンス多義エンコーディングを採用するデコーディング方法とその装置 - Google Patents

タイミング・シーケンス多義エンコーディングを採用するデコーディング方法とその装置 Download PDF

Info

Publication number
JP2009020866A
JP2009020866A JP2008119279A JP2008119279A JP2009020866A JP 2009020866 A JP2009020866 A JP 2009020866A JP 2008119279 A JP2008119279 A JP 2008119279A JP 2008119279 A JP2008119279 A JP 2008119279A JP 2009020866 A JP2009020866 A JP 2009020866A
Authority
JP
Japan
Prior art keywords
sequence
encoding
character
input
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008119279A
Other languages
English (en)
Inventor
Jen-Te Chen
仁徳 陳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of JP2009020866A publication Critical patent/JP2009020866A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0237Character input methods using prediction or retrieval techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Document Processing Apparatus (AREA)
  • Input From Keyboards Or The Like (AREA)
  • Machine Translation (AREA)

Abstract

【課題】本発明は、タイミング・シーケンス多義エンコーディングを採用するデコーディング方法を提供することである。
【解決手段】本発明に係わるデコーディング方法は、複数のエンコーディング列を非表音文字言語に使用される複数のデコーディング列にマッピングすることに用いられ、前記デコーディング方法は、入力するエンコーディング・キャラクターを受信するステップと、入力したエンコーディング・キャラクターを一つの入力列の末尾に組合せるステップとを備え、前記入力列にタイミング・シーケンス多義があるため、前記入力列は、少なくとも二つの異なるエンコーディング列組合に解析されることができ、且つエンコーディング列組合毎は、前記エンコーディング列の中の少なくとも一つを備える。
【選択図】図2

Description

本発明は、デコーディング方法及びデコーディング装置に関するものであり、特に多義なエンコーディングを採用するデコーディング方法とその装置に関するものである。
現在、携帯電話、MP3プレイヤーなどの各種の智恵性設備は、機能が強大で、且つ体積も小さくて携帯便利になる。寸法に限定されて、これらの装置の界面設計は、巨大な挑戦に直面する。文字入力を例にすると、目前の解決手段は、伝統のマルチタップ(multi−tap)入力法、プレビュー(preview)入力法及び小型標準キーボードを備える。
伝統のマルチタップ入力法(例えば、ABC入力法である)は、簡単であるが、入力効率が低く、且つ使い難い。小型標準キーボードの設計は、ユーザーが伝統の標準キーボードを非常に熟知し、且つ小型標準キーボードに非常に適応し易いと仮定する。しかし、前の仮定は、ただコンピュータ・ユーザーだけに適用し、多い未成年人は、標準キーボードに慣れる前にもう携帯電話入力法に慣れた。分散配列又は字母順序配列方式に比べて、このような設計は、コンピュータ・ユーザーを助けて字母を探し易いようにするが、寸法が小さ過ぎるため、小型キーボードの実用性を下げる。
又、プレビュー入力法は、字母毎を入力することに必要とするプッシュ・ボタンの回数を大幅に減らすことができる。しかし、プレビュー入力法も同様に新しい問題がある:a)ユーザーが入力する時、プレビュー文字が無作為に変化する;b)ユーザーが入力する時、入力の正確性を検出し難く、且つ入力を取り消すことの上でユーザーが非常に腹を立てる;c)もしプレビュー入力法の予め設置した辞書に入力しようとする単語がなければ、他の入力法(例えば、マルチタップ入力法である)に切り替えて再び入力しなければならない;d)全体にとっては、プレビュー入力法の理解能力及び表現は、予測することができなく且つ信頼することができない。
一組のマッピング(mapping)において、エンコーディング列とデコーディング列が互いに対応され、且つマッピングの中のエンコーディング列毎は、一つの文字列である。一つの文字列が複数のマッピングに対応することを多義(ambiguity)があると称する。図1A及び図1Bは、多義なエンコーディング(ambiguity encoding)を示す例であって、図1Aは、従来の通用キーボードを示し、図1Bは、従来の通用キーボードの多義なエンコーディングを示す。キー領域100内に複数のテン・キー101及び特殊機能キー104、105を備える。伝統の多義なエンコーディング方式は、デコーディング文字列集合において複数のデコーディング文字列を管理し、且つ前記デコーディング文字列集合を一つのエンコーディング文字列集合に指定する。
エンコーディング・キャラクター・レパートリーのドメインに対応してから、単純にドメインに基づく知識は、グループ化のキャラクターを区分することができる。この過程をエンコーディングを損失する過程と見なすことができる。失った情報を回復するために、あらゆる可能の組合を生成することができ、ユーザーがそれから一つの正しい組合を選択することにする。
マルチタップ入力法は、毎次入力する時、ユーザーに入力しようとするキャラクターを選択させて、キャラクター層級の上で、多義なエンコーディングの問題を解決する。
伝統のプレビュー入力法は、単語の層級の上で、多義なエンコーディングの問題を解決する。図1Bに示す“HOME”を入力することを例にすると、入力列“4663”の一つのエンコーディング・キャラクター110は、一つの集合103の中の一つのデコーディング・キャラクター112を代表する。クロス・リンキング・ネットワーク(cross linking network)111は、あらゆる隣り合うエンコーディング・キャラクターの組合を表示する。Mがキャラクター・クラス(character class)の大きさであって、Lが入力文字列の長さである場合、入力列の組合にM^L種があるため、あらゆる組合を一一に列挙することができない(本例の組合は、ただ3^4=81種であるが、一旦L=10であると、組合数が3^10=59049種になる)。
一般的に、言語学知識は、出力の数量を大幅に減少することに用いられる。最も常用する作法は、辞書を提供して、出力とマッチングすることに用いられ、且つマッチング結果を出力して、ユーザーが選択することにする。しかし、たとえ言語学を導入したとしても、入力列“4663”は、依然としていろいろな方式で解釈することができ、例えば、“HOME”、“GOOD”、“GONE”、“HOOD”、“HOOF”、“HONE”、“GOOF”、“IMME”、“INNE”、“HOND”、“INOF”、“GOOE”である。換言すると、伝統の入力方法とその装置において、とても多い可能の結果があって、ユーザーが単語を入力する効率を下げる。
だから、もっと好いエンコーディング規則及びユーザーに受け入れ易いデコーディング方法を提供する必要がある。
本発明の目的は、前記問題を解決し、オプションを効果的に減少することができ、タイミング・シーケンス多義を採用するデコーディング方法を提供することである。
本発明の他の目的は、前記問題を解決し、オプションを効果的に減少することができ、タイミング・シーケンス多義を採用する装置を提供することである。
前記目的を達成するため、本発明に係わるデコーディング方法は、エンコーディング列をデコーディング列にマッピングすることに用いられ、エンコーディング列毎は、エンコーディング・キャラクター・レパートリーから選択される少なくとも一つのキャラクターを備え、デコーディング列毎は、非表音文字言語に使われるデコーディング・キャラクター・レパートリーから選択される少なくとも一つのデコーディング・キャラクターを備え、前記デコーディング方法は、入力するエンコーディング・キャラクターを受信するステップと、入力したエンコーディング・キャラクターを一つの入力列の末尾に組合せるステップとを備え、前記入力列にタイミング・シーケンス多義があるため、前記入力列は、少なくとも二つの異なるエンコーディング列組合に解析されることができ、且つエンコーディング列組合毎は、前記エンコーディング列の中の少なくとも一つを備える。
前記目的を達成するため、本発明に係わる装置は、エンコーディング・キャラクター・レパートリーから選択される少なくとも一つのキャラクターを備える入力列を入力することに用いられるキーボードと、一つの出力列を選択的に出力することに用いられ、前記出力列は、デコーディング・キャラクター・レパートリーから選択される少なくとも一つのデコーディング・キャラクターを備え、前記出力列は、前記入力列に基づいて生成する出力装置と、複数のエンコーディング列を複数のデコーディング列にマッピングするマッピングを備え、エンコーディング列毎は、前記エンコーディング・キャラクター・レパートリーから選択される少なくとも一つのエンコーディング・キャラクターを備え、デコーディング列毎は、前記デコーディング・キャラクター・レパートリーから選択される少なくとも一つのデコーディング・キャラクターを備え、前記マッピングは、前記入力列の少なくとも一部分によって、前記入力列を前記出力列にマッピングすることに用いられるデコーディング装置とを備え、前記キーボードを介して一つのエンコーディング・キャラクターを入力する時、前記デコーディング装置は、入力したエンコーディング・キャラクターを前記入力列の末尾に組合せ、前記入力列にタイミング・シーケンス多義があるため、前記入力列は、少なくとも二つの異なるエンコーディング列組合に解析されることができる。
前記目的を達成するため、本発明に係わる他のデコーディング方法は、複数のエンコーディング列を複数のデコーディング列にマッピングする一つのマッピングを維持し、エンコーディング列毎は、エンコーディング・キャラクター・レパートリーから選択される少なくとも一つのエンコーディング・キャラクターを備え、デコーディング列毎は、非表音文字言語に使われるデコーディング・キャラクター・レパートリーから選択される少なくとも一つのデコーディング・キャラクターを備えるステップと、一つ又は複数のエンコーディング・キャラクターを受信して一つの入力列に組合せるステップと、もし前記入力列の長さが1より大きければ、複数のエンコーディング列組合を生成するステップと、前記エンコーディング列組合の中の一つを選択するステップと、前記マッピングによって、選択したエンコーディング列組合を一つの出力列にマッピングするステップと、前記出力列を出力するステップとを備える。
本発明に係わるデコーディング方法及びその装置は、タイミング・シーケンス多義エンコーディングを採用するため、出力するオプションの数量を大幅に減少することができる。
以下、図面を参照しながら、具体的な実施例を詳しく説明し、これにより、本発明の上述の目的と他の目的、特徴及び長所が、より容易に理解できる。
図2は、本発明の実施形態に係わるデコーディング装置の回路ブロック図である。本実施形態において、デコーディング装置20は、キーボード200と、デコーダー230及び出力装置250を備える。キーボード200は、エンコーディング・キャラクター・レパートリーから選択される少なくとも一つのエンコーディング・キャラクターを備える入力列を入力することに用いられる。デコーダー230は、第一通路を介してキーボード200にカップリングすることにより、キーボード200によって入力する入力列を受信する。デコーダー230は、マッピング232を備え、受信した入力列がマッピング232に基づいて出力列に変換することにする。出力装置250は、第二通路を介してデコーダー230にカップリングすることにより、マッピング232によって生成する出力列をその上に表示する。
キーボード200は、複数のキーを有する入力装置であることができ、キー毎は、一つのエンコーディング・キャラクター・レパートリーから選択される一つのエンコーディング・キャラクターを表示する。キーの数量を減少するために、K<Nである時、数量がKであるキーボード字母表(例えば、エンコーディング・キャラクター・レパートリーである)と数量がNである字母表(例えば、デコーディング・キャラクター表である)を対応する必要がある。ただはっきり説明することを目的とするだけで、本発明の範囲を限定されるものではなく、図2に示すキーボード200は、現在の携帯電話に常用する普通のキーボードである。キーボード200は、別々に数字0−9を表示するキー202−220及び特殊符号を表示するキー222、224を備える。本実施形態において、エンコーディング・キャラクター・レパートリーは、数字キャラクター十個及び特殊キャラクター二個を備える。デコーディング・キャラクター・レパートリーは、英文字母二十六個を備える。
マッピング232がエンコーディング・キャラクター・レパートリーから選択されるキャラクターからなる複数のエンコーディング列の中のエンコーディング列毎をデコーディング・キャラクター・レパートリーから選択される少なくとも一つのキャラクターからなるデコーディング列に対応することができると仮定し、エンコーディング列毎が一つの文字列であると、文字列毎が複数のデコーディング列に対応する状況を空間多義(Spatially Ambiguous)と称し、文字列を産生することに用いられる入力列毎が複数の解釈を有する状況をタイミング・シーケンス多義(Temporally Ambiguous)と称する。空間多義は、もう背景技術で討論したから、以下、タイミング・シーケンス多義を詳しく説明する。
固定長さのエンコーディングにとって、一つのエンコーディング列の中の固定長さがMであるエンコーディング・キャラクター毎は、一つの文字列を代表し、且つ一つのデコーディング・キャラクターのデコーディング列に対応する。長さ変更可能なエンコーディングにとって、常にプリフィックスがないエンコーディングを使うことにより、デコーダー230は、文字例毎をはっきり識別することができる。もしプリフィックスがあるエンコーディングを使ったら、一つの予定のタイムアウト又はタイムアウト除去記号(デリミット・キー)を使うことを必要として、需要する文字列毎をはっきり識別することにする。タイムアウト除去記号方法は、余計なプッシュ・ボタン作動を導入するため、実用ではない。タイムアウト法は、余計なプッシュ・ボタン作動を免れることができるが、ユーザーが待ちなければならなくて、効率を下げる。
一つの入力列が複数のタイミング・シーケンス解釈に対応すると、タイミング・シーケンス多義が存在する。伝統の長さ変更可能エンコーディング規則にタイミング・シーケンス多義を導入するために、タイムアウトとタイムアウト除去信号の要求を見落とすことができる。図3A−3Bに示すように、図3Aは、本発明の実施形態に係わる部分のエンコーディング規則であって、図3Bは、“HOME”を入力する時に産生するタイミング・シーケンス多義をデモンストレーション(demonstration)する。例えば、列“38”320は、‘M’301を代表する相連な文字列“3−8”311又は別々に‘E’302と‘B’303を表示する二つの文字列“3”312及び“8”313に解釈されることができる。
タイミング・シーケンス多義規則によって、一つの入力列を幾つの片段に断ち切ることにより、二つの片段における隣り合うキャラクターが一緒に形成した文字列(エンコーディング列とも言う)がデコーディング規則において対応するデコーディング列がないことにする。もし一つの片段の長さが1より大きければ、複数のタイミング・シーケンス解釈を有する。図3Bを参照すると、入力列308は、点線ブロックを限界として、複数の片段を有するタイミング・シーケンス片段化列309に断ち切られ、片段毎に複数のキャラクターを有する。図3Aに示すエンコーディング規則において、二つの隣り合うキャラクター317,318からなる文字列“03”に対応するデコーディング列がない。だから、二つの片段316、320は、タイミング・シーケンスの上で区分される。
タイミング・シーケンスを断ち切る具体過程は、入力列のキャラクター毎と次のキャラクターの組合がエンコーディング規則において対応するデコーディング列があるかどうかを一一に検査することができ、もし対応するデコーディング列があると、目前のキャラクターが累積され、もし対応するデコーディング列がなければ、目前のキャラクターと前に累積したキャラクターで一つのタイミング・シーケンス多義片段を構成する。多義なエンコーディングの長さは、タイミング・シーケンス多義片段の長さと定義することができる。もし一つのタイミング・シーケンス多義片段の長さが1ならば、タイミング・シーケンス多義がない。なお、部分の入力列は、ただエンコーディング規則によって多義を除去することができる。図4に示すエンコーディング規則を例にすると、文字列“09”は、対応するデコーディング列がないから、入力列“09”は、“0:9”に識別することができる。即ち、前記エンコーディング規則によって、“09”は、直接に“OR”に対応し、言語学の手段でタイミング・シーケンス多義を解決する必要がない。以下、これを詳しく説明する。
好ましい実施形態において、エンコーディング規則は、長さ変更可能エンコーディングであるため、デコーディング・キャラクターは、一つの数字又は二つの数字でエンコーディングすることができる。両位数字は、10*10種の組合があって、大部分の状況であらゆるデコーディング・キャラクターに対してエンコーディングすることに充足である。だから、もし三位数字を使ったら、ただ非常に少ない一部分の組合だけに関連するかも知らない。
一つのタイミング・シーケンス多義片段の合法的な組合は、多義がなく、唯一にデコーディングできる一つの入力列を代表する。エンコーディング規則において、一つのタイミング・シーケンス多義片段のあらゆる合法的な組合を列挙するために、あらゆる組合を列挙することができ、前記タイミング・シーケンス多義片段の多義の長さをNにして、且つキャラクター毎は、前又は次のキャラクターと連接することができるが、同時に連接することができない。二つの連接されたキャラクターが一つの両位数字エンコーディングを構成し、他のキャラクターと連接しない一つのキャラクターが一つの一位数字エンコーディングを構成する。もし一つのキャラクターが前のキャラクター及び後のキャラクターに同時に連接すると、三位エンコーディングに属し、これは、合法ではない組合だから、特殊処理を行わなければならない。
例えば、“1”がキャラクターを表示し、“―”が連接しないことを表示し、“+”が連接することを表示すると仮定すると、一つの列1111は、1−1−1−1、1−1−1+1、1−1+1−1、1+1−1−1、1+1−1+1のような5種の組合を列挙することができる。長さがKである連接に対して、列挙することができる数目は以下のようである。
0:C(N,0)
1:C(N−1,1)
2:C(N−2,2)
K:C(N−K,K)
N/2
もしN=10ならば、組合数目は、C(10,0)+C(9,1)+C(8,2)+C(7,3)+C(6,4)+C(5,5)=1+9+28+35+15+1=89である。伝統の空間多義に比べて、長さが10である文字列の組合数は、3^10=59049であるため、全部列挙することは実際ではない。既定の列にとって、もしそのタイミング・シーケンス多義長さがN(57000個単語を有する辞書によって計算すると、Nは、8より大きくことができないため、最大なタイミング・シーケンス多義長さが8であって、非常に少ない例外に対して、辞書を調べる方式を採用して解決する)ならば、2^(8−1)種の可能な組合において、二つの連接を有するキャラクターの非法組合を見落として、あらゆる可能な合法組合を列挙することができる。
従来の技術に比べて、組合数量から本発明のタイミング・シーケンス多義方法を考慮すると、もっと好い解決方案であることはとても明らかである。
一つの実施形態において、タイミング・シーケンス多義は、伝統の方法である空間多義を解決する時に辞書を調べる方法と類似する手段で解決することができる。タイミング・シーケンス多義は、伝統の空間多義よりもっと区分し易い。本実施形態において、約39000個単語を備える辞書を採用するが、ただ50個エンコーディング列が二つの単語に対応し、且つ二つ以上の単語に対応する状況はない。換言すると、前記辞書の99.87%の単語は、唯一に識別されることができる。伝統の空間多義エンコーディング方法は、有限な幾つのオプションを提供することができるが、本発明は、ただ一つのオプションだけで、考慮する過程を大幅に下げる。例えば、伝統の空間多義エンコーディング方法において、“HOME”を入力する場合、12個の単語を検査しなければならないが、本発明のエンコーディング方法を採用する場合、ただ一つの単語“HOME”が前記エンコーディングに符合する。最も悪い状況であっても、選択することができる単語は、ただ一つだけである。この角度から考慮すると、ユーザーは、入力しようとする単語を速く選択することができる。
ユーザーが二つの選択可能単語に対応する少数の幾つのエンコーディングからその中の多義がない一つを選択する場合、一つの解決方法は、‘*’のような特殊機能キーを使って、各個の選択可能単語からロール選択することにより、その中の一つを選択する。選択可能な単語の数量が非常に少ないから、他の方法は、選択可能な単語を同時に表示する。単語が出現する順序は、単語周波数統計又は言語学権値計算に基づく。
理論の上では、言語学の方法を採用して空間多義問題を解決することができるが、可能な組合が冪級数に増加するため、実現することができない。これに反して、言語学は、タイミング・シーケンス多義に順調に応用することができ、辞書を検索する動作を減少する。図5Aと図5Bに示すように、図5Aは、本発明の実施形態に係わる言語学を採用してタイミング・シーケンス多義を解消するフローチャートであって、図5Bは、本発明の実施形態に係わる2グラム統計(2−gram statistics)模型を採用して、言語学権値を計算するフローチャートである。以下、具体の過程を詳しく説明する。
図5Aを参照すると、言語学を採用してタイミング・シーケンス多義エンコーディングを解決する方法は、以下のステップを備える。一つのタイミング・シーケンス多義片段を獲得し、該片段の前の片段の最後の一つのキャラクターを“pre”として、該片段の後の片段の第一のキャラクターを“post”とする(ステップ511)。前記タイミング・シーケンス多義片段に対応するあらゆる可能な組合を列挙して、列挙項毎は、一つの多義がない入力列である(ステップ513)。一つの臨時最大言語学分値SMAX及び対応する多義がない列EnumMAXを初期化する(ステップ515)。ステップ517において、列挙項毎を処理し始める。列挙項毎に対してその言語学分値を計算して一つの結果S0を獲得する(ステップ519)。S0>SMAXであると、SMAXとEnumMAXが更新される(ステップ521と523)。あらゆる列挙項を処理終わってから、最大言語学分値SMAXは、実際の最大値であって、且つEnumMAXを戻る(ステップ525)。
図5Bは、言語学周波数モジュールの言語学2グラム統計(2−gram statistics)模型を採用して、言語学分値を計算する方法を示すフローチャートであって、この方法は、受信した多義がない入力列SDの言語学分値を計算することに用いられる。ステップ540において、初期化を行う。初期化を完成してから、入力列に対してデコーディングしてデコーディング・キャラクターを備えるデコーディング・キャラクター列を獲得する(ステップ542)。あらゆるデコーディング・キャラクターを順次に処理する(ステップ544と546)。デコーディング・キャラクター毎に対して、目前のキャラクターと次のキャラクターを一つの2グラム文字列に組合せる(ステップ548)。前記2グラム文字列の分値S1を探して且つ言語学分値S0の中に累積し(ステップ550と552)、累積とは、加算、乗算又は他の標準をいい。例えば、デコーディング・キャラクター列“HOME”に対して、2グラム文字列“HO”、“OM”及び“ME”の分値を計算する必要がある。前記デコーディング・キャラクター列のあらゆるデコーディング・キャラクターを処理終わってから累積した言語学分値S0を戻る(ステップ554)。
上述の言語学を採用してタイミング・シーケンス多義を解決する方法が戻ったエンコーディング・キャラクターからなる多義がない入力列EnumMAXは、唯一なデコーディング列にデコーディングされることができる。一つの単語のプリビュー(preview)を検出しようとする場合、先ずそれをエンコーディング・キャラクター列にエンコーディングしてから、言語タイミング・シーケンス多義を除去する操作を行う。もし一つの単語のプリビューがその単語自身ならば、それを命中と称して再び辞書を調べる必要がない。命中率とは、一つの単語集合において直接に命中することができる単語の比率をいい。辞書を検索するコストを減少するために、言語学を採用して解決することができる単語を辞書から除去すると、辞書の大きさを大幅に減少する。一つの実施形態において、ただ約3100個単語を保存した辞書は、57000個単語を有する辞書の中の36000個の低周波単語に対する命中率が81.3%、他の単語に対する命中率が100%になる効果に達する。
更に目的言語知識によって命中率を高めることができる。言語学分値は、目的言語の知識で補償することができる。例えば、英語において、三つの連続する子音(“S”で終わる複数形式を除く)は、とても少ない。この状況で、その言語学分値を減少することにより、単語を間違いにマッチングすることを免れる。整体の命中率を高めるために、分値を具体にいくら減少するかは、詳しく調整しなければならない。もし三つの連続する子音を有する単語がこのような調整規制によって間違いに見落とされると、まだ辞書を検索する方法でそれを探し出すことができる。
楽観タイミング・シーケンス多義解消方法は、啓発式教授法(heuristics)を採用し、あらゆる組合を列挙しない言語タイミング・シーケンス多義解消方法である。本発明は、貪欲原則を応用して、楽観多義解消を提供し、例えば、何れの多義状況に対して、最長のマッチング列を優先に選択することができる。例えば、図4に示すエンコーディング規則によって、“10”は、“IO”に対応する“1:0”又は“10”に対応するDであることができ、この状況では、貪欲原則によって“D”を選ぶべきだ。
楽観タイミング・シーケンス多義解消を採用する時、先ず楽観多義解消によって多義がない入力列を生成するべきだ。前記多義がない入力列の言語学分値は、図5Bに示す方法で求める。累積した分値がある特定の標準に符合する時、例えば、累積した分値が最小な受信可能値より大きければ、デコーディング結果をユーザーに出力することができる。累積した言語学分値が最小な受信可能値より小さいか等しければ、上述の言語タイミング・シーケンス多義解消過程をスタートして、最も好い単語のあて結果を獲得する。
上述のエンコーディング規則において、エンコーディング・キャラクター・レパートリーをデコーディング・キャラクター・レパートリーにマッピングするいろいろなマッピングを使うことができる。その一種は、形状に基づいたマッピングであることができる。多い従来の技術であって、例えば、米国の特許4008793、特許4877405、特許5307267、特許6837633、特許6874960、特許7098919、特許4173753、特許5305207、特許5790055、特許6362752、特許6686907、特許6766179、特許5982303、特許6753794は、皆形状に基づいたマッチング関係を公開した。本発明は、新しい形状に基づくマッチング方法を提供する。キャラクター・エンコーディングに対して大量に研究したが、エンコーディング規則に変形操作を使ったことがない。本発明の一つの実施形態によって、一つのエンコーディング列に少なくとも二つのエンコーディング・キャラクターを備えることができるが、エンコーディング列の中の一つの正式キャラクターの予定形状変換タイプは、その後且つそれに隣り合うキャラクター表示に利用する。
本発明が提供する形状に基づくマッピングの操作は、無操作、変換操作、創立操作、粉砕操作及び変形操作に分ける。無操作は、エンコーディング・キャラクターとデコーディング・キャラクターがほぼ同じな時に使う。変換操作は、回転、鏡像、縮小などを備える。創立操作は、筆画に基づく操作又は形状の組合を備える。粉砕操作は、筆画除去、カット(例えば、筆画によらなくて創立した分割作動である)と開口(例えば、閉鎖な領域を断ち切る)を備える。変形操作は、エンコーディング・キャラクターと対応するデコーディング・キャラクターが中間形状を採用して関連することができる場合に使う。
図6は、本発明の好ましい実施形態である。第一行は、キーボード字母表(エンコーディング・キャラクター・レパートリーの一つの実例である)600である。第二行は、正常な英文字母表(デコーディング・キャラクター・レパートリーの一つの実例である)601である。第三行は、英文字母(デコーディング・キャラクター)と数字(エンコーディング・キャラクター)との間の中間形状602である。第四行は、数字又は数字組合を備えるマッピング関係603である。第三行において、矢印が指す‘4’は、粉砕操作604を表示する。‘C’列の粉砕操作604は、“カット”操作であって、他は“開口”操作である。本発明の形状に基づくマッピング関係によって、デコーディング・キャラクター(第二行)を中間形態(第三行)に翻訳し易く、最後に対応する一つ又は複数のエンコーディング数字(第四行)を得る。もちろん、相反の過程を行うことができ、即ち一つ又は複数のエンコーディング数字をデコーディング・キャラクターに翻訳する。
図4に示すエンコーディング規則は、図6に示す形状に基づくマッピングから誘導することができ、以下、詳しく説明する。エンコーディング規則(又はマッピング関係)401は、複数のデコーディング・キャラクター402を備える。デコーディング・キャラクター402は、キー403から産生する単キャラクター文字列又はキー404、405から産生する二キャラクター文字列に対応することができる。注意しなければならないことは、‘G’は、形状の組合によって“67”にエンコーディングすることができるが、同様に変形操作によって“6”
にエンコーディングすることができる。図4の結果エンコーディングは“6”である。一般的に、もっと意義があるエンコーディングを生成する規則は、もっと多い形状情報を含むエンコーディングを優先にする。従って形状によって第一エンコーディングと第二エンコーディングを識別易くなる。例えば、‘Q’は、‘0’と‘1’の組合であるが、‘0’は、もっと多い形状情報を含むから、‘Q’のエンコーディングは、“01”である。
本発明によると、ユーザーは、キーボードを見なくても文字を入力することができ、即ち直接にキーボードの上の数字を使って記憶によって入力することができる。何れの特殊標記を使わなくても良いから、携帯電話又はキーボードの製造メーカーは、従来の設計に対して何れの変更をしなくても直接に本発明を応用することができる。
入力する場合、ユーザーは、直観的に必要のキーを本当に選択したかどうかを検査することができる。‘Q’のデコーディングを例にすると、第一のエンコーディングを入力してから‘Q’を表示しなく、‘0’のような関する形状を表示する場合、ユーザーは、すぐキーを間違いにプッシュしたから更正しなければならないことを認識する。‘0’と‘1’を正確に入力してから、‘Q’にデコーディングされると予期したが、エンコーディング規則によって列“OI”に
デコーディングされるかも知らない。両種の状況で、表示結果は、皆入力列“01”に関連し、伝統のプレビュー入力法の足飛びオプションのようではない。だからデコーディング構造によって、本発明の方法は、信頼性及び予測可能性が高い。
デコーディング・キャラクター毎に対して、設計方策に受信されるあらゆる可能なエンコーディング列(エンコーディング列毎は、皆エンコーディング・キャラクターから構成する)を生成する。設計方策によって、オプション毎は、関するウエイング(weighing)を有する。一般的に、好ましいオプションは、より高いウエイングを有する。形状に基づく文字列列挙とは、形状に基づく設計方策を有する文字列列挙をいい。複数級文字列列挙とは、異なる設計方策の等級構造をいい。複数級文字列列挙の実施形態において、デコーディング・キャラクター毎に対応するエンコーディング・キャラクターのあらゆる可能なエンコーディング列が皆生成される。可能なエンコーディング列は、幾つの論理解釈に分けることができ、例えば、形状関連、文化関連又は他の受けることができる関連である。
上述の複数級文字列列挙の文字列列挙を行ってから、いっそう分析して受けることができる分配を決める。
一つの実施形態において、目的言語文献から一つの1グラム言語表及び一つの2グラム言語表を生成し、高周波字母は、1グラム言語表によって単エンコーディング・キャラクターを指定する。好ましい形状分配が出現する周波数が低いと、再びダブル・エンコーディング・キャラクターに指定して、単エンコーディング・キャラクターは、他の高周波デコーディング・キャラクターに指定される。例えば、初期の分配において、‘Z’と‘N’は、別々に(‘Z’、“2”)と(‘N’、“2@”)に指定されるが、‘N’が更に高い周波数を有するため、‘Z’は、再び(‘Z’、“22”)に指定されることができ、Nは、(‘N’、“2”)に指定される。2グラム言語表は、このような分配に更に多い多義を導入することを防止する。例えば、以下の表1において、“12”は、エンコーディング“D”の一つのオプションである。William Soukoreff and Scott MacKenzie,Linguistic Diagram Frequency Tables (http://dynamicnetservices.com/〜will/academic/bit95.tables.html)の中のbit95のような2グラム言語表を参照すると、2グラム片段“IN”が更に高い周波数を有することを発見することができ、可能ならできるだけ免れるべきだ。もし“12”がある設計方策によって選定されたら、言語学分値補償は、このような案配から導入する多義を減少することに用いられる。
表1に示すように、エンコーディング・キャラクターとデコーディング・キャラクターとの間の可能なマッピング関係は、基本相同関係、変換関係、変形関係、組成関係及び粉砕関係のような多種の類別に分けることができる。表1の“^”は、粉砕操作を代表する。符号“@”は、変換操作の回転を代表し、“%”は、変換操作の鏡像を代表し、“/”は、“OR”を代表し、“-”に囲まれるのは、考慮に値しない案配を表示する。
Figure 2009020866
以下の両種のマッピング方法を採用してエンコーディングを案配することは、非常に重要なことであって、一種のマッピング方法は、デコーディング・キャラクター毎の周波数をよく考慮することにより、エンコーディング列を一つのデコーディング・キャラクターに案配し、他の一種のマッピング方法は、文字列列挙が提供する可能なマッピングをよく考慮することにより、エンコーディング列を一つのデコーディング・キャラクターに案配する。この両種のマッピング方法は、いずれの順序で行うことができる。例えば、表2は、エンコーディング案配結果及び一階統計(First−Order Statistics)が提供する1グラム言語統計に基づく衝突解決方法を提供する。一階統計について、http://www.data−compression.com/english.htmlの関する内容(Statistical Distributions of English Text)を参照することができる。“A”、“E”、“I”、“O”、“R”、“S”及び“T”のような高周波デコーディング・キャラクターは、1グラム(又は単キャラクター)・エンコーディング列を案配される。他のキャラクターについて、例えば、“B”と“G”は、別々にエンコーディング・キャラクター“8”、“6”と非常に相似するため、1グラム・エンコーディング列を案配される。デコーディング・キャラクター“Z”は、先ず1グラム・エンコーディング“2”を案配される。しかし、1グラム・エンコーディング・キャラクター“2”は、デコーディング・キャラクター“N”のマッピングとすることができ、且つ言語学統計結果によると“N”の出現周波数が“Z”より高いから、1グラム・エンコーディング・キャラクター“2”は、再びデコーディング・キャラクター“N”に案配され、デコーディング・キャラクター“Z”は、再び2グラム・エンコーディング・キャラクター“22”
に案配される。
Figure 2009020866

他の一種の可能なマッピングも同様に利用することができる。一つの実施形態において、案配は、基本相同、変換関係、変形関係、組成関係及び粉砕関係の順序によって行う。結果は、表3に表示される。
Figure 2009020866
デコーディング・キャラクター“C”、“D”、“H”、“K”及び“X”の可能なマッピング関係によって、表3の中のエンコーディング列の組合は、72種の選択を提供する。正式なエンコーディング・キャラクターに対して操作を行う操作符号をいずれに選択することができる。例えば、鏡像操作を代表する操作符号は、8又は0を選択することができ、回転操作を操作符号は、6又は9を選択することができ、粉砕操作を代表する操作符号は、他の何れの数字を選択することができる。一つの実施形態において、数字“8”は、二つの互いに鏡像である“o”みたいだから、鏡像操作を代表する操作符号に選択され、数字“6”は、一つの車輪みたいだから、回転操作を代表する操作符号に選択され、数字“4”は、刺みたいだから、粉砕操作を代表する操作符号に選択される。対応的に、最終のマッピング関係は、表4に示すようだ。
Figure 2009020866

エンコーディング・キャラクターとデコーディング・キャラクターとの間のマッピング関係は、表4に示す情況以外の案配を備えることができる。しかし、前記案配は、あらゆる受けることができる可能なマッピングを列挙すること、操作符号及び少なくとも一種の形状に基づくマッピング分値を決めること、入力列の多義を除去するために必要とする保存辞書の大きさ、デコーディング列の多義長さ分布、楽観タイミング・シーケンス多義解消の命中率、言語学タイミング・シーケンス多義解消の命中率、楽観タイミング・シーケンス多義解消と言語学タイミング・シーケンス多義解消を共同に使う命中率、デコーディング列周波数による命中率分布、一階統計計算から得た字母毎が必要とするボタン・プッシュ数、自然言語レパートリーの最適化及びタイミング・シーケンス多義測量の標準のような各項目から決まる。列挙したあらゆる受けることができる組合に対して、上述のある特定標準によって計算してウエイング分値を得て自動的に選択するか、又は上述の標準を満足することができると、手動的に選択してもいい。
形状に基づくマッピングとタイミング・シーケンス多義エンコーディング規則は、文字入力システムで独立に又は共同に働くことができる。
図7は、本発明の実施形態に係わるタイミング・シーケンス多義を解消するフローチャートである。図8は、本発明の実施形態に係わる文字入力システムの構造を示すブロック図である。図7と図8を参照すると、ユーザー800は、キーボード802をスタートすることにより、一つの入力列を入力する。入力列分割装置803は、入力列を文字入力820と制御入力822に分ける。制御入力822は、入力制御モジュール809に出力され、文字入力820は、タイミング・シーケンス多義片段化モジュール804に送信される。タイミング・シーケンス多義を解消する操作は、ステップ701から始め、この時、文字入力820は、タイミング・シーケンス多義片段化モジュール804に送信される。文字入力820は、タイミング・シーケンス多義片段化モジュール804の処理によって、タイミング・シーケンス片段化列821を生成する(ステップ703)。ステップ705において、タイミング・シーケンス片段化列821の片段毎は、“pre”キャラクター(前の片段の最後のキャラクター)及び“post”
キャラクター(後の片段の第一のキャラクター)を利用して処理を行う。ステップ707において、もし処理を必要とする片段がまだあると、言語周波数モジュール805に保存している統計結果を利用し、楽観多義解消モジュール806を介して目前の片段を処理する(ステップ709)。
ステップ711において、ステップ709の結果によって計算して得た言語学分値が予定値Q2より大きければ、多義がない入力列が受けられ、且つステップ720でデコーディングする。反すると、言語学タイミング・シーケンス多義解消モジュール807をスタートして、多義がない好ましい入力列を選択する(ステップ713)。前記タイミング・シーケンス多義片段から生成するあらゆる多義がない入力列は、ステップ722でリンクされてプレビュー結果824を生成し、且つ出力制御モジュール809によって表示装置801に出力する。あらゆる片段を処理終わって、且つ操作流れがステップ707からステップ715に分枝すると、入力列の言語学分値は、ステップ715で計算する。ステップ715の結果が他の予定値Q1より小さければ、プレビューを受けることができないと仮定し、出力制御モジュール809から辞書モジュール808にプレビュー検索823を出力して辞書検索を行うことにより、更に好ましいプレビュー結果を尋ねる(ステップ719)。反すると、ステップ717において、ユーザーがあるオプションを請求したかどうかを検査する。このような請求がなければ、ユーザーに目前のプレビュー結果を受けるように暗示し、反すると辞書検索をスタートする(ステップ719)。辞書検索を行ってから、その中の一つのマッチング結果は、ステップ724のプレビュー結果を代わることに用いられ、ステップ726において、ユーザーは、“*”のような特殊機能キーを利用して、需要する単語を選択し且つ確認することができる。
他の実施形態において、出力制御モジュール809は、入力列分割装置803甚だキーボード802にカップリングすることができ、直接に文字入力820及び制御入力822を受信する。受信した文字入力820及び制御入力822を辞書モジュール808に送信することができ、マッチングするエンコーディング列を検索して対応するデコーディング列を出力する。
本発明のモジュールは、客様端―サーバー(C/S)のモードに設置されることができ、即ち通信通路によって上述のカップリング又は接続を行い、且つ予定の通信協定によって情報を伝送する。これらの情報が入力のモジュールとして存在する必要があるかどうかによって、タイミング・シーケンス多義片段化モジュールは、同時に客様端及びサーバーにこピーされることができる。タイミング・シーケンス多義片段化モジュールの出力は、好ましい実施形態のように直接に消費モジュールに導引されるか又は滝(waterfall)方式で出力することができる。本発明のキーボードは、ユーザーの接触動作に応答する複数のキーを備える。前記キーは、ユーザーが引き起こす光、聴力、触覚、味覚及び気味の中の一つの物理量の変化に応答する。本発明のキーボードは、何れのキーボード・キャラクター列の出力であることができる。表示装置は、視覚、聴覚、触覚、味覚又は嗅覚の表示装置から選択する。
図7に示すように、好ましい実施形態において、あらゆるタイミング・シーケンス多義解消方法を使ったことがあるが、これらの方法の各種の組合も同様に使用可能である。極端の状況で、“NO”分枝707を終了状態に指向すると、辞書検索作動を完全に見落とすことができる。
図9A―図9Gは、本発明の実施形態において、入力を表示し且つ辞書検索を使って“WORK”の多義を除去する過程を示す図である。本実施形態が採用するエンコーディング規則(エンコーディング列とデコーディング列との間のマッピング関係である)は、図6に示すようである。図9Aにおいて、ユーザーが入力列の第一個エンコーディング・キャラクター“3”を入力すると、図6によって、出力装置は、“E”の中間形態を表示する。続いて図9Bに示すように、ユーザーが入力列の第二個エンコーディング・キャラクター“6”を入力すると、出力装置は、元に“E”の中間形態を表示する地方に“W”の中間形態を表示する。図4のエンコーディング規則によって、入力列“36”は、二つのデコーディング・キャラクター“EG”にデコーディングされて、“W”
にデコーディングされない。本実施形態において、又楽観タイミング・シーケンス多義解消を行うため、多義がある時、最長のエンコーディング列を優先に選択する。対応的に、2グラム・キャラクター・エンコーディング列“36”を有するデコーディング・キャラクター“W”は、キャラクター毎に1グラム・エンコーディング列を有するデコーディング・キャラクター“EG”に比べて、更に好ましい選択である。
図9Cに示すように、ユーザーが続いてエンコーディング列の第三個エンコーディング・キャラクター“0”
を入力すると、入力列“60”に対応するエンコーディング列がないから、エンコーディング・キャラクター“0”は、前記入力列の他の片段である。対応的に、出力装置は、“O”の中間形態を表示する。ユーザーが続いてエンコーディング列の第四個エンコーディング・キャラクター“9”
を入力すると、入力列“09”に対応するエンコーディング列がないから、このエンコーディング・キャラクターも同様に一つの片段だと認められる。対応的に、図9Dに示すように、デコーディング・キャラクター“R”がエンコーディング・キャラクター“9”からなるエンコーディング列に対応するため、出力装置は、デコーディング・キャラクター“R”の中間形態を表示する。
ユーザーが第五個のエンコーディング・キャラクター“8”を入力すると、図9Eに示すように、2グラム・エンコーディング列“98”がデコーディング・キャラクター“P”に対応するため、楽観タイミング・シーケンス多義解消によって、“P”は、更に好ましい選択だから、元の“R”の中間形態は、“P”の中間形態に変換される。ユーザーが続いて第六個のキャラクター“4”
を入力すると、図9Fに示すように、デコーディング・キャラクター“R”がエンコーディング・キャラクター“4”を入力する前に決めたから、エンコーディング列“984”は、“98:4”に分割され、出力装置は、デコーディング・キャラクター“A”の中間形態を表示する。このような状態で、失敗のプレビュー結果“WOPA”を表示する。この場合、ユーザーは、一つのエンコーディング・キャラクター“*”を入力することにより、辞書検索を使って誤りを正す。辞書検索は、出力装置にエンコーディング列“360984”に対応するマッチング・デコーディング列“WORK”の中間形態を表示させる。
“*”を連続に入力すると、続いて他のあらゆるマッチング結果を列挙する。このような状況で、ただ一つの単語を選択することができるため、必要とする単語を速く確認することができる。
しかし、間違ったプレビュー結果は、他の方式で正すことができる。例えば、図9E、9H及び9Iに示すデリミット制御である。上述のように、出力装置は、ユーザーが入力したエンコーディング・キャラクターからなるエンコーディング列“360984”に対してタイミング・シーケンス多義解消を行ってから、エンコーディング列“WOP”の中間形態を表示する。
ユーザーが一旦誤ったプレビューを発見したら、“#”のような特殊機能キーを提供して、デリミターとする。本実施形態において、ユーザーは、エンコーディング列“##”を入力して、これをデリミット制御エンコーディング列とする。対応的に、ユーザーが列“36098”を入力してからエンコーディング列“##”を入力する時、図8に示すように、デリミット制御エンコーディング列“##”は、制御入力に分割される。だから、出力制御モジュール809は、楽観タイミング・シーケンス多義解消モジュール806及び/又は言語学タイミング・シーケンス多義解消モジュール807に請求を送信して、エンコーディング片段“98”を新しい解釈“9:8”に改変する。図9Hに示すように、出力装置は、デコーディング・キャラクター“P”の中間形態を表示する位置にデコーディング・キャラクター“R”
の中間形態を表示する。エンコーディング・キャラクター“4”は、エンコーディング・キャラクター“##”の後に入力するため、エンコーディング・キャラクター“4”とエンコーディング・キャラクター“8”が組合せて、文字入力“84”として、且つ最終に“K”にデコーディングされる。だから図9Iに示すように、最終にデコーディング・キャラクター“K”の中間形態を表示する。
伝統のプレビュー入力法において、オプションに対する確認は、ユーザーが選択しなければならなく、又は情報に多種の多義があって読み難い。又、入力過程のタイプ作動は、回復することができなく、且つ全然読めない消息を招くかも知らない。とにかくフィードバックがないタイプ作動は、応用価値がない。本発明は、頭脳記憶で対照表を代わるため、フィードバックがないタイプに応用することができる。且つタイムアウトを待つか又はタイムアウト情報で前後の入力文字列を区分する必要がない。又、選択可能単語は、視覚表示の方式で矯正することができるため、入力する時に延期フィードバック・タイプ方式を採用することができ、ユーザーは、先ず必要がないプレビュー・キャラクターを受けてからこれを手動的に矯正する。極端状況では、あらゆる入力がプレビュー及び後期確認の作動を必要としない。
以上本発明を実施例に基づいて具体的に説明したが、本発明は、上述の実施例に限定されるものではなく、その要旨を逸脱しない範囲において、種種変更可能であることは勿論であって、本発明の保護範囲は、以下の特許請求の範囲から決まる。
従来の通用キーボードの構造を示す図である。 空間多義マッピング関係を示す図である。 本発明の実施形態に係わる装置の回路ブロック図である。 本発明の実施形態に係わる部分エンコーディング規則を示す図である。 本発明の実施形態において、“HOME”を入力する時に産生するタイミング・シーケンス多義をデモンストレーションする。 本発明の実施形態に係わるエンコーディング・キャラクター列とデコーディング・キャラクター列のマッピング規則を示す図である。 本発明の実施形態に係わる言語学を採用してタイミング・シーケンス多義を解消するフローチャートである。 本発明の実施形態に係わる言語学2グラム統計(2−gram statistics)模型を採用して、言語学権値を計算するフローチャートである。 本発明の実施形態に係わる中間形態を有する形状に基づくマッピング関係図である。 本発明の実施形態に係わるタイミング・シーケンス多義を解消するフローチャートである。 本発明の実施形態に係わる文字入力システムの構造を示すブロック図である。 本発明の実施形態に係わる入力を表示し且つ辞書検索を使って“WORK”の多義を除去する過程を示す図である。
符号の説明
20 デコーディング装置
200 キーボード
230 デコーダー
232 マッピング
250 出力装置
302 “E”
303 “B”
308 入力列
309 片段列
312 “3”
313 “8”
316、320 片段
317、318 キャラクター
320 列“38”
402 デコーディング・キャラクター
403、404、405 キー
600 キーボード字母表
601 英文字母表
602 中間形状
604 粉砕操作
800 ユーザー
801 表示装置
802 キーボード
803 入力列分割装置
804 タイミング・シーケンス多義片段化モジュール
805 言語周波数モジュール
806 楽観多義解消モジュール
807 言語学タイミング・シーケンス多義解消モジュール
808 辞書モジュール
809 入力制御モジュール
820 文字入力
821 タイミング・シーケンス片段化列
822 制御入力
823 プレビュー検索
824 プレビュー結果

Claims (28)

  1. 複数のエンコーディング列を複数のデコーディング列にマッピングすることに用いられ、エンコーディング列毎は、エンコーディング・キャラクター・レパートリーから選択される少なくとも一つのキャラクターを備え、デコーディング列毎は、非表音文字言語に使われるデコーディング・キャラクター・レパートリーから選択される少なくとも一つのデコーディング・キャラクターを備えるデコーディング方法であって、
    入力するエンコーディング・キャラクターを受信するステップと、
    入力したエンコーディング・キャラクターを一つの入力列の末尾に組合せるステップと、
    を備え、前記入力列にタイミング・シーケンス多義があるため、前記入力列は、少なくとも二つの異なるエンコーディング列組合に解析されることができ、且つエンコーディング列組合毎は、前記エンコーディング列の中の少なくとも一つを備えることを特徴とするデコーディング方法。
  2. 一つの辞書をマッチングすることにより前記入力列を解析し、前記辞書は、前記エンコーディング列と前記デコーディング列との間の受けることができる関連を備えることを特徴とする請求項1に記載のデコーディング方法。
  3. 前記入力列を解析する時に言語学模型を採用することを特徴とする請求項1に記載のデコーディング方法。
  4. 前記言語学模型は、前記エンコーディング列組合に対して、言語学分値計算を行うことを特徴とする請求項3に記載のデコーディング方法。
  5. 前記入力列を解析する時に啓発式言語学模型を採用して、言語学分値計算をただ一部分のエンコーディング列に応用させることを特徴とする請求項1に記載のデコーディング方法。
  6. 前記啓発式言語学模型は、貪欲原則を採用して、前記エンコーディング列組合の最長のマッチングを取って、前記エンコーディング列のマッピングとすることを特徴とする請求項5に記載のデコーディング方法。
  7. 決定ステップを更に備え、前記入力列の最後の二つのキャラクターが前記マッピングにおいて何れのエンコーディング列の一部分ではない時、前記入力列における入力するエンコーディング・キャラクターの前に位置するエンコーディング・キャラクターを一つの片断列に組成することを特徴とする請求項1に記載のデコーディング方法。
  8. エンコーディング・キャラクター・レパートリーから選択される少なくとも一つのキャラクターを備える入力列を入力することに用いられるキーボードと、
    一つの出力列を選択的に出力することに用いられ、前記出力列は、デコーディング・キャラクター・レパートリーから選択される少なくとも一つのデコーディング・キャラクターを備え、前記出力列は、前記入力列に基づいて生成する出力装置と、
    複数のエンコーディング列を複数のデコーディング列にマッピングするマッピングを備え、エンコーディング列毎は、前記エンコーディング・キャラクター・レパートリーから選択される少なくとも一つのエンコーディング・キャラクターを備え、デコーディング列毎は、前記デコーディング・キャラクター・レパートリーから選択される少なくとも一つのデコーディング・キャラクターを備え、前記マッピングは、前記入力列の少なくとも一部分によって、前記入力列を前記出力列にマッピングすることに用いられるデコーディング装置と、
    を備え、前記キーボードを介して一つのエンコーディング・キャラクターを入力する時、前記デコーディング装置は、入力したエンコーディング・キャラクターを前記入力列の末尾に組合せ、前記入力列にタイミング・シーケンス多義があるため、前記入力列は、少なくとも二つの異なるエンコーディング列組合に解析されることができることを特徴とする装置。
  9. 前記デコーディング装置は、前記キーボードにカップリングし、前記入力列を受信し、且つ前記入力列を一つの文字入力及び一つの制御入力に分割することに用いられる入力列分割装置を更に備えることを特徴とする請求項8に記載の装置。
  10. 前記マッピングは、
    前記入力列分割装置にカップリングして前記文字入力を受信し、且つ前記文字入力の最後の二つのキャラクターが何れのエンコーディング列の一部分を構成しない時、タイミング・シーケンス片段化列を生成するタイミング・シーケンス多義片段化モジュールと、
    複数の統計を保存することに用いられる言語学周波数モジュールと、
    前記タイミング・シーケンス多義片段化モジュールと前記言語学周波数モジュールにカップリングして、これらの統計によって前記タイミング・シーケンス片段化列の中の片段毎のエンコーディング列組合の分値を計算することに用いられ、前記分値は、前記デコーディング列のプレビュー結果を決めることに用いられる言語学タイミング・シーケンス多義解消モジュールと、
    を備えることを特徴とする請求項9に記載の装置。
  11. 前記デコーディング装置は、前記言語学タイミング・シーケンス多義解消モジュールにカップリングして、デコーディング列を受信してから前記出力装置に出力し、又前記タイミング・シーケンス多義片段化モジュールにカップリングして、前記タイミング・シーケンス片段化列を受信することに用いられる出力制御モジュールを更に備えることを特徴とする請求項10に記載の装置。
  12. 前記マッピングは、前記出力制御モジュールにカップリングして、前記タイミング・シーケンス片段化列を受信し、且つ一つの辞書から前記タイミング・シーケンス片段化列に対応するデコーディング列を尋ねることに用いられる辞書モジュールを更に備えることを特徴とする請求項11に記載の装置。
  13. 前記マッピングは、前記タイミング・シーケンス多義片段化モジュールと前記言語学周波数モジュールにカップリングして、これらの統計によって前記タイミング・シーケンス片段化列の中の片段毎のエンコーディング列組合毎の分値を計算することに用いられ、前記分値計算は、ただ一部分のエンコーディング列組合に適用する楽観タイミング・シーケンス多義解消モジュールを更に備えることを特徴とする請求項10に記載の装置。
  14. 前記マッピングは、
    前記入力列分割装置にカップリングして前記文字入力を受信し、且つ前記入力列の最後の二つのキャラクターが何れのエンコーディング列の一部分を構成しない時、タイミング・シーケンス片段化列を生成するタイミング・シーケンス多義片段化モジュールと、
    複数の統計を保存することに用いられる言語学周波数モジュールと、
    前記タイミング・シーケンス多義片段化モジュールと前記言語学周波数モジュールにカップリングして、前記タイミング・シーケンス片段化列の中の片段毎のエンコーディング列組合毎の分値を計算することに用いられ、前記分値計算は、ただ一部分のエンコーディング列組合に適用する楽観タイミング・シーケンス多義解消モジュールと、
    を備えることを特徴とする請求項9に記載の装置。
  15. 前記マッピングは、前記入力列分割装置にカップリングして、前記文字入力と前記制御入力を受信することに用いられる出力装置を備えることを特徴とする請求項9に記載の装置。
  16. 前記マッピングは、前記出力制御モジュールにカップリングして、前記文字入力を受信し、且つ一つの辞書から前記文字入力に対応するデコーディング列を検索することに用いられる辞書モジュールを更に備えることを特徴とする請求項15に記載の装置。
  17. 複数のエンコーディング列を複数のデコーディング列にマッピングする一つのマッピングを維持し、エンコーディング列毎は、エンコーディング・キャラクター・レパートリーから選択される少なくとも一つのエンコーディング・キャラクターを備え、デコーディング列毎は、非表音文字言語に使用されるデコーディング・キャラクター・レパートリーから選択される少なくとも一つのデコーディング・キャラクターを備えるステップと、
    一つ又は複数のエンコーディング・キャラクターを受信して一つの入力列に組合せるステップと、
    もし前記入力列の長さが1より大きければ、複数のエンコーディング列組合を生成するステップと、前記エンコーディング列組合の中の一つを選択するステップと、
    前記マッピングによって、選択したエンコーディング列組合を一つの出力列にマッピングするステップと、
    前記出力列を出力するステップと、
    を備えることを特徴とするデコーディング方法。
  18. 前記マッピングの一部分は、前記エンコーディング列と前記デコーディング列との間の可能な関連を備える辞書とすることを特徴とする請求項17に記載のデコーディング方法。
  19. これらのエンコーディング列組合の中の一つを選択するステップを繰り返すことにより複数のエンコーディング列を選択して、前記マッピングによって、選択されたこれらのエンコーディング列組合を複数の出力列に対応させることを特徴とする請求項17に記載のデコーディング方法。
  20. 前記出力列が選択的に出力され、且つ既定の文献に出現する周波数の順序によって配列することを特徴とする請求項19に記載のデコーディング方法。
  21. 前記出力列が選択的に出力され、且つ言語学分値の高低順序によって配列することを特徴とする請求項19に記載のデコーディング方法。
  22. その中の一つのエンコーディング列を選択することは、言語学模型から決まることを特徴とする請求項17に記載のデコーディング方法。
  23. 前記言語学模型は、前記エンコーディング列組合に対して言語学分値の計算を行うことを特徴とする請求項22に記載のデコーディング方法。
  24. その中の一つのエンコーディング列を選択することは、啓発式言語学模型から決まって、前記言語学分値計算をただ一部分のエンコーディング列に応用させることを特徴とする請求項17に記載のデコーディング方法。
  25. 前記啓発式言語学模型は、貪欲原則を採用して、前記エンコーディング列組合の中の最長のマッチングを取って、前記エンコーディング列のマッピングとすることを特徴とする請求項24に記載のデコーディング方法。
  26. 前記マッピングの一部分をエンコーディング規則として、前記エンコーディング規則は、前記エンコーディング列を前記デコーディング列にマッピングすることを特徴とする請求項17に記載のデコーディング方法。
  27. その中の一つのエンコーディング片段を選択する前の一つの片断化ステップを更に備え、前記片断化ステップは、前記エンコーディング規則によって、前記入力列から少なくとも一つの片段化列を生成し、前記片段化列によって、これらのエンコーディング列組合の中の一つを選択することを特徴とする請求項26に記載のデコーディング方法。
  28. 前記片段化ステップは、
    前記入力列の始めから始まるステップと、
    目前のキャラクターと目前のキャラクターの次のキャラクターからなる長さが2である文字列を形成するステップと、
    前記文字列が前記エンコーディング規則にあるかどうかを検証するステップと、
    もし前記文字列が前記エンコーディング規則にあると、目前のキャラクターを累積して、且つ次のキャラクターの上で第二及び第三のステップを行うステップと、
    もし前記文字列が前記エンコーディング規則になければ、累積したキャラクターを目前のキャラクターにリンクして、前記片段化列を生成し、且つ次のキャラクターから前記片段化ステップを再び行うステップと、
    を備えることを特徴とする請求項27に記載のデコーディング方法。
JP2008119279A 2007-04-30 2008-04-30 タイミング・シーケンス多義エンコーディングを採用するデコーディング方法とその装置 Pending JP2009020866A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US91476007P 2007-04-30 2007-04-30
US12/110,425 US7646317B2 (en) 2007-04-30 2008-04-28 Decoding method utilizing temporally ambiguous code and apparatus using the same

Publications (1)

Publication Number Publication Date
JP2009020866A true JP2009020866A (ja) 2009-01-29

Family

ID=39886303

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008119279A Pending JP2009020866A (ja) 2007-04-30 2008-04-30 タイミング・シーケンス多義エンコーディングを採用するデコーディング方法とその装置

Country Status (6)

Country Link
US (2) US20080266144A1 (ja)
EP (1) EP2142978A4 (ja)
JP (1) JP2009020866A (ja)
CN (1) CN101720457A (ja)
TW (1) TW200844798A (ja)
WO (2) WO2008134940A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
USRE43082E1 (en) * 1998-12-10 2012-01-10 Eatoni Ergonomics, Inc. Touch-typable devices based on ambiguous codes and methods to design such devices
WO2009122675A1 (ja) * 2008-03-31 2009-10-08 パナソニック株式会社 可変長符号復号化装置及びその方法
US20100122213A1 (en) * 2008-11-07 2010-05-13 Jen-Te Chen Method for assignment of shortcut key combinations utilizing numerical-shape association
TWI384377B (zh) * 2008-12-04 2013-02-01 Ind Tech Res Inst 資料編碼及解碼方法
US8583421B2 (en) * 2009-03-06 2013-11-12 Motorola Mobility Llc Method and apparatus for psychomotor and psycholinguistic prediction on touch based device
US8116338B2 (en) * 2009-05-14 2012-02-14 International Business Machines Corporation Method for reducing errors while transferring tokens to and from people
TWI476606B (zh) * 2009-06-30 2015-03-11 Alibaba Group Holding Ltd A Method and System of Partition Selection for Word - free Text Markers
US8487877B2 (en) * 2010-06-10 2013-07-16 Michael William Murphy Character specification system and method that uses a limited number of selection keys
US9087038B1 (en) * 2010-07-21 2015-07-21 Sprint Communications Company L.P. Messaging with shortcut character strings
US20120280925A1 (en) * 2011-05-03 2012-11-08 Htc Corporation Handheld Electronic Device and Method for Calibrating Input of Webpage Address
US9594831B2 (en) 2012-06-22 2017-03-14 Microsoft Technology Licensing, Llc Targeted disambiguation of named entities
US9959340B2 (en) * 2012-06-29 2018-05-01 Microsoft Technology Licensing, Llc Semantic lexicon-based input method editor
US11139827B2 (en) 2019-03-15 2021-10-05 Samsung Electronics Co., Ltd. Conditional transcoding for encoded data
TWI825305B (zh) * 2019-04-16 2023-12-11 南韓商三星電子股份有限公司 轉換編碼器及進行轉換編碼的方法及製品

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005332235A (ja) * 2004-05-20 2005-12-02 Mitsubishi Electric Corp 日本語入力変換方法および日本語入力変換装置

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1408633A (en) 1971-09-08 1975-10-01 Terracina V Typewriting machine
US4173753A (en) 1977-09-22 1979-11-06 Hsu Ching Chou Input system for sino-computer
GB2195040B (en) * 1986-08-11 1990-07-25 Chark Huen Au Input systems and keyboards for ideographic characters
US4877405A (en) 1986-09-24 1989-10-31 Stewart Mark R System of modules for composing alphanumerics
US5307267A (en) 1990-03-27 1994-04-26 Yang Gong M Method and keyboard for input of characters via use of specified shapes and patterns
US5305207A (en) 1993-03-09 1994-04-19 Chiu Jen Hwa Graphic language character processing and retrieving method
US5790055A (en) 1994-09-22 1998-08-04 Yu; Cho Jen Method for encoding chinese and japanese ideographic characters for computer entry, retrieval and processing
US5952942A (en) * 1996-11-21 1999-09-14 Motorola, Inc. Method and device for input of text messages from a keypad
US5982303A (en) 1997-02-03 1999-11-09 Smith; Jeffrey Method for entering alpha-numeric data
USRE43082E1 (en) * 1998-12-10 2012-01-10 Eatoni Ergonomics, Inc. Touch-typable devices based on ambiguous codes and methods to design such devices
US6362752B1 (en) 1998-12-23 2002-03-26 Motorola, Inc. Keypad with strokes assigned to key for ideographic text input
US6874960B2 (en) 1999-06-09 2005-04-05 Deeb Daoud Keyboard
US6766179B1 (en) 1999-10-04 2004-07-20 Koninklijke Philips Electronics N.V. Cross-shape layout of chinese stroke labels with lyric
WO2001074133A2 (en) 2000-03-31 2001-10-11 Ventris, Inc. Method and apparatus for input of alphanumeric text data from twelve key keyboards
CN1121004C (zh) 2000-12-21 2003-09-10 国际商业机器公司 用于小键盘的汉字输入方法
CN1309345A (zh) * 2001-02-19 2001-08-22 陆建钢 数字键盘的输入编码方法
US6753794B1 (en) 2001-05-16 2004-06-22 Scott Adams Character entry using numeric keypad
US6765556B2 (en) * 2001-11-16 2004-07-20 International Business Machines Corporation Two-key input per character text entry apparatus and method
KR100605929B1 (ko) 2003-09-25 2006-08-01 삼성전자주식회사 영문자 입력장치 및 그의 영문자 인식방법
US20050248527A1 (en) * 2004-05-07 2005-11-10 Research In Motion Limited Symbol views
CN100440110C (zh) * 2004-08-02 2008-12-03 鲁川 易通华文输入法
CN1779607A (zh) * 2004-11-18 2006-05-31 黄金富 一种英文输入方法
CN100416471C (zh) * 2005-03-08 2008-09-03 张一昉 一种小键盘上西语输入中的歧义处理与人机交互方法
US7649478B1 (en) * 2005-11-03 2010-01-19 Hyoungsoo Yoon Data entry using sequential keystrokes

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005332235A (ja) * 2004-05-20 2005-12-02 Mitsubishi Electric Corp 日本語入力変換方法および日本語入力変換装置

Also Published As

Publication number Publication date
US20080266144A1 (en) 2008-10-30
CN101720457A (zh) 2010-06-02
WO2008134940A1 (en) 2008-11-13
US20080266148A1 (en) 2008-10-30
EP2142978A4 (en) 2013-11-20
EP2142978A1 (en) 2010-01-13
WO2008134941A1 (en) 2008-11-13
TW200844798A (en) 2008-11-16
US7646317B2 (en) 2010-01-12

Similar Documents

Publication Publication Date Title
JP2009020866A (ja) タイミング・シーケンス多義エンコーディングを採用するデコーディング方法とその装置
CN101943952B (zh) 一种至少两种语言混合输入的方法和输入法系统
CN100549915C (zh) 去多义性语音输入系统和方法
CN1618173B (zh) 多义性文字输入的明确字符过滤
CN102449579B (zh) 一体式中文字输入方法
US9904672B2 (en) Machine-translation based corrections
CN102262683B (zh) 一种汉字输入方法
JP2006216044A (ja) 辞書学習方法、その利用する装置、及び入力方法とその方法を利用するユーザ端末装置
JP2001517823A (ja) 減少されたキーボード明瞭化システム
JP7106802B2 (ja) リソースソート方法、ソートモデルをトレーニングする方法及び対応する装置
KR102521586B1 (ko) 텍스트 핵심정보 추출방법, 장치, 전자기기 및 기록매체
CN1095560C (zh) 修改汉字转换结果的系统
CN101551710A (zh) 一种维吾尔语输入系统及输入方法
JP2007156545A (ja) 記号列変換方法、単語翻訳方法、その装置およびそのプログラム並びに記録媒体
CN100437441C (zh) 用于输入中文汉字短语的方法和设备
SG181142A1 (en) Five strokes input system and method
WO2012015021A1 (en) Stroke and structure input method and system
US20110109559A1 (en) Computer input system and input method thereof
CN1510554B (zh) 一种可嵌入应用的汉字输入法
CN101114196B (zh) 输入中文短语的方法和设备
CN104850242B (zh) 一种汉字拼音输入法及利用该输入法编码汉字的方法
CN102314420A (zh) 翻译修正系统及其修正方法
CN112733556A (zh) 同步交互式翻译方法及装置、存储介质、计算机设备
CN101122821A (zh) 一种用于数字键盘上的连句输入的词语切分系统
CN1466039A (zh) 可以进行中文和多种文字输入的电子遥控器

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101102

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110329