JPH0896085A - 文字認識文字補完方法及びコンピュータ・システム - Google Patents

文字認識文字補完方法及びコンピュータ・システム

Info

Publication number
JPH0896085A
JPH0896085A JP6227559A JP22755994A JPH0896085A JP H0896085 A JPH0896085 A JP H0896085A JP 6227559 A JP6227559 A JP 6227559A JP 22755994 A JP22755994 A JP 22755994A JP H0896085 A JPH0896085 A JP H0896085A
Authority
JP
Japan
Prior art keywords
character string
predicted
character
node
display device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6227559A
Other languages
English (en)
Other versions
JP2741575B2 (ja
Inventor
Hiroshi Nozaki
広志 野崎
Nobuyasu Ito
伸泰 伊東
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
IBM Japan Ltd
Original Assignee
IBM Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by IBM Japan Ltd filed Critical IBM Japan Ltd
Priority to JP6227559A priority Critical patent/JP2741575B2/ja
Priority to US08/495,725 priority patent/US5835635A/en
Publication of JPH0896085A publication Critical patent/JPH0896085A/ja
Application granted granted Critical
Publication of JP2741575B2 publication Critical patent/JP2741575B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • G06V30/268Lexical context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 部分文字列を入力した際に必要な文字を効果
的に補完すること。 【構成】各ノードに各文字を対応させ、ルートから各ノ
ードまでで表す文字列の生起確率を各ノードに記憶した
木構造辞書を用い、入力された文字パターンより、読取
候補文字列を生成するステップと、木構造辞書におい
て、生成された読取候補文字列に対応するノードの次の
ノードを取り出し、読取候補文字列と次のノードに対応
する文字を連結した予測文字列及びその確からしさを表
すデータを生成するステップと、予測文字列の数をカウ
ントするステップと、予測文字列の数がユーザに提示可
能な最大数以上の場合には、確からしさを表すデータの
大きい順に予測文字列を表示するステップと、提示可能
な最大数未満の場合には、確からしさを表すデータを含
む参照データを参照して、辞書のどのノードまでを提示
するかを判断し、そのノードまでの文字列を表示するス
テップとを含む。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字認識に関し、特に
文字認識機能と文字補完機能を合わせ持つ装置及び方法
に関する。
【0002】
【従来の技術】コンピュータを携帯して使用すること
や、ペン入力による操作の容易化といった要求に対応し
て、小型でタブレットを有するコンピュータが開発され
てきている。このようなタブレット付きコンピュータに
は、ペンによる入力をそのまま表示、記憶する使用形態
の他、文字を入力する際には、所定のスペースに文字を
書き込みコンピュータに文字を認識させるオンライン文
字認識という使用形態がある。このオンライン文字認識
は、主として認識率の問題からあまり用いられていな
い。しかし、あまり用いられていない原因はこれだけで
なく、この技術を十分活用した入力技術が確立されてい
ないことも原因の1つである。
【0003】すなわち、このようなタブレット付きコン
ピュータにおいてデータを入力する場合、数字だけなら
ば仮想キーボードでタップする方法があり、単語を入力
する場合においても少数の単語集合に分類できるならば
メニュー方式にて十分である。よって、オンライン文字
認識技術を用いて入力するのは、分類してメニューに収
まる程度の部分集合にできないような大量の単語のいず
れかを入力する場合にほぼ限られる。
【0004】このような状況のもと、認識の問題を考え
つつ、入力効率を高めるには、筆記者がすべての文字を
記入するのではなく、部分文字列を筆記すると残りを補
完して提示するような機能が有用である。
【0005】この補完機能を用いている例としては、キ
ーボード入力においてエディタ、シェルの例がある。R.
Stallman,GNU Emacs Manual,1987、Joy,An Introductio
n tothe C shell, 4.3BSD manual.を参照のこと。これ
らの例の場合、ファイル名やシェル変数の補完が目的で
あるため、該当する単語が複数存在する場合、入力され
た部分文字列に該当する単語をリスト形式で表示すると
いう簡単な形式が採用されている。このようにしても、
この例では入力済みの部分列にあいまい度はなく、対象
となる単語は、極端な場合を除き、たかだか数百である
ため、補完を行った候補単語は十分短いリストで表示で
きるので、問題ない。しかし、対象となる単語数が著し
く多くなる場合には、入力に対して可能性のある文字列
をすべて提示するのでは実用的でない。また、単語数が
多い場合出現頻度順に表示する方法もあるが、一目で認
識される単語以外を入力しようとする場合には、繁雑な
スクロールを行うことになる。
【0006】候補単語を提示する例としては特公平5−
50786号があるが、ここでは筆記者はすべての文字
を入力して、その識別の候補をその候補の確からしさと
ともに提供する方法が記載されている。しかし、文字の
認識の候補に加え、文字補完をおこなうことは何等記載
されていない。
【0007】また、ある文字に対する連鎖頻度を辞書に
記憶しておき、その連鎖頻度を参照しつつ認識文字の候
補順を変更していく方法が特開平5−189621号に
記載されている。しかし、部分文字列から文字補完をも
行うということは何等記載されていない。
【0008】
【発明が解決しようとする課題】そこで本発明の目的
は、オンライン文字認識において文字入力の効率を高め
ることである。
【0009】また、部分文字列を入力した際に必要な文
字を効果的に補完することも目的である。
【0010】
【課題を解決するための手段】上述の目的を達成するた
め、本発明は以下のような構成を有する。すなわち、各
ノードに各文字を対応させ、ルートから各ノードまでで
表す文字列の生起確率を各ノードに記憶した木構造辞書
と、文字を入力する座標入力装置と、表示装置とを有す
るコンピュータ・システムにおいて、(a)座標入力装
置に入力された文字パターンより、読取候補文字列を生
成するステップと、(b)木構造辞書において、生成さ
れた読取候補文字列に対応するノードの次のノードを取
り出し、読取候補文字列と次のノードに対応する文字を
連結した予測文字列及びその確からしさを表すデータを
生成するステップと、(c)予測文字列の数をカウント
するステップと、(d)予測文字列の数がユーザに提示
可能な最大数N以上の場合には、確からしさを表すデー
タの大きい順に予測文字列を表示装置に表示するステッ
プと、(e)予測文字列の数がユーザに提示可能な最大
数N未満の場合には、確からしさを表すデータを参照し
て、辞書のどのノードまでを提示するかを判断し、その
ノードまでの文字列を表示装置に表示するステップとを
含む文字認識文字補完方法である。これにより、読取候
補文字列(実施例における左部分列)の次の文字(あわせ
て予測文字列)までユーザに提示するか、またはそれ以
上の文字列(例えば単語)を提示するかを動的変更するこ
とができる。
【0011】ここでステップ(e)は、(f)1の予測
文字列を、辞書を参照して1の予測文字列を含む単語に
展開し、単語の確からしさを表すデータを生成するステ
ップと、(g)単語と他の予測文字列で構成される候補
文字列を、確からしさを表すデータの大きい順に並べ換
えるステップと、(h)ステップ(g)の順番で上位N
+1以降の候補文字列が破棄可能かを判断するステップ
と、(i)ステップ(h)で破棄可能と判断されなかっ
た場合は、予測文字列を表示装置に表示するステップ
と、(j)予測文字列をすべて単語に展開してもステッ
プ(h)で破棄可能とされた場合には、単語を表示装置
に表示するステップとを含んでもよい。これにより、単
語まで提示することができる場合も生じ、ユーザはより
効率的な入力を行うことができる。また、単語を提示す
ることが好ましくない場合にも対応することができる。
【0012】またステップ(e)は、(k)予測文字列
を、辞書を参照して予測文字列を含む単語に展開し、単
語の確からしさを表すデータを生成するステップと、
(l)単語をその確からしさを表すデータの大きい順に
並べ換えるステップと、(m)ステップ(l)の順番で
上位N+1以降の単語が破棄可能かを判断するステップ
と、(n)ステップ(m)で破棄可能と判断されなかっ
た場合は、予測文字列を表示装置に表示するステップ
と、(o)ステップ(m)で破棄可能と判断された場合
には、単語を表示装置に表示するステップとを含んでも
よい。この方法は、単語まで展開する上述の方法を簡便
化した方法である。
【0013】さらにステップ(e)は、(p)1の予測
文字列を、辞書を参照して1の予測文字列を表すノード
から所定数先のノードまでに対応する文字列に展開し、
文字列の確からしさを表すデータを生成するステップ
と、(q)文字列と他の予測文字列で構成される候補文
字列を、確からしさを表すデータの大きい順に並べ換え
るステップと、(r)ステップ(q)の順番で上位N+
1以降の候補文字列が破棄可能かを判断するステップ
と、(s)ステップ(r)で破棄可能と判断されなかっ
た場合は、予測文字列を表示装置に表示するステップ
と、(t)予測文字列をすべて文字列に展開してもステ
ップ(r)で破棄可能とされた場合には、文字列を表示
装置に表示するステップとを含むようにしてもよい。こ
れにより、単語だけでなく、読取候補文字列から複数文
字予測した文字列をユーザに提示することができる。
【0014】またステップ(e)は、(u)予測文字列
を、辞書を参照して予測文字列を表すノードから所定数
先のノードまでに対応する文字列に展開し、文字列の確
からしさを表すデータを生成するステップと、(v)文
字列をその確からしさを表すデータの大きい順に並べ換
えるステップと、(w)ステップ(v)の順番で上位N
+1以降の文字列が破棄可能かを判断するステップと、
(x)ステップ(w)で破棄可能と判断されなかった場
合は、予測文字列を表示装置に表示するステップと、
(y)ステップ(w)で破棄可能と判断された場合に
は、文字列を表示装置に表示するステップとを含んでも
よい。これは、上述の複数文字予測の方法を簡便化した
方法である。
【0015】以上のような方法は、この方法を実施する
装置であっても同様の作用効果を奏する。
【0016】
【実施例】図1に、本発明を実施した装置の一例を示
す。処理装置1は、メイン・メモリ3に接続されてお
り、メイン・メモリ3に格納されたプログラム及びデー
タを用いて演算を行う。入出力装置5は、キーボード、
マウス、プリンタなどを含み、処理装置1等に対する命
令、データを入力し、必要なデータなどを出力する。本
発明は文字入力をペン等で行うため、いわゆる表示装置
とタブレットなどの入力装置とが一体となった座標入力
・表示装置11を有している。この座標入力・表示装置
11の表示機能に対しては、表示制御部9が接続されて
おり、処理装置1と共動する。また、座標入力・表示装
置11の入力機能に対しては、文字入力部7を有してい
る。この文字入力部7は、座標入力・表示装置11から
読み取られた情報を処理装置1に送り、処理装置1にて
入力された文字の同定を行う。ここで、座標入力・表示
装置11は一体のものとして記載されているが、座標入
力装置と表示装置を別個のものとして設置してもよい。
但し、一体とすれば装置全体の小型化を図ることがで
き、携帯性において有利である。また、ペン等の座標指
示装置は、座標入力・表示装置11の方式に依存し、本
発明の要旨ではないので詳細な説明は省略する。記憶装
置13は、メイン・メモリ3等にロードするためのデー
タ等を格納しておくためのハードディスク等の装置であ
る。ここではデータとして、文字補完のために用いる辞
書等がある。
【0017】図1に示した処理装置1のブロック図を図
2に示す。処理装置1は、大きく分けると文字認識部2
1と文字予測部23とに分けられる。文字認識部21
は、文字入力部7より入力された読み取り情報に対応す
る文字を特定する操作を行う。そして、確からしい順に
1以上の候補を選び出す。この操作は、従来行われてい
るものと何等変わることはないので、それ以上述べな
い。
【0018】文字予測部23は、部分文字列を入力され
た場合に、文字認識部21の認識結果を元に次の文字
(複数文字の場合もある)又は単語全体を予測するもので
ある。この場合に、ある文字からある文字に分岐する確
率をそれぞれ求め且つ記憶している辞書を用いる。この
辞書は、単語を共通する左部分列(左文字部分列ともい
う。)により木構造(本発明では、木は左から右に広が
っていく。また、文字も左から右に記載される。但し、
いずれの方向からでも問題ない。)になっており、各ノ
ードは文字に対応する。
【0019】例えば図3に、英語辞書のうちdに関する
部分木の例を示す。この分岐確率付き辞書は、各ノード
に文字、子ノードへのポインタの他に、ルート・ノード
からあるノードへの分岐確率を保持している。分岐確率
は、ある部分木に該当する単語の頻度の総和を求め、そ
れを全単語の生起数で正規化することにより得られる。
すなわち、あるノードの子ノードの分岐確率をすべて加
えると当該ノード自身の分岐確率になる。例えば、左部
分列diを共通して有するdid*,dif*,dis
*,dir*,die*,dic*等(*は、後続の文
字があることを示す。)の生起確率を加えたものが、文
字列diの生起確率、すなわちルート・ノードからdi
への分岐確率(128=58+30+23+7+3+1
+・・・・)となる。この値128は説明のため便宜上
付された数字であり、また辞書全体の文字数にも依存す
るが、一定数で除したものが、正確な分岐確率になる。
なお、ある単語が単語の終端であり、且つさらにそれに
続く別の単語が存在する場合がある。言いかえれば、あ
る単語が別の単語の左部分列になることもある。例え
ば、didはdidacticの左部分列でもあるが、
didで終了することもあるので、これを示すためのノ
ード(図3ではεと示す。)を設定し、そこにdidの
分岐確率を格納する。
【0020】このように文字予測部23は上述した分岐
確率付き辞書を用いるが、図4に示す動作を行う。
【0021】すなわち次のアルゴリズムに従う。座標入
力・表示装置11から文字入力部7を経由して入力され
た読み取り情報から読取候補文字列を認識する(ステッ
プ33)。この結果として通常は複数の文字列が候補と
して認識される。認識された読取候補文字列ごとに、辞
書を検索して読取候補文字列に続き得る文字、及びその
生起確率(分岐確率)を取得する(ステップ35)。こ
こで、認識された読取候補文字列はそれぞれ確からしさ
を有しているので、その読取候補文字列に続き得る文字
まで(以下、予測文字列という。)の確からしさという
ものも認識できる。この予測文字列の確からしさLを求
める(ステップ37)。
【0022】この際、予測文字列の数が候補文字列とし
てユーザに提示される最大数Nより多いか否かを判断す
る(ステップ39)。もし、多い場合にはLが大きい順
にNだけ表示する(ステップ49)。しかし、少ない場
合にはまだ候補をユーザに提示できるので、1文字のみ
ではなくそれ以上予測することができる。ここでは、予
測文字列を単語となるまで、辞書のノードを探索するこ
とにより展開する。そして、その単語をLが大きい順に
ソートする(ステップ41)。そして、N番目までの単
語のLの総和LcとN+1番目以降のLの総和Ldの差が
所定数以上であれば、展開することにより予測された単
語をユーザに提示する(ステップ45)。LcとLdの差
が所定数未満であれば、展開する意味がないので予測文
字列を提示する(ステップ47)。
【0023】以下、このアルゴリズムについて、背景理
論と共に詳細を述べる。
【0024】分岐確率付き辞書を用いて、既に記入され
た左部分列(n−1文字とする。)に対する認識結果
(オンライン文字入力においては、そのカラムごとに文
字を記入する。そのカラムごとに認識候補があり、マト
リクスとなるので、それをMで表す。)から、次の文字
nを含めて実際に書かれるべき文字列がc1,c2,・・
・・cn-1,cnである確率を求める。
【0025】筆記済みの左部分文字列に相当するc1
2,・・・・cn-1は認識結果に依存してさまざまな可
能性があるので、この部分をTjで表す。すると、条件
付き確率P(Tj,cn|M)を求めることが目的とな
る。ここで、P(cn|Tj)は明らかに認識結果Mには
依存せず、マルコフ性があるので、L=P(Tj|M)
*P(cn|Tj)の値を求め、評価すればよいことにな
る。P(Tj|M)は、Bayesの定理より数1に分
解できる。
【0026】
【数1】
【0027】この分母は各文字列Tjに共通なので分子
のみで大小を判断すればよい。よってLは、以下のとお
りに変形することができる。 L=P(Tj)P(M|Tj)*(P(cn,Tj)/P
(Tj))=P(cn,Tj)*P(M|Tj
【0028】この式の前半は文字列Tjnが生起する確
率なので、前に述べた分岐確率に相当する。後半は、認
識から得られるTjの確からしさというべきものであ
る。しかし、これは正確な値を求めることは多くの実験
を必要とする。そこで、文字認識候補ci(i=1,・・n-1)
の認識時の尤度sciを用いて数2のように近似すること
ができる。但し、数2中のαは正規化定数である。
【0029】
【数2】
【0030】上述のLの式を評価して、次の文字を含め
た文字列を予測する。この値が、補完された文字列の候
補順位を決定すると同時にさらにその先を予測するか、
すなわち辞書の子ノード以降を展開するかを決定する基
礎となる。
【0031】これで上記の各ステップをさらに具体的に
述べる容易が整った。まずステップ33は、入力された
左部分列を認識するステップであるが、上述のように候
補となる文字列は通常複数になる。よって、場合によっ
てはその数が著しく多くなる場合もある。よって、その
ような場合には、数2を各Tjごとに計算し、その値に
より候補文字列の絞り込みを行う。これは、音声認識等
でよく用いられるビーム・サーチと同様なので、これ以
上述べない。
【0032】ステップ35は、ステップ33で得られた
候補文字列Tjごとに、上述の辞書を検索して続き得る
文字及び生起確率P(Tj,cn)を取り出す。
【0033】ステップ37で、候補文字列とステップ3
5にて得られた続き得る文字との結合である予測文字列
ごとに上記のLを計算する。Lは、Tjの確率である数
2と、cnの生起確率P(Tj,cn)の積である。
【0034】ここで、予測文字列をLが大きい順に並べ
かえる。これは、表示する際に確からしい順に提示する
等ためである。
【0035】そして、予測文字列の数をカウントする。
もし、予測文字列の数がユーザに提示できる最大数Nよ
り多ければ、Lが大きい順にN個の予測文字列をユーザ
に提示する(ステップ49)。
【0036】予測文字列の数がNより少なければ、ユー
ザにさらに候補を提示することにより、入力の効率を高
めることができる。そこで、より確からしいものから順
に辞書の子ノードを探索する。この実施例では、Lの大
きい順に、各予測文字列を部分文字列とする単語まで展
開する。そして、その単語のLも求める。
【0037】1の予測文字列を展開するごとに、その単
語と展開されていない予測文字列で構成される候補文字
列をLの大きい順に並べ換える。この候補文字列のN番
目までのLの総和LcとN+1番目以降のLの総和Ldの
差が所定数以上であれば、N+1番目以降の候補文字列
は破棄されても問題がない程選択される可能性は少な
い。よって、N+1番目以降の候補文字を破棄する。し
かしLdは保持し、他の予測文字列を展開した場合に生
じたLdに加算していく。
【0038】LcとLdの差が所定数未満であれば、破棄
されるN+1番目以降の候補文字列も、選択される可能
性が十分あることがわかるので、単語への展開を中止す
る。そして、予測文字列を候補文字列としてユーザに提
示する。
【0039】LcとLdの差が所定数以上であれば、上述
の展開操作を他の予測文字列に対して行う。そして同様
の処理を行い、単語まで展開する是非を判断する。展開
していない予測文字列が無くなるまで上述の操作を行っ
て、最終的にLcとLdの差が所定数以上であれば、候補
文字列のN番目までの単語をユーザに提示する。
【0040】以上、図4に示したフローのステップ41
乃至47の具体的実施例を説明したが、システムの容量
・能力に余裕があれば、最初にすべての予測文字列を単
語に展開してもよい。しかし、通常はメイン・メモリの
容量や処理装置の能力に限界があるので、具体的実施例
の説明の方が効率的である。どちらで実施しても結果が
同様である。
【0041】これにて、ユーザが十分可能性の高い文字
補完のなされた候補の中から、自己の所望の単語、又は
部分単語を選択することにより、入力効率を向上するこ
とができる。
【0042】上述のような次の1文字か単語かという提
示の切り換えだけでなく、状況に応じて可能な限り複数
文字を予測するように拡張することもできる。例えば、
予測文字列の子ノードを候補文字列として展開し、それ
ぞれにつきLを求めソートし、LcとLdを求め、同様に
LcとLdの差が所定数以上であれば候補文字列(予測文
字列の子ノードまでの文字列)をユーザに提示するよう
にしてもよい。
【0043】図3の例で考えてみる。ここで、+はその
文字列で単語を形成していることを示す。例えばdiを
入力した場合、先に述べた方法で行えばdid*,di
f*,dis*,dir*,die*,dic*...
の各子ノードのうち単語であるもののみ処理の対象とな
る。これに対し複数文字の予測を行うことになると、d
id*の子ノードのdid+とdida*等が、候補文
字列として考慮されるようになる。
【0044】以上本発明の実施例について述べたが、本
発明はこの実施例に限定されるものではない。例えば、
入力された文字列Tjの絞り込みは、ビーム・サーチと
いう方法を提案したが、他の方法とも置換可能である。
また、ユーザに提示する候補数は任意であり、設定可能
なようにしてもよい。さらにオンライン文字認識という
ことで、ある一定のカラムに文字を書き込む環境を設定
したが、ユーザ・インターフェースにおいてカラムなし
でも認識できるならば、カラムに限定されるわけではな
い。
【0045】本発明を英単語の例をもって説明してきた
が、適用は英単語に限られない。例えば、日本語のかな
姓名の文字認識及び文字補完に用いることができる。両
者は、文字の認識率、表音文字として情報量という観点
から類似しており、その量も同様である。但し、住所入
力における文字補完は、日本語の漢字及び住所の統計的
性質を利用するのがより効率的であり、本発明の主たる
対象とはならない。
【0046】
【発明の効果】以上述べたように、1文字予測にとどめ
るか、単語予測を行うかを効果的に切り換えることによ
り、提示できる数の限界と出来る限り先まで予測するこ
とが望ましいという要請のバランスをとることができ
た。さらに、複数文字予測もでき、より効率的になっ
た。
【0047】このことにより、オンライン文字認識にお
いて文字入力の効率を高めることができた。
【0048】さらに、動的に予測する文字の長さを変化
させることにより、よりユーザに的確な文字列を提示す
ることができた。
【図面の簡単な説明】
【図1】本発明の装置構成の例を示すブロック図であ
る。
【図2】本発明の処理装置の例を示すブロック図であ
る。
【図3】本発明で使用する辞書の一部の例である。
【図4】本発明の高レベルのフローチャートである。
【符号の説明】
1 処理装置 3 メイン・メモリ 5 入出力装置 7 文字入力部 9 表示制御部 11 座標入力・表示装置 13 記憶装置 21 文字認識部 23 文字予測部

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】各ノードに各文字を対応させ、ルートから
    前記各ノードまでで表す文字列の生起確率を前記各ノー
    ドに記憶した木構造辞書と、文字を入力する座標入力装
    置と、表示装置とを有するコンピュータ・システムにお
    いて、(a)前記座標入力装置に入力された文字パター
    ンより、読取候補文字列を生成するステップと、(b)
    前記木構造辞書において、生成された前記読取候補文字
    列に対応するノードの次のノードを取り出し、前記読取
    候補文字列と前記次のノードに対応する文字を連結した
    予測文字列及びその確からしさを表すデータを生成する
    ステップと、(c)前記予測文字列の数をカウントする
    ステップと、(d)前記予測文字列の数がユーザに提示
    可能な最大数N以上の場合には、前記確からしさを表す
    データの大きい順に前記予測文字列を前記表示装置に表
    示するステップと、(e)前記予測文字列の数がユーザ
    に提示可能な最大数N未満の場合には、前記確からしさ
    を表すデータを参照して、前記辞書のどのノードまでを
    提示するかを判断し、そのノードまでの文字列を前記表
    示装置に表示するステップとを含む文字認識文字補完方
    法。
  2. 【請求項2】前記ステップ(e)が、(f)1の前記予
    測文字列を、前記辞書を参照して前記1の予測文字列を
    含む単語に展開し、前記単語の確からしさを表すデータ
    を生成するステップと、(g)前記単語と他の前記予測
    文字列で構成される候補文字列を、前記確からしさを表
    すデータの大きい順に並べ換えるステップと、(h)前
    記ステップ(g)の順番で上位N+1以降の前記候補文
    字列が破棄可能かを判断するステップと、(i)前記ス
    テップ(h)で破棄可能と判断されなかった場合は、前
    記予測文字列を前記表示装置に表示するステップと、
    (j)前記予測文字列をすべて単語に展開しても前記ス
    テップ(h)で破棄可能とされた場合には、前記単語を
    前記表示装置に表示するステップとを含む請求項1記載
    の文字認識文字補完方法。
  3. 【請求項3】前記ステップ(e)が、(k)前記予測文
    字列を、前記辞書を参照して前記予測文字列を含む単語
    に展開し、前記単語の確からしさを表すデータを生成す
    るステップと、(l)前記単語をその確からしさを表す
    データの大きい順に並べ換えるステップと、(m)前記
    ステップ(l)の順番で上位N+1以降の前記単語が破
    棄可能かを判断するステップと、(n)前記ステップ
    (m)で破棄可能と判断されなかった場合は、前記予測
    文字列を前記表示装置に表示するステップと、(o)前
    記ステップ(m)で破棄可能と判断された場合には、前
    記単語を前記表示装置に表示するステップとを含む請求
    項1記載の文字認識文字補完方法。
  4. 【請求項4】前記ステップ(e)が、(p)1の前記予
    測文字列を、前記辞書を参照して前記1の予測文字列を
    表すノードから所定数先のノードまでに対応する文字列
    に展開し、前記文字列の確からしさを表すデータを生成
    するステップと、(q)前記文字列と他の前記予測文字
    列で構成される候補文字列を、前記確からしさを表すデ
    ータの大きい順に並べ換えるステップと、(r)前記ス
    テップ(q)の順番で上位N+1以降の前記候補文字列
    が破棄可能かを判断するステップと、(s)前記ステッ
    プ(r)で破棄可能と判断されなかった場合は、前記予
    測文字列を前記表示装置に表示するステップと、(t)
    前記予測文字列をすべて前記文字列に展開しても前記ス
    テップ(r)で破棄可能とされた場合には、前記文字列
    を前記表示装置に表示するステップとを含む請求項1記
    載の文字認識文字補完方法。
  5. 【請求項5】前記ステップ(e)が、(u)前記予測文
    字列を、前記辞書を参照して前記予測文字列を表すノー
    ドから所定数先のノードまでに対応する文字列に展開
    し、前記文字列の確からしさを表すデータを生成するス
    テップと、(v)前記文字列をその確からしさを表すデ
    ータの大きい順に並べ換えるステップと、(w)前記ス
    テップ(v)の順番で上位N+1以降の前記文字列が破
    棄可能かを判断するステップと、(x)前記ステップ
    (w)で破棄可能と判断されなかった場合は、前記予測
    文字列を前記表示装置に表示するステップと、(y)前
    記ステップ(w)で破棄可能と判断された場合には、前
    記文字列を前記表示装置に表示するステップとを含む請
    求項1記載の文字認識文字補完方法。
  6. 【請求項6】1)各ノードに各文字を対応させ、ルート
    から前記各ノードまでで表す文字列の生起確率を前記各
    ノードに記憶した木構造辞書と、 2)文字を入力する座標入力装置と、 3)表示装置と、 4)前記座標入力装置に入力された文字パターンより、
    読取候補文字列を生成する手段と、 5)前記木構造辞書において、生成された前記読取候補
    文字列に対応するノードの次のノードを取り出し、前記
    読取候補文字列と前記次のノードに対応する文字を連結
    した予測文字列及びその確からしさを表すデータを生成
    する手段と、 6)前記予測文字列の数をカウントする手段と、 7)前記予測文字列の数がユーザに提示可能な最大数N
    以上の場合には、前記確からしさを表すデータの大きい
    順に前記予測文字列を前記表示装置に表示する手段と、 8)前記予測文字列の数がユーザに提示可能な最大数N
    未満の場合には、前記確からしさを表すデータを参照し
    て、前記辞書のどのノードまでを提示するかを判断し、
    そのノードまでの文字列を前記表示装置に表示する手段
    とを有するコンピュータ・システム。
  7. 【請求項7】前記手段8)が、 9)1の前記予測文字列を、前記辞書を参照して前記1
    の予測文字列を含む単語に展開し、前記単語の確からし
    さを表すデータを生成する手段と、 10)前記単語と他の前記予測文字列で構成される候補
    文字列を、前記確からしさを表すデータの大きい順に並
    べ換える手段と、 11)前記手段10)が並べ換えた順番で上位N+1以
    降の前記候補文字列が破棄可能かを判断する手段と、 12)前記手段10)が破棄可能と判断しなかった場合
    は、前記予測文字列を前記表示装置に表示し、前記予測
    文字列をすべて単語に展開しても前記手段10)が破棄
    可能とした場合には、前記単語を前記表示装置に表示す
    る手段とを有する請求項6記載のコンピュータ・システ
    ム。
  8. 【請求項8】前記手段8)が、 13)前記予測文字列を、前記辞書を参照して前記予測
    文字列を含む単語に展開し、前記単語の確からしさを表
    すデータを生成する手段と、 14)前記単語をその確からしさを表すデータの大きい
    順に並べ換える手段と、 15)前記手段14)が並べ換えた順番で上位N+1以
    降の前記単語が破棄可能かを判断する手段と、 16)前記手段14)が破棄可能と判断しなかった場合
    は、前記予測文字列を前記表示装置に表示し、前記手段
    14)が破棄可能と判断した場合には、前記単語を前記
    表示装置に表示する手段とを有する請求項6記載のコン
    ピュータ・システム。
  9. 【請求項9】前記手段8)が、 17)1の前記予測文字列を、前記辞書を参照して前記
    1の予測文字列を表すノードから所定数先のノードまで
    に対応する文字列に展開し、前記文字列の確からしさを
    表すデータを生成する手段と、 18)前記文字列と他の前記予測文字列で構成される候
    補文字列を、前記確からしさを表すデータの大きい順に
    並べ換える手段と、 19)前記手段18)が並べ換えた順番で上位N+1以
    降の前記候補文字列が破棄可能かを判断する手段と、 20)前記手段19)が破棄可能と判断しなかった場合
    は、前記予測文字列を前記表示装置に表示し、前記予測
    文字列をすべて前記文字列に展開しても前記手段19)
    が破棄可能とした場合には、前記文字列を前記表示装置
    に表示する手段とを有する請求項6記載のコンピュータ
    ・システム。
  10. 【請求項10】前記手段8)が、 21)前記予測文字列を、前記辞書を参照して前記予測
    文字列を表すノードから所定数先のノードまでに対応す
    る文字列に展開し、前記文字列の確からしさを表すデー
    タを生成する手段と、 22)前記文字列をその確からしさを表すデータの大き
    い順に並べ換える手段と、 23)前記手段22)が並べ換えた順番で上位N+1以
    降の前記文字列が破棄可能かを判断する手段と、 24)前記手段23)が破棄可能と判断しなかった場合
    は、前記予測文字列を前記表示装置に表示し、前記手段
    23)が破棄可能と判断した場合には、前記文字列を前
    記表示装置に表示する手段とを有する請求項6記載のコ
    ンピュータ・システム。
JP6227559A 1994-09-22 1994-09-22 文字認識文字補完方法及びコンピュータ・システム Expired - Fee Related JP2741575B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP6227559A JP2741575B2 (ja) 1994-09-22 1994-09-22 文字認識文字補完方法及びコンピュータ・システム
US08/495,725 US5835635A (en) 1994-09-22 1995-06-27 Method for the recognition and completion of characters in handwriting, and computer system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6227559A JP2741575B2 (ja) 1994-09-22 1994-09-22 文字認識文字補完方法及びコンピュータ・システム

Publications (2)

Publication Number Publication Date
JPH0896085A true JPH0896085A (ja) 1996-04-12
JP2741575B2 JP2741575B2 (ja) 1998-04-22

Family

ID=16862809

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6227559A Expired - Fee Related JP2741575B2 (ja) 1994-09-22 1994-09-22 文字認識文字補完方法及びコンピュータ・システム

Country Status (2)

Country Link
US (1) US5835635A (ja)
JP (1) JP2741575B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012521025A (ja) * 2009-03-19 2012-09-10 グーグル・インコーポレーテッド インプットメソッドエディタ
US8704761B2 (en) 2009-03-19 2014-04-22 Google Inc. Input method editor
JP2014081867A (ja) * 2012-10-18 2014-05-08 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5963666A (en) * 1995-08-18 1999-10-05 International Business Machines Corporation Confusion matrix mediated word prediction
DE19813605A1 (de) * 1998-03-27 1999-09-30 Daimlerchrysler Aerospace Ag Erkennungssystem
US7293231B1 (en) * 1999-03-18 2007-11-06 British Columbia Ltd. Data entry for personal computing devices
DE60003177T2 (de) 1999-03-18 2004-05-06 602531 British Columbia Ltd., Vancouver Dateneingabe für personalrechnergeräte
US6597809B1 (en) * 1999-03-19 2003-07-22 Raf Technology, Inc. Rollup functions for efficient storage presentation and analysis of data
US7031530B2 (en) * 2001-11-27 2006-04-18 Lockheed Martin Corporation Compound classifier for pattern recognition applications
US8411958B2 (en) 2004-05-04 2013-04-02 Nokia Corporation Apparatus and method for handwriting recognition
US7561740B2 (en) * 2004-12-10 2009-07-14 Fuji Xerox Co., Ltd. Systems and methods for automatic graphical sequence completion
US8552984B2 (en) 2005-01-13 2013-10-08 602531 British Columbia Ltd. Method, system, apparatus and computer-readable media for directing input associated with keyboard-type device
US20060190424A1 (en) * 2005-02-18 2006-08-24 Beale Kevin M System and method for dynamically linking
DE102005031656A1 (de) * 2005-07-06 2007-01-11 Siemens Ag Verfahren zur Auswahl einer Bezeichung
US20070065003A1 (en) * 2005-09-21 2007-03-22 Lockheed Martin Corporation Real-time recognition of mixed source text
JP4446313B2 (ja) * 2006-12-15 2010-04-07 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声処理用の辞書に登録するべき新規語句を検索する技術
US7895518B2 (en) * 2007-04-27 2011-02-22 Shapewriter Inc. System and method for preview and selection of words
US8165398B2 (en) * 2008-05-30 2012-04-24 Sony Ericsson Mobile Communications Ab Method and device for handwriting detection
US8542927B2 (en) * 2008-06-26 2013-09-24 Microsoft Corporation Character auto-completion for online east asian handwriting input
CN104160361A (zh) 2012-02-06 2014-11-19 迈克尔·K·科尔比 字符串完成
US10228819B2 (en) 2013-02-04 2019-03-12 602531 British Cilumbia Ltd. Method, system, and apparatus for executing an action related to user selection
JP2016513849A (ja) * 2013-03-15 2016-05-16 ノリス,フォーブス,ホルテン,サード スペース最適化マイクロキーボードの方法および装置
WO2015157474A1 (en) 2014-04-08 2015-10-15 Norris Forbes Holten 3Rd Virtual keyboard text entry method optimized for ergonomic thumb typing
US10332628B2 (en) * 2016-09-30 2019-06-25 Sap Se Method and system for control of an electromechanical medical device
US11354503B2 (en) 2017-07-27 2022-06-07 Samsung Electronics Co., Ltd. Method for automatically providing gesture-based auto-complete suggestions and electronic device thereof

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01134585A (ja) * 1987-11-19 1989-05-26 Fujitsu Ltd 分離文字処理機能を持つ文書リーダ装置
JPH04120679A (ja) * 1990-09-12 1992-04-21 Matsushita Electric Ind Co Ltd 英文字認識装置
JPH04289989A (ja) * 1991-03-19 1992-10-14 Matsushita Electric Ind Co Ltd 英文字認識装置
JPH05108890A (ja) * 1991-10-18 1993-04-30 Fuji Xerox Co Ltd 文字認識方法および装置
JPH05128300A (ja) * 1991-11-05 1993-05-25 Canon Inc 文字認識方法及びその装置
JPH05233600A (ja) * 1992-02-24 1993-09-10 Matsushita Electric Ind Co Ltd ワードプロセッサ

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0664631B2 (ja) * 1987-09-09 1994-08-22 インターナショナル・ビジネス・マシーンズ・コーポレーション 文字認識装置
JPH0782544B2 (ja) * 1989-03-24 1995-09-06 インターナショナル・ビジネス・マシーンズ・コーポレーション マルチテンプレートを用いるdpマツチング方法及び装置
US5067165A (en) * 1989-04-19 1991-11-19 Ricoh Company, Ltd. Character recognition method
US5151950A (en) * 1990-10-31 1992-09-29 Go Corporation Method for recognizing handwritten characters using shape and context analysis
JP3260843B2 (ja) * 1992-08-25 2002-02-25 株式会社リコー 文字認識方法
JPH06187502A (ja) * 1992-12-15 1994-07-08 Hitachi Ltd オンライン手書き文字認識装置
US5524066A (en) * 1994-03-31 1996-06-04 Xerox Corporation Text recognition by predictive composed shapes

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01134585A (ja) * 1987-11-19 1989-05-26 Fujitsu Ltd 分離文字処理機能を持つ文書リーダ装置
JPH04120679A (ja) * 1990-09-12 1992-04-21 Matsushita Electric Ind Co Ltd 英文字認識装置
JPH04289989A (ja) * 1991-03-19 1992-10-14 Matsushita Electric Ind Co Ltd 英文字認識装置
JPH05108890A (ja) * 1991-10-18 1993-04-30 Fuji Xerox Co Ltd 文字認識方法および装置
JPH05128300A (ja) * 1991-11-05 1993-05-25 Canon Inc 文字認識方法及びその装置
JPH05233600A (ja) * 1992-02-24 1993-09-10 Matsushita Electric Ind Co Ltd ワードプロセッサ

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012521025A (ja) * 2009-03-19 2012-09-10 グーグル・インコーポレーテッド インプットメソッドエディタ
US8704761B2 (en) 2009-03-19 2014-04-22 Google Inc. Input method editor
US9026426B2 (en) 2009-03-19 2015-05-05 Google Inc. Input method editor
JP2014081867A (ja) * 2012-10-18 2014-05-08 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム

Also Published As

Publication number Publication date
US5835635A (en) 1998-11-10
JP2741575B2 (ja) 1998-04-22

Similar Documents

Publication Publication Date Title
JP2741575B2 (ja) 文字認識文字補完方法及びコンピュータ・システム
US10402493B2 (en) System and method for inputting text into electronic devices
EP2889729A1 (en) System and method for inputting text into electronic devices
JPH096924A (ja) 電子手書きパターンを格納されたストリングと比較する装置および方法
JPH04281566A (ja) 文書検索装置
JP3290451B2 (ja) 電子辞書
JPH10269210A (ja) 文字入力装置
JPH07271774A (ja) 文章入力装置
JP3952964B2 (ja) 読み情報決定方法及び装置及びプログラム
JP2002207557A (ja) 日本語入力システム、日本語入力方法、および、記録媒体
JP2001051996A (ja) 形態素解析方法及び装置及び形態素解析プログラムを格納した記憶媒体
JP3056810B2 (ja) 文書検索方法および装置
KR102317910B1 (ko) 중국어 형태소 분석 장치 및 방법
JP3585944B2 (ja) データ処理方法及びその装置
JP2000057133A (ja) 入力予測装置、入力予測方法及び入力予測プログラムを記録した記録媒体
JP2575650B2 (ja) かな漢字変換装置
JPH09274613A (ja) 文字列予測方法及びこの文字列予測方法を用いた文書作成装置
JP3273778B2 (ja) 仮名漢字変換装置及び仮名漢字変換方法
JP2000048019A (ja) 入力予測装置、入力予測方法及び入力予測プログラムを記録した記録媒体
JP2526678B2 (ja) 単語辞書検索装置
JPH08255156A (ja) 文字列予測方法,文字列予測装置及び文書作成装置
JPH11238056A (ja) 日本語予測入力方法ならびにシステム及び同方法がプログラムされ記録される記録媒体
JPH02177726A (ja) 漢字入力装置
JPH10269208A (ja) 仮名漢字変換装置
JPH10269209A (ja) 文字列予測装置及び文字列予測方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees