JPH09305716A - 入力文字列推測認識装置 - Google Patents

入力文字列推測認識装置

Info

Publication number
JPH09305716A
JPH09305716A JP12536096A JP12536096A JPH09305716A JP H09305716 A JPH09305716 A JP H09305716A JP 12536096 A JP12536096 A JP 12536096A JP 12536096 A JP12536096 A JP 12536096A JP H09305716 A JPH09305716 A JP H09305716A
Authority
JP
Japan
Prior art keywords
character
word
character string
candidate
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP12536096A
Other languages
English (en)
Other versions
JP3275704B2 (ja
Inventor
Keiko Gunji
圭子 郡司
Akihiro Katsura
晃洋 桂
壮四郎 ▲葛▼貫
Soshiro Kuzunuki
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP12536096A priority Critical patent/JP3275704B2/ja
Priority to TW089114382A priority patent/TW421764B/zh
Priority to TW086105652A priority patent/TW490643B/zh
Priority to KR1019970018940A priority patent/KR100475266B1/ko
Priority to DE69724910T priority patent/DE69724910T2/de
Priority to EP97108132A priority patent/EP0841630B1/en
Priority to US08/859,410 priority patent/US6097841A/en
Priority to CNB971135959A priority patent/CN1143240C/zh
Publication of JPH09305716A publication Critical patent/JPH09305716A/ja
Priority to US09/789,820 priority patent/US6751605B2/en
Application granted granted Critical
Publication of JP3275704B2 publication Critical patent/JP3275704B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】キーとなる文字を手書き入力するのみで、残り
の文字列を推測し認識結果として文字列全体を出力し得
る装置の提供。 【解決手段】文字認識装置において、複数の単語を階層
化し各単語を識別するための単語識別情報と階層情報を
記憶する単語辞書a6と、ある文字から他の文字へ遷移
する確率とその遷移関係にある文字の組合せに対応する
単語識別情報を記憶した文字遷移確率テーブルa4と、
認識手段により得られた候補文字列を前記文字遷移確率
テーブルを用いて最適化する最適化部a5を設け、最適
化された候補文字列に対応する単語識別情報に基づいて
前記単語辞書を検索し、前記階層情報に対応する未入力
の単語を抽出する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力されたパター
ンを認識し結果を表示するパターン認識装置に関し、特
に、住所や定形句などの定まった文字列が手書き入力パ
ターン認識装置に関する。
【0002】
【従来の技術】PenPC(ペン入力コンピュータ)な
どの伝票処理等では、住所や定形句の入力が用途として
多い。従来の住所や定形句の入力方法としては、(1)
メニューによる選択や、(2)文字認識とメニューの組
み合わせで、郵便番号を入力すると、関連する住所をメ
ニューで表示し、選択する方法、(3)手書き入力した
文字を認識し、その候補を単語辞書で最適化する方法な
どが開示されている。
【0003】(1)のメニューによる方法は、例えば、
文献「文字位置のずれを許容する枠なし筆記住所認識」
(電子情報通信学会論文誌D−2,1994年1月号)
に開示されるように、住所のように階層化されたデータ
では、上位階層から順々に下位まで(例えば、「茨城
県」→「日立市」→「大みか町」のように)選択する方
法が一般的である。そこで、もし、「日立市」と入力す
るのに、「日立市」が何県にあるのか、例えば「茨城
県」か「栃木県」か分からなかったら、なかなか「日立
市」を選べない問題がある。
【0004】(2)の郵便番号を入力すると、関連する
住所をメニューで表示する方法は、郵便番号のみ文字入
力し、あとは、郵便番号から決まる地名はメニューで選
べるので、比較的容易に入力可能である。しかし、自分
の住所の郵便番号は覚えられるが、他の郵便番号まで覚
えるのは困難である。
【0005】(3)の手書き入力した文字を認識し、そ
の候補を単語辞書で最適化する方法について、図面を用
いて説明する。図3は、従来の文字認識の構成図であ
る。タブレットa1より入力された手書きパターンを認
識辞書a2とパターンマッチして文字認識a3し、得ら
れた候補文字を単語辞書a6と単語照合b7し、該当す
る単語をLCDa8に表示する。
【0006】図4に、従来の文字認識を用いて住所を入
力する場合の動作概要図である。例えば、「茨城県 日
立市 大みか町」と入力するには、「茨城県 日立市
大みか町」と全部を所定の住所入力エリアb1に手書き
入力する。すると、文字認識a3し、得られた候補文字
を単語辞書a6を用いて、最上位階層の都道府県から単
語照合し、候補文字を最適化し、結果を候補文字として
出力していた。
【0007】従来、住所のような階層データを最上位の
階層からアクセスしていたのは、一般に階層の上位ほど
データ量が少なく、上位が決まれば下位の候補を絞るこ
とができたからである。もし、仮に従来のシステムで
「大みか」というキーワードを入力して、単語辞書を検
索したならば、どの階層にあるかも分からないので、約
1.5MB もある単語辞書を全文検索するしかなく、オ
ンライン文字認識のように応答性が必要な場合には実用
的でなかったためである。
【0008】 ((住所単語辞書の例) 都道府県: 約50個×約3文字×2バイト = 約300B 市町村 : 約4000個×約3文字×2バイト = 約2.5KB それ以下: 約160000個×約4文字×2バイト= 約1.3MB 合 計 : 約1.5MB ) しかし、従来の方式のように、例えば「茨城県 日立市
大みか町」と、長い住所を全部を手書き入力しなけれ
ばならないのでは、ユーザにとっては大変である。
【0009】
【発明が解決しようとする課題】上記従来技術(1)〜
(3)に共通する問題点としては、文字認識利用の例で
は、住所や定形句などを全て手書き入力する必要があり
ユーザにとって煩わしい点、また、単語辞書を最上位以
外の階層から探索すると探索に膨大な時間を要してしま
う点、メニューにより選択する場合においても住所のよ
うに階層構造になっていると、上位が分からないと下位
を選択できない点がある。
【0010】本発明の目的は、キーとなる文字(例えば
「大みか」や「〜みか町」)を手書き入力するのみで、
残りの文字列(例えば「茨城県 日立市」)を推測し認
識結果として文字列全体(例えば「茨城県 日立市 大
みか町」)を出力し得るパターン認識装置を提供するこ
とにある。
【0011】
【課題を解決するための手段】本発明の特徴は、入力さ
れた文字列を認識する認識手段を有し、認識された結果
を表示する文字認識装置において、複数の単語を階層化
し各単語を識別するための単語識別情報及び階層情報を
記憶する単語辞書と、少なくとも、ある文字から他の文
字へ遷移する確率とその遷移関係にある文字の組合せに
対応する単語識別情報を記憶した文字遷移確率テーブル
と、前記認識手段により得られた候補文字列を前記文字
遷移確率テーブルを用いて最適化する手段と、最適化さ
れた候補文字列に対応する単語識別情報に基づいて前記
単語辞書を検索し、前記階層情報に対応する未入力の単
語を抽出する検索手段とを設けたことにある。
【0012】これにより、例えば、「大みか町」とのみ
入力された場合であっても、前記最適化手段により最適
化された候補文字として「大みか町」が抽出され、この
文字列に対応する単語識別情報に基づいて単語辞書が検
索され、この単語識別情報と共に記憶された階層情報に
より、「大みか町」の上位の階層である「茨城県 日立
市」が抽出されるため、未入力の文字列を含む「茨城県
日立市 大みか町」を認識結果として得ることが可能
となる。
【0013】また、本発明の他の特徴は、入力された文
字列を認識する認識手段を有し、認識された結果を表示
する文字認識装置において、予め複数の文字列群をそれ
ぞれ固有のアドレスに記憶する辞書と、少なくとも、あ
る文字から他の文字へ遷移する確率と前記複数の文字列
群のうち前記遷移関係にある文字の組合せを含む文字列
群のアドレスとをそれぞれ対応付けて記憶した文字遷移
確率テーブルと、前記認識手段により得られた候補文字
列を前記文字遷移確率テーブルを用いて最適化する手段
とを有し、前記最適化された候補文字列に対応する文字
列群のアドレスにより前記辞書をアクセスし、このアド
レスに対応する前記辞書中の文字列群を認識結果として
表示するようにしたことにある。
【0014】
【発明の実施の形態】以下、図面を用いて、手書きによ
り住所を入力する装置に本発明を適用した場合を例とし
て説明する。
【0015】図2は、本発明の一実施例である手書き入
力住所認識装置の動作概要図である。住所入力エリアb
1に、スタイラスペンa9で、住所のキーとなる文字
「大みか」を手書き入力する。すると、手書きされたス
トローク(筆跡)は、文字認識a3により認識され、キ
ーワードの候補文字,第一候補「大みか」と第二候補
「犬るカ」が得られる。これらの候補文字を、文字遷移
確率テーブルa4にある文字間の遷移確率((文字A)
→(文字B)に続く確率)と、文字の出現確率テーブル
a8を参照し、候補文字をどのように組み合わせると、
文字列として出現確率が高くなるかを求め、文字列とし
ての出現確率が高くなるように、候補文字の順位を最適
化する。さらに、文字遷移確率テーブルの候補単語No.
を参照し、候補文字列にある文字遷移を含む単語のポイ
ンタを求める。図の例では、「大みか」と候補文字を組
み合わせると出現確率が高くなり、文字遷移確率テーブ
ルより、(大→み)と(み→か)を含む単語のポインタ
No.A11が求められる。本方式では、文字認識の後処
理に用いる、遷移確率テーブルに、新たに単語辞書中の
単語へのポインタを設けるにより、高速に目的の単語に
アクセスすることができる。そして、単語辞書中で該当
する単語が分かったら、単語辞書の階層情報により、上
位の階層は一意に求められる。この例では、最下位の階
層の「大みか町」が一意に求められたので、上位は「茨城
県 日立市」と一意に求めることができる。従って、
「大みか」しか手書き入力していないのに、「茨城県
日立市 大みか町」と、住所を頭から候補表示し、入力
することができる。
【0016】図1は、本発明の一実施例である手書き入
力住所認識装置の機能ブロック図である。図1を用いて
動作を簡単に説明する。スタイラスペンa9をタブレッ
トa1上に滑らせることにより、手書き文字パターンが
入力される。入力された手書きパターンを、認識辞書a
2にある文字パターンとマッチングして文字認識a3す
る。文字認識の結果得られた候補文字の候補順位を最適
化するために、あらかじめ学習して作成してある、文字
間の遷移確率と文字遷移を含む単語辞書中の候補単語の
ポインタが載っている遷移確率テーブルa4及び文字の
出現確率テーブルa8を参照し、文字列としての出現確
率が高くなるように候補順位を最適化するとともに、最
適化した文字列が該当する単語辞書中の単語へのポイン
タを求める(a5)。前記方法で求めた単語辞書a6の
単語と候補文字列を照合し、該当する単語とその前後の
情報を単語辞書の階層情報より求める(a7)。求めら
れた結果をLCDa8に表示する。
【0017】尚、本発明の特徴である、[1]遷移確率
テーブルa4の作成方法、[2]遷移確率テーブルa4
を用いて、候補文字を文字列としての出現確率が高くな
るように候補順位を最適化するとともに、最適化した文
字列にある文字遷移を含む単語へのポインタを求める方
法、[3]求めた単語のポインタを利用して手書き入力
した単語(キーワード)を含む文字列を推測する方法、
[4]推測した文字列の表示方法については、後に図面
を用いて詳細に説明する。
【0018】図5は、本発明の一実施例である手書き入
力住所認識装置のハード構成図である。入力パターンと
辞書パターンをマッチングする機能、パターンマッチン
グにより得られた候補文字を最適化し、候補文字を含む
単語へのポインタを求める機能、候補文字を単語照合し
て、さらに前後の情報を検索する機能は、例えば、RO
Mc5に記憶してあるプログラムをCPUc3が読みだし、
実行することにより実現される。尚、各機能について
は、後に図面を用いて詳細に説明する。
【0019】[1]遷移確率テーブルa4の作成方法 図6は、遷移確率テーブルa4の作成方法を説明するフ
ロー図である。まず、学習用の単語辞書a6を読み出す
d1。読み出した単語について、単語中に含まれる文字
の出現回数をカウントし(d2)、出現回数テーブルd
3に記録する。続いて、文字遷移回数をカウントし(d
4),遷移回数テーブルd6に記録する。続いて、遷移
回数テーブルd6に、文字遷移が含まれた元の単語の単
語No.(単語のポインタ)を記録するd5。例えば、単
語「大みか」の例では、文字の出現回数は、「大」
「み」「か」それぞれ1回、文字遷移回数では「大→
み」と「み→か」がそれぞれ1回とカウントされる。ま
た、「大→み」と「み→か」の候補単語No.には、単語
「大みか」の単語No.が記録される。このような処理d
1〜d6を、単語辞書a6中の全ての単語について繰り
返し行う。その後、前記処理により作成した文字出現回
数テーブルd3と文字遷移回数テーブルd6を参照し
て、文字間の遷移確率と文字遷移を含む候補単語No.の
情報を記述した遷移確率テーブルa4を作成する(d
9)。さらに、必要があれば、文字出現回数テーブルd
3を参照して、文字毎の出現確率を記述した文字出現確
率テーブルd8を作成する(d7)。それぞれのテーブ
ルの構成については、以下図面を用いて説明する。
【0020】図7は、単語辞書の概要図である。ここで
は例として、住所の単語辞書a6を示す。この辞書は、
都道府県・市町村・それ以下で階層化された構造になっ
ており、各要素は、単語No.(単語の位置情報),上位
単語No.,単語(文字列)からなる。各単語にアクセス
するには、単語No.によりアクセスできる。また、単語
の階層関係は、上位単語No.によって分かる。
【0021】図8は、文字出現回数テーブルの概要図で
ある。文字出現回数テーブルd3には、学習用単語辞書
中に各文字が現れた回数が記憶され、学習用単語中の全
文字数をカウントするのに用いられる。
【0022】図9は、文字遷移回数テーブルの概要図で
ある。文字遷移回数テーブルd6は、学習用単語辞書中
に各文字遷移が現れた回数と、文字遷移が含まれていた
単語のNo.(候補単語No.)を記録するのに用いる。
【0023】図10は、文字出現確率テーブルの概要図
である。例えば、文字「日」の出現確率は、出現確率
(日)=出現回数(日)/全文字数で表せる。従って、
文字出現確率テーブルd8を作成するには、文字出現回
数テーブルd3を参照し、各文字の出現回数を求め、文
字出現確率テーブルd8に記録すればよい。
【0024】図11は、文字遷移確率テーブルの概要図
である。例えば、文字遷移「日→立」の遷移確率は、遷移
確率(日→立)=遷移回数(日→立)/出現回数(日)
で表せる。従って、文字遷移確率テーブルa4を作成す
るには、文字出現回数テーブルd3と文字遷移回数テー
ブルd6を参照して、各文字の遷移確率を求め、文字遷
移確率テーブルa4に記録すればよい。
【0025】以上の処理により、単語辞書の単語へのポ
インタのついた遷移確率テーブルa4を作成することが
できる。尚、本実施例においては、単語辞書中の各単語
を識別するための単語識別情報として単語No.を用いた
が、これに限られるものではなく、コード情報であって
も良い。また、同様に、単語辞書中の単語間の階層関係
を示す階層情報として上位単語No.を用いたが、これに
限られるものではなく、階層関係を表わし得るものであ
れば良く、例えばコード情報であっても良い。
【0026】[2]遷移確率による後処理(候補文字の
最適化と候補単語のポインタの決定)方法 図12は、遷移確率テーブルを用いて行う文字認識後処
理の概要図である。図のように、入力パターン「大み
か」の候補文字が、第一候補「大るか」・第二候補「犬
みカ」であるとする。尚、ここでは文字認識結果に誤り
がある場合でも、遷移確率による候補文字の最適化で対
応できることを示すため、特に、図2の例とは異なる
「大みか」を誤認識した例を用いて説明する。候補文字
の組み合わせは、図に示す8通りが考えられる。これら
文字列の組について、文字遷移確率テーブルを参照し
て、文字列の出現確率と単語辞書中の単語候補の単語の
ポインタを求める。文字列の出現確率が高い候補文字の
組合せが、最適な組み合わせ(パス)である。従って、
その文字組を候補単語No.と共に遷移確率後処理の結果
とする。
【0027】それでは、まず、文字列の出現確率の計算
方法を述べる。一般に、文字列S1 S2 …Snの出
現確率は、次式で近似できる。
【0028】
【数1】 出現確率(S1 S2 …Sn) =出現確率(S1)×遷移確率(S1→S2)×…×遷移確率(Sn−1→Sn) …(数1) 図の候補文字の組み合わせNo.3の「大みか」の例で
は、以下の通りとなる。出現確率(大みか)=出現確率
(大)×遷移確率(大→み)×遷移確率(み→か) 具体的には、遷移確率テーブルa4と出現確率テーブル
a8とにより、次式の通り値が求められる。
【0029】
【数2】 出現確率(大みか) =(18/89274)×(1/18)×(2/15)×(2/198) =14940×10~8% …(数2) 次に、候補単語No.(単語辞書中の単語候補のポインタ
0を求める方法を述べる。文字列S1 S2 …Snの
候補単語No.は、次式のように求めることができる。
【0030】
【数3】 候補単語No.(S1 S2 …Sn) =候補単語No.(S1→S2)∩…∩候補単語No.(Sn−1→Sn) …(数3) 図の例、文字列「大みか」の場合は、文字遷移確率テー
ブルa4により次式のようになる。
【0031】
【数4】 候補単語No.(大みか) =∩候補単語No.(大→み)∩候補単語No.(み→か) =(A11)∩(A11,A12) =A11 …(数4) この例では、アンド(∩)をとることにより、候補を
「大みか町」(A11)に絞ったが、オア(∪)をとり
候補を「大みか町」と「みかの原町」にしてもよい。こ
の場合、一致数を考慮すれば「大みか町」を第一候補に
することができる。
【0032】以上の方法により、文字認識により得られ
た候補文字を文字列としての出現確率が高くなるように
最適化し、最適化した候補文字列の候補単語No.(単語
へのポインタ)を求めることができる。尚、上記の方法
によれば、例えば、「大みか町」の一部分である「み
か」のみを入力しても、「大みか町」と「みかの原町」
を候補にすることができる。
【0033】[3]手書き入力した単語(キーワード)
を含む文字列の推測方法 続いて、最適化した候補文字列(手書き入力したキーワ
ード)を含む文字列全体の推測方法について、図面を用
いて説明する。
【0034】図13は、後処理結果により文字列を推測
する概要図である。この例では、遷移確率による後処理
でキーワード(候補文字)「大みか」と候補単語No.A
11が得られた場合を示す。この図から分かるように、
キーワード「大みか」は単語辞書中に1つしかなく、ま
た最下位の階層なので、上位の文字列「茨城県 日立
市」は一意に決まる。そこで、手書き文字「大みか」の
全体の推測結果として、候補文字列「茨城県 日立市
大みか町」を表示した。
【0035】図22は、図13と同様の例であるが、手
書き文字「大みか」の候補文字列として、文字列推測結
果の「茨城県 日立市 大みか町」と推測結果なしの文
字認識結果の「大みか町」を両方候補として出し、ユー
ザが選択できるようにしたことが特徴である。このよう
に、キーワードから推測した文字列と推測なしのキーワ
ードのみの両方を候補にすると、ユーザは好みの方を選
べる利点がある。
【0036】図14は、後処理結果により文字列を推測
する概要図である。この例では、遷移確率による後処理
の結果、単語辞書の中間階層の単語である「日立」(候
補単語No.A1)得られた場合を示す。図より分かるよ
うに、キーワード「日立」は、単語辞書テーブル中に1
つしかないので、上位階層の文字列「茨城県」は一意に
決まる。しかし、下位の階層は複数あるので、例えば、
候補を「茨城県 日立市 大みか町」「茨城県 日立市
みかの原町」・・・と複数表示し、ユーザに選択して
もらえば良い。
【0037】図15は、図14と同様に後処理の結果単
語辞書の中間階層の単語である「日立」(候補単語No.
A1)遷移確率による得られ、下位の候補が複数ある例
である。この図の例では、単語辞書には各都市毎の人口
情報を保持しており、複数ある下位の階層のうち、人口
の多い町を優先的に高い候補順位で表示することによ
り、操作性を向上している。
【0038】図16は、図15と似ているが、単語辞書
には人口情報の代わりに、単語間の遷移確率をもってい
る。複数ある下位の階層のうち、遷移確率の高い単語を
優先的に高い候補順位で表示することにより、操作性を
向上できる。この単語間の遷移確率は、地名がよく現れ
るテキストなどから学習することができる。また、簡易
には、都市の人口により頻度を決定して学習してもよ
い。
【0039】図21は、図14と同様に後処理の結果単
語辞書の中間階層のキーワード「日立」(単語No.A
1)が得られ、下位の候補が一意に定まらない例であ
る。図14と異なるのは、一意に候補が決まった「茨城
県 日立市」のみを表示しており、一意に定まらない市
町村以下は、ユーザが再度入力するようにした点であ
る。
【0040】以上より、わかるように、キーワードより
上位の階層は、自動で一意に推測できるし、キーワード
より下位の候補が複数ある場合は、一意には定められな
いので、メニューを提示したり、その部分だけ際入力し
てもらえばよい。
【0041】[4]推測した文字列の表示方法 さて、次に、上記方法で求めた文字列候補の表示の仕方
について述べる。図17〜図20は、推測した文字列の
表示形態を示す図である。いずれも「大みか町」と入力
して、推測認識結果の文字列「茨城県 日立市 大みか
町」を表示しているが、各々表示の位置を変えて、特徴
を出している。
【0042】図17では、「大みか町」と手書きした近
くに候補文字列「茨城県 日立市大みか町」の中の「大
みか町」の部分を表示している。この表示方法では、手
書きした筆跡と認識結果の候補を対比しやすいメリット
がある。
【0043】さて、図18は、「大みか町」と手書きし
た位置の近くから、「茨城県 日立市 大みか町」と表
示している。この表示方法では、手書き文字と候補文字
列の頭が揃っているので、結果の表示開始位置が容易に
分かるメリットがある。
【0044】図19では、「大みか町」と手書きした位
置を中心として、候補文字列「茨城県 日立市 大みか
町」と表示している。この表示方法では、手書き文字と
候補文字列の位置が全体的に見て一番近く、視点をあま
り動かさなくて済むというメリットがある。
【0045】図20では、「大みか町」と手書きした終
りの位置と候補文字列「茨城県 日立市 大みか町」の
最後の文字の位置を揃えてと表示している。この表示方
法では、特に右利きのユーザでは、ペンを持った手の下
に候補文字列が隠れないメリットがある。
【0046】図17〜図20のように、各々特徴ある表
示方法があるが、システムが適宜どれか1つの方法に決
めてもよいし、ユーザが複数の表示方法から自分にあっ
た表示方法を選択できるようにしてもよい。
【0047】また、図17〜図20では、候補文字列中
のキーワード「大みか」を反転表示して分かりやすくし
ているが、例えばフォントを変えるなど、他の方法でも
よい。また、特に反転表示やフォントを変えるなどを行
わなくてもよい。
【0048】以上、本実施例によれば、住所のような階
層データや定形句などを入力する際に、キーとなる文字
を入力するだけで、文字列全体を推測し、候補として表
示することができる。また、単語辞書に高速にアクセス
して単語照合することができ、上記実施例のように単語
辞書が階層化されているときでも、階層の上位・下位に
関係なく高速にアクセスができる。
【0049】
【発明の効果】本発明によれば、キーとなる文字を手書
き入力するのみで、残りの文字列を推測し認識結果とし
て文字列全体が出力されるので、操作性が大幅に向上で
きる。
【図面の簡単な説明】
【図1】本発明の一実施例である手書き入力住所認識装
置の機能ブロック図である。
【図2】本発明の一実施例である手書き入力住所認識装
置の動作概要図である。
【図3】従来の文字認識装置の構成図である。
【図4】従来の文字認識装置を用いて住所入力する場合
の動作概要図である。
【図5】本発明の一実施例である手書き入力住所認識装
置のハード構成図である。
【図6】文字遷移確率テーブルの作成方法を説明するフ
ロー図である。
【図7】単語辞書の概要図である。
【図8】文字出現回数テーブルの概要図である。
【図9】文字遷移回数テーブルの概要図である。
【図10】文字出現確率テーブルの概要図である。
【図11】文字遷移確率テーブルの概要図である。
【図12】遷移確率テーブルを用いて行う文字認識後処
理方法の概要図である。
【図13】後処理結果より文字列を推測する概要図であ
る。
【図14】後処理結果より文字列を推測する概要図であ
る。
【図15】後処理結果より文字列を推測する概要図であ
る。
【図16】後処理結果より文字列を推測する概要図であ
る。
【図17】推測した文字列の表示形態を示す図である。
【図18】推測した文字列の表示形態を示す図である。
【図19】推測した文字列の表示形態を示す図である。
【図20】推測した文字列の表示形態を示す図である。
【図21】後処理結果より文字列を推測する概要図であ
る。
【図22】後処理結果より文字列を推測する概要図であ
る。
【符号の説明】
a1…タブレット、a2…認識辞書、a3…文字認識
部、a4…遷移確率テーブル、a5…候補文字最適化と
単語のポインタ決定部、a6…単語辞書、a7…単語照
合と文字列推測部、d1…学習用単語の読み出し部、d
2…文字出現回数のカウント部、d3…文字出現回数テ
ーブル、d4…文字遷移回数のカウント部、d5…文字
遷移を含む候補単語記憶部、d6…文字遷移回数テーブ
ル、d7…文字出現確率テーブル作成部、d8…文字出
現確率テーブル、d9…文字遷移確率テーブル作成部。

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】入力された文字列を認識する認識手段を有
    し、認識された結果を表示する文字認識装置において、 複数の単語を階層化し、各単語を識別するための単語識
    別情報及び階層情報を記憶する単語辞書と、 少なくとも、ある文字から他の文字へ遷移する確率及び
    当該遷移関係にある文字の組合せに対応する前記単語識
    別情報を記憶した文字遷移確率テーブルと、 前記認識手段により得られた候補文字列を前記文字遷移
    確率テーブルを用いて最適化する手段と、 前記最適化された候補文字列に対応する単語識別情報に
    基づいて前記単語辞書を検索し、前記階層情報に対応す
    る未入力の単語を抽出する検索手段とを設けたことを特
    徴とする文字認識装置。
  2. 【請求項2】請求項1において、前記階層情報は、前記
    単語辞書中の各単語に対し上位の関係にある単語の単語
    識別情報であることを特徴とする文字認識装置。
  3. 【請求項3】請求項2において、前記検索手段は、未入
    力の単語として前記最適化された文字列に対し上位の関
    係にある単語を前記単語辞書より抽出することを特徴と
    する文字認識装置。
  4. 【請求項4】入力された文字列を認識する認識手段を有
    し、認識された結果を表示する文字認識装置において、 予め複数の文字列群を、それぞれ固有のアドレスに記憶
    する辞書と、 少なくとも、ある文字から他の文字へ遷移する確率と、
    前記複数の文字列群のうち前記遷移関係にある文字の組
    合せを含む文字列群のアドレスとをそれぞれ対応付けて
    記憶した文字遷移確率テーブルと、 前記認識手段により得られた候補文字列を前記文字遷移
    確率テーブルを用いて最適化する手段とを有し、 前記最適化された候補文字列に対応する文字列群のアド
    レスにより前記辞書をアクセスし、当該アドレスに対応
    する前記辞書中の文字列群を認識結果として表示するこ
    とを特徴とする文字認識装置。
  5. 【請求項5】請求項1又は4において、前記最適化手段
    は、前記認識手段により得られる複数の候補文字列のう
    ち各候補文字列を構成する文字間の遷移確率が最大とな
    る候補文字列を、最適化された候補文字列として決定す
    ることを特徴とする文字認識装置。
  6. 【請求項6】請求項1又は4において、前記文字列は、
    手書きにより入力されることを特徴とする文字認識装
    置。
  7. 【請求項7】請求項1又は4において、前記文字列は、
    音声により入力されることを特徴とする文字認識装置。
  8. 【請求項8】文字パターンを入力する手段と、入力され
    た文字パターンを認識する手段と、認識結果を表示する
    手段を有する文字認識装置において、 予め複数の単語を登録した単語辞書と、 予め学習した文字間の遷移確率とその文字遷移を含む単
    語辞書の単語へのポインタを記述した文字遷移確率テー
    ブルと、 文字間の遷移確率を用いて文字認識の候補文字列を最適
    化するとともに、文字認識の候補文字列の文字遷移を含
    む単語辞書の単語のポインタを求める手段と、 前記最適化された候補文字列を、前記求めた単語のポイ
    ンタを使って参照した単語辞書中の単語と照合するとと
    もに、その単語に関連する情報を単語辞書より推測する
    手段を備えたことを特徴とするパターン認識装置。
  9. 【請求項9】請求項8のパターン認識装置において、前
    記単語辞書の単語は階層化されたデータであることを特
    徴とするパターン認識装置。
  10. 【請求項10】請求項8のパターン認識装置において、
    前記文字パターンは手書きにより入力されるものであっ
    て、前記推測手段により推測した候補文字列を、前記手
    書き入力パターンの近傍に表示することを特徴とするパ
    ターン認識装置。
  11. 【請求項11】請求項10のパターン認識装置におい
    て、前記候補文字列のうち、前記手書き入力パターンに
    対応する部分のみ、色を反転又はフォントを変更し表示
    することを特徴とするパターン認識装置。
  12. 【請求項12】入力された文字パターンを認識し、認識
    結果を表示する文字認識方法において、 入力された文字パターンを認識し候補文字列を抽出し、 抽出された候補文字列を、予め学習した文字間の遷移確
    率とその文字遷移を含む単語辞書の単語へのポインタを
    記述した文字遷移確率テーブルを用いて最適化し、 最適化された候補文字列の文字遷移を含む単語辞書の単
    語のポインタを求め、 前記単語辞書に登録された複数の単語のうち、前記求め
    た単語のポインタを用いて得られる一つの単語と前記最
    適化された候補文字列とを照合し、 当該単語に関連する情報を単語辞書より推測し、推測結
    果を候補文字列として表示することを特徴とするパター
    ン認識方法。
  13. 【請求項13】請求項12のパターン認識方法におい
    て、前記単語辞書の単語は階層化されたデータであるこ
    とを特徴とするパターン認識方法。
  14. 【請求項14】請求項12のパターン認識方法におい
    て、前記文字パターンは手書きにより入力されるもので
    あって、推測した候補文字列を、入力された手書き文字
    パターンの近傍に表示することを特徴とするパターン認
    識方法。
  15. 【請求項15】請求項14のパターン認識方法におい
    て、前記候補文字列のうち、前記手書き入力パターンに
    対応する部分のみ、色を反転又はフォントを変更し表示
    することを特徴とするパターン認識方法。
JP12536096A 1996-05-21 1996-05-21 入力文字列推測認識装置 Expired - Lifetime JP3275704B2 (ja)

Priority Applications (9)

Application Number Priority Date Filing Date Title
JP12536096A JP3275704B2 (ja) 1996-05-21 1996-05-21 入力文字列推測認識装置
TW089114382A TW421764B (en) 1996-05-21 1997-04-29 Input character string estimation and identification apparatus
TW086105652A TW490643B (en) 1996-05-21 1997-04-29 Estimated recognition device for input character string
KR1019970018940A KR100475266B1 (ko) 1996-05-21 1997-05-16 입력문자열추측인식장치
DE69724910T DE69724910T2 (de) 1996-05-21 1997-05-20 Vorrichtung zum Erkennen von eingegebenen Zeichenketten durch Schlussfolgerung
EP97108132A EP0841630B1 (en) 1996-05-21 1997-05-20 Apparatus for recognizing input character strings by inference
US08/859,410 US6097841A (en) 1996-05-21 1997-05-20 Apparatus for recognizing input character strings by inference
CNB971135959A CN1143240C (zh) 1996-05-21 1997-05-21 用于通过推理识别输入字符串的装置
US09/789,820 US6751605B2 (en) 1996-05-21 2001-02-22 Apparatus for recognizing input character strings by inference

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP12536096A JP3275704B2 (ja) 1996-05-21 1996-05-21 入力文字列推測認識装置

Publications (2)

Publication Number Publication Date
JPH09305716A true JPH09305716A (ja) 1997-11-28
JP3275704B2 JP3275704B2 (ja) 2002-04-22

Family

ID=14908216

Family Applications (1)

Application Number Title Priority Date Filing Date
JP12536096A Expired - Lifetime JP3275704B2 (ja) 1996-05-21 1996-05-21 入力文字列推測認識装置

Country Status (1)

Country Link
JP (1) JP3275704B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008537270A (ja) * 2005-04-22 2008-09-11 マイクロソフト コーポレーション 自動提案リスト及び手書き入力
JP2010009440A (ja) * 2008-06-30 2010-01-14 Fujitsu Frontech Ltd 文字認識プログラム、文字認識装置および文字認識方法
WO2011103337A2 (en) * 2010-02-17 2011-08-25 Google Inc. Translating user interaction with a touchscreen into text
JP2012173959A (ja) * 2011-02-21 2012-09-10 Fuji Xerox Co Ltd 文字認識装置及びプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008537270A (ja) * 2005-04-22 2008-09-11 マイクロソフト コーポレーション 自動提案リスト及び手書き入力
JP2010009440A (ja) * 2008-06-30 2010-01-14 Fujitsu Frontech Ltd 文字認識プログラム、文字認識装置および文字認識方法
WO2011103337A2 (en) * 2010-02-17 2011-08-25 Google Inc. Translating user interaction with a touchscreen into text
WO2011103337A3 (en) * 2010-02-17 2011-12-15 Google Inc. Translating user interaction with a touchscreen into text
US8463731B2 (en) 2010-02-17 2013-06-11 Google Inc. Translating user interaction with a touch screen into text
JP2012173959A (ja) * 2011-02-21 2012-09-10 Fuji Xerox Co Ltd 文字認識装置及びプログラム

Also Published As

Publication number Publication date
JP3275704B2 (ja) 2002-04-22

Similar Documents

Publication Publication Date Title
US4903206A (en) Spelling error correcting system
US5649023A (en) Method and apparatus for indexing a plurality of handwritten objects
JP3560289B2 (ja) 統合辞書ベースで、ありそうな文字列の手書き認識方法
US6864809B2 (en) Korean language predictive mechanism for text entry by a user
CN101167075B (zh) 专有表现抽取装置、方法以及程序
CN102063482B (zh) 一种手持设备高效联系人查找方法
JPH1153402A (ja) 情報検索装置
US6067510A (en) Machine interpreter which stores and retrieves translated sentences based on variable and invariable sentence portions
JPH07160701A (ja) 住所情報検索装置
JP3275704B2 (ja) 入力文字列推測認識装置
JP3419205B2 (ja) 情報検索装置
JPH09319767A (ja) 類義語辞書登録方法
JP3945075B2 (ja) 辞書機能を備えた電子装置及び情報検索処理プログラムを記憶した記憶媒体
JPH05113964A (ja) 電子辞書
JPH1021252A (ja) 情報検索装置
JPH03260869A (ja) データ検索装置及びデータ検索方法
JP4004060B1 (ja) 文字検索方法
JP3266755B2 (ja) 中国語情報処理装置
JPH10105562A (ja) 検索システム
JPH08272813A (ja) ファイリング装置
JPH0793483A (ja) 手書き文字認識方法および手書き文字認識装置
JPH03268064A (ja) データ検索装置及びデータ検索方法
JP3045886B2 (ja) 手書き入力機能付き文字処理装置
US20070033173A1 (en) Method and apparatus for data search with error tolerance
JPH0973464A (ja) 類似事例検索装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080208

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090208

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090208

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100208

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100208

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110208

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120208

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120208

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130208

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130208

Year of fee payment: 11

EXPY Cancellation because of completion of term