JPH09305716A

JPH09305716A - 入力文字列推測認識装置

Info

Publication number: JPH09305716A
Application number: JP12536096A
Authority: JP
Inventors: Keiko Gunji; 圭子郡司; Akihiro Katsura; 晃洋桂; 壮四郎 ▲葛▼貫; Soshiro Kuzunuki
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1996-05-21
Filing date: 1996-05-21
Publication date: 1997-11-28
Anticipated expiration: 2016-05-21
Also published as: JP3275704B2

Abstract

(57)【要約】【課題】キーとなる文字を手書き入力するのみで、残り
の文字列を推測し認識結果として文字列全体を出力し得
る装置の提供。【解決手段】文字認識装置において、複数の単語を階層
化し各単語を識別するための単語識別情報と階層情報を
記憶する単語辞書ａ６と、ある文字から他の文字へ遷移
する確率とその遷移関係にある文字の組合せに対応する
単語識別情報を記憶した文字遷移確率テーブルａ４と、
認識手段により得られた候補文字列を前記文字遷移確率
テーブルを用いて最適化する最適化部ａ５を設け、最適
化された候補文字列に対応する単語識別情報に基づいて
前記単語辞書を検索し、前記階層情報に対応する未入力
の単語を抽出する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、入力されたパター
ンを認識し結果を表示するパターン認識装置に関し、特
に、住所や定形句などの定まった文字列が手書き入力パ
ターン認識装置に関する。

【０００２】

【従来の技術】ＰｅｎＰＣ（ペン入力コンピュータ）な
どの伝票処理等では、住所や定形句の入力が用途として
多い。従来の住所や定形句の入力方法としては、（１）
メニューによる選択や、（２）文字認識とメニューの組
み合わせで、郵便番号を入力すると、関連する住所をメ
ニューで表示し、選択する方法、（３）手書き入力した
文字を認識し、その候補を単語辞書で最適化する方法な
どが開示されている。

【０００３】（１）のメニューによる方法は、例えば、
文献「文字位置のずれを許容する枠なし筆記住所認識」
（電子情報通信学会論文誌Ｄ−２，１９９４年１月号）
に開示されるように、住所のように階層化されたデータ
では、上位階層から順々に下位まで（例えば、「茨城
県」→「日立市」→「大みか町」のように）選択する方
法が一般的である。そこで、もし、「日立市」と入力す
るのに、「日立市」が何県にあるのか、例えば「茨城
県」か「栃木県」か分からなかったら、なかなか「日立
市」を選べない問題がある。

【０００４】（２）の郵便番号を入力すると、関連する
住所をメニューで表示する方法は、郵便番号のみ文字入
力し、あとは、郵便番号から決まる地名はメニューで選
べるので、比較的容易に入力可能である。しかし、自分
の住所の郵便番号は覚えられるが、他の郵便番号まで覚
えるのは困難である。

【０００５】（３）の手書き入力した文字を認識し、そ
の候補を単語辞書で最適化する方法について、図面を用
いて説明する。図３は、従来の文字認識の構成図であ
る。タブレットａ１より入力された手書きパターンを認
識辞書ａ２とパターンマッチして文字認識ａ３し、得ら
れた候補文字を単語辞書ａ６と単語照合ｂ７し、該当す
る単語をＬＣＤａ８に表示する。

【０００６】図４に、従来の文字認識を用いて住所を入
力する場合の動作概要図である。例えば、「茨城県日
立市大みか町」と入力するには、「茨城県日立市
大みか町」と全部を所定の住所入力エリアｂ１に手書き
入力する。すると、文字認識ａ３し、得られた候補文字
を単語辞書ａ６を用いて、最上位階層の都道府県から単
語照合し、候補文字を最適化し、結果を候補文字として
出力していた。

【０００７】従来、住所のような階層データを最上位の
階層からアクセスしていたのは、一般に階層の上位ほど
データ量が少なく、上位が決まれば下位の候補を絞るこ
とができたからである。もし、仮に従来のシステムで
「大みか」というキーワードを入力して、単語辞書を検
索したならば、どの階層にあるかも分からないので、約
１.５ＭＢもある単語辞書を全文検索するしかなく、オ
ンライン文字認識のように応答性が必要な場合には実用
的でなかったためである。

【０００８】（（住所単語辞書の例）都道府県：約５０個×約３文字×２バイト＝約３００Ｂ市町村：約４０００個×約３文字×２バイト＝約２.５ＫＢそれ以下：約１６００００個×約４文字×２バイト＝約１.３ＭＢ合計：約１.５ＭＢ）しかし、従来の方式のように、例えば「茨城県日立市
大みか町」と、長い住所を全部を手書き入力しなけれ
ばならないのでは、ユーザにとっては大変である。

【０００９】

【発明が解決しようとする課題】上記従来技術（１）〜
（３）に共通する問題点としては、文字認識利用の例で
は、住所や定形句などを全て手書き入力する必要があり
ユーザにとって煩わしい点、また、単語辞書を最上位以
外の階層から探索すると探索に膨大な時間を要してしま
う点、メニューにより選択する場合においても住所のよ
うに階層構造になっていると、上位が分からないと下位
を選択できない点がある。

【００１０】本発明の目的は、キーとなる文字（例えば
「大みか」や「〜みか町」）を手書き入力するのみで、
残りの文字列（例えば「茨城県日立市」）を推測し認
識結果として文字列全体（例えば「茨城県日立市大
みか町」）を出力し得るパターン認識装置を提供するこ
とにある。

【００１１】

【課題を解決するための手段】本発明の特徴は、入力さ
れた文字列を認識する認識手段を有し、認識された結果
を表示する文字認識装置において、複数の単語を階層化
し各単語を識別するための単語識別情報及び階層情報を
記憶する単語辞書と、少なくとも、ある文字から他の文
字へ遷移する確率とその遷移関係にある文字の組合せに
対応する単語識別情報を記憶した文字遷移確率テーブル
と、前記認識手段により得られた候補文字列を前記文字
遷移確率テーブルを用いて最適化する手段と、最適化さ
れた候補文字列に対応する単語識別情報に基づいて前記
単語辞書を検索し、前記階層情報に対応する未入力の単
語を抽出する検索手段とを設けたことにある。

【００１２】これにより、例えば、「大みか町」とのみ
入力された場合であっても、前記最適化手段により最適
化された候補文字として「大みか町」が抽出され、この
文字列に対応する単語識別情報に基づいて単語辞書が検
索され、この単語識別情報と共に記憶された階層情報に
より、「大みか町」の上位の階層である「茨城県日立
市」が抽出されるため、未入力の文字列を含む「茨城県
日立市大みか町」を認識結果として得ることが可能
となる。

【００１３】また、本発明の他の特徴は、入力された文
字列を認識する認識手段を有し、認識された結果を表示
する文字認識装置において、予め複数の文字列群をそれ
ぞれ固有のアドレスに記憶する辞書と、少なくとも、あ
る文字から他の文字へ遷移する確率と前記複数の文字列
群のうち前記遷移関係にある文字の組合せを含む文字列
群のアドレスとをそれぞれ対応付けて記憶した文字遷移
確率テーブルと、前記認識手段により得られた候補文字
列を前記文字遷移確率テーブルを用いて最適化する手段
とを有し、前記最適化された候補文字列に対応する文字
列群のアドレスにより前記辞書をアクセスし、このアド
レスに対応する前記辞書中の文字列群を認識結果として
表示するようにしたことにある。

【００１４】

【発明の実施の形態】以下、図面を用いて、手書きによ
り住所を入力する装置に本発明を適用した場合を例とし
て説明する。

【００１５】図２は、本発明の一実施例である手書き入
力住所認識装置の動作概要図である。住所入力エリアｂ
１に、スタイラスペンａ９で、住所のキーとなる文字
「大みか」を手書き入力する。すると、手書きされたス
トローク（筆跡）は、文字認識ａ３により認識され、キ
ーワードの候補文字，第一候補「大みか」と第二候補
「犬るカ」が得られる。これらの候補文字を、文字遷移
確率テーブルａ４にある文字間の遷移確率（（文字Ａ）
→（文字Ｂ）に続く確率）と、文字の出現確率テーブル
ａ８を参照し、候補文字をどのように組み合わせると、
文字列として出現確率が高くなるかを求め、文字列とし
ての出現確率が高くなるように、候補文字の順位を最適
化する。さらに、文字遷移確率テーブルの候補単語Ｎo.
を参照し、候補文字列にある文字遷移を含む単語のポイ
ンタを求める。図の例では、「大みか」と候補文字を組
み合わせると出現確率が高くなり、文字遷移確率テーブ
ルより、（大→み）と（み→か）を含む単語のポインタ
Ｎo.Ａ１１が求められる。本方式では、文字認識の後処
理に用いる、遷移確率テーブルに、新たに単語辞書中の
単語へのポインタを設けるにより、高速に目的の単語に
アクセスすることができる。そして、単語辞書中で該当
する単語が分かったら、単語辞書の階層情報により、上
位の階層は一意に求められる。この例では、最下位の階
層の「大みか町」が一意に求められたので、上位は「茨城
県日立市」と一意に求めることができる。従って、
「大みか」しか手書き入力していないのに、「茨城県
日立市大みか町」と、住所を頭から候補表示し、入力
することができる。

【００１６】図１は、本発明の一実施例である手書き入
力住所認識装置の機能ブロック図である。図１を用いて
動作を簡単に説明する。スタイラスペンａ９をタブレッ
トａ１上に滑らせることにより、手書き文字パターンが
入力される。入力された手書きパターンを、認識辞書ａ
２にある文字パターンとマッチングして文字認識ａ３す
る。文字認識の結果得られた候補文字の候補順位を最適
化するために、あらかじめ学習して作成してある、文字
間の遷移確率と文字遷移を含む単語辞書中の候補単語の
ポインタが載っている遷移確率テーブルａ４及び文字の
出現確率テーブルａ８を参照し、文字列としての出現確
率が高くなるように候補順位を最適化するとともに、最
適化した文字列が該当する単語辞書中の単語へのポイン
タを求める（ａ５）。前記方法で求めた単語辞書ａ６の
単語と候補文字列を照合し、該当する単語とその前後の
情報を単語辞書の階層情報より求める（ａ７）。求めら
れた結果をＬＣＤａ８に表示する。

【００１７】尚、本発明の特徴である、［１］遷移確率
テーブルａ４の作成方法、［２］遷移確率テーブルａ４
を用いて、候補文字を文字列としての出現確率が高くな
るように候補順位を最適化するとともに、最適化した文
字列にある文字遷移を含む単語へのポインタを求める方
法、［３］求めた単語のポインタを利用して手書き入力
した単語（キーワード）を含む文字列を推測する方法、
［４］推測した文字列の表示方法については、後に図面
を用いて詳細に説明する。

【００１８】図５は、本発明の一実施例である手書き入
力住所認識装置のハード構成図である。入力パターンと
辞書パターンをマッチングする機能、パターンマッチン
グにより得られた候補文字を最適化し、候補文字を含む
単語へのポインタを求める機能、候補文字を単語照合し
て、さらに前後の情報を検索する機能は、例えば、ＲＯ
Ｍc5に記憶してあるプログラムをＣＰＵc3が読みだし、
実行することにより実現される。尚、各機能について
は、後に図面を用いて詳細に説明する。

【００１９】［１］遷移確率テーブルａ４の作成方法図６は、遷移確率テーブルａ４の作成方法を説明するフ
ロー図である。まず、学習用の単語辞書ａ６を読み出す
ｄ１。読み出した単語について、単語中に含まれる文字
の出現回数をカウントし（ｄ２）、出現回数テーブルｄ
３に記録する。続いて、文字遷移回数をカウントし（ｄ
４），遷移回数テーブルｄ６に記録する。続いて、遷移
回数テーブルｄ６に、文字遷移が含まれた元の単語の単
語Ｎo.（単語のポインタ）を記録するｄ５。例えば、単
語「大みか」の例では、文字の出現回数は、「大」
「み」「か」それぞれ１回、文字遷移回数では「大→
み」と「み→か」がそれぞれ１回とカウントされる。ま
た、「大→み」と「み→か」の候補単語Ｎo.には、単語
「大みか」の単語Ｎo.が記録される。このような処理ｄ
１〜ｄ６を、単語辞書ａ６中の全ての単語について繰り
返し行う。その後、前記処理により作成した文字出現回
数テーブルｄ３と文字遷移回数テーブルｄ６を参照し
て、文字間の遷移確率と文字遷移を含む候補単語Ｎo.の
情報を記述した遷移確率テーブルａ４を作成する（ｄ
９）。さらに、必要があれば、文字出現回数テーブルｄ
３を参照して、文字毎の出現確率を記述した文字出現確
率テーブルｄ８を作成する（ｄ７）。それぞれのテーブ
ルの構成については、以下図面を用いて説明する。

【００２０】図７は、単語辞書の概要図である。ここで
は例として、住所の単語辞書ａ６を示す。この辞書は、
都道府県・市町村・それ以下で階層化された構造になっ
ており、各要素は、単語Ｎo.（単語の位置情報），上位
単語Ｎo.，単語（文字列）からなる。各単語にアクセス
するには、単語Ｎo.によりアクセスできる。また、単語
の階層関係は、上位単語Ｎo.によって分かる。

【００２１】図８は、文字出現回数テーブルの概要図で
ある。文字出現回数テーブルｄ３には、学習用単語辞書
中に各文字が現れた回数が記憶され、学習用単語中の全
文字数をカウントするのに用いられる。

【００２２】図９は、文字遷移回数テーブルの概要図で
ある。文字遷移回数テーブルｄ６は、学習用単語辞書中
に各文字遷移が現れた回数と、文字遷移が含まれていた
単語のＮo.（候補単語Ｎo.）を記録するのに用いる。

【００２３】図１０は、文字出現確率テーブルの概要図
である。例えば、文字「日」の出現確率は、出現確率
（日）＝出現回数（日）／全文字数で表せる。従って、
文字出現確率テーブルｄ８を作成するには、文字出現回
数テーブルｄ３を参照し、各文字の出現回数を求め、文
字出現確率テーブルｄ８に記録すればよい。

【００２４】図１１は、文字遷移確率テーブルの概要図
である。例えば、文字遷移「日→立」の遷移確率は、遷移
確率（日→立）＝遷移回数（日→立）／出現回数（日）
で表せる。従って、文字遷移確率テーブルａ４を作成す
るには、文字出現回数テーブルｄ３と文字遷移回数テー
ブルｄ６を参照して、各文字の遷移確率を求め、文字遷
移確率テーブルａ４に記録すればよい。

【００２５】以上の処理により、単語辞書の単語へのポ
インタのついた遷移確率テーブルａ４を作成することが
できる。尚、本実施例においては、単語辞書中の各単語
を識別するための単語識別情報として単語Ｎo.を用いた
が、これに限られるものではなく、コード情報であって
も良い。また、同様に、単語辞書中の単語間の階層関係
を示す階層情報として上位単語Ｎo.を用いたが、これに
限られるものではなく、階層関係を表わし得るものであ
れば良く、例えばコード情報であっても良い。

【００２６】［２］遷移確率による後処理（候補文字の
最適化と候補単語のポインタの決定）方法図１２は、遷移確率テーブルを用いて行う文字認識後処
理の概要図である。図のように、入力パターン「大み
か」の候補文字が、第一候補「大るか」・第二候補「犬
みカ」であるとする。尚、ここでは文字認識結果に誤り
がある場合でも、遷移確率による候補文字の最適化で対
応できることを示すため、特に、図２の例とは異なる
「大みか」を誤認識した例を用いて説明する。候補文字
の組み合わせは、図に示す８通りが考えられる。これら
文字列の組について、文字遷移確率テーブルを参照し
て、文字列の出現確率と単語辞書中の単語候補の単語の
ポインタを求める。文字列の出現確率が高い候補文字の
組合せが、最適な組み合わせ（パス）である。従って、
その文字組を候補単語Ｎo.と共に遷移確率後処理の結果
とする。

【００２７】それでは、まず、文字列の出現確率の計算
方法を述べる。一般に、文字列Ｓ１Ｓ２ …Ｓｎの出
現確率は、次式で近似できる。

【００２８】

【数１】出現確率（Ｓ１Ｓ２ …Ｓｎ）＝出現確率(Ｓ１)×遷移確率(Ｓ１→Ｓ２)×…×遷移確率(Ｓｎ−１→Ｓｎ) …（数１）図の候補文字の組み合わせＮo.３の「大みか」の例で
は、以下の通りとなる。出現確率（大みか）＝出現確率
（大）×遷移確率（大→み）×遷移確率（み→か）具体的には、遷移確率テーブルａ４と出現確率テーブル
ａ８とにより、次式の通り値が求められる。

【００２９】

【数２】出現確率（大みか）＝(１８／８９２７４)×(１／１８)×(２／１５)×(２／１９８) ＝１４９４０×１０~⁸％ …（数２）次に、候補単語Ｎo.（単語辞書中の単語候補のポインタ
０を求める方法を述べる。文字列Ｓ１Ｓ２ …Ｓｎの
候補単語Ｎo.は、次式のように求めることができる。

【００３０】

【数３】候補単語Ｎo.（Ｓ１Ｓ２ …Ｓｎ）＝候補単語Ｎo.(Ｓ１→Ｓ２)∩…∩候補単語Ｎo.(Ｓｎ−１→Ｓｎ) …（数３）図の例、文字列「大みか」の場合は、文字遷移確率テー
ブルａ４により次式のようになる。

【００３１】

【数４】候補単語Ｎo.（大みか）＝∩候補単語Ｎo.(大→み)∩候補単語Ｎo.(み→か) ＝(Ａ１１)∩(Ａ１１，Ａ１２）＝Ａ１１ …（数４）この例では、アンド（∩）をとることにより、候補を
「大みか町」（Ａ１１）に絞ったが、オア（∪）をとり
候補を「大みか町」と「みかの原町」にしてもよい。こ
の場合、一致数を考慮すれば「大みか町」を第一候補に
することができる。

【００３２】以上の方法により、文字認識により得られ
た候補文字を文字列としての出現確率が高くなるように
最適化し、最適化した候補文字列の候補単語Ｎo.（単語
へのポインタ）を求めることができる。尚、上記の方法
によれば、例えば、「大みか町」の一部分である「み
か」のみを入力しても、「大みか町」と「みかの原町」
を候補にすることができる。

【００３３】［３］手書き入力した単語（キーワード）
を含む文字列の推測方法続いて、最適化した候補文字列（手書き入力したキーワ
ード）を含む文字列全体の推測方法について、図面を用
いて説明する。

【００３４】図１３は、後処理結果により文字列を推測
する概要図である。この例では、遷移確率による後処理
でキーワード（候補文字）「大みか」と候補単語Ｎo.Ａ
１１が得られた場合を示す。この図から分かるように、
キーワード「大みか」は単語辞書中に１つしかなく、ま
た最下位の階層なので、上位の文字列「茨城県日立
市」は一意に決まる。そこで、手書き文字「大みか」の
全体の推測結果として、候補文字列「茨城県日立市
大みか町」を表示した。

【００３５】図２２は、図１３と同様の例であるが、手
書き文字「大みか」の候補文字列として、文字列推測結
果の「茨城県日立市大みか町」と推測結果なしの文
字認識結果の「大みか町」を両方候補として出し、ユー
ザが選択できるようにしたことが特徴である。このよう
に、キーワードから推測した文字列と推測なしのキーワ
ードのみの両方を候補にすると、ユーザは好みの方を選
べる利点がある。

【００３６】図１４は、後処理結果により文字列を推測
する概要図である。この例では、遷移確率による後処理
の結果、単語辞書の中間階層の単語である「日立」（候
補単語Ｎo.Ａ１）得られた場合を示す。図より分かるよ
うに、キーワード「日立」は、単語辞書テーブル中に１
つしかないので、上位階層の文字列「茨城県」は一意に
決まる。しかし、下位の階層は複数あるので、例えば、
候補を「茨城県日立市大みか町」「茨城県日立市
みかの原町」・・・と複数表示し、ユーザに選択して
もらえば良い。

【００３７】図１５は、図１４と同様に後処理の結果単
語辞書の中間階層の単語である「日立」（候補単語Ｎo.
Ａ１）遷移確率による得られ、下位の候補が複数ある例
である。この図の例では、単語辞書には各都市毎の人口
情報を保持しており、複数ある下位の階層のうち、人口
の多い町を優先的に高い候補順位で表示することによ
り、操作性を向上している。

【００３８】図１６は、図１５と似ているが、単語辞書
には人口情報の代わりに、単語間の遷移確率をもってい
る。複数ある下位の階層のうち、遷移確率の高い単語を
優先的に高い候補順位で表示することにより、操作性を
向上できる。この単語間の遷移確率は、地名がよく現れ
るテキストなどから学習することができる。また、簡易
には、都市の人口により頻度を決定して学習してもよ
い。

【００３９】図２１は、図１４と同様に後処理の結果単
語辞書の中間階層のキーワード「日立」（単語Ｎo.Ａ
１）が得られ、下位の候補が一意に定まらない例であ
る。図１４と異なるのは、一意に候補が決まった「茨城
県日立市」のみを表示しており、一意に定まらない市
町村以下は、ユーザが再度入力するようにした点であ
る。

【００４０】以上より、わかるように、キーワードより
上位の階層は、自動で一意に推測できるし、キーワード
より下位の候補が複数ある場合は、一意には定められな
いので、メニューを提示したり、その部分だけ際入力し
てもらえばよい。

【００４１】［４］推測した文字列の表示方法さて、次に、上記方法で求めた文字列候補の表示の仕方
について述べる。図１７〜図２０は、推測した文字列の
表示形態を示す図である。いずれも「大みか町」と入力
して、推測認識結果の文字列「茨城県日立市大みか
町」を表示しているが、各々表示の位置を変えて、特徴
を出している。

【００４２】図１７では、「大みか町」と手書きした近
くに候補文字列「茨城県日立市大みか町」の中の「大
みか町」の部分を表示している。この表示方法では、手
書きした筆跡と認識結果の候補を対比しやすいメリット
がある。

【００４３】さて、図１８は、「大みか町」と手書きし
た位置の近くから、「茨城県日立市大みか町」と表
示している。この表示方法では、手書き文字と候補文字
列の頭が揃っているので、結果の表示開始位置が容易に
分かるメリットがある。

【００４４】図１９では、「大みか町」と手書きした位
置を中心として、候補文字列「茨城県日立市大みか
町」と表示している。この表示方法では、手書き文字と
候補文字列の位置が全体的に見て一番近く、視点をあま
り動かさなくて済むというメリットがある。

【００４５】図２０では、「大みか町」と手書きした終
りの位置と候補文字列「茨城県日立市大みか町」の
最後の文字の位置を揃えてと表示している。この表示方
法では、特に右利きのユーザでは、ペンを持った手の下
に候補文字列が隠れないメリットがある。

【００４６】図１７〜図２０のように、各々特徴ある表
示方法があるが、システムが適宜どれか１つの方法に決
めてもよいし、ユーザが複数の表示方法から自分にあっ
た表示方法を選択できるようにしてもよい。

【００４７】また、図１７〜図２０では、候補文字列中
のキーワード「大みか」を反転表示して分かりやすくし
ているが、例えばフォントを変えるなど、他の方法でも
よい。また、特に反転表示やフォントを変えるなどを行
わなくてもよい。

【００４８】以上、本実施例によれば、住所のような階
層データや定形句などを入力する際に、キーとなる文字
を入力するだけで、文字列全体を推測し、候補として表
示することができる。また、単語辞書に高速にアクセス
して単語照合することができ、上記実施例のように単語
辞書が階層化されているときでも、階層の上位・下位に
関係なく高速にアクセスができる。

【００４９】

【発明の効果】本発明によれば、キーとなる文字を手書
き入力するのみで、残りの文字列を推測し認識結果とし
て文字列全体が出力されるので、操作性が大幅に向上で
きる。

【図面の簡単な説明】

【図１】本発明の一実施例である手書き入力住所認識装
置の機能ブロック図である。

【図２】本発明の一実施例である手書き入力住所認識装
置の動作概要図である。

【図３】従来の文字認識装置の構成図である。

【図４】従来の文字認識装置を用いて住所入力する場合
の動作概要図である。

【図５】本発明の一実施例である手書き入力住所認識装
置のハード構成図である。

【図６】文字遷移確率テーブルの作成方法を説明するフ
ロー図である。

【図７】単語辞書の概要図である。

【図８】文字出現回数テーブルの概要図である。

【図９】文字遷移回数テーブルの概要図である。

【図１０】文字出現確率テーブルの概要図である。

【図１１】文字遷移確率テーブルの概要図である。

【図１２】遷移確率テーブルを用いて行う文字認識後処
理方法の概要図である。

【図１３】後処理結果より文字列を推測する概要図であ
る。

【図１４】後処理結果より文字列を推測する概要図であ
る。

【図１５】後処理結果より文字列を推測する概要図であ
る。

【図１６】後処理結果より文字列を推測する概要図であ
る。

【図１７】推測した文字列の表示形態を示す図である。

【図１８】推測した文字列の表示形態を示す図である。

【図１９】推測した文字列の表示形態を示す図である。

【図２０】推測した文字列の表示形態を示す図である。

【図２１】後処理結果より文字列を推測する概要図であ
る。

【図２２】後処理結果より文字列を推測する概要図であ
る。

【符号の説明】

ａ１…タブレット、ａ２…認識辞書、ａ３…文字認識
部、ａ４…遷移確率テーブル、ａ５…候補文字最適化と
単語のポインタ決定部、ａ６…単語辞書、ａ７…単語照
合と文字列推測部、ｄ１…学習用単語の読み出し部、ｄ
２…文字出現回数のカウント部、ｄ３…文字出現回数テ
ーブル、ｄ４…文字遷移回数のカウント部、ｄ５…文字
遷移を含む候補単語記憶部、ｄ６…文字遷移回数テーブ
ル、ｄ７…文字出現確率テーブル作成部、ｄ８…文字出
現確率テーブル、ｄ９…文字遷移確率テーブル作成部。

Claims

【特許請求の範囲】

【請求項１】入力された文字列を認識する認識手段を有
し、認識された結果を表示する文字認識装置において、複数の単語を階層化し、各単語を識別するための単語識
別情報及び階層情報を記憶する単語辞書と、少なくとも、ある文字から他の文字へ遷移する確率及び
当該遷移関係にある文字の組合せに対応する前記単語識
別情報を記憶した文字遷移確率テーブルと、前記認識手段により得られた候補文字列を前記文字遷移
確率テーブルを用いて最適化する手段と、前記最適化された候補文字列に対応する単語識別情報に
基づいて前記単語辞書を検索し、前記階層情報に対応す
る未入力の単語を抽出する検索手段とを設けたことを特
徴とする文字認識装置。
【請求項２】請求項１において、前記階層情報は、前記
単語辞書中の各単語に対し上位の関係にある単語の単語
識別情報であることを特徴とする文字認識装置。
【請求項３】請求項２において、前記検索手段は、未入
力の単語として前記最適化された文字列に対し上位の関
係にある単語を前記単語辞書より抽出することを特徴と
する文字認識装置。
【請求項４】入力された文字列を認識する認識手段を有
し、認識された結果を表示する文字認識装置において、予め複数の文字列群を、それぞれ固有のアドレスに記憶
する辞書と、少なくとも、ある文字から他の文字へ遷移する確率と、
前記複数の文字列群のうち前記遷移関係にある文字の組
合せを含む文字列群のアドレスとをそれぞれ対応付けて
記憶した文字遷移確率テーブルと、前記認識手段により得られた候補文字列を前記文字遷移
確率テーブルを用いて最適化する手段とを有し、前記最適化された候補文字列に対応する文字列群のアド
レスにより前記辞書をアクセスし、当該アドレスに対応
する前記辞書中の文字列群を認識結果として表示するこ
とを特徴とする文字認識装置。
【請求項５】請求項１又は４において、前記最適化手段
は、前記認識手段により得られる複数の候補文字列のう
ち各候補文字列を構成する文字間の遷移確率が最大とな
る候補文字列を、最適化された候補文字列として決定す
ることを特徴とする文字認識装置。
【請求項６】請求項１又は４において、前記文字列は、
手書きにより入力されることを特徴とする文字認識装
置。
【請求項７】請求項１又は４において、前記文字列は、
音声により入力されることを特徴とする文字認識装置。
【請求項８】文字パターンを入力する手段と、入力され
た文字パターンを認識する手段と、認識結果を表示する
手段を有する文字認識装置において、予め複数の単語を登録した単語辞書と、予め学習した文字間の遷移確率とその文字遷移を含む単
語辞書の単語へのポインタを記述した文字遷移確率テー
ブルと、文字間の遷移確率を用いて文字認識の候補文字列を最適
化するとともに、文字認識の候補文字列の文字遷移を含
む単語辞書の単語のポインタを求める手段と、前記最適化された候補文字列を、前記求めた単語のポイ
ンタを使って参照した単語辞書中の単語と照合するとと
もに、その単語に関連する情報を単語辞書より推測する
手段を備えたことを特徴とするパターン認識装置。
【請求項９】請求項８のパターン認識装置において、前
記単語辞書の単語は階層化されたデータであることを特
徴とするパターン認識装置。
【請求項１０】請求項８のパターン認識装置において、
前記文字パターンは手書きにより入力されるものであっ
て、前記推測手段により推測した候補文字列を、前記手
書き入力パターンの近傍に表示することを特徴とするパ
ターン認識装置。
【請求項１１】請求項１０のパターン認識装置におい
て、前記候補文字列のうち、前記手書き入力パターンに
対応する部分のみ、色を反転又はフォントを変更し表示
することを特徴とするパターン認識装置。
【請求項１２】入力された文字パターンを認識し、認識
結果を表示する文字認識方法において、入力された文字パターンを認識し候補文字列を抽出し、抽出された候補文字列を、予め学習した文字間の遷移確
率とその文字遷移を含む単語辞書の単語へのポインタを
記述した文字遷移確率テーブルを用いて最適化し、最適化された候補文字列の文字遷移を含む単語辞書の単
語のポインタを求め、前記単語辞書に登録された複数の単語のうち、前記求め
た単語のポインタを用いて得られる一つの単語と前記最
適化された候補文字列とを照合し、当該単語に関連する情報を単語辞書より推測し、推測結
果を候補文字列として表示することを特徴とするパター
ン認識方法。
【請求項１３】請求項１２のパターン認識方法におい
て、前記単語辞書の単語は階層化されたデータであるこ
とを特徴とするパターン認識方法。
【請求項１４】請求項１２のパターン認識方法におい
て、前記文字パターンは手書きにより入力されるもので
あって、推測した候補文字列を、入力された手書き文字
パターンの近傍に表示することを特徴とするパターン認
識方法。
【請求項１５】請求項１４のパターン認識方法におい
て、前記候補文字列のうち、前記手書き入力パターンに
対応する部分のみ、色を反転又はフォントを変更し表示
することを特徴とするパターン認識方法。