JP2968221B2

JP2968221B2 - 手書き文字認識方法及び装置

Info

Publication number: JP2968221B2
Application number: JP8328758A
Authority: JP
Inventors: 正嶋　　博; 泰福永; 壮四郎葛貫; 雅樹三浦; 登志美横田; 敏彦松田
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1996-12-09
Filing date: 1996-12-09
Publication date: 1999-10-25
Anticipated expiration: 2014-10-25
Also published as: JPH09204497A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、手書きストロークを認
識することにより文字入力を行う手書文字認識装置に係
り、特に、その認識率を向上させる手書文字認識の方式
に関する。

【０００２】

【従来の技術】従来の手書文字認識装置は、特公昭63-4
9264号公報に記載のように、漢字仮名混じりの不完全熟
語(例えば“計算キ")を正しい熟語（“計算機”）に変
換するために、使用者が上記文字列“計算キ”を認識装
置に指示する必要があった。また、特開昭60-7585号公
報に記載のように、認識結果から単語整合を行う際、あ
る入力に対する認識結果がすべて同字種の場合にのみ、
その部分を単語領域として切り出していた。

【０００３】

【発明が解決しようとする課題】上記従来技術の前者に
おいては、仮名漢字変換する文字列をいちいち使用者が
指定しなければならず、操作性の点で考慮が不足してい
た。

【０００４】また、上記従来技術の後者においては、一
つの入力文字に複数字種の認識結果が得られたとき、単
語領域を安定に抽出できないという問題があった。

【０００５】本発明の目的は、認識候補から同字種の文
字列を抽出することにより、操作性／処理性に優れた文
字認識方法および装置を提供することにある。

【０００６】本発明の他の目的は、認識候補から同字種
の文字列を抽出し、仮名文字列については仮名漢字変換
することにより、操作性／処理性に優れた文字認識方式
および装置を提供することにある。

【０００７】本発明の更に他の目的は、認識候補から同
字種の文字列を抽出し、それらのうち平仮名／片仮名文
字列を仮名漢字変換し、上記変換結果も含めて単語整合
することにより、操作性／処理性に優れた文字認識方式
および装置を提供することにある。

【０００８】

【課題を解決するための手段】上記目的を達成するため
の本発明の第１の態様によれば、手書の筆跡情報から文
字を認識する手書文字認識方法であって、入力された手
書文字について、認識候補文字を選定し、認識候補文字
から成る文字列が、漢字と仮名文字で構成される場合
に、仮名文字については、変換辞書を用いて、漢字に変
換し、変換結果として得られた漢字と、前記文字列を構
成する漢字とから成る漢字列を単語辞書と照合し、単語
辞書に存在する漢字列と一致した漢字列を認識結果とす
ることを特徴とする手書文字認識方法が提供される。

【０００９】上記目的を達成するための本発明の第２の
態様によれば、手書の筆跡情報から文字を認識する手書
文字認識方法であって、入力された手書文字について、
認識候補文字を選定し、選定された認識候補文字のう
ち、一部の文字については、変換辞書を用いて、文字種
の変換を行い、変換結果として得られた文字と、変換さ
れなかった認識候補文字とから成る文字列を、単語辞書
と照合し、単語辞書に存在する文字列と一致した文字列
を認識結果とすることを特徴とする手書文字認識方法が
提供される。

【００１０】上記目的を達成するための本発明の第３の
態様によれば、手書の筆跡情報から文字を認識する手書
文字認識方法であって、入力された手書文字について、
認識候補文字を選定し、認識候補文字に対して仮名漢字
変換を施し、変換結果として得られた漢字、認識候補文
字として元から存在する漢字、認識候補文字として元か
ら存在する仮名文字の組み合わせによる文字列を単語辞
書と照合し、単語辞書に存在する文字列と一致した文字
列を認識結果とすることを特徴とする手書文字認識方法
が提供される。

【００１１】上記目的を達成するための本発明の第４の
態様は、以下の通りである。

【００１２】すなわち、手書の筆跡情報を入力する手段
と、入力された筆跡情報から、手書文字についての認識
候補文字を選定する手段と、認識候補文字から成る文字
列が、漢字と仮名文字で構成される場合に、仮名文字に
ついては、変換辞書を用いて、漢字に変換する手段と、
変換結果として得られた漢字と、前記文字列を構成する
漢字とから成る漢字列を単語辞書と照合する手段と、単
語辞書に存在する漢字列と一致した漢字列を認識結果と
して出力する手段と、を備えたことを特徴とする手書文
字認識装置が提供される。

【００１３】上記目的を達成するための本発明の第５の
態様は、以下の通りである。

【００１４】すなわち、手書の筆跡情報を入力する手段
と、入力された筆跡情報から、手書文字についての認識
候補文字を選定する手段と、選定された認識候補文字の
うち、一部の文字については、変換辞書を用いて、文字
種の変換を行う手段と、変換結果として得られた文字
と、変換されなかった認識候補文字とから成る文字列
を、単語辞書と照合する手段と、単語辞書に存在する文
字列と一致した文字列を認識結果として出力する手段
と、を備えたことを特徴とする手書文字認識装置が提供
される。

【００１５】上記目的を達成するための本発明の第６の
態様は、以下の通りである。

【００１６】すなわち、手書の筆跡情報を入力する手段
と、入力された筆跡情報から、手書文字についての認識
候補文字を選定する手段と、認識候補文字に対して仮名
漢字変換を施す手段と、変換結果として得られた漢字、
認識候補文字として元から存在する漢字、認識候補文字
として元から存在する仮名文字の組み合わせによる文字
列を単語辞書と照合する手段と、単語辞書に存在する文
字列と一致した文字列を認識結果として出力する手段
と、を備えたことを特徴とする手書文字認識装置が提供
される。

【００１７】

【作用】本発明によれば、入力された手書文字につい
て、まず、認識候補文字が選定される。

【００１８】選定された認識候補文字のうち、一部の文
字については、変換辞書を用いて、文字種の変換が行わ
れる。

【００１９】文字種の変換は、仮名漢字変換であっても
構わない。

【００２０】そして、変換結果として得られた文字と、
変換されなかった認識候補文字とから成る文字列につい
ては、単語辞書と照合され、単語辞書に存在する文字列
と一致した文字列が認識結果とされる。

【００２１】このようにすれば、例えば、認識候補文字
として「計算キ」が選定された場合に、認識結果として
「計算機」を取得することができるようになる。

【００２２】また、認識候補文字に対して仮名漢字変換
が行なわれたのち、変換結果として得られた漢字、認識
候補文字として元から存在する漢字、認識候補文字とし
て元から存在する仮名文字の組み合わせによる文字列を
単語辞書と照合するようにしてもよい。

【００２３】このようにすれば、単語辞書と照合する文
字列が増加し、結果として、文字列の認識精度が向上す
る。

【００２４】

【実施例】以下、本発明の一実施例を第１図〜第１２図
により説明する。

【００２５】第１図に本発明を含む手書文字認識装置の
構成を示す。入力部１と表示部１１は同じ座標系上に重
ねられた入力一体化表示機構を構成している。入力部１
は、筆跡入力用ペンの動きに従い座標点列を時系列的に
出力する。表示部１１は、上記入力部１から得た座標点
列をその直下に表示し、認識等の処理後、清書情報を再
表示する。文字認識部２は、上記入力部１から得た座標
点列を１文字毎に切りだし、予め保持している標準パタ
ーン辞書（図示せず）との間で類似度を求め、該類似度
の高い順に候補文字として出力する。同字種文字列切り
だし部３は、前記文字認識部２から得た候補文字群から
時系列的に平仮名／片仮名／漢字／英数字等の字種別の
文字列をその位置情報と共に出力する。本文字列切りだ
し部３は、字種指定レジスタにより切り出す文字列の種
類を指定することが可能である。仮名漢字変換部４は、
上記文字列切りだし部３から得た平仮名／片仮名文字列
を変換辞書５により漢字混じり熟語等に変換し、その結
果の文字列を上記文字認識部２から得た候補文字群に加
える。単語整合部６は上記変換された文字を含めて上記
文字列切りだし部３から得た同字種文字列から単語辞書
７を用いて単語を抽出し、一致した文字を上記候補文字
群の第１候補として出力する。文書管理部８は、上記処
理から得た候補文字群から第１候補を抽出してそれらを
文書バッファ９に格納し、上記候補文字群を候補文字バ
ッファ１０に格納する。

【００２６】入力部１としては、例えば透明の静電誘導
タブレット、感圧タブレット等が利用できる。表示部１
１としては、ＣＲＴあるいは液晶／プラズマ等の平面デ
ィスプレイを利用できる。これらの技術は既に公知であ
り、本実施例では特に詳細な動作を述べない。また、文
字認識部２は、その認識手法について特に限定するもの
ではなく、例えば特開昭60-237580号で開示されるよう
な入力筆跡の近似特徴を用いる方式等を利用できる。

【００２７】以下、本装置の詳細な動作を述べる。

【００２８】第２図に、本装置を用いて手書文字入力を
行う場合の処理の一例の流れを示す。

【００２９】初期設定Ａでは装置の起動と共に以下の処
理で使用するレジスタ／バッファの初期化を行なう。終
了確認Ｂは、第１図では示さなかったがメニュー等によ
り本装置の文字入力機能を終了させる処理である。入力
Ｃは、入力部１の処理であり、文字認識用の筆跡入力が
あると、その座標情報を次の文字認識Ｄに渡す。文字認
識Ｄは、入力された筆跡から一文字分の座標情報を切り
だし、それらを予め設定した標準パターン辞書のデータ
構造に変換し、類似度の高い順に候補文字群を出力す
る。同字種文字列切りだしＥは、同種文字列切り出し部
３の処理であり、上記文字認識Ｄから得た候補文字群を
順次取り込みながら、平仮名／片仮名字種の文字列を切
り出す。単語整合Ｆは、単語整合部６の処理であり、上
記文字列切りだしＥから得た平仮名／片仮名文字列を予
め設定した単語辞書との間で比較し、一致した文字列を
抽出してそれらを上記候補文字群の第１候補の認識結果
と入れ替える。このとき、単語辞書７とマッチングがと
れた文字についてはマーカーを付加する。仮名漢字変換
Ｇは、仮名漢字変換部４の処理であり、上記平仮名／片
仮名文字列のうち上記マーカーの無い文字列を仮名漢字
変換し、変換された漢字混じり文字列を上記候補文字群
に加える。同字種文字列切りだしＨは、上記候補文字群
から漢字／英数字種の文字列を切り出す。単語整合Ｉ
は、上記文字列切りだしＨから得た漢字／英数字種文字
列を上記単語整合Ｆと同様に予め設定した単語辞書７と
の間で比較し、一致した文字列を抽出してそれらを上記
候補文字群の第１候補の認識結果とを入れ替える。この
とき、確定した単語部分にマーカーを付加する。文書管
理Ｊは、上記単語整合Ｉから得た候補文字群から、その
第１候補を文書バッファ９に登録し、表示部１１に上記
文書バッファ９の内容を表示し、上記候補文字群を候補
文字バッファ１０に格納する。

【００３０】以下、本発明の主要部に当る同字種文字列
切りだしＥ以降の処理について詳細に述べる。

【００３１】＜同字種文字列の切りだしＥ＞第３図〜第
６図に当文字切りだし処理、第７図に本書力同時の各バ
ッファの状況、第８図に本処理終了時の各バッファの状
況をそれぞれ示す。

【００３２】の流れを、第８図／第９図にデータの動き
を示す。まず、本処理で使用されるバッファの内容を
説明する。

【００３３】第７図において、文字認識部２内に含まれ
る認識バッファは文字認識結果を格納する領域で、簡単
のため候補文字数を最大２とし、以後の仮名漢字変換結
果用に２文字分の予備領域を認識バッファに持つことに
する。文字列バッファは切りだされる同字種文字列を格
納する領域で、切り出し文字列の登録番号ｍ／先頭位置
情報Ｘ，Ｙ／文字列Ｂｓ／文字列の長さＬ／単語フラグ
の各小領域に分割されている。単語フラグは、後に説明
する単語整合処理が単語辞書と一致した文字列につける
マーカーである。単語処理レジスタは、上記マーカーを
付した文字の入力位置を示す。指定字種レジスタは、切
りだす文字種の設定に用いられる。なお、文字列バッフ
ァ、単語処理レジスタおよび指令字種レジスタは、同種
文字列切り出し部３に内包される。

【００３４】文字列バッファには、切り出された各文字
列について、その字種情報を付加してもよい。

【００３５】また、切り出し文字の先頭文字についての
みＹ情報をもたせたが、第２文字目以降の文字について
もＹ情報を持つようにしてもよい。このようにすれば、
記憶容量は増加するが、後述する候補順位の入替えの処
理が迅速に行える。

【００３６】この同字種文字列切り出し処理は、第７図
の認識バッファの入力内容に対し、最終的に第８図の文
字列バッファの内容を出力する処理を行う。

【００３７】以下、その処理を第３図の同字種文字列切
り出し処理Ｅの流れをもとに説明する。この時点で、指
定字種レジスタは、平仮名／片仮名に設定されている。

【００３８】処理３−１、３−２：第３図において、ま
ず、切り出す起点となる入力（以下、起点入力）の入力
番号Wpsをループ先頭ｉｓとして設定する。ループ変数
ｉは、当ｉｓから入力文字列の後尾Wpeまで以下の処理
を実行させる。第７図の認識バッファの第１、第２入力
文字（“こ”、“の”）についての処理が終了し、第３
入力文字からの同字種文字列切り出しが行われる場合を
例にとると、Wpsは３、入力文字列の後尾Wpeは１２とな
る。

【００３９】処理３−３：次に、切り出しの起点個数を
設定するため、上記起点入力の候補数ｎmaxに上記起点
入力の候補文字数ｎｃを設定する。第７図の認識バッフ
ァの第３入力の場合は、“シ”“三”の二つの候補を有
するためｎmaxは２となる。

【００４０】処理３−４：以下上記ｎmaxまで処理３−
５以下の同字種文字列切り出しを行う。上記ｎmaxまで
の処理が終了すると、処理３−１４で結合元入力の番号
ｉを更新し、前回登録個数ｎoldを初期化し、上記処理
３−２に戻る。

【００４１】処理３−５：上記起点入力の候補文字（以
下、起点文字）の字種Ｋを設定する。第７図の認識バッ
ファ第３入力の最初の起点文字は“シ”であるから、字
種Ｋは片仮名となる。

【００４２】処理３−６：次に、上記字種Ｋが指定字種
レジスタに設定された字種と一致するか否かを判定す
る。例では上記処理３−５により字種Ｋは片仮名であ
り、前記指定字種レジスタは平仮名／片仮名に設定され
ていたので、判定結果は肯定となり、以下の処理に進
む。否定された場合は、処理３−１５で起点入力ｉの候
補番号ｎを更新して上記処理３−４に戻り、次の起点文
字について処理３−５以下を行う。

【００４３】なお、文字コードはＪＩＳ／シフトＪＩＳ
等で字種別に割り振られているため、それらの文字コー
ド表から第１２図に示すような字種分類テーブルを作成
しておく。当字種分類テーブルは、文字種を８個のテー
ブルに分割しており、各テーブルのコード（１６進で示
す）を各文字種の先頭文字コードとしている。

【００４４】処理３−７：次に、上記起点文字と位置／
長さを文字列バッファに格納する。第４図に本処理３−
７の詳細な流れを示す。

【００４５】処理3-7-1：まず、起点文字を文字列バッ
ファのＢｓ［ｍ］に格納する。

【００４６】処理3-7-2：それと共に、文字位置（Ｘ，
Ｙ）／長さＬを格納する。ここで、Ｘ［ｍ］は起点入力
番号ｉ、Ｙ［ｍ］は起点文字の候補番号ｎに対応してい
る。例では、起点文字“シ”の文字位置はＸ［ｍ］＝
３，Ｙ［ｍ］＝１、長さＬ＝１となる。

【００４７】処理3-7-3：最後に文字列登録番号ｍを更
新する。

【００４８】処理３−８：次に、第３図に戻って同字種
の文字が何文字続くかのチェックを行うため、結合する
候補文字群の入力番号ｊｓ（以下、結合入力番号９を現
入力番号ｉの次の入力番号に初期化する。今回の処理例
の場合、ｉは３であるため、ｊｓは４となる。

【００４９】処理３−９：次に、同字種文字列探索およ
び結合処理に入る。以下の処理は、結合入力番号ｊが入
力後尾となるまで繰り返される。ただし、ｊの位置に対
応する前記単語処理レジスタの値がオンとなっている場
合および同字種の文字がとぎれた場合は、起点文字の候
補番号を更新して（処理3-1-4）、上記処理３−４に戻
る。第８図の例では、単語処理レジスタは初期状態であ
るため、上記ｊが４から１２となるまで以下の処理を実
行する。

【００５０】処理３−１０：次に結合可能な文字を得る
ため、結合入力番号ｊに対応する候補文字（以下、結合
入力文字）群から上記処理３−５で設定した文字種Ｋと
同じ字種の候補をさがす。

【００５１】第５図に処理３−１０の詳細な流れを示
す。

【００５２】処理3-10-1,-2：まず、パラメータの初期
化のため、同字種候補が１以上存在したことを示す発見
個数ｎｆを０、結合フラグＣflag［］をオフにする。

【００５３】処理3-10-3：次に、結合処理回数を設定す
るため、結合先入力の候補文字数の総数ｎjmaxを設定す
る。

【００５４】第７図から、結合先入力番号ｊ＝４のケー
スでは第４入力の候補文字は“ヌ／ス”であり、ｎjmax
は２となる。

【００５５】処理3-10-4：以降、同字種文字の探索をｎ
jmax回繰り返す。

【００５６】処理3-10-5：結合先候補文字コード［ｊ］
［ｎｊ］（＝“ヌ”）の字種設定を上記処理３−７と同
様の手順で行う。このとき、Ｋ［ｊ］［ｎｊ］は片仮名
となる。

【００５７】処理3-10-6：次に、起点文字種Ｋ［ｊ］
［ｎｊ］と結合先文字種Ｋ［ｊ］［ｎｊ］を比較し、一
致する場合はフラグ設定処理に進む。この例では起点文
字種Ｋ［ｉ］［ｎ］と結合先文字種Ｋ［ｊ］［ｎｊ］は
共に片仮名であり一致している。

【００５８】処理3-10-7：結合先候補文字コード［ｊ］
［ｎｊ］が起点文字と結合可能であることを保存するた
め、結合フラグＣflag［ｎｊ］をオンにする。

【００５９】処理3-10-8：次に、結合個数を保存するた
めに、発見個数ｎｆを更新する。上記処理3-10-6で字種
が一致しなかったときは、直接結合先候補番号の更新
（3-10-9）を行い、上記処理3-10-4に戻る。

【００６０】本処理３−１０の結果、結合先文字
“ヌ”、“ス”は共に片仮名字種であり、上記起点字種
と一致するため結合フラグＣflag［１〜２］がオン、発
見個数ｎｆが２となる。

【００６１】第３図に戻り、処理３−１１：発見個数ｎｆが０以上であれば、文字列
結合／格納処理３−１２に進む。ｎｆが０の場合は、起
点文字の候補番号を処理３−１５で更新し、前記処理３
−４へ戻る。この例では、ｎｆは２であり、処理３−１
２に進む。

【００６２】処理３−１２：ここでは、結合文字を起点
文字とつなぎあわせ、前記文字列バッファに登録する。
そのため、前記設定した結合フラグと発見個数に従って
以下の処理を行う。第６図に、処理３−１２の詳細な流
れを示す。

【００６３】処理3-12-1：現登録番号ｍを保存するた
め、現登録番号をｍ′に退避する。

【００６４】処理3-12-2,-3：文字列の結合は、前回の
結合処理で生成した文字列数ｎoldに結合先候補文字群
のＣflag［ｎｊ］がオンとなっている個数を乗じた回数
行うため、結合回数ｎconを設定する。第８図の例で
は、片仮名文字種の最初の結合のため、ｎoldは１、結
合フラグＣflag［］は、前記処理３−９から二つオン
（発見個数＝２）となっているため、結合ｎconは２と
なる。

【００６５】処理3-11-4：まず、結合フラグＣflag［ｎ
ｊ］を判定する。

【００６６】処理3-11-5：判定の結果、オンならば、前
回登録した文字列Ｂｓ［ｍ′−ｎold］に結合先文字
［ｊ］［ｎｊ］を結合し、文字列バッファに格納する。
このとき、前記処理３−６と同様に文字列の位置と長さ
も合わせて格納する。その後、登録番号ｍを更新する。
現在、文字列Ｂｍ′−ｎold］は“シ”であり、結合先
候補文字コードは“ヌ／ス”であるから、“シヌ”“シ
ス”の二つの文字列を文字列バッファＢｓ［ｍ］および
Ｂｓ［ｍ＋１］の領域に追加登録する。その後、処理3-
12-3に戻る。

【００６７】処理3-12-6：文字列の結合登録が終了した
ならば、前回登録個数ｎoldを前記結合回数ｎconに更新
して、本処理を終了する。この例では、ｎoldは２とな
る。

【００６８】第３図に戻り、上記処理３−１３で文字列
結合／格納後、結合先入力番号ｊを更新し、前記処理３
−９に戻る。

【００６９】以上延べた同字種文字列切り出し処理Ｅに
より、第８図の文字列バッファに示すように、例えば、
第３入力第１候補“シ”を起点として、“シ／シヌ／シ
ス／シヌテ／・・／システム／・・／システムケなる片
仮名文字列が切り出されることが分かる。

【００７０】本処理Ｅは、平仮名／片仮名文字列の切り
だしを行なうため、“こ／この／の”“サ／サン／サン
キ／ン／ンキ／キ”等の文字列も同時に切り出されてい
る。ここでは、認識バッファに格納した候補文字群から
単純に同字種文字列を切りだしたため無意味な文字列
“ン／ンキ”等もある。これらは、よう音／はつ音等単
語の先頭文字とならない文字を、起点文字として不採用
とすることにより、切り出しを抑制する方式にすれば、
上記無意味な文字列を出力しないようにでき、処理時間
を短縮することができる。

【００７１】また、起点文字の設定時（処理３−３）
に、単語辞書や仮名漢字変換辞書の索引と比較し、該当
する文字索引がないときには、予め候補番号ｎを更新
し、その値をループの初期値として処理３−４で用いる
ことによっても処理時間を短縮できる。

【００７２】さらに、各文字種の最大単語長を制限する
ことにより、不要な文字列の発生を抑制でき、処理時間
を短縮できる。この場合は、処理３−１２で文字列結合
／格納後、文字列長Ｌが最大単語長になったら、結合処
理を終了し、起点文字を処理３−１５にて更新すること
で可能となる。

【００７３】切り出しの際、認識結果の相違度（図示せ
ず)により予め設定した値以下の類似性が高い候補文字
のみ上記切り出しを実行することにより、不要な文字列
の発生を抑制することができる。

【００７４】＜単語整合Ｆ＞前記処理Ｅで切り出された
平仮名／片仮名文字列と単語辞書７を比較して一致する
文字列を見つけ出す。この例では、“システム”が一致
する文字列となり、第９図に示すように認識バッファの
“ス”を第１候補と入れ替え、文字バッファの“シ”を
起点とする４文字までの文字列に対し、単語フラグを設
定し、単語処理レジスタのＲt[３〜６]に単語確定を意
味するオンフラグを設定する。ここで、“サン”は、例
えば“太陽”の外来単語としても解釈できるが、“三／
算・・”等の漢字の読みとも取れる。そこで、単語が見
つかった時点で、それらの文字が仮名漢字変数の読み辞
書に無ければ単語確定とし、有れば保留とすることで整
合ミスを抑制することができる。この例では“サン”は
保留となる。

【００７５】また、一般に一人の使用者が使う単語は限
定されるので、上記確定した単語を一時格納しておき、
次回の単語整合時に優先的に比較することで、処理時間
を短縮できる。また、単語辞書に単語長を保持し、単語
長が一致するもののみ整合処理することでも処理時間を
短縮できる。

【００７６】単語発見時に、対応する候補文字の相違度
により第１候補を選択することにより、例えば、上記相
違度の総和が最小になる文字列を常に第１候補として選
択することにより安定して良好な結果を得ることができ
る。

【００７７】＜仮名漢字変数Ｇ＞前記処理Ｆで確定した
入力、即ち単語処理レジスタＲt[３〜６]に対応する入
力文字列を除く平仮名／片仮名文字列を変換辞書を用い
て漢字混じり文字列に変換する。仮名漢字変数技術につ
いては公知の技術を用い、その結果を第１０図に示すよ
うに認識バッファの予備領域に格納する。このとき、変
換により文字列長が短縮されることが有るため、その部
分の上記予備領域にはヌル記号を設定する。第１０図の
例では、“サン”の変換効果“算”から、“ン”の列に
ヌル記号を設定されている。

【００７８】＜同字種文字列切りだしＨ＞指定字種が漢
字／英数であること以外は、前記処理同字種文字列切り
だしＥと同様の処理を行なう。その結果、第１１図の文
字列バッファに示すように、“計／計差／計算／・・／
計算機／計算記／・・”なる文字列が切りだされる。

【００７９】＜単語整合Ｉ＞指定字種が漢字／英数であ
ること以外は、前記処理単語整合Ｆと同様の処理を行な
う。その結果、“計算”“計算機”の２単語の整合結果
を得る。ここでは、最長一致の単語を優先することと
し、“計算機”を確定単語とする。そこで第１１図に示
すように“算”“機”を認識バッファの第１候補と入れ
替え、単語処理レジスタのＲt[８〜１１]に単語確定を
意味するオンフラグを設定する。

【００８０】＜文書管理Ｊ＞上記処理ＡからＩにより更
新された認識バッファＢr／単語処理レジスタＲtから最
終的に表示する文字を選択し、文書バッファ１０／候補
文字バッファ９に格納する。単語処理レジスタＲtを先
頭から順次読みだし、未確定入力は、て／に／を／は／
の等の助詞、句読点等の区切り記号を優先して上記文書
バッファ１０に格納する。確定入力は、ヌル記号となる
入力を削除しながら上記文書バッファに格納する。これ
ら、文書バッファ１０に格納した入力に対応する候補文
字群を候補文字バッファ９に格納する。その結果、“こ
のシステムは計算機の”という文字列を表示部１１に表
示させる。

【００８１】以上の実施例の説明では、仮名と漢字の文
字列切り出しを別々に行ったが、同時に実行することも
可能である。

【００８２】

【発明の効果】本発明によれば、手書入力された文字列
から同字種の文字列を自動的に抽出できるため、操作性
向上の効果がある。

【００８３】上記抽出された文字列の平仮名／片仮名部
分を仮名漢字変換することにより、記憶があいまいな漢
字を自動的に出力することができるため、操作性向上の
効果がある。

【００８４】また、上記抽出された文字列を単語整合す
ることで類似文字の中から正しい文字を自動的に選択で
きるため、文字認識率向上と操作性向上の効果がある。

【００８５】されに、仮名漢字混じりの不完全熟語から
上記抽出された文字列の平仮名／片仮名部分を仮名漢字
変換し、それらを含めて上記抽出した同字種文字列から
単語整合により正しい熟語を自動的に生成することによ
り上記漢字混じりの不完全熟語を正しく変換できるた
め、操作性向上の効果がある。

【図面の簡単な説明】

【図１】第１図は、本発明の一実施例の文字認識装置の
構成を示すブロック図。

【図２】第２図は、第１図の文字認識装置の処理の流れ
図。

【図３】第３図は、同字種文字列切り出し処理の流れ
図。

【図４】第４図は、同字種文字列切り出し処理の流れ
図。

【図５】第５図は、同字種文字列切り出し処理の流れ
図。

【図６】第６図は、同字種文字列切り出し処理の流れ
図。

【図７】第７図は、処理過程のバッファ／レジスタの説
明図。

【図８】第８図は、処理過程のバッファ／レジスタの説
明図。

【図９】第９図は、処理過程のバッファ／レジスタの説
明図。

【図１０】第１０図は、処理過程のバッファ／レジスタ
の説明図。

【図１１】第１１図は、処理過程のバッファ／レジスタ
の説明図。

【図１２】第１２図は、字種テーブルの説明図。

【符号の説明】

１…入力部、２…文字認識部、３…同字種切り出し部、
４…仮名漢字変換部、５…変換辞書、６…単語整合部、
７…単語辞書、８…文書管理部、９…文書バッファ、１
０…候補文字バッファ

───────────────────────────────────────────────────── フロントページの続き (72)発明者三浦雅樹茨城県日立市久慈町4026番地株式会社日立製作所日立研究所内 (72)発明者横田登志美茨城県日立市久慈町4026番地株式会社日立製作所日立研究所内 (72)発明者松田敏彦愛知県尾張旭市晴丘町池上１番地株式会社日立製作所旭工場内 (56)参考文献特開平２−112058（ＪＰ，Ａ) 特開昭61−260354（ＪＰ，Ａ) 特開昭55−59578（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁶，ＤＢ名) G06K 9/00 - 9/82 G06F 17/22

Claims

(57)【特許請求の範囲】

【請求項１】手書の筆跡情報から文字を認識する手書文
字認識方法であって、入力された手書文字について、認識候補文字を選定し、認識候補文字から成る文字列が、漢字と仮名文字で構成
される場合に、仮名文字については、変換辞書を用い
て、漢字に変換し、変換結果として得られた漢字と、前記文字列を構成する
漢字とから成る漢字列を単語辞書と照合し、単語辞書に存在する漢字列と一致した漢字列を認識結果
とすることを特徴とする手書文字認識方法。
【請求項２】手書の筆跡情報から文字を認識する手書文
字認識方法であって、入力された手書文字について、認識候補文字を選定し、選定された認識候補文字のうち、一部の文字について
は、変換辞書を用いて、文字種の変換を行い、変換結果として得られた文字と、変換されなかった認識
候補文字とから成る文字列を、単語辞書と照合し、単語辞書に存在する文字列と一致した文字列を認識結果
とすることを特徴とする手書文字認識方法。
【請求項３】手書の筆跡情報を入力する手段と、入力された筆跡情報から、手書文字についての認識候補
文字を選定する手段と、認識候補文字から成る文字列が、漢字と仮名文字で構成
される場合に、仮名文字については、変換辞書を用い
て、漢字に変換する手段と、変換結果として得られた漢字と、前記文字列を構成する
漢字とから成る漢字列を単語辞書と照合する手段と、単語辞書に存在する漢字列と一致した漢字列を認識結果
として出力する手段と、を備えたことを特徴とする手書
文字認識装置。
【請求項４】手書の筆跡情報を入力する手段と、入力された筆跡情報から、手書文字についての認識候補
文字を選定する手段と、選定された認識候補文字のうち、一部の文字について
は、変換辞書を用いて、文字種の変換を行う手段と、変換結果として得られた文字と、変換されなかった認識
候補文字とから成る文字列を、単語辞書と照合する手段
と、単語辞書に存在する文字列と一致した文字列を認識結果
として出力する手段と、を備えたことを特徴とする手書
文字認識装置。