JP2745484B2 - 手書文字認識方法および装置 - Google Patents

手書文字認識方法および装置

Info

Publication number
JP2745484B2
JP2745484B2 JP1222268A JP22226889A JP2745484B2 JP 2745484 B2 JP2745484 B2 JP 2745484B2 JP 1222268 A JP1222268 A JP 1222268A JP 22226889 A JP22226889 A JP 22226889A JP 2745484 B2 JP2745484 B2 JP 2745484B2
Authority
JP
Japan
Prior art keywords
character
recognition
recognition candidate
handwritten
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1222268A
Other languages
English (en)
Other versions
JPH0384692A (ja
Inventor
正嶋  博
泰 福永
壮四郎 葛貫
雅樹 三浦
登志美 横田
敏彦 松田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP1222268A priority Critical patent/JP2745484B2/ja
Publication of JPH0384692A publication Critical patent/JPH0384692A/ja
Application granted granted Critical
Publication of JP2745484B2 publication Critical patent/JP2745484B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、手書きストロークを認識することにより文
字入力を行う手書文字認識装置に係り、特に、その認識
率を向上させる手書文字認識の方式に関する。
[従来の技術] 従来の手書文字認識装置は、特公昭63-49264号公報に
記載のように、漢字仮名混じりの不完全熟語(例えば
“計算キ”)を正しい熟語(“計算機”)に変換するた
めに、使用者が上記文字列“計算キ”を認識装置に指示
する必要があった。また、特開昭60-7585号公報に記載
のように、認識結果から単語整合を行う際、ある入力に
対する認識結果がすべて同字種の場合にのみ、その部分
を単語領域として切り出していた。
[発明が解決しようとする課題] 上記従来技術の前者においては、仮名漢字変換する文
字列をいちいち使用者が指定しなければならず、操作性
の点で考慮が不足していた。
また、上記従来技術の後者においては、一つの入力文
字に複数字種の認識結果が得られたとき、単語領域を安
定に抽出できないという問題があった。
本発明の目的は、認識候補から同字種の文字列を抽出
することにより、操作性/処理性に優れた文字認識方法
および装置を提供することにある。
本発明の他の目的は、認識候補から同字種の文字列を
抽出し、仮名文字列については仮名漢字変換することに
より、操作性/処理性に優れた文字認識方式および装置
を提供することにある。
本発明の更に他の目的は、認識候補から同字種の文字
列を抽出し、それらのうち平仮名/片仮名文字列を仮名
漢字変換し、上記変換結果も含めて単語整合することに
より、操作性/処理性に優れた文字認識方式および装置
を提供することにある。
[課題を解決するための手段] 上記目的を達成するために、本発明による手書文字認
識方式は、一連の手書の筆跡情報から文字を認識する手
書文字認識方式であって、手書文字認識の前提として、
入力された個々の手書文字について、1または2以上の
認識候補を選定し、各文字の認識候補を対象として、文
字の配列順に連続する同字種の文字列を切り出すように
したものである。
本発明による手書文字認識方式は、他の見地によれ
ば、一連の手書の筆跡情報から文字を認識する手書文字
認識方式であって、入力された個々の手書文字につい
て、1または2以上の認識候補を選定し、各文字の認識
候補を対象として、文字の配列順に連続する同字種の文
字列を切り出し、該抽出された各文字列を単語辞書と照
合して、該単語辞書に存在する文字列と一致した文字列
を認識結果として利用するようにしたものである。
上記同字種の文字列切り出し処理の開始タイミングと
しては、予め定めた数の文字について認識候補を得た
後、各文字の認識候補を基に句読点等の区切り記号を抽
出した後、あるいは各文字について認識候補を得た後、
等の任意のタイミングを選ぶことができる。
また、単語の先頭文字とはならない認識候補を先頭文
字とする文字列の切り出しを抑制することが好ましい。
各入力文字の認識候補のうち、筆跡との相違度が小さ
い認識候補についてのみ、上記文字列切り出し処理の対
象とするようにしてもよい。
本発明による他の手書文字認識方式は、一連の手書の
筆跡情報から文字を認識する手書文字認識方式であっ
て、入力された個々の手書文字について、1または2以
上の認識候補を選定し、各文字の認識候補を対象とし
て、文字の配列順に連続する仮名文字の文字列を切り出
し、該切り出された各仮名文字列を単語辞書と照合し、
該単語辞書に存在する仮名文字列と一致した仮名文字列
を抽出し、少なくとも該抽出された仮名文字列以外の仮
名文字を仮名漢字変換し、該仮名漢字変換により得られ
た漢字および上記認識候補中の漢字について、配列順に
連続する漢字の文字列を切り出し、該切り出された各漢
字文字列を単語辞書と照合して、該単語辞書に存在する
漢字文字列と一致した漢字文字列を抽出し、上記抽出さ
れた仮名文字列および漢字文字列に基づいて最終認識結
果を得るようにしたものである。
さらに、本発明による文字認識装置は、一連の手書の
筆跡情報から文字を認識する手書文字認識装置であっ
て、手書の筆跡情報を入力する手段と、該筆跡情報から
各入力文字について1または2以上の認識候補を選定す
る手段と、該選定された認識候補について、文字の配列
順に連続する同字種の文字列を切り出す手段と、該切り
出された文字列の各々について、単語辞書を検索する手
段と、該検索結果を基に認識結果としての文字列を表示
する手段とを備えたものである。
この装置において、上記同字種の文字列切り出しに際
し、文字種を指定する手段を備えてもよい。
好ましくは、上記認識候補を選定する手段は各入力文
字についての複数の認識候補に順位を付与する機能を有
し、当該順位は上記検索結果に応じて変更される。
上記各手段に加えて、上記同字種の文字列を切り出す
手段により切り出された仮名文字列を漢字に変換する仮
名漢字変換手段を備えることが望ましい。
[作用] 上記文字列の切り出し手段は、認識結果の候補文字群
中、連続する同一字種の候補を結合して同字種の文字列
を切り出す。その際、好ましくは、その文字列に対し
て、その入力の位置情報と文字列の長さまたは最後尾の
位置情報を付与する。
具体的には、一つの候補文字Aを起点として、その次
の入力に対応する候補文字群に同じ字種の文字があれ
ば、それを結合して文字列を切り出し、その文字列と上
記情報を文字列バッファに出力する、という一連の操作
を最新の入力文字まで繰返し、これらを原則としてすべ
ての入力文字に対する候補文字群を起点として実施する
ことにより、上記認識結果から必要な同字種文字列を抽
出が可能となる。
また、文字列の切り出し手段の起動タイミングは、認
識結果を1文字得る度、数文字格納した後、助詞あるい
は句読点等の文節区切り文字が候補文字に出現したとき
等に行うことができる。いずれの場合でも上記処理は逐
次処理により文字列の切り出しを行うため誤動作するこ
とはない。
上記かな漢字変換手段は、上記文字列切り出し手段で
切り出された平仮名/片仮名文字列に対しかな漢字変換
を行う。
上記単語辞書を検索する手段すなわち単語整合手段
は、上記文字列の切り出し手段で切り出された同字種の
文字列に対して単語辞書との整合を行い、一致した文字
列を各入力の第1候補として出力する。
本発明によれば、仮名漢字混じりの不完全な熟語に対
して、認識候補群から同種文字列を切り出し、単語整合
を行うことにより、筆跡情報から高精度に入力文字を認
識することが可能になる。
また、認識した仮名を漢字に変換した後、認識候補中
の漢字と共に漢字文字列の切り出しを行い、この結果に
対して単語整合を行うことにより、仮名漢字変換対象を
使用者が指定する必要はなく、また、仮名漢字混じりの
単語についても自動的に正確な漢字単語に変換すること
ができる。
[実施例] 以下、本発明の一実施例を第1図〜第12図により説明
する。
第1図に本発明を含む手書文字認識装置の構成を示
す。入力部1と表示部11は同じ座標系上に重ねられた入
力一体化機構を構成している。入力部1は、筆跡入力用
ペンの動きに従い座標点列を時系列的に出力する。表示
部11は、上記入力部1から得た座標点列をその直下に表
示し、認識等の処理後、清書情報を再表示する。文字認
識部2は、上記入力部1から得た座標点列を1文字毎に
切りだし、予め保持している座標パターン辞書(図示せ
ず)との間で類似度を求め、該類似度の高い順に候補文
字として出力する。同字種文字列切りだし部3は、前記
文字認識部2から得た候補文字群から時系列的に平仮名
/片仮名/漢字/英数字等の字種別の文字列をその位置
情報と共に出力する。本文字列切りだし部3は、字種指
定レジスタにより切り出す文字列の種類を指定すること
が可能である。仮名漢字変換部4は、上記文字列切りだ
し部3から得た平仮名/片仮名文字列を変換辞書5によ
り漢字混じり熟語等に変換し、その結果の文字列を上記
文字認識部2から得た候補文字群に加える。単語整合部
6は上記変換された文字を含めて上記文字列切りだし部
3から得た同字種文字列から単語辞書7を用いて単語を
抽出し、一致した文字を上記候補文字群の第1候補とし
て出力する。文書管理部8は、上記処理から得た候補文
字群から第1候補を抽出してそれらを文書バッファ9に
格納し、上記候補文字群を候補文字バッファ10に格納す
る。
入力部1としては、例えば透明の静電誘導タブレッ
ト、感圧タブレット等が利用できる。表示部11として
は、CRTあるいは液晶/プラズマ等の平面ディスプレイ
を利用できる。これらの技術は既に公知であり、本実施
例では特に詳細な動作を述べない。また、文字認識部2
は、その認識手法について特に限定するものではなく、
例えば特開昭60-237580号で開示されるような入力筆跡
の近似特徴を用いる方式等を利用できる。
以下、本装置の詳細な動作を述べる。
第2図に、本装置を用いて手書文字入力を行う場合の
処理の一例の流れを示す。
初期設定Aでは装置の起動を共に以下の処理で使用す
るレジスタ/バッファの初期化を行なう。終了確認B
は、第1図では示さなかったがメニュー等により本装置
の文字入力機能を終了させる処理である。入力Cは、入
力部1の処理であり、文字認識用の筆跡入力があると、
その座標情報を次の文字認識Dに渡す。文字認識Dは、
入力された筆跡から一文字分の座標情報を切りだし、そ
れらを予め設定した標準パターン辞書のデータ構造に変
換し、類似度の高い順に候補文字群を出力する。同字種
文字列切りだしEは、同種文字列切り出し部3の処理で
あり、上記文字認識Dから得た候補文字群を順次取り込
みながら、平仮名/片仮名字種の文字列を切り出す。単
語整合Fは、単語整合部6の処理であり、上記文字列切
りだしEから得た平仮名/片仮名文字列を予め設定した
単語辞書との間で比較し、一致した文字列を抽出してそ
れらを上記候補文字群の第1候補の認識結果と入れ替え
る。このとき、単語辞書7とマッチングがとれた文字に
ついてはマーカーを付加する。仮名漢字変換Gは、仮名
漢字変換部4の処理であり、上記平仮名/片仮名文字列
のうち上記マーカーの無い文字列を仮名漢字変換し、変
換された漢字混じり文字列を上記候補文字群に加える。
同字種文字列切りだしHは、上記候補文字群から漢字/
英数字種の文字列を切り出す。単語整合Iは、上記文字
列切りだしHから得た漢字/英数字種文字列を上記単語
整合Fと同様に予め設定した単語辞書7との間で比較
し、一致した文字列を抽出してそれらを上記候補文字群
の第1候補の認識結果とを入れ替える。このとき、確定
した単語部分にマーカーを付与する。文書管理Jは、上
記単語整合Iから得た候補文字群から、その第1候補を
文書バッファ9に登録し、表示部11に上記文書バッファ
9の内容を表示し、上記候補文字群を候補文字バッファ
10に格納する。
以下、本発明の主要部に当る同字種文字列切りだしE
以降の処理について詳細に述べる。
〈同字種文字列の切りだしE〉 第3図〜第6図に当文字切りだし処理、第7図に本書
力同時の各バッファの状況、第8図に本処理終了時の各
バッファの状況をそれぞれ示す。
の流れを、第8図/第9図にデータの動きを示す。
まず、本処理で使用されるバッファの内容を説明す
る。
第7図において、文字認識部2内に含まれる認識バッ
ファは文字認識結果を格納する領域で、簡単のため候補
文字数を最大2とし、以後の仮名漢字変換結果用に2文
字分の予備領域を認識バッファに持つことにする。文字
列バッファは切りだされる同字種文字列を格納する領域
で、切り出し文字列の登録番号m/先頭位置情報X,Y/文字
列Bs/文字列の長さL/単語フラグの各小領域に分割され
ている。単語フラグは、後に説明する単語整合処理が単
語辞書と一致した文字列につけるマーカーである。単語
処理レジスタは、上記マーカーを付した文字の入力位置
を示す。指定字種レジスタは、切りだす文字種の設定に
用いられる。なお、文字列バッファ、単語処理レジスタ
および指令字種レジスタは、同種文字列切り出し部3に
内包される。
文字列バッファには、切り出された各文字列につい
て、その字種情報を付加してもよい。
また、切り出し文字の先頭文字についてのみY情報を
もたせたが、第2文字目以降の文字についてもY情報を
持つようにしてもよい。このようにすれば、記憶容量は
増加するが、後述する候補順位の入替えの処理が迅速に
行える。
この同字種文字列切り出し処理は、第7図の認識バッ
ファの入力内容に対し、最終的に第8図の文字列バッフ
ァの内容を出力する処理を行う。
以下、その処理を第3図の同字種文字列切り出し処理
Eの流れをもとに説明する。この時点で、指定字種レジ
スタは、平仮名/片仮名に設定されている。
処理3−1、3−2:第3図において、まず、切り出す起
点となる入力(以下、起点入力)の入力番号Wpsをルー
プ先頭isとして設定する。ループ変数iは、当isから入
力文字列の後尾Wpeまで以下の処理を実行させる。第7
図の認識バッファの第1、第2入力文字(“こ”、
“の”)についての処理が終了し、第3入力文字からの
同字種文字列切り出しが行われる場合を例にとると、Wp
sは3、入力文字列の後尾Wpeは12となる。
処理3−3:次に、切り出しの起点個数を設定するため、
上記起点入力の候補数nmaxに上記起点入力の候補文字数
ncを設定する。第7図の認識バッファの第3入力の場合
は、“シ”“三”の二つの候補を有するためnmaxは2と
なる。
処理3−4:以下上記nmaxまで処理3−5以下の同字種文
字列切り出しを行う。上記nmaxまでの処理が終了する
と、処理3−14で結合元入力の番号iを更新し、前回登
録個数noldを初期化し、上記処理3−2に戻る。
処理3−5:上記起点入力の候補文字(以下、起点文字)
の字種Kを設定する。第7図の認識バッファ第3入力の
最初の起点文字は“シ”であるから、字種Kは片仮名と
なる。
処理3−6:次に、上記字種Kが指定字種レジスタに設定
された字種と一致するか否かを判定する。例では上記処
理3−5により字種Kは片仮名であり、前記指定字種レ
ジスタは平仮名/片仮名に設定されていたので、判定結
果は肯定となり、以下の処理に進む。否定された場合
は、処理3−15で起点入力iの候補番号nを更新して上
記処理3−4に戻り、次の起点文字について処理3−5
以下を行う。
なお、文字コードはJIS/シフトJIS等で字種別に割り
振られているため、それらの文字コード表から第12図に
示すような字種分類テーブルを作成しておく。当字種分
類テーブルは、文字種を8個のテーブルに分割してお
り、各テーブルのコード(16進で示す)を各文字種の先
頭文字コードとしている。
処理3−7:次に、上記起点文字と位置/長さを文字列バ
ッファに格納する。第4図に本処理3−7の詳細な流れ
を示す。
処理3−7−1:まず、起点文字を文字列バッファのBs
[m]に格納する。
処理3−7−2:それと共に、文字位置(X,Y)/長さL
を格納する。ここで、X[m]は起点入力番号i、Y
[m]は起点文字の候補番号nに対応している。例で
は、起点文字“シ”の文字位置はX[m]=3,Y[m]
=1、長さL=1となる。
処理3−7−3:最後に文字列登録番号mを更新する。
処理3−8:次に、第3図に戻って同字種の文字が何文字
続くかのチェックを行うため、結合する候補文字群の入
力番号js(以下、結合入力番号9を現入力番号iの次の
入力番号に初期化する。今回の処理例の場合、iは3で
あるため、jsは4となる。
処理3−9:次に、同字種文字列探索および結合処理に入
る。以下の処理は、結合入力番号jが入力後尾となるま
で繰り返される。ただし、jの位置に対応する前記単語
処理レジスタの値がオンとなっている場合および同字種
の文字がとぎれた場合は、起点文字の候補番号を更新し
て(処理3−1−4)、上記処理3−4に戻る。第8図
の例では、単語処理レジスタは初期状態であるため、上
記jが4から12となるまで以下の処理を実行する。
処理3−10:次に結合可能な文字を得るため、結合入力
番号jに対応する候補文字(以下、結合入力文字)群か
ら上記処理3−5で設定した文字種Kと同じ字種の候補
をさがす。
第5図に処理3−10の詳細な流れを示す。
処理3−10−1、−2:まず、パラメータの初期化のた
め、同字種候補が1以上存在したことを示す発見個数nf
を0、結合フラグCflag[ ]をオフにする。
処理3−10−3:次に、結合処理回数を設定するため、結
合先入力の候補文字数の総数njmaxを設定する。
第7図から、結合先入力番号j=4のケースでは第4
入力の候補文字は“ヌ/ス”であり、njmaxは2とな
る。
処理3−10−4:以降、同字種文字の探索をnjmax回繰り
返す。
処理3−10−5:結合先候補文字コード[j][nj](=
“ヌ”)の字種設定を上記処理3−7と同様の手順で行
う。このとき、K[j][nj]は片仮名となる。
処理3−10−6:次に、起点文字種K[j][nj]と結合
先文字種K[j][nj]を比較し、一致する場合はフラ
グ設定処理に進む。この例では起点文字種K[i]
[n]と結合先文字種K[j][nj]は共に片仮名であ
り一致している。
処理3−10−7:結合先候補文字コード[j][nj]が起
点文字と結合可能であることを保存するため、結合フラ
グCflag[nj]をオンにする。
処理3−10−8:次に、結合個数を保存するために、発見
個数nfを更新する。上記処理3−10−6で字種が一致し
なかったときは、直接結合先候補番号の更新(3−10−
9)を行い、上記処理3−10−4に戻る。
本処理3−10の結果、結合先文字“ヌ”、“ス”は共
に片仮名字種であり、上記起点字種と一致するため結合
フラグCflag[1〜2]がオン、発見個数nfが2とな
る。
第3図に戻り、 処理3−11:発見個数nfが0以上であれば、文字列結合
/格納処理3−12に進む。nfが0の場合は、起点文字の
候補番号を処理3−15で更新し、前記処理3−4へ戻
る。この例では、nfは2であり、処理3−12に進む。
処理3−12:ここでは、結合文字を起点文字とつなぎあ
わせ、前記文字列バッファに登録する。そのため、前記
設定した結合フラグと発見個数に従って以下の処理を行
う。第6図に、処理3−12の詳細な流れを示す。
処理3−12−1:現登録番号mを保存するため、現登録番
号をm′に退避する。
処理3−12−2,−3:文字列の結合は、前回の結合処理で
生成した文字列数noldに結合先候補文字群のCflag[n
j]がオンとなっている個数を乗じた回数行うため、結
合回数nconを設定する。第8図の例では、片仮名文字種
の最初の結合のため、noldは1、結合フラグCflag
[ ]は、前記処理3−9から二つオン(発見個数=
2)となっているため、結合nconは2となる。
処理3−11−4:まず、結合フラグCflag[nj]を判定す
る。
処理3−11−5:判定の結果、オンならば、前回登録した
文字列Bs[m′−nold]に結合先文字[j][nj]を結
合し、文字列バッファに格納する。このとき、前記処理
3−6と同様に文字列の位置と長さも合わせて格納す
る。その後、登録番号mを更新する。現在、文字列Bm′
−nold]は“シ”であり、結合先候補文字コードは“ヌ
/ス”であるから、“シヌ”“シス”の二つの文字列を
文字列バッファBs[m]およびBs[m+1]の領域に追
加登録する。その後、処理3−12−3に戻る。
処理3−12−6:文字列の結合登録が終了したならば、前
回登録個数noldを前記結合回数nconに更新して、本処理
を終了する。この例では、noldは2となる。
第3図に戻り、上記処理3−13で文字列結合/格納
後、結合先入力番号jを更新し、前記処理3−9に戻
る。
以上延べた同字種文字列切り出し処理Eにより、第8
図の文字列バッファに示すように、例えば、第3入力第
1候補“シ”を起点として、“シ/シヌ/シス/システ
/・・/システム/・・/システムケなる片仮名文字列
が切り出されることが分かる。
本処理Eは、平仮名/片仮名文字列の切りだしを行な
うため、“こ/この/の”“サ/サン/サンキ/ン/ン
キ/キ”等の文字列も同時に切り出されている。ここで
は、認識バッファに格納した候補文字群から単純に同字
種文字列を切りだしたため無意味な文字列“ン/ンキ”
等もある。これらは、よう音/はつ音等単語の先頭文字
とならない文字を、起点文字として不採用とすることに
より、切り出しを抑制する方式にすれば、上記無意味な
文字列を出力しないようにでき、処理時間を短縮するこ
とができる。
また、起点文字の設定時(処理3−3)に、単語辞書
や仮名漢字変換辞書の索引と比較し、該当する文字索引
がないときには、予め候補番号nを更新し、その値をル
ープの初期値として処理3−4で用いることによっても
処理時間を短縮できる。
さらに、各文字種の最大単語長を制限することによ
り、不要な文字列の発生を抑制でき、処理時間を短縮で
きる。この場合は、処理3−12で文字列結合/格納後、
文字列長Lが最大単語長になったら、結合処理を終了
し、起点文字を処理3−15にて更新することで可能とな
る。
切り出しの際、認識結果の相違度(図示せず)により
予め設定した値以下の類似性が高い候補文字のみ上記切
り出しを実行することにより、不要な文字列の発生を抑
制することができる。
〈単語整合F〉 前記処理Eで切り出された平仮名/片仮名文字列と単
語辞書7を比較して一致する文字列を見つけ出す。この
例では、“システム”が一致する文字列となり、第9図
に示すように認識バッファの“ス”を第1候補と入れ替
え、文字バッファの“シ”を起点とする4文字までの文
字列に対し、単語フラグを設定し、単語処理レジスタの
Rt[3〜6]に単語確定を意味するオンフラグを設定す
る。ここで、“サン”は、例えば“太陽”の外来単語と
しても解釈できるが、“三/算・・”等の漢字の読みと
も取れる。そこで、単語が見つかった時点で、それらの
文字が仮名漢字変数の読み辞書に無ければ単語確定と
し、有れば保留とすることで整合ミスを抑制することが
できる。この例では“サン”は保留となる。
また、一般に一人の使用者が使う単語は限定されるの
で、上記確定した単語を一時格納しておき、次回の単語
整合時に優先的に比較することで、処理時間を短縮でき
る。また、単語辞書に単語長を保持し、単語長が一致す
るもののみ整合処理することでも処理時間を短縮でき
る。
単語発見時に、対応する候補文字の相違度により第1
候補を選択することにより、例えば、上記相違度の総和
が最小になる文字列を常に第1候補として選択すること
により安定して良好な結果を得ることができる。
〈仮名漢字変数G〉 前記処理Fで確定した入力、即ち単語処理レジスタRt
[3〜6]に対応する入力文字列を除く平仮名/片仮名
文字列を変換辞書を用いて漢字混じり文字列に変換す
る。仮名漢字変数技術については公知の技術を用い、そ
の結果を第10図に示すように認識バッファの予備領域に
格納する。このとき、変換により文字列長が短縮される
ことが有るため、その部分の上記予備領域にはヌル記号
を設定する。第10図の例では、“サン”の変換効果
“算”から、“ン”の列にヌル記号を設定されている。
〈同字種文字列切りだしH〉 指定字種が漢字/英数であること以外は、前記処理同
字種文字列切りだしEと同様の処理を行なう。その結
果、第11図の文字列バッファに示すように、“計/計差
/計算/・・/計算機/計算記/・・”なる文字列が切
りだされる。
〈単語整合I〉 指定字種が漢字/英数であること以外は、前記処理単
語整合Fと同様の処理を行なう。その結果、“計算”
“計算機”の2単語の整合結果を得る。ここでは、最長
一致の単語を優先することとし、“計算機”を確定単語
とする。そこで第11図に示すように“算”“機”を認識
バッファの第1候補と入れ替え、単語処理レジスタのRt
[8〜11]に単語確定を意味するオンフラグを設定す
る。
〈文書管理J〉 上記処理AからIにより更新された認識バッファBr/
単語処理レジスタRtから最終的に表示する文字を選択
し、文書バッファ10/候補文字バッファ9に格納する。
単語処理レジスタRtを先頭から順次読みだし、未確定入
力は、て/に/を/は/の等の助詞、句読点等の区切り
記号を優先して上記文書バッファ10に格納する。確定入
力は、ヌル記号となる入力を削除しながら上記文書バッ
ファに格納する。これら、文書バッファ10に格納した入
力に対応する候補文字群を候補文字バッファ9に格納す
る。その結果、“このシステムは計算機の”という文字
列を表示部11に表示させる。
以上の実施例の説明では、仮名と漢字の文字列切り出
しを別々に行ったが、同時に実行することも可能であ
る。
[発明の効果] 本発明によれば、手書入力された文字列から同字種の
文字列を自動的に抽出できるため、操作性向上の効果が
ある。
上記抽出された文字列の平仮名/片仮名部分を仮名漢
字変換することにより、記憶があいまいな漢字を自動的
に出力することができるため、操作性向上の効果があ
る。
また、上記抽出された文字列を単語整合することで類
似文字の中から正しい文字を自動的に選択できるため、
文字確認率向上と操作性向上の効果がある。
されに、仮名漢字混じりの不完全熟語から上記抽出さ
れた文字列の平仮名/片仮名部分を仮名漢字変換し、そ
れらを含めて上記抽出した同字種文字列から単語整合に
より正しい熟語を自動的に生成することにより上記漢字
混じりの不完全熟語を正しく変換できるため、操作性向
上の効果がある。
【図面の簡単な説明】
第1図は本発明の一実施例の文字認識装置の構成を示す
ブロック図、第2図は第1図の文字認識装置の処理の流
れ図、第3図〜第6図は同字種文字列切り出し処理の流
れ図、第7図〜第11図は処理過程のバッファ/レジスタ
の説明図、第12図は字種テーブルの説明図である。 1……入力部、2……文字認識部、3……同字種切り出
し部、4……仮名漢字変換部、5……変換辞書、6……
単語整合部、7……単語辞書、8……文書管理部、9…
…文書バッファ、10……候補文字バッファ。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 葛貫 壮四郎 茨城県日立市久慈町4026番地 株式会社 日立製作所日立研究所内 (72)発明者 三浦 雅樹 茨城県日立市久慈町4026番地 株式会社 日立製作所日立研究所内 (72)発明者 横田 登志美 茨城県日立市久慈町4026番地 株式会社 日立製作所日立研究所内 (72)発明者 松田 敏彦 愛知県尾張旭市晴丘町池上1番地 株式 会社日立製作所旭工場内 (56)参考文献 特開 昭63−150788(JP,A) 特開 昭62−247480(JP,A) 特開 昭64−91286(JP,A) 特開 昭61−292774(JP,A) 特開 昭58−163072(JP,A) 特開 平1−183795(JP,A)

Claims (8)

    (57)【特許請求の範囲】
  1. 【請求項1】一連の手書の筆跡情報から文字を認識する
    手書文字認識方法であって、 入力された手書文字のうち、少なくとも一部の手書文字
    については、複数の認識候補文字が選定されるように、
    各手書文字について認識候補文字を選定し、 各認識候補文字のそれぞれを順次、起点とし、 起点とした認識候補文字に対応する手書文字に続く各手
    書文字毎に認識候補文字を一つずつ選択して前記起点と
    した認識候補文字に順に結合した場合に得られる複数の
    文字列中から、前記起点とした認識候補文字を先頭とす
    ると共に前記起点とした認識候補文字と同字種の認識候
    補文字のみからなる文字列の各々を認識候補文字列とし
    て切り出し、 該切り出された各認識候補文字列を単語辞書と照合し
    て、 該単語辞書に存在する文字列と一致した認識候補文字列
    を認識結果として利用することを特徴とする手書文字認
    識方法。
  2. 【請求項2】上記同字種の認識候補文字列の切り出し処
    理は、予め定めた数の手書文字について、認識候補文字
    を得た後に開始することを特徴とする請求項1記載の手
    書文字認識方法。
  3. 【請求項3】上記同字種の認識候補文字列の切りだし処
    理は、各手書文字の認識候補文字を基に、句読点等の区
    切り記号を抽出した後に開始することを特徴とする請求
    項1記載の手書文字認識方法。
  4. 【請求項4】上記同字種の認識候補文字列の切りだし処
    理は、各手書文字について認識候補文字を得る度に開始
    することを特徴とする請求項1記載の手書文字認識方
    法。
  5. 【請求項5】単語の先頭文字とはならない認識候補文字
    を先頭文字とする認識候補文字列の切り出しを抑制する
    ことを特徴とする請求項1記載の手書文字認識方法。
  6. 【請求項6】各入力文字の認識候補文字のうち、筆跡と
    の相違度が小さい認識候補文字についてのみ、上記同字
    種の認識候補文字列の切りだし処理の対象とすることを
    特徴とする請求項1記載の手書文字認識方法。
  7. 【請求項7】一連の手書の筆跡情報から文字を認識する
    手書文字認識装置であって、手書の筆跡情報を入力する
    手段と、 該筆跡情報から、少なくとも一部の手書文字について
    は、複数の認識候補文字が選定されるように、各手書文
    字について認識候補文字を選定する手段と、 各認識候補文字のそれぞれを順次、起点とし、 起点とした認識候補文字に対応する手書文字に続く各手
    書文字毎に認識候補文字を一つずつ選択して前記起点と
    した認識候補文字に順に結合した場合に得られる複数の
    文字列中から、前記起点とした認識候補文字を先頭とす
    ると共に前記起点とした認識候補文字と同字種の認識候
    補文字のみからなる文字列の各々を認識候補文字列とし
    て切り出す手段と、 該切り出された認識候補文字列の各々について、単語辞
    書と照合する手段と、 該照合結果を、認識結果として表示する手段とを備えた
    ことを特徴とする手書文字認識装置。
  8. 【請求項8】上記同字種の認識候補文字列の切り出しに
    際し、文字種を指定する手段を備えたことを特徴とする
    請求項7記載の手書文字認識装置。
JP1222268A 1989-08-29 1989-08-29 手書文字認識方法および装置 Expired - Lifetime JP2745484B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1222268A JP2745484B2 (ja) 1989-08-29 1989-08-29 手書文字認識方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1222268A JP2745484B2 (ja) 1989-08-29 1989-08-29 手書文字認識方法および装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP8328758A Division JP2968221B2 (ja) 1996-12-09 1996-12-09 手書き文字認識方法及び装置

Publications (2)

Publication Number Publication Date
JPH0384692A JPH0384692A (ja) 1991-04-10
JP2745484B2 true JP2745484B2 (ja) 1998-04-28

Family

ID=16779724

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1222268A Expired - Lifetime JP2745484B2 (ja) 1989-08-29 1989-08-29 手書文字認識方法および装置

Country Status (1)

Country Link
JP (1) JP2745484B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07334625A (ja) * 1994-06-06 1995-12-22 Nec Corp 文字列入力装置
JP3190834B2 (ja) * 1996-09-02 2001-07-23 エヌイーシーマイクロシステム株式会社 Osd表示回路

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58163072A (ja) * 1982-03-20 1983-09-27 Comput Basic Mach Technol Res Assoc 文字修正方式
JPS61292774A (ja) * 1985-06-20 1986-12-23 Fujitsu Ltd 手書き入力ワ−ドプロセツサ
JPS62247480A (ja) * 1986-04-19 1987-10-28 Ricoh Co Ltd 文字認識後処理方式
JPS63150788A (ja) * 1986-12-16 1988-06-23 Canon Inc 文字認識装置
JPS6491286A (en) * 1987-10-01 1989-04-10 Sharp Kk Automatic correction method of recognition character in handwritten character recognition device

Also Published As

Publication number Publication date
JPH0384692A (ja) 1991-04-10

Similar Documents

Publication Publication Date Title
US9589200B2 (en) Handwriting input conversion apparatus, computer-readable medium, and conversion method
JP4037608B2 (ja) 減少されたキーボード明瞭化システム
US20050268231A1 (en) Method and device for inputting Chinese phrases
CN111428494A (zh) 专有名词的智能纠错方法、装置、设备及存储介质
EP1743275A1 (en) Apparatus and method for handwriting recognition
JP2003162687A (ja) 手書き文字入力装置、手書き文字認識プログラム
JP2745484B2 (ja) 手書文字認識方法および装置
JPH08263478A (ja) 中国語簡繁体字文書変換装置
JP2968221B2 (ja) 手書き文字認識方法及び装置
JP2943791B2 (ja) 言語識別装置,言語識別方法および言語識別のプログラムを記録した記録媒体
JP3371983B2 (ja) 不完全文字列と文字列の照合方法および装置
JPH08115330A (ja) 類似文書検索方法および装置
JP2001092831A (ja) 文書検索装置及び文書検索方法
JPH07191986A (ja) 文章入力装置
JPH10232864A (ja) 文章入力装置、及び文章入力プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH0380363A (ja) 文書処理装置
JP3518976B2 (ja) 文書処理装置及び文書処理装置制御プログラムを記憶した媒体
JP5337559B2 (ja) 文字列入力装置、文字列入力方法、および、プログラム
KR101488670B1 (ko) 텍스트와 디지털 잉크를 포함하는 대용량 문서의 교차 검색 시스템 및 방법
JPH07319909A (ja) 文書検索装置、文書検索方法、文字認識装置及び辞書作成方法
JPH05324610A (ja) 住所表記漢字入力装置
JP2019185631A (ja) 情報処理装置及びプログラム
JPH02177726A (ja) 漢字入力装置
JPH0574867B2 (ja)
JPH08329057A (ja) 文字列予測方法