JP2968221B2 - 手書き文字認識方法及び装置 - Google Patents

手書き文字認識方法及び装置

Info

Publication number
JP2968221B2
JP2968221B2 JP8328758A JP32875896A JP2968221B2 JP 2968221 B2 JP2968221 B2 JP 2968221B2 JP 8328758 A JP8328758 A JP 8328758A JP 32875896 A JP32875896 A JP 32875896A JP 2968221 B2 JP2968221 B2 JP 2968221B2
Authority
JP
Japan
Prior art keywords
character
recognition
kanji
candidate
string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP8328758A
Other languages
English (en)
Other versions
JPH09204497A (ja
Inventor
正嶋  博
泰 福永
壮四郎 葛貫
雅樹 三浦
登志美 横田
敏彦 松田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP8328758A priority Critical patent/JP2968221B2/ja
Publication of JPH09204497A publication Critical patent/JPH09204497A/ja
Application granted granted Critical
Publication of JP2968221B2 publication Critical patent/JP2968221B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、手書きストロークを認
識することにより文字入力を行う手書文字認識装置に係
り、特に、その認識率を向上させる手書文字認識の方式
に関する。
【0002】
【従来の技術】従来の手書文字認識装置は、特公昭63-4
9264号公報に記載のように、漢字仮名混じりの不完全熟
語(例えば“計算キ")を正しい熟語(“計算機”)に変
換するために、使用者が上記文字列“計算キ”を認識装
置に指示する必要があった。また、特開昭60-7585号公
報に記載のように、認識結果から単語整合を行う際、あ
る入力に対する認識結果がすべて同字種の場合にのみ、
その部分を単語領域として切り出していた。
【0003】
【発明が解決しようとする課題】上記従来技術の前者に
おいては、仮名漢字変換する文字列をいちいち使用者が
指定しなければならず、操作性の点で考慮が不足してい
た。
【0004】また、上記従来技術の後者においては、一
つの入力文字に複数字種の認識結果が得られたとき、単
語領域を安定に抽出できないという問題があった。
【0005】本発明の目的は、認識候補から同字種の文
字列を抽出することにより、操作性/処理性に優れた文
字認識方法および装置を提供することにある。
【0006】本発明の他の目的は、認識候補から同字種
の文字列を抽出し、仮名文字列については仮名漢字変換
することにより、操作性/処理性に優れた文字認識方式
および装置を提供することにある。
【0007】本発明の更に他の目的は、認識候補から同
字種の文字列を抽出し、それらのうち平仮名/片仮名文
字列を仮名漢字変換し、上記変換結果も含めて単語整合
することにより、操作性/処理性に優れた文字認識方式
および装置を提供することにある。
【0008】
【課題を解決するための手段】上記目的を達成するため
の本発明の第1の態様によれば、手書の筆跡情報から文
字を認識する手書文字認識方法であって、入力された手
書文字について、認識候補文字を選定し、認識候補文字
から成る文字列が、漢字と仮名文字で構成される場合
に、仮名文字については、変換辞書を用いて、漢字に変
換し、変換結果として得られた漢字と、前記文字列を構
成する漢字とから成る漢字列を単語辞書と照合し、単語
辞書に存在する漢字列と一致した漢字列を認識結果とす
ることを特徴とする手書文字認識方法が提供される。
【0009】上記目的を達成するための本発明の第2の
態様によれば、手書の筆跡情報から文字を認識する手書
文字認識方法であって、入力された手書文字について、
認識候補文字を選定し、選定された認識候補文字のう
ち、一部の文字については、変換辞書を用いて、文字種
の変換を行い、変換結果として得られた文字と、変換さ
れなかった認識候補文字とから成る文字列を、単語辞書
と照合し、単語辞書に存在する文字列と一致した文字列
を認識結果とすることを特徴とする手書文字認識方法が
提供される。
【0010】上記目的を達成するための本発明の第3の
態様によれば、手書の筆跡情報から文字を認識する手書
文字認識方法であって、入力された手書文字について、
認識候補文字を選定し、認識候補文字に対して仮名漢字
変換を施し、変換結果として得られた漢字、認識候補文
字として元から存在する漢字、認識候補文字として元か
ら存在する仮名文字の組み合わせによる文字列を単語辞
書と照合し、単語辞書に存在する文字列と一致した文字
列を認識結果とすることを特徴とする手書文字認識方法
が提供される。
【0011】上記目的を達成するための本発明の第4の
態様は、以下の通りである。
【0012】すなわち、手書の筆跡情報を入力する手段
と、入力された筆跡情報から、手書文字についての認識
候補文字を選定する手段と、認識候補文字から成る文字
列が、漢字と仮名文字で構成される場合に、仮名文字に
ついては、変換辞書を用いて、漢字に変換する手段と、
変換結果として得られた漢字と、前記文字列を構成する
漢字とから成る漢字列を単語辞書と照合する手段と、単
語辞書に存在する漢字列と一致した漢字列を認識結果と
して出力する手段と、を備えたことを特徴とする手書文
字認識装置が提供される。
【0013】上記目的を達成するための本発明の第5の
態様は、以下の通りである。
【0014】すなわち、手書の筆跡情報を入力する手段
と、入力された筆跡情報から、手書文字についての認識
候補文字を選定する手段と、選定された認識候補文字の
うち、一部の文字については、変換辞書を用いて、文字
種の変換を行う手段と、変換結果として得られた文字
と、変換されなかった認識候補文字とから成る文字列
を、単語辞書と照合する手段と、単語辞書に存在する文
字列と一致した文字列を認識結果として出力する手段
と、を備えたことを特徴とする手書文字認識装置が提供
される。
【0015】上記目的を達成するための本発明の第6の
態様は、以下の通りである。
【0016】すなわち、手書の筆跡情報を入力する手段
と、入力された筆跡情報から、手書文字についての認識
候補文字を選定する手段と、認識候補文字に対して仮名
漢字変換を施す手段と、変換結果として得られた漢字、
認識候補文字として元から存在する漢字、認識候補文字
として元から存在する仮名文字の組み合わせによる文字
列を単語辞書と照合する手段と、単語辞書に存在する文
字列と一致した文字列を認識結果として出力する手段
と、を備えたことを特徴とする手書文字認識装置が提供
される。
【0017】
【作用】本発明によれば、入力された手書文字につい
て、まず、認識候補文字が選定される。
【0018】選定された認識候補文字のうち、一部の文
字については、変換辞書を用いて、文字種の変換が行わ
れる。
【0019】文字種の変換は、仮名漢字変換であっても
構わない。
【0020】そして、変換結果として得られた文字と、
変換されなかった認識候補文字とから成る文字列につい
ては、単語辞書と照合され、単語辞書に存在する文字列
と一致した文字列が認識結果とされる。
【0021】このようにすれば、例えば、認識候補文字
として「計算キ」が選定された場合に、認識結果として
「計算機」を取得することができるようになる。
【0022】また、認識候補文字に対して仮名漢字変換
が行なわれたのち、変換結果として得られた漢字、認識
候補文字として元から存在する漢字、認識候補文字とし
て元から存在する仮名文字の組み合わせによる文字列を
単語辞書と照合するようにしてもよい。
【0023】このようにすれば、単語辞書と照合する文
字列が増加し、結果として、文字列の認識精度が向上す
る。
【0024】
【実施例】以下、本発明の一実施例を第1図〜第12図
により説明する。
【0025】第1図に本発明を含む手書文字認識装置の
構成を示す。入力部1と表示部11は同じ座標系上に重
ねられた入力一体化表示機構を構成している。入力部1
は、筆跡入力用ペンの動きに従い座標点列を時系列的に
出力する。表示部11は、上記入力部1から得た座標点
列をその直下に表示し、認識等の処理後、清書情報を再
表示する。文字認識部2は、上記入力部1から得た座標
点列を1文字毎に切りだし、予め保持している標準パタ
ーン辞書(図示せず)との間で類似度を求め、該類似度
の高い順に候補文字として出力する。同字種文字列切り
だし部3は、前記文字認識部2から得た候補文字群から
時系列的に平仮名/片仮名/漢字/英数字等の字種別の
文字列をその位置情報と共に出力する。本文字列切りだ
し部3は、字種指定レジスタにより切り出す文字列の種
類を指定することが可能である。仮名漢字変換部4は、
上記文字列切りだし部3から得た平仮名/片仮名文字列
を変換辞書5により漢字混じり熟語等に変換し、その結
果の文字列を上記文字認識部2から得た候補文字群に加
える。単語整合部6は上記変換された文字を含めて上記
文字列切りだし部3から得た同字種文字列から単語辞書
7を用いて単語を抽出し、一致した文字を上記候補文字
群の第1候補として出力する。文書管理部8は、上記処
理から得た候補文字群から第1候補を抽出してそれらを
文書バッファ9に格納し、上記候補文字群を候補文字バ
ッファ10に格納する。
【0026】入力部1としては、例えば透明の静電誘導
タブレット、感圧タブレット等が利用できる。表示部1
1としては、CRTあるいは液晶/プラズマ等の平面デ
ィスプレイを利用できる。これらの技術は既に公知であ
り、本実施例では特に詳細な動作を述べない。また、文
字認識部2は、その認識手法について特に限定するもの
ではなく、例えば特開昭60-237580号で開示されるよう
な入力筆跡の近似特徴を用いる方式等を利用できる。
【0027】以下、本装置の詳細な動作を述べる。
【0028】第2図に、本装置を用いて手書文字入力を
行う場合の処理の一例の流れを示す。
【0029】初期設定Aでは装置の起動と共に以下の処
理で使用するレジスタ/バッファの初期化を行なう。終
了確認Bは、第1図では示さなかったがメニュー等によ
り本装置の文字入力機能を終了させる処理である。入力
Cは、入力部1の処理であり、文字認識用の筆跡入力が
あると、その座標情報を次の文字認識Dに渡す。文字認
識Dは、入力された筆跡から一文字分の座標情報を切り
だし、それらを予め設定した標準パターン辞書のデータ
構造に変換し、類似度の高い順に候補文字群を出力す
る。同字種文字列切りだしEは、同種文字列切り出し部
3の処理であり、上記文字認識Dから得た候補文字群を
順次取り込みながら、平仮名/片仮名字種の文字列を切
り出す。単語整合Fは、単語整合部6の処理であり、上
記文字列切りだしEから得た平仮名/片仮名文字列を予
め設定した単語辞書との間で比較し、一致した文字列を
抽出してそれらを上記候補文字群の第1候補の認識結果
と入れ替える。このとき、単語辞書7とマッチングがと
れた文字についてはマーカーを付加する。仮名漢字変換
Gは、仮名漢字変換部4の処理であり、上記平仮名/片
仮名文字列のうち上記マーカーの無い文字列を仮名漢字
変換し、変換された漢字混じり文字列を上記候補文字群
に加える。同字種文字列切りだしHは、上記候補文字群
から漢字/英数字種の文字列を切り出す。単語整合I
は、上記文字列切りだしHから得た漢字/英数字種文字
列を上記単語整合Fと同様に予め設定した単語辞書7と
の間で比較し、一致した文字列を抽出してそれらを上記
候補文字群の第1候補の認識結果とを入れ替える。この
とき、確定した単語部分にマーカーを付加する。文書管
理Jは、上記単語整合Iから得た候補文字群から、その
第1候補を文書バッファ9に登録し、表示部11に上記
文書バッファ9の内容を表示し、上記候補文字群を候補
文字バッファ10に格納する。
【0030】以下、本発明の主要部に当る同字種文字列
切りだしE以降の処理について詳細に述べる。
【0031】<同字種文字列の切りだしE>第3図〜第
6図に当文字切りだし処理、第7図に本書力同時の各バ
ッファの状況、第8図に本処理終了時の各バッファの状
況をそれぞれ示す。
【0032】の流れを、第8図/第9図にデータの動き
を示す。 まず、本処理で使用されるバッファの内容を
説明する。
【0033】第7図において、文字認識部2内に含まれ
る認識バッファは文字認識結果を格納する領域で、簡単
のため候補文字数を最大2とし、以後の仮名漢字変換結
果用に2文字分の予備領域を認識バッファに持つことに
する。文字列バッファは切りだされる同字種文字列を格
納する領域で、切り出し文字列の登録番号m/先頭位置
情報X,Y/文字列Bs/文字列の長さL/単語フラグ
の各小領域に分割されている。単語フラグは、後に説明
する単語整合処理が単語辞書と一致した文字列につける
マーカーである。単語処理レジスタは、上記マーカーを
付した文字の入力位置を示す。指定字種レジスタは、切
りだす文字種の設定に用いられる。なお、文字列バッフ
ァ、単語処理レジスタおよび指令字種レジスタは、同種
文字列切り出し部3に内包される。
【0034】文字列バッファには、切り出された各文字
列について、その字種情報を付加してもよい。
【0035】また、切り出し文字の先頭文字についての
みY情報をもたせたが、第2文字目以降の文字について
もY情報を持つようにしてもよい。このようにすれば、
記憶容量は増加するが、後述する候補順位の入替えの処
理が迅速に行える。
【0036】この同字種文字列切り出し処理は、第7図
の認識バッファの入力内容に対し、最終的に第8図の文
字列バッファの内容を出力する処理を行う。
【0037】以下、その処理を第3図の同字種文字列切
り出し処理Eの流れをもとに説明する。この時点で、指
定字種レジスタは、平仮名/片仮名に設定されている。
【0038】処理3−1、3−2:第3図において、ま
ず、切り出す起点となる入力(以下、起点入力)の入力
番号Wpsをループ先頭isとして設定する。ループ変数
iは、当isから入力文字列の後尾Wpeまで以下の処理
を実行させる。第7図の認識バッファの第1、第2入力
文字(“こ”、“の”)についての処理が終了し、第3
入力文字からの同字種文字列切り出しが行われる場合を
例にとると、Wpsは3、入力文字列の後尾Wpeは12とな
る。
【0039】処理3−3:次に、切り出しの起点個数を
設定するため、上記起点入力の候補数nmaxに上記起点
入力の候補文字数ncを設定する。第7図の認識バッフ
ァの第3入力の場合は、“シ”“三”の二つの候補を有
するためnmaxは2となる。
【0040】処理3−4:以下上記nmaxまで処理3−
5以下の同字種文字列切り出しを行う。上記nmaxまで
の処理が終了すると、処理3−14で結合元入力の番号
iを更新し、前回登録個数noldを初期化し、上記処理
3−2に戻る。
【0041】処理3−5:上記起点入力の候補文字(以
下、起点文字)の字種Kを設定する。第7図の認識バッ
ファ第3入力の最初の起点文字は“シ”であるから、字
種Kは片仮名となる。
【0042】処理3−6:次に、上記字種Kが指定字種
レジスタに設定された字種と一致するか否かを判定す
る。例では上記処理3−5により字種Kは片仮名であ
り、前記指定字種レジスタは平仮名/片仮名に設定され
ていたので、判定結果は肯定となり、以下の処理に進
む。否定された場合は、処理3−15で起点入力iの候
補番号nを更新して上記処理3−4に戻り、次の起点文
字について処理3−5以下を行う。
【0043】なお、文字コードはJIS/シフトJIS
等で字種別に割り振られているため、それらの文字コー
ド表から第12図に示すような字種分類テーブルを作成
しておく。当字種分類テーブルは、文字種を8個のテー
ブルに分割しており、各テーブルのコード(16進で示
す)を各文字種の先頭文字コードとしている。
【0044】処理3−7:次に、上記起点文字と位置/
長さを文字列バッファに格納する。第4図に本処理3−
7の詳細な流れを示す。
【0045】処理3-7-1:まず、起点文字を文字列バッ
ファのBs[m]に格納する。
【0046】処理3-7-2:それと共に、文字位置(X,
Y)/長さLを格納する。ここで、X[m]は起点入力
番号i、Y[m]は起点文字の候補番号nに対応してい
る。例では、起点文字“シ”の文字位置はX[m]=
3,Y[m]=1、長さL=1となる。
【0047】処理3-7-3:最後に文字列登録番号mを更
新する。
【0048】処理3−8:次に、第3図に戻って同字種
の文字が何文字続くかのチェックを行うため、結合する
候補文字群の入力番号js(以下、結合入力番号9を現
入力番号iの次の入力番号に初期化する。今回の処理例
の場合、iは3であるため、jsは4となる。
【0049】処理3−9:次に、同字種文字列探索およ
び結合処理に入る。以下の処理は、結合入力番号jが入
力後尾となるまで繰り返される。ただし、jの位置に対
応する前記単語処理レジスタの値がオンとなっている場
合および同字種の文字がとぎれた場合は、起点文字の候
補番号を更新して(処理3-1-4)、上記処理3−4に戻
る。第8図の例では、単語処理レジスタは初期状態であ
るため、上記jが4から12となるまで以下の処理を実
行する。
【0050】処理3−10:次に結合可能な文字を得る
ため、結合入力番号jに対応する候補文字(以下、結合
入力文字)群から上記処理3−5で設定した文字種Kと
同じ字種の候補をさがす。
【0051】第5図に処理3−10の詳細な流れを示
す。
【0052】処理3-10-1,-2:まず、パラメータの初期
化のため、同字種候補が1以上存在したことを示す発見
個数nfを0、結合フラグCflag[]をオフにする。
【0053】処理3-10-3:次に、結合処理回数を設定す
るため、結合先入力の候補文字数の総数njmaxを設定す
る。
【0054】第7図から、結合先入力番号j=4のケー
スでは第4入力の候補文字は“ヌ/ス”であり、njmax
は2となる。
【0055】処理3-10-4:以降、同字種文字の探索をn
jmax回繰り返す。
【0056】処理3-10-5:結合先候補文字コード[j]
[nj](=“ヌ”)の字種設定を上記処理3−7と同
様の手順で行う。このとき、K[j][nj]は片仮名
となる。
【0057】処理3-10-6:次に、起点文字種K[j]
[nj]と結合先文字種K[j][nj]を比較し、一
致する場合はフラグ設定処理に進む。この例では起点文
字種K[i][n]と結合先文字種K[j][nj]は
共に片仮名であり一致している。
【0058】処理3-10-7:結合先候補文字コード[j]
[nj]が起点文字と結合可能であることを保存するた
め、結合フラグCflag[nj]をオンにする。
【0059】処理3-10-8:次に、結合個数を保存するた
めに、発見個数nfを更新する。上記処理3-10-6で字種
が一致しなかったときは、直接結合先候補番号の更新
(3-10-9)を行い、上記処理3-10-4に戻る。
【0060】本処理3−10の結果、結合先文字
“ヌ”、“ス”は共に片仮名字種であり、上記起点字種
と一致するため結合フラグCflag[1〜2]がオン、発
見個数nfが2となる。
【0061】第3図に戻り、 処理3−11:発見個数nfが0以上であれば、文字列
結合/格納処理3−12に進む。nfが0の場合は、起
点文字の候補番号を処理3−15で更新し、前記処理3
−4へ戻る。この例では、nfは2であり、処理3−1
2に進む。
【0062】処理3−12:ここでは、結合文字を起点
文字とつなぎあわせ、前記文字列バッファに登録する。
そのため、前記設定した結合フラグと発見個数に従って
以下の処理を行う。第6図に、処理3−12の詳細な流
れを示す。
【0063】処理3-12-1:現登録番号mを保存するた
め、現登録番号をm′に退避する。
【0064】処理3-12-2,-3:文字列の結合は、前回の
結合処理で生成した文字列数noldに結合先候補文字群
のCflag[nj]がオンとなっている個数を乗じた回数
行うため、結合回数nconを設定する。第8図の例で
は、片仮名文字種の最初の結合のため、noldは1、結
合フラグCflag[]は、前記処理3−9から二つオン
(発見個数=2)となっているため、結合nconは2と
なる。
【0065】処理3-11-4:まず、結合フラグCflag[n
j]を判定する。
【0066】処理3-11-5:判定の結果、オンならば、前
回登録した文字列Bs[m′−nold]に結合先文字
[j][nj]を結合し、文字列バッファに格納する。
このとき、前記処理3−6と同様に文字列の位置と長さ
も合わせて格納する。その後、登録番号mを更新する。
現在、文字列Bm′−nold]は“シ”であり、結合先
候補文字コードは“ヌ/ス”であるから、“シヌ”“シ
ス”の二つの文字列を文字列バッファBs[m]および
Bs[m+1]の領域に追加登録する。その後、処理3-
12-3に戻る。
【0067】処理3-12-6:文字列の結合登録が終了した
ならば、前回登録個数noldを前記結合回数nconに更新
して、本処理を終了する。この例では、noldは2とな
る。
【0068】第3図に戻り、上記処理3−13で文字列
結合/格納後、結合先入力番号jを更新し、前記処理3
−9に戻る。
【0069】以上延べた同字種文字列切り出し処理Eに
より、第8図の文字列バッファに示すように、例えば、
第3入力第1候補“シ”を起点として、“シ/シヌ/シ
ス/シヌテ/・・/システム/・・/システムケなる片
仮名文字列が切り出されることが分かる。
【0070】本処理Eは、平仮名/片仮名文字列の切り
だしを行なうため、“こ/この/の”“サ/サン/サン
キ/ン/ンキ/キ”等の文字列も同時に切り出されてい
る。ここでは、認識バッファに格納した候補文字群から
単純に同字種文字列を切りだしたため無意味な文字列
“ン/ンキ”等もある。これらは、よう音/はつ音等単
語の先頭文字とならない文字を、起点文字として不採用
とすることにより、切り出しを抑制する方式にすれば、
上記無意味な文字列を出力しないようにでき、処理時間
を短縮することができる。
【0071】また、起点文字の設定時(処理3−3)
に、単語辞書や仮名漢字変換辞書の索引と比較し、該当
する文字索引がないときには、予め候補番号nを更新
し、その値をループの初期値として処理3−4で用いる
ことによっても処理時間を短縮できる。
【0072】さらに、各文字種の最大単語長を制限する
ことにより、不要な文字列の発生を抑制でき、処理時間
を短縮できる。この場合は、処理3−12で文字列結合
/格納後、文字列長Lが最大単語長になったら、結合処
理を終了し、起点文字を処理3−15にて更新すること
で可能となる。
【0073】切り出しの際、認識結果の相違度(図示せ
ず)により予め設定した値以下の類似性が高い候補文字
のみ上記切り出しを実行することにより、不要な文字列
の発生を抑制することができる。
【0074】<単語整合F>前記処理Eで切り出された
平仮名/片仮名文字列と単語辞書7を比較して一致する
文字列を見つけ出す。この例では、“システム”が一致
する文字列となり、第9図に示すように認識バッファの
“ス”を第1候補と入れ替え、文字バッファの“シ”を
起点とする4文字までの文字列に対し、単語フラグを設
定し、単語処理レジスタのRt[3〜6]に単語確定を意
味するオンフラグを設定する。ここで、“サン”は、例
えば“太陽”の外来単語としても解釈できるが、“三/
算・・”等の漢字の読みとも取れる。そこで、単語が見
つかった時点で、それらの文字が仮名漢字変数の読み辞
書に無ければ単語確定とし、有れば保留とすることで整
合ミスを抑制することができる。この例では“サン”は
保留となる。
【0075】また、一般に一人の使用者が使う単語は限
定されるので、上記確定した単語を一時格納しておき、
次回の単語整合時に優先的に比較することで、処理時間
を短縮できる。また、単語辞書に単語長を保持し、単語
長が一致するもののみ整合処理することでも処理時間を
短縮できる。
【0076】単語発見時に、対応する候補文字の相違度
により第1候補を選択することにより、例えば、上記相
違度の総和が最小になる文字列を常に第1候補として選
択することにより安定して良好な結果を得ることができ
る。
【0077】<仮名漢字変数G>前記処理Fで確定した
入力、即ち単語処理レジスタRt[3〜6]に対応する入
力文字列を除く平仮名/片仮名文字列を変換辞書を用い
て漢字混じり文字列に変換する。仮名漢字変数技術につ
いては公知の技術を用い、その結果を第10図に示すよ
うに認識バッファの予備領域に格納する。このとき、変
換により文字列長が短縮されることが有るため、その部
分の上記予備領域にはヌル記号を設定する。第10図の
例では、“サン”の変換効果“算”から、“ン”の列に
ヌル記号を設定されている。
【0078】<同字種文字列切りだしH>指定字種が漢
字/英数であること以外は、前記処理同字種文字列切り
だしEと同様の処理を行なう。その結果、第11図の文
字列バッファに示すように、“計/計差/計算/・・/
計算機/計算記/・・”なる文字列が切りだされる。
【0079】<単語整合I>指定字種が漢字/英数であ
ること以外は、前記処理単語整合Fと同様の処理を行な
う。その結果、“計算”“計算機”の2単語の整合結果
を得る。ここでは、最長一致の単語を優先することと
し、“計算機”を確定単語とする。そこで第11図に示
すように“算”“機”を認識バッファの第1候補と入れ
替え、単語処理レジスタのRt[8〜11]に単語確定を
意味するオンフラグを設定する。
【0080】<文書管理J>上記処理AからIにより更
新された認識バッファBr/単語処理レジスタRtから最
終的に表示する文字を選択し、文書バッファ10/候補
文字バッファ9に格納する。単語処理レジスタRtを先
頭から順次読みだし、未確定入力は、て/に/を/は/
の等の助詞、句読点等の区切り記号を優先して上記文書
バッファ10に格納する。確定入力は、ヌル記号となる
入力を削除しながら上記文書バッファに格納する。これ
ら、文書バッファ10に格納した入力に対応する候補文
字群を候補文字バッファ9に格納する。その結果、“こ
のシステムは計算機の”という文字列を表示部11に表
示させる。
【0081】以上の実施例の説明では、仮名と漢字の文
字列切り出しを別々に行ったが、同時に実行することも
可能である。
【0082】
【発明の効果】本発明によれば、手書入力された文字列
から同字種の文字列を自動的に抽出できるため、操作性
向上の効果がある。
【0083】上記抽出された文字列の平仮名/片仮名部
分を仮名漢字変換することにより、記憶があいまいな漢
字を自動的に出力することができるため、操作性向上の
効果がある。
【0084】また、上記抽出された文字列を単語整合す
ることで類似文字の中から正しい文字を自動的に選択で
きるため、文字認識率向上と操作性向上の効果がある。
【0085】されに、仮名漢字混じりの不完全熟語から
上記抽出された文字列の平仮名/片仮名部分を仮名漢字
変換し、それらを含めて上記抽出した同字種文字列から
単語整合により正しい熟語を自動的に生成することによ
り上記漢字混じりの不完全熟語を正しく変換できるた
め、操作性向上の効果がある。
【図面の簡単な説明】
【図1】第1図は、本発明の一実施例の文字認識装置の
構成を示すブロック図。
【図2】第2図は、第1図の文字認識装置の処理の流れ
図。
【図3】第3図は、同字種文字列切り出し処理の流れ
図。
【図4】第4図は、同字種文字列切り出し処理の流れ
図。
【図5】第5図は、同字種文字列切り出し処理の流れ
図。
【図6】第6図は、同字種文字列切り出し処理の流れ
図。
【図7】第7図は、処理過程のバッファ/レジスタの説
明図。
【図8】第8図は、処理過程のバッファ/レジスタの説
明図。
【図9】第9図は、処理過程のバッファ/レジスタの説
明図。
【図10】第10図は、処理過程のバッファ/レジスタ
の説明図。
【図11】第11図は、処理過程のバッファ/レジスタ
の説明図。
【図12】第12図は、字種テーブルの説明図。
【符号の説明】
1…入力部、2…文字認識部、3…同字種切り出し部、
4…仮名漢字変換部、5…変換辞書、6…単語整合部、
7…単語辞書、8…文書管理部、9…文書バッファ、1
0…候補文字バッファ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 三浦 雅樹 茨城県日立市久慈町4026番地 株式会社 日立製作所 日立研究所内 (72)発明者 横田 登志美 茨城県日立市久慈町4026番地 株式会社 日立製作所 日立研究所内 (72)発明者 松田 敏彦 愛知県尾張旭市晴丘町池上1番地 株式 会社日立製作所 旭工場内 (56)参考文献 特開 平2−112058(JP,A) 特開 昭61−260354(JP,A) 特開 昭55−59578(JP,A) (58)調査した分野(Int.Cl.6,DB名) G06K 9/00 - 9/82 G06F 17/22

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】手書の筆跡情報から文字を認識する手書文
    字認識方法であって、 入力された手書文字について、認識候補文字を選定し、 認識候補文字から成る文字列が、漢字と仮名文字で構成
    される場合に、仮名文字については、変換辞書を用い
    て、漢字に変換し、 変換結果として得られた漢字と、前記文字列を構成する
    漢字とから成る漢字列を単語辞書と照合し、 単語辞書に存在する漢字列と一致した漢字列を認識結果
    とすることを特徴とする手書文字認識方法。
  2. 【請求項2】手書の筆跡情報から文字を認識する手書文
    字認識方法であって、 入力された手書文字について、認識候補文字を選定し、 選定された認識候補文字のうち、一部の文字について
    は、変換辞書を用いて、文字種の変換を行い、 変換結果として得られた文字と、変換されなかった認識
    候補文字とから成る文字列を、単語辞書と照合し、 単語辞書に存在する文字列と一致した文字列を認識結果
    とすることを特徴とする手書文字認識方法。
  3. 【請求項3】手書の筆跡情報を入力する手段と、 入力された筆跡情報から、手書文字についての認識候補
    文字を選定する手段と、 認識候補文字から成る文字列が、漢字と仮名文字で構成
    される場合に、仮名文字については、変換辞書を用い
    て、漢字に変換する手段と、 変換結果として得られた漢字と、前記文字列を構成する
    漢字とから成る漢字列を単語辞書と照合する手段と、 単語辞書に存在する漢字列と一致した漢字列を認識結果
    として出力する手段と、を備えたことを特徴とする手書
    文字認識装置。
  4. 【請求項4】手書の筆跡情報を入力する手段と、 入力された筆跡情報から、手書文字についての認識候補
    文字を選定する手段と、 選定された認識候補文字のうち、一部の文字について
    は、変換辞書を用いて、文字種の変換を行う手段と、 変換結果として得られた文字と、変換されなかった認識
    候補文字とから成る文字列を、単語辞書と照合する手段
    と、 単語辞書に存在する文字列と一致した文字列を認識結果
    として出力する手段と、を備えたことを特徴とする手書
    文字認識装置。
JP8328758A 1996-12-09 1996-12-09 手書き文字認識方法及び装置 Expired - Fee Related JP2968221B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8328758A JP2968221B2 (ja) 1996-12-09 1996-12-09 手書き文字認識方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8328758A JP2968221B2 (ja) 1996-12-09 1996-12-09 手書き文字認識方法及び装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP1222268A Division JP2745484B2 (ja) 1989-08-29 1989-08-29 手書文字認識方法および装置

Publications (2)

Publication Number Publication Date
JPH09204497A JPH09204497A (ja) 1997-08-05
JP2968221B2 true JP2968221B2 (ja) 1999-10-25

Family

ID=18213829

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8328758A Expired - Fee Related JP2968221B2 (ja) 1996-12-09 1996-12-09 手書き文字認識方法及び装置

Country Status (1)

Country Link
JP (1) JP2968221B2 (ja)

Also Published As

Publication number Publication date
JPH09204497A (ja) 1997-08-05

Similar Documents

Publication Publication Date Title
US9589200B2 (en) Handwriting input conversion apparatus, computer-readable medium, and conversion method
US6567549B1 (en) Method and apparatus for immediate response handwriting recognition system that handles multiple character sets
EP1743275B1 (en) Apparatus and method for handwriting recognition
JP2007317022A (ja) 手書文字処理装置及び手書文字処理方法
US20050268231A1 (en) Method and device for inputting Chinese phrases
JP2003162687A (ja) 手書き文字入力装置、手書き文字認識プログラム
KR20010088892A (ko) 한자입력장치 및 방법
JPH08314910A (ja) 異種コード文字列転記装置および電子辞書
JP2968221B2 (ja) 手書き文字認識方法及び装置
JP2745484B2 (ja) 手書文字認識方法および装置
JP2943791B2 (ja) 言語識別装置,言語識別方法および言語識別のプログラムを記録した記録媒体
JP2012108893A (ja) 手描き入力方法
JP2017062584A (ja) 電子機器及び方法
JP2765712B2 (ja) 文字認識入力装置
JPH08115330A (ja) 類似文書検索方法および装置
JPH10232864A (ja) 文章入力装置、及び文章入力プログラムを記録したコンピュータ読み取り可能な記録媒体
US6801660B1 (en) Method and system for maintaining alternates in association with recognized words
US6771817B1 (en) Method and system for extending ink word data structures while maintaining version compatibility
KR100916816B1 (ko) 일본어 앨리어스 데이터베이스를 이용하여 장음 및 촉음에대한 오류를 줄이고 일본어 입력기 사용 시 단자 찾기기능을 제공하는 방법 및 시스템
JP3518976B2 (ja) 文書処理装置及び文書処理装置制御プログラムを記憶した媒体
JP3022790B2 (ja) 手書き文字入力装置
JPH05189621A (ja) オンライン手書き文字認識装置
JPS6120176A (ja) ロ−マ字−中国語変換装置
JPH11306176A (ja) 文字処理装置及び方法並びにその制御プログラムを記憶した媒体
JPH0574867B2 (ja)

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees