JP2962984B2

JP2962984B2 - 文字認識装置

Info

Publication number: JP2962984B2
Application number: JP5311249A
Authority: JP
Inventors: 健治岡野; 浩司松本; 英理一井
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 1993-11-17
Filing date: 1993-11-17
Publication date: 1999-10-12
Anticipated expiration: 2014-10-12
Also published as: JPH07141466A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、手書き文字等から文字
認識を行う文字認識装置に関し、特に、文字列から各文
字切出しのための文字列ブロックに分割する構成に関す
る。

【０００２】

【従来の技術】筆記された文字を認識する文字認識技術
として、オンライン文字認識技術がある。このオンライ
ン文字認識技術とは、筆記された文字の軌跡をタブレッ
ト等により一定時間毎にｘ，ｙ方向の座標として抽出
し、この座標列データを用いて、ほぼ実時間で文字を認
識する技術である。即ち、このようなオンライン文字認
識技術は、筆記入力の始点（ペンオン）から終点（ペン
オフ）までを１ストロークとし、この１ストローク毎の
座標列データから文字認識を行うものである。

【０００３】このようなオンライン文字認識技術におい
て、従来の文字認識装置では、筆記された文字を１文字
に切出す場合、筆記時に文字枠を予め設けておき、この
文字枠内に、１文字を記入し、この枠内の情報を基に切
出しを行う方法が行われていた。

【０００４】ところが、このような文字枠を設ける方法
は、筆記者にとって入力時の負担が大きく、その結果、
筆記文字の入力効率を下げることにもつながる。そこ
で、例えば、特開昭６１−１２３９８８号公報や特開昭
６１−２９９８２号公報等に示されているように、文字
枠を設けることなく文字認識を行う方法が考えられてい
る。

【０００５】ここで、特開昭６１−１２３９８８号公報
に記載されている方法（これを方法１とする）は、一つ
の文字幅の上限値を定め、この文字幅によって、１文字
ずつの切出しを行おうとするものであり、また、特開昭
６１−２９９８２号公報に記載されている方法（これを
方法２とする）は、先ず、筆記された文字から分割した
各ストロークの組を基本セグメントとし、この基本セグ
メントを組み合わせて候補文字とし、次に、この候補文
字を標準文字と比較し、それらの相違度が最小となる文
字を筆記された文字とする文字認識技術である。

【０００６】

【発明が解決しようとする課題】しかしながら、上記方
法１では、文字幅情報のみで切出しを行っているため、
筆記された文字の文字幅が所定の範囲から外れてしまっ
た場合では、誤った切出しを行ってしまうという問題点
があった。また、方法２においても、文字幅に加えて文
字認識を用いて切出し性能の向上を図ってはいるが、候
補文字の作成を機械的に行っているために、余分な組合
せを作成してしまい、筆記条件によっては誤った切出し
を行ってしまうという問題点があった。更に、余分な組
合せが多ければ多いほど処理量が増大してしまうという
問題点もあった。

【０００７】本発明は、上記従来の問題点を解決するた
めになされたもので、切出しミスが少なく、かつ、処理
量の増大を抑制することのできる文字認識装置を提供す
ることを目的とする。

【０００８】

【課題を解決するための手段】本発明の文字認識装置
は、筆記文字の始点から終点までの１ストロークの座標
データを入力するための座標入力部と、前記座標入力部
で入力された座標データに基づき、筆記された文字列
を、複数の基本セグメントに分割する基本セグメント分
割部と、前記基本セグメントに含まれる各ストローク
を、各々の特徴に基づき分類したストロークコードに変
換するストロークコード化部と、前記基本セグメントに
含まれるストローク数と、各ストロークコードとに基づ
き、前記文字列を文字列ブロックに分割する文字列分割
部と、前記文字列分割部で分割された文字列ブロック毎
に文字切出しを行う文字切出し部を備えたことを特徴と
するものである。

【０００９】

【作用】本発明の文字認識装置において、各構成部分は
以下の通り動作を行う。先ず、基本セグメント分割部
は、座標入力部により入力された筆記文字列を構成する
各ストロークを、例えばＸ軸上に投影し、重なりあった
ストローク群を一つの基本セグメントとし、ストローク
コード化部に出力する。ストロークコード化部は、基本
セグメントに含まれる各ストロークのコード化を行う。
このコード化を行う方法としては、１ストローク分の入
力データ列の特徴点に基づき、ストロークを分類し、コ
ード化する。このコード化されたストロークデータ列は
文字列分割部に出力される。

【００１０】文字列分割部は、基本セグメントが文字列
ブロック分割の条件を満たすかをチェックする。この分
割条件とは、例えば、「この基本セグメントの直前で必
ず分離する（文字列分割条件１）」「この基本セグメン
トの直後で必ず分離する（文字列分割条件２）」「この
基本セグメントは１文字である（文字列分割条件３）」
という三つの可能性を調べるための条件で、ストローク
数とストロークコードより記述されている。

【００１１】もし、基本セグメントが文字列分割条件１
を満たした場合、直前までに入力された基本セグメント
を文字切出し部に出力する。また、文字列分割条件２を
満たした場合には現在の基本セグメントまでを出力す
る。文字列分割条件３を満たした場合は、先ず直前まで
に入力された基本セグメントを文字切出し部に出力し、
次に現在の基本セグメントのみを出力する。文字切出し
部は、文字列分割部より入力された文字列ブロックに基
づいて文字切出しを行う。文字切出しの方法としては、
例えば基本セグメント毎に相違度を計算し、相違度の組
合せが最小になるものを切出し結果とする。

【００１２】従って、筆記された文字列は、文字列分割
部によって分離すべき箇所は必ず分割されているので、
文字切出し部において誤って結合することがない。ま
た、余分な結合処理を行わないため、処理量が軽減され
る。また、文字列分割部は、ストローク数とストローク
コードのみで処理を行うため、処理が容易でかつ高速に
実行される。

【００１３】

【実施例】以下、本発明の実施例を図面を用いて詳細に
説明する。図１は本発明の文字認識装置の実施例を示す
ブロック図である。図の装置は、座標入力部１、基本セ
グメント分割部２、ストロークコード化部３、文字列分
割辞書４、文字列分割部５、文字切出し部６、出力端子
７からなる。

【００１４】座標入力部１は、タブレット、マウス、ラ
イトペン、タッチパネル等からなり、筆記者が文字を入
力し、この入力された文字からデータ列を抽出して基本
セグメント分割部２に出力するものである。基本セグメ
ント分割部２は、座標入力部１で入力された座標データ
列の情報から、各ストロークデータの、例えばＸ軸方向
への重なりを検出し、この重なりあったストロークを一
つの基本セグメントととして検出する機能を備えてい
る。ストロークコード化部３は、基本セグメント分割部
２で分割された基本セグメントに含まれる各ストローク
を、各々の特徴に基づき分類した識別のためのコードに
変換するものである。

【００１５】文字列分割辞書４は、基本セグメントに含
まれるストローク数と、各ストロークのコードとに対応
した文字列分割条件を格納する辞書である。図２に文字
列分割辞書４の構成を示す。図示のように、この辞書に
は、文字列分割条件１（注目している基本セグメントの
直前で行を分割するための条件）、文字列分割条件２
（注目している基本セグメントの直後で行を分割するた
めの条件）、文字列分割条件３（注目している基本セグ
メントが１文字であるための条件）が格納されている。
そして、各々の条件は、ストローク数とストロークコー
ドによって記述されている。

【００１６】文字列分割部５は、ストロークコード化部
３でコード化された各セグメントのストロークを、文字
列分割辞書４に基づき、文字列ブロックに分割するため
の機能を備えている。文字切出し部６は、文字列分割部
５で分割された文字列ブロック毎に文字切出しを行い、
出力端子７に出力するものである。

【００１７】次に、上記構成の文字認識装置の動作につ
いて説明する。尚、以下の動作は文字列が横書きの場合
である。図３、４は、上記装置の動作フローチャートで
ある。尚、図示フローチャートにおいて、基本セグメン
ト分割部２は、ステップＳ１０１を実行し、以下、スト
ロークコード化部３はステップＳ１０２を、文字列分割
部５はステップＳ１０３〜１１３を、文字切出し部６は
ステップＳ２０１〜２０４を実行する。

【００１８】先ず、座標入力部１で文字が入力される
と、そのデータ列｛（ｘ_i ，ｙ_i ）：ｉ＝１，２，…，
ｎ_j ｝_j ｛但し、ｊは画数（１〜ｊ）を示す｝が抽出さ
れ、基本セグメント分割部２に送られる。基本セグメン
ト分割部２は、座標入力部１から得られたストローク列
をＸ座標に投影し、重なりが連続しているものを一つの
基本セグメントとする（ステップＳ１０１）。

【００１９】図５は、基本セグメント分割の一例を示す
図である。このような分割を行う場合は、先ず、ストロ
ーク毎にＸ方向の最大値、最小値を求める。各々の値を
Ｘｍａｘ_i 、Ｙｍｉｎ_i ｛ｉはストロークの番号：ｉ＝
１〜Ｓｍａｘ（Ｓｍａｘは手書き文字列に含まれるスト
ローク数）｝とする。

【００２０】最初に各々のストロークを一つのセグメン
トと仮定する。例えば、ｋ番目のセグメントの処理を行
う場合、そのセグメントのＸ方向の最小値（Ｘｍｉｎ
_K ）が、それ以前のセグメント（それまでの処理結果が
反映される）のＸ方向の最大値（Ｘｍａｘ_i ：ｉ＜ｋ）
を下回らないか（Ｘｍｉｎ_K ≦Ｘｍａｘ_i ）をチェック
する。ここで、ｉは１から順に変化させ、最初に条件を
満たしたものを採用する。もし、条件を満たした場合に
は、第ｉセグメントから第ｋセグメントまでを一つのセ
グメントとする。以上の操作を、ｋを１からＳｍａｘま
で変化させて順次処理することにより、基本セグメント
の分割を行うことができる。

【００２１】分割して生成された基本セグメントは、ス
トロークコード化部３に出力される。ここで、生成され
た基本セグメントの数をＳＥＧｎ、各基本セグメントに
含まれるストロークの数をＳＴＲｎ_i （ｉ＝１〜ＳＥＧ
ｎ）とする。また、この基本セグメント分割部２の分割
動作において、マイナス方向に移動して生成された空白
は空白とは見なさない。図６は、このような例を示した
ものである。即ち、「小」のように、筆順がマイナス方
向（左方向）移動する部分がある文字では、その部分の
空白は空白とはみなさないものである。

【００２２】次に、ストロークコード化部３の動作につ
いて説明する。ストロークコード化部３は、ストローク
毎の特徴点情報（特徴点は、例えば入力データ列のデー
タ間のＸ，Ｙ方向のサインを求め、このサインの状態の
変化点を特徴点とする等の方法により抽出することがで
きる）に基づき、各ストロークをその形状により、予め
用意された数種類のコードに割り当てる（ステップＳ１
０２）。このコード化の方法としては、例えば各セグメ
ントのＸ，Ｙサイン、セグメントの角度、セグメント間
の回転角度により分類し、コード化を行う。尚、ここ
で、サインとは各データ間の差分の符号（＋、−）であ
り、また、セグメントとは、ストロークの曲線を複数の
直線で近似した場合の各々の直線を指している。

【００２３】この処理により、各基本セグメント毎に、
ストロークコード｛Ｓ-1，Ｓ-2，…，Ｓ-STRn_i｝_i （ｉ
＝１〜ＳＥＧｎ）が得られる（ここで、Ｓ-iとは、ｉ番
目のストロークに割り当てられたストロークコードであ
る）。そしてコード化されたストロークデータは文字列
分割部５に出力される。

【００２４】文字列分割部５は、各基本セグメントに含
まれるストロークコードと基本セグメントに含まれるス
トロークの数の両方が文字列分割辞書４に記述された条
件を満たすかを判定する。先ず、文字列分割条件１（基
本セグメントの直前で分割する条件）を満たすかを調べ
る（ステップＳ１０３）。実際に一致するものを検索す
る場合、処理の増加を抑えるため、先ずストローク数の
一致するものを探し出す。一致するものが存在した場
合、次に辞書に筆記されたストロークコードＳ_dicと一
致するストロークコードが基本セグメントに含まれるか
を調べる（Ｓ_i ＝Ｓ_dic：ｉ＝１〜ＳＴＲｎ_j ；ｊは注
目している基本セグメント）。

【００２５】以上の操作で条件が一致した場合には、直
前の基本セグメントまでを文字切出し部６に出力する
（ステップＳ１０４）。もし、一致する条件が存在しな
かった場合には、次に文字列分割条件２（基本セグメン
トの直後で分割する条件）を満たすかを調べる（ステッ
プＳ１０５）。尚、調べる方法は文字列分割条件１と同
様である。

【００２６】ここで、文字列分割条件２を満たした場
合、現在注目している基本セグメントまでを文字切出し
部６に出力する（ステップＳ１０６）。一方、文字列分
割条件２を満たさない場合、次に文字列分割条件３を満
たすかを調べる（ステップＳ１０７）。また、ここでも
調べる方法は文字列分割条件１の方法と同様である。も
し、文字列分割条件３を満たした場合、先ず直前の基本
セグメントまでを文字切出し部６に出力し（ステップＳ
１０８）、これによって、文字切出し部６が、分割され
た文字列ブロックの文字切出しを行う（ステップＳ２０
２）。次に、文字列分割部５は、注目している現在の基
本セグメントのみを出力し（ステップＳ１０９）、文字
切出し部６は、この基本セグメントの文字切出しを行う
（ステップＳ２０３）。図７に、文字列分割の一例を示
す。

【００２７】次に、文字切出し部６の動作について説明
する。文字切出し部６は、文字列分割部５より送られき
た各文字列ブロック毎に、文字切出しを行う（ステップ
Ｓ２０１、Ｓ２０２、Ｓ２０３）。この文字切出しとし
ては、既知の方法を用いることができる。例えば、従来
の技術で述べた方法２を適用することが考えられる。先
ず、基本セグメント毎に文字辞書との相違度を計算し、
各々を組み合わせた場合の相違度の合計が最小となるよ
うな組合せを探し出し、最小となったものを各々文字候
補とする。あるいは、方法１に示されているような文字
幅のみを用いる方法や、ペンアップ時間を検出して切出
しを行う等、様々な文字切出し方法を用いることができ
る。

【００２８】尚、図３、４のフローチャートにおいて、
ステップＳ２０１で文字切出しを行った後、およびステ
ップＳ１０７で文字列分割条件３を満たさなかった場合
（即ち、文字列分割条件１〜３を全て満たさなかった場
合）は、その基本セグメントが最後か否かを判定し（ス
テップＳ１１０）、最後であった場合は、残りの基本セ
グメントを出力し（ステップＳ１１１）、これを文字切
出し部６が文字切出しを行い（ステップＳ２０４）、文
字認識処理を終了する。一方、ステップＳ１１０で最後
の基本セグメントでない場合は、文字列の分割処理を次
の基本セグメントとして（ステップＳ１１３）、ステッ
プＳ１０３に戻る。

【００２９】また、ステップＳ２０３の文字切出しが終
了すると、それが最後の基本セグメントか否かを判定し
（ステップＳ１１２）、最後でない場合は、次の基本セ
グメントとして（ステップＳ１１３）、ステップＳ１０
３に戻り、最後であった場合は文字認識処理を終了す
る。

【００３０】尚、上記実施例では、文字列が横書きの場
合を説明したが、これに限定されるものではなく、縦書
き等の場合も同様に適用可能である。例えば、縦書きの
場合では、基本セグメントの分割をＹ軸方向への投影に
よる重なりに基づいて行い、文字列分割辞書４も、この
ような分割に対応したストローク数およびストロークコ
ードとすることで、容易に適用することができる。

【００３１】

【発明の効果】以上説明したように、本発明の文字認識
装置によれば、入力された文字列を複数の基本セグメン
トに分割し、この基本セグメントに含まれるストローク
の数と、各ストロークの特徴とに基づき文字列を文字列
ブロックに分割し、これら文字列ブロック毎に文字切出
しを行うようにしたので、以下のような効果がある。文字列分割部によって、文字列の分離すべき箇所のう
ち分割条件を満たしたものは必ず分割されるため、文字
切出し部で誤って結合される箇所が減少し、従って切出
し性能が向上する。文字切出し部で余分な結合処理を行わなくて良いの
で、処理量を軽減することができる。文字列分割部は、ストローク数とストロークコードの
二つのみで処理を行うため、処理が容易で、かつ高速に
実行することができる。

【図面の簡単な説明】

【図１】本発明の文字認識装置の構成を示すブロック図
である。

【図２】本発明の文字認識装置における文字列分割辞書
の内容を示す説明図である。

【図３】本発明の文字認識装置の動作フローチャート
（その１）である。

【図４】本発明の文字認識装置の動作フローチャート
（その２）である。

【図５】本発明の文字認識装置における基本セグメント
分割の説明図である。

【図６】本発明の文字認識装置における筆順を考慮した
セグメント分割の説明図である。

【図７】本発明の文字認識装置における文字列ブロック
分割の一例を示す図である。

【符号の説明】

１座標入力部２基本セグメント分割部３ストロークコード化部４文字列分割辞書５文字列分割部６文字切出し部

───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.⁶，ＤＢ名) G06K 9/00 - 9/82

Claims

(57)【特許請求の範囲】

【請求項１】筆記文字の始点から終点までの１ストロ
ークの座標データを入力するための座標入力部と、前記座標入力部で入力された座標データに基づき、筆記
された文字列を、複数の基本セグメントに分割する基本
セグメント分割部と、前記基本セグメントに含まれる各ストロークを、各々の
特徴に基づき分類したストロークコードに変換するスト
ロークコード化部と、前記基本セグメントに含まれるストローク数と、各スト
ロークコードとに基づき、前記文字列を文字列ブロック
に分割する文字列分割部と、前記文字列分割部で分割された文字列ブロック毎に文字
切出しを行う文字切出し部を備えたことを特徴とする文
字認識装置。