JPH0916720A

JPH0916720A - 文字認識方法及び装置

Info

Publication number: JPH0916720A
Application number: JP7167723A
Authority: JP
Inventors: Yukimitsu Fujimori; 幸光藤森
Original assignee: Seiko Epson Corp
Current assignee: Seiko Epson Corp
Priority date: 1995-07-03
Filing date: 1995-07-03
Publication date: 1997-01-17

Abstract

(57)【要約】【目的】画数等では有効な大分類が行えない走り書き
等による続け字も大分類可能とし、さらに、従来の画数
やセグメント長による大分類では分類できなかった文字
も大分類可能とする。【構成】入力された文字の入力開始位置から終了位置
までの間をサンプリングし座標データ列を生成する座標
化処理ステップ２，３と、その座標化された各座標点間
を結ぶ２次元ベクトルを生成するベクトル化処理ステッ
プ４，５と、ベクトル化処理された各ベクトルの成分の
総和を２次元の各要素毎にとる総和ベクトル算出処理ス
テップ６と、総和ベクトル算出処理により得られた各総
和値の値を利用して文字の候補を抽出する文字分類処理
ステップ７，８とを有している。そして、この文字分類
処理ステップ７，８では、ベクトルの成分の絶対値の総
和の比を、総和ベクトル成分比辞書に格納された値と比
較し、文字の大分類処理を行っている。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、いわゆる文字大分類と
言われる文字分類を利用した文字認識方法及び装置に関
し、さらに詳しくは、楷書だけでなく、続け字をも認識
できる文字認識方法及び装置に関する。

【０００２】

【従来の技術】パソコンやオンライン装置等では、省力
化等のため、キーによる文字入力に代わり、タブレット
やスキャナー等の文字入力手段が使用されることが多く
なっている。ところが、タブレットやスキャナー等の文
字入力手段による入力は、手書き文字や印刷文字を一旦
イメージデータとして読み込むものであり、特定の文字
として認識させるためには、そのイメージデータを解析
し分類する作業、例えば文字大分類と言われている作業
等が必要となる。

【０００３】ここで文字認識装置等における文字大分類
とは、文字認識を行う前に、入力文字パターンの所定の
特徴をもとに辞書から候補文字を選出し、入力文字パタ
ーンと候補文字のみの辞書パターンとを照合させること
で照合回数を削減し、文字認識を高速に行う処理のこと
である。

【０００４】そして、従来、続け字に対応する文字大分
類としては、特公平４−５２３１に記載されるように、
辞書中の各文字毎に変動が予想される画数範囲をあらか
じめ辞書中に記しておき、辞書中に記された画数範囲が
入力画数を含む文字のみを候補文字とする方法や、特開
平２−７５０８９に記載されるように、入力文字の座標
データを特徴点でセグメントに分割し、そのセグメント
長の平均値を予め同様にして算出された標準パターンの
セグメント長の平均値と比較することにより、候補文字
を選出する方法などがある。これらにより、文字認識装
置、特にオンライン文字認識装置は認識速度を向上させ
ている。

【０００５】

【発明が解決しようとする課題】しかしながら、前述の
特公平４−５２３１のような画数を用いる方法や装置で
は、例えば走り書きなどにより設定した画数範囲外の書
き方をした文字は、大分類の段階で候補文字から除外さ
れて認識できなくなってしまう。これを補うために画数
範囲を広く設定すれば、候補文字が増え、文字大分類の
効率が低下してしまうという問題がある。また、前述の
特開平２−７５０８９のようなセグメント長を用いる方
法では、セグメント長が近い値を持つ文字、例えば
「川」と「三」、「山」と「ヨ」、などを分類、すなわ
ち区別しにくいという問題がある。

【０００６】本発明は、以上述べた問題点を改善し、画
数等では有効な大分類が行えない走り書き等による続け
字も大分類可能とし、さらに、従来の画数やセグメント
長による大分類では分類できなかった文字も大分類可能
とした文字認識方法及び装置を提供する事を目的として
いる。

【０００７】

【課題を解決するための手段】上記課題をを解決するた
めに、本発明の文字認識方法は、入力された文字の入力
開始位置から終了位置までの間をサンプリングし座標デ
ータ列を生成する座標化処理ステップと、その座標化さ
れた各座標点間を結ぶ２次元ベクトルを生成するベクト
ル化処理ステップと、ベクトル化処理された各ベクトル
の成分の総和を２次元の各要素毎にとる総和ベクトル算
出処理ステップと、総和ベクトル算出処理により得られ
た各総和値の値を利用して文字の候補を抽出する文字分
類処理ステップとを有している。

【０００８】そして、ベクトル化処理ステップにおい
て、座標点間、または、座標データ列から抽出した特徴
点間を結ぶ２次元ベクトルを生成している。

【０００９】また、本発明の文字認識装置は、入力され
た文字の入力開始位置から終了位置までの間をサンプリ
ングし座標データ列を生成する座標化処理手段と、その
座標化された各座標点間を結ぶ２次元ベクトルを生成す
るベクトル化処理手段と、ベクトル化処理された各ベク
トルの成分の総和を２次元の各要素毎にとる総和ベクト
ル算出処理手段と、総和ベクトル算出処理により得られ
た各総和値の値を利用して文字の候補を抽出する文字分
類処理手段とを具備している。

【００１０】そして、ベクトル化処理手段において、座
標点間、または、座標データ列から抽出した特徴点間を
結ぶ２次元ベクトルを生成している。

【００１１】

【作用】本発明の文字認識方法及び装置では、まず文字
入力手段により文字のイメージデータを入力する。その
後、そのイメージデータを解析分類し特定の文字として
認識する。そして、文字大分類にあたり、総和ベクトル
算出処理により得られた各総和値の値を利用する。

【００１２】この文字大分類の際に使用する総和ベクト
ルは、入力文字の座標データ列の座標点間または特徴点
間を結ぶベクトルの総和であり、画数に依存しないため
画数範囲を限定する必要がなく、走り書き等による続け
字の認識においても正しく有効な大分類が行える。さら
に画数やセグメント長等では分類できなかった文字も分
類可能となるため、走り書きされた文字を含む続け字に
対しても正しく大分類ができると共に入力文字の認識率
を向上させる事が可能となる。

【００１３】

【実施例】本発明の実施例を図面に基づいて説明する。

【００１４】図１は、本発明に係る手順を示すフローチ
ャートである。このフローチャートと図４から図６に示
す、手書き文字「い」が入力された場合の例に基づき文
字認識方法のステップの概要を説明する。

【００１５】図１において、第１ステップの文字イメー
ジデータ入力ステップ１では、従来からよく知られてい
るタブレット等のパネルにペンで、入力文字のイメージ
データが入力される。第２ステップの座標データ列成生
処理ステップ２は、後述する文字入力回路により、入力
された手書き文字を座標データ列に変換する処理であ
る。この処理により、ノイズ等の不要信号が除去され、
図４（ａ）に示すように、始終点情報によるオンストロ
ーク（＝１連続部分の開始から終了）及びオフストロー
ク（＝１連続部分の終了から次の１連続部分の開始）の
情報を含み、原点を入力文字の外接矩形の左下とした座
標データ列が生成される。次に、第３ステップの正規化
処理ステップ３において、この座標データ列をベクトル
の要素、すなわち縦方向成分と横方向成分に対しそれぞ
れ独立した倍率で正規化を行う。次に、第４ステップの
特徴点抽出処理ステップ４において、オンストローク毎
に折れ線近似を行い、この端点を特徴点として抽出す
る。その後、第５ステップのベクトル生成処理ステップ
５において正規化後の各座標点間を結ぶベクトルを生成
する。その後、第６ステップの総和ベクトル算出処理ス
テップ６において、ベクトルの成分の絶対値の総和をと
ることにより総和ベクトルを求める。さらに、第７ステ
ップの総和ベクトル成分比算出処理ステップ７により、
２つの総和ベクトルの成分の比（以下、総和ベクトル成
分比という）を算出し、入力文字の総和ベクトル成分比
とする。

【００１６】次に、第８ステップとして、大分類処理ス
テップ８が行われる。この大分類処理ステップ８では、
後述する、あらかじめ算出された各文字の標準パターン
の総和ベクトル成分比が大きい順に格納されている総和
ベクトル成分比辞書と、総和ベクトル成分比算出処理ス
テップで得られた総和ベクトル成分比とを比較し、認識
候補となる文字の選出を行う。その後、第９ステップの
文字認識処理ステップ９において、文字辞書（詳細は後
述）に格納された文字認識用データの内、大分類処理ス
テップ８により選出された候補文字の文字認識用データ
と、特徴点抽出処理ステップ４により得られたデータと
を比較して文字認識を行う。そして、その得られた結果
を第１０ステップの表示出力ステップ１０にて例えばＣ
ＲＴ等に表示する。

【００１７】以下に各処理ステップの詳細内容を、図１
から図６に基づき説明する。

【００１８】ａ）文字イメージデータ入力ステップ１タブレット１１等のパネルとペン１２からなる文字入力
手段１３で、入力文字のイメージデータが入力される。
この場合、スキャナー等の他の入力手段を採用してもよ
い。

【００１９】ｂ）座標データ列生成処理ステップ２座標データ列生成処理は、文字入力回路１４からのサン
プリングされた信号を得て、１文字入力開始から終了ま
でに記入されたオンストローク（ペンオンからペンオフ
までの筆記部分でもある）毎に、ストローク始終点情報
と座標データ列を生成する。その例を図４（ａ）に示
す。なお、文字入力回路４が座標データ列生成処理部１
５に相当する。

【００２０】ｃ）正規化処理ステップ３正規化処理ステップ３は、正規化処理回路１６にて実施
される。そして、座標データ列生成処理ステップ２と正
規化処理ステップ３とで、座標化処理ステップを構成し
ている。同様に、座標データ列生成処理部１５と正規化
処理回路１６とで座標化処理手段１７が構成される。

【００２１】正規化処理ステップ３の内容を図４を用い
て詳細に説明する。図４（ａ）において符号４１は座標
データ列生成処理ステップ２により得られたｎ個の座標
データ列、（Ｐx(i),Ｐy(i)）｛１≦ｉ≦ｎ｝による座標点Ｐ(i)｛１≦ｉ≦ｎ｝を図示したものである。これよりベクトルの要素の各方
向における最大点を算出する。本実施例においては、ベ
クトルの要素に縦方向（Ｙ）成分及び横方向（Ｘ）成分
を用いているので、図４（ａ）においてＸmax及びＹmax
が最大点となる。これを基に、正規化すべき最大座標で
あるＸnorm、Ｙnorm（本実施例ではＸnorm＝Ｙnorm＝１
６０に設定）との比、Ｘratio＝Ｘnorm／Ｘmax Ｙratio＝Ｙnorm／Ｙmax を求める。正規化後の座標データ列（Ｎx(i)、Ｎy(i)）
｛１≦ｉ≦ｎ｝は、Ｎx(i) ＝Ｐix × Ｘratio Ｎy(i) ＝Ｐiy × Ｙratio により求める。図４（ｂ）は、図４（ａ）に示す座標デ
ータ列に対してこの正規化を行った結果を示した図であ
る。この例では、Ｘratio＝１．９６、Ｙratio＝２．３
７であった。

【００２２】ｄ）特徴点抽出処理ステップ４特徴点抽出処理ステップ４は、特徴点抽出処理回路１８
にて行われる。そして、この特徴点抽出処理ステップ４
の内容を図５を用いて詳細に説明する。座標点Ｐ１〜Ｐ
８は、Ｐ１を始点、Ｐ８を終点とする１オンストローク
の正規化された座標データ列である。オンストロークの
始点と終点を結ぶ直線ｍを作成し、正規化された座標デ
ータ列中から直線ｍとの距離の最大値をｈとする。図５
（ａ）ではＰ４が最遠点となる。このとき、ｈ／ｍが所
定の値ｅよりも大きい時は、直線ｍを、最遠点Ｐ４を端
点としたｍ１及びｍ２に分割する。この様子を図５
（ｂ）に示す。この処理を直線の分割が起こらなくなる
まで再帰的に行い、得られた端点を特徴点として次のベ
クトル生成処理ステップ５にかける。図４（ｂ）に示す
正規化された座標データ列に対し特徴点抽出処理を行っ
た例を図６に示す。この例では、Ｔ１〜Ｔ７の７点の特
徴点が抽出された。

【００２３】ｅ）ベクトル生成処理ステップ５ベクトル生成処理ステップ５は、特徴点抽出処理ステッ
プ４で得られた各特徴点を入力された順に結ぶベクトル
を生成する。なお、このベクトル生成処理ステップ５
は、ベクトル生成処理回路１９で実施される。本実施例
ではベクトルの要素に縦（Ｙ）方向成分及び横（Ｘ）方
向成分を用いているので、特徴点ＴiのＸ成分をＴx
(i)、Ｙ成分をＴy(i)とすると、特徴点データ列Ｔi（Ｔx(i)、Ｔy(i)）｛１≦ｉ≦ｎ｝からベクトル列Ｖi（Ｖx(i)、Ｖy(i)）｛１≦ｉ＜ｎ｝
を、Ｖx(i)＝Ｔx(i+1)−Ｔx(i) Ｖy(i)＝Ｔy(i+1)−Ｔy(i) により求める。図４に示す特徴点データ列は、Ｔ１＝（０，１６０）Ｔ２＝（３４，０）Ｔ３＝（４６，２７）Ｔ４＝（６５，５０）Ｔ５＝（１３７，１６０）Ｔ６＝（１４９，１２６）Ｔ７＝（１６０，３８）であるので、ベクトル列は、Ｖ１＝（３４，−１６０）Ｖ２＝（１２，２７）Ｖ３＝（１９，２３）Ｖ４＝（７２，１１０）Ｖ５＝（１２，− ３４）Ｖ６＝（１１，− ８８）となる。

【００２４】なお、特徴点抽出処理ステップ４とベクト
ル生成処理ステップ５とで、ベクトル化処理ステップが
構成され、特徴点抽出処理回路１８とベクトル生成処理
回路１９とで、ベクトル化処理手段２０が構成される。

【００２５】ｆ）総和ベクトル算出処理ステップ６総和ベクトル算出処理ステップ６は、ベクトル生成処理
ステップ５により得られたデータから総和ベクトルを算
出する処理である。総和ベクトルは全ベクトルの成分の
絶対値の和で、これを（ＳＶｘ，ＳＶｙ）とすると、である。図６に示す特徴点データ列では、ＳＶｘ＝１６
０、ＳＶｙ＝４４２となり、縦方向に筆記ペンの動きが
大きい事が分かる。なお、この総和ベクトル算出処理ス
テップ６は、総和ベクトル算出処理回路で構成される総
和ベクトル算出処理手段２１で行われる。

【００２６】ｇ）総和ベクトル成分比算出処理ステップ
７総和ベクトル成分比は、ＳＶｙ／（ＳＶｘ＋ＳＶｙ）で求める。図６に示す特徴点データ列では、４４２／（４４２＋１６０）＝０．７３となる。縦方向の筆記ペンの動きが全体の７３％を占め
ていることが分かる。なお、この総和ベクトル成分比算
出処理ステップ７は、総和ベクトル成分比算出処理回路
２２で実施される。

【００２７】ｈ）大分類処理ステップ８大分類処理ステップ８での大分類方法は、入力文字の総
和ベクトル成分比を含むある範囲幅を設け、標準パター
ンの総和ベクトル成分比がこの範囲幅に含まれる文字の
みを認識候補とする方法である。具体的には、予め、総
和ベクトル成分比の上限の値ＵＰ、下限の値ＤＰを予め
定めておき、総和ベクトル成分比算出処理ステップ７に
よって得られた総和ベクトル成分比ＶＲに対し、ＶＲｍａｘ＝ＶＲ＋ＵＰＶＲｍｉｎ＝ＶＲ＋ＤＰなる範囲幅、ＶＲｍａｘ、ＶＲｍｉｎを求め、総和ベク
トル成分比辞書２３の総和ベクトル成分比ＶＲｄｉｃ
が、ＶＲｍｉｎ＜ＶＲｄｉｃ＜ＶＲｍａｘである文字のみを候補文字として抽出するものである。

【００２８】ここで、総和ベクトル成分比辞書２３と
は、大分類辞書であり、文字コードと各文字の標準パタ
ーンの総和ベクトル成分比を表１のように格納したもの
である。

【００２９】

【表１】

【００３０】なお、大分類処理ステップ８は、大分類処
理回路２４で行われる。そして、総和ベクトル成分比算
出処理ステップ７と大分類処理ステップ８とで文字分類
処理ステップが構成される。また、総和ベクトル成分比
算出処理回路２２、総和ベクトル成分比辞書２３および
大分類処理回路２４から文字分類処理手段２５が構成さ
れる。

【００３１】ｉ）文字認識処理ステップ９文字認識処理ステップ９では、特徴点抽出処理ステップ
４で得られた折れ線端点である特徴点データ列とストロ
ーク始終点情報とから、サブストロークを抽出する。サ
ブストロークとは、似た方向に延びるいくつかの折れ線
を１本にまとめた直線である。サブストローク抽出の例
を図７に示す。サブストローク抽出後、文字辞書２６に
格納されたサブストロークパターンのうち、大分類処理
ステップ８で得られた候補文字に該当するサブストロー
クパターンとのみマッチングを行い、最も類似度が高い
ものを認識結果として抽出する。

【００３２】ここで文字辞書２６には、文字認識処理ス
テップ９で行うサブストロークマッチングのための、標
準パターンのサブストロークパターンが格納されてい
る。

【００３３】なお、文字認識処理ステップ９は、文字認
識処理回路２７で行われる。また、特徴点抽出処理回路
１８と、文字辞書２６と、文字認識処理回路２７とで文
字認識処理手段２８が構成される。

【００３４】ｊ）表示出力ステップ１０文字認識処理ステップ９で得られた結果を、出力バッフ
ァ２９を介して、ＣＲＴ３０、プリンタ３１、外部記憶
手段３２等に表示する。ここで、表示出力ステップ１０
は、出力部３３に相当し、この出力部３３は、出力バッ
ファ２９、ＣＲＴ３０、プリンタ３１、外部記憶手段３
２等で構成される。

【００３５】以上説明した各ステップの内、第３ステッ
プの正規化処理ステップ３から第９ステップの文字認識
処理ステップ９までは、図３に示すようにマイクロプロ
セッサ３４で行わせることができる。なお、第２ステッ
プの座標データ列生成処理ステップ２もマイクロプロセ
ッサ３４で行わせるようにしても良い。

【００３６】以上の方法によれば、オフストローク情報
を含んだ座標データ列を大分類処理の際の特徴に用いる
ので、楷書と続け字との差異が殆どなくなり、続け字で
も有効な大分類が行える。すなわち、図６の実施例で示
すように、Ｔ４からＴ５のオフストロークの情報も含ん
でいるため、仮にＴ４とＴ５がつながった続け字でも楷
書と同じような値を持つことになり、認識が可能となる
のである。

【００３７】また、総和ベクトルを大分類処理に用いて
いるので、画数やセグメント長などでは大分類不可能で
あった文字も大分類可能となる。例えば、「三」と
「川」は、どちらも画数は３で、平均セグメント長はど
ちらもほぼ外接矩形の１辺の長さであり、これらは画数
や平均セグメント長では分類不可能であるが、総和ベク
トルでは、「三」（７２０、１６０）、「川」（１７
０、７２０）となるため、容易に分類が可能である。

【００３８】さらに、本実施例では、総和ベクトルの要
素の各方向に独立した倍率で正規化を行うので、この方
向への変動が吸収され、安定した大分類処理の際の特徴
の抽出が行える。また、文字認識処理に用いる特徴点を
用いて大分類を行うので、大分類処理のために、文字認
識処理とは別の特徴点を抽出する必要がなく、処理量が
少なくなっている。

【００３９】また、総和ベクトル成分比という１つのパ
ラメータで大分類を行っているので、そのまま総和ベク
トルを用いるのに比べ、大分類辞書容量、大分類処理時
間ともに半分になっている。

【００４０】本実施例では、ベクトル生成処理ステップ
５を軽減するために、特徴点抽出処理を行い、特徴点か
らベクトルの生成を行ったが、正規化処理ステップ３で
得られる正規化後の座標データ列からベクトル生成処理
を行ってもよい。

【００４１】また、本実施例では、文字変形を吸収する
ために、正規化処理ステップ３において、総和ベクトル
の要素の方向に独立した倍率で正規化を行う方法を用い
たが、文献「線密度イコライゼーション−相関法のため
の非線形正規化−」（電子情報通信学会論文誌 Vol.J67
-D No.11 pp.1379-1383）などの線密度を一定にする非
線形正規化を行えば、文字変形をより吸収することがで
き、より安定した総和ベクトルの算出が行え、より有効
な大分類を行うことができる。

【００４２】また、総和ベクトル成分比の算出式は、ＳＶｘ／（ＳＶｘ＋ＳＶｙ）（式１）ＳＶｙ／ＳＶｘ（式２）ＳＶｘ／ＳＶｙ（式３）などを用いることができる。本実施例の総和ベクトル成
分比と上記３つの式は本質的に差異がない。式１と式３
は、Ｘ方向の総和ベクトルＳＶｘに注目し、本実施例と
式２は、Ｙ方向の総和ベクトルＳＶｙに注目した式であ
る。また、式２と式３は値域が０以上無限大であるが、
本実施例と式２は０以上１以下である。

【００４３】また、大分類処理の方法は、本実施例の方
法の他に、次の方法がある。

【００４４】入力文字の総和ベクトル成分比に近い総
和ベクトル成分比を持つ標準パターンをいくつか選び出
して候補文字とする方法がある。具体的には、入力文字
の総和ベクトル成分比に最も近い総和ベクトル成分比を
持つ文字を総和ベクトル成分比辞書２３より捜し出し、
前記文字から総和ベクトル成分比の大きい方及び小さい
方へ各々定めた文字数分取り出して候補文字とし、文字
認識処理回路２７の処理にかける方法である。

【００４５】総和ベクトル成分比辞書２３を、表２に
示すように上限、下限の項目に変更し、総和ベクトル成
分比算出処理ステップ７により得られた総和ベクトル成
分比が前記上限と前記下限の間にある文字のみを候補文
字として文字認識処理ステップ９に送る方法である。

【００４６】

【表２】

【００４７】なお、手書き文字ではなく印刷文字のよう
なしっかりした文字の場合等では、大分類処理での絞り
込み精度が高くなるので、文字認識処理を行わないよう
にしたり、文字認識処理の代わりに、作業する人間が候
補文字から対象文字を確定させるようにしても良い。

【００４８】

【発明の効果】請求項１及び１１によれば、大分類処理
に総和ベクトルを用いるので、画数情報を利用した大分
類処理では不可能な走り書きのような文字においても正
しく認識でき、大分類が可能となる。また、セグメント
長等を用いた大分類では不可能な文字、例えば「川」と
「三」のような文字を区別でき大分類が可能となる。こ
のため、認識率が極めて高く、かつ効率の良い文字認識
方法及び装置を得ることができる。

【００４９】加えて、請求項２及び１２によれば、ベク
トルを特徴点間を結ぶものとしているため、入力座標点
間を結ぶベクトルに比べ、ベクトル数を著しく減少させ
ることができ、総和ベクトルを求める際の計算量を大幅
に軽減することができる。このため、一層効率の良い文
字認識方法及び装置を得ることができる。

【００５０】さらに、請求項３及び１３によれば、請求
項２または１２記載の文字認識方法または装置におい
て、入力文字を手書き文字とし、２次元ベクトルの要素
を、縦方向成分及び横方向成分としたので、ペンとタブ
レットの組み合わせ等の簡易な入力装置を使用でき、し
かもタブレット等の座標入力装置の座標軸をそのまま用
いる事ができるので、座標系変換処理を省く事ができ
る。この結果、パソコン等での文字入力が用紙に文字を
書く感覚で行え、しかもその処理も極めてスピードアッ
プできる。

【００５１】また、請求項４及び１４によれば、請求項
２または１２記載の文字認識方法または装置において、
特徴点抽出処理の結果を文字分類処理のみならず、文字
認識処理においても利用できるため、処理が単純でかつ
処理時間を短縮することができる。このため、オンライ
ン処理に極めて好適な文字認識方法及び装置となる。

【００５２】加えて、請求項５及び１５によれば、請求
項２または１２記載の文字認識方法または装置におい
て、特徴点を折れ線近似したときの折れ線の端点とした
ので、簡単にしかも高速に特徴点を求めることができ
る。このため、一層文字認識スピードの速い文字認識方
法及び装置を得ることができる。

【００５３】さらに、請求項６及び１６によれば、請求
項１もしくは２または１１もしくは１２記載の文字認識
方法または装置において、総和ベクトルを求める際に各
ベクトルの成分の絶対値をとるようにしたので、ある方
向に往復があるような文字入力に対しても、ペンの移動
量が、総和をとることにより相殺されることなく保存さ
れるので、文字特徴を際立たせることができる。このた
め、文字認識率が一層向上する。

【００５４】また、請求項７及び１７によれば、請求項
１もしくは２または１１もしくは１２記載の文字認識方
法または装置において、オンストロークのみならず、オ
フストロークにおいてもベクトルの生成を行うので、楷
書体だけでなく続け字においても正しい大分類を行うこ
とができる。この結果、人があわてて書いたような文字
でも認識できるという認識範囲の広い文字認識方法及び
装置を得ることができる。

【００５５】加えて、請求項８及び１８によれば、請求
項１もしくは２または１１もしくは１２記載の文字認識
方法または装置において、ベクトルの２次元の各要素の
方向へ独立した倍率で正規化を行うので、ベクトルの２
次元の各要素の方向への変形がある入力文字に対して
も、正しい大分類を行うことができ、くずれ字も正しく
認識できるものとなる。

【００５６】さらに、請求項９及び１９によれば、請求
項１もしくは２または１１もしくは１２記載の文字認識
方法または装置において、線密度を均一にする非線形正
規化を行うので、変形した入力文字に対しても安定した
長さのベクトルを得る事ができ、正しい大分類を行うこ
とができる。この結果、変形文字も正しく認識できるも
のとなる。

【００５７】そして、請求項１０及び２０によれば、請
求項１もしくは２または１１もしくは１２記載の文字認
識方法または装置において、比を算出するという単純な
計算で総和ベクトル成分比を算出することにより、１つ
のパラメータで大分類を行えるので、総和ベクトルを用
いるのに比べ、大分類辞書容量、大分類処理時間ともに
半分で大分類を行うことができる。この結果、文字認識
速度が速い文字認識方法となり、また同じ字数でも記憶
容量部分を少なくでき処理速度が速い文字認識装置とな
る。

【図面の簡単な説明】

【図１】本発明に係る手順を示すフローチャートであ
る。

【図２】本発明に係る文字認識装置を示す機能ブロッ
ク図である。

【図３】本発明の文字認識装置の構成図である。

【図４】本発明により生成した座標データ列の例を示
す図で、（ａ）は正規化前の座標データ列を示す図で、
（ｂ）は正規化後の座標データ列を示す図である。

【図５】本発明による折れ線近似による特徴点抽出を
説明する図で、（ａ）は特徴点の抽出開始時点の説明図
で、（ｂ）は１つの特徴点が抽出された状況を示してい
る図である。

【図６】本発明による折れ線近似処理によって特徴点
が抽出された一例を示す図である。

【図７】本発明の一実施例に使用する文字認識処理に
よって抽出されたサブストロークの一例を示す図であ
る。

【符号の説明】

１文字イメージデータ入力ステップ２座標データ列生成処理ステップ（座標化処理ステッ
プ）３正規化処理ステップ（座標化処理ステップ）４特徴点抽出処理ステップ（ベクトル化処理ステッ
プ）５ベクトル生成処理ステップ（ベクトル化処理ステッ
プ）６総和ベクトル算出処理ステップ７総和ベクトル成分比算出処理ステップ（文字分類処
理ステップ）８大分類処理ステップ（文字分類処理ステップ）９文字認識処理ステップ１０表示出力ステップ１１タブレット（パネル）１２ペン１３入力手段１４文字入力回路１５座標データ列生成処理部１６正規化処理回路１７座標化処理手段１８特徴点抽出処理回路１９ベクトル生成処理回路２０ベクトル化処理手段２１総和ベクトル算出処理回路（総和ベクトル算出処
理手段）２２総和ベクトル成分比算出処理回路２３総和ベクトル成分比辞書２４大分類処理回路２５文字分類処理手段２６文字辞書２７文字認識処理回路２８文字認識処理手段３３出力部３４マイクロコンピュータ（ＣＰＵ）４１手書き文字座標データ列Ｐ０・・・Ｐｎ座標Ｔ１・・・Ｔ７特徴点

Claims

【特許請求の範囲】

【請求項１】文字入力手段により入力された文字のイ
メージデータを解析分類し特定の文字として認識する文
字認識方法において、入力された文字の入力開始位置か
ら終了位置までの間をサンプリングし座標データ列を生
成する座標化処理ステップと、その座標化された各座標
点間を結ぶ２次元ベクトルを生成するベクトル化処理ス
テップと、前記ベクトル化処理された各ベクトルの成分
の総和を２次元の各要素毎にとる総和ベクトル算出処理
ステップと、前記総和ベクトル算出処理により得られた
各総和値の値を利用して文字の候補を抽出する文字分類
処理ステップとを有することを特徴とする文字認識方
法。
【請求項２】前記ベクトル化処理ステップにおいて、
前記座標データより特徴点を抽出し、前記特徴点間を結
ぶ２次元ベクトルを生成することを特徴とする請求項１
記載の文字認識方法。
【請求項３】入力文字を手書き文字とし、２次元ベク
トルの各要素を縦方向成分及び横方向成分としたことを
特徴とする請求項１または２記載の文字認識方法。
【請求項４】入力文字の座標データから抽出する特徴
点が、文字分類処理ステップに続く、入力文字を特定文
字として認識する文字認識処理ステップに使用される特
徴点であることを特徴とするオンラインで使用される請
求項２記載の文字認識方法。
【請求項５】入力文字の座標データから抽出する特徴
点が、入力文字の座標データを折れ線近似したときの折
れ線の端点であることを特徴とする請求項２記載の文字
認識方法。
【請求項６】ベクトルの成分の総和をとる際に、ベク
トルの成分の絶対値をとることを特徴とする請求項１ま
たは２記載の文字認識方法。
【請求項７】ベクトルの生成を、オンストロークのみ
ならずオフストロークにおいても行うことを特徴とする
請求項１または２記載の文字認識方法。
【請求項８】前記座標化処理ステップにおいて、前記
各ベクトルの２次元の各要素の方向に、それぞれ独立し
た倍率での正規化処理を行うこと特徴とする請求項１ま
たは２記載の文字認識方法。
【請求項９】前記座標化処理ステップにおいて、前記
各ベクトルの２次元の各要素の方向に、線密度を均一に
する非線形正規化を行うこと特徴とする請求項１または
２記載の文字認識方法。
【請求項１０】前記文字分類処理ステップにおいて、
総和されたベクトルの２成分の比の値に応じて文字の候
補を抽出することを特徴とする請求項１または２記載の
文字認識方法。
【請求項１１】文字入力手段により入力された文字の
イメージデータを解析分類し特定の文字として認識する
文字認識装置において、入力された文字の入力開始位置
から終了位置までの間をサンプリングし座標データ列を
生成する座標化処理手段と、その座標化された各座標点
間を結ぶ２次元ベクトルを生成するベクトル化処理手段
と、前記ベクトル化処理された各ベクトルの成分の総和
を２次元の各要素毎にとる総和ベクトル算出処理手段
と、前記総和ベクトル算出処理により得られた各総和値
の値を利用して文字の候補を抽出する文字分類処理手段
とを具備することを特徴とする文字認識装置。
【請求項１２】前記ベクトル化処理手段が、前記座標
データより特徴点を抽出する特徴点抽出処理回路と、前
記特徴点間を結ぶ２次元ベクトルを生成するベクトル生
成処理回路からなることを特徴とする請求項１記載の文
字認識装置。
【請求項１３】入力文字を手書き文字とし、前記ベク
トル化処理手段が、２次元ベクトルの各要素を縦方向成
分及び横方向成分として算出する直交座標成分算出回路
を有することを特徴とする請求項１または２記載の文字
認識装置。
【請求項１４】前記文字分類処理手段と接続され、か
つ、入力文字を特定文字として認識する文字認識処理手
段に、前記特徴点抽出処理回路を接続したことを特徴と
するオンラインで使用される請求項１２記載の文字認識
装置。
【請求項１５】前記特徴点抽出処理回路が、入力座標
データ列に対し折れ線近似を行う折れ線近似回路を含
み、前記折れ線の端点を出力することを特徴とする請求
項１２記載の文字認識装置。
【請求項１６】前記総和ベクトル算出処理手段が、ベ
クトルの総和をとる際にベクトルの成分の絶対値をとる
絶対値算出回路を含んで構成されることを特徴とする請
求項１１または１２記載の文字認識装置。
【請求項１７】前記ベクトル化処理手段が、ベクトル
の生成をオンストロークのみならずオフストロークにお
いても行うことを特徴とする請求項１１または１２記載
の文字認識装置。
【請求項１８】前記座標化処理手段に、２次元の各要
素の方向における最大座標に基づき算出したそれぞれの
倍率を各座標点にかけて正規化を行う正規化処理回路を
設けたことを特徴とする請求項１１または１２記載の文
字認識装置。
【請求項１９】前記座標化処理手段が、各ベクトルの
２次元の各要素の方向に線密度が均一になる非線形正規
化を行う正規化回路を具備することを特徴とする請求項
１１または１２記載の文字認識装置。
【請求項２０】前記文字分類処理手段は、総和された
ベクトルの２成分の比を文字毎に記憶させた総和ベクト
ル成分比辞書と、入力された文字の総和されたベクトル
の２成分の比を求める総和ベクトル成分比算出処理回路
とを具備し、両者の値を比較し文字の候補を抽出するこ
とを特徴とした請求項１１または１２記載の文字認識装
置。