JPH0916720A - 文字認識方法及び装置 - Google Patents

文字認識方法及び装置

Info

Publication number
JPH0916720A
JPH0916720A JP7167723A JP16772395A JPH0916720A JP H0916720 A JPH0916720 A JP H0916720A JP 7167723 A JP7167723 A JP 7167723A JP 16772395 A JP16772395 A JP 16772395A JP H0916720 A JPH0916720 A JP H0916720A
Authority
JP
Japan
Prior art keywords
character
vector
character recognition
input
coordinate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7167723A
Other languages
English (en)
Inventor
Yukimitsu Fujimori
幸光 藤森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP7167723A priority Critical patent/JPH0916720A/ja
Publication of JPH0916720A publication Critical patent/JPH0916720A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 画数等では有効な大分類が行えない走り書き
等による続け字も大分類可能とし、さらに、従来の画数
やセグメント長による大分類では分類できなかった文字
も大分類可能とする。 【構成】 入力された文字の入力開始位置から終了位置
までの間をサンプリングし座標データ列を生成する座標
化処理ステップ2,3と、その座標化された各座標点間
を結ぶ2次元ベクトルを生成するベクトル化処理ステッ
プ4,5と、ベクトル化処理された各ベクトルの成分の
総和を2次元の各要素毎にとる総和ベクトル算出処理ス
テップ6と、総和ベクトル算出処理により得られた各総
和値の値を利用して文字の候補を抽出する文字分類処理
ステップ7,8とを有している。そして、この文字分類
処理ステップ7,8では、ベクトルの成分の絶対値の総
和の比を、総和ベクトル成分比辞書に格納された値と比
較し、文字の大分類処理を行っている。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、いわゆる文字大分類と
言われる文字分類を利用した文字認識方法及び装置に関
し、さらに詳しくは、楷書だけでなく、続け字をも認識
できる文字認識方法及び装置に関する。
【0002】
【従来の技術】パソコンやオンライン装置等では、省力
化等のため、キーによる文字入力に代わり、タブレット
やスキャナー等の文字入力手段が使用されることが多く
なっている。ところが、タブレットやスキャナー等の文
字入力手段による入力は、手書き文字や印刷文字を一旦
イメージデータとして読み込むものであり、特定の文字
として認識させるためには、そのイメージデータを解析
し分類する作業、例えば文字大分類と言われている作業
等が必要となる。
【0003】ここで文字認識装置等における文字大分類
とは、文字認識を行う前に、入力文字パターンの所定の
特徴をもとに辞書から候補文字を選出し、入力文字パタ
ーンと候補文字のみの辞書パターンとを照合させること
で照合回数を削減し、文字認識を高速に行う処理のこと
である。
【0004】そして、従来、続け字に対応する文字大分
類としては、特公平4−5231に記載されるように、
辞書中の各文字毎に変動が予想される画数範囲をあらか
じめ辞書中に記しておき、辞書中に記された画数範囲が
入力画数を含む文字のみを候補文字とする方法や、特開
平2−75089に記載されるように、入力文字の座標
データを特徴点でセグメントに分割し、そのセグメント
長の平均値を予め同様にして算出された標準パターンの
セグメント長の平均値と比較することにより、候補文字
を選出する方法などがある。これらにより、文字認識装
置、特にオンライン文字認識装置は認識速度を向上させ
ている。
【0005】
【発明が解決しようとする課題】しかしながら、前述の
特公平4−5231のような画数を用いる方法や装置で
は、例えば走り書きなどにより設定した画数範囲外の書
き方をした文字は、大分類の段階で候補文字から除外さ
れて認識できなくなってしまう。これを補うために画数
範囲を広く設定すれば、候補文字が増え、文字大分類の
効率が低下してしまうという問題がある。また、前述の
特開平2−75089のようなセグメント長を用いる方
法では、セグメント長が近い値を持つ文字、例えば
「川」と「三」、「山」と「ヨ」、などを分類、すなわ
ち区別しにくいという問題がある。
【0006】本発明は、以上述べた問題点を改善し、画
数等では有効な大分類が行えない走り書き等による続け
字も大分類可能とし、さらに、従来の画数やセグメント
長による大分類では分類できなかった文字も大分類可能
とした文字認識方法及び装置を提供する事を目的として
いる。
【0007】
【課題を解決するための手段】上記課題をを解決するた
めに、本発明の文字認識方法は、入力された文字の入力
開始位置から終了位置までの間をサンプリングし座標デ
ータ列を生成する座標化処理ステップと、その座標化さ
れた各座標点間を結ぶ2次元ベクトルを生成するベクト
ル化処理ステップと、ベクトル化処理された各ベクトル
の成分の総和を2次元の各要素毎にとる総和ベクトル算
出処理ステップと、総和ベクトル算出処理により得られ
た各総和値の値を利用して文字の候補を抽出する文字分
類処理ステップとを有している。
【0008】そして、ベクトル化処理ステップにおい
て、座標点間、または、座標データ列から抽出した特徴
点間を結ぶ2次元ベクトルを生成している。
【0009】また、本発明の文字認識装置は、入力され
た文字の入力開始位置から終了位置までの間をサンプリ
ングし座標データ列を生成する座標化処理手段と、その
座標化された各座標点間を結ぶ2次元ベクトルを生成す
るベクトル化処理手段と、ベクトル化処理された各ベク
トルの成分の総和を2次元の各要素毎にとる総和ベクト
ル算出処理手段と、総和ベクトル算出処理により得られ
た各総和値の値を利用して文字の候補を抽出する文字分
類処理手段とを具備している。
【0010】そして、ベクトル化処理手段において、座
標点間、または、座標データ列から抽出した特徴点間を
結ぶ2次元ベクトルを生成している。
【0011】
【作用】本発明の文字認識方法及び装置では、まず文字
入力手段により文字のイメージデータを入力する。その
後、そのイメージデータを解析分類し特定の文字として
認識する。そして、文字大分類にあたり、総和ベクトル
算出処理により得られた各総和値の値を利用する。
【0012】この文字大分類の際に使用する総和ベクト
ルは、入力文字の座標データ列の座標点間または特徴点
間を結ぶベクトルの総和であり、画数に依存しないため
画数範囲を限定する必要がなく、走り書き等による続け
字の認識においても正しく有効な大分類が行える。さら
に画数やセグメント長等では分類できなかった文字も分
類可能となるため、走り書きされた文字を含む続け字に
対しても正しく大分類ができると共に入力文字の認識率
を向上させる事が可能となる。
【0013】
【実施例】本発明の実施例を図面に基づいて説明する。
【0014】図1は、本発明に係る手順を示すフローチ
ャートである。このフローチャートと図4から図6に示
す、手書き文字「い」が入力された場合の例に基づき文
字認識方法のステップの概要を説明する。
【0015】図1において、第1ステップの文字イメー
ジデータ入力ステップ1では、従来からよく知られてい
るタブレット等のパネルにペンで、入力文字のイメージ
データが入力される。第2ステップの座標データ列成生
処理ステップ2は、後述する文字入力回路により、入力
された手書き文字を座標データ列に変換する処理であ
る。この処理により、ノイズ等の不要信号が除去され、
図4(a)に示すように、始終点情報によるオンストロ
ーク(=1連続部分の開始から終了)及びオフストロー
ク(=1連続部分の終了から次の1連続部分の開始)の
情報を含み、原点を入力文字の外接矩形の左下とした座
標データ列が生成される。次に、第3ステップの正規化
処理ステップ3において、この座標データ列をベクトル
の要素、すなわち縦方向成分と横方向成分に対しそれぞ
れ独立した倍率で正規化を行う。次に、第4ステップの
特徴点抽出処理ステップ4において、オンストローク毎
に折れ線近似を行い、この端点を特徴点として抽出す
る。その後、第5ステップのベクトル生成処理ステップ
5において正規化後の各座標点間を結ぶベクトルを生成
する。その後、第6ステップの総和ベクトル算出処理ス
テップ6において、ベクトルの成分の絶対値の総和をと
ることにより総和ベクトルを求める。さらに、第7ステ
ップの総和ベクトル成分比算出処理ステップ7により、
2つの総和ベクトルの成分の比(以下、総和ベクトル成
分比という)を算出し、入力文字の総和ベクトル成分比
とする。
【0016】次に、第8ステップとして、大分類処理ス
テップ8が行われる。この大分類処理ステップ8では、
後述する、あらかじめ算出された各文字の標準パターン
の総和ベクトル成分比が大きい順に格納されている総和
ベクトル成分比辞書と、総和ベクトル成分比算出処理ス
テップで得られた総和ベクトル成分比とを比較し、認識
候補となる文字の選出を行う。その後、第9ステップの
文字認識処理ステップ9において、文字辞書(詳細は後
述)に格納された文字認識用データの内、大分類処理ス
テップ8により選出された候補文字の文字認識用データ
と、特徴点抽出処理ステップ4により得られたデータと
を比較して文字認識を行う。そして、その得られた結果
を第10ステップの表示出力ステップ10にて例えばC
RT等に表示する。
【0017】以下に各処理ステップの詳細内容を、図1
から図6に基づき説明する。
【0018】a)文字イメージデータ入力ステップ1 タブレット11等のパネルとペン12からなる文字入力
手段13で、入力文字のイメージデータが入力される。
この場合、スキャナー等の他の入力手段を採用してもよ
い。
【0019】b)座標データ列生成処理ステップ2 座標データ列生成処理は、文字入力回路14からのサン
プリングされた信号を得て、1文字入力開始から終了ま
でに記入されたオンストローク(ペンオンからペンオフ
までの筆記部分でもある)毎に、ストローク始終点情報
と座標データ列を生成する。その例を図4(a)に示
す。なお、文字入力回路4が座標データ列生成処理部1
5に相当する。
【0020】c)正規化処理ステップ3 正規化処理ステップ3は、正規化処理回路16にて実施
される。そして、座標データ列生成処理ステップ2と正
規化処理ステップ3とで、座標化処理ステップを構成し
ている。同様に、座標データ列生成処理部15と正規化
処理回路16とで座標化処理手段17が構成される。
【0021】正規化処理ステップ3の内容を図4を用い
て詳細に説明する。図4(a)において符号41は座標
データ列生成処理ステップ2により得られたn個の座標
データ列、 (Px(i),Py(i)){1≦i≦n} による座標点 P(i){1≦i≦n} を図示したものである。これよりベクトルの要素の各方
向における最大点を算出する。本実施例においては、ベ
クトルの要素に縦方向(Y)成分及び横方向(X)成分
を用いているので、図4(a)においてXmax及びYmax
が最大点となる。これを基に、正規化すべき最大座標で
あるXnorm、Ynorm(本実施例ではXnorm=Ynorm=1
60に設定)との比、 Xratio=Xnorm/Xmax Yratio=Ynorm/Ymax を求める。正規化後の座標データ列(Nx(i)、Ny(i))
{1≦i≦n}は、 Nx(i) = Pix × Xratio Ny(i) = Piy × Yratio により求める。図4(b)は、図4(a)に示す座標デ
ータ列に対してこの正規化を行った結果を示した図であ
る。この例では、Xratio=1.96、Yratio=2.3
7であった。
【0022】d)特徴点抽出処理ステップ4 特徴点抽出処理ステップ4は、特徴点抽出処理回路18
にて行われる。そして、この特徴点抽出処理ステップ4
の内容を図5を用いて詳細に説明する。座標点P1〜P
8は、P1を始点、P8を終点とする1オンストローク
の正規化された座標データ列である。オンストロークの
始点と終点を結ぶ直線mを作成し、正規化された座標デ
ータ列中から直線mとの距離の最大値をhとする。図5
(a)ではP4が最遠点となる。このとき、h/mが所
定の値eよりも大きい時は、直線mを、最遠点P4を端
点としたm1及びm2に分割する。この様子を図5
(b)に示す。この処理を直線の分割が起こらなくなる
まで再帰的に行い、得られた端点を特徴点として次のベ
クトル生成処理ステップ5にかける。図4(b)に示す
正規化された座標データ列に対し特徴点抽出処理を行っ
た例を図6に示す。この例では、T1〜T7の7点の特
徴点が抽出された。
【0023】e)ベクトル生成処理ステップ5 ベクトル生成処理ステップ5は、特徴点抽出処理ステッ
プ4で得られた各特徴点を入力された順に結ぶベクトル
を生成する。なお、このベクトル生成処理ステップ5
は、ベクトル生成処理回路19で実施される。本実施例
ではベクトルの要素に縦(Y)方向成分及び横(X)方
向成分を用いているので、特徴点TiのX成分をTx
(i)、Y成分をTy(i)とすると、特徴点データ列 Ti(Tx(i)、Ty(i)){1≦i≦n} からベクトル列Vi(Vx(i)、Vy(i)){1≦i<n}
を、 Vx(i)=Tx(i+1)−Tx(i) Vy(i)=Ty(i+1)−Ty(i) により求める。図4に示す特徴点データ列は、 T1=( 0,160) T2=( 34, 0) T3=( 46, 27) T4=( 65, 50) T5=(137,160) T6=(149,126) T7=(160, 38) であるので、ベクトル列は、 V1=( 34,−160) V2=( 12, 27) V3=( 19, 23) V4=( 72, 110) V5=( 12,− 34) V6=( 11,− 88) となる。
【0024】なお、特徴点抽出処理ステップ4とベクト
ル生成処理ステップ5とで、ベクトル化処理ステップが
構成され、特徴点抽出処理回路18とベクトル生成処理
回路19とで、ベクトル化処理手段20が構成される。
【0025】f)総和ベクトル算出処理ステップ6 総和ベクトル算出処理ステップ6は、ベクトル生成処理
ステップ5により得られたデータから総和ベクトルを算
出する処理である。総和ベクトルは全ベクトルの成分の
絶対値の和で、これを(SVx,SVy)とすると、 である。図6に示す特徴点データ列では、SVx=16
0、SVy=442となり、縦方向に筆記ペンの動きが
大きい事が分かる。なお、この総和ベクトル算出処理ス
テップ6は、総和ベクトル算出処理回路で構成される総
和ベクトル算出処理手段21で行われる。
【0026】g)総和ベクトル成分比算出処理ステップ
7 総和ベクトル成分比は、 SVy /(SVx+SVy) で求める。図6に示す特徴点データ列では、 442/(442+160)=0.73 となる。縦方向の筆記ペンの動きが全体の73%を占め
ていることが分かる。なお、この総和ベクトル成分比算
出処理ステップ7は、総和ベクトル成分比算出処理回路
22で実施される。
【0027】h)大分類処理ステップ8 大分類処理ステップ8での大分類方法は、入力文字の総
和ベクトル成分比を含むある範囲幅を設け、標準パター
ンの総和ベクトル成分比がこの範囲幅に含まれる文字の
みを認識候補とする方法である。具体的には、予め、総
和ベクトル成分比の上限の値UP、下限の値DPを予め
定めておき、総和ベクトル成分比算出処理ステップ7に
よって得られた総和ベクトル成分比VRに対し、 VRmax = VR + UP VRmin = VR + DP なる範囲幅、VRmax、VRminを求め、総和ベク
トル成分比辞書23の総和ベクトル成分比VRdic
が、 VRmin<VRdic<VRmax である文字のみを候補文字として抽出するものである。
【0028】ここで、総和ベクトル成分比辞書23と
は、大分類辞書であり、文字コードと各文字の標準パタ
ーンの総和ベクトル成分比を表1のように格納したもの
である。
【0029】
【表1】
【0030】なお、大分類処理ステップ8は、大分類処
理回路24で行われる。そして、総和ベクトル成分比算
出処理ステップ7と大分類処理ステップ8とで文字分類
処理ステップが構成される。また、総和ベクトル成分比
算出処理回路22、総和ベクトル成分比辞書23および
大分類処理回路24から文字分類処理手段25が構成さ
れる。
【0031】i)文字認識処理ステップ9 文字認識処理ステップ9では、特徴点抽出処理ステップ
4で得られた折れ線端点である特徴点データ列とストロ
ーク始終点情報とから、サブストロークを抽出する。サ
ブストロークとは、似た方向に延びるいくつかの折れ線
を1本にまとめた直線である。サブストローク抽出の例
を図7に示す。サブストローク抽出後、文字辞書26に
格納されたサブストロークパターンのうち、大分類処理
ステップ8で得られた候補文字に該当するサブストロー
クパターンとのみマッチングを行い、最も類似度が高い
ものを認識結果として抽出する。
【0032】ここで文字辞書26には、文字認識処理ス
テップ9で行うサブストロークマッチングのための、標
準パターンのサブストロークパターンが格納されてい
る。
【0033】なお、文字認識処理ステップ9は、文字認
識処理回路27で行われる。また、特徴点抽出処理回路
18と、文字辞書26と、文字認識処理回路27とで文
字認識処理手段28が構成される。
【0034】j)表示出力ステップ10 文字認識処理ステップ9で得られた結果を、出力バッフ
ァ29を介して、CRT30、プリンタ31、外部記憶
手段32等に表示する。ここで、表示出力ステップ10
は、出力部33に相当し、この出力部33は、出力バッ
ファ29、CRT30、プリンタ31、外部記憶手段3
2等で構成される。
【0035】以上説明した各ステップの内、第3ステッ
プの正規化処理ステップ3から第9ステップの文字認識
処理ステップ9までは、図3に示すようにマイクロプロ
セッサ34で行わせることができる。なお、第2ステッ
プの座標データ列生成処理ステップ2もマイクロプロセ
ッサ34で行わせるようにしても良い。
【0036】以上の方法によれば、オフストローク情報
を含んだ座標データ列を大分類処理の際の特徴に用いる
ので、楷書と続け字との差異が殆どなくなり、続け字で
も有効な大分類が行える。すなわち、図6の実施例で示
すように、T4からT5のオフストロークの情報も含ん
でいるため、仮にT4とT5がつながった続け字でも楷
書と同じような値を持つことになり、認識が可能となる
のである。
【0037】また、総和ベクトルを大分類処理に用いて
いるので、画数やセグメント長などでは大分類不可能で
あった文字も大分類可能となる。例えば、「三」と
「川」は、どちらも画数は3で、平均セグメント長はど
ちらもほぼ外接矩形の1辺の長さであり、これらは画数
や平均セグメント長では分類不可能であるが、総和ベク
トルでは、「三」(720、160)、「川」(17
0、720)となるため、容易に分類が可能である。
【0038】さらに、本実施例では、総和ベクトルの要
素の各方向に独立した倍率で正規化を行うので、この方
向への変動が吸収され、安定した大分類処理の際の特徴
の抽出が行える。また、文字認識処理に用いる特徴点を
用いて大分類を行うので、大分類処理のために、文字認
識処理とは別の特徴点を抽出する必要がなく、処理量が
少なくなっている。
【0039】また、総和ベクトル成分比という1つのパ
ラメータで大分類を行っているので、そのまま総和ベク
トルを用いるのに比べ、大分類辞書容量、大分類処理時
間ともに半分になっている。
【0040】本実施例では、ベクトル生成処理ステップ
5を軽減するために、特徴点抽出処理を行い、特徴点か
らベクトルの生成を行ったが、正規化処理ステップ3で
得られる正規化後の座標データ列からベクトル生成処理
を行ってもよい。
【0041】また、本実施例では、文字変形を吸収する
ために、正規化処理ステップ3において、総和ベクトル
の要素の方向に独立した倍率で正規化を行う方法を用い
たが、文献「線密度イコライゼーション−相関法のため
の非線形正規化−」(電子情報通信学会論文誌 Vol.J67
-D No.11 pp.1379-1383)などの線密度を一定にする非
線形正規化を行えば、文字変形をより吸収することがで
き、より安定した総和ベクトルの算出が行え、より有効
な大分類を行うことができる。
【0042】また、総和ベクトル成分比の算出式は、 SVx/(SVx+SVy)(式1) SVy/SVx (式2) SVx/SVy (式3) などを用いることができる。本実施例の総和ベクトル成
分比と上記3つの式は本質的に差異がない。式1と式3
は、X方向の総和ベクトルSVxに注目し、本実施例と
式2は、Y方向の総和ベクトルSVyに注目した式であ
る。また、式2と式3は値域が0以上無限大であるが、
本実施例と式2は0以上1以下である。
【0043】また、大分類処理の方法は、本実施例の方
法の他に、次の方法がある。
【0044】入力文字の総和ベクトル成分比に近い総
和ベクトル成分比を持つ標準パターンをいくつか選び出
して候補文字とする方法がある。具体的には、入力文字
の総和ベクトル成分比に最も近い総和ベクトル成分比を
持つ文字を総和ベクトル成分比辞書23より捜し出し、
前記文字から総和ベクトル成分比の大きい方及び小さい
方へ各々定めた文字数分取り出して候補文字とし、文字
認識処理回路27の処理にかける方法である。
【0045】総和ベクトル成分比辞書23を、表2に
示すように上限、下限の項目に変更し、総和ベクトル成
分比算出処理ステップ7により得られた総和ベクトル成
分比が前記上限と前記下限の間にある文字のみを候補文
字として文字認識処理ステップ9に送る方法である。
【0046】
【表2】
【0047】なお、手書き文字ではなく印刷文字のよう
なしっかりした文字の場合等では、大分類処理での絞り
込み精度が高くなるので、文字認識処理を行わないよう
にしたり、文字認識処理の代わりに、作業する人間が候
補文字から対象文字を確定させるようにしても良い。
【0048】
【発明の効果】請求項1及び11によれば、大分類処理
に総和ベクトルを用いるので、画数情報を利用した大分
類処理では不可能な走り書きのような文字においても正
しく認識でき、大分類が可能となる。また、セグメント
長等を用いた大分類では不可能な文字、例えば「川」と
「三」のような文字を区別でき大分類が可能となる。こ
のため、認識率が極めて高く、かつ効率の良い文字認識
方法及び装置を得ることができる。
【0049】加えて、請求項2及び12によれば、ベク
トルを特徴点間を結ぶものとしているため、入力座標点
間を結ぶベクトルに比べ、ベクトル数を著しく減少させ
ることができ、総和ベクトルを求める際の計算量を大幅
に軽減することができる。このため、一層効率の良い文
字認識方法及び装置を得ることができる。
【0050】さらに、請求項3及び13によれば、請求
項2または12記載の文字認識方法または装置におい
て、入力文字を手書き文字とし、2次元ベクトルの要素
を、縦方向成分及び横方向成分としたので、ペンとタブ
レットの組み合わせ等の簡易な入力装置を使用でき、し
かもタブレット等の座標入力装置の座標軸をそのまま用
いる事ができるので、座標系変換処理を省く事ができ
る。この結果、パソコン等での文字入力が用紙に文字を
書く感覚で行え、しかもその処理も極めてスピードアッ
プできる。
【0051】また、請求項4及び14によれば、請求項
2または12記載の文字認識方法または装置において、
特徴点抽出処理の結果を文字分類処理のみならず、文字
認識処理においても利用できるため、処理が単純でかつ
処理時間を短縮することができる。このため、オンライ
ン処理に極めて好適な文字認識方法及び装置となる。
【0052】加えて、請求項5及び15によれば、請求
項2または12記載の文字認識方法または装置におい
て、特徴点を折れ線近似したときの折れ線の端点とした
ので、簡単にしかも高速に特徴点を求めることができ
る。このため、一層文字認識スピードの速い文字認識方
法及び装置を得ることができる。
【0053】さらに、請求項6及び16によれば、請求
項1もしくは2または11もしくは12記載の文字認識
方法または装置において、総和ベクトルを求める際に各
ベクトルの成分の絶対値をとるようにしたので、ある方
向に往復があるような文字入力に対しても、ペンの移動
量が、総和をとることにより相殺されることなく保存さ
れるので、文字特徴を際立たせることができる。このた
め、文字認識率が一層向上する。
【0054】また、請求項7及び17によれば、請求項
1もしくは2または11もしくは12記載の文字認識方
法または装置において、オンストロークのみならず、オ
フストロークにおいてもベクトルの生成を行うので、楷
書体だけでなく続け字においても正しい大分類を行うこ
とができる。この結果、人があわてて書いたような文字
でも認識できるという認識範囲の広い文字認識方法及び
装置を得ることができる。
【0055】加えて、請求項8及び18によれば、請求
項1もしくは2または11もしくは12記載の文字認識
方法または装置において、ベクトルの2次元の各要素の
方向へ独立した倍率で正規化を行うので、ベクトルの2
次元の各要素の方向への変形がある入力文字に対して
も、正しい大分類を行うことができ、くずれ字も正しく
認識できるものとなる。
【0056】さらに、請求項9及び19によれば、請求
項1もしくは2または11もしくは12記載の文字認識
方法または装置において、線密度を均一にする非線形正
規化を行うので、変形した入力文字に対しても安定した
長さのベクトルを得る事ができ、正しい大分類を行うこ
とができる。この結果、変形文字も正しく認識できるも
のとなる。
【0057】そして、請求項10及び20によれば、請
求項1もしくは2または11もしくは12記載の文字認
識方法または装置において、比を算出するという単純な
計算で総和ベクトル成分比を算出することにより、1つ
のパラメータで大分類を行えるので、総和ベクトルを用
いるのに比べ、大分類辞書容量、大分類処理時間ともに
半分で大分類を行うことができる。この結果、文字認識
速度が速い文字認識方法となり、また同じ字数でも記憶
容量部分を少なくでき処理速度が速い文字認識装置とな
る。
【図面の簡単な説明】
【図1】 本発明に係る手順を示すフローチャートであ
る。
【図2】 本発明に係る文字認識装置を示す機能ブロッ
ク図である。
【図3】 本発明の文字認識装置の構成図である。
【図4】 本発明により生成した座標データ列の例を示
す図で、(a)は正規化前の座標データ列を示す図で、
(b)は正規化後の座標データ列を示す図である。
【図5】 本発明による折れ線近似による特徴点抽出を
説明する図で、(a)は特徴点の抽出開始時点の説明図
で、(b)は1つの特徴点が抽出された状況を示してい
る図である。
【図6】 本発明による折れ線近似処理によって特徴点
が抽出された一例を示す図である。
【図7】 本発明の一実施例に使用する文字認識処理に
よって抽出されたサブストロークの一例を示す図であ
る。
【符号の説明】
1 文字イメージデータ入力ステップ 2 座標データ列生成処理ステップ(座標化処理ステッ
プ) 3 正規化処理ステップ(座標化処理ステップ) 4 特徴点抽出処理ステップ(ベクトル化処理ステッ
プ) 5 ベクトル生成処理ステップ(ベクトル化処理ステッ
プ) 6 総和ベクトル算出処理ステップ 7 総和ベクトル成分比算出処理ステップ(文字分類処
理ステップ) 8 大分類処理ステップ(文字分類処理ステップ) 9 文字認識処理ステップ 10 表示出力ステップ 11 タブレット(パネル) 12 ペン 13 入力手段 14 文字入力回路 15 座標データ列生成処理部 16 正規化処理回路 17 座標化処理手段 18 特徴点抽出処理回路 19 ベクトル生成処理回路 20 ベクトル化処理手段 21 総和ベクトル算出処理回路(総和ベクトル算出処
理手段) 22 総和ベクトル成分比算出処理回路 23 総和ベクトル成分比辞書 24 大分類処理回路 25 文字分類処理手段 26 文字辞書 27 文字認識処理回路 28 文字認識処理手段 33 出力部 34 マイクロコンピュータ(CPU) 41 手書き文字座標データ列 P0・・・Pn 座標 T1・・・T7 特徴点

Claims (20)

    【特許請求の範囲】
  1. 【請求項1】 文字入力手段により入力された文字のイ
    メージデータを解析分類し特定の文字として認識する文
    字認識方法において、入力された文字の入力開始位置か
    ら終了位置までの間をサンプリングし座標データ列を生
    成する座標化処理ステップと、その座標化された各座標
    点間を結ぶ2次元ベクトルを生成するベクトル化処理ス
    テップと、前記ベクトル化処理された各ベクトルの成分
    の総和を2次元の各要素毎にとる総和ベクトル算出処理
    ステップと、前記総和ベクトル算出処理により得られた
    各総和値の値を利用して文字の候補を抽出する文字分類
    処理ステップとを有することを特徴とする文字認識方
    法。
  2. 【請求項2】 前記ベクトル化処理ステップにおいて、
    前記座標データより特徴点を抽出し、前記特徴点間を結
    ぶ2次元ベクトルを生成することを特徴とする請求項1
    記載の文字認識方法。
  3. 【請求項3】 入力文字を手書き文字とし、2次元ベク
    トルの各要素を縦方向成分及び横方向成分としたことを
    特徴とする請求項1または2記載の文字認識方法。
  4. 【請求項4】 入力文字の座標データから抽出する特徴
    点が、文字分類処理ステップに続く、入力文字を特定文
    字として認識する文字認識処理ステップに使用される特
    徴点であることを特徴とするオンラインで使用される請
    求項2記載の文字認識方法。
  5. 【請求項5】 入力文字の座標データから抽出する特徴
    点が、入力文字の座標データを折れ線近似したときの折
    れ線の端点であることを特徴とする請求項2記載の文字
    認識方法。
  6. 【請求項6】 ベクトルの成分の総和をとる際に、ベク
    トルの成分の絶対値をとることを特徴とする請求項1ま
    たは2記載の文字認識方法。
  7. 【請求項7】 ベクトルの生成を、オンストロークのみ
    ならずオフストロークにおいても行うことを特徴とする
    請求項1または2記載の文字認識方法。
  8. 【請求項8】 前記座標化処理ステップにおいて、前記
    各ベクトルの2次元の各要素の方向に、それぞれ独立し
    た倍率での正規化処理を行うこと特徴とする請求項1ま
    たは2記載の文字認識方法。
  9. 【請求項9】 前記座標化処理ステップにおいて、前記
    各ベクトルの2次元の各要素の方向に、線密度を均一に
    する非線形正規化を行うこと特徴とする請求項1または
    2記載の文字認識方法。
  10. 【請求項10】 前記文字分類処理ステップにおいて、
    総和されたベクトルの2成分の比の値に応じて文字の候
    補を抽出することを特徴とする請求項1または2記載の
    文字認識方法。
  11. 【請求項11】 文字入力手段により入力された文字の
    イメージデータを解析分類し特定の文字として認識する
    文字認識装置において、入力された文字の入力開始位置
    から終了位置までの間をサンプリングし座標データ列を
    生成する座標化処理手段と、その座標化された各座標点
    間を結ぶ2次元ベクトルを生成するベクトル化処理手段
    と、前記ベクトル化処理された各ベクトルの成分の総和
    を2次元の各要素毎にとる総和ベクトル算出処理手段
    と、前記総和ベクトル算出処理により得られた各総和値
    の値を利用して文字の候補を抽出する文字分類処理手段
    とを具備することを特徴とする文字認識装置。
  12. 【請求項12】 前記ベクトル化処理手段が、前記座標
    データより特徴点を抽出する特徴点抽出処理回路と、前
    記特徴点間を結ぶ2次元ベクトルを生成するベクトル生
    成処理回路からなることを特徴とする請求項1記載の文
    字認識装置。
  13. 【請求項13】 入力文字を手書き文字とし、前記ベク
    トル化処理手段が、2次元ベクトルの各要素を縦方向成
    分及び横方向成分として算出する直交座標成分算出回路
    を有することを特徴とする請求項1または2記載の文字
    認識装置。
  14. 【請求項14】 前記文字分類処理手段と接続され、か
    つ、入力文字を特定文字として認識する文字認識処理手
    段に、前記特徴点抽出処理回路を接続したことを特徴と
    するオンラインで使用される請求項12記載の文字認識
    装置。
  15. 【請求項15】 前記特徴点抽出処理回路が、入力座標
    データ列に対し折れ線近似を行う折れ線近似回路を含
    み、前記折れ線の端点を出力することを特徴とする請求
    項12記載の文字認識装置。
  16. 【請求項16】 前記総和ベクトル算出処理手段が、ベ
    クトルの総和をとる際にベクトルの成分の絶対値をとる
    絶対値算出回路を含んで構成されることを特徴とする請
    求項11または12記載の文字認識装置。
  17. 【請求項17】 前記ベクトル化処理手段が、ベクトル
    の生成をオンストロークのみならずオフストロークにお
    いても行うことを特徴とする請求項11または12記載
    の文字認識装置。
  18. 【請求項18】 前記座標化処理手段に、2次元の各要
    素の方向における最大座標に基づき算出したそれぞれの
    倍率を各座標点にかけて正規化を行う正規化処理回路を
    設けたことを特徴とする請求項11または12記載の文
    字認識装置。
  19. 【請求項19】 前記座標化処理手段が、各ベクトルの
    2次元の各要素の方向に線密度が均一になる非線形正規
    化を行う正規化回路を具備することを特徴とする請求項
    11または12記載の文字認識装置。
  20. 【請求項20】 前記文字分類処理手段は、総和された
    ベクトルの2成分の比を文字毎に記憶させた総和ベクト
    ル成分比辞書と、入力された文字の総和されたベクトル
    の2成分の比を求める総和ベクトル成分比算出処理回路
    とを具備し、両者の値を比較し文字の候補を抽出するこ
    とを特徴とした請求項11または12記載の文字認識装
    置。
JP7167723A 1995-07-03 1995-07-03 文字認識方法及び装置 Pending JPH0916720A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7167723A JPH0916720A (ja) 1995-07-03 1995-07-03 文字認識方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7167723A JPH0916720A (ja) 1995-07-03 1995-07-03 文字認識方法及び装置

Publications (1)

Publication Number Publication Date
JPH0916720A true JPH0916720A (ja) 1997-01-17

Family

ID=15854986

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7167723A Pending JPH0916720A (ja) 1995-07-03 1995-07-03 文字認識方法及び装置

Country Status (1)

Country Link
JP (1) JPH0916720A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013205922A (ja) * 2012-03-27 2013-10-07 Fuji Xerox Co Ltd 文字認識用学習データ生成装置、文字認識装置、およびプログラム
KR101991461B1 (ko) * 2017-12-13 2019-06-20 단국대학교 산학협력단 특징점의 벡터화를 이용한 문자인식 시스템 및 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013205922A (ja) * 2012-03-27 2013-10-07 Fuji Xerox Co Ltd 文字認識用学習データ生成装置、文字認識装置、およびプログラム
KR101991461B1 (ko) * 2017-12-13 2019-06-20 단국대학교 산학협력단 특징점의 벡터화를 이용한 문자인식 시스템 및 방법

Similar Documents

Publication Publication Date Title
US20200065601A1 (en) Method and system for transforming handwritten text to digital ink
US4573196A (en) Confusion grouping of strokes in pattern recognition method and system
US5742705A (en) Method and apparatus for character recognition of handwritten input
JP4504702B2 (ja) 文書処理装置、文書処理方法、および文書処理プログラム
JP3176023B2 (ja) 手書き入力照合方法および装置
US7437001B2 (en) Method and device for recognition of a handwritten pattern
Sharma et al. Online handwritten Gurmukhi character recognition using elastic matching
JP3761937B2 (ja) パターン認識方法及び装置及びコンピュータ制御装置
IL100198A (en) Character recognition method
JPH0916720A (ja) 文字認識方法及び装置
CN115311674A (zh) 手写处理方法、装置、电子设备和可读存储介质
CN111382749B (zh) 一种基于二维结构特征的青铜器铭文图像自动识别方法
US6175651B1 (en) On line-character recognition method and device
Hamanaka et al. On-line Japanese character recognition based on flexible pattern matching method using normalization-cooperative feature extraction
JPH07117986B2 (ja) 文字認識装置
Rao et al. Orthographic properties based Telugu text recognition using hidden Markov models
JP3221488B2 (ja) 検証機能付きオンライン文字認識装置
Mahmoud et al. The use of radon transform in handwritten Arabic (Indian) numerals recognition
JP3015137B2 (ja) 手書文字認識装置
Sandyal et al. Segmentation approach for offline handwritten Kannada scripts
Inuganti et al. Recognition of online handwritten Telugu stroke by detected dominant points using curvature estimation
JPH06131503A (ja) 文字認識処理装置
JPH0253193A (ja) 文字認識方法および文字認識装置
JPH08287186A (ja) 特徴抽出装置及び方法
JPH0773275A (ja) 文字認識装置