JPH08194780A - 特徴抽出方法 - Google Patents

特徴抽出方法

Info

Publication number
JPH08194780A
JPH08194780A JP7202555A JP20255595A JPH08194780A JP H08194780 A JPH08194780 A JP H08194780A JP 7202555 A JP7202555 A JP 7202555A JP 20255595 A JP20255595 A JP 20255595A JP H08194780 A JPH08194780 A JP H08194780A
Authority
JP
Japan
Prior art keywords
mesh
area
feature
feature vector
character pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7202555A
Other languages
English (en)
Inventor
Yukihisa Uchiyama
幸央 内山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP7202555A priority Critical patent/JPH08194780A/ja
Priority to CN95117537A priority patent/CN1095145C/zh
Priority to US08/560,748 priority patent/US5911005A/en
Publication of JPH08194780A publication Critical patent/JPH08194780A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18086Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
    • G06V30/18095Summing image-intensity values; Projection and histogram analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 分割された各メッシュ領域で抽出される特徴
ベクトルに対して、メッシュの大きさによる値の変動を
抑えるために適切な重み付けを行う。 【解決手段】 領域分割部103は、入力パターンをメ
ッシュ領域に分割し、各領域の分割位置が分割位置格納
部107に記録される。領域別特徴ベクトル抽出部10
4は、各メッシュ領域から特徴ベクトルを抽出し、領域
別特徴ベクトル重み付け部105は、各メッシュ領域の
各辺の長さ、対角線の長さ、面積を基に特徴ベクトルを
重み付けする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字認識におい
て、特徴量の重み付けを適切に行う特徴抽出方法に関す
る。
【0002】
【従来の技術】入力文字パターンをメッシュ領域に分割
し、それぞれのメッシュ領域ごとに特徴ベクトルを抽出
し、それら特徴ベクトルを統合して文字パターン全体の
特徴量とする文字認識方法が知られている。例えば、特
徴量として各メッシュ領域内に含まれる黒画素の数をカ
ウントしたり、あるいは文字パターンの輪郭を構成する
画素パターンに方向コードを付与し、各メッシュ領域内
に含まれる各方向コードの数をカウントすることによっ
て作成した方向コードヒストグラムを用いて文字を認識
する。
【0003】このような特徴量を用いて認識する際に
は、黒画素や方向コードが同一の字種の間でいつも同じ
メッシュに配置されることが重要であるが、特に手書き
文字の場合、パターンの変形によって、配置されるメッ
シュ領域が異なる可能性がある。これを図5を用いて説
明する。図5(a)、(b)は、同じ「井」という文字
パターンに対して4×4の領域分割を行ったものであ
る。パターン(a)とパターン(b)では、黒画素を含
まないメッシュや縦2本、横2本の各ストロークの配置
されているメッシュが大きく異なっている。つまり、パ
ターン(a)とパターン(b)は、同一字種であるにも
係らず特徴量のばらつきが大きく、これが認識率を低下
させる原因となる。
【0004】この問題を解決する方法として、「山田博
三ほか:“非線形正規化の改良”,昭和63年電子情報
通信学会春季全国大会,D−439,p.1−182」
および特開平1−116892号公報に記載されている
非線形正規化を利用することができる。この非線形正規
化は、文字パターンの密な箇所を拡げ、また突出した線
分を縮めるようなパターン整形を行う。図5のパターン
(a)とパターン(b)に対して非線形正規化を行う
と、それぞれ図6(a)、(b)に示すように整形さ
れ、文字パターン「井」がほぼ同じメッシュ上に配置さ
れるようになる。この結果、特徴量のばらつきが低減さ
れる。
【0005】しかし、従来の非線形正規化法は、画像を
局所的に異なる倍率で変倍するため、文字線のつながり
が不自然になったり、輪郭が乱れてノイズを生じるな
ど、パターンの滑らかさを失ってしまうことが多い。こ
れを解決するためには、関数値の補間や何らかの画像処
理を施して滑らかさを補う必要があり、処理時間と計算
装置の増大を招くという問題がある。例えば、特開平3
−286390号公報に記載された文字の非線形正規化
法では、滑らかな非線形変換が提案されているが、その
ためにはスプライン関数のような補間関数を求めなけれ
ばならない。
【0006】一方、パターンの整形を行うことなく、メ
ッシュ領域の分割位置を文字パターンに応じて変動させ
ることにより、特徴量のばらつきを抑えることができ
る。図7(a)、(b)ではパターンの密な箇所ではメ
ッシュの幅を狭くし、粗な箇所ではメッシュの幅を広く
して分割を行った結果、2つのパターンがほぼ同じメッ
シュ上に配置されている。
【0007】このような変動を伴う領域分割方式の一例
として、特開昭63−14291号公報および特開昭6
3−16394号公報に記載された方法が提案されてい
る。この方法では、まず文字パターンの特徴を抽出し
(例えば方向コードの付与など)、その後、特徴量が均
等に分配されるように、文字パターンをサブ領域に分割
する。ここでサブ領域はメッシュ領域に比べてより細か
く、より多数に分割されている。図4(a)は、4×4
のサブ領域分割を行った例である。特徴量が均等に分配
されるように、サブ領域の段階で文字パターンの局所的
な粗密に応じた分割が得られる。
【0008】上記した発明では、その後、特定の規則に
従い、各メッシュ領域に1以上のサブ領域を割り当て、
かつ特定の隣接したメッシュ領域に1以上の共通のサブ
領域を割り当てることにより、サブ領域をそれよりも少
ないメッシュ領域に統合する。例えば、図4(a)のサ
ブ領域から(b)に示す3×3のメッシュ領域に統合す
ることができる。このようにして、文字パターンに応じ
て適切な位置で領域分割を行い、なおかつ隣接するメッ
シュ間にサブ領域に相当する幅の重なりを持たせること
によって、変形や位置ずれを持つパターンが適切なメッ
シュ上に配置されることになる。
【0009】
【発明が解決しようとする課題】しかし、上記した分割
位置を変動させる方法では、一般に各々のメッシュ領域
の大きさが異なるため、メッシュ領域ごとに抽出される
特徴ベクトルの値域にばらつきが生じる。特徴ベクトル
の例として、それぞれのメッシュ領域内に含まれる黒画
素数を考えると、そのとり得る値は、0から各メッシュ
の面積(つまりメッシュに含まれる全画素数)までであ
る。
【0010】従って、2つのパターンについて、所定の
メッシュを比べたとき、どちらも全て黒画素で占められ
ているケースであっても、メッシュの大きさが異なれば
特徴量の値も異なってしまう。反対に、2つのパターン
の所定のメッシュの大きさが異なるにも係らず、どちら
のメッシュも同じ数の黒画素を含んでいれば、それらは
同じ特徴量の値を持つと評価されることになる。
【0011】このように特徴量の値がメッシュの大きさ
に影響されると、同一字種の間においても特徴量の値に
大きなばらつきを生じることになり、この結果、認識率
の低下を招き、変動領域分割の効果が十分に発揮されな
いという問題がある。
【0012】本発明の目的は、互いに大きさの異なり得
る領域分割を行う特徴抽出方法において、それぞれのメ
ッシュ領域で抽出される特徴ベクトルに対して、メッシ
ュの大きさによる値の変動を抑えるために適切な重み付
けを行うようにした特徴抽出方法を提供することにあ
る。
【0013】
【課題を解決するための手段】前記目的を達成するため
に、請求項1記載の発明では、入力文字パターンを所定
の規則に従って多角形のメッシュ領域に分割し、該分割
された各メッシュ領域から抽出される特徴ベクトルを統
合して、該入力文字パターンの特徴量とする特徴抽出方
法において、該分割された各メッシュ領域を構成する辺
または対角線の長さに基づいて特徴ベクトルの重み付け
を行うことを特徴としている。
【0014】請求項2記載の発明では、入力文字パター
ンを所定の規則に従って多角形のメッシュ領域に分割
し、該分割された各メッシュ領域から抽出される特徴ベ
クトルを統合して、該入力文字パターンの特徴量とする
特徴抽出方法において、該分割された各メッシュ領域の
面積に基づいて特徴ベクトルの重み付けを行うことを特
徴としている。
【0015】請求項3記載の発明では、前記メッシュ領
域の分割は、入力文字パターンを複数の特定軸へ投影し
たときの黒画素数分布の積算が均等に分配されるように
分割することを特徴としている。
【0016】請求項4記載の発明では、前記メッシュ領
域の分割は、入力文字パターンを複数の特定軸へ投影し
たときの文字輪郭画素数分布の積算が均等に分配される
ように分割することを特徴としている。
【0017】請求項5記載の発明では、前記メッシュ領
域の分割は、入力文字パターンを複数の特定軸へ投影し
たときのストローク数分布の積算が均等に分配されるよ
うに分割することを特徴としている。
【0018】請求項6記載の発明では、前記メッシュ領
域の分割は、入力文字パターンを特徴量が均等に分配さ
れるようなメッシュ領域数より多いサブ領域に分割し、
隣接したメッシュ領域に共通のサブ領域を割り当てるこ
とにより、該サブ領域をメッシュ領域に統合する領域分
割方法であることを特徴としている。
【0019】
【実施例】以下、本発明の一実施例を図面を用いて具体
的に説明する。図1は、本発明の実施例の構成を示す。
文字パターン入力部101は、スキャナなどで構成さ
れ、画像を読み取って文字パターンをディジタル画像と
して入力する。前処理部102は、入力された文字パタ
ーンのノイズを除去し、正規化などの必要な前処理を行
う。次いで、特徴抽出部(103〜107)は、入力文
字パターンの特徴量を抽出する。
【0020】辞書作成のときには、パターン辞書作成部
108は、抽出された入力文字パターンの特徴量を用い
て、各字種を代表する特徴量をパターン辞書109に記
録する。文字認識を行うときは、マッチング部110
は、入力パターンの特徴量とパターン辞書109とのマ
ッチングを行い、候補文字群あるいは棄却コードなどを
認識結果出力部111に送る。
【0021】特徴抽出部について詳述すると、領域分割
部103は、まず所定の規則(例えば、前掲した公報に
記載の方法)に従って入力パターンをメッシュ領域に分
割する。このとき、各々の領域の分割位置が分割位置格
納部107に記録される。次いで、領域別特徴ベクトル
抽出部104は、分割された各メッシュ領域から特徴ベ
クトルを抽出する。
【0022】領域別特徴ベクトル重み付け部105は、
記録された分割位置を用いて求められる各メッシュ領域
の各辺の長さ、対角線の長さ、あるいは面積に基づいて
各メッシュの特徴ベクトルあるいは特徴ベクトルの各成
分を重み付けする。特徴ベクトル統合部106は、各メ
ッシュ領域の特徴ベクトルを、入力文字パターン全体の
特徴量として統合し、辞書作成部108あるいはマッチ
ング部110に送る。
【0023】〈実施例1〉特徴ベクトルとして、文字パ
ターンの輪郭線素を水平方向、垂直方向、右上がり斜
め、右下がり斜めの4方向に量子化した方向コードを、
各メッシュ領域内でコード別にカウントする方向コード
ヒストグラムを例にとる。まず、文字パターンを走査
し、注目画素が白画素であり、かつその上下左右に隣接
する4つの画素が図8に示す状態の何れかであるとき、
該注目画素に対して図8(a)〜(d)に応じて1〜4
のコードを付与する(図中の黒は、黒画素を表す)。例
えば、注目画素が白で、その左右の画素とその上の画素
が白で、注目画素の下の画素が黒画素のとき(図8の3
01の状態)、コード1が付与される。
【0024】次にパターンの領域分割を行うが、ここで
は簡単のためメッシュは互いに重なりを持たず、3×3
の9つの矩形に分割されるものとする。9個に分割され
た内の領域i(i=1,2,..,9)で抽出される特
徴ベクトルXiは4次元であり、その成分Xi[k]
(k=1,2,3,4)は、 Xi[1]=(領域i内のコード1の数) Xi[2]=(領域i内のコード2の数) Xi[3]=(領域i内のコード3の数) Xi[4]=(領域i内のコード4の数) となる。
【0025】従来は、これら特徴ベクトルをそのまま統
合して(例えば、Xiを単純に連結して36次元のベク
トル(X1[1],X1[2],X1[3],X1
[4],...,X9[1],X9[2],X9
[3],X9[4])とするなど)、文字パターン全体
の特徴量としていた。
【0026】図9は、同じ「木」という字種の2つのパ
ターンを示す。右上のハッチングを施したメッシュ領域
に注目すると、(a)、(b)ともに「水平な文字線が
左端からメッシュ中央付近まで伸びている」ことが分か
る。そして、文字線の上側の輪郭画素(注目画素)は、
図8(a)の状態301に相当するので、コード1が付
与され、文字線の下側の輪郭画素(注目画素)は、図8
(a)の状態302に相当するので、コード1が付与さ
れる。また、文字線の先端の輪郭画素は、図8(b)の
状態303に相当するので、コード2が付与される。
【0027】ところが、(a)の該領域に含まれるコー
ド1の数XAは14であり、(b)の該領域に含まれる
コード1の数XBは18であり、変動領域分割によって
互いに類似した部分パターンが得られたにも係らず、特
徴量の比はXB/XA=1.29となって、3割近い差
がある。
【0028】そこで、本実施例では、水平な輪郭を表す
コード1については、メッシュの横の長さで重み付けを
行う。図9(a)のメッシュは横の長さが12であり、
(b)のメッシュは横の長さが16であるから、 WA=XA/12=14/12=1.17 WB=XB/16=18/16=1.13 となって、重み付け後の特徴量の比は、WB/WA=
1.13/1.17=0.97となり、1に近い値にま
で補正される。
【0029】同様にして、垂直な輪郭を表すコード2に
ついては、メッシュの縦の長さで重み付けを行う。図9
の例では、(a)、(b)ともにコード2の数は1であ
り、メッシュの縦の長さも等しく13であるから、特徴
量の比は重み付け前後で変わらない。
【0030】また、斜めの輪郭を表すコード3、4につ
いては、メッシュの対角線の長さで重み付けを行う。図
9(a)は、√(122+132)=17.7、(b)
は、√(162+132)=20.6が重みとなる(な
お、同図では該メッシュにコード3、4が存在しないの
で、重みにかかわらず、特徴量は0のままである)。
【0031】あるいは対角線の長さを計算する際の2乗
根による計算負荷を回避するため、コード3、4につい
ては、メッシュの縦と横の長さの和を用いてもよい。こ
の場合、図9(a)は12+13=25、(b)は16
+13=29を重み付けすることになる。もちろん、辺
や対角線の長さで割算した後の特徴量に適当な定数を乗
じてもよい。
【0032】以上の重み付けを式で表すと、メッシュi
に関する方向コードヒストグラムXi[1]〜Xi
[4]から該メッシュの横の長さLHiおよび縦の長さ
LViを用いて、 Wi[1]=C1・Xi[1]/LHi Wi[2]=C2・Xi[2]/LVi Wi[3]=C3・Xi[3]/√(LHi)2+(L
Vi)2またはC3・Xi[3]/(LHi+LVi) Wi[4]=C4・Xi[4]/√(LHi)2+(L
Vi)2またはC4・Xi[4]/(LHi+LVi) 重み付けされたヒストグラムWi[1]〜Wi[4]を
得る。C1〜C4はメッシュによらない定数である。こ
のようにして重み付けしたメッシュ領域毎の特徴ベクト
ルを統合して(例えば単純に連結して)、文字パターン
全体の特徴ベクトルを得る。
【0033】なお、上記した実施例で方向コードヒスト
グラムを用いたこと、その量子化方向が4方向であるこ
と、メッシュの形状が矩形であること、3×3の分割で
あることは、一例であって、本発明はこれに限定されな
い。また、本発明は他の特徴抽出方法にも適用すること
ができる。
【0034】〈実施例2〉他の特徴ベクトルとして、各
メッシュ領域に含まれる黒画素の数を用いる。ここで
は、簡単のためメッシュは互いに重なりを持たず、3×
3の9つの矩形に分割されるものとする。
【0035】図9の例では、ハッチングを施した右上の
メッシュについて、(a)、(b)ともに類似した部分
パターンが得られているにも係らず、(a)でカウント
される黒画素数XAは7、(b)の方の黒画素数XBは
9であり、特徴量の比XB/XA=9/7=1.29と
なって、3割近い差があると評価されてしまう。
【0036】一方、メッシュの面積を比べると、(a)
のメッシュ面積SA=12×13=156,(b)のメ
ッシュ面積SB=16×13=208であり、その比は
SB/SA=1.33であるから、類似のパターンなら
ば(b)の黒画素数の方が3割ほど黒画素数が多くなる
のはむしろ自然である。そこで、メッシュの面積を用い
て次のような重み付けを行う。
【0037】 WA=XA/SA=7/156=0.045 WB=XB/SB=9/208=0.043 重み付け後の特徴量の比はWB/WA=0.043/
0.045=0.96であり、かなり1に近い値にまで
補正されている。もちろん、面積で割算した後の特徴量
に適当な定数を乗じてもよい。
【0038】以上の重み付けを式で表すと、メッシュi
の黒画素数Xiは該メッシュの面積Siを用いて、 Wi=C・Xi/Si 重み付けされた特徴量Wiを得る。Cはメッシュによら
ない定数である。Wiを統合して(例えば連結して(W
1,W2,...,W9)とする)、文字パターン全体
の特徴ベクトルを得る。
【0039】なお、本実施例では特徴量として黒画素数
を用いたこと、3×3の矩形に領域分割したことは一例
であって、本発明はこれに限定されない。また、本発明
は他の特徴抽出方法にも適用可能である。
【0040】〈実施例3〉本実施例3は、入力パターン
を互いに重なりを持たない3×3の矩形メッシュ領域に
分割する実施例である。図2は、領域分割のフローチャ
ートである。
【0041】まず、水平(x軸)および垂直(y軸)方
向に沿った1ラインについてパターンを走査し、パター
ンの粗密を示す特性量を検出する(ステップ201)。
本実施例の特性量に相当するものは黒画素であり、各ラ
イン上の黒画素数をカウントすることによって、黒画素
数の分布関数H(y)、V(x)を得る(ステップ20
2)。H(y)は水平な1ライン上の黒画素数をy軸に
投影したものであり、V(x)は垂直な1ライン上の黒
画素数をx軸に投影したものである。例として、図10
は、「木」を表すパターンについての黒画素数の分布関
数を示す。
【0042】次に、分布関数H(y)、V(x)をそれ
ぞれy、x軸上に累積して、累積関数CH(y)とCV
(x)を求める(ステップ203)。すなわち、CH
(y)はパターン上端から幅yの区間でH(y)を累積
したもの、CV(x)はパターン左端から幅xの区間で
V(x)を累積したものであって、次式で求められる。
【0043】CH(y)=ΣH(t) ここで、和
はt=1からyまで行う CV(x)=ΣV(t) ここで、和はt=1から
xまで行う CH(y)、CV(x)は単調増加なので、それらの最
大値CHmax、CVmaxは、y、xに文字パターン
のサイズを代入して求められる(ステップ204)。例
えば、64画素×64画素のパターンであれば、CHm
ax=CH(64)、CVmax=CV(64)とな
る。
【0044】そして、累積関数を3等分する点を決定す
る(ステップ205)。すなわち、CV(x)の値がC
Vmaxの1/3および2/3であるような点x1、x
2と、CH(y)の値がCHmaxの1/3および2/
3であるような点y1、y2とを求める。ただし、x、
yは整数なので、次式を用いる。
【0045】 x1=min{x|CV(x)≧(1/3)・CVmax} x2=min{x|CV(x)≧(2/3)・CVmax} y1=min{y|CH(y)≧(1/3)・CHmax} y2=min{y|CH(y)≧(2/3)・CHmax} 上記した例えばx1についての式は、CV(x)が(1
/3)・CVmaxを超えるようなxの値の内、最小の
ものがx1であることを意味する。x2、y1、y2に
ついても同様である。
【0046】これらの等分点を領域分割位置とする。図
3は、領域分割の具体例を示す。この分割では、各分割
区間での分布関数の積算が等しくなっている。つまり、
x<x1と、x1≦x<x2と、x≧x2という3つの
区間では、それぞれの区間内における分布関数CV
(x)の積算が互いに等しいか、または近似的に等し
い。同様に、y<y1と、y1≦y<y2と、y≧y2
という3つの区間では、それぞれの区間内における分布
関数CH(y)の積算が互いに等しいか、または近似的
に等しい。
【0047】このようにして、パターンの粗密に応じて
決定された分割位置x1,x2,y1,y2を分割位置
格納部107に格納して、分割処理を終える(ステップ
206)。そして、領域分割の後、分割された領域ごと
に特徴ベクトルを抽出し、実施例1または2を用いて特
徴ベクトルの重み付けを行う。
【0048】なお、本発明は上記した実施例に限定され
ず、隣接する領域が重なり部分を持つようにしてもよい
し、また水平方向と垂直方向で分割数が異なってもよ
い。さらに、メッシュの形状が矩形である必要はなく、
パターンを水平軸や垂直軸以外の方向軸に投影した分布
関数を利用するような分割方式であってもよい。
【0049】〈実施例4〉本実施例では、文字パターン
の輪郭画素をパターンの粗密を示す特性量として用い、
領域分割位置を決定する。まず、パターンを水平、垂直
方向に沿った1ラインについて走査し、白画素であっ
て、かつ、その上下左右の画素が図8に示す何れかの状
態であるとき、該画素を輪郭画素としてカウントするこ
とによって、輪郭画素数の分布関数H(y)、V(x)
を求める。例として、図11に「木」を表すパターンに
ついての輪郭画素数の分布関数を示す。図中のグレーの
網点部分は文字パターンにおける黒画素を表し、その周
囲の黒い線が輪郭画素を表す。図2のステップ203以
降の処理は実施例3と同様である。なお、ここで用いた
文字輪郭画素の定義は一例であって、他の定義を用いる
場合にも本発明を適用することができる。
【0050】〈実施例5〉この実施例は、文字パターン
のストローク数をパターンの粗密を示す特性量として用
い、領域分割位置を決定する。まずパターンを水平、垂
直方向に沿った1ラインについて走査し、文字線と交差
した回数をストローク数とすることによって、ストロー
ク数の分布関数H(y)、V(x)を求める。例とし
て、図12に「木」を表すパターンについての分布関数
を示す。図2のステップ203以降の処理は実施例3と
同様である。
【0051】〈実施例6〉まず、文字パターンの特徴量
を抽出し、次に特徴量を均等に分配するような分割位置
を持つサブ領域を作成する。サブ領域への分割は、実施
例3〜5で説明したメッシュ分割方法をそのまま用いる
ことができる。パターンの粗密を示す特性量として、先
に抽出した特徴量を用い、特徴量の分布関数H(y)、
V(x)を求めればよい。
【0052】例えば、黒画素数を特徴量とするならば、
サブ領域への分割は実施例3に帰着するし、方向コード
ヒストグラムを特徴量とするならば実施例4の方法を用
いることができる。もちろん、ここで得られるのはメッ
シュ領域ではなく、それよりも細かく数の多いサブ領域
である。
【0053】図4(a)は、サブ領域の例を示す。ここ
では4×4のサブ領域A〜PをパラメータP(j)、Q
(j)、R(j)、S(j)(j=1,2,3)および
以下の規則から3×3のメッシュ領域に統合する。
【0054】統合規則とは、「左からm列目、上からn
行目のメッシュ領域は、『左からP(m)列目〜Q
(m)列目、かつ上からR(n)行目〜S(n)行目ま
でに含まれるサブ領域』からなる」という、規則であ
る。
【0055】図4(b)では、次のパラメータを用いて
いる。 P(1)=1、Q(1)=1、R(1)=1、S(1)=1 P(2)=2、Q(2)=3、R(2)=2、S(2)=3 P(3)=3、Q(3)=4、R(3)=3、S(3)=4 従って、例えば、図4(b)のメッシュ領域2は、同図
(a)のサブ領域BとCからなり、メッシュ領域6はサ
ブ領域G、H、K、Lからなる。このようにして、パタ
ーンをメッシュ領域に分割した後、分割されたメッシュ
領域毎に特徴ベクトルを抽出し、前述した実施例1、2
を用いて特徴ベクトルの重み付けを行う。なお、本分割
方式および他の統合規則例の詳細については、前掲した
特開昭63−14291号公報に記載されている。
【0056】
【発明の効果】以上、説明したように、本発明によれ
ば、分割したメッシュ領域の大きさが異なる場合にも適
切に特徴量の重み付けが行われるので、マッチング部に
おいて特徴量の値を正しく評価することができ、特に同
一字種間の特徴量のばらつきを抑えることができるの
で、誤認識を減らすことができる。また、パターンを局
所的に異なる倍率で変倍するかわりに、特徴量の重み付
けという簡単な演算を用いて変倍に相当する効果を得て
いるので、非線形正規化工程を省略することができ、文
字パターンの整形を行う時間と装置を不要にすることが
可能となる。
【図面の簡単な説明】
【図1】本発明の実施例の構成を示す。
【図2】領域分割のフローチャートである。
【図3】領域分割された例を示す。
【図4】(a)はサブ領域の例を示し、(b)はサブ領
域をメッシュ領域に統合した例を示す。
【図5】(a)、(b)は、4×4の領域に分割された
文字パターンの例を示す。
【図6】(a)、(b)は、整形された文字パターンの
例を示す。
【図7】(a)、(b)は、文字パターンに応じて領域
の分割位置を変動させる例を示す。
【図8】(a)〜(d)は、4方向の方向コードを示
す。
【図9】(a)、(b)は、「木」という字種のパター
ン例を示す。
【図10】黒画素数の分布を示す。
【図11】輪郭画素数の分布を示す。
【図12】ストローク数の分布を示す。
【符号の説明】 101 文字パターン入力部 102 前処理部 103 領域分割部 104 領域別特徴ベクトル抽出部 105 領域別特徴ベクトル重み付け部 106 特徴ベクトル統合部 107 分割位置格納部 108 パターン辞書作成部 109 パターン辞書 110 マッチング部 111 認識結果出力部

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 入力文字パターンを所定の規則に従って
    多角形のメッシュ領域に分割し、該分割された各メッシ
    ュ領域から抽出される特徴ベクトルを統合して、該入力
    文字パターンの特徴量とする特徴抽出方法において、該
    分割された各メッシュ領域を構成する辺または対角線の
    長さに基づいて特徴ベクトルの重み付けを行うことを特
    徴とする特徴抽出方法。
  2. 【請求項2】 入力文字パターンを所定の規則に従って
    多角形のメッシュ領域に分割し、該分割された各メッシ
    ュ領域から抽出される特徴ベクトルを統合して、該入力
    文字パターンの特徴量とする特徴抽出方法において、該
    分割された各メッシュ領域の面積に基づいて特徴ベクト
    ルの重み付けを行うことを特徴とする特徴抽出方法。
  3. 【請求項3】 前記メッシュ領域の分割は、入力文字パ
    ターンを複数の特定軸へ投影したときの黒画素数分布の
    積算が均等に分配されるように分割することを特徴とす
    る請求項1または2記載の特徴抽出方法。
  4. 【請求項4】 前記メッシュ領域の分割は、入力文字パ
    ターンを複数の特定軸へ投影したときの文字輪郭画素数
    分布の積算が均等に分配されるように分割することを特
    徴とする請求項1または2記載の特徴抽出方法。
  5. 【請求項5】 前記メッシュ領域の分割は、入力文字パ
    ターンを複数の特定軸へ投影したときのストローク数分
    布の積算が均等に分配されるように分割することを特徴
    とする請求項1または2記載の特徴抽出方法。
  6. 【請求項6】 前記メッシュ領域の分割は、入力文字パ
    ターンを特徴量が均等に分配されるようなメッシュ領域
    数より多いサブ領域に分割し、隣接したメッシュ領域に
    共通のサブ領域を割り当てることにより、該サブ領域を
    メッシュ領域に統合する領域分割方法であることを特徴
    とする請求項1または2記載の特徴抽出方法。
JP7202555A 1994-11-18 1995-08-08 特徴抽出方法 Pending JPH08194780A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP7202555A JPH08194780A (ja) 1994-11-18 1995-08-08 特徴抽出方法
CN95117537A CN1095145C (zh) 1994-11-18 1995-11-17 特征提取方法
US08/560,748 US5911005A (en) 1994-11-18 1995-11-20 Character recognition method and system

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP28467494 1994-11-18
JP6-284674 1994-11-18
JP7202555A JPH08194780A (ja) 1994-11-18 1995-08-08 特徴抽出方法

Publications (1)

Publication Number Publication Date
JPH08194780A true JPH08194780A (ja) 1996-07-30

Family

ID=26513454

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7202555A Pending JPH08194780A (ja) 1994-11-18 1995-08-08 特徴抽出方法

Country Status (3)

Country Link
US (1) US5911005A (ja)
JP (1) JPH08194780A (ja)
CN (1) CN1095145C (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0924639A2 (en) * 1997-12-19 1999-06-23 Fujitsu Limited Character string extraction apparatus and pattern extraction apparatus
JP2009020884A (ja) * 2007-07-10 2009-01-29 Sharp Corp 画像データの特徴を特定する方法及びシステム
JP2009037640A (ja) * 2008-10-06 2009-02-19 Toshiba Corp パターン認識装置および特徴抽出パラメータの生成方法
JP2009043280A (ja) * 2008-10-06 2009-02-26 Toshiba Corp パターン認識装置

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6975755B1 (en) * 1999-11-25 2005-12-13 Canon Kabushiki Kaisha Image processing method and apparatus
US6721452B2 (en) 2001-09-12 2004-04-13 Auburn University System and method of handwritten character recognition
US20050152600A1 (en) * 2004-01-14 2005-07-14 International Business Machines Corporation Method and apparatus for performing handwriting recognition by analysis of stroke start and end points
US7756337B2 (en) * 2004-01-14 2010-07-13 International Business Machines Corporation Method and apparatus for reducing reference character dictionary comparisons during handwriting recognition
US7298904B2 (en) * 2004-01-14 2007-11-20 International Business Machines Corporation Method and apparatus for scaling handwritten character input for handwriting recognition
US7359576B1 (en) 2004-02-27 2008-04-15 Adobe Systems Incorporated Using difference kernels for image filtering
US7490033B2 (en) * 2005-01-13 2009-02-10 International Business Machines Corporation System for compiling word usage frequencies
JP4768451B2 (ja) * 2006-01-18 2011-09-07 株式会社リコー 画像処理装置、画像形成装置、プログラムおよび画像処理方法
US8160365B2 (en) * 2008-06-30 2012-04-17 Sharp Laboratories Of America, Inc. Methods and systems for identifying digital image characteristics
JP5377649B2 (ja) * 2009-09-02 2013-12-25 ルネサスエレクトロニクス株式会社 画像処理装置および映像再生装置
JP6094400B2 (ja) * 2013-06-25 2017-03-15 ソニー株式会社 情報処理装置、情報処理方法、および情報処理プログラム
US9087272B2 (en) * 2013-07-17 2015-07-21 International Business Machines Corporation Optical match character classification
JP2016153933A (ja) * 2015-02-20 2016-08-25 株式会社リコー 画像処理装置、画像処理システム、画像処理方法、プログラム、及び記録媒体

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3480667D1 (de) * 1983-03-01 1990-01-11 Nec Corp System zum bestimmen des zeichenabstandes.
JPS59202823A (ja) * 1983-05-02 1984-11-16 Kanegafuchi Chem Ind Co Ltd 熱可塑性発泡樹脂成形品の成形用金型における成形品の離型方法並びにその離型方法で用いられる成形用金型
JPS59202825A (ja) * 1983-05-06 1984-11-16 Toyota Motor Corp シ−トの製造方法
JPS6125283A (ja) * 1984-07-12 1986-02-04 Omron Tateisi Electronics Co 文字認識装置
GB2190778B (en) * 1986-05-19 1990-04-25 Ricoh Kk Character recognition with variable subdivisions of a character region
JPH0795333B2 (ja) * 1986-07-03 1995-10-11 株式会社リコー 文字パターン領域分割方法
US4903313A (en) * 1986-07-03 1990-02-20 Ricoh Company, Ltd. Character recognition method
US4959870A (en) * 1987-05-26 1990-09-25 Ricoh Company, Ltd. Character recognition apparatus having means for compressing feature data
JPH0789362B2 (ja) * 1987-10-30 1995-09-27 工業技術院長 非線形正規化方法
JPH01246678A (ja) * 1988-03-29 1989-10-02 Toshiba Corp パターン認識装置
JP2822189B2 (ja) * 1988-05-19 1998-11-11 ソニー株式会社 文字認識装置及び方法
US5086490A (en) * 1990-02-07 1992-02-04 Nippon Sheet Glass Co., Ltd. Optical pattern extracting apparatus
US5271068A (en) * 1990-03-15 1993-12-14 Sharp Kabushiki Kaisha Character recognition device which divides a single character region into subregions to obtain a character code
JPH03286390A (ja) * 1990-04-02 1991-12-17 Ricoh Co Ltd 文字の非線形正規化法
US5020121A (en) * 1990-08-16 1991-05-28 Hewlett-Packard Company Neighborhood block prediction bit compression
JPH0772906B2 (ja) * 1991-07-10 1995-08-02 富士ゼロックス株式会社 文書認識装置
EP0610916A3 (en) * 1993-02-09 1994-10-12 Cedars Sinai Medical Center Method and device for generating preferred segmented numerical images.
JP3286390B2 (ja) * 1993-03-30 2002-05-27 マツダ株式会社 車両の制御装置
JPH07129720A (ja) * 1993-11-04 1995-05-19 Matsushita Electric Ind Co Ltd 文字認識装置
JP3242511B2 (ja) * 1993-12-06 2001-12-25 松下電器産業株式会社 文字生成装置および文字生成方法
JP3027321B2 (ja) * 1994-09-27 2000-04-04 財団法人工業技術研究院 拘束のない手書き英数字のオンライン認識の方法及び装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0924639A2 (en) * 1997-12-19 1999-06-23 Fujitsu Limited Character string extraction apparatus and pattern extraction apparatus
EP0924639A3 (en) * 1997-12-19 2001-11-28 Fujitsu Limited Character string extraction apparatus and pattern extraction apparatus
US6563949B1 (en) 1997-12-19 2003-05-13 Fujitsu Limited Character string extraction apparatus and pattern extraction apparatus
JP2009020884A (ja) * 2007-07-10 2009-01-29 Sharp Corp 画像データの特徴を特定する方法及びシステム
JP2009037640A (ja) * 2008-10-06 2009-02-19 Toshiba Corp パターン認識装置および特徴抽出パラメータの生成方法
JP2009043280A (ja) * 2008-10-06 2009-02-26 Toshiba Corp パターン認識装置

Also Published As

Publication number Publication date
US5911005A (en) 1999-06-08
CN1095145C (zh) 2002-11-27
CN1151056A (zh) 1997-06-04

Similar Documents

Publication Publication Date Title
JPH08194780A (ja) 特徴抽出方法
US10339643B2 (en) Algorithm and device for image processing
Schulte et al. A fuzzy impulse noise detection and reduction method
US5594816A (en) Computer based digital image noise reduction method based on over-lapping planar approximation
DE69521184T2 (de) Gerät zur Bildverarbeitung gemäss einem lokal ermittelten Bildregionentyp
US5832118A (en) Texture classification apparatus employing coarsensess and directivity of patterns
US4641355A (en) Pattern recognition apparatus
CN111126185A (zh) 一种针对道路卡口场景的深度学习车辆目标识别方法
Taguchi et al. Fuzzy filters for image smoothing
DE69715585T2 (de) Verfahren und Vorrichtung zur Kodierung von Objektkonturen mittels Scheiteleinfügungstechnik
CN112528851B (zh) 一种人脸检测方法及系统
Margalit et al. Using probabilistic domain knowledge to reduce the expected computational cost of template matching
KR100866277B1 (ko) 에지 트래킹에 의한 영상 노이즈 제거 시스템, 방법 및상기 방법을 프로그램화하여 수록한 컴퓨터로 읽을 수 있는기록매체
Carlinet et al. Getting a morphological tree of shapes for multivariate images: Paths, traps, and pitfalls
Xin et al. Face image restoration based on statistical prior and image blur measure
JP2004062505A (ja) 画像処理装置
EP0450521B1 (en) A learning method for a data processing system
JPH07334648A (ja) 画像処理方法及びその装置
Otte et al. Extraction of line drawings from gray value images by non-local analysis of edge element structures
CN112435186A (zh) 一种基于双规则矩阵方向场的指纹图像增强方法
JP4164166B2 (ja) 照射領域抽出装置、照射領域抽出方法及びコンピュータ読み取り可能な記憶媒体
Kountchev et al. Image Segmentation based on Adaptive Mode Quantization and 2D Histograms Analysis
WO2006056743A1 (en) Method and system for initialising a background model
JP3809210B2 (ja) 画像抽出装置
DE68919888T2 (de) Bildverarbeitungsmethode.