JPS63237183A - 文字の特徴を抽出するシステム - Google Patents

文字の特徴を抽出するシステム

Info

Publication number
JPS63237183A
JPS63237183A JP63060197A JP6019788A JPS63237183A JP S63237183 A JPS63237183 A JP S63237183A JP 63060197 A JP63060197 A JP 63060197A JP 6019788 A JP6019788 A JP 6019788A JP S63237183 A JPS63237183 A JP S63237183A
Authority
JP
Japan
Prior art keywords
character
subroutine
block
circumferential
coordinates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63060197A
Other languages
English (en)
Other versions
JP2930300B2 (ja
Inventor
スティーブン・エル・ホロウィッツ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GTX Corp
Original Assignee
GTX Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GTX Corp filed Critical GTX Corp
Publication of JPS63237183A publication Critical patent/JPS63237183A/ja
Application granted granted Critical
Publication of JP2930300B2 publication Critical patent/JP2930300B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/478Contour-based spectral representations or scale-space representations, e.g. by Fourier analysis, wavelet analysis or curvature scale-space [CSS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18086Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/182Extraction of features or characteristics of the image by coding the contour of the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/186Extraction of features or characteristics of the image by deriving mathematical or geometrical properties from the whole image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Algebra (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、英数字等の連続しない文字を認識するための
方法および装置に関し、特に電子的に走査された文字を
認識するため統計的な判断ツリーにより更に効率的に使
用することができる特徴の    −効率的な抽出を行
なうための方法および装置に関し、また特に、一般に大
きさの不変量および回転の不変量である%りを生じるこ
とができる如き方法および装置に関する。
〔従来の技術および解決しようとする問題点〕過去にお
いては、1つは「構造的な」試みであり他は「統計的な
」試みである、不連続な文字の認識に直する2つの広く
用いられる試みがあった。
構造的な試みにおいては、文字は当業者には周知の正中
軸変換法によりスケルトン化され、次いで文字の各部が
このスケルトンの空間的分析を経て識別される。手順側
ベースによる分析、−次元および二次元文法による分析
、また構造的判断ツリー分析によるものを含む文字の各
部を識別するための広範囲の手法が当業者には知られて
いる。正中軸変換法は、計算機によっても非常に高価に
つく。構造的方法論において要求されるコンピュータ処
理は、走査された文字の無意味な「偽の」構造即ち「ノ
イズ」構造の識別を生起する。単一文字に対して非常に
大きな数となり得るこのような構造を処理する際には、
誤った分類を避けるために複雑な認識アルゴリズムが必
要となる。
文字認識に対する統計的な試みは1文字の走査と、種々
の予め定めた文字種に対する予め選定された特徴の組に
抽申された特徴を比較し、最後には文字を認識するかあ
るいは棄却する統計的判断ツリーに対して抽出した特徴
を送ることにより得られるピクセル・データからの「特
徴」の抽出とを含んでいる。従来の文字抽出手法は、は
とんどが矩形状格子内の大量サンプリング、二次元モー
メントの生成、ある境界特性のフーリエ変換、文字の縦
横比、文字の周囲長さ対暗ピクセル数の厚みの比率、等
に限られてきた。抽出された特徴についての従来の統計
的手法は、一般に文字の大きさおよび方位が既知である
ことを要求する。別の充分な統計的特徴抽出法が考えら
れてきたが、これらは一般に大量のコンピュータ処理時
間および記憶容量を必要とするものである。
このように、Mo t o r o l a社のMC6
8020Wイクロプロセツサの如き1つ以上の技術水準
のマイクロプロセッサによシ有効な統計的文字認識を迅
速に行なうことを可能にするため、C,Y、 5uen
およびQ、 L Wangの「新たな目的を持つI 5
OETRP一対話集合アルゴリズムJ (r Patt
ern Recognition J第17巻、第2号
、211〜219頁、1984年刊)に基くものの如き
技術水準の判断ツリーにより処理することができる有効
な組をなす大きさの不変量、回転不変量の特徴を生じる
改善された文字特徴の抽出の方法および装置を求める文
字認識技術における満たされざる需要が存在する。
〔問題点を解決するための手段〕
本発明の目的は、全てが文字の大きさおよび方位とは独
立しておりかつ統計的判断ツリーにより文字を認識する
際に効率的な1組の特徴を抽出するためのシステムの提
供にある。
本発明の別の目的は、従来技術において使用されてきた
ものよりも基かに複雑でないコンピュータ・ハードウェ
アを用いる文字の迅速な認識のための方法および装置の
提供にある。
本発明の他の目的は、特徴が微分平均および小さな標準
偏差を伴なう確率分布を持つ走査文字デーfiからの「
強固な」特徴グループを生成することにある。
本発明の他の目的は、文字の形状についての実質的に異
なる情報を提供するように特徴が極小関連付けがなされ
る走査文字データから「豊かな」特徴グループを抽出す
ることにある。
要約すれば、また本発明の一実施態様によれば、本発明
は、電子的に走査された文字の特徴の抽出を行なうため
のシステムを提供するもので、この特徴は文字の認識を
行なうため統計的判断ツリーに対して与えられるべき大
きさが独立でありかつ回転が独立である。記述する実施
態様においては、各々が文字の各4つの点に接する4つ
の辺を有する固定数(例えば、6)の仮想的な最小制限
矩形の複数の子め定めたパラメータを決定することに−
より1組の特徴が抽出され、この最小制限矩形はそれぞ
れ予め定めたある角度(例えば、15°)だけ他に対し
て回転している。それぞれ各最小制限矩形の高さおよび
巾、各最小制限矩形の面積、各最小制限矩形の縦横比、
各最小制限矩形の中心点および各最小制限矩形の中心点
間の距離を含む一次元の列が生成される。%徴は、最小
制限矩形の中心点により定義される多角形の周囲の長さ
を計算することによシ得られる。文字の個々の周ピクセ
ルのX座標列、および各周ピクセルのy座標の同様な列
が生成される。文字の中心点からその各局ピクセルまで
の半径の長さを含む列が生成される。各々がO乃至7の
値を有する方向のコード列が、6対の文字の周ピクセル
毎に生成される。各周ピクセルから次のピクセルまでの
距離を含む別の列が生成され、もし次のピクセルがその
時の周ピクセルに対して水平または垂直方向に大きさが
生成されるならば、各ピクセルの距離は1となり、もし
次の周ピクセルがその時のピクセルに対して斜め方向に
整合されるならば、2の平方根に等しい。周ピクセルの
XおよびX座標列は、各々が再びサンプルされた固定数
(例えば、64)のXまたはy座標を含むように再サン
プルされ、その6各はそれぞれ総数のXまたはy座標の
等しい端数の平均となる。2回の複素形ツー」J工変換
が再サンプルされたXおよびy座標について行なわれて
2つの対応するグループをなす8つの大きさの二乗調和
係数を生じ、その各々は8つの対応する調和係数の和で
除した後平方根をとることにより正規化される。半径の
長さ列は、各々が文字の周囲長さの等しい割合を表わす
固定数(例えば、64)の再サンプルされた半径長さを
生じるためピクセル距離の列について演算することによ
り再サンプルされる。方向コード列は、これおよびピク
セル距離の列について演算することにより再サンプルさ
れて、各々が文字の周囲長さの等しい割合にわ★、る周
囲の正接角を表わす固定数(例えば、64)の再サンプ
ルされた方向コードを生じる。円の増分が再サンプルさ
れた各方向コードから差引かれて、補正された丙サンプ
ル方向コードの列を生じる。
再サンプルされた方向コードの移動平均が演算さjして
、各々が1つの移動平均数と次の平均数との間の差に等
しい固定数(例えば、64)の方向コ・−ド増分を生成
する。方向コード増分は各々1つの閾値に比較され、も
しこの方向コード増分がこの閾値より小さければ凹の表
示数が増分され、もしこの方向コード増分が閾値より大
きければ、凸の表示数が増分される。凹および凸の異な
る極値を測定するため多重閾値を定めることができる。
変数環の固定した大きさく例えば、8)の列が文字を囲
む円内の等しい半径の増分の対応する仮想的な連続循環
領域に割当てられる。文字における各ピクセルのXおよ
びy座標は、もし対応するピクセルが暗でちるかどうか
を判定するため系統的に増分され、もしそうであれば、
その時のピクセルがどの循環領域に見出されるかが判定
され、その対応する変数環が増分される。文字も全ての
暗ピクセルがこれにより有効に1つの循環領域と関連付
けられた後、変数環の各々がこれを文字における暗のピ
クセルの総数により除すことにより区分される。
ある固定された大きさく例えば、24)の列のスライス
変数が、文字の1つの境界円の対応する仮想的な連続し
たパイ状のスライス領域(例えば、15°に対する)に
割当てられる。対応するピクセルが暗であるかどうかを
決定するため、文字における各ピクセルのXおよびy座
標が系統的に増分され、もしそうであれば、その時のピ
クセルがどのスライス領域に見出されるかが決定され、
対応するスライス変数が増分される。文字の全ての暗の
ピクセルがこれにより有効に1つのスライス領域と関連
付けられた後、このスライス変数の各々は文字内の暗ピ
クセルの総数により除すことにより区分される。尖形フ
ーリエ変換演算が、制限矩形列、半径長さの再サンプル
された周囲列および補正された再サンプル方向コード、
およびスライス列について個々に行なわれて、対応する
グル・−ブをなす8つの大きさの二乗調和係数を生じ、
その各々は8つの調和係数の和で除し、その平方根をと
ることにより正規化される。正規化された自己相関演算
がこれらの同じ列について行なわれる。
最初の4つの一次元のモーメント、即ち平均、分散、歪
みおよびとがりが長さ、面積、縦横比および矩形列を限
定する中心点距離、半径および方向のコード増分の長さ
の再サンプルされた周囲列、および循環およびスライス
列について個々に計算される。分類操作はこれらの列に
ついて行なわれ、これから得られる組をなす要素の色々
な算術的組合せが計算される。モーメントおよび分類さ
れた要素は、予め計算された長さおよび面積の変数によ
り適当に区分される。
文字における最も大きな穴の中心軌跡と文字の最小制限
矩形の中心の平均との間の区分された距離が計算される
。文字のこの2つの最も大きな穴の周囲と文字の周囲長
さとの間の比率もまた計算される。
組をなす抽出された特徴は、8つの正規化された調和係
数と選択された制限矩形列、周囲の列およびスライス列
の正規化された自己相関との組、4つの一次元の区分さ
れたモーメントおよび区分された分類要素および選定さ
れた制限矩形列、周囲列循環およびスライス列のその徨
々の算術的組合せ、凹および凸の表示値、最小制限矩形
の隣接する中心間の距離の区分された和、文字の穴の周
囲を含む比率、および文字の最も大きな穴の中心軌跡と
文字の中心との間の区分された距離を含んでいる。
〔実施例〕
初めに、本発明の特徴抽出手法が、認識されるべき文字
を含む文書の行単位の走査に応答して生じたファイルか
ら表1に示された1つのグループの入力変数を受取るこ
とを理解すべきである。当業者は、対象物を走査するこ
とにより生じるピクセル・データについて演算すること
により、文字認識システムにおいて使用することができ
る種々の入力変数を生じる色々な公知の境界追跡アルゴ
リズムには馴染があろう。本発明の現在望ましい実施態
様においては、従来の境界走査サブルーチンが「対象物
」即ち目的ファイルについて動作する。この対象物は、
走査される文書における文字の幾何学的構造と対応する
水平方向のスライスとして組立てられた認識されるべき
文字の全てのピクセル・データを含んでいる。
以下に示す表1は、上記の境界追跡ルーチンにより生じ
る入力変数およびこれらの変数の定義のリストである。
表1 人力変数 P(xyy)   2進ピクセル像(0=明/1=暗)
、但し、全ての暗ピクセルが結合状態にあるx   P
(x、y)のX座標:0 ≦x<mxy   P(x、
y)のX座標:0≦y≦mymx  P(x、y)=1
の量大X座標my  P(x、y)==1の最大y座標
npix暗pxp (x、 y)==1の数px(ip
)   最も左上のP(x、y)=1周ピクセルのX座
標から反時計方向に追跡された座標 Py(ip)   最も左上のP(x、y)=1周ピク
セルのX座標から反時計方向に追跡された座標 PD (ip )   周ピクセルipから(ip+1
)までの8通りの方向(0〜7)(あるいは、最後のピ
クセル々らば0) ip  周ピクセル標識(O≦ip≦nper+m −
11perirn  周ピクセルの数 perim   周長(水平または垂直(偶数)方向毎
に1f、加算、また対角(奇数)方向毎に2加算) Hx(ih)  最も左上のP (X* y ) =0
0最も大きな穴の境界ピクセルのX座標から反時計方向
に追跡され念座標 Hy(th)  最も左上(’)P(x、y)=Oの最
も大きな穴の境界ピクセルのX座標から反時計方向に追
跡された座標 HD (i h )  最も大きな穴の境界ピクセルi
hから(th+1)まで8通りの方向(θ〜7)、(あ
るいは、最後のピクセルならば0)th  最も大きな
穴の境界ピクセル標識:0 ≦ ih  ≦nhole nhole  最も大きな穴の境界ピクセル数(もしな
ければ0) ahole  最も大きなnholeの境界長さくもし
2なければO) bhole  2番目に大きな穴の境界長さくもしなけ
れば0) 第2図は、rBJO形を有する認識すべき文字の図であ
る。表1の入力変数の記述に際して、第2図を参照する
のが便利であろう。表1においては、P (X、 y 
)は二次元の列であり、2進ピクセル像を表わす。もし
P(x、y)がその時のx、X座標における「1」であ
るならば、これは暗のピクセルを表わし、同様に、もし
P (X、 y )がrOJならば、これは座枠X、7
における明即ち透明なピクセルを表わす。2進数のX軸
に沿って示されるように、Xは0とmxとの間のどんな
値でもとり得る。同様に、2進数のy軸で示されるよう
に、yは0とmyとの間のどんな値でもとり得る。0回
転における最小制限矩形は、図に示すように点(0,0
)、(0,mx)、(mx、my)および(0゜my)
によシ定義される。文字10における暗ピクセルの総数
、即ちP (xp y )が「1」に等しいピクセル数
は、nptxに等しい。
PX(ip)は、npe jm  の周囲即ち文字10
のピクセルのX座標の一次元列である。標識の変数ip
はOとnperim−1との間のどんな値でもとり得る
が、ここでnperim  とは文字10の周囲ピクセ
ルの総数である。同様に、PY(ip)は。
文字10のnperim  ピクセル全てのX座標の一
次元列である。PX (ip)およびPY(ip)の列
は、文字10の最も左上のピクセルから、即ち第2図に
おける点13から反時計方向に追跡された周囲点の順序
にリストされる。もし文字10が、例えば文字を「円滑
化(smooth ) j、 「薄化(thin)J6
るいは[分解(decomposes) Jするプログ
ラムにより前処理されるならば、PX(ip)およびP
Y(ip)列は、結果(単数または複数)の周囲を表わ
すことになろう。
一次元列PD(ip)は、文字の境界が反時計方向に追
跡されるため、ある周ピクセルipから次の周ピクセル
(ip+1)までの8つの方向の1つを表わす。DP 
(ip)は、第2A図の9で示されるようにO乃至7の
どんな値でもとり得、この場合0°、45°、90’、
135°%180°、270゜および315° の8つ
の方向がそれぞれ0.1.2.3.4,5.6および7
により表わされる。このため、3つの列PX(ip)、
PY(ip)およびPD (ip)のグループは、文字
10に対する隣接ピクセル間の周の点および方向の全て
を表わす。
(PD(ip)列はP (x+ y )あるいはPX(
iP)、およびPY(ip)から容易に得ることができ
ることに注意。) 変数perim  は、文字10における周囲長さを表
わす。この長さは、文字10の周囲がピクセル13から
逆にピクセル17まで反時計方向に追跡されるため、隣
接するピクセル間の全ての距離を加算することによシ決
定される。PD(ip)の偶数を付した6値においては
、水平または垂直方向の距離の長さ即ち1がperim
 に加算され、po(ip)の奇数を付した6値におい
ては、対角距離の長さく例えば、第2図における16あ
るいは19)、即ち2の平方根が文字10の周囲長さを
得るためperim  に加算される。
HX(ih) 、HY(ih)およびHD (ih)は
、最も大きな穴の境界ピクセルに対するX座標、X座標
および方向のコード列であり、もし文字がその中に穴を
持つならば、pX(ip)、py(ip)およびpo(
ip)が穴の境界のXおよびyの座標を含む点を除いて
、それぞれこれらおよび方向のコードに類似している。
ihは最も大きな穴の境界ピクセルであり、Oと(nh
ole−1)との間のどんな値でもとり得るが、この場
合nholeは文字10の最も大きな穴15における境
界ピクセルの総数である。第2図においては、参照番号
14および15は穴を表わす。点19は、点20まで反
時計方向に穴15の境界を追跡するための開始点を表わ
す。第2図に示されるように、2、P(x、y)は文字
が暗であるどこでも1となる。穴14および15のよう
な文字における穴の場所では、P(x、y)はOとなる
。明のピクセルは、どこでも第2図におけるP(x、y
)で示される。
最も大きな穴の境界の長さ、即ち穴15の境界の長さは
、変数1−aha L eJで表わされ、もし文字中に
穴がなければ値Oを有する。変数「bho I ejは
、もし2番目の穴があれば、文字10の2番目に大きな
穴即ち穴13の境界長さである。もし2番目の穴がなけ
れば、bholeはOの値を持つ。
第1図のフローチャートに関して記述する本発明の特徴
抽出プログラムおよびこれにより呼出される色々なサブ
ルーチンについて説明する先立ち、以下に示す表2に列
記される計算された変数について最初にある程度詳細に
記述することが役立とう。
表2 計算された変数 clen(0”ll)  15°ずつ回転されたP(x
、y)の制限矩形の辺部の長さ card(0〜5)  15°ずつ回転されたP(x、
y)の制限矩形の面積 cdiv(0〜5)  15°ずつ回転されたP(x、
y)の制限矩形の縦横比 cxcp(0〜5)  15°ずつ回転されたp(x、
y)の制限矩形の中心点のX座標 cycp(0−5)  15°ずつ回転されたp(x、
y)の制限矩形の中心点のX座標 cx制限矩形の中心点の平均X座標 cy制限矩形の中心点のtaverage y座標cd
ist(0〜14)  各制限矩形の中心点間距離cd
sum perimで区分された隣接の制限矩形の中心
点間の距離の和 xproj (ip)  周ピクセルのnperimの
X座標列(px(ip)と同) yproj(ip)  周ピクセルのnperjmのX
座標列(px(ip)と同) plen(ip)   隣接の周ピクセル間のnper
 im距離の列(もしPD(ip)が偶数ならば11も
しpD(ip)が奇数ならばd) prad(ip)   (cx、cy)から各(PX(
ip)。
py(ip))tでのnperim距離の列ptan(
ip)   隣接の周ピクセル間のnperim距離の
列(PD(ip)と同) prmax  (ex、 cy)から(PX(ip)s
PY(ip))までの最大距離 msamp(0”63)   xprojからの周囲の
再サンプルされたX軸射影 y s amp (0〜63)  yprojからの周
囲の再サンプルされたy射影 rsamp(0−63)  plenおよびpradか
ら再サンプルされた周半径 tsamp(0〜63)  plenおよびptanか
ら再サンプルされた周正接 tnorm(0〜63)   tsampから正規化さ
れた周正接tdiff(0〜63)   tsampか
らの周正接の平滑差ccoef(1〜8)  二乗の和
で区分されたx s ampおよびysampからの最
初の8つの複合7−りエ係数 dcoef(1〜8 )  二乗の和で区分されたxs
ampおよびy s ampからの最初の8つの複合フ
ーリエ係数 thisum  tdiffからのある閾値より大きな
周正接差の和 tlosum tdiffからのある閾値上り小さな周
正接差の和 口ng(0〜7)  npixにより区分された半径方
向サンプルされたP(x、y)からの等しい半径方向増
分の同心円環 5lice(0〜23)   npixにより区分され
た半径方向サンプルされたP(x、y)からの等しい面
積の隣接する15°のスライス hx最も大きな穴境界中心軌跡のX座標by最も大きな
穴境界中心軌跡のy座標hdist  prmaxに対
する(hx、by)と(c x。
cy)間の距離の比 hratl  perimに対するaholeの比hr
at2  perimに対するbholeの比表2の計
算された変数について述べるに先立ち、第2A図につい
て述べておくことが役立とう。同図においては、参照番
号25が再び認識すべき仮想的な文字を表わす。番号3
2−0は、文字25の第1の最小制限矩形を表わす。本
発明によれば、第2の最小制限矩形32−1もまた、X
およびy軸の原点に対して15°回転して描くことがで
きる。
それぞれ次の最小制限矩形に対して15°時計方向(あ
るいは、反時計方向)に回転された更に4つの最小制限
矩形(図示せず)もまた描くことができる。6つの最小
制限矩形はそれぞれ、異なる中心と、異なる高さと、異
なる巾とを持つことができる。clen(0)は第1の
最小制限矩形32−Oの高さを表わし、clen(7)
はこの最小制限矩形の巾であり、clen(2)は第1
の回転された最小制限矩形32−1の高さ、clen(
8)は矩形32−1の巾・・・・・・・マとなシ、その
結果1組の変数c ten(0) ・−c fen(1
1)がP(x、y)の6つの全ての回転された最小制限
矩形の2つの直交する辺部の長さを表わす。
cprd(0)、card(1) ・・−・−cprd
(5)は、P(x、y)の6つの最小制限矩形の面積で
ある。
cdiv(Q)・・・・・・cdiv(5)は、それぞ
れそのより長いclen値で除した前記矩形のより短い
clen値と等しい6つの最小制限矩形の各々の縦横比
であり、その結果cdiv(0〜5)の全ての値は1よ
シ小さいかあるいは1と等しい。
変数cxcp(0)・・・・・・c xc p (5)
は、各最小制限矩形の6つの中心点のX座標である。c
ycp(0)・・・・・・cycp(5)は、各最小制
限矩形の、6つの中心点のy座標である。cxは6つの
最小制限矩形の中心点の平均X座標であり、cyは6つ
の最小制限矩形の中心点の平均y座標である。cx、 
 cyは、本文においては文字の中心点即ち中心として
用いられる。15の変数cdist(0)・・・・・・
cdist(14)は、6つの最小制限矩形の中心点間
の15の存在し得る距離を表わす。cdsumは、この
6、つの隣接する(回転角度に関する)最小制限矩形の
中心点間の距離の和に等しく、これは中心点26−0.
26−1等により定義される第2A図の矢印25Aによ
って示される多角形の周囲の長さである。
列xproj (ip)は、(第7図に関して説明され
るように)px(ip)に設定される。同様に、ypr
oj (ip)列は第7図においてpy(jp)に対し
て設定される。このため、xproj(ip)およびy
proj(ip)は、それぞれ文字の最も左上のピクセ
ルから反時計方向に見た周ピクセルのXおよびy座標列
である。ptan(ip)は第7図においてPD(ip
)に設定される方向コード列であシ、このため、隣接す
る周ピクセル間の方向列となる。
文字10の各周囲点nperimからの距離のprad
(ip)は、この文字の中心点(これもまた第2B図に
おいて番号26によシ識別される)から前記周囲点まで
に対する。例えば、距離のp r ad (0)、pr
ad(1)およびprad(2)は、第2C図において
矢印34−0,34−1および34−2により示される
。対応する周囲点は、第2B図において点33−0.3
3−1.33−2によって示される。xproj(0)
、xproj(1)およびxproj(2)はそれぞれ
周囲点33−1.33−1および33−2のxq標であ
る。yproj(0)、yproj (1)およびyp
roj (2)はこれら同じ3つの周囲点のy座標であ
る。prmaxは、その全周における文字25の半径3
4−0.34−1・・・・・・等のどれかの最大長さで
あり、即ちprad(ip)の最大値である。plen
(ip)は、nperimの周囲点33−0.33−1
・・・・・・33の各々の次のものまでの距離の列であ
る。この距離は、対応するpn(ip)がそれぞれ偶数
か奇数のいずれであるかに従って1であるかあるいは2
の平方根である。表2のこの部分における残りの計算さ
れた変数は、残りのフローチャートを参照することによ
シ最もよく理解することができよう。
本発明の再サンプリング手法については、この再サンプ
リング法の概要を述べるフローチャートを参照すれば最
もよく理解されよう。フーリエ係数については、これら
の式を示すフローチャートを参照することによシ最もよ
く理解されよう。
計算された変数環(O〜7)は、それぞれ同じ半径の増
分を持つ8つの中心円環の1つを表わす。
このことは第2C図を参照することによシ理解すること
ができ、同図においては参照番号25が再び認識される
べき仮想的な文字を表わす。第2図におけるように、y
軸およびy軸はそれぞれ番号11および12により示さ
れる。文字の中心は、参照番号26により示される。中
心点26から各周ピクセルまで引かれた半径の最大値p
rmaxは、矢印31により示される。8つの同心円2
7−0、27−1・・・・・・27−7が、8つの円環
を形成するように中心26の周囲に描かれる。各環状変
数の値は、その周囲に文字におけるピクセルの総数であ
るnpixによシ前記環が描かれる文字のP (x。
y)の暗ピクセルの数に等しい。
各々が15°の角度に対する24のパイ形のスライスは
、参照番号30−0.30−1・・・・・・30−23
によって示される。第1のスライス30−0は、中心点
26を通る水平軸28に対し−7,5°の角度をなす半
径29−1と、軸28に対し+7.5゜の角度をなす半
径29−1とにより定義される。
番号29−2および29−23は、第2C図に示される
ように他のスライスを包囲する。各スライス変数の値は
、その周囲でこのスライスがnpixにより分割された
状態で示される文字P(x、y)の暗ピクセル数に等し
い。変数hx、 IIYshdist、 hratlお
よびhrat 2は、第2D図に関して理解することが
できよう。ここで第2D図によれば、「8」の形状にお
ける文字25は大きな穴35と小さな穴36とを持つよ
うに示される。(英数字は3つの種別、即ち穴のないも
の、1つの穴を持つものおよび2つの穴を持つものに該
当する。)番号37で示される点hx、byは、その境
界に関して最も大きな穴35の中心円環である。前のよ
うに、文字25の中心は番号26により示される点Cx
X Cyである。hdistは線39により示される最
大半径prmaxで切られた第2D図の@38によシ示
される最も大きな穴の中心円Jj137と文字の中心2
6との間の距離である。hratlは、文字の周囲pe
rimに対する境界長さを制限する最も大きな穴35の
比である。
hrat2は、文字の周囲長さperimに対する比較
的小さな穴36の制限穴境界長さの比である。
hratlおよびhrat2はまた、手で薔いたrKl
の如き文字に現われ得る「ノイズ穴」間を見分ける際に
非常に有効であり、このようなノイズ穴と第2D図の「
8」における如き意図された穴との間を見分ける方法を
提供する。
特徴抽出プログラムについて詳細に述べるに先立ち、最
初に本発明の特徴抽出システムが包含される文書走査シ
ステムの構造を示す図である第21図を参照することは
役立とう。第21図においては、スキャナ2が手書き文
書lを走査し、ノイズ・フィルタ2Aによシフィルタさ
れるピクセルを生じるが、このフィルタ出力はランレン
グス・工゛ンコーダ2Bに対して送られる。このランレ
ングス・エンコーダ2Bは、図面lにおいて走査された
対象物の形態と対応する方法で配列された粗のランレン
グス即ち水平方向のスライスからなる「対象物」に形成
される粗のランレングスを生じる。対象物分類装置3B
が、大きさその他の幾何学的特性から、対象物が1つの
文字として分類されるに充分に小さいかどうかを判定し
、もしそうであれば、この対象物の粗のう/レングスを
ランレングス・デコーダ4Aに対して送シ、これが対象
物のランレングスを再びピクセル像、即ちP(x、y)
に変換して、mXXmyおよびnpixを計算する。次
いで境界追跡装置4BがP(x、y)について演[痺し
、表1に示される残りの入力変数を生成する。
本発明の特徴抽出システムは第21図において参照番号
5により示され、第1図および第1A図に示され表2に
含まれる計算された中間変数および抽出された特徴を生
じる。抽出された特徴は、判断ツリー分類装置6Aへ送
られ、その出力が規則に基く文字文脈ルーチン6Bに送
られ、これからフォーマツタ7へ送られ、その出力はI
BM社のPC−ATコンピュータ、キーボード、高解像
度グラフィックス・モニター、高解像度プロッタ、ハー
ドディスクおよび他の適当なハードウェアを含むワーク
ステーション8に対し編集のためロードされる。
第1図を除く第21図に示された全てのブロック、スキ
ャナ2およびワークステーション8は、多数の6802
0マイクロプロセツサおよび適当なメモリーを含むグラ
フィックス・プロセッサ8Aに含まれる。
次に第1図においては、サブルーチンの名称はブロック
内に含まれ、大文字により表わされる。
構成文字で表わされる計算された列の後に京が付される
と、第16図のRFOURIERサブルーチンが実行さ
れてこの列の組をなす8つの正規化された調和係数を計
算し、第17図のサブルーチンC0RRELが実行され
てn個の要素を持つ前記列の組をなすn個の正規化され
た自己相関関数を計算する。小文字によシ表わされる計
算された変数列の後に十が続く時は、第18図のサブル
ーチンMOMENTが実行されて第1A図に示される如
き前記列の平均、分散、歪みおよびとがりを計算し、第
19図のサブルーチン5ORTが実行されて前記列の予
め定めたソート操作およびノートされた要素の種々の算
術的組合せを実施する。
第1図においては、第1図または第1A図のいずれかに
下線を付記した計算された変数または変数列の特徴抽出
が行なわれ、この特徴が文字の認識機能を行なう前記の
統計的判断ツリーに対して与えられる。モーメントおよ
びソート変数は、後で説明するようにスケール因数によ
る除算が行なわれ、大きさの不変性を保証する。
第1図においては、入力変数px(ip)、PY(ip
)、PD(ip)、nperimおよびperimがサ
ブルーチンDOCOHに対する入力変数である。このサ
ブルーチンDOCONは、第2B図における文字25の
如き文字の周囲に6つの最小制限矩形を有効に描出し、
各最小制限矩形は前の矩形に対して15°回転されて、
0°、15°、30’、45°、60°および75°の
方位を持つ6つの最小制限矩形が生じる。
出力変数(fen(0〜11)、cprd(0−5)お
よびcdiv(0〜5)が第3図乃至第6図のサブルー
チンDOCONにより生成される。第16図の実フーリ
エ変換サブルーチンがclen、cprdおよびcdi
v列について演算して、抽出された特徴であるclco
ef(1〜4)、cpcoef(1〜2)およびcdc
oef(1〜2)の正規化された調和係数を生成する。
また、第17図のサブルーチン自己相関操作がこの同じ
列について演算して、拡張された特徴であるclcor
(1〜11)、cpcor(1〜5)およびcdcor
(1〜5)の正規化された自己相関を生成する。
ブロック11のサブルーチンDOCONはまた、cdi
tt(0=14)、exおよびcy変数およびcdsu
mの特徴を演算する。また、clen。
cprd、cdivおよびcdist列がサブルーチン
MOMENTおよび5ORTによシ演算され、その出力
は次いで区分されて第1A図に示される如き抽出された
特徴を生成する。
入力変数px(ip)、py(ip)、pD(ip)、
nperim、perimおよび計算された変数cxお
よびcyが第7図のサブルーチンDOPERIMKより
演算されて特徴が抽出される文字の周囲の点の分析を行
なう。サブルーチンDOPERIM12は%  xpr
oj(”ip)、yproj(ip)、p r a d
(ip)、ptan(ip)およびplen(ip)列
を計算する。
DOPERTMはまた、DORADおよびDOHOLE
により用いられるp rma x変数を計算する。
各々が特徴が抽出される文字の境界における多数のピク
セル数と等しい値の数を含むxprojおよびypro
j列が、第1図のブロック14に示される如きサブルー
チアFSAMPによシ演算され、このサブルーチンがx
projおよびyprojを「再サンプル」してnpe
rimから64までの点数を減少(あるいは増加)シ、
これによりx s amp(0−63)列およびysa
mp(0〜63)列を生成する。はとんどの場合、この
64個の再サンプルされた点は抽出された特徴の精度を
χ質的に損うことなく周ピクセルの元の数からの非常に
大きな減少を表わす。次に、第9図の双対複素フーリエ
変換のサブルーチンが、XSampおよびysampに
ついて一緒に演算して、2組の8つの調和係数を生成す
る。これらの調和係数の各々は、この時これが帰属する
組をなす8つの調和係数の和でこれを除すことにより第
1O図において正規化され、次いでその平方根を求める
ことによシ、大きさが不変の回転が不変の調和係数列c
coef(1〜8)およびdcoef(1〜8)を生成
する。
DOPERIMによシ生成されるprad(ip)およ
びptan(ip)列はそれぞれ第1図のブロック24
に示される如き「媒介変数再サンプリング」サブルーチ
ンP F S AMPにより演算され、plen(ip
)を用いて各々が64個の点を持つrsamp(0〜6
3)列およびtsamp(0=63)列を生成する。こ
のサブルーチンPFSAMPilた、ptan(ip)
列について演算する時tnorm(0〜63)列を生成
する。第16図の突形フーリエ変携サブルーチンは、r
sampおよびtnorm列について演算して、rco
ef(1〜8)およびtcoef(1〜8)正規化調和
係数を生成し、これが抽出された特徴である。また、第
17図の自己相関サブルーチンは、これらの走査された
列について演算して、rcor(1〜63)およびtc
or(1〜63)醇ヒn>関を生成し、これが抽出され
た特徴である。また、rsamp列がサブルーチンMO
MENTおよび5ORTにより演算され、その出力は次
に区分されて第1A図に示される如き抽出された特徴を
生成する。
tsamp(0〜63)列がブロックz2に示される如
き第12図のサブルーチンDERIVにより演算されて
、tcLiff(0〜63)列を生成する。
この列は、第1図のブロック23に示される如き第13
図のサブルーチンHILO8UMにより演算されて、t
hisumおよびtlosumを生成するが、これらは
認識されるべき文字の顕著な凸凹性を表わす。この列は
また、サブルーチンMOMENTおよび5ORTにより
演算され、その出力は区分されて第1A図に示される如
き更に他の抽出された特徴を生成する。
第1図のブロック30により示される第15図のサブル
ーチンDORADはP(x、y)およびnpixおよび
prmaxについて演算して、円環(0〜7)列および
スライス(O〜23)列を生成する。円環(0〜7)列
はそれ自体抽出された特徴である。第16図の尖形フー
リエ変換サブルーチンは、前記スライス列について演算
して、抽出された特徴である5coef (1〜6)正
規化調和係数を生成する。また、第17図の自己相関サ
ブルーチンはスライス列について演算して、抽出された
特徴である5cor(1〜23)正規化自己相関関数を
生じる。円環列およびスライス列はサブルーチンMOM
ENTおよび5ORTにより演算されて、@IA図に示
される如き抽出された特徴を生成する。
第1図の参照番号33で示される第20図のサブルーチ
ンDOHOLEは、HX(ih)、HY(in)、nh
ole、ex、cyおよびprmax変数について演算
してhdistの抽出された特徴を生成し、またaho
le、bholeおよびperim間に簡単な比をとっ
てhratlおよびhrat2の抽出された特徴を計算
する。
次に、個々のサブルーチンについて述べることにする。
第3図においては、サブルーチンDOCONが、各々が
前のものに対して15°回転した文字の6つの仮想的な
最小制限矩形の種々の特性を生成する。第2A図におい
て示される32−0および32−1により典型化される
如き最小制限矩形は実際には「描かれる」ものではない
が、これらを視覚化することがその結果計算された変数
を理解する上で役立ち得る。サブルーチンDOCONは
第3図乃至第6図からなっている。
基本的には、第3図の目的は、考察の結果縁形および凹
状の周囲点を除外することにより、最小制限矩形の組を
な−す4つの接触周囲点に対して同様に候補となる第2
A図の25の如きある文字の全ての周ピクセルを見出す
ことにある。第4図の目的は各最小制限矩形の組をなす
4つの接触する周囲点を見出すことにあり、第5図の目
的は各最小制限矩形の中心点、巾、面積および縦横比、
ならびに平均中心点を見出すことにある。最後に、第6
図は、最小制限矩形の6対の中心点間の距離と、これら
中心点により形成される多角形の周囲の長さとを計算す
る。
サブルーチンDOCONは、ブロック50において開始
し、文字の前のピクセルから最も左上のピクセルへの方
向である値PD(nperim−1)に対する前の方向
変数pctを初期化する。例えば、第2A図においては
、番号23Aは文字の最も左上のピクセルであり、点2
3Bは前の(nperim−1)番目のピクセルの位置
である。
次いでこのサブルーチンはブロック51へ進み、周囲の
標!RipをOに初期化し、またcpi列の標識Cを0
に設定する。このcpi列は、凸のピクセル標識列と呼
ぶ。次いで、サブルーチンはブロック52へ進み、その
時の方向変数cdf、PD(ip)に設定する。
周囲のピクセル列px(ip)およびPY(ip)は周
囲のXおよびX座標の全てを含む。第3図は1つの新ら
しい列を充填する方法を提供し、これにおいてはどれか
の最小制限矩形に接触するための適当な候補であるピク
セルを指示するために、凸のピクセル標識列即ちcpi
(c)列がipの代りK PXおよびPYの周ピクセル
列の標識として用いることができる。
第3図のサブルーチンはブロック52から判断ブロック
53へ進んで、(cd−pd)が−4よシ小さいかある
いはこれと等しいかを判定する。もしこの判定が肯定で
あれば、このことは文字の周囲が一回以上方向0を通る
ように充分な累積角度にわたって追跡されたことを意味
し、凹であることを維持するためブロック54に示され
る如くその時の方向cdを8だけ増分することを必要と
する。もしブロック53の判定が否定ならば、サブルー
チンは判断ブロック55へ進み、その時の方向(cd 
−pd )が4よシも大きいかどうかを判定する。もし
この判定が肯定ならば、このことは文字の周囲が一回以
上方向0を通るように正の充分な累積角度にわたって追
跡されたことを意味し、凸であることを維持するために
ブロック56に示される如くその時の方向cdを8だけ
減分することを必要とする。もしブロック55の判定が
否定ならば、プログラムは判断ブロック57に進み、そ
の時の方向cdが前の方向paよりも大きいかどうかを
判定する。もしこの判定が肯定ならば、このことは、ブ
ロック57の否定的な判定によシ示されるように、周囲
のその時Ω部分が線形もしくは凹ではなく凸であること
を意味する。もし周囲のその時の部分が凸であるならば
、凸のピクセル標識列がブロック58におけるその時の
周ピクセルの数であるipに設定される。このcpi標
Rcはブロック59において1だけ増分される。
次いでサブルーチンは判断ブロック60進み、その時の
ピクセルが文字の最後の周ピクセルであるかどうかを判
定する。この判定は、判断ブロック60の否定的な判定
と対応する。もしループが完了しなければ、サブルーチ
ンはブロック6oからブロック61へ進み、前の方向p
aをその時の方向cdに設定し、次いでブロック62へ
進んでピクセルの標識ipを1だけ増分し、ブロック5
2へ戻って継続する。ブロック63においては、サブル
ーチンは凸のピクセル・カラン)cpnumをCに設定
し、ラベルAを介して第4図のサブルーチンへ進む。
第4図においては、最初のステップは、ブロック70に
示されるように回転標識iを0に初期化することである
 この回転標識は、上記の6つの最小制限矩形の6つの
異なる回転を記録し、文字25の周囲の6回の15°の
回転を記録し、結果として得られる最小制限矩形の測定
の組を記録する。ブロック71においては、サブルーチ
ンはXおよびX座標の最小のxminおよびyminを
外ならぬ正の値に初期化し、XおよびX座標の最大値x
maxおよびymaxを外ならぬ負の値に初期化する。
次にサブルーチンはブロック172へ進み、90’の回
転標識jを(i+6)に設定し、角度θを(111π/
2)/6に設定するが、ここでπ=3.14.11は乗
算を表わすため用いられる。
サブルーチンは次いでブロック73へ進み、標識cpi
をOに初期化し、ブロック73Aへ進んでその時のX座
標をx=PX(cpi(c))に設定し、その時のX座
標をy=PY(cpi(c))に設定し、次にブロック
74へ進む。
2つの回転標識iおよびjを提供する目的は、回転毎に
、2つの最小制限矩形の長さ、即ち最小制限矩形の垂直
長さ即ち高さおよび最小制限矩形の水平長さ即ち巾がそ
れぞれ長さの列の要素clen(i)およびclen(
j)に格納されるようにすることである。(下記のブロ
ック82も参照)ブロック72においては、回転標識i
は増分され、θもまた15°だけ増分される。
ブロック73A、74.75.76および77は、回転
したX座標および回転したX座標の最小値および最大値
を決定するために、θの増分の後に文字の周囲における
各候補の凸の点を調べるループを構成する。ブロック7
4においては、サブルーチンは回転したX座標xrを下
式の値即ち、xr=x来cos(θ)−y*5in(θ
)に設定し、また回転したy座標yrを下式の値即ち、 yr=x*5in(θ)+y奈cos(θ)に設定する
上記の2つの式は、点X% Yを原点(0,0)の周囲
で点(xr、 yr)まで有効に回転させるよう作用す
る。
次いで、サブルーチンはブロック75へ進み、xmin
をxrおよびxminの前の値の小さい方に設定するこ
とによシ回転された対象物の極値を調べ、yminをy
rおよびyminの前の値の小さい方に設定し、xma
xをxrおよびxma xの前の値の大きな方に設定し
、ymaxをyrおよびyma xの前の値の大きな方
と等しく設定する。次に、プログラムはブロック76へ
進み、凸のピクセル初期化列1ndex  cが凸のピ
クセル・カウント(cpnum−1)よシ小さいかどう
かを決定する。
もしこの決定が肯定ならば、更に多くの候補の凸の周ピ
クセルがあり、従ってサブルーチンはブロック77へ進
み、Cを1だけ増分し、ブロック73Aへ戻る。さもな
ければ、サブルーチンはラベルCを介して第5図へ進む
第5図のブロック80においては、サブルーチンは回転
した中心点の座標xrcを(xmax+xmin)/2
に設定し、回転した中心点の座標yrcを(ymax+
ymin)/2へ設定する。サブルーチンは次にブロッ
ク81へ進み、回転iに対する最小制限矩形の中心点の
X座標であるcxcp(i)をxrc奈cos(θ) 
+yrc垂5in(θ)に設定し、その時の最小制限矩
形の中心点のX座標であるcycp(i)を−xrc*
5in(θ) + yrc*cosin(θ)に設定す
る。上記の2つの式は、点xrc。
yrcを原点(0,0)の周囲て点cxcp(i)、c
ycp(i)まで時計方向に有効に回転させるよう作用
する。
サブルーチンは次にブロック82へ進み、巾clen(
i)を(xmax−xmin)に設定し1高さclen
(j)を(ymax−ymin)へ設定する。次いでサ
ブルーチンは、ブロック83において、cprd(i)
をclen(i)*clen(j)に設定する。
サブルーチンは次にブロック84へ進み、その時の最小
制限矩形について巾clen(i)が高さclen(j
)より小さいかどうかを判定する。もしこの判定が肯定
ならば、サブルーチンはブロック85へ進み、clen
(i)/clen(j)の比と等しい縦横比cdiv(
i)を計算する。さもなければ、サブルーチンはブロッ
ク86へ進み、縦横比cdiv(i)を反応の比cle
n(j)/clen(i)に設定して、縦横比が常に1
より小さいかあるいはこれと等しくなるようにする。
いずれの場合も、サブルーチンはブロック87へ進み、
回転の標識が5より小さいかを判定する。
もしそうであれば、プログラムはブロック86へ進み、
iを増分し、ラベルBを各して第4図のブロック71へ
戻って別の15°の回転のため上記の過程を反復する。
さもなければ、サブルーチンはブロック98へ進み、c
xを6のcxcp(i)の平均値に設定し、またcyを
6のcycp(i)の平均値に等しく設定する。サブル
ーチンは次にラベルDを介して第6図へ進む。
この時、サブルーチンは文字25の回転を完了して6つ
の最小制限矩形を生成する。結果としての6つの中心点
に関する変数は次に計算される。
第6図のブロック90における最初のステップは、最初
の中心点標識11を0に初期化すること、およびcdi
stの標識dをOに初期化することである。このcdi
stの標識dはOから14の15の値をとシ、これは回
転した最小制限矩形の全ての対の6つの中心点間に引く
ことができる線の数である。次に、サブルーチンはブロ
ック91へ進ミ、2番目の中心点標識i2′fr、(i
l+1)に初期化する。次いで、サブルーチンはブロッ
ク92へ進み、cdist(d)を (cxcp(il) −cxcp(i2) )2+ (
cycp (1l)−cycp(i2) ) 2サブル
ーチンは次にブロック93へ進み、2番目の中心点標識
12が5より小さいかどうかを判定し、もしそうであれ
ば、このサブルーチンは12およびdを増加し、ブロッ
ク92へ戻ってcdist(d)に対する新たな値を設
定する。否定の判定がブロック3から得られ時は、サブ
ルーチンはブロック94へ進み、最初の中心点標識11
が4よシも小さいかどうかを判定し、もしそうであれば
、11を増加してブロック91へ戻る。否定の判定がブ
ロック95から得られる時は、サブルーチンはブロック
97へ進む。実際に、判断ブロック93.94によシ供
される2つのループは、最初の中心点cx、cyから2
番目、3番目、4番目および5番目の中心点までの距離
を測定し、次いで2番目の中心点から3番目、4番目お
よび5番目の点までの距離、というようにあシ得る全て
の対をなす6つの中心点間の距離が測定さ−れることに
よりcdist(0〜14)の値を生じるまで測定する
よう作用する。
ブロック97においては、サブルーチンは最初の中心点
の標sfa ilをOに再び初期化し、また変数cds
umもOに初期化する。次いで、サブルーチンはブロッ
ク98へ進み、2番目の中心点の標識12を(il+1
)(mod6)に設定する。サブルーチンは次にブロッ
ク99へ進み、隣接する制限矩形の中心点間の全ての距
離の和であるcdsumを下式の量、 (cxcp(i)−cxcp(j) )2+(cycp
(i)−cycp(j) またけ増分し、次いでブロッ
ク100へ進み、11が5よシ小さいかどうかを判定す
る。もしそうであれば、サブルーチンは11を増分し、
ブロック98へ戻り、また他のブロックに戻る。
次に第7図においては、サブルーチンDOPERIMが
DOCONと同じ周囲の情報、即ちnperim。
perim、 PX(ip)、py(ip)およびpn
(ip)列、ならびに前にDoCONにより計算された
cx、cyについて演算する。ブロック105において
は、前の方向変数paが0に初期化され、始動方向変数
sdがPD(0)に初期化される(pd$”よびsdは
単にptan(ip)列を生成する際に用いられるに過
ぎない)。次いでサブルーチンはブロック106へ進み
、周囲標識ip’)0に初期化し、次いでブロック10
7へ進んでxproj(ip)をpx(ip)に設定し
、またyproj (ip)をpy(ip)に設定する
。(上記のステップの理由は、整数から浮動少数点表記
への変換を許容することである)次に、ブロック108
においては、サブルーチンDOPERIMは中心cx、
cyから半径の長さを計算し、prad(ip)をこの
半径に等しく、即ちprad(ip)=  (PX(i
p)−cx)2+(PY(ip)−cy)2と等しく設
定する。
次ニ、サブルーチンは判断ブロック109へ進み、方向
PD(ip)が偶数および奇数のどちらであるかどうか
を判定する。もし偶数であれば、サブルーチンはブロッ
ク110へ進み、plen(ip)を1に設定するが、
これはこの時の方向が水平か垂直のいずれかであるため
である。もしこの時の方向が偶数でなければ、この時の
方向は対角であシ、サブルーチンはplen(ip)を
2の平方根に等しく設定する。いずれの場合でも、サブ
ルーチンはブロック112へ進み、この時の方向変数c
dをpD(ip)−8α に設定して、最初の方向が常
に0になり、また偏りあるいは始動の方向が以降の方向
から差引かれるようにする。
次にサブルーチン、はブロック113へ進む。第7図の
ブロック113〜116は、第3図のブロック53〜5
6と正確に同じことを実行する。ブロック117におい
ては、サブルーチンはptan(ip)をこの時の方向
cdに設定し、また前の方向pctをその時のcdの値
に設定し、次いで判断ブロック118へ進み、このブロ
ックが前の手順が(nperim−1)の周囲点まで全
ての周囲点について行なわれたかどうかを判定する。も
しこの角度が否定ならば、即ち、もしこれ以上の周囲点
が残るならば、サブルーチンはブロック119へ進み、
周囲の標識ipを1だけ増分して、ブロック107へ戻
る。さもなければ、サブルーチンはp rma xをp
rad(ip)における半径の長さの最犬噴となるよう
に計算して戻る。
次に、特徴抽出ルーチンは第8図のサブルーチンFSA
MPに進む。このサブルーチンFSAMPば、文字25
の周ピクセル数であるnperim要素列について演算
する。サブルーチンFSAMPはこれらの列を「再びサ
ンプル」してこれらを64点で表わするが、これは充分
な精度であることが判った。周囲の点の数をこのように
一定の小さな数まで減じることにより、フーリエ係数、
モーメント等を鍔るため必要な計算時間を大幅に短縮し
て、フーリエ変換の計算のため格納された余弦および正
弦衣のアクセスを便利にする。(第8図においては\ 
xprojおよび)(samp変数を用いることのみが
示されるが、同じサブルーチンFSAMPがxproj
(ip)およびyproj (ip)について演算する
ため実行されることに注意すべきである。
もしサブルーチンFSAMPがyprojについて演算
するならば、変数ysampが用いられる。)第1に、
サブルーチンはブロック125へ進み、再サンプリング
−サイズ変数を釧Zeをnperjm/64に等しく設
定する。nperllTiの周ピクセル点が存在するこ
と、およびこれらを64の再サンプル点に変換すること
が望ましいこと、従ってこのサンプリングφサイズを6
4で除したnperimに等しく定義することが必要で
あることに注意。
次に、サブルーチンはブロック126へ進み、サンプル
和ssumを初期化し、またサンプル増分tsum’e
Oに初期化する。このサンプル増分tsumを用いて、
サンプル−サイズtsizei持つサンプルをカウント
し、5surnはこれらの値の和を表わす。
次にサブルーチンはバッファ127へ進み、xproj
の標識iおよびxsampの標識JをOに初期化する。
xproj傾識lはnperirn周囲点を経てカウン
トし、またxsamp標識1は64の再サンプル点eM
でカウントする。
次いで、サブルーチ/haブロック128へ進み、ts
umを1だけ増分し、またssumをxproj(i)
だけ増分する。
次に、サブルーチンは判断ブロック129へ進み、ts
umがtsizeより大きいかあるいはこれと等しいか
を判定する。もしこの判定が肯定ならば、このことは、
iが別のxsampサンプルの形成のため必要な境界を
越えたことを意味する。従って、サブルーチンはブロッ
ク130においてtsizeだけtsum’i減じ、ブ
ロック131へ進み、サンプル和の残りsremをts
umxxproj(i)に設定する。この時サブルーチ
ンはブロック132へ進み、xsamp(j)を(ss
um−srem)/1size に設定し、ブロック1
34において1を1だけ増分し、判断ブロック129へ
戻る。もし判断ブロック】29の判定が否定ならば、サ
ブルーチンは判断ブロック135へ進み、xprojの
標r! +が(nperim−1)より小さいかどうか
を判定する。もしこの判定が否定ならば、このことは、
全てのnperimの周囲点が再びサンプルされたこと
を意味し−、サブルーチンは呼出しプログラムへ戻る。
もし、ブロック135の判定が肯定ならば、xproj
の標識iを1だけ増分し、ブロック128へ戻る。
(yproi列がFSAMPにより演算さnつつあるな
らば、xprojはブロック127においてyproi
で置換され、xsampはブロック127においてy 
s ampにより置換される。xprojはブロック1
31においてyprojにより置換され、xsampは
ブロック132においてysampにより置換される。
) おそらくは、ザブルーチンFSAMPの動作については
、第8A図を参照することによシ更に理解することがで
きるが、同図においては、参照番号139がxproj
の標識iに対してプロットされたxproj(i)列を
表わす。もし垂直線]、39Bと垂直軸】39Cとの間
の距離がtsizeであれば、xsamp(1)はts
ize線139BとOの軸139Cとの間のカーブの下
の面積である。これは、第8図のブロック1;32にお
いて計算さ9.たlである。
この値は、水平@139Dにより衣わされ、この水平線
はnprrim/64の周ピクセルと対応する許容され
る64への1つの再サンプル点を表わす。
もしブロック129においてtsumがtsizeより
も大きいことが判定されるならば、残りのsremは、
垂直線139 Aと139Bとの間のカーブ139の下
の面積で表わされ、垂直線139Aはこの場合tsum
を表わしている。量sremは1次の操作でブロック1
32において計算されるxsamp(2)に含まれ、t
sizeの2倍に等しい垂直線139Eまで延びるレベ
ル139Fによシ示される。
上記のサブルーチンは、もしnperimが64を越え
るならばnperimの周ピクセルを64の更に操作可
能なサンプル・サイズに正確に「縮減」し、またもしn
perimが64よシ小さければnperimピクセル
を64を生じるように「伸長」する。
第1図に示されるように、xsampおよびysamp
は共に第9図の双対複素形7−リエ変換サブルーチンに
よシ演算されるが、このサブルーチンはzsampおよ
びysamp列の2組の8つの調和係数を計算する。第
9図および第10図のサプルーチycDFOURIER
は最初にブロック140に進み、変数ccoefおよび
変数dcoefに対する標識である標facを1に初期
化する。次いでサブルーチンはブロック141へaみ、
X$ampおよびysampの標識11余弦の和xco
sおよびycos 、および正弦の和xsinおよびy
sinを0に初期化する。サブルーチンは次にブロック
142へ進み、このブロックが角度θをi*c*2/6
4に設定するが、これは64の点が文字の周囲の第1の
ピクセルから(nperim−1)番目のピクセルまで
の移動、即ち1サイクルを示すためである。
次に、サブルーチンはブロック143へ進み、xcos
をxsamp(i)秦cos(θ)だけ増分し、x:s
jnをxsamp(i)来5in(θ)だけ増分し、y
cos ’Frysamp(i)毫cos(θ)だけ増
分し、またψセンサインをysarnp(i)xsin
(θ)だけ増分する。
次に、サブルーチンは判断ブロック144へ進み、xs
ampおよびysampの標識iが63より小さいかど
うかを判定し、もしこの判定が肯定ならば、サブルーチ
ンの内部ループが未完了となり、従ってiは1だけ増分
され、サブルーチンはブロック142へ戻る。もし判断
ブロック144の判定が否定ならば、サブルーチンの内
部ループが完了し、サブルーチンはブロック146へ進
み、ccoef(c)ccoef(c)=(xcos+
ysin)2+ (ycos−xsin)”に設定し、
またdcoef(c)を dcoef(c)=xcos2+xsin2+ycos
2+ysin2に設定する。
次いで、サブルーチンはブロック147へ進み、cco
efおよびdcoe fの標識Cが8より小さいかどう
かを判定し、もしそうであれば、Cを1だけ増分してブ
ロック141へ戻る。もしCが8より小さくなければ、
サブルーチンは第10図のブロック148へ進む。
前に計算された係数ccoef(1〜8)およびdco
ef(1〜8)は、これらが文字の大きさに依存する「
粗の」係数である。このことは、大きさて依存すること
が小さな文字の比較的高い振幅の高調波を大きな文字の
比較的低い振幅の高調波から見分けることを不可能にす
る故、即ち両者が同じ大きさを持つことになる故に望ま
しくない。従来技術においては、高調波の係数を正規化
するための試みは第1の高調波の大きさあるいは全ての
高調波の大きさの和により係数を除すことであった。最
初の高調波の振幅のみによる正規化を行なうというこの
試みは、最初の高調波自体が有効な特徴となるという短
所を持ち、一般に、この特徴の情報内容が失われる故に
1つの有効な特徴で区分する即ち正規化することは望ま
しくない。
後者の試みの主な短所は、もし文字のノイズが非常に多
ければ、比較的高い次数のフーリエ係数が異常に高いも
のとなることである。
第10図について説明を続ければ、変数csumおよび
dsumはブロック148において8つの粗の係数の各
組の和に等しく設定され、CC0efおよびdcoef
の標識Cは1に初期化される。次にブロック49はcc
oef(c)k ccoef(c)=v’ccoef(c)/csumに
設定し、またdcoef(c)を dcoef(c)=v’丁:oef(c)/dsumに
設定する。このように、この方法は、大きさを二乗した
粗の係数の各々をこれが帰属する組をなす8つの高調波
係数の和により正規化し、次いで平方根を求めることで
ある。
第11図のPFSAMP媒介変数再サンプリング・サブ
ルーチンは、このサブルーチンがplen(ip)を用
いてサプルーチ:y prild(ip)およびpta
n(ip)について演算する点を除いて、第8図のサブ
ルーチンFSAMPと類似しておシ、その要素はxpr
oJ(ip)およびyproj(ip)列におけるよう
に等間隔になっていない。第11図においては、ブロッ
ク150および151はそれぞれ第8図のブロック12
5および126と同じである。
ブロック152ば、このブロックにおいてiがprad
標識でありかつjがrsamp標識である点を除いてブ
ロック127と類似し7ている。第11図のブロック1
53においては、tsumは長さplen(i)により
媒介変数により増分され、ssumは面積plen(i
)*prad(i)で増分される。第11図のブロック
154.155.158.159.160.161およ
び162は、それぞれブロック129.130.1昭、
134.135.137および136と同じものである
ブロック156においては、5relY1は面積tsu
m乗prad(i)に設定され、ブロック157におい
ては、r s amp (」)は(ssum−srem
)/1sizeになるよう計算される。
第11A図は、サンプルprad(i)がplen(i
)に従って不均等な間隔で隔てられる点を除いて第8A
図と同じものである。もし第11図のサブルーチンPF
SAMPがprad(ip)の代りにptan(ip)
について演算するならば、ブロック152におけるpr
adおよびrsamp(ip)はそれぞれptan(i
p)およびtsampにより置換される。tsampは
、実際には、区分された周囲の正接角度である。更にま
た、もしP F S AMPがptan(ip)につい
て演算する別の、ブロック163はブロック157と1
58の間に挿入され、tnorm(j)がtsamp(
j)  8来j/64に設定されることを示す。
「円度」の増分を除去することによりtsampを補正
するためにブロック163が付加される。これが何を意
味するかを理解するためには、tsamp  。
が」に対してプロットされる第11B図を参照されたい
。斜め線166は、もし示される文字が円166Aであ
るならばtsampを表わす。カーブ167は、もし文
字が「8の字」の形状168Bであるならば、tsam
pのプロットとなる。関数tsamp(j)は周期を持
たず、即ちOには回帰せず、従ってtsamp(j)の
フーリエ変換は不可能である。しかし、もし斜め線16
6が減算される、即ち「円度」の増分が量je8/64
を差引くことにより取除かれてtnorm(ip)を生
成するならば、tnorm(0〜63)の有意義なフー
リエ変換を第1図に示されるように計算することができ
る。
第12図は、tsa、mp(0=63)について平滑化
する微分演算を行なってtd i f f (0〜63
)列を生成するサブルーチンDERIVを示し、この列
はtsamp列の連続する平滑化された点間の差として
再サンプルされた方向コードにおける増分を表わす。以
降に述べるように、この情報は、特徴が抽出されつつあ
る文字の凸および凹の各部を評価する際に有効である。
これは、英数字セットが文字の凸性および菌性の太きさ
を分析することによっては一部は認識できない故に有効
である。
第12図においては、最初のステップは、ブロック19
0に示されるように平滑化和変数ssumt−最初の8
つのtsamp列の要素の和に初期化することである。
ブロック191においては、サブルーチンは小さな平滑
化標識jをOに初期化し、また大きな平滑化標識kを7
に初期化する。これは、実際には、移動平均が計算され
る8つの要素の「移動する窓」を確立する。次いでサブ
ルーチンはブロック192へ進み、tdiff(j)t
−ssum/8に設定する。サブルーチンは次にブロッ
ク193へ進み、ssumをt s amp (j )
だけ減分し、これによりこの項を窓から取払う。
次いで、サブルーチンはブロック194へ進ミ、大きな
平滑化標識kが64よシ小さいかどうかを判定し、もし
そうであればブロック195へ進み、ssumをtsa
mp(k)だけ増分し、これによりこの項を窓に加算す
る。もしkが64よりも小さくなければ、サブルーチン
はブロック195Aへ進み、その代り「丸め」のため5
Sun〕をtsamp(k−64)+8だけ増分する。
次に、サブルーチンは判断ブロック196へ進み、小さ
な平滑化標識jが63よシ小さいかどうかを判定する。
もしそうであれば、サブルーチンはブロック197へ進
み、jを増分し、ブロック192へ戻り、tdiff(
j)の新たな値、即ち移動平均tdiff(j)の新た
な値を計算する。もしブロック196の判定が平滑化ル
ープが終了したことであれば、サブルーチンはブロック
198へ進み、tdiffの標識iを1に初期化し、ブ
ロック199における別のループに入9、tdiff(
i)を(tdiff(i+1)−tdiff(i))に
リセットし、これにより方向のコード増分を計算する。
次にサブルーチンは判断ブロック200へ進み、tdi
ffの標識iが62よシ小さいかどうかを判定し、もし
そうであれば、iを増分してブロック199へ戻る。t
diff(i)列の最初の63点が計算された時、サブ
ルーチンはブロック200カラ否定の判定を得、ブロッ
ク202へ進み、丸めのためにtdiff(i)列の最
後の点即ち点tdiff(63)、の値を(8+tdi
ff(0)−tdiff(63))になるように計算す
る。実際には、tdiffは周囲の正接角の増分の列で
ある。次いでサブルーチンは戻る。
次に、特徴が抽出されつつある文字の菌性を分析する第
13図のサブルーチンHILO8UMKついて述べる。
このサブルーチンは、tsamp列からの周囲の方向コ
ードの平滑化された差を含むtdiff(i)列につい
て演算する。第13図のサブルーチンHILO8UMに
ついては、tdiff(i)が「8の字」の文字25に
対してプロットされている第14図を参照すれば理解が
助けられよう。波形213はtdiff(0〜63)を
示す。公差あるいは閾値である変数tolの2つの値、
即ち−1および+1に等しいtdiffもまた示される
点A、R,C,D、EおよびFは文字の凸性A1C,D
およびElおよび菌性BおよびFを識別するためカーブ
313において識別される。tdiffカーブにおいて
は凸性はピークとして現われ、菌性は谷として現われる
。第14図のカーブ213かち判るように、比較的高い
tol値+1の上の領域214Eは顕著な凸性を表わす
が、比較的小さなtol値−1の下の領域214Dは顕
著な菌性を表わす。
多重値tolは、特徴が抽出されつつある文字の菌性オ
よび凸性についての所要の情報レベルヲ生じるように実
験的に選定することができる。
第13図のサブルーチンHILO8UMは最初にブロッ
ク205へ進み、低いカウント変数1num。
低い和の変数1sum、高いカウント和変数hnum。
高い和変数hsumおよびtdiffの標識iを全て0
に初期化する。次いで、このサブルーチンは判断ブロッ
ク206へ進み、tdiff(i)のその時の値がto
lより小さいかどうかを判定する。もしブロック206
の判定が肯定ならば、サブルーチンはブロック207へ
進み、lnumを1だけ増分し、lsumをtdiff
(i)だけ増分し、判断ブ07り209へ進む。もしブ
ロック206の判定が不定ならば、サブルーチンブロッ
ク208へ進み、hunmを1だけ増分し、hsumを
tdiff(i)だけ増分し、判断ブロック209へ進
む。ブロック209はiが63より小さいかどうかを判
定し、もしそうであれば、サブルーチンはブロック21
0へ進んでiを1だけ増分し、ブロック206へ戻る。
さもなければ、サブルーチンはブロック211へ進み、
tlosumをtlosurn=(tol来1num−
1sum)/64に設定し、またthisumを thisum=(hsum−tol*hnum)/64
に設定して戻る。実際に、第14図における214Eの
如き凸の領域の区分和はこの和によって表わされ、また
菌性を表わす領域214Dの区分和はtlosumによ
り表わされる。
次に、第2Cに関し7て先に述べた如き円環およびスラ
イスを形成する第15図のサブルーチンDORADは、
文字のピクセルが如何にして円環およびスライスに対し
付加されるかを示している。
ブロック216においては、サブルーチンは円環区分因
数の変数rsizeを7.99 =7 p rma x
に記憶し、これによりどの半径も0乃至7の間の截頭整
数に区分する。次いでサブルーチンはブロック217へ
進み、全ての角度をO乃至23の間の截頭整数に区分す
るため、スライスの区分因数変数5sizeを23.9
9−/2πに設定する。
ブロック218においては、サブルーチンは全ての円環
(θ〜7)列をOに初期化し、また全てのスライス(0
〜23)列をOに初期化する。
ブロック219においては、サブルーチンはyを0に初
期化し、ブロック220へ運んでXを0に初期化する。
従って、初期化された円環およびスライスの変数は、サ
ブルーチンDORADが実行される時円環またはスライ
スが重った暗ピクセルが合計される数学的な積分値とし
て考えることができる。
次に、サブルーチンは判断ブロック221へ進み、P(
x、y)が1に等しいかどうか、即ちその時のピクセル
が暗であるかどうかを判定する。もしこの判定が肯定な
らば、サブルーチンはブロック222へ進み、Xをx−
cxに等しく設定しかつyをy−cyに等しく設定する
ことにより、第2A図において参照番号26で示される
中心点CX。
cyに関してXおよびy座標を変換する。
この時、サブルーチンはブロック223へ進み、円環初
期化rをrs ize x (x” +y”)の平方根
に等しく設定し、これにより同項標識を特定の文字のピ
クセルと文字の中心との間の距離に設定し、rsize
により乗じてrを0と7の間の整数になるよう打切る。
次いで、サブルーチンはブロック224へ進み、スライ
ス標R8を(−y/x )の逆正接に等しく設定し、こ
れによりこのスライス標識を特定の文字のピクセルおよ
びこの文字の中心を通って引布れた正のX軸とによ多形
成される角度に設定し、5sizeで乗じてSを0と2
3の間の整数になるよう打切る。サブルーチンは次ニブ
ロック225へ進み、円m (r)およびスライス(S
)を増加し、判断ブロック226に進み、もしXが回転
Oにおける最小制限矩形の巾であるmxよシ小さければ
、サブルーチンはXを増分して判断ブロック221へ戻
る。もしブロック226の判定が否定ならば、サブルー
チンは判断ブロック228へ進み、yが回転Oにおける
最小制限矩形の高さであるmyより小さいかどうかを判
定する。もしこの判定が肯定ならば、サブルーチンはy
を増分し、ブロック22へ戻り、さもなければ、ブロッ
ク230へ進み、円環(0〜7)およびスライス(0〜
23)inpixで除すことによシ区分してこれら変数
をOと1の間にさせて大きさが不変の状態にする。この
ように、文字列P(x、y)が線単位に走査され、暗ピ
クセル8つの定義された円環の適当なものおよび24個
の定義されたスライスの適当なものに加算される即ちこ
れに含められる。従って、8つの円環および24のスラ
イスの各々は、文字中の全ての暗ピクセルのある一部を
含む。
第1図に関して前に述べたように、スライス(0〜23
)列は回転不変性ではなく、そのため第16図のサブル
ーチンRFOURIER,第17図のサブルーチンC0
RREL、第18図のサブルーチンMOMENT、およ
び第19図のサブルーチン5ORTがスライス(0〜2
3)列について演算して、大きさの不変性および回転不
変性を生成する。
特徴抽出プログラムの実行におけるこの時点において、
全ての計算された変数列が生成されたことを知るべきで
ある。前述の如く、第16図のサブルーチンRFOUR
I ERおよび第17図のサブルーチンC0RREL、
および(または)第18図のサブルーチンMOMENT
および第19図のサブルーチン5ORTは、第1図に示
される如くそれぞれ計算された変数列の後にa来または
十が続く場合における別の特徴を計算するため用いられ
た。第16図乃至第19図においては、rxyzJはn
項のxyz(0)−= xyz(n−1)のこれらの列
のどれかを指示する。第16図、第17図、第18図お
よび第19図のこれらのサブルーチンにより生成される
全ての特徴は、無論回転不変性のものである。サブルー
チンRFOURIERおよびC0RRELにより生成さ
れる特徴は、これらサブルーチン内で行なわれる正規化
の故に大きさ不変性を呈する。サブルーチンMOMEN
Tおよび5ORTにより計算される変数に対する大きさ
の不変性は、以下に論述するように適当な基準化因数で
除すことにより達成される。
次に、第16図の突形フーリエ変換サブルーチンについ
て記述する。これは、xsampおよびysampの代
りに、単一の列xyz、即ちclen。
cprd、cdiv、rsamp、tnormおよびス
ライスの1つについて演算し、かつccoefおよびd
coefの代りに、単一のcoef列、即ちclcoe
f(1−4)、cpcoef(1−2)、cdcoef
(1−2)、rcoef(1−8)、tcoef(1−
8)および5coef(1−6)をそれぞれ生成する点
を除いて、第9図および第10図の複素形フーリエ変換
サブルーチンと全く同様である。フーリエ変換のための
サブルーチン16の手法は当技術においては周知であシ
、本文においては完全を期すためにのみ含まれる。第1
6図のブロック170は、iがxyzの標識であり、c
osineおよび5ineの和がxcos  ycos
、xsinおよびysinの代りにrcosおよびrs
inである点を除いてブロック141と同じである。第
16図のブロック172は、第9図のブロック142と
同じものである。ブロック173に示される計算は、ブ
ロック143に示される計算の半分からなる。ブロック
176における計算は、ブロック146に示される2つ
の計算よりも簡単である。最後に、第16図のブロック
180〜184に示されたrsumを用いる正規化は、
C5umおよびdsumを用いる第10図のブロック1
48〜149Bに示される2つの正規化と同じ計算であ
る。
次に、第17図の自己相関サブルーチンについて述べる
。自己相関のためのサブルーチン17の手法は当技術に
おいては周知であり、従って本文においては完全を期す
ためにのみ含まれる。第17図においては、サブルーチ
ンCORRELu最初に全てのあシ得る相関acor(
0−(n−1))をOに初期化する。次いで、サブルー
チンはブロック236へ進み、相関標識cf、oに初期
化し、Xyz標識iをOに初期化することにより、ブロ
ック237において外側のループに入る。サブルーチン
は次にブロック238において内部ループに入シ、変位
されたxyz標識jを(i+c)modnに設定する。
次にサブルーチンはブロック239へ進み、acor(
c)をxyz(i)棄xyz(j)だけ増分する。
もしiが判断ブロック240により決定される如き(n
−1)よりも小さい場合におけるようにこのループが未
完了であるならば、サブルーチンはブロック241へ進
んでiを増分し、ブロック238へ戻って内部ループを
継続し、これが相関変数acor(C)の計算を続ける
。このループが完了すると、相関変数acor(c)は
判断ブロック242へ進み、相関標RCが(n−1)よ
シ小さいかどうかを判定し、もしそうであれば、ブロッ
ク243へ進み、Cを増分し、ブロック237へ戻って
外側のループを続行する。外側のループが完了すると、
サブルーチンはブロック244へ進み、値a c o 
r(0)、変位しない自己相関、あるいはxyz列の二
乗の和で各項を除すことにより列acor(1−n−1
)の計算された値を正規化して戻る。
この段階において、第9図におけるブロック147の後
のccoef(1−8)およびdcoef(1−8)の
ように、coef(1−8)が粗の係数である。
ccaef(1−8)の要素は、第10図においてcc
oe f (1−8)およびdcoef(1−8)がブ
ロック148乃至149Bにより区分されると同じ方法
で、第16図のブロック180乃至184によって区分
される。
第18図の一次元モーメントのサブルーチンは単に周知
の技術に従ってモーメントを計算し、また完全を期す目
的のみのため本文に触れる。第18図においては、列に
おける要素の数により列の全ての要素を除すことにより
、列の平均がブロック250において計算される。ブロ
ック251においては、分散、歪みおよびとがl)が従
来の周知の式を用いて計算される。第19図においては
、1つのブロック246が、列が昇順(あるいは、使用
可能な他の予め定めた順序)で要素に分類されることを
示している。当業者は、列を分類するルーチンを容易に
提供することができる。一般に、新たな特徴は分−類さ
れた列からの組をなす要素の算術的な組合せによって生
成することができる。経験的には、最小および最大の要
素を分離し、その和、差、積および(または)比を求め
ることが有効である。また、固定数の隣接する要素を加
えることにより列を減らすこと、またその和、差、積お
よび(または)比を求めることが、別の有効な特徴を生
成することを発見し7た。
サブルーチンMOMENTおよび5ORTから生じるあ
る計算された変数は、大きさおよび分散の抽出された特
徴を得るため適当な区分因数により区分される必要があ
る。列clen、cdistおよびrsampは長さ即
ち距離を含み、文字の直組的距離に比例する。そのモー
メントおよび分類された要素を、perim即ちcle
nおよびpradの列の最小、最大あるいは平均、ある
いはcprd列の最小、最大または平均の平方根のよう
な線形値によりそのモーメントおよび分類された要素を
区分することが、この線形値への依存度を有効に排除す
る。列cprdは、文字の二乗した線形次元に比例する
面積を含む。そのモーメントおよび分類された要素をp
erim”の如き面積値、(fenおよびprad列の
最小、最大または平均、あるいはcprd列の最小、最
大または平均の二乗により区分することによシ、このよ
うな線形二乗された依存度を有効に排除する。残りの列
cdiv、 tdiff。
円環およびスライスは既に大きさが不変性であシ、その
モーメントおよび分類された要素のこれ以上の区分は不
要である。
第20図はおいては、サブルーチンDOHOLEが変数
hxおよびhyをブロック266における式により表わ
される平均値に設定し、また最も大きな穴の中心軌跡h
xと文字の中心との間の距離であるhdistを設定し
、これにより第2D図に示された最大半径長さprma
x38で除した長さを計算する。変数hratlおよび
hrat2は、それぞれブロック268に示されるよう
に比ahole/perimおよびbhole/per
imと等しく設定される。
上記の抽出された特徴の組の大半は、文字の認識に対す
る上記の「構造的な」試みの場合よりも文字構造におけ
る変動によシ生じる「ノイズ」に対する不感性が更に大
きいことが発見された。この改善されたノイズ不感性は
、「ノイズ特徴」が実際にノイズであるか、あるいは認
識される文字の真の一部であるかを確認することがしば
しば難しい故に生じるように思われる。この問題は、従
来の構造的な文字の認識手法において要求される種々の
閾値レベルの設定において大きな困難を生じる。ノイズ
は、構造的なスケルトンにおける新らしいセグメントと
して現われ、文字の認識に対する構造的な試みに欠かせ
ない文法、規則ペースあるいは判断ブロックを大幅に拡
張することを必要とする。更にまた、周知の正中軸変換
法を介してスケルトンを得ることは、これまでに述べた
特徴の抽出よシもコンピュータ経費的に遥かに高いもの
になる。
上記の特徴抽出システムにおいて、認識される文字のピ
クセル・マスの代りにこの文字の境界を用いることは、
円環およびスライスの特徴の計算を除いて、所要の計算
回数を大きく減少させながら、特徴の大半を取得する上
で有効かつ充分であった。フーリエ変換が計算される固
定数の列の要素を生じる再サンプリング法は、正弦値お
よび余弦値を得るため少数の組の予め計算された三角関
数表を用いることを容易にする。しかし、得られた回転
不変性の円環およびスライスの特徴は、他の境界領域に
基く特徴に比して非常に有益であり、従来の統計的な文
字認識の判断ツリーによシ有効に認識することができる
高度に最適化された1組の抽出特徴をもたらす結果とな
った。この特徴のあるものは実際には調べられなかった
が、有効であろうと予期され、また本発明の範囲内に含
まれるものと見做される。
上記の組をなす抽出された特徴の「一貫性」および「豊
かさ」ならびにその全体的な計算の容易さは、第21図
において示されたシステムの文字認識能力に大きく寄与
するものである。先に定義した抽出特徴の大半を用いて
3200の文字サンプルを集めることによシ前に述べた
5uenの方法を用いて判断ツリーが形成され(収集プ
ログラムが最も有効な特徴のサブセットを自動的に選定
して表わされた文字種を見分ける)、このIllll上
用セット8.3%および別の文字の未成のセットの97
.3%が前記判断ツリーにより正しく認識された。アル
ゴリズムの改善は、加えられ倍増される数の動的範囲の
確立によって容易になされた。
【図面の簡単な説明】
第1図は本発明の特徴抽出法を示す一般化7a−チャー
ト、第1A図は種々の特徴を計算するため第1図のフロ
ーチャートによシ呼出されるサブルーチンを示すフロー
チャート、第2図は第1図の特徴抽出法により用いられ
る種々の入力変数の説明に役立つ図、第2A図は本発明
において用いられる最小制限矩形の説明に役立つ図、第
2B図は本発明において用いられる半径および周囲距離
の長さの説明に役立つ図、第2C図は本発明において用
いられる循環およびスライスの積分の説明に役立つ図、
第2D図は本発明において計算される特徴点hdist
、 hrat 1およびhrat2の説明に役立つ図、
第3図乃至第6図は第1図のサブルーチンDOCONを
示すフローチャートを構成する図、第7図は第1図のサ
ブルーチンDOPERIMを示すフローチャート、第8
図は第1図のサブルーチンF’SAMPを示すフローチ
ャート、第8A図は第8図のフローチャートの動作の理
解に役立つ図、第9図および第10図は第1図のサブル
ーチンCDFOURIERを示すフローチャートを構成
する図、第11図は第1図のサブルーチンP F S 
AMPを示すフローチャート、第11A図は第11図の
フローチャートの動作の理解に役立つ図、・第11B図
もまた第11図のフローチャートの動作の理解に役立つ
図、第12図は第1図のサブルーチンDERIVを示す
フローチャート、第13図は第1図のサブルーチンHI
LO8UMを示す70−チャート、第14図は第13図
のサブルーチンの動作の理解に役立つ図、第15図は第
1図のサブルーチンDCFRADを示すフローチャート
、第16図は第1図のサブルーチンRFOURI ER
を示すフローチャート、第17図は第1図のサブルーチ
ンC0RRELを示すフローチャート、第18図は第1
A図のサブルーチンMOMENTを示す70−チャート
、第19図は第1A図のサブルーチン5ORTを示すフ
ローチャート、第20図は第1図のサブルーチンDOH
OLEを示すフローチャート、および第21図は第1図
の特徴抽出プログラムが盛り込まれた文書認識システム
を示す図である。 1・・・文書、2・・・スキャナ、3A・・・対象物形
成装置、3B・・・対象物分類装置、4A・・・ランレ
ングス・デコーダ、4B・・・文字境界追跡装置、5・
・・特徴抽出システム、6A・・・判断ツリー分類装置
、6B・・・規則に基く文脈文字認識装置、7・・・フ
ァイル・フォーマツタ、8・・・ワークステーション、
8A・・・グラフィックス・プロセッサ、25・・・文
字、26・・・文字の中心、35・・・大きな穴、36
・・・小さな穴、37・・・中心円環。 (外4名) F”xr−−E; FOH5〜7 F′H5語 Fxr、r:yEl               ’
 ””へ)F□、11A Fxr;、−11B Fxs、:IE! d−」F、5−75 Fxs、M3 1”xs、17

Claims (1)

  1. 【特許請求の範囲】 1、文字の大きさおよび方位の不変特徴を抽出するシス
    テムにおいて、 (a)文字を走査する手段と、該走査手段に応答して走
    査された文字の周ピクセルの複数のxおよびy座標を生
    じる手段と、 (b)前記xおよびy座標について演算して、各々が文
    字に対して種々の方位をなす複数の最小限多角形の予め
    選定されたパラメータの値を決定する手段とを設け、各
    最小限多角形はその各々が文字の少なくとも1つの各周
    囲点と接触する複数の辺部を持ち、 (c)前記値について演算してこれから大きさおよび方
    位の情報を除去する手段を設けるシステム。 2、各最小制限多角形が最小制限矩形であり、各最小限
    矩形の2つの相互に直交する辺の次元を決定する手段を
    設ける請求項1記載のシステム。 3、各最小制限矩形の面積および縦横比を計算する手段
    を設ける請求項2記載のシステム。 4、前記最小限矩形の各々の中心点の座標を決定し、こ
    れら中心点間の距離を計算する手段を設ける請求項2記
    載のシステム。 5、隣接する中心点間の計算された距離の和を決定する
    手段を設ける請求項4記載のシステム。 6、文字の特徴を抽出するシステムにおいて、(a)各
    周ピクセルのxおよびy座標を生成する手段と、 (b)xおよびy座標について演算して各対の周ピクセ
    ル間の周囲距離を生成する手段と、 (c)xおよびy座標、および文字の中心について演算
    し、該中心と各周ピクセルとの間の半径方向距離を生成
    する手段と、 (d)前記周囲距離を用いて前記半径方向距離を再サン
    プルして、それぞれ全周囲長さの等しい割合と対応する
    固定数の再サンプルされた半径方向距離を生成する手段
    と、 (e)前記再サンプルされた半径方向距離について演算
    してこれから大きさおよび方位の情報を除去し、これに
    より抽出された特徴を生成する手段とを設けるシステム
    。 7、再サンプルされた半径方向距離について実フーリエ
    変換を行なう手段を設ける請求項6記載のシステム。 8、直角の特徴を抽出するシステムにおいて、(a)文
    字を電子的に走査して周ピクセル・データを生成する手
    段と、該周ピクセル・データに応答して各周ピクセルの
    xおよびy座標を生成する手段と、 (b)前記xおよびy座標について演算して、各対の周
    ピクセル間の周囲距離を生成する手段と、(c)前記x
    およびy座標について演算して、各周ピクセル毎に周囲
    に対して接する角度の測定を行なう手段と、 (d)前記周囲距離を用いて前記接触角度を再サンプル
    して各々が全周囲長さの等しい部分と対応する固定数の
    再サンプルされた接触角度を生成する手段とを設けるシ
    ステム。 9、再サンプルされた各接触角度から円度の増分を差引
    いて、前記固定数の補正された再サンプル接触角度を生
    成する手段を設ける請求項8記載のシステム。 10、前記の補正された再サンプル接触角度について実
    フーリエ変換を行ない調和係数を生成する手段を設ける
    請求項9記載のシステム。 11、前記の補正された再サンプル接触角度の移動平均
    差を生成することにより平滑化された接触角度増分を生
    成する手段と、 前記各接触角度増分をある閾値と比較し、もし該接触角
    度増分が凹性閾値より小さければ凹性表示子を増分する
    手段と、 前記各接触角度増分をある閾値と比較し、もし該接触角
    度増分が凸性閾値より大きければ凸性表示子を生成する
    手段とを設ける請求項10記載のシステム。 12、文字の特徴を抽出するシステムにおいて、(a)
    文字を走査して周ピクセル・データを生成する手段と、
    該周ピクセル・データについて演算してそれぞれ対応す
    る各周ピクセルのxおよびy座標を生成する手段と、 (b)前記xおよびy座標を再サンプルしてこれについ
    て演算することにより、各々がそれぞれxおよびy座標
    の総数の等しい部分を表わす固定数の再サンプルされた
    xおよびy座標数値を生成する手段と、 (c)前記再サンプルされたxおよびy座標について複
    素フーリエ変換を行ない、調和係数を生成する手段とを
    設けるシステム。 13、文字の特徴を抽出するシステムにおいて、(a)
    文字を走査して周ピクセルを生成する手段と、(b)該
    周ピクセルについて演算して文字を囲む複数の仮想的な
    連続する円環領域を生成する手段と、各円環領域と対応
    する複数の環変数を生成する手段と、 (c)各円環領域内に位置する文字の暗ピクセル数を決
    定し、該ピクセル数と対応する環変数を設定する手段と
    、 (d)変数から大きさの情報を除去する手段とを設ける
    システム。 14、文字の特徴を抽出するシステムにおいて、(a)
    文字を走査してピクセル・データを生成する手段と、 (b)前記ピクセル・データについて演算して、文字を
    囲む円の複数の仮想的な連続するスライス領域を生成す
    る手段と、前記各スライス領域と対応する複数のスライ
    ス変数を生成する手段と、(c)各スライス領域内に位
    置する文字の暗ピクセル数を決定し、該ピクセル数に等
    しくその対応するスライス変数を設定する手段と、 (d)前記スライス変数の各々から大きさの情報を除去
    する手段とを設けるシステム。
JP63060197A 1987-03-13 1988-03-14 文字の特徴を抽出するシステム Expired - Lifetime JP2930300B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US26672 1987-03-13
US07/026,672 US4802230A (en) 1987-03-13 1987-03-13 Method and apparatus for generating size and orientation invariant shape features

Publications (2)

Publication Number Publication Date
JPS63237183A true JPS63237183A (ja) 1988-10-03
JP2930300B2 JP2930300B2 (ja) 1999-08-03

Family

ID=21833187

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63060197A Expired - Lifetime JP2930300B2 (ja) 1987-03-13 1988-03-14 文字の特徴を抽出するシステム

Country Status (5)

Country Link
US (1) US4802230A (ja)
EP (1) EP0281725A3 (ja)
JP (1) JP2930300B2 (ja)
AU (1) AU590470B2 (ja)
IL (1) IL84650A0 (ja)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4817187A (en) * 1987-02-19 1989-03-28 Gtx Corporation Apparatus and method for vectorization of incoming scanned image data
US5131053A (en) * 1988-08-10 1992-07-14 Caere Corporation Optical character recognition method and apparatus
US5054094A (en) * 1990-05-07 1991-10-01 Eastman Kodak Company Rotationally impervious feature extraction for optical character recognition
US5305395A (en) * 1990-06-08 1994-04-19 Xerox Corporation Exhaustive hierarchical near neighbor operations on an image
US5245674A (en) * 1991-07-30 1993-09-14 Xerox Corporation Image processing using distance as a function of direction
US5253307A (en) * 1991-07-30 1993-10-12 Xerox Corporation Image analysis to obtain typeface information
JP3361124B2 (ja) * 1991-07-30 2003-01-07 ゼロックス・コーポレーション テキストを含む2次元画像上での画像処理方法と画像処理装置
US6373997B1 (en) 1991-07-30 2002-04-16 Xerox Corporation Coarse and fine skew measurement
US5251268A (en) * 1991-08-09 1993-10-05 Electric Power Research Institute, Inc. Integrated method and apparatus for character and symbol recognition
US7242988B1 (en) 1991-12-23 2007-07-10 Linda Irene Hoffberg Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
US10361802B1 (en) 1999-02-01 2019-07-23 Blanding Hovenweep, Llc Adaptive pattern recognition based control system and method
US6850252B1 (en) * 1999-10-05 2005-02-01 Steven M. Hoffberg Intelligent electronic appliance system and method
US5903454A (en) 1991-12-23 1999-05-11 Hoffberg; Linda Irene Human-factored interface corporating adaptive pattern recognition based controller apparatus
US6400996B1 (en) 1999-02-01 2002-06-04 Steven M. Hoffberg Adaptive pattern recognition based control system and method
US6418424B1 (en) 1991-12-23 2002-07-09 Steven M. Hoffberg Ergonomic man-machine interface incorporating adaptive pattern recognition based control system
FR2685795B1 (fr) * 1991-12-26 1994-02-25 Thomson Csf Procede de segmentation polytomique.
US5444797A (en) * 1993-04-19 1995-08-22 Xerox Corporation Method and apparatus for automatic character script determination
US5604822A (en) * 1993-11-12 1997-02-18 Martin Marietta Corporation Methods and apparatus for centroid based object segmentation in object recognition-type image processing system
ES2171432T3 (es) * 1993-12-10 2002-09-16 Ricoh Kk Aparato y metodos para reconocer una imagen especifica a partir de una señal de imagen de entrada.
US6002807A (en) * 1996-01-11 1999-12-14 Northrop Grumman Corporation Rotationally invariant correlator
US6130959A (en) * 1997-07-16 2000-10-10 Cognex Corporation Analyzing an image of an arrangement of discrete objects
US6636631B2 (en) * 1998-06-04 2003-10-21 Matsushita Electric Industrial Co., Ltd. Optical character reading method and system for a document with ruled lines and its application
US6229918B1 (en) * 1998-10-20 2001-05-08 Microsoft Corporation System and method for automatically detecting clusters of data points within a data space
US7904187B2 (en) 1999-02-01 2011-03-08 Hoffberg Steven M Internet appliance system and method
GB2394349B (en) * 1999-07-05 2004-06-16 Mitsubishi Electric Inf Tech Method and apparatus for representing and searching for an object in an image
US6577758B1 (en) * 1999-09-24 2003-06-10 Cognex Technology And Investment Corporation Image position detection technique in which input parameters can be easily determined
EP1779295A4 (en) * 2004-07-26 2012-07-04 Automotive Systems Lab SYSTEM FOR PROTECTING USERS OF THE ROAD IN A DANGER SITUATION
US7623734B2 (en) * 2004-09-30 2009-11-24 Microsoft Corporation Method and system for automatically inscribing noisy objects in scanned image data within a minimum area rectangle
US8768007B2 (en) 2012-03-26 2014-07-01 Tk Holdings Inc. Method of filtering an image
US8824733B2 (en) 2012-03-26 2014-09-02 Tk Holdings Inc. Range-cued object segmentation system and method

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3925760A (en) * 1971-05-06 1975-12-09 Ecrm Method of and apparatus for optical character recognition, reading and reproduction
JPS604505B2 (ja) * 1972-07-10 1985-02-04 スキヤン − オプテイクス インコ−ポレ−テツド マルチ・フオント光学式文字認識装置
GB1537322A (en) * 1975-01-30 1978-12-29 Agency Ind Science Techn Apparatus for recognition of approximate shape of an article
US4105998A (en) * 1976-03-30 1978-08-08 Fujitsu Limited Pattern recognition processing system
AU523135B2 (en) * 1979-04-05 1982-07-15 Environmental Research Institute Of Michigan, The Automatic image processor
DE3234608A1 (de) * 1982-09-16 1984-03-22 Kraft, Hans Rainer, Dr.-Ing., 1000 Berlin Verfahren und schaltungsanordnung zur erzeugung einer lageunabhaengigen objektsignatur
DE3419140A1 (de) * 1984-05-23 1985-11-28 Licentia Patent-Verwaltungs-Gmbh, 6000 Frankfurt Verfahren zur omnidirektionalen merkmalserkennung in einem sensorsehfeld

Also Published As

Publication number Publication date
EP0281725A2 (en) 1988-09-14
AU590470B2 (en) 1989-11-02
AU1176188A (en) 1988-09-29
JP2930300B2 (ja) 1999-08-03
EP0281725A3 (en) 1991-01-23
US4802230A (en) 1989-01-31
IL84650A0 (en) 1988-04-29

Similar Documents

Publication Publication Date Title
JPS63237183A (ja) 文字の特徴を抽出するシステム
Mao et al. Empirical performance evaluation methodology and its application to page segmentation algorithms
US10152650B2 (en) Trademark retrieval method, apparatus and system, and computer storage medium
JP2694101B2 (ja) パターン認識と妥当性検査の方法及び装置
US5687253A (en) Method for comparing word shapes
US5369714A (en) Method and apparatus for determining the frequency of phrases in a document without document image decoding
Nakano et al. An algorithm for the skew normalization of document image
US6691126B1 (en) Method and apparatus for locating multi-region objects in an image or video database
JPH05217019A (ja) ビジネスフォーム識別システム及び画像処理システム
US4989257A (en) Method and apparatus for generating size and orientation invariant shape features
US6711292B2 (en) Block selection of table features
JPH11250261A (ja) 指紋画像特色相関器
Warif et al. CMF-iteMS: An automatic threshold selection for detection of copy-move forgery
Kasar et al. Table information extraction and structure recognition using query patterns
Oka et al. Vectorization of contour lines from scanned topographic maps
Diem et al. Skew estimation of sparsely inscribed document fragments
US7936928B2 (en) Mutual symmetry detection
Ruzon et al. Corner detection in textured color images
Lengauer et al. A benchmark dataset for repetitive pattern recognition on textured 3d surfaces
Lin et al. A modified morphological corner detector
CN110825896A (zh) 一种商标检索系统及检索方法
Forel et al. Morphometry of Middle Bronze Age palstaves by discrete cosine transform
Rosenfeld et al. Picture recognition and scene analysis
Szymkowski et al. A novel approach to fingerprint identification using method of sectorization
Church et al. Raster‐to‐vector image analysis for fast digitization of historic seismograms

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term