JPS62221785A

JPS62221785A - パタ−ン認識方式において使用する特徴抽出技術

Info

Publication number: JPS62221785A
Application number: JP61238156A
Authority: JP
Inventors: デイビッド　ジャスチン　ロス
Original assignee: Palantir Corp
Current assignee: Caere Corp
Priority date: 1985-10-10
Filing date: 1986-10-08
Publication date: 1987-09-29
Also published as: EP0228776B1; DE3689416D1; DE3689416T2; EP0228776A3; EP0228776A2; US4700400A

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】本発明は、パターン認識におけるパターンの特徴抽出に
関する方法に関するものである。

多様なパターン認識方式が従来公知である。この様な各
方式は認識されるべきパターンを描写するデータを光学
的に受は取り、且つこのパターンに成る作業を行ってそ
れを既知のパターンと比較し、入力パターンを「認識」
する。パターン認識方式を表す基本的なフローチャート
を第１図に示しである。入力パターンは認識されること
を所望するパターンである。デジタイザ１２が入力パタ
ーン１１をシステムメモリ１３内に格納する為に一連の
バイトへ変換する。これらのバイトは典型的には二進数
的性質であり、入力パターン１１は基本的に黒白の図で
あることを反映している。デジタイザは従来公知であり
且つ典型的には、ファクシミリ装置、電子複写装置（光
学的複写装置に対して）及び従来技術の光学的文字認識
方式等の装置において使用されている。メモリ１３は任
意の適宜のメモリデバイスを有することが可能であり、
例えば公知の構成のランダムアクセスメモリがある。セ
グメンテーション１４は、メモリ１３内に格納された画
像データを個別的な文字へ分割する機能を有する。この
様なセグメンテーションは従来公知であり、且つ、例え
ば、Ａｚｒｉｅｌ　Ｒｏｓｅｎｆｅｌｄ及びＡｖｉｎａ
ｓｈ　Ｃ，Ｋａｋ共著の「デジタル画像処理（Ｄｉｇｉ
ｔａｌ　Ｐｉｃｔｕｒｅ　Ｐｒｏｃｅｓｓｉｎｇ）Ｊ、
第２版、２巻、アカデミツクプレス出版社、１９８２年
、第１０章「セグメンテーション（Ｓｅｇｍｅｎｔａｔ
ｉｏｎ）Ｊに記載されている。

特徴抽出手段１５は、セグメンテーション１４から受け
とったデータの各一部（即ち、各文字）を変換させる機
能を有しており、そのデータを識別手段１６によってし
よする為に標準の予め定めた形態へ変換させ、該識別手
段１６は各文字を既知の文字の組の１つとして認識する
。出力手段１７は、所望により、外部回路（不図示）へ
データ出力（典型的に、ＡＳＣＩＩ等）を提供すべく機
能する。

識別手段１６は、パターン認識方式において典型的に使
用されている多数の従来技術の識別手段、例えば、更に
詳細には、光学的文字認識方式、の何れか１つとするこ
とが可能である。本発明に使用するのに適したこの様な
１つの識別手段は１９８１年３月３１日にＴｏｄｄへ発
行された米国特許第４．２５９，６６１号「パターンを
認識する装置及び方法（Ａｐｐａｒａｔｕｓ　ａｎｄ　
Ｍｅｔｈｏｄ　ｆｏｒ　Ｒｅｃｏｇｎｉｚｉｎｇ　ａ　
Ｐａｔｔｅｒｎ）Ｊに記載されている。識別手段１６も
に、　Ｓ、　Ｆｕ著の「統語的パターン認識及び適用（
Ｓｙｎｔａｃｔｉｃ　Ｐａｔｔｅｒｎ　Ｒｅｃｏｇｎｉ
ｔｉｏｎ　ａｎｄ　ＡｐｐｌｉｃａｔｉｏｎＳ）」、プ
レンティスホールインコーホレイテッド出版社、１９８
２年、特にセクション１．６及びアペンディックスＡ及
びＢに記載されている。

本発明は光学的文字認識方式に使用する特徴抽出手段１
５として使用する方法に関するものであるから、ここに
従来技術の説明を包含する本出願−１〇− は特徴抽出手段１５に焦点を当てることとする。

然し乍ら、理解すべきことであるが、本発明は文字以外
のパターンを認識するパターン認識方式において使用す
べく適用可能であり、数学的に表現することの可能な任
意の情報を認識する為に使用される方式にも適用可能な
ものである。

従来技術の特徴抽出技術は、大略、２つのカテゴリー、
即ち、「マトリクスオーバーレイ」と「特徴解析」に分
類される。マトリクスオーバーレイにおいては、認識さ
れるべき入力文字がメモリ内に格納されている複数個の
既知のパターンと物理的に比較される。基本的に、複数
個の画素（画像要素）を有する入力データ及び格納され
ている既知の文字の両方は、各々文字の各画素に対する
ビット（白及び黒の両方）を有する特徴ベクトルとして
格納されている。このことは、テストパターンが多数の
基準パターンと比較する場合に、非常に多数の特徴ベク
トルが格納されることとなる。マトリクスオーバーレイ
型の特徴抽出は、大略、示性数を使用し、それは、入力
文字の個々の画素と既知の文字の個々の画素とを排他的
オア論理操作で結合させる個々の画素のベストマツチ即
ち最良の合致の手順によって派生される数字である。こ
の排他的オア操作の結果としての示性数は、２つのパタ
ーンにおいてマツチしない画素数を表している。この情
報は識別手段１６へ供給され、該手段１６が認識された
文字として、マツチしなかった画素の最小数を持った文
字を選択する。

特徴抽出のマトリクスオーバーレイ方法は、入力文字を
非常に限定された数のフォント又は基準文字をマツチン
グさせるのに有用である。このことが、特別のｒＯｃＲ
Ｊ文字フォントが開発された１つの理由で、それはマト
リクスオーバーレイ特徴抽出技術と共に使用するのに非
常に適しているが、人間によって特に読み易いものでは
ない。

マトリクスオーバーレイ特徴抽出技術は「斑点」ノイズ
（即ち、汚れた頁）に比較的影響されることはなく、且
つ文字における意図しない切目に比較的影響されない。

然し乍ら、マトリクスオーバーレイは形状における変化
、即ちフォント、タイプにおける変化、イタリック、ア
ンダーライン、ボールドフェイス、の使用等の通常発生
するものの形状の変化に敏感に影響される。従って、マ
トリクスオーバーレイ特徴抽出技術は、多数のフォント
、タイプ寸法等を持った文字を、ハードウェア及び計算
能力に巨大な投資を必要とすること無しに、認識せねば
ならないシステムにおいて広範に使用するのには特に適
していない。

特徴抽出に使用される別の従来技術は所謂「特徴解析」
である。特徴解析は、認識されるべき各文字を凝視しこ
の様な文字が複数個の特別の特徴の何れか１つ又はそれ
以上を有するものであるか否かを判別する特徴抽出技術
である。特徴解析特徴抽出技術において屡々使用される
この様な特別の特徴は、成る位置におけるストロークの
位置、文字の端部位置、文字の端部によって完全に囲ま
れている区域の位置（例えば、大文字のｒＡＪの頂部に
おける上方向に向いた突起部、文字「Ｃ」における開口
の如き右方向に指向した「入り江」等）がある。この様
な特徴解析技術は、例えば、Ｃｈｉｎｇ　Ｙ、　５ｕｅ
ｎ及びＲｅｎａｔｏ　Ｄａ　Ｍｏｒｉ共著の「コンピュ
ータ解析及び概念（Ｃｏｍｐｕｔｅｒ　Ａｎａｌｙｓｉ
ｓ　ａｎｄ　Ｐｅｒｃｅｐｔｉｏｎ）Ｊ、巻重、「視覚
信号（Ｖｉｓｕａｌ　Ｓｉｇｎａｌｓ）」、ＣＲＣプレ
スインコーポレイテッド、１９８２年、特に第３章に記
載されている。文字を認識する上で成る人が重要である
と考える特定の特徴に部分的に依存する多数の特徴解析
技術が存在する。特徴解析特徴抽出技術からのデータ出
力は数学的特徴ベクトルであり、それは認識されるべき
未知の文字における特別の特徴が存在すること、その量
、又はその強度を画定する。この特徴ベクトルは、識別
手段によって使用されて、既知の文字の格納されている
特徴ベクトルを、該未知の文字の特徴ベクトルと最も類
似する特徴ベクトルを持った既知の文字として識別され
る未知の文字と比較する。幾つかの特徴解析技術におい
ては、成る特徴は、未知の文字特徴ベクトルと既知の文
字特徴ベクトルとの比較の間に、他のものよりも一層重
く重みを付けられている。一般的に、どの特徴が探索さ
れ且つ使用されるかに拘らず、特徴解新技術は文字にお
ける不本意の切目や斑点ノイズに非常に影響される。一
方、特徴解析特徴抽出技術は、通常、マトリクスオーバ
ーレイ特徴抽出技術よりも、形状変化、従ってフォント
及びタイプ寸法の変化にはあまり影響されない。

更に、従来技術において、７１ヘリクスオーバーレイ及
び特徴解析特徴抽出技術の特徴の幾らかを結合する技術
が使用されている。所謂「テンプレートマツチング」技
術は、成る特徴を探索する為に、既知のマスクを使用し
て未知の文字内の領域を観察する。従って、成るマスク
を使用して文字の左端部をａｍして、例えば文字ｒＫＪ
の如く文字の左端に垂直線があるか否かを判別する。こ
の技術は、７１−リクスオーバーレイ及び特徴解析特徴
抽出技術の欠点の幾つかを解消するものではあるが、テ
ンプレートマツチング特徴抽出技術は同一の欠点の多く
を維持する傾向にある。例えば、特徴解析における如く
、テンプレートマツチングは多量の計算能力を必要とす
る。

別の従来の特徴抽出技術は、Ｓ、　Ｙａｍａｍｏｔｏ、
　Ａ。

Ｎａｋａｊｉｍａ、　Ｋ、　Ｎａｋａｔａ等の「ヒエラ
ルキ的パターンマツチングによる漢字認識（Ｃｈｉｎｅ
ｓｅ　Ｃｈａｒａｃｔｅｒ　Ｒｅｃｏｇｎｉｔｉｏｎ　
ｂｙ　Ｈｉｅｒａｒｃｈｉｃａｌ　Ｐａｔｔｅｒｎ　Ｍ
ａｔｃｈｉｎｇ）Ｊパターン認識に関する第１回国際合
同会議のプロシーディングズ、１９７３年１０月３０日
乃至１１月１日、ワシントン、ディ、シイ０、インステ
ィテユートオブエレクトリ力ルアンドエレクトロニクス
エンジニアーズ、インコーホレイテッド、１８７−１９
６頁に記載されている。Ｙａｍａｍｏｔｏ　ｅｔ　ａｌ
、はマトリクスオーバーレイ特徴抽出技術を記載してい
る。然し乍ら、この特徴抽出技術の各ステップにおいて
、認識されるべき文字を形成する画素は一連の「圧縮画
像Ｊを形成する為に使用されており、この様な圧縮画像
の各々が、画像が同様に圧縮されている既知の文字と比
較される。

各ステップにおいて、より少ない「圧縮」が使用され、
未知の文字でないと判別された多数の既知の文字は爾後
の比較から外され、その際に比較処理を高速化させてい
る。このタイプのマトリクスオーバーレイ技術は、上述
したマトリクスオーバーレイ技術と比較して成る利点を
提供するものではあるが、それはマトリクスオーバーレ
イ技術のままであるので、この技術を使用して、不当な
量のハードウェア及び計算能力を必要とすることなしに
、多数のフォノ１−から文字を認識することを困難であ
る。

本発明は以上の点に鑑みなされたものであって、上述し
た如き従来技術の欠点を解消し、認識されることを所望
するパターン及び基準パターン内に含まれる画素を表す
特徴ベクトルを形成する独得の方法を提供することを目
的とする。

本発明に基づいて展開される特徴ベクトルの１部分はパ
ターン自身の中に含まれる画素を表しており、該パター
ンの各画素を正確に定義する非常に大きな特徴ベクトル
を必要とすることはない。

本発明の１実施例は、該特徴ベクトルの１つ又はそれ以
上のパイ１〜から構成される特徴ベクトルの別の部分は
該パターンのアスペクト比を定義する。

１実施例においては、文字の中に含まれる画素を表す特
徴ベクトルの各バイトは該文字の特別の区域における全
体の画素に対する黒画素の相対的な比を表しており、入
力マトリクス及び出力特徴ベクトル情報に関するその他
の関数を使用することが可能である。本発明の１実施例
において、特徴ベクトルによって定義される文字の区域
は共に文字全体をカバーし、パターンの「不鮮明」化さ
せたものと大凡考えることの可能なものを表す特徴ベク
トルを与える・以下、添付の図面を参考に、本発明の具体的実施の態様
に付いて詳細に説明する。

本発明に拠れば、認識することを所望するパターン又は
文字の中に含まれる画素を画定する特徴ベクトルを形成
する独得の方法が提供される。本発明に基づいて展開さ
れる特徴ベクトルは、従来技術のものと異なり、文字自
身の中に含まれる画素を表しており、一方、マトリクス
オーバーレイ技術と異なり、画像の各画素を正確に画定
する非常に大きな特徴ベクトルを形成するものではない
。

本発明の１実施例においては、特徴ベクトルは４０バイ
ト＋アスペクト比（文字の高さに対する文字の幅の比の
平方根）を画定する１６バイトを有している。この実施
例においては、特徴ベクトルの４０パイ１〜の各々は、
文字の４０個の異なった区域の各々における全画素に対
する黒画素の相対的数を画定する。１実施例においては
、文字を単に４０個の部分に分割することは望ましくな
い。

何故ならば、一般的に、文字における画素数は４０で均
等に分割されないからである。この実施例において使用
される技術は、１つの画素を部分的に幾つかの（１実施
例においては、最大４つ）領域の間で配分されることを
可能とすることによって、文字を４０の等しい領域に効
果的に分割している。

この独得の技術は、この技術を使用する光学的文字認識
方式が、未知の文字を、人によってなされる比較の方法
に類似すると考えられる態様で。

複数個の既知の文字（夫々自身の独得の特徴ペクトによ
って表わされている）と比較することを可能としている
。この能力は、単に学問的な興味のみならず、この技術
は、多くの異なったタイプのフォントでの文字に対して
従来技術において知られているものよりも一層信頼性の
ある程度に文字の認識を可能とさせ、且つ文字の認識誤
りを回避することを可能としている。

多数の入力データに関して光学的文字認識を行うことに
よって経験的に分かってことであるが、文字を表現する
５×８マトリクス（幅が５に等しく、高さが８に等しい
）を表す特徴ベクトルは、ローマン印字の認識において
最大の精度を与える。

ローマ字以外の字体の場合、この様なその他の文字の組
を認識する為に異なったアスペクト比がより良く適して
いるかどうかを判別する為に同一の操作を実行すること
が可能である。

一般的には、読み取られる文書のデジタル化は、５Ｘ８
マトリクスよりも大きな多数の画素によって表される文
字となるので、例えば、２０画素幅で３０画素高さの画
像を５×８バイト特徴ベクトルマトリクスへ変換させる
為の技術を有することが必要である。大きなマトリクス
をより扱い易くする為に特徴解析又はマトリクスオーバ
ーレイ特徴解析技術を使用してより小さなマトリクスへ
減少させる場合、選択される画素のみが変換されるアレ
イ内に包含される。選択された画素は、望むらくは、「
Ｃ」とｒｅＪ等の２つの類似する文字の間を区別する能
力を向上させる重要な画素に選択される。これらの技術
はデータを一層取扱い易い大きさへ変換させることを可
能としているが、これらの技術はいまなお特徴解析又は
マトリクスオーバーレイ特徴解析技術に関して上述した
付随する欠点を持っている。逆に、「、」の如き小さな
文字は５×８特徴ベクトルマトリクスを充填する為に拡
大されねばならない。

本発明に拠れば、独得の技術を使用して文字を定義する
第１寸法の７１〜リクスを、文字の「不鮮明ｊ化させた
ものであるにも拘らず、人間が文字を観察する態様に類
似すると考えられる態様で同一の文字を定義する第２寸
法のマトリクスへ変換させる。この技術は、第２ａ図乃
至第２ｃ図を参照して説明することが可能である。第２
ａ図は、例えばセグメンテーション手段１．４（第１図
）から受けとられたＮＸＭのマトリクスを表している。

第２ａ図は４×３のマトリクスを示しているが、これは
単に例示的なものであるということを理解すべきであり
、実際には、典型的な入力マトリクスは２０画素幅で３
０画素高さ又は以上とすることが可能である。更に、簡
潔性の為に、第２ａ図の４×３マトリクスを第２ｃ図に
示した如き３Ｘ２マトリクスへ変換することを所望する
と仮定する。第２ｂ図は、ＮＰＸＭＱビットの寸法の中
間マトリクスを示しており（その他の寸法の中間マトリ
クスを使用することも可能であることを理解すべきであ
るが）、Ｎは入力マトリクスの高さでありＭは入力マト
リクスの幅でありＰは出力マトリクスの高さでありＱは
出力マトリクスの幅である。第２ｂ図のマトリクスを充
填する為に、第２ａ図の各ビットの値を、図示した如く
（点線矩形）に、水平方向にＱ回且つ垂直方向にＰ回第
２ｂ図の中に入れられる。変換を完了させる為に、第２
ｂ図の中間マトリクスからのデータは、各々が図示した
如＜ＮＸＭの寸法を持っている第２ｂ図のＰＸＱ領域（
実線矩形）の各々の値を加算することによって第２ｃ図
のＰＸＱマトリクス内へエンターされる。これにより、
第２ａ図のＮＸＭ　（４×３）入力マトリクスは第２ｃ
図のＰＸＱ　（３Ｘ２）出カフトリクスへ変換される。

重要なことであるが、第２ｃ図の出カフ１ヘリクスは、
「混同コされた態様で入カマ）〜リンス２ａによって前
に表されていた文字を表す。換言すると、第３Ｃ図にお
けるデータは、第２ｃ図のマトリクスの各バイトが第２
ａ図内に表されているオリジナルの文字の領域を表す様
な態様で、第２ａ図のデータから混同（ｃｏｎｆｏｕｎ
ｄ）される。

入力アレイがかなり大きい場合、この実施例は非常に大
きな中間アレイとなる（第２ｂ図）。本発明の別の実施
例においては、同一の出力アレイ（第３ｃ図）が、入力
アレイ（第３ａ図）の要素が出力アレイの要素へ加算さ
れる場合に協動する一連のカウンタを使用して、形成さ
れる。第２の実施例においては、出力アレイの幅と入力
アレイの高さを持った中間アレイが形成される。その様
に形成された中間アレイ（第３ｂ図）は、入力アレイの
要素を使用して、最初にインクリメントされる。中間ア
レイが満杯になると、中間アレイの要素が使用されて出
力アレイを充填する。第４図は、中間アレイを充填する
処理を示したフローチャートであり、且つ表１は種々の
カウンタの値及び中間アレイを充填する為に第４図のフ
ローチャートにおいて使用されているインデックスを示
している。同様に、第５図は、中間アレイが充填された
後に、出力アレイを充填する為の処理を示すフローチャ
ートであり、且つ表２は出力アレイを充填するのに使用
されるカウンタの値及びインデックスを示している。本
明細書中の表のなかのステップは、それらの関連するフ
ローチャートにおいて「星印」を付したステップの実行
の直前に番号を付しである。

本明細書においては、以下の変数をフローチャート及び
表に関連して使用しており、カウンタの動作を示してい
る。

Ｍ＝入カアレイの幅（ビットマツプ）Ｑ＝＝力アレイの幅Ｎ＝入入子アレイ高さＰ＝＝力アレイの高さｉ＝入カアレイ水平インデックス。○からＭ−１へイン
クリメント。

■＝＝力アレイ水平インデックス。０からＱ−１へイン
クリメント。

ｊ＝＝力アレイ垂直インデックス。０からＮ−１へイン
クリメント。

Ｊ＝＝力アレイ垂直インデックス。０からＰ−１ヘイン
クリメント。

Ｈ１＝　ｉインクリメント動作を決定する為の水平カウ
ンタ。０からＱへインクリメント。

Ｈ２＝Ｉインクリメント動作を決定する為の水平カウン
タ。０からＭヘインクリメント。

Ｖ１＝ｊインクリメント動作を決定する為の垂直カウン
タ。０からＰへインクリメント。

Ｖ２＝Ｊインクリメン１〜動作を決定する為の垂直カウ
ンタ。ＯからＮヘインクリメント。

退」−１第］」剖ＬｉＩ旧ＦＩ２ｊＶＩＶ２Ｊスタート　　ｏｏｏｏｏｏｏ。

ステップ１００１１．００００ステップ２　　１００２００００ステツプ３　　１１１０００００ステツプ４　　２１０１００００ステツプ５　　２１１２００００ステツプ６　　００００１０００表２（第４図）ｉＩ旧Ｈ２ｊＶＩＶ２Ｊスタート　　ｏｏｏｏｏｏｏ。

ステップ１　　０００００１１０ステツプ２　　０００００２２０ステツプ３　　００００１０３０ステツプ４　　００００１１０１ステツプ５　　００００１２１１ステツプ６　　００００２０２１＝２６− ステップ７　　００００２１３１ステツプ８　　００００２２０２ステツプ９　　００００３０１２ステツプ１０　０　０　０　０　３　１　２　２ステツ
プ１１　０　０　０　０　３　２　３　２ステツプ１２
　１　０　０　０　０　．０　０　０人ＷｌｉＩ旧！１２　ｊ　ＶＩ　Ｖ２　Ｊスタート　　ｏｏｏｏｏｏｏ。

ステップ１　　０　０　１　　］、　　ＯＯＯＯステッ
プ２　　１００２００００ステツプ３　　１１１０００００ステツプ４　　２　１　０　１．　０　０　０　０ステ
ツプ５　　２１１２００００ステツプ６　　０００００１１０ステツプ７　　０　０　１　１．　０　１　１　０ステ
ツプ８　　１００２０１１０ステツプ９　　１．　１　１　０　０　１．　１　０ス
テツプ１０　２　１　０　１　０　１　１．　０ステツ
プ１１　２　１　１　２　０　１　１　０ステツプ１２
　０　０　０　０　０　２　２　０ステツプ１３　０　
０　１　１　０　２　２　０ステツプ１４　１　０　０
　２　０　２　２　０ステツプ１５　１　１　１　０　
０　２　２　０ステツプ１６　２　　ｉ−０１０２２０
ステツプ１７　２　１　１　２　０　２　２　０ステツ
プ１８　０　０　０　０　１　０　３　０ステツプ１９
　０　０　１　１　１　０　３　０ステツプ２０　１　
０　０　２　１　０　３　０ステツプ２１　１　１　１
　０　１　０　３　０ステツプ２２　２　１　０　１　
１　０　３　０ステツプ２３　２　１　１　２　１　０
　３　０ステツプ２４　０　０　０　０　１　１　０　
１本発明の別の実施例においては、中間アレイの使用は
付加的なカウンタを使用することによって除去されてい
る。第６図は、本発明のこの３番目の実施例の動作を示
したフローチャートである。

表３は、第３ａ図の入力アレイを第３ｃ図の出力アレイ
へ変換する為のアルゴリズムにおけるステップをトレー
スしている。

前述した如く、文字を画定する典型的な入力マトリクス
は、２０画素幅で３０画素高さの場合があり、混同させ
た出力マトリクスは５バイト幅で８バイト高さの場合が
あり、従ってこのデータを更に処理する為に操作するの
に必要なパイ１〜数を著しく減少させている。本発明の
開示から当業者等なら容易に理解出来る如く、白と黒の
画素を表す単一ビッ１−二進数を有する２０幅で３０高
さの入力マトリクスは、任意の寸法のマトリクスと混同
された場合に、全てが黒（その領域における全ての入力
画素＝１）の領域に対応する６００（ＮＸＭ）の最大値
を持った出力バイトを与える。

本発明の１実施例において、特徴ベクトル（アスペクト
比又はその他の付加的な特徴を表している特徴ベクトル
のバイ１へを除いて）は以下の式に従って正規化される
。

Σ　　（ｘ、”）　　＝　２５６Ｉ＝１尚、Ｘ□＝特徴ベクトルの１番目のバイト、Ｎ＝特徴ベ
クトルの混同させた画素部分におけるバイト数。

数２５６は、要素当り任意の大きなビット数で、特徴ベ
クトルから略正確に識別手段から結果を与える要素当り
の最小ビット数で出力ベクトルを発生させる為に、経験
的に決定されている。

正規化は幾つかの利点を与える。正規化は任意の与えら
れたバイトの値を減少させ、その際にそのバイトを表す
のに必要とされるビット数を最小とさせる。

更に重要なことであるが、この正規化は、文字寸法にお
ける変動の降下を取り除く為に実施され、従って広い範
囲のタイプ寸法に渡ってフォント値の単一組の基準ベク
トルのみを必要とするに過ぎない。このことは、従来技
術と対比される点であり、従来技術では、例えば、クー
リエ１０ポイント用に１組の基準文字特徴ベクトルが必
要とされ、フーリエ１２ポイント用に別の１組の基準文
字特徴ベクトルが必要とされ、フーリエ１４ポイント用
に別の１組が必要とされる等々である。換言すると、本
発明に拠れば、例えば、１２ポイントのフーリエの場合
、ｒｅＪは１４ポイントのフーリエのｒｅＪに対する特
徴ベクトルと全く同一であり、一方マトリクスオーバー
レイ特徴抽出技術を使用するＯＣＲシステムにおいては
、これらは２つの別々の特徴ベクトルを有することとな
る。このことは、格納される基準文字特徴ベクトルの数
を劇的に減少させることを可能とし、その結果コストが
減少され且つ動作速度が著しく向上される。

比較的少ない場合（経験的に１％の略１／１０未満に決
定されている）、この正規化技術は、１゜２７を越える
値を持った正規化されたベクトルの１つ又はそれ以上の
バイトとなる。この場合、これらの値は１２７に等しく
セットされ、その際に特徴ベクトルの各バイトを７ビツ
１〜で表現することの可能な値として維持する。

本発明の付加的な特徴として、入力パターンに対する付
加的な特徴を表す１つ又はそれ以上の付加的なバイトを
使用して特徴ベクトルを形成する。

１実施例においては、１６個のこの様なバイトを使用し
て各々が以下の値を表す。

尚、Ｗ＝入力文字の幅、Ｈ＝入力文字の高さ、Ｋ＝以下の式と略等しく経験的に決定されている定数。

［（３（ＫＫＨＥＩＧＨＴ）／１６）・（２）１３５］
Ｖ′尚、ＫＫＩＩＥＩＧＨＴ　＝特徴ベクトルにおける
垂直要素数。

この様に、アスペクト比を表すバイトは実際に重み付け
したアスペクト比を表しており、その重み付けしたアス
ペクト比は、特徴ベクトルを画定する残りのバイトと相
対的な、既知の文字に対して未知の文字を比較する上で
アスペクト比の相対的な重要性が決定されている。この
実施例においては、複数個のこの様な重み付けしたアス
ペクト比表現を使用して、それらの値が各々７ビツトで
表現されるか又は精度を失うこと無しに７ビツトに丸め
ることが可能である様に、それらの値を維持している。

これが必要でない場合には、単一のアスペクト比バイト
を使用することが可能である。

本発明のこの実施例においては、値には、正確に文字を
認識するのに最も効果的であると決定さねた重み付は係
数の実際には１／４であり、従って特徴ベクトルには１
６個のアスペクトフィールドがある。この様に、認識さ
れるべき文字を表す特徴ベクトルを既知の基準文字特徴
ベクトルと比較する場合に、各アスペクト比バイトは、
初期の４０バイトの各々がどの様にして処理されたがと
いうことと同一の態様で処理される。換言すると、２つ
の特徴ベクトルを比較する場合、以下の式が実行される
。

Ｄ（Ｘ、Ｙ）　＝　Σ（Ｘｉ−Ｙｉ）２■＝１Ｘ＝特徴ベクトルＸ ■＝特徴ベクトルＹＤ（Ｘ、Ｙ）　＝特徴ベクトルＸと特徴ベクトルＹとの
間の距離Ｘｉ　＝特徴ベクトルＸのｉ番目要素Ｙｉ　＝特徴ベクトルＹのｉ番目要素Ｎ　＝各特徴ベクトルにおける要素数（４０個の混同さ
せた画素バイト及びアスペクト比を表す１６個のバイト
を持った上述した特徴ベクトルにおいてＮ＝５６）以上、本発明の具体的実施の態様に付いて詳細に説明し
たが、本発明はこれら具体例にのみ限定されるべきもの
では無く、本発明の技術的範囲を逸脱すること無しに種
々の変形が可能であることは勿論である。

【図面の簡単な説明】

第１図は典型的な従来技術のパターン乃至は文字認識方
式の物理的構成及び処理フローの両方を示すブロック線
図、第２ａ図乃至第２ｃ図は画像における画素を表すビ
ットを含んだ第１寸法のマー調− トリクスをその画像の混同させたものを表すバイトを含
んだ第２寸法のマトリクスへ変換させる為の本発明に基
づいて使用される技術を示す各概略図、第３ａ図乃至第
３Ｑ図はｉＩ！ｉｉ像内の画素を表すビットを含む第１
寸法の７トリクスをその画像の混同させたものを表すバ
イトを含んだ第２寸法のマトリクスへ変換させる為の本
発明に基づいて使用される技術を示した各概略図、第４
図は第３ａ図及び第３ｂ図の方法を示したフローチャー
ト図、第５図は第３ｂ図及び第３Ｃ図の方法を示したフ
ローチャー１・図、第６図は中間アレイを使用しない本
発明の同様の方法を示したフローチャー１〜図、である
。（符号の説明）１１：入力パターン１２：デジタイザ１３：メモリ１４：セグメンテーション１５：特徴抽出手段１６：識別手段１７：出力手段特許出願人　　　　ザ　パランチール　コーポレーショ
ンＸ力１′イ　　　　　　　　　究Ｐ高ルイ　　　　　　
　　　　弘女ヱ・イ１　　ｉ　　ｉ　　　　　　　　　
　　　　　　３３　　　　　　　　　　　　　　　　　
Ｂ２Ｏ３３ｉｉ　　　　　　　　　　　　　　　　１７
Ｆ工Ｇ、２ｂ手続朔ｔ−ｚＪ三二書（方式）昭和６２年４月１５日特許庁長官　　黒　１）明　雄　殿１、事件の表示　　　昭和６１年　特　許　願　第２３
８１５６号２、発明の名称　　　パターン認識方式にお
いて使用する特徴抽出技術３、補正をする者事件との関係　　　特許出願人名称　　　　ザ　パランチール　コーポレーション４、
代理人

Claims

【特許請求の範囲】１、二進又は中間調画素データからなるパターンの特徴
を抽出する方法において、複数個のパターン画像をフェ
ッチし、前記各パターン画像を複数個の領域に分割し、
前記各画像に対して変換を入力データに与えて前記領域
内の画素値情報を混同させることにより発生される入力
パターンの「不鮮明」化とさせ、その「不鮮明」とされ
たデータを使用してパターン認識用の特徴ベクトル又は
特徴ベクトルの一部を発生する、上記各ステップを有す
ることを特徴とする方法。２、特許請求の範囲第１項において、前記領域は該パタ
ーンの幅に渡って均等に離隔されていることを特徴とす
る方法。３、特許請求の範囲第１項において、前記領域は該パタ
ーンの高さに沿って均等に離隔されていることを特徴と
する方法。４、特許請求の範囲第２項において、該パターンの幅に
渡っての前記均等な間隔が該パターンを水平方向に５つ
の等しい部分に分割することを特徴とする方法。５、特許請求の範囲第３項において、該パターンの高さ
に沿っての塩基均等な間隔が該パターンを垂直方向に８
つの等しい部分に分割することを特徴とする方法。６、特許請求の範囲第１項において、前記パターンは二
進データから構成されることを特徴とする方法。７、特許請求の範囲第６項において、前記二進パターン
は文字であることを特徴とする方法。８、特許請求の範囲第１項において、前記「不鮮明」化
は前記領域内の中間調レベルの画素を加算することによ
って行われることを特徴とする方法。９、特許請求の範囲第８項において、前記和は該特徴ベ
クトルにおける要素となることを特徴とする方法。１０、特許請求の範囲第６項において、前記「不鮮明」
化は前記領域内の黒画素の数を加算することによって行
われることを特徴とする方法。１１、特許請求の範囲第１０項において、前記和は該特
徴ベクトルにおける要素となることを特徴とする方法。１２、特許請求の範囲第８項又は第１０項において、前
記加算を行う場合に、Ｐをパターン画像が分割される垂
直領域の数であり且つＱをパターン画像が分割される水
平領域の数として各々が垂直にＰ回且つ水平にＱ回書き
込まれたオリジナルのパターン画像の要素からなる中間
アレイを形成し、水平寸法がＱで垂直寸法がＰである出
力アレイを形成し、前記出力アレイはＭを画素でのオリ
ジナルのパターン画像の高さであり且つＮを画素でのオ
リジナルのパターン画像の幅としてＭ垂直要素とＮ水平
要素のグループにおいて加算された中間アレイの要素か
ら構成されていることを特徴とする方法。１３、特許請求の範囲第８項又は第１０項において、前
記加算を行う場合に、オリジナルのパターン画像が水平
に分割される領域数に等しい幅及びオリジナルのパター
ン画像の画素における高さに等しい高さの中間アレイを
形成し、カウンタを使用して該パターン画像におけるど
の画素のその値を該中間アレイのどの要素へ加算させる
かを決定し、カウンタを使用して該中間アレイのどの要
素のその値を該出力アレイのどの要素へ加算させるかを
決定することを特徴とする方法。１４、特許請求の範囲第８項又は第１０項において、前
記加算はカウンタを使用して行われ、該パターン画像に
おけるどの画素のその値を該出力アレイのどの要素へ加
算させるかを決定することを特徴とする方法。１５、特許請求の範囲第１項において、「不鮮明」とさ
れたか又は混同されたデータに関係しない付加的な特徴
を前記「不鮮明」とされたか又は混同されたデータから
なる特徴ベクトルへ加算されることを特徴とする方法。１６、特許請求の範囲第１５項において、幾つかの付加
的な特徴がオリジナルなパターン画像のアスペクト比に
関係していることを特徴とする方法。１７、特許請求の範囲第１６項において、オリジナルの
パターン画像のアスペクト比に関連する特徴がＮをオリ
ジナルなパターン画像の画素における幅とし且つＭをオ
リジナルなパターン画像の画素における高さとしてＮ／
Ｍの平方根に比例することを特徴とする方法。１８、特許請求の範囲第１７項において、前記比例の係
数は［（３（ＫＫＨＥＩＧＨＴ）／１０）・（２）＾１＾３
＾．＾５］＾１＾／＾２であり、ＫＫＨＥＩＧＨＴは該
特徴ベクトルにおける垂直要素の数であることを特徴と
する方法。１９、特許請求の範囲第１項において、最終の特徴ベク
トルの部分が正規化されていることを特徴とする方法。２０、特許請求の範囲第１９項において、「不鮮明」化
又は混同化から派生される特徴ベクトル要素が正規化さ
れることを特徴とする方法。２１、特許請求の範囲第２０項において、この様な正規
化が行われて「不鮮明」化又は混同化から派生されるベ
クトル要素をオリジナルのパターン画像の元の寸法に影
響を受けなくさせることを特徴とする方法。２２、特許請求の範囲第１９項又は第２０項において、
「不鮮明」化又は混同化から派生される特徴ベクトルの
一部のノルムは２５６であることを特徴とする方法。２３、入力マトリクスを出力マトリクスへ変換させる方
法において、入力マトリクスを得、前記入力マトリクス
の領域内に含まれる情報を使用して前記出力マトリクス
の対応する領域に対してデータを与える、上記各ステッ
プを有することを特徴とする方法。２４、特許請求の範囲第２３項において、前記入力マト
リクスの前記領域がオーバーラップすることを特徴とす
る方法。２５、特許請求の範囲第２３項において、データを供給
するステップが、前記入力マトリクスの領域内に含まれ
る前記情報を使用して数学的関数を実施して前記出力マ
トリクスの対応する領域に対して前記データを形成する
ステップを有することを特徴とする方法。２６、特許請求の範囲第２５項において、前記数学的関
数は加算、重み付き加算のいずれかから選択されたもの
であることを特徴とする方法。２７、特許請求の範囲第２３項において、前記出力マト
リクスは５要素幅で８要素高さであることを特徴とする
方法。２８、入力パターンを表す幅Ｐで高さＱの出力特徴ベク
トルアレイを形成する方法において、幅Ｎで高さＭの入
力アレイの形態で前記入力パターンを得、幅ＮＰで高さ
ＭＱを持った中間アレイを形成し、前記中間アレイを前
記入力アレイからのデータで重点し、前記出力アレイを
前記中間アレイからのデータで重点する、上記各ステッ
プを有することを特徴とする方法。２９、特許請求の範囲第２８項において、前記中間アレ
イを充填する前記ステップは、前記入力アレイ内の各要
素を水平方向にＱ回且つ垂直方向にＰ回前記中間アレイ
内に入れるステップを有することを特徴とする方法。