JPS62221785A - パタ−ン認識方式において使用する特徴抽出技術 - Google Patents
パタ−ン認識方式において使用する特徴抽出技術Info
- Publication number
- JPS62221785A JPS62221785A JP61238156A JP23815686A JPS62221785A JP S62221785 A JPS62221785 A JP S62221785A JP 61238156 A JP61238156 A JP 61238156A JP 23815686 A JP23815686 A JP 23815686A JP S62221785 A JPS62221785 A JP S62221785A
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- array
- input
- pattern image
- feature vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003909 pattern recognition Methods 0.000 title claims description 9
- 238000000605 extraction Methods 0.000 title description 25
- 238000000034 method Methods 0.000 claims description 87
- 239000013598 vector Substances 0.000 claims description 65
- 239000011159 matrix material Substances 0.000 claims description 52
- 238000010606 normalization Methods 0.000 claims description 5
- 238000007620 mathematical function Methods 0.000 claims 2
- 230000009466 transformation Effects 0.000 claims 1
- 238000004458 analytical method Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 9
- 238000012015 optical character recognition Methods 0.000 description 6
- 230000011218 segmentation Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012567 pattern recognition method Methods 0.000 description 2
- 241001137251 Corvidae Species 0.000 description 1
- RSPISYXLHRIGJD-UHFFFAOYSA-N OOOO Chemical compound OOOO RSPISYXLHRIGJD-UHFFFAOYSA-N 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000011888 autopsy Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 235000015108 pies Nutrition 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
- G06V10/507—Summing image-intensity values; Histogram projection analysis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
- Image Analysis (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は、パターン認識におけるパターンの特徴抽出に
関する方法に関するものである。
関する方法に関するものである。
多様なパターン認識方式が従来公知である。この様な各
方式は認識されるべきパターンを描写するデータを光学
的に受は取り、且つこのパターンに成る作業を行ってそ
れを既知のパターンと比較し、入力パターンを「認識」
する。パターン認識方式を表す基本的なフローチャート
を第1図に示しである。入力パターンは認識されること
を所望するパターンである。デジタイザ12が入力パタ
ーン11をシステムメモリ13内に格納する為に一連の
バイトへ変換する。これらのバイトは典型的には二進数
的性質であり、入力パターン11は基本的に黒白の図で
あることを反映している。デジタイザは従来公知であり
且つ典型的には、ファクシミリ装置、電子複写装置(光
学的複写装置に対して)及び従来技術の光学的文字認識
方式等の装置において使用されている。メモリ13は任
意の適宜のメモリデバイスを有することが可能であり、
例えば公知の構成のランダムアクセスメモリがある。セ
グメンテーション14は、メモリ13内に格納された画
像データを個別的な文字へ分割する機能を有する。この
様なセグメンテーションは従来公知であり、且つ、例え
ば、Azriel Rosenfeld及びAvina
sh C,Kak共著の「デジタル画像処理(Digi
tal Picture Processing)J、
第2版、2巻、アカデミツクプレス出版社、1982年
、第10章「セグメンテーション(Segmentat
ion)Jに記載されている。
方式は認識されるべきパターンを描写するデータを光学
的に受は取り、且つこのパターンに成る作業を行ってそ
れを既知のパターンと比較し、入力パターンを「認識」
する。パターン認識方式を表す基本的なフローチャート
を第1図に示しである。入力パターンは認識されること
を所望するパターンである。デジタイザ12が入力パタ
ーン11をシステムメモリ13内に格納する為に一連の
バイトへ変換する。これらのバイトは典型的には二進数
的性質であり、入力パターン11は基本的に黒白の図で
あることを反映している。デジタイザは従来公知であり
且つ典型的には、ファクシミリ装置、電子複写装置(光
学的複写装置に対して)及び従来技術の光学的文字認識
方式等の装置において使用されている。メモリ13は任
意の適宜のメモリデバイスを有することが可能であり、
例えば公知の構成のランダムアクセスメモリがある。セ
グメンテーション14は、メモリ13内に格納された画
像データを個別的な文字へ分割する機能を有する。この
様なセグメンテーションは従来公知であり、且つ、例え
ば、Azriel Rosenfeld及びAvina
sh C,Kak共著の「デジタル画像処理(Digi
tal Picture Processing)J、
第2版、2巻、アカデミツクプレス出版社、1982年
、第10章「セグメンテーション(Segmentat
ion)Jに記載されている。
特徴抽出手段15は、セグメンテーション14から受け
とったデータの各一部(即ち、各文字)を変換させる機
能を有しており、そのデータを識別手段16によってし
よする為に標準の予め定めた形態へ変換させ、該識別手
段16は各文字を既知の文字の組の1つとして認識する
。出力手段17は、所望により、外部回路(不図示)へ
データ出力(典型的に、ASCII等)を提供すべく機
能する。
とったデータの各一部(即ち、各文字)を変換させる機
能を有しており、そのデータを識別手段16によってし
よする為に標準の予め定めた形態へ変換させ、該識別手
段16は各文字を既知の文字の組の1つとして認識する
。出力手段17は、所望により、外部回路(不図示)へ
データ出力(典型的に、ASCII等)を提供すべく機
能する。
識別手段16は、パターン認識方式において典型的に使
用されている多数の従来技術の識別手段、例えば、更に
詳細には、光学的文字認識方式、の何れか1つとするこ
とが可能である。本発明に使用するのに適したこの様な
1つの識別手段は1981年3月31日にToddへ発
行された米国特許第4.259,661号「パターンを
認識する装置及び方法(Apparatus and
Method for Recognizing a
Pattern)Jに記載されている。識別手段16も
に、 S、 Fu著の「統語的パターン認識及び適用(
Syntactic Pattern Recogni
tion and ApplicationS)」、プ
レンティスホールインコーホレイテッド出版社、198
2年、特にセクション1.6及びアペンディックスA及
びBに記載されている。
用されている多数の従来技術の識別手段、例えば、更に
詳細には、光学的文字認識方式、の何れか1つとするこ
とが可能である。本発明に使用するのに適したこの様な
1つの識別手段は1981年3月31日にToddへ発
行された米国特許第4.259,661号「パターンを
認識する装置及び方法(Apparatus and
Method for Recognizing a
Pattern)Jに記載されている。識別手段16も
に、 S、 Fu著の「統語的パターン認識及び適用(
Syntactic Pattern Recogni
tion and ApplicationS)」、プ
レンティスホールインコーホレイテッド出版社、198
2年、特にセクション1.6及びアペンディックスA及
びBに記載されている。
本発明は光学的文字認識方式に使用する特徴抽出手段1
5として使用する方法に関するものであるから、ここに
従来技術の説明を包含する本出願−1〇− は特徴抽出手段15に焦点を当てることとする。
5として使用する方法に関するものであるから、ここに
従来技術の説明を包含する本出願−1〇− は特徴抽出手段15に焦点を当てることとする。
然し乍ら、理解すべきことであるが、本発明は文字以外
のパターンを認識するパターン認識方式において使用す
べく適用可能であり、数学的に表現することの可能な任
意の情報を認識する為に使用される方式にも適用可能な
ものである。
のパターンを認識するパターン認識方式において使用す
べく適用可能であり、数学的に表現することの可能な任
意の情報を認識する為に使用される方式にも適用可能な
ものである。
従来技術の特徴抽出技術は、大略、2つのカテゴリー、
即ち、「マトリクスオーバーレイ」と「特徴解析」に分
類される。マトリクスオーバーレイにおいては、認識さ
れるべき入力文字がメモリ内に格納されている複数個の
既知のパターンと物理的に比較される。基本的に、複数
個の画素(画像要素)を有する入力データ及び格納され
ている既知の文字の両方は、各々文字の各画素に対する
ビット(白及び黒の両方)を有する特徴ベクトルとして
格納されている。このことは、テストパターンが多数の
基準パターンと比較する場合に、非常に多数の特徴ベク
トルが格納されることとなる。マトリクスオーバーレイ
型の特徴抽出は、大略、示性数を使用し、それは、入力
文字の個々の画素と既知の文字の個々の画素とを排他的
オア論理操作で結合させる個々の画素のベストマツチ即
ち最良の合致の手順によって派生される数字である。こ
の排他的オア操作の結果としての示性数は、2つのパタ
ーンにおいてマツチしない画素数を表している。この情
報は識別手段16へ供給され、該手段16が認識された
文字として、マツチしなかった画素の最小数を持った文
字を選択する。
即ち、「マトリクスオーバーレイ」と「特徴解析」に分
類される。マトリクスオーバーレイにおいては、認識さ
れるべき入力文字がメモリ内に格納されている複数個の
既知のパターンと物理的に比較される。基本的に、複数
個の画素(画像要素)を有する入力データ及び格納され
ている既知の文字の両方は、各々文字の各画素に対する
ビット(白及び黒の両方)を有する特徴ベクトルとして
格納されている。このことは、テストパターンが多数の
基準パターンと比較する場合に、非常に多数の特徴ベク
トルが格納されることとなる。マトリクスオーバーレイ
型の特徴抽出は、大略、示性数を使用し、それは、入力
文字の個々の画素と既知の文字の個々の画素とを排他的
オア論理操作で結合させる個々の画素のベストマツチ即
ち最良の合致の手順によって派生される数字である。こ
の排他的オア操作の結果としての示性数は、2つのパタ
ーンにおいてマツチしない画素数を表している。この情
報は識別手段16へ供給され、該手段16が認識された
文字として、マツチしなかった画素の最小数を持った文
字を選択する。
特徴抽出のマトリクスオーバーレイ方法は、入力文字を
非常に限定された数のフォント又は基準文字をマツチン
グさせるのに有用である。このことが、特別のrOcR
J文字フォントが開発された1つの理由で、それはマト
リクスオーバーレイ特徴抽出技術と共に使用するのに非
常に適しているが、人間によって特に読み易いものでは
ない。
非常に限定された数のフォント又は基準文字をマツチン
グさせるのに有用である。このことが、特別のrOcR
J文字フォントが開発された1つの理由で、それはマト
リクスオーバーレイ特徴抽出技術と共に使用するのに非
常に適しているが、人間によって特に読み易いものでは
ない。
マトリクスオーバーレイ特徴抽出技術は「斑点」ノイズ
(即ち、汚れた頁)に比較的影響されることはなく、且
つ文字における意図しない切目に比較的影響されない。
(即ち、汚れた頁)に比較的影響されることはなく、且
つ文字における意図しない切目に比較的影響されない。
然し乍ら、マトリクスオーバーレイは形状における変化
、即ちフォント、タイプにおける変化、イタリック、ア
ンダーライン、ボールドフェイス、の使用等の通常発生
するものの形状の変化に敏感に影響される。従って、マ
トリクスオーバーレイ特徴抽出技術は、多数のフォント
、タイプ寸法等を持った文字を、ハードウェア及び計算
能力に巨大な投資を必要とすること無しに、認識せねば
ならないシステムにおいて広範に使用するのには特に適
していない。
、即ちフォント、タイプにおける変化、イタリック、ア
ンダーライン、ボールドフェイス、の使用等の通常発生
するものの形状の変化に敏感に影響される。従って、マ
トリクスオーバーレイ特徴抽出技術は、多数のフォント
、タイプ寸法等を持った文字を、ハードウェア及び計算
能力に巨大な投資を必要とすること無しに、認識せねば
ならないシステムにおいて広範に使用するのには特に適
していない。
特徴抽出に使用される別の従来技術は所謂「特徴解析」
である。特徴解析は、認識されるべき各文字を凝視しこ
の様な文字が複数個の特別の特徴の何れか1つ又はそれ
以上を有するものであるか否かを判別する特徴抽出技術
である。特徴解析特徴抽出技術において屡々使用される
この様な特別の特徴は、成る位置におけるストロークの
位置、文字の端部位置、文字の端部によって完全に囲ま
れている区域の位置(例えば、大文字のrAJの頂部に
おける上方向に向いた突起部、文字「C」における開口
の如き右方向に指向した「入り江」等)がある。この様
な特徴解析技術は、例えば、Ching Y、 5ue
n及びRenato Da Mori共著の「コンピュ
ータ解析及び概念(Computer Analysi
s and Perception)J、巻重、「視覚
信号(Visual Signals)」、CRCプレ
スインコーポレイテッド、1982年、特に第3章に記
載されている。文字を認識する上で成る人が重要である
と考える特定の特徴に部分的に依存する多数の特徴解析
技術が存在する。特徴解析特徴抽出技術からのデータ出
力は数学的特徴ベクトルであり、それは認識されるべき
未知の文字における特別の特徴が存在すること、その量
、又はその強度を画定する。この特徴ベクトルは、識別
手段によって使用されて、既知の文字の格納されている
特徴ベクトルを、該未知の文字の特徴ベクトルと最も類
似する特徴ベクトルを持った既知の文字として識別され
る未知の文字と比較する。幾つかの特徴解析技術におい
ては、成る特徴は、未知の文字特徴ベクトルと既知の文
字特徴ベクトルとの比較の間に、他のものよりも一層重
く重みを付けられている。一般的に、どの特徴が探索さ
れ且つ使用されるかに拘らず、特徴解新技術は文字にお
ける不本意の切目や斑点ノイズに非常に影響される。一
方、特徴解析特徴抽出技術は、通常、マトリクスオーバ
ーレイ特徴抽出技術よりも、形状変化、従ってフォント
及びタイプ寸法の変化にはあまり影響されない。
である。特徴解析は、認識されるべき各文字を凝視しこ
の様な文字が複数個の特別の特徴の何れか1つ又はそれ
以上を有するものであるか否かを判別する特徴抽出技術
である。特徴解析特徴抽出技術において屡々使用される
この様な特別の特徴は、成る位置におけるストロークの
位置、文字の端部位置、文字の端部によって完全に囲ま
れている区域の位置(例えば、大文字のrAJの頂部に
おける上方向に向いた突起部、文字「C」における開口
の如き右方向に指向した「入り江」等)がある。この様
な特徴解析技術は、例えば、Ching Y、 5ue
n及びRenato Da Mori共著の「コンピュ
ータ解析及び概念(Computer Analysi
s and Perception)J、巻重、「視覚
信号(Visual Signals)」、CRCプレ
スインコーポレイテッド、1982年、特に第3章に記
載されている。文字を認識する上で成る人が重要である
と考える特定の特徴に部分的に依存する多数の特徴解析
技術が存在する。特徴解析特徴抽出技術からのデータ出
力は数学的特徴ベクトルであり、それは認識されるべき
未知の文字における特別の特徴が存在すること、その量
、又はその強度を画定する。この特徴ベクトルは、識別
手段によって使用されて、既知の文字の格納されている
特徴ベクトルを、該未知の文字の特徴ベクトルと最も類
似する特徴ベクトルを持った既知の文字として識別され
る未知の文字と比較する。幾つかの特徴解析技術におい
ては、成る特徴は、未知の文字特徴ベクトルと既知の文
字特徴ベクトルとの比較の間に、他のものよりも一層重
く重みを付けられている。一般的に、どの特徴が探索さ
れ且つ使用されるかに拘らず、特徴解新技術は文字にお
ける不本意の切目や斑点ノイズに非常に影響される。一
方、特徴解析特徴抽出技術は、通常、マトリクスオーバ
ーレイ特徴抽出技術よりも、形状変化、従ってフォント
及びタイプ寸法の変化にはあまり影響されない。
更に、従来技術において、71ヘリクスオーバーレイ及
び特徴解析特徴抽出技術の特徴の幾らかを結合する技術
が使用されている。所謂「テンプレートマツチング」技
術は、成る特徴を探索する為に、既知のマスクを使用し
て未知の文字内の領域を観察する。従って、成るマスク
を使用して文字の左端部をamして、例えば文字rKJ
の如く文字の左端に垂直線があるか否かを判別する。こ
の技術は、71−リクスオーバーレイ及び特徴解析特徴
抽出技術の欠点の幾つかを解消するものではあるが、テ
ンプレートマツチング特徴抽出技術は同一の欠点の多く
を維持する傾向にある。例えば、特徴解析における如く
、テンプレートマツチングは多量の計算能力を必要とす
る。
び特徴解析特徴抽出技術の特徴の幾らかを結合する技術
が使用されている。所謂「テンプレートマツチング」技
術は、成る特徴を探索する為に、既知のマスクを使用し
て未知の文字内の領域を観察する。従って、成るマスク
を使用して文字の左端部をamして、例えば文字rKJ
の如く文字の左端に垂直線があるか否かを判別する。こ
の技術は、71−リクスオーバーレイ及び特徴解析特徴
抽出技術の欠点の幾つかを解消するものではあるが、テ
ンプレートマツチング特徴抽出技術は同一の欠点の多く
を維持する傾向にある。例えば、特徴解析における如く
、テンプレートマツチングは多量の計算能力を必要とす
る。
別の従来の特徴抽出技術は、S、 Yamamoto、
A。
A。
Nakajima、 K、 Nakata等の「ヒエラ
ルキ的パターンマツチングによる漢字認識(Chine
se Character Recognition
by Hierarchical Pattern M
atching)Jパターン認識に関する第1回国際合
同会議のプロシーディングズ、1973年10月30日
乃至11月1日、ワシントン、ディ、シイ0、インステ
ィテユートオブエレクトリ力ルアンドエレクトロニクス
エンジニアーズ、インコーホレイテッド、187−19
6頁に記載されている。Yamamoto et al
、はマトリクスオーバーレイ特徴抽出技術を記載してい
る。然し乍ら、この特徴抽出技術の各ステップにおいて
、認識されるべき文字を形成する画素は一連の「圧縮画
像Jを形成する為に使用されており、この様な圧縮画像
の各々が、画像が同様に圧縮されている既知の文字と比
較される。
ルキ的パターンマツチングによる漢字認識(Chine
se Character Recognition
by Hierarchical Pattern M
atching)Jパターン認識に関する第1回国際合
同会議のプロシーディングズ、1973年10月30日
乃至11月1日、ワシントン、ディ、シイ0、インステ
ィテユートオブエレクトリ力ルアンドエレクトロニクス
エンジニアーズ、インコーホレイテッド、187−19
6頁に記載されている。Yamamoto et al
、はマトリクスオーバーレイ特徴抽出技術を記載してい
る。然し乍ら、この特徴抽出技術の各ステップにおいて
、認識されるべき文字を形成する画素は一連の「圧縮画
像Jを形成する為に使用されており、この様な圧縮画像
の各々が、画像が同様に圧縮されている既知の文字と比
較される。
各ステップにおいて、より少ない「圧縮」が使用され、
未知の文字でないと判別された多数の既知の文字は爾後
の比較から外され、その際に比較処理を高速化させてい
る。このタイプのマトリクスオーバーレイ技術は、上述
したマトリクスオーバーレイ技術と比較して成る利点を
提供するものではあるが、それはマトリクスオーバーレ
イ技術のままであるので、この技術を使用して、不当な
量のハードウェア及び計算能力を必要とすることなしに
、多数のフォノ1−から文字を認識することを困難であ
る。
未知の文字でないと判別された多数の既知の文字は爾後
の比較から外され、その際に比較処理を高速化させてい
る。このタイプのマトリクスオーバーレイ技術は、上述
したマトリクスオーバーレイ技術と比較して成る利点を
提供するものではあるが、それはマトリクスオーバーレ
イ技術のままであるので、この技術を使用して、不当な
量のハードウェア及び計算能力を必要とすることなしに
、多数のフォノ1−から文字を認識することを困難であ
る。
本発明は以上の点に鑑みなされたものであって、上述し
た如き従来技術の欠点を解消し、認識されることを所望
するパターン及び基準パターン内に含まれる画素を表す
特徴ベクトルを形成する独得の方法を提供することを目
的とする。
た如き従来技術の欠点を解消し、認識されることを所望
するパターン及び基準パターン内に含まれる画素を表す
特徴ベクトルを形成する独得の方法を提供することを目
的とする。
本発明に基づいて展開される特徴ベクトルの1部分はパ
ターン自身の中に含まれる画素を表しており、該パター
ンの各画素を正確に定義する非常に大きな特徴ベクトル
を必要とすることはない。
ターン自身の中に含まれる画素を表しており、該パター
ンの各画素を正確に定義する非常に大きな特徴ベクトル
を必要とすることはない。
本発明の1実施例は、該特徴ベクトルの1つ又はそれ以
上のパイ1〜から構成される特徴ベクトルの別の部分は
該パターンのアスペクト比を定義する。
上のパイ1〜から構成される特徴ベクトルの別の部分は
該パターンのアスペクト比を定義する。
1実施例においては、文字の中に含まれる画素を表す特
徴ベクトルの各バイトは該文字の特別の区域における全
体の画素に対する黒画素の相対的な比を表しており、入
力マトリクス及び出力特徴ベクトル情報に関するその他
の関数を使用することが可能である。本発明の1実施例
において、特徴ベクトルによって定義される文字の区域
は共に文字全体をカバーし、パターンの「不鮮明」化さ
せたものと大凡考えることの可能なものを表す特徴ベク
トルを与える・ 以下、添付の図面を参考に、本発明の具体的実施の態様
に付いて詳細に説明する。
徴ベクトルの各バイトは該文字の特別の区域における全
体の画素に対する黒画素の相対的な比を表しており、入
力マトリクス及び出力特徴ベクトル情報に関するその他
の関数を使用することが可能である。本発明の1実施例
において、特徴ベクトルによって定義される文字の区域
は共に文字全体をカバーし、パターンの「不鮮明」化さ
せたものと大凡考えることの可能なものを表す特徴ベク
トルを与える・ 以下、添付の図面を参考に、本発明の具体的実施の態様
に付いて詳細に説明する。
本発明に拠れば、認識することを所望するパターン又は
文字の中に含まれる画素を画定する特徴ベクトルを形成
する独得の方法が提供される。本発明に基づいて展開さ
れる特徴ベクトルは、従来技術のものと異なり、文字自
身の中に含まれる画素を表しており、一方、マトリクス
オーバーレイ技術と異なり、画像の各画素を正確に画定
する非常に大きな特徴ベクトルを形成するものではない
。
文字の中に含まれる画素を画定する特徴ベクトルを形成
する独得の方法が提供される。本発明に基づいて展開さ
れる特徴ベクトルは、従来技術のものと異なり、文字自
身の中に含まれる画素を表しており、一方、マトリクス
オーバーレイ技術と異なり、画像の各画素を正確に画定
する非常に大きな特徴ベクトルを形成するものではない
。
本発明の1実施例においては、特徴ベクトルは40バイ
ト+アスペクト比(文字の高さに対する文字の幅の比の
平方根)を画定する16バイトを有している。この実施
例においては、特徴ベクトルの40パイ1〜の各々は、
文字の40個の異なった区域の各々における全画素に対
する黒画素の相対的数を画定する。1実施例においては
、文字を単に40個の部分に分割することは望ましくな
い。
ト+アスペクト比(文字の高さに対する文字の幅の比の
平方根)を画定する16バイトを有している。この実施
例においては、特徴ベクトルの40パイ1〜の各々は、
文字の40個の異なった区域の各々における全画素に対
する黒画素の相対的数を画定する。1実施例においては
、文字を単に40個の部分に分割することは望ましくな
い。
何故ならば、一般的に、文字における画素数は40で均
等に分割されないからである。この実施例において使用
される技術は、1つの画素を部分的に幾つかの(1実施
例においては、最大4つ)領域の間で配分されることを
可能とすることによって、文字を40の等しい領域に効
果的に分割している。
等に分割されないからである。この実施例において使用
される技術は、1つの画素を部分的に幾つかの(1実施
例においては、最大4つ)領域の間で配分されることを
可能とすることによって、文字を40の等しい領域に効
果的に分割している。
この独得の技術は、この技術を使用する光学的文字認識
方式が、未知の文字を、人によってなされる比較の方法
に類似すると考えられる態様で。
方式が、未知の文字を、人によってなされる比較の方法
に類似すると考えられる態様で。
複数個の既知の文字(夫々自身の独得の特徴ペクトによ
って表わされている)と比較することを可能としている
。この能力は、単に学問的な興味のみならず、この技術
は、多くの異なったタイプのフォントでの文字に対して
従来技術において知られているものよりも一層信頼性の
ある程度に文字の認識を可能とさせ、且つ文字の認識誤
りを回避することを可能としている。
って表わされている)と比較することを可能としている
。この能力は、単に学問的な興味のみならず、この技術
は、多くの異なったタイプのフォントでの文字に対して
従来技術において知られているものよりも一層信頼性の
ある程度に文字の認識を可能とさせ、且つ文字の認識誤
りを回避することを可能としている。
多数の入力データに関して光学的文字認識を行うことに
よって経験的に分かってことであるが、文字を表現する
5×8マトリクス(幅が5に等しく、高さが8に等しい
)を表す特徴ベクトルは、ローマン印字の認識において
最大の精度を与える。
よって経験的に分かってことであるが、文字を表現する
5×8マトリクス(幅が5に等しく、高さが8に等しい
)を表す特徴ベクトルは、ローマン印字の認識において
最大の精度を与える。
ローマ字以外の字体の場合、この様なその他の文字の組
を認識する為に異なったアスペクト比がより良く適して
いるかどうかを判別する為に同一の操作を実行すること
が可能である。
を認識する為に異なったアスペクト比がより良く適して
いるかどうかを判別する為に同一の操作を実行すること
が可能である。
一般的には、読み取られる文書のデジタル化は、5X8
マトリクスよりも大きな多数の画素によって表される文
字となるので、例えば、20画素幅で30画素高さの画
像を5×8バイト特徴ベクトルマトリクスへ変換させる
為の技術を有することが必要である。大きなマトリクス
をより扱い易くする為に特徴解析又はマトリクスオーバ
ーレイ特徴解析技術を使用してより小さなマトリクスへ
減少させる場合、選択される画素のみが変換されるアレ
イ内に包含される。選択された画素は、望むらくは、「
C」とreJ等の2つの類似する文字の間を区別する能
力を向上させる重要な画素に選択される。これらの技術
はデータを一層取扱い易い大きさへ変換させることを可
能としているが、これらの技術はいまなお特徴解析又は
マトリクスオーバーレイ特徴解析技術に関して上述した
付随する欠点を持っている。逆に、「、」の如き小さな
文字は5×8特徴ベクトルマトリクスを充填する為に拡
大されねばならない。
マトリクスよりも大きな多数の画素によって表される文
字となるので、例えば、20画素幅で30画素高さの画
像を5×8バイト特徴ベクトルマトリクスへ変換させる
為の技術を有することが必要である。大きなマトリクス
をより扱い易くする為に特徴解析又はマトリクスオーバ
ーレイ特徴解析技術を使用してより小さなマトリクスへ
減少させる場合、選択される画素のみが変換されるアレ
イ内に包含される。選択された画素は、望むらくは、「
C」とreJ等の2つの類似する文字の間を区別する能
力を向上させる重要な画素に選択される。これらの技術
はデータを一層取扱い易い大きさへ変換させることを可
能としているが、これらの技術はいまなお特徴解析又は
マトリクスオーバーレイ特徴解析技術に関して上述した
付随する欠点を持っている。逆に、「、」の如き小さな
文字は5×8特徴ベクトルマトリクスを充填する為に拡
大されねばならない。
本発明に拠れば、独得の技術を使用して文字を定義する
第1寸法の71〜リクスを、文字の「不鮮明j化させた
ものであるにも拘らず、人間が文字を観察する態様に類
似すると考えられる態様で同一の文字を定義する第2寸
法のマトリクスへ変換させる。この技術は、第2a図乃
至第2c図を参照して説明することが可能である。第2
a図は、例えばセグメンテーション手段1.4(第1図
)から受けとられたNXMのマトリクスを表している。
第1寸法の71〜リクスを、文字の「不鮮明j化させた
ものであるにも拘らず、人間が文字を観察する態様に類
似すると考えられる態様で同一の文字を定義する第2寸
法のマトリクスへ変換させる。この技術は、第2a図乃
至第2c図を参照して説明することが可能である。第2
a図は、例えばセグメンテーション手段1.4(第1図
)から受けとられたNXMのマトリクスを表している。
第2a図は4×3のマトリクスを示しているが、これは
単に例示的なものであるということを理解すべきであり
、実際には、典型的な入力マトリクスは20画素幅で3
0画素高さ又は以上とすることが可能である。更に、簡
潔性の為に、第2a図の4×3マトリクスを第2c図に
示した如き3X2マトリクスへ変換することを所望する
と仮定する。第2b図は、NPXMQビットの寸法の中
間マトリクスを示しており(その他の寸法の中間マトリ
クスを使用することも可能であることを理解すべきであ
るが)、Nは入力マトリクスの高さでありMは入力マト
リクスの幅でありPは出力マトリクスの高さでありQは
出力マトリクスの幅である。第2b図のマトリクスを充
填する為に、第2a図の各ビットの値を、図示した如く
(点線矩形)に、水平方向にQ回且つ垂直方向にP回第
2b図の中に入れられる。変換を完了させる為に、第2
b図の中間マトリクスからのデータは、各々が図示した
如<NXMの寸法を持っている第2b図のPXQ領域(
実線矩形)の各々の値を加算することによって第2c図
のPXQマトリクス内へエンターされる。これにより、
第2a図のNXM (4×3)入力マトリクスは第2c
図のPXQ (3X2)出カフトリクスへ変換される。
単に例示的なものであるということを理解すべきであり
、実際には、典型的な入力マトリクスは20画素幅で3
0画素高さ又は以上とすることが可能である。更に、簡
潔性の為に、第2a図の4×3マトリクスを第2c図に
示した如き3X2マトリクスへ変換することを所望する
と仮定する。第2b図は、NPXMQビットの寸法の中
間マトリクスを示しており(その他の寸法の中間マトリ
クスを使用することも可能であることを理解すべきであ
るが)、Nは入力マトリクスの高さでありMは入力マト
リクスの幅でありPは出力マトリクスの高さでありQは
出力マトリクスの幅である。第2b図のマトリクスを充
填する為に、第2a図の各ビットの値を、図示した如く
(点線矩形)に、水平方向にQ回且つ垂直方向にP回第
2b図の中に入れられる。変換を完了させる為に、第2
b図の中間マトリクスからのデータは、各々が図示した
如<NXMの寸法を持っている第2b図のPXQ領域(
実線矩形)の各々の値を加算することによって第2c図
のPXQマトリクス内へエンターされる。これにより、
第2a図のNXM (4×3)入力マトリクスは第2c
図のPXQ (3X2)出カフトリクスへ変換される。
重要なことであるが、第2c図の出カフ1ヘリクスは、
「混同コされた態様で入カマ)〜リンス2aによって前
に表されていた文字を表す。換言すると、第3C図にお
けるデータは、第2c図のマトリクスの各バイトが第2
a図内に表されているオリジナルの文字の領域を表す様
な態様で、第2a図のデータから混同(confoun
d)される。
「混同コされた態様で入カマ)〜リンス2aによって前
に表されていた文字を表す。換言すると、第3C図にお
けるデータは、第2c図のマトリクスの各バイトが第2
a図内に表されているオリジナルの文字の領域を表す様
な態様で、第2a図のデータから混同(confoun
d)される。
入力アレイがかなり大きい場合、この実施例は非常に大
きな中間アレイとなる(第2b図)。本発明の別の実施
例においては、同一の出力アレイ(第3c図)が、入力
アレイ(第3a図)の要素が出力アレイの要素へ加算さ
れる場合に協動する一連のカウンタを使用して、形成さ
れる。第2の実施例においては、出力アレイの幅と入力
アレイの高さを持った中間アレイが形成される。その様
に形成された中間アレイ(第3b図)は、入力アレイの
要素を使用して、最初にインクリメントされる。中間ア
レイが満杯になると、中間アレイの要素が使用されて出
力アレイを充填する。第4図は、中間アレイを充填する
処理を示したフローチャートであり、且つ表1は種々の
カウンタの値及び中間アレイを充填する為に第4図のフ
ローチャートにおいて使用されているインデックスを示
している。同様に、第5図は、中間アレイが充填された
後に、出力アレイを充填する為の処理を示すフローチャ
ートであり、且つ表2は出力アレイを充填するのに使用
されるカウンタの値及びインデックスを示している。本
明細書中の表のなかのステップは、それらの関連するフ
ローチャートにおいて「星印」を付したステップの実行
の直前に番号を付しである。
きな中間アレイとなる(第2b図)。本発明の別の実施
例においては、同一の出力アレイ(第3c図)が、入力
アレイ(第3a図)の要素が出力アレイの要素へ加算さ
れる場合に協動する一連のカウンタを使用して、形成さ
れる。第2の実施例においては、出力アレイの幅と入力
アレイの高さを持った中間アレイが形成される。その様
に形成された中間アレイ(第3b図)は、入力アレイの
要素を使用して、最初にインクリメントされる。中間ア
レイが満杯になると、中間アレイの要素が使用されて出
力アレイを充填する。第4図は、中間アレイを充填する
処理を示したフローチャートであり、且つ表1は種々の
カウンタの値及び中間アレイを充填する為に第4図のフ
ローチャートにおいて使用されているインデックスを示
している。同様に、第5図は、中間アレイが充填された
後に、出力アレイを充填する為の処理を示すフローチャ
ートであり、且つ表2は出力アレイを充填するのに使用
されるカウンタの値及びインデックスを示している。本
明細書中の表のなかのステップは、それらの関連するフ
ローチャートにおいて「星印」を付したステップの実行
の直前に番号を付しである。
本明細書においては、以下の変数をフローチャート及び
表に関連して使用しており、カウンタの動作を示してい
る。
表に関連して使用しており、カウンタの動作を示してい
る。
M=入カアレイの幅(ビットマツプ)
Q==力アレイの幅
N=入入子アレイ高さ
P==力アレイの高さ
i=入カアレイ水平インデックス。○からM−1へイン
クリメント。
クリメント。
■==力アレイ水平インデックス。0からQ−1へイン
クリメント。
クリメント。
j==力アレイ垂直インデックス。0からN−1へイン
クリメント。
クリメント。
J==力アレイ垂直インデックス。0からP−1ヘイン
クリメント。
クリメント。
H1= iインクリメント動作を決定する為の水平カウ
ンタ。0からQへインクリメント。
ンタ。0からQへインクリメント。
H2=Iインクリメント動作を決定する為の水平カウン
タ。0からMヘインクリメント。
タ。0からMヘインクリメント。
V1=jインクリメント動作を決定する為の垂直カウン
タ。0からPへインクリメント。
タ。0からPへインクリメント。
V2=Jインクリメン1〜動作を決定する為の垂直カウ
ンタ。OからNヘインクリメント。
ンタ。OからNヘインクリメント。
退」−1第]」剖L
iI旧FI2jVIV2J
スタート ooooooo。
ステップ10011.0000
ステップ2 10020000
ステツプ3 11100000
ステツプ4 21010000
ステツプ5 21120000
ステツプ6 00001000
表2(第4図)
iI旧H2jVIV2J
スタート ooooooo。
ステップ1 00000110
ステツプ2 00000220
ステツプ3 00001030
ステツプ4 00001101
ステツプ5 00001211
ステツプ6 00002021
=26−
ステップ7 00002131
ステツプ8 00002202
ステツプ9 00003012
ステツプ10 0 0 0 0 3 1 2 2ステツ
プ11 0 0 0 0 3 2 3 2ステツプ12
1 0 0 0 0 .0 0 0人Wl iI旧!12 j VI V2 J スタート ooooooo。
プ11 0 0 0 0 3 2 3 2ステツプ12
1 0 0 0 0 .0 0 0人Wl iI旧!12 j VI V2 J スタート ooooooo。
ステップ1 0 0 1 ]、 OOOOステッ
プ2 10020000 ステツプ3 11100000 ステツプ4 2 1 0 1. 0 0 0 0ステ
ツプ5 21120000 ステツプ6 00000110 ステツプ7 0 0 1 1. 0 1 1 0ステ
ツプ8 10020110 ステツプ9 1. 1 1 0 0 1. 1 0ス
テツプ10 2 1 0 1 0 1 1. 0ステツ
プ11 2 1 1 2 0 1 1 0ステツプ12
0 0 0 0 0 2 2 0ステツプ13 0
0 1 1 0 2 2 0ステツプ14 1 0 0
2 0 2 2 0ステツプ15 1 1 1 0
0 2 2 0ステツプ16 2 i−010220
ステツプ17 2 1 1 2 0 2 2 0ステツ
プ18 0 0 0 0 1 0 3 0ステツプ19
0 0 1 1 1 0 3 0ステツプ20 1
0 0 2 1 0 3 0ステツプ21 1 1 1
0 1 0 3 0ステツプ22 2 1 0 1
1 0 3 0ステツプ23 2 1 1 2 1 0
3 0ステツプ24 0 0 0 0 1 1 0
1本発明の別の実施例においては、中間アレイの使用は
付加的なカウンタを使用することによって除去されてい
る。第6図は、本発明のこの3番目の実施例の動作を示
したフローチャートである。
プ2 10020000 ステツプ3 11100000 ステツプ4 2 1 0 1. 0 0 0 0ステ
ツプ5 21120000 ステツプ6 00000110 ステツプ7 0 0 1 1. 0 1 1 0ステ
ツプ8 10020110 ステツプ9 1. 1 1 0 0 1. 1 0ス
テツプ10 2 1 0 1 0 1 1. 0ステツ
プ11 2 1 1 2 0 1 1 0ステツプ12
0 0 0 0 0 2 2 0ステツプ13 0
0 1 1 0 2 2 0ステツプ14 1 0 0
2 0 2 2 0ステツプ15 1 1 1 0
0 2 2 0ステツプ16 2 i−010220
ステツプ17 2 1 1 2 0 2 2 0ステツ
プ18 0 0 0 0 1 0 3 0ステツプ19
0 0 1 1 1 0 3 0ステツプ20 1
0 0 2 1 0 3 0ステツプ21 1 1 1
0 1 0 3 0ステツプ22 2 1 0 1
1 0 3 0ステツプ23 2 1 1 2 1 0
3 0ステツプ24 0 0 0 0 1 1 0
1本発明の別の実施例においては、中間アレイの使用は
付加的なカウンタを使用することによって除去されてい
る。第6図は、本発明のこの3番目の実施例の動作を示
したフローチャートである。
表3は、第3a図の入力アレイを第3c図の出力アレイ
へ変換する為のアルゴリズムにおけるステップをトレー
スしている。
へ変換する為のアルゴリズムにおけるステップをトレー
スしている。
前述した如く、文字を画定する典型的な入力マトリクス
は、20画素幅で30画素高さの場合があり、混同させ
た出力マトリクスは5バイト幅で8バイト高さの場合が
あり、従ってこのデータを更に処理する為に操作するの
に必要なパイ1〜数を著しく減少させている。本発明の
開示から当業者等なら容易に理解出来る如く、白と黒の
画素を表す単一ビッ1−二進数を有する20幅で30高
さの入力マトリクスは、任意の寸法のマトリクスと混同
された場合に、全てが黒(その領域における全ての入力
画素=1)の領域に対応する600(NXM)の最大値
を持った出力バイトを与える。
は、20画素幅で30画素高さの場合があり、混同させ
た出力マトリクスは5バイト幅で8バイト高さの場合が
あり、従ってこのデータを更に処理する為に操作するの
に必要なパイ1〜数を著しく減少させている。本発明の
開示から当業者等なら容易に理解出来る如く、白と黒の
画素を表す単一ビッ1−二進数を有する20幅で30高
さの入力マトリクスは、任意の寸法のマトリクスと混同
された場合に、全てが黒(その領域における全ての入力
画素=1)の領域に対応する600(NXM)の最大値
を持った出力バイトを与える。
本発明の1実施例において、特徴ベクトル(アスペクト
比又はその他の付加的な特徴を表している特徴ベクトル
のバイ1へを除いて)は以下の式に従って正規化される
。
比又はその他の付加的な特徴を表している特徴ベクトル
のバイ1へを除いて)は以下の式に従って正規化される
。
Σ (x、”) = 256
I=1
尚、X□=特徴ベクトルの1番目のバイト、N=特徴ベ
クトルの混同させた画素部分におけるバイト数。
クトルの混同させた画素部分におけるバイト数。
数256は、要素当り任意の大きなビット数で、特徴ベ
クトルから略正確に識別手段から結果を与える要素当り
の最小ビット数で出力ベクトルを発生させる為に、経験
的に決定されている。
クトルから略正確に識別手段から結果を与える要素当り
の最小ビット数で出力ベクトルを発生させる為に、経験
的に決定されている。
正規化は幾つかの利点を与える。正規化は任意の与えら
れたバイトの値を減少させ、その際にそのバイトを表す
のに必要とされるビット数を最小とさせる。
れたバイトの値を減少させ、その際にそのバイトを表す
のに必要とされるビット数を最小とさせる。
更に重要なことであるが、この正規化は、文字寸法にお
ける変動の降下を取り除く為に実施され、従って広い範
囲のタイプ寸法に渡ってフォント値の単一組の基準ベク
トルのみを必要とするに過ぎない。このことは、従来技
術と対比される点であり、従来技術では、例えば、クー
リエ10ポイント用に1組の基準文字特徴ベクトルが必
要とされ、フーリエ12ポイント用に別の1組の基準文
字特徴ベクトルが必要とされ、フーリエ14ポイント用
に別の1組が必要とされる等々である。換言すると、本
発明に拠れば、例えば、12ポイントのフーリエの場合
、reJは14ポイントのフーリエのreJに対する特
徴ベクトルと全く同一であり、一方マトリクスオーバー
レイ特徴抽出技術を使用するOCRシステムにおいては
、これらは2つの別々の特徴ベクトルを有することとな
る。このことは、格納される基準文字特徴ベクトルの数
を劇的に減少させることを可能とし、その結果コストが
減少され且つ動作速度が著しく向上される。
ける変動の降下を取り除く為に実施され、従って広い範
囲のタイプ寸法に渡ってフォント値の単一組の基準ベク
トルのみを必要とするに過ぎない。このことは、従来技
術と対比される点であり、従来技術では、例えば、クー
リエ10ポイント用に1組の基準文字特徴ベクトルが必
要とされ、フーリエ12ポイント用に別の1組の基準文
字特徴ベクトルが必要とされ、フーリエ14ポイント用
に別の1組が必要とされる等々である。換言すると、本
発明に拠れば、例えば、12ポイントのフーリエの場合
、reJは14ポイントのフーリエのreJに対する特
徴ベクトルと全く同一であり、一方マトリクスオーバー
レイ特徴抽出技術を使用するOCRシステムにおいては
、これらは2つの別々の特徴ベクトルを有することとな
る。このことは、格納される基準文字特徴ベクトルの数
を劇的に減少させることを可能とし、その結果コストが
減少され且つ動作速度が著しく向上される。
比較的少ない場合(経験的に1%の略1/10未満に決
定されている)、この正規化技術は、1゜27を越える
値を持った正規化されたベクトルの1つ又はそれ以上の
バイトとなる。この場合、これらの値は127に等しく
セットされ、その際に特徴ベクトルの各バイトを7ビツ
1〜で表現することの可能な値として維持する。
定されている)、この正規化技術は、1゜27を越える
値を持った正規化されたベクトルの1つ又はそれ以上の
バイトとなる。この場合、これらの値は127に等しく
セットされ、その際に特徴ベクトルの各バイトを7ビツ
1〜で表現することの可能な値として維持する。
本発明の付加的な特徴として、入力パターンに対する付
加的な特徴を表す1つ又はそれ以上の付加的なバイトを
使用して特徴ベクトルを形成する。
加的な特徴を表す1つ又はそれ以上の付加的なバイトを
使用して特徴ベクトルを形成する。
1実施例においては、16個のこの様なバイトを使用し
て各々が以下の値を表す。
て各々が以下の値を表す。
尚、W=入力文字の幅、
H=入力文字の高さ、
K=以下の式と略等しく経験的に決定されている定数。
[(3(KKHEIGHT)/16)・(2)135]
V′尚、KKIIEIGHT =特徴ベクトルにおける
垂直要素数。
V′尚、KKIIEIGHT =特徴ベクトルにおける
垂直要素数。
この様に、アスペクト比を表すバイトは実際に重み付け
したアスペクト比を表しており、その重み付けしたアス
ペクト比は、特徴ベクトルを画定する残りのバイトと相
対的な、既知の文字に対して未知の文字を比較する上で
アスペクト比の相対的な重要性が決定されている。この
実施例においては、複数個のこの様な重み付けしたアス
ペクト比表現を使用して、それらの値が各々7ビツトで
表現されるか又は精度を失うこと無しに7ビツトに丸め
ることが可能である様に、それらの値を維持している。
したアスペクト比を表しており、その重み付けしたアス
ペクト比は、特徴ベクトルを画定する残りのバイトと相
対的な、既知の文字に対して未知の文字を比較する上で
アスペクト比の相対的な重要性が決定されている。この
実施例においては、複数個のこの様な重み付けしたアス
ペクト比表現を使用して、それらの値が各々7ビツトで
表現されるか又は精度を失うこと無しに7ビツトに丸め
ることが可能である様に、それらの値を維持している。
これが必要でない場合には、単一のアスペクト比バイト
を使用することが可能である。
を使用することが可能である。
本発明のこの実施例においては、値には、正確に文字を
認識するのに最も効果的であると決定さねた重み付は係
数の実際には1/4であり、従って特徴ベクトルには1
6個のアスペクトフィールドがある。この様に、認識さ
れるべき文字を表す特徴ベクトルを既知の基準文字特徴
ベクトルと比較する場合に、各アスペクト比バイトは、
初期の40バイトの各々がどの様にして処理されたがと
いうことと同一の態様で処理される。換言すると、2つ
の特徴ベクトルを比較する場合、以下の式が実行される
。
認識するのに最も効果的であると決定さねた重み付は係
数の実際には1/4であり、従って特徴ベクトルには1
6個のアスペクトフィールドがある。この様に、認識さ
れるべき文字を表す特徴ベクトルを既知の基準文字特徴
ベクトルと比較する場合に、各アスペクト比バイトは、
初期の40バイトの各々がどの様にして処理されたがと
いうことと同一の態様で処理される。換言すると、2つ
の特徴ベクトルを比較する場合、以下の式が実行される
。
D(X、Y) = Σ(Xi−Yi)2■=1
X=特徴ベクトルX
■=特徴ベクトルY
D(X、Y) =特徴ベクトルXと特徴ベクトルYとの
間の距離 Xi =特徴ベクトルXのi番目要素 Yi =特徴ベクトルYのi番目要素 N =各特徴ベクトルにおける要素数(40個の混同さ
せた画素バイト及びアスペクト比を表す16個のバイト
を持った上述した特徴ベクトルにおいてN=56) 以上、本発明の具体的実施の態様に付いて詳細に説明し
たが、本発明はこれら具体例にのみ限定されるべきもの
では無く、本発明の技術的範囲を逸脱すること無しに種
々の変形が可能であることは勿論である。
間の距離 Xi =特徴ベクトルXのi番目要素 Yi =特徴ベクトルYのi番目要素 N =各特徴ベクトルにおける要素数(40個の混同さ
せた画素バイト及びアスペクト比を表す16個のバイト
を持った上述した特徴ベクトルにおいてN=56) 以上、本発明の具体的実施の態様に付いて詳細に説明し
たが、本発明はこれら具体例にのみ限定されるべきもの
では無く、本発明の技術的範囲を逸脱すること無しに種
々の変形が可能であることは勿論である。
第1図は典型的な従来技術のパターン乃至は文字認識方
式の物理的構成及び処理フローの両方を示すブロック線
図、第2a図乃至第2c図は画像における画素を表すビ
ットを含んだ第1寸法のマー調− トリクスをその画像の混同させたものを表すバイトを含
んだ第2寸法のマトリクスへ変換させる為の本発明に基
づいて使用される技術を示す各概略図、第3a図乃至第
3Q図はiI!ii像内の画素を表すビットを含む第1
寸法の7トリクスをその画像の混同させたものを表すバ
イトを含んだ第2寸法のマトリクスへ変換させる為の本
発明に基づいて使用される技術を示した各概略図、第4
図は第3a図及び第3b図の方法を示したフローチャー
ト図、第5図は第3b図及び第3C図の方法を示したフ
ローチャー1・図、第6図は中間アレイを使用しない本
発明の同様の方法を示したフローチャー1〜図、である
。 (符号の説明) 11:入力パターン 12:デジタイザ 13:メモリ 14:セグメンテーション 15:特徴抽出手段 16:識別手段 17:出力手段 特許出願人 ザ パランチール コーポレーショ
ン X力1′イ 究P高ルイ
弘女ヱ・イ1 i i
33
B2O33ii 17
F工G、2b 手続朔t−zJ三二書(方式) 昭和62年4月15日 特許庁長官 黒 1)明 雄 殿 1、事件の表示 昭和61年 特 許 願 第23
8156号2、発明の名称 パターン認識方式にお
いて使用する特徴抽出技術3、補正をする者 事件との関係 特許出願人 名称 ザ パランチール コーポレーション4、
代理人
式の物理的構成及び処理フローの両方を示すブロック線
図、第2a図乃至第2c図は画像における画素を表すビ
ットを含んだ第1寸法のマー調− トリクスをその画像の混同させたものを表すバイトを含
んだ第2寸法のマトリクスへ変換させる為の本発明に基
づいて使用される技術を示す各概略図、第3a図乃至第
3Q図はiI!ii像内の画素を表すビットを含む第1
寸法の7トリクスをその画像の混同させたものを表すバ
イトを含んだ第2寸法のマトリクスへ変換させる為の本
発明に基づいて使用される技術を示した各概略図、第4
図は第3a図及び第3b図の方法を示したフローチャー
ト図、第5図は第3b図及び第3C図の方法を示したフ
ローチャー1・図、第6図は中間アレイを使用しない本
発明の同様の方法を示したフローチャー1〜図、である
。 (符号の説明) 11:入力パターン 12:デジタイザ 13:メモリ 14:セグメンテーション 15:特徴抽出手段 16:識別手段 17:出力手段 特許出願人 ザ パランチール コーポレーショ
ン X力1′イ 究P高ルイ
弘女ヱ・イ1 i i
33
B2O33ii 17
F工G、2b 手続朔t−zJ三二書(方式) 昭和62年4月15日 特許庁長官 黒 1)明 雄 殿 1、事件の表示 昭和61年 特 許 願 第23
8156号2、発明の名称 パターン認識方式にお
いて使用する特徴抽出技術3、補正をする者 事件との関係 特許出願人 名称 ザ パランチール コーポレーション4、
代理人
Claims (1)
- 【特許請求の範囲】 1、二進又は中間調画素データからなるパターンの特徴
を抽出する方法において、複数個のパターン画像をフェ
ッチし、前記各パターン画像を複数個の領域に分割し、
前記各画像に対して変換を入力データに与えて前記領域
内の画素値情報を混同させることにより発生される入力
パターンの「不鮮明」化とさせ、その「不鮮明」とされ
たデータを使用してパターン認識用の特徴ベクトル又は
特徴ベクトルの一部を発生する、上記各ステップを有す
ることを特徴とする方法。 2、特許請求の範囲第1項において、前記領域は該パタ
ーンの幅に渡って均等に離隔されていることを特徴とす
る方法。 3、特許請求の範囲第1項において、前記領域は該パタ
ーンの高さに沿って均等に離隔されていることを特徴と
する方法。 4、特許請求の範囲第2項において、該パターンの幅に
渡っての前記均等な間隔が該パターンを水平方向に5つ
の等しい部分に分割することを特徴とする方法。 5、特許請求の範囲第3項において、該パターンの高さ
に沿っての塩基均等な間隔が該パターンを垂直方向に8
つの等しい部分に分割することを特徴とする方法。 6、特許請求の範囲第1項において、前記パターンは二
進データから構成されることを特徴とする方法。 7、特許請求の範囲第6項において、前記二進パターン
は文字であることを特徴とする方法。 8、特許請求の範囲第1項において、前記「不鮮明」化
は前記領域内の中間調レベルの画素を加算することによ
って行われることを特徴とする方法。 9、特許請求の範囲第8項において、前記和は該特徴ベ
クトルにおける要素となることを特徴とする方法。 10、特許請求の範囲第6項において、前記「不鮮明」
化は前記領域内の黒画素の数を加算することによって行
われることを特徴とする方法。 11、特許請求の範囲第10項において、前記和は該特
徴ベクトルにおける要素となることを特徴とする方法。 12、特許請求の範囲第8項又は第10項において、前
記加算を行う場合に、Pをパターン画像が分割される垂
直領域の数であり且つQをパターン画像が分割される水
平領域の数として各々が垂直にP回且つ水平にQ回書き
込まれたオリジナルのパターン画像の要素からなる中間
アレイを形成し、水平寸法がQで垂直寸法がPである出
力アレイを形成し、前記出力アレイはMを画素でのオリ
ジナルのパターン画像の高さであり且つNを画素でのオ
リジナルのパターン画像の幅としてM垂直要素とN水平
要素のグループにおいて加算された中間アレイの要素か
ら構成されていることを特徴とする方法。 13、特許請求の範囲第8項又は第10項において、前
記加算を行う場合に、オリジナルのパターン画像が水平
に分割される領域数に等しい幅及びオリジナルのパター
ン画像の画素における高さに等しい高さの中間アレイを
形成し、カウンタを使用して該パターン画像におけるど
の画素のその値を該中間アレイのどの要素へ加算させる
かを決定し、カウンタを使用して該中間アレイのどの要
素のその値を該出力アレイのどの要素へ加算させるかを
決定することを特徴とする方法。 14、特許請求の範囲第8項又は第10項において、前
記加算はカウンタを使用して行われ、該パターン画像に
おけるどの画素のその値を該出力アレイのどの要素へ加
算させるかを決定することを特徴とする方法。 15、特許請求の範囲第1項において、「不鮮明」とさ
れたか又は混同されたデータに関係しない付加的な特徴
を前記「不鮮明」とされたか又は混同されたデータから
なる特徴ベクトルへ加算されることを特徴とする方法。 16、特許請求の範囲第15項において、幾つかの付加
的な特徴がオリジナルなパターン画像のアスペクト比に
関係していることを特徴とする方法。 17、特許請求の範囲第16項において、オリジナルの
パターン画像のアスペクト比に関連する特徴がNをオリ
ジナルなパターン画像の画素における幅とし且つMをオ
リジナルなパターン画像の画素における高さとしてN/
Mの平方根に比例することを特徴とする方法。 18、特許請求の範囲第17項において、前記比例の係
数は [(3(KKHEIGHT)/10)・(2)^1^3
^.^5]^1^/^2であり、KKHEIGHTは該
特徴ベクトルにおける垂直要素の数であることを特徴と
する方法。 19、特許請求の範囲第1項において、最終の特徴ベク
トルの部分が正規化されていることを特徴とする方法。 20、特許請求の範囲第19項において、「不鮮明」化
又は混同化から派生される特徴ベクトル要素が正規化さ
れることを特徴とする方法。 21、特許請求の範囲第20項において、この様な正規
化が行われて「不鮮明」化又は混同化から派生されるベ
クトル要素をオリジナルのパターン画像の元の寸法に影
響を受けなくさせることを特徴とする方法。 22、特許請求の範囲第19項又は第20項において、
「不鮮明」化又は混同化から派生される特徴ベクトルの
一部のノルムは256であることを特徴とする方法。 23、入力マトリクスを出力マトリクスへ変換させる方
法において、入力マトリクスを得、前記入力マトリクス
の領域内に含まれる情報を使用して前記出力マトリクス
の対応する領域に対してデータを与える、上記各ステッ
プを有することを特徴とする方法。 24、特許請求の範囲第23項において、前記入力マト
リクスの前記領域がオーバーラップすることを特徴とす
る方法。 25、特許請求の範囲第23項において、データを供給
するステップが、前記入力マトリクスの領域内に含まれ
る前記情報を使用して数学的関数を実施して前記出力マ
トリクスの対応する領域に対して前記データを形成する
ステップを有することを特徴とする方法。 26、特許請求の範囲第25項において、前記数学的関
数は加算、重み付き加算のいずれかから選択されたもの
であることを特徴とする方法。 27、特許請求の範囲第23項において、前記出力マト
リクスは5要素幅で8要素高さであることを特徴とする
方法。 28、入力パターンを表す幅Pで高さQの出力特徴ベク
トルアレイを形成する方法において、幅Nで高さMの入
力アレイの形態で前記入力パターンを得、幅NPで高さ
MQを持った中間アレイを形成し、前記中間アレイを前
記入力アレイからのデータで重点し、前記出力アレイを
前記中間アレイからのデータで重点する、上記各ステッ
プを有することを特徴とする方法。 29、特許請求の範囲第28項において、前記中間アレ
イを充填する前記ステップは、前記入力アレイ内の各要
素を水平方向にQ回且つ垂直方向にP回前記中間アレイ
内に入れるステップを有することを特徴とする方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US06/786,037 US4700400A (en) | 1985-10-10 | 1985-10-10 | Feature extraction technique for use in a pattern recognition system |
US786037 | 1985-10-10 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS62221785A true JPS62221785A (ja) | 1987-09-29 |
Family
ID=25137412
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61238156A Pending JPS62221785A (ja) | 1985-10-10 | 1986-10-08 | パタ−ン認識方式において使用する特徴抽出技術 |
Country Status (4)
Country | Link |
---|---|
US (1) | US4700400A (ja) |
EP (1) | EP0228776B1 (ja) |
JP (1) | JPS62221785A (ja) |
DE (1) | DE3689416T2 (ja) |
Families Citing this family (50)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4754489A (en) * | 1985-10-15 | 1988-06-28 | The Palantir Corporation | Means for resolving ambiguities in text based upon character context |
US4903313A (en) * | 1986-07-03 | 1990-02-20 | Ricoh Company, Ltd. | Character recognition method |
US4841473A (en) * | 1986-12-19 | 1989-06-20 | Robert S. Salzman | Computer architecture providing programmable degrees of an almost condition |
JP2696211B2 (ja) * | 1987-04-20 | 1998-01-14 | 株式会社日立製作所 | 濃淡画像からのパターン認識方法及び装置 |
US5052045A (en) * | 1988-08-29 | 1991-09-24 | Raytheon Company | Confirmed boundary pattern matching |
US5173949A (en) * | 1988-08-29 | 1992-12-22 | Raytheon Company | Confirmed boundary pattern matching |
US5168529A (en) * | 1988-08-29 | 1992-12-01 | Rayethon Company | Confirmed boundary pattern matching |
US5168530A (en) * | 1988-08-29 | 1992-12-01 | Raytheon Company | Confirmed boundary pattern matching |
US5027422A (en) * | 1988-08-29 | 1991-06-25 | Raytheon Company | Confirmed boundary pattern matching |
JP2523222B2 (ja) * | 1989-12-08 | 1996-08-07 | ゼロックス コーポレーション | 画像縮小/拡大方法及び装置 |
US5272764A (en) * | 1989-12-08 | 1993-12-21 | Xerox Corporation | Detection of highlighted regions |
US5131049A (en) * | 1989-12-08 | 1992-07-14 | Xerox Corporation | Identification, characterization, and segmentation of halftone or stippled regions of binary images by growing a seed to a clipping mask |
US5202933A (en) * | 1989-12-08 | 1993-04-13 | Xerox Corporation | Segmentation of text and graphics |
US5129014A (en) * | 1989-12-08 | 1992-07-07 | Xerox Corporation | Image registration |
US5065437A (en) * | 1989-12-08 | 1991-11-12 | Xerox Corporation | Identification and segmentation of finely textured and solid regions of binary images |
US5187753A (en) * | 1989-12-08 | 1993-02-16 | Xerox Corporation | Method and apparatus for identification and correction of document skew |
US5048109A (en) * | 1989-12-08 | 1991-09-10 | Xerox Corporation | Detection of highlighted regions |
US5193122A (en) * | 1990-12-03 | 1993-03-09 | Xerox Corporation | High speed halftone detection technique |
US5341438A (en) * | 1992-07-22 | 1994-08-23 | Eastman Kodak Company | Method and apparatus for segmenting and classifying unconstrained handwritten characters |
JPH0749927A (ja) * | 1993-08-09 | 1995-02-21 | Nireco Corp | パターン認識方法 |
JP2000181993A (ja) * | 1998-12-16 | 2000-06-30 | Fujitsu Ltd | 文字認識方法および装置 |
US6718074B1 (en) * | 2000-06-02 | 2004-04-06 | Cognex Corporation | Method and apparatus for inspection for under-resolved features in digital images |
JP4624594B2 (ja) * | 2000-06-28 | 2011-02-02 | パナソニック株式会社 | 物体認識方法および物体認識装置 |
US7010166B2 (en) * | 2000-11-22 | 2006-03-07 | Lockheed Martin Corporation | Character recognition system and method using spatial and structural feature extraction |
US7271806B2 (en) * | 2002-12-18 | 2007-09-18 | Microsoft Corporation | International automatic line height system and method |
US20040119714A1 (en) * | 2002-12-18 | 2004-06-24 | Microsoft Corporation | International automatic font size system and method |
US7385606B2 (en) * | 2002-12-18 | 2008-06-10 | Microsoft Corporation | International font measurement system and method |
US7409108B2 (en) * | 2003-09-22 | 2008-08-05 | Siemens Medical Solutions Usa, Inc. | Method and system for hybrid rigid registration of 2D/3D medical images |
US9443298B2 (en) | 2012-03-02 | 2016-09-13 | Authentect, Inc. | Digital fingerprinting object authentication and anti-counterfeiting system |
US8774455B2 (en) | 2011-03-02 | 2014-07-08 | Raf Technology, Inc. | Document fingerprinting |
US10346852B2 (en) * | 2016-02-19 | 2019-07-09 | Alitheon, Inc. | Preserving authentication under item change |
US10867301B2 (en) * | 2016-04-18 | 2020-12-15 | Alitheon, Inc. | Authentication-triggered processes |
US10740767B2 (en) | 2016-06-28 | 2020-08-11 | Alitheon, Inc. | Centralized databases storing digital fingerprints of objects for collaborative authentication |
US10915612B2 (en) | 2016-07-05 | 2021-02-09 | Alitheon, Inc. | Authenticated production |
US10902540B2 (en) | 2016-08-12 | 2021-01-26 | Alitheon, Inc. | Event-driven authentication of physical objects |
US10839528B2 (en) | 2016-08-19 | 2020-11-17 | Alitheon, Inc. | Authentication-based tracking |
US10733428B2 (en) * | 2017-02-01 | 2020-08-04 | The Government Of The United States Of America, As Represented By The Secretary Of The Navy | Recognition actions on event based cameras with motion event features |
EP3435287A3 (en) | 2017-07-25 | 2019-05-01 | Alitheon, Inc. | Model-based digital fingerprinting |
US11087013B2 (en) | 2018-01-22 | 2021-08-10 | Alitheon, Inc. | Secure digital fingerprint key object database |
US10963670B2 (en) | 2019-02-06 | 2021-03-30 | Alitheon, Inc. | Object change detection and measurement using digital fingerprints |
EP3734506A1 (en) | 2019-05-02 | 2020-11-04 | Alitheon, Inc. | Automated authentication region localization and capture |
EP3736717A1 (en) | 2019-05-10 | 2020-11-11 | Alitheon, Inc. | Loop chain digital fingerprint method and system |
US11238146B2 (en) | 2019-10-17 | 2022-02-01 | Alitheon, Inc. | Securing composite objects using digital fingerprints |
EP3859603A1 (en) | 2020-01-28 | 2021-08-04 | Alitheon, Inc. | Depth-based digital fingerprinting |
EP3885984A1 (en) | 2020-03-23 | 2021-09-29 | Alitheon, Inc. | Facial biometrics system and method of using digital fingerprints |
EP3885982A3 (en) | 2020-03-23 | 2021-12-22 | Alitheon, Inc. | Hand biometrics system and method using digital fingerprints |
EP3929806A3 (en) | 2020-04-06 | 2022-03-09 | Alitheon, Inc. | Local encoding of intrinsic authentication data |
US11663849B1 (en) | 2020-04-23 | 2023-05-30 | Alitheon, Inc. | Transform pyramiding for fingerprint matching system and method |
US11983957B2 (en) | 2020-05-28 | 2024-05-14 | Alitheon, Inc. | Irreversible digital fingerprints for preserving object security |
US11700123B2 (en) | 2020-06-17 | 2023-07-11 | Alitheon, Inc. | Asset-backed digital security tokens |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6065384A (ja) * | 1983-09-19 | 1985-04-15 | Nec Corp | 正規化回路 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2113519A1 (de) * | 1971-03-19 | 1972-09-28 | Klemt Kg Arthur | Verfahren und Vorrichtung zur rasterfoermigen Abtastung von Schriftzeichen,insbesondere Ziffern |
US3784981A (en) * | 1971-07-28 | 1974-01-08 | Recognition Equipment Inc | Normalizer for optical character recognition system |
CH572249A5 (en) * | 1974-10-25 | 1976-01-30 | Altmann Andre Jean Pierre | Printed character processing for automatic character recognition - arranges character in series of matrices and processes functions |
US4259661A (en) * | 1978-09-01 | 1981-03-31 | Burroughs Corporation | Apparatus and method for recognizing a pattern |
US4542527A (en) * | 1982-05-17 | 1985-09-17 | Tokyo Shibaura Denki Kabushiki Kaisha | Image processing device for continuously extracting features of small regions of an image |
-
1985
- 1985-10-10 US US06/786,037 patent/US4700400A/en not_active Expired - Lifetime
-
1986
- 1986-10-08 JP JP61238156A patent/JPS62221785A/ja active Pending
- 1986-10-10 DE DE3689416T patent/DE3689416T2/de not_active Expired - Fee Related
- 1986-10-10 EP EP86307868A patent/EP0228776B1/en not_active Expired - Lifetime
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6065384A (ja) * | 1983-09-19 | 1985-04-15 | Nec Corp | 正規化回路 |
Also Published As
Publication number | Publication date |
---|---|
EP0228776B1 (en) | 1993-12-15 |
EP0228776A2 (en) | 1987-07-15 |
DE3689416D1 (de) | 1994-01-27 |
DE3689416T2 (de) | 1994-12-15 |
EP0228776A3 (en) | 1990-03-28 |
US4700400A (en) | 1987-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS62221785A (ja) | パタ−ン認識方式において使用する特徴抽出技術 | |
US6081620A (en) | System and method for pattern recognition | |
US5377280A (en) | Method and apparatus for automatic language determination of European script documents | |
US6185341B1 (en) | Image processing using vector data to reduce noise | |
US6400853B1 (en) | Image retrieval apparatus and method | |
US5687253A (en) | Method for comparing word shapes | |
US4903312A (en) | Character recognition with variable subdivisions of a character region | |
JP4607633B2 (ja) | 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法 | |
US5557689A (en) | Optical word recognition by examination of word shape | |
US5539840A (en) | Multifont optical character recognition using a box connectivity approach | |
US7277584B2 (en) | Form recognition system, form recognition method, program and storage medium | |
RU2640322C2 (ru) | Способы и системы эффективного автоматического распознавания символов | |
US9633256B2 (en) | Methods and systems for efficient automated symbol recognition using multiple clusters of symbol patterns | |
US5835638A (en) | Method and apparatus for comparing symbols extracted from binary images of text using topology preserved dilated representations of the symbols | |
US20160048728A1 (en) | Method and system for optical character recognition that short circuit processing for non-character containing candidate symbol images | |
US5825925A (en) | Image classifier utilizing class distribution maps for character recognition | |
RU2582064C1 (ru) | Способы и системы эффективного автоматического распознавания символов с использованием леса решений | |
JPH0333990A (ja) | マスク処理を用いる光学式文字認識装置及び方法 | |
EP1010128B1 (en) | Method for performing character recognition on a pixel matrix | |
JP2832928B2 (ja) | 文字認識方法 | |
JP2788506B2 (ja) | 文字認識装置 | |
JP2993533B2 (ja) | 情報処理装置及び文字認識装置 | |
JP2827288B2 (ja) | 文字認識装置 | |
JPS6089290A (ja) | パタ−ン認識方法 | |
Salameh et al. | hyper recognition techniques for English digits using statistical analysis of nodes and Fuzzy Logic for pattern recognition |