JPH0773329A - 画像処理方法および装置 - Google Patents
画像処理方法および装置Info
- Publication number
- JPH0773329A JPH0773329A JP6092540A JP9254094A JPH0773329A JP H0773329 A JPH0773329 A JP H0773329A JP 6092540 A JP6092540 A JP 6092540A JP 9254094 A JP9254094 A JP 9254094A JP H0773329 A JPH0773329 A JP H0773329A
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- image
- neural network
- detected
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Character Discrimination (AREA)
- Image Analysis (AREA)
Abstract
(57)【要約】
【目的】 ノイズの多い画像からパターンを精度良く認
識することのできる画像処理方法及び画像処理装置を提
供する。 【構成】 光学的文字認識を例とするパターン認識は、
ニューラルネットワークを学習することと、画像を走査
することと、検出されたパターンを前処理することと、
そして検出され前処理されたパターンを、学習したニュ
ーラルネットワークに向けることにより達成される。こ
の前処理はパターンの重心を決定することと、この重心
を、パターンを入れるフレームの中心に位置させること
から成る。ニューラルネットワークの学習は、フレーム
内のテンプレートパターンを、ニューラルネットワーク
に向ける前に、無作為に移し替えることから成る。
識することのできる画像処理方法及び画像処理装置を提
供する。 【構成】 光学的文字認識を例とするパターン認識は、
ニューラルネットワークを学習することと、画像を走査
することと、検出されたパターンを前処理することと、
そして検出され前処理されたパターンを、学習したニュ
ーラルネットワークに向けることにより達成される。こ
の前処理はパターンの重心を決定することと、この重心
を、パターンを入れるフレームの中心に位置させること
から成る。ニューラルネットワークの学習は、フレーム
内のテンプレートパターンを、ニューラルネットワーク
に向ける前に、無作為に移し替えることから成る。
Description
【0001】
【産業上の利用分野】本発明は、一般的にはコンピュー
タ処理による画像処理装置及び方法に係り、具体的に
は、光学的文字の如きの検出されたパターンを学習した
ニューラルネットワークに適用することによって認識す
る装置及び方法に関する。ここで、ニューラルネットワ
ークの学習は、上述のようなパターンを、一組のパター
ンテンプレートの1つに対応するものとして認識するよ
うになされる。
タ処理による画像処理装置及び方法に係り、具体的に
は、光学的文字の如きの検出されたパターンを学習した
ニューラルネットワークに適用することによって認識す
る装置及び方法に関する。ここで、ニューラルネットワ
ークの学習は、上述のようなパターンを、一組のパター
ンテンプレートの1つに対応するものとして認識するよ
うになされる。
【0002】
【従来の技術】パターン認識に関して、多くの手法が提
案されてきた。特に光学的文字認識(OCR)の領域
で、多くの研究開発が行われてきた。例えば、S.N.Sr
ihari,V.Govindaraju、J.J.Hull、R.K.Fenrich a
nd S.Lamによる「パターン認識、文字認識及び光学的
文字読み取り装置(Pattern Recognition,Character Re
cognition and Optical Character Readers)」(Techni
cal Report CEDAR−TR−91−1,Center for Document A
nalysis and Recognition,State University of New Y
ork at Buffalo,Buffalo,N.Y.,May1991)がある。
案されてきた。特に光学的文字認識(OCR)の領域
で、多くの研究開発が行われてきた。例えば、S.N.Sr
ihari,V.Govindaraju、J.J.Hull、R.K.Fenrich a
nd S.Lamによる「パターン認識、文字認識及び光学的
文字読み取り装置(Pattern Recognition,Character Re
cognition and Optical Character Readers)」(Techni
cal Report CEDAR−TR−91−1,Center for Document A
nalysis and Recognition,State University of New Y
ork at Buffalo,Buffalo,N.Y.,May1991)がある。
【0003】OCRに関する既知の手法はその方法にお
いて幅広く多様である。いくつかの初期の試みは、既知
の文字テンプレートの上に、ビットマップ状の検出され
た画像を重ねるものであった。このような手法は、フォ
ントの相違、スキュー、拡大、縮小のような要素に非常
に影響されやすかった。他の方法は、検出された文字か
ら特別な特徴を抽出するという方式に集中した。しか
し、この手法は、特別の選択と特徴の処理次第で結果が
変化しまうというものであった。
いて幅広く多様である。いくつかの初期の試みは、既知
の文字テンプレートの上に、ビットマップ状の検出され
た画像を重ねるものであった。このような手法は、フォ
ントの相違、スキュー、拡大、縮小のような要素に非常
に影響されやすかった。他の方法は、検出された文字か
ら特別な特徴を抽出するという方式に集中した。しか
し、この手法は、特別の選択と特徴の処理次第で結果が
変化しまうというものであった。
【0004】米国特許第3,846,752号(発明
者:Nakanoその他)は、文字の濃度分布を使用す
る文字認識装置を開示する。濃度分布の周波数スペクト
ルが、既知の文字に対応する濃度分布の周波数スペクト
ルと比較され、そしてその検出された文字のフーリエ変
換スペクトルのパターンに最も近いフーリエ変換スペク
トルパターンを有する既知の文字が、認識された文字と
して出力される。
者:Nakanoその他)は、文字の濃度分布を使用す
る文字認識装置を開示する。濃度分布の周波数スペクト
ルが、既知の文字に対応する濃度分布の周波数スペクト
ルと比較され、そしてその検出された文字のフーリエ変
換スペクトルのパターンに最も近いフーリエ変換スペク
トルパターンを有する既知の文字が、認識された文字と
して出力される。
【0005】米国特許第4,817,176号(発明
者:マーシャルその他)は、振幅と位相の相違に関する
種々の修正を伴う、フーリエ変換を使用する他のパター
ン認識の手法を開示する。米国特許第3,930,23
1号(ヘンリクソンジュニアその他)は、パターン濃度
の検出と特徴を認識するために、多数のセル状グリッド
の使用を開示する。その多重のセルグリッドによって検
出された文字に各々認識可能な特徴が有るか無いかに基
いて、ベクトル信号が生成され、そしてこのベクトルは
既知の文字を表現するベクトルと比較される。
者:マーシャルその他)は、振幅と位相の相違に関する
種々の修正を伴う、フーリエ変換を使用する他のパター
ン認識の手法を開示する。米国特許第3,930,23
1号(ヘンリクソンジュニアその他)は、パターン濃度
の検出と特徴を認識するために、多数のセル状グリッド
の使用を開示する。その多重のセルグリッドによって検
出された文字に各々認識可能な特徴が有るか無いかに基
いて、ベクトル信号が生成され、そしてこのベクトルは
既知の文字を表現するベクトルと比較される。
【0006】米国特許第3,993,976号(ギンズ
バーグ)は、空間周波数を得る変換を使用するパターン
解析を開示する。この空間周波数は、検出されたパター
ンの一般的な型、エッジ、テクスチャ、そして深さの情
報を決定するためのパターン情報を抽出するためにフィ
ルタ処理される。米国特許第4,513,441号(ヘ
ンショウ)は、2つの画像の合成オーバーレイを形成
し、そこにある位相の相違を調べることにより、この2
つの画像を比較する方法を開示する。
バーグ)は、空間周波数を得る変換を使用するパターン
解析を開示する。この空間周波数は、検出されたパター
ンの一般的な型、エッジ、テクスチャ、そして深さの情
報を決定するためのパターン情報を抽出するためにフィ
ルタ処理される。米国特許第4,513,441号(ヘ
ンショウ)は、2つの画像の合成オーバーレイを形成
し、そこにある位相の相違を調べることにより、この2
つの画像を比較する方法を開示する。
【0007】他の技術において、米国特許第4,22
5,850号(チャン)は、フーリエ変換技術の使用を
開示して、指紋画像を含まない画像領域の範囲を検出す
る。米国特許第4,547,800号(マサキ)は、作
品の位置の偏りを検出する方式を開示し、その作品の画
像の上で並列変換と回転とを行ない、基準画像情報と比
較する。米国特許第4,346,405号(ヨダ)は、
テレビの映像スクリーンを複数のブロックに分割し、視
覚情報に関するX−Yデータを処理することにより、テ
レビの画像における時間的な変化を検出する方式を開示
する。米国特許第4,241,329号は、連続する音
声信号においてキーワードを認識するために、スペクト
ル統計を使用する音声認識を開示する。米国特許第3,
760,356号は、一組の二進数の範囲内で極値とな
る二進数を決定するための技術を説明する。
5,850号(チャン)は、フーリエ変換技術の使用を
開示して、指紋画像を含まない画像領域の範囲を検出す
る。米国特許第4,547,800号(マサキ)は、作
品の位置の偏りを検出する方式を開示し、その作品の画
像の上で並列変換と回転とを行ない、基準画像情報と比
較する。米国特許第4,346,405号(ヨダ)は、
テレビの映像スクリーンを複数のブロックに分割し、視
覚情報に関するX−Yデータを処理することにより、テ
レビの画像における時間的な変化を検出する方式を開示
する。米国特許第4,241,329号は、連続する音
声信号においてキーワードを認識するために、スペクト
ル統計を使用する音声認識を開示する。米国特許第3,
760,356号は、一組の二進数の範囲内で極値とな
る二進数を決定するための技術を説明する。
【0008】ニューラルネットワークはまた光学的文字
認識の分野にも応用されてきた。J.Loncelle『光学的文
字認識と協同ニューラルネットワーク技術』「人工ニュ
ーラルネットワーク2」(I. AleksanderとJ. Taylor
編、Elsevier科学出版、B.V.、1992)におい
て、ニューラルネットワークに基づき、生じるエラー確
率が約10ー2であるOCRシステムが説明されている。
A. KhotanzadとJ. Lu.『ニューラルネットワークを使用
する不変な映像表現の分類』(音響効果、音声、シグナ
ル処理6に関するアメリカ電気電子学会会報38号10
28ー1038ページ、1990年6月)において、雑
音を伴う画像に対してはやや精度に乏しいが、高いSN
比率を有する画像に対しては、完全な認識精度をもたら
す、ニューラルネットワークに基づくもう1つのOCR
システムが説明される。
認識の分野にも応用されてきた。J.Loncelle『光学的文
字認識と協同ニューラルネットワーク技術』「人工ニュ
ーラルネットワーク2」(I. AleksanderとJ. Taylor
編、Elsevier科学出版、B.V.、1992)におい
て、ニューラルネットワークに基づき、生じるエラー確
率が約10ー2であるOCRシステムが説明されている。
A. KhotanzadとJ. Lu.『ニューラルネットワークを使用
する不変な映像表現の分類』(音響効果、音声、シグナ
ル処理6に関するアメリカ電気電子学会会報38号10
28ー1038ページ、1990年6月)において、雑
音を伴う画像に対してはやや精度に乏しいが、高いSN
比率を有する画像に対しては、完全な認識精度をもたら
す、ニューラルネットワークに基づくもう1つのOCR
システムが説明される。
【0009】
【発明が解決しようとする課題】しかしながら、上記の
いずれの開示も、光学的文字や他のパターン等がかなり
の雑音を含むような場合には、その光学的文字や他のパ
ターンを既知の一組のパターンの1つに対応するものと
して認識することに関して、十分な技術を提供するもの
ではない。それ故、もしニューラルネットワークに基づ
くOCRシステムと方法が、不完全な画像に対しても高
い精度を有するように開発できるならば、それは望まし
いことである。
いずれの開示も、光学的文字や他のパターン等がかなり
の雑音を含むような場合には、その光学的文字や他のパ
ターンを既知の一組のパターンの1つに対応するものと
して認識することに関して、十分な技術を提供するもの
ではない。それ故、もしニューラルネットワークに基づ
くOCRシステムと方法が、不完全な画像に対しても高
い精度を有するように開発できるならば、それは望まし
いことである。
【0010】従って、本発明の目的は、ノイズの多い画
像からパターンを精度良く認識することのできる画像処
理方法及び画像処理装置を提供するものである。
像からパターンを精度良く認識することのできる画像処
理方法及び画像処理装置を提供するものである。
【0011】
【課題を解決するための手段】上記課題を達成するため
の本発明の画像処理方法の構成は、画像中のパターン
を、一組の既知のテンプレート中において認識するコン
ピュータ処理による画像処理方法であって、(a)前記
一組の既知のテンプレートを使用してニューラルネット
ワークを学習する工程と、(b)前記画像を走査する工
程と、(c)前記走査された画像を分割することにより
前記パターンを検出する工程と、(d)前記検出された
パターンを前処理する工程と、(e)前記検出され前処
理されたパターンを、前記学習されたニューラルネット
ワークに適用することにより、その検出され前処理され
たパターンを、前記既知のテンプレートの1つに対応す
るものとして認識する工程とを具備することを特徴とす
る。
の本発明の画像処理方法の構成は、画像中のパターン
を、一組の既知のテンプレート中において認識するコン
ピュータ処理による画像処理方法であって、(a)前記
一組の既知のテンプレートを使用してニューラルネット
ワークを学習する工程と、(b)前記画像を走査する工
程と、(c)前記走査された画像を分割することにより
前記パターンを検出する工程と、(d)前記検出された
パターンを前処理する工程と、(e)前記検出され前処
理されたパターンを、前記学習されたニューラルネット
ワークに適用することにより、その検出され前処理され
たパターンを、前記既知のテンプレートの1つに対応す
るものとして認識する工程とを具備することを特徴とす
る。
【0012】また、上記課題を達成するための本発明の
画像処理装置は、画像中のパターンを、一組の既知のテ
ンプレート中において認識する画像処理装置であって、
前記画像を走査する工程と、前記走査手段により生成さ
れた画像信号を入力として受けるとともに、この画像信
号から、複数の多値の画素値を含む前処理されたパター
ン信号を生成するように適合された前処理手段と、この
前処理されたパターン信号を入力として受けるととも
に、そのパターン信号から、前記テンプレートの1つに
対応し前記パターンを示す出力信号を生成するように適
合されたニューラルネットワークとを具備する。
画像処理装置は、画像中のパターンを、一組の既知のテ
ンプレート中において認識する画像処理装置であって、
前記画像を走査する工程と、前記走査手段により生成さ
れた画像信号を入力として受けるとともに、この画像信
号から、複数の多値の画素値を含む前処理されたパター
ン信号を生成するように適合された前処理手段と、この
前処理されたパターン信号を入力として受けるととも
に、そのパターン信号から、前記テンプレートの1つに
対応し前記パターンを示す出力信号を生成するように適
合されたニューラルネットワークとを具備する。
【0013】
【作用】即ち、具体的には、初めに既知のテンプレート
パターンを用いてニューラルネットワーク(108)を
学習し、それからその検出されたパターンを前処理し、
そして検出され前処理されたパターンを、そのニューラ
ルネットワークに適用することによって、検出されたパ
ターンは、一組の既知のテンプレートパターンのなかで
認識される。この発明の1つの面において、ニューラル
ネットワークの学習は、パターンフレーム内の一組のテ
ンプレートパターンの各々の位置が無作為に変えられる
前処理から成る。この発明のもう1つの面において、前
処理は検出されたパターンを含む多くの値を持つ画素の
値を反転して、雑音レベルを決定し、そしてこの雑音レ
ベルを画素の値から引き算し、ある閾値未満の値を有す
る画素に、新しいベースラインの値を選定することによ
って完成する。
パターンを用いてニューラルネットワーク(108)を
学習し、それからその検出されたパターンを前処理し、
そして検出され前処理されたパターンを、そのニューラ
ルネットワークに適用することによって、検出されたパ
ターンは、一組の既知のテンプレートパターンのなかで
認識される。この発明の1つの面において、ニューラル
ネットワークの学習は、パターンフレーム内の一組のテ
ンプレートパターンの各々の位置が無作為に変えられる
前処理から成る。この発明のもう1つの面において、前
処理は検出されたパターンを含む多くの値を持つ画素の
値を反転して、雑音レベルを決定し、そしてこの雑音レ
ベルを画素の値から引き算し、ある閾値未満の値を有す
る画素に、新しいベースラインの値を選定することによ
って完成する。
【0014】
【実施例】以下添付図面を参照して本発明の好適な実施
例を詳細に説明する。図1を参照すると、本発明による
パターン認識のためのシステム100が図示される。簡
単に説明すると、このシステム100は4つの主要な機
能ブロックから成る。スキャナ102は、認識対象のパ
ターンを含む走査画像を表す画素の値の二次元配列を得
るために使用される。セグメンタ104は、このパター
ンを他の画像要素から分けることにより検出する。プリ
プロセッサ106はパターン認識を容易にするために、
検出されたパターンを前処理する。ニューラルネットワ
ーク108は、この検出され前処理されたパターンを入
力として受け取り、認識されたパターンを表現する信号
を出力する。好適な実施例では、本発明を実行するため
に、従来型のスキャナ102とセグメンタ104を使用
するものとする。好適な実施例では、スキャナ102は
ヒューレットパッカード社の「スキャンジェットII
c」型デジタル式スキャナであり、1インチにつき40
0ドット(画素)の解像度を達成し、その各画素が8ビ
ットのグレイスケールの解像度で量子化される。セグメ
ンタ104は、80486(33MHz)型マイクロプロ
セッサを使用する従来型の汎用IBM互換のパーソナル
コンピュータで実行するソフトウエアによって、従来の
ように実行される。プリプロセッサ106は図2でより
詳細に説明され、ニューラルネットワーク108は図3
と図4においてより詳細に説明される。
例を詳細に説明する。図1を参照すると、本発明による
パターン認識のためのシステム100が図示される。簡
単に説明すると、このシステム100は4つの主要な機
能ブロックから成る。スキャナ102は、認識対象のパ
ターンを含む走査画像を表す画素の値の二次元配列を得
るために使用される。セグメンタ104は、このパター
ンを他の画像要素から分けることにより検出する。プリ
プロセッサ106はパターン認識を容易にするために、
検出されたパターンを前処理する。ニューラルネットワ
ーク108は、この検出され前処理されたパターンを入
力として受け取り、認識されたパターンを表現する信号
を出力する。好適な実施例では、本発明を実行するため
に、従来型のスキャナ102とセグメンタ104を使用
するものとする。好適な実施例では、スキャナ102は
ヒューレットパッカード社の「スキャンジェットII
c」型デジタル式スキャナであり、1インチにつき40
0ドット(画素)の解像度を達成し、その各画素が8ビ
ットのグレイスケールの解像度で量子化される。セグメ
ンタ104は、80486(33MHz)型マイクロプロ
セッサを使用する従来型の汎用IBM互換のパーソナル
コンピュータで実行するソフトウエアによって、従来の
ように実行される。プリプロセッサ106は図2でより
詳細に説明され、ニューラルネットワーク108は図3
と図4においてより詳細に説明される。
【0015】さて図2を参照すると、プリプロセッサ1
06は5つの主要な機能ブロックから成る。インバータ
202は、セグメンタ104からの検出されたパターン
画像から横50画素×縦60画素の表現を入力として取
り出し、それらの各画素の値を、オリジナルの画素値の
補数である値で置き換える。この動作により、画像の白
色の部分は黒色に反転され、画像の黒色の部分は白色に
反転される。好適な実施例では、スキャナ102とセグ
メンタ104は、黒白よりむしろグレイスケールの画像
を出力として供給するので、インバータ202も、ま
た、ライトグレイの画素はダークグレイに変え、ダーク
グレイ画素はライトグレイに変えることになる。好適な
実施例においては、スキャナ102とセグメンタ104
とは、3000平方画素のフレーム(横50画素×縦6
0画素)上に、1インチ当たり400(画素)ドットの
画像解像度を提供する。
06は5つの主要な機能ブロックから成る。インバータ
202は、セグメンタ104からの検出されたパターン
画像から横50画素×縦60画素の表現を入力として取
り出し、それらの各画素の値を、オリジナルの画素値の
補数である値で置き換える。この動作により、画像の白
色の部分は黒色に反転され、画像の黒色の部分は白色に
反転される。好適な実施例では、スキャナ102とセグ
メンタ104は、黒白よりむしろグレイスケールの画像
を出力として供給するので、インバータ202も、ま
た、ライトグレイの画素はダークグレイに変え、ダーク
グレイ画素はライトグレイに変えることになる。好適な
実施例においては、スキャナ102とセグメンタ104
とは、3000平方画素のフレーム(横50画素×縦6
0画素)上に、1インチ当たり400(画素)ドットの
画像解像度を提供する。
【0016】ノイズフィルター204は二つの機能を実
現する。第一に、ノイズフィルター204は、検出され
反転させられたパターンから最小の画素値を決定し、そ
の値をパターンの各画素から減じる。この結果、各パタ
ーンに対する最小の画素値はゼロになる。第二に、ノイ
ズフィルター204は、結果として生じる各画素値を最
小の閾値と比較し、その閾値未満の値を有する全ての画
素をベースライン(baseline value)値で置き換える。好
適な実施例では、上記閾値は、当該パターンにおける最
大の画素値の20%の値に設定され、そしてそのベース
ライン値はゼロにある。この画素値による置き換えによ
って、システム100の背景雑音に対する感度を、その
認識精度を著しく損なうことなく、低くするということ
が知られてきた。
現する。第一に、ノイズフィルター204は、検出され
反転させられたパターンから最小の画素値を決定し、そ
の値をパターンの各画素から減じる。この結果、各パタ
ーンに対する最小の画素値はゼロになる。第二に、ノイ
ズフィルター204は、結果として生じる各画素値を最
小の閾値と比較し、その閾値未満の値を有する全ての画
素をベースライン(baseline value)値で置き換える。好
適な実施例では、上記閾値は、当該パターンにおける最
大の画素値の20%の値に設定され、そしてそのベース
ライン値はゼロにある。この画素値による置き換えによ
って、システム100の背景雑音に対する感度を、その
認識精度を著しく損なうことなく、低くするということ
が知られてきた。
【0017】ノイズフィルター204の出力は重心位置
決定器206に送られる。重心位置決定器206は先
ず、ノイズフィルタ処理をした前記パターンの重心を決
定する。この重心はそのパターンにおける画素の座標と
画素値に対応する加重値との加重平均をとることにより
定義される位置である。重心が一旦決まると、パターン
全体は、重心が上記50×60のフレームの中心にある
ように、シフトされる。
決定器206に送られる。重心位置決定器206は先
ず、ノイズフィルタ処理をした前記パターンの重心を決
定する。この重心はそのパターンにおける画素の座標と
画素値に対応する加重値との加重平均をとることにより
定義される位置である。重心が一旦決まると、パターン
全体は、重心が上記50×60のフレームの中心にある
ように、シフトされる。
【0018】重心位置決定器206の出力はディザプロ
セサ208に送られる。ディザプロセサ208は、送ら
れたパターンを正規化器210と最終的にはニューラル
ネットワークとに送る前に、このパターンの位置を無作
為にシフトするが、ニューラルネットワーク108が学
習する時だけ、この機能を実行する。好適な実施例にお
いては、この無作為なシフトは、水平方向と垂直方向に
おいて独立して、且つ、重心から各々の方向において範
囲[−2,+2]画素に亘って行われる。位置において
このようにシフトすることの目的は、入力の位置変動に
対して左右されない認識を保証することである。ディザ
プロセッサ208は、ニューラルネットワーク108の
学習の間にのみ、このようなシフトを行ない、そして認
識処理の間はその機能を動作しない。
セサ208に送られる。ディザプロセサ208は、送ら
れたパターンを正規化器210と最終的にはニューラル
ネットワークとに送る前に、このパターンの位置を無作
為にシフトするが、ニューラルネットワーク108が学
習する時だけ、この機能を実行する。好適な実施例にお
いては、この無作為なシフトは、水平方向と垂直方向に
おいて独立して、且つ、重心から各々の方向において範
囲[−2,+2]画素に亘って行われる。位置において
このようにシフトすることの目的は、入力の位置変動に
対して左右されない認識を保証することである。ディザ
プロセッサ208は、ニューラルネットワーク108の
学習の間にのみ、このようなシフトを行ない、そして認
識処理の間はその機能を動作しない。
【0019】ディザプロセッサ208の出力が正規化器
210に送られると、正規化器210はノイズを減らさ
れ位置決め処理されたパターンからなる60列の画素の
各々を連結することによって3000次元のベクトルを
生成し、このベクトルの各々の画素値に全体的な変倍値
を乗じることにより、このベクトルが単位の長さとなる
ように正規化する。正規化器210によるこの正規化
は、認識がパターンの相対的な明るさや暗さに対して敏
感に過ぎないことを保証するために、自動的明るさ調節
として機能する。
210に送られると、正規化器210はノイズを減らさ
れ位置決め処理されたパターンからなる60列の画素の
各々を連結することによって3000次元のベクトルを
生成し、このベクトルの各々の画素値に全体的な変倍値
を乗じることにより、このベクトルが単位の長さとなる
ように正規化する。正規化器210によるこの正規化
は、認識がパターンの相対的な明るさや暗さに対して敏
感に過ぎないことを保証するために、自動的明るさ調節
として機能する。
【0020】なお、好適な実施例では、重心位置決定処
理され且つ可能な限りディザ処理されたパターンが正規
化器210に送られるが、当業者には、そのパターンが
正規化の前にまず重心位置決め処理される必要はないと
いうことが理解されるであろう。他の実施例としては、
ノイズフィルタ204の出力は、重心プロセッサ206
により重心位置決め処理され、そしてディザプロセッサ
により可能な限りディザ処理される前において、正規化
器210に送るようにすることもできる。
理され且つ可能な限りディザ処理されたパターンが正規
化器210に送られるが、当業者には、そのパターンが
正規化の前にまず重心位置決め処理される必要はないと
いうことが理解されるであろう。他の実施例としては、
ノイズフィルタ204の出力は、重心プロセッサ206
により重心位置決め処理され、そしてディザプロセッサ
により可能な限りディザ処理される前において、正規化
器210に送るようにすることもできる。
【0021】上記のどちらの方式が適用されても、正規
化化され、重心位置決め処理されたパターンはその後認
識のためにニューラルネットワーク108に送られる。
さて図3を参照すると、図1のネットワーク108のよ
うなニューラルネットワークの構成要素が説明される。
好適な実施例では、ニューラルネットワーク108は、
3000の入力、即ち50×60画素の送られてきたパ
ターンの各々の画素値に対して1つの入力を有し、そし
て、完全に連結されたフィードフォワード構造を、即
ち、ある層の各ニューラル出力は、その次の層の全ての
ニューラル入力に送られるという構造を有し、そしてデ
ータは図3で左から右へのみ流れる。明瞭にするため
に、このニューラルネットワークへの入力は、図3では
単一の入力として図示される。ニューラルネットワーク
108は、例えば261のような二つのレベルのニュー
ロンと出力コンパレータ395とを有する。第一のレベ
ルのニューロン(例えばニューロン261〜280)は
20個のニューロンから成り、その各々は、上記の30
00個の入力全部を入力し、そして1つの出力シグナル
を生成する。第二レベルのニューロン(例えば301〜
394)は94個のニューロンから成り、その各々は、
261のような第一レベルのニューロンの各々からの出
力シグナルを、入力として受け取る。301を例とする
第二レベルのニューロンの各々は、単一の出力シグナル
を発生する。出力コンパレータ395は、301のよう
な第二レベルのニューロンにより生成されたシグナルを
入力として受取り、そして第二レベルのニューロンのど
れが最大の出力シグナルを生成してきたかを示すシグナ
ルを発生する。図3で説明される構造を使用する場合に
は、301を例とする第二の層のニューロンの各々に対
して1つの認識というように、94の異なるパターンが
認識され得る。なお、一般に、層の数と層ごとのニュー
ロンの数は、(3000、20、94)の構造に束縛さ
れる必要がない。しかしながらいくつかの構造は他の構
造より良い結果を提供するであろう。例えば最後の層
(即ち出力層)は、認識可能なパターンの必要数と同じ
数のニューロンを有するはずである。さらにその他の層
は、得られる入力信号の数に基づくパターンを、明瞭に
認識するために必要な自由度の値により、ある程度まで
は限定される。この(3000、20、94)という構
造により、実際非常に良い結果が得られている。
化化され、重心位置決め処理されたパターンはその後認
識のためにニューラルネットワーク108に送られる。
さて図3を参照すると、図1のネットワーク108のよ
うなニューラルネットワークの構成要素が説明される。
好適な実施例では、ニューラルネットワーク108は、
3000の入力、即ち50×60画素の送られてきたパ
ターンの各々の画素値に対して1つの入力を有し、そし
て、完全に連結されたフィードフォワード構造を、即
ち、ある層の各ニューラル出力は、その次の層の全ての
ニューラル入力に送られるという構造を有し、そしてデ
ータは図3で左から右へのみ流れる。明瞭にするため
に、このニューラルネットワークへの入力は、図3では
単一の入力として図示される。ニューラルネットワーク
108は、例えば261のような二つのレベルのニュー
ロンと出力コンパレータ395とを有する。第一のレベ
ルのニューロン(例えばニューロン261〜280)は
20個のニューロンから成り、その各々は、上記の30
00個の入力全部を入力し、そして1つの出力シグナル
を生成する。第二レベルのニューロン(例えば301〜
394)は94個のニューロンから成り、その各々は、
261のような第一レベルのニューロンの各々からの出
力シグナルを、入力として受け取る。301を例とする
第二レベルのニューロンの各々は、単一の出力シグナル
を発生する。出力コンパレータ395は、301のよう
な第二レベルのニューロンにより生成されたシグナルを
入力として受取り、そして第二レベルのニューロンのど
れが最大の出力シグナルを生成してきたかを示すシグナ
ルを発生する。図3で説明される構造を使用する場合に
は、301を例とする第二の層のニューロンの各々に対
して1つの認識というように、94の異なるパターンが
認識され得る。なお、一般に、層の数と層ごとのニュー
ロンの数は、(3000、20、94)の構造に束縛さ
れる必要がない。しかしながらいくつかの構造は他の構
造より良い結果を提供するであろう。例えば最後の層
(即ち出力層)は、認識可能なパターンの必要数と同じ
数のニューロンを有するはずである。さらにその他の層
は、得られる入力信号の数に基づくパターンを、明瞭に
認識するために必要な自由度の値により、ある程度まで
は限定される。この(3000、20、94)という構
造により、実際非常に良い結果が得られている。
【0022】好適な実施例では、このニューラルネット
ワーク108は、汎用パーソナルコンピュータをプログ
ラムすることにより、当業者には良く知られる従来の方
法で実行され得る。さて図4を参照すると、図3の30
1を例とするニューロンについてより詳細な説明がされ
る。
ワーク108は、汎用パーソナルコンピュータをプログ
ラムすることにより、当業者には良く知られる従来の方
法で実行され得る。さて図4を参照すると、図3の30
1を例とするニューロンについてより詳細な説明がされ
る。
【0023】ニューロン301は、入力として、論理
「1」の信号をバイアスウエートエレメント(bias weig
ht element)400に受け取る。また入力として、ニュ
ーロン261−280からの出力シグナルを、対応する
ウエートエレメント401−420に夫々受け取る。4
00−420の各エレメントは、自らに送られたシグナ
ルにスカラ量ω1−ω20をそれぞれ乗じる。スカラ量ω1
−ω20の一組は、20次元ベクトルWを形成すると考え
られる。スカラ量ω1−ω20の実際の値は、下記のニュ
ーラルネットワークの学習の進行中に調整される。エレ
メント400−420の出力は加算器450により合計
され、それからシグモイド関数器451に送られる。好
適な実施例では、シグモイド関数器451により使用さ
れる特別のシグモイド関数は: Sgm(s)≡1/(1+e-(s)) … (1) で表され、sはシグモイド関数器451に送られるシグ
ナルである。こうして、ニューロン261−280から
の入力信号がベクトルXとして表され、スカラ量ω1−
ω20がベクトルWとして表されるならば、ニューロン3
01に対する伝達関数全体は: f(X,W)=1/[1+exp{−(XTW+ω0)}] … (2) の式により与えられ、そのXTWはベクトルXとWのド
ット積である。
「1」の信号をバイアスウエートエレメント(bias weig
ht element)400に受け取る。また入力として、ニュ
ーロン261−280からの出力シグナルを、対応する
ウエートエレメント401−420に夫々受け取る。4
00−420の各エレメントは、自らに送られたシグナ
ルにスカラ量ω1−ω20をそれぞれ乗じる。スカラ量ω1
−ω20の一組は、20次元ベクトルWを形成すると考え
られる。スカラ量ω1−ω20の実際の値は、下記のニュ
ーラルネットワークの学習の進行中に調整される。エレ
メント400−420の出力は加算器450により合計
され、それからシグモイド関数器451に送られる。好
適な実施例では、シグモイド関数器451により使用さ
れる特別のシグモイド関数は: Sgm(s)≡1/(1+e-(s)) … (1) で表され、sはシグモイド関数器451に送られるシグ
ナルである。こうして、ニューロン261−280から
の入力信号がベクトルXとして表され、スカラ量ω1−
ω20がベクトルWとして表されるならば、ニューロン3
01に対する伝達関数全体は: f(X,W)=1/[1+exp{−(XTW+ω0)}] … (2) の式により与えられ、そのXTWはベクトルXとWのド
ット積である。
【0024】さて図5を参照すると、本発明に従って、
例えば108のようなニューラルネットワークを学習す
る際に関係する工程を示すフローチャートが説明されて
いる。学習ステップ501は、認識を要求されるテンプ
レートパターンを含む画像(例えば文字「E」)を走査
するステップ502により開始する。前処理プロセッサ
106との関連で上述したが、このテンプレート画像
は、この画像に対する画素値の補数をとることにより反
転させられ(ステップ503)、「ノイズ」画素値が決
定され(ステップ504)、それから画素値の各々から
「ノイズ」画素値が減じられ(ステップ505)、そし
てそれらの所定の閾値未満の画素値は、ベースライン画
素値により置き換えられる(ステップ506)。
例えば108のようなニューラルネットワークを学習す
る際に関係する工程を示すフローチャートが説明されて
いる。学習ステップ501は、認識を要求されるテンプ
レートパターンを含む画像(例えば文字「E」)を走査
するステップ502により開始する。前処理プロセッサ
106との関連で上述したが、このテンプレート画像
は、この画像に対する画素値の補数をとることにより反
転させられ(ステップ503)、「ノイズ」画素値が決
定され(ステップ504)、それから画素値の各々から
「ノイズ」画素値が減じられ(ステップ505)、そし
てそれらの所定の閾値未満の画素値は、ベースライン画
素値により置き換えられる(ステップ506)。
【0025】次に50×60画素のフレームがテンプレ
ートパターンの周囲で定義される(ステップ507)。
典型的には、そのようなフレームの定義はセグメンタ1
04の動作に固有のものであり、そのように定義される
フレームはステップ507において直接に使用できる。
次にテンプレートパターンの重心が決定され(ステップ
508)、そしてテンプレートパターン全体が、その重
心がフレーム内の中心になるように位置を変えられる
(ステップ509)。このテンプレートパターンは、そ
れから垂直と水平の次元においてランダムな数の画素分
だけ変位され、前述の単位長さに対応するように標準化
され(ステップ511)、そしてその結果として生じる
パターンはニューラルネットワークに送られる(ステッ
プ512)。ニューラルネットワークの学習における実
際の動作は、A.Dengel,A.Luhn,B.Verberreiter共
著「印刷文書の認識のための、モデルに基づく分割と仮
生成」、(SPIE会報、860号、89ー94ペー
ジ、1988年刊)のような、この問題に関する多数の
参照において説明されたように、従来からのバックプロ
パゲーション法である。図4との関連で説明されたスカ
ラ量ω1−ω20は、このような学習の結果として決定さ
れる。好適な実施例においては、テンプレートパターン
を供給するために、12ポイントのクーリエフォント活
字が使用され、そして略430,000回の反復学習が
採用され、およそ10-6のエラー確率となる。
ートパターンの周囲で定義される(ステップ507)。
典型的には、そのようなフレームの定義はセグメンタ1
04の動作に固有のものであり、そのように定義される
フレームはステップ507において直接に使用できる。
次にテンプレートパターンの重心が決定され(ステップ
508)、そしてテンプレートパターン全体が、その重
心がフレーム内の中心になるように位置を変えられる
(ステップ509)。このテンプレートパターンは、そ
れから垂直と水平の次元においてランダムな数の画素分
だけ変位され、前述の単位長さに対応するように標準化
され(ステップ511)、そしてその結果として生じる
パターンはニューラルネットワークに送られる(ステッ
プ512)。ニューラルネットワークの学習における実
際の動作は、A.Dengel,A.Luhn,B.Verberreiter共
著「印刷文書の認識のための、モデルに基づく分割と仮
生成」、(SPIE会報、860号、89ー94ペー
ジ、1988年刊)のような、この問題に関する多数の
参照において説明されたように、従来からのバックプロ
パゲーション法である。図4との関連で説明されたスカ
ラ量ω1−ω20は、このような学習の結果として決定さ
れる。好適な実施例においては、テンプレートパターン
を供給するために、12ポイントのクーリエフォント活
字が使用され、そして略430,000回の反復学習が
採用され、およそ10-6のエラー確率となる。
【0026】さて図6を参照すると、本発明に従ったシ
ステム100の動作のフローチャートが説明される。図
5に関連して説明された学習に続く動作は、そのパター
ン認識を求められる画像を走査(ステップ601)する
ことにより始まる。それからこの画像は、その画像を構
成する各々のパターンを得るために分割される(ステッ
プ602)。次いでそのようなパターン全部に対して処
理が終了したか否かをチェックする。YESであれば、
処理は完了である。そうでない場合には、前記のよう
に、パターンは画素値の補数を取ることにより反転させ
られ(ステップ604)、ノイズ画素値が決定され(ス
テップ605)、ノイズ画素値が画素値の各々から減じ
られ(ステップ606)、閾値未満の各画素値はベース
ラインの値で置き換えられ(ステップ607)、フレー
ムがパターンの周囲に定義され(ステップ608)、こ
のパターンの重心が決定され(ステップ609)、そし
てこのパターンが、その重心がフレームの中心に位置す
るように置かれる(ステップ610)。これらの工程が
完了した上で、パターンが、認識のためにニューラルネ
ットワークに送られ、処理はステップ603に戻る。
ステム100の動作のフローチャートが説明される。図
5に関連して説明された学習に続く動作は、そのパター
ン認識を求められる画像を走査(ステップ601)する
ことにより始まる。それからこの画像は、その画像を構
成する各々のパターンを得るために分割される(ステッ
プ602)。次いでそのようなパターン全部に対して処
理が終了したか否かをチェックする。YESであれば、
処理は完了である。そうでない場合には、前記のよう
に、パターンは画素値の補数を取ることにより反転させ
られ(ステップ604)、ノイズ画素値が決定され(ス
テップ605)、ノイズ画素値が画素値の各々から減じ
られ(ステップ606)、閾値未満の各画素値はベース
ラインの値で置き換えられ(ステップ607)、フレー
ムがパターンの周囲に定義され(ステップ608)、こ
のパターンの重心が決定され(ステップ609)、そし
てこのパターンが、その重心がフレームの中心に位置す
るように置かれる(ステップ610)。これらの工程が
完了した上で、パターンが、認識のためにニューラルネ
ットワークに送られ、処理はステップ603に戻る。
【0027】前記説明の論点は、印刷された文字の光学
的認識に集中していたが、本発明は他の型のパターン認
識にもまた同様に適用することができる。光学的画像よ
りむしろ例えば音声画像の方がニューラルネットワーク
による認識に対して効果的に前処理されることができよ
う。この場合の認識は、音声画像の時間ベースの若しく
は周波数ベースのベクトル表現の各次元から、ノイズレ
ベルを減じることにより、またはそのようなベクトル表
現を標準化することにより、または閾値未満の成分をベ
ースラインの値で置き換えることによりなされる。この
ように本発明は光学的文字認識以外の領域における応用
を見出すことも可能である。
的認識に集中していたが、本発明は他の型のパターン認
識にもまた同様に適用することができる。光学的画像よ
りむしろ例えば音声画像の方がニューラルネットワーク
による認識に対して効果的に前処理されることができよ
う。この場合の認識は、音声画像の時間ベースの若しく
は周波数ベースのベクトル表現の各次元から、ノイズレ
ベルを減じることにより、またはそのようなベクトル表
現を標準化することにより、または閾値未満の成分をベ
ースラインの値で置き換えることによりなされる。この
ように本発明は光学的文字認識以外の領域における応用
を見出すことも可能である。
【0028】それゆえパターン認識は、テンプレートパ
ターンを用いてニューラルネットワークを学習するこ
と、認識対象のパターンを検出し前処理すること、そし
て検出され前処理されたパターンを、学習されたニュー
ラルネットワークに送ることにより達成される。前記説
明は好適な実施例の動作を説明するために含められるも
のであり、この発明の範囲を限定するものではない。こ
の発明の範囲は特許請求の範囲によってのみ限定される
ことになる。前記の論議から、本発明の精神と範囲に包
含される限り、当業者にとって多くの変更が明白なこと
であろう。
ターンを用いてニューラルネットワークを学習するこ
と、認識対象のパターンを検出し前処理すること、そし
て検出され前処理されたパターンを、学習されたニュー
ラルネットワークに送ることにより達成される。前記説
明は好適な実施例の動作を説明するために含められるも
のであり、この発明の範囲を限定するものではない。こ
の発明の範囲は特許請求の範囲によってのみ限定される
ことになる。前記の論議から、本発明の精神と範囲に包
含される限り、当業者にとって多くの変更が明白なこと
であろう。
【0029】尚、本発明は、複数の機器から構成される
システムに適用しても良いし、1つの機器から成る装置
に適用しても良い。また、本発明は、システム或は装置
にプログラムを供給することによって達成される場合に
も適用できることはいうまでもない。
システムに適用しても良いし、1つの機器から成る装置
に適用しても良い。また、本発明は、システム或は装置
にプログラムを供給することによって達成される場合に
も適用できることはいうまでもない。
【0030】
【発明の効果】以上述べた様に本発明によれば、ノイズ
の多い画像からパターンを精度良く認識することのでき
る画像処理方法及び画像処理装置を提供することができ
た。
の多い画像からパターンを精度良く認識することのでき
る画像処理方法及び画像処理装置を提供することができ
た。
【図1】実施例のパターン認識のための装置の機能ブロ
ック図である。
ック図である。
【図2】実施例のプリプロセッサの機能ブロック図であ
る。
る。
【図3】実施例のニューラルネットワークのブロック図
である。
である。
【図4】図3のニューラルネットワークの1つのニュー
ロンの機能ブロック図である。
ロンの機能ブロック図である。
【図5】実施例のニューラルネットワークを学習する際
に使用される制御手順を説明するフローチャート。
に使用される制御手順を説明するフローチャート。
【図6】実施例のパターン認識のための手順を説明する
フローチャートである。
フローチャートである。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ハダール アイ. アヴィ−イツァーク アメリカ合衆国 カリフォルニア州 94304 パロアルト ミランダ アベニュ ー 4009 キヤノン リサーチ センター アメリカ インコーポレイテッド内 (72)発明者 ハリー ティー. ガーランド アメリカ合衆国 カリフォルニア州 94304 パロアルト ミランダ アベニュ ー 4009 キヤノン リサーチ センター アメリカ インコーポレイテッド内
Claims (8)
- 【請求項1】 画像中のパターンを、一組の既知のテン
プレート中において認識するコンピュータ処理による画
像処理方法であって、(a)前記一組の既知のテンプレ
ートを使用してニューラルネットワークを学習する工程
と、(b)前記画像を走査する工程と、(c)前記走査
された画像を分割することにより前記パターンを検出す
る工程と、(d)前記検出されたパターンを前処理する
工程と、(e)前記検出され前処理されたパターンを、
前記学習されたニューラルネットワークに適用すること
により、その検出され前処理されたパターンを、前記既
知のテンプレートの1つに対応するものとして認識する
工程とを具備することを特徴とする画像処理方法。 - 【請求項2】 前記検出されたパターンは各々の画素が
一つの値を有する複数の画素から成り、 前記前処理工程は、前記複数の画素の1つの部分集合内
の画素の閾値を超えない画素値に応じて、前記部分集合
内の画素に所定のフィルタされた画素値を選択的に割り
当てることにより、画素の値をフィルタ処理する工程を
含むことを特徴とする請求項1に記載の画像処理方法。 - 【請求項3】 前記分割工程は前記検出されたパターン
の周囲にフレームを定義する工程を含み、前記前処理工
程は、(f)前記検出されたパターンの重心を決定し、
(g)前記重心が前記フレームに関して中心に位置する
ように、前記検出されたパターンを前記フレーム内に位
置決めすることを特徴とする請求項1に記載の画像処理
方法。 - 【請求項4】前記検出されたパターンは、その各々が一
個のマルチビット画素値を有する画素マップとして表現
され、前記前処理工程は、(f)前記画素の値の各々の
補数を決定し、(g)ノイズ値として前記補数の最小値
を選択し、(h)前記補数の各々から前記ノイズの値を
減じ、(i)前記補数を、予め決められた閾値を越えな
い前記補数に対して、ベースラインの値で選択的に置き
換えることを特徴とする請求項1に記載の画像処理方
法。 - 【請求項5】 前記学習工程は、(f)前記テンプレー
トの1つの周囲にフレームを定義し、(g)前記1つの
テンプレートの重心を決定し、(h)前記重心が前記フ
レームに関して中心に位置するように、前記フレーム内
の前記1つのテンプレートを位置決めし、(i)工程h
に続いて、前記フレーム内の前記1つのテンプレートを
無作為に移動し、(j)前記無作為に移されたテンプレ
ートを、前記ニューラルネットワークへ送ることを特徴
とする請求項1に記載の画像処理方法。 - 【請求項6】 画像中のパターンを、一組の既知のテン
プレート中において認識する画像処理装置であって、 前記画像を走査する工程と、 前記走査手段により生成された画像信号を入力として受
けるとともに、この画像信号から、複数の多値の画素値
を含む前処理されたパターン信号を生成するように適合
された前処理手段と、 この前処理されたパターン信号を入力として受けるとと
もに、そのパターン信号から、前記テンプレートの1つ
に対応し前記パターンを示す出力信号を生成するように
適合されたニューラルネットワークとを具備する画像処
理装置。 - 【請求項7】 前記ニューラルネットワークは、 前記前処理されたパターン信号を入力として受けるとと
もに、そのパターン信号から一組の中間信号を生じさせ
るように適合された第1のニューロン層と、 前記中間信号を入力として受けるとともに、その中間信
号から一組のテンプレートの値を生じさせるように適合
された第2のニューロン層と、 前記テンプレートの値の最大値を決定するとともに、そ
れに応答して前記出力信号を発生する手段を具備するこ
とを特徴とする請求項6に記載の画像処理装置。 - 【請求項8】 前記前処理されたパターン信号は300
0個の前記多値の画素値を有し、 前記第1のニューロン層は20個のニューロンを有し、 前記第2のニューロン層は94個のニューロンを有する
ことを特徴とする請求項7に記載の画像処理装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/055523 | 1993-04-29 | ||
US08/055,523 US5475768A (en) | 1993-04-29 | 1993-04-29 | High accuracy optical character recognition using neural networks with centroid dithering |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0773329A true JPH0773329A (ja) | 1995-03-17 |
Family
ID=21998420
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6092540A Withdrawn JPH0773329A (ja) | 1993-04-29 | 1994-04-28 | 画像処理方法および装置 |
Country Status (4)
Country | Link |
---|---|
US (2) | US5475768A (ja) |
EP (1) | EP0622750B1 (ja) |
JP (1) | JPH0773329A (ja) |
DE (1) | DE69422446T2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002312762A (ja) * | 2001-04-12 | 2002-10-25 | Seirei Ind Co Ltd | ニューラルネットワークを利用した穀粒選別装置 |
CN110110780A (zh) * | 2019-04-30 | 2019-08-09 | 南开大学 | 一种基于对抗神经网络和海量噪声数据的图片分类方法 |
KR20210015299A (ko) * | 2019-08-01 | 2021-02-10 | 단국대학교 산학협력단 | 기기의 운전상태 분석 시스템 |
Families Citing this family (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5475768A (en) * | 1993-04-29 | 1995-12-12 | Canon Inc. | High accuracy optical character recognition using neural networks with centroid dithering |
DE69431393T2 (de) * | 1994-01-13 | 2003-01-23 | St Microelectronics Srl | Anlage zur Bilderkennung alphanumerischen Zeichen |
JP3463288B2 (ja) * | 1994-08-19 | 2003-11-05 | インターナショナル・ビジネス・マシーンズ・コーポレーション | ヒストリカル・データに対してコンテキスト・ナビゲーションを行うための方法及び装置 |
US5739518A (en) * | 1995-05-17 | 1998-04-14 | Metanetics Corporation | Autodiscrimination for dataform decoding and standardized recording |
US6665639B2 (en) * | 1996-12-06 | 2003-12-16 | Sensory, Inc. | Speech recognition in consumer electronic products |
US5774831A (en) * | 1996-12-06 | 1998-06-30 | Gupta; Surender Kumar | System for improving average accuracy of signals from global positioning system by using a neural network to obtain signal correction values |
DE69838714T2 (de) * | 1997-05-05 | 2008-10-30 | Symbol Technologies, Inc. | Optische abtastvorrichtung und bildleser zum bildlesen und dekodieren optischer informationen mit ein- und zweidimensionalen symbolen bei veränderlicher tiefenschärfe |
US6044375A (en) * | 1998-04-30 | 2000-03-28 | Hewlett-Packard Company | Automatic extraction of metadata using a neural network |
US6996549B2 (en) * | 1998-05-01 | 2006-02-07 | Health Discovery Corporation | Computer-aided image analysis |
US7016539B1 (en) | 1998-07-13 | 2006-03-21 | Cognex Corporation | Method for fast, robust, multi-dimensional pattern recognition |
US8682077B1 (en) | 2000-11-28 | 2014-03-25 | Hand Held Products, Inc. | Method for omnidirectional processing of 2D images including recognizable characters |
DE10145608B4 (de) | 2001-09-15 | 2006-01-26 | Eads Deutschland Gmbh | Modellbasierte Objektklassifikation und Zielerkennung |
US7308136B2 (en) * | 2002-07-01 | 2007-12-11 | Xerox Corporation | Weak edge repositioning in a MRC segmentor |
US7113636B2 (en) * | 2002-08-30 | 2006-09-26 | Lockheed Martin Corporation | Method and computer program product for generating training data for a new class in a pattern recognition classifier |
US7480397B2 (en) * | 2003-04-18 | 2009-01-20 | Casio Computer Co., Ltd. | Fingerprint image reading apparatus |
US7190834B2 (en) * | 2003-07-22 | 2007-03-13 | Cognex Technology And Investment Corporation | Methods for finding and characterizing a deformed pattern in an image |
US8081820B2 (en) | 2003-07-22 | 2011-12-20 | Cognex Technology And Investment Corporation | Method for partitioning a pattern into optimized sub-patterns |
GB0324638D0 (en) * | 2003-10-22 | 2003-11-26 | Gore W L & Ass Uk | An on-line inspection system |
US20060098887A1 (en) * | 2004-05-19 | 2006-05-11 | Hazem El-Bakry | Mehthod for image conversion |
US8437502B1 (en) | 2004-09-25 | 2013-05-07 | Cognex Technology And Investment Corporation | General pose refinement and tracking tool |
US7653244B2 (en) * | 2005-02-22 | 2010-01-26 | Potts Wesley F | Intelligent importation of information from foreign applications user interface |
US7416125B2 (en) * | 2005-03-24 | 2008-08-26 | Hand Held Products, Inc. | Synthesis decoding and methods of use thereof |
US20060245654A1 (en) * | 2005-04-29 | 2006-11-02 | Microsoft Corporation | Utilizing grammatical parsing for structured layout analysis |
US8249344B2 (en) * | 2005-07-01 | 2012-08-21 | Microsoft Corporation | Grammatical parsing of document visual structures |
US8509563B2 (en) | 2006-02-02 | 2013-08-13 | Microsoft Corporation | Generation of documents from images |
US20070211930A1 (en) * | 2006-03-09 | 2007-09-13 | Terry Dolwick | Attribute based image enhancement and display for medical imaging applications |
US8103085B1 (en) | 2007-09-25 | 2012-01-24 | Cognex Corporation | System and method for detecting flaws in objects using machine vision |
JP4926116B2 (ja) * | 2008-04-16 | 2012-05-09 | 株式会社日立ハイテクノロジーズ | 画像検査装置 |
US8416256B2 (en) * | 2009-03-18 | 2013-04-09 | Stmicroelectronics, Inc. | Programmable dithering for video displays |
US8660371B2 (en) * | 2010-05-06 | 2014-02-25 | Abbyy Development Llc | Accuracy of recognition by means of a combination of classifiers |
US9679224B2 (en) | 2013-06-28 | 2017-06-13 | Cognex Corporation | Semi-supervised method for training multiple pattern recognition and registration tool models |
JP7022076B2 (ja) * | 2016-12-19 | 2022-02-17 | 株式会社安川電機 | 産業機器用の画像認識プロセッサ及びコントローラ |
RU173468U1 (ru) * | 2017-03-27 | 2017-08-29 | Акционерное общество "ЭЛВИС-НеоТек" | Устройство каскадной обработки потока изображений с помощью свёрточных нейронных сетей |
RU2651147C1 (ru) * | 2017-03-27 | 2018-04-18 | Акционерное общество "ЭЛВИС-НеоТек" | Устройство и способ каскадной обработки потока изображений с помощью свёрточных нейронных сетей |
SG10201707094VA (en) | 2017-08-30 | 2019-03-28 | Mastercard International Inc | System and Method for Transmitting Payment Card Information, and Payment Card |
DE102018100238A1 (de) * | 2018-01-08 | 2019-07-11 | Connaught Electronics Ltd. | Verfahren zum Trainieren eines künstlichen neuronalen Netzwerks |
DE102018100315A1 (de) * | 2018-01-09 | 2019-07-11 | Connaught Electronics Ltd. | Erzeugen von Eingabedaten für ein konvolutionelles neuronales Netzwerk |
US20200065654A1 (en) * | 2018-08-22 | 2020-02-27 | Electronics And Telecommunications Research Institute | Neural network fusion apparatus and modular neural network fusion method and matching interface generation method for the same |
JP2020039020A (ja) * | 2018-09-03 | 2020-03-12 | ソニーセミコンダクタソリューションズ株式会社 | 画像処理装置および画像処理方法 |
US11991251B2 (en) * | 2021-09-15 | 2024-05-21 | Citrix Systems, Inc. | Access for resources during remote session |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3760356A (en) * | 1971-12-17 | 1973-09-18 | Honeywell Inf Systems | Technique for determining the extreme binary number from a set of binary numbers |
US3846752A (en) * | 1972-10-02 | 1974-11-05 | Hitachi Ltd | Character recognition apparatus |
US3993976A (en) * | 1974-05-13 | 1976-11-23 | The United States Of America As Represented By The Secretary Of The Air Force | Method and apparatus for pattern analysis |
US3930231A (en) * | 1974-06-10 | 1975-12-30 | Xicon Data Entry Corp | Method and system for optical character recognition |
US4241329A (en) * | 1978-04-27 | 1980-12-23 | Dialog Systems, Inc. | Continuous speech recognition method for improving false alarm rates |
US4225850A (en) * | 1978-11-15 | 1980-09-30 | Rockwell International Corporation | Non-fingerprint region indicator |
JPS6016673B2 (ja) * | 1978-12-25 | 1985-04-26 | 川崎重工業株式会社 | サ−ボ系における被検体認識装置 |
JPS5654479A (en) * | 1979-10-12 | 1981-05-14 | Hitachi Ltd | Picture image data processor |
US5161203A (en) * | 1981-08-06 | 1992-11-03 | Buckley B Shawn | Self-organizing circuits |
US4513441A (en) * | 1983-08-02 | 1985-04-23 | Sparta, Inc. | Image comparison system |
US4817176A (en) * | 1986-02-14 | 1989-03-28 | William F. McWhortor | Method and apparatus for pattern recognition |
US4965725B1 (en) * | 1988-04-08 | 1996-05-07 | Neuromedical Systems Inc | Neural network based automated cytological specimen classification system and method |
US5003490A (en) * | 1988-10-07 | 1991-03-26 | Hughes Aircraft Company | Neural network signal processor |
US4958939A (en) * | 1988-11-14 | 1990-09-25 | Honeywell Inc. | Centering scheme for pattern recognition |
US5121443A (en) * | 1989-04-25 | 1992-06-09 | Spectra-Physics, Inc. | Neural net system for analyzing chromatographic peaks |
US5263097A (en) * | 1991-07-24 | 1993-11-16 | Texas Instruments Incorporated | Parameter normalized features for classification procedures, systems and methods |
JPH07117950B2 (ja) * | 1991-09-12 | 1995-12-18 | 株式会社エイ・ティ・アール視聴覚機構研究所 | パターン認識装置およびパターン学習装置 |
CA2081406C (en) * | 1991-12-23 | 1997-09-16 | Chinmoy Bhusan Bose | Method and apparatus for connected and degraded text recognition |
US5453295A (en) * | 1992-01-15 | 1995-09-26 | Morton International, Inc. | Method for preventing filiform corrosion of aluminum wheels by powder coating with a thermosetting resin |
US5245672A (en) * | 1992-03-09 | 1993-09-14 | The United States Of America As Represented By The Secretary Of Commerce | Object/anti-object neural network segmentation |
JP2737583B2 (ja) * | 1992-11-26 | 1998-04-08 | 松下電器産業株式会社 | ニューラルネットワーク回路 |
US5305392A (en) * | 1993-01-11 | 1994-04-19 | Philip Morris Incorporated | High speed, high resolution web inspection system |
US5475768A (en) * | 1993-04-29 | 1995-12-12 | Canon Inc. | High accuracy optical character recognition using neural networks with centroid dithering |
-
1993
- 1993-04-29 US US08/055,523 patent/US5475768A/en not_active Expired - Fee Related
-
1994
- 1994-04-28 EP EP94303081A patent/EP0622750B1/en not_active Expired - Lifetime
- 1994-04-28 DE DE69422446T patent/DE69422446T2/de not_active Expired - Fee Related
- 1994-04-28 JP JP6092540A patent/JPH0773329A/ja not_active Withdrawn
-
1995
- 1995-05-22 US US08/445,470 patent/US5625707A/en not_active Expired - Fee Related
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002312762A (ja) * | 2001-04-12 | 2002-10-25 | Seirei Ind Co Ltd | ニューラルネットワークを利用した穀粒選別装置 |
CN110110780A (zh) * | 2019-04-30 | 2019-08-09 | 南开大学 | 一种基于对抗神经网络和海量噪声数据的图片分类方法 |
CN110110780B (zh) * | 2019-04-30 | 2023-04-07 | 南开大学 | 一种基于对抗神经网络和海量噪声数据的图片分类方法 |
KR20210015299A (ko) * | 2019-08-01 | 2021-02-10 | 단국대학교 산학협력단 | 기기의 운전상태 분석 시스템 |
Also Published As
Publication number | Publication date |
---|---|
US5625707A (en) | 1997-04-29 |
DE69422446T2 (de) | 2000-06-15 |
DE69422446D1 (de) | 2000-02-10 |
EP0622750B1 (en) | 2000-01-05 |
EP0622750A2 (en) | 1994-11-02 |
US5475768A (en) | 1995-12-12 |
EP0622750A3 (en) | 1995-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH0773329A (ja) | 画像処理方法および装置 | |
Tensmeyer et al. | Historical document image binarization: A review | |
US5212741A (en) | Preprocessing of dot-matrix/ink-jet printed text for Optical Character Recognition | |
US6807304B2 (en) | Feature recognition using loose gray scale template matching | |
US4259661A (en) | Apparatus and method for recognizing a pattern | |
US6917703B1 (en) | Method and apparatus for image analysis of a gabor-wavelet transformed image using a neural network | |
JPH05174183A (ja) | 文書画像傾き検出方式 | |
Türkyılmaz et al. | License plate recognition system using artificial neural networks | |
US20060056696A1 (en) | Degraded dictionary generation method and apparatus | |
JPH04233094A (ja) | イメージ分析のための方法及び装置 | |
Bawane et al. | Object and character recognition using spiking neural network | |
Yadav et al. | A robust approach for offline English character recognition | |
US20220027662A1 (en) | Optical character recognition using specialized confidence functions | |
US6240209B1 (en) | Method for deriving character features in a character recognition system | |
US6694054B1 (en) | Pattern recognition process | |
Oz et al. | A practical license plate recognition system for real-time environments | |
Mohsin et al. | Developing an Arabic handwritten recognition system by means of artificial neural network | |
Verma et al. | Enhanced character recognition using surf feature and neural network technique | |
US6694059B1 (en) | Robustness enhancement and evaluation of image information extraction | |
EP0632404B1 (en) | Pattern recognition by generating and using zonal features and anti-features | |
JP3150762B2 (ja) | グラディエントベクトルの抽出方式及び文字認識用特徴抽出方式 | |
Vaidya et al. | Marathi Numeral Identification System in Devanagari Script Using 1D Discrete Cosine Transform. | |
Seenu | OPTICAL CHARACTER RECOGNITION USING RBFNN | |
Siddique et al. | An absolute Optical Character Recognition system for Bangla script Utilizing a captured image | |
Cemil et al. | Signature recognition and verification with ANN |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040205 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040209 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20040408 |