JPH0334082A - 文字認識用計算ネットワーク - Google Patents
文字認識用計算ネットワークInfo
- Publication number
- JPH0334082A JPH0334082A JP2135546A JP13554690A JPH0334082A JP H0334082 A JPH0334082 A JP H0334082A JP 2135546 A JP2135546 A JP 2135546A JP 13554690 A JP13554690 A JP 13554690A JP H0334082 A JPH0334082 A JP H0334082A
- Authority
- JP
- Japan
- Prior art keywords
- feature
- map
- maps
- network
- units
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000009467 reduction Effects 0.000 claims abstract description 37
- 238000001514 detection method Methods 0.000 claims abstract description 34
- 238000004364 calculation method Methods 0.000 claims abstract description 6
- 239000000284 extract Substances 0.000 claims 1
- 238000013507 mapping Methods 0.000 claims 1
- 238000003491 array Methods 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 15
- 238000000034 method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000012549 training Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/1801—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
- G06V30/18019—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by matching or filtering
- G06V30/18038—Biologically-inspired filters, e.g. difference of Gaussians [DoG], Gabor filters
- G06V30/18048—Biologically-inspired filters, e.g. difference of Gaussians [DoG], Gabor filters with interaction between the responses of different filters, e.g. cortical complex cells
- G06V30/18057—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biodiversity & Conservation Biology (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Character Discrimination (AREA)
- Image Analysis (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[産業上の利用分野]
本発明はパターン認識の分野に関し、特に光学文字認識
用の大量並列的制約ネットワークに関する。
用の大量並列的制約ネットワークに関する。
[従来技術]
きめ細い並列アーキテクチャ−を持つ適応学習をベース
にした計算システムが、コンピュータベースの情報収集
、処理、操作、蓄積、伝送などの進歩により、近年登場
するようになった。これらのシステムに採用される概念
は、個々のイメージ中の文字パターンの自動的認識、解
析、及び分類等の問題を解決する高効率アプローチを表
している。そのようなシステムにおける技術的価値は、
従来方式と比べた効率と精度で決められる。
にした計算システムが、コンピュータベースの情報収集
、処理、操作、蓄積、伝送などの進歩により、近年登場
するようになった。これらのシステムに採用される概念
は、個々のイメージ中の文字パターンの自動的認識、解
析、及び分類等の問題を解決する高効率アプローチを表
している。そのようなシステムにおける技術的価値は、
従来方式と比べた効率と精度で決められる。
Connectioniss in Perspect
lve 143−155頁(Elsevler 5cl
ence Publlshers:North−11o
lland 1989)のY、LeCunの“−膜化と
ネットワーク設計戦略”と題する論文中で、光デジット
認識問題へ適用される5階層ネットワークアーキテクチ
ャ−について述べられている。ネットワークの夫々にお
ける学習は、D。
lve 143−155頁(Elsevler 5cl
ence Publlshers:North−11o
lland 1989)のY、LeCunの“−膜化と
ネットワーク設計戦略”と題する論文中で、光デジット
認識問題へ適用される5階層ネットワークアーキテクチ
ャ−について述べられている。ネットワークの夫々にお
ける学習は、D。
Rumelhart他のParallel Distr
ibuted Processing、VOL、 1.
318−302頁(Bradrord Books:C
ambrldge、Mass、198B)で述べられて
いるバック伝搬技術から得られた固有の分類知能を介し
て、手書き数字のビクセルイメージについて試みられた
。ネットワークの複雑性は、2つのレベルの制約特徴マ
ツプを持つ階層ネットワークへ最終的には拡大してしま
うことを示した。階層ネットワークの性能は、余り複雑
でないネットワークのそれ以上である。更にそれは、多
レベルの制約特徴マツプはシフト不変量の追加制御が必
要であった。
ibuted Processing、VOL、 1.
318−302頁(Bradrord Books:C
ambrldge、Mass、198B)で述べられて
いるバック伝搬技術から得られた固有の分類知能を介し
て、手書き数字のビクセルイメージについて試みられた
。ネットワークの複雑性は、2つのレベルの制約特徴マ
ツプを持つ階層ネットワークへ最終的には拡大してしま
うことを示した。階層ネットワークの性能は、余り複雑
でないネットワークのそれ以上である。更にそれは、多
レベルの制約特徴マツプはシフト不変量の追加制御が必
要であった。
上記の階層ネットワークは、文字認識や分類の問題を解
決する技術を進歩させるが、信頼性の高い自動文字認識
装置の実現を可能にするには、現システムは十分な精度
を欠いていることも明らかである。
決する技術を進歩させるが、信頼性の高い自動文字認識
装置の実現を可能にするには、現システムは十分な精度
を欠いていることも明らかである。
[発明の概要]
高い精度と信頼性ある光文字認識は、制約特徴検出の各
層が複数の制約特徴マツプとそれに対応する複数の特徴
減少マツプを含む制約特徴検出の数層をもつ階層化ネッ
トワークによって提供される。各特徴減少マツプは、そ
の制約特徴マツプをアンダーサンプリングするために、
同一層のただ1つの制約特徴マツプと接続される。第1
の制約特徴検出層の各制約特徴マツプ中のユニットは、
対応する核の関数として、及びユニットに関連する受入
れ領域の中に捕らえられた文字のビクセルイメージの異
なる部分の関数として応答する。第2の制約特徴検出層
の各特徴マツプ中のユニットは、対応する核の関数とし
て、及び個々の特徴減少マツプの異なる部分、又はユニ
ットの受入れ領域の中に捕らえられた第1制約特徴検出
層中の数個の特徴減少マツプの組合わせの関数として応
答する。第2の制約特徴検出層の特徴減少マツプは、最
後の分類層の各ユニットと完全に接続される。核はネッ
トワークの始動又は訓練の間、制約バック伝搬により自
動的に学習される。
層が複数の制約特徴マツプとそれに対応する複数の特徴
減少マツプを含む制約特徴検出の数層をもつ階層化ネッ
トワークによって提供される。各特徴減少マツプは、そ
の制約特徴マツプをアンダーサンプリングするために、
同一層のただ1つの制約特徴マツプと接続される。第1
の制約特徴検出層の各制約特徴マツプ中のユニットは、
対応する核の関数として、及びユニットに関連する受入
れ領域の中に捕らえられた文字のビクセルイメージの異
なる部分の関数として応答する。第2の制約特徴検出層
の各特徴マツプ中のユニットは、対応する核の関数とし
て、及び個々の特徴減少マツプの異なる部分、又はユニ
ットの受入れ領域の中に捕らえられた第1制約特徴検出
層中の数個の特徴減少マツプの組合わせの関数として応
答する。第2の制約特徴検出層の特徴減少マツプは、最
後の分類層の各ユニットと完全に接続される。核はネッ
トワークの始動又は訓練の間、制約バック伝搬により自
動的に学習される。
このネットワークのアーキテクチャ−から実現された利
点は、シフト不変量の増加、エントロピの大幅減少、パ
ブニラクーチニルボネンキス(Vapnik−cher
vonenkis)の次元化、及び自由パラメータの数
である。この改良の結果として、ネットワークは一般化
性能の与えられたレベルに達するために必要な訓練デー
タ量、即ち訓練時間を比例的に減少させる。
点は、シフト不変量の増加、エントロピの大幅減少、パ
ブニラクーチニルボネンキス(Vapnik−cher
vonenkis)の次元化、及び自由パラメータの数
である。この改良の結果として、ネットワークは一般化
性能の与えられたレベルに達するために必要な訓練デー
タ量、即ち訓練時間を比例的に減少させる。
[実施例の説明]
第1図に示す計算素子は、本発明により実現された階層
制約ネットワークのための基礎的な機能及び相互接続ブ
ロックを形成する。一般に、計算素子はn千1個の入力
の入力値加重和を作り、単一値に達するために非線形性
回路を介して結果を伝える。計算素子の人力値と出力値
は、多レベル、グレイスケール、あるいは現存の二進の
ようなアナログ、準アナログである。計算素子に用いら
れる非線形性回路は、例えば、ハード・リミッタ−1し
きい論理素子、及びS字状非線形性を含む。
制約ネットワークのための基礎的な機能及び相互接続ブ
ロックを形成する。一般に、計算素子はn千1個の入力
の入力値加重和を作り、単一値に達するために非線形性
回路を介して結果を伝える。計算素子の人力値と出力値
は、多レベル、グレイスケール、あるいは現存の二進の
ようなアナログ、準アナログである。計算素子に用いら
れる非線形性回路は、例えば、ハード・リミッタ−1し
きい論理素子、及びS字状非線形性を含む。
動作については、第1図に示す計算素子は、イメージ又
は特徴マツプからのn個の近傍の人力ビクセル、ピクセ
ル値、及びユニット値を走査し、このピクセル値とユニ
ット値は、a11a2、・・・、a□と表された値を持
っている。人力バイアスは計算素子のn+1番目の人力
に供給される。簡単化のためバイアスは通常1のような
一定値にセットされる。入力値とバイアスは、掛算器1
−1から1−(n+1)まで供給される。掛算器は重み
W からWn+1をもbカーネルからの入力を受は入れ
る。すべての掛算器からの出力は、入力値の加重和をつ
くる加算器2へ供給される。加算器2の出力は、重みの
カーネルを表すベクトルと入力値(バイアス値を含む)
のベクトルとのドツト積である。加算器2からの出力値
は、単一ユニツト出力値x1を作る非線形性回’i!l
sB中の非線関数を通過する。以下に詳述するように、
ユニツト出力値Xtは、特徴マツプ中のi番目のユニッ
トの値に関するものである。
は特徴マツプからのn個の近傍の人力ビクセル、ピクセ
ル値、及びユニット値を走査し、このピクセル値とユニ
ット値は、a11a2、・・・、a□と表された値を持
っている。人力バイアスは計算素子のn+1番目の人力
に供給される。簡単化のためバイアスは通常1のような
一定値にセットされる。入力値とバイアスは、掛算器1
−1から1−(n+1)まで供給される。掛算器は重み
W からWn+1をもbカーネルからの入力を受は入れ
る。すべての掛算器からの出力は、入力値の加重和をつ
くる加算器2へ供給される。加算器2の出力は、重みの
カーネルを表すベクトルと入力値(バイアス値を含む)
のベクトルとのドツト積である。加算器2からの出力値
は、単一ユニツト出力値x1を作る非線形性回’i!l
sB中の非線関数を通過する。以下に詳述するように、
ユニツト出力値Xtは、特徴マツプ中のi番目のユニッ
トの値に関するものである。
実施例では、非線性回路3用の典型的S字状関数は、目
盛り双曲線正接関数、f(α)−、AtanhSαとし
て選ばれている。ここでαは非線性回路3への加重和入
力、Aは関数の振幅、Sは原点における関数の傾斜を決
める。上述のごとく、非線形性関数は+Aと−Aにおけ
る水平漸近線をもつ奇数関数である。奇数対称を表す非
線形関数は、カーネルの重みWtからWnilまでより
早い転換を提供できる。
盛り双曲線正接関数、f(α)−、AtanhSαとし
て選ばれている。ここでαは非線性回路3への加重和入
力、Aは関数の振幅、Sは原点における関数の傾斜を決
める。上述のごとく、非線形性関数は+Aと−Aにおけ
る水平漸近線をもつ奇数関数である。奇数対称を表す非
線形関数は、カーネルの重みWtからWnilまでより
早い転換を提供できる。
階層制約ネットワーク中の夫々のカーネルの重みは、バ
ック伝搬として知られている試行錯誤技術を用いて得ら
れたものである。これは前記Rumelhart他の論
文や、R,P、Llppsamsの“神経網をもつ計算
の導入”と題する1lEI2E ASSP Magaz
lne第4巻、第2号、4−22頁(1987)に述べ
られている。訓練前は、カーネルの中の重みの夫々は、
例えば、−2,4/F1と2.4/F、の均一分布を用
いたランダム値に初期化される。ここでF、は、その接
続が属するユニットの入力(ファン・イン〉の数である
。第1図の例では、ファン・インFlはn+1に等しい
。この初期化技術を使って、S字状非線性の操作範囲内
に値を維持することが可能である。訓練中はイメージパ
ターンは一定順序で与えられる。重みは、認識のための
単一イメージパターンの各表示後に、統計的傾斜又は“
オンライン”の手順で更新される。実際の傾斜手順は、
重みが更新される前に、平均化が全訓練セットについて
行われるように、更新のために使われる。統計的傾斜は
、特別大きい冗長度の大きいイメージデータベース用の
実際の傾斜よりも、重みを早く転換させることが知られ
ている。
ック伝搬として知られている試行錯誤技術を用いて得ら
れたものである。これは前記Rumelhart他の論
文や、R,P、Llppsamsの“神経網をもつ計算
の導入”と題する1lEI2E ASSP Magaz
lne第4巻、第2号、4−22頁(1987)に述べ
られている。訓練前は、カーネルの中の重みの夫々は、
例えば、−2,4/F1と2.4/F、の均一分布を用
いたランダム値に初期化される。ここでF、は、その接
続が属するユニットの入力(ファン・イン〉の数である
。第1図の例では、ファン・インFlはn+1に等しい
。この初期化技術を使って、S字状非線性の操作範囲内
に値を維持することが可能である。訓練中はイメージパ
ターンは一定順序で与えられる。重みは、認識のための
単一イメージパターンの各表示後に、統計的傾斜又は“
オンライン”の手順で更新される。実際の傾斜手順は、
重みが更新される前に、平均化が全訓練セットについて
行われるように、更新のために使われる。統計的傾斜は
、特別大きい冗長度の大きいイメージデータベース用の
実際の傾斜よりも、重みを早く転換させることが知られ
ている。
通常の技術が、手書き文字を、供給された文字イメージ
を形成するビクセル・アレーへ転換するために用いられ
る。文字イメージは、遠隔地からの電子伝送により、ま
たは走査カメラやその他の走査デバイスで局部的に得ら
れる。そのソースに関係なく、従来方式により、文字イ
メージはビクセルの順序ずけられた集合によって表示さ
れる。順序ずけられた集合の代表はアレーである。−旦
表示されると、文字イメージは捕獲されて、光メモリ・
デバイス又はフレーム・バッファのような電子メモリ・
デバイスに蓄えられる。
を形成するビクセル・アレーへ転換するために用いられ
る。文字イメージは、遠隔地からの電子伝送により、ま
たは走査カメラやその他の走査デバイスで局部的に得ら
れる。そのソースに関係なく、従来方式により、文字イ
メージはビクセルの順序ずけられた集合によって表示さ
れる。順序ずけられた集合の代表はアレーである。−旦
表示されると、文字イメージは捕獲されて、光メモリ・
デバイス又はフレーム・バッファのような電子メモリ・
デバイスに蓄えられる。
各ビクセルは可視文字イメージの小域から放射される光
の強さや色に対応した関連値を有している。
の強さや色に対応した関連値を有している。
ビクセルの値はその後メモリ・デバイスに蓄えられる。
個々のマツプに言及すると、′ビクセル1と“ユニット
値1の語は同じ意味で使われ、それはビクセル、ピクセ
ル値、及びマツプ・アレーを形成するための各計算素子
の組合わせからのビクセル値出力を含むと解される。そ
れは、ネットワークの操作の理解を視覚化したり展開し
たりするためのピクセル値又はユニット値よりも、むし
ろビクセルの平面的、即ち2次元的アレー(マツプ)の
観点から考える方が便利である。元のイメージとそれに
続く特徴マツプのために、ビクセルの強さレベルを使っ
たピクセル値とユニット値のそのような視覚化は第12
図から第15図に示される。
値1の語は同じ意味で使われ、それはビクセル、ピクセ
ル値、及びマツプ・アレーを形成するための各計算素子
の組合わせからのビクセル値出力を含むと解される。そ
れは、ネットワークの操作の理解を視覚化したり展開し
たりするためのピクセル値又はユニット値よりも、むし
ろビクセルの平面的、即ち2次元的アレー(マツプ)の
観点から考える方が便利である。元のイメージとそれに
続く特徴マツプのために、ビクセルの強さレベルを使っ
たピクセル値とユニット値のそのような視覚化は第12
図から第15図に示される。
ビクセル強さレベルをもつビクセルとユニット値の視覚
化に加えて、この方法でカーネルの中の重みのアレーを
視覚化することも有益である。第7図から第9図までは
、第2図のネットワーク実施例の実験中に習得されたカ
ーネルのアレーを表している。
化に加えて、この方法でカーネルの中の重みのアレーを
視覚化することも有益である。第7図から第9図までは
、第2図のネットワーク実施例の実験中に習得されたカ
ーネルのアレーを表している。
アレーとしてのカーネルを視覚化することにより、いか
にして又どのカーネルが、計算が行われているビクセル
・アレーに影響するかを容易に理解することが可能とな
る。
にして又どのカーネルが、計算が行われているビクセル
・アレーに影響するかを容易に理解することが可能とな
る。
文字認識用ビクセル・アレーとしての文字イメージの準
備に使われる各種の他の予備処理は、スケーリング、サ
イズ・ノーマリゼーシュン、デスキューイング、センタ
リング、トランスレージジン、及びシフティング等の各
種線形変換を含んでおり、これらのすべては当業者に良
く知られている。更に、手書き文字からグレイ・スケー
ルのビクセル・アレーへの変換は、さもなければ予備処
理中の回復不能の損失となる情報を保護するために望ま
しいことである。この変換は当業者に良く知られている
。
備に使われる各種の他の予備処理は、スケーリング、サ
イズ・ノーマリゼーシュン、デスキューイング、センタ
リング、トランスレージジン、及びシフティング等の各
種線形変換を含んでおり、これらのすべては当業者に良
く知られている。更に、手書き文字からグレイ・スケー
ルのビクセル・アレーへの変換は、さもなければ予備処
理中の回復不能の損失となる情報を保護するために望ま
しいことである。この変換は当業者に良く知られている
。
文字認識用にイメージを準備するための上記操作に加え
て、元のイメージの周りに実質的一定レベルの均一な境
界を設けることが望ましい。そのような境界は第3図の
アレー102に示され、そこでイメージ10中のアレー
101の外部のアレー素子は均一な境界を構成している
。
て、元のイメージの周りに実質的一定レベルの均一な境
界を設けることが望ましい。そのような境界は第3図の
アレー102に示され、そこでイメージ10中のアレー
101の外部のアレー素子は均一な境界を構成している
。
計算素子と全ネットワークの実現化は、ハードウェア又
はソフトウェア、或いはハードウェアとソフトウェアの
便利な組合わせにかかっている。ここで提供されたネッ
トワークの多くは、加算、減算、乗算及び比較の基本的
数学動作を行う単純なプログラムをもつSUNワークス
テーションを用いて実行された。バイブライン・デバイ
ス、マイクロプロセッサ及び特殊目的ディジタル信号プ
ロセッサは、本発明のネットワークを実現するための便
利なアーキテクチャ−を提供する。MOS VLSI
技術は、第2図に示される型の個々に重みづけされた相
互接続ネットワークを実行するために用いられた。ロー
カル◆メモリは、ビクセルやユニット値及び他の一時的
計算結果を蓄えるのに適している。
はソフトウェア、或いはハードウェアとソフトウェアの
便利な組合わせにかかっている。ここで提供されたネッ
トワークの多くは、加算、減算、乗算及び比較の基本的
数学動作を行う単純なプログラムをもつSUNワークス
テーションを用いて実行された。バイブライン・デバイ
ス、マイクロプロセッサ及び特殊目的ディジタル信号プ
ロセッサは、本発明のネットワークを実現するための便
利なアーキテクチャ−を提供する。MOS VLSI
技術は、第2図に示される型の個々に重みづけされた相
互接続ネットワークを実行するために用いられた。ロー
カル◆メモリは、ビクセルやユニット値及び他の一時的
計算結果を蓄えるのに適している。
第2図は、本発明による階層制約自動学習ネットワーク
のための典型的実施例の簡単化したブロックダイヤグラ
ムを示している。そのネットワークは、供給されたイメ
ージから大量の並列計算を経て文字認識を行う。レベル
20から60までに示される各アレー(ボックス)は、
アレー・ユニットごとに複数の計算素子を含む。
のための典型的実施例の簡単化したブロックダイヤグラ
ムを示している。そのネットワークは、供給されたイメ
ージから大量の並列計算を経て文字認識を行う。レベル
20から60までに示される各アレー(ボックス)は、
アレー・ユニットごとに複数の計算素子を含む。
第2図のネットワークは、第1、第2特徴検出層と文字
分類層を含んでいる。各層は特徴マツプ又は異なる寸法
のアレーを含んでいる。従来の大部分の適用では、マツ
プは正方形である。しかし、矩形や、対称、非対称、或
いは不規則なパターンも考えられている。アレーは、ビ
クセル(ユニット値)が蓄えられ、1つ下のレベルのマ
ツプからの特徴検出が、そのマツプのアレーの適切な場
所に置かれるようなメモリ◆デバイスに構成されるので
、検出された特徴の配列は、マツプと称される。その様
にして、特徴の存在又は実質的な存在(グレイ・スケー
ル・レベルを使用した)とその関係場所が記録される。
分類層を含んでいる。各層は特徴マツプ又は異なる寸法
のアレーを含んでいる。従来の大部分の適用では、マツ
プは正方形である。しかし、矩形や、対称、非対称、或
いは不規則なパターンも考えられている。アレーは、ビ
クセル(ユニット値)が蓄えられ、1つ下のレベルのマ
ツプからの特徴検出が、そのマツプのアレーの適切な場
所に置かれるようなメモリ◆デバイスに構成されるので
、検出された特徴の配列は、マツプと称される。その様
にして、特徴の存在又は実質的な存在(グレイ・スケー
ル・レベルを使用した)とその関係場所が記録される。
マツプ中で検出された特徴の型は、使われているカーネ
ルによって決められる。制約特徴マツプ中では、同じカ
ーネルが同じマツプの各ユニツト値使われる。即ち、制
約特徴マツプは、1つの特別なカーネルによって決めら
れた特別な特徴の発生によりビクセル・アレーを走査す
る。その様に、用語“制約“は、特別なマツプを含む計
算素子がカーネルの重みの同じセットを分は合うように
強制される条件を意味する。これにより、入力イメージ
が異なる場所で検出されても同じ特徴となる。この技術
は、重みシェアリングとして知られている。
ルによって決められる。制約特徴マツプ中では、同じカ
ーネルが同じマツプの各ユニツト値使われる。即ち、制
約特徴マツプは、1つの特別なカーネルによって決めら
れた特別な特徴の発生によりビクセル・アレーを走査す
る。その様に、用語“制約“は、特別なマツプを含む計
算素子がカーネルの重みの同じセットを分は合うように
強制される条件を意味する。これにより、入力イメージ
が異なる場所で検出されても同じ特徴となる。この技術
は、重みシェアリングとして知られている。
カーネルは、カーネルによって決められた特徴の発生が
検出されるイメージビクセル又はマツプ・ユニットの面
上に、受入れ領域(5ピクセル×5ビクセル又は2ビク
セル×2ビクセル)を決める。ビクセル・アレー上にカ
ーネルを置くことによって、どのビクセルが特徴マツプ
中の計算素子へ入力されつつあるか、及び特徴マツプ上
のどのユニットが活性化されつつあるかを示すことが可
能となる。活性化されつつあるユニットは、通常、検出
下にあるマツプ中の特徴発生の大体の場所と一致してい
る。
検出されるイメージビクセル又はマツプ・ユニットの面
上に、受入れ領域(5ピクセル×5ビクセル又は2ビク
セル×2ビクセル)を決める。ビクセル・アレー上にカ
ーネルを置くことによって、どのビクセルが特徴マツプ
中の計算素子へ入力されつつあるか、及び特徴マツプ上
のどのユニットが活性化されつつあるかを示すことが可
能となる。活性化されつつあるユニットは、通常、検出
下にあるマツプ中の特徴発生の大体の場所と一致してい
る。
第1特徴検出層は、複数の制約特徴マツプ20とそれに
対応する複数の特徴減少マツプ30を含んでいる。図示
のごとく特別な実施例のネットワークは、第1層に4つ
の夫々の制約特徴マツプ及び対応する複数の特徴減少マ
ツプを含んでいる。第2特徴検出層は、複数の制約特徴
マツプ40とそれに対応する複数の特徴減少マツプ50
を含んでいる。図示のごとく特別な実施例のネットワー
クは、第2層に12の夫々の制約特徴マツプ及び対応す
る複・数の特徴減少マツプを含んでいる。
対応する複数の特徴減少マツプ30を含んでいる。図示
のごとく特別な実施例のネットワークは、第1層に4つ
の夫々の制約特徴マツプ及び対応する複数の特徴減少マ
ツプを含んでいる。第2特徴検出層は、複数の制約特徴
マツプ40とそれに対応する複数の特徴減少マツプ50
を含んでいる。図示のごとく特別な実施例のネットワー
クは、第2層に12の夫々の制約特徴マツプ及び対応す
る複・数の特徴減少マツプを含んでいる。
ネットワークの最後の層は、第2特徴検出層のすべての
特徴減少マツプと完全に接続する文字分類層60を含ん
でいる。文字分類層は、供給された元の信号からネット
ワークによって認識された文字の指示を作る。“完全に
接続”という語は、文字分類層60中のピクセルと関連
した計算素子が、前の層のマツプ、即ち層50に含まれ
るすべてのピクセル又はユニットからの人力を受は入れ
るという意味である。
特徴減少マツプと完全に接続する文字分類層60を含ん
でいる。文字分類層は、供給された元の信号からネット
ワークによって認識された文字の指示を作る。“完全に
接続”という語は、文字分類層60中のピクセルと関連
した計算素子が、前の層のマツプ、即ち層50に含まれ
るすべてのピクセル又はユニットからの人力を受は入れ
るという意味である。
ネットワークの層から層への相互接続線は、前の層のど
のマツプが、夫々のすべての計算素子への入力を提供す
るか、どのユニットが関係の層の中にマツプを形成する
かを示すために描かれている。例えば、制約特徴マツプ
201から204までは、制約特徴マツプを作る過程で
、イメージ10から異なる特徴を検出する。次のマツプ
のレベルへ進むと、特徴減少マツプ301は制約特徴マ
ツプ201中のユニットから単独でその人力を得ること
が示されている。同様に特徴減少マツプ302から30
4までは、夫々の制約特徴マツプ202から204まで
のユニットから単独でそれの入力を得る。第2図に示さ
れるネットワークの実施例では、第1特徴検出層から第
2特徴検出層への接続はやや複雑である。制約特徴マツ
プ401.404.407.410は、それらの人力を
特徴減少マツプ301から304までの夫々から単独に
得る。制約特徴マツプ402.403.405.406
は、その人力を特徴減少マツプ301と302の組合せ
から得る。制約特徴マツプ408.409.411.4
12は、その人力を特徴減少マツプ303と304の組
合せから得る。最後に、個々の特徴減少マツプ501か
ら512までは、その人力を対応する制約特徴マツプ4
01から412までの夫々から単独で得る。
のマツプが、夫々のすべての計算素子への入力を提供す
るか、どのユニットが関係の層の中にマツプを形成する
かを示すために描かれている。例えば、制約特徴マツプ
201から204までは、制約特徴マツプを作る過程で
、イメージ10から異なる特徴を検出する。次のマツプ
のレベルへ進むと、特徴減少マツプ301は制約特徴マ
ツプ201中のユニットから単独でその人力を得ること
が示されている。同様に特徴減少マツプ302から30
4までは、夫々の制約特徴マツプ202から204まで
のユニットから単独でそれの入力を得る。第2図に示さ
れるネットワークの実施例では、第1特徴検出層から第
2特徴検出層への接続はやや複雑である。制約特徴マツ
プ401.404.407.410は、それらの人力を
特徴減少マツプ301から304までの夫々から単独に
得る。制約特徴マツプ402.403.405.406
は、その人力を特徴減少マツプ301と302の組合せ
から得る。制約特徴マツプ408.409.411.4
12は、その人力を特徴減少マツプ303と304の組
合せから得る。最後に、個々の特徴減少マツプ501か
ら512までは、その人力を対応する制約特徴マツプ4
01から412までの夫々から単独で得る。
文字分類層60は、ネットワークにより分解される個々
の文字認識に対して十分な数の素子を含んでいる。即ち
、大文字又は小文字のラテンアルファベット文字の双方
の認識のために、層60の典型的実施例は、AからZま
で、またはaから2までを表す26ユニツトを含んでい
る。一方、数字の認識のためには、層60の一実施例は
、数字0から9までの僅か10ユニツトを含むだけであ
る。
の文字認識に対して十分な数の素子を含んでいる。即ち
、大文字又は小文字のラテンアルファベット文字の双方
の認識のために、層60の典型的実施例は、AからZま
で、またはaから2までを表す26ユニツトを含んでい
る。一方、数字の認識のためには、層60の一実施例は
、数字0から9までの僅か10ユニツトを含むだけであ
る。
理解を容易にするために、第1図に示された計算素子へ
のバイアス入力とそれに関連するカーネル中の重みは、
第3図から第6図まで、及びその説明からは省略されて
いる。実験的実施においては、バイアスは1にセットさ
れ、対応するカーネル中の重みはバック伝搬を通して学
習される。
のバイアス入力とそれに関連するカーネル中の重みは、
第3図から第6図まで、及びその説明からは省略されて
いる。実験的実施においては、バイアスは1にセットさ
れ、対応するカーネル中の重みはバック伝搬を通して学
習される。
第3図は、サンプル接続とイメージ10から制約特徴マ
ツプ201への特徴検出とその相互接続を示す。マツプ
201中のユニット210は、人力イメージ面上の5×
5の近傍を観測し、ユニット210の値を発展させるた
めに典型的なカーネル610からの重みを使用する。グ
レイスケール・ユニット値は、その近傍の入力イメージ
の中のその特徴の存在、実質的存在、実質的不在又は不
在を示す。制約特徴マツプ中の計算素子によって行われ
た機能は、イメージピクセルの5×5の受入れ領域即ち
5×5のカーネルをもつユニットの非線形たたみ込みと
解釈される。マツプ201中の離れた1つのユニットで
あるユニット(計算素子)に対して、人力層中のそれら
の受入れ領域は、離れた1つのピクセルである。
ツプ201への特徴検出とその相互接続を示す。マツプ
201中のユニット210は、人力イメージ面上の5×
5の近傍を観測し、ユニット210の値を発展させるた
めに典型的なカーネル610からの重みを使用する。グ
レイスケール・ユニット値は、その近傍の入力イメージ
の中のその特徴の存在、実質的存在、実質的不在又は不
在を示す。制約特徴マツプ中の計算素子によって行われ
た機能は、イメージピクセルの5×5の受入れ領域即ち
5×5のカーネルをもつユニットの非線形たたみ込みと
解釈される。マツプ201中の離れた1つのユニットで
あるユニット(計算素子)に対して、人力層中のそれら
の受入れ領域は、離れた1つのピクセルである。
制約特徴マツプ201中の他のユニットは、ユニット2
10で使われた同じカーネルを使う。層20中の他のマ
ツプは、第3図に示すものとは別のカーネルを使って、
マツプ201へと同じ方法で、イメージを操作するユニ
ットを含んでいる。第7図から第9図までは層20に対
する異なるカーネルを示している。
10で使われた同じカーネルを使う。層20中の他のマ
ツプは、第3図に示すものとは別のカーネルを使って、
マツプ201へと同じ方法で、イメージを操作するユニ
ットを含んでいる。第7図から第9図までは層20に対
する異なるカーネルを示している。
第3図に示すように、イメージ10は28X28ノイメ
ージアレー102中に作られる12ビクセルの広さの一
定値の境界で囲まれた元の文字のイメージを含んだ16
X16のアレー101を含んでいる。
ージアレー102中に作られる12ビクセルの広さの一
定値の境界で囲まれた元の文字のイメージを含んだ16
X16のアレー101を含んでいる。
制約特徴マツプ201は24X24のアレーとして示さ
れている。
れている。
第4図は、制約特徴マツプ201から、マツプ201中
のユニットのアンダーサンプリングする特徴減少マツプ
301への接続を示す。例えば、特徴減少マツプ301
は12X12のアレーとして示される。ユニット(計算
素子)310は、マツプ201の人力面上の2×2の受
入れ領域から人力を受は取る。ユニットに関連した計算
素子によって行われた機能は、マツプ201中の2×2
の受入れ領域からの単純平均化プロセスを含んでいる。
のユニットのアンダーサンプリングする特徴減少マツプ
301への接続を示す。例えば、特徴減少マツプ301
は12X12のアレーとして示される。ユニット(計算
素子)310は、マツプ201の人力面上の2×2の受
入れ領域から人力を受は取る。ユニットに関連した計算
素子によって行われた機能は、マツプ201中の2×2
の受入れ領域からの単純平均化プロセスを含んでいる。
マツプ301中の隣接するユニットは、マツプ201中
に離れた2ユニツトを有する。特徴減少マツプ301中
の他のユニットは、ユニット210で用いられた同じカ
ーネルを用いる。層30中の他のマツプは、マツプ30
1に対するものと実質的同一のカーネルを使ってマツプ
301へ同一の方法でイメージを操作するユニットを含
んでいる。
に離れた2ユニツトを有する。特徴減少マツプ301中
の他のユニットは、ユニット210で用いられた同じカ
ーネルを用いる。層30中の他のマツプは、マツプ30
1に対するものと実質的同一のカーネルを使ってマツプ
301へ同一の方法でイメージを操作するユニットを含
んでいる。
第5図は、特徴減少マツプ301から、第2特徴検出層
の制約特徴マツプ401中のユニット420への接続を
示している。この接続は、第3図に示したものと同じで
ある。機能的には、この接続は、マツプ401,404
.407.410への接続のための5×5のカーネルの
非線形たたみ込みである。
の制約特徴マツプ401中のユニット420への接続を
示している。この接続は、第3図に示したものと同じで
ある。機能的には、この接続は、マツプ401,404
.407.410への接続のための5×5のカーネルの
非線形たたみ込みである。
第1、第2特徴検出層間の他のすべての接続は、2つの
異なる特徴減少マツプ上の同じ(例えば5×5)受入れ
領域から、ユニットの合成アレー上へ合成カーネル即ち
2つの別々のカーネル(2つの5×5のカーネルのよう
な)を用いた非線形たたみ込みとなる。第5図に示すよ
うに、マツプ301は12×12のアレー、マツプ40
1は8X8のアレーである。
異なる特徴減少マツプ上の同じ(例えば5×5)受入れ
領域から、ユニットの合成アレー上へ合成カーネル即ち
2つの別々のカーネル(2つの5×5のカーネルのよう
な)を用いた非線形たたみ込みとなる。第5図に示すよ
うに、マツプ301は12×12のアレー、マツプ40
1は8X8のアレーである。
制約特徴マツプ401中の他のユニットは、ユニット4
20で使われたと同じカーネルを用いる。層40中の他
のマツプは、第5図に示されたものとは異なるカーネル
を用いて、同一の方法でマツプ401ヘイメージを操作
するユニットを含んでいる。第7図から第9図までは層
40に対する異なるカーネルを示している。
20で使われたと同じカーネルを用いる。層40中の他
のマツプは、第5図に示されたものとは異なるカーネル
を用いて、同一の方法でマツプ401ヘイメージを操作
するユニットを含んでいる。第7図から第9図までは層
40に対する異なるカーネルを示している。
第6図は、制約特徴マツプ401から、特徴減少マツプ
501中のユニット520への接続を示している。この
例ではマツプ401は8×8のアレーマツプ501は4
X4のアレーである。特徴減少マツプ中のユニット52
0は、制約特徴マツプの入力面上の2×2の受入れ領域
421を用いる。計算素子の中で行われた機能は、受入
れ領域中での入力の単純平均化プロセスを含んでいる。
501中のユニット520への接続を示している。この
例ではマツプ401は8×8のアレーマツプ501は4
X4のアレーである。特徴減少マツプ中のユニット52
0は、制約特徴マツプの入力面上の2×2の受入れ領域
421を用いる。計算素子の中で行われた機能は、受入
れ領域中での入力の単純平均化プロセスを含んでいる。
マツプ501中の隣接ユニットは、マツプ401中の受
入れ領域の離れた2を有する。特徴減少マツプ501中
の他のユニットは、ユニット520で使われた同じカー
ネルを用いる。層50中の他のマツプは、マツプ501
のためのものと実質的に同一なカーネルを用いて、同一
の方法でマツプ501ヘイメージを操作するユニットを
含んでいる。
入れ領域の離れた2を有する。特徴減少マツプ501中
の他のユニットは、ユニット520で使われた同じカー
ネルを用いる。層50中の他のマツプは、マツプ501
のためのものと実質的に同一なカーネルを用いて、同一
の方法でマツプ501ヘイメージを操作するユニットを
含んでいる。
tIi7図から第9図までは、第2図に示したネットワ
ークで学習されたカーネルの典型的なセットを示してい
る。カーネルは第1、第2特徴検出層中の制約特徴マツ
プのための計算素子によって用いられる。
ークで学習されたカーネルの典型的なセットを示してい
る。カーネルは第1、第2特徴検出層中の制約特徴マツ
プのための計算素子によって用いられる。
個々の四角の輝度の増したレベルは、カーネル中の重み
に対する、より陽性なアナログ(グレイレベル)値をし
めす。個々の四角の暗度の増した(交差ハツチング)レ
ベルはカーネル中の重みに対する、より負性なアナログ
(グレイレベル)値をしめす。カーネル610から61
3までは、制約特徴マツプ201から203で用いられ
る。カーネル620から624までは、制約特徴マツプ
401,402.403.405.406の中のユニッ
トを計算するために特徴減少マツプ301で用いられる
。カーネル625から629までは制約特徴マツプ40
2から406の中でユニットを計算するために制約特徴
マツプ302で用いられる。カーネル630から634
までは制約特徴マツプ407.408.409.411
.412の中のユニットを計算するために特徴減少マツ
プ303で用いられる。カーネル635から639まで
は制約特徴マツプ408から412までのユニットを計
算するために制約特徴マツプ304で用いられる。
に対する、より陽性なアナログ(グレイレベル)値をし
めす。個々の四角の暗度の増した(交差ハツチング)レ
ベルはカーネル中の重みに対する、より負性なアナログ
(グレイレベル)値をしめす。カーネル610から61
3までは、制約特徴マツプ201から203で用いられ
る。カーネル620から624までは、制約特徴マツプ
401,402.403.405.406の中のユニッ
トを計算するために特徴減少マツプ301で用いられる
。カーネル625から629までは制約特徴マツプ40
2から406の中でユニットを計算するために制約特徴
マツプ302で用いられる。カーネル630から634
までは制約特徴マツプ407.408.409.411
.412の中のユニットを計算するために特徴減少マツ
プ303で用いられる。カーネル635から639まで
は制約特徴マツプ408から412までのユニットを計
算するために制約特徴マツプ304で用いられる。
第12図から第15図までは、手書きの大文字“K”が
ネットワークにより認識される実験中の変化する輝度(
暗度)における各マツプ中のユニットを示している。マ
ツプの場所は、第2図のそれらの場所にほぼ対応してい
る。即ち、元のイメージは第12図の左上部に現れる。
ネットワークにより認識される実験中の変化する輝度(
暗度)における各マツプ中のユニットを示している。マ
ツプの場所は、第2図のそれらの場所にほぼ対応してい
る。即ち、元のイメージは第12図の左上部に現れる。
第12図から第15図の第1柱は、レベル20のマツプ
に対応している。第12図から第15図の第2柱は、レ
ベル30のマツプに対応している。第12図から第15
図の第3柱は、レベル4・0のマツプに対応している。
に対応している。第12図から第15図の第2柱は、レ
ベル30のマツプに対応している。第12図から第15
図の第3柱は、レベル4・0のマツプに対応している。
第12図から第15図の第4柱は、レベル50のマツプ
に対応している。第12図から第15図の第5柱は、分
類層60の出力に対応している。
に対応している。第12図から第15図の第5柱は、分
類層60の出力に対応している。
第2図から第15図までに示された典型的なネットワー
クの実施例には、約90,000の接続と、僅か約26
00の自由パラメータがあると推定されている。例えば
層30から層40への接続は、32゜000の入力接続
と768の出カニニットを含んでいる。これらの数字は
バイアス接続を除いているので近似値である。
クの実施例には、約90,000の接続と、僅か約26
00の自由パラメータがあると推定されている。例えば
層30から層40への接続は、32゜000の入力接続
と768の出カニニットを含んでいる。これらの数字は
バイアス接続を除いているので近似値である。
当業者にとって、受入れ領域とアレーの大きさは、本発
明の精神から離れることなしに、変更し得ることは明ら
かである。更に、アルファベットと英数字の他のセット
もネットワークアーキテクチアーの僅かな調整のみで認
識し得ることは、当業者には明らかなことである。
明の精神から離れることなしに、変更し得ることは明ら
かである。更に、アルファベットと英数字の他のセット
もネットワークアーキテクチアーの僅かな調整のみで認
識し得ることは、当業者には明らかなことである。
第1図は、ネットワークの個々の計算素子に対する簡単
化したブロツクダイヤグラム、 第2図は、本発明の原理に従った、典型的な階層制約自
動学習ネットワークの簡tIt化したブロックダイヤグ
ラム、 93.4,5.6図は、1つのレベルのマツプ中のユニ
ットと1段上のレベルのマツプ中のユニット間の接続関
係を示す簡単化したダイヤグラム、第7.8.9図は、
第2図のネットワークに用いられた典型的なカーネルの
表示を集めた図、第10図は、第7.8.9図の組合せ
表示図、第11図は、第12図から第15図の組合せ表
示図、 第12図から第15図までは、アルファベット文字を認
識する間の、第2図のネットワーク実施例で作られた典
型的な特徴マツプ表示を集めた図である。 出 願 人;アメリカン テレフォン アンドFIG、
1 1− (n十L) Flに、10 FIC;、 17
化したブロツクダイヤグラム、 第2図は、本発明の原理に従った、典型的な階層制約自
動学習ネットワークの簡tIt化したブロックダイヤグ
ラム、 93.4,5.6図は、1つのレベルのマツプ中のユニ
ットと1段上のレベルのマツプ中のユニット間の接続関
係を示す簡単化したダイヤグラム、第7.8.9図は、
第2図のネットワークに用いられた典型的なカーネルの
表示を集めた図、第10図は、第7.8.9図の組合せ
表示図、第11図は、第12図から第15図の組合せ表
示図、 第12図から第15図までは、アルファベット文字を認
識する間の、第2図のネットワーク実施例で作られた典
型的な特徴マツプ表示を集めた図である。 出 願 人;アメリカン テレフォン アンドFIG、
1 1− (n十L) Flに、10 FIC;、 17
Claims (5)
- (1)複数のイメージユニットを有する影像マップの文
字認識のための大量並列計算ネットワークにおいて、 複数の制約特徴マップと、対応する複数の特徴減少マッ
プとを含む第1、第2特徴検出層を有し、各マップは、
複数のユニットと前記マップ中の前記ユニットの値を作
るための複数の対応する計算素子を含み、 前記各特徴減少マップは、前記各制約特徴マップより少
ないユニットを有し、 前記計算素子は、関連重みづけ核を有し、所定の他のマ
ップからの複数のほぼ近傍ユニットに応答して、前記関
連重みづけ核と前記所定の近傍ユニットとのドット積を
選択された非線形標準にマップ化し、前記計算素子は、
同一マップに関連する他の各計算素子とは異なる複数の
ほぼ近傍ユニットに応答し、前記第2特徴検出層は、前
記第1特徴検出層よりも少ないユニットを有し、 前記第1特徴検出層の制約特徴マップは、イメージユニ
ットに応答し、 前記第1特徴検出層の各特徴減少マップは、それの対応
する制約特徴マップからのユニットに応答し、前記第2
特徴検出層の前記制約特徴マップは、前記第1特徴検出
層中の少なくとも1つの特徴減少マップからのユニット
に応答し、 前記第2特徴検出層の各特徴減少マップは、それの対応
する制約特徴マップからのユニットに応答し、更に、前
記第2特徴検出層のすべての特徴減少マップに完全に接
続され、ネットワークによって認識された文字を表す指
示を生成する文字分類層を有する ことを特徴とする文字認識用計算ネットワーク。 - (2)選択された非線形標準はS字関数を含むことを特
徴とする請求項1に記載の計算ネットワーク。 - (3)前記イメージマップは、元の文字イメージを囲む
実質的一定の所定の背景を含むことを特徴とする請求項
2記載の計算ネットワーク。 - (4)イメージマップ中に含まれる文字の文字認識用大
量並列計算ネットワークにおいて、前記ネットワークは
、前記イメージマップから制約特徴を抽出し、かつ抽出
された制約特徴をアンダーサンプリングする第1特徴検
出層手段、 前記第1層手段からアンダーサンプリングされた抽出制
約特徴からの制約特徴を抽出し、かつ第2層手段の抽出
された制約特徴をアンダーサンプリングする第2特徴検
出層手段、 ネットワークによって認識された文字を表す指示を生成
する前記第2特徴検出層手段に完全に接続された文字分
類層手段を含むことを特徴とする文字認識用計算ネット
ワーク。 - (5)前記イメージマップは元の文字映像を囲む実質的
一定の所定の背景を含むことを特徴とする請求項4記載
の計算ネットワーク。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US07/444,455 US5067164A (en) | 1989-11-30 | 1989-11-30 | Hierarchical constrained automatic learning neural network for character recognition |
US444455 | 1989-11-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0334082A true JPH0334082A (ja) | 1991-02-14 |
JPH0650539B2 JPH0650539B2 (ja) | 1994-06-29 |
Family
ID=23764959
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2135546A Expired - Fee Related JPH0650539B2 (ja) | 1989-11-30 | 1990-05-28 | 文字認識用計算ネットワーク |
Country Status (3)
Country | Link |
---|---|
US (1) | US5067164A (ja) |
JP (1) | JPH0650539B2 (ja) |
CA (1) | CA2015740C (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100560017B1 (ko) * | 2002-11-09 | 2006-03-15 | 유경진 | 일회용 구강 세정기 및 그의 제조방법 |
JP2009041171A (ja) * | 2007-08-09 | 2009-02-26 | Tei Senden | リボン織機の送出しローラーユニット伝動装置 |
Families Citing this family (97)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5588091A (en) * | 1989-05-17 | 1996-12-24 | Environmental Research Institute Of Michigan | Dynamically stable associative learning neural network system |
US5361328A (en) * | 1989-09-28 | 1994-11-01 | Ezel, Inc. | Data processing system using a neural network |
JPH07104952B2 (ja) * | 1989-12-28 | 1995-11-13 | シャープ株式会社 | パターンマッチング装置 |
US5271090A (en) * | 1990-03-21 | 1993-12-14 | At&T Bell Laboratories | Operational speed improvement for neural network |
JPH03288285A (ja) * | 1990-04-04 | 1991-12-18 | Takayama:Kk | データ処理装置の学習方法 |
KR910020571A (ko) * | 1990-05-21 | 1991-12-20 | 다카도리 수나오 | 데이터 처리장치 |
JP2760145B2 (ja) * | 1990-09-26 | 1998-05-28 | 三菱電機株式会社 | 知識情報処理装置 |
US5263107A (en) * | 1991-01-31 | 1993-11-16 | Sharp Kabushiki Kaisha | Receptive field neural network with shift-invariant pattern recognition |
JPH04315272A (ja) * | 1991-04-12 | 1992-11-06 | Eastman Kodak Japan Kk | 図形認識装置 |
EP0514986B1 (fr) * | 1991-05-24 | 1997-12-10 | Laboratoires D'electronique Philips S.A.S. | Procédé d'apprentissage d'un réseau de neurones et dispositif de classification pour la mise en oeuvre de ce procédé |
US5293456A (en) * | 1991-06-28 | 1994-03-08 | E. I. Du Pont De Nemours And Company | Object recognition system employing a sparse comparison neural network |
US5493688A (en) * | 1991-07-05 | 1996-02-20 | Booz, Allen & Hamilton, Inc. | Pattern categoritzation system having self-organizing analog fields |
US5179596A (en) * | 1991-07-05 | 1993-01-12 | Booz, Allen & Hamilton, Inc. | Analog pattern categorization system having dual weighted connectivity between nodes |
DE4138740A1 (de) † | 1991-11-26 | 1993-05-27 | Schloemann Siemag Ag | Verfahren und vorrichtung zum stranggiessen von brammen oder bloecken |
US6850252B1 (en) | 1999-10-05 | 2005-02-01 | Steven M. Hoffberg | Intelligent electronic appliance system and method |
US5903454A (en) | 1991-12-23 | 1999-05-11 | Hoffberg; Linda Irene | Human-factored interface corporating adaptive pattern recognition based controller apparatus |
US6400996B1 (en) | 1999-02-01 | 2002-06-04 | Steven M. Hoffberg | Adaptive pattern recognition based control system and method |
US10361802B1 (en) | 1999-02-01 | 2019-07-23 | Blanding Hovenweep, Llc | Adaptive pattern recognition based control system and method |
US6418424B1 (en) | 1991-12-23 | 2002-07-09 | Steven M. Hoffberg | Ergonomic man-machine interface incorporating adaptive pattern recognition based control system |
US8352400B2 (en) | 1991-12-23 | 2013-01-08 | Hoffberg Steven M | Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore |
JP2809954B2 (ja) * | 1992-03-25 | 1998-10-15 | 三菱電機株式会社 | 画像感知および処理のための装置および方法 |
EP0566015A3 (en) * | 1992-04-14 | 1994-07-06 | Eastman Kodak Co | Neural network optical character recognition system and method for classifying characters in amoving web |
US5481621A (en) * | 1992-05-28 | 1996-01-02 | Matsushita Electric Industrial Co., Ltd. | Device and method for recognizing an image based on a feature indicating a relative positional relationship between patterns |
DE69333811T2 (de) * | 1992-06-19 | 2006-05-11 | United Parcel Service Of America, Inc. | Verfahren und Gerät zur Erzeugung und Einstellung eines Neurones |
US5438629A (en) * | 1992-06-19 | 1995-08-01 | United Parcel Service Of America, Inc. | Method and apparatus for input classification using non-spherical neurons |
JP2723118B2 (ja) * | 1992-08-31 | 1998-03-09 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 2次元オブジェクトの認識に用いるためのニューラル・ネットワーク及び光学式文字認識装置 |
US5377302A (en) * | 1992-09-01 | 1994-12-27 | Monowave Corporation L.P. | System for recognizing speech |
US5319722A (en) * | 1992-10-01 | 1994-06-07 | Sony Electronics, Inc. | Neural network for character recognition of rotated characters |
US5742702A (en) * | 1992-10-01 | 1998-04-21 | Sony Corporation | Neural network for character recognition and verification |
US5337372A (en) * | 1992-10-13 | 1994-08-09 | At&T Bell Laboratories | Method and apparatus for symbol recognition using multidimensional preprocessing at multiple resolutions |
US5647022A (en) * | 1992-10-13 | 1997-07-08 | Lucent Technologies Inc. | Method and apparatus for symbol recognition using multidimensional preprocessing and symbol sorting |
US5625708A (en) * | 1992-10-13 | 1997-04-29 | Lucent Technologies, Inc. | Method and apparatus for symbol recognition using multidimensional preprocessing |
JPH06203005A (ja) * | 1992-10-27 | 1994-07-22 | Eastman Kodak Co | 高速区分化ニューラルネットワーク及びその構築方法 |
DE69314293T2 (de) * | 1992-12-16 | 1998-04-02 | Koninkl Philips Electronics Nv | Neuronalanlage und -Bauverfahren |
US5479574A (en) * | 1993-04-01 | 1995-12-26 | Nestor, Inc. | Method and apparatus for adaptive classification |
JPH0744514A (ja) * | 1993-07-27 | 1995-02-14 | Matsushita Electric Ind Co Ltd | ニューラルネットの学習用データ縮約化方法 |
US5649068A (en) * | 1993-07-27 | 1997-07-15 | Lucent Technologies Inc. | Pattern recognition system using support vectors |
GB2282906B (en) * | 1993-10-13 | 1996-11-06 | Dataquill Ltd | Data enty systems |
US5473730A (en) * | 1993-11-09 | 1995-12-05 | At&T Ipm Corp. | High efficiency learning network |
US5774586A (en) * | 1994-05-04 | 1998-06-30 | Ncr Corporation | Method and apparatus for standardization of inputs to word recognition systems |
US5572628A (en) * | 1994-09-16 | 1996-11-05 | Lucent Technologies Inc. | Training system for neural networks |
US5802204A (en) * | 1995-06-07 | 1998-09-01 | Microchip Technology Incorporated | Handwritten character translator using fuzzy logic |
US7904187B2 (en) | 1999-02-01 | 2011-03-08 | Hoffberg Steven M | Internet appliance system and method |
US8064886B2 (en) | 1999-08-12 | 2011-11-22 | Hewlett-Packard Development Company, L.P. | Control mechanisms for mobile devices |
US7503016B2 (en) | 1999-08-12 | 2009-03-10 | Palm, Inc. | Configuration mechanism for organization of addressing elements |
US7007239B1 (en) | 2000-09-21 | 2006-02-28 | Palm, Inc. | Method and apparatus for accessing a contacts database and telephone services |
US20060121938A1 (en) | 1999-08-12 | 2006-06-08 | Hawkins Jeffrey C | Integrated handheld computing and telephony device |
US7216177B1 (en) | 2000-06-16 | 2007-05-08 | Palm, Inc. | Apparatus and method for supplying electronic content to network appliances |
US8332553B2 (en) | 2000-09-21 | 2012-12-11 | Hewlett-Packard Development Company, L.P. | Method and apparatus for accessing a contacts database and telephone services |
EP1262907B1 (en) * | 2001-05-28 | 2007-10-03 | Honda Research Institute Europe GmbH | Pattern recognition with hierarchical networks |
US6950988B1 (en) | 2001-06-11 | 2005-09-27 | Handspring, Inc. | Multi-context iterative directory filter |
US7356361B1 (en) | 2001-06-11 | 2008-04-08 | Palm, Inc. | Hand-held device |
US6957397B1 (en) | 2001-06-11 | 2005-10-18 | Palm, Inc. | Navigating through a menu of a handheld computer using a keyboard |
US7395089B1 (en) | 2001-06-11 | 2008-07-01 | Palm, Inc | Integrated personal digital assistant device |
US6975304B1 (en) | 2001-06-11 | 2005-12-13 | Handspring, Inc. | Interface for processing of an alternate symbol in a computer device |
US6976226B1 (en) | 2001-07-06 | 2005-12-13 | Palm, Inc. | Translating tabular data formatted for one display device to a format for display on other display devices |
US7692667B2 (en) | 2001-08-17 | 2010-04-06 | Palm, Inc. | Handheld computer having moveable segments that are interactive with an integrated display |
US7231208B2 (en) * | 2001-10-17 | 2007-06-12 | Palm, Inc. | User interface-technique for managing an active call |
US7192235B2 (en) | 2001-11-01 | 2007-03-20 | Palm, Inc. | Temporary messaging address system and method |
US7665043B2 (en) | 2001-12-28 | 2010-02-16 | Palm, Inc. | Menu navigation and operation feature for a handheld computer |
US7474298B2 (en) | 2002-05-31 | 2009-01-06 | Palm, Inc. | Mobile device having an adjustable length to selectively expose a surface component |
US8374974B2 (en) * | 2003-01-06 | 2013-02-12 | Halliburton Energy Services, Inc. | Neural network training data selection using memory reduced cluster analysis for field model development |
US7164088B1 (en) * | 2003-03-16 | 2007-01-16 | Palm, Inc. | Method and apparatus to improve tactile feel for keyboards and button assemblies |
US7231229B1 (en) | 2003-03-16 | 2007-06-12 | Palm, Inc. | Communication device interface |
US7835504B1 (en) | 2003-03-16 | 2010-11-16 | Palm, Inc. | Telephone number parsing and linking |
JPWO2004084121A1 (ja) * | 2003-03-17 | 2006-06-22 | 富士通株式会社 | 車両識別方法及び装置 |
US7295852B1 (en) | 2003-05-01 | 2007-11-13 | Palm, Inc. | Automated telephone conferencing method and system |
US7865180B2 (en) | 2003-06-23 | 2011-01-04 | Palm, Inc. | Automated telephone conferencing method and system |
US7287015B2 (en) * | 2004-09-30 | 2007-10-23 | International Business Machines Corporation | Methods and apparatus for transmitting signals through network elements for classification |
WO2007095107A2 (en) * | 2006-02-10 | 2007-08-23 | Numenta, Inc. | Architecture of a hierarchical temporal memory based system |
US8065244B2 (en) * | 2007-03-14 | 2011-11-22 | Halliburton Energy Services, Inc. | Neural-network based surrogate model construction methods and applications thereof |
US9031583B2 (en) | 2007-04-11 | 2015-05-12 | Qualcomm Incorporated | Notification on mobile device based on location of other mobile device |
US9140552B2 (en) | 2008-07-02 | 2015-09-22 | Qualcomm Incorporated | User defined names for displaying monitored location |
US20080254811A1 (en) | 2007-04-11 | 2008-10-16 | Palm, Inc. | System and method for monitoring locations of mobile devices |
US8126519B2 (en) | 2007-08-31 | 2012-02-28 | Hewlett-Packard Development Company, L.P. | Housing for mobile computing device having construction to slide and pivot into multiple positions |
US8233948B2 (en) | 2007-12-11 | 2012-07-31 | Hewlett-Packard Development Company, L.P. | Slider assembly for a housing of a mobile computing device |
US8150482B2 (en) | 2008-01-08 | 2012-04-03 | Hewlett-Packard Development Company, L.P. | Mobile computing device with moveable housing segments |
US8611661B2 (en) * | 2007-12-26 | 2013-12-17 | Intel Corporation | OCR multi-resolution method and apparatus |
US8200298B2 (en) | 2008-01-08 | 2012-06-12 | Hewlett-Packard Development Company, L.P. | Keypad housing configuration for a mobile computing device |
US9514388B2 (en) * | 2008-08-12 | 2016-12-06 | Halliburton Energy Services, Inc. | Systems and methods employing cooperative optimization-based dimensionality reduction |
AU2009279644B2 (en) * | 2008-08-06 | 2012-08-23 | Halliburton Energy Services, Inc. | Systems and methods employing cooperative optimization-based dimensionality reduction |
US8218904B2 (en) * | 2008-08-27 | 2012-07-10 | Lockheed Martin Corporation | Method and system for circular to horizontal transposition of an image |
JP2011107648A (ja) * | 2009-11-20 | 2011-06-02 | Fujifilm Corp | レンズユニット |
JP2015529365A (ja) | 2012-09-05 | 2015-10-05 | エレメント,インク. | カメラ付きデバイスに関連する生体認証のためのシステム及び方法 |
US9189067B2 (en) | 2013-01-12 | 2015-11-17 | Neal Joseph Edelstein | Media distribution system |
CN106489248A (zh) | 2014-05-13 | 2017-03-08 | 埃利蒙特公司 | 用于与移动设备相关的电子钥匙供应和访问管理的系统和方法 |
US9501740B2 (en) | 2014-06-03 | 2016-11-22 | Saudi Arabian Oil Company | Predicting well markers from artificial neural-network-predicted lithostratigraphic facies |
JP6415607B2 (ja) | 2014-06-03 | 2018-10-31 | エレメント,インク. | モバイル・デバイスに関連する出退認証および管理 |
US10192148B1 (en) * | 2017-08-22 | 2019-01-29 | Gyrfalcon Technology Inc. | Machine learning of written Latin-alphabet based languages via super-character |
KR20200073222A (ko) | 2017-09-18 | 2020-06-23 | 엘리먼트, 인크. | 모바일 인증에서 스푸핑을 검출하기 위한 방법, 시스템 및 매체 |
CA3133229C (en) | 2019-03-12 | 2023-04-04 | Element Inc. | Detecting spoofing of facial recognition with mobile devices |
US11173510B2 (en) * | 2019-03-22 | 2021-11-16 | Twenty Twenty Therapeutics Llc | Imaging device for identifying a liquid within a dispenser |
US11281911B2 (en) | 2019-04-27 | 2022-03-22 | Gyrfalcon Technology Inc. | 2-D graphical symbols for representing semantic meaning of a video clip |
US10713830B1 (en) | 2019-05-13 | 2020-07-14 | Gyrfalcon Technology Inc. | Artificial intelligence based image caption creation systems and methods thereof |
US11526723B2 (en) | 2019-07-09 | 2022-12-13 | Gyrfalcon Technology Inc. | Apparatus and methods of obtaining multi-scale feature vector using CNN based integrated circuits |
US11507248B2 (en) | 2019-12-16 | 2022-11-22 | Element Inc. | Methods, systems, and media for anti-spoofing using eye-tracking |
US11774553B2 (en) * | 2020-06-18 | 2023-10-03 | Infineon Technologies Ag | Parametric CNN for radar processing |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4774677A (en) * | 1981-08-06 | 1988-09-27 | Buckley Bruce S | Self-organizing circuits |
US4760604A (en) * | 1985-02-15 | 1988-07-26 | Nestor, Inc. | Parallel, multi-unit, adaptive, nonlinear pattern class separator and identifier |
US4897811A (en) * | 1988-01-19 | 1990-01-30 | Nestor, Inc. | N-dimensional coulomb neural network which provides for cumulative learning of internal representations |
-
1989
- 1989-11-30 US US07/444,455 patent/US5067164A/en not_active Expired - Lifetime
-
1990
- 1990-04-30 CA CA002015740A patent/CA2015740C/en not_active Expired - Fee Related
- 1990-05-28 JP JP2135546A patent/JPH0650539B2/ja not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100560017B1 (ko) * | 2002-11-09 | 2006-03-15 | 유경진 | 일회용 구강 세정기 및 그의 제조방법 |
JP2009041171A (ja) * | 2007-08-09 | 2009-02-26 | Tei Senden | リボン織機の送出しローラーユニット伝動装置 |
Also Published As
Publication number | Publication date |
---|---|
JPH0650539B2 (ja) | 1994-06-29 |
CA2015740A1 (en) | 1991-05-31 |
CA2015740C (en) | 1996-01-16 |
US5067164A (en) | 1991-11-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH0334082A (ja) | 文字認識用計算ネットワーク | |
US5058179A (en) | Hierarchical constrained automatic learning network for character recognition | |
Lin et al. | IENet: Interacting embranchment one stage anchor free detector for orientation aerial object detection | |
Le Cun et al. | Handwritten digit recognition: Applications of neural net chips and automatic learning | |
Toivanen | New geodosic distance transforms for gray-scale images | |
KR101298393B1 (ko) | 그래픽 처리 유닛 상에서 콘볼루션 신경망을 트레이닝하는방법 | |
US20200285954A1 (en) | Memory-based convolutional neural network system | |
US5511134A (en) | Image recognition device and image recognition method | |
US20200279166A1 (en) | Information processing device | |
US5793932A (en) | Image recognition device and an image recognition method | |
US5271090A (en) | Operational speed improvement for neural network | |
Lin et al. | Lateral refinement network for contour detection | |
CN111899203A (zh) | 基于标注图在无监督训练下的真实图像生成方法及存储介质 | |
US11481919B2 (en) | Information processing device | |
US10970201B2 (en) | System, method and apparatus for data manipulation | |
CN115049830A (zh) | 一种基于矩阵边缘特征元素的图像缩边模型、方法及装置 | |
Mujtaba et al. | Automatic solar panel detection from high-resolution orthoimagery using deep learning segmentation networks | |
Kussul et al. | LIRA neural classifier for handwritten digit recognition and visual controlled microassembly | |
US5737444A (en) | Binary digital image feature extracting process | |
Bodani et al. | OrthoSeg: a deep multimodal convolutional neural network for semantic segmentation of orthoimagery | |
JPH0367381A (ja) | 文字認識装置 | |
CN114254618B (zh) | 基于动态路由注意力机制的视觉问答方法、存储介质及设备 | |
CN117315753A (zh) | 基于注意力和相对距离对齐的低分辨率人脸表情识别方法 | |
Ma et al. | Heterogeneous Image Change Detection based on Dual Image Translation and Dual Contrastive Learning | |
Hemminger et al. | Using a Hopfield network for rotation and scale independent pattern recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |