JPH0334082A - 文字認識用計算ネットワーク - Google Patents

文字認識用計算ネットワーク

Info

Publication number
JPH0334082A
JPH0334082A JP2135546A JP13554690A JPH0334082A JP H0334082 A JPH0334082 A JP H0334082A JP 2135546 A JP2135546 A JP 2135546A JP 13554690 A JP13554690 A JP 13554690A JP H0334082 A JPH0334082 A JP H0334082A
Authority
JP
Japan
Prior art keywords
feature
map
maps
network
units
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2135546A
Other languages
English (en)
Other versions
JPH0650539B2 (ja
Inventor
John S Denker
ジョン エス.デンカー
Richard E Howard
リチャード イー.ハワード
Lawrence D Jackel
ローレンス ディ.ラッケル
Yann Lecun
ヤン レカン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
American Telephone and Telegraph Co Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by American Telephone and Telegraph Co Inc filed Critical American Telephone and Telegraph Co Inc
Publication of JPH0334082A publication Critical patent/JPH0334082A/ja
Publication of JPH0650539B2 publication Critical patent/JPH0650539B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/1801Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
    • G06V30/18019Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by matching or filtering
    • G06V30/18038Biologically-inspired filters, e.g. difference of Gaussians [DoG], Gabor filters
    • G06V30/18048Biologically-inspired filters, e.g. difference of Gaussians [DoG], Gabor filters with interaction between the responses of different filters, e.g. cortical complex cells
    • G06V30/18057Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明はパターン認識の分野に関し、特に光学文字認識
用の大量並列的制約ネットワークに関する。
[従来技術] きめ細い並列アーキテクチャ−を持つ適応学習をベース
にした計算システムが、コンピュータベースの情報収集
、処理、操作、蓄積、伝送などの進歩により、近年登場
するようになった。これらのシステムに採用される概念
は、個々のイメージ中の文字パターンの自動的認識、解
析、及び分類等の問題を解決する高効率アプローチを表
している。そのようなシステムにおける技術的価値は、
従来方式と比べた効率と精度で決められる。
Connectioniss in Perspect
lve 143−155頁(Elsevler 5cl
ence Publlshers:North−11o
lland 1989)のY、LeCunの“−膜化と
ネットワーク設計戦略”と題する論文中で、光デジット
認識問題へ適用される5階層ネットワークアーキテクチ
ャ−について述べられている。ネットワークの夫々にお
ける学習は、D。
Rumelhart他のParallel Distr
ibuted Processing、VOL、 1.
318−302頁(Bradrord Books:C
ambrldge、Mass、198B)で述べられて
いるバック伝搬技術から得られた固有の分類知能を介し
て、手書き数字のビクセルイメージについて試みられた
。ネットワークの複雑性は、2つのレベルの制約特徴マ
ツプを持つ階層ネットワークへ最終的には拡大してしま
うことを示した。階層ネットワークの性能は、余り複雑
でないネットワークのそれ以上である。更にそれは、多
レベルの制約特徴マツプはシフト不変量の追加制御が必
要であった。
上記の階層ネットワークは、文字認識や分類の問題を解
決する技術を進歩させるが、信頼性の高い自動文字認識
装置の実現を可能にするには、現システムは十分な精度
を欠いていることも明らかである。
[発明の概要] 高い精度と信頼性ある光文字認識は、制約特徴検出の各
層が複数の制約特徴マツプとそれに対応する複数の特徴
減少マツプを含む制約特徴検出の数層をもつ階層化ネッ
トワークによって提供される。各特徴減少マツプは、そ
の制約特徴マツプをアンダーサンプリングするために、
同一層のただ1つの制約特徴マツプと接続される。第1
の制約特徴検出層の各制約特徴マツプ中のユニットは、
対応する核の関数として、及びユニットに関連する受入
れ領域の中に捕らえられた文字のビクセルイメージの異
なる部分の関数として応答する。第2の制約特徴検出層
の各特徴マツプ中のユニットは、対応する核の関数とし
て、及び個々の特徴減少マツプの異なる部分、又はユニ
ットの受入れ領域の中に捕らえられた第1制約特徴検出
層中の数個の特徴減少マツプの組合わせの関数として応
答する。第2の制約特徴検出層の特徴減少マツプは、最
後の分類層の各ユニットと完全に接続される。核はネッ
トワークの始動又は訓練の間、制約バック伝搬により自
動的に学習される。
このネットワークのアーキテクチャ−から実現された利
点は、シフト不変量の増加、エントロピの大幅減少、パ
ブニラクーチニルボネンキス(Vapnik−cher
vonenkis)の次元化、及び自由パラメータの数
である。この改良の結果として、ネットワークは一般化
性能の与えられたレベルに達するために必要な訓練デー
タ量、即ち訓練時間を比例的に減少させる。
[実施例の説明] 第1図に示す計算素子は、本発明により実現された階層
制約ネットワークのための基礎的な機能及び相互接続ブ
ロックを形成する。一般に、計算素子はn千1個の入力
の入力値加重和を作り、単一値に達するために非線形性
回路を介して結果を伝える。計算素子の人力値と出力値
は、多レベル、グレイスケール、あるいは現存の二進の
ようなアナログ、準アナログである。計算素子に用いら
れる非線形性回路は、例えば、ハード・リミッタ−1し
きい論理素子、及びS字状非線形性を含む。
動作については、第1図に示す計算素子は、イメージ又
は特徴マツプからのn個の近傍の人力ビクセル、ピクセ
ル値、及びユニット値を走査し、このピクセル値とユニ
ット値は、a11a2、・・・、a□と表された値を持
っている。人力バイアスは計算素子のn+1番目の人力
に供給される。簡単化のためバイアスは通常1のような
一定値にセットされる。入力値とバイアスは、掛算器1
−1から1−(n+1)まで供給される。掛算器は重み
W からWn+1をもbカーネルからの入力を受は入れ
る。すべての掛算器からの出力は、入力値の加重和をつ
くる加算器2へ供給される。加算器2の出力は、重みの
カーネルを表すベクトルと入力値(バイアス値を含む)
のベクトルとのドツト積である。加算器2からの出力値
は、単一ユニツト出力値x1を作る非線形性回’i!l
sB中の非線関数を通過する。以下に詳述するように、
ユニツト出力値Xtは、特徴マツプ中のi番目のユニッ
トの値に関するものである。
実施例では、非線性回路3用の典型的S字状関数は、目
盛り双曲線正接関数、f(α)−、AtanhSαとし
て選ばれている。ここでαは非線性回路3への加重和入
力、Aは関数の振幅、Sは原点における関数の傾斜を決
める。上述のごとく、非線形性関数は+Aと−Aにおけ
る水平漸近線をもつ奇数関数である。奇数対称を表す非
線形関数は、カーネルの重みWtからWnilまでより
早い転換を提供できる。
階層制約ネットワーク中の夫々のカーネルの重みは、バ
ック伝搬として知られている試行錯誤技術を用いて得ら
れたものである。これは前記Rumelhart他の論
文や、R,P、Llppsamsの“神経網をもつ計算
の導入”と題する1lEI2E ASSP Magaz
lne第4巻、第2号、4−22頁(1987)に述べ
られている。訓練前は、カーネルの中の重みの夫々は、
例えば、−2,4/F1と2.4/F、の均一分布を用
いたランダム値に初期化される。ここでF、は、その接
続が属するユニットの入力(ファン・イン〉の数である
。第1図の例では、ファン・インFlはn+1に等しい
。この初期化技術を使って、S字状非線性の操作範囲内
に値を維持することが可能である。訓練中はイメージパ
ターンは一定順序で与えられる。重みは、認識のための
単一イメージパターンの各表示後に、統計的傾斜又は“
オンライン”の手順で更新される。実際の傾斜手順は、
重みが更新される前に、平均化が全訓練セットについて
行われるように、更新のために使われる。統計的傾斜は
、特別大きい冗長度の大きいイメージデータベース用の
実際の傾斜よりも、重みを早く転換させることが知られ
ている。
通常の技術が、手書き文字を、供給された文字イメージ
を形成するビクセル・アレーへ転換するために用いられ
る。文字イメージは、遠隔地からの電子伝送により、ま
たは走査カメラやその他の走査デバイスで局部的に得ら
れる。そのソースに関係なく、従来方式により、文字イ
メージはビクセルの順序ずけられた集合によって表示さ
れる。順序ずけられた集合の代表はアレーである。−旦
表示されると、文字イメージは捕獲されて、光メモリ・
デバイス又はフレーム・バッファのような電子メモリ・
デバイスに蓄えられる。
各ビクセルは可視文字イメージの小域から放射される光
の強さや色に対応した関連値を有している。
ビクセルの値はその後メモリ・デバイスに蓄えられる。
個々のマツプに言及すると、′ビクセル1と“ユニット
値1の語は同じ意味で使われ、それはビクセル、ピクセ
ル値、及びマツプ・アレーを形成するための各計算素子
の組合わせからのビクセル値出力を含むと解される。そ
れは、ネットワークの操作の理解を視覚化したり展開し
たりするためのピクセル値又はユニット値よりも、むし
ろビクセルの平面的、即ち2次元的アレー(マツプ)の
観点から考える方が便利である。元のイメージとそれに
続く特徴マツプのために、ビクセルの強さレベルを使っ
たピクセル値とユニット値のそのような視覚化は第12
図から第15図に示される。
ビクセル強さレベルをもつビクセルとユニット値の視覚
化に加えて、この方法でカーネルの中の重みのアレーを
視覚化することも有益である。第7図から第9図までは
、第2図のネットワーク実施例の実験中に習得されたカ
ーネルのアレーを表している。
アレーとしてのカーネルを視覚化することにより、いか
にして又どのカーネルが、計算が行われているビクセル
・アレーに影響するかを容易に理解することが可能とな
る。
文字認識用ビクセル・アレーとしての文字イメージの準
備に使われる各種の他の予備処理は、スケーリング、サ
イズ・ノーマリゼーシュン、デスキューイング、センタ
リング、トランスレージジン、及びシフティング等の各
種線形変換を含んでおり、これらのすべては当業者に良
く知られている。更に、手書き文字からグレイ・スケー
ルのビクセル・アレーへの変換は、さもなければ予備処
理中の回復不能の損失となる情報を保護するために望ま
しいことである。この変換は当業者に良く知られている
文字認識用にイメージを準備するための上記操作に加え
て、元のイメージの周りに実質的一定レベルの均一な境
界を設けることが望ましい。そのような境界は第3図の
アレー102に示され、そこでイメージ10中のアレー
101の外部のアレー素子は均一な境界を構成している
計算素子と全ネットワークの実現化は、ハードウェア又
はソフトウェア、或いはハードウェアとソフトウェアの
便利な組合わせにかかっている。ここで提供されたネッ
トワークの多くは、加算、減算、乗算及び比較の基本的
数学動作を行う単純なプログラムをもつSUNワークス
テーションを用いて実行された。バイブライン・デバイ
ス、マイクロプロセッサ及び特殊目的ディジタル信号プ
ロセッサは、本発明のネットワークを実現するための便
利なアーキテクチャ−を提供する。MOS  VLSI
技術は、第2図に示される型の個々に重みづけされた相
互接続ネットワークを実行するために用いられた。ロー
カル◆メモリは、ビクセルやユニット値及び他の一時的
計算結果を蓄えるのに適している。
第2図は、本発明による階層制約自動学習ネットワーク
のための典型的実施例の簡単化したブロックダイヤグラ
ムを示している。そのネットワークは、供給されたイメ
ージから大量の並列計算を経て文字認識を行う。レベル
20から60までに示される各アレー(ボックス)は、
アレー・ユニットごとに複数の計算素子を含む。
第2図のネットワークは、第1、第2特徴検出層と文字
分類層を含んでいる。各層は特徴マツプ又は異なる寸法
のアレーを含んでいる。従来の大部分の適用では、マツ
プは正方形である。しかし、矩形や、対称、非対称、或
いは不規則なパターンも考えられている。アレーは、ビ
クセル(ユニット値)が蓄えられ、1つ下のレベルのマ
ツプからの特徴検出が、そのマツプのアレーの適切な場
所に置かれるようなメモリ◆デバイスに構成されるので
、検出された特徴の配列は、マツプと称される。その様
にして、特徴の存在又は実質的な存在(グレイ・スケー
ル・レベルを使用した)とその関係場所が記録される。
マツプ中で検出された特徴の型は、使われているカーネ
ルによって決められる。制約特徴マツプ中では、同じカ
ーネルが同じマツプの各ユニツト値使われる。即ち、制
約特徴マツプは、1つの特別なカーネルによって決めら
れた特別な特徴の発生によりビクセル・アレーを走査す
る。その様に、用語“制約“は、特別なマツプを含む計
算素子がカーネルの重みの同じセットを分は合うように
強制される条件を意味する。これにより、入力イメージ
が異なる場所で検出されても同じ特徴となる。この技術
は、重みシェアリングとして知られている。
カーネルは、カーネルによって決められた特徴の発生が
検出されるイメージビクセル又はマツプ・ユニットの面
上に、受入れ領域(5ピクセル×5ビクセル又は2ビク
セル×2ビクセル)を決める。ビクセル・アレー上にカ
ーネルを置くことによって、どのビクセルが特徴マツプ
中の計算素子へ入力されつつあるか、及び特徴マツプ上
のどのユニットが活性化されつつあるかを示すことが可
能となる。活性化されつつあるユニットは、通常、検出
下にあるマツプ中の特徴発生の大体の場所と一致してい
る。
第1特徴検出層は、複数の制約特徴マツプ20とそれに
対応する複数の特徴減少マツプ30を含んでいる。図示
のごとく特別な実施例のネットワークは、第1層に4つ
の夫々の制約特徴マツプ及び対応する複数の特徴減少マ
ツプを含んでいる。第2特徴検出層は、複数の制約特徴
マツプ40とそれに対応する複数の特徴減少マツプ50
を含んでいる。図示のごとく特別な実施例のネットワー
クは、第2層に12の夫々の制約特徴マツプ及び対応す
る複・数の特徴減少マツプを含んでいる。
ネットワークの最後の層は、第2特徴検出層のすべての
特徴減少マツプと完全に接続する文字分類層60を含ん
でいる。文字分類層は、供給された元の信号からネット
ワークによって認識された文字の指示を作る。“完全に
接続”という語は、文字分類層60中のピクセルと関連
した計算素子が、前の層のマツプ、即ち層50に含まれ
るすべてのピクセル又はユニットからの人力を受は入れ
るという意味である。
ネットワークの層から層への相互接続線は、前の層のど
のマツプが、夫々のすべての計算素子への入力を提供す
るか、どのユニットが関係の層の中にマツプを形成する
かを示すために描かれている。例えば、制約特徴マツプ
201から204までは、制約特徴マツプを作る過程で
、イメージ10から異なる特徴を検出する。次のマツプ
のレベルへ進むと、特徴減少マツプ301は制約特徴マ
ツプ201中のユニットから単独でその人力を得ること
が示されている。同様に特徴減少マツプ302から30
4までは、夫々の制約特徴マツプ202から204まで
のユニットから単独でそれの入力を得る。第2図に示さ
れるネットワークの実施例では、第1特徴検出層から第
2特徴検出層への接続はやや複雑である。制約特徴マツ
プ401.404.407.410は、それらの人力を
特徴減少マツプ301から304までの夫々から単独に
得る。制約特徴マツプ402.403.405.406
は、その人力を特徴減少マツプ301と302の組合せ
から得る。制約特徴マツプ408.409.411.4
12は、その人力を特徴減少マツプ303と304の組
合せから得る。最後に、個々の特徴減少マツプ501か
ら512までは、その人力を対応する制約特徴マツプ4
01から412までの夫々から単独で得る。
文字分類層60は、ネットワークにより分解される個々
の文字認識に対して十分な数の素子を含んでいる。即ち
、大文字又は小文字のラテンアルファベット文字の双方
の認識のために、層60の典型的実施例は、AからZま
で、またはaから2までを表す26ユニツトを含んでい
る。一方、数字の認識のためには、層60の一実施例は
、数字0から9までの僅か10ユニツトを含むだけであ
る。
理解を容易にするために、第1図に示された計算素子へ
のバイアス入力とそれに関連するカーネル中の重みは、
第3図から第6図まで、及びその説明からは省略されて
いる。実験的実施においては、バイアスは1にセットさ
れ、対応するカーネル中の重みはバック伝搬を通して学
習される。
第3図は、サンプル接続とイメージ10から制約特徴マ
ツプ201への特徴検出とその相互接続を示す。マツプ
201中のユニット210は、人力イメージ面上の5×
5の近傍を観測し、ユニット210の値を発展させるた
めに典型的なカーネル610からの重みを使用する。グ
レイスケール・ユニット値は、その近傍の入力イメージ
の中のその特徴の存在、実質的存在、実質的不在又は不
在を示す。制約特徴マツプ中の計算素子によって行われ
た機能は、イメージピクセルの5×5の受入れ領域即ち
5×5のカーネルをもつユニットの非線形たたみ込みと
解釈される。マツプ201中の離れた1つのユニットで
あるユニット(計算素子)に対して、人力層中のそれら
の受入れ領域は、離れた1つのピクセルである。
制約特徴マツプ201中の他のユニットは、ユニット2
10で使われた同じカーネルを使う。層20中の他のマ
ツプは、第3図に示すものとは別のカーネルを使って、
マツプ201へと同じ方法で、イメージを操作するユニ
ットを含んでいる。第7図から第9図までは層20に対
する異なるカーネルを示している。
第3図に示すように、イメージ10は28X28ノイメ
ージアレー102中に作られる12ビクセルの広さの一
定値の境界で囲まれた元の文字のイメージを含んだ16
X16のアレー101を含んでいる。
制約特徴マツプ201は24X24のアレーとして示さ
れている。
第4図は、制約特徴マツプ201から、マツプ201中
のユニットのアンダーサンプリングする特徴減少マツプ
301への接続を示す。例えば、特徴減少マツプ301
は12X12のアレーとして示される。ユニット(計算
素子)310は、マツプ201の人力面上の2×2の受
入れ領域から人力を受は取る。ユニットに関連した計算
素子によって行われた機能は、マツプ201中の2×2
の受入れ領域からの単純平均化プロセスを含んでいる。
マツプ301中の隣接するユニットは、マツプ201中
に離れた2ユニツトを有する。特徴減少マツプ301中
の他のユニットは、ユニット210で用いられた同じカ
ーネルを用いる。層30中の他のマツプは、マツプ30
1に対するものと実質的同一のカーネルを使ってマツプ
301へ同一の方法でイメージを操作するユニットを含
んでいる。
第5図は、特徴減少マツプ301から、第2特徴検出層
の制約特徴マツプ401中のユニット420への接続を
示している。この接続は、第3図に示したものと同じで
ある。機能的には、この接続は、マツプ401,404
.407.410への接続のための5×5のカーネルの
非線形たたみ込みである。
第1、第2特徴検出層間の他のすべての接続は、2つの
異なる特徴減少マツプ上の同じ(例えば5×5)受入れ
領域から、ユニットの合成アレー上へ合成カーネル即ち
2つの別々のカーネル(2つの5×5のカーネルのよう
な)を用いた非線形たたみ込みとなる。第5図に示すよ
うに、マツプ301は12×12のアレー、マツプ40
1は8X8のアレーである。
制約特徴マツプ401中の他のユニットは、ユニット4
20で使われたと同じカーネルを用いる。層40中の他
のマツプは、第5図に示されたものとは異なるカーネル
を用いて、同一の方法でマツプ401ヘイメージを操作
するユニットを含んでいる。第7図から第9図までは層
40に対する異なるカーネルを示している。
第6図は、制約特徴マツプ401から、特徴減少マツプ
501中のユニット520への接続を示している。この
例ではマツプ401は8×8のアレーマツプ501は4
X4のアレーである。特徴減少マツプ中のユニット52
0は、制約特徴マツプの入力面上の2×2の受入れ領域
421を用いる。計算素子の中で行われた機能は、受入
れ領域中での入力の単純平均化プロセスを含んでいる。
マツプ501中の隣接ユニットは、マツプ401中の受
入れ領域の離れた2を有する。特徴減少マツプ501中
の他のユニットは、ユニット520で使われた同じカー
ネルを用いる。層50中の他のマツプは、マツプ501
のためのものと実質的に同一なカーネルを用いて、同一
の方法でマツプ501ヘイメージを操作するユニットを
含んでいる。
tIi7図から第9図までは、第2図に示したネットワ
ークで学習されたカーネルの典型的なセットを示してい
る。カーネルは第1、第2特徴検出層中の制約特徴マツ
プのための計算素子によって用いられる。
個々の四角の輝度の増したレベルは、カーネル中の重み
に対する、より陽性なアナログ(グレイレベル)値をし
めす。個々の四角の暗度の増した(交差ハツチング)レ
ベルはカーネル中の重みに対する、より負性なアナログ
(グレイレベル)値をしめす。カーネル610から61
3までは、制約特徴マツプ201から203で用いられ
る。カーネル620から624までは、制約特徴マツプ
401,402.403.405.406の中のユニッ
トを計算するために特徴減少マツプ301で用いられる
。カーネル625から629までは制約特徴マツプ40
2から406の中でユニットを計算するために制約特徴
マツプ302で用いられる。カーネル630から634
までは制約特徴マツプ407.408.409.411
.412の中のユニットを計算するために特徴減少マツ
プ303で用いられる。カーネル635から639まで
は制約特徴マツプ408から412までのユニットを計
算するために制約特徴マツプ304で用いられる。
第12図から第15図までは、手書きの大文字“K”が
ネットワークにより認識される実験中の変化する輝度(
暗度)における各マツプ中のユニットを示している。マ
ツプの場所は、第2図のそれらの場所にほぼ対応してい
る。即ち、元のイメージは第12図の左上部に現れる。
第12図から第15図の第1柱は、レベル20のマツプ
に対応している。第12図から第15図の第2柱は、レ
ベル30のマツプに対応している。第12図から第15
図の第3柱は、レベル4・0のマツプに対応している。
第12図から第15図の第4柱は、レベル50のマツプ
に対応している。第12図から第15図の第5柱は、分
類層60の出力に対応している。
第2図から第15図までに示された典型的なネットワー
クの実施例には、約90,000の接続と、僅か約26
00の自由パラメータがあると推定されている。例えば
層30から層40への接続は、32゜000の入力接続
と768の出カニニットを含んでいる。これらの数字は
バイアス接続を除いているので近似値である。
当業者にとって、受入れ領域とアレーの大きさは、本発
明の精神から離れることなしに、変更し得ることは明ら
かである。更に、アルファベットと英数字の他のセット
もネットワークアーキテクチアーの僅かな調整のみで認
識し得ることは、当業者には明らかなことである。
【図面の簡単な説明】
第1図は、ネットワークの個々の計算素子に対する簡単
化したブロツクダイヤグラム、 第2図は、本発明の原理に従った、典型的な階層制約自
動学習ネットワークの簡tIt化したブロックダイヤグ
ラム、 93.4,5.6図は、1つのレベルのマツプ中のユニ
ットと1段上のレベルのマツプ中のユニット間の接続関
係を示す簡単化したダイヤグラム、第7.8.9図は、
第2図のネットワークに用いられた典型的なカーネルの
表示を集めた図、第10図は、第7.8.9図の組合せ
表示図、第11図は、第12図から第15図の組合せ表
示図、 第12図から第15図までは、アルファベット文字を認
識する間の、第2図のネットワーク実施例で作られた典
型的な特徴マツプ表示を集めた図である。 出 願 人;アメリカン テレフォン アンドFIG、
1 1− (n十L) Flに、10 FIC;、 17

Claims (5)

    【特許請求の範囲】
  1. (1)複数のイメージユニットを有する影像マップの文
    字認識のための大量並列計算ネットワークにおいて、 複数の制約特徴マップと、対応する複数の特徴減少マッ
    プとを含む第1、第2特徴検出層を有し、各マップは、
    複数のユニットと前記マップ中の前記ユニットの値を作
    るための複数の対応する計算素子を含み、 前記各特徴減少マップは、前記各制約特徴マップより少
    ないユニットを有し、 前記計算素子は、関連重みづけ核を有し、所定の他のマ
    ップからの複数のほぼ近傍ユニットに応答して、前記関
    連重みづけ核と前記所定の近傍ユニットとのドット積を
    選択された非線形標準にマップ化し、前記計算素子は、
    同一マップに関連する他の各計算素子とは異なる複数の
    ほぼ近傍ユニットに応答し、前記第2特徴検出層は、前
    記第1特徴検出層よりも少ないユニットを有し、 前記第1特徴検出層の制約特徴マップは、イメージユニ
    ットに応答し、 前記第1特徴検出層の各特徴減少マップは、それの対応
    する制約特徴マップからのユニットに応答し、前記第2
    特徴検出層の前記制約特徴マップは、前記第1特徴検出
    層中の少なくとも1つの特徴減少マップからのユニット
    に応答し、 前記第2特徴検出層の各特徴減少マップは、それの対応
    する制約特徴マップからのユニットに応答し、更に、前
    記第2特徴検出層のすべての特徴減少マップに完全に接
    続され、ネットワークによって認識された文字を表す指
    示を生成する文字分類層を有する ことを特徴とする文字認識用計算ネットワーク。
  2. (2)選択された非線形標準はS字関数を含むことを特
    徴とする請求項1に記載の計算ネットワーク。
  3. (3)前記イメージマップは、元の文字イメージを囲む
    実質的一定の所定の背景を含むことを特徴とする請求項
    2記載の計算ネットワーク。
  4. (4)イメージマップ中に含まれる文字の文字認識用大
    量並列計算ネットワークにおいて、前記ネットワークは
    、前記イメージマップから制約特徴を抽出し、かつ抽出
    された制約特徴をアンダーサンプリングする第1特徴検
    出層手段、 前記第1層手段からアンダーサンプリングされた抽出制
    約特徴からの制約特徴を抽出し、かつ第2層手段の抽出
    された制約特徴をアンダーサンプリングする第2特徴検
    出層手段、 ネットワークによって認識された文字を表す指示を生成
    する前記第2特徴検出層手段に完全に接続された文字分
    類層手段を含むことを特徴とする文字認識用計算ネット
    ワーク。
  5. (5)前記イメージマップは元の文字映像を囲む実質的
    一定の所定の背景を含むことを特徴とする請求項4記載
    の計算ネットワーク。
JP2135546A 1989-11-30 1990-05-28 文字認識用計算ネットワーク Expired - Fee Related JPH0650539B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/444,455 US5067164A (en) 1989-11-30 1989-11-30 Hierarchical constrained automatic learning neural network for character recognition
US444455 1989-11-30

Publications (2)

Publication Number Publication Date
JPH0334082A true JPH0334082A (ja) 1991-02-14
JPH0650539B2 JPH0650539B2 (ja) 1994-06-29

Family

ID=23764959

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2135546A Expired - Fee Related JPH0650539B2 (ja) 1989-11-30 1990-05-28 文字認識用計算ネットワーク

Country Status (3)

Country Link
US (1) US5067164A (ja)
JP (1) JPH0650539B2 (ja)
CA (1) CA2015740C (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100560017B1 (ko) * 2002-11-09 2006-03-15 유경진 일회용 구강 세정기 및 그의 제조방법
JP2009041171A (ja) * 2007-08-09 2009-02-26 Tei Senden リボン織機の送出しローラーユニット伝動装置

Families Citing this family (97)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5588091A (en) * 1989-05-17 1996-12-24 Environmental Research Institute Of Michigan Dynamically stable associative learning neural network system
US5361328A (en) * 1989-09-28 1994-11-01 Ezel, Inc. Data processing system using a neural network
JPH07104952B2 (ja) * 1989-12-28 1995-11-13 シャープ株式会社 パターンマッチング装置
US5271090A (en) * 1990-03-21 1993-12-14 At&T Bell Laboratories Operational speed improvement for neural network
JPH03288285A (ja) * 1990-04-04 1991-12-18 Takayama:Kk データ処理装置の学習方法
KR910020571A (ko) * 1990-05-21 1991-12-20 다카도리 수나오 데이터 처리장치
JP2760145B2 (ja) * 1990-09-26 1998-05-28 三菱電機株式会社 知識情報処理装置
US5263107A (en) * 1991-01-31 1993-11-16 Sharp Kabushiki Kaisha Receptive field neural network with shift-invariant pattern recognition
JPH04315272A (ja) * 1991-04-12 1992-11-06 Eastman Kodak Japan Kk 図形認識装置
EP0514986B1 (fr) * 1991-05-24 1997-12-10 Laboratoires D'electronique Philips S.A.S. Procédé d'apprentissage d'un réseau de neurones et dispositif de classification pour la mise en oeuvre de ce procédé
US5293456A (en) * 1991-06-28 1994-03-08 E. I. Du Pont De Nemours And Company Object recognition system employing a sparse comparison neural network
US5493688A (en) * 1991-07-05 1996-02-20 Booz, Allen & Hamilton, Inc. Pattern categoritzation system having self-organizing analog fields
US5179596A (en) * 1991-07-05 1993-01-12 Booz, Allen & Hamilton, Inc. Analog pattern categorization system having dual weighted connectivity between nodes
DE4138740A1 (de) 1991-11-26 1993-05-27 Schloemann Siemag Ag Verfahren und vorrichtung zum stranggiessen von brammen oder bloecken
US6850252B1 (en) 1999-10-05 2005-02-01 Steven M. Hoffberg Intelligent electronic appliance system and method
US5903454A (en) 1991-12-23 1999-05-11 Hoffberg; Linda Irene Human-factored interface corporating adaptive pattern recognition based controller apparatus
US6400996B1 (en) 1999-02-01 2002-06-04 Steven M. Hoffberg Adaptive pattern recognition based control system and method
US10361802B1 (en) 1999-02-01 2019-07-23 Blanding Hovenweep, Llc Adaptive pattern recognition based control system and method
US6418424B1 (en) 1991-12-23 2002-07-09 Steven M. Hoffberg Ergonomic man-machine interface incorporating adaptive pattern recognition based control system
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
JP2809954B2 (ja) * 1992-03-25 1998-10-15 三菱電機株式会社 画像感知および処理のための装置および方法
EP0566015A3 (en) * 1992-04-14 1994-07-06 Eastman Kodak Co Neural network optical character recognition system and method for classifying characters in amoving web
US5481621A (en) * 1992-05-28 1996-01-02 Matsushita Electric Industrial Co., Ltd. Device and method for recognizing an image based on a feature indicating a relative positional relationship between patterns
DE69333811T2 (de) * 1992-06-19 2006-05-11 United Parcel Service Of America, Inc. Verfahren und Gerät zur Erzeugung und Einstellung eines Neurones
US5438629A (en) * 1992-06-19 1995-08-01 United Parcel Service Of America, Inc. Method and apparatus for input classification using non-spherical neurons
JP2723118B2 (ja) * 1992-08-31 1998-03-09 インターナショナル・ビジネス・マシーンズ・コーポレイション 2次元オブジェクトの認識に用いるためのニューラル・ネットワーク及び光学式文字認識装置
US5377302A (en) * 1992-09-01 1994-12-27 Monowave Corporation L.P. System for recognizing speech
US5319722A (en) * 1992-10-01 1994-06-07 Sony Electronics, Inc. Neural network for character recognition of rotated characters
US5742702A (en) * 1992-10-01 1998-04-21 Sony Corporation Neural network for character recognition and verification
US5337372A (en) * 1992-10-13 1994-08-09 At&T Bell Laboratories Method and apparatus for symbol recognition using multidimensional preprocessing at multiple resolutions
US5647022A (en) * 1992-10-13 1997-07-08 Lucent Technologies Inc. Method and apparatus for symbol recognition using multidimensional preprocessing and symbol sorting
US5625708A (en) * 1992-10-13 1997-04-29 Lucent Technologies, Inc. Method and apparatus for symbol recognition using multidimensional preprocessing
JPH06203005A (ja) * 1992-10-27 1994-07-22 Eastman Kodak Co 高速区分化ニューラルネットワーク及びその構築方法
DE69314293T2 (de) * 1992-12-16 1998-04-02 Koninkl Philips Electronics Nv Neuronalanlage und -Bauverfahren
US5479574A (en) * 1993-04-01 1995-12-26 Nestor, Inc. Method and apparatus for adaptive classification
JPH0744514A (ja) * 1993-07-27 1995-02-14 Matsushita Electric Ind Co Ltd ニューラルネットの学習用データ縮約化方法
US5649068A (en) * 1993-07-27 1997-07-15 Lucent Technologies Inc. Pattern recognition system using support vectors
GB2282906B (en) * 1993-10-13 1996-11-06 Dataquill Ltd Data enty systems
US5473730A (en) * 1993-11-09 1995-12-05 At&T Ipm Corp. High efficiency learning network
US5774586A (en) * 1994-05-04 1998-06-30 Ncr Corporation Method and apparatus for standardization of inputs to word recognition systems
US5572628A (en) * 1994-09-16 1996-11-05 Lucent Technologies Inc. Training system for neural networks
US5802204A (en) * 1995-06-07 1998-09-01 Microchip Technology Incorporated Handwritten character translator using fuzzy logic
US7904187B2 (en) 1999-02-01 2011-03-08 Hoffberg Steven M Internet appliance system and method
US8064886B2 (en) 1999-08-12 2011-11-22 Hewlett-Packard Development Company, L.P. Control mechanisms for mobile devices
US7503016B2 (en) 1999-08-12 2009-03-10 Palm, Inc. Configuration mechanism for organization of addressing elements
US7007239B1 (en) 2000-09-21 2006-02-28 Palm, Inc. Method and apparatus for accessing a contacts database and telephone services
US20060121938A1 (en) 1999-08-12 2006-06-08 Hawkins Jeffrey C Integrated handheld computing and telephony device
US7216177B1 (en) 2000-06-16 2007-05-08 Palm, Inc. Apparatus and method for supplying electronic content to network appliances
US8332553B2 (en) 2000-09-21 2012-12-11 Hewlett-Packard Development Company, L.P. Method and apparatus for accessing a contacts database and telephone services
EP1262907B1 (en) * 2001-05-28 2007-10-03 Honda Research Institute Europe GmbH Pattern recognition with hierarchical networks
US6950988B1 (en) 2001-06-11 2005-09-27 Handspring, Inc. Multi-context iterative directory filter
US7356361B1 (en) 2001-06-11 2008-04-08 Palm, Inc. Hand-held device
US6957397B1 (en) 2001-06-11 2005-10-18 Palm, Inc. Navigating through a menu of a handheld computer using a keyboard
US7395089B1 (en) 2001-06-11 2008-07-01 Palm, Inc Integrated personal digital assistant device
US6975304B1 (en) 2001-06-11 2005-12-13 Handspring, Inc. Interface for processing of an alternate symbol in a computer device
US6976226B1 (en) 2001-07-06 2005-12-13 Palm, Inc. Translating tabular data formatted for one display device to a format for display on other display devices
US7692667B2 (en) 2001-08-17 2010-04-06 Palm, Inc. Handheld computer having moveable segments that are interactive with an integrated display
US7231208B2 (en) * 2001-10-17 2007-06-12 Palm, Inc. User interface-technique for managing an active call
US7192235B2 (en) 2001-11-01 2007-03-20 Palm, Inc. Temporary messaging address system and method
US7665043B2 (en) 2001-12-28 2010-02-16 Palm, Inc. Menu navigation and operation feature for a handheld computer
US7474298B2 (en) 2002-05-31 2009-01-06 Palm, Inc. Mobile device having an adjustable length to selectively expose a surface component
US8374974B2 (en) * 2003-01-06 2013-02-12 Halliburton Energy Services, Inc. Neural network training data selection using memory reduced cluster analysis for field model development
US7164088B1 (en) * 2003-03-16 2007-01-16 Palm, Inc. Method and apparatus to improve tactile feel for keyboards and button assemblies
US7231229B1 (en) 2003-03-16 2007-06-12 Palm, Inc. Communication device interface
US7835504B1 (en) 2003-03-16 2010-11-16 Palm, Inc. Telephone number parsing and linking
JPWO2004084121A1 (ja) * 2003-03-17 2006-06-22 富士通株式会社 車両識別方法及び装置
US7295852B1 (en) 2003-05-01 2007-11-13 Palm, Inc. Automated telephone conferencing method and system
US7865180B2 (en) 2003-06-23 2011-01-04 Palm, Inc. Automated telephone conferencing method and system
US7287015B2 (en) * 2004-09-30 2007-10-23 International Business Machines Corporation Methods and apparatus for transmitting signals through network elements for classification
WO2007095107A2 (en) * 2006-02-10 2007-08-23 Numenta, Inc. Architecture of a hierarchical temporal memory based system
US8065244B2 (en) * 2007-03-14 2011-11-22 Halliburton Energy Services, Inc. Neural-network based surrogate model construction methods and applications thereof
US9031583B2 (en) 2007-04-11 2015-05-12 Qualcomm Incorporated Notification on mobile device based on location of other mobile device
US9140552B2 (en) 2008-07-02 2015-09-22 Qualcomm Incorporated User defined names for displaying monitored location
US20080254811A1 (en) 2007-04-11 2008-10-16 Palm, Inc. System and method for monitoring locations of mobile devices
US8126519B2 (en) 2007-08-31 2012-02-28 Hewlett-Packard Development Company, L.P. Housing for mobile computing device having construction to slide and pivot into multiple positions
US8233948B2 (en) 2007-12-11 2012-07-31 Hewlett-Packard Development Company, L.P. Slider assembly for a housing of a mobile computing device
US8150482B2 (en) 2008-01-08 2012-04-03 Hewlett-Packard Development Company, L.P. Mobile computing device with moveable housing segments
US8611661B2 (en) * 2007-12-26 2013-12-17 Intel Corporation OCR multi-resolution method and apparatus
US8200298B2 (en) 2008-01-08 2012-06-12 Hewlett-Packard Development Company, L.P. Keypad housing configuration for a mobile computing device
US9514388B2 (en) * 2008-08-12 2016-12-06 Halliburton Energy Services, Inc. Systems and methods employing cooperative optimization-based dimensionality reduction
AU2009279644B2 (en) * 2008-08-06 2012-08-23 Halliburton Energy Services, Inc. Systems and methods employing cooperative optimization-based dimensionality reduction
US8218904B2 (en) * 2008-08-27 2012-07-10 Lockheed Martin Corporation Method and system for circular to horizontal transposition of an image
JP2011107648A (ja) * 2009-11-20 2011-06-02 Fujifilm Corp レンズユニット
JP2015529365A (ja) 2012-09-05 2015-10-05 エレメント,インク. カメラ付きデバイスに関連する生体認証のためのシステム及び方法
US9189067B2 (en) 2013-01-12 2015-11-17 Neal Joseph Edelstein Media distribution system
CN106489248A (zh) 2014-05-13 2017-03-08 埃利蒙特公司 用于与移动设备相关的电子钥匙供应和访问管理的系统和方法
US9501740B2 (en) 2014-06-03 2016-11-22 Saudi Arabian Oil Company Predicting well markers from artificial neural-network-predicted lithostratigraphic facies
JP6415607B2 (ja) 2014-06-03 2018-10-31 エレメント,インク. モバイル・デバイスに関連する出退認証および管理
US10192148B1 (en) * 2017-08-22 2019-01-29 Gyrfalcon Technology Inc. Machine learning of written Latin-alphabet based languages via super-character
KR20200073222A (ko) 2017-09-18 2020-06-23 엘리먼트, 인크. 모바일 인증에서 스푸핑을 검출하기 위한 방법, 시스템 및 매체
CA3133229C (en) 2019-03-12 2023-04-04 Element Inc. Detecting spoofing of facial recognition with mobile devices
US11173510B2 (en) * 2019-03-22 2021-11-16 Twenty Twenty Therapeutics Llc Imaging device for identifying a liquid within a dispenser
US11281911B2 (en) 2019-04-27 2022-03-22 Gyrfalcon Technology Inc. 2-D graphical symbols for representing semantic meaning of a video clip
US10713830B1 (en) 2019-05-13 2020-07-14 Gyrfalcon Technology Inc. Artificial intelligence based image caption creation systems and methods thereof
US11526723B2 (en) 2019-07-09 2022-12-13 Gyrfalcon Technology Inc. Apparatus and methods of obtaining multi-scale feature vector using CNN based integrated circuits
US11507248B2 (en) 2019-12-16 2022-11-22 Element Inc. Methods, systems, and media for anti-spoofing using eye-tracking
US11774553B2 (en) * 2020-06-18 2023-10-03 Infineon Technologies Ag Parametric CNN for radar processing

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4774677A (en) * 1981-08-06 1988-09-27 Buckley Bruce S Self-organizing circuits
US4760604A (en) * 1985-02-15 1988-07-26 Nestor, Inc. Parallel, multi-unit, adaptive, nonlinear pattern class separator and identifier
US4897811A (en) * 1988-01-19 1990-01-30 Nestor, Inc. N-dimensional coulomb neural network which provides for cumulative learning of internal representations

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100560017B1 (ko) * 2002-11-09 2006-03-15 유경진 일회용 구강 세정기 및 그의 제조방법
JP2009041171A (ja) * 2007-08-09 2009-02-26 Tei Senden リボン織機の送出しローラーユニット伝動装置

Also Published As

Publication number Publication date
JPH0650539B2 (ja) 1994-06-29
CA2015740A1 (en) 1991-05-31
CA2015740C (en) 1996-01-16
US5067164A (en) 1991-11-19

Similar Documents

Publication Publication Date Title
JPH0334082A (ja) 文字認識用計算ネットワーク
US5058179A (en) Hierarchical constrained automatic learning network for character recognition
Lin et al. IENet: Interacting embranchment one stage anchor free detector for orientation aerial object detection
Le Cun et al. Handwritten digit recognition: Applications of neural net chips and automatic learning
Toivanen New geodosic distance transforms for gray-scale images
KR101298393B1 (ko) 그래픽 처리 유닛 상에서 콘볼루션 신경망을 트레이닝하는방법
US20200285954A1 (en) Memory-based convolutional neural network system
US5511134A (en) Image recognition device and image recognition method
US20200279166A1 (en) Information processing device
US5793932A (en) Image recognition device and an image recognition method
US5271090A (en) Operational speed improvement for neural network
Lin et al. Lateral refinement network for contour detection
CN111899203A (zh) 基于标注图在无监督训练下的真实图像生成方法及存储介质
US11481919B2 (en) Information processing device
US10970201B2 (en) System, method and apparatus for data manipulation
CN115049830A (zh) 一种基于矩阵边缘特征元素的图像缩边模型、方法及装置
Mujtaba et al. Automatic solar panel detection from high-resolution orthoimagery using deep learning segmentation networks
Kussul et al. LIRA neural classifier for handwritten digit recognition and visual controlled microassembly
US5737444A (en) Binary digital image feature extracting process
Bodani et al. OrthoSeg: a deep multimodal convolutional neural network for semantic segmentation of orthoimagery
JPH0367381A (ja) 文字認識装置
CN114254618B (zh) 基于动态路由注意力机制的视觉问答方法、存储介质及设备
CN117315753A (zh) 基于注意力和相对距离对齐的低分辨率人脸表情识别方法
Ma et al. Heterogeneous Image Change Detection based on Dual Image Translation and Dual Contrastive Learning
Hemminger et al. Using a Hopfield network for rotation and scale independent pattern recognition

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees