JPH0644410A - 移動するウエブにおける文字を分離するための神経ネットワーク光学式の文字認識装置及び方法 - Google Patents

移動するウエブにおける文字を分離するための神経ネットワーク光学式の文字認識装置及び方法

Info

Publication number
JPH0644410A
JPH0644410A JP5087326A JP8732693A JPH0644410A JP H0644410 A JPH0644410 A JP H0644410A JP 5087326 A JP5087326 A JP 5087326A JP 8732693 A JP8732693 A JP 8732693A JP H0644410 A JPH0644410 A JP H0644410A
Authority
JP
Japan
Prior art keywords
neural network
character
web
processing
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5087326A
Other languages
English (en)
Inventor
Kenneth H Loewenthal
ケネス・エイチ・ローエンサール
Steven M Bryant
スティーヴン・エム・ブライアント
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eastman Kodak Co
Original Assignee
Eastman Kodak Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Eastman Kodak Co filed Critical Eastman Kodak Co
Publication of JPH0644410A publication Critical patent/JPH0644410A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1434Special illumination such as grating, reflections or deflections, e.g. for characters with relief
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/192Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
    • G06V30/194References adjustable by an adaptive method, e.g. learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 移動するウエブ上の文字を識別するための神
経ネットワーク準拠形光学式文字認識技法を提供する。 【構成】 画像獲得装置(38)は、移動ウエブ(1
0)上に印刷された文字が画像化されるように移動ウエ
ブが通過する画像化窓を規定している。分類データは画
像化窓を通過する各印刷ウエブ文字について抽出されて
累積される。光源(50)は画像化されているときのウ
エブの透過照明を与える。累積分類データを処理して各
対応する画像化文字を表示する印刷文字分類情報を生成
するために画像獲得装置に神経ネットワーク加速器(7
0,128)が結合される。分類情報を適当なASCC
II文字コードに変換するために加速器に処理装置(1
30)が結合される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は一般に光学式文字認識
の分野に、且つ特に、神経ネットワークアルゴリズムを
使用して半透明又は透明材料の移動ウエブ上の縁部標識
付き文字を認識する光学式の文字認識装置及び方法に関
係している。
【0002】
【従来の技術及び発明が解決しようとする課題】縁部標
識付け(エッジマーキング)は、フィルムベース又はウ
エブの長手方向縁部に識別番号の形式で人間にも機械に
も読取り可能な文字を印刷することを含んでいる。ウエ
ブは非写真又は写真材料、例えばアセテート又はEst
ar(登録商標)フィルムベース、でよい。一つの典型
的な実施は、整合標識からなる一連の文字で構成された
縁部標識を増分的ロール番号及びフィート数数字と共に
レーザプリントすることである。例えば、写真フィルム
産業においては、製造工程中に半透明フィルムベースの
一方の縁部に種々の事前規定の長さで縁部標識が印刷さ
れることがある。縁部標識はフィルム製造産業において
は製造工程の種々の段階中におけるロール同一性及び欠
陥場所の確認を可能にする「内蔵の」ロール識別を与え
るために使用される。縁部標識は、大抵の場合フィルム
ベースの縁部に沿って配置された突起模様上に部分的に
又は完全に重ね合わされることができる。種々の縁部標
識付けシステムが例として米国特許番号485469
6,4865872,4508438,4519701
及び4548492に記述されている。
【0003】通常の書類処理システムは白色背景上の黒
色印刷情報を光学的に読み取るように設計されている。
又、異なった印刷字体を区別するために及び特定の個々
の文字を識別するために既知の技術においては多くの光
学的文字認識(OCR)技法が利用されている。(ここ
で使用されたように「文字」の語は数字及び英数字文字
並びにバーコードデータ又は他の類似の指標を含むべき
である。文字は、一般に連続プリントと呼ばれる連続形
式で、又はドット(点)の行及び列が文字を規定するド
ットマトリックス印刷形式で印刷されることができる。
【0004】文字認識は文字と関連した多くのパラメー
タを関係させるので、文字が連続しているか又はドット
マトリックス印刷により表現されているかは文字を認識
する際の重要な情報部分である。種々の特徴認識アルゴ
リズムが連続形文字の光学式文字認識のために利用可能
である。加えて、テンプレート認識のための種々のマス
クがしばしばドットマトリックス印刷を認識するために
利用される。一般に、ドットマトリックス印刷の認識は
文字の破断した性質のために連続形文字の認識よりも困
難である。
【0005】ドットマトリックス文字を認識する際の別
の複雑性は多くの場合、文字が印刷されているウエブの
材料から生じる。既に述べたように、写真材料産業にお
いては、例えば、ドットマトリックス文字はEstar
及び/又はアセテートフィルムウエブに施されることが
ある。それゆえ、結果として生じる文字は(連結形であ
ればドットマトリックス形であれ)一般に、白色紙上の
黒色文字と同じ品質のものではない。せいぜい、白色紙
上の黒色文字のための最高技術水準の光学式文字認識
(OCR)技法は、Estar及びアセテートフィルム
ウエブにおいて見つけられるような良くない品質の背景
材料上の連続形文字を読み取るために使用されたときに
はわずかに機能する。更に、利用可能な技法を用いる半
透明のEstar及びアセテートウエブ上の高度に異常
なレーザ印刷ドットマトリックス文字の光学式文字認識
は実際上全く動作不可能である。ドットマトリックス印
刷は、多くの場所で不連続である(且つことによると透
明又は半透明の形式で施されることさえもある)ので、
白色紙上の標準的黒色文字よりもかなり大きい認識問題
を提供する。付加的な問題は明らかに、例えば、ウエブ
の縁部におけるぎざぎざに起因する、文字が印刷されて
いる材料の「雑音の多い」性質に関係していることがあ
る。
【0006】今日市場へ出ているOCR装置は一般に、
半透明の、雑音の多い背景材料上のドットマトリックス
形印刷(又は連続形印刷でさえも)については十分に機
能しないので、そのような文字の認識に対する新しい人
工的神経ネットワーク・アプローチがここで提案されて
いる。神経ネットワークは、OCR、パターン認識、機
械学習、プロセス制御及び音声認識に限定はされない
が、これらを与えるように特定の方法で相互接続された
大規模に並列のニューロン形素子である。人工的神経ネ
ットワークシステムにおける最も普通の構造は非線形処
理素子のネットワークであって、この場合「ノード(接
続点)」は情報チャネル又は「重み」により複数の入力
に相互接続されている。各ノードは多数の入力及び重み
を処理することができ且つそれぞれ一つの出力信号を持
っている。ネットワークは多くの場合多数の層を持つこ
とができ、この場合最初の層に続く層は前の層の出力か
ら入力を受ける。ネットワークにおける最後の層は一般
に出力刺激を与える。
【0007】神経ネットワークは非常に基本的なレベル
において、生物学的神経系を模擬することができる。生
物学的神経系の利点の多くは、広い許容範囲及び環境を
一般化し、適応させて処理し、大規模並列形式で動作し
て実効上実時間レートで機能する能力、障害耐性、又は
ネットワーク自体の内部の誤りを処理する能力、前例に
より学習する能力、を含んでいる。神経ネットワークは
有効な結果が得られるようになる前に訓練を必要とす
る。しかしながら、多くの応用においては、ネットワー
クの一度のバッチの後方伝達訓練で十分である。訓練さ
れると、結果として生じる「重み」は記憶されて、後程
の使用のために非訓練試験モード又は「前方モード」動
作で検索される。
【0008】ここに開示されているのは、移動する雑音
の多いウエブ背景(例えばEstar及びアセテートウ
エブ)上の連続形又はドットマトリックス形の文字を実
時間で認識するための神経ネットワーク準拠形光学式文
字認識技法である。
【0009】
【課題を解決するための手法】簡単に記述すると、この
発明は一態様において、移動する材料のウエブ上に配置
された文字を抽出して分類するための新規な神経ネット
ワーク光学式の文字認識装置を含んでいる。この文字認
識装置には移動する材料のウエブが通過させられる画像
化窓を規定する画像獲得装置がある。この画像獲得装置
は画像化窓を通過している各印刷ウエブ文字について画
像データを抽出して蓄積する。ウエブが規定の画像化窓
を通過するときにウエブを照明するために光源が準備さ
れている。画像化窓を通過する各ウエブ文字についての
蓄積画像データを処理するために画像獲得装置に神経ネ
ットワーク加速器板が結合されている。この処理は事前
定義の神経ネットワークアルゴリズムに従って行われ
る。ネットワーク加速器は画像データから印刷文字分類
情報を生成する。神経ネットワーク加速器に結合された
分類装置は次に、神経ネットワーク加速器により生成さ
れた対応する印刷文字分類情報を用いて各印刷ウエブ文
字を明確に分類する。
【0010】望ましくは、認識装置内に使用される神経
ネットワーク加速器は事前定義の多層神経ネットワーク
後方伝搬形アルゴリズムを実現する新規な神経ネットワ
ーク加速器板を含んでいる。この板は第1部分及び第2
部分に分割された記憶装置を含んでいて、入力データは
最初それの第1部分に保持されている。複数の並列接続
処理ノードがそれに結合されていて、各ノードは記憶装
置の両方の部分へのアクセスを備えている。各処理ノー
ドは又、二重ポート式記憶装置の第1部分か又は第2部
分にそれの出力データを送るように接続されている。多
層後方伝搬形神経ネットワークの第1層においては、複
数の並列接続処理ノードからの出力データは二重ポート
式記憶装置の第2部分へ記憶される。第1層処理の後、
スイッチング装置が活動化されて第2記憶装置部分を複
数の並列接続処理ノードのそれぞれの入力に結合するの
で、そこに記憶されたデータは次にネットワークアルゴ
リズムに従って第2層処理のために使用されることがで
きる。第2層においては、処理ノードからの出力データ
は二重ポート式記憶装置の第1部分へオーバライトされ
る、データの記憶及び検索は、多層神経ネットワークア
ルゴリズムが処理されてしまうまで記憶装置の第1部分
と第2部分との間で交番するように接続される。認識装
置に対する更なる特定の改良も又この明細書において記
述され且つ請求されている。
【0011】別の態様においては、神経ネットワークを
用いて移動する材料のウエブ上に配置された文字を抽出
して分類するための方法が提供されている。この方法
は、移動するウエブを事前規定の画像化窓を通過させて
これと同時に窓内のウエブを照明すること、ウエブが画
像化窓を通過するときにこの窓内のウエブの画像を獲得
すること、画像化窓に配置された任意の文字についての
画像データを抽出して蓄積すること、及び事前規定の神
経ネットワークを用いて蓄積画像データを処理し且つこ
れから文字分類情報を生成すること、を含んでいる。望
ましくは、この分類情報は次に、記憶、外部システムへ
の伝送、及び/又は表示のためにASCII符号に変換
される。認識装置についてと同様に、特定の改良式プロ
セス段階も又この明細書において記述され且つ請求され
ている。
【0012】要約すると、神経ネットワークを使用して
移動する材料のウエブ上の縁部標識形文字を認識する新
規な文字認識装置及び方法が述べられている。述べられ
た技法は移動する透明又は半透明材料、例えばEsta
r又はアセテート材料のウエブ上の高度に変形したドッ
トマトリックス数字文字を識別することができる。更
に、任意のソフトウエア準拠式文字認識実施法に比べて
改善された性能を明らかに提供することの外に、任意の
これまでの知られた加速器板に比べてかなり改善された
性能が可能である新規な神経ネットワーク加速器板が提
供されている。提供されているのは、移動するウエブ上
の縁部標識付き文字の認識に対する実用的神経ネットワ
ーク応用である。この技法を用いると、文字が肉眼では
認識不可能であるような良くない品質のものであるかも
しれないにもかかわらず文字を適当に認識することがで
きる。説明された文字認識装置及び方法は生成データに
ついて実時間で動作する。この技法は神経ネットワーク
に基づいているので、この認識装置/方法は、一般化を
行うこと、環境における広い寛容度に適応し且つ処理す
ること、大規模並列形式で動作して実時間レートで実効
上動作すること、障害耐性、又はネットワーク自体の外
部の誤りを処理する能力を与えること、及び例によって
学習すること、ができる。
【0013】
【実施例】今度は諸図面に言及が行われるが、この諸図
面においては同様又は類似の構成部分を示すために種々
の図面を通して同じ参照数字が使用されている。
【0014】総括的に10で示された、移動する材料の
ウエブの一つの部分的実施例が図1に描かれている。上
述のように、ウエブ10は任意の連続的に移動する、非
写真材料(例えば紙)又は写真材料、例えばアセテート
若しくはEstarフィルムベース、のウエブからなる
ことができる。ウエブが写真材料からなっている場合に
は、市松模様の浮出しパターン又は突起模様12が一般
的にウエブ10の縁部14に沿って使用されている。
(典型的には、写真材料では、乳剤被膜がウエブの各長
手方向縁部から事前規定の距離内には現れないので、ウ
エブはその縁部の近くでは半透明である。突起模様12
はこの区域内に生じるものと仮定されている。) ウエブ速度は特定の範囲(例えば、静止から1000f
t./Min.まで)内で変化するものと仮定されてい
て、進行は右から左である。長手方向の縁部標識16は
突起模様12の一つの部分に部分的に重なり合って示さ
れており、従って重なり合った文字の人間による認識及
び機械による認識は困難である。ちり、表面の非一様
性、及び複屈折は半透明背景材料の品質を更に劣化させ
るように機能する。図示の例においては、縁部標識16
は、機械番号、増分式ロール番号及び/又はフィート数
数字情報からなっているような複数の数字文字20が後
続している特定の整合標識18を含んでいる。
【0015】縁部標識16のような縁部標識付けは典型
的にはウエブ10の縁部に沿って等間隔に印刷されてい
る。縁部標識の「分類」の適当な識別は製品管理ループ
又はプロセス制御ループにおけるフィードバックとして
使用されることができる。例えば、縁部標識は製造工程
の任意の段階中における欠陥場所と共に、ロール特定の
直接の確認を可能にする。一採択形式の縁部標識付けに
おいては、標識16はドットマトリックス式文字の小長
円ピットのCO2 レーザ印刷系列からなっているが、連
続的に移動するウエブの事前選択場所に指標を集束させ
るために種々の形式の別の機器が利用可能である。ここ
で与えられる説明は良くない品質の印刷を仮定してお
り、これは文字が施されている雑音の多い背景材料に部
分的に又は完全に起因することがあり、従って、全部で
はないとしても大抵の現存する文字認識機器は不満足な
結果を生じる。ここに説明される例においては、移動す
るEstarウエブ上の高度に変形したドットマトリッ
クス文字が配置されていて分類されることになっている
ものと仮定されている。そのような場合には、文字は典
型的には半透明であり、フィルムベースは透明又は半透
明であるので、肉眼では特定の文字分類を識別すること
ができない。しかしながら、文字を分類するためにこの
発明に従って構成された神経ネットワークシステムによ
って使用され得る関連の分類情報がなおそれに存在す
る。
【0016】文字は「0,1,2,3,4,5,6,
7,8,9」のようなある種の数字分類内に入るように
定義されている。ドットマトリックス数字文字像16は
ウエブ10の縁部14に非常に接近して印刷されること
ができる。文字メッセージ書式は固定されていてウエブ
の縁部に沿って実質上一定に隔置されているものと仮定
されている。文字間の一定の長さ及び文字の一定の大き
さは既知であると仮定されている。更に、文字は大き
さ、形状及び書式が実質上一定にとどまっていて決して
重なり合わない。しかしながら、メッセージ間の距離は
メッセージごとに変わることがある。
【0017】図2に言及すると、総括的に30で示され
た、この発明による神経ネットワーク準拠形光学式の文
字認識装置の一実施例が示されている。やはり、文字認
識装置30は、それ自体透明又は半透明であるような材
料10の、移動する連続ウエブにおける、半透明である
ようなドットマトリックス数字文字像を走査するように
設計されている。提供された文字認識装置は、他の場合
には人間の目には認識不可能であるかもしれない特定の
文字を抽出して分類することができる。文字認定装置3
0はコンピュータ32を含んでおり、これは下で説明さ
れるように、この発明による神経ネットワークを実現す
る。コンピュータ32は標準入力インターフェース装
置、例えばキーボード34又はタッチスクリーン、並び
に出力インタフェース装置、例えばビデオ表示装置36
及び/又は直列ポート31、を備えていればよい。文字
認識装置30は又カメラ38を備えており、これは望ま
しくは、ウエブ上の縁部標識16を画像化するためにウ
エブ10の縁部14の上方に適当に配置されたCCD線
装置カメラからなっている。透過照明源(図示されてい
ない)が移動ウエブの下に配置されており、且つ符号器
40も又準備されている。カメラ38、照明源、及び符
号器40はそれぞれ適当な線接続部37、39、41に
よってコンピュータ32に結合されている。
【0018】文字認識装置30に対する種々のハードウ
エア成分のあるものが図3に幾分詳細に描かれている。
移動する連続ウエブ10を透過照明するために赤外線照
明源50が示されている。ウエブ照明は線走査カメラ3
8の画像化窓として規定された画像化窓内で行われる。
ウエブ移送装置はカメラ38の画像化窓に直角にウエブ
10を移動させるためにローラ52を含んでいる。カメ
ラ38には縁部標識を画像化するためにウエブ10の適
当な縁部に沿ってトラッキング装置(図示されていな
い)が配置されている。ウエブは移送装置におけるサー
ボモータ(図示されていない)を用いて未知の変化する
速度で推進される。ウエブは270°光学式軸符号器ロ
ーラ54を含む数個のローラの周りに巻きついている。
このローラの軸56は回転式光学軸符号器(図示されて
いない)に取り付けられている。光学式軸符号器は1回
転当り20000パルスの分解能を持つことができ、ウ
エブ10の運動又は移動を監視するためにこの発明に従
って使用される。
【0019】又図3に示されているように、文字認識装
置30はCCDカメラ38の観察レンズ60に近接して
配置された(IR光だけを通過させることのできる)白
色光フィルタ58を備えている。フィルタ58のすぐ下
には空間スリップフィルタ(図示されていない)が取り
付けられることが望ましい。コンピュータ62は、CP
U62及びPCデータ/制御母線63のような標準的計
算用構成部分の外に、この発明に従って、フレームグラ
ッバ板64(これは線接続部37によってカメラ38に
結合されている)、前処理板68、神経ネットワーク加
速器板70、符号器板72、及び直列通信板74を備え
ている。板64、68、70、72及び74はそれぞれ
下で詳細に説明される。
【0020】光学式軸符号器は相互接続ケーブル41に
よって符号器板72に結合されている。ウエブ10が移
動するにつれて光学式軸符号器から符号器パルスで発生
され、これは線41により符号器板71にインタフェー
ス接続される。板72はこれらのパルスを係数し、n
(ここでnはパルス計数の事前プログラムされた数であ
る)のパルス計数が(例えば、値nを事前記憶した計数
器を減分することによって)達成されると、符号器板は
フレームグラッバ板64(すなわち、線走査処理板)に
トリガパルスを放出する。ウエブが支援するべきである
ならば、板72はウエブが後程前方へ移動するときに次
の文字場所を正しく識別するために逆方向にパルスの数
を計数してこれらを減分されるべき計数器に加算するよ
うにプログラムされる。トリガパルスは外部トリガ入力
67において受信される。板64はそこでカメラ38を
トリガして、所定数の画素(例えば、32画素)からな
る移動ウエブのグレースケール線画像を捕獲してこれを
外部母線37により板64に伝送する。結果として生じ
る画像はRAM65に保持されて、専用の外部母線69
により前処理板68に転送され、そしてここで線走査画
像の各画像の各画素はしきい値設定されて1ビット値に
変換される。
【0021】図4は前処理板68の実施例を更に詳細に
示している。
【0022】図示されたように、しきい値設定を受けた
後、画像化画素値は64ビット先入れ先出し(FIF
O)バッファ80へ押し込まれる。バッファ80は二つ
の32ビット列を備えており、各列は二つの隣接した捕
獲線走査式画像の一つを受ける。一たん二つの線画像が
捕獲されると、FIFOにおけるデータは16の並列接
続4入力ORゲート82を用いて同時に処理される。こ
の方法で、走査情報は一つの新規な段階で拡大され且つ
又圧縮される。ORゲート82からの結果として生じる
16ビットのデータは16語の深さの記憶配列84によ
って16ビット幅へパイプラインされる。
【0023】記憶配列84は、パイプライン式RAMと
も呼ばれる、移動窓画像バッファのように機能する。配
列の内容がコンピュータスクリーンに表示されるとした
ならば、ウエブがカメラの下を移動するときにウエブの
16列幅の複製物が移動することになるであろう。画像
前処理板における付加的な回路構成はその場合完全な1
6×16の配列をとり、各ビットをこれの規準化16ビ
ット、2の補数同値数へ変換する。例えば、ビットが1
であるならば、それは1024として取り扱われ、従っ
てそれの規準化16ビット整数2の関数は0000 0
100 0000 0000である。別の場合として、
ビットが0であるならば、それは負の1024として取
り扱われ、それの規準化2の補数は1111 1100
0000、0000である。変換が完成されると、各
結果は専用母線86か又は主pc母線63により神経ネ
ットワーク加速器板70(図3)に送られる。
【0024】図5はこの発明による神経ネットワーク加
速器板70の一実施例を示している。画像前処理板(図
3)からの各規準化2の補数は最初に連続的順序で二重
ポート入力RAM90の第1部分に記憶される。(第1
RAM部分は図5の低バンクRAM部分からなってい
る。)情報は、専用のデータ入力線86か又はPC母線
−データ入力/出力63から信号を受けるように結合さ
れたMUX92を介してRAM90に転送される。画像
データの全256ビット(すなわち、16×16配列)
を受けると、トリガ信号が画像前処理板68から神経ネ
ットワーク加速器板70に送られて入力データ画像が処
理され且つ分類される。下で詳細に説明されるように、
神経ネットワーク加速器板70は次に一連の計算を行
い、この計算はこの発明の数字文字実施例に従って、各
数字0〜9について一つずつの、10の16ビット出力
値を生じる結果になる。これらの出力値は記憶装置90
における二つのRAM場所の一つに記憶されて、ネット
ワークの出力と呼ばれる。ネットワーク出力結果はCP
U62(図3)によって読み取られ、対応するASCI
I符号に合わせて復号化されることが望ましい。表1は
一つの可能な復号化形態を記載している。代わりの復号
化形態はしきい値付き「勝者全量取得方式(winne
r take all approach)」であろ
う。このような復号化形態においては、最高の出力値は
残りの出力値の大多数がHi−Threshold(高
しきい値)より下にあるという条件で文字を識別する。
すべての出力がHi−Threshより小さければ、文
字は識別されたとは考えられない。
【0025】
【表1】 ここで、Hi−Thresh及びLo−Threshは
経験的に事前決定される。
【0026】文字が見つけられないと仮定して、文字認
識装置はウエブから付加的な線画像を捕獲し、この画像
を処理して各画像窓を神経ネットワーク加速器板に転送
し、この板をトリガし、そしてこの板への出力を復号化
することへと移行して、ついには特別のメッセージ整合
文字18(図1)が見つけられる。一たん文字18が見
つけられると、事前規定の文字フィールドメッセージに
おける各文字画像の場所が知られる。(ウエブにおける
各文字は高い精度で機械印刷されることが望ましいの
で、文字間の間隔は既知で固定されていると仮定されて
いる。)この情報は縁部標識における各文字が存在する
はずである整合文字から線走査列の数を決定するために
使用されることができる。
【0027】特別の整合文字の分類後、ソフトウェアを
用いて特別の復号化「ホールドオフ」変数及び特別の
「メッセージ長ホールドオフ」変数を設定することがで
きる。「ホールドオフ」変数はメッセージにおける最初
の数字の開始までの列の数を含んでおり、又「メッセー
ジ長ホールドオフ」変数はメッセージ内の文字認識装置
の現在の場所を識別する。カメラシステムが新しい線に
おいて読取りを行い、この線を事前処理板及び神経ネッ
トワーク加速器板により処理するたびごとに、ホールド
オフ変数は減分される。変数が0に達すると、文字画像
が画像化窓内で中心に配置されるはずであり、神経ネッ
トワークRAM90(図5)の出力層における対応する
情報は縁部標識における現在の文字を表現している。こ
の時点で、ソフトウエアは神経ネットワーク入力RAM
を検査して文字がほとんど又は完全に存在しているのか
どうかを決定することとが望ましい。文字が存在するな
らば、技術に通じた者は、方形畳込みを用いて小さい窓
ディザリング調整を行って窓内の文字の正確な場所を決
定することができ、且つ小調整も又必要に応じて行うこ
とができることを認めるであろう。
【0028】例として、図6(a)〜6(c)はカメラ
規定の画像化窓100への縁部標識付き文字104の右
から左への移動を描いている。ウエブ104はウエブの
縁部102を含んでおり、これは図6(a)、6(b)
及び6(c)のウエブ進行中ほぼ一定の位置にとどまる
ように示されている。上述のような光学式符号器(図
3)の使用は、文字104が観察窓100内にあるとき
にデータが処理されることを保証し、これによって文字
を首尾よく抽出して分類する機械を最大化する。神経ネ
ットワークは又画像化窓100内のウエブ進み方を認識
するように訓練されることが望ましい。このことに関し
て、図7(a)はウエブの画像化窓通過のための好適な
場所を描いている。図7(b)及び図7(c)は画像化
窓内の移動ウエブの、それぞれ下方進行及び上方進行を
描いている。望ましくは、神経ネットワークは主題の文
字を画像化窓内のそれの位置に無関係に認識するように
訓練される。ウエブは移動しているので、それの縁部1
02は画像化窓内で上又は下に移動することがある。
(ネットワークはより大きい画像化窓内のどこでも文字
を認識するように事前訓練されている。注意されるべき
ことであるが、印刷文字はウエブ場所に関して移動する
ことがある。) 一たん妥当な数字文字が復号化され(そして、例えば、
その結果が文字認識装置30(図3)に結合されたI/
O装置、例えば直列ポート及び/又はビデオ(すなわ
ち、直列通信ボード74を経由して)、並列ポート又は
ディスク駆動機構)に送られると、ホールドオフ変数
は、縁部標識における次の文字までの既知の列の数にリ
セットされる。文字が復号化されない場合には、ホール
ドオフ変数は零にセットされ且つ文字認識装置は次の特
別のメッセージ整合文字18(図1)を捜索し始める。
この処理ループは文字認識装置がソフトウエアインタフ
ェースを経由してコンピュータ操作員により終了するよ
うに命令されるまで継続する。図5に戻って、技術的知
識のある人は気が付くことであろうが、与えられた神経
ネットワーク加速器板は多数の処理ノードに分割されて
いる。ノード分割が利用されているので、幾つかの処理
装置は同時に個別のノード計算について動作することが
できる。すべての処理装置(すなわち、乗算/累算器)
がそのそれぞれのノード計算を完了すると、その結果は
シグモイド(Sigmoid)LUT(探索表)へ送ら
れ、そしてデータはこれから二重ポート入力/出力記憶
装置RAM90の一方の側に再び書き込まれて、多層後
方伝搬形神経ネットワークアルゴリズムの第1層につい
てのすべてのノード計算が完了するまで記憶される。第
1層ノードが計算されると、それらの記憶された値は次
に第2層のノード計算のための入力として使用される。
第2層ノード計算の結果は二重ポート式入力RAM90
の高/低記憶領域の他方に記憶される。この交番式プロ
セスは神経ネットワーク「出力層」に到達するまで続行
される。すべての演算は16ビット整数2の補数形式で
実施されることができる。整数計算を利用すると、安価
な高速乗算器及び累算器をノード処理装置として使用す
ることが可能である。前方モードにおいて神経ネットワ
ークのソフトウエアシミュレーション中浮動点計算を用
いても改善は見られず、又訓練モードにおいてさえもあ
る研究者たちは4ビットのような少ないビットでの整数
計算だけを用いて好結果の訓練を報告していることに注
目することが重要である。
【0029】この特定の設計においては、16の並列処
理装置が実現されていて、各処理装置は一度に一つのノ
ードを計算する。(「出力層」ネットワーク処理のため
には16のノードのうちの10だけが必要であるが、こ
れはここで論述されている実施例においては特別の整合
文字の外には数字文字(0〜9)だけが縁部標識に存在
するものと仮定されているからである。)各並列処理ノ
ードは各クロックサイクルにおいてそれぞれの累算器に
対して一つの入力重み乗算及び加算を行う。典型的なク
ロックサイクルは40MHzであろう。図示された特定
の設計は完全接続式計算(に限定されてはいないが)の
ための能力を備えており、これは層n+1における各ノ
ードが重みを介して層nにおけることごとくのノードに
接続されているということである。そのような実施例に
おいては、前方モード計算速度は6.4億相互接続/秒
の程度になるように決定されている。
【0030】加速器板はネットワークにおけるアドレス
・制御論理回路98の制御レジスタ99を適当にロード
することによって制御される。一つの制御レジスタはネ
ットワークにおける層の番号「層レジスタの番号」を保
持する。現在、ネットワーク層の番号は4まで(及びあ
る制限付きで8まで)行くことができる。各層につい
て、I/O場所はその層についての入力の番号を保持
し、且つ別値のI/O場所はノードの番号、i=1・・
・4における、「入力層iの番号」、「ノード層iの番
号」を保持する。これは板に対するネットワークの構造
を定義するのに必要な情報の大部分である。
【0031】各処理装置は、後方伝搬アルゴリズムのそ
れぞれの層に対する所定の重み値、すなわち重みRAM
1、重みRAM2、・・・・重みRAM16、を記憶す
るためにそれと関連した記憶装置95を持っている。慣
例上、処理ノードは乗算器・累算器1、乗算器・累算器
2・・・・乗算器・累算器16として標識付けされてい
る。最初の16ノードが処理された後、処理ノードは次
の神経ネットワークの主部層のノード17ないし32に
ついて動作する。このプロセスは所与の層におけるすべ
てのノードが処理されるまで繰り返される。すなわち、
処理装置番号1はノード1,17,33などについて動
作し、又処理装置番号2はノード2,18,34につい
て動作する。処理されるべき層が16未満の処理ノード
を含んでいるか又は16未満のノードが処理されるため
に残っている場合には、不必要な処理装置94の結果は
単に無視される。図8は処理ノード1についての重み値
記憶のための一実施例を示している。重み記憶装置は低
いアドレスから高いアドレスまで重み、ノード及び層の
順序でロードされる。並列に動作するネットワークにお
いては16の処理ノードがあるのでノード順序は16だ
け飛び越すことに注意せよ。
【0032】入力をロードするには二つの方法がある。
文字認識のための入力をロードする主要な方法は、前処
理装置及びネットワーク板にインタフェース接続をする
ように設計された専用の並列入力ポート86を通してで
ある。このインタフェースは、前処理装置板が書込みパ
ルスと共に16ビットデータ及び12ビットアドレスを
供給するポートを備えている。書込みハンドシェーキン
グなしで非同期的に行われる。特定の例として、前処理
装置板からの入力書込みは20MHzで動作することが
できる。神経ネットワーク加速器のマルチプレクサ92
は又主PC母線63による入力RAMのローディングを
可能にする。入力RAMがロードされると、加速器板は
ソフトウエア開始指令又はハードウエアパルスによって
トリガされる。
【0033】神経ネットワーク加速器板は加え合わされ
た16ビット整数入力を非線形的に変換する処理ユニッ
トで構成されている。一つのユニットを別のユニットに
連結する連結強度すなわち重みは、第1ユニットの第2
ユニットの出力に及ぼす刺激的又は抑制的影響を表して
いる。正又は負の16ビット整数であることができる。
各ユニットは又加合せ入力から減算されるしきい値を持
っている。このしきい値は1024の固定値を持ってい
るユニットからの重みとして実現され、従って同じ表記
及び学習アルゴリズムが又重みはもとよりしきい値にも
適用され得る。i番目のユニットの出力はそれの入力の
すべてをまず加え合わせ、
【0034】
【式1】 但し、wijはj番目からi番目までのユニットの重み
である、そして次にシグモイド変換を適用する、すなわ
ち Pi=P(Ei)=tanh(Ei) 但し、tanh(Ei)は15ビット・シグモイド接続
探索表RAMにおいて実現される、ことによって決定さ
れる。
【0035】使用された神経ネットワーク加速器板は多
数の層のノードに階層的に配列されていて情報はネット
ワークを下部から上部へ流れる。
【0036】処理装置Σwij ☆Ij の計算で終わった
後、この和は探索表96RAMに送られてシグモイド関
数、例えはtanh関数を計算する。(ジグモイド関数
探索表96はノード出力について動作するように望まれ
た任意の伝達関数で事前プログラムされることができ
る。)tanh探索表の出力結果は現在の層の計算のた
めに使用されていない二重ポート入力RAMの交互の部
分に記憶される。例えば、初期入力が入力RAM90の
低バンク90bへロードされたときには、第1の組のノ
ード計算が完了すると出力はRAM90の高バンクRA
M90aの開始アドレスで記憶される。第1層ノード計
算全体が完了すると、入力は高RAM区域にシフトし
(トグルし)、第2層についての完了ノードは再び低バ
ンク90bRAMに書き込まれる。この交番プロセスは
すべての最終層計算が完了するまで継続する。明らか
に、奇数の層又は偶数の層のどちらが存在するかが、最
終結果が入力RAMの高又は低バンクのどちらに配置さ
れるかを決定する。又、この機能は入力RAM空間が記
憶されるべき最大数の単一層入力の大きさの少なくとも
2倍であることを必要とすることに注意せよ。多くの場
合に、ネットワークの入力層は神経ネットワークにおけ
る最大層であることがわかる。
【0037】多数の方法のいずれか一つを用いる、ネッ
トワークがその計算を完了したかどうかを決定すること
ができる。第1の、最も簡単な方法は加速器板に対する
最大時間より長い遅延を挿入してネットワークを計算し
て次に出力を読み取ることである。第2の方法は規定の
ネットワーク完了ビットについてネットワーク状態ポー
トを監視することであり、このビットは板がその計算を
完了するとセットされるであろう。なお別の代替例とし
て、板における割込み要求線を使用して割込み駆動形ソ
フトウエアルーチンを生成し、加速器板の出力を読み取
ることができる。
【0038】システムの動作を要約すると、すべての周
辺板がオペレーティングシステムソフトウエアによって
初期設定された後、走査が非周期的に始まる。ソフトウ
エア制御式システムは、抽出されて特徴化されるべき縁
部標識を有する移動する材料のウエブの縁部の上方に適
当に配置された高速度線走査カメラで構成されている。
材料が感光性である場合には、透過赤外照明がカメラ入
力側の適当な白色光フィルタと共に利用される。カメラ
及び赤外線光学系は周期的間隔でウエブを観察してウエ
ブ上の数字文字の画像をディジタル的に捕獲する。これ
らの画像はフレームグラッバ板におけるRAMに一度に
1線走査ずつ記憶される。捕獲又は走査のレート及びタ
イミングは光学式軸符号器及び対応する符号器板によっ
て制御される。光学式軸符号器はウエブ移送システムに
おけるローラに取り付けられている。
【0039】高電力形赤外線照明ユニットがEstar
ウエブを照明するために使用されている。しかしなが
ら、高電力形IR LEDは安定な空間的及び時間的方
法で多量の赤外線光子を供給する能力において周知のよ
うに不安定である。これは大部分電流がIR LEDを
通過するときのこれにおける温度変化に起因している。
室温の環境において所要の電力レベルで冷却されないま
まであるならばLEDは容易に120°Fに達する。こ
の時間的に変化する光強度は線走査カメラにより捕獲さ
れた画像を明るさ及びコントラストにおいて激烈に変化
させる。大抵の場合画像はIR LEDが十分高い明る
さを達成したならば単に洗い流される。その結果とし
て、IR LEDの輝度変動を制御するために装置が開
発された。これらの装置はLEDを通る一定電流を維持
すること及びLEDのための一定設定温度を維持するこ
とを含んでいる。
【0040】二つの要因がLED変動に対して主として
責任がある。すなわち 1.LED温度が変化すると、LED内部抵抗が変化す
る。定電圧電源がLEDに給電するために使用された場
合には、LED抵抗値が変化すると、電流が変化する。
LEDの光出力強度は到来電流にほぼ比例するので、L
EDにより放出される光の量は定電圧源が使用されたな
らば時間と共に変化する。
【0041】2.LED温度が変化すると、LEDの空
間的光出力パターンが変化する、すなわちLEDの出力
角度輝度が移動する。これは、輝度プロファイルの明る
い帯域が大抵の場合線走査カメラから離れて移動するこ
とになるので、問題を生じる。このために、光強度にお
ける減少がカメラによって観察される。
【0042】大部分は定電圧源電力供給を定電流源電力
供給に置き換えると最初に記憶した問題は解決する。
【0043】定電流源ではLEDの全パワー出力は時間
について有意には変化しないが、しかし温度は変化す
る。温度が変化すると空間的パターンが移動する。この
問題は熱電気冷却器(TEC)及び温度フィードバック
を備えたTEC制御器を用いて処理される。IR照明ユ
ニットの説明が後続する。
【0044】赤外線光源ユニットは赤外線LED、レン
ズ、レンズ取付具、アルミニウム熱シンク、固体熱電気
冷却器(TEC)、サーミスタ、TEC電力供給制御
器、及び定電流源からなっている。
【0045】ガラスレンズはIR LEDの発光側のす
ぐ上方に、光が半透明Estar材料を通じて光る平行
ビームへと一様にコリメートされるような方法で取り付
けられている。IR LEDは940nmでピーク照明
を発生する。レンズ取付具はアルミニウムで作られてい
て二つの構成部分に分割されている。第1の構成部分は
LEDハウジング(LEDカソード)の上部に乗ってお
り、且つ第2の(より小さい)アルミニウム熱シンク/
取付具はIR LEDスタッド(アノード)に取り付け
られている。第2の、より小さい熱シンクの表面のすぐ
上方及び上でスタッドの適当な場所に接着されているの
は小形サーミスタである。サーミスタは電気抵抗性温度
検出素子である。サーミスタの二つの線はTEC電力供
給制御器に接続されている。この制御器はサーミスタか
ら信号を温度フィードバック情報として使用してIR
LED温度を監視している。
【0046】ほぼ0.5インチ×0.5インチ×0.0
85インチのTEC素子は第2のより小さい熱シンクの
下にこれと接触して配置されている。TECは電流を利
用してTECの一方の側から他方の側へ熱を伝達する固
体冷却器である。このためにサーミスタに最も近い小熱
シンクの側は冷却され且つ反対の側は加熱される。TE
Cからの二つの電線はTEC電力供給制御器の電流供給
源に接続されている。電力供給制御器はIR LED温
度を所望の温度に、この場合には95°Fに維持するよ
うにプログラムされている。
【0047】TECの加熱側はその熱を伝達するために
熱シンク、例えば大きいアルミニウムブロック、を持た
なければならず、さもないと加熱することになる。それ
ゆえに、TEC表面のすぐ下でこれと接触しているのは
大きいアルミニウムの取付板である。
【0048】今度は図9に言及すると、画像120を捕
獲した後、フレームグラッバ板における256−8ビッ
トディジタル画像画素の最初の32ビットはソフトウエ
ア制御により前処理板に転送される。これら32の画素
は利用可能な画素データの列内の関心事の区域に対応し
ている。二つの画素列を受けた後、前処理板はこの画像
データを取って数百ナノ秒内にそれについて簡単な画像
処理動作を行う。これらの動作はしきい値設定122、
拡張124及び基準化126を含んでいる。拡張及び基
準化は既述の新規な論理的実施例においては実質上同時
に行われる。
【0049】結果として生じる16ビットの画素データ
は次にパイプライン式RAM(図4の84)へ押し込ま
れる。パイプライン式RAMは画像の16×16移動画
素窓全体が記憶される動的画像窓記憶回路として機能す
る。前処理回路からの結果として生じるデータは次に2
の補数変換器回路に送られ、そしてこの回路は情報を神
経ネットワーク加速器板に外部母線を通して転送する前
に画像データをその最終形成に変換する。神経ネットワ
ークはこのデータを受けてこれを分類し始める。分類さ
れた結果は処理装置復号化130のための通信ポートか
ら、例えば記憶/及び表示のために対応するASCII
文字へと送られる。
【0050】光学式の文字認識装置は移動するウエブを
事実上連続的方法で走査するように設計され且つ構成さ
れている。例えば、ことごとくの0.0085インチの
ウエブ運動により文字認識装置は新しい走査線の画像画
素データを捕獲し且つ前処理板のパイプライン式二重ポ
ートRAMに記憶された画像を解析する。妥当な数字一
文字が存在しなければ、情報は直列通信ポートから送ら
れない。文字が最終的にカメラの下に落ちてパイプライ
ン式RAMを満たすときには、文字認識装置は通信線か
ら妥当な文字を送る。この方法で、各文字に対する個別
の数字一文字整合装置は必要とされない。
【0051】この発明の幾つかの実施例が添付の諸図面
に図解され且つ前述の詳細な説明において記述されたけ
れども、この発明はここで記述された特定の実施例に限
定されず、この発明の範囲から外れることなく多くの再
配列、変更及び置換が可能であることは理解されること
であろう。次の諸請求項はすべてのそのような変更を包
含するように意図されている。
【0052】
【発明の効果】技術に通じた者は上に与えられた文字認
識装置/方法がここで最初に述べられた諸利点を与える
ことを認識するであろう。明確には、神経ネットワーク
を使用して移動する材料のウエブ上の縁部標識付き文字
を認識するようにした新規な文字認識方式が記述されて
いる。この技法は透明又は半透明材料の移動するウエブ
上の高度に変形したドットマトリックス数字文字を識別
することができる。更に、任意のソフトウエア準拠式文
字認識実現例に比べて改善された性能の外に、任意の従
来既知の加速器板に比べて有意に高められた性能が可能
である新規な神経ネットワーク加速器板が提供されてい
る。移動するウエブ上の縁部標識付き文字の認識に対す
る実用的神経ネットワーク応用として提供されている。
この技法を用いると、文字は、肉眼には認識不可能であ
るような良くない品質のものであるような場合にもかか
わらず、正しく認識されることができる。既述の文字認
識装置及び方法は生成されたデータについて実時間で動
作する。
【図面の簡単な説明】
【図1】この発明に従って抽出され且つ分類されるべき
縁部標識を備えた移動する材料のウエブの部分的平面図
である。
【図2】この発明による神経ネットワーク光学式文字認
識装置の一実施例の簡単化された透視図である。
【図3】図2の神経ネットワーク光学式文字認識装置の
ある特徴部のより詳細なブロック図表現である。
【図4】図3の前処理板の一実施例のより詳細な表現で
ある。
【図5】図3の神経ネットワーク加速器板の一実施例の
ブロック図表現である。
【図6】(a)〜(c)はこの発明による神経ネットワ
ーク光学式文字認識装置における規定の画像化窓を通る
移動ウエブ上の文字の進行を図示している。
【図7】(a)〜(c)はウエブが規定の画像化窓を通
過するときの縁部標識付きウエブの種々の可能な位置を
図示している。
【図8】図5の神経ネットワーク加速器板実施例におけ
る一つの処理ノードのための記憶重み情報の一実施例を
図示している。
【図9】この発明による神経ネットワーク光学式文字認
識装置の主処理機能の一実施例の動作上の概観図を図示
している。
【符号の説明】
10 ウエブ, 12 市松模様の浮出しパターン又は突起模様, 14 縁部, 16 縁部標識, 18 整合標識, 20 数字文字, 30 光学式文字認識装置, 31 直列ポート, 32 コンピュータ, 34 キーボード, 36 ビデオ表示装置, 37 線接続部, 38 カメラ, 39 線接続部, 40 符号器, 41 相互接続用ケーブル, 50 赤外線照明源, 52 ローラ, 54 符号器ローラ, 56 ローラ軸, 58 フィルタ, 60 観察用レンズ, 62 CPU, 63 PCデータ/制御母線, 64 フレームグラッバ板, 65 RAM, 67 外部トリガ入力, 68 前処理板, 69 外部母線, 70 神経ネットワーク加速器板, 72 符号器板, 74 直列通信板, 80 バッファ, 82 四入力ORゲート, 84 記憶配列, 86 専用母線, 90 RAM, 92 マルチプレクサ, 94 乗算器・累算器, 95 記憶装置, 96 探索表, 98 アドレス発生器・制御論理回路, 100 画像化窓, 102 縁部, 104 縁部標識形文字, 120 捕獲画像, 122 しきい値, 124 拡張, 126 基準化, 128 神経ネットワーク, 130 処理装置復号化。

Claims (39)

    【特許請求の範囲】
  1. 【請求項1】 移動する材料のウエブ上に配置された文
    字を抽出して分類するための神経ネットワーク準拠形光
    学式の文字認識装置であって、 画像化窓を規定する画像獲得装置であって、前記のウエ
    ブ文字が前記の規定の画像化窓を通過するように配置可
    能であり、前記の画像化窓を通過する各ウエブ文字につ
    いての画像データを抽出して蓄積する前記の画像獲得装
    置、 前記のウエブが前記の規定の画像化窓を通過するときに
    前記のウエブの照明を与えるための光源、 前記の画像獲得装置に結合されていて、前記の画像化窓
    を通過する前記のウエブ文字のそれぞれについての前記
    の蓄積画像データを事前定義の神経ネットワークアルゴ
    リズムに従って処理することができ且つそれから文字分
    類情報を生成することができる神経ネットワーク加速器
    装置、 前記の神経ネットワーク加速器装置に結合されていて、
    前記の画像獲得装置により画像化された前記のウエブ文
    字のそれぞれを前記の神経ネットワーク加速器装置によ
    り生成された対応する文字分類情報を用いて分類するこ
    とができる分類装置、を備えている前記の文字認識装
    置。
  2. 【請求項2】 前記の画像獲得装置が、前記の画像化窓
    を規定するために役立つ観察レンズを備えた線走査CC
    Dカメラを含んでおり、且つ前記のウエブが前記のカメ
    ラレンズに実質上直交する前記の規定の画像化窓を通過
    し、且つ又前記の神経ネットワーク加速器装置が、これ
    の入力に結合された二重ポート式記憶装置を含んでい
    て、前記の記憶装置が第1部分及び第2部分を有してお
    り、前記の二重ポート式記憶装置の前記の第1部分が、
    前記の事前定義の神経ネットワークアルゴリズムによる
    同時処理のために多数の走査線からの蓄積画像データを
    収容する、請求項1の文字認識装置。
  3. 【請求項3】 前記の神経ネットワークアルゴリズムが
    完全相互接続式多層前方モードアルゴリズムからなって
    いる、請求項2の文字認識装置。
  4. 【請求項4】 前記のネットワーク加速器装置が、前記
    の多層ネットワークアルゴリズムにおける入力層の種々
    のノードにおける画像データを同時に処理するように並
    列に接続されたnの処理ノードを含んでいて、各ノード
    の出力が前記の記憶装置の前記の第2部分に記憶され
    る、請求項2の文字認識装置。
  5. 【請求項5】 前記の多層ネットワークアルゴリズムの
    前記の入力層におけるすべてのノードの処理が完了され
    ると、前記の並列処理ノードへの入力と前記の二重ポー
    ト式記憶装置の前記の第1部分からそれの前記の第2部
    分に切り換えるための装置を更に備えている、請求項4
    の文字認識装置。
  6. 【請求項6】 前記の多層ネットワークアルゴリズムの
    第2層処理中の各処理ノードの出力が前記の記憶装置の
    前記の第1部分へオーバライトされる、請求項5の文字
    認識装置。
  7. 【請求項7】 前記の多層ネットワークの各層のための
    前記の並列接続処理ノードの出力が前記の二重ポート式
    記憶装置の前記の第1部分及び前記の第2部分に記憶さ
    れ、選択された記憶装置部分が前記の層のための並列処
    理ノードへの入力データを収容した前記の二重ポート式
    記憶装置の前記の部分以外であり、前記の層のための前
    記の入力データが多層ネットワークアルゴリズムにおけ
    る前記の層のための記憶された処理ノード出力を含んで
    いる、請求項6の文字認識装置。
  8. 【請求項8】 前記の処理ノードの出力が、前記の記憶
    装置に記憶される前にデータ押込みのためにシグモイド
    関数処理装置を通過させられる、請求項4の文字認識装
    置。
  9. 【請求項9】 前記の蓄積画像データを前記の画像獲得
    装置から前記の神経ネットワーク加速器装置の前記の二
    重ポート式記憶装置に転送するための専用の並列構成式
    母線を更に備えている、請求項2の文字認識装置。
  10. 【請求項10】 マルチプレクサ及びシステムデータ母
    線を更に備えていて、前記のマルチプレクサが前記の神
    経ネットワーク加速器装置内に配置され且つ前記の専用
    並列入力母線及び前記のシステムデータ母線のそれぞれ
    に接続されていて前記の母線のどちらか一つからの画像
    データの前記の記憶装置への多重化を可能にする、請求
    項9の文字認識装置。
  11. 【請求項11】 前記のnの並列接続式処理ノードのそ
    れぞれが、二つの入力及び一つの出力を有する乗算器/
    累算器論理回路を備えていて、前記の入力の第1のもの
    が前記の記憶装置に接続され且つ前記の入力の第2のも
    のが、多層神経ネットワークのそれぞれの層における対
    応する処理ノードのための事前規定の重み付け係数を収
    容している独特のシステム記憶アドレスに接続されてい
    る、請求項4の文字認識装置。
  12. 【請求項12】 前記の神経ネットワーク加速器装置内
    のデータの流れを制御するための制御論理回路を更に備
    えていて、前記の神経ネットワーク加速器装置が神経ネ
    ットワーク加速器板を含んでいる、請求項2の文字認識
    装置。
  13. 【請求項13】 前記の画像獲得装置により蓄積された
    前記の画像データを前記の神経ネットワーク加速器装置
    による前記のデータの処理前に前処理するための装置を
    更に備えていて、前記の前処理装置が雑音フィルタリン
    グのための装置及び前記の画像データを書式化するため
    の装置を含んでいる、請求項3の文字認識装置。
  14. 【請求項14】 前記の前処理装置の前記の雑音フィル
    タリング装置及び書式化装置が、 妥当でない画像データ情報をフィルタするためのしきい
    値設定装置、 前記の蓄積画像データを拡張圧縮形式で同時に表現する
    ための拡張・圧縮装置、及び前記の神経ネットワーク加
    速器装置による受領のために事前規定の形式に前記の圧
    縮画像データを変換するための装置、を含んでいる、請
    求項13の文字認識装置。
  15. 【請求項15】 前記の同時拡張・圧縮装置が複数の多
    入力ORゲートを含んでいる、前記のORゲートのそれ
    ぞれが前記の走査線から入力画素を受けるように接続さ
    れている、請求項14の文字認識装置。
  16. 【請求項16】 前記のORゲートのそれぞれが隣接し
    た走査線から四つの入力画素を受けるように接続されて
    いて、前記の入力画素の二つが前記の走査線のそれぞれ
    から得られる、請求項15の文字認識装置。
  17. 【請求項17】 前記の画像獲得装置がフレームグラッ
    バ記憶装置を含んでいて、前記のフレームグラッバ記憶
    装置が前記の前処理装置の入力に結合されており、前記
    のフレームグラッバ装置が前記の前処理装置により前処
    理されるべき蓄積画像データを受ける、請求項13の文
    字認識装置。
  18. 【請求項18】 前記の移動する材料のウエブが移動す
    る写真材料のウエブからなっており、且つ前記のウエブ
    が前記の規定の画像化窓を通過するときに前記の光源が
    前記のウエブに赤外線透過照明を与える、請求項1の文
    字認識装置。
  19. 【請求項19】 前記の移動する材料のウエブに配置さ
    れた前記の文字が縁部標識を含んでいて、この縁部標識
    のそれぞれが複数の群分けの一つへと集められ、この群
    分けのそれぞれが特別のメッセージ文字で標識付けされ
    ており、前記のそれぞれの特別のメッセージ文字から各
    文字までの各群における距離が知られており、且つ前記
    の文字認識装置が更に、 前記の特別のメッセージ文字を識別するための装置、及
    び各識別された特別のメッセージ文字からのウエブ距離
    をクロックするための符号器装置であって、前記の特別
    のメッセージ文字からある文字までの既知の距離が達成
    されると前記の画像獲得装置に画像収集トリガ信号を供
    給する前記の符号器、を備えている、請求項1の文字認
    識装置。
  20. 【請求項20】 前記の符号器装置が前記の移動する材
    料のウエブと連絡して配置された光学式文字符号器を含
    んでいる、請求項19の文字認識装置。
  21. 【請求項21】 前記の分類装置が前記の神経ネットワ
    ーク加速器装置により生成された前記の分類情報をAS
    CII符号へと書式化するための処理装置を含んでお
    り、且つ前記の文字認識装置が更に、少なくとも一つの
    プロセス計算及びプロセス制御のためにホストコンピュ
    ータに前記のASCII符号化分類情報を転送すること
    を容易にするための通信装置を備えている、請求項1の
    文字認識装置。
  22. 【請求項22】 前記の文字認識装置が更に、前記の分
    類ウエブ文字を観察するための少なくとも一つの表示装
    置、及び前記のウエブ文字についての前記の分類情報を
    記憶するための記憶装置を備えている、請求項1の文字
    認識装置。
  23. 【請求項23】 前記の文字がドットマトリックス形印
    刷文字からなっている、請求項1の文字認識装置。
  24. 【請求項24】 抽出されて分類されるべき前記の印刷
    文字が前記のウエブ上で縁部標識付けされており、且つ
    前記の移動する材料のウエブのための機械情報、ロール
    情報及びフィート数情報の少なくとも一つを含んでい
    る、請求項23の文字認識装置。
  25. 【請求項25】 前記の材料のウエブが写真材料からな
    っており、且つ前記のドットマトリックス印刷文字が半
    透明であり且つ前記の写真材料が半透明である、請求項
    24の文字認識装置。
  26. 【請求項26】 前記の文字が機械印刷の数字文字から
    なっている、請求項25の文字認識装置。
  27. 【請求項27】 神経ネットワークを用いて移動する材
    料のウエブに配置された文字を抽出して分類するための
    方法であって、 (a) 事前規定の画像化窓を通して前記の移動するウ
    エブを進行させる段階、 (b) 前記の画像化窓内の前記のウエブを前記の進行
    段階(a)と同時に照明する段階、 (c) 前記の画像化窓内の前記のウエブの画像を前記
    の進行段階(a)と同時に獲得する段階、 (d) 前記の段階(c)において画像化された前記の
    ウエブに配置された文字についての画像データを抽出し
    て蓄積する段階、及び (e) 前記の神経ネットワークを利用して前記の段階
    (c)において蓄積された画像データを処理し、前記の
    神経ネットワークが前記の蓄積画像データに基づいて文
    字分類情報を生成する段階、 を含んでいる前記の方法。
  28. 【請求項28】 前記の文字分類情報を対応するASC
    II符号へと処理する段階を更に含んでいる、請求項2
    7の方法。
  29. 【請求項29】 多層後方伝搬訓練技法を用いて前記の
    段階(c)において利用される前記の神経ネットワーク
    を事前定義する段階を更に含んでいる、請求項27の方
    法。
  30. 【請求項30】 前記の段階(c)が前記の画像化窓内
    の前記のウエブの光学的画像を前記の進行段階(a)と
    同時に獲得することを含んでいる、請求項27の方法。
  31. 【請求項31】 前記の神経ネットワークが完全相互接
    続式多層神経ネットワークからなっている、請求項27
    の方法。
  32. 【請求項32】 前記の利用段階(e)が前記の多層神
    経ネットワークの各層についてこれのnのノードを並列
    に処理することを含んでいる、請求項31の方法。
  33. 【請求項33】 前記の利用段階(e)が、前記の多層
    神経ネットワークの種々の層に対する入力データを収容
    するために第1部分及び第2部分を有する記憶装置を利
    用することを含んでおり、且つ前記の方法が更に、 前記の段階(d)において蓄積された前記の画像データ
    を前記の記憶装置の第1部分に記憶する段階、 前記の多層神経ネットワークの入力層処理中、前記のn
    の処理ノードの出力を前記の記憶装置の前記の第2部分
    へ記憶する段階、及び前記の入力層に続く各ネットワー
    ク層について、前記のnの並列処理ノードの出力を、そ
    れへの入力データを収容していない各記憶部分の他方へ
    記憶する段階、 を含んでいる、請求項32の方法。
  34. 【請求項34】 前記の段階(e)の前に前記の画像デ
    ータを前処理する段階を更に含んでいて、前記の前処理
    が前記の画像データを拡張圧縮形式に実質上同時に拡張
    し圧縮することを含んでいる、請求項27の方法。
  35. 【請求項35】 前記の同時拡張・圧縮が前記の画像デ
    ータを複数の並列配置式ORゲートに通すことを含んで
    いる、請求項34の方法。
  36. 【請求項36】 前記のウエブが写真材料からなってお
    り且つ前記の照明段階(b)が前記の事前規定の画像化
    窓内の前記のウエブを赤外線透過照明で照明することを
    含んでいる、請求項27の方法。
  37. 【請求項37】 事前定義の多層神経ネットワークに従
    って入力データを処理するための神経ネットワーク加速
    器であって、 第1部分及び第2部分に分割されていて、前記の入力デ
    ータが最初に前記の第1部分により受け取られるように
    なっている記憶装置、 前記の第1記憶部分に記憶された前記の入力データを処
    理するためのnの並列接続式処理ノードであって、これ
    の各ノードが記憶のために前記の記憶装置の前記の第2
    部分への出力データに結合されている、前記のnの並列
    接続式処理ノード、並びに、 前記のnの並列接続式処理ノードによる入力層処理の完
    了時に処理ノード入力を前記の記憶装置の第1部分から
    前記の記憶装置の第2部分へ切り換えるための装置、を
    備えている前記の神経ネットワーク加速器。
  38. 【請求項38】 前記の多層神経ネットワークの第2層
    処理中の、前記のnの並列接続式処理ノードの出力が前
    記の記憶装置の前記の第1部分へオーバライトされる、
    請求項37の神経ネットワーク加速器。
  39. 【請求項39】 前記の切換装置が更に、前記のnの並
    列接続式処理ノードによる前記の多層神経ネットワーク
    の第3層処理の間処理ノード入力を前記の第2記憶部分
    から前記の第1記憶部分へ切り換えるための装置を含ん
    でいる、請求項38の神経ネットワーク加速器。
JP5087326A 1992-04-14 1993-04-14 移動するウエブにおける文字を分離するための神経ネットワーク光学式の文字認識装置及び方法 Pending JPH0644410A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US86837292A 1992-04-14 1992-04-14
US868372 1992-04-14

Publications (1)

Publication Number Publication Date
JPH0644410A true JPH0644410A (ja) 1994-02-18

Family

ID=25351543

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5087326A Pending JPH0644410A (ja) 1992-04-14 1993-04-14 移動するウエブにおける文字を分離するための神経ネットワーク光学式の文字認識装置及び方法

Country Status (3)

Country Link
US (1) US5712922A (ja)
EP (1) EP0566015A3 (ja)
JP (1) JPH0644410A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019160252A (ja) * 2018-03-16 2019-09-19 株式会社リコー 学習識別装置および学習識別方法
JP2019160254A (ja) * 2018-03-16 2019-09-19 株式会社リコー 学習識別装置および学習識別方法

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6038338A (en) * 1997-02-03 2000-03-14 The United States Of America As Represented By The Secretary Of The Navy Hybrid neural network for pattern recognition
IT1306105B1 (it) * 1998-01-21 2001-05-29 P & S S R L Metodo ed apparecchiatura per la convalida di documenti di viaggio
FI110343B (fi) 1999-02-25 2002-12-31 Honeywell Oy Paperikoneen ratakatkojen monitorointijärjestelmä
US6473524B1 (en) 1999-04-14 2002-10-29 Videk, Inc. Optical object recognition method and system
MC2491A1 (fr) * 1999-06-21 1999-11-22 Stringa Luigi Reconnaissance automatique de caractères sur fond structuré par combinaison des modèles du fond et des caractères
US6728419B1 (en) * 2000-02-17 2004-04-27 Xerox Corporation Multi-tasking multi-threaded image processing system and method for image capture devices
US7262752B2 (en) * 2001-01-16 2007-08-28 Visteon Global Technologies, Inc. Series led backlight control circuit
ITUD20020085A1 (it) * 2002-04-12 2003-10-13 Neuricam Spa Dispositivo elettro-ottico per l'acquisizione e l'elaborazione di immagini
US7305122B2 (en) * 2002-08-13 2007-12-04 Lockheed Martin Corporation Method and computer program product for identifying and correcting systematic noise in a pattern recognition system
US20040136241A1 (en) * 2002-10-31 2004-07-15 Lockheed Martin Corporation Pipeline accelerator for improved computing architecture and related system and method
US7391451B2 (en) * 2003-01-09 2008-06-24 Lockheed Martin Corporation Reconfigurable, multi-output frame grabber for machine vision applications
US7242410B2 (en) * 2003-09-06 2007-07-10 Good News Enterprises Limited Color conversion method and apparatus
US20060085781A1 (en) * 2004-10-01 2006-04-20 Lockheed Martin Corporation Library for computer-based tool and related system and method
AU2006201849A1 (en) * 2005-05-03 2006-11-23 Tangam Gaming Technology Inc. Gaming object position analysis and tracking
CN100458410C (zh) * 2006-03-29 2009-02-04 南开大学 数字化光电油脂积分测色系统及其检测方法
US8117137B2 (en) * 2007-04-19 2012-02-14 Microsoft Corporation Field-programmable gate array based accelerator system
US8131659B2 (en) * 2008-09-25 2012-03-06 Microsoft Corporation Field-programmable gate array based accelerator system
US8301638B2 (en) * 2008-09-25 2012-10-30 Microsoft Corporation Automated feature selection based on rankboost for ranking
FR2938680B1 (fr) 2008-11-14 2012-11-16 Saint Louis Inst Procede de construction en temps reel de vecteurs prototypes a partir de donnees d'entree d'un processus neuronal
US8891872B2 (en) 2011-12-16 2014-11-18 General Electric Company System and method for identifying physical markings on objects
US9235499B2 (en) 2011-12-16 2016-01-12 General Electric Company System and method for identifying a character-of-interest
US9378435B1 (en) * 2014-06-10 2016-06-28 David Prulhiere Image segmentation in optical character recognition using neural networks
US11157800B2 (en) 2015-07-24 2021-10-26 Brainchip, Inc. Neural processor based accelerator system and method
KR102209689B1 (ko) 2015-09-10 2021-01-28 삼성전자주식회사 음향 모델 생성 장치 및 방법, 음성 인식 장치 및 방법
US10733503B2 (en) * 2016-02-18 2020-08-04 Intel Corporation Technologies for shifted neural networks
US10878318B2 (en) 2016-03-28 2020-12-29 Google Llc Adaptive artificial neural network selection techniques
US9942074B1 (en) 2016-11-30 2018-04-10 Micron Technology, Inc. Wireless devices and systems including examples of mixing coefficient data specific to a processing mode selection
US10027523B2 (en) 2016-11-30 2018-07-17 Micron Technology, Inc. Wireless devices and systems including examples of mixing input data with coefficient data
US10515302B2 (en) * 2016-12-08 2019-12-24 Via Alliance Semiconductor Co., Ltd. Neural network unit with mixed data and weight size computation capability
US11687759B2 (en) * 2018-05-01 2023-06-27 Semiconductor Components Industries, Llc Neural network accelerator
CN111191668B (zh) * 2018-11-15 2023-04-28 零氪科技(北京)有限公司 一种在病历文本中识别出疾病内容的方法
US10886998B2 (en) * 2019-02-22 2021-01-05 Micron Technology, Inc. Mixing coefficient data specific to a processing mode selection using layers of multiplication/accumulation units for wireless communication
DE102019129760A1 (de) 2019-11-05 2021-05-06 Eyyes Gmbh Verfahren zur Verarbeitung von Eingangsdaten
US10924152B1 (en) 2019-11-13 2021-02-16 Micron Technology, Inc. Mixing coefficient data for processing mode selection
CN111914714B (zh) * 2020-07-24 2021-05-14 深圳市鹰硕教育服务有限公司 点阵本交互方法

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4414685A (en) * 1979-09-10 1983-11-08 Sternberg Stanley R Method and apparatus for pattern recognition and detection
US4680805A (en) * 1983-11-17 1987-07-14 Texas Instruments Incorporated Method and apparatus for recognition of discontinuous text
US5068799A (en) * 1985-04-24 1991-11-26 Jarrett Jr Harold M System and method for detecting flaws in continuous web materials
FR2590703B1 (fr) * 1985-11-25 1991-03-29 Commissariat Energie Atomique Procede de reconnaissance de caracteres en temps reel, notamment sur des objets en defilement rapide
GB2203688B (en) * 1987-04-24 1991-05-01 Browns Agricultural Machinery A bale accumulator
USH681H (en) * 1987-06-05 1989-09-05 Dot matrix print detector
US5014327A (en) * 1987-06-15 1991-05-07 Digital Equipment Corporation Parallel associative memory having improved selection and decision mechanisms for recognizing and sorting relevant patterns
FR2625347B1 (fr) * 1987-12-23 1990-05-04 Labo Electronique Physique Structure de reseau de neurones et circuit et arrangement de reseaux de neurones
DE68927014T2 (de) * 1988-01-11 1997-01-23 Sharp Kk Assoziatives Musterkonversionssystem und Anpassungsverfahren dafür
EP0340901A3 (en) * 1988-03-23 1992-12-30 Du Pont Pixel Systems Limited Access system for dual port memory
DE68922567T2 (de) * 1988-10-06 1995-08-17 Toshiba Kawasaki Kk Neuronales Netzwerksystem.
US4932065A (en) * 1988-11-16 1990-06-05 Ncr Corporation Universal character segmentation scheme for multifont OCR images
US5048100A (en) * 1988-12-15 1991-09-10 Michael Kuperstein Self organizing neural network method and system for general classification of patterns
US4974169A (en) * 1989-01-18 1990-11-27 Grumman Aerospace Corporation Neural network with memory cycling
US5553196A (en) * 1989-04-05 1996-09-03 Yozan, Inc. Method for processing data using a neural network having a number of layers equal to an abstraction degree of the pattern to be processed
US5267185A (en) * 1989-04-14 1993-11-30 Sharp Kabushiki Kaisha Apparatus for calculating matrices
JP2940933B2 (ja) * 1989-05-20 1999-08-25 株式会社リコー パターン認識方式
JPH0375860A (ja) * 1989-08-18 1991-03-29 Hitachi Ltd パーソナライズド端末
US5105387A (en) * 1989-10-13 1992-04-14 Texas Instruments Incorporated Three transistor dual port dynamic random access memory gain cell
JPH03152406A (ja) * 1989-11-09 1991-06-28 Matsushita Electric Ind Co Ltd パターン検査方法
US5067164A (en) * 1989-11-30 1991-11-19 At&T Bell Laboratories Hierarchical constrained automatic learning neural network for character recognition
US5167006A (en) * 1989-12-29 1992-11-24 Ricoh Company, Ltd. Neuron unit, neural network and signal processing method
JP3260357B2 (ja) * 1990-01-24 2002-02-25 株式会社日立製作所 情報処理装置
US5040229A (en) * 1990-02-02 1991-08-13 Eastman Kodak Company Contour feature-based method for identification and segmentation of touching characters
US5048097A (en) * 1990-02-02 1991-09-10 Eastman Kodak Company Optical character recognition neural network system for machine-printed characters
US5054094A (en) * 1990-05-07 1991-10-01 Eastman Kodak Company Rotationally impervious feature extraction for optical character recognition
US5052043A (en) * 1990-05-07 1991-09-24 Eastman Kodak Company Neural network with back propagation controlled through an output confidence measure
EP0468229A3 (en) * 1990-07-27 1994-01-26 Hnc Inc A neural network with expert system functionality
GB2247586B (en) * 1990-08-31 1994-10-12 Sony Corp Movie film to video conversion
US5204914A (en) * 1991-08-30 1993-04-20 Eastman Kodak Company Character recognition method using optimally weighted correlation
FR2686175B1 (fr) * 1992-01-14 1996-12-20 Andre Thepaut Systeme de traitement de donnees multiprocesseur.

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019160252A (ja) * 2018-03-16 2019-09-19 株式会社リコー 学習識別装置および学習識別方法
JP2019160254A (ja) * 2018-03-16 2019-09-19 株式会社リコー 学習識別装置および学習識別方法

Also Published As

Publication number Publication date
EP0566015A3 (en) 1994-07-06
US5712922A (en) 1998-01-27
EP0566015A2 (en) 1993-10-20

Similar Documents

Publication Publication Date Title
JPH0644410A (ja) 移動するウエブにおける文字を分離するための神経ネットワーク光学式の文字認識装置及び方法
EP3531347B1 (en) Data volume sculptor for deep learning acceleration
Garcia et al. A neural architecture for fast and robust face detection
CN106599863A (zh) 一种基于迁移学习技术的深度人脸识别方法
JPH0255824B2 (ja)
EP1805689A2 (en) Methods and apparatus for dynamic signal processing
CN113869300A (zh) 基于多视觉融合的工件表面缺陷和字符识别的方法及系统
CN111079511A (zh) 基于深度学习的文档自动归类及光学字符识别方法及系统
Putro et al. An efficient face detector on a cpu using dual-camera sensors for intelligent surveillance systems
KR860000609A (ko) 상(image)의 사진요소를 신호형태로 나타내는 방법 및 장치
Prasad et al. Real-time hand gesture recognition using Indian Sign Language
Verma et al. Enhanced character recognition using surf feature and neural network technique
Koyuncu et al. Handwritten character recognition by using convolutional deep neural network; review
US5361311A (en) Automated recongition of characters using optical filtering with positive and negative functions encoding pattern and relevance information
Jebadurai et al. Handwritten text recognition and conversion using convolutional neural network (CNN) based deep learning model
Howell et al. Recognising simple behaviours using time-delay RBF networks
Scherer et al. Robust, Real-Time Number Sign Detection on a Mobile Outdoor Robot.
Moon et al. An improved custom convolutional neural network based hand sign recognition using machine learning algorithm
Yin et al. Mirrored EAST: An Efficient Detector for Automatic Vehicle Identification Number Detection in the Wild
Urs et al. Action Detection for Sign Language Using Machine Learning
JPH08272971A (ja) 対象物認識方法
Jiao et al. Research on Multi-side Joint Industrial Parts Inspection Based on Model Fusion
WO2022185481A1 (ja) 検査装置、検査方法、及び、記録媒体
Johnsson et al. Enabling Communication: Instantaneous Translation from Sign Language to Text
Naidovich et al. DSDNet Neural Network for Shadow Detection from Urban Satellite Images