JPH03186986A - ニューラルネットを用いた文字認識装置 - Google Patents

ニューラルネットを用いた文字認識装置

Info

Publication number
JPH03186986A
JPH03186986A JP1326725A JP32672589A JPH03186986A JP H03186986 A JPH03186986 A JP H03186986A JP 1326725 A JP1326725 A JP 1326725A JP 32672589 A JP32672589 A JP 32672589A JP H03186986 A JPH03186986 A JP H03186986A
Authority
JP
Japan
Prior art keywords
parallel
picture
neural network
buffer
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1326725A
Other languages
English (en)
Inventor
Toru Ueda
徹 上田
Takashi Aramaki
荒巻 隆志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP1326725A priority Critical patent/JPH03186986A/ja
Publication of JPH03186986A publication Critical patent/JPH03186986A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野コ この発明はニューラルネットを用いた文字認識装置に関
し、特に、紙面に表記された文字両像を読取り、ニュー
ラルネットを用いて文字認識を行ない、文字コードを出
力するようなニューラルネットを用いた文字認識装置に
関する。
[従来の技術] 従来の文″了:認識装置は、画像の特徴を抽出するため
の演算装置を用いて高速で特徴を抽出することや、高速
のマツチング用演算装置を用いて高速化を図る手法かと
られている。しかし、従来の文字認識手法は、その複雑
さから並列に処理することが困難であり、並列で演算を
行なうためには非常に複雑な制御機構か必要である。
一方、近年研究が盛んなニューラルネットの分野におい
ては、ニューラルネッ]・の並列性を生かした並列の演
算装置が研究されている。ニューラルネットは、比較的
t4を純な演算を行なう素子が多数集まることにより複
雑な問題を解く手法であり、並列化に非常に向いている
。ニューラルネットの原理は、人間の脳を模擬するネッ
トワークを用いて、人力特徴とネットワーク内部で保持
されているウェイトとの演算により、出力結果を得るも
のてあり、代表的な学習方式としてバックプロパゲンヨ
ンが挙げられる。
ニューラルネットは火水的な特徴として、ニューロンと
呼ばれる比較的単純な演算素子を多数持った構造をして
いる。単純な演算素子が多数並列で動作する構造である
ため、並列化か簡単で、並列で清算機能を動作させるた
めのLSIならば各所で研究されている。
[発明が航法しようとする課題] 一方、文字認識を行なう場介、特徴抽出やノイズ除去な
どの前処理が必要とされる。これらの画像処理は、多く
の場合、ニューラルネットで用いる演算に比較してより
(]1純なANDloRなとの論理演算で実現できるこ
とか多い。3×3程度の大きさの窓を画像のに上から順
に右下までスキャンしていき、その窓内に入ったデータ
を処理することにより、細線化やノイズ除去が可能とな
る。
この場合には、データが逐次的に入力されかつ各データ
に対しての演算量か極めて少ないため、先のニューラル
ネット用の並列演算装置を用いることは効率的ではない
また、一般の信号処理用LSIを使用する場合、乗算を
高速に行なえるようになっているか、画像からの特徴抽
出はほとんとの場合8ヒツトを越える乗置は必械とせず
、文字認識装置に用いるには本適当である。
それゆえに、この発明の主たる1」的は、高速に特徴抽
出を9−Jなうための演算手段と、ニューラルネットの
演3↑を並列に行丸うための並列演算手段と、これらの
演算手段を制御する制御手段を設け、文字認識を高速に
行なうことのできるようt、I:ニュラルネットを用い
た文字認識装置を提(兵することである。
[課題を角q決するための手段] この発明は♀j(向に表記された文′了神jj像を読取
り、その画像から文字認識を行なって文字コードを出力
するニューラルネットを用いた文字認識装置において、
読取られた小領域の画(象信号に応答して特徴抽出やノ
イズ除去などの前処理を行なう簡易演算手段と、簡易演
算手段の処理出力を用いて、並列的にニューラルネット
の演算を行なう並列演算手段と、簡易演算手段と並列演
算手段とを制御するための制御手段とを備えて構成され
る。
[作用] この発明にがかるニューラルネットを用いた文字認識装
置は、読取られた小領域の画像信号に基ついて特徴抽出
やノイズ除去などの前処理を行なった後、並列的にニュ
ーラルネットの演算を?jなって画像認識するようにし
たので、演算を非常に高速に行なうことができ、高速な
画像認識が可能となる。
[発明の大施例] 沁1図はこの発明の一丈施例の概略ブロック図である。
ます、第1図を参照して、画像認識装置の禍戊について
説明する。スキャナーは紙面に表記された文字画像を読
取るものであり、読取られた画像データは画像メモリ2
に一時記憶される。
画像メモリ2に一時記憶された画像データは画像処理装
置3によって特徴抽出やノイズ除去などの前処理が行な
われる。画像処理装置3によって抽出された特徴はハ゛
ツファ4に、記憶される。バッファ4に泥上さされた特
徴は並りリl責Z♀装置5に一1jえられる。!II;
列演騨装置はニューラル不ツー・の演算を1jなうもの
であり、その演’+?N+’j東はバッファ6に1j己
憶される。外部インタフェース7は!1f−列演算装置
で演算された文字:1−1・を夕り部に出力するために
設けられている。なお、スキャナーとiil:ii f
’4メモJ2と両1イ!処裡裟置3とバッファlと並列
演算装置5とバッファ6と外部インタフェース7はCP
U8によ−〕で制御される。
画像処理装置3は算術II+/’比較/A、ND10R
/XOR(排他的論裡和)/舌足/テーブル参照などの
演算を1シ;、速に行なうちのであるか、一般の信号処
理用プロセッサのように高速に乗算処理できる必要はな
い。特に、この1lhI像処理装置3は第R図に示すよ
うに、スキャナーによって読取られ、1+l+i l象
メモリ2に6己憶された1+% MのX方向311jl
j I象およびY方向31!lIl像の付1域と画(象
(、=号の演算を高速に石なうためのハードウェアを価
えている。第2園にンJ< した3×′3の’6fl域
をX )J’向に1ずつ移動させ、X方向の両像の終わ
りに達したならば、Y方向に1移動させX座標を1に戻
して再びX方向に移動させる方法によって処理が行なわ
れる。または、領域をY/j向に1移動させ、その後に
X方向に移動させる方法によって処理してもよい。さら
には、画(象領域の右下からスタートして上述の2つの
方法とは逆の順序で移動させる方法で処理を行なっても
よい。処理は、最小画素のみ、または2×2のマスク、
3×3のマスク内でのデータを参照し、それらのデータ
の演算により結果が出力される。たとえば、2値画像に
対して、第2図に示したマスクを用い、次の演算を施す
と、バッファ4には、孤立点が除去された画像が生成さ
れる。
0=E& (AIBICIDIFIGIHI I)ただ
し、 &:論理積 :論理和 A−I:第2図で示される位置の人力画像、ただし、マ
スクは上述の方法で画像 メモリをスキャンする。
O2演算結果。この桔東はバッファ4の人力1011像
と対応する位置に書込まれる。
第3図は第1園にiJ\した両像処理装置の動作を説明
するためのフロー図であり、第4図は画像処理装置によ
るペリフェラル特徴の特徴量を説明するための図である
第4図において、この失地1列て処理される画像は、た
とえばX方向54トツI−、l、向64ドツトの画素か
らなり、背景部分は論理゛0”で表わされ、文字は論)
71“]”で表わされているものとする。まず、Y方向
の最初の列の画素を処理するために、Y=L1に設定さ
れ、yかY、。より大きいか占かが判別される。Yカは
Y方向の画素の最大値であり、第4図に小した例ては6
4ドツトになる。yかY閏以ドであれば、stem値を
論理“0”に設定し、inc値を論理“1゛に設定する
。SLl nl値は各y7+の1+l+i素をX方向に
順次処理していき、最初に文字を検出するまでの背景の
ドツト数てあり、inc値は初期状態では論理°°1″
に設定され、最初に文字を検出すると論理“0“に設定
される。
次に、X Jj向の最初の列の両系を処理するため、x
=Oに設定され、XかXゆよりも小さいか否かか判別さ
れる。XいはX方向の画素の最大値であり、第4図に示
した例では64ドツトになる。XがXいより小さければ
、INC値の演算か行なわれる。このINC値はそれま
でのincの値と画]象メモリに記悟されている各画素
の値の否定値との論理枯を求めることによって算出され
る。すなわち、背景であれば、x、yか共に論理“0”
であり、その盃定値は論理“1″になり、それまでのi
nc値が論理゛′]“であれば新たなinc値は論理“
1”となる。
次に、それまでのSL1m値にinc値を加算して新た
なsum値か求められる。このsum値は文字を検出す
るまて増え続ける。そして、Xが+コされて、次のX方
向の画素の処理か行なわれる。
そして、X方向1行分の処理が終わったとき、すなわち
XがX力に達すると、sum値を結果値として出力し、
yを+1して次の(jの処理が行なわれる。
第5図は第1図に示した画像処理装置およびその周辺回
路のブロック図である。第5図において、画像処理装置
3はセレクタ31と演算装置32とを含む。セレクタ3
1は入力画像を読出すメモリの選択を行なうために設け
られる。これは、画像処理演算を繰返し行なう必要のあ
る処理(たとえば細線化)は、1度処理した結果をバッ
ファ4に保存し、次回からは、このバッファ4からデー
タを読出すことにより、処理を繰返すことができるよう
にするためである。演算装置32は前述の第3図に示し
たペリフェラル特徴抽出のための演算を行なう。なお、
このような画像処理装置3はたとえば特徴抽出プロセジ
ヤなどを用いれば安価に実現できかつ高速に処理を実行
できる。
第6図は並列演算装置周辺のブロック図である。
第6図を参照して、並列演算装置5は4つの演算装置5
1ないし54と、それぞれの演算装置51ないし54に
対応して設けられるメモリ55〜58を含む。並列演算
装置5は並列にニューラルネ0 ットの計算を行なうが、たとえば出力ノードが4つの場
合のニューラルネッi・における典型的な出力の演算と
して、次のような式が考えられる。
0=ma x (Wi・I) i−1・・・4 これは、ウェイトベクトルWiと人力ベクトルIとの内
積を求め、そのうちの最大値を出力値Oとするものであ
る。
第1番1」のウェイトベクトルW1の第1要素をwll
、、J2要素をw 1.2とし、人力ベクトルの禎]要
素をi]、第2里素を12とすると、内積は次の式で表
わされる。
Wl・I−w]lX1l+w12Xi2+w13×13
+・・・ ベクトルの要素数が10個の場合、1回の積和を1ステ
ツプと数えると、第1番[1のノードの出力を求めるの
に10ステツプの演算が必要である。
1つの演算装置しか侍たない場合には、4つの出力ノー
ドの値を計算するためには、逐次的に処理を行なうため
、仝体て40ステツプを必要とする。
1 4つの出力の最大値を求める(・Y作は、積和の割算こ
比べて簡単であるため、ここでは演算量を考慮に入れな
いとすると、最p (,4戸、出力をrするために40
ステツプ必要となる。なお、最大値を求める操・作は、
各演算装置51ないし54の拮果をバッファ7にりえた
後、CPU8で行なうことにより1現できる。
一方、W1〜W4の4つのウェイトベクトルをメモリ5
5ないし58に蓄え、人力ベクトルとの積和を演算装置
51ないし54で並列に行なった場合、4回の積和か1
ステツプでできるため、出力を得るために10ステツプ
ですみ、これは逐次的に計算した場合の4倍のスピード
になる。
[発明の効果] 以上のように、この発明によれば、特徴抽出とニューラ
ルネットの演算を非常に高速にできるため、高速の文字
認識装置を実現できる。また、各演算装置の出力をバッ
ファに蓄え、制御手段からの操作が可能であり、特殊な
処理を制御手段で行なうことができるため、柔軟度の高
いシステムを2 fAi成できる。さらに、この発明は文字認識に限るこ
となく、画像認識/処理にも応用でき′る。
【図面の簡単な説明】
第1図はこの発明の一実施例の概略ブロック図である。 第2図はこの発明の一実施例によって処理される画像の
一例を示す図である。第3図はこの発明の一実施例にお
けるペリフェラル特徴を抽出する動作を説明するための
フローである。第4図はべりフェラル特徴を説明するた
めの概念図である。第5図は第1図に示した画像処理装
置周辺のブロック図である。第6図は第1図に示した並
列演算装置周辺のブロック図である。 図において、]はスキャナ、2は画像メモリ、3は画像
処理装置、4,6はバッファ、5は並列演算装置、7は
外部インタフェース、8はCPU。 3〕はセレクタ、32.51ないし54は演算装置、5
5ないし58はメモリを示す。

Claims (1)

  1. 【特許請求の範囲】 紙面に表記された文字画像を読取り、その画像から文字
    認識を行なって文字コードを出力するニューラルネット
    を用いた文字認識装置において、読取られた小領域の画
    像信号に応答して特徴抽出やノイズ除去などの前処理を
    行なう簡易演算手段、 前記簡易演算手段の処理出力を用いて、並列的にニュー
    ラルネットの演算を行なう並列演算手段、および 前記簡易演算手段と前記並列演算手段とを制御するため
    の制御手段を備えた、ニューラルネットを用いた文字認
    識装置。
JP1326725A 1989-12-15 1989-12-15 ニューラルネットを用いた文字認識装置 Pending JPH03186986A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1326725A JPH03186986A (ja) 1989-12-15 1989-12-15 ニューラルネットを用いた文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1326725A JPH03186986A (ja) 1989-12-15 1989-12-15 ニューラルネットを用いた文字認識装置

Publications (1)

Publication Number Publication Date
JPH03186986A true JPH03186986A (ja) 1991-08-14

Family

ID=18190979

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1326725A Pending JPH03186986A (ja) 1989-12-15 1989-12-15 ニューラルネットを用いた文字認識装置

Country Status (1)

Country Link
JP (1) JPH03186986A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08123779A (ja) * 1994-10-27 1996-05-17 Nec Corp パターン学習方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01267789A (ja) * 1988-04-19 1989-10-25 Nec Corp 認識辞書作成機能を備えた文字認識装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01267789A (ja) * 1988-04-19 1989-10-25 Nec Corp 認識辞書作成機能を備えた文字認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08123779A (ja) * 1994-10-27 1996-05-17 Nec Corp パターン学習方法

Similar Documents

Publication Publication Date Title
US5519811A (en) Neural network, processor, and pattern recognition apparatus
US11755889B2 (en) Method, system and apparatus for pattern recognition
JP2020017274A (ja) ニューラルネットワークを使用するエンドツーエンド手書きテキスト認識のためのシステムおよび方法
Yamasaki et al. A real-time image-feature-extraction and vector-generation VLSI employing arrayed-shift-register architecture
US20200005074A1 (en) Semantic image segmentation using gated dense pyramid blocks
Roska Computational and computer complexity of analogic cellular wave computers
US5627943A (en) Neural network processor including systolic array of two-dimensional layers
Musaev et al. Accelerated training for convolutional neural networks
WO2020231005A1 (ko) 영상 처리 장치 및 그 동작방법
CN114556260A (zh) 用于执行神经网络的装置和系统
CN114925320B (zh) 一种数据处理方法及相关装置
JP2021170284A (ja) 情報処理装置及びプログラム
US11704894B2 (en) Semantic image segmentation using gated dense pyramid blocks
US20220262006A1 (en) Device for detecting an edge using segmentation information and method thereof
Kayumov et al. Combined convolutional and perceptron neural networks for handwritten digits recognition
JP6532334B2 (ja) 並列演算装置、画像処理装置及び並列演算方法
US11436432B2 (en) Method and apparatus for artificial neural network
JPH03186986A (ja) ニューラルネットを用いた文字認識装置
CN115049830A (zh) 一种基于矩阵边缘特征元素的图像缩边模型、方法及装置
Klaseen et al. The functional link net in structural pattern recognition
JP7323849B2 (ja) 分割認識方法、分割認識装置及びプログラム
JP7238510B2 (ja) 情報処理装置、情報処理方法及びプログラム
Kaur et al. Image-based Indian sign language recognition: a practical review using deep neural networks
JP2658346B2 (ja) 並列画像処理装置
Bakambekova et al. Generate while sensing-intelligent imaging with memristive pixel-CNN