JP2691022B2 - ニューラルネットを用いた画像認識システム - Google Patents

ニューラルネットを用いた画像認識システム

Info

Publication number
JP2691022B2
JP2691022B2 JP1166675A JP16667589A JP2691022B2 JP 2691022 B2 JP2691022 B2 JP 2691022B2 JP 1166675 A JP1166675 A JP 1166675A JP 16667589 A JP16667589 A JP 16667589A JP 2691022 B2 JP2691022 B2 JP 2691022B2
Authority
JP
Japan
Prior art keywords
learning
unit
neural network
data
image recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP1166675A
Other languages
English (en)
Other versions
JPH0333968A (ja
Inventor
寛 武長
良幸 奥山
政雄 高藤
和佳 浅田
紀夫 田中
忠明 北村
邦行 菊地
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP1166675A priority Critical patent/JP2691022B2/ja
Priority to US07/544,870 priority patent/US5086479A/en
Publication of JPH0333968A publication Critical patent/JPH0333968A/ja
Priority to US07/774,887 priority patent/US5295197A/en
Application granted granted Critical
Publication of JP2691022B2 publication Critical patent/JP2691022B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、画像認識装置に係わり、特にニユーラルネ
ツトワークを応用した画像認識装置に関する。
〔従来の技術〕
脳の神経回路網を模擬したニユーラルネツトワーク
は、ネツトワークに、入力データとその入力データに対
するネツトワークの出力期待値(以下、教師データと呼
ぶ)を教えるだけで、そのデータから所定のカテゴリー
に分類、識別する認識アルゴンリズムを構築できる能力
を備えている。そのため、画像認識や音声認識などのパ
ターン認識分野への応用が活発に進められている。特
に、画像認識においては、従来認識対象が変わるごとに
画像処理のエキスパートがヒユーリステイツクな手法で
認識アルゴリズムを開発しなければならないのが大きな
問題点であつたが、ニユーラルネツトワークを適用する
と認識対象をニユーラルネツトワークに教えるだけでよ
いため、認識アルゴリズム開発の簡単化及び期間短縮を
図ることができる。
しかし、従来のニユーラルネツトワークは、パーソナ
ルコンピユータやワークステーシヨンにニユーラルネツ
トワークの構造(層数、各層のニユーロン数、など)を
定義するニユーラルネツトワーク定義部とキーボードや
フアイルから読み込んだ学習データ(入力データと教師
データが対となつたデータ)を用いた学習あるいは学習
済みのニユーラルネツトワークを用いた想起を行う演算
部とで実現されていた。この種の装置としては、例え
ば、電子情報通信学会 技術研究報告 PRU88−85や日
経コンピユータ1988.3.14P.103などの記載のものが挙げ
られる。
〔発明が解決しようとする課題〕
上記従来技術は、ニユーラルネツトワークの構造を定
義する部分とニユーラルネツトワークで学習、想起を行
う演算部で構成されていたため、上記従来技術を画像認
識などの具体的なアプリケーションに適用する場合、ニ
ユーラルネツトワークの学習に際しては、学習データ
(入力データと教師データが対になつたデータ)の作成
やその学習データのニユーラルネツトワークへの入力方
法などが十分配慮されておらず、また実用システムとし
て運用する際には学習機能が冗長機能になるという問題
があつた。
本発明の目的は、このような問題点を取り除き、アプ
リケーション毎に異なる学習データを容易に作成、及び
ニューラルネットワークに入力でき、学習が実行でき、
かつ、実用システムへの移行も容易なニューラルネット
を用いた画像認識システムを提供することにある。
〔課題を解決するための手段〕
上記目的を達成するための本発明の特徴は、少なくと
もニューラルネットワークが学習するための学習データ
を作成する学習データ作成手段と、前記学習データによ
り学習を終了した前記ニューラルネットワークを用い
て、ある入力データから出力データを出力する早期手段
とを有して画像認識を行う画像認識装置と、少なくとも
前記学習データ作成手段により作成された学習データを
用いて、学習を実行する学習手段を有する演算装置と、
前記画像認識装置及び前記演算装置間での相互通信を可
能とする通信手段とからなることである。
〔作用〕
パターン認識装置上のニユーラルネツトワーク管理部
は、パターン認識装置で扱う認識対象(数字、英数字、
音声など)に応じたニユーラルネツトワーク構造情報を
作成する。次に、学習データ作成部は、認識対象から学
習に必要なデータを抽出して、そのデータと認識対象の
カテゴリーを示す教師データとを対にして学習データを
作成する。その後、ニユーラルネツトワーク管理部は、
作成したニユーラルネツトワーク構造情報と学習データ
作成部で作成した学習データを通信部及び通信ケーブル
を介して計算機に転送する。
一方、計算機側では、ニユーラルネツトワーク管理部
は、送られてきたニユーラルネツトワーク構造情報と学
習データを学習部に渡す。学習部は、これらのデータを
基に学習を行つて、ニユーロン間の結合の重みを計算し
て、認識対象に適したニユーラルネツトワークを構築す
る。このとき、ニユーラルネツトワーク管理部は、ニユ
ーラルネツトワークの学習状況を、例えば、重みの変化
や学習回数の変化などを表示することができる。
学習が終了した場合、ニユーラルネツトワーク管理部
は、学習部で決定したニユーロン間の重みを通信部及び
通信ケーブルを介してパターン認識装置に転送する。
最後に、パターン認識装置に実現した想起部は、最初
にニユーラルネツトワーク管理部で作成したニユーラル
ネツトワーク構造情報と計算機から転送されてきた重み
を用いて認識対象をカテゴリーに判別、分類する。
このように各部が動作するようにしたので、ニユーラ
ルネツトワークで学習する場合はパターン認識装置と計
算機とを通信で接続することにより学習の高速化が図
れ、また、学習が終了した場合は計算機を切り離してパ
ターン認識装置単独で処理する低価格な実用システムが
実現できる。
〔実施例〕
以下、本発明の一実施例を第1図により説明する。
第1図で、20はパターン認識装置、30は計算機システ
ム、1−1及び1−2はニユーラルネツトワーク管理
部、2は学習部、3は想起部、4−1及び4−2は通信
部、40は通信ケーブル、5は学習データ作成部、10はユ
ーザアプリケーシヨン、6はハードデイスク、フロツピ
ーデイスクなどの記録媒体を示している。また、第1図
で、実現した矢印61,62,63,64,65は学習データやニユー
ラルネツトワークの構造情報などのデータの流れを表し
ている。
第1図は、ニユーラルネツトワークを応用する場合に
必須の基本機能の中で、学習データ作成部5及び想起部
3をパターン認識装置20に、そして学習部を計算機シス
テム30にそれぞれ機能分散し、パターン認識装置20と計
算機システム30を通信ケーブル40で接続した構成を示し
ている。
このような構成によれば、パターン認識装置20と計算
機システム30との間の通信ケーブル40の接続または切り
離しを行うことで、下記に述べる(1)学習フエーズ、
(2)運用フエーズが容易に実現できる。
(1)学習フエーズ…これは、パターン認識装置20のア
プリケーシヨンに適したニユーラルネツトワークを学習
によつて構築するフエーズで、この場合はパターン認識
装置20と計算機システム30を通信ケーブル40で接続す
る。そして、ユーザーアプリケーシヨン10が作成した入
力データを基にパターン認識装置20内の学習データ作成
部5で学習データを作成し、作成した学習データを通信
部4−1から通信ケーブル40を介して計算機システム30
内の通信部4−2に転送する。通信部4−2は、送られ
てきた学習データをニユーラルネツトワーク管理部1−
2に送る。ニユーラルネツトワーク管理部1−2では、
学習データの管理を行うとともに学習データを学習部2
に供給する。学習部2で学習を行つた後決定した荷重係
数は、ニユーラルネツトワーク管理部1−2が通信部4
−2に転送する要求を発光することで通信ケーブル40を
介してパターン認識装置20に転送する。
(2)運用フエーズ…これは、通信ケーブル40を切り離
して、パターン認識装置20単体で(1)の学習フエーズ
で送られてきた荷重係数を用いてニユーラルネツトワー
クで想起、認識を行うフエーズである。
第1図の構成によれば、学習の高速化と実用システム
の低価格化を両立することができる。更に、第1図は、
パターン認識装置20と計算機システム30の1対1の接続
であるが、例えば、第2図に示すように1台の計算機シ
ステム30とn台のパターン認識装置20−1〜20−nを通
信ネツトワーク50で接続した大規模な機能分散システム
も構築することができる。
また、機能分散の方法も第1図の構成だけでなく、例
えば第3図(a)〜(c)の形態が考えられる。第3図
(a)は、第1図の構成において計算機システム30に更
に想起部3−1を追加したもので、計算機システム30で
も学習済みのニユーラルネツトワークを用いて想起が実
行できるようにしたものである。次に、第3図(b)
は、第1図のパターン認識装置20内にある想起部3を計
算機システム30側で実現した構成で、本構成では想起も
計算機システム30で実行してその結果のみをパターン認
識装置20に転送するものである。この構成では、計算機
システム30とパターン認識装置20を切り離すことはでき
ないが、学習及び想起の両処理の高速化が可能である。
最後に、第3図(c)は第1図の各部を1つのシステ
ム10にまとめたものである。
第1図,第2図及び第3図(a),(b)のシステム
形態を実現するため、例えば第4図に示すデータフオー
マツトに従つてパターン認識装置20と計算機システム30
はデータ交換を行う。第3図(c)についても、同様の
データフオーマツトで管理できる。
第4図で、制御情報としては例えば第5図に示すよう
にデータの種別、転送要求、受信要求及びパターン認識
装置に割付けられたアドレスなどが考えられる。また、
データ領域に格納されるデータとしては、例えば第6図
(a)〜(d)に示すような4種類のデータ構成が考え
られる。
第6図(a)は、データ領域に学習データを格納した
もので、第1図〜第3図のシステムに共通に用いられ
る。第6図(b)は、学習データにネツトワークの構造
情報を付加したもので、例えば第2図のように複数のア
プリケーシヨンを行うパターン認識装置20−1〜20−n
が共通の計算機システム30を使う場合に用いられ、この
とき計算機システム30はネツトワーク構造情報に基づい
てニユーラルネツトワークを構成し、一緒に送られてき
た学習データで学習する。
次に、第6図(c)は、(a),(b)の計算機シス
テム30が学習データで学習した後のニユーラルネツトワ
ークの荷重係数をパターン認識装置に転送する場合に用
いる。(b)の場合の転送先のパターン認識装置は、制
御情報に書かれたアドレスに一致するパターン認識装置
となる。
第6図(d)は、想起に必要な入力データを想起部に
転送する場合に用いる。
最後に、第6図(e)は、第3図(b)の構成の場合
のように第6図(d)で送られてきた入力データに基づ
いて想起した結果をパターン認識装置20に転送する場合
に用いる。
次に、第6図(a)〜(e)に示すデータで特に重要
なニユーラルネツトワークの構造情報や学習データをど
のように作成していくかについて、第1図のシステム構
成を例に以下説明する。
第1図で、パターン認識装置20及び計算機30の各シス
テムを管理するのが、ニユーラルネツトワーク管理部1
−1,1−2で、学習部2、想起部3、通信部4−1,4−2
及び学習データ作成部5を制御するとともに、ニユーラ
ルネツトワークの構造の編集や学習の進行状況などのモ
ニタリングなどマンマシンインターフエースの機能も対
話型に実行する。上述した機能を全てニユーラルネツト
ワーク管理部1−1及び1−2に実現する必要はなく、
例えばパターン認識装置20のニユーラルネツトワーク管
理部1−1には学習の進行状況のモニタリングは不要で
ある。しかし、機能をモジユール化しておくことで必要
な機能を取捨選択してニユーラルネツトワーク管理部1
−1,1−2を構成することができるため、以下では全て
の機能がニユーラルネツトワーク管理部1−1,1−2に
実現されている場合を基に説明する。また、以下ではパ
ターン認識装置20は画像認識装置を想定して説明する。
まず、ニユーラルネツトワーク管理部1−1,1−2の
動作の一例を第7図に示す。第7図で、 で示したS1,S3,S4,S6〜S11は、サブルーチン化された機
能モジユールである。以下、第7図の流れを参照して第
1図の各部の動作を説明する。
まず、第1図のシステムの起動指令(例えば、電源の
投入など)が発生すると、ニユーラルネツトワーク管理
部1−1,1−2は第7図の初期設定S1の処理を実行す
る。初期設定S1では、ワークエリアの確保、定数設定な
どの処理を行う。起動指令を受けたときは、終了ではな
いので次に初期画面表示設定処理S3を実行してオペレー
タからのコマンド入力待ち処理S4を行う。初期画面表示
設定処理S3で表示する初期画面の一例として第8図のよ
うな画面が考えられる。画面の上部に矩形のコマンド入
力覧を設け、これを複数に分割して編集、学習、想起あ
るいは終了など次に実行可能な機能を表示する。オペレ
ータは、これらの機能の1つを例えばマウスなどで選択
する。コマンド入力待ち処理S4で、オペレータが終了を
選択したことを検知すると、第1図のニユーラルネツト
ワーク管理部1−1,1−2は、第7図のS5の処理に示す
ように選択された機能に従つて各々の機能モジユールを
実行する。以下、「編集」,「学習」,「想起」の順に
第1図のシステムの動作を説明する。
まず、「編集」が選択されると、ニユーラルネツトワ
ーク管理部1−1,1−2は、編集モード画面表示処理S6
を表示し、例えば第9図に示すような編集モード画面を
表示する。第9図では、編集機能が選択されたことを表
わすためコマンド入力覧の斜線で示した編集の領域の色
を変えるあるいは白黒反転して表示している。そして、
編集モードで行える機能1.ネツトワーク編集,2.学習デ
ータ作成も同時に表示してある。ここに示した機能は、
ニユーラルネツトワークの構造や学習データの作成など
アプリケーシヨン毎に適したニユーラルネツトワーク構
造を構築していく上で必要な機能を上位概念でまとめて
列挙したものであり、何らこれにこだわるものではな
い。例えば、1.ネツトワーク編集,2.学習データ作成を
構成する下位の機能をそのまま表示してもよい。
この「編集」で定義されたニユーラルネツトワークの
構造(層数、層毎のニユーロン数など)や学習データな
どは、第1図のニユーラルネツトワーク管理部1−1,1
−2の管理下に置れ、学習部2,想起部3,通信部4−1,4
−2に供給される。
このニユーラルネツトワークの構造を定義する情報及
び学習データのフオーマツトとしては、例えば第10図及
び第11図に示すものが考えられる。第10図は、ニユーラ
ルネツトワークの構造情報を示したもので、C1は第10図
の構造を持つニユーラルネツトワークの名称を定義する
もので、第8図のコマンド入力覧の「編集」,「学
習」,「想起」は全てこのニユーラルネツトワーク名称
に基づいて行われる。C2は、構築するニユーラルネツト
ワークの型を定義する領域で、ランメルハート型、ポツ
プフイールド型などを指定する。C3は、誤差逆伝播(バ
ツクプロパゲージヨン)による学習演算の繰り返し回数
の上限値を設定する領域である。C4及びC5は、バツクプ
ロパゲーシヨンに使われる学習定数、安定化定数を設定
する領域で、学習定数、安定化定数は文献(合原一幸
著:ニユーラルコンピユータ東京電機大学出版局)p.11
3に記載のニユーロン間の荷重係数の修正量Δωij VN-1
を表わす式、 で、η(学習定数)及びα(安定化定数)に相当する。
式(1)〜式(4)で、Δωij NN-1は第(N−1)層の
第jニユーロンと第N層の第iニユーロンとの結合の荷
重係数の修正量を、δi Nは第N層第iニユーロンの学習
信号を、xj N-1は第(N−1)層の第jニユーロンの出
力データを、δi Oは出力層の学習信号を、tiは出力層の
第iニユーロンに対する教師データを、Oiは出力層第i
ニユーロンの出力データを、fiはニユーロンの出力値関
数((5)式ではシグモイド関数)を示したf′はそ
の微分値を、θi Nは第N層第iニユーロンのしきい値
を、それぞれ表わす。
また、第10図のC6は、ニユーロン間の荷重係数の初期
値の設定方法を指定する領域で、C7に設定した荷重係数
を全ての荷重係数の初期値とするかあるいはこれらを乱
数で発生させるかなどを指定する。C8は、式(3)中の
しきい値(θi N)を指定する領域で、ここでは全てのニ
ユーロンのしきい値を同一として扱つているが、各ニユ
ーロン毎のしきい値を設定できるようにしてもよい。C9
は、ニユーラルネツトワークの学習の収束を判定する条
件値を設定する領域で、例えばニユーラルネツトワーク
の出力データと教師データとの2乗誤差あるいはエネル
ギーが指定された条件値より小さくなつたとき収束した
と判断するというように用いる、C10〜C19は、ニユーラ
ルネツトワークの構造を指定する領域で、ニユーラルネ
ツトワークの層数及び各層毎のニユーロン数を指定す
る。そして、C2のネツトワークの型で、ラメルハート型
が指定された場合は、第1層が入力層、第2層以降が中
間層となり層数C10で指定した層数、例えば3層なら第
3層が、5層なら第5層が出力層となり、第1層と第2
層,第2層と第3層のように、第N層と第(N+1)層
のニユーロン間にのみ結合が付与される。一方、ネツト
ワークの型で、ホツプフイールド型が指定された場合
は、層毎のニユーロン間だけでなく層内のニユーロン間
にも結合が付与される。
次に、第11図は学習データのフオーマツトと複数の学
習データを管理するためのテーブル構造を示している。
第11図で、T1は学習を行うニユーラルネツトワークの名
称を指定する領域である。従つて、そのニユーラルネツ
トワークの構造を同一のニユーラルネツトワーク名称で
第10図のフオーマツトで定義しておく必要がある。T
2は、第11図のテーブルに接続されている学習データの
個数が設定される領域で、学習データの接続や個数の更
新はシステムが行う。T3及びT4は、ラメルハート型のニ
ユーラルネツトワークの入力層及び出力層のニユーロン
の個数を設定する領域で、これらの値は第10図のニユー
ラルネツトワーク構造情報からシステムがコピーする。
T3及びT4の値を用いて、学習データiの格納場所を求め
ることができる。
第10図のニユーラルネツトワーク構造情報及び第11図
の学習データの作成方法を、以下に示す。
まず、第10図のニユーラルネツトワーク構造情報の作
成方法を説明する。この情報は、第9図の「1.ネツトワ
ーク編集」機能を実行することにより作成される。「1.
ネツトワーク編集」機能の選択は、マウスあるいはキー
ボードより行う。本機能が選択されると、例えば第12図
に示す画面を表示する。第12図ではコマンド入力欄の空
白部に「1.ネツトワーク編集」を表示し、階層構造化さ
れたシステムの中でのオペレータの置かれた環境把握の
一助としている。このとき、ネツトワーク名称、入力モ
ード及びプリントアウトの問い合わせを行う。ここでネ
ツトワーク名称欄には編集の対象とするネツトワーク名
を入力する。入力モードで、「キーボード」が選択され
ると新規ネツトワークの作成と見なされ、「フアイル」
が選択されるとフアイルの記録媒体6(ハードデイス
ク、フロツピーデイスク)に記録されているネツトワー
ク構造情報の中から「ネツトワーク名称」の欄に指定さ
れた名称に一致するネツトワーク情報を捜す。また、
「入力モード」で外部装置が選択されると、第1図に示
すシステムと同様な機能を持つた他システムからネツト
ワーク構造情報を入力する。
編集が終了したネツトワーク構造情報のプリント出力
の選択もできる。ネツトワーク表示を「する」を選択す
ると作成したネツトワーク構造情報にもとづいてネツト
ワークを表示できる。
このように、「ネツトワーク名称」,「入力モー
ド」,「プリント出力」、及び「ネツトワーク表示」の
設定が終了したあと、コマンド欄の「実行」を選択する
と、第12図の枠内に第10図に示すネツトワーク構造情報
の各項目を表示し、既に各項目にデータが設定されてい
る場合はその内容も表示する。その後、各項目を修正す
ることができる。ここで、「ネツトワーク表示」で「す
る」を選択してある場合、入力されたネツトワーク構造
情報に基づいて第13図(a)に示すようにネツトワーク
を表示することができる。更に、拡大コマンドを選択す
ると例えばマウスで指定された部分の拡大表示(第13図
(b))することができ、このとき、ニユーロン間の荷
重係数やニユーロンのしきい値などを修正することがで
きる。第13図(b)では、ニユーロンが属する層番号
(i,i+1)と層内の番号(k,j)を表示するようにして
いる。
編集が終了した場合は、「終了」を選択することで第
9図の編集モード初期画面に戻る。このとき、「プリン
ト出力」で「する」を選択してある場合は、編集対象に
したネツトワーク構造情報をプリント出力する。
次に、学習データの作成方法について説明する。学習
データの作成は、第9図の編集モード初期画面で「学習
データ作成」を選択することにより行われる。但し、第
1図では学習データ作成機能が動作するのは画像認識装
置20側だけである。学習データの作成」機能の選択は、
マウスあるいはキーボードより行う。本機能が選択され
ると、例えば第14図に示す画面を表示する。第14図の画
面においても第12図と同様にコマンド入力欄の空白部に
「2.学習データ作成」を表示し、階層構造化されたシス
テムの中でのオペレータの置かれた環境把握の一助とし
ている。
また、このとき「ニユーラルネツトワーク名称」、
「入力モード」及び「プリント出力」のメニユーを表示
して、オペレータの入力を促す。ここで、「ニユーラル
ネツトワーク名称」に入力する名称は、学習の対象とな
るニユーラルネツトワークの名称で既にネツトワークの
構造情報が定義されている必要がある。次に、「入力モ
ード」ではキーボードから入力して学習データを作成す
るかあるいはユーザアプリケーシヨンで作成した学習デ
ータを入力するかを選択する。このユーザアプリケーシ
ヨン(ここでは画像処理)による学習データ作成の一例
を第15図に示す。
第15図(a)はユーザーアプリケーシヨン10の構成と
ニユーラルネツトワーク管理部1−1との接続方法の一
例を示した図である。ユーザーアプリケーシヨン10は入
力データ作成部101と認識105から成り、これらはニユー
ラルネツトワーク管理部1−1と共通テーブル(入力デ
ータテーブル200と想起結果テーブル201)を介して接続
するようにしている。
入力データテーブル200や想起結果テーブル201は、学
習データ作成部5や想起部3からアクセスできる。第15
図(b)は、自動車のナンバーから入力データを作成す
る例で、まず、前処理102でナンバープレートを抽出し
て各ナンバーを切り出す、次に切り出されたナンバーか
ら特徴抽出103で特徴量を抽出する。本入力データ作成
部101の特長は、前処理102で切り出したナンバーの画像
データ(2値画像、濃淡画像)やナンバーから抽出した
特徴量だけでなくこれらを混合したデータを入力データ
にできることである。作成した入力データは、ニユーラ
ルネツトワーク管理部1−1内の入力データテーブル20
0に格納されて学習データ作成部5に渡される。学習デ
ータ作成部5で、この入力データに教師データ(オペレ
ータから与えられる)を追加して学習データとして第11
図のように登録する。
また、作成した学習データを第11図に示すフオーマツ
トでプリント出力することもできる。
このように「ニユーラルネツトワーク名称」、「入力
モード」及び「プリント出力」の各項目について説明し
た後、コマンド入力欄の「実行」を選択すると第14図の
画面の中央部の枠内に示すように第11図の学習データテ
ーブルの内容が表示される。枠内の左側にはネツトワー
ク名称、現在の学習データの個数、入力層ニユーロン数
及び出力層ニユーロン数が表示され、右側には既に作成
された学習データの内容とその番号及び新規作成する学
習データを入力するための入力エリアを表示する。これ
らの学習データは、上下方向に任意にスクロールでき、
任意の学習データ番号の学習データの内容を確認するこ
とができる。
ところで、画像認識は通常、次の2つの方式が用いら
れる。すなわち、 (1)認識対象の2次元配列された画像データを標準パ
ターンとして用意し、この標準パターンと入力画像とを
比較し、最も類似度の高い標準パターンを認識結果とす
るパターンマツチング方式 (2)認識対象の画像から、認識対象の特徴量(例え
ば、濃度頻度分布、面積、周囲長、傾き、など)を抽出
し、これらの特徴量から判別木を用いた認識あるいは特
徴軸空間にマツピングして標準パターンとの距離を計算
して最小距離の標準パターンを認識結果とする特徴量方
式 である。一方、ニユーラルネツトワークは、入力層の入
力ニユーロンに2次元配列の画像データを入力すること
によりパターンマツチング方式として動作し、また、特
徴量を入力することにより特徴量方式として動作する。
すなわち、ニユーラルネツトワークは、パターンマツチ
ング方式と特徴量方式の両者の認識方式を合わせ持つと
いう性質を有する。したがつて、この性質を利用して、
ニユーラルネツトワークに2次元配列の画像データと特
徴量を混合したデータを入力することにより、特徴量で
大局的に判断し画像データで局所的に判断して認識する
ことができる。そのため、第1図の学習データ作成部5
に第15図に示すような学習データ作成機構を設ける。第
15図で、100は認識対象(この例では数字)を含んだ入
力画像、101は学習データ作成部である。学習データ作
成部101は、画像の前処理102、特徴抽出103及び混合104
の各機能から成る。
例えば、第15図の入力画像100に対しては次のように
処理されて学習データが作成される。まず、前処理102
を行つて入力画像100から数字のみの画像を作成し、次
に、その画像から特徴抽出103により各数字毎の特徴量
を抽出する。その後、オペレータが指定した制御指令に
基づいて、前処理102で得られた画像データのみ、特徴
抽出103で得られた特徴量のみ、あるいは両者を混合し
たデータを混合部104で選択して出力し、このデータと
オペレータより与えられる教師データを対にして学習デ
ータを作成する。
学習データの作成が終了した後、第14図のコマンド入
力欄の「転送」を選択すると作成した学習データとネツ
トワーク名称、入力層ニユーロン数、出力層ニユーロン
数などの情報を合わせて計算機システム30に転送する。
次に、第8図の初期画面で「学習」を選択すると例え
ば第16図に示すような画面が表示される。ここで、学習
対象のニユーラルネツトワークの名称と学習データの番
号を入力して、コマンド入力欄の「実行」あるいは「再
実行」を選択することで学習が実行される。学習データ
の番号は、複数個指定することができる。「実行」ある
いは「再実行」のコマンドの違いは、学習対象ニユーラ
ルネツトワークのニユーロン間の荷重係数の初期値とし
て次のどれを選ぶかを切り換えることである。
(1) 「実行」…ニユーラルネツトワーク編集で指定
した初期荷重係数設定方法に従つて設定された初期値を
用いる。
(2) 「再実行」…「実行」あるいは「再実行」で学
習して修正された荷重係数を初期値として用いる。
「実行」コマンドを設けたことにより、同一初期荷重
係数を用いて、学習定数、安定化定数などの条件を変え
た場合のニユーラルネツトワークを比較評価することが
できる。
また、学習終了後のニユーラルネツトワークの表示、
学習後の荷重係数のプリント出力及び荷重係数の変化状
態のグラフ表示を制御できる。ニユーラルネツトワーク
を表示した場合は、第13図のように表示され、このとき
ニユーロンの興奮の度合や荷重係数の値に応じて色や濃
淡で表示し、また、興奮度合い及び荷重係数の値の大き
いニユーロンやニユーロン間の接続線をブリンク表示す
る。
コマンド入力欄の「格納」を選択すると学習が終了し
たニユーラルネツトワークの荷重係数をフアイルに退避
すると同時に画像認識装置20に転送する。「終了」を選
択すると「学習」モードを終了して、第8図の初期画面
に戻る。
最後に、第8図の初期画面でコマンド入力欄の「想
起」を選択すると、例えば第17図に示すような画面が表
示される。但し、「想起」を実行するときは、画像認識
装置20にニユーラルネツトワークの荷重係数が転送され
ている必要がある。
想起を行うのに用いるニユーラルネツトワーク名称を
指定し、次に「モード」としてニユーラルネツトワーク
の入力データとしてユーザアプリケーシヨンで作成する
かあるいは既に作成した学習データの中の入力データを
用いるかを選択する。その後、コマンド入力欄の「実
行」を選択するとモードで指定された入力データを用い
て想起の処理が実行され、想起結果が「結果ウインド
ウ」欄に表示される。このとき、「結果のプリント出
力」で「する」が選択されている場合は、想起結果を画
面表示だけでなくプリント出力する。また、「ネツトワ
ーク表示」で「する」が選択されている場合は、第13図
に示すようにニユーラルネツトワークが表示され、学習
時と同様にニユーロンの興奮の度合いに応じて色あるい
は濃淡で表示するとともにブリンク表示する。
本実施例によれば、マンマシン性よくニユーラルネツ
トワークの構築、評価ができる学習環境と、想起結果を
ビジユアルに確認できる実用システムを簡単に構成する
ことができる。
次に、本実施例の−応用として、自動車のナンバー認
識システムの構成を第18図に示す。第18図で、20は画像
認識装置、30はワークステーシヨン、7はTVカメラ、10
は自動車のナンバー認識を行うユーザアプリケーシヨン
である。ユーザアプリケーシヨン10は、前処理102、特
徴抽出103と認識105の3つの手段で構成される。第18図
のシステムの処理は、2つのフエーズに従つて実行され
る。まず、ニユーラルネツトワークで学習する学習フエ
ーズでは、第18図の実線矢印 に従つて処理され、次に、自動車のナンバ認識をオンラ
インで処理する運用フエーズでは、第18図の破線の矢印 に従つて処理される。
学習フエーズでは、TVカメラ7で撮影した画像をユー
ザアプリケーシヨン10で前処理102と特徴抽出103を行つ
て、ナンバープレートからナンバーの切り出し及びその
ナンバーの特徴量を抽出する。そして、その特徴量を学
習データとしてワークステーシヨン30に通信ケーブル40
を介して転送する。ワークステーシヨン30は、転送され
てきた学習データを用いて学習2を実行する。学習が終
了した後、荷重係数を画像認識装置20に転送する。
次に、運用フエーズでは、ワークステーシヨン30を切
り離し、画像認識装置20単独で次のように動作する。TV
カメラ7で撮影した画像をユーザーアプリケーシヨン10
で処理して、ナンバーの特徴量を抽出し、第15図(a)
の入力データテーブル200に格納して想起部3に渡す。
想起部3では先に転送されてきた荷重係数を基に想起を
行い、各出力ニユーロンの出力値を想起結果テーブルに
格納する。
そして、認識105でその想起結果テーブル201を参照し
ても最も大きい値を出力したニユーロンから各カテゴリ
ー(本例では‘0'〜‘9')に分類する。この様子を第19
図に示す。第19図では入力層、中間層及び出力層の3層
から成るニユーラルネツトワークで学習した後、そのニ
ユーラルネツトワークを用いてナンバープレート内のナ
ンバー‘7'の画像から抽出した特徴量で想起3を行つた
ところであり、出力層の‘7'のニユーロンが最大の出力
値を出して興奮している。
第18図のシステムによれば、認識対象すなわち自動車
のナンバーから抽出した特徴量を学習データとしている
ため、ナンバーの2次元配列された画像データ(2値画
像データ、濃淡画像データ)を学習データとして用いる
場合に比べてニユーラルネツトワークを構成するニユー
ロン数を少なくできるため、学習の時間や想起の時間を
高速化できる効果がある。
しかし、2次元配列された画像データを学習データと
して用いると、学習、想起の時間は長くなるが、上記で
述べた特徴量に何を用いるかを考えなくてもよいという
効果があるため、第18図のシステムで学習データ作成部
5の前処理103で切り出したナンバーの画像データ(2
値画像データ、濃淡画像データ)を学習データとする構
成も考えられる。
〔発明の効果〕
本発明によれば、アプリケーション毎に異なる学習デ
ータを容易に作成、及びニユーラルネツトワークに入力
でき、学習が実行でき、かつ、実用システムへの移行も
容易なニューラルネットを用いた画像認識システムを提
供することができる。
【図面の簡単な説明】
第1図は本発明の一実施例を表わすシステム構成図、第
2図は本発明を大規化したシステム構成図、第3図は本
発明の他の実施例を表わすシステム構成図、第4図は本
発明で用いるデータフオーマツトを表わす図、第5図は
第4図の制御情報の内容の一例を示す図、第6図は第5
図の具体例を示す図、第7図は本発明の動作フローチヤ
ートを表わす図、第8図は本発明を起動したときの初期
画面を表わす図、第9図は第8図の編集モードの初期画
面を表わす図、第10図は本発明で用いるニユーラルネツ
トワークの構成情報を示す図、第11図は本発明で用いる
学習データのフオーマツトを表わす図、第12図はニユー
ラルネツトワーク編集モードの画面を表わす図、第13図
はニユーラルネツトワークの表示例を示す図、第14図は
学習データ作成モードの画面を示す図、第15図はユーザ
アプリケーシヨンの例を示す図、第16図は学習モードの
画面を示す図、第17図は想起モードの画面を示す図、第
18図は本発明を自動車のナンバー認識に応用したときの
システム構成を表わす図、第19図は第18図のシステムで
ナンバー‘7'を想起している様子を示す図である。 1−1,1−2……ニユーラルネツトワーク管理部、2…
…学習部、3……想起部、4−1,4−2……通信部、5
……学習データ作成部、20……パターン認識装置、30…
…計算機システム、40……通信ケーブル。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 高藤 政雄 茨城県日立市久慈町4026番地 株式会社 日立製作所日立研究所内 (72)発明者 浅田 和佳 茨城県日立市大みか町5丁目2番1号 株式会社日立製作所大みか工場内 (72)発明者 田中 紀夫 茨城県日立市大みか町5丁目2番1号 株式会社日立製作所大みか工場内 (72)発明者 北村 忠明 茨城県日立市久慈町4026番地 株式会社 日立製作所日立研究所内 (72)発明者 菊地 邦行 茨城県日立市大みか町5丁目2番1号 株式会社日立製作所大みか工場内 (56)参考文献 特開 平1−116869(JP,A) 特開 昭62−73391(JP,A)

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】少なくともニューラルネットワークが学習
    するための学習データを作成する学習データ作成手段
    と、前記学習データにより学習を終了した前記ニューラ
    ルネットワークを用いて、ある入力データから出力デー
    タを出力する想起手段とを有して画像認識を行う画像認
    識装置と、 少なくとも前記学習データ作成手段により作成された学
    習データを用いて、学習を実行する学習手段を有する演
    算装置と、 前記画像認識装置及び前記演算装置間での相互通信を可
    能とする通信手段と、 少なくとも前記学習または想起に用いたニューラルネッ
    トワークの構成を表示する表示手段とを有し、 前記表示手段によって表示されたニューラルネットワー
    クの構成の所定の部分を拡大表示する拡大表示手段と、
    少なくとも前記拡大表示されたニューラルネットワーク
    に対してニューロンのしきい値の修正、ニューロン間の
    荷重係数の修正及びニューロン間の接続の切断のうち一
    を実行するニューラルネットワーク修正手段を有するこ
    とを特徴とするニューラルネットを用いた画像認識シス
    テム。
  2. 【請求項2】少なくともニューラルネットワークが学習
    するための学習データを作成する学習データ作成手段
    と、前記学習データにより学習を終了した前記ニューラ
    ルネットワークを用いて、ある入力データから出力デー
    タを出力する想起手段とを有して画像認識を行う画像認
    識装置と、 少なくとも前記学習データ作成手段により作成された学
    習データを用いて、学習を実行する学習手段を有する演
    算装置と、 前記画像認識装置及び前記演算装置間での相互通信を可
    能とする通信手段と、 少なくとも前記学習または想起に用いたニューラルネッ
    トワークの構成を表示する表示手段とを有し、 少なくともニューロンの興奮の度合いに応じて色または
    明るさを変化させて表示する手段及び前記興奮の度合い
    の大きいニューロンをブリンク表示する表示手段のうち
    一方を有することを特徴とするニューラルネットを用い
    た画像認識システム。
  3. 【請求項3】少なくともニューラルネットワークが学習
    するための学習データを作成する学習データ作成手段
    と、前記学習データにより学習を終了した前記ニューラ
    ルネットワークを用いて、ある入力データから出力デー
    タを出力する想起手段とを有して画像認識を行う画像認
    識装置と、 少なくとも前記学習データ作成手段により作成された学
    習データを用いて、学習を実行する学習手段を有する演
    算装置と、 前記画像認識装置及び前記演算装置間での相互通信を可
    能とする通信手段とを有する画像認識システムであっ
    て、 前記画像認識装置は、入力データを作成する入力データ
    作成手段及び前記想起手段による想起結果を用いて認識
    を行う認識手段とから成るユーザアプリケーションと、
    前記ユーザアプリケーションと前記学習データ作成手段
    及び前記想起手段との接続を可能とするインターフェー
    ス手段とを有し、 ナンバープレートを含む自動車を撮影しその画像を入力
    する撮影手段と、前記ユーザアプリケーション内に、前
    記撮影手段により入力された画像からナンバープレート
    を抽出し、この抽出したナンバープレートからナンバー
    を切り出す前処理手段と、前記前処理手段により切り出
    されたナンバーから特徴量を抽出する特徴抽出手段とを
    設け、 前記特徴抽出手段により抽出された特徴量を用いて前記
    学習手段により学習し、且つ前記抽出された特徴量を用
    いて前記想起手段により想起することを特徴とするニュ
    ーラルネットを用いた画像認識システム。
  4. 【請求項4】少なくともニューラルネットワークが学習
    するための学習データを作成する学習データ作成手段
    と、前記学習データにより学習を終了した前記ニューラ
    ルネットワークを用いて、ある入力データから出力デー
    タを出力する想起手段とを有して画像認識を行う画像認
    識装置と、 少なくとも前記学習データ作成手段により作成された学
    習データを用いて、学習を実行する学習手段を有する演
    算装置と、 前記画像認識装置及び前記演算装置間での相互通信を可
    能とする通信手段とを有する画像認識システムであっ
    て、 前記画像認識装置は、入力データを作成する入力データ
    作成手段及び前記想起手段による想起結果を用いて認識
    を行う認識手段とから成るユーザアプリケーションと、
    前記ユーザアプリケーションと前記学習データ作成手段
    及び前記想起手段との接続を可能とするインターフェー
    ス手段とを有し、 ナンバープレートを含む自動車を撮影しその画像を入力
    する撮影手段と、前記ユーザアプリケーション内に、前
    記撮影手段により入力された画像からナンバープレート
    を抽出し、この抽出したナンバープレートからナンバー
    を切り出す前処理手段を設け、前記前処理手段による切
    り出されたナンバーの2次元配列データを用いて前記学
    習手段により学習し、且つ前記切り出されたナンバーの
    2次元配列データを用いて前記想起手段により想起する
    ことを特徴とするニューラルネットを用いた画像認識シ
    ステム。
JP1166675A 1989-06-30 1989-06-30 ニューラルネットを用いた画像認識システム Expired - Fee Related JP2691022B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP1166675A JP2691022B2 (ja) 1989-06-30 1989-06-30 ニューラルネットを用いた画像認識システム
US07/544,870 US5086479A (en) 1989-06-30 1990-06-28 Information processing system using neural network learning function
US07/774,887 US5295197A (en) 1989-06-30 1991-10-11 Information processing system using neural network learning function

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1166675A JP2691022B2 (ja) 1989-06-30 1989-06-30 ニューラルネットを用いた画像認識システム

Publications (2)

Publication Number Publication Date
JPH0333968A JPH0333968A (ja) 1991-02-14
JP2691022B2 true JP2691022B2 (ja) 1997-12-17

Family

ID=15835641

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1166675A Expired - Fee Related JP2691022B2 (ja) 1989-06-30 1989-06-30 ニューラルネットを用いた画像認識システム

Country Status (1)

Country Link
JP (1) JP2691022B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4513796B2 (ja) * 2006-10-12 2010-07-28 パナソニック電工株式会社 異常監視装置
JP5115390B2 (ja) * 2008-08-04 2013-01-09 住友電気工業株式会社 移動体識別装置、コンピュータプログラム及び移動体識別装置の学習方法
US20150100531A1 (en) * 2013-10-09 2015-04-09 Qualcomm Incorporated Method and apparatus to control and monitor neural model execution remotely
JP6516025B2 (ja) * 2016-02-12 2019-05-22 ソニー株式会社 情報処理方法および情報処理装置
JP7207309B2 (ja) * 2017-08-16 2023-01-18 ソニーグループ株式会社 プログラム、情報処理方法、および情報処理装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6273391A (ja) * 1985-09-27 1987-04-04 Toshiba Corp パタ−ン認識学習装置
JPH0752439B2 (ja) * 1987-10-30 1995-06-05 日本電気株式会社 ダイナミックプログラミング機能を有するニューラルネットワーク

Also Published As

Publication number Publication date
JPH0333968A (ja) 1991-02-14

Similar Documents

Publication Publication Date Title
US5086479A (en) Information processing system using neural network learning function
US5874955A (en) Interactive rule based system with selection feedback that parameterizes rules to constrain choices for multiple operations
WO2020092308A1 (en) Refinement of machine learning engines for automatically generating component-based user interfaces
WO2003104960A2 (en) Temporary communication areas for a computer user interface
Runde et al. Software support for building automation requirements engineering—An application of semantic web technologies in automation
US7287233B2 (en) Minimization function for a computer user interface
JPH1115895A (ja) データ表示装置、データ表示方法、およびデータ表示用プログラムを記録した記録媒体
US20040046797A1 (en) Systems and methods for navigating and displaying print job exception information in a printer system
US6446054B1 (en) Fuzzy inference system or adaptive neuro-fuzzy inference system, and intelligent agent for the dynamic generation and retrieval of user interface software modules
CN110853117A (zh) 图表绘制方法、装置、设备及存储介质
JP2691022B2 (ja) ニューラルネットを用いた画像認識システム
CN116128254A (zh) 基于边缘计算的嵌入式智能制造资源配置方法及终端系统
CN115115745A (zh) 自主创作型的数字艺术的生成方法、系统、存储介质及电子设备
CN110991279A (zh) 文档图像分析与识别方法及系统
JPH08123913A (ja) 情報処理方法
Glez-Morcillo et al. Gaudii: An automated graphic design expert system
DE102023202593A1 (de) Verfahren und System zum Empfehlen von Modulen für ein Engineering-Projekt
JPH06266688A (ja) 大規模情報認識回路
CN113722577A (zh) 反馈信息的处理方法、装置、设备以及存储介质
JPH10283379A (ja) 設計支援方法及び装置
JPH04190461A (ja) ニューラルネットワークの構築表示方法
CN108765508A (zh) 一种基于分层的Art Deco风格图案快速生成方法
US20230274478A1 (en) Neural image compositing with layout transformers
JP3819313B2 (ja) システム構築装置
JPH0762842B2 (ja) 文書管理装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070829

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080829

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees