JPH0478972A - 濃淡画像識別装置 - Google Patents

濃淡画像識別装置

Info

Publication number
JPH0478972A
JPH0478972A JP2192964A JP19296490A JPH0478972A JP H0478972 A JPH0478972 A JP H0478972A JP 2192964 A JP2192964 A JP 2192964A JP 19296490 A JP19296490 A JP 19296490A JP H0478972 A JPH0478972 A JP H0478972A
Authority
JP
Japan
Prior art keywords
picture
image
gradation
layer
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2192964A
Other languages
English (en)
Inventor
Makoto Kosugi
小杉 信
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2192964A priority Critical patent/JPH0478972A/ja
Publication of JPH0478972A publication Critical patent/JPH0478972A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] この発明は、神経回路網を用いて従来の逐次処理方式で
は困難であった画像認識や視覚情報処理などを実現する
濃淡画像識別装置に関するものである。
[従来の技術] 神経回路網は生体の神経素子を模したもので、多数の入
力をしきい値処理し多数へ出力する人工的神経素子を多
数結合することにより、新しい並列処理を実現すること
ができる。この神経回路網を画像処理に適用することが
試みられている。
画像処理応用の代表例は、画像認識(パターン認識)で
あり、これは画像から適切な特徴を抽出して画像を識別
するものである。
具体的には、数字や文字認識、あるいは飛行機などの目
標探知などの例がある。この場合、画像の形状的な線分
特徴がフィルタなどにより事前に抽出され、神経回路網
に入力される。神経回路網はこれらの特徴の組合わせと
して対象を識別する。この方法は、膨大な画像データが
事前の処理により比較的少量の特徴データ群に置き換え
られる長所がある。
また、濃淡画像を事前に2値化し、これを神経回路網に
入力することにより、神経回路網は何らかの形状的特徴
を自動的に抽出して対象を識別する方法がある。
[発明が解決しようとする課題〕 従来の事前に線分を抽出する方法では、フィルタ処理に
より線分を抽出するが、まだ万能なフィルタ技術がな(
、通常無駄な線分がでたり、逆に必要な線分が抽出され
ない場合が応々にしである。これは、対象画像の濃淡分
布に偏りがなく、かつピントがあっている場合において
さえであり、濃淡に偏りがあったりピントがぼけている
ものについては、線分抽出はほとんど困難となる欠点が
ある。
一方、濃淡画像を事前に2値化する方法では、例えば5
00X500画素のモノクロ画像では250000x8
ビツトの画像データ量を1/8に低減することができる
が、それでも神経回路網の人力層のユニット数は250
000個という大きな数が必要となる。このため、中間
層や出力層との組合わせ数はさらに膨大となり、大規模
なハードウェアと大きな処理時間を必要とする欠点があ
る。さらに、形状特徴の自動抽出のため、原画は濃淡に
偏りのないこと、ピントのあっていることが必要不可欠
な条件となる難点がある。
そこで、この発明の目的は、上述の問題点を克服し、濃
淡画像を少ないデータ量で表現し、かつ、少ない計算量
で所望の画像識別を可能とする濃淡画像識別装置を提供
することにある。
ところで、カラー画像は、通常、赤(R)、緑(G)、
青(B)の3原色に分離でき、分離後は各色ごとにモノ
クロ多値画像、すなわち、濃淡画像として扱うことがで
きることから、以下では濃淡画像で代表する事とする。
[課題を解決するための手段] この発明にかかる濃淡画像識別装置は、入力すべき画像
の位置とサイズを決定して画像を切り出す画像切り出し
手段と、切り出された画像をあらかじめ定められた複数
のブロックに分割し、各ブロックごとに濃度の代表値を
算出する画像ブロック化手段と、各代表値を入力とし識
別すべき画像ごとに特定の識別信号を教師信号とする神
経回路網とを有するものである。
[作用] この発明においては、濃淡画像をあらかじめ定めた複数
のブロックに分割し、各ブロック毎にブロック内の画素
の代表値を算出する。例えば500X500画素で、か
つ各画素が8ビツトで表される濃淡画像を縦横各20に
分割した場合、当該画像は20x20=400個×8ビ
ット=400バイトの代表データで表現される。これは
400字分のデータと同数である。
次にこれらの代表データを、例えば入力層のユニット数
は濃淡画像の分割ブロック数(上記の例では400) 
、出力層のユニット数は識別すべき画像の数、中間層(
隠れ層)は、例えば出力層ユニットの半分程度からなる
層状神経回路網に入力する。学習時の教師信号として、
識別すべき画像ごとに特定の識別信号を与える。学習が
終了すると、中間層には代表データ群による画像の識別
に必要な特徴が自動的に形成される。
C実施例〕 第1図はこの発明の一実施例のブロック図である。第2
図は画像のブロック化を説明するための図である。ここ
では、前述のとおり、モノクロ多値画像、すなわち、濃
淡画像を対象に説明する。
画像入力装置1はビデオカメラあるいはスキャナなどで
あり、第2図(a)のように、画像Pの中心○等があら
かじめ指定された場所となるよう位置合わせをして濃淡
画像を取り込み、これを画像ブロック化装置2へ送る。
画像ブロック化装置2はこの濃淡画像から、第2図(a
)のように、あらかじめ対象によって定められたサイズ
の領域を切り出す。なお、限られた対象であれば画像の
中心の自動検出が可能な場合もあり、このとき中心等の
位置合わせは画像入力装置1ではなく、画像ブロック化
装置2で自動化してもよく、要は画像切り出し手段があ
ればよい。
次に、この発明の画像ブロック化手段としての画像ブロ
ック化装置2は、上記のごと(切り出した濃淡画像を第
2図(b)のようにあらかじめ定められたブロック数(
縦の数と横の数の積)Nに分割し、さらに、各ブロック
ごとに代表値を算出する。代表値の算出法としては、ブ
ロック内の全画素の値の平均値としたり、ブロック内の
中心を最大とする2次元のガウス関数やラプラシアンガ
ウシアン関数、ガボール関数などによる重み付は算出法
など種々ある。こうして、画像ブロック化装置2は各ブ
ロックごとに代表値を算出すると、その結果を神経回路
網3に送出する。
なお、画像ブロック化装置2は前述したとおり画像入力
装置1の機能を持つことがあるので、画像人力装置1と
画像ブロック化装置2とを合わせて画像切り出し手段と
画像ブロック化手段を備えていればよい。
神経回路網3は第3図に示すように、例えば、少なくと
も入力層4.中間層5.出力層6の3層以上からなる層
状神経回路網である。入力層4は前記で分割されたブロ
ックの数と同数Nのユニット41を有しており、出力層
6は識別すべき画像の数りと同数の出力層ユニット61
を有している。ただし、識別すべき画像の数を符号化す
ることにより、出力層6のユニット数を低減することも
可能である。中間層5は必要に応じて複数の層をとりつ
るが、ここでは1層で、かつM個ユニット51の場合に
ついて説明する。
入力層4の各ユニット41から中間層5の各ユニット5
1へはすべて重みWih42を介して結合されており、
同様に、中間層5の各ユニット51から出力層6の各ユ
ニット61へはすべて重みWh052を介して結合され
ている。
画像ブロック化装置2から送り出された画像のブロック
の代表値■、は、それぞれ入力層4の対応する各ユニッ
ト41に入力される。さらに、各人カニニットからの出
力は、それぞれ重みWih42を乗じて中間層5の中間
層ユニット51に集められる。すなわち、中間層5の各
ユニット51の値HnetJは第 (1)式のように算
出される。
HnetJ=Σ  W ih、 、   I 、−−(
1)さらに、中間層5の各ユニット51は第 (2)式
のように、ロジスティック関数などの非線形の入出力関
数f (Hnet、−〇h)により出力する。
穀に、HnetJが適切なしきい値θ。以上であればオ
ンとし、そうでなければオフとなる。
HJ =f4(HnetJ−θh) =fJ(孟8、Wih、I+−〇h)・・・・・・(2
)同様に、中間層5の各ユニット51からの出力H8は
、それぞれ重みWho52を乗じて出力層6の出力層ユ
ニット61に集められる。さらに、各ユニット61は第
 (3)式のように、中間層5の全ユニット51からの
出力を加算しく OnetJ)て、しきい値θ。との差
をとり非線形関数fにより出力する。
0、、=f、(OneJ−〇。) =f、(Σ W ha、、 i H+−θol  −・
−(3)この結果、出力層6の各ユニット61はブロッ
クの代表値で表現された画像に対し出力値を算出し、結
果を学習制御装置7に送出する。
出力層6の各出力層ユニット61はそれぞれ識別すべき
画像に対応しており、あらかじめ定めた出力層ユニット
61のみ入力画像に反応するよう神経回路網3の全ての
重み42.52を調整する必要がある。このため、学習
制御装置7は、画像入力装置1等から転送された望まし
い値と出力層6から転送された出力値からこれらの誤差
を算出し、当該誤差が小さくなるように重み52.42
を調整する。
これを識別すべき画像に対し繰り返し実施することによ
り、神経回路網3は誤差が最も小さ(なるように重み5
2.42が調整され、この結果、どの画像に対しても望
ましい出力を出すようになり学習は終了する。
学習が終了した神経回路網3に、画像入力装置1、画像
ブロック化装置2を介して未知画像を入力すると、当該
画像の識別結果が出力装置8に出力され、結果の表示あ
るいは他装置への出力がなされる。
なお、この発明の神経回路網3は、層状神経回路網に限
定されない。また、この発明は画像を識別して分類を行
うのにも極めて有効である。
〔発明の効果〕
この発明は以上説明したように、入力すべき画像の位置
とサイズを決定して画像を切り出す画像切り出し手段と
、切り出された画像をあらかじめ定められた複数のブロ
ックに分割し、各ブロックごとに濃度の代表値を算出す
る画像ブロック化手段と、各代表値を入力とし識別すべ
き画像ごとに特定の識別信号を教師信号とする神経回路
網とを有するので、次の効果が得られる。
(1)画像から線分抽出をする必要がないため、画像に
濃淡の偏りなど照明条件に差があったり、またはピント
調節の不備によるぼけがあっても画像の適切な認識が可
能である。
(2)画像を複数のブロックに分割してその代表値をデ
ータとするので、入力データ量を11500以上に激減
することができ、このため、神経回路網の大きさならび
に処理計算量を大きく低減することができる。
【図面の簡単な説明】
第1図はこの発明の一実施例を示すブロック図、第2図
は画像のブロッ化を説明する図、第3図は、第1図の実
施例における神経回路網の詳細を示す図である。 図中、1は画像入力装置、2は画像ブロック化装置、3
は神経回路網、4は入力層、5は中間層、6は出力層、
7は学習制御装置、8は出力装置、41は入力層ユニッ
ト、42は入力層と中間層間の重み、51は中間層ユニ
ット、52は中間層と出力層間の重み、61は出力層ユ
ニットである。

Claims (1)

    【特許請求の範囲】
  1. 入力すべき画像の位置とサイズを決定して画像を切り出
    す画像切り出し手段と、切り出された画像をあらかじめ
    定められた複数のブロックに分割し、各ブロックごとに
    濃度の代表値を算出する画像ブロック化手段と、前記各
    代表値を入力とし識別すべき画像ごとに特定の識別信号
    を教師信号とする神経回路網とを有することを特徴とす
    る濃淡画像識別装置。
JP2192964A 1990-07-23 1990-07-23 濃淡画像識別装置 Pending JPH0478972A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2192964A JPH0478972A (ja) 1990-07-23 1990-07-23 濃淡画像識別装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2192964A JPH0478972A (ja) 1990-07-23 1990-07-23 濃淡画像識別装置

Publications (1)

Publication Number Publication Date
JPH0478972A true JPH0478972A (ja) 1992-03-12

Family

ID=16299971

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2192964A Pending JPH0478972A (ja) 1990-07-23 1990-07-23 濃淡画像識別装置

Country Status (1)

Country Link
JP (1) JPH0478972A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004522228A (ja) * 2001-04-09 2004-07-22 メイアーズ、ゲーリー、エリオット ディジタル画像を表現し比較する方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0272491A (ja) * 1988-09-08 1990-03-12 Sony Corp 画像変換処理装置
JPH02185192A (ja) * 1989-01-12 1990-07-19 Toshiba Corp 均一性評価装置
JPH0458943A (ja) * 1990-06-28 1992-02-25 Konica Corp デジタル放射線画像の画像認識装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0272491A (ja) * 1988-09-08 1990-03-12 Sony Corp 画像変換処理装置
JPH02185192A (ja) * 1989-01-12 1990-07-19 Toshiba Corp 均一性評価装置
JPH0458943A (ja) * 1990-06-28 1992-02-25 Konica Corp デジタル放射線画像の画像認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004522228A (ja) * 2001-04-09 2004-07-22 メイアーズ、ゲーリー、エリオット ディジタル画像を表現し比較する方法

Similar Documents

Publication Publication Date Title
CN108537743B (zh) 一种基于生成对抗网络的面部图像增强方法
CN110728628B (zh) 一种基于条件生成对抗网络的人脸去遮挡方法
CN109918971B (zh) 监控视频中人数检测方法及装置
CN112686812A (zh) 银行卡倾斜矫正检测方法、装置、可读存储介质和终端
Nagane et al. Moving object detection and tracking using Matlab
CN109376625A (zh) 一种基于卷积神经网络的面部表情识别方法
CN111886600A (zh) 一种用于图像的实例级别分割的设备和方法
CN110930327B (zh) 基于级联深度残差网络的视频去噪方法
CN111160194B (zh) 一种基于多特征融合的静态手势图像识别方法
CN111582074A (zh) 一种基于场景深度信息感知的监控视频树叶遮挡检测方法
CN112633221A (zh) 一种人脸方向的检测方法及相关装置
Katramados et al. Real-time visual saliency by division of gaussians
CN112686248A (zh) 证件增减类别检测方法、装置、可读存储介质和终端
CN109902751B (zh) 融合卷积神经网络和半字模板匹配的表盘数字字符识别法
CN114359333A (zh) 运动目标提取方法、装置、计算机设备和存储介质
CN115965844B (zh) 基于视觉显著性先验知识的多聚焦图像融合方法
CN115294162B (zh) 目标识别方法、装置、设备及存储介质
JPH0478972A (ja) 濃淡画像識別装置
CN114119428B (zh) 一种图像去模糊方法和装置
Sizyakin et al. A deep learning-based approach for defect detection and removing on archival photos
CN114694196A (zh) 活体分类器建立方法、人脸活体检测方法及装置
RU2174710C1 (ru) Способ автоматического улучшения полутонового изображения
Chaczko et al. Teaching Computer Vision for telemedicine systems using OpenCV
CN115830517B (zh) 基于视频的考场异常帧提取方法及系统
Tsekouras Image recoloring of art paintings for the color blind guided by semantic segmentation