JPH04352081A - 人物画像認識における前処理方法および後処理方法 - Google Patents

人物画像認識における前処理方法および後処理方法

Info

Publication number
JPH04352081A
JPH04352081A JP3125993A JP12599391A JPH04352081A JP H04352081 A JPH04352081 A JP H04352081A JP 3125993 A JP3125993 A JP 3125993A JP 12599391 A JP12599391 A JP 12599391A JP H04352081 A JPH04352081 A JP H04352081A
Authority
JP
Japan
Prior art keywords
image
specific object
region
area
extracting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3125993A
Other languages
English (en)
Other versions
JP3164835B2 (ja
Inventor
Minoru Iinuma
飯沼 実
Tetsuo Horinouchi
堀ノ内 徹雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ikegami Tsushinki Co Ltd
Original Assignee
Ikegami Tsushinki Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ikegami Tsushinki Co Ltd filed Critical Ikegami Tsushinki Co Ltd
Priority to JP12599391A priority Critical patent/JP3164835B2/ja
Publication of JPH04352081A publication Critical patent/JPH04352081A/ja
Application granted granted Critical
Publication of JP3164835B2 publication Critical patent/JP3164835B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Input (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は特定の物体、すなわち動
物体ないし静物体の画像を認識する画像認識における前
処理方法および装置、特に任意の背景画像の中から人物
の顔を認識する画像認識における前処理方法に関する。
【0002】
【従来の技術】通常の画像認識にはパターンマッチング
(あらかじめ登録されてある画像と入力した画像との比
較)によるもの、特徴点比較(あらかじめ登録した画像
の特徴と入力した画像の特徴の比較、解析)によるもの
等がある。画像認識は、近年ではこれ以外に、ニューラ
ルネットワークを用いたバックプロパゲーションによる
認識も研究されている〔岩下正雄(日本電気株式会社C
&C情報研究所)他:“画像処理プロセッサ(ImPP
)とニューラルネットワークへの応用”理研シンポジュ
ウム第9回「非接触計測と画像処理」昭和63年9月2
2日(木)及び小杉信(NTTヒューマンインタフェー
ス研究所)他:“ニューラルネットを用いた顔画像識別
の一検討”テレビジョン学会技術報告Vol.14, 
No.50, PP. 7〜12, 1990年9月2
6日(木)発表を参照〕。
【0003】
【発明が解決しようとする課題】従来のパターンマッチ
ングは「パターンの単純比較」であり、従ってロバスト
性(適応力)は低く、また、特徴点比較では「入力で対
象ごとに特徴点を見つけこれをプログラム化する」方式
であるため多大の労力を要した。これに比べ、バックプ
ロパゲーションは、「学習」という作業で簡単に特徴抽
出ができる画期的方法である。しかし、この認識方法を
用いても、パターンがずれた場合では十分な認識ができ
ないことが指摘されている〔緑川博子(成蹊大学):バ
ックプロパゲーションによる顔画像認識の一考察“情報
処理学会第36回(昭和63年前期)全国大会を参照〕
【0004】撮像装置の被写界にある特定の物体を知り
、その物体の固体差を認識する場合、撮像装置でその特
定の物体の画像を撮像して、その画像を画像認識装置に
入力する。ここで特定の物体と撮像装置の光学系及び照
明系との関係が一定状態を保ち、撮像装置で得られた画
像内容が認識装置の入力として一定のパターンになって
いることが、広い意味での画像認識に当たって認識を向
上させる方法である。しかし、認識すべき特定の物体に
よっては、一定のパターンで画像を得ることが困難であ
る。
【0005】例えば、固定された位置にある撮像装置の
光学系で、人物の上半身を撮像し、その顔認識を行う場
合は次の問題がある。人物の顔認識の場合、身長の違い
、顔の大きさの違い、撮像装置の光学系との相対関係(
方向、距離、向き)等が異なり、認識対象となる顔領域
部分のみの画像を得るには、複雑な光学系の駆動制御が
必要となる。実際問題として、ある程度の動きのある人
物の場合、光学系で同一のパターンの画像を得ることは
不可能に近い。通常の場合は撮像装置の光学系は固定さ
れている為、人物が一定位置に存在しなければ、現在の
バックプロパゲーションの認識に必要な一定のパターン
にならない。従来の画像認識における入力画は、人間が
手助けし加工して同一のパターンとし、それを画像認識
装置への入力としていた。
【0006】このように、前処理がなければ、大きさ、
位置などの補正なしに比較を行うことになるため、この
ような画像認識は、非効率的であり精度も落ちることに
なる。種々の撮像条件において得られた画像の中の人物
の顔を認識する場合では、先ず、画像の中に顔があるか
ないかが問題となる。従って顔があるかどうかを判断す
るためには対象となる顔の条件(見え方、動き、回転、
付帯物、顔自体の変形)、人間の顔としての一般形状、
背景内の顔の出現位置の限定、顔部分の形状抽出アルゴ
リズム、顔背景分離アルゴリズムなどが必要である。さ
らに顔領域抽出後の正規化として、2次元サイズの補正
、顔の3次元的な回転補正、濃度補正、一部しか見えな
い部分の補間、顔の部分変形の補間などが考えられる。
【0007】従って、本発明の目的は、認識すべき動物
体の画像の前処理を行うことで、後処理である画像認識
の処理の効率を向上させることにある。
【0008】
【課題を解決するための手段】上述した問題点を解決す
るため、本発明によれば、特定の物体(動物体ないし静
物体)の画像を認識する画像認識における前処理方法に
おいて、前記特定の物体を抽出する段階と、該物体から
認識すべき領域を抽出する段階と、該抽出した領域を正
規化する段階とから成る前処理方法が提供される。
【0009】前記特定の物体を抽出する段階が、特定物
体画像を含む任意の背景画像と背景のみの画像とを量子
化してその差をとり、その差分を2値化し、これにより
背景画像から特定物体画像を分離し、背景ノイズを除去
し、この結果生ずる特定物体画像部分の欠落を補正する
簡易穴うめ処理を行うことを含み、特定物体画像の一部
である前記認識すべき領域を抽出する段階が、その領域
としての基準にあてはまるかどうかを評価してすべての
条件を満たすものの領域を外接する矩形領域で切り出す
ことを含み、前記正規化する段階が、アフィン変換を含
んでいてもよい。
【0010】また、前記特定の物体から認識すべき領域
を抽出する段階が、その領域としての基準に当てはまる
かどうかを試行するそれぞれの設定値群において、基準
に当てはまる設定値群から、最適とされる設定値群によ
る抽出を行うことを含んでもよい。さらに、前記特定の
物体を抽出する段階が、前記特定物体を含まない背景画
を基準画として固定することを含み、前記特定の物体か
ら認識すべき領域を抽出する段階が、その領域としてそ
の基準に当てはまるかどうかを評価して全ての条件を満
たすものの領域を外接する矩形領域で切り出すことから
、切り出された入力画を保存することまでを、入力画を
更新して繰り返すことを含み、前記正規化する段階が、
前記認識すべき領域としての基準に最適な入力画像を、
前記繰り返し処理に当たって使用したデータとを基に正
規化することを含んでもよい。
【0011】また、後処理にあたる画像認識の処理結果
より判断し、撮像装置からの入力画を更新しながら、全
体の処理を複数回繰り返し、それぞれにおける画像認識
の結果より最終的な認識結果を得ることをさらに含んで
もよい。また本発明によれば、特定の物体の画像を含む
画像を入力する画像入力部と、該入力した画像を記憶す
る画像記憶部と、記憶した画像を読みだして特定物体の
画像を抽出する物体画像抽出部と、抽出した物体画像か
ら認識すべき領域を抽出する認識領域抽出部と、該抽出
した領域を正規化する抽出領域正規化部とから成る前処
理装置が提供される。
【0012】前記本発明の前処理方法および前処理装置
においては、特定の物体が人物であり、認識すべき領域
が人物の顔であってもよい。
【0013】
【実施例】以下本発明の一実施例を図面に従って詳述す
る。初めに、前述した各々の処理について説明し、後で
これらの処理が全体としてどのように進められるのかを
説明する。第1図は本発明による画像認識における前処
理を実現する手段、すなわち前処理装置を含む画像認識
システムの構成図である。本発明による前処理は前処理
部1で実現され、この前処理部1は、画像入力部2、画
像記憶部3、特定物体画像抽出部4、認識領域抽出部5
および抽出領域正規化部6で構成される。なお、第1図
には、画像認識の後処理を行う認識処理部7も示されて
いる。
【0014】画像入力部2は、特定物体画像を含む任意
の背景画像および背景のみの画像を入力するカメラ8と
、その入力画像を量子化するビデオデジタイザ9とを有
する。画像記憶部3は、背景のみの画像を基準画として
保存する基準画メモリ10と、特定物体を含む画像を入
力画として保存する入力画メモリ11を有する。また、
特定物体抽出部4は、後述する濃度変換1、濃度変換2
、濃度変換3、フィルタ処理1およびフィルタ処理2の
各手順を行う手段を有する。なお、フィルタ処理2を終
了した抽出特定画像は画像記憶部3の抽出特定画像(人
物)メモリ12に記憶される。
【0015】さらに、認識領域抽出部5は、後述するよ
うに、頭頂候補点検出、顔の左端右端の検出、顔の領域
決定、顔の領域評価の各手順を行う手段を有する。なお
、顔の領域評価の手順において所望の結果を得られなか
った場合(NG)に、再度上記手順を繰り返すための顔
のパラメータ設定/再設定の手順を行う手段も含まれて
いる。顔の領域評価の手順において所望の結果が得られ
た場合(OK)に、抽出領域画像を記憶する抽出領域画
像(顔)メモリ13が、前記画像記憶部3に設けられて
いる。
【0016】また、抽出領域正規化部6は、後述するよ
うに、中心補正やサイズ変更およびセンタリングの各手
順を行う手段を有する。なお、正規化された抽出画像は
、画像記憶部3の抽出画像メモリ14に記憶される。 画像記憶部3は、ニューラルネットワークを用いたバッ
クプロパゲーションの学習手順により蓄積された学習デ
ータを記憶する学習データメモリ15を有している。認
識処理部7では、前記抽出画像メモリ14に記憶された
正規化抽出画像と前記学習データとをニューラルネット
ワークにより処理する手順と、その処理結果を評価する
手順を行う。なお、ニューラルネットワークによる処理
は認識演算プロセッサ(ImPP)16により行われる
。 1.  特定物体(人物)領域の抽出(前処理1)特定
物体(人物)領域抽出は、特定物体を含まない基準画と
入力画との画像間の差演算により抽出可能であるが、単
純な差だけで抽出可能なのは2値画のみである。 例えば多値の場合、一方が、(背景+人物)、他方が(
背景)であるとする。ここで差演算(背景+人物)−(
背景)を行うと、人物の形をした(人物−背景)の濃度
値の画像となってしまう。また、この結果は符号付とな
るなどの特徴がある。この符号は物体の移動中はその方
向も判別可能な要素も持っている。そこで、特定物体領
域の抽出手順では濃度変換を行っている。以下、図2及
び図3について説明する。 1.1 特定物体領域抽出手順 (a) 基準となる背景画をカメラから取り込み、基準
画Aとして保存する。 (b) 人物+背景画をカメラから取り込み、入力画B
とする。 (c) 基準画Aを量子化して得られる各画素の濃度レ
ベル0〜255 を0〜127 に変換する、すなわち
、基準画Aの濃度を1/2に濃度変換する(濃度変換1
)。変換後の画像を入力画1とすると、濃度変換1の式
は、Da2=Da1/2 となる。(ここで、Da1 は基準画Aの濃度値、Da
2 は入力画1の濃度値である。) (d) 入力画Bの各画素の濃度レベル0〜255 を
128 〜255 に変換する、すなわち、入力画Bの
濃度を1/2に圧縮し、この濃度に128のバイアスを
与える(濃度変換2)。濃度変換後の画像を入力画2と
すると、濃度変換2の式は、 Db2=(Db1/2)+128 となる。(ここで、Db1 は入力画Bの濃度値、Db
2 は入力画2の濃度値である。) (e) 濃度変換1、2で処理した画像の差(入力画2
−入力画1)をとると、両者の画像の同じ位置で濃度の
変化のない場合は、どのような濃度であってもその差は
128となる。このことを利用して、実際の場合の量子
化誤差や、背景の時間的変化量等をεと考え、(入力画
2−入力画1)の濃度差が128 ±εレベル以内の位
置は画像が変化しないものとして0とし、それ以外の場
所は画像が変化したものとして1とする2値画像を得る
(濃度変換3)。 (f) 入力画Bと(e) で作成した2値画像とのA
ND をとる。これにより特定物体領域を入力画Bから
切り出すことができる。 (g) 以上(c) 〜(f) の処理を画像の各画素
に対し行い、特定画像Cを得る。 (h) 特定画像Cの背景ノイズ除去を行う。(フィル
タ処理1) (i) (e) で作成した2値画像において、特定画
像の部分は1、それ以外の部分は0となるのが理想的で
あるが特定画像と背景画像の濃度差が±ε以内であれば
0となってしまう。これにより、特定画像の領域に欠落
が生じる場合がある。これを補正するために、特定画像
Cの簡易穴埋めを行う。(フィルタ処理2) このように基準画Aを固定する場合は特定物体の領域の
抽出が可能である。また、基準画Aをインターバルで再
取り込みし、3値化する方式では特定物体の動きの方向
の抽出が可能である。
【0017】なお、図2は、上記特定物体領域(動画像
)抽出手順の基本ブロック図であり、図3はそのフロー
チャートである。図4は、フィルタ処理1のフローチャ
ートであり、これを参照してノイズ処理について詳述す
る。ノイズ除去処理は3×3オペレータにより行う。 3×3オペレータとは、図5の(A)、(B)に示すよ
うな(x,y)アドレスを中心として3×3マトリック
スでデータを取り扱う画像処理手法である。(x,y)
の中心値が変わればオペレータの値も変わる。なお、図
5の(A)はオペレータの座標を示し、図5の(B)は
オペレータ番号に対応する座標で、各座標値はオペレー
タ中心からみた方向を示している。
【0018】一般にオペレータ処理では、入力画像メモ
リと出力画像メモリは別々である。図5の(C)に示す
ように、入力画像メモリの値をオペレータに取り込み、
処理後、値は出力画像メモリに書き込む。説明に当たっ
て、画像(基準画像、入力画像)の大きさ(領域)をX
、Y方向について0〜127 とする。このオペレータ
処理におけるオペレータのスキャンは、図5の(C)に
示すように、アドレス(1,1)より始め、X方向アド
レスを+1づつ加算し、Xが126 になったら1回目
のスキャンを終了し、再びX=1より始めるが、次のス
キャンではYを+1する。この方法でY=126 まで
行う(画像領域が0〜127 であるため、3×3のオ
ペレータ処理は1〜126 の範囲を動く)。
【0019】ノイズ除去オペレータ処理の内容は、入力
画から認識すべき領域を抽出するに当たって害となる背
景領域のノイズ除去を主目的とする。ノイズがある場合
のオペレータ内のデータの取り扱いを説明すると、オペ
レータ中心のデータが0以外の値でその周囲の8つの方
向のデータが0であるときはホワイトノイズであり、オ
ペレータ中心のデータが0でその周囲の8つの方向のデ
ータが0以外の値であるときであるときはブラックノイ
ズであるとしている。
【0020】今回は、ホワイトノイズを除去することを
目的とし、且つ、これに或る程度の許容範囲を設ける(
1ドットの縦線、横線はノイズとする)ため、オペレー
タの8方向すべてデータが0というのではなく、6個以
上のデータが0であるときとした。これに当てはまるオ
ペレータの例を図6に示す。図7はフィルタ処理2のフ
ローチャートであり、ここでは、特定物体領域の画像欠
落の補完を主目的とする。これを参照して簡易穴埋めオ
ペレータ処理について詳述する。穴埋め処理とは、本来
、閉じたエッジ内のデータをすべて指定のデータとする
ことであるが、ここでは簡単な操作で或る程度穴埋めを
する処理として簡易穴埋め処理の原理を示す。
【0021】図8の(A)、(B)に示すような3×2
のオペレータを用いて、オペレータ中心のデータが0で
、オペレータ番号1〜5のうちの何れか2つ以上のデー
タが0以外の値であるとき、その時のオペレータ中心の
アドレスの出力画像メモリの内容を入力画像の近傍の値
で置き換える。なお、図8の(A)はオペレータの座標
を示し、図8の(B)はオペレータ番号に対応する座標
で、各座標値はオペレータ中心(x,y)からみた方向
を示している。
【0022】簡易穴埋め処理のオペレータを3×3では
なく3×2に選んだのは、オペレータの下方向を見たく
ないからである。もし、下方向を見ると、穴埋め処理を
した時、画像が上方向に1ドット増える。この場合、特
定物体の画像Cの物体領域の頂部の位置が1ドットだけ
Y方向にずれてしまう。 2.  認識すべき領域の抽出(前処理2)認識すべき
領域として人物の顔領域を抽出する方法を以下に説明す
る。 2.1 顔のパラメータ 顔領域を抽出する際に、次のパラメータを用いる。
【0023】α    :顔の縦の長さの定数β   
 :顔の横幅の定数 Ylen  :顔の横幅を調べるために頭頂からのYの
長さ上の3つのパラメータの関係は次式のように仮定し
た。 β=0.75α Ylen=0.5α これらのパラメータは、顔の外形を定義するものであり
、画像中の顔の大きさによって変える必要がある。そこ
でまずα、β、Ylenを大きい値から始めて徐々に小
さくしていくようにする。つまり図9のように7段階に
変化させる。このようにパラメータを段階的に変化させ
ることにより、大きな顔から小さな顔まで検出できる。
【0024】図9は、顔のパラメータの例を表の形態で
示したもので、i=1のとき、顔領域が後述する顔領域
評価によって正しく抽出されれば、顔領域抽出成功とな
るが、失敗したときはi=2,3・・・というようにα
、β、Ylenを徐々に小さくしてゆき、顔領域が正し
く抽出されるまで、以下に述べる顔領域抽出手順の処理
を繰り返す。つまり、顔のパラメータを変化させること
によって、画像中の顔の大きさが異なっても、顔が抽出
できるようにしている。しかし、i=7までパラメータ
を変化させて処理を行っても顔領域が抽出できない場合
は、その画像中には顔が存在しないということになる。
【0025】図9の数値は、画像のX、Y方向のそれぞ
れの領域を0〜127の128 ×128 の画像に展
開したときのそれぞれのパラメータの値である。 2.2 顔領域抽出手順(前処理2) 顔領域抽出手順は、図15に示すように、■Y方向頂点
検出(頭頂の候補点検出)、■顔の左端、右端の検出、
■顔の領域決定、および■顔の領域評価の各手順で構成
される。
【0026】この処理を行う時点では、切り出された顔
画像以外の画像の濃度レベルは全て0である。また切り
出された顔画像の濃度レベルは1〜255 である。 2.2.1 頭頂の候補点検出 以下図10、図16を参照しながら頭頂の候補点検出の
手順について説明する。候補点のYアドレスをYmin
i とする。 (a) すべてのXに対して、上から下(Y軸の増える
方向)に走査し、最初に設定した閾値以上の画素のYア
ドレスYminx を求める。頭頂検出の対象となる画
像の背景は前処理1で除去されてある。従って、頭頂検
出は、Yアドレスの上部から下部方向に濃度情報を検索
し、1以上となったときのアドレスを頭頂の候補点要素
とする。 (b) 最初の閾値以上のYアドレスYminx をX
方向の画素m個ずつに区切り、各m個の中でYアドレス
の最も小さい(上にある)ものを頭頂の候補点Ymin
i とする。 (c) 候補点Ymini からのYラン長が、顔の縦
の長さαより短い長さの定数Ylen=0.5 α(α
の値は図9のiの値によって設定される)より小さかっ
たら、候補点から除去する。Ylen=0.5 αとし
たのは、特定画像抽出の際に背景と同じ濃度レベルの顔
の部分が虫食い状態となる場合があることを考慮したた
めである。 (d) 隣り合う2つの候補点のX方向の距離が顔の横
幅の定数βの2/3より小さいとき、アドレスの大きい
方(下にある方)を候補点から除去する。
【0027】頭頂の候補点はこの処理によって絞られて
いくが、この処理は候補点の数が変化しなくなるまで繰
り返す。なお、図16のフローチャートの(a),(b
),(c),(d)は上記(a),(b),(c),(
d) の手順を示したものである。以上の手順で求めた
頭頂の各候補点について、顔領域を決定し、その顔領域
を評価する。それらを次に示す。 2.2.2 顔の左端、右端の検出 以下図11、図17を参照しながら、顔の左端、右端の
検出手順について説明する。顔の左端のXアドレスをL
x、右端のXアドレスをRxとする。 (a) Ymini から下へ顔の縦の長さより短い長
さの定数Ylen=0.5 αまでのすべてのYについ
て、以下の処理を行う。
【0028】(a−1) Ymini の iより左へ
向かって走査し、最初の閾値以下となった画素の直前の
Xアドレスを求める。 (a−2) Ymini の iより右へ向かって走査
し、最初の閾値以下となった画素の直前のXアドレスを
求める。 (b)  (a−1)で求めたXアドレスのうち、最も
小さいものを顔の左端Lxとする。 (c)  (a−2)で求めたXアドレスのうち、最も
大きいものを顔の右端Rxとする。
【0029】なお、図17のフローチャートの(a),
(b),(c) は上記(a),(b),(c) の手
順を示したものである。 2.2.3 顔の領域決定 図12、図18に示すように、X方向の幅をWx、Y方
向の幅をWyとする矩形領域を顔の領域とする。顔は縦
に長いが、その比率Rをα、βより求める。
【0030】α:顔の縦の長さの定数 β:顔の横幅の定数 2.2.4 顔領域の評価 図13、図19を参照しながら、顔領域の評価手順につ
いて説明する。決定された領域が顔らしいかどうかを評
価する。顔領域が以下の4つの条件を満足したとき顔領
域抽出成功とする。 (a) 顔領域のX方向幅Wxが次の範囲であるか。
【0031】 β−4≦Wx≦β+4    β:顔の横幅の定数この
式は顔幅の評価を規定している。(ここで4の数値は、
画面を128 ×128 の画素としたときの画素数を
表す。) (b) 頭頂の候補点のXアドレスXmini と顔領
域の左端Lx、右端RxとのそれぞれのX距離の比が次
の範囲であるか。
【0032】 1/3≦(Rx−Xmini ) /(Xmini −
Lx)≦3この式は、頭頂の頭の中心からのずれを評価
したもので、頭頂は中央近辺にあるはずであるというこ
との評価にもとづくものである。 (c) 顔領域底辺部に閾値以上の画素が存在するか。 これは顔の下には首、胴体がつながっているということ
の評価である。逆に言えば、領域底辺部に閾値以上の画
素が存在しないときは、顔ではないと言うことになる。 (d) 顔領域内の閾値以上の画素の割合いは60%以
上か。
【0033】なお、図19のフローチャートの(a),
(b),(c),(d) は上記(a),(b),(c
),(d) の手順を示したものである。“60%以上
”の根拠について以下図14を参照しながら説明する。 1)  まず楕円とその楕円に外接する矩形との面積比
について考える。楕円の長軸を2b、短軸を2aとする
。半径aの面積S1はπ・a2である。楕円の面積S2
はガバリエリの原理より S2=(b/a)・S1=(b/a)・π・a2=π・
a・bまた外接する矩形の面積S3は4・a・bである
。 よって楕円と外接する矩形の面積比は (S2/S3)・100 =( π・a・b)/(4・
a・b)・100 =78.5〔%〕 2)  1)では78.5%以上のときに顔であると判
断したいが、特定画像抽出の際に、背景と同じ濃度レベ
ルの顔の部分が虫食い状態となる場合がある。よって顔
領域内の閾値以上の画素の割合いは60%以上のとき、
顔であると判断するようにした。 3.  顔領域の正規化(前処理3) 3.1 正規化処理手順 図20のように128 ×128 ドットの入力画像よ
り長方形の顔の部分のみを切り出し、これを128 ×
128 の画素からなる画枠内におさまるように正規化
する。図21のフローチャートの(a), (b),(
c) の部分に対応して以下の手順により処理する。 (a) 正規化パラメータの初期設定 平行移動X(1回目)m=−m1     平行移動X
(2回目)m=m2  平行移動Y(1回目)n=−n1     平行移動Y
(2回目)n=n2  スケールS          s=Wy/Vy(b)
 正規化変換式 変換後のアドレスを(X,Y)、変換前を(x,y)と
すると変換式は以下のようになる。変換1回目は入力画
像の中心補正及びサイズ変更を行い、変換2回目は、変
換画像のセンタリングを行う。
【0034】 X=(x−m1)/s+m2 Y=(y−n1)/s+n2 である。ただし、 m1=Lx                m2=(
128 −128/R)/2n1=Ymini    
         n2=0s=Wy/128 R=α/β(R≧1)  α:顔の長さの定数、β:顔
の幅の定数 である。 (c) 変換後の画像の表示及びその画像ファイルへの
格納4.各々の処理の進め方 本発明の部分を画像認識に関わる全体のシステムの視点
で捉えると本発明の処理の進め方として次の3つに大別
される。 4.1 認識すべき領域の抽出におけるそれぞれの手順
の繰り返し 2.1 項で述べた顔のパラメータ群(i=1、2、3
、…)において、先ずは、i=1の設定値を使用して処
理を行い顔領域の評価を行う。この結果、条件を満足し
ない場合、iの設定値を次の設定値に更新し、これらの
手順を再び行い再評価を行う。この手順は顔領域の評価
において条件を満足するまで繰り返す。この評価条件が
満足された時点で、次の顔領域の正規化の処理へ進む。
【0035】この方法の変形として、全てのiの設定値
について顔領域の評価を行い、条件を満足したiの値か
ら最適なiの設定値を予測する方法もある。例えばiの
設定値を多く設けて条件を満足する複数個のi値を求め
、そのi値の中央のi値の設定による領域のデータを採
用したり、また、条件を満足する度合いの一番大きいi
値の設定を採用する方法もある。これらの方法は認識態
様によっては実験を行いその評価結果からより良い方法
を選択すべきである。 4.2  4.1項の方法を含み、特定物体(人物)領
域の抽出手順と認識すべき領域の抽出の繰り返しこの方
法は、基準画を固定し、入力画を得た後に上記4.1 
項による手順を領域の抽出の段階まで行い、この結果を
保存し、次に新たな入力画を得て再びこれらの手順を繰
り返す方法である。この方法では、顔領域の抽出成功に
至らない場合に、新たな人物画像を得て抽出成功となる
まで繰り返して、画像の制限を行い、その回数の中で一
番、評価が高い画像を得る方法を採用することになる。
【0036】この方法においては入力する画像のタイミ
ングによって、得られる画像に違いがあることを前提に
している。従って、4.1 項では繰り返す場合の設定
値としてiの値のみ更新しているが、本方法の場合はi
の繰り返しは勿論、評価基準の設定値もiと同様に設定
値群として予め設けて置き、高い評価基準に合致した入
力画とその認識領域の抽出データとを得ることもできる
【0037】図22ないし図26は、本発明の画像認識
における前処理1、前処理2および前処理3ならびに後
処理である認識処理の各処理およびそれらの全ての処理
を実現する機器の構成例をそれぞれ示したものである。 なお、図22ないし図26の矢印は、各機器間における
データの流れを示す。図22の機器の構成例は、特定の
物体すなわち動物体ないし静物体の画像を認識するため
の前処理として、特定物体を抽出する段階を実現するも
のである。
【0038】画像入力部21は、基準となる背景画(基
準画A)および人物+背景画(入力画B)を取り込むた
めに必要な機器、すなわち白黒モニタ、カメラおよびビ
デオデジタイザで構成される。画像処理部22は、上記
の取り込んだ画像を格納ないし画像処理するためのフレ
ームメモリで構成される。
【0039】中央演算処理部24は、前処理1の手順を
制御する機能を行う80386(CPU)で構成される
。ここにおいて、この中央演算処理部24は、前述の「
1.特定物体(人物)領域の抽出」の(a) 〜(i)
 の作業を各機器に指示する。処理結果表示部25は、
前処理1における画像処理部22で処理した画像の表示
および中央演算処理部24の処理情報をアナログRGB
で表示する機能を持つ。この表示機能により特定物体の
画像が抽出されたかを画像で確認することができる。
【0040】図23の機器の構成例は、特定の物体すな
わち動物体ないし静物体の画像を認識するための前処理
として、認識すべき領域を抽出する段階を実現するもの
である。画像処理部22は、切り出した特定画像を格納
するためのフレームメモリで構成される。
【0041】中央演算処理部24は、前処理2の手順を
制御する機能を行う80386(CPU)で構成される
。ここにおいて、この中央演算処理部24は、前述の「
2.認識すべき領域の抽出」の作業を画像処理部22を
用いて処理する。処理結果表示部25は、前処理2にお
いて画像処理部22で処理した画像の表示および中央演
算処理部24の処理情報をアナログRGBで表示する機
能を持つ。この表示機能により特定物体の認識すべき画
像が抽出されたかを画像で確認することができる。
【0042】図24の機器の構成例は、特定の物体すな
わち動物体ないし静物体の画像を認識するための前処理
として、認識すべき領域を正規化する段階を実現するも
のである。画像処理部22は、抽出した特定画像を格納
、正規化するためのフレームメモリで構成される。
【0043】中央演算処理部24は、前処理3の手順を
制御する機能を行う80386(CPU)で構成される
。ここにおいて、この中央演算処理部24は、前述の「
3.顔の正規化」の作業を画像処理部22を用いて処理
する。処理結果表示部25は、前処理3において画像処
理部22で処理した画像の表示および中央演算処理部2
4の処理情報をアナログRGBで表示する機能を持つ。 この表示機能により特定物体の認識すべき画像が正規化
されたかを画像で確認することができる。
【0044】図25の機器の構成例は、特定の物体すな
わち動物体ないし静物体の画像を認識するための前処理
に引き続いて、この画像を認識する後処理の段階を実現
するものである。認識処理部23は、データ格納部26
より読み出した認識対象である正規化後の画像ファイル
、認識の比較基準となる登録画像ファイル、およびこれ
ら2つの画像の特徴を調べるための学習ファイルを用い
て認識処理を行うImPPボードで構成される。認識処
理部23は認識処理を高速に行うための手段として用い
られているのであり、この処理は中央演算処理部24で
も代行可能である。
【0045】中央演算処理部24は、認識処理の手順を
制御する機能を行う80386(CPU)で構成される
。ここより認識処理部23に指示を与え、データ格納部
26を用いて認識処理を行う。処理結果表示部25は、
認識処理における認識処理部23で処理した演算結果を
中央演算処理部24の指示によりアナログRGBで表示
する機能を持つ。認識結果がどの程度であるかは、特徴
の一致する割合を表現する方式とする。
【0046】データ格納部26には、認識対象である正
規化後の画像ファイル、認識の基準となる登録画像ファ
イル、およびこれらの2つの画像の特徴を調べるための
学習ファイルが格納してある。図26は、本発明の画像
認識における前処理1、前処理2および前処理3ならび
に後処理である認識処理の全ての処理を実現する機器の
構成例を示したものである。
【0047】画像入力部21は、基準となる背景画(基
準画A)および人物+背景画(入力画B)を取り込むた
めに必要な機器、すなわち白黒モニタ、カメラおよびビ
デオデジタイザで構成される。画像処理部22は、上記
の取り込んだ画像を格納ないし画像処理するためのフレ
ームメモリで構成される。
【0048】認識処理部23は、データ格納部26より
読み出した認識対象である正規化後の画像ファイル、認
識の比較基準となる登録画像ファイル、およびこれら2
つの画像の特徴を調べるための学習ファイルを用いて認
識処理を行うImPPボードで構成される。認識処理部
23は認識処理を高速に行うための手段として用いられ
ているのであり、この処理は中央演算処理部24でも代
行可能である。
【0049】中央演算処理部24は、前処理1、前処理
2、前処理3および後処理の手順を制御する機能を行う
80386(CPU)で構成される。ここにおいて、こ
の中央演算処理部24は、前述の「1.特定物体(人物
)領域抽出」の(a) 〜(i) の作業を各機器に指
示し、前述の「2.認識すべき領域の抽出」の作業およ
び「3.顔領域の正規化」の作業を画像処理部22を用
いて処理し、後処理である「認識処理」の作業をデータ
格納部26を用いて処理する。
【0050】処理結果表示部25は、前処理1、前処理
2、前処理3および後処理において画像処理部22で処
理した画像の表示および中央演算処理部24の処理情報
をアナログRGBで表示する機能を持つ。この表示機能
により特定物体の画像が抽出されたかを画像で確認する
ことができる。データ格納部26には、認識対象である
正規化後の画像ファイル、認識の基準となる登録画像フ
ァイル、およびこれらの2つの画像の特徴を調べるため
の学習ファイルが格納してある。
【0051】
【発明の効果】本発明によれば、特定の動物体ないし静
物体の画像を認識する画像認識における前処理を行うこ
とにより、後処理である画像認識の処理の効率を向上さ
せることができる。すなわち、実際の物体の画像認識に
おいて、撮像装置と物体との間の位置的な相対関係に厳
密な条件を必要としない。後処理に当たる画像認識処理
の為の入力のパターンを一致させる作業が簡単となる。 画像の認識において、入力画像に対して厳密なパターン
の一致を要求しないで十分な認識が可能となる。画像認
識の精度を向上させることができる。認識に当たって不
要な背景等の画素を除去し、注目したい特定物体のみの
画像を切り出すことにより、監視などの目的において全
画面をくまなく注視する必要がなくなる。
【図面の簡単な説明】
【図1】本発明の構成を示すブロック図である。
【図2】本発明の特定物体領域抽出手順を示す基本ブロ
ック図である。
【図3】本発明の特定物体領域抽出手順を示すフローチ
ャートである。
【図4】上記特定物体領域抽出手順の内のフィルタ処理
1の手順を示すフローチャートである。
【図5】上記フィルタ処理1におけるオペレータの座標
、オペレータ番号に対応する座標、オペレータ処理およ
びオペレータのスキャン操作を示す図である。
【図6】上記フィルタ処理1におけるノイズ除去オペレ
ータ処理のノイズの例を示すフローチャートである。
【図7】上記特定物体領域抽出手順の内のフィルタ処理
2の手順を示すフローチャートである。
【図8】上記フィルタ処理2におけるオペレータの座標
およびオペレータ番号に対応する座標を示す図である。
【図9】本発明の顔領域抽出手順における顔のパラメー
タの表を示す図である。
【図10】上記顔領域抽出手順の内の頭頂の候補点検出
手順を示す図である。
【図11】上記顔領域抽出手順の内の顔の左端、右端検
出手順を示す図である。
【図12】上記顔領域抽出手順の内の顔の領域決定手順
を示す図である。
【図13】上記顔領域抽出手順の内の顔領域評価手順を
示す図である。
【図14】上記顔領域抽出手順における楕円と外接する
矩形との面積比を示す図である。
【図15】本発明の顔領域抽出手順のフローチャートで
ある。
【図16】上記顔領域抽出手順の内の頭頂の候補点検出
手順のフローチャートである。
【図17】上記顔領域抽出手順の内の顔の左端、右端検
出手順のフローチャートである。
【図18】上記顔領域抽出手順の内の顔の領域決定手順
のフローチャートである。
【図19】上記顔領域抽出手順の内の顔領域評価手順の
フローチャートである。
【図20】上記顔領域の正規化手順における顔の切り出
し、128×128ファイルへの顔の大きさの正規化の
例を示す図である。
【図21】上記顔領域の正規化手順のフローチャートで
ある。
【図22】本発明の前処理1で使用する機器の構成例を
示すブロック図である。
【図23】本発明の前処理2で使用する機器の構成例を
示すブロック図である。
【図24】本発明の前処理3で使用する機器の構成例を
示すブロック図である。
【図25】本発明の前処理に引き続いて行われる後処理
である認識処理で使用する機器の構成例を示すブロック
図である。
【図26】本発明の前処理および後処理である認識処理
の全てを含むシステムで使用する機器の構成例を示すブ
ロック図である。
【符号の説明】
1  前処理部 2  画像入力部 3  画像記憶部 4  特定物体画像抽出部 5  認識領域抽出部 6  抽出領域正規化部 7  認識処理部 8  カメラ 9  ビデオデジタイザ 10  基準画メモリ 11  入力画メモリ 12  抽出特定画像(人物)メモリ 13  抽出領域画像(顔)メモリ 14  抽出画像メモリ 15  学習データメモリ 16  認識演算プロセッサ(ImPP)21  画像
入力部 22  画像処理部 23  認識処理部 24  中央演算処理部 25  処理結果表示部 26  データ格納部

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】  特定の物体の画像を認識する画像認識
    における前処理方法において、前記特定の物体を抽出す
    る段階と、該特定の物体から認識すべき領域を抽出する
    段階と、該抽出した領域を正規化する段階とから成る前
    処理方法。
  2. 【請求項2】  前記特定の物体を抽出する段階が、特
    定物体画像を含む任意の背景画像と背景のみの画像とを
    量子化してその差をとり、その差分を2値化し、これに
    より背景画像から特定物体画像を分離し、背景ノイズを
    除去し、この結果生ずる特定物体画像部分の欠落を補正
    する簡易穴うめ処理を行うことを含み、特定物体画像の
    一部である前記認識すべき領域を抽出する段階がその領
    域としての基準にあてはまるかどうかを評価してすべて
    の条件を満たすものの領域を外接する矩形領域で切り出
    すことを含み、前記正規化する段階がアフィン変換を含
    む請求項1記載の前処理方法。
  3. 【請求項3】  前記特定の物体から認識すべき領域を
    抽出する段階が、その領域としての基準に当てはまるか
    どうかを試行するそれぞれの設定値群において、基準に
    当てはまる設定値群から、最適とされる設定値群による
    抽出を行うことを含む請求項2記載の前処理方法。
  4. 【請求項4】  前記特定の物体を抽出する段階が、前
    記特定物体を含まない背景画を基準画として固定するこ
    とを含み、前記特定の物体から認識すべき領域を抽出す
    る段階が、その領域としてその基準に当てはまるかどう
    かを評価して全ての条件を満たすものの領域を外接する
    矩形領域で切り出すことから、切り出された入力画を保
    存することまでを、入力画を更新して繰り返すことを含
    み、前記正規化する段階が、前記認識すべき領域として
    の基準に最適な入力画像を、前記繰り返し処理に当たっ
    て使用したデータとを基に正規化することを含む請求項
    2又は3に記載の前処理方法。
  5. 【請求項5】  後処理にあたる画像認識の処理結果よ
    り判断し、撮像装置からの入力画を更新しながら、全体
    の処理を複数回繰り返し、それぞれにおける画像認識の
    結果より最終的な認識結果を得ることをさらに含む請求
    項2ないし4のいずれかに記載の前処理方法。
  6. 【請求項6】  特定の物体が人物であり、認識すべき
    領域が人物の顔である請求項1ないし5のいずれかに記
    載の前処理方法。
  7. 【請求項7】  特定の物体の画像を含む画像を入力す
    る画像入力部と、該入力した画像を記憶する画像記憶部
    と、記憶した画像を読みだして特定物体の画像を抽出す
    る物体画像抽出部と、抽出した物体画像から認識すべき
    領域を抽出する認識領域抽出部と、該抽出した領域を正
    規化する抽出領域正規化部とから成る前処理装置。
JP12599391A 1991-05-29 1991-05-29 人物画像認識における前処理方法および後処理方法 Expired - Fee Related JP3164835B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP12599391A JP3164835B2 (ja) 1991-05-29 1991-05-29 人物画像認識における前処理方法および後処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP12599391A JP3164835B2 (ja) 1991-05-29 1991-05-29 人物画像認識における前処理方法および後処理方法

Publications (2)

Publication Number Publication Date
JPH04352081A true JPH04352081A (ja) 1992-12-07
JP3164835B2 JP3164835B2 (ja) 2001-05-14

Family

ID=14924070

Family Applications (1)

Application Number Title Priority Date Filing Date
JP12599391A Expired - Fee Related JP3164835B2 (ja) 1991-05-29 1991-05-29 人物画像認識における前処理方法および後処理方法

Country Status (1)

Country Link
JP (1) JP3164835B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0799566A (ja) * 1993-09-28 1995-04-11 Sokkia Co Ltd 画像入力装置における移動ステージの校正方法
JP2005196519A (ja) * 2004-01-08 2005-07-21 Sony Corp 画像処理装置および方法、記録媒体、並びにプログラム
JP2010021916A (ja) * 2008-07-14 2010-01-28 Eastman Kodak Co 画像処理装置
JP2016177755A (ja) * 2015-03-23 2016-10-06 日本電気株式会社 注文端末装置、注文システム、客情報生成方法、及びプログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3847672B2 (ja) 2002-07-03 2006-11-22 松下電器産業株式会社 コンパイラ装置及びコンパイル方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0799566A (ja) * 1993-09-28 1995-04-11 Sokkia Co Ltd 画像入力装置における移動ステージの校正方法
JP2005196519A (ja) * 2004-01-08 2005-07-21 Sony Corp 画像処理装置および方法、記録媒体、並びにプログラム
JP2010021916A (ja) * 2008-07-14 2010-01-28 Eastman Kodak Co 画像処理装置
JP2016177755A (ja) * 2015-03-23 2016-10-06 日本電気株式会社 注文端末装置、注文システム、客情報生成方法、及びプログラム

Also Published As

Publication number Publication date
JP3164835B2 (ja) 2001-05-14

Similar Documents

Publication Publication Date Title
JP5047005B2 (ja) 画像処理方法、パターン検出方法、パターン認識方法及び画像処理装置
US20080025609A1 (en) Apparatus and method for detecting specific subject in image
US7831068B2 (en) Image processing apparatus and method for detecting an object in an image with a determining step using combination of neighborhoods of a first and second region
CN108229432A (zh) 人脸标定方法及装置
Gour et al. Fingerprint feature extraction using midpoint ridge contour method and neural network
JP2007025902A (ja) 画像処理装置、画像処理方法
Devadethan et al. Face detection and facial feature extraction based on a fusion of knowledge based method and morphological image processing
EP1679655A1 (en) Face image candidate area search method, face image candidate area search system, and face image candidate area search program
JPH04315272A (ja) 図形認識装置
JP2006323779A (ja) 画像処理方法、画像処理装置
KR101192365B1 (ko) 얼굴 검출 시스템 및 그 방법
JPH04352081A (ja) 人物画像認識における前処理方法および後処理方法
JP2007026308A (ja) 画像処理方法、画像処理装置
EP3702958B1 (en) Method for verifying the identity of a user by identifying an object within an image that has a biometric characteristic of the user and separating a portion of the image comprising the biometric characteristic from other portions of the image
CN115546796A (zh) 一种基于视觉计算的无接触式数据采集方法及系统
JPH1125222A (ja) 文字切り出し方法及び文字切り出し装置
JPH04205284A (ja) ナンバープレート認識装置
RU2440609C1 (ru) Способ сегментации растровых изображений на основе выращивания и слияния областей
JP2795860B2 (ja) 文字認識装置
JPH0935058A (ja) 画像認識方法
Lin et al. Improved Binarization Using Morphology-driven Image Resizing and Decomposition
KR100493718B1 (ko) 골프스윙객체 자세추적방법
JP2002230564A (ja) 輪郭抽出装置、方法および輪郭抽出プログラム
KR940007935B1 (ko) 문자 인식을 위한 후보 분류 방법
Jayanthi et al. Group-Scanning by Face Identification and Real time Emotion detection using Faster R-CNN

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100302

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110302

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees