JP3164835B2 - 人物画像認識における前処理方法および後処理方法 - Google Patents

人物画像認識における前処理方法および後処理方法

Info

Publication number
JP3164835B2
JP3164835B2 JP12599391A JP12599391A JP3164835B2 JP 3164835 B2 JP3164835 B2 JP 3164835B2 JP 12599391 A JP12599391 A JP 12599391A JP 12599391 A JP12599391 A JP 12599391A JP 3164835 B2 JP3164835 B2 JP 3164835B2
Authority
JP
Japan
Prior art keywords
image
head
region
face
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP12599391A
Other languages
English (en)
Other versions
JPH04352081A (ja
Inventor
実 飯沼
徹雄 堀ノ内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ikegami Tsushinki Co Ltd
Original Assignee
Ikegami Tsushinki Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ikegami Tsushinki Co Ltd filed Critical Ikegami Tsushinki Co Ltd
Priority to JP12599391A priority Critical patent/JP3164835B2/ja
Publication of JPH04352081A publication Critical patent/JPH04352081A/ja
Application granted granted Critical
Publication of JP3164835B2 publication Critical patent/JP3164835B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Input (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は特定の物体、すなわち動
物体ないし静物体の画像を認識する画像認識に関し、特
に任意の背景画像の中から人物の顔を認識する画像認識
における前処理方法および装置ならびに認識結果を補正
する後処理方法および装置に関する。
【0002】
【従来の技術】通常の画像認識にはパターンマッチング
(あらかじめ登録されてある画像と入力した画像との比
較)によるもの、特徴点比較(あらかじめ登録した画像
の特徴と入力した画像の特徴の比較、解析)によるもの
等がある。画像認識は、近年ではこれ以外に、ニューラ
ルネットワークを用いたバックプロパゲーションによる
認識も研究されている〔岩下正雄(日本電気株式会社C
&C情報研究所)他:“画像処理プロセッサ(ImPP)とニ
ューラルネットワークへの応用”理研シンポジュウム第
9回「非接触計測と画像処理」昭和63年9月22日(木)
及び小杉信(NTTヒューマンインタフェース研究所)
他:“ニューラルネットを用いた顔画像識別の一検討”
テレビジョン学会技術報告Vol.14, No.50, PP. 7〜12,
1990年9月26日(木)発表を参照〕。
【0003】
【発明が解決しようとする課題】従来のパターンマッチ
ングは「パターンの単純比較」であり、従ってロバスト
性(適応力)は低く、また、特徴点比較では「入力で対
象ごとに特徴点を見つけこれをプログラム化する」方式
であるため多大の労力を要した。これに比べ、バックプ
ロパゲーションは、「学習」という作業で簡単に特徴抽
出ができる画期的方法である。しかし、この認識方法を
用いても、パターンがずれた場合では十分な認識ができ
ないことが指摘されている〔緑川博子(成蹊大学):バ
ックプロパゲーションによる顔画像認識の一考察“情報
処理学会第36回(昭和63年前期)全国大会を参照〕。
【0004】撮像装置の被写界にある特定の物体を知
り、その物体の固体差を認識する場合、撮像装置でその
特定の物体の画像を撮像して、その画像を画像認識装置
に入力する。ここで特定の物体と撮像装置の光学系及び
照明系との関係が一定状態を保ち、撮像装置で得られた
画像内容が認識装置の入力として一定のパターンになっ
ていることが、広い意味での画像認識に当たって認識を
向上させる方法である。しかし、認識すべき特定の物体
によっては、一定のパターンで画像を得ることが困難で
ある。
【0005】例えば、固定された位置にある撮像装置の
光学系で、人物の上半身を撮像し、その顔認識を行う場
合は次の問題がある。人物の顔認識の場合、身長の違
い、顔の大きさの違い、撮像装置の光学系との相対関係
(方向、距離、向き)等が異なり、認識対象となる顔領
域部分のみの画像を得るには、複雑な光学系の駆動制御
が必要となる。実際問題として、ある程度の動きのある
人物の場合、光学系で同一のパターンの画像を得ること
は不可能に近い。通常の場合は撮像装置の光学系は固定
されている為、人物が一定位置に存在しなければ、現在
のバックプロパゲーションの認識に必要な一定のパター
ンにならない。従来の画像認識における入力画は、人間
が手助けし加工して同一のパターンとし、それを画像認
識装置への入力としていた。
【0006】このように、前処理がなければ、大きさ、
位置などの補正なしに比較を行うことになるため、この
ような画像認識は、非効率的であり精度も落ちることに
なる。種々の撮像条件において得られた画像の中の人物
の顔を認識する場合では、先ず、画像の中に顔があるか
ないかが問題となる。従って顔があるかどうかを判断す
るためには対象となる顔の条件(見え方、動き、回転、
付帯物、顔自体の変形)、人間の顔としての一般形状、
背景内の顔の出現位置の限定、顔部分の形状抽出アルゴ
リズム、顔背景分離アルゴリズムなどが必要である。さ
らに顔領域抽出後の正規化として、2次元サイズの補
正、顔の3次元的な回転補正、濃度補正、一部しか見え
ない部分の補間、顔の部分変形の補間などが考えられ
る。
【0007】従って、本発明の目的は、認識すべき動物
体の画像の前処理を行うことで、後処理である画像認識
の処理の効率を向上させることにある。また、認識処理
を複数回繰り返し、この結果を総合判断し、最終認識結
果を出すことである。
【0008】
【課題を解決するための手段】上述した問題点を解決す
るため、本発明によれば、特定の物体(動物体ないし静
物体)の画像を認識する画像認識における前処理方法に
おいて、前記特定の物体を抽出する段階と、該物体から
認識すべき領域を抽出する段階と、該抽出した領域を正
規化する段階とから成る前処理方法が提供される。
【0009】前記特定の物体を抽出する段階が、特定物
体画像を含む任意の背景画像と背景のみの画像とを量子
化してその差をとり、その差分を2値化し、これにより
背景画像から特定物体画像を分離し、背景ノイズを除去
し、この結果生ずる特定物体画像部分の欠落を補正する
簡易穴うめ処理を行うことを含み、特定物体画像の一部
である前記認識すべき領域を抽出する段階が、その領域
としての基準にあてはまるかどうかを評価してすべての
条件を満たすものの領域を外接する矩形領域で切り出す
ことを含み、前記正規化する段階が、アフィン変換を含
んでいてもよい。
【0010】また、前記特定の物体から認識すべき領域
を抽出する段階が、その領域としての基準に当てはまる
かどうかを試行するそれぞれの設定値群において、基準
に当てはまる設定値群から、最適とされる設定値群によ
る抽出を行うことを含んでもよい。さらに、前記特定の
物体を抽出する段階が、前記特定物体を含まない背景画
を基準画として固定することを含み、前記特定の物体か
ら認識すべき領域を抽出する段階が、その領域としてそ
の基準に当てはまるかどうかを評価して全ての条件を満
たすものの領域を外接する矩形領域で切り出すことか
ら、切り出された入力画を保存することまでを、入力画
を更新して繰り返すことを含み、前記正規化する段階
が、前記認識すべき領域としての基準に最適な入力画像
を、前記繰り返し処理に当たって使用したデータとを基
に正規化することを含んでもよい。
【0011】また、後処理にあたる画像認識の処理結果
より判断し、撮像装置からの入力画を更新しながら、全
体の処理を複数回繰り返し、それぞれにおける画像認識
の結果より最終的な認識結果を得ることをさらに含んで
もよい。また本発明によれば、特定の物体の画像を含む
画像を入力する画像入力部と、該入力した画像を記憶す
る画像記憶部と、記憶した画像を読みだして特定物体の
画像を抽出する物体画像抽出部と、抽出した物体画像か
ら認識すべき領域を抽出する認識領域抽出部と、該抽出
した領域を正規化する抽出領域正規化部とから成る前処
理装置が提供される。
【0012】前記本発明の前処理方法および前処理装置
においては、特定の物体が人物であり、認識すべき領域
が人物の顔であってもよい。
【0013】
【実施例】以下本発明の一実施例を図面に従って詳述す
る。初めに、前述した各々の処理について説明し、後で
これらの処理が全体としてどのように進められるのかを
説明する。第1図は本発明による画像認識における前処
理を実現する手段、すなわち前処理装置を含む画像認識
システムの構成図である。本発明による前処理は前処理
部1で実現され、この前処理部1は、画像入力部2、画
像記憶部3、特定物体画像抽出部4、認識領域抽出部5
および抽出領域正規化部6で構成される。なお、第1図
には、画像認識の後処理を行う認識処理部7も示されて
いる。
【0014】画像入力部2は、特定物体画像を含む任意
の背景画像および背景のみの画像を入力するカメラ8
と、その入力画像を量子化するビデオデジタイザ9とを
有する。画像記憶部3は、背景のみの画像を基準画とし
て保存する基準画メモリ10と、特定物体を含む画像を
入力画として保存する入力画メモリ11を有する。ま
た、特定物体抽出部4は、後述する濃度変換1、濃度変
換2、濃度変換3、フィルタ処理1およびフィルタ処理
2の各手順を行う手段を有する。なお、フィルタ処理2
を終了した抽出特定画像は画像記憶部3の抽出特定画像
(人物)メモリ12に記憶される。
【0015】さらに、認識領域抽出部5は、後述するよ
うに、頭頂候補点検出、顔の左端右端の検出、顔の領域
決定、顔の領域評価の各手順を行う手段を有する。な
お、顔の領域評価の手順において所望の結果を得られな
かった場合(NG)に、再度上記手順を繰り返すための
顔のパラメータ設定/再設定の手順を行う手段も含まれ
ている。顔の領域評価の手順において所望の結果が得ら
れた場合(OK)に、抽出領域画像を記憶する抽出領域
画像(顔)メモリ13が、前記画像記憶部3に設けられ
ている。
【0016】また、抽出領域正規化部6は、後述するよ
うに、中心補正やサイズ変更およびセンタリングの各手
順を行う手段を有する。なお、正規化された抽出画像
は、画像記憶部3の抽出画像メモリ14に記憶される。
画像記憶部3は、ニューラルネットワークを用いたバッ
クプロパゲーションの学習手順により蓄積された学習デ
ータを記憶する学習データメモリ15を有している。認
識処理部7では、前記抽出画像メモリ14に記憶された
正規化抽出画像と前記学習データとをニューラルネット
ワークにより処理する手順と、その処理結果を評価する
手順を行う。なお、ニューラルネットワークによる処理
は認識演算プロセッサ(ImPP)16により行われる。 1. 特定物体(人物)領域の抽出(前処理1) 特定物体(人物)領域抽出は、特定物体を含まない基準
画と入力画との画像間の差演算により抽出可能である
が、単純な差だけで抽出可能なのは2値画のみである。
例えば多値の場合、一方が、(背景+人物)、他方が
(背景)であるとする。ここで差演算(背景+人物)−
(背景)を行うと、人物の形をした(人物−背景)の濃
度値の画像となってしまう。また、この結果は符号付と
なるなどの特徴がある。この符号は物体の移動中はその
方向も判別可能な要素も持っている。そこで、特定物体
領域の抽出手順では濃度変換を行っている。以下、図2
及び図3について説明する。 1.1 特定物体領域抽出手順 (a) 基準となる背景画をカメラから取り込み、基準画A
として保存する。 (b) 人物+背景画をカメラから取り込み、入力画Bとす
る。 (c) 基準画Aを量子化して得られる各画素の濃度レベル
0〜255 を0〜127 に変換する、すなわち、基準画Aの
濃度を1/2に濃度変換する(濃度変換1)。変換後の
画像を入力画1とすると、濃度変換1の式は、 Da2=Da1/2 となる。(ここで、Da1 は基準画Aの濃度値、Da2 は入
力画1の濃度値である。) (d) 入力画Bの各画素の濃度レベル0〜255 を128 〜25
5 に変換する、すなわち、入力画Bの濃度を1/2に圧
縮し、この濃度に128のバイアスを与える(濃度変換
2)。濃度変換後の画像を入力画2とすると、濃度変換
2の式は、 Db2=(Db1/2)+128 となる。(ここで、Db1 は入力画Bの濃度値、Db2 は入
力画2の濃度値である。) (e) 濃度変換1、2で処理した画像の差(入力画2−入
力画1)をとると、両者の画像の同じ位置で濃度の変化
のない場合は、どのような濃度であってもその差は12
8となる。このことを利用して、実際の場合の量子化誤
差や、背景の時間的変化量等をεと考え、(入力画2−
入力画1)の濃度差が128 ±εレベル以内の位置は画像
が変化しないものとして0とし、それ以外の場所は画像
が変化したものとして1とする2値画像を得る(濃度変
換3)。 (f) 入力画Bと(e) で作成した2値画像とのAND をと
る。これにより特定物体領域を入力画Bから切り出すこ
とができる。 (g) 以上(c) 〜(f) の処理を画像の各画素に対し行い、
特定画像Cを得る。 (h) 特定画像Cの背景ノイズ除去を行う。(フィルタ処
理1) (i) (e) で作成した2値画像において、特定画像の部分
は1、それ以外の部分は0となるのが理想的であるが特
定画像と背景画像の濃度差が±ε以内であれば0となっ
てしまう。これにより、特定画像の領域に欠落が生じる
場合がある。これを補正するために、特定画像Cの簡易
穴埋めを行う。(フィルタ処理2) このように基準画Aを固定する場合は特定物体の領域の
抽出が可能である。また、基準画Aをインターバルで再
取り込みし、3値化する方式では特定物体の動きの方向
の抽出が可能である。
【0017】なお、図2は、上記特定物体領域(動画
像)抽出手順の基本ブロック図であり、図3はそのフロ
ーチャートである。図4は、フィルタ処理1のフローチ
ャートであり、これを参照してノイズ処理について詳述
する。ノイズ除去処理は3×3オペレータにより行う。
3×3オペレータとは、図5の(A)、(B)に示すよ
うな(x,y)アドレスを中心として3×3マトリック
スでデータを取り扱う画像処理手法である。(x,y)
の中心値が変わればオペレータの値も変わる。なお、図
5の(A)はオペレータの座標を示し、図5の(B)は
オペレータ番号に対応する座標で、各座標値はオペレー
タ中心からみた方向を示している。
【0018】一般にオペレータ処理では、入力画像メモ
リと出力画像メモリは別々である。図5の(C)に示す
ように、入力画像メモリの値をオペレータに取り込み、
処理後、値は出力画像メモリに書き込む。説明に当たっ
て、画像(基準画像、入力画像)の大きさ(領域)を
X、Y方向について0〜127 とする。このオペレータ処
理におけるオペレータのスキャンは、図5の(C)に示
すように、アドレス(1,1)より始め、X方向アドレ
スを+1づつ加算し、Xが126 になったら1回目のスキ
ャンを終了し、再びX=1より始めるが、次のスキャン
ではYを+1する。この方法でY=126 まで行う(画像
領域が0〜127 であるため、3×3のオペレータ処理は
1〜126 の範囲を動く)。
【0019】ノイズ除去オペレータ処理の内容は、入力
画から認識すべき領域を抽出するに当たって害となる背
景領域のノイズ除去を主目的とする。ノイズがある場合
のオペレータ内のデータの取り扱いを説明すると、オペ
レータ中心のデータが0以外の値でその周囲の8つの方
向のデータが0であるときはホワイトノイズであり、オ
ペレータ中心のデータが0でその周囲の8つの方向のデ
ータが0以外の値であるときであるときはブラックノイ
ズであるとしている。
【0020】今回は、ホワイトノイズを除去することを
目的とし、且つ、これに或る程度の許容範囲を設ける
(1ドットの縦線、横線はノイズとする)ため、オペレ
ータの8方向すべてデータが0というのではなく、6個
以上のデータが0であるときとした。これに当てはまる
オペレータの例を図6に示す。図7はフィルタ処理2の
フローチャートであり、ここでは、特定物体領域の画像
欠落の補完を主目的とする。これを参照して簡易穴埋め
オペレータ処理について詳述する。穴埋め処理とは、本
来、閉じたエッジ内のデータをすべて指定のデータとす
ることであるが、ここでは簡単な操作で或る程度穴埋め
をする処理として簡易穴埋め処理の原理を示す。
【0021】図8の(A)、(B)に示すような3×2
のオペレータを用いて、オペレータ中心のデータが0
で、オペレータ番号1〜5のうちの何れか2つ以上のデ
ータが0以外の値であるとき、その時のオペレータ中心
のアドレスの出力画像メモリの内容を入力画像の近傍の
値で置き換える。なお、図8の(A)はオペレータの座
標を示し、図8の(B)はオペレータ番号に対応する座
標で、各座標値はオペレータ中心(x,y)からみた方
向を示している。
【0022】簡易穴埋め処理のオペレータを3×3では
なく3×2に選んだのは、オペレータの下方向を見たく
ないからである。もし、下方向を見ると、穴埋め処理を
した時、画像が上方向に1ドット増える。この場合、特
定物体の画像Cの物体領域の頂部の位置が1ドットだけ
Y方向にずれてしまう。 2. 認識すべき領域の抽出(前処理2) 認識すべき領域として人物の顔領域を抽出する方法を以
下に説明する。 2.1 顔のパラメータ 顔領域を抽出する際に、次のパラメータを用いる。
【0023】α :顔の縦の長さの定数 β :顔の横幅の定数 Ylen :顔の横幅を調べるために頭頂からのYの長さ 上の3つのパラメータの関係は次式のように仮定した。 β=0.75α Ylen=0.5α これらのパラメータは、顔の外形を定義するものであ
り、画像中の顔の大きさによって変える必要がある。そ
こでまずα、β、Ylenを大きい値から始めて徐々に小さ
くしていくようにする。つまり図9のように7段階に変
化させる。このようにパラメータを段階的に変化させる
ことにより、大きな顔から小さな顔まで検出できる。
【0024】図9は、顔のパラメータの例を表の形態で
示したもので、i=1のとき、顔領域が後述する顔領域
評価によって正しく抽出されれば、顔領域抽出成功とな
るが、失敗したときはi=2,3・・・というようにα、
β、Ylenを徐々に小さくしてゆき、顔領域が正しく抽出
されるまで、以下に述べる顔領域抽出手順の処理を繰り
返す。つまり、顔のパラメータを変化させることによっ
て、画像中の顔の大きさが異なっても、顔が抽出できる
ようにしている。しかし、i=7までパラメータを変化
させて処理を行っても顔領域が抽出できない場合は、そ
の画像中には顔が存在しないということになる。
【0025】図9の数値は、画像のX、Y方向のそれぞ
れの領域を0〜127の128 ×128 の画像に展開したとき
のそれぞれのパラメータの値である。 2.2 顔領域抽出手順(前処理2) 顔領域抽出手順は、図15に示すように、Y方向頂点
検出(頭頂の候補点検出)、顔の左端、右端の検出、
顔の領域決定、および顔の領域評価の各手順で構成
される。
【0026】この処理を行う時点では、切り出された顔
画像以外の画像の濃度レベルは全て0である。また切り
出された顔画像の濃度レベルは1〜255 である。 2.2.1 頭頂の候補点検出 以下図10、図16を参照しながら頭頂の候補点検出の
手順について説明する。候補点のYアドレスをYmini
する。 (a) すべてのXに対して、上から下(Y軸の増える方
向)に走査し、最初に設定した閾値以上の画素のYアド
レスYminx を求める。頭頂検出の対象となる画像の背景
は前処理1で除去されてある。従って、頭頂検出は、Y
アドレスの上部から下部方向に濃度情報を検索し、1以
上となったときのアドレスを頭頂の候補点要素とする。 (b) 最初の閾値以上のYアドレスYminx をX方向の画素
m個ずつに区切り、各m個の中でYアドレスの最も小さ
い(上にある)ものを頭頂の候補点Ymini とする。 (c) 候補点Ymini からのYラン長が、顔の縦の長さαよ
り短い長さの定数Ylen=0.5 α(αの値は図9のiの値
によって設定される)より小さかったら、候補点から除
去する。Ylen=0.5 αとしたのは、特定画像抽出の際に
背景と同じ濃度レベルの顔の部分が虫食い状態となる場
合があることを考慮したためである。 (d) 隣り合う2つの候補点のX方向の距離が顔の横幅の
定数βの2/3より小さいとき、アドレスの大きい方
(下にある方)を候補点から除去する。
【0027】頭頂の候補点はこの処理によって絞られて
いくが、この処理は候補点の数が変化しなくなるまで繰
り返す。なお、図16のフローチャートの(a),(b),(c),
(d)は上記(a),(b),(c),(d) の手順を示したものであ
る。以上の手順で求めた頭頂の各候補点について、顔領
域を決定し、その顔領域を評価する。それらを次に示
す。 2.2.2 顔の左端、右端の検出 以下図11、図17を参照しながら、顔の左端、右端の
検出手順について説明する。顔の左端のXアドレスをL
x、右端のXアドレスをRxとする。 (a) Ymini から下へ顔の縦の長さより短い長さの定数Yl
en=0.5 αまでのすべてのYについて、以下の処理を行
う。
【0028】(a-1) Ymini iより左へ向かって走査
し、最初の閾値以下となった画素の直前のXアドレスを
求める。 (a-2) Ymini iより右へ向かって走査し、最初の閾値
以下となった画素の直前のXアドレスを求める。 (b) (a-1)で求めたXアドレスのうち、最も小さいもの
を顔の左端Lxとする。 (c) (a-2)で求めたXアドレスのうち、最も大きいもの
を顔の右端Rxとする。
【0029】なお、図17のフローチャートの(a),(b),
(c) は上記(a),(b),(c) の手順を示したものである。 2.2.3 顔の領域決定 図12、図18に示すように、X方向の幅をWx、Y方向
の幅をWyとする矩形領域を顔の領域とする。顔は縦に長
いが、その比率Rをα、βより求める。
【0030】α:顔の縦の長さの定数 β:顔の横幅の定数 2.2.4 顔領域の評価 図13、図19を参照しながら、顔領域の評価手順につ
いて説明する。決定された領域が顔らしいかどうかを評
価する。顔領域が以下の4つの条件を満足したとき顔領
域抽出成功とする。 (a) 顔領域のX方向幅Wxが次の範囲であるか。
【0031】 β−4≦Wx≦β+4 β:顔の横幅の定数 この式は顔幅の評価を規定している。(ここで4の数値
は、画面を128 ×128 の画素としたときの画素数を表
す。) (b) 頭頂の候補点のXアドレスXmini と顔領域の左端L
x、右端RxとのそれぞれのX距離の比が次の範囲である
か。
【0032】 1/3≦(Rx−Xmini ) /(Xmini −Lx)≦3 この式は、頭頂の頭の中心からのずれを評価したもの
で、頭頂は中央近辺にあるはずであるということの評価
にもとづくものである。 (c) 顔領域底辺部に閾値以上の画素が存在するか。これ
は顔の下には首、胴体がつながっているということの評
価である。逆に言えば、領域底辺部に閾値以上の画素が
存在しないときは、顔ではないと言うことになる。 (d) 顔領域内の閾値以上の画素の割合いは60%以上か。
【0033】なお、図19のフローチャートの(a),(b),
(c),(d) は上記(a),(b),(c),(d) の手順を示したもので
ある。“60%以上”の根拠について以下図14を参照し
ながら説明する。 1) まず楕円とその楕円に外接する矩形との面積比につ
いて考える。楕円の長軸を2b、短軸を2aとする。半
径aの面積S1はπ・a2である。楕円の面積S2はガバリエ
リの原理より S2=(b/a)・S1=(b/a)・π・a2=π・a・b また外接する矩形の面積S3は4・a・bである。 よって楕円と外接する矩形の面積比は (S2/S3)・100 =( π・a・b)/(4・a・b)・100
=78.5〔%〕 2) 1)では78.5%以上のときに顔であると判断したい
が、特定画像抽出の際に、背景と同じ濃度レベルの顔の
部分が虫食い状態となる場合がある。よって顔領域内の
閾値以上の画素の割合いは60%以上のとき、顔であると
判断するようにした。 3. 顔領域の正規化(前処理3) 3.1 正規化処理手順 図20のように128 ×128 ドットの入力画像より長方形
の顔の部分のみを切り出し、これを128 ×128 の画素か
らなる画枠内におさまるように正規化する。図21のフ
ローチャートの(a), (b),(c) の部分に対応して以下の
手順により処理する。 (a) 正規化パラメータの初期設定 平行移動X(1回目)m=−m1 平行移動X(2回
目)m=m2 平行移動Y(1回目)n=−n1 平行移動Y(2回
目)n=n2 スケールS s=Wy/Vy (b) 正規化変換式 変換後のアドレスを(X,Y)、変換前を(x,y)と
すると変換式は以下のようになる。変換1回目は入力画
像の中心補正及びサイズ変更を行い、変換2回目は、変
換画像のセンタリングを行う。
【0034】 X=(x−m1)/s+m2 Y=(y−n1)/s+n2 である。ただし、 m1=Lx m2=(128 −128/R)/2 n1=Ymini n2=0 s=Wy/128 R=α/β(R≧1) α:顔の長さの定数、β:顔の
幅の定数 である。 (c) 変換後の画像の表示及びその画像ファイルへの格納 4.各々の処理の進め方 本発明の部分を画像認識に関わる全体のシステムの視点
で捉えると本発明の処理の進め方として次の3つに大別
される。 4.1 認識すべき領域の抽出におけるそれぞれの手順の繰
り返し 2.1 項で述べた顔のパラメータ群(i=1、2、3、
…)において、先ずは、i=1の設定値を使用して処理
を行い顔領域の評価を行う。この結果、条件を満足しな
い場合、iの設定値を次の設定値に更新し、これらの手
順を再び行い再評価を行う。この手順は顔領域の評価に
おいて条件を満足するまで繰り返す。この評価条件が満
足された時点で、次の顔領域の正規化の処理へ進む。
【0035】この方法の変形として、全てのiの設定値
について顔領域の評価を行い、条件を満足したiの値か
ら最適なiの設定値を予測する方法もある。例えばiの
設定値を多く設けて条件を満足する複数個のi値を求
め、そのi値の中央のi値の設定による領域のデータを
採用したり、また、条件を満足する度合いの一番大きい
i値の設定を採用する方法もある。これらの方法は認識
態様によっては実験を行いその評価結果からより良い方
法を選択すべきである。4.2 4.1項の方法を含
み、特定物体(人物)領域の抽出手順と認識すべき領域
の抽出の繰り返しこの方法は、基準画を固定し、入力画
を得た後に上記4.1項による手順を領域の抽出の段階
まで行い、この結果を保存し、次に新たな入力画を得て
再びこれらの手順を繰り返す方法である。この方法で
は、顔領域の抽出成功に至らない場合に、新たな人物画
像を得て抽出成功となるまで繰り返して、画像の制限を
行い、その回数の中で一番、評価が高い画像を得る方法
を採用することになる。
【0036】この方法においては入力する画像のタイミ
ングによって、得られる画像に違いがあることを前提に
している。従って、4.1 項では繰り返す場合の設定値と
してiの値のみ更新しているが、本方法の場合はiの繰
り返しは勿論、評価基準の設定値もiと同様に設定値群
として予め設けて置き、高い評価基準に合致した入力画
とその認識領域の抽出データとを得ることもできる。
【0037】図22ないし図26は、本発明の画像認識
における前処理1、前処理2および前処理3ならびに後
処理である認識処理の各処理およびそれらの全ての処理
を実現する機器の構成例をそれぞれ示したものである。
なお、図22ないし図26の矢印は、各機器間における
データの流れを示す。図22の機器の構成例は、特定の
物体すなわち動物体ないし静物体の画像を認識するため
の前処理として、特定物体を抽出する段階を実現するも
のである。
【0038】画像入力部21は、基準となる背景画(基
準画A)および人物+背景画(入力画B)を取り込むた
めに必要な機器、すなわち白黒モニタ、カメラおよびビ
デオデジタイザで構成される。画像処理部22は、上記
の取り込んだ画像を格納ないし画像処理するためのフレ
ームメモリで構成される。
【0039】中央演算処理部24は、前処理1の手順を
制御する機能を行うCPU(例えば80386)で構成
される。ここにおいて、この中央演算処理部24は、前
述の「1.特定物体(人物)領域の抽出」の(a)〜
(i)の作業を各機器に指示する。処理結果表示部25
は、前処理1における画像処理部22で処理した画像の
表示および中央演算処理部24の処理情報をアナログR
GBで表示する機能を持つ。この表示機能により特定物
体の画像が抽出されたかを画像で確認することができ
る。
【0040】図23の機器の構成例は、特定の物体すな
わち動物体ないし静物体の画像を認識するための前処理
として、認識すべき領域を抽出する段階を実現するもの
である。画像処理部22は、切り出した特定画像を格納
するためのフレームメモリで構成される。
【0041】中央演算処理部24は、前処理2の手順を
制御する機能を行うCPU(例えば80386)で構成
される。ここにおいて、この中央演算処理部24は、前
述の「2.認識すべき領域の抽出」の作業を画像処理部
22を用いて処理する。処理結果表示部25は、前処理
2において画像処理部22で処理した画像の表示および
中央演算処理部24の処理情報をアナログRGBで表示
する機能を持つ。この表示機能により特定物体の認識す
べき画像が抽出されたかを画像で確認することができ
る。
【0042】図24の機器の構成例は、特定の物体すな
わち動物体ないし静物体の画像を認識するための前処理
として、認識すべき領域を正規化する段階を実現するも
のである。画像処理部22は、抽出した特定画像を格
納、正規化するためのフレームメモリで構成される。
【0043】中央演算処理部24は、前処理3の手順を
制御する機能を行うCPU(例えば80386)で構成
される。ここにおいて、この中央演算処理部24は、前
述の「3.顔の正規化」の作業を画像処理部22を用い
て処理する。処理結果表示部25は、前処理3において
画像処理部22で処理した画像の表示および中央演算処
理部24の処理情報をアナログRGBで表示する機能を
持つ。この表示機能により特定物体の認識すべき画像が
正規化されたかを画像で確認することができる。
【0044】図25の機器の構成例は、特定の物体すな
わち動物体ないし静物体の画像を認識するための前処理
に引き続いて、この画像を認識する後処理の段階を実現
するものである。認識処理部23は、データ格納部26
より読み出した認識対象である正規化後の画像ファイ
ル、認識の比較基準となる登録画像ファイル、およびこ
れら2つの画像の特徴を調べるための学習ファイルを用
いて認識処理を行うImPPボードで構成される。認識処理
部23は認識処理を高速に行うための手段として用いら
れているのであり、この処理は中央演算処理部24でも
代行可能である。
【0045】中央演算処理部24は、認識処理の手順を
制御する機能を行うCPU(例えば80386)で構成
される。ここより認識処理部23に指示を与え、データ
格納部26を用いて認識処理を行う。処理結果表示部2
5は、認識処理における認識処理部23で処理した演算
結果を中央演算処理部24の指示によりアナログRGB
で表示する機能を持つ。認識結果がどの程度であるか
は、特徴の一致する割合を表現する方式とする。
【0046】データ格納部26には、認識対象である正
規化後の画像ファイル、認識の基準となる登録画像ファ
イル、およびこれらの2つの画像の特徴を調べるための
学習ファイルが格納してある。図26は、本発明の画像
認識における前処理1、前処理2および前処理3ならび
に後処理である認識処理の全ての処理を実現する機器の
構成例を示したものである。
【0047】画像入力部21は、基準となる背景画(基
準画A)および人物+背景画(入力画B)を取り込むた
めに必要な機器、すなわち白黒モニタ、カメラおよびビ
デオデジタイザで構成される。画像処理部22は、上記
の取り込んだ画像を格納ないし画像処理するためのフレ
ームメモリで構成される。
【0048】認識処理部23は、データ格納部26より
読み出した認識対象である正規化後の画像ファイル、認
識の比較基準となる登録画像ファイル、およびこれら2
つの画像の特徴を調べるための学習ファイルを用いて認
識処理を行うImPPボードで構成される。認識処理部23
は認識処理を高速に行うための手段として用いられてい
るのであり、この処理は中央演算処理部24でも代行可
能である。
【0049】中央演算処理部24は、前処理1、前処理
2、前処理3および後処理の手順を制御する機能を行う
CPU(例えば80386)で構成される。ここにおい
て、この中央演算処理部24は、前述の「1.特定物体
(人物)領域抽出」の(a)〜(i)の作業を各機器に
指示し、前述の「2.認識すべき領域の抽出」の作業お
よび「3.顔領域の正規化」の作業を画像処理部22を
用いて処理し、後処理である「認識処理」の作業をデー
タ格納部26を用いて処理する。
【0050】処理結果表示部25は、前処理1、前処理
2、前処理3および後処理において画像処理部22で処
理した画像の表示および中央演算処理部24の処理情報
をアナログRGBで表示する機能を持つ。この表示機能
により特定物体の画像が抽出されたかを画像で確認する
ことができる。データ格納部26には、認識対象である
正規化後の画像ファイル、認識の基準となる登録画像フ
ァイル、およびこれらの2つの画像の特徴を調べるため
の学習ファイルが格納してある。
【0051】
【発明の効果】本発明によれば、特定の動物体ないし静
物体の画像を認識する画像認識における前処理を行うこ
とにより、後処理である画像認識の処理の効率を向上さ
せることができる。すなわち、実際の物体の画像認識に
おいて、撮像装置と物体との間の位置的な相対関係に厳
密な条件を必要としない。後処理に当たる画像認識処理
の為の入力のパターンを一致させる作業が簡単となる。
画像の認識において、入力画像に対して厳密なパターン
の一致を要求しないで十分な認識が可能となる。画像認
識の精度を向上させることができる。認識に当たって不
要な背景等の画素を除去し、注目したい特定物体のみの
画像を切り出すことにより、監視などの目的において全
画面をくまなく注視する必要がなくなる。
【図面の簡単な説明】
【図1】本発明の構成を示すブロック図である。
【図2】本発明の特定物体領域抽出手順を示す基本ブロ
ック図である。
【図3】本発明の特定物体領域抽出手順を示すフローチ
ャートである。
【図4】上記特定物体領域抽出手順の内のフィルタ処理
1の手順を示すフローチャートである。
【図5】上記フィルタ処理1におけるオペレータの座
標、オペレータ番号に対応する座標、オペレータ処理お
よびオペレータのスキャン操作を示す図である。
【図6】上記フィルタ処理1におけるノイズ除去オペレ
ータ処理のノイズの例を示すフローチャートである。
【図7】上記特定物体領域抽出手順の内のフィルタ処理
2の手順を示すフローチャートである。
【図8】上記フィルタ処理2におけるオペレータの座標
およびオペレータ番号に対応する座標を示す図である。
【図9】本発明の顔領域抽出手順における顔のパラメー
タの表を示す図である。
【図10】上記顔領域抽出手順の内の頭頂の候補点検出
手順を示す図である。
【図11】上記顔領域抽出手順の内の顔の左端、右端検
出手順を示す図である。
【図12】上記顔領域抽出手順の内の顔の領域決定手順
を示す図である。
【図13】上記顔領域抽出手順の内の顔領域評価手順を
示す図である。
【図14】上記顔領域抽出手順における楕円と外接する
矩形との面積比を示す図である。
【図15】本発明の顔領域抽出手順のフローチャートで
ある。
【図16】上記顔領域抽出手順の内の頭頂の候補点検出
手順のフローチャートである。
【図17】上記顔領域抽出手順の内の顔の左端、右端検
出手順のフローチャートである。
【図18】上記顔領域抽出手順の内の顔の領域決定手順
のフローチャートである。
【図19】上記顔領域抽出手順の内の顔領域評価手順の
フローチャートである。
【図20】上記顔領域の正規化手順における顔の切り出
し、128×128ファイルへの顔の大きさの正規化の
例を示す図である。
【図21】上記顔領域の正規化手順のフローチャートで
ある。
【図22】本発明の前処理1で使用する機器の構成例を
示すブロック図である。
【図23】本発明の前処理2で使用する機器の構成例を
示すブロック図である。
【図24】本発明の前処理3で使用する機器の構成例を
示すブロック図である。
【図25】本発明の前処理に引き続いて行われる後処理
である認識処理で使用する機器の構成例を示すブロック
図である。
【図26】本発明の前処理および後処理である認識処理
の全てを含むシステムで使用する機器の構成例を示すブ
ロック図である。
【符号の説明】
1 前処理部 2 画像入力部 3 画像記憶部 4 特定物体画像抽出部 5 認識領域抽出部 6 抽出領域正規化部 7 認識処理部 8 カメラ 9 ビデオデジタイザ 10 基準画メモリ 11 入力画メモリ 12 抽出特定画像(人物)メモリ 13 抽出領域画像(顔)メモリ 14 抽出画像メモリ 15 学習データメモリ 16 認識演算プロセッサ(ImPP) 21 画像入力部 22 画像処理部 23 認識処理部 24 中央演算処理部 25 処理結果表示部 26 データ格納部

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】 人物候補領域を抽出する段階と、前記人
    物候補領域から頭部領域を抽出する段階と、前記頭部領
    域を評価する段階と、前記抽出、評価した頭部領域を正
    規化する段階から成る人物画像認識の前処理方法におい
    て、 前記人物候補領域から頭部領域を抽出する段階が、 この人物候補領域から頭頂候補を求め、 この頭頂候補から頭部の左右端を求め、 この左右端から頭部横幅を特定し、 この頭部横幅に所定の値をかけることにより頭部縦幅を
    特定し、 前記頭頂候補を基準として前記頭部横幅と前記頭部縦幅
    からなる矩形領域を抽出することを特徴とする人物画像
    認識の前処理方法。
  2. 【請求項2】 前記人物候補領域を抽出する段階が、人
    物候補領域を含む任意画像とその背景画像とをそれぞれ
    量子化し、その差をとり、その差分を2値化し、これに
    より背景画像から人物候補領域を分離し、背景ノイズを
    除去し、この結果生じる人物候補領域の欠落を補正する
    穴埋め処理を行うことを含み、 前記頭部領域を正規化する段階が、アフィン段階を含
    む、 請求項1記載の前処理方法。
  3. 【請求項3】 前記頭部領域を抽出する段階が、領域の
    大きさが変化しても、頭部領域を誤らずに抽出すること
    を可能とするために、大きな頭部の設定値から小さな頭
    部の設定値まで、設定基準を変化させ、最適な設定値を
    当てはめ、頭部領域を抽出することを含む請求項1に記
    載の前処理方法。
  4. 【請求項4】 前記頭部領域を評価する段階が、領域と
    してその基準に当てはまるかどうかを評価する条件を満
    たすものとして、頭部領域の幅がある頭部領域の大きさ
    に見合う横幅の範囲内かどうかの評価と、頭頂位置が頭
    部領域の左端、右端の中央付近にあるかどうかの評価
    と、頭部領域の底部は胴体と繋がっているかどうかの評
    価と、頭部の外接矩形領域と頭部領域の比がある割合以
    内かどうかの評価を含む請求項1に記載の前処理方法。
  5. 【請求項5】 人物候補領域を含まない任意の背景画像
    を基準画像として固定し、前記請求項1に記載の前処理
    方法を繰り返し、前記正規化する段階が、前記頭部領域
    を、前繰り返し処理で求めた場所に基づいて、正規化す
    ることを含む前処理方法。
  6. 【請求項6】 請求項1ないし5のいずれかに記載の前
    処理方法を行った後、画像認識の処理結果より判断し、
    撮像装置からの入力画像を更新しながら、全体の処理を
    複数回繰り返し、それぞれにおける画像認識結果に基づ
    いて最終結果を得る後処理方法。
JP12599391A 1991-05-29 1991-05-29 人物画像認識における前処理方法および後処理方法 Expired - Fee Related JP3164835B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP12599391A JP3164835B2 (ja) 1991-05-29 1991-05-29 人物画像認識における前処理方法および後処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP12599391A JP3164835B2 (ja) 1991-05-29 1991-05-29 人物画像認識における前処理方法および後処理方法

Publications (2)

Publication Number Publication Date
JPH04352081A JPH04352081A (ja) 1992-12-07
JP3164835B2 true JP3164835B2 (ja) 2001-05-14

Family

ID=14924070

Family Applications (1)

Application Number Title Priority Date Filing Date
JP12599391A Expired - Fee Related JP3164835B2 (ja) 1991-05-29 1991-05-29 人物画像認識における前処理方法および後処理方法

Country Status (1)

Country Link
JP (1) JP3164835B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7698696B2 (en) 2002-07-03 2010-04-13 Panasonic Corporation Compiler apparatus with flexible optimization

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3410779B2 (ja) * 1993-09-28 2003-05-26 株式会社ソキア 画像入力装置における移動ステージの校正方法
JP2005196519A (ja) * 2004-01-08 2005-07-21 Sony Corp 画像処理装置および方法、記録媒体、並びにプログラム
JP5189913B2 (ja) * 2008-07-14 2013-04-24 イーストマン コダック カンパニー 画像処理装置
JP2016177755A (ja) * 2015-03-23 2016-10-06 日本電気株式会社 注文端末装置、注文システム、客情報生成方法、及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7698696B2 (en) 2002-07-03 2010-04-13 Panasonic Corporation Compiler apparatus with flexible optimization
US8418157B2 (en) 2002-07-03 2013-04-09 Panasonic Corporation Compiler apparatus with flexible optimization

Also Published As

Publication number Publication date
JPH04352081A (ja) 1992-12-07

Similar Documents

Publication Publication Date Title
Wenyin et al. From raster to vectors: extracting visual information from line drawings
Hori et al. Raster-to-vector conversion by line fitting based on contours and skeletons
JP4993615B2 (ja) 画像認識方法および装置
Gour et al. Fingerprint feature extraction using midpoint ridge contour method and neural network
JP2007025902A (ja) 画像処理装置、画像処理方法
EP1679655A1 (en) Face image candidate area search method, face image candidate area search system, and face image candidate area search program
JP3164835B2 (ja) 人物画像認識における前処理方法および後処理方法
KR101192365B1 (ko) 얼굴 검출 시스템 및 그 방법
JP3223384B2 (ja) 濃淡画像のパターンマッチング装置
JP4221534B2 (ja) 2値画像の特徴量抽出方法
JP5625196B2 (ja) 特徴点検出装置、特徴点検出方法、特徴点検出プログラム及び記録媒体
US7136515B2 (en) Method and apparatus for providing a binary fingerprint image
JP2002133424A (ja) 文書の傾き角度及び境界の検出方法
RU2440609C1 (ru) Способ сегментации растровых изображений на основе выращивания и слияния областей
EP3702958A1 (en) Method for verifying the identity of a user by identifying an object within an image that has a biometric characteristic of the user and separating a portion of the image comprising the biometric characteristic from other portions of the image
KR100493718B1 (ko) 골프스윙객체 자세추적방법
JP2795860B2 (ja) 文字認識装置
JP2002230564A (ja) 輪郭抽出装置、方法および輪郭抽出プログラム
JP2956151B2 (ja) 画像処理方法及びその装置
JPH09245166A (ja) パターンマッチング装置
KR940007935B1 (ko) 문자 인식을 위한 후보 분류 방법
JPH0935058A (ja) 画像認識方法
JP2803224B2 (ja) パターンマッチング方法
JPH03175591A (ja) 文字認識装置
JP2006092151A (ja) 領域検出装置、領域検出プログラムおよび領域検出方法

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100302

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110302

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees