JP2007257087A - Skin color area detecting device and skin color area detecting method - Google Patents

Skin color area detecting device and skin color area detecting method Download PDF

Info

Publication number
JP2007257087A
JP2007257087A JP2006077692A JP2006077692A JP2007257087A JP 2007257087 A JP2007257087 A JP 2007257087A JP 2006077692 A JP2006077692 A JP 2006077692A JP 2006077692 A JP2006077692 A JP 2006077692A JP 2007257087 A JP2007257087 A JP 2007257087A
Authority
JP
Japan
Prior art keywords
skin color
data
image data
unit
histogram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006077692A
Other languages
Japanese (ja)
Inventor
Masahide Kaneko
正秀 金子
Junichi Imai
順一 今井
Tetsushi Takahashi
哲史 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electro Communications NUC
Original Assignee
University of Electro Communications NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electro Communications NUC filed Critical University of Electro Communications NUC
Priority to JP2006077692A priority Critical patent/JP2007257087A/en
Publication of JP2007257087A publication Critical patent/JP2007257087A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a skin color area detecting method hardly having erroneous recognition in dynamic image data, and capable of quickly corresponding to unforseen situations. <P>SOLUTION: Existence of a face of a person is specified from an input image, and a skin color distribution model is created from pixel data of skin color in the specified face area. Skin color distribution models created from skin color data of a variety of people are prepared beforehand, and a skin color distribution model created from input image data and a "corrected skin color distribution model" added with weighting are created. In the corrected skin color distribution model, an appropriate skin color likelihood can be derived even when another person suddenly appears in the input image data, while deriving a large skin color likelihood with respect to the skin color in the input image data. Comparison with a threshold of the derived skin color likelihood is carried out to determine whether respective pixel data groups in the input image data are the skin color or not. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、肌色領域の検出装置及び方法に適用して好適な技術に関する。   The present invention relates to a technique suitable for application to a skin color region detection apparatus and method.

画像データから、顔の領域や、顔を含めた肌色の領域を検出するための技術が、様々なアプリケーションにおいて求められている。
例えば、ロボットが人間と対話する際には、相手が人間であることを認識できることが必要である。人間であることを認識するには、発声を認識する技術と、肌色を認識する技術が必要になる。
例えば、人物を撮影している動画データに対して背景と着用している服を全く別の画像と差し替える、等というような特殊効果を行うには、肌色を認識する技術と、頭髪を認識する技術が必要になる。
A technique for detecting a face area and a skin color area including a face from image data is required in various applications.
For example, when a robot interacts with a human, it is necessary to be able to recognize that the other party is a human. In order to recognize being a human, technology for recognizing utterances and technology for recognizing skin tone are required.
For example, to perform special effects such as replacing the background and the clothes you are wearing with completely different images for moving image data of a person, you can recognize skin color and hair. Technology is needed.

なお、発明者は任意の画像データから肌色領域を検出する発明を、特許文献1として出願済みである。
特許文献1に開示される発明の大まかな技術内容は、以下の通りである。
(1)できるだけ多くの人物の顔写真データから肌色のサンプルデータを収集する。
(2)収集した肌色画像データをHSV変換して、肌色の(H,S)データを集める。
(3)集めた肌色(H,S)データのヒストグラムを作成する。
(4)ヒストグラムを複数のガウス分布モデルの組み合わせにて近似し、混合ガウス分布モデルのパラメータを得る。
(5)入力画像データの各要素に対して前記混合ガウス分布モデルのパラメータを用いて、肌色尤度を算出する。
(6)算出した肌色尤度を閾値と比較して、肌色であるか否かを判定する。
特許文献1の発明は、多種多様な人種や人物の肌色画像データから肌色の混合ガウス分布モデルを作成し、これを基に肌色であるか否かの判定を行う、いわば「汎用的な肌色検出技術」である。
特開2004−246424号公報
The inventor has filed an application for detecting a skin color area from arbitrary image data as Patent Document 1.
The general technical contents of the invention disclosed in Patent Document 1 are as follows.
(1) Collect skin color sample data from face photo data of as many people as possible.
(2) The collected flesh color image data is HSV converted to collect flesh color (H, S) data.
(3) Create a histogram of the collected skin color (H, S) data.
(4) A histogram is approximated by a combination of a plurality of Gaussian distribution models to obtain parameters of a mixed Gaussian distribution model.
(5) The skin color likelihood is calculated for each element of the input image data using the parameters of the mixed Gaussian distribution model.
(6) The calculated skin color likelihood is compared with a threshold value to determine whether the skin color is used.
The invention of Patent Document 1 creates a skin color mixed Gaussian distribution model from skin color image data of a wide variety of races and persons, and determines whether it is a skin color based on this, so-called “general skin color” Detection technology ".
JP 2004-246424 A

特許文献1による汎用的な肌色領域検出装置では、ノイズを拾い易い。
例えば、ロボットがある部屋に置かれ、対話する相手が一人の日本人である場合に、汎用的肌色検出技術を用いると、机の木目を黒人の肌と誤認識したり、机の上にある白い紙を白人の肌と誤認識する可能性が生じる。
In the general-purpose skin color area detection device according to Patent Document 1, it is easy to pick up noise.
For example, if a robot is placed in a room and the conversation partner is a Japanese, using the general skin color detection technology, the wood grain of the desk may be misrecognized as black skin or on the desk There is a possibility that white paper may be mistaken for white skin.

本発明はかかる点に鑑みてなされたものであり、特に動画像データにおいて、誤認識が少なく、且つ、予期しない状況が発生しても迅速に適応できる、肌色領域の検出方法を提供することを目的とする。   The present invention has been made in view of the above points, and provides a skin color region detection method that is less likely to be misrecognized especially in moving image data and can be quickly applied even when an unexpected situation occurs. Objective.

上記課題を解決するための本発明は、
入力画像データから肌色と思しき画素データを抽出する肌色画素抽出部と、
前記肌色画素抽出部にて得られた前記肌色画素データが有する色に関する情報からヒストグラムを生成するヒストグラム生成部と、
前記ヒストグラム生成部にて得られた前記ヒストグラムを近似処理して、第1の統計モデルを得るヒストグラム近似部と、
前記ヒストグラム近似部にて得られた第1の統計モデルと、前記第1の統計モデルとは異なる第2の統計モデルとを重み付け加算処理する複合統計モデル作成部と、
前記複合統計モデル作成部にて得られた複合統計モデルを用いて、前記入力画像データの画素データに対応する肌色尤度を求め、得られた前記肌色尤度を閾値と比較して、前記画素データが肌色であるか否かを判定し、前記判定結果に基づいて入力画像データに対する肌色領域検出結果を得る二値化処理部と、
前記二値化処理部の結果得られた肌色領域検出結果を前記閾値の更新に利用する閾値更新部と
よりなることを特徴とする肌色領域検出装置としたものである。
The present invention for solving the above problems is as follows.
A skin color pixel extraction unit that extracts pixel data that seems to be skin color from input image data;
A histogram generation unit that generates a histogram from information about the color of the skin color pixel data obtained by the skin color pixel extraction unit;
A histogram approximation unit that approximates the histogram obtained by the histogram generation unit to obtain a first statistical model;
A composite statistical model creation unit that performs weighted addition processing on the first statistical model obtained by the histogram approximation unit and a second statistical model different from the first statistical model;
Using the composite statistical model obtained by the composite statistical model creation unit, the skin color likelihood corresponding to the pixel data of the input image data is obtained, the obtained skin color likelihood is compared with a threshold value, and the pixel A binarization processing unit that determines whether or not the data is skin color, and obtains a skin color area detection result for the input image data based on the determination result;
The skin color area detection apparatus includes a threshold color update unit that uses the skin color area detection result obtained as a result of the binarization processing unit to update the threshold value.

任意の入力画像中に多種多様の肌色のバリエーションを持つ人物が多数含まれる可能性はまれである。すなわち、従来技術である特許文献1の技術では、汎用性が高いが故にどうしてもノイズを含んでしまう。そこで、入力画像から人物の顔の存在を特定し、特定した顔領域中に肌色の画素データがあれば、その画素データに類似する肌色画素データが画像データ全体に存在するものと推定し、入力画像データを肌色であるか否かと推定する為の統計モデル(以下「肌色モデル」)を作成する。
しかし、この方法だけでは顔領域が正しく検出できなかった場合に誤検出を引き起こす可能性がある。
そこで、特許文献1の技術思想を一部流用し、多種多様な人物の肌色データより作成した統計モデルを予め用意しておき、入力画像データから作成した肌色モデルと重み付け加算した修正モデル(以下「修正肌色モデル」)を作成する。
修正肌色モデルは入力画像データ中の肌色に対して大きな尤度を導出しつつ、入力画像データ中に突然別の人物が飛び込んで来ても、相応の尤度を導出することができる。
こうして導出した、画素データに対する肌色の尤度を閾値と比較して、入力画像データ中の個々の画素データ群に対し、肌色であるか否かを極めて迅速且つ精度良く判定することができる。
It is rare that a large number of persons having various skin color variations are included in an arbitrary input image. That is, the technique of Patent Document 1 which is a conventional technique has high versatility, and therefore noise is inevitably included. Therefore, the presence of a human face is identified from the input image, and if there is skin color pixel data in the identified face area, it is assumed that skin color pixel data similar to the pixel data exists in the entire image data, and input A statistical model (hereinafter referred to as “skin color model”) for estimating whether the image data is a skin color or not is created.
However, this method alone may cause false detection when the face area cannot be detected correctly.
In view of this, a statistical model created from skin color data of a wide variety of people is prepared in advance using a part of the technical idea of Patent Document 1, and a modified model (hereinafter referred to as “the skin color model created from input image data” is weighted and added. Create a modified skin color model ").
The corrected skin color model can derive a large likelihood for the skin color in the input image data, and can derive a corresponding likelihood even if another person suddenly jumps into the input image data.
The likelihood of the skin color for the pixel data thus derived is compared with a threshold value, and it can be determined very quickly and accurately whether the individual pixel data group in the input image data is the skin color.

本発明により、比較的少ない演算量にて、データ量の多い画像データから肌色の領域を極めて迅速且つ精度良く判定することができる。
本発明は、静止画像においても有用であるが、データ量が多く、迅速な処理を要求される動画像を利用するアプリケーションに対して特に有益である。
According to the present invention, it is possible to determine a skin color region from image data having a large amount of data with a relatively small amount of calculation extremely quickly and accurately.
The present invention is useful for still images, but is particularly useful for applications using moving images that require a large amount of data and require rapid processing.

以下、本発明の第1の実施の形態を、図1〜図4を参照して説明する。   Hereinafter, a first embodiment of the present invention will be described with reference to FIGS.

図1は、本発明の第1の実施の形態に係る肌色領域検出装置の機能ブロック図である。   FIG. 1 is a functional block diagram of a skin color area detecting apparatus according to the first embodiment of the present invention.

肌色領域検出装置1の主要部分は、実際にはコンピュータプログラムにて提供される機能である。
画像情報取得部2では、所定の手法にてカラー画像データを取得する。カラー画像データを取得する手段は何でも良い。本実施形態においては、例えば動画を撮影可能な周知のCCDカメラである。
画像データは静止画でも良い。しかし、必ずカラー画像である必要がある。本発明は入力画像データから肌色領域を推定する技術であり、色に関する情報がない限り、本発明は実現し得ないからである。
但し、本実施形態において、画像データの大まかな処理は1つの静止画像単位にて行われる。これは本実施形態が後述する顔領域認識処理に依存するからである。
なお、以下の説明において、画像データは一つの静止画像を構成するデータの集合体を意味し、画素データとは所定のXY座標にて位置が表現される1ドット毎の色や明るさ等を表現するデータを意味する。すなわち、画像データは画素データの集合体である。
The main part of the skin color area detection apparatus 1 is actually a function provided by a computer program.
The image information acquisition unit 2 acquires color image data by a predetermined method. Any means for acquiring color image data may be used. In the present embodiment, for example, a well-known CCD camera capable of shooting a moving image.
The image data may be a still image. However, it must be a color image. This is because the present invention is a technique for estimating a skin color region from input image data, and the present invention cannot be realized unless there is information about color.
However, in the present embodiment, rough processing of image data is performed in units of one still image. This is because the present embodiment depends on a face area recognition process described later.
In the following description, image data refers to a collection of data constituting one still image, and pixel data refers to the color, brightness, etc. of each dot whose position is expressed by a predetermined XY coordinate. Means the data to be represented. That is, the image data is a collection of pixel data.

入力画像データは多くの場合RGB乃至はYMCK等の、所定のアプリケーションソフトウェアやハードウェア等が取り扱う際に適した情報である。これを、HSV変換する。
HSV変換部3は、RGB形式のカラー画像データを色相(Hue)、彩度(Saturation)、明度(Value)の三要素に変換する(以下、それぞれ「H」「S」「V」と略す。また「H成分」「S成分」「V成分」は、画素データ中の、それぞれの情報成分を表し、「Hデータ」「Sデータ」「Vデータ」は、HSV変換部3にて変換された各々の成分のデータを表す。)。これはカラー画像データから明度に関する情報V成分を抜き取り、入力画面の明暗に依存しない色情報H成分とS成分を取り扱う為と、明度に関する情報V成分は後述の色情報に依存しない顔領域抽出方法に使用するためである。
HSV変換は周知技術であり、詳細については本願と同一発明者よりなる特許文献1に一部詳述されているので割愛する。
In many cases, the input image data is information suitable for handling by predetermined application software or hardware such as RGB or YMCK. This is HSV converted.
The HSV converter 3 converts RGB color image data into three elements of hue, saturation, and value (hereinafter abbreviated as “H”, “S”, and “V”, respectively). “H component”, “S component”, and “V component” represent respective information components in the pixel data, and “H data”, “S data”, and “V data” are converted by the HSV conversion unit 3. Represents the data for each component.) This is because the information V component related to lightness is extracted from the color image data, and the color information H component and S component independent of the light and darkness of the input screen are handled. It is for use in.
HSV conversion is a well-known technique, and details are omitted because it is described in part in Patent Document 1 consisting of the same inventor as the present application.

ヒストグラム生成部4は、一つの静止画像データに含まれるH,Sデータの組よりなるデータ群とVデータの群を用いて、肌色に対応するH成分とS成分の組の出現頻度をヒストグラム化する。この処理については後に図2にて詳述する。
ヒストグラム生成部4にて得られるヒストグラムは、肌色に対応するH成分とS成分の組の出現頻度、すなわち尤度(確からしさ)を表すものである。
The histogram generation unit 4 generates a histogram of the frequency of appearance of the H and S component pairs corresponding to the skin color, using a data group and a V data group composed of H and S data sets included in one still image data. To do. This process will be described in detail later with reference to FIG.
The histogram obtained by the histogram generation unit 4 represents the frequency of appearance of a set of H and S components corresponding to skin color, that is, likelihood (probability).

ヒストグラム近似部5は、得られたヒストグラムをガウス混合モデルにて近似する。
入力される画像データから得られるヒストグラムは、膨大な量の離散値の集合体である。この膨大な量の離散値では、未知のデータに対して肌色であるか否かの判定処理ができない。そこで、ヒストグラムを少ない情報量にて表現できるガウス混合モデルにて近似する。この近似処理により、任意の画像データに対する尤度を、少ない演算量で且つ実用的な良い精度にて算出することが可能になる。
ガウス混合モデルは統計モデルの最も代表的なものであり、複数のガウス分布の集合体である。つまり、ガウス分布を構成する平均及び分散の値の、複数組の集合体である。膨大な量の離散値の集合体を、この複数のガウス分布にて近似する。なお、統計モデルとしては、ガウス混合モデル以外の、他の周知のモデルを適用することも可能である。すなわち、統計モデルの種類によって実施形態が限定されるものではない。
ヒストグラム近似部5における近似処理の詳細は特許文献1にて詳述されており、また以下に記す論文においても開示されており、良く知られているので、これ以上詳細な説明は省略する。
(1)S. McKenna, S. Gong, and Y. Raja. Modelling Facial Colour and Identity with Gaussian Mixtures. Pattern Recognition, 31(12):1883-1892, 1998.
(2)H.P. Graf, E. Cosatto, D. Gibbon, M. Kocheisen, and E. Petajan. MultimodelSystem for Locating Heads and Faces. In Proceedings of the Second IEEE International Conference on automatic Face and Gesture Recognition, pages 88-93, 1996.
The histogram approximation unit 5 approximates the obtained histogram with a Gaussian mixture model.
A histogram obtained from input image data is an aggregate of a huge amount of discrete values. With this enormous amount of discrete values, it is not possible to determine whether or not the unknown data is flesh-colored. Therefore, the histogram is approximated by a Gaussian mixture model that can be expressed with a small amount of information. By this approximation processing, it is possible to calculate the likelihood for arbitrary image data with a small amount of calculation and good practical accuracy.
The Gaussian mixture model is the most representative statistical model, and is an aggregate of a plurality of Gaussian distributions. That is, it is an aggregate of a plurality of sets of mean and variance values constituting a Gaussian distribution. An enormous collection of discrete values is approximated by the plurality of Gaussian distributions. As the statistical model, other known models other than the Gaussian mixture model can be applied. That is, the embodiment is not limited by the type of statistical model.
The details of the approximation processing in the histogram approximation unit 5 are described in detail in Patent Document 1, and are also disclosed in the following papers, which are well known.
(1) S. McKenna, S. Gong, and Y. Raja.Modeling Facial Color and Identity with Gaussian Mixtures.Pattern Recognition, 31 (12): 1883-1892, 1998.
(2) HP Graf, E. Cosatto, D. Gibbon, M. Kocheisen, and E. Petajan.MultimodelSystem for Locating Heads and Faces.In Proceedings of the Second IEEE International Conference on automatic Face and Gesture Recognition, pages 88-93, 1996.

ヒストグラム近似部5によって、膨大な量の離散値の集合体であったヒストグラムは、極めてデータ量の少ない、ガウス分布を構成する平均及び分散のデータの複数組の集合体よりなるデータ群(以下「GMMパラメータ群」と略す。GMMは"Gaussian Mixture Model"の略。)に変換される。
ヒストグラム近似部5によって得られるGMMパラメータ群は、現在入力されている画像データ中に存在する人物の肌色に依存した、「対象人物に固有のGMMパラメータ群」である。
説明の便宜上、この「対象人物に固有のGMMパラメータ群」を「第1のGMMパラメータ群」と称する。
第1のGMMパラメータ群にて表現されるガウス混合モデルは、対象人物の肌色の尤度を表現する肌色モデルである。
The histogram which is an aggregate of a huge amount of discrete values by the histogram approximation unit 5 is a data group (hereinafter referred to as “a group of multiple sets of average and variance data constituting a Gaussian distribution, which has an extremely small amount of data”. It is abbreviated as “GMM parameter group.” GMM is converted into “Gaussian Mixture Model”.
The GMM parameter group obtained by the histogram approximation unit 5 is a “GMM parameter group specific to the target person” depending on the skin color of the person existing in the currently input image data.
For convenience of explanation, this “GMM parameter group specific to the target person” is referred to as a “first GMM parameter group”.
The Gaussian mixture model expressed by the first GMM parameter group is a skin color model that expresses the likelihood of the skin color of the target person.

作成済肌色GMM7は不揮発性メモリ内のデータである。例えば周知のハードディスク装置内にファイルとして格納されている。
作成済肌色GMM7には、特許文献1の技術を用いて、多種多様な人種、性別、年齢等の人物の画像データから肌色の情報を抽出し、ガウス混合モデルにて正規化処理した結果得られたGMMパラメータ群が格納されている。
作成済肌色GMM7に格納されているGMMパラメータ群は、多種多様な人種、性別、年齢等の人物の画像データを基に作られている、つまり対象人物に依存しない「汎用のGMMパラメータ群」である。
説明の便宜上、この「汎用のGMMパラメータ群」を「第2のGMMパラメータ群」と称する。
第2のGMMパラメータ群にて表現されるガウス混合モデルは、汎用的な肌色の尤度を表現する肌色モデルである。
The created flesh color GMM 7 is data in the nonvolatile memory. For example, it is stored as a file in a known hard disk device.
The created skin color GMM7 is obtained as a result of extracting skin color information from image data of people of various races, genders, ages, etc. using the technique of Patent Document 1 and normalizing it with a Gaussian mixture model. Stored GMM parameter groups are stored.
The GMM parameter group stored in the created skin color GMM 7 is created based on image data of people of various races, genders, ages, etc., that is, “general-purpose GMM parameter group” that does not depend on the target person. It is.
For convenience of explanation, this “general-purpose GMM parameter group” is referred to as a “second GMM parameter group”.
The Gaussian mixture model expressed by the second GMM parameter group is a skin color model that expresses a general skin color likelihood.

修正GMM作成部6は、第1のGMMパラメータ群と第2のGMMパラメータ群とを重み付け加算処理し、修正GMMを作成する。例えば第1のGMMパラメータ群と第2のGMMパラメータ群とを3:2の割合で加算する。なお、加算の割合を変化させることにより、作成する修正GMMを入力画像データ中の人物の肌色に強く依存するものとしたり、逆に広範囲の人種に対応するものとすることもできる。
修正GMMにて表現されるガウス混合モデルは、対象人物の肌色の尤度に汎用的な肌色の尤度が加味された、いわば複合的な肌色モデルである。
The modified GMM creating unit 6 performs weighted addition processing on the first GMM parameter group and the second GMM parameter group to create a modified GMM. For example, the first GMM parameter group and the second GMM parameter group are added at a ratio of 3: 2. Note that by changing the ratio of addition, the modified GMM to be created can be made to strongly depend on the skin color of the person in the input image data, or conversely, can correspond to a wide range of races.
The Gaussian mixture model expressed by the modified GMM is a complex skin color model in which a general skin color likelihood is added to the skin color likelihood of the target person.

肌色尤度算出部8は、HSV変換部3にて得られた入力画像データ中の個々の画素データに対応するH,Sデータに対し、修正GMMを基にして肌色尤度を算出する。   The skin color likelihood calculation unit 8 calculates the skin color likelihood based on the corrected GMM for H and S data corresponding to individual pixel data in the input image data obtained by the HSV conversion unit 3.

二値化部9は、肌色尤度算出部8によって得られた尤度データを閾値11と比較して、肌色であるか否かを判定し、判定結果を0又は1の二値として出力する。
閾値11は単一のスカラ値であり、例えば周知のRAMに格納されている。
二値化部9によって得られた判定結果は、肌色領域データ10として、例えばRAMに格納される。
なお、肌色領域データ10は、顔領域中の目や眉、鼻の穴等、肌色と認識されない細部に対する「塗り潰し」を行うべく、所定の積分処理を施す。
The binarizing unit 9 compares the likelihood data obtained by the skin color likelihood calculating unit 8 with the threshold value 11 to determine whether the skin color is used, and outputs the determination result as a binary value of 0 or 1. .
The threshold value 11 is a single scalar value, and is stored in, for example, a well-known RAM.
The determination result obtained by the binarizing unit 9 is stored as skin color area data 10 in, for example, a RAM.
The skin color area data 10 is subjected to a predetermined integration process in order to “fill” details that are not recognized as skin color, such as eyes, eyebrows, and nostrils in the face area.

閾値更新部12は、ヒストグラム生成部4内の矩形状顔領域作成部21から得られる矩形状顔領域データと、肌色領域データ10に基づき、所定の演算処理によって閾値11を更新する。   The threshold update unit 12 updates the threshold 11 by a predetermined calculation process based on the rectangular face region data obtained from the rectangular face region creation unit 21 in the histogram generation unit 4 and the skin color region data 10.

図2は、ヒストグラム生成部4の内部構成を詳述する機能ブロック図である。   FIG. 2 is a functional block diagram detailing the internal configuration of the histogram generation unit 4.

HSV変換部3から得られるH,S,Vデータのうち、Vデータは矩形状顔領域作成部21に渡される。矩形状顔領域作成部21は、明度を表すVデータの一画面分から、円形或は楕円形の明るい領域を探し出し、この円或は楕円を囲む矩形データを作成する。顔の領域はほぼ楕円形の均一の明るさを持つ領域であるという性質に基づいて、大まかな顔領域の特定を行う処理である。   Of the H, S, and V data obtained from the HSV conversion unit 3, the V data is passed to the rectangular face region creation unit 21. The rectangular face area creation unit 21 searches for a bright area of a circle or an ellipse from one screen of V data representing brightness, and creates rectangular data surrounding the circle or ellipse. This is a process for specifying a rough face area on the basis of the property that the face area is an almost elliptical area having uniform brightness.

HSV変換部3から得られるH,S,Vデータのうち、H,Sデータは顔領域データ抽出部22に渡される。また、矩形状顔領域作成部21から得られた矩形状顔領域データも顔領域データ抽出部22に渡される。顔領域データ抽出部22は、矩形状顔領域内のH,Sデータの組を特定する。   Of the H, S, and V data obtained from the HSV conversion unit 3, the H and S data is transferred to the face area data extraction unit 22. Further, the rectangular face area data obtained from the rectangular face area creating unit 21 is also passed to the face area data extracting unit 22. The face area data extraction unit 22 identifies a set of H and S data in the rectangular face area.

顔領域データ抽出部22にて選択されたH,Sデータに対して、汎用肌色GMM23内のH,S範囲データ群に含まれているか否かを、簡易肌色判定部24にて判定する。
こうして得られたデータは、肌色の可能性が相応に高いデータである。
The simple skin color determination unit 24 determines whether the H and S data selected by the face area data extraction unit 22 is included in the H and S range data group in the general-purpose skin color GMM 23.
The data obtained in this way is data with a correspondingly high possibility of skin color.

得られた肌色のH,Sデータから、ヒストグラム作成部25にてヒストグラムを作成する。こうして、対象人物の画像データから顔領域内の肌色データと思しきデータを基に、ヒストグラムが出来上がる。   A histogram creation unit 25 creates a histogram from the obtained H and S data of the skin color. In this way, a histogram is created based on the image data of the target person based on data that seems to be skin color data in the face area.

図3は、閾値更新部12の内部構成を詳述する機能ブロック図である。   FIG. 3 is a functional block diagram detailing the internal configuration of the threshold update unit 12.

肌色領域データ10に対し、矩形状顔領域作成部21にて得られた矩形状顔領域データを基に、顔領域内外の肌色データの出現率を計算する。
顔領域内肌色データ出現率算出部31は、矩形状顔領域データに含まれる肌色領域データの数を数え、矩形状顔領域データ全体の数から出現率を算出する。これをパラメータaとする。
顔領域外肌色データ出現率算出部32は、矩形状顔領域データの外にある肌色領域データの数を数え、画像データ全体の数から矩形状顔領域データ全体の数を引いた分から出現率を算出する。これをパラメータbとする。
閾値更新部は、顔領域内肌色データ出現率算出部31と顔領域外肌色データ出現率算出部32にて得られたaとbと、定数34に格納されているα、β、Srateを用いて、以下の更新演算を行う。

Figure 2007257087
For the skin color area data 10, the appearance rate of the skin color data inside and outside the face area is calculated based on the rectangular face area data obtained by the rectangular face area creating unit 21.
The face area skin color data appearance rate calculation unit 31 counts the number of skin color area data included in the rectangular face area data, and calculates the appearance rate from the total number of rectangular face area data. This is parameter a.
The face area outside skin color data appearance rate calculating unit 32 counts the number of skin color area data outside the rectangular face area data, and subtracts the number of the entire rectangular face area data from the number of the entire image data. calculate. This is parameter b.
The threshold update unit calculates a and b obtained by the skin color data appearance rate calculation unit 31 and the skin color data appearance rate calculation unit 32 outside the face region, and α, β, and S rate stored in the constant 34. To perform the following update operation.
Figure 2007257087

数式中、max(x,y)はxとyの中から最大値を選択する関数である。
定数34は作成済肌色GMM7と同様の、不揮発性メモリ内のデータである。例えば周知のハードディスク装置内にファイルとして格納されている。α、βは学習速度係数、Srateは顔領域内における肌色データ出現率の最小値を、予め設定しておくものである。
αの値は、顔領域内の肌色出現率aが肌色データ出現率の最小値Srateより小さくなると、速い速度で閾値を小さくするように設定される。例えばαは0.6である。
βの値は、常に閾値の値を遅い速度で大きくするように設定される。例えばβは0.4である。
rateの値は、顔が横を向いている状態を最小値とする。横顔が写っている画像データに対し、矩形状顔領域作成部21にて矩形状顔領域データを作成すると、顔領域内の肌色出現率がおよそ0.56程度になることから、この値を設定する。
In the formula, max (x, y) is a function for selecting the maximum value from x and y.
The constant 34 is data in the nonvolatile memory similar to the created flesh color GMM7. For example, it is stored as a file in a known hard disk device. α and β are preset learning rate coefficients, and S rate is a minimum value of the skin color data appearance rate in the face area.
The value of α is set so that the threshold value is reduced at a high speed when the skin color appearance rate a in the face area is smaller than the minimum value S rate of the skin color data appearance rate. For example, α is 0.6.
The value of β is always set to increase the threshold value at a slow speed. For example, β is 0.4.
The value of S rate is the minimum value when the face is facing sideways. When rectangular face area data is created by the rectangular face area creation unit 21 for image data showing a profile, the skin color appearance rate in the face area is about 0.56, so this value is set. To do.

矩形状顔領域中の肌色出現率aが小さくなると、閾値Tは小さくなる。
矩形状顔領域外の肌色出現率bが大きくなると、閾値Tは大きくなる。
閾値算出部33による閾値Tの更新演算処理により、肌色領域の検出精度は向上する。入力画像データが静止画像である場合、閾値更新部12の繰り返し演算処理により、aとbは所定の値へ収束し、閾値Tも所定の値に収束する。
As the skin color appearance rate a in the rectangular face region decreases, the threshold T decreases.
As the skin color appearance rate b outside the rectangular face area increases, the threshold T increases.
The detection accuracy of the skin color area is improved by the update calculation process of the threshold value T by the threshold value calculation unit 33. When the input image data is a still image, a and b converge to a predetermined value and the threshold T also converges to a predetermined value by repeated calculation processing of the threshold update unit 12.

図4は、本実施形態に係る肌色領域検出処理を示す。   FIG. 4 shows a skin color area detection process according to this embodiment.

図4(a)は入力画像データである。女性の上半身のカラー画像データである。
図4(b)は矩形状顔領域作成部21にて顔領域Fを検出した結果を示す。検出した顔領域の範囲内に限定して、対象人物の肌色のサンプルを取り出し、肌色分布モデルを作成する。
図4(c)は検出した肌色領域データ10を示す。積分処理により大きな肌色の領域S1,S2,S3が検出される。また、閾値の更新処理により、ノイズが減少し、検出精度が向上する。
FIG. 4A shows input image data. It is color image data of the upper body of a woman.
FIG. 4B shows a result of detecting the face area F by the rectangular face area creating unit 21. A sample of the skin color of the target person is extracted within the range of the detected face area, and a skin color distribution model is created.
FIG. 4C shows the detected skin color area data 10. Large flesh-colored regions S1, S2, and S3 are detected by the integration process. In addition, the threshold update process reduces noise and improves detection accuracy.

実施の形態は上記に限らず、以下のような応用が可能である。
(1)特に動画に対する肌色検出処理においては、閾値は検出した肌色領域データ10の形態に基づき、座標に応じて異なる値を作成しても良い。つまり、被写体である人間は連続的な動作をすることから、肌色領域であると判定した部分の閾値は低めに、それ以外の部分の閾値は高めに設定することにより、ノイズに強い肌色検出装置を得ることができる。
(2)定数34を予め用意するのではなく、各々の定数の最適値を事前の演算処理によって得ることもできる。例えば、サンプルの静止画像データを用いて、α,β,Srateを変化させながら閾値更新処理を何度か行い、最適値を選択すること等が考えられる。
The embodiment is not limited to the above, and the following applications are possible.
(1) In particular, in the skin color detection process for a moving image, a different threshold value may be created according to the coordinates based on the form of the detected skin color area data 10. In other words, since the human subject is continuously moving, the skin color detection device that is resistant to noise is set by setting the threshold value of the portion determined to be a skin color region low and setting the threshold values of other portions high. Can be obtained.
(2) Instead of preparing the constants 34 in advance, the optimum values of the respective constants can be obtained by a prior calculation process. For example, using the sample still image data, it is conceivable to perform threshold update processing several times while changing α, β, and S rate, and to select an optimum value.

本発明の第1の実施の形態による肌色領域検出装置の例を示すブロック図である。It is a block diagram which shows the example of the skin color area | region detection apparatus by the 1st Embodiment of this invention. ヒストグラム生成部の内部を示すブロック図である。It is a block diagram which shows the inside of a histogram production | generation part. 閾値更新部の内部を示すブロック図である。It is a block diagram which shows the inside of a threshold value update part. 肌色領域検出処理の例を示すブロック図である。It is a block diagram which shows the example of a skin color area | region detection process.

符号の説明Explanation of symbols

1…肌色領域検出装置、2…画像情報取得部、3…HSV変換部、4…ヒストグラム生成部、5…ヒストグラム近似部、6…修正GMM作成部、7…作成済肌色GMM、8…肌色尤度算出部、9…二値化部、10…肌色領域データ、11…閾値、12…閾値更新部
DESCRIPTION OF SYMBOLS 1 ... Skin color area | region detection apparatus, 2 ... Image information acquisition part, 3 ... HSV conversion part, 4 ... Histogram generation part, 5 ... Histogram approximation part, 6 ... Correction GMM creation part, 7 ... Created skin color GMM, 8 ... Skin color likelihood Degree calculation unit, 9 ... binarization unit, 10 ... skin color area data, 11 ... threshold, 12 ... threshold update unit

Claims (3)

入力画像データから肌色と思しき画素データを抽出する肌色画素抽出部と、
前記肌色画素抽出部にて得られた前記肌色画素データが有する色に関する情報からヒストグラムを生成するヒストグラム生成部と、
前記ヒストグラム生成部にて得られた前記ヒストグラムを近似処理して、第1の統計モデルを得るヒストグラム近似部と、
前記ヒストグラム近似部にて得られた第1の統計モデルと、前記第1の統計モデルとは異なる第2の統計モデルとを重み付け加算処理する複合統計モデル作成部と、
前記複合統計モデル作成部にて得られた複合統計モデルを用いて、前記入力画像データの画素データに対応する肌色尤度を求め、得られた前記肌色尤度を閾値と比較して、前記画素データが肌色であるか否かを判定し、前記判定結果に基づいて入力画像データに対する肌色領域検出結果を得る二値化処理部と、
前記二値化処理部の結果得られた肌色領域検出結果を前記閾値の更新に利用する閾値更新部と
よりなることを特徴とする肌色領域検出装置。
A skin color pixel extraction unit that extracts pixel data that seems to be skin color from input image data;
A histogram generation unit that generates a histogram from information about the color of the skin color pixel data obtained by the skin color pixel extraction unit;
A histogram approximation unit that approximates the histogram obtained by the histogram generation unit to obtain a first statistical model;
A composite statistical model creation unit that performs weighted addition processing on the first statistical model obtained by the histogram approximation unit and a second statistical model different from the first statistical model;
Using the composite statistical model obtained by the composite statistical model creation unit, the skin color likelihood corresponding to the pixel data of the input image data is obtained, the obtained skin color likelihood is compared with a threshold value, and the pixel A binarization processing unit that determines whether or not the data is skin color, and obtains a skin color area detection result for the input image data based on the determination result;
A skin color region detection apparatus comprising a threshold update unit that uses a skin color region detection result obtained as a result of the binarization processing unit to update the threshold.
前記肌色画素抽出部は、
前記入力画像データの明度を示す情報から人物の顔の位置を推定して顔領域推定結果を得る顔領域推定部と、
前記入力画像データのうち、前記顔領域推定結果の範囲内にある画素データ群から、肌色の画素データであるか否かを判定する肌色判定部と
を含み、
前記ヒストグラム近似部は、ガウス混合モデルによって前記ヒストグラムを近似するものであり、
前記第2の統計モデルは、入力画像データに依存しない肌色の統計モデルであり、
前記閾値更新部は、前記顔領域推定結果の範囲内にある肌色領域の画素データ出現率と、前記顔領域推定結果の範囲外にある肌色領域の画素データ出現率とを閾値の更新演算に用いるものである
ことを特徴とする、請求項1記載の肌色領域検出装置。
The skin color pixel extraction unit
A face area estimation unit that estimates the position of a person's face from information indicating the brightness of the input image data and obtains a face area estimation result;
A skin color determination unit that determines whether or not the input image data is pixel data of skin color from a pixel data group within the range of the face region estimation result;
The histogram approximation unit approximates the histogram by a Gaussian mixture model,
The second statistical model is a skin color statistical model that does not depend on input image data,
The threshold update unit uses the pixel data appearance rate of the skin color area within the range of the face area estimation result and the pixel data appearance rate of the skin color area outside the range of the face area estimation result for the threshold update calculation. The skin color area detecting apparatus according to claim 1, wherein the apparatus is a skin color area detecting apparatus.
入力画像データから肌色と思しき画素データを抽出する肌色画素抽出手順と、
前記肌色画素抽出手順にて得られた前記肌色画素データが有する色に関する情報からヒストグラムを生成するヒストグラム生成手順と、
前記ヒストグラム生成手順にて得られた前記ヒストグラムを近似処理するヒストグラム近似手順と、
前記ヒストグラム近似手順にて得られた第1の統計モデルと、前記第1の統計モデルとは異なる第2の統計モデルとを重み付け加算処理する複合統計モデル作成手順と、
前記複合統計モデル作成手順にて得られた複合統計モデルを用いて、前記入力画像データの画素データに対応する肌色尤度を求め、得られた前記肌色尤度を閾値と比較して、前記画素データが肌色であるか否かを判定し、前記判定結果に基づいて入力画像データに対する肌色領域検出結果を得る二値化処理手順と、
前記二値化処理手順の結果得られた肌色領域検出結果を前記閾値の更新に利用する閾値更新手順と
よりなることを特徴とする肌色領域検出方法。
Skin color pixel extraction procedure for extracting pixel data that seems to be skin color from input image data;
A histogram generation procedure for generating a histogram from information relating to the color of the skin color pixel data obtained in the skin color pixel extraction procedure;
A histogram approximation procedure for approximating the histogram obtained in the histogram generation procedure;
A composite statistical model creation procedure for performing a weighted addition process on the first statistical model obtained by the histogram approximation procedure and a second statistical model different from the first statistical model;
Using the composite statistical model obtained in the composite statistical model creation procedure, the skin color likelihood corresponding to the pixel data of the input image data is obtained, the obtained skin color likelihood is compared with a threshold value, and the pixel A binarization processing procedure for determining whether the data is a skin color and obtaining a skin color area detection result for the input image data based on the determination result;
A skin color region detection method comprising: a threshold update procedure that uses a skin color region detection result obtained as a result of the binarization processing procedure to update the threshold.
JP2006077692A 2006-03-20 2006-03-20 Skin color area detecting device and skin color area detecting method Pending JP2007257087A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006077692A JP2007257087A (en) 2006-03-20 2006-03-20 Skin color area detecting device and skin color area detecting method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006077692A JP2007257087A (en) 2006-03-20 2006-03-20 Skin color area detecting device and skin color area detecting method

Publications (1)

Publication Number Publication Date
JP2007257087A true JP2007257087A (en) 2007-10-04

Family

ID=38631307

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006077692A Pending JP2007257087A (en) 2006-03-20 2006-03-20 Skin color area detecting device and skin color area detecting method

Country Status (1)

Country Link
JP (1) JP2007257087A (en)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009169518A (en) * 2008-01-11 2009-07-30 Kddi Corp Area identification apparatus and content identification apparatus
WO2010041836A2 (en) * 2008-10-07 2010-04-15 Korea Institute Of Oriental Medicine Method of detecting skin-colored area using variable skin color model
JP2010166263A (en) * 2009-01-14 2010-07-29 Canon Inc Image processor, image processing method, and program
CN101960491A (en) * 2008-03-18 2011-01-26 汤姆森许可贸易公司 Method and apparatus for adaptive feature of interest color model parameters estimation
WO2016006429A1 (en) * 2014-07-07 2016-01-14 ソニー株式会社 Image processing device and method, program, and endoscope system
RU2578210C1 (en) * 2014-07-23 2016-03-27 Сяоми Инк. Method and device for correcting skin colour
JP2016061692A (en) * 2014-09-18 2016-04-25 株式会社メガチップス Human body detection device
US9374574B2 (en) 2012-07-11 2016-06-21 Panasonic Intellectual Property Management Co., Ltd. Three-dimensional video display apparatus and three-dimensional video display method
KR101854991B1 (en) * 2016-09-12 2018-05-08 에스테 로우더, 인코포레이티드 System and method for correcting color of digital image based on the human sclera and pupil
US10445612B2 (en) 2015-10-26 2019-10-15 Canon Kabushiki Kaisha Information processing apparatus, information processing method, and storage medium
US10621754B2 (en) 2016-09-23 2020-04-14 Casio Computer Co., Ltd. Method of detecting skin color area of human
KR102269897B1 (en) * 2020-01-08 2021-06-28 주식회사 메디트 Image filtering method
US20220222466A1 (en) * 2021-01-13 2022-07-14 Ford Global Technologies, Llc Material spectroscopy
US11657589B2 (en) 2021-01-13 2023-05-23 Ford Global Technologies, Llc Material spectroscopy
US11741747B2 (en) 2021-01-13 2023-08-29 Ford Global Technologies, Llc Material spectroscopy

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004246424A (en) * 2003-02-10 2004-09-02 Masahide Kaneko Method for extracting skin color area
JP2005242582A (en) * 2004-02-25 2005-09-08 Univ Waseda Face detection device and method thereof
JP2005250712A (en) * 2004-03-03 2005-09-15 Univ Waseda Figure attribute identification method and its system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004246424A (en) * 2003-02-10 2004-09-02 Masahide Kaneko Method for extracting skin color area
JP2005242582A (en) * 2004-02-25 2005-09-08 Univ Waseda Face detection device and method thereof
JP2005250712A (en) * 2004-03-03 2005-09-15 Univ Waseda Figure attribute identification method and its system

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009169518A (en) * 2008-01-11 2009-07-30 Kddi Corp Area identification apparatus and content identification apparatus
CN101960491A (en) * 2008-03-18 2011-01-26 汤姆森许可贸易公司 Method and apparatus for adaptive feature of interest color model parameters estimation
JP2011517526A (en) * 2008-03-18 2011-06-09 トムソン ライセンシング Method and apparatus for adaptive color model parameter estimation of object of interest
KR101528895B1 (en) * 2008-03-18 2015-06-15 톰슨 라이센싱 Method and apparatus for adaptive feature of interest color model parameters estimation
WO2010041836A2 (en) * 2008-10-07 2010-04-15 Korea Institute Of Oriental Medicine Method of detecting skin-colored area using variable skin color model
KR100957716B1 (en) 2008-10-07 2010-05-12 한국 한의학 연구원 Extraction Method of Skin-Colored Region using Variable Skin Color Model
WO2010041836A3 (en) * 2008-10-07 2010-07-15 Korea Institute Of Oriental Medicine Method of detecting skin-colored area using variable skin color model
US8457394B2 (en) 2008-10-07 2013-06-04 Korea Institute Of Oriental Medicine Method of detecting skin-colored area using variable skin color model
JP2010166263A (en) * 2009-01-14 2010-07-29 Canon Inc Image processor, image processing method, and program
US9374574B2 (en) 2012-07-11 2016-06-21 Panasonic Intellectual Property Management Co., Ltd. Three-dimensional video display apparatus and three-dimensional video display method
WO2016006429A1 (en) * 2014-07-07 2016-01-14 ソニー株式会社 Image processing device and method, program, and endoscope system
US10367974B2 (en) 2014-07-07 2019-07-30 Sony Corporation Image processing apparatus, image processing method, program, and endoscope system
RU2578210C1 (en) * 2014-07-23 2016-03-27 Сяоми Инк. Method and device for correcting skin colour
JP2016061692A (en) * 2014-09-18 2016-04-25 株式会社メガチップス Human body detection device
US10445612B2 (en) 2015-10-26 2019-10-15 Canon Kabushiki Kaisha Information processing apparatus, information processing method, and storage medium
KR101854991B1 (en) * 2016-09-12 2018-05-08 에스테 로우더, 인코포레이티드 System and method for correcting color of digital image based on the human sclera and pupil
US10621754B2 (en) 2016-09-23 2020-04-14 Casio Computer Co., Ltd. Method of detecting skin color area of human
KR102269897B1 (en) * 2020-01-08 2021-06-28 주식회사 메디트 Image filtering method
WO2021141424A1 (en) * 2020-01-08 2021-07-15 주식회사 메디트 Image filtering method
US20220222466A1 (en) * 2021-01-13 2022-07-14 Ford Global Technologies, Llc Material spectroscopy
US11657589B2 (en) 2021-01-13 2023-05-23 Ford Global Technologies, Llc Material spectroscopy
US11741747B2 (en) 2021-01-13 2023-08-29 Ford Global Technologies, Llc Material spectroscopy

Similar Documents

Publication Publication Date Title
JP2007257087A (en) Skin color area detecting device and skin color area detecting method
JP5010905B2 (en) Face recognition device
JP2004348674A (en) Region detection method and its device
US7925093B2 (en) Image recognition apparatus
KR100957716B1 (en) Extraction Method of Skin-Colored Region using Variable Skin Color Model
KR20040008791A (en) System and method for detecting and tracking a plurality of faces in real-time by integrating the visual ques
Sharma Designing of face recognition system
Zhang et al. Hand gesture detection and segmentation based on difference background image with complex background
KR101408344B1 (en) Apparatus for detecting face
Yusuf et al. Human face detection using skin color segmentation and watershed algorithm
Manaf et al. Color recognition system with augmented reality concept and finger interaction: Case study for color blind aid system
JP3902887B2 (en) Lip extraction method
KR20110019969A (en) Apparatus for detecting face
Jindal et al. Sign Language Detection using Convolutional Neural Network (CNN)
JP2006343989A (en) Image processing device, image processing method, and image processing program
JP2022147713A (en) Image generation device, learning device, and image generation method
Jalilian et al. Face and hand shape segmentation using statistical skin detection for sign language recognition
JP4475395B2 (en) Image processing method, image processing apparatus, image processing program, and storage medium
KR200473405Y1 (en) Intelligent toy system with facial expression recognition technology
JP3979122B2 (en) Image processing apparatus and image processing method
KR20090113617A (en) Image authentication method, Apparatus and computer readable record-medium on which program for executing method thereof
Derhalli et al. Face detection using boosting and histogram normalization
Chai et al. Towards contactless palm region extraction in complex environment
Prinosil Clothing Color Based De-Identification
KR100910754B1 (en) Method for Detecting Skin Region by Grid-Based Approach

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090312

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101228

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110419