JP2007257087A - Skin color area detecting device and skin color area detecting method - Google Patents
Skin color area detecting device and skin color area detecting method Download PDFInfo
- Publication number
- JP2007257087A JP2007257087A JP2006077692A JP2006077692A JP2007257087A JP 2007257087 A JP2007257087 A JP 2007257087A JP 2006077692 A JP2006077692 A JP 2006077692A JP 2006077692 A JP2006077692 A JP 2006077692A JP 2007257087 A JP2007257087 A JP 2007257087A
- Authority
- JP
- Japan
- Prior art keywords
- skin color
- data
- image data
- unit
- histogram
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
Description
本発明は、肌色領域の検出装置及び方法に適用して好適な技術に関する。 The present invention relates to a technique suitable for application to a skin color region detection apparatus and method.
画像データから、顔の領域や、顔を含めた肌色の領域を検出するための技術が、様々なアプリケーションにおいて求められている。
例えば、ロボットが人間と対話する際には、相手が人間であることを認識できることが必要である。人間であることを認識するには、発声を認識する技術と、肌色を認識する技術が必要になる。
例えば、人物を撮影している動画データに対して背景と着用している服を全く別の画像と差し替える、等というような特殊効果を行うには、肌色を認識する技術と、頭髪を認識する技術が必要になる。
A technique for detecting a face area and a skin color area including a face from image data is required in various applications.
For example, when a robot interacts with a human, it is necessary to be able to recognize that the other party is a human. In order to recognize being a human, technology for recognizing utterances and technology for recognizing skin tone are required.
For example, to perform special effects such as replacing the background and the clothes you are wearing with completely different images for moving image data of a person, you can recognize skin color and hair. Technology is needed.
なお、発明者は任意の画像データから肌色領域を検出する発明を、特許文献1として出願済みである。
特許文献1に開示される発明の大まかな技術内容は、以下の通りである。
(1)できるだけ多くの人物の顔写真データから肌色のサンプルデータを収集する。
(2)収集した肌色画像データをHSV変換して、肌色の(H,S)データを集める。
(3)集めた肌色(H,S)データのヒストグラムを作成する。
(4)ヒストグラムを複数のガウス分布モデルの組み合わせにて近似し、混合ガウス分布モデルのパラメータを得る。
(5)入力画像データの各要素に対して前記混合ガウス分布モデルのパラメータを用いて、肌色尤度を算出する。
(6)算出した肌色尤度を閾値と比較して、肌色であるか否かを判定する。
特許文献1の発明は、多種多様な人種や人物の肌色画像データから肌色の混合ガウス分布モデルを作成し、これを基に肌色であるか否かの判定を行う、いわば「汎用的な肌色検出技術」である。
The general technical contents of the invention disclosed in Patent Document 1 are as follows.
(1) Collect skin color sample data from face photo data of as many people as possible.
(2) The collected flesh color image data is HSV converted to collect flesh color (H, S) data.
(3) Create a histogram of the collected skin color (H, S) data.
(4) A histogram is approximated by a combination of a plurality of Gaussian distribution models to obtain parameters of a mixed Gaussian distribution model.
(5) The skin color likelihood is calculated for each element of the input image data using the parameters of the mixed Gaussian distribution model.
(6) The calculated skin color likelihood is compared with a threshold value to determine whether the skin color is used.
The invention of Patent Document 1 creates a skin color mixed Gaussian distribution model from skin color image data of a wide variety of races and persons, and determines whether it is a skin color based on this, so-called “general skin color” Detection technology ".
特許文献1による汎用的な肌色領域検出装置では、ノイズを拾い易い。
例えば、ロボットがある部屋に置かれ、対話する相手が一人の日本人である場合に、汎用的肌色検出技術を用いると、机の木目を黒人の肌と誤認識したり、机の上にある白い紙を白人の肌と誤認識する可能性が生じる。
In the general-purpose skin color area detection device according to Patent Document 1, it is easy to pick up noise.
For example, if a robot is placed in a room and the conversation partner is a Japanese, using the general skin color detection technology, the wood grain of the desk may be misrecognized as black skin or on the desk There is a possibility that white paper may be mistaken for white skin.
本発明はかかる点に鑑みてなされたものであり、特に動画像データにおいて、誤認識が少なく、且つ、予期しない状況が発生しても迅速に適応できる、肌色領域の検出方法を提供することを目的とする。 The present invention has been made in view of the above points, and provides a skin color region detection method that is less likely to be misrecognized especially in moving image data and can be quickly applied even when an unexpected situation occurs. Objective.
上記課題を解決するための本発明は、
入力画像データから肌色と思しき画素データを抽出する肌色画素抽出部と、
前記肌色画素抽出部にて得られた前記肌色画素データが有する色に関する情報からヒストグラムを生成するヒストグラム生成部と、
前記ヒストグラム生成部にて得られた前記ヒストグラムを近似処理して、第1の統計モデルを得るヒストグラム近似部と、
前記ヒストグラム近似部にて得られた第1の統計モデルと、前記第1の統計モデルとは異なる第2の統計モデルとを重み付け加算処理する複合統計モデル作成部と、
前記複合統計モデル作成部にて得られた複合統計モデルを用いて、前記入力画像データの画素データに対応する肌色尤度を求め、得られた前記肌色尤度を閾値と比較して、前記画素データが肌色であるか否かを判定し、前記判定結果に基づいて入力画像データに対する肌色領域検出結果を得る二値化処理部と、
前記二値化処理部の結果得られた肌色領域検出結果を前記閾値の更新に利用する閾値更新部と
よりなることを特徴とする肌色領域検出装置としたものである。
The present invention for solving the above problems is as follows.
A skin color pixel extraction unit that extracts pixel data that seems to be skin color from input image data;
A histogram generation unit that generates a histogram from information about the color of the skin color pixel data obtained by the skin color pixel extraction unit;
A histogram approximation unit that approximates the histogram obtained by the histogram generation unit to obtain a first statistical model;
A composite statistical model creation unit that performs weighted addition processing on the first statistical model obtained by the histogram approximation unit and a second statistical model different from the first statistical model;
Using the composite statistical model obtained by the composite statistical model creation unit, the skin color likelihood corresponding to the pixel data of the input image data is obtained, the obtained skin color likelihood is compared with a threshold value, and the pixel A binarization processing unit that determines whether or not the data is skin color, and obtains a skin color area detection result for the input image data based on the determination result;
The skin color area detection apparatus includes a threshold color update unit that uses the skin color area detection result obtained as a result of the binarization processing unit to update the threshold value.
任意の入力画像中に多種多様の肌色のバリエーションを持つ人物が多数含まれる可能性はまれである。すなわち、従来技術である特許文献1の技術では、汎用性が高いが故にどうしてもノイズを含んでしまう。そこで、入力画像から人物の顔の存在を特定し、特定した顔領域中に肌色の画素データがあれば、その画素データに類似する肌色画素データが画像データ全体に存在するものと推定し、入力画像データを肌色であるか否かと推定する為の統計モデル(以下「肌色モデル」)を作成する。
しかし、この方法だけでは顔領域が正しく検出できなかった場合に誤検出を引き起こす可能性がある。
そこで、特許文献1の技術思想を一部流用し、多種多様な人物の肌色データより作成した統計モデルを予め用意しておき、入力画像データから作成した肌色モデルと重み付け加算した修正モデル(以下「修正肌色モデル」)を作成する。
修正肌色モデルは入力画像データ中の肌色に対して大きな尤度を導出しつつ、入力画像データ中に突然別の人物が飛び込んで来ても、相応の尤度を導出することができる。
こうして導出した、画素データに対する肌色の尤度を閾値と比較して、入力画像データ中の個々の画素データ群に対し、肌色であるか否かを極めて迅速且つ精度良く判定することができる。
It is rare that a large number of persons having various skin color variations are included in an arbitrary input image. That is, the technique of Patent Document 1 which is a conventional technique has high versatility, and therefore noise is inevitably included. Therefore, the presence of a human face is identified from the input image, and if there is skin color pixel data in the identified face area, it is assumed that skin color pixel data similar to the pixel data exists in the entire image data, and input A statistical model (hereinafter referred to as “skin color model”) for estimating whether the image data is a skin color or not is created.
However, this method alone may cause false detection when the face area cannot be detected correctly.
In view of this, a statistical model created from skin color data of a wide variety of people is prepared in advance using a part of the technical idea of Patent Document 1, and a modified model (hereinafter referred to as “the skin color model created from input image data” is weighted and added. Create a modified skin color model ").
The corrected skin color model can derive a large likelihood for the skin color in the input image data, and can derive a corresponding likelihood even if another person suddenly jumps into the input image data.
The likelihood of the skin color for the pixel data thus derived is compared with a threshold value, and it can be determined very quickly and accurately whether the individual pixel data group in the input image data is the skin color.
本発明により、比較的少ない演算量にて、データ量の多い画像データから肌色の領域を極めて迅速且つ精度良く判定することができる。
本発明は、静止画像においても有用であるが、データ量が多く、迅速な処理を要求される動画像を利用するアプリケーションに対して特に有益である。
According to the present invention, it is possible to determine a skin color region from image data having a large amount of data with a relatively small amount of calculation extremely quickly and accurately.
The present invention is useful for still images, but is particularly useful for applications using moving images that require a large amount of data and require rapid processing.
以下、本発明の第1の実施の形態を、図1〜図4を参照して説明する。 Hereinafter, a first embodiment of the present invention will be described with reference to FIGS.
図1は、本発明の第1の実施の形態に係る肌色領域検出装置の機能ブロック図である。 FIG. 1 is a functional block diagram of a skin color area detecting apparatus according to the first embodiment of the present invention.
肌色領域検出装置1の主要部分は、実際にはコンピュータプログラムにて提供される機能である。
画像情報取得部2では、所定の手法にてカラー画像データを取得する。カラー画像データを取得する手段は何でも良い。本実施形態においては、例えば動画を撮影可能な周知のCCDカメラである。
画像データは静止画でも良い。しかし、必ずカラー画像である必要がある。本発明は入力画像データから肌色領域を推定する技術であり、色に関する情報がない限り、本発明は実現し得ないからである。
但し、本実施形態において、画像データの大まかな処理は1つの静止画像単位にて行われる。これは本実施形態が後述する顔領域認識処理に依存するからである。
なお、以下の説明において、画像データは一つの静止画像を構成するデータの集合体を意味し、画素データとは所定のXY座標にて位置が表現される1ドット毎の色や明るさ等を表現するデータを意味する。すなわち、画像データは画素データの集合体である。
The main part of the skin color area detection apparatus 1 is actually a function provided by a computer program.
The image
The image data may be a still image. However, it must be a color image. This is because the present invention is a technique for estimating a skin color region from input image data, and the present invention cannot be realized unless there is information about color.
However, in the present embodiment, rough processing of image data is performed in units of one still image. This is because the present embodiment depends on a face area recognition process described later.
In the following description, image data refers to a collection of data constituting one still image, and pixel data refers to the color, brightness, etc. of each dot whose position is expressed by a predetermined XY coordinate. Means the data to be represented. That is, the image data is a collection of pixel data.
入力画像データは多くの場合RGB乃至はYMCK等の、所定のアプリケーションソフトウェアやハードウェア等が取り扱う際に適した情報である。これを、HSV変換する。
HSV変換部3は、RGB形式のカラー画像データを色相(Hue)、彩度(Saturation)、明度(Value)の三要素に変換する(以下、それぞれ「H」「S」「V」と略す。また「H成分」「S成分」「V成分」は、画素データ中の、それぞれの情報成分を表し、「Hデータ」「Sデータ」「Vデータ」は、HSV変換部3にて変換された各々の成分のデータを表す。)。これはカラー画像データから明度に関する情報V成分を抜き取り、入力画面の明暗に依存しない色情報H成分とS成分を取り扱う為と、明度に関する情報V成分は後述の色情報に依存しない顔領域抽出方法に使用するためである。
HSV変換は周知技術であり、詳細については本願と同一発明者よりなる特許文献1に一部詳述されているので割愛する。
In many cases, the input image data is information suitable for handling by predetermined application software or hardware such as RGB or YMCK. This is HSV converted.
The
HSV conversion is a well-known technique, and details are omitted because it is described in part in Patent Document 1 consisting of the same inventor as the present application.
ヒストグラム生成部4は、一つの静止画像データに含まれるH,Sデータの組よりなるデータ群とVデータの群を用いて、肌色に対応するH成分とS成分の組の出現頻度をヒストグラム化する。この処理については後に図2にて詳述する。
ヒストグラム生成部4にて得られるヒストグラムは、肌色に対応するH成分とS成分の組の出現頻度、すなわち尤度(確からしさ)を表すものである。
The
The histogram obtained by the
ヒストグラム近似部5は、得られたヒストグラムをガウス混合モデルにて近似する。
入力される画像データから得られるヒストグラムは、膨大な量の離散値の集合体である。この膨大な量の離散値では、未知のデータに対して肌色であるか否かの判定処理ができない。そこで、ヒストグラムを少ない情報量にて表現できるガウス混合モデルにて近似する。この近似処理により、任意の画像データに対する尤度を、少ない演算量で且つ実用的な良い精度にて算出することが可能になる。
ガウス混合モデルは統計モデルの最も代表的なものであり、複数のガウス分布の集合体である。つまり、ガウス分布を構成する平均及び分散の値の、複数組の集合体である。膨大な量の離散値の集合体を、この複数のガウス分布にて近似する。なお、統計モデルとしては、ガウス混合モデル以外の、他の周知のモデルを適用することも可能である。すなわち、統計モデルの種類によって実施形態が限定されるものではない。
ヒストグラム近似部5における近似処理の詳細は特許文献1にて詳述されており、また以下に記す論文においても開示されており、良く知られているので、これ以上詳細な説明は省略する。
(1)S. McKenna, S. Gong, and Y. Raja. Modelling Facial Colour and Identity with Gaussian Mixtures. Pattern Recognition, 31(12):1883-1892, 1998.
(2)H.P. Graf, E. Cosatto, D. Gibbon, M. Kocheisen, and E. Petajan. MultimodelSystem for Locating Heads and Faces. In Proceedings of the Second IEEE International Conference on automatic Face and Gesture Recognition, pages 88-93, 1996.
The histogram approximation unit 5 approximates the obtained histogram with a Gaussian mixture model.
A histogram obtained from input image data is an aggregate of a huge amount of discrete values. With this enormous amount of discrete values, it is not possible to determine whether or not the unknown data is flesh-colored. Therefore, the histogram is approximated by a Gaussian mixture model that can be expressed with a small amount of information. By this approximation processing, it is possible to calculate the likelihood for arbitrary image data with a small amount of calculation and good practical accuracy.
The Gaussian mixture model is the most representative statistical model, and is an aggregate of a plurality of Gaussian distributions. That is, it is an aggregate of a plurality of sets of mean and variance values constituting a Gaussian distribution. An enormous collection of discrete values is approximated by the plurality of Gaussian distributions. As the statistical model, other known models other than the Gaussian mixture model can be applied. That is, the embodiment is not limited by the type of statistical model.
The details of the approximation processing in the histogram approximation unit 5 are described in detail in Patent Document 1, and are also disclosed in the following papers, which are well known.
(1) S. McKenna, S. Gong, and Y. Raja.Modeling Facial Color and Identity with Gaussian Mixtures.Pattern Recognition, 31 (12): 1883-1892, 1998.
(2) HP Graf, E. Cosatto, D. Gibbon, M. Kocheisen, and E. Petajan.MultimodelSystem for Locating Heads and Faces.In Proceedings of the Second IEEE International Conference on automatic Face and Gesture Recognition, pages 88-93, 1996.
ヒストグラム近似部5によって、膨大な量の離散値の集合体であったヒストグラムは、極めてデータ量の少ない、ガウス分布を構成する平均及び分散のデータの複数組の集合体よりなるデータ群(以下「GMMパラメータ群」と略す。GMMは"Gaussian Mixture Model"の略。)に変換される。
ヒストグラム近似部5によって得られるGMMパラメータ群は、現在入力されている画像データ中に存在する人物の肌色に依存した、「対象人物に固有のGMMパラメータ群」である。
説明の便宜上、この「対象人物に固有のGMMパラメータ群」を「第1のGMMパラメータ群」と称する。
第1のGMMパラメータ群にて表現されるガウス混合モデルは、対象人物の肌色の尤度を表現する肌色モデルである。
The histogram which is an aggregate of a huge amount of discrete values by the histogram approximation unit 5 is a data group (hereinafter referred to as “a group of multiple sets of average and variance data constituting a Gaussian distribution, which has an extremely small amount of data”. It is abbreviated as “GMM parameter group.” GMM is converted into “Gaussian Mixture Model”.
The GMM parameter group obtained by the histogram approximation unit 5 is a “GMM parameter group specific to the target person” depending on the skin color of the person existing in the currently input image data.
For convenience of explanation, this “GMM parameter group specific to the target person” is referred to as a “first GMM parameter group”.
The Gaussian mixture model expressed by the first GMM parameter group is a skin color model that expresses the likelihood of the skin color of the target person.
作成済肌色GMM7は不揮発性メモリ内のデータである。例えば周知のハードディスク装置内にファイルとして格納されている。
作成済肌色GMM7には、特許文献1の技術を用いて、多種多様な人種、性別、年齢等の人物の画像データから肌色の情報を抽出し、ガウス混合モデルにて正規化処理した結果得られたGMMパラメータ群が格納されている。
作成済肌色GMM7に格納されているGMMパラメータ群は、多種多様な人種、性別、年齢等の人物の画像データを基に作られている、つまり対象人物に依存しない「汎用のGMMパラメータ群」である。
説明の便宜上、この「汎用のGMMパラメータ群」を「第2のGMMパラメータ群」と称する。
第2のGMMパラメータ群にて表現されるガウス混合モデルは、汎用的な肌色の尤度を表現する肌色モデルである。
The created flesh color GMM 7 is data in the nonvolatile memory. For example, it is stored as a file in a known hard disk device.
The created skin color GMM7 is obtained as a result of extracting skin color information from image data of people of various races, genders, ages, etc. using the technique of Patent Document 1 and normalizing it with a Gaussian mixture model. Stored GMM parameter groups are stored.
The GMM parameter group stored in the created skin color GMM 7 is created based on image data of people of various races, genders, ages, etc., that is, “general-purpose GMM parameter group” that does not depend on the target person. It is.
For convenience of explanation, this “general-purpose GMM parameter group” is referred to as a “second GMM parameter group”.
The Gaussian mixture model expressed by the second GMM parameter group is a skin color model that expresses a general skin color likelihood.
修正GMM作成部6は、第1のGMMパラメータ群と第2のGMMパラメータ群とを重み付け加算処理し、修正GMMを作成する。例えば第1のGMMパラメータ群と第2のGMMパラメータ群とを3:2の割合で加算する。なお、加算の割合を変化させることにより、作成する修正GMMを入力画像データ中の人物の肌色に強く依存するものとしたり、逆に広範囲の人種に対応するものとすることもできる。
修正GMMにて表現されるガウス混合モデルは、対象人物の肌色の尤度に汎用的な肌色の尤度が加味された、いわば複合的な肌色モデルである。
The modified
The Gaussian mixture model expressed by the modified GMM is a complex skin color model in which a general skin color likelihood is added to the skin color likelihood of the target person.
肌色尤度算出部8は、HSV変換部3にて得られた入力画像データ中の個々の画素データに対応するH,Sデータに対し、修正GMMを基にして肌色尤度を算出する。
The skin color likelihood calculation unit 8 calculates the skin color likelihood based on the corrected GMM for H and S data corresponding to individual pixel data in the input image data obtained by the
二値化部9は、肌色尤度算出部8によって得られた尤度データを閾値11と比較して、肌色であるか否かを判定し、判定結果を0又は1の二値として出力する。
閾値11は単一のスカラ値であり、例えば周知のRAMに格納されている。
二値化部9によって得られた判定結果は、肌色領域データ10として、例えばRAMに格納される。
なお、肌色領域データ10は、顔領域中の目や眉、鼻の穴等、肌色と認識されない細部に対する「塗り潰し」を行うべく、所定の積分処理を施す。
The binarizing unit 9 compares the likelihood data obtained by the skin color likelihood calculating unit 8 with the
The
The determination result obtained by the binarizing unit 9 is stored as skin
The skin
閾値更新部12は、ヒストグラム生成部4内の矩形状顔領域作成部21から得られる矩形状顔領域データと、肌色領域データ10に基づき、所定の演算処理によって閾値11を更新する。
The
図2は、ヒストグラム生成部4の内部構成を詳述する機能ブロック図である。
FIG. 2 is a functional block diagram detailing the internal configuration of the
HSV変換部3から得られるH,S,Vデータのうち、Vデータは矩形状顔領域作成部21に渡される。矩形状顔領域作成部21は、明度を表すVデータの一画面分から、円形或は楕円形の明るい領域を探し出し、この円或は楕円を囲む矩形データを作成する。顔の領域はほぼ楕円形の均一の明るさを持つ領域であるという性質に基づいて、大まかな顔領域の特定を行う処理である。
Of the H, S, and V data obtained from the
HSV変換部3から得られるH,S,Vデータのうち、H,Sデータは顔領域データ抽出部22に渡される。また、矩形状顔領域作成部21から得られた矩形状顔領域データも顔領域データ抽出部22に渡される。顔領域データ抽出部22は、矩形状顔領域内のH,Sデータの組を特定する。
Of the H, S, and V data obtained from the
顔領域データ抽出部22にて選択されたH,Sデータに対して、汎用肌色GMM23内のH,S範囲データ群に含まれているか否かを、簡易肌色判定部24にて判定する。
こうして得られたデータは、肌色の可能性が相応に高いデータである。
The simple skin
The data obtained in this way is data with a correspondingly high possibility of skin color.
得られた肌色のH,Sデータから、ヒストグラム作成部25にてヒストグラムを作成する。こうして、対象人物の画像データから顔領域内の肌色データと思しきデータを基に、ヒストグラムが出来上がる。
A
図3は、閾値更新部12の内部構成を詳述する機能ブロック図である。
FIG. 3 is a functional block diagram detailing the internal configuration of the
肌色領域データ10に対し、矩形状顔領域作成部21にて得られた矩形状顔領域データを基に、顔領域内外の肌色データの出現率を計算する。
顔領域内肌色データ出現率算出部31は、矩形状顔領域データに含まれる肌色領域データの数を数え、矩形状顔領域データ全体の数から出現率を算出する。これをパラメータaとする。
顔領域外肌色データ出現率算出部32は、矩形状顔領域データの外にある肌色領域データの数を数え、画像データ全体の数から矩形状顔領域データ全体の数を引いた分から出現率を算出する。これをパラメータbとする。
閾値更新部は、顔領域内肌色データ出現率算出部31と顔領域外肌色データ出現率算出部32にて得られたaとbと、定数34に格納されているα、β、Srateを用いて、以下の更新演算を行う。
The face area skin color data appearance
The face area outside skin color data appearance
The threshold update unit calculates a and b obtained by the skin color data appearance
数式中、max(x,y)はxとyの中から最大値を選択する関数である。
定数34は作成済肌色GMM7と同様の、不揮発性メモリ内のデータである。例えば周知のハードディスク装置内にファイルとして格納されている。α、βは学習速度係数、Srateは顔領域内における肌色データ出現率の最小値を、予め設定しておくものである。
αの値は、顔領域内の肌色出現率aが肌色データ出現率の最小値Srateより小さくなると、速い速度で閾値を小さくするように設定される。例えばαは0.6である。
βの値は、常に閾値の値を遅い速度で大きくするように設定される。例えばβは0.4である。
Srateの値は、顔が横を向いている状態を最小値とする。横顔が写っている画像データに対し、矩形状顔領域作成部21にて矩形状顔領域データを作成すると、顔領域内の肌色出現率がおよそ0.56程度になることから、この値を設定する。
In the formula, max (x, y) is a function for selecting the maximum value from x and y.
The constant 34 is data in the nonvolatile memory similar to the created flesh color GMM7. For example, it is stored as a file in a known hard disk device. α and β are preset learning rate coefficients, and S rate is a minimum value of the skin color data appearance rate in the face area.
The value of α is set so that the threshold value is reduced at a high speed when the skin color appearance rate a in the face area is smaller than the minimum value S rate of the skin color data appearance rate. For example, α is 0.6.
The value of β is always set to increase the threshold value at a slow speed. For example, β is 0.4.
The value of S rate is the minimum value when the face is facing sideways. When rectangular face area data is created by the rectangular face
矩形状顔領域中の肌色出現率aが小さくなると、閾値Tは小さくなる。
矩形状顔領域外の肌色出現率bが大きくなると、閾値Tは大きくなる。
閾値算出部33による閾値Tの更新演算処理により、肌色領域の検出精度は向上する。入力画像データが静止画像である場合、閾値更新部12の繰り返し演算処理により、aとbは所定の値へ収束し、閾値Tも所定の値に収束する。
As the skin color appearance rate a in the rectangular face region decreases, the threshold T decreases.
As the skin color appearance rate b outside the rectangular face area increases, the threshold T increases.
The detection accuracy of the skin color area is improved by the update calculation process of the threshold value T by the threshold
図4は、本実施形態に係る肌色領域検出処理を示す。 FIG. 4 shows a skin color area detection process according to this embodiment.
図4(a)は入力画像データである。女性の上半身のカラー画像データである。
図4(b)は矩形状顔領域作成部21にて顔領域Fを検出した結果を示す。検出した顔領域の範囲内に限定して、対象人物の肌色のサンプルを取り出し、肌色分布モデルを作成する。
図4(c)は検出した肌色領域データ10を示す。積分処理により大きな肌色の領域S1,S2,S3が検出される。また、閾値の更新処理により、ノイズが減少し、検出精度が向上する。
FIG. 4A shows input image data. It is color image data of the upper body of a woman.
FIG. 4B shows a result of detecting the face area F by the rectangular face
FIG. 4C shows the detected skin
実施の形態は上記に限らず、以下のような応用が可能である。
(1)特に動画に対する肌色検出処理においては、閾値は検出した肌色領域データ10の形態に基づき、座標に応じて異なる値を作成しても良い。つまり、被写体である人間は連続的な動作をすることから、肌色領域であると判定した部分の閾値は低めに、それ以外の部分の閾値は高めに設定することにより、ノイズに強い肌色検出装置を得ることができる。
(2)定数34を予め用意するのではなく、各々の定数の最適値を事前の演算処理によって得ることもできる。例えば、サンプルの静止画像データを用いて、α,β,Srateを変化させながら閾値更新処理を何度か行い、最適値を選択すること等が考えられる。
The embodiment is not limited to the above, and the following applications are possible.
(1) In particular, in the skin color detection process for a moving image, a different threshold value may be created according to the coordinates based on the form of the detected skin
(2) Instead of preparing the
1…肌色領域検出装置、2…画像情報取得部、3…HSV変換部、4…ヒストグラム生成部、5…ヒストグラム近似部、6…修正GMM作成部、7…作成済肌色GMM、8…肌色尤度算出部、9…二値化部、10…肌色領域データ、11…閾値、12…閾値更新部
DESCRIPTION OF SYMBOLS 1 ... Skin color area | region detection apparatus, 2 ... Image information acquisition part, 3 ... HSV conversion part, 4 ... Histogram generation part, 5 ... Histogram approximation part, 6 ... Correction GMM creation part, 7 ... Created skin color GMM, 8 ... Skin color likelihood Degree calculation unit, 9 ... binarization unit, 10 ... skin color area data, 11 ... threshold, 12 ... threshold update unit
Claims (3)
前記肌色画素抽出部にて得られた前記肌色画素データが有する色に関する情報からヒストグラムを生成するヒストグラム生成部と、
前記ヒストグラム生成部にて得られた前記ヒストグラムを近似処理して、第1の統計モデルを得るヒストグラム近似部と、
前記ヒストグラム近似部にて得られた第1の統計モデルと、前記第1の統計モデルとは異なる第2の統計モデルとを重み付け加算処理する複合統計モデル作成部と、
前記複合統計モデル作成部にて得られた複合統計モデルを用いて、前記入力画像データの画素データに対応する肌色尤度を求め、得られた前記肌色尤度を閾値と比較して、前記画素データが肌色であるか否かを判定し、前記判定結果に基づいて入力画像データに対する肌色領域検出結果を得る二値化処理部と、
前記二値化処理部の結果得られた肌色領域検出結果を前記閾値の更新に利用する閾値更新部と
よりなることを特徴とする肌色領域検出装置。 A skin color pixel extraction unit that extracts pixel data that seems to be skin color from input image data;
A histogram generation unit that generates a histogram from information about the color of the skin color pixel data obtained by the skin color pixel extraction unit;
A histogram approximation unit that approximates the histogram obtained by the histogram generation unit to obtain a first statistical model;
A composite statistical model creation unit that performs weighted addition processing on the first statistical model obtained by the histogram approximation unit and a second statistical model different from the first statistical model;
Using the composite statistical model obtained by the composite statistical model creation unit, the skin color likelihood corresponding to the pixel data of the input image data is obtained, the obtained skin color likelihood is compared with a threshold value, and the pixel A binarization processing unit that determines whether or not the data is skin color, and obtains a skin color area detection result for the input image data based on the determination result;
A skin color region detection apparatus comprising a threshold update unit that uses a skin color region detection result obtained as a result of the binarization processing unit to update the threshold.
前記入力画像データの明度を示す情報から人物の顔の位置を推定して顔領域推定結果を得る顔領域推定部と、
前記入力画像データのうち、前記顔領域推定結果の範囲内にある画素データ群から、肌色の画素データであるか否かを判定する肌色判定部と
を含み、
前記ヒストグラム近似部は、ガウス混合モデルによって前記ヒストグラムを近似するものであり、
前記第2の統計モデルは、入力画像データに依存しない肌色の統計モデルであり、
前記閾値更新部は、前記顔領域推定結果の範囲内にある肌色領域の画素データ出現率と、前記顔領域推定結果の範囲外にある肌色領域の画素データ出現率とを閾値の更新演算に用いるものである
ことを特徴とする、請求項1記載の肌色領域検出装置。 The skin color pixel extraction unit
A face area estimation unit that estimates the position of a person's face from information indicating the brightness of the input image data and obtains a face area estimation result;
A skin color determination unit that determines whether or not the input image data is pixel data of skin color from a pixel data group within the range of the face region estimation result;
The histogram approximation unit approximates the histogram by a Gaussian mixture model,
The second statistical model is a skin color statistical model that does not depend on input image data,
The threshold update unit uses the pixel data appearance rate of the skin color area within the range of the face area estimation result and the pixel data appearance rate of the skin color area outside the range of the face area estimation result for the threshold update calculation. The skin color area detecting apparatus according to claim 1, wherein the apparatus is a skin color area detecting apparatus.
前記肌色画素抽出手順にて得られた前記肌色画素データが有する色に関する情報からヒストグラムを生成するヒストグラム生成手順と、
前記ヒストグラム生成手順にて得られた前記ヒストグラムを近似処理するヒストグラム近似手順と、
前記ヒストグラム近似手順にて得られた第1の統計モデルと、前記第1の統計モデルとは異なる第2の統計モデルとを重み付け加算処理する複合統計モデル作成手順と、
前記複合統計モデル作成手順にて得られた複合統計モデルを用いて、前記入力画像データの画素データに対応する肌色尤度を求め、得られた前記肌色尤度を閾値と比較して、前記画素データが肌色であるか否かを判定し、前記判定結果に基づいて入力画像データに対する肌色領域検出結果を得る二値化処理手順と、
前記二値化処理手順の結果得られた肌色領域検出結果を前記閾値の更新に利用する閾値更新手順と
よりなることを特徴とする肌色領域検出方法。 Skin color pixel extraction procedure for extracting pixel data that seems to be skin color from input image data;
A histogram generation procedure for generating a histogram from information relating to the color of the skin color pixel data obtained in the skin color pixel extraction procedure;
A histogram approximation procedure for approximating the histogram obtained in the histogram generation procedure;
A composite statistical model creation procedure for performing a weighted addition process on the first statistical model obtained by the histogram approximation procedure and a second statistical model different from the first statistical model;
Using the composite statistical model obtained in the composite statistical model creation procedure, the skin color likelihood corresponding to the pixel data of the input image data is obtained, the obtained skin color likelihood is compared with a threshold value, and the pixel A binarization processing procedure for determining whether the data is a skin color and obtaining a skin color area detection result for the input image data based on the determination result;
A skin color region detection method comprising: a threshold update procedure that uses a skin color region detection result obtained as a result of the binarization processing procedure to update the threshold.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006077692A JP2007257087A (en) | 2006-03-20 | 2006-03-20 | Skin color area detecting device and skin color area detecting method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006077692A JP2007257087A (en) | 2006-03-20 | 2006-03-20 | Skin color area detecting device and skin color area detecting method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007257087A true JP2007257087A (en) | 2007-10-04 |
Family
ID=38631307
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006077692A Pending JP2007257087A (en) | 2006-03-20 | 2006-03-20 | Skin color area detecting device and skin color area detecting method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007257087A (en) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009169518A (en) * | 2008-01-11 | 2009-07-30 | Kddi Corp | Area identification apparatus and content identification apparatus |
WO2010041836A2 (en) * | 2008-10-07 | 2010-04-15 | Korea Institute Of Oriental Medicine | Method of detecting skin-colored area using variable skin color model |
JP2010166263A (en) * | 2009-01-14 | 2010-07-29 | Canon Inc | Image processor, image processing method, and program |
CN101960491A (en) * | 2008-03-18 | 2011-01-26 | 汤姆森许可贸易公司 | Method and apparatus for adaptive feature of interest color model parameters estimation |
WO2016006429A1 (en) * | 2014-07-07 | 2016-01-14 | ソニー株式会社 | Image processing device and method, program, and endoscope system |
RU2578210C1 (en) * | 2014-07-23 | 2016-03-27 | Сяоми Инк. | Method and device for correcting skin colour |
JP2016061692A (en) * | 2014-09-18 | 2016-04-25 | 株式会社メガチップス | Human body detection device |
US9374574B2 (en) | 2012-07-11 | 2016-06-21 | Panasonic Intellectual Property Management Co., Ltd. | Three-dimensional video display apparatus and three-dimensional video display method |
KR101854991B1 (en) * | 2016-09-12 | 2018-05-08 | 에스테 로우더, 인코포레이티드 | System and method for correcting color of digital image based on the human sclera and pupil |
US10445612B2 (en) | 2015-10-26 | 2019-10-15 | Canon Kabushiki Kaisha | Information processing apparatus, information processing method, and storage medium |
US10621754B2 (en) | 2016-09-23 | 2020-04-14 | Casio Computer Co., Ltd. | Method of detecting skin color area of human |
KR102269897B1 (en) * | 2020-01-08 | 2021-06-28 | 주식회사 메디트 | Image filtering method |
US20220222466A1 (en) * | 2021-01-13 | 2022-07-14 | Ford Global Technologies, Llc | Material spectroscopy |
US11657589B2 (en) | 2021-01-13 | 2023-05-23 | Ford Global Technologies, Llc | Material spectroscopy |
US11741747B2 (en) | 2021-01-13 | 2023-08-29 | Ford Global Technologies, Llc | Material spectroscopy |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004246424A (en) * | 2003-02-10 | 2004-09-02 | Masahide Kaneko | Method for extracting skin color area |
JP2005242582A (en) * | 2004-02-25 | 2005-09-08 | Univ Waseda | Face detection device and method thereof |
JP2005250712A (en) * | 2004-03-03 | 2005-09-15 | Univ Waseda | Figure attribute identification method and its system |
-
2006
- 2006-03-20 JP JP2006077692A patent/JP2007257087A/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004246424A (en) * | 2003-02-10 | 2004-09-02 | Masahide Kaneko | Method for extracting skin color area |
JP2005242582A (en) * | 2004-02-25 | 2005-09-08 | Univ Waseda | Face detection device and method thereof |
JP2005250712A (en) * | 2004-03-03 | 2005-09-15 | Univ Waseda | Figure attribute identification method and its system |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009169518A (en) * | 2008-01-11 | 2009-07-30 | Kddi Corp | Area identification apparatus and content identification apparatus |
CN101960491A (en) * | 2008-03-18 | 2011-01-26 | 汤姆森许可贸易公司 | Method and apparatus for adaptive feature of interest color model parameters estimation |
JP2011517526A (en) * | 2008-03-18 | 2011-06-09 | トムソン ライセンシング | Method and apparatus for adaptive color model parameter estimation of object of interest |
KR101528895B1 (en) * | 2008-03-18 | 2015-06-15 | 톰슨 라이센싱 | Method and apparatus for adaptive feature of interest color model parameters estimation |
WO2010041836A2 (en) * | 2008-10-07 | 2010-04-15 | Korea Institute Of Oriental Medicine | Method of detecting skin-colored area using variable skin color model |
KR100957716B1 (en) | 2008-10-07 | 2010-05-12 | 한국 한의학 연구원 | Extraction Method of Skin-Colored Region using Variable Skin Color Model |
WO2010041836A3 (en) * | 2008-10-07 | 2010-07-15 | Korea Institute Of Oriental Medicine | Method of detecting skin-colored area using variable skin color model |
US8457394B2 (en) | 2008-10-07 | 2013-06-04 | Korea Institute Of Oriental Medicine | Method of detecting skin-colored area using variable skin color model |
JP2010166263A (en) * | 2009-01-14 | 2010-07-29 | Canon Inc | Image processor, image processing method, and program |
US9374574B2 (en) | 2012-07-11 | 2016-06-21 | Panasonic Intellectual Property Management Co., Ltd. | Three-dimensional video display apparatus and three-dimensional video display method |
WO2016006429A1 (en) * | 2014-07-07 | 2016-01-14 | ソニー株式会社 | Image processing device and method, program, and endoscope system |
US10367974B2 (en) | 2014-07-07 | 2019-07-30 | Sony Corporation | Image processing apparatus, image processing method, program, and endoscope system |
RU2578210C1 (en) * | 2014-07-23 | 2016-03-27 | Сяоми Инк. | Method and device for correcting skin colour |
JP2016061692A (en) * | 2014-09-18 | 2016-04-25 | 株式会社メガチップス | Human body detection device |
US10445612B2 (en) | 2015-10-26 | 2019-10-15 | Canon Kabushiki Kaisha | Information processing apparatus, information processing method, and storage medium |
KR101854991B1 (en) * | 2016-09-12 | 2018-05-08 | 에스테 로우더, 인코포레이티드 | System and method for correcting color of digital image based on the human sclera and pupil |
US10621754B2 (en) | 2016-09-23 | 2020-04-14 | Casio Computer Co., Ltd. | Method of detecting skin color area of human |
KR102269897B1 (en) * | 2020-01-08 | 2021-06-28 | 주식회사 메디트 | Image filtering method |
WO2021141424A1 (en) * | 2020-01-08 | 2021-07-15 | 주식회사 메디트 | Image filtering method |
US20220222466A1 (en) * | 2021-01-13 | 2022-07-14 | Ford Global Technologies, Llc | Material spectroscopy |
US11657589B2 (en) | 2021-01-13 | 2023-05-23 | Ford Global Technologies, Llc | Material spectroscopy |
US11741747B2 (en) | 2021-01-13 | 2023-08-29 | Ford Global Technologies, Llc | Material spectroscopy |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2007257087A (en) | Skin color area detecting device and skin color area detecting method | |
JP5010905B2 (en) | Face recognition device | |
JP2004348674A (en) | Region detection method and its device | |
US7925093B2 (en) | Image recognition apparatus | |
KR100957716B1 (en) | Extraction Method of Skin-Colored Region using Variable Skin Color Model | |
KR20040008791A (en) | System and method for detecting and tracking a plurality of faces in real-time by integrating the visual ques | |
Sharma | Designing of face recognition system | |
Zhang et al. | Hand gesture detection and segmentation based on difference background image with complex background | |
KR101408344B1 (en) | Apparatus for detecting face | |
Yusuf et al. | Human face detection using skin color segmentation and watershed algorithm | |
Manaf et al. | Color recognition system with augmented reality concept and finger interaction: Case study for color blind aid system | |
JP3902887B2 (en) | Lip extraction method | |
KR20110019969A (en) | Apparatus for detecting face | |
Jindal et al. | Sign Language Detection using Convolutional Neural Network (CNN) | |
JP2006343989A (en) | Image processing device, image processing method, and image processing program | |
JP2022147713A (en) | Image generation device, learning device, and image generation method | |
Jalilian et al. | Face and hand shape segmentation using statistical skin detection for sign language recognition | |
JP4475395B2 (en) | Image processing method, image processing apparatus, image processing program, and storage medium | |
KR200473405Y1 (en) | Intelligent toy system with facial expression recognition technology | |
JP3979122B2 (en) | Image processing apparatus and image processing method | |
KR20090113617A (en) | Image authentication method, Apparatus and computer readable record-medium on which program for executing method thereof | |
Derhalli et al. | Face detection using boosting and histogram normalization | |
Chai et al. | Towards contactless palm region extraction in complex environment | |
Prinosil | Clothing Color Based De-Identification | |
KR100910754B1 (en) | Method for Detecting Skin Region by Grid-Based Approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090312 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101228 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110419 |