JP4591215B2 - 顔画像データベース作成方法及び装置 - Google Patents
顔画像データベース作成方法及び装置 Download PDFInfo
- Publication number
- JP4591215B2 JP4591215B2 JP2005166327A JP2005166327A JP4591215B2 JP 4591215 B2 JP4591215 B2 JP 4591215B2 JP 2005166327 A JP2005166327 A JP 2005166327A JP 2005166327 A JP2005166327 A JP 2005166327A JP 4591215 B2 JP4591215 B2 JP 4591215B2
- Authority
- JP
- Japan
- Prior art keywords
- face
- group
- area
- image
- face area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Description
ここで、顔画像データベースの構築に人物の顔特徴量の学習を導入することで、顔識別性能が向上する可能性がある。したがって、人物の顔判別性能の向上のためには顔画像データベースの構築する手法が有利である。しかし、顔画像データベースを構築するためには、同一人物の顔画像であることが分かっている顔画像サンプルを学習データとして収集する必要があり、人手による学習データの収集作業が大きな負担となっていた。
本発明は、この問題点に鑑みてなされたものであり、同一人物の顔画像と、異なる人物の顔画像を教師情報として自動的に収集し、顔画像データベースの人手による構築作業が不要という長所と顔識別性能の向上という利点の両立を図ったものである。
図1は、本発明の一実施例を説明する機能ブロック図である。本ブロック図を大別すると、動画像処理を行う102〜106の部分と、顔グループ(各カット内において連続したフレームに対し顔領域検出と領域追跡を行い、顔領域をまとめたもの)を生成する部分107,108、データを生成する部分109〜114、顔識別情報を生成する部分115〜117、全顔識別情報に対して顔グループ単位で顔識別処理をする部分118, 119とで構成されている。また、図中の正学習用顔データ(113)、反学習用顔データ(114)、顔識別情報(117)、別人情報(122)、顔領域情報(124)、メタデータ(126)は、顔画像データベース内に高速アクセス可能な状態で蓄積される。この顔画像データベースは、一つのデータベースで構成されていてもよいし、複数のデータベースで構成されて連携して機能していても良い。
101は映像コンテンツである。主に、編集意図によるカットが存在する映像コンテンツを対象としている。
102で映像コンテンツの映像と音声を分離し、106で映像フォーマットを判別してコーデックを選択し、103にて映像をデコードする。104で映像から各フレームが抽出され、107の顔領域検出処理と105のカット分割処理へ送られる。
105は、カット分割処理であり、公知の技術等を用いて映像のカットの変わり目を検出する。映像の切り替わり効果であるディゾルブ(前後二つのカットの画面が二重写しとなりつつ、前カットから後カットへ徐々に移り変わる効果)とワイプ(ある画面に他の画面が割り込んでくるような形で次のカットへ置き換わる効果)の特殊効果も検出する。
107の顔領域検出では、後述の顔の回転処理を考慮して顔領域の対角線を一辺とする顔領域より大きな正方領域を抽出する。
108は、カット内の各フレームで検出された顔領域を追跡し、グループ化する処理であり、顔グループ化された結果は121別人情報生成処理、123顔領域情報生成処理へ送られ使用される。また、顔画像データ(127)は顔画像データベースへ格納されて必要に応じて読み出され、109顔画像サイズの正規化処理と110顔画像左右反転処理で使用される。
109では、フレームの中の顔領域で指定される顔画像の部分のみを正規化、すなわち、拡大や縮小を行って一定のサイズへ変換する。
123では、顔グループ毎に顔領域が含まれているフレームと、顔領域の位置およびサイズの情報を含む顔領域情報(124)を生成する。その顔領域情報は、125で人物毎にフレームと顔領域を分類してメタデータを生成する際に参照される。また、顔グループ単位の処理を行う際にも必要に応じて参照される。
111は、入力された画像について、必要に応じて顔画像の中心を軸として時計回り、反時計回りに回転した画像を出力する。顔画像のモーメントを算出することで長軸を見出して回転角度を決めることで、顔の傾きがどのような画像が入力されても、顔の傾きを一定にそろえることができる。あるいは、傾きにロバストな学習を行う場合には、110の左右反転と111の回転の組み合わせで多くの傾きや顔の向きの画像サンプルを生成することも可能である。
112は、109と同じで顔画像サイズの正規化処理である。さらに、顔画像を顔グループに応じて正学習用顔画像データ(113)と反学習用顔画像データ(114)に振り分ける。同一フレームに複数の顔領域が存在する場合、一つのカット内に複数の顔グループが生成される。それらの顔グループのうち、一つの顔グループを取り上げ、その顔グループの顔画像を正学習用顔データとして扱い、他の顔グループの顔画像を反学習用顔データとして扱う。これらの処理は別人情報(122)を参照して行われる。
118では、116で生成された顔識別情報(117)を用い、109でサイズが正規化された顔画像を判別し、顔領域情報(124)を参照して顔グループ毎に判別できた顔画像数を集計する。これを全ての顔判別部で繰り返す。
119は、リジェクト機能、すなわち、顔識別された結果のうち、ある条件を満たすものを却下することで信頼性の高い結果を残す機能である。例えば、顔グループに含まれる顔画像を対象として、顔識別で同一人物であると判別した画像の枚数を計数し、事前に設定されたしきい値以下の場合にリジェクトする。
118と119で全てのが行われ、さらに、顔グループ毎に生成されたフレームとフレーム内の顔領域に関する顔領域情報(124)を参照して、人物の指定により人物が登場するフレームとフレーム内の顔領域が参照可能とする情報と、フレーム内の顔領域から人物を参照可能とする情報をメタデータ(126)として出力する。
カット(201)は、二つの映像変化点(202)によって分割された映像の一部である。その中にフレームが時系列として右方向へ並んでいる。その中に二つの顔領域が含まれている。一つの顔領域について、顔領域検出手段によって203の顔領域が検出されたとする。その後、顔領域追跡手段によってフレーム間における近傍探索を色情報や輝度変化方向情報のヒストグラム等の照合で行い、対応する領域を見つけることによって、時系列方向に向かってフレーム内を追跡し、特定される顔画像をグループ化し、顔グループI(205)を得る。こうして得られた顔グループ内には同一人物の顔が集められている。
本発明によれば、このような性質を活かして、前述の顔領域検出手段と顔領域追跡手段を用いて、顔領域が検出できないフレームが続いたとしても、一度顔領域が検出できれば、カット内において時系列をさかのぼって顔領域を追跡することができるので、カット内のフレームからの顔画像の抽出漏れを少なくすることができる。
片側のみ識別する図6の方法に比べて、識別の信頼性の低い顔グループのペアはリジェクトされやすくなるため、顔識別精度を高めることができる。
以下に、前述のように作成された顔領域のサイズと座標等を含むメタデータの活用方法を説明する。メタデータは通常、映像再生端末によって受信され、利用されるのが一般的である。したがって、下記は映像再生端末側の動作の例を示す。
こうして人物一覧表示画面が生成される。人物ごとに最も大きな顔領域を持つ画像が表示されているので、ユーザにとって人物が見やすく選択し易くする効果がある。
人物一覧モードを選択した場合、903で人物一覧モードと判定され、904へ処理が移る。904では、一覧からの人物画像選択がユーザに要求され、ユーザが選択を行う。この処理の中で、図8の人物一覧の作成(801)が呼び出される。次に、905にてユーザによって選択された人物画像に対応する分類ラベルが、データベース化されたメタデータを参照することによって、取得される。
910では分類ラベルに対応するフレーム番号の範囲が、データベースアクセスにより取得され、911でそのフレーム番号の範囲が次々と再生される。
こうして、指定した人物の映像が再生されるので、ユーザは好みの人物の映像のみを視聴することができる。
102: 映像音声分離部
103: 映像デコード部
104: フレーム抽出部
105: カット分割処理部
106: コーデック自動選択部
107: 顔領域検出部
108: 顔グループ生成部
109: 顔画像サイズ正規化部
110: 顔画像左右反転部
111: 顔画像回転部
112: 顔画像サイズ正規化部
113: 正学習用画像データ
114: 反学習用画像データ
115: 顔特徴量抽出部
116: 顔識別情報作成部
117: 顔識別情報
118: 顔グループ単位で同一人物の顔識別数を出力
119: リジェクト処理部
120: 顔グループ対応付け処理
121: 別人情報生成部
122: 別人情報
123: 顔領域情報生成部
124: 顔領域情報
125: フレーム領域分類処理
126: メタデータ
127: 顔画像データ
201: カット
202: 映像変化点
203: 検出された顔領域
204: カットの途中で検出された顔領域
205: 顔グループ
206: 顔グループ
301: 顔グループID
302: 分類ラベル
303: 顔領域数
304: 顔領域情報
310: フレーム番号
311: 顔領域のx座標
312: 顔領域のy座標
313: 顔領域の幅
314: 顔領域の高さ
401: 顔画像から抽出された顔特徴量空間
402: 学習データAの分布
403: 学習データBの分布
404: 分布の分散が大きい軸が主軸にとなるように回転した空間
405: 擾乱済み分割データA1
406: 各分布が等方的となるように正規化した空間
407: 未知サンプル
501: 顔グループ
502: 含まれる顔画像を特徴抽出
503: 特徴抽出された顔グループ
504: 異なる顔グループ
505: 特徴抽出された顔グループ
506: 顔特徴量同士の照合
601: 顔識別情報(顔グループI)
602: 顔グループIの顔画像群
603: 顔グループKの顔画像群
604: 同一人物と識別された顔画像数の計数
605: 顔画像数リジェクト
606: しきい値判定
607: 顔グループIと顔グループJは同一人物判定
701: 顔識別情報(顔グループK)
702: 同一人物と識別された顔画像数の計数
703: 顔画像数リジェクト
704: しきい値判定
705: 顔グループIと顔グループJは同一人物判定。
Claims (7)
- 動画像が、顔画像データベース作成装置に入力されるステップと、
前記顔画像データベース作成装置のカット分割処理部にて、前記入力された動画像を、複数のフレームからなるカットに分割するステップと、
前記顔画像データベース作成装置の顔領域検出部にて、前記複数のフレームから顔領域を検出するステップと、
前記顔画像データベース作成装置の顔グループ生成部にて、前記複数のフレームについて前記顔領域を追跡して、抽出された顔領域をグループ化するステップと、
前記顔画像データベース作成装置の別人情報生成部にて、前記フレーム内に存在する複数の顔領域それぞれに互いに別人であることを示す別人情報を付すステップと、
前記別人情報を用いて前記複数の顔領域グループのうちの1つの顔領域グループの顔画像を正学習用顔データとして、他の顔領域グループの顔画像を反学習用顔データとして扱い、前記顔画像データベース作成装置の特徴量抽出部にて、前記正学習用顔データと前記反学習用顔データそれぞれの特徴量を抽出するステップと、
前記顔画像データベース作成装置の顔識別情報生成部にて、前記抽出された特徴量に基づいて、顔識別情報を生成するステップと、
前記顔画像データベース作成装置の顔領域グループ対応付け部にて、前記顔識別情報を用いて、前記反学習用顔データは用いずに、同一人物かどうかが判定されるための顔領域グループ同士を対応づけ、顔分類を行うステップと、
前記顔分類されたデータを、メタデータとして出力するステップと
を有することを特徴とする顔画像データベース作成方法。 - 前記顔グループ生成部は、前記複数のフレームの何れかにおいて顔領域が検出された場合に、時系列をさかのぼって顔領域を追跡することを特徴とする請求項1記載の顔画像データベース作成方法。
- 前記顔画像データベース作成装置の顔領域情報生成部は、前記検出された顔領域のフレーム中の位置及びサイズ情報を含む顔領域情報を、前記顔領域グループ毎に生成し、前記顔領域情報を用いて、前記フレームに含まれる顔領域を人物ごとに分類することを特徴とする請求項1又は2に記載の顔画像データベース作成方法。
- 前記顔領域グループ同士の対応付けは、顔画像の特徴量を用いて、異なる前記顔領域グループ間の顔画像同士を照合することにより行われることを特徴とする請求項1の顔画像データベース作成方法。
- 前記顔領域グループ同士の対応付けは、顔画像識別情報データベースを用いて別の顔グループの顔画像を顔識別することにより、その顔グループと別の顔グループとの対応付けを行うことを特徴とする請求項1の顔画像データベース作成方法。
- 前記顔領域グループ同士の対応付けは、一方の顔グループの顔識別情報を用いて他方の顔グループの顔画像を顔識別し、さらに、前記他方の顔グループの顔識別情報を用いて前記一方の顔グループの顔画像を顔識別し、両者が互いに同一人物であると顔識別された場合に、それらの顔領域グループ同士を対応付けることにより行われることを特徴とする請求項1の顔画像データベース作成方法。
- 動画像が入力される入力部と、
前記入力された動画像を、複数のフレームからなるカットに分割するカット分割処理部と、
前記複数のフレームから顔領域を検出する顔領域検出部と、
前記複数のフレームについて前記顔領域を追跡して、抽出された顔領域をグループ化する顔グループ生成部と、
前記フレーム内に存在する複数の顔領域それぞれに互いに別人であることを示す別人情報を付す別人情報生成部と、
前記別人情報を用いて前記複数の顔領域グループのうちの1つの顔領域グループの顔画像を正学習用顔データとして、他の顔領域グループの顔画像を反学習用顔データとして扱い、前記正学習用顔データと前記反学習用顔データそれぞれの特徴量を抽出する特徴量抽出部と、
前記抽出された特徴量に基づいて、顔識別情報を生成する顔識別情報生成部と、
前記顔識別情報を用いて、前記反学習用顔データは用いずに、同一人物かどうかが判定されるための顔領域グループ同士を対応づける顔領域グループ対応付け部と、
前記対応づけられた顔領域グループの顔分類を行う顔分類部と、
前記顔分類されたデータを、メタデータとして出力する出力部と
を有することを特徴とする顔画像データベース作成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005166327A JP4591215B2 (ja) | 2005-06-07 | 2005-06-07 | 顔画像データベース作成方法及び装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005166327A JP4591215B2 (ja) | 2005-06-07 | 2005-06-07 | 顔画像データベース作成方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006343791A JP2006343791A (ja) | 2006-12-21 |
JP4591215B2 true JP4591215B2 (ja) | 2010-12-01 |
Family
ID=37640751
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005166327A Expired - Fee Related JP4591215B2 (ja) | 2005-06-07 | 2005-06-07 | 顔画像データベース作成方法及び装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4591215B2 (ja) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4697106B2 (ja) * | 2006-09-25 | 2011-06-08 | ソニー株式会社 | 画像処理装置および方法、並びにプログラム |
JP4888111B2 (ja) * | 2006-12-26 | 2012-02-29 | 株式会社ニコン | 被写体認識装置、画像検索方法、および被写体認識プログラム |
JP4831623B2 (ja) * | 2007-03-29 | 2011-12-07 | Kddi株式会社 | 動画像の顔インデックス作成装置およびその顔画像追跡方法 |
US7890556B2 (en) | 2007-04-04 | 2011-02-15 | Sony Corporation | Content recording apparatus, content playback apparatus, content playback system, image capturing apparatus, processing method for the content recording apparatus, the content playback apparatus, the content playback system, and the image capturing apparatus, and program |
JP4337064B2 (ja) | 2007-04-04 | 2009-09-30 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
JP4462290B2 (ja) * | 2007-04-04 | 2010-05-12 | ソニー株式会社 | コンテンツ管理情報記録装置、コンテンツ再生装置、コンテンツ再生システム、撮像装置、コンテンツ管理情報記録方法およびプログラム |
JP5016999B2 (ja) * | 2007-07-03 | 2012-09-05 | キヤノン株式会社 | 撮像装置、撮像方法、及びプログラム |
US20100174707A1 (en) * | 2007-09-07 | 2010-07-08 | Daiki Kudo | Image searching apparatus, image sorting apparatus and method and program |
JP5061382B2 (ja) * | 2008-03-31 | 2012-10-31 | Kddi株式会社 | 時系列データの識別装置および動画像への人物メタ情報付与装置 |
JP2010081457A (ja) * | 2008-09-29 | 2010-04-08 | Hitachi Ltd | 情報記録再生装置およびビデオカメラ |
JP5075924B2 (ja) * | 2010-01-13 | 2012-11-21 | 株式会社日立製作所 | 識別器学習画像生成プログラム、方法、及びシステム |
JP6194880B2 (ja) * | 2012-03-09 | 2017-09-13 | 日本電気株式会社 | 情報処理装置、情報処理方法および記録媒体 |
JP5368614B2 (ja) * | 2012-08-07 | 2013-12-18 | オリンパスイメージング株式会社 | 画像検索装置および画像検索方法 |
JP6215774B2 (ja) * | 2014-05-29 | 2017-10-18 | 富士フイルム株式会社 | 同一人物判定装置ならびにその方法およびその制御プログラム |
JP2017102671A (ja) * | 2015-12-01 | 2017-06-08 | キヤノン株式会社 | 識別装置、調整装置、情報処理方法及びプログラム |
JP6442746B2 (ja) * | 2015-12-24 | 2018-12-26 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、制御方法、プログラム |
JP6874772B2 (ja) * | 2016-11-25 | 2021-05-19 | 日本電気株式会社 | 画像生成装置、画像生成方法、およびプログラム |
JP6933164B2 (ja) * | 2018-03-08 | 2021-09-08 | 株式会社Jvcケンウッド | 学習用データ作成装置、学習用モデル作成システム、学習用データ作成方法、及びプログラム |
KR20210033940A (ko) * | 2018-04-23 | 2021-03-29 | 에스티씨-이노베이션스 리미티드 | 인간 안면 인식을 위하여 신경 네트워크를 트레이닝시키는 방법 |
KR102198920B1 (ko) | 2019-02-28 | 2021-01-06 | 네이버 주식회사 | 온라인 학습을 이용한 객체 트래킹을 위한 방법 및 시스템 |
JP7251609B2 (ja) * | 2019-03-15 | 2023-04-04 | 日本電気株式会社 | 処理装置、処理方法及びプログラム |
CN110458102A (zh) * | 2019-08-12 | 2019-11-15 | 深圳市商汤科技有限公司 | 一种人脸图像识别方法及装置、电子设备和存储介质 |
JP7340992B2 (ja) * | 2019-08-26 | 2023-09-08 | 日本放送協会 | 画像管理装置およびプログラム |
CN111581412B (zh) * | 2020-06-10 | 2023-11-10 | 腾讯科技(深圳)有限公司 | 人脸形状库的构建方法、装置、设备及存储介质 |
EP3971771A1 (en) * | 2020-09-22 | 2022-03-23 | Grazper Technologies ApS | A concept for generating training data and training a machine-learning model for use in re-identification |
JP7218769B2 (ja) * | 2021-02-04 | 2023-02-07 | 日本電気株式会社 | 画像生成装置、画像生成方法、およびプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004110448A (ja) * | 2002-09-19 | 2004-04-08 | Nippon Hoso Kyokai <Nhk> | 映像オブジェクト識別・追跡装置、その方法及びそのプログラム |
JP2005101906A (ja) * | 2003-09-25 | 2005-04-14 | Fuji Photo Film Co Ltd | 動画記録装置、動画記録方法、及びプログラム |
-
2005
- 2005-06-07 JP JP2005166327A patent/JP4591215B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004110448A (ja) * | 2002-09-19 | 2004-04-08 | Nippon Hoso Kyokai <Nhk> | 映像オブジェクト識別・追跡装置、その方法及びそのプログラム |
JP2005101906A (ja) * | 2003-09-25 | 2005-04-14 | Fuji Photo Film Co Ltd | 動画記録装置、動画記録方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2006343791A (ja) | 2006-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4591215B2 (ja) | 顔画像データベース作成方法及び装置 | |
CN102722698B (zh) | 多姿态人脸检测与跟踪方法及系统 | |
US9471849B2 (en) | System and method for suspect search | |
JP2020503604A (ja) | 外観検索のシステムおよび方法 | |
US8139817B2 (en) | Face image log creation | |
US10795928B2 (en) | Image search apparatus, system, and method | |
CN108564052A (zh) | 基于mtcnn的多摄像头动态人脸识别系统与方法 | |
EP2530605A1 (en) | Data processing device | |
CN104077594B (zh) | 一种图像识别方法和装置 | |
US20020146168A1 (en) | Anchor shot detection method for a news video browsing system | |
JP5503011B2 (ja) | イメージコンテンツに対してトリミングを実行するための方法、端末及びコンピュータ読み取り可能な記録媒体 | |
JP2001167110A (ja) | 画像検索方法及びその装置 | |
US10037467B2 (en) | Information processing system | |
JP5180922B2 (ja) | 画像検索システム及び画像検索方法 | |
TWI446192B (zh) | A memory having an information filtering detection function, a method of using the same, a device including the memory | |
WO2013091370A1 (zh) | 基于三维深度图像信息的并行统计学习人体部位检测方法 | |
CN110119726A (zh) | 一种基于YOLOv3模型的车辆品牌多角度识别方法 | |
KR102102164B1 (ko) | 영상 전처리 방법, 장치 및 컴퓨터 프로그램 | |
JP6334767B1 (ja) | 情報処理装置、プログラム、及び情報処理方法 | |
JP2011019192A (ja) | 画像表示装置 | |
JPWO2019215779A1 (ja) | モデル提供システム、方法およびプログラム | |
CN111079694A (zh) | 一种柜面助手履职监控装置和方法 | |
CN112651996A (zh) | 目标检测跟踪方法、装置、电子设备和存储介质 | |
US9030555B2 (en) | Surveillance system | |
CN110866931A (zh) | 图像分割模型训练方法及基于分类的强化图像分割方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071122 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100302 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100419 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100518 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100602 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100817 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100830 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130924 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130924 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |