JP5178611B2 - 画像処理装置、画像処理方法及びプログラム - Google Patents
画像処理装置、画像処理方法及びプログラム Download PDFInfo
- Publication number
- JP5178611B2 JP5178611B2 JP2009099226A JP2009099226A JP5178611B2 JP 5178611 B2 JP5178611 B2 JP 5178611B2 JP 2009099226 A JP2009099226 A JP 2009099226A JP 2009099226 A JP2009099226 A JP 2009099226A JP 5178611 B2 JP5178611 B2 JP 5178611B2
- Authority
- JP
- Japan
- Prior art keywords
- similarity
- face
- face image
- dictionaries
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012545 processing Methods 0.000 title claims description 50
- 238000003672 processing method Methods 0.000 title description 5
- 238000000034 method Methods 0.000 claims description 60
- 238000004364 calculation method Methods 0.000 claims description 29
- 238000012937 correction Methods 0.000 claims description 25
- 238000001514 detection method Methods 0.000 claims description 14
- 230000001815 facial effect Effects 0.000 claims description 5
- 230000008569 process Effects 0.000 description 43
- 210000000887 face Anatomy 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 7
- 230000002123 temporal effect Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 210000004709 eyebrow Anatomy 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 210000001747 pupil Anatomy 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
- G06V40/173—Classification, e.g. identification face re-identification, e.g. recognising unknown faces across different face tracks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
- G06V10/763—Non-hierarchical techniques, e.g. based on statistics of modelling distributions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19173—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Processing (AREA)
Description
例えば、静止画のデータから人の顔照合を行う場合に、画像の撮影条件が変化しても、高精度に顔照合をするための技術の提案がある(例えば、特許文献1参照)。その提案に係る技術は、撮影条件が悪い場合であっても、撮影条件に応じて類似度と閾値のデータの補正を行うことによって、高精度に顔照合ができるようにするものである。
(ハードウエア構成)
まず図1に基づき、本実施の形態に係わる画像処理装置の構成を説明する。図1は、本実施の形態に係わる画像処理装置の構成を示す構成図である。
以下、説明する画像処理の例としては、CPU11が、HDD14に記憶された動画像データを読み出して、顔認識映像インデクシング処理を実行する例を挙げて説明する。
始めに、動画像データにおけるフレーム、シーン及び顔シーケンスについて説明する。
図2は、デコードされたフレームとシーンとの関係を説明するための図である。動画像データは、連続するフレームデータとして、CPU11あるいは図示しないデコーダでデコードされる。動画像データは、例えば、MPEG2形式のデータであり、デコードされると、時間経過の順のフレームデータfが生成される。フレームレートに従ってモニタ16に出力されることにより、視聴者は、動画像を視ることができる。
よって、動画像は、通常は、複数のシーンからなる。図2は、時刻t1からあるシーン1(SCN1)が始まり、時刻t2でそのシーン1(SCN1)が終了し、その時刻t2以後は、別のシーン(SCN2)が始まり、時刻t3でそのシーン2が終了し、その時刻t3以後は、別のシーンが始まっている例を示している。各シーン内では、被写体が連続して映されているので、フレーム間では被写体の変化は少ない。しかし、シーンカットの前後のフレーム間では、被写体の変化は大きい。
次に顔シーケンスについて説明する。顔シーケンスとは、時間的及び空間的に連続した一連の顔画像の集合を指し、同一人物の顔のみで構成される。
例えば、シーン1(SCN1)中の連続する複数のフレームの範囲FR1において、出演者Aと出演者Bの登場しているシーンがある場合、顔検出により出演者Aと出演者Bの顔がそれぞれ認識されて、それぞれの顔シーケンスが生成される。図2の場合、複数のフレームの範囲FR1には、出演者Aの顔部分Faがあるフレームfと、出演者Bの顔部分Fbがあるフレームfが存在する。
(b)現在のフレームの顔画像領域のサイズと、その1つ前のフレームにおける顔画像領域のサイズとが十分に近い、すなわち、所定の範囲内である。
(c)現在のフレームの顔画像領域と、その1つ前のフレームにおける顔画像領域との間にシーンカットがない。なお、ここでは、連続する2枚のフレーム画像同士の類似度が閾値以下である場合、その2枚のフレームの間にシーンカットがあるとする。
次に、顔認識映像インデクシング処理について説明する。顔認識映像インデクシング処理は、顔検出、顔シーケンス作成、顔画像特徴量抽出、顔画像辞書作成、顔類似度計算、及び顔クラスタリングの処理を含む。各処理について順番に説明する。
まず、指定された映像コンテンツのストリームをHDD14から読み出してデコードを順次行い、時系列のフレームを生成し、その生成された連続する2つのフレーム間におけるフレーム同士の類似度を計算する処理が行われる(ステップS1)。フレーム同士の類似度データは、RAM13中のファイルに保存される。ステップS1は、動画像データにおける連続する2つのフレームのフレーム間類似度を計算するフレーム間類似度計算部を構成する。
なお、ステップS2における顔検出アルゴリズムとしては、例えば、文献1(「顔検出に適した共起に基づくJoint Harr-like特徴」,電子情報通信学会論文誌(D),vol. J89-D-II,no. 8,pp. 1791-1801,2006)に記載されている方法が適用可能である。
ステップS4の顔シーケンス作成処理では、ステップS1とS2において顔検出処理において検出した顔位置とフレーム間類似度を用いて、顔シーケンスの作成が行われる。
ステップS4の処理は、ステップS1とS2において得られたデータを参照して実行される。その結果、ステップS4の処理により、図3に示すような1以上の顔シーケンスのデータが作成される。
ステップS7では、ステップS6において抽出された顔画像特徴量データを用いて、顔画像辞書(部分空間)の作成が行われる。ステップS6において得られた複数の顔画像特徴量データに対して主成分分析を行うことにより、所定数の主成分特徴量データを抽出し、その抽出された主成分特徴量データだけを有する顔画像辞書データが作成される。
ここでは、CPU11は、顔シーケンス同士の類似度、すなわち複数の顔画像辞書内の各ペアの類似度を計算する。各ペアの顔シーケンスの類似度は、それぞれが有する顔画像辞書(ステップS7で作成された)同士の類似度として計算される。通常は、全ての組み合わせについて類似度を計算するため、顔シーケンスがN個ある場合は、Di(i=1,2,3,・・・N)とDj(j=1,2,3,・・・N)の全てのペアについて類似度が計算される。ここで、i, j は、 顔シーケンス番号である。顔シーケンスがN個ある場合は、N*(N−1)/2 回の類似度計算が行われる。
ステップS9の顔クラスタリング処理では、全ての顔シーケンス同士の組み合わせの中で、ステップS8で計算して補正された各類似度が、所定の閾値TH以上である組み合わせを同一人物とする(以下では「結合する」と表現する)ことにより、全てのシーケンスをM個の人物カテゴリに分類する。すなわち、所定の閾値TH以上の類似度の2つの顔シーケンスは、結合されて、同一人物のクラスになる。具体的には、ステップS9では、補正された類似度が所定の閾値TH以上であるときには、そのペアの顔画像辞書は、同一人物の顔画像辞書とし、補正された類似度が所定の閾値TH未満であるときには、そのペアの顔画像辞書は、別の人物の顔画像辞書とするように、複数の顔画像辞書はクラスタリングされる。仮にステップS1からS9の処理が完全に理想的に行われた場合、実際の出演者の人数と人物カテゴリ数Mは一致する。
ステップS9は、ステップS8で補正された複数の類似度と所定の閾値THとを比較して、複数の顔画像辞書Di,Djをクラスタリングする顔クラスタリング部を構成する。
しかし、顔クラスタリングの目的は、他人どうしが同一人物カテゴリに混在することなく、人物カテゴリ数Mを正しい人数まで減らすことである。よって、本実施の形態の映像インデクシング処理では、顔類似度の計算処理において、顔類似度の補正を行うことによって、顔クラスタリングの精度の向上を図っている。
ステップS8における顔類似度の計算における類似度の補正処理について説明する。
二つの顔画像辞書 Di、Dj(i, j : 顔シーケンス番号)の類似度Sijは、次の式(1)で表される。
Sij=MSM(Di, Dj) ・・・式(1)
ここで、 MSM(d1, d2)は、部分空間d1,d2の正準角で表される類似度であり、上述した文献6に記載の相互部分空間法によって計算される。
しかしながら、顔には、他人との類似度が高くなり易い顔と、低くなり易いものがあると考えられる。よって、作成された顔画像辞書には、他人との類似度が平均的に高くなるもの、あるいは低くなるものがあるため、その所定の閾値を適切に設定することは通常用意ではない。
図6は、10人の顔シーケンスS1〜S10について、複数の本人辞書と複数の他人辞書との類似度を計算した場合の類似度分布を模式的に表した図である。
なお、図6では、複数の本人辞書及び複数の他人辞書を仮定し、ステップS8におけるN個の顔シーケンスではなく、別途用意した本人の複数の顔画像部分空間辞書を想定している。図6において、実線は、本人の複数の顔画像部分空間辞書間の類似度の分布幅を示し、破線は、本人の各顔画像空間辞書と複数の他人辞書との類似度の分布幅を示している。図6に示すように、各顔シーケンスの類似度分布の平均値にはばらつきがあるので、顔クラスタリングをするために、類似度についての閾値を適切に設定することは容易ではない。
例えば、複数の外部辞書は、少なくとも年齢及び性別のそれぞれについて偏りがない複数人の顔画像から生成されている辞書であることが望ましい。年齢及び性別のそれぞれについて偏りがないとは、少なくとも、各年齢層(例えば、10代、20代など)の数が略同数でかつ男女の数も略同数であることを意味する。さらに、複数の外部辞書は、人種及び地域性のそれぞれにおいても偏りがない複数人の顔画像から生成されている辞書であれば、より望ましい。
本実施の形態における顔シーケンスQi、Qj同士の類似度S’ijは以下の式で表される。
ここで、Sijは、式(1)により求められる類似度であり、α(i, j)は、顔シーケンスQi、QjのそれぞれとK個の外部辞書との類似度に基づいて、以下の式により計算して得られた係数である。Yは、類似度の分布の中心、および拡大及び縮小を決定するパラメータであり、通常は多数の顔シーケンス同士の類似度の平均値である。
Tj = Σk ( MSM(Dj, Gk) ) / K ・・・ 式(2−3)
α(i, j) = SQRT(Ti×Tj) ・・・ 式(2−4)
ここで、Di、Djは、それぞれ顔シーケンスQi、Qjから作成した顔画像辞書であり、Gk(k=1,2,・・・K)は、外部辞書(部分空間)であり、SQRT(a)は、aの平方根を求める関数である。Ti、Tjは、それぞれ顔シーケンスQi、Qjと外部辞書との各ペアの類似度の平均値、すなわち平均類似度である。外部辞書は、複数人(K人)の顔画像に基づいて、上述したステップS5〜S7と同様の方法によって作成した顔画像辞書(部分空間)であり、K個の中に同一人物は含まれないものとする。
まず、各顔画像辞書Diについて、全ての外部辞書ODk(kは1〜K)との類似度を計算し、得られたK個の類似度から、各顔画像辞書Diについての外部辞書との平均類似度Tiを計算する(ステップS8-1)。ステップS8-1で得られた平均類似度Tiは、上記の式(2−2)の計算により得られた値である。
そして、その類似度Sijを、平均類似度Ti、Tjにより、補正する(ステップS8-4)。具体的には、ステップS8-4では、上述した式(2−1)による計算が行われる。ステップS8-4は、複数の顔画像辞書Di,Dj内の各ペアの類似度を、各顔画像辞書Di,Djと複数の外部辞書の各ペアの類似度により補正する類似度補正部を構成する。
さらに、最後の辞書のペアか否かの判断が行われる(ステップS8-5)。最後の辞書のペアで無ければ、処理はステップS8-2に戻り、最後の辞書のペアであれば、処理は、終了する。
S’ij = Sij × Y/β(i, j) ・・・ 式(3−1)
Ti = Σk ( MSM(Di, Gk) )/K ・・・ 式(3−2)
Tj = Σk ( MSM(Dj, Gk) ) /K ・・・ 式(3−3)
β(i, j) = ( Ti + Tj )/2 ・・・ 式(3−4)
以上のように、上述した本実施の形態の画像処理装置では、2つの顔の類似度を計算する際に、それぞれの“他人との似やすさ”を計算し、その2つの顔間の類似度は、その他人との似やすさにより補正される。
従って、上述した本実施の形態の画像処理装置によれば、顔クラスタリングにおける閾値設定の非容易性が緩和され、顔クラスタリング性能が向上する。
なお、本実施の形態における各手順の各ステップは、その性質に反しない限り、実行順序を変更し、複数同時に実行し、あるいは実行毎に異なった順序で実行してもよい。
Claims (5)
- 動画像データ中の連続した同一人物の顔画像を1つのシーケンスとして複数のシーケンスを作成するシーケンス作成部と、
シーケンス毎に作成された複数の顔画像辞書内の各ペアの第1の類似度、及び各顔画像辞書とサンプルとしての複数人の顔画像から生成されて予め用意された複数の外部辞書の各ペアの第2の類似度を計算する類似度計算部と、
計算して得られた複数の第1の類似度を、前記第2の類似度が大きい程、小さくし、かつ前記第2の類似度が小さい程、大きくするように補正する類似度補正部と、
前記類似度補正部において補正された前記複数の第1の類似度と所定の閾値とを比較して、前記複数の顔画像辞書をクラスタリングする顔クラスタリング部と、
を有することを特徴とする画像処理装置。 - 前記サンプルとしての複数人の顔画像は、各年齢層の数が略同数でかつ男女の数も略同数である複数人の顔画像であることを特徴とする請求項1に記載の画像処理装置。
- 動画像データに含まれる複数の顔画像が連続して存在する複数のフレームを1つのシーケンスとしてそれぞれが作成された複数のシーケンスについての複数の顔画像辞書内の各ペアの第1の類似度と、各顔画像辞書とサンプルとしての複数人の顔画像から生成されて予め用意された複数の外部辞書の各ペアの第2の類似度とを計算し、
計算して得られた複数の第1の類似度を、前記第2の類似度が大きい程、小さくし、かつ前記第2の類似度が小さい程、大きくするように補正し、
補正された前記複数の第1の類似度と所定の閾値とを比較して、前記複数の顔画像辞書をクラスタリングすることを特徴とする画像処理方法。 - 動画像データに含まれるフレーム毎に顔画像の検出を行う顔画像検出部と、
前記動画像データにおける連続する2つのフレームのフレーム間類似度を計算するフレーム間類似度計算部と、
前記顔画像検出部により検出された複数の顔画像と前記フレーム間類似度計算部により計算して得られた前記フレーム間類似度とに基づき、前記動画像データ中の連続した同一人物の顔画像を1つのシーケンスとして、複数のシーケンスを作成するシーケンス作成部と、
シーケンス毎に作成された複数の顔画像辞書内の各ペアの第1の類似度、及び各顔画像辞書とサンプルとしての複数人の顔画像から生成されて予め用意された複数の外部辞書の各ペアの第2の類似度を計算する類似度計算部と、
計算して得られた複数の第1の類似度を、前記第2の類似度が大きい程、小さくし、かつ前記第2の類似度が小さい程、大きくするように補正する類似度補正部と、
前記類似度補正部において補正された前記複数の第1の類似度と所定の閾値とを比較して、前記複数の顔画像辞書をクラスタリングする顔クラスタリング部と、
を有することを特徴とする画像処理装置。 - コンピュータに画像処理を実行させるためのプログラムであって、
動画像データ中の連続した同一人物の顔画像を1つのシーケンスとして複数のシーケンスを作成する機能と、
シーケンス毎に作成された複数の顔画像辞書内の各ペアの第1の類似度、及び各顔画像辞書とサンプルとしての複数人の顔画像から生成されて予め用意された複数の外部辞書の各ペアの第2の類似度を計算する機能と、
計算して得られた複数の第1の類似度を、前記第2の類似度が大きい程、小さくし、かつ前記第2の類似度が小さい程、大きくするように補正する機能と、
補正された前記複数の第1の類似度と所定の閾値とを比較して、前記複数の顔画像辞書をクラスタリングする機能とを有する。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009099226A JP5178611B2 (ja) | 2009-04-15 | 2009-04-15 | 画像処理装置、画像処理方法及びプログラム |
US12/760,315 US8428312B2 (en) | 2009-04-15 | 2010-04-14 | Image processing apparatus, image processing method, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009099226A JP5178611B2 (ja) | 2009-04-15 | 2009-04-15 | 画像処理装置、画像処理方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010250556A JP2010250556A (ja) | 2010-11-04 |
JP5178611B2 true JP5178611B2 (ja) | 2013-04-10 |
Family
ID=42980999
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009099226A Expired - Fee Related JP5178611B2 (ja) | 2009-04-15 | 2009-04-15 | 画像処理装置、画像処理方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8428312B2 (ja) |
JP (1) | JP5178611B2 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102859525A (zh) * | 2011-02-24 | 2013-01-02 | 松下电器产业株式会社 | 图像处理装置以及图像处理方法 |
JP5843618B2 (ja) * | 2012-01-06 | 2016-01-13 | キヤノン株式会社 | 画像処理装置、その制御方法、及びプログラム |
US9084411B1 (en) | 2014-04-10 | 2015-07-21 | Animal Biotech Llc | Livestock identification system and method |
JP6215774B2 (ja) | 2014-05-29 | 2017-10-18 | 富士フイルム株式会社 | 同一人物判定装置ならびにその方法およびその制御プログラム |
US9430694B2 (en) * | 2014-11-06 | 2016-08-30 | TCL Research America Inc. | Face recognition system and method |
CN105488527B (zh) * | 2015-11-27 | 2020-01-10 | 小米科技有限责任公司 | 图像分类方法及装置 |
TWI760525B (zh) * | 2018-07-10 | 2022-04-11 | 鴻發國際科技股份有限公司 | 現金處理系統及現金交易方法 |
CN111091106B (zh) * | 2019-12-23 | 2023-10-10 | 浙江大华技术股份有限公司 | 图像聚类方法及装置、存储介质、电子装置 |
CN111291678B (zh) * | 2020-02-06 | 2024-01-12 | 北京爱笔科技有限公司 | 一种基于多特征融合的人脸图像聚类方法及装置 |
CN111859001B (zh) * | 2020-07-06 | 2022-05-31 | Oppo(重庆)智能科技有限公司 | 图像相似度检测方法、装置、存储介质与电子设备 |
US11727726B2 (en) * | 2021-03-11 | 2023-08-15 | Kemtai Ltd. | Evaluating movements of a person |
CN115249378B (zh) * | 2022-09-19 | 2023-08-15 | 内蒙古蒙元生物基因科技有限公司 | 一种基于人脸识别的用于核酸检测的系统及方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6181805B1 (en) * | 1993-08-11 | 2001-01-30 | Nippon Telegraph & Telephone Corporation | Object image detecting method and system |
JP2007140823A (ja) | 2005-11-17 | 2007-06-07 | Omron Corp | 顔照合装置、顔照合方法及びプログラム |
JP2007310703A (ja) * | 2006-05-19 | 2007-11-29 | Toshiba Corp | パターン認識装置及びその方法 |
JP4697106B2 (ja) * | 2006-09-25 | 2011-06-08 | ソニー株式会社 | 画像処理装置および方法、並びにプログラム |
US7881505B2 (en) * | 2006-09-29 | 2011-02-01 | Pittsburgh Pattern Recognition, Inc. | Video retrieval system for human face content |
JP5010905B2 (ja) * | 2006-12-13 | 2012-08-29 | パナソニック株式会社 | 顔認証装置 |
JP2009042876A (ja) | 2007-08-07 | 2009-02-26 | Toshiba Corp | 画像処理装置及びその方法 |
US8315430B2 (en) * | 2007-11-07 | 2012-11-20 | Viewdle Inc. | Object recognition and database population for video indexing |
US8705810B2 (en) * | 2007-12-28 | 2014-04-22 | Intel Corporation | Detecting and indexing characters of videos by NCuts and page ranking |
JP4620150B2 (ja) * | 2008-10-23 | 2011-01-26 | 株式会社東芝 | 電子機器および映像処理方法 |
US8121358B2 (en) * | 2009-03-06 | 2012-02-21 | Cyberlink Corp. | Method of grouping images by face |
US8351661B2 (en) * | 2009-12-02 | 2013-01-08 | At&T Intellectual Property I, L.P. | System and method to assign a digital image to a face cluster |
-
2009
- 2009-04-15 JP JP2009099226A patent/JP5178611B2/ja not_active Expired - Fee Related
-
2010
- 2010-04-14 US US12/760,315 patent/US8428312B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010250556A (ja) | 2010-11-04 |
US8428312B2 (en) | 2013-04-23 |
US20100266166A1 (en) | 2010-10-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5178611B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
US8804999B2 (en) | Video recommendation system and method thereof | |
US9176987B1 (en) | Automatic face annotation method and system | |
JP5358083B2 (ja) | 人物画像検索装置及び画像検索装置 | |
Young et al. | Pets metrics: On-line performance evaluation service | |
US20100182501A1 (en) | Information processing apparatus, information processing method, and program | |
JP5857450B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
CN110119711A (zh) | 一种获取视频数据人物片段的方法、装置及电子设备 | |
CN106156693B (zh) | 用于面部识别的基于多模型表示的鲁棒错误纠正方法 | |
US8971585B2 (en) | Image processing apparatus for retrieving object from moving image and method thereof | |
US10524005B2 (en) | Facilitating television based interaction with social networking tools | |
US20110007975A1 (en) | Image Display Apparatus and Image Display Method | |
TW200921454A (en) | Method and apparatus for video digest generation | |
WO2006025272A1 (ja) | 映像分類装置、映像分類プログラム、映像検索装置、および映像検索プログラム | |
JP6557592B2 (ja) | 映像シーン分割装置及び映像シーン分割プログラム | |
JP2011237970A (ja) | 顔表情変化度測定装置およびそのプログラム並びに番組興味度測定装置 | |
WO2014100936A1 (zh) | 视频的关联信息库制作和视频播放的方法、平台及系统 | |
Wang et al. | Baseline results for violence detection in still images | |
KR102426089B1 (ko) | 전자 장치 및 전자 장치의 요약 영상 생성 방법 | |
JP2006217046A (ja) | 映像インデックス画像生成装置及び映像のインデックス画像を生成するプログラム | |
Miniakhmetova et al. | An approach to personalized video summarization based on user preferences analysis | |
JP2009289210A (ja) | 重要物体認識装置および重要物体認識方法ならびにそのプログラム | |
Zhang et al. | Key frame extraction method for lecture videos based on spatio-temporal subtitles | |
Bakalos et al. | Dance posture/steps classification using 3D joints from the kinect sensors | |
JP2018137639A (ja) | 動画像処理システム、並びに、符号化装置及びプログラム、並びに、復号装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110819 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120608 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120619 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120810 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121218 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130108 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5178611 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160118 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |