JP2021531554A - 画像処理方法及び装置、電子機器並びに記憶媒体 - Google Patents
画像処理方法及び装置、電子機器並びに記憶媒体 Download PDFInfo
- Publication number
- JP2021531554A JP2021531554A JP2020573222A JP2020573222A JP2021531554A JP 2021531554 A JP2021531554 A JP 2021531554A JP 2020573222 A JP2020573222 A JP 2020573222A JP 2020573222 A JP2020573222 A JP 2020573222A JP 2021531554 A JP2021531554 A JP 2021531554A
- Authority
- JP
- Japan
- Prior art keywords
- face
- face image
- parameter
- image
- image frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 19
- 238000000034 method Methods 0.000 claims abstract description 55
- 238000012545 processing Methods 0.000 claims description 54
- 230000001815 facial effect Effects 0.000 claims description 22
- 230000008569 process Effects 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 10
- 230000000875 corresponding effect Effects 0.000 description 21
- 238000010586 diagram Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 9
- 239000002699 waste material Substances 0.000 description 8
- 230000003287 optical effect Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000003068 static effect Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/73—Deblurring; Sharpening
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/98—Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
- G06V10/993—Evaluation of the quality of the acquired pattern
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
- G06V40/166—Detection; Localisation; Normalisation using acquisition arrangements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
- G06V40/171—Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Quality & Reliability (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
- Collating Specific Patterns (AREA)
Abstract
本開示の実施例は、画像処理方法及び装置、電子機器並びに記憶媒体を開示する。前記方法は、画像フレームシーケンスを選別し、第1顔パラメータが所定の要件に合致する顔画像フレームシーケンスを取得することと、前記顔画像フレームシーケンスにおける各顔画像の第2顔パラメータを決定することと、前記顔画像フレームシーケンスにおける各顔画像の第1顔パラメータ及び第2顔パラメータに基づいて、前記顔画像フレームシーケンスにおける各顔画像の品質スコアを決定することと、顔画像フレームシーケンスにおける各顔画像の品質スコアに基づいて、顔認識のためのターゲット顔画像を得ることと、を含む。
Description
(関連出願の相互参照)
本開示は、2019年06月28日に提出された出願番号第201910575840.3号の中国特許出願に基づく優先権を主張し、該中国特許出願の全内容が参照として本開示に組み込まれる。
本開示は、2019年06月28日に提出された出願番号第201910575840.3号の中国特許出願に基づく優先権を主張し、該中国特許出願の全内容が参照として本開示に組み込まれる。
本開示は、コンピュータビジョン技術分野に関し、特に、画像処理方法及び装置、電子機器並びに記憶媒体に関する。
電子技術の成長に伴い、顔認識技術は、日々成熟しつつあり、種々のシーンに広く適用されている。例えば、顔認識技術を利用した勤怠管理、顔認識によるスマートフォンのロック解除、電子パスポートの身分認識及びネットワーク支払等を行う。これは、人々の生活に利便性を与える。
現在、収集した画像フレームシーケンスに、顔ボケがあるか又は顔画像が存在しない画像フレームがある。これらの画像フレームに対して顔認識を行うと、大量の処理リソースの浪費を引き起こしてしまう。
本開示の実施例は、画像処理方法及び装置、電子機器並びに記憶媒体を提供する。
本開示の実施例の一態様によれば、画像処理方法が提供される。前記方法は、画像フレームシーケンスを選別し、第1顔パラメータが所定の要件に合致する顔画像フレームシーケンスを取得することと、前記顔画像フレームシーケンスにおける各顔画像の第2顔パラメータを決定することと、前記顔画像フレームシーケンスにおける各顔画像の第1顔パラメータ及び第2顔パラメータに基づいて、前記顔画像フレームシーケンスにおける各顔画像の品質スコアを決定することと、顔画像フレームシーケンスにおける各顔画像の品質スコアに基づいて、顔認識のためのターゲット顔画像を得ることと、を含む。
任意の可能な実施形態において、前記所定の要件は、第1顔パラメータが所定の基準パラメータ区間内にあることを含み、画像フレームシーケンスを選別し、第1顔パラメータが所定の要件に合致する顔画像フレームシーケンスを取得する前に、前記方法は、画像フレームシーケンスにおける各画像フレームの第1顔パラメータを取得することと、前記第1顔パラメータが前記基準パラメータ区間内にある場合、該画像フレームを、前記所定の要件に合致する顔画像フレームシーケンスに属するものと決定することと、を更に含む。
任意の可能な実施形態において、画像フレームシーケンスにおける各画像フレームの第1顔パラメータを取得することは、前記画像フレームシーケンスを収集するための画像収集装置の向き情報及び位置情報を取得することと、前記画像収集装置の向き情報及び位置情報に基づいて、前記画像フレームシーケンスにおける各画像フレームの顔向き情報を決定することと、前記顔向き情報に基づいて、各画像フレームの第1顔パラメータを取得することと、を含む。
任意の可能な実施形態において、前記第1顔パラメータは、顔画像座標を含み、前記第1顔パラメータが前記基準パラメータ区間内にある場合、該画像フレームを、前記所定の要件に合致する顔画像フレームシーケンスに属するものと決定することは、前記顔画像座標が前記基準座標区間内にある場合、該画像フレームを、前記所定の要件に合致する顔画像フレームシーケンスに属するものと決定することを含む。
任意の可能な実施形態において、前記第1顔パラメータは、顔画像幅、顔画像高さ、顔画像座標、顔画像整合度、顔画像姿勢角のうちの少なくとも1つを含む。
任意の可能な実施形態において、前記顔画像フレームシーケンスにおける各顔画像の第1顔パラメータ及び第2顔パラメータに基づいて、前記顔画像フレームシーケンスにおける各顔画像の品質スコアを決定することは、各顔画像の第1顔パラメータ及び第2顔パラメータに対して加重処理を行い、加重処理の結果に基づいて、前記顔画像の品質スコアを得ることを含む。
任意の可能な実施形態において、前記顔画像フレームシーケンスにおける各顔画像の第1顔パラメータ及び第2顔パラメータに基づいて、前記顔画像フレームシーケンスにおける各顔画像の品質スコアを決定することは、前記第1顔パラメータ及び第2顔パラメータのそれぞれと顔画像の認識率との間の相関性に基づいて、前記第1顔パラメータ及び前記第2顔パラメータにおける各顔パラメータに対応するパラメータスコアをそれぞれ決定することと、各顔パラメータに対応するパラメータスコアに基づいて、各顔画像の品質スコアを決定することと、を含む。
任意の可能な実施形態において、顔画像フレームシーケンスにおける各顔画像の品質スコアに基づいて、顔認識のためのターゲット顔画像を得ることは、前記品質スコアに基づいて、キャッシュキューに記憶される顔画像を決定することと、前記キャッシュキューにおける複数の顔画像を順序付け、順序付け結果を得ることと、前記順序付け結果に基づいて、顔認識のためのターゲット顔画像を得ることと、を含む。
任意の可能な実施形態において、前記品質スコアに基づいて、キャッシュキューに記憶される顔画像を決定することは、各顔画像の品質スコアと所定のスコア閾値を比較することと、前記顔画像の品質スコアが所定のスコア閾値より大きい場合、前記顔画像をキャッシュキューに記憶すると決定することと、を含む。
任意の可能な実施形態において、前記順序付け結果に基づいて、顔認識のためのターゲット顔画像を得ることは、前記順序付け結果に基づいて、前記キャッシュキューにおける品質スコアが最も高い顔画像を決定することと、前記キャッシュキューにおける品質スコアが最も高い顔画像を、顔認識のためのターゲット顔画像として決定することと、を含む。
任意の可能な実施形態において、前記第2顔パラメータは、顔画像鮮鋭度、顔画像輝度、顔画像画素点の数のうちの少なくとも1つを含む。
本開示の実施例のもう1つの態様によれば、画像処理装置が提供される。前記画像処理装置は、
画像フレームシーケンスを選別し、第1顔パラメータが所定の要件に合致する顔画像フレームシーケンスを取得するように構成される取得モジュールと、
前記顔画像フレームシーケンスにおける各顔画像の第2顔パラメータを決定するように構成される第1決定モジュールと、
前記顔画像フレームシーケンスにおける各顔画像の第1顔パラメータ及び第2顔パラメータに基づいて、前記顔画像フレームシーケンスにおける各顔画像の品質スコアを決定するように構成される第2決定モジュールと、
顔画像フレームシーケンスにおける各顔画像の品質スコアに基づいて、顔認識のためのターゲット顔画像を得るように構成される第3決定モジュールと、を備える。
画像フレームシーケンスを選別し、第1顔パラメータが所定の要件に合致する顔画像フレームシーケンスを取得するように構成される取得モジュールと、
前記顔画像フレームシーケンスにおける各顔画像の第2顔パラメータを決定するように構成される第1決定モジュールと、
前記顔画像フレームシーケンスにおける各顔画像の第1顔パラメータ及び第2顔パラメータに基づいて、前記顔画像フレームシーケンスにおける各顔画像の品質スコアを決定するように構成される第2決定モジュールと、
顔画像フレームシーケンスにおける各顔画像の品質スコアに基づいて、顔認識のためのターゲット顔画像を得るように構成される第3決定モジュールと、を備える。
任意の可能な実施形態において、前記所定の要件は、第1顔パラメータが所定の基準パラメータ区間内にあることを含み、前記装置は、前記取得モジュールにより画像フレームシーケンスを選別し、第1顔パラメータが所定の要件に合致する顔画像フレームシーケンスを取得する前に、画像フレームシーケンスにおける各画像フレームの第1顔パラメータを取得し、前記第1顔パラメータが前記基準パラメータ区間内にある場合、該画像フレームを、前記所定の要件に合致する顔画像フレームシーケンスに属するものと決定するように構成される判定モジュールを更に備える。
任意の可能な実施形態において、前記判定モジュールは、前記画像フレームシーケンスを収集するための画像収集装置の向き情報及び位置情報を取得し、前記画像収集装置の向き情報及び位置情報に基づいて、前記画像フレームシーケンスにおける各画像フレームの顔向き情報を決定し、前記顔向き情報に基づいて、各画像フレームの第1顔パラメータを取得するように構成される。
任意の可能な実施形態において、前記第1顔パラメータは、顔画像座標を含み、前記判定モジュールは、前記顔画像座標が前記基準座標区間内にある場合、該画像フレームを、前記所定の要件に合致する顔画像フレームシーケンスに属するものと決定するように構成される。
任意の可能な実施形態において、前記第1顔パラメータは、顔画像幅、顔画像高さ、顔画像座標、顔画像整合度、顔画像姿勢角のうちの少なくとも1つを含む。
任意の可能な実施形態において、前記第2決定モジュールは、各顔画像の第1顔パラメータ及び第2顔パラメータに対して加重処理を行い、加重処理の結果に基づいて、前記顔画像の品質スコアを得るように構成される。
任意の可能な実施形態において、前記第2決定モジュールは、前記第1顔パラメータ及び第2顔パラメータのそれぞれと顔画像の認識率との間の相関性に基づいて、前記第1顔パラメータ及び前記第2顔パラメータにおける各顔パラメータに対応するパラメータスコアをそれぞれ決定し、各顔パラメータに対応するパラメータスコアに基づいて、各顔画像の品質スコアを決定するように構成される。
任意の可能な実施形態において、前記第3決定モジュールは、前記品質スコアに基づいて、キャッシュキューに記憶される顔画像を決定し、前記キャッシュキューにおける複数の顔画像を順序付け、順序付け結果を得て、前記順序付け結果に基づいて、顔認識のためのターゲット顔画像を得るように構成される。
任意の可能な実施形態において、前記第3決定モジュールは、各顔画像の品質スコアと所定のスコア閾値を比較し、前記顔画像の品質スコアが所定のスコア閾値より大きい場合、前記顔画像をキャッシュキューに記憶すると決定するように構成される。
任意の可能な実施形態において、前記第3決定モジュールは、前記順序付け結果に基づいて、前記キャッシュキューにおける品質スコアが最も高い顔画像を決定し、前記キャッシュキューにおける品質スコアが最も高い顔画像を、顔認識のためのターゲット顔画像として決定するように構成される。
任意の可能な実施形態において、前記第2顔パラメータは、顔画像鮮鋭度、顔画像輝度、顔画像画素点の数のうちの少なくとも1つを含む。
本開示の実施例のまた1つの態様によれば、電子機器が提供される。前記電子機器は、プロセッサと、プロセッサによる実行可能な命令を記憶するためのメモリと、を備え、前記プロセッサは、上記画像処理方法を実行するように構成される。
本開示の実施例のもう1つの態様によれば、コンピュータ可読記憶媒体が提供される。前記コンピュータ可読記憶媒体には、コンピュータに、前記画像処理方法を実行させるためのコンピュータプログラムが記憶される。
本開示の実施例において、画像フレームシーケンスから、画像フレームシーケンスを選別し、第1顔パラメータが所定の要件に合致する顔画像フレームシーケンスを取得し、前記顔画像フレームシーケンスにおける各顔画像の第2顔パラメータを決定し、更に、前記顔画像フレームシーケンスにおける各顔画像の第1顔パラメータ及び第2顔パラメータに基づいて、前記顔画像フレームシーケンスにおける各顔画像の品質スコアを決定し、顔画像フレームシーケンスにおける各顔画像の品質スコアに基づいて、顔認識のためのターゲット顔画像を得ることができる。従って、顔認識を行う前に、まず、第1顔パラメータに基づいて、画像フレームシーケンスから顔画像フレームシーケンスを選別し、更に、顔画像フレームシーケンスにおける顔画像の品質スコアに基づいて、画像フレームシーケンスを再選別し、顔品質が高いターゲット顔画像を選別して後続の顔認識を行うことができる。これにより、顔認識過程における処理リソースの浪費を減少させ、顔認識の効率を向上させることができる。
上記の一般的な説明及び後述する細部に関する説明は、例示及び説明のためのものに過ぎず、本開示を限定するものではないことが理解されるべきである。
本発明の他の特徴及び態様は、下記の図面に基づく例示的な実施例の詳細な説明を参照すれば明らかになる。
ここで添付した図面は、明細書に引き入れて本明細書の一部分を構成し、本開示に適合する実施例を示し、かつ、明細書とともに本開示の技術的解決手段を解釈することに用いられる。
以下、図面を参照しながら本開示の種々の例示的な実施例、特徴及び態様を詳しく説明する。図面における同一の符号は、同一または類似する機能を有する要素を示す。図面は、実施例の種々の態様を示しているが、特別な説明がない限り、必ずしも比率どおりの図面ではない。
ここで使用した「例示的」という用語は「例、実施例として用いられるか、または説明のためのものである」ことを意味する。ここで、「例示的なもの」として説明される如何なる実施例も、他の実施例より好適または有利であると必ずしも解釈されるべきではない。
本明細書において、用語「及び/又は」は、関連対象の関連関係を説明するためのものであり、3通りの関係が存在することを表す。例えば、A及び/又はBは、Aのみが存在すること、AとBが同時に存在すること、Bのみが存在するという3つの場合を表す。また、本明細書において、用語「少なくとも1つ」は、複数のうちのいずれか1つ又は複数のうちの少なくとも2つの任意の組み合わせを表す。例えば、A、B、Cのうちの少なくとも1つを含むことは、A、B及びCからなる集合から選ばれるいずれか1つ又は複数の要素を含むことを表す。
なお、本開示をより良く説明するために、以下の具体的な実施形態において具体的な細部を多く記載した。当業者は、これら具体的な詳細に関わらず、本開示は同様に実施可能であると理解すべきである。本発明の主旨を明確にするために、一部の実例において、当業者に熟知されている方法、手段、素子及び回路については詳しく説明しないことにする。
本開示の実施例で提供される画像処理方法は、収集した画像フレームシーケンスを選別し、第1顔パラメータが所定の要件に合致する顔画像フレームシーケンスを取得することができる。これにより、第1顔パラメータにより、画像フレームシーケンスにおける画像フレームに対して一次選別を行い、顔画像フレームシーケンスを得ることができる。更に、顔画像フレームシーケンスにおける各顔画像の第2顔パラメータを決定し、顔画像フレームシーケンスにおける各顔画像の第1顔パラメータ及び第2顔パラメータに基づいて、各顔画像の品質スコアを得て、各顔画像の品質スコアに基づいて、顔認識のためのターゲット顔画像を決定する。これにより、画像フレームシーケンスを更に選別し、顔認識のためのターゲット顔画像を決定することができる。従って、顔認識を行う前に、画像フレームシーケンスにおける画像フレームを選別することができる。例えば、品質スコアが高い画像フレームをターゲット顔画像として選択し、後続の顔認識を行う。これにより、顔認識過程における認識回数を減少させ、顔画像の品質が低いか又は顔画像が存在しないことによる処理リソースの浪費を低減させ、顔認識の効率を向上させ、顔認識の正確度を向上させることができる。
画像フレームシーケンスにおける画像フレームに対して顔認識を行う過程において、顔認識プロセスは、消費が高い処理プロセスであるため、一般的には、画像収集装置により収集された各画像フレームを処理することなく、所定の処理周期に応じて顔認識される画像フレームを取得する。これにより、酷いフレームロス現象を引き起こしてしまう。捨てられた画像フレームの品質が高くて、顔認識に適合するが、取得した顔認識される画像フレームの品質が低いか又は取得した画像フレームに顔画像が存在しない可能性がある。これは、大量の有効な画像フレームの浪費を引き起こすだけでなく、顔認識の効率が低いという問題も引き起こしてしまう。
本開示の実施例で提供される画像処理方法は、顔認識を行う前に、画像フレームシーケンスにおける画像フレームを選別し、顔画像の品質が高い画像フレームを選択して顔認識を行うことができる。これにより、有効な画像フレームの浪費を減少させ、顔認識の速度を速くし、顔認識の正確度を向上させ、処理リソースの浪費を減少させることができる。
以下、実施例を参照しながら、本開示の実施例で提供される画像処理方法を説明する。
図1は、本開示の実施例による画像処理方法を示すフローチャートである。該処理方法は、端末装置、サーバ又は他の情報処理装置により実行されてもよい。ここで、端末装置は、ゲートデバイス、顔認識装置、ユーザ装置(User Equipment:UE)、携帯機器、ユーザ端末、端末、セルラ電話、コードレス電話、パーソナルデジタルアシスタント(Personal Digital Assistant:PDA)、ハンドヘルドデバイス、コンピューティングデバイス、車載機器、ウェアブル機器などであってもよい。幾つかの任意の可能な実施形態において、該画像処理方法は、プロセッサによりメモリに記憶されているコンピュータ可読命令を呼び出すことで実現することができる。以下、画像処理端末を実行主体として本開示の実施例の画像処理方法を説明する。
図1に示すように、前記画像処理方法は、下記ステップを含む。
ステップS11において、画像フレームシーケンスを選別し、第1顔パラメータが所定の要件に合致する顔画像フレームシーケンスを取得する。
本開示の実施例において、画像処理端末は、画像フレームを連続的に収集することができる。連続的に収集した画像フレームは、画像フレームシーケンスを構成することができる。又は、画像処理端末は、画像収集装置を備える。画像処理端末は、画像収集装置により収集された画像フレームシーケンスを取得することができる。例えば、画像収集装置が1つの画像フレームを収集するたびに、画像処理端末は、画像収集装置により収集された1つの画像フレームを取得することができる。画像収集端末は、画像フレームシーケンスを取得した後、画像フレームシーケンスのいずれか1つの画像フレームに対して、該画像フレームの第1顔パラメータを取得し、画像フレームの第1顔パラメータを利用して画像フレームシーケンスを選別する。画像フレームシーケンスを選別する場合、各画像フレームの第1顔パラメータが所定の要件に合致するかどうかを判定することができる。各画像フレームについて、該画像フレームの第1顔パラメータが所定の要件に合致すれば、該画像フレームを顔画像フレームシーケンスの顔画像と決定することができる。該画像フレームの第1顔パラメータが所定の要件に合致しなければ、該画像フレームを捨て、次の画像フレームに対して引き続き選別を行う。
本実施例において、第1顔パラメータは、顔画像の認識率に関わるパラメータであってもよい。例えば、第1顔パラメータは、画像フレームにおける顔画像の完備性を表すパラメータであってもよい。例示的には、第1顔パラメータが大きいほど、画像の完備性が高くなり、つまり、顔画像の認識率が高くなることを表す。所定の要件は、画像フレームにおける顔画像が満たすべき基本要件であってもよい。例えば、所定の要件は、画像フレームに顔画像が存在することであってもよい。また例えば、所定の要件は、画像フレームにおける顔画像にターゲットキーポイントが存在することであってもよい。例えば、眼部キーポイント、口部キーポイントなどが存在する。また例えば、所定の要件は、画像フレームにおける顔画像の輪郭が連続したものであることであってもよい。画像フレームシーケンスにおける第1顔パラメータが所定の要件に合致する顔画像フレームシーケンスを取得することで、画像フレームシーケンスの画像フレームに対して一次選別を行い、画像フレームシーケンスにおける、顔画像が存在しない画像フレームを除去するか又は画像フレームシーケンスにおける、顔画像が完備ではない画像フレームを除去することができる。
任意の可能な実施形態において、上記第1顔パラメータは、顔画像幅、顔画像高さ、顔画像座標、顔画像整合度、顔画像姿勢角のうちの少なくとも1つを含む。
本実施例において、顔画像幅は、画像フレームにおける顔画像に対応する最大画像幅を表すことができる。顔画像高さは、画像フレームにおける顔画像に対応する最大画素幅を表すことができる。顔画像座標は、画像フレームにおける顔画像画素点の画像座標を表すことができる。例えば、画像フレームの中心点により、画像座標系を確立する。画像座標は、該画像座標系での、画素点の座標であってもよい。顔画像整合度は、顔画像のキーポイントと所定の顔テンプレートのキーポイントとのマッチング度を表すことができる。例えば、画像フレームにおける顔画像の口部キーポイントの画像座標がAであり、所定の顔テンプレートにおける口部キーポイントの画像座標がBであり、前記顔画像整合度は、画像座標Aと画像座標Bとの距離を含んでもよい。ここで、画像座標Aと画像座標Bとの距離が小さいほど、顔画像の口部キーポイントと所定の顔テンプレートの口部キーポイントとのマッチング度が高くなり、つまり、顔画像整合度が大きくなることを表す。画像座標Aと画像座標Bとの距離が大きいほど、顔画像の口部キーポイントと所定の顔テンプレートの口部キーポイントとのマッチング度が低くなり、つまり、顔画像整合度が小さくなることを表す。顔画像姿勢角は、顔画像の姿勢を表すことができる。例示的に、顔画像姿勢角は、ヨー角、フリップ角及びピッチ角のうちの少なくとも1つを含んでもよい。例えば、画像フレームの顔画像を所定の顔テンプレートと比較し、所定の顔テンプレートの標準軸に対する、画像フレームの顔画像のヨー角、フリップ角及びピッチ角を決定することができる。
ステップS12において、前記顔画像フレームシーケンスにおける各顔画像の第2顔パラメータを決定する。
本開示の実施例において、第2顔パラメータは、顔画像の認識率に関わるパラメータであってもよい。第2顔パラメータの数は、1つ又は複数であってもよい。第2顔パラメータの数が複数である場合、各第2顔パラメータは各々独立してもよく、且つ、各第2顔パラメータと各第1顔パラメータは、各々独立してもよい。これにより、第1顔パラメータ及び第2顔パラメータを利用して顔画像の認識可能性を評価することができる。
任意の可能な実施形態において、第2顔パラメータは、顔画像鮮鋭度、顔画像輝度、顔画像画素点の数のうちの少なくとも1つを含んでもよい。ここで、顔画像鮮鋭度は、顔画像の顔領域輪郭と輪郭付近画素点とのコントラストを表すことができる。顔画像鮮鋭度が高いほど、該画像フレームの顔画像が鮮明になることを表し、顔画像鮮鋭度が低いほど、該画像フレームにおける顔画像がぼやけることを表す。ここで、例示的に、本実施例における顔画像鮮鋭度は、顔画像の平均画像鮮鋭度であってもよい。顔画像輝度は、顔画像の顔領域に対応する画像輝度を表すことができる。例示的に、本実施例における顔画像輝度は、顔領域の平均画像輝度であってもよい。顔画像画素点の数は、顔画像における顔領域に含まれる画素点の数を表すことができる。顔画像鮮鋭度、顔画像輝度及び顔画像画素点の数は、顔画像の認識率に影響を与える重要なパラメータであってもよい。従って、画像フレームに対して顔認識を行う前に、顔画像フレームシーケンスにおける各顔画像の顔画像鮮鋭度、顔画像輝度及び顔画像画素点の数のうちの1つ又は複数の第2顔パラメータを決定する。
ステップS13において、前記顔画像フレームシーケンスにおける各顔画像の第1顔パラメータ及び第2顔パラメータに基づいて、前記顔画像フレームシーケンスにおける各顔画像の品質スコアを決定する。
本開示の実施例において、第1顔パラメータと第2顔パラメータはいずれも、顔画像の顔品質を評価するためのものであってもよい。画像処理端末は各顔画像の第1顔パラメータと第2顔パラメータを組み合わせ、第1顔パラメータ及び第2顔パラメータを利用して各顔画像の顔品質を評価し、顔画像フレームシーケンスにおける各顔画像の品質スコアを得ることができる。品質スコアは、顔画像の顔品質を表すことができる。例えば、品質スコアが高いほど、顔画像の顔品質が高くなることを表す。品質スコアが低いほど、顔画像の顔品質が低くなることを表す。
任意の可能な実施形態において、上記ステップS13は、各顔画像の第1顔パラメータ及び第2顔パラメータに対して加重処理を行い、加重処理の結果に基づいて、前記顔画像の品質スコアを得ることを含んでもよい。
該実現形態において、画像処理端末は、第1顔パラメータ及び第2顔パラメータに対して加重を行うことで、顔画像フレームシーケンスにおける各顔画像の品質スコアを得ることができる。第1顔パラメータ及び第2顔パラメータにおける各顔パラメータに対して、対応する重みを設定することができる。異なる顔パラメータに対応する重みは、異なってもよい。各顔パラメータに対応する重みは、該顔パラメータと顔画像の認識率との相関性に基づいて設定されてもよい。例えば、1つの顔パラメータが顔画像の認識率に与える影響が大きい場合、該顔パラメータに対して、大みな重みを設定することができる。1つの顔パラメータが顔画像の認識率に与える影響が小さい場合、該顔パラメータに対して、小さな重みを設定することができる。第1顔パラメータ及び第2顔パラメータに対応する重みを利用して顔パラメータに対して加重処理を行うことで、複数の顔パラメータが顔画像の認識率に与える影響を総合的に考慮して、品質スコアを利用して顔画像フレームシーケンスにおける各顔画像の品質を評価することができる。
もう1つの任意の可能な実施形態において、上記ステップS13は、前記第1顔パラメータ及び第2顔パラメータのそれぞれと顔画像の認識率との間の相関性に基づいて、前記第1顔パラメータ及び前記第2顔パラメータにおける各顔パラメータに対応するパラメータスコアをそれぞれ決定することと、各顔パラメータに対応するパラメータスコアに基づいて、各顔画像の品質スコアを決定することと、を更に含んでもよい。
該実現形態において、画像処理端末は、顔画像フレームシーケンスにおける各顔画像に対して、該顔画像の第1顔パラメータ及び第2顔パラメータにおける各顔パラメータと顔画像の認識率との相関性に基づいて、第1顔パラメータ及び第2顔パラメータにおける各顔パラメータに対応するパラメータスコアを得ることができる。更に、得られた各顔パラメータのパラメータスコアを加算又は乗算し、該顔画像の品質スコアを得る。ここで、各顔パラメータのパラメータスコアの算出方式は、該顔パラメータと顔画像の認識率との相関性によって決まってもよい。例えば、1つの顔パラメータと顔画像の認識率が正に相関する場合、該顔パラメータにより、認識率に正に相関する算出方式を設定し、該顔パラメータのパラメータスコアを決定することができる。上記顔画像フレームシーケンスにおける各顔画像の品質スコアの決定方式により、様々な顔パラメータと顔画像の認識率との相関性に基づいて、様々な顔パラメータに対して、様々なパラメータスコアの演算方式を設定することで、得られた顔画像の品質スコアをより正確にすることができる。
ステップS14において、顔画像フレームシーケンスにおける各顔画像の品質スコアに基づいて、顔認識のためのターゲット顔画像を得る。
本開示の実施例において、品質スコアは、顔画像の認識可能性を表すことができる。品質スコアが高いほど、顔画像の認識可能性が大きくなり、品質スコアが低いほど、顔画像の認識可能性が低くなると理解されてもよい。これにより、決定された顔画像フレームシーケンスにおける各顔画像の品質スコアに基づいて、顔画像フレームシーケンスから、後続で顔認識に用いられるターゲット顔画像を選別することができる。例えば、品質スコアが所定のスコア閾値より大きい顔画像を顔認識のためのターゲット顔画像として選択するか、又は、品質スコアが最も高い顔画像を顔認識のためのターゲット顔画像として選択することで、顔認識の効率及び正確性を向上させることができる。
任意の可能な実施形態において、上記ステップS14において、顔画像フレームシーケンスにおける各顔画像の品質スコアに基づいて、顔認識のためのターゲット顔画像を得ることは、前記品質スコアに基づいて、キャッシュキューに記憶される顔画像を決定することと、前記キャッシュキューにおける複数の顔画像を順序付け、順序付け結果を得ることと、前記順序付け結果に基づいて、顔認識のためのターゲット顔画像を得ることと、を含んでもよい。
本実現形態において、顔画像フレームシーケンスにおける各顔画像の品質スコアに基づいて、顔画像フレームシーケンスを選別し、顔画像フレームシーケンスにおけるキャッシュキューに記憶される顔画像を決定することができる。更に、キャッシュキューにおける顔画像の品質スコアに基づいて、キャッシュキューに記憶される顔画像を順序付ける。例えば、顔画像の品質スコアの降順に応じて、キャッシュキューにおける顔画像を順序付け、順序付け結果を得る。更に、得られた順序付け結果に基づいて、キャッシュキューにおける顔認識のためのターゲット顔画像を決定することができる。これにより、顔画像フレームシーケンスにおける顔画像に対して複数回選別することで、最終的に顔認識に用いられるターゲット顔画像を決定し、構造の顔認識の効率及び正確性を向上させることができる。
一例において、前記品質スコアに基づいて、キャッシュキューに記憶される顔画像を決定することは、各顔画像の品質スコアと所定のスコア閾値を比較することと、前記顔画像の品質スコアが所定のスコア閾値より大きい場合、前記顔画像をキャッシュキューに記憶すると決定することと、を含んでもよい。
該例において、顔画像フレームシーケンスにおける各画像フレームについて、該顔画像の品質スコアと所定のスコア閾値を比較し、該顔画像の品質スコアがスコア閾値より大きいかどうかを判定することができる。該顔画像の品質スコアが所定のスコア閾値より大きい場合、該顔画像の顔品質が高いと認められる。該顔画像をキャッシュキューに記憶することができる。該顔画像の品質スコアが所定のスコア閾値以下である場合、該顔画像の顔品質が低いと認められる。該顔画像を破棄することができる。ここで、顔画像をキャッシュキューに記憶するかどうかを決定するステップは、別個のスレッドにより実行されてもよい。つまり、画像処理端末は、キャッシュキューに記憶される顔画像の決定ステップ及び前記キャッシュキューの複数の顔画像の順序付けステップを同時に実行することができる。これにより、画像フレーム処理の効率を向上させることができる。
一例において、前記順序付け結果に基づいて、顔認識のためのターゲット顔画像を得ることは、前記順序付け結果に基づいて、前記キャッシュキューにおける品質スコアが最も高い顔画像を決定することと、前記キャッシュキューにおける品質スコアが最も高い顔画像を、顔認識のためのターゲット顔画像として決定することと、を含んでもよい。
該例において、画像処理端末は、順序付け結果に基づいて、キャッシュキューから品質スコアが最も高い顔画像を選択し、品質スコアが最も高い顔画像を顔認識のためのターゲット顔画像とすることができる。これにより、顔認識に用いられるターゲット顔画像はいずれもキャッシュキューにおける品質スコアが最も顔画像である。品質スコアが高いほど、顔画像の認識可能性が高くなる。従って、品質スコアにより、顔認識のためのターゲット顔画像の顔品質を確保し、顔認識の効率及び正確性を向上させることができる。
ここで、顔画像フレームシーケンスにおける顔認識のためのターゲット顔画像を決定した後、決定されたターゲット顔画像に対して顔認識を行うことができる。ターゲット顔画像の顔品質が高いため、顔認識過程における比較回数を減少させ、処理リソース及び装置の電力消費を節約することができる。ターゲット顔画像を決定した後、キャッシュキューにおけるターゲット顔画像の顔とマッチングした顔画像を削除することもできる。つまり、同一の顔を有する顔画像を削除する。これにより、キャッシュキューにキャッシュされた顔画像を減少させ、記憶スペースを節約することができる。
図2は、本開示の実施例による顔画像フレームシーケンスの決定の例を示すフローチャートである。
任意の可能な実施形態において、上記所定の要件は、第1顔パラメータが所定の基準パラメータ区間内にあることを含み、上記ステップS11で画像フレームシーケンスを選別し、第1顔パラメータが所定の要件に合致する顔画像フレームシーケンスを取得する前に、下記ステップを更に含んでもよい。
ステップS01において、画像フレームシーケンスにおける各画像フレームの第1顔パラメータを取得する。
本実現形態において、画像処理端末は、まず、各画像フレームにおける顔画像を検出し、各画像フレームの顔領域を位置決めし、更に位置決めされた顔領域に基づいて、画像フレームシーケンスにおける各画像フレームの第1顔パラメータを決定することができる。例えば、顔領域の顔画像座標、顔画像高さなどの第1顔パラメータを決定する。
一例において、画像フレームシーケンスにおける各画像フレームの第1顔パラメータを取得することは、前記画像フレームシーケンスを収集するための画像収集装置の向き情報及び位置情報を取得することと、前記画像収集装置の向き情報及び位置情報に基づいて、前記画像フレームシーケンスにおける各画像フレームの顔向き情報を決定することと、前記顔向き情報に基づいて、各画像フレームの第1顔パラメータを取得することと、を含んでもよい。
該例において、画像収集装置は、画像フレームシーケンスを収集するための装置であってもよい。画像処理端末は、画像収集装置を備えてもよい。画像収集装置により収集された画像フレームにおいて、顔の大まかな向き及び角度は、撮影過程における画像収集装置の向き及び位置によって決まってもよい。従って、画像フレームシーケンスにおける各画像フレームの第1顔パラメータを決定する前に、まず画像収集装置の向き情報及び位置情報を取得し、画像収集装置の向き情報及び位置情報に基づいて、画像フレームの顔向き情報を決定することができる。該顔向き情報により、画像フレームにおける顔の向きを大まかに推定することができる。例えば、画像フレームにおける顔が左向き又は右向きである。該顔向き情報に基づいて、各画像フレームの顔領域を迅速に位置決めし、顔領域の画像位置を決定し、更に、各画像フレームの第1顔パラメータを取得することができる。
ステップS02において、前記画像フレームシーケンスにおける各画像フレームに対して、前記第1顔パラメータが前記基準パラメータ区間内にあるかどうかを判定する。
本実施例において、画像フレームシーケンスにおける各画像フレームに対して、画像処理端末は、該画像フレームの1つ又は複数の第1顔パラメータと対応する基準パラメータ区間を比較し、該画像フレームの1つ又は複数の第1顔パラメータが対応する基準パラメータ区間内にあるかどうかを判定する。例えば、該画像フレームの第1顔パラメータが基準パラメータ区間内にあれば、ステップS03を実行する。そうでなければ、ステップS04を実行する。従って、第1顔パラメータが前記基準パラメータ区間内にあるかどうかを判定することで、画像フレームシーケンスの画像フレームに対して一次選別を行うことができる。
ステップS03において、前記第1顔パラメータが前記基準パラメータ区間内にある場合、該画像フレームを、前記所定の要件に合致する顔画像フレームシーケンスに属するものと決定する。
ここで、第1パラメータが所定の基準パラメータ区間にあれば、該画像フレームに顔が存在すると決定することができる。又は、該画像フレームにおける顔領域が比較的完備なものであり、該画像フレームが顔画像フレームシーケンスにおける顔画像であり、保留すると決定することができる。
一例において、第1顔パラメータは、顔画像座標を含む。前記第1顔パラメータが前記基準パラメータ区間内にある場合、該画像フレームを、前記所定の要件に合致する顔画像フレームシーケンスに属するものと決定することは、前記画像座標が前記基準座標区間内にある場合、該画像フレームを、前記所定の要件に合致する顔画像フレームシーケンスに属するものと決定する。
該例において、第1顔パラメータが顔画像座標である場合、画像フレームシーケンスの現在の画像フレームについて、現在の画像フレームの顔画像座標と所定の要件の基準画像座標区間を比較することができる。現在の画像フレームの顔画像座標を(x1,y1)と仮定すると、x1が、基準画像座標区間における横座標に対応する区間[left,right]にあるかどうか、y1が、基準画像座標区間における縦座標に対応する区間[botton,top]にあるかどうかを判定する。x1が[left,right]区間内にあり、且つy1が[botton,top]区間内にある場合、現在の画像フレームは、所定の要件に合致する顔画像フレームシーケンスである。
ステップS04において、前記第1顔パラメータが前記基準パラメータ区間内にない場合、該画像フレームを破棄する。
該実現形態において、該画像フレームの第1パラメータが所定の基準パラメータ区間内に存在しなければ、該画像フレームに顔が存在しないか又は該画像フレームの顔領域が不完備であると認められる。該画像フレームを捨て、引き続き、次の画像フレームを検出する。画像フレームに顔画像が存在しない画像フレームについて、第1顔パラメータは0であってもよい。これにより、画像フレームシーケンスに対して一次選別を行う場合、第1顔パラメータにより選別を行い、画像フレームシーケンスにおける顔画像が存在しない画像フレーム又は第1顔パラメータが合格しない画像フレームを削除することができる。
図3は、本開示の実施例による画像処理の一例を示すフローチャートである。該例において、画像処理プロセスは、下記ステップを含んでもよい。
ステップS301において、画像フレームシーケンスの現在の画像フレームを取得する。
ステップS302において、現在の画像フレームの顔領域を位置決めし、現在の画像フレームの第1顔パラメータを取得する。
ここで、第1顔パラメータは、顔画像幅、顔画像高さ、顔画像座標、顔画像整合度、顔画像姿勢角のうちの1つ又は複数を含んでもよい。
ステップS303において、現在の画像フレームの第1顔パラメータが所定の要件に合致するかどうかを判定する。
ここで、所定の要件は、第1顔パラメータが所定の基準パラメータ区間内にあることを含んでもよい。これにより、各第1顔パラメータが該第1顔パラメータの基準パラメータ区間にあるかどうかを判定することができる。各第1顔パラメータがいずれも該第1顔パラメータの基準パラメータ区間内にあれば、現在の画像フレームが完備な顔画像を有すると決定し、ステップS304を実行する。そうでなければ、現在の画像フレームに顔が存在しないか又は顔が完備ではないと決定し、画像フレームを再取得し、つまり、S301を再実行する。
ステップS304において、第1顔パラメータが所定の要件に合致する場合、現在の画像フレームの第2顔パラメータを決定し、現在の画像フレームの第1顔パラメータ及び第2顔パラメータに基づいて、現在の画像フレームの品質スコアを決定する。
ここで、第2顔パラメータは、顔画像鮮鋭度、顔画像輝度、顔画像画素点の数のうちの少なくとも1つを含んでもよい。
ステップS305において、現在の画像フレームの品質スコアが所定のスコア閾値より大きいかどうかを判定する。
ここで、現在の画像フレームの品質スコアが所定のスコア閾値より大きいと、現在の画像フレームの顔品質が高いと認められ、S306を実行する。品質スコアが所定のスコア閾値以下であると、現在の画像フレームの顔品質が低いと認められ、S303を再実行する。
ステップS306において、現在の画像フレームに対して顔認識を行う。
本開示の実施例で提供される画像処理方法は、顔認識を行う前に、画像フレームシーケンスにおける画像フレームを選別し、顔画像の品質が高い画像フレームを選択して顔認識を行うことができる。これにより、有効な画像フレームの浪費を減少させ、顔認識の速度を速くし、顔認識の正確度を向上させ、処理リソースの浪費を減少させることができる。
本開示に言及した上記各方法の実施例は、原理や論理から逸脱しない限り、互いに組み合わせることで組み合わせた実施例を構成することができ、紙数に限りがあるため、本開示において逐一説明しないことが理解されるべきである。
なお、本開示は、画像処理装置、電子機器、コンピュータ可読記憶媒体、プログラムを更に提供する。上記はいずれも、本開示で提供されるいずれか1つのビデオ処理方法を実現させるためのものである。対応する技術的解決手段及び説明は、方法に関連する記述を参照されたい。ここで、詳細な説明を省略する。
具体的な実施形態の上記方法において、各ステップの記述順番は、厳密な実行順番として実施過程を限定するものではなく、各ステップの具体的な実行順番はその機能及び考えられる内在的論理により決まることは、当業者であれば理解すべきである。
図4は、本開示の実施例による画像処理装置を示すブロック図である。図4に示すように、前記画像処理装置は、
画像フレームシーケンスを選別し、第1顔パラメータが所定の要件に合致する顔画像フレームシーケンスを取得するように構成される取得モジュール41と、
前記顔画像フレームシーケンスにおける各顔画像の第2顔パラメータを決定するように構成される第1決定モジュール42と、
前記顔画像フレームシーケンスにおける各顔画像の第1顔パラメータ及び第2顔パラメータに基づいて、前記顔画像フレームシーケンスにおける各顔画像の品質スコアを決定するように構成される第2決定モジュール43と、
顔画像フレームシーケンスにおける各顔画像の品質スコアに基づいて、顔認識のためのターゲット顔画像を得るように構成される第3決定モジュール44と、を備える。
画像フレームシーケンスを選別し、第1顔パラメータが所定の要件に合致する顔画像フレームシーケンスを取得するように構成される取得モジュール41と、
前記顔画像フレームシーケンスにおける各顔画像の第2顔パラメータを決定するように構成される第1決定モジュール42と、
前記顔画像フレームシーケンスにおける各顔画像の第1顔パラメータ及び第2顔パラメータに基づいて、前記顔画像フレームシーケンスにおける各顔画像の品質スコアを決定するように構成される第2決定モジュール43と、
顔画像フレームシーケンスにおける各顔画像の品質スコアに基づいて、顔認識のためのターゲット顔画像を得るように構成される第3決定モジュール44と、を備える。
任意の可能な実施形態において、前記所定の要件は、第1顔パラメータが所定の基準パラメータ区間内にあることを含み、前記装置は、
前記取得モジュール41により画像フレームシーケンスを選別し、第1顔パラメータが所定の要件に合致する顔画像フレームシーケンスを取得する前に、画像フレームシーケンスにおける各画像フレームの第1顔パラメータを取得し、前記第1顔パラメータが前記基準パラメータ区間内にある場合、該画像フレームを、前記所定の要件に合致する顔画像フレームシーケンスに属するものと決定するように構成される判定モジュールを更に備える。
前記取得モジュール41により画像フレームシーケンスを選別し、第1顔パラメータが所定の要件に合致する顔画像フレームシーケンスを取得する前に、画像フレームシーケンスにおける各画像フレームの第1顔パラメータを取得し、前記第1顔パラメータが前記基準パラメータ区間内にある場合、該画像フレームを、前記所定の要件に合致する顔画像フレームシーケンスに属するものと決定するように構成される判定モジュールを更に備える。
任意の可能な実施形態において、前記判定モジュールは、前記画像フレームシーケンスを収集するための画像収集装置の向き情報及び位置情報を取得し、前記画像収集装置の向き情報及び位置情報に基づいて、前記画像フレームシーケンスにおける各画像フレームの顔向き情報を決定し、前記顔向き情報に基づいて、各画像フレームの第1顔パラメータを取得するように構成される。
任意の可能な実施形態において、前記第1顔パラメータは、顔画像座標を含み、
前記判定モジュールは、前記顔画像座標が前記基準座標区間内にある場合、該画像フレームを、前記所定の要件に合致する顔画像フレームシーケンスに属するものと決定するように構成される。
前記判定モジュールは、前記顔画像座標が前記基準座標区間内にある場合、該画像フレームを、前記所定の要件に合致する顔画像フレームシーケンスに属するものと決定するように構成される。
任意の可能な実施形態において、前記第1顔パラメータは、顔画像幅、顔画像高さ、顔画像座標、顔画像整合度、顔画像姿勢角のうちの少なくとも1つを含む。
任意の可能な実施形態において、前記第2決定モジュール43は、各顔画像の第1顔パラメータ及び第2顔パラメータに対して加重処理を行い、加重処理の結果に基づいて、前記顔画像の品質スコアを得るように構成される。
任意の可能な実施形態において、前記第2決定モジュール43は、前記第1顔パラメータ及び第2顔パラメータのそれぞれと顔画像の認識率との間の相関性に基づいて、前記第1顔パラメータ及び前記第2顔パラメータにおける各顔パラメータに対応するパラメータスコアをそれぞれ決定し、各顔パラメータに対応するパラメータスコアに基づいて、各顔画像の品質スコアを決定するように構成される。
任意の可能な実施形態において、前記第3決定モジュール44は、前記品質スコアに基づいて、キャッシュキューに記憶される顔画像を決定し、前記キャッシュキューにおける複数の顔画像を順序付け、順序付け結果を得て、前記順序付け結果に基づいて、顔認識のためのターゲット顔画像を得るように構成される。
任意の可能な実施形態において、前記第3決定モジュール44は、各顔画像の品質スコアと所定のスコア閾値を比較し、前記顔画像の品質スコアが所定のスコア閾値より大きい場合、前記顔画像をキャッシュキューに記憶すると決定するように構成される。
任意の可能な実施形態において、前記第3決定モジュール44は、前記順序付け結果に基づいて、前記キャッシュキューにおける品質スコアが最も高い顔画像を決定し、前記キャッシュキューにおける品質スコアが最も高い顔画像を、顔認識のためのターゲット顔画像として決定するように構成される。
任意の可能な実施形態において、前記第2顔パラメータは、顔画像鮮鋭度、顔画像輝度、顔画像画素点の数のうちの少なくとも1つを含む。
幾つかの実施例において、本開示の実施例で提供される装置における機能及びモジュールは、上記方法実施例に記載の方法を実行するために用いられ、具体的な実現形態は上記方法実施例の説明を参照されたい。簡潔化のために、ここで詳細な説明を省略する。
本開示の実施例はコンピュータ可読記憶媒体を更に提供する。該コンピュータ可読記憶媒体にはコンピュータプログラム命令が記憶されており、前記コンピュータプログラム命令がプロセッサにより実行される時、上記方法を実現させる。コンピュータ可読記憶媒体は不揮発性コンピュータ可読記憶媒体であってもよい。
本開示の実施例は電子機器を更に提供する。該電子機器は、プロセッサと、プロセッサによる実行可能な命令を記憶するためのメモリと、を備え、プロセッサは、上記方法を実行するように構成される。
例示的に、電子機器は、端末、サーバ又は他の形態の機器として提供されてもよい。
図5は本開示の実施例による電子機器を示すブロック図である。例えば、電子機器は、携帯電話、コンピュータ、デジタル放送端末、メッセージング装置、ゲームコンソール、タブレットデバイス、医療機器、フィットネス機器、パーソナルデジタルアシスタントなどの端末であってもよい。
図5を参照すると、電子機器800は、処理コンポーネント802、メモリ804、電源コンポーネント806、マルチメディアコンポーネント808、オーディオコンポーネント810、入力/出力(I/O)インタフェース812、センサコンポーネント814及び通信コンポーネント816のうちの1つ又は複数を備えてもよい。
処理コンポーネント802は一般的には、電子機器800の全体操作を制御する。例えば、表示、通話呼、データ通信、カメラ操作及び記録操作に関連する操作を制御する。処理コンポーネント802は、指令を実行するための1つ又は複数のプロセッサ820を備えてもよい。それにより上記方法の全て又は一部のステップを実行する。なお、処理コンポーネント802は、他のユニットとのインタラクションのために、1つ又は複数のモジュールを備えてもよい。例えば、処理コンポーネント802はマルチメディアモジュールを備えることで、マルチメディアコンポーネント808と処理コンポーネント802とのインタラクションに寄与する。
メモリ804は、各種のデータを記憶することで電子機器800における操作をサポートするように構成される。これらのデータの例として、電子機器800上で操作される如何なるアプリケーション又は方法の命令、連絡先データ、電話帳データ、メッセージ、イメージ、ビデオ等を含む。メモリ804は任意のタイプの揮発性または不揮発性記憶装置、あるいはこれらの組み合わせにより実現される。例えば、スタティックランダムアクセスメモリ(Static Random Access Memory:SRAM)、電気的消去可能なプログラマブル読み出し専用メモリ(Electrically Erasable Programmable Read−Only Memory:EEPROM)、電気的に消去可能なプログラマブル読出し専用メモリ(Erasable Programmable Read−Only Memory:EPROM)、プログラマブル読出し専用メモリ(Programmable Read−Only Memory:PROM)、読出し専用メモリ(Read Only Memory:ROM)、磁気メモリ、フラッシュメモリ、磁気もしくは光ディスクを含む。
電源コンポーネント806は電子機器800の様々なユニットに電力を提供する。電源コンポーネント806は、電源管理システム、1つ又は複数の電源、及び電子機器800のための電力生成、管理、分配に関連する他のユニットを備えてもよい。
マルチメディアコンポーネント808は、上記電子機器800とユーザとの間に出力インタフェースを提供するためのスクリーンを備える。幾つかの実施例において、スクリーンは、液晶ディスプレイ(Liquid Crystal Display:LCD)及びタッチパネル(Touch Panel:TP)を含む。スクリーンは、タッチパネルを含むと、タッチパネルとして実現され、ユーザからの入力信号を受信する。タッチパネルは、タッチ、スライド及びパネル上のジェスチャを感知する1つ又は複数のタッチセンサを備える。上記タッチセンサは、タッチ又はスライド動作の境界を感知するだけでなく、上記タッチ又はスライド操作に関連する持続時間及び圧力を検出することもできる。幾つかの実施例において、マルチメディアコンポーネント808は、フロントカメラ及び/又はリアカメラを備える。電子機器800が、撮影モード又はビデオモードのような操作モードであれば、フロントカメラ及び/又はリアカメラは外部からのマルチメディアデータを受信することができる。各フロントカメラ及びリアカメラは固定した光学レンズシステム又は焦点及び光学ズーム能力を持つものであってもよい。
オーディオコンポーネント810は、オーディオ信号を出力及び/又は入力するように構成される。例えば、オーディオコンポーネント810は、マイクロホン(Microphone:MIC)を備える。電子機器800が、通話モード、記録モード及び音声識別モードのような操作モードであれば、マイクロホンは、外部からのオーディオ信号を受信するように構成される。受信したオーディオ信号を更にメモリ804に記憶するか、又は通信コンポーネント816を経由して送信することができる。幾つかの実施例において、オーディオコンポーネント810は、オーディオ信号を出力するように構成されるスピーカーを更に備える。
I/Oインタフェース812は、処理コンポーネント802と周辺インタフェースモジュールとの間のインタフェースを提供する。上記周辺インタフェースモジュールは、キーボード、クリックホイール、ボタン等であってもよい。これらのボタンは、ホームボダン、ボリュームボタン、スタートボタン及びロックボタンを含むが、これらに限定されない。
センサコンポーネント814は、1つ又は複数のセンサを備え、電子機器800のために様々な状態の評価を行うように構成される。例えば、センサコンポーネント814は、電子機器800のオン/オフ状態、ユニットの相対的な位置決めを検出することができる。例えば、上記ユニットが電子機器800のディスプレイ及びキーパッドである。センサコンポーネント814は電子機器800又は電子機器800における1つのユニットの位置の変化、ユーザと電子機器800との接触の有無、電子機器800の方位又は加速/減速及び電子機器800の温度の変動を検出することもできる。センサコンポーネント814は近接センサを備えてもよく、いかなる物理的接触もない場合に周囲の物体の存在を検出するように構成される。センサコンポーネント814は、金属酸化膜半導体素子(Complementary Metal−Oxide Semiconductor:CMOS)又は電荷結合素子(Charge Coupled Device:CCD)画像センサのような光センサを備えてもよく、結像に適用されるように構成される。幾つかの実施例において、該センサコンポーネント814は、加速度センサ、ジャイロセンサ、磁気センサ、圧力センサ又は温度センサを備えてもよい。
通信コンポーネント816は、電子機器800と他の機器との有線又は無線方式の通信に寄与するように構成される。電子機器800は、WiFi、2G又は3G、又はそれらの組み合わせのような通信規格に基づいた無線ネットワークにアクセスできる。一例示的な実施例において、通信コンポーネント816は放送チャネルを経由して外部放送チャネル管理システムからの放送信号又は放送関連する情報を受信する。一例示的な実施例において、上記通信コンポーネント816は、近接場通信(Near Field Communication:NFC)モジュールを更に備えることで近距離通信を促進する。例えば、NFCモジュールは、無線周波数識別(Radio Frequency Identification:RFID)技術、赤外線データ協会(Infrared Data Association:IrDA)技術、超広帯域(Ultra WideBand:UWB)技術、ブルートゥース(登録商標)(Bluetooth:BT)技術及び他の技術に基づいて実現される。
例示的な実施例において、電子機器800は、1つ又は複数の特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)、デジタル信号プロセッサ(Digital Signal Processor:DSP)、デジタル信号処理機器(DSPD)、プログラマブルロジックデバイス(PLD)、フィールドプログラマブルゲートアレイ(Field−Programmable Gate Array:FPGA)、コントローラ、マイクロコントローラ、マイクロプロセッサ又は他の電子素子により実現され、上記方法を実行するように構成されてもよい。
例示的な実施例において、コンピュータプログラム命令を記憶したメモリ804のような不揮発性コンピュータ可読記憶媒体を更に提供する。上記コンピュータプログラム命令は、電子機器800のプロセッサ820により実行され上記方法を完了する。
本開示の実施例は、システム、方法及び/又はコンピュータプログラム製品であってもよい。コンピュータプログラム製品は、コンピュータ可読記憶媒体を備えてもよく、プロセッサに本開示の各態様を実現させるためのコンピュータ可読プログラム命令がそれに記憶されている。
コンピュータ可読記憶媒体は、命令実行装置に用いられる命令を保持又は記憶することができる有形装置であってもよい。コンピュータ可読記憶媒体は、例えば、電気記憶装置、磁気記憶装置、光記憶装置、電磁記憶装置、半導体記憶装置又は上記の任意の組み合わせであってもよいが、これらに限定されない。コンピュータ可読記憶媒体のより具体的な例(非網羅的なリスト)は、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ(Random Access Memory:RAM)、読み出し専用メモリ(Read Only Memory:ROM)、消去可能なプログラマブル読み出し専用メモリ(Erasable Programmable Read−Only Memory:EPROM又はフラッシュ)、スタティックランダムアクセスメモリ(Static Random Access Memory:SRAM)、ポータブルコンパクトディスク読み出し専用メモリ(Compact Disc Read−Only Memory:CD−ROM)、デジタル多目的ディスク(DVD)、メモリスティック、フレキシブルディスク、命令が記憶されているパンチカード又は凹溝内における突起構造のような機械的符号化装置、及び上記任意の適切な組み合わせを含む。ここで用いられるコンピュータ可読記憶媒体は、電波もしくは他の自由に伝搬する電磁波、導波路もしくは他の伝送媒体を通って伝搬する電磁波(例えば、光ファイバケーブルを通過する光パルス)、または、電線を通して伝送される電気信号などの、一時的な信号それ自体であると解釈されるべきではない。
ここで説明されるコンピュータ可読プログラム命令を、コンピュータ可読記憶媒体から各コンピューティング/処理装置にダウンロードすることができるか、又は、インターネット、ローカルエリアネットワーク、ワイドエリアネットワーク及び/又は無線ネットワークのようなネットワークを経由して外部コンピュータ又は外部記憶装置にダウンロードすることができる。ネットワークは、伝送用銅線ケーブル、光ファイバー伝送、無線伝送、ルータ、ファイアウォール、交換機、ゲートウェイコンピュータ及び/又はエッジサーバを含んでもよい。各コンピューティング/処理装置におけるネットワークインターフェースカード又はネットワークインタフェースは、ネットワークからコンピュータ可読プログラム命令を受信し、該コンピュータ可読プログラム命令を転送し、各コンピューティング/処理装置におけるコンピュータ可読記憶媒体に記憶する。
本開示の操作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、又は1つ又は複数のプログラミング言語で記述されたソースコード又はターゲットコードであってもよい。前記プログラミング言語は、Smalltalk、C++などのようなオブジェクト指向プログラミング言語と、「C」プログラミング言語又は類似したプログラミング言語などの従来の手続型プログラミング言語とを含む。コンピュータ可読プログラム命令は、ユーザコンピュータ上で完全に実行してもよいし、ユーザコンピュータ上で部分的に実行してもよいし、独立したソフトウェアパッケージとして実行してもよいし、ユーザコンピュータ上で部分的に実行してリモートコンピュータ上で部分的に実行してもよいし、又はリモートコンピュータ又はサーバ上で完全に実行してもよい。リモートコンピュータの場合に、リモートコンピュータは、ローカルエリアネットワーク(LAN)やワイドエリアネットワーク(WAN)を含む任意の種類のネットワークを通じてユーザのコンピュータに接続するか、または、外部のコンピュータに接続することができる(例えばインターネットサービスプロバイダを用いてインターネットを通じて接続する)。幾つかの実施例において、コンピュータ可読プログラム命令の状態情報を利用して、プログラマブル論理回路、フィールドプログラマブルゲートアレイ(FPGA)又はプログラマブル論理アレイ(PLA)のような電子回路をカスタマイズする。該電子回路は、コンピュータ可読プログラム命令を実行することで、本開示の各態様を実現させることができる。
ここで、本開示の実施例の方法、装置(システム)及びコンピュータプログラム製品のフローチャート及び/又はブロック図を参照しながら、本開示の各態様を説明する。フローチャート及び/又はブロック図の各ブロック及びフローチャート及び/又はブロック図における各ブロックの組み合わせは、いずれもコンピュータ可読プログラム命令により実現できる。
これらのコンピュータ可読プログラム命令は、汎用コンピュータ、専用コンピュータまたはその他プログラマブルデータ処理装置のプロセッサに提供でき、それによって機器を生み出し、これら命令はコンピュータまたはその他プログラマブルデータ処理装置のプロセッサにより実行される時、フローチャート及び/又はブロック図における1つ又は複数のブロック中で規定している機能/操作を実現する装置を生み出した。これらのコンピュータ可読プログラム命令をコンピュータ可読記憶媒体に記憶してもよい。これらの命令によれば、コンピュータ、プログラマブルデータ処理装置及び/又は他の装置は特定の方式で動作する。従って、命令が記憶されているコンピュータ可読記憶媒体は、フローチャート及び/又はブロック図おける1つ又は複数のブロック中で規定している機能/操作を実現する各態様の命令を含む製品を備える。
コンピュータ可読プログラム命令をコンピュータ、他のプログラマブルデータ処理装置又は他の装置にロードしてもよい。これにより、コンピュータ、他のプログラマブルデータ処理装置又は他の装置で一連の操作の工程を実行して、コンピュータで実施されるプロセスを生成する。従って、コンピュータ、他のプログラマブルデータ処理装置又は他の装置で実行される命令により、フローチャート及び/又はブロック図における1つ又は複数のブロック中で規定している機能/操作を実現させる。
図面におけるフローチャート及びブロック図は、本開示の複数の実施例によるシステム、方法及びコンピュータプログラム製品の実現可能なアーキテクチャ、機能および操作を例示するものである。この点で、フローチャート又はブロック図における各ブロックは、1つのモジュール、プログラムセグメント又は命令の一部を表すことができる。前記モジュール、プログラムセグメント又は命令の一部は、1つまたは複数の所定の論理機能を実現するための実行可能な命令を含む。いくつかの取り替えとしての実現中に、ブロックに表記される機能は図面中に表記される順序と異なる順序で発生することができる。例えば、二つの連続するブロックは実際には基本的に並行して実行でき、場合によっては反対の順序で実行することもでき、これは関係する機能から確定する。ブロック図及び/又はフローチャートにおける各ブロック、及びブロック図及び/又はフローチャートにおけるブロックの組み合わせは、所定の機能又は操作を実行するための専用ハードウェアベースシステムにより実現するか、又は専用ハードウェアとコンピュータ命令の組み合わせにより実現することができることにも留意されたい。
以上、本発明の各実施例を説明したが、前記説明は例示的なものであり、網羅するものではなく、且つ開示した各実施例に限定されない。説明した各実施例の範囲と趣旨から逸脱しない場合、当業者にとって、多くの修正及び変更は容易に想到しえるものである。本明細書に用いられる用語の選択は、各実施例の原理、実際の応用、或いは市場における技術への改善を最もよく解釈すること、或いは他の当業者が本明細書に開示された各実施例を理解できることを目的とする。
41 取得モジュール
42 第1決定モジュール
43 第2決定モジュール
44 第3決定モジュール
800 電子機器
802 処理コンポーネント
804 メモリ
806 電源コンポーネント
808 マルチメディアコンポーネント
810 オーディオコンポーネント
812 入力/出力インタフェース
814 センサコンポーネント
816 通信コンポーネント
820 プロセッサ
42 第1決定モジュール
43 第2決定モジュール
44 第3決定モジュール
800 電子機器
802 処理コンポーネント
804 メモリ
806 電源コンポーネント
808 マルチメディアコンポーネント
810 オーディオコンポーネント
812 入力/出力インタフェース
814 センサコンポーネント
816 通信コンポーネント
820 プロセッサ
Claims (24)
- 画像処理方法であって、
画像フレームシーケンスを選別し、第1顔パラメータが所定の要件に合致する顔画像フレームシーケンスを取得することと、
前記顔画像フレームシーケンスにおける各顔画像の第2顔パラメータを決定することと、
前記顔画像フレームシーケンスにおける各顔画像の第1顔パラメータ及び第2顔パラメータに基づいて、前記顔画像フレームシーケンスにおける各顔画像の品質スコアを決定することと、
顔画像フレームシーケンスにおける各顔画像の品質スコアに基づいて、顔認識のためのターゲット顔画像を得ることと、を含む方法。 - 前記所定の要件は、第1顔パラメータが所定の基準パラメータ区間内にあることを含み、前記画像フレームシーケンスを選別し、第1顔パラメータが所定の要件に合致する顔画像フレームシーケンスを取得する前に、前記方法は、
画像フレームシーケンスにおける各画像フレームの第1顔パラメータを取得することと、
前記第1顔パラメータが前記基準パラメータ区間内にある場合、該画像フレームを、前記所定の要件に合致する顔画像フレームシーケンスに属するものと決定することと、を更に含むことを特徴とする
請求項1に記載の方法。 - 前記画像フレームシーケンスにおける各画像フレームの第1顔パラメータを取得することは、
前記画像フレームシーケンスを収集するための画像収集装置の向き情報及び位置情報を取得することと、
前記画像収集装置の向き情報及び位置情報に基づいて、前記画像フレームシーケンスにおける各画像フレームの顔向き情報を決定することと、
前記顔向き情報に基づいて、各画像フレームの第1顔パラメータを取得することと、を含むことを特徴とする
請求項2に記載の方法。 - 前記第1顔パラメータは、顔画像座標を含み、前記第1顔パラメータが前記基準パラメータ区間内にある場合、該画像フレームを、前記所定の要件に合致する顔画像フレームシーケンスに属するものと決定することは、
前記顔画像座標が基準座標区間内にある場合、該画像フレームを、前記所定の要件に合致する顔画像フレームシーケンスに属するものと決定することを含むことを特徴とする
請求項2に記載の方法。 - 前記第1顔パラメータは、顔画像幅、顔画像高さ、顔画像座標、顔画像整合度、顔画像姿勢角のうちの少なくとも1つを含むことを特徴とする
請求項1から4のうちいずれか一項に記載の方法。 - 前記顔画像フレームシーケンスにおける各顔画像の第1顔パラメータ及び第2顔パラメータに基づいて、前記顔画像フレームシーケンスにおける各顔画像の品質スコアを決定することは、
各顔画像の第1顔パラメータ及び第2顔パラメータに対して加重処理を行い、加重処理の結果に基づいて、前記顔画像の品質スコアを得ることを含むことを特徴とする
請求項1から5のうちいずれか一項に記載の方法。 - 前記顔画像フレームシーケンスにおける各顔画像の第1顔パラメータ及び第2顔パラメータに基づいて、前記顔画像フレームシーケンスにおける各顔画像の品質スコアを決定することは、
前記第1顔パラメータ及び第2顔パラメータのそれぞれと顔画像の認識率との間の相関性に基づいて、前記第1顔パラメータ及び前記第2顔パラメータにおける各顔パラメータに対応するパラメータスコアをそれぞれ決定することと、
各顔パラメータに対応するパラメータスコアに基づいて、各顔画像の品質スコアを決定することと、を含むことを特徴とする
請求項1から5のうちいずれか一項に記載の方法。 - 前記顔画像フレームシーケンスにおける各顔画像の品質スコアに基づいて、顔認識のためのターゲット顔画像を得ることは、
前記品質スコアに基づいて、キャッシュキューに記憶される顔画像を決定することと、
前記キャッシュキューにおける複数の顔画像を順序付け、順序付け結果を得ることと、
前記順序付け結果に基づいて、顔認識のためのターゲット顔画像を得ることと、を含むことを特徴とする
請求項1から7のうちいずれか一項に記載の方法。 - 前記品質スコアに基づいて、キャッシュキューに記憶される顔画像を決定することは、
各顔画像の品質スコアと所定のスコア閾値を比較することと、
前記顔画像の品質スコアが所定のスコア閾値より大きい場合、前記顔画像をキャッシュキューに記憶すると決定することと、を含むことを特徴とする
請求項8に記載の方法。 - 前記順序付け結果に基づいて、顔認識のためのターゲット顔画像を得ることは、
前記順序付け結果に基づいて、前記キャッシュキューにおける品質スコアが最も高い顔画像を決定することと、
前記キャッシュキューにおける品質スコアが最も高い顔画像を、顔認識のためのターゲット顔画像として決定することと、を含むことを特徴とする
請求項8に記載の方法。 - 前記第2顔パラメータは、顔画像鮮鋭度、顔画像輝度、顔画像画素点の数のうちの少なくとも1つを含むことを特徴とする
請求項1から10のうちいずれか一項に記載の方法。 - 画像処理装置であって、
画像フレームシーケンスを選別し、第1顔パラメータが所定の要件に合致する顔画像フレームシーケンスを取得するように構成される取得モジュールと、
前記顔画像フレームシーケンスにおける各顔画像の第2顔パラメータを決定するように構成される第1決定モジュールと、
前記顔画像フレームシーケンスにおける各顔画像の第1顔パラメータ及び第2顔パラメータに基づいて、前記顔画像フレームシーケンスにおける各顔画像の品質スコアを決定するように構成される第2決定モジュールと、
顔画像フレームシーケンスにおける各顔画像の品質スコアに基づいて、顔認識のためのターゲット顔画像を得るように構成される第3決定モジュールと、を備える装置。 - 前記所定の要件は、第1顔パラメータが所定の基準パラメータ区間内にあることを含み、前記装置は、
前記取得モジュールにより画像フレームシーケンスを選別し、第1顔パラメータが所定の要件に合致する顔画像フレームシーケンスを取得する前に、画像フレームシーケンスにおける各画像フレームの第1顔パラメータを取得し、前記第1顔パラメータが前記基準パラメータ区間内にある場合、該画像フレームを、前記所定の要件に合致する顔画像フレームシーケンスに属するものと決定するように構成される判定モジュールを更に備えることを特徴とする
請求項12に記載の装置。 - 前記判定モジュールは、前記画像フレームシーケンスを収集するための画像収集装置の向き情報及び位置情報を取得し、前記画像収集装置の向き情報及び位置情報に基づいて、前記画像フレームシーケンスにおける各画像フレームの顔向き情報を決定し、前記顔向き情報に基づいて、各画像フレームの第1顔パラメータを取得するように構成されることを特徴とする
請求項13に記載の装置。 - 前記第1顔パラメータは、顔画像座標を含み、前記判定モジュールは、前記顔画像座標が基準座標区間内にある場合、該画像フレームを、前記所定の要件に合致する顔画像フレームシーケンスに属するものと決定するように構成されることを特徴とする
請求項13に記載の装置。 - 前記第1顔パラメータは、顔画像幅、顔画像高さ、顔画像座標、顔画像整合度、顔画像姿勢角のうちの少なくとも1つを含むことを特徴とする
請求項12から15のうちいずれか一項に記載の装置。 - 前記第2決定モジュールは、各顔画像の第1顔パラメータ及び第2顔パラメータに対して加重処理を行い、加重処理の結果に基づいて、前記顔画像の品質スコアを得るように構成されることを特徴とする
請求項12から16のうちいずれか一項に記載の装置。 - 前記第2決定モジュールは、前記第1顔パラメータ及び第2顔パラメータのそれぞれと顔画像の認識率との間の相関性に基づいて、前記第1顔パラメータ及び前記第2顔パラメータにおける各顔パラメータに対応するパラメータスコアをそれぞれ決定し、各顔パラメータに対応するパラメータスコアに基づいて、各顔画像の品質スコアを決定するように構成されることを特徴とする
請求項12から16のうちいずれか一項に記載の装置。 - 前記第3決定モジュールは、前記品質スコアに基づいて、キャッシュキューに記憶される顔画像を決定し、前記キャッシュキューにおける複数の顔画像を順序付け、順序付け結果を得て、前記順序付け結果に基づいて、顔認識のためのターゲット顔画像を得るように構成されることを特徴とする
請求項12から18のうちいずれか一項に記載の装置。 - 前記第3決定モジュールは、各顔画像の品質スコアと所定のスコア閾値を比較し、前記顔画像の品質スコアが所定のスコア閾値より大きい場合、前記顔画像をキャッシュキューに記憶すると決定するように構成されることを特徴とする
請求項19に記載の装置。 - 前記第3決定モジュールは、前記順序付け結果に基づいて、前記キャッシュキューにおける品質スコアが最も高い顔画像を決定し、前記キャッシュキューにおける品質スコアが最も高い顔画像を、顔認識のためのターゲット顔画像として決定するように構成されることを特徴とする
請求項19に記載の装置。 - 前記第2顔パラメータは、顔画像鮮鋭度、顔画像輝度、顔画像画素点の数のうちの少なくとも1つを含むことを特徴とする
請求項12から21のうちいずれか一項に記載の装置。 - プロセッサと、
プロセッサによる実行可能な命令を記憶するためのメモリと、を備え、
前記プロセッサは、前記メモリに記憶されている命令を呼び出して、請求項1から11のうちいずれか一項に記載の方法を実行するように構成される、電子機器。 - コンピュータに請求項1から11のうちいずれか一項に記載の方法を実行させるためのコンピュータプログラムを記憶した、コンピュータ可読記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910575840.3A CN110298310A (zh) | 2019-06-28 | 2019-06-28 | 图像处理方法及装置、电子设备和存储介质 |
CN201910575840.3 | 2019-06-28 | ||
PCT/CN2020/087784 WO2020259073A1 (zh) | 2019-06-28 | 2020-04-29 | 图像处理方法及装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021531554A true JP2021531554A (ja) | 2021-11-18 |
Family
ID=68029478
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020573222A Pending JP2021531554A (ja) | 2019-06-28 | 2020-04-29 | 画像処理方法及び装置、電子機器並びに記憶媒体 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20210374447A1 (ja) |
JP (1) | JP2021531554A (ja) |
KR (1) | KR20210042952A (ja) |
CN (1) | CN110298310A (ja) |
SG (1) | SG11202108646XA (ja) |
TW (1) | TW202105239A (ja) |
WO (1) | WO2020259073A1 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110298310A (zh) * | 2019-06-28 | 2019-10-01 | 深圳市商汤科技有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN110796106A (zh) * | 2019-11-04 | 2020-02-14 | 北京迈格威科技有限公司 | 人像质量评估模型建立和从视频中进行人像识别的方法 |
CN110852303A (zh) * | 2019-11-21 | 2020-02-28 | 中科智云科技有限公司 | 一种基于OpenPose的吃东西行为识别方法 |
CN111291633B (zh) * | 2020-01-17 | 2022-10-14 | 复旦大学 | 一种实时行人重识别方法及装置 |
CN111444856A (zh) * | 2020-03-27 | 2020-07-24 | 广东博智林机器人有限公司 | 图像的分析方法、模型的训练方法、装置、设备及存储介质 |
CN111639216A (zh) * | 2020-06-05 | 2020-09-08 | 上海商汤智能科技有限公司 | 一种人脸图像的展示方法、装置、计算机设备及存储介质 |
CN111738243B (zh) * | 2020-08-25 | 2020-11-20 | 腾讯科技(深圳)有限公司 | 人脸图像的选择方法、装置、设备及存储介质 |
CN112967273B (zh) * | 2021-03-25 | 2021-11-16 | 北京的卢深视科技有限公司 | 图像处理方法、电子设备及存储介质 |
CN113311861B (zh) * | 2021-05-14 | 2023-06-16 | 国家电投集团青海光伏产业创新中心有限公司 | 光伏组件隐裂特性的自动化检测方法及其系统 |
CN113505700A (zh) * | 2021-07-12 | 2021-10-15 | 北京字跳网络技术有限公司 | 一种图像处理方法、装置、设备及存储介质 |
KR20230053144A (ko) * | 2021-10-14 | 2023-04-21 | 삼성전자주식회사 | 전자 장치 및 전자 장치에서 촬영 기능을 수행하는 방법 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006025272A1 (ja) * | 2004-09-01 | 2006-03-09 | Nec Corporation | 映像分類装置、映像分類プログラム、映像検索装置、および映像検索プログラム |
US20120070041A1 (en) * | 2010-09-16 | 2012-03-22 | Jie Wang | System And Method For Face Verification Using Video Sequence |
CN102799877A (zh) * | 2012-09-11 | 2012-11-28 | 上海中原电子技术工程有限公司 | 人脸图像筛选方法及系统 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106056138A (zh) * | 2016-05-25 | 2016-10-26 | 努比亚技术有限公司 | 照片处理装置及方法 |
US9971933B1 (en) * | 2017-01-09 | 2018-05-15 | Ulsee Inc. | Facial image screening method and face recognition system thereof |
CN108875470B (zh) * | 2017-06-19 | 2021-06-22 | 北京旷视科技有限公司 | 对访客进行登记的方法、装置及计算机存储介质 |
CN108229330A (zh) * | 2017-12-07 | 2018-06-29 | 深圳市商汤科技有限公司 | 人脸融合识别方法及装置、电子设备和存储介质 |
CN108875522B (zh) * | 2017-12-21 | 2022-06-10 | 北京旷视科技有限公司 | 人脸聚类方法、装置和系统及存储介质 |
CN108171207A (zh) * | 2018-01-17 | 2018-06-15 | 百度在线网络技术(北京)有限公司 | 基于视频序列的人脸识别方法和装置 |
CN108287821B (zh) * | 2018-01-23 | 2021-12-17 | 北京奇艺世纪科技有限公司 | 一种高质量文本筛选方法、装置及电子设备 |
CN108491784B (zh) * | 2018-03-16 | 2021-06-22 | 南京邮电大学 | 面向大型直播场景的单人特写实时识别与自动截图方法 |
CN108694385A (zh) * | 2018-05-14 | 2018-10-23 | 深圳市科发智能技术有限公司 | 一种高速人脸识别方法、系统及装置 |
CN110298310A (zh) * | 2019-06-28 | 2019-10-01 | 深圳市商汤科技有限公司 | 图像处理方法及装置、电子设备和存储介质 |
-
2019
- 2019-06-28 CN CN201910575840.3A patent/CN110298310A/zh active Pending
-
2020
- 2020-04-29 SG SG11202108646XA patent/SG11202108646XA/en unknown
- 2020-04-29 WO PCT/CN2020/087784 patent/WO2020259073A1/zh active Application Filing
- 2020-04-29 JP JP2020573222A patent/JP2021531554A/ja active Pending
- 2020-04-29 KR KR1020217007096A patent/KR20210042952A/ko active Search and Examination
- 2020-06-04 TW TW109118778A patent/TW202105239A/zh unknown
-
2021
- 2021-08-06 US US17/395,597 patent/US20210374447A1/en not_active Abandoned
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006025272A1 (ja) * | 2004-09-01 | 2006-03-09 | Nec Corporation | 映像分類装置、映像分類プログラム、映像検索装置、および映像検索プログラム |
US20120070041A1 (en) * | 2010-09-16 | 2012-03-22 | Jie Wang | System And Method For Face Verification Using Video Sequence |
CN102799877A (zh) * | 2012-09-11 | 2012-11-28 | 上海中原电子技术工程有限公司 | 人脸图像筛选方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
WO2020259073A1 (zh) | 2020-12-30 |
TW202105239A (zh) | 2021-02-01 |
CN110298310A (zh) | 2019-10-01 |
SG11202108646XA (en) | 2021-09-29 |
KR20210042952A (ko) | 2021-04-20 |
US20210374447A1 (en) | 2021-12-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2021531554A (ja) | 画像処理方法及び装置、電子機器並びに記憶媒体 | |
TWI775091B (zh) | 資料更新方法、電子設備和儲存介質 | |
JP7085622B2 (ja) | 画像におけるシーケンスを認識する方法及び装置、電子機器並びに記憶媒体 | |
TWI747325B (zh) | 目標對象匹配方法及目標對象匹配裝置、電子設備和電腦可讀儲存媒介 | |
JP2021528742A (ja) | 画像処理方法及び装置、電子機器、並びに記憶媒体 | |
JP7110412B2 (ja) | 生体検出方法及び装置、電子機器並びに記憶媒体 | |
CN111783756B (zh) | 文本识别方法及装置、电子设备和存储介质 | |
JP7152598B2 (ja) | 画像処理方法及び装置、電子機器並びに記憶媒体 | |
CN106331504B (zh) | 拍摄方法及装置 | |
JP7090183B2 (ja) | ビデオ処理方法及び装置、電子機器、並びに記憶媒体 | |
JP7152532B2 (ja) | ビデオ処理方法及び装置、電子機器並びに記憶媒体 | |
CN111340731B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
JP2021518961A (ja) | 画像生成方法および装置、電子機器並びに記憶媒体 | |
CN109934275B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
JP2021512378A (ja) | アンカー決定方法及び装置、電子機器並びに記憶媒体 | |
JP2021517747A (ja) | 画像処理方法及び装置、電子機器並びに記憶媒体 | |
CN111523346B (zh) | 图像识别方法及装置、电子设备和存储介质 | |
JP2022523243A (ja) | 画像処理方法及び装置、電子機器並びに記憶媒体 | |
JP7114811B2 (ja) | 画像処理方法及び装置、電子機器並びに記憶媒体 | |
CN110796094A (zh) | 基于图像识别的控制方法及装置、电子设备和存储介质 | |
CN109101542B (zh) | 图像识别结果输出方法及装置、电子设备和存储介质 | |
CN110633715B (zh) | 图像处理方法、网络训练方法及装置、和电子设备 | |
CN112286683A (zh) | 一种分片下载方法、装置及介质 | |
CN109447258B (zh) | 神经网络模型的优化方法及装置、电子设备和存储介质 | |
CN112598676B (zh) | 图像分割方法及装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201225 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220228 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20221011 |