JP2022508990A - 顔認識方法及び装置、電子機器、並びに記憶媒体 - Google Patents
顔認識方法及び装置、電子機器、並びに記憶媒体 Download PDFInfo
- Publication number
- JP2022508990A JP2022508990A JP2020573403A JP2020573403A JP2022508990A JP 2022508990 A JP2022508990 A JP 2022508990A JP 2020573403 A JP2020573403 A JP 2020573403A JP 2020573403 A JP2020573403 A JP 2020573403A JP 2022508990 A JP2022508990 A JP 2022508990A
- Authority
- JP
- Japan
- Prior art keywords
- feature
- face recognition
- residual
- face
- target parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 156
- 238000003860 storage Methods 0.000 title claims abstract description 33
- 238000012937 correction Methods 0.000 claims abstract description 132
- 238000012545 processing Methods 0.000 claims abstract description 106
- 238000000605 extraction Methods 0.000 claims abstract description 47
- 230000008569 process Effects 0.000 claims description 88
- 238000001994 activation Methods 0.000 claims description 54
- 230000006870 function Effects 0.000 claims description 44
- 230000004913 activation Effects 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 15
- 238000005457 optimization Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 19
- 238000012549 training Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 8
- 230000001815 facial effect Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000003068 static effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 0 CC(*)C1C*CC1 Chemical compound CC(*)C1C*CC1 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
- G06V40/171—Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
- G06F18/2193—Validation; Performance evaluation; Active pattern learning techniques based on specific statistical tests
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
Landscapes
- Engineering & Computer Science (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
- Collating Specific Patterns (AREA)
- Image Processing (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Abstract
Description
認識される第1顔画像の第1目標パラメータ値を抽出することと、
前記第1顔画像に対して特徴抽出を実行して、前記第1顔画像に対応する第1特徴を取得することと、
前記第1特徴及び前記第1目標パラメータ値を処理して、前記第1特徴に対応する第1補正特徴を取得することと、
前記第1補正特徴に基づいて、前記第1顔画像の顔認識結果を獲得することとを含む。
前記第1特徴を処理して、前記第1特徴に対応する第1残差特徴を取得することと、
前記第1残差特徴、前記第1目標パラメータ値、及び前記第1特徴を処理して、前記第1特徴に対応する第1補正特徴を取得することとを含む。
前記第1特徴に対して完全接続処理とアクティブ化処理を実行して、前記第1特徴に対応する第1残差特徴を取得することを含む。
前記第1特徴に対して1段または多段の完全接続処理とアクティブ化処理を実行して、前記第1特徴に対応する第1残差特徴を取得することを含む。
前記第1残差特徴及び前記第1目標パラメータ値に従って、前記第1特徴に対応する第1残差成分を決定することと、
前記第1残差顔及び前記第1特徴に従って、前記第1特徴に対応する第1補正特徴を決定することとを含む。
前記第1残差特徴と前記第1目標パラメータ値の正規化値との積に従って、前記第1特徴に対応する第1残差成分を取得することを含む。
前記第1残差成分と前記第1特徴の和を、前記第1特徴に対応する第1補正特徴として決定することを含む。
最適化された顔認識モデルにより前記第1特徴及び前記第1目標パラメータ値を処理することを含む。
任意の目標対象の複数の顔画像に従って、目標パラメータ条件を満たす第2顔画像及び前記目標パラメータ条件を満たさない第3顔画像を決定することと、
前記第2顔画像及び前記第3顔画像に対してそれぞれ特徴抽出を実行して、前記第2顔画像及び前記第3顔画像にそれぞれ対応する第2特徴及び第3特徴を取得することと、
前記第2特徴及び前記第3特徴に従って、損失関数を取得することと、
前記損失関数に基づいて顔認識モデルに対して逆伝播を実行して、前記最適化された顔認識モデルを取得することとを含む。
前記顔認識モデルにより前記第3特徴及び前記第3顔画像の第2目標パラメータ値を処理して、前記第3特徴に対応する第2補正特徴を取得することと、
前記第2特徴及び前記第2補正特徴に従って、損失関数を取得することとを含む。
前記顔認識モデルより前記第3特徴を処理して、前記第3特徴に対応する第2残差特徴を取得することと、
前記顔認識モデルにより前記第2残差特徴、前記第3顔画像の第2目標パラメータ値及び前記第3特徴を処理して、前記第3特徴に対応する第2補正特徴を取得することとを含む。
前記顔認識モデルにより前記第3特徴に対して完全接続処理とアクティブ化処理を実行して、前記第3特徴に対応する第2残差特徴を取得することを含む。
前記顔認識モデルにより前記第3特徴に対して1段または多段の完全接続処理とアクティブ化処理を実行して、前記第3特徴に対応する第2残差特徴を取得することを含む。
前記顔認識モデルにより、前記第2残差特徴及び前記第2目標パラメータ値に従って、前記第3特徴に対応する第2残差成分を決定することと、
前記顔認識モデルにより、前記第2残差成分及び前記第3特徴に従って、前記第3特徴に対応する第2補正特徴を決定することとを含む。
前記顔認識モデルにより、前記第2残差特徴と前記第2目標パラメータ値の正規化値との積を決定して、前記第3特徴に対応する第2残差成分を取得することを含む。
前記顔認識モデルにより、前記第2残差成分と前記第3特徴の和を前記第3特徴に対応する第2補正特徴として決定することを含む。
複数の第2顔画像が存在する場合、前記複数の第2顔画像に対してそれぞれ特徴抽出を実行して、前記複数の第2顔画像に対応する複数の第4特徴を取得することと、
前記複数の第4特徴に従って、前記第2特徴を取得することとを含む。
前記複数の第4特徴の平均値を前記第2特徴として決定することを含む。
前記第2補正特徴と前記第2特徴との差に従って、前記損失関数を決定することを含む。
認識される第1顔画像の第1目標パラメータ値を抽出するように構成される第1抽出モジュールと、
前記第1顔画像に対して特徴抽出を実行して、前記第1顔画像に対応する第1特徴を取得するように構成される第2抽出モジュールと、
前記第1特徴及び前記第1目標パラメータ値を処理して、前記第1特徴に対応する第1補正特徴を取得するように構成される処理モジュールと、
前記第1補正特徴に基づいて、前記第1顔画像の顔認識結果を獲得するように構成される獲得モジュールとを備える。
前記第1特徴を処理して、前記第1特徴に対応する第1残差特徴を獲得し、
前記第1残差特徴、前記第1目標パラメータ値、及び前記第1特徴を処理して、前記第1特徴に対応する第1補正特徴を取得するように構成される。
前記第1特徴に対して完全接続処理とアクティブ化処理を実行して、前記第1特徴に対応する第1残差特徴を獲得するように構成される。
前記第1特徴に対して1段または多段の完全接続処理とアクティブ化処理を実行して、前記第1特徴に対応する第1残差特徴を獲得するように構成される。
前記第1残差特徴及び前記第1目標パラメータ値に従って、前記第1特徴に対応する第1残差成分を決定し、
前記第1残差顔及び前記第1特徴に従って、前記第1特徴に対応する第1補正特徴を決定するように構成される。
前記第1残差特徴と前記第1目標パラメータ値の正規化値との積に従って、前記第1特徴に対応する第1残差成分を獲得するように構成される。
前記第1残差成分と前記第1特徴の和を、前記第1特徴に対応する第1補正特徴として決定するように構成される。
最適化された顔認識モデルにより前記第1特徴及び前記第1目標パラメータ値を処理するように構成される。
任意の目標対象の複数の顔画像に従って、目標パラメータ条件を満たす第2顔画像及び前記目標パラメータ条件を満たさない第3顔画像を決定するように構成される決定モジュールと、
前記第2顔画像及び前記第3顔画像に対してそれぞれ特徴抽出を実行して、前記第2顔画像及び前記第3顔画像にそれぞれ対応する第2特徴及び第3特徴を取得するように構成される第3抽出モジュールと、
前記第2特徴及び前記第3特徴に従って、損失関数を取得するように構成される取得モジュールと、
前記損失関数に基づいて顔認識モデルに対して逆伝播を実行して、前記最適化された顔認識モデルを取得するように構成される最適化モジュールとを備える。
前記顔認識モデルにより前記第3特徴及び前記第3顔画像の第2目標パラメータ値を処理して、前記第3特徴に対応する第2補正特徴を取得し、
前記第2特徴及び前記第2補正特徴に従って、損失関数を取得するように構成される。
前記顔認識モデルより前記第3特徴を処理して、前記第3特徴に対応する第2残差特徴を取得し、
前記顔認識モデルにより前記第2残差特徴、前記第3顔画像の第2目標パラメータ値及び前記第3特徴を処理して、前記第3特徴に対応する第2補正特徴を取得するように構成される。
前記顔認識モデルにより前記第3特徴に対して完全接続処理とアクティブ化処理を実行して、前記第3特徴に対応する第2残差特徴を取得するように構成される。
前記顔認識モデルにより前記第3特徴に対して1段または多段の完全接続処理とアクティブ化処理を実行して、前記第3特徴に対応する第2残差特徴を取得するように構成される。
前記顔認識モデルにより、前記第2残差特徴及び前記第2目標パラメータ値に従って、前記第3特徴に対応する第2残差成分を決定し、
前記顔認識モデルにより、前記第2残差成分及び前記第3特徴に従って、前記第3特徴に対応する第2補正特徴を決定するように構成される。
前記顔認識モデルにより、前記第2残差特徴と前記第2目標パラメータ値の正規化値との積を決定して、前記第3特徴に対応する第2残差成分を取得するように構成される。
前記顔認識モデルにより、前記第2残差成分と前記第3特徴の和を前記第3特徴に対応する第2補正特徴として決定するように構成される。
複数の第2顔画像が存在する場合、前記複数の第2顔画像に対してそれぞれ特徴抽出を実行して、前記複数の第2顔画像に対応する複数の第4特徴を取得し、
前記複数の第4特徴に従って、前記第2特徴を取得するように構成される。
前記複数の第4特徴の平均値を前記第2特徴として決定するように構成される。
前記第2補正特徴と前記第2特徴との差に従って、前記損失関数を決定するように構成される。
プロセッサと、
プロセッサ実行可能な命令を記憶するように構成されるメモリとを備え、
前記プロセッサは、上記の方法を実行するように構成される。
42 第2抽出モジュール
43 処理モジュール
44 獲得モジュール
802 処理コンポーネント
804 メモリ
806 電源コンポーネント
808 マルチメディアコンポーネント
810 オーディオコンポーネント
812 入力/出力インターフェース
814 センサコンポーネント
816 通信コンポーネント
820 プロセッサ
1922 処理コンポーネント
1926 電源コンポーネント
1932 メモリ
1950 ネットワークインターフェース
1958 入力/出力インターフェース
Claims (46)
- 顔認識方法であって、
認識される第1顔画像の第1目標パラメータ値を抽出することと、
前記第1顔画像に対して特徴抽出を実行して、前記第1顔画像に対応する第1特徴を取得することと、
前記第1特徴及び前記第1目標パラメータ値を処理して、前記第1特徴に対応する第1補正特徴を取得することと、
前記第1補正特徴に基づいて、前記第1顔画像の顔認識結果を獲得することと、を含む、前記顔認識方法。 - 前記第1特徴及び前記第1目標パラメータ値を処理して、前記第1特徴に対応する第1補正特徴を取得することは、
前記第1特徴を処理して、前記第1特徴に対応する第1残差特徴を取得することと、
前記第1残差特徴、前記第1目標パラメータ値、及び前記第1特徴を処理して、前記第1特徴に対応する第1補正特徴を取得することと、を含む、
請求項1に記載の顔認識方法。 - 前記第1特徴を処理して、前記第1特徴に対応する第1残差特徴を取得することは、
前記第1特徴に対して完全接続処理とアクティブ化処理を実行して、前記第1特徴に対応する第1残差特徴を取得することを含む、
請求項2に記載の顔認識方法。 - 前記第1特徴に対して完全接続処理とアクティブ化処理を実行して、前記第1特徴に対応する第1残差特徴を取得することは、
前記第1特徴に対して1段または多段の完全接続処理とアクティブ化処理を実行して、前記第1特徴に対応する第1残差特徴を取得することを含む、
請求項3に記載の顔認識方法。 - 前記第1特徴に対して完全接続処理を実行して取得した特徴の次元数は、前記第1特徴の次元数と同じである、
請求項3又は4に記載の顔認識方法。 - 前記第1残差特徴、前記第1目標パラメータ値、及び前記第1特徴を処理して、前記第1特徴に対応する第1補正特徴を取得することは、
前記第1残差特徴及び前記第1目標パラメータ値に従って、前記第1特徴に対応する第1残差成分を決定することと、
前記第1残差顔及び前記第1特徴に従って、前記第1特徴に対応する第1補正特徴を決定することと、を含む、
請求項2ないし5のいずれか一項に記載の顔認識方法。 - 前記第1残差特徴及び前記第1目標パラメータ値に従って、前記第1特徴に対応する第1残差成分を決定することは、
前記第1残差特徴と前記第1目標パラメータ値の正規化値との積に従って、前記第1特徴に対応する第1残差成分を取得することを含む、
請求項6に記載の顔認識方法。 - 前記第1残差成分及び前記第1特徴に従って、前記第1特徴に対応する第1補正特徴を決定することは、
前記第1残差成分と前記第1特徴の和を、前記第1特徴に対応する第1補正特徴として決定することを含む、
請求項6又は7に記載の顔認識方法。 - 目標パラメータは、顔の角度、ぼかし度合い、又は遮蔽率を含む、
請求項1ないし8のいずれか一項に記載の顔認識方法。 - 前記第1特徴及び前記第1目標パラメータ値を処理することは、
最適化された顔認識モデルにより前記第1特徴及び前記第1目標パラメータ値を処理することを含む、
請求項1ないし9のいずれか一項に記載の顔認識方法。 - 前記顔認識モデルにより前記第1特徴及び前記第1目標パラメータ値を処理する前に、前記方法は、
任意の目標対象の複数の顔画像に従って、目標パラメータ条件を満たす第2顔画像及び前記目標パラメータ条件を満たさない第3顔画像を決定することと、
前記第2顔画像及び前記第3顔画像に対してそれぞれ特徴抽出を実行して、前記第2顔画像及び前記第3顔画像にそれぞれ対応する第2特徴及び第3特徴を取得することと、
前記第2特徴及び前記第3特徴に従って、損失関数を取得することと、
前記損失関数に基づいて顔認識モデルに対して逆伝播を実行して、前記最適化された顔認識モデルを取得することと、を含む、
請求項10に記載の顔認識方法。 - 前記第2特徴及び前記第3特徴に従って、損失関数を取得することは、
前記顔認識モデルにより前記第3特徴及び前記第3顔画像の第2目標パラメータ値を処理して、前記第3特徴に対応する第2補正特徴を取得することと、
前記第2特徴及び前記第2補正特徴に従って、損失関数を取得することと、を含む、
請求項11に記載の顔認識方法。 - 前記顔認識モデルにより前記第3特徴及び前記第3顔画像の第2目標パラメータ値を処理して、前記第3特徴に対応する第2補正特徴を取得することは、
前記顔認識モデルより前記第3特徴を処理して、前記第3特徴に対応する第2残差特徴を取得することと、
前記顔認識モデルにより前記第2残差特徴、前記第3顔画像の第2目標パラメータ値、及び前記第3特徴を処理して、前記第3特徴に対応する第2補正特徴を取得することと、を含む、
請求項12に記載の顔認識方法。 - 前記顔認識モデルより前記第3特徴を処理して、前記第3特徴に対応する第2残差特徴を取得することは、
前記顔認識モデルにより前記第3特徴に対して完全接続処理とアクティブ化処理を実行して、前記第3特徴に対応する第2残差特徴を取得することを含む、
請求項13に記載の顔認識方法。 - 前記顔認識モデルにより前記第3特徴に対して完全接続処理とアクティブ化処理を実行して、前記第3特徴に対応する第2残差特徴を取得することは、
前記顔認識モデルにより前記第3特徴に対して1段または多段の完全接続処理とアクティブ化処理を実行して、前記第3特徴に対応する第2残差特徴を取得することを含む、
請求項14に記載の顔認識方法。 - 前記第3特徴に対して完全接続処理を実行して取得した特徴の次元数は、前記第3特徴の次元数と同じである、
請求項14又は15に記載の顔認識方法。 - 前記顔認識モデルにより前記第2残差特徴、前記第3顔画像の第2目標パラメータ値及び前記第3特徴を処理して、前記第3特徴に対応する第2補正特徴を取得することは、
前記顔認識モデルにより、前記第2残差特徴及び前記第2目標パラメータ値に従って、前記第3特徴に対応する第2残差成分を決定することと、
前記顔認識モデルにより、前記第2残差成分及び前記第3特徴に従って、前記第3特徴に対応する第2補正特徴を決定することと、を含む、
請求項12ないし16のいずれか一項に記載の顔認識方法。 - 前記顔認識モデルにより、前記第2残差特徴及び前記第2目標パラメータ値に従って、前記第3特徴に対応する第2残差成分を決定することは、
前記顔認識モデルにより、前記第2残差特徴と前記第2目標パラメータ値の正規化値との積を決定して、前記第3特徴に対応する第2残差成分を取得することを含む、
請求項17に記載の顔認識方法。 - 前記顔認識モデルにより、前記第2残差成分及び前記第3特徴に従って、前記第3特徴に対応する第2補正特徴を決定することは、
前記顔認識モデルにより、前記第2残差成分と前記第3特徴の和を前記第3特徴に対応する第2補正特徴として決定することを含む、
請求項17又は18に記載の顔認識方法。 - 前記第2顔画像及び前記第3顔画像に対してそれぞれ特徴抽出を実行して、前記第2顔画像及び前記第3顔画像にそれぞれ対応する第2特徴及び第3特徴を取得することは、
複数の第2顔画像が存在する場合、前記複数の第2顔画像に対してそれぞれ特徴抽出を実行して、前記複数の第2顔画像に対応する複数の第4特徴を取得することと、
前記複数の第4特徴に従って、前記第2特徴を取得することと、を含む、
請求項11ないし19のいずれか一項に記載の顔認識方法。 - 前記複数の第4特徴に従って、前記第2特徴を取得することは、
前記複数の第4特徴の平均値を前記第2特徴として決定することを含む、
請求項20に記載の顔認識方法。 - 前記第2特徴及び前記第2補正特徴に従って、損失関数を取得することは、
前記第2補正特徴と前記第2特徴との差に従って、前記損失関数を決定することを含む、
請求項12ないし19のいずれか一項に記載の顔認識方法。 - 顔認識装置であって、
認識される第1顔画像の第1目標パラメータ値を抽出するように構成される第1抽出モジュールと、
前記第1顔画像に対して特徴抽出を実行して、前記第1顔画像に対応する第1特徴を取得するように構成される第2抽出モジュールと、
前記第1特徴及び前記第1目標パラメータ値を処理して、前記第1特徴に対応する第1補正特徴を取得するように構成される処理モジュールと、
前記第1補正特徴に基づいて、前記第1顔画像の顔認識結果を獲得するように構成される獲得モジュールと、を備える、前記顔認識装置。 - 前記獲得モジュールは、
前記第1特徴を処理して、前記第1特徴に対応する第1残差特徴を獲得し、
前記第1残差特徴、前記第1目標パラメータ値、及び前記第1特徴を処理して、前記第1特徴に対応する第1補正特徴を取得するように構成される、
請求項23に記載の顔認識装置。 - 前記獲得モジュールは、
前記第1特徴に対して完全接続処理とアクティブ化処理を実行して、前記第1特徴に対応する第1残差特徴を獲得するように構成される、
請求項24に記載の顔認識装置。 - 前記獲得モジュールは、
前記第1特徴に対して1段または多段の完全接続処理とアクティブ化処理を実行して、前記第1特徴に対応する第1残差特徴を獲得するように構成される、
請求項25に記載の顔認識装置。 - 前記第1特徴に対して完全接続処理を実行して取得した特徴の次元数は、前記第1特徴の次元数と同じである、
請求項25又は26に記載の顔認識装置。 - 前記獲得モジュールは、
前記第1残差特徴及び前記第1目標パラメータ値に従って、前記第1特徴に対応する第1残差成分を決定し、
前記第1残差顔及び前記第1特徴に従って、前記第1特徴に対応する第1補正特徴を決定するように構成される、
請求項24ないし27のいずれか一項に記載の顔認識装置。 - 前記獲得モジュールは、
前記第1残差特徴と前記第1目標パラメータ値の正規化値との積に従って、前記第1特徴に対応する第1残差成分を獲得するように構成される、
請求項28に記載の顔認識装置。 - 前記獲得モジュールは、
前記第1残差成分と前記第1特徴の和を、前記第1特徴に対応する第1補正特徴として決定するように構成される、
請求項28又は29に記載の顔認識装置。 - 目標パラメータは、顔の角度、ぼかし度合い、又は遮蔽率を含む、
請求項23ないし30のいずれか一項に記載の顔認識装置。 - 前記処理モジュールは、
最適化された顔認識モデルにより前記第1特徴及び前記第1目標パラメータ値を処理するように構成される、
請求項23ないし31のいずれか一項に記載の顔認識装置。 - 前記装置は、
任意の目標対象の複数の顔画像に従って、目標パラメータ条件を満たす第2顔画像及び前記目標パラメータ条件を満たさない第3顔画像を決定するように構成される決定モジュールと、
前記第2顔画像及び前記第3顔画像に対してそれぞれ特徴抽出を実行して、前記第2顔画像及び前記第3顔画像にそれぞれ対応する第2特徴及び第3特徴を取得するように構成される第3抽出モジュールと、
前記第2特徴及び前記第3特徴に従って、損失関数を取得するように構成される取得モジュールと、
前記損失関数に基づいて顔認識モデルに対して逆伝播を実行して、前記最適化された顔認識モデルを取得するように構成される最適化モジュールと、をさらに備える、
請求項32に記載の顔認識装置。 - 前記取得モジュールは、
前記顔認識モデルにより前記第3特徴及び前記第3顔画像の第2目標パラメータ値を処理して、前記第3特徴に対応する第2補正特徴を取得し、
前記第2特徴及び前記第2補正特徴に従って、損失関数を取得するように構成される、
請求項33に記載の顔認識装置。 - 前記取得モジュールは、
前記顔認識モデルより前記第3特徴を処理して、前記第3特徴に対応する第2残差特徴を取得し、
前記顔認識モデルにより前記第2残差特徴、前記第3顔画像の第2目標パラメータ値及び前記第3特徴を処理して、前記第3特徴に対応する第2補正特徴を取得するように構成される、
請求項34に記載の顔認識装置。 - 前記取得モジュールは、
前記顔認識モデルにより前記第3特徴に対して完全接続処理とアクティブ化処理を実行して、前記第3特徴に対応する第2残差特徴を取得するように構成される、
請求項35に記載の顔認識装置。 - 前記取得モジュールは、
前記顔認識モデルにより前記第3特徴に対して1段または多段の完全接続処理とアクティブ化処理を実行して、前記第3特徴に対応する第2残差特徴を取得するように構成される、
請求項36に記載の顔認識装置。 - 前記第3特徴に対して完全接続処理を実行して取得した特徴の次元数は、前記第3特徴の次元数と同じである、
請求項36又は37に記載の顔認識装置。 - 前記取得モジュールは、
前記顔認識モデルにより、前記第2残差特徴及び前記第2目標パラメータ値に従って、前記第3特徴に対応する第2残差成分を決定し、
前記顔認識モデルにより、前記第2残差成分及び前記第3特徴に従って、前記第3特徴に対応する第2補正特徴を決定するように構成される、
請求項34ないし38のいずれか一項に記載の顔認識装置。 - 前記取得モジュールは、
前記顔認識モデルにより、前記第2残差特徴と前記第2目標パラメータ値の正規化値との積を決定して、前記第3特徴に対応する第2残差成分を取得するように構成される、
請求項39に記載の顔認識装置。 - 前記取得モジュールは、
前記顔認識モデルにより、前記第2残差成分と前記第3特徴の和を前記第3特徴に対応する第2補正特徴として決定するように構成される、
請求項39又は40に記載の顔認識装置。 - 前記第3抽出モジュールは、
複数の第2顔画像が存在する場合、前記複数の第2顔画像に対してそれぞれ特徴抽出を実行して、前記複数の第2顔画像に対応する複数の第4特徴を取得し、
前記複数の第4特徴に従って、前記第2特徴を取得するように構成される、
請求項33ないし41のいずれか一項に記載の顔認識装置。 - 前記第3抽出モジュールは、
前記複数の第4特徴の平均値を前記第2特徴として決定するように構成される、
請求項42に記載の顔認識装置。 - 前記取得モジュールは、
前記第2補正特徴と前記第2特徴との差に従って、前記損失関数を決定するように構成される、
請求項34ないし41のいずれか一項に記載の顔認識装置。 - 電子機器であって、
プロセッサと、
プロセッサ実行可能な命令を記憶するように構成されるメモリと、を備え、
前記プロセッサは、請求項1ないし22のいずれか一項に記載の方法を実行するように構成される、前記電子機器。 - コンピュータプログラム命令が記憶された、コンピュータ可読記憶媒体であって、前記コンピュータプログラム命令がプロセッサによって実行される時に、請求項1ないし22のいずれか一項に記載の方法を実現するように構成される、前記コンピュータ可読記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911053929.XA CN110826463B (zh) | 2019-10-31 | 2019-10-31 | 人脸识别方法及装置、电子设备和存储介质 |
CN201911053929.X | 2019-10-31 | ||
PCT/CN2020/088384 WO2021082381A1 (zh) | 2019-10-31 | 2020-04-30 | 人脸识别方法及装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022508990A true JP2022508990A (ja) | 2022-01-20 |
JP7150896B2 JP7150896B2 (ja) | 2022-10-11 |
Family
ID=69551816
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020573403A Active JP7150896B2 (ja) | 2019-10-31 | 2020-04-30 | 顔認識方法及び装置、電子機器、並びに記憶媒体 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20210326578A1 (ja) |
JP (1) | JP7150896B2 (ja) |
KR (1) | KR20210054522A (ja) |
CN (1) | CN110826463B (ja) |
SG (1) | SG11202107252WA (ja) |
TW (1) | TWI770531B (ja) |
WO (1) | WO2021082381A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110826463B (zh) * | 2019-10-31 | 2021-08-24 | 深圳市商汤科技有限公司 | 人脸识别方法及装置、电子设备和存储介质 |
CN112101216A (zh) * | 2020-09-15 | 2020-12-18 | 百度在线网络技术(北京)有限公司 | 人脸识别方法、装置、设备及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108229313A (zh) * | 2017-11-28 | 2018-06-29 | 北京市商汤科技开发有限公司 | 人脸识别方法和装置、电子设备和计算机程序及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101475684B1 (ko) * | 2008-10-17 | 2014-12-23 | 삼성전자주식회사 | 디지털 영상 처리기에서 얼굴 영상 개선 장치 및 방법 |
CN106980831A (zh) * | 2017-03-17 | 2017-07-25 | 中国人民解放军国防科学技术大学 | 基于自编码器的自亲缘关系识别方法 |
CN109753920B (zh) * | 2018-12-29 | 2021-09-17 | 深圳市商汤科技有限公司 | 一种行人识别方法及装置 |
CN110163169A (zh) * | 2019-05-27 | 2019-08-23 | 北京达佳互联信息技术有限公司 | 人脸识别方法、装置、电子设备及存储介质 |
CN110826463B (zh) * | 2019-10-31 | 2021-08-24 | 深圳市商汤科技有限公司 | 人脸识别方法及装置、电子设备和存储介质 |
-
2019
- 2019-10-31 CN CN201911053929.XA patent/CN110826463B/zh active Active
-
2020
- 2020-04-30 WO PCT/CN2020/088384 patent/WO2021082381A1/zh active Application Filing
- 2020-04-30 KR KR1020217006942A patent/KR20210054522A/ko unknown
- 2020-04-30 JP JP2020573403A patent/JP7150896B2/ja active Active
- 2020-04-30 SG SG11202107252WA patent/SG11202107252WA/en unknown
- 2020-06-17 TW TW109120373A patent/TWI770531B/zh active
-
2021
- 2021-06-30 US US17/363,074 patent/US20210326578A1/en not_active Abandoned
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108229313A (zh) * | 2017-11-28 | 2018-06-29 | 北京市商汤科技开发有限公司 | 人脸识别方法和装置、电子设备和计算机程序及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP7150896B2 (ja) | 2022-10-11 |
US20210326578A1 (en) | 2021-10-21 |
WO2021082381A1 (zh) | 2021-05-06 |
TW202119281A (zh) | 2021-05-16 |
SG11202107252WA (en) | 2021-07-29 |
CN110826463B (zh) | 2021-08-24 |
KR20210054522A (ko) | 2021-05-13 |
TWI770531B (zh) | 2022-07-11 |
CN110826463A (zh) | 2020-02-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11532180B2 (en) | Image processing method and device and storage medium | |
CN110647834B (zh) | 人脸和人手关联检测方法及装置、电子设备和存储介质 | |
JP6986167B2 (ja) | 画像生成方法および装置、電子機器並びに記憶媒体 | |
CN109800737B (zh) | 面部识别方法及装置、电子设备和存储介质 | |
CN109522910B (zh) | 关键点检测方法及装置、电子设备和存储介质 | |
TWI766286B (zh) | 圖像處理方法及圖像處理裝置、電子設備和電腦可讀儲存媒介 | |
CN110889469B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN107692997B (zh) | 心率检测方法及装置 | |
CN109934275B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
KR20210065178A (ko) | 생체 검출 방법 및 장치, 전자 기기 및 저장 매체 | |
KR20210065180A (ko) | 이미지 처리 방법과 장치, 전자 기기 및 저장매체 | |
JP7098763B2 (ja) | 画像処理方法及び装置、電子機器、並びに記憶媒体 | |
WO2022247103A1 (zh) | 图像处理方法及装置、电子设备和计算机可读存储介质 | |
TW202032425A (zh) | 圖像處理方法及裝置、電子設備和儲存介質 | |
US20220188982A1 (en) | Image reconstruction method and device, electronic device, and storage medium | |
JP2022508990A (ja) | 顔認識方法及び装置、電子機器、並びに記憶媒体 | |
CN109447258B (zh) | 神经网络模型的优化方法及装置、电子设备和存储介质 | |
CN108984628B (zh) | 内容描述生成模型的损失值获取方法及装置 | |
CN110659625A (zh) | 物体识别网络的训练方法及装置、电子设备和存储介质 | |
CN113689362B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN112651880B (zh) | 视频数据处理方法及装置、电子设备和存储介质 | |
US20220294989A1 (en) | Method and apparatus for processing image | |
KR102374400B1 (ko) | 이미지 처리 방법 및 장치, 전자 기기와 저장 매체 | |
CN107992893B (zh) | 压缩图像特征空间的方法及装置 | |
CN111369456B (zh) | 图像去噪方法及装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201228 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220221 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220510 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220829 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220928 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7150896 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |