JP7289012B2

JP7289012B2 - ラベル付けされていない顔データにわたるクラスタリングに基づく深層顔認識

Info

Publication number: JP7289012B2
Application number: JP2022513896A
Authority: JP
Inventors: シアンユ、; マンモハンチャンドラカー、; キヒョクソン、; アルニロイチョウデュリー、
Original assignee: NEC Laboratories America Inc
Current assignee: NEC Laboratories America Inc
Priority date: 2019-11-13
Filing date: 2020-11-09
Publication date: 2023-06-08
Anticipated expiration: 2040-11-09
Also published as: WO2021096799A1; US11600113B2; DE112020005572T5; US20210142046A1; JP2022547003A

Description

関連出願情報
本出願は、２０１９年１１月１３日に出願された仮出願第６２／９３４，６１７号、および２０２０年１１月６日に出願された米国特許出願第１７／０９１，０６６号の優先権を主張し、その全体が参照により本明細書に組み込まれる。

本発明は、人工知能および機械学習に関し、より詳細には、深層顔認識に関する。
関連技術の説明

深層顔認識のような顔認識は、小さな識別内距離および大きな識別間距離を有する特徴空間に入力画像をマッピングしようとする。深層顔認識は、高性能を達成し、大規模なラベル付けされたデータから恩恵を受けている。顔認識性能に対するさらなる改善は、ラベル付けされたデータセットボリュームをさらに拡大することを必要とする注釈努力の増加を介して達成することができ、これは、非実用的であり、労働集約的であり得る。

本発明の一態様によれば、顔認識を実施するためにコンピュータで実施する方法が提供される。コンピュータ実装方法は、ラベル付けされた顔データ上で訓練された顔認識モデルを取得することと、確率分布の混合を使用して、ラベル付けされていない顔データに対応する複数のラベル付けされていない顔を、前記ラベル付けされた顔データ内のものと重複するアイデンティティを含む１つまたは複数の重複するラベル付けされていない顔のセットと、前記ラベル付けされた顔データ内のものと互いに素なアイデンティティを含む１つまたは複数の互いに素なラベル付けされていない顔のセットとに分離することと、１つまたは複数の擬似ラベル付けされたサンプルを取得するためにクラスタ割り当てに対応する擬似ラベルを前記１つまたは複数の互いに素なラベル付けされていない顔のそれぞれに割り当てることを含む、グラフ畳み込みネットワークを使用して１つまたは複数のクラスタ割り当てを生成するために前記１つまたは複数の互いに素なラベル付けされていない顔をクラスタリングすることと、前記１つまたは複数のクラスタ割り当てに関連するクラスタリング不確実性を生成することと、前記クラスタリング不確実性を組み込むことによって顔認識性能を改善するために、前記ラベル付けされた顔データおよび前記ラベル付けされていない顔データ上で前記顔認識モデルを再訓練することとを含む。

本発明の別の態様によれば、顔認識を実施するためのシステムが提供される。システムは、プログラムコードを記憶するメモリ装置と、メモリ装置と動作可能に結合された少なくとも１つのプロセッサ装置とを含む。少なくとも１つのプロセッサ装置は、ラベル付けされた顔データ上で訓練された顔認識モデルを取得し、確率分布の混合を使用して、ラベル付けされていない顔データに対応する複数のラベル付けされていない顔を、前記ラベル付けされた顔データ内のものと重複するアイデンティティを含む１つまたは複数の重複するラベル付けされていない顔のセットと、前記ラベル付けされた顔データ内のものと互いに素なアイデンティティを含む１つまたは複数の互いに素なラベル付けされていない顔のセットとに分離し、１つまたは複数の擬似ラベル付けされたサンプルを取得するためにクラスタ割り当てに対応する擬似ラベルを前記１つまたは複数の互いに素なラベル付けされていない顔のそれぞれに割り当てることによって、グラフ畳み込みネットワークを使用して１つまたは複数のクラスタ割り当てを生成するために前記１つまたは複数の互いに素なラベル付けされていない顔をクラスタリングし、前記１つまたは複数のクラスタ割り当てに関連するクラスタリング不確実性を生成し、前記クラスタリング不確実性を組み込むことによって顔認識性能を改善するために、前記ラベル付けされた顔データおよび前記ラベル付けされていない顔データ上で前記顔認識モデルを再訓練するように構成される。

これらおよび他の特徴および利点は、添付の図面に関連して読まれるべき、その例示的な実施形態の以下の詳細な説明から明らかになるであろう。

本開示は、以下の図面を参照して、好ましい実施形態の以下の説明において詳細を提供する。

本発明の一実施形態による、顔認識フレームワークの高レベルの概念を示す図である。

本発明の一実施形態による、図１の顔認識フレームワークの再訓練構成要素を示す図である。

本発明の一実施形態による、ラベル付けされていない顔データに基づいて顔認識を実施するための例示的な環境を示すブロック／フロー図である。

本発明の一実施形態による、顔認識を実施するためのシステム／方法を示すブロック／フロー図である。

本発明の一実施形態による、コンピュータシステムを示すブロック／フロー図である。

本発明の実施形態によれば、ラベル付けされていない顔データにわたるクラスタリングに基づいた深層顔認識のためのシステムおよび方法が提供される。より具体的には、ラベル付けされた顔（例えば、大規模なラベル付けされたデータセット）上で訓練された深層顔認識モデルが与えられると、本明細書で説明される実施形態は、さらなる訓練サンプルのためのラベル付けされていない顔データ上のクラスタリングを利用して、深層顔認識性能をさらに改善することができる。本明細書で説明される実施形態は、例えば、ラベル付けされたデータとラベル付けされていないデータとの間の重なり合うアイデンティティ、ならびに擬似ラベル付けされたデータに対する訓練時のノイズの多いラベルの影響を減衰させることなどの現実世界の課題に対処することができる。例えば、重複するアイデンティティは、Ｗｅｉｂｕｌｌ分布の混合でパラメータ化された分布外検出問題として問題を定式化することによって、極値理論に基づく問題として扱うことができる。クラスタリング手順によって導入されたラベルノイズを補償するために、クラスタ割り当ての不確実性をモデル化し、深層顔認識ネットワークの再訓練に組み込むことができる。

本明細書に記載する実施形態は、完全にハードウェアであってもよく、完全にソフトウェアであってもよく、または、ハードウェアおよびソフトウェア要素の両方を含むものであってもよい。好ましい実施形態では、本発明は、ファームウェア、常駐ソフトウェア、マイクロコードなどを含むが、これらに限定されないソフトウェアで実施される。

実施形態は、コンピュータまたは任意の命令実行システムによって、またはそれに関連して使用するためのプログラムコードを提供する、コンピュータ使用可能またはコンピュータ可読媒体からアクセス可能なコンピュータプログラム製品を含むことができる。コンピュータ使用可能媒体またはコンピュータ可読媒体は、命令実行システム、装置、またはデバイスによって、またはそれに関連して使用するためのプログラムを格納、通信、伝搬、またはトランスポートする任意の装置を含むことができる。媒体は、磁気、光学、電子、電磁気、赤外線、または半導体システム（または装置またはデバイス）、または伝搬媒体とすることができる。媒体は、半導体または固体ステートメモリ、磁気テープ、リムーバブルコンピュータディスケット、ランダムアクセスメモリ（ＲＡＭ）、リードオンリーメモリ（ＲＯＭ）、リジッド磁気ディスクおよび光ディスクなどのコンピュータ読み取り可能な記憶媒体を含むことができる。

各コンピュータプログラムは、本明細書に記載する手順を実行するために、記憶媒体または装置がコンピュータによって読み取られるときに、コンピュータの操作を構成し制御するために、汎用または特殊目的のプログラム可能コンピュータによって読み取り可能な、機械読み取り可能な記憶媒体または装置（例えば、プログラムメモリまたは磁気ディスク）に実体的に記憶することができる。本発明のシステムはまた、コンピュータプログラムで構成された、コンピュータ読み取り可能な記憶媒体で実施されるものと考えることができ、その場合、構成された記憶媒体は、コンピュータを特定の所定の方法で動作させて、本明細書に記載する機能を実行させる。

プログラムコードを記憶および／または実行するのに適したデータ処理システムは、システムバスを介してメモリ要素に直接的または間接的に結合された少なくとも１つのプロセッサを含んでもよい。メモリ要素は、プログラムコードの実際の実行中に採用されるローカルメモリ、バルクストレージ、および実行中にバルクストレージからコードが検索される回数を減らすために少なくとも何らかのプログラムコードの一時記憶を提供するキャッシュメモリを含むことができる。入力／出力またはＩ／Ｏ装置（キーボード、ディスプレイ、ポインティング装置などを含むが、これらに限定されない）は、直接または介在するＩ／Ｏコントローラを介してシステムに結合され得る。

介在する専用ネットワークまたは公衆ネットワークを介して、データ処理システムを他のデータ処理システムあるいはリモートプリンタまたはストレージデバイスに結合できるようにするために、ネットワークアダプタをシステムに結合することもできる。モデム、ケーブルモデム、およびイーサネット（登録商標）カードは、現在使用可能なネットワークアダプタのタイプの一例に過ぎない。

本明細書で採用されるように、「ハードウェアプロセッササブシステム」または「ハードウェアプロセッサ」という用語は、１つ以上の特定のタスクを実行するために協働するプロセッサ、メモリ、ソフトウェアまたはそれらの組み合わせを指すことができる。有用な実施形態では、ハードウェアプロセッササブシステムは、１つまたは複数のデータ処理要素（例えば、論理回路、処理回路、命令実行デバイスなど）を含むことができる。１つまたは複数のデータ処理要素は、中央処理ユニット、画像処理ユニットおよび／または別個のプロセッサまたはコンピューティング要素ベースのコントローラ（たとえば、論理ゲートなど）に含めることができる。ハードウェアプロセッササブシステムは、１つ以上のオンボードメモリ（例えば、キャッシュ、専用メモリアレイ、読み出し専用メモリなど）を含むことができる。いくつかの実施形態では、ハードウェアプロセッササブシステムは、オンボードまたはオフボードにすることができるか、またはハードウェアプロセッササブシステム（例えば、ＲＯＭ、ＲＡＭ、基本入出力システム（ＢＩＯＳ）など）によって使用するために専用にすることができる１つ以上のメモリを含むことができる。

ある実施形態では、ハードウェアプロセッササブシステムは、１つ以上のソフトウェア要素を含むことができ、実行することができる。１つ以上のソフトウェア要素は、特定の結果を達成するために、オペレーティングシステムおよび／または１つ以上のアプリケーションおよび／または特定のコードを含むことができる。

他の実施形態では、ハードウェアプロセッササブシステムは、指定された結果を達成するために１つまたは複数の電子処理機能を実行する専用の専用回路を含むことができる。そのような回路は、１つまたは複数のアプリケーション専用集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、および／またはプログラマブルロジックアレイ（ＰＬＡ）を含むことができる。

ハードウェアプロセッササブシステムのこれらおよび他の変形もまた、本発明の実施形態に従って企図される。

ここで、同一の数字が同一または類似の要素を表し、最初に図１を参照すると、顔認識フレームワーク１００の一例を示す高レベルのブロック／フロー図が提供される。以下でさらに詳細に説明するように、フレームワーク１００は、ラベル付けされていない顔画像をクラスタリングし、追加のラベル付けされていないデータ上の擬似ラベルとしてクラスタ割当てを使用してラベル付けされた顔画像とラベル付けされていない顔画像との両方に対して再訓練することによって、教師あり顔認識モデルの訓練および性能を改善するように構成される。

図示のように、フレームワーク１００は、ラベル付けされた顔訓練器１１０と、ラベル付けされていない顔分離器１２０と、ラベル付けされていない顔クラスタリング構成要素１３０と、クラスタリング不確実性推定器１４０と、再訓練構成要素１５０とを含む複数の構成要素を含む。

ラベル付けされた顔訓練器１１０は、１組のラベル付けされた顔画像１１２を受信し、訓練損失（「損失」）１１６を生成するニューラルネットワーク（ＮＮ）１１４を訓練するように構成される。一実施形態では、ＮＮ１１４は、深層ニューラルネットワークとすることができる。この実施形態では、ＮＮ１１４は、ラベル付けされた顔画像１１２のセット上で、ベースラインとして全教師あり方式で訓練することができる。例えば、ラベル付けされた顔画像１１２のセットは、大規模なラベル付けされたデータセットを含むことができる。一実施形態では、ラベル付けされた顔画像１１２のセットは、人間の顔画像を含むことができる。しかしながら、そのような実施形態は、限定的であると考えられるべきではなく、本明細書で説明される実施形態は、任意の適切な顔画像に関して顔認識訓練を実行するために適用され得る。したがって、ラベル付けされた顔訓練器１１０によって実行される訓練は、半教師あり顔認識訓練とすることができる。

一般に、ラベル付けされていないデータの収集に対する制御はないため、ラベル付けされたデータ（したがって、ベースライン顔認識エンジンが訓練されるクラス）およびラベル付けされていないデータ内に同じ被写体Ｓが存在することがある。すなわち、ラベル付けされていない顔画像は、ラベル付けされた顔画像１１２のセット内に既に存在するアイデンティティ（ＩＤ）を含んでもよい。以下にさらに詳細に説明するように、ラベル付けされていない顔画像はクラスタ化することができ、クラスタ割り当ては、ラベル付けされていない顔画像のそれぞれの１つに「擬似ラベル」として割り当てられる。デフォルトでは、クラスタリングは、ラベル付けされていないデータ内の被写体Ｓの画像を新しいカテゴリとして割り当てることができる。この場合、追加の擬似ラベル付けされたデータを用いて再訓練すると、ネットワークは、被写体Ｓの画像を２つのカテゴリに分類することを誤って学習する可能性がある。これは、重複する被写体が、インターネットから収集された、または受動的に取り付けられた画像キャプチャ装置（例えば、カメラ）を介して記録されたデータセットにおいて自然に発生し得るので、重要な考慮事項である。

少なくともこれらの問題に対処するために、ラベル付けされていない顔画像分離器１２０は、ラベル付けされていない顔画像１２２のセットを、ラベル付けされた顔画像とラベル付けされていない顔画像（「重複するＩＤ」）１２４との間の重複するＩＤまたはクラスを持つ顔画像と、ラベル付けされた顔画像とラベル付けされていない顔画像（「互いに素なＩＤ」）１２６との間の互いに素なＩＤまたはクラスを持つ顔画像のセットとに分離するように構成される。

ラベル付けされていない顔画像分離器１２０によって解決される分離問題は、「分布外検出問題」とみなすことができ、重複するアイデンティティを有するラベル付けされていない顔画像は、同じラベル付けされたデータが顔認識エンジンを訓練するために使用されるため、顔認識エンジンから高い信頼スコアを有することになるという直観を伴う。数千カテゴリにわたるソフトマックス操作は、正規化のために小さな値をもたらすことができるため、各ラベル付けされていない顔画像の最大ロジット（「ｍａｘ－ｌｏｇｉｔ」）を、その対応する信頼スコアとして使用することができる。したがって、互いに素なＩＤと重複するＩＤとを分離することができる信頼スコアのしきい値が探索される。多数のクラスにわたる最大値を扱うことができるため、極値理論（ＥＶＴ）からの結果を利用することができる。Ｆｉｓｈｅｒ－Ｔｉｐｐｅｔの定理は、極値定理とも呼ばれ、独立で同一分布に従う（ｉ．ｉ．ｄ．）確率変数の極大値の極限分布が、Ｇｕｍｂｅｌ分布、Ｆｒｅｃｈｅｔ分布、またはＷｅｉｂｕｌｌ分布のいずれかに対応する極値分布に収束することを提供する。極値分布の混合（例えば、Ｗｅｉｂｕｌｌ分布）を使用して、ラベル付けされていない顔画像１２２のセットから、重複するＩＤ１２４のセットおよび互いに素なＩＤ１２６のセットのオンザフライ分離を実行することができる。

例示的な例として、最大ロジットは、以下のようにＷｅｉｂｕｌｌ分布を使用してモデル化することができる。

ここで、κ＞０は形状パラメータを示し、λ＞０はスケールパラメータを示す。最大ロジットスコアの分布に関する初期閾値を得ることができる。例えば、Ｏｔｓｕの方法は、最大ロジットスコアの分布に関する初期閾値を得るために、自動画像閾値化を実行するために使用され得る。しかしながら、本明細書に記載の実施形態によれば、任意の適切な画像閾値化方法を使用することができる。それから、Ｗｅｉｂｕｌｌ分布の２成分混合を適合させ、分布の上部と下部に初期化し、それによって重複クラスと互いに素なクラスとをそれぞれモデル化することができる。各Ｗｅｉｂｕｌｌモデルの下で９５％信頼度に対応する値を選択することにより、２つのしきい値、すなわち、１つは互いに素なサンプル用であり、１つは重複サンプル用であり、別々に高い信頼度である閾値が提供される。次に、この間隔外にあるサンプルは拒絶される。このアプローチは、いかなるハイパーパラメータを先験的に設定することも必要とせず、いかなる新しいラベル付けされていないデータセットにも適用することができる。

ラベル付けされていない顔画像１２２のセットの画像が分離されたため、ラベル付けされていない顔画像クラスタリング構成要素１３０は、それぞれのクラスタ割り当てを有するクラスタ化された（ラベル付けされていない）顔画像１３２のセットを生成するために、互いに素なＩＤ１２６のセットのラベル付けされていない顔画像をクラスタ化するように構成される。クラスタ割り当ては、ラベル付けされていない顔画像に割り当てられた「擬似ラベル」または「擬似ＩＤ」と見なすことができる。以下でさらに詳細に説明するように、追加のラベル付けされていない顔画像に対応するクラスタ割り当て／擬似ラベルは、顔認識ネットワークの再訓練中に組み込まれる。

一実施形態では、ラベル付けされていない顔画像クラスタリング構成要素１３０は、ラベル付けされていない顔画像をクラスタリングするためにグラフ畳み込みネットワーク（ＧＣＮ）を実装するように構成することができる。より具体的には、クラスタリングは、擬似ラベルを使用する大規模顔クラスタリングのためにＧＣＮを活用することができる。例えば、ラベル付けされていない顔画像クラスタリング構成要素１３０は、Ｆａｃｅ－ＧＣＮを実装するように構成することができる。事前訓練された顔認識エンジンから抽出された特徴に基づいて、Ｆａｃｅ－ＧＣＮは、親和性測度としてＥｕｃｌｉｄｅａｎ距離を使用することができる、全サンプルにわたる最近傍グラフを構築することができる。このグラフのエッジ重みに様々な閾値を設定することによって、１組の連結成分またはクラスタ提案が生成される。訓練中、目的は、単一のグラウンドトゥルースアイデンティティから生じる提案の正確さおよび想起を回帰させることである。提案は、ラベル付けされた顔画像に基づいて生成されるため、Ｆａｃｅ－ＧＣＮは、完全な教師ありの方法で訓練することができる。これは、通常、各ノードまたは入力グラフ全体のいずれかの分類損失で訓練されるＧＣＮの通常の訓練とは異なる。テスト中、オブジェクト検出における非最大抑圧に類似した「重複排除」手順は、ラベル付けされていないデータセットをクラスタのセットに分割するために、提案のための予測ＧＣＮスコアを使用することができる。

ノイズの多い訓練ラベルは、ラベル付けされていない顔画像クラスタリング構成要素１３０によって生成された不正確なクラスタリング割り当てから生じる可能性がある。例えば、ジョージ・Ｈ・Ｗ・ブッシュ元米国大統領の写真は、彼の息子とジョージ・Ｈ・ブッシュ元米国大統領との顔写真のクラスタに誤って割り当てられることがある。このようなラベルノイズは、顔認識性能劣化の源となり得る。

クラスタリング手順によって導入されたラベルノイズを補償し、従って顔認識性能を改善するために、クラスタリング不確実性推定器１４０は、教師なしラベルノイズ推定に対応するクラスタリング不確実性（「クラスタリング不確実性」）１４２の推定値を生成するために、不正確なクラスタ割り当てを推定するように構成される。クラスタリング不確実性１４２は、ノイズの多いラベル付けされたデータによって引き起こされる誤った勾配の影響を低減するために訓練損失を重み付けすることによって、顔認識ネットワークの再訓練に組み込まれる。クラスタリング不確定性１４２は、訓練カリキュラムを学習するためにクリーンなラベル付けされたデータセットを必要とせず、したがって、すぐに適用することができる。

再訓練構成要素１５０は、ラベル付けされた顔画像１１２のセット、クラスタ化された顔画像１３２のセットに対応する擬似ラベル付けされた顔画像、およびクラスタリング不確実性１４２に基づいて、顔認識モデルを再訓練するように構成される。ラベル付けされたおよび擬似ラベル付けされたデータを再訓練するとき、擬似ラベル付けされた顔画像が正しくラベル付けされたかどうかの不確実性を組み込むことができる。

再訓練構成要素１５０に関するさらなる詳細を、図２を参照して以下に説明する。

ここで図２を参照すると、例示的な再訓練構成要素２００を示すブロック／フロー図が提供されている。例えば、再訓練構成要素２００は、図１の再訓練構成要素１５０として実施することができる。

図示のように、ラベル付けされた顔画像２１０のセットおよびクラスタ化された顔画像２２０のセットは、ニューラルネットワーク（ＮＮ）２３０に供給される。これらは、図１のラベル付けされた顔画像１１２のセット、クラスタ化された顔画像１２のセット、およびＮＮ１１４にそれぞれ類似する。ラベル付けされた顔画像２１０のセットとクラスタ化された顔画像２２０のセットの擬似ラベル付けされた顔画像との和集合上で元の顔認識モデルを再訓練することにより、顔認識性能を改善することができる。

クラスタリング不確実性２４０（図１のクラスタリング不確実性１４２と同様）を使用することによって訓練を減衰させることができる場合、ノイズの多いラベルの影響に関連する訓練損失は、重み付き損失２５０を生成する。具体的には、重み付き損失２５０は、重み付き訓練損失に対応する。したがって、クラスタリング不確実性２４０を組み込むことにより、再訓練手順を円滑にすることができ、したがって、顔認識性能をさらに改善することができる。

図１および図２を参照して上述したフレームワークの例示的な例として、

のように、ｘ_iを、ラベル付けされていない顔画像のセット、データセットＸ^Uから描かれたラベル付けされていない顔画像とする。ベースライン教師ありモデルを使用するラベル付けされていない顔画像ｘ_iの特徴表現は、Φ（ｘ_i）として示される。Ｘ^U上で得られたクラスタ割り当てをＫ個のクラスタについて｛Ｃ₁，Ｃ_2，．．．，Ｃ_K｝とする。ロジスティック回帰モデルを訓練して、確率分布

を推定することができる。ここで、ｋ＝１，２，．．．Ｋである。例えば、

ここでω_kは、ｋ番目のクラスまたはクラスタのロジスティック回帰重みである。直観的には、判別的な顔記述子の上にある単純な線形分類子がクラスタ割当てにどの程度良く適合できるかを決定することが望ましい。

ロジスティック回帰出力についての以下の３つの不確実性メトリックを比較することができる：（１）Ｋ個のクラス／クラスタにわたる事後のエントロピー（例えば、

である。）（２）最大ロジット、またはＫ個のクラス／クラスタにわたる最大ロジット値であって、互いに素なＩＤと重複したＩＤとを分離するために上記で使用されたものと同様のもの。（３）分類マージンは、最大ロジットと第２の最大ロジットとの間の差であり、サンプルが２つのクラスタ間でラベルをどの程度容易に切り替えることができるかを測定する。

以下は、（１）そのアイデンティティがクラスタのアイデンティティに属さない外れ値、および（２）同様ＩＤからのサンプルがいくつかのクラスタにわたって拡散される分割ＩＤを考慮することができる、適合率と再現率の概念に対応する、クラスタリングからの２種類の不正確な擬似ラベルである。クラスタ化された顔画像のグランドトゥルースＩＤが既知である制御された設定において、ロジスティック回帰モデルからの不確実性の尺度が正しいクラスタ割り当てと正しくないクラスタ割り当てとを区別することができるという仮説を検証することができる。スプリットＩＤは、不正確にクラスタ化されたサンプルの大部分を構成することが観察され得る（例えば、外れ値は、不正確にクラスタ化されたサンプルの約１０％を含み得る）。

直感的に、大きな分類マージンを有さないサンプルは、誤った疑似ラベルである可能性が高い。クラスタ割り当てが正しいことと相関する不確実性の尺度が与えられると、２モード分布分離が予想され得る（例えば、雑音のあるラベル付けされたサンプルは、１つのモードにあり、他のモードでは正しくラベル付けされたサンプルになる）。これは、上述した重複するＩＤと互いに素なＩＤとを分離する分配問題と同様に、別の分配分離問題である。従って、極値分布（例えば、Ｗｅｉｂｕｌｌ分布）は、２つのモードを分離する初期閾値が得られる（例えば、Ｏｔｓｕの方法を使用する）２つのモードのクラスマージン分布の下部に適合させることができる。ｐ^-（ｘ_i）がサンプルｘ_iが不正確にクラスタ化される確率（または不正確なラベリング確率）を示す場合、ｐ^-（ｘ_i）は以下のように推定することができる。

ここで、

は、学習された極値（例えば、Ｗｅｉｂｕｌｌ）分布のパラメータであり、ｇ（・）は、不確実性の尺度（例えば、クラスマージン）を示す。極値分布フィッティングのどの時点においても、グラウンドトゥルースラベルへのアクセスが必要ではないことに留意されたい。

上記の不確実性は、確率的顔認識損失を設定するために、クラスタ化／擬似ラベル付きサンプルと関連付けられることができる。例えば、以下の余弦損失を用いることができる。

ここで、ｘ_iはｉ番目の訓練サンプルであり、ω_jはｊ番目のクラスに対する学習された分類器重みであり、ｍはｊ番目のクラス境界を絞るための損失余裕であり、αは収束のために調整された温度である。

について、不正確なラベル付けされた確率ｐ^-（ｘ_i）は、以下のようにペナルティを補償するために関連付けることができる。

ここで、γは、極値分布（例えば、Ｗｅｉｂｕｌｌ）の下での可能性に応じて各擬似ラベル付きサンプルに割り当てられる重要度重みに対応するパラメータであり、これは、べき乗則に従って重み付け曲線の形状を制御する。パラメータγは、損失に対する重み付けを制御し、重み付けの重要度を調整するために使用することができる。すなわち、不確実性ｐ^-（ｘ_i）が高い場合、γを小さく調整して、全体損失Ｌ^P（ｘ_i）に対するサンプル損失Ｌ（ｘ_i）を防止することができる。例えば、ｐ^-（ｘ_i）＝０．１の場合、（ｌ－ｐ^-（ｘ_i））^γ＝（１－０．１）^γ＝（０．９）^γとなる。γを大きく設定すると、重み（０．９）^γを小さくすることができるので、現在のサンプルｘ_iの全体損失項は小さくなる。γを小さく設定すると、現在のサンプルｘ_iの損失項が大きくなる。

図１および図２を参照して上述した実施形態に従って訓練された顔認識モデルは、任意の環境内で顔認識を実行するように実装することができる。

例えば、ここで図３を参照すると、顔認識を実施するための例示的な環境３００が示されている。より具体的には、環境３００は、ユーザ３１０と、計算システムまたはデバイス３２０とを含む。計算システム３２０は、ユーザ３１０の顔の分析に基づいて、ユーザ３１０に計算システム３２０へのアクセスを許可または拒否する生体認証システムを実装することができる。例えば、この例示的な実施形態では、計算システム３２０は、カメラを含むスマートフォンである。この実施形態は、純粋に例示的なものであり、顔認識モデルは、任意の適切な環境内で顔認識タスクを実行するために使用することができる。

さらに示されるように、環境３００は、少なくとも１つのプロセッサ装置３３０をさらに含むことができる。プロセッサ装置３３０は、本明細書に記載する顔認識モデルを再訓練するためのシステム／方法を実現するように構成することができる。処理装置３３０は、計算システム３２０とは別個の実体であるものとして示されているが、プロセッサ装置３００は、代替的に、計算システム３２０のサブ構成要素であってもよく、または、計算システム３２０は、プロセッサ装置３３０のサブ構成要素であってもよい。

次に図４を参照すると、ラベル付けされていない顔データに基づいて顔認識を実施するためのシステム／方法４００を示すブロック／フロー図が提供されている。システム／方法４００は、ラベル付けされていない顔画像をクラスタリングし、追加のラベル付けされていないデータ上の擬似ラベルとしてクラスタ割り当てを使用して、ラベル付けされた顔画像とラベル付けされていない顔画像との両方を再訓練することによって、教師あり顔認識モデルの性能を改善することができる。

ブロック４１０において、ラベル付けされた顔データについて訓練された顔認識モデルが得られる。例えば、ラベル付けされた顔データは、大規模なラベル付けされたデータセットを含むラベル付けされた顔画像のセットとすることができる。一実施形態では、ラベル付けされた顔データは、１つまたは複数の人間の顔画像を含むことができる。しかしながら、そのような実施形態は、限定的であると考えられるべきではなく、本明細書で説明される実施形態は、任意の適切な顔画像に関して顔認識訓練を実行するために適用され得る。

一実施形態では、顔認識モデルを取得することは、訓練損失を取得するために、深層ニューラルネットワークを使用して顔認識モデルを訓練することを含む。この実施形態では、ニューラルネットワークを訓練することは、ベースラインとして完全な教師ありの様式で、ラベル付けされた顔画像のセット上でニューラルネットワークを訓練することを含むことができる。したがって、ブロック４２０で実行される訓練は、半教師あり顔認識訓練であってもよい。

ブロック４２０において、ラベル付けされていない顔データに対応する複数のラベル付けされていない顔が、確率分布の混合を使用して、ラベル付けされた顔データ内のものと重複するアイデンティティを含む１つまたは複数の重複するラベル付けされていない顔のセットと、ラベル付けされた顔データ内のものと互いに素なアイデンティティを含む１つまたは複数の互いに素なラベル付けされていない顔のセットとに分離される。より具体的には、極値分布の混合を使用して、オンザフライで実行することができる。一実施形態では、極値分布の混合は、Ｗｅｉｂｕｌｌ分布の混合を含む。

ブロック４２０で解決される分離問題は、「分布外検出問題」とみなすことができ、重複するアイデンティティを有するラベル付けされていない顔画像は、同じラベル付けされたデータが顔認識エンジンを訓練するために使用されるため、顔認識エンジンから高い信頼スコアを有することになるという直観を伴う。数千カテゴリにわたるｓｏｆｔｍａｘ操作は、正規化のために小さな値をもたらすことができるため、各ラベル付けされていない顔画像の最大ロジット（「ｍａｘ－ｌｏｇｉｔ」）を、その対応する信頼性スコアとして使用することができる。したがって、互いに素なＩＤと重複するＩＤとを分離することができる信頼性スコアのしきい値が探索される。多数のクラスにわたる最大値を扱うことができるため、極値理論（ＥＶＴ）からの結果を利用することができる。Ｆｉｓｈｅｒ－Ｔｉｐｐｅｔの定理は、極値定理とも呼ばれ、独立で同一分布に従う（ｉ．ｉ．ｄ．）確率変数の極大値の極限分布が、Ｇｕｍｂｅｌ分布、Ｆｒｅｃｈｅｔ分布、またはＷｅｉｂｕｌｌ分布のいずれかに対応する極値分布に収束することを提供する。

ブロック４３０で、１つまたは複数のばらばらのラベル付けされていない顔は、グラフ畳み込みネットワークを使用してクラスタ化されて、１つまたは複数のクラスタ割当てを生成する。これは、１つまたは複数の互いに素なラベル付けされていない顔のそれぞれにクラスタ割当てに対応する擬似ラベルを割り当てて、１つまたは複数の擬似ラベル付けされたサンプルを取得することを含む。以下でさらに詳細に説明するように、追加のラベル付けされていない顔画像に対応するクラスタ割り当て／擬似ラベルは、顔認識ネットワークの再訓練中に組み込まれる。より具体的には、クラスタリングは、擬似ラベルを使用する大規模顔クラスタリングのためにグラフ畳み込みネットワークを活用することができる。

一実施形態では、ＧＣＮはＦａｃｅ－ＧＣＮである。事前訓練された顔認識エンジンから抽出された特徴に基づいて、Ｆａｃｅ－ＧＣＮは、親和性測度としてＥｕｃｌｉｄｅａｎ距離を使用することができる、全サンプルにわたる最近傍グラフを構築することができる。このグラフのエッジ重みに様々な閾値を設定することによって、１組の連結成分またはクラスタ提案が生成される。訓練中、目的は、単一のグラウンドトゥルースアイデンティティから生じる提案の正確さおよび想起を回帰させることである。提案は、ラベル付けされた顔画像に基づいて生成されるので、Ｆａｃｅ－ＧＣＮは、完全な教師ありの方法で訓練することができる。これは、通常、各ノードまたは入力グラフ全体のいずれかの分類損失で訓練されるＧＣＮの通常の訓練とは異なる。テスト中、オブジェクト検出における非最大抑圧に類似した「重複排除」手順は、ラベル付けされていないデータセットをクラスタのセットに分割するために、提案のための予測ＧＣＮスコアを使用することができる。

ブロック４４０で、１つまたは複数のクラスタ割り当てに関連するクラスタリング不確実性が生成される。クラスタリング不確実性は、クラスタ化された顔画像のセット内の不正確なクラスタリング割り当ての推定に対応する。クラスタリング不確実性は、クラスタリング手順によって導入されたラベルノイズを補償し、従って顔認識性能を改善するために生成される。より具体的には、クラスタリング不確実性は、ノイズの多いラベル付けされたデータによって引き起こされる誤った勾配の影響を低減するために訓練損失を重み付けすることによって、顔認識ネットワークの再訓練に組み込まれる。クラスタリング不確実性は、訓練カリキュラムを学習するためにクリーンなラベル付けされたデータセットを必要とせず、したがって、すぐに適用することができる。

ブロック４５０では、クラスタリング不確実性を使用して１つまたは複数の擬似ラベル付けされたサンプルの訓練損失を減衰させることを含むクラスタリング不確実性を組み込むことによって、ラベル付けされた顔データおよびラベル付けされていない顔データに対して顔認識モデルが再訓練される。すなわち、再訓練は、擬似ラベル付けされた顔画像が正しくラベル付けされたかどうかのクラスタリング不確実性を組み込む。したがって、ラベル付けされた顔画像のセットとクラスタ化された顔画像のセットとの和集合に元の顔認識モデルを再訓練することにより、顔認識性能を改善することができる。

より具体的には、顔認識モデルを再訓練することは、ブロック４５２において、ラベル付けされた顔データと１つまたは複数の擬似ラベル付けされたサンプルとをニューラルネットワークに供給することと、ブロック４５４において、クラスタリング不確実性とニューラルネットワークの出力とを使用することによって、１つまたは複数の擬似ラベル付けされたサンプルの訓練損失を減らして、重み付けされた訓練損失を得ることとを含むことができる。

ブロック４６０において、顔認識モデルは、顔認識タスクを実行するために実装され得る。一実施形態では、顔認識モデルは、ユーザの顔の分析に基づいて、ユーザに計算システムまたは装置へのアクセスを提供する生体認証システム内で実現することができる。しかしながら、顔認識モデルは、任意の適切な環境内で顔認識タスクを実行するために使用することができる。上述のように、顔認識タスクの性能は、本明細書に記載の実施形態に従って顔認識モデルを再訓練することによって改善することができる。

ブロック４１０～４７０に関するさらなる詳細は、図１～３を参照して上述される。

次に図５を参照すると、本発明の一実施形態による、サーバまたはネットワークデバイスを表すことができる例示的なコンピュータシステム５００が示されている。コンピュータシステム５００は、システムバス５０２を介して他の構成要素に動作可能に結合された少なくとも１つのプロセッサ（ＣＰＵ）５０５を含む。キャッシュ５０６、リードオンリーメモリ（ＲＯＭ）５０８、ランダムアクセスメモリ（ＲＡＭ）５１０、入力／出力（Ｉ／Ｏ）アダプタ５２０、音声アダプタ５３０、ネットワークアダプタ５９０、ユーザインタフェースアダプタ５５０、およびディスプレイアダプタ５６０は、システムバス５０２に動作可能に結合される。

第１の記憶装置５２２および第２の記憶装置５２９は、Ｉ／Ｏアダプタ５２０によってシステムバス５０２に動作可能に結合される。記憶装置５２２および５２９は、ディスク記憶装置（例えば、磁気または光ディスク記憶装置）、ソリッドステート磁気装置などのいずれであってもよい。記憶装置５２２および５２９は、同じタイプの記憶装置または異なるタイプの記憶装置とすることができる。

スピーカ５３２は、音声アダプタ５３０によってシステムバス５０２に動作可能に結合することができる。トランシーバ５９５は、ネットワークアダプタ５９０によってシステムバス５０２に動作可能に結合される。ディスプレイ装置５６２は、ディスプレイアダプタ５６０によってシステムバス５０２に動作可能に結合される。

第１のユーザ入力装置５５２、第２のユーザ入力装置５５９、および第３のユーザ入力装置５５６は、ユーザインタフェースアダプタ５５０によってシステムバス５０２に動作可能に結合される。ユーザ入力装置５５２，５５９，５５６は、センサ、キーボード、マウス、キーパッド、ジョイスティック、画像捕捉装置、動き感知装置、電力測定装置、マイクロフォン、前述の装置のうちの少なくとも２つの機能を組み込んだ装置などのいずれかとすることができる。もちろん、本発明の精神を維持しながら、他のタイプの入力装置を使用することもできる。ユーザ入力装置５５２，５５９，５５６は、同じタイプのユーザ入力装置または異なるタイプのユーザ入力装置とすることができる。ユーザ入力装置５５２，５５９，５５６は、システム５００との間で情報を入出力するために使用される。

顔認識（ＦＲ）構成要素５７０は、システムバス５０２に動作可能に結合されてもよい。ＦＲ構成要素５７０は、上述の動作のうちの１つまたは複数を実行するように構成される。ＦＲ構成要素５７０は、スタンドアロンの特殊目的のハードウェア装置として実施することも、記憶装置に記憶されたソフトウェアとして実施することもできる。ＦＲ構成要素５７０がソフトウェアウェア実装される実施形態では、コンピュータシステム５００の別個の構成要素として示されているが、ＦＲ構成要素５７０は、例えば、第１の記憶装置５２２および／または第２の記憶装置５２９に格納することができる。代替的に、ＦＲ構成要素５７０は、別個の記憶装置（図示せず）に記憶され得る。

もちろん、コンピュータシステム５００は、当業者によって容易に企図されるように、他の要素（図示せず）を含むこともでき、また、特定の要素を省略することもできる。例えば、当業者によって容易に理解されるように、他の様々な入力装置および／または出力装置を、その特定の実装に応じて、コンピュータシステム５００に含めることができる。例えば、様々なタイプの無線および／または有線の入力および／または出力装置を使用することができる。さらに、様々な構成の追加のプロセッサ、コントローラ、メモリなども、当業者には容易に理解されるように利用することができる。コンピュータシステム１２００のこれらおよび他の変形は、本明細書で提供される本発明の教示を与えられれば、当業者によって容易に企図される。

本明細書において、本発明の「一実施形態」又は「一実施形態」とは、その他の変形例と同様に、その実施形態に関連して説明した特定の特徴、構造、特性等が、本発明の少なくとも一実施形態に含まれることを意味するものであり、「一実施形態において」又は「一実施形態において」の語句の出現、並びに本明細書全体の様々な箇所に出現する他の変形例は、必ずしも全て同一の実施形態を意味するものではない。しかしながら、本明細書で提供される本発明の教示を前提として、１つまたは複数の実施形態の特徴を組み合わせることができることを理解されたい。

以下の「／」、「および／または」、および「少なくとも１つ」、例えば、「Ａ／Ｂ」、「Ａおよび／またはＢ」、および「ＡおよびＢの少なくとも１つ」のいずれかの使用は、第１のリストされた実施例（Ａ）のみの選択、または第２のリストされた実施例（Ｂ）のみの選択、または両方の実施例（ＡおよびＢ）の選択を包含することが意図されることを理解されたい。さらなる例として、「Ａ、Ｂ、および／またはＣ」、および「Ａ、Ｂ、およびＣの少なくとも１つ」の場合、このような句は、第１のリストされた実施例（Ａ）のみの選択、または第２のリストされた実施例（Ｂ）のみの選択、または第３のリストされた実施例（Ｃ）のみの選択、または第１および第２のリストされた実施例（ＡおよびＢ）のみの選択、または第１および第３のリストされた実施例（ＡおよびＣ）のみの選択、または第２および第３のリストされた実施例（ＢおよびＣ）のみの選択、または３つすべての実施例（ＡおよびＢおよびＣ）の選択を包含することを意図する。これは、列挙された項目の数だけ拡張することができる。

上記は、あらゆる点で例示的かつ例示的であるが、限定的ではないと理解されるべきであり、本明細書に開示される本発明の範囲は、詳細な説明からではなく、むしろ特許法によって許容される全範囲に従って解釈されるような特許請求の範囲から決定されるべきである。本明細書に示され、説明された実施形態は、本発明の例示にすぎず、当業者は、本発明の範囲および精神から逸脱することなく、様々な修正を実施することができることを理解されたい。当業者は、本発明の範囲および精神から逸脱することなく、様々な他の特徴の組み合わせを実施することができる。このように、本発明の態様を、特許法によって要求される詳細および特殊性と共に説明してきたが、特許状によって保護されることが請求され、望まれるものは、添付の特許請求の範囲に記載されている。

Claims

顔認識を実施するためにコンピュータで実施する方法であって、
ラベル付けされた顔データ上で訓練された顔認識モデルを取得すること（４１０）と、
確率分布の混合を使用して、ラベル付けされていない顔データに対応する複数のラベル付けされていない顔を、前記ラベル付けされた顔データ内のものと重複するアイデンティティを含む１つまたは複数の重複するラベル付けされていない顔のセットと、前記ラベル付けされた顔データ内のものと互いに素なアイデンティティを含む１つまたは複数の互いに素なラベル付けされていない顔のセットとに分離すること（４２０）と、
１つまたは複数の擬似ラベル付けされたサンプルを取得するためにクラスタ割り当てに対応する擬似ラベルを前記１つまたは複数の互いに素なラベル付けされていない顔のそれぞれに割り当てることを含む、グラフ畳み込みネットワークを使用して１つまたは複数のクラスタ割り当てを生成するために前記１つまたは複数の互いに素なラベル付けされていない顔をクラスタリングすること（４３０）と、
前記１つまたは複数のクラスタ割り当てに関連するクラスタリング不確実性を生成すること（４４０）と、
前記クラスタリング不確実性を組み込むことによって顔認識性能を改善するために、前記ラベル付けされた顔データおよび前記ラベル付けされていない顔データ上で前記顔認識モデルを再訓練すること（４５０）とを含む、方法。
前記ラベル付けされた顔データ上で訓練された顔認識モデルを取得するために使用される深層ニューラルネットワークは、完全な教師ありの様式で、ラベル付けされた顔上で訓練される、請求項１に記載の方法。
前記確率分布の混合は、Ｗｅｉｂｕｌｌ分布の混合を含む、請求項１に記載の方法。
推定された前記クラスタリング不確実性を取得することは、不正確なクラスタ割り当ての可能性の教師なしモデルを学習することをさらに含む、請求項１に記載の方法。
前記顔認識モデルを再訓練することは、さらに、
前記ラベル付けされた顔データおよび前記１つまたは複数の擬似ラベル付けされたサンプルをニューラルネットワークに供給することと、
前記クラスタリング不確実性と前記ニューラルネットワークの出力とを使用することによって、重み付けされた訓練損失を得るために前記１つまたは複数の擬似ラベル付けされたサンプルの訓練損失を減らすこととを含む、請求項１に記載の方法。
顔認識タスクを実行するために前記顔認識モデルを実施することをさらに含む、請求項１に記載の方法。
前記顔認識モデルは、計算システムまたは装置へのユーザのアクセスを前記ユーザの顔の分析に基づいて提供するバイオメトリックシステム内に実装される、請求項６に記載の方法。
コンピュータに顔認識を実現する方法を実行させるために前記コンピュータによって実行可能なプログラム命令を有する、一時的でないコンピュータ読み取り可能な記憶媒体を備えるコンピュータプログラム製品であって、前記コンピュータによって実行される方法は、
ラベル付けされた顔データ上で訓練された顔認識モデルを取得すること（４１０）と、
確率分布の混合を使用して、ラベル付けされていない顔データに対応する複数のラベル付けされていない顔を、前記ラベル付けされた顔データ内のものと重複するアイデンティティを含む１つまたは複数の重複するラベル付けされていない顔のセットと、前記ラベル付けされた顔データ内のものと互いに素なアイデンティティを含む１つまたは複数の互いに素なラベル付けされていない顔のセットとに分離すること（４２０）と、
１つまたは複数の擬似ラベル付けされたサンプルを取得するためにクラスタ割り当てに対応する擬似ラベルを前記１つまたは複数の互いに素なラベル付けされていない顔のそれぞれに割り当てることを含む、グラフ畳み込みネットワークを使用して１つまたは複数のクラスタ割り当てを生成するために前記１つまたは複数の互いに素なラベル付けされていない顔をクラスタリングすること（４３０）と、
前記１つまたは複数のクラスタ割り当てに関連するクラスタリング不確実性を生成すること（４４０）と、
前記クラスタリング不確実性を組み込むことによって顔認識性能を改善するために、前記ラベル付けされた顔データおよび前記ラベル付けされていない顔データ上で前記顔認識モデルを再訓練すること（４５０）とを含む、コンピュータプログラム製品。
前記ラベル付けされた顔データ上で訓練された顔認識モデルを取得するために使用される深層ニューラルネットワークは、完全な教師ありの様式で、ラベル付けされた顔上で訓練される、請求項８に記載のコンピュータプログラム製品。
前記確率分布の混合は、Ｗｅｉｂｕｌｌ分布の混合を含む、請求項８に記載のコンピュータプログラム製品。
推定された前記クラスタリング不確実性を取得することは、不正確なクラスタ割り当ての可能性の教師なしモデルを学習することをさらに含む、請求項８に記載のコンピュータプログラム製品。
前記顔認識モデルを再訓練することは、さらに、
前記ラベル付けされた顔データおよび前記１つまたは複数の擬似ラベル付けされたサンプルをニューラルネットワークに供給することと、
前記クラスタリング不確実性と前記ニューラルネットワークの出力とを使用することによって、重み付けされた訓練損失を得るために前記１つまたは複数の擬似ラベル付けされたサンプルの訓練損失を減らすこととを含む、請求項８に記載のコンピュータプログラム製品。
前記方法は、顔認識タスクを実行するために前記顔認識モデルを実施することをさらに含む、請求項８に記載のコンピュータプログラム製品。
前記顔認識モデルは、計算システムまたは装置へのユーザのアクセスを前記ユーザの顔の分析に基づいて提供するバイオメトリックシステム内に実装される、請求項１３に記載のコンピュータプログラム製品。
顔認識を実施するためのシステムであって、
プログラムコードを格納するメモリ装置と、
前記メモリ装置と動作可能に結合され、前記メモリ装置に記憶されたプログラムコードを実行するように構成された少なくとも１つのプロセッサ装置とを有し、前記プロセッサ装置は、
ラベル付けされた顔データ上で訓練された顔認識モデルを取得し（４１０）、
確率分布の混合を使用して、ラベル付けされていない顔データに対応する複数のラベル付けされていない顔を、前記ラベル付けされた顔データ内のものと重複するアイデンティティを含む１つまたは複数の重複するラベル付けされていない顔のセットと、前記ラベル付けされた顔データ内のものと互いに素なアイデンティティを含む１つまたは複数の互いに素なラベル付けされていない顔のセットとに分離し（４２０）、
１つまたは複数の擬似ラベル付けされたサンプルを取得するためにクラスタ割り当てに対応する擬似ラベルを前記１つまたは複数の互いに素なラベル付けされていない顔のそれぞれに割り当てることによって、グラフ畳み込みネットワークを使用して１つまたは複数のクラスタ割り当てを生成するために前記１つまたは複数の互いに素なラベル付けされていない顔をクラスタリングし（４３０）、
前記１つまたは複数のクラスタ割り当てに関連するクラスタリング不確実性を生成し（４４０）、
前記クラスタリング不確実性を組み込むことによって顔認識性能を改善するために、前記ラベル付けされた顔データおよび前記ラベル付けされていない顔データ上で前記顔認識モデルを再訓練する（４５０）、システム。
前記ラベル付けされた顔データ上で訓練された顔認識モデルを取得するために使用される深層ニューラルネットワークは、完全な教師ありの様式で、ラベル付けされた顔上で訓練される、請求項１５に記載のシステム。
前記確率分布の混合は、Ｗｅｉｂｕｌｌ分布の混合を含む、請求項１５に記載のシステム。
前記少なくとも１つのプロセッサ装置は、不正確なクラスタ割り当ての可能性の教師なしモデルを学習することによって、前記クラスタリング不確実性を生成するようにさらに構成される、請求項１５に記載のシステム。
前記少なくとも１つのプロセッサ装置は、
前記ラベル付けされた顔データおよび前記１つまたは複数の擬似ラベル付けされたサンプルをニューラルネットワークに供給し、
前記クラスタリング不確実性と前記ニューラルネットワークの出力とを使用することによって、重み付けされた訓練損失を得るために前記１つまたは複数の擬似ラベル付けされたサンプルの訓練損失を減らすことによって、前記顔認識モデルを再訓練するようにさらに構成される、請求項１５に記載のシステム。
前記少なくとも１つのプロセッサ装置は、顔認識タスクを実行するために前記顔認識モデルを実装するために前記メモリ装置上に格納されたプログラムコードを実行するようにさらに構成され、前記顔認識モデルは、計算システムまたは装置へのユーザのアクセスを前記ユーザの顔の分析に基づいて提供するバイオメトリックシステム内に実装される、請求項１５に記載のシステム。