JP7414901B2

JP7414901B2 - 生体検出モデルのトレーニング方法及び装置、生体検出の方法及び装置、電子機器、記憶媒体、並びにコンピュータプログラム

Info

Publication number: JP7414901B2
Application number: JP2022119731A
Authority: JP
Inventors: 国生 ▲張▼; 浩城 ▲馮▼; ▲海▼▲瀟▼ 岳; 珂▲尭▼ 王
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2021-08-25
Filing date: 2022-07-27
Publication date: 2024-01-16
Anticipated expiration: 2042-07-27
Also published as: EP4075395A3; CN113705425A; EP4075395A2; KR20220107120A; JP2022141931A; CN113705425B

Description

本開示は、人工知能の技術分野に関し、具体的に、コンピュータ視覚及びディープラーニングの技術分野に関し、顔識別などのシーンに適用することができる。

コンピュータ技術及びネットワーク技術の発展に伴い、ディープラーニング技術が多くの分野で広く応用されている。例えば、ディープラーニング技術を用いて生体検出を行うことで、検出精度を効果的に向上させることができる。しかし、コンピュータ技術の発展に伴い、偽造生体を生成する技術が続出してきた。関連技術において生体を検出するディープラーニング技術は、一般的に汎化能力が劣り、様々な技術で生成された偽造生体を効果的に識別することを保証し難い。

これに鑑みて、本開示は、汎化能力及び検出精度を向上させる生体検出モデルのトレーニング方法及び装置、生体検出モデルを用いて生体検出を行う方法及び装置、電子機器、記録媒体、並びにコンピュータプログラムを提供している。

本開示の１つの局面によれば、生体検出モデルのトレーニング方法であって、生体検出モデルは、特徴抽出ネットワークと分類ネットワークとを含み、このトレーニング方法は、オブジェクト対象を含む複数のサンプル画像を特徴抽出ネットワークに入力して、複数のサンプル画像のうち各サンプル画像の第１の画像特徴を得ており、前記各サンプル画像は、オブジェクト対象が本物種別である実際確率を示すラベルを有することと、第１の画像特徴を分類ネットワークに入力して、各サンプル画像におけるオブジェクト対象が本物種別である第１の予測確率を得ることと、第１の画像特徴と、所定特徴シーケンスにおける各特徴との間の類似度に基づいて、各サンプル画像におけるオブジェクト対象が非本物種別である第２の予測確率を特定し、前記各特徴は、ラベルが示す実際確率がゼロである第１のサンプル画像の第２の画像特徴であることと、第１の予測確率と、第２の予測確率と、実際確率とに基づいて、生体検出モデルをトレーニングすることと、を含む生体検出モデルのトレーニング方法を提供している。

本開示の別の局面によれば、生体検出モデルを用いて生体検出を行う方法であって、生体検出モデルは、特徴抽出ネットワークと分類ネットワークとを含み、この方法は、オブジェクト対象を含む検出すべき画像を特徴抽出ネットワークに入力して、検出すべき画像の第３の画像特徴を得ることと、第３の画像特徴を分類ネットワークに入力して、検出すべき画像におけるオブジェクト対象が本物種別である確率を得ることと、を含み、ここで、生体検出モデルは、前文で説明した生体検出モデルのトレーニング方法を用いてトレーニングされたものである生体検出方法を提供している。

本開示の別の局面によれば、生体検出モデルのトレーニング装置であって、この生体検出モデルは、特徴抽出ネットワークと分類ネットワークとを含み、このトレーニング装置は、オブジェクト対象を含む複数のサンプル画像を特徴抽出ネットワークに入力して、複数のサンプル画像のうちの各サンプル画像の第１の画像特徴を得るためのものであって、前記各サンプル画像は、オブジェクト対象が本物種別である実際確率を示すラベルを有するの第１の特徴取得モジュールと、第１の画像特徴を分類ネットワークに入力して、各サンプル画像におけるオブジェクト対象が本物種別である第１の予測確率を得るための第１の予測モジュールと、第１の画像特徴と所定特徴シーケンスにおける各特徴との間の類似度に基づいて、各サンプル画像におけるオブジェクト対象が非本物種別である第２の予測確率を得るためのものであって、前記各特徴は、ラベルが示す実際確率がゼロである第１のサンプル画像の第２の画像特徴である第２の予測モジュールと、第１の予測確率と、第２の予測確率と、実際確率とに基づいて、生体検出モデルをトレーニングするためのモデルトレーニングモジュールと、を含む、生体検出モデルのトレーニング装置を提供している。

本開示の別の局面によれば、生体検出モデルを用いて生体検出を行う装置であって、生体検出モデルは、特徴抽出ネットワークと分類ネットワークとを含み、この装置は、オブジェクト対象を含む検出すべき画像を特徴抽出ネットワークに入力して、検出すべき画像の第３の画像特徴を得るための第２の特徴取得モジュールと、第３の画像特徴を分類ネットワークに入力して、検出すべき画像におけるオブジェクト対象が本物種別である確率を得るための確率取得モジュールと、を含み、ここで、生体検出モデルは、前文で説明した生体検出モデルのトレーニング装置を用いてトレーニングされたものである、生体検出装置を提供している。

本開示の別の局面によれば、少なくとも１つのプロセッサと、少なくとも１つのプロセッサと通信接続するメモリとを有する電子機器であって、メモリに、少なくとも１つのプロセッサによって実行され得るコマンドが記憶されており、コマンドが少なくとも１つのプロセッサによって実行されることで、少なくとも１つのプロセッサが本開示が提供した生体検出モデルのトレーニング方法及び／又は生体検出モデルを用いて生体検出を行う方法を実行することができる、電子機器を提供している。

本開示の別の局面によれば、コンピュータに本開示が提供した生体検出モデルのトレーニング方法及び／又は生体検出モデルを用いて生体検出を行う方法を実行させるためのコンピュータコマンドを記憶している、非一時的なコンピュータ読取可能な記憶媒体を提供している。

本開示の別の局面によれば、プロセッサにより実行される場合に、本開示が提供した生体検出モデルのトレーニング方法及び／又は生体検出モデルを用いて生体検出を行う方法を実現するコンピュータプログラムを提供している。

理解されるべきこととして、本部分に記載された内容は、本開示の実施例のキーポイント又は重要な特徴を示すことを意図するものではなく、本開示の範囲を限定するものでもない。本開示の他の特徴は、以下の説明により容易に理解される。

ここで、図面は、本技術案をよりよく理解するために用いられ、本開示を限定するものではない。
図１は、本開示の実施例による生体検出モデルのトレーニング方法及び生体検出の方法、装置の適用シーン模式図である。図２は、本開示の実施例による生体検出モデルのトレーニング方法のフロー模式図である。図３は、本開示の実施例による生体検出モデルのトレーニング方法の原理模式図である。図４は、本開示の実施例による生体検出モデルの構成模式図である。図５は、本開示の実施例による生体検出モデルを用いて生体検出を行う方法のフロー模式図である。図６は、本開示の実施例による生体検出モデルのトレーニング装置の構成ブロック図である。図７は、本開示の実施例による生体検出モデルを用いて生体検出を行う装置の構成ブロック図である。図８は、本開示の実施例の生体検出モデルのトレーニング方法及び／又は生体検出モデルを用いて生体検出を行う方法を実施するための電子機器のブロック図である。

以下、図面を参照して本開示の例示的な実施例を説明する。ここで、より理解しやすいために本開示の実施例の様々な詳細は含まれ、それらが例示的なものであると考えられるべきである。したがって、当業者であれば、ここで記載される実施例に対して様々な変更・修正を行うことができ、本開示の範囲及び精神から逸脱することはないと分るべきである。同様に、明確かつ簡潔に説明するために、以下の記載において周知の機能や構成に対する説明を省略する。

一般的に、生体検出モデルは特徴二項分類の方法に基づいて構築されてもよく、異常検出の方法に基づいて構築されてもよい。特徴二項分類の方法に基づいて構築された生体検出モデルは、まず画像に対して特徴抽出を行い、次に抽出された特徴を二項分類してもよい。従来の方法又はディープニューラルネットワークに基づく方法を用いて特徴抽出を行ってよく、サポートベクターマシン又は全接続ネットワークを用いて特徴を二項分類してもよい。ここで、特徴を抽出する従来の方法は、ローカルバイナリパターン（ＬｏｃａｌＢｉｎａｒｙＰａｔｔｅｒｎ、ＬＢＰ）を用いる方法、方向勾配ヒストグラム（ＨｉｓｔｏｇｒａｍｏｆＯｒｉｅｎｔｅｄＧｒａｄｉｅｎｔｓ、ＨＯＧ）を用いる方法などを含んでよく、ディープニューラルネットワークに基づく方法は、畳み込みニューラルネットワーク又は長・短期記憶ネットワークなどを用いて特徴を抽出してもよい。異常検出に基づく方法はオブジェクト対象が本物種別である（即ち、オブジェクト対象が本物生体の種別である）画像を正常な種別と見なし、オブジェクト対象が非本物種別である（即ち、オブジェクト対象が偽造生体の種別である）画像を異常な種別と見なしてもよい。トレーニング過程において、この異常検出に基づく方法は、正常な種別の画像におけるオブジェクト対象の特徴を学習することで、本物種別のオブジェクト対象の特徴が特徴中心に集中し、非本物種別のオブジェクト対象の特徴が特徴中心から離れるようにすることができる。

以上の二項分類の方法に基づいて本物生体と偽造生体とを２つの種別と見なす方法は実際のシーンに合致しない。これは、異なる偽造方法によって得られた偽造生体の差異が一般的に大きく、すべての偽造生体を一類に分類することは、生体検出モデルの学習に不利であり、生体検出モデルにより学習された偽造生体の特徴がトレーニングセットの分布にオーバーフィッティングすることを引き起こしやすく、それにより生体検出モデルの汎化効果が劣るためである。トレーニング過程において、異常検出に基づく方法は本物生体のみに対して特徴学習を行い、偽造生体の特徴に基づく監視を欠いているため、検出性能が限られているという技術的問題が存在する。

これに鑑みて、本開示は生体検出モデルのトレーニング方法を提供しており、特徴取得段階と、第１の予測段階と、第２の予測段階と、モデルトレーニング段階とを含む。ここで、生体検出モデルは、特徴抽出ネットワーク及び分類ネットワークを含む。特徴取得段階において、オブジェクト対象を含む複数のサンプル画像を特徴抽出ネットワークに入力して、複数のサンプル画像のうちの各サンプル画像の第１の画像特徴を取得し、この各サンプル画像は、オブジェクト対象が本物種別である実際確率を示すラベルを有する。第１の予測段階において、第１の画像特徴を分類ネットワークに入力して、各サンプル画像におけるオブジェクト対象が本物種別である第１の予測確率を得る。第２の予測段階において、第１の画像特徴と所定特徴シーケンスにおける各特徴との間の類似度に基づいて、各サンプル画像におけるオブジェクト対象が非本物種別である第２の予測確率を特定し、ここで、各特徴はラベルが示す実際確率がゼロである第１のサンプル画像の第２の画像特徴である。モデルトレーニング段階において、第１の予測確率と、第２の予測確率と、実際確率とに基づいて、生体検出モデルをトレーニングする。トレーニングされた生体検出モデルは通常の方法で構築された生体検出モデルに存在する問題を克服できることが期待される。

以下、図１を参照して本開示が提供した方法及び装置の適用シーンを説明する。

図１は、本開示の実施例による生体検出モデルのトレーニング方法及び生体検出の方法、装置の適用シーン模式図である。

図１に示すように、この実施例の適用シーン１００は、居住者１１０、建物１２０、画像収集装置１３０及び電子機器１４０を含んでもよい。この画像収集装置１３０は、ネットワーク又は近距離通信プロトコルなどを通じて電子機器１４０と通信接続することができる。

この建物１２０の玄関ドアは、例えば、スマートドアである。電子機器１４０は、例えば、この玄関ドアの開閉を制御することができる。画像収集装置１３０は、例えば、この玄関ドアへ行く居住者１１０の顔画像を収集し、この顔画像を電子機器１４０に送信することで、電子機器１４０によってこの顔画像に対して生体検出及び顔識別を行うために用いられる。顔画像中の顔が所定ユーザの本物顔であると検出された場合、玄関ドアに開きコマンドを送信して、玄関ドアのスマート開きを実現する。

１つの実施例において、電子機器１４０は、例えば、建物１２０内に設置されており、ディスプレイパネルを有する端末機器であってもよく、遠隔制御サーバなどであってもよい。

１つの実施例において、電子機器１４０は、例えば、生体検出モデルを用いて顔画像中の顔が本物顔であるか否かを検出してもよい。この生体検出モデルは、電子機器１４０と通信接続するサーバによってトレーニングされたものであってもよい。又は、この電子機器１４０によって予めトレーニングされたものであってもよい。

なお、本開示が提供した生体検出モデルのトレーニング方法は、一般的に、電子機器１４０によって実行されてもよく、或いは、電子機器１４０と通信接続するサーバによって実行されてもよい。それに応じて、本開示が提供した生体検出モデルのトレーニング装置は、電子機器１４０に設置されてもよく、或いは、電子機器１４０と通信接続するサーバに設置されてもよい。本開示が提供した生体検出モデルを用いて生体検出を行う方法は、電子機器１４０によって実行されてもよい。それに応じて、本開示が提供した生体検出モデルを用いて生体検出を行う装置は、電子機器１４０に設置されてもよい。

理解されるべきこととして、図１における画像収集装置、建物及び電子機器の数、タイプ、及び居住者の数は、単に例示的なものに過ぎない。実現の必要に応じて、任意の数及びタイプの画像収集装置、建物及び電子機器を有してもよく、任意の数の居住者を有してもよい。

理解されるべきこととして、本開示を理解することに役立つように、図１における適用シーンは単に例示であり、このシーンにおいてオブジェクト対象が顔である。本開示が提供した方法は、オブジェクト分類、オブジェクト検出、オブジェクト識別、オブジェクト分割及びオブジェクト予測などの様々なシーンに適用されてもよい。他のシーンにおいて、オブジェクト対象は、本物の生理的特徴を有する各種の対象、例えば、目、動物の顔などであってもよい。本開示が用いるサンプル画像は、いずれも公開データセットに由来し、トレーニングされた生体検出モデルは、ある特定のユーザに対するモデルではなく、このモデルを用いることで、ある特定のユーザの個人情報を得ることもできない。

以下、図１を参照して、以下の図２～図４を通じて本開示が提供した生体検出モデルのトレーニング方法を詳細に説明する。

図２は、本開示の実施例による生体検出モデルのトレーニング方法のフロー模式図である。

図２に示すように、この実施例の生体検出モデルのトレーニング方法２００は、操作Ｓ２１０～操作Ｓ２４０を含む。ここで、この生体検出モデルは、特徴抽出ネットワークと分類ネットワークとを含んでもよい。

操作Ｓ２１０において、オブジェクト対象を含む複数のサンプル画像を特徴抽出ネットワークに入力して、複数のサンプル画像のうちの各サンプル画像の第１の画像特徴を得る。

本開示の実施例によれば、公開データセットからオブジェクト対象を含む複数の画像データを取得して、所定の判定結果に応じてこの複数の画像データにラベルを付加し、付加されたラベルは画像データにおけるオブジェクト対象の実際種別を示す情報であってよく、例えば、実際種別が本物種別である場合、この画像データにラベル「１」を付加し、そうでなければ、この画像データにラベル「０」を付加する。このラベルは、同時に画像データにおけるオブジェクト対象が本物種別である実際確率を示すことができる。例えば、ラベルが「１」である場合、実際確率が１であり、ラベルが「０」である場合、実際確率が０である。理解されるべきこととして、本開示を理解することに役立つように、付加されたラベルは単に例示であり、本開示はこれを限定しない。

ラベルが付加された複数の画像データをサンプル画像としてもよい。例えば、サンプル画像を複数のグループに分けてよく、各グループのサンプル画像は、所定数のサンプル画像を含む。この各グループのサンプル画像を一バッチのトレーニングデータとし、同時に特徴抽出ネットワークに入力することで、この各グループサンプル画像のうちの各サンプル画像の画像特徴を得る。ここで、所定数は実際のニーズに応じて設定されてよく、本開示はこれを限定しない。

例示的に、特徴抽出ネットワークは、畳み込みニューラルネットワークを用いてよく、例えば、残差ニューラルネットワーク（ＲｅｓｉｄｕａｌＮｅｕｒａｌＮｅｔｗｏｒｋ，ＲｅｓＮｅｔ）、移動側及び埋込式側のディープラーニングアプリケーションのために設計されたネットワーク（例えば、ＭｏｂｉｌｅＮｅｔ）などを用いてよく、本開示はこれを限定しない。

１つの実施例において、各サンプル画像のサイズをＨ×Ｗとし、各サンプル画像のチャンネル数をＧとし、一バッチのトレーニングデータにおけるサンプル画像の数をＮとすると、特徴抽出ネットワークに入力されたデータは、サイズがＨ×Ｗ×Ｇ×Ｎであるデータであってもよい。特徴抽出ネットワークによって処理された後、各サンプル画像毎に１つの特徴ベクトルが得られる。このＮ個のサンプル画像に対して、特徴抽出ネットワークが出力した特徴データは、例えば、Ｎ×Ｄの特徴行列であってもよい。この特徴行列における各行のデータが１つのサンプル画像の特徴ベクトルを構成し、各サンプル画像の特徴ベクトルはＤ個の要素を含む。

操作Ｓ２２０において、第１の画像特徴を分類ネットワークに入力して、各サンプル画像におけるオブジェクト対象が本物種別である第１の予測確率を得る。

本開示の実施例によれば、分類ネットワークは、例えば、全接続ネットワークであってもよい。この分類ネットワークの入力は、特徴抽出ネットワークが出力した第１の画像特徴である。例えば、一バッチのトレーニングデータにおいてサンプル画像の数がＮであれば、この分類ネットワークの入力はＮ×Ｄの特徴行列であってもよい。この分類ネットワークの出力は確率ベクトルである。この確率ベクトルにはＮ個の要素が含まれ、それぞれはＮ個のサンプル画像のそれぞれに含まれるオブジェクト対象が本物種別である予測確率を表す。したがって、この分類ネットワークによって処理されることで、各サンプル画像におけるオブジェクト対象が本物種別である第１の予測確率が得られる。

１つの実施例において、この分類ネットワークには、例えば、複数の重みパラメータが設定されており、この複数の重みパラメータは重みベクトルを構成し、分類ネットワークは各サンプル画像の第１の画像特徴とこの重みベクトルとの内積を算出することで、各サンプル画像におけるオブジェクト対象が本物種別である予測確率を得ることができる。このように、この重みベクトルにおける重みパラメータの数と前文に説明した特徴ベクトルにおける要素の数とは等しいであってもよい。

在操作Ｓ２３０において、第１の画像特徴と所定特徴シーケンスにおける各特徴との間の類似度に基づいて、各サンプル画像におけるオブジェクト対象が非本物種別である第２の予測確率を特定する。

本開示の実施例によれば、まず第１の画像特徴と各特徴との間の余弦類似度、ピアソン（Ｐｅａｒｓｏｎ）相関係数又はジャッカード（Ｊａｃｃａｒｄ）係数などを算出し、算出された値を第１の画像特徴と各特徴との間の類似度をしてもよい。第１の画像特徴と所定特徴シーケンスにおける各特徴との間の類似度を算出することで、１つの類似度ベクトルが得られ、この類似度ベクトルにおける要素数と所定特徴シーケンスにおける特徴の数とが等しい。この実施例は、類似度ベクトルにおける各要素の平均値、二乗平均平方根又は複数の要素のうちの最大値、最小値などをサンプル画像におけるオブジェクト対象が非本物種別である第２の予測確率としてもよい。

１つの実施例において、各サンプル画像の第１の画像特徴が得られた後、第１の画像特徴と所定特徴シーケンスにおける各特徴との間の内積を算出し、算出された内積によって第１の画像特徴とこの各特徴との間の類似度を表す。第１の画像特徴毎に、第１の画像特徴と特徴シーケンスとの間の１つの類似度ベクトルが得られる。この類似度ベクトルにおける各要素の値は、サンプル画像におけるオブジェクト対象と各特徴に対応する画像におけるオブジェクト対象とが同一種別に属する確率値を示すことができる。類似度ベクトルが得られた後、この実施例は、類似度ベクトルのうちの最大値をサンプル画像におけるオブジェクト対象が非本物種別である第２の予測確率としてもよい。

本開示の実施例によれば、所定特徴シーケンスにおける各特徴は、ラベルが示す実際確率がゼロである第１のサンプル画像の第２の画像特徴であってもよい。例えば、この実施例は、生体検出モデルをトレーニングする前に、ラベルが付加された複数の画像データからオブジェクト対象が非本物種別である複数のサンプル画像（即ち、負サンプル）を予め選出してもよい。次に、前述した特徴抽出ネットワークを用いて各負サンプルの画像特徴を得て、複数の負サンプルの画像特徴からこの所定特徴シーケンスを構成する。又は、複数の単位特徴ベクトルをランダムに生成し、この複数の単位特徴ベクトルから所定特徴シーケンスを構成してもよい。単位特徴ベクトルをランダムに生成する時、例えば、拘束条件を付加することで、生成された単位特徴ベクトルが負サンプルの画像特徴の情報を有するようにしてもよい。

ここで、所定特徴シーケンスにおける特徴の数は実際のニーズに応じて設定されてよく、本開示はこれを限定しない。所定特徴シーケンスにおける各特徴のサイズは、例えば、前述した得られた第１の画像特徴のサイズと等しいであってもよい。

操作Ｓ２４０において、第１の予測確率と、第２の予測確率と、実際確率とに基づいて、生体検出モデルをトレーニングする。

本開示の実施例によれば、第１の所定確率と実際確率との間の差異、第２の所定確率と実際確率との間の差異に基づいて、生体検出モデルの損失を特定し、逆方向伝播アルゴリズムを用いて生体検出モデル中のパラメータを調整することで、生体検出モデルの損失を低減するようにしてもよい。

この実施例において、入力されたサンプル画像は複数であるため、サンプル画像毎に１つの確率グループが得られ、合計で複数の確率グループが得られる。各確率グループには、１つの第１の予測確率と、１つの第２の予測確率と、１つの実際確率とが含まれる。この実施例は、各確率グループに基づいて１つの損失が得られ、合計で複数の損失が得られ、この複数の損失を重ね合わせて生体検出モデルの損失が得られる。

本開示の実施例によれば、サンプル画像を複数のグループに分けた後、生体検出モデルの損失が所定値より小さくなるまでに、又はこの生体検出モデルのトレーニング回数が所定回数に達するまでに、複数グループのサンプル画像に基づいてこの生体検出モデルを順次にトレーニングしてもよい。ここで、所定値及び所定回数は実際のニーズに応じて設定されてよく、本開示はこれを限定しない。

本開示の実施例によれば、生体検出モデルをトレーニングする過程において、生体検出モデルの損失に基づいて分類ネットワーク中の各重みパラメータの値を調整することで、複数の重みパラメータからなる重みベクトルと正サンプル（即ち、オブジェクト対象が本物種別であるサンプル画像）の画像特徴との間の内積が大きくなり、重みベクトルと負サンプルの画像特徴との間の内積が小さくなるようにしてもよい。この方式によって、正サンプルの画像特徴が同一中心に集中し、負サンプルの画像特徴がこの中心から離れるようにすることができる。それにより、生体検出モデルは、本物種別のオブジェクト対象と非本物種別のオブジェクト対象とを正確に区別することができるようにする。

上述したように、本開示の実施例の生体検出モデルのトレーニング方法は、負サンプルに基づいて所定特徴シーケンスを構築し、サンプル画像の画像特徴と所定特徴シーケンスにおける各特徴との類似度に基づいてオブジェクト対象が非本物種別である第２の予測確率を特定することで、非本物種別に対する複数分類を実現し、得られた第２の予測確率の正確性を向上させることができる。この第２の予測確率を参照して生体検出モデルをトレーニングすることで、負サンプル特徴の監視を実現し、モデル精度及び汎化能力を向上させることができる。ここで、所定特徴シーケンスの特徴を１よりもはるかに大きい値に設定すれば、非本物種別を無限の種別に近似的に分けて、モデルの汎化能力を最大に向上させることができる。

図３は、本開示の実施例による生体検出モデルのトレーニング方法の原理模式図である。

図３に示すように、この実施例３００において生体検出モデル３１０と所定特徴シーケンス３２０とが設置されてもよい。ここで、生体検出モデル３１０は特徴抽出ネットワーク３１１と分類ネットワーク３１２とを含む。この特徴抽出ネットワーク３１１は畳み込みニューラルネットワーク（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋｓ，ＣＮＮ）を用いてよく、分類ネットワーク３１２は全接続ネットワークを用いてもよい。

生体検出モデル３１０をトレーニングする時、正サンプル３０１と負サンプル３０２とを含む一組のサンプル画像をＣＮＮに入力して、このＣＮＮによって処理された後に特徴行列３０３を出力し、この特徴行列３０３は、この一組のサンプル画像における画像数と等しい複数の特徴ベクトルを含む。この特徴行列３０３を分類ネットワーク３１２に入力した後、分類ネットワーク３１２によって処理された後に第１の予測確率３０４が得られる。実質的に、この分類ネットワーク３１２が出力したのは確率ベクトルであり、確率ベクトルにおける各要素は、１つのサンプル画像におけるオブジェクト対象が本物種別に属する第１の予測確率を表す。同時に、特徴行列３０３における各特徴ベクトルと所定特徴シーケンス３２０における各特徴との間の内積を算出し、前文の操作Ｓ２３０と類似する方法を用いて、各サンプル画像におけるオブジェクト対象が非本物種別に属する第２の予測確率３０５を得る。最後に、この第１の予測確率３０４、第２の予測確率３０５、及びサンプル画像のラベルが示す実際確率に基づいて、生体検出モデルの損失３０６を算出する。その後、この損失３０６に基づいて生体検出モデルをトレーニングすることができる。

本開示の実施例によれば、第１の予測確率３０４と、第２の予測確率３０５と、実際確率とに基づいて、交差エントロピー損失関数を用いて生体検出モデル３１０の損失を特定してもよい。具体的に、第１の予測確率と、第２の予測確率と、実際確率とを交差エントロピー損失関数に代入して算出し、算出された交差エントロピー損失関数の値を生体検出モデルの損失としてもよい。

本開示の実施例によれば、所定特徴シーケンス３２０における特徴は、例えば、動的に更新されてもよい。例えば、この所定特徴シーケンスは、キュー形式であってもよい。生体検出モデルのトレーニング過程において、現在の所定特徴シーケンスに基づいて第２の予測確率が得られた後に、複数のサンプル画像のうちの第２のサンプル画像の画像特徴を用いて現在の所定特徴シーケンスを更新してもよい。ここで、第２のサンプル画像は、ラベルが示す実際確率がゼロであるサンプルであり、即ち、前述の負サンプルである。所定特徴シーケンスを更新する時に、所定特徴シーケンスにおける最初にエンキューした特徴（即ち、キュー先頭の特徴）を削除し、第２のサンプル画像の画像特徴を所定特徴シーケンスのキュー末尾に挿入してもよい。この所定特徴シーケンスを動的に更新することで、モデルトレーニング過程において、モデルが本物生体と、異なる偽造技術によって得られた偽造生体との間の差異を連続的に学習していき、それによって、得られた生体検出モデルの汎化能力及び検出精度を向上させることができる。

図４は、本開示の実施例による生体検出モデルの構成模式図である。

図４に示すように、１つの実施例において、生体検出モデル４００は、特徴抽出ネットワーク４１０と分類ネットワーク４２０とを含み、その中の特徴抽出ネットワーク４１０は、特徴抽出サブネットワーク４１１と正規化サブネットワーク４１２とを含んでもよい。この特徴抽出サブネットワーク４１１は、前文に説明したＣＮＮなどを用いてよく、各サンプル画像の特徴を抽出するために用いられる。正規化サブネットワーク４１２は、特徴抽出サブネットワーク４１１によって抽出された特徴を正規化処理して、出力された特徴ベクトルにおける各要素の値が[0，1]の範囲にあるようにするために用いられる。

本開示の実施例によれば、前述した得られた第１の画像特徴は、正規化サブネットワーク４１２によって処理された特徴であってもよい。即ち、前文に説明した第１の画像特徴を得る操作は、まず複数のサンプル画像を特徴抽出サブネットワーク４１１に入力して、この複数のサンプル画像のそれぞれの初期特徴を取得してもよい。その後、各サンプル画像の初期特徴を正規化サブネットワーク４１２に入力して、この正規化サブネットワーク４１２によって各サンプル画像の第１の画像特徴を出力する。

本開示の実施例は、特徴抽出ネットワークに正規化サブネットワークを設置することで、特徴抽出ネットワークによって抽出された画像特徴の精度を向上させ、それにより生体検出モデルの検出精度を向上させることができる。これは、異なるデータ領域における画像データの差異が大きい可能性があることを考慮して、正規化されていない特徴をそのまま用いて分類すれば、異なるデータ領域に対する分類基準が同一であることによる分類結果が不正確になる問題が存在し得るためである。

本開示の実施例によれば、サンプル画像が得られた後、例えば、複数のサンプル画像をトレーニングサンプルセットとテストサンプルセットとに区分してもよい。その後、トレーニングサンプルセットにおける複数のサンプル画像を複数のグループに分けて、生体検出モデルをトレーニングする。生体検出モデルをトレーニングした後、テストサンプルセットを用いてトレーニングされた生体検出モデルをテストしてもよい。具体的に、テストサンプルセットにおけるサンプル画像を生体検出モデルに入力して、テストサンプルセットにおけるサンプル画像の画像特徴を順次に抽出し、オブジェクト対象が本物種別である予測確率を得る。この予測確率とテストサンプルセットにおけるサンプル画像のラベルが示す実際確率との差異によって、トレーニング後の生体検出モデルの精度を得る。トレーニングされた生体検出モデルをテストする過程において、所定特徴シーケンスに基づいてサンプル画像におけるオブジェクト対象が非本物種別である予測確率を特定する必要がない。

本開示が提供した生体検出モデルのトレーニング方法によれば、本開示は、生体検出モデルを用いて生体検出を行う方法をさらに提供している。以下、図５を参照してこの方法を詳細に説明する。

図５は、本開示の実施例による生体検出モデルを用いて生体検出を行う方法のフロー模式図である。

図５に示すように、この実施例の生体検出モデルを用いて生体検出を行う方法５００は、操作Ｓ５１０～操作Ｓ５２０を含んでもよい。ここで、生体検出モデルは、特徴抽出ネットワークと分類ネットワークとを含む。この生体検出モデルは、前文に説明した生体検出モデルのトレーニング方法を用いてトレーニングされたものであってもよい。

操作Ｓ５１０において、オブジェクト対象を含む検出すべき画像を特徴抽出ネットワークに入力して、検出すべき画像の第３の画像特徴を得る。ここで、検出すべき画像は、画像収集装置によってリアルタイムに収集された画像であってもよい。この操作Ｓ５１０は前文に説明した操作Ｓ２１０と類似し、第３の画像特徴は前文に説明した第１の画像特徴と類似し、ここで説明を繰り返さない。

操作Ｓ５２０において、第３の画像特徴を分類ネットワークに入力して、検出すべき画像におけるオブジェクト対象が本物種別である確率を得る。この操作Ｓ５２０は前文に説明した操作Ｓ２２０と類似し、ここで説明を繰り返さない。

検出すべき画像におけるオブジェクト対象が本物種別である確率が得られた後、この確率と確率閾値とを比較してもよい。オブジェクト対象が本物種別である確率がこの確率閾値より大きい場合、オブジェクト対象が本物生体であると判定することができる。そうでなければ、このオブジェクト対象が偽造生体であると判定することができる。ここで、確率閾値は実際のニーズに応じて設定されてもよい。例えば、この確率閾値は０.８などの、０.５より大きい任意の値であってよく、本開示はこれを限定しない。

本開示の実施例は前述した方法でトレーニングされた生体検出モデルを用いることで、余計な計算量を増やすことなく、生体検出の正確性を向上させ、セキュリティ、金融、エントリー通行などの多くのシーンで様々な方式の攻撃を防御する効果を向上させることができる。それにより、この生体検出方法を広く普及させ、ユーザ体験を向上させることができる。

本開示が提供した生体検出モデルのトレーニング方法に基づいて、本開示は生体検出モデルのトレーニング装置をさらに提供している。以下、図６を参照してこの装置を詳細に説明する。

図６は、本開示の実施例による生体検出モデルのトレーニング装置の構成ブロック図である。

図６に示すように、この生体検出モデルのトレーニング装置６００は、第１の特徴取得モジュール６１０と、第１の予測モジュール６２０と、第２の予測モジュール６３０と、モデルトレーニングモジュール６４０とを含む。ここで、生体検出モデルは、特徴抽出ネットワークと、分類ネットワークとを含む。

第１の特徴取得モジュール６１０は、オブジェクト対象を含む複数のサンプル画像を特徴抽出ネットワークに入力して、複数のサンプル画像のうちの各サンプル画像の第１の画像特徴を得るために用いられる。ここで、各サンプル画像は、オブジェクト対象が本物種別である実際確率を示すラベルを有する。１つの実施例において、この第１の特徴取得モジュール６１０は、前文に説明した操作Ｓ２１０を実行するために用いられ、ここで説明を繰り返さない。

第１の予測モジュール６２０は、第１の画像特徴を分類ネットワークに入力して、各サンプル画像におけるオブジェクト対象が本物種別である第１の予測確率を得るために用いられる。１つの実施例において、この第１の予測モジュール６２０は、前文に説明した操作Ｓ２２０を実行するために用いられ、ここで説明を繰り返さない。

第２の予測モジュール６３０は、第１の画像特徴と所定特徴シーケンスにおける各特徴との間の類似度に基づいて、各サンプル画像におけるオブジェクト対象が非本物種別である第２の予測確率を特定するために用いられる。ここで、各特徴はラベルが示す実際確率がゼロである第１のサンプル画像の第２の画像特徴である。１つの実施例において、この第２の予測モジュール６３０は、前文に説明した操作Ｓ２３０を実行するために用いられ、ここで説明を繰り返さない。

モデルトレーニングモジュール６４０は、第１の予測確率と、第２の予測確率と、実際確率とに基づいて、生体検出モデルをトレーニングするために用いられる。１つの実施例において、このモデルトレーニングモジュール６４０は、前文に説明した操作Ｓ２４０を実行するために用いられ、ここで説明を繰り返さない。

本開示の実施例によれば、所定特徴シーケンスはキュー形式である。上記生体検出モデルのトレーニング装置６００は、複数のサンプル画像のうちの第２のサンプル画像の第１の画像特徴を用いて、所定特徴シーケンスを更新するためのシーケンス更新モジュールをさらに含んでもよい。ここで、第２のサンプル画像のラベルが示す実際確率はゼロである。

本開示の実施例によれば、第２の予測モジュール６３０は、ベクトル取得サブモジュールと確率特定サブモジュールとを含んでもよい。ベクトル取得サブモジュールは、第１の画像特徴と特徴シーケンスにおける各特徴との間の内積を特定し、第１の画像特徴と特徴シーケンスとの間の類似度ベクトルを得るために用いられる。ここで、類似度ベクトルにおける各要素の値は、各サンプル画像におけるオブジェクト対象と第１のサンプル画像におけるオブジェクト対象とが同一種別に属する確率値を示す。確率特定サブモジュールは、類似度ベクトルのうちの最大値を、各サンプル画像におけるオブジェクト対象が非本物種別である第２の予測確率として特定するために用いられる。

本開示の実施例によれば、特徴抽出ネットワークは特徴抽出サブネットワークと正規化サブネットワークとを含む。上記第１の特徴取得モジュールは、特徴抽出サブモジュールと正規化サブモジュールとを含んでもよい。特徴抽出サブモジュールは、複数のサンプル画像を特徴抽出サブネットワークに入力して、複数のサンプル画像のそれぞれの初期特徴を得るために用いられる。正規化サブモジュールは、各サンプル画像の初期特徴を正規化サブネットワークに入力して、各サンプル画像の第１の画像特徴を得るために用いられる。

本開示の実施例によれば、上記モデルトレーニングモジュール６４０は、損失特定サブモジュールとトレーニングサブモジュールとを含んでもよい。損失特定サブモジュールは、第１の予測確率と、第２の予測確率と、実際確率とに基づいて、交差エントロピー損失関数を用いて生体検出モデルの損失を特定するために用いられる。トレーニングサブモジュールは、損失に基づいて、生体検出モデルをトレーニングするために用いられる。

本開示が提供した生体検出モデルを用いて生体検出を行う方法によれば、本開示は、生体検出モデルを用いて生体検出を行う装置をさらに提供している。以下、図７を参照してこの装置を詳細に説明する。

図７は、本開示の実施例による生体検出モデルを用いて生体検出を行う装置の構成ブロック図である。

図７に示すように、この実施例の生体検出モデルを用いて生体検出を行う装置７００は、第２の特徴取得モジュール７１０と確率取得モジュール７２０とを含んでもよい。この生体検出モデルは、特徴抽出ネットワークと分類ネットワークとを含む。例えば、この生体検出モデルは、前文に説明した生体検出モデルのトレーニング装置を用いてトレーニングされたものであってもよい。

第２の特徴取得モジュール７１０は、オブジェクト対象を含む検出すべき画像を特徴抽出ネットワークに入力して、検出すべき画像の第３の画像特徴を得るために用いられる。１つの実施例において、この第２の特徴取得モジュール７１０は、前文に説明した操作Ｓ５１０を実行するために用いられ、ここで説明を繰り返さない。

確率取得モジュール７２０は、第３の画像特徴を分類ネットワークに入力して、検出すべき画像におけるオブジェクト対象が本物種別である確率を得るために用いられる。１つの実施例において、この確率取得モジュール７２０は、前文に説明した操作Ｓ５２０を実行するために用いられ、ここで説明を繰り返さない。

なお、本開示の技術案では、係られたユーザ個人情報の取得、収集、記憶、応用、加工、伝送、提供及び開示などの処理は、いずれも関連法律や法規の規定に合致しており、公序良俗に反していない。

本開示の実施例によれば、本開示は、電子機器、読取可能な記憶媒体及びコンピュータプログラムをさらに提供している。

図８は、本開示の実施例の生体検出モデルのトレーニング方法及び／又は生体検出モデルを用いて生体検出を行う方法を実施することが可能な例示的電子機器８００の模式的ブロック図を示している。電子機器は、様々な形式のデジタルコンピュータを示すことを目的とし、例えば、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、大型コンピュータ及び他の適切なコンピュータである。電子機器は、さらに様々な形式の移動装置を示してもよく、例えば、パーソナルデジタルアシスタント、携帯電話、スマートフォン、ウェアラブル機器及び他の類似の演算装置である。本明細書に示された部材、それらの接続及び関係、並びにそれらの機能は、例示に過ぎず、本明細書に記載された及び／又は要求された本開示の実現を限定しない。

図８に示すように、機器８００は、計算手段８０１を含み、計算手段８０１は、リードオンリーメモリ（ＲＯＭ）８０２に記憶されたコンピュータプログラム又は記憶手段８０８からランダムアクセスメモリ（ＲＡＭ）８０３にロードされたコンピュータプログラムに基づいて、様々な適切な動作及び処理を実行してもよい。ＲＡＭ８０３には、さらに機器８００の操作に必要な様々なプログラム及びデータを記憶してもよい。計算手段８０１、ＲＯＭ８０２、及びＲＡＭ８０３は、バス８０４を介して相互に接続される。入出力（Ｉ／Ｏ）インターフェース８０５も、バス８０４に接続される。

機器８００における複数の部品は、Ｉ／Ｏインターフェース８０５に接続され、例えばキーボード、マウス等の入力手段８０６と、例えば様々な種類のディスプレイ、スピーカ等の出力手段８０７と、例えば磁気ディスク、光ディスク等の記憶手段８０８と、例えばネットワークカード、モデム、無線通信トランシーバ等の通信手段８０９とを含む。通信手段８０９は、機器８００がインターネット等のコンピュータネットワーク及び／又は各種の電気ネットワークを介して他の機器と情報・データをやり取りすることを可能にする。

計算手段８０１は、処理及び演算能力を有する各種の汎用及び／又は専用の処理モジュールであってもよい。計算手段８０１の幾つかの例として、中央処理ユニット（ＣＰＵ）、ＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、各種専用の人工知能（ＡＩ）演算チップ、各種機械学習モデルアルゴリズムをランニングする演算ユニット、ＤＳＰ（ＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｏｒ）、並びに任意の適切なプロセッサ、コントローラ、マイクロコントローラ等が挙げられるが、これらに限定されない。計算手段８０１は、前文で説明した各方法と処理、例えば、生体検出モデルのトレーニング方法及び／又は生体検出モデルを用いて生体検出を行う方法を実行する。例えば、幾つかの実施例において、生体検出モデルのトレーニング方法及び／又は生体検出モデルを用いて生体検出を行う方法は、例えば記憶手段８０８のような機械可読媒体に有形的に含まれるコンピュータソフトウェアプログラムとして実現されてもよい。いくつかの実施例において、コンピュータプログラムの一部又は全部は、ＲＯＭ８０２及び／又は通信手段８０９を介して機器８００にロード及び／又はインストールされてもよい。コンピュータプログラムがＲＡＭ８０３にロードされて計算手段８０１により実行される場合、前文で説明した生体検出モデルのトレーニング方法及び／又は生体検出モデルを用いて生体検出を行う方法の１つ又は複数のステップを実行してもよい。代替的に、他の実施例において、計算手段８０１は、他の任意の適切な方式（例えば、ファームウェアを介する）により生体検出モデルのトレーニング方法及び／又は生体検出モデルを用いて生体検出を行う方法を実行するように構成されてもよい。

本明細書で以上に説明されたシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、特定用途向け集積回路（ＡＳＩＣ）、特定用途向け標準製品（ＡＳＳＰ）、システムオンチップ（ＳＯＣ）、コンプレックスプログラムマブルロジックデバイス（ＣＰＬＤ）、コンピュータハードウェア、ファームウェア、ソフトウェア、及び／又はそれらの組み合わせにおいて実現されてもよい。これらの様々な実施形態は、１つ又は複数のコンピュータプログラムにおいて実施され、該１つ又は複数のコンピュータプログラムは、少なくとも１つのプログラムマブルプロセッサを含むプログラムマブルシステムで実行され及び／又は解釈されることが可能であり、該プログラムマブルプロセッサは、専用又は汎用のプログラムマブルプロセッサであってもよく、記憶システム、少なくとも１つの入力装置、及び少なくとも１つの出力装置からデータ及び命令を受信し、かつデータ及び命令を該記憶システム、該少なくとも１つの入力装置、及び該少なくとも１つの出力装置に伝送することができることを含んでもよい。

本開示の方法を実施するためのプログラムコードは、１つ又は複数のプログラミング言語の任意の組み合わせで作成されてもよい。これらのプログラムコードは、汎用コンピュータ、専用コンピュータ又は他のプログラマブルデータ処理装置のプロセッサ又はコントローラに提供されてもよく、それによって、プログラムコードがプロセッサ又はコントローラにより実行される時に、フローチャート及び／又はブロック図に規定された機能・操作が実施される。プログラムコードは、機器に完全に実行されてもよく、部分的に機器で実行されてもよく、独立したソフトウェアパッケージとして部分的に機器で実行され、かつ部分的に遠隔機器で実行されるか又は完全に遠隔機器又はサーバで実行されてもよい。

本開示のコンテキストにおいて、機械可読媒体は、有形の媒体であってもよく、命令実行システム、装置又は電子機器に使用され、又は命令実行システム、装置又は電子機器と組み合わせて使用されるプログラムを含んで又は記憶してもよい。機械可読媒体は、機械可読信号媒体又は機械可読記憶媒体であってもよい。機械可読媒体は、電子の、磁気的、光学的、電磁的、赤外線の、又は半導体システム、装置又は機器、又は上記内容の任意の適切な組み合わせを含んでもよいが、それらに限定されない。機械可読記憶媒体のより具体的な例としては、１つ以上の線による電気的接続、携帯式コンピュータディスク、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、読み出し専用メモリ（ＲＯＭ）、消去可能なプログラマブルリードオンリーメモリ（ＥＰＲＯＭ又はフラッシュメモリ）、光ファイバ、コンパクトディスクリードオンリーメモリ（ＣＤ-ＲＯＭ）、光学記憶装置、磁気記憶装置、又は上記内容の任意の適切な組み合わせを含む。

ユーザとの対話を提供するために、コンピュータにここで説明されたシステム及び技術を実施させてもよく、該コンピュータは、ユーザに情報を表示するための表示装置（例えば、ＣＲＴ（陰極線管）又はＬＣＤ（液晶ディスプレイ）モニタ）と、キーボード及びポインティングデバイス（例えば、マウス又はトラックボール）とを備え、ユーザは、該キーボード及び該ポインティングデバイスを介して入力をコンピュータに提供することができる。他の種類の装置は、さらにユーザとの対話を提供してもよく、例えば、ユーザに提供されたフィードバックは、いかなる形式のセンシングフィードバック（例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック）であってもよく、かついかなる形式（音声入力、語音入力又は、触覚入力を含む）でユーザからの入力を受信してもよい。

ここで説明されたシステム及び技術は、バックグラウンド部品を含むコンピューティングシステム（例えば、データサーバとする）、又はミドルウェア部品を含むコンピューティングシステム（例えば、アプリケーションサーバ）、又はフロントエンド部品を含むコンピューティングシステム（例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータ、ユーザが該グラフィカルユーザインタフェース又は該ネットワークブラウザを介してここで説明されたシステム及び技術の実施形態と対話することができる）、又はこのようなバックグラウンド部品、ミドルウェア部品、又はフロントエンド部品のいずれかの組み合わせを含むコンピューティングシステムに実施されることが可能である。任意の形式又は媒体のデジタルデータ通信（例えば、通信ネットワーク）によりシステムの部品を互いに接続することができる。通信ネットワークの例としては、ローカルエリアネットワーク（ＬＡＮ）、ワイドエリアネットワーク（ＷＡＮ）及びインターネットを例示的に含む。

コンピュータシステムは、クライアント及びサーバを含んでもよい。クライアントとサーバ同士は、一般的に離れており、通常、通信ネットワークを介して対話する。クライアントとサーバとの関係は、該当するコンピュータ上でランニングし、クライアント－サーバの関係を有するコンピュータプログラムによって生成される。サーバは、クラウドサーバであってもよく、クラウドサーバは、クラウドコンピューティングサーバ又はクラウドホストとも呼ばれ、クラウドコンピューティングサービスシステムのうちの１つのホスト製品であり、従来の物理ホストとＶＰＳサービス（「ＶｉｒｔｕａｌＰｒｉｖａｔｅＳｅｒｖｅｒ」、又は「ＶＰＳ」と略称する）に存在する管理難度が大きく、サービス拡張性が弱いという欠陥を解決する。サーバは、分散型システムのサーバであってもよく、又はブロックチェーンを組合せたサーバであってもよい。

理解されるべきこととして、以上に示された様々な形式のフローを使用してもよく、操作を改めてソーティングしたり、追加したり又は削除してもよい。例えば、本開示に記載の各操作は、並列に実行されたり、順次に実行されたり、又は異なる順序で実行されてもよく、本開示に開示された技術案が所望する結果を実現することができれば、本明細書はここで限定されない。

上記具体的な実施形態は、本開示の保護範囲を限定するものではない。当業者であれば、設計要件及び他の要因に応じて、様々な修正、組み合わせ、サブコンビネーション及び代替を行うことが可能であると理解すべきである。本開示の精神と原則内で行われる任意の修正、均等置換及び改良などは、いずれも本開示の保護範囲内に含まれるべきである。

Claims

生体検出モデルのトレーニング方法であって、前記生体検出モデルは、特徴抽出ネットワークと分類ネットワークとを含み、前記方法は、
オブジェクト対象を含む複数のサンプル画像を前記特徴抽出ネットワークに入力して、前記複数のサンプル画像のうち各サンプル画像の第１の画像特徴を得ており、前記各サンプル画像は前記オブジェクト対象が本物種別である実際確率を示すラベルを有することと、
前記第１の画像特徴を前記分類ネットワークに入力して、前記各サンプル画像におけるオブジェクト対象が本物種別である第１の予測確率を得ることと、
前記第１の画像特徴と、所定特徴シーケンスにおける各特徴との間の類似度に基づいて、前記各サンプル画像におけるオブジェクト対象が非本物種別である第２の予測確率を特定し、前記各特徴は、ラベルが示す実際確率がゼロである第１のサンプル画像の第２の画像特徴であることと、
前記第１の予測確率と、前記第２の予測確率と、前記実際確率とに基づいて、前記生体検出モデルをトレーニングすることと、を含み、
前記所定特徴シーケンスはキュー形式であり、
前記方法は、前記各サンプル画像におけるオブジェクト対象が非本物種別である第２の予測確率を特定した後に、前記複数のサンプル画像のうちの第２のサンプル画像の第１の画像特徴を用いて、前記所定特徴シーケンスを更新することをさらに含み、
ここで、前記第２のサンプル画像のラベルが示す実際確率がゼロであり、
前記生体検出モデルをトレーニングすることは、
前記第１の予測確率と、前記第２の予測確率と、前記実際確率とに基づいて、交差エントロピー損失関数を用いて前記生体検出モデルの損失を特定することと、
前記損失に基づいて、前記生体検出モデルをトレーニングすることと、を含む、
生体検出モデルのトレーニング方法。
前記各サンプル画像におけるオブジェクト対象が非本物種別である第２の予測確率を特定することは、
前記第１の画像特徴と前記所定特徴シーケンスにおける各特徴との間の内積を特定して、前記第１の画像特徴と前記所定特徴シーケンスとの間の類似度ベクトルを得ることであって、前記類似度ベクトルにおける各要素の値は前記各サンプル画像におけるオブジェクト対象と前記第１のサンプル画像におけるオブジェクト対象とが同一種別に属する確率値を示すことと、
前記類似度ベクトルのうちの最大値を、前記各サンプル画像におけるオブジェクト対象が非本物種別である第２の予測確率として特定することと、を含む、
請求項１に記載の方法。
前記特徴抽出ネットワークは、特徴抽出サブネットワークと正規化サブネットワークとを含み、前記オブジェクト対象を含む複数のサンプル画像を前記特徴抽出ネットワークに入力して、前記複数のサンプル画像のうちの各サンプル画像の第１の画像特徴を得ることは、
前記複数のサンプル画像を前記特徴抽出サブネットワークに入力して、前記複数のサンプル画像のうちの各サンプル画像の初期特徴を得ることと、
前記各サンプル画像の初期特徴を前記正規化サブネットワークに入力して、前記各サンプル画像の第１の画像特徴を得ることと、を含む、
請求項１に記載の方法。
生体検出モデルを用いて生体検出を行う方法であって、前記生体検出モデルは、特徴抽出ネットワークと分類ネットワークとを含み、前記方法は、
オブジェクト対象を含む検出すべき画像を前記特徴抽出ネットワークに入力して、前記検出すべき画像の第３の画像特徴を得ることと、
前記第３の画像特徴を前記分類ネットワークに入力して、前記検出すべき画像におけるオブジェクト対象が本物種別である確率を得ることと、を含み、
ここで、前記生体検出モデルは、請求項１に記載の方法を用いてトレーニングされたものである、
生体検出方法。
生体検出モデルのトレーニング装置であって、前記生体検出モデルは、特徴抽出ネットワークと分類ネットワークとを含み、前記装置は、
オブジェクト対象を含む複数のサンプル画像を前記特徴抽出ネットワークに入力して、前記複数のサンプル画像のうちの各サンプル画像の第１の画像特徴を得るためのものであって、前記各サンプル画像は前記オブジェクト対象が本物種別である実際確率を示すラベルを有する第１の特徴取得モジュールと、
前記第１の画像特徴を前記分類ネットワークに入力して、前記各サンプル画像におけるオブジェクト対象が本物種別である第１の予測確率を得るための第１の予測モジュールと、
前記第１の画像特徴と所定特徴シーケンスにおける各特徴との間の類似度に基づいて、前記各サンプル画像におけるオブジェクト対象が非本物種別である第２の予測確率を得るためのものであって、前記各特徴は、ラベルが示す実際確率がゼロである第１のサンプル画像の第２の画像特徴である第２の予測モジュールと、
前記第１の予測確率と、前記第２の予測確率と、前記実際確率とに基づいて、前記生体検出モデルをトレーニングするためのモデルトレーニングモジュールと、を含み、
前記所定特徴シーケンスはキュー形式であって、
前記装置は、前記複数のサンプル画像のうちの第２のサンプル画像の第１の画像特徴を用いて、前記所定特徴シーケンスを更新するためのシーケンス更新モジュールをさらに含み、
ここで、前記第２のサンプル画像のラベルが示す実際確率はゼロであり、
前記モデルトレーニングモジュールは、
前記第１の予測確率と、前記第２の予測確率と、前記実際確率とに基づいて、交差エントロピー損失関数を用いて前記生体検出モデルの損失を特定するための損失特定サブモジュールと、
前記損失に基づいて、前記生体検出モデルをトレーニングするためのトレーニングサブモジュールと、を含む、
生体検出モデルのトレーニング装置。
前記第２の予測モジュールは、
前記第１の画像特徴と前記所定特徴シーケンスにおける各特徴との間の内積を特定して、前記第１の画像特徴と前記所定特徴シーケンスとの間の類似度ベクトルを得るためのものであって、前記類似度ベクトルにおける各要素の値は、前記各サンプル画像におけるオブジェクト対象と前記第１のサンプル画像におけるオブジェクト対象とが同一種別に属する確率値を示すベクトル取得サブモジュールと、
前記類似度ベクトルのうちの最大値を、前記各サンプル画像におけるオブジェクト対象が非本物種別である第２の予測確率として特定するための確率特定サブモジュールと、を含む、
請求項５に記載の装置。
前記特徴抽出ネットワークは特徴抽出サブネットワークと正規化サブネットワークとを含み、前記第１の特徴取得モジュールは、
前記複数のサンプル画像を前記特徴抽出サブネットワークに入力して、前記複数のサンプル画像のうちの各サンプル画像の初期特徴を得るための特徴抽出サブモジュールと、
前記各サンプル画像の初期特徴を前記正規化サブネットワークに入力して、前記各サンプル画像の第１の画像特徴を得るための正規化サブモジュールと、を含む、
請求項５に記載の装置。
生体検出モデルを用いて生体検出を行う装置であって、前記生体検出モデルは、特徴抽出ネットワークと分類ネットワークとを含み、前記装置は、
オブジェクト対象を含む検出すべき画像を前記特徴抽出ネットワークに入力して、前記検出すべき画像の第３の画像特徴を得るための第２の特徴取得モジュールと、
前記第３の画像特徴を前記分類ネットワークに入力して、前記検出すべき画像におけるオブジェクト対象が本物種別である確率を得るための確率取得モジュールと、を含み、
ここで、前記生体検出モデルは、請求項５～７の何れか一項に記載の装置を用いてトレーニングされたものである、
生体検出装置。
少なくとも１つのプロセッサと、
前記少なくとも１つのプロセッサと通信接続するメモリとを有する電子機器であって、
前記メモリに、前記少なくとも１つのプロセッサによって実行され得るコマンドが記憶されており、前記コマンドが前記少なくとも１つのプロセッサによって実行されることで、前記少なくとも１つのプロセッサが請求項１～４のいずれか一項に記載の方法を実行することができる、
電子機器。
コンピュータに請求項１～４のいずれか一項に記載の方法を実行させるためのコンピュータコマンドを記憶している、
非一時的なコンピュータ読取可能な記憶媒体。
プロセッサにより実行される場合に、請求項１～４のいずれか一項に記載の方法を実現するコンピュータプログラム。