JPWO2023037494A5 - モデル訓練装置、制御方法、及びプログラム - Google Patents
モデル訓練装置、制御方法、及びプログラム Download PDFInfo
- Publication number
- JPWO2023037494A5 JPWO2023037494A5 JP2023546668A JP2023546668A JPWO2023037494A5 JP WO2023037494 A5 JPWO2023037494 A5 JP WO2023037494A5 JP 2023546668 A JP2023546668 A JP 2023546668A JP 2023546668 A JP2023546668 A JP 2023546668A JP WO2023037494 A5 JPWO2023037494 A5 JP WO2023037494A5
- Authority
- JP
- Japan
- Prior art keywords
- image
- training
- patch
- feature
- feature map
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Description
訓練画像50と出力画像20のそれぞれから得られる複数の特徴マップを利用してパッチワイズ損失を算出する場合、例えばパッチワイズ損失は以下の式(3)で表される。
ここで、L は特徴抽出を行うレイヤの集合を表し、l は1つのレイヤを表す。v^l_s は、出力画像20が入力された特徴抽出モデル110の l 番目のレイヤから出力された特徴マップから得られる、パッチセット s の正例パッチ22に対応する特徴量である。vp^l_s は、訓練画像50が入力された特徴抽出モデル110の l 番目のレイヤから出力された特徴マップから得られる、パッチセット s の正例パッチ52に対応する特徴量である。vn^l_s は、訓練画像50が入力された特徴抽出モデル110の l 番目のレイヤから出力された特徴マップから得られる、パッチセット s の負例パッチ54に対応する特徴量の集合である。なお、記号「^」は上付き文字を表している。
Claims (10)
- 第1環境下のシーンを表す入力画像から第2環境下の前記シーンを表す出力画像を生成するように画像変換モデルの訓練を行う訓練実行部と、
前記訓練に用いる第1画像である訓練画像を取得する取得部と、を有し、
前記画像変換モデルは、前記入力画像の複数の部分領域それぞれから特徴量を抽出して特徴マップを生成する特徴抽出モデルと、前記特徴抽出モデルによって生成される前記特徴マップから前記出力画像を生成する画像生成モデルと、を有し、
前記訓練実行部は、
前記訓練画像を前記画像変換モデルに入力することで、前記訓練画像の特徴マップである第1特徴マップと前記出力画像とを取得し、
前記出力画像を前記特徴抽出モデルに入力することで、前記出力画像の特徴マップである第2特徴マップを取得し、
前記訓練画像の部分領域である第1正例パッチ及び第1負例パッチ、並びに前記出力画像において前記第1正例パッチに対応する位置の部分領域である第2正例パッチのセットであるパッチセットを1つ以上生成し、
前記第1特徴マップ、前記第2特徴マップ、及び前記パッチセットを用いて算出されるパッチワイズ損失を用いて前記画像変換モデルの訓練を行い、
前記訓練実行部は、前記パッチセットの生成において、前記訓練画像に含まれる領域のうち、特定の種別の物体を表す特定領域から重点的に前記第1正例パッチを抽出する、モデル訓練装置。 - 前記訓練実行部は、前記特定領域の中と外のどちらから前記第1正例パッチを抽出するのかを決定する処理を、前記特定領域の中から前記第1正例パッチが抽出される確率が、前記特定領域の外から前記第1正例パッチが抽出される確率よりも高くなるように行い、その決定の結果に基づいて前記第1正例パッチを前記訓練画像から抽出することで、前記第1正例パッチを前記特定領域から重点的に抽出する、請求項1に記載のモデル訓練装置。
- 前記訓練実行部は、前記訓練画像の複数の部分領域それぞれについて、その部分領域が前記第1正例パッチとして抽出される確率である抽出確率を表す抽出確率マップを生成し、その抽出確率マップによって示される前記抽出確率に従って前記訓練画像から前記第1正例パッチを抽出することで、前記第1正例パッチを前記特定領域から重点的に抽出し、
前記訓練実行部は、前記抽出確率マップにおいて、各部分領域に対し、その部分領域と前記特定領域との重複度合いが高いほど高い前記抽出確率を設定する、請求項1に記載のモデル訓練装置。 - 前記訓練実行部は、
前記訓練画像に含まれる前記特定領域によって表される物体について、前記特定の種別よりも細かい分類を表すサブ種別を特定し、
前記抽出確率マップにおいて、各部分領域に対し、その部分領域と前記特定領域との重複度合いが高いほど高く、なおかつ、その部分領域と重複している前記特定領域によって表される物体の前記サブ種別の出現頻度が低いほど高い前記抽出確率を設定する、請求項3に記載のモデル訓練装置。 - 前記訓練実行部は、前記パッチワイズ損失を、前記第1正例パッチに対応する特徴量と前記第2正例パッチに対応する特徴量との類似度が高いほどその大きさが小さくなるように、かつ、前記第1負例パッチに対応する特徴量と前記第2正例パッチに対応する特徴量との類似度が高いほどその大きさが大きくなるように算出する、請求項1から4いずれか一項に記載のモデル訓練装置。
- コンピュータによって実行される制御方法であって、
第1環境下のシーンを表す入力画像から第2環境下の前記シーンを表す出力画像を生成するように画像変換モデルの訓練を行う訓練実行ステップと、
前記訓練に用いる第1画像である訓練画像を取得する取得ステップと、を有し、
前記画像変換モデルは、前記入力画像の複数の部分領域それぞれから特徴量を抽出して特徴マップを生成する特徴抽出モデルと、前記特徴抽出モデルによって生成される前記特徴マップから前記出力画像を生成する画像生成モデルと、を有し、
前記訓練実行ステップにおいて、
前記訓練画像を前記画像変換モデルに入力することで、前記訓練画像の特徴マップである第1特徴マップと前記出力画像とを取得し、
前記出力画像を前記特徴抽出モデルに入力することで、前記出力画像の特徴マップである第2特徴マップを取得し、
前記訓練画像の部分領域である第1正例パッチ及び第1負例パッチ、並びに前記出力画像において前記第1正例パッチに対応する位置の部分領域である第2正例パッチのセットであるパッチセットを1つ以上生成し、
前記第1特徴マップ、前記第2特徴マップ、及び前記パッチセットを用いて算出されるパッチワイズ損失を用いて前記画像変換モデルの訓練を行い、
前記訓練実行ステップにおいて、前記パッチセットの生成において、前記訓練画像に含まれる領域のうち、特定の種別の物体を表す特定領域から重点的に前記第1正例パッチを抽出する、制御方法。 - コンピュータに、
第1環境下のシーンを表す入力画像から第2環境下の前記シーンを表す出力画像を生成するように画像変換モデルの訓練を行う訓練実行ステップと、
前記訓練に用いる第1画像である訓練画像を取得する取得ステップと、を実行させ、
前記画像変換モデルは、前記入力画像の複数の部分領域それぞれから特徴量を抽出して特徴マップを生成する特徴抽出モデルと、前記特徴抽出モデルによって生成される前記特徴マップから前記出力画像を生成する画像生成モデルと、を有し、
前記訓練実行ステップにおいて、
前記訓練画像を前記画像変換モデルに入力することで、前記訓練画像の特徴マップである第1特徴マップと前記出力画像とを取得し、
前記出力画像を前記特徴抽出モデルに入力することで、前記出力画像の特徴マップである第2特徴マップを取得し、
前記訓練画像の部分領域である第1正例パッチ及び第1負例パッチ、並びに前記出力画像において前記第1正例パッチに対応する位置の部分領域である第2正例パッチのセットであるパッチセットを1つ以上生成し、
前記第1特徴マップ、前記第2特徴マップ、及び前記パッチセットを用いて算出されるパッチワイズ損失を用いて前記画像変換モデルの訓練を行い、
前記訓練実行ステップにおいて、前記パッチセットの生成において、前記訓練画像に含まれる領域のうち、特定の種別の物体を表す特定領域から重点的に前記第1正例パッチを抽出する、プログラム。 - 第1環境下のシーンを表す入力画像から第2環境下の前記シーンを表す出力画像を生成するように画像変換モデルの訓練を行う訓練実行部と、
前記訓練に用いる第1画像である訓練画像を取得する取得部と、を有し、
前記画像変換モデルは、前記入力画像の複数の部分領域それぞれから特徴量を抽出して特徴マップを生成する特徴抽出モデルと、前記特徴抽出モデルによって生成される前記特徴マップから前記出力画像を生成する画像生成モデルと、を有し、
前記訓練実行部は、
前記訓練画像を前記画像変換モデルに入力することで、前記訓練画像の特徴マップである第1特徴マップと前記出力画像とを取得し、
前記出力画像を前記特徴抽出モデルに入力することで、前記出力画像の特徴マップである第2特徴マップを取得し、
前記訓練画像の一部の領域である第1正例パッチ及び第1負例パッチ、並びに前記出力画像において前記第1正例パッチに対応する位置の領域である第2正例パッチのセットであるパッチセットを複数抽出し、
各前記パッチセットについて、前記第1特徴マップによって示される前記第1正例パッチに対応する特徴量と前記第2特徴マップによって示される前記第2正例パッチに対応する特徴量との類似度が高いほどその大きさが小さくなるように、かつ、前記第1特徴マップによって示される前記第1負例パッチに対応する特徴量と前記第2特徴マップによって示される前記第2正例パッチに対応する特徴量との類似度が高いほどその大きさが大きくなるように損失を算出し、
各前記パッチセットについて算出された損失を用いて、特定の種別の物体を表す特定領域の中から抽出された前記第1正例パッチを含む前記パッチセットについて算出された損失の影響が、前記特定領域の外から抽出された前記第1正例パッチを含む前記パッチセットについて算出された損失の影響よりも大きくなるようにパッチワイズ損失を算出し、
前記パッチワイズ損失を用いて前記画像変換モデルの訓練を行う、モデル訓練装置。 - コンピュータによって実行される制御方法であって、
第1環境下のシーンを表す入力画像から第2環境下の前記シーンを表す出力画像を生成するように画像変換モデルの訓練を行う訓練実行ステップと、
前記訓練に用いる第1画像である訓練画像を取得する取得ステップと、を有し、
前記画像変換モデルは、前記入力画像の複数の部分領域それぞれから特徴量を抽出して特徴マップを生成する特徴抽出モデルと、前記特徴抽出モデルによって生成される前記特徴マップから前記出力画像を生成する画像生成モデルと、を有し、
前記訓練実行ステップにおいて、
前記訓練画像を前記画像変換モデルに入力することで、前記訓練画像の特徴マップである第1特徴マップと前記出力画像とを取得し、
前記出力画像を前記特徴抽出モデルに入力することで、前記出力画像の特徴マップである第2特徴マップを取得し、
前記訓練画像の一部の領域である第1正例パッチ及び第1負例パッチ、並びに前記出力画像において前記第1正例パッチに対応する位置の領域である第2正例パッチのセットであるパッチセットを複数抽出し、
各前記パッチセットについて、前記第1特徴マップによって示される前記第1正例パッチに対応する特徴量と前記第2特徴マップによって示される前記第2正例パッチに対応する特徴量との類似度が高いほどその大きさが小さくなるように、かつ、前記第1特徴マップによって示される前記第1負例パッチに対応する特徴量と前記第2特徴マップによって示される前記第2正例パッチに対応する特徴量との類似度が高いほどその大きさが大きくなるように損失を算出し、
各前記パッチセットについて算出された損失を用いて、特定の種別の物体を表す特定領域の中から抽出された前記第1正例パッチを含む前記パッチセットについて算出された損失の影響が、前記特定領域の外から抽出された前記第1正例パッチを含む前記パッチセットについて算出された損失の影響よりも大きくなるようにパッチワイズ損失を算出し、
前記パッチワイズ損失を用いて前記画像変換モデルの訓練を行う、制御方法。 - コンピュータに、
第1環境下のシーンを表す入力画像から第2環境下の前記シーンを表す出力画像を生成するように画像変換モデルの訓練を行う訓練実行ステップと、
前記訓練に用いる第1画像である訓練画像を取得する取得ステップと、を実行させ、
前記画像変換モデルは、前記入力画像の複数の部分領域それぞれから特徴量を抽出して特徴マップを生成する特徴抽出モデルと、前記特徴抽出モデルによって生成される前記特徴マップから前記出力画像を生成する画像生成モデルと、を有し、
前記訓練実行ステップにおいて、
前記訓練画像を前記画像変換モデルに入力することで、前記訓練画像の特徴マップである第1特徴マップと前記出力画像とを取得し、
前記出力画像を前記特徴抽出モデルに入力することで、前記出力画像の特徴マップである第2特徴マップを取得し、
前記訓練画像の一部の領域である第1正例パッチ及び第1負例パッチ、並びに前記出力画像において前記第1正例パッチに対応する位置の領域である第2正例パッチのセットであるパッチセットを複数抽出し、
各前記パッチセットについて、前記第1特徴マップによって示される前記第1正例パッチに対応する特徴量と前記第2特徴マップによって示される前記第2正例パッチに対応する特徴量との類似度が高いほどその大きさが小さくなるように、かつ、前記第1特徴マップによって示される前記第1負例パッチに対応する特徴量と前記第2特徴マップによって示される前記第2正例パッチに対応する特徴量との類似度が高いほどその大きさが大きくなるように損失を算出し、
各前記パッチセットについて算出された損失を用いて、特定の種別の物体を表す特定領域の中から抽出された前記第1正例パッチを含む前記パッチセットについて算出された損失の影響が、前記特定領域の外から抽出された前記第1正例パッチを含む前記パッチセットについて算出された損失の影響よりも大きくなるようにパッチワイズ損失を算出し、
前記パッチワイズ損失を用いて前記画像変換モデルの訓練を行う、プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2021/033303 WO2023037494A1 (ja) | 2021-09-10 | 2021-09-10 | モデル訓練装置、制御方法、及び非一時的なコンピュータ可読媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2023037494A1 JPWO2023037494A1 (ja) | 2023-03-16 |
JPWO2023037494A5 true JPWO2023037494A5 (ja) | 2023-11-10 |
Family
ID=
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021036059A1 (zh) | 图像转换模型训练方法、异质人脸识别方法、装置及设备 | |
CN103279936B (zh) | 基于画像的人脸伪照片自动合成及修正方法 | |
CN109034210A (zh) | 基于超特征融合与多尺度金字塔网络的目标检测方法 | |
CN108961272A (zh) | 一种基于深度卷积对抗生成网络的皮肤病图像的生成方法 | |
JP5505409B2 (ja) | 特徴点生成システム、特徴点生成方法および特徴点生成プログラム | |
CN103425996B (zh) | 一种并行分布式的大规模图像识别方法 | |
JPWO2020059527A1 (ja) | フォント作成装置、フォント作成方法及びフォント作成プログラム | |
CN113888501B (zh) | 一种基于注意力定位网络的无参考型图像质量评价方法 | |
CN107301643A (zh) | 基于鲁棒稀疏表示与拉普拉斯正则项的显著目标检测方法 | |
Shi et al. | A benchmark and baseline for language-driven image editing | |
CN103984954B (zh) | 基于多特征融合的图像合成方法 | |
CN109993135B (zh) | 一种基于增强现实的手势识别方法、系统及装置 | |
de Geus et al. | Variability Evaluation of CNNs using Cross-validation on Viruses Images. | |
JP6318513B2 (ja) | 代表色抽出装置、代表色抽出方法、プログラムおよび記録媒体 | |
CN111709433A (zh) | 一种多特征融合图像识别算法 | |
WO2021179822A1 (zh) | 人体特征点的检测方法、装置、电子设备以及存储介质 | |
JPWO2023037494A5 (ja) | モデル訓練装置、制御方法、及びプログラム | |
Dhanabal et al. | Handwritten Digits Recognition from Images using Serendipity and Orthogonal Schemes | |
JP2012069084A (ja) | 重み付きテンプレートマッチング実行装置およびプログラム | |
CN112508966A (zh) | 一种交互式图像分割方法及系统 | |
Kumar et al. | Performance analysis of KNN, SVM and ANN techniques for gesture recognition system | |
CN113239867B (zh) | 一种基于掩码区域自适应增强的光照变化人脸识别方法 | |
CN116206728A (zh) | 一种基于传感器融合和迁移学习的康复训练方法及系统 | |
CN112613470A (zh) | 一种人脸静默活体检测方法、装置、终端及存储介质 | |
CN105488543B (zh) | 一种获得识别模型的方法及装置 |