JP7148078B2 - 属性推定装置、属性推定方法、属性推定器学習装置、及びプログラム - Google Patents
属性推定装置、属性推定方法、属性推定器学習装置、及びプログラム Download PDFInfo
- Publication number
- JP7148078B2 JP7148078B2 JP2019038279A JP2019038279A JP7148078B2 JP 7148078 B2 JP7148078 B2 JP 7148078B2 JP 2019038279 A JP2019038279 A JP 2019038279A JP 2019038279 A JP2019038279 A JP 2019038279A JP 7148078 B2 JP7148078 B2 JP 7148078B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- attribute
- type
- value
- loss function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1及び図2を参照して、本発明の実施の形態に係る属性推定装置100の構成について説明する。図1は、本発明の実施の形態に係る属性推定装置として機能するコンピュータの概略構成を示すブロック図である。
以下、本実施の形態における属性推定装置100の各処理部について説明する。なお、各処理部の具体的な処理については、後述する各処理の詳細において説明する。
次に、本発明の実施形態に係る属性推定装置100の作用について説明する。第1属性推定器、第2属性推定器、第1画像変換器、及び第2画像変換器の学習処理について先に説明し、その後、属性推定装置100による属性推定処理について説明する。
図3は、本発明の実施の形態に係る属性推定装置の学習処理ルーチンを示すフローチャートである。属性推定装置100は、図3に示す第1画像記憶装置110及び第2画像記憶装置120から第1の種類の画像の集合及び第2の種類の画像の集合を受け付けると、図3に示す学習処理ルーチンを実行する。
ここで、属性推定装置100の学習処理における、各処理部の処理の詳細について説明する。以下、第1の種類の画像の集合に含まれる人工画像をb、第2の種類の画像の集合に含まれる実画像をaと表す。
図4に示した第2学習部104による画像変換器学習処理ルーチンの処理を詳述する。
[参考文献1]Amjad Almahairi, Sai Rajeswar, Alessandro Sordoni, Philip Bachman, Aaron Courville, " Augmented CycleGAN: Learning Many-to-Many Mappings from Unpaired Data." In Proc. International Conference on Machine Learning (ICML), 2018.
第2学習部104は、第1画像変換器及び第2画像変換器のパラメータであるφa及びφbを更新するために、下記に示す一連の損失関数(真偽損失、循環損失、及び属性損失)の値を求め、これらの値を組み合わせた画像変換損失関数の値に基づいてパラメータを反復更新する。
人工画像bを第2画像変換器により変換した“偽物の”実画像a’は、当然のことながら実際の実画像、つまり実画像aに見まがうようなものであることが好ましい。また逆に、実画像aを第1画像変換器により変換した“偽物の”人工画像b’は、当然のことながら実際の人工画像、つまり人工画像bに見まがうようなものであることが好ましい。これを実現するため、本実施の形態では、入力された実画像が、実際の実画像であるか、あるいは、人工画像が変換されたものであるかを表す確率値である実画像真偽確率値を出力する実画像識別器Da、並びに、入力された人工画像が、実際の人工画像であるか、あるいは、実画像が変換されたものであるかを表す確率値である人工画像真偽確率値を出力する人工画像識別器DbをそれぞれCNNにより構成し、用意する。これらのCNNは特別な機能を導入する必要はなく、例えば、参考文献1に開示されているようなものを採ればよい。
関数Gbaが人工画像を実画像に変換し、関数Gabが実画像を人工画像に変換するような関数であるから、これらを順に適用することにより、人工画像→実画像→人工画像…と変換していくことが可能である。このような変換を考えた場合に、最も自然な制約は、ある人工画像bを実画像a’に変換し、再度人工画像に変換した画像b”が、元の人工画像bに戻るように変換される(下記式(7))、あるいは反対に、ある実画像aを人工画像b’に変換し、再度実画像に変換した画像a”が、元の実画像aと戻るように変換されることである(下記式(8))。
いかに“本物”に見まがうような偽物が作れたとしても、変換の前後で本来推定すべき属性値が変化してしまっては、このような属性推定器の学習は成しえない。例えば、顔の画像から、当該人物の年齢を推定するような属性推定器を得たいとする。仮に、年齢を与えれば、その年齢にあった人の顔画像を人工的に生成することができるコンピュータグラフィクスツールがあるとして、その画像を属性値が既知の人工画像として用いることを考えたとする。この際、もし当該人工画像を実画像に変換した際に、例えその人工画像が実際の顔を写した顔写真のように変換できたとしても、写る人物の年齢が変わってしまったとすると、正しい年齢を推定できるような属性推定器にはならない。このような問題を克服すべく、推定の対象となる属性値が変換しないような制約を損失関数として導入することが好ましい。
第2学習部104は、上記式(19)で表される画像変換損失関数LTRANSが大きくなるように人工画像識別器Da及び人工画像識別器Dbのパラメータを反復更新し、上記式(19)で表される画像変換損失関数LTRANSが小さくなるように第1画像変換器(関数Gab)及び第2画像変換器(関数Gba)のパラメータφa及びφbを反復更新する。これにより、望ましい第1画像変換器及び第2画像変換器を得ることができる。反復更新を行う手段としては、例えば確率的勾配降下法など、任意のものを用いることができる。
以上が、画像変換器学習処理の一例である。
図5に示した第1学習部103による属性推定器学習処理ルーチンの処理を詳述する。
[参考文献2]Antti Tarvainen, Harri Valpola, " A Mean Teachers are Better Role Models: Weight-averaged Consistency Targets Improve Semi-supervised Deep Learning Results." In Proc. Neural Information Processing Systems (NIPS), 2017.
第1学習部103は、第1損失関数の値と、第2損失関数の値とが小さくなるように第2属性推定器と共に学習する。第1損失関数は、第1の種類の画像の属性値と、第1画像変換器により前記第2の種類の画像を変換した結果に対して、第1属性推定器により推定した属性値とが近いほど小さい値となる損失関数である。第2損失関数は、第1画像変換器又は第2画像変換器により第1の種類の画像又は第2の種類の画像を変換した結果に対して、第1属性推定器により推定した属性値と、第1画像変換器又は第2画像変換器により第1の種類の画像又は第2の種類の画像を変換した結果に対して、第2属性推定器により推定した属性値とが近いほど小さい値となる損失関数である。
第1学習部103は、上記式(22)で表される属性推定損失関数LESTが小さくなるように、第1属性推定器fのパラメータθを反復更新することにより、望ましい第1属性推定器を得ることができる。反復更新手段としては、例えば確率的勾配降下法など、任意のものを用いることができる。
画素変換作用は、画像変換部101を用いて、元の画像に対してランダムな変換を施す処理であり、このようなものであれば任意の方法を更に採用することができる。
第1学習部103は、第1属性推定器のパラメータθの統計量を基に、第2属性推定器のパラメータηを反復更新する。ここで、利用する統計量は、どのようなものを用いても構わないが、第1属性推定器のパラメータθの更新履歴を用いて統計量を求めるのがよい。t回目の繰り返し回数における第1属性推定器のパラメータをθt、第2属性推定器のパラメータをηt表すとする。例えば、第1学習部103は、t回目までの属性推定器のパラメータθ1、…、θtの平均により、第2属性推定器のパラメータηtを更新する構成としてもよい(下記式(25))。
以上が、属性推定器学習処理の一例である。
次に、属性推定処理について説明する。図6は、本発明の実施の形態に係る属性推定処理ルーチンを示すフローチャートである。入力部107に、属性値が未知の実画像である第2の種類の画像が入力されると、図6に示す属性推定処理ルーチンが実行される。
ここで、属性推定装置100の属性推定処理における、各処理部の処理の詳細について説明する。
11 CPU
12 メモリ
13 通信IF部
14 入力部
15 表示部
16 記憶部
17 プログラム
50 ネットワーク
100 属性推定装置
101 画像変換部
102 学習部
103 第1学習部
104 第2学習部
105 第1属性推定部
106 第2属性推定部
107 入力部
108 出力部
110 第1画像記憶装置
120 第2画像記憶装置
130 記憶部
Claims (5)
- 推定対象である画像の有する属性値を推定する属性推定装置であって、
属性値が既知の人工画像及び実画像の何れか一方である第1の種類の画像と、属性値が未知の画像である人工画像及び実画像の何れか他方である第2の種類の画像を前記第1の種類の画像に変換して得られる画像と、を関連付けることにより学習された第1属性推定器を用いて、入力された前記画像の有する属性値を推定する第1属性推定部を含み、
前記第2の種類の画像の変換は、前記第2の種類の画像を前記第1の種類の画像に変換するための第1画像変換器を用いて行われ、
画像の有する属性値を推定するための前記第1属性推定器は、第1損失関数の値と、第2損失関数の値とが小さくなるように第2属性推定器と共に予め学習されたものであり、
前記第1画像変換器は、第3損失関数の値と、第4損失関数の値とが小さくなるように、前記第1の種類の画像を前記第2の種類の画像に変換するための第2画像変換器と共に予め学習されたものであり、
前記第1損失関数は、前記第1の種類の画像の属性値と、前記第1画像変換器により前記第2の種類の画像を変換した結果に対して、前記第1属性推定器により推定した属性値とが近いほど小さい値となる損失関数であり、
前記第2損失関数は、前記第1画像変換器又は前記第2画像変換器により前記第1の種類の画像又は前記第2の種類の画像を変換した結果に対して、前記第1属性推定器により推定した属性値と、前記第1画像変換器又は前記第2画像変換器により前記第1の種類の画像又は前記第2の種類の画像を変換した結果に対して、前記第2属性推定器により推定した属性値とが近いほど小さい値となる損失関数であり、
前記第3損失関数は、前記第1画像変換器により前記第1の種類の画像を変換した結果の分布が、前記第2の種類の画像の分布に近いほど小さい値となる損失関数であり、
前記第4損失関数は、前記第2画像変換器により前記第2の種類の画像を変換した結果の分布が、前記第1の種類の画像の分布に近いほど小さい値となる損失関数である、
属性推定装置。 - 前記第2の種類の画像の変換は、前記第2の種類の画像を前記第1の種類の画像に変換し、かつ、推定対象の属性以外の少なくとも1つの属性を変更するものである請求項1記載の属性推定装置。
- 推定対象である画像の有する属性値を推定するための第1属性推定器を学習する属性推定器学習装置であって、
属性値が既知の人工画像及び実画像の何れか一方である第1の種類の画像と、属性値が未知の画像である人工画像及び実画像の何れか他方である第2の種類の画像を前記第1の種類の画像に変換して得られる画像と、を関連付けることにより、前記第1属性推定器を学習する学習部を含み、
前記第2の種類の画像の変換は、前記第2の種類の画像を前記第1の種類の画像に変換するための第1画像変換器を用いて行われ、
前記学習部は、
前記第1属性推定器を、第1損失関数の値と、第2損失関数の値とが小さくなるように第2属性推定器と共に学習する第1学習部と、
前記第1画像変換器を、第3損失関数の値と、第4損失関数の値とが小さくなるように、前記第1の種類の画像を前記第2の種類の画像に変換するための第2画像変換器と共に学習する第2学習部と、
を含み、
前記第1損失関数は、前記第1の種類の画像の属性値と、前記第1画像変換器により前記第2の種類の画像を変換した結果に対して、前記第1属性推定器により推定した属性値とが近いほど小さい値となる損失関数であり、
前記第2損失関数は、前記第1画像変換器又は前記第2画像変換器により前記第1の種類の画像又は前記第2の種類の画像を変換した結果に対して、前記第1属性推定器により推定した属性値と、前記第1画像変換器又は前記第2画像変換器により前記第1の種類の画像又は前記第2の種類の画像を変換した結果に対して、前記第2属性推定器により推定した属性値とが近いほど小さい値となる損失関数であり、
前記第3損失関数は、前記第1画像変換器により前記第1の種類の画像を変換した結果の分布が、前記第2の種類の画像の分布に近いほど小さい値となる損失関数であり、
前記第4損失関数は、前記第2画像変換器により前記第2の種類の画像を変換した結果の分布が、前記第1の種類の画像の分布に近いほど小さい値となる損失関数である
属性推定器学習装置。 - 推定対象である画像の有する属性値を推定する属性推定方法であって、
第1属性推定部が、属性値が既知の人工画像及び実画像の何れか一方である第1の種類の画像と、属性値が未知の画像である人工画像及び実画像の何れか他方である第2の種類の画像を前記第1の種類の画像に変換して得られる画像と、を関連付けることにより学習された第1属性推定器を用いて、入力された前記画像の有する属性値を推定する、処理をコンピュータに実行させる属性推定方法おいて、
前記第2の種類の画像の変換は、前記第2の種類の画像を前記第1の種類の画像に変換するための第1画像変換器を用いて行われ、
画像の有する属性値を推定するための前記第1属性推定器は、第1損失関数の値と、第2損失関数の値とが小さくなるように第2属性推定器と共に予め学習されたものであり、
前記第1画像変換器は、第3損失関数の値と、第4損失関数の値とが小さくなるように、前記第1の種類の画像を前記第2の種類の画像に変換するための第2画像変換器と共に予め学習されたものであり、
前記第1損失関数は、前記第1の種類の画像の属性値と、前記第1画像変換器により前記第2の種類の画像を変換した結果に対して、前記第1属性推定器により推定した属性値とが近いほど小さい値となる損失関数であり、
前記第2損失関数は、前記第1画像変換器又は前記第2画像変換器により前記第1の種類の画像又は前記第2の種類の画像を変換した結果に対して、前記第1属性推定器により推定した属性値と、前記第1画像変換器又は前記第2画像変換器により前記第1の種類の画像又は前記第2の種類の画像を変換した結果に対して、前記第2属性推定器により推定した属性値とが近いほど小さい値となる損失関数であり、
前記第3損失関数は、前記第1画像変換器により前記第1の種類の画像を変換した結果の分布が、前記第2の種類の画像の分布に近いほど小さい値となる損失関数であり、
前記第4損失関数は、前記第2画像変換器により前記第2の種類の画像を変換した結果の分布が、前記第1の種類の画像の分布に近いほど小さい値となる損失関数である、
属性推定方法。 - 推定対象である画像の有する属性値を推定する処理をコンピュータに実行させるプログラムであって、
第1属性推定部が、属性値が既知の人工画像及び実画像の何れか一方である第1の種類の画像と、属性値が未知の画像である人工画像及び実画像の何れか他方である第2の種類の画像を前記第1の種類の画像に変換して得られる画像と、を関連付けることにより学習された第1属性推定器を用いて、入力された前記画像の有する属性値を推定する、処理をコンピュータに実行させるプログラムにおいて、
前記第2の種類の画像の変換は、前記第2の種類の画像を前記第1の種類の画像に変換するための第1画像変換器を用いて行われ、
画像の有する属性値を推定するための前記第1属性推定器は、第1損失関数の値と、第2損失関数の値とが小さくなるように第2属性推定器と共に予め学習されたものであり、
前記第1画像変換器は、第3損失関数の値と、第4損失関数の値とが小さくなるように、前記第1の種類の画像を前記第2の種類の画像に変換するための第2画像変換器と共に予め学習されたものであり、
前記第1損失関数は、前記第1の種類の画像の属性値と、前記第1画像変換器により前記第2の種類の画像を変換した結果に対して、前記第1属性推定器により推定した属性値とが近いほど小さい値となる損失関数であり、
前記第2損失関数は、前記第1画像変換器又は前記第2画像変換器により前記第1の種類の画像又は前記第2の種類の画像を変換した結果に対して、前記第1属性推定器により推定した属性値と、前記第1画像変換器又は前記第2画像変換器により前記第1の種類の画像又は前記第2の種類の画像を変換した結果に対して、前記第2属性推定器により推定した属性値とが近いほど小さい値となる損失関数であり、
前記第3損失関数は、前記第1画像変換器により前記第1の種類の画像を変換した結果の分布が、前記第2の種類の画像の分布に近いほど小さい値となる損失関数であり、
前記第4損失関数は、前記第2画像変換器により前記第2の種類の画像を変換した結果の分布が、前記第1の種類の画像の分布に近いほど小さい値となる損失関数である、
プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019038279A JP7148078B2 (ja) | 2019-03-04 | 2019-03-04 | 属性推定装置、属性推定方法、属性推定器学習装置、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019038279A JP7148078B2 (ja) | 2019-03-04 | 2019-03-04 | 属性推定装置、属性推定方法、属性推定器学習装置、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020144411A JP2020144411A (ja) | 2020-09-10 |
JP7148078B2 true JP7148078B2 (ja) | 2022-10-05 |
Family
ID=72353562
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019038279A Active JP7148078B2 (ja) | 2019-03-04 | 2019-03-04 | 属性推定装置、属性推定方法、属性推定器学習装置、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7148078B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022096379A (ja) * | 2020-12-17 | 2022-06-29 | 富士通株式会社 | 画像出力プログラム,画像出力方法および画像出力装置 |
-
2019
- 2019-03-04 JP JP2019038279A patent/JP7148078B2/ja active Active
Non-Patent Citations (1)
Title |
---|
Kangwook Lee, Hoon Kim & Changho Suh,SIMULATED+UNSUPERVISED LEARNING WITH ADAPTIVE DATA GENERATION AND BIDIRECTIONAL MAPPINGS,Conference paper at ICLR 2018,2018年04月30日,p1-15 |
Also Published As
Publication number | Publication date |
---|---|
JP2020144411A (ja) | 2020-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11379722B2 (en) | Method for training generative adversarial network (GAN), method for generating images by using GAN, and computer readable storage medium | |
JP6441980B2 (ja) | 教師画像を生成する方法、コンピュータおよびプログラム | |
CN111507311B (zh) | 一种基于多模态特征融合深度网络的视频人物识别方法 | |
JP7139749B2 (ja) | 画像認識学習装置、画像認識装置、方法、及びプログラム | |
CN111582483A (zh) | 基于空间和通道联合注意力机制的无监督学习光流估计方法 | |
CN114332578A (zh) | 图像异常检测模型训练方法、图像异常检测方法和装置 | |
CN114418030B (zh) | 图像分类方法、图像分类模型的训练方法及装置 | |
US20220237917A1 (en) | Video comparison method and apparatus, computer device, and storage medium | |
US11823490B2 (en) | Non-linear latent to latent model for multi-attribute face editing | |
CN113066034A (zh) | 人脸图像的修复方法与装置、修复模型、介质和设备 | |
Chira et al. | Image super-resolution with deep variational autoencoders | |
JP2020181240A (ja) | データ生成装置、データ生成方法およびプログラム | |
CN112884648A (zh) | 多类模糊图像超分辨率重建的方法和系统 | |
KR20180087735A (ko) | 이미지 분류 장치 및 방법 | |
CN115587924A (zh) | 一种基于循环生成对抗网络的自适应掩膜引导的图像模态转换方法 | |
JP7148078B2 (ja) | 属性推定装置、属性推定方法、属性推定器学習装置、及びプログラム | |
CN107729885B (zh) | 一种基于多重残差学习的人脸增强方法 | |
KR102198480B1 (ko) | 재귀 그래프 모델링을 통한 비디오 요약 생성 장치 및 방법 | |
KR102567128B1 (ko) | 개선된 적대적 어텐션 네트워크 시스템 및 이를 이용한 이미지 생성 방법 | |
JP2019197445A (ja) | 画像認識装置、画像認識方法、およびプログラム | |
CN112270334A (zh) | 一种基于异常点暴露的少样本图像分类方法及系统 | |
CN110889316B (zh) | 一种目标对象识别方法、装置及存储介质 | |
KR102105951B1 (ko) | 추론을 위한 제한된 볼츠만 머신 구축 방법 및 추론을 위한 제한된 볼츠만 머신을 탑재한 컴퓨터 장치 | |
US20190156182A1 (en) | Data inference apparatus, data inference method and non-transitory computer readable medium | |
CN115630361A (zh) | 一种基于注意力蒸馏的联邦学习后门防御方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20190306 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210219 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220126 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220208 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220405 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220830 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220913 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7148078 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |