JP7119865B2 - 情報処理方法及び装置、並びに情報検出方法及び装置 - Google Patents
情報処理方法及び装置、並びに情報検出方法及び装置 Download PDFInfo
- Publication number
- JP7119865B2 JP7119865B2 JP2018188151A JP2018188151A JP7119865B2 JP 7119865 B2 JP7119865 B2 JP 7119865B2 JP 2018188151 A JP2018188151 A JP 2018188151A JP 2018188151 A JP2018188151 A JP 2018188151A JP 7119865 B2 JP7119865 B2 JP 7119865B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- distribution
- images
- latent
- latent variables
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Description
(外1)
、
(外2)
及び
(外3)
は画像xi a、xi p及びxi nの潜在変数の分布をそれぞれ表し、
(外4)
は画像xi aとxi pの間の潜在変数の分布の第1距離であり、
(外5)
は画像xi aとxi nの間の潜在変数の分布の第2距離であり、+は、[]内の値がゼロよりも大きい場合に該値を損失とし、ゼロよりも小さい場合に損失がゼロであることを表す。tは所定の閾値であり、当業者が経験に基づいて設定されてもよく、例えばtを0に設定してもよい。式(1)から分かるように、損失関数Lmetは、画像xi aの潜在変数の分布と画像xi pの潜在変数の分布との間の第1距離に対して正の相関関係を有し、画像xi aの潜在変数の分布と画像xi nの潜在変数の分布との間の第2距離に対して負の相関関係を有する。該メトリック学習を用いることで、識別性のより良い顔セマンティック特徴を取得できる。
(外6)
と
(外7)
との間の距離と、
(外8)
と
(外9)
との間の距離との間には、最小の間隔がある。例えば、式(1)における所定の閾値tをゼロでない値に設定してもよく、例えばtを1に設定してもよい。
(外12)
は総教師誤差であり、Lmetは距離メトリックに基づく損失関数であり、KL(P||Q)は潜在変数の分布と潜在変数の事前分布とのKLダイバージェンスであり、KL(S||G)は中間変数の分布と標準ガウス分布とのKLダイバージェンスであり、α及びβは定数であり、その値が[0,1]の範囲内にある。総誤差関数を最小化するように、VAEのパラメータを更新してもよい。
また、上述の各実施例を含む実施形態に関し、更に以下の付記を開示する。
(付記1)
訓練セットから同一のセマンティック特徴に対応する3つの画像を抽出するステップであって、前記3つの画像は、前記セマンティック特徴について同一のセマンティック特徴値を有する第1画像及び第2画像、並びに前記第1画像及び前記第2画像と異なるセマンティック特徴値を有する第3画像を含む、ステップと、
変分オートエンコーダ(VAE)により、前記3つの画像の前記セマンティック特徴に対応する潜在変数の分布を取得するステップと、
前記3つの画像の各画像について、損失関数を最小化するように前記VAEのパラメータを更新するステップであって、前記損失関数は、前記第1画像の潜在変数の分布と前記第2画像の潜在変数の分布との間の第1距離に対して正の相関関係を有し、前記第1画像の潜在変数の分布と前記第3画像の潜在変数の分布との間の第2距離に対して負の相関関係を有する、ステップと、を含む、情報処理方法。
(付記2)
前記損失関数は、前記第2距離と前記第1距離との差が所定の閾値よりも大きいという制約をさらに含む、付記1に記載の情報処理方法。
(付記3)
前記損失関数は、教師誤差に関する制約をさらに含み、
前記教師誤差は、前記セマンティック特徴のラベル及び画像の前記潜在変数の分布に基づいて算出されたものである、付記2に記載の情報処理方法。
(付記4)
前記教師誤差を算出するステップは、
非線形関数を用いて画像の前記潜在変数の分布をクラス空間にマッピングしてマッピング出力を取得するステップと、
分類損失関数又は回帰損失関数を用いて、前記マッピング出力及び前記セマンティック特徴のラベルに基づいて前記教師誤差を算出するステップと、を含む、付記3に記載の情報処理方法。
(付記5)
画像の前記潜在変数の事前分布は任意の分布を含む、付記3に記載の情報処理方法。
(付記6)
画像の前記潜在変数の事前分布を取得するステップは、
前記潜在変数の分布に基づいて、ガウス分布に従う中間変数を取得するステップと、
前記中間変数に対して非線形変換を行い、前記潜在変数の事前分布を取得するステップと、を含む、付記5に記載の情報処理方法。
(付記7)
前記損失関数は、前記潜在変数の分布と前記潜在変数の事前分布とのカルバック・ライブラー・ダイバージェンス(KLダイバージェンス)に関する制約、及び前記中間変数の分布と標準ガウス分布とのKLダイバージェンスに関する制約をさらに含む、付記6に記載の情報処理方法。
(付記8)
前記損失関数は、再構築誤差に関する制約をさらに含み、
前記再構築誤差は、前記VAEに出力された画像と該画像に対応する前記VAEから出力された画像との差異を評価するために用いられる、付記7に記載の情報処理方法。
(付記9)
訓練セットから同一のセマンティック特徴に対応する3つの画像を抽出する画像抽出手段であって、前記3つの画像は、前記セマンティック特徴について同一のセマンティック特徴値を有する第1画像及び第2画像、並びに前記第1画像及び前記第2画像と異なるセマンティック特徴値を有する第3画像を含む、画像抽出手段と、
変分オートエンコーダ(VAE)により、前記3つの画像の前記セマンティック特徴に対応する潜在変数の分布を取得する潜在変数分布取得手段と、
前記3つの画像の各画像について、損失関数を最小化するように前記VAEのパラメータを更新するパラメータ更新手段であって、前記損失関数は、前記第1画像の潜在変数の分布と前記第2画像の潜在変数の分布との間の第1距離に対して正の相関関係を有し、前記第1画像の潜在変数の分布と前記第3画像の潜在変数の分布との間の第2距離に対して負の相関関係を有する、パラメータ更新手段と、を含む、情報処理装置。
(付記10)
前記損失関数は、前記第2距離と前記第1距離との差が所定の閾値よりも大きいという制約をさらに含む、付記9に記載の情報処理装置。
(付記11)
前記損失関数は、教師誤差に関する制約をさらに含み、
前記教師誤差は、前記セマンティック特徴のラベル及び画像の前記潜在変数の分布に基づいて算出されたものである、付記10に記載の情報処理装置。
(付記12)
前記教師誤差を算出するステップは、
非線形関数を用いて画像の前記潜在変数の分布をクラス空間にマッピングしてマッピング出力を取得するステップと、
分類損失関数又は回帰損失関数を用いて、前記マッピング出力及び前記セマンティック特徴のラベルに基づいて前記教師誤差を算出するステップと、を含む、付記11に記載の情報処理装置。
(付記13)
画像の前記潜在変数の事前分布は任意の分布を含む、付記11に記載の情報処理装置。
(付記14)
画像の前記潜在変数の事前分布を取得するステップは、
前記潜在変数の分布に基づいて、ガウス分布に従う中間変数を取得するステップと、
前記中間変数に対して非線形変換を行い、前記潜在変数の事前分布を取得するステップと、を含む、付記13に記載の情報処理装置。
(付記15)
前記損失関数は、前記潜在変数の分布と前記潜在変数の事前分布とのカルバック・ライブラー・ダイバージェンス(KLダイバージェンス)に関する制約、及び前記中間変数の分布と標準ガウス分布とのKLダイバージェンスに関する制約をさらに含む、付記14に記載の情報処理装置。
(付記16)
前記損失関数は、再構築誤差に関する制約をさらに含み、
前記再構築誤差は、前記VAEに出力された画像と該画像に対応する前記VAEから出力された画像との差異を評価するために用いられる、付記15に記載の情報処理装置。
(付記17)
訓練された変分オートエンコーダ(VAE)に複数の画像をそれぞれ入力し、各画像のセマンティック特徴に対応する潜在変数の分布を取得し、各画像の再構築画像を取得するステップ、を含み、
前記複数の画像のうち同一のセマンティック特徴を有する3つの画像について、前記3つの画像は、前記セマンティック特徴について同一のセマンティック特徴値を有する第1画像及び第2画像、並びに前記第1画像及び前記第2画像と異なるセマンティック特徴値を有する第3画像を含み、
前記第1画像の潜在変数の分布と前記第2画像の潜在変数の分布との間の第1距離は、前記第1画像の潜在変数の分布と前記第3画像の潜在変数の分布との間の第2距離よりも小さい、情報検出方法。
Claims (10)
- 訓練セットから同一のセマンティック特徴に対応する3つの画像を抽出するステップであって、前記3つの画像は、前記セマンティック特徴について同一のセマンティック特徴値を有する第1画像及び第2画像、並びに前記第1画像及び前記第2画像と異なるセマンティック特徴値を有する第3画像を含む、ステップと、
変分オートエンコーダ(VAE)により、前記3つの画像の前記セマンティック特徴に対応する潜在変数の分布を取得するステップと、
前記3つの画像の各画像について、損失関数を最小化するように前記VAEのパラメータを更新するステップであって、前記損失関数は、前記第1画像の潜在変数の分布と前記第2画像の潜在変数の分布との間の第1距離に対して正の相関関係を有し、前記第1画像の潜在変数の分布と前記第3画像の潜在変数の分布との間の第2距離に対して負の相関関係を有する、ステップと、を含む、情報処理方法。 - 前記損失関数は、前記第2距離と前記第1距離との差が所定の閾値よりも大きいという制約をさらに含む、請求項1に記載の情報処理方法。
- 前記損失関数は、教師誤差に関する制約をさらに含み、
前記教師誤差は、前記セマンティック特徴のラベル及び画像の前記潜在変数の分布に基づいて算出されたものである、請求項2に記載の情報処理方法。 - 前記教師誤差を算出するステップは、
非線形関数を用いて画像の前記潜在変数の分布をクラス空間にマッピングしてマッピング出力を取得するステップと、
分類損失関数又は回帰損失関数を用いて、前記マッピング出力及び前記セマンティック特徴のラベルに基づいて前記教師誤差を算出するステップと、を含む、請求項3に記載の情報処理方法。 - 画像の前記潜在変数の事前分布は任意の分布を含む、請求項3に記載の情報処理方法。
- 画像の前記潜在変数の事前分布を取得するステップは、
前記潜在変数の分布に基づいて、ガウス分布に従う中間変数を取得するステップと、
前記中間変数に対して非線形変換を行い、前記潜在変数の事前分布を取得するステップと、を含む、請求項5に記載の情報処理方法。 - 前記損失関数は、前記潜在変数の分布と前記潜在変数の事前分布とのカルバック・ライブラー・ダイバージェンス(KLダイバージェンス)に関する制約、及び前記中間変数の分布と標準ガウス分布とのKLダイバージェンスに関する制約をさらに含む、請求項6に記載の情報処理方法。
- 前記損失関数は、再構築誤差に関する制約をさらに含み、
前記再構築誤差は、前記VAEに出力された画像と該画像に対応する前記VAEから出力された画像との差異を評価するために用いられる、請求項7に記載の情報処理方法。 - 訓練セットから同一のセマンティック特徴に対応する3つの画像を抽出する画像抽出手段であって、前記3つの画像は、前記セマンティック特徴について同一のセマンティック特徴値を有する第1画像及び第2画像、並びに前記第1画像及び前記第2画像と異なるセマンティック特徴値を有する第3画像を含む、画像抽出手段と、
変分オートエンコーダ(VAE)により、前記3つの画像の前記セマンティック特徴に対応する潜在変数の分布を取得する潜在変数分布取得手段と、
前記3つの画像の各画像について、損失関数を最小化するように前記VAEのパラメータを更新するパラメータ更新手段であって、前記損失関数は、前記第1画像の潜在変数の分布と前記第2画像の潜在変数の分布との間の第1距離に対して正の相関関係を有し、前記第1画像の潜在変数の分布と前記第3画像の潜在変数の分布との間の第2距離に対して負の相関関係を有する、パラメータ更新手段と、を含む、情報処理装置。 - 訓練された変分オートエンコーダ(VAE)に複数の画像をそれぞれ入力し、各画像のセマンティック特徴に対応する潜在変数の分布を取得し、各画像の再構築画像を取得するステップ、を含み、
前記複数の画像のうち同一のセマンティック特徴を有する3つの画像について、前記3つの画像は、前記セマンティック特徴について同一のセマンティック特徴値を有する第1画像及び第2画像、並びに前記第1画像及び前記第2画像と異なるセマンティック特徴値を有する第3画像を含み、
前記第1画像の潜在変数の分布と前記第2画像の潜在変数の分布との間の第1距離は、前記第1画像の潜在変数の分布と前記第3画像の潜在変数の分布との間の第2距離よりも小さい、情報検出方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710970935.6 | 2017-10-18 | ||
CN201710970935.6A CN109685087B9 (zh) | 2017-10-18 | 2017-10-18 | 信息处理方法和装置以及信息检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019075108A JP2019075108A (ja) | 2019-05-16 |
JP7119865B2 true JP7119865B2 (ja) | 2022-08-17 |
Family
ID=66182810
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018188151A Active JP7119865B2 (ja) | 2017-10-18 | 2018-10-03 | 情報処理方法及び装置、並びに情報検出方法及び装置 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7119865B2 (ja) |
CN (1) | CN109685087B9 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7254649B2 (ja) * | 2019-07-11 | 2023-04-10 | 株式会社東芝 | 学習装置、診断装置及び学習方法 |
CN110264398B (zh) * | 2019-07-16 | 2021-05-28 | 北京市商汤科技开发有限公司 | 图像处理方法及装置 |
CN111161249B (zh) * | 2019-12-31 | 2023-06-02 | 复旦大学 | 一种基于域适应的无监督医学图像分割方法 |
US11748629B2 (en) | 2020-01-21 | 2023-09-05 | Moxa Inc. | Device and method of handling anomaly detection |
KR102580159B1 (ko) * | 2020-03-05 | 2023-09-19 | 한성대학교 산학협력단 | 자기수렴 생성망 학습 방법 및 시스템 |
US11301724B2 (en) * | 2020-04-30 | 2022-04-12 | Robert Bosch Gmbh | Semantic adversarial generation based function testing method in autonomous driving |
CN111784121B (zh) * | 2020-06-12 | 2022-08-09 | 清华大学 | 基于不确定性分数分布学习的动作质量评价方法 |
CN112133311B (zh) * | 2020-09-18 | 2023-01-17 | 科大讯飞股份有限公司 | 说话人识别方法、相关设备及可读存储介质 |
WO2022176196A1 (ja) * | 2021-02-22 | 2022-08-25 | 日本電信電話株式会社 | 学習装置、学習方法、およびプログラム |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017094267A1 (ja) | 2015-12-01 | 2017-06-08 | 株式会社Preferred Networks | 異常検出システム、異常検出方法、異常検出プログラム及び学習済モデル生成方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9129190B1 (en) * | 2013-12-04 | 2015-09-08 | Google Inc. | Identifying objects in images |
WO2015192263A1 (en) * | 2014-06-16 | 2015-12-23 | Xiaoou Tang | A method and a system for face verification |
WO2017031356A1 (en) * | 2015-08-19 | 2017-02-23 | D-Wave Systems Inc. | Discrete variational auto-encoder systems and methods for machine learning using adiabatic quantum computers |
CN105224948B (zh) * | 2015-09-22 | 2019-03-01 | 清华大学 | 一种基于图像处理的最大间隔深度生成模型的生成方法 |
EP3171297A1 (en) * | 2015-11-18 | 2017-05-24 | CentraleSupélec | Joint boundary detection image segmentation and object recognition using deep learning |
WO2017136083A1 (en) * | 2016-02-05 | 2017-08-10 | Google Inc. | Compressing images using neural networks |
CN107122809B (zh) * | 2017-04-24 | 2020-04-28 | 北京工业大学 | 基于图像自编码的神经网络特征学习方法 |
CN107194868A (zh) * | 2017-05-19 | 2017-09-22 | 成都通甲优博科技有限责任公司 | 一种人脸图像生成方法及装置 |
-
2017
- 2017-10-18 CN CN201710970935.6A patent/CN109685087B9/zh active Active
-
2018
- 2018-10-03 JP JP2018188151A patent/JP7119865B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017094267A1 (ja) | 2015-12-01 | 2017-06-08 | 株式会社Preferred Networks | 異常検出システム、異常検出方法、異常検出プログラム及び学習済モデル生成方法 |
Non-Patent Citations (2)
Title |
---|
尾亦 範泰,オートエンコーダによる低次元化と可視化,可視化情報学会誌 第38巻 第151号,日本,一般社団法人可視化情報学会,2018年,第38巻 第151号,p.9-p.13 |
山田 智輝,β-VAEを用いた字種非依存な筆跡特徴抽出手法の検討,映像情報メディア学会技術報告 Vol.42 No.27,日本,(一社)映像情報メディア学会,2018年,Vol.42 No.27,p.79-p.82 |
Also Published As
Publication number | Publication date |
---|---|
CN109685087B9 (zh) | 2023-02-03 |
JP2019075108A (ja) | 2019-05-16 |
CN109685087A (zh) | 2019-04-26 |
CN109685087B (zh) | 2022-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7119865B2 (ja) | 情報処理方法及び装置、並びに情報検出方法及び装置 | |
Castiglioni et al. | AI applications to medical images: From machine learning to deep learning | |
US11645833B2 (en) | Generative adversarial network medical image generation for training of a classifier | |
US11032585B2 (en) | Real-time synthetically generated video from still frames | |
US11416772B2 (en) | Integrated bottom-up segmentation for semi-supervised image segmentation | |
JP6725547B2 (ja) | 人工ニューラルネットワークの関連性スコア割当て | |
CN109740620B (zh) | 人群画像分类模型的建立方法、装置、设备和存储介质 | |
Emeršič et al. | Convolutional encoder–decoder networks for pixel‐wise ear detection and segmentation | |
Steingrimsson et al. | Deep learning for survival outcomes | |
Darapureddy et al. | Optimal weighted hybrid pattern for content based medical image retrieval using modified spider monkey optimization | |
CN112602155A (zh) | 生成针对经训练的模型的元数据 | |
Yu et al. | A deep residual computation model for heterogeneous data learning in smart Internet of Things | |
US20230359868A1 (en) | Federated learning method and apparatus based on graph neural network, and federated learning system | |
WO2019198026A1 (en) | Deep learning approach for assessing credit risk | |
Vieira et al. | Main concepts in machine learning | |
WO2023065070A1 (zh) | 一种基于领域自适应的多域医学图像分割方法 | |
US11934555B2 (en) | Privacy-preserving data curation for federated learning | |
US20210397905A1 (en) | Classification system | |
Gaggion et al. | Hybrid graph convolutional neural networks for landmark-based anatomical segmentation | |
CN108304568B (zh) | 一种房地产公众预期大数据处理方法及系统 | |
Ampavathi | Research challenges and future directions towards medical data processing | |
Shahin et al. | Survival analysis for idiopathic pulmonary fibrosis using ct images and incomplete clinical data | |
US20220391760A1 (en) | Combining model outputs into a combined model output | |
KR102358050B1 (ko) | 의료 영상 기반의 병변 분석 방법 | |
Mirzargar et al. | Representative Consensus from Limited‐Size Ensembles |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210610 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220530 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220705 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220718 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7119865 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |