JPWO2020162294A1 - 変換方法、訓練装置及び推論装置 - Google Patents
変換方法、訓練装置及び推論装置 Download PDFInfo
- Publication number
- JPWO2020162294A1 JPWO2020162294A1 JP2020571126A JP2020571126A JPWO2020162294A1 JP WO2020162294 A1 JPWO2020162294 A1 JP WO2020162294A1 JP 2020571126 A JP2020571126 A JP 2020571126A JP 2020571126 A JP2020571126 A JP 2020571126A JP WO2020162294 A1 JPWO2020162294 A1 JP WO2020162294A1
- Authority
- JP
- Japan
- Prior art keywords
- space
- probability distribution
- hyperbolic
- hyperbolic space
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 32
- 238000000034 method Methods 0.000 title claims abstract description 18
- 238000012549 training Methods 0.000 title claims description 47
- 238000009826 distribution Methods 0.000 claims abstract description 93
- 238000013519 translation Methods 0.000 claims description 12
- 238000010801 machine learning Methods 0.000 claims description 7
- 238000013528 artificial neural network Methods 0.000 claims description 6
- 239000013598 vector Substances 0.000 description 21
- 238000012545 processing Methods 0.000 description 12
- 238000013507 mapping Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000005070 sampling Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 230000002902 bimodal effect Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 235000012907 honey Nutrition 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
- G06F16/322—Trees
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Probability & Statistics with Applications (AREA)
- Complex Calculations (AREA)
- Image Analysis (AREA)
Abstract
Description
まず、本実施形態の理論的構成について説明する。
任意のμ,ν∈Hnに対して、平行移動PTν→μは、接空間TνHn上のベクトルを測地線に沿って、かつ、計量テンソルを変えずに、接空間TνHnから接空間TμHnに移動させる写像と定義される。したがって、PTν→μを平行移動とすれば、任意のv,v’∈TνHnに対して、<PTν→μ(v),PTν→μ(v’)>L=<v,v’>Lが成り立つ。
任意のu∈TμHnに対して、γμ(0)=μ、かつ、
上記で説明した平行移動PTμ0→μ及び指数写像expμは共に微分可能であるため、その合成写像も微分可能である。つまり、
一実施例として、本実施形態を変分オートエンコーダ(VAE:Variational Autoencoder)に応用する場合について説明する。本実施例では、変分オートエンコーダに含まれるエンコーダの出力を用いてガウス分布から擬双曲ガウス分布を得て、この擬双曲ガウス分布からサンプリングされる点を潜在変数としてデコーダに入力する。すなわち、図3に示されるように、変分オートエンコーダに含まれるエンコーダ110にデータx入力して、μ及びσを得る。次に、上記のS1及びS2で説明したように、このσで決定されるガウス分布からベクトルv∈Tμ0Hnを得る。そして、上記のS3で説明したように、μを用いた平行移動PTμ0→μによりベクトルvを移動させてベクトルuを得た後、上記のS4で説明したように、指数写像expμによりベクトルuを双曲空間Hn上に写像して潜在変数z∈Hnを得る。この潜在変数zは、変分オートエンコーダに含まれるデコーダ120に入力され、データ^xが出力される。なお、「^x」は、xの推論結果を表す。
以降では、訓練データセットを用いて変分オートエンコーダを訓練(学習)する訓練装置10について説明する。なお、訓練データセットをD={x(1),x(2),・・・,x(N)}と表す。各x(i)は訓練データ、Nは訓練データ数である。上述したように、訓練データセットは何等かの階層構造を有していてもよい。
一実施形態に係る訓練装置10の機能構成を図4に示す。図4は、一実施形態に係る訓練装置10の機能構成の一例を示す図である。
一実施形態に係る訓練処理の流れを図5に示す。図5は、一実施形態に係る訓練処理の一例を示すフローチャートである。
以降では、訓練済みの変分オートエンコーダを用いて推論を行う推論装置20について説明する。
一実施形態に係る推論装置20の機能構成を図6に示す。図6は、一実施形態に係る推論装置20の機能構成の一例を示す図である。
一実施形態に係る推論処理の流れを図7に示す。図7は、一実施形態に係る推論処理の一例を示すフローチャートである。
上記の実施例に係る訓練装置10及び推論装置20は装置又はシステムで実現され、これらの装置、システムは、例えば、図8に示すコンピュータ装置500のハードウェア構成で実現可能である。図8は、コンピュータ装置500のハードウェア構成の一例を示す図である。
20 推論装置
201 エンコード部
202 変換部
203 デコード部
204 訓練部
Claims (13)
- 双曲空間に対して定義された空間上の確率分布を、前記双曲空間上の確率分布に変換するステップをコンピュータが実行する変換方法。
- 前記空間は前記双曲空間に接するよう定義された、請求項1に記載の変換方法。
- 前記変換するステップは、指数写像を用いて、前記空間上の確率分布を、前記双曲空間上の確率分布に変換することを含む、請求項1又は2に記載の変換方法。
- 前記変換するステップは、前記空間上の確率分布の平行移動を含む、請求項1から3のいずれか一項に記載の変換方法。
- 前記確率分布に関するデータの種類はツリー構造を有するものである、請求項1から4のいずれか1項に記載の変換方法。
- 第1のニューラルネットワークで実現され、入力データを符号化するエンコーダと、
前記エンコーダによって符号化された入力データによって定義される、双曲空間に対して定義された空間上の確率分布を、前記双曲空間上の確率分布に変換する変換部と、
第2のニューラルネットワークで実現され、変換された前記双曲空間上の確率分布に基づいて出力データを得るデコーダと、
前記入力データと前記出力データに基づいて、前記第1のニューラルネットワークと前記第2のニューラルネットワークのパラメータを更新する訓練部と、
を備える訓練装置。 - 前記変換部は、指数写像を用いて、前記空間上の確率分布を、前記双曲空間上の確率分布に変換する、請求項6に記載の訓練装置。
- 前記変換部は、前記空間上の確率分布を平行移動させる、請求項6又は7に記載の訓練装置。
- 前記デコーダは、前記双曲空間上の確率分布からサンプリングされたデータを入力して、前記出力データを得る、請求項6から8のいずれか1項に記載の訓練装置。
- 第1の機械学習で実現され、入力データを入力するエンコーダと、
前記エンコーダの出力によって定義される、双曲空間に対して定義された空間上の確率分布を、前記双曲空間上の確率分布に変換する変換部と、
第2の機械学習で実現され、変換された前記双曲空間上の確率分布に基づいて出力データを得るデコーダと、
を備える推論装置。 - 前記変換部は、指数写像を用いて、前記空間上の確率分布を、前記双曲空間上の確率分布に変換する、請求項10に記載の推論装置。
- 前記変換部は、前記空間上の確率分布を平行移動させる、請求項10又は11に記載の推論装置。
- 前記デコーダは、前記双曲空間上の確率分布からサンプリングされたデータを入力して、前記出力データを得る、請求項10から12のいずれか1項に記載の推論装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962802317P | 2019-02-07 | 2019-02-07 | |
US62/802,317 | 2019-02-07 | ||
PCT/JP2020/003260 WO2020162294A1 (ja) | 2019-02-07 | 2020-01-29 | 変換方法、訓練装置及び推論装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2020162294A1 true JPWO2020162294A1 (ja) | 2021-12-16 |
JP7425755B2 JP7425755B2 (ja) | 2024-01-31 |
Family
ID=71948111
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020571126A Active JP7425755B2 (ja) | 2019-02-07 | 2020-01-29 | 変換方法、訓練装置及び推論装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20210406773A1 (ja) |
JP (1) | JP7425755B2 (ja) |
WO (1) | WO2020162294A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022185529A1 (ja) * | 2021-03-05 | 2022-09-09 | 日本電気株式会社 | 学習装置、学習方法、推論装置、推論方法、及び、記録媒体 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7058556B2 (ja) | 2018-05-24 | 2022-04-22 | ヤフー株式会社 | 判定装置、判定方法、および判定プログラム |
-
2020
- 2020-01-29 JP JP2020571126A patent/JP7425755B2/ja active Active
- 2020-01-29 WO PCT/JP2020/003260 patent/WO2020162294A1/ja active Application Filing
-
2021
- 2021-08-03 US US17/444,301 patent/US20210406773A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2020162294A1 (ja) | 2020-08-13 |
US20210406773A1 (en) | 2021-12-30 |
JP7425755B2 (ja) | 2024-01-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3398119B1 (en) | Generative neural networks for generating images using a hidden canvas | |
KR102170199B1 (ko) | 비교 세트를 사용한 입력 예시들 분류 | |
CN111046027B (zh) | 时间序列数据的缺失值填充方法和装置 | |
CN108475505A (zh) | 使用部分条件从输入序列生成目标序列 | |
US11901047B2 (en) | Medical visual question answering | |
EP4006909B1 (en) | Method, apparatus and device for quality control and storage medium | |
US20220207370A1 (en) | Inferring device, training device, inferring method, and training method | |
CN112084301B (zh) | 文本修正模型的训练方法及装置、文本修正方法及装置 | |
CN115409111A (zh) | 命名实体识别模型的训练方法和命名实体识别方法 | |
US20200074277A1 (en) | Fuzzy input for autoencoders | |
US20220358594A1 (en) | Counterfactual e-net learning for contextual enhanced earnings call analysis | |
CN112740200A (zh) | 用于基于共指消解的端到端深度强化学习的系统和方法 | |
JP7425755B2 (ja) | 変換方法、訓練装置及び推論装置 | |
JP7211103B2 (ja) | 系列ラベリング装置、系列ラベリング方法、およびプログラム | |
WO2023116572A1 (zh) | 一种词句生成方法及相关设备 | |
CN115206421B (zh) | 药物重定位方法、重定位模型的训练方法及装置 | |
CN114792097B (zh) | 预训练模型提示向量的确定方法、装置及电子设备 | |
CN110717037A (zh) | 对用户分类的方法和装置 | |
Zhu et al. | A hybrid model for nonlinear regression with missing data using quasilinear kernel | |
CN115270719A (zh) | 基于多模态信息的文本摘要生成方法、训练方法及其装置 | |
CN111724487B (zh) | 一种流场数据可视化方法、装置、设备及存储介质 | |
CN111475618B (zh) | 用于生成信息的方法和装置 | |
CN113935338A (zh) | 基于层预测的语言翻译的方法、设备、装置和介质 | |
CN114912568A (zh) | 数据处理的方法、设备和计算机可读存储介质 | |
CN114510592A (zh) | 图像分类方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210803 |
|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A801 Effective date: 20210902 |
|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20210902 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230124 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240109 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240119 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7425755 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |