JP2021524099A - 異なるデータモダリティの統計モデルを統合するためのシステムおよび方法 - Google Patents
異なるデータモダリティの統計モデルを統合するためのシステムおよび方法 Download PDFInfo
- Publication number
- JP2021524099A JP2021524099A JP2020564186A JP2020564186A JP2021524099A JP 2021524099 A JP2021524099 A JP 2021524099A JP 2020564186 A JP2020564186 A JP 2020564186A JP 2020564186 A JP2020564186 A JP 2020564186A JP 2021524099 A JP2021524099 A JP 2021524099A
- Authority
- JP
- Japan
- Prior art keywords
- modality
- data
- feature vector
- training
- embedding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 296
- 238000013179 statistical model Methods 0.000 title claims abstract description 232
- 239000013598 vector Substances 0.000 claims abstract description 254
- 230000008569 process Effects 0.000 claims abstract description 134
- 230000014509 gene expression Effects 0.000 claims abstract description 28
- 238000012549 training Methods 0.000 claims description 303
- 238000013528 artificial neural network Methods 0.000 claims description 41
- 102000004169 proteins and genes Human genes 0.000 claims description 29
- 108090000623 proteins and genes Proteins 0.000 claims description 29
- 230000015654 memory Effects 0.000 claims description 23
- 230000031018 biological processes and functions Effects 0.000 claims description 10
- 230000004931 aggregating effect Effects 0.000 claims description 8
- 238000013527 convolutional neural network Methods 0.000 claims description 8
- 230000000306 recurrent effect Effects 0.000 claims description 8
- 210000003850 cellular structure Anatomy 0.000 claims description 6
- 230000004879 molecular function Effects 0.000 claims description 6
- 238000011478 gradient descent method Methods 0.000 claims description 2
- 238000002372 labelling Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 18
- 239000011159 matrix material Substances 0.000 description 12
- 238000004422 calculation algorithm Methods 0.000 description 9
- 238000009826 distribution Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 238000005259 measurement Methods 0.000 description 7
- 230000006835 compression Effects 0.000 description 6
- 238000007906 compression Methods 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 5
- 238000013507 mapping Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000011176 pooling Methods 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013479 data entry Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000000455 protein structure prediction Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2155—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H30/00—ICT specially adapted for the handling or processing of medical images
- G16H30/40—ICT specially adapted for the handling or processing of medical images for processing medical images, e.g. editing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
Description
いくつかの実施形態では、訓練工程は、第1訓練段階の前に第1モダリティおよび第2モダリティの第1デコーダおよび第2デコーダのパラメータの値をそれぞれ推定する工程をさらに含む。
いくつかの実施形態では、第1エンコーダはd次元ベクトルを出力するように構成され、共同モダリティ表現はN個のm次元ベクトルを含み、第1モダリティ埋め込みはmxdの重みを含む。
図2Bは、本明細書に記載の技術のいくつかの実施形態による、教師あり学習手法を使用するマルチモーダル統計モデル250の第2訓練段階を示す図である。図2Bに示されるように、マルチモーダル統計モデル250は、予測タスク256の予測子252およびタスク埋め込み254を含む。
<マルチモーダル統計モデルの訓練>
図3は、本明細書に記載の技術のいくつかの実施形態による、第1段階は自己教師あり学習を含み、第2段階は教師あり学習を含む、2段階の訓練手順を使用してマルチモーダル統計モデルを訓練する例示的な処理300のフローチャートである。処理300は、任意の適切なコンピューティング装置によって実行されてよい。例えば、処理300は、1つまたは複数のグラフィックス処理ユニット(GPU)、クラウドコンピューティングサービスによって提供される1つまたは複数のコンピューティング装置、および/または任意の他の適切なコンピューティング装置によって実行されてよい。本明細書に記載の技術の態様はこの点では限定されない。
<自己教師あり訓練段階>
xi∈Xiをモダリティiの入力データポイントとし、ti∈Tiを次のようなxiの圧縮表現とする。
ネットワークパラメータの少なくとも一部(例えば、エンコーダ、デコーダ、共同モダリティ表現、およびモダリティ埋め込みのパラメータ値の一部または全て)に関する再構成損失の勾配が逆伝播され、パラメータは以下の確率的勾配降下アルゴリズムを介して更新される。
タスクをy∈Yで表されるラベルまたは値を予測するものとして定義する。データペア(Xi,Yj)が存在する場合、自己教師あり学習段階で訓練された共同モダリティ表現およびxi∈XiのエンコーダΨi(xi)を使用して、上記の式に示すように、表現ti∈Tiを生成する。次に、特徴表現
図4は、本明細書に記載の技術のいくつかの実施形態による、予測タスクのためのマルチモーダル統計モデルを使用する例示的な処理400のフローチャートである。処理400は、任意の適切なコンピューティング装置によって実行されてよい。例えば、処理400は、1つまたは複数のグラフィックス処理ユニット(GPU)、クラウドコンピューティングサービスによって提供される1つまたは複数のコンピューティング装置、および/または任意の他の適切なコンピューティング装置によって実行されてよい。本明細書に記載の技術の態様はこの点では限定されない。
ここでは、タンパク質構造を予測する例示的な問題について、本明細書に記載される異なるデータモダリティの深層学習統計モデルを統合する手法を説明する。分子生物学において予測モデルを構築する従来の手法はしばしば不十分であり、結果として得られるモデルは、望ましい性能特性(例えば、精度)を欠く。
ソースの不均一性:調査され得る潜在的に数千の異なる分子実体が存在し、データは様々な形式またはモダリティで取得される。
実験的ノイズ:生物学的データ収集はしばしばノイズが多く、実験的バイアスや特異性に悩まされる。
このような困難なモデリングコンテキストにおいて高品質な予測モデルを構築する従来の手法は、ドメインレベルの深い知見と知識を表現する強力な事前分布に依存する。しかしながら、そのような事前分布を指定する能力は、利用可能なドメインレベルの知識の量によって制限される。たとえば、広範なドメイン知識がない場合、BLASTクエリを実行して(最も近い既知の配列を見つけて)、上位ヒットから機能割り当てを転送することで、新しく発見された種のタンパク質配列に機能的な注釈を付けることが可能である。ただし、この手法は、特に目的のタンパク質が関与する生物学的プロセスを識別する場合、非常に不正確で誤解を招くと報告されている。より優れて機能するモデルには、タンパク質、アミノ酸モチーフ、生物学的プロセスへの関与等に関する長年の蓄積されたドメイン知識を要する。
機能オントロジー予測がタスクだが、これらのオントロジーを個別のモダリティとして扱った。本明細書に記載される手法を機能オントロジー予測タスクに適用するには、エンコーダ、デコーダ、共同モダリティ表現、モダリティ埋め込み、およびタスク埋め込みの態様を指定する必要がある。
この例示的な例では、タンパク質配列入力用のエンコーダは、4つの畳み込みブロックを含み、それぞれがサイズ20の10個のフィルタを備えた1D畳み込みを含み、その後に層の正規化、ストライド3を伴うサイズ3の1次元最大プーリング、およびReLU(rectified linear unit)の活性化が続く。4つの畳み込みブロックの後に、エンコーダは、サイズ11の10個のカーネルとサイズ1への適応1d最大プーリングを備えた別の畳み込み層を含む。その結果、タンパク質配列エンコーダは、10×1024のワンホットエンコードされたタンパク質配列入力を受け取り(配列が1024より短い場合、入力はすべてゼロで埋められる)、10×1の潜在表現を返す。
タンパク質配列のデコーダは、デコンボリューションブロックの6つの連続層を含む。各ブロックには、フィルタの数が128、フィルタサイズが6、ストライドが3、両端が1で埋められたデコンボリューション演算が含まれ、その後に層の正規化および勾配0.1の漏洩ReLUの活性化が続く。
共同モダリティ表現は、64次元の512個のベクトルを含む。この例では、これらのベクトルは512×64の行列に記憶されてよい。行は、更新毎にL2で正規化される。この例においては6つのモダリティがあるため、6つのモダリティ埋め込みがあり、それぞれが64×10の行列を使用して表される。各モダリティ埋め込みは、共同モダリティ表現をそれぞれのモダリティの表現空間に投影する。
配列の再構築には、配列内のすべてのアミノ酸残基について、20の可能なアミノ酸にわたる確率分布に対して算出されたクロスエントロピー損失を使用した。パディングされた領域を除外した。3つのオントロジーモダリティおよびpfamドメインモダリティについては、負のサンプリング手順とマージン値1で最大マージン損失を使用した。分類学的ファミリーモダリティについては、クロスエントロピーを使用した。
学習率が10−3、バッチサイズが25の「Adam」と呼ばれるSGDオプティマイザーのバリアントを使用した。以下の2つの異なるシナリオをテストした。(1)ペアにされたデータを使用した同期的訓練、(2)ペアにされていないデータを使用した非同期的訓練。
図5に示されるように、初期の実験は、タンパク質の機能的な注釈をする上記のマルチモーダル統計モデルが、広範な特徴量エンジニアリングを必要とする他のモデルの競合する従来の手法よりも大幅に優れた動作をすることを示す。図5に示されるように、上記のマルチモーダル統計モデルの平均AUROC(area under receiver operating characteristic curve)は、競合する従来手法のものよりも高い。図5に示される競合する手法の性能は、2016年9月7日にGenome Biology, volume 17, page 184に掲載された「An expanded evaluation of protein function prediction methods shows an improvement in accuracy」というタイトルの記事でさらに議論され、この記事は参照によりその全体が本明細書に組み込まれる。
本明細書に記載されているマルチモーダル統計モデルのさらなる態様は、以下の議論から理解され得る。
Xが固定した確率測度ρ(x)の信号(メッセージ)空間を示し、Τがその量子化されたコードブックまたは圧縮表現を示すとする。
量子化の品質は、混乱なくコードブックの要素を指定するために必要な「レート」または「メッセージあたりの平均ビット数」によって決定される。Xの要素ごとのこの数は、相互情報量によって以下から制限される。
<情報のボトルネック>
究極的には、任意の予測タスクについて、入力空間Xから予測(ラベル)空間Yに関連する情報のみを保持する表現空間Tへのマッピングp(t│x)を学習したい。言い換えれば、マッピングp(t│x)に関して次の関数を最小化することによって捕捉可能なTとYの間の相互情報量を最大化しながら、XとTの間の相互情報量を最小化したい。
<入力圧縮限界>
最高の予測性能のため、データ処理の不均衡により上限I(T;Y)≦I(X;Y)に制限されるI(T;Y)を最大化することを目的とする。XおよびYに無制限のデータ量がある場合、同時分布p(x,y)に任意に近似できるため、Xのコンパクトな表現を必要としない。しかしながら、データ量はしばしば限られているため、p(x│y)を十分には推定できない。したがって、入力を圧縮してモデルを正則化する必要がある。I(X;T)を最小化することで複雑さを減少させる。
モダリティX1およびX2が、X2およびX1をそれぞれ予測することになるT1およびT2表現に圧縮される、単純なクロスモダリティ予測設定を考えてみる。図6Aに示すように、観測された変数X1およびX2は、X1およびX2の圧縮表現である潜在確率変数T1およびT2によって表されている。第1モダリティおよび第2モダリティの潜在確率変数T1およびT2は、それぞれ、第1モダリティおよび第2モダリティのエンコーダの出力として定義されてよい。図6Bに示すように、潜在確率変数T1およびT2を使用して、変数X1およびX2を予測してよい。第1モダリティおよび第2モダリティのデコーダをそれぞれ使用して、潜在表現T1およびT2から変数X1およびX2を予測してよい。
Claims (43)
- 第1モダリティからの入力データおよび前記第1モダリティとは異なる第2モダリティからの入力データを含む複数のモダリティからの入力データを受信するように構成されたマルチモーダル統計モデルを訓練する方法であって、前記方法は
前記第1モダリティのラベル付けされていない訓練データおよび前記第2モダリティのラベル付けされていない訓練データを含むラベル付けされていない訓練データにアクセスする、ラベル付けされていない訓練データアクセス工程と、
前記第1モダリティのラベル付けされた訓練データおよび前記第2モダリティのラベル付けされた訓練データを含むラベル付けされた訓練データにアクセスする、ラベル付けされた訓練データアクセス工程と、
前記マルチモーダル統計モデルを2段階で訓練する、訓練工程であって、前記マルチモーダル統計モデルは、前記第1モダリティおよび前記第2モダリティの入力データをそれぞれ処理する第1エンコーダおよび第2エンコーダと、第1モダリティ埋め込みおよび第2モダリティ埋め込みと、共同モダリティ表現と、予測子とを含む複数の構成要素を含み、前記訓練工程は、
自己教師あり学習手法および前記ラベル付けされていない訓練データを使用して、前記第1モダリティ埋め込みおよび前記第2モダリティ埋め込みと前記共同モダリティ表現とのパラメータの値を推定することにより、少なくとも部分的に第1訓練段階を実行する、第1訓練段階実行工程および、
教師あり学習手法および前記ラベル付けされた訓練データを使用して、前記予測子のパラメータの値を推定することにより、少なくとも部分的に第2訓練段階を実行する、第2訓練段階実行工程、を含む訓練工程と、
前記マルチモーダル統計モデルの前記複数の構成要素のパラメータの予測値を記憶することにより、前記マルチモーダル統計モデルを指定する情報を少なくとも部分的に記憶する工程と、を備える方法。 - 前記訓練工程は、前記第1訓練段階の前に前記第1エンコーダおよび前記第2エンコーダのパラメータの値を推定する工程をさらに含む、請求項1に記載の方法。
- 前記訓練工程は、前記第1訓練段階の前に前記第1モダリティおよび前記第2モダリティの第1デコーダおよび第2デコーダのパラメータの値をそれぞれ推定する工程をさらに含む、請求項2に記載の方法。
- 前記訓練工程は、前記第1訓練段階中に、前記第1エンコーダおよび前記第2エンコーダのパラメータの値の推定を、前記共同モダリティ表現のパラメータの値の推定と共同でする工程をさらに含む、請求項1または先行する請求項のいずれか一項に記載の方法。
- 前記訓練工程は、前記第1訓練段階中に、前記第1モダリティの第1デコーダおよび前記第2モダリティの第2デコーダのパラメータの値を推定する工程をさらに含む、請求項4または先行する請求項のいずれか一項に記載の方法。
- 前記第1訓練段階実行工程は、
前記第1モダリティの前記ラベル付けされていない訓練データにおける第1データ入力にアクセスする工程と、
前記第1データ入力を前記第1エンコーダに提供して、第1特徴ベクトルを生成する工程と、
前記共同モダリティ表現、前記第1モダリティ埋め込み、および前記第1特徴ベクトルを使用して、第2特徴ベクトルを特定する、第2特徴ベクトル特定工程と、
前記第2特徴ベクトルを入力として第1デコーダに提供して、第1データ出力を生成する工程と、を含む請求項1または先行する請求項のいずれか一項に記載の方法。 - 前記第1データ出力を前記第1データ入力と比較する工程と、
前記比較の結果に基づき、前記共同モダリティ表現の1つ以上のパラメータの1つ以上の値を更新する工程と、をさらに含む請求項6または先行する請求項のいずれか一項に記載の方法。 - 前記第1訓練段階実行工程は、
前記第1モダリティの前記ラベル付けされていない訓練データにおける第1入力にアクセスする工程と、
前記第1入力データを前記第1エンコーダに提供して、第1特徴ベクトルを生成する工程と、
前記共同モダリティ表現、前記第2モダリティ埋め込み、および前記第1特徴ベクトルを使用して、第2特徴ベクトルを特定する工程と、
前記第2特徴ベクトルを入力として前記第2モダリティの第2デコーダに提供して、第2出力データを生成する工程と、を含む請求項1または先行する請求項のいずれか一項に記載の方法。 - 前記第1エンコーダはd次元ベクトルを出力するように構成され、前記共同モダリティ表現はN個のm次元ベクトルを含み、前記第1モダリティ埋め込みはm*dの重みを含む、請求項6または先行する請求項のいずれか一項に記載の方法。
- 前記第2特徴ベクトル特定工程は、
前記第1モダリティ埋め込みを使用することにより、前記共同モダリティ表現を前記第1モダリティの空間に投影して、N個のd次元ベクトルを取得する工程と、
前記共同モダリティ表現における前記N個のd次元ベクトルの中から、類似性メトリックに従って前記第1特徴ベクトルに最も類似する第3特徴ベクトルを特定する工程と、
前記第1特徴ベクトルを前記第3特徴ベクトルと集約することにより前記第2特徴ベクトルを生成する工程と、を含む請求項9に記載の方法。 - 前記第2特徴ベクトル特定工程は、
前記第1モダリティ埋め込みを使用することにより、前記共同モダリティ表現を前記第1モダリティの空間に投影して、N個のd次元ベクトルを取得する工程と、
前記N個のd次元ベクトルの少なくとも一部と前記第1特徴ベクトルとの間の類似性に従って、前記共同モダリティ表現における前記N個のd次元ベクトルの前記少なくとも一部の重みを算出する工程と、
前記第1特徴ベクトルを、算出された前記重みによって重み付けされた前記N個のd次元ベクトルの前記少なくとも一部の加重和と集約することにより前記第2特徴ベクトルを生成する工程と、を含む請求項9または先行する請求項のいずれか一項に記載の方法。 - 前記マルチモーダル統計モデルは、第1タスク埋め込みおよび第2タスク埋め込みをさらに備え、前記訓練工程は、前記第2訓練段階中に、前記第1タスク埋め込みおよび前記第2タスク埋め込みのパラメータの値の推定を、前記予測子のパラメータの値の推定と共同でする工程をさらに含む、請求項1または先行する請求項のいずれか一項に記載の方法。
- 前記第1エンコーダはニューラルネットワークを含む、請求項1または先行する請求項のいずれか一項に記載の方法。
- 前記ニューラルネットワークは畳み込みニューラルネットワークである、請求項13または先行する請求項のいずれか一項に記載の方法。
- 前記ニューラルネットワークは回帰型ニューラルネットワークである、請求項13または先行する請求項のいずれか一項に記載の方法。
- 前記第1訓練段階は、確率的勾配降下法を使用して前記共同モダリティ表現の前記パラメータの前記値を推定する工程をさらに含む、請求項1または先行する請求項のいずれか一項に記載の方法。
- 前記第1訓練段階は、前記確率的勾配降下法を使用して前記第1モダリティ埋め込みおよび前記第2モダリティ埋め込みの前記パラメータの前記値を推定する工程をさらに含む、請求項16または先行する請求項のいずれか一項に記載の方法。
- 前記第1モダリティの前記ラベル付けされていない訓練データは画像を含む、請求項1または先行する請求項のいずれか一項に記載の方法。
- 前記第2モダリティのラベル付けされていない訓練データはテキストを含む、請求項18または先行する請求項のいずれか一項に記載の方法。
- 前記第1モダリティのラベル付けされていない訓練データはタンパク質配列データを含む、請求項1または先行する請求項のいずれか一項に記載の方法。
- 前記第2モダリティのラベル付けされていない訓練データは、タンパク質ファミリーデータ、生物学的プロセスオントロジーデータ、分子機能オントロジーデータ、細胞構成要素オントロジーデータ、または分類学的種ファミリーデータを含む、請求項20または先行する請求項のいずれか一項に記載の方法。
- 第3モダリティのラベル付けされていない訓練データにアクセスする工程と、
前記第3モダリティのラベル付けされた訓練データにアクセスする工程と、
前記マルチモーダル統計モデルを拡張して、前記第3モダリティの第3エンコーダおよび第3モダリティ埋め込みを含める工程と、
自己教師あり学習手法および前記第3モダリティの前記ラベル付けされていない訓練データを使用して、前記第3モダリティ埋め込みおよび前記共同モダリティ表現のパラメータの値を更新することおよび、
教師あり学習手法および前記第3モダリティの前記ラベル付けされた訓練データを使用して、前記予測子のパラメータの値を更新することにより
前記マルチモーダル統計モデルを更新する工程と、をさらに備える請求項1または先行する請求項のいずれか一項に記載の方法。 - 前記マルチモーダル統計モデルは、前記第1モダリティおよび前記第2モダリティとは異なる第3モダリティから入力データを受信するように構成され、第3モダリティ埋め込みをさらに含み、
前記ラベル付けされていない訓練データアクセス工程は、前記第3モダリティのラベル付けされていない訓練データにアクセスする工程を含み、
前記ラベル付けされた訓練データアクセス工程は、前記第3モダリティのラベル付けされた訓練データにアクセスする工程を含み、
前記第1訓練段階実行工程は、前記第3モダリティの前記ラベル付けされていない訓練データにさらに基づき前記第3モダリティ埋め込みのパラメータの値を推定する工程をさらに含み、
前記第2訓練段階実行工程は、前記第3モダリティの前記ラベル付けされた訓練データにさらに基づき前記予測子のパラメータの値を推定する工程を含む、請求項1または先行する請求項のいずれか一項に記載の方法。 - 1つ以上のコンピュータハードウェアプロセッサと、
1つ以上の非一時的なコンピュータ可読記憶媒体と、を備えるシステムであって、前記非一時的なコンピュータ可読記憶媒体は、前記1つ以上のコンピュータハードウェアプロセッサによって実行された場合、前記1つ以上のコンピュータハードウェアプロセッサに、第1モダリティからの入力データおよび前記第1モダリティとは異なる第2モダリティからの入力データを含む複数のモダリティからの入力データを受信するように構成されたマルチモーダル統計モデルを訓練する方法、を実行させるプロセッサ実行可能な命令を記憶し、前記方法は
前記第1モダリティのラベル付けされていない訓練データおよび前記第2モダリティのラベル付けされていない訓練データを含むラベル付けされていない訓練データにアクセスする工程と、
前記第1モダリティのラベル付けされた訓練データおよび前記第2モダリティのラベル付けされた訓練データを含むラベル付けされた訓練データにアクセスする工程と、
前記マルチモーダル統計モデルを2段階で訓練する、訓練工程であって、前記マルチモーダル統計モデルは、前記第1モダリティおよび前記第2モダリティの入力データをそれぞれ処理する第1エンコーダおよび第2エンコーダと、第1モダリティ埋め込みおよび第2モダリティ埋め込みと、共同モダリティ表現と、予測子とを含む複数の構成要素を含み、前記訓練工程は、
自己教師あり学習手法および前記ラベル付けされていない訓練データを使用して、前記第1モダリティ埋め込みおよび前記第2モダリティ埋め込みと前記共同モダリティ表現とのパラメータの値を推定することにより、少なくとも部分的に第1訓練段階を実行する、第1訓練段階実行工程および、
教師あり学習手法および前記ラベル付けされた訓練データを使用して、前記予測子のパラメータの値を推定することにより、少なくとも部分的に第2訓練段階を実行する、第2訓練段階実行工程、を含む訓練工程と、
前記マルチモーダル統計モデルの前記複数の構成要素のパラメータの予測値を記憶することにより、前記マルチモーダル統計モデルを指定する情報を少なくとも部分的に記憶する工程と、を含むシステム。 - 前記共同モダリティ表現は、複数のm次元ベクトルを含み、前記システムは、前記複数のm次元ベクトルを記憶するように構成されたメモリをさらに備える、請求項24に記載のシステム。
- 1つ以上の非一時的なコンピュータ可読記憶媒体であって、前記非一時的なコンピュータ可読記憶媒体は、1つ以上のコンピュータハードウェアプロセッサによって実行された場合、前記1つ以上のコンピュータハードウェアプロセッサに、第1モダリティからの入力データおよび前記第1モダリティとは異なる第2モダリティからの入力データを含む複数のモダリティからの入力データを受信するように構成されたマルチモーダル統計モデルを訓練する方法、を実行させるプロセッサ実行可能な命令を記憶し、前記方法は
前記第1モダリティのラベル付けされていない訓練データおよび前記第2モダリティのラベル付けされていない訓練データを含むラベル付けされていない訓練データにアクセスする工程と、
前記第1モダリティのラベル付けされた訓練データおよび前記第2モダリティのラベル付けされた訓練データを含むラベル付けされた訓練データにアクセスする工程と、
前記マルチモーダル統計モデルを2段階で訓練する、訓練工程であって、前記マルチモーダル統計モデルは、前記第1モダリティおよび前記第2モダリティの入力データをそれぞれ処理する第1エンコーダおよび第2エンコーダと、第1モダリティ埋め込みおよび第2モダリティ埋め込みと、共同モダリティ表現と、予測子とを含む複数の構成要素を含み、前記訓練工程は、
自己教師あり学習手法および前記ラベル付けされていない訓練データを使用して、前記第1モダリティ埋め込みおよび前記第2モダリティ埋め込みと前記共同モダリティ表現とのパラメータの値を推定することにより、少なくとも部分的に第1訓練段階を実行する、第1訓練段階実行工程および、
教師あり学習手法および前記ラベル付けされた訓練データを使用して、前記予測子のパラメータの値を推定することにより、少なくとも部分的に第2訓練段階を実行する、第2訓練段階実行工程、を含む訓練工程と、
前記マルチモーダル統計モデルの前記複数の構成要素のパラメータの予測値を記憶することにより、前記マルチモーダル統計モデルを指定する情報を少なくとも部分的に記憶する工程と、を含む非一時的なコンピュータ可読記憶媒体。 - 第1モダリティからの入力データおよび前記第1モダリティとは異なる第2モダリティからの入力データを含む複数のモダリティからの入力データを受信するように構成されたマルチモーダル統計モデルを使用して、予測タスクを実行する方法であって、前記方法は
前記マルチモーダル統計モデルを指定する情報を取得する工程であって、前記マルチモーダル統計モデルを指定する情報は、前記マルチモーダル統計モデルの複数の構成要素のそれぞれのパラメータの値を含み、前記複数の構成要素は、前記第1モダリティおよび前記第2モダリティの入力データをそれぞれ処理する第1エンコーダおよび第2エンコーダと、第1モダリティ埋め込みおよび第2モダリティ埋め込みと、共同モダリティ表現と、予測子とを含む工程と、
前記第1データモダリティの第1入力データを取得する工程と、
前記第1入力データを前記第1エンコーダに提供して、第1特徴ベクトルを生成する工程と、
前記共同モダリティ表現、前記第1モダリティ埋め込み、および前記第1特徴ベクトルを使用して、第2特徴ベクトルを特定する、第2特徴ベクトル特定工程と、
前記予測子および前記第2特徴ベクトルを使用して前記予測タスクの予測を生成する、予想生成工程と、を備える方法。 - 前記第2データモダリティの第2入力データを取得する工程と、
前記第2入力データを前記第2エンコーダに提供して、第3特徴ベクトルを生成する工程と、
前記共同モダリティ表現、前記第2モダリティ埋め込み、および前記第3特徴ベクトルを使用して、第4特徴ベクトルを特定する工程と、をさらに備え
前記第4特徴ベクトルを使用して前記予想生成工程を実行する、請求項27に記載の方法。 - 前記マルチモーダル統計モデルは、前記第1モダリティおよび前記第2モダリティの第1タスク埋め込みおよび第2タスク埋め込みを含み、前記予想生成工程は、
前記第1タスク埋め込みを使用して前記第2特徴ベクトルを重み付けする工程と、
前記第2タスク埋め込みを使用して前記第4特徴ベクトルを重み付けする工程と、
重み付けされた前記第2特徴ベクトルおよび前記第4特徴ベクトルと前記予測子とを使用して、前記予測タスクの前記予測を生成する工程と、をさらに含む請求項28または先行する請求項のいずれか一項に記載の方法。 - 重み付けされた前記第2特徴ベクトルおよび前記第4特徴ベクトルを前記予測子に提供する工程をさらに備える、請求項29または先行する請求項のいずれか一項に記載の方法。
- 前記第1エンコーダはd次元ベクトルを出力するように構成され、前記共同モダリティ表現はN個のm次元ベクトルを含み、前記第1モダリティ埋め込みはmxdの重みを含む、請求項27または先行する請求項のいずれか一項に記載の方法。
- 前記第2特徴ベクトル特定工程は、
前記第1モダリティ埋め込みを使用することにより、前記共同モダリティ表現を前記第1モダリティの空間に投影して、N個のd次元ベクトルを取得する工程と、
前記共同モダリティ表現における前記N個のd次元ベクトルの中から、類似性メトリックに従って前記第1特徴ベクトルに最も類似する第3特徴ベクトルを特定する工程と、
前記第1モダリティ埋め込みにおける重みを使用して前記第3特徴ベクトルの次元を重み付けすることにより前記第2特徴ベクトルを生成する工程と、を含む請求項31または先行する請求項のいずれか一項に記載の方法。 - 前記第2特徴ベクトル特定工程は、
前記第1モダリティ埋め込みを使用することにより、前記共同モダリティ表現を前記第1モダリティの空間に投影して、N個のd次元ベクトルを取得する工程と、
前記共同モダリティ表現における前記N個のd次元ベクトルの中から、類似性メトリックに従って前記第1特徴ベクトルに最も類似する第3特徴ベクトルを特定する工程と、
前記第1特徴ベクトルを前記第3特徴ベクトルと集約することにより前記第2特徴ベクトルを生成する工程と、を含む請求項31または先行する請求項のいずれか一項に記載の方法。 - 前記第2特徴ベクトル特定工程は、
前記第1モダリティ埋め込みを使用することにより、前記共同モダリティ表現を前記第1モダリティの空間に投影して、N個のd次元ベクトルを取得する工程と、
前記N個のd次元ベクトルの少なくとも一部と前記第1特徴ベクトルとの間の類似性に従って、前記共同モダリティ表現における前記N個のd次元ベクトルの前記少なくとも一部の重みを算出する工程と、
算出された前記重みによって重み付けられた前記N個のd次元ベクトルの前記少なくとも一部の加重和として前記第2特徴ベクトルを生成する工程と、を含む請求項32または先行する請求項のいずれか一項に記載の方法。 - 前記第1エンコーダはニューラルネットワークを含む、請求項27または先行する請求項のいずれか一項に記載の方法。
- 前記ニューラルネットワークは、畳み込みニューラルネットワークである請求項35または先行する請求項のいずれか一項に記載の方法。
- 前記ニューラルネットワークは回帰型ニューラルネットワークである、請求項35または先行する請求項のいずれか一項に記載の方法。
- 前記第1モダリティの入力データは1つ以上の画像を含む、請求項27または先行する請求項のいずれか一項に記載の方法。
- 前記第2モダリティの入力データはテキストを含む、請求項27または先行する請求項のいずれか一項に記載の方法。
- 前記第1モダリティの入力データはタンパク質配列データを含む、請求項39または先行する請求項のいずれか一項に記載の方法。
- 前記第2モダリティの入力データは、タンパク質ファミリーデータ、生物学的プロセスオントロジーデータ、分子機能オントロジーデータ、細胞構成要素オントロジーデータ、または分類学的種ファミリーデータを含む、請求項40または先行する請求項のいずれか一項に記載の方法。
- 第1モダリティからの入力データおよび前記第1モダリティとは異なる第2モダリティからの入力データを含む複数のモダリティからの入力データを受信するように構成されたマルチモーダル統計モデルを使用して、予測タスクを実行するシステムであって、前記システムは
1つ以上のコンピュータハードウェアプロセッサと、
1つ以上の非一時的なコンピュータ可読記憶媒体と、を備えるシステムであって、前記1つ以上の非一時的なコンピュータ可読記憶媒体は、前記1つ以上のコンピュータハードウェアプロセッサによって実行された場合、前記1つ以上のコンピュータハードウェアプロセッサに、
前記マルチモーダル統計モデルを指定する情報を取得する工程であって、前記マルチモーダル統計モデルを指定する情報は、前記マルチモーダル統計モデルの複数の構成要素のそれぞれのパラメータの値を含み、前記複数の構成要素は、前記第1モダリティおよび前記第2モダリティの入力データをそれぞれ処理する第1エンコーダおよび第2エンコーダと、第1モダリティ埋め込みおよび第2モダリティ埋め込みと、共同モダリティ表現と、予測子とを含む工程と、
前記第1データモダリティの第1入力データを取得する工程と、
前記第1入力データを前記第1エンコーダに提供して、第1特徴ベクトルを生成する工程と、
前記共同モダリティ表現、前記第1モダリティ埋め込み、および前記第1特徴ベクトルを使用して、第2特徴ベクトルを特定する工程と、
前記予測子と前記第2特徴ベクトルを使用して前記予測タスクの予測を生成する工程と、を実行させるプロセッサ実行可能な命令を記憶するシステム。 - 1つ以上の非一時的なコンピュータ可読記憶媒体であって、前記1つ以上のコンピュータハードウェアプロセッサによって実行された場合、前記1つ以上のコンピュータハードウェアプロセッサに、
マルチモーダル統計モデルを指定する情報を取得する工程であって、前記マルチモーダル統計モデルを指定する情報は、前記マルチモーダル統計モデルの複数の構成要素のそれぞれのパラメータの値を含み、前記複数の構成要素は、第1モダリティおよび第2モダリティの入力データをそれぞれ処理する第1エンコーダおよび第2エンコーダと、第1モダリティ埋め込みおよび第2モダリティ埋め込みと、共同モダリティ表現と、予測子とを含む工程と、
前記第1データモダリティの第1入力データを取得する工程と、
前記第1入力データを前記第1エンコーダに提供して、第1特徴ベクトルを生成する工程と、
前記共同モダリティ表現、前記第1モダリティ埋め込み、および前記第1特徴ベクトルを使用して、第2特徴ベクトルを特定する工程と、
前記予測子と前記第2特徴ベクトルを使用して予測タスクの予測を生成する工程と、を実行させるプロセッサ実行可能な命令を記憶する1つ以上の非一時的なコンピュータ可読記憶媒体。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862671068P | 2018-05-14 | 2018-05-14 | |
US62/671,068 | 2018-05-14 | ||
US201862678074P | 2018-05-30 | 2018-05-30 | |
US62/678,074 | 2018-05-30 | ||
PCT/US2019/031255 WO2019221985A1 (en) | 2018-05-14 | 2019-05-08 | Systems and methods for unifying statistical models for different data modalities |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2021524099A true JP2021524099A (ja) | 2021-09-09 |
JPWO2019221985A5 JPWO2019221985A5 (ja) | 2022-05-31 |
JP7317050B2 JP7317050B2 (ja) | 2023-07-28 |
Family
ID=66641492
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020564186A Active JP7317050B2 (ja) | 2018-05-14 | 2019-05-08 | 異なるデータモダリティの統計モデルを統合するためのシステムおよび方法 |
Country Status (10)
Country | Link |
---|---|
US (3) | US10956787B2 (ja) |
EP (1) | EP3794512A1 (ja) |
JP (1) | JP7317050B2 (ja) |
KR (1) | KR20210010505A (ja) |
CN (1) | CN112119411A (ja) |
AU (1) | AU2019269312A1 (ja) |
BR (1) | BR112020022270A2 (ja) |
CA (1) | CA3098447A1 (ja) |
MX (1) | MX2020012276A (ja) |
WO (1) | WO2019221985A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7311120B1 (ja) | 2022-03-16 | 2023-07-19 | ソフトバンク株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
WO2023166959A1 (ja) * | 2022-03-01 | 2023-09-07 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 学習方法、及び、プログラム |
Families Citing this family (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10956787B2 (en) | 2018-05-14 | 2021-03-23 | Quantum-Si Incorporated | Systems and methods for unifying statistical models for different data modalities |
US11971963B2 (en) | 2018-05-30 | 2024-04-30 | Quantum-Si Incorporated | Methods and apparatus for multi-modal prediction using a trained statistical model |
US11967436B2 (en) | 2018-05-30 | 2024-04-23 | Quantum-Si Incorporated | Methods and apparatus for making biological predictions using a trained multi-modal statistical model |
EP3618287B1 (en) * | 2018-08-29 | 2023-09-27 | Université de Genève | Signal sampling with joint training of learnable priors for sampling operator and decoder |
US11386306B1 (en) * | 2018-12-13 | 2022-07-12 | Amazon Technologies, Inc. | Re-identification of agents using image analysis and machine learning |
US11704573B2 (en) * | 2019-03-25 | 2023-07-18 | Here Global B.V. | Method, apparatus, and computer program product for identifying and compensating content contributors |
CA3081168A1 (en) * | 2019-05-22 | 2020-11-22 | Royal Bank Of Canada | System and method for machine learning architecture for partially-observed multimodal data |
US11520993B2 (en) * | 2019-07-24 | 2022-12-06 | Nec Corporation | Word-overlap-based clustering cross-modal retrieval |
US20210027157A1 (en) * | 2019-07-24 | 2021-01-28 | Nec Laboratories America, Inc. | Unsupervised concept discovery and cross-modal retrieval in time series and text comments based on canonical correlation analysis |
KR20220039791A (ko) * | 2019-08-02 | 2022-03-29 | 플래그쉽 파이어니어링 이노베이션스 브이아이, 엘엘씨 | 기계 학습 안내된 폴리펩티드 설계 |
CN111091010A (zh) * | 2019-11-22 | 2020-05-01 | 京东方科技集团股份有限公司 | 相似度确定、网络训练、查找方法及装置和存储介质 |
US11727913B2 (en) * | 2019-12-23 | 2023-08-15 | Adobe Inc. | Automatically associating context-based sounds with text |
EP3851560A1 (en) * | 2020-01-16 | 2021-07-21 | Recherche 2000 Inc. | Methods and systems for detecting faults in electrolysers having electrolysis cells |
US11251896B2 (en) * | 2020-03-03 | 2022-02-15 | Mitsubishi Electric Research Laboratories, Inc. | Generative model for inverse design of materials, devices, and structures |
CN111461304B (zh) * | 2020-03-31 | 2023-09-15 | 北京小米松果电子有限公司 | 分类神经网络的训练方法、文本分类方法、装置及设备 |
CN111625858B (zh) * | 2020-05-10 | 2023-04-07 | 武汉理工大学 | 一种垂直领域下的智能化多模态数据脱敏方法和装置 |
US11664037B2 (en) * | 2020-05-22 | 2023-05-30 | Electronics And Telecommunications Research Institute | Methods of encoding and decoding speech signal using neural network model recognizing sound sources, and encoding and decoding apparatuses for performing the same |
US20210365965A1 (en) * | 2020-05-25 | 2021-11-25 | Microsoft Technology Licensing, Llc | Self-supervised system generating embeddings representing sequenced activity |
US20210374499A1 (en) * | 2020-05-26 | 2021-12-02 | International Business Machines Corporation | Iterative deep graph learning for graph neural networks |
CN111797589A (zh) * | 2020-05-29 | 2020-10-20 | 华为技术有限公司 | 一种文本处理网络、神经网络训练的方法以及相关设备 |
US11868428B2 (en) | 2020-07-21 | 2024-01-09 | Samsung Electronics Co., Ltd. | Apparatus and method with compressed neural network computation |
US11461681B2 (en) * | 2020-10-14 | 2022-10-04 | Openstream Inc. | System and method for multi-modality soft-agent for query population and information mining |
CN112667071A (zh) * | 2020-12-18 | 2021-04-16 | 宜通世纪物联网研究院(广州)有限公司 | 基于随机变分信息的手势识别方法、装置、设备及介质 |
CN112735569B (zh) * | 2020-12-31 | 2022-09-02 | 四川大学华西医院 | 脑肿瘤多模态mri术前胶质瘤手术区结果输出系统及方法 |
CN112991350B (zh) * | 2021-02-18 | 2023-06-27 | 西安电子科技大学 | 一种基于模态差异缩减的rgb-t图像语义分割方法 |
CN113033622B (zh) * | 2021-03-05 | 2023-02-03 | 北京百度网讯科技有限公司 | 跨模态检索模型的训练方法、装置、设备和存储介质 |
CN113360673B (zh) * | 2021-06-21 | 2023-07-07 | 浙江师范大学 | 多模态知识图谱的实体对齐方法、装置及存储介质 |
CN113688938B (zh) * | 2021-09-07 | 2023-07-28 | 北京百度网讯科技有限公司 | 确定对象情感的方法、训练情感分类模型的方法及装置 |
CN114124520A (zh) * | 2021-11-22 | 2022-03-01 | 浙江大学 | 基于多模态的拟态waf执行体实现方法 |
WO2023105673A1 (ja) * | 2021-12-08 | 2023-06-15 | 日本電信電話株式会社 | 学習装置、推定装置、学習方法、推定方法及びプログラム |
AU2022204142B1 (en) * | 2022-06-14 | 2022-10-06 | Curvebeam Ai Limited | Method and System for Material Decomposition in Dual- or Multiple-Energy X-ray Based Imaging |
CN114840327B (zh) * | 2022-06-29 | 2022-12-02 | 阿里巴巴达摩院(杭州)科技有限公司 | 多模态多任务的处理方法、设备及系统 |
CN115604475A (zh) * | 2022-08-12 | 2023-01-13 | 西安电子科技大学(Cn) | 一种多模态信源联合编码方法 |
US20240071105A1 (en) * | 2022-08-24 | 2024-02-29 | Nec Laboratories America, Inc. | Cross-modal self-supervised learning for infrastructure analysis |
KR20240029127A (ko) * | 2022-08-26 | 2024-03-05 | 한국전자기술연구원 | 환경정보 인식을 위한 계층적 전이학습 기반의 딥러닝 모델 생성 시스템 및 방법 |
US20240169261A1 (en) * | 2022-11-10 | 2024-05-23 | Lg Electronics Inc. | Method and device for domain generalized incremental learning under covariate shift |
CN116091907B (zh) * | 2023-04-12 | 2023-08-15 | 四川大学 | 一种基于非互斥三元对比学习的图像篡改定位模型及方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017122785A1 (en) * | 2016-01-15 | 2017-07-20 | Preferred Networks, Inc. | Systems and methods for multimodal generative machine learning |
WO2018042211A1 (en) * | 2016-09-05 | 2018-03-08 | Kheiron Medical Technologies Ltd | Multi-modal medical image processing |
Family Cites Families (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5814565A (en) | 1995-02-23 | 1998-09-29 | University Of Utah Research Foundation | Integrated optic waveguide immunosensor |
US6787308B2 (en) | 1998-07-30 | 2004-09-07 | Solexa Ltd. | Arrayed biomolecules and their use in sequencing |
US6202049B1 (en) | 1999-03-09 | 2001-03-13 | Matsushita Electric Industrial Co., Ltd. | Identification of unit overlap regions for concatenative speech synthesis system |
US7175811B2 (en) | 2000-04-28 | 2007-02-13 | Edgelight Biosciences | Micro-array evanescent wave fluorescence detection device |
US6917726B2 (en) | 2001-09-27 | 2005-07-12 | Cornell Research Foundation, Inc. | Zero-mode clad waveguides for performing spectroscopy with confined effective observation volumes |
FR2813121A1 (fr) | 2000-08-21 | 2002-02-22 | Claude Weisbuch | Dispositif perfectionne de support d'elements chromophores |
US7738086B2 (en) | 2005-05-09 | 2010-06-15 | The Trustees Of Columbia University In The City Of New York | Active CMOS biosensor chip for fluorescent-based detection |
US7426322B2 (en) | 2005-07-20 | 2008-09-16 | Searete Llc. | Plasmon photocatalysis |
US8975216B2 (en) | 2006-03-30 | 2015-03-10 | Pacific Biosciences Of California | Articles having localized molecules disposed thereon and methods of producing same |
EP3936857B1 (en) | 2006-09-01 | 2023-06-21 | Pacific Biosciences Of California, Inc. | Substrates, systems and methods for analyzing materials |
US8207509B2 (en) | 2006-09-01 | 2012-06-26 | Pacific Biosciences Of California, Inc. | Substrates, systems and methods for analyzing materials |
FR2908888B1 (fr) | 2006-11-21 | 2012-08-03 | Centre Nat Rech Scient | Dispositif pour la detection exaltee de l'emission d'une particule cible |
WO2009082706A1 (en) | 2007-12-21 | 2009-07-02 | The Trustees Of Columbia University In The City Of New York | Active cmos sensor array for electrochemical biomolecular detection |
AU2009292629B2 (en) | 2008-09-16 | 2014-03-20 | Pacific Biosciences Of California, Inc. | Substrates and optical systems and methods of use thereof |
JP5229478B2 (ja) | 2008-12-25 | 2013-07-03 | 日本電気株式会社 | 統計モデル学習装置、統計モデル学習方法、およびプログラム |
US8278728B2 (en) | 2009-10-17 | 2012-10-02 | Florida Institute Of Technology | Array of concentric CMOS photodiodes for detection and de-multiplexing of spatially modulated optical channels |
US8467061B2 (en) | 2010-02-19 | 2013-06-18 | Pacific Biosciences Of California, Inc. | Integrated analytical system and method |
US8865078B2 (en) | 2010-06-11 | 2014-10-21 | Industrial Technology Research Institute | Apparatus for single-molecule detection |
EP3305400A3 (en) | 2011-10-28 | 2018-06-06 | Illumina, Inc. | Microarray fabrication system and method |
US9606060B2 (en) | 2012-01-13 | 2017-03-28 | California Institute Of Technology | Filterless time-domain detection of one or more fluorophores |
JP2013211616A (ja) | 2012-03-30 | 2013-10-10 | Sony Corp | 端末装置、端末制御方法、プログラム、および情報処理システム |
US9372308B1 (en) | 2012-06-17 | 2016-06-21 | Pacific Biosciences Of California, Inc. | Arrays of integrated analytical devices and methods for production |
US9223084B2 (en) | 2012-12-18 | 2015-12-29 | Pacific Biosciences Of California, Inc. | Illumination of optical analytical devices |
US9607014B2 (en) | 2013-10-31 | 2017-03-28 | Adobe Systems Incorporated | Image tagging |
WO2015064672A1 (ja) * | 2013-11-01 | 2015-05-07 | Eizo株式会社 | 画像高画質化装置、画像表示装置、画像高画質化方法及びコンピュータプログラム |
US9765395B2 (en) | 2014-04-28 | 2017-09-19 | Nanomedical Diagnostics, Inc. | System and method for DNA sequencing and blood chemistry analysis |
US20160170982A1 (en) | 2014-12-16 | 2016-06-16 | Yahoo! Inc. | Method and System for Joint Representations of Related Concepts |
US9666748B2 (en) | 2015-01-14 | 2017-05-30 | International Business Machines Corporation | Integrated on chip detector and zero waveguide module structure for use in DNA sequencing |
CN107615121B (zh) | 2015-03-16 | 2021-04-16 | 加利福尼亚太平洋生物科学股份有限公司 | 用于自由空间光耦合的集成装置及系统 |
US10872699B2 (en) | 2016-03-25 | 2020-12-22 | Siemens Healthcare Gmbh | Case-based reasoning in the cloud using deep learning |
US10534613B2 (en) * | 2017-04-28 | 2020-01-14 | Intel Corporation | Supporting learned branch predictors |
CN107506370A (zh) * | 2017-07-07 | 2017-12-22 | 大圣科技股份有限公司 | 多媒体数据深度挖掘方法、存储介质及电子设备 |
US20190026655A1 (en) | 2017-07-19 | 2019-01-24 | Petuum Inc. | Machine Learning System for Patient Similarity |
US20190279075A1 (en) | 2018-03-09 | 2019-09-12 | Nvidia Corporation | Multi-modal image translation using neural networks |
US20190325293A1 (en) * | 2018-04-19 | 2019-10-24 | National University Of Singapore | Tree enhanced embedding model predictive analysis methods and systems |
US10956787B2 (en) | 2018-05-14 | 2021-03-23 | Quantum-Si Incorporated | Systems and methods for unifying statistical models for different data modalities |
US11971963B2 (en) | 2018-05-30 | 2024-04-30 | Quantum-Si Incorporated | Methods and apparatus for multi-modal prediction using a trained statistical model |
US11967436B2 (en) | 2018-05-30 | 2024-04-23 | Quantum-Si Incorporated | Methods and apparatus for making biological predictions using a trained multi-modal statistical model |
-
2019
- 2019-05-08 US US16/406,348 patent/US10956787B2/en active Active
- 2019-05-08 KR KR1020207035725A patent/KR20210010505A/ko unknown
- 2019-05-08 MX MX2020012276A patent/MX2020012276A/es unknown
- 2019-05-08 WO PCT/US2019/031255 patent/WO2019221985A1/en unknown
- 2019-05-08 CA CA3098447A patent/CA3098447A1/en active Pending
- 2019-05-08 JP JP2020564186A patent/JP7317050B2/ja active Active
- 2019-05-08 CN CN201980032862.3A patent/CN112119411A/zh active Pending
- 2019-05-08 AU AU2019269312A patent/AU2019269312A1/en not_active Abandoned
- 2019-05-08 EP EP19726251.2A patent/EP3794512A1/en active Pending
- 2019-05-08 BR BR112020022270-4A patent/BR112020022270A2/pt unknown
-
2021
- 2021-03-08 US US17/195,311 patent/US11494589B2/en active Active
-
2022
- 2022-10-17 US US17/967,417 patent/US11875267B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017122785A1 (en) * | 2016-01-15 | 2017-07-20 | Preferred Networks, Inc. | Systems and methods for multimodal generative machine learning |
WO2018042211A1 (en) * | 2016-09-05 | 2018-03-08 | Kheiron Medical Technologies Ltd | Multi-modal medical image processing |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023166959A1 (ja) * | 2022-03-01 | 2023-09-07 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 学習方法、及び、プログラム |
JP7311120B1 (ja) | 2022-03-16 | 2023-07-19 | ソフトバンク株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
US20190347523A1 (en) | 2019-11-14 |
KR20210010505A (ko) | 2021-01-27 |
BR112020022270A2 (pt) | 2021-02-23 |
US11494589B2 (en) | 2022-11-08 |
JP7317050B2 (ja) | 2023-07-28 |
CA3098447A1 (en) | 2019-11-21 |
CN112119411A (zh) | 2020-12-22 |
US20210192290A1 (en) | 2021-06-24 |
EP3794512A1 (en) | 2021-03-24 |
US11875267B2 (en) | 2024-01-16 |
MX2020012276A (es) | 2021-01-29 |
US10956787B2 (en) | 2021-03-23 |
US20230039210A1 (en) | 2023-02-09 |
AU2019269312A1 (en) | 2020-11-19 |
WO2019221985A1 (en) | 2019-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7317050B2 (ja) | 異なるデータモダリティの統計モデルを統合するためのシステムおよび方法 | |
CN114067160B (zh) | 基于嵌入平滑图神经网络的小样本遥感图像场景分类方法 | |
CN111353076B (zh) | 训练跨模态检索模型的方法、跨模态检索的方法和相关装置 | |
Li et al. | 2-D stochastic configuration networks for image data analytics | |
CN109993102B (zh) | 相似人脸检索方法、装置及存储介质 | |
CN110674323B (zh) | 基于虚拟标签回归的无监督跨模态哈希检索方法及系统 | |
CN109948735B (zh) | 一种多标签分类方法、系统、装置及存储介质 | |
CN109447096B (zh) | 一种基于机器学习的扫视路径预测方法和装置 | |
CN113821668A (zh) | 数据分类识别方法、装置、设备及可读存储介质 | |
CN111582506A (zh) | 基于全局和局部标记关系的偏多标记学习方法 | |
CN114743037A (zh) | 一种基于多尺度结构学习的深度医学图像聚类方法 | |
Bhardwaj et al. | Computational biology in the lens of CNN | |
CN113378938B (zh) | 一种基于边Transformer图神经网络的小样本图像分类方法及系统 | |
Williams et al. | Sensing with shallow recurrent decoder networks | |
CN116561314B (zh) | 基于自适应阈值选择自注意力的文本分类方法 | |
CN111695570B (zh) | 一种基于变分原型推理的小样本下语义分割方法 | |
CN113591955A (zh) | 一种提取图数据的全局信息的方法、系统、设备及介质 | |
CN116383441A (zh) | 社群检测方法、装置、计算机设备和存储介质 | |
CN111259176A (zh) | 融合有监督信息的基于矩阵分解的跨模态哈希检索方法 | |
CN111626332B (zh) | 一种基于图卷积极限学习机的快速半监督分类方法 | |
Bucci et al. | Leveraging the structure of dynamical systems for data-driven modeling | |
US20240152799A1 (en) | Generative graph modeling framework | |
WO2023226310A1 (zh) | 一种分子优化方法以及装置 | |
CN117274732A (zh) | 一种基于情景记忆驱动构建优化扩散模型的方法和系统 | |
Schau | Exploring the Efficiency of Zero-Cost Proxies in NAS for Human Action Recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220506 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220506 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220523 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230426 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230516 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20230615 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230718 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7317050 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |