JP7247258B2 - コンピュータシステム、方法及びプログラム - Google Patents
コンピュータシステム、方法及びプログラム Download PDFInfo
- Publication number
- JP7247258B2 JP7247258B2 JP2021065411A JP2021065411A JP7247258B2 JP 7247258 B2 JP7247258 B2 JP 7247258B2 JP 2021065411 A JP2021065411 A JP 2021065411A JP 2021065411 A JP2021065411 A JP 2021065411A JP 7247258 B2 JP7247258 B2 JP 7247258B2
- Authority
- JP
- Japan
- Prior art keywords
- compound
- information
- distribution
- training
- label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Probability & Statistics with Applications (AREA)
- Crystallography & Structural Chemistry (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Pharmacology & Pharmacy (AREA)
- Medicinal Chemistry (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Analysis (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Databases & Information Systems (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Image Analysis (AREA)
Description
態では、訓練は、確率的エンコーダと確率的デコーダとの間の情報フロー全体をさらに制約する。いくつかの実施形態では、確率的エンコーダは、平均のベクトルおよび標準偏差のベクトルのペアを含む出力を提供するように構成される。いくつかの実施形態では、サンプリングモジュールは、エンコーダの出力を受け取り、エンコーダの出力に基づいて潜在変数を定義し、1つまたは複数の潜在的表現を生成するように構成され、潜在変数は確率分布によってモデル化される。いくつかの実施形態では、確率分布は、正規分布、ラプラス分布、楕円分布、スチューデントt分布、ロジスティック分布、一様分布、三角分布、指数分布、可逆累積分布、コーシー分布、レイリー分布、パレート分布、ワイブル分布、相反分布、ゴンペルツ分布、ガンベル分布、アーラン分布、対数正規分布、ガンマ分布、ディリクレ分布、ベータ分布、カイ二乗分布、F分布、およびそれらの変形形態からなるグループから選択される。いくつかの実施形態では、確率的エンコーダは推論モデルを含む。いくつかの実施形態では、推論モデルは多層パーセプトロンを含む。いくつかの実施形態では、確率的自動エンコーダは生成モデルを含む。いくつかの実施形態では、生成モデルは多層パーセプトロンを含む。いくつかの実施形態では、システムは、化合物指紋について選択されたラベル要素の値を予測するように構成された予測子をさらに含む。いくつかの実施形態では、ラベルは、バイオアッセイ結果、毒性、交差反応性、薬物動態、薬力学、バイオアベイラビリティ、および溶解性からなるグループから選択される1つまたは複数のラベル要素を含む。
ことを含む。いくつかの実施形態では、第1のラベル要素についての規定値に関する要件は、等モル濃度の既知の化合物の活性よりも少なくとも100%大きい第1のバイオアッセイについての肯定的な結果を有することを含む。いくつかの実施形態では、第1のラベル要素についての規定値に関する要件は、等モル濃度の既知の化合物の活性よりも少なくとも2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、15倍、25倍、50倍、100倍、200倍、300倍、400倍、500倍、1000倍、10000倍、または100000倍大きい第1のバイオアッセイについての肯定的な結果を有することを含む。いくつかの実施形態では、第2のラベル要素についての規定値に関する要件は、ノイズと比較して少なくとも1、2、3、4、5、6、7、8、9、10、12、15、20、30、50、100、500、1000、またはそれ以上の標準偏差である第2のバイオアッセイについての肯定的な結果を有することを含む。いくつかの実施形態では、第2のラベル要素についての規定値に関する要件は、等モル濃度の既知の化合物の活性よりも少なくとも10、20、30、40、50、100、200、500、または1000%大きい第2のバイオアッセイについての肯定的な結果を有することを含む。いくつかの実施形態では、第2のラベル要素の規定値に関する要件は、等モル濃度の既知の化合物の活性よりも少なくとも2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、15倍、25倍、50倍、100倍、200倍、300倍、400倍、500倍、1000倍、10000倍、または100000倍大きい第2のバイオアッセイについての肯定的な結果を有することを含む。
個々の刊行物、特許、または特許出願が、参照により組み込まれるように具体的かつ個別に示された場合のように、本明細書内で言及されるすべての刊行物、特許、および特許出願は、参照により本明細書に組み込まれる。
を含む場合がある。
は、選択された一組の所望のラベル要素値を満たす可能性が高い化合物指紋を生成するように構成される。いくつかの実施形態では、一組の所望のラベル要素値は、訓練データセット内のラベル内に現れない。いくつかの実施形態では、各化合物指紋は一意的に化合物を同定する。いくつかの実施形態では、エンコーダは、平均のベクトルおよび標準偏差のベクトルのペアを含む出力を提供するように構成される。システムは、エンコーダの出力に基づいて潜在的な確率変数を定義することができる。潜在的な確率変数は、確率分布、たとえば、正規分布、ラプラス分布、楕円分布、スチューデントt分布、ロジスティック分布、一様分布、三角分布、指数分布、可逆累積分布、コーシー分布、レイリー分布、パレート分布、ワイブル分布、相反分布、ゴンペルツ分布、ガンベル分布、アーラン分布、対数正規分布、ガンマ分布、ディリクレ分布、ベータ分布、カイ二乗分布、もしくはF分布、またはそれらの変形形態によってモデル化される場合がある。エンコーダおよび/またはデコーダは、多層パーセプトロンまたは再帰型ニューラルネットワークなどの他のタイプのニューラルネットワークの1つまたは複数の層を含む場合がある。システムは、化合物指紋に関連付けられたラベル要素値を予測するための予測子をさらに含む場合がある。いくつかの実施形態では、ラベル要素は、バイオアッセイ結果、毒性、交差反応性、薬物動態、薬力学、バイオアベイラビリティ、および溶解性からなるグループから選択される1つまたは複数の要素を含む。
の層のユニットを有する多層パーセプトロンを含む。いくつかの実施形態では、生成モデルは、確率的エンコーダ、確率的デコーダ、およびサンプリングモジュールを含む確率的自動エンコーダまたは変分自動エンコーダを含む。確率的エンコーダは、平均のベクトルおよび標準偏差のベクトルのペアを含む出力を提供するように構成される場合がある。システムは、エンコーダの出力に基づいて潜在的な確率変数を定義することができる。潜在的な確率変数は、確率分布、たとえば、正規分布、ラプラス分布、楕円分布、スチューデントt分布、ロジスティック分布、一様分布、三角分布、指数分布、可逆累積分布、コーシー分布、レイリー分布、パレート分布、ワイブル分布、相反分布、ゴンペルツ分布、ガンベル分布、アーラン分布、対数正規分布、ガンマ分布、ディリクレ分布、ベータ分布、カイ二乗分布、F分布、またはそれらの変形形態によってモデル化される場合がある。コンピュータシステムはGNUを含む場合がある。生成モデルは予測子をさらに含む場合がある。予測子は、訓練データセット内の化合物指紋の少なくともサブセットについてのラベル要素値を予測するように構成される場合がある。いくつかの実施形態では、生成モデルは、モデルによって生成された化合物表現を含む出力を提供するように構成される。表現は、化合物を一意的に同定するのに十分であり得る。生成された化合物は、訓練データセットに含まれなかった化合物であってもよく、場合によっては、これまで合成されていないか、または考えられてさえいない化合物であってもよい。
様々な実施形態では、本明細書に記載されるシステムおよび方法は、生成モデルをコアコンポーネントとして利用する。
logpθ(x)=L(θ,φ,x)
ここで、φは符号化パラメータを表記し、θは復号パラメータを表記する。この定義から、
L(θ,φ,x)=-DKL(qφ(Z|x)||pθ(Z))+Eq_φ(Z|x)(logpθ(x|Z))
という結果になる。
qφ(Z|x)=q(Z;g(x,φ))
ここで、g(x)は、入力xを潜在変数Zにマッピングする関数であり、Z=μZ(x)+σZ(x)εZとしてパラメータ化され、ここで、εZ=N(0,1)である(図5A)。
pθ(x|Z)=p(x;f(Z,θ))
ここで、f(Z)は潜在変数Zをxにわたる分布にマッピングする関数である(図5B)。デコーダの出力Xは、
X=μx(Z)+σx(Z)εx
としてパラメータ化される場合があり、ここで、εx=N(0,1)である。
指紋データと関連付けるための予測子モジュールを含む。半教師付き学習の例示的な実施形態では、生成モデルを訓練するために使用される訓練データセットは、実験的に同定されたラベル情報を有する化合物と、予測子モジュールによって予測されるラベルを有する化合物の両方を含む。(図2B)。
変分下限を最適化するように訓練される場合がある。
様々な実施形態では、本明細書に記載される方法およびシステムは、化合物の表現を生成するために使用される。これらの生成された表現は、モデルを訓練するために使用された訓練データセットの一部ではなかった可能性がある。いくつかの実施形態では、生成された表現に関連付けられた化合物は、それを作成した生成モデルに対して新規であり得る。
初期ケースでは、候補化合物の生成は、所望のラベルy~によってのみ制約される。したがって、候補化合物の物理的構造に制限がない場合、初期生成が使用される場合がある。生成された化合物は所望のラベルy~によってのみ制限されるので、初期生成は、化合物データベースにまだ存在しない可能性がある新規化合物を生成する可能性がより高い場
合がある。そのような結果は、探索的創薬研究において有用であり得る。
様々な実施形態では、本明細書に記載されるシステムおよび方法は、シード化合物を開始点として使用して、化合物の表現、たとえば指紋を生成するために利用される。シード化合物は、特定の実験結果が知られている既知の化合物であってもよく、生成された化合物の構造特性がシード化合物の構造特性とのいくらかの類似性を示すことが予想される場合がある。たとえば、シード化合物は、オフラベル使用のために再利用または検査されている既存の薬物であってもよく、生成された候補化合物が、低い毒性および高い溶解性などのシード化合物の有益な活性のうちのいくつかを保持するが、所望のラベルによって要求されるように、異なるターゲットとの結合などの、他のアッセイでは異なる活性を示すことが望ましい場合がある。シード化合物はまた、所望のラベル結果のサブセットを所有するように物理的に検査された化合物であってもよいが、毒性の低下、溶解性の改善、および/または合成の容易さの改善などの、特定の他のラベル結果における改善が望まれる。したがって、比較生成は、シード化合物と構造的類似性を所有するが、特定のアッセイにおいて所望の活性などの異なるラベル結果を示すことを目指す化合物を生成するために使用される場合がある。
訓練データは、PubChem(http://pubchem.ncbi.nlm.nih.gov/)などのデータベースからの化合物および関連ラベルの情報から集められる場合がある。データは、薬物スクリーニングライブラリ、組合せ合成ライブラリなどから取得される場合もある。アッセイに関連するラベル要素は、細胞アッセイおよび生化学アッセイを含む場合があり、場合によっては、複数の関連するアッセイ、たとえば、酵素の異なるファミリのアッセイを含む場合がある。様々な実施形態では、1つまたは複数のラベル要素に関する情報は、化合物データベース、バイオアッセイデータベース、毒性データベース、臨床記録、交差反応性記録、または当技術分野で知られている任意の他の適切なデータベースなどのリソースから取得される場合もある。
化合物は、本明細書に記載される生成モデルとの関連で使用することができる表現、たとえば、指紋を作成するために前処理される場合がある。場合によっては、化合物の化学式は、縮退なしにその表現から復元される場合がある。他の場合には、1つの表現は2つ以上の化学式にマッピングすることができる。さらに他の場合には、その表現から推論され得る同定可能な化学式は存在しない可能性がある。最も近い隣接物探索は、表現空間において行われる場合がある。同定された隣接物は、生成モデルによって生成された表現を近似することができる化学式につながる可能性がある。
合物にわたって正規化される場合がある。
本発明の重要な利点は、より少ない副作用しかもたない可能性がある薬物を発見する能力である。本明細書に記載される生成モデルは、特定の結果がヒトまたは動物における副作用および/または毒性反応を引き起こす原因となることが知られている特定のアッセイについての化合物活性を訓練データセットに含めることによって訓練される場合がある。したがって、生成モデルは、化合物表現と有益な効果および望まれない効果との間の関係を教えられる場合がある。生成フェーズでは、デコーダに入力される所望のラベルy~は、有益な効果および/または望まれない副作用に関連付けられたアッセイで所望の化合物活性を特定することができる。次いで、生成モデルは、有益な効果と毒性/副作用の両方の要件を同時に満たす化合物の表現を生成することができる。
る生成ネットワークは、所望のラベルに基づいて化合物用の生成された表現を作成することができ、化合物は別の効果を有することが知られている。したがって、複数のラベル要素で訓練された生成モデルは、異なる効果のための所望のラベルを入力することによって生成フェーズの使用に応答して、第1の効果を有することが知られている化合物用の表現を生成し、第2の効果を効果的に同定することができる。したがって、生成モデルは、既存の化合物用の第2のラベルを同定するために使用される場合がある。臨床試験された化合物を再利用することは、臨床研究中のリスクを低くする可能性があり、さらに、効果的かつ安価に有効性および安全性が実証される可能性があるため、そのように決定された化合物は特に価値がある。
のアッセイ結果で、y*は1ラベル要素値だけy~と異なる場合がある。
られることなく、集合Aおよび集合Bの基数が大きくなるにつれて、ジニ係数の直接計算は、組合せ爆発に起因して困難または非現実的になる可能性がある。本明細書に記載されるシステムおよび方法は、たとえばクラスタリング方法を適用することにより、AとBとの間の必要な一対比較の数を減らす方法を利用するように構成される場合がある。したがって、パラメータのジニ係数は、AのメンバおよびBのメンバのクラスタリングから生じるクラスタの重心間の一対比較によって計算される場合がある。
心集合ACおよびBCを形成するために抽出される場合がある。理論に縛られることなく、重心集合ACおよびBCのメンバは、多くの場合、元の集合AおよびBのいくつかのメンバに対応する符号化された潜在的表現ではない可能性がある。しかしながら、重心集合のメンバは、化合物表現空間において対応するメンバを生成するために復号される場合がある。たとえば、潜在的表現デコーダモジュール(LRD)は、重心に対応する化合物表現、たとえば指紋を生成するために使用される場合があり、これらは、それぞれ、集合AFおよびBF内でグループ化される場合がある。
本発明はまた、本明細書の動作を実施するための装置に関する。この装置は、必要な目的のために特別に構築される場合があり、または、コンピュータに記憶されたコンピュータプログラムによって選択的に起動または再構成された汎用コンピュータを含む場合がある。そのようなコンピュータプログラムは、限定はしないが、フロッピーディスク、光ディスク、CD-ROM、および光磁気ディスクを含む任意のタイプのディスク、読取り専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、EPROM、EEPROM、磁気カードもしくは光カード、または電子命令を記憶するのに適した、各々がコンピュータシステムバスに結合される任意のタイプの媒体などの、コンピュータ可読記憶媒体に記憶される場合がある。
一例では、データは、分子記述子の特徴ベクトルを含む指紋などの化合物表現(xD)、および表現された化合物に関連付けられたラベル(yD)を含むペアとしてエンコーダに提供される。エンコーダに入力されるペアは、IE = (xiD, yiD) として記述される場合があり、xiD は次元数dim_xiD を有する実数値ベクトルであり、yiD は対応するxiD についてのラベルデータを表記する。xiDの次元数dim_xiD は、訓練データセット全体にわたって固定される場合がある。yDの要素は、場合によっては任意の次元を有するスカラーまたはベクトルであり得る。yD内のラベル要素値は、連続またはバイナリであり得る。
xD=(1.2,-0.3,1.5,4.3,-2.9,1.3,-1.5,2.3,10.2,1.1)、
yD=3、
エンコーダへの入力は
IE=((1.2,-0.3,1.5,4.3,-2.9,1.3,-1.5,2.3,10.2,1.1),3)
である。
エンコーダ用の例示的な出力構造が記載される。エンコーダに入力される所与のIE = (xiD, yiD) に対して、エンコーダは、平均の実数値ベクトルμE,i、および標準偏差の実数値ベクトルσE,iのペアを出力し、OE=(μE,i,σE,i)=((μE,i,1,・・・,μE,i,d),(σE,i,1,・・・,σE,i,d))として表される。ベクトルμEおよびσEの次元はこの例では同じである。しかしながら、ベクトルμEおよびσEの次元は、dim_xiD、または、dim_xiD + dim_yiD とは異なる場合がある。OEは、決定論的な方法でエンコーダによって提供される。所与のIEおよびエンコーダのパラメータの集合に対して、単一のOEペアが提供される。4の次元数の場合、エンコーダの例示的な出力は、μE=(1.2,-0.02,10.5,0.2)およびσE=(0.4,1.0,0.3,0.3)によって示される。
この例では、エンコーダによって出力される平均および標準偏差は、潜在変数Z=(N(μE,i,1,σE,i,1),・・・,N(μE,i,d,σE,i,d))を定義し、μE,iおよびσE,iはエンコーダによって出力されたベクトルであり、Nは正規分布を表記する。たとえば、エンコーダの出力がμE=(1.2,-0.02,10.5,0.2)およびσE=(0.4,1.0,0.3,0.3)を含む場合、サンプリングモジュールは、潜在的な確率変数をZ=(N(1.2,0.4),N(-0.02,1.0),N(10.5,0.3),N(0.2,0.3))として定義することができる。
例示的なサンプリングモジュールは、潜在変数Zおよび確率変数X~によって定義されるものなどの、一確率分布からの一サンプル、または確率分布の集合からの複数のサンプルを引き出す。この例では、サンプリングモジュールは、潜在変数Zと同じ次元を有する潜在的表現zを生成するために、潜在変数Zからサンプルを引き出すことができる。この例では、潜在変数Zから単一の潜在的表現zが引き出される。Z=(N(1.2,0.4),N(-0.02,1.0),N(10.5,0.3),N(0.2,0.3)に対して、例示的な潜在的表現ベクトルzは、z=(0.9,-0.1,10.1,0.1)である。必要に応じて、サンプリングモジュールは、単一の潜在変数Zから複数の潜在的表現zを引き出すことができる。
この例では、デコーダは、順序付きペア(z、yD)を含む入力IDを受け取り、zは潜在的な確率変数Zからサンプリングされた潜在的表現であり、yDはラベルである。この例では、ラベルyDは、入力特徴ベクトルxDに関連付けられたラベルと同じである。したがって、ラベルyDは訓練プロセス内で2回入力され、1回はエンコーダに、1回はデコーダに入力される。たとえば、IDは、ペア((0.9,-0.1,10.1,0.1),3)を含む場合がある。
この例では、デコーダは、平均の実数値ベクトルμD,iおよび標準偏差の実数値ベクトルσD,iのペアを出力として生成する:OD=(μD,i,σD,i)=((μD,i,1・・・,μD,i,d),(σD,i,1,・・・,σD,i,d))。この例では、ベクトルμDおよびσDの次元は、エンコーダに入力される特徴ベクトルxDの次元と同じである。たとえば、dim_xiD =10の場合、デコーダは、元の入力xD=(1.2,-0.3,1.5,4.3,-2.9,1.3,-1.5,2.3,10.2,1.1)に対して、μD=(1.1,-0.2,1.1,3.9,-3.5,0.1,-2.0,1.9,9.3,1.0)およびσD=(0.1,0.3,0.2,0.5,1.0,0.5,1.0,0.2,0.1,1.0)を出力することができる。
この例は初期生成プロセスに関する。この例では、潜在的表現zは、サンプリングモジュールによって標準正規分布N(0,1)から引き出される。単一の所望のラベルy~が使用される。モデルによって生成されるべき化合物表現ごとに、別個の潜在的表現zがN(0,1)から引き出される。たとえば、ユーザが2つの化合物表現を生成することを望む場合、2つの別個の潜在的表現z1およびz2がN(0,1)から引き出される。zの次元数が4である場合、サンプリングモジュールは、一例では、サンプルz1=(0.2,-0.1,0.5,0.1)およびz2=(0.3,0.1,0,-0.3)を引き出すことができる。
この例では、サンプリングモジュールによってNから以前にサンプリングされた潜在的表現z、ならびに所望のラベルy~がデコーダに入力される。ラベルy~は、生成された指紋によって表される化合物の所望の特性および活性に従って、ユーザによって指定される場合がある。所望のラベルy~は、モデルを訓練するために使用されたラベル要素のサブセット、すなわちラベルyDに含まれるラベル要素についての所望の値を含まなければならない。y~がyDよりも少ないラベル要素を有する場合、マスキングモジュールは、デコーダにy~が入力されるより前に、y~の欠損ラベル要素に0の値を与えることができる。所望のラベルy~は、yD内の対応するラベル要素の値とは異なるラベル要素の1つまたは複数の値を含む場合がある。単一の所望のラベルy~を用いて複数のx~を生成するために、Nから複数のサンプルzを引き出すことが可能である。zおよび異なる所望のラベルy~から構成されるいくつかのペアをデコーダに入力し、2つ以上の確率変数X~を生成することにより、単一の潜在的表現zから2つ以上の化合物表現を生成することも可能である。
この例では、デコーダは、平均の実数値ベクトルμ D~および標準偏差の実数値ベクトルσD~のペア(μ D~、σD~)を出力する。この例では、ベクトルμ D~およびσD~の次元は、モデルの学習に使用された指紋である特徴ベクトルxDの次元と同じである。たとえば、xDの次元が10である場合、デコーダは、一例では、μ D~=(1.1,-0.2,1.1,3.9,-3.5,0.1,-2.0,1.9,9.3,1.0)およびσD~=(0.1,0.3,0.2,0.5,1.0,0.5,1.0,0.2,0.1,1.0)を出力する。
デコーダの出力から、確率変得X~は、X~=(N(μ D、i、1,σD、i、1),・・・,N(μ D、i、d,σD,i,d))であるように定義することができ、μD,iおよびσD,iはデコーダによって出力されたベクトルである。たとえば、μD=(1.1,-0.2,1.1,3.9,-3.5,0.1,-2.0,1.9,9.3,1.0)およびσD=(0.1,0.3,0.2,0.5,1.0,0.5,1.0,0.2,0.1,1.0)である場合、X~=(N(1.1,0.1),N(-0.2,0.3),・・・,N(1.0,1.0))である。
化合物表現x~を生成するために、サンプリングモジュールは、確率変数X~からサンプルを引き出す。その次元がモデルを訓練するために使用された指紋特徴ベクトルの次元と同じであるようにX~を定義すると、表現x~の次元が指紋特徴ベクトルの次元と同じになることが可能になり得る。必要に応じて、確率変数X~から複数の化合物表現がサンプリングされる場合がある。たとえば、確率変数X~=(N(1.1,0.1),N(-0.2,0.3),・・・,N(1.0,1.0))である場合、X~から4つのサンプルを引き出すことができ、一例では、4つの表現x1~=(1.0,-0.1,・・・,3.0)、x2~=(1.2,-0.5,・・・,1.8)、x3~=(1.0,-0.1,・・・,0.5)、およびx4~=(0.9,0.3,・・・,1.1)がもたらされる。
この例では、エンコーダへの入力およびエンコーダからの出力は、エンコーダおよびデコーダの訓練中に実施例1および2において使用されたものと同じタイプである。たとえば:
xD=(1.2,-0.3,1.5,4.3,-2.9,1.3,-1.5,2.3,10.2,1.1)、
yD=3、
μE=(1.2,-0.02,10.5,0.2)、および
σE=(0.4,1.0,0.3,0.3)
である。
この例では、上記の実施例3および4において使用されたように、潜在的表現zを作成するために、潜在変数Zを定義し、Zからサンプリングするために同じ手順が使用される。
μE=(1.2,-0.02,10.5,0.2)、
σE=(0.4,1.0,0.3,0.3)、
Z=(N(1.2,0.4),N(-0.02,1.0),N(10.5,0.3),N(0.2,0.3))、および
z=(0.9,-0.1,10.1,0.1)
である。
この例では、デコーダへの入力とデコーダの出力の両方を構築するために、実施例8および9において使用されたものと同じ手順が使用される。たとえば:
ID=(z,y~)、
OD=(μD~,σD~)、
μD~=(1.1,-0.2,1.1,3.9,-3.5,0.1,-2.0,1.9,9.3,1.0)、および
σD~=(0.1,0.3,0.2,0.5,1.0,0.5,1.0,0.2,0.1,1.0)
である。
この例では、確率変数X~を定義し、X~からサンプリングすることによって化合物表現x~を生成するために、実施例10および11において使用されたものと同じ手順が使用される。たとえば:
X~=(N(1.1,0.1),N(-0.2,0.3),・・・,N(1.0,1.0))、
x1~=(1.0,-0.1,・・・,3.0)、
x2~=(1.2,-0.5,・・・,1.8)、
x3~=(1.0,-0.1,・・・,0.5)、および
x4~=(0.9,0.3,・・・,1.1)
である。
この例では、生成された指紋の予測されたアッセイ結果が、所望のアッセイ結果と比較される。次いで、所望のアッセイ結果と一致する予測結果を有する指紋が、薬物らしさスコアによってランク付けされる。
この例では、比較生成プロセスを使用して生成された指紋は、シード化合物との類似性、および所望のラベルと類似するラベルを有することについて評価される。上記で例示された比較生成手順では、シードに類似する新規の指紋を生成するためにシード化合物が使用される。指紋が生成されると、生成された指紋がシードと十分に類似しているかどうかを判定するために、さらなる評価ステップが使用される。比較モジュールは、2つの指紋の対応するパラメータを比較するために使用される。同一パラメータのしきい値またはしきい値類似性が達成された場合、2つの指紋は十分に類似しているとマークされる。
この例では、ランク付けモジュールは、生成された表現x~をランク付けするように訓練される。生成された表現は、ランク付けモジュールに入るより前に、比較モジュールなどの他のモジュールによってフィルタリングされている場合がある。この例では、ランク付けモジュールは2つの機能を有する:(1)各指紋に薬物らしさスコアを割り当てること、および(2)それらの薬物らしさスコアに従って指紋の集合をランク付けすること。
合である。
アッセイ結果の特定の集合の場合、それらの結果を満たす新規化合物を生成し、次いで、最初の化合物のまわりの空間において同様の化合物を探索することが望ましい場合がある。この適用の場合、初期生成および比較生成が順番に使用される場合がある。
この方法は、特定のアッセイ結果の原因となり得る化合物特性を同定するために使用される。この方法は、候補変態、すなわち特定のアッセイで化合物の性能を変化させる特定の構造特性を同定する方法を提供する。これらは、次いで、一致分子ペア分析(MMPA)のための開始点として使用される場合がある。
この例では、特定のアッセイ結果の原因となり得る特定の化合物における変態を探索するための方法が記載される。この方法では、指紋の2つの集合を生成するために、2つの比較生成プロセスが並行して繰り返し実行される(図13)。これらのプロセスは同じシード化合物を使用するが、各々ターゲットアッセイ結果の異なる集合、たとえば、y~およびy*が単一のアッセイ結果だけ異なる、陽性ターゲットy~および陰性ターゲットy*を使用する。比較モジュールは、陽性ターゲットで生成された指紋と陰性ターゲットで生成された指紋との間の特定の構造的差異を識別するために使用される。
この例は、(1)2つのオブジェクト、たとえばアッセイ結果の2つのベクトルまたは2つの指紋が同様または同一であるかどうかを判定すること、および(2)指紋の2つの集合を比較することによって特定のアッセイ結果における変化の原因となる可能性が最も高い指紋パラメータを識別することの2つの機能を有する比較モジュールを記載する。
類似性に関する簡単な一対比較では、2つのオブジェクトの対応する要素、たとえば、アッセイ結果の2つのベクトルまたは2つの指紋のいずれかが比較される。2つのオブジェクトが比較に合格するか失敗するかを判定するために、ユーザ指定のしきい値が設定される。
指紋の2つの集合を比較するとき、化合物の重要な変態を同定するために、いくつかの方法が使用される。1つの簡単な方法は、線形モデルを使用して重要なパラメータを識別することである。たとえば、パラメータ間の相互作用がアッセイ結果における変化の原因となった可能性に対処するために、相互作用項をモデルに加えることができる。
この例では、比較モジュールは、集合AおよびBの潜在的表現のクラスタを利用するように構成される。最初に、集合AおよびBのメンバを潜在的表現として符号化して、それぞれ、集合ALおよびBLを形成するために、潜在的表現生成器(LRG)が使用される(図14)。次いで、K-メドイドクラスタリングが、集合ALおよびBLのメンバに適用される。クラスタリングに続いて、潜在的表現の重心集合ACおよびBCを形成するために、クラスタリングされた集合の重心が抽出される。指紋の2つの集合AFおよびBFを形成するために、ACおよびBCのメンバに対応する指紋が検索される。次いで、AFおよびBFのメンバは、アッセイ結果または別のラベル要素値における変化の原因となり得る化合物変態を同定するために使用される。
この例では、実施例23に記載された方法におけるk-メドイドクラスタリングの代わりにk-平均クラスタリングが使用される。k-メドイド法におけるように、集合AおよびBのメンバが潜在的表現として符号化される。潜在的表現の集合にk-平均クラスタリングが適用される。k-平均クラスタリングの結果である重心は、潜在的表現デコーダモジュール(LRD)を使用して指紋として復号され、それぞれの集合AFおよびBFに保存される。集合AFおよびBFは、ラベルまたはラベル要素値の変化に関連付けられた重要な化合物変態を同定するために使用される。
Claims (24)
- 1つまたは複数のメモリと、
1つまたは複数のプロセッサと、を備え、
前記1つまたは複数のプロセッサは、
潜在的表現をニューラルネットワークに入力することで、化合物に関する情報を生成し、
前記ニューラルネットワークは、訓練用の化合物に関する情報と、前記訓練用の化合物の潜在的表現を前記ニューラルネットワークに入力することで生成された前記訓練用の化合物に関する情報の再構成物との誤差に基づいて訓練されたものであり、
前記ニューラルネットワークは、デコーダであって、
前記訓練用の化合物の潜在的表現は、前記訓練用の化合物に関する情報をエンコーダに入力することで生成される、
コンピュータシステム。 - 前記1つまたは複数のプロセッサは、
前記化合物に関する情報を、所定の特性に関して評価する、
請求項1に記載のコンピュータシステム。 - 前記所定の特性は、活性、溶解性、毒性、合成の容易性、バイオアッセイデータ、交差反応性、疎水性を含む他の化学的特徴、前記化合物の生物学および化学の特性の複合データ、前記化合物の構造または機能を特徴付けるために用いられうる任意の他の情報、アッセイ結果、のうちの1つまたは複数である、請求項2に記載のコンピュータシステム。
- 前記1つまたは複数のプロセッサは、
前記化合物に関する情報として、化合物に関する第1の情報を生成し、前記化合物に関する第1の情報に基づいて、化合物に関する第2の情報を生成する、
請求項1から3のいずれか1項に記載のコンピュータシステム。 - 前記化合物に関する第2の情報の生成は、前記化合物に関する第1の情報の評価に基づく、請求項4に記載のコンピュータシステム。
- 前記化合物に関する第2の情報の生成は、前記化合物に関する第1の情報のまわりの化合物空間を用いて行われる、請求項4または5に記載のコンピュータシステム。
- 前記化合物は薬品である、請求項1から6のいずれか1項に記載のコンピュータシステム。
- 前記評価は、少なくとも、所望のアッセイ結果、構造特性、生成された前記化合物に関する情報に対応する化合物とは別の化合物との類似性、又は、薬物らしさのいずれか1つに関する評価である、
請求項2に記載のコンピュータシステム。 - 前記訓練用の化合物の潜在的表現は、前記エンコーダから出力された潜在変数を用いたサンプリングによって生成される、
請求項1に記載のコンピュータシステム。 - 前記潜在変数は、正規分布、ラプラス分布、楕円分布、スチューデントt分布、ロジスティック分布、一様分布、三角分布、指数分布、可逆累積分布、コーシー分布、レイリー分布、パレート分布、ワイブル分布、相反分布、ゴンペルツ分布、ガンベル分布、アーラン分布、対数正規分布、ガンマ分布、ディリクレ分布、ベータ分布、カイ二乗分布、又は、F分布のいずれか1つを用いて表現される、
請求項9に記載のコンピュータシステム。 - 前記潜在的表現は、生成された前記化合物に関する情報に対応する化合物とは別の化合物に基づいて生成されたものである、
請求項1から10のいずれか1項に記載のコンピュータシステム。 - 前記1つまたは複数のプロセッサは、
前記別の化合物に関する情報を第2のニューラルネットワークに入力した際の出力に基づいて、前記潜在的表現を生成する、
請求項11に記載のコンピュータシステム。 - 前記1つまたは複数のプロセッサは、
前記別の化合物の潜在変数を用いたサンプリングにより前記潜在的表現を生成する、
請求項11または請求項12に記載のコンピュータシステム。 - 前記1つまたは複数のプロセッサは、
前記潜在的表現とラベル情報を前記ニューラルネットワークに入力することで、前記化合物に関する情報を生成する、
請求項1から13のいずれか1項に記載のコンピュータシステム。 - 前記1つまたは複数のプロセッサは、
生成された前記化合物に関する情報に対応する化合物とは別の化合物に関する情報から前記ラベル情報を生成する、
請求項14に記載のコンピュータシステム。 - 前記1つまたは複数のプロセッサは、
第3のニューラルネットワークを用いて、前記別の化合物に関する情報から前記ラベル情報を生成する、
請求項15に記載のコンピュータシステム。 - 前記潜在的表現は、生成された前記化合物に関する情報に対応する化合物とは別の化合物に基づいて生成されたものであって、
前記ニューラルネットワークに入力される前記ラベル情報は、前記別の化合物のラベル情報とは異なる情報を含む、
請求項14から16のいずれか1項に記載のコンピュータシステム。 - 前記潜在的表現はランダムな要素を含む、
請求項14に記載のコンピュータシステム。 - 前記ラベル情報は、少なくとも、生物学的データ、バイオアッセイデータ、溶解性、交差反応性、疎水性、相転移境界毒性、薬物動態、薬力学、バイオアベイラビリティ、又は、活性のいずれか1つに関する情報を含む、
請求項14から18のいずれか1項に記載のコンピュータシステム。 - 前記ラベル情報は、少なくとも、化合物データベース、バイオアッセイデータベース、毒性データベース、臨床記録、又は、交差反応性記録のいずれか1つに基づく情報である、
請求項14から19のいずれか1項に記載のコンピュータシステム。 - 前記化合物に関する情報は、少なくとも、分子記述子、又は、指紋表現のいずれか1つを含む、
請求項1から20のいずれか1項に記載のコンピュータシステム。 - 前記化合物に関する情報は、前記化合物の構造情報を含む、
請求項1から21のいずれか1項に記載のコンピュータシステム。 - 1つまたは複数のプロセッサが実行する、化合物に関する情報を生成する方法であって、
潜在的表現をニューラルネットワークに入力することで、前記化合物に関する情報を生成するステップを含み、
前記ニューラルネットワークは、訓練用の化合物に関する情報と、前記訓練用の化合物の潜在的表現を前記ニューラルネットワークに入力することで生成された前記訓練用の化合物に関する情報の再構成物との誤差に基づいて訓練されたものであり、
前記ニューラルネットワークは、デコーダであって、
前記訓練用の化合物の潜在的表現は、前記訓練用の化合物に関する情報をエンコーダに入力することで生成される、
方法。 - 1つまたは複数のプロセッサに、
潜在的表現をニューラルネットワークに入力することで、化合物に関する情報を生成する処理を実行させ、
前記ニューラルネットワークは、訓練用の化合物に関する情報と、前記訓練用の化合物の潜在的表現を前記ニューラルネットワークに入力することで生成された前記訓練用の化合物に関する情報の再構成物との誤差に基づいて訓練されたものであり、
前記ニューラルネットワークは、デコーダであって、
前記訓練用の化合物の潜在的表現は、前記訓練用の化合物に関する情報をエンコーダに入力することで生成される、
プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023040192A JP2023082017A (ja) | 2015-12-02 | 2023-03-15 | コンピュータシステム |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562262337P | 2015-12-02 | 2015-12-02 | |
US62/262,337 | 2015-12-02 | ||
US15/015,044 US10776712B2 (en) | 2015-12-02 | 2016-02-03 | Generative machine learning systems for drug design |
US15/015,044 | 2016-02-03 | ||
JP2018528803A JP6866375B2 (ja) | 2015-12-02 | 2016-12-02 | 薬物設計のためのコンピュータシステム、訓練方法及び生成方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018528803A Division JP6866375B2 (ja) | 2015-12-02 | 2016-12-02 | 薬物設計のためのコンピュータシステム、訓練方法及び生成方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023040192A Division JP2023082017A (ja) | 2015-12-02 | 2023-03-15 | コンピュータシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021121927A JP2021121927A (ja) | 2021-08-26 |
JP7247258B2 true JP7247258B2 (ja) | 2023-03-28 |
Family
ID=58797388
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018528803A Active JP6866375B2 (ja) | 2015-12-02 | 2016-12-02 | 薬物設計のためのコンピュータシステム、訓練方法及び生成方法 |
JP2021065411A Active JP7247258B2 (ja) | 2015-12-02 | 2021-04-07 | コンピュータシステム、方法及びプログラム |
JP2023040192A Pending JP2023082017A (ja) | 2015-12-02 | 2023-03-15 | コンピュータシステム |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018528803A Active JP6866375B2 (ja) | 2015-12-02 | 2016-12-02 | 薬物設計のためのコンピュータシステム、訓練方法及び生成方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023040192A Pending JP2023082017A (ja) | 2015-12-02 | 2023-03-15 | コンピュータシステム |
Country Status (3)
Country | Link |
---|---|
US (3) | US10776712B2 (ja) |
JP (3) | JP6866375B2 (ja) |
WO (1) | WO2017094899A1 (ja) |
Families Citing this family (130)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2850734B1 (en) | 2012-05-13 | 2019-04-24 | Amir Khandani | Full duplex wireless transmission with channel phase-based encryption |
US10177896B2 (en) | 2013-05-13 | 2019-01-08 | Amir Keyvan Khandani | Methods for training of full-duplex wireless systems |
US10042422B2 (en) | 2013-11-12 | 2018-08-07 | Thalmic Labs Inc. | Systems, articles, and methods for capacitive electromyography sensors |
US20150124566A1 (en) | 2013-10-04 | 2015-05-07 | Thalmic Labs Inc. | Systems, articles and methods for wearable electronic devices employing contact sensors |
US10188309B2 (en) | 2013-11-27 | 2019-01-29 | North Inc. | Systems, articles, and methods for electromyography sensors |
US11921471B2 (en) | 2013-08-16 | 2024-03-05 | Meta Platforms Technologies, Llc | Systems, articles, and methods for wearable devices having secondary power sources in links of a band for providing secondary power in addition to a primary power source |
US9880632B2 (en) | 2014-06-19 | 2018-01-30 | Thalmic Labs Inc. | Systems, devices, and methods for gesture identification |
US10074066B2 (en) * | 2016-01-16 | 2018-09-11 | International Business Machines Corporation | Two phase predictive approach for supply network optimization |
GB201718756D0 (en) * | 2017-11-13 | 2017-12-27 | Cambridge Bio-Augmentation Systems Ltd | Neural interface |
US10778295B2 (en) | 2016-05-02 | 2020-09-15 | Amir Keyvan Khandani | Instantaneous beamforming exploiting user physical signatures |
CN110300542A (zh) | 2016-07-25 | 2019-10-01 | 开创拉布斯公司 | 使用可穿戴的自动传感器预测肌肉骨骼位置信息的方法和装置 |
US11337652B2 (en) * | 2016-07-25 | 2022-05-24 | Facebook Technologies, Llc | System and method for measuring the movements of articulated rigid bodies |
US11216069B2 (en) | 2018-05-08 | 2022-01-04 | Facebook Technologies, Llc | Systems and methods for improved speech recognition using neuromuscular information |
US20200073483A1 (en) | 2018-08-31 | 2020-03-05 | Ctrl-Labs Corporation | Camera-guided interpretation of neuromuscular signals |
CN110312471B (zh) | 2016-07-25 | 2022-04-29 | 脸谱科技有限责任公司 | 从神经肌肉活动测量中导出控制信号的自适应系统 |
US11635736B2 (en) | 2017-10-19 | 2023-04-25 | Meta Platforms Technologies, Llc | Systems and methods for identifying biological structures associated with neuromuscular source signals |
WO2018022597A1 (en) | 2016-07-25 | 2018-02-01 | Ctrl-Labs Corporation | Methods and apparatus for inferring user intent based on neuromuscular signals |
US10650227B2 (en) * | 2016-10-31 | 2020-05-12 | Google Llc | Face reconstruction from a learned embedding |
CN108021549B (zh) * | 2016-11-04 | 2019-08-13 | 华为技术有限公司 | 序列转换方法及装置 |
EP3566182A1 (en) * | 2017-02-06 | 2019-11-13 | Deepmind Technologies Limited | Memory augmented generative temporal models |
WO2018192672A1 (en) * | 2017-04-19 | 2018-10-25 | Siemens Healthcare Gmbh | Target detection in latent space |
US10700766B2 (en) | 2017-04-19 | 2020-06-30 | Amir Keyvan Khandani | Noise cancelling amplify-and-forward (in-band) relay with self-interference cancellation |
US11288575B2 (en) * | 2017-05-18 | 2022-03-29 | Microsoft Technology Licensing, Llc | Asynchronous neural network training |
WO2019004350A1 (ja) * | 2017-06-29 | 2019-01-03 | 株式会社 Preferred Networks | データ識別器訓練方法、データ識別器訓練装置、プログラム及び訓練方法 |
US11035227B2 (en) | 2017-07-14 | 2021-06-15 | The Board Of Regents Of The University Of Oklahoma | Generating spectral responses of materials |
WO2019048965A1 (ja) * | 2017-09-06 | 2019-03-14 | 株式会社半導体エネルギー研究所 | 物性予測方法および物性予測システム |
CN110021373A (zh) * | 2017-09-19 | 2019-07-16 | 上海交通大学 | 一种化学反应的合法性预测方法 |
US10679129B2 (en) * | 2017-09-28 | 2020-06-09 | D5Ai Llc | Stochastic categorical autoencoder network |
WO2019070517A1 (en) * | 2017-10-03 | 2019-04-11 | Bioanalytix, Inc. | SYSTEMS AND METHODS FOR AUTOMATED BIOLOGICAL DEVELOPMENT DETERMINATIONS |
US11212089B2 (en) | 2017-10-04 | 2021-12-28 | Amir Keyvan Khandani | Methods for secure data storage |
WO2019139595A1 (en) * | 2018-01-11 | 2019-07-18 | Visa International Service Association | Offline authorization of interactions and controlled tasks |
US11012144B2 (en) | 2018-01-16 | 2021-05-18 | Amir Keyvan Khandani | System and methods for in-band relaying |
US11150730B1 (en) | 2019-04-30 | 2021-10-19 | Facebook Technologies, Llc | Devices, systems, and methods for controlling computing devices via neuromuscular signals of users |
US11567573B2 (en) | 2018-09-20 | 2023-01-31 | Meta Platforms Technologies, Llc | Neuromuscular text entry, writing and drawing in augmented reality systems |
US11493993B2 (en) | 2019-09-04 | 2022-11-08 | Meta Platforms Technologies, Llc | Systems, methods, and interfaces for performing inputs based on neuromuscular control |
US11069148B2 (en) | 2018-01-25 | 2021-07-20 | Facebook Technologies, Llc | Visualization of reconstructed handstate information |
US11907423B2 (en) | 2019-11-25 | 2024-02-20 | Meta Platforms Technologies, Llc | Systems and methods for contextualized interactions with an environment |
US11961494B1 (en) | 2019-03-29 | 2024-04-16 | Meta Platforms Technologies, Llc | Electromagnetic interference reduction in extended reality environments |
US10937414B2 (en) | 2018-05-08 | 2021-03-02 | Facebook Technologies, Llc | Systems and methods for text input using neuromuscular information |
US11481030B2 (en) | 2019-03-29 | 2022-10-25 | Meta Platforms Technologies, Llc | Methods and apparatus for gesture detection and classification |
WO2019155064A1 (en) * | 2018-02-09 | 2019-08-15 | Deepmind Technologies Limited | Data compression using jointly trained encoder, decoder, and prior neural networks |
JP6893483B2 (ja) * | 2018-02-09 | 2021-06-23 | 株式会社デンソーアイティーラボラトリ | 情報推定装置及び情報推定方法 |
US11087861B2 (en) | 2018-03-15 | 2021-08-10 | International Business Machines Corporation | Creation of new chemical compounds having desired properties using accumulated chemical data to construct a new chemical structure for synthesis |
EP3561702A1 (de) * | 2018-04-23 | 2019-10-30 | Covestro Deutschland AG | Verfahren zum ermitteln einer produktkomposition für ein chemisches mischungsprodukt |
US10592001B2 (en) | 2018-05-08 | 2020-03-17 | Facebook Technologies, Llc | Systems and methods for improved speech recognition using neuromuscular information |
JP7002404B2 (ja) * | 2018-05-15 | 2022-01-20 | 株式会社日立製作所 | データから潜在因子を発見するニューラルネットワーク |
WO2019231911A1 (en) | 2018-05-29 | 2019-12-05 | Ctrl-Labs Corporation | Shielding techniques for noise reduction in surface electromyography signal measurement and related systems and methods |
CN112585600A (zh) | 2018-06-14 | 2021-03-30 | 脸谱科技有限责任公司 | 使用神经肌肉标记进行用户识别和认证 |
JP7119631B2 (ja) * | 2018-06-20 | 2022-08-17 | 日本電信電話株式会社 | 検知装置、検知方法および検知プログラム |
WO2020018892A1 (en) | 2018-07-19 | 2020-01-23 | Ctrl-Labs Corporation | Methods and apparatus for improved signal robustness for a wearable neuromuscular recording device |
CN112740631A (zh) * | 2018-07-20 | 2021-04-30 | 诺基亚技术有限公司 | 通过接收算法中的参数的更新来在通信系统中学习 |
WO2020023650A1 (en) * | 2018-07-25 | 2020-01-30 | Wuxi Nextcode Genomics Usa, Inc. | Retrosynthesis prediction using deep highway networks and multiscale reaction classification |
JP6559850B1 (ja) | 2018-07-27 | 2019-08-14 | Karydo TherapeutiX株式会社 | ヒトにおける被験物質の作用を予測するための人工知能モデル |
CN112566553A (zh) | 2018-08-13 | 2021-03-26 | 脸谱科技有限责任公司 | 实时尖峰检测和识别 |
US11461693B2 (en) | 2018-08-20 | 2022-10-04 | United Microelectronics Corp. | Training apparatus and training method for providing sample size expanding model |
US11893498B2 (en) | 2018-09-18 | 2024-02-06 | Insilico Medicine Ip Limited | Subset conditioning using variational autoencoder with a learnable tensor train induced prior |
US11593660B2 (en) * | 2018-09-18 | 2023-02-28 | Insilico Medicine Ip Limited | Subset conditioning using variational autoencoder with a learnable tensor train induced prior |
CN112771478A (zh) | 2018-09-26 | 2021-05-07 | 脸谱科技有限责任公司 | 对环境中的物理对象的神经肌肉控制 |
WO2020068421A1 (en) * | 2018-09-28 | 2020-04-02 | Dow Global Technologies Llc | Hybrid machine learning model for code classification |
CN112822992A (zh) | 2018-10-05 | 2021-05-18 | 脸谱科技有限责任公司 | 在增强现实环境中使用神经肌肉信号来提供与物理对象的增强交互 |
JP7430406B2 (ja) * | 2018-10-23 | 2024-02-13 | ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー | 深層特徴抽出を用いた能動的転移学習のためのシステムおよび方法 |
CN111126554A (zh) * | 2018-10-31 | 2020-05-08 | 深圳市云网拜特科技有限公司 | 一种基于生成对抗网络的药物先导化合物筛选方法和系统 |
US11928610B2 (en) | 2018-11-19 | 2024-03-12 | Koninklijke Philips N.V. | Clinical case search and generation system and method based on a probabilistic encoder-generator framework |
CN113423341A (zh) | 2018-11-27 | 2021-09-21 | 脸谱科技有限责任公司 | 用于可穿戴电极传感器系统的自动校准的方法和装置 |
WO2020109074A1 (en) * | 2018-11-30 | 2020-06-04 | Asml Netherlands B.V. | Method for decreasing uncertainty in machine learning model predictions |
US10311334B1 (en) * | 2018-12-07 | 2019-06-04 | Capital One Services, Llc | Learning to process images depicting faces without leveraging sensitive attributes in deep learning models |
US11995854B2 (en) * | 2018-12-19 | 2024-05-28 | Nvidia Corporation | Mesh reconstruction using data-driven priors |
US20210217498A1 (en) * | 2018-12-24 | 2021-07-15 | Medirita | Data processing apparatus and method for predicting effectiveness and safety of new drug candidate substance |
WO2020138588A1 (ko) * | 2018-12-24 | 2020-07-02 | 주식회사 메디리타 | 신약 후보 물질 발굴을 위한 데이터 처리 장치 및 방법 |
CN109711483B (zh) * | 2019-01-08 | 2020-10-27 | 西安交通大学 | 一种基于Sparse Autoencoder的电力系统运行方式聚类方法 |
US20220130494A1 (en) * | 2019-02-11 | 2022-04-28 | Neal W. Woodbury | Systems, methods, and media for molecule design using machine learning mechanisms |
US10905383B2 (en) | 2019-02-28 | 2021-02-02 | Facebook Technologies, Llc | Methods and apparatus for unsupervised one-shot machine learning for classification of human gestures and estimation of applied forces |
JP7218624B2 (ja) * | 2019-03-08 | 2023-02-07 | 富士通株式会社 | データ処理プログラム及びデータ処理方法 |
JP7246979B2 (ja) * | 2019-03-18 | 2023-03-28 | 株式会社日立製作所 | 生物反応情報処理システムおよび生物反応情報処理方法 |
CN111798935B (zh) * | 2019-04-09 | 2024-07-05 | 南京药石科技股份有限公司 | 基于神经网络的普适性化合物结构-性质相关性预测方法 |
US20200327963A1 (en) * | 2019-04-11 | 2020-10-15 | Accenture Global Solutions Limited | Latent Space Exploration Using Linear-Spherical Interpolation Region Method |
US11777715B2 (en) | 2019-05-15 | 2023-10-03 | Amir Keyvan Khandani | Method and apparatus for generating shared secrets |
US11315038B2 (en) | 2019-05-16 | 2022-04-26 | International Business Machines Corporation | Method to measure similarity of datasets for given AI task |
CN110311743B (zh) * | 2019-06-05 | 2021-06-22 | 宁波大学 | 一种变分推断估计主用户占空比的方法 |
US10515715B1 (en) | 2019-06-25 | 2019-12-24 | Colgate-Palmolive Company | Systems and methods for evaluating compositions |
CN110580937B (zh) * | 2019-08-21 | 2023-11-21 | 上海云贵信息科技有限公司 | 基于结构及药代动力学性质的物质成药性评价方法和装置 |
US20210057050A1 (en) * | 2019-08-23 | 2021-02-25 | Insilico Medicine Ip Limited | Workflow for generating compounds with biological activity against a specific biological target |
JPWO2021038362A1 (ja) * | 2019-08-29 | 2021-03-04 | ||
JP7353874B2 (ja) | 2019-09-03 | 2023-10-02 | 株式会社日立製作所 | 材料特性予測装置および材料特性予測方法 |
US11586982B2 (en) | 2019-09-18 | 2023-02-21 | Samsung Electronics Co., Ltd. | Electronic and atomic structure computation utilizing machine learning |
JP7267883B2 (ja) * | 2019-09-18 | 2023-05-02 | 株式会社日立製作所 | 材料特性予測システムおよび材料特性予測方法 |
EP3798918A1 (en) * | 2019-09-26 | 2021-03-31 | Naver Corporation | Using semi-supervised variational autoencoder for wi-fi-based indoor localization |
JP7392366B2 (ja) * | 2019-10-01 | 2023-12-06 | 富士通株式会社 | 最適解獲得プログラム、最適解獲得方法および情報処理装置 |
KR20210039598A (ko) * | 2019-10-02 | 2021-04-12 | 삼성전자주식회사 | 응답 추론 방법 및 장치 |
US11537898B2 (en) | 2019-10-02 | 2022-12-27 | Samsung Electronics Co., Ltd. | Generative structure-property inverse computational co-design of materials |
US11854672B2 (en) * | 2019-10-10 | 2023-12-26 | Samsung Electronics Co., Ltd. | Method and apparatus for generating chemical structure |
US11481626B2 (en) * | 2019-10-15 | 2022-10-25 | International Business Machines Corporation | Generating attribute-based samples |
CA3158327A1 (en) * | 2019-10-17 | 2021-04-22 | Karydo Therapeutix, Inc. | Artificial intelligence model for predicting indications for test substances in humans |
US12008478B2 (en) | 2019-10-18 | 2024-06-11 | Unlearn.AI, Inc. | Systems and methods for training generative models using summary statistics and other constraints |
DE102019216927A1 (de) * | 2019-11-04 | 2021-05-06 | Robert Bosch Gmbh | Synthetische Erzeugung von Radar-, LIDAR- und Ultraschallmessdaten |
US11507840B2 (en) * | 2019-11-13 | 2022-11-22 | International Business Machines Corporation | Region constrained regularized adversarial examples for model interpretability |
US11443236B2 (en) | 2019-11-22 | 2022-09-13 | International Business Machines Corporation | Enhancing fairness in transfer learning for machine learning models with missing protected attributes in source or target domains |
CN112949344B (zh) * | 2019-11-26 | 2023-03-31 | 四川大学 | 一种用于异常检测的特征自回归方法 |
CN110970099B (zh) * | 2019-12-10 | 2023-04-28 | 北京大学 | 一种基于正则化变分自动编码器的药物分子生成方法 |
US11664094B2 (en) * | 2019-12-26 | 2023-05-30 | Industrial Technology Research Institute | Drug-screening system and drug-screening method |
CN113053470A (zh) * | 2019-12-26 | 2021-06-29 | 财团法人工业技术研究院 | 药物筛选系统与药物筛选方法 |
US20210217484A1 (en) * | 2020-01-10 | 2021-07-15 | Modernatx, Inc. | Variational autoencoder for biological sequence generation |
CN115362506A (zh) * | 2020-01-14 | 2022-11-18 | 旗舰先锋创新Vi有限责任公司 | 分子设计 |
US11436427B2 (en) * | 2020-03-02 | 2022-09-06 | Lawrence Livermore National Security, Llc | Generative attribute optimization |
US11587679B2 (en) * | 2020-03-26 | 2023-02-21 | International Business Machines Corporation | Generating computer models from implicitly relevant feature sets |
US11615317B2 (en) | 2020-04-10 | 2023-03-28 | Samsung Electronics Co., Ltd. | Method and apparatus for learning stochastic inference models between multiple random variables with unpaired data |
US11174289B1 (en) | 2020-05-21 | 2021-11-16 | International Business Machines Corporation | Artificial intelligence designed antimicrobial peptides |
CN112116963A (zh) * | 2020-09-24 | 2020-12-22 | 深圳智药信息科技有限公司 | 自动药物设计方法、系统、计算设备及计算机可读存储介质 |
US11127488B1 (en) | 2020-09-25 | 2021-09-21 | Accenture Global Solutions Limited | Machine learning systems for automated pharmaceutical molecule screening and scoring |
US20220138537A1 (en) * | 2020-11-02 | 2022-05-05 | International Business Machines Corporation | Probabilistic nonlinear relationships cross-multi time series and external factors for improved multivariate time series modeling and forecasting |
CN112270951B (zh) * | 2020-11-10 | 2022-11-01 | 四川大学 | 基于多任务胶囊自编码器神经网络的全新分子生成方法 |
US20220165359A1 (en) * | 2020-11-23 | 2022-05-26 | Peptilogics, Inc. | Generating anti-infective design spaces for selecting drug candidates |
CN112582032B (zh) * | 2020-11-27 | 2024-05-17 | 北京科技大学 | 基于机器学习模型设计高热稳定性铁基软磁非晶合金 |
US20220189578A1 (en) * | 2020-12-14 | 2022-06-16 | International Business Machines Corporation | Interpretable molecular generative models |
CN114627981A (zh) * | 2020-12-14 | 2022-06-14 | 阿里巴巴集团控股有限公司 | 化合物分子结构的生成方法及装置、非易失性存储介质 |
US11610139B2 (en) | 2020-12-16 | 2023-03-21 | Ro5 Inc. | System and method for the latent space optimization of generative machine learning models |
US20220222520A1 (en) * | 2021-01-13 | 2022-07-14 | International Business Machines Corporation | Supervised vae for optimization of value function and generation of desired data |
JPWO2022201256A1 (ja) * | 2021-03-22 | 2022-09-29 | ||
US11868531B1 (en) | 2021-04-08 | 2024-01-09 | Meta Platforms Technologies, Llc | Wearable device providing for thumb-to-finger-based input gestures detected based on neuromuscular signals, and systems and methods of use thereof |
CN113223637B (zh) * | 2021-05-07 | 2023-07-25 | 中国科学院自动化研究所 | 基于领域知识和深度强化学习的药物分子生成器训练方法 |
CN113327651A (zh) * | 2021-05-31 | 2021-08-31 | 东南大学 | 一种基于变分自编码器和消息传递神经网络的分子图生成方法 |
WO2023008160A1 (ja) | 2021-07-26 | 2023-02-02 | 株式会社ブリヂストン | 推定装置、推定方法、推定プログラム、及びロボットシステム |
WO2023034051A1 (en) * | 2021-09-01 | 2023-03-09 | Carnegie Mellon University | System and method for material modelling and design using differentiable models |
JP7275216B2 (ja) * | 2021-09-03 | 2023-05-17 | 株式会社サイバーエージェント | 広告制作支援プログラム、広告制作支援装置及び広告制作支援方法 |
TWI789042B (zh) * | 2021-10-01 | 2023-01-01 | 瑞昱半導體股份有限公司 | 具有平均量化機制的神經網路建構方法及裝置 |
WO2023165506A1 (en) * | 2022-03-01 | 2023-09-07 | Insilico Medicine Ip Limited | Structure-based deep generative model for binding site descriptors extraction and de novo molecular generation |
GB2621108A (en) | 2022-07-08 | 2024-02-07 | Topia Life Sciences Ltd | An automated system for generating novel molecules |
US12020789B1 (en) | 2023-02-17 | 2024-06-25 | Unlearn.AI, Inc. | Systems and methods enabling baseline prediction correction |
US11966850B1 (en) | 2023-02-22 | 2024-04-23 | Unlearn.AI, Inc. | Systems and methods for training predictive models that ignore missing features |
US11972333B1 (en) * | 2023-06-28 | 2024-04-30 | Intuit Inc. | Supervisory systems for generative artificial intelligence models |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130173503A1 (en) | 2010-08-25 | 2013-07-04 | Matthew Segall | Compound selection in drug discovery |
WO2014034577A1 (ja) | 2012-08-27 | 2014-03-06 | 株式会社京都コンステラ・テクノロジーズ | 化合物設計装置、化合物設計方法、及びコンピュータプログラム |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5425128A (en) * | 1992-05-29 | 1995-06-13 | Sunquest Information Systems, Inc. | Automatic management system for speech recognition processes |
US5463564A (en) | 1994-09-16 | 1995-10-31 | 3-Dimensional Pharmaceuticals, Inc. | System and method of automatically generating chemical compounds with desired properties |
US8704832B2 (en) | 2008-09-20 | 2014-04-22 | Mixamo, Inc. | Interactive design, synthesis and delivery of 3D character motion data through the web |
EP2593844A4 (en) | 2010-07-16 | 2017-05-31 | The Trustees of Columbia University in the City of New York | Machine learning for power grids |
US8924314B2 (en) | 2010-09-28 | 2014-12-30 | Ebay Inc. | Search result ranking using machine learning |
US9088601B2 (en) | 2010-12-01 | 2015-07-21 | Cisco Technology, Inc. | Method and apparatus for detecting malicious software through contextual convictions, generic signatures and machine learning techniques |
US9916538B2 (en) | 2012-09-15 | 2018-03-13 | Z Advanced Computing, Inc. | Method and system for feature detection |
US8311973B1 (en) | 2011-09-24 | 2012-11-13 | Zadeh Lotfi A | Methods and systems for applications for Z-numbers |
US8484022B1 (en) * | 2012-07-27 | 2013-07-09 | Google Inc. | Adaptive auto-encoders |
US20140046879A1 (en) | 2012-08-13 | 2014-02-13 | Predixion Software, Inc. | Machine learning semantic model |
US20140278130A1 (en) * | 2013-03-14 | 2014-09-18 | William Michael Bowles | Method of predicting toxicity for chemical compounds |
US20140310218A1 (en) | 2013-04-11 | 2014-10-16 | Nec Laboratories America, Inc. | High-Order Semi-RBMs and Deep Gated Neural Networks for Feature Interaction Identification and Non-Linear Semantic Indexing |
US10318881B2 (en) * | 2013-06-28 | 2019-06-11 | D-Wave Systems Inc. | Systems and methods for quantum processing of data |
WO2015017798A2 (en) * | 2013-08-02 | 2015-02-05 | CRIXlabs, Inc. | Method and system for predicting spatial and temporal distributions of therapeutic substance carriers |
AU2015413368B2 (en) * | 2015-10-30 | 2021-09-09 | Halliburton Energy Services, Inc. | Producing chemical formulations with cognitive computing |
KR102457974B1 (ko) | 2015-11-04 | 2022-10-21 | 삼성전자주식회사 | 신규 물질 탐색 방법 및 장치 |
-
2016
- 2016-02-03 US US15/015,044 patent/US10776712B2/en active Active
- 2016-12-02 WO PCT/JP2016/085955 patent/WO2017094899A1/en active Application Filing
- 2016-12-02 JP JP2018528803A patent/JP6866375B2/ja active Active
-
2020
- 2020-08-24 US US17/000,746 patent/US11900225B2/en active Active
-
2021
- 2021-04-07 JP JP2021065411A patent/JP7247258B2/ja active Active
-
2023
- 2023-03-15 JP JP2023040192A patent/JP2023082017A/ja active Pending
- 2023-12-22 US US18/394,019 patent/US20240144092A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130173503A1 (en) | 2010-08-25 | 2013-07-04 | Matthew Segall | Compound selection in drug discovery |
WO2014034577A1 (ja) | 2012-08-27 | 2014-03-06 | 株式会社京都コンステラ・テクノロジーズ | 化合物設計装置、化合物設計方法、及びコンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2023082017A (ja) | 2023-06-13 |
JP6866375B2 (ja) | 2021-04-28 |
US11900225B2 (en) | 2024-02-13 |
WO2017094899A1 (en) | 2017-06-08 |
JP2019502988A (ja) | 2019-01-31 |
JP2021121927A (ja) | 2021-08-26 |
US20170161635A1 (en) | 2017-06-08 |
US10776712B2 (en) | 2020-09-15 |
US20240144092A1 (en) | 2024-05-02 |
US20200387831A1 (en) | 2020-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7247258B2 (ja) | コンピュータシステム、方法及びプログラム | |
EP3467723B1 (en) | Machine learning based network model construction method and apparatus | |
EP3853776A1 (en) | Subset conditioning using variational autoencoder with a learnable tensor train induced prior | |
US20200342953A1 (en) | Target molecule-ligand binding mode prediction combining deep learning-based informatics with molecular docking | |
WO2017151757A1 (en) | Recurrent neural feedback model for automated image annotation | |
Xie et al. | Generative VoxelNet: Learning energy-based models for 3D shape synthesis and analysis | |
CN113707235A (zh) | 基于自监督学习的药物小分子性质预测方法、装置及设备 | |
CN112639831A (zh) | 互信息对抗自动编码器 | |
WO2017151759A1 (en) | Category discovery and image auto-annotation via looped pseudo-task optimization | |
KR102362678B1 (ko) | 생체신호 분석 방법 | |
US11893498B2 (en) | Subset conditioning using variational autoencoder with a learnable tensor train induced prior | |
US20230290114A1 (en) | System and method for pharmacophore-conditioned generation of molecules | |
KR20230094955A (ko) | 문서 데이터 검색 기법 | |
Bhardwaj et al. | Computational biology in the lens of CNN | |
US20220198286A1 (en) | System and method for molecular reconstruction from molecular probability distributions | |
Ding et al. | Dance: A deep learning library and benchmark for single-cell analysis | |
JP7427011B2 (ja) | センサ入力信号からのコグニティブ・クエリへの応答 | |
Altares-López et al. | AutoQML: Automatic generation and training of robust quantum-inspired classifiers by using evolutionary algorithms on grayscale images | |
US20230253076A1 (en) | Local steps in latent space and descriptors-based molecules filtering for conditional molecular generation | |
Karim | Java Deep Learning Projects: Implement 10 real-world deep learning applications using Deeplearning4j and open source APIs | |
Rajasekhar et al. | A novel speech emotion recognition model using mean update of particle swarm and whale optimization-based deep belief network | |
Xu et al. | Cross-media retrieval based on pseudo-label learning and semantic consistency algorithm | |
Zagagy et al. | ACKEM: automatic classification, using KNN based ensemble modeling | |
Kawale | Machine Learning Tool Development And Use In Biological Information Decoding | |
KR102556235B1 (ko) | 컨텐츠 기반 영상 검색 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210415 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220309 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220426 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220624 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221018 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221121 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230214 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230315 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7247258 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |