JP2022535769A - メソスケールペプチドを操作するための機械学習ベースの装置およびそのための方法およびシステム - Google Patents
メソスケールペプチドを操作するための機械学習ベースの装置およびそのための方法およびシステム Download PDFInfo
- Publication number
- JP2022535769A JP2022535769A JP2021571033A JP2021571033A JP2022535769A JP 2022535769 A JP2022535769 A JP 2022535769A JP 2021571033 A JP2021571033 A JP 2021571033A JP 2021571033 A JP2021571033 A JP 2021571033A JP 2022535769 A JP2022535769 A JP 2022535769A
- Authority
- JP
- Japan
- Prior art keywords
- blueprint
- records
- machine learning
- learning model
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 202
- 238000010801 machine learning Methods 0.000 title claims abstract description 201
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 173
- 238000000034 method Methods 0.000 title claims abstract description 124
- 229920001184 polypeptide Polymers 0.000 claims abstract description 160
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 97
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 97
- 238000012549 training Methods 0.000 claims abstract description 39
- 210000004896 polypeptide structure Anatomy 0.000 claims abstract description 13
- 238000002372 labelling Methods 0.000 claims abstract description 3
- 238000013461 design Methods 0.000 claims description 101
- 238000000329 molecular dynamics simulation Methods 0.000 claims description 78
- 238000013528 artificial neural network Methods 0.000 claims description 26
- 150000001413 amino acids Chemical class 0.000 claims description 21
- 238000013527 convolutional neural network Methods 0.000 claims description 16
- 238000003066 decision tree Methods 0.000 claims description 16
- 238000004088 simulation Methods 0.000 claims description 16
- 238000012706 support-vector machine Methods 0.000 claims description 16
- 230000001939 inductive effect Effects 0.000 claims description 12
- 238000001914 filtration Methods 0.000 claims description 11
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 230000003068 static effect Effects 0.000 claims description 10
- 238000005094 computer simulation Methods 0.000 claims description 8
- 238000007637 random forest analysis Methods 0.000 claims description 8
- 230000000306 recurrent effect Effects 0.000 claims description 8
- 230000004044 response Effects 0.000 claims description 8
- 230000008827 biological function Effects 0.000 claims description 6
- 230000008512 biological response Effects 0.000 claims description 6
- 238000000342 Monte Carlo simulation Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 21
- 238000002360 preparation method Methods 0.000 description 21
- 238000004891 communication Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 17
- 230000008569 process Effects 0.000 description 11
- 239000013598 vector Substances 0.000 description 11
- 238000012545 processing Methods 0.000 description 10
- 230000012846 protein folding Effects 0.000 description 7
- 230000008901 benefit Effects 0.000 description 5
- 238000005457 optimization Methods 0.000 description 5
- 125000000539 amino acid group Chemical group 0.000 description 4
- 238000010438 heat treatment Methods 0.000 description 4
- 239000000427 antigen Substances 0.000 description 3
- 102000036639 antigens Human genes 0.000 description 3
- 108091007433 antigens Proteins 0.000 description 3
- 230000003278 mimic effect Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000011960 computer-aided design Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 238000011067 equilibration Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 238000013077 scoring method Methods 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 101710167800 Capsid assembly scaffolding protein Proteins 0.000 description 1
- 238000003775 Density Functional Theory Methods 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 1
- 102000007474 Multiprotein Complexes Human genes 0.000 description 1
- 108010085220 Multiprotein Complexes Proteins 0.000 description 1
- 101710130420 Probable capsid assembly scaffolding protein Proteins 0.000 description 1
- 101710204410 Scaffold protein Proteins 0.000 description 1
- 101800001690 Transmembrane protein gp41 Proteins 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 238000013406 biomanufacturing process Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000002050 diffraction method Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000001493 electron microscopy Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 238000013515 script Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 238000002255 vaccination Methods 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/001—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof by chemical synthesis
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6845—Methods of identifying protein-protein interactions in protein mixtures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/20—Protein or domain folding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
- G16B5/30—Dynamic-time models
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K1/00—General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
- C07K1/10—General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length using coupling agents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Molecular Biology (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Organic Chemistry (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medicinal Chemistry (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Evolutionary Biology (AREA)
- Immunology (AREA)
- Urology & Nephrology (AREA)
- Hematology (AREA)
- Computational Linguistics (AREA)
- Genetics & Genomics (AREA)
- Gastroenterology & Hepatology (AREA)
- Physiology (AREA)
- Analytical Chemistry (AREA)
- Cell Biology (AREA)
- Microbiology (AREA)
- Pathology (AREA)
Abstract
Description
training_energies=Rosetta(training_scaffolds)##ロゼッタエネルギーは、足場の初期訓練セットに対して計算される
training_energiesが収束していない間:##ロゼッタエネルギーが改善を停止するまで繰り返される
training_scaffoldsからtraining_energiesを予測するためにxgboostを訓練する##足場の訓練セットからロゼッタのエネルギーを予測するようにXGBoostを訓練する
predicted_scaffolds=xgboostから上位の予測された足場##XGBoostで最適な足場を予測する
new_energies=Rosetta(predicted_scaffolds)##ロゼッタエネルギーは、予測足場に対して計算される
predicted_scaffoldsをtraining_scaffoldsに追加する##予測された足場を訓練セットに追加する
new_energiesをtraining_energiesに追加する##予測された足場エネルギーを訓練セットに追加する
実施形態I-1.方法であって、
第1の複数のブループリント記録、またはそれらの表現、および第1の複数のスコアに基づいて、機械学習モデルを訓練することであって、第1の複数のブループリント記録からの各ブループリント記録が、第1の複数のスコアからの各スコアに関連付けられている、訓練することと、
訓練後に、機械学習モデルを実行して、少なくとも1つの所望のスコアを有する第2の複数のブループリント記録を生成することと、を含み、
第2の複数のブループリント記録が、計算タンパク質モデリングで入力として受信されて、第2の複数のブループリント記録に基づいて、操作されたポリペプチドを生成するように構成されている、方法。
参照標的に対する参照標的構造の表現を受信することと、
参照標的構造の所定の部分から第1の複数のブループリント記録を生成することであって、第1の複数のブループリント記録からの各ブループリント記録が、標的残基位置および足場残基位置を含み、各標的残基位置が、複数の標的残基からの1つの標的残基に対応する、生成することと、を含む、実施形態I-1に記載の方法。
第1の複数のブループリント記録からの各ブループリント記録について、
そのブループリント記録上で計算タンパク質モデリングを実施して、ポリペプチド構造を生成することと、
ポリペプチド構造のスコアを計算することと、
スコアをそのブループリント記録と関連付けることと、によって、第1の複数のブループリント記録にラベルを付けることを含む、実施形態I-1~I-4のいずれか1つに記載の方法。
第2の複数のブループリント記録に対する第2の複数のスコアを計算することによって、機械学習モデルを再訓練するかどうかを決定することと、
決定することに応答して、(1)第2の複数のブループリント記録を含む再訓練ブループリント記録、および(2)第2の複数のスコアを含む再訓練スコアに基づいて、機械学習モデルを再訓練することと、を含む、実施形態I-1~I-7のいずれか1つに記載の方法。
機械学習モデルを再訓練することの後に、第1の複数のブループリント記録および第2の複数のブループリント記録を連結して、再訓練ブループリント記録を生成し、再訓練スコアを生成することを含み、再訓練ブループリント記録からの各ブループリント記録が、再訓練スコアからのスコアに関連付けられている、実施形態I-8に記載の方法。
第1の複数のブループリント記録、またはそれらの表現、および第1の複数のスコアに基づいて、機械学習モデルを訓練することであって、第1の複数のブループリント記録からの各ブループリント記録が、第1の複数のスコアからの各スコアに関連付けられている、訓練することと、
訓練の後、機械学習モデルを実行して、少なくとも1つの所望のスコアを有する第2の複数のブループリント記録を生成することと、を行わせるコードを含み、
第2の複数のブループリント記録が、計算タンパク質モデリングで入力として受信されて、第2の複数のブループリント記録に基づいて、操作されたポリペプチドを生成するように構成されている、非一時的プロセッサ可読媒体。
参照標的構造の表現を受信することと、
参照標的構造の所定の部分から第1の複数のブループリント記録を生成することであって、第1の複数のブループリント記録からの各ブループリント記録が、標的残基位置および足場残基位置を含み、複数の標的残基位置からの各標的残基位置が、複数の標的残基からの1つの標的残基に対応する、生成することと、を行わせる、コードを含む、実施形態I-22に記載の媒体。
各ブループリント記録上で計算タンパク質モデリングを実施して、ポリペプチド構造を生成することと、ポリペプチド構造のスコアを計算することと、スコアをブループリント記録と関連付けることと、によって、第1の複数のブループリント記録にラベルを付けさせるコードを含む、実施形態I-23~I-25のいずれか1つに記載の媒体。
第2の複数のブループリント記録に対する第2の複数のスコアを計算することによって、機械学習モデルを再訓練するかどうかを決定することと、
決定することに応答して、(1)第2の複数のブループリント記録を含む再訓練ブループリント記録、および(2)第2の複数のスコアを含む再訓練スコアに基づいて、機械学習モデルを再訓練することと、を行わせるコードを含む、実施形態I-22~I-28のいずれか1つに記載の媒体。
機械学習モデルを再訓練することの後に、第1の複数のブループリント記録および第2の複数のブループリント記録を連結して、再訓練ブループリント記録を生成させ、再訓練スコアを生成させるコードを含み、再訓練ブループリント記録からの各ブループリント記録が、再訓練スコアからのスコアに関連付けられている、実施形態I-29に記載の媒体。
第2の複数のブループリント記録上で計算タンパク質モデリングを実施して、操作されたポリペプチドを生成させるコードを含む、実施形態I-22~I-37のいずれか1つに記載の媒体。
参照標的構造の表現に対する静的構造の比較によって、操作されたポリペプチドをフィルタリングさせるコードを含む、実施形態I-38に記載の媒体。
参照標的構造および操作されたポリペプチドの各々の表現の分子動力学(MD)シミュレーションを使用する参照標的構造の表現に対する動的構造の比較によって、操作されたポリペプチドをフィルタリングさせるコードを含む、実施形態I-38またはI-39に記載の媒体。
プロセッサと、
メモリと、を有する、第1のコンピューティングデバイスを備え、
メモリは、
第1のコンピューティングデバイスから遠隔の第2のコンピューティングデバイスから、参照標的構造を受信することと、
参照標的構造の所定の部分から第1の複数のブループリント記録を生成することであって、第1の複数のブループリント記録からの各ブループリント記録が、標的残基位置および足場残基位置を含み、各標的残基位置が、複数の標的残基からの1つの標的残基に対応する、生成することと、
第1の複数のブループリント記録、またはそれらの表現、および第1の複数のスコアに基づいて、機械学習モデルを訓練することであって、第1の複数のブループリント記録からの各ブループリント記録が、第1の複数のスコアからの各スコアに関連付けられている、訓練することと、
訓練の後、機械学習モデルを実行して、少なくとも1つの所望のスコアを有する第2の複数のブループリント記録を生成することと、を行うためにプロセッサによって実行可能な命令を記憶しており、
第2の複数のブループリント記録が、計算タンパク質モデリングで入力として受信されて、第2の複数のブループリント記録に基づいて、操作されたポリペプチドを生成するように構成されている、装置。
第2の複数のブループリント記録に対する第2の複数のスコアを計算することによって、機械学習モデルを再訓練するかどうかを決定することと、
決定することに応答して、(1)第2の複数のブループリント記録を含む再訓練ブループリント記録、および(2)第2の複数のスコアを含む再訓練スコアに基づいて、機械学習モデルを再訓練することと、を行わせるコードを含む、実施形態I-43に記載の装置。
第2の複数のブループリント記録上で計算タンパク質モデリングを実施して、操作されたポリペプチドを生成させるコードを含む、実施形態I-43~I-51のいずれか1つに記載の装置。
参照標的構造の表現に対する静的構造の比較によって、操作されたポリペプチドをフィルタリングさせるコードを含む、実施形態I-52に記載の装置。
参照標的構造および操作されたポリペプチドの各々の表現の分子動力学(MD)シミュレーションを使用する参照標的構造の表現に対する動的構造の比較によって、操作されたポリペプチドをフィルタリングさせるコードを含む、実施形態I-52または実施形態I-53に記載の装置。
空間的に関連するトポロジカル制約の組み合わせを含み、制約のうちの1つ以上が、参照標的由来の制約であり、
操作されたペプチドのアミノ酸の10%~98%が、1つ以上の参照標的由来の制約を満たし、
1つ以上の参照標的由来の制約を満たすアミノ酸が、参照標的と8.0Å未満の骨格平均二乗偏差(RSMD)構造相同性を有する、操作されたペプチド。
生物学的応答または生物学的機能に関連する操作されたペプチド中の1つ以上の原子の原子変動が、生物学的応答または生物学的機能に関連する参照標的中の1つ以上の原子の原子変動と重複する、実施形態I-57~I-61のいずれか一項に記載の操作されたペプチド。
参照標的の1つ以上のトポロジカル特性を特定することと、
参照標的由来の空間的に関連するトポロジカル制約の組み合わせを生成するように、各トポロジカル特性に対して空間的に関連する制約を設計することと、
候補ペプチドの空間的に関連するトポロジカル特性を、参照標的由来の空間的に関連するトポロジカル制約の組み合わせと比較することと、
参照標的由来の空間的に関連するトポロジカル制約の組み合わせと重複する、空間的に関連するトポロジカル特性を有する候補ペプチドを選択して、操作されたペプチドを生成することと、を含む、方法。
Claims (71)
- 方法であって、
第1の複数のブループリント記録、またはそれらの表現、および第1の複数のスコアに基づいて、機械学習モデルを訓練することであって、前記第1の複数のブループリント記録からの各ブループリント記録が、前記第1の複数のスコアからの各スコアに関連付けられている、訓練することと、
前記訓練後に、前記機械学習モデルを実行して、少なくとも1つの所望のスコアを有する第2の複数のブループリント記録を生成することと、を含み、
前記第2の複数のブループリント記録が、計算タンパク質モデリングで入力として受信されて、前記第2の複数のブループリント記録に基づいて、操作されたポリペプチドを生成するように構成されている、方法。 - 参照標的に対する参照標的構造の表現を受信することと、
前記参照標的構造の所定の部分から前記第1の複数のブループリント記録を生成することであって、前記第1の複数のブループリント記録からの各ブループリント記録が、標的残基位置および足場残基位置を含み、各標的残基位置が、複数の標的残基からの1つの標的残基に対応する、生成することと、を含む、請求項1に記載の方法。 - 少なくとも1つのブループリント記録において、前記標的残基位置が、非連続的である、請求項2に記載の方法。
- 少なくとも1つのブループリント記録において、前記標的残基位置が、参照標的配列中の前記標的残基位置の順序とは異なる順序にある、請求項2に記載の方法。
- 前記第1の複数のブループリント記録からの各ブループリント記録について、
そのブループリント記録上で計算タンパク質モデリングを実施して、ポリペプチド構造を生成することと、
前記ポリペプチド構造のスコアを計算することと、
前記スコアをそのブループリント記録と関連付けることと、によって、前記第1の複数のブループリント記録にラベルを付けることを含む、請求項2に記載の方法。 - 前記計算タンパク質モデリングが、前記参照標的構造とテンプレートを一致させることなく、デノボ設計に基づく、請求項5に記載の方法。
- 前記第1の複数のスコアからの各スコアが、エネルギー項と、前記参照標的構造の前記表現から抽出された1つ以上の構造制約を使用して決定される、構造制約一致項と、を含む、請求項5に記載の方法。
- 前記第2の複数のブループリント記録に対する第2の複数のスコアを計算することによって、前記機械学習モデルを再訓練するかどうかを決定することと、
前記決定することに応答して、(1)前記第2の複数のブループリント記録を含む再訓練ブループリント記録、および(2)前記第2の複数のスコアを含む再訓練スコアに基づいて、前記機械学習モデルを再訓練することと、を含む、請求項1に記載の方法。 - 前記機械学習モデルを前記再訓練することの後に、前記第1の複数のブループリント記録および前記第2の複数のブループリント記録を連結して、前記再訓練ブループリント記録を生成し、前記再訓練スコアを生成することを含み、前記再訓練ブループリント記録からの各ブループリント記録が、前記再訓練スコアからのスコアに関連付けられている、請求項8に記載の方法。
- 前記少なくとも1つの所望のスコアが、プリセット値である、請求項1に記載の方法。
- 前記少なくとも1つの所望のスコアが、動的に決定される、請求項1に記載の方法。
- 前記機械学習モデルが、教師あり機械学習モデルである、請求項1に記載の方法。
- 前記教師あり機械学習モデルが、決定木のアンサンブル、ブーストされた決定木アルゴリズム、eXtreme勾配ブースティング(XGBoost)モデル、またはランダムフォレストを含む、請求項12に記載の方法。
- 前記教師あり機械学習モデルが、サポートベクトルマシン(SVM)、フィードフォワード機械学習モデル、再帰型ニューラルネットワーク(RNN)、畳み込みニューラルネットワーク(CNN)、グラフニューラルネットワーク(GNN)、またはトランスフォーマーニューラルネットワークを含む、請求項12に記載の方法。
- 前記機械学習モデルが、帰納的機械学習モデルである、請求項1に記載の方法。
- 前記機械学習モデルが、生成機械学習モデルである、請求項1に記載の方法。
- 前記第2の複数のブループリント記録上で計算タンパク質モデリングを実施して、前記操作されたポリペプチドを生成することを含む、請求項1に記載の方法。
- 参照標的構造の前記表現に対する静的構造の比較によって、前記操作されたポリペプチドをフィルタリングすることを含む、請求項17に記載の方法。
- 参照標的構造および操作されたポリペプチドの各構造の前記表現の分子動力学(MD)シミュレーションを使用する前記参照標的構造の前記表現に対する動的構造の比較によって、前記操作されたポリペプチドをフィルタリングすることを含む、請求項17に記載の方法。
- 前記MDシミュレーションが、対称型マルチプロセシング(SMP)を使用して並列して実施される、請求項19に記載の方法。
- 前記第2の複数のブループリント記録中のブループリント記録の数が、前記第1の複数のブループリント記録中のブループリント記録の数よりも少ない、請求項1に記載の方法。
- プロセッサによって実行される命令を表すコードを記憶する非一時的プロセッサ可読媒体であって、前記コードが、前記プロセッサに、
第1の複数のブループリント記録、またはそれらの表現、および第1の複数のスコアに基づいて、機械学習モデルを訓練することであって、前記第1の複数のブループリント記録からの各ブループリント記録が、前記第1の複数のスコアからの各スコアに関連付けられている、訓練することと、
前記訓練の後、前記機械学習モデルを実行して、少なくとも1つの所望のスコアを有する第2の複数のブループリント記録を生成することと、を行わせるコードを含み、
前記第2の複数のブループリント記録が、計算タンパク質モデリングで入力として受信されて、前記第2の複数のブループリント記録に基づいて、操作されたポリペプチドを生成するように構成されている、非一時的プロセッサ可読媒体。 - 前記プロセッサに、
参照標的構造の表現を受信することと、
前記参照標的構造の所定の部分から前記第1の複数のブループリント記録を生成することであって、前記第1の複数のブループリント記録からの各ブループリント記録が、標的残基位置および足場残基位置を含み、複数の標的残基位置からの各標的残基位置が、前記複数の標的残基からの1つの標的残基に対応する、生成することと、を行わせる、コードを含む、請求項22に記載の媒体。 - 少なくとも1つのブループリント記録において、前記標的残基位置が、非連続的である、請求項23に記載の媒体。
- 少なくとも1つのブループリント記録において、前記標的残基位置が、参照標的配列中の前記標的残基位置の順序とは異なる順序にある、請求項23に記載の媒体。
- 前記プロセッサに、
各ブループリント記録上で計算タンパク質モデリングを実施して、ポリペプチド構造を生成することと、前記ポリペプチド構造のスコアを計算することと、前記スコアを前記ブループリント記録と関連付けることと、によって、前記第1の複数のブループリント記録にラベルを付けさせるコードを含む、請求項23に記載の媒体。 - 前記計算タンパク質モデリングが、前記参照標的構造とテンプレートを一致させることなく、デノボ設計に基づく、請求項26に記載の媒体。
- 各スコアが、エネルギー項と、前記参照標的構造の前記表現から抽出された1つ以上の構造制約を使用して決定される、構造制約一致項と、を含む、請求項26に記載の媒体。
- 前記プロセッサに、
前記第2の複数のブループリント記録に対する第2の複数のスコアを計算することによって、前記機械学習モデルを再訓練するかどうかを決定することと、
前記決定することに応答して、(1)前記第2の複数のブループリント記録を含む再訓練ブループリント記録、および(2)前記第2の複数のスコアを含む再訓練スコアに基づいて、前記機械学習モデルを再訓練することと、を行わせるコードを含む、請求項22に記載の媒体。 - 前記プロセッサに、
前記機械学習モデルを前記再訓練することの後に、前記第1の複数のブループリント記録および前記第2の複数のブループリント記録を連結して、前記再訓練ブループリント記録を生成させ、前記再訓練スコアを生成させるコードを含み、前記再訓練ブループリント記録からの各ブループリント記録が、前記再訓練スコアからのスコアに関連付けられている、請求項29に記載の媒体。 - 前記少なくとも1つの所望のスコアが、プリセット値である、請求項22に記載の媒体。
- 前記少なくとも1つの所望のスコアが、動的に決定される、請求項22に記載の媒体。
- 前記機械学習モデルが、教師あり機械学習モデルである、請求項22に記載の媒体。
- 前記教師あり機械学習モデルが、決定木のアンサンブル、ブーストされた決定木アルゴリズム、eXtreme勾配ブースティング(XGBoost)モデル、またはランダムフォレストを含む、請求項33に記載の媒体。
- 前記教師あり機械学習モデルが、サポートベクトルマシン(SVM)、フィードフォワード機械学習モデル、再帰型ニューラルネットワーク(RNN)、畳み込みニューラルネットワーク(CNN)、グラフニューラルネットワーク(GNN)、またはトランスフォーマーニューラルネットワークを含む、請求項33に記載の媒体。
- 前記機械学習モデルが、帰納的機械学習モデルである、請求項22に記載の媒体。
- 前記機械学習モデルが、生成機械学習モデルである、請求項22に記載の媒体。
- 前記プロセッサに、
前記第2の複数のブループリント記録上で計算タンパク質モデリングを実施して、操作されたポリペプチドを生成させるコードを含む、請求項22に記載の媒体。 - 前記プロセッサに、
参照標的構造の前記表現に対する静的構造の比較によって、前記操作されたポリペプチドをフィルタリングさせるコードを含む、請求項38に記載の媒体。 - 前記プロセッサに、
参照標的構造および前記操作されたポリペプチドの各々の前記表現の分子動力学(MD)シミュレーションを使用する前記参照標的構造の前記表現に対する動的構造の比較によって、前記操作されたポリペプチドをフィルタリングさせるコードを含む、請求項38に記載の媒体。 - 前記MDシミュレーションが、対称型マルチプロセシング(SMP)を使用して並列して実施される、請求項40に記載の媒体。
- 前記第2の複数のブループリント記録中のブループリント記録の数が、前記第1の複数のブループリント記録中のブループリント記録の数よりも少ない、請求項22に記載の媒体。
- 操作されたポリペプチドを選択する装置であって、
プロセッサと、
第1のコンピューティングデバイスから遠隔の第2のコンピューティングデバイスから、参照標的構造を受信することと、
前記参照標的構造の所定の部分から第1の複数のブループリント記録を生成することであって、前記第1の複数のブループリント記録からの各ブループリント記録が、標的残基位置および足場残基位置を含み、各標的残基位置が、複数の標的残基からの1つの標的残基に対応する、生成することと、
第1の複数のブループリント記録、またはそれらの表現、および第1の複数のスコアに基づいて、機械学習モデルを訓練することであって、前記第1の複数のブループリント記録からの各ブループリント記録が、前記第1の複数のスコアからの各スコアに関連付けられている、訓練することと、
前記訓練の後、前記機械学習モデルを実行して、少なくとも1つの所望のスコアを有する第2の複数のブループリント記録を生成することと、を行うために前記プロセッサによって実行可能な命令を記憶するメモリと、を有する、第1のコンピューティングデバイス、を備え、
前記第2の複数のブループリント記録が、計算タンパク質モデリングで入力として受信されて、前記第2の複数のブループリント記録に基づいて、操作されたポリペプチドを生成するように構成されている、装置。 - 前記プロセッサに、
前記第2の複数のブループリント記録に対する第2の複数のスコアを計算することによって、前記機械学習モデルを再訓練するかどうかを決定することと、
前記決定することに応答して、(1)前記第2の複数のブループリント記録を含む再訓練ブループリント記録、および(2)前記第2の複数のスコアを含む再訓練スコアに基づいて、前記機械学習モデルを再訓練することと、を行わせるコードを含む、請求項43に記載の装置。 - 前記所望のスコアが、プリセット値である、請求項43に記載の装置。
- 前記所望のスコアが、動的に決定される、請求項43に記載の装置。
- 前記機械学習モデルが、教師あり機械学習モデルである、請求項43に記載の装置。
- 前記教師あり機械学習モデルが、決定木のアンサンブル、ブーストされた決定木アルゴリズム、eXtreme勾配ブースティング(XGBoost)モデル、またはランダムフォレストを含む、請求項47に記載の装置。
- 前記教師あり機械学習モデルが、サポートベクトルマシン(SVM)、フィードフォワード機械学習モデル、再帰型ニューラルネットワーク(RNN)、畳み込みニューラルネットワーク(CNN)、グラフニューラルネットワーク(GNN)、またはトランスフォーマーニューラルネットワークを含む、請求項47に記載の装置。
- 前記機械学習モデルが、帰納的機械学習モデルである、請求項43に記載の装置。
- 前記機械学習モデルが、生成機械学習モデルである、請求項43に記載の装置。
- 前記プロセッサに、
前記第2の複数のブループリント記録上で計算タンパク質モデリングを実施して、操作されたポリペプチドを生成させるコードを含む、請求項43に記載の装置。 - 前記プロセッサに、
参照標的構造の表現に対する静的構造の比較によって、前記操作されたポリペプチドをフィルタリングさせるコードを含む、請求項52に記載の装置。 - 前記プロセッサに、
参照標的構造および前記操作されたポリペプチドの各々の表現の分子動力学(MD)シミュレーションを使用する前記参照標的構造の前記表現に対する動的構造の比較によって、前記操作されたポリペプチドをフィルタリングさせるコードを含む、請求項52に記載の装置。 - 前記MDシミュレーションが、対称型マルチプロセシング(SMP)を使用して並列して実施される、請求項54に記載の装置。
- 請求項1~21のいずれか一項に記載の方法、請求項22~42のいずれか一項に記載の媒体、または請求項43~55のいずれか一項に記載の装置によって生成される、操作されたポリペプチド。
- 操作されたペプチドであって、前記操作されたペプチドが、1kDa~10kDaの分子量を有し、最大50個のアミノ酸を含み、前記操作されたペプチドが、
空間的に関連するトポロジカル制約の組み合わせを含み、前記制約のうちの1つ以上が、参照標的由来の制約であり、
前記操作されたペプチドの前記アミノ酸の10%~98%が、前記1つ以上の参照標的由来の制約を満たし、
前記1つ以上の参照標的由来の制約を満たす前記アミノ酸が、前記参照標的と8.0Å未満の骨格平均二乗偏差(RSMD)構造相同性を有する、操作されたペプチド。 - 前記1つ以上の参照標的由来の制約を満たす前記アミノ酸が、前記参照標的と10%~90%の配列相同性を有する、請求項57に記載の操作されたペプチド。
- 前記組み合わせが、少なくとも2つの参照標的由来の制約を含む、請求項57または58に記載の操作されたペプチド。
- 前記組み合わせが、少なくとも2つの参照標的由来の制約を含む、請求項57または59に記載の操作されたペプチド。
- 前記組み合わせが、エネルギー項と、参照標的構造の表現から抽出された1つ以上の構造制約を使用して決定される、構造制約一致項と、を含む、請求項57~60のいずれか一項に記載の操作されたペプチド。
- 前記1つ以上の非参照標的由来の制約が、所望の構造的特性、動的特性、またはそれらの任意の組み合わせを説明する、請求項57~61のいずれか一項に記載の操作されたペプチド。
- 前記参照標的が、生物学的応答または生物学的機能に関連する1つ以上の原子を含み、
生物学的応答または生物学的機能に関連する前記操作されたペプチド中の前記1つ以上の原子の原子変動が、生物学的応答または生物学的機能に関連する前記参照標的中の前記1つ以上の原子の前記原子変動と重複する、請求項57~62のいずれか一項に記載の操作されたペプチド。 - 前記重複が、0.25より大きい二乗平均平方根内積(RMSIP)である、請求項63に記載の操作されたペプチド。
- 前記重複が、0.75より大きい二乗平均平方根内積(RMSIP)を有する、請求項63に記載の操作されたペプチド。
- 操作されたペプチドを選択する方法であって、
参照標的の1つ以上のトポロジカル特性を特定することと、
前記参照標的由来の空間的に関連するトポロジカル制約の組み合わせを生成するように、各トポロジカル特性に対して空間的に関連する制約を設計することと、
候補ペプチドの空間的に関連するトポロジカル特性を、前記参照標的由来の前記空間的に関連するトポロジカル制約の組み合わせと比較することと、
前記参照標的由来の前記空間的に関連するトポロジカル制約の組み合わせと重複する、空間的に関連するトポロジカル特性を有する候補ペプチドを選択して、前記操作されたペプチドを生成することと、を含む、方法。 - 1つ以上の制約が、残基当たりのエネルギーおよび残基当たりの原子距離に由来する、請求項66に記載の方法。
- 1つ以上の候補ペプチドの前記特性が、コンピュータシミュレーションによって決定される、請求項66または67に記載の方法。
- 前記コンピュータシミュレーションが、分子動力学シミュレーション、モンテカルロシミュレーション、粗視化シミュレーション、ガウスネットワークモデル、機械学習、またはそれらの任意の組み合わせを含む、請求項68に記載の方法。
- 前記1つ以上の参照標的由来の制約を満たすアミノ酸が、前記参照標的と10%~90%の配列相同性を有する、請求項66~69のいずれか一項に記載の方法。
- 前記1つ以上の非参照標的由来の制約が、所望の構造的特性および/または動的特性を説明する、請求項66~70のいずれか一項に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962855767P | 2019-05-31 | 2019-05-31 | |
US62/855,767 | 2019-05-31 | ||
PCT/US2020/032724 WO2020242766A1 (en) | 2019-05-31 | 2020-05-13 | Machine learning-based apparatus for engineering meso-scale peptides and methods and system for the same |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022535769A true JP2022535769A (ja) | 2022-08-10 |
JPWO2020242766A5 JPWO2020242766A5 (ja) | 2023-06-15 |
Family
ID=73553528
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021571033A Pending JP2022535769A (ja) | 2019-05-31 | 2020-05-13 | メソスケールペプチドを操作するための機械学習ベースの装置およびそのための方法およびシステム |
JP2021570755A Pending JP2022535511A (ja) | 2019-05-31 | 2020-05-13 | メソスケール操作されたペプチドおよび選択方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021570755A Pending JP2022535511A (ja) | 2019-05-31 | 2020-05-13 | メソスケール操作されたペプチドおよび選択方法 |
Country Status (7)
Country | Link |
---|---|
US (3) | US11545238B2 (ja) |
EP (2) | EP3976083A4 (ja) |
JP (2) | JP2022535769A (ja) |
KR (2) | KR20220041784A (ja) |
CN (2) | CN114401734A (ja) |
CA (2) | CA3142339A1 (ja) |
WO (2) | WO2020242765A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4341936A1 (en) * | 2021-05-21 | 2024-03-27 | Peptone, Ltd. | Spacio-temporal determination of polypeptide structure |
CN114065620B (zh) * | 2021-11-11 | 2022-06-03 | 四川大学 | 基于像素图表征和cnn的可解释性分子动力学轨迹分析方法 |
WO2023215887A1 (en) * | 2022-05-06 | 2023-11-09 | Dyno Therapeutics, Inc. | System and methods for predicting features of biological sequences |
CN115512763B (zh) * | 2022-09-06 | 2023-10-24 | 北京百度网讯科技有限公司 | 多肽序列的生成方法、多肽生成模型的训练方法和装置 |
CN115881220B (zh) * | 2023-02-15 | 2023-06-06 | 北京深势科技有限公司 | 一种抗体结构预测的处理方法和装置 |
CN116913395B (zh) * | 2023-09-13 | 2023-11-28 | 青岛虹竹生物科技有限公司 | 一种构建小分子肽数据库的数字化方法 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AUPP660698A0 (en) * | 1998-10-21 | 1998-11-12 | University Of Queensland, The | A method of protein engineering |
ATE281472T1 (de) * | 1999-08-02 | 2004-11-15 | Synt Em Sa | Berechnungsmethoden zur herstellung von molekularen mimetika |
EP1379283B1 (en) * | 2000-12-19 | 2008-02-13 | Palatin Technologies, Inc. | Identification of target-specific folding sites in peptides and proteins |
EP1482434A3 (en) * | 2001-08-10 | 2006-07-26 | Xencor, Inc. | Protein design automation for protein libraries |
US20060020396A1 (en) * | 2002-09-09 | 2006-01-26 | Rene Gantier | Rational directed protein evolution using two-dimensional rational mutagenesis scanning |
US20070192033A1 (en) | 2006-02-16 | 2007-08-16 | Microsoft Corporation | Molecular interaction predictors |
US8050870B2 (en) | 2007-01-12 | 2011-11-01 | Microsoft Corporation | Identifying associations using graphical models |
US8374828B1 (en) * | 2007-12-24 | 2013-02-12 | The University Of North Carolina At Charlotte | Computer implemented system for protein and drug target design utilizing quantified stability and flexibility relationships to control function |
WO2012040406A2 (en) * | 2010-09-21 | 2012-03-29 | Massachusetts Institute Of Technology | Influenza treatment and/or characterization; human-adapted ha polypeptides; vaccines |
US20130090265A1 (en) | 2011-10-11 | 2013-04-11 | Biolauncher Ltd. | Systems and methods for generation of context-specific, molecular field-based amino acid substitution matrices |
WO2014022817A2 (en) | 2012-08-03 | 2014-02-06 | Novartis Ag | Methods to identify amino acid residues involved in macromolecular binding and uses therefor |
US10155031B2 (en) * | 2012-11-28 | 2018-12-18 | Biontech Rna Pharmaceuticals Gmbh | Individualized vaccines for cancer |
CN106605228B (zh) * | 2014-07-07 | 2019-08-16 | 耶达研究及发展有限公司 | 计算蛋白质设计的方法 |
JP6871232B2 (ja) | 2015-04-06 | 2021-05-12 | サブドメイン リミテッド ライアビリティ カンパニー | 新規結合ドメイン含有ポリペプチドおよびその使用 |
US20180068054A1 (en) * | 2016-09-06 | 2018-03-08 | University Of Washington | Hyperstable Constrained Peptides and Their Design |
WO2018132752A1 (en) | 2017-01-13 | 2018-07-19 | Massachusetts Institute Of Technology | Machine learning based antibody design |
WO2018201020A1 (en) * | 2017-04-28 | 2018-11-01 | University Of Washington | Folded and protease-resistant polypeptides |
EP3880698A4 (en) * | 2018-11-14 | 2022-11-30 | RubrYc Therapeutics, Inc. | MANIPULATED CD25 POLYPEPTIDES AND USES THEREOF |
WO2020132586A1 (en) | 2018-12-21 | 2020-06-25 | Neon Therapeutics, Inc. | Method and systems for prediction of hla class ii-specific epitopes and characterization of cd4+ t cells |
-
2020
- 2020-05-13 CA CA3142339A patent/CA3142339A1/en active Pending
- 2020-05-13 JP JP2021571033A patent/JP2022535769A/ja active Pending
- 2020-05-13 CA CA3142227A patent/CA3142227A1/en active Pending
- 2020-05-13 CN CN202080050301.9A patent/CN114401734A/zh active Pending
- 2020-05-13 WO PCT/US2020/032715 patent/WO2020242765A1/en unknown
- 2020-05-13 EP EP20815607.5A patent/EP3976083A4/en active Pending
- 2020-05-13 KR KR1020217043265A patent/KR20220041784A/ko unknown
- 2020-05-13 JP JP2021570755A patent/JP2022535511A/ja active Pending
- 2020-05-13 WO PCT/US2020/032724 patent/WO2020242766A1/en unknown
- 2020-05-13 EP EP20813167.2A patent/EP3977117A4/en active Pending
- 2020-05-13 KR KR1020217043264A patent/KR20220039659A/ko unknown
- 2020-05-13 CN CN202080050892.XA patent/CN114585918A/zh active Pending
- 2020-12-01 US US17/108,958 patent/US11545238B2/en active Active
-
2021
- 2021-11-29 US US17/537,215 patent/US20220081472A1/en active Pending
-
2022
- 2022-10-07 US US17/961,942 patent/US20230095685A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP3976083A1 (en) | 2022-04-06 |
EP3977117A1 (en) | 2022-04-06 |
US20220081472A1 (en) | 2022-03-17 |
US11545238B2 (en) | 2023-01-03 |
EP3976083A4 (en) | 2023-07-12 |
US20210166788A1 (en) | 2021-06-03 |
KR20220041784A (ko) | 2022-04-01 |
KR20220039659A (ko) | 2022-03-29 |
CN114585918A (zh) | 2022-06-03 |
US20230095685A1 (en) | 2023-03-30 |
WO2020242765A1 (en) | 2020-12-03 |
CA3142227A1 (en) | 2020-12-03 |
WO2020242766A1 (en) | 2020-12-03 |
EP3977117A4 (en) | 2023-08-16 |
CA3142339A1 (en) | 2020-12-03 |
JP2022535511A (ja) | 2022-08-09 |
CN114401734A (zh) | 2022-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2022535769A (ja) | メソスケールペプチドを操作するための機械学習ベースの装置およびそのための方法およびシステム | |
Alshehri et al. | Deep learning and knowledge-based methods for computer-aided molecular design—toward a unified approach: State-of-the-art and future directions | |
CN110459274B (zh) | 一种基于深度迁移学习的小分子药物虚拟筛选方法及其应用 | |
Jia et al. | Caffe: Convolutional architecture for fast feature embedding | |
US9990558B2 (en) | Generating image features based on robust feature-learning | |
Idris et al. | Genetic programming and adaboosting based churn prediction for telecom | |
JP2021514086A (ja) | Mhcペプチド結合予測のためのgan−cnn | |
CN113707235A (zh) | 基于自监督学习的药物小分子性质预测方法、装置及设备 | |
US20230267381A1 (en) | Neural trees | |
US20230005567A1 (en) | Generating protein sequences using machine learning techniques based on template protein sequences | |
Hu et al. | DeepMHC: Deep convolutional neural networks for high-performance peptide-MHC binding affinity prediction | |
Zarlenga et al. | Efficient decompositional rule extraction for deep neural networks | |
Shuai et al. | IgLM: Infilling language modeling for antibody sequence design | |
US20220130490A1 (en) | Peptide-based vaccine generation | |
Handoko et al. | Extreme learning machine for predicting HLA-peptide binding | |
Borrero et al. | Folding kinetics of a lattice protein via a forward flux sampling approach | |
Wakayama et al. | Distributed forests for MapReduce-based machine learning | |
Mu et al. | HyLo: a hybrid low-rank natural gradient descent method | |
US20240096443A1 (en) | Generalized Scaffolds for Polypeptide Display and Uses Thereof | |
Han et al. | Deep learning framework DNN with conditional WGAN for protein solubility prediction | |
Keyes et al. | Latent Vector Recovery of Audio GANs | |
Day et al. | Machine Learning-Enabled Image Classification for Automated Electron Microscopy | |
Kenig et al. | Unsupervised learning of correlated quantum dynamics on disordered lattices | |
CN117393047A (zh) | 基于语言模型的抗病毒多肽序列设计方法 | |
Xu et al. | Glue: Enhancing Compatibility and Flexibility of Reinforcement Learning Platforms by Decoupling Algorithms and Environments |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20221111 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20221205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230224 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230421 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230515 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230515 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20221111 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240527 |