JPWO2020242766A5 - - Google Patents

Download PDF

Info

Publication number
JPWO2020242766A5
JPWO2020242766A5 JP2021571033A JP2021571033A JPWO2020242766A5 JP WO2020242766 A5 JPWO2020242766 A5 JP WO2020242766A5 JP 2021571033 A JP2021571033 A JP 2021571033A JP 2021571033 A JP2021571033 A JP 2021571033A JP WO2020242766 A5 JPWO2020242766 A5 JP WO2020242766A5
Authority
JP
Japan
Prior art keywords
blueprint
records
machine learning
learning model
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021571033A
Other languages
Japanese (ja)
Other versions
JP2022535769A (en
Publication date
Application filed filed Critical
Priority claimed from PCT/US2020/032724 external-priority patent/WO2020242766A1/en
Publication of JP2022535769A publication Critical patent/JP2022535769A/en
Publication of JPWO2020242766A5 publication Critical patent/JPWO2020242766A5/ja
Pending legal-status Critical Current

Links

Claims (16)

方法であって、
第1の複数のブループリント記録、またはそれらの表現、および第1の複数のスコアに基づいて、機械学習モデルを訓練することであって、前記第1の複数のブループリント記録からの各ブループリント記録が、前記第1の複数のスコアからの各スコアに関連付けられている、前記訓練することと、
前記訓練後に、前記機械学習モデルを実行して、少なくとも1つの所望のスコアを有する第2の複数のブループリント記録を生成することと、を含み、
前記第2の複数のブループリント記録が、計算タンパク質モデリングで入力として受信されて、前記第2の複数のブループリント記録に基づいて、操作されたポリペプチドを生成するように構成されている、前記方法。
a method,
training a machine learning model based on a first plurality of blueprint records, or representations thereof, and a first plurality of scores, wherein each blueprint from the first plurality of blueprint records; said training, wherein a record is associated with each score from said first plurality of scores;
after the training, running the machine learning model to generate a second plurality of blueprint records having at least one desired score;
wherein said second plurality of blueprint records is received as input in computational protein modeling and configured to generate an engineered polypeptide based on said second plurality of blueprint records; Method.
参照標的に対する参照標的構造の表現を受信することと、
前記参照標的構造の所定の部分から前記第1の複数のブループリント記録を生成することであって、前記第1の複数のブループリント記録からの各ブループリント記録が、標的残基位置および足場残基位置を含み、各標的残基位置が、複数の標的残基からの1つの標的残基に対応し、
少なくとも1つのブループリント記録において、前記標的残基位置が、非連続的であり、
少なくとも1つのブループリント記録において、1つ以上の標的残基位置が、参照標的配列中の前記標的残基位置の順序とは異なる順序にある、前記生成することと、
前記第1の複数のブループリント記録からの各ブループリント記録について、
そのブループリント記録上で計算タンパク質モデリングを実施して、ポリペプチド構造を生成すること、
前記ポリペプチド構造のスコアを計算すること、および
前記スコアをそのブループリント記録と関連付けること
により、
前記第1の複数のブループリント記録にラベルを付けることとを含み、
前記計算タンパク質モデリングが、前記参照標的構造とテンプレートを一致させることなく、デノボ設計に基づくか;または
前記第1の複数のスコアからの各スコアが、エネルギー項と、前記参照標的構造の前記表現から抽出された1つ以上の構造制約を使用して決定される、構造制約一致項とを含む、
請求項1に記載の方法。
receiving a representation of the reference target structure for the reference target;
generating said first plurality of blueprint records from a predetermined portion of said reference target structure, wherein each blueprint record from said first plurality of blueprint records comprises a target residue position and a scaffold residue; group positions, each target residue position corresponding to one target residue from a plurality of target residues;
in at least one blueprint record, the target residue positions are non-contiguous;
said generating, wherein in at least one blueprint record, one or more target residue positions are in a different order than the order of said target residue positions in a reference target sequence;
for each blueprint record from the first plurality of blueprint records;
performing computational protein modeling on the blueprint record to generate a polypeptide structure;
calculating a score for said polypeptide structure; and
associating the score with its blueprint record
by
labeling the first plurality of blueprint records;
said computational protein modeling is based on de novo design without template matching to said reference target structure; or
each score from the first plurality of scores comprising an energy term and a structural constraint match term determined using one or more structural constraints extracted from the representation of the reference target structure;
The method of claim 1.
前記第2の複数のブループリント記録に対する第2の複数のスコアを計算することによって、前記機械学習モデルを再訓練するかどうかを決定することと、
前記決定することに応答して、(1)前記第2の複数のブループリント記録を含む再訓練ブループリント記録、および(2)前記第2の複数のスコアを含む再訓練スコアに基づいて、前記機械学習モデルを再訓練することと、を含任意に、
前記機械学習モデルを前記再訓練することの後に、前記第1の複数のブループリント記録および前記第2の複数のブループリント記録を連結して、前記再訓練ブループリント記録を生成し、前記再訓練スコアを生成することであって、前記再訓練ブループリント記録からの各ブループリント記録が、前記再訓練スコアからのスコアに関連付けられていること、
前記少なくとも1つの所望のスコアが、プリセット値であること、
前記少なくとも1つの所望のスコアが、動的に決定されること、
の少なくとも1つをさらに含み、あるいは
前記機械学習モデルが、教師あり機械学習モデルの場合、
前記教師あり機械学習モデルが、決定木のアンサンブル、ブーストされた決定木アルゴリズム、eXtreme勾配ブースティング(XGBoost)モデル、もしくはランダムフォレストを含むか、
前記教師あり機械学習モデルが、サポートベクトルマシン(SVM)、フィードフォワード機械学習モデル、再帰型ニューラルネットワーク(RNN)、畳み込みニューラルネットワーク(CNN)、グラフニューラルネットワーク(GNN)、もしくはトランスフォーマーニューラルネットワークを含むか、または
前記機械学習モデルが、帰納的機械学習モデルもしくは生成機械学習モデルである、
請求項1に記載の方法。
determining whether to retrain the machine learning model by calculating a second plurality of scores for the second plurality of blueprint records;
in response to the determining, based on (1) a retraining blueprint record comprising the second plurality of blueprint records; and (2) a retraining score comprising the second plurality of scores. retraining the machine learning model; and optionally ,
concatenating the first plurality of blueprint records and the second plurality of blueprint records to generate the retraining blueprint record after the retraining the machine learning model; generating a score, wherein each blueprint record from the retraining blueprint record is associated with a score from the retraining score;
the at least one desired score is a preset value;
the at least one desired score is determined dynamically;
or
When the machine learning model is a supervised machine learning model,
the supervised machine learning model comprises a decision tree ensemble, a boosted decision tree algorithm, an eXtreme Gradient Boosting (XGBoost) model, or a random forest;
whether the supervised machine learning model comprises a support vector machine (SVM), a feedforward machine learning model, a recurrent neural network (RNN), a convolutional neural network (CNN), a graph neural network (GNN), or a transformer neural network ,or
the machine learning model is an inductive machine learning model or a generative machine learning model;
The method of claim 1.
前記第2の複数のブループリント記録上で計算タンパク質モデリングを実施して、前記操作されたポリペプチドを生成すること
前記参照標的構造の前記表現に対する静的構造の比較によって、前記操作されたポリペプチドをフィルタリングすること;
前記参照標的構造および操作されたポリペプチドの各構造の前記表現の分子動力学(MD)シミュレーションを使用する前記参照標的構造の前記表現に対する動的構造の比較によって、前記操作されたポリペプチドをフィルタリングすること;の少なくとも1つを含
前記MDシミュレーションが、対称型マルチプロセシング(SMP)を使用して並列して実施されるか、または
前記第2の複数のブループリント記録中のブループリント記録の数が、前記第1の複数のブループリント記録中のブループリント記録の数よりも少ない、請求項に記載の方法。
performing computational protein modeling on the second plurality of blueprint records to generate the engineered polypeptide ;
filtering said engineered polypeptides by comparison of static structures to said representation of said reference target structure;
Filtering said engineered polypeptides by comparison of dynamic structures to said representation of said reference target structure using molecular dynamics (MD) simulations of said representation of each structure of said reference target structure and engineered polypeptide. including at least one of:
said MD simulations are performed in parallel using symmetric multiprocessing (SMP), or
3. The method of claim 2 , wherein a number of blueprint records in said second plurality of blueprint records is less than a number of blueprint records in said first plurality of blueprint records.
プロセッサによって実行される命令を表すコードを記憶する非一時的プロセッサ可読媒体であって、前記コードが、前記プロセッサに、
第1の複数のブループリント記録、またはそれらの表現、および第1の複数のスコアに基づいて、機械学習モデルを訓練することであって、前記第1の複数のブループリント記録からの各ブループリント記録が、前記第1の複数のスコアからの各スコアに関連付けられている、前記訓練することと、
前記訓練の後、前記機械学習モデルを実行して、少なくとも1つの所望のスコアを有する第2の複数のブループリント記録を生成することと、を行わせるコードを含み、
前記第2の複数のブループリント記録が、計算タンパク質モデリングで入力として受信されて、前記第2の複数のブループリント記録に基づいて、操作されたポリペプチドを生成するように構成されている、前記非一時的プロセッサ可読媒体。
A non-transitory processor-readable medium storing code representing instructions to be executed by a processor, the code causing the processor to:
training a machine learning model based on a first plurality of blueprint records, or representations thereof, and a first plurality of scores, wherein each blueprint from the first plurality of blueprint records; said training, wherein a record is associated with each score from said first plurality of scores;
executing the machine learning model after the training to generate a second plurality of blueprint records having at least one desired score;
wherein said second plurality of blueprint records is received as input in computational protein modeling and configured to generate an engineered polypeptide based on said second plurality of blueprint records; A non-transitory processor-readable medium.
前記プロセッサに、
参照標的構造の表現を受信することと、
前記参照標的構造の所定の部分から前記第1の複数のブループリント記録を生成することであって、前記第1の複数のブループリント記録からの各ブループリント記録が、標的残基位置および足場残基位置を含み、複数の標的残基位置からの各標的残基位置が、前記複数の標的残基からの1つの標的残基に対応
少なくとも1つのブループリント記録において、前記標的残基位置が、非連続的であり;
少なくとも1つのブループリント記録において、1つ以上の標的残基位置が、前記参照標的配列中の前記標的残基位置の順序とは異なる順序にある、前記生成することと、
前記第1の複数のブループリント記録からの各ブループリント記録について、
そのブループリント記録上で計算タンパク質モデリングを実施して、ポリペプチド構造を生成すること、
前記ポリペプチド構造のスコアを計算すること、および
前記スコアをそのブループリント記録と関連付けること
により、
前記第1の複数のブループリント記録にラベルを付けることと、
を行わせるコードを含
前記計算タンパク質モデリングが、前記参照標的構造とテンプレートを一致させることなく、デノボ設計に基づくか、または
前記第1の複数のスコアからの各スコアが、エネルギー項と、前記参照標的構造の前記表現から抽出された1つ以上の構造制約を使用して決定される、構造制約一致項とを含む、
請求項に記載の媒体。
to the processor;
receiving a representation of the reference target structure;
generating said first plurality of blueprint records from a predetermined portion of said reference target structure, wherein each blueprint record from said first plurality of blueprint records comprises a target residue position and a scaffold residue; base positions, each target residue position from the plurality of target residue positions corresponding to one target residue from the plurality of target residues;
in at least one blueprint record, the target residue positions are non-contiguous;
said generating, wherein in at least one blueprint record, one or more target residue positions are in a different order than the order of said target residue positions in said reference target sequence;
for each blueprint record from the first plurality of blueprint records;
performing computational protein modeling on the blueprint record to generate a polypeptide structure;
calculating a score for said polypeptide structure; and
associating the score with its blueprint record
by
labeling the first plurality of blueprint records;
contains code that causes the
said computational protein modeling is based on de novo design without template matching to said reference target structure, or
each score from the first plurality of scores comprising an energy term and a structural constraint match term determined using one or more structural constraints extracted from the representation of the reference target structure;
A medium according to claim 5 .
前記プロセッサに、
前記第2の複数のブループリント記録に対する第2の複数のスコアを計算することによって、前記機械学習モデルを再訓練するかどうかを決定することと、
前記決定することに応答して、(1)前記第2の複数のブループリント記録を含む再訓練ブループリント記録、および(2)前記第2の複数のスコアを含む再訓練スコアに基づいて、前記機械学習モデルを再訓練することと、を行わせるコードを含み任意に、
前記機械学習モデルを前記再訓練することの後に、前記第1の複数のブループリント記録および前記第2の複数のブループリント記録を連結して、前記再訓練ブループリント記録を生成し、前記再訓練スコアを生成することであって、前記再訓練ブループリント記録からの各ブループリント記録が、前記再訓練スコアからのスコアに関連付けられていること、
前記少なくとも1つの所望のスコアが、プリセット値であること、
前記少なくとも1つの所望のスコアが、動的に決定されること
の少なくとも1つをさらに含み、あるいは
前記機械学習モデルが、教師あり機械学習モデルの場合、
前記教師あり機械学習モデルが、決定木のアンサンブル、ブーストされた決定木アルゴリズム、eXtreme勾配ブースティング(XGBoost)モデル、もしくはランダムフォレストを含むか、
前記教師あり機械学習モデルが、サポートベクトルマシン(SVM)、フィードフォワード機械学習モデル、再帰型ニューラルネットワーク(RNN)、畳み込みニューラルネットワーク(CNN)、グラフニューラルネットワーク(GNN)、もしくはトランスフォーマーニューラルネットワークを含むか、または
前記機械学習モデルが、帰納的機械学習モデルもしくは生成機械学習モデルである、
請求項に記載の媒体。
to the processor;
determining whether to retrain the machine learning model by calculating a second plurality of scores for the second plurality of blueprint records;
in response to the determining, based on (1) a retraining blueprint record comprising the second plurality of blueprint records; and (2) a retraining score comprising the second plurality of scores. retraining the machine learning model, and optionally ,
concatenating the first plurality of blueprint records and the second plurality of blueprint records to generate the retraining blueprint record after the retraining the machine learning model; generating a score, wherein each blueprint record from the retraining blueprint record is associated with a score from the retraining score;
the at least one desired score is a preset value;
the at least one desired score is determined dynamically
or
When the machine learning model is a supervised machine learning model,
the supervised machine learning model comprises a decision tree ensemble, a boosted decision tree algorithm, an eXtreme Gradient Boosting (XGBoost) model, or a random forest;
whether the supervised machine learning model comprises a support vector machine (SVM), a feedforward machine learning model, a recurrent neural network (RNN), a convolutional neural network (CNN), a graph neural network (GNN), or a transformer neural network ,or
the machine learning model is an inductive machine learning model or a generative machine learning model;
A medium according to claim 5 .
前記プロセッサに、
前記第2の複数のブループリント記録上で計算タンパク質モデリングを実施して、操作されたポリペプチドを生成させること;
参照標的構造の表現に対する静的構造の比較によって、前記操作されたポリペプチドをフィルタリングすること;
前記参照標的構造および操作されたポリペプチドの各構造の前記表現の分子動力学(MD)シミュレーションを使用する前記参照標的構造の前記表現に対する動的構造の比較によって、前記操作されたポリペプチドをフィルタリングすること;または
対称型マルチプロセシング(SMP)を使用して前記MDシミュレーションを並列して実施すること
を行わせるコードを含
前記第2の複数のブループリント記録中のブループリント記録の数が、前記第1の複数のブループリント記録中のブループリント記録の数よりも少ない、
請求項に記載の媒体。
to the processor;
performing computational protein modeling on the second plurality of blueprint records to generate engineered polypeptides;
filtering said engineered polypeptides by comparison of static structures to representations of reference target structures;
Filtering said engineered polypeptides by comparison of dynamic structures to said representation of said reference target structure using molecular dynamics (MD) simulations of said representation of each structure of said reference target structure and engineered polypeptide. to do; or
Performing said MD simulations in parallel using symmetric multiprocessing (SMP)
contains code that causes the
the number of blueprint records in the second plurality of blueprint records is less than the number of blueprint records in the first plurality of blueprint records;
A medium according to claim 5 .
操作されたポリペプチドを選択する装置であって、
プロセッサと、
第1のコンピューティングデバイスから遠隔の第2のコンピューティングデバイスから、参照標的構造を受信することと、
前記参照標的構造の所定の部分から第1の複数のブループリント記録を生成することであって、前記第1の複数のブループリント記録からの各ブループリント記録が、標的残基位置および足場残基位置を含み、各標的残基位置が、複数の標的残基からの1つの標的残基に対応する、前記生成することと、
第1の複数のブループリント記録、またはそれらの表現、および第1の複数のスコアに基づいて、機械学習モデルを訓練することであって、前記第1の複数のブループリント記録からの各ブループリント記録が、前記第1の複数のスコアからの各スコアに関連付けられている、前記訓練することと、
前記訓練の後、前記機械学習モデルを実行して、少なくとも1つの所望のスコアを有する第2の複数のブループリント記録を生成すること
行うために前記プロセッサによって実行可能な命令を記憶するメモリ
有する、第1のコンピューティングデバイスを備え、
前記第2の複数のブループリント記録が、計算タンパク質モデリングで入力として受信されて、前記第2の複数のブループリント記録に基づいて、操作されたポリペプチドを生成するように構成されている、前記装置。
A device for selecting an engineered polypeptide, comprising:
a processor;
receiving a reference target structure from a second computing device remote from the first computing device;
generating a first plurality of blueprint records from a predetermined portion of said reference target structure, wherein each blueprint record from said first plurality of blueprint records comprises a target residue position and a scaffold residue; positions, each target residue position corresponding to one target residue from a plurality of target residues;
training a machine learning model based on a first plurality of blueprint records, or representations thereof, and a first plurality of scores, wherein each blueprint from the first plurality of blueprint records; said training, wherein a record is associated with each score from said first plurality of scores;
After the training, running the machine learning model to generate a second plurality of blueprint records having at least one desired score.
a memory storing instructions executable by the processor to perform
a first computing device having
wherein said second plurality of blueprint records is received as input in computational protein modeling and configured to generate an engineered polypeptide based on said second plurality of blueprint records; Device.
前記プロセッサに、
前記第2の複数のブループリント記録に対する第2の複数のスコアを計算することによって、前記機械学習モデルを再訓練するかどうかを決定することと、
前記決定することに応答して、(1)前記第2の複数のブループリント記録を含む再訓練ブループリント記録、および(2)前記第2の複数のスコアを含む再訓練スコアに基づいて、前記機械学習モデルを再訓練することと、を行わせるコードを含かつ
前記所望のスコアが、プリセット値である、または
前記所望のスコアが、動的に決定される
の少なくとも1つであり、あるいは
前記機械学習モデルが、教師あり機械学習モデルである場合、
前記教師あり機械学習モデルが、決定木のアンサンブル、ブーストされた決定木アルゴリズム、eXtreme勾配ブースティング(XGBoost)モデル、またはランダムフォレストを含み、
前記教師あり機械学習モデルが、サポートベクトルマシン(SVM)、フィードフォワード機械学習モデル、再帰型ニューラルネットワーク(RNN)、畳み込みニューラルネットワーク(CNN)、グラフニューラルネットワーク(GNN)、またはトランスフォーマーニューラルネットワークを含み、
前記機械学習モデルが帰納的機械学習モデルであり、
前記機械学習モデルが生成機械学習モデルである、
請求項に記載の装置。
to the processor;
determining whether to retrain the machine learning model by calculating a second plurality of scores for the second plurality of blueprint records;
in response to the determining, based on (1) a retraining blueprint record comprising the second plurality of blueprint records; and (2) a retraining score comprising the second plurality of scores. retraining a machine learning model ; and
the desired score is a preset value, or
The desired score is dynamically determined
is at least one of, or
When the machine learning model is a supervised machine learning model,
the supervised machine learning model comprises a decision tree ensemble, a boosted decision tree algorithm, an eXtreme Gradient Boosting (XGBoost) model, or a random forest;
wherein the supervised machine learning model comprises a support vector machine (SVM), a feedforward machine learning model, a recurrent neural network (RNN), a convolutional neural network (CNN), a graph neural network (GNN), or a transformer neural network;
the machine learning model is an inductive machine learning model;
wherein the machine learning model is a generative machine learning model;
10. Apparatus according to claim 9 .
前記プロセッサに、
前記第2の複数のブループリント記録上で計算タンパク質モデリングを実施して、操作されたポリペプチドを生成させること;
参照標的構造の表現に対する静的構造の比較によって、前記操作されたポリペプチドをフィルタリングすること;
参照標的構造および前記操作されたポリペプチドの各構造の前記表現の分子動力学(MD)シミュレーションを使用する前記参照標的構造の前記表現に対する動的構造の比較によって、前記操作されたポリペプチドをフィルタリングすること;または
対称型マルチプロセシング(SMP)を使用して前記MDシミュレーションを並列して実施すること;
の少なくとも1つを行わせるコードを含む、請求項に記載の装置。
to the processor;
performing computational protein modeling on the second plurality of blueprint records to generate engineered polypeptides;
filtering said engineered polypeptides by comparison of static structures to representations of reference target structures;
filtering said engineered polypeptides by comparison of dynamic structures to said representation of said reference target structure using a molecular dynamics (MD) simulation of said representation of each structure of said engineered polypeptide and said reference target structure. to do; or
performing said MD simulations in parallel using symmetric multiprocessing (SMP);
10. The apparatus of claim 9 , comprising code for causing at least one of :
請求項1~のいずれか一項に記載の方法、請求項5~8のいずれか一項に記載の非一時的プロセッサ可読媒体、または請求項9~11のいずれか一項に記載の装置によって生成される、操作されたポリペプチド。 A method according to any one of claims 1-4 , a non-transitory processor-readable medium according to any one of claims 5-8 , or an apparatus according to any one of claims 9-11. engineered polypeptides produced by 操作されたペプチドであって、前記操作されたペプチドが、1kDa~10kDaの分子量を有し、最大50個のアミノ酸を含み、前記操作されたペプチドが、
空間的に関連するトポロジカル制約の組み合わせを含み、前記制約のうちの1つ以上が、参照標的由来の制約であり、
前記操作されたペプチドの前記アミノ酸の10%~98%が、前記1つ以上の参照標的由来の制約を満たし、
前記1つ以上の参照標的由来の制約を満たす前記アミノ酸が、前記参照標的と8.0Å未満の骨格平均二乗偏差(RSMD)構造相同性を有する、前記操作されたペプチド。
an engineered peptide, said engineered peptide having a molecular weight of 1 kDa to 10 kDa and comprising up to 50 amino acids, said engineered peptide comprising:
comprising a combination of spatially related topological constraints, one or more of said constraints being reference target derived constraints;
10% to 98% of said amino acids of said engineered peptide satisfy said one or more reference target derived constraints;
Said engineered peptide, wherein said amino acids satisfying the constraints from said one or more reference targets have less than 8.0 Å backbone root mean square deviation (RSMD) structural homology with said reference targets.
前記1つ以上の参照標的由来の制約を満たす前記アミノ酸が、前記参照標的と10%~90%の配列相同性を有するか、
前記組み合わせが、少なくとも2つの参照標的由来の制約を含むか
前記組み合わせが、エネルギー項と、参照標的構造の表現から抽出された1つ以上の構造制約を使用して決定される、構造制約一致項とを含むか、
前記1つ以上の非参照標的由来の制約が、所望の構造的特性、動的特性、またはそれらの任意の組み合わせを規定するか、
前記参照標的が、生物学的応答または生物学的機能に関連する1つ以上の原子を含み、生物学的応答または生物学的機能に関連する前記操作されたペプチド中の前記1つ以上の原子の原子変動が、生物学的応答または生物学的機能に関連する前記参照標的中の前記1つ以上の原子の前記原子変動と重複するか、
前記重複が、0.25より大きい二乗平均平方根内積(RMSIP)であるか、または
前記重複が、0.75より大きい二乗平均平方根内積(RMSIP)を有する
の少なくとも1つである、請求項13に記載の操作されたペプチド。
said amino acids satisfying the constraints from said one or more reference targets have between 10% and 90% sequence homology with said reference targets ;
said combination comprises at least two reference target derived constraints ;
said combination comprises an energy term and a structural constraint match term determined using one or more structural constraints extracted from a representation of a reference target structure;
the one or more non-reference target-derived constraints define desired structural properties, dynamic properties, or any combination thereof;
said reference target comprises one or more atoms associated with a biological response or function, said one or more atoms in said engineered peptide associated with a biological response or function overlaps with said atomic variations of said one or more atoms in said reference target associated with a biological response or biological function;
the overlap is a root mean square dot product (RMSIP) greater than 0.25, or
the overlap has a root mean square inner product (RMSIP) greater than 0.75
14. The engineered peptide of claim 13 , which is at least one of
操作されたペプチドを選択する方法であって、
参照標的の1つ以上のトポロジカル特性を特定することと、
前記参照標的由来の空間的に関連するトポロジカル制約の組み合わせを生成するように、各トポロジカル特性に対して空間的に関連する制約を設計することと、
候補ペプチドの空間的に関連するトポロジカル特性を、前記参照標的由来の前記空間的に関連するトポロジカル制約の組み合わせと比較することと、
前記参照標的由来の前記空間的に関連するトポロジカル制約の組み合わせと重複する、空間的に関連するトポロジカル特性を有する候補ペプチドを選択して、前記操作されたペプチドを生成すること
含む、前記方法。
A method of selecting an engineered peptide comprising:
identifying one or more topological properties of the reference target;
designing a spatially related constraint for each topological feature to generate a combination of spatially related topological constraints derived from the reference target;
comparing the spatially related topological properties of a candidate peptide with the combination of said spatially related topological constraints from said reference target;
selecting candidate peptides with spatially related topological properties that overlap with the combination of the spatially related topological constraints from the reference target to generate the engineered peptides ;
The above method, comprising
1つ以上の制約が、残基当たりのエネルギーおよび残基当たりの原子距離に由来する
1つ以上の候補ペプチドの前記特性が、コンピュータシミュレーションによって決定されるか、
前記コンピュータシミュレーションが、分子動力学シミュレーション、モンテカルロシミュレーション、粗視化シミュレーション、ガウスネットワークモデル、機械学習、もしくはそれらの任意の組み合わせを含むか、
前記1つ以上の参照標的由来の制約を満たす前記アミノ酸が、前記参照標的と10%~90%の配列相同性を有するか、または
前記1つ以上の非参照標的由来の制約が、所望の構造的特性および/もしくは動的特性を説明する
の少なくとも1つである、請求項15に記載の方法。
one or more of the constraints come from energy per residue and atomic distance per residue;
said property of one or more candidate peptides is determined by computer simulation;
the computer simulation comprises a molecular dynamics simulation, a Monte Carlo simulation, a coarse-grained simulation, a Gaussian network model, machine learning, or any combination thereof;
said amino acids satisfying the constraints from said one or more reference targets have 10% to 90% sequence homology with said reference targets, or
the one or more non-reference target-derived constraints describe desired structural and/or dynamic properties
16. The method of claim 15 , wherein at least one of
JP2021571033A 2019-05-31 2020-05-13 Machine learning-based apparatus for manipulating mesoscale peptides and methods and systems therefor Pending JP2022535769A (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962855767P 2019-05-31 2019-05-31
US62/855,767 2019-05-31
PCT/US2020/032724 WO2020242766A1 (en) 2019-05-31 2020-05-13 Machine learning-based apparatus for engineering meso-scale peptides and methods and system for the same

Publications (2)

Publication Number Publication Date
JP2022535769A JP2022535769A (en) 2022-08-10
JPWO2020242766A5 true JPWO2020242766A5 (en) 2023-06-15

Family

ID=73553528

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2021570755A Pending JP2022535511A (en) 2019-05-31 2020-05-13 Mesoscale engineered peptides and selection methods
JP2021571033A Pending JP2022535769A (en) 2019-05-31 2020-05-13 Machine learning-based apparatus for manipulating mesoscale peptides and methods and systems therefor

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2021570755A Pending JP2022535511A (en) 2019-05-31 2020-05-13 Mesoscale engineered peptides and selection methods

Country Status (7)

Country Link
US (3) US11545238B2 (en)
EP (2) EP3976083A4 (en)
JP (2) JP2022535511A (en)
KR (2) KR20220041784A (en)
CN (2) CN114585918A (en)
CA (2) CA3142339A1 (en)
WO (2) WO2020242766A1 (en)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117980995A (en) * 2021-05-21 2024-05-03 蛋白胨有限公司 Spatiotemporal determination of polypeptide structure
CN114065620B (en) * 2021-11-11 2022-06-03 四川大学 Interpretable molecular dynamics trajectory analysis method based on pixel diagram and CNN
WO2023215887A1 (en) * 2022-05-06 2023-11-09 Dyno Therapeutics, Inc. System and methods for predicting features of biological sequences
CN115512763B (en) * 2022-09-06 2023-10-24 北京百度网讯科技有限公司 Polypeptide sequence generation method, and training method and device of polypeptide generation model
CN115881220B (en) * 2023-02-15 2023-06-06 北京深势科技有限公司 Antibody structure prediction processing method and device
CN116913395B (en) * 2023-09-13 2023-11-28 青岛虹竹生物科技有限公司 Digitization method for constructing small molecule peptide database

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPP660698A0 (en) * 1998-10-21 1998-11-12 University Of Queensland, The A method of protein engineering
DE60015564T2 (en) * 1999-08-02 2005-12-22 Synt:Em (S.A.) CALCULATION METHODS FOR THE MANUFACTURE OF MOLECULAR MIMETICS
ATE385811T1 (en) * 2000-12-19 2008-03-15 Palatin Technologies Inc IDENTIFICATION OF TARGETED FOLDING SITES IN PEPTIDES AND PROTEINS
EP1482434A3 (en) * 2001-08-10 2006-07-26 Xencor, Inc. Protein design automation for protein libraries
US20060020396A1 (en) * 2002-09-09 2006-01-26 Rene Gantier Rational directed protein evolution using two-dimensional rational mutagenesis scanning
US20070192033A1 (en) 2006-02-16 2007-08-16 Microsoft Corporation Molecular interaction predictors
US8050870B2 (en) 2007-01-12 2011-11-01 Microsoft Corporation Identifying associations using graphical models
US8374828B1 (en) * 2007-12-24 2013-02-12 The University Of North Carolina At Charlotte Computer implemented system for protein and drug target design utilizing quantified stability and flexibility relationships to control function
AU2011305371B2 (en) * 2010-09-21 2015-05-21 Massachusetts Institute Of Technology Human-adapted HA polypeptides, vaccines, and influenza treatment
US20130090265A1 (en) * 2011-10-11 2013-04-11 Biolauncher Ltd. Systems and methods for generation of context-specific, molecular field-based amino acid substitution matrices
WO2014022817A2 (en) 2012-08-03 2014-02-06 Novartis Ag Methods to identify amino acid residues involved in macromolecular binding and uses therefor
US10155031B2 (en) * 2012-11-28 2018-12-18 Biontech Rna Pharmaceuticals Gmbh Individualized vaccines for cancer
CN106605228B (en) * 2014-07-07 2019-08-16 耶达研究及发展有限公司 The method for calculating protein design
CN107921090A (en) 2015-04-06 2018-04-17 苏伯多曼有限责任公司 Polypeptide containing from the beginning binding structural domain and application thereof
US20180068054A1 (en) * 2016-09-06 2018-03-08 University Of Washington Hyperstable Constrained Peptides and Their Design
EP3568782A1 (en) 2017-01-13 2019-11-20 Massachusetts Institute Of Technology Machine learning based antibody design
US20210284695A1 (en) * 2017-04-28 2021-09-16 University Of Washington Folded and protease-resistant polypeptides
CN113646330A (en) * 2018-11-14 2021-11-12 鲁比克治疗股份有限公司 Engineered CD25 polypeptides and uses thereof
MX2021007556A (en) 2018-12-21 2021-09-10 Biontech Us Inc Method and systems for prediction of hla class ii-specific epitopes and characterization of cd4+ t cells.

Similar Documents

Publication Publication Date Title
JP6832678B2 (en) New substance search method and equipment
Talathi et al. Improving performance of recurrent neural network with relu nonlinearity
JP2015095212A (en) Identifier, identification program, and identification method
WO2020197501A1 (en) Method and system for image classification
JP6839123B2 (en) Information processing equipment, information processing methods, and programs
Huang et al. Greedy vacancy search algorithm for packing equal circles in a square
KR102546817B1 (en) Method and apparatus for learning of teacher assisted attention transfer using total cam information in knowledge distillation
CN107193969B (en) Method for automatically generating novel text emotion curve and predicting recommendation
JP7411758B2 (en) Prediction of molecular properties of molecular variants using residue-specific molecular structural features
WO2020242766A1 (en) Machine learning-based apparatus for engineering meso-scale peptides and methods and system for the same
JPWO2020242766A5 (en)
Qu et al. Dat: Training deep networks robust to label-noise by matching the feature distributions
John et al. Audio and video-based emotion recognition using multimodal transformers
Zhang et al. Co-attention network and low-rank bilinear pooling for aspect based sentiment analysis
Vivek et al. A hybrid bioinspired algorithm for facial emotion recognition using CSO-GA-PSO-SVM
Gao et al. A constraint approximation assisted PSO for computationally expensive constrained problems
CN113487027A (en) Sequence distance measurement method based on time sequence alignment prediction, storage medium and chip
Al-Helali et al. GP-based feature selection and weighted KNN-based instance selection for symbolic regression with incomplete data
JP5667004B2 (en) Data classification apparatus, method and program
Gönen et al. Multiple kernel machines using localized kernels
Smith et al. The use of reduced models in the optimisation of energy integrated processes
Singh et al. Predicting Enhancer-Promoter Interaction from Genomic Sequence with Deep Learning
Labram Fitting data with XGBoost
Yu et al. Regression Estimation Combined with Conformal Mapping and Boundary Extracting and It's Application
Wang et al. Design and Analysis of Neural Networks Based on Linearly Translated Features