JP7057004B1 - 予測装置、学習済みモデルの生成装置、予測方法、学習済みモデルの生成方法、予測プログラム、及び学習済みモデルの生成プログラム - Google Patents
予測装置、学習済みモデルの生成装置、予測方法、学習済みモデルの生成方法、予測プログラム、及び学習済みモデルの生成プログラム Download PDFInfo
- Publication number
- JP7057004B1 JP7057004B1 JP2021035648A JP2021035648A JP7057004B1 JP 7057004 B1 JP7057004 B1 JP 7057004B1 JP 2021035648 A JP2021035648 A JP 2021035648A JP 2021035648 A JP2021035648 A JP 2021035648A JP 7057004 B1 JP7057004 B1 JP 7057004B1
- Authority
- JP
- Japan
- Prior art keywords
- learning
- peptide
- predicted
- feature vector
- trained model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 331
- 239000013598 vector Substances 0.000 claims abstract description 298
- 230000002688 persistence Effects 0.000 claims abstract description 176
- 102000001189 Cyclic Peptides Human genes 0.000 claims abstract description 166
- 108010069514 Cyclic Peptides Proteins 0.000 claims abstract description 166
- 238000001727 in vivo Methods 0.000 claims abstract description 78
- 125000004122 cyclic group Chemical group 0.000 claims abstract description 23
- 230000013016 learning Effects 0.000 claims description 409
- 238000003032 molecular docking Methods 0.000 claims description 201
- 238000004364 calculation method Methods 0.000 claims description 114
- 238000000034 method Methods 0.000 claims description 65
- 102000004506 Blood Proteins Human genes 0.000 claims description 61
- 108010017384 Blood Proteins Proteins 0.000 claims description 61
- 238000000605 extraction Methods 0.000 claims description 57
- 238000010801 machine learning Methods 0.000 claims description 42
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 41
- 238000004422 calculation algorithm Methods 0.000 claims description 40
- 239000000284 extract Substances 0.000 claims description 33
- 238000013527 convolutional neural network Methods 0.000 claims description 32
- 238000012545 processing Methods 0.000 claims description 22
- 230000002085 persistent effect Effects 0.000 claims description 20
- 230000008569 process Effects 0.000 claims description 16
- 238000012549 training Methods 0.000 claims description 13
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 230000002459 sustained effect Effects 0.000 claims description 2
- 230000014759 maintenance of location Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 abstract description 25
- 238000013500 data storage Methods 0.000 description 49
- 102000008100 Human Serum Albumin Human genes 0.000 description 13
- 108091006905 Human Serum Albumin Proteins 0.000 description 13
- 230000002209 hydrophobic effect Effects 0.000 description 8
- 102000004169 proteins and genes Human genes 0.000 description 7
- 108090000623 proteins and genes Proteins 0.000 description 7
- 238000003062 neural network model Methods 0.000 description 6
- 239000003814 drug Substances 0.000 description 5
- 239000000427 antigen Substances 0.000 description 4
- 102000036639 antigens Human genes 0.000 description 4
- 108091007433 antigens Proteins 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 102100033620 Calponin-1 Human genes 0.000 description 2
- 101000945318 Homo sapiens Calponin-1 Proteins 0.000 description 2
- 150000001413 amino acids Chemical class 0.000 description 2
- 229920001222 biopolymer Polymers 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000007876 drug discovery Methods 0.000 description 2
- 238000000329 molecular dynamics simulation Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 102000009027 Albumins Human genes 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102100033591 Calponin-2 Human genes 0.000 description 1
- 101000945403 Homo sapiens Calponin-2 Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- 230000008275 binding mechanism Effects 0.000 description 1
- 229960002488 dalbavancin Drugs 0.000 description 1
- 108700009376 dalbavancin Proteins 0.000 description 1
- 238000013434 data augmentation Methods 0.000 description 1
- 238000004821 distillation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000009881 electrostatic interaction Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 229940126586 small molecule drug Drugs 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- KGPGQDLTDHGEGT-JCIKCJKQSA-N zeven Chemical compound C=1C([C@@H]2C(=O)N[C@H](C(N[C@H](C3=CC(O)=C4)C(=O)NCCCN(C)C)=O)[C@H](O)C5=CC=C(C(=C5)Cl)OC=5C=C6C=C(C=5O[C@H]5[C@@H]([C@@H](O)[C@H](O)[C@H](O5)C(O)=O)NC(=O)CCCCCCCCC(C)C)OC5=CC=C(C=C5)C[C@@H]5C(=O)N[C@H](C(N[C@H]6C(=O)N2)=O)C=2C(Cl)=C(O)C=C(C=2)OC=2C(O)=CC=C(C=2)[C@H](C(N5)=O)NC)=CC=C(O)C=1C3=C4O[C@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@@H]1O KGPGQDLTDHGEGT-JCIKCJKQSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/30—Drug targeting using structural data; Docking or binding prediction
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B35/00—ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K7/00—Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
- C07K7/04—Linear peptides containing only normal peptide links
- C07K7/08—Linear peptides containing only normal peptide links having 12 to 20 amino acids
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- Organic Chemistry (AREA)
- Medicinal Chemistry (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Genetics & Genomics (AREA)
- Library & Information Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Pharmacology & Pharmacy (AREA)
- Crystallography & Structural Chemistry (AREA)
- Bioethics (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Public Health (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
次に、第8実施形態について説明する。第8実施形態の予測装置は、ペプチドの残基を血漿タンパク質とドッキング計算させたときの残基ドッキング計算のドッキングプロファイルを利用して、予測対象のペプチドの体内持続性を予測する点が第1~第7実施形態と異なる。なお、第8実施形態に係る予測装置の構成のうちの第1~第7実施形態の何れかの予測装置と同様の部分は、同一符号を付して説明を省略する。
12 データ記憶部
14 学習用抽出部
15 学習用調整部
16,716 学習用データ記憶部
18,718 学習部
20,42,720,820 学習済みモデル記憶部
22,722,822 抽出部
23 調整部
24 生成部
30 ドッキング計算用データ記憶部
32 配座生成部
33 選定部
34 予測部
40,721 ドッキング計算部
44,724,826 学習済みモデル予測部
46 計算部
315,715 学習用データ生成部
714 学習用ドッキング計算部
819 ドッキング計算結果記憶部
824 残基特定部
Claims (33)
- 体内持続性の予測対象の環状ペプチドから、前記環状ペプチドに含まれる複数の残基の各々を環状配列の開始点とした場合の特徴を表す予測用特徴ベクトルの各々を抽出する抽出部と、
前記抽出部により抽出された複数の予測用特徴ベクトルを、環状ペプチドの特徴を表す特徴ベクトルからペプチドの体内持続性の予測値を出力するための予め学習された学習済みモデルへ入力することにより、前記予測対象の環状ペプチドの体内持続性の予測値を生成する生成部と、
を含む予測装置。 - 前記生成部は、複数の予測用特徴ベクトルの各々を、前記学習済みモデルへ入力し、前記学習済みモデルから出力された複数の特徴ベクトルの各々に対する前記予測対象の環状ペプチドの体内持続性の予測値の代表値を生成する、
請求項1に記載の予測装置。 - 前記抽出部により抽出された予測用特徴ベクトルの長さが、所定長さとなるように調整する調整部を更に含み、
前記生成部は、前記調整部により長さが調整された複数の予測用特徴ベクトルを、前記学習済みモデルへ入力することにより、前記予測対象の環状ペプチドの体内持続性の予測値を生成する、
請求項1又は請求項2に記載の予測装置。 - 前記調整部は、パディング法又は線形補間法による変換によって、前記予測用特徴ベクトルの長さを調整する、
請求項3に記載の予測装置。 - 複数の学習用の環状ペプチドの各々から、前記学習用の環状ペプチドに含まれる複数の残基の各々を環状配列の開始点とした場合の特徴を表す学習用特徴ベクトルを抽出する学習用抽出部と、
複数の学習用の環状ペプチドの各々について、前記学習用抽出部により抽出された複数の学習用特徴ベクトルと前記学習用の環状ペプチドの体内持続性の正解値との対である学習用データに基づいて、機械学習アルゴリズムを実行することにより、環状ペプチドの特徴を表す特徴ベクトルから環状ペプチドの体内持続性の予測値を出力するための学習済みモデルを生成する学習部と、
を含む学習済みモデルの生成装置。 - 前記学習用抽出部により抽出された、複数の学習用の環状ペプチドの各々に対する学習用特徴ベクトルの各々の長さが、所定長さとなるように調整する学習用調整部を更に含み、
前記学習部は、前記学習用調整部により長さが調整された前記学習用特徴ベクトルと前記学習用の環状ペプチドの体内持続性の正解値との対である学習用データに基づいて、機械学習アルゴリズムを実行することにより、前記学習済みモデルを生成する、
請求項5に記載の学習済みモデルの生成装置。 - 複数の学習用の環状ペプチドの各々から特徴を表す第1学習用特徴ベクトルを抽出する学習用抽出部と、
前記学習用抽出部により抽出された前記第1学習用特徴ベクトルの各々に対して、前記第1学習用特徴ベクトルの要素を巡回シフトさせることにより複数の第2学習用特徴ベクトルを生成し、前記第1学習用特徴ベクトル及び複数の前記第2学習用特徴ベクトルと学習用の環状ペプチドの体内持続性の正解値との対を表す学習用データを生成する学習用データ生成部と、
前記学習用データ生成部により生成された複数の学習用データに基づいて、機械学習アルゴリズムを実行することにより、環状ペプチドの特徴を表す特徴ベクトルから環状ペプチドの体内持続性の予測値を出力するための学習済みモデルを生成する学習部と、
を含む学習済みモデルの生成装置。 - 体内持続性の予測対象の環状ペプチドから特徴を表す予測用特徴ベクトルを抽出する抽出部と、
前記抽出部により抽出された前記予測用特徴ベクトルを、請求項7に記載の学習済みモデルの生成装置によって生成された学習済みモデルへ入力することにより、前記予測対象の環状ペプチドの体内持続性の予測値を生成する生成部と、
を含む予測装置。 - 複数の学習用の環状ペプチドの各々から抽出された特徴を表す学習用特徴ベクトルと複数の学習用の環状ペプチドの体内持続性の正解値との対を表す学習用データに基づいて、前記学習用特徴ベクトルの両端の要素を隣接させる両端隣接層を有する畳み込みニューラルネットワークモデルを用いて機械学習アルゴリズムを実行することにより、環状ペプチドの特徴を表す特徴ベクトルから環状ペプチドの体内持続性の予測値を出力するための学習済み畳み込みニューラルネットワークモデルを生成する学習部、
を含む学習済みモデルの生成装置。 - 体内持続性の予測対象の環状ペプチドから特徴を表す予測用特徴ベクトルを抽出する抽出部と、
前記抽出部により抽出された前記予測用特徴ベクトルを、環状ペプチドの特徴を表す特徴ベクトルの両端の要素を隣接させる両端隣接層を有する学習済み畳み込みニューラルネットワークモデルであって、かつ前記特徴ベクトルから環状ペプチドの体内持続性の予測値を出力するための学習済み畳み込みニューラルネットワークモデルへ入力することにより、前記予測対象の環状ペプチドの体内持続性の予測値を生成する生成部と、
を含む予測装置。 - 体内持続性の予測対象のペプチドが取りうる配座を複数生成する配座生成部と、
所定の選定基準に基づいて、前記配座生成部により生成された複数の配座から、ドッキング計算を行う対象の配座を選定する選定部と、
前記選定部により選定された配座に対応する予測対象のペプチドと血漿タンパク質との間においてドッキング計算を行うことにより、前記予測対象のペプチドの体内持続性を予測する予測部と、
を含む予測装置。 - 前記選定部は、
前記配座を取った場合の前記予測対象のペプチドの側鎖の長さ、
前記配座を取った場合の前記予測対象のペプチドの側鎖の直線度合い、
前記配座を取った場合の前記予測対象のペプチドの側鎖の付根部分の構造、
前記配座を取った場合の前記予測対象のペプチドの側鎖の先端部付近の3次元形状、及び
前記配座を取った場合の前記予測対象のペプチドの側鎖に含まれる荷電原子の有無の物理的条件の少なくとも1つに基づいて、複数の配座からドッキング計算を行う対象の配座を選定する、
請求項11に記載の予測装置。 - 体内持続性の予測対象のペプチドと血漿タンパク質との間のドッキング計算を行うことにより、前記ペプチドの体内持続性を表す第1の体内持続性の予測値を計算するドッキング計算部と、
前記予測対象のペプチドから抽出される特徴ベクトルを、機械学習アルゴリズムにより予め生成された学習済みモデルへ入力することにより、前記ペプチドの体内持続性を表す第2の体内持続性の予測値を生成する学習済みモデル予測部と、
前記ドッキング計算部によって生成された前記第1の体内持続性の予測値と、前記学習済みモデル予測部により生成された前記第2の体内持続性の予測値とを統合することにより、前記ペプチドの体内持続性を計算する計算部と、
を含む予測装置。 - 体内持続性の予測対象のペプチドと血漿タンパク質との間のドッキング計算を行うことにより、前記ペプチドと前記血漿タンパク質との間のドッキングスコアを含むドッキングプロファイルを計算するドッキング計算部と、
前記ドッキング計算部により計算された前記ドッキングプロファイルを含む予測用特徴ベクトルを、機械学習アルゴリズムにより予め生成された学習済みモデルへ入力することにより、前記予測対象のペプチドの体内持続性の予測値を生成する学習済みモデル予測部と、
を含む予測装置。 - 前記ドッキングプロファイルには、前記ペプチドと前記血漿タンパク質のポケット内の各残基との間のドッキングスコア及び前記ペプチドと前記血漿タンパク質との間の全体ドッキングスコアの少なくとも一方が含まれる、
請求項14に記載の予測装置。 - 前記予測対象のペプチドから特徴を表す特徴量を抽出する抽出部を更に含み、
前記学習済みモデル予測部は、前記ドッキングプロファイルと前記抽出部により抽出された前記特徴量とを含む前記予測用特徴ベクトルを、前記学習済みモデルへ入力することにより、前記予測対象のペプチドの体内持続性の予測値を生成する、
請求項14又は請求項15に記載の予測装置。 - 複数の学習用のペプチドと血漿タンパク質との間のドッキング計算を行うことにより、前記学習用のペプチドのドッキングスコアを含むドッキングプロファイルである学習用のドッキングプロファイルを計算する学習用ドッキング計算部と、
複数の前記学習用のペプチドの各々について、前記学習用ドッキング計算部により計算された学習用のドッキングプロファイルを含む学習用特徴ベクトルと前記学習用のペプチドの体内持続性の正解値との対を表す学習用データに基づいて、機械学習アルゴリズムを実行することにより、ペプチドのドッキング計算により得られるドッキングプロファイルを含む特徴ベクトルから、ペプチドの体内持続性の予測値を出力するための学習済みモデルを生成する学習部と、
を含む学習済みモデル生成装置。 - 体内持続性の予測対象のペプチドから残基を抽出する抽出部と、
複数種類の残基の各々についての、前記残基と血漿タンパク質との間のドッキング計算結果を表すドッキングプロファイルが記憶された記憶部から、前記抽出部により抽出された前記残基に対応するドッキングプロファイルを読み出し、読み出した前記予測対象の残基のドッキングプロファイルを含む特徴ベクトルを、機械学習アルゴリズムにより予め生成された学習済みモデルへ入力することにより、前記予測対象のペプチドの体内持続性を予測する学習済みモデル予測部と、
を含む予測装置。 - 体内持続性の予測対象の環状ペプチドから、前記環状ペプチドに含まれる複数の残基の各々を環状配列の開始点とした場合の特徴を表す予測用特徴ベクトルの各々を抽出し、
抽出された複数の予測用特徴ベクトルを、環状ペプチドの特徴を表す特徴ベクトルからペプチドの体内持続性の予測値を出力するための予め学習された学習済みモデルへ入力することにより、前記予測対象の環状ペプチドの体内持続性の予測値を生成する、
処理をコンピュータが実行する予測方法。 - 抽出された前記予測用特徴ベクトルの長さが、所定長さとなるように調整し、
長さが調整された前記予測用特徴ベクトルを、前記学習済みモデルへ入力することにより、前記予測対象の環状ペプチドの体内持続性の予測値を生成する、
請求項19に記載の予測方法。 - 複数の学習用の環状ペプチドの各々から、前記学習用の環状ペプチドに含まれる複数の残基の各々を環状配列の開始点とした場合の特徴を表す学習用特徴ベクトルを抽出し、
複数の学習用の環状ペプチドの各々について、抽出された複数の学習用特徴ベクトルと前記学習用の環状ペプチドの体内持続性の正解値との対である学習用データに基づいて、機械学習アルゴリズムを実行することにより、環状ペプチドの特徴を表す特徴ベクトルから環状ペプチドの体内持続性の予測値を出力するための学習済みモデルを生成する、
処理をコンピュータが実行する学習済みモデルの生成方法。 - 抽出された、複数の学習用の環状ペプチドの各々に対する学習用特徴ベクトルの各々の長さが、所定長さとなるように調整し、
長さが調整された前記学習用特徴ベクトルと前記学習用の環状ペプチドの体内持続性の正解値との対である学習用データに基づいて、機械学習アルゴリズムを実行することにより、前記学習済みモデルを生成する、
請求項21に記載の学習済みモデルの生成方法。 - 複数の学習用の環状ペプチドの各々から特徴を表す第1学習用特徴ベクトルを抽出し、
抽出された前記第1学習用特徴ベクトルの各々に対して、前記第1学習用特徴ベクトルの要素を巡回シフトさせることにより複数の第2学習用特徴ベクトルを生成し、前記第1学習用特徴ベクトル及び複数の前記第2学習用特徴ベクトルと学習用の環状ペプチドの体内持続性の正解値との対を表す学習用データを生成し、
生成された複数の学習用データに基づいて、機械学習アルゴリズムを実行することにより、環状ペプチドの特徴を表す特徴ベクトルから環状ペプチドの体内持続性の予測値を出力するための学習済みモデルを生成する、
処理をコンピュータが実行する学習済みモデルの生成方法。 - 体内持続性の予測対象の環状ペプチドから特徴を表す予測用特徴ベクトルを抽出し、
抽出された前記予測用特徴ベクトルを、請求項23に記載の学習済みモデルの生成方法によって生成された学習済みモデルへ入力することにより、前記予測対象のペプチドの体内持続性の予測値を生成する、
処理をコンピュータが実行する予測方法。 - 複数の学習用の環状ペプチドの各々から抽出された特徴を表す学習用特徴ベクトルと複数の学習用の環状ペプチドの体内持続性の正解値との対を表す学習用データに基づいて、前記学習用特徴ベクトルの両端の要素を隣接させる両端隣接層を有する畳み込みニューラルネットワークモデルを用いて機械学習アルゴリズムを実行することにより、環状ペプチドの特徴を表す特徴ベクトルから環状ペプチドの体内持続性の予測値を出力するための学習済み畳み込みニューラルネットワークモデルを生成する、
処理をコンピュータが実行する学習済みモデルの生成方法。 - 体内持続性の予測対象の環状ペプチドから特徴を表す予測用特徴ベクトルを抽出し、
抽出された前記予測用特徴ベクトルを、環状ペプチドの特徴を表す特徴ベクトルの両端の要素を隣接させる両端隣接層を有する学習済み畳み込みニューラルネットワークモデルであって、かつ前記特徴ベクトルから環状ペプチドの体内持続性の予測値を出力するための学習済み畳み込みニューラルネットワークモデルへ入力することにより、前記予測対象の環状ペプチドの体内持続性の予測値を生成する、
処理をコンピュータが実行する予測方法。 - 体内持続性の予測対象のペプチドが取りうる配座を複数生成し、
所定の選定基準に基づいて、生成された複数の配座から、ドッキング計算を行う対象の配座を選定し、
選定された配座に対応する予測対象のペプチドと血漿タンパク質との間においてドッキング計算を行うことにより、前記予測対象のペプチドの体内持続性を予測する、
処理をコンピュータが実行する予測方法。 - 体内持続性の予測対象のペプチドと血漿タンパク質との間のドッキング計算を行うことにより、前記ペプチドの体内持続性を表す第1の体内持続性の予測値を計算し、
前記予測対象のペプチドから抽出される特徴ベクトルを、機械学習アルゴリズムにより予め生成された学習済みモデルへ入力することにより、前記ペプチドの体内持続性を表す第2の体内持続性の予測値を生成し、
生成された前記第1の体内持続性の予測値と、生成された前記第2の体内持続性の予測値とを統合することにより、前記ペプチドの体内持続性を計算する、
処理をコンピュータが実行する予測方法。 - 体内持続性の予測対象のペプチドと血漿タンパク質との間のドッキング計算を行うことにより、前記ペプチドと前記血漿タンパク質との間のドッキングスコアを含むドッキングプロファイルを計算し、
計算された前記ドッキングプロファイルを含む予測用特徴ベクトルを、機械学習アルゴリズムにより予め生成された学習済みモデルへ入力することにより、前記予測対象のペプチドの体内持続性の予測値を生成する、
処理をコンピュータが実行する予測方法。 - 複数の学習用のペプチドと血漿タンパク質との間のドッキング計算を行うことにより、前記学習用のペプチドのドッキングスコアを含むドッキングプロファイルである学習用のドッキングプロファイルを計算し、
複数の前記学習用のペプチドの各々について、計算された学習用のドッキングプロファイルを含む学習用特徴ベクトルと前記学習用のペプチドの体内持続性の正解値との対を表す学習用データに基づいて、機械学習アルゴリズムを実行することにより、ペプチドのドッキング計算により得られるドッキングプロファイルを含む特徴ベクトルから、ペプチドの体内持続性の予測値を出力するための学習済みモデルを生成する、
処理をコンピュータが実行する学習済みモデルの生成方法。 - 体内持続性の予測対象のペプチドから残基を抽出し、
複数種類の残基の各々についての、前記残基と血漿タンパク質との間のドッキング計算結果を表すドッキングプロファイルが記憶された記憶部から、抽出された前記残基に対応するドッキングプロファイルを読み出し、読み出した前記予測対象の残基のドッキングプロファイルを含む特徴ベクトルを、機械学習アルゴリズムにより予め生成された学習済みモデルへ入力することにより、前記予測対象のペプチドの体内持続性を予測する、
処理をコンピュータが実行する予測方法。 - 請求項19、請求項20、請求項24、請求項26、請求項27、請求項28、請求項29、及び請求項31の何れか1項に記載の予測方法の処理をコンピュータに実行させるための予測プログラム。
- 請求項21、請求項22、請求項23、請求項25、及び請求項30の何れか1項に記載の学習済みモデルの生成方法の処理をコンピュータに実行させるための学習済みモデルの生成プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021035648A JP7057004B1 (ja) | 2021-03-05 | 2021-03-05 | 予測装置、学習済みモデルの生成装置、予測方法、学習済みモデルの生成方法、予測プログラム、及び学習済みモデルの生成プログラム |
US17/577,527 US20220284987A1 (en) | 2021-03-05 | 2022-01-18 | Prediction device, trained model generation device, prediction method, and trained model generation method |
EP22159146.4A EP4102507A1 (en) | 2021-03-05 | 2022-02-28 | Prediction device, trained model generation device, prediction method, and trained model generation method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021035648A JP7057004B1 (ja) | 2021-03-05 | 2021-03-05 | 予測装置、学習済みモデルの生成装置、予測方法、学習済みモデルの生成方法、予測プログラム、及び学習済みモデルの生成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP7057004B1 true JP7057004B1 (ja) | 2022-04-19 |
JP2022135688A JP2022135688A (ja) | 2022-09-15 |
Family
ID=80595410
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021035648A Active JP7057004B1 (ja) | 2021-03-05 | 2021-03-05 | 予測装置、学習済みモデルの生成装置、予測方法、学習済みモデルの生成方法、予測プログラム、及び学習済みモデルの生成プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20220284987A1 (ja) |
EP (1) | EP4102507A1 (ja) |
JP (1) | JP7057004B1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11620441B1 (en) * | 2022-02-28 | 2023-04-04 | Clearbrief, Inc. | System, method, and computer program product for inserting citations into a textual document |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010225120A (ja) | 2009-03-25 | 2010-10-07 | Nec Corp | 事例検索システム、事例検索方法および事例検索プログラム |
US20120265513A1 (en) | 2011-04-08 | 2012-10-18 | Jianwen Fang | Methods and systems for designing stable proteins |
US20150015569A1 (en) | 2013-07-15 | 2015-01-15 | Samsung Electronics Co., Ltd. | Method and apparatus for processing depth image |
US20210027862A1 (en) | 2018-03-30 | 2021-01-28 | Board Of Trustees Of Michigan State University | Systems and methods for drug design and discovery comprising applications of machine learning with differential geometric modeling |
CN112420123A (zh) | 2020-11-30 | 2021-02-26 | 上海商汤智能科技有限公司 | 自监督学习模型的训练方法和装置、设备以及存储介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2002354462A1 (en) | 2001-12-10 | 2003-07-09 | Fujitsu Limited | Apparatus for predicting stereostructure of protein and prediction method |
JP6558754B2 (ja) | 2015-08-07 | 2019-08-14 | 富士通株式会社 | 情報処理装置、指標次元抽出方法、および指標次元抽出プログラム |
US10258590B2 (en) | 2015-10-14 | 2019-04-16 | Alcresta Therapeutics, Inc. | Enteral feeding device and related methods of use |
BR112019021782A2 (pt) | 2017-04-19 | 2020-08-18 | Gritstone Oncology, Inc. | identificação, fabricação e uso de neoantígenos |
US11521712B2 (en) * | 2017-05-19 | 2022-12-06 | Accutar Biotechnology Inc. | Computational method for classifying and predicting ligand docking conformations |
US20200105377A1 (en) | 2017-06-09 | 2020-04-02 | Gritstone Oncology, Inc. | Neoantigen identification, manufacture, and use |
US12100485B2 (en) * | 2018-03-05 | 2024-09-24 | The Board Of Trustees Of The Leland Stanford Junior University | Machine learning and molecular simulation based methods for enhancing binding and activity prediction |
JP2020035134A (ja) * | 2018-08-29 | 2020-03-05 | 株式会社豊田中央研究所 | 物性予測装置、物性予測モデル学習装置、及びプログラム |
-
2021
- 2021-03-05 JP JP2021035648A patent/JP7057004B1/ja active Active
-
2022
- 2022-01-18 US US17/577,527 patent/US20220284987A1/en active Pending
- 2022-02-28 EP EP22159146.4A patent/EP4102507A1/en not_active Withdrawn
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010225120A (ja) | 2009-03-25 | 2010-10-07 | Nec Corp | 事例検索システム、事例検索方法および事例検索プログラム |
US20120265513A1 (en) | 2011-04-08 | 2012-10-18 | Jianwen Fang | Methods and systems for designing stable proteins |
US20150015569A1 (en) | 2013-07-15 | 2015-01-15 | Samsung Electronics Co., Ltd. | Method and apparatus for processing depth image |
US20210027862A1 (en) | 2018-03-30 | 2021-01-28 | Board Of Trustees Of Michigan State University | Systems and methods for drug design and discovery comprising applications of machine learning with differential geometric modeling |
CN112420123A (zh) | 2020-11-30 | 2021-02-26 | 上海商汤智能科技有限公司 | 自监督学习模型的训练方法和装置、设备以及存储介质 |
Non-Patent Citations (1)
Title |
---|
李 佳男,機械学習を用いた環状ペプチドの体内安定性予測手法の改良,情報処理学会 研究報告 バイオ情報学(BIO) 2019-BIO-58 [online] ,日本,情報処理学会,2019年06月10日,p.1-8,ISSN:2188-8590 |
Also Published As
Publication number | Publication date |
---|---|
US20220284987A1 (en) | 2022-09-08 |
EP4102507A1 (en) | 2022-12-14 |
JP2022135688A (ja) | 2022-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
He et al. | A survey on deep learning in DNA/RNA motif mining | |
US20230281465A1 (en) | Systems and Methods for Spatial Graph Convolutions with Applications to Drug Discovery and Molecular Simulation | |
Ezzat et al. | Computational prediction of drug–target interactions using chemogenomic approaches: an empirical survey | |
Hashemifar et al. | Predicting protein–protein interactions through sequence-based deep learning | |
Zhang et al. | AutoDock CrankPep: combining folding and docking to predict protein–peptide complexes | |
Gao et al. | Incorporation of solvent effect into multi-objective evolutionary algorithm for improved protein structure prediction | |
Li et al. | RNA3DCNN: Local and global quality assessments of RNA 3D structures using 3D deep convolutional neural networks | |
Pan et al. | Robust prediction of B-factor profile from sequence using two-stage SVR based on random forest feature selection | |
Xiong et al. | A deep learning framework for improving long-range residue–residue contact prediction using a hierarchical strategy | |
JP7057004B1 (ja) | 予測装置、学習済みモデルの生成装置、予測方法、学習済みモデルの生成方法、予測プログラム、及び学習済みモデルの生成プログラム | |
CN116235191A (zh) | 选择用于训练模型的训练数据集 | |
Yu et al. | Disulfide connectivity prediction based on modelled protein 3D structural information and random forest regression | |
Yao et al. | Efficient algorithms to explore conformation spaces of flexible protein loops | |
Guo et al. | TRScore: a 3D RepVGG-based scoring method for ranking protein docking models | |
Taylor et al. | Molecular models for the core components of the flagellar type-III secretion complex | |
JP7057003B1 (ja) | 予測装置、学習済みモデルの生成装置、予測方法、学習済みモデルの生成方法、予測プログラム、及び学習済みモデルの生成プログラム | |
Abbas et al. | Bioinformatics and management science: Some common tools and techniques | |
Zhou et al. | Prediction of one-dimensional structural properties of proteins by integrated neural networks | |
Nugent | De novo membrane protein structure prediction | |
Li et al. | A machine-learning approach for predicting palmitoylation sites from integrated sequence-based features | |
Poluri et al. | Prediction, analysis, visualization, and storage of protein–protein interactions using computational approaches | |
Schelhorn et al. | An integrative approach for predicting interactions of protein regions | |
WO2019198408A1 (ja) | 学習装置、学習方法、及び学習プログラム | |
Citarella et al. | Gene Ontology Terms Visualization with Dynamic Distance-Graph and Similarity Measures (S). | |
VIART et al. | PickPocket: Pocket binding prediction for specific ligands family using neural networks. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20210315 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210810 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20210810 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220124 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220315 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220331 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7057004 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |