JP7057003B1 - 予測装置、学習済みモデルの生成装置、予測方法、学習済みモデルの生成方法、予測プログラム、及び学習済みモデルの生成プログラム - Google Patents
予測装置、学習済みモデルの生成装置、予測方法、学習済みモデルの生成方法、予測プログラム、及び学習済みモデルの生成プログラム Download PDFInfo
- Publication number
- JP7057003B1 JP7057003B1 JP2021031234A JP2021031234A JP7057003B1 JP 7057003 B1 JP7057003 B1 JP 7057003B1 JP 2021031234 A JP2021031234 A JP 2021031234A JP 2021031234 A JP2021031234 A JP 2021031234A JP 7057003 B1 JP7057003 B1 JP 7057003B1
- Authority
- JP
- Japan
- Prior art keywords
- peptide
- membrane
- learning
- region
- representing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/30—Drug targeting using structural data; Docking or binding prediction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
- G16B5/20—Probabilistic models
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/30—Prediction of properties of chemical compounds, compositions or mixtures
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Evolutionary Biology (AREA)
- Biotechnology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Chemical & Material Sciences (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Public Health (AREA)
- Bioethics (AREA)
- Crystallography & Structural Chemistry (AREA)
- Biomedical Technology (AREA)
- Probability & Statistics with Applications (AREA)
- Physiology (AREA)
- Medicinal Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
Description
12 データ記憶部
14 学習用抽出部
15 学習用調整部
16,716 学習用データ記憶部
18,718 学習部
20,42,720 学習済みモデル記憶部
22 抽出部
23 調整部
24 生成部
31 シミュレーション用データ記憶部
32 設定部
33,40 シミュレーション部
34 エネルギー計算部
35 拡散係数計算部
36 予測部
44 学習済みモデル予測部
46 計算部
315,715 学習用データ生成部
741 シミュレーション結果記憶部
Claims (31)
- 膜透過性の予測対象の環状ペプチドから、前記環状ペプチドに含まれる複数の残基の各々を環状配列の開始点とした場合の特徴を表す予測用特徴ベクトルの各々を抽出する抽出部と、
前記抽出部により抽出された複数の予測用特徴ベクトルを、環状ペプチドの特徴を表す特徴ベクトルからペプチドの膜透過性の予測値を出力するための予め学習された学習済みモデルへ入力することにより、前記予測対象の環状ペプチドの膜透過性の予測値を生成する生成部と、
を含む予測装置。 - 前記生成部は、複数の予測用特徴ベクトルの各々を、前記学習済みモデルへ入力し、前記学習済みモデルから出力された複数の特徴ベクトルの各々に対する前記予測対象の環状ペプチドの膜透過性の予測値の代表値を生成する、
請求項1に記載の予測装置。 - 前記抽出部により抽出された予測用特徴ベクトルの長さが、所定長さとなるように調整する調整部を更に含み、
前記生成部は、前記調整部により長さが調整された複数の予測用特徴ベクトルを、前記学習済みモデルへ入力することにより、前記予測対象の環状ペプチドの膜透過性の予測値を生成する、
請求項1又は請求項2に記載の予測装置。 - 前記調整部は、パディング法又は線形補間法による変換によって、前記予測用特徴ベクトルの長さを調整する、
請求項3に記載の予測装置。 - 複数の学習用の環状ペプチドの各々から、前記学習用の環状ペプチドに含まれる複数の残基の各々を環状配列の開始点とした場合の特徴を表す学習用特徴ベクトルを抽出する学習用抽出部と、
複数の学習用の環状ペプチドの各々について、前記学習用抽出部により抽出された複数の学習用特徴ベクトルと前記学習用の環状ペプチドの膜透過性の正解値との対である学習用データに基づいて、機械学習アルゴリズムを実行することにより、環状ペプチドの特徴を表す特徴ベクトルから環状ペプチドの膜透過性の予測値を出力するための学習済みモデルを生成する学習部と、
を含む学習済みモデルの生成装置。 - 前記学習用抽出部により抽出された、複数の学習用の環状ペプチドの各々に対する学習用特徴ベクトルの各々の長さが、所定長さとなるように調整する学習用調整部を更に含み、
前記学習部は、前記学習用調整部により長さが調整された前記学習用特徴ベクトルと前記学習用の環状ペプチドの膜透過性の正解値との対である学習用データに基づいて、機械学習アルゴリズムを実行することにより、前記学習済みモデルを生成する、
請求項5に記載の学習済みモデルの生成装置。 - エネルギー計算部、拡散係数計算部、及び予測部を含み、細胞膜を表す膜領域と、前記膜領域の一方側と隣接する溶媒を表す第1溶媒領域と、前記膜領域の他方側と隣接する溶媒を表す第2溶媒領域とを透過する際のペプチドの膜透過性の予測値を計算する予測装置であって、
前記エネルギー計算部が、前記第1溶媒領域と前記膜領域と前記第2溶媒領域とを透過する際のペプチドのシミュレーション結果に基づいて、前記第1溶媒領域と前記膜領域と前記第2溶媒領域とを含む領域における前記ペプチドの位置を表し、かつ前記膜領域の膜表面に対する鉛直軸方向における前記ペプチドの位置を表す反応座標zの各々において、前記ペプチドの自由エネルギーG(z)を計算すると共に、反応座標zの各々において計算された前記ペプチドの自由エネルギーG(z)のうちの最小値Gminと、反応座標zにおける前記ペプチドの自由エネルギーG(z)との間の差分ΔG(z)を反応座標zの各々において計算し、
前記拡散係数計算部が、反応座標zの各々における局所的な拡散係数D(z)を計算し、
前記予測部が、反応座標zの各々において、前記エネルギー計算部によって計算された前記差分ΔG(z)と前記拡散係数計算部によって計算された局所的な拡散係数D(z)とに基づいて、前記ペプチドの反応座標zにおける局所的な抵抗を表す値R(z)を計算し、反応座標zの各々において計算された前記局所的な抵抗を表す値R(z)に基づいて、前記ペプチドの膜透過性の予測値を計算する、
予測装置。 - 前記予測部は、反応座標zの各々において、アンブレラサンプリングを実行する際のペプチドの重心の位置の分散を表す値var(z)と、各時刻tにおける前記重心の位置の自己相関を表す値Czz(t)とに基づいて、前記局所的な拡散係数D(z)を計算する、
請求項7に記載の予測装置。 - 設定部、シミュレーション部、及び予測部を含み、細胞膜を表す膜領域と、前記膜領域の一方側と隣接する溶媒を表す第1溶媒領域と、前記膜領域の他方側と隣接する溶媒を表す第2溶媒領域とを透過する際のペプチドの動態をシミュレーションする予測装置であって、
前記設定部が、前記第1溶媒領域から、前記第1溶媒領域と前記膜領域との境界よりも膜中心側に位置する脂質分子の接合点付近に至る区間での前記ペプチドの透過をシミュレーションする際の、前記第1溶媒領域中の物質の比誘電率に応じた前記ペプチドの初期配座を設定し、
前記接合点付近から、前記膜領域の中心領域を表す膜中心部の領域を越えるまでの区間での前記ペプチドの透過をシミュレーションする際の、前記膜領域中の物質の比誘電率に応じた前記ペプチドの初期配座を設定し、
前記シミュレーション部が、前記設定部により設定された前記ペプチドの初期配座に応じて、前記ペプチドの動態をシミュレーションし、
前記設定部が、前記シミュレーション部によって得られたシミュレーションの結果に基づいて、アンブレラサンプリング手法における各領域の一連の初期配座を設定し、
前記シミュレーション部が、前記設定部によって設定された各領域の一連の初期配座に基づいて、アンブレラサンプリング手法に従って前記ペプチドの動態をシミュレーションし、
前記予測部が、前記シミュレーション部によって得られた、アンブレラサンプリング手法に基づくシミュレーションの結果に基づいて、前記ペプチドの膜透過性を予測する、
予測装置。 - 設定部、シミュレーション部、及び予測部を含み、細胞膜を表す膜領域と、前記膜領域の一方側と隣接する溶媒を表す第1溶媒領域と、前記膜領域の他方側と隣接する溶媒を表す第2溶媒領域とを透過する際のペプチドの動態をシミュレーションする予測装置であって、
前記設定部が、前記ペプチドの透過をアンブレラサンプリング手法によってシミュレーションする際に、前記膜領域の中心領域を表す膜中心部に近い領域ほど前記ペプチドの拘束位置の間隔が細かくなるように設定し、
前記シミュレーション部が、前記設定部により設定された前記拘束位置の間隔に応じて、アンブレラサンプリング手法によって前記ペプチドの動態をシミュレーションし、
前記予測部が、前記シミュレーション部によって得られたシミュレーションの結果に基づいて、前記ペプチドの膜透過性を予測する、
予測装置。 - 細胞膜を表す膜領域と、前記膜領域の一方側と隣接する溶媒を表す第1溶媒領域と、前記膜領域の他方側と隣接する溶媒を表す第2溶媒領域とを透過するペプチドの動態をシミュレーションすることにより、前記ペプチドの膜透過性を表す第1の膜透過性値を生成するシミュレーション部と、
前記ペプチドから特徴を表す予測用特徴ベクトルを抽出し、前記予測用特徴ベクトルを、予め機械学習された学習済みモデルへ入力することにより、前記ペプチドの膜透過性を表す第2の膜透過性値を生成する学習済みモデル予測部と、
前記シミュレーション部によって生成された前記第1の膜透過性値と、前記学習済みモデル予測部により生成された前記第2の膜透過性値とを統合することにより、前記ペプチドの膜透過性の予測値を計算する計算部と、
を含む予測装置。 - 細胞膜を表す膜領域と、前記膜領域の一方側と隣接する溶媒を表す第1溶媒領域と、前記膜領域の他方側と隣接する溶媒を表す第2溶媒領域とを透過するペプチドの動態をシミュレーションすることにより、前記ペプチドの膜透過性を表す膜透過性の予測値を生成するシミュレーション部と、
前記シミュレーション部によって得られたペプチドの膜透過性の予測値と、各箇所における前記ペプチドの立体配座から得られる3D記述子から生成される特徴ベクトルとの対を表すシミュレーション由来学習用データを生成する学習用データ生成部と、
前記学習用データ生成部により生成された前記シミュレーション由来学習用データを含む学習用データに基づいて、機械学習アルゴリズムを実行することにより、前記特徴ベクトルから前記膜透過性の予測値を出力する学習済みモデルを生成する学習部と、
を含む学習済みモデルの生成装置。 - 複数の学習用の環状ペプチドの各々から特徴を表す第1学習用特徴ベクトルを抽出する学習用抽出部と、
前記学習用抽出部により抽出された前記第1学習用特徴ベクトルの各々に対して、前記第1学習用特徴ベクトルの要素を巡回シフトさせることにより複数の第2学習用特徴ベクトルを生成し、前記第1学習用特徴ベクトル及び複数の前記第2学習用特徴ベクトルと学習用の環状ペプチドの膜透過性の正解値との対を表す学習用データを生成する学習用データ生成部と、
前記学習用データ生成部により生成された複数の学習用データに基づいて、機械学習アルゴリズムを実行することにより、環状ペプチドの特徴を表す特徴ベクトルから環状ペプチドの膜透過性の予測値を出力するための学習済みモデルを生成する学習部と、
を含む学習済みモデルの生成装置。 - 膜透過性の予測対象の環状ペプチドから特徴を表す予測用特徴ベクトルを抽出する抽出部と、
前記抽出部により抽出された前記予測用特徴ベクトルを、請求項13に記載の学習済みモデルの生成装置によって生成された学習済みモデルへ入力することにより、前記予測対象の環状ペプチドの膜透過性の予測値を生成する生成部と、
を含む予測装置。 - 複数の学習用の環状ペプチドの各々から抽出された特徴を表す学習用特徴ベクトルと複数の学習用の環状ペプチドの膜透過性の正解値との対を表す学習用データに基づいて、前記学習用特徴ベクトルの両端の要素を隣接させる両端隣接層を有する畳み込みニューラルネットワークモデルを用いて機械学習アルゴリズムを実行することにより、環状ペプチドの特徴を表す特徴ベクトルから環状ペプチドの膜透過性の予測値を出力するための学習済み畳み込みニューラルネットワークモデルを生成する学習部と、
を含む学習済みモデルの生成装置。 - 膜透過性の予測対象の環状ペプチドから特徴を表す予測用特徴ベクトルを抽出する抽出部と、
前記抽出部により抽出された前記予測用特徴ベクトルを、環状ペプチドの特徴を表す特徴ベクトルの両端の要素を隣接させる両端隣接層を有する学習済み畳み込みニューラルネットワークモデルであって、かつ前記特徴ベクトルから環状ペプチドの膜透過性の予測値を出力するための学習済み畳み込みニューラルネットワークモデルへ入力することにより、前記予測対象の環状ペプチドの膜透過性の予測値を生成する生成部と、
を含む予測装置。 - 膜透過性の予測対象の環状ペプチドから、前記環状ペプチドに含まれる複数の残基の各々を環状配列の開始点とした場合の特徴を表す予測用特徴ベクトルの各々を抽出し、
抽出された複数の予測用特徴ベクトルを、環状ペプチドの特徴を表す特徴ベクトルからペプチドの膜透過性の予測値を出力するための予め学習された学習済みモデルへ入力することにより、前記予測対象の環状ペプチドの膜透過性の予測値を生成する、
処理をコンピュータが実行する予測方法。 - 抽出された前記予測用特徴ベクトルの長さが、所定長さとなるように調整し、
長さが調整された前記予測用特徴ベクトルを、前記学習済みモデルへ入力することにより、前記予測対象の環状ペプチドの膜透過性の予測値を生成する、
請求項17に記載の予測方法。 - 複数の学習用の環状ペプチドの各々から、前記学習用の環状ペプチドに含まれる複数の残基の各々を環状配列の開始点とした場合の特徴を表す学習用特徴ベクトルを抽出し、
複数の学習用の環状ペプチドの各々について、抽出された複数の学習用特徴ベクトルと前記学習用の環状ペプチドの膜透過性の正解値との対である学習用データに基づいて、機械学習アルゴリズムを実行することにより、環状ペプチドの特徴を表す特徴ベクトルから環状ペプチドの膜透過性の予測値を出力するための学習済みモデルを生成する、
処理をコンピュータが実行する学習済みモデルの生成方法。 - 抽出された、複数の学習用の環状ペプチドの各々に対する学習用特徴ベクトルの各々の長さが、所定長さとなるように調整し、
長さが調整された前記学習用特徴ベクトルと前記学習用の環状ペプチドの膜透過性の正解値との対である学習用データに基づいて、機械学習アルゴリズムを実行することにより、前記学習済みモデルを生成する、
請求項19に記載の学習済みモデルの生成方法。 - 細胞膜を表す膜領域と、前記膜領域の一方側と隣接する溶媒を表す第1溶媒領域と、前記膜領域の他方側と隣接する溶媒を表す第2溶媒領域とを透過する際のペプチドの膜透過性の予測値を計算する予測方法であって、
前記第1溶媒領域と前記膜領域と前記第2溶媒領域とを透過する際のペプチドのシミュレーション結果に基づいて、前記第1溶媒領域と前記膜領域と前記第2溶媒領域とを含む領域における前記ペプチドの位置を表し、かつ前記膜領域の膜表面に対する鉛直軸方向における前記ペプチドの位置を表す反応座標zの各々において、前記ペプチドの自由エネルギーG(z)を計算すると共に、反応座標zの各々において計算された前記ペプチドの自由エネルギーG(z)のうちの最小値Gminと、反応座標zにおける前記ペプチドの自由エネルギーG(z)との間の差分ΔG(z)を反応座標zの各々において計算し、
反応座標zの各々における局所的な拡散係数D(z)を計算し、
反応座標zの各々において、計算された前記差分ΔG(z)と計算された局所的な拡散係数D(z)とに基づいて、前記ペプチドの反応座標zにおける局所的な抵抗を表す値R(z)を計算し、反応座標zの各々において計算された前記局所的な抵抗を表す値R(z)に基づいて、前記ペプチドの膜透過性の予測値を計算する、
処理をコンピュータが実行する予測方法。 - 細胞膜を表す膜領域と、前記膜領域の一方側と隣接する溶媒を表す第1溶媒領域と、前記膜領域の他方側と隣接する溶媒を表す第2溶媒領域とを透過する際のペプチドの動態をシミュレーションする予測方法であって、
前記第1溶媒領域から、前記第1溶媒領域と前記膜領域との境界よりも膜中心側に位置する脂質分子の接合点付近に至る区間での前記ペプチドの透過をシミュレーションする際の、前記第1溶媒領域中の物質の比誘電率に応じた前記ペプチドの初期配座を設定し、
前記接合点付近から、前記膜領域の中心領域を表す膜中心部の領域を越えるまでの区間での前記ペプチドの透過をシミュレーションする際の、前記膜領域中の物質の比誘電率に応じた前記ペプチドの初期配座を設定し、
設定された前記ペプチドの初期配座に応じて、前記ペプチドの動態をシミュレーションし、
得られたシミュレーションの結果に基づいて、アンブレラサンプリング手法における各領域の一連の初期配座を設定し、
設定された各領域の一連の初期配座に基づいて、アンブレラサンプリング手法に従って前記ペプチドの動態をシミュレーションし、
アンブレラサンプリング手法に基づくシミュレーションの結果に基づいて、前記ペプチドの膜透過性を予測する、
処理をコンピュータが実行する予測方法。 - 細胞膜を表す膜領域と、前記膜領域の一方側と隣接する溶媒を表す第1溶媒領域と、前記膜領域の他方側と隣接する溶媒を表す第2溶媒領域とを透過する際のペプチドの動態をシミュレーションする予測方法であって、
前記ペプチドの透過をアンブレラサンプリング手法によってシミュレーションする際に、前記膜領域の中心領域を表す膜中心部に近い領域ほど前記ペプチドの拘束位置の間隔が細かくなるように設定し、
設定された前記拘束位置の間隔に応じて、アンブレラサンプリング手法によって前記ペプチドの動態をシミュレーションし、
シミュレーションの結果に基づいて、前記ペプチドの膜透過性を予測する、
処理をコンピュータが実行する予測方法。 - 細胞膜を表す膜領域と、前記膜領域の一方側と隣接する溶媒を表す第1溶媒領域と、前記膜領域の他方側と隣接する溶媒を表す第2溶媒領域とを透過するペプチドの動態をシミュレーションすることにより、前記ペプチドの膜透過性を表す第1の膜透過性値を生成し、
前記ペプチドから特徴を表す予測用特徴ベクトルを抽出し、前記予測用特徴ベクトルを、予め機械学習された学習済みモデルへ入力することにより、前記ペプチドの膜透過性を表す第2の膜透過性値を生成し、
生成された前記第1の膜透過性値と、生成された前記第2の膜透過性値とを統合することにより、前記ペプチドの膜透過性の予測値を計算する、
処理をコンピュータが実行する予測方法。 - 細胞膜を表す膜領域と、前記膜領域の一方側と隣接する溶媒を表す第1溶媒領域と、前記膜領域の他方側と隣接する溶媒を表す第2溶媒領域とを透過するペプチドの動態をシミュレーションすることにより、前記ペプチドの膜透過性を表す膜透過性の予測値を生成し、
得られたペプチドの膜透過性の予測値と、各箇所における前記ペプチドの立体配座から得られる3D記述子から生成される特徴ベクトルとの対を表すシミュレーション由来学習用データを生成し、
生成された前記シミュレーション由来学習用データを含む学習用データに基づいて、機械学習アルゴリズムを実行することにより、前記特徴ベクトルから前記膜透過性の予測値を出力する学習済みモデルを生成する、
処理をコンピュータが実行する学習済みモデルの生成方法。 - 複数の学習用の環状ペプチドの各々から特徴を表す第1学習用特徴ベクトルを抽出し、
抽出された前記第1学習用特徴ベクトルの各々に対して、前記第1学習用特徴ベクトルの要素を巡回シフトさせることにより複数の第2学習用特徴ベクトルを生成し、前記第1学習用特徴ベクトル及び複数の前記第2学習用特徴ベクトルと学習用の環状ペプチドの膜透過性の正解値との対を表す学習用データを生成し、
生成された複数の学習用データに基づいて、機械学習アルゴリズムを実行することにより、環状ペプチドの特徴を表す特徴ベクトルから環状ペプチドの膜透過性の予測値を出力するための学習済みモデルを生成する、
処理をコンピュータが実行する学習済みモデルの生成方法。 - 膜透過性の予測対象の環状ペプチドから特徴を表す予測用特徴ベクトルを抽出する抽出部と、
前記抽出部により抽出された前記予測用特徴ベクトルを、請求項26に記載の学習済みモデルの生成方法によって生成された学習済みモデルへ入力することにより、前記予測対象の環状ペプチドの膜透過性の予測値を生成する、
処理をコンピュータが実行する予測方法。 - 複数の学習用の環状ペプチドの各々から抽出された特徴を表す学習用特徴ベクトルと複数の学習用の環状ペプチドの膜透過性の正解値との対を表す学習用データに基づいて、前記学習用特徴ベクトルの両端の要素を隣接させる両端隣接層を有する畳み込みニューラルネットワークモデルを用いて機械学習アルゴリズムを実行することにより、環状ペプチドの特徴を表す特徴ベクトルから環状ペプチドの膜透過性の予測値を出力するための学習済み畳み込みニューラルネットワークモデルを生成する、
処理をコンピュータが実行する学習済みモデルの生成方法。 - 膜透過性の予測対象の環状ペプチドから特徴を表す予測用特徴ベクトルを抽出し、
抽出された前記予測用特徴ベクトルを、環状ペプチドの特徴を表す特徴ベクトルの両端の要素を隣接させる両端隣接層を有する学習済み畳み込みニューラルネットワークモデルであって、かつ前記特徴ベクトルから環状ペプチドの膜透過性の予測値を出力するための学習済み畳み込みニューラルネットワークモデルへ入力することにより、前記予測対象の環状ペプチドの膜透過性の予測値を生成する、
処理をコンピュータが実行する予測方法。 - 請求項17、請求項18、請求項21、請求項22、請求項23、請求項24、請求項27、及び請求項29の何れか1項に記載の予測方法の処理をコンピュータに実行させるための予測プログラム。
- 請求項19、請求項20、請求項25、請求項26、及び請求項28の何れか1項に記載の学習済みモデルの生成方法の処理をコンピュータに実行させるための学習済みモデルの生成プログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021031234A JP7057003B1 (ja) | 2021-02-26 | 2021-02-26 | 予測装置、学習済みモデルの生成装置、予測方法、学習済みモデルの生成方法、予測プログラム、及び学習済みモデルの生成プログラム |
CN202210043122.3A CN115050424A (zh) | 2021-02-26 | 2022-01-14 | 预测装置、生成装置、预测方法、生成方法和记录介质 |
EP22151777.4A EP4102506A1 (en) | 2021-02-26 | 2022-01-17 | Prediction device, trained model generation device, prediction method, and trained model generation method |
US17/577,507 US20220277224A1 (en) | 2021-02-26 | 2022-01-18 | Prediction device, trained model generation device, prediction method, and trained model generation method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021031234A JP7057003B1 (ja) | 2021-02-26 | 2021-02-26 | 予測装置、学習済みモデルの生成装置、予測方法、学習済みモデルの生成方法、予測プログラム、及び学習済みモデルの生成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP7057003B1 true JP7057003B1 (ja) | 2022-04-19 |
JP2022131959A JP2022131959A (ja) | 2022-09-07 |
Family
ID=79687180
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021031234A Active JP7057003B1 (ja) | 2021-02-26 | 2021-02-26 | 予測装置、学習済みモデルの生成装置、予測方法、学習済みモデルの生成方法、予測プログラム、及び学習済みモデルの生成プログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US20220277224A1 (ja) |
EP (1) | EP4102506A1 (ja) |
JP (1) | JP7057003B1 (ja) |
CN (1) | CN115050424A (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024043251A1 (ja) * | 2022-08-23 | 2024-02-29 | 富士フイルム株式会社 | 環状ペプチドの細胞膜透過性の予測方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010225120A (ja) * | 2009-03-25 | 2010-10-07 | Nec Corp | 事例検索システム、事例検索方法および事例検索プログラム |
US20150015569A1 (en) * | 2013-07-15 | 2015-01-15 | Samsung Electronics Co., Ltd. | Method and apparatus for processing depth image |
CN111401534A (zh) * | 2020-04-29 | 2020-07-10 | 北京晶派科技有限公司 | 一种蛋白质性能预测方法、装置和计算设备 |
JP2020166747A (ja) * | 2019-03-29 | 2020-10-08 | 株式会社カネカ | 細胞膜透過性天然ペプチドの探索方法 |
CN112151109A (zh) * | 2020-09-09 | 2020-12-29 | 中国科学院大连化学物理研究所 | 用于评价生物分子交联质谱鉴定随机性的半监督学习方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2002354462A1 (en) | 2001-12-10 | 2003-07-09 | Fujitsu Limited | Apparatus for predicting stereostructure of protein and prediction method |
JP6558754B2 (ja) | 2015-08-07 | 2019-08-14 | 富士通株式会社 | 情報処理装置、指標次元抽出方法、および指標次元抽出プログラム |
BR112019021782A2 (pt) | 2017-04-19 | 2020-08-18 | Gritstone Oncology, Inc. | identificação, fabricação e uso de neoantígenos |
US20200105377A1 (en) | 2017-06-09 | 2020-04-02 | Gritstone Oncology, Inc. | Neoantigen identification, manufacture, and use |
JP2021031234A (ja) | 2019-08-26 | 2021-03-01 | 株式会社関電工 | 盤起立治具及び当該治具を用いた盤起立方法 |
-
2021
- 2021-02-26 JP JP2021031234A patent/JP7057003B1/ja active Active
-
2022
- 2022-01-14 CN CN202210043122.3A patent/CN115050424A/zh active Pending
- 2022-01-17 EP EP22151777.4A patent/EP4102506A1/en not_active Withdrawn
- 2022-01-18 US US17/577,507 patent/US20220277224A1/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010225120A (ja) * | 2009-03-25 | 2010-10-07 | Nec Corp | 事例検索システム、事例検索方法および事例検索プログラム |
US20150015569A1 (en) * | 2013-07-15 | 2015-01-15 | Samsung Electronics Co., Ltd. | Method and apparatus for processing depth image |
JP2020166747A (ja) * | 2019-03-29 | 2020-10-08 | 株式会社カネカ | 細胞膜透過性天然ペプチドの探索方法 |
CN111401534A (zh) * | 2020-04-29 | 2020-07-10 | 北京晶派科技有限公司 | 一种蛋白质性能预测方法、装置和计算设备 |
CN112151109A (zh) * | 2020-09-09 | 2020-12-29 | 中国科学院大连化学物理研究所 | 用于评价生物分子交联质谱鉴定随机性的半监督学习方法 |
Non-Patent Citations (2)
Title |
---|
松山 祐輔,薬剤活性予測の改良のための化合物フィンガープリントの比較解析,情報処理学会 研究報告 バイオ情報学(BIO) 2017-BIO-49 [online] ,日本,情報処理学会,2017年03月16日,p.1-7,ISSN:2188-8590 |
松山 祐輔: "薬剤活性予測の改良のための化合物フィンガープリントの比較解析", 情報処理学会 研究報告 バイオ情報学(BIO) 2017−BIO−49 [ONLINE], JPN6021045944, 16 March 2017 (2017-03-16), JP, pages 1 - 7, ISSN: 0004646516 * |
Also Published As
Publication number | Publication date |
---|---|
JP2022131959A (ja) | 2022-09-07 |
EP4102506A1 (en) | 2022-12-14 |
CN115050424A (zh) | 2022-09-13 |
US20220277224A1 (en) | 2022-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hashemifar et al. | Predicting protein–protein interactions through sequence-based deep learning | |
Chiavazzo et al. | Intrinsic map dynamics exploration for uncharted effective free-energy landscapes | |
Li et al. | RNA3DCNN: Local and global quality assessments of RNA 3D structures using 3D deep convolutional neural networks | |
Higham et al. | Fitting a geometric graph to a protein–protein interaction network | |
CN112289369B (zh) | 一种基于深度学习的抗体库构建方法及装置 | |
Gligorijević et al. | Function-guided protein design by deep manifold sampling | |
Huang et al. | Constructing multi-resolution Markov state models (MSMs) to elucidate RNA hairpin folding mechanisms | |
WO2012094655A2 (en) | Deductive multiscale simulation using order parameters | |
Wang et al. | Nonlinear machine learning in simulations of soft and biological materials | |
Cheng et al. | Swfoldrate: predicting protein folding rates from amino acid sequence with sliding window method | |
Pan et al. | Stitchable neural networks | |
JP7057003B1 (ja) | 予測装置、学習済みモデルの生成装置、予測方法、学習済みモデルの生成方法、予測プログラム、及び学習済みモデルの生成プログラム | |
CN114207729A (zh) | 材料特性预测系统以及材料特性预测方法 | |
Si et al. | Improved protein contact prediction using dimensional hybrid residual networks and singularity enhanced loss function | |
EP4272216A1 (en) | Protein structure prediction | |
Kalemati et al. | CapsNet-MHC predicts peptide-MHC class I binding based on capsule neural networks | |
Li et al. | ProSTAGE: predicting effects of mutations on protein stability by using protein embeddings and graph convolutional networks | |
EP3809415A1 (en) | Word embedding method and apparatus, and word search method | |
JP7057004B1 (ja) | 予測装置、学習済みモデルの生成装置、予測方法、学習済みモデルの生成方法、予測プログラム、及び学習済みモデルの生成プログラム | |
CN117095753A (zh) | 一种蛋白质稳定性预测方法及网络app | |
Knight et al. | Coarse-graining away electronic structure: a rigorous route to accurate condensed phase interaction potentials | |
Valentin et al. | Formulation of probabilistic models of protein structure in atomic detail using the reference ratio method | |
Shenker et al. | Efficient traversal of beta-sheet protein folding pathways using ensemble models | |
WO2019198408A1 (ja) | 学習装置、学習方法、及び学習プログラム | |
Orkoulas | Spatial updating Monte Carlo algorithms in particle simulations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20210305 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210810 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20210810 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220124 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220315 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220331 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7057003 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |