CN112331273B - 一种基于多维度信息的药物小分子-蛋白靶点反应预测方法 - Google Patents
一种基于多维度信息的药物小分子-蛋白靶点反应预测方法 Download PDFInfo
- Publication number
- CN112331273B CN112331273B CN202011168551.0A CN202011168551A CN112331273B CN 112331273 B CN112331273 B CN 112331273B CN 202011168551 A CN202011168551 A CN 202011168551A CN 112331273 B CN112331273 B CN 112331273B
- Authority
- CN
- China
- Prior art keywords
- protein
- drug
- dimensional
- characteristic
- features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000003814 drug Substances 0.000 title claims abstract description 72
- 229940079593 drug Drugs 0.000 title claims abstract description 63
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 10
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 55
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 55
- 239000013598 vector Substances 0.000 claims abstract description 39
- 239000000126 substance Substances 0.000 claims abstract description 20
- 150000001413 amino acids Chemical class 0.000 claims abstract description 16
- 150000003384 small molecules Chemical class 0.000 claims abstract description 10
- 238000012549 training Methods 0.000 claims abstract description 9
- 230000004927 fusion Effects 0.000 claims abstract description 7
- 108020001507 fusion proteins Proteins 0.000 claims abstract description 3
- 102000037865 fusion proteins Human genes 0.000 claims abstract description 3
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 9
- 230000009466 transformation Effects 0.000 claims description 6
- 125000004432 carbon atom Chemical group C* 0.000 claims description 4
- 230000006870 function Effects 0.000 claims description 4
- 238000000547 structure data Methods 0.000 claims description 3
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 claims description 2
- 238000004925 denaturation Methods 0.000 claims description 2
- 230000036425 denaturation Effects 0.000 claims description 2
- 238000006460 hydrolysis reaction Methods 0.000 claims description 2
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 claims description 2
- 238000001556 precipitation Methods 0.000 claims description 2
- 230000011218 segmentation Effects 0.000 claims description 2
- 230000001988 toxicity Effects 0.000 claims description 2
- 231100000419 toxicity Toxicity 0.000 claims description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 2
- 230000003993 interaction Effects 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000003596 drug target Substances 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 208000030453 Drug-Related Side Effects and Adverse reaction Diseases 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002598 diffusion tensor imaging Methods 0.000 description 1
- 238000012362 drug development process Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/10—Analysis or design of chemical reactions, syntheses or processes
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
Landscapes
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Analytical Chemistry (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Peptides Or Proteins (AREA)
Abstract
本发明公开了一种基于多维度信息的药物小分子‑蛋白靶点反应预测方法,包括:(1)获取蛋白靶点的特征表示,包括氨基酸向量、蛋白质三维空间结构特征、蛋白质化学特征;(2)获取药物小分子的特征表示,包括药物分子的语义特征、BERT的通用网络特征、药物分子本身的化学特征;(3)融合蛋白靶点和药物小分子的特征;(4)将融合后的特征作为分类器的输入,再结合训练集中的标签即可训练整个网络;三种不同类型的特征融合可极大程度地挖掘药物、蛋白质的潜在特征,便于更精确地进行DTI预测。该发明可同时提升DTI预测的速度与准确率,具备较高的实用价值。
Description
技术领域
本申请涉及人工智能药物研发,具体涉及药物小分子-蛋白靶点相互作用领域。
背景技术
预测药物小分子-蛋白靶点相互作用(drug target interactions,DTIs)是研究药物治疗效果和绝大多数药物副作用的基础,在药物研发过程中起到了至关重要的作用。尽管部分实验已经验证了DTI(药物-靶点相互作用)是相对可靠的方式,但是药物小分子-蛋白靶点的组合空间过于庞大,通过实验一一验证将会耗费巨大的人力和计算资源。通常DTI预测方法可分为两类:基于物理的方法和基于机器学习的方法。其中基于物理的方法如分子对接,即利用预定的得分函数来评估原子水平上的DTI。然而该方法所得精度有限,难以评估构象熵与溶剂的贡献,而且基于原子层的方法对分子结构波动敏感。此外,基于相似性的DTI预测认为相似的药物可能共享相同的蛋白质靶点,相似的蛋白质可能与相同的药物相互作用。该方法依赖于如何度量药物分子和蛋白质序列的相似性,而相似性又取决于药物分子及蛋白质序列的特征表示。传统基于先验知识所得的特征表示对于预测DTI具有一定的局限性,而由数据驱动的、自动搜索所得的特征表示更有利于DTI预测。
近年来,基于机器学习的DTI方法发展迅速。药物分子所包含的原子较少,其化学药性可以很好地被神经网络捕捉;同时,蛋白质序列信息也能由自然语言处理中的LSTM等神经网络来刻画。于是,药物分子-蛋白靶点之间的相互作用可以通过构建不同的端对端的深度网络来预测。
DTI预测主要包含药物小分子和蛋白靶点的特征表示和相互作用两部分。通常情况下,药物分子可由SMILES(简化分子线性输入规范)进行表示,蛋白靶点可由一维的氨基酸序列进行表示,也可由三维的空间结构来表示。然而,由于一维的氨基酸序列信息有限,因此很难刻画蛋白质的空间结构特征;而三维的空间结构(如每个氨基酸的3D坐标)通常难以获得,且三维结构本身伴随着高维的稀疏运算,计算效率通常较低。为此,最新研究提出基于二维距离矩阵的蛋白质表示方法,矩阵中的每个元素表示对应的氨基酸之间的距离,这种蛋白质表示方法的好处在于:既弥补了一维的氨基酸序列信息不充分的问题,又解决了三维结构计算复杂度高的问题。尽管如此,在DTI预测的过程中,仍然存在以下难点:1)不同蛋白质的距离矩阵的大小不一致,由于矩阵中的每个元素表示的是一对氨基酸之间的距离,因此对不同的距离矩阵直接进行下采样放缩到相同的尺寸并不合理;2)不同药物分子的SMILES序列长度不一致,需要使用合适的模型来获得语义特征;3)用于DTI任务的训练数据集相对较小,因此设计合适的网络结构是非常关键的。
发明内容
发明目的:本发明提出了一种基于多维度信息的方法,通过对不同层级、不同维度信息的融合,最大程度地对分子和蛋白进行特征表达,从而提高药物小分子-蛋白靶点作用的预测准确率。
技术方案:一种基于多维度信息的药物小分子-蛋白靶点反应预测方法:(1)获取蛋白靶点的特征表示,包括氨基酸向量、蛋白质三维空间结构特征、蛋白质化学特征;(2)获取药物小分子的特征表示,包括药物分子的语义特征、BERT的通用网络特征、药物分子本身的化学特征;(3)融合蛋白靶点和药物小分子的特征;(4)将融合后的特征作为分类器的输入,再结合训练集中的标签即可训练整个网络。如图1所示。
所述的获取蛋白靶点的特征表示:(a)以氨基酸为单位分割蛋白靶点的氨基酸序列,得到一组氨基酸向量;(b)将蛋白质的三维空间结构作为输入,通过定义的图网络GCN,得到基于三维空间结构的特征;如图1中的1.1所示;(c)将氨基酸序列作为输入,基于之前预训练的BERT获得通用的蛋白质特征;如图1中的1.2所示;(d)由先验知识获取蛋白质本身的化学特征:结构特征和化学性质,如图1中的1.3所示;。
所述的结构特征为碳原子个数、是否含羧基、共价键的类型;化学性质为水解反应、沉淀、变性。
所述的获取药物小分子的特征表示:(a)设计特定的分词器,对给定的药物小分子SMILES进行分词并数字化,得到相应的数字向量;(b)将数字化的向量作为输入,通过ELMo网络得到药物的语义特征;如图1中的2.1所示;(c)将数字化的向量作为输入,基于之前预训练的BERT获得通用的分子特征;如图1中的2.2所示;(d)由先验知识获取药物本身的化学特征:结构特征和药学特征;如图1中的2.3所示。
所述的结构特征是碳原子个数、是否含苯环、双键;药学特征是水溶性、不稳定性、毒性。
所述的获取蛋白质的特征表示:(1)获取蛋白质的三维空间结构数据P={(xi,yi,zi)},其中(xi,yi,zi)表示第i个氨基酸的空间坐标,将P作为GCN的输入,得到256维的特征向量Pc;(2)分割蛋白质,得到氨基酸向量S=(M,Q,S,K,…);将S作为BERT网络的输入,得到256维的基于BERT的通用网络特征Pb;(3)通过先验知识获取蛋白质化学特征Ph,即64维one-hot编码的特征向量。
所述的获取药物分子的特征表示:(1)按给定的正则表达式分割药物分子的SMILES序列D,得到向量M=(CNC,=O,C1=C,…);(2)将向量M输入善于发掘语义信息的ELMo网络中,获取256维德药物分子内部语义特征De;(3)将向量M输入通用网络BERT中,获取256维的特征向量Db;(4)通过先验知识获取药物分子的化学特征Dh,即64维one-hot编码的特征向量。
所述的药物-蛋白质的特征融合:(1)将蛋白相关特征进行组合,得到R=[Pc,Pb,Ph],并通过两层全连接网络进行非线性变换,得到最终的蛋白特征表示Pa;(2)将分子相关特征进行组合,得到H=[De,Db,Dh],并通过两层全连接网络进行非线性变换,得到最终的分子特征表示Ma。
所述的DTI分类器:将蛋白质-药物的特征向量Pa和Ma归一化后输入包含全连接的分类层中,再结合训练集中的标签及给定的损失函数训练整个网络。
有益效果:本发明创新性地提出了一种基于多维度信息的药物小分子-蛋白靶点反应预测方法,三种不同类型的特征融合可极大程度地挖掘药物、蛋白质的潜在特征,便于更精确地进行DTI预测。该发明不仅可同时提升DTI预测的速度与准确率,具备较高的实用价值。
附图说明
图1是本发明基于多维度信息的药物小分子-蛋白靶点反应预测方法的示意图;
图2是本发明DTI预测过程图。
具体实施方式
为了精确描述药物小分子-蛋白靶点的作用过程,提高药物小分子-蛋白靶点作用的预测准确率,本申请提出了一种基于多维度信息的应预测方法。如图1所示,该方法分别对药物小分子和蛋白靶点进行语义编码。在药物小分子编码方面,为了增加特征的表达能力,我们引入了基于ELMo的上下文语义表达方法和基于BERT的预训练语言模型对药物小分子的通用特征进行描述,同时融合了小分子自身相关的化学特性和药学性质。在蛋白靶点编码方面,我们以氨基酸序列作为输入,同样基于BERT获取语义向量的表达,基于3D-GCN网络学习蛋白靶点的局部结构信息和空间结构信息;通过对不同层级、不同维度信息的融合表达,该方法可极大地保留药物小分子和蛋白靶点的多种物理化学特性,最大程度地对分子和蛋白进行特征表达,因此有利于提升DTI预测精度。
对于给定的药物分子-蛋白靶点相互作用的训练集来构建DTI预测模型的具体步骤如下:
1.准备大量的蛋白质/氨基酸序列数据集,预训练BERT模型;
2.获取蛋白质的特征表示,以人体VGFR2受体(MQSKVLLAVA…)为例:
(1)获取蛋白质的三维空间结构数据P={(xi,yi,zi)},其中(xi,yi,zi)表示第i个氨基酸的空间坐标,将P作为GCN的输入,得到256维的特征向量Pc;
(2)分割蛋白质,得到氨基酸向量S=(M,Q,S,K,…);将S作为BERT网络的输入,得到256维的基于BERT的通用网络特征Pb;
(3)通过先验知识获取蛋白质化学特征Ph,即64维one-hot编码的特征向量。
3.获取药物分子的特征表示,以药物分子Axitinib(CNC(=O)C1=C(SC2…))为例:
(1)按给定的正则表达式分割药物分子的SMILES序列D,得到向量M=(CNC,=O,C1=C,…);
(2)将向量M输入善于发掘语义信息的ELMo网络中,获取256维德药物分子内部语义特征De;
(3)将向量M输入通用网络BERT中,获取256维的特征向量Db;
(4)通过先验知识获取药物分子的化学特征Dh,即64维one-hot编码的特征向量。
4.药物-蛋白质的特征融合
(1)将蛋白相关特征进行组合,得到R=[Pc,Pb,Ph],并通过两层全连接网络进行非线性变换,得到最终的蛋白特征表示Pa;
(2)将分子相关特征进行组合,得到H=[De,Db,Dh],并通过两层全连接网络进行非线性变换,得到最终的分子特征表示Ma。。
5.DTI分类器:
1)将蛋白质-药物的特征向量Pa和Ma归一化后输入包含全连接的分类层中,再结合训练集中的标签及给定的损失函数训练整个网络。
6.DTI预测过程如图2所示。
以上实施例进一步说明本发明的内容,但不应理解为对本发明的限制。在不背离本发明精神和实质的情况下,对本发明方法、步骤或条件所作的修改或替换,均属于本发明的范围。若未特别指明,实施例中所用的技术手段为本领域技术人员所熟知的常规手段。
Claims (4)
1.一种基于多维度信息的药物小分子-蛋白靶点反应预测方法,其特征在于,
(1)获取蛋白靶点的特征表示,包括氨基酸向量、蛋白质三维空间结构特征、蛋白质化学特征;
(2)获取药物小分子的特征表示,包括药物分子的语义特征、BERT的通用网络特征、药物分子本身的化学特征;
(3)融合蛋白靶点和药物小分子的特征;
(4)将融合后的特征作为分类器的输入,再结合训练集中的标签即可训练整个网络;
所述的获取蛋白靶点特征表示:
(a)以氨基酸为单位分割蛋白靶点的氨基酸序列,得到一组氨基酸向量;
(b)将蛋白质的三维空间结构作为输入,通过定义的图网络GCN,得到基于三维空间结构的特征;
(c)将氨基酸序列作为输入,基于之前预训练的BERT获得通用的蛋白质特征;
(d)由先验知识获取蛋白质本身的化学特征:结构特征和化学性质;
所述的获取药物小分子的特征表示:
(a)设计特定的分词器,对给定的药物小分子SMILES进行分词并数字化,得到相应的数字向量;
(b)将数字化的向量作为输入,通过 ELMo 网络得到药物的语义特征;
(c)将数字化的向量作为输入,基于之前预训练的BERT获得通用的分子特征;
(d)由先验知识获取药物本身的化学特征:结构特征和药学特征;
获取蛋白质的特征表示:
(1)获取蛋白质的三维空间结构数据 P={(xi,yi,zi)}, 其中 (xi,yi,zi) 表示第 i个氨基酸的空间坐标,将 P 作为 GCN 的输入,得到256维的特征向量 Pc;
(2)分割蛋白质,得到氨基酸向量 S=(M,Q,S,K,…);将 S 作为BERT网络的输入,得到256维的基于BERT的通用网络特征Pb;
(3)通过先验知识获取蛋白质化学特征Ph,即64维one-hot 编码的特征向量;
所述的获取药物分子的特征表示:
(1)按给定的正则表达式分割药物分子的 SMILES序列 D,得到向量 M=(CNC,=O,C1=C,…);
(2)将向量M输入善于发掘语义信息的ELMo网络中,获取256维德药物分子内部语义特征De;
(3)将向量M输入通用网络BERT中,获取 256维的特征向量Db;
(4)通过先验知识获取药物分子的化学特征Dh,即64维 one-hot 编码的特征向量;
所述的药物-蛋白质的特征融合:
(1) 将蛋白相关特征进行组合,得到R = [Pc, Pb, Ph],并通过两层全连接网络进行非线性变换,得到最终的蛋白特征表示Pa;
(2) 将分子相关特征进行组合,得到H = [De, Db, Dh],并通过两层全连接网络进行非线性变换,得到最终的分子特征表示Ma。
2.根据权利要求1所述的一种基于多维度信息的药物小分子-蛋白靶点反应预测方法,其特征在于,蛋白质的结构特征为碳原子个数、是否含羧基、共价键的类型;蛋白质的化学性质为水解反应、沉淀、变性。
3.根据权利要求1所述的一种基于多维度信息的药物小分子-蛋白靶点反应预测方法,其特征在于,药物的结构特征是碳原子个数、是否含苯环、双键;药物的药学特征是水溶性、不稳定性、毒性。
4.根据权利要求1所述的一种基于多维度信息的药物小分子-蛋白靶点反应预测方法,其特征在于,所述的分类器:将蛋白质-药物的特征向量Pa和Ma归一化后输入包含全连接的分类层中,再结合训练集中的标签及给定的损失函数训练整个网络。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011168551.0A CN112331273B (zh) | 2020-10-28 | 2020-10-28 | 一种基于多维度信息的药物小分子-蛋白靶点反应预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011168551.0A CN112331273B (zh) | 2020-10-28 | 2020-10-28 | 一种基于多维度信息的药物小分子-蛋白靶点反应预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112331273A CN112331273A (zh) | 2021-02-05 |
CN112331273B true CN112331273B (zh) | 2023-12-15 |
Family
ID=74296179
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011168551.0A Active CN112331273B (zh) | 2020-10-28 | 2020-10-28 | 一种基于多维度信息的药物小分子-蛋白靶点反应预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112331273B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113066539A (zh) * | 2021-03-22 | 2021-07-02 | 上海商汤智能科技有限公司 | 预测方法及相关装置、设备 |
CN113327644B (zh) * | 2021-04-09 | 2024-05-14 | 中山大学 | 一种基于图与序列的深度嵌入学习的药物-靶标相互作用预测方法 |
CN113409883B (zh) * | 2021-06-30 | 2022-05-03 | 北京百度网讯科技有限公司 | 信息预测及信息预测模型的训练方法、装置、设备及介质 |
CN113823352B (zh) * | 2021-09-26 | 2023-09-08 | 南开大学 | 药物-靶蛋白亲和力预测方法及系统 |
CN114360639A (zh) * | 2022-01-11 | 2022-04-15 | 平安科技(深圳)有限公司 | 基于人工智能的药物靶点作用关系确定方法及装置 |
CN117393036B (zh) * | 2023-11-09 | 2024-07-23 | 中国海洋大学 | 一种用于药物-靶点亲和力预测的蛋白多层次语义聚合表征方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107679362A (zh) * | 2017-09-19 | 2018-02-09 | 广东药科大学 | 化合物‑蛋白质相互作用亲和力识别方法、系统和装置 |
JP2018092575A (ja) * | 2016-10-27 | 2018-06-14 | 武田薬品工業株式会社 | 化合物の生物活性を予測するためのプログラム、装置及び方法 |
CN108959841A (zh) * | 2018-04-16 | 2018-12-07 | 华南农业大学 | 一种基于dbn算法的药物靶向蛋白作用预测方法 |
CN109493925A (zh) * | 2018-11-20 | 2019-03-19 | 北京晶派科技有限公司 | 一种确定药物和药物靶点关联关系的方法 |
CN109637596A (zh) * | 2018-12-18 | 2019-04-16 | 广州市爱菩新医药科技有限公司 | 一种药物靶点预测方法 |
CN109887541A (zh) * | 2019-02-15 | 2019-06-14 | 张海平 | 一种靶点蛋白质与小分子结合预测方法及系统 |
CN110689965A (zh) * | 2019-10-10 | 2020-01-14 | 电子科技大学 | 一种基于深度学习的药物靶点亲和力预测方法 |
WO2020140156A1 (en) * | 2019-01-04 | 2020-07-09 | Cyclica Inc. | Method and system for predicting drug binding using synthetic data |
WO2020193966A1 (en) * | 2019-03-26 | 2020-10-01 | Benevolentai Technology Limited | Name entity recognition with deep learning |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080235167A1 (en) * | 2007-02-16 | 2008-09-25 | Beratan David N | Methods and systems for selecting molecular structures |
BR112014032104A2 (pt) * | 2012-06-21 | 2017-08-01 | Univ Georgetown | método para identificar interações proteína-droga, e, produto de computador. |
-
2020
- 2020-10-28 CN CN202011168551.0A patent/CN112331273B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018092575A (ja) * | 2016-10-27 | 2018-06-14 | 武田薬品工業株式会社 | 化合物の生物活性を予測するためのプログラム、装置及び方法 |
CN107679362A (zh) * | 2017-09-19 | 2018-02-09 | 广东药科大学 | 化合物‑蛋白质相互作用亲和力识别方法、系统和装置 |
CN108959841A (zh) * | 2018-04-16 | 2018-12-07 | 华南农业大学 | 一种基于dbn算法的药物靶向蛋白作用预测方法 |
CN109493925A (zh) * | 2018-11-20 | 2019-03-19 | 北京晶派科技有限公司 | 一种确定药物和药物靶点关联关系的方法 |
CN109637596A (zh) * | 2018-12-18 | 2019-04-16 | 广州市爱菩新医药科技有限公司 | 一种药物靶点预测方法 |
WO2020140156A1 (en) * | 2019-01-04 | 2020-07-09 | Cyclica Inc. | Method and system for predicting drug binding using synthetic data |
CN109887541A (zh) * | 2019-02-15 | 2019-06-14 | 张海平 | 一种靶点蛋白质与小分子结合预测方法及系统 |
WO2020193966A1 (en) * | 2019-03-26 | 2020-10-01 | Benevolentai Technology Limited | Name entity recognition with deep learning |
CN110689965A (zh) * | 2019-10-10 | 2020-01-14 | 电子科技大学 | 一种基于深度学习的药物靶点亲和力预测方法 |
Non-Patent Citations (4)
Title |
---|
A comparative study of SMILES-based compound similarity functions for drug-target interaction prediction;Hakime Öztürk et al.;《BMC Bioinformatics》;第17卷;128(1-11) * |
Structure-Aware Multimodal Deep Learning for Drug−Protein Interaction Prediction;Penglei Wang et al.;《J. Chem. Inf. Model》;第62卷;1308-1317 * |
利用SVM 预测潜在的蛋白质药物靶点;王春丽 等;《2011 2nd International Conference on Management Science and Engineering》;第3卷;550-551 * |
基于回归模型的网络排序算法预测药物靶点关系;闫效莺 等;《科学技术与工程》;第16卷(第22期);36-40 * |
Also Published As
Publication number | Publication date |
---|---|
CN112331273A (zh) | 2021-02-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112331273B (zh) | 一种基于多维度信息的药物小分子-蛋白靶点反应预测方法 | |
Farhadi et al. | Attribute-centric recognition for cross-category generalization | |
CN113241128B (zh) | 基于分子空间位置编码注意力神经网络模型的分子性质预测方法 | |
CN117218498B (zh) | 基于多模态编码器的多模态大语言模型训练方法及系统 | |
CN110555387B (zh) | 骨架序列中基于局部关节点轨迹时空卷的行为识别方法 | |
CN113157678B (zh) | 一种多源异构数据关联方法 | |
CN110046550A (zh) | 基于多层特征学习的行人属性识别系统及方法 | |
CN113780003A (zh) | 时空数据变分编解码跨模态增强方法 | |
CN109785409B (zh) | 一种基于注意力机制的图像-文本数据融合方法和系统 | |
Luo et al. | Gait recognition and understanding based on hierarchical temporal memory using 3D gait semantic folding | |
CN113764037A (zh) | 模型训练、抗体改造和结合位点预测的方法与装置 | |
CN116206688A (zh) | 一种用于dta预测的多模态信息融合模型及方法 | |
CN116486900A (zh) | 基于深度模态数据融合的药物靶标亲和度预测方法 | |
CN113450870B (zh) | 一种药物与靶点蛋白的匹配方法及系统 | |
CN118038995B (zh) | 非编码rna中小开放阅读窗编码多肽能力预测方法及系统 | |
CN114283326A (zh) | 一种结合局部感知和高阶特征重构的水下目标重识别方法 | |
CN114187546A (zh) | 组合性动作识别方法及系统 | |
Marchellus et al. | Deep learning for 3d human motion prediction: State-of-the-art and future trends | |
Mayo | Restrictions, Challenges and Opportunities for AI and ML | |
Radzi et al. | Research on Emotion Classification Based on Multi-modal Fusion | |
CN113780350A (zh) | 一种基于ViLBERT和BiLSTM的图像描述方法 | |
Li et al. | Rsmodm: Multimodal momentum distillation model for remote sensing visual question answering | |
CN118470515B (zh) | 一种针对水下目标物的自监督三维点云补全方法 | |
Fan et al. | A Novel Road Crack Detection Technology Based on Deep Dictionary Learning and Encoding Networks | |
CN115458061B (zh) | 一种药物-蛋白质相互作用预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |