CN107480429A - 化合物的3d展示方法和系统 - Google Patents

化合物的3d展示方法和系统 Download PDF

Info

Publication number
CN107480429A
CN107480429A CN201710601316.XA CN201710601316A CN107480429A CN 107480429 A CN107480429 A CN 107480429A CN 201710601316 A CN201710601316 A CN 201710601316A CN 107480429 A CN107480429 A CN 107480429A
Authority
CN
China
Prior art keywords
compound
attribute
axis
dimensions
space
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710601316.XA
Other languages
English (en)
Other versions
CN107480429B (zh
Inventor
陈宇综
蒋宇扬
谭英
秦楚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Kun Jian Original New Drug Research Institute
Shenzhen Graduate School Tsinghua University
Original Assignee
Shenzhen Kun Jian Original New Drug Research Institute
Shenzhen Graduate School Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Kun Jian Original New Drug Research Institute, Shenzhen Graduate School Tsinghua University filed Critical Shenzhen Kun Jian Original New Drug Research Institute
Priority to CN201710601316.XA priority Critical patent/CN107480429B/zh
Publication of CN107480429A publication Critical patent/CN107480429A/zh
Application granted granted Critical
Publication of CN107480429B publication Critical patent/CN107480429B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/80Data visualisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Chemical & Material Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明公开了一种化合物的3D展示方法和系统。该方法可以包括:1)创建化合物属性库,所述化合物属性库存储化合物属性;2)将所述化合物库中化合物多个维度的属性映射到三个维度上;3)创建与步骤2)中的三个维度对应的3D空间,所述3D空间的X轴、Y轴、Z轴分别代表所述三个维度中的一个维度;4)根据化合物在X轴、Y轴、Z轴上所对应的位置,将所述化合物对应的展示体展示在所述3D空间中。本发明将化合物的高维属性特征映射到三个维度上,从而能够直观地向观测者展示化合物属性在化学空间的分布状况,通过研究化合物属性的分布规律,以此评价或预测新的化合物的属性。

Description

化合物的3D展示方法和系统
技术领域
本发明涉及计算机辅助分子设计领域,具体地,涉及一种化合物的3D展示方法和系统。
背景技术
研究化合物群体特征对掌握其基本规律、促进新发现起着重要的作用。例如,研究药物的成药性,对新药研发具有重要意义。其中一个常用的方法是分析某一特定群体在化学空间中相对于其他群体的分布规律。
这些研究遇到的主要瓶颈是无法有效地在大范围化学空间中展示特定化合物群体的分布规律,比如药物在活性化学空间的分布规律,其主要原因是化合物数量巨大,目前常用的平面图形展示方法展示能力非常有限,远远不能满足大范围化学空间展示的需求。因此,有必要开发一种新的方法和系统来解决这个需求。
公开于本发明背景技术部分的信息仅仅旨在加深对本发明的一般背景技术的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域技术人员所公知的现有技术。
发明内容
为了解决现有技术中存在的问题,本发明的提出了一种化合物的3D展示方法和系统。
根据本发明的一个方法,化合物的3D展示方法可以包括:
1)创建化合物属性库,所述化合物属性库存储化合物属性;
2)将所述化合物库中化合物多个维度的属性映射到三个维度上;
3)创建与步骤2)中的三个维度对应的3D空间,所述3D空间的X轴、Y轴、Z轴分别代表所述三个维度中的一个维度;
4)根据化合物在X轴、Y轴、Z轴上所对应的位置,将所述化合物对应的展示体展示在所述3D空间中。
优选地,所述化合物属性包括化合物结构和分子描述符。
优选地,所述化合物结构包括化学分子指纹和简化分子线性输入规范两种表述方式。
优选地,通过深度学习算法将化合物多个维度的属性映射到三个维度上。
优选地,通过自编码器将化合物多个维度的属性映射到三个维度上。
根据本发明的另一方面,化合物的3D展示系统包括:
化合物属性库,所述化合物属性库存储化合物属性;
3D空间,所述3D空间与化合物库中化合物多个维度的属性所映射到的三个维度相对应,所述3D空间的X轴、Y轴、Z轴分别代表所述三个维度中的一个维度;
至少一个展示体,所述展示体对应于选自所述化合物库中的一种化合物,且根据所述化合物在X轴、Y轴、Z轴上所对应的位置展示在所述3D空间中;
任选的虚拟现实设备,用于观测所述展示体。
优选地,所述化合物属性包括化合物结构和分子描述符。
优选地,所述化合物结构包括化学分子指纹和简化分子线性输入规范两种表述方式。
优选地,通过深度学习算法将化合物多个维度的属性映射到三个维度上。
优选地,通过自编码器将化合物多个维度的属性映射到三个维度上。
根据本发明的化合物的3D展示方法和系统,将化合物的高维属性特征映射到三个维度上,从而能够直观地向观测者展示化合物属性在化学空间的分布状况,通过研究化合物属性的分布规律,以此评价或预测新的化合物的属性。
本发明的方法和装置具有其它的特性和优点,这些特性和优点从并入本文中的附图和随后的具体实施例中将是显而易见的,或者将在并入本文中的附图和随后的具体实施例中进行详细陈述,这些附图和具体实施例共同用于解释本发明的特定原理。
附图说明
通过结合附图对本发明示例性实施例进行更详细的描述,本发明的上述以及其它目的、特征和优势将变得更加明显,其中,在本发明示例性实施例中,相同的参考标号通常代表相同部件。
图1为根据本发明的一个实施方案的化合物的3D展示方法的流程图。
具体实施方式
下面将参照附图更详细地描述本发明。虽然附图中显示了本发明的优选实施例,然而应该理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了使本发明更加透彻和完整,并且能够将本发明的范围完整地传达给本领域的技术人员。
以下参考图1详细描述根据本发明示例性实施方案的化合物的3D展示方法的流程图。该方法可以包括以下步骤:
步骤1:创建化合物属性库,所述化合物属性库存储化合物属性。
可以创建一种或多种化合物属性库。化合物属性库中所包含的化合物可以是待分析的任何化合物的集合,所述化合物可以是合成化合物和/或天然化合物。
其中,所述合成化合物可以为本领域已存在的各种类型的化合物,包括但不限于上市药库、临床药库、靶点的抑制剂库、中草药成分库、人体代谢产物库、食品添加剂库、农药库、毒性化合物库和工业用化合物库中的至少一种中的化合物。其中,所述上市药库包括1500个上市药,所述临床药库包括3000个临床药,所述靶点的抑制剂库包括上百个靶点的抑制剂(每个靶点一组),所述中草药成分库包括2万个中草药成分,所述人体代谢产物库包括2000个人体代谢产物,所述食品添加剂库包括1000个食品添加剂,所述农药库包括500个农药,所述毒性化合物库包括3万个毒性化合物。所述天然化合物库包括7000万个化合物,其中包括100万种活性化合物和30万种天然产物。
本领域技术人员应当理解,可以根据需要在所述化合物属性库中增加化合物及其属性,并且也可以在不创建化合物属性库的情况下,直接使用现有的或者所合成的化合物及其属性。
所述化合物属性可以为本领域各种描述化合物性质的参数,包括但不限于化合物结构和分子描述符,也包括化合物名称。其中,所述化合物结构包括化学分子指纹和简化分子线性输入规范(smiles)两种表述方式。
所述化学分子指纹的概念为本领域技术人员公知。化学分子指纹有多种表示方式,优选Pubchem分子指纹。每个化合物的Pubchem分子指纹是一串881位长度的二进制的有序列表。指纹上每个点用布尔值表示是否存在某个化学结构片段,比如化学结构中的某个元素数量,环的类型,原子配对,原子环境等。
所述简化分子线性输入规范的概念为本领域技术人员公知。简化分子线性输入规范通过使用简短ASCII字符串来描述化学分子结构。这个字符串可以通过自然语言处理中的词嵌入技术映射到实数向量空间里。
分子描述符可以表示所述化合库中的化合物的各种性质。分子描述符有多种,例如可以是(但不限于)表征化合物的分子物性、化学特性、分子连接性和形状、电性拓扑态的描述符,具体如表1所示。
表1分子描述符库所包括的分子描述符
分子描述符可以作为合理的信息和预测,例如,Lipinski氏五规则。目前分子描述符的选择方法主要有主成分分析(PCA)、逐步回归(SR)、因子分析(FA)以及偏最小二乘分析(PLS)等,在本方法中采用深度学习自编码器对分子描述符进行降维。同时用主成分分析法对分子描述符降维作为比对。
本领域技术人员应当理解,可以根据需要在所述化合物属性库中增加新的分子描述符。
步骤2:将所述化合物库中化合物多个维度的属性映射到三个维度上。
通常,化合物的属性是高维的,无法直观地在3D空间展示出来。本发明提出了一种将化合物多个维度的属性映射到三个维度上的方法以实现化合物属性的直观显示。本领域技术人员应当理解,所述多个维度的属性可以是所有维度的属性,也可以是大部分或者一部分维度的属性。
在示例性实施例中,通过深度学习算法将化合物多个维度的属性映射到三个维度上。具体地,可以通过深度学习的自编码器(autoencoder)技术建模,将量化的分子结构和分子描述符从高维空间降至三维空间,同时保留绝大部分原始结构或者化合物性质信息。比如可以将分子指纹从881维降到3维。
自编码器技术是一种降维技术。对化学分子指纹进行自编码器降维的时候,可以采用深度神经网络,共有十层,每层有几十到上百个节点数;对简化分子线性输入规范进行降维的时候可以采用卷积神经网络(convolutional neural network)和循环神经网络(Recurrent Neural Network)。
步骤3:创建与步骤2中的三个维度对应的3D空间,所述3D空间的X轴、Y轴、Z轴分别代表所述三个维度中的一个维度。
在不同的映射方式下,所得到的三个维度的属性是不同的,这三个维度的属性保留了绝大部分原始结构或者化合物性质信息。
步骤4:根据化合物在X轴、Y轴、Z轴上所对应的位置,将所述化合物对应的展示体展示在所述3D空间中。
在不同的映射方式下,同一个化合物的展示体会有不同的3D空间位置。多种化合物在相同的映射方式下,其展示体可以显示在同一个3D空间中,而这些展示体在3D空间中的位置和相互距离可以反映出化合物之间的属性关系,并且可以反映出化合物群体的分布规律。
在示例性实施例中,对应于所述化合物的展示体的3D形式为球状。属于不同化合物群体的化合物对应的展示体可以用不同的颜色或大小表示。化合物群体的颜色可以是自动分配的,也可以是用户根据偏好选择的。
例如,当从小分子化合物库中选择一个合成化合物或天然化合物,其在所述3D空间的X轴、Y轴、Z轴上都具体相应的坐标值,则可以将其定位到所述3D空间中进行显示。当多个化合物的展示体都显示在3D空间中,则通过研究这种分布规律可以评价或预测新的化合物的属性。
本发明的另一个实施例提出了一种用化合物的3D显示系统。所述系统可以包括:
化合物属性库,所述化合物属性库存储化合物属性;
3D空间,所述3D空间与化合物库中化合物多个维度的属性所映射到的三个维度相对应,所述3D空间的X轴、Y轴、Z轴分别代表所述三个维度中的一个维度;
至少一个展示体,所述展示体对应于选自所述化合物库中的一种化合物,且根据所述化合物在X轴、Y轴、Z轴上所对应的位置展示在所述3D空间中;
任选的虚拟现实设备,用于观测所述展示体。
在示例性实施例中,所述化合物属性包括化合物结构和分子描述符。
在示例性实施例中,所述化合物结构包括化学分子指纹和简化分子线性输入规范两种表述方式。
在示例性实施例中,通过深度学习算法将化合物多个维度的属性映射到三个维度上。
在示例性实施例中,通过自编码器将化合物多个维度的属性映射到三个维度上。
在示例性实施例中,可以通过虚拟现实设备观测所述展示体。
具体地,将虚拟现实VR设备与所述化合物的3D展示系统连接,用户通过该虚拟现实设备可以产生置身于所述3D空间中的感受,用户就像在所述化合物的3D展示系统所虚拟出来的3D空间中漫游来观测化合物属性在化学空间的分布状况。
进一步地,通过kinect等可以进行光学或电磁或视频地用户动作捕捉,使用户动作真实反馈到虚拟的3D空间中,以此可以实现对小球形状的化合物进行各种操作,例如移动其位置或者观看其具体的空间结构。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (10)

1.一种化合物的3D展示方法,其特征在于,包括以下步骤:
1)创建化合物属性库,所述化合物属性库存储化合物属性;
2)将所述化合物库中化合物多个维度的属性映射到三个维度上;
3)创建与步骤2)中的三个维度对应的3D空间,所述3D空间的X轴、Y轴、Z轴分别代表所述三个维度中的一个维度;
4)根据化合物在X轴、Y轴、Z轴上所对应的位置,将所述化合物对应的展示体展示在所述3D空间中。
2.根据权利要求1所述的化合物的3D展示方法,其特征在于,所述化合物属性包括化合物结构和分子描述符。
3.根据权利要求2所述的化合物的3D展示方法,其特征在于,所述化合物结构包括化学分子指纹和简化分子线性输入规范两种表述方式。
4.根据权利要求1-3中的一项所述的化合物的3D展示方法,其特征在于,通过深度学习算法将化合物多个维度的属性映射到三个维度上。
5.根据权利要求4所述的化合物的3D展示方法,其特征在于,通过自编码器将化合物多个维度的属性映射到三个维度上。
6.一种化合物的3D展示系统,其特征在于,包括:
化合物属性库,所述化合物属性库存储化合物属性;
3D空间,所述3D空间与化合物库中化合物多个维度的属性所映射到的三个维度相对应,所述3D空间的X轴、Y轴、Z轴分别代表所述三个维度中的一个维度;
至少一个展示体,所述展示体对应于选自所述化合物库中的一种化合物,且根据所述化合物在X轴、Y轴、Z轴上所对应的位置展示在所述3D空间中;
任选的虚拟现实设备,用于观测所述展示体。
7.根据权利要求6所述的化合物的3D展示系统,其特征在于,所述化合物属性包括化合物结构和分子描述符。
8.根据权利要求7所述的化合物的3D展示系统,其特征在于,所述化合物结构包括化学分子指纹和简化分子线性输入规范两种表述方式。
9.根据权利要求6-8中的一项所述的化合物的3D展示系统,其特征在于,通过深度学习算法将化合物多个维度的属性映射到三个维度上。
10.根据权利要求9所述的化合物的3D展示系统,其特征在于,通过自编码器将化合物多个维度的属性映射到三个维度上。
CN201710601316.XA 2017-07-21 2017-07-21 化合物的3d展示方法和系统 Active CN107480429B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710601316.XA CN107480429B (zh) 2017-07-21 2017-07-21 化合物的3d展示方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710601316.XA CN107480429B (zh) 2017-07-21 2017-07-21 化合物的3d展示方法和系统

Publications (2)

Publication Number Publication Date
CN107480429A true CN107480429A (zh) 2017-12-15
CN107480429B CN107480429B (zh) 2020-07-03

Family

ID=60596315

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710601316.XA Active CN107480429B (zh) 2017-07-21 2017-07-21 化合物的3d展示方法和系统

Country Status (1)

Country Link
CN (1) CN107480429B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11455440B2 (en) 2019-02-25 2022-09-27 International Business Machines Corporation Graphic user interface assisted chemical structure generation

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002057954A1 (fr) * 2001-01-19 2002-07-25 Mitsubishi Chemical Corporation Procede pour realiser une structure tridimensionnelle de proteine avec ajustement induit et son utilisation
CN103310045A (zh) * 2013-05-28 2013-09-18 山东师范大学 一种利用增强现实技术进行晶体大分子三维可视化的方法
CN108416184A (zh) * 2017-02-09 2018-08-17 清华大学深圳研究生院 化合物的3d展示方法和系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002057954A1 (fr) * 2001-01-19 2002-07-25 Mitsubishi Chemical Corporation Procede pour realiser une structure tridimensionnelle de proteine avec ajustement induit et son utilisation
CN103310045A (zh) * 2013-05-28 2013-09-18 山东师范大学 一种利用增强现实技术进行晶体大分子三维可视化的方法
CN108416184A (zh) * 2017-02-09 2018-08-17 清华大学深圳研究生院 化合物的3d展示方法和系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
TIZIANAN GINEX等: "Application of the quantum mechanical IEF/PCM-MST hydrophobic descriptors to selectivity in ligand binding", 《SPRINGER》 *
文元桥: "基于Java 3D的生物大分子模拟可视化系统", 《计算机工程与科学》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11455440B2 (en) 2019-02-25 2022-09-27 International Business Machines Corporation Graphic user interface assisted chemical structure generation

Also Published As

Publication number Publication date
CN107480429B (zh) 2020-07-03

Similar Documents

Publication Publication Date Title
O'Sullivan Graph-cellular automata: a generalised discrete urban and regional model
Vehlow et al. The State of the Art in Visualizing Group Structures in Graphs.
Vincur et al. VR City: Software analysis in virtual reality environment
De Benedictis et al. Digital twins in healthcare: an architectural proposal and its application in a social distancing case study
Oriti et al. Generalized quantum gravity condensates for homogeneous geometries and cosmology
Cui et al. Integrating shape grammars into a generative system for Zhuang ethnic embroidery design exploration
Parisi Digital design and topological control
CN106991475A (zh) 用于神经网络的基于标记的装置和方法
Lehmann et al. General projective maps for multidimensional data projection
Ole Ohlbrock et al. Combinatorial equilibrium modeling
Pinaud et al. PORGY: a visual graph rewriting environment for complex systems
CN104952086B (zh) 用于管理结构数据的设备及方法
Hadjar et al. WebVR based interactive visualization of open health data
Deng et al. Octahedral Tucker is PPA-complete
Lau et al. Immunity-based autonomous guided vehicles control
Troiano et al. SCI-FI: shape-changing interfaces, future interactions
Lipp et al. Local editing of procedural models
US9626387B2 (en) Volumetric vector node and object based multi-dimensional operating system
CN108416184B (zh) 化合物的3d展示方法和系统
CN107480429A (zh) 化合物的3d展示方法和系统
Saffo et al. Unraveling the design space of immersive analytics: A systematic review
Brimberg et al. Heuristics for location models
Hua A case-based design with 3D mesh models of architecture
Lock et al. Visual analytics of single cell microscopy data using a collaborative immersive environment
Moraes et al. Collaborative information visualization using a multi-projection system and mobile devices

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant