CN110246538B - 基于高性能计算平台的小分子靶标核酸适配体计算机辅助筛选方法及小分子靶标核酸适配体 - Google Patents
基于高性能计算平台的小分子靶标核酸适配体计算机辅助筛选方法及小分子靶标核酸适配体 Download PDFInfo
- Publication number
- CN110246538B CN110246538B CN201910514445.4A CN201910514445A CN110246538B CN 110246538 B CN110246538 B CN 110246538B CN 201910514445 A CN201910514445 A CN 201910514445A CN 110246538 B CN110246538 B CN 110246538B
- Authority
- CN
- China
- Prior art keywords
- target
- small
- nucleic acid
- small molecule
- small molecular
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/115—Aptamers, i.e. nucleic acids binding a target molecule specifically and with high affinity without hybridising therewith ; Nucleic acids binding to non-nucleic acids, e.g. aptamers
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/30—Data warehousing; Computing architectures
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/16—Aptamers
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Wood Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Engineering & Computer Science (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Organic Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Databases & Information Systems (AREA)
- Bioethics (AREA)
- Plant Pathology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供了一种基于高性能计算平台的小分子靶标核酸适配体计算机辅助筛选方法,涉及分子生物学技术领域。首先对小分子靶标进行结构分析,其次在小分子化合物库中进行筛选,如符合匹配原则,则作为目标小分子靶标,与核酸分子进行分子对接,如不符合匹配原则,则可进行分子结构构建,将分子结构构建后的小分子靶标作为目标小分子靶标,与核酸分子进行分子对接,如果对接成功,则核酸分子为初选核酸适配体,解决了小分子靶标与核酸分子的结合位点少、亲和力弱,核酸分子抓靶困难、耗材多,小分子靶标结合核酸形成的复合物与核酸自身的大小、质量、电荷性质等方面差异较小,二者的分离难度大的问题。
Description
技术领域
本发明涉及分子生物学技术领域,尤其是涉及基于高性能计算平台的小分子靶标核酸适配体计算机辅助筛选方法及小分子靶标核酸适配体。
背景技术
计算生物学是一门充满活力的新兴交叉学科,在目前生物学研究中不断扮演着重要的角色,也是目前阐述生物学机理研究的一个重要工具。计算生物学能够完成基于大量生物学数据及复杂的计算过程,是目前生命学科与非生命学科的大交叉,具有高效便捷的特点。在基因与蛋白质的计算机辅助设计、比较基因组分析、生物系统模型、细胞信号传导与基因调控网络研究、专家数据库、生物软件包等领域发挥重要作用。
计算生物学中的蛋白核酸对接技术,为预测蛋白质-核酸复合物结构的有效方法,为研究生物学过程中蛋白质-核酸的相互作用提供了重要的工具。
核酸适配体是从一种人工合成的寡核苷酸文库中筛选得到的能与靶分子高亲和性和高特异性性结合的单链寡核苷酸,可以是单链DNA(ssD-NA),也可以是RNA。它能高亲和性和专一性的与小分子、金属离子、有机物、氨基酸、肽段、核酸、蛋白质甚至整个细胞结合。核酸适配体与各种靶分子的结合是基于单链寡核苷酸的结构和空间构象的多样性。核酸适配体可以通过链内互补碱基G-A、A-U的配对(RNA中还存在G-U配对)以及静电作用、氢键作用等自身形成发夹、茎环、假结、口袋或G-四分体等多种三维空间结构,这些三维结构成为核酸适配体与靶分子特定区域结合的基础,二者之间的结合主要通过“假碱基对”的堆积作用、氢键作用、静电作用。
核酸适配体特有的生化特性使其在生物医学应用领域具备许多优势。核酸适配体的生化特点主要体现在:1)高亲和力。核酸适配体与靶分子的解离常数可达nmol/L或pmol/L水平;2)强稳定性。变性的适配体可在数分钟内复性,便于长期保存和运输;3)无免疫原性,无毒,组织渗透性好;4)可修饰性。如荧光标记、生物素标记等;5)靶分子的广泛性。小到ATP、氨基酸、金属离子,大到蛋白质,甚至完整的病毒、细菌和细胞等。理论上,核酸适配体的靶分子几乎涵盖自然界中的所有物质。6)分子量小。7)稳定性好。8)制备和标记方便等优点。核酸适配体的应用主要体现在:1)在生物医药领域可以利用核酸适配体进行分子诊断和生物体内靶向治疗(治疗新药、药物运输、癌细胞的检测、抗体诊断、生物成像、生物标志物的发现、毒品检测、抗病毒等,具体为:作为治疗新药,部分产品已经通过FDA批准上市;在药物靶向运输中,核酸适配体是最有力的生物配体,因此能准确有效的进行疾病的治疗;借助现代生物技术及分析化学方法,将核酸适配体应用到相应的生物传感器中,可以实现疾病的早期检测;核酸适配体不仅可以提高生物成像的分辨率,还可以找到与恶性肿瘤等疾病相关的生物标志物;能够结合到病毒的特定部位,作为阻断剂影响病毒的复制和翻译等步骤,从而中断疾病的发生,还可以直接识别被感染的细胞。核酸适配体及其筛选技术的不断进步,有助于人们进一步认识分子间的相互作用和疾病发生的分子生物学机制等);2)检测食品安全(小分子食品添加剂或非法添加物问题,对该类物质进行快速、特异、敏感、高通量检测亦迫在眉睫)。3)生物恐怖因子检测(需要快速、特异、敏感、高通量)。
现有的小分子靶标核酸适配体的筛选技术为体外SELEX技术,具体方法如下:筛选过程从化学合成一个1014~1015随机序列的寡核苷酸序列库开始,然后在一定温度下将随机核酸库与小分子靶标置于缓冲液中温育,这时,有极少部分序列可与小分子靶标相互作用,用物理方法(固相亲和层析法或离心法)将这些序列与库中其他序列分离出来,那些不与小分子靶标结合的序列被洗脱出来,用PCR方法扩增放大获得一个亲和力增强的核酸库,然后与小分子靶标再共育进行下一轮的筛选。经过数轮的筛选与放大,对大多数小分子靶标而言,筛选与之相匹配的适配分子需要8~24轮循环,达到亲和饱和,然后对此时的核酸库克隆测序,获得库中每一条序列的信息,并根据每一序列与小分子靶标的亲和力作进一步定性,一旦序列确定下来,再用化学合成方法大量制备适配体分子。
但是,现有的小分子靶标核酸适配体的筛选技术缺点主要体现在:1,小分子靶标与核酸分子的结合位点少、亲和力弱,核酸分子抓靶困难。2,筛选过程中小分子靶标需要固定在特定载体上,耗材多。3,小分子靶标结合核酸形成的复合物与核酸自身的大小、质量、电荷性质等方面差异较小,二者的分离难度大。4,筛选流程复杂、筛选循环次数多。5,耗时长、耗费的人力物力大。6,筛选成功率低。
由此可见,传统的小分子靶标核酸适配体筛选方法是通过指数级富集配体系统进化技术筛选得到,需要对预富集的文库进行测序,再从大量的测序结果中挑选出亲和力高、选择性好的小分子靶标核酸适配体序列,这一过程存在耗时长、效率低、成本高、难以实现自动化的问题。即,该方法周期长,劳动量大,成本高,此外,过多的试验次数和试验周期,会出现错配问题,每次收敛过程,目标序列由于没有得到扩增,从而造成目标序列的丢失。因此,亟待研究一种实验次数少、工作强度低、发展高效快速、准确度高的小分子靶标核酸适配体的方法,以满足日益增长的科学、医疗需求。
应该注意,上面对技术背景的介绍只是为了方便对本发明的技术方案进行清楚、完整的说明,并方便本领域技术人员的理解而阐述的。不能仅仅因为这些技术方案在本发明的技术背景部分进行了阐述而认为上述技术方案为本领域技术人员所公知。
发明内容
本发明的目的在于提供一种快速、特异、敏感、高通量的基于高性能计算平台的小分子靶标核酸适配体计算机辅助筛选方法,能够减少筛选复杂度及次数,大大节约人力、物力且筛选成功率高,相对于传统单纯湿法实验筛选方法,使得筛选准确度更高,目标序列丢失降低,使得筛选更有针对性,解决了小分子靶标与核酸分子的结合位点少、亲和力弱,核酸分子抓靶困难、耗材多,小分子靶标结合核酸形成的复合物与核酸自身的大小、质量、电荷性质等方面差异较小,二者的分离难度大的问题,具有重要的研究意义和使用价值。
为实现上述目的,本发明提供了以下技术方案:
本发明提供的基于高性能计算平台的小分子靶标核酸适配体计算机辅助筛选方法,包括:
步骤一,对小分子靶标进行结构分析;
步骤二,根据匹配原则,在小分子化合物库中对小分子靶标进行筛选;
判断所述小分子靶标是否符合所述匹配原则;
如果所述小分子靶标符合所述匹配原则,则所述小分子靶标作为目标小分子靶标;
如果所述小分子靶标不符合所述匹配原则,则根据小分子靶标结构式进行分子结构构建,将分子结构构建后的小分子靶标作为目标小分子靶标;
步骤三,所述目标小分子靶标在核酸分子数据库中与核酸分子进行分子对接,判断所述目标小分子靶标与所述核酸分子是否对接成功:
如果对接成功,则所述核酸分子为初选核酸适配体;
如果对接不成功,则重复步骤三。
可选地,步骤二中所述匹配原则为所述小分子靶标为不同基团组成的分子、含相同基团的同类分子、基团相同空间结构不同的手性分子及离子。
可选地,根据不同类型的小分子靶标选择不同的结合模式、结合参数或结合结构特征在核酸分子数据库中与核酸分子进行分子对接。
可选地,所述结合模式主要指小分子靶标与核酸适配体的空间结构匹配度。
可选地,所述小分子化合物库为ZING数据库。
可选地,利用检索加速引擎在小分子化合物库中对小分子靶标进行筛选;利用检索加速引擎使得所述目标小分子靶标在核酸分子数据库中与核酸分子进行分子对接。
本发明还提供了一种小分子靶标核酸适配体,所述小分子靶标核酸适配体采用根据上述权利要求所述的基于高性能计算平台的小分子靶标核酸适配体计算机辅助筛选方法制备获得。
本发明提供的技术方案中,通过对小分子靶标进行结构分析,根据匹配原则,在小分子化合物库中对小分子靶标进行筛选,如果小分子靶标符合匹配原则,则小分子靶标作为目标小分子靶标,将目标小分子靶标在核酸分子数据库中与核酸分子进行分子对接,判断目标小分子靶标与核酸分子是否对接成功,如果对接成功,则核酸分子为初选核酸适配体,该筛选方法实验次数少,高效快捷,现有的小分子靶标核酸适配体的筛选技术为体外SELEX技术,筛选过程从化学合成一个1014~1015随机序列的寡核苷酸序列库开始,然后在一定温度下将随机核酸库与小分子靶标置于缓冲液中温育,这时,有极少部分序列可与小分子靶标相互作用,用物理方法(固相亲和层析法或离心法)将这些序列与库中其他序列分离出来,那些不与小分子靶标结合的序列被洗脱出来,用PCR方法扩增放大获得一个亲和力增强的核酸库,然后与小分子靶标再共育进行下一轮的筛选。经过数轮的筛选与放大,对大多数小分子靶标而言,筛选与之相匹配的适配分子需要8~24轮循环,达到亲和饱和,然后对此时的核酸库克隆测序,获得库中每一条序列的信息,并根据每一序列与小分子靶标的亲和力作进一步定性,一旦序列确定下来,再用化学合成方法大量制备适配体分子。现有的小分子靶标核酸适配体的体外SELEX技术筛选技术,其缺点主要体现在:1,小分子靶标与核酸分子的结合位点少、亲和力弱,核酸分子抓靶困难。2,筛选过程中小分子靶标需要固定在特定载体上,耗材多。3,小分子靶标结合核酸形成的复合物与核酸自身的大小、质量、电荷性质等方面差异较小,二者的分离难度大。4,筛选流程复杂、筛选循环次数多。5,耗时长、耗费的人力物力大。6,筛选成功率低。本发明的基于高性能计算平台的小分子靶标核酸适配体计算机辅助筛选方法能够克服现有筛选方法的不足,是一种快速、特异、敏感、高通量的筛选方法,筛选复杂度及次数大大降低,大大节约人力、物力且筛选成功率高的小分子靶标核酸适配体筛选方法。
在本发明的优选方案中,根据不同类型的小分子靶标选择不同的结合模式、结合参数或结合结构特征在核酸分子数据库中与核酸分子进行分子对接,实验次数大大降低,然而,现有的小分子靶标核酸适配体的体外SELEX技术筛选技术,这一过程存在耗时长、效率低、成本高、难以实现自动化的问题。即,该方法周期长,劳动量大,成本高,此外,过多的试验次数和试验周期,使得ssdna和drdna相互转换之间,会出现错配问题,每次收敛过程,目标序列由于没有得到扩增,从而造成目标序列的丢失。本发明的筛选方法实验次数大大降低、工作强度降低、更加高效快速,此外能够有效改进传统筛选方法目标序列丢失、准确度低的核酸适配体筛选的方法,进一步满足日益增长的科学、医疗需求,实用性高。
在本发明的优选方案中,根据匹配原则查询小分子靶标是否能够作为目标小分子靶标,如果小分子靶标不符合匹配原则,则根据小分子靶标结构式进行分子结构构建,将分子结构构建后的小分子靶标作为目标小分子靶标,通过匹配原则的设定,能够率先判断是否需要进行分子结构构建,流程清晰、简化,结果更加精确。
在本发明的优选方案中,匹配原则包括:小分子靶标是否为不同基团组成的分子、含相同基团的同类分子、基团相同空间结构不同的手性分子及离子,如果小分子靶标是不同基团组成的分子、含相同基团的同类分子、基团相同空间结构不同的手性分子及离子,那么小分子靶标符合匹配原则,则小分子靶标作为目标小分子靶标;如果小分子靶标不是不同基团组成的分子、含相同基团的同类分子、基团相同空间结构不同的手性分子或离子,那么小分子靶标不符合匹配原则,则根据小分子靶标结构式进行分子结构构建,将分子结构构建后的小分子靶标作为目标小分子靶标,能够率先判断是否需要进行分子结构构建,流程清晰、简化,结果相对于现有技术更加精确,构建过程:1,查询小分子分子式;2,由小分子分子式确定其结构式;3,由小分子结构式用chemdraw软件构建小分子结构并进行一定的优化,进而得到小分子结构。利用chemdraw进行小分子结构构建,并进行优化,使得筛选更加准确,更加有效的避免了筛选错误。
在本发明的优选方案中,通过并行化技术构建加速引擎,即,利用检索加速引擎在小分子化合物库中对小分子靶标进行筛选;利用检索加速引擎使得目标小分子靶标在核酸分子数据库中与核酸分子进行分子对接,即,通过高性能计算平台提供的加速引擎提高数据库检索、特征匹配、序列比对等计算模拟的速度,可以通过hadoop架构中的Redis来进行加速,大大提高了运算效率。
在本发明的优选方案中,根据不同类型的小分子靶标选择不同的结合模式、结合参数或结合结构特征在核酸分子数据库中与核酸分子进行分子对接,结合模式主要指小分子靶标与核酸适配体在空间结构上的匹配度,首先,进行三类小分子的区分:由分子组成成分,比如有分子含有苯环,有分子含有羟基,由分子含有羧基等,利用这些基团的特征参数(碳六环特征结构、羟基中碳氧距离、取向等参数)加以区分,含相同基团的同类分子及基团相同结构不同的手型分子都由其特定的参数加以筛选。结合模式包括小分子靶标与核酸适配体之间的熵值,焓值,键能等,获得方式有其特定的参数标准(如键长、键角、原子类型等),符合参数标准的即为被选中。
对于三种不同分子的筛选方案步骤分别为:1,不同基团组成的分子,针对该类分子选取特异性结合的位点并选定结合模式及相应的结合构象,之后在核算分子数据库利用检索加速引擎进行分子对接,最终获得该目标小分子靶标的核酸适配体分子(特异性结合位点是指形成氢键的受体集团和配体集团,形成疏水作用的结合腔等,符合条件结合位点主要有氢键形成的受体集团、配体集团、疏水口袋、离子敖合腔等。)(结合构象是指小分子靶标与核酸分子具体结合的样子,比如核酸分子结合到小分子靶标的功能集团、核酸分子结合到小分子靶标的羟基的样子、核酸分子结合到小分子靶标的羧基的样子等。)2,含相同基团的同类分子,针对该类分子除去相同集团与核酸适配体的结合模式,进而针对分子的不同集团选定特定的结合模式及相应的参数,之后利用检索加速引擎在核酸数据库中与核酸分子进行对接,最终获取该特定小分子靶标的核酸适配体。3,基团相同空间结构不同的手性分子,针对该类分子提取由于手性不同而形成空间结构不同的小分子靶标,将已知其中一种空间结构的小分子与核酸分子的结合模式及结合参数“嫁接”到目标小分子靶标分子上,之后利用检索加速引擎在核酸数据库中与核酸分子进行对接,最终获取该特定小分子靶标的核酸适配体(“嫁接”指的是将已知分子的结合模式和结合参数直接用于本发明要研究的分子上),通过三种不同分子归纳出相应的参数,进而将这些参数作为筛选条件,通过计算机加速计算的方法从小分子数据库中筛选出符合这个参数条件的分子,由于采用计算机虚拟筛选的方法,相对于现有技术而言避免了大量的实验耗材、人力及物力的浪费。
在本发明的优选方案中,对于含相同基团的同类分子,除去相同集团的方法是通过特定集团的参数文档,通过计算,将不符合这些参数条件的分子筛选出来,之后在分子库中删除。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例中小分子靶标核酸适配体计算机辅助筛选方法筛选流程图;
图2是本发明实施例中包含匹配原则的小分子靶标核酸适配体计算机辅助筛选方法筛选流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的技术方案进行详细的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本发明所保护的范围。
现有的小分子靶标核酸适配体的筛选技术为体外SELEX技术,具体方法如下:筛选过程从化学合成一个1014~1015随机序列的寡核苷酸序列库开始,然后在一定温度下将随机核酸库与小分子靶标置于缓冲液中温育,这时,有极少部分序列可与小分子靶标相互作用,用物理方法(固相亲和层析法或离心法)将这些序列与库中其他序列分离出来,那些不与小分子靶标结合的序列被洗脱出来,用PCR方法扩增放大获得一个亲和力增强的核酸库,然后与小分子靶标再共育进行下一轮的筛选。经过数轮的筛选与放大,对大多数小分子靶标而言,筛选与之相匹配的适配分子需要8~24轮循环,达到亲和饱和,然后对此时的核酸库克隆测序,获得库中每一条序列的信息,并根据每一序列与小分子靶标的亲和力作进一步定性,一旦序列确定下来,再用化学合成方法大量制备适配体分子。这一过程存在耗时长、效率低、成本高、难以实现自动化的问题。即,该方法周期长,劳动量大,成本高,此外,过多的试验次数和试验周期,会出现错配问题,每次收敛过程,目标序列由于没有得到扩增,从而造成目标序列的丢失。本发明提供了一种小分子靶标核酸适配体计算机辅助筛选方法实验次数少、工作强度低、发展高效快速、准确度高的小分子靶标核酸适配体的方法,以满足日益增长的科学、医疗需求,避免了现有体外SELEX技术的问题存在。
本发明提供一种基于高性能计算平台的小分子靶标核酸适配体计算机辅助筛选方法如图1-图2所示,包括以下步骤:
步骤一,对小分子靶标进行结构分析;
步骤二,根据匹配原则,在小分子化合物库中对小分子靶标进行筛选;
判断小分子靶标是否符合匹配原则;
如果小分子靶标符合匹配原则,则小分子靶标作为目标小分子靶标;
如果小分子靶标不符合匹配原则,则根据小分子靶标结构式进行分子结构构建,将分子结构构建后的小分子靶标作为目标小分子靶标;
步骤三,目标小分子靶标在核酸分子数据库中与核酸分子进行分子对接,判断目标小分子靶标与核酸分子是否对接成功:
如果对接成功,则核酸分子为初选核酸适配体;
如果对接不成功,则重复步骤三。
本发明提供的基于高性能计算平台的小分子靶标核酸适配体计算机辅助筛选方法,首先要对小分子靶标进行结构分析,充分掌握小分子靶标的结构特征,以用于更好地进行筛选。其次要在小分子化合物库中对已知小分子靶标结构的小分子进行筛选,如果符合既定的匹配原则,则可将小分子靶标作为目标小分子靶标,用于与核酸分子进行分子对接,如果不符合既定的匹配原则,则可根据小分子靶标结构式进行分子结构构建,将分子结构构建后的小分子靶标作为目标小分子靶标,用于与核酸分子进行分子对接,如果目标小分子靶标与核酸分子对接成功,则核酸分子为初选核酸适配体。本发明提供的基于高性能计算平台的小分子靶标核酸适配体计算机辅助筛选方法,实验次数少,高效快捷,能够通过模拟分析得到适配信息,并将数据在终端进行展示,并通过计算模拟方法,得到相应生物材料(主要为药物分子、中药活性成分)与核酸分子间可能的相互作用机理,并与前端进行重点展示,相对于传统单纯湿法实验筛选方法,使得筛选准确度更高,筛选更有针对性,具有重要的研究意义和使用价值。
该初选核酸适配体即可作为核酸适配体侯选物,通过该筛选方法,初步筛选出核酸适配体侯选物,初步筛选出的核酸适配体侯选物可与“湿法”实验结合,减少“湿法”实验次数,实验次数的降低:一方面能够节省实验成本,另一方面,减少小分子靶标与核酸序列错配和目标丢失的可能性,提高核酸适配体筛选的成功率。
于本发明的具体实施例中,生物信息学相关数据库包含目前多家国际知名数据库相关数据,主要为小分子数据库和核酸数据库,也可以认为主要分为:蛋白数据库、核酸数据库、小分子化合物数据库、基因序列数据库。于本发明的具体实施例中,生物信息学相关数据库具体主要包括蛋白质小分子ZINC数据库、NCBI基因序列数据库。目前,国际知名蛋白质三维晶体结构数据库,主要分为已有三维晶体蛋白数据库和分子模型数据库,需下载和整合的分子结构数据库主要包括:小分子ZINC数据库、NCBI基因序列数据库分子模型数据库、生物学功能信息库、其它类型数据库,具体细节如下:
(1)小分子化合物数据库
ZINC数据库是全球最大的小分子化合物库,主要包括ZINC先导化合物库、ZINC类药化合物库、ZINC片段库、ZINC天然产物库等,几乎集全了所有的小分子化合物。
(2)传统中药数据库
传统中药数据库(traditional Chinese medicine database platform,TCMSP),该数据库收集了来自于《中国药典》(2015年版一部)499种草药的组分数据,涵盖13144个分子以及29384个化合物,这些分子数据都是有研究组成员经过数年的手动验证添加的,是世界上最大的非商业中药分子数据库之一。
(3)中国天然产物数据库(Neosuite CNPD)
该数据库是创腾科技有限公司和中国科学院上海药物研究所联合开发的综合性天然产物数据库。CNPD数据库目前共收集了37个类别的57,000多个天然产物,其中70%的分子是类药性分子,相关的数据包括天然产物的CAS登录号,名称,分子式,分子量,熔点等理化性质,以及二维及三维分子结构,生物活性,自然来源和参考文献信息。对于原植物或同属中药,还收录了对应的中文名,拉丁文名,性味,归经及功能主治信息。小分子数目:化学成分10000余种,涉及中草药4500余种
该数据库收集了目前研究较为深入的中草药化学成分信息,共收录化学成分10000余种,涉及中草药4500余种。中国天然产物化学成分数据库的建设,将为药物设计和药物研发工作者提供信息全面、方便快捷的信息查询服务。
(4)中药与化学成分数据库
该数据库属上海有机所化学专业数据库系统的一部分,是化学专业数据库最早建设的数据库之一。数据将数千年来中国传统中医的临床实践融合成一个内涵丰富疾病用药-中药药材-化合物性质的多层次信息数据库,其中包括了50000余个处方,1400多种疾病及其用药,22000多种中药材,以及药材中的19700多种化合物。
(5)药物设计相关的数据库
Open National Cancer Institute database,NCI开放数据库(免费数据库),MDL数据库、Chinese Natural Product Database,CNPD数据库,Traditional ChineseMedicine Database,TCMD数据库(商业数据库),SPECS数据库(化学试剂供应商处获数据库)。NCI是由美国国立癌症研究所提供的数据库,其中收集了自1955年以来从有机合成或天然产物中得到的化合物,这些化合物最初主要用于抗癌药物的筛选,最近也用于抗艾滋病的研究。FDA数据库收录的是经过FDA批准已经成药的分子。MDL数据库是MDL化学、生物信息系统的一部分,它主要包括ACD-3D、CMC、MDDR、RXNBRO、Metabolite和Toxicity。其中RXNBRO是一个化学反应数据库,Metabolite是药物代谢库,Toxicity是毒性数据库。
于本发明的具体实施例中,小分子化合物库为ZING数据库。
需要说明的是,上述的生物信息学相关数据库,并不局限于前面列举的几个数据库,其数据库的选取以及来源并不局限于本发明的具体实施例,均是可以根据用户需求以及时代发展来进行实时更新的。
本发明的具体实施例根据匹配原则小分子靶标为不同基团组成的分子、含相同基团的同类分子、基团相同空间结构不同的手性分子或离子,通过匹配原则的设定,能够率先判断是否需要进行分子结构构建,流程清晰、简化,结果更加精确。
于本发明的具体实施例中,步骤二中匹配原则为小分子靶标为不同基团组成的分子、含相同基团的同类分子、基团相同空间结构不同的手性分子及离子,也就是说,首先要对小分子靶标进行结构分析,充分掌握小分子靶标的结构特征,以用于更好地进行筛选。其次要在小分子化合物库中对已知小分子靶标结构的小分子进行筛选,如果小分子靶标为不同基团组成的分子、含相同基团的同类分子、基团相同空间结构不同的手性分子或离子,则可将小分子靶标作为目标小分子靶标,用于与核酸分子进行分子对接,如果小分子靶标并非不同基团组成的分子、含相同基团的同类分子、基团相同空间结构不同的手性分子或离子,则可根据小分子靶标结构式进行分子结构构建,将分子结构构建后的小分子靶标作为目标小分子靶标,用于与核酸分子进行分子对接,如果目标小分子靶标与核酸分子对接成功,则核酸分子为初选核酸适配体。该方法能够通过模拟分析得到适配信息,并将数据在终端进行展示,并通过计算模拟方法,得到相应生物材料(主要为药物分子、中药活性成分)与核酸分子间可能的相互作用机理,并与前端进行重点展示,相对于传统单纯湿法实验筛选方法,使得筛选准确度更高,筛选更有针对性。
为了保证数据库系统数据的及时性,于本发明的具体实施例中,还需要书写即时更新程序,将相应数据库中的最新更新所有数据,分批下载与保存,确保数据库后台调用数据的即时性,从而充分保证数据的准确程度。
于本发明的具体实施例中,在对接过程中:根据不同类型的小分子靶标选择不同的结合模式、结合参数或结合结构特征在核酸分子数据库中与核酸分子进行分子对接。结合模式包括小分子靶标与核酸适配体之间的熵值,焓值,键能等。结合模式主要指小分子靶标与核酸适配体的空间结构匹配度。于本发明的具体是实施例中,关于小分子构建模块,需要安装的软件包括结构比对、结构构建及优化三大模块。其中结构比对、结构构建目前常用的chemdraw软件流程,结构优化软件则包括chem3D等。其中chemdraw软件我们只是利用其中的部分模块,因此需要对其进行重新编辑和整合;chem3D软件拥有Linux系统版本调用命令,在一体化流程中,将改软件设定为首要建模软件;chemdraw等软件可留有端口与线服务器相连,需要书写响应的流程,进行在线整合。对于小分子构建软件,需要针对不同的分子不同进行流程甄别,充分优化已构建的小分子结构,以便体系的相对可靠性。于本发明的具体实施例中,如果小分子靶标不是不同基团组成的分子、含相同基团的同类分子、基团相同空间结构不同的手性分子或离子,那么小分子靶标不符合匹配原则,则根据小分子靶标结构式进行分子结构构建,将分子结构构建后的小分子靶标作为目标小分子靶标,能够率先判断是否需要进行分子结构构建,流程清晰、简化,结果相对于现有技术更加精确,构建过程:1,查询小分子分子式;2,由小分子分子式确定其结构式;3,由小分子结构式用chemdraw软件构建小分子结构并进行一定的优化,进而得到小分子结构,利用chemdraw进行小分子结构构建,并进行优化,使得筛选更加准确,更加有效的避免了筛选错误。
在本发明的优选方案中,评定目标小分子靶标和核酸的参数指标有多个,一个为能量结合情况,能量越低越好。一个为结合口袋及两分子的构象关系,如正负电和亲疏水等。如果目标小分子靶标分别与核酸a和核酸b结合,如果与b结合时的结合能量低,那么结合b构象时比结合a构象时稳定,但是b构象中的主要疏水部分结合在了目标小分子靶标的亲水端,那即便b构象的能量低,也是不可取的。筛选更加准确,更加有效的避免了筛选错误。
首先,进行小分子的区分:由分子组成成分,比如有分子含有苯环,有分子含有羟基,由分子含有羧基等,利用这些基团的特征参数(碳六环特征结构、羟基中碳氧距离、取向等参数)加以区分,含相同基团的同类分子及基团相同结构不同的手型分子都由其特定的参数加以筛选。结合模式主要指小分子靶标与核酸适配体的空间结构匹配度,符合参数标准的即为被选中。
对于三种不同分子的筛选方案步骤分别为:1,不同基团组成的分子,针对该类分子选取特异性结合的位点并选定结合模式及相应的结合构象,之后在核酸分子数据库利用检索加速引擎进行分子对接,最终获得该目标小分子靶标的核酸适配体分子(特异性结合位点是指核酸分子与小分子化合物结合构象空间高度匹配。)(结合构象是指小分子靶标与核酸分子具体结合的样子,比如核酸分子结合到小分子靶标的功能集团、核酸分子结合到小分子靶标的羟基的样子、核酸分子结合到小分子靶标的羧基的样子等。)2,含相同基团的同类分子,针对该类分子除去相同集团与核酸适配体的结合模式,进而针对分子的不同集团选定特定的结合模式及相应的参数,之后利用检索加速引擎在核酸数据库中与核酸分子进行对接,最终获取该特定小分子靶标的核酸适配体。3,基团相同空间结构不同的手性分子,针对该类分子提取由于手性不同而形成空间结构不同的小分子靶标,将已知其中一种空间结构的小分子与核酸分子的结合模式及结合参数“嫁接”到目标小分子靶标分子上,之后利用检索加速引擎在核酸数据库中与核酸分子进行对接,最终获取该特定小分子靶标的核酸适配体(“嫁接”指的是将已知分子的结合模式和结合参数直接用于本发明要研究的分子上),4,对于离子,根据离子性质利用检索加速引擎在核酸数据库中与核酸分子进行对接,最终获取该特定离子靶标的核酸适配体。通过四种不同分子归纳出相应的参数,进而将这些参数作为筛选条件,通过计算机加速计算的方法从小分子数据库中筛选出符合这个参数条件的分子,由于采用计算机虚拟筛选的方法,相对于现有技术而言避免了大量的实验耗材、人力及物力的浪费。
具体地,于本发明地具体实施例中,对于含相同基团的同类分子,除去相同集团的方法是通过特定集团的参数文档,通过计算,将不符合这些参数条件的分子筛选出来,之后在分子库中删除。
实施例1:如目标小分子靶标结合核酸a的构象时能量为-5Kcal/mol,结合b构象时能量为-6Kcal/mol,那么结合b构象时比结合a构象时稳定,这个值一般情况下-3Kcal/mol以下才算是可取的,因此,一般情况下b构象是可取的。
实施例2:如目标小分子靶标结合核酸a的构象时能量是-5Kcal/mol,结合b构象时能量为-6Kcal/mol,但是b构象中的主要疏水部分结合在了目标小分子靶标的亲水端,那即便b构象的能量低,b构象也是不可取的。
实施例3:如目标小分子靶标结合核酸a的构象时能量是-5Kcal/mol,结合b构象时能量为-6Kcal/mol,但是b构象中的主要亲水部分结合在了目标小分子靶标的亲水端,那么b构象的能量低,且b构象中的主要亲水部分结合在了目标小分子靶标的亲水端,因此,b构象可取。
于本发明的具体实施例中,利用检索加速引擎在小分子化合物库中对小分子靶标进行筛选;利用检索加速引擎使得目标小分子靶标在核酸分子数据库中与核酸分子进行分子对接。通过并行化技术构建加速引擎,对核酸序列在核酸数据库中的特征值匹配与检索进行加速,可以通过hadoop架构中的Redis来进行加速,大大提高了运算效率。
本发明还提供一种小分子靶标核酸适配体,小分子靶标核酸适配体采用根据上述的基于高性能计算平台的小分子靶标核酸适配体计算机辅助筛选方法制备获得获得,克服现有筛选方法的不足,是一种快速、特异、敏感、高通量的筛选方法,筛选复杂度及次数大大降低,大大节约人力、物力且筛选成功率高的小分子靶标核酸适配体筛选方法。通过该高性能计算平台的核酸适配体计算机辅助筛选方法获得的初选的核酸适配体,准确度更高,分子量小、易于合成与修饰,能够高特异性识别并且具有高亲和力,相容性更好,准确度更高,能够满足日益增长的科学、医疗需求。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (7)
1.一种基于高性能计算平台的小分子靶标核酸适配体计算机辅助筛选方法,其特征在于,包括:
步骤一,对小分子靶标进行结构分析;
步骤二,根据匹配原则,在小分子化合物库中对小分子靶标进行筛选;
判断所述小分子靶标是否符合所述匹配原则;
如果所述小分子靶标符合所述匹配原则,则所述小分子靶标作为目标小分子靶标;
如果所述小分子靶标不符合所述匹配原则,则根据小分子靶标结构式进行分子结构构建,将分子结构构建后的小分子靶标作为目标小分子靶标;
步骤三,所述目标小分子靶标在核酸分子数据库中与核酸分子进行分子对接,判断所述目标小分子靶标与所述核酸分子是否对接成功:
如果对接成功,则所述核酸分子为初选核酸适配体;
如果对接不成功,则重复步骤三。
2.根据权利要求1所述的基于高性能计算平台的小分子靶标核酸适配体计算机辅助筛选方法,其特征在于,步骤二中所述匹配原则为所述小分子靶标为不同基团组成的分子、含相同基团的同类分子、基团相同空间结构不同的手性分子及离子。
3.根据权利要求2所述的基于高性能计算平台的小分子靶标核酸适配体计算机辅助筛选方法,其特征在于,根据不同类型的小分子靶标选择不同的结合模式、结合参数或结合结构特征在核酸分子数据库中与核酸分子进行分子对接。
4.根据权利要求3所述的基于高性能计算平台的小分子靶标核酸适配体计算机辅助筛选方法,其特征在于,所述结合模式主要指小分子靶标与核酸适配体的空间结构匹配度。
5.根据权利要求1所述的基于高性能计算平台的小分子靶标核酸适配体计算机辅助筛选方法,其特征在于,所述小分子化合物库为ZING数据库。
6.根据权利要求1所述的基于高性能计算平台的小分子靶标核酸适配体计算机辅助筛选方法,其特征在于,利用检索加速引擎在小分子化合物库中对小分子靶标进行筛选;利用检索加速引擎使得所述目标小分子靶标在核酸分子数据库中与核酸分子进行分子对接。
7.一种小分子靶标核酸适配体,其特征在于,所述小分子靶标核酸适配体采用根据权利要求1-6项中任一项所述的基于高性能计算平台的小分子靶标核酸适配体计算机辅助筛选方法制备获得。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910514445.4A CN110246538B (zh) | 2019-06-14 | 2019-06-14 | 基于高性能计算平台的小分子靶标核酸适配体计算机辅助筛选方法及小分子靶标核酸适配体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910514445.4A CN110246538B (zh) | 2019-06-14 | 2019-06-14 | 基于高性能计算平台的小分子靶标核酸适配体计算机辅助筛选方法及小分子靶标核酸适配体 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110246538A CN110246538A (zh) | 2019-09-17 |
CN110246538B true CN110246538B (zh) | 2021-05-07 |
Family
ID=67887202
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910514445.4A Active CN110246538B (zh) | 2019-06-14 | 2019-06-14 | 基于高性能计算平台的小分子靶标核酸适配体计算机辅助筛选方法及小分子靶标核酸适配体 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110246538B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113129996B (zh) * | 2021-03-22 | 2022-04-12 | 复旦大学 | 一种基于分子动力学模拟的核酸适配体优化设计方法 |
CN114121154A (zh) * | 2021-10-18 | 2022-03-01 | 江南大学 | 一种利用分子设计导向提高适配体特异性和亲和力的方法 |
CN114334037B (zh) * | 2021-12-23 | 2022-09-30 | 上海智药科技有限公司 | 分子对接的处理方法、装置及电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107446929A (zh) * | 2017-08-31 | 2017-12-08 | 天津科技大学 | 特异识别赭曲霉毒素a的核酸适配体及其制备方法 |
CN108197429A (zh) * | 2018-01-03 | 2018-06-22 | 中国科学院亚热带农业生态研究所 | 一种基于分子对接技术的代谢物肽适体快速筛选方法 |
CN108231206A (zh) * | 2018-01-05 | 2018-06-29 | 中国农业大学 | 一种蜕皮激素类似物的筛选方法及先导化合物 |
-
2019
- 2019-06-14 CN CN201910514445.4A patent/CN110246538B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107446929A (zh) * | 2017-08-31 | 2017-12-08 | 天津科技大学 | 特异识别赭曲霉毒素a的核酸适配体及其制备方法 |
CN108197429A (zh) * | 2018-01-03 | 2018-06-22 | 中国科学院亚热带农业生态研究所 | 一种基于分子对接技术的代谢物肽适体快速筛选方法 |
CN108231206A (zh) * | 2018-01-05 | 2018-06-29 | 中国农业大学 | 一种蜕皮激素类似物的筛选方法及先导化合物 |
Non-Patent Citations (3)
Title |
---|
Screening and Identification of Aptamers Against Pulmonary Surfactant Protein A;Li-Juan LIU等;《Chinese Journal of Analytical Chemistry》;20131130;1659-1663页 * |
全细胞的核酸适配体筛选的研究进展;刘品多等;《色谱》;20160430;382-388页 * |
小分子靶标的核酸适配体筛选的研究进展;王勇等;《色谱》;20160430;361-369页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110246538A (zh) | 2019-09-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bentzen et al. | Evolution of MHC-based technologies used for detection of antigen-responsive T cells | |
Navien et al. | In silico molecular docking in DNA aptamer development | |
CN110246538B (zh) | 基于高性能计算平台的小分子靶标核酸适配体计算机辅助筛选方法及小分子靶标核酸适配体 | |
Wang et al. | Multiparameter particle display (MPPD): a quantitative screening method for the discovery of highly specific aptamers | |
Weisbrod et al. | In vivo protein interaction network identified with a novel real-time cross-linked peptide identification strategy | |
CN105264088B (zh) | 提高鉴定细胞中的多个表位的动态范围 | |
AU2014337093B2 (en) | Methods and systems for identifying disease-induced mutations | |
Wilson et al. | Functional requirements for specific ligand recognition by a biotin-binding RNA pseudoknot | |
Chen et al. | Protein microarrays | |
CN103134938B (zh) | 适体在蛋白质组学中的用途 | |
Kodadek | Development of protein-detecting microarrays and related devices | |
Zichi et al. | Proteomics and diagnostics: Let's Get Specific, again | |
Bakhshinejad et al. | Phage display biopanning and isolation of target-unrelated peptides: in search of nonspecific binders hidden in a combinatorial library | |
Lokesh et al. | X-aptamer selection and validation | |
WO2019083856A1 (en) | METHODS AND SYSTEMS FOR PROTEIN IDENTIFICATION | |
Shangguan et al. | Cell-SELEX: Aptamer selection against whole cells | |
Zumrut et al. | Ligand-guided selection with artificially expanded genetic information systems against TCR-CD3ε | |
Cole et al. | High-throughput methods in aptamer discovery and analysis | |
Lombard-Banek et al. | Mass spectrometry advances and perspectives for the characterization of emerging adoptive cell therapies | |
Goto et al. | Development of aptamers against unpurified proteins | |
Mirian et al. | Generation of HBsAg DNA aptamer using modified cell-based SELEX strategy | |
Glasscock et al. | Computational design of sequence-specific DNA-binding proteins | |
Lee et al. | Small-molecule binding and sensing with a designed protein family | |
Rollins et al. | 3D protein structure from genetic epistasis experiments | |
Bastas et al. | Bioinformatic requirements for protein database searching using predicted epitopes from disease-associated antibodies |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP01 | Change in the name or title of a patent holder |
Address after: 249 Dongsi South Street, Dongcheng District, Beijing 100094 Patentee after: Beijing Computing Center Co.,Ltd. Address before: 249 Dongsi South Street, Dongcheng District, Beijing 100094 Patentee before: BEIJING COMPUTING CENTER |
|
CP01 | Change in the name or title of a patent holder |