CN110352459A - 靶向非结构-结构转移位点的新药候选物质挖掘方法及新药候选物质挖掘装置 - Google Patents

靶向非结构-结构转移位点的新药候选物质挖掘方法及新药候选物质挖掘装置 Download PDF

Info

Publication number
CN110352459A
CN110352459A CN201780072772.8A CN201780072772A CN110352459A CN 110352459 A CN110352459 A CN 110352459A CN 201780072772 A CN201780072772 A CN 201780072772A CN 110352459 A CN110352459 A CN 110352459A
Authority
CN
China
Prior art keywords
mentioned
structural
candidate
compound
protein
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201780072772.8A
Other languages
English (en)
Other versions
CN110352459B (zh
Inventor
罗仁圣
金敏煐
弗拉基米尔·乌弗斯凯
金喆根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industry University Cooperation Foundation IUCF HYU
Original Assignee
Industry University Cooperation Foundation IUCF HYU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industry University Cooperation Foundation IUCF HYU filed Critical Industry University Cooperation Foundation IUCF HYU
Publication of CN110352459A publication Critical patent/CN110352459A/zh
Application granted granted Critical
Publication of CN110352459B publication Critical patent/CN110352459B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6845Methods of identifying protein-protein interactions in protein mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • G16B35/20Screening of libraries
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2500/00Screening for compounds of potential therapeutic value
    • G01N2500/02Screening involving studying the effect of compounds C on the interaction between interacting molecules A and B (e.g. A = enzyme and B = substrate for A, or A = receptor and B = ligand for the receptor)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Medicinal Chemistry (AREA)
  • Immunology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Biochemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Library & Information Science (AREA)
  • Food Science & Technology (AREA)
  • Microbiology (AREA)
  • Pathology (AREA)
  • Cell Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Computing Systems (AREA)
  • Physiology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

靶向非结构‑结构转移位点的新药候选物质挖掘方法包括:计算机装置利用生物信息学而确定靶蛋白的非结构‑结构转移位点的步骤;上述计算机装置执行将上述非结构‑结构转移位点作为对象而联动了特定的化合物库的分子对接而在上述化合物库中选择与上述非结构‑结构转移位点能够结合的第一候选化合物的步骤;以及上述计算机装置执行对于上述第一候选化合物和上述非结构‑结构转移位点的分子动力学模拟而在上述第一候选化合物中选择第二候选化合物的步骤。

Description

靶向非结构-结构转移位点的新药候选物质挖掘方法及新药 候选物质挖掘装置
技术领域
以下说明的技术涉及一种挖掘能够使用于新药开发的候选物质的技法。
背景技术
制药行业最近在开发用于新药开发的各种平台。使用用于新药物质挖掘的平台而在节减新药开发所需的时间和费用。
迄今为止,大多数抗癌剂基于在癌细胞表面存在的信号传递受体和对细胞内信号传递起重要作用的磷酸化酶/去磷酸化酶的抑制。然而,这种受体和酶也参与正常细胞的存活,因此,所开发的抗癌剂影响正常细胞,从而会产生严重的副作用。最近也在酝酿着靶向参与根本性基因表达调节的转录因子和表观基因组的治疗剂开发。然而,生物体内正常细胞的维持也需要这些因子,因此不容易找到具有有效性的靶标。
在最活跃地进行的抗癌剂开发中在新颖地出现癌症干细胞(cancer stem cell,CSC)概念。已知与正常干细胞相同地在肿瘤中也存在CSC,通过固有的基因调节网络而维持CSC的特性并产生各种分化癌细胞,从而引起抗癌剂抗性、癌症复发以及癌症转移。由此,实际情况是需要开发根据CSC的维持机制的理解的能够控制新CSC的抗癌剂。有必要开发调节非CSC与CSC细胞之间的可塑性而能够诱导CSC细胞的分化及生成抑制的技术,这种技术的开发最终会与能够彻底治疗癌症的新概念靶癌症治疗剂的开发衔接。
发明内容
技术问题
在治疗剂开发方法中,将特定细胞系作为对象而筛查天然产物或化学合成物库,从而鉴定诱导癌细胞的细胞死亡或向正常细胞的分化的候选物质,或者,确认与特定靶蛋白的结合/表达,从而鉴定候选物质。这种方法由于能够将各种物质作为对象而进行筛查,因此具有能够鉴定最佳候选物质的优点,与此相反,存在花费很多时间和经费的缺点。在靶蛋白的三级结构被揭示的情况下,还能够通过计算机模拟而有效地鉴定能够与靶位点的结构结合的候选物质。然而,在生物体中靶蛋白的三级结构被揭示的例子是有限的,且通过各种修饰或与各种蛋白质的相互作用而显示作用,因此,在实际在细胞/生物体中处理候选物质的情况下,有可能不出现预测的效果。
况且,已知调节生命现象的主要调节性蛋白质并不具有固定的三级结构而是通过特定修饰或与其它蛋白质的相互作用而具有特定结构(Dyson H and Wright PE,Intrinsically unstructured proteins and their function.Nat Rev Mol Cell Biol,2005,6:197)。这种非结构性位点(disordered region)不仅保存得良好,而且已确认出以与对方蛋白质相遇而构成特定结构的方式结合的机制。因此,若开发出能够导出靶向这种非结构性位点的候选物质的方法,则将能够广泛地应用于能够调节正常和非正常生命现象的新候选物质的开发。
IDP(intrinsically disordered protein,固有无序蛋白质)与其它蛋白质形成稳定的复合物或响应于外部信号而执行伴随结合-非结合变化的动态且灵敏的转换作用(Uversky VN,(Intrinsically disordered)splice variants in the proteome:implications for novel drug discovery.Genes Genome,2016,38:577)。另外,IDPs随周围环境而示出其它结构,且随细胞环境还示出其它功能(Uversky VN and Dunker AK,Understanding protein non-folding.Biochim Biophys Acta,2010,1804:1231)。因此,通过现有的计算机模拟方法就难以导出靶向这种IDP的候选物质。
进而,在导出的候选物质为大小较小的化合物的情况下,除了与特定靶蛋白的特异性结合之外,还与其它非靶蛋白结合,从而还会示出意想不到的副作用。其结果,虽然推断出在生物体内发生650,000件蛋白质-蛋白质相互作用,但迄今为止仅有1件蛋白质-蛋白质相互作用抑制化合物被允许进行临床试验,因而是未开拓的领域(Douglas R.Green,ABH3Mimetic for Killing Cancer Cells.Cell,2016,165:1560)。
以下说明的技术将提供一种挖掘以非结构-结构变异位点为基准抑制或激活特定蛋白质表达的新候选物质的技法或平台。
解决问题方案
靶向非结构-结构转移位点的新药候选物质挖掘方法包括:计算机装置利用生物信息学而确定靶蛋白的非结构-结构转移位点的步骤;上述计算机装置执行将上述非结构-结构转移位点作为对象而联动了特定的化合物库的分子对接(molecular docking)而在上述化合物库中选择与上述非结构-结构转移位点能够结合的第一候选化合物的步骤;以及上述计算机装置执行对于上述第一候选化合物和上述非结构-结构转移位点的分子动力学模拟而在上述第一候选化合物中选择第二候选化合物的步骤。进而,靶向非结构-结构转移位点的新药候选物质挖掘方法能够进一步包括验证上述第二候选化合物是否还与其它候选蛋白质结合的步骤。
发明效果
以下说明的技术能够非常快速地导出新药候选物质而无需经过诸多实验。进而,以下说明的技术预先排除预料有副作用的物质,从而空前节省新药开发所需的费用和时间。
附图说明
图1是对于将MBD2和p66α作为对象而鉴定了非结构-结构转移区域的结果的例子。
图2是对于靶蛋白MBD2和候选化合物执行了分子动力学模拟的结果的例子。
图3是对于鉴定的候选化合物将p66α作为对象而执行了分子对接以及分子动力学分析的例子。
图4是2种候选化合物的结构以及通过免疫共沉淀法(co-immunoprecipitationassay,Co-IP)分析了MBD2和p66α的相互作用抑制能力的结果数据。
图5是示出2种候选化合物的处理在CP2c转录因子复合物的靶基因表达中影响MBD2或p66α作用的效果的Luc reporter assay(荧光素酶报告基因分析)的结果数据。
图6是对于靶向非结构-结构转移位点的新药候选物质挖掘方法的流程图的例子。
图7是对于执行针对挖掘的候选物质的验证的过程的流程图的例子。
图8是对于靶向非结构-结构转移位点的新药候选物质挖掘装置的例子。
具体实施方式
如前面所述,蛋白质的非结构性位点并不具有定型化的结构。因此,尚未应用于现有利用了计算机的候选化合物鉴定。
然而,以下说明的技术在预测通过蛋白质相互作用而会发生非结构-结构转移(disorder-to-order transition)的区域执行分子对接以及分子动力学模拟而鉴定候选化合物。进而,以下说明的技术还能够预先确认鉴定的候选化合物是否具有与其它蛋白质结合的副作用。另外,通过实验确认出通过以下说明的技术鉴定的候选化合物在培养细胞系以及动物模型中示出了有效性。
在蛋白质结构中,非结构(disorder)区域是指结构并未定型化的部分。结构(order)区域是指起生化反应而使结构定型化的部分。
候选化合物是指与特定蛋白质的特定位点结合而抑制或激活该蛋白质的作用的物质。候选化合物可以成为对于特定疾病的新药候选物质。
计算机装置执行以下说明的新药候选物质挖掘。计算机装置包括诸如个人计算机、笔记本电脑、智能设备等终端装置。进而,计算机装置还包括如分析服务器那样的网络上的对象。在后者的情况下,用户通过客户端装置与服务器连接而执行鉴定新药候选物质的过程。对于用来挖掘新药候选物质的装置或系统将在下面叙述。
以下说明的技术通过具体实验而举证了候选物质鉴定及效果。以下以MBD2-p66α(GATAD2A)相互作用位点为中心进行说明。染色质重塑复合物(chromatin remodelingcomplex,CRC)Mi-2/NuRD虽然对于正常细胞的存活也重要,但在癌细胞中也执行重要作用。MBD2-p66α(GATAD2A)相互作用位点对于维持Mi-2/NuRD的结构是重要的。在以下说明中,说明将MBD2-p66α(GATAD2A)相互作用位点作为对象执行分子对接以及分子动力学模拟而鉴定候选化合物的过程。这里,候选化合物是妨碍MBD2-p66α相互作用而抑制完整的复合物组成的物质。
首先,对于用来说明鉴定新药候选物质的过程的靶蛋白进行说明。当然,这是将特定靶蛋白作为一个例子而进行说明。
靶蛋白的筛选
肿瘤中的癌细胞彼此不相同,这些各种癌细胞起源于癌症干细胞(CSC),据报告,染色质重塑复合物(CRC)与癌症的转移和复发也相关。因此,肿瘤的形成最终归因于致癌基因(oncogene)以及肿瘤抑制基因(tumor suppressor)的突变,但CSC的表观遗传调节机制(DNA甲基化、核小体重构以及组蛋白修饰)不仅对这种肿瘤的起源还对肿瘤的维持和转移起重要作用。
根据在先研究报告,在抑制这种表观遗传调节机制的作用的情况下,能够控制CSC的自我复制以及各种分化癌细胞的出现,从而能够有效地抑制癌症的转移和复发。因此,已开发出各种类型的DNA甲基化酶抑制剂以及组蛋白去乙酰化酶(HDACs)抑制剂而在进行临床实验,这些抑制剂虽然能够有效地控制癌细胞,但不仅也影响正常细胞,而且存在示出严重的毒性的问题。
例如,在启动子中的DNA甲基化与染色质以及核小体维持密切的关系,且抑制靶基因的表达。彼此示出相互作用的各种蛋白质复合物参与启动子的DNA甲基化过程。掌管基因表达抑制所必需的组蛋白蛋白质的去乙酰化的HDACs也总是参与通过DNA甲基化的靶基因表达抑制。然而,HDACs是各种转录抑制复合物的成员。因此,控制其的抗癌剂只能示出副作用。
因此,基于表观遗传学的理想的抗癌剂是转录抑制复合物的成员,另外,应当将对正常细胞功能并不是必需且具有癌细胞特异性的成员作为靶标。
Mi-2/NuRD染色质重塑复合物识别甲基化的DNA区域并与其结合而抑制转录。另外,Mi-2/NuRD染色质重塑复合物还包括HDAC而作为成员。Mi-2/NuRD复合物不仅能够与DNA甲基化位点还能够与DNA甲基化酶直接结合,因此在表观遗传方面对基因表达抑制执行非常重要的功能。
在用于药物候选物质鉴定的实验中,将Mi-2/NuRD CRC组成蛋白质中MBD2设定成靶标。MBD2具有如下特征。
1)MBD2基因敲除(knock out)小鼠示出了正常的存活和繁殖而未示出显著的有害效果(Hendrich B,Guy J,Ramsahoye B,Wilson VA,Bird A,Closely related proteinsMBD2and MBD3play distinctive but interacting roles in mouse development.GenesDev,2001,15:710)。
2)在癌细胞系以及癌症移植动物模型中降低MBD2的表达的情况下,示出癌症的生长抑制效果(Slack A,Bovenzi V,Bigey P,Ivanov MA,Ramchandani S,Bhattacharya S,tenOever B,Lamrihi B,Scherman D,Szyf M,Antisense MBD2gene therapy inhibitstumorigenesis.J Gene Med,2002,4:381;Sansom OJ,Berger J,Bishop SM,Hendrich B,Bird A,Clarke AR,Deficiency of Mbd2suppresses intestinal tumorigenesis.NatGenet,2003,34:145;Mian OY,Wang SZ,Zhu SZ,Gnanapragasam MN,Graham L,Bear HD,Ginder GD,Methyl-binding domain protein 2-dependent proliferation andsurvival of breast cancer cells.Mol Cancer Res,2011,9:1152)。
在研究小鼠红白血病(murine erythroleukemia,MEL)细胞系模型中通过转录因子CP2c(也命名为TFCP2、LSF、LBP1、USF)的珠蛋白基因转录调节机制的过程中确认出正常的红细胞分化过程必需MBD2的表达衰减。MEL细胞系虽然是在红细胞分化过程中在原红细胞(proerythroblast)状态下分化停止的癌细胞,但在培养液中处理如二甲基亚砜(DMSO)或六亚甲基双乙酰胺(HMBA)那样的化学诱导物质,则与末端分化一起示出珠蛋白基因表达。
另外,已确认出CP2c形成CP2b以及PIAS1蛋白质和CBP复合物并参与红细胞特异性珠蛋白基因转录(Kang HC,Chae JH,Lee YH,Park MA,Shin JH,Kim SH,Ye SK,Cho YS,Fiering S,Kim CG,Erythroid cell-specific alpha-globin gene regulation by theCP2transcription factor family.Mol Cell Biol,2005,25:6005;Kang HC,Chae JH,Jeon J,Kim W,Ha DH,Shin JH,Kim CG,Kim CG,PIAS1regulates CP2c localization andactive promoter complex formation in erythroid cell-specific alpha-globinexpression.Nucleic Acids Res,2010,38;5456)。
另外,通过酵母双杂交分析(Yeast two hybrid assay)方法已揭示出Mi-2/NuRDCRC成员之一即p66α(GATAD2A)与CP2c直接结合(Kang HC,Chung BM,Chae JH,Yang SI,KimCG,Kim CG,Identification and characterization of four novel peptide motifsthat recognize distinct regions of the transcription factor CP2.FEBS J,2005,272:1265)。
本发明的各发明人已确认出,p66α通过与CP2c结合而抑制CBP转录因子复合物(CP2c、CP2b以及PIAS1)的转录活性,且在使p66α的表达衰减的MEL细胞系静脉注射到免疫缺陷小鼠的情况下,不仅显著抑制了正常对照组细胞所示出的脾肿大(splenomegaly)现象,而且显著抑制了血液、脾脏以及肝脏的肿瘤形成。而且确认出,p66α的表达在诱导MEL细胞红细胞分化时以及在骨髓的红细胞分化过程中维持一定,与此相反,已知作为Mi-2/NuRDCRC的其它成员之一而与p66α直接结合的MBD2的表达急剧减少。
实际上,不仅CBP复合物的转录活性示出了与MBD2的表达成反比例的关系,而且使MBD2的表达衰减的MEL细胞系示出了自发的红细胞分化。另外,确认出MBD2通过与p66α的相互作用而参与CBP复合物的活性,并揭示出如下新的事实:存在于未分化MEL细胞中的Mi-2/NuRD CRC作为具有MBD2的典型的CRC(restrictive Mi-2/NuRD CRC)而抑制靶基因的表达,与此相反,在正常的红细胞分化时,MBD2并不存在的(permissive)Mi-2/NuRD CRC在并未从珠蛋白基因启动子分离的状态下有助于CBP复合物的转录活性。
从前面所述的实验结果中可推断MBD2不影响正常细胞的存活,且MBD2-p66α相互作用对Mi-2/NuRD CRC的基因表达抑制功能重要。以下在MBD2-p66α相互作用对Mi-2/NuRDCRC的基因表达抑制功能重要的前提下,以MBD2-p66α相互作用位点为中心说明挖掘能够成为抗癌剂的候选物质的过程。即、以下说明以称为“MBD2-p66α”的相互作用蛋白质为中心进行记载。然而,就以下说明的技术而言,参与特定疾病的蛋白质一旦被特定,则能够通用地适用于寻找与该蛋白质的特定位点结合而抑制或激活基因表达的新药候选物质的过程。
接下来,以前面所述的靶蛋白MBD2(MBD2-p66α)为基准说明鉴定新药候选物质的过程。
基于分子对接及分子动力学模拟的靶向MBD2-p66α相互作用位点的治疗剂候选物 质挖掘
(1)第一个步骤是鉴定靶蛋白的结构中的非结构-结构转移区域(disorder-to-order transition site)。对于MBD2和p66α通过包括IDP(intrinsic disorderprediction,固有非结构预测)、序列比对(sequence alignment)、结构比对(structuralalignment)的生物信息学技术而鉴定在MBD2与p66α之间的非结构-结构转移区域。
根据非结构区域预测必要性,迄今为止的研究提出有比蛋白质的结构数据更多地利用已知的序列数据的方法、提取示出蛋白质的特定性质的特征(feature)并通过分类/预测算法而预测区域的方法等。从蛋白质序列数据预测非结构区域的现有的分类/预测技法利用在主要序列数据适用滑动窗口(sliding window)并使用特征选择(featureselection)方法而生成的各种模式(pattern)。接着,将这些模式输入到二元分类/预测模型中而预测非结构区域。主要使用SVM(Support Vector Machine,支持向量机)、NNs(Neural Networks、神经网络)、回归分析(Regression)等。
图1是对于将MBD2和p66α作为对象而鉴定了非结构-结构转移区域的结果的例子。图1相当于适用了以对于MBD2和p66α的结构信息为基准寻找非结构区域的预测模型的结果。图1是使用PONDR-FIT、PONDR-VLXT以及PONDR-VSL2而寻找了非结构区域的例子。将各个蛋白质氨基酸序列输入到PONDR-FIT、PONDR-VLXT以及PONDR-VSL2中而按照各组成氨基酸预测了非结构分数(disorder score)。另外,对于三种非结构分数结果以氨基酸为单位测定了平均值(AVERAGE)。按照氨基酸顺序对平均值进行了图表化,其结果,在与各对方蛋白质相互作用的位点共同地出现了大致40个氨基酸连续增加区间。另一方面,已揭示出这些区域的N-末端在MBD2中能够与各相互作用蛋白质形成结合结构。图1中以虚线四边形表示的区域相当于在MBD2与p66α之间的非结构-结构转移区域。
另一方面,可确认出对于MBD2的非结构-结构转移区域的一部分与过去已知的MBD2和p66α的相互作用位点一致(Gnanapragasam MN,Scarsdale JN,Amaya ML,Webb HD,Desai MA,Walavalkar NM,Wang SZ,Zu Zhu S,Ginder GD,Williams DC Jr,p66Alpha-MBD2coiled-coil interaction and recruitment of Mi-2are critical for globingene silencing by the MBD2-NuRD complex.Proc Natl Acad Sci USA,2011,108:7487;Walavalkar NM,Gordon N,Williams DC Jr,Unique features of the anti-parallel,heterodimeric coiled-coil interaction between methyl-cytosine binding domain2(MBD2)homologues and GATA zinc finger domain containing 2A(GATAD2A/p66α).JBiol Chem,2013,288:3419)。即、可谓非结构-结构转移区域相当于在特定蛋白质与其它蛋白质相互作用的主要的位点。
下面说明寻找与靶蛋白的靶位点(非结构-结构转移区域)结合的候选物质的过程。简言之,执行分子对接以及分子动力学模拟而寻找与靶位点能够结合的候选物质。使用了这种方法论的依据(创意导出依据)如下。
Myc靶化合物10058-F4首次被鉴定为靶向非结构位点的药物。然而,这是利用酵母双杂交系统(yeast two-hybrid system)发现的,而不是基于计算机模拟找出的(Yin X,Giap C,Lazo JS,Prochownik EV,Low molecular weight inhibitors of Myc-Maxinteraction and function.Oncogene,2003,22(40)6151-9)。随后通过生化分析而揭示出10058-F4与Myc的402-412区域特异地结合(Follis AV,Hammoudeh DI,Wang H,ProchownikEV,Metallo SJ,Structural rationale for the coupled binding and unfolding ofthe c-Myc oncoprotein by small molecules.Chemistry&Biology,2008,15(11)1149-55)。另外,在该区域内执行了用于分析10058-F4的结合特性的分子动力学模拟,其结果,在Y402和K412观察到次数最多的相互作用(Michel J and Cuchillo R,The impact ofsmall molecule binding on the energy landscape of the intrinsicallydisordered proteinC-myc.PLoSOne,2012,7:e41070)。学术界在同意这些位点是在Myc的情况下通过蛋白质相互作用而示出结构变异特性的非结构-结构转移区域(Uversky VN,Intrinsically disordered proteins and novel strategies for drugdiscovery.Expert Opinion on Drug Discovery,2012,7:475)。
以下说明的技术将揭示了10058-F4与Myc之间的结合特性的分子对接以及分子动力学模拟执行方法反向应用而用作寻找并分析有望抑制MBD2和p66α相互作用的新化合物的平台。
另一方面,Myc也与MBD2相同地在与示出相互作用的蛋白质的结合位点具有非结构-结构转移区域特性。另外,在MBD2中在非结构-结构转移区域出现了大致40个氨基酸连续增加区间,从而揭示出这些区域的N-末端在Myc和MBD2均能够与各相互作用蛋白质形成结合结构(Nair SK,Burley SK,X-ray structures of Myc-Max and Mad-Maxrecognizing DNA.Molecular bases of regulation by proto-oncogenictranscription factors.Cell,2003,112(2)193-205;Gnanapragasam MN,Scarsdale JN,Amaya ML,Webb HD,Desai MA,Walavalkar NM,Wang SZ,Zu Zhu S,Ginder GD,WilliamsDC Jr,p66Alpha-MBD2coiled-coil interaction and recruitment of Mi-2arecritical for globin gene silencing by the MBD2-NuRD complex.Proc Natl AcadSci USA,2011,108:7487)。
(2)第二个步骤是将鉴定的非结构-结构转移区域作为对象而寻找能够结合的候选物质。具体地、利用特定的化合物库而执行对于鉴定的非结构-结构转移区域的分子对接。由此,确定与鉴定的非结构-结构转移区域能够结合的候选化合物。
在对此的实验中,将MBD2结构作为对象并利用联动了ZINC化合物库的DOCK程序而执行了分子对接。利用联动了ZINC库的DOCK程序执行了分子对接,其结果,能够导得出1000个候选化合物。DOCK程序是能够确认蛋白质与配体(ligand)是否结合的程序。使用各种DOCK程序中的一种程序就能够在ZINC化合物库中确定与MBD2的非结构-结构转移位点能够结合的候选化合物。
(3)第三个步骤是将候选化合物作为对象并执行分子动力学模拟而导出最终候选化合物。例如,能够应用Gromacs程序而执行/分析分子动力学模拟。
利用联动了ZINC库的DOCK执行了分子对接,并对于以执行结果导出的1000个候选化合物执行了分子动力学模拟。执行分子动力学模拟而将对于蛋白质的靶位点(非结构-结构转移位点)的结合能值最大的上位2种化合物导出为最终候选化合物。最终候选化合物为能够与MBD2形成3个氢键的ZINC40430779和ZINC60177071。
利用Gromacs程序对3组(Com1=‘MBD2+ZINC40430779',Com2=‘MBD2+ZINC60177071',Myc+10058-F4)执行了分子动力学模拟,之后,根据蛋白质的氨基酸与化合物之间的接触数量而导出了蛋白质-化合物接触热图(heatmap)。图2是对于靶蛋白MBD2和候选化合物执行了分子动力学模拟的结果的例子。为了说明为对于MBD2的对照组而图示了Myc+10058-F4。
执行了分子动力学模拟的结果确认出,MBD2的D368与ZINC40430779最靠近而结合,与此相反,MBD2的Q372与ZINC60177071靠近而结合。确认出,相互作用能与接触数量状况一致,且两种化合物以互不相同的角度与MBD2的D368结合。
为了验证在单独的MBD2和MBD2-p66α复合物的化合物结合时所示出的结构变异,求出参与到与p66α的结合的各氨基酸的骨架(backbone)扭转角而进行了T-test(T-检验)分析以确认是否存在差异。分析结果,在氨基酸的骨架扭转角示出了有意义的差异。
[com1,ZINC40430779;#086567(Fluorochem)]
[com2,ZINC60177071;#080579(Fluorochem)]
通过前面所述的过程导出了与MBD2和p66α的相互作用位点即非结构-结构转移区域结合而抑制Mi-2/NuRD CRC的基因表达的候选物质。另一方面,导出的最终候选化合物除了靶蛋白之外还与其它蛋白质结合,因而还存在导致意想不到的副作用的可能性。因此,理想的是对于最终候选化合物是否也与其它蛋白质结合进行验证。
基于分子对接以及分子动力学模拟的治疗剂候选物质与其它蛋白质的结合以及 相互作用可能性验证
蛋白质的非结构性位点性质由氨基酸单位所决定,蛋白质结构由氨基酸的组成所决定。因此,通过非结构性位点就能够预测蛋白质结构上的能够结合的区域。与其它物质的结合可能性大的这些区域称为MoRF(Molecular Recognition Feature,分子识别特征)。虽然通过MoRF预测算法而能够推断该蛋白质与其它物质的结合可能性,但也存在如在MBD2以及Myc那样检索包含蛋白质结构信息的数据库而能够找出的情况,因此,可考虑这种可能性而开发新算法。
首先,将判断为与导出的最终候选化合物结合的可能性存在的蛋白质的几个氨基酸序列组成一组。从理论上讲,还能够准备对于能够获得的所有蛋白质的氨基酸序列。与最终候选化合物结合的可能性存在的蛋白质命名为结合候选蛋白质。
(i)将结合候选蛋白质的氨基酸序列输入到用于预测非结构位点的程序(或算法)中。能够使用前面所述的PONDR-FIT、PONDR-VLXT、PONDR-VSL2等算法。由此预测结合候选蛋白质的非结构位点。(ii)另外,利用预测MoRF等的结合区域的ANCHOR、MoRFpred等算法而预测其可能性。即、确定结合候选蛋白质的氨基酸序列中的与最终候选化合物结合的可能性存在的候选区域。
(iii)若氨基酸序列中的候选区域已确定,则以确定的候选区域为基准推断该氨基酸序列所构成的蛋白质结构。
特定候选区域,并利用掌管生物信息学信息的数据库而确认与其它蛋白质的结合可能性,另外,确认相同区域的结构在PDB(Protein Data Bank,蛋白质数据库)中是否存在。若是在PDB中存在的序列,则从PDB获得相应蛋白质的预期的结构。
如果结构并不存在,则判别其区域是否为MoRF。若是MoRF,则通过同源建模(homology modeling)而获得蛋白质整个结构。在不是MoRF而是非结构-结构转移区域的情况下,通过同源建模而获得相应的非结构-结构转移区域的蛋白质结构。同源建模是以氨基酸序列为基准推断相应序列的蛋白质结构的技法。
(iv)若结合候选蛋白质的结构已被推断,则确认是否与最终候选化合物结合或相互作用乃至程度。为此,对于结合候选蛋白质和最终候选化合物执行分子对接(利用DOCK、Autodock、Autodock vina等)并将已完成分子对接的复杂的结构作为对象而执行分子动力学模拟(利用Gromacs、AMBER、CHARMM、OpenMM等),从而最终筛选与治疗剂候选物质结合的可能性大的蛋白质。
(v)最后,将最终候选化合物中的与靶蛋白(在前面所述的实验中为MDB2)的结合或相互作用远优于结合候选蛋白质的候选化合物选择为最终化合物。最终化合物能够用作用于开发新药的候选物质。
通过前面所述的验证过程而能够预先排除会示出包括副作用在内的额外效果的候选化合物,从而能够有效地鉴定可适用于临床的治疗剂。由此,将在治疗剂开发过程中能够节省大量时间并降低巨额费用支出。
将前面所述的MBD2作为靶标找出上述的2种化合物(com1,ZINC40430779以及com2,ZINC60177071),并将该2种化合物作为对象而选定p66α的MBD2结合氨基酸为靶位点,之后执行分子对接以及分子动力学模拟而分析了接触数量。
联动ZINC40430779和ZINC60177071而作为化合物库,并将p66α作为靶蛋白,且将已知为与MBD2结合的p66α的4种氨基酸(I145、L152、L159、R166)作为靶位点并利用DOCK执行了分子对接。从其中筛选出结合能值优良的结合物结构,并对其执行分子动力学模拟而分析了p66α与ZINC40430779或ZINC60177071的相互作用。
图3是对于鉴定的候选化合物将p66α作为对象而执行了分子对接以及分子动力学分析的例子。利用Gromacs程序对ZINC40430779和ZINC60177071执行了各自对于4个位点(I145、L152、L159、R166)的分子动力学模拟。在实施了分子动力学模拟之后,根据蛋白质的氨基酸与化合物之间的接触数量从5组中导出了蛋白质-化合物之间接触热图,其结果,在各个组中p66α的E155与两种化合物均有了相对最多的接触。
以2种化合物为基准比较了分子动力学组,其结果,ZINC40430779所结合的4组中的3种(I145com1、L159com1、R166com1)示出了高水平的与E155接触数量密度,且1种(L152com1)示出了相对高的与E156接触数量密度。与此相反,与ZINC60177071结合的4组中的2种(L152com2、L159com2)示出了高水平的与E155接触数量密度,1种(I145com2)示出了高水平的与E151接触数量密度。然而,1种(R166com2)与任何氨基酸也未示出特征性接触数量密度。
因此,虽然ZINC40430779和ZINC60177071均将MBD2的非结构-结构转移区域作为靶标,但执行了对于与p66α的4种氨基酸(I145、L152、L159、R166)的结合可能性的分子动力学模拟的结果,可预测出ZINC40430779在p66α的E155-E156区域能够示出更优于ZINC60177071的结合。终究,能够选择ZINC40430779为最终化合物。当然,根据情况还能够将两个化合物均选择为最终化合物。
最后,通过实验确认了对于被提为新药候选物质的2个化合物(ZINC40430779和ZINC60177071)的MBD2-p66α相互作用抑制能力。
对于2种候选物质的MBD2-p66α相互作用抑制确认
通过免疫共沉淀法(co-immunoprecipitation assay;Co-IP)分析了上面筛选的2种化合物实际上是否能够抑制MBD2和p66α的相互作用。图4是2种候选化合物的结构以及通过免疫共沉淀法(co-immunoprecipitation assay,Co-IP)分析了MBD2和p66α的相互作用抑制能力的结果数据。
在293T细胞系中转导分别以3XFB和Myc标记的MBD2和p66α蛋白质过表达载体而得到了细胞提取物,并在该细胞提取物中处理化合物之后执行了Co-IP,其结果,确认出两种候选化合物均以浓度依赖性方式抑制MBD2和p66α的结合。
本发明的各发明人在过去的研究中确认出,通过CP2c转录因子复合物的靶基因的表达不仅由完整的Mi-2/NuRD CRC所抑制还由MBD2或p66α的过表达所抑制,与此相反,靶基因的表达通过MBD2或p66α的表达衰减或MBD2和p66α的相互作用的抑制而恢复。
因此,以Luc reporter assay(荧光素酶报告基因分析)分析了通过MBD2或p66α的过表达的CP2c转录因子复合物的靶基因表达的减少是否通过上面筛选的MBD2和p66α的相互作用抑制化合物的处理而恢复。图5是示出2种候选化合物的处理在CP2c转录因子复合物的靶基因表达中影响MBD2或p66α作用的效果的Luc reporter assay(荧光素酶报告基因分析)的结果数据。
此时,使用GATA1增强子而作为控制Luc reporter基因的表达的CP2c转录因子靶序列,并在293T细胞中转导各种组合的CBP复合物蛋白质过表达载体而进行了分析。其结果,化合物ZINC40430779(#086567,Fluorochem)恢复了通过p66α过表达的靶基因的表达抑制,与此相反,并未恢复通过MBD2过表达的靶基因的表达抑制,化合物ZINC60177071(#080579,Fluorochem)示出了与化合物ZINC40430779的效果正相反的效果。
因此,可推断并确认出,化合物ZINC40430779与p66α结合而抑制与MBD2的相互作用,与此相反,化合物ZINC60177071与MBD2结合而抑制与p66α的相互作用。这是与在接触数量分析结果(图3)所预测的结果一致的结果,所述接触数量分析结果是将MBD2作为靶标找出上述的2种化合物(com1,ZINC40430779以及com2,ZINC60177071),并将该2种化合物作为对象而选定p66α的MBD2结合氨基酸为靶位点,之后执行分子对接以及分子动力学模拟而得到的。
总而言之,这些验证结果以及实验数据表明前面所述的新药候选物质鉴定算法或平台对于新药物挖掘会非常有用。
对于前面所述的新药候选物质挖掘过程进行整理。计算机装置执行挖掘新药候选物质的过程。图6是对于靶向非结构-结构转移位点的新药候选物质挖掘方法(步骤100)的流程图的例子。
计算机装置预测靶蛋白的非结构位点(步骤110)。例如,计算机装置使用诸如PONDR-FIT、PONDR-VLXT、PONDR-VSL等程序(网络算法)并测定蛋白质的非结构分数而能够预测非结构-结构转移位点。靶蛋白是在对于特定疾病的通路(pathway)中作用的物质。如前面所述,新药候选物质挖掘技法并不限定于特定的疾病或特定靶蛋白。候选化合物终究相当于以阻止其它物质结合的方式与靶蛋白结合而抑制或激活靶蛋白的物质。计算机装置利用对靶蛋白已知的生物信息学信息而确定靶蛋白的非结构-结构转移位点。
其后,计算机装置执行联动确定的靶蛋白的非结构-结构转移位点和特定化合物库的分子对接(步骤120)。例如,计算机装置使用分子对接(DOCK、AutoDock、AutoDock vina等)程序而能够执行靶蛋白的非结构-结构转移位点和特定化合物的分子对接。特定化合物库包含对于多种化合物的结构的信息。特定化合物库可以是包含特定分子的类型。根据情况,化合物库还能够包含对于迄今为止已被揭示的所有化合物结构的信息。化合物库可由计算机装置预先保有或从位于网络的数据库接收而获得。分子对接能够应用前面所述的各种对接程序。计算机装置执行非结构-结构转移位点和特定化合物的分子对接而选择与非结构-结构转移位点能够结合的第一候选化合物(步骤120)。此时,计算机装置能够预测对于非结构-结构转移位点的结构,并将能够进入该结构的化合物选择为第一候选化合物。根据情况,计算机装置还能够设置特定基准并比较非结构-结构转移位点和与该位点结合的化合物的隔开距离和阈值而将具有阈值内的隔开距离的化合物选择为第一候选化合物。
计算机装置执行对于第一候选化合物和非结构-结构转移位点的分子动力学模拟(步骤130)。例如,计算机装置能够执行诸如Gromacs、AMBER、CHARMM、OpenMM等的程序而执行分子动力学模拟。此时,计算机装置分析模拟结果而选择第一候选化合物中更适合的第二候选化合物。例如,计算机装置能够将第一候选化合物中与非结构-结构转移位点的结合力更好的化合物选择为第二候选化合物。或者例如,计算机装置能够从分子动力学模拟结果中将第一候选化合物中的与非结构-结构转移位点结合的位点的数量或结合能为基准值以上的化合物选择为第二候选化合物。
计算机装置能够将第二候选化合物确定为用于开发新药的候选物质。进而,计算机装置能够验证第二候选化合物是否除了靶蛋白之外还与其它蛋白质结合(步骤140)。验证过程将在图7进行说明。
图7是对于执行针对挖掘的候选物质的验证的过程(步骤200)的流程图的例子。首先,计算机装置选定导出的候选化合物(前面所述的第二化合物)所能够结合的其它结合候选蛋白质(步骤210)。优选地、结合候选蛋白质为多种蛋白质。若存在先前已知具有与候选化合物的结合性的蛋白质组,则能够将该蛋白质组选定为结合候选蛋白质。根据情况,若无先前已知的信息,则计算机装置还能够将迄今已知其结构的所有蛋白质选定为候选蛋白质。
计算机装置以结合候选蛋白质的氨基酸序列为基准确定结合候选蛋白质的非结构位点(步骤220)。计算机装置使用前面所述的非结构位点预测算法而能够确定结合候选蛋白质的非结构位点。结合候选蛋白质的氨基酸序列可以是另外的数据库中所存储的信息。
计算机装置对于结合候选蛋白质的非结构位点利用预测MoRF等的结合区域的ANCHOR、MoRFpred等算法而能够预测结合可能性(步骤230)。计算机装置预先预测对于结合候选蛋白质的非结构位点的结合可能性而将具有一定基准值以上可能性的区域确定为候选区域(步骤230)。
计算机装置以候选区域的氨基酸序列为基准推断候选区域的蛋白质结构(步骤240)。计算机装置确认候选区域的氨基酸序列是否在PDB(Protein DataBank,蛋白质数据库)中存在。若是在PDB中存在的序列,则从PDB中获得相应蛋白质的预期的结构。如果结构并不存在,则计算机装置判别其区域是否为MoRF。若是MoRF,则通过同源建模(homologymodeling)而获得蛋白质整个结构。在如果是非结构-结构转移区域而不是MoRF的情况下,计算机装置通过同源建模而获得相应的非结构-结构转移区域的蛋白质结构。
接下来,计算机装置执行候选区域的蛋白质结构和候选化合物的分子对接或分子动力学模拟(步骤250)。分子对接或分子动力学模拟使用前面所述的相关程序。分子对接或分子动力学模拟结果示出候选区域的蛋白质结构与候选化合物的结合程度。
计算机装置将靶蛋白与候选化合物结合力(第一结合力)和候选区域的蛋白质结构与候选化合物结合力(第二结合力)进行比较。若第一结合力远大于第二结合力,则计算机装置能够将候选化合物(第二候选化合物)确定为最终化合物(步骤280)。或者,若第一结合力比第二结合力高出基准值以上,则计算机装置能够将候选化合物(第二候选化合物)确定为最终化合物。或者,若第一结合力大于第二结合力,则计算机装置能够将候选化合物(第二候选化合物)确定为最终化合物。
如果第一结合力低于第二结合力或在临界范围内具有相近的结合力,则计算机装置能够从新药候选物质中排除当前候选化合物(第二候选化合物)(步骤270)。
图8是对于靶向非结构-结构转移位点的新药候选物质挖掘装置的例子。
图8的(A)部分是在网络上具体实现的系统300的例子。新药候选物质挖掘装置300包括客户端装置310和分析服务器320。进而,新药候选物质挖掘装置300还能够包括化合物DB330。分析服务器320相当于前面所述的计算机装置。
客户端装置310是与分析服务器320连接而传递要求分析新药物质的命令并接收分析结果的装置。根据情况,客户端装置310能够向分析服务器320提供分析所需的一部分数据。例如,客户端装置310能够向分析服务器320提供诸如靶蛋白的氨基酸序列等的数据。
分析服务器320利用生物信息学而确定靶蛋白的非结构-结构转移位点。分析服务器320利用诸如PONDR-FIT、PONDR-VLXT、PONDR-VSL等的程序(网络算法)而预测非结构位点。分析服务器320执行对接程序而执行将非结构-结构转移位点作为对象而联动了特定的化合物库的分子对接,并在化合物库中选择与非结构-结构转移位点能够结合的第一候选化合物。另外,分析服务器320执行分子动力学模拟程序,执行对于第一候选化合物和非结构-结构转移位点的分子动力学模拟而在第一候选化合物中选择第二候选化合物。进而,分析服务器320如前面所述那样还能够执行对于第二候选化合物的验证。
虽然在图8的(A)部分中并未图示,但另外的web服务器能够提供蛋白质的非结构位点预测程序、对接程序、以及分子动力学模拟程序中的至少一个程序。在该情况下,分析服务器320与该web服务器连接而请求与相应程序相关的操作并一边接收结果一边执行分析。
化合物DB330能够存储包含对于特定化合物的结构信息的化合物库、对于特定蛋白质的氨基酸序列的信息等。
图8的(B)部分是对于挖掘新药候选物质的计算机装置400的例子。图8(B)中所图示的计算机装置300还可以是前面所述的分析服务器320。计算机装置400是指诸如个人计算机、笔记本电脑、智能设备或服务器等装置。计算机装置400包括输入装置410、计算装置420、存储装置430以及输出装置440。
输入装置310接受用户的命令或特定数据输入。特定数据能够包括靶蛋白的氨基酸序列、对于生物信息学的数据、结合候选蛋白质的氨基酸序列以及特定化合物库中的至少一种。输入装置410可以是通过通信或另外的存储装置而将用户命令或特定数据输入到计算机装置400中的通信接口装置。进而,输入装置410还可以是诸如键盘、鼠标、触摸屏等的接口装置。
存储装置430是存储执行化合物与蛋白质的分子对接的对接程序以及化合物和蛋白质特定位点的分子动力学模拟程序的装置。进而,存储装置430还能够进一步存储靶蛋白的氨基酸序列、对于生物信息学的数据、结合候选蛋白质的氨基酸序列以及特定化合物库中的至少一种。存储装置430还能够存储对于与分析结果相应的候选物质的信息。
计算装置430保有执行化合物与蛋白质的分子对接的对接程序以及化合物和蛋白质特定位点的分子动力学模拟程序。计算装置430利用生物信息学而确定靶蛋白的非结构-结构转移位点。计算装置430执行对接程序,执行将非结构-结构转移位点作为对象而联动了特定的化合物库的分子对接而在化合物库中选择与非结构-结构转移位点能够结合的第一候选化合物。另外,计算装置430执行分子动力学模拟程序,执行对于第一候选化合物和非结构-结构转移位点的分子动力学模拟而在第一候选化合物中选择第二候选化合物。进而,计算装置430如前面所述那样还能够执行对于第二候选化合物的验证。
输出装置440是以一定方式输出分析结果的装置。输出装置440包括显示器装置、输出文档的输出装置以及向其它装置传递候选物质导出结果的通信装置中的至少一种装置。
另外,如上所述的新药候选物质挖掘方法能够以包含可在计算机执行的可执行算法的程序(或应用程序)来具体实现。上述程序可存储于非暂时性计算机可读介质(non-transitory computer readable medium)中而提供。
非暂时性计算机可读介质是指半永久地存储数据且由设备可读(reading)的介质而非为如寄存器、高速缓冲存储器、存储器等那样短时间存储数据的介质。具体来讲,上述的各种应用程序或程序可存储于诸如CD、DVD、硬盘、蓝光盘、USB、存储卡、ROM等的非暂时性计算机可读介质中而提供。
本实施例及本说明书的附图只是明确地示出前面所述的技术中所包含的技术思想的一部分而已,本领域技术人员清楚在前面所述的技术的说明书以及附图中所包含的技术思想的范围内所能够容易地类推的变形例和具体实施例均落入前面所述的技术的权利范围内。

Claims (13)

1.一种靶向非结构-结构转移位点的新药候选物质挖掘方法,其特征在于,包括:
计算机装置利用生物信息学而确定靶蛋白的非结构-结构转移位点的步骤;
上述计算机装置执行将上述非结构-结构转移位点作为对象而联动了特定的化合物库的分子对接而在上述化合物库中选择与上述非结构-结构转移位点能够结合的第一候选化合物的步骤;以及,
上述计算机装置执行对于上述第一候选化合物和上述非结构-结构转移位点的分子动力学模拟而在上述第一候选化合物中选择第二候选化合物的步骤。
2.根据权利要求1所述的靶向非结构-结构转移位点的新药候选物质挖掘方法,其特征在于,
上述计算机装置使用分子对接程序而执行上述化合物库中所包含的某种化合物与上述非结构-结构转移位点的分子对接。
3.根据权利要求1所述的靶向非结构-结构转移位点的新药候选物质挖掘方法,其特征在于,
上述计算机装置根据上述分子动力学模拟结果将上述第一候选化合物中与上述非结构-结构转移位点结合的位点的数量或结合能为基准值以上的化合物选择为上述第二候选化合物。
4.根据权利要求1所述的靶向非结构-结构转移位点的新药候选物质挖掘方法,其特征在于,
上述计算机装置进一步包括确认上述第二候选化合物是否还与其它候选蛋白质结合的步骤,
在上述第二候选化合物对上述靶蛋白具有基准值以上的结合力而强于与上述其它候选蛋白质的结合力的情况下,将上述第二候选化合物选择为最终候选化合物。
5.根据权利要求4所述的靶向非结构-结构转移位点的新药候选物质挖掘方法,其特征在于,
上述确认的步骤包括:
上述计算机装置以上述候选蛋白质的非结构位点为基准而确定具有上述第二候选蛋白质所结合可能性的候选区域的步骤,其中,上述候选蛋白质的非结构位点以对于上述候选蛋白质的氨基酸序列为基准而确定;
上述计算机装置以上述候选区域的氨基酸序列为基准而推断上述候选区域的蛋白质结构的步骤;以及,
上述计算机装置利用对接程序而确认上述候选区域的蛋白质结构与上述第二候选蛋白质的结合程度的步骤。
6.根据权利要求5所述的靶向非结构-结构转移位点的新药候选物质挖掘方法,其特征在于,
上述计算机装置在PDB中检索上述候选区域的氨基酸序列而将匹配的结构推断为上述候选区域的蛋白质结构,若无匹配的结构,则以上述候选区域的氨基酸序列为基准执行同源建模而推断上述候选区域的蛋白质结构。
7.一种计算机可读记录介质,其特征在于,
记录用于在计算机执行上述权利要求1至6中任一项所述的靶向非结构-结构转移位点的新药候选物质挖掘方法的程序。
8.一种靶向非结构-结构转移位点的新药候选物质挖掘装置,其特征在于,包括:
输入装置,其接受用户的命令或特定数据输入;
存储装置,其存储执行化合物与蛋白质的分子对接的对接程序以及化合物和蛋白质特定位点的分子动力学模拟程序;以及,
计算装置,其利用生物信息学而确定靶蛋白的非结构-结构转移位点,并执行上述对接程序,将上述非结构-结构转移位点作为对象执行联动了特定的化合物库的分子对接而选择上述化合物库中与上述非结构-结构转移位点能够结合的第一候选化合物,并执行上述分子动力学模拟程序,执行对于上述第一候选化合物和上述非结构-结构转移位点的分子动力学模拟而在上述第一候选化合物中选择第二候选化合物。
9.根据权利要求1所述的靶向非结构-结构转移位点的新药候选物质挖掘装置,其特征在于,
上述特定数据包含对于上述生物信息学的数据以及上述特定化合物库中的至少一个数据,上述输入装置从外部存储介质或存在于网络的数据库接收上述特定数据。
10.根据权利要求1所述的靶向非结构-结构转移位点的新药候选物质挖掘装置,其特征在于,
上述计算装置根据上述分子动力学模拟结果将上述第一候选化合物中与上述非结构-结构转移位点结合的位点的数量或结合能为基准值以上的化合物选择为上述第二候选化合物。
11.根据权利要求1所述的靶向非结构-结构转移位点的新药候选物质挖掘装置,其特征在于,
上述计算装置确认上述第二候选化合物是否还与其它候选蛋白质结合,在上述第二候选化合物对上述靶蛋白具有基准值以上的结合力而强于与上述其它候选蛋白质的结合力的情况下,将上述第二候选化合物选择为最终候选化合物。
12.根据权利要求11所述的靶向非结构-结构转移位点的新药候选物质挖掘装置,其特征在于,
上述计算装置以上述候选蛋白质的非结构位点为基准而确定具有上述第二候选蛋白质所结合可能性的候选区域,其中,上述候选蛋白质的非结构位点以对于上述候选蛋白质的氨基酸序列为基准而确定,并以上述候选区域的氨基酸序列为基准而推断上述候选区域的蛋白质结构,且利用上述对接程序而确认上述候选区域的蛋白质结构与上述第二候选蛋白质的结合程度。
13.根据权利要求12所述的靶向非结构-结构转移位点的新药候选物质挖掘装置,其特征在于,
上述计算装置在PDB中检索上述候选区域的氨基酸序列而将匹配的结构推断为上述候选区域的蛋白质结构,若无匹配的结构,则以上述候选区域的氨基酸序列为基准执行同源建模而推断上述候选区域的蛋白质结构。
CN201780072772.8A 2016-11-24 2017-11-24 靶向非结构-结构转移位点的新药候选物质挖掘方法及新药候选物质挖掘装置 Active CN110352459B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR10-2016-0157162 2016-11-24
KR20160157162 2016-11-24
PCT/KR2017/013489 WO2018097635A1 (ko) 2016-11-24 2017-11-24 비구조-구조 전이 부위를 표적으로 하는 신약 후보 물질 발굴 방법 및 신약 후보 물질 발굴 장치

Publications (2)

Publication Number Publication Date
CN110352459A true CN110352459A (zh) 2019-10-18
CN110352459B CN110352459B (zh) 2023-08-22

Family

ID=62195308

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780072772.8A Active CN110352459B (zh) 2016-11-24 2017-11-24 靶向非结构-结构转移位点的新药候选物质挖掘方法及新药候选物质挖掘装置

Country Status (5)

Country Link
US (1) US20190279737A1 (zh)
EP (1) EP3547177A4 (zh)
KR (1) KR102145318B1 (zh)
CN (1) CN110352459B (zh)
WO (1) WO2018097635A1 (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210026541A (ko) 2019-08-30 2021-03-10 주식회사 에일론 호몰로지를 이용한 인공신경망 기반 타겟 단백질의 화합물 활성 예측 시스템
KR20210026543A (ko) 2019-08-30 2021-03-10 주식회사 에일론 복수의 인공신경망 모델 기반 단백질 결합 화합물의 활성 예측 시스템
KR20210026542A (ko) 2019-08-30 2021-03-10 주식회사 에일론 기하학적 이미지를 이용한 인공신경망 기반 단백질 결합 화합물의 생물학적 활성 예측 시스템
KR20210027668A (ko) 2019-08-30 2021-03-11 주식회사 에일론 푸리에 디스크립터와 인공신경망을 이용한 타겟 단백질에 대한 화합물 활성 예측 시스템
KR102540558B1 (ko) 2019-12-31 2023-06-12 고려대학교 산학협력단 신약 후보 물질의 출력 방법 및 장치
CN113129999B (zh) 2019-12-31 2024-06-18 高丽大学校产学协力团 新药候选物质输出方法及装置、模型构建方法与记录介质
KR102490338B1 (ko) 2020-03-24 2023-01-19 (의료)길의료재단 질병의 치료 및 예방을 위한 신약 타겟 유전자 예측 방법
US20220165359A1 (en) 2020-11-23 2022-05-26 Peptilogics, Inc. Generating anti-infective design spaces for selecting drug candidates
KR20220094179A (ko) 2020-12-28 2022-07-05 고려대학교 산학협력단 전사체 표현형 기반 약물 작용 기전 예측 장치 및 방법
US11512345B1 (en) 2021-05-07 2022-11-29 Peptilogics, Inc. Methods and apparatuses for generating peptides by synthesizing a portion of a design space to identify peptides having non-canonical amino acids
KR20230006171A (ko) 2021-07-02 2023-01-10 (의료)길의료재단 질병의 치료 및 예방을 위한 신약 타겟 유전자 예측 방법
KR102496208B1 (ko) * 2022-02-21 2023-02-06 (주) 칼리시 신약 후보 물질 발굴 시스템 및 신약 후보 물질 발굴 플랫폼을 구현한 컴퓨터 프로그램
KR102598390B1 (ko) * 2022-03-14 2023-11-06 디어젠 주식회사 타겟 단백질의 선택성을 가지는 결합 부위를 식별하는 방법
CN115579050B (zh) * 2022-12-08 2023-03-14 香港中文大学(深圳) 生物分子功能性动力学中关键原子集的搜索方法、系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006252485A (ja) * 2005-03-14 2006-09-21 In-Silico Science Inc リガンド探索装置、リガンド探索方法、プログラム、および記録媒体
US20130053541A1 (en) * 2011-03-11 2013-02-28 Lynntech, Inc. Methods for discovering molecules that bind to proteins
CN103265635A (zh) * 2013-04-28 2013-08-28 中山大学附属第一医院 一种通用的靶向蛋白嵌合型分子化合物的构建方法
CN104350141A (zh) * 2012-06-13 2015-02-11 学校法人冲绳科学技术大学院大学学园 相互作用预测装置、相互作用预测方法和程序

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007272627A (ja) * 2006-03-31 2007-10-18 Nec Corp スクリーニング方法およびスクリーニングシステム
KR100773055B1 (ko) * 2006-07-04 2007-11-02 한국생명공학연구원 상호작용면체를 기반으로 한 단백질과 상호작용하는 물질의검색 시스템 및 방법과 이를 위한 기록매체
KR101400717B1 (ko) * 2012-12-28 2014-05-29 (주)신테카바이오 전체원자기반 고분자 복합체의 시뮬레이션 시스템 및 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006252485A (ja) * 2005-03-14 2006-09-21 In-Silico Science Inc リガンド探索装置、リガンド探索方法、プログラム、および記録媒体
US20130053541A1 (en) * 2011-03-11 2013-02-28 Lynntech, Inc. Methods for discovering molecules that bind to proteins
CN104350141A (zh) * 2012-06-13 2015-02-11 学校法人冲绳科学技术大学院大学学园 相互作用预测装置、相互作用预测方法和程序
CN103265635A (zh) * 2013-04-28 2013-08-28 中山大学附属第一医院 一种通用的靶向蛋白嵌合型分子化合物的构建方法

Non-Patent Citations (11)

* Cited by examiner, † Cited by third party
Title
CHEN YU.ET AL: ""Structure-based Inhibitor Design for the Intrinsically Disordered Protein c-Myc"", 《WWW.NATURE.COM/SCIENTIFICREPORTS/》 *
CHEN YU.ET AL: ""Structure-based Inhibitor Design for the Intrinsically Disordered Protein c-Myc"", 《WWW.NATURE.COM/SCIENTIFICREPORTS/》, 2 March 2016 (2016-03-02) *
CHRISTOPH A. SOTRIFFER.ET AL: "\"Automated Docking of Ligands to Antibodies: Methods and Applications\"", 《DOI:10.1006/METH.1999.0922, AVAILABLE ONLINE AT HTTP://WWW.IDEALIBRARY.COM》, vol. 20, no. 3, XP004466885, DOI: 10.1006/meth.1999.0922 *
INT.J.MOL.SCI.ET AL: ""an overview of practical applications of protrein disorder prediction and drive for faster,more accurate predictions"", 《WWW.MDPI.COM/JOURNAL/IJMS》 *
INT.J.MOL.SCI.ET AL: ""an overview of practical applications of protrein disorder prediction and drive for faster,more accurate predictions"", 《WWW.MDPI.COM/JOURNAL/IJMS》, 7 December 2015 (2015-12-07) *
LEONARDO G. FERREIRA.ET AL: ""Molecular Docking and Structure-Based Drug Design Strategies"", 《WWW.MDPI.COM/JOURNAL/MOLECULES》 *
LEONARDO G. FERREIRA.ET AL: ""Molecular Docking and Structure-Based Drug Design Strategies"", 《WWW.MDPI.COM/JOURNAL/MOLECULES》, 13 May 2015 (2015-05-13) *
VLADIMIR N. UVERSKY.ET AL: ""Understanding protein non-folding"", 《BIOCHIMICA ET BIOPHYSICA ACTA》 *
VLADIMIR N. UVERSKY.ET AL: ""Understanding protein non-folding"", 《BIOCHIMICA ET BIOPHYSICA ACTA》, 21 January 2010 (2010-01-21) *
谢磊等: ""Structure-based systems biology for analyzing off-target binding"", 《CURRENT OPINION STRUCTURAL BIOLOGY》 *
谢磊等: ""Structure-based systems biology for analyzing off-target binding"", 《CURRENT OPINION STRUCTURAL BIOLOGY》, 20 January 2011 (2011-01-20) *

Also Published As

Publication number Publication date
EP3547177A4 (en) 2020-08-26
EP3547177A1 (en) 2019-10-02
WO2018097635A1 (ko) 2018-05-31
KR102145318B1 (ko) 2020-08-19
CN110352459B (zh) 2023-08-22
US20190279737A1 (en) 2019-09-12
KR20180058648A (ko) 2018-06-01

Similar Documents

Publication Publication Date Title
CN110352459A (zh) 靶向非结构-结构转移位点的新药候选物质挖掘方法及新药候选物质挖掘装置
Li et al. Deep learning enhancing kinome-wide polypharmacology profiling: model construction and experiment validation
Adams et al. NAMPT is the cellular target of STF-31-like small-molecule probes
Ilinskaya et al. Direct inhibition of oncogenic KRAS by Bacillus pumilus ribonuclease (binase)
Chakrabarti et al. Comparison of the conformations of KRAS isoforms, K-Ras4A and K-Ras4B, points to similarities and significant differences
Meslamani et al. Structural features and inhibitors of bromodomains
Joy et al. A dual-site inhibitor of CBP/p300 KIX is a selective and effective modulator of Myb
Zhang et al. Systems biology of angiogenesis signaling: Computational models and omics
McKinsey et al. Epigenomic regulation of heart failure: integrating histone marks, long noncoding RNAs, and chromatin architecture
Yang et al. p38α mitogen-activated protein kinase is a druggable target in pancreatic adenocarcinoma
Raschella et al. New factors in mammalian DNA repair—the chromatin connection
Jackson Pharmacodynamic modelling of biomarker data in oncology
Keskin Karakoyun et al. Evaluation of AlphaFold structure-based protein stability prediction on missense variations in cancer
Chang et al. E2-E3 ubiquitin enzyme pairing-partnership in provoking or mitigating cancers
Kern et al. Role of mTOR as an essential kinase in SCLC
Kim et al. Tetrahydrobiopterin enhances mitochondrial biogenesis and cardiac contractility via stimulation of PGC1α signaling
Liu et al. Identification of small-molecule inhibitors of fibroblast growth factor 23 signaling via in silico hot spot prediction and molecular docking to α-Klotho
Spinello et al. Cancer-related mutations alter RNA-driven functional cross-talk underlying premature-messenger RNA recognition by splicing factor SF3B
Laporte et al. Deciphering the molecular terms of Arp2/3 allosteric regulation from all-atom simulations and dynamical network theory
Su et al. Kinetic inference resolves epigenetic mechanism of drug resistance in melanoma
Bueno et al. Changes in gene expression variability reveal a stable synthetic lethal interaction network in BRCA2− ovarian cancers
Stefan et al. Targeting the architecture of deregulated protein complexes in cancer
Korla et al. Somatic mutational landscapes of adherens junctions and their functional consequences in cutaneous melanoma development
Sun et al. Exploration of the substrate preference of lysine methyltransferase SMYD3 by molecular dynamics simulations
Wang et al. Scaffold-based analysis of nonpeptide oncogenic FTase inhibitors using multiple similarity matching, binding affinity scoring and enzyme inhibition assay

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant