CN109477081A - 结合细胞Pol Ⅱ C末端结构域(CTD)的病毒多肽片段及其用途 - Google Patents

结合细胞Pol Ⅱ C末端结构域(CTD)的病毒多肽片段及其用途 Download PDF

Info

Publication number
CN109477081A
CN109477081A CN201780042151.5A CN201780042151A CN109477081A CN 109477081 A CN109477081 A CN 109477081A CN 201780042151 A CN201780042151 A CN 201780042151A CN 109477081 A CN109477081 A CN 109477081A
Authority
CN
China
Prior art keywords
virus
compound
amino acid
rna
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780042151.5A
Other languages
English (en)
Inventor
斯蒂芬·丘萨克
亚历山大·普夫卢格
玛利亚·卢卡尔斯卡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Europaisches Laboratorium fuer Molekularbiologie EMBL
Original Assignee
Europaisches Laboratorium fuer Molekularbiologie EMBL
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Europaisches Laboratorium fuer Molekularbiologie EMBL filed Critical Europaisches Laboratorium fuer Molekularbiologie EMBL
Publication of CN109477081A publication Critical patent/CN109477081A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/20Protein or domain folding
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/127RNA-directed RNA polymerase (2.7.7.48), i.e. RNA replicase
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Biochemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Microbiology (AREA)
  • Computing Systems (AREA)
  • Virology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Plant Pathology (AREA)
  • Oncology (AREA)
  • Communicable Diseases (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及通过计算机鉴别降低或阻止来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体与其配体(优选与细胞Pol II,更优选与CTD)结合的化合物的方法,以及产生鉴别的化合物的方法。本发明还涉及可通过所述方法鉴别和/或产生的化合物。本发明还涉及针对RNA依赖性RNA聚合酶与其配体(特别是与细胞Pol II,特别是与Pol II的CTD)的结合位点的抗体、以及编码所述抗体的核酸和包含所述核酸的载体。本发明涉及可根据所述方法制备的药物组合物,和/或包含所述化合物、所述抗体、所述核酸或所述载体的药物组合物。本发明还涉及所述化合物、所述抗体、所述核酸、所述载体或所述药物在治疗、改善、或预防由正黏病毒科的病毒感染引起的疾病状况中的用途。

Description

结合细胞Pol Ⅱ C末端结构域(CTD)的病毒多肽片段及其 用途
技术领域
本发明涉及用于通过计算机鉴别降低或阻止来自正黏病毒科(Orthomyxoviridae)的病毒RNA依赖性RNA聚合酶或其变体与其配体(优选与细胞聚合酶II(Pol II),更优选与Pol II C末端结构域(CTD))结合的化合物的方法,以及产生鉴别出的化合物的方法。本发明还涉及可通过所述方法鉴别和/ 或产生的化合物。本发明还涉及针对RNA依赖性RNA聚合酶与其配体(特别是细胞Pol II,特别是Pol II的CTD)的结合位点的抗体、以及编码所述抗体的核酸和包含该核酸的载体。本发明涉及可根据所述方法制备的药物组合物,和 /或包含所述化合物、所述抗体、所述核酸或所述载体的药物组合物。本发明还涉及所述化合物、所述抗体、所述核酸、所述载体或所述药物在治疗、改善、或预防由正黏病毒科病毒的病毒感染引起的疾病状况中的用途。
背景技术
流感是造成世界上大量发病率和死亡率的原因,并被许多人视为属于对人类最主要的病毒威胁。每年流感疫情在全球范围内肆虐并且偶然出现的新致病菌株引起具有巨大破坏力的流行病。目前控制流感病毒疫情的主要手段是疫苗接种。然而,迅速产生突变的流感病毒避开了疫苗接种的作用。鉴于产生新的流感疫苗需要大约6个月的事实,特别需要替代治疗手段,即抗病毒药物,以作为对抗迅速传播的流行病的第一道防线。
开发抗病毒药物的一个很好的起点是必要的病毒蛋白质的结构数据。因此,流感病毒表面抗原神经氨酸酶的晶体结构测定(von Itzstein等人,1993,Nature 363:418-423)直接导致了具有能阻止病毒从细胞中释放而非阻止病毒产生的抗病毒活性的神经氨酸酶抑制剂的开发。这些抑制剂及其衍生物随后发展成抗流感药物,扎那米韦(葛兰素)和奥司他韦(罗氏),它们目前由许多国家储存以作为抵御可能的流行病的第一道防线。然而,这些药物仅减少临床疾病的持续时间。或者,其他抗流感化合物例如金刚烷胺和金刚乙胺靶向病毒膜中的离子通道蛋白,即M2蛋白,以干扰细胞内病毒的脱壳。然而,由于它们的副作用和抗性病毒突变体的快速发展,它们尚未被广泛使用(Magden等人,2005,Appl.Microbiol.Biotechnol.66:612-621)。此外,更多非特异性病毒药物例如利巴韦林已显示出对于治疗流感感染的作用(Eriksson等人,1977,Antimicrob.Agents Chemother.11:946-951)。然而,利巴韦林可能是由于严重的副作用(Furuta等人, 2005,Antimicrob.Agents Chemother.49:981-986),而仅在少数国家获得批准。显然,需要新的抗病毒化合物,优选针对不同靶标的抗病毒化合物。
甲型、乙型、丙型流感病毒属和鲑传贫病毒属(Isavirus)以及索戈托病毒属(Thogotovirus)属于正黏病毒科,其与布尼亚病毒科(Bunyaviridae)一样为负链 RNA病毒,布尼亚病毒科包括汉坦病毒属(Hantavirus)、内罗病毒属(Nairovirus)、正布尼亚病毒属(Orthobunyavirus)、白蛉病毒属(Phlebovirus)、和番茄斑萎病毒属(Tospovirus)。它们的基因组是分段的并且含有核糖核蛋白颗粒,所述核糖核蛋白颗粒包括RNA依赖性RNA聚合酶,所述RNA依赖性RNA聚合酶执行: (i)单链病毒粒子RNA(vRNA)到病毒mRNA的初始复制,和(ii)vRNA复制。聚合酶复合物似乎是合适的抗病毒药物靶标,因为它对于病毒mRNA合成和病毒复制是必要的,并且含有若干可能与宿主细胞蛋白质中发现的功能活性位点显著不同的功能活性位点(Magden等人,同上)。因此,例如已经尝试通过类似于PB1内PA结合结构域的25个氨基酸的肽来干扰聚合酶亚基的组装(Ghanem 等人,2007,J.Virol.81:7801-7804)。此外,已经尝试通过核苷类似物如2′-脱氧 -2′-氟鸟嘌呤来干扰病毒转录(Tisdale等人,1995,Antimicrob.Agents Chemother. 39:2454-2458),并且已经显示,T-705(一种经置换的吡嗪化合物)可以作为流感病毒RNA聚合酶的特异性抑制剂(Furuta等人,同上)。此外,已经靶向聚合酶的内切核酸酶活性,并且已经鉴别出一系列4位置换的2,4-二氧代丁酸化合物作为流感病毒中该活性的选择性抑制剂(Tomassini等人,1994,Antimicrob.Agents Chemother.38:2827-2837)。另外,在真菌物种Delitschia confertaspora 的提取物中鉴定出的flutimide(经置换的2,6-二酮哌嗪)显示出可抑制流感病毒的内切核酸酶活性(Tomassini等人,1996,Antimicrob.Agents Chemother. 40:1189-1193)。
聚合酶的PA亚基在功能上是最不充分表征的,其涉及帽结合和内切核酸酶活性、vRNA复制、和有争议的蛋白酶活性。PA(甲型流感中的716个残基) 可通过胰蛋白酶在213位残基处分离。结合至PB1 N末端肽的PA的C末端三分之二部分的晶体结构提供了对PA亚基的大部分和其中一个关键的亚基间相互作用的确切性质的首次结构见解(He等人,2008,Nature 454:1123-1126; Obayashi等人,2008,Nature 454:1127-1131)。通过PA氨基末端结构域中保守残基的系统突变已经鉴别出对于聚合酶复合物的蛋白质稳定性、启动子结合、帽结合和内切核酸酶活性至关重要的残基(Hara等人,2006,J.Virol. 80:7789-7798)。随后显示,抢帽内切核酸酶(cap-snatching endonuclease)构成PA 的N末端部分(约1至200个残基)(Dias等人Nature 2009,PMID:19194459,Yuan 等人,Nature PMID:19194459),这大大推动了靶向内切核酸酶的药物开发(例如 Kowalinski等人,PLoS Pathog.2012,PMID 22876177)。最后在2014年,完整蝙蝠甲型流感病毒(Pflug等人,Nature 2014)和人乙型流感病毒(Reich等人,2014 Nature)的晶体结构显示出PA是如何整合至完整的异三聚体中,并如何在稳定 PB1亚基方面发挥额外作用,以及如何与PB1一起结合vRNA启动子的5′端。
病毒复制需要主动使细胞RNA聚合酶II(Pol II)转录(Mahy等人,1972, PNAS 69:1421-1424)并且已经表明FluPol与Pol II的C末端结构域(CTD)的物理缔合(Engelhardt等人,2005,Journal of virology 79:5812-5818;Loucaides等人, 2009,Virology 394:154-163)。病毒和细胞转录的这种紧密偶联被认为能够实现“抢帽”,这是病毒聚合酶抢夺短帽状寡聚物的独特机制,该短帽状寡聚物来源于初始的Pol II转录物用于引发转录(Plotch等人,1981,Cell 23:847-858;Reich 等人,2014,Nature 516:361-366)。哺乳动物细胞中的Pol II CTD由具有共有序列Y1S2P3T4S5P6S7的52个七肽的重复序列组成(Palancade等人,2003,Eur J Biochem 270:3859-3870)。大多数这些残基可进行可逆地磷酸化,并且由几种激酶和磷酸酶的调节相互作用所限定的暂时磷酸化模式与转录的不同阶段相关(Lidschreiber等人,2013,Mol Cell Biol 33:3805-3816;Hsin等人,2014,MolCell Biol 34:2488-2498;Martinez-Rucobo等人,2015,Mol Cell 58:1079-1089)。已经表明,当CTD进行Ser5-磷酸化而不是进行作为延伸标志的Ser2-磷酸化时,Flu Pol与启动PolII相关(Engelhardt等人,2005,Journal of virology 79:5812-5818;Loucaides等人,2009,Virology 394:154-163;Chan等人,2006, Virology 351:210-217)。实际上,病毒聚合酶抑制延伸以及诱导Pol II降解 (Rodriguez等人,2007,Journal of virology 81:5315-5324;Vreede等人,2010, Virology 396,125-134)。这有助于抑制细胞转录(“宿主关闭”),这被认为在对抗抗病毒反应和从病毒转录到复制的转换方面具有重要意义(Vreede等人, 2010,Virology 396,125-134)。尽管病毒和细胞转录之间已建立了良好的功能性偶联,但两种聚合酶之间结构相互作用的确切性质仍不清楚。因此,需要准确理解病毒RNA聚合酶和细胞Pol II如何相互作用,以便能够鉴别靶向病毒聚合酶结合位点的机制和化合物,从而干扰与细胞聚合酶的结合。
本发明人通过整个病毒聚合酶与包含Ser5磷酸化CTD的四次重复序列的 Pol IICTD肽模拟物的共结晶在结构上表征了两种聚合酶之间的相互作用,从而鉴别了两者之间的结合位点。因此,本发明提供了研究两种聚合酶之间相互作用位点的独特机会,这将大大简化靶向病毒复制的新抗病毒化合物的开发并优化先前鉴别的化合物。
本发明人令人惊异的成就是确定了一种系统,该系统允许使用易于获得的材料对病毒聚合酶上相互作用位点的抑制剂进行体外高通量筛选。此外,与完整流感聚合酶结合,特别是与PA亚基结合的Pol II CTD的结构数据允许针对性地设计抑制剂并通过计算机筛选靶向聚合酶上CTD结合位点的潜在治疗性化合物。最后,相同的系统可用于在结构上表征最终抑制剂与病毒聚合酶的相互作用,并使用该数据进一步优化其抑制性质。
发明内容
在第一方面,本发明涉及通过计算机鉴别降低或阻止来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体与其配体(特别是与细胞Pol II,特别是与 CTD)结合的化合物的方法,其包括以下步骤
(a)基于病毒RNA依赖性RNA聚合酶与其配体的一个或多于一个结合位点的结构坐标构建计算机模型;
(b)通过选自以下的方法来选择潜在的调节化合物:
(i)修饰结合位点内的共结晶配体,
(ii)基于共结晶配体与病毒RNA依赖性RNA聚合酶的一个或多于一个结合位点的相互作用特征,和/或基于与共结晶配体的3D相似性,从小分子数据库中过滤并选择化合物,和
(iii)基于共结晶配体与病毒RNA依赖性RNA聚合酶的一个或多于一个结合位点的相互作用特征和/或基于与共结晶配体的3D相似性,重新进行所述化合物的配体设计:
(c)采用计算手段在所述化合物和所述一个或多于一个结合位点的计算机模型之间执行拟合程序操作,以便提供所述化合物在活性位点的能量最小化构型;和/或采用计算对接方法将所述化合物定位并置于所述一个或多于一个结合位点中,以便提供化学实体,即所述化合物的合理3D排列;和
(d)评估所述拟合操作和/或所述对接方法的结果以量化所述化合物与结合位点模型之间的缔合,从而评估所述化合物与所述活性位点缔合的能力。
在第二方面,本发明涉及产生降低或阻止来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体与其配体(特别是与细胞Pol II,特别是与CTD)结合的化合物的方法,其包括以下步骤
(a)通过第一方面的方法鉴别所述化合物,和
(b)合成所述化合物并任选地将所述化合物或其药学上可接受的盐与一种或多于一种药学上可接受的赋形剂和/或载体调配。
在第三方面,本发明涉及通过第一方面的方法能够鉴别和/或可通过第二方面的方法产生的化合物,其中所述化合物能够降低或阻止病毒RNA依赖性 RNA聚合酶与其配体(特别是与细胞Pol II,特别是与Pol II的CTD)的结合。
在第四方面,本发明涉及针对来自属于正黏病毒科的病毒的RNA依赖性RNA聚合酶或其变体与其配体(特别是与细胞Pol II,特别是与Pol II的CTD) 的一个或多于一个结合位点的抗体。
在第五方面,本发明涉及编码本发明第四方面的抗体的核酸。
在第六方面,本发明涉及包含本发明第五方面的核酸的载体。
在第七方面,本发明涉及包含本发明第五方面的核酸或第六方面的载体的重组宿主细胞。
在第八方面,本发明涉及根据本发明第二方面的方法能够制备的药物组合物。
在第九方面,本发明涉及包含本发明第三方面的化合物、本发明第四方面的抗体、本发明第五方面的核酸、或本发明第六方面的载体的药物组合物。
在第十方面,本发明涉及根据本发明第三方面的化合物、本发明第四方面的抗体、本发明第五方面的核酸、本发明第六方面的载体、或本发明的第七方面或第八方面的药物组合物,其用于治疗、改善、或预防由正黏病毒科病毒的病毒感染引起的疾病状况,特别是由流感病毒的病毒感染引起的疾病状况。
在第十一方面,本发明涉及治疗、改善、或预防由正黏病毒科病毒的病毒感染引起的疾病状况,特别是由流感病毒的病毒感染引起的疾病状况的方法,其包括施用治疗上有效量的根据本发明第三方面的化合物、本发明第四方面的抗体、本发明第五方面的核酸、本发明第六方面的载体、或本发明的第七方面或第八方面的药物组合物。
附图说明
图1:与甲型流感病毒(FluA)聚合酶及其他Pol II相互作用因子结合的 CTD肽的构象。与SeP5或SeP2-SeP5 CTD肽结合的蛋白质的结构。将所有蛋白质的结构用灰色图像显示,肽被着色以突出其位置并在其相应结构的旁边放大。CTD肽用棒状表示。A、B:FluA聚合酶与CTD SeP5肽的相应部分的结合位点1(A)及结合位点2(B)。C:与肽基脯氨酰异构酶Pin1(PDB:1F8A)结合的Ser2-Ser5-磷酸化CTD。D:与白色念珠菌(C.albicans)加帽酶Cgt1(PDB:1P16) 结合的Ser5磷酸化CTD。E:与哺乳动物加帽酶Mce1(PDB:3RTX)结合的 Ser2-Ser5磷酸化CTD。F:与裂殖酵母(S.pombe)加帽酶Pce1(PDB:4PZ6)结合的Ser2-Ser5-磷酸化CTD。G:与人Ssu72(PDB:3O2Q)结合的Ser5-磷酸化CTD。
图2:与Ser5-磷酸化CTD肽结合的甲型流感病毒聚合酶的结构。
A:结合有Ser5-磷酸化CTD肽(蓝色棒)的蝙蝠甲型流感病毒聚合酶结构的曲面表示。两个肽结合位点位于PA的C末端结构域(PA-C)。
B:具有(绿色)或不具有(黄色)CTD结合肽的蝙蝠FluA聚合酶PA-C结构域的叠加,其显示出550环的运动。假设仅结合一个4次重复肽,来自连续重复序列的CTD残基被着色为(从N末端开始)蓝色、白色、品红色和青色,并且虚线表示缺失的连接(第二重复序列的大部分)。
C、D:结合位点1(C)和位点2(D)中PA残基(绿色)与CTD肽(蓝色)的相互作用的细节。推定的氢键以虚线绘制。
图3:与乙型流感病毒(FluB)聚合酶结合的CTD肽。
A:代表性甲型至丁型流感病毒株的序列比对,其表明形成位点1的残基在FluA和FluB病毒株中是保守的,但形成位点2的残基仅在FluA病毒株中是保守的。
B:顶部:在与Ser5-磷酸化CTD肽共结晶的全长FluB聚合酶的表面上观察到的忽略差异电子密度(Fo-Fc,3.0σ,蓝色网格)。底部:红框区域的特写,其显示CTD肽与FluB聚合酶的位点1结合的相互作用,该结合的方向与结合到FluA中相应的位点1的方向(图1C)相同。在PB2-627结构域上延伸的其他额外密度无法建模。
C、D:比较两次重复和四次重复荧光标记的Ser5-磷酸化CTD肽与FluA(C) 和FluB(D)结合的荧光各向异性数据。误差线显示三次实验的SD,KD显示为±拟合误差。
图4:各种流感病毒株(蝙蝠甲型流感、人类甲型流感、禽类甲型流感、乙禽类型流感、禽类丙型流感、禽类丁型流感)的PA亚基的序列比对。仅显示从 220位残基开始的PA-C区域。绝对保守的残基在红色背景上用白色表示,高度保守的残基用蓝色框出的红色字母表示。氨基酸编号和二级结构是针对蝙蝠 FluA聚合酶的。CTD结合位点1残基用青色三角形表示(在Flu A和Flu B病毒株中保守),而位点2用黄色三角形表示(关键残基仅在FluA病毒株中保守)。将讨论中提到的残基(位点1:C/R448(H1N1 453),位点2:I/L545(550)、 T/S547(552))显示为黑色三角形。
图5:Flu A聚合酶的荧光各向异性数据。A:替代测定:与蝙蝠聚合酶结合的荧光标记Ser5-磷酸化肽(4次重复):用相同的未标记肽滴定vRNA。示出表观KD(KD′)。B:不存在vRNA启动子的情况下Ser5-磷酸化肽的结合。C:与非磷酸化4次重复CTD肽(Y1S2P3T4S5P6S7)的相互作用。结合曲线可外推至估计的KD的>10μM范围。误差线表示三次独立实验的SD,KD显示为±拟合误差。
图6:SeP5结合口袋的突变分析。A:显示测量出的重组蝙蝠FluA突变体与Ser5-磷酸化4次重复CTD肽的KD的表格。每个双突变仅影响FluA上的两个CTD结合位点中的一个(位点1的K289A和R449A,以及位点2的K630A 和R633A,蝙蝠中的编号)。还显示了与野生型蛋白相比的倍数变化(FluA或 FluB的相应突变体)。B:微型基因组测定,其将与磷酸化Ser5CTD的结合减弱的单突变体和双突变体的活性进行比较。误差线表示重复三次的三次独立实验的SD。C:体外帽依赖性转录活性测定,其将野生型FluA与相应位点1和位点2的双突变体进行比较。误差线显示来自三次不同实验的SD。速率常数显示为±拟合误差。
图7:突变聚合酶蛋白与4次重复的Ser5-磷酸化CTD肽相互作用的荧光各向异性数据。(A):蝙蝠FluA位点1双突变体K630A/R633A(左),位点2双突变体K289A_R449A(右);(B):乙型流感病毒位点1双突变体K631A/R634A。误差线表示三次独立实验的SD,KD显示为±拟合误差。C:用vRNA和cRNA 作为模板的体外未引发复制反应的时间历程,其将位点1和位点2的双突变体与野生型蝙蝠FluA进行比较。误差线显示来自三种不同反应的SD。表格显示测量出的速率常数±拟合误差。
图8:突变病毒挽救实验。A:噬斑测定,其显示重组甲型/WSN/33病毒在反向遗传学上清液中的滴度和噬斑表型。示出用指定的病毒稀释液感染的细胞单层结晶紫染色。野生型(WT),空白对照(Mock):分别用野生型PA或无PA 质粒进行对照。B:重组甲型/WSN/33病毒在MDCK细胞中的生长曲线。在指定的时间点,通过MDCK细胞中的噬斑测定来确定病毒感染滴度。将X轴设定为测定的检测限(25噬斑形成单位(pfu)/mL)。误差线显示三次重复的SD。由于噬斑的尺寸非常小,R454A突变体的病毒滴度可能被低估。C:左:与CTD 肽结合的野生型蝙蝠FluA结构,其显示出R633-SeP5相互作用;右:以结合 CTD的蝙蝠FluA结构为模型的C448R/R633A双突变体(对应于禽类/人类FluA 中的C453R/R638A),其显示出R448可以补偿R633。涉及双突变体的残基是品红色的。D:CTD-FluA相互作用的视图,其显示出I545和T547残基的位置。I545(人类/禽类病毒株中的L550)与Y1c和P6c接触;T547(人类/禽类流感中的S/T552)接近于S7b。FluA PA-C着色为绿色,I545和T547着色为品红色, CTD肽着色为蓝色。
图9:表1:与28个氨基酸的SeP5 CTD肽结合的FluA和FluB聚合酶的数据收集和修正统计数据。
图10:表2:报道的与具有各种CTD相互作用蛋白的SeP2/SeP5或SeP5 磷酸化的CTD肽的结合亲和力。
图11至图12:(一般注释):与CTD(链X)结合的如SEQ ID NO:1或SEQ ID NO:2所示的PA亚基的C末端结构域(链A)的修正原子结构坐标。文件头部提供了关于结合有vRNA启动子和CTD的完整异源三聚体结构的结构修正的信息。“原子(Atom)”是指其坐标被测量的元素。列中的第一个字母限定了元素。给出各氨基酸的3字母代码和氨基酸序列位置。“原子”行中的前3个值限定了所测量的元素的原子位置。第四个值对应于占有率,第五个(最后一个)值为温度因子(B因子)。占有率是指每个原子占据坐标指定位置的分子分数。值“1”表示每个原子在晶体的所有等效分子中具有相同的构象,即相同的位置。B是测量原子围绕其原子中心运动的热因子。该命名法对应于蛋白质数据库(PDB) 格式。
图11:结合有CTD的蝙蝠甲型流感/H17N10的RNA依赖性RNA聚合酶 PA亚基C末端结构域(258位至713位残基)的结构坐标,其为标准蛋白质数据库(PDB)格式。
图12:结合有CTD的人类乙型流感/孟菲斯/13/03的RNA依赖性RNA聚合酶PA亚基C末端结构域(258位至722位残基)的结构坐标,其为标准蛋白质数据库(PDB)格式。
图13:完整蝙蝠FluA和甲型/H7N9核心聚合酶的PA-CTD晶体结构比较。在H7N9结构中未观察到在位点1处的结合,这可能是由于该区域中PA的构象变化。FluA PA为绿色,H7N9PA为青色,CTD肽为蓝色(蝙蝠FluA位点1 和位点2)或品红色(H7N9位点2)。
图14:位点2 CTD结合模式和磷酸丝氨酸相互作用的碱性残基在甲型 /H7N9禽类流感聚合酶的PA中保守。H7N9 PA着色为青色,CTD肽着色为品红色。推定的氢键显示为黄色虚线。
图15:表3:SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:44的相应氨基酸位置
序列表
SEQ ID NO:1:甲型/小黄肩蝙蝠/危地马拉/060/2010(H17N10)的RNA依赖性RNA聚合酶PA亚基的氨基酸序列;GenBank:AFC35437.1
SEQ ID NO:2:人乙型流感/孟菲斯/13/03的RNA依赖性RNA聚合酶PA 亚基的氨基酸序列
SEQ ID NO:3:肽接头序列GMGSGMA
具体实施方式
在下面详细描述本发明之前,应理解本发明不限于本文所述的特定方法、方案和试剂,因它们是可变化的。还应理解,本文使用的术语仅用于描述特定实施方案,并不意图限制本发明的范围,本发明的范围仅受所附权利要求的限制。除非另外定义,否则本文使用的所有技术和科学术语均具有与本领域普通技术人员通常所理解的相同的含义。
在本说明书的整个文档中引用了若干文献。本文引用的每篇文献(包括所有专利、专利申请、科学出版物、制造商的说明书、使用说明等),无论在上文或在下文,均通过引用整体并入本文。本文中的任何内容不应被解释为承认本发明由于在先发明而不享有先于这类公开文本的权利。本文引用的一些文献的特征在于“通过引用并入”。如果这些并入的参考文献的定义或教导与本说明书中引用的定义或教导之间存在冲突,则以本说明书的文本为优先。优选地,本文所用术语的定义如“生物技术术语的多语言词汇表:(IUPAC推荐用语)”, H.G.W.Leuenberger,B.Nagel,and H.编,Helvetica Chimica Acta,CH-4010Basel,Switzerland,(1995)中所述。
为了实施本发明,除非另有说明,否则采用化学、生物化学、和重组DNA 技术的常规方法,这些方法在本领域的文献中有所解释(参见,例如,Molecular Cloning:ALaboratory Manual,第二版,J.Sambrook等人编,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor 1989)。
在下文中,将描述本发明的要素。这些要素与特定实施方案一同列出,然而,应该理解,它们可以以任何方式和任何数量组合以产生另外的实施方案。不应将各种所描述的实例和优选实施方案解释为将本发明仅限于明确描述的实施方案。该描述应被理解为支持和涵盖将明确描述的实施方案与任何数量的所公开的和/或优选的要素相组合的实施方案。此外,除非上下文另有说明,否则本申请中描述的所有要素的任何排列和组合应当认为由本申请的描述所公开。
定义
词语“包含”“含有”“包括”将被理解为暗示包括所述事物或步骤、或者事物或步骤的组但不排除任何其他事物或步骤、或者事物或步骤的组。
如本说明书和所附权利要求书中所使用的,要素前无数量词包括复数指代,除非所述内容另有明确说明。
浓度、量、和其他数值数据可以以“范围”格式在本文中表示或呈现。应当理解,这种范围格式仅仅是为了方便和简洁而使用,因此应该被灵活地解释为不仅包括明确列举为范围限制的数值,而且还包括包含在该范围内的所有单独的数值或子范围,如同明确地列举了每个数值和子范围。作为说明,“150mg 至600mg”的数值范围应解释为不仅包括明确列举的150mg至600mg的值,而且还包括在指定范围内的单独值和子范围。因此,包括在该数值范围内的是单独的值,例如150mg、160mg、170mg、180mg、190mg、......580mg、590mg、 600mg和子范围,例如150mg至200mg、150mg至250mg、250mg至300mg、 350mg至600mg等。同样的原理适用于仅引用一个数值的范围。此外,无论所描述的范围或特征的宽度如何,都应该应用这种解释。
当与数值结合使用时,术语“约”意味着包括具有比指示的数值小5%的下限和比指示的数值大5%的上限的范围内的数值。
术语“核酸”和“核酸分子”在本文中作同义使用,并且理解为脱氧核糖核苷酸碱基或核糖核苷酸碱基或两者的单链或双链寡聚物或聚合物。核苷酸单体由核碱基、五碳糖(例如但不限于核糖或2′-脱氧核糖)、和一至三个磷酸基团组成。通常,核酸通过各核苷酸单体之间的磷酸二酯键形成。在本发明的上下文中,术语核酸包括但不限于核糖核酸(RNA)分子和脱氧核糖核酸(DNA)分子,而且还包括包含其他连接的核酸合成形式,例如,Nielsen等人(Science 254: 1497-1500,1991)所述的肽核酸。通常,核酸是单链或双链分子且由天然存在的核苷酸组成。单链核酸的描述也(至少部分地)规定了互补链的序列。核酸可以是单链或双链,或可以包含双链和单链序列的部分。示例性的双链核酸分子可以具有3′或5′突出端,因此不需要或假设在其整个长度上完全是双链的。核酸可通过生物学、生物化学或化学合成方法或本领域已知的任何方法获得,包括但不限于扩增和RNA逆转录的方法。术语核酸包括染色体或染色体区段、载体(例如,表达载体)、表达盒、裸露DNA或RNA聚合物、引物、探针、cDNA、基因组DNA、重组DNA、cRNA、mRNA、tRNA、微小RNA(miRNA)或小干扰RNA(siRNA)。核酸可以是例如单链、双链、或三链的,且不限于任何特定长度。除非另有说明,否则除了明确指出的任何序列外,特定核酸序列还包含或编码互补序列。
核酸可以被内切核酸酶或外切酶核酸降解,特别是可以被在细胞中发现的 DNA酶和RNA酶降解。因此,有利的是,修饰核酸使其稳定防止降解,从而确保核酸在长时间内在细胞中维持高浓度。通常,可以通过引入一个或多于一个核苷酸间磷酸基团或通过引入一个或多于一个核苷酸间非磷桥来获得这种稳定。因此,核酸可以由非天然存在的核苷酸组成和/或天然存在的核苷酸的修饰形式、和/或分子骨架的变化形式构成。核酸中修饰的核苷酸间磷酸基团和/或非磷桥包括但不限于膦酸甲酯、硫代磷酸酯、氨基磷酸酯、二硫代磷酸酯和/或磷酸酯,而非磷的核苷酸间类似物包括但不限于硅氧烷桥、碳酸酯桥、羧甲基酯、乙酰胺桥和/或硫醚桥。核苷酸修饰的其他实例包括但不限于:5′或3′核苷酸的磷酸化,以分别允许连接或防止外切核酸酶降解/聚合酶延伸;氨基、巯基、炔烃、或生物素基修饰,用于共价和近共价连接;荧光和淬灭;以及修饰碱基,例如脱氧肌苷(dI)、5-溴脱氧尿苷(5-溴-dU)、脱氧尿苷、2-氨基嘌呤、2,6-二氨基嘌呤、反向dT、反向双脱氧-T、双脱氧基胞苷(ddC)、5-甲基脱氧胞苷(5-甲基dC)、锁核酸(LNA)、5-硝基吲哚、异-dC碱基和异-dG碱基、2′-O- 甲基RNA碱基、羟甲基dC、5-羟基丁炔-2′-脱氧尿苷、8-氮杂-7-脱氮鸟苷和氟修饰的碱基。因此,核酸也可以是人工核酸,其包括但不限于聚酰胺或肽核酸 (PNA)、吗啉代核酸和锁核酸(LNA)、以及乙二醇核酸(GNA)和苏糖核酸(TNA)。
当核酸与另一核酸序列存在功能关系时,该核酸被“可操作地连接”。例如,如果启动子或增强子影响序列的转录,则该启动子或增强子与编码序列可操作地连接;或者如果核糖体结合位点被定位以便进行翻译,则该核糖体结合位点与编码序列可操作地连接。
在本发明的背景下,术语“寡核苷酸”是指最多约50个核苷酸的核酸序列,例如长度为2个至约50个核苷酸的核酸序列。
当在本发明的背景下使用时,术语“多核苷酸”是指长度大于约50个核苷酸的核酸,例如长度为51个或多于51个核苷酸的核酸。
寡核苷酸和多肽通过任何合适的方法制备,包括但不限于分离现有或天然序列、DNA复制或扩增、逆转录、克隆和限制性消化适当的序列、或通过例如以下方法直接化学合成:Narang等人的磷酸三酯方法(Meth.Enzymol. 68:90-99,1979);Brown等人的磷酸二酯方法(Meth.Enzymol.68:109-151,1979); Beaucage等人的二乙基亚磷酰胺方法(Tetrahedron Lett.22:1859-1862,1981); Matteucci等人的三酯方法(J.Am.Chem.Soc.103:3185-3191,1981);自动合成方法;或美国专利第4458066号的固相支持体方法;或本领域技术人员已知的其他方法。
如本文所用,术语“载体”是指蛋白质或多核苷酸或其混合物,其能够被引入细胞中或将包含在其中的蛋白质和/或核酸引入细胞中。载体的实例包括但不限于质粒、黏粒、噬菌体、病毒或人工染色体。特别地,载体用于将感兴趣的基因产物,例如外源或异源DNA转运至合适的宿主细胞中。载体可含有“复制子”多核苷酸序列,其有助于载体在宿主细胞中的自主复制。外源DNA定义为异源DNA,其是宿主细胞中非天然存在的DNA,其例如复制载体分子、编码可选择的或可筛选的标记、或编码转基因。一旦进入宿主细胞,载体可以独立于宿主染色体DNA进行复制或与宿主染色体DNA同时进行复制,并且可以产生载体及其插入的DNA的若干拷贝。此外,载体还可含有允许插入的DNA 转录成mRNA分子或以其他方式使得插入的DNA复制为多拷贝的RNA的必需元件。载体还可以包含调节感兴趣的基因表达的“表达控制序列”。通常,表达控制序列是多肽或多核苷酸,例如但不限于启动子、增强子、沉默子、绝缘子、或抑制子。在包含编码一种或多于一种感兴趣的基因产物的一种或多于一种多核苷酸的载体中,可以通过一种或多于一种表达控制序列来共同地或单独地控制表达。更具体地,载体上包含的每个多核苷酸可以由单独的表达控制序列控制,或者载体上包含的所有多核苷酸可以由单个表达控制序列控制。包含在单个载体上、由单个表达控制序列控制的多核苷酸可以形成开放阅读框。一些表达载体另外含有与插入的DNA相邻的序列元件,该序列元件增加表达的mRNA的半衰期和/或允许mRNA翻译成蛋白质分子。因此可以快速合成由插入的DNA编码的许多mRNA和多肽分子。
术语“氨基酸”通常是指包含置换或未置换的氨基、置换或未置换的羧基、和一个或多于一个侧链或基团、或任何这些基团的类似物的任何单体单元。示例性侧链包括例如巯基、硒基、磺酰基、烷基、芳基、酰基、酮基、叠氮基、羟基、肼、氰基、卤素、酰肼、烯基、炔基、醚、硼酸、硼酸盐、磷酸、膦酰基、膦、杂环基、烯酮、亚胺、醛、酯、硫代酸、羟胺、或这些基团的任何组合。其他代表性氨基酸包括但不限于包含可光活化交联剂的氨基酸、金属结合氨基酸、自旋标记氨基酸、荧光氨基酸、含金属氨基酸、具有新官能团的氨基酸、共价或非共价地与其他分子相互作用的氨基酸、光化和/或光致异构化的氨基酸、放射性氨基酸、包含生物素或生物素类似物的氨基酸、糖基化氨基酸、其他碳水化合物修饰的氨基酸、包含聚乙二醇或聚醚的氨基酸、重原子置换的氨基酸、可化学裂解的和/或可光裂解的氨基酸、碳连接的含糖氨基酸、氧化还原活性氨基酸、含氨基硫代酸的氨基酸、以及包含一个或多于一个毒性部分的氨基酸。如本文所用,术语“氨基酸”包括以下二十种天然或遗传编码的α- 氨基酸:丙氨酸(Ala或A)、精氨酸(Arg或R)、天冬酰胺(Asn或N)、天冬氨酸 (Asp或D)、半胱氨酸(Cys或C)、谷氨酰胺(Gln或Q)、谷氨酸(Glu或E)、甘氨酸(Gly或G)、组氨酸(His或H)、异亮氨酸(Ile或I)、亮氨酸(Leu或L))、赖氨酸(Lys或K)、甲硫氨酸(Met或M)、苯丙氨酸(Phe或F)、脯氨酸(Pro或P)、丝氨酸(Ser或S)、苏氨酸(Thr或T)、色氨酸(Trp或W)、酪氨酸(Tyr或Y)和缬氨酸(Val或V)。在“X”残基未定义的情况下,这些残基应定义为“任何氨基酸”。这20种天然氨基酸的结构示于例如Stryer等人,Biochemistry,第5版, Freeman and Company(2002)中。其他的氨基酸,例如硒代半胱氨酸和吡咯赖氨酸,也可以被遗传编码(Stadtman(1996)“Selenocysteine,”Annu Rev Biochem. 65:83-100和Ibba等人,(2002)“Genetic code:introducing pyrrolysine,”Curr Biol. 12(13):R464-R466)。术语“氨基酸”还包括非天然氨基酸、修饰的氨基酸(例如,具有修饰的侧链和/或骨架)、和氨基酸类似物。参见,例如,Zhang等人(2004) “Selective incorporation of 5-hydroxytryptophan into proteinsin mammalian cells,” Proc.Natl.Acad.Sci.U.S.A.101(24):8882-8887;Anderson等人(2004)“An expanded genetic code with a functional quadruplet codon”Proc.Natl.Acad.Sci. U.S.A.101(20):7566-7571;Ikeda等人(2003)“Synthesis of anovel histidine analogue and its efficient incorporation into a protein invivo,”Protein Eng.Des. Sel.16(9):699-706;Chin等人(2003)“An ExpandedEukaryotic Genetic Code,” Science 301(5635):964-967;James等人(2001)“Kineticcharacterization of ribonuclease S mutants containing photoisomerizablephenylazophenylalanine residues,”Protein Eng.Des.Sel.14(12):983-991;Kohrer等人(2001)“Import of amber and ochre suppressor tRNAs into mammalian cells:Ageneral approach to site-specific insertion of amino acid analogues intoproteins,”Proc.Natl.Acad.Sci. U.S.A.98(25):14310-14315;Bacher等人(2001)“Selection and Characterization of Escherichia coli Variants Capable ofGrowth on an Otherwise Toxic Tryptophan Analogue,”J.Bacteriol.183(18):5414-5425;Hamano-Takaku等人(2000)“A Mutant Escherichia coli Tyrosyl-tRNASynthetase Utilizes the Unnatural Amino Acid Azatyrosine More Efficientlythan Tyrosine,”J.Biol.Chem. 275(51):40324-40328;以及Budisa等人(2001)“Proteinswith {beta}-(thienopyrrolyl)alanines as alternative chromophores andpharmaceutically active amino acids,”Protein Sci.10(7):1281-1292。氨基酸可以合并成肽、多肽、或蛋白质。
在本发明的背景下,术语“肽”是指通过肽键连接的氨基酸的短聚合物。它与蛋白质具有相同的化学键(肽键),但通常长度较短。最短的肽是二肽,由通过单个肽键连接的两个氨基酸组成。还可以存在三肽、四肽、五肽等。通常,肽的长度为最多8个、10个、12个、15个、18个或20个氨基酸。除非肽是环肽,否则其具有氨基末端和羧基末端。
在本发明的背景下,术语“多肽”是指通过肽键结合在一起的氨基酸的单个直链并且通常包含至少约21个氨基酸。多肽可以是由多于一条链构成的蛋白质的一条链,或者如果蛋白质由一条链构成,则多肽可以是蛋白质本身。
术语“氨基酸段”是指具有特定氨基酸序列的肽、多肽或蛋白质的一部分。因此,氨基酸段首先由存在于所述段中的氨基酸限定,其次由该段中存在的氨基酸的特定顺序限定。例如,在多肽包含某一段氨基酸的情况下,应理解该多肽包含以在该区段中排列的特定顺序特定存在于该段中的氨基酸。然而,不包含特定氨基酸段的多肽可包含该段的单个氨基酸,但不包含特定氨基酸在该段中排列的特定顺序。
在本发明的背景下,蛋白质或多肽的“一级结构”是多肽链中的氨基酸序列。蛋白质的“二级结构”是蛋白质局部区段的总体三维形式。然而,二级结构没有描述三维空间中的特定原子位置,该特定原子位置被认为是三级结构。在蛋白质中,二级结构由骨架酰胺和羧基之间的氢键模式限定。蛋白质的“三级结构”是由原子坐标确定的蛋白质三维结构。“四级结构”是多亚基复合物中多个折叠或卷曲的蛋白质或多肽分子的排列。
本文所用的术语“折叠”或“蛋白质折叠”是指蛋白质呈现其三维形状或构象的过程,即通过非共价相互作用引导蛋白质形成特定的三维形状的过程,非共价相互作用例如但不限于氢键、金属配位、疏水力、范德华力、π-π相互作用、和/或静电效应。因此,术语“折叠的蛋白质”是指其具有三维形状,例如其二级、三级、或四级结构的蛋白质。
本文使用的术语“片段”是指天然存在的片段(例如剪接变体)以及人工构建的片段,特别是通过基因技术手段获得的片段。通常,相较于亲本多肽,片段在其N末端和/或在其C末端和/或内部,优选在其N末端、在其N末端和C 末端、或在其C末端具有至多1个、2个、3个、4个、5个、6个、7个、8 个、9个、10个、15个、20个、25个、30个、35个、40个、45个、50个、 55个、60个、65个、70个、75个、80个、85个、90个、95个、100个、 110个、120个、130个、140个、150个、160个、170个、180个、190个、 200个、210个、220个、230个、240个、250个、260个、270个、280个、 290个、或300个氨基酸的缺失。
术语“亚基”是指可以使大分子(例如多肽、蛋白质或多蛋白)分离的大分子的任何部分。大分子可以由一个或多于一个亚基组成。由于大分子和/或单个亚基的功能(例如具有某些结合或相互作用功能)或结构(例如核苷酸或氨基酸序列,或二级或三级结构)性质,这种分离是可能存在的。在本发明的背景下,术语“亚基”优选指蛋白质或多蛋白的一部分。特别优选的是,这种亚基独立于蛋白质或多蛋白的其余部分折叠和/或起作用。特别地,在本发明的背景下, RNA依赖性RNA聚合酶的亚基是指PA亚基、PB1亚基、和PB2亚基。术语亚基还包括天然亚基的变体,例如天然亚基的片段、天然亚基的衍生物、或天然亚基的密码子优化变体。优选地,这些亚基的变体仍然表现出与天然亚基相同的功能。
术语“PA亚基的羧基末端片段”是指衍生自PA亚基的羧基末端部分的PA 亚基的片段。术语“PA亚基的羧基末端片段”不要求PA亚基的C末端以片段形式存在,而是指该片段衍生自PA亚基的位于该亚基C末端三分之二处的部分,即可通过胰蛋白酶使PA亚基分离的C末端258位氨基酸残基(甲型流感中的 713位氨基酸残基或乙型流感中的726位氨基酸残基)处的部分。因此,术语“PA 亚基的羧基末端片段”是指衍生自甲型流感病毒PA亚基的258位至713位氨基酸的片段、或乙型流感病毒PA亚基的258位至726位氨基酸的片段、或与这些氨基酸对应的氨基酸的片段,即在与甲型流感病毒PA亚基或乙型流感病毒 PA亚基比对的PA亚基中具有类似位置的氨基酸的片段。
术语“CTD”或“Pol II CTD”或“细胞Pol II CTD”是指真核细胞中存在的 DNA依赖性RNA聚合酶II的C末端结构域。通常,哺乳动物细胞,特别是人细胞中的Pol II CTD由具有共有序列Y1S2P3T4S5P6S7的52个七肽的重复序列组成。
如本文所用,术语“变体”应理解为与所述多肽或多核苷酸不同的多肽或多核苷酸,且由所述多肽或多核苷酸的长度或序列中的一个或多于一个改变衍生而来。衍生出多肽或多核苷酸变体的多肽或多核苷酸也称为亲本多肽或亲本多核苷酸。术语“变体”包括亲本分子的“片段”或“衍生物”。通常,“片段”的长度或大小小于亲本分子,而“衍生物”表现出与亲本分子在序列方面的一个或多于一个差异。变体还包括修饰的分子,例如但不限于翻译后修饰的蛋白质(例如糖基化蛋白质、生物素化蛋白质、磷酸化蛋白质、泛素化蛋白质、棕榈酰化蛋白质、或蛋白水解切割的蛋白质)和修饰的核酸例如甲基化的DNA。此外,术语“变体”包括不同分子的混合物,例如但不限于RNA-DNA杂合体。通常,变体是人工构建的,优选通过基因技术手段构建,而亲本蛋白质或多核苷酸是野生型蛋白质或多核苷酸、或其共有序列。然而,天然存在的变体还应理解为包括在本文使用的术语“变体”中。此外,可用于本发明的变体还可以衍生自亲本分子的同源物、直系同源物、或旁系同源物,或衍生自人工构建的变体,只要该变体表现出亲本分子的至少一种生物活性,即该变体具有功能活性。
特别地,术语“肽变体”、“多肽变体”、“蛋白质变体”应理解为与所述肽、多肽或蛋白质不同的肽、多肽或蛋白质,且由所述肽、多肽或蛋白质的氨基酸序列中的一个或多于一个改变衍生而来。衍生出肽、多肽或蛋白质变体的肽、多肽或蛋白质也称为亲本肽、亲本多肽、或亲本蛋白质。此外,可用于本发明的变体还可以衍生自亲本肽、亲本多肽、或亲本蛋白质的同源物、直系同源物或旁系同源物,或衍生自人工构建的变体,只要该变体表现出亲本肽、亲本多肽、或亲本蛋白质的至少一种生物活性。氨基酸序列的改变可以是可在一个或几个位点发生的氨基酸交换、插入、缺失、N末端截短、或C末端截短、或这些改变的任何组合。肽、多肽或蛋白质变体在氨基酸序列中可以显示出总数为至多200个(至多1个、2个、3个、4个、5个、6个、7个、8个、9个、10 个、15个、20个、25个、30个、35个、40个、45个、50个、55个、60个、 65个、70个、75个、80个、85个、90个、95个、100个、110个、120个、 130个、140个、150个、160个、170个、180个、190个、或200个)的改变(即交换、插入、缺失、N末端截短、和/或C末端截短)。氨基酸交换可以是保守的和/或非保守的。替代地或另外地,如本文所用的“变体”可以通过与衍生出它的亲本肽、亲本多肽、或亲本蛋白质的一定程度的序列同一性来表征。更确切地说,本发明背景下的肽、多肽、或蛋白质变体表现出与其亲本肽、亲本多肽、或亲本蛋白质至少80%的序列同一性。肽、多肽、或蛋白质变体的序列同一性覆盖20个、30个、40个、45个、50个、60个、70个、80个、90个、100 个、或多于100个氨基酸的连续段。
如果残基占据多肽结构中的类似位置,则认为两个或多于两个多肽中的残基彼此“对应”。如本领域众所周知的,可以通过基于氨基酸序列或结构相似性比对多肽序列来确定两个或多于两个多肽中的类似位置。术语与另一序列(例如,区域、片段、核苷酸或氨基酸位置等)“对应”是指以使序列同一性百分比最大化的方式对核苷酸或氨基酸位置进行编号以及进行序列比对的惯例。因为并非给定“对应区域”内的所有位置都需要相同,所以对应区域内的非匹配位置可视为“对应位置”。因此,如本文所用,所提及的指定核苷酸序列或氨基酸序列的“对应于氨基酸位置[X]的氨基酸位置”是指基于比对,在与其比对的另一核苷酸或氨基酸序列以及结构同源物和家族中的等同位置。在本发明的一些实施方案中,氨基酸位置的“对应”是相对于包含SEQ ID NO:1、SEQ ID NO:2、或SEQ ID NO:44中的一个或多于一个基序的感兴趣区域确定的。例如,位于SEQ ID NO:1的第449位的氨基酸精氨酸(R449)对应于SEQ ID NO:44的第454位的氨基酸精氨酸(R454)。特别地,SEQ ID NO:1、SEQID NO:2、和SEQ ID NO:44的CTD结合位点1和结合位点2的相应氨基酸位置如图15 中所示。当多肽序列例如通过氨基酸的改变或氨基酸的添加或缺失而不同于指定序列时,与活性改善相关的特定突变可能与所述特定序列中的位置编号不同。允许技术人员分析序列和鉴别对应位置的比对工具在本领域中是众所周知的,并且可以例如使用标准设置在万维网(World Wide Web)上获得,例如 ClustalW(www.ebi.ac.uk/clustalw)或 Align(http://www.ebi.ac.uk/emboss/align/index.html),优选Align EMBOSS:needle, Matrix:Blosum62,Gap Open 10.0,Gap Extend 0.5。本领域技术人员理解,可能需要在任一序列中引入空位以产生令人满意的比对。如果以最佳序列比对进行残基比对,则认为两个或多于两个PA亚基中的残基“对应”。将两个多肽之间的“最佳序列比对”定义为产生最大数量对齐的相同残基的比对。如果两个比对序列之间的序列相似性,优选同一性,在10个、20个或30个氨基酸的长度上下降至小于30%、优选小于20%、更优选小于10%,则结束“最佳序列比对区域”,并因此确定比较序列长度的范围和界限以确定相似性得分。
在采用本发明方法鉴别化合物的背景下使用的术语“缔合”是指部分(即,化学实体或化合物或其部分或片段)与PA亚基的内切核酸酶活性位点之间相邻近的情况。该缔合可以是非共价的,即其中位置邻近在能量上是因为例如氢键、范德华力、静电或疏水相互作用带来的,或者其可以是共价的。
术语“重组”是指通过重组方法有意修饰的氨基酸序列或核苷酸序列。如本文所用的术语“重组核酸”是指在体外形成的核酸,并且任选地通过内切核酸酶进一步操作以形成通常不存在于自然界中的核酸分子。示例性的重组核酸包括线性形式的cDNA、以及通过连接通常不被包含的DNA分子而在体外形成的载体。应当理解,一旦制得重组核酸并将其导入宿主细胞,其将非重组地复制,即使用宿主细胞的体内细胞机制而非体外操作进行复制。因此,重组产生的核酸可以随后非重组地复制。“重组蛋白”是使用重组技术制备的蛋白质,例如通过表达如上所述的重组核酸而制备的蛋白质。本文所用的术语“重组载体”包括本领域技术人员已知的任何载体,包括质粒载体、黏粒载体、噬菌体载体如λ噬菌体、病毒载体如腺病毒载体或杆状病毒载体、或人工染色体载体如细菌人工染色体(BAC)、酵母人工染色体(YAC)、或P1人工染色体(PAC)。所述载体包括表达载体以及克隆载体。表达载体包括质粒以及病毒载体,并且通常含有期望的编码序列和在特定宿主生物(例如,细菌、酵母、植物、昆虫或哺乳动物)中或在体外表达系统中表达可操作连接的编码序列所必需的合适的DNA序列。克隆载体通常用于改造和扩增一些期望的DNA片段,并且可能缺乏表达期望DNA片段所需的功能序列。
术语“宿主细胞”是指携带载体(例如质粒或病毒)的细胞。这种宿主细胞可以是原核细胞(例如细菌细胞)或真核细胞(例如真菌、植物或动物细胞)。宿主细胞包括单细胞原核生物和真核生物(例如细菌、酵母和放线菌)以及来自高等植物或动物、在细胞培养物中生长的单个细胞。如本文所用,“重组宿主细胞”是指包含编码感兴趣的多肽片段,即根据本发明的病毒PA亚基的片段或其变体的多核苷酸的宿主细胞。可以发现该多核苷酸在宿主细胞内(i)自由地分散、 (ii)掺入重组载体中、或(iii)整合至宿主细胞基因组或线粒体DNA中。重组细胞可用于表达感兴趣的多核苷酸或用于扩增本发明的多核苷酸或重组载体。术语“重组宿主细胞”包括已经用本发明的多核苷酸或重组载体转化、转染、或感染的原始细胞的子代。重组宿主细胞可以是细菌细胞如大肠杆菌细胞、酵母细胞例如酿酒酵母或巴斯德毕赤酵母、植物细胞、昆虫细胞如SF9或High Five 细胞、或哺乳动物细胞。哺乳动物细胞的优选实例是中国仓鼠卵巢(CHO)细胞、非洲绿猴肾(COS)细胞、人胚肾(HEK293)细胞、HELA细胞等。
通过在对比窗口比较两个最佳比对序列来确定“序列同一性百分比”,其中对比窗口中的序列部分与参考序列(不包括添加或缺失)相比可以包含添加或缺失(即空位)以供两个序列的最佳比对。该百分比通过以下方式计算:确定在两个序列中出现相同核酸碱基或氨基酸残基的位置数以产生匹配位置的数量,将匹配位置的数量除以对比窗口中的位置总数并将结果乘以100以得到序列同一性百分比。
在两个或多于两个核酸或多肽序列的背景下,术语“相同”是指两个或多于两个相同的序列或子序列,即包含相同的核苷酸或氨基酸序列的的序列或子序列。当在所测量的对比窗口或指定区域使用以下序列比较算法之一或通过手动比对和目测来比较并对齐以获得最大的对应性时,如果序列具有指定百分比的相同的核苷酸或氨基酸残基(例如,在指定区域具有至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%的同一性),则序列彼此“基本相同”。这些定义还涉及测试序列的互补序列。任选地,所讨论的多肽和参考多肽在20个、30个、40 个、45个、50个、60个、70个、80个、90个、100个或多于100个氨基酸的连续段或参考多肽的整个长度显示出所指定的序列同一性。任选地,所讨论的多核苷酸和参考多核苷酸在60个、90个、120个、135个、150个、180个、 210个、240个、270个、300个、400个、500个、600个、700个、800个、 900个、1000个、或多于1000个核苷酸的连续段或参考多核苷酸的整个长度显示出所指定的序列同一性。
术语“序列比较”是指一个序列作为参考序列与测试序列进行比较的过程。当使用序列比较算法时,将测试序列和参考序列输入计算机,如果需要,指定子序列坐标并指定序列算法程序参数。通常使用默认程序参数,或者可以指定替代参数。然后,序列比较算法基于程序参数计算测试序列相对于参考序列的序列同一性或相似性百分比。在比较两个序列并且未指定用来计算序列同一性百分比的参考序列的情况下,如不具体另外说明,则参考待比较的两个序列中较长的序列来计算序列同一性。如果指定参考序列且不具体另外说明,则基于 SEQ ID指示的参考序列的全长确定序列同一性。
在序列比对中,术语“对比窗口”是指那些序列连续位置的段,其与具有相同数量位置的序列的连续位置参考段进行比较。所选择的连续位置的数量可以为10个到1000个,即可以包括20个、30个、40个、50个、60个、70个、 80个、90个、100个、150个、200个、250个、300个、350个、400个、450 个、500个、550个、600个、650个、700个、750个、800个、850个、900个、950个、或1000个连续位置。通常,连续位置的数量为约20个至800个连续位置、约20个至600个连续位置、约50个至400个连续位置、约50个至约200个连续位置、约100个至约150个连续位置。
用于比较的序列比对方法是本领域所熟知的。可以例如通过Smith和 Waterman的局部同源性算法(Adv.Appl.Math.2:482,1970)、通过Needleman和 Wunsch的同源性比对算法(J.Mol.Biol.48:443,1970)、通过Pearson和Lipman 的相似性搜索方法(Proc.Natl.Acad.Sci.USA 85:2444,1988)、通过这些算法的计算机化实现(例如,威斯康星遗传学软件包(the Wisconsin Genetics Software Package,Genetics ComputerGroup,575Science Dr.,Madison,Wis.)中的GAP、 BESTFIT、FASTA、和TFASTA)、或通过手动比对和目测(参见,例如,Ausubel 等人,Current Protocols in Molecular Biology(1995补充))来进行用于比较的序列的最佳比对。适用于确定序列同一性和序列相似性百分比的算法是BLAST 和BLAST 2.0算法,其由Altschul等人(NNuc.Acids Res.25:3389-402,1977)和 Altschul等人(J.Mol.Biol.215:403-10,1990)分别描述。用于进行BLAST分析的软件可通过美国国家生物技术信息中心(http://www.ncbi.nlm.nih.gov/)公开获得。该算法包括首先通过鉴别问询序列中长度为W的短字来鉴别高得分序列对(HSP),该高得分序列对在与数据库序列中相同长度的字比对时匹配或满足一定的正值阈值得分T。T被称为邻域字得分阈值(Altschul等人,同上)。这些最初的邻域字命中充当用于启始搜索的种子以寻找包含它们的更长的HSP。只要累计的比对得分可被增加,字命中则沿每条序列的两个方向延伸。对于核苷酸序列,使用参数M(一对匹配残基的奖励得分;总是>0)和N(错配残基的处罚得分;总是<0)计算累计得分。对于氨基酸序列,使用得分矩阵来计算累计得分。当发生以下情况时停止字命中在每个方向的延伸:累计比对得分从其所达到的最大值下降了量X;由于一个或多于一个负得分残基比对的累积,累计得分趋于零或零以下;或者到达每条序列的末端。BLAST算法参数W、T 和X决定比对的灵敏度和速度。BLASTN程序(对于核苷酸序列而言)使用字长 (W)为11、期望(E)为10、M=5、N=-4、和两条链的比较作为默认值。对于氨基酸序列,BLASTP程序使用字长为3、期望(E)为10、和BLOSUM62得分矩阵(参见Henikoff和Henikoff,Proc.Natl.Acad.Sci.USA 89:10915,1989)比对(B) 为50、期望(E)为10、M=5、N=-4、和两条链的比较作为默认值。BLAST算法还对两个序列之间的相似性进行统计学分析(参见,例如,Karlin和Altschul, Proc.Natl.Acad.Sci.USA 90:5873-87,1993)。BLAST算法提供的一种相似性测量方法为最小总和概率(P(N)),其指示两个核苷酸或氨基酸序列之间偶然发生匹配的概率。例如,如果在测试核酸与参考核酸的比较中最小总和概率小于约0.2,通常小于约0.01,更通常小于约0.001,则认为核酸与参考序列相似。
如本文所用,术语“共有”是指表示多序列比对结果的氨基酸或核苷酸序列,其中相关序列彼此比较。这种共有序列由在每个位置最常见的氨基酸或核苷酸组成。在本发明的背景下,优选地,在序列比对中用于获得共有序列的序列是在世界范围内各种不同疾病暴发中分离的不同病毒亚型病毒株的序列。序列比对中使用的每个单独序列称为特定病毒“分离株”的序列。
优选半保守和特别保守的氨基酸置换,其中氨基酸被化学上相关的氨基酸置换。典型置换发生在脂肪族氨基酸之间、具有脂肪族羟基侧链的氨基酸之间、具有酸性残基的氨基酸之间、酰胺衍生物之间、具有碱性残基的氨基酸之间、或具有芳香族残基的氨基酸之间。典型的半保守和保守置换为:
如果新的半胱氨酸保持为游离巯基,则从A、F、H、I、L、M、P、V、 W或Y变为C是半保守的。此外,技术人员将理解,空间上要求高的位置处的甘氨酸不应被置换,并且不应将P引入具有α-螺旋或β-折叠结构的蛋白质部分。
标签(或标志物或标记)是能够指示另一种物质或物质复合物存在的任何种类的物质。标志物可以是与待检测物质连接的物质或是引入待检测物质中的物质。可检测标志物用于分子生物学和生物技术中以检测例如蛋白质、酶促反应的产物、第二信使、DNA、分子的相互作用等。合适的标签或标记的实例包括荧光团、发色团、放射性标记、金属胶体、酶或化学发光或生物发光分子。在本发明的背景下,合适的标签优选是蛋白质标签,其肽序列以基因的方法接枝到重组蛋白质中或重组蛋白质上。蛋白质标签可以例如包括亲和标签、增溶标签、色谱标签、表位标签或荧光标签。
将“亲和标签”附加到蛋白质上,使得可以使用亲和技术从其天然生物来源纯化蛋白质。这些标签包括几丁质结合蛋白(CBP)、麦芽糖结合蛋白(MBP)、和谷胱甘肽-S-转移酶(GST)。多聚(His)标签是广泛使用的蛋白质标签,其与金属基质结合。
“增溶标签”特别地用于以分子伴侣缺陷类别表达的重组蛋白,以帮助蛋白质的适当折叠并防止它们沉淀。这些标签包括硫氧还蛋白(TRX)和多聚(NANP)。一些亲和标签具有作为增溶剂的双重作用,例如MBP和GST。
“色谱标签”用于改变蛋白质的色谱性质,以在特定的分离技术中提供不同的分辨率。通常,这些标签由聚阴离子氨基酸组成,例如FLAG-标签。
“表位标签”是由于在许多不同物种中可以可靠地产生高亲和力抗体而被挑选出来的短肽序列。这些标签通常来自病毒基因,这解释了它们的高免疫反应性。表位标签包括V5标签、Myc标签、和HA标签。这些标签特别适用于蛋白质印迹、免疫荧光和免疫沉淀实验,然而它们也可用于抗体纯化。
“荧光标签”用于视觉读出蛋白质。GFP及其变体是最常用的荧光标签。GFP 的更高级应用包括将其用作折叠报告物(如果折叠则发出荧光,否则则为无色)。荧光团的其他实例包括荧光素、罗丹明和磺基吲哚菁染料Cy5。
此类标签的实例包括但不限于Avi标签(能够被酶BirA生物素化并由链霉亲和素分离的肽(SEQ ID NO:4,GLNDIFEAQKIEWHE))、钙调蛋白标签(由蛋白质钙调蛋白结合的肽(SEQ ID NO:5, KRRWKKNFIAVSAANRFKKISSSGAL))、多聚谷氨酸标签(有效结合阴离子交换树脂如Mono-Q的肽(SEQ ID NO:6,EEEEEE))、E标签(由抗体识别的肽(SEQ ID NO:7,GAPVPYPDPLEPR))、FLAG标签(由抗体识别的肽(SEQ ID NO:8, DYKDDDDK))、HA-标签(由抗体识别的肽(SEQ ID NO:9,YPYDVPDYA))、His标签(结合镍或钴螯合物的5个至10个组氨酸(SEQ ID NO:10,HHHHHH))、 Myc标签(由抗体识别的短肽(SEQ ID NO:11,EQKLISEEDL))、S标签(SEQ ID NO:12,KETAAAKFERQHMDS)、SBP标签(与链霉亲和素结合的肽(SEQ ID NO:13,MDEKTTGWRGGHVVEGLAGELEQLRARLEHHPQGQREP))、Sof 标签1(用于哺乳动物表达(SEQ IDNO:14,SLAELLNAGLGGS))、Sof标签 3(用于原核表达(SEQ ID NO:15,TQDPSRVG))、Strep标签(与链霉亲和素或被称为streptactin的经修饰的链霉亲和素结合的肽(Strep标签II:SEQ ID NO: 16,WSHPQFEK))、TC标签(由FlAsH和ReAsH双砷化合物识别的四半胱氨酸标签(SEQ ID NO:17,CCPGCC))、V5标签(由抗体识别的肽(SEQ ID NO: 18,GKPIPNPLLGLDST))、VSV标签(由抗体识别的肽(SEQ ID NO:19, YTDIEMNRLGK)、Xpress标签(SEQ ID NO:20,DLYDDDDK)、Isopep标签(与 pilin-C蛋白共价结合的肽(SEQ ID NO:22,TDKDMTITFTNKKDAE))、Spy 标签(与SpyCatcher蛋白共价结合的肽(SEQ ID NO:23,AHIVMVDAYKPTK))、 BCCP(生物素羧基载体蛋白,一种由BirA生物素化、能够被链霉亲和素识别的蛋白质结构域)、谷胱甘肽-S-转移酶标签(一种与固定化谷胱甘肽结合的蛋白质)、绿色荧光蛋白标签(一种自发荧光并可被纳米抗体结合的蛋白质)、麦芽糖结合蛋白标签(一种与直链淀粉琼脂糖结合的蛋白质)、Nus标签、硫氧还蛋白标签、Fc标签(来源于免疫球蛋白Fc结构域)、Ty标签、包含促进无序的氨基酸(P、E、S、T、A、Q、G、......)的经设计的内在无序标签(Minde,David P;Els F Halff;Sander J Tans(2013-09-01).″Designingdisorder:Tales of the unexpected tails″.Intrinsically Disordered Proteins 1(2):e26790)。
如本文所用,术语“晶体”是指其中平面以特定角度交叉并且其中构成的化学物质存在规则结构(例如内部结构)的结构(例如三维固体聚集体)。术语“晶体”可包括以下任何一种:固体物理晶体形式,例如实验制备的晶体;可衍生自晶体的晶体结构(包括二级和/或三级和/或四级结构元素);基于晶体结构的2D和 /或3D模型,其表示例如其示意图、或其图示、或其计算机的数据集。在一个方面,晶体可用于X射线晶体学技术。这里,所使用的晶体可以承受暴露于X 射线束,并用于产生解析X射线晶体结构所必需的衍射图谱数据。晶体的特征在于能够由X射线衍射出由T.L.Blundell和L.N.Johnson,“ProteinCrystallography”,Academic Press,纽约(1976)所述晶体形式之一所定义的图谱。
术语“晶胞”是指基本立方体或平行六面体形状的块。可以通过这种块的常规组装来构造整个晶体。每个晶胞包括图案单元的完整表示,通过重复图案单元构建晶体。
术语“空间群”是指晶体对称元素的排列。在空间群命名中,大写字母表示晶格类型且其他符号表示可以对非对称单元的内容进行的而不改变其外观的对称操作。
术语“结构坐标”是指一组值,其参照轴系统限定一个或多于一个氨基酸残基的位置。该术语是指限定一个或多于一个分子的三维结构的数据集(例如,笛卡尔坐标、温度因子、和占有率)。结构坐标可以稍加修改但仍然呈现几乎相同的三维结构。独特组的结构坐标的度量是所得结构的均方根偏差。本领域普通技术人员可以将呈现三维结构(特别是酶活性中心的三维结构)且互相的均方根偏差小于的结构坐标视为非常相似。
术语“均方根偏差”是指偏离平均值的平方的算术平均值的平方根。它是一种表达趋势或对象的偏差或变化的方法。出于本发明的目的,“均方根偏差”限定PA亚基的变体或其中的结合位点与由根据图11或图12的PA亚基的结构坐标所限定的PA亚基或其中的结合位点的骨架变化。
如本文所用,术语“构建计算机模型”包括基于原子结构信息和相互作用模型对分子结构和/或功能进行定量和定性分析。术语“建模”包括常规的基于数字的分子动态和能量最小化模型、交互式计算机图形模型、改进的分子力学模型、距离几何、和其他基于结构的约束模型。
术语“拟合程序操作”是指利用化学实体、酶活性中心、结合口袋、分子或分子复合物、或其部分的结构坐标将化学实体与酶活性中心、结合口袋、分子或分子复合物、或其部分相缔合的操作。这可以通过在酶活性中心定位、旋转或平移化学实体以匹配酶活性中心或结合位点的形状和静电互补性来实现。可以优化共价相互作用以及非共价相互作用,如氢键、静电相互作用、疏水相互作用、范德华相互作用,并且可以减少非互补静电相互作用,例如排斥电荷- 电荷相互作用、偶极-偶极相互作用和电荷-偶极相互作用。或者,可以最大程度降低化学实体与酶活性中心或结合位点结合的变形能。
术语“计算对接方法”是指利用化学实体、酶活性中心、结合口袋、分子或分子复合物、或其部分的结构坐标将化学实体与酶活性中心、结合口袋、分子或分子复合物、或其部分相缔合的操作。这可以通过在酶活性中心、结合位点、分子或分子复合物或其部分内以化学上合理的方式定位、旋转或平移化学实体并改变其扭转键以匹配酶活性中心、结合位点、分子、或分子复合物的形状和静电互补性来实现。可以优化共价相互作用以及非共价相互作用,如氢键、静电相互作用、疏水相互作用、范德华相互作用,并且可以减少非互补静电相互作用,例如排斥电荷-电荷相互作用、偶极-偶极相互作用和电荷-偶极相互作用。
如本文所用,术语“测试化合物”是指包含针对其降低或阻止感兴趣的多肽片段结合的能力进行测试的化合物、分子、或复合物的试剂,所述结合例如为来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体的PA亚基与其配体的结合,特别是与细胞Pol II CTD的结合。测试化合物可以是任何试剂,包括但不限于肽、类肽、多肽、蛋白质(包括抗体)、脂质、金属、核苷酸、核苷酸类似物、核苷、核酸、小有机分子或小无机分子、化合物、元素、糖类、同位素、碳水化合物、显像剂、脂蛋白、糖蛋白、酶、分析探针、多胺、及其组合和其衍生物。
术语“小分子”是指分子量为50道尔顿至约2500道尔顿,优选200道尔顿至800道尔顿的分子。此外,根据本发明的测试化合物可任选地包含可检测的标记。此类标记包括但不限于酶标记、放射性同位素或放射性化合物或元素、荧光化合物或金属、化学发光化合物和生物发光化合物。可以使用众所周知的方法将这种可检测标记附着到测试化合物上。本发明的测试化合物还可以包含物质的复杂混合物,例如含有天然产物的提取物、或混合组合合成的产物。这些也可以被测试,并且可以在后续步骤中从混合物中纯化出抑制PA亚基的羧基末端结构域的结合的组分。测试化合物可以衍生自或选自合成或天然化合物的库。例如,合成化合物库可从Enamine有限责任公司(Kiev,Ukraine)、 ChemBridge公司(SanDiego,CA)、或LabNetwork股份有限公司(South Portland, ME,USA)商购获得。天然化合物库例如可从TimTec有限责任公司(Newark,DE, USA)获得。或者,可以使用细菌、真菌、植物和动物细胞和组织提取物形式的天然化合物库。另外,测试化合物可以作为单独的化合物或作为混合物使用组合化学合成产生。使用组合化学制备的化合物的集合在本文中称为组合库。
在本发明的背景下,“降低来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体与其配体结合的化合物”降低了病毒RNA依赖性RNA聚合酶与其细胞配体的结合,特别是与细胞聚合酶Pol II CTD的结合。这种化合物可以特异于病毒RNA依赖性RNA聚合酶或其变体的PA亚基的羧基末端片段,并且不调节其他聚合酶,优选不调节其他聚合酶的活性,特别是哺乳动物聚合酶的活性。通常,与不存在所述化合物时的活性相比,活性降低80%至100%,特别是降低90%至100%。
在本发明的背景下,“阻止来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体与其配体结合的化合物”完全消除了病毒RNA依赖性RNA聚合酶与其细胞配体的结合,特别是与细胞聚合酶Pol II CTD的结合。这种化合物可以特异于病毒RNA依赖性RNA聚合酶或其变体的PA亚基的羧基末端片段,并且不调节其他聚合酶,优选不调节其他聚合酶的活性,特别是哺乳动物聚合酶的活性。
术语“高通量设置”是指高通量筛选测定和各种类型的用于筛选测试化合物库降低或阻止病毒RNA依赖性RNA聚合酶的PA亚基与其配体结合的能力的技术。通常,高通量测定以多孔形式进行,包括无细胞和基于细胞的测定。
关于多肽的术语“纯化”不需要绝对纯度例如同质制剂,而是表示该多肽比天然环境中相对更纯。通常,纯化的多肽基本上不含其他蛋白质、脂质、碳水化合物、或与其天然缔合的其他物质,优选达到功能上显著的水平,例如至少 85%纯度、更优选至少90%或95%纯度、最优选至少99%纯度。表述“纯化至适于结晶的程度”是指多肽的纯度为85%至100%,优选90%至100%,更优选 95%至100%或98%至100%,并且可以在无沉淀的情况下浓缩至高于3mg/ml,优选高于10mg/ml,更优选高于18mg/ml。技术人员可以使用用于蛋白质纯化的标准技术纯化多肽。基本上纯的多肽将在非还原性聚丙烯酰胺凝胶上产生单一主条带。
通常,本文所用的术语“抗体”是指分泌的免疫球蛋白,其缺乏跨膜区并因此可释放到血流和体腔中。基于人类抗体拥有的重链,将它们分组成不同的同种型。人类Ig重链有五种类型,用希腊字母表示为:α、γ、δ、ε、和μ。存在的重链类型限定了抗体类别,即这些链分别存在于IgA、IgD、IgE、IgG和IgM 抗体中,各自发挥不同的作用,并指导针对不同类型抗原的适当免疫应答。不同的重链在大小和组成上有所不同;并且可包含约450个氨基酸(Janeway等人,(2001)Immunobiology,Garland Science)。IgA存在于黏膜区例如肠道、呼吸道和泌尿生殖道,以及存在于唾液、泪液和母乳中,并可防止病原体定殖 (Underdown&Schiff(1986)Annu.Rev.Immunol.4:389-417)。IgD主要作为未暴露于抗原的B细胞上的抗原受体发挥作用,并且参与激活嗜碱性粒细胞和肥大细胞以产生抗微生物因子(Geisberger等人,(2006)Immunology 118:429-437; Chen等人,(2009)Nat.Immunol.10:889-898)。IgE通过其与过敏原的结合参与过敏反应,从而引发肥大细胞和嗜碱性粒细胞释放组胺。IgE还涉及防止寄生虫感染(Pier等人,(2004)Immunology,Infection,andImmunity,ASM出版社)。 IgG提供针对入侵病原体的大部分基于抗体的免疫,并且是唯一能够穿过胎盘赋予胎儿被动免疫的抗体同种型(Pier等人,(2004)Immunology,Infection,and Immunity,ASM出版社)。在人体中有四种不同的IgG亚类(IgG1、IgG2、IgG3、和IgG4),按其在血清中的丰度的顺序命名,其中IgG1最为丰富(约66%),然后是IgG2(约23%)、IgG3(约7%)和IgG(约4%)。不同IgG类别的生物学特征由相应铰链区的结构决定。具有极高亲合力的IgM以单体形式和分泌的五聚体形式在B细胞表面上表达。IgM在B细胞介导的(体液)免疫的早期中,在产生足够的IgG之前,参与消除病原体(Geisberger等人,(2006)Immunology 118:429-437)。抗体不仅作为单体被发现,而且已知还形成两个Ig单元的二聚体(例如IgA)、四个Ig单元的四聚体(例如硬骨鱼的IgM)、或五个Ig单元的五聚体(例如哺乳动物IgM)。抗体通常由四条多肽链组成,所述四条多肽链包含两条相同的重链和两条相同的两条轻链,它们通过二硫键连接并且形成类似于“Y”形的大分子。每条链包含一定数量的免疫球蛋白结构域,其中一些是不变的结构域,而其他的是可变的结构域。免疫球蛋白结构域由2层三明治结构组成,其中7个至9个反向平行的链排列成两个片层。通常,抗体的重链包含四个Ig结构域,其中三个是不变的结构域(CH结构域:CH1、CH2、CH3),一个是可变结构域(VH)。轻链通常包含一个不变的Ig结构域(CL)和一个可变Ig 结构域(VL)。例如,人类IgG重链由以VwCH1-CH2-CH3(也称为 VwCyl-Cy2-Cy3)的顺序从N末端到C末端连接的四个Ig结构域构成,而人类 IgG轻链由以VL-CL的顺序从N末端到C末端连接的两个免疫球蛋白结构域构成,且为κ型或λ型(VK-CK或VA-CA)。例如,人类IgG的恒定链包含447 个氨基酸。在整个说明书和权利要求书中,免疫球蛋白中氨基酸位置的编号是如Kabat,E.A.,Wu,T.T.,Perry,H.M.,Gottesman,K.S.,和Foeller,C.,(1991) Sequences of proteins ofimmunological interest,第五版,美国卫生及公共服务部,美国国立卫生研究院,Bethesda,MD中所描述的“EU索引”中的编号。“如 Kabat中的EU索引”是指人类IgG1EU抗体的残基编号。因此,IgG背景下的 CH结构域如下:“CHI”是指如Kabat中所描述的根据EU索引的118位至220 位氨基酸位置;“CH2”是指如Kabat中所描述的根据EU索引的237位至340 位氨基酸位置;“CH3”是指如Kabat中所描述的根据EU索引的341位至447 位氨基酸位置。抗体的木瓜蛋白酶消化产生两个相同的抗原结合片段,其称为“Fab片段”(也称为“Fab部分”或“Fab区”),每个片段具有单个抗原结合位点,并且产生残留的“Fe片段”(也称为作为“Fe部分”或“Fe区”),其名称反映了其易于结晶的能力。已经确定了人类IgG Fe区的晶体结构(Deisenhofer(1981) Biochemistry 20:2361-2370)。在IgG、IgA和IgD同种型中,Fe区由两个相同的蛋白质片段组成,所述蛋白质片段衍生自抗体的两条重链的CH2和CH3结构域;在IgM和IgE同种型中,Fe区含有每条多肽链中的三个重链恒定结构域(CH2至CH4)。此外,较小的免疫球蛋白分子天然存在或通过人工构建。术语“Fab′片段”是指Fab片段额外包含Ig分子的铰链区,而“F(ab′)2片段”应理解为包含经化学连接或通过二硫键连接的两个Fab′片段。虽然“单结构域抗体 (sdAb)”(Desmyter等人,(1996)Nat.Structure Biol.3:803-811)和“纳米抗体”仅包含单个VH结构域,但“单链Fv(scFv)”片段包含重链可变结构域,其通过短接头肽与轻链可变结构域连接(Huston等人,(1988)Proc.Natl.Acad.Sci.USA 85,5879-5883)。可以通过连接两个scFv(scFvA-scFvB)来设计二价单链可变片段 (di-scFv)。这可以通过产生具有两个VH和两个VL区的单个肽链,从而产生“串联scFv”(VHA-VLA-VHB-VLB)来实现。另一种可能性是产生具有接头的scFv,所述接头足够短而使两个可变区不能折叠在一起,从而迫使scFv二聚化。通常使用长度为5个残基的接头来产生这些二聚体。这种类型被称为“双抗体”。 VH和VL结构域之间较短的接头(一个或两个氨基酸)导致单特异性三聚体的形成,即所谓的“三抗体”或“三元体”。通过分别表达排列为VHA-VLB和 VHB-VLA或VLA-VHB和VLB-VHA的链来形成双特异性双抗体。单链双抗体(scDb)包含VHA-VLB和VHB-VLA片段,这些片段通过12个至20个氨基酸,优选14个氨基酸的接头肽(P)连接形成VHA-VLB-P-VHB-VLA。“双特异性T细胞参与者(BiTE)”是由两种不同抗体的scFv组成的融合蛋白,其中一种 scFv通过CD3受体与T细胞结合,另一种通过肿瘤特异性分子与肿瘤细胞结合(Kufer等人,(2004)Trends Biotechnol.22:238-244)。双亲和重靶向分子 (“DART”分子)是额外通过C末端二硫键来稳定的双抗体。
术语“结合亲和力”通常是指分子(例如抗体)的单个结合位点与其结合配偶体(例如抗原)之间的非共价相互作用总和的强度。除非另有说明,否则如本文所用,“结合亲和力”是指内在结合亲和力,其反映结合对的成员(例如,抗体和抗原)之间的1∶1相互作用。分子X与其配偶体Y的亲和力通常可由解离常数 (Kd)表示。亲和力可以通过本领域已知的常规方法测量,包括但不限于基于表面等离子体共振的测定(例如PCT申请公开第WO2005/012359号中描述的 BIAcore测定);酶联免疫吸附测定(ELISA);和竞争测定(例如RIA)。低亲和力抗体通常缓慢地结合抗原并且易于解离,而高亲和力抗体通常更快地结合抗原并且倾向于保持更长时间的结合。测量结合亲和力的各种方法是本领域已知的,其中任何方法都可用于本发明的目的。用于测量结合亲和力的具体说明性和示例性实施方案描述如下。
通过用感兴趣抗体的Fab形式及其抗原进行的放射性标记抗原结合测定 (RIA)测量根据本发明的“Kd”或“Kd值”,如以下测定所描述。Fab对抗原的溶液结合亲和力通过以下方式测量:在连续滴定的未标记抗原存在下用最小浓度的(125I)标记的抗原平衡Fab,然后用抗Fab抗体包被的板捕获结合的抗原(参见例如,Chen等人,J.Mol.Biol.293:865-881(1999))。为了建立测定条件,将微量滴定板(DYNEX Technologies股份有限公司)在50mM碳酸钠(pH9.6)中用 5μg/ml的捕获抗Fab抗体(Cappel Labs)包被过夜,然后在室温下(约23℃)用在 PBS中的2%(重量/体积)牛血清白蛋白封闭2小时至5小时。在非吸附板(Nunc #269620)中,将100pM或26pM[125I]-抗原与感兴趣的Fab的连续稀释液混合 (例如,与抗VEGF抗体Fab-12的评估一致,Presta等人,Cancer Res. 57:4593-4599(1997))。然后将感兴趣的Fab过夜孵育;然而,孵育可以持续更长的时间(例如,约65小时)以确保达到平衡。此后,将混合物转移到捕获板中,在室温下孵育(例如,1小时)。然后除去溶液,用PBS中的0.1%吐温-20TM表面活性剂洗涤板8次。当板干燥后,加入150μl/孔的闪烁剂(MICROSCINT-20TM; Packard),并将板在TOPCOUNTTM伽马计数器(Packard)上计数10分钟。选择产生小于或等于20%最大结合的每种Fab的浓度,用于竞争性结合测定。
Kd或Kd值也可以通过表面等离子体共振测定法使用仪器(BIAcore股份有限公司,Piscataway,NJ)在25℃下采用固定化抗原CM5芯片以约10个应答单位(RU)进行测量。简而言之,依照供应商的说明书用N-乙基-N′-(3-二甲基氨基丙基)-碳二亚胺盐酸盐(EDC)和N-羟基琥珀酰亚胺(NHS)激活羧甲基化葡聚糖生物传感器芯片(CM5,BIACORE股份有限公司)。用10mM pH4.8的乙酸钠将抗原稀释至5μg/ml(约0.2μM),然后以5μl/分钟的流速注入以获得约10个应答单位(RU)的偶联蛋白质。注入抗原后,注入1M乙醇胺以封闭未反应基团。为了进行动力学测量,将两倍连续稀释的Fab(0.78nM至500nM)在25℃下以约25μl/分钟的流速注入含0.05%吐温 20TM表面活性剂的PBS(PBST)中。使用简单一对一Langmuir结合模型 ( Evaluation Software版本3.2)通过同时拟合缔合和解离传感图来计算缔合速率(kon)和解离速率(koff)。平衡解离常数(Kd)以比率koff/kon计算。参见例如Chen等人,J.Mol.Biol.293:865-881(1999)。如果根据上文表面等离子共振测定法,缔合速率超过106M-1s-1,那么缔合速率可使用荧光淬灭技术来测定,该技术在存在如具有搅拌比色皿的分光光度计(例如配备了截流装置的分光光度计(Aviv Instruments)或8000系列SLM-AMINCOTM分光光度计 (ThermoSpectronic))所测量的浓度渐增的抗原的条件下,在25℃下测量在PBS 中、pH7.2的20nM抗-抗原抗体(Fab形式)的荧光发射强度的升高或降低(激发=295nm;发射=340nm,16nm带通)。
还可以使用系统(BIAcore股份有限公司,Piscataway,NJ)如上所述确定“缔合速率”或“kon”。
通常,抗体与其靶标具有足够的结合亲和力,例如,Kd值为500nM至1pM,即500nM、450nM、400nM、350nM、300nM、250nM、200nM、150nM、100nM、 50nM、1nM、900pM、800pM、700pM、600pM、500pM、400pM、300pM、 200pM、100pM、50pM、1pM。
术语“药学上可接受的盐”是指可通过本发明的方法或本发明的化合物确定的化合物的盐。合适的药学上可接受的盐包括酸加成盐,其可以例如通过将本发明化合物的溶液与药学上可接受的酸的溶液混合而形成,药学上可接受的酸例如为盐酸、硫酸、富马酸、马来酸、琥珀酸、乙酸、苯甲酸、柠檬酸、酒石酸、碳酸或磷酸。此外,当化合物带有酸性部分时,其合适的药学上可接受的盐可包括碱金属盐(例如钠盐或钾盐);碱土金属盐(例如钙盐或镁盐);和用合适的有机配体形成的盐(例如,使用反阴离子例如卤化物阴离子、氢氧根、羧酸根、硫酸根、磷酸根、硝酸根、烷基磺酸根和芳基磺酸根阴离子与铵、季铵和胺阳离子形成的盐)。药学上可接受的盐的说明性实例包括但不限于乙酸盐、己二酸盐、藻酸盐、抗坏血酸盐、天冬氨酸盐、苯磺酸盐、苯甲酸盐、碳酸氢盐、硫酸氢盐、酒石酸氢盐、硼酸盐、溴化物、丁酸盐、乙二胺四乙酸钙、樟脑酸盐、樟脑磺酸盐、右旋樟脑磺酸盐、碳酸盐、氯化物、柠檬酸盐、克拉维酸盐、环戊烷丙酸盐、二葡糖酸盐、二盐酸盐、十二烷基硫酸盐、乙二胺四乙酸盐、乙二磺酸盐、依托酸盐(estolate)、乙磺酸盐(esylate)、乙磺酸盐、甲酸盐、富马酸盐、葡庚糖酸盐(gluceptate)、葡庚糖酸盐、葡糖酸盐、谷氨酸盐、甘油磷酸盐、乙醇酰基对氨苯基胂酸盐、半硫酸盐、庚酸盐、己酸盐、己基间苯二酚盐、海巴明盐、氢溴酸盐、盐酸盐、氢碘酸盐、2-羟基-乙磺酸盐、羟基萘酸盐、碘化物、异硫代硫酸盐、乳酸盐、乳糖醛酸盐、月桂酸盐、月桂基硫酸盐、苹果酸盐、马来酸盐、丙二酸盐、扁桃酸盐、甲磺酸盐、甲磺酸盐、甲基硫酸盐、黏酸盐、2-萘磺酸盐、萘磺酸盐、烟酸盐、硝酸盐、N-甲基葡糖胺铵盐、油酸盐、草酸盐、双羟萘酸盐、棕榈酸盐、泛酸盐、果胶酸盐、过硫酸盐、3-苯基丙酸盐、磷酸盐/二磷酸盐、苦味酸盐、新戊酸盐、聚半乳糖醛酸盐、丙酸盐、水杨酸盐、硬脂酸盐、硫酸盐、次醋酸盐、琥珀酸盐、鞣酸盐、酒石酸盐、茶氯酸盐(teoclate)、甲苯磺酸盐、三乙基碘、十一酸盐、戊酸盐等(参见,例如SM Berge等人,″Pharmaceutical Salts″,J.Pharm.Sci.66:1-19(1977))。
当在本文中使用时,术语“赋形剂”旨在表示药物制剂中为非活性成分的所有物质,例如载体、黏合剂、润滑剂、增稠剂、表面活性剂、防腐剂、乳化剂、缓冲剂、调味剂、或着色剂。
术语“药学上可接受的载体”包括,例如碳酸镁、硬脂酸镁、滑石、糖、乳糖、果胶、糊精、淀粉、明胶、黄蓍胶、甲基纤维素、羧甲基纤维素钠、低熔点蜡、可可脂等。
术语“个体”或“对象”在本文中可互换使用,并且是指可从本发明获益的任何哺乳动物、爬行动物或鸟类。特别地,个体选自实验动物(例如小鼠、大鼠或兔);家畜(包括例如豚鼠、兔、马、驴、牛、绵羊、山羊、猪、鸡、鸭、骆驼、猫、狗、海龟、乌龟、蛇或蜥蜴);或灵长类动物,包括黑猩猩、倭黑猩猩、大猩猩和人类。特别是,“个体”是人类。
术语“疾病”和“病症”在本文中可互换使用,指的是异常状态,尤其是诸如疾病或损伤的异常医学状态,其中组织、器官或个体不再能够有效地发挥其功能。通常但非必要地,疾病与指示这种疾病存在的特定症状或病征相关。因此,这些症状或病征的存在可以指示组织、器官或个体患有疾病。这些症状或病征的改变可以指示这种疾病的进展。疾病进展的特征通常在于这些症状或病征的增加或减少,这可能表明疾病的“恶化”或“改善”。疾病“恶化”的特征为组织、器官或生物体有效发挥其功能的能力降低,而疾病“改善”的特征通常为组织、器官或个体有效履行其功能的能力增强。处于“发展出疾病的风险”的组织、器官或个体处于健康状态,但显示出疾病发生的潜在可能性。通常,发展出疾病的风险与这种疾病的早期或轻微病征或症状相关。在这种情况下,仍可通过治疗来预防疾病的发作。疾病的实例包括但不限于传染病、创伤性疾病、炎性疾病、皮肤病、内分泌疾病、肠疾病、神经障碍、关节疾病、遗传疾病、自身免疫疾病、和各种类型的癌症。
术语“感染”是指致病因子侵入生物体组织、繁殖、以及宿主组织对这些生物体及其产生的毒素的反应。“传染病”也称为传染性疾病,是由这种感染引起的疾病。感染是由感染因子引起的,感染因子包括病毒;类病毒;朊病毒;细菌;线虫,例如寄生蛔虫和蛲虫;节肢动物,例如蜱、螨虫、跳蚤和虱子;真菌,例如癣;以及其他巨型寄生虫,例如绦虫和其他蠕虫。感染可以通过感染的解剖学位置或器官系统进行分类,包括:呼吸道感染、尿路感染、皮肤感染、牙源性感染(源自牙齿或紧邻周围组织的感染)、阴道感染、羊膜腔感染。此外,感染最常见的炎症部位包括肺炎、脑膜炎和输卵管炎。
“呼吸道感染”是指涉及呼吸道的任何传染病。这种类型的感染通常进一步分类为上呼吸道感染(URI或URTI)或下呼吸道感染(LRI或LRTI)。下呼吸道感染例如肺炎往往是比上呼吸道感染例如普通感冒更严重的情况。
“包膜病毒”例如正黏病毒(orthomyxovirus)、副黏病毒(paramyxovirus)、逆转录病毒(retrovirus)、黄病毒(flavivirus)、弹状病毒(rhabdovirus)和α病毒(alphavirus),被源自宿主质膜的脂双层包围。包膜病毒包括但不限于非分段和分段的负义单链RNA病毒。非分段的负义单链RNA病毒包括单股负链病毒目 (Mononegavirales),包括博尔纳病毒科(Bornaviridae)、丝状病毒科(Filoviridae)、副黏病毒科(Paramyxoviridae)和弹状病毒科(Rhabdoviridae)。分段的负义单链RNA病毒包括正黏病毒科,包括甲型流感病毒属、乙型流感病毒属、丙型流感病毒属、索戈托病毒属和鲑传贫病毒属;沙粒病毒科和布尼亚病毒科,包括汉坦病毒属、内罗病毒属、正布尼亚病毒属、白蛉病毒属、和番茄斑萎病毒属。在本发明的背景下,分段的负义单链RNA病毒优选为正黏病毒科,更优选为甲型流感病毒属、乙型流感病毒属、丙型流感病毒属、索戈托病毒属、Quarja 病毒属或鲑传贫病毒属,特别是甲型流感病毒属。
甲型流感亚型包括但不限于禽类和哺乳动物亚型。哺乳动物亚型包括人类、猪、马和蝙蝠亚型。甲型流感亚型包括但不限于所有H1N1至H18N11亚型,例如H1N1、H1N2、H1N3、H1N8、H1N9、H2N2、H2N3、H2N8、H3N1、 H3N2、H3N8、H4N4、H4N6、H4N8、H5N1、H5N2、H5N3、H5N8、H5N9、 H6N1、H6N2、H6N4、H6N5、H6N8、H7N1、H7N2、H7N3、H7N4、H7N7、 H7N8、H7N9、H8N4、H9N2、H9N8、H10N3、H10N7、H10N8、H10N9、H11N2、 H11N6、H11N9、H12N1、H12N3、H12N5、H13N6、H13N8、H14N5、H15N2、 H15N8、H16N3、H17N10、和H18N11。
所示例的这些亚型包含以下病毒株:
实施方案
在第一方面,本发明涉及通过计算机鉴别降低或阻止来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体与其配体结合的化合物的方法,其包括以下步骤:
(a)基于病毒RNA依赖性RNA聚合酶与其配体的一个或多于一个结合位点的结构坐标构建计算机模型;
(b)通过选自以下的方法选择潜在的调节化合物:
(i)修饰一个或多于一个结合位点内的共结晶配体,
(ii)基于共结晶配体与病毒RNA依赖性RNA聚合酶的一个或多于一个结合位点的相互作用特征,和/或基于与共结晶配体的3D相似性,从小分子数据库中过滤并选择化合物,和
(ii)基于共结晶配体与病毒RNA依赖性RNA聚合酶的结合位点的相互作用特征和/或基于与共结晶配体的3D相似性,重新进行所述化合物的配体设计。
(c)采用计算手段在所述化合物的计算机模型和所述一个或多于一个结合位点之间执行拟合程序操作,以便提供所述化合物在活性位点的能量最小化构型;和/或采用计算对接方法将所述化合物定位并置于所述结合位点中,以便提供化学实体,即所述化合物的合理3D排列;和
(d)评估所述拟合操作的结果和任选地评估所述对接方法,以量化所述化合物与一个或多于一个结合位点模型之间的缔合,从而评估所述化合物与所述结合位点缔合的能力。
在实施方案中,病毒RNA依赖性RNA聚合酶是甲型、乙型、丙型、或丁型流感病毒的RNA依赖性RNA聚合酶或其变体。特别地,病毒RNA依赖性 RNA聚合酶是甲型或乙型流感病毒的RNA依赖性RNA聚合酶。
在实施方案中,一个或多于一个结合位点是RNA依赖性RNA聚合酶的 PA亚基与其配体的结合位点。
在特定实施方案中,甲型或乙型流感病毒的RNA依赖性RNA聚合酶的 PA亚基分别具有如SEQ ID NO:1、SEQ ID NO 2、或SEQ ID NO:44所示的氨基酸序列。
特别地,来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体的配体是细胞聚合酶II(Pol II)。特别地,配体是Pol II的羧基末端结构域(CTD)。
特别地,来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体的PA 亚基的所述配体是细胞聚合酶II(Pol II)。特别地,配体是Pol II的羧基末端结构域(CTD)。
通过计算机鉴别降低或阻止来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体与其配体结合的化合物的方法包括步骤(a),即基于病毒RNA依赖性RNA聚合酶与其配体的一个或多于一个结合位点的结构坐标,特别是基于 RNA依赖性RNA聚合酶的PA亚基与其配体的结合位点的结构坐标构建计算机模型。
在实施方案中,来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体的一个或多于一个结合位点包括甲型流感病毒(特别是SEQ ID NO:1或SEQ ID NO:44)或乙型流感病毒(特别是SEQ ID NO:2)的RNA依赖性RNA聚合酶PA亚基的第一和/或第二结合位点的氨基酸,或包括占据与其比对的PA亚基序列中类似位置的氨基酸。
在实施方案中,来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体的结合位点包括一个或多于一个选自甲型流感病毒RNA依赖性RNA聚合酶PA亚基(特别是根据SEQ IDNO:1)的K630、R633、和E444的氨基酸;包括一个或多于一个选自SEQ ID NO:44的K635、R638、和E449的氨基酸;或包括占据与其比对的PA亚基序列中类似位置的氨基酸。
在实施方案中,来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体的结合位点包括甲型流感病毒RNA依赖性RNA聚合酶PA亚基(SEQ ID NO: 1)的氨基酸K630、R633、和E444;包括SEQ ID NO:44的PA亚基的氨基酸 K635、R638、和E449;或包括占据与其比对的PA亚基序列中类似位置的氨基酸。
在特定实施方案中,甲型流感病毒的RNA依赖性RNA聚合酶的结合位点还包括一个或多于一个选自SEQ ID NO:1的K289、R449、和E452的氨基酸,或包括一个或多于一个选自SEQ ID NO:44的K289、R454、和E457的氨基酸。
在特定实施方案中,甲型流感病毒的RNA依赖性RNA聚合酶的结合位点还包括SEQID NO:1的氨基酸K289、R449、和E452。
在特定实施方案中,甲型流感病毒的RNA依赖性RNA聚合酶的结合位点还包括SEQID NO:44的氨基酸K289、R454、和E457。
在特定实施方案中,甲型流感病毒的RNA依赖性RNA聚合酶的结合位点还包括SEQID NO:1的氨基酸F440和/或F607。
在特定实施方案中,甲型流感病毒的RNA依赖性RNA聚合酶的结合位点还包括SEQID NO:44的氨基酸Y445和/或F612。
在特定实施方案中,甲型流感病毒的RNA依赖性RNA聚合酶的结合位点还包括一个或多于一个选自SEQ ID NO:1的M288、L290、S291、T313、F314、 I545、M543、和K554的氨基酸。
在特定实施方案中,甲型流感病毒的RNA依赖性RNA聚合酶的结合位点还包括一个或多于一个选自SEQ ID NO:44的L288、L290、S291、T313、F314、 L550、M548、和R559的氨基酸。
在特定实施方案中,甲型流感病毒的RNA依赖性RNA聚合酶的结合位点还包括SEQID NO:1的氨基酸M288、L290、S291、T313、F314、I545、M543、和K554。
在特定实施方案中,甲型流感病毒的RNA依赖性RNA聚合酶的结合位点还包括SEQID NO:44的氨基酸L288、L290、S291、T313、F314、L550、 M548、和R559。
在特定实施方案中,甲型流感病毒的RNA依赖性RNA聚合酶的结合位点还包括SEQID NO:1的氨基酸G629。
在特定实施方案中,甲型流感病毒的RNA依赖性RNA聚合酶的结合位点还包括SEQID NO:44的氨基酸G634。
在特定实施方案中,甲型流感病毒的RNA依赖性RNA聚合酶的结合位点包括甲型流感病毒RNA依赖性RNA聚合酶PA亚基(特别是根据SEQ ID NO: 1)的氨基酸F440、E444、F607、G629、K630、和R633,包括根据SEQ ID NO: 44的氨基酸Y445、E449、F612、G634、K635、和R683,或包括占据与其比对的PA亚基序列中类似位置的氨基酸。
在特定实施方案中,甲型流感病毒的RNA依赖性RNA聚合酶的结合位点包括甲型流感病毒RNA依赖性RNA聚合酶PA亚基(特别是根据SEQ ID NO: 1)的氨基酸M288、K289、L290、S291、T313、F314、R449、E452、M543、 K554和I545,包括SEQ ID NO:44的氨基酸L288、K289、L290、S291、T313、 F314、R454、E457、M548、K559和L550,或包括占据与其比对的PA亚基序列中类似位置的氨基酸。
在特定实施方案中,甲型流感病毒的RNA依赖性RNA聚合酶的结合位点包括甲型流感病毒RNA依赖性RNA聚合酶PA亚基(特别是根据SEQ ID NO: 1)的氨基酸M288、K289、L290、S291、T313、F314、F440、E444、R449、 E452、M543、K554、I545、F607、G629、K630、和R633,包括SEQ ID NO: 44的氨基酸L288、K289、L290、S291、T313、F314、Y445、E449、R454、 E457、M548、K559、L550、F612、G634、K635、和R638,或包括占据与其比对的PA亚基序列中类似位置的氨基酸。
在特定实施方案中,甲型流感病毒的RNA依赖性RNA聚合酶的结合位点包括SEQ IDNO:1的258位至713位氨基酸,或包括SEQ ID NO:44的201 位至716位氨基酸和任选的氨基酸序列为GMGSGMA(SEQ ID NO:3)的氨基末端接头。
在特定的实施方案中,甲型流感病毒的RNA依赖性RNA聚合酶的所述结合位点具有由图11所示的结构坐标限定的结构。
在实施方案中,来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体的结合位点包括一个或多于一个选自乙型流感病毒RNA依赖性RNA聚合酶 PA亚基(特别是根据SEQ IDNO:2)的E445、K631、和R634的氨基酸;或包括占据与其比对的PA亚基序列中类似位置的氨基酸。
在实施方案中,来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体的结合位点包括乙型流感病毒RNA依赖性RNA聚合酶PA亚基(特别是根据 SEQ ID NO:2)的氨基酸E445、K631、和R634;或包括占据与其比对的PA 亚基序列中类似位置的氨基酸。
在特定实施方案中,乙型流感病毒的RNA依赖性RNA聚合酶的结合位点还包括SEQID NO:2的氨基酸Y441和/或F604。
在特定实施方案中,乙型流感病毒的RNA依赖性RNA聚合酶的结合位点还包括SEQID NO:2的氨基酸G630。
在特定实施方案中,乙型流感病毒的RNA依赖性RNA聚合酶的结合位点包括乙型流感病毒RNA依赖性RNA聚合酶PA亚基(特别是根据SEQ ID NO: 2)的氨基酸Y441、E445、F604、G630、K631、和R634,或包括占据与其比对的PA亚基序列中类似位置的氨基酸。
在特定实施方案中,乙型流感病毒的RNA依赖性RNA聚合酶的结合位点包括SEQ IDNO:2的258位至722位氨基酸,以及任选的氨基酸序列为 GMGSGMA(SEQ ID NO:3)的氨基末端接头。
在特定的实施方案中,乙型流感病毒的RNA依赖性RNA聚合酶的所述结合位点具有由图12所示的结构坐标限定的结构。
在特定实施方案中,甲型流感病毒或乙型流感病毒的RNA依赖性RNA聚合酶的一个或多于一个结合位点是独立的,即不与RNA依赖性RNA聚合酶的其他部分相互作用或结合。
在特定实施方案中,甲型流感病毒或乙型流感病毒的RNA依赖性RNA聚合酶PA亚基的一个或多于一个结合位点还可与PA亚基的其他部分、PB1亚基的全部或部分和/或PB2亚基的全部或部分相互作用或结合。特别地,甲型流感病毒或乙型流感病毒的RNA依赖性RNA聚合酶PA亚基的一个或多于一个结合位点可以与完整的异源三聚体聚合酶结合。特别地,甲型流感病毒或乙型流感病毒的RNA依赖性RNA聚合酶PA亚基的一个或多于一个结合位点是完整异源三聚体聚合酶的整合部分。
获得结构坐标的方式如例如图11和图12所示,如本文所述,理解蛋白质结构时坐标及其效用的解释如技术人员通常所理解并参考标准文本,例如J. Drenth,“Principlesof protein X-ray crystallography”,第二版,Springer Advanced Texts inChemistry,New York(1999);以及G.E.Schulz和R.H.Schirmer,“Principles of ProteinStructure”,Springer Verlag,New York(1985)。例如,通常使用冷冻至100K的经冷冻保护的(例如,用20%至30%甘油)晶体,例如采用同步加速器设施的光束线或旋转阳极作为X射线源以首先获得X射线衍射数据。然后,通过通常已知的方法解决相位问题,这些方法例如为多波长异常衍射(MAD)、多同晶置换(MIR)、单波长异常衍射(SAD)、或分子置换(MR)。可以使用SHELXD(Schneider和Sheldrick,2002,Acta Crystallogr.D.Biol. Crystallogr.(Pt10 Pt 2),1772-1779)解析亚结构,用SHARP(Vonrhein等人,2006, MethodsMol.Biol.364:215-30)计算相位,并且使用溶剂扁平化和非晶体对称平均化,例如使用RESOLVE(Terwilliger,2000,Acta Cryst.D.Biol.Crystallogr. 56:965-972)进行改进。可以例如用ARP/wARP(Perrakis等人,1999,Nat.Struct. Biol.6:458-63)进行模型自动构建,并且例如用REFMAC(Murshudov,1997,Acta Crystallogr.D.Biol.Crystallogr.53:240-255)进行修正。
来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体的晶体可以通过本领域技术人员已知的任何方法生长,包括但不限于悬滴和座滴技术、三明治法、透析、和微量分批或微管分批装置。对于本领域技术人员显而易见的是改变以上公开的结晶条件,以确定可以产生来自正黏病毒科的病毒RNA依赖性 RNA聚合酶或其变体的单独晶体或与化合物复合的晶体的其他结晶条件。这些改变包括但不限于调节pH、蛋白质浓度和/或结晶温度;改变所用盐和/或沉淀剂的特性或浓度;使用不同的结晶方法;或引入添加剂例如洗涤剂(例如,吐温20(单月桂酸酯)、LDOA、Brij 30(4十二烷基醚))、糖(例如葡萄糖、麦芽糖)、有机化合物(例如二烷、二甲基甲酰胺)、镧系元素离子或有助于结晶的多离子化合物。高通量结晶测定也可用于帮助发现或优化结晶条件。
微种晶可用于增加晶体的尺寸和质量。简而言之,将微晶粉碎以产生储备种子溶液。将储备种子溶液连续稀释。使用针头、玻璃棒或头发束,将来自每种稀释溶液的小样品加入到一组平衡的液滴中,所述液滴的蛋白质浓度等于或小于不存在种子的情况下产生晶体所需的浓度。目的是最终得到单一晶种,所述晶种将形成在液滴中生长的晶核。
在特定实施方案中,来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体可使用以下溶液或试剂进行结晶:(i)蛋白质水溶液即结晶溶液,其中蛋白质在缓冲体系例如HEPES或Tris-HCl中的浓度为5mg/ml至20mg/ml,例如 5mg/ml、5.5mg/ml、6mg/ml、6.5mg/ml、7mg/ml、7.5mg/ml、8mg/ml、8.5mg/ml、 9mg/ml、9.5mg/ml、10mg/ml、10.5mg/ml、11mg/ml、11.5mg/ml、12mg/ml、 12.5mg/ml、13mg/ml、13.5mg/ml、14mg/ml、14.5mg/ml、15mg/ml、15.5mg/ml、 16mg/ml、16.5mg/ml、17mg/ml、17.5mg/ml、18mg/ml、18.5mg/ml、19mg/ml、19.5mg/ml、或20mg/ml,优选8mg/ml至15mg/ml,最优选10mg/ml至15mg/ml,其中HEPES或Tris-HCl浓度为10mM至3M,特别为10mM至2M,特别为 20mM至1M,且pH为pH3至pH9,特别为pH4至pH9,特别为pH7至pH9;和(ii)沉淀剂/储层溶液,其包含一种或多于一种物质,例如甲酸钠、硫酸铵、硫酸锂、乙酸镁、乙酸锰、或乙二醇。
任选地,蛋白质溶液可含有一种或多于一种盐,例如浓度为10mM至1M,特别是20mM至500mM,特别是50mM至200mM的一价盐,例如NaCl、KCl、或LiCl,特别是NaCl;和/或浓度为0.1mM至50mM,特别是0.5mM至25mM,特别是1mM至10mM或1mM至5mM的二价盐,例如MnCl2、CaCl2、MgCl2、 ZnCl2、或CoCl2,特别是MgCl2和MnCl2
在实施方案中,沉淀剂/储层溶液包含浓度为0.5M至2M,特别是1M至 1.8M的甲酸钠;缓冲体系,例如HEPES,其浓度为10mM至1M,特别是50mM 至500mM,特别是75mM至150mM,其pH优选为pH4至pH8,特别是pH5 至pH7;和/或浓度为1%至20%,特别是2%至8%,特别是2%至5%的乙二醇。
来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体在结晶溶液中优选为85%纯至100%纯,特别是90%纯至100%纯,特别是95%纯至100%纯。为了产生晶体,可以将适于结晶的蛋白质溶液与等体积的沉淀剂溶液混合。
在一个具体实施方案中,结晶介质包含0.05μl至2μl、特别是0.8至1.2μl 的适于结晶的蛋白质溶液,该蛋白质溶液与相似体积的、特别是等体积的沉淀剂溶液混合,该沉淀剂溶液包含1.0M至2.0M甲酸钠、80mM至120mM的 pH6.5至pH7.5的HEPES、和2%至5%乙二醇。
在另一个实施方案中,沉淀剂溶液包含1.6M甲酸钠、0.1M的pH7.0HEPES、和5%乙二醇,优选地基本上由1.6M甲酸钠、0.1M的pH7.0HEPES、和5%乙二醇组成或由1.6M甲酸钠、0.1M的pH7.0HEPES、和5%乙二醇组成,并且结晶溶液/蛋白质溶液包含在20mM的pH7.5HEPES中的10mg/ml至15mg/ml 的蛋白质、150mM NaCl、2.0mM MnCl2、和2.0mM MgCl2,优选地基本上由在20mM的pH7.5HEPES中的10mg/ml至15mg/ml的蛋白质、150mM NaCl、2.0mM MnCl2、和2.0mM MgCl2组成或由在20mM的pH7.5HEPES中的 10mg/ml至15mg/ml的蛋白质、150mM NaCl、2.0mM MnCl2、和2.0mM MgCl2组成。
在另一个实施方案中,来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体可与化合物共结晶。在特定实施方案中,该化合物是病毒RNA依赖性 RNA聚合酶的天然配体,特别是细胞Pol II CTD。在其他实施方案中,该化合物调节,优选降低或阻止病毒RNA依赖性RNA聚合酶与其配体的结合,特别是与细胞Pol II CTD的结合。在特定实施方案中,来自正黏病毒科的病毒RNA 依赖性RNA聚合酶或其变体可与以下化合物共结晶:(i)蛋白质水溶液,其中 PA亚基片段和/或整个多肽在缓冲体系例如HEPES或Tris-HCl中的浓度为 5mg/ml至20mg/ml,例如5mg/ml、5.5mg/ml、6mg/ml、6.5mg/ml、7mg/ml、 7.5mg/ml、8mg/ml、8.5mg/ml、9mg/ml、9.5mg/ml、10mg/ml、10.5mg/ml、11mg/ml、 11.5mg/ml、12mg/ml、12.5mg/ml、13mg/ml、13.5mg/ml、14mg/ml、14.5mg/ml、 15mg/ml、15.5mg/ml、16mg/ml、16.5mg/ml、17mg/ml、17.5mg/ml、18mg/ml、 18.5mg/ml、19mg/ml、19.5mg/ml、或20mg/ml,特别是8mg/ml至15mg/ml,特别是10mg/ml至15mg/ml,其中HEPES或Tris-HCl的浓度为10mM至3M,特别为10mM至2M,特别为20mM至1M,且pH为pH3至pH9,特别为pH4 至pH9,特别为pH7至pH9;和(ii)沉淀剂/储层溶液,其包含一种或多于一种物质,例如甲酸钠、硫酸铵、硫酸锂、乙酸镁、乙酸锰、乙二醇、或PEG。在特定实施方案中,为了共结晶将所述化合物加入蛋白质水溶液中至终浓度为 0.5mM至5mM,特别是1.5mM至5mM,即0.5mM、1mM、1.5mM、2mM、 2.5mM、3mM、4.5mM或5mM。
任选地,蛋白质溶液可含有一种或多于一种盐,例如浓度为10mM至1M,特别是20mM至500mM,特别是50mM至200mM的一价盐,例如NaCl、KCl、或LiCl,特别是NaCl;和/或浓度为0.1mM至50mM,特别是0.5mM至25mM,特别是1mM至10mM或1mM至5mM的二价盐,例如MnCl2、CaCl2、MgCl2、 ZnCl2、或CoCl2,特别是MgCl2和MnCl2
在特定实施方案中,沉淀剂/储层溶液包含浓度为0.1M至2.5M,特别是 0.1M至2.0M的硫酸铵;缓冲体系,例如Bis-Tris,其浓度为10mM至1M,特别是50mM至500mM,特别是75mM至150mM,其pH优选为pH4至pH7,特别是pH5至pH6;和/或浓度为1%至30%,特别是15%至30%,特别是20%至25%的PEG例如PEG3350。
在特定实施方案中,来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体在蛋白溶液中优选为85%纯至100%纯,更优选为90%纯至100%纯,甚至更优选为95%纯至100%纯。为了共结晶,包含来自正黏病毒科的病毒RNA 依赖性RNA聚合酶或其变体和配体的蛋白质水溶液可以与等体积的沉淀剂溶液混合。
通过计算机鉴别降低或阻止来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体与其配体结合的化合物的方法还包括步骤(b),即选择潜在调节化合物。所述化合物可以特别通过以下方法选择:
(i)修饰结合位点内的共结晶配体,
(ii)基于共结晶配体与病毒RNA依赖性RNA聚合酶的结合位点的相互作用特征,和/或基于与共结晶配体的3D相似性,从小分子数据库中过滤并选择化合物,和
(iii)基于共结晶配体与病毒RNA依赖性RNA聚合酶的结合位点的相互作用特征和/或基于与共结晶配体的3D相似性,重新进行所述化合物的配体设计。
本发明允许使用分子设计技术基于根据图1至图3的(天然)结合位点的结构坐标来鉴别、选择或设计可能降低或消除RNA依赖性RNA聚合酶的PA亚基羧基末端结构域与其配体结合,特别是与细胞Pol II CTD结合的化合物。已经由根据本发明的RNA依赖性聚合酶的PA亚基羧基末端结构域与结合化合物共结晶,特别是与细胞Pol II CTD共结晶而获得所述结构坐标。
鉴于可能与RNA依赖性RNA聚合酶的PA亚基羧基末端片段结合的许多不同化合物的制备和测试涉及较高的成本,这种预测模型是有价值的。
借助计算机可视化程序分析PA亚基与其配体之间的精确结合区域,特别是借助选自SYBYL-X(SYBYL-X 1.3,Tripos,1699South Hanley Rd.,St.Louis, Missouri,63144,USA)和Benchware 3D-Explorer(Benchware-3D-Explorer 2.7, Tripos,1699SouthHanley Rd.,St.Louis,Missouri,63144,USA)的计算机程序。由此鉴别出两个不同的结合区域,如图1至图3所示。
针对PA亚基中的每个结合位点,创建了单独的三维计算机模型。这是通过使用上述可商购获得的软件实现的。
所创建的三维计算机模型作为以下各项的输入:
(i.)精确分析配体与一个或多于一个结合位点之间的相互作用特征 (特别是通过分析氢键、范德华相互作用和/或静电相互作用)
(ii.)修饰共结晶配体以改善结合潜力(特别是通过增加配体与各自结合位点之间的相互作用表面和/或降低配体的自由度)
(iii.)应用计算对接方法以将化合物定位到结合位点并评估所述化合物在一个或多于一个结合位点中的配合,和/或
(iv.)重新设计适合于一个或多于一个结合位点并且能够有利地与所述一个或多于一个结合位点相互作用的化合物。
上述(iii.)中提到的测试化合物可以选自商业供应商提供的小分子分子库。从这些商业产品中可以过滤出具有亚结构要素的化合物,所述化合物可以最好地模拟共结晶配体,特别是模拟在细胞Pol II CTD中存在的磷酸化丝氨酸基团。该过滤可以使用众所周知的化学信息工具完成,特别是使用SYBY-X的软件套装(SYBYL-X 1.3,Tripos,1699 SouthHanley Rd.,St.Louis,Missouri,63144,USA)。
在该筛选中,可以通过形状互补性或通过估计的相互作用能来判断这些化合物与活性位点的配合质量(Meng等人,1992,J.Comp.Chem.13:505-524)。
一旦选择了合适的化合物或片段,可以将它们设计或组装成单一化合物或复合物。该手动模型构建使用软件例如SYBYL-X(SYBYL-X 1.3,Tripos,1699 South HanleyRd.,St.Louis,Missouri,63144,USA)、MOE(Molecular Operating Environment(MOE),2013.08);Chemical Computing Group股份有限公司,1010 Sherbooke St.West,Suite#910,Montreal,QC,Canada,H3A 2R7,2016)或 Maestro( Release 2016-1:Maestro,10.5版,LLC,New York,NY,2016)。辅助技术人员连接各个化合物或片段的有用程序包括,例如, (i)LUDI(Bohm,1992,J.Comp.Aid.Mol.Des.6:61-78)(ii)Muse Invent(2012, Certara,USA,股份有限公司);(ii)CAVEAT(Bartlett等人,1989,inMolecular Recognition in Chemical and Biological Problems,SpecialPublication,Royal Chem.Soc.78:182-196;Lauri和Bartlett,1994,J.Comp.Aid.Mol.Des.8:51-66; CAVEAT,可从the University of California,Berkley,CA获得,(ii)3D数据库系统,例如ISIS(MDL Information Systems,San Leandro,CA;在Martin,1992,J.Med. Chem.35:2145-2154中综述),以及(iii)HOOK(Eisen等人,1994,Proteins:Struct.,Funct.,Genet.19:199-221;HOOK,可从Molecular SimulationsIncorporated,San Diego,CA获得)。
本发明允许的另一种方法是化合物的小分子数据库的计算筛选/对接,所述化合物可以全部或部分结合RNA依赖性RNA聚合酶的PA亚基羧基末端片段的结合位点。对于计算对接过程,存在几种可用的程序,例如,FlexX(Rarey 等人,J Mol Biol.1996年8月23日;261(3):470-89)、Glide(Friesner等人,J.Med. Chem.,2004,47,1739-1749)、SurflexDock(Jain等人,J.Computer-Aided Molecular Design.2007,21,281-306.)。
或者,可以基于根据图1至图3的PA多肽片段的三维结构重新设计RNA 依赖性RNA聚合酶的PA亚基羧基末端片段与其配体的结合,特别是与Pol II CTD结合的潜在抑制剂。本领域技术人员可以使用各种重新设计配体的方法。这些方法包括(i)LUDI(Bohm,1992,J.Comp.Aid.Mol.Des.6:61-78);(ii)Muse Invent(2012,Certara,USA,股份有限公司);(iii)LEGEND(Nishibata和Itai,Tetrahedron 47:8985-8990;LEGEND可获自MolecularSimulations Incorporated, San Diego,CA);(iii)LeapFrog(可获自TriposAssociates,St.Louis,MO);(iV) SPROUT(Gillet等人,1993,J.Comp.Aid.Mol.Des.7:127-153;SPROUT可从the University of Leeds,UK获得);(v)GROUPBUILD(Rotstein和Murcko,1993,J. Med.Chem.36:1700-1710);以及(vi)GROW(Moon和Howe,1991,Proteins 11:314-328)。
另外,已经描述了几种分子建模技术(通过引用并入本文),其可以支持本领域技术人员对结合位点的潜在抑制剂的重新设计和建模,并且其包括例如 Cohen等人,1990,J.Med.Chem.33:883-894;Navia和Murcko,1992,Curr.Opin. Struct.Biol.2:202-210;Balbes等人,1994,Reviews in Computational Chemistry,第5卷,Lipkowitz和Boyd编,VCH,New York,第37页至第380页;Guida,1994, Curr.Opin.Struct.Biol.4:777-781。
可以进一步在计算上优化被设计或选择作为与RNA依赖性RNA聚合酶的结合位点结合的分子,使得在其结合状态下优选缺乏与靶区域的排斥静电相互作用。这种非互补(例如静电)相互作用包括排斥电荷-电荷相互作用、偶极-偶极相互作用和电荷-偶极相互作用。具体地,在结合状态下,结合化合物与结合口袋之间的所有静电相互作用的总和优选地对结合焓产生中性或有利的贡献。可以评估化合物变形能和静电相互作用的特定计算机程序在本领域中是可获得的。合适的程序的实例包括(i)Gaussian 09,Revision E.01,(Frisch,M.J.等人, (2016),AMBER 2016,University of California,San Francisco.);(iii) QUANTA/CHARMM(Molecular Simulations Incorporated,San Diego,CA),(iV)OPLS-AA(Jorgensen,1998,Encyclopedia of Computational Chemistry,Schleyer 编,Wiley,New York,第3卷,第1986页至第1989页),以及(v)Insight II/Discover(BiosysmTechnologies Incorporated,San Diego,CA)。这些程序可以在现有技术的计算机上执行,这些计算机包括支持3D可视化的硬件(例如 NVIDIA Quadro图形板、Silicon Graphics工作站、IRIS 4D/35或IBM RISC/6000 工作站型号550)。其他硬件系统和软件包是本领域技术人员已知的。
一旦如上所述地选择或设计了感兴趣分子,可以随后对它的一些原子或侧基进行置换,以改善或改变其结合性质。通常,初始置换是保守的,即替代基团将与原始基团的大小、形状、疏水性和电荷近似相同。当然,应该理解,应该避免本领域已知的改变构象的组分。然后可以通过以上详细描述的相同计算机方法来分析这些经置换的化学化合物与RNA依赖性RNA聚合酶的PA亚基羧基末端片段的结合位点的配合效率。
通过计算机鉴别降低或阻止来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体与其配体结合的化合物的方法还包括步骤(c),即采用计算手段在所述化合物和所述活性位点的计算机模型之间执行拟合程序操作,以在活性位点提供所述化合物的能量最小化构型。
通过计算机鉴别降低或阻止来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体与其配体结合的化合物的方法还包括步骤(e),即评估所述拟合操作和任选的所述对接方法的结果,以量化所述化合物与结合位点模型之间的缔合,从而评估所述化合物与所述结合位点缔合的能力。该评估可以(i)基于此类对接程序的输出来实现,所述对接程序提供反映测试化合物与结合位点的相互作用程度如何的得分,和/或(ii)通过本领域技术人员的目测判断测试化合物填充结合位点的程度如何以及采用的几何结构如何有利来实现。
在第二方面,本发明涉及产生降低或阻止来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体与其配体(特别是与细胞Pol II,特别是与CTD)结合的化合物的方法,其包括以下步骤
(a)通过如上公开的第一方面的方法鉴别所述化合物,和
(b)合成所述化合物,和
(c)任选地将所述化合物或其药学上可接受的盐与一种或多于一种药学上可接受的赋形剂和/或载体调配。
在特定实施方案中,在体外或体内测试所述化合物或其药学上可接受的盐或其制剂降低或阻止来自正黏病毒科的病毒RNA依赖性RNA聚合酶的PA亚基的羧基末端片段与其配体结合,特别是与细胞Pol II CTD结合的能力。因此,在实施方案中,第二方面的方法还包括以下步骤
(c)使所述化合物与来自正黏病毒科的病毒RNA依赖性RNA聚合酶接触,和
(d)确定所述化合物降低或阻止病毒RNA依赖性RNA聚合酶与其配体结合,优选与细胞Pol II CTD结合的能力。
可以通过形状互补性或通过估计的相互作用能来判断这些化合物与结合位点的配合质量(Meng等人,1992,J.Comp.Chem.13:505-524)。合成所述化合物的方法是本领域技术人员熟知的。
在具体的实施方案中,降低或阻止病毒RNA依赖性RNA聚合酶与其配体结合,特别是与CTD结合的化合物降低或完全消除所述结合。特别地,与不存在所述化合物时病毒RNA依赖性RNA聚合酶与其配体的结合相比,特别是在相同的反应条件下,即相同的缓冲条件、反应时间和温度下,所述化合物使 RNA依赖性RNA聚合酶与其配体的结合降低50%、特别是降低60%、特别是降低70%、特别是降低80%、特别是降低90%、特别是降低100%。特别优选地,所述化合物特异性地降低或阻止RNA依赖性RNA聚合酶与其配体的结合,特别是与CTD的结合,但不以相同程度降低或抑制其他聚合酶的结合,特别是哺乳动物聚合酶的结合,优选完全未降低或抑制。
可以容易地评估化合物降低或阻止来自正黏病毒科的病毒RNA依赖性 RNA聚合酶与其配体结合,特别是与细胞Pol II CTD结合的能力。例如,在第一步中,在存在或不存在不同量测试化合物的情况下使纯化的来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体与其配体接触,特别是与细胞Pol II CTD接触并孵育一段时间,例如5分钟、10分钟、15分钟、20分钟、30 分钟、40分钟、60分钟、或90分钟。在无测试化合物的情况下,选择反应条件使得纯化的来自正黏病毒科的病毒RNA依赖性RNA聚合酶与其配体结合,特别是与细胞PolII CTD结合。然后在第二步中,就测试化合物是否降低或阻止来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体与其配体的结合,特别是与细胞Pol II CTD的结合,对混合物进行分析。结合的分析可以通过本领域已知的任何方法进行,特别是通过以下更详细描述的一种或多于一种方法进行。
在特定实施方案中,可以用拉下测定的形式来分析来自正黏病毒科的病毒 RNA依赖性RNA聚合酶或其变体与测试化合物之间的相互作用。例如,可以纯化来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体,并且可以将其固定在固体表面上,例如珠子上。在一个实施方案中,固定在珠子上的来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体可以与例如(i)另一种纯化的蛋白质、多肽片段、或肽;(ii)蛋白质、多肽片段、或肽的混合物;或(iii)细胞或组织提取物接触,并且可以通过聚丙烯酰胺凝胶电泳结合考马斯染色或蛋白质免疫印迹来验证蛋白质、多肽片段或肽的结合。可通过质谱分析来鉴别未知的结合配偶体。
在另一个实施方案中,可以以基于酶联免疫吸附测定(ELISA)的实验形式分析来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体与测试化合物之间的相互作用。在一个实施方案中,来自正黏病毒科的病毒RNA依赖性RNA 聚合酶或其变体可以固定在固体表面例如ELISA板上并与测试化合物接触。可以通过对测试化合物或表位标签具有特异性的抗体来验证测试化合物与例如蛋白质、多肽、肽、和表位标记的化合物的结合。这些抗体可以直接与酶偶联或用与所述酶偶联的第二抗体检测,所述酶与适当的底物组合进行化学发光反应(例如辣根过氧化物酶)或显色反应(例如碱性磷酸酶)。在另一个实施方案中,对于不能由抗体检测的化合物的结合,可以通过直接与测试化合物偶联的标记进行验证。此类标记可以包括酶标记、放射性同位素或放射性化合物或元素、荧光化合物或金属、化学发光化合物和生物发光化合物。在另一个实施方案中,可以将测试化合物固定在ELISA板上并与根据本发明的PA多肽片段或其变体接触。所述多肽的结合可以通过如上所述的对PA亚基的羧基末端片段具有特异性的抗体和化学发光或显色反应来验证。
在另一个实施方案中,纯化的来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体可以与肽阵列一起孵育,并且可以分析PA亚基的羧基末端片段与对应于特定肽序列的特定肽位点的结合,例如,通过来自正黏病毒科的病毒 RNA依赖性RNA聚合酶或其变体的特异性抗体、通过针对与来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体融合的表位标签的抗体、或者通过与正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体相偶联的荧光标签所发出的荧光信号来进行分析。
在另一个实施方案中,使表达来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体的重组宿主细胞与测试化合物接触。这可以通过共表达测试蛋白质或多肽,并且例如通过荧光共振能量转移(FRET)或免疫共沉淀进行相互作用的验证来实现。在另一个实施方案中,可以将直接标记的测试化合物添加到重组宿主细胞的培养基中。可以例如通过所述多肽的免疫沉淀和验证标记的存在来验证测试化合物穿透膜并与来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体结合的潜力。
在具体的实施方案中,在高通量设置下进行用于鉴别与来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体结合的化合物的上述方法。在一个具体实施方案中,根据本发明和标记的测试化合物在如上所述的多孔微量滴定板中使用来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体进行所述方法。
在特定的实施方案中,测试化合物来源于合成或天然化合物的库。例如,合成化合物库可从Maybridge Chemical Co.(Trevillet,Cornwall,UK)、 ChemBridge Corporation(San Diego,CA)或Aldrich(Milwaukee,WI)商购获得。天然化合物库例如可从TimTec有限责任公司(Newark,DE)获得。或者,可以使用细菌、真菌、植物和动物提取物形式的天然化合物库。另外,测试化合物可以使用组合化学作为单独的化合物或作为混合物合成产生。
在另一个实施方案中,可以在体内环境中测试所鉴别的化合物对来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体与其配体的结合,特别是与细胞Pol II CTD的结合的抑制作用。可以在存在或不存在所鉴别的化合物的情况下,用流感病毒感染易受流感病毒感染的细胞系,例如293T人胚肾细胞、 Madin-Darby犬肾细胞、或鸡胚成纤维细胞。在优选的实施方案中,可以将所鉴别的化合物以各种浓度添加到细胞的培养基中。可以使用病毒噬斑形成作为流感病毒感染能力的读取结果,并且可以对已经用所鉴别的化合物处理过的细胞和未经处理的细胞之间的病毒噬斑形成进行比较。
在本发明的另一个实施方案中,在任何上述方法中应用的测试化合物是小分子。在具体实施方案中,所述小分子来源于库,例如小分子抑制剂库。
在进一步的实施方案中,所述测试化合物是肽或蛋白质。在具体实施方案中,所述肽或蛋白质来源于肽库或蛋白质库。
在第三方面,本发明涉及可通过本发明第一方面的计算机筛选方法鉴别的化合物,和/或可通过本发明第二方面的制备方法进行制备的化合物,其中所述化合物能够降低或阻止来自正黏病毒科的病毒RNA依赖性RNA聚合酶与其配体的结合,特别是细胞Pol IICTD的结合。
可以容易地评估化合物降低或阻止来自正黏病毒科的病毒RNA依赖性RNA聚合酶与其配体结合,特别是与细胞Pol II CTD结合的能力。例如,在第一步中,在存在或不存在不同量测试化合物的情况下,使经纯化的来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体与其配体接触,特别是与细胞 Pol II CTD接触并孵育一段时间,例如5分钟、10分钟、15分钟、20分钟、 30分钟、40分钟、60分钟、或90分钟。在无测试化合物的情况下,选择反应条件使得经纯化的来自正黏病毒科的病毒RNA依赖性RNA聚合酶与其配体结合,特别是与细胞Pol II CTD结合。然后在第二步中,就测试化合物是否降低或阻止来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体与其配体的结合,特别是与细胞Pol II CTD的结合,对混合物进行分析。结合的分析可以通过本领域已知的任何方法进行,特别是通过以上更详细描述的一种或多于一种方法进行。
在具体的实施方案中,所述化合物可与来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体的结合位点结合,从而降低或阻止来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体与其配体的结合,特别是与细胞Pol II CTD的结合。
在其他实施方案中,所述化合物可以与来自正黏病毒科的病毒RNA依赖性RNA聚合酶的不同部分相互作用,并通过在空间上阻断来自正黏病毒科的病毒RNA依赖性RNA聚合酶与其配体的结合,特别是与细胞Pol II CTD的结合来降低或阻止来自正黏病毒科的病毒RNA依赖性RNA聚合酶与其配体的结合,优选与细胞Pol II CTD的结合。
在具体的实施方案中,所述测试化合物或来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体的配体可包含可检测的标记,所述标记在与来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体结合时提供信号,但如果没有结合则不提供信号。例如,测试化合物可以用荧光标记物标记,所述荧光标记在与来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体结合时提供信号,但在被移除时不提供信号。在进一步的实施方案中,可以用荧光标记物标记测试化合物,并且可以在孵育步骤和分析步骤之间插入洗涤步骤以除去未结合测试化合物的荧光标记物。在具体的实施方案中,来自正黏病毒科的病毒 RNA依赖性RNA聚合酶或其变体可以固定在固体表面上。特别地,可以通过以下关于本发明第八方面所描述的任何方法来分析测试化合物与PA亚基羧基末端片段的结合。
本发明的化合物可以是任何试剂,包括但不限于肽、类肽、多肽、蛋白质 (包括抗体)、脂质、金属、核苷酸、核苷、核酸、小有机分子或小无机分子、化合物、单质、糖类、同位素、碳水化合物、显像剂、脂蛋白、糖蛋白、酶、分析探针、多胺、及其组合和其衍生物。术语“小分子”是指分子量为50道尔顿至约2500道尔顿,优选200至800道尔顿的分子。此外,根据本发明的测试化合物可任选地包含可检测的标记。此类标记包括但不限于酶标记、放射性同位素或放射性化合物或单质、荧光化合物或金属、化学发光化合物和生物发光化合物。
在第四方面,本发明涉及针对来自属于正黏病毒科的病毒的RNA依赖性 RNA聚合酶或其变体与其配体(特别是与细胞Pol II,特别是与Pol II的CTD) 的一个或多于一个结合位点的抗体。
在实施方案中,病毒RNA依赖性RNA聚合酶是甲型、乙型、丙型、或丁型流感病毒的RNA依赖性RNA聚合酶或其变体。特别地,病毒RNA依赖性RNA聚合酶是甲型或乙型流感病毒的RNA依赖性RNA聚合酶。
在实施方案中,一个或多于一个结合位点是RNA依赖性RNA聚合酶的 PA亚基与其配体的结合位点。
在特定实施方案中,甲型或乙型流感病毒的RNA依赖性RNA聚合酶的 PA亚基分别具有SEQ ID NO:1、SEQ ID NO 2、或SEQ ID NO:44所示的氨基酸序列。
特别地,来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体的所述配体是细胞聚合酶II(Pol II)。特别地,配体是Pol II的羧基末端结构域(CTD)。
特别地,来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体的PA 亚基的所述配体是细胞聚合酶II(Pol II)。特别地,配体是Pol II的羧基末端结构域(CTD)。
在实施方案中,来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体的一个或多于一个结合位点包括甲型流感病毒(特别是SEQ ID NO:1或SEQ ID NO:44)或乙型流感病毒(特别是SEQ ID NO:2)的RNA依赖性RNA聚合酶PA亚基的第一和/或第二结合位点的氨基酸,或包括占据与其比对的PA亚基序列中类似位置的氨基酸。
在实施方案中,来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体的结合位点包括一个或多于一个选自甲型流感病毒的RNA依赖性RNA聚合酶 PA亚基(特别是根据SEQID NO:1)的K630、R633、和E444的氨基酸;包括一个或多于一个选自SEQ ID NO:44的K635、R638、和E449的氨基酸;或包括占据与其比对的PA亚基序列中类似位置的氨基酸。
在实施方案中,来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体的结合位点包括甲型流感病毒的RNA依赖性RNA聚合酶PA亚基(SEQ ID NO: 1)的氨基酸K630、R633和E444;包括SEQ ID NO:44的氨基酸K635、R638、和E449;或包括占据与其比对的PA亚基序列中类似位置的氨基酸。
在特定实施方案中,甲型流感病毒的RNA依赖性RNA聚合酶的结合位点还包括一个或多于一个选自SEQ ID NO:1的K289、R449、和E452的氨基酸,或还包括一个或多于一个选自SEQ ID NO:44的K289、R454、和E457的氨基酸。
在特定实施方案中,甲型流感病毒的RNA依赖性RNA聚合酶的结合位点还包括SEQID NO:1的氨基酸K289、R449、和E452。
在特定实施方案中,甲型流感病毒的RNA依赖性RNA聚合酶的结合位点还包括SEQID NO:44的氨基酸K289、R454、和E457。在特定实施方案中,甲型流感病毒的RNA依赖性RNA聚合酶的结合位点还包括SEQ ID NO:1的氨基酸F440和/或F607。
在特定实施方案中,甲型流感病毒的RNA依赖性RNA聚合酶的结合位点还包括SEQID NO:1的氨基酸Y445和/或F612。
在特定实施方案中,甲型流感病毒的RNA依赖性RNA聚合酶的结合位点还包括一个或多于一个选自SEQ ID NO:1的M288、L290、S291、T313、F314、 I545、M543、和K554的氨基酸。
在特定实施方案中,甲型流感病毒的RNA依赖性RNA聚合酶的结合位点还包括一个或多于一个选自SEQ ID NO:44的L288、L290、S291、T313、F314、L550、M548、和R559的氨基酸。
在特定实施方案中,甲型流感病毒的RNA依赖性RNA聚合酶的结合位点还包括SEQID NO:1的氨基酸M288、L290、S291、T313、F314、I545、M543、和K554。
在特定实施方案中,甲型流感病毒的RNA依赖性RNA聚合酶的结合位点还包括SEQID NO:44的氨基酸L288、L290、S291、T313、F314、L550、 M548、和R559。
在特定实施方案中,甲型流感病毒的RNA依赖性RNA聚合酶的结合位点还包括SEQID NO:1的氨基酸G629。
在特定实施方案中,甲型流感病毒的RNA依赖性RNA聚合酶的结合位点还包括SEQID NO:44的氨基酸G634。
在特定实施方案中,甲型流感病毒的RNA依赖性RNA聚合酶的结合位点包括甲型流感病毒的RNA依赖性RNA聚合酶PA亚基(特别是根据SEQ ID NO: 1)的氨基酸F440、E444、F607、G629、K630、和R633,包括根据SEQ ID NO: 44的氨基酸Y445、E449、F612、G634、K635、和R683,或包括占据与其比对的PA亚基序列中类似位置的氨基酸。
在特定实施方案中,甲型流感病毒的RNA依赖性RNA聚合酶的结合位点包括甲型流感病毒的RNA依赖性RNA聚合酶PA亚基(特别是根据SEQ ID NO: 1)的氨基酸M288、K289、L290、S291、T313、F314、R449、E452、M543、 K554和I545,包括SEQ ID NO:44的氨基酸L288、K289、L290、S291、T313、 F314、R454、E457、M548、K559和L550,或包括占据与其比对的PA亚基序列中类似位置的氨基酸。
在特定实施方案中,甲型流感病毒的RNA依赖性RNA聚合酶的结合位点包括甲型流感病毒的RNA依赖性RNA聚合酶PA亚基(特别是根据SEQ ID NO: 1)的氨基酸M288、K289、L290、S291、T313、F314、F440、E444、R449、 E452、M543、K554、I545、F607、G629、K630、和R633,包括SEQ ID NO: 44的氨基酸L288、K289、L290、S291、T313、F314、Y445、E449、R454、E457、M548、K559、L550、F612、G634、K635、和R638,或包括占据与其比对的PA亚基序列中类似位置的氨基酸。
在特定实施方案中,甲型流感病毒的RNA依赖性RNA聚合酶的结合位点包括SEQ IDNO:1的258位至713位氨基酸,或包括SEQ ID NO:44的201 位至716位氨基酸和任选的氨基酸序列为GMGSGMA(SEQ ID NO:3)的氨基末端接头。
在特定的实施方案中,甲型流感病毒的RNA依赖性RNA聚合酶的所述结合位点具有由图11所示的结构坐标限定的结构。在实施方案中,来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体的结合位点包括一个或多于一个选自乙型流感病毒的RNA依赖性RNA聚合酶PA亚基(特别是根据SEQ ID NO: 2)的E445、K631、和R634的氨基酸;或包括占据与其比对的PA亚基序列中类似位置的氨基酸。
在实施方案中,来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体的结合位点包括乙型流感病毒的RNA依赖性RNA聚合酶PA亚基(特别是根据 SEQ ID NO:2)的氨基酸E445、K631、和R634;或包括占据与其比对的PA 亚基序列中类似位置的氨基酸。
在特定实施方案中,乙型流感病毒的RNA依赖性RNA聚合酶的结合位点还包括SEQID NO:2的氨基酸Y441和/或F604。
在特定实施方案中,乙型流感病毒的RNA依赖性RNA聚合酶的结合位点还包括SEQID NO:2的氨基酸G630。
在特定实施方案中,乙型流感病毒的RNA依赖性RNA聚合酶的结合位点包括乙型流感病毒的RNA依赖性RNA聚合酶PA亚基(特别是根据SEQ ID NO: 2)的氨基酸Y441、E445、F604、G630、K631、R634,或包括占据与其比对的 PA亚基序列中类似位置的氨基酸。
在特定实施方案中,乙型流感病毒的RNA依赖性RNA聚合酶的结合位点包括SEQ IDNO:2的258位至722位氨基酸和任选的氨基酸序列为 GMGSGMA(SEQ ID NO:3)的氨基末端接头。
在特定的实施方案中,乙型流感病毒的RNA依赖性RNA聚合酶的所述结合位点具有由图12所示的结构坐标限定的结构。
在特定实施方案中,甲型流感病毒或乙型流感病毒的RNA依赖性RNA聚合酶的一个或多于一个结合位点是独立的,即不与RNA依赖性RNA聚合酶的其他部分相互作用或结合。
在特定实施方案中,甲型流感病毒或乙型流感病毒的RNA依赖性RNA聚合酶的PA亚基的一个或多于一个结合位点还可与PA亚基的其他部分、PB1 亚基的全部或部分和/或PB2亚基的全部或部分相互作用或结合。特别地,甲型流感病毒或乙型流感病毒的RNA依赖性RNA聚合酶的PA亚基的一个或多于一个结合位点可以与完整的异源三聚体聚合酶结合。特别地,甲型流感病毒或乙型流感病毒的RNA依赖性RNA聚合酶的PA亚基的一个或多于一个结合位点是完整异源三聚体聚合酶的整合部分。
本发明的抗体可以是单克隆抗体或多克隆抗体或其部分。可以通过重组 DNA技术或通过酶促或化学切割完整的抗体来产生抗原结合部分。在一些实施方案中,抗原结合部分包括Fab、Fab′、F(ab′)2、Fd、Fv、dAb、和互补决定区(CDR)片段、单链抗体(scFv)、嵌合抗体如人源化抗体、双抗体、含有足以使多肽与特异性抗原结合的抗体的至少一部分的多肽。根据标准方案产生本发明的抗体。例如,根据本领域技术人员熟知的标准方法,可以通过使用任选地与佐剂例如弗氏完全或不完全佐剂、RIBI(胞壁酰二肽)、或ISCOM(免疫刺激复合物)组合的感兴趣抗原来免疫动物例如小鼠、大鼠、兔、山羊、绵羊、猪、牛或马从而产生多克隆抗体。通过放血或处死被免疫的动物从动物获得针对本发明第一方面的多肽的多克隆抗血清。(i)可以从动物获得血清并直接使用,(ii) 可以从血清中获得免疫球蛋白部分,或者(iii)可以从血清中纯化对本发明第一方面的多肽具有特异性的抗体。可以通过本领域技术人员熟知的方法产生单克隆抗体。简而言之,在免疫后处死动物并通过本领域已知的任何方法使淋巴结和/或脾脏B细胞永生化。使细胞永生化的方法包括但不限于用癌基因转染细胞、用致癌病毒感染细胞并在筛选永生化细胞的条件下培养细胞、使细胞经受致癌或突变化合物、将细胞与永生化细胞例如骨髓瘤细胞融合、以及使肿瘤抑制基因失活。使用本发明第一方面的多肽筛选永生化细胞。筛选、克隆产生针对本发明第一方面的多肽的抗体的细胞如杂交瘤,并进一步筛选具有期望特征的细胞,该期望特征包括稳定生长、高抗体产量、和期望的抗体特征。杂交瘤可以(i)在同基因动物体内扩增,(ii)在缺乏免疫系统的动物如裸鼠中扩增,或(iii) 在体外细胞培养物中扩增。筛选、克隆和扩增杂交瘤的方法是本领域普通技术人员所熟知的。为了支持抗体的产生,技术人员可以参考标准文本,例如“Antibodies:A Laboratory Manual”,Harlow和Lane编,Cold Spring Harbor Laboratory出版社,Cold Spring Harbor,New York(1990),其通过引用并入本文。
在第五方面,本发明涉及编码本发明第四方面的抗体的核酸。用于获得这种分离的核苷酸片段的分子生物学方法通常是本领域技术人员已知的(对于标准分子生物学方法,参见Sambrook等人编,“Molecular Cloning:A Laboratory Manual”,Cold SpringHarbor Laboratory出版社,Cold Spring Harbor,New York (1989),其通过引用并入本文)。例如,可以从经流感病毒感染的细胞中分离 RNA,并使用随机引物(例如,十聚体的随机六聚体)或对感兴趣片段的具有特异性的引物应用逆转录聚合酶链反应(RT-PCR)产生cDNA。然后可以使用片段特异性引物通过标准PCR扩增感兴趣的片段。
在第六方面,本发明涉及包含本发明第五方面的核酸的载体。本领域技术人员充分了解将感兴趣的多核苷酸序列并入载体中的技术(同样参见Sambrook 等人,1989,同上)。这些载体包括本领域技术人员已知的任何载体,包括质粒载体;黏粒载体;噬菌体载体,例如λ噬菌体;病毒载体,例如腺病毒或杆状病毒载体;或人工染色体载体,例如细菌人工染色体(BAC)、酵母人工染色体(YAC)、或P1人工染色体(PAC)。所述载体可以是适合于原核或真核表达的表达载体。所述质粒可包含复制起点(ori)、多克隆位点和调节序列如启动子(组成型或诱导型)、转录起始位点、核糖体结合位点、转录终止位点、多聚腺苷酸化信号、和选择标记如抗生素抗性或基于互补性突变或缺失的营养缺陷型标记。在一个实施方案中,感兴趣的多核苷酸序列与调节序列可操作地连接。
在另一个实施方案中,所述载体包括编码有助于纯化感兴趣多肽片段的表位标签、肽标签、或蛋白质标签的核苷酸序列。此类表位标签、肽标签、或蛋白质标签包括但不限于血凝素(HA)标签、FLAG标签、myc标签、多聚His标签、谷胱甘肽-S-转移酶(GST)标签、麦芽糖结合蛋白(MBP)标签、NusA标签和硫氧还蛋白标签、或荧光蛋白标签例如(增强型)绿色荧光蛋白((E)GFP)、(增强型)黄色荧光蛋白((E)YFP)、来自香菇珊瑚的红色荧光蛋白(RFP)(DsRed)或单体红色荧光蛋白(mRFP)、青色荧光蛋白(CFP)等。在一个优选的实施方案中,例如,使用蛋白酶如凝血酶、因子Xa、PreScission、TEV蛋白酶等可以从感兴趣的多肽片段上切下表位标签、肽标签、或蛋白质标签。优选地,可以用TEV 蛋白酶切割标签。这些蛋白酶的识别位点是本领域技术人员熟知的。例如,TEV 蛋白酶识别位点的七个氨基酸共有序列是Glu-X-X-Tyr-X-Gln-Gly/Ser,其中X 可以是任何氨基酸,并且在本发明的背景下优选为Glu-Asn-Leu-Tyr-Phe-Gln-Gly(SEQ ID NO:21)。在另一个实施方案中,载体包括使感兴趣的多肽片段分泌到重组宿主细胞的培养基中或分泌到细菌的周质空间中的功能序列。信号序列片段通常编码由疏水性氨基酸构成的信号肽,所述信号肽指导蛋白质从细胞中分泌。蛋白质分泌到生长培养基(革兰氏阳性细菌)或分泌到位于细胞的内膜和外膜之间的周质空间(革兰氏阴性细菌)。优选地,存在加工位点,其可以在体内或体外被切割,并编码于信号肽片段和外源基因之间。
在第七方面,本发明提供了包含所述分离的多核苷酸或所述重组载体的重组宿主细胞。重组宿主细胞可以是原核细胞例如古细菌和细菌细胞,或者可以是真核细胞例如酵母、植物、昆虫、或哺乳动物细胞。本领域技术人员充分了解将所述分离的多核苷酸或所述重组载体导入所述宿主细胞中的方法。例如,可以使用例如化学转化例如氯化钙法或电穿孔容易地转化细菌细胞。可以例如使用乙酸锂转化方法或电穿孔转化酵母细胞。可以例如使用可商购获得的基于脂质体的转染试剂盒例如LipofectamineTM(Invitrogen)、可商购获得的基于脂质的转染试剂盒例如Fugene(Roche Diagnostics)、基于聚乙二醇的转染、磷酸钙沉淀、基因枪(生物弹射击法)、电穿孔、或病毒感染来转染其他真核细胞。
在第八方面,本发明涉及根据本发明第二方面的方法能够制备的药物组合物。
在第九方面,本发明涉及包含本发明第三方面的化合物、本发明第四方面的抗体、本发明第五方面的核酸、或本发明第六方面的载体的药物组合物。
在特定实施方案中,药物组合物还包含一种或多于一种药学上可接受的赋形剂和/或载体。
本发明考虑的药物组合物可以以本领域技术人员熟知的各种方式配制。例如,本发明的药物组合物可以是固体形式,例如片剂、丸剂、胶囊剂(包括软凝胶胶囊)、扁囊剂、锭剂、卵形剂(ovule)、散剂、颗粒剂或栓剂的形式;或液体形式,例如酏剂、溶液、乳剂、或混悬剂的形式。
固体给药形式可含有赋形剂,例如微晶纤维素、乳糖、柠檬酸钠、碳酸钙、磷酸氢钙、甘氨酸、和淀粉(优选玉米淀粉、马铃薯淀粉、或木薯淀粉);崩解剂,例如羟基乙酸淀粉钠、交联羧甲基纤维素钠、和一些复合硅酸盐;以及造粒黏合剂,例如聚乙烯吡咯烷酮、羟丙基甲基纤维素(HPMC)、羟丙基纤维素 (HPC)、蔗糖、明胶、和阿拉伯胶。另外,可以包括润滑剂,例如硬脂酸镁、硬脂酸、山嵛酸甘油酯、和滑石。类似类型的固体组合物也可用作明胶胶囊中的填料。就此而言,优选的赋形剂包括乳糖、淀粉、纤维素、乳糖、或高分子量聚乙二醇。
对于适于经口给药的含水混悬剂、溶液、酏剂、和乳剂,所述化合物可与各种甜味剂或调味剂;着色剂或染料;乳化剂和/或助悬剂;以及稀释剂,例如水、乙醇、丙二醇、和甘油;和其组合结合使用。
本发明的药物组合物可含有释放速率调节剂,包括例如羟丙基甲基纤维素、甲基纤维素、羧甲基纤维素钠、乙基纤维素、乙酸纤维素、聚环氧乙烷、黄原胶、卡波姆、季铵基甲基丙烯酸酯(ammonio methacrylate)共聚物、氢化蓖麻油、巴西棕榈蜡、石蜡、邻苯二甲酸醋酸纤维素、邻苯二甲酸羟丙基甲基纤维素、甲基丙烯酸共聚物、及其混合物。
本发明的药物组合物可以是快速分散或溶解制剂(FDDF)的形式并且可以含有以下成分:阿斯巴甜、乙酰磺胺酸钾、柠檬酸、交联羧甲基纤维素钠、交聚维酮、二抗坏血酸、丙烯酸乙酯、乙基纤维素、明胶、羟丙基甲基纤维素、硬脂酸镁、甘露醇、甲基丙烯酸甲酯、薄荷调味剂、聚乙二醇、气相二氧化硅、二氧化硅、羟基乙酸淀粉钠、硬脂酰富马酸钠、山梨糖醇、木糖醇。
为了制备栓剂,首先熔化低熔点蜡,例如脂肪酸甘油酯或可可脂的混合物,并通过搅拌将活性组分均匀地分散于其中。然后将熔融的均匀混合物倒入适当大小的模具中,使其冷却,从而固化。
适于胃肠外给药的本发明药物组合物最好以无菌水溶液的形式使用,所述无菌水溶液可含有其它物质,例如足够的盐或葡萄糖,以使溶液与血液等渗。如果需要,水溶液应为适当缓冲的(优选pH为3至9)。
适于鼻内给药和吸入给药的药物组合物最好以干粉吸入剂或气雾剂喷雾的形式从加压容器、泵、喷雾器或雾化器递送,同时使用合适的推进剂,例如二氯二氟甲烷、三氯氟甲烷、二氯四氟乙烷、氢氟烷烃例如1,1,1,2-四氟乙烷 (HFA 134A.TM.)或1,1,1,2,3,3,3-七氟丙烷(HFA 227EA.TM.)、二氧化碳、或另一种合适的气体。加压容器、泵、喷雾器或雾化器可含有例如使用乙醇和推进剂的混合物作为溶剂的活性化合物溶液或悬浮液,其可另外含有润滑剂,例如脱水山梨糖醇三油酸酯。
在特定的实施方案中,药物组合物是单位剂型。在这种形式中,制剂细分为含有适量活性成分的单位剂量。单位剂型可以是包装的制剂,所述包装含有离散量的制剂,例如包装的片剂、胶囊、和小瓶或安瓿中的粉末。此外,单位剂型可以是胶囊、片剂、扁囊剂、或锭剂本身,或者其可以是任何这些包装形式中的适当数量。
根据具体应用和活性成分的效力,可以在约1mg/m2至约1000mg/m2,优选约5mg/m2至约150mg/m2的范围内改变或调节在本发明的使用中施用的单位剂量制剂中的活性成分的量。
在第十方面,本发明涉及根据本发明第三方面的化合物、本发明第四方面的抗体、本发明第五方面的核酸、本发明第六方面的载体、或本发明第七方面或第八方面的药物组合物,其用于治疗、改善、或预防由正黏病毒科病毒的病毒感染引起的疾病状况。
在特定实施方案中,所述疾病状况由选自甲型流感病毒、乙型流感病毒、和丙型流感病毒的病毒引起。
在特定的实施方案中,通过肺部途径,例如通过吸入,通过直肠或肠胃外途径,例如海绵体内、静脉内、动脉内、腹膜内、鞘内、心室内、尿道内、胸骨内(intrasternally)、颅内、肌内、或皮下途径,向动物患者特别是哺乳动物患者,特别是人类患者经口、经颊部、舌下、鼻内施用用于治疗、改善、预防所述疾病状况的根据本发明第七或第十方面的化合物、根据本发明第十一或第十三方面的药物组合物、或根据本发明第十二方面的抗体,此外,它们可通过输注或无针注射技术施用。
在第十一方面,本发明涉及治疗、改善、或预防由正黏病毒科病毒的病毒感染引起的疾病状况的方法,其包括施用治疗上有效量的根据本发明第三方面的化合物、本发明第四方面的抗体、本发明第五方面的核酸、本发明第六方面的载体、或本发明第七或第八方面的药物组合物。
在特定实施方案中,所述疾病状况由选自甲型流感病毒、乙型流感病毒、和丙型流感病毒的病毒引起。
在特定实施方案中,通过肺部途径,例如吸入,通过直肠或胃肠外途径,例如海绵体内、静脉内、动脉内、腹膜内、鞘内、心室内、尿道内、胸骨内、颅内、肌内或皮下途径,向动物患者,特别是哺乳动物患者,特别是人类患者经口、经颊部、舌下、鼻内施用根据本发明第三方面的化合物、本发明第四方面的抗体、本发明第五方面的核酸、本发明第六方面的载体、或者本发明第七或第八方面的药物组合物,此外,它们还可通过输注或无针注射技术施用。
在特定的实施方案中,每日施用约0.05mg/kg至约20mg/kg的初始剂量。优选约0.05mg/kg至约2mg/kg的日剂量范围,最优选约0.05mg/kg至约1mg/kg 的日剂量范围。然而,剂量可以根据患者的需求、所治疗病症的严重程度、和所用化合物而变化。确定特定情况的适当剂量在从业者的技能范围内。通常,用小于化合物最佳剂量的较小剂量开始治疗。此后,剂量以小增量增加,直到达到所处情况下的最佳效果。为方便起见,如果需要,可以将日总剂量分份并在一天中分批给药。
在不脱离本发明的范围的情况下,本发明的各种修改和变化对于本领域技术人员来说是显而易见的。尽管已经结合具体的优选实施方案描述了本发明,但是应该理解,要求保护的本发明不应该不适当地限于这些特定实施方案。实际上,本发明旨在涵盖对相关领域技术人员显而易见的用于实施本发明的所述实施方案的各种修改。
特别地,本发明涉及以下方面:
1.一种通过计算机鉴别降低或阻止来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体与其配体(特别是与细胞Pol II,特别是与CTD)结合的化合物的方法,其包括以下步骤
(a)基于病毒RNA依赖性RNA聚合酶与其配体的结合位点的结构坐标构建计算机模型;
(b)通过选择以下的方法来选择潜在的调节化合物:
(i)修饰结合位点内的共结晶配体,
(ii)基于共结晶配体与病毒RNA依赖性RNA聚合酶的结合位点的相互作用特征,和/或基于与共结晶配体的3D相似性,从小分子数据库中过滤并选择化合物,和
(iii)基于共结晶配体与病毒RNA依赖性RNA聚合酶的结合位点的相互作用特征和/或基于与共结晶配体的3D相似性,重新进行所述化合物的配体设计;
(c)采用计算手段在所述化合物和所述结合位点的计算机模型之间执行拟合程序操作,以便提供所述化合物在活性位点的能量最小化构型;和/或采用计算对接方法将所述化合物定位并置于所述结合位点中,以便提供化学实体,即所述化合物的合理3D排列;和
(d)评估所述拟合操作的结果并任选地评估所述对接方法的结果,以量化所述化合物与结合位点模型之间的缔合,从而评估所述化合物与所述活性位点缔合的能力。
2.根据方面1的方法,其中来自正黏病毒科的病毒RNA依赖性RNA聚合酶是来自甲型流感病毒、乙型流感病毒、丙型流感病毒、或丁型流感病毒的病毒RNA依赖性RNA聚合酶或其变体,特别是来自甲型流感病毒的病毒RNA 依赖性RNA聚合酶。
3.根据方面1至2中任一项的方法,其中结合位点包括甲型流感病毒的 RNA依赖性RNA聚合酶PA亚基(SEQ ID NO:1)的氨基酸K630、R633、和 E444;包括一个或多于一个选自SEQ ID NO:44的K635、R638、和E449的氨基酸;或包括占据与其比对的PA亚基序列中类似位置的氨基酸。
4.根据方面3的方法,其中结合位点还包括SEQ ID NO:1的氨基酸K289、 R449、和E452,或包括一个或多于一个选自SEQ ID NO:44的K289、R454、和E457的氨基酸。
5.根据方面3或4的方法,其中结合位点还包括SEQ ID NO:1的氨基酸 F440和F607,或包括SEQ ID NO:44的氨基酸Y445和F612。
6.根据方面3至5中任一项的方法,其中结合位点还包括一个或多于一个选自SEQID NO:1的M288、L290、S291、T313、F314、I545、M543、和 K554的氨基酸,或包括一个或多于一个选自SEQ ID NO:44的L288、L290、 S291、T313、F314、L550、M548、和R559的氨基酸。
7.根据方面3至6中任一项的方法,其中结合位点还包括SEQ ID NO:1 的氨基酸G629,或包括SEQ ID NO:44的氨基酸G634。
8.根据方面1至7中任一项的方法,其中结合位点包括SEQ ID NO:1的氨基酸F440、E444、F607、G629、K630、和R633,包括根据SEQ ID NO: 44的氨基酸Y445、E449、F612、G634、K635、和R683,或包括占据与其比对的PA亚基序列中类似位置的氨基酸。
9.根据方面1至8中任一项的方法,其中结合位点包括SEQ ID NO:1的氨基酸M288、K289、L290、S291、T313、F314、R449、E452、M543、K554、和I545,包括SEQ ID NO:44的氨基酸L288、K289、L290、S291、T313、 F314、R454、E457、M548、K559、和L550,或包括占据与其比对的PA亚基的序列中类似位置的氨基酸。
10.根据方面1至9中任一项的方法,其中甲型流感病毒的RNA依赖性 RNA聚合酶的结合位点包括SEQ ID NO:1的氨基酸M288、K289、L290、 S291、T313、F314、F440、E444、R449、E452、M543、K554、I545、F607、 G629、K630、和R633,包括SEQ ID NO:44的氨基酸L288、K289、L290、 S291、T313、F314、Y445、E449、R454、E457、M548、K559、L550、F612、 G634、K635、和R638,或包括占据与其比对的PA亚基序列中类似位置的氨基酸。
11.根据方面1至10中任一项的方法,其中结合位点包括SEQ ID NO:1 的258位至713位氨基酸,或包括SEQ ID NO:44的201位至716位氨基酸。
12.根据方面1至2中任一项的方法,其中结合位点包括乙型流感病毒的 RNA依赖性RNA聚合酶PA亚基(SEQ ID NO:2)的氨基酸E445、K631、和 R634;或包括占据与其比对的PA亚基序列中类似位置的氨基酸。
13.根据方面12的方法,其中结合位点还包括SEQ ID NO:2的氨基酸Y441 和F604。
14.根据方面3或4的方法,其中结合位点还包括SEQ ID NO:2的氨基酸 G630。
15.根据方面12至14中任一项的方法,其中结合位点包括SEQ ID NO:2 的258位至722位氨基酸。
16.根据方面1至15中任一项的方法,其中所述计算机模型基于晶体的结构坐标,所述晶体的X射线衍射分辨率为或高于优选或高于优选或高于
17.根据方面1至16中任一项的方法,其中所述计算机模型基于如图11 或图12所示的结构坐标。
18.一种产生降低或阻止来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体与其配体(优选与细胞Pol II,更优选与CTD)结合的化合物的方法,其包括以下步骤
(a)通过方面1至9中任一项的方法鉴别所述化合物,和
(b)合成所述化合物并任选地将所述化合物或其药学上可接受的盐与一种
或多于一种药学上可接受的赋形剂和/或载体调配。
19.根据方面18的方法,其包括进一步的步骤
(c)使所述化合物与来自正黏病毒科的病毒RNA依赖性RNA聚合酶接触,
(d)确定所述化合物阻止病毒RNA依赖性RNA聚合酶与其配体结合,优
选与CTD结合的能力。
20.根据方面1至19中任一项的方法,其中所述测试化合物是小分子。
21.根据方面1至19中任一项的方法,其中测试化合物是肽或蛋白质。
22.根据方面21的方法,其中测试化合物是抗体,优选针对正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体与其配体(优选与细胞Pol II,更优选与 CTD)的结合位点的抗体。
23.一种通过方面1至18中任一项的方法能够鉴别和/或产生的化合物,其中所述化合物能够降低或阻止病毒RNA依赖性RNA聚合酶或其变体与其配体(优选与CTD)的结合。
24.一种针对正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体与其配体(优选与细胞Pol II,更优选与CTD)的结合位点的抗体。
25.根据方面24的抗体,其中所述抗体识别如SEQ ID NO:1或SEQ ID NO: 2中所示的氨基酸序列的5个至15个氨基酸长度的多肽,其中所述多肽包含一个或多于一个选自根据SEQ ID NO:1的甲型流感病毒RNA依赖性RNA聚合酶PA亚基的K630、R633、和E444的氨基酸残基;或包含一个或多于一个选自根据SEQ ID NO:2的乙型流感病毒RNA依赖性RNA聚合酶PA亚基的E445、 K631、和R634的氨基酸残基。
26.一种编码方面24至25中任一项的抗体的核酸。
27.一种包含方面26的核酸的载体。
28.一种重组宿主细胞,其包含方面26的分离的核酸或方面27的重组载体。
29.一种根据方面18至22的方法能够制备的药物组合物。
30.一种药物组合物,其包含方面23的化合物、方面24至25的抗体、方面26的核酸、方面27的载体、或方面28的重组宿主细胞。
31.根据方面23的化合物、根据方面24至25的抗体、根据方面26的核酸、或根据方面27的载体、根据方面28的重组宿主细胞、或根据方面29或30的药物,其用于治疗、改善或预防由正黏病毒科病毒的病毒感染引起的疾病状况。
32.根据方面31之用途的方面23的化合物、方面24至25的抗体、方面 26的核酸、或方面27的载体、方面28的重组宿主细胞、或方面29或30的药物,其中所述疾病状况是由选自甲型流感病毒、乙型流感病毒、和丙型流感病毒的病毒引起。
33.一种治疗、改善、或预防由正黏病毒科病毒的病毒感染引起的疾病状况的方法,该方法包括施用治疗上有效量的根据方面23的化合物、方面24至25 的抗体、方面26的核酸、或方面27的载体、方面28的重组宿主细胞、或方面29或30的药物。
34.根据方面33的方法,其中所述疾病状况由选自甲型流感病毒、乙型流感病毒、和丙型流感病毒的病毒引起。
以下附图和实施例仅用于说明本发明,不应解释为以任何方式限制由所附权利要求指出的本发明的范围。
实施例
设计实施例以进一步说明本发明并提供更好的理解。它们不应被解释为以任何方式限制本发明的范围。
实施例概述
如前所述表达并纯化来自甲型蝙蝠流感病毒(H17N10)和人类乙型流感病毒/孟菲斯/13/03以及各突变体的聚合酶(Plotch等人,1981 Cell 23:847-858; Pflug等人,2014Nature,516:355-360)。两种聚合酶与SeP5 28聚体(mer)(四个七肽重复序列)CTD肽共结晶,在ESRF收集衍射数据,并使用标准程序测定结构。通过用包含标记有FAM荧光的2个或4个七肽重复序列的CTD肽进行各向异性测量,来对野生型或突变型聚合酶进行结合测定。通过荧光测定法用野生型或突变型聚合酶进行体外转录/复制测定,其中该荧光测定法在有或没有加帽引物的情况下使用单独的短vRNA或cRNA 5′端(激活子)和3′端(模板)。对于微型基因组测定而言,用表达聚合酶亚基、核蛋白和pPolI编码的萤光素酶报告基因的pcDNA3质粒转染HEK293T细胞,该荧光素酶报告基因呈负极性并携带核蛋白区段的5′端和3′端。通过反向遗传学产生重组病毒并通过噬斑测定来确定病毒复制效率。
实施例1:重组蛋白的表达和纯化
如前所述表达并纯化来自甲型流感病毒/小黄肩蝙蝠/危地马拉 /060/2010(H17N10)和人类乙型流感病毒/孟菲斯/13/03的异源三聚体聚合酶以及相应突变体(Pflug等人,2014,Nature 516:355-360;Reich等人,2014,Nature 516:361-366)。
实施例2:结晶、数据收集和结构解析
如前所述产生蝙蝠甲型流感病毒(FluA)聚合酶-vRNA晶体(Pflug等人, 2014,Nature 516:355-360),但是将Ser-5-磷酸化的28mer CTD肽(Covalab)以1∶1 的比例加入聚合酶复合物。在冷冻保护和冷冻之前,通过用过量的肽浸泡晶体来增加肽的占有率。在欧洲同步辐射光源(ESRF)的光束线ID29上收集衍射数据,并用XDS套装进行整合和放大(Kabsch 2010,Acta Crystallogr D Biol Crystallogr 66:133-144)。使用原始蝙蝠FluA聚合酶结构(PDB代码:4WSB)通过分子替代来解析结构,并且以明显的差异密度手动对肽进行建模(图1A)。将乙型流感病毒(FluB)聚合酶-vRNA复合物与Ser-5磷酸化的28个氨基酸的CTD 肽以1∶15的比例共结晶,从而产生如前所述的FluB1晶形(Reich,等人,2014, Nature516:361-366)。在ESRF的光束线ID23-1上收集衍射数据。通过用乙型流感病毒结构模型(PDB代码:4WSA)进行分子替代来解析结构。两种结构均使用Refmac54和Phenix5进行修正。对于较低分辨率FluB结构,仅修正TLS 参数。用Pymol(DeLano 2002;PyMOL MolecularGraphics System,可从 http://www.pymol.sourceforge.net在线获得)绘制结构图。以分辨率测定共结晶、结合vRNA-启动子、具有四个七肽重复Ser5-磷酸化(SeP5)CTD肽的蝙蝠FluA聚合酶的结构。在聚合酶表面的两个不同位点清楚地观察到肽的明确的额外电子密度,并且可以在结构中模拟16/28个残基(图1A)。CTD肽结合 PA的PA的C末端结构域(PA-C)(图2A),PA-C远离启动子结合位点、聚合酶活性位点以及帽结合和内切核酸酶结构域,从而保持不受干扰。来自一个CTD 重复序列的六个残基(Y1aS2aP3aT4aSeP5aP6a)结合到由PA螺旋α16、α20、α21形成的凹槽和连接螺旋α15至α16的环(表示为位点1),其中相互作用表面为 (图2B)。位点2容纳来自三个连续重复序列的残基(P6bS7b-Y1cS2cP3cT4cSeP5cP6cS7c-Y1d),该位点在结合时包埋的表面区域。肽位于β19至β20带和突出的550环上(Pflug等人,2014,Nature 516:355-360)。连接位点1和位点2的肽没有电子密度,尽管它们可能合理地与缺失的残基 (-S7a-Y1b-S2b-P3b-T4b-SeP5b-)连接(图2B)。
位点1中的CTD肽采用延伸的β样构象,其中交替的残基与蛋白质(Y1a、 P3a、SeP5a)相互作用或指向溶剂(S2a、T4a和P6a)(图2C)。先前已在与蛋白质配偶体结合的CTD的其他结构中观察到类似的构象(图1B至图1E),但具体的相互作用是不同的。Y1a容纳在由PA残基F440和F607(蝙蝠FluA编号)形成的疏水口袋中,并且其羟基与E444结合形成氢键。P3a与非极性残基L412和A443 通过范德华力接触。SeP5a的磷酸在由K630和R633形成的带正电荷的口袋中由多个氢键结合,其反过来又定位成与E444相互作用。结合到位点2的CTD 重复序列形成侧翼为延伸区域的β-转角,其夹住550环(图2B、图2D)。与不含肽的结构相比,β18至β19带和550环占据至多(图2B)。β-转角由 S2cP3cT4cSeP5c形成,并且通过S2c的羟基与T4c羟基之间、S2c的羟基与SeP5c氨基之间以及T4c羟基与SeP5c磷酸之间的三个内部氢键得以稳定。这些相互作用阻止了这种构型中S2c或T4c的磷酸化,这与聚合酶对Ser5磷酸化CTD2的已知特异性一致。SeP5c磷酸与碱性残基K289和R449形成带电荷的氢键,后者由E452稳定。两个酪氨酸(Y1c和Y1d)以及P6c在疏水口袋中结合,该疏水口袋由I545和K554的脂肪族侧链(对于Y1c);M543和M288(P6c);M543、L290 和F314(Y1d)形成。Y1d羟基也与T313的侧链和S291的主链酰胺形成两个氢键。
甲型流感病毒、乙型流感病毒、丙型流感病毒和丁型流感病毒的序列比对显示,所有关键位点1的残基在蝙蝠(禽/人)的所有FluA病毒株中高度保守,即F440(Y445)、E444(449)、F607(612)、G629(634)、K630(635)、R633(638),以及在FluB中高度保守,即Y441、E445、F604、G630、K631和R634,但在 FluC或FluD中并非如此(图3A,图4)。相反,关键位点2残基仅在FluA病毒株中是保守的。为了证实这些观察结果,我们测定了与相同的28merSeP5肽共结晶的FluB聚合酶的分辨率结构。如所预测的,除另外观察到S7a-Y1b以外,我们观察到在位点1结合时,相互作用的模式与蝙蝠FluA相同(图3B、图3C)。然而,还观察到额外的肽样差异电子密度从接近位点1(但未连接)延伸跨过PB2627结构域(图3B),这在蝙蝠流感病毒(bat Flu)结构中未观察到。这些结果表明,位点1是所有甲型和乙型流感病毒株的通用CTD结合位点,而位点2似乎是FluA特异性的并且在FluB病毒株中可能存在替代的第二位点。
实施例3:荧光各向异性
为了进一步表征CTD与FluA和FluB聚合酶的相互作用,使用具有2次 (14mer)或4次(28mer)重复的荧光团标记的肽进行荧光各向异性结合实验。用 CTD肽进行结合测定,该CTD肽在N末端用FAM进行荧光标记并由共有序列(Y1S2P3T4S5P6S7)的不同数目的重复组成。使用2次和4次重复(分别为14个和28个氨基酸)Ser-5磷酸化肽和4次重复非磷酸化肽(Covalab)。用增加浓度的野生型聚合酶或相应的突变体在50mM HEPES、150mM NaCl、10%甘油、5mM MgCl2、2mM三(2-羧乙基)膦(TCEP)、pH7.5条件下滴定肽。将蛋白质与针对蝙蝠FluA的vRNA启动子5′-pAGUAGAAACAAGG-3′(SEQ ID NO:24)和 3′OH-GCCUGCUUCUGCU-5′(SEQ ID NO:25)以及与针对FluB的vRNA启动子5′-pAGUAGUAACAAGAG-3′(SEQ ID NO:26)和3′OH-CUCUGCUUCUGCU-5′(SEQ ID NO:27)预混合,其中有一个例外(所指示的)。使用荧光光谱仪(Photon Technology International)在23℃下测量荧光各向异性。绘制观察到的荧光各向异性。通过使用以下等式将数据拟合成1∶1结合模型来获得解离常数:
(fb-结合肽的分级浓度,L-荧光肽的总浓度,P-蛋白质的总浓度,KD-解离常数)。对于替代测定,将0.5μM FluA聚合酶:vRNA复合物与0.5μM荧光标记的Ser-5磷酸化CTD肽一起孵育,并用递增量的未标记的Ser-5磷酸化CTD 肽滴定。使用相同的结合模型方程计算表观KD
我们得到了与蝙蝠FluA聚合酶-vRNA启动子复合物结合的28mer SeP5肽的KD为0.9μM(图3C)。通过用未标记的肽替代结合的标记肽获得类似的KD(图 5A)。结合不依赖于vRNA启动子结合(图5B),这与肽结合位点位于聚合酶结构上稳定的核心的外部,远离vRNA结合位点且远离灵活连接的外周结构域 18相一致,这也与显示vRNA不是CTD结合所必需的先前结果一致(Engelhardt 等人,2005,Journal of virology 79:5812-5818;Loucaides等人,2009,Virology 394:154-163)。对于14mer SeP5肽和未磷酸化的28mer Ser5肽,我们分别测量到KD为6.1μM和>10μM(图3C,图5C)。这意味着对Ser5磷酸化序列的亲和力比对非磷酸化CTD重复序列的亲和力高>10倍,并且与4次重复的结合比与两次重复的结合更紧。后一结果与晶体结构相一致,这表明四次连续重复序列可以跨两个位点结合并且具有融合独立配体的预期亲合力效应。FluB聚合酶不区分不同长度的Sep5肽(对于28mer SeP5和14mer SeP5,KD分别为2.9和 4.2)(图3D)。
实施例4:体外聚合酶活性测定
为了评估CTD相互作用对病毒复制的重要性,我们对形成带正电荷的磷酸丝氨酸结合位点的保守碱性残基进行突变。我们首先表达并纯化了在位点 1(K630A+R633A)或位点2(K289A+R449A)中具有双突变体的重组蝙蝠聚合酶。K289A+R449A突变体和K630A+R633A突变体对四次重复SeP5肽的亲和力分别降低约4倍和7.5倍(图6A、图7A)。FluB中相应的突变体(K631A+R634A) 对CTD的结合亲和力降低2.5倍(图6A、图7B)。含有所有四种突变(K289A、 R449A、K630A和R633A)的聚合酶不能重组产生,并且使用在哺乳动物细胞中表达的荧光标记聚合酶亚基的研究表明该聚合酶不能正确地在核中定位,这与其他突变体不同(数据未显示)。
进行三种类型的RNA合成测定以比较FluA聚合酶CTD结合突变体的内在酶活性:使用vRNA或cRNA作为模板的帽引发的转录测定和非引发的复制测定。对于每种测定,将与5′vRNA(5′-pAGUAGUAACAAGAG-3′)(SEQ ID NO: 28)或5′cRNA(5′-pAGCAGAAGCAGAGG-3′)(SEQID NO:29)预先混合的 0.25μM蝙蝠FluA聚合酶加入至0.15μM荧光标记的模板 3′vRNA(5′-FAM-UAUACCUCUGCUUCUGCU-3′)(SEQ ID NO:30)或 cRNA(5′-FAMUACCCUCUUGUUACUACU-3′)(SEQ ID NO:31)中。反应在 50mM HEPES、150mM NaCl、10%甘油、5mM MgCl2、2mM三(2-羧乙基)膦 (TCEP)、pH7.5、具有0.025mM或0.5mM NTP的条件下进行(分别存在或不存在加帽引物)。对于帽依赖性转录反应,加入0.5μM加帽引物 (5′-m7GpppAAUCUAUAAUAG-3′)(SEQ IDNO:32)。测定在24℃下进行。在 NaCl中淬灭反应,并使用Clariostar酶标仪(BMG Germany)检测对应于双链产物-模板双链体的荧光偏振信号。将所获得的非引发复制反应的时间历程拟合成单指数方程:
或者,在帽依赖性转录的情况下,进行双指数拟合:
其中A和C是观察到的偏振振幅,B和D是相应相位的最终偏振值;t 是时间并且kn是各自观察到的速率常数。
实施例5:微型基因组测定
接下来,我们使用微型基因组测定法来测定细胞环境中聚合酶活性的总体效应,其中人类FluA聚合酶和核蛋白与编码负极性报告萤光素酶的RNA一起表达。功能性报告蛋白只能通过活跃转录的核糖核蛋白复合物产生。
将HEK293T细胞接种在12孔板中,并用XtremeGene转染试剂进行转染。使用100ng表达核蛋白(NP)的pcDNA3,10ng表达甲型流感病毒/维多利亚 /3/1975(H3N2)聚合酶的PA亚基或相应突变体、PB1亚基和PB2亚基的pcDNA3 质粒(Ortin等人,2015,Virology 479-480:532-544),和100ng编码侧翼为NP区段的5′和3′区域的负极性萤火虫萤光素酶报告基因的pPolI-NP-Luc(Palancade 等人,2003,Eur J Biochem 270:3859-3870)转染每个孔。将没有PA的转染混合物用作阴性对照。将pRenilla-TK质粒(Promega)用于校正转染效率。转染后24 小时裂解细胞,并根据制造商说明书(Promega)使用Berthold TechnologiesCentro LB 960光度计测量萤火虫和海肾萤光素酶活性。实验以生物学的一式三份进行。为了进行突变体表达水平的蛋白质印迹检测,使用聚乙烯亚胺转染试剂转染1μg的PA或相应的突变体,并使用小鼠抗PA抗体(由J.Ortin提供)进行检测。β-肌动蛋白抗体(Abcam,UK)用于各细胞裂解物中总蛋白量的归一化。
我们观察到每种双突变体(位点1:K635A+R638A和位点2:K289A+R454A) 的活性分别剧烈地降至野生型活性的0.3%和2%(图6B)。我们还分别产生每个单独的精氨酸或赖氨酸的单个丙氨酸突变,并且观察到活性降低至野生型的6%至60%之间(图6B)。有趣的是,具有等效双突变的纯化重组蝙蝠FluA聚合酶与野生型相比在体外帽依赖性转录(图6C)或使用vRNA或cRNA作为模板的未引发病毒复制测定(图7C)中没有显示出活性差异,这证实所有内在的聚合酶酶活性不受突变的影响。这些结果表明,突变的聚合酶仅在细胞环境中受损,这可能是由于与Pol II CTD的结合减少。
实施例6:通过反向遗传学产生重组病毒
我们使用反向遗传学产生在PA亚基中具有K635A+R638A(位点1)或 K289A+R454A(位点2)双突变,或具有K289A、R454A、K635A、或R638A单突变的重组人流感病毒。HEK-293T细胞在补充有10%胎牛血清(FCS)的完全达尔伯克氏改良伊格尔培养液(DMEM)中生长。MDCK细胞在补充有5%FCS 的改良伊格尔培养液中生长。使用改编自先前工作的程序通过反向遗传学产生重组甲型流感/WSN/33病毒(Fodor等人,2003,Journal of virology 77:5017-5020;Eisfeld等人,2015,Nat Rev Microbiol 13:28-41)。通过使用改编自先前工作的噬斑测定程序滴定MDCK细胞的上清液来评估反向遗传学的效率(Resa-Infante 等人,2011,RNA Biol 8:207-215)。对MDCK细胞进行噬斑纯化和扩增后,使用 QIAamp病毒RNA微型试剂盒(QIAGEN)提取病毒RNA。使用SuperScript One-Step RT-PCR试剂盒(Invitrogen)、以及寡核苷酸 5′-AGTAGAAACAAGGTACTTTTTTGG-3′(SEQ ID NO:33)和 5′-TGCAGGACATTGAGAATGAGG-3′(SEQ ID NO:34)、或 5′-ACCTCAATTCTGGTTCATCAC-3′(SEQ IDNO:35)和 5′-AGCGAAAGCAGGTACTGATCC-3′(SEQ ID NO:36)进行逆转录和扩增,以分别扩增PA区段的5′或3′部分。使用凝胶和PCR清理试剂盒(Macherey-Nagel) 纯化扩增产物,并使用内部寡核苷酸进行测序。
两种双突变病毒都不能被挽救。如图8A所示,相较于野生型病毒的滴度>107pfu/ml,单个PA突变体的反向遗传上清液显示出滴度<103pfu/ml和较小的噬斑(R454突变体的噬斑极小)。对于每种PA突变,将来自单个噬斑的病毒纯化并在MDCK细胞上扩增。所得到的病毒原种显示出预期的PA序列和小的噬斑表型(数据未显示)。为了比较突变体和野生型病毒的生长特性,以0.001 的感染复数感染MDCK细胞,并在不同时间点在培养上清液中测定病毒滴度 (图8B)。与野生型相比,K635A和R638A突变体的病毒滴度剧烈降低。R454 突变体甚至降低得更多,而K289A突变体在这些条件下不能以可检测的水平生长。
实施例7:虚拟筛选与FluPol结合的化合物并从而阻断细胞RNA聚合酶II(Pol II) 的CTD结构域与FluPol之间的相互作用
晶体结构阐明了FluPol中存在至少两个不同的结合区,该两个不同的结合区都容纳Pol II的C末端结构域(CTD)部分。结构信息使得能够分析Pol II CTD 的这些氨基酸与FluPol的精确相互作用特征。
分别分析两个相互作用位点,并将这些知识应用于几种虚拟筛选方法,以便根据以下两种方法寻找阻断病毒蛋白和细胞蛋白之间相互作用的化合物:
1.基于配体虚拟筛选和检测化合物,该化合物可以在生物活性构象方面模拟与FluPol进行重要相互作用的CTD氨基酸。
a.这针对位点1中的结合进行
b.这针对位点2中的结合进行
2.基于结构的虚拟筛选:
a.将可商购获得的化合物对接到针对CTD重复序列的一部分的结合位点1 中。在此,将偏差包括在内以支持具有子结构的化合物,该化合物可以最好地模拟与病毒蛋白相互作用的SeP5基团
b.将可商购获得的化合物对接到针对CTD重复序列的一部分的结合位点 2中。在此,将偏差包括在内以支持具有子结构的化合物,该化合物可以最好地模拟与病毒蛋白相互作用的SeP5基团。
结论
我们已经揭示,FluA聚合酶在体外直接结合多个Ser5磷酸化的Pol II CTD 重复序列,并且两个保守的磷酸丝氨酸结合位点的破坏对病毒感染性是高度不利的,但不影响聚合酶的内在RNA合成活性。
基于结合CTD的FluA聚合酶结构的建模工作表明了C453R(蝙蝠FluA中为C448R)置换的非常接近的空间接近度可如何补偿磷酸丝氨酸结合中的R638 缺失(图8C)。其次,已经显示,PA置换L550I足以赋予甲型流感/PR/8/34病毒株低毒力表型、以及降低的Pol II降解(Llompart等人,2014,Journal of virology 88:3455-3463;Rolling等人,2009,Journalof virology 83:6673-6680)。 PA L550在人类/禽甲型流感病毒株中高度保守(99.6%)并且对应于蝙蝠FluA中的残基I545,该残基与CTD结合位点2中的CTD残基Tyr1c和Pro6c产生关键的疏水相互作用(图2D、图8D)。这些观察结果表明,该残基的保守置换可以巧妙地调节而不消除CTD结合,因此对聚合酶活性、Pol II降解和毒力产生连锁效应。第三,PA552位残基靠近550环的尖端,该残基在禽类中几乎专有地是苏氨酸(在蝙蝠中为T547),或者人类FluA聚合酶中的丝氨酸也是结合位点 2的一部分并且非常接近CTD残基Ser7b(图8D)。单个PA突变T552S(禽类变成人类特征)足以使原本受损的禽类聚合酶在人类细胞中的活性增强20倍(Mehle等人,2012,Journal of virology 86:1750-1757)。总之,我们得出结论认为, CTD结合位点残基中的微小变动(例如I550L或T552S)可产生生物学上显著的作用。这与我们的发现一致,即相对剧烈的突变(例如结合磷酸丝氨酸的碱性残基的双重敲除)导致病毒无活力,且甚至单个突变体导致病毒的高度减毒,尽管双突变聚合酶与CTD的体外结合仅降低了4倍至8倍(图6A、图7A)。这些考虑指出,相对于竞争宿主因子,需要微调病毒聚合酶对PolII CTD的亲和力。将FluA聚合酶与SeP5 CTD肽重复序列结合的KD(0.9μM)与同其他相关 CTD结合蛋白结合的KD进行比较,例如:与哺乳动物加帽酶(Mce1)结合的 KD为约139μM24、与Pin1脯氨酸异构酶结合的KD为约30μM(Verdecia等人, 2000,Nat Struct Biol 7:639-643)以及与Ssu72 Sep5磷酸酶结合的KM为约 280μM(Xiang等人,2010,Nature 467:729-733;Hausmann等人,2005,The Journal of biological chemistry 280:37681-37688)。表2显示,迄今为止报道的病毒聚合酶对CTD的亲和力是最高的。这表明FluPol可以强有力地竞争与CTD的结合并潜在地阻止其他因子结合,特别是阻止那些促进向延伸期转变的因子(例如 Ssu72和Pin1)的结合。
实施例8:H7N9聚合酶核心的构建设计/克隆
基于商业杆状病毒表达载体pFastBacDual(Thermo Fisher)产生用于甲型流感/ 浙江/DTID-ZJU01/2013(H7N9)聚合酶核心的共表达构建体。使用限制性位点BamHI和RsrII 将编码完整PB1蛋白的序列(SEQ ID NO:41,合成的,GenBank:AGJ51960.1)插入PolH-MCS 中;使用限制性位点BbsI和XhoI将补充有TEV可切割多聚组氨酸标签(SEQ ID NO:43, GSGSENLYFQGSHHHHHHHH)的编码蛋白质PB2的1位至127位残基的序列(SEQ ID NO:42,合成 的,GenBank:KJ633805.1)插入P10-MCS中。首先通过限制性位点BamHI和EcoRI将编码蛋白 质PA的201位至716位残基的序列(SEQ ID NO:44,合成的,GenBank:AGJ51952.1)克隆到载 体pACEBac中,然后由包括PolH启动子和SV40 polA信号的构建体进行扩增并且使用独特的 AvrII限制性位点和SLIC克隆技术将所述序列亚克隆到pFastBacDual_PB1_PB2构建体中。
实施例9:重组蛋白的表达和纯化
使用杆状病毒表达系统在HighFive昆虫细胞中产生H7N9核心。通过在缓冲液A(50mM Tris-HCl pH8.0、500mM NaCl、10%(体积/体积)甘油)中超声处理来裂解细胞,将细胞碎片离心(30分钟、4℃、35000g)并将硫酸铵加入上清液 (0.5μg/ml)中以迫使蛋白质离开溶液。通过离心(30分钟、4℃、35000g)收集沉淀的蛋白质,重悬于缓冲液A中并通过离心(30分钟、4℃、35000g)进行最后一次清洁,然后进行固定的金属离子亲和色谱法(IMAC)。合并含有聚合酶蛋白的洗脱级分,并用TEV蛋白酶(在补充有5mM β-巯基乙醇的缓冲液A中)消化。在将消化的蛋白质样品透析回缓冲液A后,将其再次通过IMAC柱,以除去杂质、未裂解的聚合酶蛋白以及切断的多聚组氨酸标签。将样品稀释至 250mM NaCl的盐浓度,然后将其加载到肝素柱(HiPrep Heparin HP,GE Healthcare)上。首先用缓冲液B(50mM HEPES pH7.5、5%(体积/体积)甘油、2mM TCEP、150mM NaCl)洗涤柱子,然后通过1M NaCl的盐梯度稳定水平洗脱蛋白质。将单体无RNA聚合酶浓缩至约9mg/ml,快速冷冻并在-80℃下储存。
实施例10:结晶
H7N9核心通常在0.1M Tris pH 7.0、8%至13%PEG 8K、0.2M MgCl2、0.1M 盐酸胍的条件下于4天至5天内结晶;在4℃下滴加比为1∶2至1∶3(蛋白质∶孔)。晶体具有空间群P212121(其中晶胞尺寸a为约76.5、b为约144.1、c为约336.2),其中在不对称单元中具有两个复合物。加入超过蛋白质1.1的5′vRNA(SEQ ID NO:45,5′-pAGUAGUAACAAG)用于共结晶实验。将模拟人RNA聚合酶II 的蛋白质RPB1的C末端结构域(CTD)的Ser5磷酸化肽(含有4个CTD七肽 Tyr-Ser-Pro-Thr-SerP-Pro-Ser的28mer)以约2mM的浓度浸于现有的晶体中约24小时。将晶体在补充有25%甘油的孔溶液中快速冷冻以用于在欧洲同步辐射光源的光束线处收集数据。
结论
该结构显示CTD肽结合在PA的位点2中,正如在蝙蝠聚合酶结构中观察到的那样,其中关键的碱性残基Lys289和Arg454与磷酸丝氨酸的磷酸相互作用(图13、图14)。然而,在位点1中未观察到结合,这可以通过影响肽结合的晶体堆积、或者通过所观察到的由于PB2中的截短而引起的PA位点1(图13) 中的变形来解释。后者与先前的报道一致,即完全异源三聚体是完整CTD结合所必需的。
这些结果证实,CTD结合位点2在蝙蝠甲型流感病毒聚合酶与禽/人甲型流感病毒聚合酶之间是完全保守的,正如序列保守所预测的。此外,H7N9核心聚合酶构建体的高产量使其可用于进一步研究CTD结合亲和力和特异性,以及对仅在位点2中抑制CTD结合的化合物进行的虚拟和生物化学筛选。

Claims (15)

1.一种通过计算机鉴别降低或阻止来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体与其配体(特别是与细胞Pol II,特别是与CTD)结合的化合物的方法,其包括以下步骤
(a)基于病毒RNA依赖性RNA聚合酶与其配体的结合位点的结构坐标构建计算机模型;
(b)通过选自以下的方法来选择潜在的调节化合物:
(iv)修饰结合位点内的共结晶配体,
(v)基于共结晶配体与病毒RNA依赖性RNA聚合酶的结合位点的相互作用特征,和/或基于与共结晶配体的3D相似性,从小分子数据库中过滤并选择化合物,和
(vi)基于共结晶配体与病毒RNA依赖性RNA聚合酶的结合位点的相互作用特征和/或基于与共结晶配体的3D相似性,重新进行所述化合物的配体设计;
(c)采用计算手段在所述化合物和所述结合位点的计算机模型之间执行拟合程序操作,以便提供所述化合物在活性位点的能量最小化构型;和/或采用计算对接方法将所述化合物定位并置于所述结合位点中,以便提供化学实体的合理3D排列,即所述化合物的合理3D排列;和
(d)评估所述拟合操作的结果并任选地评估所述对接方法的结果,以量化所述化合物与结合位点模型之间的缔合,从而评估所述化合物与所述结合位点缔合的能力。
2.根据权利要求1所述的方法,其中所述结合位点包括甲型流感病毒的RNA依赖性RNA聚合酶PA亚基(SEQ ID NO:1)的氨基酸K630、R633、和E444;包括SEQ ID NO:44的氨基酸K635、R638、和E449;或包括乙型流感病毒的RNA依赖性RNA聚合酶PA亚基(SEQ ID NO:2)的氨基酸E445、K631、和R634,或包括占据与其比对的PA亚基序列中类似位置的的氨基酸。
3.根据权利要求2所述的方法,其中甲型流感病毒的RNA依赖性RNA聚合酶PA亚基的结合位点还包括SEQ ID NO:1的氨基酸K289、R449、和E452,任选还包括氨基酸F440和F607,并且任选地还包括一个或多于一个选自SEQ ID NO:1的M288、L290、S291、T313、F314、I545、M543、和K554的氨基酸,任选地还包括SEQ ID NO:1的氨基酸G629,或其中甲型流感病毒的RNA依赖性RNA聚合酶PA亚基的结合位点还包括SEQ ID NO:44的氨基酸K289、R454、和E457,任选地还包括氨基酸Y44和F612,和任选地还包括一个或多于一个选自SEQ ID NO:44的L288、L290、S291、T313、F314、L550、M548、和R559的氨基酸,任选地还包括SEQ ID NO:44的氨基酸G634,或其中乙型流感病毒的RNA依赖性RNA聚合酶PA亚基的结合位点还包括SEQ IDNO:2的氨基酸Y441和F604,和任选地还包括SEQ ID NO:2的氨基酸G630。
4.根据权利要求1至2中任一项所述的方法,其中所述结合位点包括SEQ ID NO:1的258位至713位氨基酸,包括SEQ ID NO:44的201位至716位氨基酸,或包括SEQ ID NO:2的258位至722位氨基酸。
5.根据权利要求1至4中任一项所述的方法,其中所述计算机模型基于如图11或图12所示的结构坐标。
6.一种产生降低或阻止来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体与其配体(优选与细胞Pol II,更优选与CTD)结合的化合物的方法,其包括以下步骤
(a)通过权利要求1至5中任一项所述的方法鉴别所述化合物,和
(b)合成所述化合物并任选地将所述化合物或其药学上可接受的盐与一种或多于一种药学上可接受的赋形剂和/或载体调配,并任选地
(c)使所述化合物与来自正黏病毒科的病毒RNA依赖性RNA聚合酶接触,和
(d)确定所述化合物阻止病毒RNA依赖性RNA聚合酶与其配体结合,优选与CTD结合的能力。
7.根据权利要求1至6中任一项所述的方法,其中所述测试化合物是小分子或肽或蛋白质。
8.一种通过权利要求1至7中任一项所述的方法能够鉴别和/或产生的化合物,其中所述化合物能够降低或阻止病毒RNA依赖性RNA聚合酶或其变体与其配体的结合。
9.一种针对来自正黏病毒科的病毒RNA依赖性RNA聚合酶或其变体与其配体的结合位点的抗体。
10.一种编码权利要求9所述的抗体的核酸。
11.一种包含权利要求10所述的核酸的载体。
12.一种重组宿主细胞,其包含权利要求10的经分离的核酸或权利要求11所述的重组载体。
13.一种根据权利要求6至7所述的方法能够制备的药物组合物。
14.一种药物组合物,其包含权利要求8所述的化合物、权利要求9所述的抗体、权利要求10所述的核酸、权利要求11所述的载体、或权利要求12所述的重组宿主细胞。
15.根据权利要求8所述的化合物、根据权利要求9所述的抗体、根据权利要求10所述的核酸、根据权利要求11所述的载体、根据权利要求12所述的重组宿主细胞、或根据权利要求13或14所述的药物,其用于治疗、改善或预防由正黏病毒科病毒的病毒感染引起的疾病状况。
CN201780042151.5A 2016-07-07 2017-07-07 结合细胞Pol Ⅱ C末端结构域(CTD)的病毒多肽片段及其用途 Pending CN109477081A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP16178396.4 2016-07-07
EP16178396 2016-07-07
PCT/EP2017/067144 WO2018007615A1 (en) 2016-07-07 2017-07-07 Viral polypeptide fragments that bind cellular pol ii c-terminal domain (ctd) and their uses

Publications (1)

Publication Number Publication Date
CN109477081A true CN109477081A (zh) 2019-03-15

Family

ID=56403977

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780042151.5A Pending CN109477081A (zh) 2016-07-07 2017-07-07 结合细胞Pol Ⅱ C末端结构域(CTD)的病毒多肽片段及其用途

Country Status (7)

Country Link
US (1) US20190252037A1 (zh)
EP (1) EP3481946A1 (zh)
JP (1) JP2019528508A (zh)
CN (1) CN109477081A (zh)
AU (1) AU2017294090A1 (zh)
CA (1) CA3029784A1 (zh)
WO (1) WO2018007615A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109769258B (zh) * 2019-03-05 2020-01-31 深圳大学 基于安全urllc通信协议的资源优化方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101514335A (zh) * 2008-02-22 2009-08-26 中国科学院生物物理研究所 流感病毒聚合酶亚基pa的表达纯化及pa氨基端及pa羧基端与pb1氨基端多肽复合体的晶体结构
US20110104710A1 (en) * 2008-07-02 2011-05-05 Kyosuke Nagata Construction of expression system for rna polymerase derived from influenza virus, crystallization of the rna polymerase, and screening method for anti-influenza agent
CN102439028A (zh) * 2009-05-08 2012-05-02 派克制药有限公司 A型和b型流感病毒复制抑制肽
CN102449144A (zh) * 2008-12-19 2012-05-09 欧洲分子生物学实验室 包含内切核酸酶活性的多肽片段及其用途

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4458066A (en) 1980-02-29 1984-07-03 University Patents, Inc. Process for preparing polynucleotides
US20050106667A1 (en) 2003-08-01 2005-05-19 Genentech, Inc Binding polypeptides with restricted diversity sequences

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101514335A (zh) * 2008-02-22 2009-08-26 中国科学院生物物理研究所 流感病毒聚合酶亚基pa的表达纯化及pa氨基端及pa羧基端与pb1氨基端多肽复合体的晶体结构
US20110104710A1 (en) * 2008-07-02 2011-05-05 Kyosuke Nagata Construction of expression system for rna polymerase derived from influenza virus, crystallization of the rna polymerase, and screening method for anti-influenza agent
CN102449144A (zh) * 2008-12-19 2012-05-09 欧洲分子生物学实验室 包含内切核酸酶活性的多肽片段及其用途
CN102439028A (zh) * 2009-05-08 2012-05-02 派克制药有限公司 A型和b型流感病毒复制抑制肽

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MÓNICA MARTÍNEZ-ALONSO等: "RNA-Free and Ribonucleoprotein-Associated Influenza Virus Polymerases Directly Bind the Serine-5-Phosphorylated Carboxyl- Terminal Domain of Host RNA Polymerase II", 《JOURNAL OF VIROLOGY》 *
OTHMAR G. ENGELHARDT等: ""Association of the Influenza A Virus RNA-Dependent RNA Polymerase with Cellular RNA Polymerase II"", 《JOURNAL OF VIROLOGY》 *

Also Published As

Publication number Publication date
JP2019528508A (ja) 2019-10-10
CA3029784A1 (en) 2018-01-11
EP3481946A1 (en) 2019-05-15
AU2017294090A1 (en) 2019-01-03
WO2018007615A1 (en) 2018-01-11
US20190252037A1 (en) 2019-08-15

Similar Documents

Publication Publication Date Title
Wu et al. Structural insights into the design of novel anti-influenza therapies
Ekiert et al. Cross-neutralization of influenza A viruses mediated by a single antibody loop
Willensky et al. Crystal structure of glycoprotein C from a hantavirus in the post-fusion conformation
Hong et al. Antibody recognition of the pandemic H1N1 Influenza virus hemagglutinin receptor binding site
CN103906763B (zh) 能够中和系统发育群1和系统发育群2的a型流感病毒以及b型流感病毒的人结合分子
Xu et al. A recurring motif for antibody recognition of the receptor-binding site of influenza hemagglutinin
Ekiert et al. A highly conserved neutralizing epitope on group 2 influenza A viruses
Thornburg et al. H7N9 influenza virus neutralizing antibodies that possess few somatic mutations
ES2831802T3 (es) Composición que comprende al menos dos moléculas de unión neutralizantes del virus influenza A
Hellert et al. Orthobunyavirus spike architecture and recognition by neutralizing antibodies
Huang et al. Structure–function analysis of neutralizing antibodies to H7N9 influenza from naturally infected humans
JP6707455B2 (ja) 新規フルスペクトル抗デング抗体
CN101970465A (zh) 能够结合rna帽的流感病毒pb2蛋白可溶性片段
Lu et al. A multivalent and thermostable nanobody neutralizing SARS-CoV-2 omicron (B. 1.1. 529)
CN102449144B (zh) 包含内切核酸酶活性的多肽片段及其用途
CN107540737A (zh) 用于促进内体及溶酶体生物降解的碳氢订书肽
Frey et al. Nanovaccines Displaying the Influenza Virus Hemagglutinin in an Inverted Orientation Elicit an Enhanced Stalk‐Directed Antibody Response
Tzarum et al. Unique structural features of influenza virus H15 hemagglutinin
Pascha et al. Inhibition of H1 and H5 Influenza A Virus Entry by Diverse Macrocyclic Peptides Targeting the Hemagglutinin Stem Region
Kim et al. Development of antibody against drug-resistant respiratory syncytial virus: rapid detection of mutant virus using split superfolder green fluorescent protein-antibody system
CN109477081A (zh) 结合细胞Pol Ⅱ C末端结构域(CTD)的病毒多肽片段及其用途
CN102803288B (zh) 来自甲型流感2009大流行h1n1病毒的rna依赖性rna聚合酶的pa亚基片段及其用途
WO2020232426A1 (en) Peptide vaccine based on a new universal influenza a hemagglutinin head domain epitope and human monoclonal antibodies binding thereto
Wu et al. Biochemical and structural characterization of the interface mediating interaction between the influenza A virus non-structural protein-1 and a monoclonal antibody
Branfield Structural and biochemical analysis of protein/RNA interactions during the initiation of dengue virus genome replication

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190315

WD01 Invention patent application deemed withdrawn after publication