CN114008195A - 控制rna病毒复制和基因表达的新机制 - Google Patents
控制rna病毒复制和基因表达的新机制 Download PDFInfo
- Publication number
- CN114008195A CN114008195A CN202080044249.6A CN202080044249A CN114008195A CN 114008195 A CN114008195 A CN 114008195A CN 202080044249 A CN202080044249 A CN 202080044249A CN 114008195 A CN114008195 A CN 114008195A
- Authority
- CN
- China
- Prior art keywords
- protease
- protein
- virus
- replication
- vsv
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N7/00—Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/81—Protease inhibitors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y304/00—Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
- C12Y304/23—Aspartic endopeptidases (3.4.23)
- C12Y304/23016—HIV-1 retropepsin (3.4.23.16)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/00032—Use of virus as therapeutic agent, other than vaccine, e.g. as cytolytic agent
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/20011—Rhabdoviridae
- C12N2760/20211—Vesiculovirus, e.g. vesicular stomatitis Indiana virus
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/20011—Rhabdoviridae
- C12N2760/20211—Vesiculovirus, e.g. vesicular stomatitis Indiana virus
- C12N2760/20221—Viruses as such, e.g. new isolates, mutants or their genomic sequences
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/20011—Rhabdoviridae
- C12N2760/20211—Vesiculovirus, e.g. vesicular stomatitis Indiana virus
- C12N2760/20222—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/20011—Rhabdoviridae
- C12N2760/20211—Vesiculovirus, e.g. vesicular stomatitis Indiana virus
- C12N2760/20232—Use of virus as therapeutic agent, other than vaccine, e.g. as cytolytic agent
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/20011—Rhabdoviridae
- C12N2760/20211—Vesiculovirus, e.g. vesicular stomatitis Indiana virus
- C12N2760/20241—Use of virus, viral particle or viral elements as a vector
- C12N2760/20243—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Medicinal Chemistry (AREA)
- Virology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Pharmacology & Pharmacy (AREA)
- Veterinary Medicine (AREA)
- Physics & Mathematics (AREA)
- Public Health (AREA)
- Plant Pathology (AREA)
- Animal Behavior & Ethology (AREA)
- General Chemical & Material Sciences (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Immunology (AREA)
- Mycology (AREA)
- Epidemiology (AREA)
- AIDS & HIV (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本发明涉及使用条件蛋白酶方法控制RNA病毒复制和基因表达的新机制,所述条件蛋白酶方法使用特异性蛋白酶抑制剂进行调节。更具体地,它涉及单链RNA病毒,优选单股反链病毒目单链RNA病毒,其包含编码病毒转录和/或复制所必需的至少一种蛋白质、蛋白酶和所述蛋白酶的切割位点的多核苷酸序列。可以使用蛋白酶抑制剂抑制蛋白酶,因此蛋白酶和所述蛋白酶的切割位点形成可调节的开关。通过将可调节开关的插入位点从病毒转录和/或复制所必需的至少一种蛋白质中的分子内位置改变为分子间位置,蛋白酶抑制剂的效果可以从ON开关变为OFF开关。RNA病毒还可以编码异源蛋白质,然后通过调节病毒活性来调节其表达。ON开关也可用于RNA病毒以直接调节异源蛋白表达。还提供了具有条件病毒活性或异源蛋白表达的所述病毒的体内和体外用途。
Description
技术领域
本发明涉及使用条件蛋白酶方法控制RNA病毒复制和基因表达的新机制,所述条件蛋白酶方法使用蛋白酶特异性抑制剂进行调节。更具体地,涉及单链RNA病毒,优选单股反链病毒目单链RNA病毒,其包含编码病毒转录和/或复制所必需的至少一种蛋白质、蛋白酶和所述蛋白酶的切割位点的多核苷酸序列。可以使用蛋白酶抑制剂抑制蛋白酶,因此蛋白酶和所述蛋白酶的切割位点形成可调节的开关。通过将可调节开关的插入位点从病毒转录和/或复制所必需的至少一种蛋白质中的分子内位置改变为分子间位置,蛋白酶抑制剂的效果可以从ON开关改变为OFF开关。RNA病毒还可以编码异源蛋白质,然后通过调节病毒活性来调节其表达。ON开关也可用于RNA病毒以直接调节异源蛋白表达。还提供了具有条件病毒活性或异源蛋白表达的所述病毒的体内和体外用途。
背景技术
基因改造病毒已显示出作为有效基因治疗载体、用于病毒免疫治疗或作为癌症病毒治疗中的溶瘤病毒的巨大潜力。通常,这三种不同类型的治疗利用基因过表达、使用RNA干扰的基因敲落和自杀基因传递。在治疗环境中,转基因或病毒基因表达的时间控制构成了安全开关和效力刻度盘(potency dial)。虽然DNA病毒活性的修饰剂已经很好地建立,例如可调节的启动子(例如Tet系统),但这些机制不能用于调节大多数RNA病毒(逆转录病毒除外)。
适体酶是一种严格控制RNA病毒的机制((Ketzer et al.,PNAS,2014,111(5):E554-62)。适体酶由响应小化合物(适体)的RNA结构和具有酶活性的RNA(核酶)组成。这种机制被证明能够通过作为其融合蛋白的OFF开关来调节RNA麻疹病毒的传播。然而,病毒转录或复制活动不受控制。在麻疹病毒中,必须将适体酶置于病毒融合蛋白的3'-和5'UTR中以实现对病毒传播的有效抑制,从而使病毒后代减少3个对数数量级。抑制被施加在病毒复制周期的后期阶段,即融合。显然,即使是少量的融合蛋白也足以促进病毒传播。因此,只有通过多步感染试验(0.0001的低MOI)和8天的长观察期才能实现3个对数数量级的减少。在3'-或5'UTR中单独插入适配酶不会显著降低滴度。
遵循不同的方法,麻疹病毒RNA复制的OFF开关控制通过小分子辅助关闭(SMASh)标签显示,该标签通过C端与病毒P蛋白融合(Chung et al..Nature Chemical Biology,2015,11:713-722),从而控制蛋白质降解。
我们试图开发基于条件蛋白水解的可调节系统,其涉及将侧翼为HIV蛋白酶切割位点的小型人类免疫缺陷病毒(HIV)蛋白酶(99个氨基酸)克隆到RNA水泡性口炎病毒(VSV)的基因组的不同基因座作为模型蛋白酶。HIV蛋白酶作为同型二聚体具有活性,并作为天冬氨酰蛋白酶发挥作用。在HIV中,它将从正链基因组翻译的多聚蛋白切割成功能性蛋白质。由于HIV蛋白酶对其病毒复制周期至关重要,因此药物管理机构已经批准了几种蛋白酶抑制剂,并且正在开发新的抑制剂。一种这样的蛋白酶抑制剂是安普那韦(amprenavir),它结合在HIV蛋白酶同源二聚体之间的催化中心,从而降低其功能。
水泡性口炎病毒(VSV)是一种负义单链RNA病毒,是弹状病毒科的典型成员,被广泛用作疫苗载体、溶瘤病毒和追踪工具。尽管VSV广泛用于病毒学基础科学和治疗性病毒的开发,但作为一种RNA病毒的VSV迄今尚未显示出外部可调节性。VSV RNA基因组包括五个病毒基因,其按照从3'到5'的顺序为:核蛋白(N-蛋白),然后是磷蛋白(P-蛋白)、基质蛋白(M-蛋白)、糖蛋白(G-蛋白),最后是聚合酶或大蛋白(L-蛋白)。所有VSV基因都由VSV聚合酶使用3'端(N蛋白上游)的相同进入位点(从该位点开始转录)以顺序方式转录。这些基因散布着基因间区域,所述基因间区域能够从一个RNA基因组转录多种病毒mRNA。第一种病毒蛋白,即N蛋白,覆盖病毒RNA基因组,并与病毒聚合酶复合物相互作用,该复合物由P蛋白和L蛋白形成。M蛋白形成病毒衣壳并通过阻塞核孔来阻碍细胞翻译。G蛋白促进细胞附着和进入,并且其融合特征构成了另一个致病因素。VSV的临床开发受限于实验室动物中显示的潜在神经毒性副作用。
发明内容
我们在这里首次提出了一种调控开关,其在外源应用的临床批准化合物存在的情况下,将RNA病毒的活性置于条件控制之下。通过将开关的插入位点从分子内位置更改为分子间位置,我们可以将化合物的效果从ON开关转换为OFF开关。这些调控元件为目前考虑在肿瘤学和疫苗接种领域开发作为治疗性病毒的RNA病毒提供了新的安全措施。此外,在治疗期间病毒脱落的情况下,依赖于所应用药物的存在提供了环境安全屏障。对于ON开关,将具有自催化活性的蛋白酶(例如HIV蛋白酶)插入必需蛋白质(如原型负链RNA病毒(如VSV)的P-蛋白和/或L-蛋白)的分子内插入位点,即开放阅读框。添加蛋白酶特异性抑制剂,例如HIV蛋白酶抑制剂,可阻止这些必需病毒蛋白的切割,并且可以继续病毒聚合酶活性。我们还确定了L蛋白中的一个新插入位点,其只会轻微影响病毒复制。对于OFF开关,具有自催化活性的蛋白酶被插入分子间插入位点并与必需蛋白质融合,从而产生无功能的融合蛋白质。自体蛋白水解释放功能性必需蛋白,例如原型负链RNA 病毒VSV的L蛋白。添加特定的蛋白酶抑制剂,例如HIV蛋白酶抑制剂,可防止功能失调的多蛋白的切割,从而阻断病毒聚合酶活性。
在一方面,提供了一种单链RNA病毒,其包括修饰的病毒基因组,所述基因组包括编码病毒转录和/或复制所必需的至少一种蛋白质、蛋白酶和所述蛋白酶的切割位点的多核苷酸序列,其中(a)病毒转录和/或复制所必需的至少一种蛋白质包含在分子内插入位点处的插入物,该插入位点至少包含所述蛋白酶的切割位点,并且任选地还包含所述蛋白酶;或(b)病毒转录和/或复制所必需的至少一种蛋白质被编码为融合蛋白,所述融合蛋白包含融合到N-末端或C-末端、由所述蛋白酶的切割位点分隔的蛋白酶。任选地,所述病毒还可以编码异源蛋白质。在替代方案(a)中,本文也称为ON-开关,蛋白酶在分子内插入位点处的所述蛋白酶的切割位点处切割病毒转录和/或复制所必需的至少一种蛋白质。在替代方案(b)中,本文也称为OFF-开关,蛋白酶在位于编码为融合蛋白的至少一种病毒转录和/或复制所必需的蛋白质的N-末端或C-末端的所述蛋白酶的切割位点切割,以释放病毒转录和/或复制所必需的至少一种蛋白质。在替代方案(b)的一个实施方案中,融合蛋白不包含SEQ IDNO:30的氨基酸序列。蛋白酶可以是任何蛋白酶,只要它可以被蛋白酶抑制剂抑制。
在一个实施方案中,病毒转录和/或复制所必需的至少一种蛋白质是依赖于RNA的RNA聚合酶或聚合酶复合物的蛋白质,其包含依赖于RNA的RNA聚合酶或核衣壳,优选选自由聚合酶辅助因子(如P-蛋白或其功能等价物)、聚合酶(如L-蛋白)和核衣壳(如N-蛋白)组成的组。
优选地,单链RNA病毒是负义单链RNA病毒,更优选地是单股反链病毒目负义单链RNA病毒。在某些实施方案中,单链RNA病毒是选自由弹状病毒科、副粘病毒科、丝状病毒科(Filoviridae)、尼亚米病毒科(Nyamiviridae)、肺病毒科和玻那病毒科(Bornaviridae)组成的组的病毒。优选地,单链RNA病毒是副粘病毒科病毒,优选麻疹麻疹病毒(MeV)或弹状病毒科病毒,优选水泡病毒属病毒,最优选水泡性口炎病毒(VSV)。在一个实施方案中,病毒是溶瘤病毒,优选地,所述溶瘤病毒是VSV。在甚至更优选的实施方案中,水疱病毒是具有淋巴细胞脉络丛脑膜炎病毒(LCMV)的糖蛋白GP,优选具有毒株WE-HPI的水疱性口炎病毒。这种VSV例如在WO2010/040526中描述并命名为VSV-GP。
在一个实施方案中,所述单链RNA病毒是单股反链病毒目负义单链RNA病毒,并且病毒转录和/或复制所必需的至少一种蛋白质选自由聚合酶辅因子、聚合酶和核衣壳组成的组,优选地,其中病毒转录和/或复制所必需的至少一种蛋白质是(a)聚合酶辅因子,优选P-蛋白或其功能等同物;(b)聚合酶,优选L-蛋白;和/或(c)它们的组合。
根据本发明使用的蛋白酶调节病毒转录和/或复制所必需的至少一种蛋白质的活性。因此,它还调节病毒转录和/或复制。在一个实施方案中,蛋白酶是自催化蛋白酶。在另一个实施方案中或另外,蛋白酶是病毒蛋白酶,优选蛋白酶来自HCV或HIV。在另一个实施方案中,蛋白酶是HIV-1蛋白酶,优选HIV-1蛋白酶的单链二聚体。合适的HIV-1蛋白酶抑制剂为,但不限于,茚地那韦、沙奎那韦、利托那韦、奈非那韦、洛匹那韦、安普那韦、福沙那韦、阿扎那韦、替拉那韦或达芦那韦。
在分子内插入位点具有插入物的实施方案中(ON-开关),病毒转录和/或复制所必需的至少一种蛋白质的分子内插入位点处的插入物不影响或基本上不影响病毒转录和/或复制所必需的至少一种蛋白质的活性。
在某些实施方案中,至少所述蛋白酶的切割位点位于并且任选地所述蛋白酶也位于病毒转录和/或复制所必需的至少一种蛋白质的分子内插入位点内,并且蛋白质的蛋白水解切割在分子内插入位点内的所述蛋白酶的切割位点处切割病毒转录和/或复制所必需的至少一种蛋白质。分子内插入位点内的切割使病毒转录和/或复制所必需的至少一种蛋白质失活。病毒转录和/或复制所必需的至少一种蛋白质在分子内插入位点内的进一步切割抑制病毒转录和/或复制。因此,病毒在蛋白酶的特异性抑制剂存在时是有活性的,而在蛋白酶的特异性抑制剂不存在时则是无活性的。病毒还可编码至少一种异源蛋白质,其中如果病毒在蛋白酶的特异性抑制剂存在下是有活性的,则异源蛋白质被表达,而如果病毒在蛋白酶的特异性抑制剂不存在时是无活性的,则异源蛋白质不表达。
在另一实施方案中,单链RNA病毒是水泡性口炎病毒(VSV)并且病毒转录和/或复制所必需的至少一种蛋白质是P-蛋白和/或L-蛋白。P-蛋白中合适的分子内插入位点的一个例子是,但不限于,VSV P-蛋白的柔性铰链区,其优选在对应于VSVi P蛋白(例如SEQ IDNO:27的氨基酸序列)的氨基酸位置193-199的位置,更优选氨基酸位置196的位置。在一个实施方案中,VSV P-蛋白来自VSV Indiana(VSVi),并且P-蛋白中的分子内插入位点是VSVP-蛋白的柔性铰链区,其优选在VSVi P蛋白(例如SEQ ID NO:27的氨基酸序列)的氨基酸位置193-199,更优选氨基酸位置196。L-蛋白中合适的分子内插入的一个例子是,但不限于,在L蛋白的甲基转移酶(MT)结构域的环中,其对应于VSVi L-蛋白(例如SEQ ID NO:28的氨基酸序列)的氨基酸1614-1634,优选对应于氨基酸1616-1625,并且更优选对应于氨基酸1620。在一个实施方案中,VSV-L蛋白来自VSV Indiana(VSVi),并且L-蛋白中的分子内插入位点位于L-蛋白甲基转移酶(MT)结构域的环中,其在VSVi L-蛋白(例如SEQ ID NO:28的氨基酸序列)的氨基酸1614-1634,优选在氨基酸1614-1629,更优选在氨基酸1616-1625,甚至更优选在氨基酸1620。在一个实施方案中,水泡性口炎病毒(VSV)和病毒转录和/或复制所必需的至少一种蛋白质是在如上所述的分子内插入位点具有插入物的P-蛋白质和L-蛋白质。
在分子间插入位点具有插入物的替代方案(OFF开关)中,病毒转录和/或复制所必需的至少一种蛋白质被编码为融合蛋白,其包含融合到病毒转录和/或复制所必需的至少一种蛋白质的N-末端或C-末端、由所述蛋白酶的切割位点分隔的蛋白酶。在某些实施方案中,融合蛋白的蛋白水解切割以活性形式释放病毒转录和/或复制所必需的至少一种蛋白质。融合蛋白中的病毒转录和/或复制所必需的至少一种蛋白质在没有蛋白水解切割的情况下是无活性的,所述融合蛋白包含融合到病毒转录和/或复制所必需的至少一种蛋白质的N-末端或C-末端、由所述蛋白酶的切割位点分隔的蛋白酶。可以使用蛋白酶的特异性抑制剂来抑制融合蛋白的蛋白水解切割。因此,病毒在蛋白酶的特异性蛋白酶抑制剂存在时是无活性的,而在蛋白酶的特异性抑制剂不存在时是有活性的。病毒还可编码至少一种异源蛋白质,其中如果病毒在蛋白酶的特异性抑制剂存在下是无活性的,则异源蛋白质被不表达,而如果病毒在蛋白酶的特异性抑制剂不存在时是有活性的,则异源蛋白质表达。融合蛋白还可包含与蛋白酶的另一端融合的另外的病毒蛋白,所述蛋白酶与病毒转录和/或复制所必需的至少一种蛋白质的N-末端或C-末端融合,其中所述另外的病毒蛋白和所述蛋白酶也被所述蛋白酶的切割位点分隔。在一个实施方案中,蛋白酶的任一侧是所述蛋白酶的切割位点,并代替了连接病毒转录和/或复制所必需的至少一种蛋白质与另外的病毒蛋白的基因间区域。因此,蛋白酶的丧失导致包含病毒转录和/或复制所必需的蛋白质和另外的病毒蛋白质的进一步失活的融合蛋白。融合蛋白还可包含与蛋白酶的另一端融合的异源蛋白,所述蛋白酶与病毒转录和/或复制所必需的至少一种蛋白质的N-末端或C-末端融合,其中所述异源蛋白和所述蛋白酶被所述蛋白酶的切割位点分隔。在一个实施方案中,蛋白酶的任一侧是所述蛋白酶的切割位点,并用异源蛋白代替连接病毒转录和/或复制所必需的至少一种蛋白质的基因间区域。因此,蛋白酶的丧失导致包含病毒转录和/或复制所必需的蛋白质和异源蛋白质的进一步失活的融合蛋白。融合蛋白还可包含接头,其在蛋白酶和病毒转录和/或复制所必需的至少一种蛋白质之间,或者,如果适用,在蛋白酶和另外的病毒蛋白或异源蛋白之间。所述接头可将蛋白酶与切割位点或将切割位点与病毒转录和/或复制所必需的至少一种蛋白质分隔;和/或将蛋白酶与另外的病毒蛋白或异源蛋白分隔。
在该替代方案(OFF开关)的优选实施方案中,单链RNA病毒是单股反链病毒目负义单链RNA病毒,并且病毒转录和/或复制所必需的至少一种蛋白质是L-蛋白质。在该替代方案(OFF开关)的另一优选实施方案中,融合蛋白中的病毒转录和/或复制所必需的至少一种蛋白质在无活性的,所述融合蛋白包含融合到病毒转录和/或复制所必需的至少一种蛋白质的N-末端、由所述蛋白酶的切割位点分隔的蛋白酶。在该替代方案(OFF开关)的另一实施方案中,单链RNA病毒是单股反链病毒目负义单链RNA病毒,并且病毒转录和/或复制所必需的至少一种蛋白质是L蛋白,其中融合蛋白包含融合到L蛋白N末端、由所述蛋白酶的切割位点分隔的蛋白酶。
在另一方面,本发明涉及一种RNA病毒,其包括所述病毒的修饰基因组,所述基因组包括编码至少一种异源蛋白质、蛋白酶和所述蛋白酶的切割位点的多核苷酸序列,其中所述至少一种异源蛋白质在分子内插入位点包含插入物,该插入位点至少包含所述蛋白酶的切割位点,并且任选地还包含所述蛋白酶。病毒可以是溶瘤病毒,其中所述溶瘤病毒优选为VSV。
异源蛋白质可以是治疗性蛋白质、报道分子或肿瘤抗原。
在另一方面,本发明涉及用于治疗,特别是用于治疗癌症的根据本发明的RNA病毒。癌症可以是实体瘤,优选地选自由以下组成的组:结肠癌、前列腺癌、乳腺癌、肺癌、NSCLC、皮肤癌、肝癌、骨癌、卵巢癌、胰腺癌、脑癌、头颈癌、HNSCC、淋巴瘤(霍奇金和非霍奇金淋巴瘤)、脑癌、神经母细胞瘤、间皮瘤、威尔姆瘤、视网膜母细胞瘤和肉瘤。
在另一方面,本发明涉及重组VSV L蛋白,其包含在L-蛋白的甲基转移酶结构域的环中的插入物,其对应于VSVi L-蛋白(例如SEQ ID NO:28的氨基酸序列)的氨基酸1614-1634,优选对应于氨基酸1614-1629,更优选对应于氨基酸1616-1625,并且更优选对应于氨基酸1620。插入物可包含报告蛋白(例如荧光素酶或荧光蛋白)或替代地蛋白酶切割位点或蛋白酶和所述蛋白酶的切割位点。如果插入物包含蛋白酶切割位点或蛋白酶和所述蛋白酶的切割位点,蛋白酶可以是病毒蛋白酶和/或自催化蛋白酶。优选地,蛋白酶来自HCV或HIV。在一个实施方案中,蛋白酶是HIV-1蛋白酶,优选HIV-1蛋白酶的单链二聚体。合适的HIV-1蛋白酶抑制剂为,但不限于,茚地那韦、沙奎那韦、利托那韦、奈非那韦、洛匹那韦、安普那韦、福沙那韦、阿扎那韦、替拉那韦或达芦那韦。在某些实施方案中,L-蛋白可包含二级突变。还提供了包含根据本发明的重组VSV L-蛋白的水疱性口炎病毒(VSV)。
本发明还提供了一种控制RNA病毒复制的方法,其包括(a)用根据本发明的RNA病毒转导或转染宿主细胞,或者在分子内插入位点具有插入物(ON-开关),和(b)在存在或不存在对所述蛋白酶特异的蛋白酶抑制剂的情况下维持宿主细胞,其中所述蛋白酶抑制剂的添加允许病毒转录和/或复制,并且所述蛋白酶抑制剂的不存在抑制病毒转录和复制。
本发明还提供了一种控制RNA病毒复制的方法,其包括(a)用根据本发明的RNA病毒转导或转染宿主细胞,或者在分子间插入位点具有插入物(OFF-开关),和(b)在存在或不存在对所述蛋白酶特异的蛋白酶抑制剂的情况下维持宿主细胞,其中所述蛋白酶抑制剂的添加抑制病毒转录和/或复制,并且所述蛋白酶抑制剂的不存在允许病毒转录和复制。
本发明还提供了一种控制通过RNA病毒表达异源蛋白的方法,其包括(a)用根据本发明的RNA病毒转导或转染宿主细胞,或者其中至少一种异源蛋白质在分子内插入位点包含插入物,该插入位点至少包含所述蛋白酶的切割位点,并且任选地还包含所述蛋白酶;和(b)在存在或不存在对所述蛋白酶特异的蛋白酶抑制剂的情况下维持宿主细胞,其中所述蛋白酶抑制剂的添加允许异源蛋白质表达,并且所述蛋白酶抑制剂的不存在抑制异源蛋白质表达。根据本发明方法中的蛋白质可以是自催化蛋白酶,优选地,所述自催化蛋白酶是HIV-1蛋白酶,更优选所述HIV-1蛋白酶的单链二聚体。合适的HIV-1蛋白酶抑制剂为,但不限于,茚地那韦、沙奎那韦、利托那韦、奈非那韦、洛匹那韦、安普那韦、福沙那韦、阿扎那韦、替拉那韦或达芦那韦。
附图说明
图1:VSV-prot-ON系统的原理。A)HIV蛋白酶二聚体构建体被插入到形成聚合酶复合物的两种VSV蛋白中,即P-蛋白和L-蛋白。HIV蛋白酶作为二聚体起作用。为了确保HIV蛋白酶作为VSV P蛋白和聚合酶(L蛋白)的开放阅读框的一部分的功能,我们使用了先验连接(priori linked)的蛋白酶二聚体。这样,除非存在蛋白酶抑制剂,否则P-蛋白已经包含功能性蛋白酶二聚体,该蛋白酶二聚体在翻译时具有自催化活性并切割P-蛋白。B)HIV蛋白酶二聚体的蛋白带结构。HIV蛋白酶作为二聚体起作用。为了确保HIV蛋白酶作为VSV磷蛋白和聚合酶的开放阅读框的一部分的功能,我们使用了先验连接的蛋白酶二聚体(蛋白质带结构底部的深灰色环)。
图2:A)aa196(P-196PR2)表达质粒中连接二聚体蛋白酶的结构。B)P-196PR2的构建体结构。通过GeneArt合成了在位置aa196具有连接的二聚体蛋白酶d P-蛋白(P-196PR2)的cDNA序列,和侧翼序列,即VSV核蛋白(N蛋白)和基质蛋白(M蛋白)。连接的蛋白酶二聚体侧面是氨基酸序列(GGSG)3组成的柔性接头。这种分隔确保了对具有P-和L-蛋白三级结构的分子内插入蛋白的干扰最小。在第一蛋白酶之前和第二蛋白酶之后,定位蛋白酶切割序列。两种蛋白酶通过二聚体接头序列连接。
图3:反式供应的VSV P蛋白对补充VSV-ΔP病毒的蛋白酶相关调节。磷蛋白-蛋白酶构建体的功能首先用其中P-196PR2被克隆的P表达质粒进行测试(P-prot)。BHK细胞用这种P-prot构建体转染,并用VSV-ΔP变体感染。VSV-ΔP配备红色荧光蛋白作为报告基因。对于VSV-ΔP的功能,工作P-蛋白是必需的,它是由表达P-Prot的细胞反式提供的。所显示的是转染后指定时间点的转染细胞的代表性照片:A(1-3):没有用安普那韦处理,B(1-3):用1μM安普那韦处理,C(1-3):使用正常P表达质粒的阳性对照。
图4:具有全长VSV-P-prot序列的质粒结构。B:在位置aa196具有连接的二聚体蛋白酶的磷蛋白(P-蛋白)(P-196PR2)的构建体结构VSV Indiana GFP中的P蛋白基因被P-196PR2取代。VSV基因组第5位(G和L蛋白之间)的增强型GFP(eGFP)用作标记基因。
图5:具有HIV蛋白酶二聚体插入物构建体的VSV P-蛋白的示意图,和HIV蛋白酶二聚体插入物的氨基酸序列(SEQ ID NO:29),包括蛋白酶切割序列和柔性接头。连接的蛋白酶二聚体侧面是氨基酸序列(GGSG)3组成的柔性接头。在第一蛋白酶之前和第二蛋白酶之后,定位蛋白酶切割序列。两种蛋白酶通过接头序列连接。
图6:蛋白酶抑制剂安普那韦调节表达蛋白酶开关的VSV-P-prot的活性。A:为了测试VSV-P-prot的基因组完整性,将病毒基因组RNA纯化、逆转录,并对P196PR2进行PCR。将没有蛋白酶插入的VSV变体用作阴性对照。在凝胶的第1行和第4行中使用了标记,第2行显示了VSV对照的PCR产物,第3行显示了VSV-P-Prot的PCR产物。我们发现P196PR2和蛋白酶阴性P蛋白PCR片段的大小符合预期(具有蛋白酶的P蛋白的预期大小:1490bp;没有蛋白酶的P蛋白的预期大小:773bp;VSV-P-Prot原液滴度:1.8x107)。随后对PCR产物进行测序。B:在生成全长VSV-P-Prot后,通过在存在和不存在10μM安普那韦(APV)的情况下感染BHK细胞来测试其功能。在APV存在下,通过eGFP的表达(左手行)和标准细胞培养皿中的细胞病变效应(右手行)可以看到病毒活性。C:使用或不使用APV的VSV-P-Prot噬菌斑试验。在存在APV的情况下,细胞病变效应在噬菌斑试验中是可见的。如果不使用APV,则无法观察到eGFP信号和细胞病变效应。用两个Sanger测序反应对插入位点进行测序以评估在具有SEQ ID NO:4的原始DNA序列的蛋白酶二聚体序列中是否发生突变,原始DNA序列显示该蛋白酶二聚体序列中没有突变。
图7:VSV-P-prot活性可以通过各种HIV蛋白酶抑制剂进行调节。我们测试了VSV-P-prot是否可以用第二代蛋白酶抑制剂(如沙奎那韦和茚地那韦)复制。报告基因eGFP的荧光信号(A:左手图片)、细胞病变效应(A:右手图片)和噬菌斑形成(B)证实了VSV-P-prot与沙奎那韦(SQV)和茚地那韦(IND)的功能。
图8:蛋白酶抑制剂安普那韦以剂量依赖性方式调节VSV-P-Prot活性。HIV蛋白酶抑制剂安普那韦对VSV-P-prot病毒活性的剂量反应。感染BHK细胞,MOI为1,并在24小时后评估病毒传播。A:病毒eGFP表达和细胞病变效应随着APV剂量的增加而增加。B:VSV-P-prot复制开始于100nM的安普那韦剂量,在3至100μM之间的剂量范围内达到最大活性的稳定期(plateau),并在更高的剂量下恶化。复制曲线显示VSV-P-prot比VSV略有衰减。
图9:消除VSV-P-prot的神经毒性。A:颅内滴注基于野生型的VSV-dsRed(2x105TCID50in 2μl)导致神经毒性的严重迹象。使用有或没有安普那韦的VSV-P-prot均未观察到神经毒性。B:显示出于人道原因不得不在4天内被处死的注射VSV-dsRed的小鼠的生存图。C:体重图表显示注射VSV-dsRed的小鼠体重严重下降。D:冠状脑切片的组织学荧光分析揭示了表达红色荧光的VSV-dsRed的扩展扩散。在整个纹状体、皮层下区域和下丘脑(双侧)发现病毒感染。相比之下,使用或不使用安普那韦的VSV-P-Prot的GFP表达被高度限制在注射针道的紧贴层(immediate lining),没有任何颅内扩散的迹象。
图10:在多次病毒传代后,VSV-P-Prot的蛋白酶调节活性保持稳定。病毒以次优APV浓度传代20次;每次传代都转移到不含蛋白酶抑制剂的细胞中以检测逃逸突变体。A:BHK细胞接种有和没有APV的传代VSV-P-Prot。B:传代后,病毒基因组RNA被分离并逆转录。对插入区域进行PCR,随后对PCR进行测序。我们发现P196PR2和蛋白酶阴性P-蛋白PCR片段的大小符合预期(具有P-蛋白的预期大小:1490bp;没有P-蛋白的预期大小:773bp)。
图11:VSV L蛋白中的结构域组织、结构和插入位点。A:示意性VSV基因组组织显示了3′到5′方向的基因和VSV L蛋白结构域图,其相应的结构域边界在上排标有数字(Lianget al.,Cell,2015,162(2):314-327)。CD1506、CD1537、MT1603、MT1620和MT1889表示本文测试的候选插入位点。B:由结构信息确定的VSV L-蛋白质结构。右图显示了互补结构域(CD)、甲基转移酶结构域(MT)和C末端结构域(CTD)的放大图。C:CD、MT和CTD的放大图,其中所指示的环被选为插入位点。D:VSV L蛋白的分子模型,其中在MT1620位置插入mCherry。
图12:在MT1620位置插入mCherry会导致具有复制能力的病毒。A:顶部:带有插入位点的VSV L-蛋白结构域图。显微照片描绘了用五种不同的L-mCherry表达质粒转染的293T细胞。相应的插入位点用结构域缩写后跟氨基酸编号标记。红色(上排)表示L-mCherry表达。底部:用VSV-GFP-ΔL感染后显示相同的转染293T细胞,MOI为10。绿色荧光表明功能性L-mCherry融合蛋白和聚合酶活性。B:BHK-21细胞感染24小时后VSV-L-mCherry、VSV-GFP-L-mCherry和VSV-L-mWasabi的荧光和相差图像。病毒基因组图式显示在荧光图像上方。C:在还原条件下,在12%聚丙烯酰胺凝胶上对mCherry进行免疫印迹。β-肌动蛋白用作上样对照。使用感染后8小时的VSV、VSV-GFP、VSV-L-mCherry和VSV-GFP-L-mCherry感染的BHK-21细胞制备裂解物。
图13:在MT1620位置插入mCherry会导致中等衰减。A:使用结晶紫噬菌斑试验进行病毒复制适合度评估。来自6孔培养皿的代表性照片显示了相应的显微插图,用于显示单个噬菌斑。BHK-21单层用病毒接种1小时,洗涤,然后培养24小时。B:不同VSV菌株的病毒复制动力学。BHK-21细胞中VSV(黑点)和VSV-L-mCherry(白色三角形)的单步生长动力学。使用TCID50试验对滴度进行定量。C:在IFN反应MTT存活力试验中病毒诱导的细胞毒活性的比较。将IFN反应性BHK-21细胞用递增量(0、10、100、500和1000U/ml)的IFN处理,并以MOI 0.1、1和10感染。将存活力显示为标准化为未处理的对照。条形表示平均值+/-SEM(n=4)。在没有IFN处理的情况下,两种病毒都会导致受感染细胞的存活力降低。
图14:蛋白酶开关插入VSV L蛋白,产生替代的可调控病毒VSV-Lprot。A:BHK是接种有和没有APV的VSV-L-prot的细胞。B:噬菌斑纯化后,病毒基因组RNA被分离并逆转录。对VSV-L-prot的插入区域和没有插入物(有插入物的L蛋白的预期大小:1830bp,无插入物的L蛋白的预期大小:1114bp)的对照病毒进行PCR,随后对PCR进行测序,未检测到突变。
图15:蛋白酶抑制剂安普那韦以剂量依赖性方式调节VSV-L-Prot活性。我们测试了VSV-L-prot对HIV蛋白酶抑制剂安普那韦的剂量反应。感染BHK细胞,MOI为1,并在24小时后评估病毒传播。A:病毒GFP表达随着安普那韦剂量的增加而增加。B:VSV-L-prot活性在安普那韦剂量为100nM时开始,在30μM时达到最大活性。由于对细胞的毒性作用,未测试更高浓度的安普那韦L-prot。复制曲线显示VSV-L-prot比VSV略有衰减。
图16:生成具有到P和L的功能性双分子内插入的VSV,生成VSV-P-mWasabi-L-mCherry。我们生成了具有功能性双分子内插入P和L的VSV,即VSV-P-mWasabi-L-mCherry,作为VSV-P-prot-L-prot的测试。我们确认了具有双荧光读出的双插入功能,和噬菌斑试验中的细胞病变效应(A,左:mWasabi、中:mCherry、右:噬菌斑、底部:构建体示意图),并通过cDNA合成和PCR测试了基因组完整性(B;1.VSV P-位点、2.VSV-P-mWasabi-L-mCherry P-位点、3.VSV L-位点、4.VSV-P-mWasabi-L-mCherry L-位点)。
图17:VSV-Prot-OFF系统原理及HIV蛋白酶二聚体蛋白带结构。A:GFP和L蛋白之间的基因间区域被HIV蛋白酶构建体取代。B:HIV蛋白酶作为二聚体起作用。为了确保HIV蛋白酶作为GFP-Prot-L融合蛋白的开放阅读框的一部分的功能,我们使用了先验连接(priorilinked)的蛋白酶二聚体。
图18:用HIV蛋白酶二聚体功能性替换基因间区域生成VSV。A:BHK细胞用没有(GGSG)3接头的VSV-GFP-Prot-L接种(有接头的构建体未示出)。添加10μM安普那韦导致病毒活性停止。B:噬菌斑纯化后,分离和逆转录有和没有(GGSG)3接头的VSV-GFP-Prot-L的病毒基因组RNA。对Prot-Off病毒和对照病毒的插入物区域进行PCR,随后对PCR进行测序。示出了1.不具有蛋白酶的GFP-L片段(959bp)、2.具有(GGSG)3接头的GFP-Prot-L片段(1559bp)、3.不具有(GGSG)3接头的GFP-Prot-L片段(1487bp)。拯救的VSV-Prot-Off病毒(无(GGSG)3接头)与HIV蛋白酶插入物区域的构建体质粒的序列比对以及质粒序列的共有序列未显示任何突变。
图19:蛋白酶抑制剂安普那韦以剂量依赖性方式调节VSV-Prot-off活性。HIV蛋白酶抑制剂对VSV-Prot-OFF病毒活性的剂量反应。A:感染BHK细胞,MOI为1,并在24小时后评估病毒感染。病毒GFP表达随着安普那韦(APV)剂量的增加而降低。B:在24hpi测量病毒复制。在APV剂量为30nM时,VSV-Prot-OFF活性开始降低。我们测试的最高APV剂量为30μM。由于对细胞的毒性作用,未针对VSV-Prot-OFF测试高于30μM的APV浓度。10μM沙奎那韦(SQV,白色符号)显示出对病毒复制的最强抑制。C:使用指定的沙奎那韦浓度在24hpi测量病毒复制。D:将BHK细胞以MOI为3的指定的VSV变体VSV-GFP或VSV-Prot-Off感染,用于单步复制动力学。测定收获的上清液中的病毒滴度并显示为Log10TCID50/ml。
图20:VSV-P-prot可以通过施用蛋白酶抑制剂在体内进行调节。裸鼠皮下异种移植U87胶质母细胞瘤细胞,并在0.1cm3的中位体积时瘤内注射单剂量的指定病毒VSV-P-prot-Luc或对照缓冲液。蛋白酶抑制剂(PI)混合物包含0.8mM安普那韦(APV)和0.2mM利托那韦(RTV),每12小时以50μl腹膜内施用。A:显示了病毒接种后8天的代表性生物发光图像。B:显示了接受PI(黑色方块)或药物媒介物(灰色圆圈)的小鼠中来自VSV-P-prot-Luc处理的肿瘤的荧光素酶信号的生物发光成像(BLI)定量(n=5;平均SD;*p<0.05)。
图21:VSV-L-prot可以通过施用蛋白酶抑制剂在体内进行调节。裸鼠皮下异种移植U87胶质母细胞瘤细胞,并在0.1cm3的中位体积时瘤内注射单剂量的指定病毒VSV-L-prot、VSV对照或对照缓冲液(模拟)。将包含0.8mM安普那韦(APV)和0.2mM利托那韦(RTV)的蛋白酶抑制剂(PI)混合物每12小时以50μl腹膜内施用。A:用卡尺测量肿瘤并使用以下公式计算体积:长×宽2×0.4。用VSV-L-prot对皮下U87肿瘤进行瘤内治疗导致肿瘤生长减少。B:显示了生存图,表明与在不存在PI的情况下用VSV-L-prot治疗的小鼠的肿瘤相比(实心粗线),用VSV-L-prot和PI治疗的动物的存活率(实线细线)增加(Lprot病毒处理+/-PI n=5;VSV n=3;PBS n=6;平均SD,*p<0.0X,**p<0.01)。
图22:蛋白酶抑制剂在体内调节VSV-Prot-off活性,如肿瘤体积和存活率所示。用100μl G62神经胶质瘤细胞悬液对NOD-SCID小鼠进行皮下异种移植,并在中位体积0.07cm3时肿瘤内注射单剂量的指定病毒VSV-Prot-Off、VSV-GFP或对照缓冲液(模拟),并于7天后再次进行,如A和B中的垂直黑色虚线所示。将包含0.8mM沙奎那韦(SQV)和0.2mM利托那韦(RTV)的蛋白酶抑制剂(PI)混合物每8小时以50μl腹膜内施用。当观察到肿瘤消退时,在第二次病毒注射后8天开始PI治疗。A:用卡尺测量肿瘤并使用以下公式计算体积:长×宽2×0.4。B:显示了存活率图,反映了观察期内病毒神经毒性和/或肿瘤发展的存活率情况(VSV-Prot-Off病毒处理+/-PI n=8;VSV-GFP n=8;平均SD)。
图23:如免疫荧光所示,蛋白酶抑制剂在体内调节VSV-Prot-off活性。用指定的VSV变体VSV-Prot-Off或VSV-GFP或对照缓冲液(模拟)对具有0.07cm3中位体积的G62异种移植物进行瘤内注射。PI处理(SQV+RTV)在单病毒处理后3天开始用于组织学研究。显示了每组3只小鼠的免疫荧光染色的代表性图像;上图:DAPI染色;中图:抗VSV-N抗体染色;下图:抗VSV-N抗体染色的扩大区域。PI处理将VSV-Prot-Off-GFP的扩散主要限制到注射部位。
图24:沙奎那韦对体外编码可溶性IL12的VSV-Prot-off活性的剂量反应。用指定的VSV变体VSV-GP、VSV-GP-IL12、VSV-GP-GFP-IL12-Prot-Off-wl或VSV-GP-GFP-IL12-Prot-Off-w/ol以MOI为1感染BHK细胞,并在洗涤后,在没有(对照(-ctrl))或存在10、100、300、1.000、10.000nmol蛋白酶抑制剂(PI)沙奎那韦的情况下培养。感染后30小时,采集上清液。A:VSV-GP-GFP-IL12-Prot-Off基因组组织示意图,以3′到5′方向显示基因(顶部)。通过TCID50测定上清液中的病毒滴度。使用和不使用接头(wl,w/ol)的VSV-GP-IL12-Prot-Off的病毒滴度与沙奎那韦浓度呈负相关。B:进行酶联免疫吸附测定(ELISA)以确定上清液中转基因IL 12的表达。IL12表达与沙奎那韦浓度呈负相关。作为对照,没有沙奎那韦(-ctrl)的VSV-GP-IL12样品被稀释和测量。
图25:阿扎那韦对体外编码可溶性IL12的VSV-Prot-off活性的剂量反应。用指定的VSV变体VSV-GP-IL12、VSV-GP-Luc-IL12-Prot-Off-w/ol或VSV-GP-Luc-IL12-Prot-Off-wl以MOI为1感染BHK细胞,并在洗涤后,在没有(对照(-ctrl))或存在10、100、300、1.000、10,000nmol阿扎那韦的情况下培养。感染后30小时,采集上清液。A:VSV-GP-Luc-IL12-Prot-Off基因组组织示意图,以3′到5′方向显示基因(顶部)。通过TCID50测定上清液中的病毒滴度。使用和不使用接头(wl,w/ol)的VSV-GP--IL12-Prot-Off的病毒滴度与阿扎那韦浓度呈负相关。B:进行酶联免疫吸附测定(ELISA)以确定上清液中转基因IL12的表达。IL12表达与沙奎那韦浓度呈负相关。作为对照,没有阿扎那韦(-ctrl)的VSV-GP-IL12样品被稀释和测量。
图26:两种编码可溶性IL 12但不同报告蛋白的VSV-Prot-off构建体的复制动力学。A:编码IL12和GFP(VSV-GP-Prot-Off-w/ol GFP IL12)或萤光素酶(VSV-GP-Prot-Off-w/ol Luc IL12)的VSV变体的VSV-Prot-Off基因组组织示意图,其以3'到5'方向示出编码可溶性IL12和融合蛋白的基因,该融合蛋白包含与蛋白酶二聚体和L蛋白融合(从N端到C端)的GFP或荧光素酶(Luc)。B:将BHK细胞以MOI为3的指定的VSV变体感染,用于单步复制动力学。感染后的细胞在GMEM中洗涤和培养指定的时间。测定收获的上清液中的病毒滴度并显示为Log10TCID50/ml。
图27:编码膜锚定的IL12的VSV-Prot-off构建体的示意图。A:VSV-Prot-off基因组组织示意图,以3′到5′方向显示了编码融合蛋白的基因,该融合蛋白包含与CD4跨膜结构域融合的IL12、蛋白酶和L蛋白。B.包含IL12、CD4跨膜结构域(TM)、位于跨膜结构域的蛋白酶(prot二聚体)和L蛋白(L)的融合蛋白的示意图。
图28:使用VSV-Prot-off构建体表达膜结合治疗蛋白的原理证明。通过将IL12与CD4的跨膜结构域直接融合到聚合酶上,可以通过蛋白酶抑制剂(PI)的存在来降低病毒复制和转基因表达。用MOI为1的指定VSV变体感染BHK细胞,洗涤后,在没有(-ctrl)或存在10、100、300、1000、10000nmol阿扎那韦(ATV)的情况下培养细胞。感染后30小时,采集上清液。A:通过TCID50测定上清液中的病毒滴度。无接头(-w/ol)或仅在IL12的跨膜结构域和HIV蛋白酶二聚体(-fl)之间有正向接头的VSV-GP-TM-IL12-Prot-Off的病毒滴度与AZV浓度呈负相关,而VSV-GP-IL12未受影响。B:在酶联免疫吸附测定(ELISA)中测试了未过滤的培养物上清液中的IL12,该培养物被无接头(-w/ol)或仅具有正向接头(-fl)的VSV-GP-TM-IL12-Prot-Off感染。C:将用VSV-GP-TM-IL12-Prot-Off-fl感染的细胞在细胞裂解缓冲液中稀释,并且在裂解样品(上清液+裂解细胞)中通过ELISA测量IL12浓度,对比含有细胞的上清液(未裂解)或单独过滤的上清液(n=2)。D:用MOI为3的指定的VSV变体感染BHK细胞,用于单步复制动力学。与源病毒VSV-GP-IL12相比,不带(-w/ol)或带正向接头(-fl)的VSV-Prot-Off跨膜IL12变体仅在早期时间点显示适度衰减。
具体实施方式
一般实施方案“包含(comprising)”或“包含(comprised)”涵盖更具体的实施方案“由……组成”。此外,单数和复数形式不以限制的方式使用。除非明确表明仅指代单数,否则本文所用单数形式“一(a)”、“一个(an)”以及“该(the)”指单数以及复数两者。
本发明中使用的术语“同源物”或“同源的”是指与原始序列或其互补序列在序列上至少80%相同的多肽分子或核酸分子。优选地,所述多肽分子或核酸分子与参考序列或其互补序列在序列上至少90%相同。更优选地,所述多肽分子或核酸分子与参考序列或其互补序列在序列上至少95%相同。最优选地,所述多肽分子或核酸分子与参考序列或其互补序列在序列上至少98%相同。同源蛋白质还显示与原始序列相同或相似的蛋白质活性。
如本文所用,术语“对应于氨基酸位置的”或“对应于氨基酸位置”包括VSVi的定义序列,例如具有SEQ ID NO:27序列的P蛋白的氨基酸序列,或具有SEQ ID NO:28序列的L-蛋白的氨基酸序列,以及其自然变异或来自其他VSV血清型的序列。此外,技术人员将理解RNA病毒(例如VSV)的基因组序列是变化的并且因此可能与SEQ ID NO:27或SEQ ID NO:28中提供的序列不同,即使来自相同的血清型。然而,使用序列比对,技术人员会知道如何在特定VSV序列中识别分别对应于P-蛋白或L-蛋白的SEQ ID NO:27或SEQ ID NO:28序列中的定义位置的序列中的位置,即同源位置。这种序列包含对应于具有SEQ ID NO:27的序列的P-蛋白或具有SEQ ID NO:28的序列的L-蛋白中的定义位置的位置,这种序列将与SEQ ID NO:27的序列或与SEQ ID NO:28的序列具有至少80%的序列同一性,优选地,与SEQ ID NO:27的序列或与SEQ ID NO:28的序列具有至少90%的同一性。所述对应序列还可以包含重组插入物,例如蛋白酶和/或所述蛋白酶的切割位点,其不被认为用于确定对应序列。
术语“蛋白质”可与“氨基酸残基序列”或“多肽”互换使用,是指任意长度的氨基酸的聚合物。这些术语还包括通过反应翻译后修饰的蛋白质,所述反应包括但不限于糖基化、乙酰化、磷酸化、糖化或蛋白质加工。多肽的结构中可以进行修饰和改变,例如氨基酸序列取代、缺失或插入,而分子保持其生物学功能活性。例如,某些氨基酸序列取代可以在多肽或其基础核酸编码序列中进行,并且可以获得具有相同性质的蛋白质。术语“多肽”通常是指具有多于10个氨基酸的序列,并且术语“肽”是指具有至多10个氨基酸的长度的序列。然而,该术语有时也可以互换使用。
术语“融合蛋白”是指由来自不同来源的部分组成的嵌合蛋白,特别是通过连接最初编码单独蛋白质或其片段的两个或多个基因或基因部分而产生的。重组融合蛋白是通过重组DNA技术人工产生的。融合蛋白可包含全长蛋白(即,包含所有功能性结构域)或其片段,例如与另一全长蛋白(即,包含所有功能性结构域)或其片段融合的一个或多个功能性结构域、共有动机(consensus motive)、切割位点。融合是指编码第一多肽的核苷酸序列与编码第二多肽的核苷酸序列在阅读框内,这样核苷酸序列将被表达为单一蛋白质。多聚蛋白是融合蛋白的一种亚型,通常出现在RNA病毒中。多聚蛋白是通过在单个开放阅读框中翻译编码多种蛋白质的单个mRNA产生的蛋白质,即彼此融合(多顺反子mRNA)。多聚蛋白通常通过蛋白酶在翻译后或共同翻译加工成单一蛋白质。
如本文所用,术语“基因组RNA”是指RNA病毒的可遗传的遗传信息。然而,在本发明的上下文中,术语“基因组”通常也指RNA病毒的基因组,因此指具有核糖核酸序列的RNA基因组。本领域技术人员将理解,RNA病毒的基因组也可以作为载体如质粒中的DNA序列提供。在通过转录转染宿主细胞后,然后在宿主细胞中产生RNA基因组。
如本文所用,术语“基因”是指可遗传基因组序列的DNA或RNA基因座,其通过表达为功能产物或通过调控基因表达而影响生物体的性状。基因和多核苷酸可以包括如在基因组序列中的内含子和外显子,或者仅包括如在cDNA中的编码序列,例如包含起始密码子(甲硫氨酸密码子)和翻译终止密码子的开放阅读框(ORF)。基因和多核苷酸还可以包括调节其表达的区域,例如转录起始、翻译和转录终止。因此,还包括调控元件,例如启动子。
本文使用的术语“核酸”、“核苷酸”和“多核苷酸”可互换使用,并且是指从5'至3'端读取的脱氧核糖核苷酸碱基或核糖核苷酸碱基的单链或双链聚合物,并且包括双链DNA(dsDNA)、单链DNA(ssDNA)、单链RNA(ssRNA,负义和正义)、双链RNA(dsRNA),基因组DNA、cDNA、cRNA、重组DNA或重组RNA及其衍生物,例如含有修饰骨架的那些。
本文使用的术语“核糖核酸”、“RNA”或“RNA寡核苷酸”描述了由核苷酸序列组成的分子,核苷酸序列由核碱基、核糖糖和磷酸基团构成。RNA通常是单链分子并且可以发挥各种功能。术语“核糖核酸”具体包括信使RNA(mRNA)、转移RNA(tRNA)、核糖体RNA(rRNA)、短干扰RNA(siRNA)、小发夹RNA(shRNA)和microRNA(miRNA),其中的每一个在生物细胞中起特定作用。它包括小的非编码RNA,例如microRNA(miRNA)、短干扰RNA(siRNA)、小发夹RNA(shRNA)和与Piwi相互作用的RNA(piRNA)。术语“非编码”是指RNA分子不翻译为氨基酸序列。
术语“上游”和“下游”可以指DNA或RNA中的相对位置。DNA或RNA的每条链具有5’端和3’端,这与脱氧核糖或核糖单元的末端碳位置有关。按照惯例,“上游”是指多核苷酸的5’端,而“下游”是指多核苷酸的3’端。双链DNA的情况下,例如基因组DNA,术语“上游”指编码链的5’端,而“下游”指编码链的3’端。
术语“编码链”或“正义链”是指编码蛋白质的RNA链。
术语“非编码链”、“反义链”或“负义链”或“负链”是指在翻译前需要由依赖于RNA的RNA聚合酶转录成正链RNA的RNA链。
“载体”是可用于将异源多核苷酸引入细胞的核酸。载体的一种类型是“质粒”,其是指线性或环状双链DNA分子,其中可以连接另外的核酸区段。另一种类型的载体是病毒载体(例如,逆转录病毒、腺病毒、腺相关病毒、VSV和MeV复制缺陷型或活性型),其中可以将额外的DNA或RNA片段引入病毒基因组。
术语“编码(encodes)”和“编码(codes for)”广义上是指其中使用聚合物大分子中的信息指导不同于第一分子的第二分子的产生的任何过程。所述第二分子可具有不同于第一分子的化学性质的化学结构。例如,术语“编码”描述半保守DNA复制的过程,其中双链DNA分子的一条链被用作模板以通过DNA依赖性DNA聚合酶来编码新合成的互补的姐妹链。此外,DNA分子可以编码RNA分子(例如,通过使用依赖于DNA的RNA聚合酶)或RNA分子(负链)可以编码RNA分子(正链)(例如,通过使用依赖于RNA的RNA聚合酶)。此外,RNA分子(正链)可以如在翻译过程中那样编码多肽。当用于描述翻译过程时,术语“编码”还扩展到编码氨基酸的三联体密码子。RNA分子还可以例如通过使用RNA依赖性DNA聚合酶的逆转录过程编码DNA分子。当意指编码多肽的DNA分子时,指的是转录和翻译过程。
如本文所用,术语“异源多肽”或“异源蛋白质”是指源自与受体(即RNA病毒)不同的生物体或不同物种的蛋白质。在本发明的上下文中,技术人员会理解它是指不是由病毒自然表达的蛋白质。当用于指蛋白质的部分时,术语“异源的”还可以表示蛋白质包含两个或更多个在自然界中彼此不具有相同关系的氨基酸序列。在本发明的上下文中,它通常是治疗性蛋白质、抗原,例如肿瘤特异性或肿瘤相关抗原,或报告分子(例如荧光素酶或荧光蛋白)。
术语“治疗性蛋白”是指可用于人类和/或动物的医学治疗的蛋白质。这些包括但不限于抗体、生长因子、凝血因子、细胞因子,例如干扰素和白介素、趋化因子和激素,优选生长因子、细胞因子、趋化因子和抗体。
术语“细胞因子”是指由细胞释放并作为细胞间介质的小蛋白质,例如影响分泌细胞周围细胞的行为。细胞因子可以由免疫或其他细胞分泌,例如T细胞、B细胞、NK细胞和巨噬细胞。细胞因子可以参与细胞间信号事件,例如自分泌信号、旁分泌信号和内分泌信号。它们可能介导一系列生物过程,包括但不限于免疫、炎症和造血。细胞因子可以是趋化因子、干扰素、白介素、淋巴因子或肿瘤坏死因子。
如本文所用,术语“生长因子”是指能够刺激细胞生长的蛋白质或多肽。
如本文所用,术语“表达”是指异源核酸序列在宿主细胞内的转录和/或翻译。目标基因产物在宿主细胞中的表达水平可以基于细胞中存在的对应mRNA的量或由所选序列编码的多肽的量来确定。例如,从选定序列转录的RNA可以通过Northern印迹杂交、核糖核酸酶RNA保护、与细胞RNA原位杂交或通过PCR如qPCR来定量。由选定序列编码的蛋白质可以通过多种方法定量,例如ELISA、蛋白质印迹法、放射免疫分析法、免疫沉淀法、蛋白质生物活性测定法、蛋白质免疫染色然后FACS分析或均相时间分辨荧光(HTRF)测定法。非编码RNA(如miRNA或shRNA)的表达水平可通过PCR(如qPCR)定量。
术语“基因产物”是指由基因或DNA多核苷酸编码的mRNA多核苷酸和多肽。
如本文所用,“报告基因”是编码可容易地检测和定量的报告蛋白或“报告分子”的多核苷酸。因此,报告分子表达水平的测量通常指示转录和/或翻译水平。编码报告分子的基因是报告基因。例如,报告基因可编码报告分子,例如,报告活性可被量化的酶,例如碱性磷酸酶(AP)、氯霉素乙酰转移酶(CAT)、海肾荧光素酶或萤火虫荧光素酶蛋白。报告物还包括荧光蛋白,例如绿色荧光蛋白(GFP)或GFP的重组变体中的任一种,其包括增强的GFP(EGFP)、蓝色荧光蛋白(BFP和其他衍生物)、青色荧光蛋白(CFP和其他衍生物)、黄色荧光蛋白(YFP和其他衍生物)和红色荧光蛋白(RFP和其他衍生物)或其他荧光蛋白,例如mCherry和mWasabi。
术语“蛋白酶”或“蛋白酶”在本文中同义使用,是指帮助蛋白水解,即通过肽键水解进行的蛋白质分解代谢的酶。蛋白酶可分为丝氨酸蛋白酶、半胱氨酸蛋白酶、苏氨酸蛋白酶、天冬氨酸蛋白酶、谷氨酸蛋白酶、金属蛋白酶和天冬酰胺肽切割酶七大类。蛋白酶存在于所有生物体中,包括原核生物、真核生物和病毒。原则上,所有蛋白酶都适用于本发明,只要它们是高度特异性的,即具有有限的底物序列集,并且可以使用特异性抑制剂。蛋白酶抑制剂应该对蛋白酶具有特异性并且已知是适合体内使用的(即,是安全的)、是生物可利用的和在体内是活性的,例如在对受试者,优选人类受试者口服或肠胃外使施用之后。病毒蛋白酶是有利的,因为它们是抗病毒药物的常见靶标,因此许多抑制病毒蛋白酶的蛋白酶抑制剂已被批准并测试在人类中是安全的。例如,对于人类免疫缺陷(HIV)蛋白酶,可以使用各种充分表征的蛋白酶抑制剂,并允许以所需的动力学调节系统。合适的HIV蛋白酶抑制剂的例子是,但不限于,例如茚地那韦、沙奎那韦、利托那韦、奈非那韦、洛匹那韦、安普那韦、福沙那韦、阿扎那韦、替拉那韦和达芦那韦。在治疗中,蛋白酶抑制剂,特别是HIV蛋白酶抑制剂,可以与利托那韦联合施用。利托那韦增加其他蛋白酶抑制剂的血浆浓度。人类蛋白酶是有利的,因为它们是人类患者的内源性蛋白质,因此不会引发免疫反应。在根据本发明的RNA病毒中使用的蛋白酶是异源蛋白酶,即非病毒内源性的蛋白酶。如本文所用,术语“Prot”或“prot”是蛋白酶的缩写,因此例如,L-Prot是指包含如本文公开的分子内蛋白酶的L-蛋白,P-Prot是指包含如本文公开的分子内蛋白酶的P-蛋白,或者Prot-L是指与L蛋白融合的蛋白酶,Prot-P是指与P-蛋白融合的蛋白酶。
蛋白酶可以是单体或二聚体。优选地,通过经由柔性接头连接单体,以单链二聚体的形式使用二聚体。仅作为二聚体有活性的蛋白酶的例子是实施例中使用的HIV蛋白酶。正如对HIV-1蛋白酶所解释的,单链二聚体优选是密码子优化的,以避免第一和第二蛋白酶之间的同源性。HIV 1蛋白酶的密码子优化的单链二聚体可以例如具有SEQ ID NO:5的DNA序列。这降低了先前在VSV中描述的“复制选择”重组事件的风险(Simon-Loriere and Holmes2011),其中病毒聚合酶L蛋白可以在模板之间切换并跳过序列延伸。当聚合酶由新生RNA链与新选择的模板的序列同源性引导时,就会发生“复制选择”。优选地,蛋白酶具有自催化活性,即其介导顺式切割。这可以是蛋白酶的固有特性,或者可以通过在蛋白酶附近克隆相应的切割位点而产生,即蛋白酶具有N端和/或C端切割位点。优选地,蛋白酶在任一侧被所述蛋白酶的切割位点框住。因此,蛋白酶具有所述蛋白酶的两个切割位点,一个在蛋白酶的N-末端侧,一个在蛋白酶的C-末端侧。优选地,两个切割位点不同。具有切割位点的蛋白酶还可在一侧或两侧、在一侧或两侧位于切割位点的侧翼,或者替代地在蛋白酶与一个或多个切割位点之间具有接头。
因此,根据本发明的调节元件或“开关”包含蛋白酶、至少一个所述蛋白酶的切割位点和对所述蛋白酶特异的蛋白酶抑制剂。
如本文所用,术语“RNA病毒”是指具有核糖核酸(RNA)作为其遗传物质的病毒。RNA病毒可以是单链(ssRNA)或双链(dsRNA)。单链RNA病毒包括类别(门)“负义ssRNA病毒”(负核糖病毒门(Negarnaviricota)),其包括尤其是单股反链病毒目和分割病毒目(包括正粘病毒科,其中包括流感病毒),和类别“正义ssRNA病毒”,例如冠状病毒科、黄病毒科和肠病毒科。负义ssRNA病毒,特别是单股反链病毒目病毒,包括,玻那病毒科(玻那病病毒(BDV))、尼亚米病毒科(尼亚马尼尼病毒(NYMV))、弹状病毒科(狂犬病病毒、水泡性口炎病毒(VSV)、马拉巴病毒)、丝状病毒科(包括EBOV在内的埃博拉病毒)、副粘病毒科(包括麻疹病毒(MeV)、新城疫病毒(NDV))和肺泡病毒科(例如人类呼吸道合胞病毒(HRSV))。在本发明的上下文中,优选弹状病毒科和副粘病毒科,更优选水泡病毒属的RNA病毒。
负义病毒RNA与mRNA互补,必须在翻译前通过依赖于RNA的RNA聚合酶转化为正义RNA。因此,负义RNA的纯化RNA没有传染性,因为它需要首先被转录,这需要病毒颗粒(病毒粒子)中包含的依赖于RNA的RNA聚合酶。重组RNA病毒的序列通常作为cDNA序列提供,因为RNA序列被逆转录用于测序。
术语“接头”是指编码可变长度为约6至30个氨基酸,优选为7至15个氨基酸的分离肽的序列,其将蛋白质的不同部分分开而不影响蛋白质不同部分的功能或单独发挥功能。接头可以是柔性或刚性的,优选地,接头是柔性接头。优选地,在蛋白酶切割位点与病毒转录和/或复制所必需的至少一种蛋白质之间不使用接头。
RNA病毒的条件调控
在一方面,本发明涉及单链RNA病毒,其包括所述病毒的修饰基因组,所述基因组包括编码病毒转录和/或复制所必需的至少一种蛋白质、蛋白酶和所述蛋白酶的切割位点的多核苷酸序列,其中所述病毒转录和/或复制所必需的至少一种蛋白质在分子内插入位点包含插入物,该插入位点至少包含所述蛋白酶的切割位点,并且任选地还包含所述蛋白酶。所述蛋白酶在分子内插入位点处的所述蛋白酶的切割位点处切割病毒转录和/或复制所必需的至少一种蛋白质。在分子内插入位点的切割使病毒转录和/或复制所必需的至少一种蛋白质失活。在本发明的上下文中,该方面也可称为ON开关,因为蛋白酶抑制剂的添加“开启(switches on)”了病毒转录和/或复制所必需的至少一种蛋白质。优选地,插入物在任一侧包含柔性接头,例如甘氨酸-丝氨酸接头。
在另一方面,本发明涉及单链RNA病毒,其包括所述病毒的修饰基因组,所述基因组包括编码病毒转录和/或复制所必需的至少一种蛋白质、蛋白酶和所述蛋白酶的切割位点的多核苷酸序列,其中所述病毒转录和/或复制所必需的至少一种蛋白质被编码为融合蛋白,其包含融合到N-末端或C-末端、由所述蛋白酶的切割位点分隔的蛋白酶。融合蛋白在切割位点和病毒转录和/或复制所必需的蛋白质之间可以包含或不包含接头,例如甘氨酸-丝氨酸接头。更一般地,在蛋白酶和病毒转录和/或复制所必需的蛋白质之间,即,在蛋白酶和切割位点之间或在切割位点和病毒转录和/或复制所必需的蛋白质之间,融合蛋白可以或可以不包含接头。优选地,在切割位点和病毒转录和/或复制所必需的蛋白质之间,融合蛋白不包含接头。或者,在蛋白酶和切割位点之间,融合蛋白可以或可以不包含接头。蛋白酶在位于编码为融合蛋白的至少一种病毒转录和/或复制所必需的蛋白质的N-末端或C-末端的所述蛋白酶的切割位点切割,以释放病毒转录和/或复制所必需的至少一种蛋白质。因此,蛋白酶和所述蛋白酶的蛋白酶切割位点位于分子间位置。病毒转录和/或复制所必需的至少一种蛋白质的蛋白水解释放使所述病毒转录和/或复制所必需的蛋白质具有活性。换言之,蛋白水解切割释放病毒转录和/或复制所必需的至少一种活性蛋白质。如本文所用,术语“释放”或“蛋白水解释放”是指去除与病毒转录和/或复制所必需的至少一种蛋白质融合的序列,该序列使所述蛋白质失活。在本发明的上下文中,该方面也可称为OFF开关,因为蛋白酶抑制剂的添加“关闭(switches off)”了病毒转录和/或复制所必需的至少一种蛋白质。
因此,融合蛋白可以由融合到病毒转录和/或复制所必需的至少一种蛋白质的N-末端或C-末端、由所述蛋白酶的切割位点分隔的蛋白酶组成。融合蛋白可以任选地还包含在蛋白酶和病毒转录和/或复制所必需的至少一种蛋白质之间的接头,例如甘氨酸-丝氨酸接头。因此,融合蛋白在切割位点和病毒转录和/或复制所必需的蛋白质之间可以包含或不包含接头;或者替代地,融合蛋白可以或可以不包含蛋白酶和切割位点之间的接头。优选地,在切割位点和病毒转录和/或复制所必需的蛋白质之间,融合蛋白不包含接头。然而,对于所述融合蛋白中病毒转录和/或复制所必需的至少一种蛋白质的失活不需要其他元件。因此,融合蛋白可以由融合到病毒转录和/或复制所必需的至少一种蛋白质的N-末端或C-末端的蛋白酶以及任选的接头组成,所述蛋白酶和蛋白质由所述蛋白酶的切割位点分隔。所述融合蛋白可以还包含以下或由以下组成:(a)蛋白酶,其与病毒转录和/或复制所必需的蛋白质的N-末端或C-末端融合,由所述蛋白酶的切割位点分隔,和(b)另外的病毒蛋白质或异源蛋白质,其与融合至病毒转录和/或复制所必需的蛋白质的N-末端或C-末端的蛋白酶的另一端融合,并且其中所述另外的病毒蛋白质或异源蛋白质以及所述蛋白酶也被所述蛋白酶的切割位点分隔。融合蛋白还可任选地包含在蛋白酶和病毒转录和/或复制所必需的蛋白质之间的接头,和/或在蛋白酶和另外的病毒蛋白质或异源蛋白质之间的接头。在此上下文中,重要的是蛋白酶在蛋白酶的任一侧包含切割位点(在任一侧由所述蛋白酶的切割位点框定)以同时释放两种蛋白质,即病毒转录和/或复制所必需的蛋白质以及另外的病毒蛋白质或异源蛋白质。优选地,蛋白酶与病毒转录和/或复制所必需的蛋白质的N末端融合,或者病毒转录和/或复制所必需的至少一种蛋白质是L-蛋白质,或者蛋白酶融合到L-蛋白质的N-末端。位于任一侧的所述蛋白酶的两个切割位点(和任选的接头)优选彼此不同。在任一侧具有切割位点的蛋白酶还可在一侧或两侧、在一侧或两侧位于切割位点的侧翼、或者替代地在蛋白酶与一个或多个切割位点之间具有接头。优选地,融合蛋白在切割位点与病毒转录和/或复制所必需的至少一种蛋白质之间不包含接头。
适用于本发明上下文的RNA病毒特别是单链RNA病毒。术语单链RNA病毒包括正义单链RNA病毒或负义单链RNA病毒。优选地,RNA病毒是负义单链RNA病毒。在一个实施方案中,RNA病毒是单股反链病毒目的。更具体地,单股反链病毒目单链RNA病毒可以是选自由以下组成的组的科的病毒:弹状病毒科、副粘病毒科、丝状病毒科、尼亚米病毒科、肺泡病毒科、博尔纳病毒科,优选弹状病毒科或副粘病毒科,优选水泡病毒属,更优选水泡性口炎病毒(VSV)或麻疹病毒(MeV),甚至更优选VSV。
在一个实施方案中,病毒转录和/或复制所必需的至少一种蛋白质是依赖于RNA的RNA聚合酶(RdRp)和/或包含依赖于RNA的RNA聚合酶和/或核衣壳蛋白质的聚合酶复合物的蛋白质。优选地,病毒转录和/或复制所必需的至少一种蛋白质选自由聚合酶辅因子、聚合酶和核衣壳蛋白组成的组。术语聚合酶辅因子是指RNA聚合酶转录和复制复合物的基本组分。在VSV中,RdRp复合物包含充当RdRp的大蛋白(L-蛋白)和磷蛋白(P-蛋白)。P-蛋白有两个结构域,第一个参与转录,第二个参与复制。它通常结合病毒核糖衣壳并将依赖于RNA的RNA聚合酶定位在模板上。
在某些实施方案中,RNA病毒属于单股反链病毒目,并且病毒转录和/或复制所必需的至少一种蛋白质是聚合酶辅因子,例如磷蛋白(P-蛋白)或其功能等价物;聚合酶,例如大蛋白(L-蛋白);和/或核衣壳,例如核蛋白(N-蛋白)。病毒转录和/或复制所必需的至少一种蛋白质可以是病毒转录和/或复制所必需的一种、两种或三种蛋白质,优选病毒转录和/或复制所必需的一种或两种蛋白质。术语P-蛋白的“功能等效物”是指RdRp复合物的重要组成部分,而不是依赖于RNA的RNA聚合酶本身。
单股反链病毒目包括但不限于博尔纳病毒科、尼亚米病毒科、弹状病毒科、丝状病毒科和副粘病毒科,例如副粘病毒亚科和肺病毒亚科。聚合酶在以下病毒科中称为L蛋白:博尔纳病毒科(例如,BDV)、尼亚米病毒科(例如,NYMV)、弹状病毒科(例如,VSV、Maraba)、丝状病毒科(例如,EBOV)和副粘病毒科,例如副粘病毒亚科(例如,MeV)和肺病毒亚科(例如,HRSV)。核衣壳在以下病毒科中称为N蛋白:博尔纳病毒科(例如,BDV)、尼亚米病毒科(例如,NYMV)、弹状病毒科(例如,VSV)和副粘病毒科,例如副粘病毒亚科(例如,MeV)和肺病毒亚科(例如,HRSV),而它在丝状病毒科(例如,EBOV)中被称为NP蛋白。因此,N蛋白的功能等价物的一个例子是丝状病毒科中的NP蛋白。聚合酶辅因子在以下病毒科中称为P蛋白:尼亚米病毒科(例如,NYMV)、弹状病毒科(例如,VSV)和肺病毒亚科(例如,HRSV),而它在博尔纳病毒科(例如,BDV)中称为X/P蛋白、在丝状病毒科(例如,EBOV)中称为VP35,以及在副粘病毒亚科(例如,MeV)中称为P/V/C蛋白。尼亚米病毒科除P蛋白外,还包含另外的聚合酶辅因子,即X蛋白。因此,P-蛋白的功能等价物的例子是博尔纳病毒科中的X/P蛋白、丝状病毒科中的VP35蛋白、副粘病毒科中的P/V/C蛋白和尼亚米病毒科中的X蛋白。
在一个实施方案中,RNA病毒属于单股反链病毒目,并且病毒转录和/或复制所必需的至少一种蛋白质是聚合酶辅因子,例如P-蛋白或其功能等价物;和/或聚合酶,例如L-蛋白;或它们的组合。优选地,病毒转录和/或复制所必需的至少一种蛋白质是聚合酶,例如L-蛋白。不受理论的束缚,因为病毒基因的转录从基因组3'端的单个启动子开始顺序发生,导致每个转录本的数量减少,所以基因组中最后的L蛋白的修饰与其他蛋白质的修饰相比导致较少的衰减。
蛋白酶调节病毒转录和/或复制所必需的至少一种蛋白质的活性。蛋白酶使病毒转录和/或复制所必需的蛋白质失活,当所述蛋白酶的至少一个切割位点在分子内位置,而在分子间位置时,蛋白酶激活病毒转录和/或复制所必需的蛋白质。这是指蛋白酶处于活性状态且不存在所述蛋白酶的蛋白质抑制剂。因此,蛋白酶还调节病毒转录和/或复制。术语“所述蛋白酶的切割位点”是指作为多肽蛋白水解切割底物的共有氨基酸序列。各个蛋白酶的切割位点是本领域已知的。
在一个实施方案中,蛋白酶是自催化蛋白酶或蛋白酶充当自催化蛋白酶。蛋白酶充当自催化蛋白酶意味着蛋白酶具有自催化活性,即它介导顺式切割。通常,除了顺式切割之外,自催化活性蛋白酶还介导反式切割,即在包含各自切割位点的不同多肽中。介导顺式切割可能是蛋白酶(自催化蛋白酶)的固有特性。例如,蛋白酶的侧翼是一个或多个切割位点。因此蛋白酶介导包含蛋白酶的多肽的切割。在特定情况下,蛋白酶可以通过自催化切割从多聚蛋白中释放出来。蛋白酶也可以通过在蛋白酶的N末端或C末端掺入一个或两个切割位点而变得具有自催化活性。因此,充当自催化蛋白酶的蛋白酶或具有催化活性的蛋白酶也可以通过克隆紧邻蛋白酶的相应切割位点(在同一多肽上的非天然表达的切割位点)来产生,使得重组蛋白酶具有N末端和/或C末端切割位点。优选地,蛋白酶在任一侧被所述蛋白酶的切割位点框住。因此,蛋白酶具有所述蛋白酶的两个切割位点,一个在蛋白酶的N-末端侧,一个在蛋白酶的C-末端侧。对于与ON-开关相关的方面(添加蛋白酶抑制剂“开启”病毒转录和/或复制所必需的至少一种蛋白质)以及与OFF-开关相关的方面(添加蛋白酶抑制剂“关闭”病毒转录和/或复制所必需的至少一种蛋白质)自催化蛋白酶或充当自催化蛋白酶的蛋白酶是优选的。然而,在与ON开关相关的方面,分子内插入位点的插入物可以仅包含所述蛋白酶的切割位点,而蛋白酶可以反式提供,即作为优选由RNA病毒编码的单独多肽。因此,病毒转录和/或复制所必需的至少一种蛋白质在分子内插入位点包含插入物,该插入位点至少包含所述蛋白酶的切割位点,优选蛋白酶和所述蛋白酶的切割位点。因此,在分子内插入位点处的插入物仅包含所述蛋白酶的切割位点的情况下,蛋白酶以反式提供。
此外,蛋白酶或自催化蛋白酶可以是任何蛋白酶,特别是病毒蛋白酶、原核蛋白酶或真核蛋白酶,特别是病毒或真核蛋白酶。在根据本发明的RNA病毒中使用的蛋白酶是异源蛋白酶,即非病毒内源性的蛋白酶。在一个实施方案中,蛋白酶是病毒蛋白酶,例如来自HCV或HIV的蛋白酶。本领域技术人员将理解适用于本发明上下文的蛋白酶是高度特异性的,即具有有限的独特和稀有底物序列的集合,并且还具有可用的特异性抑制剂。特异性抑制剂的可用性允许有条件地调节RNA病毒。蛋白酶抑制剂抑制蛋白酶的蛋白水解活性,其中抑制是指与不存在抑制剂的蛋白酶相比,蛋白酶表现出至少80%的抑制、至少90%的抑制、至少95%的抑制、至少99%的抑制和优选100%的抑制。优选地,抑制剂以对应于治疗血清浓度的剂量使用。
蛋白酶抑制剂应该对蛋白酶具有特异性并且适合体内使用(即安全)的、是生物可利用的和在体内是活性的,例如在对受试者,优选人类受试者口服或肠胃外使施用之后。病毒蛋白酶是有利的,因为其是抗病毒药物的常见靶标,因此许多抑制病毒蛋白酶的蛋白酶抑制剂已被批准并测试在人类中是安全的。例如,对于人类免疫缺陷(HIV)蛋白酶,可以使用各种充分表征的蛋白酶抑制剂,并允许以所需的动力学调节系统。合适的HIV蛋白酶抑制剂的例子是,但不限于,例如茚地那韦、沙奎那韦、利托那韦、奈非那韦、洛匹那韦、安普那韦、福沙那韦、阿扎那韦、替拉那韦和达芦那韦。人类蛋白酶是有利的,因为它们是人类患者的内源性蛋白质,因此不会引发免疫反应。合适的人类蛋白酶的实例是半胱天冬酶和金属蛋白酶,但不限于此。合适的人类蛋白酶抑制剂的实例是,但不限于,例如,半胱天冬酶抑制剂emricasan和nivocasan;基质金属蛋白酶抑制剂batimastat和tanomastat,以及依卡昔单抗。
蛋白酶可以是单体或二聚体。优选地,通过经由柔性接头连接单体,以单链二聚体的形式使用二聚体。仅作为二聚体有活性的蛋白酶的例子是实施例中使用的HIV蛋白酶。正如对HIV-1蛋白酶所解释的,单链二聚体优选是密码子优化的,以避免第一和第二蛋白酶之间的同源性。这降低了先前在VSV中描述的“复制选择”重组事件的风险(Simon-Loriereand Holmes 2011),其中病毒聚合酶L蛋白可以在模板之间切换并跳过序列延伸。当聚合酶由新生RNA链与新选择的模板的序列同源性引导时,就会发生“复制选择”。优选地,蛋白酶具有自催化活性,即其介导顺式切割。在一个实施方案中,蛋白酶是HIV-1蛋白酶,优选是HIV-1蛋白酶的单链二聚体(例如,具有SEQ ID NO:5的DNA序列的HIV-1蛋白酶的单链二聚体)。合适的HIV-1蛋白酶抑制剂为,但不限于,茚地那韦、沙奎那韦、利托那韦、奈非那韦、洛匹那韦、安普那韦、福沙那韦、阿扎那韦、替拉那韦或达芦那韦,优选安普那韦、沙奎那韦或茚地那韦。在另一实施方案中,蛋白酶是HCV蛋白酶NS3并且合适的NS3抑制剂是,但不限于:波普瑞韦、特拉瑞韦、阿舒瑞韦、西卢瑞韦、非德瑞韦、凡尼瑞韦、那拉瑞韦、西美瑞韦或达诺瑞韦,优选凡尼瑞韦、那拉瑞韦、西美瑞韦或达诺瑞韦。
根据本发明的单链RNA病毒还可编码异源蛋白质,优选治疗性蛋白质、报告分子或肿瘤抗原,更优选治疗性蛋白质或肿瘤抗原。这种异源蛋白质的产生取决于病毒转录复合物的完整活性。
在某些实施方案中,病毒是溶瘤病毒。溶瘤病毒是一种优先感染和杀死癌细胞的病毒。被杀死的癌细胞释放感染更多的癌细胞的新的传染性病毒颗粒,并释放刺激宿主的抗肿瘤免疫反应的细胞碎片。经临床测试的溶瘤RNA病毒包括但不限于:呼肠孤病毒、麻疹病毒、新城疫病毒、流感病毒、西门利克森林病毒、辛德毕斯病毒、脊髓灰质炎病毒、柯萨奇病毒、塞内卡谷病毒、马拉巴病毒和VSV。优选地,溶瘤病毒是VSV。这包括它们的衍生物,例如用淋巴细胞脉络丛脑膜炎病毒(LCMV)的糖蛋白(GP)假型化的VSV-GP,如WO 2010/040526中所述。
ON-开关
提供了单链RNA病毒,其包括所述病毒的修饰基因组,所述基因组包括编码病毒转录和/或复制所必需的至少一种蛋白质、蛋白酶和所述蛋白酶的切割位点的多核苷酸序列,其中所述病毒转录和/或复制所必需的至少一种蛋白质在分子内插入位点包含插入物,该插入位点至少包含所述蛋白酶的切割位点,并且任选地还包含蛋白酶,优选包含蛋白酶和所述蛋白酶的切割位点。
病毒转录和/或复制所必需的至少一种蛋白质的分子内插入位点处的插入物不影响病毒转录和/或复制所必需的至少一种蛋白质的活性。病毒转录和/或复制所必需的至少一种蛋白质的活性可以通过检测病毒报告基因表达、TCID50复制试验或MTT杀伤试验(参见图13C)来评估,优选使用TCID50复制试验来评估。其中,在分子内位点携带插入片段的病毒转录和/或复制所必需的修饰蛋白可由单链RNA病毒表达,或可以与缺乏所述病毒转录和/或复制所必需的蛋白质的单链RNA病毒一起在质粒上反式表达。在病毒转录或复制所必需的至少一种蛋白质的分子内插入位点处的插入物被认为不会影响病毒转录和/或复制所必需的至少一种蛋白质的活性,如果例如通过TCID50所测量的蛋白质活性和因此的病毒复制提供的滴度,与在分子内插入位点没有插入物的重组单链RNA病毒(对照)相比,降低不超过2log滴度,优选降低不超过1.5log滴度,更优选降低不超过1log滴度,更优选相等滴度,以及如果在对照和测试样品中存在蛋白酶抑制剂的情况下分子内插入位点存在蛋白酶。
在单链RNA病毒中,至少所述蛋白酶的切割位点并且任选地另外的蛋白酶位于病毒转录和/或复制所必需的至少一种蛋白质的分子内插入位点内,并且蛋白质的蛋白水解切割在分子内插入位点内的所述蛋白酶的切割位点处切割病毒转录和/或复制所必需的至少一种蛋白质。分子内插入位点内的切割使病毒转录和/或复制所必需的至少一种蛋白质失活。因此,病毒转录和/或复制所必需的至少一种蛋白质在分子内插入位点内的切割进一步抑制病毒转录和/或复制。因此,病毒在蛋白酶的特异性抑制剂存在时是有活性的,而在蛋白酶的特异性抑制剂不存在时则是无活性的。单链RNA病毒还可编码至少一种异源蛋白质,其中如果病毒在蛋白酶的特异性抑制剂存在下是有活性的,则异源蛋白质被表达,而如果病毒在蛋白酶的特异性抑制剂不存在时是无活性的,则异源蛋白质不表达。这种异源蛋白质的产生取决于病毒转录复合物的完整活性。合适的异源蛋白质是如治疗性蛋白质、报道分子或肿瘤抗原之类的蛋白质。
在具体的实施方案中,蛋白酶是一种自催化HIV蛋白酶二聚体,插入构成聚合酶复合体的水泡性口炎病毒(VSV)的一种或两种蛋白质(P-蛋白和/或L-蛋白,单独地和组合地)的分子内插入位点。在蛋白酶抑制剂存在的情况下,病毒蛋白的完整性得以保留,病毒进行复制。在没有蛋白酶抑制剂的情况下,HIV蛋白酶二聚体具有自催化活性,在翻译时切割必需的病毒蛋白。类似于DNA病毒中的调节模块(例如Tet-On),这种机制在实施例中被称为“prot-ON”。
在一个实施方案中,分子内插入位点处的插入物包含蛋白酶和至少一个所述蛋白酶的切割位点。在分子内位置,蛋白酶有两个切割位点。因此,蛋白酶在任一侧具有切割位点并且任选地在一侧或两侧具有接头。接头可以在一侧或两侧位于切割位点的侧翼,或者替代地可以位于蛋白酶和一个或多个切割位点之间。位于蛋白酶任一侧的所述蛋白酶的两个切割位点(和任选的接头)优选彼此不同。
在一个实施方案中,RNA病毒属于单股反链病毒目,并且病毒转录和/或复制所必需的至少一种蛋白质是聚合酶辅因子,例如P-蛋白或其功能等价物;聚合酶,例如L-蛋白;和/或核衣壳,例如N-蛋白。病毒转录和/或复制所必需的至少一种蛋白质可以是病毒转录和/或复制所必需的一种、两种或三种蛋白质,优选病毒转录和/或复制所必需的一种或两种蛋白质。在某些实施方案中,病毒转录和/或复制所必需的至少一种蛋白质是P-蛋白或其功能等价物,或L-蛋白,或它们的组合。
柔性接头和蛋白酶二聚体的密码子使用已经过优化,以避免第一和第二蛋白酶之间的同源性。采取了这种预防措施,因为VSV中所谓的“复制选择”重组事件前人已经描述过(Simon-Loriere and Holmes 2011),其中病毒聚合酶L蛋白可以在模板之间切换并跳过序列延伸。优选地,当聚合酶由新生RNA链与新选择的模板的序列同源性引导时,就会发生“复制选择”。此外,点突变在RNA病毒中经常出现,对于VSV突变率约为10,000个中1个核苷酸。从理论上讲,每个基因组都带有一个突变,这导致病毒学家认为VSV基因组(和其他RNA病毒基因组)不是一个序列,而是所谓的“准物种”的混合物。因此,在HIV蛋白酶序列中发生突变使蛋白水解开关失活是一种真正的可能性。为了避免可能失去条件性ON开关控制的此类逃逸突变体或回复突变的病毒,可以通过在第一和第二必需VSV蛋白(如P蛋白和L蛋白)中引入蛋白酶二聚体来使蛋白酶模块(ON-switch)加倍。蛋白酶和各自的切割位点在病毒转录和/或复制所必需的两种蛋白质中可以相同,或者可以不同,因此可以由相同或不同的蛋白酶抑制剂调节。
已经描述了VSV的P蛋白第196位氨基酸处的合适插入位点(Das et al.,JVirol,2006,80(13):6368-6377和Das and Pattnaik,J Virol,2005,79(13):8101-8112),其中编号是指血清型VSV Indiana(VSVI)的P蛋白(例如,具有SEQ ID NO:1的核苷酸序列和/或SEQID NO:27的氨基酸序列)。
已经描述了L蛋白插入位点,但由此产生的病毒在传代后对温度敏感且不稳定(Ruedas and Perrault 2009,Ruedas and Perrault 2014)。基于最近公布的关于VSV L-蛋白的完整结构信息(Liang,Li et al.2015),可能的许可位点被确定和测试,最初使用荧光蛋白,随后使用HIV蛋白酶二聚体。
因此,在一个实施方案中,单链RNA病毒是水泡性口炎病毒(VSV)。尽管存在VSV血清型,但最能表征和用于治疗的VSV血清型是VSV Indiana(VSVi)。本文公开和使用的所有序列均来自VSVi。还包括VSVi的衍生物,例如在WO 2010/040526中更详细描述的VSV-GP。由于VSV Indiana是一种RNA病毒,因此有多种完整的基因组核苷酸序列可用,一个例子是SEQID NO:22的cDNA序列(GenBank登录号MH919398.1)。示例中产生的病毒来源于(SEQ ID NO:20)的DNA序列。因此,下文所涉及的位置被提供为对应于所提供的VSVi的P蛋白或L蛋白的氨基酸位置,或分别具有SEQ ID NOs:27或28的氨基酸序列的VSVi的P蛋白或L蛋白的氨基酸位置。本领域技术人员会知道如何通过序列比对鉴定其他的VSVi P-蛋白或L-蛋白序列中的相应氨基酸序列。
在一个实施方案中,单链RNA病毒是VSV并且病毒转录和/或复制所必需的至少一种蛋白质是VSV的P蛋白和/或L蛋白。对于-P蛋白合适的分子内插入位点位于VSV P-蛋白的柔性铰链区,优选在对应于VSVi P蛋白的氨基酸位置193-199的位置,更优选氨基酸位置196的位置。在具体的实施方案中,P-蛋白的分子内插入位点在VSVi的P-蛋白的氨基酸位置193-199处,优选在VSVi的P-蛋白的氨基酸位置196处。其中编号是指VSVi的P-蛋白,VSVi的P-蛋白的一个示例性序列具有SEQ ID NO:27的氨基酸序列。在一个实施方案中,P-蛋白的分子内插入位点在具有序列SEQ ID NO:27的VSVi的P-蛋白或其同源物的氨基酸位置193-199处,优选在具有SEQ ID NO:27或其同源物的序列的VSVi的P蛋白的氨基酸196处,其中同源物与SEQ ID NO:27具有至少80%的序列同一性,优选与SEQ ID NO:27具有至少90%的序列同一性。L蛋白的合适分子内插入位点位于L蛋白的甲基转移酶结构域(MT)中,特别是在L蛋白甲基转移酶结构域的环中,其对应于VSVi L-蛋白的氨基酸1614-1634,优选对应于氨基酸1614-1629,更优选对应于氨基酸1616-1625,并且更优选对应于氨基酸1620。在具体的实施方案中,L-蛋白的分子内插入位点在VSVi L-蛋白的氨基酸1614-1634之间,优选在氨基酸1614-1629之间,更优选在氨基酸1616-1625之间,更优选在氨基酸1620处。其中编号是指VSVi的L-蛋白,VSVi的L-蛋白的一个示例性序列具有SEQ ID NO:28的氨基酸序列。在一个实施方案中,L-蛋白的分子内插入位点在具有SEQ ID NO:28的VSVi的L-蛋白或其同源物的氨基酸1614-1634之间,优选在氨基酸1614-1629之间,更优选在氨基酸1616-1625之间,甚至更优选在氨基酸1620处,其中同源物与SEQ ID NO:28具有至少80%的序列同一性,优选与SEQ ID NO:28具有至少90%的序列同一性。在另一实施方案中,单链RNA病毒是VSV,并且P-蛋白在分子内插入位点包含插入物,该插入位点包含至少所述蛋白酶的切割位点,并且任选地还包含VSV P-蛋白的柔性铰链区中的蛋白酶,该铰链区在对应于VSVi P-蛋白的193-199位氨基酸的位置,优选在VSVi P-蛋白的193-199位氨基酸处,或L-蛋白在细胞内插入位点包含插入物,该插入位点包含至少所述蛋白酶的切割位点,并且任选地还包含L-蛋白的甲基转移酶结构域(MT)的环中的蛋白酶,该环对应于VSVi L-蛋白的氨基酸1614-1634,优选在VSVi L-蛋白的氨基酸1614-1634之间。在另一实施方案中,单链RNA病毒是VSV,并且P-蛋白在分子内插入位点包含插入物,该插入位点包含至少所述蛋白酶的切割位点,并且任选地还包含VSV P-蛋白的柔性铰链区中的蛋白酶,该铰链区在对应于VSVi P-蛋白的193-199位氨基酸的位置,优选在VSVi P-蛋白的193-199位氨基酸处,并且L-蛋白在细胞内插入位点包含插入物,该插入位点包含至少所述蛋白酶的切割位点,并且任选地还包含L-蛋白的甲基转移酶结构域(MT)的环中的蛋白酶,该环对应于VSVi L-蛋白的氨基酸1614-1634,优选在VSVi L-蛋白的氨基酸1614-1634之间。将一个ON开关置于病毒转录和/或复制所必需的一种以上的、优选两种蛋白质中,可以降低逃逸突变体的风险。尽管重复传代,但没有观察到ON开关逃逸突变体,但病毒转录和/或复制所必需的两种蛋白质中的插入物提供了更高的稳定性。如本文所用,术语“在氨基酸位置”是指在之后,即在具有序列SEQID NO:27的VSVi P蛋白的氨基酸位置196,是指在具有序列SEQ ID NO:27的VSVi P蛋白的氨基酸位置196和197之间,而在具有序列SEQ ID NO:28的VSVi的L-蛋白的氨基酸1620处是指在具有序列SEQ ID NO:28的VSVi的L-蛋白的氨基酸位置1620和1621之间。
ON开关系统固有地包含环境安全元件。由于病毒后代依赖于蛋白酶抑制剂的存在,因此可能脱落的病毒对产毒性感染没有活性。这在治疗性RNA病毒可引起动物疾病的情况下可能很重要。
VSV通常与神经毒性和颅内扩散有关。体内数据表明,ON开关系统完全消除了神经毒性和颅内扩散。由于蛋白酶抑制剂安普那韦不穿过血脑屏障,该化合物的全身应用在大脑中不会赋予病毒活性,并且不存在神经毒性,尽管在全身安普那韦存在下全身存在的ON开关系统导致病毒复制。
在一个实施方案中,根据本发明的单链RNA病毒用于治疗,特别是用于癌症治疗,特别是用于人类。
OFF-开关
本发明还提供了一种单链RNA病毒,其包括所述病毒的修饰基因组,所述基因组包括编码病毒转录和/或复制所必需的至少一种蛋白质、蛋白酶和所述蛋白酶的切割位点的多核苷酸序列,其中所述病毒转录和/或复制所必需的至少一种蛋白质被编码为融合蛋白,其包含融合到N-末端或C-末端、由所述蛋白酶的切割位点分隔的蛋白酶。在一个实施方案中,融合蛋白不包含SEQ ID NO:30的氨基酸序列。优选地,蛋白酶与病毒转录和/或复制所必需的至少一种蛋白质的N-末端融合。因此,病毒转录和/或复制所必需的至少一种蛋白质被编码为融合蛋白,其包含蛋白酶和任选地包含接头,所述蛋白酶直接融合至病毒转录和/或复制所必需的至少一种蛋白质的N-末端,被所述蛋白酶的切割位点分隔。融合蛋白在蛋白酶和病毒转录和/或复制所必需的蛋白质之间可以包含或不包含接头,例如甘氨酸-丝氨酸接头。因此,融合蛋白在切割位点和病毒转录和/或复制所必需的蛋白质之间可以包含或不包含接头;或者,融合蛋白可以或可以不包含蛋白酶和切割位点之间的接头。优选地,在切割位点和病毒转录和/或复制所必需的蛋白质之间,融合蛋白不包含接头。
病毒转录和/或复制所必需的至少一种蛋白质被编码为包含蛋白酶的融合蛋白,所述蛋白酶融合至病毒转录和/或复制所必需的至少一种蛋白质的N-末端或C-末端,被所述蛋白酶的切割位点分隔,其中融合蛋白的蛋白水解切割释放活性形式的病毒转录和/或复制所必需的至少一种蛋白质。因此,病毒转录和/或复制所必需的至少一种蛋白质和蛋白酶被表达为被所述蛋白酶的切割位点分隔的融合蛋白。在蛋白水解切割后,蛋白酶和病毒转录和/或复制所必需的至少一种蛋白质被分离。病毒转录和/或复制所必需的至少一种蛋白质在融合蛋白中是无活性的,并且在通过蛋白水解切割(也称为蛋白水解释放)释放后被激活。根据本发明,融合蛋白不包含SEQ ID NO:30的氨基酸序列。该序列在Chung et al.(Nature Chemical Biology(2015),11:713-722)中描述的SMASh标签中作为降解决定子(degron)起作用,导致蛋白质降解。相比之下,根据本发明,蛋白酶与被所述蛋白酶的切割位点分隔的至少一种病毒转录和/或复制所必需的蛋白质的融合使病毒转录和/或复制所必需的至少一种蛋白质失活。因此融合蛋白被表达并且可检测到,即不被降解。因此,在融合蛋白中,病毒转录和/或复制所必需的至少一种蛋白质在功能上是无活性的。使病毒转录和/或复制所必需的至少一种蛋白质,例如L蛋白,在融合蛋白中功能性失活,足以有效地关闭病毒产毒,而无需蛋白质降解。单链RNA病毒还可编码至少一种异源蛋白质,其中如果病毒在蛋白酶的特异性抑制剂存在下是有活性的,则异源蛋白质被表达,而如果病毒在蛋白酶的特异性抑制剂不存在时是无活性的,则异源蛋白质不表达。这种异源蛋白质的产生取决于病毒转录复合物的完整活性。合适的异源蛋白质是如治疗性蛋白质、报道分子或肿瘤抗原之类的蛋白质。
因此,融合蛋白中的病毒转录和/或复制所必需的至少一种蛋白质在没有蛋白水解切割的情况下是无活性的,所述融合蛋白包含融合到病毒转录和/或复制所必需的至少一种蛋白质的N-末端或C-末端、由所述蛋白酶的切割位点分隔的蛋白酶。可以使用蛋白酶的特异性抑制剂来抑制融合蛋白的蛋白水解切割。因此,单链RNA病毒在蛋白酶的特异性蛋白酶抑制剂存在时是无活性的,而在蛋白酶的特异性抑制剂不存在时是有活性的。
在一个实施方案中,蛋白酶和所述蛋白酶的切割位点代替了连接病毒转录和/或复制所必需的蛋白质与另外的病毒蛋白的基因间区域。因此,在一个实施方案中,融合蛋白包含病毒转录和/或复制所必需的蛋白和被蛋白酶和所述蛋白酶的切割位点分隔的另外的病毒蛋白,其中蛋白酶优选地在任一侧(即,在蛋白酶的N末端和C末端)侧接所述蛋白酶的切割位点。因此,蛋白酶的丧失导致包含病毒转录和/或复制所必需的蛋白质和另外的病毒蛋白质的进一步失活的融合蛋白。换言之,回复突变体或逃逸突变体中蛋白酶和所述蛋白酶的切割位点的缺失将导致新的非功能性融合蛋白,其包含与另外的病毒蛋白融合的处于非活性状态的病毒转录和/或复制所必需的蛋白质。因此,替换整个基因间区域使病毒更安全,因为删除包含蛋白酶和所述蛋白酶的切割位点的插入物会产生另外的融合蛋白,其中所述另外的融合蛋白包含病毒转录和/或复制所必需的蛋白质和另外的病毒蛋白。另外的病毒蛋白可以是病毒转录和/或复制所必需的第二蛋白。由于蛋白酶插入物的缺失对该病毒没有任何优势,因此该特征可以防止逃逸突变体。
如果病毒基因组不包含病毒转录和/或复制所必需的两种彼此相邻的蛋白质,这可以通过基因改组来实现。对于VSV,已知可以改组基因。然而,基因组中基因的顺序与翻译频率相关。因此,基因改组通常伴随着某种程度的衰减。或者,另外的病毒蛋白是对病毒转录和/或复制不是必需的病毒蛋白。
在另一实施方案中,蛋白酶和所述蛋白酶的切割位点代替了连接病毒转录和/或复制所必需的蛋白质与异源蛋白的基因间区域,如图17所示。换言之,蛋白酶在一端与病毒转录和/或复制所必需的蛋白质融合,在另一端与异源蛋白质融合,其各自被所述蛋白酶的切割位点分隔。因此,在一个实施方案中,融合蛋白还可包含与蛋白酶的另一端融合的异源蛋白,所述蛋白酶与病毒转录和/或复制所必需的至少一种蛋白质的N-末端或C-末端融合,其中所述异源蛋白和所述蛋白酶也被所述蛋白酶的切割位点分隔。在一个实施方案中,蛋白酶的任一侧是所述蛋白酶切割位点,并用异源蛋白代替连接病毒转录和/或复制所必需的至少一种蛋白质的基因间区域。因此,蛋白酶的丧失导致包含病毒转录和/或复制所必需的蛋白质和异源蛋白质的进一步失活的融合蛋白。
如果基因间区域被蛋白酶取代,该蛋白酶应该是自催化蛋白酶,其任一侧是所述蛋白酶的切割位点,即,包含所述蛋白酶的两个切割位点,一个位于蛋白酶(或单链二聚体蛋白酶)的N-末端侧,一个C-末端侧。因此,在一个实施方案中,融合蛋白还包括与蛋白酶的另一端融合的另外的病毒蛋白或异源蛋白,所述蛋白酶与病毒转录和/或复制所必需的至少一种蛋白质的N-末端或C-末端融合,其中所述另外的病毒蛋白或异源蛋白和所述蛋白酶也被所述蛋白酶的切割位点分隔。在具体的实施方案中,在任一侧侧接所述蛋白酶的切割位点的蛋白酶替换了将病毒转录和/或复制所必需的至少一种蛋白质与另外的病毒蛋白或异源蛋白连接的基因间区域,优选地,其中,回复突变体病毒或逃逸突变体中蛋白酶的丧失导致病毒转录和/或复制所必需的至少一种蛋白质通过形成具有至少一种其他病毒蛋白质或异源蛋白质的融合蛋白而失活。用蛋白酶替换基因间区域具有减少(在另外的病毒蛋白的情况下)或不增加(在异源蛋白的情况下)基因间区域数量的优点,从而降低病毒减毒的风险。位于蛋白酶任一侧的所述蛋白酶的两个切割位点(和任选的接头)优选彼此不同。
在一个实施方案中,RNA病毒属于单股反链病毒目,并且病毒转录和/或复制所必需的至少一种蛋白质是聚合酶辅因子,例如P-蛋白或其功能等价物;聚合酶,例如L-蛋白;和/或核衣壳,例如N-蛋白。病毒转录和/或复制所必需的至少一种蛋白质可以是病毒转录和/或复制所必需的一种或两种蛋白质,优选病毒转录和/或复制所必需的一种蛋白质。优选地,病毒转录和/或复制所必需的至少一种蛋白质是P-蛋白或其功能等价物,或L-蛋白,或它们的组合。此外,蛋白酶优选与P-蛋白(或其功能等同物)或L-蛋白的N-末端融合,更优选与L-蛋白的N-末端融合。
在具体的实施方案中,病毒转录和/或复制所必需的至少一种蛋白质是L-蛋白质;或者蛋白酶被融合到被所述蛋白酶的切割位点分隔的病毒转录和/或复制所必需的至少一种蛋白质的N-末端;或者病毒转录和/或复制所必需的至少一种蛋白质是L-蛋白质并且蛋白酶被融合到L-蛋白质的N-末端,被所述蛋白酶的切割位点分隔。根据本发明,病毒转录和/或复制所必需的至少一种蛋白质,优选L-蛋白质,在融合蛋白中,优选在包含与病毒转录和/或复制所必需的至少一种蛋白质的N-末端融合的蛋白酶的融合蛋白中是无活性的,并在通过蛋白水解切割释放时被激活。
在一个实施方案中,单链RNA病毒包括所述病毒的修饰基因组,所述基因组包括编码病毒转录和/或复制所必需的至少一种蛋白质、蛋白酶和所述蛋白酶的切割位点的多核苷酸序列,其中所述病毒转录和/或复制所必需的至少一种蛋白质被编码为融合蛋白,其由与病毒转录和/或复制所必需的蛋白质的N-末端或C-末端融合、由所述蛋白酶的切割位点分隔的蛋白酶组成,其中融合蛋白任选地还包含蛋白酶和病毒转录和/或复制所必需的蛋白质之间的接头,例如甘氨酸-丝氨酸接头。因此,融合蛋白在切割位点和病毒转录和/或复制所必需的蛋白质之间可以包含或不包含接头;或者,融合蛋白可以或可以不包含蛋白酶和切割位点之间的接头。优选地,在切割位点和病毒转录和/或复制所必需的蛋白质之间,融合蛋白不包含接头。优选地,蛋白酶与病毒转录和/或复制所必需的蛋白质的N末端融合,或者病毒转录和/或复制所必需的至少一种蛋白质是L-蛋白质,或者蛋白酶融合到L-蛋白质的N-末端。
在另一实施方案中,单链RNA病毒包括所述病毒的修饰基因组,所述基因组包括编码病毒转录和/或复制所必需的至少一种蛋白质、蛋白酶和所述蛋白酶的切割位点的多核苷酸序列,其中病毒转录和/或复制所必需的至少一种蛋白质被编码为融合蛋白,所述融合蛋白包括以下或由以下所组成:(a)与病毒转录和/或复制所必需的至少一种蛋白质的N-末端或C-末端融合、由所述蛋白酶的切割位点分隔的蛋白酶;和(b)另外的病毒蛋白或异源蛋白,其融合至与病毒转录和/或复制所必需的至少一种蛋白质的N-末端或C-末端融合的蛋白酶,其中所述另外的病毒蛋白或异源蛋白和所述蛋白酶也被所述蛋白酶的切割位点分隔,其中融合蛋白任选地还包含蛋白酶与病毒转录和/或复制所必需的蛋白质之间的接头,和/或蛋白酶与另外的病毒蛋白或异源蛋白之间的接头。因此,融合蛋白在切割位点和病毒转录和/或复制所必需的蛋白质之间可以包含或不包含接头;或者替代地融合蛋白在蛋白酶和切割位点之间可以包含或不包含接头;和/或融合蛋白在切割位点和另外的病毒蛋白或异源蛋白之间可以包含或不包含接头;或者替代地融合蛋白在蛋白酶的另一侧和切割位点之间可以包含或不包含接头。优选地,在切割位点和病毒转录和/或复制所必需的蛋白质之间,融合蛋白不包含接头。
优选地,蛋白酶与病毒转录和/或复制所必需的蛋白质的N末端融合,或者病毒转录和/或复制所必需的至少一种蛋白质是L-蛋白质,或者蛋白酶融合到L-蛋白质的N-末端。位于蛋白酶任一侧的所述蛋白酶的两个切割位点(和任选的接头)优选彼此不同。在任一侧具有切割位点的蛋白酶可在一侧或两侧、在一侧或两侧位于切割位点的侧翼,或者替代地在蛋白酶与一个或多个切割位点之间具有接头。优选地,在切割位点和病毒转录和/或复制所必需的至少一种蛋白质之间,融合蛋白不包含接头。
在一个实施方案中,根据本发明的单链RNA病毒用于治疗,特别是用于癌症治疗,特别是用于人类。
异源蛋白的条件表达
根据本发明的单链RNA病毒还可以编码至少一种异源蛋白,所述单链RNA病毒包括所述病毒的修饰基因组,所述基因组包括编码病毒转录和/或复制所必需的至少一种蛋白质、蛋白酶和所述蛋白酶的切割位点的多核苷酸序列,其中(a)病毒转录和/或复制所必需的至少一种蛋白质包含在分子内插入位点处的插入物,该插入位点至少包含所述蛋白酶的切割位点,并且任选地还包含所述蛋白酶;或(b)病毒转录和/或复制所必需的至少一种蛋白质被编码为融合蛋白,所述融合蛋白包含融合到N-末端或C-末端、由所述蛋白酶的切割位点分隔的蛋白酶。这种异源蛋白质的产生依赖于完整的病毒转录和/或复制,因此需要病毒转录和/或复制所必需的至少一种蛋白质是有活性的。因此,在备选方案(a)中(ON-开关),如果病毒在蛋白酶的特异性抑制剂存在的情况下有活性,则异源蛋白被表达,如果病毒在蛋白酶的特异性抑制剂不存在的情况下无活性,则异源蛋白不表达,而在备选方案(b)中(OFF-开关),如果病毒在蛋白酶的特异性抑制剂存在的情况下无活性,则异源蛋白不表达,如果病毒在蛋白酶的特异性抑制剂不存在的情况下有活性,则异源蛋白表达。合适的异源蛋白质是如治疗性蛋白质、报道分子或肿瘤抗原之类的蛋白质。特别是为了治疗目的,异源蛋白优选是具有免疫调节或细胞死亡调节功能的治疗性蛋白质或肿瘤抗原。治疗性蛋白质也可以是由自杀基因编码的蛋白质。
本文还提供了一种RNA病毒,其包括所述病毒的修饰基因组,所述基因组包括编码至少一种异源蛋白质、蛋白酶和所述蛋白酶的切割位点的多核苷酸序列,其中所述至少一种异源蛋白质在分子内插入位点包含插入物,该插入位点至少包含所述蛋白酶的切割位点,并且任选地还包含所述蛋白酶。在一个实施方案中,所述RNA病毒是单链RNA病毒。
术语单链RNA病毒包括正义单链RNA病毒或负义单链RNA病毒。优选地,RNA病毒是负义单链RNA病毒。在一个实施方案中,RNA病毒是单股反链病毒目的。更具体地,单股反链病毒目单链RNA病毒可以是选自由以下组成的组的科的病毒:弹状病毒科、副粘病毒科、丝状病毒科、尼亚米病毒科、肺泡病毒科、博尔纳病毒科,优选弹状病毒科或副粘病毒科,优选水泡病毒属,更优选水泡性口炎病毒(VSV)或麻疹病毒(MeV),甚至更优选VSV。
在某些实施方案中,病毒是溶瘤病毒。溶瘤病毒是一种优先感染和杀死癌细胞的病毒。被杀死的癌细胞释放感染更多的癌细胞的新的传染性病毒颗粒,并释放刺激宿主的抗肿瘤免疫反应的细胞碎片。经临床测试的溶瘤RNA病毒包括但不限于:呼肠孤病毒、麻疹病毒、新城疫病毒、流感病毒、西门利克森林病毒、辛德毕斯病毒、脊髓灰质炎病毒、柯萨奇病毒、塞内卡谷病毒、马拉巴病毒病毒和VSV。优选地,溶瘤病毒是VSV。
术语异源是指RNA病毒,而不是感染病毒的宿主或患者,因此明确包括真核生物,特别是人类蛋白质。异源蛋白质是来自与受体不同的生物体或不同物种,即RNA病毒的蛋白。由根据本发明的RNA病毒编码的至少一种异源蛋白质可以是治疗性蛋白质、报道分子或肿瘤抗原。优选地,至少一种异源蛋白质是具有免疫调节或细胞死亡调节功能的治疗性蛋白质,其优选选自由细胞因子、趋化因子、生长因子和抗体组成的组。治疗性蛋白质也可以是膜结合蛋白,或者可以通过将跨膜结构域例如CD4的跨膜结构域融合到异源蛋白质上而使膜结合,优选经接头连接。治疗性蛋白质也可以是编码的自杀基因。替代地或另外,至少一种异源蛋白质是肿瘤抗原(包括肿瘤特异性和/或肿瘤相关抗原),例如谱系抗原、新抗原、睾丸抗原和肿瘤病毒抗原。术语“肿瘤特异性抗原”是指仅在肿瘤细胞中而不在生物体的任何其他组织中表达的抗原。术语“肿瘤相关抗原”是指与生物体中的其他组织相比,在肿瘤细胞中过表达(即以更高水平表达)的抗原。肿瘤抗原也可以是一种或多种新抗原。其中新抗原是由肿瘤体细胞突变产生的新形成的抗原。本领域技术人员会知道如何检测和确定来自患者的新抗原。在另一个实施方案中,异源蛋白是报告蛋白,例如绿色荧光蛋白、红色荧光蛋白、mCherry或mWasabi。特别是为了治疗目的,异源蛋白优选是具有免疫调节或细胞死亡调节功能的治疗蛋白质或肿瘤抗原。
本领域技术人员会理解,包含至少所述蛋白酶的切割位点,以及任选地还包含在分子内插入位点中的蛋白酶的插入物,对应于包含至少所述蛋白酶的切割位点和任选地还包含至少一种病毒转录和/或复制所必需的蛋白质的分子内插入位点中的蛋白酶的插入物,即ON-开关。因此,与ON-开关相关的上述公开内容和实施方案同样适用于包含病毒的修饰基因组的RNA病毒,该病毒的修饰基因组包含至少一种异源蛋白质、蛋白酶和所述蛋白酶的切割位点,其中所述至少一种异源蛋白质在分子内插入位点包含插入物,该插入位点至少包含所述蛋白酶的切割位点,并且任选地还包含所述蛋白酶。在一个实施方案中,所述RNA病毒是单链RNA病毒。
本领域技术人员还将理解,与异源蛋白质中的ON-开关相关的方面可以与病毒转录和/或复制所必需的至少一种蛋白质中的ON-开关组合。因此还设想了具有两个独立开关的武装病毒(armed viruses),一个控制病毒活性,一个控制病毒编码的治疗蛋白的活性。两个开关最好由两个独立的化合物控制。
在一个实施方案中,根据本发明的RNA病毒用于治疗,特别是用于癌症治疗,特别是用于人类。
还提供了编码至少一种重组蛋白、蛋白酶和所述蛋白酶的切割位点的多核苷酸序列,其中至少一种重组蛋白在包含蛋白酶和所述蛋白酶的切割位点的分子内插入位点包含插入物,或在包含蛋白酶和所述蛋白酶的切割位点的分子内插入位点包含插入物的重组蛋白。因此,如本文所述的ON-开关也可用于治疗性蛋白质,特别是具有小治疗窗口的治疗性蛋白质。这种治疗性蛋白质的例子是细胞因子。
在一个实施方案中,根据本发明的多核苷酸或重组蛋白用于治疗,特别是用于人类治疗。因此蛋白酶优选是人源的以防止免疫反应。
因此,在一个实施方案中,蛋白酶是人蛋白酶,例如金属蛋白酶或半胱天冬酶。合适的人类蛋白酶抑制剂的实例是,但不限于,例如,emricasan、nivocasan、batimastat、tanomastat和ecaliximab。在其他的实施方案中,蛋白酶是自催化蛋白酶或充当自催化蛋白酶的蛋白酶。因此,蛋白酶的侧翼可以是所述蛋白酶的切割位点,优选蛋白酶的任一侧是所述蛋白酶的切割位点。位于蛋白酶任一侧的所述蛋白酶的两个切割位点(和任选的接头)优选彼此不同。优选地,插入物在任一侧包含柔性接头,例如甘氨酸-丝氨酸接头。
治疗用途
本文还提供了根据本发明的单链RNA病毒,其包括所述病毒的修饰基因组,所述基因组包括编码病毒转录和/或复制所必需的至少一种蛋白质、蛋白酶和所述蛋白酶的切割位点的多核苷酸序列,其中(a)病毒转录和/或复制所必需的至少一种蛋白质包含在分子内插入位点处的插入物,该插入位点至少包含所述蛋白酶的切割位点,并且任选地还包含所述蛋白酶;或(b)病毒转录和/或复制所必需的至少一种蛋白质被编码为融合蛋白,所述融合蛋白包含融合到N-末端或C-末端、被用于治疗的所述蛋白酶的切割位点分隔的蛋白酶,其中单链RNA病毒任选地还编码至少一种异源蛋白质,例如治疗性蛋白质或肿瘤抗原。合适的疗法是癌症疗法、基因疗法和/或预防性和治疗性疫苗接种。
在优选的实施方案中,单链RNA病毒用于治疗癌症。
本文还提供了根据本发明的RNA病毒,其包括所述病毒的修饰基因组,所述基因组包括编码至少一种异源蛋白质、蛋白酶和所述蛋白酶的切割位点的多核苷酸序列,其中所述至少一种异源蛋白质在分子内插入位点包含插入物,该插入位点至少包含所述蛋白酶的切割位点,并且任选地还包含用于治疗的蛋白酶。合适的疗法是癌症疗法、基因疗法和/或预防性和治疗性疫苗接种。
在优选的实施方案中,RNA病毒用于治疗癌症。
所述病毒可以静脉内、肿瘤内、皮下、肌肉内、皮内、鼻内、腹膜内施用,优选静脉内或肿瘤内施用。可以使用生理缓冲液或相关制剂施用病毒。所用蛋白酶抑制剂对所述蛋白酶具有特异性。合适的HIV蛋白酶抑制剂的例子是,但不限于,例如茚地那韦、沙奎那韦、利托那韦、奈非那韦、洛匹那韦、安普那韦、福沙那韦、阿扎那韦、替拉那韦和达芦那韦。其他合适的蛋白酶抑制剂是本领域众所周知的。在治疗中,蛋白酶抑制剂,特别是HIV蛋白酶抑制剂,可以与降解酶的阻断剂例如Cyp家族,例如利托那韦联合施用。利托那韦或其他降解酶抑制剂会增加其他蛋白酶抑制剂的血浆浓度。
蛋白酶抑制剂可以通过任何合适的途径给药,优选皮下、口服或静脉内给药,更优选口服。
癌症可以是实体瘤优选地选自由以下组成的组:结肠癌、前列腺癌、乳腺癌、肺癌、皮肤癌、肝癌、骨癌、卵巢癌、胰腺癌、脑癌、头颈癌、淋巴瘤(霍奇金和非霍奇金淋巴瘤)、脑癌、神经母细胞瘤、间皮瘤、威尔姆瘤、视网膜母细胞瘤和肉瘤(如横纹肌肉瘤)。
L-蛋白插入位点
还提供了一种重组VSV L-蛋白,其包含在L-蛋白的甲基转移酶(MT)结构域中,特别是在L-蛋白的甲基转移酶结构域的环中的插入物,其对应于VSVi L-蛋白,特别是具有SEQ ID NO:28的氨基酸序列的VSVi L-蛋白的氨基酸1614-1634,优选对应于氨基酸1614-1629,更优选对应于氨基酸1616-1625,并且更优选对应于氨基酸1620。在具体的实施方案中,L-蛋白的分子内插入位点在VSVi L-蛋白的氨基酸1614-1634之间,优选在氨基酸1614-1629之间,更优选在氨基酸1616-1625之间,甚至更优选在氨基酸1620处。其中编号是指VSVi的L-蛋白,VSVi的L-蛋白的一个示例性序列具有SEQ ID NO:28的氨基酸序列。在一个实施方案中,L-蛋白的分子内插入位点在具有SEQ ID NO:28序列的VSVi的L-蛋白或其同源物的氨基酸1614-1634之间,优选在氨基酸1614-1629之间,更优选在氨基酸1616-1625之间,甚至更优选在氨基酸1620处,其中同源物与SEQ ID NO:28具有至少80%的序列同一性,优选与SEQ ID NO:28具有至少90%的序列同一性。
如本文所用,术语“插入”是指可变长度的氨基酸序列,其包括几个氨基酸(例如至少3个、至少5个、至少10个、优选至少15个氨基酸)至几百个氨基酸,例如至多500个、至多300个和至多250个氨基酸。插入物被引入到另一个序列中,在本例中是L蛋白序列,并导致氨基酸的净添加。因此,它可以例如包含蛋白酶的至少一个切割位点(例如,至少约15个氨基酸,如SEQ ID NO:6和7);蛋白酶和所述蛋白质的至少一个切割位点;或报告蛋白。优选地,插入物在任一侧包含柔性接头,例如甘氨酸-丝氨酸接头。在某些实施方案中,插入物为15-500个氨基酸,优选15-300个氨基酸,更优选15-250个氨基酸。插入物导致氨基酸的净添加,并且不包括氨基酸替换,即用相同数目的不同氨基酸简单替换一个或多个氨基酸。
L-蛋白的分子内插入位点处的插入物不影响L-蛋白的活性。L-蛋白的活性可以通过检测病毒报告基因表达、TCID50复制试验或MTT杀伤试验(参见图13C)来评估,优选使用TCID50复制试验来评估。其中,在分子内位点携带插入物的修饰的L-蛋白可由单链RNA病毒表达,或可以与缺乏L-蛋白的单链RNA病毒一起在质粒上反式表达。,如果例如通过TCID50所测量的蛋白质活性和因此的病毒复制提供的滴度,与在分子内插入位点没有插入物的重组单链RNA病毒(对照)相比,降低不超过2log滴度,优选降低不超过1.5log滴度,更优选降低不超过1log滴度,更优选相等滴度,以及对于对照和测试样品中存在蛋白酶抑制剂的情况下分子内插入位点处的蛋白酶,在L-蛋白的分子内插入位点处的插入物被认为不会影响L-蛋白的活性。
在一个实施方案中,插入物包含荧光蛋白。在另一个实施方案中,插入物包含蛋白酶的切割位点或蛋白酶以及所述蛋白酶的切割位点。蛋白酶可以是侧接两个蛋白酶切割位点的单链二聚体;或者蛋白酶可以是侧接有N-末端和/或C-末端蛋白酶切割位点的单体。在一个实施方案中,蛋白酶是病毒蛋白酶,例如来自HCV或HIV的蛋白酶。优选地,蛋白酶是自催化蛋白酶或充当自催化蛋白酶。
自催化蛋白酶可以是HIV-1蛋白酶,优选是HIV-1蛋白酶的单链二聚体,并且蛋白酶可以被选自由以下组成的组的蛋白酶抑制剂抑制:茚地那韦、沙奎那韦、利托那韦、奈非那韦、洛匹那韦、安普那韦、福沙那韦、阿扎那韦、替拉那韦和达芦那韦。
L-蛋白还可包含次级突变,优选在L-蛋白的甲基转移酶结构域中。在一个实施方案中,次级突变恢复L-蛋白活性。
本文还提供了包含根据本发明的重组VSV L-蛋白的水疱性口炎病毒(VSV)。
体外方法
还提供了一种控制RNA病毒复制的方法,其包括用根据本发明的单链RNA病毒转导或转染宿主细胞,所述病毒包含病毒的修饰基因组,所述基因组包括编码病毒转录和/或复制所必需的至少一种蛋白质、蛋白酶和所述蛋白酶的切割位点的多核苷酸序列,其中病毒转录和/或复制所必需的至少一种蛋白质包含在分子内插入位点处的插入物,该插入位点包含至少所述蛋白酶的切割位点,并且任选地还包含蛋白酶;在存在或不存在对所述蛋白酶特异的蛋白酶抑制剂的情况下维持宿主细胞,其中所述蛋白酶抑制剂的添加允许病毒转录和/或复制,而所述蛋白酶抑制剂的不存在抑制病毒转录和复制。
还提供了一种控制RNA病毒复制的方法,其包括用根据本发明的单链RNA病毒转导或转染宿主细胞,所述病毒包含病毒的修饰基因组,所述基因组包括编码病毒转录和/或复制所必需的至少一种蛋白质、蛋白酶和所述蛋白酶的切割位点的多核苷酸序列,其中病毒转录和/或复制所必需的至少一种蛋白质被编码为融合蛋白,该融合蛋白包含融合到N-末端或C-末端、由所述蛋白酶的切割位点分隔的蛋白酶;在存在或不存在对所述蛋白酶特异的蛋白酶抑制剂的情况下维持宿主细胞,其中所述蛋白酶抑制剂的添加抑制病毒转录和/或复制,而所述蛋白酶抑制剂的不存在允许病毒转录和复制。
还提供了一种控制通过RNA病毒表达异源蛋白的方法,其包括用根据本发明的RNA病毒转导或转染宿主细胞,其中蛋白酶位于至少一种异源蛋白质的分子内插入位点内;在存在或不存在对所述蛋白酶特异的蛋白酶抑制剂的情况下维持宿主细胞,其中所述蛋白酶抑制剂的添加允许异源蛋白质表达,而所述蛋白酶抑制剂的不存在抑制异源蛋白质表达。
优选地,根据本发明的方法是体外方法。因此,转导或转染和维持的步骤在离体细胞培养物中进行。
蛋白酶优选是自催化蛋白酶,更优选是HIV-1蛋白酶,甚至更优选是HIV-1蛋白酶的单链二聚体。这种蛋白酶特别有利,因为有许多蛋白酶抑制剂可用。合适的蛋白酶抑制剂为,例如,茚地那韦、沙奎那韦、利托那韦、奈非那韦、洛匹那韦、安普那韦、福沙那韦、阿扎那韦、替拉那韦或达芦那韦。
综上所述,本发明还包括以下内容:
1.一种单链RNA病毒,其包括所述病毒的修饰基因组,所述基因组包括编码病毒转录和/或复制所必需的至少一种蛋白质、蛋白酶和所述蛋白酶的切割位点的多核苷酸序列,其中(a)病毒转录和/或复制所必需的至少一种蛋白质包含在分子内插入位点处的插入物,该插入位点至少包含所述蛋白酶的切割位点,并且任选地还包含所述蛋白酶;或(b)病毒转录和/或复制所必需的至少一种蛋白质被编码为融合蛋白,所述融合蛋白包含融合到N-末端或C-末端、由所述蛋白酶的切割位点分隔的蛋白酶。
2.项1所述的单链RNA病毒,其中(a)蛋白酶在分子内插入位点处的所述蛋白酶的切割位点处切割病毒转录和/或复制所必需的至少一种蛋白质,或(b)蛋白酶在所述蛋白酶的切割位点切割以释放病毒转录和/或复制所必需的至少一种蛋白质,所述切割位点位于病毒转录和/或复制所必需的至少一种蛋白质的N-末端或C-末端。
3.项1或2所述的单链RNA病毒,其中可以使用蛋白酶抑制剂来抑制所述蛋白酶。
4.前述项任一项所述的单链RNA病毒,其中病毒转录和/或复制所必需的至少一种蛋白质是依赖于RNA的RNA聚合酶或包含依赖于RNA的RNA
聚合酶或核衣壳的聚合酶复合物的蛋白质,优选地,其中病毒转录和/或复制所必需的至少一种蛋白质选自由聚合酶辅因子、聚合酶和核衣壳组成的组。
5.前述项任一项所述的单链RNA病毒,其中单链RNA病毒是负义单链RNA病毒,优选地是单股反链病毒目负义单链RNA病毒。
6.前述项任一项的单链RNA病毒,其中所述单链RNA病毒是(a)选自由弹状病毒科、副粘病毒科、丝状病毒科、尼亚米病毒科、肺病毒科和博尔纳病毒科组成的组的病毒;和/或(b)副粘病毒科病毒,优选麻疹病毒(MeV)或弹状病毒科病毒,优选水疱性口炎病毒(VSV)。
7.项5或6所述的单链RNA病毒,其中病毒转录和/或复制所必需的至少一种蛋白质选自由聚合酶辅因子、聚合酶和核衣壳组成的组,优选地,其中病毒转录和/或复制所必需的至少一种蛋白质是(a)聚合酶辅因子,优选P-蛋白或其功能等同物;(b)聚合酶,优选L-蛋白;和/或(c)它们的组合。
8.前述项任一项所述的单链RNA病毒,其中(a)蛋白酶调节病毒转录和/或复制所必需的至少一种蛋白质的活性;(b)蛋白酶调节病毒转录和/或复制;(c)蛋白酶是自催化蛋白酶;(d)蛋白酶是病毒蛋白酶;和/或(e)蛋白酶来自HCV或HIV。
9.前述项任一项所述的单链RNA病毒,其中蛋白酶是HIV-1蛋白酶,优选是HIV-1蛋白酶的单链二聚体,并且蛋白酶可以被选自由以下组成的组的蛋白酶抑制剂抑制:茚地那韦、沙奎那韦、利托那韦、奈非那韦、洛匹那韦、安普那韦、福沙那韦、阿扎那韦、替拉那韦和达芦那韦。
10.前述项任一项所述的单链RNA病毒,其中病毒转录和/或复制所必需的至少一种蛋白质的分子内插入位点处的插入物不影响病毒转录和/或复制所必需的至少一种蛋白质的活性。
11.前述项任一项所述的单链RNA病毒,其中至少所述蛋白酶的切割位点并且任选地另外的蛋白酶位于病毒转录和/或复制所必需的至少一种蛋白质的分子内插入位点内,并且其中(a)蛋白质的蛋白水解切割在分子内插入位点内的所述蛋白酶的切割位点处切割病毒转录和/或复制所必需的至少一种蛋白质;(b)分子内插入位点内的切割使病毒转录和/或复制所必需的至少一种蛋白质失活;(c)病毒转录和/或复制所必需的至少一种蛋白质的分子内插入位点内的切割抑制病毒转录和/或复制;(d)病毒在蛋白酶的特异性抑制剂存在时有活性,而在蛋白酶的特异性抑制剂不存在时则无活性;和/或(e)病毒还编码至少一种异源蛋白,其中如果病毒在蛋白酶的特异性抑制剂存在的情况下有活性,则异源蛋白表达,而如果病毒在蛋白酶的特异性抑制剂不存在的情况下无活性,则异源蛋白不表达。
12.前述项任一项所述的单链RNA病毒,其中单链RNA病毒是水泡性口炎病毒(VSV),病毒转录和/或复制所必需的至少一种蛋白质是P蛋白和/或L蛋白,并且其中分子内插入位点(a)在VSV P蛋白的柔性铰链区中,优选对应于VSVi P蛋白(例如,SEQ ID NO:27的序列)的氨基酸位置193-199,更优选氨基酸位置196;(b)在L蛋白甲基转移酶结构域的环中,其对应于具有SEQ ID NO:28的序列的VSVi L-蛋白质的氨基酸1614-1634,优选地对应于氨基酸1614-1629,更优选地对应于氨基酸1616-1625,并且更优选地对应于氨基酸1620;或(c)(a)和(b)的组合。
13.项1-9的任一项所述的单链RNA病毒,其中病毒转录和/或复制所必需的至少一种蛋白质被编码为融合蛋白,其包含融合到病毒转录和/或复制所必需的至少一种蛋白质的N-末端或C-末端、由所述蛋白酶的切割位点分隔的蛋白酶,并且其中(a)融合蛋白的蛋白水解切割以活性形式释放病毒转录和/或复制所必需的至少一种蛋白质;(b)融合蛋白中的病毒转录和/或复制所必需的至少一种蛋白质在没有蛋白水解切割的情况下是无活性的,所述融合蛋白包含融合到病毒转录和/或复制所必需的至少一种蛋白质的N-末端或C-末端、由所述蛋白酶的切割位点分隔的蛋白酶;(c)使用蛋白酶的特异性抑制剂抑制融合蛋白的蛋白水解切割;(d)病毒在蛋白酶的特异性蛋白酶抑制剂存在时是无活性的,而在蛋白酶的特异性抑制剂不存在时是有活性的;(e)病毒还编码至少一种异源蛋白,其中如果病毒在蛋白酶的特异性抑制剂存在时是无活性的,则异源蛋白不表达,而如果病毒在蛋白酶的特异性抑制剂不存在时是有活性的,则异源蛋白表达;(d)融合蛋白还包含融合到蛋白酶的另一端的另外的病毒蛋白或异源蛋白,所述蛋白酶融合到病毒转录和/或复制所必需的至少一种蛋白质的N-末端或C-末端,并且其中所述另外的病毒蛋白或异源蛋白和所述蛋白酶也被所述蛋白酶的切割位点分隔;(e)在任一侧侧接所述蛋白酶的切割位点的蛋白酶替换了将病毒转录和/或复制所必需的至少一种蛋白质与另外的病毒蛋白质或异源蛋白质连接的基因间区域;和/或(f)在任一侧侧接所述蛋白酶的切割位点的蛋白酶替换了将病毒转录和/或复制所必需的至少一种蛋白质与另外的病毒蛋白质或异源蛋白质连接的基因间区域,其中蛋白酶的丧失导致进一步失活的包括病毒转录和/或复制所必需的蛋白质和另外的病毒蛋白质或异源蛋白质的融合蛋白。
14.权利要求1或13所述的单链RNA病毒,其中单链RNA病毒是单股反链病毒目单链RNA病毒,并且病毒转录和/或复制所必需的至少一种蛋白质被编码为融合蛋白,其包含融合到病毒转录和/或复制所必需的至少一种蛋白质的N-末端或C-末端、由所述蛋白酶的切割位点分隔的蛋白酶,其中(a)病毒转录和/或复制所必需的至少一种蛋白质是L蛋白;和/或(b)融合蛋白包含融合到病毒转录和/或复制所必需的至少一种蛋白质的N-末端、由所述蛋白酶的切割位点分隔的蛋白酶,。
15.权利要求1或13所述的单链RNA病毒,其中病毒转录和/或复制所必需的至少一种蛋白质被编码为融合蛋白(a)由与病毒转录和/或复制所必需的蛋白质的N端或C端融合、由所述蛋白酶的切割位点分隔的蛋白酶组成,其中融合蛋白任选地还包含蛋白酶和病毒转录和/或复制所必需的蛋白质之间的接头;(b)所述融合蛋白包括与病毒转录和/或复制所必需的至少一种蛋白质的N-末端或C-末端融合、由所述蛋白酶的切割位点分隔的蛋白酶,以及与蛋白酶的另一端融合的另一种病毒蛋白质或异源蛋白质,该蛋白酶与病毒转录和/或复制所必需的至少一种蛋白质的N-末端或C-末端融合,并且其中所述另外的病毒蛋白或异源蛋白和所述蛋白酶也被所述蛋白酶的切割位点分隔,并且其中融合蛋白任选地还包含蛋白酶与病毒转录和/或复制所必需的蛋白质之间的接头,和/或蛋白酶与另外的病毒蛋白或异源蛋白之间的接头;或(c)所述融合蛋白不包含SEQ ID NO:30的氨基酸序列。
16.一种RNA病毒,其包括所述病毒的修饰基因组,所述基因组包括编码至少一种异源蛋白质、蛋白酶和所述蛋白酶的切割位点的多核苷酸序列,其中所述至少一种异源蛋白质在分子内插入位点包含插入物,该插入位点至少包含所述蛋白酶的切割位点,并且任选地还包含所述蛋白酶。
17.项16所述的RNA病毒,其中异源蛋白质是治疗性蛋白质、报道分子或肿瘤抗原。
18.项1-15所述的任一项的单链RNA病毒或项16或17的RNA病毒在治疗中的用途。
19.项1-15所述的任一项的单链RNA病毒或项16或17的RNA病毒在治疗癌症中的用途。
20.项19所述的单链RNA病毒或RNA病毒的用途,其中癌症是实体瘤,优选地选自由以下组成的组:结肠癌、前列腺癌、乳腺癌、肺癌、皮肤癌、肝癌、骨癌、卵巢癌、胰腺癌、脑癌、头颈癌、淋巴瘤(霍奇金和非霍奇金淋巴瘤)、脑癌、神经母细胞瘤、间皮瘤、威尔姆瘤、视网膜母细胞瘤和肉瘤。
21.一种重组VSV L蛋白,其包含在L蛋白的甲基转移酶结构域的环中的插入物,其对应于具有SEQ ID NO:28的序列的VSVi L-蛋白的氨基酸1614-1634,优选对应于氨基酸1614-1629,更优选对应于氨基酸1616-1625,并且更优选对应于氨基酸1620。
22.项21所述的重组VSV L蛋白,其中L-蛋白还包含次级突变。
23.一种水疱性口炎病毒(VSV),其包含根据项21或22所述的重组VSV L-蛋白。
24.一种控制RNA病毒复制的方法,其包括
(a)用项10-12的任一项所述的RNA病毒转导或转染宿主细胞,和
(b)在存在或不存在对所述蛋白酶特异的蛋白酶抑制剂的情况下维持宿主细胞,
其中所述蛋白酶抑制剂的添加允许病毒转录和/或复制,并且所述蛋白酶抑制剂的不存在抑制病毒转录和复制。
25.一种控制RNA病毒复制的方法,其包括
(a)用项13-15的任一项所述的RNA病毒转导或转染宿主细胞,和
(b)在存在或不存在对所述蛋白酶特异的蛋白酶抑制剂的情况下维持宿主细胞,
其中所述蛋白酶抑制剂的添加抑制病毒转录和/或复制,并且所述蛋白酶抑制剂的不存在允许病毒转录和复制。
26.一种通过RNA病毒控制异源蛋白表达的方法,其包含
(a)用根据项16或17的所述的RNA病毒转导或转染宿主细胞,其中蛋白酶位于至少一种异源蛋白质的分子内插入位点内;和
(b)在存在或不存在对所述蛋白酶特异的蛋白酶抑制剂的情况下维持宿主细胞,
其中所述蛋白酶抑制剂的添加允许异源蛋白质表达,而所述蛋白酶抑制剂的不存在抑制异源蛋白质表达。
实施例
材料和方法
P-蛋白
在aa196位置具有连接二聚体蛋白酶(P196PR2,SEQ ID NO:3的DNA序列)的磷蛋白(具有SEQ ID NO:1的cDNA序列的P-蛋白;对应于SEQ ID NO:27的氨基酸序列)的DNA序列以及VSV核蛋白和基质蛋白的侧翼序列由GeneArt合成。VSV Indiana中的P蛋白基因被P196PR2取代。位置5的GFP用作标记基因。通过PCR扩增具有侧翼VSV-N和VSV-M序列的P196PR2,其中用30bp序列将2个限制酶位点(XbaI和Bst1107l)加至全长VSV载体,用所述酶切割。然后通过Gibson组装克隆生成构建体(图4)。
蛋白酶连接的二聚体构建体(SEQ ID NO:5的DNA序列)的侧翼是(GGSG)3接头序列(SEQ ID NO:4的DNA序列;SEQ ID NO:29的氨基酸序列)以允许P蛋白和蛋白酶二聚体之间的空间分离。5’GGSG接头具有SEQ ID NO:8的DNA序列,而3’GGSG接头具有SEQ ID NO:9的DNA序列。手动设计接头密码子以避免上游与下游接头的同源性。切割位点位于每个蛋白酶结构域和接头之间并且具有SEQ ID NO:6和SEQ ID NO:7)的DNA序列。通过优化算法和手动调整的相互作用来选择蛋白酶二聚体密码子。优化过程是人类密码子使用和避免第一和第二蛋白酶之间的同源性之间的折衷。Gibson组装克隆引入了突出端(overhang)。
磷蛋白-蛋白酶构建体的功能首先用P表达质粒进行测试(图2),其中通过用XbaI和Bst1107l消化载体和插入,然后用T4连接酶连接,来克隆由GeneArt生成的P196PR2的DNA。BHK细胞用这种P-Prot(P-蛋白和蛋白酶)构建体转染,并用VSV-ΔP变体感染。VSV-ΔP配备红色荧光蛋白(RFP)作为报告基因。对于VSV-ΔP的功能,工作P-蛋白是必需的,它是由表达P-Prot的细胞反式提供的。在此设置中,我们可以证明VSV-ΔP-RFP的活性与蛋白酶抑制剂(安普那韦,浓度为0.1、1和10μM)的存在直接相关。在没有蛋白酶抑制剂的情况下,P-蛋白被切割并且没有检测到RFP信号。
L-蛋白
VSV L病毒插入通过四片段Gibson组装引入整个VSV基因组。载体的较大部分(片段4)由pVSV-GFP的酶SfoI和FseI限制性内切酶消化提供。使用对柔性(GGSG)3-接头特异的引物序列将HIV蛋白酶二聚体插入物(片段1)扩增,所述接头位于构建体的两端(SEQ IDNO:4的DNA序列;SEQ ID NO:29的氨基酸序列)。在片段3的5'末端使用引物MT1620-insertGGSG(SEQ ID NO:25)将围绕片段1(片段2和3)的L蛋白序列从引入突出端的pVSV扩增至(GGSG)3接头,而在片段2的3'末端,使用引物MT1620-insertGGSG rev(SEQ ID NO:26)。L-蛋白的cDNA序列为SEQ ID NO:2,氨基酸序列为SEQ ID NO:28,而插入物是在SEQ IDNO:28的氨基酸位置1620处引入的。所得的带有蛋白酶插入物的L蛋白具有SEQ ID NO:10的DNA序列,如通过测序所证实的。此外,使用正向引物49bp-before-FseI[5’-GCT GCC AAGTAA TAC ACC GG-3’](SEQ ID NO:23)在片段2的5'末端引入了片段4的突出端,该引物结合最近的限制酶切位点FseI上游的49个核苷酸,而在片段3的3′末端使用反向引物50bp-after-SfoI[5’-TTT ATC TCC TCC TAA AGT TTC-3’](SEQ ID NO:24),该引物结合最近的限制酶切割位点SfoI下游的50个核苷酸。
VSV载体
WT VSV载体(Indiana)和VSV-GFP载体(Indiana)分别具有SEQ ID NO:20和SEQ IDNO:21的DNA序列(更多详情参见Schnell et al.,J Virol.1996,70(4):2318-2323、Boritzet al.,J Virol,1999.73(8):6937-6945和Muik et al.,Cancer Res.2014,74(13):3567-3578)。VSV-GFP-ΔP(缺乏病毒包膜蛋白P的重组VSV Indiana株)的产生与别处记载(Muiket al.,J Mol Med(Berl),2012,90(8):959-970)类似。对于Prot-On病毒,在10μM安普那韦存在的情况下回收感染性病毒,而对于不含蛋白酶的病毒和Prot-Off病毒,在没有安普那韦的情况下,使用标准的辅助无病毒磷酸钙抢救技术在293T细胞中回收感染性病毒(Witkoet al.,J Virol,2006,135(1):91-101)。将BHK21细胞用于扩增具有复制能力的VSV变体。
细胞系
将BHK-21细胞(美国典型培养物保藏中心,马纳萨斯,弗吉尼亚州)在格拉斯哥最低必需培养基(GMEM)中培养,该培养基补充有10%胎牛血清、5%胰蛋白酶磷酸肉汤、100单位/ml青霉素和0.1mg/ml链霉素。
293T细胞(293tsA1609neo)和293-VSV(表达VSV的N、P-GFP和L的293细胞(Pandaet al.,J Virol,2010,84(9):4826-4831))在Dulbecco改良Eagle培养基(DMEM)中培养,该培养基补充有10%FCS、1%P/S、2%谷氨酰胺、1x丙酮酸钠和1x非必需氨基酸。
计算机实验
结构可视化和分子建模:使用Coot 0.8.7.1(Emsley et al.,Acta CrystallogrD Biol Crystallogr,2010,66(Pt4):486-501)和UCSF Chimera 1.12(Pettersen et al.,J Comp Chem,2004,25(13):1605-1612)分析所有结构。分子结构图像使用UCSF Chimera1.12生成。VSV-L-MT1620-mCherry模型生成如下:将具有SEQ ID NO:28氨基酸序列的VSVL-蛋白(蛋白质数据库(PDB)登录号5a22)和具有SEQ ID NO:11的DNA序列的mCherry(PDB登录号2h5q)(带接头)接入ZDock服务器(Pierce et al.,Bioinformatics,2014,30(12):1771-1773)。VSV L-蛋白被定义为参比结构,无约束mCherry以刚体模式与其对接。选择了高命中(top hits)之一,因为mCherry的N和C端位于MT1620(甲基转移酶结构域(MT)插入位点中SEQ ID NO:28的氨基酸1620)附近。随后,使用FiberDock(Mashiach et al.,Poteins,2010,78(6):1503-1519)进行刚体蛋白质对接解决方案的柔性改进。在Coot 0.8.7.1中将(GGSG)3-接头手动引入并使用ModLoop建模(Pieper et al.,Nucleic Acids Res,2014,42(Database issue):D336-346)。
RNA提取、cDNA合成和PCR
首先,根据制造商的说明,通过病毒DNA/RNA试剂盒peqGOLD(Peqlab)纯化病毒RNA。随后,根据制造商的说明,使用RevertAid第一链cDNA合成试剂盒(Thermo FisherScientific)进行cDNA合成。然后使用热启动高保真DNA聚合酶(NEB)进行PCR。根据NEB退火温度计算器的建议选择退火温度。延伸时间为1分钟/1000个核苷酸。
复制动力学
BHK-21细胞以1x105个细胞/孔接种在24孔板中,并在37℃下孵育过夜。第二天,去除培养基并用相应VSV变体以0.1的感染复数(MOI)感染细胞。细胞与接种物一起孵育1小时,随后用PBS洗涤两次。向细胞中加入1ml新鲜培养基,并将细胞在37℃下孵育。洗涤后直接采集0小时值。此外,在4小时、8小时、12小时、16小时、24小时和36小时后采集上清液。将样品储存在-80℃直到通过TCID50对BHK21细胞测定病毒滴度。
剂量反应
BHK-21细胞以1x105个细胞/孔接种在24孔板中,并在37℃下孵育过夜。第二天,去除培养基并用相应VSV变体以1的感染复数(MOI)感染细胞。施加了0、30nM、100nM、300nM、1μM、3μM、10μM、30μM和100μM的安普那韦浓度。在感染后24小时采集病毒后代。
TCID50试验
如前所述,使用方法,使用50%组织培养感染剂量(TCID50)试验测定病毒滴度(Kaerber,Archiv für Experimentalle Pathologie undPharmakologie,1931,162:480-483)。简而言之,制备了病毒的10倍系列稀释液。将100μl的每种稀释液一式四份添加到96孔板中汇合的BHK-21细胞中,并在37℃下孵育24-48小时,直到细胞病变效应可见。计数感染孔的数目并计算TCID50-值。
体外细胞毒性试验
通过结晶紫染色和固定60%汇合度的感染的BHK-21细胞获得噬菌斑(15g来自Fluka的结晶紫、85ml乙醇、250ml 37%甲醛,用H2O补足至1000毫升)。固定前的最终汇合度约为80%。制备病毒原液的5倍系列稀释液:1:106.5、1:107、1:107.5、1:108、1:108.5和1:109用于感染6孔板中的细胞。感染后一小时,用PBS洗涤细胞并用2.5%噬菌斑琼脂糖/GMEM混合物覆盖。琼脂糖/培养基混合物在固定前小心地从孔中取出,在感染后24小时用结晶紫进行固定。
IFN杀伤试验
在干扰素反应试验中评估病毒细胞杀伤,其中用递增量(10、100、500和1000U/ml)重组通用I型IFN(PBL assay science,Piscataway Township,NJ)处理具有IFN-感受态的BHK-21细胞,并以MOI 0.1、1和10感染。在INF处理前一天,以104接种细胞。在感染前16小时进行INF处理。感染持续72小时。此后,加入噻唑蓝,持续4小时。然后将细胞溶解在含有x gSDS的0.1M NaCl中另外持续4小时。在540nm处测量MTT-Formazan。
噬菌斑试验
用系列稀释的病毒原液感染BHK-21细胞的单层。感染后一小时,将细胞用PBS洗涤两次,并用1:1稀释的2.5%plaque琼脂糖和完全DMEM培养基覆盖。第二天除去plaque琼脂糖并使用结晶紫对细胞进行染色。
免疫印迹
将BHK-21细胞用VSV、VSV-GFP、VSV-L-mCherry或VSV-GPF-L-mCherry感染,MOI为5,并在4、8、12和24小时后制备细胞裂解物。将未感染的BHK-21细胞用作对照。将细胞在冰冷的细胞裂解缓冲液(50mmol/升HEPES,pH 7.5;150mmol/升NaCl;1%Triton X-100;2%抑肽酶;2mmol/升EDTA,pH 8.0;50mmol/升氟化钠;10mmol/升焦磷酸钠;10%甘油;1mmol/升钒酸钠;和2mmol/升Pefabloc SC)中裂解30分钟。为了处理细胞碎片,将细胞裂解物在13.000rpm下离心10分钟。将含有蛋白质的上清液储存在-80℃。
蛋白质裂解物的SDS-PAGE在还原条件下在12%聚丙烯酰胺凝胶上进行。为了比较VSV、VSV-GFP、VSV-L-mCherry和VSV-GFP-L-mCherry,使用了8小时时间点裂解物。通过使用罐式印迹系统将蛋白质转移到0.45μm硝酸纤维素膜(Whatman,Dassel,德国)上。印迹时间为90分钟。将所述膜用含有5%脱脂牛奶和0.1%Tween 20(PBSTM)的1x PBS封闭过夜,并与在PBSTM中以1:1,000稀释的mCherry特异性兔单克隆抗体在室温下孵育3小时。该抗体是针对重组mCherry产生的,并在内部纯化(稍后发布)。将来自山羊的过氧化物酶偶联的兔IgG特异性抗体(Invitrogen,Carlsbad,CA)洗涤后,加入在PBSTM中1:5,000稀释的溶液,并将印迹再孵育一小时。充分洗涤印迹后,用增强的化学发光(ECL)显影。在第一次检测后,相同的印迹被彻底清洗并重新用于染色以进行上样对照。用来自小鼠的β-肌动蛋白特异性单克隆抗体(A2228;Sigma,慕尼黑,德国)将肌动蛋白染色,在PBSTM中以1:5,000稀释,并使用来自山羊的二级辣根过氧化物酶偶联的小鼠IgG特异性抗体。洗涤、孵育时间和印迹显影按上述第一次检测的方法进行。
转染
L-mCherry表达质粒的转染使用来自Mirus的转染试剂盒在293T细胞中进行。根据制造商对24孔板的建议选择质粒DNA和转染试剂量,其中在转染前一天,每孔接种2.7*105个293T细胞。将P表达质粒与L-mCherry表达质粒共转染。转染后24小时,将293T细胞用VSV-GFP-ΔL感染,MOI为10。感染后48小时获取图像。
动物实验
动物实验遵守国家动物实验法。动物试验许可已获得国家主管部门的批准。
立体定向:用小鼠立体定向框架(Harvard Apparatus,Hollistion-MA)进行病毒的立体定向小鼠脑注射。麻醉由100mg/kg氯胺酮和10mg/kg甲苯噻嗪混合物诱导。手术后用5mg/kg酮洛芬进行镇痛治疗,用5mg/kg恩诺沙星进行抗生素治疗。使用饮用水中的口服布洛芬溶液(0.1mg/ml)持续进行镇痛治疗。在立体定向手术期间,小鼠被固定在立体定向框架中。小鼠头被剃光,用2x必妥碘和2x EtOH清洗。用手术刀打开头皮。注入孔的位置通过朝向前囟(Bregma)定位。用电钻(FST,Foster city CA)钻出直径为1mm的注入孔。病毒注射量为10μl,注射速度为1μl/min。手术期间将小鼠放在加热垫上,用凡士林保护眼睛。
图像分析:使用荧光显微镜(日本尼康)用于分析小鼠脑和肿瘤的培养和组织切片中的病毒感染细胞。
统计分析:通过学生t检验和方差分析(ANOVA)确定统计显著性。P值低于0.05被认为是显著的。使用GraphPad prism软件(GraphPad Software,Inc.,La Jolla,CA)用于统计分析和数据呈现。使用Adobe Photoshop软件用于合成多色照片组和叠加层。
实施例1:生成蛋白酶调节的ON开关,VSV-P-prot
为了产生可调节的开关来控制RNA病毒的活性,我们开发了一个系统,将具有自催化活性的蛋白酶序列整合到对VSV基因表达和复制必不可少的基因中(图1a)。在我们的第一个ON-开关构建体中,我们将HIV蛋白酶二聚体引入VSV聚合酶的辅因子,即P-蛋白(SEQID NO:1),产生VSV-P-prot。先前已证明分子内插入位点不影响P蛋白功能(Das et al.,JVirol.,2006,80(13):6368-6377)。HIV蛋白酶功能需要二聚化。为了促进即时的翻译后蛋白水解活性,基因插入构建体被设计为包含由一个柔性的接头连接的两个拷贝的HIV蛋白酶(PR)(图1b、2)(Krausslich,PNAS,1991,88(8):3213-3217)。柔性接头(SEQ ID NO:8和9)也应用于蛋白酶构建体(SEQ ID NO:5)的上游和下游,产生具有切割位点的蛋白酶二聚体和具有SEQ ID NO:4的编码序列的接头,以确保融合蛋白其余部分的蛋白酶的独立功能(Chen et al.,Adv Drug Deliv Rev,2013,65(10:1357-1369)。两个蛋白酶序列的密码子使用是一种折衷,以考虑人类密码子使用和两个序列之间的协调以避免序列同源性,从而最大限度地减少复制过程中发生复制选择事件的风险(Simon-Loriere and Holmes,NatRev Microbiol,2011,9(8):617-626)。得到的氨基酸序列(SEQ ID NO:29)如图5所示。如图4和5所示,单链连接的二聚体(PR2)还侧接是相应的切割位点(SEQ ID Nos:6和7)(deOliveira et al.,J Virol,2003,77(17):9422-9430),并并在aa196(P196)位置被克隆到VSV P蛋白的柔性铰链区,这先前被描述为耐受功能性分子内插入(Das et al.2006)。
为了确认具有整合的自蛋白水解ON开关的完整VSV磷蛋白功能,我们用编码分离的P196PR2构建体的质粒转染BHK细胞,然后用缺乏P蛋白并在其位置(VSV-ΔP-RFP)表达红色荧光蛋白(RFP)报告基因的VSV感染(Muik et al.,J Mol Med(Berl),2012,90(8):959-970)。VSV-ΔP-RFP感染细胞中的RFP信号仅在存在P196PR2和特定HIV蛋白酶抑制剂(此处:安普那韦)时才可检测到(图3,照片B1-B3)。蛋白酶抑制剂的不存在导致缺乏病毒基因表达和病毒复制(图3,照片A1-A3),这表明P196PR2维持基本的病毒P蛋白功能,并且可以通过抑制蛋白水解ON开关来控制。
我们接下来生成了一个表达P196PR2的重组VSV代替其天然P蛋白(VSV-P-prot),它还在第5个基因位置包含一个eGFP报告基因(图4)。VSV-P-prot的拯救和增殖是在含有10μM安普那韦的培养基条件下进行的。PCR扩增和测序证实了P196PR2构建体正确整合到VSV基因组中(图6A)。在安普那韦(10μM)存在的情况下,用VSV-P-prot感染BHK细胞在24小时内产生强烈的GFP信号,但在没有安普那韦(10μM)的情况下则不是,这表明提供的蛋白酶抑制控制了VSV-P-prot的基因表达(图6B)。相反,通过VSV-P-prot的病毒噬菌斑形成观察到的病毒复制也被发现是蛋白酶抑制剂依赖性的(图6C)。病毒RNA被逆转录并进行序列确认。来自病毒基因组序列的插入物与病毒构建质粒完全对应。
实施例2:VSV-P-prot可以以剂量依赖性方式并被多种HIV蛋白酶抑制剂调节
为了测试VSV-P-prot的安普那韦依赖性活性是否一般地适用于HIV蛋白酶抑制剂类的其他成员,BHK细胞与第二代化合物沙奎那韦(10μM)和茚地那韦(10μM)一起孵育,然后用VSV-P-prot感染,MOI为0.01。与安普那韦效应一致,两种抑制剂都促进了病毒基因表达(GFP信号)和病毒复制(噬菌斑形成)(图7),证实了基于HIV蛋白酶的VSV ON开关系统的普遍靶向性。洛匹那韦(10μM)和其他HIV蛋白酶抑制剂也显示出调节VSV-P-prot(数据未显示)。
用于病毒生产和初始研究的安普那韦剂量是根据先前描述的APV口服治疗患者的APV血浆浓度选择的(Sadler et al.,Antimicrob Agents Chemother,1999,43(7):1686-1692)。此外,还进行了一项剂量反应研究,以确定安普那韦控制的VSV-P-prot活性是否具有剂量依赖性。如前所述,评估了安普那韦对病毒基因表达(GFP)和病毒复制(TCID50复制试验)两者的影响。感染BHK细胞,MOI为1,并在24小时后评估病毒感染(图8A)。单步生长曲线显示VSV-Pprot活性开始于100nM安普那韦剂量,在3-100μM剂量范围内达到最大活性平台,并在更高剂量下恶化(图8B)。没有P-prot控制机制的标准重组VSV的病毒复制导致高1.5log的滴度,并且不受高达30μM的安普那韦剂量的影响,这表明安普那韦在没有P-prot开关的情况下不控制VSV复制。复制曲线显示VSV-P-prot比VSV略有衰减。
实施例3:VSV-Pprot缺乏神经毒性和颅内扩散
众所周知,VSV一旦进入CNS空间,就会对实验动物产生明显的神经毒性。VSV糖蛋白对神经元显示出很强的亲和力,并且已经描述了顺行和逆行轴突扩散。为了确定VSV-P-prot与正常VSV相比在多大程度上消除了神经毒性,我们采用了直接立体定向注射到小鼠纹状体。颅内滴注野生型VSV-dsRed(2x105TCID50,2μl)导致出现深度神经毒性体征(图9A),表现为注射后2天内出现后肢瘫痪、缺乏协调、驼背体位和严重体重下降(图9C)。出于人道原因,必须在4天内对所有小鼠实施安乐死(图9B)。与此形成鲜明对比的是,以相同剂量向大脑注射VSV-P-prot时,未出现神经毒性体征。当与安普那韦和利托那韦同时处理(腹腔注射100μl PBS中的100μM安普那韦、25μM利托那韦(抑制APV降解),每天施用两次,持续10天)时,小鼠在颅内注射VSV-P-prot后也没有表现出与大脑相关的不良体征(图9A-C)。为了研究立体定向注射后潜在的颅内扩散,在毒性相关安乐死(VSV-dsRed)当天或VSV-P-prot接种后第10天收获大脑。冠状脑切片的组织学荧光分析揭示了表达红色荧光的VSV-dsRed的扩展扩散。在整个纹状体、皮层下区域和下丘脑(双侧)发现病毒感染。相比之下,来自VSV-P-prot的GFP表达被高度限制在注射针道的紧贴层,没有任何VSV-P-prot颅内扩散的迹象,无论是否全身应用安普那韦(图9D)。这些数据证实VSV-P-prot与VSV典型的神经毒性和颅内扩散无关。
因此,通过完全消除与亲本VSV相关的神经毒性和颅内扩散,在体内也证实了配体依赖性病毒活性。由于安普那韦不会穿过血脑屏障,因此全身应用该化合物不会赋予病毒活性,并且尽管存在全身性ON系统,但不存在神经毒性。
实施例4:VSV-P prot蛋白酶抑制剂依赖性的遗传稳定性
RNA病毒容易发生频繁突变,以VSV为例,突变率约为万分之一(Steinhauer andHolland 1986,Steinhauer,de la Torre et al.1989)。为了测试VSV-P-prot的可调节病毒控制ON开关是否在多个病毒复制轮次中保持功能稳定,我们在最佳(10μM)和次优(1μM)安普那韦条件下采用体外连续病毒传代。在每次传代后,将上清液样品转移到没有安普那韦孵育的平行培养皿上后,通过GFP表达评估蛋白酶抑制剂的依赖性。20次传代(P20)后,未观察到安普那韦逃逸病毒变种(图10A)。为了确认VSV-P-prot的基因组完整性,从次优安普那韦处理的病毒繁殖的P20代采集的病毒基因组RNA被纯化、逆转录,并对插入物P-196PR2进行PCR。将没有蛋白酶插入的VSV变体用作阴性对照。我们发现P-196PR2和蛋白酶阴性P蛋白PCR片段达到其预期大小(图10B)。P-prot位点的后续测序以及与亲本质粒构建体(SEQID NO:4)中的相应序列的比对比较揭示了构建体中的一个突变(蛋白酶2:核苷酸G23A;氨基酸R8K),这并未使构建体失去功能。这种突变是否在功能上完全沉默,是否反映了对低APV浓度的适应或稀有密码子(R:7%)到频繁密码子(K:74%)的交换,还有待观察。
实施例5:鉴定VSV L蛋白中的蛋白酶插入位点
为了测试病毒控制自催化活性蛋白酶方法在插入替代的必需VSV蛋白时是否也能发挥作用,我们试图生成VSV-L-prot。由于迄今为止尚未成功报道稳定和未减毒的分子内插入(Ruedas and Perrault,J Virol,2009,83(23):12241-12252;Ruedas and Perrault,J Virol,2014,88(24):14458-14466),我们首先着手研究VSV L蛋白是否具有耐受报告基因(mCherry)插入的能力。我们使用结构引导的方法来识别mCherry的五个不同L蛋白插入位点(具有SEQ ID NO:28的氨基酸序列的L蛋白的氨基酸位置CD1506、CD1537、MT1603、MT1620和MT1889),我们认为这是合理的,因为它们位于表面并且在柔性环中,这应该最大限度地减少空间冲突的可能性(图11A、C)。我们还避免了alpha螺旋和beta折叠中的插入位点,以保护L蛋白的结构完整性。图11D描绘了在MT1620处插入的模型,其产生了如下所述的具有复制能力的病毒。为了筛选推荐的候选插入位点的计算机设计结构预测,生成了在CD1506、CD1537、MT1603、MT1620和MT1889具有插入的VSV L-蛋白表达载体。在HEK细胞中转染这五种构建体后,用编码eGFP作为报告分子的繁殖障碍性VSV-GFP-ΔL病毒进行感染。在该筛选中,所有位点都显示mCherry信号,但只有两个位点(CD1506、MT1620)显示eGFP信号,从而表明L-mCherry融合蛋白的转录活性(图12A)。因此,每个插入位点都允许正确的mCherry折叠,尽管效率不同,但只有两个插入保留了聚合酶活性。为了测试eGFP阳性克隆的病毒复制能力,我们选择在完整的VSV基因组中克隆这些位点(CD1506、MT1620)。每个位点都被克隆到两个VSV主干中,一个在基因组的第五个位置具有eGFP作为报告分子,另一个没有eGFP。即使经过多次尝试,也无法挽救带有CD1506构建体的VSV变体。相比之下,VSV-L-MT1620和VSV-GFP-L-MT1620病毒拯救产生了具有复制能力的病毒。这由细胞病变效应和荧光信号证实(图12B)。正如预期的那样,VSV-eGFP-L-MT1620-mCherry在FITC(绿色)和TRITC(红色)通道中均显示荧光信号,而VSV-L-MT1620-mCherry仅在TRITC通道中显示。每一侧各有一个接头的mCherry具有SEQ ID NO:11的DNA序列。VSV-L-MT1620-mWasabi在FITC通道中显示绿色荧光(图12B)。蛋白质mWasabi同样在每一侧都有一个接头,并由SEQ ID NO:12的DNA序列编码。为了在蛋白质水平验证mCherry的存在,我们使用mCherry特异性抗体进行了免疫印迹。BHK-21细胞用VSV、VSV-GFP、VSV-L-MT1620-mCherry和VSV-GFP-L-MT1620-mCherry感染。作为阳性对照,在BHK-21细胞中转染仅包含mCherry的载体。根据病毒感染后L-mCherry融合蛋白的产生,L-蛋白中的mCherry显示出高分子量信号(预计为267kDa)(图12C)。
综上所述,这些结果表明mCherry成功插入到MT1620位置,从而产生了具有复制能力的病毒。
为了评估与基于野生型的VSV相比VSV-L插入物的复制能力和潜在衰减,进行了噬菌斑试验以说明噬菌斑大小(图13A),并进行了TCID50测定以量化病毒复制(图13B)。两项测试均显示与野生型VSV相比,VSV-L-插入物减弱,病毒复制滴度降低约1-2个对数。此外,进行MTT活力测定以评估,与VSV相比,VSV-L插入物在存在或不存在干扰素的情况下在BHK细胞中诱导细胞杀伤的能力。在没有IFN的情况下,VSV-L插入物感染后的病毒细胞毒性与VSV感染相当(图13C)。在存在IFN的情况下,两种L-MT1620-mCherry VSV变体表现出更强的IFN依赖性,因此与VSV和VSV-GFP相比,杀伤力略有降低(图13C;GFP变体的数据未示出),证实了与野生型VSV相比,在MT1620位置插入mCherry导致轻度衰减,而不会显著损害其复制或细胞溶解潜力的发现。
本实施例中得到的L-mCherry的测序结果提供为SEQ ID NO:13的序列。在对所有拯救的VSV-L插入变体进行序列确认后,我们在大多数病毒中观察到一到三个次级非同义突变,这些突变位于插入位点附近。这些突变对于适当的聚合酶功能可能是有条件的和有利的。
实施例6:生成替代的蛋白酶调节ON开关,VSV-L-prot
在VSV L蛋白中发现了一个功能性插入位点,这使我们能够生成替代的可调节的VSV-prot变体VSV-L-Prot。与VSV-P-prot类似,VSV-L-Prot在L-蛋白(SEQ ID NO:10)中包含蛋白酶插入物,因此对APV响应并在其(还有沙奎那韦和茚地那韦)存在下复制到高滴度,并且在没有蛋白酶抑制剂的情况下不会复制(图14A)。
为了测试VSV-L-prot的基因组完整性,将病毒基因组RNA纯化、逆转录,并对L-MT1620PR2进行PCR。将没有蛋白酶插入的VSV变体用作阴性对照。我们发现L-MT1620PR2和蛋白酶阴性L蛋白PCR片段达到其预期大小(图14B)。
我们用两个Sanger测序反应对插入位点进行了测序,以评估蛋白酶二聚体序列中是否发生了突变。将测序结果与质粒序列比对。我们在蛋白酶二聚体序列中没有观察到突变。
实施例7:VSV-Lprot可以以剂量依赖性方式进行调节
与VSV-P-prot类似,还进行了一项剂量反应研究,以确定安普那韦控制的VSV-L-prot活性是否具有剂量依赖性。如前所述,评估了安普那韦对病毒基因表达(GFP)(图15A)和病毒复制(TCID50复制试验)两者的影响(图15B)。VSV-L-prot活性在安普那韦剂量为100nM时开始,在30μM的剂量时达到最大活性。未针对L-prot测试更高浓度的安普那韦,因为在我们之前的VSV-P-prot研究中,它们已显示出通过对细胞有毒而降低滴度。复制曲线还揭示了VSV-L-prot相对于VSV的轻度衰减,这与通过VSV-P-prot所见到的相当。
实施例8:生成串联的蛋白酶调节的ON开关,VSV-P-L-prot
为了确定可能失去条件ON开关控制的回复突变病毒发展的可能性,我们进一步研究了在P-蛋白和L-蛋白中的插入物的可能性。我们接下来生成了具有功能性双分子内插入P和L的VSV,即VSV-P-mWasabi-L-mCherry,作为功能性双插入物VSV变体的初步概念证明。我们通过噬菌斑试验中的双荧光读出和细胞病变效应(图16A)以及通过cDNA合成/PCR和Sanger测序测试基因组完整性证实了双插入功能。
为了测试VSV-P-mWasabi-L-mCherry的基因组完整性,对病毒基因组RNA进行纯化、逆转录并对P-196-mWasabi(SEQ ID NO:15)和L-MT1620-mCherry(SEQ ID NO:14)进行PCR。使用没有荧光蛋白插入的VSV变体作为阴性对照。我们发现P-196-mWasabi、L-MT1620-mCherry和荧光蛋白阴性P和L蛋白PCR片段的大小达到预期(图16B)。
我们用两个Sanger测序反应对插入位点进行了测序证实,以评估荧光标记序列中是否可能发生突变。将测序结果与质粒序列比对。我们在插入序列中没有观察到突变。测序结果在VSV-P-mWasabi-L-mCherry的P-196-mWasabi和L-MT1620-mCherry的cDNA序列中分别提供为SEQ ID NO:14和SEQ ID NO:15。
在确认串联分子内插入的可行性后,我们接下来生成了双ON开关调节的VSV变体VSV-P-L-prot。该病毒已被成功拯救,其行为似乎与单开关结构VSV-P-prot和VSV-L-prot相似。该病毒还表现出蛋白酶抑制剂依赖性,仅在安普那韦存在时产生噬菌斑(数据未示出)。然而,与单开关病毒相比,双开关病毒表现出略强的衰减。
因此,总体上,我们生成了构建体,其中HIV蛋白酶二聚体在分子内插入到构成聚合酶复合体的水泡性口炎病毒(VSV)的两种蛋白质中(P-蛋白和L-蛋白,单独地和组合地)。在蛋白酶抑制剂的存在下,病毒蛋白的完整性得以保留,病毒可以复制。在没有蛋白酶抑制剂的情况下,HIV蛋白酶二聚体具有自催化活性,在翻译时切割必需的病毒蛋白。类似于DNA病毒中的调节模块(例如Tet-On),我们将这种机制称为“prot-ON”。
我们优化了柔性接头和蛋白酶二聚体的密码子使用,以避免第一个和第二个蛋白酶之间的同源性。采取了这种预防措施,因为VSV中所谓的“复制选择”重组事件之前已经描述过(Simon-Loriere and Holmes 2011),其中病毒聚合酶L蛋白可以在模板之间切换并跳过序列延伸。优选地,当聚合酶由新生RNA链与新选择的模板的序列同源性引导时,就会发生“复制选择”。此外,点突变在RNA病毒中经常出现,对于突变率约为10,000个中1个核苷酸。从理论上讲,每个基因组都带有一个突变,这导致病毒学家认为VSV基因组(以及其他RNA病毒基因组)并非一个序列,而是所谓的“准物种”的混合物。因此,在HIV蛋白酶序列中发生突变使蛋白水解开关失活是一种真正的可能性。为了避免可能失去条件性ON开关控制的此类逃逸突变体或回复突变的病毒,我们通过在第二必需VSV蛋白,即P-蛋白和L-蛋白中引入蛋白酶二聚体来使蛋白酶模块(ON开关)加倍。
唯一其他先前公布的在VSV蛋白中的功能性分子内插入位点已在M蛋白中进行了描述,它支持病毒在连续传代中复制(Soh and Whelan,Virol,2015,89(23):117050-11760)。然而,优选直接控制VSV的复制机制,因为M蛋白的调节仍然允许病毒进行复制,可能促进逃逸突变。已经描述了L蛋白内的插入位点,但由此产生的病毒在传代后对温度敏感且不稳定(Ruedas and Perrault 2009,Ruedas and Perrault 2014)。相比之下,我们能够用最初的荧光蛋白和随后的HIV蛋白酶二聚体产生功能性插入。P-prot和L-prot都对我们测试的每种HIV蛋白酶抑制剂的存在作出反应,并以化合物剂量依赖性方式进行复制。在没有蛋白酶抑制剂的情况下,病毒基因表达停止并且复制停止。
尽管在本研究中未进行测试,但ON开关系统本身具有额外的环境安全要素。由于病毒后代依赖于蛋白酶抑制剂的存在,因此可能脱落的病毒对产毒性感染没有活性。当治疗性RNA病毒可引起或模仿应通报的动物疾病时,这一点尤为重要。
实施例9:生成蛋白酶调节的OFF开关,VSV-GFP-prot-L
在生成基于蛋白酶的ON开关之后,我们还生成了一个可以关闭的VSV变体VSV-Prot-Off。使用相同的HIV蛋白酶介导的自催化开关系统,插入从分子内到分子间位点的位置变化导致从病毒促进到病毒停止控制的方向逆转。对于这种OFF-开关,具有变异密码子优化的蛋白酶二聚体被插入到VSV基因组中,以创建GFP、蛋白酶二聚体和病毒聚合酶L的融合蛋白。具有融合到L-蛋白的N端的蛋白酶二聚体的这种大的融合蛋白预计在功能上是无活性的,但在没有蛋白酶抑制剂的情况下通过L-蛋白的蛋白水解释放被激活。在这个OFF构建体中,我们用位于其切割位点两侧的HIV蛋白酶替换了VSV的基因间区域。基因间区域在从一条RNA链生成多种蛋白质方面起着至关重要的作用。我们选择了VSV-GFP中非必需报告蛋白GFP和L蛋白(图17A)之间的基因间区域,并生成了两种病毒。第一种带有围绕HIV蛋白酶二聚体构建体的柔性接头区域(SEQ ID NO:16),而第二种不具有围绕HIV蛋白酶二聚体构建体的区域(SEQ ID NO:17)。避免柔性的接头区域将是有利的,因为在HIV蛋白酶二聚体切割其识别序列后,它们将作为GFP上的C端标签和L蛋白上的N端标签保留。然而,这两种构建体的复制能力仅略有不同。添加安普那韦(10μM)导致病毒活性在病毒转基因表达(GFP)和病毒复制(噬菌斑试验)水平上停止(图18A)。该系统增加了一个额外的独特安全功能。从理论上讲,蛋白酶插入物的可能丧失可能导致病毒后代逃离OFF开关控制。因此,我们将蛋白酶OFF开关代替基因间区域,这样插入物丢失将伴随形成两个相邻VSV蛋白的融合蛋白的不利后果,或者在这种情况下,带有GFP的VSV蛋白导致功能失调的病毒。
为了测试VSV-GFP-Prot-L的基因组完整性,对病毒基因组RNA进行纯化、逆转录并在GFP-Prot-L上进行PCR。将没有蛋白酶插入的VSV变体用作阴性对照。我们发现VSF-GFP-Prot-L和蛋白酶阴性L蛋白PCR片段达到其预期大小(图18B)。
我们用两个Sanger测序反应对插入位点进行了测序,以评估蛋白酶二聚体序列中是否发生了突变。将测序结果与质粒序列比对。我们在每个构建体的蛋白酶二聚体序列中观察到一个突变。突变位于具有接头的构建体中的氨基酸位置85,对应于具有SEQ ID NO:18序列的具有接头的蛋白酶二聚体的cDNA序列的nt 623(或第二蛋白酶核苷酸序列的nt254),和在没有接头的构建体中的氨基酸位置86,对应于具有SEQ ID NO:19的序列的没有接头的蛋白酶二聚体的cDNA 序列的nt 589(或第二蛋白酶核苷酸序列的nt 256),两者都在第二蛋白酶中。这些突变未被描述为典型的蛋白酶抑制剂抗性突变,并且不会干扰蛋白酶抑制剂的调节。可能这些突变使蛋白酶融合在GFP和L之间时更加活跃。
实施例10:VSV-GFP-prot-L可以以剂量依赖性方式并被不同的蛋白酶抑制剂调节
与所述两种prot-ON构建体类似,还进行了一项剂量反应研究,以确定安普那韦控制的VSV-GFP-Prot-L(VSV-Prot-Off)的活性是否具有剂量依赖性。如前所述,评估了安普那韦对病毒基因表达(GFP)和病毒复制(TCID50复制试验)两者的影响(图19A和B)。在不存在蛋白酶抑制剂的情况下,与正常VSV相比,VSV-GFP-Prot-L活性未减弱。VSV-GFP-Prot-L活性在低安普那韦浓度(0–300nM)时很高,在1μM时开始下降。我们还测试了VSV-GFP-Prot-L是否会对除安普那韦以外的其他蛋白酶抑制剂产生反应。10μM沙奎那韦处理导致比安普那韦更强的病毒复制抑制作用(图19B)。这在图19C中使用0–30μM的沙奎那韦浓度进一步证实。此外,通过在12孔板中每孔接种105个BHK细胞并用VSV-Prot-Off或VSV-GFP感染(MOI为3)来确定单步复制动力学(图19D)。感染后一小时,将细胞用PBS洗涤两次并在500μl GMEM中孵育直至指定的时间点。对于起始值,即0小时时间点,立即采集500μl GMEM。与VSV-GFP相比,VSV-Prot-Off没有显示出衰减(图19D)。
因此,使用与“prot-ON”构建体相同的自蛋白水解系统,但在功能上不同的基因组位置,我们还开发了蛋白酶依赖性OFF调节的逆转机制,该机制通过用HIV蛋白酶二聚体替换基因间区域来发挥作用。在该构建体中,蛋白酶必须具有分离两种病毒蛋白的活性,就像它在HIV中所做的那样。在该构建体中添加蛋白酶抑制剂会产生无功能的融合蛋白(多聚蛋白),从而抑制病毒活性。与Tet-On/Tet-Off类似,我们将这种结构称为“prot-Off”。为了优化病毒活性控制,设计了ON和OFF开关以通过调节病毒复制/转录机制的蛋白质来干扰病毒增殖的早期阶段。因此,我们的方法扩展了并可能优于当前的RNA病毒调节方法。
Prot-Off病毒中基因间区域的替换已在非必需报告蛋白GFP和必需L蛋白之间举例说明,然而,Prot-Off可以同样替换将必需病毒蛋白与其他病毒蛋白连接的基因间区域,从而使病毒更安全,因为蛋白酶构建体的缺失将导致无功能的融合蛋白。经典的抗性突变,因为它们在用蛋白酶抑制剂连续治疗的情况下发生在HIV中,理论上仍可能发生在Prot-OFF构建体中。然而,可用的蛋白酶抑制剂的广泛范围可以弥补这种点突变。
实施例11:VSV-Pprot可以通过施用蛋白酶抑制剂在体内进行调节
为了在体内验证ON-开关病毒,如实施例1中所述和图4所示产生了表达变体VSV-P-prot-Luc的荧光素酶,包含荧光素酶报告基因代替eGFP报告基因用于体内成像。6-8周龄的雌性无胸腺裸鼠(Janvier Labs,Le Genest-Saint-Isle,法国)被安置在BL2设施中,照明/黑暗周期为12小时,可以不受限制地获取食物和水。对于皮下异种移植物,将含有2x106个细胞的100μl人U87胶质母细胞瘤细胞悬液注射到裸鼠的右侧。植入期后,中值体积为0.1cm3的U87异种移植物被瘤内注射单剂量30μl的VSV-Pprot-Luc或对照缓冲液,其中含有107病毒(通过TCID50滴定)。在病毒应用前一小时开始蛋白酶抑制剂处理(每12小时腹膜内注射50μl在药物载体中的0.8mM APV+0.2mM RTV,所述药物载体含有10%DMSO、40%PEG300、5%Tween80和45%PBS)。将利托那韦作为体内降解酶(Cyp家族)的阻断剂。它增加了其他PI的浓度。正是为此目的,RTV还用作治疗HIV的添加剂。此外,它会阻断p-糖蛋白,因此会增加大脑中其他PI的浓度。如Urbiola C.et al.,(int.J.Cancer,2018,148:1786-1796)所述,使用Lumina II(Perkin Elmer,Waltham,MA)系统对表达VSV变体的荧光素酶进行生物发光体内成像。图20A显示了病毒注射后8天的代表性生物发光图像。在第8天,仅在用蛋白酶抑制剂处理过的小鼠中检测到发光。通过图20B中所示的生物发光成像(BLI)量化的荧光素酶信号数据也证实了这一点。在没有蛋白酶抑制剂的情况下,荧光素酶信号在第2天到第3天之间达到最大,然后开始下降。初始生物发光信号独立于蛋白酶抑制剂应用可以通过以下事实来解释:病毒制剂含有安普那韦以阻止病毒生产和储存过程中的自身蛋白水解。在没有再注射蛋白酶抑制剂的情况下,生物发光信号在3天后显著降低(图20B),随后失去肿瘤控制(数据未显示)。相比之下,在蛋白酶抑制剂的存在下,萤光素酶信号以总体上高得多的水平保持稳定持续17天(图20B),并且肿瘤的大小得到控制(数据未显示)。这些数据证明了ON开关构建体的体内功能性,允许病毒复制和转基因表达,例如在蛋白酶抑制剂存在的情况下,本实验中使用的报告基因荧光素酶或治疗性蛋白质。
实施例12:VSV-L-prot可以通过施用蛋白酶抑制剂在体内进行调节
体内数据可以使用VSV-L-prot以表达GFP作为报告分子进一步确认。如实施例11所述,将裸鼠皮下异种移植U87胶质母细胞瘤细胞。在0.1cm3的中位体积时,向小鼠瘤内注射单剂量的VSV-L-prot、VSV对照或对照缓冲液(模拟)。VSV-L-prot的产生在上述实施例6中描述。蛋白酶抑制剂(PI)混合物包含0.8mM安普那韦(APV)和0.2mM利托那韦(RTV),每12小时以50μl腹膜内施用。用卡尺测量肿瘤并使用以下公式计算体积:长×宽2×0.4。与不使用蛋白酶抑制剂的治疗相比,在蛋白酶抑制剂混合物的存在下,用VSV-L-prot对皮下U87肿瘤的肿瘤内治疗导致肿瘤生长减少(图21A)和增加存活的存活益处(图21B)。该概念验证研究中使用的蛋白酶抑制剂浓度相对较低,可以进一步增加。总体而言,这些数据进一步验证了病毒ON开关的体内适用性。
实施例13:蛋白酶抑制剂在体内调节VSV-Prot-Off活性
我们进一步在体内测试了OFF-开关。6-8周龄的雌性NOD.CB-17-Prkdcscid/Rj小鼠(Janvier Labs,Le Genest-Saint-Isle,法国)被安置在BL2设施中,照明/黑暗周期为12小时,可以不受限制地获取食物和水。对于皮下异种移植物,将含有2x106人G62神经胶质瘤细胞的100μl胶质母细胞瘤细胞悬液注射到NOD-SCID小鼠的右侧。为了测试OFF-开关系统,将中位体积为0.07cm3的G62异种移植物瘤内注射30μl含有2x107病毒(TCID50)的VSV-Prot-Off(n=16)、VSV-GFP(n=8)或对照缓冲液(模拟;n=7)。7天后重复病毒处理。VSV-Prot-OFF(VSV-GFP-prot-L)的产生在上面的实施例6中进行了描述并示于图17A。当观察到肿瘤消退时,在第二次病毒注射后8天开始蛋白酶抑制剂混合物处理(每8小时腹膜内注射50μl在药物载体中的0.8mM SQV+0.2mM RTV,所述药物载体含有10%DMSO、40%PEG300、5%Tween80和45%PBS)。用卡尺测量肿瘤并使用以下公式计算体积:长×宽2×0.4。从第6天开始,用VSV-GFP处理的小鼠显示出神经毒性迹象(图22B)。治疗后15天,VSV-Prot-Off治疗的小鼠中第一只出现神经系统症状,将其余小鼠随机分为2组。一组(n=7)不接受允许连续病毒复制的蛋白酶抑制剂,这维持了肿瘤控制,但也导致了一些小鼠的进一步神经毒性。然而,与亲本VSV-GFP处理的小鼠相比,神经毒性降低(3只vs.8只小鼠中的6只)。第二组(n=8)随后每天用蛋白酶抑制剂混合物(SQV+RTV)处理3次以启动OFF开关。在该组中未观察到神经毒性迹象。在该组中未观察到神经毒性迹象(图22B)。在OFF开关激活后,肿瘤控制减弱并且发生复发(图22A)。
实施例14:如免疫荧光所示,蛋白酶抑制剂在体内调节VSV-Prot-off活性
如实施例13中所述移植异种移植物。对中位体积为0.07cm3的G62异种移植瘤内注射30μl含有2x106病毒(TCID50)的VSV-Prot-Off或VSV-GFP,并且在单一病毒治疗后3天开始蛋白酶抑制剂处理(每8小时腹膜内注射50μl在药物载体中的0.8mM SQV+0.2mM RTV,所述药物载体含有10%DMSO、40%PEG300、5%Tween80和45%PBS)。一周后(第10天)收获肿瘤并使用抗VSV-N抗体染色分析病毒传播。代表性图像(图23)显示了在没有蛋白酶抑制剂的情况下VSV-GFP的广泛肿瘤内扩散和VSV-Prot-OFF的略微降低的肿瘤内扩散,表明VSV-ProtOFF在体内减弱了一定程度。相比之下,病毒接种后3天开始的蛋白酶抑制剂处理消除了病毒的传播,将其限制在较小的隔离区域。.
实施例15:蛋白酶抑制剂沙奎那韦使用具有蛋白酶调节的OFF-开关的VSV调节可溶性IL12表达
为了进一步研究是否可以使用OFF开关来调节治疗性蛋白质的转基因表达,在细胞培养中测试了VSV-GP-IL12-Prot-Off。VSV-GP-IL12-Prot-Off(见图24A的示意性图示,顶部)基于用淋巴细胞脉络丛脑膜炎病毒(LCMV)的糖蛋白(GP)假型化的VSV-GP,并已开发用于克服VSV的神经毒性,如WO 2010/040526中更详细描述的。每孔105个BHK细胞接种在12孔板中。细胞被VSV变体VSV-GP、VSV-GP-IL12、VSV-GP-GFP-IL12-Prot-Off-wl或VSV-GP-GFP-IL12-Prot-Off_w/ol感染,MOI为0.1。感染后一小时,用PBS洗涤细胞并与不含蛋白酶抑制剂的标准GMEM(-ctrl)或10、100、300、1.000、10.000nmol蛋白酶抑制剂沙奎那韦一起温育。感染后30小时,采集上清液。通过TCID50测定病毒滴度。使用和不使用接头(wl,w/ol)的VSV-GP-IL12-Prot-Off的病毒滴度取决于PI沙奎那韦的存在和浓度(图24A)。接下来,进行酶联免疫吸附测定(ELISA)以确定表达的转基因IL12是否也依赖于沙奎那韦浓度。VSV-GP-IL12-Prot-Off-w/ol具有适度优选的滴度特征(更高的滴度,对PI的反应更强),因此用于随后的ELISA。VSV-GP-IL12和未抑制的Prot-Off病毒导致IL12浓度高于测定检测限。仅稀释和测量不含PI的对照样品(-ctrl)。在用不同剂量的沙奎那韦处理的Prot-Off病毒中,IL12浓度与病毒滴度成正比(图24B)。
实施例16:蛋白酶抑制剂阿扎那韦使用具有蛋白酶调节的OFF-开关的VSV调节可溶性IL12表达
每孔105个BHK细胞接种在12孔板中。细胞被VSV变体VSV-GP-IL12、VSV-GP-Luc-IL12-Prot-Off-wl(图25A)、VSV-GP-Luc-IL12-Prot-Off-w/ol(包含GFP而不是Luc,如25A所示)感染,MOI为1。感染后一小时,用PBS洗涤细胞并与不含PI的标准GMEM(-ctrl)或10、100、300、1.000、10.000nmol的最近开发的称为阿扎那韦的蛋白酶抑制剂一起温育。感染后30小时,采集上清液。通过TCID50测定病毒滴度。同样,没有接头的Prot-Off变体复制到更高的滴度并且对阿扎那韦反应更快(图25A)。因此,该变体用于IL12ELISA。VSV-GP-IL12和未抑制的Prot-Off病毒导致IL12浓度高于测定检测限。仅稀释和测量不含PI的对照样品(-ctrl)(图25B)。
实施例17:编码IL12和报告蛋白的具有蛋白酶调节的OFF-开关的VSV的复制动力学
每孔105个BHK细胞接种在12孔板中。细胞被VSV变体VSV-GP-IL12、VSV-GP-Prot-Off-w/ol GFP IL12(图26A,顶部)、VSV-GP-Prot-Off-w/ol Luc IL12(图26A,底部)感染,MOI为3,用于单步复制动力学。感染后一小时,将细胞用PBS洗涤两次并在500μl GMEM中孵育直至指定的时间点。对于起始值,即0小时时间点,立即采集500μl GMEM。与源病毒VSV-GP-IL12相比,VSV-Prot-Off变体在早期时间点表现出轻度衰减(图26B)。
实施例18:使用蛋白酶调节的OFF开关的膜结合治疗蛋白的表达的概念验证(图27和图28)
由于全身应用IL12的强毒性,已开发出膜锚定变体以将IL12保留在所需位点(Poutou,J.et al.,Gene Therapy(2015)22,696-706)。我们应用这一原理以获得优于可溶性IL12构建体的多个优势。首先,正如Poutou等人所描述的,局部产生的IL12降低了全身毒性。然而,毒性并未完全消除;因此,仍需进一步调节。通过将IL12与CD4的跨膜结构域直接融合到VSV聚合酶(L蛋白),如图27所示,可以通过蛋白酶抑制剂的存在来同时降低病毒复制和转基因表达。此外,在病毒逃逸突变体的背景下,将可能有毒的转基因与调节病毒OFF开关变体中的蛋白酶二聚体融合将迫使病毒同时删除转基因和调节开关。仅删除开关仍会产生无功能的转基因聚合酶融合蛋白。此外,通过结合转基因和OFF开关,病毒的编码能力得到了有效利用。通常,通过其他的基因间区域将基因添加到VSV基因组中。VSV基因以连续梯度进行转录,由此每个基因间区域都会降低下游转录本的表达。因此,在不需要额外基因间区域的情况下引入转基因可以减少病毒减毒。
先前的Prot-Off构建体表明,HIV蛋白酶二聚体和聚合酶之间的柔性接头在没有蛋白酶抑制剂和不太严格的调节的情况下导致两者滴度均降低。连接到聚合酶N末端的蛋白酶切割后的残留接头可能是第一种现象的解释。由于不太严格的空间位阻,HIV蛋白酶和聚合酶之间的柔性接头还可以允许一些活性,可能导致不太严格的调节。因此,跨膜锚定的IL12病毒变体被设计为仅在IL12-TM和HIV蛋白酶二聚体之间具有柔性接头(正向接头-fl)或在蛋白酶侧翼没有任何接头(无接头-w/ol)。我们设计了正向接头构建体,以在CD4膜锚和蛋白酶-聚合酶融合蛋白之间提供一些额外的空间。跨膜结构域具有SEQ ID NO:31的氨基酸序列(由SEQ ID NO:32的核酸序列编码)并且通过具有SEQ ID NO:34的氨基酸序列(由SEQ ID NO:35的核酸序列编码)的接头与由SEQ ID NO:33的核苷酸序列编码的IL12分开。
在细胞培养物中测定病毒滴度和IL-12表达。每孔105个BHK细胞接种在12孔板中。细胞被VSV变体VSV-GP-TM-IL12-Prot-Off-w/ol、VSV-GP-TM-IL12-Prot-Off-fl或VSV-GP-IL12(对照)感染,MOI为1。感染后一小时,用PBS洗涤细胞并与不含PI的标准GMEM(-ctrl)或10、100、300、1.000、10.000nmol的阿扎那韦一起温育。感染后30小时,采集上清液。通过TCID50测定病毒滴度(图28A)。此外,在ELISA中测试未过滤的上清液的IL12。由于IL12是膜结合的,原则上只有病毒裂解的细胞会脱落蛋白质。实际上,与分泌的IL12相比,PI阴性对照样品中的最大IL12浓度较低(比较图28B与图24B和25B)。除了用分泌变体外,未稀释样品中2-3个对数尺度不超过ELISA 测定限值。
因此,我们比较了包含裂解细胞的样品、具有细胞上清液以及仅上清液。裂解的细胞包括细胞、含有死细胞的未过滤上清液和以1:1加入的裂解缓冲液。带有细胞的上清液是指未过滤的带有死细胞的上清液,并且上清液已经被离心以去除死细胞。因此,在上清液中仅包含通过病毒细胞杀伤而释放的IL12。当样品在细胞裂解缓冲液中被稀释时,由于从细胞膜释放的蛋白质,IL12浓度增加了10倍。反之亦然,离心并因此从上清液中清除剩余的携带IL12的细胞进一步降低了样品中IL12的浓度。
我们进一步分析了细胞培养物中编码VSV的跨膜IL12的复制动力学。每孔105个BHK细胞接种在12孔板中。细胞被VSV变体VSV-GP-TM-IL12-Prot-Off-fl、VSV-GP-TM-IL12-Prot-Off-w/ol或VSV-GP-IL12感染,MOI为3,用于单步复制动力学。感染后一小时,将细胞用PBS洗涤两次并在500μlGMEM中孵育直至指定的时间点。对于起始值,即0小时时间点,立即采集500μl GMEM。与源病毒VSV-GP-IL12相比,VSV-Prot-Off跨膜IL12变体在早期时间点表现出适度衰减(图28D)。可能这种早期衰减是由内质网中IL12-蛋白酶-聚合酶融合蛋白的表达引起的。然而,VSVs复制复合物在细胞质内形成。因此,释放的聚合酶必须从ER扩散到病毒复制位点。然而,在稍后的时间点,没有明显的衰减,并且没有观察到具有正向接头或不具有接头的构建体之间的差异。
序列表
序列表
<110> 勃林格殷格翰国际有限公司
威锐治疗股份有限公司
<120> 控制RNA病毒复制和基因表达的新机制
<130> 115623P1140PC
<150> EP19181717.0
<151> 2019-06-21
<160> 35
<170> BiSSAP 1.3.6
<210> 1
<211> 795
<212> DNA
<213> 水泡性口炎Indiana病毒
<220>
<223> P-蛋白 VSV Indiana
<400> 1
atggataatc tcacaaaagt tcgtgagtat ctcaagtcct attctcgtct ggatcaggcg 60
gtaggagaga tagatgagat cgaagcacaa cgagctgaaa agtccaatta tgagttgttc 120
caagaggatg gagtggaaga gcatactaag ccctcttatt ttcaggcagc agatgattct 180
gacacagaat ctgaaccaga aattgaagac aatcaaggct tgtatgcacc agatccagaa 240
gctgagcaag ttgaaggctt tatacagggg cctttagatg actatgcaga tgaggaagtg 300
gatgttgtat ttacttcgga ctggaaacag cctgagcttg aatctgacga gcatggaaag 360
accttacggt tgacatcgcc agagggttta agtggagagc agaaatccca gtggctttcg 420
acgattaaag cagtcgtgca aagtgccaaa tactggaatc tggcagagtg cacatttgaa 480
gcatcgggag aaggggtcat tatgaaggag cgccagataa ctccggatgt atataaggtc 540
actccagtga tgaacacaca tccgtcccaa tcagaagcag tatcagatgt ttggtctctc 600
tcaaagacat ccatgacttt ccaacccaag aaagcaagtc ttcagcctct caccatatcc 660
ttggatgaat tgttctcatc tagaggagag ttcatctctg tcggaggtga cggacgaatg 720
tctcataaag aggccatcct gctcggcctg agatacaaaa agttgtacaa tcaggcgaga 780
gtcaaatatt ctctg 795
<210> 2
<211> 6327
<212> DNA
<213> 水泡性口炎Indiana病毒
<220>
<223> L-蛋白 VSV Indiana
<400> 2
atggaagtcc acgattttga gaccgacgag ttcaatgatt tcaatgaaga tgactatgcc 60
acaagagaat tcctgaatcc cgatgagcgc atgacgtact tgaatcatgc tgattacaac 120
ctgaattctc ctctaattag tgatgatatt gacaatttaa tcaggaaatt caattctctt 180
ccaattccct cgatgtggga tagtaagaac tgggatggag ttcttgagat gttaacgtca 240
tgtcaagcca atcccatccc aacatctcag atgcataaat ggatgggaag ttggttaatg 300
tctgataatc atgatgccag tcaagggtat agttttttac atgaagtgga caaagaggca 360
gaaataacat ttgacgtggt ggagaccttc atccgcggct ggggcaacaa accaattgaa 420
tacatcaaaa aggaaagatg gactgactca ttcaaaattc tcgcttattt gtgtcaaaag 480
tttttggact tacacaagtt gacattaatc ttaaatgctg tctctgaggt ggaattgctc 540
aacttggcga ggactttcaa aggcaaagtc agaagaagtt ctcatggaac gaacatatgc 600
aggattaggg ttcccagctt gggtcctact tttatttcag aaggatgggc ttacttcaag 660
aaacttgata ttctaatgga ccgaaacttt ctgttaatgg tcaaagatgt gattataggg 720
aggatgcaaa cggtgctatc catggtatgt agaatagaca acctgttctc agagcaagac 780
atcttctccc ttctaaatat ctacagaatt ggagataaaa ttgtggagag gcagggaaat 840
ttttcttatg acttgattaa aatggtggaa ccgatatgca acttgaagct gatgaaatta 900
gcaagagaat caaggccttt agtcccacaa ttccctcatt ttgaaaatca tatcaagact 960
tctgttgatg aaggggcaaa aattgaccga ggtataagat tcctccatga tcagataatg 1020
agtgtgaaaa cagtggatct cacactggtg atttatggat cgttcagaca ttggggtcat 1080
ccttttatag attattacac tggactagaa aaattacatt cccaagtaac catgaagaaa 1140
gatattgatg tgtcatatgc aaaagcactt gcaagtgatt tagctcggat tgttctattt 1200
caacagttca atgatcataa aaagtggttc gtgaatggag acttgctccc tcatgatcat 1260
ccctttaaaa gtcatgttaa agaaaataca tggcccacag ctgctcaagt tcaagatttt 1320
ggagataaat ggcatgaact tccgctgatt aaatgttttg aaatacccga cttactagac 1380
ccatcgataa tatactctga caaaagtcat tcaatgaata ggtcagaggt gttgaaacat 1440
gtccgaatga atccgaacac tcctatccct agtaaaaagg tgttgcagac tatgttggac 1500
acaaaggcta ccaattggaa agaatttctt aaagagattg atgagaaggg cttagatgat 1560
gatgatctaa ttattggtct taaaggaaag gagagggaac tgaagttggc aggtagattt 1620
ttctccctaa tgtcttggaa attgcgagaa tactttgtaa ttaccgaata tttgataaag 1680
actcatttcg tccctatgtt taaaggcctg acaatggcgg acgatctaac tgcagtcatt 1740
aaaaagatgt tagattcctc atccggccaa ggattgaagt catatgaggc aatttgcata 1800
gccaatcaca ttgattacga aaaatggaat aaccaccaaa ggaagttatc aaacggccca 1860
gtgttccgag ttatgggcca gttcttaggt tatccatcct taatcgagag aactcatgaa 1920
ttttttgaga aaagtcttat atactacaat ggaagaccag acttgatgcg tgttcacaac 1980
aacacactga tcaattcaac ctcccaacga gtttgttggc aaggacaaga gggtggactg 2040
gaaggtctac ggcaaaaagg atggagtatc ctcaatctac tggttattca aagagaggct 2100
aaaatcagaa acactgctgt caaagtcttg gcacaaggtg ataatcaagt tatttgcaca 2160
cagtataaaa cgaagaaatc gagaaacgtt gtagaattac agggtgctct caatcaaatg 2220
gtttctaata atgagaaaat tatgactgca atcaaaatag ggacagggaa gttaggactt 2280
ttgataaatg acgatgagac tatgcaatct gcagattact tgaattatgg aaaaataccg 2340
attttccgtg gagtgattag agggttagag accaagagat ggtcacgagt gacttgtgtc 2400
accaatgacc aaatacccac ttgtgctaat ataatgagct cagtttccac aaatgctctc 2460
accgtagctc attttgctga gaacccaatc aatgccatga tacagtacaa ttattttggg 2520
acatttgcta gactcttgtt gatgatgcat gatcctgctc ttcgtcaatc attgtatgaa 2580
gttcaagata agataccggg cttgcacagt tctactttca aatacgccat gttgtatttg 2640
gacccttcca ttggaggagt gtcgggcatg tctttgtcca ggtttttgat tagagccttc 2700
ccagatcccg taacagaaag tctctcattc tggagattca tccatgtaca tgctcgaagt 2760
gagcatctga aggagatgag tgcagtattt ggaaaccccg agatagccaa gtttcgaata 2820
actcacatag acaagctagt agaagatcca acctctctga acatcgctat gggaatgagt 2880
ccagcgaact tgttaaagac tgaggttaaa aaatgcttaa tcgaatcaag acaaaccatc 2940
aggaaccagg tgattaagga tgcaaccata tatttgtatc atgaagagga tcggctcaga 3000
agtttcttat ggtcaataaa tcctctgttc cctagatttt taagtgaatt caaatcaggc 3060
acttttttgg gagtcgcaga cgggctcatc agtctatttc aaaattctcg tactattcgg 3120
aactccttta agaaaaagta tcatagggaa ttggatgatt tgattgtgag gagtgaggta 3180
tcctctttga cacatttagg gaaacttcat ttgagaaggg gatcatgtaa aatgtggaca 3240
tgttcagcta ctcatgctga cacattaaga tacaaatcct ggggccgtac agttattggg 3300
acaactgtac cccatccatt agaaatgttg ggtccacaac atcgaaaaga gactccttgt 3360
gcaccatgta acacatcagg gttcaattat gtttctgtgc attgtccaga cgggatccat 3420
gacgtcttta gttcacgggg accattgcct gcttatctag ggtctaaaac atctgaatct 3480
acatctattt tgcagccttg ggaaagggaa agcaaagtcc cactgattaa aagagctaca 3540
cgtcttagag atgctatctc ttggtttgtt gaacccgact ctaaactagc aatgactata 3600
ctttctaaca tccactcttt aacaggcgaa gaatggacca aaaggcagca tgggttcaaa 3660
agaacagggt ctgcccttca taggttttcg acatctcgga tgagccatgg tgggttcgca 3720
tctcagagca ctgcagcatt gaccaggttg atggcaacta cagacaccat gagggatctg 3780
ggagatcaga atttcgactt tttattccaa gcaacgttgc tctatgctca aattaccacc 3840
actgttgcaa gagacggatg gatcaccagt tgtacagatc attatcatat tgcctgtaag 3900
tcctgtttga gacccataga agagatcacc ctggactcaa gtatggacta cacgccccca 3960
gatgtatccc atgtgctgaa gacatggagg aatggggaag gttcgtgggg acaagagata 4020
aaacagatct atcctttaga agggaattgg aagaatttag cacctgctga gcaatcctat 4080
caagtcggca gatgtatagg ttttctatat ggagacttgg cgtatagaaa atctactcat 4140
gccgaggaca gttctctatt tcctctatct atacaaggtc gtattagagg tcgaggtttc 4200
ttaaaagggt tgctagacgg attaatgaga gcaagttgct gccaagtaat acaccggaga 4260
agtctggctc atttgaagag gccggccaac gcagtgtacg gaggtttgat ttacttgatt 4320
gataaattga gtgtatcacc tccattcctt tctcttacta gatcaggacc tattagagac 4380
gaattagaaa cgattcccca caagatccca acctcctatc cgacaagcaa ccgtgatatg 4440
ggggtgattg tcagaaatta cttcaaatac caatgccgtc taattgaaaa gggaaaatac 4500
agatcacatt attcacaatt atggttattc tcagatgtct tatccataga cttcattgga 4560
ccattctcta tttccaccac cctcttgcaa atcctataca agccattttt atctgggaaa 4620
gataagaatg agttgagaga gctggcaaat ctttcttcat tgctaagatc aggagagggg 4680
tgggaagaca tacatgtgaa attcttcacc aaggacatat tattgtgtcc agaggaaatc 4740
agacatgctt gcaagttcgg gattgctaag gataataata aagacatgag ctatccccct 4800
tggggaaggg aatccagagg gacaattaca acaatccctg tttattatac gaccacccct 4860
tacccaaaga tgctagagat gcctccaaga atccaaaatc ccctgctgtc cggaatcagg 4920
ttgggccaat taccaactgg cgctcattat aaaattcgga gtatattaca tggaatggga 4980
atccattaca gggacttctt gagttgtgga gacggctccg gagggatgac tgctgcatta 5040
ctacgagaaa atgtgcatag cagaggaata ttcaatagtc tgttagaatt atcagggtca 5100
gtcatgcgag gcgcctctcc tgagcccccc agtgccctag aaactttagg aggagataaa 5160
tcgagatgtg taaatggtga aacatgttgg gaatatccat ctgacttatg tgacccaagg 5220
acttgggact atttcctccg actcaaagca ggcttggggc ttcaaattga tttaattgta 5280
atggatatgg aagttcggga ttcttctact agcctgaaaa ttgagacgaa tgttagaaat 5340
tatgtgcacc ggattttgga tgagcaagga gttttaatct acaagactta tggaacatat 5400
atttgtgaga gcgaaaagaa tgcagtaaca atccttggtc ccatgttcaa gacggtcgac 5460
ttagttcaaa cagaatttag tagttctcaa acgtctgaag tatatatggt atgtaaaggt 5520
ttgaagaaat taatcgatga acccaatccc gattggtctt ccatcaatga atcctggaaa 5580
aacctgtacg cattccagtc atcagaacag gaatttgcca gagcaaagaa ggttagtaca 5640
tactttacct tgacaggtat tccctcccaa ttcattcctg atccttttgt aaacattgag 5700
actatgctac aaatattcgg agtacccacg ggtgtgtctc atgcggctgc cttaaaatca 5760
tctgatagac ctgcagattt attgaccatt agcctttttt atatggcgat tatatcgtat 5820
tataacatca atcatatcag agtaggaccg atacctccga accccccatc agatggaatt 5880
gcacaaaatg tggggatcgc tataactggt ataagctttt ggctgagttt gatggagaaa 5940
gacattccac tatatcaaca gtgtttagca gttatccagc aatcattccc gattaggtgg 6000
gaggctgttt cagtaaaagg aggatacaag cagaagtgga gtactagagg tgatgggctc 6060
ccaaaagata cccgaatttc agactccttg gccccaatcg ggaactggat cagatctctg 6120
gaattggtcc gaaaccaagt tcgtctaaat ccattcaatg agatcttgtt caatcagcta 6180
tgtcgtacag tggataatca tttgaaatgg tcaaatttgc gaagaaacac aggaatgatt 6240
gaatggatca atagacgaat ttcaaaagaa gaccggtcta tactgatgtt gaagagtgac 6300
ctacacgagg aaaactcttg gagagat 6327
<210> 3
<211> 1512
<212> DNA
<213> 人工序列
<220>
<223> 具有蛋白酶插入物的P蛋白
<400> 3
atggataatc tcacaaaagt tcgtgagtat ctcaagtcct attctcgtct ggatcaggcg 60
gtaggagaga tagatgagat cgaagcacaa cgagctgaaa agtccaatta tgagttgttc 120
caagaggatg gagtggaaga gcatactaag ccctcttatt ttcaggcagc agatgattct 180
gacacagaat ctgaaccaga aattgaagac aatcaaggct tgtatgcacc agatccagaa 240
gctgagcaag ttgaaggctt tatacagggg cctttagatg actatgcaga tgaggaagtg 300
gatgttgtat ttacttcgga ctggaaacag cctgagcttg aatctgacga gcatggaaag 360
accttacggt tgacattgcc agagggttta agtggagagc agaaatccca gtggctttcg 420
acgattaaag cagtcgtgca aagtgccaaa tactggaatc tggcagagtg cacatttgaa 480
gcatcgggag aaggggtcat tatgaaggag cgccagataa ctccggatgt atataaggtc 540
actccagtga tgaacacaca tccgtcccaa tcagaagcag tatcagatgg cggaagcggc 600
ggagggagcg ggggcgggag cggagtgtcc tttaacttcc ctcaagtgac cctgtggcag 660
cggcctctgg ttacaatcaa gatcggcgga cagctgaaag aggccctgct ggatacaggc 720
gctgacgata cagtgctgga agagatgtct ctgcccggca gatggaagcc caaaatgatc 780
ggaggaatcg gcggcttcat caaagtgcgg cagtacgacc agatcctgat cgagatctgc 840
gggcacaagg ccatcggaac agtgctcgtg ggccctacac ctgtgaacat catcggcaga 900
aatctgctga cccagatcgg ctgcaccctg aactttgctg gtgctattgg aggggcccca 960
caagttacac tgtggcaaag acccctcgtg accatcaaga ttggaggcca actcaaagaa 1020
gctctgctgg acactggggc cgatgacacc gtgcttgaag aaatgagcct gcctggccgg 1080
tggaaaccta agatgattgg cggcattgga ggttttatca aagtccgcca gtatgatcaa 1140
attctcatcg aaatctgtgg ccataaggct attggcaccg tgctcgtcgg acccactcca 1200
gttaatatca tcggacggaa cctgctcaca cagatcgggt gtacactgaa tttccccatc 1260
tcccccatcg gagggtccgg aggcggctca ggcggtggat ccggcgtttg gtctctctca 1320
aagacatcca tgactttcca acccaagaaa gcaagtcttc agcctctcac catatccttg 1380
gatgaattgt tctcatctag aggagagttc atctctgtcg gaggtgacgg acgaatgtct 1440
cataaagagg ccatcctgct cggcctgaga tacaaaaagt tgtacaatca ggcgagagtc 1500
aaatattctc tg 1512
<210> 4
<211> 717
<212> DNA
<213> 人工序列
<220>
<223> 具有切割位点和接头的蛋白酶二聚体
<400> 4
ggcggaagcg gcggagggag cgggggcggg agcggagtgt cctttaactt ccctcaagtg 60
accctgtggc agcggcctct ggttacaatc aagatcggcg gacagctgaa agaggccctg 120
ctggatacag gcgctgacga tacagtgctg gaagagatgt ctctgcccgg cagatggaag 180
cccaaaatga tcggaggaat cggcggcttc atcaaagtgc ggcagtacga ccagatcctg 240
atcgagatct gcgggcacaa ggccatcgga acagtgctcg tgggccctac acctgtgaac 300
atcatcggca gaaatctgct gacccagatc ggctgcaccc tgaactttgc tggtgctatt 360
ggaggggccc cacaagttac actgtggcaa agacccctcg tgaccatcaa gattggaggc 420
caactcaaag aagctctgct ggacactggg gccgatgaca ccgtgcttga agaaatgagc 480
ctgcctggcc ggtggaaacc taagatgatt ggcggcattg gaggttttat caaagtccgc 540
cagtatgatc aaattctcat cgaaatctgt ggccataagg ctattggcac cgtgctcgtc 600
ggacccactc cagttaatat catcggacgg aacctgctca cacagatcgg gtgtacactg 660
aatttcccca tctcccccat cggagggtcc ggaggcggct caggcggtgg atccggc 717
<210> 5
<211> 615
<212> DNA
<213> 人工序列
<220>
<223> 单链 HIV 蛋白酶二聚体
<400> 5
cctcaagtga ccctgtggca gcggcctctg gttacaatca agatcggcgg acagctgaaa 60
gaggccctgc tggatacagg cgctgacgat acagtgctgg aagagatgtc tctgcccggc 120
agatggaagc ccaaaatgat cggaggaatc ggcggcttca tcaaagtgcg gcagtacgac 180
cagatcctga tcgagatctg cgggcacaag gccatcggaa cagtgctcgt gggccctaca 240
cctgtgaaca tcatcggcag aaatctgctg acccagatcg gctgcaccct gaactttgct 300
ggtgctattg gaggggcccc acaagttaca ctgtggcaaa gacccctcgt gaccatcaag 360
attggaggcc aactcaaaga agctctgctg gacactgggg ccgatgacac cgtgcttgaa 420
gaaatgagcc tgcctggccg gtggaaacct aagatgattg gcggcattgg aggttttatc 480
aaagtccgcc agtatgatca aattctcatc gaaatctgtg gccataaggc tattggcacc 540
gtgctcgtcg gacccactcc agttaatatc atcggacgga acctgctcac acagatcggg 600
tgtacactga atttc 615
<210> 6
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> HIV 蛋白酶切割位点 1 (cut1)
<400> 6
gtgtccttta acttc 15
<210> 7
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> HIV 蛋白酶切割位点 2 (cut2)
<400> 7
cccatctccc ccatc 15
<210> 8
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> GGSG 接头 1
<400> 8
ggcggaagcg gcggagggag cgggggcggg agcgga 36
<210> 9
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> GGSG 接头 2
<400> 9
ggagggtccg gaggcggctc aggcggtgga tccggc 36
<210> 10
<211> 7047
<212> DNA
<213> 人工序列
<220>
<223> 具有蛋白酶插入物的 L 蛋白
<400> 10
atggaagtcc acgattttga gaccgacgag ttcaatgatt tcaatgaaga tgactatgcc 60
acaagagaat tcctgaatcc cgatgagcgc atgacgtact tgaatcatgc tgattacaac 120
ctgaattctc ctctaattag tgatgatatt gacaatttaa tcaggaaatt caattctctt 180
ccaattccct cgatgtggga tagtaagaac tgggatggag ttcttgagat gttaacgtca 240
tgtcaagcca atcccatccc aacatctcag atgcataaat ggatgggaag ttggttaatg 300
tctgataatc atgatgccag tcaagggtat agttttttac atgaagtgga caaagaggca 360
gaaataacat ttgacgtggt ggagaccttc atccgcggct ggggcaacaa accaattgaa 420
tacatcaaaa aggaaagatg gactgactca ttcaaaattc tcgcttattt gtgtcaaaag 480
tttttggact tacacaagtt gacattaatc ttaaatgctg tctctgaggt ggaattgctc 540
aacttggcga ggactttcaa aggcaaagtc agaagaagtt ctcatggaac gaacatatgc 600
aggattaggg ttcccagctt gggtcctact tttatttcag aaggatgggc ttacttcaag 660
aaacttgata ttctaatgga ccgaaacttt ctgttaatgg tcaaagatgt gattataggg 720
aggatgcaaa cggtgctatc catggtatgt agaatagaca acctgttctc agagcaagac 780
atcttctccc ttctaaatat ctacagaatt ggagataaaa ttgtggagag gcagggaaat 840
ttttcttatg acttgattaa aatggtggaa ccgatatgca acttgaagct gatgaaatta 900
gcaagagaat caaggccttt agtcccacaa ttccctcatt ttgaaaatca tatcaagact 960
tctgttgatg aaggggcaaa aattgaccga ggtataagat tcctccatga tcagataatg 1020
agtgtgaaaa cagtggatct cacactggtg atttatggat cgttcagaca ttggggtcat 1080
ccttttatag attattacac tggactagaa aaattacatt cccaagtaac catgaagaaa 1140
gatattgatg tgtcatatgc aaaagcactt gcaagtgatt tagctcggat tgttctattt 1200
caacagttca atgatcataa aaagtggttc gtgaatggag acttgctccc tcatgatcat 1260
ccctttaaaa gtcatgttaa agaaaataca tggcccacag ctgctcaagt tcaagatttt 1320
ggagataaat ggcatgaact tccgctgatt aaatgttttg aaatacccga cttactagac 1380
ccatcgataa tatactctga caaaagtcat tcaatgaata ggtcagaggt gttgaaacat 1440
gtccgaatga atccgaacac tcctatccct agtaaaaagg tgttgcagac tatgttggac 1500
acaaaggcta ccaattggaa agaatttctt aaagagattg atgagaaggg cttagatgat 1560
gatgatctaa ttattggtct taaaggaaag gagagggaac tgaagttggc aggtagattt 1620
ttctccctaa tgtcttggaa attgcgagaa tactttgtaa ttaccgaata tttgataaag 1680
actcatttcg tccctatgtt taaaggcctg acaatggcgg acgatctaac tgcagtcatt 1740
aaaaagatgt tagattcctc atccggccaa ggattgaagt catatgaggc aatttgcata 1800
gccaatcaca ttgattacga aaaatggaat aaccaccaaa ggaagttatc aaacggccca 1860
gtgttccgag ttatgggcca gttcttaggt tatccatcct taatcgagag aactcatgaa 1920
ttttttgaga aaagtcttat atactacaat ggaagaccag acttgatgcg tgttcacaac 1980
aacacactga tcaattcaac ctcccaacga gtttgttggc aaggacaaga gggtggactg 2040
gaaggtctac ggcaaaaagg atggagtatc ctcaatctac tggttattca aagagaggct 2100
aaaatcagaa acactgctgt caaagtcttg gcacaaggtg ataatcaagt tatttgcaca 2160
cagtataaaa cgaagaaatc gagaaacgtt gtagaattac agggtgctct caatcaaatg 2220
gtttctaata atgagaaaat tatgactgca atcaaaatag ggacagggaa gttaggactt 2280
ttgataaatg acgatgagac tatgcaatct gcagattact tgaattatgg aaaaataccg 2340
attttccgtg gagtgattag agggttagag accaagagat ggtcacgagt gacttgtgtc 2400
accaatgacc aaatacccac ttgtgctaat ataatgagct cagtttccac aaatgctctc 2460
accgtagctc attttgctga gaacccaatc aatgccatga tacagtacaa ttattttggg 2520
acatttgcta gactcttgtt gatgatgcat gatcctgctc ttcgtcaatc attgtatgaa 2580
gttcaagata agataccggg cttgcacagt tctactttca aatacgccat gttgtatttg 2640
gacccttcca ttggaggagt gtcgggcatg tctttgtcca ggtttttgat tagagccttc 2700
ccagatcccg taacagaaag tctctcattc tggagattca tccatgtaca tgctcgaagt 2760
gagcatctga aggagatgag tgcagtattt ggaaaccccg agatagccaa gtttcgaata 2820
actcacatag acaagctagt agaagatcca acctctctga acatcgctat gggaatgagt 2880
ccagcgaact tgttaaagac tgaggttaaa aaatgcttaa tcgaatcaag acaaaccatc 2940
aggaaccagg tgattaagga tgcaaccata tatttgtatc atgaagagga tcggctcaga 3000
agtttcttat ggtcaataaa tcctctgttc cctagatttt taagtgaatt caaatcaggc 3060
acttttttgg gagtcgcaga cgggctcatc agtctatttc aaaattctcg tactattcgg 3120
aactccttta agaaaaagta tcatagggaa ttggatgatt tgattgtgag gagtgaggta 3180
tcctctttga cacatttagg gaaacttcat ttgagaaggg gatcatgtaa aatgtggaca 3240
tgttcagcta ctcatgctga cacattaaga tacaaatcct ggggccgtac agttattggg 3300
acaactgtac cccatccatt agaaatgttg ggtccacaac atcgaaaaga gactccttgt 3360
gcaccatgta acacatcagg gttcaattat gtttctgtgc attgtccaga cgggatccat 3420
gacgtcttta gttcacgggg accattgcct gcttatctag ggtctaaaac atctgaatct 3480
acatctattt tgcagccttg ggaaagggaa agcaaagtcc cactgattaa aagagctaca 3540
cgtcttagag atgctatctc ttggtttgtt gaacccgact ctaaactagc aatgactata 3600
ctttctaaca tccactcttt aacaggcgaa gaatggacca aaaggcagca tgggttcaaa 3660
agaacagggt ctgcccttca taggttttcg acatctcgga tgagccatgg tgggttcgca 3720
tctcagagca ctgcagcatt gaccaggttg atggcaacta cagacaccat gagggatctg 3780
ggagatcaga atttcgactt tttattccaa gcaacgttgc tctatgctca aattaccacc 3840
actgttgcaa gagacggatg gatcaccagt tgtacagatc attatcatat tgcctgtaag 3900
tcctgtttga gacccataga agagatcacc ctggactcaa gtatggacta cacgccccca 3960
gatgtatccc atgtgctgaa gacatggagg aatggggaag gttcgtgggg acaagagata 4020
aaacagatct atcctttaga agggaattgg aagaatttag cacctgctga gcaatcctat 4080
caagtcggca gatgtatagg ttttctatat ggagacttgg cgtatagaaa atctactcat 4140
gccgaggaca gttctctatt tcctctatct atacaaggtc gtattagagg tcgaggtttc 4200
ttaaaagggt tgctagacgg attaatgaga gcaagttgct gccaagtaat acaccggaga 4260
agtctggctc atttgaagag gccggccaac gcagtgtacg gaggtttgat ttacttgatt 4320
gataaattga gtgtatcacc tccattcctt tctcttacta gatcaggacc tattagagac 4380
gaattagaaa cgattcccca caagatccca acctcctatc cgacaagcaa ccgtgatatg 4440
ggggtgattg tcagaaatta cttcaaatac caatgccgtc taattgaaaa gggaaaatac 4500
agatcacatt attcacaatt atggttattc tcagatgtct tatccataga cttcattgga 4560
ccattctcta tttccaccac cctcttgcaa atcctataca agccattttt atctgggaaa 4620
gataagaatg agttgagaga gctggcaaat ctttcttcat tgctaagatc aggagagggg 4680
tgggaagaca tacatgtgaa attcttcacc aaggacatat tattgtgtcc agaggaaatc 4740
agacatgctt gcaagttcgg gattgctaag gataataata aagacatgag ctatccccct 4800
tggggaaggg aatccagagg gacaattaca acaatccctg tttattatac gaccacccct 4860
ggcggaagcg gcggagggag cgggggcggg agcggagtgt cctttaactt ccctcaagtg 4920
accctgtggc agcggcctct ggttacaatc aagatcggcg gacagctgaa agaggccctg 4980
ctggatacag gcgctgacga tacagtgctg gaagagatgt ctctgcccgg cagatggaag 5040
cccaaaatga tcggaggaat cggcggcttc atcaaagtgc ggcagtacga ccagatcctg 5100
atcgagatct gcgggcacaa ggccatcgga acagtgctcg tgggccctac acctgtgaac 5160
atcatcggca gaaatctgct gacccagatc ggctgcaccc tgaactttgc tggtgctatt 5220
ggaggggccc cacaagttac actgtggcaa agacccctcg tgaccatcaa gattggaggc 5280
caactcaaag aagctctgct ggacactggg gccgatgaca ccgtgcttga agaaatgagc 5340
ctgcctggcc ggtggaaacc taagatgatt ggcggcattg gaggttttat caaagtccgc 5400
cagtatgatc aaattctcat cgaaatctgt ggccataagg ctattggcac cgtgctcgtc 5460
ggacccactc cagttaatat catcggacgg aacctgctca cacagatcgg gtgtacactg 5520
aatttcccca tctcccccat cggagggtcc ggaggcggct caggcggtgg atccggctac 5580
ccaaagatgc tagagatgcc tccaagaatc caaaatcccc tgctgtccgg actcaggttg 5640
ggccaattac caactggcgc tcattataaa attcggagta tattacatgg aatgggaatc 5700
cattacaggg acttcttgag ttgtggagac ggctccggag ggatgactgc tgcattacta 5760
cgagaaaatg tgcatagcag aggaatattc aatagtctgt tagaattatc agggtcagtc 5820
atgcgaggcg cctctcctga gccccccagt gccctagaaa ctttaggagg agataaatcg 5880
agatgtgtaa atggtgaaac atgttgggaa tatccatctg acttatgtga cccaaggact 5940
tgggactatt tcctccgact caaagcaggc ttggggcttc aaattgattt aattgtaatg 6000
gatatggaag ttcgggattc ttctactagc ctgaaaattg agacgaatgt tagaaattat 6060
gtgcaccgga ttttggatga gcaaggagtt ttaatctaca agacttatgg aacatatatt 6120
tgtgagagcg aaaagaatgc agtaacaatc cttggtccca tgttcaagac ggtcgactta 6180
gttcaaacag aatttagtag ttctcaaacg tctgaagtat atatggtatg taaaggtttg 6240
aagaaattaa tcgatgaacc caatcccgat tggtcttcca tcaatgaatc ctggaaaaac 6300
ctgtacgcat tccagtcatc agaacaggaa tttgccagag caaagaaggt tagtacatac 6360
tttaccttga caggtattcc ctcccaattc gttcctgatc cttttgtaaa cattgagact 6420
atgctacaaa tattcggagt acccacgggt gtgtctcatg cggctgcctt aaaatcatct 6480
gatagacctg cagatttatt gaccattagc cttttttata tggcgattat atcgtattat 6540
aacatcaatc atatcagagt aggaccgata cctccgaacc ccccatcaga tggaattgca 6600
caaaatgtgg ggatcgctat aactggtata agcttttggc tgagtttgat ggaggaagac 6660
attccactat atcaacagtg tttagcagtt atccagcaat cattcccgat taggtgggag 6720
gctgtttcag taaaaggagg atacaagcag aagtggagta ctagaggtga tgggctccca 6780
aaagataccc gaatttcaga ctccttggcc ccaatcggga actggatcag atctctggaa 6840
ttggtccgaa accaagttcg tctaaatcca ttcaatgaga tcttgttcaa tcagctatgt 6900
cgtacagtgg ataatcattt gaaatggtca aatttgcgaa gaaacacagg aatgattgaa 6960
tggatcaata gacgaatttc aaaagaagac cggtctatac tgatgttgaa gagtgaccta 7020
cacgaggaaa actcttggag agattaa 7047
<210> 11
<211> 780
<212> DNA
<213> 人工序列
<220>
<223> 具有接头的mCherry
<400> 11
ggcggaagcg gcggagggag cgggggcggg agcggaatgg tgagcaaggg cgaggaggat 60
aacatggcca tcatcaagga gttcatgcgc ttcaaggtgc acatggaggg ctccgtgaac 120
ggccacgagt tcgagatcga gggcgagggc gagggccgcc cctacgaggg cacccagacc 180
gccaagctga aggtgaccaa gggtggcccc ctgcccttcg cctgggacat cctgtcccct 240
cagttcatgt acggctccaa ggcctacgtg aagcaccccg ccgacatccc cgactacttg 300
aagctgtcct tccccgaggg cttcaagtgg gagcgcgtga tgaacttcga ggacggcggc 360
gtggtgaccg tgacccagga ctcctccctg caggacggcg agttcatcta caaggtgaag 420
ctgcgcggca ccaacttccc ctccgacggc cccgtaatgc agaagaagac catgggctgg 480
gaggcctcct ccgagcggat gtaccccgag gacggcgccc tgaagggcga gatcaagcag 540
aggctgaagc tgaaggacgg cggccactac gacgctgagg tcaagaccac ctacaaggcc 600
aagaagcccg tgcagctgcc cggcgcctac aacgtcaaca tcaagttgga catcacctcc 660
cacaacgagg actacaccat cgtggaacag tacgaacgcg ccgagggccg ccactccacc 720
ggcggcatgg acgagctgta caagggaggg tccggaggcg gctcaggcgg tggatccggc 780
<210> 12
<211> 780
<212> DNA
<213> 人工序列
<220>
<223> 具有接头的mWasabi
<400> 12
ggcggaagcg gcggagggag cgggggcggg agcggaatgg tgagcaaggg cgaggagacc 60
acaatgggcg taatcaagcc cgacatgaag atcaagctga agatggaggg caacgtgaat 120
ggccacgcct tcgtgatcga gggcgagggc gagggcaagc cctacgacgg caccaacacc 180
atcaacctgg aggtgaagga gggagccccc ctgcccttct cctacgacat tctgaccacc 240
gcgttcagtt acggcaacag ggccttcacc aagtaccccg acgacatccc caactacttc 300
aagcagtcct tccccgaggg ctactcttgg gagcgcacca tgaccttcga ggacaagggc 360
atcgtgaagg tgaagtccga catctccatg gaggaggact ccttcatcta cgagatacac 420
ctcaagggcg agaacttccc ccccaacggc cccgtgatgc agaaggagac caccggctgg 480
gacgcctcca ccgagaggat gtacgtgcgc gacggcgtgc tgaagggcga cgtcaagatg 540
aagctgctgc tggagggcgg cggccaccac cgcgttgact tcaagaccat ctacagggcc 600
aagaaggcgg tgaagctgcc cgactatcac tttgtggacc accgcatcga gatcctgaac 660
cacgacaagg actacaacaa ggtgaccgtt tacgagatcg ccgtggcccg caactccacc 720
gacggcatgg acgagctgta caagggaggg tccggaggcg gctcaggcgg tggatccggc 780
<210> 13
<211> 7107
<212> DNA
<213> 人工序列
<220>
<223> 具有mCherry插入物的 L 蛋白
<400> 13
atggaagtcc acgattttga gaccgacgag ttcaatgatt tcaatgaaga tgactatgcc 60
acaagagaat tcctgaatcc cgatgagcgc atgacgtact tgaatcatgc tgattacaac 120
ctgaattctc ctctaattag tgatgatatt gacaatttaa tcaggaaatt caattctctt 180
ccaattccct cgatgtggga tagtaagaac tgggatggag ttcttgagat gttaacgtca 240
tgtcaagcca atcccatccc aacatctcag atgcataaat ggatgggaag ttggttaatg 300
tctgataatc atgatgccag tcaagggtat agttttttac atgaagtgga caaagaggca 360
gaaataacat ttgacgtggt ggagaccttc atccgcggct ggggcaacaa accaattgaa 420
tacatcaaaa aggaaagatg gactgactca ttcaaaattc tcgcttattt gtgtcaaaag 480
tttttggact tacacaagtt gacattaatc ttaaatgctg tctctgaggt ggaattgctc 540
aacttggcga ggactttcaa aggcaaagtc agaagaagtt ctcatggaac gaacatatgc 600
aggattaggg ttcccagctt gggtcctact tttatttcag aaggatgggc ttacttcaag 660
aaacttgata ttctaatgga ccgaaacttt ctgttaatgg tcaaagatgt gattataggg 720
aggatgcaaa cggtgctatc catggtatgt agaatagaca acctgttctc agagcaagac 780
atcttctccc ttctaaatat ctacagaatt ggagataaaa ttgtggagag gcagggaaat 840
ttttcttatg acttgattaa aatggtggaa ccgatatgca acttgaagct gatgaaatta 900
gcaagagaat caaggccttt agtcccacaa ttccctcatt ttgaaaatca tatcaagact 960
tctgttgatg aaggggcaaa aattgaccga ggtataagat tcctccatga tcagataatg 1020
agtgtgaaaa cagtggatct cacactggtg atttatggat cgttcagaca ttggggtcat 1080
ccttttatag attattacac tggactagaa aaattacatt cccaagtaac catgaagaaa 1140
gatattgatg tgtcatatgc aaaagcactt gcaagtgatt tagctcggat tgttctattt 1200
caacagttca atgatcataa aaagtggttc gtgaatggag acttgctccc tcatgatcat 1260
ccctttaaaa gtcatgttaa agaaaataca tggcccacag ctgctcaagt tcaagatttt 1320
ggagataaat ggcatgaact tccgctgatt aaatgttttg aaatacccga cttactagac 1380
ccatcgataa tatactctga caaaagtcat tcaatgaata ggtcagaggt gttgaaacat 1440
gtccgaatga atccgaacac tcctatccct agtaaaaagg tgttgcagac tatgttggac 1500
acaaaggcta ccaattggaa agaatttctt aaagagattg atgagaaggg cttagatgat 1560
gatgatctaa ttattggtct taaaggaaag gagagggaac tgaagttggc aggtagattt 1620
ttctccctaa tgtcttggaa attgcgagaa tactttgtaa ttaccgaata tttgataaag 1680
actcatttcg tccctatgtt taaaggcctg acaatggcgg acgatctaac tgcagtcatt 1740
aaaaagatgt tagattcctc atccggccaa ggattgaagt catatgaggc aatttgcata 1800
gccaatcaca ttgattacga aaaatggaat aaccaccaaa ggaagttatc aaacggccca 1860
gtgttccgag ttatgggcca gttcttaggt tatccatcct taatcgagag aactcatgaa 1920
ttttttgaga aaagtcttat atactacaat ggaagaccag acttgatgcg tgttcacaac 1980
aacacactga tcaattcaac ctcccaacga gtttgttggc aaggacaaga gggtggactg 2040
gaaggtctac ggcaaaaagg atggagtatc ctcaatctac tggttattca aagagaggct 2100
aaaatcagaa acactgctgt caaagtcttg gcacaaggtg ataatcaagt tatttgcaca 2160
cagtataaaa cgaagaaatc gagaaacgtt gtagaattac agggtgctct caatcaaatg 2220
gtttctaata atgagaaaat tatgactgca atcaaaatag ggacagggaa gttaggactt 2280
ttgataaatg acgatgagac tatgcaatct gcagattact tgaattatgg aaaaataccg 2340
attttccgtg gagtgattag agggttagag accaagagat ggtcacgagt gacttgtgtc 2400
accaatgacc aaatacccac ttgtgctaat ataatgagct cagtttccac aaatgctctc 2460
accgtagctc attttgctga gaacccaatc aatgccatga tacagtacaa ttattttggg 2520
acatttgcta gactcttgtt gatgatgcat gatcctgctc ttcgtcaatc attgtatgaa 2580
gttcaagata agataccggg cttgcacagt tctactttca aatacgccat gttgtatttg 2640
gacccttcca ttggaggagt gtcgggcatg tctttgtcca ggtttttgat tagagccttc 2700
ccagatcccg taacagaaag tctctcattc tggagattca tccatgtaca tgctcgaagt 2760
gagcatctga aggagatgag tgcagtattt ggaaaccccg agatagccaa gtttcgaata 2820
actcacatag acaagctagt agaagatcca acctctctga acatcgctat gggaatgagt 2880
ccagcgaact tgttaaagac tgaggttaaa aaatgcttaa tcgaatcaag acaaaccatc 2940
aggaaccagg tgattaagga tgcaaccata tatttgtatc atgaagagga tcggctcaga 3000
agtttcttat ggtcaataaa tcctctgttc cctagatttt taagtgaatt caaatcaggc 3060
acttttttgg gagtcgcaga cgggctcatc agtctatttc aaaattctcg tactattcgg 3120
aactccttta agaaaaagta tcatagggaa ttggatgatt tgattgtgag gagtgaggta 3180
tcctctttga cacatttagg gaaacttcat ttgagaaggg gatcatgtaa aatgtggaca 3240
tgttcagcta ctcatgctga cacattaaga tacaaatcct ggggccgtac agttattggg 3300
acaactgtac cccatccatt agaaatgttg ggtccacaac atcgaaaaga gactccttgt 3360
gcaccatgta acacatcagg gttcaattat gtttctgtgc attgtccaga cgggatccat 3420
gacgtcttta gttcacgggg accattgcct gcttatctag ggtctaaaac atctgaatct 3480
acatctattt tgcagccttg ggaaagggaa agcaaagtcc cactgattaa aagagctaca 3540
cgtcttagag atgctatctc ttggtttgtt gaacccgact ctaaactagc aatgactata 3600
ctttctaaca tccactcttt aacaggcgaa gaatggacca aaaggcagca tgggttcaaa 3660
agaacagggt ctgcccttca taggttttcg acatctcgga tgagccatgg tgggttcgca 3720
tctcagagca ctgcagcatt gaccaggttg atggcaacta cagacaccat gagggatctg 3780
ggagatcaga atttcgactt tttattccaa gcaacgttgc tctatgctca aattaccacc 3840
actgttgcaa gagacggatg gatcaccagt tgtacagatc attatcatat tgcctgtaag 3900
tcctgtttga gacccataga agagatcacc ctggactcaa gtatggacta cacgccccca 3960
gatgtatccc atgtgctgaa gacatggagg aatggggaag gttcgtgggg acaagagata 4020
aaacagatct atcctttaga agggaattgg aagaatttag cacctgctga gcaatcctat 4080
caagtcggca gatgtatagg ttttctatat ggagacttgg cgtatagaaa atctactcat 4140
gccgaggaca gttctctatt tcctctatct atacaaggtc gtattagagg tcgaggtttc 4200
ttaaaagggt tgctagacgg attaatgaga gcaagttgct gccaagtaat acaccggaga 4260
agtctggctc atttgaagag gccggccaac gcagtgtacg gaggtttgat ttacttgatt 4320
gataaattga gtgtatcacc tccattcctt tctcttacta gatcaggacc tattagagac 4380
gaattagaaa cgattcccca caagatccca acctcctatc cgacaagcaa ccgtgatatg 4440
ggggtgattg tcagaaatta cttcaaatac caatgccgtc taattgaaaa gggaaaatac 4500
agatcacatt attcacaatt atggttattc tcagatgtct tatccataga cttcattgga 4560
ccattctcta tttccaccac cctcttgcaa atcctataca agccattttt atctgggaaa 4620
gataagaatg agttgagaga gctggcaaat ctttcttcat tgctaagatc aggagagggg 4680
tgggaagaca tacatgtgaa attcttcacc aaggacatat tattgtgtcc agaggaaatc 4740
agacatgctt gcaagttcgg gattgctaag gataataata aagacatgag ctatccccct 4800
tggggaaggg aatccagagg gacaattaca acaatccctg tttattatac gaccacccct 4860
ggcggaagcg gcggagggag cgggggcggg agcggaatgg tgagcaaggg cgaggaggat 4920
aacatggcca tcatcaagga gttcatgcgc ttcaaggtgc acatggaggg ctccgtgaac 4980
ggccacgagt tcgagatcga gggcgagggc gagggccgcc cctacgaggg cacccagacc 5040
gccaagctga aggtgaccaa gggtggcccc ctgcccttcg cctgggacat cctgtcccct 5100
cagttcatgt acggctccaa ggcctacgtg aagcaccccg ccgacatccc cgactacttg 5160
aagctgtcct tccccgaggg cttcaagtgg gagcgcgtga tgaacttcga ggacggcggc 5220
gtggtgaccg tgacccagga ctcctccctg caggacggcg agttcatcta caaggtgaag 5280
ctgcgcggca ccaacttccc ctccgacggc cccgtaatgc agaagaagac catgggctgg 5340
gaggcctcct ccgagcggat gtaccccgag gacggcgccc tgaagggcga gatcaagcag 5400
aggctgaagc tgaaggacgg cggccactac gacgctgagg tcaagaccac ctacaaggcc 5460
aagaagcccg tgcagctgcc cggcgcctac aacgtcaaca tcaagttgga catcacctcc 5520
cacaacgagg actacaccat cgtggaacag tacgaacgcg ccgagggccg ccactccacc 5580
ggcggcatgg acgagctgta caagggaggg tccggaggcg gctcaggcgg tggatccggc 5640
tacccaaaga tgctagagat gcctccaaga atccaaaatc ccctgctgtc cggaatcagg 5700
ttgggccaat taccaactgg cgctcattat aaaattcgga gtatattaca tggaatggga 5760
atccattaca gggacttctt gagttgtgga gacggctccg gagggatgac tgctgcatta 5820
ctacgagaaa atgtgcatag cagaggaata ttcaatagtc tgttagaatt atcagggtca 5880
gtcatgcgag gcgcctctcc tgagcccccc agtgccctag aaactttagg aggagataaa 5940
tcgagatgtg taaatggtga aacatgttgg gaatatccat ctgacttatg tgacccaagg 6000
acttgggact atttcctccg actcaaagca ggcttggggc ttcaaattga tttaattgta 6060
atggatatgg aagttcggga ttcttctact agcctgaaaa ttgagacgaa tgttagaaat 6120
tatgtgcacc ggattttgga tgagcaagga gttttaatct acaagactta tggaacatat 6180
atttgtgaga gcgaaaagaa tgcagtaaca atccttggtc ccatgttcaa gacggtcgac 6240
ttagttcaaa cagaatttag tagttctcaa acgtctgaag tatatatggt aggtaaaggt 6300
ttgaagaaat taatcgatgc acccaatccc gattggtctt ccatcaatga atcctggaaa 6360
aacctgtacg cattccagtc atcagaacag gaatttgcca gagcaaagaa ggttagtaca 6420
tactttacct tgacaggtat tccctcccaa ttcattcctg atccttttgt aaacattgag 6480
actatgctac aaatattcgg agtacccacg ggtgtgtctc atgcggctgc cttaaaatca 6540
tctgatagac ctgcagattt attgaccatt agcctttttt atatggcgat tatatcgtat 6600
tataacatca atcatatcag agtaggaccg atacctccga accccccatc agatggaatt 6660
gcacaaaatg tggggatcgc tataactggt ataagctttt ggctgagttt gatggagaaa 6720
gacattccac tatatcaaca gtgtttagca gttatccagc aatcattccc gattaggtgg 6780
gaggctgttt cagtaaaagg aggatacaag cagaagtgga gtactagagg tgatgggctc 6840
ccaaaagata cccgaatttc agactccttg gccccaatcg ggaactggat cagatctctg 6900
gaattggtcc gaaaccaagt tcgtctaaat ccattcaatg agatcttgtt caatcagcta 6960
tgtcgtacag tggataatca tttgaaatgg tcaaatttgc gaagaaacac aggaatgatt 7020
gaatggatca atagacgaat ttcaaaagaa gaccggtcta tactgatgtt gaagagtgac 7080
ctacacgagg aaaactcttg gagagat 7107
<210> 14
<211> 7107
<212> DNA
<213> 人工序列
<220>
<223> 具有mCherry插入物的 L 蛋白 (P-mWasabi-L-mCherry)
<400> 14
atggaagtcc acgattttga gaccgacgag ttcaatgatt tcaatgaaga tgactatgcc 60
acaagagaat tcctgaatcc cgatgagcgc atgacgtact tgaatcatgc tgattacaac 120
ctgaattctc ctctaattag tgatgatatt gacaatttaa tcaggaaatt caattctctt 180
ccaattccct cgatgtggga tagtaagaac tgggatggag ttcttgagat gttaacgtca 240
tgtcaagcca atcccatccc aacatctcag atgcataaat ggatgggaag ttggttaatg 300
tctgataatc atgatgccag tcaagggtat agttttttac atgaagtgga caaagaggca 360
gaaataacat ttgacgtggt ggagaccttc atccgcggct ggggcaacaa accaattgaa 420
tacatcaaaa aggaaagatg gactgactca ttcaaaattc tcgcttattt gtgtcaaaag 480
tttttggact tacacaagtt gacattaatc ttaaatgctg tctctgaggt ggaattgctc 540
aacttggcga ggactttcaa aggcaaagtc agaagaagtt ctcatggaac gaacatatgc 600
aggattaggg ttcccagctt gggtcctact tttatttcag aaggatgggc ttacttcaag 660
aaacttgata ttctaatgga ccgaaacttt ctgttaatgg tcaaagatgt gattataggg 720
aggatgcaaa cggtgctatc catggtatgt agaatagaca acctgttctc agagcaagac 780
atcttctccc ttctaaatat ctacagaatt ggagataaaa ttgtggagag gcagggaaat 840
ttttcttatg acttgattaa aatggtggaa ccgatatgca acttgaagct gatgaaatta 900
gcaagagaat caaggccttt agtcccacaa ttccctcatt ttgaaaatca tatcaagact 960
tctgttgatg aaggggcaaa aattgaccga ggtataagat tcctccatga tcagataatg 1020
agtgtgaaaa cagtggatct cacactggtg atttatggat cgttcagaca ttggggtcat 1080
ccttttatag attattacac tggactagaa aaattacatt cccaagtaac catgaagaaa 1140
gatattgatg tgtcatatgc aaaagcactt gcaagtgatt tagctcggat tgttctattt 1200
caacagttca atgatcataa aaagtggttc gtgaatggag acttgctccc tcatgatcat 1260
ccctttaaaa gtcatgttaa agaaaataca tggcccacag ctgctcaagt tcaagatttt 1320
ggagataaat ggcatgaact tccgctgatt aaatgttttg aaatacccga cttactagac 1380
ccatcgataa tatactctga caaaagtcat tcaatgaata ggtcagaggt gttgaaacat 1440
gtccgaatga atccgaacac tcctatccct agtaaaaagg tgttgcagac tatgttggac 1500
acaaaggcta ccaattggaa agaatttctt aaagagattg atgagaaggg cttagatgat 1560
gatgatctaa ttattggtct taaaggaaag gagagggaac tgaagttggc aggtagattt 1620
ttctccctaa tgtcttggaa attgcgagaa tactttgtaa ttaccgaata tttgataaag 1680
actcatttcg tccctatgtt taaaggcctg acaatggcgg acgatctaac tgcagtcatt 1740
aaaaagatgt tagattcctc atccggccaa ggattgaagt catatgaggc aatttgcata 1800
gccaatcaca ttgattacga aaaatggaat aaccaccaaa ggaagttatc aaacggccca 1860
gtgttccgag ttatgggcca gttcttaggt tatccatcct taatcgagag aactcatgaa 1920
ttttttgaga aaagtcttat atactacaat ggaagaccag acttgatgcg tgttcacaac 1980
aacacactga tcaattcaac ctcccaacga gtttgttggc aaggacaaga gggtggactg 2040
gaaggtctac ggcaaaaagg atggagtatc ctcaatctac tggttattca aagagaggct 2100
aaaatcagaa acactgctgt caaagtcttg gcacaaggtg ataatcaagt tatttgcaca 2160
cagtataaaa cgaagaaatc gagaaacgtt gtagaattac agggtgctct caatcaaatg 2220
gtttctaata atgagaaaat tatgactgca atcaaaatag ggacagggaa gttaggactt 2280
ttgataaatg acgatgagac tatgcaatct gcagattact tgaattatgg aaaaataccg 2340
attttccgtg gagtgattag agggttagag accaagagat ggtcacgagt gacttgtgtc 2400
accaatgacc aaatacccac ttgtgctaat ataatgagct cagtttccac aaatgctctc 2460
accgtagctc attttgctga gaacccaatc aatgccatga tacagtacaa ttattttggg 2520
acatttgcta gactcttgtt gatgatgcat gatcctgctc ttcgtcaatc attgtatgaa 2580
gttcaagata agataccggg cttgcacagt tctactttca aatacgccat gttgtatttg 2640
gacccttcca ttggaggagt gtcgggcatg tctttgtcca ggtttttgat tagagccttc 2700
ccagatcccg taacagaaag tctctcattc tggagattca tccatgtaca tgctcgaagt 2760
gagcatctga aggagatgag tgcagtattt ggaaaccccg agatagccaa gtttcgaata 2820
actcacatag acaagctagt agaagatcca acctctctga acatcgctat gggaatgagt 2880
ccagcgaact tgttaaagac tgaggttaaa aaatgcttaa tcgaatcaag acaaaccatc 2940
aggaaccagg tgattaagga tgcaaccata tatttgtatc atgaagagga tcggctcaga 3000
agtttcttat ggtcaataaa tcctctgttc cctagatttt taagtgaatt caaatcaggc 3060
acttttttgg gagtcgcaga cgggctcatc agtctatttc aaaattctcg tactattcgg 3120
aactccttta agaaaaagta tcatagggaa ttggatgatt tgattgtgag gagtgaggta 3180
tcctctttga cacatttagg gaaacttcat ttgagaaggg gatcatgtaa aatgtggaca 3240
tgttcagcta ctcatgctga cacattaaga tacaaatcct ggggccgtac agttattggg 3300
acaactgtac cccatccatt agaaatgttg ggtccacaac atcgaaaaga gactccttgt 3360
gcaccatgta acacatcagg gttcaattat gtttctgtgc attgtccaga cgggatccat 3420
gacgtcttta gttcacgggg accattgcct gcttatctag ggtctaaaac atctgaatct 3480
acatctattt tgcagccttg ggaaagggaa agcaaagtcc cactgattaa aagagctaca 3540
cgtcttagag atgctatctc ttggtttgtt gaacccgact ctaaactagc aatgactata 3600
ctttctaaca tccactcttt aacaggcgaa gaatggacca aaaggcagca tgggttcaaa 3660
agaacagggt ctgcccttca taggttttcg acatctcgga tgagccatgg tgggttcgca 3720
tctcagagca ctgcagcatt gaccaggttg atggcaacta cagacaccat gagggatctg 3780
ggagatcaga atttcgactt tttattccaa gcaacgttgc tctatgctca aattaccacc 3840
actgttgcaa gagacggatg gatcaccagt tgtacagatc attatcatat tgcctgtaag 3900
tcctgtttga gacccataga agagatcacc ctggactcaa gtatggacta cacgccccca 3960
gatgtatccc atgtgctgaa gacatggagg aatggggaag gttcgtgggg acaagagata 4020
aaacagatct atcctttaga agggaattgg aagaatttag cacctgctga gcaatcctat 4080
caagtcggca gatgtatagg ttttctatat ggagacttgg cgtatagaaa atctactcat 4140
gccgaggaca gttctctatt tcctctatct atacaaggtc gtattagagg tcgaggtttc 4200
ttaaaagggt tgctagacgg attaatgaga gcaagttgct gccaagtaat acaccggaga 4260
agtctggctc atttgaagag gccggccaac gcagtgtacg gaggtttgat ttacttgatt 4320
gataaattga gtgtatcacc tccattcctt tctcttacta gatcaggacc tattagagac 4380
gaattagaaa cgattcccca caagatccca acctcctatc cgacaagcaa ccgtgatatg 4440
ggggtgattg tcagaaatta cttcaaatac caatgccgtc taattgaaaa gggaaaatac 4500
agatcacatt attcacaatt atggttattc tcagatgtct tatccataga cttcattgga 4560
ccattctcta tttccaccac cctcttgcaa atcctataca agccattttt atctgggaaa 4620
gataagaatg agttgagaga gctggcaaat ctttcttcat tgctaagatc aggagagggg 4680
tgggaagaca tacatgtgaa attcttcacc aaggacatat tattgtgtcc agaggaaatc 4740
agacatgctt gcaagttcgg gattgctaag gataataata aagacatgag ctatccccct 4800
tggggaaggg aatccagagg gacaattaca acaatccctg tttattatac gaccacccct 4860
ggcggaagcg gcggagggag cgggggcggg agcggaatgg tgagcaaggg cgaggaggat 4920
aacatggcca tcatcaagga gttcatgcgc ttcaaggtgc acatggaggg ctccgtgaac 4980
ggccacgagt tcgagatcga gggcgagggc gagggccgcc cctacgaggg cacccagacc 5040
gccaagctga aggtgaccaa gggtggcccc ctgcccttcg cctgggacat cctgtcccct 5100
cagttcatgt acggctccaa ggcctacgtg aagcaccccg ccgacatccc cgactacttg 5160
aagctgtcct tccccgaggg cttcaagtgg gagcgcgtga tgaacttcga ggacggcggc 5220
gtggtgaccg tgacccagga ctcctccctg caggacggcg agttcatcta caaggtgaag 5280
ctgcgcggca ccaacttccc ctccgacggc cccgtaatgc agaagaagac catgggctgg 5340
gaggcctcct ccgagcggat gtaccccgag gacggcgccc tgaagggcga gatcaagcag 5400
aggctgaagc tgaaggacgg cggccactac gacgctgagg tcaagaccac ctacaaggcc 5460
aagaagcccg tgcagctgcc cggcgcctac aacgtcaaca tcaagttgga catcacctcc 5520
cacaacgagg actacaccat cgtggaacag tacgaacgcg ccgagggccg ccactccacc 5580
ggcggcatgg acgagctgta caagggaggg tccggaggcg gctcaggcgg tggatccggc 5640
tacccaaaga tgctagagat gcctccaaga atccaaaatc ccctgctgtc cggaatcagg 5700
ttgggccaat taccaactgg cgctcattat aaaattcgga gtatattaca tggaatggga 5760
atccattaca gggacttctt gagttgtgga gacggctccg gagggatgac tgctgcatta 5820
ctacgagaaa atgtgcatag cagaggaata ttcaatagtc tgttagaatt atcagggtca 5880
gtcatgcgag gcgcctctcc tgagcccccc agtgccctag aaactttagg aggagataaa 5940
tcgagatgtg taaatggtga aacatgttgg gaatatccat ctgacttatg tgacccaagg 6000
acttgggact atttcctccg actcaaagca ggcttggggc ttcaaattga tttaattgta 6060
atggatatgg aagttcggga ttcttctact agcctgaaaa ttgagacgaa tgttagaaat 6120
tatgtgcacc ggattttgga tgagcaagga gttttaatct acaagactta tggaacatat 6180
atttgtgaga gcgaaaagaa tgcagtaaca atccttggtc ccatgttcaa gacggtcgac 6240
ttagttcaaa cagaatttag tagttctcaa acgtctgaag tatatatggt atgtaaaggt 6300
ttgaagaaat taatcgatga accctatccc gattggtctt ccatcaatga atcctggaaa 6360
aacctgtacg cattccagtc atcagaacag gaatttgcca gagcaaagaa ggttagtaca 6420
tactttacct tgacaggtat tccctcccaa ttcattcctg atccttttgt aaacattgag 6480
actatgctac aaatattcgg agtacccacg ggtgtgtctc atgcggctgc cttaaaatca 6540
tctgatagac ctgcagattt attgaccatt agcctttttt atatggcgat tatatcgtat 6600
tataacatca atcatatcag agtaggaccg atacctccga accccccatc agatggaatt 6660
gcacaaaatg tggggatcgc tataactggt ataagctttt ggctgagttt gatggagaaa 6720
gacattccac tatatcaaca gtgtttagca gttatccagc aatcattccc gattaggtgg 6780
gaggctgttt cagtaaaagg aggatacaag cagaagtgga gtactagagg tgatgggctc 6840
ccaaaagata cccgaatttc agactccttg gccccaatcg ggaactggat cagatctctg 6900
gaattggtcc gaaaccaagt tcgtctaaat ccattcaatg agatcttgtt caatcagcta 6960
tgtcgtacag tggataatca tttgaaatgg tcaaatttgc gaagaaacac aggaatgatt 7020
gaatggatca atagacgaat ttcaaaagaa gaccggtcta tactgatgtt gaagagtgac 7080
ctacacgagg aaaactcttg gagagat 7107
<210> 15
<211> 1575
<212> DNA
<213> 人工序列
<220>
<223> 具有mWasabi的 P 蛋白 (P-mWasabi-L-mCherry)
<400> 15
atggataatc tcacaaaagt tcgtgagtat ctcaagtcct attctcgtct ggatcaggcg 60
gtaggagaga tagatgagat cgaagcacaa cgagctgaaa agtccaatta tgagttgttc 120
caagaggatg gagtggaaga gcatactaag ccctcttatt ttcaggcagc agatgattct 180
gacacagaat ctgaaccaga aattgaagac aatcaaggct tgtatgcacc agatccagaa 240
gctgagcaag ttgaaggctt tatacagggg cctttagatg actatgcaga tgaggaagtg 300
gatgttgtat ttacttcgga ctggaaacag cctgagcttg aatctgacga gcatggaaag 360
accttacggt tgacatcgcc agagggttta agtggagagc agaaatccca gtggctttcg 420
acgattaaag cagtcgtgca aagtgccaaa tactggaatc tggcagagtg cacatttgaa 480
gcatcgggag aaggggtcat tatgaaggag cgccagataa ctccggatgt atataaggtc 540
actccagtga tgaacacaca tccgtcccaa tcagaagcag tatcagatgg cggaagcggc 600
ggagggagcg ggggcgggag cggaatggtg agcaagggcg aggagaccac aatgggcgta 660
atcaagcccg acatgaagat caagctgaag atggagggca acgtgaatgg ccacgccttc 720
gtgatcgagg gcgagggcga gggcaagccc tacgacggca ccaacaccat caacctggag 780
gtgaaggagg gagcccccct gcccttctcc tacgacattc tgaccaccgc gttcagttac 840
ggcaacaggg ccttcaccaa gtaccccgac gacatcccca actacttcaa gcagtccttc 900
cccgagggct actcttggga gcgcaccatg accttcgagg acaagggcat cgtgaaggtg 960
aagtccgaca tctccatgga ggaggactcc ttcatctacg agatacacct caagggcgag 1020
aacttccccc ccaacggccc cgtgatgcag aaggagacca ccggctggga cgcctccacc 1080
gagaggatgt acgtgcgcga cggcgtgctg aagggcgacg tcaagatgaa gctgctgctg 1140
gagggcggcg gccaccaccg cgttgacttc aagaccatct acagggccaa gaaggcggtg 1200
aagctgcccg actatcactt tgtggaccac cgcatcgaga tcctgaacca cgacaaggac 1260
tacaacaagg tgaccgttta cgagatcgcc gtggcccgca actccaccga cggcatggac 1320
gagctgtaca agggagggtc cggaggcggc tcaggcggtg gatccggcgt ttggtctctc 1380
tcaaagacat ccatgacttt ccaacccaag aaagcaagtc ttcagcctct caccatatcc 1440
ttggatgaat tgttctcatc tagaggagag ttcatctctg tcggaggtga cggacgaatg 1500
tctcataaag aggccatcct gctcggcctg agatacaaaa agttgtacaa tcaggcgaga 1560
gtcaaatatt ctctg 1575
<210> 16
<211> 7761
<212> DNA
<213> 人工序列
<220>
<223> GFP-蛋白酶(具有接头)-L-蛋白
<400> 16
atgagcaagg gcgaggaact gttcactggc gtggtcccaa ttctcgtgga actggatggc 60
gatgtgaatg ggcacaaatt ttctgtcagc ggagagggtg aaggagatgc cacatacgga 120
aagctcaccc tgaaattcat ctgcaccact ggaaagctcc ctgtgccatg gccaacactg 180
gtcactacct tcacctatgg cgtgcagtgc ttttccagat acccagacca tatgaagcag 240
catgactttt tcaagagcgc catgcccgag ggctatgtgc aggagagaac catctttttc 300
aaagatgacg ggaactacaa gacccgcrct gaagtcaagt tcgaaggtga caccctggtg 360
aatagaatcg agctgaaggg cattgacttt aaggaggatg gaaacattct cggccacaag 420
ctggaataca actataactc ccacaatgtg tacatcatgg ccgacaagca aaagaatggc 480
atcaaggtca acttcaagat cagacacaac attgaggatg gatccgtgca gctggccgac 540
cattatcaac agaacactcc aatcggcgac ggccctgtgc tcctcccaga caaccattac 600
ctgtccaccc agtctgccct gtctaaagat cccaacgaaa agagagacca catggtcctg 660
ctggagtttg tgaccgctgc tgggatcaca catggcatgg acgagctgta caagggcgga 720
agcggcggag ggagcggggg cgggagcgga gtgtccttta acttccccca agtgaccctg 780
tggcagcggc ccctcgtgac catcaagatc ggcggccagc tgaaagaggc cctgctggat 840
acaggcgccg acgacacagt gctggaagag atgagcctgc ccggcagatg gaagcccaag 900
atgatcggcg gaatcggcgg cttcatcaaa gtgcggcagt atgatcagat cctgatcgag 960
atctgcggac acaaggccat cggcaccgtg ctcgtgggac ccacccccgt gaatatcatc 1020
ggccggaacc tgctgaccca gatcggctgc accctgaact tcgctggcgc cattggaggc 1080
gcccctcaag tgacactgtg gcagaggcca ctcgtgacta ttaagattgg agggcagctg 1140
aaagaagctc tgctggacac cggggctgat gataccgtgc tggaagaaat gtccctgcct 1200
ggccggtgga aacctaagat gattggaggc attgggggct ttatcaaagt gcgccagtat 1260
gatcagatcc tgattgaaat ttgtggccat aaggccattg ggacagtgct cgtgggccct 1320
acacctgtga acattaccgg cagaaatctg ctgacacaga ttgggtgtac actgaatttc 1380
cccatctccc ccatcggagg gtccggaggc ggctcaggcg gtggatccgg catggaagtc 1440
cacgattttg agaccgacga gttcaatgat ttcaatgaag atgactatgc cacaagagaa 1500
ttcctgaatc ccgatgagcg catgacgtac ttgaatcatg ctgattacaa cctgaattct 1560
cctctaatta gtgatgatat tgacaattta atcaggaaat tcaattctct tccaattccc 1620
tcgatgtggg atagtaagaa ctgggatgga gttcttgaga tgttaacgtc atgtcaagcc 1680
aatcccatcc caacatctca gatgcataaa tggatgggaa gttggttaat gtctgataat 1740
catgatgcca gtcaagggta tagtttttta catgaagtgg acaaagaggc agaaataaca 1800
tttgacgtgg tggagacctt catccgcggc tggggcaaca aaccaattga atacatcaaa 1860
aaggaaagat ggactgactc attcaaaatt ctcgcttatt tgtgtcaaaa gtttttggac 1920
ttacacaagt tgacattaat cttaaatgct gtctctgagg tggaattgct caacttggcg 1980
aggactttca aaggcaaagt cagaagaagt tctcatggaa cgaacatatg caggattagg 2040
gttcccagct tgggtcctac ttttatttca gaaggatggg cttacttcaa gaaacttgat 2100
attctaatgg accgaaactt tctgttaatg gtcaaagatg tgattatagg gaggatgcaa 2160
acggtgctat ccatggtatg tagaatagac aacctgttct cagagcaaga catcttctcc 2220
cttctaaata tctacagaat tggagataaa attgtggaga ggcagggaaa tttttcttat 2280
gacttgatta aaatggtgga accgatatgc aacttgaagc tgatgaaatt agcaagagaa 2340
tcaaggcctt tagtcccaca attccctcat tttgaaaatc atatcaagac ttctgttgat 2400
gaaggggcaa aaattgaccg aggtataaga ttcctccatg atcagataat gagtgtgaaa 2460
acagtggatc tcacactggt gatttatgga tcgttcagac attggggtca tccttttata 2520
gattattaca ctggactaga aaaattacat tcccaagtaa ccatgaagaa agatattgat 2580
gtgtcatatg caaaagcact tgcaagtgat ttagctcgga ttgttctatt tcaacagttc 2640
aatgatcata aaaagtggtt cgtgaatgga gacttgctcc ctcatgatca tccctttaaa 2700
agtcatgtta aagaaaatac atggcccaca gctgctcaag ttcaagattt tggagataaa 2760
tggcatgaac ttccgctgat taaatgtttt gaaatacccg acttactaga cccatcgata 2820
atatactctg acaaaagtca ttcaatgaat aggtcagagg tgttgaaaca tgtccgaatg 2880
aatccgaaca ctcctatccc tagtaaaaag gtgttgcaga ctatgttgga cacaaaggct 2940
accaattgga aagaatttct taaagagatt gatgagaagg gcttagatga tgatgatcta 3000
attattggtc ttaaaggaaa ggagagggaa ctgaagttgg caggtagatt tttctcccta 3060
atgtcttgga aattgcgaga atactttgta attaccgaat atttgataaa gactcatttc 3120
gtccctatgt ttaaaggcct gacaatggcg gacgatctaa ctgcagtcat taaaaagatg 3180
ttagattcct catccggcca aggattgaag tcatatgagg caatttgcat agccaatcac 3240
attgattacg aaaaatggaa taaccaccaa aggaagttat caaacggccc agtgttccga 3300
gttatgggcc agttcttagg ttatccatcc ttaatcgaga gaactcatga attttttgag 3360
aaaagtctta tatactacaa tggaagacca gacttgatgc gtgttcacaa caacacactg 3420
atcaattcaa cctcccaacg agtttgttgg caaggacaag agggtggact ggaaggtcta 3480
cggcaaaaag gatggagtat cctcaatcta ctggttattc aaagagaggc taaaatcaga 3540
aacactgctg tcaaagtctt ggcacaaggt gataatcaag ttatttgcac acagtataaa 3600
acgaagaaat cgagaaacgt tgtagaatta cagggtgctc tcaatcaaat ggtttctaat 3660
aatgagaaaa ttatgactgc aatcaaaata gggacaggga agttaggact tttgataaat 3720
gacgatgaga ctatgcaatc tgcagattac ttgaattatg gaaaaatacc gattttccgt 3780
ggagtgatta gagggttaga gaccaagaga tggtcacgag tgacttgtgt caccaatgac 3840
caaataccca cttgtgctaa tataatgagc tcagtttcca caaatgctct caccgtagct 3900
cattttgctg agaacccaat caatgccatg atacagtaca attattttgg gacatttgct 3960
agactcttgt tgatgatgca tgatcctgct cttcgtcaat cattgtatga agttcaagat 4020
aagataccgg gcttgcacag ttctactttc aaatacgcca tgttgtattt ggacccttcc 4080
attggaggag tgtcgggcat gtctttgtcc aggtttttga ttagagcctt cccagatccc 4140
gtaacagaaa gtctctcatt ctggagattc atccatgtac atgctcgaag tgagcatctg 4200
aaggagatga gtgcagtatt tggaaacccc gagatagcca agtttcgaat aactcacata 4260
gacaagctag tagaagatcc aacctctctg aacatcgcta tgggaatgag tccagcgaac 4320
ttgttaaaga ctgaggttaa aaaatgctta atcgaatcaa gacaaaccat caggaaccag 4380
gtgattaagg atgcaaccat atatttgtat catgaagagg atcggctcag aagtttctta 4440
tggtcaataa atcctctgtt ccctagattt ttaagtgaat tcaaatcagg cacttttttg 4500
ggagtcgcag acgggctcat cagtctattt caaaattctc gtactattcg gaactccttt 4560
aagaaaaagt atcataggga attggatgat ttgattgtga ggagtgaggt atcctctttg 4620
acacatttag ggaaacttca tttgagaagg ggatcatgta aaatgtggac atgttcagct 4680
actcatgctg acacattaag atacaaatcc tggggccgta cagttattgg gacaactgta 4740
ccccatccat tagaaatgtt gggtccacaa catcgaaaag agactccttg tgcaccatgt 4800
aacacatcag ggttcaatta tgtttctgtg cattgtccag acgggatcca tgacgtcttt 4860
agttcacggg gaccattgcc tgcttatcta gggtctaaaa catctgaatc tacatctatt 4920
ttgcagcctt gggaaaggga aagcaaagtc ccactgatta aaagagctac acgtcttaga 4980
gatgctatct cttggtttgt tgaacccgac tctaaactag caatgactat actttctaac 5040
atccactctt taacaggcga agaatggacc aaaaggcagc atgggttcaa aagaacaggg 5100
tctgcccttc ataggttttc gacatctcgg atgagccatg gtgggttcgc atctcagagc 5160
actgcagcat tgaccaggtt gatggcaact acagacacca tgagggatct gggagatcag 5220
aatttcgact ttttattcca agcaacgttg ctctatgctc aaattaccac cactgttgca 5280
agagacggat ggatcaccag ttgtacagat cattatcata ttgcctgtaa gtcctgtttg 5340
agacccatag aagagatcac cctggactca agtatggact acacgccccc agatgtatcc 5400
catgtgctga agacatggag gaatggggaa ggttcgtggg gacaagagat aaaacagatc 5460
tatcctttag aagggaattg gaagaattta gcacctgctg agcaatccta tcaagtcggc 5520
agatgtatag gttttctata tggagacttg gcgtatagaa aatctactca tgccgaggac 5580
agttctctat ttcctctatc tatacaaggt cgtattagag gtcgaggttt cttaaaaggg 5640
ttgctagacg gattaatgag agcaagttgc tgccaagtaa tacaccggag aagtctggct 5700
catttgaaga ggccggccaa cgcagtgtac ggaggtttga tttacttgat tgataaattg 5760
agtgtatcac ctccattcct ttctcttact agatcaggac ctattagaga cgaattagaa 5820
acgattcccc acaagatccc aacctcctat ccgacaagca accgtgatat gggggtgatt 5880
gtcagaaatt acttcaaata ccaatgccgt ctaattgaaa agggaaaata cagatcacat 5940
tattcacaat tatggttatt ctcagatgtc ttatccatag acttcattgg accattctct 6000
atttccacca ccctcttgca aatcctatac aagccatttt tatctgggaa agataagaat 6060
gagttgagag agctggcaaa tctttcttca ttgctaagat caggagaggg gtgggaagac 6120
atacatgtga aattcttcac caaggacata ttattgtgtc cagaggaaat cagacatgct 6180
tgcaagttcg ggattgctaa ggataataat aaagacatga gctatccccc ttggggaagg 6240
gaatccagag ggacaattac aacaatccct gtttattata cgaccacccc ttacccaaag 6300
atgctagaga tgcctccaag aatccaaaat cccctgctgt ccggaatcag gttgggccaa 6360
ttaccaactg gcgctcatta taaaattcgg agtatattac atggaatggg aatccattac 6420
agggacttct tgagttgtgg agacggctcc ggagggatga ctgctgcatt actacgagaa 6480
aatgtgcata gcagaggaat attcaatagt ctgttagaat tatcagggtc agtcatgcga 6540
ggcgcctctc ctgagccccc cagtgcccta gaaactttag gaggagataa atcgagatgt 6600
gtaaatggtg aaacatgttg ggaatatcca tctgacttat gtgacccaag gacttgggac 6660
tatttcctcc gactcaaagc aggcttgggg cttcaaattg atttaattgt aatggatatg 6720
gaagttcggg attcttctac tagcctgaaa attgagacga atgttagaaa ttatgtgcac 6780
cggattttgg atgagcaagg agttttaatc tacaagactt atggaacata tatttgtgag 6840
agcgaaaaga atgcagtaac aatccttggt cccatgttca agacggtcga cttagttcaa 6900
acagaattta gtagttctca aacgtctgaa gtatatatgg tatgtaaagg tttgaagaaa 6960
ttaatcgatg aacccaatcc cgattggtct tccatcaatg aatcctggaa aaacctgtac 7020
gcattccagt catcagaaca ggaatttgcc agagcaaaga aggttagtac atactttacc 7080
ttgacaggta ttccctccca attcattcct gatccttttg taaacattga gactatgcta 7140
caaatattcg gagtacccac gggtgtgtct catgcggctg ccttaaaatc atctgataga 7200
cctgcagatt tattgaccat tagccttttt tatatggcga ttatatcgta ttataacatc 7260
aatcatatca gagtaggacc gatacctccg aaccccccat cagatggaat tgcacaaaat 7320
gtggggatcg ctataactgg tataagcttt tggctgagtt tgatggagaa agacattcca 7380
ctatatcaac agtgtttagc agttatccag caatcattcc cgattaggtg ggaggctgtt 7440
tcagtaaaag gaggatacaa gcagaagtgg agtactagag gtgatgggct cccaaaagat 7500
acccgaattt cagactcctt ggccccaatc gggaactgga tcagatctct ggaattggtc 7560
cgaaaccaag ttcgtctaaa tccattcaat gagatcttgt tcaatcagct atgtcgtaca 7620
gtggataatc atttgaaatg gtcaaatttg cgaagaaaca caggaatgat tgaatggatc 7680
aatagacgaa tttcaaaaga agaccggtct atactgatgt tgaagagtga cctacacgag 7740
gaaaactctt ggagagatta a 7761
<210> 17
<211> 7689
<212> DNA
<213> 人工序列
<220>
<223> GFP-蛋白酶(无接头)-L-蛋白
<400> 17
atgagcaagg gcgaggaact gttcactggc gtggtcccaa ttctcgtgga actggatggc 60
gatgtgaatg ggcacaaatt ttctgtcagc ggagagggtg aaggagatgc cacatacgga 120
aagctcaccc tgaaattcat ctgcaccact ggaaagctcc ctgtgccatg gccaacactg 180
gtcactacct tcacctatgg cgtgcagtgc ttttccagat acccagacca tatgaagcag 240
catgactttt tcaagagcgc catgcccgag ggctatgtgc aggagagaac catctttttc 300
aaagatgacg ggaactacaa gacccgcrct gaagtcaagt tcgaaggtga caccctggtg 360
aatagaatcg agctgaaggg cattgacttt aaggaggatg gaaacattct cggccacaag 420
ctggaataca actataactc ccacaatgtg tacatcatgg ccgacaagca aaagaatggc 480
atcaaggtca acttcaagat cagacacaac attgaggatg gatccgtgca gctggccgac 540
cattatcaac agaacactcc aatcggcgac ggccctgtgc tcctcccaga caaccattac 600
ctgtccaccc agtctgccct gtctaaagat cccaacgaaa agagagacca catggtcctg 660
ctggagtttg tgaccgctgc tgggatcaca catggcatgg acgagctgta caaggtgtcc 720
tttaacttcc cccaagtgac cctgtggcag cggcccctcg tgaccatcaa gatcggcggc 780
cagctgaaag aggccctgct ggatacaggc gccgacgaca cagtgctgga agagatgagc 840
ctgcccggca gatggaagcc caagatgatc ggcggaatcg gcggcttcat caaagtgcgg 900
cagtatgatc agatcctgat cgagatctgc ggacacaagg ccatcggcac cgtgctcgtg 960
ggacccaccc ccgtgaatat catcggccgg aacctgctga cccagatcgg ctgcaccctg 1020
aacttcgctg gcgccattgg aggcgcccct caagtgacac tgtggcagag gccactcgtg 1080
actattaaga ttggagggca gctgaaagaa gctctgctgg acaccggggc tgatgatacc 1140
gtgctggaag aaatgtccct gcctggccgg tggaaaccta agatgattgg aggcattggg 1200
ggctttatca aagtgcgcca gtatgatcag atcctgattg aaatttgtgg ccataaggcc 1260
attgggacag tgctcgtggg ccctacacct gtgaacatta tcagcagaaa tctgctgaca 1320
cagattgggt gtacactgaa tttccccatc tcccccatca tggaagtcca cgattttgag 1380
accgacgagt tcaatgattt caatgaagat gactatgcca caagagaatt cctgaatccc 1440
gatgagcgca tgacgtactt gaatcatgct gattacaacc tgaattctcc tctaattagt 1500
gatgatattg acaatttaat caggaaattc aattctcttc caattccctc gatgtgggat 1560
agtaagaact gggatggagt tcttgagatg ttaacgtcat gtcaagccaa tcccatccca 1620
acatctcaga tgcataaatg gatgggaagt tggttaatgt ctgataatca tgatgccagt 1680
caagggtata gttttttaca tgaagtggac aaagaggcag aaataacatt tgacgtggtg 1740
gagaccttca tccgcggctg gggcaacaaa ccaattgaat acatcaaaaa ggaaagatgg 1800
actgactcat tcaaaattct cgcttatttg tgtcaaaagt ttttggactt acacaagttg 1860
acattaatct taaatgctgt ctctgaggtg gaattgctca acttggcgag gactttcaaa 1920
ggcaaagtca gaagaagttc tcatggaacg aacatatgca ggattagggt tcccagcttg 1980
ggtcctactt ttatttcaga aggatgggct tacttcaaga aacttgatat tctaatggac 2040
cgaaactttc tgttaatggt caaagatgtg attataggga ggatgcaaac ggtgctatcc 2100
atggtatgta gaatagacaa cctgttctca gagcaagaca tcttctccct tctaaatatc 2160
tacagaattg gagataaaat tgtggagagg cagggaaatt tttcttatga cttgattaaa 2220
atggtggaac cgatatgcaa cttgaagctg atgaaattag caagagaatc aaggccttta 2280
gtcccacaat tccctcattt tgaaaatcat atcaagactt ctgttgatga aggggcaaaa 2340
attgaccgag gtataagatt cctccatgat cagataatga gtgtgaaaac agtggatctc 2400
acactggtga tttatggatc gttcagacat tggggtcatc cttttataga ttattacact 2460
ggactagaaa aattacattc ccaagtaacc atgaagaaag atattgatgt gtcatatgca 2520
aaagcacttg caagtgattt agctcggatt gttctatttc aacagttcaa tgatcataaa 2580
aagtggttcg tgaatggaga cttgctccct catgatcatc cctttaaaag tcatgttaaa 2640
gaaaatacat ggcccacagc tgctcaagtt caagattttg gagataaatg gcatgaactt 2700
ccgctgatta aatgttttga aatacccgac ttactagacc catcgataat atactctgac 2760
aaaagtcatt caatgaatag gtcagaggtg ttgaaacatg tccgaatgaa tccgaacact 2820
cctatcccta gtaaaaaggt gttgcagact atgttggaca caaaggctac caattggaaa 2880
gaatttctta aagagattga tgagaagggc ttagatgatg atgatctaat tattggtctt 2940
aaaggaaagg agagggaact gaagttggca ggtagatttt tctccctaat gtcttggaaa 3000
ttgcgagaat actttgtaat taccgaatat ttgataaaga ctcatttcgt ccctatgttt 3060
aaaggcctga caatggcgga cgatctaact gcagtcatta aaaagatgtt agattcctca 3120
tccggccaag gattgaagtc atatgaggca atttgcatag ccaatcacat tgattacgaa 3180
aaatggaata accaccaaag gaagttatca aacggcccag tgttccgagt tatgggccag 3240
ttcttaggtt atccatcctt aatcgagaga actcatgaat tttttgagaa aagtcttata 3300
tactacaatg gaagaccaga cttgatgcgt gttcacaaca acacactgat caattcaacc 3360
tcccaacgag tttgttggca aggacaagag ggtggactgg aaggtctacg gcaaaaagga 3420
tggagtatcc tcaatctact ggttattcaa agagaggcta aaatcagaaa cactgctgtc 3480
aaagtcttgg cacaaggtga taatcaagtt atttgcacac agtataaaac gaagaaatcg 3540
agaaacgttg tagaattaca gggtgctctc aatcaaatgg tttctaataa tgagaaaatt 3600
atgactgcaa tcaaaatagg gacagggaag ttaggacttt tgataaatga cgatgagact 3660
atgcaatctg cagattactt gaattatgga aaaataccga ttttccgtgg agtgattaga 3720
gggttagaga ccaagagatg gtcacgagtg acttgtgtca ccaatgacca aatacccact 3780
tgtgctaata taatgagctc agtttccaca aatgctctca ccgtagctca ttttgctgag 3840
aacccaatca atgccatgat acagtacaat tattttggga catttgctag actcttgttg 3900
atgatgcatg atcctgctct tcgtcaatca ttgtatgaag ttcaagataa gataccgggc 3960
ttgcacagtt ctactttcaa atacgccatg ttgtatttgg acccttccat tggaggagtg 4020
tcgggcatgt ctttgtccag gtttttgatt agagccttcc cagatcccgt aacagaaagt 4080
ctctcattct ggagattcat ccatgtacat gctcgaagtg agcatctgaa ggagatgagt 4140
gcagtatttg gaaaccccga gatagccaag tttcgaataa ctcacataga caagctagta 4200
gaagatccaa cctctctgaa catcgctatg ggaatgagtc cagcgaactt gttaaagact 4260
gaggttaaaa aatgcttaat cgaatcaaga caaaccatca ggaaccaggt gattaaggat 4320
gcaaccatat atttgtatca tgaagaggat cggctcagaa gtttcttatg gtcaataaat 4380
cctctgttcc ctagattttt aagtgaattc aaatcaggca cttttttggg agtcgcagac 4440
gggctcatca gtctatttca aaattctcgt actattcgga actcctttaa gaaaaagtat 4500
catagggaat tggatgattt gattgtgagg agtgaggtat cctctttgac acatttaggg 4560
aaacttcatt tgagaagggg atcatgtaaa atgtggacat gttcagctac tcatgctgac 4620
acattaagat acaaatcctg gggccgtaca gttattggga caactgtacc ccatccatta 4680
gaaatgttgg gtccacaaca tcgaaaagag actccttgtg caccatgtaa cacatcaggg 4740
ttcaattatg tttctgtgca ttgtccagac gggatccatg acgtctttag ttcacgggga 4800
ccattgcctg cttatctagg gtctaaaaca tctgaatcta catctatttt gcagccttgg 4860
gaaagggaaa gcaaagtccc actgattaaa agagctacac gtcttagaga tgctatctct 4920
tggtttgttg aacccgactc taaactagca atgactatac tttctaacat ccactcttta 4980
acaggcgaag aatggaccaa aaggcagcat gggttcaaaa gaacagggtc tgcccttcat 5040
aggttttcga catctcggat gagccatggt gggttcgcat ctcagagcac tgcagcattg 5100
accaggttga tggcaactac agacaccatg agggatctgg gagatcagaa tttcgacttt 5160
ttattccaag caacgttgct ctatgctcaa attaccacca ctgttgcaag agacggatgg 5220
atcaccagtt gtacagatca ttatcatatt gcctgtaagt cctgtttgag acccatagaa 5280
gagatcaccc tggactcaag tatggactac acgcccccag atgtatccca tgtgctgaag 5340
acatggagga atggggaagg ttcgtgggga caagagataa aacagatcta tcctttagaa 5400
gggaattgga agaatttagc acctgctgag caatcctatc aagtcggcag atgtataggt 5460
tttctatatg gagacttggc gtatagaaaa tctactcatg ccgaggacag ttctctattt 5520
cctctatcta tacaaggtcg tattagaggt cgaggtttct taaaagggtt gctagacgga 5580
ttaatgagag caagttgctg ccaagtaata caccggagaa gtctggctca tttgaagagg 5640
ccggccaacg cagtgtacgg aggtttgatt tacttgattg ataaattgag tgtatcacct 5700
ccattccttt ctcttactag atcaggacct attagagacg aattagaaac gattccccac 5760
aagatcccaa cctcctatcc gacaagcaac cgtgatatgg gggtgattgt cagaaattac 5820
ttcaaatacc aatgccgtct aattgaaaag ggaaaataca gatcacatta ttcacaatta 5880
tggttattct cagatgtctt atccatagac ttcattggac cattctctat ttccaccacc 5940
ctcttgcaaa tcctatacaa gccattttta tctgggaaag ataagaatga gttgagagag 6000
ctggcaaatc tttcttcatt gctaagatca ggagaggggt gggaagacat acatgtgaaa 6060
ttcttcacca aggacatatt attgtgtcca gaggaaatca gacatgcttg caagttcggg 6120
attgctaagg ataataataa agacatgagc tatccccctt ggggaaggga atccagaggg 6180
acaattacaa caatccctgt ttattatacg accacccctt acccaaagat gctagagatg 6240
cctccaagaa tccaaaatcc cctgctgtcc ggaatcaggt tgggccaatt accaactggc 6300
gctcattata aaattcggag tatattacat ggaatgggaa tccattacag ggacttcttg 6360
agttgtggag acggctccgg agggatgact gctgcattac tacgagaaaa tgtgcatagc 6420
agaggaatat tcaatagtct gttagaatta tcagggtcag tcatgcgagg cgcctctcct 6480
gagcccccca gtgccctaga aactttagga ggagataaat cgagatgtgt aaatggtgaa 6540
acatgttggg aatatccatc tgacttatgt gacccaagga cttgggacta tttcctccga 6600
ctcaaagcag gcttggggct tcaaattgat ttaattgtaa tggatatgga agttcgggat 6660
tcttctacta gcctgaaaat tgagacgaat gttagaaatt atgtgcaccg gattttggat 6720
gagcaaggag ttttaatcta caagacttat ggaacatata tttgtgagag cgaaaagaat 6780
gcagtaacaa tccttggtcc catgttcaag acggtcgact tagttcaaac agaatttagt 6840
agttctcaaa cgtctgaagt atatatggta tgtaaaggtt tgaagaaatt aatcgatgaa 6900
cccaatcccg attggtcttc catcaatgaa tcctggaaaa acctgtacgc attccagtca 6960
tcagaacagg aatttgccag agcaaagaag gttagtacat actttacctt gacaggtatt 7020
ccctcccaat tcattcctga tccttttgta aacattgaga ctatgctaca aatattcgga 7080
gtacccacgg gtgtgtctca tgcggctgcc ttaaaatcat ctgatagacc tgcagattta 7140
ttgaccatta gcctttttta tatggcgatt atatcgtatt ataacatcaa tcatatcaga 7200
gtaggaccga tacctccgaa ccccccatca gatggaattg cacaaaatgt ggggatcgct 7260
ataactggta taagcttttg gctgagtttg atggagaaag acattccact atatcaacag 7320
tgtttagcag ttatccagca atcattcccg attaggtggg aggctgtttc agtaaaagga 7380
ggatacaagc agaagtggag tactagaggt gatgggctcc caaaagatac ccgaatttca 7440
gactccttgg ccccaatcgg gaactggatc agatctctgg aattggtccg aaaccaagtt 7500
cgtctaaatc cattcaatga gatcttgttc aatcagctat gtcgtacagt ggataatcat 7560
ttgaaatggt caaatttgcg aagaaacaca ggaatgattg aatggatcaa tagacgaatt 7620
tcaaaagaag accggtctat actgatgttg aagagtgacc tacacgagga aaactcttgg 7680
agagattaa 7689
<210> 18
<211> 717
<212> DNA
<213> 人工序列
<220>
<223> 具有接头的具有突变的Prot-off蛋白酶二聚体
<400> 18
ggcggaagcg gcggagggag cgggggcggg agcggagtgt cctttaactt cccccaagtg 60
accctgtggc agcggcccct cgtgaccatc aagatcggcg gccagctgaa agaggccctg 120
ctggatacag gcgccgacga cacagtgctg gaagagatga gcctgcccgg cagatggaag 180
cccaagatga tcggcggaat cggcggcttc atcaaagtgc ggcagtatga tcagatcctg 240
atcgagatct gcggacacaa ggccatcggc accgtgctcg tgggacccac ccccgtgaat 300
atcatcggcc ggaacctgct gacccagatc ggctgcaccc tgaacttcgc tggcgccatt 360
ggaggcgccc ctcaagtgac actgtggcag aggccactcg tgactattaa gattggaggg 420
cagctgaaag aagctctgct ggacaccggg gctgatgata ccgtgctgga agaaatgtcc 480
ctgcctggcc ggtggaaacc taagatgatt ggaggcattg ggggctttat caaagtgcgc 540
cagtatgatc agatcctgat tgaaatttgt ggccataagg ccattgggac agtgctcgtg 600
ggccctacac ctgtgaacat taccggcaga aatctgctga cacagattgg gtgtacactg 660
aatttcccca tctcccccat cggagggtcc ggaggcggct caggcggtgg atccggc 717
<210> 19
<211> 645
<212> DNA
<213> 人工序列
<220>
<223> 无接头的具有突变的Prot-off蛋白酶二聚体
<400> 19
gtgtccttta acttccccca agtgaccctg tggcagcggc ccctcgtgac catcaagatc 60
ggcggccagc tgaaagaggc cctgctggat acaggcgccg acgacacagt gctggaagag 120
atgagcctgc ccggcagatg gaagcccaag atgatcggcg gaatcggcgg cttcatcaaa 180
gtgcggcagt atgatcagat cctgatcgag atctgcggac acaaggccat cggcaccgtg 240
ctcgtgggac ccacccccgt gaatatcatc ggccggaacc tgctgaccca gatcggctgc 300
accctgaact tcgctggcgc cattggaggc gcccctcaag tgacactgtg gcagaggcca 360
ctcgtgacta ttaagattgg agggcagctg aaagaagctc tgctggacac cggggctgat 420
gataccgtgc tggaagaaat gtccctgcct ggccggtgga aacctaagat gattggaggc 480
attgggggct ttatcaaagt gcgccagtat gatcagatcc tgattgaaat ttgtggccat 540
aaggccattg ggacagtgct cgtgggccct acacctgtga acattatcag cagaaatctg 600
ctgacacaga ttgggtgtac actgaatttc cccatctccc ccatc 645
<210> 20
<211> 14351
<212> DNA
<213> 人工序列
<220>
<223> VSV Indiana 载体
<400> 20
cacctaaatt gtaagcgtta atattttgtt aaaattcgcg ttaaattttt gttaaatcag 60
ctcatttttt aaccaatagg ccgaaatcgg caaaatccct tataaatcaa aagaatagac 120
cgagataggg ttgagtgttg ttccagtttg gaacaagagt ccactattaa agaacgtgga 180
ctccaacgtc aaagggcgaa aaaccgtcta tcagggcgat ggcccactac gtgaaccatc 240
accctaatca agttttttgg ggtcgaggtg ccgtaaagca ctaaatcgga accctaaagg 300
gagcccccga tttagagctt gacggggaaa gccggcgaac gtggcgagaa aggaagggaa 360
gaaagcgaaa ggagcgggcg ctagggcgct ggcaagtgta gcggtcacgc tgcgcgtaac 420
caccacaccc gccgcgctta atgcgccgct acagggcgcg tcccattcgc cattcaggct 480
gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa 540
agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg 600
ttgtaaaacg acggccagtg aattgtaata cgactcacta taggacgaag acaaacaaac 660
cattattatc attaaaaggc tcaggagaaa ctttaacagt aatcaaaatg tctgttacag 720
tcaagagaat cattgacaac acagtcgtag ttccaaaact tcctgcaaat gaggatccag 780
tggaataccc ggcagattac ttcagaaaat caaaggagat tcctctttac atcaatacta 840
caaaaagttt gtcagatcta agaggatatg tctaccaagg cctcaaatcc ggaaatgtat 900
caatcataca tgtcaacagc tacttgtatg gagcattaaa ggacatccgg ggtaagttgg 960
ataaagattg gtcaagtttc ggaataaaca tcgggaaagc aggggataca atcggaatat 1020
ttgaccttgt atccttgaaa gccctggacg gcgtacttcc agatggagta tcggatgctt 1080
ccagaaccag cgcagatgac aaatggttgc ctttgtatct acttggctta tacagagtgg 1140
gcagaacaca aatgcctgaa tacagaaaaa agctcatgga tgggctgaca aatcaatgca 1200
aaatgatcaa tgaacagttt gaacctcttg tgccagaagg tcgtgacatt tttgatgtgt 1260
ggggaaatga cagtaattac acaaaaattg tcgctgcagt ggacatgttc ttccacatgt 1320
tcaaaaaaca tgaatgtgcc tcgttcagat acggaactat tgtttccaga ttcaaagatt 1380
gtgctgcatt ggcaacattt ggacacctct gcaaaataac cggaatgtct acagaagatg 1440
taacgacctg gatcttgaac cgagaagttg cagatgaaat ggtccaaatg atgcttccag 1500
gccaagaaat tgacaaggcc gattcataca tgccttattt gatcgacttt ggattgtctt 1560
ctaagtctcc atattcttcc gtcaaaaacc ctgccttcca cttctggggg caattgacag 1620
ctcttctgct cagatccacc agagcaagga atgcccgaca gcctgatgac attgagtata 1680
catctcttac tacagcaggt ttgttgtacg cttatgcagt aggatcctct gccgacttgg 1740
cacaacagtt ttgtgttgga gataacaaat acactccaga tgatagtacc ggaggattga 1800
cgactaatgc accgccacaa ggcagagatg tggtcgaatg gctcggatgg tttgaagatc 1860
aaaacagaaa accgactcct gatatgatgc agtatgcgaa aagagcagtc atgtcactgc 1920
aaggcctaag agagaagaca attggcaagt atgctaagtc agaatttgac aaatgaccct 1980
ataattctca gatcacctat tatatattat gctacatatg aaaaaaacta acagatatca 2040
tggataatct cacaaaagtt cgtgagtatc tcaagtccta ttctcgtctg gatcaggcgg 2100
taggagagat agatgagatc gaagcacaac gagctgaaaa gtccaattat gagttgttcc 2160
aagaggatgg agtggaagag catactaagc cctcttattt tcaggcagca gatgattctg 2220
acacagaatc tgaaccagaa attgaagaca atcaaggctt gtatgcacca gatccagaag 2280
ctgagcaagt tgaaggcttt atacaggggc ctttagatga ctatgcagat gaggaagtgg 2340
atgttgtatt tacttcggac tggaaacagc ctgagcttga atctgacgag catggaaaga 2400
ccttacggtt gacatcgcca gagggtttaa gtggagagca gaaatcccag tggctttcga 2460
cgattaaagc agtcgtgcaa agtgccaaat actggaatct ggcagagtgc acatttgaag 2520
catcgggaga aggggtcatt atgaaggagc gccagataac tccggatgta tataaggtca 2580
ctccagtgat gaacacacat ccgtcccaat cagaagcagt atcagatgtt tggtctctct 2640
caaagacatc catgactttc caacccaaga aagcaagtct tcagcctctc accatatcct 2700
tggatgaatt gttctcatct agaggagagt tcatctctgt cggaggtgac ggacgaatgt 2760
ctcataaaga ggccatcctg ctcggcctga gatacaaaaa gttgtacaat caggcgagag 2820
tcaaatattc tctgtagact atgaaaaaaa gtaacagata tcacgatcta agtgttatcc 2880
caatccattc atcatgagtt ccttaaagaa gattctcggt ctgaagggga aaggtaagaa 2940
atctaagaaa ttagggatcg caccaccccc ttatgaagag gacactagca tggagtatgc 3000
tccgagcgct ccaattgaca aatcctattt tggagttgac gagatggaca cctatgatcc 3060
gaatcaatta agatatgaga aattcttctt tacagtgaaa atgacggtta gatctaatcg 3120
tccgttcaga acatactcag atgtggcagc cgctgtatcc cattgggatc acatgtacat 3180
cggaatggca gggaaacgtc ccttctacaa aatcttggct tttttgggtt cttctaatct 3240
aaaggccact ccagcggtat tggcagatca aggtcaacca gagtatcacg ctcactgcga 3300
aggcagggct tatttgccac ataggatggg gaagacccct cccatgctca atgtaccaga 3360
gcacttcaga agaccattca atataggtct ttacaaggga acgattgagc tcacaatgac 3420
catctacgat gatgagtcac tggaagcagc tcctatgatc tgggatcatt tcaattcttc 3480
caaattttct gatttcagag agaaggcctt aatgtttggc ctgattgtcg agaaaaaggc 3540
atctggagcg tgggtcctgg actctatcgg ccacttcaaa tgagctagtc taacttctag 3600
cttctgaaca atccccggtt tactcagtct cccctaattc cagcctctcg aacaactaat 3660
atcctgtctt ttctatccct atgaaaaaaa ctaacagaga tcgatctgtt tacgcgtcac 3720
tatgaagtgc cttttgtact tagccttttt attcattggg gtgaattgca agttcaccat 3780
agtttttcca cacaaccaaa aaggaaactg gaaaaatgtt ccttctaatt accattattg 3840
cccgtcaagc tcagatttaa attggcataa tgacttaata ggcacagcct tacaagtcaa 3900
aatgcccaag agtcacaagg ctattcaagc agacggttgg atgtgtcatg cttccaaatg 3960
ggtcactact tgtgatttcc gctggtatgg accgaagtat ataacacatt ccatccgatc 4020
cttcactcca tctgtagaac aatgcaagga aagcattgaa caaacgaaac aaggaacttg 4080
gctgaatcca ggcttccctc ctcaaagttg tggatatgca actgtgacgg atgccgaagc 4140
agtgattgtc caggtgactc ctcaccatgt gctggttgat gaatacacag gagaatgggt 4200
tgattcacag ttcatcaacg gaaaatgcag caattacata tgccccactg tccataactc 4260
tacaacctgg cattctgact ataaggtcaa agggctatgt gattctaacc tcatttccat 4320
ggacatcacc ttcttctcag aggacggaga gctatcatcc ctgggaaagg agggcacagg 4380
gttcagaagt aactactttg cttatgaaac tggaggcaag gcctgcaaaa tgcaatactg 4440
caagcattgg ggagtcagac tcccatcagg tgtctggttc gagatggctg ataaggatct 4500
ctttgctgca gccagattcc ctgaatgccc agaagggtca agtatctctg ctccatctca 4560
gacctcagtg gatgtaagtc taattcagga cgttgagagg atcttggatt attccctctg 4620
ccaagaaacc tggagcaaaa tcagagcggg tcttccaatc tctccagtgg atctcagcta 4680
tcttgctcct aaaaacccag gaaccggtcc tgctttcacc ataatcaatg gtaccctaaa 4740
atactttgag accagataca tcagagtcga tattgctgct ccaatcctct caagaatggt 4800
cggaatgatc agtggaacta ccacagaaag ggaactgtgg gatgactggg caccatatga 4860
agacgtggaa attggaccca atggagttct gaggaccagt tcaggatata agtttccttt 4920
atacatgatt ggacatggta tgttggactc cgatcttcat cttagctcaa aggctcaggt 4980
gttcgaacat cctcacattc aagacgctgc ttcgcaactt cctgatgatg agagtttatt 5040
ttttggtgat actgggctat ccaaaaatcc aatcgagctt gtagaaggtt ggttcagtag 5100
ttggaaaagc tctattgcct cttttttctt tatcataggg ttaatcattg gactattctt 5160
ggttctccga gttggtatcc atctttgcat taaattaaag cacaccaaga aaagacagat 5220
ttatacagac atagagatga accgacttgg aaagtaactc aaatcctgct aggtatgaaa 5280
aaaactaaca gatatcacgc tcgagaatta attgctaggt atgaaaaaaa ctaacagata 5340
tcacgctcga gaattaattg ctagccagat tcttcatgtt tggaccaaat caacttgtga 5400
taccatgctc aaagaggcct caattatatt tgagttttta atttttatga aaaaaactaa 5460
cagcaatcat ggaagtccac gattttgaga ccgacgagtt caatgatttc aatgaagatg 5520
actatgccac aagagaattc ctgaatcccg atgagcgcat gacgtacttg aatcatgctg 5580
attacaacct gaattctcct ctaattagtg atgatattga caatttaatc aggaaattca 5640
attctcttcc aattccctcg atgtgggata gtaagaactg ggatggagtt cttgagatgt 5700
taacgtcatg tcaagccaat cccatcccaa catctcagat gcataaatgg atgggaagtt 5760
ggttaatgtc tgataatcat gatgccagtc aagggtatag ttttttacat gaagtggaca 5820
aagaggcaga aataacattt gacgtggtgg agaccttcat ccgcggctgg ggcaacaaac 5880
caattgaata catcaaaaag gaaagatgga ctgactcatt caaaattctc gcttatttgt 5940
gtcaaaagtt tttggactta cacaagttga cattaatctt aaatgctgtc tctgaggtgg 6000
aattgctcaa cttggcgagg actttcaaag gcaaagtcag aagaagttct catggaacga 6060
acatatgcag gattagggtt cccagcttgg gtcctacttt tatttcagaa ggatgggctt 6120
acttcaagaa acttgatatt ctaatggacc gaaactttct gttaatggtc aaagatgtga 6180
ttatagggag gatgcaaacg gtgctatcca tggtatgtag aatagacaac ctgttctcag 6240
agcaagacat cttctccctt ctaaatatct acagaattgg agataaaatt gtggagaggc 6300
agggaaattt ttcttatgac ttgattaaaa tggtggaacc gatatgcaac ttgaagctga 6360
tgaaattagc aagagaatca aggcctttag tcccacaatt ccctcatttt gaaaatcata 6420
tcaagacttc tgttgatgaa ggggcaaaaa ttgaccgagg tataagattc ctccatgatc 6480
agataatgag tgtgaaaaca gtggatctca cactggtgat ttatggatcg ttcagacatt 6540
ggggtcatcc ttttatagat tattacactg gactagaaaa attacattcc caagtaacca 6600
tgaagaaaga tattgatgtg tcatatgcaa aagcacttgc aagtgattta gctcggattg 6660
ttctatttca acagttcaat gatcataaaa agtggttcgt gaatggagac ttgctccctc 6720
atgatcatcc ctttaaaagt catgttaaag aaaatacatg gcccacagct gctcaagttc 6780
aagattttgg agataaatgg catgaacttc cgctgattaa atgttttgaa atacccgact 6840
tactagaccc atcgataata tactctgaca aaagtcattc aatgaatagg tcagaggtgt 6900
tgaaacatgt ccgaatgaat ccgaacactc ctatccctag taaaaaggtg ttgcagacta 6960
tgttggacac aaaggctacc aattggaaag aatttcttaa agagattgat gagaagggct 7020
tagatgatga tgatctaatt attggtctta aaggaaagga gagggaactg aagttggcag 7080
gtagattttt ctccctaatg tcttggaaat tgcgagaata ctttgtaatt accgaatatt 7140
tgataaagac tcatttcgtc cctatgttta aaggcctgac aatggcggac gatctaactg 7200
cagtcattaa aaagatgtta gattcctcat ccggccaagg attgaagtca tatgaggcaa 7260
tttgcatagc caatcacatt gattacgaaa aatggaataa ccaccaaagg aagttatcaa 7320
acggcccagt gttccgagtt atgggccagt tcttaggtta tccatcctta atcgagagaa 7380
ctcatgaatt ttttgagaaa agtcttatat actacaatgg aagaccagac ttgatgcgtg 7440
ttcacaacaa cacactgatc aattcaacct cccaacgagt ttgttggcaa ggacaagagg 7500
gtggactgga aggtctacgg caaaaaggat ggagtatcct caatctactg gttattcaaa 7560
gagaggctaa aatcagaaac actgctgtca aagtcttggc acaaggtgat aatcaagtta 7620
tttgcacaca gtataaaacg aagaaatcga gaaacgttgt agaattacag ggtgctctca 7680
atcaaatggt ttctaataat gagaaaatta tgactgcaat caaaataggg acagggaagt 7740
taggactttt gataaatgac gatgagacta tgcaatctgc agattacttg aattatggaa 7800
aaataccgat tttccgtgga gtgattagag ggttagagac caagagatgg tcacgagtga 7860
cttgtgtcac caatgaccaa atacccactt gtgctaatat aatgagctca gtttccacaa 7920
atgctctcac cgtagctcat tttgctgaga acccaatcaa tgccatgata cagtacaatt 7980
attttgggac atttgctaga ctcttgttga tgatgcatga tcctgctctt cgtcaatcat 8040
tgtatgaagt tcaagataag ataccgggct tgcacagttc tactttcaaa tacgccatgt 8100
tgtatttgga cccttccatt ggaggagtgt cgggcatgtc tttgtccagg tttttgatta 8160
gagccttccc agatcccgta acagaaagtc tctcattctg gagattcatc catgtacatg 8220
ctcgaagtga gcatctgaag gagatgagtg cagtatttgg aaaccccgag atagccaagt 8280
ttcgaataac tcacatagac aagctagtag aagatccaac ctctctgaac atcgctatgg 8340
gaatgagtcc agcgaacttg ttaaagactg aggttaaaaa atgcttaatc gaatcaagac 8400
aaaccatcag gaaccaggtg attaaggatg caaccatata tttgtatcat gaagaggatc 8460
ggctcagaag tttcttatgg tcaataaatc ctctgttccc tagattttta agtgaattca 8520
aatcaggcac ttttttggga gtcgcagacg ggctcatcag tctatttcaa aattctcgta 8580
ctattcggaa ctcctttaag aaaaagtatc atagggaatt ggatgatttg attgtgagga 8640
gtgaggtatc ctctttgaca catttaggga aacttcattt gagaagggga tcatgtaaaa 8700
tgtggacatg ttcagctact catgctgaca cattaagata caaatcctgg ggccgtacag 8760
ttattgggac aactgtaccc catccattag aaatgttggg tccacaacat cgaaaagaga 8820
ctccttgtgc accatgtaac acatcagggt tcaattatgt ttctgtgcat tgtccagacg 8880
ggatccatga cgtctttagt tcacggggac cattgcctgc ttatctaggg tctaaaacat 8940
ctgaatctac atctattttg cagccttggg aaagggaaag caaagtccca ctgattaaaa 9000
gagctacacg tcttagagat gctatctctt ggtttgttga acccgactct aaactagcaa 9060
tgactatact ttctaacatc cactctttaa caggcgaaga atggaccaaa aggcagcatg 9120
ggttcaaaag aacagggtct gcccttcata ggttttcgac atctcggatg agccatggtg 9180
ggttcgcatc tcagagcact gcagcattga ccaggttgat ggcaactaca gacaccatga 9240
gggatctggg agatcagaat ttcgactttt tattccaagc aacgttgctc tatgctcaaa 9300
ttaccaccac tgttgcaaga gacggatgga tcaccagttg tacagatcat tatcatattg 9360
cctgtaagtc ctgtttgaga cccatagaag agatcaccct ggactcaagt atggactaca 9420
cgcccccaga tgtatcccat gtgctgaaga catggaggaa tggggaaggt tcgtggggac 9480
aagagataaa acagatctat cctttagaag ggaattggaa gaatttagca cctgctgagc 9540
aatcctatca agtcggcaga tgtataggtt ttctatatgg agacttggcg tatagaaaat 9600
ctactcatgc cgaggacagt tctctatttc ctctatctat acaaggtcgt attagaggtc 9660
gaggtttctt aaaagggttg ctagacggat taatgagagc aagttgctgc caagtaatac 9720
accggagaag tctggctcat ttgaagaggc cggccaacgc agtgtacgga ggtttgattt 9780
acttgattga taaattgagt gtatcacctc cattcctttc tcttactaga tcaggaccta 9840
ttagagacga attagaaacg attccccaca agatcccaac ctcctatccg acaagcaacc 9900
gtgatatggg ggtgattgtc agaaattact tcaaatacca atgccgtcta attgaaaagg 9960
gaaaatacag atcacattat tcacaattat ggttattctc agatgtctta tccatagact 10020
tcattggacc attctctatt tccaccaccc tcttgcaaat cctatacaag ccatttttat 10080
ctgggaaaga taagaatgag ttgagagagc tggcaaatct ttcttcattg ctaagatcag 10140
gagaggggtg ggaagacata catgtgaaat tcttcaccaa ggacatatta ttgtgtccag 10200
aggaaatcag acatgcttgc aagttcggga ttgctaagga taataataaa gacatgagct 10260
atcccccttg gggaagggaa tccagaggga caattacaac aatccctgtt tattatacga 10320
ccacccctta cccaaagatg ctagagatgc ctccaagaat ccaaaatccc ctgctgtccg 10380
gaatcaggtt gggccaatta ccaactggcg ctcattataa aattcggagt atattacatg 10440
gaatgggaat ccattacagg gacttcttga gttgtggaga cggctccgga gggatgactg 10500
ctgcattact acgagaaaat gtgcatagca gaggaatatt caatagtctg ttagaattat 10560
cagggtcagt catgcgaggc gcctctcctg agccccccag tgccctagaa actttaggag 10620
gagataaatc gagatgtgta aatggtgaaa catgttggga atatccatct gacttatgtg 10680
acccaaggac ttgggactat ttcctccgac tcaaagcagg cttggggctt caaattgatt 10740
taattgtaat ggatatggaa gttcgggatt cttctactag cctgaaaatt gagacgaatg 10800
ttagaaatta tgtgcaccgg attttggatg agcaaggagt tttaatctac aagacttatg 10860
gaacatatat ttgtgagagc gaaaagaatg cagtaacaat ccttggtccc atgttcaaga 10920
cggtcgactt agttcaaaca gaatttagta gttctcaaac gtctgaagta tatatggtat 10980
gtaaaggttt gaagaaatta atcgatgaac ccaatcccga ttggtcttcc atcaatgaat 11040
cctggaaaaa cctgtacgca ttccagtcat cagaacagga atttgccaga gcaaagaagg 11100
ttagtacata ctttaccttg acaggtattc cctcccaatt cattcctgat ccttttgtaa 11160
acattgagac tatgctacaa atattcggag tacccacggg tgtgtctcat gcggctgcct 11220
taaaatcatc tgatagacct gcagatttat tgaccattag ccttttttat atggcgatta 11280
tatcgtatta taacatcaat catatcagag taggaccgat acctccgaac cccccatcag 11340
atggaattgc acaaaatgtg gggatcgcta taactggtat aagcttttgg ctgagtttga 11400
tggagaaaga cattccacta tatcaacagt gtttagcagt tatccagcaa tcattcccga 11460
ttaggtggga ggctgtttca gtaaaaggag gatacaagca gaagtggagt actagaggtg 11520
atgggctccc aaaagatacc cgaatttcag actccttggc cccaatcggg aactggatca 11580
gatctctgga attggtccga aaccaagttc gtctaaatcc attcaatgag atcttgttca 11640
atcagctatg tcgtacagtg gataatcatt tgaaatggtc aaatttgcga agaaacacag 11700
gaatgattga atggatcaat agacgaattt caaaagaaga ccggtctata ctgatgttga 11760
agagtgacct acacgaggaa aactcttgga gagattaaaa aatcatgagg agactccaaa 11820
ctttaagtat gaaaaaaact ttgatcctta agaccctctt gtggttttta ttttttatct 11880
ggttttgtgg tcttcgtggg tcggcatggc atctccacct cctcgcggtc cgacctgggc 11940
atccgaagga ggacgtcgtc cactcggatg gctaagggag gggcccccgc ggggctgcta 12000
acaaagcccg aaaggaagct gagttggctg ctgccaccgc tgagcaataa ctagcataac 12060
cccttggggc ctctaaacgg gtcttgaggg gttttttgct gaaaggagga actatatccg 12120
gatcgagacc tcgatactag tgcggtggag ctccagcttt tgttcccttt agtgagggtt 12180
aatttcgagc ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct 12240
cacaattcca cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg 12300
agtgagctaa ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct 12360
gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg 12420
gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc 12480
ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg 12540
aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct 12600
ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca 12660
gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct 12720
cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc 12780
gggaagcgtg gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt 12840
tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc 12900
cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc 12960
cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg 13020
gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc 13080
agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag 13140
cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga 13200
tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat 13260
tttggtcatg agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag 13320
ttttaaatca atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat 13380
cagtgaggca cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc 13440
cgtcgtgtag ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat 13500
accgcgagac ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag 13560
ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg 13620
ccgggaagct agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc 13680
tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca 13740
acgatcaagg cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg 13800
tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc 13860
actgcataat tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta 13920
ctcaaccaag tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc 13980
aatacgggat aataccgcgc cacatagcag aactttaaaa gtgctcatca ttggaaaacg 14040
ttcttcgggg cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc 14100
cactcgtgca cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc 14160
aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat 14220
actcatactc ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag 14280
cggatacata tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc 14340
ccgaaaagtg c 14351
<210> 21
<211> 15061
<212> DNA
<213> 人工序列
<220>
<223> VSV Indiana GFP 载体
<400> 21
cacctaaatt gtaagcgtta atattttgtt aaaattcgcg ttaaattttt gttaaatcag 60
ctcatttttt aaccaatagg ccgaaatcgg caaaatccct tataaatcaa aagaatagac 120
cgagataggg ttgagtgttg ttccagtttg gaacaagagt ccactattaa agaacgtgga 180
ctccaacgtc aaagggcgaa aaaccgtcta tcagggcgat ggcccactac gtgaaccatc 240
accctaatca agttttttgg ggtcgaggtg ccgtaaagca ctaaatcgga accctaaagg 300
gagcccccga tttagagctt gacggggaaa gccggcgaac gtggcgagaa aggaagggaa 360
gaaagcgaaa ggagcgggcg ctagggcgct ggcaagtgta gcggtcacgc tgcgcgtaac 420
caccacaccc gccgcgctta atgcgccgct acagggcgcg tcccattcgc cattcaggct 480
gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa 540
agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg 600
ttgtaaaacg acggccagtg aattgtaata cgactcacta taggacgaag acaaacaaac 660
cattattatc attaaaaggc tcaggagaaa ctttaacagt aatcaaaatg tctgttacag 720
tcaagagaat cattgacaac acagtcgtag ttccaaaact tcctgcaaat gaggatccag 780
tggaataccc ggcagattac ttcagaaaat caaaggagat tcctctttac atcaatacta 840
caaaaagttt gtcagatcta agaggatatg tctaccaagg cctcaaatcc ggaaatgtat 900
caatcataca tgtcaacagc tacttgtatg gagcattaaa ggacatccgg ggtaagttgg 960
ataaagattg gtcaagtttc ggaataaaca tcgggaaagc aggggataca atcggaatat 1020
ttgaccttgt atccttgaaa gccctggacg gcgtacttcc agatggagta tcggatgctt 1080
ccagaaccag cgcagatgac aaatggttgc ctttgtatct acttggctta tacagagtgg 1140
gcagaacaca aatgcctgaa tacagaaaaa agctcatgga tgggctgaca aatcaatgca 1200
aaatgatcaa tgaacagttt gaacctcttg tgccagaagg tcgtgacatt tttgatgtgt 1260
ggggaaatga cagtaattac acaaaaattg tcgctgcagt ggacatgttc ttccacatgt 1320
tcaaaaaaca tgaatgtgcc tcgttcagat acggaactat tgtttccaga ttcaaagatt 1380
gtgctgcatt ggcaacattt ggacacctct gcaaaataac cggaatgtct acagaagatg 1440
taacgacctg gatcttgaac cgagaagttg cagatgaaat ggtccaaatg atgcttccag 1500
gccaagaaat tgacaaggcc gattcataca tgccttattt gatcgacttt ggattgtctt 1560
ctaagtctcc atattcttcc gtcaaaaacc ctgccttcca cttctggggg caattgacag 1620
ctcttctgct cagatccacc agagcaagga atgcccgaca gcctgatgac attgagtata 1680
catctcttac tacagcaggt ttgttgtacg cttatgcagt aggatcctct gccgacttgg 1740
cacaacagtt ttgtgttgga gataacaaat acactccaga tgatagtacc ggaggattga 1800
cgactaatgc accgccacaa ggcagagatg tggtcgaatg gctcggatgg tttgaagatc 1860
aaaacagaaa accgactcct gatatgatgc agtatgcgaa aagagcagtc atgtcactgc 1920
aaggcctaag agagaagaca attggcaagt atgctaagtc agaatttgac aaatgaccct 1980
ataattctca gatcacctat tatatattat gctacatatg aaaaaaacta acagatatca 2040
tggataatct cacaaaagtt cgtgagtatc tcaagtccta ttctcgtctg gatcaggcgg 2100
taggagagat agatgagatc gaagcacaac gagctgaaaa gtccaattat gagttgttcc 2160
aagaggatgg agtggaagag catactaagc cctcttattt tcaggcagca gatgattctg 2220
acacagaatc tgaaccagaa attgaagaca atcaaggctt gtatgcacca gatccagaag 2280
ctgagcaagt tgaaggcttt atacaggggc ctttagatga ctatgcagat gaggaagtgg 2340
atgttgtatt tacttcggac tggaaacagc ctgagcttga atctgacgag catggaaaga 2400
ccttacggtt gacatcgcca gagggtttaa gtggagagca gaaatcccag tggctttcga 2460
cgattaaagc agtcgtgcaa agtgccaaat actggaatct ggcagagtgc acatttgaag 2520
catcgggaga aggggtcatt atgaaggagc gccagataac tccggatgta tataaggtca 2580
ctccagtgat gaacacacat ccgtcccaat cagaagcagt atcagatgtt tggtctctct 2640
caaagacatc catgactttc caacccaaga aagcaagtct tcagcctctc accatatcct 2700
tggatgaatt gttctcatct agaggagagt tcatctctgt cggaggtgac ggacgaatgt 2760
ctcataaaga ggccatcctg ctcggcctga gatacaaaaa gttgtacaat caggcgagag 2820
tcaaatattc tctgtagact atgaaaaaaa gtaacagata tcacgatcta agtgttatcc 2880
caatccattc atcatgagtt ccttaaagaa gattctcggt ctgaagggga aaggtaagaa 2940
atctaagaaa ttagggatcg caccaccccc ttatgaagag gacactagca tggagtatgc 3000
tccgagcgct ccaattgaca aatcctattt tggagttgac gagatggaca cctatgatcc 3060
gaatcaatta agatatgaga aattcttctt tacagtgaaa atgacggtta gatctaatcg 3120
tccgttcaga acatactcag atgtggcagc cgctgtatcc cattgggatc acatgtacat 3180
cggaatggca gggaaacgtc ccttctacaa aatcttggct tttttgggtt cttctaatct 3240
aaaggccact ccagcggtat tggcagatca aggtcaacca gagtatcacg ctcactgcga 3300
aggcagggct tatttgccac ataggatggg gaagacccct cccatgctca atgtaccaga 3360
gcacttcaga agaccattca atataggtct ttacaaggga acgattgagc tcacaatgac 3420
catctacgat gatgagtcac tggaagcagc tcctatgatc tgggatcatt tcaattcttc 3480
caaattttct gatttcagag agaaggcctt aatgtttggc ctgattgtcg agaaaaaggc 3540
atctggagcg tgggtcctgg actctatcgg ccacttcaaa tgagctagtc taacttctag 3600
cttctgaaca atccccggtt tactcagtct cccctaattc cagcctctcg aacaactaat 3660
atcctgtctt ttctatccct atgaaaaaaa ctaacagaga tcgatctgtt tacgcgtcac 3720
tatgaagtgc cttttgtact tagccttttt attcattggg gtgaattgca agttcaccat 3780
agtttttcca cacaaccaaa aaggaaactg gaaaaatgtt ccttctaatt accattattg 3840
cccgtcaagc tcagatttaa attggcataa tgacttaata ggcacagcct tacaagtcaa 3900
aatgcccaag agtcacaagg ctattcaagc agacggttgg atgtgtcatg cttccaaatg 3960
ggtcactact tgtgatttcc gctggtatgg accgaagtat ataacacatt ccatccgatc 4020
cttcactcca tctgtagaac aatgcaagga aagcattgaa caaacgaaac aaggaacttg 4080
gctgaatcca ggcttccctc ctcaaagttg tggatatgca actgtgacgg atgccgaagc 4140
agtgattgtc caggtgactc ctcaccatgt gctggttgat gaatacacag gagaatgggt 4200
tgattcacag ttcatcaacg gaaaatgcag caattacata tgccccactg tccataactc 4260
tacaacctgg cattctgact ataaggtcaa agggctatgt gattctaacc tcatttccat 4320
ggacatcacc ttcttctcag aggacggaga gctatcatcc ctgggaaagg agggcacagg 4380
gttcagaagt aactactttg cttatgaaac tggaggcaag gcctgcaaaa tgcaatactg 4440
caagcattgg ggagtcagac tcccatcagg tgtctggttc gagatggctg ataaggatct 4500
ctttgctgca gccagattcc ctgaatgccc agaagggtca agtatctctg ctccatctca 4560
gacctcagtg gatgtaagtc taattcagga cgttgagagg atcttggatt attccctctg 4620
ccaagaaacc tggagcaaaa tcagagcggg tcttccaatc tctccagtgg atctcagcta 4680
tcttgctcct aaaaacccag gaaccggtcc tgctttcacc ataatcaatg gtaccctaaa 4740
atactttgag accagataca tcagagtcga tattgctgct ccaatcctct caagaatggt 4800
cggaatgatc agtggaacta ccacagaaag ggaactgtgg gatgactggg caccatatga 4860
agacgtggaa attggaccca atggagttct gaggaccagt tcaggatata agtttccttt 4920
atacatgatt ggacatggta tgttggactc cgatcttcat cttagctcaa aggctcaggt 4980
gttcgaacat cctcacattc aagacgctgc ttcgcaactt cctgatgatg agagtttatt 5040
ttttggtgat actgggctat ccaaaaatcc aatcgagctt gtagaaggtt ggttcagtag 5100
ttggaaaagc tctattgcct cttttttctt tatcataggg ttaatcattg gactattctt 5160
ggttctccga gttggtatcc atctttgcat taaattaaag cacaccaaga aaagacagat 5220
ttatacagac atagagatga accgacttgg aaagtaactc aaatcctgct aggtatgaaa 5280
aaaactaaca gatatcacgc tcgaggcaat tgcgcgctag ctatgaaaaa aactaacaga 5340
tatcaccatg agcaagggcg aggaactgtt cactggcgtg gtcccaattc tcgtggaact 5400
ggatggcgat gtgaatgggc acaaattttc tgtcagcgga gagggtgaag gagatgccac 5460
atacggaaag ctcaccctga aattcatctg caccactgga aagctccctg tgccatggcc 5520
aacactggtc actaccttca cctatggcgt gcagtgcttt tccagatacc cagaccatat 5580
gaagcagcat gactttttca agagcgccat gcccgagggc tatgtgcagg agagaaccat 5640
ctttttcaaa gatgacggga actacaagac ccgcrctgaa gtcaagttcg aaggtgacac 5700
cctggtgaat agaatcgagc tgaagggcat tgactttaag gaggatggaa acattctcgg 5760
ccacaagctg gaatacaact ataactccca caatgtgtac atcatggccg acaagcaaaa 5820
gaatggcatc aaggtcaact tcaagatcag acacaacatt gaggatggat ccgtgcagct 5880
ggccgaccat tatcaacaga acactccaat cggcgacggc cctgtgctcc tcccagacaa 5940
ccattacctg tccacccagt ctgccctgtc taaagatccc aacgaaaaga gagaccacat 6000
ggtcctgctg gagtttgtga ccgctgctgg gatcacacat ggcatggacg agctgtacaa 6060
gtgatctagc cagattcttc atgtttggac caaaatcaac ttgtgatacc atgctcaaag 6120
aggcctcaaa ttatatttga gttttttaat ttttatgaaa aaaaactacc agcaatcaat 6180
ggaagtccac gattttgaga ccgacgagtt caatgatttc aatgaagatg actatgccac 6240
aagagaattc ctgaatcccg atgagcgcat gacgtacttg aatcatgctg attacaacct 6300
gaattctcct ctaattagtg atgatattga caatttaatc aggaaattca attctcttcc 6360
aattccctcg atgtgggata gtaagaactg ggatggagtt cttgagatgt taacgtcatg 6420
tcaagccaat cccatcccaa catctcagat gcataaatgg atgggaagtt ggttaatgtc 6480
tgataatcat gatgccagtc aagggtatag ttttttacat gaagtggaca aagaggcaga 6540
aataacattt gacgtggtgg agaccttcat ccgcggctgg ggcaacaaac caattgaata 6600
catcaaaaag gaaagatgga ctgactcatt caaaattctc gcttatttgt gtcaaaagtt 6660
tttggactta cacaagttga cattaatctt aaatgctgtc tctgaggtgg aattgctcaa 6720
cttggcgagg actttcaaag gcaaagtcag aagaagttct catggaacga acatatgcag 6780
gattagggtt cccagcttgg gtcctacttt tatttcagaa ggatgggctt acttcaagaa 6840
acttgatatt ctaatggacc gaaactttct gttaatggtc aaagatgtga ttatagggag 6900
gatgcaaacg gtgctatcca tggtatgtag aatagacaac ctgttctcag agcaagacat 6960
cttctccctt ctaaatatct acagaattgg agataaaatt gtggagaggc agggaaattt 7020
ttcttatgac ttgattaaaa tggtggaacc gatatgcaac ttgaagctga tgaaattagc 7080
aagagaatca aggcctttag tcccacaatt ccctcatttt gaaaatcata tcaagacttc 7140
tgttgatgaa ggggcaaaaa ttgaccgagg tataagattc ctccatgatc agataatgag 7200
tgtgaaaaca gtggatctca cactggtgat ttatggatcg ttcagacatt ggggtcatcc 7260
ttttatagat tattacactg gactagaaaa attacattcc caagtaacca tgaagaaaga 7320
tattgatgtg tcatatgcaa aagcacttgc aagtgattta gctcggattg ttctatttca 7380
acagttcaat gatcataaaa agtggttcgt gaatggagac ttgctccctc atgatcatcc 7440
ctttaaaagt catgttaaag aaaatacatg gcccacagct gctcaagttc aagattttgg 7500
agataaatgg catgaacttc cgctgattaa atgttttgaa atacccgact tactagaccc 7560
atcgataata tactctgaca aaagtcattc aatgaatagg tcagaggtgt tgaaacatgt 7620
ccgaatgaat ccgaacactc ctatccctag taaaaaggtg ttgcagacta tgttggacac 7680
aaaggctacc aattggaaag aatttcttaa agagattgat gagaagggct tagatgatga 7740
tgatctaatt attggtctta aaggaaagga gagggaactg aagttggcag gtagattttt 7800
ctccctaatg tcttggaaat tgcgagaata ctttgtaatt accgaatatt tgataaagac 7860
tcatttcgtc cctatgttta aaggcctgac aatggcggac gatctaactg cagtcattaa 7920
aaagatgtta gattcctcat ccggccaagg attgaagtca tatgaggcaa tttgcatagc 7980
caatcacatt gattacgaaa aatggaataa ccaccaaagg aagttatcaa acggcccagt 8040
gttccgagtt atgggccagt tcttaggtta tccatcctta atcgagagaa ctcatgaatt 8100
ttttgagaaa agtcttatat actacaatgg aagaccagac ttgatgcgtg ttcacaacaa 8160
cacactgatc aattcaacct cccaacgagt ttgttggcaa ggacaagagg gtggactgga 8220
aggtctacgg caaaaaggat ggagtatcct caatctactg gttattcaaa gagaggctaa 8280
aatcagaaac actgctgtca aagtcttggc acaaggtgat aatcaagtta tttgcacaca 8340
gtataaaacg aagaaatcga gaaacgttgt agaattacag ggtgctctca atcaaatggt 8400
ttctaataat gagaaaatta tgactgcaat caaaataggg acagggaagt taggactttt 8460
gataaatgac gatgagacta tgcaatctgc agattacttg aattatggaa aaataccgat 8520
tttccgtgga gtgattagag ggttagagac caagagatgg tcacgagtga cttgtgtcac 8580
caatgaccaa atacccactt gtgctaatat aatgagctca gtttccacaa atgctctcac 8640
cgtagctcat tttgctgaga acccaatcaa tgccatgata cagtacaatt attttgggac 8700
atttgctaga ctcttgttga tgatgcatga tcctgctctt cgtcaatcat tgtatgaagt 8760
tcaagataag ataccgggct tgcacagttc tactttcaaa tacgccatgt tgtatttgga 8820
cccttccatt ggaggagtgt cgggcatgtc tttgtccagg tttttgatta gagccttccc 8880
agatcccgta acagaaagtc tctcattctg gagattcatc catgtacatg ctcgaagtga 8940
gcatctgaag gagatgagtg cagtatttgg aaaccccgag atagccaagt ttcgaataac 9000
tcacatagac aagctagtag aagatccaac ctctctgaac atcgctatgg gaatgagtcc 9060
agcgaacttg ttaaagactg aggttaaaaa atgcttaatc gaatcaagac aaaccatcag 9120
gaaccaggtg attaaggatg caaccatata tttgtatcat gaagaggatc ggctcagaag 9180
tttcttatgg tcaataaatc ctctgttccc tagattttta agtgaattca aatcaggcac 9240
ttttttggga gtcgcagacg ggctcatcag tctatttcaa aattctcgta ctattcggaa 9300
ctcctttaag aaaaagtatc atagggaatt ggatgatttg attgtgagga gtgaggtatc 9360
ctctttgaca catttaggga aacttcattt gagaagggga tcatgtaaaa tgtggacatg 9420
ttcagctact catgctgaca cattaagata caaatcctgg ggccgtacag ttattgggac 9480
aactgtaccc catccattag aaatgttggg tccacaacat cgaaaagaga ctccttgtgc 9540
accatgtaac acatcagggt tcaattatgt ttctgtgcat tgtccagacg ggatccatga 9600
cgtctttagt tcacggggac cattgcctgc ttatctaggg tctaaaacat ctgaatctac 9660
atctattttg cagccttggg aaagggaaag caaagtccca ctgattaaaa gagctacacg 9720
tcttagagat gctatctctt ggtttgttga acccgactct aaactagcaa tgactatact 9780
ttctaacatc cactctttaa caggcgaaga atggaccaaa aggcagcatg ggttcaaaag 9840
aacagggtct gcccttcata ggttttcgac atctcggatg agccatggtg ggttcgcatc 9900
tcagagcact gcagcattga ccaggttgat ggcaactaca gacaccatga gggatctggg 9960
agatcagaat ttcgactttt tattccaagc aacgttgctc tatgctcaaa ttaccaccac 10020
tgttgcaaga gacggatgga tcaccagttg tacagatcat tatcatattg cctgtaagtc 10080
ctgtttgaga cccatagaag agatcaccct ggactcaagt atggactaca cgcccccaga 10140
tgtatcccat gtgctgaaga catggaggaa tggggaaggt tcgtggggac aagagataaa 10200
acagatctat cctttagaag ggaattggaa gaatttagca cctgctgagc aatcctatca 10260
agtcggcaga tgtataggtt ttctatatgg agacttggcg tatagaaaat ctactcatgc 10320
cgaggacagt tctctatttc ctctatctat acaaggtcgt attagaggtc gaggtttctt 10380
aaaagggttg ctagacggat taatgagagc aagttgctgc caagtaatac accggagaag 10440
tctggctcat ttgaagaggc cggccaacgc agtgtacgga ggtttgattt acttgattga 10500
taaattgagt gtatcacctc cattcctttc tcttactaga tcaggaccta ttagagacga 10560
attagaaacg attccccaca agatcccaac ctcctatccg acaagcaacc gtgatatggg 10620
ggtgattgtc agaaattact tcaaatacca atgccgtcta attgaaaagg gaaaatacag 10680
atcacattat tcacaattat ggttattctc agatgtctta tccatagact tcattggacc 10740
attctctatt tccaccaccc tcttgcaaat cctatacaag ccatttttat ctgggaaaga 10800
taagaatgag ttgagagagc tggcaaatct ttcttcattg ctaagatcag gagaggggtg 10860
ggaagacata catgtgaaat tcttcaccaa ggacatatta ttgtgtccag aggaaatcag 10920
acatgcttgc aagttcggga ttgctaagga taataataaa gacatgagct atcccccttg 10980
gggaagggaa tccagaggga caattacaac aatccctgtt tattatacga ccacccctta 11040
cccaaagatg ctagagatgc ctccaagaat ccaaaatccc ctgctgtccg gaatcaggtt 11100
gggccaatta ccaactggcg ctcattataa aattcggagt atattacatg gaatgggaat 11160
ccattacagg gacttcttga gttgtggaga cggctccgga gggatgactg ctgcattact 11220
acgagaaaat gtgcatagca gaggaatatt caatagtctg ttagaattat cagggtcagt 11280
catgcgaggc gcctctcctg agccccccag tgccctagaa actttaggag gagataaatc 11340
gagatgtgta aatggtgaaa catgttggga atatccatct gacttatgtg acccaaggac 11400
ttgggactat ttcctccgac tcaaagcagg cttggggctt caaattgatt taattgtaat 11460
ggatatggaa gttcgggatt cttctactag cctgaaaatt gagacgaatg ttagaaatta 11520
tgtgcaccgg attttggatg agcaaggagt tttaatctac aagacttatg gaacatatat 11580
ttgtgagagc gaaaagaatg cagtaacaat ccttggtccc atgttcaaga cggtcgactt 11640
agttcaaaca gaatttagta gttctcaaac gtctgaagta tatatggtat gtaaaggttt 11700
gaagaaatta atcgatgaac ccaatcccga ttggtcttcc atcaatgaat cctggaaaaa 11760
cctgtacgca ttccagtcat cagaacagga atttgccaga gcaaagaagg ttagtacata 11820
ctttaccttg acaggtattc cctcccaatt cattcctgat ccttttgtaa acattgagac 11880
tatgctacaa atattcggag tacccacggg tgtgtctcat gcggctgcct taaaatcatc 11940
tgatagacct gcagatttat tgaccattag ccttttttat atggcgatta tatcgtatta 12000
taacatcaat catatcagag taggaccgat acctccgaac cccccatcag atggaattgc 12060
acaaaatgtg gggatcgcta taactggtat aagcttttgg ctgagtttga tggagaaaga 12120
cattccacta tatcaacagt gtttagcagt tatccagcaa tcattcccga ttaggtggga 12180
ggctgtttca gtaaaaggag gatacaagca gaagtggagt actagaggtg atgggctccc 12240
aaaagatacc cgaatttcag actccttggc cccaatcggg aactggatca gatctctgga 12300
attggtccga aaccaagttc gtctaaatcc attcaatgag atcttgttca atcagctatg 12360
tcgtacagtg gataatcatt tgaaatggtc aaatttgcga agaaacacag gaatgattga 12420
atggatcaat agacgaattt caaaagaaga ccggtctata ctgatgttga agagtgacct 12480
acacgaggaa aactcttgga gagattaaaa aatcatgagg agactccaaa ctttaagtat 12540
gaaaaaaact ttgatcctta agaccctctt gtggttttta ttttttatct ggttttgtgg 12600
tcttcgtggg tcggcatggc atctccacct cctcgcggtc cgacctgggc atccgaagga 12660
ggacgtcgtc cactcggatg gctaagggag gggcccccgc ggggctgcta acaaagcccg 12720
aaaggaagct gagttggctg ctgccaccgc tgagcaataa ctagcataac cccttggggc 12780
ctctaaacgg gtcttgaggg gttttttgct gaaaggagga actatatccg gatcgagacc 12840
tcgatactag tgcggtggag ctccagcttt tgttcccttt agtgagggtt aatttcgagc 12900
ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 12960
cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 13020
ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 13080
ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 13140
gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 13200
cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 13260
tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 13320
cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 13380
aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 13440
cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 13500
gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 13560
ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 13620
cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 13680
aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 13740
tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc 13800
ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 13860
tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 13920
ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 13980
agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 14040
atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 14100
cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 14160
ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 14220
ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 14280
agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 14340
agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc 14400
gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 14460
cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc 14520
gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat 14580
tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag 14640
tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat 14700
aataccgcgc cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg 14760
cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca 14820
cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga 14880
aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatactc 14940
ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag cggatacata 15000
tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc ccgaaaagtg 15060
c 15061
<210> 22
<211> 11115
<212> DNA
<213> 水泡性口炎Indiana病毒
<220>
<223> 水泡性口炎Indiana病毒,全基因组 (GeneBank: MH919398.1)
<400> 22
tcaggagaaa ctttaacagt aatcaaaatg tctgttacag tcaagagaat cattgacaac 60
acagtcatag ttccaaaact tcctgcaaat gaggatccag tggaataccc ggcagattac 120
ttcagaaaat caaaggagat tcctctttac atcaatacta caaaaagttt gtcagatcta 180
agaggatatg tctaccaagg cctcaaatcc ggaaatgtat caatcataca tgtcaacagc 240
tacttgtatg gagcattgaa ggacatccgg ggtaagttgg ataaagattg gtcaagtttc 300
ggaataaaca tcgggaaggc aggggataca atcggaatat ttgaccttgt atccttgaaa 360
gccctggacg gtgtacttcc agatggagta tcggatgctt ccagaaccag cgcagatgac 420
aaatggttgc ctttgtatct acttggctta tacagagtgg gcagaacaca aatgcctgaa 480
tacagaaaaa ggctcatgga tgggctgaca aatcaatgca aaatgatcaa tgaacagttt 540
gaacctcttg tgccagaagg tcgtgacatt tttgatgtgt ggggaaatga cagtaattac 600
acaaaaattg tcgctgcagt ggacatgttc ttccacatgt tcaaaaaaca tgaatgtgcc 660
tcgttcagat acggaactat tgtttccaga ttcaaagatt gtgctgcatt ggcaacattt 720
ggacacctct gcaaaataac cggaatgtct acagaagatg taacgacctg gatcttgaac 780
cgagaagttg cagatgagat ggtccaaatg atgcttccag gccaagaaat tgacaaggcc 840
gattcataca tgccttattt gatcgacttt ggattgtctt ctaagtctcc atattcttcc 900
gtcaaaaacc ctgccttcca cttctggggg caattgacag ctcttctgct cagatccacc 960
agagcaagga atgcccgaca gcctgatgac attgagtata catctcttac tacagcaggt 1020
ttgttgtacg cttatgcagt aggatcctct gctgacttgg cacaacagtt ttgtgttgga 1080
gatagcaaat acactccaga tgatagtacc ggaggattga cgactaatgc accgccacaa 1140
ggcagagatg tggtcgaatg gctcggatgg tttgaagatc aaaacagaaa accgactcct 1200
gatatgatgc agtatgcgaa acgagcagtc atgtcactgc aaggcctaag agagaagaca 1260
attggcaagt atgctaagtc agaatttgac aaatgaccct ataattctca gatcacctat 1320
tatatattat gctacatatg aaaaaaacta acagatatca tggataatct cacaaaagtt 1380
cgtgagtatc tcaagtccta ttctcgtcta gatcaggcgg taggagagat agatgagatc 1440
gaagcacaac gagctgaaaa gtccaattat gagttgttcc aagaggacgg agtggaagag 1500
catactaggc cctcttattt tcaggcagca gatgattctg acacagaatc tgaaccagaa 1560
attgaagaca atcaaggctt gtatgtacca gatccggaag ctgagcaagt tgaaggcttt 1620
atacaggggc ctttagatga ctatgcggat gaggacgtgg atgttgtatt cacttcggac 1680
tggaaacagc ctgagcttga atccgacgag catggaaaga ccttacggtt gacattgcca 1740
gagggtttaa gtggagagca gaaatcccag tggcttttga cgattaaagc agtcgttcaa 1800
agtgccaaac actggaatct ggcagagtgc acatttgaag catcgggaga aggggtcatc 1860
ataaaaaagc gccagataac tccggatgta tataaggtca ctccagtgat gaacacacat 1920
ccgtcccaat cggaagccgt atcagatgtt tggtctctct caaagacatc catgactttc 1980
caacccaaga aagcaagtct tcagcctctc accatatcct tggatgaatt gttctcatct 2040
agaggagaat tcatctctgt cggaggtaac ggacgaatgt ctcataaaga ggccatcctg 2100
ctcggtctga ggtacaaaaa gttgtacaat caggcgagag tcaaatattc tctgtagact 2160
atgaaaaaaa gtaacagata tcacaatcta agtgttatcc caatccattc atcatgagtt 2220
ccttaaagaa gattctcggt ctgaagggga aaggtaagaa atctaagaaa ttagggatcg 2280
caccaccccc ttatgaagag gacactaaca tggagtatgc tccgagcgct ccaattgaca 2340
aatcctattt tggagttgac gagagggaca ctcatgatcc gcatcaatta agatatgaga 2400
aattcttctt tacagtgaaa atgacggtta gatctaatcg tccgttcaga acatactcag 2460
atgtggcagc cgctgtatcc cattgggatc acatgtacat cggaatggca gggaaacgtc 2520
ccttctacaa gatcttggct tttttgggtt cttctaatct aaaggccact ccagcggtat 2580
tggcagatca aggtcaacca gagtatcacg ctcactgtga aggcagggct tatttgccac 2640
acagaatggg gaagacccct cccatgctca atgtaccaga gcacttcaga agaccattca 2700
atataggtct ttacaaggga acggttgagc tcacaatgac catctacgat gatgagtcac 2760
tggaagcagc tcctatgatc tgggatcatt tcaattcttc caaattttct gatttcagag 2820
agaaggcctt aatgtttggc ctgattgtcg agaaaaaggc atctggagct tgggtcctgg 2880
attctgtcag ccacttcaaa tgagctagtc tagcttccag cttctgaaca atccccggtt 2940
tactcagtct ctcctaattc cagcctttcg aacaactaat atcctgtctt ttctatccct 3000
atgaaaaaaa ctaacagaga tcgatctgtt tccttgacac catgaagtgc cttttgtact 3060
tagctttttt attcatcggg gtgaattgca agttcaccat agtttttcca tacaaccaaa 3120
aaggaaactg gaaaaatgtt ccttccaatt accattattg cccgtcaagc tcagatttaa 3180
attggcataa tgacttaata ggcacagcct tacaagtcaa aatgcccaag agtcacaagg 3240
ctattcaagc agacggttgg atgtgtcatg cttccaaatg ggtcactact tgtgatttcc 3300
gctggtacgg accgaagtat ataacacatt ccatccgatc cttcactcca tctgtagaac 3360
aatgcaagga aagcattgaa caaacgaaac aaggaacttg gctgaatcca ggcttccctc 3420
ctcaaagttg tggatatgca actgtgacgg atgctgaagc agcgattgtc caggtgactc 3480
ctcaccatgt gcttgttgat gaatacacag gagaatgggt tgattcacag ttcatcaacg 3540
gaaaatgcag caatgacata tgccccactg tccataactc cacaacctgg cattccgact 3600
ataaggtcaa agggctatgt gattctaacc tcatttccat ggacatcacc ttcttctcag 3660
aggacggaga gctatcatcc ctaggaaagg agggcacagg gttcagaagt aactactttg 3720
cttatgaaac tggagacaag gcctgcaaaa tgcagtactg caagcattgg ggagtcagac 3780
tcccatcagg tgtctggttc gagatggctg ataaggatct ctttgctgca gccagattcc 3840
ctgaatgccc agaagggtca agtatctctg ctccatctca gacctcagtg gatgtaagtc 3900
tcattcagga cgttgagagg atcttggatt attccctctg ccaagaaacc tggagcaaaa 3960
tcagagcggg tcttcccatc tctccagtgg atctcagcta tcttgctcct aaaaacccag 4020
gaaccggtcc tgtctttacc ataatcaatg gtaccctaaa atactttgag accagataca 4080
tcagagtcga tattgctgct ccaatcctct caagaatggt cggaatgatc agtggaacta 4140
ccacagaaag ggaactgtgg gatgactggg ctccatatga agacgtggaa attggaccca 4200
atggagttct gaggaccagt tcaggatata agtttccttt atatatgatt ggacatggta 4260
tgttggactc cgatcttcat cttagctcaa aggctcaggt gtttgaacat cctcacattc 4320
aagacgctgc tgcgcagctt cctgatgatg agactttatt ttttggtgat actgggctat 4380
ccaaaaatcc aatcgagttt gtagaaggtt ggttcagtag ttggaagagc tctattgcct 4440
cttttttctt tatcataggg ttaatcattg gactattctt ggttctccga gttggtattt 4500
atctttgcat taaattaaag cacaccaaga aaagacagat ttatacagac atagagatga 4560
accgacttgg gaagtaactc aaatcctgca caacagattc ttcatgtttg aaccaaatca 4620
acttgtgata tcatgctcaa agaggcctta attatatttt aatttttaat ttttatgaaa 4680
aaaactaaca gcaatcatgg aagtccacga ttttgagacc gacgagttca atgatttcaa 4740
tgaagatgac tatgccacaa gagaattcct gaatcccgat gagcgcatga cgtacttgaa 4800
tcatgctgat tacaatttga attctcctct aattagtgat gatattgaca atttgatcag 4860
gaaattcaat tctcttccga ttccctcgat gtgggatagt aagaactggg atggagttct 4920
tgagatgtta acatcatgtc aagccaatcc catctcaaca tctcagatgc ataaatggat 4980
gggaagttgg ttaatgtctg ataatcatga tgccagtcaa gggtatagtt ttttacatga 5040
agtggacaaa gaggcagaaa taacatttga cgtggtggag accttcatcc gcggctgggg 5100
caacaaacca attgaataca tcaaaaagga aagatggact gactcattca aaattctcgc 5160
ttatttgtgt caaaagtttt tggacttaca caagttgaca ttaatcttaa atgctgtctc 5220
tgaggtggaa ttgctcaact tggcgaggac tttcaaaggc aaagtcagaa gaagttctca 5280
tggaacgaac atatgcaggc ttagggttcc cagcttgggt cctactttta tttcagaagg 5340
atgggcttac ttcaagaaac ttgatattct aatggaccga aactttctgt taatggtcaa 5400
agatgtgatt atagggagga tgcaaacggt gctatccatg gtatgtagaa tagacaacct 5460
gttctcagag caagacatct tctccctcct aaatatctac agaattggag ataaaattgt 5520
ggagaggcag ggaaattttt cttatgactt gattaaaatg gtggaaccga tatgcaactt 5580
gaagctgatg aaattagcaa gagaatcaag gcctttagtc ccacaattcc ctcattttga 5640
aaatcatatc aagacttctg ttgatgaagg ggcaaaaatt gaccgaggta taagattcct 5700
ccatgatcag ataatgagtg tgaaaacagt ggatctcaca ctggtgattt atggatcgtt 5760
cagacattgg ggtcatcctt ttatagatta ttacgctgga ctagaaaaat tacattccca 5820
agtaaccatg aagaaagata ttgatgtgtc atatgcaaaa gcacttgcaa gtgatttagc 5880
tcggattgtt ctatttcaac agttcaatga tcataaaaag tggttcgtga atggagactt 5940
gctccctcat gatcatccct ttaaaagtca tgttaaagaa aatacatggc ccacagctgc 6000
tcaagttcaa gattttggag ataaatggca tgaacttccg ctgattaaat gttttgaaat 6060
acccgactta ctagacccat cgataatata ctctgacaaa agtcattcaa tgaataggtc 6120
agaggtgttg aaacatgtcc gaatgaatcc gaacactcct atccctagta aaaaggtgtt 6180
gcagactatg ttggacacaa aggctaccaa ttggaaagaa tttcttaaag agattgatga 6240
gaagggctta gatgatgatg atctaattat tggtcttaaa ggaaaggaga gggaactgaa 6300
gttggcaggt agatttttct ccctaatgtc ttggaaattg cgagaatact ttgtaattac 6360
cgaatatttg ataaagactc atttcgtccc tatgtttaaa ggcctgacaa tggcggacga 6420
tctaaccgca gtcattaaaa agatgttaga ttcctcatcc ggccaaggat tgaagtcata 6480
tgaggcaatt tgcatagcca atcacattga ttacgaaaaa tggaataacc accaaaggaa 6540
gttatcaaac ggcccagtgt tccgagttat gggccagttc ttaggttatc catccttaat 6600
cgagagaact catgaatttt ttgagaaaag tcttatatac tacaatggaa gaccagactt 6660
gatgcgtgtt cacaacaaca cactgatcaa ttcaacctcc caacgagttt gttggcaagg 6720
acaagagggt ggactggaag gtctacggca aaaaggatgg agtatcctca atctactggt 6780
tattcaaaga gaggctaaaa tcagaaacac tgctgtcaaa gtcttggcac aaggtgataa 6840
tcaagttatt tgcacacagt ataaaacgaa gaaatcgaga aacgttgtag aattacaggg 6900
tgctctcaat caaatggttt ctaataatga gaaaattatg actgcaatca aaatagggac 6960
agggaagtta ggacttttga taaatgacga tgagactatg caatctgcag attacttgaa 7020
ttatggaaaa ataccgattt tccgtggagt gattagaggg ttagagacca agagatggtc 7080
acgagtgact tgtgtcacca atgaccaaat acccacttgt gctaatataa tgagctcagt 7140
ttccacaaat gctctcaccg tagctcattt tgctgagaac ccaatcaatg ccatgataca 7200
gtacaattat tttgggacat ttgctagact cttgttgatg atgcatgatc ctgctcttcg 7260
tcaatcattg tatgaagttc aagataagat accgggattg cacagttcta ctttcaaata 7320
cgccatgttg tatttggacc cttccattgg aggagtgtcg ggcatgtctt tgtccaggtt 7380
tttgattaga gccttcccag atcccgtaac agaaagtctc tcattctgga gattcatcca 7440
tgtacatgct cgaagtgagc atctgaagga gatgagtgca gtatttggaa accccgagat 7500
agccaagttt cgaataactc acatagacaa gctagtagaa gatccaacct ctctgaacat 7560
cgctatggga atgagtccag cgaacttgtt aaagactgag gttaaaaaat gcttaatcga 7620
atcaagacaa accatcagga accaggtgat taaggatgca accatatatt tgtatcatga 7680
agaggatcgg ctcagaagtt tcttatggtc aataaatcct ctgttcccta gatttttaag 7740
tgaattcaaa tcaggcactt ttttgggagt cgcagacggg ctcatcagtc tatttcaaaa 7800
ttctcgtact attcggaact cctttaagaa aaagtatcat agggaattgg atgatttgat 7860
tgtgaggagt gaggtatcct ctttgacaca tttagggaaa cttcatttga gaaggggatc 7920
atgtaaaatg tggacatgtt cagctactca tgctgacaca ttaagataca aatcctgggg 7980
ccgtacagtt attgggacaa ctgtacccca tccattagaa atgttgggtc cacaacatcg 8040
gaaagagact ccttgtgcac catgtaacac atcagggttc aattatgttt ctgtgcattg 8100
tccagacggg atccatgacg tctttagttc acggggacca ttgcctgctt atctagggtc 8160
taaaacatct gaatctacat ctattttgca gccttgggaa agggaaagca aagtcccact 8220
gattaaaaga gctacacgtc ttagagatgc tatctcttgg tttgttgaac ccgactctaa 8280
actagcaatg actatacttt ctaacatcca ctctttaaca ggcgaagaat ggaccaaaag 8340
gcagcatggg ttcaaaagaa cagggtctgc ccttcatagg ttttcgacat ctcggatgag 8400
ccatggtggg ttcgcatctc agagcactgc agcattgacc aggttgatgg caactacaga 8460
caccatgagg gatctgggag atcagaattt cgacttttta ttccaggcaa cgttgctcta 8520
tgctcagatt accaccactg ttgcaagaga cggatggatc accagttgta cagatcatta 8580
tcatattgcc tgtaagtcct gtttgagacc catagaagag atcaccctgg actcaagtat 8640
ggactacacg cccccagatg tatcccatgt gctgaagaca tggaggaatg gggaaggttc 8700
gtggggacaa gagataaaac agatctatcc tttagaaggg aattggaaga atttagcacc 8760
tgctgagcaa tcctatcaag tcggcagatg tataggtttt ctatatggag acttggcgta 8820
tagaaaatct actcatgccg aggacagttc tctatttcct ctatctatac aaggtcgtat 8880
tagaggtcga ggtttcttaa aagggttgct agacggatta atgagagcaa gttgctgcca 8940
agtaatacac cggagaagtc tggctcattt gaagaggccg gccaacgcag tgtacggagg 9000
tttgatttac ttgattgata aattgagtgt atcacctcca ttcctttctc ttactagatc 9060
aggacctatt agagacgaat tagaaacgat tccccacaag atcccaacct cctatccgac 9120
aagcaaccgt gatatggggg tgattgtcag aaattacttc aaataccaat gccgtctaat 9180
tgaaaaggga aaatacagat cacattattc acaattatgg ttattctcag atgtcttatc 9240
catagacttc attggaccat tctctatttc caccaccctc ttgcaaatcc tatacaagcc 9300
atttttatct gggaaagata agaatgagtt gagagagctg gcaaatcttt cttcattgct 9360
aagatcagga gaggggtggg aagacataca tgtgaaattc ttcaccaagg acatattatt 9420
gtgtccagag gaaatcagac atgcttgcaa gttcgggatt gctaaggata ataataaaga 9480
catgagctat cccccttggg gaagggaatc cagagggaca attacaacaa tccctgttta 9540
ttatacgacc accccttacc caaagatgct agagatgcct ccaagaatcc aaaatcccct 9600
gctgtccgga atcaggttgg gccagttacc aactggcgct cattataaaa ttcggagtat 9660
attacatgga atgggaatcc attacaggga cttcttgagt tgtggagacg gctccggagg 9720
gatgactgct gcattactac gagaaaatgt gcatagcaga ggaatattca atagtctgtt 9780
agaattatca gggtcagtca tgcgaggcgc ctctcctgag ccccccagtg ccctagaaac 9840
tttaggagga gataaatcga gatgtgtaaa tggtgaaaca tgttgggaat atccatctga 9900
cttatgtgac ccaaggactt gggactattt cctccgactc aaagcaggct tggggcttca 9960
aattgattta attgtaatgg atatggaagt tcgggattct tctactagcc tgaaaattga 10020
gacgaatgtt agaaattatg tgcaccggat tttggatgag caaggagttt taatctacaa 10080
gacttatgga acatatattt gtgagagcga aaagaatgca gtaacaatcc ttggtcccat 10140
gttcaagacg gtcgacttag ttcaaacaga atttagtagt tctcaaacgt ctgaagtata 10200
tatggtatgt aaaggtttga agaaattaat cgatgaaccc aatcccgatt ggtcttccat 10260
caatgaatcc tggaaaaacc tgtacgcatt ccagtcatca gaacaggaat ttgccagagc 10320
aaagaaggtt agtacatact ttaccttgac aggtattccc tcccaattca ttcctgatcc 10380
ttttgtaaac attgagacta tgctacaaat attcggagta cccacgggtg tgtctcatgc 10440
ggctgcctta aaatcatctg atagacctgc agatttattg accattagcc ttttttatat 10500
ggcgattata tcgtattata acatcaatca tatcagagta ggaccgatac ctccgaaccc 10560
cccatcagat ggaattgcac aaaatgtggg gatcgctata actggtataa gcttttggct 10620
gagtttgatg gagaaagaca ttccactata tcaacagtgt ttagcagtta tccagcaatc 10680
attcccgatt aggtgggagg ctgtttcagt aaaaggagga tacaagcaga agtggagtac 10740
tagaggtgat gggctcccaa aggatacccg aatttcagac tccttggccc caatcgggaa 10800
ctggatcaga tctctggaat tggtccgaaa ccaagttcgt ctaaatccat tcaatgagat 10860
cttgttcaat cagctatgtc gtacagtgga taatcatttg aaatggtcaa atttgcgaaa 10920
aaacacagga atgattgaat ggatcaatag acgaatttca aaagaagacc ggtctatact 10980
gatgttgaag agtgacctac atgaggaaaa ctcttggaga gattaaaaaa tcatgaggag 11040
actccaaact ttaagtatga aaaaaacttt gatccttaag accctcttgt ggtttttatt 11100
ttttatctgg ttttg 11115
<210> 23
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 基于 VSV Indiana GFP 的引物 49bp-before-FseI
<400> 23
gctgccaagt aatacaccgg 20
<210> 24
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 基于 VSV Indiana GFP 的引物 50bp-after-SfoI
<400> 24
tttatctcct cctaaagttt c 21
<210> 25
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> MT1620insertGGSG 正向
<400> 25
ggctcaggcg gtggatccgg ctacccaaag atgctagaga tg 42
<210> 26
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> MT1620insertGGSG 反向
<400> 26
gctccctccg ccgcttccgc caggggtggt cgtataataa ac 42
<210> 27
<211> 265
<212> PRT
<213> 水泡性口炎Indiana病毒
<220>
<223> P-蛋白aa
<400> 27
Met Asp Asn Leu Thr Lys Val Arg Glu Tyr Leu Lys Ser Tyr Ser Arg
1 5 10 15
Leu Asp Gln Ala Val Gly Glu Ile Asp Glu Ile Glu Ala Gln Arg Ala
20 25 30
Glu Lys Ser Asn Tyr Glu Leu Phe Gln Glu Asp Gly Val Glu Glu His
35 40 45
Thr Lys Pro Ser Tyr Phe Gln Ala Ala Asp Asp Ser Asp Thr Glu Ser
50 55 60
Glu Pro Glu Ile Glu Asp Asn Gln Gly Leu Tyr Ala Pro Asp Pro Glu
65 70 75 80
Ala Glu Gln Val Glu Gly Phe Ile Gln Gly Pro Leu Asp Asp Tyr Ala
85 90 95
Asp Glu Glu Val Asp Val Val Phe Thr Ser Asp Trp Lys Gln Pro Glu
100 105 110
Leu Glu Ser Asp Glu His Gly Lys Thr Leu Arg Leu Thr Ser Pro Glu
115 120 125
Gly Leu Ser Gly Glu Gln Lys Ser Gln Trp Leu Ser Thr Ile Lys Ala
130 135 140
Val Val Gln Ser Ala Lys Tyr Trp Asn Leu Ala Glu Cys Thr Phe Glu
145 150 155 160
Ala Ser Gly Glu Gly Val Ile Met Lys Glu Arg Gln Ile Thr Pro Asp
165 170 175
Val Tyr Lys Val Thr Pro Val Met Asn Thr His Pro Ser Gln Ser Glu
180 185 190
Ala Val Ser Asp Val Trp Ser Leu Ser Lys Thr Ser Met Thr Phe Gln
195 200 205
Pro Lys Lys Ala Ser Leu Gln Pro Leu Thr Ile Ser Leu Asp Glu Leu
210 215 220
Phe Ser Ser Arg Gly Glu Phe Ile Ser Val Gly Gly Asp Gly Arg Met
225 230 235 240
Ser His Lys Glu Ala Ile Leu Leu Gly Leu Arg Tyr Lys Lys Leu Tyr
245 250 255
Asn Gln Ala Arg Val Lys Tyr Ser Leu
260 265
<210> 28
<211> 2109
<212> PRT
<213> 水泡性口炎Indiana病毒
<220>
<223> L-蛋白氨基酸序列
<400> 28
Met Glu Val His Asp Phe Glu Thr Asp Glu Phe Asn Asp Phe Asn Glu
1 5 10 15
Asp Asp Tyr Ala Thr Arg Glu Phe Leu Asn Pro Asp Glu Arg Met Thr
20 25 30
Tyr Leu Asn His Ala Asp Tyr Asn Leu Asn Ser Pro Leu Ile Ser Asp
35 40 45
Asp Ile Asp Asn Leu Ile Arg Lys Phe Asn Ser Leu Pro Ile Pro Ser
50 55 60
Met Trp Asp Ser Lys Asn Trp Asp Gly Val Leu Glu Met Leu Thr Ser
65 70 75 80
Cys Gln Ala Asn Pro Ile Pro Thr Ser Gln Met His Lys Trp Met Gly
85 90 95
Ser Trp Leu Met Ser Asp Asn His Asp Ala Ser Gln Gly Tyr Ser Phe
100 105 110
Leu His Glu Val Asp Lys Glu Ala Glu Ile Thr Phe Asp Val Val Glu
115 120 125
Thr Phe Ile Arg Gly Trp Gly Asn Lys Pro Ile Glu Tyr Ile Lys Lys
130 135 140
Glu Arg Trp Thr Asp Ser Phe Lys Ile Leu Ala Tyr Leu Cys Gln Lys
145 150 155 160
Phe Leu Asp Leu His Lys Leu Thr Leu Ile Leu Asn Ala Val Ser Glu
165 170 175
Val Glu Leu Leu Asn Leu Ala Arg Thr Phe Lys Gly Lys Val Arg Arg
180 185 190
Ser Ser His Gly Thr Asn Ile Cys Arg Ile Arg Val Pro Ser Leu Gly
195 200 205
Pro Thr Phe Ile Ser Glu Gly Trp Ala Tyr Phe Lys Lys Leu Asp Ile
210 215 220
Leu Met Asp Arg Asn Phe Leu Leu Met Val Lys Asp Val Ile Ile Gly
225 230 235 240
Arg Met Gln Thr Val Leu Ser Met Val Cys Arg Ile Asp Asn Leu Phe
245 250 255
Ser Glu Gln Asp Ile Phe Ser Leu Leu Asn Ile Tyr Arg Ile Gly Asp
260 265 270
Lys Ile Val Glu Arg Gln Gly Asn Phe Ser Tyr Asp Leu Ile Lys Met
275 280 285
Val Glu Pro Ile Cys Asn Leu Lys Leu Met Lys Leu Ala Arg Glu Ser
290 295 300
Arg Pro Leu Val Pro Gln Phe Pro His Phe Glu Asn His Ile Lys Thr
305 310 315 320
Ser Val Asp Glu Gly Ala Lys Ile Asp Arg Gly Ile Arg Phe Leu His
325 330 335
Asp Gln Ile Met Ser Val Lys Thr Val Asp Leu Thr Leu Val Ile Tyr
340 345 350
Gly Ser Phe Arg His Trp Gly His Pro Phe Ile Asp Tyr Tyr Thr Gly
355 360 365
Leu Glu Lys Leu His Ser Gln Val Thr Met Lys Lys Asp Ile Asp Val
370 375 380
Ser Tyr Ala Lys Ala Leu Ala Ser Asp Leu Ala Arg Ile Val Leu Phe
385 390 395 400
Gln Gln Phe Asn Asp His Lys Lys Trp Phe Val Asn Gly Asp Leu Leu
405 410 415
Pro His Asp His Pro Phe Lys Ser His Val Lys Glu Asn Thr Trp Pro
420 425 430
Thr Ala Ala Gln Val Gln Asp Phe Gly Asp Lys Trp His Glu Leu Pro
435 440 445
Leu Ile Lys Cys Phe Glu Ile Pro Asp Leu Leu Asp Pro Ser Ile Ile
450 455 460
Tyr Ser Asp Lys Ser His Ser Met Asn Arg Ser Glu Val Leu Lys His
465 470 475 480
Val Arg Met Asn Pro Asn Thr Pro Ile Pro Ser Lys Lys Val Leu Gln
485 490 495
Thr Met Leu Asp Thr Lys Ala Thr Asn Trp Lys Glu Phe Leu Lys Glu
500 505 510
Ile Asp Glu Lys Gly Leu Asp Asp Asp Asp Leu Ile Ile Gly Leu Lys
515 520 525
Gly Lys Glu Arg Glu Leu Lys Leu Ala Gly Arg Phe Phe Ser Leu Met
530 535 540
Ser Trp Lys Leu Arg Glu Tyr Phe Val Ile Thr Glu Tyr Leu Ile Lys
545 550 555 560
Thr His Phe Val Pro Met Phe Lys Gly Leu Thr Met Ala Asp Asp Leu
565 570 575
Thr Ala Val Ile Lys Lys Met Leu Asp Ser Ser Ser Gly Gln Gly Leu
580 585 590
Lys Ser Tyr Glu Ala Ile Cys Ile Ala Asn His Ile Asp Tyr Glu Lys
595 600 605
Trp Asn Asn His Gln Arg Lys Leu Ser Asn Gly Pro Val Phe Arg Val
610 615 620
Met Gly Gln Phe Leu Gly Tyr Pro Ser Leu Ile Glu Arg Thr His Glu
625 630 635 640
Phe Phe Glu Lys Ser Leu Ile Tyr Tyr Asn Gly Arg Pro Asp Leu Met
645 650 655
Arg Val His Asn Asn Thr Leu Ile Asn Ser Thr Ser Gln Arg Val Cys
660 665 670
Trp Gln Gly Gln Glu Gly Gly Leu Glu Gly Leu Arg Gln Lys Gly Trp
675 680 685
Ser Ile Leu Asn Leu Leu Val Ile Gln Arg Glu Ala Lys Ile Arg Asn
690 695 700
Thr Ala Val Lys Val Leu Ala Gln Gly Asp Asn Gln Val Ile Cys Thr
705 710 715 720
Gln Tyr Lys Thr Lys Lys Ser Arg Asn Val Val Glu Leu Gln Gly Ala
725 730 735
Leu Asn Gln Met Val Ser Asn Asn Glu Lys Ile Met Thr Ala Ile Lys
740 745 750
Ile Gly Thr Gly Lys Leu Gly Leu Leu Ile Asn Asp Asp Glu Thr Met
755 760 765
Gln Ser Ala Asp Tyr Leu Asn Tyr Gly Lys Ile Pro Ile Phe Arg Gly
770 775 780
Val Ile Arg Gly Leu Glu Thr Lys Arg Trp Ser Arg Val Thr Cys Val
785 790 795 800
Thr Asn Asp Gln Ile Pro Thr Cys Ala Asn Ile Met Ser Ser Val Ser
805 810 815
Thr Asn Ala Leu Thr Val Ala His Phe Ala Glu Asn Pro Ile Asn Ala
820 825 830
Met Ile Gln Tyr Asn Tyr Phe Gly Thr Phe Ala Arg Leu Leu Leu Met
835 840 845
Met His Asp Pro Ala Leu Arg Gln Ser Leu Tyr Glu Val Gln Asp Lys
850 855 860
Ile Pro Gly Leu His Ser Ser Thr Phe Lys Tyr Ala Met Leu Tyr Leu
865 870 875 880
Asp Pro Ser Ile Gly Gly Val Ser Gly Met Ser Leu Ser Arg Phe Leu
885 890 895
Ile Arg Ala Phe Pro Asp Pro Val Thr Glu Ser Leu Ser Phe Trp Arg
900 905 910
Phe Ile His Val His Ala Arg Ser Glu His Leu Lys Glu Met Ser Ala
915 920 925
Val Phe Gly Asn Pro Glu Ile Ala Lys Phe Arg Ile Thr His Ile Asp
930 935 940
Lys Leu Val Glu Asp Pro Thr Ser Leu Asn Ile Ala Met Gly Met Ser
945 950 955 960
Pro Ala Asn Leu Leu Lys Thr Glu Val Lys Lys Cys Leu Ile Glu Ser
965 970 975
Arg Gln Thr Ile Arg Asn Gln Val Ile Lys Asp Ala Thr Ile Tyr Leu
980 985 990
Tyr His Glu Glu Asp Arg Leu Arg Ser Phe Leu Trp Ser Ile Asn Pro
995 1000 1005
Leu Phe Pro Arg Phe Leu Ser Glu Phe Lys Ser Gly Thr Phe Leu Gly
1010 1015 1020
Val Ala Asp Gly Leu Ile Ser Leu Phe Gln Asn Ser Arg Thr Ile Arg
1025 1030 1035 1040
Asn Ser Phe Lys Lys Lys Tyr His Arg Glu Leu Asp Asp Leu Ile Val
1045 1050 1055
Arg Ser Glu Val Ser Ser Leu Thr His Leu Gly Lys Leu His Leu Arg
1060 1065 1070
Arg Gly Ser Cys Lys Met Trp Thr Cys Ser Ala Thr His Ala Asp Thr
1075 1080 1085
Leu Arg Tyr Lys Ser Trp Gly Arg Thr Val Ile Gly Thr Thr Val Pro
1090 1095 1100
His Pro Leu Glu Met Leu Gly Pro Gln His Arg Lys Glu Thr Pro Cys
1105 1110 1115 1120
Ala Pro Cys Asn Thr Ser Gly Phe Asn Tyr Val Ser Val His Cys Pro
1125 1130 1135
Asp Gly Ile His Asp Val Phe Ser Ser Arg Gly Pro Leu Pro Ala Tyr
1140 1145 1150
Leu Gly Ser Lys Thr Ser Glu Ser Thr Ser Ile Leu Gln Pro Trp Glu
1155 1160 1165
Arg Glu Ser Lys Val Pro Leu Ile Lys Arg Ala Thr Arg Leu Arg Asp
1170 1175 1180
Ala Ile Ser Trp Phe Val Glu Pro Asp Ser Lys Leu Ala Met Thr Ile
1185 1190 1195 1200
Leu Ser Asn Ile His Ser Leu Thr Gly Glu Glu Trp Thr Lys Arg Gln
1205 1210 1215
His Gly Phe Lys Arg Thr Gly Ser Ala Leu His Arg Phe Ser Thr Ser
1220 1225 1230
Arg Met Ser His Gly Gly Phe Ala Ser Gln Ser Thr Ala Ala Leu Thr
1235 1240 1245
Arg Leu Met Ala Thr Thr Asp Thr Met Arg Asp Leu Gly Asp Gln Asn
1250 1255 1260
Phe Asp Phe Leu Phe Gln Ala Thr Leu Leu Tyr Ala Gln Ile Thr Thr
1265 1270 1275 1280
Thr Val Ala Arg Asp Gly Trp Ile Thr Ser Cys Thr Asp His Tyr His
1285 1290 1295
Ile Ala Cys Lys Ser Cys Leu Arg Pro Ile Glu Glu Ile Thr Leu Asp
1300 1305 1310
Ser Ser Met Asp Tyr Thr Pro Pro Asp Val Ser His Val Leu Lys Thr
1315 1320 1325
Trp Arg Asn Gly Glu Gly Ser Trp Gly Gln Glu Ile Lys Gln Ile Tyr
1330 1335 1340
Pro Leu Glu Gly Asn Trp Lys Asn Leu Ala Pro Ala Glu Gln Ser Tyr
1345 1350 1355 1360
Gln Val Gly Arg Cys Ile Gly Phe Leu Tyr Gly Asp Leu Ala Tyr Arg
1365 1370 1375
Lys Ser Thr His Ala Glu Asp Ser Ser Leu Phe Pro Leu Ser Ile Gln
1380 1385 1390
Gly Arg Ile Arg Gly Arg Gly Phe Leu Lys Gly Leu Leu Asp Gly Leu
1395 1400 1405
Met Arg Ala Ser Cys Cys Gln Val Ile His Arg Arg Ser Leu Ala His
1410 1415 1420
Leu Lys Arg Pro Ala Asn Ala Val Tyr Gly Gly Leu Ile Tyr Leu Ile
1425 1430 1435 1440
Asp Lys Leu Ser Val Ser Pro Pro Phe Leu Ser Leu Thr Arg Ser Gly
1445 1450 1455
Pro Ile Arg Asp Glu Leu Glu Thr Ile Pro His Lys Ile Pro Thr Ser
1460 1465 1470
Tyr Pro Thr Ser Asn Arg Asp Met Gly Val Ile Val Arg Asn Tyr Phe
1475 1480 1485
Lys Tyr Gln Cys Arg Leu Ile Glu Lys Gly Lys Tyr Arg Ser His Tyr
1490 1495 1500
Ser Gln Leu Trp Leu Phe Ser Asp Val Leu Ser Ile Asp Phe Ile Gly
1505 1510 1515 1520
Pro Phe Ser Ile Ser Thr Thr Leu Leu Gln Ile Leu Tyr Lys Pro Phe
1525 1530 1535
Leu Ser Gly Lys Asp Lys Asn Glu Leu Arg Glu Leu Ala Asn Leu Ser
1540 1545 1550
Ser Leu Leu Arg Ser Gly Glu Gly Trp Glu Asp Ile His Val Lys Phe
1555 1560 1565
Phe Thr Lys Asp Ile Leu Leu Cys Pro Glu Glu Ile Arg His Ala Cys
1570 1575 1580
Lys Phe Gly Ile Ala Lys Asp Asn Asn Lys Asp Met Ser Tyr Pro Pro
1585 1590 1595 1600
Trp Gly Arg Glu Ser Arg Gly Thr Ile Thr Thr Ile Pro Val Tyr Tyr
1605 1610 1615
Thr Thr Thr Pro Tyr Pro Lys Met Leu Glu Met Pro Pro Arg Ile Gln
1620 1625 1630
Asn Pro Leu Leu Ser Gly Ile Arg Leu Gly Gln Leu Pro Thr Gly Ala
1635 1640 1645
His Tyr Lys Ile Arg Ser Ile Leu His Gly Met Gly Ile His Tyr Arg
1650 1655 1660
Asp Phe Leu Ser Cys Gly Asp Gly Ser Gly Gly Met Thr Ala Ala Leu
1665 1670 1675 1680
Leu Arg Glu Asn Val His Ser Arg Gly Ile Phe Asn Ser Leu Leu Glu
1685 1690 1695
Leu Ser Gly Ser Val Met Arg Gly Ala Ser Pro Glu Pro Pro Ser Ala
1700 1705 1710
Leu Glu Thr Leu Gly Gly Asp Lys Ser Arg Cys Val Asn Gly Glu Thr
1715 1720 1725
Cys Trp Glu Tyr Pro Ser Asp Leu Cys Asp Pro Arg Thr Trp Asp Tyr
1730 1735 1740
Phe Leu Arg Leu Lys Ala Gly Leu Gly Leu Gln Ile Asp Leu Ile Val
1745 1750 1755 1760
Met Asp Met Glu Val Arg Asp Ser Ser Thr Ser Leu Lys Ile Glu Thr
1765 1770 1775
Asn Val Arg Asn Tyr Val His Arg Ile Leu Asp Glu Gln Gly Val Leu
1780 1785 1790
Ile Tyr Lys Thr Tyr Gly Thr Tyr Ile Cys Glu Ser Glu Lys Asn Ala
1795 1800 1805
Val Thr Ile Leu Gly Pro Met Phe Lys Thr Val Asp Leu Val Gln Thr
1810 1815 1820
Glu Phe Ser Ser Ser Gln Thr Ser Glu Val Tyr Met Val Cys Lys Gly
1825 1830 1835 1840
Leu Lys Lys Leu Ile Asp Glu Pro Asn Pro Asp Trp Ser Ser Ile Asn
1845 1850 1855
Glu Ser Trp Lys Asn Leu Tyr Ala Phe Gln Ser Ser Glu Gln Glu Phe
1860 1865 1870
Ala Arg Ala Lys Lys Val Ser Thr Tyr Phe Thr Leu Thr Gly Ile Pro
1875 1880 1885
Ser Gln Phe Ile Pro Asp Pro Phe Val Asn Ile Glu Thr Met Leu Gln
1890 1895 1900
Ile Phe Gly Val Pro Thr Gly Val Ser His Ala Ala Ala Leu Lys Ser
1905 1910 1915 1920
Ser Asp Arg Pro Ala Asp Leu Leu Thr Ile Ser Leu Phe Tyr Met Ala
1925 1930 1935
Ile Ile Ser Tyr Tyr Asn Ile Asn His Ile Arg Val Gly Pro Ile Pro
1940 1945 1950
Pro Asn Pro Pro Ser Asp Gly Ile Ala Gln Asn Val Gly Ile Ala Ile
1955 1960 1965
Thr Gly Ile Ser Phe Trp Leu Ser Leu Met Glu Lys Asp Ile Pro Leu
1970 1975 1980
Tyr Gln Gln Cys Leu Ala Val Ile Gln Gln Ser Phe Pro Ile Arg Trp
1985 1990 1995 2000
Glu Ala Val Ser Val Lys Gly Gly Tyr Lys Gln Lys Trp Ser Thr Arg
2005 2010 2015
Gly Asp Gly Leu Pro Lys Asp Thr Arg Ile Ser Asp Ser Leu Ala Pro
2020 2025 2030
Ile Gly Asn Trp Ile Arg Ser Leu Glu Leu Val Arg Asn Gln Val Arg
2035 2040 2045
Leu Asn Pro Phe Asn Glu Ile Leu Phe Asn Gln Leu Cys Arg Thr Val
2050 2055 2060
Asp Asn His Leu Lys Trp Ser Asn Leu Arg Arg Asn Thr Gly Met Ile
2065 2070 2075 2080
Glu Trp Ile Asn Arg Arg Ile Ser Lys Glu Asp Arg Ser Ile Leu Met
2085 2090 2095
Leu Lys Ser Asp Leu His Glu Glu Asn Ser Trp Arg Asp
2100 2105
<210> 29
<211> 239
<212> PRT
<213> 人工序列
<220>
<223> 具有切割位点和接头的蛋白酶二聚体
<400> 29
Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Val Ser Phe Asn
1 5 10 15
Phe Pro Gln Val Thr Leu Trp Gln Arg Pro Leu Val Thr Ile Lys Ile
20 25 30
Gly Gly Gln Leu Lys Glu Ala Leu Leu Asp Thr Gly Ala Asp Asp Thr
35 40 45
Val Leu Glu Glu Met Ser Leu Pro Gly Arg Trp Lys Pro Lys Met Ile
50 55 60
Gly Gly Ile Gly Gly Phe Ile Lys Val Arg Gln Tyr Asp Gln Ile Leu
65 70 75 80
Ile Glu Ile Cys Gly His Lys Ala Ile Gly Thr Val Leu Val Gly Pro
85 90 95
Thr Pro Val Asn Ile Ile Gly Arg Asn Leu Leu Thr Gln Ile Gly Cys
100 105 110
Thr Leu Asn Phe Ala Gly Ala Ile Gly Gly Ala Pro Gln Val Thr Leu
115 120 125
Trp Gln Arg Pro Leu Val Thr Ile Lys Ile Gly Gly Gln Leu Lys Glu
130 135 140
Ala Leu Leu Asp Thr Gly Ala Asp Asp Thr Val Leu Glu Glu Met Ser
145 150 155 160
Leu Pro Gly Arg Trp Lys Pro Lys Met Ile Gly Gly Ile Gly Gly Phe
165 170 175
Ile Lys Val Arg Gln Tyr Asp Gln Ile Leu Ile Glu Ile Cys Gly His
180 185 190
Lys Ala Ile Gly Thr Val Leu Val Gly Pro Thr Pro Val Asn Ile Ile
195 200 205
Gly Arg Asn Leu Leu Thr Gln Ile Gly Cys Thr Leu Asn Phe Pro Ile
210 215 220
Ser Pro Ile Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly
225 230 235
<210> 30
<211> 41
<212> PRT
<213> 人工序列
<220>
<223> 降解决定子序列
<400> 30
Pro Ile Thr Lys Ile Asp Thr Lys Tyr Ile Met Thr Cys Met Ser Ala
1 5 10 15
Asp Leu Glu Val Val Thr Ser Thr Trp Val Leu Val Gly Gly Val Leu
20 25 30
Ala Ala Leu Ala Ala Tyr Cys Leu Ser
35 40
<210> 31
<211> 24
<212> PRT
<213> 智人
<220>
<223> CD4 跨膜结构域
<400> 31
Met Ala Leu Ile Val Leu Gly Gly Val Ala Gly Leu Leu Leu Phe Ile
1 5 10 15
Gly Leu Gly Ile Phe Phe Cys Val
20
<210> 32
<211> 72
<212> DNA
<213> 智人
<220>
<223> CD4 跨膜结构域
<400> 32
atggccctga ttgtgctggg tggcgtcgcc ggcctcctgc ttttcattgg gctaggcatc 60
ttcttctgtg tc 72
<210> 33
<211> 1620
<212> DNA
<213> 智人
<220>
<223> IL12
<400> 33
atgggctggt cctgcatcat tctgtttctg gtggccacag ccaccggtgt ccactctatg 60
tgggaactcg agaaggacgt gtacgtggtg gaagtggact ggacacctga tgctccaggc 120
gagacagtga acctgacctg tgacacaccc gaagaggacg acatcacctg gacaagcgat 180
cagagacacg gcgtgatcgg cagcggcaag accctgacaa tcaccgtgaa agagtttctg 240
gacgccggcc agtacacctg tcacaaaggc ggagagacac tgtcccacag ccatctgctg 300
ctgcacaaga aagagaacgg catctggtcc accgagatcc tgaagaactt caagaacaag 360
accttcctga agtgcgaggc ccctaactac agcggcagat tcacatgtag ctggctggtg 420
cagagaaaca tggacctgaa gttcaacatc aagtcctcca gcagcagccc cgacagcaga 480
gctgttacat gtggcatggc tagcctgagc gccgagaaag tgacactgga ccagagagac 540
tacgagaagt acagcgtgtc ctgccaagag gacgtgacct gtcctacagc cgaggaaaca 600
ctgcctatcg agctggccct ggaagccaga cagcagaaca aatacgagaa ctactctacc 660
agcttcttca tccgggacat catcaagccc gatcctccaa agaacctgca gatgaagcct 720
ctgaagaaca gccaggtcga ggtgtcctgg gagtaccctg actcttggag cacccctcac 780
agctacttca gcctgaaatt cttcgtgcgc atccagcgca agaaagaaaa gatgaaggaa 840
accgaggaag gctgcaacca gaagggcgcc ttcctggtcg aaaagacctc taccgaggtg 900
cagtgcaaag gcggcaatgt ctgtgtgcag gcccaggata ggtactacaa cagcagctgc 960
agcaagtggg cctgcgtgcc atgtagagtt agaagcggag gcggaggaag tggtggcgga 1020
ggttctggcg gcggtggaag tagagttatc cctgtgtctg gccctgccag atgcctgtct 1080
cagagcagaa acctgctgaa aaccaccgac gacatggtca agaccgccag agagaagctg 1140
aagcactaca gctgcaccgc cgaggacatc gaccacgagg atatcacaag ggaccagacc 1200
agcacactga aaacctgcct gcctctggaa ctgcataaga acgagagctg cctggccaca 1260
agagagacaa gcagcaccac aagaggcagc tgtctgcctc ctcagaaaac cagcctgatg 1320
atgacactgt gcctgggcag catctacgag gatctgaaga tgtaccagac cgagttccag 1380
gccatcaacg ccgctctgca gaaccacaac caccagcaga tcatcctgga taagggcatg 1440
ctggtggcta tcgacgagct gatgcagagc ctgaaccaca atggcgagac actgagacag 1500
aagcctccag tcggagaggc cgatccttac agagtgaaga tgaagctgtg catcctgctg 1560
cacgccttca gcaccagagt ggtcaccatc aacagagtga tgggctacct gagtagtgca 1620
<210> 34
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> 接头 IL12_TM
<400> 34
Ala Pro Ala Glu Thr Lys Ala Glu Pro Met Thr
1 5 10
<210> 35
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 接头 IL12_TM
<400> 35
gcaccagcag aaacaaaagc agaaccaatg aca 33
Claims (17)
1.一种单链RNA病毒,其包括修饰的病毒基因组,所述基因组包括编码病毒转录和/或复制所必需的至少一种蛋白质、蛋白酶和所述蛋白酶的切割位点的多核苷酸序列,其中
(a)所述病毒转录和/或复制所必需的至少一种蛋白质包含在分子内插入位点处的插入物,该插入位点至少包含所述蛋白酶的切割位点,并且任选地还包含所述蛋白酶;或
(b)所述病毒转录和/或复制所必需的至少一种蛋白质被编码为融合蛋白,所述融合蛋白包含融合到N-末端或C-末端、由所述蛋白酶的切割位点分隔的蛋白酶。
2.根据权利要求1所述的单链RNA病毒,其中可以使用蛋白酶抑制剂来抑制所述蛋白酶。
3.根据权利要求1或2所述的单链RNA病毒,其中单链RNA病毒是负义单链RNA病毒,优选地是单股反链病毒目负义单链RNA病毒。
4.根据权利要求3所述的单链RNA病毒,其中病毒转录和/或复制所必需的至少一种蛋白质选自由聚合酶辅因子、聚合酶和核衣壳组成的组,优选地,其中所述病毒转录和/或复制所必需的至少一种蛋白质是
(a)聚合酶辅因子,优选P-蛋白或其功能等同物;
(b)聚合酶,优选L-蛋白;和/或
(c)它们的组合。
5.根据前述权利要求任一项所述的单链RNA病毒,其中蛋白酶是HIV-1蛋白酶,优选是HIV-1蛋白酶的单链二聚体,并且蛋白酶可以被选自由以下组成的组的蛋白酶抑制剂抑制:茚地那韦、沙奎那韦、利托那韦、奈非那韦、洛匹那韦、安普那韦、福沙那韦、阿扎那韦、替拉那韦和达芦那韦。
6.根据前述权利要求任一项所述的单链RNA病毒,其中至少所述蛋白酶的切割位点位于并且任选地所述蛋白酶也位于病毒转录和/或复制所必需的至少一种蛋白质的分子内插入位点内,并且其中
(a)所述蛋白质的蛋白水解切割在分子内插入位点内的所述蛋白酶的切割位点处切割所述病毒转录和/或复制所必需的至少一种蛋白质;
(b)分子内插入位点内的切割使所述病毒转录和/或复制所必需的至少一种蛋白质失活;
(c)所述病毒转录和/或复制所必需的至少一种蛋白质在分子内插入位点内的切割抑制病毒转录和/或复制;
(d)病毒在蛋白酶的特异性抑制剂存在时有活性,而在蛋白酶的特异性抑制剂不存在时则无活性;和/或
(e)病毒还编码至少一种异源蛋白,其中如果病毒在蛋白酶的特异性抑制剂存在的情况下有活性,则异源蛋白表达,而如果病毒在蛋白酶的特异性抑制剂不存在的情况下无活性,则异源蛋白不表达。
7.根据前述权利要求的任一项所述的单链RNA病毒,其中单链RNA病毒是水泡性口炎病毒(VSV),病毒转录和/或复制所必需的至少一种蛋白质是P蛋白和/或L蛋白,并且其中分子内插入位点
(a)在VSV P蛋白的柔性铰链区中,优选对应于VSVi P蛋白的氨基酸位置193-199,更优选氨基酸位置196;
(b)在L蛋白甲基转移酶结构域的环中,其对应于VSViL-蛋白质的氨基酸1614-1634,优选地对应于氨基酸1614-1629,更优选地对应于氨基酸1616-1625,并且更优选地对应于氨基酸1620;或
(c)(a)和(b)的组合。
8.根据权利要求1-5的任一项所述的单链RNA病毒,其中所述病毒转录和/或复制所必需的至少一种蛋白质被编码为融合蛋白,其包含融合到所述病毒转录和/或复制所必需的至少一种蛋白质的N-末端或C-末端、由所述蛋白酶的切割位点分隔的蛋白酶,并且其中
(a)融合蛋白的蛋白水解切割以活性形式释放所述病毒转录和/或复制所必需的至少一种蛋白质;
(b)所述融合蛋白中的所述病毒转录和/或复制所必需的至少一种蛋白质在没有蛋白水解切割的情况下是无活性的,所述融合蛋白包含融合到所述病毒转录和/或复制所必需的至少一种蛋白质的N-末端或C-末端、由所述蛋白酶的切割位点分隔的蛋白酶;
(c)使用蛋白酶的特异性抑制剂抑制所述融合蛋白的蛋白水解切割;
(d)所述病毒在所述蛋白酶的特异性蛋白酶抑制剂存在时是无活性的,而在所述蛋白酶的特异性抑制剂不存在时是有活性的;
(e)所述病毒还编码至少一种异源蛋白,其中如果病毒在蛋白酶的特异性抑制剂存在时是无活性的,则异源蛋白不表达,而如果病毒在蛋白酶的特异性抑制剂不存在时是有活性的,则异源蛋白表达;
(d)所述融合蛋白还包含融合到蛋白酶的另一端的另外的病毒蛋白或异源蛋白,所述蛋白酶融合到病毒转录和/或复制所必需的至少一种蛋白质的N-末端或C-末端,并且其中所述另外的病毒蛋白或异源蛋白和所述蛋白酶也被所述蛋白酶的切割位点分隔;
(e)在任一侧侧接所述蛋白酶的切割位点的蛋白酶替换了将病毒转录和/或复制所必需的至少一种蛋白质与另外的病毒蛋白质或异源蛋白质连接的基因间区域;和/或
(f)在任一侧侧接所述蛋白酶的切割位点的蛋白酶替换了将病毒转录和/或复制所必需的至少一种蛋白质与另外的病毒蛋白质或异源蛋白质连接的基因间区域,其中蛋白酶的丧失导致进一步失活的包括病毒转录和/或复制所必需的蛋白质和另外的病毒蛋白质或异源蛋白质的融合蛋白。
9.根据权利要求1或8所述的单链RNA病毒,其中单链RNA病毒是单股反链病毒目单链RNA病毒,并且所述病毒转录和/或复制所必需的至少一种蛋白质被编码为融合蛋白,其包含融合到所述病毒转录和/或复制所必需的至少一种蛋白质的N-末端或C-末端、由所述蛋白酶的切割位点分隔的蛋白酶,其中
(a)病毒转录和/或复制所必需的至少一种蛋白质是L蛋白;和/或
(b)融合蛋白包含融合到病毒转录和/或复制所必需的至少一种蛋白质的N-末端、由所述蛋白酶的切割位点分隔的蛋白酶。
10.权利要求1或8所述的单链RNA病毒,其中病毒转录和/或复制所必需的至少一种蛋白质被编码为融合蛋白
(a)由与所述病毒转录和/或复制所必需的至少一种蛋白质的N端或C端融合、由所述蛋白酶的切割位点分隔的蛋白酶组成,其中融合蛋白任选地还包含蛋白酶和病毒转录和/或复制所必需的蛋白质之间的接头;或
(b)所述融合蛋白包括与所述病毒转录和/或复制所必需的至少一种蛋白质的N-末端或C-末端融合、由所述蛋白酶的切割位点分隔的蛋白酶,以及与蛋白酶的另一端融合的另一种病毒蛋白质或异源蛋白质,该蛋白酶与病毒转录和/或复制所必需的至少一种蛋白质的N-末端或C-末端融合,并且其中所述另外的病毒蛋白或异源蛋白和所述蛋白酶也被所述蛋白酶的切割位点分隔。
11.一种RNA病毒,其包括所述病毒的修饰基因组,所述基因组包括编码至少一种异源蛋白质、蛋白酶和所述蛋白酶的切割位点的多核苷酸序列,其中所述至少一种异源蛋白质在分子内插入位点包含插入物,该插入位点至少包含所述蛋白酶的切割位点,并且任选地还包含所述蛋白酶,优选地,其中异源蛋白质是治疗性蛋白质、报告分子或肿瘤抗原。
12.根据权利要求1-10的任一项所述的单链RNA病毒或根据权利要求11所述的RNA病毒在治疗中的用途。
13.根据权利要求1-10的任一项所述的单链RNA病毒或根据权利要求11所述的RNA病毒在治疗癌症中的用途。
14.根据权利要求13所述的单链RNA病毒或RNA病毒的用途,其中癌症是实体瘤,优选地选自由以下组成的组:结肠癌、前列腺癌、乳腺癌、肺癌、皮肤癌、肝癌、骨癌、卵巢癌、胰腺癌、脑癌、头颈癌、淋巴瘤(霍奇金和非霍奇金淋巴瘤)、脑癌、神经母细胞瘤、间皮瘤、威尔姆瘤、视网膜母细胞瘤和肉瘤。
15.一种重组VSV L蛋白,其包含在L蛋白的甲基转移酶结构域的环中的插入物,其对应于具有SEQ ID NO:28的氨基酸序列的VSViL-蛋白的氨基酸1614-1634,优选对应于氨基酸1614-1629,更优选对应于氨基酸1616-1625,并且更优选对应于氨基酸1620。
16.一种水疱性口炎病毒(VSV),其包含根据权利要求15所述的重组VSV L-蛋白。
17.一种控制RNA病毒复制的方法,其包括
(a)用根据权利要求6或7所述的RNA病毒转导或转染宿主细胞,和
(b)在存在或不存在对所述蛋白酶特异的蛋白酶抑制剂的情况下维持宿主细胞,
其中所述蛋白酶抑制剂的添加允许病毒转录和/或复制,并且所述蛋白酶抑制剂的不存在抑制病毒转录和复制;或
(a)用根据权利要求8-10的任一项所述的RNA病毒转导或转染宿主细胞,和
(b)在存在或不存在对所述蛋白酶特异的蛋白酶抑制剂的情况下维持宿主细胞,
其中所述蛋白酶抑制剂的添加抑制病毒转录和/或复制,并且所述蛋白酶抑制剂的不存在允许病毒转录和复制;或
(a)用根据权利要求119所述的RNA病毒转导或转染宿主细胞,其中蛋白酶位于至少一种异源蛋白质的分子内插入位点内;和
(b)在存在或不存在对所述蛋白酶特异的蛋白酶抑制剂的情况下维持宿主细胞,
其中所述蛋白酶抑制剂的添加允许异源蛋白质表达,而所述蛋白酶抑制剂的不存在抑制异源蛋白质表达。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP19181717 | 2019-06-21 | ||
EP19181717.0 | 2019-06-21 | ||
PCT/EP2020/067218 WO2020254644A1 (en) | 2019-06-21 | 2020-06-19 | Novel mechanism to control rna virus replication and gene expression |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114008195A true CN114008195A (zh) | 2022-02-01 |
Family
ID=67180504
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080044249.6A Pending CN114008195A (zh) | 2019-06-21 | 2020-06-19 | 控制rna病毒复制和基因表达的新机制 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220228172A1 (zh) |
EP (1) | EP3987041A1 (zh) |
JP (1) | JP2022537268A (zh) |
CN (1) | CN114008195A (zh) |
WO (1) | WO2020254644A1 (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2377725A1 (en) * | 2001-04-06 | 2002-10-06 | John C. Bell | Conditionally replicative and conditionally active viruses |
CN109312366A (zh) * | 2016-05-19 | 2019-02-05 | 慕尼黑工业大学附属伊萨右岸医院 | 用于肿瘤溶瘤治疗的vsv/ndv杂合病毒 |
WO2019094801A1 (en) * | 2017-11-10 | 2019-05-16 | Research Institute At Nationwide Children's Hospital | Recombinant vectors encoding zika virus protein subunits |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK1078051T3 (da) * | 1998-05-13 | 2008-04-07 | Domantis Ltd | Fagvisningsselektionssystem til selektion af korrekt foldede proteiner |
DE102008050860A1 (de) | 2008-10-08 | 2010-04-15 | Dorothee Von Laer | LCMV-GP-VSV-Pseudotypvektoren und tumorinfiltrierende Virenproduzentenzellen zur Therapie von Tumoren |
-
2020
- 2020-06-19 EP EP20732987.1A patent/EP3987041A1/en active Pending
- 2020-06-19 WO PCT/EP2020/067218 patent/WO2020254644A1/en active Application Filing
- 2020-06-19 US US17/620,386 patent/US20220228172A1/en active Pending
- 2020-06-19 CN CN202080044249.6A patent/CN114008195A/zh active Pending
- 2020-06-19 JP JP2021573198A patent/JP2022537268A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2377725A1 (en) * | 2001-04-06 | 2002-10-06 | John C. Bell | Conditionally replicative and conditionally active viruses |
CN109312366A (zh) * | 2016-05-19 | 2019-02-05 | 慕尼黑工业大学附属伊萨右岸医院 | 用于肿瘤溶瘤治疗的vsv/ndv杂合病毒 |
WO2019094801A1 (en) * | 2017-11-10 | 2019-05-16 | Research Institute At Nationwide Children's Hospital | Recombinant vectors encoding zika virus protein subunits |
Non-Patent Citations (1)
Title |
---|
HOKYUNG K CHUNG: "Tunable and reversible drug control of protein production via a self-excising degron", NAT CHEM BIOL, vol. 11, no. 9, pages 713 - 720, XP055408268, DOI: 10.1038/nchembio.1869 * |
Also Published As
Publication number | Publication date |
---|---|
EP3987041A1 (en) | 2022-04-27 |
JP2022537268A (ja) | 2022-08-25 |
US20220228172A1 (en) | 2022-07-21 |
WO2020254644A1 (en) | 2020-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101262773B1 (ko) | 자율복제능을 갖는 개변된 인간 c형간염 바이러스 게놈rna | |
JP5035985B2 (ja) | 新規組換え型ヒトc型肝炎ウイルス様粒子とその産生方法 | |
CN112680477B (zh) | 一种基于无缝克隆技术的h9n2亚型禽流感病毒的拯救方法 | |
AU2021374174A1 (en) | Production of virus vector plasmid in bacillus subtilis | |
EP1556493B1 (en) | Novel full-length genomic rna of japanese encephalitis virus, infectious jev cdna therefrom, and use thereof | |
CN112501138A (zh) | 用于快速制备感染性rna病毒的方法 | |
CN102361977B (zh) | 衍生自丙型肝炎病毒的核酸以及通过使用该核酸各自制备的表达载体、转化细胞和丙型肝炎病毒颗粒 | |
CN114008195A (zh) | 控制rna病毒复制和基因表达的新机制 | |
JP2011500049A (ja) | ウイルス修飾 | |
KR102009266B1 (ko) | 구제역 sat2형 zim의 방어항원이 발현되는 재조합 바이러스 | |
Konduru et al. | Hepatitis A virus (HAV) packaging size limit | |
KR102009267B1 (ko) | 구제역 sat 3형 zim의 방어항원이 발현되는 재조합 바이러스 | |
WO2024088585A1 (en) | Method for generation of tumor-adapted oncolytic viruses | |
EP2485745B1 (en) | A composition for creating conditional lethality of virus mutants and for eliminating the viability of an eukaryotic cell |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |