CN116171326A - 用于基因病症的核酸疗法 - Google Patents

用于基因病症的核酸疗法 Download PDF

Info

Publication number
CN116171326A
CN116171326A CN202180062136.3A CN202180062136A CN116171326A CN 116171326 A CN116171326 A CN 116171326A CN 202180062136 A CN202180062136 A CN 202180062136A CN 116171326 A CN116171326 A CN 116171326A
Authority
CN
China
Prior art keywords
virus
composition
nucleic acid
protein
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180062136.3A
Other languages
English (en)
Inventor
C·马特兰加
K·A·豪夫
A·J·扎鲁尔
J·R·阿布希尔
K·J·威廉姆斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Greenlight Biosciences Inc
Original Assignee
Greenlight Biosciences Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Greenlight Biosciences Inc filed Critical Greenlight Biosciences Inc
Publication of CN116171326A publication Critical patent/CN116171326A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • A61K31/7115Nucleic acids or oligonucleotides having modified bases, i.e. other than adenine, guanine, cytosine, uracil or thymine
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/0012Galenical forms characterised by the site of application
    • A61K9/0019Injectable compositions; Intramuscular, intravenous, arterial, subcutaneous administration; Compositions to be administered through the skin in an invasive manner
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/48Preparations in capsules, e.g. of gelatin, of chocolate
    • A61K9/50Microcapsules having a gas, liquid or semi-solid filling; Solid microparticles or pellets surrounded by a distinct coating layer, e.g. coated microspheres, coated drug crystals
    • A61K9/51Nanocapsules; Nanoparticles
    • A61K9/5107Excipients; Inactive ingredients
    • A61K9/5123Organic compounds, e.g. fats, sugars
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0066Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16041Use of virus, viral particle or viral elements as a vector
    • C12N2740/16043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16211Human Immunodeficiency Virus, HIV concerning HIV gagpol
    • C12N2740/16222New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/24Vectors characterised by the absence of particular element, e.g. selectable marker, viral origin of replication
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/60Vectors containing traps for, e.g. exons, promoters
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/70Vectors containing special elements for cloning, e.g. topoisomerase, adaptor sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/20Vector systems having a special element relevant for transcription transcription of more than one cistron
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/20Vectors comprising a special translation-regulating system translation of more than one cistron
    • C12N2840/203Vectors comprising a special translation-regulating system translation of more than one cistron having an IRES

Abstract

本文提供基于逆转录病毒(例如,慢病毒)的组合物,其包含一个或多个编码逆转录病毒Pol多聚蛋白组分的核酸分子和包含一个或多个侧接长末端重复序列的转基因序列的核酸分子,用于一个或多个转基因到靶细胞的离体或体内递送。组合物可用于递送至靶细胞(例如,造血干细胞(HSC)、肝细胞、视觉细胞、肌肉细胞、上皮细胞、T细胞等)和/或稳定表达任何转基因(例如,β‑球蛋白、因子VIII、RP GTP酶调节剂(RPGR)、肌营养不良蛋白、囊性纤维化跨膜电导调节剂(CFTR)、嵌合抗原受体等),具有治疗和/或改善与基因表达相关的任何病症(例如,镰状细胞病、β‑地中海贫血、血友病B、视网膜色素变性、杜氏肌营养不良症、囊性纤维化、癌症等)相关的症状的生物学效应。

Description

用于基因病症的核酸疗法
发明背景
当前基因治疗方法的实例包括但不限于基于CRISPR的系统,例如CRISPR/Cas9、逆转录病毒、慢病毒、疱疹病毒、腺病毒和腺相关病毒(AAV),如图2所示。虽然这些不同的方法有很多优点,但也存在显著局限性。例如,逆转录病毒和一些基于CRISPR的系统通常需要细胞分裂和同源重组才能成功,因此在非分裂细胞中不起作用。在AAV中,存在转基因大小限制,实际上限制了它们的容量和实用性。腺病毒的其他局限性包括,例如,由于有限的功效而与高剂量相关的毒性以及由于对病毒的免疫应答而导致的重复给药的有效性降低。此外,治疗剂量的病毒的产生可能非常昂贵。
如图2所示,慢病毒先前已被用作基因治疗项目的模型。慢病毒是ssRNA基因组病毒(例如,HIV),其感染广泛的宿主并整合到基因组中,有时以潜伏的DNA形式存在。在当前的基因治疗项目中,慢病毒颗粒是使用更安全的分开的构建体设计生产的。例如,第三代设计涉及使用四种质粒的基因治疗:携带感兴趣基因并整合到基因组中的转移质粒,提供颗粒形成、逆转录和整合功能的包装质粒,提供广泛的宿主范围的包膜质粒,以及提供mRNA核输出的质粒。慢病毒方法的普遍局限性是病毒的产生需要在细胞中扩增,这既缓慢又昂贵;并且病毒颗粒的处理效率低下。
因此,仍然需要超越当前可用系统的改进的基因递送系统。
发明概述
本文公开了用于体内基因治疗的核酸组合物。组合物包括最小设计,所述最小设计提供转基因编码核酸分子、表达逆转录酶和/或整合酶的核酸分子,并且能够含有支持所述转基因的逆转录和整合的辅助核酸分子,并且能够含有递送系统。组合物不需要表达由逆转录病毒rev和env基因编码的蛋白质的核酸序列。然而,组合物能够含有表达由逆转录病毒rev基因、逆转录病毒env基因或两者编码的一个或多个蛋白质的核酸序列。本发明还提供核酸分子、使用方法、治疗方法、核酸模板、细胞和试剂盒。本发明还提供修饰以增加核酸的稳定性和/或功能(functioning)、和/或编码的蛋白质的稳定性和/或功能。这些修饰能够包括一个或多个内在不稳定性(INS)元件的突变;具有N端甲硫氨酸-甘氨酸二肽的功能单元,例如整合酶;功能单元(例如整合酶)与归巢蛋白的融合;用于在宿主细胞中表达的密码子优化的使用;和/或引发寡核苷酸的使用。其他修饰如本文所公开。
本发明的一些方面包括侧接5’和3’非翻译区(UTR)的编码一个或多个Pol多聚蛋白组分的一个或多个核酸分子,以及包含位于5’长末端重复序列(LTR)和3’LTR之间的一个或多个逆转录酶引发元件和可操作地连接至一个或多个转基因的一个或多个启动子序列的核酸分子。本发明的一些方面包括侧接5’和3’非翻译区(UTR)的编码Pol多聚蛋白的一个或多个蛋白质组分的一个或多个核酸分子,以及包含位于5’长末端重复序列(LTR)和3’LTR之间的一个或多个逆转录酶引发元件和可操作地连接至一个或多个转基因的一个或多个启动子序列的核酸分子,但不包括表达由逆转录病毒rev基因和和逆转录病毒env基因的至少一个编码的蛋白质的核酸序列。本发明的一些方面包括侧接5’和3’非翻译区(UTR)的编码一个或多个Pol多聚蛋白组分的一个或多个核酸分子,以及包含位于5’长末端重复序列(LTR)和3’LTR之间的一个或多个逆转录酶引发元件和可操作地连接至一个或多个转基因的一个或多个启动子序列的核酸分子,但不包括表达由逆转录病毒rev和env基因两者编码的蛋白质的核酸序列。本发明的一些方面包括侧接5’和3’非翻译区(UTR)的编码一个或多个Pol多聚蛋白组分的一个或多个核酸分子,以及包含位于5’长末端重复序列(LTR)和3’LTR之间的一个或多个逆转录酶引发元件和可操作地连接至一个或多个转基因的一个或多个启动子序列的核酸分子,并且能够在没有功能性逆转录病毒Rev和/或Env蛋白的情况下将一个或多个转基因整合到宿主基因组中。Pol多聚蛋白组分的表达不一定需要行内(inline)gag基因的翻译滑动(translational slippage)。编码Pol多聚蛋白组分的一个或多个核酸分子可以是包含5’UTR、编码Pol多聚蛋白的核酸序列以及3’UTR的核酸分子。替代性地,编码Pol多聚蛋白组分的一个或多个核酸分子可以是包含5’UTR、编码至少Pol多聚蛋白组分逆转录酶和整合酶的核酸序列以及3’UTR的核酸分子。Pol多聚蛋白组分逆转录酶和整合酶可以在多顺反子构建体上表达。在一些实施方案中,多顺反子构建体是双顺反子。在一些实施方案中,多顺反子构建体是三顺反子。Pol多聚蛋白组分逆转录酶和整合酶可以与一个或多个多顺反子元件一起表达。多顺反子元件可以是插入的内部核糖体进入位点(IRES)、a2A肽编码序列或其他多顺反子元件。编码Pol多聚蛋白组分的一个或多个核酸分子可以是两个核酸分子,其中一个包含5’UTR、至少编码Pol多聚蛋白组分逆转录酶的核酸序列以及3’UTR,并且另一个包含5’UTR、至少编码Pol多聚蛋白组分整合酶的核酸序列以及3’UTR。图3-5C示出了本发明某些方面的示例性实施方案。
本发明的一些方面提供了包装在非病毒递送系统中的组合物,其中该组合物包含第一RNA分子和第二RNA分子,第一RNA分子包括5’非翻译区(UTR)、编码逆转录病毒Pol多聚蛋白的核酸序列以及3’UTR;第二RNA分子包含位于5’长末端重复序列(LTR)和3’LTR之间的一个或多个逆转录酶引发元件和可操作地连接至一个或多个转基因的一个或多个启动子序列。本发明的一些方面提供了包装在非病毒递送系统中的组合物,其中该组合物包含第一RNA分子和第二RNA分子,第一RNA分子包括5’非翻译区(UTR)、编码逆转录病毒Pol多聚蛋白的核酸序列以及3’UTR;第二RNA分子包含位于5’长末端重复序列(LTR)和3’LTR之间的一个或多个逆转录酶引发元件和可操作地连接至一个或多个转基因的一个或多个启动子序列,但不包括表达由逆转录病毒rev基因和逆转录病毒env基因中的至少一个编码的蛋白质的核酸序列。本发明的一些方面提供了包装在非病毒递送系统中的组合物,其中该组合物包含第一RNA分子和第二RNA分子,第一RNA分子包括5’非翻译区(UTR)、编码逆转录病毒Pol多聚蛋白的核酸序列以及3’UTR;第二RNA分子包含位于5’长末端重复序列(LTR)和3’LTR之间的一个或多个逆转录酶引发元件和可操作地连接至一个或多个转基因的一个或多个启动子序列,但该组合物不包括表达由逆转录病毒rev和env基因两者编码的蛋白质的核酸序列。本发明的一些方面提供了包装在非病毒递送系统中的组合物,其中该组合物包含第一RNA分子和第二RNA分子,第一RNA分子包括5’非翻译区(UTR)、编码逆转录病毒Pol多聚蛋白的核酸序列以及3’UTR;第二RNA分子包含位于5’长末端重复序列(LTR)和3’LTR之间的一个或多个逆转录酶引发元件和可操作地连接至一个或多个转基因的一个或多个启动子序列,并且能够在没有功能性逆转录病毒Rev和/或Env蛋白的情况下将一个或多个转基因整合到宿主基因组中。
在一些方面,编码Pol多聚蛋白组分的一个或多个核酸分子包含编码一个或多个功能单元的核酸序列。在一些方面,编码Pol多聚蛋白组分的一个或多个核酸分子还可以包含编码一个或多个辅助蛋白的核酸序列。一个或多个辅助蛋白可以选自核衣壳(NC)、衣壳蛋白(CA)、基质蛋白(MA)、p6、病毒感染因子(Vif)、转录反式激活因子(Tat)、负调节因子(Nef)、病毒蛋白R(Vpr)和病毒蛋白u(Vpu)。在一些方面,辅助蛋白可以含有一个或多个突变。在一些方面,CA是突变CA。在一些方面,突变CA具有N74D和/或E45A突变,其编号对应于野生型HIV-1衣壳蛋白。在一些方面,野生型HIV-1毒株可以是NL4-3。在一些方面,编码Pol多聚蛋白组分的一个或多个核酸分子还可以包含编码一个或多个Gag多聚蛋白辅助蛋白(即,作为Gag多聚蛋白组分的辅助蛋白)的核酸序列。一个或多个辅助蛋白可以在与Pol多聚蛋白组分相同的核酸分子上编码。一个或多个辅助蛋白也可以与一个或多个多顺反子元件一起表达。多顺反子元件可以是插入的IRES、2A肽编码序列或其他多顺反子元件。替代性地,一个或多个辅助蛋白可以由一个或多个不同于编码Pol多聚蛋白组分的核酸分子的核酸分子编码,其中每个核酸分子包含5’UTR和3’UTR。在一些实施方案中,Gag多聚蛋白辅助蛋白可以选自NC、CA、MA和p6。在一些实施方案中,Gag多聚蛋白辅助蛋白可以由Gag多聚蛋白编码。在其他实施方案中,编码Pol多聚蛋白组分的一个或多个核酸分子不编码Gag多聚蛋白。在一些实施方案中,辅助蛋白MA不由所述核酸分子中的任一个编码。在一些实施方案中,编码Pol多聚蛋白组分的一个或多个核酸分子包含gag-pol基因。在一些实施方案中,gag-pol基因包含移码突变。在一些实施方案中,移码突变是单核苷酸插入或缺失。
本发明的一些方面提供了编码Pol多聚蛋白组分和/或辅助蛋白的一个或多个核酸分子,所述核酸分子被修饰以增加核酸分子的稳定性,和/或增加编码的蛋白质的稳定性。在一些实施方案中,编码Pol多聚蛋白组分和/或辅助蛋白的一个或多个核酸分子是RNA分子(例如,mRNA分子)并且可以任选地包含一个或多个修饰以增加RNA分子(例如,mRNA分子)的稳定性。在一些实施方案中,编码Pol多聚蛋白组分和/或辅助蛋白的一个或多个核酸分子是DNA分子并且可以任选地包含一个或多个修饰以增加DNA分子和/或相应的mRNA分子的稳定性。在一些实施方案中,编码一个或多个Pol多聚蛋白组分和/或辅助蛋白的核酸分子在一个或多个内在不稳定性(INS)元件中包含一个或多个突变。一个或多个INS元件可以选自TAGAT、ATAGA、AAAAG、ATAAA、TTATA等。在一些实施方案中,INS元件中的密码子突变为相同氨基酸的替代密码子,使得功能性蛋白质序列被保留(即,沉默突变),同时INS元件被改变或去除。在一些实施方案中,编码一个或多个Pol多聚蛋白组分的一个或多个核酸分子编码包含N端甲硫氨酸-甘氨酸二肽的整合酶多肽。在一些实施方案中,编码一个或多个Pol多聚蛋白组分的核酸分子在5’末端编码甲硫氨酸-甘氨酸二肽,并且在一些实施方案中,编码一个或多个Pol多聚蛋白组分的核酸分子在内部编码甲硫氨酸-甘氨酸二肽。
本发明的一些方面提供了与归巢蛋白融合的一个或多个Pol多聚蛋白组分(例如,整合酶),归巢蛋白可以将组分例如整合酶引导至宿主细胞中的特定序列。在一些实施方案中,归巢蛋白识别回文序列,在一些实施方案中,归巢蛋白识别限制性位点。在一些实施方案中,归巢蛋白是限制酶。在一些实施方案中,限制酶是I-PpoI。在一些实施方案中,归巢蛋白是核酸酶失活的限制酶。在一些实施方案中,归巢蛋白是I-PpoI N119A。
本发明的一些方面提供在宿主细胞中增加的翻译,例如,通过提供为了在宿主细胞中表达而对组合物的一个或多个核酸分子进行密码子优化。在一些方面,宿主细胞是哺乳动物细胞。在一些方面,宿主细胞是人细胞。在一些方面,宿主细胞是鸟类细胞。
本发明的一些方面提供进一步包含引发寡核苷酸的组合物。在一些实施方案中,引发寡核苷酸是GUCCCUGUUCGGGCGCCA(SEQ ID NO:18)或GTCCCTGTTCGGGCGCCA(SEQ ID NO:19)。在一些实施方案中,引发寡核苷酸可以是与逆转录酶引发元件互补的工程化序列。
本发明的一些方面提供了核酸分子是RNA分子或DNA分子。例如,核酸分子可以是ssDNA分子、dsDNA分子、ssRNA分子或dsRNA分子。
本发明的一些方面提供了包含一个或多个转基因的核酸分子能够包含两个或更多个转基因,其中转基因由一个或多个多顺反子元件分隔。多顺反子元件可以是一个或多个IRES和/或一个或多个编码2A肽的序列和/或其他多顺反子元件。该核酸分子可以包含一个或多个增强子。例如,一个或多个增强子可以包括土拨鼠肝炎病毒转录后调控元件(WPRE)。
本发明的一些方面提供了核酸分子是RNA分子并且包含选自修饰的核糖核苷、5’-7mG帽结构和聚(rA)尾的一个或多个修饰。在一些实施方案中,修饰的核糖核苷是假尿苷或假尿苷的衍生物(例如,N1-甲基假尿苷)。在一些实施方案中,修饰的核糖核苷是N6-甲基腺苷。在其他实施方案中,包含一个或多个转基因的核酸分子可以是RNA分子并且还包含选自5’-7mG帽结构和聚(rA)尾的一个或多个修饰。
本发明的一些方面包括Pol多聚蛋白组分、辅助蛋白和/或LTR基于来自以下的Pol多聚蛋白组分、辅助蛋白和/或LTR:人免疫缺陷病毒(HIV)、猿猴免疫缺陷病毒(SIV)、visna/maedi病毒(VMV)、山羊关节炎脑炎病毒(CAEV)、马传染性贫血病毒(EIAV)、猫免疫缺陷病毒(FIV)、牛免疫缺陷病毒(BIV)、人泡沫病毒(HFV)、鼠白血病病毒(MLV)、莫洛尼鼠白血病病毒(MoLV)、弗里德病毒(FV)、艾贝尔森鼠白血病病毒(A-MLV)、鼠干细胞病毒(MSCV)、鼠乳腺肿瘤病毒(MMTV)、莫洛尼鼠肉瘤病毒(MoMSV)、劳氏肉瘤病毒(RSV)、藤浪肉瘤病毒(FuSV)、FBR鼠骨肉瘤病毒(FBR MSV)、禽骨髓细胞瘤病毒29(MC29)、禽成红细胞增多症病毒(AEV)、人T细胞白血病病毒(HTLV)、Friend MLV(FrMLV)、禽肉瘤病毒(ASV)、禽白血病病毒、禽成髓细胞瘤病毒、UR2肉瘤病毒、Y73肉瘤病毒、Jaagsiekte绵羊逆转录病毒、叶猴病毒、Mason-pfizer猴病毒、松鼠猴逆转录病毒、禽癌米尔希尔病毒2、牛白血病病毒、灵长类T淋巴细胞病毒1、灵长类T淋巴细胞病毒2、灵长类嗜T淋巴细胞病毒3、大眼鲥鱼真皮肉瘤病毒、大眼鲥鱼表皮增生病毒1、大眼鲥鱼表皮增生病毒2、小鸡合胞病毒、猫白血病病毒、Finkel-Biskis-Jinkins鼠肉瘤病毒、Gardner-Arnstein猫肉瘤病毒、长臂猿白血病病毒、豚鼠C型肿瘤病毒、Hardy-Zuckerman猫肉瘤病毒、Harvey鼠肉瘤病毒、Kirsten鼠肉瘤病毒、考拉逆转录病毒、莫洛尼鼠肉瘤病毒、猪C型肿瘤病毒、网状内皮增生病毒、Snyder-Theilen猫肉瘤病毒、Trager鸭脾坏死病毒、毒蛇逆转录病毒、毛猴肉瘤病毒、Jembrana病病毒、美洲狮慢病毒、牛泡沫病毒、马泡沫病毒、猫泡沫病毒、棕色大丛猴原猿泡沫病毒、婆罗洲猩猩猿猴泡沫病毒、中央黑猩猩猿猴泡沫病毒、食蟹猴猿猴泡沫病毒、东方黑猩猩猿猴泡沫病毒、绿猴猿猴泡沫病毒、长尾猴猿猴泡沫病毒、日本猕猴猿猴泡沫病毒、恒河猴猿猴泡沫病毒、蜘蛛猴猿猴泡沫病毒、松鼠猴猿猴泡沫病毒、台湾猕猴猿猴泡沫病毒、西方黑猩猩猿猴泡沫病毒、西部低地大猩猩猿猴泡沫病毒、白绒耳狨猴猿猴泡沫病毒、黄胸卷尾猴猿猴泡沫病毒,或其任何组合。本发明的其他方面提供了核酸分子包装在非病毒递送系统中。例如,它们可以包装在脂质纳米颗粒中。
本发明的方面提供了一个或多个启动子包含一个或多个组织特异性或细胞特异性启动子。例如,启动子可以对骨髓、造血干细胞(HSC)、上皮细胞、肝细胞、视觉细胞、肌肉细胞或T细胞具有特异性。一个或多个启动子可以包括hCMV启动子。
本发明的一些方面提供了一个或多个转基因编码一个或多个治疗性蛋白质、诊断性蛋白质或报告蛋白或其片段。例如,一个或多个转基因可以编码一个或多个治疗性蛋白质、诊断性蛋白质或报告蛋白或其片段。治疗性蛋白质可以是β珠蛋白、囊性纤维化跨膜电导调节剂(CFTR)、因子VIII、肌营养不良蛋白或RP GTP酶调节剂(RPGR)。报告蛋白可以是荧光蛋白或萤光素酶。
本发明的其他方面提供了非病毒递送系统靶向特定组织或细胞类型。特定组织或细胞类型可以是骨髓、HSC、上皮细胞、肝细胞、视觉细胞、肌肉细胞或T细胞。非病毒递送系统是脂质纳米颗粒、脂质体、多肽纳米颗粒、二氧化硅纳米颗粒、金纳米颗粒、聚合物纳米颗粒、树枝状聚合物、阳离子纳米乳剂、无机载剂(例如CaP)、聚合物和脂质混合载剂。
还提供了在有此需要的受试者中表达基因的方法,其中该方法包括向受试者施用有效量的上述核酸或其组合物(例如,脂质纳米颗粒),导致一个或多个转基因在受试者中的表达。该方法通过将核酸递送到细胞中导致基因在细胞中表达。该方法可以包括通过将核酸或其组合物(例如,脂质纳米颗粒)递送至受试者来使用它们,从而在受试者中表达一个或多个转基因。
本发明的方面提供了通过将核酸或其组合物(例如,脂质纳米颗粒)递送至受试者从而在受试者中表达一个或多个转基因来治疗有此需要的受试者的疾病或病症的方法。待治疗的疾病或病症可以是基因疾病或病症。疾病或病症可以是遗传性基因疾病或病症。疾病或病症可以是镰状细胞病、β-地中海贫血、血友病B、视网膜色素变性、杜氏肌营养不良症、囊性纤维化或癌症。
本发明的一些方面提供了一个或多个转基因被整合到靶细胞的基因组中。例如,一个或多个转基因可以稳定表达持续至少一周、至少两周、至少一个月、至少6个月、至少一年或持续受试者的一生。
本发明的一些方面提供了通过向受试者施用有效量的核酸或其组合物(例如,脂质纳米颗粒)从而在受试者中表达一个或多个转基因在有此需要的受试者中引发免疫应答的方法。例如,受试者可以患有癌症,并且一个或多个转基因编码肿瘤抗原。或者,受试者可以患有感染性疾病或有感染感染性疾病的风险,并且一个或多个转基因编码与感染性疾病相关的抗原。实施方案包括核酸的局部或全身递送。
本发明的方面还提供了一个或多个核酸模板,其包含5’UTR、编码一个或多个逆转录病毒Pol多聚蛋白组分的核酸序列以及3’UTR,其中Pol多聚蛋白组分的表达不需要从行内(inline)gag基因的翻译滑动。本发明的其他方面提供一个或多个核酸模板,其包含5’UTR、包含移码突变的编码gag-pol基因的核酸序列以及3’UTR。本发明的其他方面提供了一个或多个核酸模板,其包含5’UTR、编码gag-pol基因的核酸序列以及3’UTR,其中gag-pol基因不编码基质蛋白。核酸模板还可以包括编码一个或多个辅助蛋白的核酸序列,辅助蛋白选自MA、p6、NC、CA、Vif、Tat、Nef、Vpr和Vpu。在一些实施方案中,模板的Pol多聚蛋白组分和/或辅助蛋白基于来自以下的多聚蛋白和辅助蛋白:人免疫缺陷病毒(HIV)、猿猴免疫缺陷病毒(SIV)、visna/maedi病毒(VMV)、山羊关节炎脑炎病毒(CAEV)、马传染性贫血病毒(EIAV)、猫免疫缺陷病毒(FIV)、牛免疫缺陷病毒(BIV)、人泡沫病毒(HFV)、鼠白血病病毒(MLV)、莫洛尼鼠白血病病毒(MoLV)、弗里德病毒(FV)、艾贝尔森鼠白血病病毒(A-MLV)、鼠干细胞病毒(MSCV)、鼠乳腺肿瘤病毒(MMTV)、莫洛尼鼠肉瘤病毒(MoMSV)、劳氏肉瘤病毒(RSV)、藤浪肉瘤病毒(FuSV)、FBR鼠骨肉瘤病毒(FBR MSV)、禽骨髓细胞瘤病毒29(MC29)、禽成红细胞增多症病毒(AEV)、人T细胞白血病病毒(HTLV)、Friend MLV(FrMLV)、禽肉瘤病毒(ASV)、禽白血病病毒、禽成髓细胞瘤病毒、UR2肉瘤病毒、Y73肉瘤病毒、Jaagsiekte绵羊逆转录病毒、叶猴病毒、Mason-pfizer猴病毒、松鼠猴逆转录病毒、禽癌米尔希尔病毒2、牛白血病病毒、灵长类T淋巴细胞病毒1、灵长类T淋巴细胞病毒2、灵长类嗜T淋巴细胞病毒3、大眼鲥鱼真皮肉瘤病毒、大眼鲥鱼表皮增生病毒1、大眼鲥鱼表皮增生病毒2、小鸡合胞病毒、猫白血病病毒、Finkel-Biskis-Jinkins鼠肉瘤病毒、Gardner-Arnstein猫肉瘤病毒、长臂猿白血病病毒、豚鼠C型肿瘤病毒、Hardy-Zuckerman猫肉瘤病毒、Harvey鼠肉瘤病毒、Kirsten鼠肉瘤病毒、考拉逆转录病毒、莫洛尼鼠肉瘤病毒、猪C型肿瘤病毒、网状内皮增生病毒、Snyder-Theilen猫肉瘤病毒、Trager鸭脾坏死病毒、毒蛇逆转录病毒、毛猴肉瘤病毒、Jembrana病病毒、美洲狮慢病毒、牛泡沫病毒、马泡沫病毒、猫泡沫病毒、棕色大丛猴原猿泡沫病毒、婆罗洲猩猩猿猴泡沫病毒、中央黑猩猩猿猴泡沫病毒、食蟹猴猿猴泡沫病毒、东方黑猩猩猿猴泡沫病毒、绿猴猿猴泡沫病毒、长尾猴猿猴泡沫病毒、日本猕猴猿猴泡沫病毒、恒河猴猿猴泡沫病毒、蜘蛛猴猿猴泡沫病毒、松鼠猴猿猴泡沫病毒、台湾猕猴猿猴泡沫病毒、西方黑猩猩猿猴泡沫病毒、西部低地大猩猩猿猴泡沫病毒、白绒耳狨猴猿猴泡沫病毒、黄胸卷尾猴猿猴泡沫病毒,或其任何组合。还提供了产生核酸例如RNA的方法,其中该方法包括核酸模板的体外转录。
本发明的其他方面提供了包含上述核酸或核酸模板的试剂盒。核酸或核酸模板可以在一个或多个容器中提供。
本发明的其他优点、特征和用途将从某些示例性、非限制性实施方案;附图;非限制性工作实施例;和权利要求的详细描述中显而易见。
附图说明
图1是概述基于mRNA的基因治疗平台的方法的示意图。
图2是描述了当前基因治疗方法的示例以及与每种方法相关的主要优势和挑战的表格。
图3是概述转基因编码转移核酸设计的示例性实施方案的示意图。RNA产生元件包括RNA聚合酶启动子(例如,T7 RNA聚合酶启动子)和用于模板线性化的限制性消化位点。
图4是说明与规范设计相比的逆转录和整合复合物设计的示例性实施方案的示意图。与来自规范设计的行内gag/pol设计相比,Pol多聚蛋白由单独的构建体产生,因此不再需要翻译滑动。在一些实施方案中,一个或多个辅助逆转录病毒蛋白与Pol多聚蛋白一起顺式编码。RNA产生元件包括RNA聚合酶启动子(例如,T7 RNA聚合酶启动子)和任选地,一个或多个用于模板线性化的限制性消化位点。
图5A-5C说明了逆转录和整合机制设计的示例性实施方案,其中Pol多聚蛋白组分在一个或多个核酸分子上被编码为单独的蛋白质。RNA产生元件包括RNA聚合酶启动子(例如,T7 RNA聚合酶启动子)和任选地,一个或多个用于模板线性化的限制性消化位点。图5A是说明示例性实施方案的示意图,其中蛋白酶(PR)、逆转录酶/RNase H(RT)和整合酶(IN)每个都在单一核酸构建体上编码,并且其中每个组分通过PR自加工分隔。图5B是说明示例性实施方案的示意图,其中单个单元RT和IN位于双顺反子构建体上。图5C是说明示例性实施方案的示意图,其中单个单元RT和IN位于单独的构建体上。
图6是描绘基于mRNA的基因治疗方法的另一示意图。逆转录和整合所需的病毒机制(例如,病毒酶和/或一个或多个辅助蛋白)和转基因在单独的RNA上提供。任选地使用表面标记的非病毒递送系统用于将RNA递送至靶细胞。转基因编码RNA也称为慢病毒“基因组”RNA。转基因的表达依赖于病毒酶的翻译,慢病毒“基因组”RNA转化为DNA,以及DNA整合到靶细胞的基因组DNA中,从而导致转基因的持久表达。
图7A和7B显示RNA衍生的功能单元驱动来自转基因编码RNA的报告基因表达。图7A显示了功能单元Gag多聚蛋白RNA和Pol多聚蛋白RNA(功能单元mRNA)和转基因编码RNA(“基因组”RNA)的示意图。图7B显示了用功能单元RNA转染时报告转基因的表达。
图8A-8D显示优化的功能单元RNA表现出增强的表达并定位于靶细胞器。图8A是描绘编码WT整合酶(IN);稳定化Met-Gly,人密码子优化的(hCO)IN;和稳定化Met-Gly hCOΔINS IN的RNA构建体的示意图。图8B显示了聚腺苷酸化前后Met-Gly、hCOΔINS IN mRNA的毛细管电泳图。图8C显示WT IN mRNA、Met-Gly hCO IN mRNA;和Met-Gly hCOΔINS INmRNA表达的Western印迹分析。图8D显示了共聚焦显微镜图像,其显示了RNA转染到293FT细胞后优化的整合酶的亚细胞定位。
图9说明了示例性实施方案,其中逆转录酶被编码为单个p51和p66亚基。
图10说明了示例性实施方案,其中整合酶与归巢蛋白融合以用于定点基因组整合。当作为Pol多聚蛋白的一部分表达或作为单个单元表达时,整合酶可以与归巢蛋白融合。
发明详述
根据本公开的一些方面,最小设计的核酸组合物对于体内基因治疗是有效的。这种最小设计可以克服慢病毒方法的一些局限性,包括需要通过在细胞中扩增来产生病毒,这种方法既缓慢又昂贵;以及需要处理病毒颗粒,这可能是低效的。这些是所公开的核酸组合物的优点的实例,并且本领域技术人员将认识到其他优点。本公开还提供核酸分子、使用方法、治疗方法、核酸模板、细胞和试剂盒。本公开还提供修饰以增加核酸的稳定性和/或功能和/或编码的蛋白质的稳定性和/或功能。这些修饰可以包括一个或多个内在不稳定性(INS)元件的突变;具有N端甲硫氨酸-甘氨酸二肽的功能单元,例如整合酶;功能单元例如整合酶与归巢蛋白的融合;针对在宿主细胞中的表达使用密码子优化;和/或引发寡核苷酸的使用。其他修饰如本文所公开。
在某些方面,本文提供了用于递送转基因(例如,但不限于β珠蛋白、囊性纤维化跨膜电导调节因子(CFTR)、因子VIII、肌营养不良蛋白或RP GTP酶调节剂(RPGR))的核酸和核酸组合物、试剂盒和使用方法。在一些方面,本公开提供了基于逆转录病毒(例如,慢病毒)的非病毒组合物,其包含:至少一个第一核酸分子,其编码逆转录病毒Pol多聚蛋白,逆转录病毒Pol多聚蛋白被加工以提供蛋白酶活性、逆转录和转基因编码核酸分子的整合,和至少一个第二核酸分子,其包含侧接长末端重复(LTR)序列的一个或多个转基因,用于将一个或多个转基因递送至靶细胞。包含一个或多个转基因的核酸分子在本文中也可以称为“转基因编码核酸分子”。在一些方面,本公开提供了将Pol多聚蛋白的组分编码为单独的多个功能单元,包括但不限于编码逆转录和整合活性的单元。这些多个功能单元可以在一个核酸或两个或更多个核酸上编码。Pol多聚蛋白的蛋白酶也可以在与一个或多个其他Pol多聚蛋白组分相同或不同的构建体上编码,或者如果所需的酶活性(例如,逆转录酶、整合酶)未编码为病毒多聚蛋白,则可以省略。在一些实施方案中,Pol多聚蛋白组分在一个或多个具有插入的多顺反子元件的核酸上编码。多顺反子元件可以是IRES和/或2A序列和/或其他多顺反子元件。在一些实施方案中,本公开的组合物还包含编码一个或多个辅助逆转录病毒蛋白(辅助蛋白)的一个或多个核酸序列,辅助逆转录病毒蛋白可以增强转基因编码核酸的逆转录和整合。如本文所用,“辅助蛋白”是指除Pol多聚蛋白组分之外的能够增强转基因编码核酸的逆转录和/或整合的任何逆转录病毒蛋白。辅助蛋白可以是结构蛋白,包括但不限于MA、CA、NC和Env,或非结构蛋白,包括但不限于Tat、Rev、Nef、Vpr、Vpu和Vif。编码一个或多个辅助逆转录病毒蛋白的核酸序列可以位于编码Pol多聚蛋白组分的一个或多个核酸上,或者可以位于不编码Pol多聚蛋白组分的一个或多个核酸上。在一些实施方案中,通过例如在一个或多个内在不稳定性(INS)元件中引入突变来增加mRNA的稳定性。在一些实施方案中,翻译的蛋白质的稳定性通过例如掺入N端甲硫氨酸-甘氨酸二肽来增加。在一些实施方案中,使用针对宿主细胞中的表达的密码子优化(例如,针对人细胞中的表达的密码子优化)增加mRNA的翻译效率。在一些实施方案中,本公开的蛋白质例如整合酶与归巢蛋白融合。在一些实施方案中,组合物包含引发寡核苷酸。本公开的核酸和组合物可用于由细胞、组织、器官或受试者离体或体内表达一种或多种转基因,或用于体外产生重组蛋白。此外,核酸分子可以被包装到非病毒递送系统(例如,脂质纳米颗粒)中,从而避免产生病毒颗粒的需要,这需要在细胞中扩增并且是缓慢且昂贵的,并避免与基于病毒的方法相关的风险,例如免疫原性。
定义
分子和细胞生物化学的通用方法可见于教科书如:Molecular Cloning:ALaboratory Manual,第3版(Sambrook等人,CSH Laboratory Press 2001);ShortProtocols in Molecular Biology,第4版(Ausubel等人编辑,John Wiley&Sons1999);Protein Methods(Bollag等人,John Wiley&Sons 1996);Nonviral Vectors for GeneTherapy(Wagner等人编辑,Academic Press 1999);Viral Vectors(Kaplift&Loewy编辑,Academic Press 1995);Immunology Methods Manual(I.Lefkovits编辑,Academic Press1997);以及Cell and Tissue Culture:Laboratory Procedures in Biotechnology(Doyle&Griffiths,John Wiley&Sons 1998),其公开内容通过引用并入本文。
抗体(以复数形式互换使用)是免疫球蛋白分子,其能够通过位于免疫球蛋白分子可变区的至少一个抗原识别位点特异性结合靶标,例如碳水化合物、多核苷酸、脂质、多肽等。如本文所用,术语“抗体”不仅涵盖完整的(例如,全长)多克隆或单克隆抗体,而且涵盖其抗原结合片段(例如Fab、Fab’、F(ab’)2、Fv)、单链(scFv)、其突变体、包含抗体部分的融合蛋白、人源化抗体、嵌合抗体、二价抗体、纳米抗体、线性抗体、单链抗体,以及包含具有所需的特异性的抗原识别位点的免疫球蛋白分子的任何其他修饰构型,包括抗体的糖基化变体、抗体的氨基酸序列变体和共价修饰的抗体。
“表达盒”或“核酸模板”包含任何能够作为用于产生DNA或RNA的模板的核酸构建体,包括感兴趣的基因/编码序列以及非翻译的RNA。
“多聚蛋白”是指包含共价连接的较小蛋白质的多肽,这些蛋白质可以天然存在并且通常被切割成具有不同生物学功能的组成蛋白质。
“Gag多聚蛋白”是指由gag(组特异性抗原)基因编码的前体多聚蛋白。Gag多聚蛋白在成熟过程中被加工形成基质蛋白(MA)、衣壳蛋白(CA)、间隔肽1(SP1)、核衣壳蛋白p7(NC)、间隔肽2(SP2)和P6蛋白。术语“Gag蛋白”和“Gag多聚蛋白组分”是指由gag基因编码的蛋白质中的一个或多个,即MA、CA、SP1、NC、SP2或P6。
“Pol多聚蛋白”是指由pol基因编码的前体多聚蛋白。Pol多聚蛋白被加工形成蛋白酶(PR)、逆转录酶/RNase H(RT/RH)和整合酶(IN)。每个组分通过经由PR的自加工被分开。术语“Pol蛋白”和“Pol多聚蛋白组分”是指由pol基因编码的蛋白质中的一个或多个,即RT/RH、IN或PR。
两个核酸序列的“同一性百分比”可以通过本领域已知的任何方法来确定。在一些实施方案中,两个核酸序列的同一性百分比使用Karlin和Altschul,Proc.Natl.Acad.Sci.USA 87:2264-68,1990的算法确定,如Karlin和Altschul,Proc.Natl.Acad.Sci.USA 90:5873-77,1993进行修改。将此算法并入到Altschul等人,J.Mol.Biol.215:403-10,1990的NBLAST和XBLAST程序(2.0版)中。可以用NBLAST程序,评分=100,字长-12进行BLAST核苷酸搜索,以获得与靶标核酸同源的引导序列。在两个序列之间存在空位的情况下,可以使用如Altschul等人,Nucleic Acids Res.25(17):3389-3402,1997所述的Gapped BLAST。当使用BLAST和Gapped BLAST程序时,可以使用相应程序(例如,XBLAST和NBLAST)的默认参数。
术语“多顺反子(polycistronic)”和“多个顺反子(multicistronic)”可互换使用,是指在相同核酸分子内单独编码多于一个多肽的核酸分子。例如,多顺反子mRNA是在同一转录本中编码多于一个多肽的mRNA。“多顺反子元件”或“多个顺反子元件”是指将多顺反子核酸中的单个多肽分隔以允许独立翻译和/或翻译后加工的元件。
术语“多肽”和“蛋白质”可互换使用,是指通过肽键连接的氨基酸残基的聚合物,并且出于本公开的目的,具有至少5个氨基酸的最小长度。该定义涵盖全长蛋白质及其大于5个氨基酸的片段。该术语还包括具有多肽的共翻译(例如,信号肽切割)和翻译后修饰的多肽,多肽的共翻译和翻译后修饰例如二硫键形成、糖基化、乙酰化、磷酸化、蛋白水解切割(例如,通过弗林蛋白酶或金属蛋白酶的切割)等。此外,如本文所用,“多肽”或“蛋白质”是指包括对天然序列的修饰,例如缺失、添加和取代(通常是本领域技术人员已知的性质上保守的)的蛋白质,只要蛋白质保持与所述方法的目的相关的期望活性。这些修饰可以是故意的,例如通过定点诱变,也可以是偶然的,例如通过产生蛋白质的宿主的突变,或由于PCR扩增或其他重组DNA方法引起的错误。
如本文所用,术语“核酸”或“核酸分子”通常指脱氧核糖核酸(DNA)或核糖核酸(RNA)。在一些实施方案中,“核酸”是指单个核酸残基(例如,核苷酸和/或核苷)。在一些实施方案中,“核酸”是指包含单个核苷酸的寡核苷酸链。如本文所用,术语“寡核苷酸”和“多核苷酸”可互换使用,是指核苷酸的聚合物(例如,一串至少两个核苷酸)。核酸可以是单链或双链的。核酸分子中的核苷酸单体可以是天然存在的核苷酸、修饰的核苷酸或其组合。在一些实施方案中,修饰的核苷酸包含糖部分和/或嘧啶或嘌呤碱基的修饰。
术语“受试者”和“患者”在本文中可互换使用。在一些实施方案中,受试者是哺乳动物。“哺乳动物”是指任何归类为哺乳动物的动物,包括人、家畜和农场动物,以及动物园、运动或宠物动物,例如狗、马、猫、牛、绵羊、山羊、猪、骆驼等。在一些实施方案中,哺乳动物是人。在一些实施方案中,受试者是禽类。
本公开的组合物的“治疗有效量”通常是指足以引起期望生物学反应(例如,在靶细胞中表达转基因、治疗病症等)的量。如本领域普通技术人员所理解的,本文所述药剂的有效量可根据诸如所治疗的病症、施用方式以及受试者的年龄、身体组成和健康等因素而变化。
术语“转基因”或“转基因序列”是指编码感兴趣的蛋白质或RNA产物的外源核苷酸序列。
术语“治疗(treat)”、“治疗(treating)”、“治疗(treatment)”、和“疗法”涵盖当受试者患有病症时,所采取的减轻病症(或与病症相关的症状)的严重程度或延缓或减缓病症(或与病症相关的症状)的进展的行为。
最小基因治疗平台
本公开部分基于以下发现:使用包含至少一个编码逆转录病毒Pol多聚蛋白的第一核酸(所述逆转录病毒Pol多聚蛋白被加工以提供除其他外潜在地转基因编码核酸的逆转录和整合)以及至少一个包含侧接LTR序列的一个或多个转基因的第二核酸分子的最小系统,所述逆转录病毒(例如,慢病毒)来源的核酸分子可用于递送、整合和稳定表达转基因(例如,用于基因治疗)。在一些实施方案中,Pol多聚蛋白的组分被编码为一个或多个核酸分子上的单独单元。在一些实施方案中,编码逆转录病毒Pol多聚蛋白组分的一个或多个核酸分子还编码一个或多个辅助逆转录病毒蛋白。在一些实施方案中,该系统包含编码一个或多个辅助逆转录病毒蛋白的一个或多个额外的核酸分子。在一些实施方案中,最小系统包含两个核酸分子,一个核酸分子提供逆转录酶和整合酶功能(作为用蛋白酶加工的多聚蛋白,或作为单独编码的单元),且一个核酸分子编码一个或多个转基因。在一些实施方案中,最小系统包含两个或更多个核酸分子(例如,2个、3个、4个或5个或更多个)。核酸分子可以被包装到非病毒递送系统(例如,脂质纳米颗粒)中,从而绕过需要在细胞中扩增并且缓慢且昂贵的病毒颗粒的产生,并避免与基于病毒的方法相关的风险,例如免疫原性。
本公开的组合物与当前的基因和细胞治疗方法相比具有若干优点。与当前基因治疗方法例如CRISPR/Cas9、逆转录病毒、慢病毒、疱疹病毒、腺病毒和腺相关病毒(AAV)相关的一些挑战如图2所示。与现有方法相比,本公开的组合物可以在分裂和非分裂细胞中发挥作用,具有高转基因大小容量(例如,4-5kb、5-6kb、6-7kb、7-8kb、8-9kb、9-10kb或大于4kb、大于5kb、大于6kb、大于7kb、大于8kb、大于9kb或大于10kb)和/或不需要昂贵的病毒和/或病毒颗粒的产生。本公开的组合物还克服了与HIV-1和第三代慢病毒载体相关的一些限制。在HIV-1载体中,HIV-1生命周期所需的所有组分都在单一RNA基因组上。HIV-1载体也具有复制能力(即,其可以在整合后复制),具有允许将基因组包装成病毒颗粒的包装信号,具有针对HIV-1mRNA的mRNA核输出元件,并且具有顺式病毒机制。HIV-1载体存在安全问题,因此无法在体内使用。另一方面,下一代基于实验室的慢病毒的特征在于整合步骤后的自我失活、在多个单独构建体上的反式病毒机制、以及具有启动子/增强子区域的转基因。然而,这些需要用多种质粒共转染包装细胞,导致病毒颗粒产生效率低下。部分包装或错误包装的病毒颗粒也具有高度免疫原性。在上述慢病毒载体的改进中,本文所述的最小RNA设计不需要颗粒形成或包装,并且在一些实施方案中,其特征在于仅在单独的构建体上具有逆转录和反式整合功能。通过仅需要提供逆转录和整合及转移(即,转基因编码)功能的最少组分,同时自我失活和绕过病毒颗粒的产生,本公开的组合物克服了与当前慢病毒方法相关的挑战。此外,非病毒递送系统可以很容易地用靶向部分功能化,简化施用和核酸合成(例如,RNA合成)以及递送系统产生都可以是无细胞的,从而简化制备过程。
本文所述的组合物包含以下基本组分:用于转基因编码核酸的逆转录(例如RT/RH)和整合(例如IN)的编码逆转录病毒Pol多聚蛋白组分的一个或多个核酸分子,和包含侧接LTR序列的一个或多个转基因序列的核酸分子。可以表达和加工Pol多聚蛋白以提供蛋白酶活性(例如使用PR蛋白)、逆转录酶活性(例如使用RT/RH蛋白)和转基因编码核酸分子的整合(例如使用IN蛋白)。Pol多聚蛋白组分可以替代地表达为一个或多个核酸分子上的单独的多个功能单元。当作为单独的单元表达时,提供蛋白酶活性的Pol多聚蛋白组分可以或可以不表达。本公开的组合物可以任选地进一步包含编码一个或多个辅助逆转录病毒蛋白的一个或多个核酸序列以增强转基因编码核酸的逆转录和整合。一个或多个辅助蛋白可以与一个或多个Pol多聚蛋白组分顺式或反式编码。在一些实施方案中,编码Pol多聚蛋白的核酸分子还编码一个或多个辅助逆转录病毒蛋白。在一些实施方案中,本公开的组合物包含编码一个或多个辅助逆转录病毒蛋白的一个或多个额外的核酸分子。在一些实施方案中,组合物包含两个核酸分子,一个核酸分子提供逆转录酶和整合酶功能(例如但不限于Pol多聚蛋白和/或一个或多个辅助逆转录病毒蛋白)且一个核酸分子编码一个或多个转基因。在一些实施方案中,组合物包含两个或更多个核酸分子(例如,2个、3个、4个或5个或更多个)。在一些实施方案中,组合物不包含任何辅助逆转录病毒蛋白。本公开的组合物被包装在非病毒递送系统(例如,脂质纳米颗粒)中用于体内或离体递送。
核酸分子可以是RNA分子或DNA分子,基因组和/或cDNA,或RNA和DNA的杂交体,其中核酸含有脱氧核糖核苷酸和核糖核苷酸的任何组合(例如,人工的或天然的)。核酸分子可以是单链的(ss)或双链的(ds),或者可以含有单链和双链序列二者的部分。在一些实施方案中,核酸分子是DNA分子。DNA分子可以是ssDNA分子或dsDNA分子(例如,线性dsDNA分子)。在一些实施方案中,核酸分子是RNA分子。RNA分子可以是ssRNA或dsRNA分子。在一些实施方案中,RNA分子可以是ssRNA分子。在一些实施方案中,核酸分子可以是mRNA分子。
在一些实施方案中,本公开的组合物包含编码逆转录病毒Pol多聚蛋白组分的一个或多个RNA分子,以及包含侧接LTR序列的一个或多个转基因序列的RNA分子。在一些实施方案中,本公开的组合物包含两个RNA分子:编码逆转录病毒Pol多聚蛋白的第一RNA分子和包含侧接LTR序列的转基因序列的第二RNA分子。在一些实施方案中,编码Pol多聚蛋白的RNA分子将多聚蛋白表达为一个规范单元,其中每个组分通过蛋白酶加工而被分开。在一些实施方案中,编码Pol多聚蛋白组分的RNA分子将它们表达为多个个体单元,例如,表达为双顺反子构建体。在一些实施方案中,编码Pol多聚蛋白的RNA分子还编码一个或多个如本文所述的辅助逆转录病毒蛋白。在一些实施方案中,组合物包含编码一个或多个辅助逆转录病毒蛋白的一个或多个额外的RNA分子。核酸分子是RNA分子的实施方案的体内方法概述于图1和图6中。
逆转录和整合功能
该系统的一个或多个核酸编码逆转录病毒Pol多聚蛋白,其被加工以提供负责蛋白酶活性、逆转录和一个或多个转基因整合的功能单元。在一些实施方案中,包含5’UTR、编码逆转录病毒Pol多聚蛋白的核酸序列(逆转录病毒pol基因)以及3’UTR的核酸分子提供逆转录和整合功能。因此,在一些实施方案中,所有Pol多聚蛋白组分在具有5’和3’UTR的一个核酸分子上编码。在一些实施方案中,Pol多聚蛋白组分在各自具有5’和3’UTR的两个或更多个核酸分子上编码。在一些实施方案中,Pol多聚蛋白组分在各自具有5’和3’UTR的一个或多个核酸分子上编码,并由一个或多个多顺反子元件(例如,一个或多个IRES和/或2A肽编码序列和/或其他多顺反子元件)分隔。也可以使用有助于翻译的任何其他多顺反子元件。在一些实施方案中,核酸分子不编码Pol蛋白酶,例如,其中Pol多聚蛋白组分逆转录酶和整合酶被编码为在一个或多个核酸分子上的多个单独单元或由插入的多顺反子元件(例如,IRES和/或2A肽编码序列,和/或其他多顺反子元件)分隔。在进一步的实施方案中,Pol多聚蛋白组分逆转录酶可以被编码为单独的p51和p66亚基(图9)。在一些实施方案中,p51和p66在各自具有5’和3’UTR的单独的核酸分子上编码。在一些实施方案中,p51和p66被编码为在同一核酸上的由多顺反子元件(例如,IRES或2A肽编码序列,或其他多顺反子元件)分隔的单独的单元。
与其中pol表达需要从gag的翻译滑动的规范设计相比,在一些实施方案中,可以通过从一个单独的构建体产生Pol多聚蛋白或单独的Pol多聚蛋白组分并通过编码不同的用于mRNA稳定性和高水平的翻译的UTR来增加Pol蛋白的表达。在一些实施方案中,选择异源UTR以提高mRNA稳定性和/或翻译水平。在一些实施方案中,UTR包括来自稳定且高度翻译的mRNA分子(例如但不限于β-珠蛋白、肌动蛋白、GAPDH、微管蛋白、组蛋白或柠檬酸循环酶)的3’或5’序列。工程化或合成的UTR(即,基于非天然存在且不同于天然存在的突变的UTR的合理设计的UTR)也可用于增强稳定性和/或翻译。人UTR的序列可在GenBank上获得。
在一些实施方案中,除了编码功能单元之外,核酸序列还编码一个或多个辅助逆转录病毒蛋白以增强逆转录和/或整合。在一些实施方案中,一个或多个辅助蛋白与一个或多个Pol多聚蛋白组分顺式编码(即,由同一核酸分子编码)。在一些实施方案中,一个或多个辅助蛋白与所有Pol多聚蛋白组分顺式编码。在一些实施方案中,一个或多个辅助蛋白与Pol多聚蛋白顺式编码。因此,在一些实施方案中,所有Pol多聚蛋白组分和辅助蛋白均由具有5’和3’UTR的一个核酸分子编码。在一些实施方案中,编码Pol多聚蛋白组分和/或辅助蛋白的核苷酸序列由一个或多个多顺反子元件(例如,一个或多个IRES和/或2A肽编码序列,和/或其他多顺反子元件)分隔。在一些实施方案中,编码Pol多聚蛋白组分和/或辅助蛋白的核苷酸序列编码包含Pol多聚蛋白组分和/或辅助蛋白的融合蛋白。在一些实施方案中,一个或多个辅助蛋白与Pol多聚蛋白组分反式编码(即,由单独的核酸分子编码)。在一些实施方案中,Pol多聚蛋白组分和辅助蛋白由各自具有5’和3’UTR的两个或更多个(例如两个、三个、四个或五个或更多个)核酸分子编码。在一些实施方案中,UTR包括来自稳定且高度翻译的mRNA分子(包括但不限于珠蛋白、肌动蛋白、GAPDH、微管蛋白、组蛋白或柠檬酸循环酶)的3’或5’序列。
在一些实施方案中,一个或多个辅助蛋白选自gag基质蛋白(MA)(p17)、核衣壳(NC)(p9)、衣壳蛋白(CA)(p24)、p6、病毒感染因子(Vif)、转录反式激活因子(Tat)、负调节因子(Nef)、病毒蛋白R(Vpr)和病毒蛋白u(Vpu)。在一些实施方案中,辅助蛋白可以是野生型蛋白或可以是突变蛋白。在一些实施方案中,突变辅助蛋白是CA N74D或CA E45A。编号对应于野生型HIV-1CA蛋白,并且本领域技术人员可以容易地确定其他逆转录病毒CA蛋白中的相应突变。在一些方面,野生型HIV-1毒株可以是NL4-3。在一些实施方案中,该系统包含选自MA、NC、CA、p6、Vif、Tat、Nef、Vpr和Vpu的一个辅助蛋白。在一些实施方案中,辅助蛋白是NC。在一些实施方案中,辅助蛋白是CA。在一些实施方案中,本公开的组合物包含选自MA、NC、CA、p6Vif、Tat、Nef、Vpr和Vpu的两个辅助蛋白。在一些实施方案中,本公开的组合物包含选自MA、NC、CA、p6Vif、Tat、Nef、Vpr和Vpu的三个辅助蛋白。在一些实施方案中,本公开的组合物包含选自MA、NC、CA、p6Vif、Tat、Nef、Vpr和Vpu的四个、五个、六个、七个或八个辅助蛋白。在一些实施方案中,该系统包含MA、NC、CA、p6、Vif、Tat、Nef、Vpr和Vpu。
在一些实施方案中,一个或多个辅助蛋白由gag多聚蛋白(p55)表达。因此,在一些实施方案中,核酸分子包含逆转录病毒gag基因。在一些实施方案中,本公开的核酸分子包含核酸序列,所述核酸序列包含在规范的gag-pol重叠方向上的gag和pol基因。在一些实施方案中,本公开的核酸分子包含编码Gag和Pol多聚蛋白的融合的核酸序列。在一些实施方案中,本公开的核酸包含编码由2A肽编码序列分隔的Gag和Pol多聚蛋白的核酸序列。在一些实施方案中,本公开的核酸分子编码作为单独的单元的一个或多个Pol多聚蛋白组分和一个或多个Gag多聚蛋白组分。在一些实施方案中,单独的单元由一个或多个多顺反子元件(例如,一个或多个2A肽编码序列和/或IRES和/或其他多顺反子元件)连接。在一些实施方案中,本公开的核酸包含不编码基质蛋白(MA)的修饰的gag-pol基因。在一些实施方案中,本公开的核酸包含含有移码突变的修饰的gag-pol基因。在一些实施方案中,本公开的核酸包含修饰的gag-pol基因,该修饰的gag-pol基因,包含破坏gag-pol移码机制的单核苷酸插入。在一些实施方案中,本公开的核酸包含不编码MA的gag基因。
在一些实施方案中,本公开的核酸分子或组合物能够在不存在功能性逆转录病毒Rev和/或Env蛋白的情况下将一个或多个转基因整合到宿主基因组中。在一些实施方案中,本公开的核酸分子或组合物不含表达由逆转录病毒rev和逆转录病毒env中的至少一个编码的蛋白质的核酸序列。在一些实施方案中,本公开的核酸分子或组合物不含表达由逆转录病毒rev和env基因两者编码的蛋白质的核酸序列。在一些实施方案中,本公开的核酸分子或组合物不包含任何编码逆转录病毒Gag蛋白的核酸序列。在其他实施方案中,本公开的核酸分子或组合物不包含能够表达所有逆转录病毒Gag蛋白的核酸序列。在一些实施方案中,本公开的核酸分子或组合物不包含编码以下逆转录病毒Gag蛋白的核酸序列:MA、SP1、SP2和p6。在一些实施方案中,本公开的核酸分子或组合物不包含编码MA的核酸序列。在一些实施方案中,本公开的核酸分子或组合物不包含任何编码逆转录病毒Gag蛋白的核酸序列。在其他实施方案中,本公开的核酸分子或组合物不包含能够表达所有逆转录病毒Gag蛋白的核酸序列。
在一些实施方案中,本公开的组合物还包含编码NC的核酸序列。在一些实施方案中,NC由包含5’UTR和3’UTR的单独的核酸分子编码。在一些实施方案中,编码逆转录病毒Pol多聚蛋白组分的一个或多个核酸分子还包含顺式编码NC的核酸序列。在一些实施方案中,编码Pol多聚蛋白的核酸分子顺式编码NC。在一些实施方案中,不存在编码其他Gag蛋白(包括MA、CA、SP1、SP2和p6)的核酸序列。在一些实施方案中,不存在编码MA、SP1、SP2和p6的核酸序列。
在一些实施方案中,本公开的组合物还包含编码CA的核酸序列。在一些实施方案中,CA由包含5’UTR和3’UTR的单独的核酸分子编码。在一些实施方案中,编码逆转录病毒Pol多聚蛋白组分的一个或多个核酸分子还包含顺式编码CA的核酸序列。在一些实施方案中,编码Pol多聚蛋白的核酸分子顺式编码CA。在一些实施方案中,不存在编码其他Gag蛋白(包括MA、NC、SP1、SP2和p6)的核酸序列。在一些实施方案中,不存在编码MA、SP1、SP2和p6的核酸序列。
在一些实施方案中,本公开的组合物还包含编码vif的核酸序列。在一些实施方案中,Vif由包含5’UTR和3’UTR的单独的核酸分子编码。在一些实施方案中,编码逆转录病毒Pol多聚蛋白组分的一个或多个核酸分子还包含顺式编码vif的核酸序列。在一些实施方案中,编码Pol多聚蛋白的核酸分子顺式编码vif。
在一些实施方案中,本公开的组合物还包含编码Tat的核酸序列。在一些实施方案中,Tat由包含5’UTR和3’UTR的单独的核酸分子编码。在一些实施方案中,编码逆转录病毒Pol多聚蛋白组分的一个或多个核酸分子还包含顺式编码Tat的核酸序列。在一些实施方案中,编码Pol多聚蛋白的核酸分子顺式编码Tat。
在一些实施方案中,本公开的组合物还包含编码Nef的核酸序列。在一些实施方案中,Nef由包含5’UTR和3’UTR的单独的核酸分子编码。在一些实施方案中,编码逆转录病毒Pol多聚蛋白组分的一个或多个核酸分子还包含顺式编码Nef的核酸序列。在一些实施方案中,编码Pol多聚蛋白的核酸分子顺式编码Nef。
在一些实施方案中,本公开的组合物还包含编码Vpr的核酸序列。在一些实施方案中,Vpr由包含5’UTR和3’UTR的单独的核酸分子编码。在一些实施方案中,编码逆转录Pol多聚蛋白组分的一个或多个核酸分子还包含顺式编码Vpr的核酸序列。在一些实施方案中,编码Pol多聚蛋白的核酸分子顺式编码Vpr。
在一些实施方案中,本公开的组合物还包含编码Vpu的核酸序列。在一些实施方案中,Vpu由包含5’UTR和3’UTR的单独的核酸分子编码。在一些实施方案中,编码逆转录Pol多聚蛋白组分的一个或多个核酸分子还包含顺式编码Vpu的核酸序列。在一些实施方案中,编码Pol多聚蛋白的核酸分子顺式编码Vpu。
在一些实施方案中,本公开的组合物还包含编码MA的核酸序列。在一些实施方案中,MA由包含5’UTR和3’UTR的单独的核酸分子编码。在一些实施方案中,编码逆转录病毒Pol多聚蛋白组分的一个或多个核酸分子还包含顺式编码MA的核酸序列。在一些实施方案中,编码Pol多聚蛋白的核酸分子顺式编码MA。
在一些实施方案中,本公开的组合物还包含编码p6的核酸序列。在一些实施方案中,p6由包含5’UTR和3’UTR的单独的核酸分子编码。在一些实施方案中,编码逆转录病毒Pol多聚蛋白组分的一个或多个核酸分子还包含顺式编码p6的核酸序列。在一些实施方案中,编码Pol多聚蛋白的核酸分子顺式编码p6。
在一些实施方案中,编码Pol多聚蛋白组分和/或一个或多个辅助蛋白的核酸序列基于来自一个或多个逆转录病毒的核酸序列。在一些实施方案中,编码Pol多聚蛋白组分和/或一个或多个辅助蛋白的核酸序列基于来自相同逆转录病毒的核酸序列。在一些实施方案中,编码Pol多聚蛋白组分和/或一个或多个辅助蛋白的核酸序列基于来自两个或更多个不同逆转录病毒的核酸序列。在一些实施方案中,编码Pol多聚蛋白组分和/或一个或多个辅助蛋白的核酸序列基于来自以下的核酸序列:鼠白血病病毒(MLV)、莫洛尼鼠白血病病毒(MoLV)、弗里德病毒(FV)、艾贝尔森鼠白血病病毒(A-MLV)、鼠干细胞病毒(MSCV)、鼠乳腺肿瘤病毒(MMTV)、莫洛尼鼠肉瘤病毒(MoMSV)、劳氏肉瘤病毒(RSV)、藤浪肉瘤病毒(FuSV)、FBR鼠骨肉瘤病毒(FBR MSV)、禽骨髓细胞瘤病毒29(MC29)、禽成红细胞增多症病毒(AEV)、人T细胞白血病病毒(HTLV)、Friend MLV(FrMLV)、禽肉瘤病毒(ASV)、禽白血病病毒、禽成髓细胞瘤病毒、UR2肉瘤病毒、Y73肉瘤病毒、Jaagsiekte绵羊逆转录病毒、叶猴病毒、Mason-pfizer猴病毒、松鼠猴逆转录病毒、禽癌米尔希尔病毒2、牛白血病病毒、灵长类T淋巴细胞病毒1、灵长类T淋巴细胞病毒2、灵长类嗜T淋巴细胞病毒3、大眼鲥鱼真皮肉瘤病毒、大眼鲥鱼表皮增生病毒1、大眼鲥鱼表皮增生病毒2、小鸡合胞病毒、猫白血病病毒、Finkel-Biskis-Jinkins鼠肉瘤病毒、Gardner-Arnstein猫肉瘤病毒、长臂猿白血病病毒、豚鼠C型肿瘤病毒、Hardy-Zuckerman猫肉瘤病毒、Harvey鼠肉瘤病毒、Kirsten鼠肉瘤病毒、考拉逆转录病毒、莫洛尼鼠肉瘤病毒、猪C型肿瘤病毒、网状内皮增生病毒、Snyder-Theilen猫肉瘤病毒、Trager鸭脾坏死病毒、毒蛇逆转录病毒、毛猴肉瘤病毒、Jembrana病病毒、美洲狮慢病毒、牛泡沫病毒、马泡沫病毒、猫泡沫病毒、棕色大丛猴原猿泡沫病毒、婆罗洲猩猩猿猴泡沫病毒、中央黑猩猩猿猴泡沫病毒、食蟹猴猿猴泡沫病毒、东方黑猩猩猿猴泡沫病毒、绿猴猿猴泡沫病毒、长尾猴猿猴泡沫病毒、日本猕猴猿猴泡沫病毒、恒河猴猿猴泡沫病毒、蜘蛛猴猿猴泡沫病毒、松鼠猴猿猴泡沫病毒、台湾猕猴猿猴泡沫病毒、西方黑猩猩猿猴泡沫病毒、西部低地大猩猩猿猴泡沫病毒、白绒耳狨猴猿猴泡沫病毒、黄胸卷尾猴猿猴泡沫病毒,或其组合。在一些实施方案中,核酸序列基于来自HFV的核酸序列。在一些实施方案中,编码Pol多聚蛋白组分和/或一个或多个辅助蛋白的核酸序列基于来自一个或多个慢病毒的核酸序列。在一些实施方案中,编码Pol多聚蛋白组分和/或一个或多个辅助蛋白的核酸序列基于来自以下的核酸序列:人免疫缺陷病毒(HIV)(例如,HIV-1、HIV-2)、猿猴免疫缺陷病毒(SIV)、visna/maedi病毒(VMV)、山羊关节炎脑炎病毒(CAEV)、马传染性贫血病毒(EIAV)、猫免疫缺陷病毒(FIV)、牛免疫缺陷病毒(BIV)、jembrana病病毒、美洲狮慢病毒、或其组合。在一些实施方案中,核酸序列基于来自HIV-1的核酸序列(例如,GenBank登录号AF033819)。技术人员可以获得来自HIV基因组的核苷酸序列。参见例如,HIV基因组浏览器(洛斯阿拉莫斯国家实验室):www.hiv.lanl.gov/content/sequence/genome_browser/browser和“HXB2中的编号位置”:Korber等人-未知期刊,附属于UCSD并由LANL数据库引用。www.hiv.lanl.gov/content/sequence/HIV/MAP/annotation还提供了用于鉴定HIV内的基因的深度注释资源。
应理解,术语“基于”或“衍生自”表示核酸序列(或氨基酸序列)可以包含相对于基础序列的一个或多个修饰。因此,核酸序列可以包含相对于相应的野生型核酸序列的一个或多个修饰(例如,一个或多个核苷酸的缺失、一个或多个核苷酸的添加、一个或多个核苷酸的取代、或其组合)。在一些实施方案中,编码Pol多聚蛋白组分和/或一个或多个辅助蛋白的核酸序列与对应的野生型核酸序列具有至少60%的同一性(例如,70%、80%、90%至100%、95%至100%、98%至100%,或81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性)。在一些方面,野生型Pol多聚蛋白来自HIV-1毒株NL4-3。
编码Pol多聚蛋白组分和/或一个或多个辅助蛋白的一个或多个核酸分子可以包含相对于天然存在的核酸分子的一个或多个化学或生物学修饰。修饰可以增强核酸或蛋白质稳定性和/或转录/翻译效率和/或降低免疫原性。修饰可以包括但不限于修饰的核碱基、修饰的骨架(例如,磷酰胺、硫代磷酸酯、二硫代磷酸酯、O-甲基亚磷酰胺连接和/或肽核酸)。
在一些实施方案中,编码Pol多聚蛋白组分和/或一个或多个辅助蛋白的一个或多个核酸分子包含一个或多个提高mRNA或相应mRNA稳定性的突变。在一些实施方案中,编码Pol多聚蛋白组分和/或一个或多个辅助蛋白的一个或多个核酸分子包含一个或多个提高Rev独立性的突变。在一些实施方案中,核酸序列包含一个或多个内在不稳定性(INS)元件中的突变(例如,一个或多个核苷酸的缺失、一个或多个核苷酸的添加、一个或多个核苷酸的取代、或其组合)。在一些实施方案中,INS元件中的密码子被替代密码子替换以保留蛋白质序列,同时改变或去除INS元件。在一些实施方案中,INS元件被针对在人中的表达优化的密码子替代。在一些实施方案中,一个或多个INS元件选自TAGAT、ATAGA、AAAAG、ATAAA和TTATA或其他INS元件(例如,Wolff等人Nucleic Acids Res.31(11):2839-51(2003)描述的那些)。在一些实施方案中,INS元件被完全去除。在一些实施方案中,INS元件被部分去除。在一些实施方案中,核酸序列针对在人中的表达进行密码子优化。这些修饰可以存在于编码逆转录酶、整合酶、衣壳、基质、核衣壳、p6、Vif、Nef、Vpu或Vpr中的一个或多个的核苷酸序列中。
在一些实施方案中,编码Pol多聚蛋白组分和/或一个或多个辅助蛋白的一个或多个核酸分子包含一个或多个提高相应蛋白稳定性的突变。在一些实施方案中,本公开的核酸分子编码包含稳定化的甲硫氨酸-甘氨酸二肽的整合酶多肽。在一些实施方案中,本公开的核酸编码包含N端甲硫氨酸-甘氨酸二肽的整合酶多肽。
在一些实施方案中,编码Pol多聚蛋白组分和/或一个或多个辅助蛋白的一个或多个核酸分子包含一个或多个提高在宿主细胞中的翻译效率的突变。在一些实施方案中,本公开的核酸分子的密码子针对在人中的表达进行优化。
在一些实施方案中,编码Pol多聚蛋白组分和/或一个或多个辅助蛋白的一个或多个核酸分子包含一个或多个选自以下的修饰:用于在宿主细胞(例如,人或其他哺乳动物或禽类细胞)中表达的密码子优化、INS元件的部分或完全去除、和用稳定化的甲硫氨酸-甘氨酸二肽的整合酶的修饰。在一些实施方案中,编码Pol多聚蛋白组分和/或一个或多个辅助蛋白的一个或多个核酸分子针对在宿主细胞(例如,人或其他哺乳动物或禽类细胞)中的表达进行密码子优化,包括INS元件的完全或部分去除,并编码用甲硫氨酸-甘氨酸二肽修饰的整合酶多肽。
在一些实施方案中,编码Pol多聚蛋白组分的一个或多个核酸分子编码与归巢蛋白融合的整合酶用于定点基因组整合(图10)。归巢蛋白识别特定的DNA序列,从而将整合酶引导至特定序列。这种方法具有降低的遗传毒性的潜力。在一些实施方案中,整合酶由Pol多聚蛋白编码。在一些实施方案中,整合酶被编码为单独的单元。在一些实施方案中,Pol多聚蛋白与归巢蛋白融合。在一些实施方案中,归巢蛋白靶向转基因的基因组基因座。在一些实施方案中,归巢蛋白是识别限制性位点的酶。识别限制性位点的酶是本领域已知的。参见例如,www.neb.com/tools-and-resources/selection-charts/alphabetized-list-of-recognition-specificities。识别限制位点的酶的非限制性实例包括但不限于AatII、AbaSI、Acc65I、AccI、AciI、AclI、AcuI、AfeI、AflII、AflIII、AgeI、AhdI、AleI-v2、AluI、AlwI、AlwNI、ApaI、ApaLI、ApoI、AscI、AseI、AsiSI、AvaI、BsoBI、AvaII、AvrII、BaeGI、BaeI、BamHI、BanI、BanII、BbsI、BbvCI、BbvI、BccI、BceAI、BcgI、BciVI、BclI、BfaI、BglI、BglII、BlpI、BmgBI、BmrI、BmtI、BpmI、BpuEI、Bpu10I、BsaAI、BsaBI、BsaHI、BsaJI、BsaWI、BsaXI、BseRI、BseYI、BsgI、BsiEI、BsiHKAI、BsiWI、BslI、BsmAI BcoDI、BsmBI-v2、BsmFI、BsmI、BspCNI、BspEI、BspHI、Bsp1286I、BspMI、BfuAI、BsrBI、BsrDI、BsrFI-v2、BsrGI、BssHII、BssSI-v2、BstAPI、BstBI、BstEII、BstNI、BstUI、BstXI、BstYI、Bsu36I、BtgI、BtgZI、BtsCI、BtsIMutI、BtsI-v2、Cac8I、ClaI、BspDI、CspCI、CviAII、CviKI-1、CviQI、DdeI、DpnI、DraI、DrdI、EaeI、EarI、EciI、Eco53kI、EcoNI、EcoO109I、EcoP15I、EcoRI、EcoRV、Esp3I、FatI、FauI、Fnu4HI、FokI、FseI、FspEI、FspI、HaeII、HaeIII、HgaI、HhaI、HincII、HindIII、HinfI、HinP1I、HpaI、HphI、HpyAV、HpyCH4III、HpyCH4IV、HpyCH4V、Hpy99I、Hpy188I、Hpy166II、Hpy188III、I-CeuI、I-SceI、KasI、KpnI、LpnPI、MboI、Sau3AI、DpnII、MboII、MfeI、MluCI、MluI、MlyI、MmeI、MnlI、MscI、MseI、MslI、MspA1I、MspI、HpaII、MspJI、MwoI、NaeI、NarI、Nb.BbvCI、Nb.BsmI、Nb.BsrDI、Nb.BssSI、Nb.BtsI、NcoI、NdeI、NgoMIV、NlaIII、NlaIV、NmeAIII、NotI、NruI、NsiI、NspI、Nt.AlwI、Nt.BbvCI、Nt.BsmAI、Nt.BspQI、Nt.BstNBI、Nt.CviPII、PacI、PaqCI、PciI、PflMI、PI-PspI、PI-SceI、PleI、PluTI、PmeI、PmlI、PpuMI、PshAI、PsiI-v2、PspGI、PspOMI、PspXI、PstI、PvuI、PvuII、RsaI、RsrII、SacI、SacII、SalI、SapI BspQI、Sau96I、SbfI、ScrFI、SexAI、SfaNI、SfcI、SfiI、SfoI、SgrAI、SmaI、SmlI、SnaBI、SpeI、SphI、SrfI、SspI、StuI、StyD4I、SwaI、TaqI-v2、TfiI、TseI、ApeKI、Tsp45I、TspRI、Tth111I、PflFI、XbaI、XcmI、XhoI、PaeR7I、XmaI、TspMI、XmnI和ZraI。在一些实施方案中,归巢蛋白是归巢核酸内切酶。归巢核酸内切酶是本领域已知的,例如Stoddard,B.I.,Homing endonucleases from mobile group I introns:discovery to genomeengineering,Mobile DNA 5,7(2014)中公开的那些。归巢核酸内切酶的非限制性实例包括I-TevI、I-HmuI、I-Bth035I、I-CreI、I-AniI、I-PpoI和I-Ssp6803I。在一些实施方案中,归巢蛋白是I-PpoI。在一些实施方案中,归巢蛋白可以被修饰以去除任何不需要的核酸酶活性以防止任何基因组损伤。在一些实施方案中,归巢蛋白是I-PpoI(N119A)等。在一些实施方案中,整合酶多肽被修饰以去除任何不需要的核酸酶活性。在一些实施方案中,整合酶多肽包含D64V突变等。
在某些实施方案中,编码Pol多聚蛋白组分和/或一个或多个辅助蛋白的核酸分子是RNA分子(例如,ssRNA分子,如mRNA分子)。在一些实施方案中,包含5’UTR、编码逆转录病毒Pol多聚蛋白的核酸序列以及3’UTR的RNA分子提供RT和整合酶功能。在一些实施方案中,包含5’UTR、编码单独的Pol多聚蛋白组分的核酸序列以及3’UTR的核酸分子提供RT和整合酶功能。在一些实施方案中,所有Pol多聚蛋白组分都在一个具有5’和3’UTR的RNA分子上编码。在一些实施方案中,Pol多聚蛋白组分在各自具有5’和3’UTR的两个或更多个RNA分子上编码。在一些实施方案中,Pol多聚蛋白组分在各自具有5’和3’UTR的一个或多个RNA分子上编码并由一个或多个多顺反子元件分隔。一个或多个多顺反子元件可以是IRES和/或2A肽编码序列和/或其他多顺反子元件。在一些实施方案中,RNA分子不编码Pol多聚蛋白蛋白酶,例如用于RT和整合酶的Pol多聚蛋白组分在单独的RNA分子上编码或由多顺反子元件如插入的IRES和/或2A肽编码序列和/或其他多顺反子元件分隔。在一些实施方案中,另外存在编码一个或多个辅助蛋白以增强逆转录和/或整合的核酸分子。在一些实施方案中,一个或多个辅助蛋白与一个或多个Pol多聚蛋白组分顺式编码(即,由同一RNA分子编码)。在一些实施方案中,一个或多个辅助蛋白与所有Pol多聚蛋白组分顺式编码。在一些实施方案中,一个或多个辅助蛋白与Pol多聚蛋白顺式编码。因此,在一些实施方案中,所有Pol多聚蛋白组分和辅助蛋白均在一个具有5’和3’UTR的RNA分子上编码。在一些实施方案中,编码Pol多聚蛋白组分和/或辅助蛋白的核苷酸序列由一个或多个多顺反子元件例如IRES和/或2A肽编码序列和/或其他多顺反子元件分隔。在一些实施方案中,一个或多个辅助蛋白与Pol多聚蛋白组分反式编码(即,由单独的核酸分子编码)。在一些实施方案中,Pol多聚蛋白组分和辅助蛋白中的每个由各自具有5’和3’UTR的两个或更多个(例如,两个、三个、四个或五个或更多个)RNA分子编码。在一些实施方案中,UTR包括来自稳定的mRNA分子(包括但不限于珠蛋白、肌动蛋白、GAPDH、微管蛋白、组蛋白或柠檬酸循环酶)的3’或5’序列。
在一些实施方案中,本公开的核酸分子或组合物能够在不存在功能性逆转录病毒Rev和/或Env蛋白的情况下将一个或多个转基因整合到宿主基因组中。在一些实施方案中,本公开的组合物不含表达由逆转录病毒rev基因和逆转录病毒env基因中的至少一个编码的蛋白质的核酸序列。在一些实施方案中,本公开的核酸分子或组合物不含表达由逆转录病毒rev和env基因两者编码的蛋白质的核酸序列。在一些实施方案中,本公开的组合物不包含编码以下逆转录病毒Gag蛋白的核酸序列:MA、SP1、SP2和p6。在一些实施方案中,本公开的组合物不包含任何编码逆转录病毒Gag蛋白的核酸序列。在其他实施方案中,本公开的组合物不包含能够表达所有逆转录病毒Gag蛋白的核酸序列。
在一些实施方案中,编码逆转录病毒Pol多聚蛋白组分和/或一个或多个辅助蛋白的RNA分子包含一个或多个修饰的核糖核苷。在一些实施方案中,修饰的核糖核苷选自2-硫代尿苷、5-氮杂尿苷、假尿苷、4-硫代尿苷、5-甲基尿苷、5-甲基假尿苷、5-氨基尿苷、5-氨基假尿苷、5-羟基尿苷、5-羟基假尿苷、5-甲氧基尿苷、5-甲氧基假尿苷、5-乙氧基尿苷、5-乙氧基假尿苷、5-羟甲基尿苷、5-羟甲基假尿苷、5-羧基尿苷、5-羧基假尿苷、5-甲酰基尿苷、5-甲酰基假尿苷、5-甲基-5-氮杂尿苷、5-氨基-5-氮杂尿苷、5-羟基-5-氮杂尿苷、5-甲基假尿苷、5-氨基假尿苷、5-羟基假尿苷、4-硫代-5-氮杂尿苷、4-硫代假尿苷、4-硫代-5-甲基尿苷、4-硫代-5-氨基尿苷、4-硫代-5-羟基尿苷、4-硫代-5-甲基-5-氮杂尿苷、4-硫代-5-氨基-5-氮杂尿苷、4-硫代-5-羟基-5-氮杂尿苷、4-硫代-5-甲基假尿苷、4-硫代-5-氨基假尿苷、4-硫代-5-羟基假尿苷、2-硫代胞苷、5-氮杂胞苷、假异胞苷、N4-甲基胞苷、N4-氨基胞苷、N4-羟基胞苷、5-甲基胞苷、5-氨基胞苷、5-羟基胞苷、5-甲氧基胞苷、5-乙氧基胞苷、5-羟甲基胞苷、5-羧基胞苷、5-甲酰基胞苷、5-甲基-5-氮杂胞苷、5-氨基-5-氮杂胞苷、5-羟基-5-氮杂胞苷、5-甲基假异胞苷、5-氨基假异胞苷、5-羟基假异胞苷、N4-甲基-5-氮杂胞苷、N4-甲基假异胞苷、2-硫代-5-氮杂胞苷、2-硫代假异胞苷、2-硫代-N4-甲基胞苷、2-硫代-N4-氨基胞苷、2-硫代-N4-羟基胞苷、2-硫代-5-甲基胞苷、2-硫代-5-氨基胞苷、2-硫代-5-羟基胞苷、2-硫代-5-甲基-5-氮杂胞苷、2-硫代-5-氨基-5-氮杂胞苷、2-硫代-5-羟基-5-氮杂胞苷、2-硫代-5-甲基假异胞苷、2-硫代-5-氨基假异胞苷、2-硫代-5-羟基假异胞苷、2-硫代-N4-甲基-5-氮杂胞苷、2-硫代-N4-甲基假异胞苷、N4-甲基-5-甲基胞苷、N4-甲基-5-氨基胞苷、N4-甲基-5-羟基胞苷、N4-甲基-5-甲基-5-氮杂胞苷、N4-甲基-5-氨基-5-氮杂胞苷、N4-甲基-5-羟基-5-氮杂胞苷、N4-甲基-5-甲基假异胞苷、N4-甲基-5-氨基假异胞苷、N4-甲基-5-羟基假异胞苷、N4-氨基-5-氮杂胞苷、N4-氨基假异胞苷、N4-氨基-5-甲基胞苷、N4-氨基-5-氨基胞苷、N4-氨基-5-羟基胞苷、N4-氨基-5-甲基-5-氮杂胞苷、N4-氨基-5-氨基-5-氮杂胞苷、N4-氨基-5-羟基-5-氮杂胞苷、N4-氨基-5-甲基假异胞苷、N4-氨基-5-氨基假异胞苷、N4-氨基-5-羟基假异胞苷、N4-羟基-5-氮杂胞苷、N4-羟基假异胞苷、N4-羟基-5-甲基胞苷、N4-羟基-5-氨基胞苷、N4-羟基-5-羟基胞苷、N4-羟基-5-甲基-5-氮杂胞苷、N4-羟基-5-氨基-5-氮杂胞苷、N4-羟基-5-羟基-5-氮杂胞苷、N4-羟基-5-甲基假异胞苷、N4-羟基-5-氨基假异胞苷、N4-羟基-5-羟基假异胞苷、2-硫代-N4-甲基-5-甲基胞苷、2-硫代-N4-甲基-5-氨基胞苷、2-硫代-N4-甲基-5-羟基胞苷、2-硫代-N4-甲基-5-甲基-5-氮杂胞苷、2-硫代-N4-甲基-5-氨基-5-氮杂胞苷、2-硫代-N4-甲基-5-羟基-5-氮杂胞苷、2-硫代-N4-甲基-5-甲基假异胞苷、2-硫代-N4-甲基-5-氨基假异胞苷、2-硫代-N4-甲基-5-羟基假异胞苷、2-硫代-N4-氨基-5-氮杂胞苷、2-硫代-N4-氨基假异胞苷、2-硫代-N4-氨基-5-甲基胞苷、2-硫代-N4-氨基-5-氨基胞苷、2-硫代-N4-氨基-5-羟基胞苷、2-硫代-N4-氨基-5-甲基-5-氮杂胞苷、2-硫代-N4-氨基-5-氨基-5-氮杂胞苷、2-硫代-N4-氨基-5-羟基-5-氮杂胞苷、2-硫代-N4-氨基-5-甲基假异胞苷、2-硫代-N4-氨基-5-氨基假异胞苷、2-硫代-N4-氨基-5-羟基假异胞苷、2-硫代-N4-羟基-5-氮杂胞苷、2-硫代-N4-羟基假异胞苷、2-硫代-N4-羟基-5-甲基胞苷、N4-羟基-5-氨基胞苷、2-硫代-N4-羟基-5-羟基胞苷、2-硫代-N4-羟基-5-甲基-5-氮杂胞苷、2-硫代-N4-羟基-5-氨基-5-氮杂胞苷、2-硫代-N4-羟基-5-羟基-5-氮杂胞苷、2-硫代-N4-羟基-5-甲基假异胞苷、2-硫代-N4-羟基-5-氨基假异胞苷、2-硫代-N4-羟基-5-羟基假异胞苷、N6-甲基腺苷、N6-氨基腺苷、N6-羟基腺苷、7-脱氮腺苷、8-氮杂腺苷、N6-甲基-7-脱氮腺苷、N6-甲基-8-氮杂腺苷、7-脱氮-8-氮杂腺苷、N6-甲基-7-脱氮-8-氮杂腺苷、N6-氨基-7-脱氮腺苷、N6-氨基-8-氮杂腺苷、N6-氨基-7-脱氮-8-氮杂腺苷、N6-羟基腺苷、N6-羟基-7-脱氮腺苷、N6-羟基-8-氮杂腺苷、N6-羟基-7-脱氮-8-氮杂腺苷、6-硫代鸟苷、7-脱氮鸟苷、8-氮杂鸟苷、6-硫代-7-脱氮鸟苷、6-硫代-8-氮杂鸟苷、7-脱氮-8-氮杂鸟苷、6-硫代-7-脱氮-8-氮杂鸟苷和N1-甲基假尿苷。在一些实施方案中,修饰的核糖核苷是假尿苷或假尿苷的衍生物。在一些实施方案中,假尿苷的衍生物是N1-甲基假尿苷。在一些实施方案中,修饰的核糖核苷是N6-甲基腺苷。
在一些实施方案中,编码逆转录病毒Pol多聚蛋白组分和/或一个或多个辅助蛋白的RNA分子包含一个或多个修饰,包括但不限于:5’端帽(例如,5’-7mG帽结构);包含聚(rA)尾;改变3’UTR或5’UTR;将mRNA与药剂(例如蛋白质或互补核酸分子)复合;包含改变mRNA分子结构(例如,形成二级结构)的元件;以及减少C和/或U残基的数量。在一些实施方案中,聚(rA)序列是约10-500个核苷酸。在一些实施方案中,聚(rA)序列是至少10、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100、至少200、至少300、至少400、或至少500个核苷酸。对RNA分子的其他化学和生物学修饰是本领域已知的。
Pol多聚蛋白组分和辅助蛋白核酸模板
在一方面,本公开还提供了用于产生编码本文所述的Pol多聚蛋白组分和/或一个或多个辅助蛋白的核酸分子的核酸模板(例如,重组DNA构建体)。在一些实施方案中,核酸模板用于产生RNA分子。在一些实施方案中,使用无细胞方法(例如,体外转录或无细胞RNA合成)产生RNA分子。参见例如,美国专利公开号2017-0292138、2018-0087045 2019-0144489,其全部内容通过引用并入本文。在一些实施方案中,核酸模板除了包含RNA产生元件(例如,T7启动子、消化位点等)之外,还包含5’UTR、编码一个或多个Pol多聚蛋白组分的核酸序列以及3’UTR。在一些实施方案中,核酸模板包含T7启动子、5’UTR、编码逆转录病毒Pol多聚蛋白的核酸序列以及3’UTR,以及任选地,用于模板线性化的一个或多个限制性消化位点。在一些实施方案中,核酸模板包含T7启动子、5’UTR、编码单独的Pol多聚蛋白组分的核酸序列以及3’UTR,以及任选地,用于模板线性化的一个或多个限制性消化位点。在一些实施方案中,各自具有T7启动子以及5’和3’UTR的两个或更多个核酸模板编码Pol多聚蛋白组分。在一些实施方案中,各自具有T7启动子以及5’和3’UTR的一个或多个模板编码Pol多聚蛋白组分,其中Pol多聚蛋白组分由一个或多个多顺反子元件分隔。一个或多个多顺反子元件可以是IRES和/或2A肽编码序列和/或其他多顺反子元件。在一些实施方案中,核酸模板不编码Pol多聚蛋白蛋白酶。
在一些实施方案中,核酸模板另外包含编码一个或多个辅助逆转录病毒蛋白核酸序列以增强逆转录和/或整合。在一些实施方案中,一个或多个辅助蛋白与一个或多个Pol多聚蛋白组分顺式编码(即,由同一核酸分子编码)。在一些实施方案中,一个或多个辅助蛋白与所有Pol多聚蛋白组分顺式编码。在一些实施方案中,一个或多个辅助蛋白与Pol多聚蛋白顺式编码。在一些实施方案中,一个核酸模板编码所有Pol多聚蛋白组分和辅助蛋白。在一些实施方案中,编码Pol多聚蛋白组分和/或辅助蛋白的核苷酸序列由一个或多个多顺反子元件分隔。多顺反子元件可以是IRES和/或2A肽编码序列和/或其他多顺反子元件。在一些实施方案中,一个或多个辅助蛋白与Pol多聚蛋白组分反式编码(即,由单独的核酸分子编码)。在一些实施方案中,Pol多聚蛋白组分和辅助蛋白中的每个由各自具有T7启动子以及5’和3’UTR的两个或更多个(例如,两个、三个、四个或五个或更多个)核酸模板编码。在一些实施方案中,核酸模板包含T7启动子、5’UTR、编码gag-pol基因的核酸序列、3’UTR和任选地,用于模板线性化的一个或多个限制性消化位点。在一些实施方案中,核酸模板包含T7启动子、5’UTR、编码包含移码突变的gag-pol基因的核酸序列、3’UTR和任选地,用于模板线性化的一个或多个限制性消化位点。在一些实施方案中,gag-pol基因不编码基质蛋白。
在一些实施方案中,UTR包括来自稳定且高度翻译的mRNA分子(包括但不限于珠蛋白、肌动蛋白、GAPDH、微管蛋白、组蛋白或柠檬酸循环酶)的3’或5’序列。
在一些实施方案中,核酸模板不含表达由逆转录病毒rev和env基因编码的蛋白质的核酸序列。在一些实施方案中,核酸模板不含编码以下逆转录病毒Gag蛋白的核酸序列:MA、SP1、SP2和p6。在一些实施方案中,核酸模板不包含编码MA的核酸序列。在一些实施方案中,核酸模板包含编码NC和CA中的一个或多个的核酸序列。在一些实施方案中,本公开的组合物不包含任何编码逆转录病毒Gag蛋白(MA、CA、NC、SP1、SP2、P6)的核酸序列。在其他实施方案中,本公开的组合物不包含能够表达所有逆转录病毒Gag蛋白的核酸序列。在一些实施方案中,核酸模板包含编码NC、CA、MA、p6、Vif、Tat、Nef、Vpr和Vpu中的一个或多个的核酸序列。编码Pol多聚蛋白和/或辅助蛋白的示例性核酸模板如图4-5所示。在一些实施方案中,使用无细胞方法(例如,体外转录、无细胞RNA合成)产生RNA分子。
转基因编码核酸
在一方面,本公开内容提供了包含侧接LTR序列的一个或多个转基因的核酸分子,其有助于将一个或多个转基因整合到宿主基因组中。核酸分子可以不包含病毒包装信号(例如,Psi包装元件)和/或Rev反应元件(RRE)。因此,转基因编码核酸分子编码一个或多个转基因并含有有助于将一个或多个转基因整合到宿主细胞基因组中的序列;然而,该系统不允许产生任何病毒颗粒。在一些实施方案中,转基因编码核酸分子包含位于5’LTR和3’LTR之间的一个或多个逆转录酶引发元件和可操作地连接到一个或多个转基因的一个或多个启动子序列。
如本文所用,术语“长末端重复序列”或“LTR”是指重复数百次或数千次的RNA或DNA序列,并且存在于通过逆转录病毒RNA的逆转录形成的原病毒DNA的任一末端。病毒使用LTR将其遗传物质整合到宿主基因组中(例如,LTR的末端参与将原病毒整合到宿主基因组中)。在一些实施方案中,LTR是自失活的。3’LTR可以具有在单轮逆转录后被转移到5’LTR的缺失(例如,3’LTR的U3区中的转录增强子或增强子和启动子的缺失)。3’LTR中的缺失(例如,3’LTR的U3区中的转录增强子或增强子和启动子的缺失)可以是10-50个、50-100个、100-150个、150-200个或更多个核苷酸。在一些实施方案中,3’LTR中的缺失是100-150个核苷酸。在一些实施方案中,3’LTR中的缺失是100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149或150个核苷酸。在一些实施方案中,LTR、Pol多聚蛋白组分和/或一个或多个辅助蛋白基于来自相同逆转录病毒的核酸序列。在一些实施方案中,LTR、Pol多聚蛋白组分和/或一个或多个辅助蛋白基于来自两个或更多个不同逆转录病毒的核酸序列。在一些实施方案中,LTR基于来自以下的LTR:鼠白血病病毒(MLV)、莫洛尼鼠白血病病毒(MoLV)、弗里德病毒(FV)、艾贝尔森鼠白血病病毒(A-MLV)、鼠干细胞病毒(MSCV)、鼠乳腺肿瘤病毒(MMTV)、莫洛尼鼠肉瘤病毒(MoMSV)、劳氏肉瘤病毒(RSV)、藤浪肉瘤病毒(FuSV)、FBR鼠骨肉瘤病毒(FBR MSV)、禽骨髓细胞瘤病毒29(MC29)、禽成红细胞增多症病毒(AEV)、人T细胞白血病病毒(HTLV)、Friend MLV(FrMLV)、禽肉瘤病毒(ASV)、禽白血病病毒、禽成髓细胞瘤病毒、UR2肉瘤病毒、Y73肉瘤病毒、Jaagsiekte绵羊逆转录病毒、叶猴病毒、Mason-pfizer猴病毒、松鼠猴逆转录病毒、禽癌米尔希尔病毒2、牛白血病病毒、灵长类T淋巴细胞病毒1、灵长类T淋巴细胞病毒2、灵长类嗜T淋巴细胞病毒3、大眼鲥鱼真皮肉瘤病毒、大眼鲥鱼表皮增生病毒1、大眼鲥鱼表皮增生病毒2、小鸡合胞病毒、猫白血病病毒、Finkel-Biskis-Jinkins鼠肉瘤病毒、Gardner-Arnstein猫肉瘤病毒、长臂猿白血病病毒、豚鼠C型肿瘤病毒、Hardy-Zuckerman猫肉瘤病毒、Harvey鼠肉瘤病毒、Kirsten鼠肉瘤病毒、考拉逆转录病毒、莫洛尼鼠肉瘤病毒、猪C型肿瘤病毒、网状内皮增生病毒、Snyder-Theilen猫肉瘤病毒、Trager鸭脾坏死病毒、毒蛇逆转录病毒、毛猴肉瘤病毒、Jembrana病病毒、美洲狮慢病毒、牛泡沫病毒、马泡沫病毒、猫泡沫病毒、棕色大丛猴原猿泡沫病毒、婆罗洲猩猩猿猴泡沫病毒、中央黑猩猩猿猴泡沫病毒、食蟹猴猿猴泡沫病毒、东方黑猩猩猿猴泡沫病毒、绿猴猿猴泡沫病毒、长尾猴猿猴泡沫病毒、日本猕猴猿猴泡沫病毒、恒河猴猿猴泡沫病毒、蜘蛛猴猿猴泡沫病毒、松鼠猴猿猴泡沫病毒、台湾猕猴猿猴泡沫病毒、西方黑猩猩猿猴泡沫病毒、西部低地大猩猩猿猴泡沫病毒、白绒耳狨猴猿猴泡沫病毒、黄胸卷尾猴猿猴泡沫病毒,或其组合。在一些实施方案中,LTR基于来自HFV的LTR。在一些实施方案中,LTR是慢病毒LTR。在一些实施方案中,慢病毒LTR基于来自以下的LTR:人免疫缺陷病毒(HIV)(例如,HIV-1、HIV-2)、猿猴免疫缺陷病毒(SIV)、visna/maedi病毒(VMV)、山羊关节炎脑炎病毒(CAEV)、马传染性贫血病毒(EIAV)、猫免疫缺陷病毒(FIV)、牛免疫缺陷病毒(BIV)、jembrana病病毒、美洲狮慢病毒、或其组合。在一些实施方案中,LTR基于来自HIV-1的LTR(例如,具有GenBank登录号AF033819中的基因组序列的HIV-1)。其他LTR可以在本领域中找到,例如在GenBank上找到,如上所述。
应理解,术语“基于”或“衍生自”表示核酸序列可以包含相对于基础序列的一个或多个修饰。因此,LTR可以包含相对于相应的野生型核酸序列的一个或多个修饰(例如,一个或多个核苷酸的缺失、一个或多个核苷酸的添加、一个或多个核苷酸的取代或其组合)。
在一些实施方案中,LTR与野生型LTR具有至少60%的同一性(例如,70%、80%、90%至100%、95%至100%、98%至100%,或81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、9%、96%、95%、98%或99%的同一性)。
HIV-1RT依赖于在逆转录反应之前用于引发病毒基因组的细胞质tRNA。在一些实施方案中,转基因编码核酸分子可以包含一个或多个逆转录酶引发元件(例如,1、2、3、4、5、6、7、8、9、10个或更多个)。在一些实施方案中,逆转录酶引发元件是内源性tRNA的结合位点。在一些实施方案中,引发元件是赖氨酰tRNA的结合位点。在一些实施方案中,逆转录酶引发元件是合成的引物结合位点。在一些实施方案中,逆转录酶引发元件是合成的引物结合位点,并且提供一个或多个合成引物以与转基因编码核酸分子和编码Pol多聚蛋白组分的核酸分子结合使用。合成的引物是基于合理设计的非天然存在的引物。应当理解,合成的引物可以基于天然存在的序列。合成的引物结合位点是互补序列。在一些实施方案中,本公开的核酸分子在递送至靶细胞之前用一个或多个RNA或DNA引发寡核苷酸引发。在一些实施方案中,本公开的核酸分子与一个或多个短RNA或DNA引发寡核苷酸共同递送。在一些实施方案中,RNA或DNA引发寡核苷酸的长度是5-10、10-15、15-20、20-25、25-30、5-15、5-20、5-25、5-30、10-20、10-25、10-30、15-25或15-30个核苷酸。在一些实施方案中,RNA或DNA引发寡核苷酸的长度是5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸。在一些实施方案中,RNA或DNA引发寡核苷酸可以是30-50或50-80或80-100、100-150或最多约200个核苷酸。在一些实施方案中,RNA或DNA引发寡核苷酸可以是约70-80个核苷酸。在一些实施方案中,RNA或DNA引发寡核苷酸可以是约70、71、72、73、74、75、76、77、78、79或80个核苷酸。在一些实施方案中,RNA或DNA引发寡核苷酸可以是约76个核苷酸。在一些实施方案中,引发寡核苷酸是与RT引发元件互补的工程化寡核苷酸。在一些实施方案中,引发寡核苷酸是GUCCCUGUUCGGGCGCCA(SEQ ID NO:18)或GTCCCTGTTCGGGCGCCA(SEQ ID NO:19)。
可以使用可操作地连接至一个或多个转基因的一个或多个控制序列来控制一个或多个转基因的表达,其中控制序列包括启动子、增强子和其他调节序列。在一些实施方案中,转移核酸包含与启动子连接的单个转基因。在一些实施方案中,转移核酸包含两个或更多个转基因。在一些实施方案中,每个转基因可操作连接至其自身的启动子。在一些实施方案中,单个启动子可操作地连接至两个或更多个转基因。在一些实施方案中,两个或更多个转基因中的一些转基因可操作地连接至它们自身的启动子,并且两个或更多个转基因中的一些转基因可操作地连接至共同的启动子。
两个或更多个转基因可以由一个或多个多顺反子元件分隔。一个或多个多顺反子元件可以是一个或多个IRES和/或一个或多个2A肽编码序列,和/或其他多顺反子元件。IRES是允许在信使RNA(mRNA)序列中间启动蛋白质翻译的核苷酸序列。2A肽是小(18-22个氨基酸)序列,允许通过2A肽序列内的核糖体跳跃事件在单个阅读框中高效、化学计量地产生离散蛋白质产物。也可以使用有助于翻译的任何其他多顺反子元件。
在真核细胞中有功能的任何启动子都可以用于本发明。在一些实施方案中,启动子可以是与转基因天然相关联的启动子,并且可以通过分离给定基因的编码区段和/或外显子上游的5’非编码序列来获得。这样的启动子可以称为内源启动子或天然启动子。在其他实施方案中,转基因可置于重组或异源启动子的控制之下,异源启动子是指在其天然环境中通常不与编码的核酸序列相关联的启动子。在一些实施方案中,启动子是组织特异性或细胞特异性的(例如,对骨髓、造血干细胞(HSC)、T细胞、肝脏、眼组织或肌肉等具有特异性)。在一些实施方案中,启动子是组成型活性启动子。在一些实施方案中,启动子是诱导型启动子。在一些实施方案中,启动子可以是包含来自两个或更多个不同启动子的序列元件的嵌合启动子。合适的启动子包括衍生自病毒基因组的启动子,例如多瘤病毒、腺病毒、鸡痘病毒、牛乳头瘤病毒、禽肉瘤病毒、巨细胞病毒(CMV)(例如,hCMV、mCMV)、劳氏肉瘤病毒(RSV)和猿猴病毒40(SV40),或来自异源哺乳动物的启动子,例如肌动蛋白启动子、人延伸因子-1α(EF1a)启动子、CAG启动子、胸苷激酶(TK)启动子、泛素启动子、人磷酸甘油酸激酶(PGK)启动子、人3-磷酸甘油醛脱氢酶(GAPDH)启动子或核糖体蛋白启动子。替代性地,组织特异性启动子,如视紫红质(Rho)启动子、视紫红质激酶(RhoK)启动子、含锥杆同源框的基因(CRX)启动子、神经视网膜特异性亮氨酸拉链蛋白(NRL)启动子、卵黄样黄斑营养不良2(VMD2)启动子、酪氨酸羟化酶启动子、神经元特异性烯醇化酶(NSE)启动子、星形胶质细胞特异性胶质纤维酸性蛋白(GFAP)启动子、人α1-抗胰蛋白酶(hAAT)启动子、磷酸烯醇丙酮酸羧激酶(PEPCK)启动子、肝脂肪酸结合蛋白启动子、Flt-1启动子、IFN-β启动子(例如,mIFN-β启动子)、Mb启动子、SP-B启动子、SYN1启动子、WASP启动子、SV40/hAlb启动子、SV40/CD43、SV40/CD45、NSE/RU5’启动子、ICAM-2启动子、GPIIb启动子、GFAP启动子、纤连蛋白启动子、内皮糖蛋白启动子、弹性蛋白酶-1启动子、结蛋白启动子、B29启动子、CD14启动子、CD43启动子、CD45启动子、CD68启动子、NphsI启动子、OG-2启动子和mNUS启动子可用于驱动转录。在一些实施方案中,启动子是hCMV启动子。
可以通过将一个或多个增强子序列插入转基因编码核酸分子中来进一步增加或调节一个或多个转基因的转录。增强子可以位于启动子的5’或3’。合适的增强子可以包括来自真核细胞病毒的增强子,例如SV40增强子、CMV早期启动子增强子或土拨鼠肝炎病毒转录后调节元件(WPRE)。在一些实施方案中,增强子是WPRE。
在一些实施方案中,转基因编码核酸分子包含5’LTR、一个或多个逆转录酶引发元件、可操作地连接至一个或多个转基因的一个或多个启动子以及3’LTR。在一些实施方案中,启动子是hCMV启动子。在一些实施方案中,转基因编码核酸分子还包含可操作地连接至启动子和/或转基因的一个或多个增强子。在一些实施方案中,增强子是WPRE元件。在一些实施方案中,转基因编码核酸分子包含5’LTR、一个或多个逆转录酶引发元件、可操作地连接至转基因的启动子、增强子以及3’LTR。在一些实施方案中,转基因编码核酸分子包含5’LTR、一个或多个逆转录酶引发元件、可操作地连接至转基因的hCMV启动子、WPRE增强子以及3’LTR。
转基因编码核酸分子可以包含相对于天然存在的核酸分子的一个或多个化学或生物学修饰。修饰可以提高稳定性和/或转录/翻译效率和/或降低免疫原性。修饰可以包括但不限于修饰的核碱基、修饰的骨架(例如,磷酰胺、硫代磷酸酯、二硫代磷酸酯、O-甲基亚磷酰胺连接和/或肽核酸)。
在一些实施方案中,转基因编码核酸分子是RNA分子(例如,ssRNA分子)。在一些实施方案中,转基因编码RNA分子包含5’LTR、一个或多个逆转录酶引发元件、可操作地连接至一个或多个转基因的一个或多个启动子以及3’LTR。在一些实施方案中,启动子是hCMV启动子。在一些实施方案中,转基因编码RNA还包含可操作地连接至启动子和/或转基因的一个或多个增强子。在一些实施方案中,增强子是WPRE元件。在一些实施方案中,转基因编码RNA分子包含5’LTR、一个或多个逆转录酶引发元件、可操作地连接到转基因的启动子、增强子以及3’LTR。在一些实施方案中,转基因编码RNA分子包含5’LTR、一个或多个逆转录酶引发元件、可操作地连接至转基因的hCMV启动子、WPRE增强子以及3’LTR。
在一些实施方案中,转基因编码RNA分子包含相对于天然存在的RNA的一个或多个化学或生物学修饰。在一些实施方案中,转基因编码RNA分子不包含任何修饰的核糖核苷。在一些实施方案中,转基因编码RNA分子包含一个或多个修饰的核糖核苷。合适的修饰的核糖核苷的实例在说明书的别处提供。在一些实施方案中,RNA分子包含一个或多个修饰,包括但不限于:修饰的核糖核苷、5’末端帽(例如,5’-7mG帽结构);包含聚(rA)尾;将mRNA与药剂(例如,蛋白质或互补核酸分子)复合;包含改变RNA分子结构(例如,形成二级结构)的元件;以及减少C和/或U残基的数量。在一些实施方案中,聚(rA)序列是约10-500个核苷酸。在一些实施方案中,聚(rA)序列是至少10、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100、至少200、至少300、至少400、或至少500个核苷酸。在一些实施方案中,转基因编码RNA分子未加帽。对RNA分子的其他化学和生物学修饰是本领域已知的。
转基因编码核酸模板
在一方面,本公开还提供了用于产生转基因编码核酸分子的核酸模板(例如,重组DNA构建体)。在一些实施方案中,核酸模板用于产生转基因编码RNA分子。在一些实施方案中,转基因编码RNA分子是使用无细胞方法(例如,体外转录或无细胞RNA合成)产生的。参见例如,美国专利公开号20170292138、20180087045 20190144489,其全部内容通过引用并入本文。在一些实施方案中,除RNA产生元件(例如,T7启动子、消化位点等)之外,核酸模板还包含5’UTR、一个或多个逆转录酶引发元件、可操作地连接至一个或多个转基因的一个或多个启动子,以及3’LTR。在一些实施方案中,核酸模板包含T7启动子、5’LTR、一个或多个逆转录酶引发元件、可操作地连接至一个或多个转基因的一个或多个启动子以及3’LTR,以及任选地用于模板线性化的一个或多个限制性消化位点。在一些实施方案中,启动子是hCMV启动子。在一些实施方案中,核酸模板还包含可操作地连接至启动子和/或转基因的一个或多个增强子。在一些实施方案中,增强子是WPRE元件。在一些实施方案中,核酸模板包含T7启动子、5’LTR、一个或多个逆转录酶引发元件、可操作地连接至转基因的启动子、增强子、3’LTR和任选地用于模板线性化的一个或多个限制性消化位点。在一些实施方案中,转基因编码核酸模板包含5’LTR、一个或多个逆转录酶引发元件、可操作地连接至转基因的hCMV启动子、WPRE增强子、3’LTR和任选地用于模板线性化的一个或多个限制性消化位点。编码转基因编码核酸分子的示例性核酸模板显示于图3中。
转基因
在一些实施方案中,转基因编码核酸分子编码一个或多个转基因。在一些实施方案中,转基因编码核酸分子编码两个或更多个转基因(例如,2、3、4、5、6、7、8、9或10个或更多个)。在某些实施方案中,转基因编码核酸分子仅编码一个转基因。
在一些实施方案中,转基因编码治疗性分子、诊断性分子或报告分子。
在一些实施方案中,转基因编码治疗性分子。治疗性分子可以是核酸或多肽。本公开的治疗性分子可用于例如在细胞、组织、器官或受试者中替代缺陷或异常的蛋白质,增强现有的生物学途径,提供新的功能或活性。治疗性分子也可以用于引发免疫应答。转基因的示例性类型包括但不限于编码酶的序列、辅因子、载剂蛋白、转运蛋白、细胞因子、信号传导蛋白、自杀基因产物、耐药蛋白、肿瘤抑制蛋白激素、具有免疫调节特性的肽、致耐受性肽、免疫原性肽、抗体及其抗原结合片段、抗氧化剂分子、工程化免疫球蛋白样分子、融合蛋白、免疫共刺激分子、免疫调节分子、嵌合抗原受体、毒素、肿瘤抑制蛋白、生长因子、膜蛋白、受体、血管活性蛋白、配体蛋白、抗病毒蛋白、核酶、RNA、核糖开关、mRNA、RNA干扰(例如,shRNA、siRNA、微小RNA)分子及其衍生物。
在一些实施方案中,由转基因编码的治疗性蛋白质包括但不限于细胞因子、囊性纤维化跨膜电导调节蛋白(CFTR)、肌营养不良蛋白、抗肌萎缩蛋白相关蛋白、凝血(血凝)因子(例如,因子XIII、因子IX、因子X、因子VIII、因子VIIa、C蛋白、因子VII、B结构域缺失的因子VIII、或凝血因子的高活性或长半衰期变体、或凝血因子的活性或非活性形式)、视黄醛色素上皮特异性65kDa蛋白(RPE65)、促红细胞生成素、LDL受体、脂蛋白脂肪酶、鸟氨酸氨甲酰基转移酶、β-珠蛋白、α-珠蛋白、血影蛋白、α-抗胰蛋白酶、腺苷脱氨酶(ADA)、金属转运蛋白(ATP7A或ATP7)、磺酰胺酶、与溶酶体贮积病有关的酶、次黄嘌呤鸟嘌呤磷酸核糖转移酶、β-25葡萄糖脑苷脂酶、鞘磷脂酶、溶酶体己糖胺酶、支链酮酸脱氢酶、胰岛素样生长因子1或2、血小板衍生的生长因子、表皮生长因子、神经生长因子、神经营养因子3和4、脑源性神经营养因子、神经胶质衍生的生长因子、转化生长因子α和β、α-干扰素、β-干扰素、干扰素-γ、白细胞介素2、白细胞介素4、白细胞介素-12、粒细胞-巨噬细胞集落刺激因子、淋巴毒素、单纯疱疹病毒胸苷激酶、胞嘧啶脱氨酶、白喉毒素、细胞色素P450、脱氧胞苷激酶、肿瘤坏死因子、p53、Rb、Wt-1、NF1、Von Hippel-Lindau(VHL)、SERCA2a、腺瘤性结肠息肉病(APC)、VEGF、微肌营养不良蛋白、微小肌营养不良蛋白、溶酶体酸性脂肪酶、芳基硫酸酯酶A和B、ATP7A和B、胰岛素、葡萄糖激酶、鸟苷酸环化酶2D(GUCY2D)、Rab护送蛋白1、LCA5、鸟氨酸酮酸氨基转移酶、视网膜劈裂症1、USH1C、RP GTP酶调节剂(RPGR)、MERTK、DFNB1、ACHM2、3和4、PKD-1或PKD-2、TPP1、CLN2、与溶酶体贮积病有关的基因产物(例如,硫酸酯酶、N-乙酰葡萄糖胺-1-磷酸转移酶、组织蛋白酶A、GM2-AP、NPC1、VPC2、鞘脂激活蛋白)和任何其他肽或蛋白质,或其可以对有此需要的受试者具有治疗效果的衍生物。
应当理解,术语“其衍生物”包括基础多肽的任何治疗性或功能性活性片段,或修饰。多肽的衍生物相对于相应的野生型多肽序列可以包含一个或多个修饰(例如,一个或多个核苷酸的缺失、一个或多个核苷酸的添加、一个或多个核苷酸的取代、或其组合)。在一些实施方案中,衍生物是同源物。同源性通常从两个或更多个核酸或蛋白质(或其序列)之间的序列相似性推断。可用于建立同源性的序列之间精确的相似性百分比因所讨论的核酸和蛋白质而异,但通常仅使用25%的序列相似性来建立同源性。更高水平的序列相似性,例如30%、40%、50%、60%、70%、80%、90%、95%或99%或更高也可以用于建立同源性。在一些实施方案中,衍生物是与基础多肽至少60%相同(例如,70%、80%、90%至100%、95%至100%、98%至100%,或81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同)的多肽。确定序列相似性百分比的方法是本领域普通技术人员所熟知的。在一些实施方案中,相似性可以使用例如本文描述的那些算法来确定,包括例如BLASTP和BLASTN算法,例如使用默认参数。在一些方面,野生型HIV-1毒株是NL4-3。
在一些实施方案中,转基因编码β-珠蛋白或其衍生物。β-珠蛋白基因可用于基因治疗以治疗β-地中海贫血或镰状细胞病。在一些实施方案中,β-珠蛋白基因是人β-珠蛋白基因。在一些实施方案中,编码β-珠蛋白或其衍生物的转基因可操作地连接至hCMV启动子。在一些实施方案中,编码β-珠蛋白或其衍生物的转基因可操作地连接至组织特异性或细胞特异性启动子。在一些实施方案中,启动子对骨髓或HSC具有特异性。在一些实施方案中,编码β-珠蛋白或其衍生物的转基因可操作地连接至天然β-珠蛋白启动子。在一些实施方案中,编码β珠蛋白或其衍生物的转基因进一步可操作地连接至WPRE增强子。在一些实施方案中,转基因编码具有对应于NCBI参考序列号NP_000509.1或其片段的氨基酸序列的β-珠蛋白多肽。在一些实施方案中,转基因编码具有与NCBI参考序列号NP_000509.1或其片段至少60%相同(例如,70%、80%、90%至100%、95%至100%、98%至100%,或81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同)的氨基酸序列的β-珠蛋白多肽。在一些实施方案中,转基因包含具有对应于NCBI参考序列号NM_000518.5或其片段的核酸序列的β-珠蛋白基因。在一些实施方案中,转基因包含具有与NCBI参考序列号NP_000509.1或其片段至少60%相同(例如,70%、80%、90%至100%、95%至100%、98%至100%,或81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同)的氨基酸序列的β-珠蛋白基因。
在一些实施方案中,转基因编码CFTR或其衍生物。CFTR基因可用于基因疗法以治疗囊性纤维化。在一些实施方案中,编码CFTR或其衍生物的转基因可操作地连接至hCMV启动子。在一些实施方案中,编码CFTR或其衍生物的转基因可操作地连接至组织特异性或细胞特异性启动子。在一些实施方案中,启动子对上皮细胞具有特异性。在一些实施方案中,编码CFTR或其衍生物的转基因可操作地连接至天然CFTR启动子。在一些实施方案中,编码CFTR或其衍生物的转基因进一步可操作地连接至WPRE增强子。在一些实施方案中,转基因编码具有对应于NCBI参考序列号NP_000483.3或其片段的氨基酸序列的CFTR。在一些实施方案中,转基因编码具有与NCBI参考序列号NP_000483.3或其片段至少60%相同(例如,70%、80%、90%至100%、95%至100%、98%至100%,或81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同)的氨基酸序列的CFTR多肽。在一些实施方案中,转基因包含具有对应于NCBI参考序列号NM_000492.4或其片段的核酸序列的CFTR基因。在一些实施方案中,转基因包含具有与NCBI参考序列号NP_000492.4或其片段至少60%相同(例如,70%、80%、90%至100%、95%至100%、98%至100%,或81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同)的氨基酸序列的CFTR基因。
在一些实施方案中,转基因编码因子VIII或其衍生物。因子VIII基因可用于基因疗法以治疗血友病B。在一些实施方案中,因子VIII基因是人因子VIII基因。在一些实施方案中,编码因子VIII或其衍生物的转基因可操作地连接至hCMV启动子。在一些实施方案中,编码因子VIII或其衍生物的转基因可操作地连接至组织特异性或细胞特异性启动子。在一些实施方案中,启动子对肝具有特异性。在一些实施方案中,启动子对骨髓或HSC具有特异性。在一些实施方案中,编码因子VIII或其衍生物的转基因可操作地连接至天然因子VIII启动子。在一些实施方案中,编码因子VIII或其衍生物的转基因进一步可操作地连接至WPRE增强子。在一些实施方案中,转基因编码具有对应于NCBI参考序列号NP_000123.1或其片段的氨基酸序列的因子VIII多肽。在一些实施方案中,转基因编码具有对应于NCBI参考序列号NP_063916.1或其片段的氨基酸序列的因子VIII多肽。在一些实施方案中,转基因编码具有与NCBI参考序列号NP_000123.1或NCBI参考序列号NP_063916.1或其片段至少60%相同(例如,70%、80%、90%至100%、95%至100%、98%至100%,或81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同)的氨基酸序列的因子VIII多肽。在一些实施方案中,转基因包含具有对应于NCBI参考序列号NM_000132.4或其片段的核酸序列的因子VIII基因。在一些实施方案中,转基因包含具有对应于NCBI参考序列号NM_019863.2或其片段的核酸序列的因子VIII基因。在一些实施方案中,转基因包含具有与NCBI参考序列号NM_000132.4或NCBI参考序列号NM_019863.2或其片段至少60%相同(例如,70%、80%、90%至100%、95%至100%、98%至100%,或81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同)的核酸序列的因子VIII基因。
在一些实施方案中,转基因编码肌营养不良蛋白或其衍生物。肌营养不良蛋白基因可用于基因疗法以治疗杜氏肌营养不良症(DMD)。在一些实施方案中,肌营养不良蛋白基因是微肌营养不良蛋白或微小肌营养不良蛋白基因(Vincent等人,Nature Genetics 5:130(1993);Wang等人,Proc Natl Acad Sci USA97:13714-9(2000)[微小肌营养不良蛋白];Harper等人,Nat Med.8:253-61(2002)[微肌营养不良蛋白])。在一些实施方案中,肌营养不良蛋白基因是人肌营养不良蛋白基因。在一些实施方案中,编码肌营养不良蛋白或其衍生物的转基因可操作地连接至hCMV启动子。在一些实施方案中,编码肌营养不良蛋白或其衍生物的转基因可操作地连接至组织特异性或细胞特异性启动子。在一些实施方案中,启动子对肌肉细胞具有特异性。在一些实施方案中,编码肌营养不良蛋白或其衍生物的转基因可操作地连接至天然肌营养不良蛋白启动子。在一些实施方案中,编码肌营养不良蛋白或其衍生物的转基因进一步可操作地连接至WPRE增强子。在一些实施方案中,转基因编码具有对应于NCBI参考序列号NP_000100.3或其片段的氨基酸序列的肌营养不良蛋白多肽。在一些实施方案中,转基因编码具有与NCBI参考序列号NP_000100.3或其片段至少60%相同(例如,70%、80%、90%至100%、95%至100%、98%至100%,或81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同)的氨基酸序列的肌营养不良蛋白多肽。在一些实施方案中,转基因包含具有对应于NCBI参考序列号NM_000109.4或其片段的核酸序列的肌营养不良蛋白基因。在一些实施方案中,转基因包含具有与NCBI参考序列号NP_000109.4或其片段至少60%相同(例如,70%、80%、90%至100%、95%至100%、98%至100%,或81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同)的氨基酸序列的肌营养不良蛋白基因。
在一些实施方案中,转基因编码RP GTP酶调节剂(RPGR)或其衍生物。RPGR基因可用于视网膜色素变性的基因治疗。在一些实施方案中,RPGR基因是人RPGR基因。在一些实施方案中,编码RPGR或其衍生物的转基因可操作地连接至hCMV启动子。在一些实施方案中,编码RPGR或其衍生物的转基因可操作地连接至组织特异性或细胞特异性启动子。在一些实施方案中,启动子对眼组织具有特异性。在一些实施方案中,编码RPGR或其衍生物的转基因可操作地连接至天然RPGR启动子。在一些实施方案中,编码RPGR或其衍生物的转基因进一步可操作地连接至WPRE增强子。在一些实施方案中,转基因编码具有对应于NCBI参考序列号NP_000319.1或其片段的氨基酸序列的RPGR多肽。在一些实施方案中,转基因编码具有与NCBI参考序列号NP_000319.1或其片段至少60%相同(例如,70%、80%、90%至100%、95%至100%、98%至100%,或81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同)的氨基酸序列的RPGR多肽。在一些实施方案中,转基因包含具有对应于NCBI参考序列号NM_000328.3或其片段的核酸序列的RPGR基因。在一些实施方案中,转基因包含具有与NCBI参考序列号NP_000328.3或其片段至少60%相同(例如,70%、80%、90%至100%、95%至100%、98%至100%,或81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同)的氨基酸序列的RPGR基因。
在一些实施方案中,转基因编码嵌合抗原受体(CAR)。CAR可用于治疗癌症。在一些实施方案中,编码CAR的转基因可操作地连接至hCMV启动子。在一些实施方案中,编码CAR的转基因可操作地连接至组织特异性或细胞特异性启动子。在一些实施方案中,启动子对HSC或T细胞(例如,细胞毒性T细胞)具有特异性。在一些实施方案中,编码CAR的转基因进一步可操作地连接至WPRE增强子。
在一些实施方案中,转基因编码报告分子。报告分子可以是核酸或多肽。报告分子是指可用于测量基因表达并通常产生可测量信号如荧光、发光或颜色的分子。在一些实施方案中,多肽是萤光素酶。在一些实施方案中,多肽是荧光蛋白。荧光蛋白是本领域已知的,并且是荧光团的亚类,荧光团是具有在激发时重新发光的能力的荧光化学化合物。荧光团将吸收第一特定波长的激发光能,然后重新发射第二、更长特定波长的光能。每种类型的荧光团响应并发射不同波长的光,这取决于其化学结构的性质和环境。在一些实施方案中,可用于本发明的荧光蛋白包括但不限于绿色荧光蛋白(例如,wt-GFP、EGFP、Emerald、Superfolder GFP、Azami Green、mWasabi、TagGFP、TurboGFP、AcGFP、ZsGreen、T-Sapphire等)、蓝色荧光蛋白(例如,EBFP、EBFP2、Azurite、mTagBFP等)、青色荧光蛋白(例如,ECFP、mECFP、Cerulean、mTurquoise、CyPet、AmCyan1、Midori-Ishi Cyan、TagCFP、mTFP1(Teal)等)、黄色荧光蛋白(例如,EYFP、Topaz、Venus、mCitrine、YPet、TagYFP、PhiYFP、ZsYellow1、mBanana等)、橙色荧光蛋白(例如,Kusabira Orange、Kusabira Orange2、mOrange、mOrange2、dTomato、dTomato-Tandem、TagRFP、TagRFP-T、DsRed、DsRed2、DsRed-Express(T1)、DsRed-Monomer、mTangerine等)或红色荧光蛋白(例如,mRuby、mApple、mStrawberry、AsRed2、mRFP1、JRed、mCherry、HcRed1、mRaspberry、dKeima-Tandem、HcRed-Tandem、mPlum、AQ143等)。在一些实施方案中,转基因编码GFP。在一些实施方案中,报告分子可以框内融合到编码其他蛋白质的序列以鉴定蛋白质在细胞、组织、器官或生物体中的位置。根据本公开使用的报告分子包括本文描述的或本领域普通技术人员已知的任何报告分子。
使用方法
本公开的核酸和组合物可用于递送具有生物学效应的任何转基因以治疗和/或改善与基因表达相关的任何病症相关的症状。本公开的方法可用于,例如,通过整合和稳定表达转基因来替代缺陷或异常的蛋白质,增强现有的生物学途径,提供新的功能或活性。本公开的方法也可以用于瞬时表达转基因并引发免疫应答。
在一方面,本公开提供了在有此需要的受试者中表达转基因的方法,该方法包括向受试者施用有效量的组合物,该组合物包含编码用于转基因编码核酸的逆转录和整合的逆转录病毒Pol多聚蛋白组分的一个或多个核酸分子以及包含侧接LTR序列的一个或多个转基因序列的转基因编码核酸,从而在受试者中表达一个或多个转基因。在一些实施方案中,编码逆转录病毒Pol多聚蛋白组分的核酸分子还编码一个或多个辅助逆转录病毒蛋白。在一些实施方案中,组合物包含编码一个或多个辅助逆转录病毒蛋白的一个或多个额外的核酸分子。在一些方面,所公开的转基因可以在有此需要的受试者中表达。包含编码用于转基因编码核酸的逆转录和整合的逆转录病毒Pol多聚蛋白组分的一个或多个核酸分子以及包含侧接LTR序列的一个或多个转基因序列的转基因编码核酸的组合物可用于在受试者中表达一个或多个转基因。
在一方面,本公开提供了用于在细胞中表达转基因的方法,该方法包括向细胞递送组合物,该组合物包含编码用于转基因编码核酸的逆转录和整合的逆转录病毒Pol多聚蛋白组分的一个或多个核酸分子以及包含侧接LTR序列的一个或多个转基因序列的转基因编码核酸,从而在细胞中表达一个或多个转基因。在一些实施方案中,编码逆转录病毒Pol多聚蛋白组分的一个或多个核酸分子还编码一个或多个辅助逆转录病毒蛋白。在一些实施方案中,组合物包含编码一个或多个辅助逆转录病毒蛋白的一个或多个额外的核酸分子。合适的细胞类型包括但不限于HSC、肝细胞、视觉细胞(例如,视网膜细胞)、肌肉细胞、上皮细胞、T细胞(例如,细胞毒性T细胞)等。在一些方面,所公开的转基因可以在细胞中表达。包含编码用于转基因编码核酸的逆转录和整合的逆转录病毒Pol多聚蛋白组分的一个或多个核酸分子以及包含侧接LTR序列的一个或多个转基因序列的转基因编码核酸的组合物可用于在细胞中表达一个或多个转基因。
在一方面,本公开提供了用于在组织中表达转基因的方法,该方法包括向组织递送组合物,该组合物包含编码用于转基因编码核酸的逆转录和整合的逆转录病毒Pol多聚蛋白组分的一个或多个核酸分子以及包含侧接LTR序列的一个或多个转基因序列的转基因编码核酸,从而在组织中表达一个或多个转基因。在一些实施方案中,编码逆转录病毒Pol多聚蛋白组分的核酸分子还编码一个或多个辅助逆转录病毒蛋白。在一些实施方案中,组合物包含编码一个或多个辅助逆转录病毒蛋白的一个或多个额外的核酸分子。合适的组织包括但不限于骨髓、肌肉、眼组织、心脏组织、肝组织、上皮组织、结缔组织、神经组织、胃肠组织等。在一些方面,所公开的转基因可以在组织中表达。包含编码用于转基因编码核酸的逆转录和整合的逆转录病毒Pol多聚蛋白组分的一个或多个核酸分子以及包含侧接LTR序列的一个或多个转基因序列的转基因编码核酸的组合物可用于在组织中表达一个或多个转基因。
在一方面,本公开提供了用于在器官中表达转基因的方法,该方法包括向器官递送组合物,该组合物包含编码用于转基因编码核酸的逆转录和整合的逆转录病毒Pol多聚蛋白组分的一个或多个核酸分子以及包含侧接LTR序列的一个或多个转基因序列的转基因编码核酸,从而在器官中表达一个或多个转基因。在一些实施方案中,编码逆转录病毒Pol多聚蛋白组分的核酸分子还编码一个或多个辅助逆转录病毒蛋白。在一些实施方案中,组合物包含编码一个或多个辅助逆转录病毒蛋白的一个或多个额外的核酸分子。合适的器官包括但不限于眼睛、心脏、肺、肝脏、胃、脾脏、胰腺、小肠、大肠、肾脏、骨髓、脑等。在一些方面,所公开的转基因可以在器官中表达。包含编码用于转基因编码核酸的逆转录和整合的逆转录病毒Pol多聚蛋白组分的一个或多个核酸分子以及包含侧接LTR序列的一个或多个转基因序列的转基因编码核酸的组合物可用于在器官中表达一个或多个转基因。
在一方面,本公开提供了使用组合物治疗病症的方法,该组合物包含编码用于转基因编码核酸的逆转录和整合的逆转录病毒Pol多聚蛋白组分的一个或多个核酸分子以及包含侧接LTR序列的一个或多个转基因序列的转基因编码核酸,该方法包括将组合物施用于需要治疗的受试者,从而在受试者中表达转基因。在一些实施方案中,编码逆转录病毒Pol多聚蛋白组分的核酸分子还编码一个或多个辅助逆转录病毒蛋白。在一些实施方案中,组合物包含编码一个或多个辅助逆转录病毒蛋白的一个或多个额外的核酸分子。在一些方面,所公开的转基因可用于治疗病症。包含编码用于转基因编码核酸的逆转录和整合的逆转录病毒Pol多聚蛋白组分的一个或多个核酸分子以及包含侧接LTR序列的一个或多个转基因序列的转基因编码核酸的组合物可用于治疗病症。
在一些实施方案中,将一个或多个转基因整合到(例如,受试者中的)靶细胞的基因组中。在一些实施方案中,一个或多个转基因稳定表达至少一周、至少两周、至少一个月、至少6个月、至少一年、至少2年、至少3年、至少4年或至少5年。在一些实施方案中,一个或多个转基因稳定表达1-2周、2-4周、1-3个月、3-6个月、6-9个月、9-12个月、1-2年、2-3年、3-4年或4-5年或更长时间。在一些实施方案中,一个或多个转基因在受试者的一生中稳定表达。在一些实施方案中,本公开的组合物用于将一个或多个转基因整合到(例如,受试者中的)靶细胞的基因组中。
可以治疗与基因表达相关(例如,其中可能期望转基因的整合和稳定表达)的任何疾病、病症或病况。在一些实施方案中,待治疗的疾病、病症或病况是基因病症。基因疾病、病症或病况可以是遗传性的或非遗传性的。在一些实施方案中,疾病、病症或病况是神经退行性、增殖性、炎性或自身免疫性疾病、病症或病况。在一些实施方案中,待治疗的病症包括但不限于囊性纤维化(和其他肺部疾病)、血友病A、血友病B、β-地中海贫血、镰状细胞病、贫血和其他凝血病症、阿尔茨海默病、帕金森病、亨廷顿病、肌萎缩性侧索硬化症、癫痫和其他神经系统病症、癌症、糖尿病、肌营养不良症(例如,杜氏、贝克氏)、莱伯先天性黑蒙、溶酶体贮积病、亚瑟综合征1C、回旋萎缩、连接蛋白26耳聋、全色盲、X连锁视网膜劈裂症、多囊肾病、戈谢病、赫勒氏病、腺苷脱氨酶缺乏症、糖原贮积病和其他代谢缺陷、庞贝氏病、充血性心力衰竭、视网膜色素变性、实体器官(例如,脑、肝、肾、心脏)疾病等。在一些实施方案中,待治疗的病况是癌症。在一些实施方案中,癌症是血癌(例如,淋巴瘤、白血病、多发性骨髓瘤等)、乳腺癌、前列腺癌、消化系统癌症(例如,食道癌、胃癌、结直肠癌)、肝癌、宫颈癌、卵巢癌或子宫癌、胰腺癌、肺癌、脑癌(例如,胶质母细胞瘤)、皮肤癌(例如,黑色素瘤)或肌肉或神经的肉瘤等。
在一些实施方案中,本公开提供了在有此需要的受试者中治疗β-地中海贫血或镰状细胞病的方法,包括施用包含编码用于转基因编码核酸的逆转录和整合的逆转录病毒Pol多聚蛋白组分的一个或多个核酸分子以及包含侧接LTR序列的编码β-珠蛋白或其衍生物的转基因的核酸分子的组合物。在一些实施方案中,本公开提供了在有此需要的受试者中治疗镰状细胞病的方法,包括施用包含编码用于转基因编码核酸的逆转录和整合的逆转录病毒Pol多聚蛋白组分的一个或多个核酸分子以及包含侧接LTR序列的编码β-珠蛋白或其衍生物的转基因的核酸分子的组合物。在一些实施方案中,编码逆转录病毒Pol多聚蛋白组分的核酸分子还编码一个或多个辅助逆转录病毒蛋白。在一些实施方案中,组合物包含编码一个或多个辅助逆转录病毒蛋白的一个或多个额外的核酸分子。在一些方面,本公开的组合物可用于治疗β-地中海贫血或镰状细胞病。
在一些实施方案中,本公开提供了在有此需要的受试者中治疗囊性纤维化的方法,包括施用包含编码用于转基因编码核酸的逆转录和整合的逆转录病毒Pol多聚蛋白组分的一个或多个核酸分子以及包含侧接LTR序列的编码CFTR或其衍生物的转基因的核酸分子的组合物。在一些实施方案中,编码逆转录病毒Pol多聚蛋白组分的核酸分子还编码一个或多个辅助逆转录病毒蛋白。在一些实施方案中,组合物包含编码一个或多个辅助逆转录病毒蛋白的一个或多个额外的核酸分子。在一些方面,本公开的组合物可用于治疗囊性纤维化。
在一些实施方案中,本公开提供了在有此需要的受试者中治疗血友病B的方法,包括施用包含编码用于转基因编码核酸的逆转录和整合的逆转录病毒Pol多聚蛋白组分的一个或多个核酸分子以及包含侧接LTR序列的编码因子VIII或其衍生物的转基因的核酸分子的组合物。在一些实施方案中,编码逆转录病毒Pol多聚蛋白组分的核酸分子还编码一个或多个辅助逆转录病毒蛋白。在一些实施方案中,组合物包含编码一个或多个辅助逆转录病毒蛋白的一个或多个额外的核酸分子。在一些方面,本公开的组合物可用于治疗血友病B。
在一些实施方案中,本公开提供了在有此需要的受试者中治疗DMD的方法,包括施用包含编码用于转基因编码核酸的逆转录和整合的逆转录病毒Pol多聚蛋白组分的一个或多个核酸分子以及包含侧接LTR序列的编码肌营养不良蛋白或其衍生物的转基因的核酸分子的组合物。在一些实施方案中,编码逆转录病毒Pol多聚蛋白组分的核酸分子还编码一个或多个辅助逆转录病毒蛋白。在一些实施方案中,组合物包含编码一个或多个辅助逆转录病毒蛋白的一个或多个额外的核酸分子。在一些方面,本公开的组合物可用于治疗DMD。
在一些实施方案中,本公开提供了在有此需要的受试者中治疗视网膜色素变性的方法,包括施用包含编码用于转基因编码核酸的逆转录和整合的逆转录病毒Pol多聚蛋白组分的一个或多个核酸分子以及包含侧接LTR序列的编码RPGR或其衍生物的转基因的核酸分子的组合物。在一些实施方案中,编码逆转录病毒Pol多聚蛋白组分的核酸分子还编码一个或多个辅助逆转录病毒蛋白。在一些实施方案中,组合物包含编码一个或多个辅助逆转录病毒蛋白的一个或多个额外的核酸分子。在一些方面,本公开的组合物可用于治疗视网膜色素变性。
在一些实施方案中,本公开提供了在有此需要的受试者中治疗癌症的方法,包括施用包含编码用于转基因编码核酸的逆转录和整合的逆转录病毒Pol多聚蛋白组分的一个或多个核酸分子以及包含侧接LTR序列的编码嵌合抗原受体(CAR)的转基因的核酸分子的组合物。在一些实施方案中,待治疗的病症是癌症。在一些实施方案中,癌症是血癌(例如,淋巴瘤、白血病、多发性骨髓瘤等)、乳腺癌、前列腺癌、消化系统癌症(例如,食道癌、胃癌、结直肠癌)、肝癌、宫颈癌、卵巢癌或子宫癌、胰腺癌、肺癌、脑癌(例如,胶质母细胞瘤)、皮肤癌(例如,黑色素瘤)、肌肉或神经的肉瘤等。在一些实施方案中,编码逆转录病毒Pol多聚蛋白组分的核酸分子还编码一个或多个辅助逆转录病毒蛋白。在一些实施方案中,组合物包含编码一个或多个辅助逆转录病毒蛋白的一个或多个额外的核酸分子。在一些方面,本公开的组合物可用于治疗癌症。
在一些实施方案中,一旦整合到(例如,受试者中的)靶细胞的基因组中,一个或多个转基因就瞬时表达。瞬时表达足以引发免疫应答。可以治疗将从免疫应答中获益的任何疾病、病症或病况。因此,在一些实施方案中,本公开提供了通过瞬时表达一个或多个转基因在有此需要的受试者中引发免疫应答的方法,该方法包括向受试者施用有效量的包含编码逆转录病毒Pol多聚蛋白组分的一个或多个核酸分子以及包含侧接长末端重复序列的转基因的核酸分子的组合物,从而在受试者中表达转基因。在一些实施方案中,疾病、病症或病况是癌症并且转基因可编码肿瘤抗原。在一些实施方案中,疾病、病症或病况是感染性疾病(例如,由诸如病原体的感染原引起的疾病)并且转基因可以编码与感染性疾病相关的抗原。受试者可处于感染感染性疾病的风险中并且可以预防性地施用组合物。在一些方面,本公开的组合物可用于引发免疫应答。
非病毒递送系统
本公开的核酸分子经由非病毒递送系统递送至细胞、组织或受试者。可以使用本领域已知的任何合适的非病毒递送系统将本公开的核酸分子离体或体内递送至靶组织和/或细胞。
在一些实施方案中,核酸分子(例如,RNA、ssDNA、线性dsDNA)被包装在脂质纳米颗粒(LNP)中。用于包装DNA分子和RNA分子(例如,mRNA分子)的合适的LNP是本领域已知的。在一些实施方案中,LNP包含一种或多种可电离脂质或阳离子脂质(例如,N-[1-(2,3-二油酰氧基)丙基]-N,N,N-三甲基氯化铵(DOTMA);1,2-二油酰-3-三甲基铵-丙烷(DOTAP);1,2-二油酰基-3-二甲基铵-丙烷(DODAP);DODMA;Dlin-MC3-DMA(MC3);LP-01;基于二酮哌嗪的可电离脂质,cKK-E12);一种或多种中性磷脂(例如,胆固醇)、一种或多种两性离子脂质分子(例如,1,2-二油酰-sn-甘油-3-磷酰乙醇胺(DOPE))和/或一种或PEG修饰的脂质。在一些实施方案中,LNP包含脂质单层内的聚乳酸(PLA)或聚(乳酸-共-乙醇酸)(PGLA)聚合物。在一些实施方案中,可电离脂质是pH依赖性可电离材料。
在一些实施方案中,包括但不限于LNP的非病毒递送系统与特异性结合靶细胞或组织上的受体的多肽(例如,病毒包膜或衣壳蛋白、抗体或其抗原结合片段,或其他靶向部分)缀合。在一些实施方案中,LNP与促进靶向特定细胞、组织或器官的小分子缀合。合适的细胞类型包括但不限于HSC、肝脏细胞(例如,肝细胞)、视觉细胞(例如,视网膜细胞)、肌肉细胞、上皮细胞、T细胞(例如,细胞毒性T细胞)等。合适的组织包括但不限于骨髓、肌肉、眼组织、心脏组织、肝组织、上皮组织、结缔组织、神经组织、胃肠组织等。合适的器官包括但不限于眼睛、心脏、肺、肝、胃、脾、胰腺、小肠、大肠、肾等。在一些实施方案中,靶细胞或组织包括但不限于骨髓、HSC、上皮细胞、肝脏细胞(例如,肝细胞)、视觉细胞(例如,视网膜细胞)、肌肉细胞、T细胞(例如,细胞毒性T细胞)。
在一些实施方案中,本公开的核酸分子可以裸露地、在水溶液(例如缓冲液,例如蔗糖柠檬酸盐缓冲液)中递送,或者与脂质、聚合物、肽或促进进入细胞的其他化合物组合递送。可以使用任何合适的技术将核酸分子引入靶细胞或受试者,例如通过直接注射、显微注射、转染、核转染、电穿孔、脂质体转染、高压喷雾、生物溶解(biolystics)等。在一些实施方案中,核酸分子与阳离子两亲物复合(complex)。在一些实施方案中,核酸分子与转染剂(例如,LipofectamineTM、LipofectinTM、jetPEI、RNAiMAX和Invivofectamine、MegaFectinTM、TransITTM)复合。在一些实施方案中,核酸分子与细胞穿透肽(例如,聚阳离子肽或两亲肽)复合。
在一些实施方案中,本公开的核酸分子被包装在脂质体、脂质纳米颗粒、多肽纳米颗粒、无机材料(例如,二氧化硅纳米颗粒、金纳米颗粒和无机基载剂如CaP)、合成聚合物、树状聚合物、阳离子纳米乳液、聚合物纳米颗粒、聚合物和脂质混合载剂或其组合中。在一些实施方案中,本公开的核酸分子被包装在病毒衣壳中。
在一些实施方案中,本公开的核酸分子被包装在聚合物纳米颗粒中,包括但不限于基于聚乙烯亚胺(PEI)、聚丙烯酸酯、聚(β-氨基酯)(PBAE)和聚(天冬酰胺)(PAsp)的纳米颗粒中。
在一些实施方案中,本公开的核酸分子包装在脂质体中。脂质体是人工制备的囊泡,其可以主要由脂质双层组成。脂质体可以有不同的尺寸,例如但不限于多层囊泡(MLV),其直径可以为数百纳米,并且可以含有一系列由狭窄的水性隔室分隔的同心双层,直径可以小于50nm的小单细胞囊泡(SUV),并且直径可以在50和500nm之间的大单层囊泡(LUV)。脂质体设计可以包括但不限于调理素或配体,以改善脂质体对不健康组织的附着或激活例如但不限于内吞作用的事件。脂质体可以含有低或高pH值以改善核酸分子的递送。在一些实施方案中,本公开的核酸分子被包装在脂质体中,例如从1,2-二油酰氧基-N,N-二甲基氨基丙烷(DODMA)脂质体、来自Marina Biotech(Bothell,Wash.)的DiLa2脂质体、1,2-二亚油酰氧基-3-二甲氨基丙烷(DLin-DMA)、2,2-二亚油基-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(DLin-KC2-DMA)和MC3(US20100324120;其内容通过整体引用并入本文)形成的那些。在一些实施方案中,脂质体是PEG化的。
本公开的核酸分子(例如,包装在脂质体、脂质纳米颗粒、阳离子纳米乳液、聚合物纳米颗粒等中的)可以全身或局部、静脉内、皮内、动脉内、病灶内、肿瘤内、颅内、关节内、前列腺内、胸膜内、气管内、鼻内、玻璃体内、阴道内、直肠内、局部(topically)、肌肉内、腹膜内、皮下、结膜下、囊内、经粘膜、心包内、脐带内、眼内、经口、局部(locally)、通过吸入(例如,气雾剂吸入)、通过注射、通过输注、通过连续输注、直接局部灌注水浴靶细胞、经由导管、经由灌洗、在乳膏中,或通过本领域普通技术人员已知的任何其他方法或前述方法的任何组合施用(参见例如,Remington’s Pharmaceutical Sciences(1990),通过引用并入本文)。
在一些实施方案中,本公开的核酸分子(例如,包装在脂质体、脂质纳米颗粒、阳离子纳米乳液、聚合物纳米颗粒中)以包含药学上可接受的载剂的药物组合物的形式施用。如本文所用,“药学上可接受的载剂”包括任何和所有溶剂、分散介质、包衣、表面活性剂、抗氧化剂、防腐剂(例如,抗菌剂、抗真菌剂)、等渗剂、吸收延迟剂、盐、防腐剂、药物、药物稳定剂(例如,抗氧化剂)、凝胶、粘合剂、赋形剂、崩解剂、润滑剂、甜味剂、调味剂、染料等本领域普通技术人员已知的材料及其组合(参见例如,Remington’s Pharmaceutical Sciences(1990),通过引用并入本文)。除非任何常规载剂与活性成分不相容,否则预期其在治疗或药物组合物中的用途。用于具有生物活性分子和合适载剂的脂质纳米颗粒的组合物公开于例如美国专利号7,404,969中,其通过引用并入本文。
本公开的核酸分子可以施用一次,或者替代性地它们可以在多次施用中施用。如果多次施用,化合物可以经由不同的途径施用。例如,第一次(或最初几次)施用可以直接进入受影响的组织,而后来的施用可以是全身性的。
试剂盒
在一方面,本公开提供了用于递送一个或多个转基因的试剂盒。在一些实施方案中,该试剂盒包括根据本公开的组合物,该组合物包含有效量的编码逆转录病毒Pol多聚蛋白组分的一个或多个核酸分子以及编码侧接LTR序列的一个或多个转基因的核酸分子。在一些实施方案中,该试剂盒包括单位剂量形式的根据本公开的组合物,该组合物包含有效量的编码逆转录病毒Pol多聚蛋白组分的一个或多个核酸分子以及编码侧接LTR序列的一个或多个转基因的核酸分子。在一些实施方案中,编码逆转录病毒Pol多聚蛋白组分的核酸分子还编码一个或多个辅助逆转录病毒蛋白。在一些实施方案中,组合物包含编码一个或多个辅助逆转录病毒蛋白的一个或多个额外的核酸分子。在一些实施方案中,试剂盒包括包含两种核酸分子的组合物。在一些实施方案中,试剂盒包括包含两种或更多种核酸分子(例如,2、3、4或5种)的组合物。在一些实施方案中,核酸分子被包装或配制用于在脂质纳米颗粒中递送。在一些实施方案中,试剂盒包括包含组合物的无菌容器。这样的容器可以是盒、安瓿、瓶、小瓶、管、包、袋、泡罩包装或本领域已知的其他合适的容器形式。此类容器可以由塑料、玻璃、层压纸、金属箔或其他适合盛放药物的材料制成。如果期望,该组合物与将细胞施用于有此需要的受试者的说明书一起提供。
实施例
为了可以更充分地理解本文描述的本发明,提出以下实施例。本申请中描述的实施例用于说明本文提供的方法、组合物和系统,不应以任何方式解释为限制其范围。
实施例1:用于体内基因治疗的mRNA编码的最小慢病毒机制
转基因编码模板如图3所示设计。转基因编码核酸模板从5’到3’包含5’LTR、逆转录酶引发元件、可操作地连接至转基因的启动子、增强子以及3’LTR。额外的RNA产生元件包括5’T7 RNA聚合酶启动子和3’消化位点。由转基因编码核酸模板产生的RNA分子包含未修饰的核苷,因为逆转录病毒逆转录酶不能复制修饰的核糖核酸酶(Swanstrom等人,J.Biol.Chem.256:1115–1121(1981))。此外,RNA具有5’-7mG帽结构和聚(rA)尾以增强RNA稳定性。
编码Pol多聚蛋白(用于逆转录/整合)的两个最小核酸模板如图4所示设计。规范基因构建提供了线内表达的gag和pol,这需要Pol多聚蛋白表达的翻译滑动。新型设计通过将来自单独构建体的pol加工为多聚蛋白单元(或甚至可以是单独的单元,如下文所述)来增加pol表达。这些新型设计编码不同的UTR,以增加mRNA的稳定性和翻译。这种新型设计任选地与pol一起编码逆转录和整合所必需的辅助蛋白单元,其可以与2A顺式。第一核酸模板从5’到3’包含5’UTR、编码Pol多聚蛋白形式的逆转录病毒Pol多聚蛋白组分的核酸序列以及3’UTR。额外的RNA产生元件包括5’T7 RNA聚合酶启动子和3’消化位点。第二核酸模板从5’到3’包含5’UTR、编码一个或多个逆转录病毒辅助蛋白的核酸序列、编码Pol多聚蛋白形式的逆转录病毒Pol多聚蛋白组分的核酸序列、以及3’UTR。辅助蛋白单元包括不由pol多聚蛋白基因编码的逆转录病毒元件,实例包括但不限于gag多聚蛋白(p55)、MA(p17)、CA(p24)、NC(p9)、p6、tat、nef、vpr、vif和vpu。额外的RNA产生元件包括5’T7 RNA聚合酶启动子和3’消化位点。从这些核酸模板产生的mRNA分子包含修饰的核苷(例如,假尿苷)和未修饰的核苷二者。修饰的核苷的使用降低了最终mRNA分子的免疫原性。此外,mRNA具有5’-7mG帽结构和聚(rA)尾以确保高效翻译和稳定性。例如,3’UTR可以编码poly A尾。
用于表达Pol多聚蛋白的多功能单元的至少三个不同的构建体如图5所示设计。在第一个中,如图5A所示,该构建体提供蛋白酶(PR)、逆转录酶/RNase H(RT)和整合酶(IN)作为规范单元,其中每个组分通过PR自加工分隔。在第二个中,如图5B所示,Pol多聚蛋白组分个体单元RT和IN在一个双顺反子构建体上编码。第三,如图5C所示,Pol多聚蛋白组分个体单元在分开的构建体上编码。存在可以使用这些构建体的各种场景。第一,所有的Pol多聚蛋白组分都可以在一个具有5’和3’UTR的mRNA上编码为多聚蛋白(由图5A表示),其中当将组分编码为多聚蛋白(pol)时需要PR蛋白酶。第二,Pol多聚蛋白组分RT和IN单元可以在各自具有5’和3’UTR以及插入的IRES或2A序列的一个或多个构建体上编码(由图5B表示),其中将元件编码为“非多聚蛋白”个体单元时不需要PR蛋白酶。第三,Pol多聚蛋白组分RT和IN单元可以在各自具有5’和3’UTR的两个或更多个构建体上编码(由图5C表示)。第四,Pol多聚蛋白组分RT和IN单元以及辅助蛋白单元可以在各自具有5’和3’UTR以及插入的IRES或2A序列的一个构建体上编码。在这种情况下,当辅助元件被编码为多聚蛋白,例如Gag多聚蛋白时,将需要PR蛋白酶。第五,作为非限制性情况,Pol多聚蛋白组分RT和IN单元以及辅助蛋白单元可以在各自具有5’和3’UTR的两个或更多个构建体上编码。
实施例2:体内递送β-珠蛋白以治疗镰状细胞病
包含β-珠蛋白转基因的如实施例1中所述的转基因编码核酸模板用于产生包含侧接LTR的β-珠蛋白基因的RNA分子,用于整合到宿主细胞基因组中。如实施例1中所述,核酸模板从5’到3’包含5’UTR、编码Pol多聚蛋白形式的逆转录病毒Pol多聚蛋白组分的核酸序列以及3’UTR,用于产生编码逆转录病毒Pol蛋白的RNA分子。
将有效量的包含所述两种RNA分子的脂质纳米颗粒组合物施用于患有镰状细胞病的患者以治疗镰状细胞病。
实施例3:在人细胞中提高RNA的稳定性和翻译
构成本文所述的RNA介导的转基因整合系统基础的慢病毒衍生基因可能对细胞中的合成基因表达提出挑战。慢病毒复制步骤经历严格控制的时空过程,这些过程由完整的病毒基因和调控元件、结构蛋白、复制酶以及与对复制至关重要的宿主因素的相互作用协调。该实施例描述了若干修饰以提高基于RNA的整合系统的稳定性和效率。
功能单元RNA的增加的稳定性
编码一个或多个Pol多聚蛋白组分和/或辅助蛋白的一个或多个核酸分子也称为“功能单元核酸”。生成最小的、具有整合能力的RNA系统通常需要去除不直接影响逆转录和前病毒整合的病毒基因。然而,在没有全长病毒基因组的情况下,野生型单个病毒RNA(即逆转录酶(RT)和整合酶(IN))的表达在没有辅助蛋白(例如Rev)的情况下具有挑战性。此外,野生型HIV-1RNA由于存在内在不稳定元件(INS)而固有地不稳定,短的5核苷酸重复序列存在于整个转录本中(Wolff等人Nucleic Acids Res.31(11):2839-51(2003))。在HIV-1感染期间,Rev可以抵消INS的作用,因为Rev可以结合并稳定RNA转录本。为了在没有Rev的情况下增加RNA稳定性,在整个功能单元mRNA中鉴定、去除和替换了五个主要的INS序列:TAGAT、ATAGA、AAAAG、ATAAA、TTATA或其他INS元件(例如,如Wolff等人Nucleic Acids Res.31(11):2839-51(2003)中描述的那些)。INS去除可以是部分的或完全的。INS序列可以用替代密码子替换,其保留蛋白质序列的同时增加RNA的稳定性。
此外,人密码子优化(hCO)导致人细胞中的基因表达增加。先前的使用全长gag-pol基因的研究证明了人密码子优化后的Rev非依赖性(Kotsopoulou等人J Virol.74(10):4839–52(2000))。生成了hCO功能单元mRNA以增加靶细胞中的翻译和稳定性。在另一重复中,将剩余的INS元件从hCO序列中去除并替换。
这些改进已应用于所有Pol多聚蛋白组分和辅助蛋白,包括RT、IN、Matrix(MA)、衣壳(CA)、核衣壳(NC)和Vpr RNA。
功能单元蛋白的增加的稳定性
由于它们从输入mRNA进行细胞质翻译,该系统中的功能单元(例如,Pol多聚蛋白组分和辅助蛋白)可能缺乏在进入的病毒颗粒中观察到的时空协调。与其中活性IN和RT被包装在病毒基因组附近的进入病毒颗粒不同,这种基于RNA的系统首先需要进入的功能单元mRNA的翻译以及随后的新翻译的功能单元与转基因编码RNA的相互作用。因此,功能单元的蛋白质寿命很重要。
野生型IN蛋白在细胞中寿命较短,因为野生型IN的N端残基是蛋白水解降解的底物(Mulder等人J Biol Chem.275(38):29749-53(2000))。先前的使用表达质粒的研究表明,这种降解可通过添加N端甲硫氨酸-甘氨酸二肽来抵消(Cherepanov等人FASEB J.14(10):1389-99(2000))。生成了若干N端Met-Gly IN构建体。这些mRNA衍生自WT HIV基因,是hCO的,和/或已经去除和替换了INS结构。
靶细胞中pol衍生的功能单元的细胞质重定向
在一些实施方案中,生成了编码单个gag或pol基因的RNA,它们分别包含在整合前复制步骤期间核孔穿越所必需的关键结构蛋白或RT和IN。该策略的优势在于功能单元RNA序列被翻译为天然Gag或Pol多聚蛋白,而gag和pol基因的分离实现了有利于细胞内活性的化学计量优化。以野生型比率表达gag和pol基因会导致新病毒从生产细胞组装、出芽和释放到细胞外空间(Sundquist等人Cold Spring Harb Perspect Med.2(7):a006924(2012))。虽然有一些证据表明生产细胞中有功能性RT和IN活性(Al Mosabbir等人Biotechnol.Lett.38(10):1715-21(2016)),但生产细胞中新病毒基因产物的表达主要被理解为有利于新病毒粒子的形成。对编码gag和pol的表达质粒的几项研究表明,病毒基因表达从颗粒形成转向pol产物的细胞内活性(Al Mosabbir等人Biotechnol.Lett.38(10):1715-21(2016),Karacostas V等人Virology 193(2):661-71(1993))。为此,已经建立了涉及DNA质粒转染的若干机制:(1)编码基质蛋白的gag序列缺失,其在病毒出芽期间将Gag多聚蛋白锚定在质膜上(Al Mosabbir等人Biotechnol.Lett.38(10):1715-21(2016)),以及(2)破坏gag-pol移码机制的单核苷酸插入(Karacostas V等人Virology193(2):661-71(1993))。虽然这些修饰已在全长病毒基因组的背景下进行了描述,但尚未针对(1)基因组外单个基因表达和(2)合成的功能性RNA对它们进行探索。为了促进表达为gag和pol衍生的多聚蛋白的功能单元的细胞内活性,工程改造了若干新型全长gag和pol RNA:(1)基质缺失的gag-pol RNA用于防止颗粒出芽,(2)基质缺失的单个gag RNA,(3)hCO的基质缺失的gag-pol RNA用于防止颗粒出芽,(4)含有突变的RNA,该突变导致gag和pol在单个阅读框中,(5)hCO的gag-pol移码RNA用于细胞内pol活性,(6)以优化比例转染单个gag或pol RNA,这导致细胞内Pol产物积累。
用于促进逆转录反应的引发RNA基因组
HIV-1RT依赖于细胞质tRNA在逆转录反应之前引发病毒基因组。已观察到通过用短RNA或DNA寡核苷酸引发病毒基因组增加了体外逆转录反应的效率(Iwatani等人J BiolChem.278(16):14185-95(2003))。作为在我们的具有整合能力的系统中增加逆转录反应效率的策略,转基因编码RNA在与功能单元mRNA共同递送到靶细胞之前先用短RNA或DNA寡核苷酸引发转基因编码RNA。
未加帽的转基因编码RNA
HIV-1RNA基因组在生产细胞中转录后被加帽。病毒进入后,病毒基因组在逆转录前被细胞宿主因子例如RNA脱支酶1(DBR1)脱帽(Galvis等人J Virol.2017Nov 14;91(23):e01377-17(2017))。为了增加逆转录步骤的效率,产生了未加帽的转基因编码RNA,并与功能单元mRNA共转染。
实施例4:材料和方法
描述了在实施例5和6中描述的研究中使用的材料和方法。
IVT模板设计
用于功能单元RNA的IVT的DNA模板序列,包括UTR和5’T7启动子,被克隆到pTWISTAmp克隆载体(Twist Bioscience)中。转基因编码RNA的IVT模板序列,包括LTR和5’T7启动子,被克隆到来自GeneArt(ThermoFisher)的pMK骨架中。
RNA制备和纯化
含有IVT模板的质粒通过用BsmBI或Bsu36I和SfiI(New England Biolabs)消化而线性化。消化的DNA用异丙醇沉淀。消化的DNA模板(30ng/μL)在NTP(转基因编码RNA:7.5mMCTP、1.5mM GTP、7.5mM UTP;功能单元RNA:4mM ATP、4mM CTP、4mM GTP、4mM UTP)、CleanCap(转基因编码RNA:CleanCap GG,6mM;功能单元RNA:CleanCap AG,5mM)、0.1M MgSO4、0.1M亚精胺、T7 RNA聚合酶(转基因编码RNA:0.2mg/mL;功能单元RNA:0.1mg/mL)和40U/mLTIPP(New England Biolabs)存在的情况下37℃孵育4h。反应用DNase(Thermo Fisher)处理并在37℃下孵育15分钟。RNA经LiCl沉淀并重悬于THE RNA储存溶液(Thermo Fisher)中。使用大肠杆菌Poly(A)聚合酶(New England Biolabs)对体外转录的RNA进行酶促聚腺苷酸化。RNA (0.25μg/μL)在大肠杆菌poly(A)聚合酶(0.1U/μL)、1X PolyA聚合酶反应缓冲液和10mM ATP存在的情况下37℃下孵育20分钟。RNA经LiCl沉淀并重悬于THE RNA储存溶液中(功能单元RNA)或通过HPLC纯化(转基因编码RNA)。使用BioAnalyzer(AgilentTechnologies)确认聚腺苷酸化。
RNA转染
使用Lipofectamine 2000(Thermo Fisher)用RNA转染293FT细胞(ThermoFisher)。对于转基因表达实验,接种在48孔板中的细胞用指定比例的500ng总RNA转染,每孔与0.5μL Lipofectamine 2000复合。对于Western印迹,接种在12孔板中的293FT细胞每孔用1μg整合酶RNA和2μL Lipofectamine2000转染。对于共聚焦显微镜分析,将293FT细胞接种在24孔板中的聚-D-赖氨酸包被的#1盖玻片(Electron Microscopy Sciences)上。在24孔板的每孔用1μg整合酶RNA转染细胞。
Western印迹
转染后48小时,将转染细胞重悬于含有Halt蛋白酶抑制剂(Pierce,ThermoFisher)的RIPA缓冲液(Pierce,Thermo Fisher)中。在–80℃下进行两次冻融循环后,在苯甲酶核酸酶(Sigma Aldrich)存在的情况下在4℃裂解细胞悬浮液。将裂解物在37℃下孵育5分钟,用EDTA处理,并通过在4℃下以21,000x g离心20分钟澄清。将裂解物在NuPage 4-12% Bis-Tris凝胶(Thermo Fisher)上电泳并转移至0.2μg PVDF膜(Trans-Blot TurboMini,Bio-Rad)。用整合酶(Abcam,[In-2],ab66645)和β-肌动蛋白(Abcam,ab8227)的一抗对膜进行探测。分别用荧光二级山羊抗小鼠和山羊抗兔抗体(Abcam)检测整合酶和β-肌动蛋白。印迹在Li-Cor成像仪上成像。
免疫细胞化学和共聚焦显微镜分析
转染后24小时,转染的293FT细胞用PBS洗涤并在室温下在4%多聚甲醛(ElectronMicroscopy Sciences)中固定7分钟。固定后,用PBS洗涤细胞。固定的细胞与封闭缓冲液(PBS中的5% FBS、1% BSA和1X TBS Tween(Thermo Fisher))中的300nM DAPI(Biotium)、ViaFluor-647(Biotium)和缀合至CF-568染料(Mix-and-Stain,Biotium)的1:100抗整合酶抗体(Abcam,[In-2],ab66645)室温下过夜进行过夜染色。用PBS洗涤染色的盖玻片,并使用ProLong Glass(ThermoFisher)安装到Superfrost Plus显微镜载玻片(Fisher)上。使用Nikon/Yokogawa CSU-W1旋转圆盘共聚焦显微镜可视化样品。
纳米萤光素酶测定
细胞在37℃下在不含furimazine的Nano-Glo缓冲液(Promega)中裂解10分钟。纳米萤光素酶测定在96孔不透明板(Costar)中进行,方法是将25μL的Nano-Glo缓冲液和1:50的furimazine(Promega)添加到每孔20μL的细胞裂解物中。添加furimazine后立即在BioTek HTX读板器上读取发光。
实施例5:RNA衍生的功能单元驱动报告基因从转基因编码RNA的表达
用编码Gag多聚蛋白的RNA、编码Pol多聚蛋白的RNA和编码纳米萤光素酶(Nluc)的转基因编码RNA、或单独用转基因编码RNA,转染293FT细胞。RNA构建体显示于图7A中。在转染后3天收获细胞用于Nluc测定。经由光度计评估Nluc活性。Nluc活性显示为相对于背景的光单位(RLU)(图7B)。显示了48孔板每孔500ng RNA转染中RNA种类的比例。统计显著性由学生t检验确定和确认;n=3。这些结果表明,慢病毒RNA衍生的功能单元能够从侧接LTR的转基因编码RNA驱动报告基因表达。结果进一步指导了用于单个mRNA功能单元和转基因编码RNA转染的化学计量学。
实施例6:稳定化功能单元表达
具有实施例3中描述的一个或多个修饰以增加RNA和/或蛋白质稳定性的优化的整合酶(IN)编码功能单元mRNA比野生型整合酶更稳定地表达,并定位至人细胞的细胞核。编码野生型IN、稳定化Met-Gly、hCO IN和稳定化Met-Gly hCOΔINS IN的RNA的RNA构建体设计元件如图8A所示。在ΔINS IN中,鉴定了不稳定序列(INS)并对其进行了密码子优化以增加RNA稳定性。
用每个指示的RNA转染293FT细胞,并在转染后48小时(p.t.)收获用于western印迹裂解。与编码野生型IN的构建体相比,来自优化构建体的整合酶表达水平更高。在48hp.t.时检测不到野生型IN蛋白条带,与来自优化构建体的条带形成对比(图8C)。还确定了RNA转染到293FT细胞后优化的IN(Met-Gly hCOΔINS IN)的亚细胞定位(图8D)。用优化的IN RNA转染细胞,转染后24小时固定,并进行免疫荧光处理。固定的细胞用缀合的抗IN抗体、DAPI(细胞核)和鬼笔环肽-647(肌动蛋白)染色。整合酶强烈表达并定位至细胞核。这些结果表明,优化的整合酶编码功能单元mRNA表现出增强的表达和到靶细胞器的定位。
实施例中描述的示例性核苷酸序列的总结提供于下表1中。
表1.示例性核苷酸序列
Figure BDA0004118371990000581
实施方案
以下实施方案在本公开的范围内。此外,本公开涵盖这些实施方案的所有变体、组合和排列,其中一个或多个所列实施方案的一个或多个限制、元素、条款和描述性术语被引入到本节中所列另一实施方案中。例如,依赖于另一实施方案的任何列出的实施方案可以被修改以包括在依赖于相同基本实施方案的该部分中的任何其他列出的实施方案中发现的一个或多个限制。在元素以列表形式例如以马库什组格式呈现的情况下,还公开了元素的每个亚组,并且可以从组中删除任何元素。应当理解,一般而言,在公开内容或公开内容的方面被称为包含特定元素和/或特征的情况下,本发明的某些实施方案或本发明的方面由此类元素和/或特征组成或基本上由此类元素和/或特征组成。还应注意的是,术语“包含”和“含有”旨在是开放式的并且允许包括额外的元素或步骤。在给出范围的情况下,端点也包括在内。此外,除非另有说明或从上下文和本领域普通技术人员的理解中可以明显看出,表示为范围的值可以采用本发明不同实施方案中所述范围内的任何特定值或亚范围,至范围下限单位的十分之一,除非上下文另有明确规定。
1.组合物,其包含:
(i)编码侧接5’和3’非翻译区(UTR)的一个或多个Pol多聚蛋白组分的一个或多个核酸分子;和
(ii)包含位于5’长末端重复序列(LTR)和3’LTR之间的一个或多个逆转录酶引发元件和可操作地连接至一个或多个转基因的一个或多个启动子序列的核酸分子,
其中该组合物不含表达由逆转录病毒rev和env基因编码的蛋白质的核酸序列。
2.实施方案1的组合物,其中Pol多聚蛋白组分的表达不需要从行内gag基因的翻译滑动。
3.实施方案1-2的组合物,其中(i)的一个或多个核酸分子不编码Gag多聚蛋白。
4.实施方案1-3的组合物,其中(i)的一个或多个核酸分子是包含5’UTR、编码Pol多聚蛋白的核酸序列以及3’UTR的核酸分子。
5.实施方案1-3的组合物,其中(i)的一个或多个核酸分子是包含5’UTR、至少编码Pol多聚蛋白组分逆转录酶和整合酶的核酸序列以及3’UTR的核酸分子。
6.实施方案5的组合物,其中Pol多聚蛋白组分逆转录酶和整合酶在双顺反子构建体上表达。
7.实施方案5-6的组合物,其中Pol多聚蛋白组分逆转录酶和整合酶与插入的内部核糖体进入位点(IRES)或2A肽编码序列一起表达。
8.实施方案1-3的组合物,其中(i)的一个或多个核酸分子是两个核酸分子,其中两个核酸分子之一包含5’UTR、至少编码Pol多聚蛋白组分逆转录酶的核酸序列以及3’UTR,并且其中两个核酸分子中的第二个包含5’UTR、至少编码Pol多聚蛋白组分整合酶的核酸序列以及3’UTR。
9.实施方案1-8的组合物,其中(i)的一个或多个核酸分子还包含编码一个或多个Gag多聚蛋白辅助蛋白的核酸。
10.实施方案9的组合物,其中一个或多个Gag多聚蛋白辅助蛋白在与Pol多聚蛋白组分相同的核酸分子上编码。
11.实施方案10的组合物,其中一个或多个Gag多聚蛋白辅助蛋白与插入的内部核糖体进入位点(IRES)或2A肽编码序列一起表达。
12.实施方案9的组合物,其中一个或多个Gag多聚蛋白辅助蛋白由一个或多个与Pol多聚蛋白组分不同的核酸分子编码,其中每个核酸分子包含5’UTR和3’UTR。
13.实施方案9-12中任一项的组合物,其中Gag多聚蛋白辅助蛋白选自核衣壳(NC)、衣壳蛋白(CA)、基质蛋白(MA)、p6、病毒感染因子(Vif)、转录反式激活因子(Tat)、负调节因子(Nef)、病毒蛋白R(Vpr)和病毒蛋白u(Vpu)。
14.实施方案13的组合物,其中Gag多聚蛋白辅助蛋白包含核衣壳(NC)、衣壳蛋白(CA)、基质蛋白(MA)、p6、病毒感染因子(Vif)、转录反式激活因子(Tat)、负调节因子(Nef)、病毒蛋白R(Vpr)和病毒蛋白u(Vpu)。
15.实施方案14的组合物,其中Gag多聚蛋白辅助蛋白由Gag多聚蛋白编码。
16.实施方案1-15中任一项的组合物,其中(i)和(ii)的核酸分子是RNA分子或DNA分子。
17.实施方案16的组合物,其中(i)和(ii)的核酸分子是ssDNA分子或dsDNA分子。
18.实施方案16的组合物,其中(i)和(ii)的核酸分子是ssRNA分子。
19.实施方案1-18中任一项的组合物,其中(ii)的核酸分子包含两个或更多个转基因,并且这些转基因由一个或多个内部核糖体进入位点(IRES)和/或一个或多个2A肽编码序列分隔。
20.实施方案1-19中任一项的组合物,其中(ii)的核酸分子还包含一个或多个增强子。
21.实施方案20的组合物,其中一个或多个增强子包含土拨鼠肝炎病毒转录后调控元件。
22.实施方案1-21中任一项的组合物,其中(i)和/或(ii)的一个或多个核酸分子是RNA分子并且包含一个或多个选自修饰的核糖核苷、5’-7mG帽结构和聚(rA)尾的修饰。
23.实施方案22的组合物,其中修饰的核糖核苷是假尿苷或假尿苷的衍生物。
24.实施方案1-23中任一项的组合物,其中(ii)的核酸分子是RNA分子并且还包含选自5’-7mG帽结构和聚(rA)尾的一个或多个修饰。
25.实施方案1-24中任一项的组合物,其中Pol蛋白和/或LTR基于来自以下的Pol蛋白和/或LTR:人免疫缺陷病毒(HIV)、猿猴免疫缺陷病毒(SIV)、visna/maedi病毒(VMV)、山羊关节炎脑炎病毒(CAEV)、马传染性贫血病毒(EIAV)、猫免疫缺陷病毒(FIV)、牛免疫缺陷病毒(BIV)、人泡沫病毒(HFV)、鼠白血病病毒(MLV)、莫洛尼鼠白血病病毒(MoLV)、弗里德病毒(FV)、艾贝尔森鼠白血病病毒(A-MLV)、鼠干细胞病毒(MSCV)、鼠乳腺肿瘤病毒(MMTV)、莫洛尼鼠肉瘤病毒(MoMSV)、劳氏肉瘤病毒(RSV)、藤浪肉瘤病毒(FuSV)、FBR鼠骨肉瘤病毒(FBR MSV)、禽骨髓细胞瘤病毒29(MC29)、禽成红细胞增多症病毒(AEV)、人T细胞白血病病毒(HTLV)。
26.实施方案1-25中任一项的组合物,其中组合物被包装在非病毒递送系统中。
27.实施方案26的组合物,其中组合物被包装在脂质纳米颗粒中。
28.组合物,其包含:
(i)包含以下的第一RNA分子:5’非翻译区(UTR)、编码逆转录病毒Pol多聚蛋白的核酸序列以及3’UTR;和
(ii)包含位于5’长末端重复序列(LTR)和3’LTR之间的一个或多个逆转录酶引发元件和可操作地连接至一个或多个转基因的一个或多个启动子序列的第二RNA分子;
其中组合物不含表达由逆转录病毒rev和env基因编码的蛋白质的核酸序列,并且其中组合物被包装在非病毒递送系统中。
29.实施方案28的组合物,其中(i)和(ii)的RNA分子是ssRNA分子。
30.实施方案28-29中任一项的组合物,其还包含编码一个或多个辅助蛋白的第三RNA分子,辅助蛋白选自核衣壳(NC)、衣壳蛋白(CA)、病毒感染因子(Vif)、转录反式激活因子(Tat)、负调节因子(Nef)、病毒蛋白R(Vpr)和病毒蛋白u(Vpu)。
31.实施方案28的组合物,其中第一RNA分子还包含编码一个或多个辅助蛋白的核酸序列,辅助蛋白选自NC、CA、Vif、Tat、Nef、Vpr和Vpu。
32.实施方案28-31中任一项的组合物,其中第二RNA分子包含两个或更多个转基因,并且转基因由一个或多个内部核糖体进入位点(IRES)和/或编码2A肽编码序列的一个或多个序列分隔。
33.实施方案28-32中任一项的组合物,其中第二RNA分子还包含一个或多个增强子。
34.实施方案33的组合物,其中一个或多个增强子包含土拨鼠肝炎病毒转录后调控元件。
35.实施方案28-34中任一项的组合物,其中第一RNA分子包含选自修饰的核苷、5’-7mG帽结构和聚(rA)尾的一个或多个修饰。
36.实施方案28-35中任一项的组合物,其中第二RNA分子包含选自5’-7mG帽结构和聚(rA)尾的一个或多个修饰。
37.实施方案1-36中任一项的组合物,其中一个或多个启动子包含一个或多个组织特异性或细胞特异性启动子。
38.实施方案37的组合物,其中一个或多个组织特异性或细胞特异性启动子对骨髓、造血干细胞(HSC)、上皮细胞、肝细胞、视觉细胞、肌肉细胞或T细胞具有特异性。
39.实施方案1-36中任一项的组合物,其中一个或多个启动子包含hCMV启动子。
40.实施方案1-39中任一项的组合物,其中一个或多个转基因编码一个或多个治疗性分子、诊断性分子或报告分子,或其片段。
41.实施方案40的组合物,其中一个或多个转基因编码一个或多个治疗性蛋白、诊断性蛋白或报告蛋白、或其片段。
42.实施方案41的组合物,其中治疗性蛋白是β珠蛋白、囊性纤维化跨膜电导调节剂(CFTR)、因子VIII、肌营养不良蛋白或RP GTP酶调节剂(RPGR)。
43.实施方案41的组合物,其中报告蛋白是荧光蛋白或萤光素酶。
44.实施方案38-43中任一项的组合物,其中Pol蛋白、辅助蛋白和/或LTR基于来自以下的Pol蛋白、辅助蛋白和/或LTR:人免疫缺陷病毒(HIV)、猿猴免疫缺陷病毒(SIV)、visna/maedi病毒(VMV)、山羊关节炎脑炎病毒(CAEV)、马传染性贫血病毒(EIAV)、猫免疫缺陷病毒(FIV)、牛免疫缺陷病毒(BIV)、人泡沫病毒(HFV)、鼠白血病病毒(MLV)、莫洛尼鼠白血病病毒(MoLV)、弗里德病毒(FV)、艾贝尔森鼠白血病病毒(A-MLV)、鼠干细胞病毒(MSCV)、鼠乳腺肿瘤病毒(MMTV)、莫洛尼鼠肉瘤病毒(MoMSV)、劳氏肉瘤病毒(RSV)、藤浪肉瘤病毒(FuSV)、FBR鼠骨肉瘤病毒(FBR MSV)、禽骨髓细胞瘤病毒29(MC29)、禽成红细胞增多症病毒(AEV)、人T细胞白血病病毒(HTLV)。
45.实施方案26或28-44中任一项的组合物,其中非病毒递送系统靶向特定组织或细胞类型。
46.实施方案45的组合物,其中特定组织或细胞类型是骨髓、HSC、上皮细胞、肝细胞、视觉细胞、肌肉细胞或T细胞。
47.实施方案28-46中任一项的组合物,其中非病毒递送系统是脂质纳米颗粒、脂质体、多肽纳米颗粒、二氧化硅纳米颗粒、金纳米颗粒、聚合物纳米颗粒、树状聚合物或阳离子纳米乳液。
48.在有此需要的受试者中表达基因的方法,该方法包括向受试者施用有效量的实施方案1-47中任一项的组合物,从而在受试者中表达一个或多个转基因。
49.用于在细胞中表达基因的方法,该方法包括将实施方案1-47中任一项的组合物递送至细胞,从而在细胞中表达一个或多个转基因。
50.使用实施方案1-47中任一项的组合物的方法,该方法包括将组合物递送至受试者,从而在受试者中表达一个或多个转基因。
51.在有此需要的受试者中治疗疾病或病症的方法,该方法包括将实施方案1-47中任一项的组合物递送至受试者,从而在受试者中表达一个或多个转基因。
52.实施方案51的方法,其中疾病或病症是基因疾病或病症。
53.实施方案51的方法,其中疾病或病症是遗传性基因疾病或病症。
54.实施方案51的方法,其中疾病或病症是镰状细胞病、β-地中海贫血、B型血友病、视网膜色素变性、杜氏肌营养不良症、囊性纤维化或癌症。
55.实施方案48-54中任一项的方法,其中一个或多个转基因被整合到靶细胞的基因组中。
56.实施方案55的方法,其中一个或多个转基因稳定表达持续至少一周、至少两周、至少一个月、至少6个月、至少一年或持续受试者的一生。
57.在有此需要的受试者中引发免疫应答的方法,该方法包括向受试者施用有效量的实施方案1-47中任一项的组合物,从而在受试者中表达一个或多个转基因。
58.实施方案57的方法,其中受试者患有癌症,并且一个或多个转基因编码肿瘤抗原。
59.实施方案57的方法,其中受试者患有感染性疾病或处于感染感染性疾病的风险中,并且一个或多个转基因编码与感染性疾病相关的抗原。
60.实施方案48-59中任一项的方法,其中组合物被局部或全身递送。
61.实施方案60的方法,其中组合物通过注射、吸入、静脉内、腹膜内、皮下、肌肉内、经口、鼻内、通过肺部施用、经皮、经粘膜或瘤内递送。
62.用于在实施方案1-47中任一项的组合物中使用的一个或多个核酸表达盒,所述核酸表达盒包含5’UTR、编码一个或多个逆转录病毒Pol多聚蛋白组分的核酸序列以及3’UTR,其中Pol多聚蛋白组分的表达不需要从行内gag基因翻译滑动。
63.实施方案62的核酸表达盒,其还包含编码一个或多个辅助蛋白的核酸序列,辅助蛋白选自核衣壳(NC)、衣壳蛋白(CA)、病毒感染因子(Vif)、转录反式激活因子(Tat)、负调节因子(Nef)、病毒蛋白R(Vpr)和病毒蛋白u(Vpu)。
64.实施方案62或63的核酸表达盒,其中Pol蛋白和/或辅助蛋白基于来自以下的Pol蛋白和辅助蛋白:人免疫缺陷病毒(HIV)、猿猴免疫缺陷病毒(SIV)、visna/maedi病毒(VMV)、山羊关节炎脑炎病毒(CAEV)、马传染性贫血病毒(EIAV)、猫免疫缺陷病毒(FIV)、牛免疫缺陷病毒(BIV)、人泡沫病毒(HFV)、鼠白血病病毒(MLV)、莫洛尼鼠白血病病毒(MoLV)、弗里德病毒(FV)、艾贝尔森鼠白血病病毒(A-MLV)、鼠干细胞病毒(MSCV)、鼠乳腺肿瘤病毒(MMTV)、莫洛尼鼠肉瘤病毒(MoMSV)、劳氏肉瘤病毒(RSV)、藤浪肉瘤病毒(FuSV)、FBR鼠骨肉瘤病毒(FBR MSV)、禽骨髓细胞瘤病毒29(MC29)、禽成红细胞增多症病毒(AEV)、人T细胞白血病病毒(HTLV)。
65.产生RNA分子的方法,其包括体外转录实施方案62-64中任一项的核酸表达盒。
66.包含一个或多个容器的试剂盒,一个或多个容器包含实施方案1-47中任一项的组合物或实施方案62-65中任一项的核酸表达盒。
等效物和范围
虽然本文已经描述和说明了若干发明实施方案,但是本领域的普通技术人员将容易地设想用于执行本文所述的功能和/或获得本文所述的结果和/或一个或多个优点的各种其他方式和/或结构,并且每个此类变化和/或修改被认为在本文所述的发明实施方案的范围内。更通常地,本领域的技术人员将容易理解,本文所述的所有参数、尺寸、材料和配置都是示例性的,实际参数、尺寸、材料和/或配置将取决于具体应用或使用了发明教导的应用。本领域技术人员将认识到或能够仅使用常规实验来确定本文所述的具体发明实施方案的许多等效物。因此,应当理解,前述实施方案仅以示例的方式呈现,并且在所附权利要求及其等效物的范围内,可以以不同于具体描述和要求保护的方式来实践发明实施方案。本公开的发明实施方案涉及本文所述的每个单独特征、系统、物品、材料、试剂盒和/或方法。此外,如果此类特征、系统、物品、材料、试剂盒和/或方法不相互不一致,两个或多个此类特征、系统、物品、材料、试剂盒和/或方法的任何组合包括在本发明的发明范围内。
如本文所定义和使用的所有定义应被理解为以字典定义、通过引用并入的文件中的定义和/或所定义术语的普通含义为准。
本文公开的所有参考文献、专利和专利申请均通过引用并入到每个引用的主题,在某些情况下可以涵盖整个文件。
在说明书和权利要求书中使用的不定冠词“一”和“一个”,除非有相反的明确指示,否则应理解为“至少一个”。
说明书和权利要求书中所用的短语“和/或”应理解为这样结合的元素的“其中之一或两者”,即在某些情况下联合存在而在其他情况下分离存在的元素。以“和/或”列出的多个元素应以相同的方式解释,即如此连接的元素中的“一个或多个”。除了由“和/或”从句具体标识的元素之外,可以任选地存在其他元素,无论是否与那些具体标识的元素相关。因此,作为非限制性示例,当与诸如“包含”的开放式语言结合使用时,对“A和/或B”的引用在一个实施方案中可以仅指代A (任选地包括除B之外的元素);在另一个实施方案中可以仅指代B(任选地包括除A之外的元素);在又一个实施方案中可以指代A和B两者(任选地包括其他元素);等等。
如本文在说明书和权利要求中所使用的,“或”应当被理解为具有与如上所定义的“和/或”相同的含义。例如,当分隔列表中的项目时,“或”或“和/或”应被解释为包含性的,即包含至少一个元素,但也包括多个元素或列表元素中的一个以上元素,以及任选地其他未列出的项目。只有明确指出相反的术语,例如“仅一个”或“恰好一个”,或者当在权利要求中使用时的“由......组成”是指恰好包括多个元素或列表元素中的一个元素。一般而言,前提是排他性条款,例如“任一”、“其中之一”、“只有一个”或“恰好是其中一个”时,如本文使用的术语“或”仅应解释为表示排他性替代方案(即“一个或另一个,但不是两者”)。“主要由......组成”在权利要求中使用时,应具有专利法领域中的普通含义。
如本文在说明书和权利要求书中所用,提及一个或多个元素的列表的短语“至少一个”应理解为是指选自元素列表中的任何一个或多个元素的至少一个元素,但不一定包括元素列表中具体列出的每个元素中的至少一个,并且不排除元素列表中元素的任何组合。该定义还允许除短语“至少一个”所指的元素列表中具体标识的元素之外的元素可以任选地存在,无论是否与具体标识的那些元素相关。因此,作为非限制性示例,“A和B中的至少一个”(或等效地“A或B中的至少一个”,或等效地“A和/或B中的至少一个”)在一个实施方案中可以指至少一个,任选地包括多于一个A,而不存在B(并且任选地包括除B之外的元素);在另一个实施方案中,可以指至少一个,任选地包括多于一个B,而不存在A(并且任选地包括除A之外的元素);在又一个实施方案中,可以指至少一个,任选地包括多于一个A,和至少一个,任选地包括多于一个B(并且任选地包括其他元素);等等。
还应当理解,除非有相反的明确指示,在本文要求保护的包括多于一个步骤或动作的任何方法中,方法的步骤或动作的顺序不一定限于所提及的方法的步骤或动作的顺序。
在权利要求以及上述说明书中,所有过渡性短语,例如“包含”、“包括”、“携带”、“具有”、“含有”、“涉及”、“持有”、“由......组成”等等应理解为开放式的,即意味着包括但不限于。如美国专利局专利审查程序手册第2111.03节所述,只有过渡短语“由......组成”和“基本上由......组成”应分别为封闭或半封闭过渡短语。应当理解,在替代实施方案中,本文件中使用开放式过渡短语(例如,“包含”)描述的实施方案也被考虑为由开放式过渡短语描述的“由......组成”和“基本上由......组成”特征。例如,如果本公开描述“包含A和B的组合物”,则本公开还考虑替代实施方案“由A和B组成的组合物”和“基本上由A和B组成的组合物”。
序列表
<110> 绿光生物科技股份有限公司
<120> 用于基因病症的核酸疗法
<130> G0830.70039WO00
<140> 未指定
<141> 与此同时
<150> US 63/053,474
<151> 2020-07-17
<160> 19
<170> PatentIn 版本 3.5
<210> 1
<211> 4664
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 1
agaccagatc tgagcctggg agctctctgg ctaactaggg aacccactgc ttaagcctca 60
ataaagcttg ccttgagtgc ttcaagtagt gtgtgcccgt ctgttgtgtg actctggtaa 120
ctagagatcc ctcagaccct tttagtcagt gtggaaaatc tctagcagtg gcgcccgaac 180
agggacttga aagcgaaagg gaaaccagag gagctctctc gacgcaggac tcggcttgct 240
gaagcgcgca cggcaagagg cgaggggcgg cgactggtga gtacgccaaa aattttgact 300
agcggaggct agaaggagag agatgggtgc gagagcgtca gtattaagcg ggggagaatt 360
agatcgcgat gggaaaaaat tcggttaagg ccagggggaa agaaaaaata taaattaaaa 420
catatagtat gggcaagcag ggagctagaa cgattcgcag ttaatcctgg cctgttagaa 480
acatcagaag gctgtagaca aatactggga cagctacaac catcccttca gacaggatca 540
gaagaactta gatcattata taatacagta gcaaccctct attgtgtgca tcaaaggata 600
gagataaaag acaccaagga agctttagac aagatagagg aagagcaaaa caaaagtaag 660
accaccgcac agcaagcggc cgctgatctt cagacctgga ggaggagata tgagggacaa 720
ttggagaagt gaattatata aatataaagt agtaaaaatt gaaccattag gagtagcacc 780
caccaaggca aagagaagag tggtgcagag agaaaaaaga gcagtgggaa taggagcttt 840
gttccttggg ttcttgggag cagcaggaag cactatgggc gcagcgtcaa tgacgctgac 900
ggtacaggcc agacaattat tgtctggtat agtgcagcag cagaacaatt tgctgagggc 960
tattgaggcg caacagcatc tgttgcaact cacagtctgg ggcatcaagc agctccaggc 1020
aagaatcctg gctgtggaaa gatacctaaa ggatcaacag ctcctgggga tttggggttg 1080
ctctggaaaa ctcatttgca ccactgctgt gccttggaat gctagttgga gtaataaatc 1140
tctggaacag atttggaatc acacgacctg gatggagtgg gacagagaaa ttaacaatta 1200
cacaagctta atacactcct taattgaaga atcgcaaaac cagcaagaaa agaatgaaca 1260
agaattattg gaattagata aatgggcaag tttgtggaat tggtttaaca taacaaattg 1320
gctgtggtat ataaaattat tcataatgat agtaggaggc ttggtaggtt taagaatagt 1380
ttttgctgta ctttctatag tgaatagagt taggcaggga tattcaccat tatcgtttca 1440
gacccacctc ccaaccccga ggggacccga caggcccgaa ggaatagaag aagaaggtgg 1500
agagagagac agagacagat ccattcgatt agtgaacgga tctcgacggt atcggttaac 1560
ttttaaaaga aaagggggga ttggggggta cagtgcaggg gaaagaatag tagacataat 1620
agcaacagac atacaaacta aagaattaca aaaacaaatt acaaaaattc aaaattttat 1680
cgataagctt gggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg 1740
cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata 1800
gggactttcc attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta 1860
catcaagtgt atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc 1920
gcctggcatt atgcccagta catgacctta tgggactttc ctacttggca gtacatctac 1980
gtattagtca tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga 2040
tagcggtttg actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg 2100
ttttggcacc aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg 2160
caaatgggcg gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac 2220
cgtcagatcg cctggagacg ccatccacgc tgttttgacc tccatagaag acaccgactc 2280
tagaggatcc actagtccag tgtggtggaa ttctgcagat atcaacaagt ttgtacaaaa 2340
aagcaggctc caccatggtg agcaagggcg aggagctgtt caccggggtg gtgcccatcc 2400
tggtcgagct ggacggcgac gtaaacggcc acaagttcag cgtgtccggc gagggcgagg 2460
gcgatgccac ctacggcaag ctgaccctga agttcatctg caccaccggc aagctgcccg 2520
tgccctggcc caccctcgtg accaccttca cctacggcgt gcagtgcttc gcccgctacc 2580
ccgaccacat gaagcagcac gacttcttca agtccgccat gcccgaaggc tacgtccagg 2640
agcgcaccat cttcttcaag gacgacggca actacaagac ccgcgccgag gtgaagttcg 2700
agggcgacac cctggtgaac cgcatcgagc tgaagggcat cgacttcaag gaggacggca 2760
acatcctggg gcacaagctg gagtacaact acaacagcca caaggtctat atcaccgccg 2820
acaagcagaa gaacggcatc aaggtgaact tcaagacccg ccacaacatc gaggacggca 2880
gcgtgcagct cgccgaccac taccagcaga acacccccat cggcgacggc cccgtgctgc 2940
tgcccgacaa ccactacctg agcacccagt ccgccctgag caaagacccc aacgagaagc 3000
gcgatcacat ggtcctgctg gagttcgtga ccgccgccgg gatcactctc ggcatggacg 3060
agctgtacaa gtaaacccag ctttcttgta caaagtggtt gatatccagc acagtggcgg 3120
ccgctcgagt ctagagggcc cgcggttcga aggtaagcct atccctaacc ctctcctcgg 3180
tctcgattct acgcgtaccg gttagtaatg atcgacaatc aacctctgga ttacaaaatt 3240
tgtgaaagat tgactggtat tcttaactat gttgctcctt ttacgctatg tggatacgct 3300
gctttaatgc ctttgtatca tgctattgct tcccgtatgg ctttcatttt ctcctccttg 3360
tataaatcct ggttgctgtc tctttatgag gagttgtggc ccgttgtcag gcaacgtggc 3420
gtggtgtgca ctgtgtttgc tgacgcaacc cccactggtt ggggcattgc caccacctgt 3480
cagctccttt ccgggacttt cgctttcccc ctccctattg ccacggcgga actcatcgcc 3540
gcctgccttg cccgctgctg gacaggggct cggctgttgg gcactgacaa ttccgtggtg 3600
ttgtcgggga agctgacgtc ctttccatgg ctgctcgcct gtgttgccac ctggattctg 3660
cgcgggacgt ccttctgcta cgtcccttcg gccctcaatc cagcggacct tccttcccgc 3720
ggcctgctgc cggctctgcg gcctcttccg cgtcttcgcc ttcgccctca gacgagtcgg 3780
atctcccttt gggccgcctc cccgcctggc gatggtaccg gtgtggaaag tccccaggct 3840
ccccagcagg cagaagtatg caaagcatgc atctcaatta gtcagcaacc aggtgtggaa 3900
agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa 3960
ccatagtccc gcccctaact ccgcccatcc cgcccctaac tccgcccagt tccgcccatt 4020
ctccgcccca tggctgacta atttttttta tttatgcaga ggccgaggcc gcctctgcct 4080
ctgagctatt ccagaagtag tgaggaggct tttttggagg cctaggcttt tgcaaaaagc 4140
tcccgggagc ttgtatatcc attttcggat ctgatcagca cgtgcacaat tcgagctcgg 4200
tacctttaag accaatgact tacaaggcag ctgtagatct tagccacttt ttaaaagaaa 4260
aggggggact ggaagggcta attcactccc aacgaagaca agatctgctt tttgcttgta 4320
ctgggtctct ctggttagac cagatctgag cctgggagct ctctggctaa ctagggaacc 4380
cactgcttaa gcctcaataa agcttgcctt gagtgcttca agtagtgtgt gcccgtctgt 4440
tgtgtgactc tggtaactag agatccctca gaccctttta gtcagtgtgg aaaatctcta 4500
gcagtagtag ttcatgtcat cttattattc agtatttata acttgcaaag aaatgaatat 4560
cagagagtga gaggaacttg tttattgcag cttataatgg ttacaaataa agcaatagca 4620
tcacaaattt cacaaataaa gcattttttt cactgcacct aagg 4664
<210> 2
<211> 4664
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 2
agaccagatc tgagcctggg agctctctgg ctaactaggg aacccactgc ttaagcctca 60
ataaagcttg ccttgagtgc ttcaagtagt gtgtgcccgt ctgttgtgtg actctggtaa 120
ctagagatcc ctcagaccct tttagtcagt gtggaaaatc tctagcagtg gcgcccgaac 180
agggacttga aagcgaaagg gaaaccagag gagctctctc gacgcaggac tcggcttgct 240
gaagcgcgca cggcaagagg cgaggggcgg cgactggtga gtacgccaaa aattttgact 300
agcggaggct agaaggagag agatgggtgc gagagcgtca gtattaagcg ggggagaatt 360
agatcgcgat gggaaaaaat tcggttaagg ccagggggaa agaaaaaata taaattaaaa 420
catatagtat gggcaagcag ggagctagaa cgattcgcag ttaatcctgg cctgttagaa 480
acatcagaag gctgtagaca aatactggga cagctacaac catcccttca gacaggatca 540
gaagaactta gatcattata taatacagta gcaaccctct attgtgtgca tcaaaggata 600
gagataaaag acaccaagga agctttagac aagatagagg aagagcaaaa caaaagtaag 660
accaccgcac agcaagcggc cgctgatctt cagacctgga ggaggagata tgagggacaa 720
ttggagaagt gaattatata aatataaagt agtaaaaatt gaaccattag gagtagcacc 780
caccaaggca aagagaagag tggtgcagag agaaaaaaga gcagtgggaa taggagcttt 840
gttccttggg ttcttgggag cagcaggaag cactatgggc gcagcgtcaa tgacgctgac 900
ggtacaggcc agacaattat tgtctggtat agtgcagcag cagaacaatt tgctgagggc 960
tattgaggcg caacagcatc tgttgcaact cacagtctgg ggcatcaagc agctccaggc 1020
aagaatcctg gctgtggaaa gatacctaaa ggatcaacag ctcctgggga tttggggttg 1080
ctctggaaaa ctcatttgca ccactgctgt gccttggaat gctagttgga gtaataaatc 1140
tctggaacag atttggaatc acacgacctg gatggagtgg gacagagaaa ttaacaatta 1200
cacaagctta atacactcct taattgaaga atcgcaaaac cagcaagaaa agaatgaaca 1260
agaattattg gaattagata aatgggcaag tttgtggaat tggtttaaca taacaaattg 1320
gctgtggtat ataaaattat tcataatgat agtaggaggc ttggtaggtt taagaatagt 1380
ttttgctgta ctttctatag tgaatagagt taggcaggga tattcaccat tatcgtttca 1440
gacccacctc ccaaccccga ggggacccga caggcccgaa ggaatagaag aagaaggtgg 1500
agagagagac agagacagat ccattcgatt agtgaacgga tctcgacggt atcggttaac 1560
ttttaaaaga aaagggggga ttggggggta cagtgcaggg gaaagaatag tagacataat 1620
agcaacagac atacaaacta aagaattaca aaaacaaatt acaaaaattc aaaattttat 1680
cgataagctt gggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg 1740
cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata 1800
gggactttcc attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta 1860
catcaagtgt atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc 1920
gcctggcatt atgcccagta catgacctta tgggactttc ctacttggca gtacatctac 1980
gtattagtca tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga 2040
tagcggtttg actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg 2100
ttttggcacc aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg 2160
caaatgggcg gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac 2220
cgtcagatcg cctggagacg ccatccacgc tgttttgacc tccatagaag acaccgactc 2280
tagaggatcc actagtccag tgtggtggaa ttctgcagat atcaacaagt ttgtacaaaa 2340
aagcaggctc caccatggtg agcaagggcg aggagctgtt caccggggtg gtgcccatcc 2400
tggtcgagct ggacggcgac gtaaacggcc acaagttcag cgtgtccggc gagggcgagg 2460
gcgatgccac ctacggcaag ctgaccctga agttcatctg caccaccggc aagctgcccg 2520
tgccctggcc caccctcgtg accaccttcg gctacggcct gatgtgcttc gcccgctacc 2580
ccgaccacat gaagcagcac gacttcttca agtccgccat gcccgaaggc tacgtccagg 2640
agcgcaccat cttcttcaag gacgacggca actacaagac ccgcgccgag gtgaagttcg 2700
agggcgacac cctggtgaac cgcatcgagc tgaagggcat cgacttcaag gaggacggca 2760
acatcctggg gcacaagctg gagtacaact acaacagcca caacgtctat atcatggccg 2820
acaagcagaa gaacggcatc aaggtgaact tcaagatccg ccacaacatc gaggacggca 2880
gcgtgcagct cgccgaccac taccagcaga acacccccat cggcgacggc cccgtgctgc 2940
tgcccgacaa ccactacctg agctaccagt ccaaactgag caaagacccc aacgagaagc 3000
gcgatcacat ggtcctgctg gagttcgtga ccgccgccgg gatcactctc ggcatggacg 3060
agctgtacaa gtaaacccag ctttcttgta caaagtggtt gatatccagc acagtggcgg 3120
ccgctcgagt ctagagggcc cgcggttcga aggtaagcct atccctaacc ctctcctcgg 3180
tctcgattct acgcgtaccg gttagtaatg atcgacaatc aacctctgga ttacaaaatt 3240
tgtgaaagat tgactggtat tcttaactat gttgctcctt ttacgctatg tggatacgct 3300
gctttaatgc ctttgtatca tgctattgct tcccgtatgg ctttcatttt ctcctccttg 3360
tataaatcct ggttgctgtc tctttatgag gagttgtggc ccgttgtcag gcaacgtggc 3420
gtggtgtgca ctgtgtttgc tgacgcaacc cccactggtt ggggcattgc caccacctgt 3480
cagctccttt ccgggacttt cgctttcccc ctccctattg ccacggcgga actcatcgcc 3540
gcctgccttg cccgctgctg gacaggggct cggctgttgg gcactgacaa ttccgtggtg 3600
ttgtcgggga agctgacgtc ctttccatgg ctgctcgcct gtgttgccac ctggattctg 3660
cgcgggacgt ccttctgcta cgtcccttcg gccctcaatc cagcggacct tccttcccgc 3720
ggcctgctgc cggctctgcg gcctcttccg cgtcttcgcc ttcgccctca gacgagtcgg 3780
atctcccttt gggccgcctc cccgcctggc gatggtaccg gtgtggaaag tccccaggct 3840
ccccagcagg cagaagtatg caaagcatgc atctcaatta gtcagcaacc aggtgtggaa 3900
agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa 3960
ccatagtccc gcccctaact ccgcccatcc cgcccctaac tccgcccagt tccgcccatt 4020
ctccgcccca tggctgacta atttttttta tttatgcaga ggccgaggcc gcctctgcct 4080
ctgagctatt ccagaagtag tgaggaggct tttttggagg cctaggcttt tgcaaaaagc 4140
tcccgggagc ttgtatatcc attttcggat ctgatcagca cgtgcacaat tcgagctcgg 4200
tacctttaag accaatgact tacaaggcag ctgtagatct tagccacttt ttaaaagaaa 4260
aggggggact ggaagggcta attcactccc aacgaagaca agatctgctt tttgcttgta 4320
ctgggtctct ctggttagac cagatctgag cctgggagct ctctggctaa ctagggaacc 4380
cactgcttaa gcctcaataa agcttgcctt gagtgcttca agtagtgtgt gcccgtctgt 4440
tgtgtgactc tggtaactag agatccctca gaccctttta gtcagtgtgg aaaatctcta 4500
gcagtagtag ttcatgtcat cttattattc agtatttata acttgcaaag aaatgaatat 4560
cagagagtga gaggaacttg tttattgcag cttataatgg ttacaaataa agcaatagca 4620
tcacaaattt cacaaataaa gcattttttt cactgcacct aagg 4664
<210> 3
<211> 4346
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 3
agaccagatc tgagcctggg agctctctgg ctaactaggg aacccactgc ttaagcctca 60
ataaagcttg ccttgagtgc ttcaagtagt gtgtgcccgt ctgttgtgtg actctggtaa 120
ctagagatcc ctcagaccct tttagtcagt gtggaaaatc tctagcagtg gcgcccgaac 180
agggacttga aagcgaaagg gaaaccagag gagctctctc gacgcaggac tcggcttgct 240
gaagcgcgca cggcaagagg cgaggggcgg cgactggtga gtacgccaaa aattttgact 300
agcggaggct agaaggagag agatgggtgc gagagcgtca gtattaagcg ggggagaatt 360
agatcgcgat gggaaaaaat tcggttaagg ccagggggaa agaaaaaata taaattaaaa 420
catatagtat gggcaagcag ggagctagaa cgattcgcag ttaatcctgg cctgttagaa 480
acatcagaag gctgtagaca aatactggga cagctacaac catcccttca gacaggatca 540
gaagaactta gatcattata taatacagta gcaaccctct attgtgtgca tcaaaggata 600
gagataaaag acaccaagga agctttagac aagatagagg aagagcaaaa caaaagtaag 660
accaccgcac agcaagcggc cgctgatctt cagacctgga ggaggagata tgagggacaa 720
ttggagaagt gaattatata aatataaagt agtaaaaatt gaaccattag gagtagcacc 780
caccaaggca aagagaagag tggtgcagag agaaaaaaga gcagtgggaa taggagcttt 840
gttccttggg ttcttgggag cagcaggaag cactatgggc gcagcgtcaa tgacgctgac 900
ggtacaggcc agacaattat tgtctggtat agtgcagcag cagaacaatt tgctgagggc 960
tattgaggcg caacagcatc tgttgcaact cacagtctgg ggcatcaagc agctccaggc 1020
aagaatcctg gctgtggaaa gatacctaaa ggatcaacag ctcctgggga tttggggttg 1080
ctctggaaaa ctcatttgca ccactgctgt gccttggaat gctagttgga gtaataaatc 1140
tctggaacag atttggaatc acacgacctg gatggagtgg gacagagaaa ttaacaatta 1200
cacaagctta atacactcct taattgaaga atcgcaaaac cagcaagaaa agaatgaaca 1260
agaattattg gaattagata aatgggcaag tttgtggaat tggtttaaca taacaaattg 1320
gctgtggtat ataaaattat tcataatgat agtaggaggc ttggtaggtt taagaatagt 1380
ttttgctgta ctttctatag tgaatagagt taggcaggga tattcaccat tatcgtttca 1440
gacccacctc ccaaccccga ggggacccga caggcccgaa ggaatagaag aagaaggtgg 1500
agagagagac agagacagat ccattcgatt agtgaacgga tctcgacggt atcggttaac 1560
ttttaaaaga aaagggggga ttggggggta cagtgcaggg gaaagaatag tagacataat 1620
agcaacagac atacaaacta aagaattaca aaaacaaatt acaaaaattc aaaattttat 1680
cgataagctt gggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg 1740
cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata 1800
gggactttcc attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta 1860
catcaagtgt atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc 1920
gcctggcatt atgcccagta catgacctta tgggactttc ctacttggca gtacatctac 1980
gtattagtca tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga 2040
tagcggtttg actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg 2100
ttttggcacc aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg 2160
caaatgggcg gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac 2220
cgtcagatcg cctggagacg ccatccacgc tgttttgacc tccatagaag acaccgactc 2280
tagaggatcc actagtccag tgtggtggaa ttctgcagat atcaacaagt ttgtacaaaa 2340
aagcaggctc caccatggct aagacttccg aacagagggt gaacattgct acactgctga 2400
cagaaaataa gaagaaaatc gtggataagg cttcccagga tctgtggcgg agacacccag 2460
acctgatcgc accaggagga attgctttct ctcagaggga ccgcgctctg tgcctgcgag 2520
attacggctg gttcctgcat ctgatcacct tttgtctgct ggccggagat aagggcccca 2580
tcgagtctat tgggctgatc agtattcgag aaatgtataa ctcactggga gtgcccgtcc 2640
ctgcaatgat ggagagcatt agatgcctga aagaagccag cctgtccctg ctggacgaag 2700
aggacgccaa cgagaccgca ccctactttg attacattat taaggctatg agctaaaccc 2760
agctttcttg tacaaagtgg ttgatatcca gcacagtggc ggccgctcga gtctagaggg 2820
cccgcggttc gaaggtaagc ctatccctaa ccctctcctc ggtctcgatt ctacgcgtac 2880
cggttagtaa tgatcgacaa tcaacctctg gattacaaaa tttgtgaaag attgactggt 2940
attcttaact atgttgctcc ttttacgcta tgtggatacg ctgctttaat gcctttgtat 3000
catgctattg cttcccgtat ggctttcatt ttctcctcct tgtataaatc ctggttgctg 3060
tctctttatg aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg cactgtgttt 3120
gctgacgcaa cccccactgg ttggggcatt gccaccacct gtcagctcct ttccgggact 3180
ttcgctttcc ccctccctat tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc 3240
tggacagggg ctcggctgtt gggcactgac aattccgtgg tgttgtcggg gaagctgacg 3300
tcctttccat ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac gtccttctgc 3360
tacgtccctt cggccctcaa tccagcggac cttccttccc gcggcctgct gccggctctg 3420
cggcctcttc cgcgtcttcg ccttcgccct cagacgagtc ggatctccct ttgggccgcc 3480
tccccgcctg gcgatggtac cggtgtggaa agtccccagg ctccccagca ggcagaagta 3540
tgcaaagcat gcatctcaat tagtcagcaa ccaggtgtgg aaagtcccca ggctccccag 3600
caggcagaag tatgcaaagc atgcatctca attagtcagc aaccatagtc ccgcccctaa 3660
ctccgcccat cccgccccta actccgccca gttccgccca ttctccgccc catggctgac 3720
taattttttt tatttatgca gaggccgagg ccgcctctgc ctctgagcta ttccagaagt 3780
agtgaggagg cttttttgga ggcctaggct tttgcaaaaa gctcccggga gcttgtatat 3840
ccattttcgg atctgatcag cacgtgcaca attcgagctc ggtaccttta agaccaatga 3900
cttacaaggc agctgtagat cttagccact ttttaaaaga aaagggggga ctggaagggc 3960
taattcactc ccaacgaaga caagatctgc tttttgcttg tactgggtct ctctggttag 4020
accagatctg agcctgggag ctctctggct aactagggaa cccactgctt aagcctcaat 4080
aaagcttgcc ttgagtgctt caagtagtgt gtgcccgtct gttgtgtgac tctggtaact 4140
agagatccct cagacccttt tagtcagtgt ggaaaatctc tagcagtagt agttcatgtc 4200
atcttattat tcagtattta taacttgcaa agaaatgaat atcagagagt gagaggaact 4260
tgtttattgc agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata 4320
aagcattttt ttcactgcac ctaagg 4346
<210> 4
<211> 4663
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 4
gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 60
ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 120
tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 180
agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 240
ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 300
caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 360
agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 420
aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 480
ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 540
ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 600
tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 660
aaaacaaaag taagaccacc gcacagcaag cggccgctga tcttcagacc tggaggagga 720
gatatgaggg acaattggag aagtgaatta tataaatata aagtagtaaa aattgaacca 780
ttaggagtag cacccaccaa ggcaaagaga agagtggtgc agagagaaaa aagagcagtg 840
ggaataggag ctttgttcct tgggttcttg ggagcagcag gaagcactat gggcgcagcg 900
tcaatgacgc tgacggtaca ggccagacaa ttattgtctg gtatagtgca gcagcagaac 960
aatttgctga gggctattga ggcgcaacag catctgttgc aactcacagt ctggggcatc 1020
aagcagctcc aggcaagaat cctggctgtg gaaagatacc taaaggatca acagctcctg 1080
gggatttggg gttgctctgg aaaactcatt tgcaccactg ctgtgccttg gaatgctagt 1140
tggagtaata aatctctgga acagatttgg aatcacacga cctggatgga gtgggacaga 1200
gaaattaaca attacacaag cttaatacac tccttaattg aagaatcgca aaaccagcaa 1260
gaaaagaatg aacaagaatt attggaatta gataaatggg caagtttgtg gaattggttt 1320
aacataacaa attggctgtg gtatataaaa ttattcataa tgatagtagg aggcttggta 1380
ggtttaagaa tagtttttgc tgtactttct atagtgaata gagttaggca gggatattca 1440
ccattatcgt ttcagaccca cctcccaacc ccgaggggac ccgacaggcc cgaaggaata 1500
gaagaagaag gtggagagag agacagagac agatccattc gattagtgaa cggatctcga 1560
cggtatcggt taacttttaa aagaaaaggg gggattgggg ggtacagtgc aggggaaaga 1620
atagtagaca taatagcaac agacatacaa actaaagaat tacaaaaaca aattacaaaa 1680
attcaaaatt ttatcgataa gcttgggagt tccgcgttac ataacttacg gtaaatggcc 1740
cgcctggctg accgcccaac gacccccgcc cattgacgtc aataatgacg tatgttccca 1800
tagtaacgcc aatagggact ttccattgac gtcaatgggt ggagtattta cggtaaactg 1860
cccacttggc agtacatcaa gtgtatcata tgccaagtac gccccctatt gacgtcaatg 1920
acggtaaatg gcccgcctgg cattatgccc agtacatgac cttatgggac tttcctactt 1980
ggcagtacat ctacgtatta gtcatcgcta ttaccatggt gatgcggttt tggcagtaca 2040
tcaatgggcg tggatagcgg tttgactcac ggggatttcc aagtctccac cccattgacg 2100
tcaatgggag tttgttttgg caccaaaatc aacgggactt tccaaaatgt cgtaacaact 2160
ccgccccatt gacgcaaatg ggcggtaggc gtgtacggtg ggaggtctat ataagcagag 2220
ctcgtttagt gaaccgtcag atcgcctgga gacgccatcc acgctgtttt gacctccata 2280
gaagacaccg actctagagg atccactagt ccagtgtggt ggaattctgc agatatcaac 2340
aagtttgtac aaaaaagcag gctccaccat ggtgagcaag ggcgaggagc tgatcaagga 2400
gaacatgaga agcaagctgt acctggaagg cagcgtgaac ggccaccagt tcaagtgcac 2460
ccacgaaggg gagggcaagc cctacgaggg caagcagacc gcgaggatca aggtggtgga 2520
gggaggcccc ctgccgttcg cattcgacat cctggccacc atgtttatgt acgggagcaa 2580
ggtgttcatc aagtaccccg ccgacctccc cgattatttt aagcagtcct tccctgaggg 2640
cttcacatgg gagagagtca tggtgttcga agacgggggc gtgctgaccg ccacccagga 2700
caccagcctc caggacggcg agctcatcta caacgtcaag ctcagagggg tgaacttccc 2760
agccaacggc cccgtgatgc agaagaaaac actgggctgg gagcccagca ccgagaccat 2820
gtaccccgct gacggcggcc tggaaggcag atgcgacaag aagctgaagc tcgtgggcgg 2880
gggccacctg cacgtcaact tcaagaccac atacaagtcc aagaaacccg tgaagatgcc 2940
cggcgtccac tacgtggacc gcagactgga aagaatcaag gaggccgaca acgagaccta 3000
cgtcgagcag tacgagcacg ctgtggccag atactccaac ctgggcggag gcatggacga 3060
gctgtacaag taaacccagc tttcttgtac aaagtggttg atatccagca cagtggcggc 3120
cgctcgagtc tagagggccc gcggttcgaa ggtaagccta tccctaaccc tctcctcggt 3180
ctcgattcta cgcgtaccgg ttagtaatga tcgacaatca acctctggat tacaaaattt 3240
gtgaaagatt gactggtatt cttaactatg ttgctccttt tacgctatgt ggatacgctg 3300
ctttaatgcc tttgtatcat gctattgctt cccgtatggc tttcattttc tcctccttgt 3360
ataaatcctg gttgctgtct ctttatgagg agttgtggcc cgttgtcagg caacgtggcg 3420
tggtgtgcac tgtgtttgct gacgcaaccc ccactggttg gggcattgcc accacctgtc 3480
agctcctttc cgggactttc gctttccccc tccctattgc cacggcggaa ctcatcgccg 3540
cctgccttgc ccgctgctgg acaggggctc ggctgttggg cactgacaat tccgtggtgt 3600
tgtcggggaa gctgacgtcc tttccatggc tgctcgcctg tgttgccacc tggattctgc 3660
gcgggacgtc cttctgctac gtcccttcgg ccctcaatcc agcggacctt ccttcccgcg 3720
gcctgctgcc ggctctgcgg cctcttccgc gtcttcgcct tcgccctcag acgagtcgga 3780
tctccctttg ggccgcctcc ccgcctggcg atggtaccgg tgtggaaagt ccccaggctc 3840
cccagcaggc agaagtatgc aaagcatgca tctcaattag tcagcaacca ggtgtggaaa 3900
gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt agtcagcaac 3960
catagtcccg cccctaactc cgcccatccc gcccctaact ccgcccagtt ccgcccattc 4020
tccgccccat ggctgactaa ttttttttat ttatgcagag gccgaggccg cctctgcctc 4080
tgagctattc cagaagtagt gaggaggctt ttttggaggc ctaggctttt gcaaaaagct 4140
cccgggagct tgtatatcca ttttcggatc tgatcagcac gtgcacaatt cgagctcggt 4200
acctttaaga ccaatgactt acaaggcagc tgtagatctt agccactttt taaaagaaaa 4260
ggggggactg gaagggctaa ttcactccca acgaagacaa gatctgcttt ttgcttgtac 4320
tgggtctctc tggttagacc agatctgagc ctgggagctc tctggctaac tagggaaccc 4380
actgcttaag cctcaataaa gcttgccttg agtgcttcaa gtagtgtgtg cccgtctgtt 4440
gtgtgactct ggtaactaga gatccctcag acccttttag tcagtgtgga aaatctctag 4500
cagtagtagt tcatgtcatc ttattattca gtatttataa cttgcaaaga aatgaatatc 4560
agagagtgag aggaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat 4620
cacaaatttc acaaataaag catttttttc actgcaccta agg 4663
<210> 5
<211> 5611
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 5
gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 60
ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 120
tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 180
agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 240
ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 300
caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 360
agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 420
aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 480
ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 540
ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 600
tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 660
aaaacaaaag taagaccacc gcacagcaag cggccgctga tcttcagacc tggaggagga 720
gatatgaggg acaattggag aagtgaatta tataaatata aagtagtaaa aattgaacca 780
ttaggagtag cacccaccaa ggcaaagaga agagtggtgc agagagaaaa aagagcagtg 840
ggaataggag ctttgttcct tgggttcttg ggagcagcag gaagcactat gggcgcagcg 900
tcaatgacgc tgacggtaca ggccagacaa ttattgtctg gtatagtgca gcagcagaac 960
aatttgctga gggctattga ggcgcaacag catctgttgc aactcacagt ctggggcatc 1020
aagcagctcc aggcaagaat cctggctgtg gaaagatacc taaaggatca acagctcctg 1080
gggatttggg gttgctctgg aaaactcatt tgcaccactg ctgtgccttg gaatgctagt 1140
tggagtaata aatctctgga acagatttgg aatcacacga cctggatgga gtgggacaga 1200
gaaattaaca attacacaag cttaatacac tccttaattg aagaatcgca aaaccagcaa 1260
gaaaagaatg aacaagaatt attggaatta gataaatggg caagtttgtg gaattggttt 1320
aacataacaa attggctgtg gtatataaaa ttattcataa tgatagtagg aggcttggta 1380
ggtttaagaa tagtttttgc tgtactttct atagtgaata gagttaggca gggatattca 1440
ccattatcgt ttcagaccca cctcccaacc ccgaggggac ccgacaggcc cgaaggaata 1500
gaagaagaag gtggagagag agacagagac agatccattc gattagtgaa cggatctcga 1560
cggtatcggt taacttttaa aagaaaaggg gggattgggg ggtacagtgc aggggaaaga 1620
atagtagaca taatagcaac agacatacaa actaaagaat tacaaaaaca aattacaaaa 1680
attcaaaatt ttatcgataa gcttgggagt tccgcgttac ataacttacg gtaaatggcc 1740
cgcctggctg accgcccaac gacccccgcc cattgacgtc aataatgacg tatgttccca 1800
tagtaacgcc aatagggact ttccattgac gtcaatgggt ggagtattta cggtaaactg 1860
cccacttggc agtacatcaa gtgtatcata tgccaagtac gccccctatt gacgtcaatg 1920
acggtaaatg gcccgcctgg cattatgccc agtacatgac cttatgggac tttcctactt 1980
ggcagtacat ctacgtatta gtcatcgcta ttaccatggt gatgcggttt tggcagtaca 2040
tcaatgggcg tggatagcgg tttgactcac ggggatttcc aagtctccac cccattgacg 2100
tcaatgggag tttgttttgg caccaaaatc aacgggactt tccaaaatgt cgtaacaact 2160
ccgccccatt gacgcaaatg ggcggtaggc gtgtacggtg ggaggtctat ataagcagag 2220
ctcgtttagt gaaccgtcag atcgcctgga gacgccatcc acgctgtttt gacctccata 2280
gaagacaccg actctagagg atccactagt ccagtgtggt ggaattctgc agatatcaac 2340
aagtttgtac aaaaaagcag gctccaccat ggaagacgcc aaaaacataa agaaaggccc 2400
ggcgccattc tatcctctag aggatggaac cgctggagag caactgcata aggctatgaa 2460
gagatacgcc ctggttcctg gaacaattgc ttttacagat gcacatatcg aggtgaacat 2520
cacgtacgcg gaatacttcg aaatgtccgt tcggttggca gaagctatga aacgatatgg 2580
gctgaataca aatcacagaa tcgtcgtatg cagtgaaaac tctcttcaat tctttatgcc 2640
ggtgttgggc gcgttattta tcggagttgc agttgcgccc gcgaacgaca tttataatga 2700
acgtgaattg ctcaacagta tgaacatttc gcagcctacc gtagtgtttg tttccaaaaa 2760
ggggttgcaa aaaattttga acgtgcaaaa aaaattacca ataattcaga aaattattat 2820
catggattct aaaacggatt accagggatt tcagtcgatg tacacgttcg tcacatctca 2880
tctacctccc ggttttaatg agtacgattt tgtaccagag tcctttgatc gtgacaaaac 2940
aattgcactg ataatgaatt cctctggatc tactgggtta cctaagggtg tggcccttcc 3000
gcatagaact gcctgcgtca gattctcgca tgccagagat cctatttttg gcaatcaaat 3060
cattccggat actgcgattt taagtgttgt tccattccat cacggttttg gaatgtttac 3120
tacactcgga tatttgatat gtggatttcg agtcgtctta atgtatagat ttgaagaaga 3180
gctgttttta cgatcccttc aggattacaa aattcaaagt gcgttgctag taccaaccct 3240
attttcattc ttcgccaaaa gcactctgat tgacaaatac gatttatcta atttacacga 3300
aattgcttct gggggcgcac ctctttcgaa agaagtcggg gaagcggttg caaaacgctt 3360
ccatcttcca gggatacgac aaggatatgg gctcactgag actacatcag ctattctgat 3420
tacacccgag ggggatgata aaccgggcgc ggtcggtaaa gttgttccat tttttgaagc 3480
gaaggttgtg gatctggata ccgggaaaac gctgggcgtt aatcagagag gcgaattatg 3540
tgtcagagga cctatgatta tgtccggtta tgtaaacaat ccggaagcga ccaacgcctt 3600
gattgacaag gatggatggc tacattctgg agacatagct tactgggacg aagacgaaca 3660
cttcttcata gttgaccgct tgaagtcttt aattaaatac aaaggatatc aggtggcccc 3720
cgctgaattg gaatcgatat tgttacaaca ccccaacatc ttcgacgcgg gcgtggcagg 3780
tcttcccgac gatgacgccg gtgaacttcc cgccgccgtt gttgttttgg agcacggaaa 3840
gacgatgacg gaaaaagaga tcgtggatta cgtcgccagt caagtaacaa ccgcgaaaaa 3900
gttgcgcgga ggagttgtgt ttgtggacga agtaccgaaa ggtcttaccg gaaaactcga 3960
cgcaagaaaa atcagagaga tcctcataaa ggccaagaag ggcggaaagt ccaaattgta 4020
aacccagctt tcttgtacaa agtggttgat atccagcaca gtggcggccg ctcgagtcta 4080
gagggcccgc ggttcgaagg taagcctatc cctaaccctc tcctcggtct cgattctacg 4140
cgtaccggtt agtaatgatc gacaatcaac ctctggatta caaaatttgt gaaagattga 4200
ctggtattct taactatgtt gctcctttta cgctatgtgg atacgctgct ttaatgcctt 4260
tgtatcatgc tattgcttcc cgtatggctt tcattttctc ctccttgtat aaatcctggt 4320
tgctgtctct ttatgaggag ttgtggcccg ttgtcaggca acgtggcgtg gtgtgcactg 4380
tgtttgctga cgcaaccccc actggttggg gcattgccac cacctgtcag ctcctttccg 4440
ggactttcgc tttccccctc cctattgcca cggcggaact catcgccgcc tgccttgccc 4500
gctgctggac aggggctcgg ctgttgggca ctgacaattc cgtggtgttg tcggggaagc 4560
tgacgtcctt tccatggctg ctcgcctgtg ttgccacctg gattctgcgc gggacgtcct 4620
tctgctacgt cccttcggcc ctcaatccag cggaccttcc ttcccgcggc ctgctgccgg 4680
ctctgcggcc tcttccgcgt cttcgccttc gccctcagac gagtcggatc tccctttggg 4740
ccgcctcccc gcctggcgat ggtaccggtg tggaaagtcc ccaggctccc cagcaggcag 4800
aagtatgcaa agcatgcatc tcaattagtc agcaaccagg tgtggaaagt ccccaggctc 4860
cccagcaggc agaagtatgc aaagcatgca tctcaattag tcagcaacca tagtcccgcc 4920
cctaactccg cccatcccgc ccctaactcc gcccagttcc gcccattctc cgccccatgg 4980
ctgactaatt ttttttattt atgcagaggc cgaggccgcc tctgcctctg agctattcca 5040
gaagtagtga ggaggctttt ttggaggcct aggcttttgc aaaaagctcc cgggagcttg 5100
tatatccatt ttcggatctg atcagcacgt gcacaattcg agctcggtac ctttaagacc 5160
aatgacttac aaggcagctg tagatcttag ccacttttta aaagaaaagg ggggactgga 5220
agggctaatt cactcccaac gaagacaaga tctgcttttt gcttgtactg ggtctctctg 5280
gttagaccag atctgagcct gggagctctc tggctaacta gggaacccac tgcttaagcc 5340
tcaataaagc ttgccttgag tgcttcaagt agtgtgtgcc cgtctgttgt gtgactctgg 5400
taactagaga tccctcagac ccttttagtc agtgtggaaa atctctagca gtagtagttc 5460
atgtcatctt attattcagt atttataact tgcaaagaaa tgaatatcag agagtgagag 5520
gaacttgttt attgcagctt ataatggtta caaataaagc aatagcatca caaatttcac 5580
aaataaagca tttttttcac tgcacctaag g 5611
<210> 6
<211> 6770
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 6
agaccaggaa ttacatttgc ttctgacaca actgtgttca ctagcaacct caaacagagc 60
cgccatgggt gcgagagcgt cagtattaag cgggggagaa ttagatcgat gggaaaaaat 120
tcggttaagg ccagggggaa agaaaaaata taaattaaaa catatagtat gggcaagcag 180
ggagctagaa cgattcgcag ttaatcctgg cctgttagaa acatcagaag gctgtagaca 240
aatactggga cagctacaac catcccttca gacaggatca gaagaactta gatcattata 300
taatacagta gcaaccctct attgtgtgca tcaaaggata gagataaaag acaccaagga 360
agctttagac aagatagagg aagagcaaaa caaaagtaag aaaaaagcac agcaagcagc 420
agctgacaca ggacacagca atcaggtcag ccaaaattac cctatagtgc agaacatcca 480
ggggcaaatg gtacatcagg ccatatcacc tagaacttta aatgcatggg taaaagtagt 540
agaagagaag gctttcagcc cagaagtgat acccatgttt tcagcattat cagaaggagc 600
caccccacaa gatttaaaca ccatgctaaa cacagtgggg ggacatcaag cagccatgca 660
aatgttaaaa gagaccatca atgaggaagc tgcagaatgg gatagagtgc atccagtgca 720
tgcagggcct attgcaccag gccagatgag agaaccaagg ggaagtgaca tagcaggaac 780
tactagtacc cttcaggaac aaataggatg gatgacacat aatccaccta tcccagtagg 840
agaaatctat aaaagatgga taatcctggg attaaataaa atagtaagaa tgtatagccc 900
taccagcatt ctggacataa gacaaggacc aaaggaaccc tttagagact atgtagaccg 960
attctataaa actctaagag ccgagcaagc ttcacaagag gtaaaaaatt ggatgacaga 1020
aaccttgttg gtccaaaatg cgaacccaga ttgtaagact attttaaaag cattgggacc 1080
aggagcgaca ctagaagaaa tgatgacagc atgtcaggga gtggggggac ccggccataa 1140
agcaagagtt ttggctgaag caatgagcca agtaacaaat ccagctacca taatgataca 1200
gaaaggcaat tttaggaacc aaagaaagac tgttaagtgt ttcaattgtg gcaaagaagg 1260
gcacatagcc aaaaattgca gggcccctag gaaaaagggc tgttggaaat gtggaaagga 1320
aggacaccaa atgaaagatt gtactgagag acaggctaat tttttaggga agatctggcc 1380
ttcccacaag ggaaggccag ggaattttct tcagagcaga ccagagccaa cagccccacc 1440
agaagagagc ttcaggtttg gggaagagac aacaactccc tctcagaagc aggagccgat 1500
agacaaggaa ctgtatcctt tagcttccct cagatcactc tttggcagcg acccctcgtc 1560
acaataaaga taggggggca attaaaggaa gctctattag atacaggagc agatgataca 1620
gtattagaag aaatgaattt gccaggaaga tggaaaccaa aaatgatagg gggaattgga 1680
ggttttatca aagtaagaca gtatgatcag atactcatag aaatctgcgg acataaagct 1740
ataggtacag tattagtagg acctacacct gtcaacataa ttggaagaaa tctgttgact 1800
cagattggct gcactttaaa ttttcccatt agtcctattg agactgtacc agtaaaatta 1860
aagccaggaa tggatggccc aaaagttaaa caatggccat tgacagaaga aaaaataaaa 1920
gcattagtag aaatttgtac agaaatggaa aaggaaggaa aaatttcaaa aattgggcct 1980
gaaaatccat acaatactcc agtatttgcc ataaagaaaa aagacagtac taaatggaga 2040
aaattagtag atttcagaga acttaataag agaactcaag atttctggga agttcaatta 2100
ggaataccac atcctgcagg gttaaaacag aaaaaatcag taacagtact ggatgtgggc 2160
gatgcatatt tttcagttcc cttagataaa gacttcagga agtatactgc atttaccata 2220
cctagtataa acaatgagac accagggatt agatatcagt acaatgtgct tccacaggga 2280
tggaaaggat caccagcaat attccagtgt agcatgacaa aaatcttaga gccttttaga 2340
aaacaaaatc cagacatagt catctatcaa tacatggatg atttgtatgt aggatctgac 2400
ttagaaatag ggcagcatag aacaaaaata gaggaactga gacaacatct gttgaggtgg 2460
ggatttacca caccagacaa aaaacatcag aaagaacctc cattcctttg gatgggttat 2520
gaactccatc ctgataaatg gacagtacag cctatagtgc tgccagaaaa ggacagctgg 2580
actgtcaatg acatacagaa attagtggga aaattgaatt gggcaagtca gatttatgca 2640
gggattaaag taaggcaatt atgtaaactt cttaggggaa ccaaagcact aacagaagta 2700
gtaccactaa cagaagaagc agagctagaa ctggcagaaa acagggagat tctaaaagaa 2760
ccggtacatg gagtgtatta tgacccatca aaagacttaa tagcagaaat acagaagcag 2820
gggcaaggcc aatggacata tcaaatttat caagagccat ttaaaaatct gaaaacagga 2880
aagtatgcaa gaatgaaggg tgcccacact aatgatgtga aacaattaac agaggcagta 2940
caaaaaatag ccacagaaag catagtaata tggggaaaga ctcctaaatt taaattaccc 3000
atacaaaagg aaacatggga agcatggtgg acagagtatt ggcaagccac ctggattcct 3060
gagtgggagt ttgtcaatac ccctccctta gtgaagttat ggtaccagtt agagaaagaa 3120
cccataatag gagcagaaac tttctatgta gatggggcag ccaataggga aactaaatta 3180
ggaaaagcag gatatgtaac tgacagagga agacaaaaag ttgtccccct aacggacaca 3240
acaaatcaga agactgagtt acaagcaatt catctagctt tgcaggattc gggattagaa 3300
gtaaacatag tgacagactc acaatatgca ttgggaatca ttcaagcaca accagataag 3360
agtgaatcag agttagtcag tcaaataata gagcagttaa taaaaaagga aaaagtctac 3420
ctggcatggg taccagcaca caaaggaatt ggaggaaatg aacaagtaga taaattggtc 3480
agtgctggaa tcaggaaagt actattttta gatggaatag ataaggccca agaagaacat 3540
gagaaatatc acagtaattg gagagcaatg gctagtgatt ttaacctacc acctgtagta 3600
gcaaaagaaa tagtagccag ctgtgataaa tgtcagctaa aaggggaagc catgcatgga 3660
caagtagact gtagcccagg aatatggcag ctagattgta cacatttaga aggaaaagtt 3720
atcttggtag cagttcatgt agccagtgga tatatagaag cagaagtaat tccagcagag 3780
acagggcaag aaacagcata cttcctctta aaattagcag gaagatggcc agtaaaaaca 3840
gtacatacag acaatggcag caatttcacc agtactacag ttaaggccgc ctgttggtgg 3900
gcggggatca agcaggaatt tggcattccc tacaatcccc aaagtcaagg agtaatagaa 3960
tctatgaata aagaattaaa gaaaattata ggacaggtaa gagatcaggc tgaacatctt 4020
aagacagcag tacaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 4080
gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 4140
ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 4200
ccagtttgga aaggaccagc aaagctcctc tggaaaggtg aaggggcagt agtaatacaa 4260
gataatagtg acataaaagt agtgccaaga agaaaagcaa agatcatcag ggattatgga 4320
aaacagatgg caggtgatga ttgtgtggca agtagacagg atgaggatta aagctcgctt 4380
tcttgctgtc caatttctat taaaggttcc tttgttccct aagtccaact actaaactgg 4440
gggatattat gaagggcctt gagcatctgg attctgccta ataagaaaca tttattgtca 4500
ttgcagagac gcggccgcgc gtctcaatga agagcgtcga cgcatgcgga ggctaggtgg 4560
aggctcagtg atgataagtc tgcgatggtg gatgcatgtg tcatggtcat agctgtttcc 4620
tgtgtgaaat tgttatccgc tcagagggca caatcctatt ccgcgctatc cgacaatctc 4680
caagacatta ggtggagttc agttcggcgt atggcatatg tcgctggaaa gaacatgtga 4740
gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 4800
aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 4860
ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 4920
gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 4980
ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 5040
ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 5100
cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 5160
attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac 5220
ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 5280
aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 5340
gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 5400
tctacggggt ctgacgctct attcaacaaa gccgccgtcc cgtcaagtca gcgtaaatgg 5460
gtagggggct tcaaatcgtc ctcgtgatac caattcggag cctgcttttt tgtacaaact 5520
tgttgataat ggcaattcaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt 5580
taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag 5640
tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt 5700
cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg caatgatacc 5760
gcgagagcca cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc 5820
cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg 5880
ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac 5940
aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg 6000
atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc 6060
tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact 6120
gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc 6180
aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat 6240
acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc 6300
ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac 6360
tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa 6420
aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact 6480
catactcttc ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg 6540
atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg 6600
aaaagtgcca gatacctgaa acaaaaccca tcgtacggcc aaggaagtct ccaataactg 6660
tgatccacca caagcgccag ggttttccca gtcacgacgt tgtaaaacga cggccagtca 6720
tgcataatcc gcacgcatct ggaataagga agtgccattc cgcctgacct 6770
<210> 7
<211> 1700
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 7
agaccaggaa ttacatttgc ttctgacaca actgtgttca ctagcaacct caaacagagc 60
cgccatgggt gcgagagcgt cagtattaag cgggggagaa ttagatcgat gggaaaaaat 120
tcggttaagg ccagggggaa agaaaaaata taaattaaaa catatagtat gggcaagcag 180
ggagctagaa cgattcgcag ttaatcctgg cctgttagaa acatcagaag gctgtagaca 240
aatactggga cagctacaac catcccttca gacaggatca gaagaactta gatcattata 300
taatacagta gcaaccctct attgtgtgca tcaaaggata gagataaaag acaccaagga 360
agctttagac aagatagagg aagagcaaaa caaaagtaag aaaaaagcac agcaagcagc 420
agctgacaca ggacacagca atcaggtcag ccaaaattac cctatagtgc agaacatcca 480
ggggcaaatg gtacatcagg ccatatcacc tagaacttta aatgcatggg taaaagtagt 540
agaagagaag gctttcagcc cagaagtgat acccatgttt tcagcattat cagaaggagc 600
caccccacaa gatttaaaca ccatgctaaa cacagtgggg ggacatcaag cagccatgca 660
aatgttaaaa gagaccatca atgaggaagc tgcagaatgg gatagagtgc atccagtgca 720
tgcagggcct attgcaccag gccagatgag agaaccaagg ggaagtgaca tagcaggaac 780
tactagtacc cttcaggaac aaataggatg gatgacacat aatccaccta tcccagtagg 840
agaaatctat aaaagatgga taatcctggg attaaataaa atagtaagaa tgtatagccc 900
taccagcatt ctggacataa gacaaggacc aaaggaaccc tttagagact atgtagaccg 960
attctataaa actctaagag ccgagcaagc ttcacaagag gtaaaaaatt ggatgacaga 1020
aaccttgttg gtccaaaatg cgaacccaga ttgtaagact attttaaaag cattgggacc 1080
aggagcgaca ctagaagaaa tgatgacagc atgtcaggga gtggggggac ccggccataa 1140
agcaagagtt ttggctgaag caatgagcca agtaacaaat ccagctacca taatgataca 1200
gaaaggcaat tttaggaacc aaagaaagac tgttaagtgt ttcaattgtg gcaaagaagg 1260
gcacatagcc aaaaattgca gggcccctag gaaaaagggc tgttggaaat gtggaaagga 1320
aggacaccaa atgaaagatt gtactgagag acaggctaat tttttaggga agatctggcc 1380
ttcccacaag ggaaggccag ggaattttct tcagagcaga ccagagccaa cagccccacc 1440
agaagagagc ttcaggtttg gggaagagac aacaactccc tctcagaagc aggagccgat 1500
agacaaggaa ctgtatcctt tagcttccct cagatcactc tttggcagcg acccctcgtc 1560
acaataaagc tcgctttctt gctgtccaat ttctattaaa ggttcctttg ttccctaagt 1620
ccaactacta aactggggga tattatgaag ggccttgagc atctggattc tgcctaataa 1680
gaaacattta ttgtcattgc 1700
<210> 8
<211> 1619
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 8
agaccaggaa ttacatttgc ttctgacaca actgtgttca ctagcaacct caaacagagc 60
cgccatggga ttccttgacg gcatcgacaa ggcgcaagag gagcacgaga aatatcatag 120
caactggagg gcgatggcat cagacttcaa cttgccgcca gtcgtggcta aagagatagt 180
agcaagctgc gataagtgtc aactgaaggg tgaagcgatg cacggtcaag tggactgttc 240
ccctggtata tggcaactgg actgtaccca tctcgaaggt aaagtcattt tggttgctgt 300
acatgttgcc tctgggtata tcgaggctga ggtgattcca gcagaaacgg gacaggaaac 360
agcttatttc ttgctcaagc ttgccgggag atggcctgtg aaaactgttc atacagataa 420
tggtagcaat tttactagta cgaccgtgaa agcagcttgt tggtgggcag ggattaagca 480
agaattcgga atcccgtata acccgcagag tcagggcgtt attgagagca tgaacaagga 540
actgaaaaaa ataattgggc aagtgagaga tcaggctgag catcttaaaa ctgctgtaca 600
aatggcggtg ttcatacata attttaagcg gaagggagga attggaggat actctgcggg 660
agagaggata gtggatataa tagcgaccga tattcagaca aaggagctgc aaaaacagat 720
aacgaaaata caaaattttc gagtttacta tcgggactcc cgcgatcccg tgtggaaagg 780
tccagcgaaa ttgctttgga agggcgaagg cgcggtagtg atccaggaca attctgatat 840
caaagtggtc ccaaggcgga aagcaaagat aatccgcgac tacggcaagc aaatggcagg 900
agatgattgc gtcgcatcac gacaggacga agatggcggc ggcggctcca tggccctgac 960
caacgcccag atcctggccg tgatcgacag ctgggaggaa accgtgggcc agttccccgt 1020
gatcacccac catgtgcctc tgggcggagg cctccaggga accctgcact gttacgagat 1080
ccccctggcc gctccttacg gcgtgggctt tgccaagaac ggccccacca gatggcagta 1140
caagcggacc atcaaccagg tggtgcacag atggggcagc cacaccgtgc cctttctgct 1200
ggaacccgac aacatcaacg gcaagacctg caccgccagc cacctgtgcc acaacaccag 1260
atgccacaac cccctgcacc tgtgctggga gagcctggac gacgccaagg gccggaattg 1320
gtgccctggc cctaatggcg gatgtgtgca tgccgtcgtg tgcctgagac agggacctct 1380
gtatggccct ggcgctacag tggctggccc tcagcagagg ggctcccact tcgtggtgta 1440
aagctcgctt tcttgctgtc caatttctat taaaggttcc tttgttccct aagtccaact 1500
actaaactgg gggatattat gaagggcctt gagcatctgg attctgccta ataagaaaca 1560
tttattgtca ttgcagagac gcggccgcgc gtctcaatga agagcgtcga cgcatgcgg 1619
<210> 9
<211> 3764
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 9
agaccaggaa ttacatttgc ttctgacaca actgtgttca ctagcaacct caaacagagc 60
cgccatgggc ttttttaggg aagatctggc cttcccacaa gggaaggcca gggaattttc 120
ttcagagcag accagagcca acagccccac cagaagagag cttcaggttt ggggaagaga 180
caacaactcc ctctcagaag caggagccga tagacaagga actgtatcct ttagcttccc 240
tcagatcact ctttggcagc gacccctcgt cacaataaag ataggggggc agctcaagga 300
ggctctcctg gacaccggag cagacgacac cgtgctggag gagatgtcgt tgccaggccg 360
ctggaagccg aagatgatcg ggggaatcgg cggtttcatc aaggtgcgcc agtatgacca 420
gatcctcatc gaaatctgcg gccacaaggc tatcggtacc gtgctggtgg gccccacacc 480
cgtcaacatc atcggacgca acctgttgac gcagatcggt tgcacgctga acttccccat 540
tagccctatc gagacggtac cggtgaagct gaagcccggg atggacggcc cgaaggtcaa 600
gcaatggcca ttgacagagg agaagatcaa ggcactggtg gagatttgca cagagatgga 660
aaaggaaggg aaaatctcca agattgggcc tgagaacccg tacaacacgc cggtgttcgc 720
aatcaagaag aaggactcga cgaaatggcg caagctggtg gacttccgcg agctgaacaa 780
gcgcacgcaa gacttctggg aggttcagct gggcatcccg caccccgcag ggctgaagaa 840
gaagaaatcc gtgaccgtac tggatgtggg tgatgcctac ttctccgttc ccctggacga 900
agacttcagg aagtacactg ccttcacaat cccttcgatc aacaacgaga caccggggat 960
tcgatatcag tacaacgtgc tgccccaggg ctggaaaggc tctcccgcaa tcttccagag 1020
tagcatgacc aaaatcctgg agcctttccg caaacagaac cccgacatcg tcatctatca 1080
gtacatggat gacttgtacg tgggctctga tctagagata gggcagcacc gcaccaagat 1140
cgaggagctg cgccagcacc tgttgaggtg gggactgacc acacccgaca agaagcacca 1200
gaaggagcct cccttcctct ggatgggtta cgagctgcac cctgacaaat ggaccgtgca 1260
gcctatcgtg ctgccagaga aagacagctg gactgtcaac gacatacaga agctggtggg 1320
gaagttgaac tgggccagtc agatttaccc agggattaag gtgaggcagc tgtgcaaact 1380
cctccgcgga accaaggcac tcacagaggt gatcccccta accgaggagg ccgagctcga 1440
actggcagaa aaccgagaga tcctaaagga gcccgtgcac ggcgtgtact atgacccctc 1500
caaggacctg atcgccgaga tccagaagca ggggcaaggc cagtggacct atcagattta 1560
ccaggagccc ttcaagaacc tgaagaccgg caagtacgcc cggatgaggg gtgcccacac 1620
taacgacgtc aagcagctga ccgaggccgt gcagaagatc accaccgaaa gcatcgtgat 1680
ctggggaaag actcctaagt tcaagctgcc catccagaag gaaacctggg aaacctggtg 1740
gacagagtat tggcaggcca cctggattcc tgagtgggag ttcgtcaaca cccctcccct 1800
ggtgaagctg tggtaccagc tggagaagga gcccatagtg ggcgccgaaa ccttctacgt 1860
ggatggggcc gctaacaggg agactaagct gggcaaagcc ggatacgtca ctaaccgggg 1920
cagacagaag gttgtcaccc tcactgacac caccaaccag aagactgagc tgcaggccat 1980
ttacctcgct ttgcaggact cgggcctgga ggtgaacatc gtgacagact ctcagtatgc 2040
cctgggcatc attcaagccc agccagacca gagtgagtcc gagctggtca atcagatcat 2100
cgagcagctg atcaagaagg aaaaggtcta tctggcctgg gtacccgccc acaaaggcat 2160
tggcggcaat gagcaggtcg acaagctggt ctcggctggc atcaggaagg tgctattcct 2220
ggatggcatc gacaaggccc aggacgagca cgagaaatac cacagcaact ggcgggccat 2280
ggctagcgac ttcaacctgc cccctgtggt ggccaaagag atcgtggcca gctgtgacaa 2340
gtgtcagctc aagggcgaag ccatgcatgg ccaggtggac tgtagccccg gcatctggca 2400
actcgattgc acccatctgg agggcaaggt tatcctggta gccgtccatg tggccagtgg 2460
ctacatcgag gccgaggtca ttcccgccga aacagggcag gagacagcct acttcctcct 2520
gaagctggca ggccggtggc cagtgaagac catccatact gacaatggca gcaatttcac 2580
cagtgctacg gttaaggccg cctgctggtg ggcgggaatc aagcaggagt tcgggatccc 2640
ctacaatccc cagagtcagg gcgtcgtcga gtctatgaat aaggagttaa agaagattat 2700
cggccaggtc agagatcagg ctgagcatct caagaccgcg gtccaaatgg cggtattcat 2760
ccacaatttc aagcggaagg gggggattgg ggggtacagt gcgggggagc ggatcgtgga 2820
catcatcgcg accgacatcc agactaagga gctgcaaaag cagattacca agattcagaa 2880
tttccgggtc tactacaggg acagcagaaa tcccctctgg aaaggcccag cgaagctcct 2940
ctggaagggt gagggggcag tagtgatcca ggataatagc gacatcaagg tggtgcccag 3000
aagaaaggcg aagatcatta gggattatgg caaacagatg gcgggtgatg attgcgtggc 3060
gagcagacag gatgaggatg gcggcggcgg ctccatggcc ctgaccaacg cccagatcct 3120
ggccgtgatc gacagctggg aggaaaccgt gggccagttc cccgtgatca cccaccatgt 3180
gcctctgggc ggaggcctcc agggaaccct gcactgttac gagatccccc tggccgctcc 3240
ttacggcgtg ggctttgcca agaacggccc caccagatgg cagtacaagc ggaccatcaa 3300
ccaggtggtg cacagatggg gcagccacac cgtgcccttt ctgctggaac ccgacaacat 3360
caacggcaag acctgcaccg ccagccacct gtgccacaac accagatgcc acaaccccct 3420
gcacctgtgc tgggagagcc tggacgacgc caagggccgg aattggtgcc ctggccctaa 3480
tggcggatgt gtgcatgccg tcgtgtgcct gagacaggga cctctgtatg gccctggcgc 3540
tacagtggct ggccctcagc agaggggctc ccacttcgtg gtgtaaagct cgctttcttg 3600
ctgtccaatt tctattaaag gttcctttgt tccctaagtc caactactaa actgggggat 3660
attatgaagg gccttgagca tctggattct gcctaataag aaacatttat tgtcattgca 3720
gagacgcggc cgcgcgtctc aatgaagagc gtcgacgcat gcgg 3764
<210> 10
<211> 4474
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 10
gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 60
ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 120
tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 180
agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 240
ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 300
caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 360
agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 420
aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 480
ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 540
ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 600
tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 660
aaaacaaaag taagaccacc gcacagcaag cggccgctga tcttcagacc tggaggagga 720
gatatgaggg acaattggag aagtgaatta tataaatata aagtagtaaa aattgaacca 780
ttaggagtag cacccaccaa ggcaaagaga agagtggtgc agagagaaaa aagagcagtg 840
ggaataggag ctttgttcct tgggttcttg ggagcagcag gaagcactat gggcgcagcg 900
tcaatgacgc tgacggtaca ggccagacaa ttattgtctg gtatagtgca gcagcagaac 960
aatttgctga gggctattga ggcgcaacag catctgttgc aactcacagt ctggggcatc 1020
aagcagctcc aggcaagaat cctggctgtg gaaagatacc taaaggatca acagctcctg 1080
gggatttggg gttgctctgg aaaactcatt tgcaccactg ctgtgccttg gaatgctagt 1140
tggagtaata aatctctgga acagatttgg aatcacacga cctggatgga gtgggacaga 1200
gaaattaaca attacacaag cttaatacac tccttaattg aagaatcgca aaaccagcaa 1260
gaaaagaatg aacaagaatt attggaatta gataaatggg caagtttgtg gaattggttt 1320
aacataacaa attggctgtg gtatataaaa ttattcataa tgatagtagg aggcttggta 1380
ggtttaagaa tagtttttgc tgtactttct atagtgaata gagttaggca gggatattca 1440
ccattatcgt ttcagaccca cctcccaacc ccgaggggac ccgacaggcc cgaaggaata 1500
gaagaagaag gtggagagag agacagagac agatccattc gattagtgaa cggatctcga 1560
cggtatcggt taacttttaa aagaaaaggg gggattgggg ggtacagtgc aggggaaaga 1620
atagtagaca taatagcaac agacatacaa actaaagaat tacaaaaaca aattacaaaa 1680
attcaaaatt ttatcgataa gcttgggagt tccgcgttac ataacttacg gtaaatggcc 1740
cgcctggctg accgcccaac gacccccgcc cattgacgtc aataatgacg tatgttccca 1800
tagtaacgcc aatagggact ttccattgac gtcaatgggt ggagtattta cggtaaactg 1860
cccacttggc agtacatcaa gtgtatcata tgccaagtac gccccctatt gacgtcaatg 1920
acggtaaatg gcccgcctgg cattatgccc agtacatgac cttatgggac tttcctactt 1980
ggcagtacat ctacgtatta gtcatcgcta ttaccatggt gatgcggttt tggcagtaca 2040
tcaatgggcg tggatagcgg tttgactcac ggggatttcc aagtctccac cccattgacg 2100
tcaatgggag tttgttttgg caccaaaatc aacgggactt tccaaaatgt cgtaacaact 2160
ccgccccatt gacgcaaatg ggcggtaggc gtgtacggtg ggaggtctat ataagcagag 2220
ctcgtttagt gaaccgtcag atcgcctgga gacgccatcc acgctgtttt gacctccata 2280
gaagacaccg actctagagg atccactagt ccagtgtggt ggaattctgc agatatcaac 2340
aagtttgtac aaaaaagcag gctccaccat ggtcttcaca ctcgaagatt tcgttgggga 2400
ctggcgacag acagccggct acaacctgga ccaagtcctt gaacagggag gtgtgtccag 2460
tttgtttcag aatctcgggg tgtccgtaac tccgatccaa aggattgtcc tgagcggtga 2520
aaatgggctg aagatcgaca tccatgtcat catcccgtat gaaggtctga gcggcgacca 2580
aatgggccag atcgaaaaaa tttttaaggt ggtgtaccct gtggatgatc atcactttaa 2640
ggtgatcctg cactatggca cactggtaat cgacggggtt acgccgaaca tgatcgacta 2700
tttcggacgg ccgtatgaag gcatcgccgt gttcgacggc aaaaagatca ctgtaacagg 2760
gaccctgtgg aacggcaaca aaattatcga cgagcgcctg atcaaccccg acggctccct 2820
gctgttccga gtaaccatca acggagtgac cggctggcgg ctgtgcgaac gcattctggc 2880
gtaaacccag ctttcttgta caaagtggtt gatatccagc acagtggcgg ccgctcgagt 2940
ctagagggcc cgcggttcga aggtaagcct atccctaacc ctctcctcgg tctcgattct 3000
acgcgtaccg gttagtaatg atcgacaatc aacctctgga ttacaaaatt tgtgaaagat 3060
tgactggtat tcttaactat gttgctcctt ttacgctatg tggatacgct gctttaatgc 3120
ctttgtatca tgctattgct tcccgtatgg ctttcatttt ctcctccttg tataaatcct 3180
ggttgctgtc tctttatgag gagttgtggc ccgttgtcag gcaacgtggc gtggtgtgca 3240
ctgtgtttgc tgacgcaacc cccactggtt ggggcattgc caccacctgt cagctccttt 3300
ccgggacttt cgctttcccc ctccctattg ccacggcgga actcatcgcc gcctgccttg 3360
cccgctgctg gacaggggct cggctgttgg gcactgacaa ttccgtggtg ttgtcgggga 3420
agctgacgtc ctttccatgg ctgctcgcct gtgttgccac ctggattctg cgcgggacgt 3480
ccttctgcta cgtcccttcg gccctcaatc cagcggacct tccttcccgc ggcctgctgc 3540
cggctctgcg gcctcttccg cgtcttcgcc ttcgccctca gacgagtcgg atctcccttt 3600
gggccgcctc cccgcctggc gatggtaccg gtgtggaaag tccccaggct ccccagcagg 3660
cagaagtatg caaagcatgc atctcaatta gtcagcaacc aggtgtggaa agtccccagg 3720
ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa ccatagtccc 3780
gcccctaact ccgcccatcc cgcccctaac tccgcccagt tccgcccatt ctccgcccca 3840
tggctgacta atttttttta tttatgcaga ggccgaggcc gcctctgcct ctgagctatt 3900
ccagaagtag tgaggaggct tttttggagg cctaggcttt tgcaaaaagc tcccgggagc 3960
ttgtatatcc attttcggat ctgatcagca cgtgcacaat tcgagctcgg tacctttaag 4020
accaatgact tacaaggcag ctgtagatct tagccacttt ttaaaagaaa aggggggact 4080
ggaagggcta attcactccc aacgaagaca agatctgctt tttgcttgta ctgggtctct 4140
ctggttagac cagatctgag cctgggagct ctctggctaa ctagggaacc cactgcttaa 4200
gcctcaataa agcttgcctt gagtgcttca agtagtgtgt gcccgtctgt tgtgtgactc 4260
tggtaactag agatccctca gaccctttta gtcagtgtgg aaaatctcta gcagtagtag 4320
ttcatgtcat cttattattc agtatttata acttgcaaag aaatgaatat cagagagtga 4380
gaggaacttg tttattgcag cttataatgg ttacaaataa agcaatagca tcacaaattt 4440
cacaaataaa gcattttttt cactgcacct aagg 4474
<210> 11
<211> 3260
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 11
agaccaggaa ttacatttgc ttctgacaca actgtgttca ctagcaacct caaacagagc 60
cgccatgggc ttttttaggg aagatctggc cttcccacaa gggaaggcca gggaattttc 120
ttcagagcag accagagcca acagccccac cagaagagag cttcaggttt ggggaagaga 180
caacaactcc ctctcagaag caggagccga tagacaagga actgtatcct ttagcttccc 240
tcagatcact ctttggcagc gacccctcgt cacaataaag ataggggggc agctcaagga 300
ggctctcctg gacaccggag cagacgacac cgtgctggag gagatgtcgt tgccaggccg 360
ctggaagccg aagatgatcg ggggaatcgg cggtttcatc aaggtgcgcc agtatgacca 420
gatcctcatc gaaatctgcg gccacaaggc tatcggtacc gtgctggtgg gccccacacc 480
cgtcaacatc atcggacgca acctgttgac gcagatcggt tgcacgctga acttccccat 540
tagccctatc gagacggtac cggtgaagct gaagcccggg atggacggcc cgaaggtcaa 600
gcaatggcca ttgacagagg agaagatcaa ggcactggtg gagatttgca cagagatgga 660
aaaggaaggg aaaatctcca agattgggcc tgagaacccg tacaacacgc cggtgttcgc 720
aatcaagaag aaggactcga cgaaatggcg caagctggtg gacttccgcg agctgaacaa 780
gcgcacgcaa gacttctggg aggttcagct gggcatcccg caccccgcag ggctgaagaa 840
gaagaaatcc gtgaccgtac tggatgtggg tgatgcctac ttctccgttc ccctggacga 900
agacttcagg aagtacactg ccttcacaat cccttcgatc aacaacgaga caccggggat 960
tcgatatcag tacaacgtgc tgccccaggg ctggaaaggc tctcccgcaa tcttccagag 1020
tagcatgacc aaaatcctgg agcctttccg caaacagaac cccgacatcg tcatctatca 1080
gtacatggat gacttgtacg tgggctctga tctagagata gggcagcacc gcaccaagat 1140
cgaggagctg cgccagcacc tgttgaggtg gggactgacc acacccgaca agaagcacca 1200
gaaggagcct cccttcctct ggatgggtta cgagctgcac cctgacaaat ggaccgtgca 1260
gcctatcgtg ctgccagaga aagacagctg gactgtcaac gacatacaga agctggtggg 1320
gaagttgaac tgggccagtc agatttaccc agggattaag gtgaggcagc tgtgcaaact 1380
cctccgcgga accaaggcac tcacagaggt gatcccccta accgaggagg ccgagctcga 1440
actggcagaa aaccgagaga tcctaaagga gcccgtgcac ggcgtgtact atgacccctc 1500
caaggacctg atcgccgaga tccagaagca ggggcaaggc cagtggacct atcagattta 1560
ccaggagccc ttcaagaacc tgaagaccgg caagtacgcc cggatgaggg gtgcccacac 1620
taacgacgtc aagcagctga ccgaggccgt gcagaagatc accaccgaaa gcatcgtgat 1680
ctggggaaag actcctaagt tcaagctgcc catccagaag gaaacctggg aaacctggtg 1740
gacagagtat tggcaggcca cctggattcc tgagtgggag ttcgtcaaca cccctcccct 1800
ggtgaagctg tggtaccagc tggagaagga gcccatagtg ggcgccgaaa ccttctacgt 1860
ggatggggcc gctaacaggg agactaagct gggcaaagcc ggatacgtca ctaaccgggg 1920
cagacagaag gttgtcaccc tcactgacac caccaaccag aagactgagc tgcaggccat 1980
ttacctcgct ttgcaggact cgggcctgga ggtgaacatc gtgacagact ctcagtatgc 2040
cctgggcatc attcaagccc agccagacca gagtgagtcc gagctggtca atcagatcat 2100
cgagcagctg atcaagaagg aaaaggtcta tctggcctgg gtacccgccc acaaaggcat 2160
tggcggcaat gagcaggtcg acaagctggt ctcggctggc atcaggaagg tgctattcct 2220
ggatggcatc gacaaggccc aggacgagca cgagaaatac cacagcaact ggcgggccat 2280
ggctagcgac ttcaacctgc cccctgtggt ggccaaagag atcgtggcca gctgtgacaa 2340
gtgtcagctc aagggcgaag ccatgcatgg ccaggtggac tgtagccccg gcatctggca 2400
actcgattgc acccatctgg agggcaaggt tatcctggta gccgtccatg tggccagtgg 2460
ctacatcgag gccgaggtca ttcccgccga aacagggcag gagacagcct acttcctcct 2520
gaagctggca ggccggtggc cagtgaagac catccatact gacaatggca gcaatttcac 2580
cagtgctacg gttaaggccg cctgctggtg ggcgggaatc aagcaggagt tcgggatccc 2640
ctacaatccc cagagtcagg gcgtcgtcga gtctatgaat aaggagttaa agaagattat 2700
cggccaggtc agagatcagg ctgagcatct caagaccgcg gtccaaatgg cggtattcat 2760
ccacaatttc aagcggaagg gggggattgg ggggtacagt gcgggggagc ggatcgtgga 2820
catcatcgcg accgacatcc agactaagga gctgcaaaag cagattacca agattcagaa 2880
tttccgggtc tactacaggg acagcagaaa tcccctctgg aaaggcccag cgaagctcct 2940
ctggaagggt gagggggcag tagtgatcca ggataatagc gacatcaagg tggtgcccag 3000
aagaaaggcg aagatcatta gggattatgg caaacagatg gcgggtgatg attgcgtggc 3060
gagcagacag gatgaggatt agagctcgct ttcttgctgt ccaatttcta ttaaaggttc 3120
ctttgttccc taagtccaac tactaaactg ggggatatta tgaagggcct tgagcatctg 3180
gattctgcct aataagaaac atttattgtc attgcagaga cgcggccgcg cgtctcaatg 3240
aagagcgtcg acgcatgcgg 3260
<210> 12
<211> 3212
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 12
agaccaggaa ttacatttgc ttctgacaca actgtgttca ctagcaacct caaacagagc 60
cgccatgttt tttagggaag atctggcctt cccacaaggg aaggccaggg aattttcttc 120
agagcagacc agagccaaca gccccaccag aagagagctt caggtttggg gaagagacaa 180
caactccctc tcagaagcag gagccgatag acaaggaact gtatccttta gcttccctca 240
gatcactctt tggcagcgac ccctcgtcac aataaagata ggggggcaat taaaggaagc 300
tctattagat acaggagcag atgatacagt attagaagaa atgaatttgc caggaagatg 360
gaaaccaaaa atgatagggg gaattggagg ttttatcaaa gtaagacagt atgatcagat 420
actcatagaa atctgcggac ataaagctat aggtacagta ttagtaggac ctacacctgt 480
caacataatt ggaagaaatc tgttgactca gattggctgc actttaaatt ttcccattag 540
tcctattgag actgtaccag taaaattaaa gccaggaatg gatggcccaa aagttaaaca 600
atggccattg acagaagaaa aaataaaagc attagtagaa atttgtacag aaatggaaaa 660
ggaaggaaaa atttcaaaaa ttgggcctga aaatccatac aatactccag tatttgccat 720
aaagaaaaaa gacagtacta aatggagaaa attagtagat ttcagagaac ttaataagag 780
aactcaagat ttctgggaag ttcaattagg aataccacat cctgcagggt taaaacagaa 840
aaaatcagta acagtactgg atgtgggcga tgcatatttt tcagttccct tagataaaga 900
cttcaggaag tatactgcat ttaccatacc tagtataaac aatgagacac cagggattag 960
atatcagtac aatgtgcttc cacagggatg gaaaggatca ccagcaatat tccagtgtag 1020
catgacaaaa atcttagagc cttttagaaa acaaaatcca gacatagtca tctatcaata 1080
catggatgat ttgtatgtag gatctgactt agaaataggg cagcatagaa caaaaataga 1140
ggaactgaga caacatctgt tgaggtgggg atttaccaca ccagacaaaa aacatcagaa 1200
agaacctcca ttcctttgga tgggttatga actccatcct gataaatgga cagtacagcc 1260
tatagtgctg ccagaaaagg acagctggac tgtcaatgac atacagaaat tagtgggaaa 1320
attgaattgg gcaagtcaga tttatgcagg gattaaagta aggcaattat gtaaacttct 1380
taggggaacc aaagcactaa cagaagtagt accactaaca gaagaagcag agctagaact 1440
ggcagaaaac agggagattc taaaagaacc ggtacatgga gtgtattatg acccatcaaa 1500
agacttaata gcagaaatac agaagcaggg gcaaggccaa tggacatatc aaatttatca 1560
agagccattt aaaaatctga aaacaggaaa gtatgcaaga atgaagggtg cccacactaa 1620
tgatgtgaaa caattaacag aggcagtaca aaaaatagcc acagaaagca tagtaatatg 1680
gggaaagact cctaaattta aattacccat acaaaaggaa acatgggaag catggtggac 1740
agagtattgg caagccacct ggattcctga gtgggagttt gtcaataccc ctcccttagt 1800
gaagttatgg taccagttag agaaagaacc cataatagga gcagaaactt tctatgtaga 1860
tggggcagcc aatagggaaa ctaaattagg aaaagcagga tatgtaactg acagaggaag 1920
acaaaaagtt gtccccctaa cggacacaac aaatcagaag actgagttac aagcaattca 1980
tctagctttg caggattcgg gattagaagt aaacatagtg acagactcac aatatgcatt 2040
gggaatcatt caagcacaac cagataagag tgaatcagag ttagtcagtc aaataataga 2100
gcagttaata aaaaaggaaa aagtctacct ggcatgggta ccagcacaca aaggaattgg 2160
aggaaatgaa caagtagata aattggtcag tgctggaatc aggaaagtac tatttttaga 2220
tggaatagat aaggcccaag aagaacatga gaaatatcac agtaattgga gagcaatggc 2280
tagtgatttt aacctaccac ctgtagtagc aaaagaaata gtagccagct gtgataaatg 2340
tcagctaaaa ggggaagcca tgcatggaca agtagactgt agcccaggaa tatggcagct 2400
agattgtaca catttagaag gaaaagttat cttggtagca gttcatgtag ccagtggata 2460
tatagaagca gaagtaattc cagcagagac agggcaagaa acagcatact tcctcttaaa 2520
attagcagga agatggccag taaaaacagt acatacagac aatggcagca atttcaccag 2580
tactacagtt aaggccgcct gttggtgggc ggggatcaag caggaatttg gcattcccta 2640
caatccccaa agtcaaggag taatagaatc tatgaataaa gaattaaaga aaattatagg 2700
acaggtaaga gatcaggctg aacatcttaa gacagcagta caaatggcag tattcatcca 2760
caattttaaa agaaaagggg ggattggggg gtacagtgca ggggaaagaa tagtagacat 2820
aatagcaaca gacatacaaa ctaaagaatt acaaaaacaa attacaaaaa ttcaaaattt 2880
tcgggtttat tacagggaca gcagagatcc agtttggaaa ggaccagcaa agctcctctg 2940
gaaaggtgaa ggggcagtag taatacaaga taatagtgac ataaaagtag tgccaagaag 3000
aaaagcaaag atcatcaggg attatggaaa acagatggca ggtgatgatt gtgtggcaag 3060
tagacaggat gaggattaaa gctcgctttc ttgctgtcca atttctatta aaggttcctt 3120
tgttccctaa gtccaactac taaactgggg gatattatga agggccttga gcatctggat 3180
tctgcctaat aagaaacatt tattgtcatt gc 3212
<210> 13
<211> 1115
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 13
agaccaggaa ttacatttgc ttctgacaca actgtgttca ctagcaacct caaacagagc 60
cgccatggga ttcctggacg gcattgacaa ggctcaggag gagcacgaga agtaccactc 120
gaattggcgg gccatggcct ccgacttcaa cctgccaccc gtcgtcgcta aggagatcgt 180
tgctagctgc gacaagtgcc agctgaaagg cgaggctatg cacgggcagg ttgattgctc 240
tcccggcatc tggcagctcg actgtactca cctggagggc aaggtcatcc tggtcgccgt 300
gcacgtggcc tctggttaca tcgaggctga ggtcatccct gcagagactg gccaggagac 360
tgcctatttc ctgctgaaac tggccggccg gtggcctgtg aagacagtgc acacagataa 420
cggctccaac ttcacctcca ccactgtgaa ggctgcctgc tggtgggctg ggatcaagca 480
ggagttcggg atcccctata acccacagtc tcagggcgtg atcgaatcca tgaacaagga 540
gctgaagaag atcatcggcc aggttccgga ccaggcagag cacctgaaga ctgcagtgca 600
catggccgtg ttcatccaca acttcaagcg aaagggcgcc atcggtgcct actcagccgg 660
cgagcggatc gtggacatca tcgccactga catccagacc aaagagctgc agaagcagat 720
caccaagatc cagaacttcc gtgtgtacta ccgggactcc cgggaccctg tgtggaaggg 780
ccctgccaag ctgctgtgga agggcgaggg cgccgtggtc attcaggaca actgtgacat 840
caaggttgtg cccaggcgca aggccaagat tatccgggac tacggcaagc agatggctgg 900
cgacgactgt gtggcctctc gtcaagatga ggactaaagc tcgctttctt gctgtccaat 960
ttctattaaa ggttcctttg ttccctaagt ccaactacta aactggggga tattatgaag 1020
ggccttgagc atctggattc tgcctaataa gaaacattta ttgtcattgc agagacgcgg 1080
ccgcgcgtct caatgaagag cgtcgacgca tgcgg 1115
<210> 14
<211> 1115
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 14
agaccaggaa ttacatttgc ttctgacaca actgtgttca ctagcaacct caaacagagc 60
cgccatggga ttccttgacg gcatcgacaa ggcgcaagag gagcacgaga aatatcatag 120
caactggagg gcgatggcat cagacttcaa cttgccgcca gtcgtggcta aagagatagt 180
agcaagctgc gataagtgtc aactgaaggg tgaagcgatg cacggtcaag tggactgttc 240
ccctggtata tggcaactgg actgtaccca tctcgaaggt aaagtcattt tggttgctgt 300
acatgttgcc tctgggtata tcgaggctga ggtgattcca gcagaaacgg gacaggaaac 360
agcttatttc ttgctcaagc ttgccgggag atggcctgtg aaaactgttc atacagataa 420
tggtagcaat tttactagta cgaccgtgaa agcagcttgt tggtgggcag ggattaagca 480
agaattcgga atcccgtata acccgcagag tcagggcgtt attgagagca tgaacaagga 540
actgaaaaaa ataattgggc aagtgagaga tcaggctgag catcttaaaa ctgctgtaca 600
aatggcggtg ttcatacata attttaagcg gaagggagga attggaggat actctgcggg 660
agagaggata gtggatataa tagcgaccga tattcagaca aaggagctgc aaaaacagat 720
aacgaaaata caaaattttc gagtttacta tcgggactcc cgcgatcccg tgtggaaagg 780
tccagcgaaa ttgctttgga agggcgaagg cgcggtagtg atccaggaca attctgatat 840
caaagtggtc ccaaggcgga aagcaaagat aatccgcgac tacggcaagc aaatggcagg 900
agatgattgc gtcgcatcac gacaggacga agattaaagc tcgctttctt gctgtccaat 960
ttctattaaa ggttcctttg ttccctaagt ccaactacta aactggggga tattatgaag 1020
ggccttgagc atctggattc tgcctaataa gaaacattta ttgtcattgc agagacgcgg 1080
ccgcgcgtct caatgaagag cgtcgacgca tgcgg 1115
<210> 15
<211> 1067
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 15
agaccaggaa ttacatttgc ttctgacaca actgtgttca ctagcaacct caaacagagc 60
cgccatgttt ttagatggaa tagataaggc ccaagaagaa catgagaaat atcacagtaa 120
ttggagagca atggctagtg attttaacct accacctgta gtagcaaaag aaatagtagc 180
cagctgtgat aaatgtcagc taaaagggga agccatgcat ggacaagtag actgtagccc 240
aggaatatgg cagctagatt gtacacattt agaaggaaaa gttatcttgg tagcagttca 300
tgtagccagt ggatatatag aagcagaagt aattccagca gagacagggc aagaaacagc 360
atacttcctc ttaaaattag caggaagatg gccagtaaaa acagtacata cagacaatgg 420
cagcaatttc accagtacta cagttaaggc cgcctgttgg tgggcgggga tcaagcagga 480
atttggcatt ccctacaatc cccaaagtca aggagtaata gaatctatga ataaagaatt 540
aaagaaaatt ataggacagg taagagatca ggctgaacat cttaagacag cagtacaaat 600
ggcagtattc atccacaatt ttaaaagaaa aggggggatt ggggggtaca gtgcagggga 660
aagaatagta gacataatag caacagacat acaaactaaa gaattacaaa aacaaattac 720
aaaaattcaa aattttcggg tttattacag ggacagcaga gatccagttt ggaaaggacc 780
agcaaagctc ctctggaaag gtgaaggggc agtagtaata caagataata gtgacataaa 840
agtagtgcca agaagaaaag caaagatcat cagggattat ggaaaacaga tggcaggtga 900
tgattgtgtg gcaagtagac aggatgagga ttaaagctcg ctttcttgct gtccaatttc 960
tattaaaggt tcctttgttc cctaagtcca actactaaac tgggggatat tatgaagggc 1020
cttgagcatc tggattctgc ctaataagaa acatttattg tcattgc 1067
<210> 16
<211> 1568
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 16
agaccaggaa ttacatttgc ttctgacaca actgtgttca ctagcaacct caaacagagc 60
cgccatgccc attagcccta tcgagacggt accggtgaag ctgaagcccg ggatggacgg 120
cccgaaggtc aagcaatggc cattgacaga ggagaagatc aaggcactgg tggagatttg 180
cacagagatg gaaaaggaag ggaaaatctc caagattggg cctgagaacc cgtacaacac 240
gccggtgttc gcaatcaaga agaaggactc gacgaaatgg cgcaagctgg tggacttccg 300
cgagctgaac aagcgcacgc aagacttctg ggaggttcag ctgggcatcc cgcaccccgc 360
agggctgaag aagaagaaat ccgtgaccgt actggatgtg ggtgatgcct acttctccgt 420
tcccctggac gaagacttca ggaagtacac tgccttcaca atcccttcga tcaacaacga 480
gacaccgggg attcgatatc agtacaacgt gctgccccag ggctggaaag gctctcccgc 540
aatcttccag agtagcatga ccaaaatcct ggagcctttc cgcaaacaga accccgacat 600
cgtcatctat cagtacatgg atgacttgta cgtgggctct gatctagaga tagggcagca 660
ccgcaccaag atcgaggagc tgcgccagca cctgttgagg tggggactga ccacacccga 720
caagaagcac cagaaggagc ctcccttcct ctggatgggt tacgagctgc accctgacaa 780
atggaccgtg cagcctatcg tgctgccaga gaaagacagc tggactgtca acgacataca 840
gaagctggtg gggaagttga actgggccag tcagatttac ccagggatta aggtgaggca 900
gctgtgcaaa ctcctccgcg gaaccaaggc actcacagag gtgatccccc taaccgagga 960
ggccgagctc gaactggcag aaaaccgaga gatcctaaag gagcccgtgc acggcgtgta 1020
ctatgacccc tccaaggacc tgatcgccga gatccagaag caggggcaag gccagtggac 1080
ctatcagatt taccaggagc ccttcaagaa cctgaagacc ggcaagtacg cccggatgag 1140
gggtgcccac actaacgacg tcaagcagct gaccgaggcc gtgcagaaga tcaccaccga 1200
aagcatcgtg atctggggaa agactcctaa gttcaagctg cccatccaga aggaaacctg 1260
ggaaacctgg tggacagagt attggcaggc cacctggatt cctgagtggg agttcgtcaa 1320
cacccctccc ctggtgaagc tgtggtacca gctggagaag gagcccatag tgggcgccga 1380
aaccttctaa agctcgcttt cttgctgtcc aatttctatt aaaggttcct ttgttcccta 1440
agtccaacta ctaaactggg ggatattatg aagggccttg agcatctgga ttctgcctaa 1500
taagaaacat ttattgtcat tgcagagacg cggccgcgcg tctcaatgaa gagcgtcgac 1560
gcatgcgg 1568
<210> 17
<211> 1928
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 17
agaccaggaa ttacatttgc ttctgacaca actgtgttca ctagcaacct caaacagagc 60
cgccatgccc attagcccta tcgagacggt accggtgaag ctgaagcccg ggatggacgg 120
cccgaaggtc aagcaatggc cattgacaga ggagaagatc aaggcactgg tggagatttg 180
cacagagatg gaaaaggaag ggaaaatctc caagattggg cctgagaacc cgtacaacac 240
gccggtgttc gcaatcaaga agaaggactc gacgaaatgg cgcaagctgg tggacttccg 300
cgagctgaac aagcgcacgc aagacttctg ggaggttcag ctgggcatcc cgcaccccgc 360
agggctgaag aagaagaaat ccgtgaccgt actggatgtg ggtgatgcct acttctccgt 420
tcccctggac gaagacttca ggaagtacac tgccttcaca atcccttcga tcaacaacga 480
gacaccgggg attcgatatc agtacaacgt gctgccccag ggctggaaag gctctcccgc 540
aatcttccag agtagcatga ccaaaatcct ggagcctttc cgcaaacaga accccgacat 600
cgtcatctat cagtacatgg atgacttgta cgtgggctct gatctagaga tagggcagca 660
ccgcaccaag atcgaggagc tgcgccagca cctgttgagg tggggactga ccacacccga 720
caagaagcac cagaaggagc ctcccttcct ctggatgggt tacgagctgc accctgacaa 780
atggaccgtg cagcctatcg tgctgccaga gaaagacagc tggactgtca acgacataca 840
gaagctggtg gggaagttga actgggccag tcagatttac ccagggatta aggtgaggca 900
gctgtgcaaa ctcctccgcg gaaccaaggc actcacagag gtgatccccc taaccgagga 960
ggccgagctc gaactggcag aaaaccgaga gatcctaaag gagcccgtgc acggcgtgta 1020
ctatgacccc tccaaggacc tgatcgccga gatccagaag caggggcaag gccagtggac 1080
ctatcagatt taccaggagc ccttcaagaa cctgaagacc ggcaagtacg cccggatgag 1140
gggtgcccac actaacgacg tcaagcagct gaccgaggcc gtgcagaaga tcaccaccga 1200
aagcatcgtg atctggggaa agactcctaa gttcaagctg cccatccaga aggaaacctg 1260
ggaaacctgg tggacagagt attggcaggc cacctggatt cctgagtggg agttcgtcaa 1320
cacccctccc ctggtgaagc tgtggtacca gctggagaag gagcccatag tgggcgccga 1380
aaccttctac gtggatgggg ccgctaacag ggagactaag ctgggcaaag ccggatacgt 1440
cactaaccgg ggcagacaga aggttgtcac cctcactgac accaccaacc agaagactga 1500
gctgcaggcc atttacctcg ctttgcagga ctcgggcctg gaggtgaaca tcgtgacaga 1560
ctctcagtat gccctgggca tcattcaagc ccagccagac cagagtgagt ccgagctggt 1620
caatcagatc atcgagcagc tgatcaagaa ggaaaaggtc tatctggcct gggtacccgc 1680
ccacaaaggc attggcggca atgagcaggt cgacaagctg gtctcggctg gcatcaggaa 1740
ggtgctataa agctcgcttt cttgctgtcc aatttctatt aaaggttcct ttgttcccta 1800
agtccaacta ctaaactggg ggatattatg aagggccttg agcatctgga ttctgcctaa 1860
taagaaacat ttattgtcat tgcagagacg cggccgcgcg tctcaatgaa gagcgtcgac 1920
gcatgcgg 1928
<210> 18
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 18
gucccuguuc gggcgcca 18
<210> 19
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 19
gtccctgttc gggcgcca 18

Claims (129)

1.组合物,其包含:
(i)编码侧接5’和3’非翻译区(UTR)的一个或多个Pol多聚蛋白组分的一个或多个核酸分子;和
(ii)包含位于5’长末端重复序列(LTR)和3’LTR之间的一个或多个逆转录酶引发元件和可操作地连接至一个或多个转基因的一个或多个启动子序列的核酸分子。
2.权利要求1的组合物,其中所述组合物不含表达由逆转录病毒rev基因和逆转录病毒env基因中的至少一个编码的蛋白质的核酸序列。
3.权利要求1或2的组合物,其中所述组合物不含表达由逆转录病毒rev和env基因编码的蛋白质的核酸序列。
4.权利要求1-3中任一项的组合物,其中所述组合物能够在不存在功能性逆转录病毒Rev和/或Env蛋白的情况下将所述一个或多个转基因整合到宿主基因组中。
5.权利要求1-4中任一项的组合物,其中所述Pol多聚蛋白组分的表达不需要从行内gag基因的翻译滑动。
6.权利要求1-5中任一项的组合物,其中(i)的所述一个或多个核酸分子是包含5’UTR、编码Pol多聚蛋白的核酸序列以及3’UTR的核酸分子。
7.权利要求1-6中任一项的组合物,其中(i)的所述一个或多个核酸分子是包含5’UTR、至少编码Pol多聚蛋白组分逆转录酶和整合酶的核酸序列以及3’UTR的核酸分子。
8.权利要求1-5和7中任一项的组合物,其中所述Pol多聚蛋白组分逆转录酶和整合酶在多顺反子构建体上表达。
9.权利要求8的组合物,其中所述多顺反子构建体是双顺反子或三顺反子。
10.权利要求1-5和7-9中任一项的组合物,其中所述Pol多聚蛋白组分逆转录酶和整合酶与一个或多个多顺反子元件一起表达。
11.权利要求10的组合物,其中所述多顺反子元件是插入的内部核糖体进入位点(IRES)或2A肽编码序列。
12.权利要求1-5和7-11中任一项的组合物,其中(i)的所述一个或多个核酸分子是两个核酸分子,其中所述两个核酸分子之一包含5’UTR、至少编码Pol多聚蛋白组分逆转录酶的核酸序列以及3’UTR,并且其中所述两个核酸分子中的第二个包含5’UTR、至少编码Pol多聚蛋白组分整合酶的核酸序列以及3’UTR。
13.权利要求1-12中任一项的组合物,其中(i)的所述一个或多个核酸分子还包含编码一个或多个辅助蛋白的核酸序列。
14.权利要求13的组合物,其中所述一个或多个辅助蛋白选自核衣壳(NC)、衣壳蛋白(CA)、基质蛋白(MA)、p6、病毒感染因子(Vif)、转录反式激活因子(Tat)、负调节因子(Nef)、病毒蛋白R(Vpr)和病毒蛋白u(Vpu)。
15.权利要求14的组合物,其中所述一个或多个辅助蛋白是突变辅助蛋白。
16.权利要求15的组合物,其中所述突变辅助蛋白是突变衣壳蛋白(CA),任选地所述突变衣壳蛋白包含N74D突变、E45A突变、或两者,其中编号对应于野生型HIV-1衣壳蛋白。
17.权利要求1-12中任一项的组合物,其中(i)的所述一个或多个核酸分子还包含编码一个或多个Gag多聚蛋白辅助蛋白的核酸序列。
18.权利要求13-17中任一项的组合物,其中所述一个或多个辅助蛋白与所述Pol多聚蛋白组分在相同的核酸分子上编码。
19.权利要求18的组合物,其中所述一个或多个辅助蛋白与一个或多个多顺反子元件一起表达。
20.权利要求19的组合物,其中所述多顺反子元件是插入的内部核糖体进入位点(IRES)或2A肽编码序列。
21.权利要求13-17中任一项的组合物,其中所述一个或多个辅助蛋白由不同于编码所述Pol多聚蛋白组分的核酸分子的一个或多个核酸分子编码,其中每个核酸分子包含5’UTR和3’UTR。
22.权利要求13-21中任一项的组合物,其中所述Gag多聚蛋白辅助蛋白由Gag多聚蛋白编码。
23.权利要求1-21中任一项的组合物,其中(i)的所述一个或多个核酸分子不编码Gag多聚蛋白。
24.权利要求1-4、6、7和13-22中任一项的组合物,其中(i)的所述一个或多个核酸分子包含gag-pol基因。
25.权利要求24的组合物,其中所述gag-pol基因包含移码突变。
26.权利要求25的组合物,其中所述移码突变是单核苷酸插入或缺失。
27.权利要求1-26中任一项的组合物,其中所述组合物不包含编码基质蛋白的核酸序列。
28.权利要求1-27中任一项的组合物,其中(i)的所述一个或多个核酸分子在一个或多个内在不稳定性(INS)元件中包含至少一个突变。
29.权利要求28的组合物,其中所述一个或多个INS元件选自TAGAT、ATAGA、AAAAG、ATAAA和TTATA。
30.权利要求1-29中任一项的组合物,其中(i)的所述一个或多个核酸分子编码包含N端甲硫氨酸-甘氨酸二肽的整合酶多肽。
31.权利要求1-30中任一项的组合物,其中所述一个或多个Pol多聚蛋白组分与归巢蛋白融合。
32.权利要求31的组合物,其中与归巢蛋白融合的所述Pol多聚蛋白组分中的至少一个是整合酶多肽。
33.权利要求31或32的组合物,其中所述归巢蛋白是I-PpoI。
34.权利要求1-33中任一项的组合物,其中(i)的所述一个或多个核酸分子和/或(ii)的所述核酸分子针对在宿主细胞中的表达进行密码子优化。
35.权利要求34的组合物,其中所述宿主细胞是哺乳动物细胞。
36.权利要求35的组合物,其中所述哺乳动物细胞是人细胞。
37.权利要求34的组合物,其中所述宿主细胞是鸟类细胞。
38.权利要求1-37中任一项的组合物,其中所述组合物还包含引发寡核苷酸。
39.权利要求38的组合物,其中所述引发寡核苷酸是GUCCCUGUUCGGGCGCCA或GTCCCTGTTCGGGCGCCA。
40.权利要求38的组合物,其中所述引发寡核苷酸被工程改造以与RT引发元件互补。
41.权利要求1-40中任一项的组合物,其中(i)和(ii)的所述核酸分子是RNA分子或DNA分子。
42.权利要求1-40中任一项的组合物,其中(i)和(ii)的所述核酸分子是ssDNA分子或dsDNA分子。
43.权利要求1-40中任一项的组合物,其中(i)和(ii)的所述核酸分子是ssRNA分子或dsRNA分子。
44.权利要求1-43中任一项的组合物,其中(ii)的所述核酸分子包含两个或更多个转基因,并且所述转基因由一个或多个多顺反子元件分隔。
45.权利要求44的组合物,其中所述一个或多个多顺反子元件包含一个或多个内部核糖体进入位点(IRES)和/或一个或多个2A肽编码序列。
46.权利要求1-45中任一项的组合物,其中(ii)的所述核酸分子还包含一个或多个增强子。
47.权利要求46的组合物,其中所述一个或多个增强子包含土拨鼠肝炎病毒转录后调控元件(WPRE)。
48.权利要求1-47中任一项的组合物,其中(i)的所述一个或多个核酸分子是RNA分子并且包含选自修饰的核糖核苷、5’-7mG帽结构和聚(rA)尾的一个或多个修饰。
49.权利要求48的组合物,其中所述一个或多个修饰包含假尿苷或假尿苷的衍生物。
50.权利要求49的组合物,其中所述假尿苷的衍生物为N1-甲基假尿苷。
51.权利要求48的组合物,其中所述一个或多个修饰包含N6-甲基腺苷。
52.权利要求1-51中任一项的组合物,其中(ii)的所述核酸分子是RNA分子并且还包含选自修饰的核糖核苷、5’-7mG帽结构和聚(rA)尾的一个或多个修饰。
53.权利要求1-52中任一项的组合物,其中所述Pol多聚蛋白组分、辅助蛋白和/或LTR基于来自以下的Pol多聚蛋白组分和/或LTR:人免疫缺陷病毒(HIV)、猿猴免疫缺陷病毒(SIV)、visna/maedi病毒(VMV)、山羊关节炎脑炎病毒(CAEV)、马传染性贫血病毒(EIAV)、猫免疫缺陷病毒(FIV)、牛免疫缺陷病毒(BIV)、人泡沫病毒(HFV)、鼠白血病病毒(MLV)、莫洛尼鼠白血病病毒(MoLV)、弗里德病毒(FV)、艾贝尔森鼠白血病病毒(A-MLV)、鼠干细胞病毒(MSCV)、鼠乳腺肿瘤病毒(MMTV)、莫洛尼鼠肉瘤病毒(MoMSV)、劳氏肉瘤病毒(RSV)、藤浪肉瘤病毒(FuSV)、FBR鼠骨肉瘤病毒(FBR MSV)、禽骨髓细胞瘤病毒29(MC29)、禽成红细胞增多症病毒(AEV)、人T细胞白血病病毒(HTLV)、Friend MLV(FrMLV)、禽肉瘤病毒(ASV)、禽白血病病毒、禽成髓细胞瘤病毒、UR2肉瘤病毒、Y73肉瘤病毒、Jaagsiekte绵羊逆转录病毒、叶猴病毒、Mason-pfizer猴病毒、松鼠猴逆转录病毒、禽癌米尔希尔病毒2、牛白血病病毒、灵长类T淋巴细胞病毒1、灵长类T淋巴细胞病毒2、灵长类嗜T淋巴细胞病毒3、大眼鲥鱼真皮肉瘤病毒、大眼鲥鱼表皮增生病毒1、大眼鲥鱼表皮增生病毒2、小鸡合胞病毒、猫白血病病毒、Finkel-Biskis-Jinkins鼠肉瘤病毒、Gardner-Arnstein猫肉瘤病毒、长臂猿白血病病毒、豚鼠C型肿瘤病毒、Hardy-Zuckerman猫肉瘤病毒、Harvey鼠肉瘤病毒、Kirsten鼠肉瘤病毒、考拉逆转录病毒、莫洛尼鼠肉瘤病毒、猪C型肿瘤病毒、网状内皮增生病毒、Snyder-Theilen猫肉瘤病毒、Trager鸭脾坏死病毒、毒蛇逆转录病毒、毛猴肉瘤病毒、Jembrana病病毒、美洲狮慢病毒、牛泡沫病毒、马泡沫病毒、猫泡沫病毒、棕色大丛猴原猿泡沫病毒、婆罗洲猩猩猿猴泡沫病毒、中央黑猩猩猿猴泡沫病毒、食蟹猴猿猴泡沫病毒、东方黑猩猩猿猴泡沫病毒、绿猴猿猴泡沫病毒、长尾猴猿猴泡沫病毒、日本猕猴猿猴泡沫病毒、恒河猴猿猴泡沫病毒、蜘蛛猴猿猴泡沫病毒、松鼠猴猿猴泡沫病毒、台湾猕猴猿猴泡沫病毒、西方黑猩猩猿猴泡沫病毒、西部低地大猩猩猿猴泡沫病毒、白绒耳狨猴猿猴泡沫病毒或黄胸卷尾猴猿猴泡沫病毒。
54.权利要求1-53中任一项的组合物,其中所述组合物被包装在非病毒递送系统中。
55.权利要求54中任一项的组合物,其中所述非病毒递送系统是脂质纳米颗粒、脂质体、多肽纳米颗粒、二氧化硅纳米颗粒、金纳米颗粒、聚合物纳米颗粒、树状聚合物或阳离子纳米乳液。
56.权利要求54的组合物,其中所述非病毒递送系统是脂质纳米颗粒。
57.组合物,其包含:
(i)包含以下的第一RNA分子:5’非翻译区(UTR)、编码逆转录病毒Pol多聚蛋白的核酸序列以及3’UTR;和
(ii)包含位于5’长末端重复序列(LTR)和3’LTR之间的一个或多个逆转录酶引发元件和可操作地连接至一个或多个转基因的一个或多个启动子序列的第二RNA分子;
其中所述组合物被包装在非病毒递送系统中。
58.权利要求57的组合物,其中所述组合物不含表达由逆转录病毒rev基因和逆转录病毒env基因中的至少一个编码的蛋白质的核酸序列。
59.权利要求57或58的组合物,其中所述组合物不含表达由逆转录病毒rev和env基因两者编码的蛋白质的核酸序列。
60.权利要求57的组合物,其中所述组合物能够在不存在功能性逆转录病毒Rev和/或Env蛋白的情况下将所述一个或多个转基因整合到宿主基因组中。
61.权利要求57-60中任一项的组合物,其中(i)和(ii)的所述RNA分子是ssRNA分子或dsRNA分子。
62.权利要求57-61中任一项的组合物,其还包含编码一个或多个辅助蛋白的第三RNA分子。
63.权利要求62的组合物,其中所述一个或多个辅助蛋白选自核衣壳(NC)、衣壳蛋白(CA)、基质蛋白(MA)、p6、病毒感染因子(Vif)、转录反式激活因子(Tat)、负调节因子(Nef)、病毒蛋白R(Vpr)和病毒蛋白u(Vpu)。
64.权利要求63的组合物,其中所述一个或多个辅助蛋白是突变辅助蛋白。
65.权利要求64的组合物,其中所述突变辅助蛋白是突变衣壳蛋白(CA),任选地所述突变衣壳蛋白包含N74D突变、E45A突变、或两者,其中编号对应于野生型HIV-1衣壳蛋白。
66.权利要求57-61中任一项的组合物,其中所述第一RNA分子还包含编码一个或多个辅助蛋白的核酸序列。
67.权利要求66的组合物,其中所述一个或多个辅助蛋白选自NC、CA、MA、p6、Vif、Tat、Nef、Vpr和Vpu。
68.权利要求57-61中任一项的组合物,其还包含编码一个或多个Gag多聚蛋白辅助蛋白的第三RNA分子。
69.权利要求57-61中任一项的组合物,其中所述第一RNA分子还包含编码一个或多个Gag多聚蛋白辅助蛋白的核酸序列。
70.权利要求68或69的组合物,其中所述Gag多聚蛋白辅助蛋白由Gag多聚蛋白编码。
71.权利要求57-70中任一项的组合物,其中所述第一RNA分子包含gag-pol基因。
72.权利要求71的组合物,其中所述gag-pol基因包含移码突变。
73.权利要求72的组合物,其中所述移码突变是单核苷酸插入或缺失。
74.权利要求57-73中任一项的组合物,其中所述组合物不包含编码基质(MA)蛋白的核酸序列。
75.权利要求57-74中任一项的组合物,其中所述第一RNA分子或如果存在的所述第三RNA分子,包含在一个或多个内在不稳定性(INS)元件中的突变。
76.权利要求75的组合物,其中所述一个或多个INS元件选自TAGAT、ATAGA、AAAAG、ATAAA和TTATA。
77.权利要求57-76中任一项的组合物,其中所述第一RNA分子编码包含N端甲硫氨酸-甘氨酸二肽的整合酶多肽。
78.权利要求57-77中任一项的组合物,其中所述Pol多聚蛋白与归巢蛋白融合。
79.权利要求78的组合物,其中所述整合酶多肽与所述归巢蛋白融合。
80.权利要求78或79的组合物,其中所述归巢蛋白是I-PpoI。
81.权利要求57-80中任一项的组合物,其中所述第一和/或第二RNA分子针对在宿主细胞中的表达进行密码子优化。
82.权利要求81的组合物,其中所述宿主细胞是哺乳动物细胞。
83.权利要求82的组合物,其中所述哺乳动物细胞是人细胞。
84.权利要求81的组合物,其中所述宿主细胞是鸟类细胞。
85.权利要求57-84中任一项的组合物,其中所述组合物还包含引发寡核苷酸。
86.权利要求85的组合物,其中所述引发寡核苷酸是GUCCCUGUUCGGGCGCCA(SEQ ID NO:18)或GTCCCTGTTCGGGCGCCA(SEQ ID NO:19)。
87.权利要求85的组合物,其中所述引发寡核苷酸被工程改造以与RT引发元件互补。
88.权利要求57-87中任一项的组合物,其中所述第二RNA分子包含两个或更多个转基因,并且所述转基因由一个或多个多顺反子元件分隔。
89.权利要求88的组合物,其中所述一个或多个多顺反子元件包含一个或多个内部核糖体进入位点(IRES)和/或一个或多个2A肽编码序列。
90.权利要求57-89中任一项的组合物,其中第二RNA分子还包含一个或多个增强子。
91.权利要求90的组合物,其中所述一个或多个增强子包含土拨鼠肝炎病毒转录后调控元件(WPRE)。
92.权利要求57-91中任一项的组合物,其中所述第一或第二RNA分子包含选自修饰的核苷、5’-7mG帽结构和聚(rA)尾的一个或多个修饰。
93.权利要求57-92中任一项的组合物,其中所述第二RNA分子包含选自5’-7mG帽结构和聚(rA)尾的一个或多个修饰。
94.权利要求92的组合物,其中所述一个或多个修饰包含假尿苷或假尿苷的衍生物。
95.权利要求94的组合物,其中所述假尿苷的衍生物为N1-甲基假尿苷。
96.权利要求92的组合物,其中所述一个或多个修饰包含N6-甲基腺苷。
97.权利要求1-96中任一项的组合物,其中所述一个或多个启动子包含一个或多个组织特异性或细胞特异性启动子。
98.权利要求97的组合物,其中所述一个或多个组织特异性或细胞特异性启动子对骨髓、造血干细胞(HSC)、上皮细胞、肝细胞、视觉细胞、肌肉细胞或T细胞具有特异性。
99.权利要求97或权利要求98的组合物,其中所述一个或多个启动子包含hCMV启动子。
100.权利要求1-99中任一项的组合物,其中所述一个或多个转基因编码一个或多个治疗性分子、诊断性分子或报告分子、或其片段。
101.权利要求1-99中任一项的组合物,其中所述一个或多个转基因编码一个或多个治疗性蛋白、诊断性蛋白或报告蛋白、或其片段。
102.权利要求101的组合物,其中所述治疗性蛋白是β珠蛋白、囊性纤维化跨膜电导调节剂(CFTR)、因子VIII、肌营养不良蛋白或RP GTP酶调节剂(RPGR)。
103.权利要求101的组合物,其中所述报告蛋白是荧光蛋白或萤光素酶。
104.权利要求57-103中任一项的组合物,其中所述Pol多聚蛋白组分、辅助蛋白和/或LTR基于来自以下的Pol多聚蛋白组分、辅助蛋白和/或LTR:人免疫缺陷病毒(HIV)、猿猴免疫缺陷病毒(SIV)、visna/maedi病毒(VMV)、山羊关节炎脑炎病毒(CAEV)、马传染性贫血病毒(EIAV)、猫免疫缺陷病毒(FIV)、牛免疫缺陷病毒(BIV)、人泡沫病毒(HFV)、鼠白血病病毒(MLV)、莫洛尼鼠白血病病毒(MoLV)、弗里德病毒(FV)、艾贝尔森鼠白血病病毒(A-MLV)、鼠干细胞病毒(MSCV)、鼠乳腺肿瘤病毒(MMTV)、莫洛尼鼠肉瘤病毒(MoMSV)、劳氏肉瘤病毒(RSV)、藤浪肉瘤病毒(FuSV)、FBR鼠骨肉瘤病毒(FBR MSV)、禽骨髓细胞瘤病毒29(MC29)、禽成红细胞增多症病毒(AEV)、人T细胞白血病病毒(HTLV)、Friend MLV(FrMLV)、禽肉瘤病毒(ASV)、禽白血病病毒、禽成髓细胞瘤病毒、UR2肉瘤病毒、Y73肉瘤病毒、Jaagsiekte绵羊逆转录病毒、叶猴病毒、Mason-pfizer猴病毒、松鼠猴逆转录病毒、禽癌米尔希尔病毒2、牛白血病病毒、灵长类T淋巴细胞病毒1、灵长类T淋巴细胞病毒2、灵长类嗜T淋巴细胞病毒3、大眼鲥鱼真皮肉瘤病毒、大眼鲥鱼表皮增生病毒1、大眼鲥鱼表皮增生病毒2、小鸡合胞病毒、猫白血病病毒、Finkel-Biskis-Jinkins鼠肉瘤病毒、Gardner-Arnstein猫肉瘤病毒、长臂猿白血病病毒、豚鼠C型肿瘤病毒、Hardy-Zuckerman猫肉瘤病毒、Harvey鼠肉瘤病毒、Kirsten鼠肉瘤病毒、考拉逆转录病毒、莫洛尼鼠肉瘤病毒、猪C型肿瘤病毒、网状内皮增生病毒、Snyder-Theilen猫肉瘤病毒、Trager鸭脾坏死病毒、毒蛇逆转录病毒、毛猴肉瘤病毒、Jembrana病病毒、美洲狮慢病毒、牛泡沫病毒、马泡沫病毒、猫泡沫病毒、棕色大丛猴原猿泡沫病毒、婆罗洲猩猩猿猴泡沫病毒、中央黑猩猩猿猴泡沫病毒、食蟹猴猿猴泡沫病毒、东方黑猩猩猿猴泡沫病毒、绿猴猿猴泡沫病毒、长尾猴猿猴泡沫病毒、日本猕猴猿猴泡沫病毒、恒河猴猿猴泡沫病毒、蜘蛛猴猿猴泡沫病毒、松鼠猴猿猴泡沫病毒、台湾猕猴猿猴泡沫病毒、西方黑猩猩猿猴泡沫病毒、西部低地大猩猩猿猴泡沫病毒、白绒耳狨猴猿猴泡沫病毒或黄胸卷尾猴猿猴泡沫病毒。
105.权利要求54和57-104中任一项的组合物,其中所述非病毒递送系统靶向特定组织或细胞类型。
106.权利要求105的组合物,其中所述特定组织或细胞类型是骨髓、HSC、上皮细胞、肝细胞、视觉细胞、肌肉细胞或T细胞。
107.权利要求57-104中任一项的组合物,其中所述非病毒递送系统是脂质纳米颗粒、脂质体、多肽纳米颗粒、二氧化硅纳米颗粒、金纳米颗粒、聚合物纳米颗粒、树状聚合物或阳离子纳米乳液。
108.在有此需要的受试者中表达基因的方法,所述方法包括向所述受试者施用有效量的权利要求1-107中任一项的组合物,从而在所述受试者中表达所述一个或多个转基因。
109.用于在细胞中表达基因的方法,所述方法包括将权利要求1-107中任一项的组合物递送至所述细胞,从而在所述细胞中表达所述一个或多个转基因。
110.使用权利要求1-107中任一项的组合物的方法,所述方法包括将所述组合物递送至受试者,从而在所述受试者中表达所述一个或多个转基因。
111.在有此需要的受试者中治疗疾病或病症的方法,所述方法包括将权利要求1-107中任一项的组合物递送至所述受试者,从而在所述受试者中表达所述一个或多个转基因。
112.权利要求111的方法,其中所述疾病或病症是基因疾病或病症。
113.权利要求111的方法,其中所述疾病或病症是遗传性基因疾病或病症。
114.权利要求111的方法,其中所述疾病或病症是镰状细胞病、β-地中海贫血、血友病B、视网膜色素变性、杜氏肌营养不良症、囊性纤维化或癌症。
115.权利要求108-114中任一项的方法,其中所述一个或多个转基因被整合到靶细胞的基因组中。
116.权利要求115的方法,其中所述一个或多个转基因稳定表达持续至少一周、至少两周、至少一个月、至少6个月、至少一年或持续所述受试者的一生。
117.在有此需要的受试者中引发免疫应答的方法,所述方法包括向所述受试者施用有效量的权利要求1-107中任一项的组合物,从而在所述受试者中表达所述一个或多个转基因。
118.权利要求117的方法,其中所述受试者患有癌症,并且所述一个或多个转基因编码肿瘤抗原。
119.权利要求117的方法,其中所述受试者患有感染性疾病或处于感染感染性疾病的风险中,并且所述一个或多个转基因编码与所述感染性疾病相关的抗原。
120.权利要求108-119中任一项的方法,其中所述组合物被局部或全身递送。
121.权利要求120的方法,其中所述组合物通过注射、吸入、静脉内、腹膜内、皮下、肌肉内、经口、鼻内、通过肺部施用、经皮、经粘膜或瘤内递送。
122.用于在权利要求1-107中任一项的组合物中使用的一个或多个核酸模板,所述核酸模板包含5’UTR、编码一个或多个逆转录病毒Pol多聚蛋白组分的核酸序列以及3’UTR,其中所述Pol多聚蛋白组分的表达不需要从行内gag基因的翻译滑动。
123.用于在权利要求1-107中任一项的组合物中使用的一个或多个核酸模板,所述核酸模板包含5’UTR、编码gag-pol基因的核酸序列以及3’UTR。
124.权利要求123的一个或多个核酸模板,其中所述gag-pol基因包含移码突变。
125.用于在权利要求1-107中任一项的组合物中使用的一个或多个核酸模板,所述核酸模板包含5’UTR、编码gag-pol基因的核酸序列以及3’UTR,其中所述gag-pol基因不编码基质蛋白。
126.权利要求122-125中任一项的核酸模板,其还包含编码一个或多个辅助蛋白的核酸序列,所述辅助蛋白选自NC、CA、MA、p6、Vif、Tat、Nef、Vpr和Vpu。
127.权利要求122-126中任一项的核酸模板,其中所述Pol多聚蛋白组分和/或辅助蛋白基于来自以下的Pol多聚蛋白组分和辅助蛋白:人免疫缺陷病毒(HIV)、猿猴免疫缺陷病毒(SIV)、visna/maedi病毒(VMV)、山羊关节炎脑炎病毒(CAEV)、马传染性贫血病毒(EIAV)、猫免疫缺陷病毒(FIV)、牛免疫缺陷病毒(BIV)、人泡沫病毒(HFV)、鼠白血病病毒(MLV)、莫洛尼鼠白血病病毒(MoLV)、弗里德病毒(FV)、艾贝尔森鼠白血病病毒(A-MLV)、鼠干细胞病毒(MSCV)、鼠乳腺肿瘤病毒(MMTV)、莫洛尼鼠肉瘤病毒(MoMSV)、劳氏肉瘤病毒(RSV)、藤浪肉瘤病毒(FuSV)、FBR鼠骨肉瘤病毒(FBR MSV)、禽骨髓细胞瘤病毒29(MC29)、禽成红细胞增多症病毒(AEV)、人T细胞白血病病毒(HTLV)、Friend MLV(FrMLV)、禽肉瘤病毒(ASV)、禽白血病病毒、禽成髓细胞瘤病毒、UR2肉瘤病毒、Y73肉瘤病毒、Jaagsiekte绵羊逆转录病毒、叶猴病毒、Mason-pfizer猴病毒、松鼠猴逆转录病毒、禽癌米尔希尔病毒2、牛白血病病毒、灵长类T淋巴细胞病毒1、灵长类T淋巴细胞病毒2、灵长类嗜T淋巴细胞病毒3、大眼鲥鱼真皮肉瘤病毒、大眼鲥鱼表皮增生病毒1、大眼鲥鱼表皮增生病毒2、小鸡合胞病毒、猫白血病病毒、Finkel-Biskis-Jinkins鼠肉瘤病毒、Gardner-Arnstein猫肉瘤病毒、长臂猿白血病病毒、豚鼠C型肿瘤病毒、Hardy-Zuckerman猫肉瘤病毒、Harvey鼠肉瘤病毒、Kirsten鼠肉瘤病毒、考拉逆转录病毒、莫洛尼鼠肉瘤病毒、猪C型肿瘤病毒、网状内皮增生病毒、Snyder-Theilen猫肉瘤病毒、Trager鸭脾坏死病毒、毒蛇逆转录病毒、毛猴肉瘤病毒、Jembrana病病毒、美洲狮慢病毒、牛泡沫病毒、马泡沫病毒、猫泡沫病毒、棕色大丛猴原猿泡沫病毒、婆罗洲猩猩猿猴泡沫病毒、中央黑猩猩猿猴泡沫病毒、食蟹猴猿猴泡沫病毒、东方黑猩猩猿猴泡沫病毒、绿猴猿猴泡沫病毒、长尾猴猿猴泡沫病毒、日本猕猴猿猴泡沫病毒、恒河猴猿猴泡沫病毒、蜘蛛猴猿猴泡沫病毒、松鼠猴猿猴泡沫病毒、台湾猕猴猿猴泡沫病毒、西方黑猩猩猿猴泡沫病毒、西部低地大猩猩猿猴泡沫病毒、白绒耳狨猴猿猴泡沫病毒或黄胸卷尾猴猿猴泡沫病毒。
128.产生RNA分子的方法,其包括体外转录权利要求122-127中任一项的核酸模板。
129.包含一个或多个容器的试剂盒,所述一个或多个容器包含权利要求1-107中任一项的组合物,或权利要求122-127中任一项的核酸模板。
CN202180062136.3A 2020-07-17 2021-07-16 用于基因病症的核酸疗法 Pending CN116171326A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063053474P 2020-07-17 2020-07-17
US63/053,474 2020-07-17
PCT/US2021/042015 WO2022016077A1 (en) 2020-07-17 2021-07-16 Nucleic acid therapeutics for genetic disorders

Publications (1)

Publication Number Publication Date
CN116171326A true CN116171326A (zh) 2023-05-26

Family

ID=77519749

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180062136.3A Pending CN116171326A (zh) 2020-07-17 2021-07-16 用于基因病症的核酸疗法

Country Status (10)

Country Link
US (1) US20220096525A1 (zh)
EP (1) EP4182332A1 (zh)
JP (1) JP2023535381A (zh)
KR (1) KR20230040353A (zh)
CN (1) CN116171326A (zh)
AU (1) AU2021308688A1 (zh)
BR (1) BR112023000784A2 (zh)
CA (1) CA3184980A1 (zh)
IL (1) IL299446A (zh)
WO (1) WO2022016077A1 (zh)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050048652A1 (en) * 2003-08-19 2005-03-03 Iowa State University Research Foundation, Inc. Retroelement vector system for amplification and delivery of nucleotide sequences in plants
US7404969B2 (en) 2005-02-14 2008-07-29 Sirna Therapeutics, Inc. Lipid nanoparticle based compositions and methods for the delivery of biologically active molecules
SI3431076T1 (sl) 2009-06-10 2022-04-29 Arbutus Biopharma Corporation Izboljšana lipidna formulacija
WO2012156839A2 (en) * 2011-05-19 2012-11-22 Ospedale San Raffaele S.R.L. New generation of splice-less lentiviral vectors for safer gene therapy applications
KR20230048162A (ko) 2015-03-30 2023-04-10 그린라이트 바이오사이언시스, 아이엔씨. 리보핵산의 무세포 생산
KR20180074699A (ko) * 2015-11-09 2018-07-03 이뮨 디자인 코포레이션 이종 핵산을 발현하는 rna 레플리콘의 발현 및 투여를 위한 레트로바이러스 벡터
AU2017246458B2 (en) 2016-04-06 2022-08-11 Greenlight Biosciences, Inc. Cell-free production of ribonucleic acid
IL273887B (en) 2017-10-11 2022-09-01 Greenlight Biosciences Inc Methods and preparations for the production of nucleoside triphosphate and ribonucleic acid

Also Published As

Publication number Publication date
JP2023535381A (ja) 2023-08-17
US20220096525A1 (en) 2022-03-31
IL299446A (en) 2023-02-01
CA3184980A1 (en) 2022-01-20
EP4182332A1 (en) 2023-05-24
BR112023000784A2 (pt) 2023-03-28
AU2021308688A1 (en) 2023-02-16
KR20230040353A (ko) 2023-03-22
WO2022016077A1 (en) 2022-01-20

Similar Documents

Publication Publication Date Title
CN110891420B (zh) Cas转基因小鼠胚胎干细胞和小鼠及其应用
KR20230019843A (ko) 표적 이중 가닥 뉴클레오티드 서열의 두 가닥의 동시 편집을 위한 방법 및 조성물
AU2022204199A1 (en) Gene editing of deep intronic mutations
KR20210143230A (ko) 뉴클레오티드 서열을 편집하기 위한 방법 및 조성물
US20040219516A1 (en) Viral vectors containing recombination sites
KR20210143897A (ko) 오리지아스로부터의 트랜스포사제를 이용한 핵산 작제물의 진핵세포로의 통합
KR20200074132A (ko) 리소좀 장애를 위한 유전자 요법
AU2021200988A1 (en) Gene therapy for retinitis pigmentosa
KR20210144861A (ko) 아마이엘로이스로부터의 트랜스포사제를 이용한 핵산 작제물의 진핵세포 게놈으로의 전위
US20240052366A1 (en) Production of Lentiviral Vectors
BRPI0613784A2 (pt) expressão de gene múltipla incluindo constructos sorf e métodos com poliproteìnas, pro-proteìnas e proteólise
CN101208425A (zh) 产生复制缺陷型腺病毒的细胞系
CN115038789A (zh) 治疗性编辑
EP3974524A1 (en) Dna vectors, transposons and transposases for eukaryotic genome modification
US20050251872A1 (en) Lentiviral vectors, related reagents, and methods of use thereof
US20210079360A1 (en) Viral vector production system
KR20210049133A (ko) 무혈청 배지에서 벡터 제조
KR20210149702A (ko) 비바이러스성 dna 벡터 및 페닐알라닌 히드록실라아제(pah) 치료제 발현을 위한 이의 용도
KR20230129996A (ko) 탈아미노화를 포함하는 게놈 편집을 위한 폴리뉴클레오타이드,조성물 및 방법
US20210062220A1 (en) Methods and constructs for production of lentiviral vector
KR20230129162A (ko) 제1형 근긴장성 이영양증을 치료하기 위한 rna 표적화조성물 및 방법
CN110582305A (zh) 用于治疗血红蛋白病的载体和组合物
CN110305902B (zh) 一种在工具细胞中激活hSyn启动子的方法及其应用
CN116171326A (zh) 用于基因病症的核酸疗法
KR20240037192A (ko) 게놈 통합을 위한 방법 및 조성물

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination