CN111885915A - 使用crispr/cas系统对动物进行转录调制 - Google Patents

使用crispr/cas系统对动物进行转录调制 Download PDF

Info

Publication number
CN111885915A
CN111885915A CN201980020470.5A CN201980020470A CN111885915A CN 111885915 A CN111885915 A CN 111885915A CN 201980020470 A CN201980020470 A CN 201980020470A CN 111885915 A CN111885915 A CN 111885915A
Authority
CN
China
Prior art keywords
sequence
human animal
seq
protein
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201980020470.5A
Other languages
English (en)
Other versions
CN111885915B (zh
Inventor
查琳·亨特
苏珊娜·哈特福德
国春·龚
布莱恩·扎姆布罗维兹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Regeneron Pharmaceuticals Inc
Original Assignee
Regeneron Pharmaceuticals Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Regeneron Pharmaceuticals Inc filed Critical Regeneron Pharmaceuticals Inc
Priority to CN202310370809.2A priority Critical patent/CN116349651A/zh
Publication of CN111885915A publication Critical patent/CN111885915A/zh
Application granted granted Critical
Publication of CN111885915B publication Critical patent/CN111885915B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New breeds of animals
    • A01K67/027New breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/072Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/20Animal model comprising regulated expression system
    • A01K2217/206Animal model comprising tissue-specific expression system, e.g. tissue specific expression of transgene, of Cre recombinase
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/0306Animal model for genetic diseases
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/035Animal model for multifactorial diseases
    • A01K2267/0362Animal model for lipid/glucose metabolism, e.g. obesity, type-2 diabetes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • C12N2015/8527Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic for producing animal models, e.g. for tests or diseases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/50Physical structure
    • C12N2310/53Physical structure partially self-complementary or closed
    • C12N2310/531Stem-loop; Hairpin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/10Applications; Uses in screening processes
    • C12N2320/11Applications; Uses in screening processes for the determination of target sites, i.e. of active nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/30Vector systems comprising sequences for excision in presence of a recombinase, e.g. loxP or FRT
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/008Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination

Abstract

提供了包含CRISPR/Cas协同激活介质系统组分的非人动物细胞和非人动物,以及制备和使用这种非人动物细胞和非人动物的方法。提供了使用此类非人动物增加体内靶基因表达并评估CRISPR/Cas协同激活介质系统增加体内靶基因表达能力的方法。

Description

使用CRISPR/CAS系统对动物进行转录调制
相关申请的交叉引用
本申请要求于2018年3月19日提交的美国申请号62/644,961的权益,出于所有目的将通过引用整体并入本文。
对通过EFS Web提交为文本文件的序列表的引用
写在文件527578SEQLIST.txt中的序列表为137KB,创建于2019年3月19日,通过引用并入。
背景技术
在许多生物过程(如发育和疾病)中,基因表达受到严格控制。转录因子通过与靶基因的增强子和启动子区域的特定DNA序列结合来调节基因表达,并通过其效应子域调制(modulate)转录。基于相同的原理,通过将各种功能域融合到经工程化以与目标基因结合的DNA结合域中以产生人工转录因子(ATF),从而调节该目标基因的表达。然而,这些ATF的结合特异性通常是简并(degenerate)的,可能难以预测,并且复杂及费时的设计和产生限制了其应用。
CRISPR/Cas技术是一种有前途的新治疗方式,其不仅可以用于进行靶向的基因组修饰,而且可以用于调节靶基因的转录。然而,需要一种更好的方法来评估体内引入的CRISPR/Cas试剂的效率。在体内测试该系统的局限性之一是需要同时将所有组分引入活生物体。引入这些组分的典型方法是将DNA构建体瞬时转染到将生成适当的RNA和蛋白质的细胞中。尽管有效,但是这种方法具有固有的缺点,因为细胞必须依靠质粒DNA构建体先进行转录,然后翻译,其后Cas蛋白才可用于与sgRNA组分相互作用。需要更好的方法和工具来更有效地评估引入的CRISPR/Cas试剂的活性,并评估靶向体内特定组织或细胞类型的不同递送方法和参数。
另外,诸如CRISPR/Cas试剂之类的生物活性剂向对象的递送通常由于组分到达靶细胞或组织的的困难而受到阻碍。这些限制可能导致,例如,需要使用比达到结果所需的浓度高得多的试剂浓度,这增加了毒性作用和副作用的风险。需要改进的体内递送方法和评估此类递送方法的方法。
发明内容
提供了包含CRISPR/Cas协同激活介质(SAM)系统的非人动物,以及使用此类非人动物(例如SAM就绪(SAM-ready)的非人动物)评估CRISPR/Cas SAM试剂在体内激活靶基因转录的能力或评估在体内激活靶基因的转录或增加靶基因的表达的影响。还提供了包含CRISPR/Cas协同激活介质(SAM)系统的非人动物基因组或细胞。
在一个方面,提供了非人动物基因组、非人动物细胞或非人动物,其包含一个或多个基因组整合的协同激活介质表达盒。此类非人动物基因组、非人动物细胞或非人动物可包含,例如,第一基因组整合表达盒,其中所述第一表达盒包含:(a)编码嵌合成簇的规律间隔的短回文重复序列(CRISPR)相关(Cas)蛋白的核酸,其包含与一个或多个转录激活域融合的核酸酶失活(nuclease-inactive)的Cas蛋白;以及(b)编码嵌合衔接体蛋白的核酸,所述嵌合衔接体蛋白包含与一个或多个转录激活域融合的衔接体。
此类非人动物基因组、非人动物细胞,或非人动物可进一步包含一个或多个指导RNA或编码所述一个或多个指导RNA的表达盒,每个指导RNA包含一个或多个衔接体结合元件,所述嵌合衔接体蛋白可以特异性结合至所述衔接体结合元件,其中所述一个或多个指导RNA中的每一个能够与所述Cas蛋白形成复合物并将其引导至靶基因内的靶序列。可选地,编码所述一个或多个指导RNA的表达盒在腺相关病毒(AAV),例如AAV8中。可选地,编码所述一个或多个指导RNA的表达盒在AAV中,所述一个或多个指导RNA中的每一个可操作地连接至不同的U6启动子,并且所述一个或多个指导RNA包含靶向单个基因的多个指导RNA。
此类非人动物基因组、非人动物细胞,或非人动物可进一步包含编码一个或多个指导RNA的第二基因组整合表达盒,每个指导RNA包含一个或衔接体结合元件,所述嵌合衔接体蛋白可以特异性结合至所述衔接体结合元件,其中所述一个或多个指导RNA中的每一个能够与所述Cas蛋白形成复合物并将其引导至靶基因内的靶序列。
在一些非人动物基因组、非人动物细胞,或非人动物中,靶序列包含靶基因内的调控序列。可选地,所述调控序列包含启动子或增强子。在一些非人动物基因组、非人动物细胞,或非人动物中,所述靶序列在靶基因的转录起始位点的200个碱基对内。可选地,所述靶序列在转录起始位点上游的200个碱基对和转录起始位点下游的1个碱基对的区域内。
在一些非人动物基因组、非人动物细胞,或非人动物中,编码所述一个或多个指导RNA中的每一个的序列可操作地连接至不同的启动子,例如U6启动子。在一些非人动物基因组、非人动物细胞,或非人动物中,所述一个或多个指导RNA中的每一个均包含两个衔接体结合元件,所述嵌合衔接体蛋白可以特异性地与所述两个衔接体结合元件结合。可选地,第一衔接体结合元件在所述一个或多个指导RNA的每一个的第一环内,且第二衔接体结合元件在所述一个或多个指导RNA的每一个的第二环内。可选地,所述一个或多个指导RNA中的每一个是单指导RNA,所述单指导RNA包含融合至反式激活CRISPR RNA(tracrRNA)部分的CRISPR RNA(crRNA)部分,其中所述第一环是对应于SEQ ID NO:12的残基13-16的四环(tetraloop),所述第二环是对应于SEQ ID NO:12的残基53-56的茎环2。在一些非人动物基因组、非人动物细胞,或非人动物中,衔接体结合元件包含SEQ ID NO:16所示的序列。可选地,所述一个或多个指导RNA中的每一个包含SEQ ID NO:40或63所示的序列。
在一些非人动物基因组、非人动物细胞,或非人动物中,所述一个或多个指导RNA中的至少一个靶向疾病相关基因。可选地,所述一个或多个指导RNA中的至少一个靶向Ttr基因,可选地,其中Ttr靶向的指导RNA靶向包含SEQ ID NO:34-36中任一个所示的序列的序列,或可选地,其中所述Ttr靶向的指导RNA包含SEQ ID NO:37-39中任一个所示的序列。可选地,所述一个或多个指导RNA中的至少一个靶向Pcsk9基因,可选地,其中Pcsk9靶向的指导RNA靶向包含SEQ ID NO:89-91中任一个所示的序列的序列,或可选地,其中所述Pcsk9靶向的指导RNA包含SEQ ID NO:92-94中任一个所示的序列。可选地,所述一个或多个指导RNA中的至少一个靶向Ldlr基因,可选地,其中Ldlr靶向的指导RNA靶向包含SEQ ID NO:75-77中任一个所示的序列的序列,或可选地,其中所述Ldlr靶向的指导RNA包含SEQ ID NO:78-80中任一个所示的序列。
在一些非人动物基因组、非人动物细胞,或非人动物中,所述一个或多个指导RNA靶向两个或多个靶基因。在一些非人动物基因组、非人动物细胞,或非人动物中,所述一个或多个指导RNA包含靶向单个靶基因的多个指导RNA。在一些非人动物基因组、非人动物细胞,或非人动物中,所述一个或多个指导RNA包含靶向单个靶基因的至少三个指导RNA。可选地,所述至少三个指导RNA靶向小鼠Ttr基因座,其中第一指导RNA靶向包含SEQ ID NO:34的序列或包含SEQ ID NO:37所示的序列,第二指导RNA靶向包含SEQ ID NO:35的序列或包含SEQ ID NO:38所示的序列,且第三指导RNA靶向包含SEQ ID NO:36的序列或包含SEQ IDNO:39所示的序列。可选地,所述至少三个指导RNA靶向小鼠Pcsk9基因座,其中第一指导RNA靶向包含SEQ ID NO:89的序列或包含SEQ ID NO:92所示的序列,第二指导RNA靶向包含SEQID NO:90的序列或包含SEQ ID NO:93所示的序列,且第三指导RNA靶向包含SEQ ID NO:91的序列或包含SEQ ID NO:94所示的序列。可选地,所述至少三个指导RNA靶向小鼠Ldlr基因座,其中第一指导RNA靶向包含SEQ ID NO:75的序列或包含SEQ ID NO:78所示的序列,第二指导RNA靶向包含SEQ ID NO:76的序列或包含SEQ ID NO:79所示的序列,且第三指导RNA靶向包含SEQ ID NO:77的序列或包含SEQ ID NO:80中所示的序列。
在一些非人动物基因组、非人动物细胞,或非人动物中,Cas蛋白是Cas9蛋白。可选地,Cas9蛋白是化脓链球菌(Streptococcus pyogenes)Cas9蛋白。任选地,当与化脓链球菌(Streptococcus pyogenes)Cas9蛋白最佳比对时,Cas9蛋白包含对应于D10A和N863A的突变。可选地,对编码Cas蛋白的序列进行密码子优化以在非人动物中表达。
在一些非人动物基因组、非人动物细胞,或非人动物中,嵌合Cas蛋白中的一个或多个转录激活因子结构域(transcriptional activator domain)选自:VP16、VP64、p65、MyoD1、HSF1、RTA、SET7/9及其组合。可选地,嵌合Cas蛋白中的一个或多个转录激活因子结构域包含VP64。
在一些非人动物基因组、非人动物细胞,或非人动物中,嵌合Cas蛋白包括从N末端到C末端的:无催化活性的Cas蛋白质;和VP64转录激活因子结构域。在一些非人动物基因组、非人动物细胞,或非人动物中,嵌合Cas蛋白包括从N末端到C末端的:无催化活性的Cas蛋白质、核定位信号,和VP64转录激活因子结构域。可选地,嵌合Cas蛋白包含与SEQ ID NO:1所示序列至少90%、95%、96%、97%、98%、99%,或100%相同的序列。可选地,编码嵌合Cas蛋白的第一表达盒的片段包含与SEQ ID NO:25所示的序列至少90%、95%、96%、97%、98%、99%,或100%相同的序列。
在一些非人动物基因组、非人动物细胞,或非人动物中,所述第一表达盒进一步包含在编码所述嵌合Cas蛋白的片段的上游的多腺苷酸化信号或转录终止子,其中所述多腺苷酸化信号或转录终止子被重组酶识别位点侧接,其中所述多腺苷酸化信号或转录终止子已以组织特异性方式切除。可选地,已经在肝脏中切除了多腺苷酸化信号或转录终止子。可选地,重组酶是Cre重组酶。可选地,非人动物基因组、非人动物细胞,或非人动物还包含基因组整合的重组酶表达盒,所述基因组整合的重组酶表达盒包含可操作地连接至组织特异性启动子的重组酶编码序列。可选地,重组酶基因可操作地连接于表2所示的启动子之一。
在一些非人动物基因组、非人动物细胞,或非人动物中,衔接体位于嵌合衔接体蛋白的N末端,一个或多个转录激活域位于嵌合衔接体蛋白的C末端。可选地,衔接体包含MS2外壳蛋白或其功能片段或变体。可选地,嵌合衔接体蛋白中的一个或多个转录激活域选自:VP16、VP64、p65、MyoD1、HSF1、RTA、SET7/9及其组合。可选地,嵌合衔接体蛋白中的一个或多个转录激活域包含p65和HSF1。
在一些非人动物基因组、非人动物细胞,或非人动物中,嵌合衔接体蛋白包含从N末端至C末端:MS2外壳蛋白、核定位信号、p65转录激活域,和HSF1转录激活域。任选地,嵌合衔接体蛋白包含与SEQ ID NO:6所示的序列至少90%、95%、96%、97%、98%、99%,或100%相同的序列。可选地,编码嵌合衔接体蛋白的第一表达盒的片段包含与SEQ ID NO:27所示的序列至少90%、95%、96%、97%、98%、99%,或100%相同的序列。
在一些非人动物基因组、非人动物细胞,或非人动物中,第一表达盒是多顺反子(multicistronic)。可选地,通过内部核糖体进入位点(IRES)将编码嵌合Cas蛋白的第一表达盒的片段与编码嵌合衔接体蛋白的第一表达盒的片段分开。可选地,通过编码2A肽的核酸将编码嵌合Cas蛋白的第一表达盒的片段与编码嵌合衔接体蛋白的第一表达盒的片段分开。可选地,2A肽是T2A肽。
在一些非人动物基因组、非人动物细胞,或非人动物中,第一表达盒被整合到安全港基因座(safe harbor locus)中。在一些非人动物基因组、非人动物细胞,或非人动物中,第一表达盒和/或第二表达盒被整合到安全港基因座中。任选地,非人动物基因组、非人动物细胞,或非人动物对于第一表达盒是杂合的,对于第二表达盒是杂合的,且第一表达盒基因组整合于所述安全港基因座的第一等位基因中,且第二表达盒基因组整合于所述安全港基因座的第二等位基因中。可选地,所述安全港基因座是Rosa26基因座。可选地,所述第一表达盒与所述安全港基因座中的内源启动子可操作地连接。
一些这样的非人动物是哺乳动物。可选地,哺乳动物是啮齿动物。可选地,所述啮齿动物是大鼠或小鼠。可选地,所述啮齿动物是小鼠。
在另一方面,提供了用于制备以上公开的任何非人动物基因组、非人动物细胞,和非人动物的靶向载体。此类靶向载体可包含被在靶基因组基因座处靶向5'靶序列的5'同源臂和在所述靶基因组基因座处靶向3'靶序列的3'同源臂侧接的插入核酸,其中插入核酸包含表达盒,其中所述表达盒包含(a)编码嵌合成簇的规律间隔的短回文重复序列(CRISPR)相关(Cas)蛋白的核酸,其包含与一个或多个转录激活域融合的核酸酶失活的Cas蛋白;以及(b)编码嵌合衔接体蛋白的核酸,所述嵌合衔接体蛋白包含与一个或多个转录激活域融合的衔接体。
在另一方面,提供了制造以上公开的任何非人动物的方法。一些这样的方法包括:(a)向非人动物胚胎干(ES)细胞引入:(i)靶向靶基因组基因座中的靶序列的核酸酶剂;(ii)靶向载体,其包含核酸插入物,所述核酸插入物包含第一表达盒,所述第一表达盒被在靶基因组基因座中对应5'靶序列的5'同源臂和在靶基因组基因座中对应3'靶序列的3'同源臂侧接,其中所述靶向载体与所述靶基因组基因座重组以产生遗传修饰的非人ES细胞,所述遗传修饰的非人ES细胞在其基因组中包含所述靶基因组基因座处的第一表达盒;(b)将经遗传修饰的非人ES细胞引入非人动物宿主胚胎中;以及(c)在代孕母体中孕育非人动物宿主胚胎,其中所述代孕母体产生F0代遗传修饰的非人动物,该非人动物的基因组中包含靶基因组基因座处的第一表达盒。可选地,靶向载体为长度至少为10kb的大靶向载体,或其中5'和3'同源臂的长度总和至少为10kb。
一些这样的方法包括:(a)向非人动物单细胞期胚胎中引入:(i)靶向靶基因组基因座中的靶序列的核酸酶剂;以及(ii)靶向载体,所述靶向载体包含核酸插入物,所述核酸插入物包含第一表达盒,所述第一表达盒被靶基因组基因座中对应5'靶序列的5'同源臂和在靶基因组基因座中对应3'靶序列的3'同源臂侧接,其中所述靶向载体与所述靶基因组基因座重组以产生遗传修饰的非人ES细胞,所述遗传修饰的非人ES细胞在其基因组中包含所述靶基因组基因座处的第一表达盒;(b)在代孕母体中孕育遗传修饰的非人动物单细胞期胚胎,以产生遗传修饰的F0代非人动物,所述遗传修饰的F0代非人动物在其基因组中包含在靶基因组基因座处的第一表达盒。
在一些这样的方法中,所述核酸酶剂包括Cas蛋白和指导RNA。可选地,所述Cas蛋白是Cas9蛋白。可选地,这样的方法可以包括引入在靶基因组基因座内靶向第二靶序列的第二指导RNA。
在一些这样的方法中,所述非人动物是小鼠或大鼠。可选地,所述非人动物是小鼠。
在另一方面,提供了增加靶基因在任何所述非人动物体内的表达的方法。这样的方法可以包括,例如,将一个或多个指导RNA引入非人动物,每个所述指导RNA包含一个或多个衔接体结合元件,所述嵌合衔接体蛋白可以特异性结合至所述衔接体结合元件,其中所述一个或多个指导RNA与所述嵌合Cas蛋白和嵌合衔接体蛋白形成复合物并将它们引导至靶基因内的靶序列,从而增加靶基因的表达。可选地,靶基因是在肝脏中表达的基因。
在一些此类方法中,通过腺相关病毒(AAV)介导的递送引入所述一个或多个指导RNA。可选地,AAV是AAV8。在一些此类方法中,通过脂质纳米颗粒介导的递送或流体动力递送来引入所述一个或多个指导RNA。在一些这样的方法中,将所述一个或多个指导RNA给予非人动物的途径是静脉内注射、脑内(intraparenchymal)注射、腹膜内注射、滴鼻法(nasalinstallation),或玻璃体内注射。
在一些这样的方法中,所述靶序列包含靶基因内的调控序列。可选地,所述调控序列包含启动子或增强子。在一些这样的方法中,所述靶序列在靶基因的转录起始位点的200个碱基对内。可选地,所述靶序列在转录起始位点上游的200个碱基对和转录起始位点下游的1个碱基对的区域内。
在一些这样的方法中,所述一个或多个指导RNA以RNA的形式被引入。在一些这样的方法中,所述一个或多个指导RNA以DNA的形式被引入。可选地,所述一个或多个指导RNA中的每一个可操作地连接至不同的启动子,例如U6启动子。
在一些这样的方法中,所述一个或多个指导RNA中的每一个均包含两个衔接体结合元件,所述嵌合衔接体蛋白可以特异性地与所述两个衔接体结合元件结合。可选地,第一衔接体结合元件在所述一个或多个指导RNA的每一个的第一环内,且第二衔接体结合元件在所述一个或多个指导RNA的每一个的第二环内。可选地,所述一个或多个指导RNA中的每一个是单指导RNA,所述单指导RNA包含融合至反式激活CRISPR RNA(tracrRNA)部分的CRISPR RNA(crRNA)部分,其中所述第一环是对应于SEQ ID NO:12的残基13-16的四环,所述第二环是对应于SEQ ID NO:12的残基53-56的茎环2。
在一些这样的方法中,所述衔接体结合元件包含SEQ ID NO:16所示的序列。可选地,所述一个或多个指导RNA中的每一个包含SEQ ID NO:40或63所示的序列。
在一些这样的方法中,所述一个或多个指导RNA中的至少一个靶向疾病相关基因。可选地,所述疾病相关基因是Ttr基因,可选地,其中所述Ttr靶向的指导RNA靶向包含SEQID NO:34-36中任一个所示的序列的序列,或可选地,其中所述Ttr靶向的指导RNA包含SEQID NO:37-39中任一个所示的序列。在一些这样的方法中,所述一个或多个指导RNA中的至少一个靶向Pcsk9基因,可选地,其中Pcsk9靶向的指导RNA靶向包含SEQ ID NO:89-91中任一个所示的序列的序列,或可选地,其中所述Pcsk9靶向的指导RNA包含SEQ ID NO:92-94中任一个所示的序列。可选地,所述方法在非人动物中引起高胆固醇血症。可选地,所述一个或多个指导RNA中的至少一个靶向Ldlr基因,可选地,其中Ldlr靶向的指导RNA靶向包含SEQID NO:75-77中任意一项所示的序列的序列,或可选地,其中所述Ldlr靶向的指导RNA包含SEQ ID NO:78-80中任一个所示的序列。
在一些这样的方法中,所述一个或多个指导RNA靶向两个或多个靶基因。在一些这样的方法中,所述一个或多个指导RNA包含靶向单个靶基因的多个指导RNA。在一些这样的方法中,所述一个或多个指导RNA包含靶向单个靶基因的至少三个指导RNA。可选地,所述至少三个指导RNA靶向小鼠Ttr基因座,其中第一指导RNA靶向包含SEQ ID NO:34的序列或包含SEQ ID NO:37所示的序列,第二指导RNA靶向包含SEQ ID NO:35的序列或包含SEQ IDNO:38所示的序列,且第三指导RNA靶向包含SEQ ID NO:36的序列或包含SEQ ID NO:39所示的序列。可选地,所述至少三个指导RNA靶向小鼠Pcsk9基因座,其中第一指导RNA靶向包含SEQ ID NO:89的序列或包含SEQ ID NO:92所示的序列,第二指导RNA靶向包含SEQ ID NO:90的序列或包含SEQ ID NO:93所示的序列,且第三指导RNA靶向包含SEQ ID NO:91的序列或包含SEQ ID NO:94所示的序列。可选地,所述至少三个指导RNA靶向小鼠Ldlr基因座,其中第一指导RNA靶向包含SEQ ID NO:75的序列或包含SEQ ID NO:78所示的序列,第二指导RNA靶向包含SEQ ID NO:76的序列或包含SEQ ID NO:79所述的序列,且第三指导RNA靶向包含SEQ ID NO:77的序列或包含SEQ ID NO:80中所述的序列。
在一些这样的方法中,靶基因的表达相对于对照非人动物增加至少0.5倍、1倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍,或20倍。
在一些这样的方法中,第一表达盒在编码嵌合Cas蛋白的片段的上游还包含多腺苷酸化信号或转录终止子,其中所述多腺苷酸化信号或转录终止子被重组酶识别位点侧接,所述重组酶识别位点被位点特异性重组酶识别,且其中该方法进一步包括将重组酶引入非人动物中。可选地,重组酶是Cre重组酶。可选地,重组酶通过腺相关病毒(AAV)介导的递送而引入。可选地,AAV是AAV8。可选地,重组酶通过脂质纳米颗粒介导的递送或流体动力递送引入。可选地,以组织特异性的方式引入或表达重组酶。可选地,以蛋白形式引入重组酶。可选地,以DNA或RNA的形式引入重组酶。可选地,以与表2中列出的启动子之一可操作地连接的DNA的形式引入重组酶。可选地,向非人动物施用重组酶的途径是静脉内注射、脑内注射、腹膜内注射、滴鼻法,或玻璃体内注射。
在一些这样的方法中,一个或多个指导RNA通过腺相关病毒(AAV)介导的递送被引入,所述一个或多个指导RNA中的每一个可操作地连接至不同的U6启动子,并且所述一个或多个指导RNA包括靶向单个基因的多个指导RNA。
在另一方面,提供了一种在上述任何非人动物中模拟高胆固醇血症的方法。这样的方法可包括将一个或多个靶向Pcsk9的指导RNA引入所述非人动物,其中所述一个或多个指导RNA中的每一个包含一个或多个嵌合体结合元件,嵌合衔接体蛋白可以特异性结合至所述衔接体结合元件,其中一个或多个指导RNA与嵌合Cas蛋白和嵌合衔接体蛋白形成复合物,并将它们引导至Pcsk9内的靶序列,从而增加Pcsk9的表达并引起高胆固醇血症。
附图说明
图1A(未按比例)示出了lox-stop-lox(LSL)dCas9协同激活介质(SAM)等位基因,由5'到3'包含:一个3'剪接序列;第一loxP位点;新霉素抗性基因;多腺苷酸化信号;第二loxP位点;dCas9-NLS-VP64编码序列;T2A肽编码序列;MCP-NLS-p65-HSF1编码序列;以及土拨鼠肝炎病毒转录后调控元件(WPRE)。
图1B(未按比例)示出了来自图1A的等位基因,其中floxed新霉素抗性基因和多腺苷酸化信号被去除。
图2示出了将图1A中的dCas9 SAM等位基因靶向到Rosa26基因座的第一内含子中的一般示意图。
图3A示出了F1H4野生型(WT)小鼠胚胎干细胞(mESCs)、Cas9WT mESCs、lox-stop-lox(LSL)dCas9 SAM mESCs(如图1A所示,具有处于floxed多腺苷酸化信号下游的dCas9SAM等位基因的mESCs)和dCas9SAM mESCs(如图1B所示,其中floxed多腺苷酸化信号被Cre重组酶切除的dCas9 SAM等位基因的mESCs)中的Cas9 mRNA表达水平。
图3B示出了F1H4野生型(WT)小鼠胚胎干细胞(mESCs)、Cas9WT mESCs、LSL dCas9SAM mESCs(见图1A),和dCas9 SAM mESCs(见图1B)中的p65 mRNA表达水平。
图4示出了F1H4野生型(WT)小鼠胚胎干细胞(mESCs)、Cas9 WT mESCs,LSL dCas9SAM mESCs(见图1A),和dCas9 SAM mESCs(见图1B)中的Cas9蛋白表达水平。
图5(未按比例)示出了将指导RNA阵列(array)等位基因引入dCas9SAM小鼠胚胎干细胞的示意图。指导RNA阵列等位基因从5'到3'包括:3'剪接序列;第一rox位点;嘌呤霉素抗性基因;多腺苷酸化信号;第二rox位点;第一U6启动子;第一指导RNA编码序列;第二U6启动子;第二指导RNA编码序列;第三U6启动子;第三指导RNA编码序列。
图6(未按比例)示出了设计靶向Ttr的转录起始位点上游的三个指导RNA的示意图。
图7示出了通用单指导RNA(SEQ ID NO:63)的示意图,其中四环和茎环2已被MS2结合的适配体替代,以促进融合至转录激活域的嵌合MS2外壳蛋白(MCP)的募集。
图8A至8C分别示出了被Ttr指导RNA阵列靶定的杂合dCas9 SAM小鼠胚胎干细胞(mESC)克隆中的Ttr、Dsg2,和B4galt6 mRNA表达水平。通过RT-qPCR确定表达水平。y轴表示循环阈(ct)值。使用F1H4野生型mESCs、LSL dCas9 SAM(见图1A),和dCas9 SAM(见图1B)mESC克隆作为对照。
图9A-9L示出了从野生型小鼠、杂合dCas9 SAM小鼠,和对Ttr指导RNA阵列也是杂合的杂合dCas9 SAM小鼠分离的各种组织中的TTR蛋白表达。
图10A和10B分别示出了从野生型小鼠、杂合dCas9 SAM小鼠,和对Ttr指导RNA阵列也是杂合的杂合dCas9 SAM小鼠分离的肺和脾中的Ttr mRNA表达水平。通过RT-qPCR确定表达水平。y轴表示循环阈(ct)值。
图10C和10D分别示出了从野生型小鼠、杂合dCas9 SAM小鼠,和对Ttr指导RNA阵列也是杂合的杂合dCas9 SAM小鼠分离的肺和脾中的Dsg2 mRNA表达水平。通过RT-qPCR确定表达水平。y轴表示循环阈(ct)值。
图10E和10F分别示出了从野生型小鼠、杂合dCas9 SAM小鼠,和对Ttr指导RNA阵列也是杂合的杂合dCas9 SAM小鼠分离的肺和脾中Bgalt6 mRNA的表达水平。通过RT-qPCR确定表达水平。y轴表示循环阈(ct)值。
图11示出了通过ELISA测定的野生型小鼠、杂合dCas9 SAM小鼠,和对Ttr指导RNA阵列也是杂合的杂合dCas9 SAM小鼠中TTR的血清水平。
图12示出了通过ELISA测定的未经处理的杂合dCas9 SAM小鼠、经AAV8-GFP处理的杂合dCas9 SAM小鼠,和经包含Ttr指导RNA阵列的AAV8处理的杂合dCas9 SAM小鼠中的TTR血清水平,示出了注射后5天、19天,和60天的结果。
]图13示出了通过ELISA测定的野生型小鼠、杂合dCas9 SAM小鼠,和对Ttr指导RNA阵列也是杂合的杂合dCas9 SAM小鼠中的TTR循环血清水平,示出了注射后3-13个月的结果。
图14示出了通过ELISA测定的未经处理的杂合dCas9 SAM小鼠、经AAV8-GFP处理的杂合dCas9 SAM小鼠,和经包含Ttr指导RNA阵列的AAV8处理的杂合dCas9 SAM小鼠中的TTR循环血清水平,显示了注射后5天、19天、2个月、3个月、4个月、5个月、6个月、7个月,和8个月的结果。
图15示出了通过ELISA测定的未经处理的纯合dCas9 SAM小鼠、经AAV8-GFP处理的纯合dCas9 SAM小鼠,和经包含Ttr指导RNA阵列或单指导RNA 1、2或3的AAV8处理的纯合dCas9 SAM小鼠中的TTR循环血清水平,显示了注射后1星期、2星期和3星期的结果。
图16A和16B分别示出了在未经处理的纯合dCas9 SAM小鼠(PCSK9前、LDLR前、WT前、2周WT,或5周WT)、用包含Pcsk9指导RNA阵列的AAV8处理的纯合dCas9 SAM小鼠,或用包含Ldlr指导RNA阵列的AAV8处理的纯合dCas9 SAM小鼠中的胆固醇和LDL水平。
图17A和17B示出了从未经处理的纯合dCas9 SAM小鼠、用包含Pcsk9指导RNA阵列的AAV8处理的纯合dCas9 SAM小鼠,和用包含Ldlr指导RNA阵列的AAV8处理的纯合dCas9SAM小鼠分离的肝脏中的相对Ldlr和Pcsk9 mRNA表达水平。
图18A和18B分别示出了在未经处理的纯合dCas9 SAM小鼠(UNT)或用包含Ldlr指导RNA阵列的AAV8处理的纯合dCas9 SAM小鼠(LDLR(HFD))中的胆固醇和LDL水平。
图19示出了从未经处理的小鼠、用包含靶基因1指导RNA#1的AAV8处理的纯合dCas9 SAM小鼠、用包含靶基因1指导RNA#2的AAV8处理的纯合dCas9 SAM小鼠,或用包含靶基因1指导RNA#1&2的AAV8处理的纯合dCas9 SAM小鼠分离的肝脏中的靶基因1的相对mRNA表达水平。通过RT-qPCR确定表达水平。y轴表示相对于未处理样品的表达。*表示与未处理相比p<0.0001。**表示与指导RNA#1或指导RNA#2相比,p<0.001。
具体实施方式
定义
本文可互换使用的术语“蛋白质”、“多肽”,和“肽”包括任何长度的氨基酸的聚合形式,包括编码和非编码氨基酸以及化学或生物化学修饰或衍生的氨基酸。该术语还包括已被修饰的聚合物,例如具有修饰的肽主链的多肽。术语“结构域”是指具有特定功能或结构的蛋白质或多肽的任何部分。
蛋白质被称为具有“N末端”和“C末端”。术语“N末端”是指蛋白质或多肽的起始,末端为具有游离胺基(-NH2)的氨基酸。术语“C末端”是指氨基酸链(蛋白质或多肽)的末端,其末端为是游离羧基(-COOH)。
本文可互换使用的术语“核酸”和“多核苷酸”包括任何长度的核苷酸的聚合形式,包括核糖核苷酸、脱氧核糖核苷酸或其类似物或修饰形式。它们包括单链、双链,和多链DNA或RNA、基因组DNA、cDNA、DNA-RNA杂交,以及包含嘌呤碱基、嘧啶碱基,或其它天然的、化学修饰的、生物化学修饰的、非天然的,或衍生的核苷酸碱基。
核酸被称为具有“5'末端”和“3'末端”,因为单核苷酸通过使一个单核苷酸戊糖环的5'磷酸通过磷酸二酯键在一个方向上与其邻居的3'氧连接的方式反应生成寡核苷酸。如果寡核苷酸的5'磷酸未与单核苷酸戊糖环的3'氧连接,则将其称为“5'末端”。如果寡核苷酸的3'氧未与另一个单核苷酸戊糖环的5'磷酸连接,则将其末端称为“3'末端”。即使是较大的寡核苷酸内部的核酸序列也可被称为具有5'和3'末端。在线性或环状DNA分子中,离散元素被称为“下游”或3'元素的“上游”或5'。
术语“基因组整合”是指已被引入细胞以使核苷酸序列整合到细胞基因组中的核酸。可以使用任何方案将核酸稳定地掺入细胞的基因组中。
术语“表达载体”或“表达构建体”或“表达盒”是指重组核酸,其包含可操作地连接至所需编码序列,该所需编码序列可操作地连接至在特定宿主细胞或生物中表达可操作连接的编码序列所必需的合适核酸序列。在原核生物中的表达所需的核酸序列通常包括启动子、操纵子(可选)和核糖体结合位点,以及其它序列。真核细胞通常利用启动子、增强子,以及终止和多腺苷酸化信号,尽管可以在不牺牲必要表达的情况下删除一些元素并添加其它元素。
术语“靶向载体”是指可以通过同源重组、非同源末端连接介导的连接,或以任何其它重组方式引入细胞基因组中的靶向位置的重组核酸。
术语“病毒载体”是指重组核酸,其包含至少一种病毒来源的元件,并且包括足以或允许包装到病毒载体颗粒中的元件。可以将载体和/或颗粒用于将DNA、RNA,或其它核酸离体或体内转移到细胞中的目的。多种形式的病毒载体是已知的。
对于蛋白质、核酸和细胞而言的术语“分离的”包括相对于通常可能原位存在的其它细胞或生物成分而言相对纯化的蛋白质、核酸,和细胞,直至并包括蛋白质、核酸,或细胞的基本纯净的制剂。术语“分离的”还包括不具有天然存在的对应物的蛋白质和核酸,或者化学合成并因此基本上未被其它蛋白质或核酸污染的蛋白质或核酸。术语“分离的”还包括已经与蛋白质、核酸,或细胞所天然伴随的大多数其它细胞成分或生物成分分离或纯化的蛋白质、核酸或细胞(例如,其它细胞蛋白质、核酸,或细胞或细胞外成分)。
术语“野生型”包括具有在正常(相对于突变、患病,改变等)的状态或情景中发现的结构和/或活性的实体。野生型基因和多肽通常以多种不同形式(例如等位基因)存在。
术语“内源序列”是指天然存在于细胞或非人动物体内的核酸序列。例如,非人动物的内源Rosa26序列是指天然存在于非人动物的Rosa26基因座处的天然Rosa26序列。
“外源”分子或序列包括通常不以该形式存在于细胞中的分子或序列。通常的存在包括在细胞的特定发育阶段和环境条件的存在。例如,外源分子或序列可以包括细胞内相应内源序列的突变形式(例如内源序列的人源化版本),或者可以包括与细胞内的内源序列相对应但形式不同(即不在染色体内)的序列。与此相对,内源分子或序列包括在特定环境条件下,在特定发育阶段的特定细胞中通常以该形式存在的分子或序列。
当在核酸或蛋白质的上下文中使用时,术语“异源的”表示该核酸或蛋白质包含在同一分子中并非天然同时出现的至少两个片段(segment)。例如,当涉及核酸的片段或蛋白质的片段使用时,术语“异源的”表示该核酸或蛋白质包含两个或更多个在自然界中彼此之间没有相同关系(例如结合在一起)的子序列。作为一个实例,核酸载体的“异源”区域是在另一核酸分子内或附着于另一核酸分子的核酸片段,其在自然界中不与另一分子相关联。例如,核酸载体的异源区域可以包括编码序列,该编码序列侧接在自然界中与该编码序列不相关联的序列。同样地,蛋白质的“异源”区域是在另一肽分子内或附着于另一肽分子的氨基酸片段,其在自然界中不与另一肽分子相关联(例如融合蛋白或带有标签的蛋白)。类似地,核酸或蛋白质可包含异源标记或异源分泌或定位序列。
“密码子优化”利用密码子的简并性,如可指定氨基酸的三碱基对密码子组合的多样性所展示的,并且通常包括修饰核酸序列的过程,以在保持天然氨基酸序列的前提下,通过用宿主细胞基因中更常用或最常用的密码子替换天然序列的至少一个密码子,从而增强在特定宿主中的表达。例如,可以修饰编码Cas9蛋白的核酸,以用在给定的原核或真核细胞中(包括细菌细胞、酵母细胞、人细胞、非人细胞、哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞、仓鼠细胞,或任何其它宿主细胞)替换天然核酸序列相比具有更高使用频率的密码子。密码子使用情况表很容易例如在“密码子使用情况数据库(Codon Usage Database)”中获得。这些表可以以多种方式适用。参见Nakamura et al.(2000)Nucleic AcidsResearch 28:292,出于所有目的通过引用整体并入本文。也可获得用于在特定宿主中表达的特定序列的密码子优化的计算机算法(参见,例如Gene Forge)。
术语“基因座”是指基因(或重要序列)、DNA序列、多肽编码序列的特定位置,或生物体基因组的染色体上的位置。例如,“Ttr基因座”可以指Ttr基因、TtrDNA序列、TTR编码序列,或Ttr在生物体基因组染色体上的特定位置,已识别出这类序列存在于该生物体基因组染色体的何处。“Ttr基因座”可包含Ttr基因的调节元件,包括例如增强子、启动子、5'和/或3'非翻译区(UTR)或其组合。
术语“基因”是指染色体中编码产物(例如RNA产物和/或多肽产物)的DNA序列,并包括被非编码内含子打断的编码区和与5'和3'末端上的与该编码区相邻的序列,使得该基因对应于全长mRNA(包括5'和3'非翻译序列)。术语“基因”还包括其它非编码序列,包括调节序列(例如启动子、增强子,和转录因子结合位点)、多腺苷酸化信号、内部核糖体进入位点、沉默子、隔绝序列(insulating sequence),和基质附着区。这些序列可以靠近基因的编码区(例如在10kb之内)或在远处位点,并且它们影响基因转录和翻译的水平或速率。
术语“等位基因”是指基因的变体形式。一些基因具有多种不同形式,它们位于染色体上的相同位置或遗传位点上。二倍体生物在每个遗传位点具有两个等位基因。每对等位基因代表特定遗传基因座的基因型。如果在特定位点有两个相同的等位基因,则基因型被描述为纯合,如果两个等位基因不同,则基因型被描述为杂合。
“启动子”是DNA的调节区,其通常包含能够引导RNA聚合酶II在特定多核苷酸序列的适当转录起始位点起始RNA合成的TATA盒。启动子可以另外包含影响转录起始速率的其它区域。本文公开的启动子序列调节可操作连接的多核苷酸的转录。启动子可以在本文公开的一种或多种细胞类型(例如真核细胞、非人类哺乳动物细胞、人类细胞、啮齿动物细胞、多能细胞、单细胞期胚胎、分化的细胞,或其组合)中具有活性。启动子可以是例如组成型活性启动子、条件启动子(conditional promoter)、诱导型启动子、时间受限的启动子(temporally restricted promoter)(例如发育调控的启动子(developmentallyregulated promoter)),或空间受限的启动子(spatially restricted promoter)(例如细胞特异性或组织特异性启动子)。启动子的例子可以在例如WO 2013/176772中找到,其全部内容通过引用并入本文。
组成型启动子是在所有发育阶段的所有组织或特定组织中都有活性的启动子。组成型启动子的实例包括人即早期(immediate early)巨细胞病毒(hCMV)启动子、小鼠即早期巨细胞病毒(mCMV)启动子、人延伸因子1α(hEF1α)启动子、小鼠延伸因子1α(mEF1α)启动子、小鼠磷酸甘油酸酯激酶(PGK)启动子、鸡β肌动蛋白杂种(CAG或CBh)启动子、SV40早期启动子,和β2微管蛋白启动子。
诱导型启动子的实例包括,例如,化学调节的启动子和物理调节的启动子。化学调节的启动子包括,例如,醇调节的启动子(例如,醇脱氢酶(alcA)基因启动子)、四环素调节的启动子(例如四环素响应性启动子、四环素操纵子序列(tetO)、tet-On启动子,或tet-Off启动子)、类固醇调节的启动子(例如大鼠糖皮质激素受体、雌激素受体的启动子,或蜕皮素受体的启动子),或金属调节的启动子(例如金属蛋白启动子)。物理调节的启动子包括,例如,温度调节的启动子(例如热激启动子)和光调节的启动子(例如光诱导型启动子或光抑制型启动子(light-repressible promoter))。
组织特异性启动子可以是,例如,神经元特异性启动子、胶质细胞特异性启动子、肌肉细胞特异性启动子、心脏细胞特异性启动子、肾细胞特异性启动子、骨细胞特异性启动子、内皮细胞特异性启动子,或免疫细胞特异性启动子(例如,B细胞启动子或T细胞启动子)。
发育调节的启动子包括,例如,仅在胚胎发育阶段或仅在成年细胞中才有活性的启动子。
可操作的连接”或“可操作地连接”是指两个或更多个成分(例如启动子和另一个序列元件)的并置,使得两个成分均正常起作用,并允许至少一个成分可以介导施加在至少一个其它成分上的功能。例如,如果启动子响应一种或多种转录调节因子的存在或不存在而控制编码序列的转录水平,则该启动子可以可操作地连接至该编码序列。可操作的连接可以包括这样的序列,所述序列彼此连续或反式作用(例如,调节序列可以在一定距离处起作用以控制编码序列的转录)。
核酸的“互补性”是指核酸的一条链中的核苷酸序列由于其核碱基的取向而与相对的核酸链上的另一序列形成氢键。DNA中的互补碱基通常是A和T,C和G。在RNA中,它们通常是C和G,U和A。互补性可以是完美的或大量的/充分的。两个核酸之间的完美互补性意味着两个核酸可以形成双链体,该双链体中的每个碱基都通过沃森-克里克配对与互补碱基结合。“大量的”(substantial)或“充分的”互补意指一条链中的序列与相对链中的序列不完全和/或不完美互补,但是两条链上的碱基之间在一系列杂交条件(例如盐浓度和温度)下发生足够的键合以形成稳定的杂合复合体。可以通过使用序列和标准数学计算来预测杂交链的Tm(解链温度),或通过使用常规方法凭实验确定Tm来预测此类条件。Tm包括两条核酸链之间形成的杂交复合物群体50%变性(即双链核酸分子群体一半解离为单链)的温度。低于Tm的温度有利于杂交复合物的形成,而高于Tm的温度有利于杂交复合物中链的解链或分离。可以通过使用例如Tm=81.5+0.41(%G+C)估算1M NaCl水溶液中具有已知G+C含量的核酸的Tm,尽管其它已知的Tm计算考虑了核酸结构特征。
“杂交条件”包括累积环境(cumulative environment),在该累积环境中一个核酸链通过互补链相互作用和氢键结合至第二核酸链以产生杂交复合物。此类条件包括含有核酸的水溶液或有机溶液的化学成分及其浓度(例如盐、螯合剂、甲酰胺),以及混合物的温度。其它因素(例如孵育时间的长度或反应室的尺寸)可能会对环境造成影响。参见,例如,Sambrook et al.,Molecular Cloning,A Laboratory Manual,2.sup.nd ed.,pp.1.90-1.91,9.47-9.51,1 1.47-11.57(Cold Spring Harbor Laboratory Press,Cold SpringHarbor,纽约,1989),出于所有目的通过引用将其全部内容合并于此。
杂交需要两个核酸包含互补序列,尽管碱基之间可能错配。适用于两种核酸之间杂交的条件取决于核酸的长度和互补程度,这是众所周知的变量。两个核苷酸序列之间的互补程度越大,具有这些序列的核酸的杂交体的解链温度(Tm)的值越大。对于具有短互补序列片段(例如35个或更少、30个或更少、25个或更少、22个或更少、20个或更少,或18个或更少的核苷酸的互补性)的核酸之间的杂交,错配的位置变得很重要(参见Sambrook等,同上,11.7-11.8)。通常,可杂交核酸的长度为至少约10个核苷酸。可杂交核酸的说明性最小长度包括至少约15个核苷酸、至少约20个核苷酸、至少约22个核苷酸、至少约25个核苷酸,和至少约30个核苷酸。此外,可以根据诸如互补区域的长度和互补程度等因素,根据需要调节温度和洗涤液盐浓度。
多核苷酸的序列不必与其靶核酸的序列100%互补以特异性杂交。此外,多核苷酸可在一个或多个片段上杂交,使得在杂交事件中不涉及间插(intervening)或相邻片段(例如环结构或发夹结构)。多核苷酸(例如gRNA)可包含与其靶向的靶核酸序列内的靶区域至少70%、至少80%、至少90%、至少95%、至少99%,或100%的序列互补性。例如,其中20个核苷酸中的18个与靶区域互补并且因此将特异性杂交的gRNA将代表90%的互补性。在该实例中,剩余的非互补核苷酸可以成簇(clustered)或散在(interspersed)于互补核苷酸,并且不需要彼此或与互补核苷酸邻接(contiguous)。
可以使用BLAST程序(基本局部比对搜索工具)和PowerBLAST程序(Altschul etal.(1990)J.Mol.Biol.215:403-410;Zhang和Madden(1997)Genome Res.7:649-656),或使用Gap程序(Wisconsin Sequence Analysis Package,Version 8for Unix,GeneticsComputer Group,University Research Park,Madison Wis.)的默认设置(其使用Smith和Waterman的算法(Adv.Appl.Math.,1981,2,482-489)),常规地确定核酸中特定核酸序列段之间的互补性百分比。
本文提供的方法和组合物采用多种不同的组分。说明书全文中的某些组分可能具有有活性的变体和片段。这样的组分包括,例如,Cas蛋白、CRISPR RNA、tracrRNA,和指导RNA。这些组分的每一种的生物活性在本文其它地方描述。术语“功能性”是指蛋白质或核酸(或其片段或变体)表现出生物学活性或功能的固有能力。这种生物学活性或功能可以包括,例如,Cas蛋白与指导RNA和靶DNA序列结合的能力。与原始片段相比,功能片段或变体的生物学功能可以相同或实际上可以改变(例如就其特异性或选择性或功效而言),但是保留了基本生物学功能。
术语“变体”是指不同于群体中最普遍的序列的核苷酸序列(例如一个核苷酸不同)或不同于群体中最普遍的序列的蛋白序列(例如一个氨基酸不同)。
当涉及蛋白质时,术语“片段”是指比全长蛋白质短或具有更少氨基酸的蛋白质。当涉及核酸时,术语“片段”是指比全长核酸短或具有更少核苷酸的核酸。片段可以是,例如,N末端片段(即去除蛋白质的C末端的一部分)、C末端片段(即去除蛋白质的N末端的一部分),或内部片段。
在两个多核苷酸或多肽序列的上下文中,“序列同一性”或“同一性”是指两个序列中的残基,当在指定的比较窗口上比对以获得最大对应性时它们是相同的。当使用序列同一性百分比来表示蛋白质时,不相同的残基位置的不同之处通常为保守的氨基酸取代,其中氨基酸残基被具有相似化学性质(例如电荷或疏水性)的其它氨基酸残基取代,并因此不改变分子的功能特性。当序列的不同之处为保守取代时,可以向上调整序列同一性百分比以对取代的保守性质进行校正。因这种保守取代而不同的序列被称为具有“序列相似性”或“相似性”。进行这种调整的方法是众所周知的。通常,这涉及将保守取代计为部分错配而不是完全错配,从而增加序列同一性百分比。因此,例如,在相同氨基酸的评分为1,非保守取代的评分为0的情况下,保守取代的评分为0与1之间的值。保守取代的得分的计算通过例如PC/GENE程序实现(加利福尼亚州,山景城,Intelligenetics)。
“序列同一性百分比”包括通过在比较窗口中比较两个最佳比对的序列(完美匹配残基的最大数目)而确定的值,其中为了两个序列的最佳比对,比较窗口中的多核苷酸序列的部分可以包括与参考序列(其不含添加或缺失)相比的添加或删除(即空隙)。通过确定两个序列中出现相同核酸碱基或氨基酸残基的位置数,以产生匹配位置数,将匹配位置数除以比较窗口中的位置总数,然后将结果乘以100,以得到序列同一性百分比。除非另有说明(例如较短的序列包括连接的异源序列),否则比较窗口是被比较的两个序列中较短的序列的全长。
除非另有说明,否则序列同一性/相似性值包括使用GAP版本10,利用以下参数获得的值:使用GAP权重50和长度权重3以及nwsgapdna.cmp评分矩阵获得核苷酸序列的同一性%和相似性%;使用GAP权重8和长度权重2,以及BLOSUM62评分矩阵获得氨基酸序列同一性%和相似性%;或其任何等效程序。“等效程序”包括任何序列比较程序,当与由GAP版本10生成的相应比对进行比较时,对于所讨论的任何两个序列,所述序列比较程序针对所讨论的任何两个序列生成具有相同核苷酸或氨基酸残基匹配和相同百分比的序列同一性的比对。
术语“保守氨基酸取代”是指序列中通常存在的氨基酸被具有相似大小,电荷或极性的不同氨基酸取代。保守取代的实例包括用非极性(疏水)残基如异亮氨酸、缬氨酸,或亮氨酸取代另一个非极性残基。同样地,保守取代的例子包括一个极性(亲水)残基被另一个所取代,例如精氨酸和赖氨酸之间的取代、谷氨酰胺和天冬酰胺之间的取代,或甘氨酸和丝氨酸之间的取代。另外,保守取代的其它实例是用碱性残基例如赖氨酸、精氨酸,或组氨酸取代另一种碱性残基,或用一个酸性残基例如天冬氨酸或谷氨酸替代另一种酸性残基。非保守取代的实例包括将非极性(疏水)氨基酸残基,例如异亮氨酸、缬氨酸、亮氨酸、丙氨酸,或蛋氨酸取代为极性(亲水)残基,如半胱氨酸、谷氨酰胺、谷氨酸或赖氨酸和/或将极性残基取代为非极性残基。下文的表1总结了典型的氨基酸分类。
表1:氨基酸分类
Figure BDA0002689802010000231
“同源”序列(例如核酸序列)是指与已知参考序列相同或基本相似的序列,使得其例如与已知参考序列至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%,或100%相同。同源序列可以包括,例如,种间同源序列和种内同源序列。同源基因例如通常通过物种形成事件(speciation event)(种间同源基因)或遗传复制事件(genetic duplicationevent)(种内同源基因)源自共同的祖先DNA序列。“种间同源”基因包括通过物种形成从共同祖先基因进化而来的不同物种中的基因。种间同源物(orthologs)通常在进化过程中保持相同的功能。“种内同源”基因包括通过基因组内的复制而相关的基因。种内同源物(paralogs)可以在进化过程中进化出新功能。
术语“体外”包括人工环境以及在人工环境(例如试管)内发生的过程或反应。术语“体内”包括自然环境(例如细胞或生物体或身体)以及在自然环境中发生的过程或反应。术语“离体”包括已经从个体体内移出的细胞以及在这种细胞内发生的过程或反应。
术语“报告基因”是指具有编码基因产物(通常是酶)的序列的核酸,当包含与内源或异源启动子和/或增强子元件可操作地连接的报告基因序列的构建体被引入含有(或可以使其含有)该启动子和/或增强子元件的激活所必需的因子的细胞中时,该序列可被容易地和定量地测定。报告基因的例子包括但不限于编码β-半乳糖苷酶(lacZ)的基因、细菌氯霉素乙酰基转移酶(cat)基因、萤火虫荧光素酶基因、编码β-葡糖醛酸糖苷酶(GUS)的基因,和编码荧光蛋白的基因。“报告蛋白”是指由报告基因编码的蛋白。
本文所使用的术语“荧光报告蛋白”是指基于荧光可检测的报告蛋白,其中荧光可以直接来自报告蛋白、报告蛋白在荧光底物上的活性,或具有结合荧光标记的化合物的亲和力的蛋白。荧光蛋白的例子包括绿色荧光蛋白(例如GFP、GFP-2、tagGFP、turboGFP、eGFP、Emerald、Azami Green、单体Azami Green、CopGFP、AceGFP,和ZsGreenl)、黄色荧光蛋白(例如YFP、eYFP、Citrine、Venus、YPet、PhiYFP,和ZsYellowl)、蓝色荧光蛋白(例如BFP、eBFP、eBFP2、Azurite、mKalamal、GFPuv,Sapphire,和T-sapphire)、青色荧光蛋白(例如CFP、eCFP、Cerulean、CyPet、AmCyanl,和Midoriishi-Cyan)、红色荧光蛋白(例如RFP、mKate、mKate2、mPlum、DsRed单体、mCherry、mRFP1、DsRed-Express、DsRed2、DsRed-Monomer、HcRed-Tandem、HcRedl、AsRed2、eqFP611、mRaspberry、mStrawberry,和Jred)、橙色荧光蛋白(例如mOrange、mKO、Kusabira-Orange、Monomeric Kusabira-Orange、mTangerine,和tdTomato),以及可以通过流式细胞方法检测到其在细胞中的存在的任何其它合适的荧光蛋白。
响应双链断裂(DSB)的修复主要通过两个保守的DNA修复途径发生:同源重组(HR)和非同源性末端接合(NHEJ)。参见Kasparek&Humphrey(2011)Seminars in Cell&Dev.Biol.22:886-897,出于所有目的通过引用整体并入本文。同样,由外源供体核酸介导的靶核酸的修复可以包括两个多核苷酸之间交换遗传信息的任何过程。
术语“重组”包括两个多核苷酸之间的遗传信息交换的任何过程,并且可以通过任何机制发生。重组可通过同源定向修复(HDR)或同源重组(HR)发生。HDR或HR包括一种可能需要核苷酸序列同源性的核酸修复形式,其使用“供体”分子作为模板来修复“靶标”分子(即经历双链断裂的分子),并导致遗传信息从供体转移到靶标。不希望受到任何特定理论的束缚,这种转移可能涉及在断裂的靶标和供体之间形成的异源双链DNA的错配校正,和/或合成依赖性链退火,其中供体用于重新合成遗传信息,该遗传信息将成为靶标的一部分,和/或相关过程。在一些情况下,供体多核苷酸、供体多核苷酸的一部分、供体多核苷酸的拷贝,或供体多核苷酸的拷贝的一部分整合到靶DNA中。参见Wang et al.(2013)Cell 153:910-918;Mandalos et al.(2012)PLOS ONE 7:e45768:1-9;和Wang et al.(2013)NatBiotechnol.31:530-532,出于所有目的将其每一篇均通过引用整体并入本文。
NHEJ包括通过将断裂末端彼此直接连接或与外源序列直接连接而不需要同源模板来修复核酸中的双链断裂。通过NHEJ对非连续序列进行连接通常会导致双链断裂位点附近的删除、插入,或易位。例如,NHEJ还可以通过将断裂末端与外源供体核酸的末端直接连接(即基于NHEJ的捕获)来导致外源供体核酸的靶向整合。当同源定向修复(HDR)途径不能立即使用时(例如,在非分裂细胞、原代细胞,以及较差地进行基于同源性的DNA修复的细胞中),此类NHEJ介导的靶向整合可优选用于插入外源供体核酸。另外,与同源定向修复相反,不需要关于切割位点侧接的大范围的序列同一性的知识,这在尝试靶向插入到具有对基因组序列的认识有限的基因组的生物中时可能是有益的。整合可以通过在外源供体核酸与切割的基因组序列之间平端的连接或通过使用侧面为单链突出端的外源供体核酸连接黏性末端(即具有5'或3'单链突出端)来进行,所述单链突出端与在切割的基因组序列中由核酸酶剂产生的那些相容。参见,例如,US2011/020722、WO 2014/033644、WO 2014/089290和Maresca et al.(2013)GenomeRes.23(3):539-546,出于所有目的将每一篇均通过引用整体并入本文。如果连接平端,可能需要进行靶标和/或供体切除,以产生片段连接所需的微同源性区域(regions of microhomology),这可能会在靶序列中产生不想要的改变。
“包含”或“包括”一个或多个所列举的要素的组合物或方法可以包括未具体列举的其它要素。例如,“包含”或“包括”蛋白质的组合物可以单独包含蛋白质或包含蛋白质以及其它成分。过渡用语“基本上由……组成”是指权利要求的范围应解释为涵盖权利要求中所述的特定要素以及不实质上影响所要求保护的发明的基本和新颖特征的要素。因此,当在本发明的权利要求书中使用时,术语“基本上由……组成”并不意图被解释为等同于“包括”。
“可选的”或“可选地”是指随后描述的事件或情况可能发生或可能不会发生,并且说明书包括事件或情况发生的情况以及事件或情况没有发生的情况。
值范围的指定包括该范围内或定义该范围的所有整数,以及该范围内的整数定义的所有子范围。
除非从上下文中另外显而易见,否则术语“约”涵盖所述值的标准测量误差范围(例如SEM)内的值。
术语“和/或”是指并涵盖一个或多个相关列出的项目的任何和所有可能的组合,以及当以备选方式(“或”)解释时组合的不存在。
术语“或”是指特定列表的任何一个成员,并且还包括该列表的成员的任何组合。
除非上下文另外明确指出,否则冠词“一”,“一个”和“所述”的单数形式包括复数形式。例如,术语“一种蛋白质”或“至少一种蛋白质”可包括多种蛋白质,包括其混合物。
具有统计学意义意指p≤0.05。
详细说明
I.概述
成簇的规律间隔的短回文重复序列(CRISPR)/CRISPR相关(Cas)(CRISPR/Cas9)系统是用于基因组工程和调节靶基因表达的强大工具。该系统在体内的一个局限性是需要将所有组分同时引入到活生物体中。通常,这些成分是通过将DNA构建体转染到会产生适当RNA和蛋白质的细胞中而瞬时引入的。尽管有效,但是这种方法具有固有的缺点,因为细胞必须依靠质粒DNA构建体先进行转录,然后翻译,然后才能使用Cas蛋白与sgRNA组分相互作用。需要更好的方法和工具来更有效地评估CRISPR/Cas试剂的活性,并评估靶向体内特定组织或细胞类型的不同递送方法和参数。
在示例性的CRISPR/Cas协同激活介质(SAM)系统中,几个激活域相互作用以引起比单独由任何一个因子诱导的转录激活更大的转录激活。要使用SAM系统,通常需要引入三种病毒。第一种病毒包含直接与VP64域融合的催化失活的Cas蛋白、由四个串联重复的单纯疱疹病毒蛋白16组成的转录激活因子。当VP64与在转录起始位点附近结合的蛋白融合时,它作用为强转录激活因子。第二种病毒携带入MS2外壳蛋白(MCP),MS2外壳蛋白与另外两个激活的转录因子融合:热休克因子1(HSF1);和转录因子65(p65)。MCP自然结合到MS2茎环。在示例性的SAM系统中,MCP与被工程化进CRISPR相关的sgRNA的MS2茎环相互作用,从而将结合的转录因子穿梭到适当的基因组位置。第三种病毒引入了包含MS2环的sgRNA。
本文提供了用于体内和离体激活靶基因的转录以及体内和离体评估CRISPR/Cas介导的转录激活活性的方法和组合物。所述方法和组合物使用细胞和非人动物,其包含嵌合Cas蛋白表达盒、嵌合衔接体蛋白表达盒,或协同激活介质(SAM)表达盒(例如嵌合Cas蛋白编码序列和嵌合衔接体蛋白序列),使得这些组分可以组成性地获得(constitutivelyavailable),或者例如组织特定的或时间特定的方式获得。盒可以是基因组整合的。这样的细胞和非人动物还可以包含如本文其它地方公开的指导RNA表达盒和/或重组酶表达盒。替代地,可通过其它方式将一种或多种组分(例如指导RNA和/或重组酶)引入细胞和非人动物中,以诱导靶基因的转录激活。
包含SAM表达盒的非人动物简化了在体内测试CRISPR/Cas组分的递送和活性的过程,因为仅需要将指导RNA引入非人动物以激活靶基因的转录。如果非人动物还包含指导RNA表达盒,则可以在不引入任何其它组分的情况下研究靶基因激活的作用。另外,SAM表达盒或指导RNA表达盒可以可选地是条件表达盒,其可以在特定组织或发育阶段中选择性表达,这可以,例如,降低体内Cas介导的毒性的风险。替代地,此类表达盒可以被组成性地表达,以使得能够测试任何和所有类型的细胞、组织,和器官中的活性。
还提供了用于制造和使用这些非人动物的方法和组合物,以测试和测量基于Cas的SAM系统在体内激活靶基因的转录的能力,或评估体内增加靶基因转录的影响。
II.包含协同激活介质(SAM)表达盒的非人动物
本文公开的非人动物基因组、非人动物细胞,和非人动物包含基于成簇的规律间隔的短回文重复序列(CRISPR)/CRISPR相关(Cas)(CRISPR/Cas9)的协同激活介质(SAM)表达盒,以用于体内或离体激活靶基因转录的方法,并评估SAM系统或此类系统的组分(例如引入非人动物或细胞中的指导RNA)体内或离体激活靶基因组基因座转录的能力。本文公开的方法和组合物利用包含成簇的规律间隔的短回文重复序列(CRISPR)/CRISPR相关(Cas)(CRISPR/Cas9)的协同激活介质(SAM)表达盒的非人动物或细胞,以用于体内或离体激活靶基因转录的方法,并评估SAM系统或此类系统的组分(例如引入非人动物或细胞中的指导RNA)体内或离体激活靶基因组基因座转录的能力。本文所述的SAM系统包含嵌合Cas蛋白和嵌合衔接体蛋白,并且可以与本文其它地方所述的指导RNA一起使用,以激活靶基因的转录。指导RNA可以通过基因组整合的表达盒编码,或者可以通过AAV或任何其它合适的方式提供。嵌合Cas蛋白和嵌合衔接体蛋白(例如包含与指导RNA内的衔接体结合元件特异性结合的衔接体;以及一个或多个异源转录激活域)在本文其它地方进一步详细描述。
CRISPR/Cas系统包括与Cas基因的表达或引导Cas基因的活性有关的转录物和其它元件。CRISPR/Cas系统可以是例如I型、II型、III型系统或V型系统(例如,V-A亚型或V-B亚型)。本文公开的组合物和方法中使用的CRISPR/Cas系统可以是非天然存在的。“非天然存在”的系统包括指示人手所参与到的任何事物,例如系统的一个或多个组分,其已从其天然存在的状态更改或变异、其至少基本上没有至少一种与它们在自然界中天然相关联的其它组分的存在,或者其与至少一个与它们非天然相关联的其它组件相关联。例如,某些CRISPR/Cas系统采用非天然存在的CRISPR复合物,该复合物包含不天然一起存在的gRNA和Cas蛋白、采用不天然存在的Cas蛋白,或采用不天然存在的gRNA。
本文公开的方法和组合物通过使用或测试CRISPR复合物(包含与嵌合Cas蛋白和嵌合衔接体蛋白复合的指导RNA(gRNA))在体内诱导靶基因组位点转录激活的能力来采用CRISPR/Cas系统。
本文公开的基因组、细胞,和非人动物包含嵌合Cas蛋白表达盒和/或嵌合衔接体蛋白表达盒。例如,本文公开的基因组、细胞,和非人动物可包含协同激活介质(SAM)表达盒,其包含嵌合Cas蛋白编码序列和嵌合衔接体蛋白编码序列。
此类包含SAM表达盒的基因组、细胞,或非人动物的优势在于:仅需要递送指导RNA,即可诱导靶基因组基因座的转录激活。一些这样的基因组、细胞,或非人动物也包含指导RNA表达盒,从而使得靶基因转录激活所需的所有组分已存在。SAM系统可用于此类细胞中,以任何所需方式提供靶基因的增加表达。例如,一种或多种靶基因的表达可以以组成性方式或调节性方式(例如可诱导的、组织特异性的、时间调节性的等)增加。
A.嵌合Cas蛋白
提供了可以与本文其它地方公开的指导RNA结合以激活靶基因转录的嵌合Cas蛋白。此类嵌合Cas蛋白可包含:(a)DNA结合结构域,其为成簇的规律间隔的短回文重复序列(CRISPR)/CRISPR相关(Cas)蛋白或其功能片段或变体,其能够与指导RNA形成复合物,并与靶序列结合;以及(b)一个或多个转录激活域或其功能片段或变体。例如,此类融合蛋白可包含1、2、3、4、5,或更多个转录激活域(例如两个或更多个异源转录激活域,或三个或更多个异源转录激活域)。在一个实施例中,嵌合Cas蛋白可包含催化失活的Cas蛋白(例如dCas9)和VP64转录激活域或其功能片段或变体。例如,这种嵌合Cas蛋白可包含,基本上由,或由以下组成:与SEQ ID NO:1所示的dCas9-VP64嵌合Cas蛋白序列至少具有85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或100%的同一性的氨基酸序列。然而,还提供了嵌合Cas蛋白,其中转录激活域包含其它转录激活域或功能片段或其变体,和/或其中还提供了该包含其它Cas蛋白(例如催化失活的Cas蛋白)的Cas蛋白。其它合适的转录激活域的实例在本文其它地方提供。
转录激活域可以位于N末端、C末端,或Cas蛋白内的任何位置。例如,转录激活域可以附着于化脓链球菌(Streptococcus pyogenes)Cas9蛋白的Rec1结构域、Rec2结构域、HNH结构域,或PI结构域,或当与化脓链球菌Cas9蛋白质最佳比对时的种间同源Cas9蛋白或同源或种间同源Cas蛋白的任何相应区域。例如,转录激活域可以在553位置附着于Rec1结构域,在575位置附着于Rec1结构域,在175-306位置中的任何位置附着于Rec2结构域或替换175-306位置的部分或整个区域,在715-901位置内的任何位置附着于HNH结构域或替换715-901位置的部分或整个区域,或在化脓链球菌Cas9蛋白的1153位置附着于PI结构域。参见例如WO2016/049258,出于所有目的通过引用将其全文并入本文。转录激活域可以如本文其它地方所述,在其一侧或两侧上侧接一个或多个接头。
嵌合Cas蛋白也可以可操作地连接或融合至其它异源多肽。融合或连接的异源多肽可以位于嵌合Cas蛋白的N末端、C末端,或其内部的任何地方。例如,嵌合Cas蛋白可以进一步包含核定位信号。合适的核定位信号和对Cas蛋白的其它修饰的实例在本文其它地方进一步详细描述。
(1)Cas蛋白
Cas蛋白通常包含至少一个可与指导RNA相互作用的RNA识别或结合结构域。Cas蛋白的功能片段或功能变体是保留与指导RNA形成复合物并结合靶基因中的靶序列的能力(并且例如激活靶基因的转录)的功能片段或功能变体。
除了本文其它地方所述的转录激活域之外,Cas蛋白还可包含核酸酶结构域(例如,DNA酶结构域或RNA酶结构域)、DNA结合结构域、解旋酶结构域、蛋白质-蛋白质相互作用结构域、二聚化结构域,和其它域。一些此类结构域(例如DNA酶结构域)可以来自天然Cas蛋白。可以添加其它此类结构域以制备修饰的Cas蛋白。核酸酶结构域具有用于核酸切割的催化活性,核酸切割包括核酸分子的共价键的断裂。切割可产生平端(blunt ends)或交错端(staggered ends),并且可以是单链或双链的。例如,野生型Cas9蛋白通常会产生平(blunt)切割产物。替代地,野生型Cpf1蛋白(例如FnCpf1)可产生具有5-核苷酸5'单链突出端的切割产物,该切割发生于非靶向链上的PAM序列的第18个碱基对之后和靶向链的第23个碱基之后。Cas蛋白可以具有完全的切割活性,从而在靶基因组位点处产生双链断裂(例如,末端为平端的双链断裂),或者它可以是在靶基因组位点上产生单链断裂的切口酶。在一个实例中,本文公开的嵌合Cas蛋白的Cas蛋白部分已被修饰为具有降低的核酸酶活性(例如核酸酶活性与野生型Cas蛋白相比降低了至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%,或100%)或基本没有任何核酸酶活性(即核酸酶活性与野生型Cas蛋白相比降低了至少90%、95%、97%、98%、99%,或100%,或具有不超过野生型Cas蛋白的核酸酶活性的约0%、1%、2%、3%、5%,或10%的核酸酶活性)。核酸酶失活的Cas蛋白是一种具有突变的Cas蛋白,已知该突变是在其催化(即核酸酶)结构域中的失活突变(例如:Cpf1蛋白中的RuvC样核酸内切酶结构域中的失活突变,或Cas9中的HNH核酸内切酶结构域和RuvC样核酸内切酶结构域中的失活突变),或该核酸酶失活的Cas蛋白是与野生型Cas蛋白相比,核酸酶活性减少了至少约97%、98%、99%,或100%的Cas蛋白。下文公开了减少或基本消除核酸酶活性的不同的Cas蛋白突变的实例。
Cas蛋白的实例包括Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5e(CasD)、Cas6、Cas6e、Cas6f、Cas7、Cas8a1、Cas8a2、Cas8b、Cas8c、Cas9(Csn1或Csx12)、Cas10、Cas10d、CasF、CasG、CasH、Csy1、Csy2、Csy3、Cse1(CasA)、Cse2(CasB)、Cse3(CasE)、Cse4(CasC)、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4,和Cu1966,以及其同源物或修饰版本。
示例性的Cas蛋白是Cas9蛋白或衍生自Cas9蛋白的蛋白。Cas9蛋白来自II型CRISPR/Cas系统,通常与保守结构具有相同的四个关键模体(motifs)。模体1、2和4是RuvC样模体,模体3是HNH模体。示例性Cas9蛋白质来自化脓链球菌(Streptococcus pyogenes)、嗜热链球菌(Streptococcus thermophilus)、链球菌属(Streptococcus sp.)、金黄色葡萄球菌(Staphylococcus aureus)、达森维尔诺卡氏菌(Nocardiopsis dassonvillei)、始旋链霉菌(Streptomyces pristinaespiralis)、绿色产色链霉菌(Streptomycesviridochromogenes)、绿色产色链霉菌(Streptomyces viridochromogenes)、粉红链孢囊菌(Streptosporangium roseum)、粉红链孢囊菌(Streptosporangium roseum)、酸性脂环酸杆菌(Alicyclobacillus acidocaldarius)、假蕈状芽孢杆菌(Bacilluspseudomycoides)、还原硒酸盐芽胞杆菌(Bacillus selenitireducens)、西伯利亚微小杆菌(Exiguobacterium sibiricum)、保加利亚乳杆菌(Lactobacillus delbrueckii)、唾液乳杆菌(Lactobacillus salivarius)、海洋微颤菌(Microscilla marina)、伯克霍尔德氏菌(Burkholderiales bacterium)、食萘极地单胞菌(Polaromonas naphthalenivorans)、极地单胞菌属(Polaromonas sp.)、海洋固氮蓝藻(Crocosphaera watsonii)、蓝丝细菌属(Cyanothece sp.)、铜绿微囊藻(Microcystis aeruginosa)、聚球藻属(Synechococcussp.)、阿拉伯醋酸喜盐菌(Acetohalobium arabaticum)、丹氏制氨菌(Ammonifexdegensii)、热解纤维素菌(Caldicelulosiruptor becscii)、金矿菌(CandidatusDesulforudis)、肉毒梭菌(Clostridium botulinum)、难辨梭菌(Clostridiumdifficile)、大芬戈尔德菌(Finegoldia magna)、嗜热盐碱厌氧菌(Natranaerobiusthermophilus)、嗜热丙酸降解发酵菌(Pelotomaculum thermopropionicum)、喜温嗜酸硫杆菌(Acidithiobacillus caldus)、氧化亚铁硫杆菌(Acidithiobacillusferrooxidans)、酒色别样着色菌(Allochromatium vinosum)、海杆菌属(Marinobactersp.)、嗜盐亚硝化球菌(Nitrosococcushalophilus)、亚硝化球菌(Nitrosococcuswatsoni)、游海假交替单胞菌(Pseudoalteromonashaloplanktis)、成簇细枝菌(Ktedonobacterracemifer)、调查甲烷盐菌(Methanohalobiumevestigatum)、鱼腥藻(Anabaenavariabilis)、泡沫节球藻(Nodularia spumigena)、念珠藻属(Nostoc sp.)、极大节旋藻(Arthrospira maxima)、钝顶节旋藻(Arthrospira platensis)、节旋藻属(Arthrospira sp.)、鞘丝藻(Lyngbya sp.)、原型微鞘藻(Microcoleus chthonoplastes)、颤藻属(Oscillatoria sp.)、运动石孢菌(Petrotoga mobilis)、非洲栖热腔菌(Thermosipho africanus)、深海单细胞蓝细菌(Acaryochloris marina)、脑膜炎奈瑟氏球菌(Neisseria meningitidis),或空肠弯曲杆菌(Campylobacter jejuni)。Cas9家族成员的另外的例子在WO 2014/131833中描述,出于所有目的通过引用将其全文并入本文。化脓链球菌的Cas9(SpCas9)(分配的SwissProt登录号为Q99ZW2)是示例性的Cas9蛋白。来自金黄色葡萄球菌的Cas9(SaCas9)(分配的UniProt登录号为J7RUA5)是另一种示例性Cas9蛋白。来自空肠弯曲杆菌的Cas9(CjCas9)(分配的UniProt登录号为Q0P897)是另一种示例性Cas9蛋白。参见,例如,Kim et al.(2017)Nat.Comm.8:14500,出于所有目的通过引用整体并入本文。SaCas9小于SpCas9,而CjCas9小于SaCas9和SpCas9。
Cas蛋白的另一个例子是Cpf1(来自普雷沃氏菌(Prevotella)和弗朗西丝氏菌1(Francisella1)的CRISPR)蛋白。Cpf1是一种大蛋白(约1300个氨基酸),其中包含与Cas9的相应结构域同源的RuvC样核酸酶结构域以及与Cas9的特征性精氨酸富集簇相对应的部分。但是,Cpf1缺少Cas9蛋白中存在的HNH核酸酶结构域,而RuvC样结构域在Cpf1序列中是连续的;这与包含HNH域的长插入片段的Cas9不同。参见,例如,Zetsche et al.(2015)Cell 163(3):759-771,出于所有目的通过引用整体并入本文。示例性的Cpf1蛋白来自土拉热弗朗西斯氏菌1(Francisella tularensis 1)、新凶手土拉弗朗西斯菌(Francisella tularensissubsp.novicida)、苏格兰普雷沃氏菌(Prevotella albensis)、毛螺科菌MC2017 1(Lachnospiraceae bacterium MC2017 1)、解蛋白丁酸弧菌(Butyrivibrioproteoclasticus)、佩莱格里尼菌科细菌GW2011_GWA2_33_10(Peregrinibacteriabacterium GW2011_GWA2_33_10)、俭菌细菌GW2011_GWC2_44_17(Parcubacteriabacterium GW2011_GWC2_44_17)、斯密斯氏互养菌属SCADC(Smithella sp.SCADC)、氨基酸球菌属BV3L6(Acidaminococcus sp.BV3L6)、毛螺科菌MA2020(Lachnospiraceaebacterium MA2020)、Candidatus Methanoplasma termitum、挑剔真杆菌(Eubacteriumeligens)、牛眼莫拉氏菌237(Moraxella bovoculi 237)、稻田钩端螺旋体(Leptospirainadai)、毛螺科菌ND2006(Lachnospiraceae bacterium ND2006)、狗口腔卟啉单胞菌3(Porphyromonas crevioricanis 3)、解糖胨普雷沃氏菌(Prevotella disiens)和猕猴卟啉单胞菌(Porphyromonas macacae)。来自新凶手土拉弗朗西斯菌U112(Francisellanovicida U112)的Cpf1(FnCpf1;分配的UniProt登录号为A0Q7Q2)是示例性Cpf1蛋白。
Cas蛋白可以是野生型蛋白(即自然界中存在的那些)、修饰的Cas蛋白(即Cas蛋白变体),或野生型Cas蛋白或修饰的Cas蛋白的片段。Cas蛋白也可以是相对于野生型Cas蛋白或修饰的Cas蛋白的催化活性的活性变体或片段。针对催化活性的活性变体或片段可包含与野生型或修饰的Cas蛋白或其部分的至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或更高的序列同一性,其中活性变体保留在所需切割位点切割的能力,因此保留了缺口诱导或双链断裂诱导活性。缺口诱导或双链断裂诱导活性的测定是已知的,并且通常测量Cas蛋白在包含切割位点的DNA底物上的总体活性和特异性。
修饰的Cas蛋白的一个例子是修饰的SpCas9-HF1蛋白,其为化脓链球菌Cas9的一种高保真变异体,具有设计为减少非特异性DNA接触的改变(N497A/R661A/Q695A/Q926A)。例如,Kleinstiver et al.(2016)Nature 529(7587):490-495,出于所有目的通过引用整体并入本文。修饰的Cas蛋白的另一个实例是修饰的eSpCas9变体(K848A/K1003A/R1060A),其设计为减少脱靶效应。参见,例如,Slaymaker et al.(2016)Science351(6268):84-88,出于所有目的通过引用全文并入本文。其它SpCas9变体包括K855A和K810A/K1003A/R1060A。
Cas蛋白可以被修饰以增加或降低核酸结合亲和力、核酸结合特异性,和酶活性中的一种或多种。Cas蛋白也可以被修饰以改变蛋白的任何其它活性或性质,例如稳定性。例如,可以修饰、删除,或灭活Cas蛋白的一个或多个核酸酶结构域,或者可以截断Cas蛋白以去除对于蛋白功能非必需的结构域或对Cas蛋白的活性或特性进行优化(例如增强或降低)。
Cas蛋白可以包含至少一个核酸酶结构域,例如DNA酶结构域。例如,野生型Cpf1蛋白通常包含RuvC样结构域,其切割靶DNA的两条链,可能是二聚体构型。Cas蛋白也可以包含至少两个核酸酶结构域,例如DNA酶结构域。例如,野生型Cas9蛋白通常包含RuvC样核酸酶结构域和HNH样核酸酶结构域。RuvC和HNH结构域可以各自切割双链DNA的一条不同的链,以在DNA中产生双链断裂。参见,例如,Jinek et al.(2012)Science 337:816-821,出于所有目的通过引用整体并入本文。
一个或多个或所有核酸酶结构域可以被缺失或突变,使得它们不再起作用或具有降低的核酸酶活性。例如,如果Cas9蛋白中的了一个核酸酶结构域被删除或突变,则所得的Cas9蛋白可以称为切口酶,并且可以在双链的靶DNA内产生单链断裂,但不能产生双链断裂(即它可以切割互补链或非互补链,但不能同时切割两者)。如果两个核酸酶结构域都被删除或突变,则所得的Cas蛋白(例如Cas9)切割双链DNA的两条链的能力会降低(例如,无核酸酶的(nuclease-null)或核酸酶失活的Cas蛋白,或催化死亡的Cas蛋白(dCas))。将Cas9转化为切口酶的突变的一个例子是来自化脓链球菌的Cas9的RuvC结构域中的D10A(在Cas9的位置10的天冬氨酸变为丙氨酸)突变。同样地,来自化脓链球菌的Cas9的HNH结构域中的H939A(在氨基酸位置839的组氨酸变为丙氨酸)、H840A(在氨基酸位置840处的组氨酸变为丙氨酸),或N863A(在氨基酸位置N863处的天冬酰胺变为丙氨酸)可以将Cas9转化为切口酶。将Cas9转化为切口酶的突变的其它实例包括来自嗜热链球菌的Cas9的相应突变。参见,例如,Sapranauskas et al.(2011)Nucleic Acids Research 39:9275-9282和WO2013/141680,出于所有目的将其每一篇通过引用整体并入本文。可以使用诸如定点突变、PCR介导的突变,或全基因合成等方法产生此类突变。可以在例如WO 2013/176772和WO 2013/142578中找到产生切口酶的其它突变的实例,出于所有目的将其每一篇的全部内容通过引用并入本文。如果在Cas蛋白中所有核酸酶结构域均删除或突变(例如在Cas9蛋白中的两个核酸酶结构域均删除或突变),则所得的Cas蛋白(例如Cas9)切割双链DNA的两条链的能力将降低(例如无核酸酶的或核酸酶失活的Cas蛋白)。一个具体实例是D10A/H840A化脓链球菌Cas9双突变体或当与化脓链球菌Cas9最佳比对时来自另一物种的Cas9中相应的双突变体。另一个具体实例是D10A/N863A化脓链球菌Cas9双突变体或当与化脓链球菌Cas9最佳比对时来自另一个物种的Cas9中相应的双突变体。催化失活的Cas9蛋白(dCas9)的一个示例包含以下、基本上由以下组成,或由以下组成:与SEQ ID NO:2中列出的dCas9蛋白序列具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或100%的同一性的氨基酸序列。
金黄色葡萄球菌Cas9蛋白的催化结构域中的失活突变的实例也是已知的。例如,金黄色葡萄球菌Cas9酶(SaCas9)可包含在位置N580处的取代(例如N580A取代)和在位置D10处的取代(例如D10A取代),以产生核酸酶失活的Cas蛋白。参见,例如,WO 2016/106236,出于所有目的通过引用将其全文并入本文。
Cpf1蛋白的催化结构域中的失活突变的实例也是已知的。对于来自新凶手土拉弗朗西斯菌U112的Cpf1蛋白(FnCpf1)、来自氨基酸球菌属BV3L6的Cpf1蛋白(AsCpf1)、来自毛螺科菌ND2006的Cpf1蛋白(LbCpf1),和来自牛眼莫拉氏菌237的Cpf1蛋白(MbCpf1 Cpf1),此类突变可包括AsCpf1的位置908、993,或1263或Cpf1种间同源物的相应位置处的突变,或LbCpf1的位置832、925、947,或1180或Cpf1种间同源物的相应位置处的突变。此类突变可包括,例如,AsCpf1的突变D908A、E993A,和D1263A或在Cpf1种间同源物的相应突变,或LbCpf1的D832A、E925A、D947A和D1180A或在Cpf1种间同源物的相应突变中的一种或多种。参见,例如,US 2016/0208243,出于所有目的通过引用将其全部内容并入本文。
Cas蛋白还可以作为融合蛋白可操作地连接至异源多肽。例如,除了转录激活域之外,Cas蛋白还可与切割结构域或表观遗传修饰结构域融合。参见WO 2014/089290,出于所有目的通过引用将其全部内容合并于此。Cas蛋白也可以与提供增加或减少的稳定性的异源多肽融合。融合结构域或异源多肽可以位于Cas蛋白的N端、C端或内部。
作为一个实例,可以将Cas蛋白与提供亚细胞定位的一种或多种异源多肽融合。此类异源多肽可包括,例如,用于靶向细胞核的一个或多个核定位信号(NLS),例如单分型(monopartite)SV40 NLS和/或二分型(bipartite)α-输入蛋白NLS,用于靶向线粒体的线粒体定位信号,ER保留信号等。参见,例如,Lange et al.(2007)J.Biol.Chem.282:5101-5105,其全部内容出于所有目的通过引用整体并入本文。此类亚细胞定位信号可以位于N末端、C末端,或Cas蛋白内的任何位置。NLS可以包含一段碱性氨基酸,并且可以是单分型序列或二分型序列。可选地,Cas蛋白可包含两个或更多个NLS,包括位于N末端的NLS(例如α-输入蛋白NLS或单分型NLS)和在C末端的NLS(例如SV40 NLS或二分型NLS)。Cas蛋白还可在N末端包含两个或多个NLS和/或在C末端包含两个或多个NLS。
Cas蛋白也可以可操作地连接至细胞穿透结构域或蛋白转导结构域。例如,细胞穿透域可以源自HIV-1TAT蛋白、来自人类乙型肝炎病毒的TLM细胞穿透模体、MPG、Pep-1、VP22、来自单纯疱疹病毒的细胞穿透肽,或聚精氨酸肽序列。参见,例如,WO 2014/089290和WO 2013/176772,出于所有目的,将其每一篇均通过引用整体并入本文。细胞穿透结构域可以位于N末端、C末端或Cas蛋白内的任何位置。
为了易于追踪或纯化,Cas蛋白也可以可操作地连接至异源多肽,例如荧光蛋白、纯化标签,或表位标签。荧光蛋白的实例包括绿色荧光蛋白(例如GFP、GFP-2、tagGFP、turboGFP、eGFP、Emerald、Azami Green、Monomeric Azami Green、CopGFP、AceGFP、ZsGreenl),黄色荧光蛋白(例如YFP、eYFP、Citrine、Venus、YPet、PhiYFP、ZsYellowl),蓝色荧光蛋白(例如eBFP、eBFP2、Azurite、mKalamal、GFPuv、Sapphire、T-sapphire),青色荧光蛋白(例如eCFP、Cerulean、CyPet、AmCyanl、Midoriishi-Cyan),红色荧光蛋白(例如mKate、mKate2、mPlum、DsRed monomer、mCherry、mRFP1、DsRed-Express、DsRed2、DsRed-Monomer、HcRed-Tandem、HcRedl、AsRed2、eqFP611、mRaspberry、mStrawberry、Jred),橙色荧光蛋白(例如mOrange、mKO、Kusabira-Orange、Monomeric Kusabira-Orange、mTangerine、tdTomato),和任何其它合适的荧光蛋白。标签的例子包括谷胱甘肽-S-转移酶(GST)、几丁质结合蛋白(CBP)、麦芽糖结合蛋白、硫氧还蛋白(TRX)、聚(NANP)、串联亲和纯化(TAP)标签、myc、AcV5、AU1、AU5、E、ECS、E2、FLAG、血凝素蛋白(HA)、nus、Softag 1、Softag3、Strep、SBP、Glu-Glu、HSV、KT3、S、S1、T7、V5、VSV-G、组氨酸(His)、生物素羧基载体蛋白(BCCP),和钙调蛋白。
Cas蛋白也可以被束缚(tethered)到标记的核酸。可以通过共价相互作用或非共价相互作用实现这种束缚(即物理连接),并且束缚可以是直接的(例如通过直接融合或化学缀合,这可以通过修饰蛋白质上的半胱氨酸或赖氨酸残基或修饰内含肽基来实现),或可以通过一种或多种间插连接子(intervening linkers)或衔接体分子(例如链霉亲和素或适配体)来实现。参见,例如,Pierce et al.(2005)Mini Rev.Med.Chem.5(1):41-55;Duckworth et al.(2007)Angew.Chem.Int.Ed.Engl.46(46):8819-8822;Schaeffer和Dixon(2009)Australian J.Chem.62(10):1328-1332;Goodman et al.(2009)Chembiochem.10(9):1551-1557;和Khatwani et al.(2012)Bioorg.Med.Chem.20(14):4532-4539,出于所有目的,将其每一篇通过引用整体并入本文。合成蛋白质-核酸缀合物的非共价策略包括生物素-链霉亲和素和镍-组氨酸方法。可以通过使用多种化学方法连接适当官能化的核酸和蛋白质来合成共价蛋白质-核酸缀合物。这些化学方法中的一些涉及将寡核苷酸直接附着到蛋白质表面的氨基酸残基(例如赖氨酸胺或半胱氨酸硫醇),而其它更复杂的方案则需要蛋白质的翻译后修饰,或催化性或反应性蛋白结构域的参与。使蛋白质与核酸共价连接的方法可以包括,例如,寡核苷酸与蛋白质赖氨酸残基或半胱氨酸残基的化学交联、表达的蛋白质连接(expressed protein-ligation)、化学酶法和光适配体(photoaptamers)的使用。可以将标记的核酸束缚在C末端、N末端,或Cas蛋白内的内部区域。在一实例中,标记的核酸束缚在Cas蛋白的C末端或N末端。同样,Cas蛋白可以束缚在5'末端、3'末端,或标记的核酸中的内部区域。即标记的核酸可以任何方向和极性束缚。例如,可以将Cas蛋白束缚在标记核酸的5'末端或3'末端。
(2)转录激活域
本文公开的嵌合Cas蛋白可包含一个或多个转录激活域。转录激活域包括天然存在的转录因子的区域,其可与DNA结合域(例如,与指导RNA复合的催化失活的Cas蛋白)一起通过直接接触转录机制或通过例如共激活因子的蛋白质接触转录机制来激活启动子的转录。转录激活域还包括转录因子的此类区域的功能片段或变体,以及工程化的转录激活域,该工程化的转录激活域衍生自天然的、天然存在的转录激活域,或是人工创建或合成的,以激活靶基因的转录。功能片段是当可操作地连接至合适的DNA结合域时能够激活靶基因转录的片段。功能变体是当可操作地连接至合适的DNA结合域时能够激活靶基因转录的变体
用于本文公开的嵌合Cas蛋白中的特异转录激活域包含VP64转录激活域或其功能片段或变体。VP64是来自单纯疱疹VP16激活域的最小激活域的四聚体重复。例如,转录激活域可包含以下、基本上由以下组成,或由以下组成:与SEQ ID NO:3中列出的VP64转录激活域蛋白序列具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或100%的同一性的氨基酸序列。
转录激活域的其它实例包括单纯疱疹病毒VP16反式激活域、VP64(单纯疱疹病毒VP16的四重串联重复)、NF-κB p65(NF-κB反式激活亚基p65)激活域、MyoD1反式激活结构域、HSF1反式激活结构域(来自人类热休克因子1的反式激活结构域)、RTA(EB病毒R反式激活因子激活结构域)、SET7/9反式激活结构域、p53激活结构域1、p53激活结构域2,CREB(cAMP反应元件结合蛋白)激活域、E2A激活域、NFAT(活化T细胞核因子)激活域,及其功能片段和变体。参见,例如,US2016/0298125、US 2016/0281072,和WO 2016/049258,出于所有目的将其全部内容通过引用整体并入本文。转录激活域的其它实例包括Gcn4、MLL、Rtg3、Gln3、Oaf1、Pip2、Pdr1、Pdr3、Pho4、Leu3及其功能片段和变体。参见,例如,US 2016/0298125,出于所有目的通过引用将其全部内容合并于此。转录激活域的其它实例包括Sp1、Vax、GATA4及其功能片段和变体。参见,例如,WO 2016/149484,出于所有目的通过引用将其全部内容合并于此。其它例子包括来自Oct1、Oct-2A、AP-2、CTF1、P300、CBP、PCAF、SRC1、PvALF、ERF-2、OsGAI、HALF-1、C1、AP1、ARF-5、ARF-6、ARF-7、ARF-8、CPRF1、CPRF4、MYC-RP/GP和TRAB1PC4的激活结构域及其功能片段和变体。参见,例如,US 2016/0237456、EP3045537,和WO 2011/146121,出于所有目的将其每一篇均通过引用整体并入。还已知其它合适的转录激活域。参见,例如,WO 2011/146121,出于所有目的通过引用将其全部内容合并于此。
B.嵌合衔接体蛋白
还提供了可以与本文其它地方公开的指导RNA结合的嵌合衔接体蛋白。本文公开的嵌合衔接体蛋白可用于dCas协同激活介质(SAM)样系统中,以增加针对靶基因内的靶序列的转录激活域的数量和多样性,以激活靶基因的转录。可以将编码嵌合衔接体蛋白的核酸基因组整合到本文其它地方公开的细胞或非人动物(例如包含基因组整合的嵌合Cas蛋白表达盒的细胞或非人动物)中,或嵌合衔接体蛋白或核酸可以使用本文其它地方公开的方法(例如LNP介导的递送或AAV介导的递送)引入此类细胞和非人动物中。
此类嵌合衔接体蛋白包含:(a)与指导RNA中的衔接体结合元件特异性结合的衔接体(即衔接体结构域或衔接体蛋白);以及(b)一个或多个异源转录激活域。例如,此类融合蛋白可包含1、2、3、4、5,或更多个转录激活域(例如,两个或更多个异源转录激活域或三个或更多个异源转录激活域)。在一个例子中,此类嵌合衔接体蛋白可包含:(a)与指导RNA中的衔接体结合元件特异性结合的衔接体(即衔接体结构域或衔接体蛋白);以及(b)两个或多个转录激活域。例如,嵌合衔接体蛋白可以包含:(a)与指导RNA中的一个或多个MS2适配体特异性结合的MS2外壳蛋白衔接体(例如指导RNA中不同位置的两个MS2适配体);以及(b)一个或多个(例如两个或多个)转录激活域。例如,两个转录激活域可以是p65和HSF1转录激活域或其功能片段或变体。然而,还提供了嵌合衔接体蛋白,其中转录激活域包含其它转录激活域或其功能片段或变体。
一个或多个转录激活域可直接融合至衔接体。替代地,一个或多个转录激活域可通过接头或接头的组合或通过一个或多个另外的域连接至衔接体。同样,如果存在两个或多个转录激活域,则它们可以彼此直接融合,或者可以通过接头或接头组合或一个或多个其它结构域彼此连接。可以在这些融合蛋白中使用的接头可以包括不干扰融合蛋白功能的任何序列。示例性的接头是短的(例如2-20个氨基酸),并且通常是柔性的(例如包含具有高自由度的氨基酸,例如甘氨酸、丙氨酸,和丝氨酸)。接头的一些具体实例包括一个或多个由GGGS(SEQ ID NO:4)或GGGGS(SEQ ID NO:5)组成的单元,例如GGGS(SEQ ID NO:4)的两个,三个,四个或更多个重复或GGGGS(SEQ ID NO:5)的任何组合。也可以使用其它接头序列。
一个或多个转录激活域和衔接体可以在嵌合衔接体蛋白内以任何顺序排列。作为一种选择,一个或多个转录激活域可以在衔接体的C末端,而该衔接体可以在一个或多个转录激活域的N末端。例如,一个或多个转录激活域可以在嵌合衔接体蛋白质的C末端,且该衔接体可以在嵌合衔接体蛋白质的N末端。然而,一个或多个转录激活域可以在衔接体的C末端而不在嵌合衔接体蛋白的C末端(例如如果核定位信号在嵌合衔接体蛋白的C末端)。同样地,衔接体可以在一个或多个转录激活域的N末端而不在嵌合衔接体蛋白质的N末端(例如如果核定位信号在嵌合衔接体蛋白质的N末端)。作为另一选择,一个或多个转录激活域可以在衔接体的N末端,而衔接体可以在一个或多个转录激活域的C末端。例如,一个或多个转录激活域可以在嵌合衔接体蛋白的N末端,而该衔接体可以在嵌合衔接体蛋白的C末端。作为另一选择,如果嵌合衔接体蛋白包含两个或更多个转录激活域,则两个或更多个转录激活域可以侧接衔接体。
嵌合衔接体蛋白也可以可操作地连接或融合至其它异源多肽。融合或连接的异源多肽可位于嵌合衔接体蛋白内的N末端、C末端或其内部的任何位置。例如,嵌合衔接体蛋白可以进一步包含核定位信号。这种蛋白质的一个具体实例包括MS2外壳蛋白(适配体)和HSF1转录激活域,所述括MS2外壳蛋白(适配体)直接或通过NLS连接p65转录激活域,该p65转录激活域位于MS2外壳蛋白(MSP)的C末端;所述HSF1转录激活域位于p65转录激活域的C末端。这样的蛋白质可以从N末端到C末端包含:MCP;核定位信号;p65转录激活域;和HSF1转录激活域。例如,嵌合衔接体蛋白可包含以下,基本上由以下组成,或由以下组成:与SEQ IDNO:6所示的MCP-p65-HSF1嵌合衔接体蛋白序列具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
嵌合衔接体蛋白也可以与提供亚细胞定位的一种或多种异源多肽融合或连接。此类异源多肽可包括,例如,一个或多个核定位信号(NLS),例如用于靶向核的SV40 NLS和/或α-输入蛋白NLS,用于靶向线粒体的线粒体定位信号,ER保留信号等。参见,例如,Lange etal.(2007)J.Biol.Chem.282:5101-5105,出于所有目的通过引用整体并入本文。NLS可以包含,例如,一段碱性氨基酸,并且可以是单分型序列或二分型序列。可选地,嵌合衔接体蛋白包含两个或更多个NLS,包括在N末端的NLS(例如,α-输入蛋白NLS)和/或在C末端的NLS(例如SV40 NLS)。
嵌合衔接体蛋白也可以可操作地连接至细胞穿透结构域或蛋白转导结构域。例如,细胞穿透域可以源自HIV-1TAT蛋白、来自人类乙型肝炎病毒的TLM细胞穿透模体、MPG、Pep-1、VP22、来自单纯疱疹病毒的细胞穿透肽,或聚精氨酸肽序列。参见,例如,WO 2014/089290和WO2013/176772,出于所有目的,将其每一篇均通过引用整体并入本文。作为另一个例子,可以将嵌合衔接体蛋白融合或连接至提供增加或降低的稳定性的异源多肽。
为了易于追踪或纯化,嵌合衔接体蛋白也可以可操作地连接至异源多肽,例如荧光蛋白、纯化标签,或表位标签。荧光蛋白的实例包括绿色荧光蛋白(例如GFP、GFP-2、tagGFP、turboGFP、eGFP、Emerald、Azami Green、Monomeric Azami Green、CopGFP、AceGFP、ZsGreenl),黄色荧光蛋白(例如YFP、eYFP、Citrine、Venus、YPet、PhiYFP、ZsYellowl),蓝色荧光蛋白(例如eBFP、eBFP2、Azurite、mKalamal、GFPuv、Sapphire、T-sapphire),青色荧光蛋白(例如eCFP、Cerulean、CyPet、AmCyanl、Midoriishi-Cyan),红色荧光蛋白(例如mKate、mKate2、mPlum、DsRed monomer、mCherry、mRFP1、DsRed-Express、DsRed2、DsRed-Monomer、HcRed-Tandem、HcRedl、AsRed2、eqFP611、mRaspberry、mStrawberry、Jred),橙色荧光蛋白(例如mOrange、mKO、Kusabira-Orange、Monomeric Kusabira-Orange、mTangerine、tdTomato),和任何其它合适的荧光蛋白。标签的例子包括谷胱甘肽-S-转移酶(GST)、几丁质结合蛋白(CBP)、麦芽糖结合蛋白、硫氧还蛋白(TRX)、聚(NANP)、串联亲和纯化(TAP)标签、myc、AcV5、AU1、AU5、E、ECS、E2、FLAG、血凝素蛋白(HA)、nus、Softag 1、Softag 3、Strep、SBP、Glu-Glu、HSV、KT3、S、S1、T7、V5、VSV-G、组氨酸(His)、生物素羧基载体蛋白(BCCP),和钙调蛋白。
嵌合衔接体蛋白也可以被束缚到标记的核酸。可以通过共价相互作用或非共价相互作用实现这种束缚(即物理连接),并且束缚可以是直接的(例如通过直接融合或化学缀合,这可以通过修饰蛋白质上的半胱氨酸或赖氨酸残基或修饰内含肽基来实现),或可以通过一种或多种间插连接子或衔接体分子(例如链霉亲和素或适配体)来实现。参见,例如,Pierce et al.(2005)Mini Rev.Med.Chem.5(1):41-55;Duckworth et al.(2007)Angew.Chem.Int.Ed.Engl.46(46):8819-8822;Schaeffer和Dixon(2009)AustralianJ.Chem.62(10):1328-1332;Goodman et al.(2009)Chembiochem.10(9):1551-1557;和Khatwani et al.(2012)Bioorg.Med.Chem.20(14):4532-4539,出于所有目的,将其每一篇通过引用整体并入本文。合成蛋白质-核酸缀合物的非共价策略包括生物素-链霉亲和素和镍-组氨酸方法。可以通过使用多种化学方法连接适当官能化的核酸和蛋白质来合成共价蛋白质-核酸缀合物。这些化学方法中的一些涉及将寡核苷酸直接附着到蛋白质表面的氨基酸残基(例如赖氨酸胺或半胱氨酸硫醇),而其它更复杂的方案则需要蛋白质的翻译后修饰,或催化性或反应性蛋白结构域的参与。使蛋白质与核酸共价连接的方法可以包括,例如,寡核苷酸与蛋白质赖氨酸残基或半胱氨酸残基的化学交联、表达的蛋白质连接、化学酶法和光适配体的使用。可以将标记的核酸束缚在C末端、N末端,或Cas蛋白内的内部区域。同样,Cas蛋白可以束缚在5'末端、3'末端,或标记的核酸中的内部区域。即标记的核酸可以任何方向和极性束缚。
(1)适配体
衔接体(即衔接体结构域或衔接体蛋白)是特异性识别并结合不同序列(例如以序列特异性方式结合不同的DNA和/或RNA序列,例如适配体)的核酸结合结构域(例如DNA结合结构域和/或RNA结合结构域)。适配体包括通过其采取特定三维构象的能力可以以高亲和力和特异性结合至靶分子的核酸。这样的衔接体可以与例如特定的RNA序列和二级结构结合。可以将这些序列(即衔接体结合元件)工程化为指导RNA。例如,可以将MS2适配体工程化成指导RNA,以特异性结合MS2外壳蛋白(MCP)。例如,衔接体可包含以下、基本上由以下组成,或由以下组成:与SEQ ID NO:7中列出的MCP序列具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或100%的同一性的氨基酸序列。
衔接体和靶标的一些具体实例包括存在于噬菌体外壳蛋白多样性内的RNA结合蛋白/适配体组合。例如,可以使用以下衔接体蛋白或其功能片段或变体:MS2外壳蛋白(MCP)、PP7、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、ΦCb5、ΦCb8r、ΦCb12r、ΦCb23r、7s和PRR1。参见,例如,WO 2016/049258,出于所有目的通过引用将其全文并入本文。衔接体蛋白的功能片段或功能变体保留结合特定的衔接体结合元件的能力(例如,以序列特异性方式与特定的衔接体结合序列结合的能力)。例如,可以使用PP7假单胞菌(Pseudomonas)噬菌体外壳蛋白变体,其中氨基酸68-69突变为SG,而氨基酸70-75从野生型蛋白中删除。参见,例如,Wu et al.(2012)Biophys J 102(12):2936-2944和Chao et al.(2007)Nature Structural&MolecularBiology 15(1):103-105,出于所有目的,将每一篇均通过引用整体并入本文。同样,可以使用MCP变体,例如N55K突变体。参见,例如,Spingola和Peabody(1994)J Biol Chem 269(12):9006-9010,出于所有目的通过引用整体并入本文。
可以使用的衔接体蛋白的其它例子包括核糖核酸内切酶Csy4或λN蛋白的全部或部分(例如DNA结合形式)。参见,例如,US 2016/0312198,出于所有目的通过引用将其全部内容合并于此。
(2)转录激活域
本文公开的嵌合衔接体蛋白包含一个或多个转录激活域。这样的转录激活域可以是天然存在的转录激活域,可以是天然存在的转录激活域的功能片段或功能变体,或者可以是工程的或合成的转录激活域。可以使用的转录激活域包括本文其它地方描述为用于嵌合Cas蛋白的那些。
用于本文公开的嵌合衔接体蛋白的具体的转录激活域包含p65和/或HSF1转录激活域或其功能片段或变体。HSF1转录激活域可以是人热休克因子1(HSF1)的转录激活域。p65转录激活域可以是转录因子p65的转录激活域(也称为由RELA基因编码的核因子NF-κ-Bp65亚基)。作为一个实例,转录激活域可包含以下、基本上由以下组成,或由以下组成:与SEQ ID NO:8中列出的p65转录激活域蛋白序列具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或100%的同一性的氨基酸序列。作为另一个例子,转录激活域可以包含以下、基本上由以下组成,或由以下组成:与SEQ ID NO:9中列出的的HSF1转录激活域蛋白序列具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或100%的同一性的氨基酸序列。
C.指导RNA和指导RNA阵列
还提供了可与本文其它各处公开的嵌合Cas蛋白和嵌合衔接体蛋白结合以激活靶基因转录的指导RNA或指导RNA阵列。如本文其它地方所公开的,可以将编码指导RNA的核酸基因组整合到细胞或非人动物(例如SAM就绪细胞(SAM-ready cell)或非人动物)中,或者可以使用本文其它地方公开的方法(例如LNP介导的递送或AAV介导的递送)将指导RNA或核酸引入此类细胞和非人动物中。如本文其它地方所公开的,可以选择递送方法以提供重组酶的组织特异性递送。
编码指导RNA或指导RNA阵列的核酸可以编码一种或多种指导RNA(或如果将指导RNA引入细胞或非人动物中,则可以引入一种或多种指导RNA)。例如,可以编码或引入2个或更多个、3个或更多个、4个或更多个,或5个或更多个指导RNA。每个指导RNA编码序列可以可操作地连接至相同的启动子(例如U6启动子)或不同的启动子(例如,每个指导RNA编码序列可操作地连接至其自身的U6启动子)。两个或更多个指导RNA可以在单个靶基因中靶向不同的靶序列。例如,2个或更多、3个或更多、4个或更多,或5个或更多的指导RNA可以在单个靶基因中分别靶向不同的靶序列。类似地,指导RNA可以靶向多个靶基因(例如2个或更多个、3个或更多个、4个或更多个,或5个或更多个靶基因)。指导RNA靶序列的实例在本文其它地方公开。
(1)指导RNA
“指导RNA”或“gRNA”是与Cas蛋白(例如Cas9蛋白)结合并且将Cas蛋白靶向靶DNA内的特定位置的RNA分子。指导RNA可以包含两个段(segment):“DNA靶向段”和“蛋白质结合段”。“段”包括分子的一部分或区域,例如RNA中核苷酸的连续链。某些gRNA(例如Cas9的gRNA)可以包含两个单独的RNA分子:“激活剂RNA”(例如tracrRNA)和“靶标RNA(targeter-RNA)”(例如CRISPR RNA或crRNA)。其它gRNA是单RNA分子(单RNA多核苷酸),也可以称为“单分子gRNA”、“单指导RNA”,或“sgRNA”。参见,例如,WO 2013/176772、WO 2014/065596、WO2014/089290、WO 2014/093622、WO 2014/099750、WO 2013/142578,和WO 2014/131833,在出于所有目的此通过引用将每一篇的全部内容并入本文。例如,对于Cas9,单指导RNA可以包含与tracrRNA融合的crRNA(例如通过接头)。例如,对于Cpf1,仅需要crRNA即可实现与靶序列的结合。术语“指导RNA”和“gRNA”包括双分子(即模块)gRNA和单分子gRNA。
示例性的两分子gRNA包含crRNA样(“CRISPR RNA”或“靶标RNA”或“crRNA”或“crRNA重复”)分子和相应的tracrRNA样(“反式作用CRISPR基因”或“激活剂RNA”或“tracrRNA”)分子。crRNA既包含gRNA的DNA靶向段(单链),又包含形成gRNA的蛋白质结合片段的dsRNA双链体一半的核苷酸链。位于DNA靶向片段下游(3’)的crRNA尾巴的例子包含以下,基本上由以下组成,或由以下组成:GUUUUAGAGCUAUGCU(SEQ ID NO:10)。可将本文公开的任何靶向DNA的片段连接至SEQ ID NO:10的5'末端以形成crRNA。
相应的tracrRNA(活化剂RNA)包含一段核苷酸,其形成gRNA的蛋白质结合段的dsRNA双链体的另一半。crRNA的一段核苷酸与tracrRNA的一段核苷酸互补并杂交,以形成gRNA蛋白质结合域的dsRNA双链体。这样,每个crRNA可以称为具有对应的tracrRNA。tracrRNA序列的实例包含以下,基本上由以下组成或由以下组成:AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUU(SEQ ID NO:11)。
在需要crRNA和tracrRNA的系统中,crRNA和相应的tracrRNA杂交以形成gRNA。在仅需要crRNA的系统中,crRNA可以是gRNA。crRNA还提供了与靶DNA互补链杂交的单链DNA靶向片段。如果用于细胞内的修饰,则可以将给定的crRNA或tracrRNA分子的确切序列设计为对要使用RNA分子的物种具有特异性。参见,例如,Mali et al.(2013)Science339:823-826;Jinek et al.(2012)Science 337:816-821;Hwanget al.(2013)Nat.Biotechnol.31:227-229;Jiang et al.(2013)Nat.Biotechnol.31:233-239;和Cong et al.(2013)Science 339:819-823,出于所有目的,将每一篇均通过引用整体并入本文。
如下文所更详细描述的,给定的gRNA的DNA靶向段(crRNA)包含与靶DNA的互补链上的序列互补的核苷酸序列。gRNA的DNA靶向片段通过杂交(即碱基配对),以序列特异性方式与靶DNA相互作用。这样,DNA靶向段的核苷酸序列可以变化,并确定gRNA和靶DNA将与之相互作用的靶DNA内的位置。可以修饰对象(subject)gRNA的DNA靶向段,以与靶DNA内的任何所需序列杂交。取决于CRISPR/Cas系统和生物体,天然存在的crRNA是不同的,但通常包含长度在21至72个核苷酸之间的靶向片段,其侧接长度在21至46个核苷酸之间的两个直接重复序列(DR)(参见,例如,WO 2014/131833,出于所有目的通过引用整体并入本文)。对于化脓链球菌,DR的长度为36个核苷酸,而靶向段的长度为30个核苷酸。位于3'的DR与相应的tracrRNA互补并与之杂交,后者又与Cas蛋白结合。
DNA靶向段可以具有例如至少约12、15、17、18、19、20、25、30、35或40个核苷酸的长度。此类DNA靶向段的长度可为,例如,约12至约100、约12至约80、约12至约50、约12至约40、约12至约30、约12至约25,或约12至约20个核苷酸。例如,DNA靶向段可以为约15至约25个核苷酸(例如约17至约20个核苷酸,或约17、18、19或20个核苷酸)。参见,例如,US 2016/0024523,出于所有目的通过引用将其全部内容合并于此。对于来自化脓链球菌的Cas9,典型的DNA靶向段的长度为16至20个核苷酸之间或17至20个核苷酸之间。对于来自金黄色葡萄球菌的Cas9,典型的DNA靶向段的长度在21至23个核苷酸之间。对于Cpf1,典型的DNA靶向段的长度为至少16个核苷酸或至少18个核苷酸。
TracrRNA可以是任何形式(例如全长tracrRNA或活性部分tracrRNA(activepartial tracrRNAs)),并且具有不同的长度。它们可以包括初级转录物或加工后的形式。例如,tracrRNA(作为单指导RNA的一部分,或作为两分子gRNA的一部分的另外的分子)可以包含以下,基本上由以下组成,或由以下组成:野生型tracrRNA序列的全部或一部分(例如野生型tracrRNA序列的约20个、26个、32个、45个、48个、54个、63个、67个、85个或更多个核苷酸)。来自化脓链球菌的野生型tracrRNA序列的实例包括171个核苷酸、89个核苷酸、75个核苷酸,和65个核苷酸的版本。参见,例如,Deltcheva et al.(2011)Nature 471:602-607;WO 2014/093661,出于所有目的,其每一篇均通过引用整体并入本文。单指导RNA(sgRNA)中的tracrRNA的例子包括在+48、+54、+67,和+85版本的sgRNA中发现的tracrRNA片段,其中“+n”表示在sgRNA中包含野生型tracrRNA的最多+n核苷酸。参见US 8,697,359,出于所有目的将其全部内容并入本文作为参考。
指导RNA的DNA靶向段与靶DNA的互补链之间的互补性百分比可以为至少60%(例如,至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少98%、至少99%,或100%)。在约20个连续核苷酸上,DNA靶向段与靶DNA的互补链之间的互补性百分比可以为至少60%。例如,DNA靶向段与靶DNA互补链之间的互补性百分比可以是靶DNA互补链5'端的14个连续核苷酸的100%,而剩下的部分则低至0%。在这种情况下,DNA靶向段可以被认为是14个核苷酸的长度。作为另一个例子,DNA靶向段与靶DNA的互补链之间的互补性百分比可以是靶DNA互补链的5'端的7个连续核苷酸的100%,而剩下的部分则低至0%。在这种情况下,DNA靶向段可被认为是7个核苷酸的长度。在一些指导RNA中,DNA靶向段内的至少17个核苷酸与靶DNA的互补链互补。例如,DNA靶向段的长度可以是20个核苷酸,并且可以与靶DNA的互补链包含1、2或3个错配。在一个例子中,错配不与互补链的对应于原间隔子相邻基序(PAM)序列的区域(即,PAM序列的反向互补序列)相邻(例如,错配在指导RNA的DNA靶向段的5'末端,或错配距离对应于PAM序列的互补链的区域至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18或19个碱基对)。
gRNA的蛋白质结合段可包含两个互补的核苷酸片段。蛋白结合段的互补核苷酸杂交形成双链RNA双链体(dsRNA)。对象gRNA的蛋白质结合段与Cas蛋白相互作用,并且gRNA通过DNA靶向段将结合的Cas蛋白导向靶DNA内的特定核苷酸序列。
单指导RNA可以包含DNA靶向段和支架序列(即指导RNA的蛋白质结合序列或Cas结合序列)。例如,此类指导RNA可以具有连接3'支架序列的5'DNA靶向段。示例性的支架序列包含以下,基本上由以下组成或由以下组成:
GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCU(版本1;SEQ ID NO:12);
GUUGGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(版本2;SEQ ID NO:13);
GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(版本3;SEQ ID NO:14);和
GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(版本4;SEQ ID NO:15)。靶向本文公开的任何指导RNA靶序列的指导RNA可以包括,例如,与指导RNA的3'末端上的任何示例性指导RNA支架序列融合的指导RNA的5'末端上的DNA靶向段。也就是说,本文公开的任何DNA靶向段都可以连接至上述任何一个支架序列的5'末端,以形成单指导RNA(嵌合指导RNA)。
指导RNA可以包括提供其它所需特征的修饰或序列(例如修饰的或调节的稳定性;亚细胞靶向;荧光标记的跟踪;蛋白质或蛋白质复合物的结合位点等)。此类修饰的示例包括,例如,5'帽(例如7-甲基鸟苷帽(m7G));3'聚腺苷酸尾(即3'聚(A)尾);核糖开关序列(例如允许调节的稳定性和/或调节的蛋白质和/或蛋白质复合物的可及性);稳定性控制序列;形成dsRNA双链体的序列(即发夹);将RNA靶向亚细胞位置的修饰或序列(例如核、线粒体、叶绿体等);提供跟踪的修饰或序列(例如与荧光分子直接缀合、与有助于荧光检测的模体缀合、允许荧光检测的序列等);提供蛋白质结合位点的修饰或序列(例如,作用于DNA的蛋白质,例如转录激活剂);及其组合。修饰的其它例子包括工程化的茎环双链体结构、工程化的凸起(bulge)区域、茎环双链体结构的3'末端的工程化的发夹,或其其任何组合。参见,例如,US 2015/0376586,出于所有目的通过引用将其全部内容并入本文。凸起可以是由crRNA样区域和最小tracrRNA样区域组成的双链体中的核苷酸的不成对区域。凸起可在双链体的一侧包含未配对的5'-XXXY-3',其中X是任何嘌呤,Y可以是可与相反链上的核苷酸形成摆动对的核苷酸,以及位于双链体的另一侧的未配对的核苷酸区域。
未修饰的核酸可能易于降解。外源核酸也可以诱导先天免疫应答。修饰可以帮助引入稳定性并降低免疫原性。指导RNA可以包含修饰的核苷和修饰的核苷酸,包括例如以下的一种或多种:(1)改变或替换一种或两种非连接的磷酸氧和/或一种或多种在磷酸二酯主链连接中的连接的磷酸氧;(2)改变或替换核糖的成分,例如改变或替换核糖上的2'羟基;(3)用去磷接头取代磷酸模体;(4)修饰或替换天然存在的核碱基;(5)取代或修饰核糖磷酸主链;(6)修饰寡核苷酸的3'末端或5'末端(例如末端磷酸基的去除、修饰或替换,或模体的缀合);以及(7)糖的修饰。其它可能的指导RNA修饰包括尿嘧啶或聚尿嘧啶束(poly-uraciltracts)的修饰或替换。参见,例如,WO 2015/048577和US 2016/0237455,出于所有目的,将每一篇通过引用整体并入本文。可以对Cas编码核酸如Cas mRNA进行类似的修饰。例如,可以通过使用同义密码子去除尿苷来修饰Cas mRNA。
作为一个实例,指导RNA的5'或3'末端的核苷酸可以包括硫代磷酸酯(phosphorothioate)键(例如,碱基可以具有为硫代磷酸酯基团的修饰的磷酸基)。例如,指导RNA可以在指导RNA的5'或3'末端的2、3,或4个末端核苷酸之间包含硫代磷酸酯键。作为另一个例子,指导RNA的5'和/或3'末端的核苷酸可以具有2'-O-甲基修饰。例如,指导RNA可以在指导RNA的5'和/或3'末端(例如5'末端)的2、3或4个末端核苷酸处包含2'-O-甲基修饰。参见,例如,WO 2017/173054A1和Finn et al.(2018)Cell Reports 22:1-9,出于所有目的,通过引用将其全文并入本文。
在一些指导RNA(例如,单指导RNA)中,通过插入与一个或多个衔接体(即衔接蛋白或结构域)结合的不同RNA序列来修饰指导RNA的至少一个环(例如两个环)。此类衔接体蛋白可用于进一步募集一个或多个异源功能结构域,例如转录激活域。包含此类衔接体蛋白(即嵌合衔接体蛋白)的融合蛋白的实例在本文其它地方公开。例如,MS2结合环ggccAACAUGAGGAUCACCCAUGUCUGCAGggcc(SEQ ID NO:16)可以取代SEQ ID NO:12或SEQ ID NO:14所示的sgRNA支架(主链)的核苷酸+13至+16和核苷酸+53至+56,或WO 2016/049258和Konermannet al.(2015)Nature 517(7536):583-588所描述的化脓链球菌CRISPR/Cas9系统的sgRNA骨架,出于所有目的,将每一篇均通过引用整体并入本文。参见,例如,图7。本文所使用的指导RNA编号是指在指导RNA支架序列(即指导RNA的DNA靶向段的下游的序列)中的核苷酸编号。例如,指导RNA支架的第一个核苷酸为+1,支架的第二个核苷酸为+2,依此类推。对应于SEQ ID NO:12或SEQ ID NO:14中核苷酸+13至+16的残基是跨越SEQ ID NO:12或SEQ IDNO:14中核苷酸+9至+21的区域中的环序列;在本文中将该区域称为四环。对应于SEQ IDNO:12或SEQ ID NO:14中核苷酸+53至+56的残基是跨越SEQ ID NO:12或SEQ ID NO:14中核苷酸+48至+61的区域中的环序列;在本文中将该区域称为茎环2。SEQID NO:12或SEQ IDNO:14中的其它茎环序列包括茎环1(核苷酸+33至+41)和茎环3(核苷酸+63至+75)。所得结构是sgRNA支架,其中四环和茎环2序列中的每一个均已被MS2结合环取代。四环和茎环2从Cas9蛋白突出,使得添加MS2结合环不会干扰任何Cas9残基。此外,四环和茎环2位点与DNA的接近性表明,定位于这些位置可能会导致DNA与任何募集的蛋白质(例如转录激活因子)之间的高度的相互作用。因此,在一些sgRNA中,对应于SEQ ID NO:12或SEQ ID NO:14所示的指导RNA支架的+13至+16的核苷酸和/或对应于+53至+56的核苷酸或与这些支架/主链中的任意一个最佳比对时的相应的残基被能够结合一个或多个衔接体蛋白或结构域的独特RNA序列取代。替代地或另外地,可以将衔接体结合序列添加到指导RNA的5'末端或3'末端。在四环和茎环2区域中包含MS2结合环的示例性指导RNA支架可以包含以下,基本上由以下组成,或由以下组成:SEQ ID NO:40所示的序列。示例性的在四环和茎环2区域中包含MS2结合环的示例性通用指导RNA可以包含以下,基本上由以下组成,或由以下组成:SEQ ID NO:63所示的序列。
指导RNA可以以任何形式提供。例如,可以以两个分子(分离的crRNA和tracrRNA)或一个分子(sgRNA)的RNA的形式提供gRNA,并且可选地以与Cas蛋白的复合物的形式提供。gRNA也可以以编码gRNA的DNA的形式提供。编码gRNA的DNA可以编码单个RNA分子(sgRNA)或分离的RNA分子(例如分离的crRNA和tracrRNA)。在后一种情况下,编码gRNA的DNA可以提供为一个DNA分子或作为分别编码crRNA和tracrRNA的分离的DNA分子。
当以DNA形式提供gRNA时,该gRNA可以在细胞中瞬时地、条件地,或组成地表达。可以将编码gRNA的DNA稳定整合到细胞基因组中,并可操作地连接在细胞中活跃的启动子。替代地,可将编码gRNA的DNA可操作地连接至表达构建体中的启动子。例如,编码gRNA的DNA可以在包含异源核酸的载体中。可用于此类表达构建体的启动子包括在例如真核细胞、人细胞、非人细胞、哺乳动物细胞、非人哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞、多能细胞、胚胎干(ES)细胞、成年干细胞、发育受限的祖细胞、诱导性多能干(iPS)细胞,或单细胞期胚胎的一种或多种中具有活性的启动子。这样的启动子可以是,例如,条件启动子、诱导型启动子、组成型启动子,或组织特异性启动子。这样的启动子也可以是,例如,双向启动子。合适的启动子的具体实例包括RNA聚合酶III启动子,例如人U6启动子、大鼠U6聚合酶III启动子,或小鼠U6聚合酶III启动子。
替代地,可以通过各种其它方法制备gRNA。例如,可以使用例如T7 RNA聚合酶,通过体外转录来制备gRNA(参见,例如,WO2014/089290和WO 2014/065596,出于所有目的将其每一篇的全部内容通过引用并入本文)。指导RNA也可以是通过化学合成制备的、合成产生的分子。
指导RNA(或编码指导RNA的核酸)可以在包含一个或多个指导RNA(例如1、2、3、4或更多个指导RNA)和增加指导RNA稳定性(例如,在给定的储存条件下(例如-20℃、4℃,或环境温度)延长降解产物的含量低于阈值(例如低于起始核酸或蛋白质的重量的0.5%)的时间;或增加体内稳定性)的载体的组合物中。此类载体的非限制性实例包括聚(乳酸)(PLA)微球、聚(D,L-乳酸-甘醇酸)(poly(D,L-lactic-coglycolic-acid),PLGA)微球、脂质体、胶束、反胶束、脂质卷(lipid cochleates),和脂质微管。这样的组合物可以进一步包含Cas蛋白,例如Cas9蛋白,或编码Cas蛋白的核酸。
(2)指导RNA靶序列
指导RNA的靶DNA包括存在于DNA中的核酸序列,在存在足够的结合条件的前提下,gRNA的DNA靶向段将与该核酸序列结合。合适的DNA/RNA结合条件包括细胞中通常存在的生理条件。其它合适的DNA/RNA结合条件(例如,无细胞系统中的条件)是本领域已知的(参见,例如,Molecular Cloning:A Laboratory Manual,3rd Ed.(Sambrook et al.,HarborLaboratory Press 2001),出于所有目的通过引用整体并入本文)。与gRNA互补并杂交的靶DNA链可以称为“互补链”,而与“互补链”互补的靶DNA链(因此与Cas蛋白或gRNA不互补)称为“非互补链”或“模板链”。
靶DNA既包括与指导RNA杂交的互补链上的序列,又包括非互补链上的相应序列(例如,与原间隔子相邻基序(PAM)相邻)。本文所使用的术语“指导RNA靶序列”具体是指非互补链上的序列,该序列对应与指导RNA在互补链上杂交的序列(即其反向互补)。即,指导RNA靶序列是指与PAM相邻的非互补链上的序列(例如对于Cas9,是PAM的上游或5’)。指导RNA靶序列等同于指导RNA的DNA靶向段,但是胸腺嘧啶而非尿嘧啶。作为一个例子,SpCas9酶的指导RNA靶序列可以指非互补链上5’-NGG-3’PAM上游的序列。指导RNA被设计成与靶DNA的互补链具有互补性,其中指导RNA的DNA靶向段与靶DNA的互补链之间的杂交促进了CRISPR复合物的形成。如果存在足够的互补性以引起杂交并促进CRISPR复合物的形成,则不一定需要完全互补。如果在本文中将指导RNA称为靶向指导RNA靶序列,则是指该指导RNA与靶DNA的互补链序列杂交,该互补链序列是非互补序列上的指导RNA靶序列的反向互补。
靶DNA或指导RNA靶序列可以包含任何多核苷酸,并且可以位于例如细胞(例如线粒体或叶绿体)的细胞核或细胞质中或细胞的细胞器内。靶DNA或指导RNA靶序列可以是细胞内源或外源的任何核酸序列。指导RNA靶序列可以是编码基因产物(例如蛋白质)的序列或非编码序列(例如调节序列),或者可以包括两者。
优选地,靶序列与基因的转录起始位点相邻。例如,靶序列可以在转录起始位点的1000、900、800、700、600、500、400、300、200、190、180、170、160、150、140、130、120、110、100、90、80、70、60、50、40、30、20、10、5或1个碱基对之内,在转录起始位点上游的1000、900、800、700、600、500、400、300、200、190、180、170、160、150、140、130、120、110、100、90、80、70、60、50、40、30、20、10、5或1个碱基对之内,或在转录起始位点下游的1000、900、800、700、600、500、400、300、200、190、180、170、160、150、140、130、120、110、100、90、80、70、60、50、40、30、20、10、5或1个碱基对之内。可选地,靶序列在转录起始位点上游的200个碱基对至转录起始位点下游的1个碱基对的区域内(-200至+1)。
靶序列可以在希望被靶向转录激活的任何基因内。在某些情况下,靶基因可以是非表达的基因或表达较弱的基因(例如,仅在背景以上最低表达的基因,例如1.1倍、1.2倍、1.3倍、1.4倍、1.5倍、1.6倍、1.7倍、1.8倍、1.9倍,或2倍)。靶基因也可以是与对照基因相比以低水平表达的基因。靶基因也可以是表观遗传沉默的。术语“表观遗传沉默的(epigenetically silenced)”是指未转录的基因或相对于对照样品(例如相应的对照细胞,例如正常细胞)中的基因转录水平而言,由于除遗传变化(例如突变)以外的其它机制而在降低的水平上转录的基因。基因沉默的表观遗传机制是众所周知的,并且包括,例如,基因5'调控区的CpG岛中CpG二核苷酸的超甲基化,以及由于例如组蛋白乙酰化导致的染色质结构变化,从而减少或抑制基因转录。
靶基因可以包括在特定器官或组织(例如肝脏)中表达的基因。靶基因可以包括疾病相关基因。疾病相关基因是指与非疾病对照的组织或细胞相比,在源自受疾病影响的组织的细胞中以异常水平或异常形式产生转录或翻译产物的任何基因。它可能是一个以异常高水平表达的基因,其中表达的改变与疾病的发生和/或进展相关。疾病相关基因还指具有引起疾病病因的突变或遗传变异的基因。转录或翻译的产物可能是已知的或未知的,并且可能处于正常或异常水平。例如,靶基因可以是与蛋白质聚集疾病和失调(例如阿尔茨海默氏病、帕金森氏病、亨廷顿氏病、肌萎缩性侧索硬化、朊病毒疾病,和淀粉样变(amyloidoses),例如甲状腺素视黄质运载蛋白淀粉样变)相关的基因(例如Ttr)。靶基因也可以是涉及与疾病或病症(例如高胆固醇血症或动脉粥样硬化)相关的途径的基因,或者当过表达时可以模拟此类疾病或病症的基因。靶基因也可以是在一种或多种类型的癌症中表达或过表达的基因。参见,例如,Santarius et al.(2010)Nat.Rev.Cancer 10(1):59-64,出于所有目的通过引用整体并入本文。
这种靶基因的一个具体实例是Ttr基因。可选地,Ttr基因可以包含病原性突变(例如,引起淀粉样变的突变)。此类突变的例子提供于例如WO 2018/007871,出于所有目的通过引用将其全文并入本文。示例性的人TTR蛋白和示例性的人TTR基因分别由UniProt IDP02766和Entrez基因ID7276识别。示例性的小鼠TTR蛋白和示例性的小鼠Ttr基因分别由UniProt ID P07309和Entrez基因ID 22139识别。运甲状腺素蛋白(TTR)是一种在血清和脑脊髓液中发现的蛋白质,其携带甲状腺激素和视黄醇结合蛋白至视黄醇。肝脏将TTR分泌到血液中,而脉络丛将TTR分泌到脑脊液中。TTR也在视网膜色素上皮中产生并分泌到玻璃体中。错折叠和聚集的TTR聚集在淀粉样变疾病,包括系统性老年性淀粉样变(SSA)、家族性淀粉样变多发性神经病(FAP),和家族性淀粉样心肌病(FAC),的多个组织和器官中。运甲状腺素蛋白(TTR)是一种127个氨基酸,55kDa的血清和脑脊液转运蛋白,主要由肝脏合成,但也由脉络丛产生。它也被称为前白蛋白、甲状腺素结合前白蛋白、ATTR、TBPA、CTS、CTS1、HEL111、HsT2651,和PALB。在其天然状态下,TTR以四聚体形式存在。在纯合子中,纯四聚体包含相同的、127个氨基酸的、富含β-折叠的亚基。在杂合子中,TTR四聚体可以由变异体和/或野生型亚基组成,通常以统计学方式组合。TTR负责在血清和脑脊髓液中携带甲状腺素(T4)和视黄醇结合的RBP(视黄醇结合蛋白)。小鼠Ttr基因中的指导RNA靶序列(不包括PAM)的实例分别在SEQ ID NO:34、35和36中列出。SEQ ID NO:34位于Ttr转录起始位点的-63(基因组坐标:build mm10,chr18,+链,20665187–20665209),SEQ ID NO:35位于Ttr转录起始位点的-134(基因组坐标:build mm10,chr18,+链,20665116–20665138),而SEQ ID NO:36位于Ttr转录起始位点的-112(基因组座标:build mm10,chr18,+链,20665138–20665160)。与分别在SEQ ID NO:34、35和36中列出的指导RNA靶序列相对应的指导RNA的DNA靶向段分别在SEQ ID NO:41、42和43中列出。包含这些DNA靶向段的单指导RNA的实例分别在SEQ IDNO:37、38和39中列出。
靶基因的其它实例是前蛋白转化酶枯草杆菌蛋白酶/kexin 9型(PCSK9)和低密度脂蛋白(LDL)受体(LDLR)。示例性人PCSK9蛋白和示例性人PCSK9基因分别通过UniProt IDQ8NBP7和Entrez基因ID255738识别。示例性的小鼠PCSK9蛋白和示例性的小鼠Pcsk9基因分别由UniProt ID Q80W65和Entrez基因ID 100102鉴定。示例性的人LDLR蛋白和示例性的人LDLR基因分别由UniProt ID P01130和Entrez基因ID 3949识别。示例性的小鼠LDLR蛋白和示例性的小鼠Ldlr基因分别由UniProt ID P35951和Entrez基因ID 16835识别。
LDLR介导富含胆固醇的LDL的内吞作用,从而维持血浆LDL水平。这发生在所有带核细胞中,但主要发生在肝脏中;肝脏从循环中清除了约70%的LDL。LDL受体结合并开始将LDL颗粒从细胞外液摄入细胞,从而降低了LDL颗粒的浓度。当LDL与LDLR结合时,它会诱导内体中LDLR-LDL复合物的内在化。内体环境的酸性诱导LDLR采用发夹结构。构象变化导致LDLR释放其LDL配体,并且受体被循环回到质膜。在人类中,由于LDL-胆固醇在血液中的积累,LDL直接参与动脉粥样硬化的发展,这是导致大多数心血管疾病的过程。
当PCSK9结合至LDLR时,PCSK9阻止受体-配体复合物的构象变化。这种抑制作用将LDLR重定向至溶酶体。PCSK9在胆固醇稳态中起主要调节作用,主要是通过降低质膜上的LDLR水平。降低的LDLR水平会导致LDL颗粒的代谢下降,从而导致高胆固醇血症。如果PCSK9被阻断,则更多的LDLR被回收并存在于细胞表面,以从细胞外液中去除LDL颗粒。因此,阻断PCSK9可以降低血液LDL颗粒浓度,而增加PCSK9的表达可以增加血液LDL颗粒浓度。因此,如本文其它地方所述的激活Pcsk9的表达可用于模拟高胆固醇血症(血液中胆固醇水平高),其可导致动脉粥样硬化(动脉的硬化)。
小鼠Ldlr基因中的指导RNA靶序列(不包括PAM)的例子分别在SEQ ID NO:75、76和77中列出。分别在SEQ ID NO:81、82和83中列出分别对应于SEQ ID NO:75、76和77中列出的指导RNA靶序列的指导RNA的DNA靶向段。包含这些DNA靶向段的单指导RNA的实例分别在SEQID NO:78、79和80中列出。
小鼠Pcsk9基因中的指导RNA靶序列(不包括PAM)的实例分别在SEQ ID NO:89、90和91中列出。分别在SEQ ID NOS:95、96和97中列出与分别在SEQ ID NO:89、90和91中列出的指导RNA靶序列相对应的指导RNA的DNA靶向段。包含这些DNA靶向段的单指导RNA的实例分别在SEQ ID NO:92、93和94中列出。
Cas蛋白对靶DNA的位点特异性结合和切割可发生在由(i)指导RNA和靶DNA的互补链之间的碱基配对互补性和(ii)位于靶DNA的非互补链中,被称为原间隔子相邻基序(PAM)的短基序。PAM可以侧接指导RNA靶序列。可选地,指导RNA靶序列可以在3'末端上侧接PAM(例如对于Cas9)。替代地,指导RNA靶序列可以在5'末端上侧接PAM(例如对于Cpf1)。例如,Cas蛋白的切割位点可以是(例如在指导RNA靶序列内)PAM序列上游或下游的约1至约10或约2至约5个碱基对(例如3个碱基对)。在SpCas9中,PAM序列(即在非互补链上)可以是5’-N1GG-3’,其中N1是任何DNA核苷酸,并且PAM在靶DNA的非互补链上紧邻指导RNA靶序列的3'。这样,在互补链上与PAM相对应的序列(即反向互补序列)将是5’-CCN2-3’',其中N2是任何DNA核苷酸,并且紧邻序列的5',指导RNA的DNA靶向段与该序列在靶DNA的互补链上杂交。在一些这样的情况下,N1和N2可以是互补的,并且N1-N2碱基对可以是任何碱基对(例如N1=C和N2=G;N1=G和N2=C;N1=A和N2=T;或N1=T,和N2=A)。对于来自金黄色葡萄球菌的Cas9,PAM可以是NNGRRT或NNGRR,其中N可以是A、G、C,或T,而R可以是G或A。对于来自空肠弯曲杆菌的Cas9,PAM可以是,例如,NNNNACAC或NNNNRYAC,其中N可以是A、G、C,或T,R可以是G或A。在某些情况下(例如对于FnCpf1),PAM序列可以位于5'末端的上游并具有序列5'-TTN-3'。
指导RNA靶序列的例子是紧接在由SpCas9蛋白识别的NGG基序之前的20个核苷酸的DNA序列。例如,指导RNA靶序列加PAM的两个例子是GN19NGG(SEQ ID NO:17)或N20NGG(SEQID NO:18)。参见,例如,WO 2014/165825,出于所有目的通过引用将其全部内容并入本文。5'末端的鸟嘌呤可促进细胞中RNA聚合酶的转录。指导RNA靶序列加PAM的其它例子可包括在5'末端的两个鸟嘌呤核苷酸(例如GGN20NGG;SEQ ID NO:19),以促进T7聚合酶在体外的有效转录。参见,例如,WO2014/065596,出于所有目的通过引用将其全部内容合并于此。其它指导RNA靶序列加PAM可以具有SEQ ID NO:17-19的4-22个核苷酸的长度,包括5'G或GG和3'GG或NGG。其它指导RNA靶序列加PAM可以具有SEQ ID NO:17-19的14至20个核苷酸的长度。
与靶DNA杂交的CRISPR复合物的形成可导致对应于指导RNA靶序列的区域内或附近的靶DNA的一条或两条链的切割(即靶DNA的非互补链上的指导RNA靶序列和与指导RNA杂交的互补链上的反向互补序列)。例如,切割位点可以在指导RNA靶序列内(例如,相对于PAM序列的限定(defined)位置)。“切割位点”包括Cas蛋白在其上产生单链断裂或双链断裂的靶DNA的位置。切割位点可以仅在双链DNA的一条链上(例如当使用切口酶时)或在两条链上。切割位点可以在两条链上的相同位置上(产生平端;例如Cas9)或可以在每条链上的不同部位(产生交错端(即突出端);例如Cpf1)。可以例如通过使用两个Cas蛋白产生交错端,每个Cas蛋白在不同链的不同切割位点产生单链断裂,从而产生双链断裂。例如,第一切口酶可在双链DNA(dsDNA)的第一链上产生单链断裂,第二切口酶可在dsDNA的第二链上产生单链断裂,从而产生突出的序列。在一些情况下,第一链上的切口酶的指导RNA靶序列或切割位点与第二链上的切口酶的指导RNA靶序列或切割位点至少相隔2、3、4、5、6、7、8、9、10、15、20、25、30、40、50、75、100、250、500或1,000个碱基对。
D.重组酶和重组酶删除子(Deleter)非人动物
本文所公开的细胞或非人动物包含嵌合Cas蛋白表达盒、嵌合衔接体蛋白表达盒、SAM表达盒、指导RNA表达盒,或重组酶表达盒,其中所述盒在多腺苷酸化信号的下游,或在侧接被由位点特异性重组酶识别的重组酶识别位点的转录终止子的下游;该细胞或非人动物可进一步包含驱动位点特异性重组酶表达的重组酶表达盒。编码重组酶的核酸可以被基因组整合,或者可以使用本文其它地方公开的方法(例如LNP介导的递送或AAV介导的递送)将重组酶或核酸引入此类细胞和非人动物中。可以选择递送方法以提供重组酶的组织特异性递送,如本文其它地方所公开的。
位点特异性重组酶包括可促进重组酶识别位点之间的重组的酶,其中两个重组位点在单个核酸内物理上分开或在分开的核酸上。重组酶的实例包括Cre、Flp,和Dre重组酶。Cre重组酶基因的一个例子是Crei,其中两个编码Cre重组酶的外显子被内含子隔开,以防止其在原核细胞中表达。此类重组酶可进一步包含核定位信号,以促进定位至核(例如NLS-Crei)。重组酶识别位点包括被位点特异性重组酶识别的核苷酸序列,并且可以用作重组事件的底物。重组酶识别位点的例子包括FRT、FRT11、FRT71、attp、att、rox,和lox位点,例如loxP、lox511、lox2272、lox66、lox71、loxM2和lox5171。
重组酶表达盒可以整合在与本文公开的其它表达盒不同的靶基因组基因座上,或者可以基因组整合在相同的靶基因座上(例如Rosa26基因座,例如整合到Rosa26基因座的第一内含子中)。例如,细胞或非人动物可以对于SAM表达盒(或嵌合Cas蛋白表达盒或嵌合衔接体蛋白表达盒)和重组酶表达盒中的每一个是杂合的,靶基因组基因座的一个等位基因包含SAM表达盒,靶基因组基因座的第二等位基因包含重组酶表达盒。同样,细胞或非人动物可以对于指导RNA表达盒(例如指导RNA阵列表达盒)和重组酶表达盒中的每一个是杂合的,靶基因组位点的一个等位基因包含指导RNA表达盒,靶基因组基因座的第二等位基因包含重组酶表达盒。
重组酶表达盒中的重组酶基因可以可操作地连接至任何合适的启动子。启动子的实例在本文其它地方公开。例如,启动子可以是组织特异性启动子或发育阶段特异性启动子。这样的启动子是有利的,因为它们可以在期望的组织中或仅在期望的发育阶段选择性地激活靶基因的转录。例如,就Cas蛋白而言,这可以减少体内的Cas介导的毒性的可能性。表2提供了小鼠重组酶删除品系(strain)的示例性启动子的非限制性列表。
表2:小鼠重组酶删除子品系中使用的示例性启动子。
Figure BDA0002689802010000611
Figure BDA0002689802010000621
Figure BDA0002689802010000631
Figure BDA0002689802010000641
Figure BDA0002689802010000651
E.编码嵌合Cas蛋白、嵌合衔接体蛋白、指导RNA,协同激活介质或重组酶的核酸
还提供了编码嵌合Cas蛋白、嵌合衔接体蛋白、指导RNA、重组酶,或其任何组合的核酸。嵌合Cas蛋白、嵌合衔接体蛋白、指导RNA和重组酶在本文其它地方更详细地描述。例如,核酸可以是嵌合Cas蛋白表达盒、嵌合衔接体蛋白表达盒、协同激活介质(SAM)表达盒(其包含编码嵌合Cas蛋白和嵌合衔接体蛋白两者的核酸)、指导RNA或指导RNA阵列表达盒、重组酶表达盒,或其任何组合。这样的核酸可以是RNA(例如信使RNA(mRNA))或DNA,可以是单链或双链,并且可以是线性或环状的。DNA可以是载体的一部分,例如表达载体或靶向载体。载体也可以是病毒载体,例如腺病毒载体、腺相关病毒载体、慢病毒载体和逆转录病毒载体。当将本文公开的任何核酸引入细胞中时,编码的嵌合DNA-靶向蛋白,嵌合衔接体蛋白或指导RNA可以在细胞中瞬时、条件或组成性表达。
可选地,可以对核酸进行密码子优化以在特定细胞或生物中有效翻译成蛋白质。例如,可以对核酸进行修饰以替代与天然多核苷酸序列相比在细菌细胞、酵母细胞、人细胞、非人细胞、哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞或任何其它感兴趣的宿主细胞中具有较高使用频率的密码子。
核酸或表达盒可以稳定地整合到细胞或非人动物的基因组(即染色体)中,或者其可以位于染色体外(例如染色体外复制DNA)。稳定整合的表达盒或核酸可以随机整合到非人动物的基因组中(即转基因),或者它们可以整合到非人动物的基因组中的预定区域中(即敲入)。在一个实例中,如本文其它地方所述,将核酸或表达盒稳定整合到安全港基因座中。稳定整合有核酸或表达盒的靶基因组位点可以是对核酸或表达盒杂合的,或对核酸或表达盒纯合的。例如,靶基因组基因座或细胞或非人动物对SAM表达盒可以是杂合的,对于指导RNA表达盒可以是杂合的,可选地,每个在不同等位基因上处于相同的靶基因组基因座。
本文所述的核酸或表达盒可以可操作地连接至任何合适的启动子,以在非人动物体内表达或离体在细胞内表达。非人动物可以是本文其它各处所述的任何合适的非人动物。作为一个实例,核酸或表达盒(例如嵌合Cas蛋白表达盒、嵌合衔接体蛋白表达盒,或包含编码嵌合Cas蛋白和嵌合衔接体蛋白的核酸的SAM盒)可以可操作地连接在靶基因组基因座上的内源启动子,例如Rosa26启动子。替代地,盒核酸或表达盒可以可操作地连接至外源启动子,例如组成型活性启动子(例如CAG启动子或U6启动子)、条件启动子(conditionalpromoter)、诱导型启动子、时间受限的启动子(temporally restricted promoter)(例如发育调控的启动子(developmentally regulated promoter)),或空间受限的启动子(spatially restricted promoter)(例如细胞特异性或组织特异性启动子)。这样的启动子是众所周知的,并在本文其它地方讨论。可用于表达构建体的启动子包括在例如真核细胞、人细胞、非人细胞、哺乳动物细胞、非人哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞、仓鼠细胞、兔细胞、多能细胞、胚胎干(ES)细胞,或合子中具有活性的启动子。这样的启动子可以是例如条件启动子、诱导型启动子、组成型启动子或组织特异性启动子。
例如,可以将编码指导RNA的核酸可操作地连接至U6启动子,例如人U6启动子或小鼠U6启动子。合适的启动子(例如用于表达指导RNA的启动子)的具体实例包括RNA聚合酶III启动子,例如人U6启动子、大鼠U6聚合酶III启动子,或小鼠U6聚合酶III启动子。
可选地,启动子可以是双向启动子,其驱动一个基因(例如编码嵌合DNA靶向蛋白的基因)和另一个方向的第二个基因(例如编码指导RNA或嵌合衔接体蛋白的基因)的表达。这种双向启动子可以由以下组成:(1)完整的、常规的单向Pol III启动子,该启动子包含3个外部控制元件:远端序列元件(DSE)、近端序列元件(PSE)和TATA盒;和(2)第二种基本的Pol III启动子,其包括PSE和以反向方向融合到DSE的5'末端的TATA盒。例如,在H1启动子中,DSE与PSE和TATA盒相邻,并且通过创建杂交启动子,可以使启动子双向表达;在该杂交启动子中,通过附加衍生自U6启动子的PSE和TATA盒来控制反向转录。参见,例如,US2016/0074535,出于所有目的通过引用将其全部内容合并于此。使用双向启动子来同时表达两个基因可以产生致密(compact)表达盒以促进递送。
一种或多种核酸可以在多顺反子表达构建体中在一起。例如,编码嵌合Cas蛋白的核酸和编码嵌合衔接体蛋白的核酸可以一起在双顺反子表达构建体中。参见例如图1A和1B。多顺反子表达载体同时表达来自同一mRNA的两个或多个单独的蛋白质(即由同一启动子产生的转录本)。蛋白质多顺反子表达的合适策略包括,例如,使用2A肽和使用内部核糖体进入位点(IRES)。例如,这样的构建体可以包含:(1)编码一种或多种嵌合Cas蛋白和一种或多种嵌合衔接体蛋白的核酸;(2)编码两个或多个嵌合衔接体蛋白的核酸;(3)编码两个或更多个嵌合Cas蛋白的核酸;(4)编码两个或更多个指导RNA或两个或更多个指导RNA阵列的核酸;(5)编码一个或多个嵌合Cas蛋白和一个或多个指导RNA或指导RNA阵列的核酸;(6)编码一个或多个嵌合衔接体蛋白和一个或多个指导RNA或指导RNA阵列的核酸;(7)编码一个或多个嵌合Cas蛋白、一个或多个嵌合衔接体蛋白,以及一个或多个指导RNA或指导RNA阵列的核酸。作为一个实例,这样的多顺反子载体可以使用一个或多个内部核糖体进入位点(IRES)以允许从mRNA的内部区域开始翻译。作为另一个例子,这样的多顺反子载体可以使用一个或多个2A肽。这些肽是小的“自切割”肽,通常具有18-22个氨基酸的长度,并从同一mRNA中产生等摩尔水平的多个基因。核糖体跳过了2A肽C端的甘氨酰-脯氨酰肽键的合成,导致2A肽与其直接下游肽之间的“切割”。参见,例如,Kim et al.(2011)PLoS One 6(4):e18556,出于所有目的通过引用整体并入本文。“切割”发生在C末端的甘氨酸和脯氨酸残基之间,这意味着上游顺反子将在其末端添加一些额外的残基,而下游顺反子将从脯氨酸开始。结果,“切割(cleaved-off)”的下游肽在其N端具有脯氨酸。2A介导的切割是所有真核细胞中的普遍现象。已经从小RNA病毒、昆虫病毒和C型轮状病毒中识别出2A肽。参见,例如,Szymczak et al.(2005)Expert Opin Biol Ther 5:627-638,出于所有目的通过引用整体并入本文。可以使用的2A肽的例子包括四体(Thataasigna)病毒2A(T2A);猪捷申病毒-1 2A(P2A);马甲型鼻炎病毒(ERAV)2A(E2A);和FMDV2A(F2A)。示例性的T2A、P2A、E2A和F2A序列包括以下:T2A(EGRGSLLTCGDVEENPGP;SEQ ID NO:20);P2A(ATNFSLLKQAGDVEENPGP;SEQ IDNO:21);E2A(QCTNYALLKLAGDVESNPGP;SEQ ID NO:22);和F2A(VKQTLNFDLLKLAGDVESNPGP;SEQ ID NO:23)。可以将GSG残基添加到任何这些肽的5'末端,以提高切割效率。
任何核酸或表达盒也可在编码序列上游包含多腺苷酸化信号或转录终止子。例如,嵌合Cas蛋白表达盒、嵌合衔接体蛋白表达盒、SAM表达盒、指导RNA表达盒,或重组酶表达盒可在表达盒中的编码序列上游包含多腺苷酸化信号或转录终止子。多腺苷酸化信号或转录终止子可以侧接位点特异性重组酶识别的重组酶识别位点。可选地,重组酶识别位点也可侧接选择盒,该选择盒包括,例如,抗药性蛋白的编码序列。可选地,重组酶识别位点不侧接选择盒。多腺苷酸化信号或转录终止子阻止了由编码序列编码的蛋白质或RNA(例如嵌合Cas蛋白、嵌合衔接体蛋白、指导RNA,或重组酶)的转录和表达。但是,暴露于位点特异性重组酶后,将切除多腺苷酸化信号或转录终止子,并且可以表达蛋白质或RNA。
如果多腺苷酸化信号或转录终止子以组织特异性或发育阶段特异性方式被切除,用于表达盒(例如嵌合Cas蛋白表达盒或SAM表达盒)的这种构型能够在包含表达盒的非人动物中进行组织特异性表达或发育阶段特异性表达。例如,在嵌合Cas蛋白的情况下,由于嵌合Cas蛋白在细胞或非人动物中的长时间表达或嵌合Cas蛋白在不希望的发育阶段或在非人动物中不希望的细胞或组织类型中的表达,这可能降低毒性。参见,例如,Parikh etal.(2015)PLoS One 10(1):e0116484,出于所有目的,通过引用将其全文并入本文。如果包含表达盒的非人动物还包含可操作地连接至组织特异性或发育阶段特异性启动子的位点特异性重组酶的编码序列,则可以以组织特异性或发育阶段特异性方式实现多腺苷酸化信号或转录终止子的切除。然后仅在那些组织或那些发育阶段中切除多腺苷酸化信号或转录终止子,从而实现组织特异性表达或发育阶段特异性表达。在一实例中,嵌合Cas蛋白、嵌合衔接体蛋白、嵌合Cas蛋白和嵌合衔接体蛋白,或指导RNA可以肝特异性方式表达。本文中其它地方公开了已用于研发非人动物的此类“重组酶删除子”品系的此类启动子的实例。
可以使用任何转录终止子或多腺苷酸化信号。本文所使用的“转录终止子”是指引起转录终止的DNA序列。在真核生物中,转录终止子由蛋白质因子识别,终止后是多腺苷酸化,其为在poly(A)聚合酶在场的情况下将poly(A)尾巴添加到mRNA转录物中的过程。哺乳动物的poly(A)信号通常由一个约45个核苷酸长的核心序列组成,该核心序列可侧接各种辅助序列,这些辅助序列用于增强切割和多腺苷酸化效率。核心序列由mRNA中的高度保守的上游元件(称为AATAAA或AAUAAA)(称为poly A识别模体或poly A识别序列,被切割和多腺苷酸化特异性因子(CPSF)识别)和定义不明确的下游区域(富含U,或G和U)组成;该下游区域受裂解刺激因子(CstF)约束。可以使用的转录终止子的例子包括,例如,人生长激素(HGH)多腺苷酸化信号、猿猴病毒40(SV40)晚期多腺苷酸化信号、兔β-球蛋白多腺苷酸化信号、牛生长激素(BGH)多腺苷酸化信号、磷酸甘油酸激酶(PGK)多腺苷酸化信号、AOX1转录终止序列、CYC1转录终止序列,或已知适合调节真核细胞中基因表达的任何转录终止序列。
位点特异性重组酶包括可促进重组酶识别位点之间的重组的酶,其中两个重组位点在单个核酸内物理上分开或在分开的核酸上。重组酶的实例包括Cre、Flp,和Dre重组酶。Cre重组酶基因的一个例子是Crei,其中两个编码Cre重组酶的外显子被内含子隔开,以防止其在原核细胞中表达。此类重组酶可进一步包含核定位信号,以促进定位至核(例如NLS-Crei)。重组酶识别位点包括被位点特异性重组酶识别的核苷酸序列,并且可以用作重组事件的底物。重组酶识别位点的例子包括FRT、FRT11、FRT71、attp、att、rox,和lox位点,例如loxP、lox511、lox2272、lox66、lox71、loxM2和lox5171。
本文公开的表达盒也可以包含其它组分。此类表达盒(例如嵌合Cas蛋白表达盒、嵌合衔接体蛋白表达盒、SAM表达盒、指导RNA表达盒,或重组酶表达盒)可进一步在表达盒的5'末端包含3'剪接序列和/或在编码序列(例如编码嵌合Cas蛋白、嵌合衔接体蛋白、指导RNA,或重组酶)之后的第二多腺苷酸化信号。术语“3'剪接序列”是指在3'内含子/外显子边界的核酸序列,其可以被剪接机制识别并结合。表达盒可进一步包括选择盒,其包含例如抗药性蛋白的编码序列。合适的选择标记的例子包括新霉素磷酸转移酶(neor)、潮霉素B磷酸转移酶(hygr)、嘌呤霉素-N-乙酰基转移酶(puror)、杀稻瘟菌素S脱氨酶(bsrr)、黄嘌呤/鸟嘌呤磷酸核糖基转移酶(gpt),和单纯疱疹病毒胸苷激酶(HSV-k)。可选地,选择盒可以侧接位点特异性重组酶的重组酶识别位点。如果表达盒还包含如上所述的侧接在编码序列上游的聚、多腺苷酸化信号的重组酶识别位点,则选择盒可以侧接相同的重组酶识别位点或者可以侧接为被不同重组酶识别的不同组的重组酶识别位点。
表达盒还可包含编码一种或多种报道蛋白,例如荧光蛋白(例如绿色荧光蛋白),的核酸。可以使用任何合适的报道蛋白。例如,可以使用如本文其它地方所定义的荧光报告蛋白,或者可以使用非荧光报告蛋白。荧光报告蛋白的实例在本文其它地方提供。非荧光报告蛋白包括,例如,可用于组织化学或生物发光测定的报告蛋白,例如β-半乳糖苷酶、荧光素酶(例如,海肾荧光素酶、萤火虫荧光素酶和NanoLuc荧光素酶)和β-葡萄糖醛酸苷酶。表达盒可以包括可以在流式细胞术测定中检测到的报道蛋白(例如,荧光报道蛋白,例如绿色荧光蛋白)和/或可以在组织化学测定中检测到的报道蛋白(例如β-半乳糖苷酶蛋白)。这种组织化学测定的一个例子是通过水解X-Gal(5-溴-4-氯-3-吲哚基-b-D-吡喃半乳糖苷)产生的蓝色沉淀,或使用荧光底物(例如β-甲基伞形半乳糖苷(MUG)和荧光素二半乳糖苷(FDG)),组织化学地可视化β-半乳糖苷酶的原位表达。
本文所述的表达盒可以是任何形式。例如,表达盒可以在载体或质粒,例如病毒载体中。该表达盒可以与能够引导蛋白质或RNA表达的表达构建体中的启动子可操作地连接(例如在去除上游多腺苷酸化信号时)。替代地,表达盒可以在靶向载体中。例如,靶向载体可以包含侧接表达盒的同源臂,其中该同源臂适合于引导与期望的靶基因组基因座的重组,以促进基因组整合和/或内源序列的替换。
本文所述的表达盒可以是体外的,它们可以离体在细胞(例如胚胎干细胞)内(例如基因组整合的或染色体外的),或者它们可以在生物体(例如非人动物)体内(例如,基因组整合或染色体外)。如果是离体的,则表达盒可以在来自任何生物的任何类型的细胞中,例如全能细胞,例如胚胎干细胞(例如,小鼠或大鼠胚胎干细胞)或诱导的多能干细胞(例如人诱导的多能干细胞)。如果在体内,则表达盒可以在任何类型的生物体中(例如,如本文其它地方进一步描述的非人动物)。
编码催化失活的Cas蛋白的核酸的具体实例可以包含以下,基本上由以下组成,或由以下组成:编码氨基酸序列的核酸,该氨基酸序列与SEQ ID NO:2所示的dCas9蛋白序列具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或100%的同一性。可选地,该核酸可以包含,基本上由以下组成,或由以下组成:编码氨基酸序列的核酸,该氨基酸序列与SEQ ID NO:24中所示的序列具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或100%的同一性(可选地,其中该序列编码蛋白,该蛋白与SEQ ID NO:2所示的dCas9蛋白序列具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或100%的同一性)。
编码嵌合Cas蛋白的核酸的具体实例可以包含以下,基本上由以下组成,或由以下组成:编码氨基酸序列的核酸,该氨基酸序列与SEQ ID NO:1所示的嵌合Cas蛋白序列具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或100%的同一性。可选地,该核酸可以包含,基本上由以下组成,或由以下组成:编码氨基酸序列的核酸,该氨基酸序列与SEQ ID NO:25中所示的序列具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或100%的同一性(可选地,其中该序列编码蛋白,该蛋白与SEQ IDNO:1所示的嵌合Cas蛋白序列具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或100%的同一性)。
编码衔接体的具体实例可以包含以下,基本上由以下组成,或由以下组成:编码氨基酸序列的核酸,该氨基酸序列与SEQ ID NO:7所示的MCP序列具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或100%的同一性。可选地,该核酸可以包含,基本上由以下组成,或由以下组成:编码氨基酸序列的核酸,该氨基酸序列与SEQ IDNO:26中所示的序列具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或100%的同一性(可选地,其中该序列编码蛋白,该蛋白与SEQ ID NO:7所示的MCP序列具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或100%的同一性)。
编码嵌合衔接体蛋白的具体实例可以包含以下,基本上由以下组成,或由以下组成:编码氨基酸序列的核酸,该氨基酸序列与SEQ ID NO:6所示的嵌合衔接体蛋白序列具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或100%的同一性。可选地,该核酸可以包含,基本上由以下组成,或由以下组成:编码氨基酸序列的核酸,该氨基酸序列与SEQ ID NO:27中所示的序列具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或100%的同一性(可选地,其中该序列编码蛋白,该蛋白与SEQ IDNO:6所示的嵌合衔接体蛋白序列具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或100%的同一性)。
编码转录激活域的具体实例可以包含以下,基本上由以下组成,或由以下组成:编码氨基酸序列的核酸,该氨基酸序列与SEQ ID NO:3、8,或9所示的VP64、p65,或HSF1序列具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或100%的同一性。可选地,该核酸可以包含,基本上由以下组成,或由以下组成:编码氨基酸序列的核酸,该氨基酸序列与SEQ ID NO:28、29,或30中所示的序列具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或100%的同一性(可选地,其中该序列编码蛋白,该蛋白与SEQ ID NO:3、8,或9所示的VP64、p65,或HSF1序列具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或100%的同一性)
一种示例性的协同激活介质(SAM)表达盒从5'至3'包含:(a)3'剪接序列;(b)第一重组酶识别位点(例如loxP位点);(c)药物抗性基因的编码序列(例如,新霉素磷酸转移酶(neor)编码序列);(d)多腺苷酸化信号;(e)第二重组酶识别位点(例如loxP位点);(f)嵌合Cas蛋白编码序列(例如dCas9-NLS-VP64融合蛋白);(g)2A蛋白编码序列(例如T2A编码序列);和(e)嵌合衔接体蛋白编码序列(例如,MCP-NLS-p65-HSF1)。参见,例如,图1A和SEQ IDNO:31(SEQ ID NO:64所示的编码序列和SEQ ID NO:44所示的编码蛋白)。
一种示例性的通用指导RNA阵列表达盒从5'至3'包含:(a)3'剪接序列;(b)第一重组酶识别位点(例如rox位点);(c)药物抗性基因的编码序列(例如,嘌呤霉素-N-乙酰基转移酶(puror)编码序列);(d)多腺苷酸化信号;(e)第二重组酶识别位点(例如rox位点);(f)指导RNA,其包含一个或多个指导RNA基因(例如,第一U6启动子,然后是第一指导RNA编码序列;第二U6启动子,然后是第二指导RNA编码序列;第三U6启动子,然后是第三指导RNA编码序列)。参见,例如,图5和SEQ ID NO:32。SEQ ID NO:32的包含启动子和指导RNA编码序列的区域在SEQ ID NO:65中列出。指导RNA阵列表达盒中的重组酶识别位点可以与SAM表达盒中的重组酶识别位点相同或不同(例如,可以被相同的重组酶或不同的重组酶识别)。编码靶向小鼠Ttr的指导RNA的这种示例性指导RNA阵列表达盒在SEQ ID NO:33中列出。SEQ IDNO:33的包含启动子和指导RNA编码序列的区域在SEQ ID NO:66中列出。
另一个示例性通用指导RNA阵列表达盒包含一个或多个指导RNA基因(例如,第一U6启动子,然后是第一指导RNA编码序列;第二U6启动子,然后是第二指导RNA编码序列;第三U6启动子,然后是第三指导RNA编码序列)。这种示例性的通用指导RNA阵列表达盒在SEQID NO:66中列出。用于特定基因的这种指导RNA阵列表达盒的例子例如在SEQ ID NO:33、66、67、71、84、85,和98中列出。
F.用于整合的基因组位点
本文所述的核酸和表达盒可以基因组整合在细胞或非人动物的靶基因组基因座处。可以使用能够表达基因的任何靶基因组基因座。
可以稳定地整合本文所述的核酸或盒的靶基因组基因座的实例是非人动物基因组中的安全港基因座。整合的外源DNA与宿主基因组之间的相互作用会限制整合的可靠性和安全性,并可能导致明显的表型效应;这不是由于靶向遗传修饰,而是由于整合对周围内源基因的意外影响。例如,随机插入的转基因可能会受到位置效应和沉默的影响,从而使其表达不可靠且不可预测。同样,将外源DNA整合到染色体基因座中会影响周围的内源基因和染色质,从而改变细胞行为和表型。安全港基因座包括染色体基因座,其中转基因或其它外源核酸插入物可以在所有目的组织中稳定、可靠地表达,而不会明显改变细胞行为或表型(即,对宿主细胞没有任何有害作用)。参见,例如,Sadelain et al.(2012)Nat.Rev.Cancer12:51-58,出于所有目的通过引用整体并入本文。例如,安全港基因座可以是其中插入的基因序列的表达不受邻近基因的任何通读表达干扰的基因。例如,安全港基因座可以包括染色体基因座,其中外源DNA可以以可预测的方式整合和发挥功能,而不会不利地影响内源基因的结构或表达。安全港基因座可包括基因外区域或基因内区域,例如,非必需、可省去,或可被破坏而无明显表型后果的基因内的基因座。
例如,Rosa26基因座及其在人类中的等同物在所有组织中提供开放的染色质构型,并在胚胎发育期间和成体中普遍表达。参见,例如,Zambrowicz et al.(1997)Proc.Natl.Acad.Sci.USA 94:3789-3794,出于所有目的通过引用整体并入本文。此外,可以高效地靶向Rosa26基因座,并且Rosa26基因的破坏不会产生明显的表型。安全港基因座的其它示例包括CCR5、HPRT、AAVS1,和白蛋白。参见,例如,美国专利号7,888,121;7,972,854;7,914,796;7,951,925;8,110,379;8,409,861;8,586,526;和美国专利公开号2003/0232410;2005/0208489;2005/0026157;2006/0063231;
2008/0159996;2010/00218264;2012/0017290;2011/0265198;2013/0137104;2013/0122591;2013/0177983;2013/0177960;和2013/0122591,出于所有目的,通过引用将其每一篇全部内容整体并入本文。安全港基因座(例如Rosa26基因座)的双等位基因靶向没有负面影响,因此可以将不同的基因或报告基因靶向两个Rosa26等位基因。在一个实例中,表达盒被整合到Rosa26基因座的内含子,例如Rosa26基因座的第一内含子。参见,例如,图2。
整合到靶基因组基因座中的表达盒可以与靶基因组基因座处的内源启动子可操作地连接,或者可以和与靶基因组基因座异源的外源启动子可操作地连接。在一个实例中,嵌合Cas蛋白表达盒、嵌合衔接体蛋白表达盒,或协同激活介质(SAM)表达盒被整合到靶基因组基因座(例如Rosa26基因座)中,并在靶基因组基因座处与内源启动子(例如Rosa26启动子)可操作地连接。在另一个实例中,将指导RNA表达盒整合到靶基因组基因座(例如Rosa26基因座)中,并且可操作地连接至一个或多个异源启动子(例如U6启动子,例如位于每个指导RNA编码序列上游的不同U6启动子)。
G.非人动物基因组、非人动物细胞,和非人动物
还提供了包含本文所述的核酸或表达盒的非人动物基因组、非人动物细胞,和非人动物。基因组、细胞,或非人动物可以是雄性或雌性。核酸或表达盒可以稳定地整合到细胞或非人动物的基因组中(即染色体中),或者可以位于染色体之外(例如染色体外复制DNA)。可以将核酸或表达盒随机整合到非人动物的基因组中(即转基因),或者可以将其整合到非人动物的基因组的预定区域(例如安全港基因座)中(即敲入)。稳定整合有核酸或表达盒的靶基因组基因座可以对于核酸或表达盒杂合,或对于核酸或表达盒纯合。二倍体生物在每个遗传位点具有两个等位基因。每对等位基因代表特定遗传基因座的基因型。如果在特定位点有两个相同的等位基因,则将基因型描述为纯合;如果两个等位基因不同,则将基因型描述为杂合。包含本文所述的稳定整合的核酸或表达盒的非人动物可在其种系中包含所述核酸或表达盒。
例如,非人动物基因组、非人动物细胞,或非人动物可包含嵌合Cas蛋白表达盒、嵌合衔接体蛋白表达盒,或协同激活介质(SAM)表达盒(包含嵌合Cas蛋白编码序列和嵌合衔接体蛋白序列两者)。在一实例中,基因组、细胞或非人动物包含SAM表达盒,该SAM表达盒包含嵌合Cas蛋白编码序列和嵌合衔接体蛋白编码序列两者。在一实例中,SAM表达盒(或嵌合Cas蛋白表达盒或嵌合衔接体蛋白表达盒)被稳定地整合到基因组中。稳定整合的SAM表达盒(或嵌合Cas蛋白表达盒或嵌合衔接体蛋白表达盒)可以随机整合到非人动物的基因组中(即转基因),也可以整合到非人动物的基因组的预定区域中(即敲入)。在一个实例中,SAM表达盒(或嵌合Cas蛋白表达盒或嵌合衔接体蛋白表达盒)被稳定整合到基因组的预定区域,例如安全港基因座(例如Rosa26)。稳定整合SAM表达盒(或嵌合Cas蛋白表达盒或嵌合衔接体蛋白表达盒)的靶基因组基因座可以对SAM表达盒(或嵌合Cas蛋白表达盒或嵌合衔接体蛋白表达盒)杂合或纯合。
可选地,上述基因组、细胞,或非人动物可进一步包含指导RNA表达盒(例如指导RNA阵列表达盒)。指导RNA表达盒可以稳定地整合到细胞或非人动物的基因组中(即染色体中),或者可以位于染色体之外(例如染色体外复制DNA或通过AAV、LNP,或本文公开的任何其它方式引入细胞或非人类细胞中)。指导RNA表达盒可以随机整合到非人动物的基因组中(即转基因),或者可以将其整合到非人动物的基因组的预定区域(例如安全港基因座)中(即敲入)。稳定整合有指导RNA表达盒的靶基因组基因座可以对于指导RNA表达盒杂合,或对于指导RNA表达盒纯合。在一个实例中,基因组、细胞或非人动物包括SAM表达盒(或嵌合Cas蛋白表达盒或嵌合衔接体蛋白表达盒)和指导RNA表达盒。在一实例中,两个盒均基因组整合。指导RNA表达盒可以与SAM表达盒(或嵌合Cas蛋白表达盒或嵌合衔接体蛋白表达盒)整合在不同的靶基因组基因座上或者可以基因组整合在相同的靶基因座上(例如,Rosa26基因座,例如整合在Rosa26基因座的第一个内含子中)。例如,基因组、细胞,或非人动物可以对于每个SAM表达盒(或嵌合Cas蛋白表达盒或嵌合衔接体蛋白表达盒)和指导RNA表达盒是杂合的,其中一个靶基因组基因座(例如Rosa26)的等位基因包含SAM表达盒(或嵌合Cas蛋白表达盒或嵌合衔接体蛋白表达盒),而靶基因组基因座的第二等位基因包含指导RNA表达盒表达盒。
可选地,上述基因组、细胞,或非人动物中的任一个可以进一步包含重组酶表达盒。重组酶表达盒可以稳定地整合到细胞或非人动物的基因组(即染色体)中,或者可以位于染色体之外(例如染色体外复制DNA,或通过AAV、LNP、HDD,或此处公开的任何其它方式引入细胞或非人动物中)。重组酶表达盒可以随机整合到非人动物的基因组中(即转基因),或者其可以整合到非人动物的基因组的预定区域(例如安全港基因座)中(即敲入)。重组酶表达盒被稳定整合的靶基因组基因座可以对重组酶表达盒为杂合或纯合。重组酶表达盒可以与本文公开的任何其它表达盒整合在不同的靶基因组基因座上,或者可以基因组整合在相同的靶基因座上(例如Rosa26基因座,例如整合到Rosa26基因座的第一内含子中)。
本文提供的基因组或细胞可以是,例如,真核生物基因组或细胞,其包括,例如,真菌细胞(例如酵母)、植物细胞、动物细胞、哺乳动物细胞、非人哺乳动物细胞,和人类细胞。术语“动物”包括哺乳动物、鱼类,和鸟类。哺乳动物基因组或细胞可以是,例如,非人哺乳动物细胞、人类细胞、啮齿动物细胞、大鼠细胞、小鼠细胞,或仓鼠细胞。其它非人哺乳动物包括,例如,非人灵长类动物、猴子、猿、猫、狗、兔、马、公牛、鹿、野牛、家畜(例如牛科动物如奶牛和阉牛等;绵羊科动物如绵羊和山羊等;以及猪科动物如猪和野猪)。鸟类包括,例如,鸡、火鸡、鸵鸟、鹅、鸭等。还包括家养动物和农业动物。术语“非人”不包括人类。
细胞也可以是任何类型的未分化或分化状态。例如,细胞可以是全能细胞、多能细胞(例如人多能细胞或非人多能细胞,例如小鼠胚胎干(ES)细胞或大鼠ES细胞)或非多能细胞。全能细胞包括可以产生任何细胞类型的未分化细胞,多能细胞包括具有发展为一种以上分化细胞类型的能力的未分化细胞。这样的多能和/或全能细胞可以是,例如,ES细胞或ES样细胞,例如诱导性多能干(iPS)细胞。ES细胞包括胚胎来源的全能或多能细胞,其在引入胚胎后能够对发育中的胚胎的任何组织作出贡献。ES细胞可以源自胚泡的内部细胞团,并且能够分化为三个脊椎动物胚层(内胚层、外胚层,和中胚层)中任何一个的细胞。
人多能细胞的例子包括人ES细胞、人成体干细胞、发育受限的人祖细胞,和人诱导性多能干(iPS)细胞,例如primed的人iPS细胞和
Figure BDA0002689802010000781
的人iPS细胞。诱导的多能干细胞包括可以直接源自分化的成体细胞的多能干细胞。可以通过将特定的重编程因子集引入细胞,以生成人iPS细胞,其可以包括例如Oct3/4、Sox家族转录因子(例如Sox1、Sox2、Sox3、Sox15)、Myc家族转录因子(例如c-Myc、l-Myc、n-Myc),Krüppel样家族(KLF)转录因子(例如KLF1、KLF2、KLF4、KLF5)和/或相关的转录因子,例如NANOG、LIN28和/或Glis1。还可以通过例如使用miRNA、模仿转录因子作用的小分子,或谱系特异性分子(lineage specifiers)来生成人iPS细胞。人iPS细胞的特征在于它们能够分化为三个脊椎动物胚层(例如内胚层、外胚层,或中胚层)的任何细胞。人iPS细胞的特征还在于其在合适的体外培养条件下无限增殖的能力。参见例如Takahashi和Yamanaka(2006)Cell126:663-676,出于所有目的通过引用将其全部内容合并于此。Primed的人ES细胞和primed的人iPS细胞包括表达与植入后的上胚层细胞相似的特征并致力于谱系特异性和分化的细胞。
Figure BDA0002689802010000791
的人类ES细胞和
Figure BDA0002689802010000792
的iPS细胞包括表达与植入前胚胎内部细胞团的ES细胞相似的特征,并不致力于谱系特异性的细胞。参见,例如,Nichols和Smith(2009)Cell Stem Cell4:487-492,出于所有目的通过引用整体并入本文。
本文提供的细胞也可以是生殖细胞(例如精子或卵母细胞)。该细胞可以是有丝分裂潜能细胞(mitotically competent cells)或有丝分裂惰性细胞、减数分裂潜能细胞或减数分裂惰性细胞。类似地,细胞也可以是初级体细胞或并非初级体细胞的细胞。体细胞包括不是配子、生殖细胞、配子母细胞,或未分化干细胞的任何细胞。例如,细胞可以是肝细胞、肾细胞、造血细胞、内皮细胞、上皮细胞、成纤维细胞、间充质细胞、角质形成细胞、血细胞、黑素细胞、单核细胞、单个核细胞、单核细胞前体、B细胞、红细胞-巨核细胞、嗜酸性粒细胞、巨噬细胞、T细胞、胰岛β细胞、外分泌细胞、胰腺祖细胞、内分泌祖细胞、脂肪细胞、前脂肪细胞、神经元、神经胶质细胞、神经干细胞、神经元、肝母细胞(hepatoblasts)、肝细胞、心肌细胞、骨骼成肌细胞、平滑肌细胞、导管细胞、泡细胞、α细胞、β细胞、δ细胞、PP细胞、胆囊上皮细胞(cholangiocytes)、白色或棕色脂肪细胞,或眼细胞(例如,小梁网细胞、视网膜色素上皮细胞、视网膜微血管内皮细胞、视网膜周细胞、结膜上皮细胞、结膜成纤维细胞、虹膜色素上皮细胞、角膜细胞、晶状体上皮细胞、非色素性睫状上皮细胞、眼球脉络膜成纤维细胞、感光细胞、神经节细胞、双极细胞、水平细胞,或无长突细胞)。
本文提供的合适的细胞还包括初级细胞。初级细胞包括直接从生物体、器官,或组织分离的细胞或细胞培养物。初级细胞包括既未转化也非永生的细胞。它们包括获自生物体、器官,或组织的任何细胞,所述细胞先前没有在组织培养中进行传代或先前已经在组织培养中进行了传代但是无法在组织培养中进行无限传代。这样的细胞可以通过常规技术分离,并且包括,例如,体细胞、造血细胞、内皮细胞、上皮细胞、成纤维细胞、间充质细胞、角质形成细胞、黑素细胞、单核细胞(monocytes)、单个核细胞(mononuclear cells)、脂肪细胞、前脂肪细胞、神经元、神经胶质细胞、肝细胞、骨骼肌成肌细胞,和平滑肌细胞。例如,原代细胞可以衍生自结缔组织、肌肉组织、神经系统组织,或上皮组织。
本文提供的其它合适的细胞包括永生细胞。永生细胞包括来自多细胞生物的细胞,这些细胞通常不会无限期增殖,但是由于突变或改变而逃避了正常的细胞衰老,可以继续分裂。这样的突变或改变可以自然发生或有意诱导。永生细胞的实例包括中国仓鼠卵巢(CHO)细胞、人胚肾细胞(例如HEK 293细胞或293T细胞),和小鼠胚成纤维细胞(例如3T3细胞)。永生细胞的许多类型是众所周知的。永生细胞或原代细胞包括通常用于培养或表达重组基因或蛋白质的细胞。
本文提供的细胞还包括单细胞期胚胎(即受精卵母细胞或受精卵)。这样的单细胞期胚胎可以来自任何遗传背景(例如,BALB/c、C57BL/6、129,或它们的组合),可以是新鲜的或冷冻的,并且可以源自自然育种或体外受精。
本文提供的细胞可以是正常,健康的细胞,或者可以是患病或携带突变的细胞。
包含本文所述核酸或表达盒的非人动物可以通过本文其它地方描述的方法制备。术语“动物”包括哺乳动物、鱼类,和蠕虫。哺乳动物包括,例如,人类、非人灵长类动物、猴子、猿、猫、狗、马、公牛、鹿、野牛、绵羊、兔子、啮齿动物(如小鼠、大鼠、仓鼠,以及豚鼠),以及家畜(例如牛科动物如奶牛和阉牛;绵羊科动物如绵羊和山羊;以及猪科动物如猪和野猪)。鸟类包括,例如,鸡、火鸡、鸵鸟、鹅、鸭。还包括家养动物和农业动物。术语“非人动物”不包括人类。优选的非人动物包括例如啮齿动物,例如小鼠和大鼠。
非人动物可以来自任何遗传背景。例如,合适的小鼠可以来自129种系、C57BL/6种系、129种系和C57BL/6种系的混合、BALB/c种系,或Swiss Webster种系。129种系的实例包括129P1、129P2、129P3、129X1、129S1(例如129S1/SV、129S1/Svlm)、129S2、129S4、129S5、129S9/SvEvH、129S6(129/SvEvTac)、129S7、129S8、129T1,和129T2。参见,例如,Festing etal.(1999)Mammalian Genome 10:836,出于所有目的通过引用整体并入本文。C57BL种系的实例包括C57BL/A、C57BL/An、C57BL/GrFa、C57BL/Kal_wN、C57BL/6、C57BL/6J、C57BL/6ByJ、C57BL/6NJ、C57BL/10、C57BL/10ScSn、C57BL/10Cr,和C57BL/Ola。合适的小鼠还可来自于前述129种系和前述C57BL/6种系的混合(例如50%129和50%C57BL/6)。类似地,合适的小鼠可来自于前述129种系的混合或前述BL/6种系的混合(例如129S6(129/SvEvTac)种系)。
类似地,大鼠可来自于任何大鼠种系,包括例如ACI大鼠种系、Dark Agouti(DA)大鼠种系、Wistar大鼠种系、LEA大鼠种系、Sprague Dawley(SD)大鼠种系,或Fischer大鼠种系(例如Fisher F344或Fisher F6)。大鼠还可获自衍生自上述两种或多种种系的混合的种系。例如,合适的大鼠可获自DA种系或ACI种系。ACI大鼠种系被表征为具有黑色刺豚鼠,其具有白色腹部和足部以及RT1av1单体型。这些种系可获自包括Harlan实验室在内的多种不同的来源。Dark Agouti(DA)大鼠种系被表征为具有刺鼠皮(agouti coat)和RT1av1单体型。这些大鼠获自包括Charles River和Harlan实验室在内的多种不同的来源。一些合适的大鼠可来自同系交配大鼠种系。参见,例如,US2014/0235933,其全部内容出于所有目的通过引用并入本文。
III.增加靶基因的转录/表达和评估CRISPR/Cas体内活性的方法
提供了多种方法,以使用协同激活介质系统以及本文所述的细胞和非人动物在体内激活一个或多个靶基因的转录或评估CRISPR/Cas的递送以及评估CRISPR/Cas在活体动物的组织和器官中的活性。此类方法利用了包含本文其它地方所述的表达盒的非人动物。
A.增加靶基因的表达或测试CRISPR/Cas在体内或体外激活靶基因转录的能力的方法
提供了多种方法来增加/激活靶基因的表达/转录或评估本文所述的CRISPR/Cas协同激活介质(SAM)系统在体内使用本文所述的非人动物增加/激活靶基因的表达/转录的能力。这样的非人动物例如可以包含SAM表达盒(包含嵌合Cas蛋白编码序列和嵌合衔接体蛋白编码序列),或者可以包含嵌合Cas蛋白表达盒或嵌合衔接体蛋白表达盒。这样的方法可以包括将一个或多个指导RNA引入非人动物,所述指导RNA各自包含一个或多个本文公开的嵌合衔接体蛋白可以特异性结合的衔接体结合元件。一个或多个指导RNA可以与嵌合Cas蛋白和嵌合衔接体蛋白形成复合物,并引导它们靶向一种或多种靶基因内的靶序列,从而增加一个或多个靶基因的表达。这样的方法可以进一步包括评估一种或多种靶基因的表达或转录。
可选地,可以引入两个或更多个指导RNA,每个设计成靶向靶基因内的不同指导RNA靶序列。例如,可以将2个或更多个、3个或更多个、4个或更多个,或5个或更多个指导RNA设计为靶向单个靶基因。替代地或另外地,可以引入两个或更多个指导RNA,每个被设计为在两个或更多个不同的靶基因中靶向不同的指导RNA靶序列(即复用(multiplexing))。
可选地,在其中的嵌合Cas蛋白表达盒、嵌合衔接体蛋白表达盒,或协同激活介质表达盒(包括嵌合Cas蛋白编码序列和嵌合衔接体蛋白编码序列)包含位于编码序列上游的多腺苷酸化信号或转录终止子,且多腺苷酸化信号或转录终止子的侧接由位点特异性重组酶识别的重组酶识别位点的方法中,该方法可进一步包括将重组酶引入非人动物中。重组酶可以切除多腺苷酸化信号或转录终止子,从而允许下游编码序列的表达。
在其中的非人动物已经包含如本文其它地方所述的指导RNA表达盒的一些方法中,该方法可以简单地包括将重组酶引入非人动物中,其中该重组酶切除上游多腺苷酸化信号或转录终止子,从而表达嵌合Cas蛋白和/或嵌合衔接体蛋白,从而增加/激活靶基因的表达/转录。
可选地,在其中的非人动物包括嵌合Cas蛋白表达盒但不包括嵌合衔接体蛋白表达盒的方法中,可以将嵌合衔接体蛋白引入非人动物中。同样地,在其中的非人动物包括嵌合衔接体蛋白表达盒但不包括嵌合Cas蛋白表达盒的方法中,可以将嵌合Cas蛋白表达盒引入非人动物中。
上文提供的用于评估体内CRISPR/Cas活性的各种方法也可以用于使用如本文其它地方所述的包含Cas表达盒的细胞离体评估CRISPR/Cas活性。
指导RNA和可选的重组酶可以如本文其它各处所公开的,通过任何递送方法(例如AAV、LNP或HDD)和任何给药途径,以任何形式(用于指导RNA的DNA或RNA;用于重组酶的DNA、RNA或蛋白质)引入细胞或非人动物。在一些方法中,指导RNA或重组酶可以以组织特异性方式引入。在特定方法中,递送是通过AAV介导的递送。例如,如果靶向肝,则可以使用AAV8。同样,如果非人动物或细胞包含嵌合Cas蛋白表达盒但不包含嵌合衔接体蛋白表达盒,则嵌合衔接体蛋白可以以任何形式(DNA、RNA,或蛋白质)通过任何递送方法(例如AAV、LNP,或HDD)和本文其它各处公开的任何给药途径引入细胞或非人动物。或者,如果非人动物或细胞包含嵌合衔接体蛋白表达盒但不包含嵌合Cas蛋白表达盒,则嵌合Cas蛋白可以以任何形式(DNA、RNA或DNA),通过任何递送方法(例如AAV、LNP或HDD)和任何给药途径(如本文其它地方所公开的)引入细胞或非人动物中。
用于评估靶基因组基因座的增加的转录或表达的方法在本文其它地方提供,并且是众所周知的。评估可以是本文其它各处所公开的任何细胞类型、任何组织类型或任何器官类型。在一些方法中,例如通过评估肝细胞中靶基因组基因座表达的分泌蛋白的血清水平来评估靶基因在肝细胞中的表达。如果靶基因编码具有特定酶活性的蛋白质,则评估可以包括测量靶基因的表达和/或靶基因编码的蛋白质的活性。替代地或另外地,评估可以包括评估在从非人动物分离的一种或多种细胞中的表达。评估可包括从非人动物分离靶器官或组织,并评估靶基因在靶器官或组织中的表达。评估还可包括评估靶器官或组织内两种或更多种不同细胞类型中靶基因的表达。类似地,评估可包括从非人动物分离非靶器官或组织(例如两个或更多个非靶器官或组织),并评估靶基因在非靶器官或组织中的表达。
在一些方法中,靶基因可以是如本文其它地方所述的疾病相关基因。例如,靶基因可以是与蛋白质聚集疾病或病症相关的基因。作为特定实例,靶基因可以是与蛋白质聚集疾病或病症相关的基因(例如Ttr),并且该方法可以包括增加该靶基因的表达以模拟蛋白质聚集疾病或病症。在某些特定方法中,靶基因可以是Ttr。可选地,Ttr基因可以包含病原性突变(例如引起淀粉样变性的突变)或病原性突变的组合。此类突变的例子提供于例如WO2018/007871,出于所有目的通过引用将其全文并入本文。
在其它方法中,靶基因可以是参与与疾病或病症(例如高胆固醇血症或动脉粥样硬化)相关的途径的一种。在某些特定方法中,靶基因可以是Pcsk9或Ldlr。在其它方法中,靶基因可以是当过表达时可以模拟此类疾病或病症的基因。例如,靶基因可以是Pcsk9,并且该方法可以包括增加Pcsk9的表达以模拟高胆固醇血症。
B.优化CRISPR/Cas体内或体外增加靶基因表达能力的方法
提供了多种方法来优化CRISPR/Cas向细胞或非人动物的递送或优化CRISPR/Cas的体内转录激活活性。这样的方法可以包括,例如:(a)在第一非人动物或第一细胞中第一次进行如上所述的测试CRISPR/Cas修饰靶基因组基因座的能力的方法;(b)更改变量,并在具有更改后的变量的第二非人动物(即同一物种)或第二细胞中第二次进行该方法;以及(c)比较步骤(a)中靶基因的表达/转录与步骤(b)中靶基因的表达/转录,并选择导致靶基因最高表达/转录的方法。
替代地或附加地,可以选择导致最高功效、最高一致性,或最高特异性的方法。较高的功效是指靶基因的表达/转录水平更高(例如在特定靶细胞类型内、特定靶组织内,或特定靶器官内靶向较高百分比的细胞)。较高的一致性是指如果靶向多种类型的细胞、组织,或器官,则靶基因在不同类型的靶细胞、组织,或器官之间的表达/转录更加一致地增加(例如靶器官中更多的细胞类型的表达/转录增加)。如果靶向特定器官,则较高的一致性也可以指器官内所有位置的表达/转录更加一致的增加。更高的特异性可以指相对于靶基因或被靶向的基因的更高特异性、相对于靶定的细胞类型的更高特异性、相对于靶定的组织类型的更高特异性,或相对于靶定的器官的更高特异性。例如,增加的靶特异性是指其它基因上的脱靶作用较小(例如,代替或除了修饰靶基因组基因座外,在非预期的脱靶基因组基因座(例如邻近基因组基因座)上转录增加的靶细胞的百分比更低)。同样,增加的细胞类型、组织,或器官类型特异性是指如果特定细胞类型、组织类型,或器官类型被靶向,则脱靶细胞类型、组织类型,或器官类型中的作用(即增加的表达/转录)较少。(例如,当特定器官被靶向(例如肝脏)时,在并非预期靶标的器官或组织中的细胞中的作用(即增加的表达/转录)较少)。
改变的变量可以是任何参数。作为一个例子,改变的变量可以是包装或递送方法,通过该包装或递送方法将指导RNA(或可选地重组酶或其它组分)引入细胞或非人动物中。递送方法(例如LNP、HDD,和AAV)的例子在本文其它地方公开。例如,改变的变量可以是AAV血清型。作为另一个例子,改变的变量可以是用于将指导RNA(或可选地重组酶或其它成分)引入细胞或非人动物的给药途径。给药途径的实例(例如静脉内,玻璃体内、实质内和鼻内滴注)在本文其它地方公开。
作为另一个例子,改变的变量可以是引入的指导RNA(或可选地,重组酶或其它组分)的浓度或量。作为另一个例子,改变的变量可以是引入指导RNA(或可选地,重组酶或其它组分)的次数或频率。作为另一个例子,改变的变量可以是指导RNA(或可选地,重组酶或其它组分)被引入的形式。例如,指导RNA可以以DNA的形式或以RNA的形式被引入。类似地,指导RNA(或可选地,重组酶或其它组分)可包含修饰的各种组合,以实现稳定性,减少脱靶效应,促进递送等。作为另一个例子,改变的变量可以是被引入的指导RNA的序列(例如,引入以不同的序列的不同的指导RNA)。
C.将指导RNA和其它成分引入细胞和非人动物
本文公开的方法包括将一个或多个如本文其它地方所述的指导RNA、指导RNA阵列、重组酶,或其它组分引入细胞或非人动物中。“引入”包括以这样的方式向细胞或非人动物呈现核酸或蛋白质,使得该核酸或蛋白质能够进入细胞内部或非人动物内的细胞内部。引入可以通过任何方式完成,并且可以将两个或更多个组分(例如组分中的两个或全部的组分)同时或以任何组合顺序引入细胞或非人动物中。例如,可以在引入第二指导RNA之前将第一指导RNA引入细胞或非人动物中。另外,可以通过相同的递送方法或不同的递送方法将两个或更多组分引入细胞或非人动物中。类似地,可以通过相同的给药途径或不同的给药途径将两个或更多组分引入非人动物。
指导RNA可以以RNA的形式(例如体外转录的RNA)或以编码该指导RNA的DNA的形式被引入细胞。同样地,诸如重组酶的蛋白质组分可以以DNA、RNA,或蛋白质的形式引入细胞。当以DNA的形式引入时,编码指导RNA的DNA可以可操作地连接至在细胞中有活性的启动子。例如,指导RNA可以经由AAV递送并在U6启动子下在体内表达。这样的DNA可以在一个或多个表达构建体中。例如,这样的表达构建体可以是单个核酸分子的组分。替代地,它们可以以任何组合在两个或多个核酸分子之间分离(即,编码一个或多个CRISPR RNA的DNA和编码一个或多个tracrRNA的DNA可以是分离的核酸分子的组分)。
编码指导RNA或重组酶(或其它组分)的核酸可与表达构建体中的启动子可操作地连接。表达构建体包括能够引导基因或其它目的核酸序列的表达并且可以将这种目的核酸序列转移至靶细胞的任何核酸构建体。可以在表达构建体中使用的合适的启动子包括在例如真核细胞、人细胞、非人细胞、哺乳动物细胞、非人哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞、仓鼠细胞、兔细胞、多能细胞、胚胎干(ES)细胞、成年干细胞、发育受限的祖细胞、诱导性多能干(iPS)细胞,或单细胞期胚胎中的一个或多个中有活性的启动子。这样的启动子可以是例如条件启动子、诱导型启动子、组成型启动子,或组织特异性启动子。可选地,启动子可以是双向启动子,其在一个方向上驱动指导RNA的表达,而在另一方向上驱动另一组分的表达。这种双向启动子可以由(1)完整的、常规的单向Pol III启动子,该启动子包含3个外部控制元件:远端序列元件(DSE)、近端序列元件(PSE)和TATA盒;和(2)第二基本Pol III启动子,其包括PSE和反向融合到DSE的5'末端的TATA盒组成。例如,在H1启动子中,DSE与PSE和TATA盒相邻,并且可以通过创建杂交启动子,使启动子为双向;在该杂交启动子中,通过附加衍生自U6启动子的PSE和TATA盒来控制反向的转录。参见,例如,US 2016/0074535,出于所有目的通过引用将其全部内容合并于此。使用双向启动子来同时表达编码指导RNA的基因和另一种组分允许紧凑表达盒的产生,以促进递送。
指导RNA或编码指导RNA(或其它组分)的核酸可以在包含载体的组合物中提供,所述载体增加了指导RNA的稳定性(例如,在给定的储存条件下(例如-20℃、4℃,或环境温度)延长降解产物的含量低于阈值(例如低于起始核酸或蛋白质的重量的0.5%)的时间;或增加体内稳定性)。此类载体的非限制性实例包括聚(乳酸)(PLA)微球、聚(D,L-乳酸-甘醇酸)
(poly(D,L-lactic-coglycolic-acid),PLGA)微球、脂质体、胶束、反胶束、脂质卷),和脂质微管。
本文提供了各种方法和组合物,以允许将核酸或蛋白质引入细胞或非人动物中。将核酸引入各种细胞类型的方法是本领域已知的,包括例如稳定的转染方法、瞬时转染方法和病毒介导的方法。
转染方案以及用于将核酸序列引入细胞的方案是多样的。非限制性转染方法包括基于化学品的转染方法,其使用脂质体;纳米粒子;磷酸钙(Graham et al.(1973)Virology52(2):456–67,Bacchetti et al.(1977)Proc.Natl.Acad.Sci.USA 74(4):1590–4,和Kriegler,M(1991).Transfer and Expression:A Laboratory Manual.New York:W.H.Freeman and Company.pp.96–97);树状聚合物;或阳离子聚合物(例如DEAE-葡聚糖或聚乙烯亚胺)。非化学方法包括电穿孔、声纳穿孔,和光学转染。基于粒子的转染包括使用基因枪或磁辅助转染(Bertram(2006)Current Pharmaceutical Biotechnology 7,277–28)。病毒方法也可以用于转染。
还可以通过电穿孔、通过卵细胞质内注射(intracytoplasmic injection)、通过病毒感染、通过腺病毒、通过腺相关病毒、通过慢病毒、通过逆转录病毒、通过转染、通过脂质介导的转染,或通过核转染将人TRKB靶向试剂引入细胞。核转染是一种改进的电穿孔技术,其使核酸底物不仅可以传递到细胞质,还可以通过核膜递送到细胞核。另外,在本文公开的方法中使用核转染通常比常规电穿孔需要更少的细胞(例如仅需约200万,而常规电穿孔则需700万)。在一实施例中,使用
Figure BDA0002689802010000871
NUCLEOFECTORTM系统进行核转染。
也可以通过显微注射来将核酸或蛋白引入细胞(例如合子)。在合子(即单细胞期胚胎)中,显微注射可以注入母系和/或父系原核或注入细胞质中。如果显微注射仅进入一个原核,则父系原核因其尺寸较大是优选的。替代地,显微注射可以通过注射到细胞核/原核和细胞质中执行:可以先将针头引入细胞核/原核,然后可以注射第一量,然后当从单细胞期胚胎中取出针头时,可将第二量注入细胞质中。进行显微注射的方法是众所周知的。参见,例如,Nagy et al.(Nagy A,Gertsenstein M,Vintersten K,Behringer R.,2003,Manipulating the Mouse Embryo.Cold Spring Harbor,New York:Cold Spring HarborLaboratory Press);还参见Meyer et al.(2010)Proc.Natl.Acad.Sci.USA 107:15022-15026和Meyer et al.(2012)Proc.Natl.Acad.Sci.USA 109:9354-9359。
将核酸或蛋白质引入细胞或非人动物的其它方法可包括,例如,载体递送、颗粒介导的递送、外体介导的递送、脂质纳米颗粒介导的递送、细胞穿膜肽介导的递送,或可植入装置介导的递送。作为具体实例,可以将核酸或蛋白质在诸如聚(乳酸)(PLA)微球、聚(D,L-乳酸-甘醇酸)(PLGA)微球、脂质体、胶束、反胶束、脂质卷,或脂质微管的载体中引入细胞或非人动物。递送至非人动物的一些具体实例包括流体动力递送、病毒介导的递送(例如,腺相关病毒(AAV)介导的递送),和脂质纳米颗粒介导的递送。
核酸和蛋白质向细胞或非人动物中的引入可以通过流体动力递送(HDD)来完成。流体动力递送已经作为体内的细胞内DNA递送的方法出现。为了将基因递送至实质细胞,仅需要通过选定的血管注射必需的DNA序列,从而消除了与当前的病毒载体和合成载体有关的安全隐患。当注射入血液时,DNA能够到达血液可及的不同组织中的细胞。流体动力递送利用通过将大量溶液快速注射到循环中不可压缩的血液中所产生的力来克服内皮和细胞膜的物理屏障,该物理屏障阻止了大的和膜不可渗透的化合物进入实质细胞。除了DNA的递送外,此方法还可用于体内的RNA、蛋白质,和其它小化合物的有效细胞内递送。参见,例如,Bonamassa et al.(2011)Pharm.Res.28(4):694-701,出于所有目的通过引用整体并入本文。
还可以通过病毒介导的递送(例如AAV介导的递送或慢病毒介导的递送)来实现核酸的引入。其它示例性病毒/病毒载体包括逆转录病毒、腺病毒、痘苗病毒、痘病毒,和单纯疱疹病毒。病毒可以感染分裂细胞、非分裂细胞,或分裂和非分裂细胞两者。病毒可以整合到宿主基因组中,也可以不整合到宿主基因组中。还可以对此类病毒进行工程化,使其免疫力降低。病毒可以是可复制型的,也可以是复制缺陷型的(例如,在另一轮病毒体复制和/或包装中必需的一个或多个基因中有缺陷)。病毒可引起瞬时表达、长期表达(例如至少1周、2周、1个月、2个月,或3个月),或永久表达(例如Cas9和/或gRNA的表达)。示例性病毒滴度(例如AAV滴度)包括1012、1013、1014、1015,和1016载体基因组/mL。
ssDNA AAV基因组由两个开放阅读框Rep和Cap组成,其侧接允许合成互补DNA链的两个反向末端重复序列。当构建AAV转移质粒时,将转基因置于两个ITR之间,并且Rep和Cap可以反式提供。除了Rep和Cap之外,AAV还可能需要一个包含来自腺病毒的基因的辅助质粒。这些基因(E4、E2a,和VA)介导AAV复制。例如,可以将转移质粒Rep/Cap和辅助质粒转染到含有腺病毒基因E1+的HEK293细胞中,以产生感染性AAV颗粒。替代地,可以将Rep、Cap,和腺病毒辅助基因合并为一个质粒。类似的包装细胞和方法可用于其它病毒,例如逆转录病毒。
已经识别出多种血清型的AAV。这些血清型在它们感染的细胞类型(即它们的向性(tropism))上有所不同,从而允许特定细胞类型的优先转导。CNS组织的血清型包括AAV1、AAV2、AAV4、AAV5、AAV8,和AAV9。心脏组织的血清型包括AAV1、AAV8,和AAV9。肾组织的血清型包括AAV2。肺组织的血清型包括AAV4、AAV5、AAV6,和AAV9。胰腺组织的血清型包括AAV8。感光细胞的血清型包括AAV2、AAV5,和AAV8。视网膜色素上皮组织的血清型包括AAV1、AAV2、AAV4、AAV5,和AAV8。骨骼肌组织的血清型包括AAV1、AAV6、AAV7、AAV8,和AAV9。肝组织的血清型包括AAV7、AAV8,和AAV9,尤其是AAV8。
可以通过假型(pseudotyping)进一步完善向性;假型是来自不同病毒血清型的衣壳和基因组的混合。例如,AAV2/5表示一种病毒,其包含包装在血清型5的衣壳中的血清型2的基因组。使用假型病毒可以提高转导效率,并改变向性。衍生自不同血清型的混合衣壳也可用于改变病毒向性。例如,AAV-DJ包含来自八种血清型的杂交衣壳,并且在体内多种细胞类型中显示出高感染性。AAV-DJ8是另一个显示AAV-DJ的属性,但具有增强的大脑摄入的示例。AAV血清型也可以通过突变进行修饰。AAV2的突变修饰的例子包括Y444F、Y500F、Y730F,和S662V。AAV3的突变修饰的例子包括Y705F、Y731F,和T492V。AAV6的突变修饰的例子包括S663V和T492V。其它假型/修饰的AAV变体包括AAV2/1、AAV2/6、AAV2/7、AAV2/8、AAV2/9、AAV2.5、AAV8.2,和AAV/SASTG。
为了加速转基因表达,可以使用自身互补的AAV(scAAV)变体。由于AAV依赖于细胞的DNA复制机制来合成AAV单链DNA基因组的互补链,因此转基因表达可能会延迟。为了解决此延迟,可以使用包含能够在感染后自发退火的互补序列的scAAV,从而消除了宿主细胞DNA合成的需求。
为了增加包装能力,可以在两个AAV转移质粒之间分裂更长的转基因,第一个具有3'剪接供体,第二个具有5'剪接受体。细胞共同感染(co-infection)后,这些病毒形成多联体,被剪接在一起,全长转基因可以得到表达。尽管这允许更长的转基因表达,但表达效率较低。用于增加能力的类似方法利用同源重组。例如,转基因可以在两个转移质粒之间分开,但是具有实质的序列重叠,使得共同表达诱导全长转基因的同源重组和表达。
核酸和蛋白质的引入也可以通过脂质纳米颗粒(LNP)介导的递送来实现。例如,LNP介导的递送可以用于递送RNA形式的指导RNA。通过这种方法的递送导致了指导RNA的瞬时存在,并且可生物降解的脂质提高了清除率,提高了耐受性并降低了免疫原性。脂质制剂可以保护生物分子免于降解,同时改善其细胞摄取。脂质纳米颗粒是包含通过分子间力彼此物理结合的多个脂质分子的颗粒。这些包括微球(包括单层和多层囊泡,例如脂质体)、乳液中的分散相、胶束或悬浮液中的内相。此类脂质纳米颗粒可用于封装一种或多种核酸或蛋白质以进行递送。包含阳离子脂质的制剂在用于递送聚阴离子(如核酸)时是有用的。可以包括的其它脂质是中性脂质(即不带电荷的或两性离子脂质)、阴离子脂质、增强转染的辅助脂质(helper lipid),以及隐形脂质(stealth lipid),其增加了纳米粒子可以在体内存在的时间长度。合适的阳离子脂质、中性脂质、阴离子脂质、辅助脂质,和隐形脂质的实例可以在WO 2016/010840A1和WO 2017/173054A1中找到,其每一篇出于所有目的通过引用整体并入本文。示例性的脂质纳米颗粒可包含阳离子脂质和一种或多种其它组分。在一个实例中,其它组分可包含辅助脂质,例如胆固醇。在另一个实例中,其它组分可以包含辅助脂质,例如胆固醇和诸如DSPC的中性脂质。在另一个实例中,其它组分可以包含辅助脂质(例如胆固醇)、可选的中性脂质(例如DSPC),以及隐形脂质(例如S010、S024、S027、S031,或S033)。
LNP可包含以下一种或多种或全部:(i)用于包封和用于内体逸出的脂质;(ii)稳定的中性脂质;(iii)用于稳定的辅助脂质;(iv)隐形脂质。参见,例如,Finn et al.(2018)Cell Reports 22:1-9和WO 2017/173054A1,出于所有目的,通过引用将其全部内容整体并入本文。在某些LNP中,运货(cargo)可包含指导RNA或编码指导RNA的核酸。在某些LNP中,运货可包含编码Cas核酸酶(例如Cas9)的mRNA以及指导RNA或编码指导RNA的核酸。
用于包封和内体逸出的脂质可以是阳离子脂质。脂质也可以是可生物降解的脂质,例如可生物降解的可电离脂质。合适脂质的一个实例是脂质A或LP01,其为(9Z,12Z)-3-((4,4-双(辛氧基氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙基十八烷基-9,12-二烯酸酯,也称为3-((4,4-双(辛基氧基)丁酰基)氧基)-2-((((3-(二乙基氨基)丙氧基)羰基)氧基)甲基)丙基(9Z,12Z)-十八烷基-9,12-二烯酸酯。参见,例如,Finnet al.(2018)Cell Reports 22:1-9和WO 2017/173054A1,出于所有目的,通过引用将其每一篇的全部内容整体并入本文。合适的脂质的另一个实例是脂质B,其为((5-((二甲基氨基)甲基)-1,3-亚苯基)双(氧基))双(辛烷-8,1-二基)双(癸酸酯),也称为((5-((二甲基氨基)甲基)-1,3-亚苯基)双(氧基))双(辛烷-8,1-二基)双(癸酸酯)。合适的脂质的另一个例子是脂质C,其为2-((4-(((3-(二甲基氨基)丙氧基)羰基)氧基)-十六烷酰基)氧基)丙烷-1,3-二基(9Z,9'Z,12Z,12'Z)-双(十八烷基-9,12-二烯酸酯)。合适的脂质的另一个实例是脂质D,其为3-(((3-(二甲基氨基)丙氧基)羰基)氧基)-13-(辛酰氧基)十三烷基-3-辛基十一酸酯。
适用于本文所述的LNP的一些此类脂质在体内是可生物降解的。例如,包含这种脂质的LNP包括其中至少75%的脂质在8、10、12、24,或48小时或3、4、5、6、7,或10天内从血浆中清除的那些。作为另一个例子,50%的LNP在8、10、12、24,或48小时,或3、4、5、6、7,或10天之内从血浆中清除。
此类脂质可以根据它们所在的介质的pH值而为可电离的。例如,在弱酸性介质中,脂质可以被质子化并因此带有正电荷。相反,在轻微弱碱性的介质中,例如pH值约为7.35的血液中,脂质可能不会质子化,因此不带电荷。在一些实施方案中,脂质可以在至少约9、9.5,或10的pH下质子化。这种脂质带有电荷的能力与其固有的pKa有关。例如,脂质可以独立地具有约5.8至约6.2的pKa。
中性脂质起到稳定和改善LNP加工的作用。合适的中性脂质的实例包括各种中性、不带电或两性离子脂质。适用于本公开的中性磷脂的实例包括,但不限于,5-七癸基苯-1,3-二醇(间苯二酚)、二棕榈酰磷脂酰胆碱(DPPC)、二硬脂酰磷脂酰胆碱(DSPC)、磷酸胆碱(DOPC)、二肉豆蔻酰磷脂酰胆碱(DMPC)、磷脂酰胆碱(PLPC)、1,2-双硬脂酰-sn-甘油-3-磷酸胆碱(DAPC)、磷脂酰乙醇胺(PE)、卵磷脂酰胆碱(EPC)、二月桂酰磷脂酰胆碱(DLPC)、二肉豆蔻酰磷脂酰胆碱(DMPC)、1-肉豆蔻酰基-2-棕榈酰基磷脂酰胆碱(MPPC)、1-棕榈酰基-2-肉豆蔻酰基磷脂酰胆碱(PMPC)、1-棕榈酰基-2-硬脂酰基磷脂酰胆碱(PSPC)、1,2-二硬脂酰基-sn-甘油-3-磷酸胆碱(DBPC)、1-硬脂酰基-2-棕榈酰基磷脂酰胆碱(SPPC)、1,2-双二十碳烯酰基(dieicosenoyl)-sn-甘油基-3-磷酸胆碱(DEPC)、棕榈酰基油酰基磷脂酰胆碱(POPC)、溶血磷脂酰胆碱、二油酰基磷脂酰乙醇胺(DOPE)、二亚油酰基磷脂酰胆碱二硬脂酰基磷脂酰乙醇胺(DSPE)、二豆蔻酰基磷脂酰乙醇胺(DMPE)、二棕榈酰基磷脂酰乙醇胺(DPPE)、棕榈酰基油酰基磷脂酰乙醇胺(POPE)、溶血磷脂酰乙醇胺,以及它们的组合。
辅助脂质包括增强转染的脂质。辅助脂质提高转染的机制可能包括例如提高粒子的稳定性。在一些情况下,辅助脂质可以改善膜的融合性(fusogenicity)。辅助脂质包括类固醇、固醇,和烷基邻苯二酚。合适的辅助脂质的实例包括胆固醇、5-十七烷基间苯二酚,和胆固醇半琥珀酸酯。在一实例中,辅助脂质可以是胆固醇或胆固醇半琥珀酸酯。
隐形脂质包括改变纳米颗粒可以在体内存在的时间长度的脂质。隐形脂质可以通过例如减少颗粒聚集和控制颗粒大小来辅助配制过程。隐形脂质可能会调节LNP的药代动力学特性。合适的隐形脂质包括具有连接至脂质部分的亲水头部基团的脂质。
隐形脂质的亲水性头部基团可包括,例如,选自基于PEG的聚合物的聚合物部分(有时称为聚(环氧乙烷))、聚(恶唑啉)、聚(乙烯醇)、聚(甘油)、聚(N-乙烯基吡咯烷酮)、聚氨基酸,和聚N-(2-羟丙基)甲基丙烯酰胺。术语“PEG”是指任何聚乙二醇或其它聚亚烷基醚聚合物。在某些LNP制剂中,PEG是PEG-2K,也称为PEG 2000,其平均分子量为约2,000道尔顿。参见,例如,WO 2017/173054A1,出于所有目的通过引用将其全部内容合并于此。
隐形脂质的脂质部分可以衍生自,例如,二酰基甘油或二酰基甘油酰胺,包括那些包含烷基链的二烷基甘油或二烷基甘油酰胺基团的分子,其中该烷基链的长度独立地包含约C4至约C40饱和或不饱和碳原子,其中该链可包含一个或多个官能团,例如酰胺或酯。二烷基甘油或二烷基甘油酰胺基可进一步包含一个或多个取代的烷基。
作为一个实例,隐形脂质可以选自PEG-二月桂酰基甘油、PEG-二肉豆蔻酰基甘油(PEG-DMG)、PEG-二棕榈酰基甘油、PEG-二硬脂酰基甘油(PEG-DSPE)、PEG-二月桂基甘油酰胺、PEG-二肉豆蔻基甘油酰胺、PEG-二棕榈酰基甘油酰胺,和PEG-二硬脂酰基甘油酰胺、PEG-胆固醇(1-[8'-(胆甾-5-烯-3β-氧基)羧酰胺-3',6'-二氧辛基]氨基甲酰基-ω-甲基-聚(乙二醇)、PEG-DMB(3,4-二十四烷氧基苄基-ω-甲基-聚(乙二醇)醚)、1,2-二肉豆蔻酰基-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000](PEG2k-DMG)、1,2-二硬脂酰基-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000](PEG2k-DSPE)、1,2-二硬脂酰基-sn-甘油、甲氧基聚乙二醇(PEG2k-DSG)、聚(乙二醇)-2000-二甲基丙烯酸酯(PEG2k-DMA),和1,2-二硬脂基氧基丙基-3-胺-N-[甲氧基(聚乙二醇)-2000](PEG2k-DSA)。在一个特定实例中,隐形脂质可以是PEG2k-DMG。
LNP可以在制剂中包含组分脂质的各自不同的摩尔比。CCD脂质的摩尔%可以是例如约30摩尔%至约60摩尔%、约35摩尔%至约55摩尔%、约40摩尔%至约50摩尔%、约42摩尔%至约47摩尔%,或约45%。辅助脂质的摩尔%可以是例如约30摩尔%至约60摩尔%、约35摩尔%至约55摩尔%、约40摩尔%至约50摩尔、约41摩尔%至约46摩尔%,或约44摩尔%。中性脂质的摩尔%可以是例如约1摩尔%至约20摩尔%、约5摩尔%至约15摩尔%、约7摩尔%至约12摩尔%,或约9摩尔%。隐形脂质的摩尔%可以是例如约1摩尔%至约10摩尔%、约1摩尔%至约5摩尔%、约1摩尔%至约3摩尔%、约2摩尔%,或约1摩尔%。
LNP在要被包封的核酸的可生物降解脂质的带正电荷的胺基(N)和带负电荷的磷酸基(P)之间可以具有不同的比率。这可在数学上由等式N/P表示。例如,N/P之比可为约0.5至约100、约1至约50、约1至约25、约1至约10、约1至约7、约3至5、约4至约5、约4、约4.5,或约5。
在一些LNP中,运货可以包含Cas mRNA和gRNA。Cas mRNA和gRNA的比例可以不同。例如,LNP制剂可包括Cas mRNA与gRNA核酸之比为约25:1至约1:25、约10:1至约1:10、约5:1至约1:5,或约1:1。替代地,LNP制剂可以包括约1:1至约1:5,或约10:1的Cas mRNA与gRNA核酸之比。备选地,LNP制剂可以包括约1:10、25:1、10:1、5:1、3:1、1:1、1:3、1:5、1:10或1:25的Cas mRNA与gRNA核酸之比。
合适的LNP的具体实例的氮磷(N/P)比为4.5,并且以45:44:9:2的摩尔比包含可生物降解的阳离子脂质、胆固醇、DSPC,和PEG2k-DMG。可生物降解的阳离子脂质可以是(9Z,12Z)-3-((4,4-双(辛氧基氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙基十八烷基-9,12-二烯酸酯,也称为3-((4,4-双(辛基氧基)丁酰基)氧基)-2-((((3-(二乙基氨基)丙氧基)羰基)氧基)甲基)丙基(9Z,12Z)-十八烷基-9,12-二烯酸酯。参见,例如,Finn et al.(2018)Cell Reports 22:1-9,出于所有目的,通过引用将其全部内容整体并入本文。合适的脂质的另一个实例是脂质B,其为((5-((二甲基氨基)甲基)-1,3-亚苯基)双(氧基))双(辛烷-8,1-二基)双(癸酸酯),也称为((5-((二甲基氨基)甲基)-1,3-亚苯基)双(氧基))双(辛烷-8,1-二基)双(癸酸酯)。合适的脂质的另一个例子是脂质C,其为2-((4-(((3-(二甲基氨基)丙氧基)羰基)氧基)-十六烷酰基)氧基)丙烷-1,3-二基(9Z,9'Z,12Z,12'Z)-双(十八烷基-9,12-二烯酸酯)。合适的脂质的另一个实例是脂质D,其为3-(((3-(二甲基氨基)丙氧基)羰基)氧基)-13-(辛酰氧基)十三烷基-3-辛基十一酸酯。其它合适的脂质包括庚二酸-6,9,28,31-四烯-19-基-4-(二甲基氨基)丁酸酯(也称为Dlin-MC3-DMA(MC3))。
合适的LNP的另一个具体实例的氮磷(N/P)比为6,并且以50:38:9:3的摩尔比包含可生物降解的阳离子脂质、胆固醇、DSPC,和PEG2k-DMG。可生物降解的阳离子脂质可以是(9Z,12Z)-3-((4,4-双(辛氧基氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙基十八烷基-9,12-二烯酸酯,也称为3-((4,4-双(辛基氧基)丁酰基)氧基)-2-((((3-(二乙基氨基)丙氧基)羰基)氧基)甲基)丙基(9Z,12Z)-十八烷基-9,12-二烯酸酯。
可以选择递送方式以降低免疫原性。例如,可以通过不同的模式来递送不同的组分(例如双模式的递送)。这些不同的模式可以赋予对象递送的分子不同的药效学或药代动力学性质。例如,不同的模式可以导致不同的组织分布、不同的半衰期,或不同的时间分布。某些递送摸式(例如通过自主复制或基因组整合而保留在细胞中的核酸载体的递送)导致分子更持久的表达和存在,而其它递送方式是瞬时的且持久性较低(例如递送RNA或蛋白质)。以更瞬时的方式递送组分(例如RNA)可以确保Cas/gRNA复合物仅在短时间内存在并起作用,并且可以降低免疫原性。这种瞬时传递也可以减少脱靶修饰的可能性。
体内给药可以通过任何合适的途径进行,包括,例如,肠胃外、静脉内、口服、皮下、动脉内、颅内、鞘内、腹膜内、局部、鼻内,或肌肉内。全身性给药方式包括,例如,口服和肠外途径。肠外途径的实例包括静脉内、动脉内、骨内(intraosseous),肌肉内、皮内、皮下、鼻内,和腹膜内途径。一个具体的例子是静脉输液。局部给药方式包括,例如,鞘内、脑室内、实质内(例如局部实质内递送至纹状体(例如进入尾状核(caudate)或壳核)、大脑皮层、中央前回、海马(例如进入齿状回或CA3区)、颞叶皮层(temporal cortex)、杏仁核、额叶皮层(frontal cortex)、丘脑、小脑、延髓、下丘脑、顶盖、被盖,或黑质)、眼内、眶内、结膜下、玻璃体内、视网膜下,和巩膜途径。与全身给药(例如静脉内)相比,当局部给药(例如实质内或玻璃体内)时,显著更少量的组分(与全身途径相比)即可以发挥作用。局部给药方式还可以减少或消除全身给药治疗有效量的组分时可能发生的潜在毒性副作用的发生。
体内给药可以通过任何合适的途径进行,包括,例如,肠胃外、静脉内、口服、皮下、动脉内、颅内、鞘内、腹膜内、局部、鼻内,或肌肉内。一个具体的例子是静脉输液。鼻滴注和玻璃体内注射是其它的具体实例。可以使用一种或多种生理和药学上可接受的载体、稀释剂、赋形剂,或助剂配制包含指导RNA(或编码指导RNA的核酸)的组合物。该制剂可以取决于选择的给药途径。术语“药学上可接受的”是指载体、稀释剂、赋形剂,或助剂与制剂的其它成分相容并且对其接受者基本上无害。
给药频率和剂量数目可以取决于外源供体核酸或指导RNA(或编码该指导RNA的核酸)的半衰期和给药途径以及其它因素。可以在一段时间内进行一次或多次的将核酸或蛋白质引入细胞或非人动物中。例如,引入可以在一段时间内至少执行两次、在一段时间内至少执行三次、在一段时间内至少执行四次、在一段时间内至少执行五次、在一段时间内至少执行六次、在一段时间内至少执行七次、在一段时间内至少执行八次、在一段时间内至少执行九次、在一段时间内至少执行十次、至少执行十一次、在一段时间内至少执行十二次、在一段时间内至少执行十三次、在一段时间内至少执行十四次、在一段时间内至少执行十五次、在一段时间内至少执行十六次、在一段时间内至少执行十七次、在一段时间内至少执行十八次、在一段时间内至少执行十九次,或在一段时间内至少执行二十次。
E.体内测量CRISPR/Cas的活性并评估靶基因的表达
本文公开的方法可以进一步包括评估靶基因的表达。测量表达或活性的方法将取决于被修饰的靶基因。
例如,如果靶基因包括编码RNA或蛋白质的基因,则评估表达的方法可包括测量编码的RNA和/或蛋白质的表达或活性。例如,如果编码的蛋白质是释放到血清中的蛋白质,则可以测量编码的蛋白质的血清水平。用于测量RNA和蛋白质的水平和活性的测定是众所周知的。
可以在来自任何组织或器官的任何细胞类型中评估靶基因在非人动物中的表达。例如,可以在来自相同组织或器官的多种细胞类型或在来自组织或器官内的多个位置的细胞中评估靶基因的表达。这可以提供关于靶组织或器官内的哪些细胞类型被靶向或CRISPR/Cas达到并修改了组织或器官的哪些部分的信息。作为另一个例子,可以在多种类型的组织或多个器官中评估靶基因的表达。在将特定组织或器官被靶定的方法中,这可以提供有关该组织或器官被靶向的效率以及在其它组织或器官中是否存在脱靶效应的信息。
IV.制作包含Cas表达盒和/或重组酶表达盒的非人动物的方法
提供了各种方法来制备非人动物,其包含如本文别处所公开的协同激活介质(SAM)表达盒(包含嵌合Cas蛋白编码序列和嵌合衔接体蛋白表达编码序列)、指导RNA表达盒,和重组酶表达中的一个或多个或全部。同样,提供了各种方法来制备非人动物,其包含如本文别处所公开的嵌合Cas蛋白表达盒、嵌合衔接体蛋白表达盒、指导RNA表达盒,和重组酶表达中的一个或多个或全部。用于生产遗传修饰生物的任何方便的方法或方案都适用于生产这种遗传修饰的非人动物。参见,例如,Cho et al.(2009)Current Protocols inCell Biology42:19.11:19.11.1–19.11.22和Gama Sosa et al.(2010)BrainStruct.Funct.214(2-3):91-109,出于所有目的,将每一篇均通过引用整体并入本文。这样的遗传修饰的非人动物可以例如通过在靶基因座(例如安全港基因座,如Rosa26)处的基因敲入或通过使用随机整合的转基因来产生。参见,例如,WO 2014/093622和WO 2013/176772,出于所有目的,将它们的每一篇通过引用整体并入本文。在例如US 2012/0017290、US 2011/0265198,和US 2013/0236946中描述了将构建体靶向Rosa26基因座的方法,出于所有目的将其每一篇的全部内容通过引用并入本文。
例如,产生包含本文中其它地方公开的一个或多个或所有表达盒的非人动物的方法可包括:(1)修饰多能细胞的基因组以包含一个或多个或全部的表达盒;(2)识别或选择包含一个或多个或所有所述表达盒的遗传修饰的多能细胞;(3)将该遗传修饰的多能细胞导入非人类物宿主胚胎中;以及(4)将宿主胚胎植入代孕母体中并在代孕母体中孕育宿主胚胎。例如,产生包含本文中其它地方公开的一个或多个或所有表达盒的非人动物的方法可包括:(1)修饰多能细胞的基因组以包含一个或多个或所有表达盒;(2)识别或选择包含一个或多个或所有表达盒的遗传修饰的多能细胞;(3)将经遗传修饰的多能细胞导入非人动物宿主胚胎中;(4)在代孕母体中孕育宿主胚胎。可选地,可以将包含修饰的多能细胞(例如非人ES细胞)的宿主胚胎培育至胚泡阶段,然后将其植入代孕母体并在代孕母体中孕育,以产生F0非人动物。代孕母体然后可以产生包含一个或多个或全部表达盒的F0代非人动物。
所述方法可以进一步包括识别具有修饰的靶基因组基因座的细胞或动物。可以使用多种方法来识别具有靶向遗传修饰的细胞和动物。
修饰基因组的步骤可以例如利用外源供体核酸(例如靶向载体)来修饰靶基因组基因座,以包含本文别处所公开的一个或多个或所有表达盒。作为一个实例,靶向载体可以包括靶向靶基因组基因座处的5'靶序列的5'同源臂和和靶向靶基因组基因座处的3'靶序列的3'同源臂。外源修复模板也可以包含核酸插入物,该核酸插入物包括要整合在靶基因组基因座中的DNA片段。靶基因组基因座中的核酸插入物的整合可导致在靶基因组基因座中添加目标核酸序列、在靶基因组基因座中删除目标核酸序列,或替换靶基因组基因座中的目标核酸序列(即删除和插入)。同源臂可以侧接包含本文别处所公开的一个或多个或全部表达盒的插入核酸,以产生靶基因组基因座。
外源修复模板可以用于非同源末端连接介导的插入或同源重组。外源修复模板可以包含脱氧核糖核酸(DNA)或核糖核酸(RNA),它们可以是单链或双链的,并且可以是线性或环状形式。例如,修复模板可以是单链寡脱氧核苷酸(ssODN)。
外源修复模板还可以包含在未靶向的内源靶基因组基因座处不存在的异源序列。例如,外源修复模板可包含选择盒,例如侧接重组酶识别位点的选择盒。
一些外源修复模板包含同源臂。如果外源修复模板酸还包含核酸插入物,则同源臂可以侧接该核酸插入物。为了便于参考,在本文中将同源臂称为5'和3'(即上游和下游)同源臂。该术语涉及外源修复模板内的同源臂与核酸插入物的相对位置。5'和3'同源臂对应于靶基因组基因座内的区域,其在本文分别称为“5'靶序列”和“3'靶序列”。
当两个区域彼此共享足够水平的序列同一性以充当同源重组反应的底物时,同源臂和靶序列“对应”或彼此“对应”。术语“同源”包括与相应序列相同或共享序列同一性的DNA序列。给定靶序列与外源供体核酸中发现的相应同源臂之间的序列同一性可以是允许同源重组发生的任何程度的序列同一性。例如,外源供体核酸(或其片段)的同源臂和靶序列(或其片段)共有的序列同一性的量可以为至少50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或100%的序列同一性,以使这些序列进行同源重组。此外,同源臂和对应靶序列之间的对应同源区域可以为足以促进同源重组的任何长度。在一些靶向载体中,靶基因组基因座中的预期突变包括在侧接同源臂的插入核酸中。
在单细胞期胚胎以外的细胞中,外源修复模板可以是“大靶向载体”或“LTVEC”,其包括靶向载体,所述靶向载体包含对应于并衍生自核酸序列的同源臂,该核酸序列大于用于在细胞中进行同源重组的其它方法所通常使用的核酸序列。LTVEC还包括靶向载体,该靶向载体包含具有核酸序列的核酸插入物,该核酸序列大于用于在细胞中进行同源重组的其它方法所通常使用的核酸序列。例如,LTVEC使大基因座的修饰成为可能;由于其尺寸限制,传统的基于质粒的靶向载体无法容纳该大基因座。例如,靶定的基因座可以是(即5'和3'同源臂可以对应于)在不存在核酸酶剂(例如Cas蛋白)诱导的切口或双链断裂时使用常规方法不可靶定的或只能被错误地靶定的或仅以非常低的效率被靶定的细胞的基因座。LTVEC可以是任何长度,通常长度至少为10kb。LTVEC中5'同源臂和3'同源臂的总和通常至少为10kb。
筛选步骤可以包括例如用于评估亲代染色体的等位遗传修饰(MOA)的定量测定。例如,可以通过定量PCR,例如实时PCR(qPCR),来进行定量测定。实时PCR可以利用识别靶基因座的第一引物组和识别非靶定参考基因座的第二引物组。引物组可以包含识别扩增的序列的荧光探针。
合适的定量测定的其它实例包括荧光介导原位杂交(FISH)、比较基因组杂交、等温DNA扩增、定量杂交至固定探针、
Figure BDA0002689802010001001
探针、
Figure BDA0002689802010001002
分子信标探针,或ECLIPSETM探针技术(参见例如US2005/0144655,其出于所有目的以全文引用方式并入本文)。
合适的多能细胞的例子是胚胎干(ES)细胞(例如小鼠ES细胞或大鼠ES细胞)。修饰的多能细胞可通过例如以下产生:通过(a)将一个或多个外源供体核酸(例如靶向载体)引入细胞中,该外源供体核酸包含侧接例如对应于5'和3'靶位点的5'和3'同源臂的插入核酸,其中插入核酸包含本文所公开的一个或多个或全部表达盒;以及(b)识别至少一个细胞,所述细胞在其基因组中包含在靶基因组基因座处整合的插入核酸。替代地,修饰的多能细胞可以例如通过以下产生:通过(a)向细胞中引入:(i)核酸酶剂,其中所述核酸酶剂在靶基因组基因座内的识别位点处诱导切口或双链断裂;以及(ii)一个或多个靶向载体,其包含侧接对应于5'和3'靶位点的5'和3'同源臂的插入核酸,所述5'和3'靶位点位于与识别位点足够接近之处,其中所述插入核酸包含一个或多个或全部的表达盒;以及(c)识别至少一个在靶基因组基因座处包含修饰(例如插入核酸的整合)的细胞。可以使用诱导切口或双链断裂进入所需的识别位点的任何核酸酶剂。合适的核酸酶的实例包括类转录激活因子效应物核酸酶(TALEN)、锌指核酸酶(ZFN)、兆核酸酶,和成簇的规律间隔的短回文重复序列(CRISPR)/CRISPR相关(Cas)系统(例如CRISPR/Cas9系统)或此类系统的组分(例如CRISPR/Cas9)。参见,例如,US 2013/0309670和US 2015/0159175,出于所有目的将每一篇的全部内容通过引用整体并入本文。
供体细胞可以在任何阶段(例如胚泡期或桑椹胚前期(pre-morula stage,即4细胞期或8细胞期))引入宿主胚胎。产生能够通过种系传递遗传修饰的后代。参见,例如,美国专利号7,294,754,其出于所有目的通过引用整体并入本文。
替代地,产生本文本文其它地方所述的非人动物的方法可包括:(1)使用上述修饰多能细胞的方法修饰单细胞期胚胎的基因组,以包含一个或多个或全部的表达盒;(2)选择遗传修饰的胚胎;和(3)将该遗传修饰的胚胎植入代孕母体到并在代孕母体中孕育。替代地,产生本文其它地方所述的非人动物的方法可包括:(1)使用上述修饰多能细胞的方法修饰单细胞期胚胎的基因组,以包含一个或多个或全部的表达盒;(2)选择遗传修饰的胚胎;和(3)在代孕母体中孕育该遗传修饰的胚胎。产生了能够通过种系传递遗传修饰的后代。
核转移技术也可以用于产生非人动物。简而言之,核转移的方法可以包括以下步骤:(1)将卵母细胞去核或提供去核卵母细胞;(2)分离或提供将与该去核卵母细胞结合的供体细胞或细胞核;(3)将细胞或细胞核插入去核卵母细胞中以形成重组细胞;(4)将重组细胞植入动物子宫内形成胚胎;以及(5)允许该胚胎发育。在这种方法中,卵母细胞通常是从死去的动物身上获得的,尽管它们也可以从活体动物的输卵管和/或卵巢中分离。去核之前,卵母细胞可在多种众所周知的培养基中成熟。卵母细胞的去核可以多种公知的方式进行。可以通过融合前在透明带下显微注射供体细胞,将供体细胞或细胞核插入去核卵母细胞以形成重构细胞。可以通过在接触/融合平面上施加直流电脉冲(电融合),通过将细胞暴露于融合促进化学物质(例如聚乙二醇),或通过灭活病毒(例如仙台病毒)来诱导融合。重建的细胞可以在核供体和受体卵母细胞融合之前、之中,和/或之后通过电和/或非电方式激活。激活方法包括电脉冲、化学诱导的电击、精子穿透、卵母细胞中二价阳离子水平的增加,以及卵母细胞中细胞蛋白的磷酸化的降低(通过激酶抑制剂的方式)。活化的重组细胞或胚胎可以在众所周知的培养基中培养,然后转移到动物的子宫中。参见,例如,US 2008/0092249、WO 1999/005266、US 2004/0177390、WO 2008/017234,和美国专利号7,612,250,出于所有目的将其每一篇的全部内容通过引用整体并入本文。
本文提供的各种方法允许产生遗传修饰的非人F0动物,其中遗传修饰的F0动物的细胞包含一个或多个或全部的表达盒。已经认识到,取决于用于产生F0动物的方法,F0动物中具有一个或多个或全部的表达盒的细胞数量将有所不同。通过例如VELOCI
Figure BDA0002689802010001021
方法将供体ES细胞从相应的生物体(例如8细胞期小鼠胚胎)导入到桑椹胚前期胚胎中,从而使F0动物的细胞群体的更高百分比包含具有目的核苷酸序列的细胞,所述目的核苷酸序列包含靶定的遗传修饰。例如,至少50%、60%、65%、70%、75%、85%、86%、87%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或100%的非人F0动物的细胞贡献可包括具有靶定修饰的细胞群体。
遗传修饰的F0动物的细胞对此处公开的一个或多个或全部的表达盒可以是杂合的,或者对此处公开的一个或多个或全部的表达盒可以是纯合的。
出于所有目的,上文或下文所引用的所有专利文件、网站、其它出版物、登录号等均以引用的方式整体并入本文,其程度与将每个单独的项目具体并单独地指示为通过引用并入本文的程度相同。如果序列的不同版本在不同时间与登录号相关联,则意指着在本申请的有效申请日与登录号相关联的版本。有效申请日是指实际的申请日或提及登录号的优先权申请(如有的话)的申请日中较早的日期。同样,如果在不同时间发布了出版物,网站等的不同版本,则除非另有说明,是指在本申请的有效申请日最近发布的版本。除非另外明确指出,否则本发明的任何特征、步骤、元素、实施例,或方面可以与任何其它相结合使用。尽管出于清楚和理解的目的已经通过图示和示例的方式对本发明进行了详细描述,但是显而易见的是,可以在所附权利要求的范围内进行某些改变和修改。
序列简述
使用核苷酸碱基的标准字母缩写和氨基酸的三字母代码示出所附序列表中列出的核苷酸和氨基酸序列。核苷酸序列遵循从序列5'末端开始并向前(即每行从左到右)到3'末端的标准约定。每个核苷酸序列仅显示一条链,但任何对所示出的链的提及均应理解为包括互补链。当提供编码氨基酸序列的核苷酸序列时,应当理解还提供了其编码相同氨基酸序列的密码子简并变体。氨基酸序列遵循从序列的氨基末端开始并向前(即在每行中从左至右)到达羧基末端的标准约定。
表3:序列描述。
Figure BDA0002689802010001031
Figure BDA0002689802010001041
Figure BDA0002689802010001051
实施例
实施例1:SAM就绪的小鼠的产生
要使用dCas9协同激活介质(SAM)系统,通常需要引入三个组分:(1)直接融合到VP64域的dCas9;(2)与两个其它激活转录因子(热休克因子1(HSF1)和转录因子65(p65))融合的MS2外壳蛋白(MCP);和(3)含MS2环的sgRNA。通常需要将每个组分引入单独的慢病毒中。尽管所描述的三组分系统在细胞培养中具有一定的灵活性,但在动物模型中这种设置不太理想。相反,我们选择引入dCas9 SAM组件(dCas9-VP64和MCP-p65-HSF1)作为由内源Rosa26启动子驱动的一个转录本。最初,dCas9SAM系统的表达被floxed的新霉素停止表达盒的存在而阻断。引入Cre重组酶后,删除终止盒,并打开dCas9 SAM表达。然后通过将指导RNA或指导RNA阵列(例如表达自U6启动子)整合入另一个Rosa26等位基因或通过AAV引入来引入指导RNA或指导RNA阵列。通过将dCas9 SAM等位基因与各种Cre递送方法配对,可以控制基因调节的时机和组织特异性。如下所示,该系统可用于在体内诱导基因表达,并可用于疾病模拟等应用。
产生了包含靶向小鼠的Rosa26基因座的同源臂的大靶向载体(LTVEC),以将dCas9SAM表达盒引入Rosa26基因座的第一内含子。在例如US 6,586,251和Valenzuela et al.(2003)Nat.Biotechnol.21(6):652-659中描述了使用
Figure BDA0002689802010001061
基因工程技术,通过细菌同源重组(BHR)反应从细菌人工染色体(BAC)DNA衍生的LTVEC的产生和使用;出于所有目的,通过引用将其每一篇的全部内容合并于此。在例如US 2015/0376628和WO 2015/200334中描述了通过体外组装方法产生LTVEC的方法,出于所有目的将其全部内容通过引用并入本文。
对表达盒中的化脓链球菌dCas9编码序列(CDS)进行密码子优化以在小鼠中表达。编码的dCas9包含以下使Cas9核酸酶失活的突变:D10A和N863A。dCas9-NLS-VP64-T2A-MCP-NLS-p65-HSF1-WPRE表达盒如图1A和SEQ ID NO:31所示。协同激活介质(SAM)编码序列(dCas9-VP64-T2A-MCP-p65-HSF1)如SEQ ID NO:64所示,并编码SEQ ID NO:44所示的蛋白质。该表达盒靶向Rosa26基因座的第一个内含子(见图2),以利用Rosa26基因座的强普遍表达以及靶向Rosa26基因座的简单程度。表达盒之前是带有合适剪接信号和强多腺苷酸化(polyA)信号的floxed新霉素抗性盒(neo盒)。dCas9 SAM表达盒从5'到3'的组分如下表4所示。
表4:dCas9 SAM表达盒组分。
Figure BDA0002689802010001071
为了产生靶向的Rosa26等位基因,将LTVEC引入F1H4小鼠胚胎干细胞中。在抗生素选择后,通过
Figure BDA0002689802010001072
以挑选、扩增,和筛选集落(colonies)。在例如US 2014/0178879;US 2016/0145646;WO 2016/081923;和Frendewey et al.(2010)MethodsEnzymol.476:295-307中描述了包括等位基因丢失(LOA)和等位基因获得(GOA)测定的等位遗传修饰(MOA)测定,出于所有目的,通过引用将其每一篇的全部内容合并于此。等位基因丢失(LOA)测定颠倒了传统的筛选逻辑,并量化了突变所针对的天然基因座的基因组DNA样本中的拷贝数。在正确靶向的杂合细胞克隆中,LOA测定检测到两个天然等位基因之一(对于不在X或Y染色体上的基因),另一个等位基因被靶向修饰破坏。可以将相同的原理反向应用于等位基因获得(GOA)测定,以量化基因组DNA样品中插入的靶向载体的拷贝数。表5提供了用于筛选的引物和探针。
表5:引物和探针。
引物/探针 序列 SEQ ID NO
XBA-TDP fw CGTGATCTGCAACTCCAGTCTT 45
XBA-TDP探针 AGATGGGCGGGAGTCTTCTGGGC 46
XBA-TDP rev CACACCAGGTTAGCCTTTAAGCC 47
Neo fw GGTGGAGAGGCTATTCGGC 48
Neo探针 TGGGCACAACAGACAATCGGCTG 49
Neo rev GAACACGGCGGCATCAG 50
SAM TD fw ACCGGCTGTCCGACTACGAT 51
SAM TD探针 TGGACCACATCGTGCCTCAGA 52
SAM TD rev CGGGCCTTGTCGCTTCTG 53
MS2_T fw GGCTCCTTCTAATTTCGCTAATGG 54
MS2_T探针 TGGCAGAGTGGATCAGCTCCA 55
MS2_T rev CTGACGCTGCATGTCACCTT 56
P65_T fw AGGGCGTGTCCATGTCTCATAG 57
P65_T探针 ACAGCCGAACCAATGCTGATGGA 58
P65_T rev CCAGCCGGGTAATGGCTTC 59
WPRE_TP fw TGTGTTGCCACCTGGATTCTG 60
WPRE_TP探针 CGCGGGACGTCCTTCTGCTAC 61
WPRE_TP rev GGAAGGTCCGCTGGATTGAG 62
使用
Figure BDA0002689802010001081
方法产生了F0小鼠。参见,例如,US 7,576,259;US 7,659,442;US 7,294,754;US 2008/0078000;和Poueymirou et al.(2007)Nat.Biotechnol.25(1):91-99,出于所有目的,将其每一篇通过引用整体并入本文。在
Figure BDA0002689802010001082
方法中,通过激光辅助注射将靶向的小鼠胚胎干(ES)细胞注入前桑葚胚期(pre-morula stage)的胚胎,例如八细胞期的胚胎,从而有效地产生了完全为ES细胞衍生的F0代小鼠。
在通过Cre重组酶的作用除去floxed的新霉素抗性盒(neo盒)之前,转录和翻译新霉素抗性基因;然而,由于存在有效阻断了贯穿转录的强poly(A)区域,因此没有表达dCas9-NLS-VP64 CDS和MCP-NLS-p65-HSF1CDS。参见图1A。但是,在通过Cre重组酶的作用去除neo盒后,dCas9和MCP融合蛋白的杂合mRNA由Rosa26启动子组成性表达。参见图1B。通过从已去除floxed新霉素抗性盒(neo盒)的靶向mESC中提取总RNA来验证dCas9和MCP的表达,然后进行反转录以生成cDNA和
Figure BDA0002689802010001091
qPCR,以检测反转录的cDNA(RT-qPCR)。测量Cas9和p65 mRNA水平。分别参见图3A和3B。dCas9表达也通过蛋白质印迹证实。参见图4。综上所述,所创建的系统能够在mESC和衍生自它们的小鼠中连续或有条件地(需要除去新霉素抗性盒)表达水平一致的dCas9融合蛋白和MCP融合蛋白。
实施例2.用Ttr指导RNA验证SAM就绪小鼠
为了在体内验证该系统,用Ttr指导RNA阵列靶向载体靶向杂合的dCas9 SAMmESC,所述Ttr指导RNA阵列靶向载体靶向小鼠Rosa26基因座的第一内含子。Ttr指导RNA阵列在图5和SEQ ID NO:33中描述。包括启动子和指导RNA编码序列的区域在SEQ ID NO:66中列出。阵列中的指导RNA所靶向的小鼠Ttr基因中的指导RNA靶序列(不包括PAM)分别在SEQID NO:34(ACGGTTGCCCTCTTTTTCCCAA)、SEQ ID NO:35(ACTGTCAGACTCAAAGGTGC),和SEQ IDNO:36(GACAATAAGTAGTCTTACTC)中列出。SEQ ID NO:34位于Ttr转录起始位点的-63,SEQ IDNO:35位于Ttr转录起始位点的-134,而SEQ ID NO:36位于Ttr转录起始位点的-112。靶向这些指导RNA靶序列的单指导RNA分别在SEQ ID NOS:37、38和39中列出。同源臂侧接Ttr指导RNA阵列,该阵列包含三个靶向Ttr基因座的、含MS2茎环的指导RNA。将Ttr指导RNA阵列与roxed的嘌呤霉素终止盒整合在Rosa26基因座上。此盒可防止Rosa26贯穿转录本,干扰U6启动子活性。终止盒后,U6启动子串联表达包含MS2茎环的三个sgRNA序列,并用扩展的PolIII终止序列将它们分开。设计指导(guides)的目的是将dCas9 SAM组分引导至Ttr转录起始位点(TSS)上游100-200bp的区域。参见图6。Ttr指导RNA阵列表达盒从5'到3'的组分如下表6所示。每个指导RNA的结构的总体示意图,包括MS2茎环,示于图7。
表6.Ttr指导RNA阵列表达盒组分。
Figure BDA0002689802010001101
在确认靶向的mESC克隆对于dCas9 SAM表达盒为杂合且对于指导RNA阵列表达盒为杂合后,我们使用RT-qPCR来确定相对基因表达。对于Ttr,在我们的WT mESC中、包含由终止盒封闭的dCas9 SAM组分的mESC中,以及带有主动表达的dCas9 SAM等位基因(移除终止盒)的mESC中,RT-qPCR的ct值达到35。但是,在将U6 SAM Ttr指导阵列靶向到每条细胞系后,只有包含活性dCas9 SAM系统加指导表达的细胞系才显示出ct值减小为20。请参见图8A。ct值下降15意味着相对基因表达增加了2500倍。随着Ttr表达的显著增加,我们希望确保dCas9 SAM激活成分的紧密接近不会影响邻近的基因。为此,通过RT-qPCR评估Dsg2和B4galt6(Ttr每一侧的基因),并确定在上述任何细胞系中的表达均没有显著增加。分别参见图8B和8C。
为了验证该基因上调是稳定的并且可以转化为小鼠模型,将靶向克隆微注射到8细胞小鼠胚胎中以衍生出小鼠品系。具体而言,在透明带上创建一个小孔,以促进靶向mESC的注射。将这些注射的8细胞胚胎转移给代孕母体,以产生携带转基因的幼仔。在代孕母体中妊娠后,注射的胚胎产生了F0小鼠,其没有携带可检测的宿主胚胎。完全由ES细胞衍生的小鼠是正常、健康和可育的(通过种系传播)。
在从具有基因组整合的Ttr指导RNA阵列的野生型小鼠、dCas9SAM小鼠,和dCas9SAM小鼠收获的各种组织中观察到通过RT-qPCR测定的Ttr mRNA表达。这些组织中的每一个都提取了RNA。基因组DNA被降解,因此不会计入qPCR反应。逆转录RNA,然后使用对Ttr特异的测定法检测Ttr转录本。在实验中,通过RT-qPCR测定了来自每个组织的等量RNA。数据显示,Ttr表达水平在所有组织中均升高,包括一些正常情况下预计不会出现TTR的器官。参见表7。在所有检查的组织(包括肝、脾、心脏、肺、骨骼肌、睾丸、胸腺、眼、胰腺、淋巴结、肾,和脑)中,TTR蛋白的表达也升高。分别参见图9A-9L。然而,表达的相对性受组织的影响。总体而言,来自对照小鼠的组织中较低的Ttr表达与SAM系统较高的上调相关。由肺和脾脏中的循环阈值确定的Ttr mRNA表达水平分别示于图10A和10B中。在RT-qPCR中,通过荧光信号的积累检测到阳性反应。循环阈值(ct)定义为荧光信号超过背景水平所需的循环数——ct值越低表示表达越高。此外,与在mESC克隆中进行筛选一样,通过RT-qPCR评估Dsg2和B4galt6(Ttr两侧的基因),并确定其表达没有明显增加。参见例如图10C、10D、10E,和10F。
表7.相对于对照,TTR表达的增加。
Figure BDA0002689802010001121
与野生型小鼠或只表达dCas9 SAM组分的小鼠相比,对dCas9SAM组分和靶向Ttr的SAM指导RNA阵列杂合的F0小鼠显示从血清中通过ELISA检测的1000μg/mL的循环TTR增加至4000μg/mL。参见图11。
我们接下来评估了在表达靶向来自Rosa26基因座的Ttr的指导RNA的小鼠中TTR水平的增加是否稳定。使用三组小鼠:(1)F1H4(WT);(2)杂合的Rosa26-dCas9-SAM;和(3)Rosa26-dCas9-SAM:Rosa26-U6-TTR指导阵列(3个靶向Ttr的指导)。如上所述,从mESC产生这些小鼠,并且将F0代老化至一年。每月通过ELISA测量TTR的血清量,并观察动物的任何病理变化。尽管这些动物在一年内未观察到病理变化,但它们的循环TTR保持了2倍至2.5倍的增长。参见图13。这些数据表明,在表达靶向来自Rosa26基因座的Ttr的指导的小鼠中,Ttr表达和循环TTR水平稳定至少一年。
其中的dCas9 SAM组分和指导RNA阵列的表达构建体均基因组整合的系统是在小鼠的整个寿命中产生非常高的基因表达的良好系统。然而,我们还希望能够模仿表达的急剧增加。为此,我们将具有相同Ttr指导阵列的AAV引入了成年小鼠中,其对Rosa26表达的dCas9 SAM组分杂合。通过尾静脉注射将AAV(血清型8)引入靶肝细胞。我们在注射后5、19和60天通过ELISA分析了循环TTR,以确定注射是否成功。令人惊讶地,到第5天,在小鼠中循环的TTR水平从未经处理的小鼠或用表达GFP的AAV处理的对照小鼠中的1000μg/mL跃升至在AAV处理的小鼠中的7000μg/mL。到第19天,血清水平继续增加到11,000μg/mL。到第60天,血清水平仍约为8000μg/mL。参见图12。
我们接下来在注射后8个月进行该实验。如上所述,评估了三组小鼠:(1)纯合的Rosa26-dCas9-SAM(未处理);(2)纯合的Rosa26-dCas9-SAM(AAV8-GFP);(3)纯合的Rosa26-dCas9-SAM(AAV8-gTTR阵列(3个靶向TTR的指导))。这些小鼠在8周龄时被注射AAV8-GFP或AAV8-gTTR阵列,并被追踪到注射后8个月。通过ELISA在各个早期时间点测定TTR的血清量,然后每月一次测定TTR的血清量,并观察这些动物的任何病理变化。尽管这些动物在注射后8个月未观察到病理变化,但在第19天时它们的循环TTR具有11倍的最初增加,而在注射后5个月,该水平处于TTR升高了约4倍的稳定状态。参见图14。
为了追踪在体内的上调是否需要多个指导RNA,或者单指导RNA是否足够,我们从指导RNA阵列中取出每个指导RNA,并将其分别包装到AAV8中。在该实验中评估了六组小鼠:(1)纯合的Rosa26-dCas9-SAM(未处理);(2)纯合的Rosa26-dCas9-SAM(AAV8-GFP);(3)纯合的Rosa26-dCas9-SAM(AAV8-gTTR阵列(3个靶向TTR的指导));(4)纯合的Rosa26-dCas9-SAM(AAV8-gTTR#1);(5)纯合的Rosa26-dCas9-SAM(AAV8-gTTR#2);和(6)纯合的Rosa26-dCas9-SAM(AAV8-gTTR#3)。组(3)-(6)中的指导RNA表达盒的序列分别在SEQ ID NO:67-70中列出。这些小鼠在8周龄时被注射了含有AAV8的指导RNA或GFP,并被追踪到注射后8个月。通过ELISA在不同的早期时间点至3周测量TTR的血清量。结果如图15所示。注射后1周,gTTR指导阵列的循环TTR较对照组增加了6.5倍,而每个单指导RNA的血清中的循环TTR则增加了3倍。在注射后2周,gTTR指导阵列的循环TTR降低至对照组的5.5倍,而单指导中的两个的血清中的循环TTR保持为3.5倍,且gRNA#3的血清中的循环TTR跃升至几乎5倍。在注射后3周,与WT对照相比,所有gRNA的血清中的循环TTR具有增加约3.5倍的水平。这些结果表明,指导RNA阵列可以提供最初的高蛋白爆发,但随着时间的流逝,单个gRNA可以在基因上调方面同样表现出色,从而导致循环TTR蛋白。
为了继续评估整合到AAV中的单指导或多指导在Rosa26-dCas9-SAM小鼠中的基因上调中是否更成功,我们使用一种或两种指导RNA评估了肝中靶基因1的表达。注射后三周通过TAQMAN评估RNA表达。我们观察到与未经处理的纯合Rosa26-dCas9-SAM相比,所有三个组((1)纯合的Rosa26-dCas9-SAM(AAV8-靶基因1指导RNA#1)、(2)纯合Rosa26-dCas9-SAM(AAV8-靶基因1指导RNA#2)和(3)纯合Rosa26-dCas9-SAM(AAV8-靶基因1指导RNA#1&2))中的靶基因1的显著上调。与注射后3周的一个指导RNA组相比,两个指导RNA组的RNA表达显著增加。将AAV8与两个指导RNA结合使用可导致肝脏表达比未处理的多200倍,而将AAV8与一个指导RNA结合使用可以导致肝脏表达比未经处理的多100倍。参见图19。
尽管上述实验主要集中于小鼠Ttr基因的上调,但是当靶向其它基因时也观察到类似的表达增加(数据未显示)。此外,通过使用不同的血清型或通过组织特异性Cre处理来控制dCas9 SAM表达,我们可以控制基因上调的时机和组织特异性以生成强大、可靠的疾病模型。
实施例3.用Pcsk9和Ldlr指导RNA验证SAM就绪小鼠
作为该系统在体内的进一步验证,选择参与胆固醇途径的两个基因(Pcsk9和Ldlr)作为上调的靶标,并且在五周的时间过程中观察对胆固醇水平的生理作用。评估三组小鼠:(1)纯合Rosa26-dCas9-SAM(AAV8-Pcsk9指导阵列);(2)纯合Rosa26-dCas9-SAM(AAV8-Ldlr指导阵列);(3)纯合Rosa26-dCas9-SAM(未处理)。
Pcsk9指导RNA阵列的序列在SEQ ID NO:85中列出。该指导RNA阵列编码三个指导RNA。包括启动子和指导RNA编码序列的区域在SEQ ID NO:98中列出。由阵列中的指导RNA靶向的小鼠Pcsk9基因中的指导RNA靶序列(不包括PAM)在SEQID NO:89-91中列出。靶向这些指导RNA靶序列的单指导RNA分别在SEQ ID NO:92-94中列出。
Ldlr指导RNA阵列的序列在SEQ ID NO:71中列出。指导RNA阵列编码三个指导RNA。包括启动子和指导RNA编码序列的区域在SEQ ID NO:84中列出。由阵列中的指导RNA靶向的小鼠Ldlr基因中的指导RNA靶序列(不包括PAM)在SEQID NO:75-77中列出。靶向这些指导RNA靶序列的单指导RNA分别在SEQ ID NO:78-80中列出。
结果在图16A中示出。注射后两周,Rosa26-dCas9-SAM(AAV8-Pcsk9指导阵列)的胆固醇水平比注射前的胆固醇水平增加3.5倍。与此相对,Rosa26-dCas9-SAM(AAV8-Ldlr指导阵列)显示总胆固醇水平比注射前水平降低了75%。未经处理的动物保持其胆固醇。注射后5周,Rosa26-dCas9-SAM(AAV8-Pcsk9指导阵列)的胆固醇水平比注射前的胆固醇水平增加3倍。与此相对,Rosa26-dCas9-SAM(AAV8-Ldlr指导阵列)显示总胆固醇水平比注射前水平降低了50%。未经处理的动物保持其胆固醇。在LDL水平处观察到类似的效果。参见图16B。
接下来,评估了Ldlr和Pcsk9的表达。在图17A和17B中分别示出了在上述实验中,在注射后5周,小鼠肝脏中Ldlr和Pcsk9的TAQMAN表达水平。
作为进一步的验证,示出通过dCAS9-SAM系统而增加的LDLR可以带来长期利益,我们在喂养高脂饮食的纯合dCas9-SAM小鼠中评估了AAV8-Ldlr指导RNA阵列,并在注射AAV8-Ldlr指导RNA阵列后对其进行了20周的追踪。预先给小鼠放血以测定其初始胆固醇水平,然后向其饲喂高脂肪饮食(HFD)8周(每4周放血以测试胆固醇水平)。胆固醇和LDL水平的结果分别示于图18A和18B。8周后,向小鼠注射AAV8-Ldlr指导阵列或不进行处理。每月给小鼠放血,并评估其总胆固醇和LDL水平。在此时间框架内,与未经处理的、饲喂HFD的小鼠相比,经AAV8-Ldlr指导阵列处理的小鼠具有较低的总胆固醇和较低的LDL水平。
序列表
<110> 瑞泽恩制药公司
<120> 使用CRISPR/CAS系统对动物进行转录调制
<130> 57766-527578
<150> US 62/644,961
<151> 2018-03-19
<160> 98
<170> PatentIn版本3.5
<210> 1
<211> 1471
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 1
Met Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys
1 5 10 15
Lys Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Ser Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
1385 1390 1395
Gly Gly Ser Gly Pro Lys Lys Lys Arg Lys Val Ala Ala Ala Gly
1400 1405 1410
Ser Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
1415 1420 1425
Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser
1430 1435 1440
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala
1445 1450 1455
Leu Asp Asp Phe Asp Leu Asp Met Leu Ile Asn Cys Thr
1460 1465 1470
<210> 2
<211> 1384
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 2
Met Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys
1 5 10 15
Lys Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp
<210> 3
<211> 62
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 3
Ala Ala Ala Gly Ser Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu
1 5 10 15
Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
20 25 30
Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp
35 40 45
Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Ile Asn Cys Thr
50 55 60
<210> 4
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 4
Gly Gly Gly Ser
1
<210> 5
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 5
Gly Gly Gly Gly Ser
1 5
<210> 6
<211> 473
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 6
Met Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Gly Thr
1 5 10 15
Gly Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu
20 25 30
Trp Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser
35 40 45
Val Arg Gln Ser Ser Ala Gln Lys Arg Lys Tyr Thr Ile Lys Val Glu
50 55 60
Val Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val
65 70 75 80
Ala Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe
85 90 95
Ala Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu
100 105 110
Leu Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly
115 120 125
Ile Tyr Ser Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
130 135 140
Gly Gly Ser Gly Pro Lys Lys Lys Arg Lys Val Ala Ala Ala Gly Ser
145 150 155 160
Pro Ser Gly Gln Ile Ser Asn Gln Ala Leu Ala Leu Ala Pro Ser Ser
165 170 175
Ala Pro Val Leu Ala Gln Thr Met Val Pro Ser Ser Ala Met Val Pro
180 185 190
Leu Ala Gln Pro Pro Ala Pro Ala Pro Val Leu Thr Pro Gly Pro Pro
195 200 205
Gln Ser Leu Ser Ala Pro Val Pro Lys Ser Thr Gln Ala Gly Glu Gly
210 215 220
Thr Leu Ser Glu Ala Leu Leu His Leu Gln Phe Asp Ala Asp Glu Asp
225 230 235 240
Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Gly Val Phe Thr Asp
245 250 255
Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly
260 265 270
Val Ser Met Ser His Ser Thr Ala Glu Pro Met Leu Met Glu Tyr Pro
275 280 285
Glu Ala Ile Thr Arg Leu Val Thr Gly Ser Gln Arg Pro Pro Asp Pro
290 295 300
Ala Pro Thr Pro Leu Gly Thr Ser Gly Leu Pro Asn Gly Leu Ser Gly
305 310 315 320
Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu
325 330 335
Ser Gln Ile Ser Ser Ser Gly Gln Gly Gly Gly Gly Ser Gly Phe Ser
340 345 350
Val Asp Thr Ser Ala Leu Leu Asp Leu Phe Ser Pro Ser Val Thr Val
355 360 365
Pro Asp Met Ser Leu Pro Asp Leu Asp Ser Ser Leu Ala Ser Ile Gln
370 375 380
Glu Leu Leu Ser Pro Gln Glu Pro Pro Arg Pro Pro Glu Ala Glu Asn
385 390 395 400
Ser Ser Pro Asp Ser Gly Lys Gln Leu Val His Tyr Thr Ala Gln Pro
405 410 415
Leu Phe Leu Leu Asp Pro Gly Ser Val Asp Thr Gly Ser Asn Asp Leu
420 425 430
Pro Val Leu Phe Glu Leu Gly Glu Gly Ser Tyr Phe Ser Glu Gly Asp
435 440 445
Gly Phe Ala Glu Asp Pro Thr Ile Ser Leu Leu Thr Gly Ser Glu Pro
450 455 460
Pro Lys Ala Lys Asp Pro Thr Val Ser
465 470
<210> 7
<211> 130
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 7
Met Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Gly Thr
1 5 10 15
Gly Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu
20 25 30
Trp Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser
35 40 45
Val Arg Gln Ser Ser Ala Gln Lys Arg Lys Tyr Thr Ile Lys Val Glu
50 55 60
Val Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val
65 70 75 80
Ala Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe
85 90 95
Ala Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu
100 105 110
Leu Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly
115 120 125
Ile Tyr
130
<210> 8
<211> 181
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 8
Pro Ser Gly Gln Ile Ser Asn Gln Ala Leu Ala Leu Ala Pro Ser Ser
1 5 10 15
Ala Pro Val Leu Ala Gln Thr Met Val Pro Ser Ser Ala Met Val Pro
20 25 30
Leu Ala Gln Pro Pro Ala Pro Ala Pro Val Leu Thr Pro Gly Pro Pro
35 40 45
Gln Ser Leu Ser Ala Pro Val Pro Lys Ser Thr Gln Ala Gly Glu Gly
50 55 60
Thr Leu Ser Glu Ala Leu Leu His Leu Gln Phe Asp Ala Asp Glu Asp
65 70 75 80
Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Gly Val Phe Thr Asp
85 90 95
Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly
100 105 110
Val Ser Met Ser His Ser Thr Ala Glu Pro Met Leu Met Glu Tyr Pro
115 120 125
Glu Ala Ile Thr Arg Leu Val Thr Gly Ser Gln Arg Pro Pro Asp Pro
130 135 140
Ala Pro Thr Pro Leu Gly Thr Ser Gly Leu Pro Asn Gly Leu Ser Gly
145 150 155 160
Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu
165 170 175
Ser Gln Ile Ser Ser
180
<210> 9
<211> 124
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 9
Gly Phe Ser Val Asp Thr Ser Ala Leu Leu Asp Leu Phe Ser Pro Ser
1 5 10 15
Val Thr Val Pro Asp Met Ser Leu Pro Asp Leu Asp Ser Ser Leu Ala
20 25 30
Ser Ile Gln Glu Leu Leu Ser Pro Gln Glu Pro Pro Arg Pro Pro Glu
35 40 45
Ala Glu Asn Ser Ser Pro Asp Ser Gly Lys Gln Leu Val His Tyr Thr
50 55 60
Ala Gln Pro Leu Phe Leu Leu Asp Pro Gly Ser Val Asp Thr Gly Ser
65 70 75 80
Asn Asp Leu Pro Val Leu Phe Glu Leu Gly Glu Gly Ser Tyr Phe Ser
85 90 95
Glu Gly Asp Gly Phe Ala Glu Asp Pro Thr Ile Ser Leu Leu Thr Gly
100 105 110
Ser Glu Pro Pro Lys Ala Lys Asp Pro Thr Val Ser
115 120
<210> 10
<211> 16
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 10
guuuuagagc uaugcu 16
<210> 11
<211> 67
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 11
agcauagcaa guuaaaauaa ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg 60
gugcuuu 67
<210> 12
<211> 77
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 12
guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60
ggcaccgagu cggugcu 77
<210> 13
<211> 82
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 13
guuggaacca uucaaaacag cauagcaagu uaaaauaagg cuaguccguu aucaacuuga 60
aaaaguggca ccgagucggu gc 82
<210> 14
<211> 76
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 14
guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60
ggcaccgagu cggugc 76
<210> 15
<211> 86
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 15
guuuaagagc uaugcuggaa acagcauagc aaguuuaaau aaggcuaguc cguuaucaac 60
uugaaaaagu ggcaccgagu cggugc 86
<210> 16
<211> 34
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 16
ggccaacaug aggaucaccc augucugcag ggcc 34
<210> 17
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (2)..(21)
<223> n = A, T, C, 或 G
<400> 17
gnnnnnnnnn nnnnnnnnnn ngg 23
<210> 18
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(21)
<223> n = A, T, C, 或 G
<400> 18
nnnnnnnnnn nnnnnnnnnn ngg 23
<210> 19
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (3)..(23)
<223> n = A, T, C, 或 G
<400> 19
ggnnnnnnnn nnnnnnnnnn nnngg 25
<210> 20
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 20
Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro
1 5 10 15
Gly Pro
<210> 21
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 21
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly Pro
<210> 22
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 22
Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp Val Glu Ser
1 5 10 15
Asn Pro Gly Pro
20
<210> 23
<211> 22
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 23
Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val
1 5 10 15
Glu Ser Asn Pro Gly Pro
20
<210> 24
<211> 4152
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 24
atgaaaaggc cggcggccac gaaaaaggcc ggccaggcaa aaaagaaaaa ggacaagaag 60
tacagcatcg gcctggccat cggcaccaac tctgtgggct gggccgtgat caccgacgag 120
tacaaggtgc ccagcaagaa attcaaggtg ctgggcaaca ccgaccggca cagcatcaag 180
aagaacctga tcggagccct gctgttcgac agcggcgaaa cagccgaggc cacccggctg 240
aagagaaccg ccagaagaag atacaccaga cggaagaacc ggatctgcta tctgcaagag 300
atcttcagca acgagatggc caaggtggac gacagcttct tccacagact ggaagagtcc 360
ttcctggtgg aagaggataa gaagcacgag cggcacccca tcttcggcaa catcgtggac 420
gaggtggcct accacgagaa gtaccccacc atctaccacc tgagaaagaa actggtggac 480
agcaccgaca aggccgacct gcggctgatc tatctggccc tggcccacat gatcaagttc 540
cggggccact tcctgatcga gggcgacctg aaccccgaca acagcgacgt ggacaagctg 600
ttcatccagc tggtgcagac ctacaaccag ctgttcgagg aaaaccccat caacgccagc 660
ggcgtggacg ccaaggccat cctgtctgcc agactgagca agagcagacg gctggaaaat 720
ctgatcgccc agctgcccgg cgagaagaag aatggcctgt tcggcaacct gattgccctg 780
agcctgggcc tgacccccaa cttcaagagc aacttcgacc tggccgagga tgccaaactg 840
cagctgagca aggacaccta cgacgacgac ctggacaacc tgctggccca gatcggcgac 900
cagtacgccg acctgtttct ggccgccaag aacctgtccg acgccatcct gctgagcgac 960
atcctgagag tgaacaccga gatcaccaag gcccccctga gcgcctctat gatcaagaga 1020
tacgacgagc accaccagga cctgaccctg ctgaaagctc tcgtgcggca gcagctgcct 1080
gagaagtaca aagagatttt cttcgaccag agcaagaacg gctacgccgg ctacattgac 1140
ggcggagcca gccaggaaga gttctacaag ttcatcaagc ccatcctgga aaagatggac 1200
ggcaccgagg aactgctcgt gaagctgaac agagaggacc tgctgcggaa gcagcggacc 1260
ttcgacaacg gcagcatccc ccaccagatc cacctgggag agctgcacgc cattctgcgg 1320
cggcaggaag atttttaccc attcctgaag gacaaccggg aaaagatcga gaagatcctg 1380
accttccgca tcccctacta cgtgggccct ctggccaggg gaaacagcag attcgcctgg 1440
atgaccagaa agagcgagga aaccatcacc ccctggaact tcgaggaagt ggtggacaag 1500
ggcgcttccg cccagagctt catcgagcgg atgaccaact tcgataagaa cctgcccaac 1560
gagaaggtgc tgcccaagca cagcctgctg tacgagtact tcaccgtgta taacgagctg 1620
accaaagtga aatacgtgac cgagggaatg agaaagcccg ccttcctgag cggcgagcag 1680
aaaaaggcca tcgtggacct gctgttcaag accaaccgga aagtgaccgt gaagcagctg 1740
aaagaggact acttcaagaa aatcgagtgc ttcgactccg tggaaatctc cggcgtggaa 1800
gatcggttca acgcctccct gggcacatac cacgatctgc tgaaaattat caaggacaag 1860
gacttcctgg acaatgagga aaacgaggac attctggaag atatcgtgct gaccctgaca 1920
ctgtttgagg acagagagat gatcgaggaa cggctgaaaa cctatgccca cctgttcgac 1980
gacaaagtga tgaagcagct gaagcggcgg agatacaccg gctggggcag gctgagccgg 2040
aagctgatca acggcatccg ggacaagcag tccggcaaga caatcctgga tttcctgaag 2100
tccgacggct tcgccaacag aaacttcatg cagctgatcc acgacgacag cctgaccttt 2160
aaagaggaca tccagaaagc ccaggtgtcc ggccagggcg atagcctgca cgagcacatt 2220
gccaatctgg ccggcagccc cgccattaag aagggcatcc tgcagacagt gaaggtggtg 2280
gacgagctcg tgaaagtgat gggccggcac aagcccgaga acatcgtgat cgaaatggcc 2340
agagagaacc agaccaccca gaagggacag aagaacagcc gcgagagaat gaagcggatc 2400
gaagagggca tcaaagagct gggcagccag atcctgaaag aacaccccgt ggaaaacacc 2460
cagctgcaga acgagaagct gtacctgtac tacctgcaga atgggcggga tatgtacgtg 2520
gaccaggaac tggacatcaa ccggctgtcc gactacgatg tggaccacat cgtgcctcag 2580
agctttctga aggacgactc catcgacaac aaggtgctga ccagaagcga caaggcccgg 2640
ggcaagagcg acaacgtgcc ctccgaagag gtcgtgaaga agatgaagaa ctactggcgg 2700
cagctgctga acgccaagct gattacccag agaaagttcg acaatctgac caaggccgag 2760
agaggcggcc tgagcgaact ggataaggcc ggcttcatca agagacagct ggtggaaacc 2820
cggcagatca caaagcacgt ggcacagatc ctggactccc ggatgaacac taagtacgac 2880
gagaatgaca agctgatccg ggaagtgaaa gtgatcaccc tgaagtccaa gctggtgtcc 2940
gatttccgga aggatttcca gttttacaaa gtgcgcgaga tcaacaacta ccaccacgcc 3000
cacgacgcct acctgaacgc cgtcgtggga accgccctga tcaaaaagta ccctaagctg 3060
gaaagcgagt tcgtgtacgg cgactacaag gtgtacgacg tgcggaagat gatcgccaag 3120
agcgagcagg aaatcggcaa ggctaccgcc aagtacttct tctacagcaa catcatgaac 3180
tttttcaaga ccgagattac cctggccaac ggcgagatcc ggaagcggcc tctgatcgag 3240
acaaacggcg aaaccgggga gatcgtgtgg gataagggcc gggattttgc caccgtgcgg 3300
aaagtgctga gcatgcccca agtgaatatc gtgaaaaaga ccgaggtgca gacaggcggc 3360
ttcagcaaag agtctatcct gcccaagagg aacagcgata agctgatcgc cagaaagaag 3420
gactgggacc ctaagaagta cggcggcttc gacagcccca ccgtggccta ttctgtgctg 3480
gtggtggcca aagtggaaaa gggcaagtcc aagaaactga agagtgtgaa agagctgctg 3540
gggatcacca tcatggaaag aagcagcttc gagaagaatc ccatcgactt tctggaagcc 3600
aagggctaca aagaagtgaa aaaggacctg atcatcaagc tgcctaagta ctccctgttc 3660
gagctggaaa acggccggaa gagaatgctg gcctctgccg gcgaactgca gaagggaaac 3720
gaactggccc tgccctccaa atatgtgaac ttcctgtacc tggccagcca ctatgagaag 3780
ctgaagggct cccccgagga taatgagcag aaacagctgt ttgtggaaca gcacaagcac 3840
tacctggacg agatcatcga gcagatcagc gagttctcca agagagtgat cctggccgac 3900
gctaatctgg acaaagtgct gtccgcctac aacaagcacc gggataagcc catcagagag 3960
caggccgaga atatcatcca cctgtttacc ctgaccaatc tgggagcccc tgccgccttc 4020
aagtactttg acaccaccat cgaccggaag aggtacacca gcaccaaaga ggtgctggac 4080
gccaccctga tccaccagag catcaccggc ctgtacgaga cacggatcga cctgtctcag 4140
ctgggaggcg ac 4152
<210> 25
<211> 4414
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 25
atgaaaaggc cggcggccac gaaaaaggcc ggccaggcaa aaaagaaaaa ggacaagaag 60
tacagcatcg gcctggccat cggcaccaac tctgtgggct gggccgtgat caccgacgag 120
tacaaggtgc ccagcaagaa attcaaggtg ctgggcaaca ccgaccggca cagcatcaag 180
aagaacctga tcggagccct gctgttcgac agcggcgaaa cagccgaggc cacccggctg 240
aagagaaccg ccagaagaag atacaccaga cggaagaacc ggatctgcta tctgcaagag 300
atcttcagca acgagatggc caaggtggac gacagcttct tccacagact ggaagagtcc 360
ttcctggtgg aagaggataa gaagcacgag cggcacccca tcttcggcaa catcgtggac 420
gaggtggcct accacgagaa gtaccccacc atctaccacc tgagaaagaa actggtggac 480
agcaccgaca aggccgacct gcggctgatc tatctggccc tggcccacat gatcaagttc 540
cggggccact tcctgatcga gggcgacctg aaccccgaca acagcgacgt ggacaagctg 600
ttcatccagc tggtgcagac ctacaaccag ctgttcgagg aaaaccccat caacgccagc 660
ggcgtggacg ccaaggccat cctgtctgcc agactgagca agagcagacg gctggaaaat 720
ctgatcgccc agctgcccgg cgagaagaag aatggcctgt tcggcaacct gattgccctg 780
agcctgggcc tgacccccaa cttcaagagc aacttcgacc tggccgagga tgccaaactg 840
cagctgagca aggacaccta cgacgacgac ctggacaacc tgctggccca gatcggcgac 900
cagtacgccg acctgtttct ggccgccaag aacctgtccg acgccatcct gctgagcgac 960
atcctgagag tgaacaccga gatcaccaag gcccccctga gcgcctctat gatcaagaga 1020
tacgacgagc accaccagga cctgaccctg ctgaaagctc tcgtgcggca gcagctgcct 1080
gagaagtaca aagagatttt cttcgaccag agcaagaacg gctacgccgg ctacattgac 1140
ggcggagcca gccaggaaga gttctacaag ttcatcaagc ccatcctgga aaagatggac 1200
ggcaccgagg aactgctcgt gaagctgaac agagaggacc tgctgcggaa gcagcggacc 1260
ttcgacaacg gcagcatccc ccaccagatc cacctgggag agctgcacgc cattctgcgg 1320
cggcaggaag atttttaccc attcctgaag gacaaccggg aaaagatcga gaagatcctg 1380
accttccgca tcccctacta cgtgggccct ctggccaggg gaaacagcag attcgcctgg 1440
atgaccagaa agagcgagga aaccatcacc ccctggaact tcgaggaagt ggtggacaag 1500
ggcgcttccg cccagagctt catcgagcgg atgaccaact tcgataagaa cctgcccaac 1560
gagaaggtgc tgcccaagca cagcctgctg tacgagtact tcaccgtgta taacgagctg 1620
accaaagtga aatacgtgac cgagggaatg agaaagcccg ccttcctgag cggcgagcag 1680
aaaaaggcca tcgtggacct gctgttcaag accaaccgga aagtgaccgt gaagcagctg 1740
aaagaggact acttcaagaa aatcgagtgc ttcgactccg tggaaatctc cggcgtggaa 1800
gatcggttca acgcctccct gggcacatac cacgatctgc tgaaaattat caaggacaag 1860
gacttcctgg acaatgagga aaacgaggac attctggaag atatcgtgct gaccctgaca 1920
ctgtttgagg acagagagat gatcgaggaa cggctgaaaa cctatgccca cctgttcgac 1980
gacaaagtga tgaagcagct gaagcggcgg agatacaccg gctggggcag gctgagccgg 2040
aagctgatca acggcatccg ggacaagcag tccggcaaga caatcctgga tttcctgaag 2100
tccgacggct tcgccaacag aaacttcatg cagctgatcc acgacgacag cctgaccttt 2160
aaagaggaca tccagaaagc ccaggtgtcc ggccagggcg atagcctgca cgagcacatt 2220
gccaatctgg ccggcagccc cgccattaag aagggcatcc tgcagacagt gaaggtggtg 2280
gacgagctcg tgaaagtgat gggccggcac aagcccgaga acatcgtgat cgaaatggcc 2340
agagagaacc agaccaccca gaagggacag aagaacagcc gcgagagaat gaagcggatc 2400
gaagagggca tcaaagagct gggcagccag atcctgaaag aacaccccgt ggaaaacacc 2460
cagctgcaga acgagaagct gtacctgtac tacctgcaga atgggcggga tatgtacgtg 2520
gaccaggaac tggacatcaa ccggctgtcc gactacgatg tggaccacat cgtgcctcag 2580
agctttctga aggacgactc catcgacaac aaggtgctga ccagaagcga caaggcccgg 2640
ggcaagagcg acaacgtgcc ctccgaagag gtcgtgaaga agatgaagaa ctactggcgg 2700
cagctgctga acgccaagct gattacccag agaaagttcg acaatctgac caaggccgag 2760
agaggcggcc tgagcgaact ggataaggcc ggcttcatca agagacagct ggtggaaacc 2820
cggcagatca caaagcacgt ggcacagatc ctggactccc ggatgaacac taagtacgac 2880
gagaatgaca agctgatccg ggaagtgaaa gtgatcaccc tgaagtccaa gctggtgtcc 2940
gatttccgga aggatttcca gttttacaaa gtgcgcgaga tcaacaacta ccaccacgcc 3000
cacgacgcct acctgaacgc cgtcgtggga accgccctga tcaaaaagta ccctaagctg 3060
gaaagcgagt tcgtgtacgg cgactacaag gtgtacgacg tgcggaagat gatcgccaag 3120
agcgagcagg aaatcggcaa ggctaccgcc aagtacttct tctacagcaa catcatgaac 3180
tttttcaaga ccgagattac cctggccaac ggcgagatcc ggaagcggcc tctgatcgag 3240
acaaacggcg aaaccgggga gatcgtgtgg gataagggcc gggattttgc caccgtgcgg 3300
aaagtgctga gcatgcccca agtgaatatc gtgaaaaaga ccgaggtgca gacaggcggc 3360
ttcagcaaag agtctatcct gcccaagagg aacagcgata agctgatcgc cagaaagaag 3420
gactgggacc ctaagaagta cggcggcttc gacagcccca ccgtggccta ttctgtgctg 3480
gtggtggcca aagtggaaaa gggcaagtcc aagaaactga agagtgtgaa agagctgctg 3540
gggatcacca tcatggaaag aagcagcttc gagaagaatc ccatcgactt tctggaagcc 3600
aagggctaca aagaagtgaa aaaggacctg atcatcaagc tgcctaagta ctccctgttc 3660
gagctggaaa acggccggaa gagaatgctg gcctctgccg gcgaactgca gaagggaaac 3720
gaactggccc tgccctccaa atatgtgaac ttcctgtacc tggccagcca ctatgagaag 3780
ctgaagggct cccccgagga taatgagcag aaacagctgt ttgtggaaca gcacaagcac 3840
tacctggacg agatcatcga gcagatcagc gagttctcca agagagtgat cctggccgac 3900
gctaatctgg acaaagtgct gtccgcctac aacaagcacc gggataagcc catcagagag 3960
caggccgaga atatcatcca cctgtttacc ctgaccaatc tgggagcccc tgccgccttc 4020
aagtactttg acaccaccat cgaccggaag aggtacacca gcaccaaaga ggtgctggac 4080
gccaccctga tccaccagag catcaccggc ctgtacgaga cacggatcga cctgtctcag 4140
ctgggaggcg acagcgctgg aggaggtgga agcggaggag gaggaagcgg aggaggaggt 4200
agcggaccta agaaaaagag gaaggtggcg gccgctggat ccggacgggc tgacgcattg 4260
gacgattttg atctggatat gctgggaagt gacgccctcg atgattttga ccttgacatg 4320
cttggttcgg atgcccttga tgactttgac ctcgacatgc tcggcagtga cgcccttgat 4380
gatttcgacc tggacatgct gattaactgt acag 4414
<210> 26
<211> 390
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 26
atggcttcaa actttactca gttcgtgctc gtggacaatg gtgggacagg ggatgtgaca 60
gtggctcctt ctaatttcgc taatggggtg gcagagtgga tcagctccaa ctcacggagc 120
caggcctaca aggtgacatg cagcgtcagg cagtctagtg cccagaagag aaagtatacc 180
atcaaggtgg aggtccccaa agtggctacc cagacagtgg gcggagtcga actgcctgtc 240
gccgcttgga ggtcctacct gaacatggag ctcactatcc caattttcgc taccaattct 300
gactgtgaac tcatcgtgaa ggcaatgcag gggctcctca aagacggtaa tcctatccct 360
tccgccatcg ccgctaactc aggtatctac 390
<210> 27
<211> 1419
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 27
atggcttcaa actttactca gttcgtgctc gtggacaatg gtgggacagg ggatgtgaca 60
gtggctcctt ctaatttcgc taatggggtg gcagagtgga tcagctccaa ctcacggagc 120
caggcctaca aggtgacatg cagcgtcagg cagtctagtg cccagaagag aaagtatacc 180
atcaaggtgg aggtccccaa agtggctacc cagacagtgg gcggagtcga actgcctgtc 240
gccgcttgga ggtcctacct gaacatggag ctcactatcc caattttcgc taccaattct 300
gactgtgaac tcatcgtgaa ggcaatgcag gggctcctca aagacggtaa tcctatccct 360
tccgccatcg ccgctaactc aggtatctac agcgctggag gaggtggaag cggaggagga 420
ggaagcggag gaggaggtag cggacctaag aaaaagagga aggtggcggc cgctggatcc 480
ccttcagggc agatcagcaa ccaggccctg gctctggccc ctagctccgc tccagtgctg 540
gcccagacta tggtgccctc tagtgctatg gtgcctctgg cccagccacc tgctccagcc 600
cctgtgctga ccccaggacc accccagtca ctgagcgctc cagtgcccaa gtctacacag 660
gccggcgagg ggactctgag tgaagctctg ctgcacctgc agttcgacgc tgatgaggac 720
ctgggagctc tgctggggaa cagcaccgat cccggagtgt tcacagatct ggcctccgtg 780
gacaactctg agtttcagca gctgctgaat cagggcgtgt ccatgtctca tagtacagcc 840
gaaccaatgc tgatggagta ccccgaagcc attacccggc tggtgaccgg cagccagcgg 900
ccccccgacc ccgctccaac tcccctggga accagcggcc tgcctaatgg gctgtccgga 960
gatgaagact tctcaagcat cgctgatatg gactttagtg ccctgctgtc acagatttcc 1020
tctagtgggc agggaggagg tggaagcggc ttcagcgtgg acaccagtgc cctgctggac 1080
ctgttcagcc cctcggtgac cgtgcccgac atgagcctgc ctgaccttga cagcagcctg 1140
gccagtatcc aagagctcct gtctccccag gagcccccca ggcctcccga ggcagagaac 1200
agcagcccgg attcagggaa gcagctggtg cactacacag cgcagccgct gttcctgctg 1260
gaccccggct ccgtggacac cgggagcaac gacctgccgg tgctgtttga gctgggagag 1320
ggctcctact tctccgaagg ggacggcttc gccgaggacc ccaccatctc cctgctgaca 1380
ggctcggagc ctcccaaagc caaggacccc actgtctcc 1419
<210> 28
<211> 187
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 28
gcggccgctg gatccggacg ggctgacgca ttggacgatt ttgatctgga tatgctggga 60
agtgacgccc tcgatgattt tgaccttgac atgcttggtt cggatgccct tgatgacttt 120
gacctcgaca tgctcggcag tgacgccctt gatgatttcg acctggacat gctgattaac 180
tgtacag 187
<210> 29
<211> 543
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 29
ccttcagggc agatcagcaa ccaggccctg gctctggccc ctagctccgc tccagtgctg 60
gcccagacta tggtgccctc tagtgctatg gtgcctctgg cccagccacc tgctccagcc 120
cctgtgctga ccccaggacc accccagtca ctgagcgctc cagtgcccaa gtctacacag 180
gccggcgagg ggactctgag tgaagctctg ctgcacctgc agttcgacgc tgatgaggac 240
ctgggagctc tgctggggaa cagcaccgat cccggagtgt tcacagatct ggcctccgtg 300
gacaactctg agtttcagca gctgctgaat cagggcgtgt ccatgtctca tagtacagcc 360
gaaccaatgc tgatggagta ccccgaagcc attacccggc tggtgaccgg cagccagcgg 420
ccccccgacc ccgctccaac tcccctggga accagcggcc tgcctaatgg gctgtccgga 480
gatgaagact tctcaagcat cgctgatatg gactttagtg ccctgctgtc acagatttcc 540
tct 543
<210> 30
<211> 372
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 30
ggcttcagcg tggacaccag tgccctgctg gacctgttca gcccctcggt gaccgtgccc 60
gacatgagcc tgcctgacct tgacagcagc ctggccagta tccaagagct cctgtctccc 120
caggagcccc ccaggcctcc cgaggcagag aacagcagcc cggattcagg gaagcagctg 180
gtgcactaca cagcgcagcc gctgttcctg ctggaccccg gctccgtgga caccgggagc 240
aacgacctgc cggtgctgtt tgagctggga gagggctcct acttctccga aggggacggc 300
ttcgccgagg accccaccat ctccctgctg acaggctcgg agcctcccaa agccaaggac 360
cccactgtct cc 372
<210> 31
<211> 9043
<212> DNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(34)
<223> 第一loxP位点
<220>
<221> misc_feature
<222> (125)..(928)
<223> 编码对新霉素家族抗生素具有抗性的新霉素磷酸转移酶的序列
<220>
<221> misc_feature
<222> (937)..(2190)
<223> 多腺苷酸化信号
<220>
<221> misc_feature
<222> (2218)..(2251)
<223> 第二loxP 位点
<220>
<221> misc_feature
<222> (2306)..(6457)
<223> 密码子优化的dCas9编码序列
<220>
<221> misc_feature
<222> (2309)..(2356)
<223> 第一NLS
<220>
<221> misc_feature
<222> (6512)..(6532)
<223> 第二NLS
<220>
<221> misc_feature
<222> (6533)..(6719)
<223> VP64
<220>
<221> misc_feature
<222> (6719)..(6781)
<223> 带有5’ GSG的T2A
<220>
<221> misc_feature
<222> (6782)..(7171)
<223> MCP
<220>
<221> misc_feature
<222> (7226)..(7246)
<223> 第三NLS
<220>
<221> misc_feature
<222> (7262)..(7804)
<223> p65
<220>
<221> misc_feature
<222> (7829)..(8200)
<223> HSF1
<220>
<221> misc_feature
<222> (8224)..(8820)
<223> 土拨鼠肝炎病毒转录后调控元件(WPRE)
<400> 31
ataacttcgt ataatgtatg ctatacgaag ttattaggtc cctcgacctg caggaattgt 60
tgacaattaa tcatcggcat agtatatcgg catagtataa tacgacaagg tgaggaacta 120
aaccatggga tcggccattg aacaagatgg attgcacgca ggttctccgg ccgcttgggt 180
ggagaggcta ttcggctatg actgggcaca acagacaatc ggctgctctg atgccgccgt 240
gttccggctg tcagcgcagg ggcgcccggt tctttttgtc aagaccgacc tgtccggtgc 300
cctgaatgaa ctgcaggacg aggcagcgcg gctatcgtgg ctggccacga cgggcgttcc 360
ttgcgcagct gtgctcgacg ttgtcactga agcgggaagg gactggctgc tattgggcga 420
agtgccgggg caggatctcc tgtcatctca ccttgctcct gccgagaaag tatccatcat 480
ggctgatgca atgcggcggc tgcatacgct tgatccggct acctgcccat tcgaccacca 540
agcgaaacat cgcatcgagc gagcacgtac tcggatggaa gccggtcttg tcgatcagga 600
tgatctggac gaagagcatc aggggctcgc gccagccgaa ctgttcgcca ggctcaaggc 660
gcgcatgccc gacggcgatg atctcgtcgt gacccatggc gatgcctgct tgccgaatat 720
catggtggaa aatggccgct tttctggatt catcgactgt ggccggctgg gtgtggcgga 780
ccgctatcag gacatagcgt tggctacccg tgatattgct gaagagcttg gcggcgaatg 840
ggctgaccgc ttcctcgtgc tttacggtat cgccgctccc gattcgcagc gcatcgcctt 900
ctatcgcctt cttgacgagt tcttctgagg ggatccgctg taagtctgca gaaattgatg 960
atctattaaa caataaagat gtccactaaa atggaagttt ttcctgtcat actttgttaa 1020
gaagggtgag aacagagtac ctacattttg aatggaagga ttggagctac gggggtgggg 1080
gtggggtggg attagataaa tgcctgctct ttactgaagg ctctttacta ttgctttatg 1140
ataatgtttc atagttggat atcataattt aaacaagcaa aaccaaatta agggccagct 1200
cattcctccc actcatgatc tatagatcta tagatctctc gtgggatcat tgtttttctc 1260
ttgattccca ctttgtggtt ctaagtactg tggtttccaa atgtgtcagt ttcatagcct 1320
gaagaacgag atcagcagcc tctgttccac atacacttca ttctcagtat tgttttgcca 1380
agttctaatt ccatcagaag cttgcagatc tgcgactcta gaggatctgc gactctagag 1440
gatcataatc agccatacca catttgtaga ggttttactt gctttaaaaa acctcccaca 1500
cctccccctg aacctgaaac ataaaatgaa tgcaattgtt gttgttaact tgtttattgc 1560
agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 1620
ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctggat 1680
ctgcgactct agaggatcat aatcagccat accacatttg tagaggtttt acttgcttta 1740
aaaaacctcc cacacctccc cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt 1800
aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 1860
aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct 1920
tatcatgtct ggatctgcga ctctagagga tcataatcag ccataccaca tttgtagagg 1980
ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat aaaatgaatg 2040
caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa agcaatagca 2100
tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac 2160
tcatcaatgt atcttatcat gtctggatcc ccatcaagct gatccggaac ccttaatata 2220
acttcgtata atgtatgcta tacgaagtta ttaggtccct cgacctgcag cccaagctag 2280
tgcccgggaa ttcgctaggg ccaccatgaa aaggccggcg gccacgaaaa aggccggcca 2340
ggcaaaaaag aaaaaggaca agaagtacag catcggcctg gccatcggca ccaactctgt 2400
gggctgggcc gtgatcaccg acgagtacaa ggtgcccagc aagaaattca aggtgctggg 2460
caacaccgac cggcacagca tcaagaagaa cctgatcgga gccctgctgt tcgacagcgg 2520
cgaaacagcc gaggccaccc ggctgaagag aaccgccaga agaagataca ccagacggaa 2580
gaaccggatc tgctatctgc aagagatctt cagcaacgag atggccaagg tggacgacag 2640
cttcttccac agactggaag agtccttcct ggtggaagag gataagaagc acgagcggca 2700
ccccatcttc ggcaacatcg tggacgaggt ggcctaccac gagaagtacc ccaccatcta 2760
ccacctgaga aagaaactgg tggacagcac cgacaaggcc gacctgcggc tgatctatct 2820
ggccctggcc cacatgatca agttccgggg ccacttcctg atcgagggcg acctgaaccc 2880
cgacaacagc gacgtggaca agctgttcat ccagctggtg cagacctaca accagctgtt 2940
cgaggaaaac cccatcaacg ccagcggcgt ggacgccaag gccatcctgt ctgccagact 3000
gagcaagagc agacggctgg aaaatctgat cgcccagctg cccggcgaga agaagaatgg 3060
cctgttcggc aacctgattg ccctgagcct gggcctgacc cccaacttca agagcaactt 3120
cgacctggcc gaggatgcca aactgcagct gagcaaggac acctacgacg acgacctgga 3180
caacctgctg gcccagatcg gcgaccagta cgccgacctg tttctggccg ccaagaacct 3240
gtccgacgcc atcctgctga gcgacatcct gagagtgaac accgagatca ccaaggcccc 3300
cctgagcgcc tctatgatca agagatacga cgagcaccac caggacctga ccctgctgaa 3360
agctctcgtg cggcagcagc tgcctgagaa gtacaaagag attttcttcg accagagcaa 3420
gaacggctac gccggctaca ttgacggcgg agccagccag gaagagttct acaagttcat 3480
caagcccatc ctggaaaaga tggacggcac cgaggaactg ctcgtgaagc tgaacagaga 3540
ggacctgctg cggaagcagc ggaccttcga caacggcagc atcccccacc agatccacct 3600
gggagagctg cacgccattc tgcggcggca ggaagatttt tacccattcc tgaaggacaa 3660
ccgggaaaag atcgagaaga tcctgacctt ccgcatcccc tactacgtgg gccctctggc 3720
caggggaaac agcagattcg cctggatgac cagaaagagc gaggaaacca tcaccccctg 3780
gaacttcgag gaagtggtgg acaagggcgc ttccgcccag agcttcatcg agcggatgac 3840
caacttcgat aagaacctgc ccaacgagaa ggtgctgccc aagcacagcc tgctgtacga 3900
gtacttcacc gtgtataacg agctgaccaa agtgaaatac gtgaccgagg gaatgagaaa 3960
gcccgccttc ctgagcggcg agcagaaaaa ggccatcgtg gacctgctgt tcaagaccaa 4020
ccggaaagtg accgtgaagc agctgaaaga ggactacttc aagaaaatcg agtgcttcga 4080
ctccgtggaa atctccggcg tggaagatcg gttcaacgcc tccctgggca cataccacga 4140
tctgctgaaa attatcaagg acaaggactt cctggacaat gaggaaaacg aggacattct 4200
ggaagatatc gtgctgaccc tgacactgtt tgaggacaga gagatgatcg aggaacggct 4260
gaaaacctat gcccacctgt tcgacgacaa agtgatgaag cagctgaagc ggcggagata 4320
caccggctgg ggcaggctga gccggaagct gatcaacggc atccgggaca agcagtccgg 4380
caagacaatc ctggatttcc tgaagtccga cggcttcgcc aacagaaact tcatgcagct 4440
gatccacgac gacagcctga cctttaaaga ggacatccag aaagcccagg tgtccggcca 4500
gggcgatagc ctgcacgagc acattgccaa tctggccggc agccccgcca ttaagaaggg 4560
catcctgcag acagtgaagg tggtggacga gctcgtgaaa gtgatgggcc ggcacaagcc 4620
cgagaacatc gtgatcgaaa tggccagaga gaaccagacc acccagaagg gacagaagaa 4680
cagccgcgag agaatgaagc ggatcgaaga gggcatcaaa gagctgggca gccagatcct 4740
gaaagaacac cccgtggaaa acacccagct gcagaacgag aagctgtacc tgtactacct 4800
gcagaatggg cgggatatgt acgtggacca ggaactggac atcaaccggc tgtccgacta 4860
cgatgtggac cacatcgtgc ctcagagctt tctgaaggac gactccatcg acaacaaggt 4920
gctgaccaga agcgacaagg cccggggcaa gagcgacaac gtgccctccg aagaggtcgt 4980
gaagaagatg aagaactact ggcggcagct gctgaacgcc aagctgatta cccagagaaa 5040
gttcgacaat ctgaccaagg ccgagagagg cggcctgagc gaactggata aggccggctt 5100
catcaagaga cagctggtgg aaacccggca gatcacaaag cacgtggcac agatcctgga 5160
ctcccggatg aacactaagt acgacgagaa tgacaagctg atccgggaag tgaaagtgat 5220
caccctgaag tccaagctgg tgtccgattt ccggaaggat ttccagtttt acaaagtgcg 5280
cgagatcaac aactaccacc acgcccacga cgcctacctg aacgccgtcg tgggaaccgc 5340
cctgatcaaa aagtacccta agctggaaag cgagttcgtg tacggcgact acaaggtgta 5400
cgacgtgcgg aagatgatcg ccaagagcga gcaggaaatc ggcaaggcta ccgccaagta 5460
cttcttctac agcaacatca tgaacttttt caagaccgag attaccctgg ccaacggcga 5520
gatccggaag cggcctctga tcgagacaaa cggcgaaacc ggggagatcg tgtgggataa 5580
gggccgggat tttgccaccg tgcggaaagt gctgagcatg ccccaagtga atatcgtgaa 5640
aaagaccgag gtgcagacag gcggcttcag caaagagtct atcctgccca agaggaacag 5700
cgataagctg atcgccagaa agaaggactg ggaccctaag aagtacggcg gcttcgacag 5760
ccccaccgtg gcctattctg tgctggtggt ggccaaagtg gaaaagggca agtccaagaa 5820
actgaagagt gtgaaagagc tgctggggat caccatcatg gaaagaagca gcttcgagaa 5880
gaatcccatc gactttctgg aagccaaggg ctacaaagaa gtgaaaaagg acctgatcat 5940
caagctgcct aagtactccc tgttcgagct ggaaaacggc cggaagagaa tgctggcctc 6000
tgccggcgaa ctgcagaagg gaaacgaact ggccctgccc tccaaatatg tgaacttcct 6060
gtacctggcc agccactatg agaagctgaa gggctccccc gaggataatg agcagaaaca 6120
gctgtttgtg gaacagcaca agcactacct ggacgagatc atcgagcaga tcagcgagtt 6180
ctccaagaga gtgatcctgg ccgacgctaa tctggacaaa gtgctgtccg cctacaacaa 6240
gcaccgggat aagcccatca gagagcaggc cgagaatatc atccacctgt ttaccctgac 6300
caatctggga gcccctgccg ccttcaagta ctttgacacc accatcgacc ggaagaggta 6360
caccagcacc aaagaggtgc tggacgccac cctgatccac cagagcatca ccggcctgta 6420
cgagacacgg atcgacctgt ctcagctggg aggcgacagc gctggaggag gtggaagcgg 6480
aggaggagga agcggaggag gaggtagcgg acctaagaaa aagaggaagg tggcggccgc 6540
tggatccgga cgggctgacg cattggacga ttttgatctg gatatgctgg gaagtgacgc 6600
cctcgatgat tttgaccttg acatgcttgg ttcggatgcc cttgatgact ttgacctcga 6660
catgctcggc agtgacgccc ttgatgattt cgacctggac atgctgatta actgtacagg 6720
cagtggagag ggcagaggaa gtctgctaac atgcggtgac gtcgaggaga atcctggccc 6780
aatggcttca aactttactc agttcgtgct cgtggacaat ggtgggacag gggatgtgac 6840
agtggctcct tctaatttcg ctaatggggt ggcagagtgg atcagctcca actcacggag 6900
ccaggcctac aaggtgacat gcagcgtcag gcagtctagt gcccagaaga gaaagtatac 6960
catcaaggtg gaggtcccca aagtggctac ccagacagtg ggcggagtcg aactgcctgt 7020
cgccgcttgg aggtcctacc tgaacatgga gctcactatc ccaattttcg ctaccaattc 7080
tgactgtgaa ctcatcgtga aggcaatgca ggggctcctc aaagacggta atcctatccc 7140
ttccgccatc gccgctaact caggtatcta cagcgctgga ggaggtggaa gcggaggagg 7200
aggaagcgga ggaggaggta gcggacctaa gaaaaagagg aaggtggcgg ccgctggatc 7260
cccttcaggg cagatcagca accaggccct ggctctggcc cctagctccg ctccagtgct 7320
ggcccagact atggtgccct ctagtgctat ggtgcctctg gcccagccac ctgctccagc 7380
ccctgtgctg accccaggac caccccagtc actgagcgct ccagtgccca agtctacaca 7440
ggccggcgag gggactctga gtgaagctct gctgcacctg cagttcgacg ctgatgagga 7500
cctgggagct ctgctgggga acagcaccga tcccggagtg ttcacagatc tggcctccgt 7560
ggacaactct gagtttcagc agctgctgaa tcagggcgtg tccatgtctc atagtacagc 7620
cgaaccaatg ctgatggagt accccgaagc cattacccgg ctggtgaccg gcagccagcg 7680
gccccccgac cccgctccaa ctcccctggg aaccagcggc ctgcctaatg ggctgtccgg 7740
agatgaagac ttctcaagca tcgctgatat ggactttagt gccctgctgt cacagatttc 7800
ctctagtggg cagggaggag gtggaagcgg cttcagcgtg gacaccagtg ccctgctgga 7860
cctgttcagc ccctcggtga ccgtgcccga catgagcctg cctgaccttg acagcagcct 7920
ggccagtatc caagagctcc tgtctcccca ggagcccccc aggcctcccg aggcagagaa 7980
cagcagcccg gattcaggga agcagctggt gcactacaca gcgcagccgc tgttcctgct 8040
ggaccccggc tccgtggaca ccgggagcaa cgacctgccg gtgctgtttg agctgggaga 8100
gggctcctac ttctccgaag gggacggctt cgccgaggac cccaccatct ccctgctgac 8160
aggctcggag cctcccaaag ccaaggaccc cactgtctcc tgagaattcg atatcaagct 8220
tatcgataat caacctctgg attacaaaat ttgtgaaaga ttgactggta ttcttaacta 8280
tgttgctcct tttacgctat gtggatacgc tgctttaatg cctttgtatc atgctattgc 8340
ttcccgtatg gctttcattt tctcctcctt gtataaatcc tggttgctgt ctctttatga 8400
ggagttgtgg cccgttgtca ggcaacgtgg cgtggtgtgc actgtgtttg ctgacgcaac 8460
ccccactggt tggggcattg ccaccacctg tcagctcctt tccgggactt tcgctttccc 8520
cctccctatt gccacggcgg aactcatcgc cgcctgcctt gcccgctgct ggacaggggc 8580
tcggctgttg ggcactgaca attccgtggt gttgtcgggg aaatcatcgt cctttccttg 8640
gctgctcgcc tgtgttgcca cctggattct gcgcgggacg tccttctgct acgtcccttc 8700
ggccctcaat ccagcggacc ttccttcccg cggcctgctg ccggctctgc ggcctcttcc 8760
gcgtcttcgc cttcgccctc agacgagtcg gatctccctt tgggccgcct ccccgcatcg 8820
ataccgtcga cctcgacctc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 8880
tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 8940
gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 9000
caggacagca agggggagga ttgggaagac aatggcaggc atg 9043
<210> 32
<211> 3812
<212> DNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(32)
<223> 第一rox位点
<220>
<221> misc_feature
<222> (111)..(710)
<223> 编码嘌呤霉素-N-乙酰基转移酶以对嘌呤霉素家族抗生素具有抗性的序列
<220>
<221> misc_feature
<222> (797)..(2338)
<223> 多腺苷酸化信号
<220>
<221> misc_feature
<222> (2363)..(2394)
<223> 第二rox位点
<220>
<221> misc_feature
<222> (2401)..(2640)
<223> 第一U6启动子
<220>
<221> misc_feature
<222> (2641)..(2797)
<223> 第一指导RNA编码序列
<220>
<221> misc_feature
<222> (2641)..(2660)
<223> n = A, T, C, 或 G
<220>
<221> misc_feature
<222> (2883)..(3122)
<223> 第二U6启动子
<220>
<221> misc_feature
<222> (3123)..(3279)
<223> 第二指导RNA编码序列
<220>
<221> misc_feature
<222> (3123)..(3142)
<223> n = A, T, C, 或 G
<220>
<221> misc_feature
<222> (3364)..(3603)
<223> 第三U6启动子
<220>
<221> misc_feature
<222> (3604)..(3760)
<223> 第三指导RNA编码序列
<220>
<221> misc_feature
<222> (3604)..(3623)
<223> n = A, T, C, 或 G
<400> 32
taactttaaa taatgccaat tatttaaagt tacctgcagg acgtgttgac aattaatcat 60
cggcatagta tatcggcata gtataatacg acaaggtgag gaactaaacc atgaccgagt 120
acaagcccac ggtgcgcctc gccacccgcg acgacgtccc cagggccgta cgcaccctcg 180
ccgccgcgtt cgccgactac cccgccacgc gccacaccgt cgatccggac cgccacatcg 240
agcgggtcac cgagctgcaa gaactcttcc tcacgcgcgt cgggctcgac atcggcaagg 300
tgtgggtcgc ggacgacggc gccgcggtgg cggtctggac cacgccggag agcgtcgaag 360
cgggggcggt gttcgccgag atcggcccgc gcatggccga gttgagcggt tcccggctgg 420
ccgcgcagca acagatggaa ggcctcctgg cgccgcaccg gcccaaggag cccgcgtggt 480
tcctggccac cgtcggcgtc tcgcccgacc accagggcaa gggtctgggc agcgccgtcg 540
tgctccccgg agtggaggcg gccgagcgcg ccggggtgcc cgccttcctg gagacctccg 600
cgccccgcaa cctccccttc tacgagcggc tcggcttcac cgtcaccgcc gacgtcgagg 660
tgcccgaagg accgcgcacc tggtgcatga cccgcaagcc cggtgcctga cgcccgcccc 720
acgacccgca gcgcccgacc gaaaggagcg cacgacccca tgcatcgatg atctagagct 780
cgctgatcag cctcgactgt gccttctagt tgccagccat ctgttgtttg cccctccccc 840
gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa 900
attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac 960
agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt gggctctatg 1020
gcataacttc gtataatgta tgctatacgg gggatccgct gtaagtctgc agaaattgat 1080
gatctattaa acaataaaga tgtccactaa aatggaagtt tttcctgtca tactttgtta 1140
agaagggtga gaacagagta cctacatttt gaatggaagg attggagcta cgggggtggg 1200
ggtggggtgg gattagataa atgcctgctc tttactgaag gctctttact attgctttat 1260
gataatgttt catagttgga tatcataatt taaacaagca aaaccaaatt aagggccagc 1320
tcattcctcc cactcatgat ctatagatct atagatctct cgtgggatca ttgtttttct 1380
cttgattccc actttgtggt tctaagtact gtggtttcca aatgtgtcag tttcatagcc 1440
tgaagaacga gatcagcagc ctctgttcca catacacttc attctcagta ttgttttgcc 1500
aagttctaat tccatcagac ctcgacctgc agccgacgct aggtcgtcag tcaaagtacg 1560
tacctcaggt gcaggctgcc tatcagaagg tggtggctgg tgtggccaat gccctggctc 1620
acaaatacca ctgagatctt tttccctctg ccaaaaatta tggggacatc atgaagcccc 1680
ttgagcatct gacttctggc taataaagga aatttatttt cattgcaata gtgtgttgga 1740
attttttgtg tctctcactc ggaaggacat atgggagggc aaatcattta aaacatcaga 1800
atgagtattt ggtttagagt ttggcaacat atgcccatat gctggctgcc atgaacaaag 1860
gttggctata aagaggtcat cagtatatga aacagccccc tgctgtccat tccttattcc 1920
atagaaaagc cttgacttga ggttagattt tttttatatt ttgttttgtg ttattttttt 1980
ctttaacatc cctaaaattt tccttagatg ttttactagc cagatttttc ctcctctcct 2040
gactactccc agtcatagct gtccctcttc tcttatggag atccctcgag gacatgaggt 2100
cgtcgctgta atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc 2160
acacctcccc ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat 2220
tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt 2280
tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtcga 2340
cactgggtcg tgatcgggta cctaacttta aataatgcca attatttaaa gttagctagc 2400
tttcccatga ttccttcata tttgcatata cgatacaagg ctgttagaga gataattgga 2460
attaatttga ctgtaaacac aaagatatta gtacaaaata cgtgacgtag aaagtaataa 2520
tttcttgggt agtttgcagt tttaaaatta tgttttaaaa tggactatca tatgcttacc 2580
gtaacttgaa agtatttcga tttcttggct ttatatatct tgtggaaagg acgaaacacc 2640
nnnnnnnnnn nnnnnnnnnn gttttagagc taggccaaca tgaggatcac ccatgtctgc 2700
agggcctagc aagttaaaat aaggctagtc cgttatcaac ttggccaaca tgaggatcac 2760
ccatgtctgc agggccaagt ggcaccgagt cggtgctttt tttgttttag agctagaaat 2820
agcaagttaa aataaggcta gtccgttttg agctccataa gactcggcct tagaacaagc 2880
tttttcccat gattccttca tatttgcata tacgatacaa ggctgttaga gagataattg 2940
gaattaattt gactgtaaac acaaagatat tagtacaaaa tacgtgacgt agaaagtaat 3000
aatttcttgg gtagtttgca gttttaaaat tatgttttaa aatggactat catatgctta 3060
ccgtaacttg aaagtatttc gatttcttgg ctttatatat cttgtggaaa ggacgaaaca 3120
ccnnnnnnnn nnnnnnnnnn nngttttaga gctaggccaa catgaggatc acccatgtct 3180
gcagggccta gcaagttaaa ataaggctag tccgttatca acttggccaa catgaggatc 3240
acccatgtct gcagggccaa gtggcaccga gtcggtgctt tttttgtttt agagctagaa 3300
atagcaagtt aaaataaggc tagtccgttt tatgcatgtg gctcccattt atacctggcc 3360
ggctttccca tgattccttc atatttgcat atacgataca aggctgttag agagataatt 3420
ggaattaatt tgactgtaaa cacaaagata ttagtacaaa atacgtgacg tagaaagtaa 3480
taatttcttg ggtagtttgc agttttaaaa ttatgtttta aaatggacta tcatatgctt 3540
accgtaactt gaaagtattt cgatttcttg gctttatata tcttgtggaa aggacgaaac 3600
accnnnnnnn nnnnnnnnnn nnngttttag agctaggcca acatgaggat cacccatgtc 3660
tgcagggcct agcaagttaa aataaggcta gtccgttatc aacttggcca acatgaggat 3720
cacccatgtc tgcagggcca agtggcaccg agtcggtgct ttttttgttt tagagctaga 3780
aatagcaagt taaaataagg ctagtccgtt tt 3812
<210> 33
<211> 3814
<212> DNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(32)
<223> 第一rox位点
<220>
<221> misc_feature
<222> (111)..(710)
<223> 编码嘌呤霉素-N-乙酰基转移酶以对嘌呤霉素家族抗生素具有抗性的序列
<220>
<221> misc_feature
<222> (797)..(2338)
<223> 多腺苷酸化信号
<220>
<221> misc_feature
<222> (2363)..(2394)
<223> 第二rox位点
<220>
<221> misc_feature
<222> (2401)..(2640)
<223> 第一U6启动子
<220>
<221> misc_feature
<222> (2642)..(2798)
<223> 第一Ttr指导RNA编码序列
<220>
<221> misc_feature
<222> (2884)..(3123)
<223> 第二U6启动子
<220>
<221> misc_feature
<222> (3125)..(3281)
<223> 第二Ttr指导RNA编码序列
<220>
<221> misc_feature
<222> (3366)..(3605)
<223> 第三U6启动子
<220>
<221> misc_feature
<222> (3606)..(3762)
<223> 第三Ttr指导RNA编码序列
<400> 33
taactttaaa taatgccaat tatttaaagt tacctgcagg acgtgttgac aattaatcat 60
cggcatagta tatcggcata gtataatacg acaaggtgag gaactaaacc atgaccgagt 120
acaagcccac ggtgcgcctc gccacccgcg acgacgtccc cagggccgta cgcaccctcg 180
ccgccgcgtt cgccgactac cccgccacgc gccacaccgt cgatccggac cgccacatcg 240
agcgggtcac cgagctgcaa gaactcttcc tcacgcgcgt cgggctcgac atcggcaagg 300
tgtgggtcgc ggacgacggc gccgcggtgg cggtctggac cacgccggag agcgtcgaag 360
cgggggcggt gttcgccgag atcggcccgc gcatggccga gttgagcggt tcccggctgg 420
ccgcgcagca acagatggaa ggcctcctgg cgccgcaccg gcccaaggag cccgcgtggt 480
tcctggccac cgtcggcgtc tcgcccgacc accagggcaa gggtctgggc agcgccgtcg 540
tgctccccgg agtggaggcg gccgagcgcg ccggggtgcc cgccttcctg gagacctccg 600
cgccccgcaa cctccccttc tacgagcggc tcggcttcac cgtcaccgcc gacgtcgagg 660
tgcccgaagg accgcgcacc tggtgcatga cccgcaagcc cggtgcctga cgcccgcccc 720
acgacccgca gcgcccgacc gaaaggagcg cacgacccca tgcatcgatg atctagagct 780
cgctgatcag cctcgactgt gccttctagt tgccagccat ctgttgtttg cccctccccc 840
gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa 900
attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac 960
agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt gggctctatg 1020
gcataacttc gtataatgta tgctatacgg gggatccgct gtaagtctgc agaaattgat 1080
gatctattaa acaataaaga tgtccactaa aatggaagtt tttcctgtca tactttgtta 1140
agaagggtga gaacagagta cctacatttt gaatggaagg attggagcta cgggggtggg 1200
ggtggggtgg gattagataa atgcctgctc tttactgaag gctctttact attgctttat 1260
gataatgttt catagttgga tatcataatt taaacaagca aaaccaaatt aagggccagc 1320
tcattcctcc cactcatgat ctatagatct atagatctct cgtgggatca ttgtttttct 1380
cttgattccc actttgtggt tctaagtact gtggtttcca aatgtgtcag tttcatagcc 1440
tgaagaacga gatcagcagc ctctgttcca catacacttc attctcagta ttgttttgcc 1500
aagttctaat tccatcagac ctcgacctgc agccgacgct aggtcgtcag tcaaagtacg 1560
tacctcaggt gcaggctgcc tatcagaagg tggtggctgg tgtggccaat gccctggctc 1620
acaaatacca ctgagatctt tttccctctg ccaaaaatta tggggacatc atgaagcccc 1680
ttgagcatct gacttctggc taataaagga aatttatttt cattgcaata gtgtgttgga 1740
attttttgtg tctctcactc ggaaggacat atgggagggc aaatcattta aaacatcaga 1800
atgagtattt ggtttagagt ttggcaacat atgcccatat gctggctgcc atgaacaaag 1860
gttggctata aagaggtcat cagtatatga aacagccccc tgctgtccat tccttattcc 1920
atagaaaagc cttgacttga ggttagattt tttttatatt ttgttttgtg ttattttttt 1980
ctttaacatc cctaaaattt tccttagatg ttttactagc cagatttttc ctcctctcct 2040
gactactccc agtcatagct gtccctcttc tcttatggag atccctcgag gacatgaggt 2100
cgtcgctgta atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc 2160
acacctcccc ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat 2220
tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt 2280
tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtcga 2340
cactgggtcg tgatcgggta cctaacttta aataatgcca attatttaaa gttagctagc 2400
tttcccatga ttccttcata tttgcatata cgatacaagg ctgttagaga gataattgga 2460
attaatttga ctgtaaacac aaagatatta gtacaaaata cgtgacgtag aaagtaataa 2520
tttcttgggt agtttgcagt tttaaaatta tgttttaaaa tggactatca tatgcttacc 2580
gtaacttgaa agtatttcga tttcttggct ttatatatct tgtggaaagg acgaaacacc 2640
gacggttgcc ctctttccca agttttagag ctaggccaac atgaggatca cccatgtctg 2700
cagggcctag caagttaaaa taaggctagt ccgttatcaa cttggccaac atgaggatca 2760
cccatgtctg cagggccaag tggcaccgag tcggtgcttt ttttgtttta gagctagaaa 2820
tagcaagtta aaataaggct agtccgtttt gagctccata agactcggcc ttagaacaag 2880
ctttttccca tgattccttc atatttgcat atacgataca aggctgttag agagataatt 2940
ggaattaatt tgactgtaaa cacaaagata ttagtacaaa atacgtgacg tagaaagtaa 3000
taatttcttg ggtagtttgc agttttaaaa ttatgtttta aaatggacta tcatatgctt 3060
accgtaactt gaaagtattt cgatttcttg gctttatata tcttgtggaa aggacgaaac 3120
accgactgtc agactcaaag gtgcgtttta gagctaggcc aacatgagga tcacccatgt 3180
ctgcagggcc tagcaagtta aaataaggct agtccgttat caacttggcc aacatgagga 3240
tcacccatgt ctgcagggcc aagtggcacc gagtcggtgc tttttttgtt ttagagctag 3300
aaatagcaag ttaaaataag gctagtccgt tttatgcatg tggctcccat ttatacctgg 3360
ccggctttcc catgattcct tcatatttgc atatacgata caaggctgtt agagagataa 3420
ttggaattaa tttgactgta aacacaaaga tattagtaca aaatacgtga cgtagaaagt 3480
aataatttct tgggtagttt gcagttttaa aattatgttt taaaatggac tatcatatgc 3540
ttaccgtaac ttgaaagtat ttcgatttct tggctttata tatcttgtgg aaaggacgaa 3600
acaccgacaa taagtagtct tactcgtttt agagctaggc caacatgagg atcacccatg 3660
tctgcagggc ctagcaagtt aaaataaggc tagtccgtta tcaacttggc caacatgagg 3720
atcacccatg tctgcagggc caagtggcac cgagtcggtg ctttttttgt tttagagcta 3780
gaaatagcaa gttaaaataa ggctagtccg tttt 3814
<210> 34
<211> 20
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 34
acggttgccc tctttcccaa 20
<210> 35
<211> 20
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 35
actgtcagac tcaaaggtgc 20
<210> 36
<211> 20
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 36
gacaataagt agtcttactc 20
<210> 37
<211> 157
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 37
acgguugccc ucuuucccaa guuuuagagc uaggccaaca ugaggaucac ccaugucugc 60
agggccuagc aaguuaaaau aaggcuaguc cguuaucaac uuggccaaca ugaggaucac 120
ccaugucugc agggccaagu ggcaccgagu cggugcu 157
<210> 38
<211> 157
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 38
acugucagac ucaaaggugc guuuuagagc uaggccaaca ugaggaucac ccaugucugc 60
agggccuagc aaguuaaaau aaggcuaguc cguuaucaac uuggccaaca ugaggaucac 120
ccaugucugc agggccaagu ggcaccgagu cggugcu 157
<210> 39
<211> 157
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 39
gacaauaagu agucuuacuc guuuuagagc uaggccaaca ugaggaucac ccaugucugc 60
agggccuagc aaguuaaaau aaggcuaguc cguuaucaac uuggccaaca ugaggaucac 120
ccaugucugc agggccaagu ggcaccgagu cggugcu 157
<210> 40
<211> 137
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 40
guuuuagagc uaggccaaca ugaggaucac ccaugucugc agggccuagc aaguuaaaau 60
aaggcuaguc cguuaucaac uuggccaaca ugaggaucac ccaugucugc agggccaagu 120
ggcaccgagu cggugcu 137
<210> 41
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 41
acgguugccc ucuuucccaa 20
<210> 42
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 42
acugucagac ucaaaggugc 20
<210> 43
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 43
gacaauaagu agucuuacuc 20
<210> 44
<211> 1965
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 44
Met Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys
1 5 10 15
Lys Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Ser Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
1385 1390 1395
Gly Gly Ser Gly Pro Lys Lys Lys Arg Lys Val Ala Ala Ala Gly
1400 1405 1410
Ser Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
1415 1420 1425
Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser
1430 1435 1440
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala
1445 1450 1455
Leu Asp Asp Phe Asp Leu Asp Met Leu Ile Asn Cys Thr Gly Ser
1460 1465 1470
Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu
1475 1480 1485
Asn Pro Gly Pro Met Ala Ser Asn Phe Thr Gln Phe Val Leu Val
1490 1495 1500
Asp Asn Gly Gly Thr Gly Asp Val Thr Val Ala Pro Ser Asn Phe
1505 1510 1515
Ala Asn Gly Val Ala Glu Trp Ile Ser Ser Asn Ser Arg Ser Gln
1520 1525 1530
Ala Tyr Lys Val Thr Cys Ser Val Arg Gln Ser Ser Ala Gln Lys
1535 1540 1545
Arg Lys Tyr Thr Ile Lys Val Glu Val Pro Lys Val Ala Thr Gln
1550 1555 1560
Thr Val Gly Gly Val Glu Leu Pro Val Ala Ala Trp Arg Ser Tyr
1565 1570 1575
Leu Asn Met Glu Leu Thr Ile Pro Ile Phe Ala Thr Asn Ser Asp
1580 1585 1590
Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu Leu Lys Asp Gly
1595 1600 1605
Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly Ile Tyr Ser
1610 1615 1620
Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
1625 1630 1635
Ser Gly Pro Lys Lys Lys Arg Lys Val Ala Ala Ala Gly Ser Pro
1640 1645 1650
Ser Gly Gln Ile Ser Asn Gln Ala Leu Ala Leu Ala Pro Ser Ser
1655 1660 1665
Ala Pro Val Leu Ala Gln Thr Met Val Pro Ser Ser Ala Met Val
1670 1675 1680
Pro Leu Ala Gln Pro Pro Ala Pro Ala Pro Val Leu Thr Pro Gly
1685 1690 1695
Pro Pro Gln Ser Leu Ser Ala Pro Val Pro Lys Ser Thr Gln Ala
1700 1705 1710
Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu His Leu Gln Phe Asp
1715 1720 1725
Ala Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro
1730 1735 1740
Gly Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln
1745 1750 1755
Gln Leu Leu Asn Gln Gly Val Ser Met Ser His Ser Thr Ala Glu
1760 1765 1770
Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr
1775 1780 1785
Gly Ser Gln Arg Pro Pro Asp Pro Ala Pro Thr Pro Leu Gly Thr
1790 1795 1800
Ser Gly Leu Pro Asn Gly Leu Ser Gly Asp Glu Asp Phe Ser Ser
1805 1810 1815
Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser
1820 1825 1830
Ser Gly Gln Gly Gly Gly Gly Ser Gly Phe Ser Val Asp Thr Ser
1835 1840 1845
Ala Leu Leu Asp Leu Phe Ser Pro Ser Val Thr Val Pro Asp Met
1850 1855 1860
Ser Leu Pro Asp Leu Asp Ser Ser Leu Ala Ser Ile Gln Glu Leu
1865 1870 1875
Leu Ser Pro Gln Glu Pro Pro Arg Pro Pro Glu Ala Glu Asn Ser
1880 1885 1890
Ser Pro Asp Ser Gly Lys Gln Leu Val His Tyr Thr Ala Gln Pro
1895 1900 1905
Leu Phe Leu Leu Asp Pro Gly Ser Val Asp Thr Gly Ser Asn Asp
1910 1915 1920
Leu Pro Val Leu Phe Glu Leu Gly Glu Gly Ser Tyr Phe Ser Glu
1925 1930 1935
Gly Asp Gly Phe Ala Glu Asp Pro Thr Ile Ser Leu Leu Thr Gly
1940 1945 1950
Ser Glu Pro Pro Lys Ala Lys Asp Pro Thr Val Ser
1955 1960 1965
<210> 45
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 45
cgtgatctgc aactccagtc tt 22
<210> 46
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 46
agatgggcgg gagtcttctg ggc 23
<210> 47
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 47
cacaccaggt tagcctttaa gcc 23
<210> 48
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 48
ggtggagagg ctattcggc 19
<210> 49
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 49
tgggcacaac agacaatcgg ctg 23
<210> 50
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 50
gaacacggcg gcatcag 17
<210> 51
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 51
accggctgtc cgactacgat 20
<210> 52
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 52
tggaccacat cgtgcctcag a 21
<210> 53
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 53
cgggccttgt cgcttctg 18
<210> 54
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 54
ggctccttct aatttcgcta atgg 24
<210> 55
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 55
tggcagagtg gatcagctcc a 21
<210> 56
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 56
ctgacgctgc atgtcacctt 20
<210> 57
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 57
agggcgtgtc catgtctcat ag 22
<210> 58
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 58
acagccgaac caatgctgat gga 23
<210> 59
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 59
ccagccgggt aatggcttc 19
<210> 60
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 60
tgtgttgcca cctggattct g 21
<210> 61
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 61
cgcgggacgt ccttctgcta c 21
<210> 62
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 62
ggaaggtccg ctggattgag 20
<210> 63
<211> 157
<212> RNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(20)
<223> n = A, T, C, 或 G
<400> 63
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaggccaaca ugaggaucac ccaugucugc 60
agggccuagc aaguuaaaau aaggcuaguc cguuaucaac uuggccaaca ugaggaucac 120
ccaugucugc agggccaagu ggcaccgagu cggugcu 157
<210> 64
<211> 5895
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 64
atgaaaaggc cggcggccac gaaaaaggcc ggccaggcaa aaaagaaaaa ggacaagaag 60
tacagcatcg gcctggccat cggcaccaac tctgtgggct gggccgtgat caccgacgag 120
tacaaggtgc ccagcaagaa attcaaggtg ctgggcaaca ccgaccggca cagcatcaag 180
aagaacctga tcggagccct gctgttcgac agcggcgaaa cagccgaggc cacccggctg 240
aagagaaccg ccagaagaag atacaccaga cggaagaacc ggatctgcta tctgcaagag 300
atcttcagca acgagatggc caaggtggac gacagcttct tccacagact ggaagagtcc 360
ttcctggtgg aagaggataa gaagcacgag cggcacccca tcttcggcaa catcgtggac 420
gaggtggcct accacgagaa gtaccccacc atctaccacc tgagaaagaa actggtggac 480
agcaccgaca aggccgacct gcggctgatc tatctggccc tggcccacat gatcaagttc 540
cggggccact tcctgatcga gggcgacctg aaccccgaca acagcgacgt ggacaagctg 600
ttcatccagc tggtgcagac ctacaaccag ctgttcgagg aaaaccccat caacgccagc 660
ggcgtggacg ccaaggccat cctgtctgcc agactgagca agagcagacg gctggaaaat 720
ctgatcgccc agctgcccgg cgagaagaag aatggcctgt tcggcaacct gattgccctg 780
agcctgggcc tgacccccaa cttcaagagc aacttcgacc tggccgagga tgccaaactg 840
cagctgagca aggacaccta cgacgacgac ctggacaacc tgctggccca gatcggcgac 900
cagtacgccg acctgtttct ggccgccaag aacctgtccg acgccatcct gctgagcgac 960
atcctgagag tgaacaccga gatcaccaag gcccccctga gcgcctctat gatcaagaga 1020
tacgacgagc accaccagga cctgaccctg ctgaaagctc tcgtgcggca gcagctgcct 1080
gagaagtaca aagagatttt cttcgaccag agcaagaacg gctacgccgg ctacattgac 1140
ggcggagcca gccaggaaga gttctacaag ttcatcaagc ccatcctgga aaagatggac 1200
ggcaccgagg aactgctcgt gaagctgaac agagaggacc tgctgcggaa gcagcggacc 1260
ttcgacaacg gcagcatccc ccaccagatc cacctgggag agctgcacgc cattctgcgg 1320
cggcaggaag atttttaccc attcctgaag gacaaccggg aaaagatcga gaagatcctg 1380
accttccgca tcccctacta cgtgggccct ctggccaggg gaaacagcag attcgcctgg 1440
atgaccagaa agagcgagga aaccatcacc ccctggaact tcgaggaagt ggtggacaag 1500
ggcgcttccg cccagagctt catcgagcgg atgaccaact tcgataagaa cctgcccaac 1560
gagaaggtgc tgcccaagca cagcctgctg tacgagtact tcaccgtgta taacgagctg 1620
accaaagtga aatacgtgac cgagggaatg agaaagcccg ccttcctgag cggcgagcag 1680
aaaaaggcca tcgtggacct gctgttcaag accaaccgga aagtgaccgt gaagcagctg 1740
aaagaggact acttcaagaa aatcgagtgc ttcgactccg tggaaatctc cggcgtggaa 1800
gatcggttca acgcctccct gggcacatac cacgatctgc tgaaaattat caaggacaag 1860
gacttcctgg acaatgagga aaacgaggac attctggaag atatcgtgct gaccctgaca 1920
ctgtttgagg acagagagat gatcgaggaa cggctgaaaa cctatgccca cctgttcgac 1980
gacaaagtga tgaagcagct gaagcggcgg agatacaccg gctggggcag gctgagccgg 2040
aagctgatca acggcatccg ggacaagcag tccggcaaga caatcctgga tttcctgaag 2100
tccgacggct tcgccaacag aaacttcatg cagctgatcc acgacgacag cctgaccttt 2160
aaagaggaca tccagaaagc ccaggtgtcc ggccagggcg atagcctgca cgagcacatt 2220
gccaatctgg ccggcagccc cgccattaag aagggcatcc tgcagacagt gaaggtggtg 2280
gacgagctcg tgaaagtgat gggccggcac aagcccgaga acatcgtgat cgaaatggcc 2340
agagagaacc agaccaccca gaagggacag aagaacagcc gcgagagaat gaagcggatc 2400
gaagagggca tcaaagagct gggcagccag atcctgaaag aacaccccgt ggaaaacacc 2460
cagctgcaga acgagaagct gtacctgtac tacctgcaga atgggcggga tatgtacgtg 2520
gaccaggaac tggacatcaa ccggctgtcc gactacgatg tggaccacat cgtgcctcag 2580
agctttctga aggacgactc catcgacaac aaggtgctga ccagaagcga caaggcccgg 2640
ggcaagagcg acaacgtgcc ctccgaagag gtcgtgaaga agatgaagaa ctactggcgg 2700
cagctgctga acgccaagct gattacccag agaaagttcg acaatctgac caaggccgag 2760
agaggcggcc tgagcgaact ggataaggcc ggcttcatca agagacagct ggtggaaacc 2820
cggcagatca caaagcacgt ggcacagatc ctggactccc ggatgaacac taagtacgac 2880
gagaatgaca agctgatccg ggaagtgaaa gtgatcaccc tgaagtccaa gctggtgtcc 2940
gatttccgga aggatttcca gttttacaaa gtgcgcgaga tcaacaacta ccaccacgcc 3000
cacgacgcct acctgaacgc cgtcgtggga accgccctga tcaaaaagta ccctaagctg 3060
gaaagcgagt tcgtgtacgg cgactacaag gtgtacgacg tgcggaagat gatcgccaag 3120
agcgagcagg aaatcggcaa ggctaccgcc aagtacttct tctacagcaa catcatgaac 3180
tttttcaaga ccgagattac cctggccaac ggcgagatcc ggaagcggcc tctgatcgag 3240
acaaacggcg aaaccgggga gatcgtgtgg gataagggcc gggattttgc caccgtgcgg 3300
aaagtgctga gcatgcccca agtgaatatc gtgaaaaaga ccgaggtgca gacaggcggc 3360
ttcagcaaag agtctatcct gcccaagagg aacagcgata agctgatcgc cagaaagaag 3420
gactgggacc ctaagaagta cggcggcttc gacagcccca ccgtggccta ttctgtgctg 3480
gtggtggcca aagtggaaaa gggcaagtcc aagaaactga agagtgtgaa agagctgctg 3540
gggatcacca tcatggaaag aagcagcttc gagaagaatc ccatcgactt tctggaagcc 3600
aagggctaca aagaagtgaa aaaggacctg atcatcaagc tgcctaagta ctccctgttc 3660
gagctggaaa acggccggaa gagaatgctg gcctctgccg gcgaactgca gaagggaaac 3720
gaactggccc tgccctccaa atatgtgaac ttcctgtacc tggccagcca ctatgagaag 3780
ctgaagggct cccccgagga taatgagcag aaacagctgt ttgtggaaca gcacaagcac 3840
tacctggacg agatcatcga gcagatcagc gagttctcca agagagtgat cctggccgac 3900
gctaatctgg acaaagtgct gtccgcctac aacaagcacc gggataagcc catcagagag 3960
caggccgaga atatcatcca cctgtttacc ctgaccaatc tgggagcccc tgccgccttc 4020
aagtactttg acaccaccat cgaccggaag aggtacacca gcaccaaaga ggtgctggac 4080
gccaccctga tccaccagag catcaccggc ctgtacgaga cacggatcga cctgtctcag 4140
ctgggaggcg acagcgctgg aggaggtgga agcggaggag gaggaagcgg aggaggaggt 4200
agcggaccta agaaaaagag gaaggtggcg gccgctggat ccggacgggc tgacgcattg 4260
gacgattttg atctggatat gctgggaagt gacgccctcg atgattttga ccttgacatg 4320
cttggttcgg atgcccttga tgactttgac ctcgacatgc tcggcagtga cgcccttgat 4380
gatttcgacc tggacatgct gattaactgt acaggcagtg gagagggcag aggaagtctg 4440
ctaacatgcg gtgacgtcga ggagaatcct ggcccaatgg cttcaaactt tactcagttc 4500
gtgctcgtgg acaatggtgg gacaggggat gtgacagtgg ctccttctaa tttcgctaat 4560
ggggtggcag agtggatcag ctccaactca cggagccagg cctacaaggt gacatgcagc 4620
gtcaggcagt ctagtgccca gaagagaaag tataccatca aggtggaggt ccccaaagtg 4680
gctacccaga cagtgggcgg agtcgaactg cctgtcgccg cttggaggtc ctacctgaac 4740
atggagctca ctatcccaat tttcgctacc aattctgact gtgaactcat cgtgaaggca 4800
atgcaggggc tcctcaaaga cggtaatcct atcccttccg ccatcgccgc taactcaggt 4860
atctacagcg ctggaggagg tggaagcgga ggaggaggaa gcggaggagg aggtagcgga 4920
cctaagaaaa agaggaaggt ggcggccgct ggatcccctt cagggcagat cagcaaccag 4980
gccctggctc tggcccctag ctccgctcca gtgctggccc agactatggt gccctctagt 5040
gctatggtgc ctctggccca gccacctgct ccagcccctg tgctgacccc aggaccaccc 5100
cagtcactga gcgctccagt gcccaagtct acacaggccg gcgaggggac tctgagtgaa 5160
gctctgctgc acctgcagtt cgacgctgat gaggacctgg gagctctgct ggggaacagc 5220
accgatcccg gagtgttcac agatctggcc tccgtggaca actctgagtt tcagcagctg 5280
ctgaatcagg gcgtgtccat gtctcatagt acagccgaac caatgctgat ggagtacccc 5340
gaagccatta cccggctggt gaccggcagc cagcggcccc ccgaccccgc tccaactccc 5400
ctgggaacca gcggcctgcc taatgggctg tccggagatg aagacttctc aagcatcgct 5460
gatatggact ttagtgccct gctgtcacag atttcctcta gtgggcaggg aggaggtgga 5520
agcggcttca gcgtggacac cagtgccctg ctggacctgt tcagcccctc ggtgaccgtg 5580
cccgacatga gcctgcctga ccttgacagc agcctggcca gtatccaaga gctcctgtct 5640
ccccaggagc cccccaggcc tcccgaggca gagaacagca gcccggattc agggaagcag 5700
ctggtgcact acacagcgca gccgctgttc ctgctggacc ccggctccgt ggacaccggg 5760
agcaacgacc tgccggtgct gtttgagctg ggagagggct cctacttctc cgaaggggac 5820
ggcttcgccg aggaccccac catctccctg ctgacaggct cggagcctcc caaagccaag 5880
gaccccactg tctcc 5895
<210> 65
<211> 1412
<212> DNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (241)..(260)
<223> n = A, T, C, 或 G
<220>
<221> misc_feature
<222> (723)..(742)
<223> n = A, T, C, 或 G
<220>
<221> misc_feature
<222> (1204)..(1223)
<223> n = A, T, C, 或 G
<400> 65
tttcccatga ttccttcata tttgcatata cgatacaagg ctgttagaga gataattgga 60
attaatttga ctgtaaacac aaagatatta gtacaaaata cgtgacgtag aaagtaataa 120
tttcttgggt agtttgcagt tttaaaatta tgttttaaaa tggactatca tatgcttacc 180
gtaacttgaa agtatttcga tttcttggct ttatatatct tgtggaaagg acgaaacacc 240
nnnnnnnnnn nnnnnnnnnn gttttagagc taggccaaca tgaggatcac ccatgtctgc 300
agggcctagc aagttaaaat aaggctagtc cgttatcaac ttggccaaca tgaggatcac 360
ccatgtctgc agggccaagt ggcaccgagt cggtgctttt tttgttttag agctagaaat 420
agcaagttaa aataaggcta gtccgttttg agctccataa gactcggcct tagaacaagc 480
tttttcccat gattccttca tatttgcata tacgatacaa ggctgttaga gagataattg 540
gaattaattt gactgtaaac acaaagatat tagtacaaaa tacgtgacgt agaaagtaat 600
aatttcttgg gtagtttgca gttttaaaat tatgttttaa aatggactat catatgctta 660
ccgtaacttg aaagtatttc gatttcttgg ctttatatat cttgtggaaa ggacgaaaca 720
ccnnnnnnnn nnnnnnnnnn nngttttaga gctaggccaa catgaggatc acccatgtct 780
gcagggccta gcaagttaaa ataaggctag tccgttatca acttggccaa catgaggatc 840
acccatgtct gcagggccaa gtggcaccga gtcggtgctt tttttgtttt agagctagaa 900
atagcaagtt aaaataaggc tagtccgttt tatgcatgtg gctcccattt atacctggcc 960
ggctttccca tgattccttc atatttgcat atacgataca aggctgttag agagataatt 1020
ggaattaatt tgactgtaaa cacaaagata ttagtacaaa atacgtgacg tagaaagtaa 1080
taatttcttg ggtagtttgc agttttaaaa ttatgtttta aaatggacta tcatatgctt 1140
accgtaactt gaaagtattt cgatttcttg gctttatata tcttgtggaa aggacgaaac 1200
accnnnnnnn nnnnnnnnnn nnngttttag agctaggcca acatgaggat cacccatgtc 1260
tgcagggcct agcaagttaa aataaggcta gtccgttatc aacttggcca acatgaggat 1320
cacccatgtc tgcagggcca agtggcaccg agtcggtgct ttttttgttt tagagctaga 1380
aatagcaagt taaaataagg ctagtccgtt tt 1412
<210> 66
<211> 1414
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 66
tttcccatga ttccttcata tttgcatata cgatacaagg ctgttagaga gataattgga 60
attaatttga ctgtaaacac aaagatatta gtacaaaata cgtgacgtag aaagtaataa 120
tttcttgggt agtttgcagt tttaaaatta tgttttaaaa tggactatca tatgcttacc 180
gtaacttgaa agtatttcga tttcttggct ttatatatct tgtggaaagg acgaaacacc 240
gacggttgcc ctctttccca agttttagag ctaggccaac atgaggatca cccatgtctg 300
cagggcctag caagttaaaa taaggctagt ccgttatcaa cttggccaac atgaggatca 360
cccatgtctg cagggccaag tggcaccgag tcggtgcttt ttttgtttta gagctagaaa 420
tagcaagtta aaataaggct agtccgtttt gagctccata agactcggcc ttagaacaag 480
ctttttccca tgattccttc atatttgcat atacgataca aggctgttag agagataatt 540
ggaattaatt tgactgtaaa cacaaagata ttagtacaaa atacgtgacg tagaaagtaa 600
taatttcttg ggtagtttgc agttttaaaa ttatgtttta aaatggacta tcatatgctt 660
accgtaactt gaaagtattt cgatttcttg gctttatata tcttgtggaa aggacgaaac 720
accgactgtc agactcaaag gtgcgtttta gagctaggcc aacatgagga tcacccatgt 780
ctgcagggcc tagcaagtta aaataaggct agtccgttat caacttggcc aacatgagga 840
tcacccatgt ctgcagggcc aagtggcacc gagtcggtgc tttttttgtt ttagagctag 900
aaatagcaag ttaaaataag gctagtccgt tttatgcatg tggctcccat ttatacctgg 960
ccggctttcc catgattcct tcatatttgc atatacgata caaggctgtt agagagataa 1020
ttggaattaa tttgactgta aacacaaaga tattagtaca aaatacgtga cgtagaaagt 1080
aataatttct tgggtagttt gcagttttaa aattatgttt taaaatggac tatcatatgc 1140
ttaccgtaac ttgaaagtat ttcgatttct tggctttata tatcttgtgg aaaggacgaa 1200
acaccgacaa taagtagtct tactcgtttt agagctaggc caacatgagg atcacccatg 1260
tctgcagggc ctagcaagtt aaaataaggc tagtccgtta tcaacttggc caacatgagg 1320
atcacccatg tctgcagggc caagtggcac cgagtcggtg ctttttttgt tttagagcta 1380
gaaatagcaa gttaaaataa ggctagtccg tttt 1414
<210> 67
<211> 1490
<212> DNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (28)..(267)
<223> hU6启动子
<220>
<221> misc_feature
<222> (269)..(288)
<223> 指导1
<220>
<221> misc_feature
<222> (289)..(425)
<223> SAM Tracr
<220>
<221> misc_feature
<222> (426)..(477)
<223> 扩展终止子
<220>
<221> misc_feature
<222> (511)..(750)
<223> hU6启动子
<220>
<221> misc_feature
<222> (752)..(771)
<223> 指导2
<220>
<221> misc_feature
<222> (772)..(908)
<223> SAM Tracr
<220>
<221> misc_feature
<222> (909)..(960)
<223> 扩展终止子
<220>
<221> misc_feature
<222> (993)..(1232)
<223> hU6启动子
<220>
<221> misc_feature
<222> (1233)..(1252)
<223> 指导3
<220>
<221> misc_feature
<222> (1253)..(1389)
<223> SAM Tracr
<220>
<221> misc_feature
<222> (1390)..(1441)
<223> 扩展终止子
<400> 67
gctagccata agactcggcc ttagaacttt cccatgattc cttcatattt gcatatacga 60
tacaaggctg ttagagagat aattggaatt aatttgactg taaacacaaa gatattagta 120
caaaatacgt gacgtagaaa gtaataattt cttgggtagt ttgcagtttt aaaattatgt 180
tttaaaatgg actatcatat gcttaccgta acttgaaagt atttcgattt cttggcttta 240
tatatcttgt ggaaaggacg aaacaccgac ggttgccctc tttcccaagt tttagagcta 300
ggccaacatg aggatcaccc atgtctgcag ggcctagcaa gttaaaataa ggctagtccg 360
ttatcaactt ggccaacatg aggatcaccc atgtctgcag ggccaagtgg caccgagtcg 420
gtgctttttt tgttttagag ctagaaatag caagttaaaa taaggctagt ccgttttgag 480
ctccataaga ctcggcctta gaacaagctt tttcccatga ttccttcata tttgcatata 540
cgatacaagg ctgttagaga gataattgga attaatttga ctgtaaacac aaagatatta 600
gtacaaaata cgtgacgtag aaagtaataa tttcttgggt agtttgcagt tttaaaatta 660
tgttttaaaa tggactatca tatgcttacc gtaacttgaa agtatttcga tttcttggct 720
ttatatatct tgtggaaagg acgaaacacc gactgtcaga ctcaaaggtg cgttttagag 780
ctaggccaac atgaggatca cccatgtctg cagggcctag caagttaaaa taaggctagt 840
ccgttatcaa cttggccaac atgaggatca cccatgtctg cagggccaag tggcaccgag 900
tcggtgcttt ttttgtttta gagctagaaa tagcaagtta aaataaggct agtccgtttt 960
atgcatgtgg ctcccattta tacctggccg gctttcccat gattccttca tatttgcata 1020
tacgatacaa ggctgttaga gagataattg gaattaattt gactgtaaac acaaagatat 1080
tagtacaaaa tacgtgacgt agaaagtaat aatttcttgg gtagtttgca gttttaaaat 1140
tatgttttaa aatggactat catatgctta ccgtaacttg aaagtatttc gatttcttgg 1200
ctttatatat cttgtggaaa ggacgaaaca ccgacaataa gtagtcttac tcgttttaga 1260
gctaggccaa catgaggatc acccatgtct gcagggccta gcaagttaaa ataaggctag 1320
tccgttatca acttggccaa catgaggatc acccatgtct gcagggccaa gtggcaccga 1380
gtcggtgctt tttttgtttt agagctagaa atagcaagtt aaaataaggc tagtccgttt 1440
tggtcaccca gtgaggaagc taggacagac ctaggacggt tgcctgcagg 1490
<210> 68
<211> 490
<212> DNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(318)
<223> mU6启动子
<220>
<221> misc_feature
<222> (320)..(339)
<223> 指导1
<220>
<221> misc_feature
<222> (340)..(476)
<223> SAM Tracr
<220>
<221> misc_feature
<222> (477)..(482)
<223> 小终止子
<400> 68
tgtacaaaaa agcaggcttt aaaggaacca attcagtcga ctggatccgg taccaaggtc 60
gggcaggaag agggcctatt tcccatgatt ccttcatatt tgcatatacg atacaaggct 120
gttagagaga taattagaat taatttgact gtaaacacaa agatattagt acaaaatacg 180
tgacgtagaa agtaataatt tcttgggtag tttgcagttt taaaattatg ttttaaaatg 240
gactatcata tgcttaccgt aacttgaaag tatttcgatt tcttggcttt atatatcttg 300
tggaaaggac gaaacaccga cggttgccct ctttcccaag ttttagagct aggccaacat 360
gaggatcacc catgtctgca gggcctagca agttaaaata aggctagtcc gttatcaact 420
tggccaacat gaggatcacc catgtctgca gggccaagtg gcaccgagtc ggtgcttttt 480
ttctagaggc 490
<210> 69
<211> 490
<212> DNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(318)
<223> mU6启动子
<220>
<221> misc_feature
<222> (320)..(339)
<223> 指导2
<220>
<221> misc_feature
<222> (340)..(476)
<223> SAM Tracr
<220>
<221> misc_feature
<222> (477)..(482)
<223> 小终止子
<400> 69
tgtacaaaaa agcaggcttt aaaggaacca attcagtcga ctggatccgg taccaaggtc 60
gggcaggaag agggcctatt tcccatgatt ccttcatatt tgcatatacg atacaaggct 120
gttagagaga taattagaat taatttgact gtaaacacaa agatattagt acaaaatacg 180
tgacgtagaa agtaataatt tcttgggtag tttgcagttt taaaattatg ttttaaaatg 240
gactatcata tgcttaccgt aacttgaaag tatttcgatt tcttggcttt atatatcttg 300
tggaaaggac gaaacaccga ctgtcagact caaaggtgcg ttttagagct aggccaacat 360
gaggatcacc catgtctgca gggcctagca agttaaaata aggctagtcc gttatcaact 420
tggccaacat gaggatcacc catgtctgca gggccaagtg gcaccgagtc ggtgcttttt 480
ttctagaggc 490
<210> 70
<211> 489
<212> DNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(318)
<223> mU6启动子
<220>
<221> misc_feature
<222> (319)..(338)
<223> 指导3
<220>
<221> misc_feature
<222> (339)..(475)
<223> SAM Tracr
<220>
<221> misc_feature
<222> (476)..(481)
<223> 小终止子
<400> 70
tgtacaaaaa agcaggcttt aaaggaacca attcagtcga ctggatccgg taccaaggtc 60
gggcaggaag agggcctatt tcccatgatt ccttcatatt tgcatatacg atacaaggct 120
gttagagaga taattagaat taatttgact gtaaacacaa agatattagt acaaaatacg 180
tgacgtagaa agtaataatt tcttgggtag tttgcagttt taaaattatg ttttaaaatg 240
gactatcata tgcttaccgt aacttgaaag tatttcgatt tcttggcttt atatatcttg 300
tggaaaggac gaaacaccga caataagtag tcttactcgt tttagagcta ggccaacatg 360
aggatcaccc atgtctgcag ggcctagcaa gttaaaataa ggctagtccg ttatcaactt 420
ggccaacatg aggatcaccc atgtctgcag ggccaagtgg caccgagtcg gtgctttttt 480
tctagaggc 489
<210> 71
<211> 1491
<212> DNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (28)..(267)
<223> hU6 启动子
<220>
<221> misc_feature
<222> (269)..(288)
<223> 指导1
<220>
<221> misc_feature
<222> (289)..(425)
<223> SAM Tracr
<220>
<221> misc_feature
<222> (426)..(477)
<223> 扩展终止子
<220>
<221> misc_feature
<222> (511)..(750)
<223> hU6启动子
<220>
<221> misc_feature
<222> (752)..(771)
<223> 指导2
<220>
<221> misc_feature
<222> (772)..(908)
<223> SAM Tracr
<220>
<221> misc_feature
<222> (909)..(960)
<223> 扩展终止子
<220>
<221> misc_feature
<222> (993)..(1232)
<223> hU6启动子
<220>
<221> misc_feature
<222> (1234)..(1253)
<223> 指导3
<220>
<221> misc_feature
<222> (1254)..(1390)
<223> SAM Tracr
<220>
<221> misc_feature
<222> (1391)..(1442)
<223> 扩展终止子
<400> 71
gctagccata agactcggcc ttagaacttt cccatgattc cttcatattt gcatatacga 60
tacaaggctg ttagagagat aattggaatt aatttgactg taaacacaaa gatattagta 120
caaaatacgt gacgtagaaa gtaataattt cttgggtagt ttgcagtttt aaaattatgt 180
tttaaaatgg actatcatat gcttaccgta acttgaaagt atttcgattt cttggcttta 240
tatatcttgt ggaaaggacg aaacaccgaa gcggtgaaat tctgtggggt tttagagcta 300
ggccaacatg aggatcaccc atgtctgcag ggcctagcaa gttaaaataa ggctagtccg 360
ttatcaactt ggccaacatg aggatcaccc atgtctgcag ggccaagtgg caccgagtcg 420
gtgctttttt tgttttagag ctagaaatag caagttaaaa taaggctagt ccgttttgag 480
ctccataaga ctcggcctta gaacaagctt tttcccatga ttccttcata tttgcatata 540
cgatacaagg ctgttagaga gataattgga attaatttga ctgtaaacac aaagatatta 600
gtacaaaata cgtgacgtag aaagtaataa tttcttgggt agtttgcagt tttaaaatta 660
tgttttaaaa tggactatca tatgcttacc gtaacttgaa agtatttcga tttcttggct 720
ttatatatct tgtggaaagg acgaaacacc gcactcaaac agcaacgcgg ggttttagag 780
ctaggccaac atgaggatca cccatgtctg cagggcctag caagttaaaa taaggctagt 840
ccgttatcaa cttggccaac atgaggatca cccatgtctg cagggccaag tggcaccgag 900
tcggtgcttt ttttgtttta gagctagaaa tagcaagtta aaataaggct agtccgtttt 960
atgcatgtgg ctcccattta tacctggccg gctttcccat gattccttca tatttgcata 1020
tacgatacaa ggctgttaga gagataattg gaattaattt gactgtaaac acaaagatat 1080
tagtacaaaa tacgtgacgt agaaagtaat aatttcttgg gtagtttgca gttttaaaat 1140
tatgttttaa aatggactat catatgctta ccgtaacttg aaagtatttc gatttcttgg 1200
ctttatatat cttgtggaaa ggacgaaaca ccgcttcacc tcactgagcg ggggttttag 1260
agctaggcca acatgaggat cacccatgtc tgcagggcct agcaagttaa aataaggcta 1320
gtccgttatc aacttggcca acatgaggat cacccatgtc tgcagggcca agtggcaccg 1380
agtcggtgct ttttttgttt tagagctaga aatagcaagt taaaataagg ctagtccgtt 1440
ttggtcaccc agtgaggaag ctaggacaga cctaggacgg ttgcctgcag g 1491
<210> 72
<211> 490
<212> DNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(318)
<223> mU6启动子
<220>
<221> misc_feature
<222> (320)..(339)
<223> 指导1
<220>
<221> misc_feature
<222> (340)..(476)
<223> SAM Tracr
<220>
<221> misc_feature
<222> (477)..(482)
<223> 小终止子
<400> 72
tgtacaaaaa agcaggcttt aaaggaacca attcagtcga ctggatccgg taccaaggtc 60
gggcaggaag agggcctatt tcccatgatt ccttcatatt tgcatatacg atacaaggct 120
gttagagaga taattagaat taatttgact gtaaacacaa agatattagt acaaaatacg 180
tgacgtagaa agtaataatt tcttgggtag tttgcagttt taaaattatg ttttaaaatg 240
gactatcata tgcttaccgt aacttgaaag tatttcgatt tcttggcttt atatatcttg 300
tggaaaggac gaaacaccga agcggtgaaa ttctgtgggg ttttagagct aggccaacat 360
gaggatcacc catgtctgca gggcctagca agttaaaata aggctagtcc gttatcaact 420
tggccaacat gaggatcacc catgtctgca gggccaagtg gcaccgagtc ggtgcttttt 480
ttctagaggc 490
<210> 73
<211> 490
<212> DNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(318)
<223> mU6启动子
<220>
<221> misc_feature
<222> (320)..(339)
<223> 指导2
<220>
<221> misc_feature
<222> (340)..(476)
<223> SAM Tracr
<220>
<221> misc_feature
<222> (477)..(482)
<223> 小终止子
<400> 73
tgtacaaaaa agcaggcttt aaaggaacca attcagtcga ctggatccgg taccaaggtc 60
gggcaggaag agggcctatt tcccatgatt ccttcatatt tgcatatacg atacaaggct 120
gttagagaga taattagaat taatttgact gtaaacacaa agatattagt acaaaatacg 180
tgacgtagaa agtaataatt tcttgggtag tttgcagttt taaaattatg ttttaaaatg 240
gactatcata tgcttaccgt aacttgaaag tatttcgatt tcttggcttt atatatcttg 300
tggaaaggac gaaacaccgc actcaaacag caacgcgggg ttttagagct aggccaacat 360
gaggatcacc catgtctgca gggcctagca agttaaaata aggctagtcc gttatcaact 420
tggccaacat gaggatcacc catgtctgca gggccaagtg gcaccgagtc ggtgcttttt 480
ttctagaggc 490
<210> 74
<211> 489
<212> DNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(318)
<223> mU6启动子
<220>
<221> misc_feature
<222> (319)..(338)
<223> 指导3
<220>
<221> misc_feature
<222> (339)..(475)
<223> SAM Tracr
<220>
<221> misc_feature
<222> (476)..(481)
<223> 小终止子
<400> 74
tgtacaaaaa agcaggcttt aaaggaacca attcagtcga ctggatccgg taccaaggtc 60
gggcaggaag agggcctatt tcccatgatt ccttcatatt tgcatatacg atacaaggct 120
gttagagaga taattagaat taatttgact gtaaacacaa agatattagt acaaaatacg 180
tgacgtagaa agtaataatt tcttgggtag tttgcagttt taaaattatg ttttaaaatg 240
gactatcata tgcttaccgt aacttgaaag tatttcgatt tcttggcttt atatatcttg 300
tggaaaggac gaaacaccct tcacctcact gagcgggggt tttagagcta ggccaacatg 360
aggatcaccc atgtctgcag ggcctagcaa gttaaaataa ggctagtccg ttatcaactt 420
ggccaacatg aggatcaccc atgtctgcag ggccaagtgg caccgagtcg gtgctttttt 480
tctagaggc 489
<210> 75
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 75
aagcggtgaa attctgtggg 20
<210> 76
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 76
cactcaaaca gcaacgcggg 20
<210> 77
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 77
cttcacctca ctgagcgggg 20
<210> 78
<211> 157
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 78
aagcggugaa auucuguggg guuuuagagc uaggccaaca ugaggaucac ccaugucugc 60
agggccuagc aaguuaaaau aaggcuaguc cguuaucaac uuggccaaca ugaggaucac 120
ccaugucugc agggccaagu ggcaccgagu cggugcu 157
<210> 79
<211> 157
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 79
cacucaaaca gcaacgcggg guuuuagagc uaggccaaca ugaggaucac ccaugucugc 60
agggccuagc aaguuaaaau aaggcuaguc cguuaucaac uuggccaaca ugaggaucac 120
ccaugucugc agggccaagu ggcaccgagu cggugcu 157
<210> 80
<211> 157
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 80
cuucaccuca cugagcgggg guuuuagagc uaggccaaca ugaggaucac ccaugucugc 60
agggccuagc aaguuaaaau aaggcuaguc cguuaucaac uuggccaaca ugaggaucac 120
ccaugucugc agggccaagu ggcaccgagu cggugcu 157
<210> 81
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 81
aagcggugaa auucuguggg 20
<210> 82
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 82
cacucaaaca gcaacgcggg 20
<210> 83
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 83
cuucaccuca cugagcgggg 20
<210> 84
<211> 1415
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 84
tttcccatga ttccttcata tttgcatata cgatacaagg ctgttagaga gataattgga 60
attaatttga ctgtaaacac aaagatatta gtacaaaata cgtgacgtag aaagtaataa 120
tttcttgggt agtttgcagt tttaaaatta tgttttaaaa tggactatca tatgcttacc 180
gtaacttgaa agtatttcga tttcttggct ttatatatct tgtggaaagg acgaaacacc 240
gaagcggtga aattctgtgg ggttttagag ctaggccaac atgaggatca cccatgtctg 300
cagggcctag caagttaaaa taaggctagt ccgttatcaa cttggccaac atgaggatca 360
cccatgtctg cagggccaag tggcaccgag tcggtgcttt ttttgtttta gagctagaaa 420
tagcaagtta aaataaggct agtccgtttt gagctccata agactcggcc ttagaacaag 480
ctttttccca tgattccttc atatttgcat atacgataca aggctgttag agagataatt 540
ggaattaatt tgactgtaaa cacaaagata ttagtacaaa atacgtgacg tagaaagtaa 600
taatttcttg ggtagtttgc agttttaaaa ttatgtttta aaatggacta tcatatgctt 660
accgtaactt gaaagtattt cgatttcttg gctttatata tcttgtggaa aggacgaaac 720
accgcactca aacagcaacg cggggtttta gagctaggcc aacatgagga tcacccatgt 780
ctgcagggcc tagcaagtta aaataaggct agtccgttat caacttggcc aacatgagga 840
tcacccatgt ctgcagggcc aagtggcacc gagtcggtgc tttttttgtt ttagagctag 900
aaatagcaag ttaaaataag gctagtccgt tttatgcatg tggctcccat ttatacctgg 960
ccggctttcc catgattcct tcatatttgc atatacgata caaggctgtt agagagataa 1020
ttggaattaa tttgactgta aacacaaaga tattagtaca aaatacgtga cgtagaaagt 1080
aataatttct tgggtagttt gcagttttaa aattatgttt taaaatggac tatcatatgc 1140
ttaccgtaac ttgaaagtat ttcgatttct tggctttata tatcttgtgg aaaggacgaa 1200
acaccgcttc acctcactga gcgggggttt tagagctagg ccaacatgag gatcacccat 1260
gtctgcaggg cctagcaagt taaaataagg ctagtccgtt atcaacttgg ccaacatgag 1320
gatcacccat gtctgcaggg ccaagtggca ccgagtcggt gctttttttg ttttagagct 1380
agaaatagca agttaaaata aggctagtcc gtttt 1415
<210> 85
<211> 1490
<212> DNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (28)..(267)
<223> hU6启动子
<220>
<221> misc_feature
<222> (268)..(287)
<223> 指导1
<220>
<221> misc_feature
<222> (288)..(424)
<223> SAM Tracr
<220>
<221> misc_feature
<222> (425)..(476)
<223> 扩展终止子
<220>
<221> misc_feature
<222> (510)..(749)
<223> hU6启动子
<220>
<221> misc_feature
<222> (751)..(770)
<223> 指导2
<220>
<221> misc_feature
<222> (771)..(907)
<223> SAM Tracr
<220>
<221> misc_feature
<222> (908)..(959)
<223> 扩展终止子
<220>
<221> misc_feature
<222> (992)..(1231)
<223> hU6启动子
<220>
<221> misc_feature
<222> (1233)..(1252)
<223> 指导3
<220>
<221> misc_feature
<222> (1253)..(1389)
<223> SAM Tracr
<220>
<221> misc_feature
<222> (1390)..(1441)
<223> 扩展终止子
<400> 85
gctagccata agactcggcc ttagaacttt cccatgattc cttcatattt gcatatacga 60
tacaaggctg ttagagagat aattggaatt aatttgactg taaacacaaa gatattagta 120
caaaatacgt gacgtagaaa gtaataattt cttgggtagt ttgcagtttt aaaattatgt 180
tttaaaatgg actatcatat gcttaccgta acttgaaagt atttcgattt cttggcttta 240
tatatcttgt ggaaaggacg aaacaccgaa gagtcatggg tcacagggtt ttagagctag 300
gccaacatga ggatcaccca tgtctgcagg gcctagcaag ttaaaataag gctagtccgt 360
tatcaacttg gccaacatga ggatcaccca tgtctgcagg gccaagtggc accgagtcgg 420
tgcttttttt gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttttgagc 480
tccataagac tcggccttag aacaagcttt ttcccatgat tccttcatat ttgcatatac 540
gatacaaggc tgttagagag ataattggaa ttaatttgac tgtaaacaca aagatattag 600
tacaaaatac gtgacgtaga aagtaataat ttcttgggta gtttgcagtt ttaaaattat 660
gttttaaaat ggactatcat atgcttaccg taacttgaaa gtatttcgat ttcttggctt 720
tatatatctt gtggaaagga cgaaacaccg caggcggggt gccaactcag gttttagagc 780
taggccaaca tgaggatcac ccatgtctgc agggcctagc aagttaaaat aaggctagtc 840
cgttatcaac ttggccaaca tgaggatcac ccatgtctgc agggccaagt ggcaccgagt 900
cggtgctttt tttgttttag agctagaaat agcaagttaa aataaggcta gtccgtttta 960
tgcatgtggc tcccatttat acctggccgg ctttcccatg attccttcat atttgcatat 1020
acgatacaag gctgttagag agataattgg aattaatttg actgtaaaca caaagatatt 1080
agtacaaaat acgtgacgta gaaagtaata atttcttggg tagtttgcag ttttaaaatt 1140
atgttttaaa atggactatc atatgcttac cgtaacttga aagtatttcg atttcttggc 1200
tttatatatc ttgtggaaag gacgaaacac cgaatattaa ctaacttctc ctgttttaga 1260
gctaggccaa catgaggatc acccatgtct gcagggccta gcaagttaaa ataaggctag 1320
tccgttatca acttggccaa catgaggatc acccatgtct gcagggccaa gtggcaccga 1380
gtcggtgctt tttttgtttt agagctagaa atagcaagtt aaaataaggc tagtccgttt 1440
tggtcaccca gtgaggaagc taggacagac ctaggacggt tgcctgcagg 1490
<210> 86
<211> 489
<212> DNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(318)
<223> mU6启动子
<220>
<221> misc_feature
<222> (319)..(338)
<223> 指导1
<220>
<221> misc_feature
<222> (339)..(475)
<223> SAM Tracr
<220>
<221> misc_feature
<222> (476)..(481)
<223> 小终止子
<400> 86
tgtacaaaaa agcaggcttt aaaggaacca attcagtcga ctggatccgg taccaaggtc 60
gggcaggaag agggcctatt tcccatgatt ccttcatatt tgcatatacg atacaaggct 120
gttagagaga taattagaat taatttgact gtaaacacaa agatattagt acaaaatacg 180
tgacgtagaa agtaataatt tcttgggtag tttgcagttt taaaattatg ttttaaaatg 240
gactatcata tgcttaccgt aacttgaaag tatttcgatt tcttggcttt atatatcttg 300
tggaaaggac gaaacaccga agagtcatgg gtcacagggt tttagagcta ggccaacatg 360
aggatcaccc atgtctgcag ggcctagcaa gttaaaataa ggctagtccg ttatcaactt 420
ggccaacatg aggatcaccc atgtctgcag ggccaagtgg caccgagtcg gtgctttttt 480
tctagaggc 489
<210> 87
<211> 490
<212> DNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(318)
<223> mU6启动子
<220>
<221> misc_feature
<222> (320)..(339)
<223> 指导2
<220>
<221> misc_feature
<222> (340)..(476)
<223> SAM Tracr
<220>
<221> misc_feature
<222> (477)..(482)
<223> 小终止子
<400> 87
tgtacaaaaa agcaggcttt aaaggaacca attcagtcga ctggatccgg taccaaggtc 60
gggcaggaag agggcctatt tcccatgatt ccttcatatt tgcatatacg atacaaggct 120
gttagagaga taattagaat taatttgact gtaaacacaa agatattagt acaaaatacg 180
tgacgtagaa agtaataatt tcttgggtag tttgcagttt taaaattatg ttttaaaatg 240
gactatcata tgcttaccgt aacttgaaag tatttcgatt tcttggcttt atatatcttg 300
tggaaaggac gaaacaccgc aggcggggtg ccaactcagg ttttagagct aggccaacat 360
gaggatcacc catgtctgca gggcctagca agttaaaata aggctagtcc gttatcaact 420
tggccaacat gaggatcacc catgtctgca gggccaagtg gcaccgagtc ggtgcttttt 480
ttctagaggc 490
<210> 88
<211> 489
<212> DNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(318)
<223> mU6启动子
<220>
<221> misc_feature
<222> (319)..(338)
<223> 指导3
<220>
<221> misc_feature
<222> (339)..(475)
<223> SAM Tracr
<220>
<221> misc_feature
<222> (476)..(481)
<223> 小终止子
<400> 88
tgtacaaaaa agcaggcttt aaaggaacca attcagtcga ctggatccgg taccaaggtc 60
gggcaggaag agggcctatt tcccatgatt ccttcatatt tgcatatacg atacaaggct 120
gttagagaga taattagaat taatttgact gtaaacacaa agatattagt acaaaatacg 180
tgacgtagaa agtaataatt tcttgggtag tttgcagttt taaaattatg ttttaaaatg 240
gactatcata tgcttaccgt aacttgaaag tatttcgatt tcttggcttt atatatcttg 300
tggaaaggac gaaacaccaa tattaactaa cttctcctgt tttagagcta ggccaacatg 360
aggatcaccc atgtctgcag ggcctagcaa gttaaaataa ggctagtccg ttatcaactt 420
ggccaacatg aggatcaccc atgtctgcag ggccaagtgg caccgagtcg gtgctttttt 480
tctagaggc 489
<210> 89
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 89
gaagagtcat gggtcacagg 20
<210> 90
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 90
caggcggggt gccaactcag 20
<210> 91
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 91
aatattaact aacttctcct 20
<210> 92
<211> 157
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 92
gaagagucau gggucacagg guuuuagagc uaggccaaca ugaggaucac ccaugucugc 60
agggccuagc aaguuaaaau aaggcuaguc cguuaucaac uuggccaaca ugaggaucac 120
ccaugucugc agggccaagu ggcaccgagu cggugcu 157
<210> 93
<211> 157
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 93
caggcggggu gccaacucag guuuuagagc uaggccaaca ugaggaucac ccaugucugc 60
agggccuagc aaguuaaaau aaggcuaguc cguuaucaac uuggccaaca ugaggaucac 120
ccaugucugc agggccaagu ggcaccgagu cggugcu 157
<210> 94
<211> 157
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 94
aauauuaacu aacuucuccu guuuuagagc uaggccaaca ugaggaucac ccaugucugc 60
agggccuagc aaguuaaaau aaggcuaguc cguuaucaac uuggccaaca ugaggaucac 120
ccaugucugc agggccaagu ggcaccgagu cggugcu 157
<210> 95
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 95
gaagagucau gggucacagg 20
<210> 96
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 96
caggcggggu gccaacucag 20
<210> 97
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 97
aauauuaacu aacuucuccu 20
<210> 98
<211> 1414
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 98
tttcccatga ttccttcata tttgcatata cgatacaagg ctgttagaga gataattgga 60
attaatttga ctgtaaacac aaagatatta gtacaaaata cgtgacgtag aaagtaataa 120
tttcttgggt agtttgcagt tttaaaatta tgttttaaaa tggactatca tatgcttacc 180
gtaacttgaa agtatttcga tttcttggct ttatatatct tgtggaaagg acgaaacacc 240
gaagagtcat gggtcacagg gttttagagc taggccaaca tgaggatcac ccatgtctgc 300
agggcctagc aagttaaaat aaggctagtc cgttatcaac ttggccaaca tgaggatcac 360
ccatgtctgc agggccaagt ggcaccgagt cggtgctttt tttgttttag agctagaaat 420
agcaagttaa aataaggcta gtccgttttg agctccataa gactcggcct tagaacaagc 480
tttttcccat gattccttca tatttgcata tacgatacaa ggctgttaga gagataattg 540
gaattaattt gactgtaaac acaaagatat tagtacaaaa tacgtgacgt agaaagtaat 600
aatttcttgg gtagtttgca gttttaaaat tatgttttaa aatggactat catatgctta 660
ccgtaacttg aaagtatttc gatttcttgg ctttatatat cttgtggaaa ggacgaaaca 720
ccgcaggcgg ggtgccaact caggttttag agctaggcca acatgaggat cacccatgtc 780
tgcagggcct agcaagttaa aataaggcta gtccgttatc aacttggcca acatgaggat 840
cacccatgtc tgcagggcca agtggcaccg agtcggtgct ttttttgttt tagagctaga 900
aatagcaagt taaaataagg ctagtccgtt ttatgcatgt ggctcccatt tatacctggc 960
cggctttccc atgattcctt catatttgca tatacgatac aaggctgtta gagagataat 1020
tggaattaat ttgactgtaa acacaaagat attagtacaa aatacgtgac gtagaaagta 1080
ataatttctt gggtagtttg cagttttaaa attatgtttt aaaatggact atcatatgct 1140
taccgtaact tgaaagtatt tcgatttctt ggctttatat atcttgtgga aaggacgaaa 1200
caccgaatat taactaactt ctcctgtttt agagctaggc caacatgagg atcacccatg 1260
tctgcagggc ctagcaagtt aaaataaggc tagtccgtta tcaacttggc caacatgagg 1320
atcacccatg tctgcagggc caagtggcac cgagtcggtg ctttttttgt tttagagcta 1380
gaaatagcaa gttaaaataa ggctagtccg tttt 1414

Claims (109)

1.一种非人动物,其包含第一基因组整合表达盒,其中所述第一表达盒包含:
(a)编码嵌合成簇的规律间隔的短回文重复序列(CRISPR)相关(Cas)蛋白的核酸,所述蛋白包含与一个或多个转录激活域融合的核酸酶失活的Cas蛋白;以及
(b)编码嵌合衔接体蛋白的核酸,所述嵌合衔接体蛋白包含与一个或多个转录激活域融合的衔接体。
2.根据权利要求1所述的非人动物,还包含一个或多个指导RNA或编码所述一个或多个指导RNA的表达盒,每个所述指导RNA包含一个或多个衔接体结合元件,所述嵌合衔接体蛋白可以特异性结合至所述衔接体结合元件,且
其中所述一个或多个指导RNA中的每一个能够与所述Cas蛋白形成复合物并将所述Cas蛋白引导至靶基因内的靶序列。
3.根据权利要求1所述的非人动物,还包含编码一个或多个指导RNA的第二基因组整合表达盒,每个所述指导RNA包含一个或多个衔接体结合元件,所述嵌合衔接体蛋白可以特异性结合至所述衔接体结合元件,且
其中所述一个或多个指导RNA中的每一个能够与所述Cas蛋白形成复合物并将所述Cas蛋白引导至靶基因内的靶序列。
4.根据权利要求2或3所述的非人动物,其中所述靶序列包含所述靶基因内的调控序列。
5.根据权利要求4所述的非人动物,其中所述调控序列包含启动子或增强子。
6.根据权利要求2-5中任意一项所述的非人动物,其中所述靶序列在所述靶基因的转录起始位点的200个碱基对内。
7.根据权利要求6所述的非人动物,其中所述靶序列在所述转录起始位点上游的200个碱基对和所述转录起始位点下游的1个碱基对的区域内。
8.根据权利要求2-7中任意一项所述的非人动物,其中编码所述一个或多个指导RNA中的每一个的序列可操作地连接至不同的U6启动子。
9.根据权利要求2-8中任意一项所述的非人动物,其中所述一个或多个指导RNA中的每一个包含两个衔接体结合元件,所述嵌合衔接体蛋白可以特异性地与所述两个衔接体结合元件结合。
10.根据权利要求9所述的非人动物,其中第一衔接体结合元件在所述一个或多个指导RNA的每一个的第一环内,且第二衔接体结合元件在所述一个或多个指导RNA的每一个的第二环内。
11.根据权利要求10所述的非人动物,其中所述一个或多个指导RNA中的每一个是单指导RNA,所述单指导RNA包含融合至反式激活CRISPR RNA(tracrRNA)部分的CRISPR RNA(crRNA)部分,且
其中所述第一环是对应于SEQ ID NO:12的残基13-16的四环,且所述第二环是对应于SEQ ID NO:12的残基53-56的茎环2。
12.根据权利要求2-11中任意一项所述的非人动物,其中所述衔接体结合元件包含SEQID NO:16所示的序列。
13.根据权利要求12所述的非人动物,其中所述一个或多个指导RNA中的每一个包含SEQ ID NO:40或63所示的序列。
14.根据权利要求2-13中任意一项所述的非人动物,其中所述一个或多个指导RNA中的至少一个靶向Ttr基因,可选地,其中Ttr靶向的指导RNA靶向包含SEQ ID NO:34-36中任一个所示的序列的序列,或可选地,其中所述Ttr靶向的指导RNA包含SEQ ID NO:37-39中任一个所示的序列。
15.根据权利要求2-13中任意一项所述的非人动物,其中所述一个或多个指导RNA中的至少一个靶向Pcsk9基因,可选地,其中Pcsk9靶向的指导RNA靶向包含SEQ ID NO:89-91中任一个所示的序列的序列,或可选地,其中所述Pcsk9靶向的指导RNA包含SEQ ID NO:92-94中任一个所示的序列。
16.根据权利要求2-13中任意一项所述的非人动物,其中所述一个或多个指导RNA中的至少一个靶向Ldlr基因,可选地,其中Ldlr靶向的指导RNA靶向包含SEQ ID NO:75-77中任一个所示的序列的序列,或可选地,其中所述Ldlr靶向的指导RNA包含SEQ ID NO:78-80中任一个所示的序列。
17.根据权利要求2-16中任意一项所述的非人动物,其中所述一个或多个指导RNA靶向两个或多个靶基因。
18.根据权利要求2-17中任意一项所述的非人动物,其中所述一个或多个指导RNA包含靶向单个靶基因的多个指导RNA。
19.根据权利要求2-18中任意一项所述的非人动物,其中所述一个或多个指导RNA包含靶向单个靶基因的至少三个指导RNA。
20.根据权利要求19所述的非人动物,其中所述至少三个指导RNA靶向小鼠Ttr基因座,其中第一指导RNA靶向包含SEQ ID NO:34的序列或包含SEQ ID NO:37所示的序列,第二指导RNA靶向包含SEQ ID NO:35的序列或包含SEQ ID NO:38所示的序列,且第三指导RNA靶向包含SEQ ID NO:36的序列或包含SEQ ID NO:39所示的序列。
21.根据权利要求19所述的非人动物,其中所述至少三个指导RNA靶向小鼠Pcsk9基因座,其中第一指导RNA靶向包含SEQ ID NO:89的序列或包含SEQ ID NO:92所示的序列,第二指导RNA靶向包含SEQ ID NO:90的序列或包含SEQ ID NO:93所示的序列,且第三指导RNA靶向包含SEQ ID NO:91的序列或包含SEQ ID NO:94所示的序列。
22.根据权利要求19所述的非人动物,其中所述至少三个指导RNA靶向小鼠Ldlr基因座,且其中第一指导RNA靶向包含SEQ ID NO:75的序列或包含SEQ ID NO:78所示的序列,第二指导RNA靶向包含SEQ ID NO:76的序列或包含SEQ ID NO:79所示的序列,且第三指导RNA靶向包含SEQ ID NO:77的序列或包含SEQ ID NO:80中所示的序列。
23.根据前述权利要求中任意一项所述的非人动物,其中所述Cas蛋白是Cas9蛋白。
24.根据权利要求23所述的非人动物,其中所述Cas9蛋白是化脓链球菌Cas9蛋白。
25.根据权利要求23或24所述的非人动物,其中当与化脓链球菌Cas9蛋白最佳比对时,所述Cas9蛋白包含对应于D10A和N863A的突变。
26.根据前述权利要求中任意一项所述的非人动物,其中对编码所述Cas蛋白的序列进行密码子优化以在所述非人动物中表达。
27.根据前述权利要求中任意一项所述的非人动物,其中嵌合Cas蛋白中的一个或多个转录激活因子结构域选自:VP16、VP64、p65、MyoD1、HSF1、RTA、SET7/9及其组合。
28.根据权利要求27所述的非人动物,其中所述嵌合Cas蛋白中的一个或多个转录激活因子结构域包含VP64。
29.根据权利要求28所述的非人动物,其中所述嵌合Cas蛋白从N末端到C末端包括:无催化活性的Cas蛋白质、核定位信号,和VP64转录激活因子结构域。
30.根据权利要求29所述的非人动物,其中所述嵌合Cas蛋白包含与SEQ ID NO:1所示的序列至少90%、95%、96%、97%、98%、99%,或100%相同的序列。
31.根据权利要求30所述的非人动物,其中编码所述嵌合Cas蛋白的第一表达盒的片段包含与SEQ ID NO:25所示的序列至少90%、95%、96%、97%、98%、99%,或100%相同的序列。
32.根据前述权利要求中任意一项所述的非人动物,其中所述第一表达盒进一步包含在编码所述嵌合Cas蛋白的片段的上游的多腺苷酸化信号或转录终止子,
其中所述多腺苷酸化信号或所述转录终止子被重组酶识别位点侧接,且
其中所述多腺苷酸化信号或所述转录终止子已以组织特异性方式切除。
33.根据权利要求32所述的非人动物,其中已经在肝脏中切除了所述多腺苷酸化信号或所述转录终止子。
34.根据权利要求32或33所述的非人动物,其中所述重组酶是Cre重组酶。
35.根据权利要求32-34中任意一项所述的非人动物,其中所述非人动物还包含基因组整合的重组酶表达盒,所述基因组整合的重组酶表达盒包含可操作地连接至组织特异性启动子的重组酶编码序列。
36.根据权利要求32-35中任意一项所述的非人动物,其中重组酶基因可操作地连接于表2所示的启动子之一。
37.根据前述权利要求中任意一项所述的非人动物,其中衔接体位于所述嵌合衔接体蛋白的N末端,且一个或多个转录激活域位于所述嵌合衔接体蛋白的C末端。
38.根据前述权利要求中任意一项所述的非人动物,其中衔接体包含MS2外壳蛋白或其功能片段或变体。
39.根据前述权利要求中任意一项所述的非人动物,其中所述嵌合衔接体蛋白中的一个或多个转录激活域选自:VP16、VP64、p65、MyoD1、HSF1、RTA、SET7/9及其组合。
40.根据权利要求39所述的非人动物,其中所述嵌合衔接体蛋白中的一个或多个转录激活域包含p65和HSF1。
41.根据权利要求40所述的非人动物,其中所述嵌合衔接体蛋白从N末端至C末端包含:MS2外壳蛋白、核定位信号、p65转录激活域,和HSF1转录激活域。
42.根据权利要求41所述的非人动物,其中所述嵌合衔接体蛋白包含与SEQ ID NO:6所示的序列至少90%、95%、96%、97%、98%、99%,或100%相同的序列。
43.根据权利要求42所述的非人动物,其中编码所述嵌合衔接体蛋白的第一表达盒的片段包含与SEQ ID NO:27所示的序列至少90%、95%、96%、97%、98%、99%,或100%相同的序列。
44.根据前述权利要求中任意一项所述的非人动物,其中所述第一表达盒是多顺反子。
45.根据权利要求44所述的非人动物,其中通过内部核糖体进入位点(IRES)将编码所述嵌合Cas蛋白的所述第一表达盒的片段与编码所述嵌合衔接体蛋白的所述第一表达盒的片段分开。
46.根据权利要求44所述的非人动物,其中通过编码2A肽的核酸将编码所述嵌合Cas蛋白的所述第一表达盒的片段与编码所述嵌合衔接体蛋白的所述第一表达盒的片段分开。
47.根据权利要求46所述的非人动物,其中所述2A肽是T2A肽。
48.根据前述权利要求中任意一项所述的非人动物,其中所述第一表达盒被整合到安全港基因座中。
49.根据权利要求2-48中任意一项所述的非人动物,其中所述第一表达盒和/或所述第二表达盒被整合到安全港基因座中。
50.根据权利要求49所述的非人动物,其中所述非人动物对于所述第一表达盒是杂合的,且对于所述第二表达盒是杂合的,且
所述第一表达盒基因组整合于所述安全港基因座的第一等位基因中,且所述第二表达盒基因组整合于所述安全港基因座的第二等位基因中。
51.根据权利要求48-50中任意一项所述的非人动物,其中所述安全港基因座是Rosa26基因座。
52.根据权利要求48-51中任意一项所述的非人动物,其中所述第一表达盒与所述安全港基因座中的内源启动子可操作地连接。
53.根据前述权利要求中任意一项所述的非人动物,其中所述非人动物是哺乳动物。
54.根据权利要求53所述的非人动物,其中所述哺乳动物是啮齿动物。
55.根据权利要求54所述的非人动物,其中所述啮齿动物是大鼠或小鼠。
56.根据权利要求55所述的非人动物,其中所述啮齿动物是小鼠。
57.包含基因组整合的表达盒的非人动物细胞,其中所述表达盒包含:
(a)编码嵌合成簇的规律间隔的短回文重复序列(CRISPR)相关(Cas)蛋白的核酸,所述蛋白包含与一个或多个转录激活域融合的核酸酶失活的Cas蛋白;以及
(b)编码嵌合衔接体蛋白的核酸,所述嵌合衔接体蛋白包含与一个或多个转录激活域融合的衔接体。
58.包含基因组整合的表达盒的非人动物基因组,其中所述表达盒包含:
(a)编码嵌合成簇的规律间隔的短回文重复序列(CRISPR)相关(Cas)蛋白的核酸,所述蛋白包含与一个或多个转录激活域融合的核酸酶失活的Cas蛋白;以及
(b)编码嵌合衔接体蛋白的核酸,所述嵌合衔接体蛋白包含与一个或多个转录激活域融合的衔接体。
59.靶向载体,其包含被在靶基因组基因座处靶向5'靶序列的5'同源臂和在所述靶基因组基因座处靶向3'靶序列的3'同源臂侧接的插入核酸,其中所述插入核酸包含表达盒,其中所述表达盒包含:
(a)编码嵌合成簇的规律间隔的短回文重复序列(CRISPR)相关(Cas)蛋白的核酸,所述蛋白包含与一个或多个转录激活域融合的核酸酶失活的Cas蛋白;以及
(b)编码嵌合衔接体蛋白的核酸,所述嵌合衔接体蛋白包含与一个或多个转录激活域融合的衔接体。
60.制造根据权利要求1-56中任意一项所述的非人动物的方法,包括:
(a)向非人动物胚胎干(ES)细胞引入:
(i)靶向靶基因组基因座中的靶序列的核酸酶剂;和
(ii)靶向载体,其包含核酸插入物,所述核酸插入物包含第一表达盒,所述第一表达盒被在靶基因组基因座中对应5'靶序列的5'同源臂和在靶基因组基因座中对应3'靶序列的3'同源臂侧接,
其中所述靶向载体与所述靶基因组基因座重组以产生遗传修饰的非人ES细胞,所述遗传修饰的非人ES细胞在其基因组中包含所述靶基因组基因座处的所述第一表达盒;
(b)将所述遗传修饰的非人ES细胞引入非人动物宿主胚胎中;以及
(c)在代孕母体中孕育所述非人动物宿主胚胎,其中所述代孕母体产生F0代遗传修饰的非人动物,所述非人动物的基因组中包含所述靶基因组基因座处的所述第一表达盒。
61.根据权利要求60所述的方法,其中所述靶向载体为长度至少为10kb的大靶向载体,或其中所述5'同源臂和所述3'同源臂的长度总和至少为10kb。
62.制造根据权利要求1-56中任意一项所述的非人动物的方法,包括:
(a)向非人动物单细胞期胚胎引入:
(i)靶向靶基因组基因座中的靶序列的核酸酶剂;和
(ii)靶向载体,其包含核酸插入物,所述核酸插入物包含第一表达盒,所述第一表达盒被在所述靶基因组基因座中对应5'靶序列的5'同源臂和在所述靶基因组基因座中对应3'靶序列的3'同源臂侧接,
其中所述靶向载体与所述靶基因组基因座重组以产生遗传修饰的非人ES细胞,所述遗传修饰的非人ES细胞在其基因组中包含所述靶基因组基因座处的所述第一表达盒;
(b)在代孕母体中孕育遗传修饰的非人动物单细胞期胚胎,以产生遗传修饰的F0代非人动物,所述遗传修饰的F0代非人动物在其基因组中包含在所述靶基因组基因座处的所述第一表达盒。
63.根据权利要求60-62中任意一项所述的方法,其中所述核酸酶剂包括Cas蛋白和指导RNA。
64.根据权利要求63所述的方法,其中所述Cas蛋白是Cas9蛋白。
65.根据权利要求63或64所述的方法,其中步骤(a)进一步包括引入在所述靶基因组基因座内靶向第二靶序列的第二指导RNA。
66.根据权利要求60-65中任意一项所述的方法,其中所述非人动物是小鼠或大鼠。
67.根据权利要求66所述的方法,其中所述非人动物是小鼠。
68.一种增加靶基因在权利要求1-56中任意一项所述的非人动物体内的表达的方法,包括将一个或多个指导RNA引入所述非人动物,每个所述指导RNA包含一个或多个衔接体结合元件,所述嵌合衔接体蛋白可以特异性结合至所述衔接体结合元件,
其中所述一个或多个指导RNA与所述嵌合Cas蛋白和嵌合衔接体蛋白形成复合物并将它们引导至所述靶基因内的靶序列,从而增加所述靶基因的表达。
69.根据权利要求68所述的方法,其中通过腺相关病毒(AAV)介导的递送引入所述一个或多个指导RNA。
70.根据权利要求69所述的方法,其中所述AAV是AAV8。
71.根据权利要求68所述的方法,其中通过脂质纳米颗粒介导的递送或流体动力递送来引入所述一个或多个指导RNA。
72.根据权利要求68-71中任意一项所述的方法,其中所述靶基因是在肝脏中表达的基因。
73.根据权利要求68-72中任意一项所述的方法,其中将所述一个或多个指导RNA给予所述非人动物的途径是静脉内注射、脑内注射、腹膜内注射、滴鼻法,或玻璃体内注射。
74.根据权利要求68-72中任意一项所述的方法,其中所述靶序列包含所述靶基因内的调控序列。
75.根据权利要求74所述的方法,其中所述调控序列包含启动子或增强子。
76.根据权利要求68-75中任意一项所述的方法,其中所述靶序列在所述靶基因的所述转录起始位点的200个碱基对内。
77.根据权利要求76所述的方法,其中所述靶序列在所述转录起始位点上游的200个碱基对和所述转录起始位点下游的1个碱基对的区域内。
78.根据权利要求68-77中任意一项所述的方法,其中所述一个或多个指导RNA以RNA的形式被引入。
79.根据权利要求68-77中任意一项所述的方法,其中所述一个或多个指导RNA以DNA的形式被引入。
80.根据权利要求79所述的方法,其中所述一个或多个指导RNA中的每一个可操作地连接至不同U6启动子。
81.根据权利要求68-80中任意一项所述的方法,其中所述一个或多个指导RNA中的每一个均包含两个衔接体结合元件,所述嵌合衔接体蛋白可以特异性地与所述两个衔接体结合元件结合。
82.根据权利要求81所述的方法,其中第一衔接体结合元件在所述一个或多个指导RNA的每一个的第一环内,且第二衔接体结合元件在所述一个或多个指导RNA的每一个的第二环内。
83.根据权利要求82所述的方法,其中所述一个或多个指导RNA中的每一个是单指导RNA,所述单指导RNA包含融合至反式激活CRISPR RNA(tracrRNA)部分的CRISPR RNA(crRNA)部分,且
其中所述第一环是对应于SEQ ID NO:12的残基13-16的四环,所述第二环是对应于SEQID NO:12的残基53-56的茎环2。
84.根据权利要求68-83中任意一项所述的方法,其中所述衔接体结合元件包含SEQ IDNO:16所示的序列。
85.根据权利要求84所述的方法,其中所述一个或多个指导RNA中的每一个包含SEQ IDNO:40或63所示的序列。
86.根据权利要求68-85中任意一项所述的方法,其中所述一个或多个指导RNA中的至少一个靶向疾病相关基因。
87.根据权利要求86所述的方法,其中所述疾病相关基因是Ttr基因,可选地,其中Ttr靶向的指导RNA靶向包含SEQ ID NO:34-36中任一个所示的序列的序列,或可选地,其中所述Ttr靶向的指导RNA包含SEQ ID NO:37-39中任意一项所示的序列。
88.根据权利要求68-85中任意一项所述的方法,其中所述一个或多个指导RNA中的至少一个靶向Pcsk9基因,可选地,其中Pcsk9靶向的指导RNA靶向包含SEQ ID NO:89-91中任一个所示的序列的序列,或可选地,其中所述Pcsk9靶向的指导RNA包含SEQ ID NO:92-94中任一个所示的序列。
89.根据权利要求88所述的方法,其中所述方法在所述非人动物中引起高胆固醇血症。
90.根据权利要求68-85中任意一项所述的方法,其中所述一个或多个指导RNA中的至少一个靶向Ldlr基因,可选地,其中Ldlr靶向的指导RNA靶向包含SEQ ID NO:75-77中任一个所示的序列的序列,或可选地,其中所述Ldlr靶向的指导RNA包含SEQ ID NO:78-80中任一个所示的序列。
91.根据权利要求68-90中任意一项所述的方法,其中所述一个或多个指导RNA靶向两个或多个靶基因。
92.根据权利要求68-91中任意一项所述的方法,其中所述一个或多个指导RNA包含靶向单个靶基因的多个指导RNA。
93.根据权利要求68-92中任意一项所述的方法,其中所述一个或多个指导RNA包含靶向单个靶基因的至少三个指导RNA。
94.根据权利要求93所述的方法,其中所述至少三个指导RNA靶向所述小鼠Ttr基因座,其中第一指导RNA靶向包含SEQ ID NO:34的序列或包含SEQ ID NO:37所示的序列,第二指导RNA靶向包含SEQ ID NO:35的序列或包含SEQ ID NO:38所示的序列,且第三指导RNA靶向包含SEQ ID NO:36的序列或包含SEQ ID NO:39所示的序列。
95.根据权利要求93所述的方法,其中所述至少三个指导RNA靶向所述小鼠Pcsk9基因座,且其中第一指导RNA靶向包含SEQ ID NO:89的序列或包含SEQ ID NO:92所示的序列,第二指导RNA靶向包含SEQ ID NO:90的序列或包含SEQ ID NO:93所示的序列,且第三指导RNA靶向包含SEQ ID NO:91的序列或包含SEQ ID NO:94所示的序列。
96.根据权利要求93所述的方法,其中所述至少三个指导RNA靶向所述小鼠Ldlr基因座,其中第一指导RNA靶向包含SEQ ID NO:75的序列或包含SEQ ID NO:78所示的序列,第二指导RNA靶向包含SEQ ID NO:76的序列或包含SEQ ID NO:79所述的序列,且第三指导RNA靶向包含SEQ ID NO:77的序列或包含SEQ ID NO:80中所述的序列。
97.根据权利要求68-96中任意一项所述的方法,其中所述靶基因的表达相对于对照非人动物增加至少0.5倍、1倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍,或20倍。
98.根据权利要求68-97中任意一项所述的方法,其中所述第一表达盒在编码所述嵌合Cas蛋白的片段的上游还包含多腺苷酸化信号或转录终止子,
其中所述多腺苷酸化信号或所述转录终止子被重组酶识别位点侧接,所述重组酶识别位点被位点特异性重组酶识别,且
其中所述方法进一步包括将所述重组酶引入所述非人动物中。
99.根据权利要求98所述的方法,其中所述重组酶是Cre重组酶。
100.根据权利要求98或99所述的方法,其中所述重组酶通过腺相关病毒(AAV)介导的递送而引入。
101.根据权利要求100所述的方法,其中所述AAV是AAV8。
102.根据权利要求98或99所述的方法,其中所述重组酶通过脂质纳米颗粒介导的递送或流体动力递送引入。
103.根据权利要求98-102中任意一项所述的方法,其中以组织特异性的方式引入或表达所述重组酶。
104.根据权利要求98-102中任意一项所述的方法,其中以蛋白形式引入所述重组酶。
105.根据权利要求98-102中任意一项所述的方法,其中以DNA或RNA的形式引入所述重组酶。
106.根据权利要求105所述的方法,其中以与表2中列出的启动子之一可操作地连接的DNA的形式引入所述重组酶。
107.根据权利要求98-106中任意一项所述的方法,其中向所述非人动物施用所述重组酶的途径是静脉内注射、脑内注射、腹膜内注射、滴鼻法,或玻璃体内注射。
108.根据权利要求68-107中任意一项所述的方法,其中所述一个或多个指导RNA通过腺相关病毒(AAV)介导的递送被引入,其中所述一个或多个指导RNA中的每一个可操作地连接至不同的U6启动子,并且其中所述一个或多个指导RNA包括靶向单个靶基因的多个指导RNA。
109.一种在非人动物体内模拟高胆固醇血症的方法,包括将一个或多个靶向Pcsk9的指导RNA引入权利要求1-56中任意一项所述的非人动物,其中所述一个或多个指导RNA中的每一个包含一个或多个嵌合体结合元件,所述嵌合衔接体蛋白可以特异性结合至所述衔接体结合元件,
其中所述一个或多个指导RNA与所述嵌合Cas蛋白和嵌合衔接体蛋白形成复合物,并将它们引导至Pcsk9内的靶序列,从而增加Pcsk9的表达并引起高胆固醇血症。
CN201980020470.5A 2018-03-19 2019-03-19 使用crispr/cas系统对动物进行转录调制 Active CN111885915B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310370809.2A CN116349651A (zh) 2018-03-19 2019-03-19 使用crispr/cas系统对动物进行转录调制

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862644961P 2018-03-19 2018-03-19
US62/644,961 2018-03-19
PCT/US2019/023009 WO2019183123A1 (en) 2018-03-19 2019-03-19 Transcription modulation in animals using crispr/cas systems

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202310370809.2A Division CN116349651A (zh) 2018-03-19 2019-03-19 使用crispr/cas系统对动物进行转录调制

Publications (2)

Publication Number Publication Date
CN111885915A true CN111885915A (zh) 2020-11-03
CN111885915B CN111885915B (zh) 2023-04-28

Family

ID=66102210

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202310370809.2A Pending CN116349651A (zh) 2018-03-19 2019-03-19 使用crispr/cas系统对动物进行转录调制
CN201980020470.5A Active CN111885915B (zh) 2018-03-19 2019-03-19 使用crispr/cas系统对动物进行转录调制

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202310370809.2A Pending CN116349651A (zh) 2018-03-19 2019-03-19 使用crispr/cas系统对动物进行转录调制

Country Status (8)

Country Link
US (2) US11519004B2 (zh)
EP (1) EP3592140A1 (zh)
JP (1) JP7334178B2 (zh)
KR (2) KR102647714B1 (zh)
CN (2) CN116349651A (zh)
AU (2) AU2019239880B2 (zh)
CA (1) CA3089331A1 (zh)
WO (1) WO2019183123A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113122581A (zh) * 2021-04-13 2021-07-16 上海长征医院 一种Hsf1基因敲除小鼠模型的建立及应用
WO2024036600A1 (zh) * 2022-08-19 2024-02-22 中国农业科学院作物科学研究所 一种母体细胞自主的孤雌单倍体生殖方法及其育种应用

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102647714B1 (ko) 2018-03-19 2024-03-18 리제너론 파마슈티칼스 인코포레이티드 CRISPR/Cas 시스템을 사용한 동물에서의 전사 조절
CN113166754A (zh) 2018-10-16 2021-07-23 蓝色等位基因有限责任公司 用于将dna靶向插入基因中的方法
JP7461368B2 (ja) 2019-03-18 2024-04-03 リジェネロン・ファーマシューティカルズ・インコーポレイテッド タウの播種または凝集の遺伝的修飾因子を同定するためのcrispr/casスクリーニングプラットフォーム
KR20210141536A (ko) 2019-03-18 2021-11-23 리제너론 파마슈티칼스 인코포레이티드 타우 응집과 관련된 유전적 취약성을 식별하기 위한 CRISPR/Cas 드랍아웃 스크리닝 플랫폼
US11891618B2 (en) 2019-06-04 2024-02-06 Regeneron Pharmaceuticals, Inc. Mouse comprising a humanized TTR locus with a beta-slip mutation and methods of use
EP3813522A1 (en) 2019-06-14 2021-05-05 Regeneron Pharmaceuticals, Inc. Models of tauopathy
WO2021108363A1 (en) 2019-11-25 2021-06-03 Regeneron Pharmaceuticals, Inc. Crispr/cas-mediated upregulation of humanized ttr allele
AU2020405289A1 (en) * 2019-12-17 2022-07-21 Aridis Pharmaceuticals, Inc. Methods of enhancing and expediting expression of antibodies
US20230102342A1 (en) 2020-03-23 2023-03-30 Regeneron Pharmaceuticals, Inc. Non-human animals comprising a humanized ttr locus comprising a v30m mutation and methods of use
US20230374528A1 (en) * 2020-08-17 2023-11-23 University Of Maryland, College Park Compositions, systems, and methods for orthogonal genome engineering in plants
EP4256052A1 (en) * 2020-12-02 2023-10-11 Decibel Therapeutics, Inc. Crispr sam biosensor cell lines and methods of use thereof
WO2023108047A1 (en) 2021-12-08 2023-06-15 Regeneron Pharmaceuticals, Inc. Mutant myocilin disease model and uses thereof

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101918431A (zh) * 2007-09-25 2010-12-15 田园温室气体研究有限公司 用于微生物细胞的细胞通透肽和多肽
CN104357422A (zh) * 2014-10-08 2015-02-18 绍兴市人民医院 转录激活子样效应因子核酸酶及其编码基因与应用
CN105164264A (zh) * 2012-12-12 2015-12-16 布罗德研究所有限公司 用于序列操纵和治疗应用的系统、方法和组合物的递送、工程化和优化
WO2016049258A2 (en) * 2014-09-25 2016-03-31 The Broad Institute Inc. Functional screening with optimized functional crispr-cas systems
US20160208243A1 (en) * 2015-06-18 2016-07-21 The Broad Institute, Inc. Novel crispr enzymes and systems
WO2018005873A1 (en) * 2016-06-29 2018-01-04 The Broad Institute Inc. Crispr-cas systems having destabilization domain
CN107603976A (zh) * 2012-05-25 2018-01-19 埃玛纽埃尔·沙尔庞捷 用于rna定向的靶dna修饰和用于rna定向的转录调节的方法和组合物
CN107614680A (zh) * 2015-05-14 2018-01-19 南加利福尼亚大学 利用重组核酸内切酶系统的最佳化基因编辑
CN107760715A (zh) * 2017-10-17 2018-03-06 云南瑞火生物科技有限公司 一种精准高效的转基因载体及其构建方法和应用
CN107805632A (zh) * 2016-09-06 2018-03-16 中国科学院微生物研究所 OsMKK6蛋白及编码基因在调控植物种子发育中的应用

Family Cites Families (104)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5523226A (en) 1993-05-14 1996-06-04 Biotechnology Research And Development Corp. Transgenic swine compositions and methods
WO1999005266A2 (en) 1997-07-26 1999-02-04 Wisconsin Alumni Research Foundation Trans-species nuclear transfer
US6586251B2 (en) 2000-10-31 2003-07-01 Regeneron Pharmaceuticals, Inc. Methods of modifying eukaryotic cells
US20050144655A1 (en) 2000-10-31 2005-06-30 Economides Aris N. Methods of modifying eukaryotic cells
AUPR451401A0 (en) 2001-04-20 2001-05-24 Monash University A method of nuclear transfer
CA2474486C (en) 2002-01-23 2013-05-14 The University Of Utah Research Foundation Targeted chromosomal mutagenesis using zinc finger nucleases
EP2368982A3 (en) 2002-03-21 2011-10-12 Sangamo BioSciences, Inc. Methods and compositions for using zinc finger endonucleases to enhance homologous recombination
US7612250B2 (en) 2002-07-29 2009-11-03 Trustees Of Tufts College Nuclear transfer embryo formation method
CA2497913C (en) 2002-09-05 2014-06-03 California Institute Of Technology Use of chimeric nucleases to stimulate gene targeting
US7888121B2 (en) 2003-08-08 2011-02-15 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
US8409861B2 (en) 2003-08-08 2013-04-02 Sangamo Biosciences, Inc. Targeted deletion of cellular DNA sequences
US7972854B2 (en) 2004-02-05 2011-07-05 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
CA2579677A1 (en) 2004-09-16 2006-03-30 Sangamo Biosciences, Inc. Compositions and methods for protein production
DK1802193T3 (da) 2004-10-19 2014-06-10 Regeneron Pharma Fremgangsmåde til frembringelse af en homozygot mus til genetisk modifikation
AU2007267887B2 (en) 2006-05-25 2013-05-30 Sangamo Therapeutics, Inc. Variant Foki Cleavage Half-Domains
EP2019839B1 (en) 2006-05-25 2011-12-07 Sangamo BioSciences, Inc. Methods and compositions for gene inactivation
CN101117633B (zh) 2006-08-03 2011-07-20 上海交通大学附属儿童医院 一种细胞核移植方法
US10155038B2 (en) 2007-02-02 2018-12-18 Yale University Cells prepared by transient transfection and methods of use thereof
US8110379B2 (en) 2007-04-26 2012-02-07 Sangamo Biosciences, Inc. Targeted integration into the PPP1R12C locus
WO2008149176A1 (en) 2007-06-06 2008-12-11 Cellectis Meganuclease variants cleaving a dna target sequence from the mouse rosa26 locus and uses thereof
KR20100120226A (ko) 2008-04-11 2010-11-12 유티씨 파워 코포레이션 매니폴드 섬프를 갖는 바이폴라 플레이트 및 연료 전지
ES2627552T3 (es) 2008-12-04 2017-07-28 Sigma Aldrich Company Edición de genoma en ratas usando nucleasas con dedos de cinc
US8771985B2 (en) 2010-04-26 2014-07-08 Sangamo Biosciences, Inc. Genome editing of a Rosa locus using zinc-finger nucleases
CN103025344B (zh) 2010-05-17 2016-06-29 桑格摩生物科学股份有限公司 新型dna-结合蛋白及其用途
IL277027B (en) 2011-09-21 2022-07-01 Sangamo Therapeutics Inc Methods and preparations for regulating transgene expression
CA3099582A1 (en) 2011-10-27 2013-05-02 Sangamo Biosciences, Inc. Methods and compositions for modification of the hprt locus
WO2013071440A1 (en) 2011-11-18 2013-05-23 UNIVERSITé LAVAL Methods and products for increasing frataxin levels and uses thereof
WO2013141680A1 (en) 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
IN2014DN09261A (zh) 2012-04-25 2015-07-10 Regeneron Pharma
WO2014033644A2 (en) 2012-08-28 2014-03-06 Novartis Ag Methods of nuclease-based genetic engineering
CA3233048A1 (en) 2012-10-23 2014-05-01 Toolgen Incorporated Composition for cleaving a target dna comprising a guide rna specific for the target dna and cas protein-encoding nucleic acid or cas protein, and use thereof
ES2757325T3 (es) 2012-12-06 2020-04-28 Sigma Aldrich Co Llc Modificación y regulación del genoma en base a CRISPR
EP2784162B1 (en) 2012-12-12 2015-04-08 The Broad Institute, Inc. Engineering of systems, methods and optimized guide compositions for sequence manipulation
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
WO2014093701A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof
KR20220139433A (ko) 2012-12-17 2022-10-14 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 Rna-가이드된 인간 게놈 조작
JP6475172B2 (ja) 2013-02-20 2019-02-27 リジェネロン・ファーマシューティカルズ・インコーポレイテッドRegeneron Pharmaceuticals, Inc. ラットの遺伝子組換え
EP2922393B2 (en) 2013-02-27 2022-12-28 Helmholtz Zentrum München - Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) Gene editing in the oocyte by cas9 nucleases
EP2971041B1 (en) 2013-03-15 2018-11-28 The General Hospital Corporation Using rna-guided foki nucleases (rfns) to increase specificity for rna-guided genome editing
US10760064B2 (en) 2013-03-15 2020-09-01 The General Hospital Corporation RNA-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci
JP2016522679A (ja) 2013-04-04 2016-08-04 プレジデント アンド フェローズ オブ ハーバード カレッジ CRISPR/Cas系を用いたゲノム編集の治療的使用
SG11201508028QA (en) 2013-04-16 2015-10-29 Regeneron Pharma Targeted modification of rat genome
EP3603679B1 (en) 2013-06-04 2022-08-10 President and Fellows of Harvard College Rna-guided transcriptional regulation
US20140356956A1 (en) 2013-06-04 2014-12-04 President And Fellows Of Harvard College RNA-Guided Transcriptional Regulation
SG11201510327TA (en) 2013-06-17 2016-01-28 Broad Inst Inc Delivery, engineering and optimization of systems, methods and compositions for targeting and modeling diseases and disorders of post mitotic cells
KR20160030187A (ko) 2013-06-17 2016-03-16 더 브로드 인스티튜트, 인코퍼레이티드 간의 표적화 및 치료를 위한 CRISPR­Cas 시스템, 벡터 및 조성물의 전달 및 용도
KR102285485B1 (ko) 2013-07-10 2021-08-04 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 Rna-가이드된 유전자 조절 및 편집을 위한 직교 cas9 단백질
US9228207B2 (en) 2013-09-06 2016-01-05 President And Fellows Of Harvard College Switchable gRNAs comprising aptamers
US9322037B2 (en) 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
WO2015040075A1 (en) 2013-09-18 2015-03-26 Genome Research Limited Genomic screening methods using rna-guided endonucleases
TW201542816A (zh) 2013-09-18 2015-11-16 Kymab Ltd 方法、細胞與生物體
RS64573B1 (sr) 2013-09-23 2023-10-31 Regeneron Pharma Ne-humana životinja sa humanizovanim signalno-regulatornim proteinskim genom
WO2015048577A2 (en) 2013-09-27 2015-04-02 Editas Medicine, Inc. Crispr-related methods and compositions
AU2014337783B2 (en) * 2013-10-24 2020-07-02 Uniqure Ip B.V. AAV-5 pseudotyped vector for gene therapy for neurological diseases
SG10201700961TA (en) 2013-12-11 2017-04-27 Regeneron Pharma Methods and compositions for the targeted modification of a genome
JP6793547B2 (ja) 2013-12-12 2020-12-02 ザ・ブロード・インスティテュート・インコーポレイテッド 最適化機能CRISPR−Cas系による配列操作のための系、方法および組成物
WO2015191693A2 (en) 2014-06-10 2015-12-17 Massachusetts Institute Of Technology Method for gene editing
AU2015277369B2 (en) 2014-06-16 2021-08-19 The Johns Hopkins University Compositions and methods for the expression of CRISPR guide RNAs using the H1 promoter
SG11201610481YA (en) 2014-06-23 2017-01-27 Regeneron Pharma Nuclease-mediated dna assembly
US20150376587A1 (en) 2014-06-25 2015-12-31 Caribou Biosciences, Inc. RNA Modification to Engineer Cas9 Activity
EP3161128B1 (en) 2014-06-26 2018-09-26 Regeneron Pharmaceuticals, Inc. Methods and compositions for targeted genetic modifications and methods of use
EP3169776A4 (en) * 2014-07-14 2018-07-04 The Regents of The University of California Crispr/cas transcriptional modulation
CN106794141B (zh) 2014-07-16 2021-05-28 诺华股份有限公司 将核酸包封在脂质纳米粒主体中的方法
EP3180034B1 (en) 2014-08-11 2022-04-20 The Board of Regents of The University of Texas System Prevention of muscular dystrophy by crispr/cas9-mediated gene editing
EP3193592A1 (en) 2014-09-19 2017-07-26 Regeneron Pharmaceuticals, Inc. Chimeric antigen receptors
WO2016049024A2 (en) 2014-09-24 2016-03-31 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for modeling competition of multiple cancer mutations in vivo
KR20230070319A (ko) 2014-11-21 2023-05-22 리제너론 파마슈티칼스 인코포레이티드 쌍 형성된 가이드 rna를 사용하는 표적화된 유전자 변형을 위한 방법 및 조성물
EP3230452A1 (en) 2014-12-12 2017-10-18 The Broad Institute Inc. Dead guides for crispr transcription factors
WO2016094874A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Escorted and functionalized guides for crispr-cas systems
WO2016106236A1 (en) 2014-12-23 2016-06-30 The Broad Institute Inc. Rna-targeting system
WO2016137949A1 (en) 2015-02-23 2016-09-01 Voyager Therapeutics, Inc. Regulatable expression using adeno-associated virus (aav)
KR102598856B1 (ko) 2015-03-03 2023-11-07 더 제너럴 하스피탈 코포레이션 변경된 PAM 특이성을 갖는 조작된 CRISPR-Cas9 뉴클레아제
WO2016149484A2 (en) 2015-03-17 2016-09-22 Temple University Of The Commonwealth System Of Higher Education Compositions and methods for specific reactivation of hiv latent reservoir
JP6851319B2 (ja) 2015-04-27 2021-03-31 ザ・トラステイーズ・オブ・ザ・ユニバーシテイ・オブ・ペンシルベニア ヒト疾患のCRISPR/Cas9媒介性の修正のためのデュアルAAVベクター系
US10179918B2 (en) 2015-05-07 2019-01-15 Sangamo Therapeutics, Inc. Methods and compositions for increasing transgene activity
WO2016183402A2 (en) 2015-05-13 2016-11-17 President And Fellows Of Harvard College Methods of making and using guide rna for use with cas9 systems
WO2017011721A1 (en) 2015-07-15 2017-01-19 Rutgers, The State University Of New Jersey Nuclease-independent targeted gene editing platform and uses thereof
EP3159407A1 (en) 2015-10-23 2017-04-26 Silence Therapeutics (London) Ltd Guide rnas, methods and uses
SI3376857T1 (sl) 2015-11-20 2021-09-30 Regeneron Pharmaceuticals, Inc. Nehumane živali, ki imajo humaniziran gen 3 za aktivacijo limfocitov
WO2017106657A1 (en) 2015-12-18 2017-06-22 The Broad Institute Inc. Novel crispr enzymes and systems
WO2017104404A1 (ja) 2015-12-18 2017-06-22 国立研究開発法人科学技術振興機構 遺伝子改変非ヒト生物、卵細胞、受精卵、及び標的遺伝子の改変方法
US20190038780A1 (en) 2016-02-05 2019-02-07 Regents Of The University Of Minnesota Vectors and system for modulating gene expression
US10286073B2 (en) 2016-02-23 2019-05-14 Ilisa Tech, Inc. Magnetic control of gene delivery in vivo
EP3436077A1 (en) 2016-03-30 2019-02-06 Intellia Therapeutics, Inc. Lipid nanoparticle formulations for crispr/cas components
WO2017180915A2 (en) 2016-04-13 2017-10-19 Duke University Crispr/cas9-based repressors for silencing gene targets in vivo and methods of use
WO2018009869A1 (en) 2016-07-07 2018-01-11 University Of Florida Research Foundation, Inc. Metabolically competent cells, methods of making, and uses thereof
WO2018007871A1 (en) 2016-07-08 2018-01-11 Crispr Therapeutics Ag Materials and methods for treatment of transthyretin amyloidosis
CN108018314A (zh) 2016-11-03 2018-05-11 优美佳生物技术有限公司 用于细胞重编程的方法和组合物
GB201619876D0 (en) 2016-11-24 2017-01-11 Cambridge Entpr Ltd Controllable transcription
JP2019536464A (ja) 2016-12-08 2019-12-19 インテリア セラピューティクス,インコーポレイテッド 修飾されたガイドrna
AU2017374042B2 (en) 2016-12-09 2024-02-15 Acuitas Therapeutics, Inc. Delivery of target specific nucleases
EP3554546A4 (en) 2016-12-14 2021-04-14 Ligandal, Inc. METHODS AND COMPOSITIONS FOR ADMINISTRATION OF NUCLEIC ACID AND PROTEIN PAYLOADS
KR20230125856A (ko) 2016-12-23 2023-08-29 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 Pcsk9의 유전자 편집
CA3053709A1 (en) 2017-02-22 2018-08-30 Crispr Therapeutics Ag Compositions and methods for treatment of proprotein convertase subtilisin/kexin type 9 (pcsk9)-related disorders
US11674138B2 (en) 2017-03-13 2023-06-13 President And Fellows Of Harvard College Methods of modulating expression of target nucleic acid sequences in a cell
CN111263812A (zh) 2017-07-31 2020-06-09 西格马-奥尔德里奇有限责任公司 用于crispr/cas激活系统的合成的指导rna
KR102647714B1 (ko) 2018-03-19 2024-03-18 리제너론 파마슈티칼스 인코포레이티드 CRISPR/Cas 시스템을 사용한 동물에서의 전사 조절
US11690921B2 (en) 2018-05-18 2023-07-04 Sangamo Therapeutics, Inc. Delivery of target specific nucleases
WO2019236081A1 (en) 2018-06-06 2019-12-12 Salk Institute For Biological Studies Targeted gene activation using modified guide rna
CN112567036A (zh) 2018-06-08 2021-03-26 因特利亚治疗公司 用于基因编辑的修饰的向导rna
AU2019288373A1 (en) 2018-06-19 2021-01-14 The Board Of Regents Of The University Of Texas System Lipid nanoparticle compositions for delivery of mRNA and long nucleic acids
WO2020142714A1 (en) 2019-01-04 2020-07-09 Exonics Therapeutics, Inc. Aav expression cassette and aav vectors comprising the same
WO2021108363A1 (en) 2019-11-25 2021-06-03 Regeneron Pharmaceuticals, Inc. Crispr/cas-mediated upregulation of humanized ttr allele

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101918431A (zh) * 2007-09-25 2010-12-15 田园温室气体研究有限公司 用于微生物细胞的细胞通透肽和多肽
CN107603976A (zh) * 2012-05-25 2018-01-19 埃玛纽埃尔·沙尔庞捷 用于rna定向的靶dna修饰和用于rna定向的转录调节的方法和组合物
CN105164264A (zh) * 2012-12-12 2015-12-16 布罗德研究所有限公司 用于序列操纵和治疗应用的系统、方法和组合物的递送、工程化和优化
WO2016049258A2 (en) * 2014-09-25 2016-03-31 The Broad Institute Inc. Functional screening with optimized functional crispr-cas systems
CN104357422A (zh) * 2014-10-08 2015-02-18 绍兴市人民医院 转录激活子样效应因子核酸酶及其编码基因与应用
CN107614680A (zh) * 2015-05-14 2018-01-19 南加利福尼亚大学 利用重组核酸内切酶系统的最佳化基因编辑
US20160208243A1 (en) * 2015-06-18 2016-07-21 The Broad Institute, Inc. Novel crispr enzymes and systems
WO2018005873A1 (en) * 2016-06-29 2018-01-04 The Broad Institute Inc. Crispr-cas systems having destabilization domain
CN107805632A (zh) * 2016-09-06 2018-03-16 中国科学院微生物研究所 OsMKK6蛋白及编码基因在调控植物种子发育中的应用
CN107760715A (zh) * 2017-10-17 2018-03-06 云南瑞火生物科技有限公司 一种精准高效的转基因载体及其构建方法和应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HAIBO ZHOU: "In vivo simultaneous transcriptional activation of multiple genes in the brain using CRISPR-dCas9-activator transgenic mice", 《NATURE NEUROSCIENCE》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113122581A (zh) * 2021-04-13 2021-07-16 上海长征医院 一种Hsf1基因敲除小鼠模型的建立及应用
WO2024036600A1 (zh) * 2022-08-19 2024-02-22 中国农业科学院作物科学研究所 一种母体细胞自主的孤雌单倍体生殖方法及其育种应用

Also Published As

Publication number Publication date
AU2024201257A1 (en) 2024-03-21
JP7334178B2 (ja) 2023-08-28
US11519004B2 (en) 2022-12-06
US20190284572A1 (en) 2019-09-19
CA3089331A1 (en) 2019-09-26
JP2021518141A (ja) 2021-08-02
CN116349651A (zh) 2023-06-30
EP3592140A1 (en) 2020-01-15
KR102647714B1 (ko) 2024-03-18
US20230123296A1 (en) 2023-04-20
AU2019239880A1 (en) 2020-10-01
KR20200132849A (ko) 2020-11-25
AU2019239880B2 (en) 2023-11-30
WO2019183123A1 (en) 2019-09-26
KR20240038811A (ko) 2024-03-25
CN111885915B (zh) 2023-04-28

Similar Documents

Publication Publication Date Title
CN111885915B (zh) 使用crispr/cas系统对动物进行转录调制
CN110891420B (zh) Cas转基因小鼠胚胎干细胞和小鼠及其应用
US20210261985A1 (en) Methods and compositions for assessing crispr/cas-mediated disruption or excision and crispr/cas-induced recombination with an exogenous donor nucleic acid in vivo
CN111163633B (zh) 包含人源化ttr基因座的非人类动物及其使用方法
US20190032156A1 (en) Methods and compositions for assessing crispr/cas-induced recombination with an exogenous donor nucleic acid in vivo
IL284095B2 (en) Nuclease-mediated repeat expansion
KR20220062079A (ko) 지질 나노입자에 의해 전달되는 CRISPR/Cas 시스템을 사용한 동물에서의 전사 조절
RU2782358C2 (ru) Экспрессирующие cas мышиные эмбриональные стволовые клетки и мыши и их применения

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant