CN115074343A - Cas转基因小鼠胚胎干细胞和小鼠及其应用 - Google Patents

Cas转基因小鼠胚胎干细胞和小鼠及其应用 Download PDF

Info

Publication number
CN115074343A
CN115074343A CN202210528912.0A CN202210528912A CN115074343A CN 115074343 A CN115074343 A CN 115074343A CN 202210528912 A CN202210528912 A CN 202210528912A CN 115074343 A CN115074343 A CN 115074343A
Authority
CN
China
Prior art keywords
expression cassette
cas9
rodent
protein
cas
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210528912.0A
Other languages
English (en)
Inventor
国春·龚
查琳·亨特
大辅·梶村
苏珊娜·哈特福德
布莱恩·扎姆布罗维兹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Regeneron Pharmaceuticals Inc
Original Assignee
Regeneron Pharmaceuticals Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Regeneron Pharmaceuticals Inc filed Critical Regeneron Pharmaceuticals Inc
Publication of CN115074343A publication Critical patent/CN115074343A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K49/00Preparations for testing in vivo
    • A61K49/0004Screening or testing of compounds for diagnosis of disorders, assessment of conditions, e.g. renal clearance, gastric emptying, testing for diabetes, allergy, rheuma, pancreas functions
    • A61K49/0008Screening agents using (non-human) animal models or transgenic animal models or chimeric hosts, e.g. Alzheimer disease animal model, transgenic model for heart failure
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/0012Galenical forms characterised by the site of application
    • A61K9/0019Injectable compositions; Intramuscular, intravenous, arterial, subcutaneous administration; Compositions to be administered through the skin in an invasive manner
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6897Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids involving reporter genes operably linked to promoters
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/072Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/15Animals comprising multiple alterations of the genome, by transgenesis or homologous recombination, e.g. obtained by cross-breeding
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/20Animal model comprising regulated expression system
    • A01K2217/206Animal model comprising tissue-specific expression system, e.g. tissue specific expression of transgene, of Cre recombinase
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/0393Animal model comprising a reporter system for screening tests
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/60Fusion polypeptide containing spectroscopic/fluorescent detection, e.g. green fluorescent protein [GFP]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/30Vector systems comprising sequences for excision in presence of a recombinase, e.g. loxP or FRT
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Environmental Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Animal Husbandry (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Urology & Nephrology (AREA)
  • Pathology (AREA)
  • Rheumatology (AREA)
  • Toxicology (AREA)
  • Diabetes (AREA)
  • Endocrinology (AREA)
  • Virology (AREA)

Abstract

本文提供用于评价CRISPR/Cas介导的非同源末端连接的活性和/或CRISPR/Cas诱导的目标基因组基因座与外源供体核酸的体内或离体重组的方法和组合物。所述方法和组合物使用包含诸如基因组整合的Cas表达盒之类的Cas表达盒的细胞和非人类动物,从而使得Cas蛋白质组成上可获取的或以组织特异性或时间特异性的方式可获取。本文还提供用于产生和使用这些非人类动物的方法和组合物,包括使用这些非人类动物通过腺相关病毒(AAV)介导的将向导RNA递送至所述非人类动物来评价CRISPR/Cas的体内活性。

Description

CAS转基因小鼠胚胎干细胞和小鼠及其应用
分案申请说明
本申请是申请日为2018年07月31日,申请号为201880044435.2,发明名称为“CAS转基因小鼠胚胎干细胞和小鼠及其应用”的发明专利申请的分案申请。
相关申请的交叉引用
本申请要求2017年7月31日提交的美国申请US62/539,275的权益,该美国申请的全部内容通过引用并入本文,用于所有目的。
对通过EFS WEB以TEXT文件格式提交的序列表的引用
在文件516569SEQLIST.txt中写入的序列表的大小为178千字节,其于2018年7月30日创建,并通过引用并入本文。
背景技术
CRISPR/Cas技术有望成为一种新的治疗形式。然而,目前需要更好的通过引入体内的CRISPR/Cas试剂评价突变产生效率或目标基因突变效率的方式。在体内对系统进行测试的一个限制在于需要将所有成分同时引入活体生物体中。引入这些成分的经典方法是将DNA构建体瞬时转染至将会产生合适的RNA和蛋白质的细胞中。虽然这种方法很有效,但是这种方法具有固有缺点,这是因为细胞必须依赖于质粒DNA构建体,从而先经历转录再进行翻译,随后Cas9蛋白质能够与sgRNA成分发生相互作用。因此,需要更好的方法和工具来更加有效地评价引入的CRISPR/Cas试剂的活性并且评价靶定体内特定组织或细胞类型的不同的递送方法和参数。
此外,诸如CRISPR/Cas试剂之类的生物活性试剂向受治者的递送通常由于各个成分难以到达目标细胞或组织而受到限制。这些限制可能会导致例如,需要使用比实现期理想结果高得多的浓度的试剂,这会增加毒副作用的风险。因此,本领域需要改进的递送方法以及体内评价这种递送方法的方法。
发明内容
本文提供Cas9就绪(Cas9-ready)的非人类动物,并且本文提供用于评价CRISPR/Cas核酸酶试剂体内修饰目标基因组基因座的能力的方法和组合物。在一个方面,本文提供测试CRISPR/Cas核酸酶体内修饰目标基因组基因座的能力的方法。一些这样的方法包括:(a)向非人类动物体内引入设计为靶定目标基因组基因座的向导RNA靶向序列的向导RNA,其中,所述非人类动物包括基因组整合的Cas表达盒,该表达盒包括NLS-Cas编码序列,并且,其中,向导RNA通过腺相关病毒(AAV)介导的递送被引入;以及(b)评价对目标基因组基因座的修饰。一些这样的方法包括:(a)向非人类动物体内引入设计为靶定目标基因组基因座的向导RNA靶向序列的向导RNA,其中,所述非人类动物包含基因组整合的Cas表达盒,该表达盒包括NLS-Cas编码序列,并且,其中,所述向导RNA通过脂质纳米颗粒(LNP)介导的递送被引入,以及(b)评价对所述目标基因组基因座的修饰。
在一些这样的方法中,所述AAV是AAV7,AAV8,或AAV9,步骤(b)包括对肝脏中的目标基因组基因座的修饰进行评价。任选地,AAV是AAV8。
在一些这样的方法中,向所述非人类动物给药AAV的途径是静脉内注射,脑实质内注射,腹膜内注射,鼻灌注或玻璃体内注射。
在一些这样的方法中,在步骤(a)中引入外源供体核酸,其中,所述外源供体核酸被设计为与所述目标基因组基因座重组。任选地,所述外源供体核酸是单链寡脱氧核苷酸(ssODN)。
在一些这样的方法中,所述非人类动物是大鼠或小鼠。任选地,所述非人类动物是小鼠。
在一些这样的方法中,所述目标基因组基因座包括目标基因,并且步骤(b)包括测量所述目标基因的表达或所述目标基因编码的蛋白质的活性。
在一些这样的方法中,步骤(b)包括对分离自所述非人类动物的一种或多种细胞中的目标基因组基因座进行测序。
在一些这样的方法中,步骤(b)包括从所述非人类动物中分离目标器官或组织并且评价对所述目标器官或组织中的目标基因组基因座的修饰。任选地,步骤(b)包括对所述目标器官或组织中的两种或多种不同的细胞类型中的目标基因组基因座的修饰进行评价。
在一些这样的方法中,步骤(b)包括从所述非人类动物中分离非目标器官或组织并且评价对所述非目标器官或组织中的目标基因组基因座的修饰。
在一些这样的方法中,所述NLS-Cas编码序列是NLS-Cas9编码序列。
在一些这样的方法中,所述Cas表达盒还包括NLS-Cas编码序列上游的聚腺苷酸化信号,其中,所述聚腺苷酸化信号的侧面具有重组酶识别位点,并且,其中,所述Cas表达盒中的聚腺苷酸化信号已通过组织特异性方式删除。任选地,在肝脏中,所述Cas表达盒中的NLS-Cas编码序列上游的聚腺苷酸化信号已被删除。任选地,所述Cas表达盒中的识别重组酶识别位点的重组酶是Cre重组酶。任选地,所述非人类动物还包括基因组整合的Cre重组酶表达盒,其中,所述Cre重组酶表达盒包括Cre重组酶编码序列,其可操作地连接至组织特异性启动子。任选地,所述Cre重组酶基因可操作地连接至表2中列出的启动子中的一个。
在一些这样的方法中,Cas表达盒还包括NLS-Cas编码序列上游的聚腺苷酸化信号,其中,所述聚腺苷酸化信号的侧面具有重组酶识别位点,并且,其中,所述方法还包括将重组酶以组织特异性的方式引入非人类动物体内。任选地,所述重组酶通过腺相关病毒(AAV)介导的递送或脂质纳米颗粒(LNP)介导的递送被引入。任选地,所述重组酶通过AAV8介导的递送被引入。任选地,所述重组酶被引入至肝脏。
在一些这样的方法中,Cas表达盒还包括荧光蛋白编码序列。任选地,所述Cas表达盒包括多顺反子核酸,该多顺反子核酸包含由介入的内部核糖体进入位点(IRES)或介入的2A肽编码序列分隔开的NLS-Cas编码序列和荧光蛋白编码序列。任选地,所述Cas表达盒中的多顺反子核酸包括由介入的P2A肽编码序列分隔开的NLS-Cas编码序列和绿色荧光蛋白编码序列。在一些这样的方法中,Cas表达盒不包括荧光蛋白编码序列。在一些这样的方法中,NLS-Cas编码序列编码包含蛋白质标签的Cas蛋白质。
在一些这样的方法中,Cas表达盒可操作地连接至内源启动子。在一些这样的方法中,Cas表达盒可操作地连接至外源组成性启动子。
在一些这样的方法中,Cas表达盒的5’端还包括3’剪接序列。
在一些这样的方法中,Cas表达盒编码包含SEQ ID NO:13,16,19或22中列出的序列的蛋白质。任选地,Cas表达盒包含SEQ ID NO:28,29,30或31中列出的序列。任选地,Cas表达盒包含SEQ ID NO:1,12,14,15,17,18,20或21中列出的序列。
在一些这样的方法中,Cas表达盒被整合至安全港基因座。任选地,所述安全港基因座是Rosa26基因座。任选地,Cas表达盒被整合至Rosa26基因座的第一内含子中。
在一些这样的方法中,所述非人类动物对于Cas表达盒而言是杂合的。在一些这样的方法中,所述非人类动物对于Cas表达盒而言是纯合的。
在一些这样的方法中,所述非人类动物是小鼠,AAV是AAV8,Cas表达盒可操作地连接至内源Rosa26启动子,被插入至Rosa26基因座的第一内含子中,并且在5’至3’方向上包括:(i)3’剪接序列,以及(ii)NLS-Cas9编码序列,并且步骤(b)包括评价非人类动物的肝脏中的目标基因组基因座的修饰。在一些这样的方法中,所述非人类动物是小鼠,AAV是通过静脉内注射递送至所述非人类动物的AAV8,Cas表达盒可操作地连接至内源Rosa26启动子,被插入至Rosa26基因座的第一内含子,并且在5’至3’方向上包括:(i)3’剪接序列;以及(ii)NLS-Cas9编码序列,并且步骤(b)包括评价非人类动物的肝脏中的目标基因组基因座的修饰。
另一方面,本文提供优化CRISPR/Cas核酸酶体内修饰目标基因组基因座的能力的方法。一些这样的方法包括:(I)在第一非人类动物体内第一次执行上述任何一种测试CRISPR/Cas核酸酶体内修饰目标基因组基因座的能力的方法;(II)改变可变量并且在第二非人类动物体内使用改变的可变量再次执行步骤(I)的方法;以及(III)将步骤(I)中目标基因组基因座的修饰与步骤(II)中目标基因组基因座的修饰进行比较,并且选择产生对目标基因组基因座的修饰具有较高的效率,较高的精确度,较高的一致性或较高的特异性中的一种或多种的方法。
在一些这样的方法中,步骤(II)中改变的可变量是AAV血清型。在一些这样的方法中,步骤(II)中改变的可变量是将向导RNA引入至非人类动物中的给药途径。在一些这样的方法中,步骤(II)中改变的可变量是引入至非人类动物中的向导RNA的浓度或量。在一些这样的方法中,步骤(II)中改变的可变量是引入至非人类动物中的向导RNA(例如,向导RNA的形式或序列)。在一些这样的方法中,所述方法包括引入外源供体核酸,并且,其中,步骤(II)中改变的可变量是将所述外源供体核酸引入至非人类动物的递送方法。在一些这样的方法中,所述方法包括引入外源供体核酸,并且,其中,步骤(II)中改变的可变量是将所述外源供体核酸引入至非人类动物的给药途径。在一些这样的方法中,所述方法包括引入外源供体核酸,并且步骤(II)中改变的可变量是引入至非人类动物中的外源供体核酸的浓度或量。在一些这样的方法中,所述方法包括引入外源供体核酸,并且步骤(II)中改变的可变量是相对于引入至非人类动物中的外源供体核酸的浓度或量的引入至非人类动物中的向导RNA的浓度或量。在一些这样的方法中,步骤(II)中改变的可变量是引入至非人类动物中的外源供体核酸(例如,外源供体核酸的形式)。
附图说明
图1显示了Cas9等位基因(MAID2599,不是成比例的),其在5’至3’方向上包括:3’剪接序列,第一loxP位点,新霉素耐药基因,聚腺苷酸化信号,第二loxP位点,NLS-Cas9编码序列,P2A肽编码序列,以及GFP编码序列。
图2A显示了野生型F1H4小鼠胚胎干细胞(mESC)以及具有和不具有lox-stop-lox新霉素盒(分别为MAID2599和MAID2600)并随后引入了靶向第一目标基因的起始密码子区域和终止密码子区域的两个sgRNA(质粒形式或RNA形式)的Cas9就绪的mESC中的NHEJ活性,任选地,Cas9就绪的mESC中还引入了Cas9质粒。在左图中测量了5’切割效率,在中间图中测量了3’切割效率,在右图中测量了将介入的DNA完全删除的速率。
图2B显示了切割效率(左图)和HDR效率(右图),随后引入靶定第二目标基因的sgRNA(质粒形式或RNA形式)以及作为点突变供体的单链寡脱氧核苷酸(ssODN),任选地还引入了Cas9质粒。
图3A至图3F显示了野生型小鼠和杂合的Cas9就绪的小鼠(MAID2600)的肝脏(图3A),肾脏(图3B)以及脑组织(图3C)的亮视场图像,以及野生型小鼠和Cas9就绪的小鼠(MAID2600)的肝脏(图3D),肾脏(图3E)以及脑组织(图3F)的GFP荧光图像。
图4A显示了通过RT-qPCR测定的从杂合的Cas9就绪的小鼠(MAID2600)中分离出来的各种不同的组织中的Cas9 mRNA表达水平。y轴显示了与来自脑组织的平均Cas9 Ct相比的δCt+1。
图4B显示了从野生型小鼠和杂合的Cas9就绪的小鼠(MAID2600)中分离出来的各种不同的组织中的Cas9蛋白质的表达。肌动蛋白用作对照。
图4C显示了通过RT-qPCR测定的从杂合的Cas9就绪的小鼠(MAID2600)中分离出来的各种不同的组织中的Cas9平均Cas9和β-2-微球蛋白(B2m)mRNA的表达水平。柱形上方显示了每种类型的组织中所测试的样本数量。
图5A至图5B显示了在由脂质纳米颗粒(LNP)递送了GFP mRNA和对照(dead)sgRNA,GFP mRNA和目标基因3sgRNA或者Cas9mRNA和目标基因3sgRNA之后从野生型小鼠(图5A)和表达盒删除的Cas9小鼠(MAID2600;图5B)中分离出来的初级肝细胞中第三目标基因处的NHEJ活性百分比(插入/缺失(indel)频率)。测试得到mRNA的浓度为15.6,62.5,250,和1000ng/mL。
图6A至图6D显示了如下蛋白质的血清水平,所述蛋白质被肝脏分泌并且在血清中发现并由第三目标基因(目标基因3)编码,随后通过流体动力学DNA递送(HDD),脂质纳米颗粒(LNP)递送,或通过尾静脉注射腺相关病毒(AAV)递送将目标基因3sgRNA引入野生型小鼠(msCas9-)或表达盒删除的Cas9就绪的小鼠。在一些情况下,Cas9也被引入(对于LNP递送而言以mRNA的形式,对于HDD以及AAV递送而言以DNA的形式(Cas9质粒))。未处理的小鼠,LNP对照小鼠,AAV对照小鼠和HDD对照小鼠用作阴性对照。对于LNP介导的递送而言,测试了如下三组小鼠:(1)Cas9就绪的小鼠(3只雄性+3只雌性;2mg/kg对照向导RNA+GFP mRNA);(2)Cas9就绪的小鼠(3只雄性+3只雌性;2mg/kg向导RNA用于目标基因3+GFP mRNA);以及(3)WT小鼠(3只雄性+3只雌性;2mg/kg向导RNA用于目标基因3+Cas9 mRNA)。对于AAV-介导的递送而言,测试了如下两组小鼠:(1)Cas9就绪的小鼠(3只雄性+3只雌性;AAV8-向导RNA用于目标基因3);以及(2)WT小鼠(3只雄性+3只雌性;AAV8-向导RNA用于目标基因3+AAV8-Cas9)。对于HDD而言,测试如下两组小鼠:(1)Cas9就绪的小鼠(3只雄性+3只雌性;向导RNA用于目标基因3);以及(2)WT小鼠(3只雄性+3只雌性;向导RNA用于目标基因3+Cas9)。测量了雄性小鼠(图6A和图6B)和雌性小鼠(图6C和图6D)中由目标基因3编码的蛋白质的血清水平,并且在第7天(图6A和图6C)和第21天(图6B和图6D)测量了由目标基因3编码的蛋白质的血清水平。
图7显示了在脂质纳米颗粒(LNP)单独递送sgRNA或递送sgRNA和Cas9 mRNA,由流体动力学(HDD)单独递送sgRNA质粒或sgRNA质粒和Cas9质粒,或者单独递送AAV8-sgRNA或AAV8-sgRNA和AAV8-Cas9之后一个月野生型小鼠(msCas9-)和表达盒删除的Cas9小鼠(msCas9+;MAID2600)的肝脏中的目标基因3基因座处的NHEJ活性百分比(插入/缺失(indel)频率)。
图8A显示了通过尾静脉注射在由AAV8递送sgRNA之后3至4周表达盒删除的Cas9小鼠(MAID2600)的肝脏中目标基因4基因座处的NHEJ活性百分比(插入/缺失(indel)频率)。UNT=未处理的对照。
图8B显示了在通过尾静脉注射由AAV8递送sgRNA之后3至4周从表达盒删除的Cas9小鼠(MAID2600)中分离出来的肝脏组织中由TAQMAN分析测定的目标基因4表达的相对水平。WT mastermix是指混合在一起的并且注射至作为阴性对照的野生型小鼠的所有五种sgRNA病毒。
图9显示了通过尾静脉注射在注射了LNP-Cre之后一个星期在从LSL-Cas小鼠(MAID2599)中分离的肝脏、脾脏和肾脏样本中Cas9表达的western印迹。未进行LNP-Cre注射的小鼠用作阴性对照。表达盒删除的Cas9小鼠(MAID2600)用作阳性对照。
图10显示了仅通过AAV8或者通过AAV8和LNP-Cre将目标基因3sgRNA注射至LSL-Cas9小鼠(MAID2599)中之后1周和3周由第三目标基因(目标基因3)编码的、由肝脏分泌的并且在血清中发现的蛋白质的血清水平。既没有经过LNP-Cre处理也没有通过AAV8-gRNA处理的小鼠用作阴性对照。还在表达盒删除的小鼠(ROSA Cas9;MAID2600)中测试了所有条件。
图11显示了仅通过AAV8或通过AAV8和LNP-Cre将目标基因3sgRNA注射至LSL-Cas9小鼠(MAID2599)之后3个星期在分离的肝脏的目标基因3基因座处的NHEJ活性百分比(插入/缺失(indel)频率)。既没有经过LNP-Cre处理也没有通过AAV8-gRNA处理的小鼠用作阴性对照。还在表达盒删除的小鼠(ROSA Cas9;MAID2600)中测试了所有条件。
图12A显示了从LSL-Cas9小鼠(MAID2599)和LSL-Cas9/Alb-Cre小鼠中分离出来的肝脏中的Cas9的western印迹。肌动蛋白用作负载对照。
图12B显示了从LSL-Cas9小鼠(MAID2599)和LSL-Cas9/Alb-Cre小鼠中分离出来的脑组织中的Cas9的western印迹。肌动蛋白用作负载对照。
图13显示了通过AAV8向WT小鼠,表达盒删除的Cas9小鼠(ROSA Cas9,MAID2600),LSL-Cas9小鼠(MAID2599),白蛋白-Cre小鼠或LSL-Cas9/Alb-Cre小鼠中注射目标基因3sgRNA之后1个星期由肝脏分泌的、在血清中发现的并且由第三目标基因(目标基因3)编码的蛋白质的血清水平。
图14显示了四种不同的Cas9等位基因(不按照比例的),包括MAID2599等位基因(一旦删除了lox-stop-lox(LSL)表达盒即为MAID2600),MAID2658等位基因(一旦删除了LSL表达盒即为MAID2659),MAID2660等位基因(一旦删除了LSL表达盒即为MAID2661)以及MAID2672等位基因(一旦删除了LSL表达盒即为MAID2673)。
具体实施方式
释义
本文中可互换使用的术语“蛋白质”,“多肽”和“肽”包括任何长度的氨基酸的聚合形式,包括编码的和非编码的氨基酸以及化学或生物化学修饰的或衍生的氨基酸。这些术语还包括诸如具有修饰的肽骨架的多肽之类的已经被修饰的聚合物。
蛋白质被描述为具有“N-末端”和“C-末端”。术语“N-末端”涉及蛋白质或多肽的起始点,其以具有游离胺基(-NH2)的氨基酸为终点。术语“C-末端”涉及氨基酸链(蛋白质或多肽)的终点,其以游离羧基(-COOH)为终点。
本文中可互换使用的术语“核酸”和“多核苷酸”包括任何长度的核苷酸的聚合形式,包括核糖核苷酸,脱氧核糖核苷酸或其类似物或修饰的形式。它们包括单链DNA或RNA,双链DNA或RNA和多链DNA或RNA,基因组DNA,cDNA,DNA-RNA杂合体以及包含嘌呤碱基,嘧啶碱基或其他天然的、化学修饰的、生物化学修饰的、非天然的或衍生得到的核苷酸碱基的聚合物。
核酸被描述为具有“5’端”和“3’端”,因为单核苷酸以使一个单核苷酸戊糖环的5’磷酸酯在一个方向上通过磷酸二酯键连接至相邻的单核苷酸戊糖环的3’氧的方式发生反应形成寡核苷酸。若寡核苷酸的5’磷酸酯没有与单核苷酸戊糖环的3’氧连接,那么寡核苷酸的这一端被称为5’端。如果寡核苷酸的3’氧没有与另一单核苷酸戊糖环的5’磷酸酯连接,那么寡核苷酸的这一端被称为3’端。即便核酸序列内部形成较大的寡核苷酸,那么核酸序列也可被描述为具有5’端和3’端。在线性或环状DNA分子中,离散元件被称为“上游”元件或“下游”的5’元件或3’元件。
术语“基因组整合的”是指已被引入至细胞内使得核苷酸序列整合至细胞的基因组中的核酸。任何操作规程可用于将核酸稳定地合并至细胞的基因组中。
术语“表达载体”或“表达构建体”是指如下重组核酸,其含有可操作地连接至合适的核酸序列的期望的编码序列,所述合适的核酸序列是可操作地连接的编码序列在特定宿主细胞或生物体内表达所必需的。在原核生物中表达所必需的核酸序列通常包括启动子、操纵子(任选)和核糖体结合位点,以及其他序列。通常已知真核细胞使用启动子、增强子以及终止和聚腺苷酸化信号,虽然一些元件可能被删除或添加了其他元件,但是不会牺牲必要的表达。
术语“靶向载体”是指可通过同源重组,非同源末端结合介导的连接或任何其他重组方式引入至细胞基因组中的目标位置的重组核酸。
术语“病毒载体”是指重组核酸,其包含病毒来源中的至少一种元件并且包括足以包装至病毒载体颗粒中或能够包装至病毒载体颗粒中的元件。载体和/或颗粒可用于将DNA,RNA或其他核酸离体或体内转染至细胞的目的。本领域已知多种形式的病毒载体。
与蛋白质、核酸和细胞有关的术语“分离的”包括相对于通常可能原位存在的细胞成分或生物体成分而相对地进行纯化的蛋白质、核酸和细胞,相当于并且包括蛋白质、核酸或细胞的基本纯的制剂。术语“分离的”还包括具有非天然生成的相应成分或蛋白质或核酸的蛋白质或核酸,所述非天然生成的相应成分或蛋白质或核酸是化学合成的并且因此基本没有被其他蛋白质或核酸污染。术语“分离的”还包括从与其天然伴生的大多数其他细胞成分或生物体成分中分离出来的或纯化得到的蛋白质、核酸或细胞(例如,其他细胞蛋白、核酸或者细胞或细胞外成分)。
术语“野生型”包括具有在正常(与突变、患病、发生改变等相反的)状态或情况中发现的结构和/或活性的实体。野生型基因和多肽通常以多种不同的形式(例如,等位基因)存在。
术语“内源序列”是指在细胞或非人类动物中天然出现的核酸序列。例如,非人类动物的内源Rosa26序列是指在非人类动物的Rosa26基因座处天然出现的原生Rosa26序列。
“外源”分子或序列包括外源形式的通常不存在于细胞中的分子或序列。通常存在包括相对于细胞的特定发育阶段和环境条件的存在。例如,外源分子或序列可包括细胞内的相应内源序列的突变形式(例如,内源序列的人源化形式)或可包括对应于细胞内的内源序列的不同形式的(即,不存在于染色体内)序列。相反,内源分子或序列包括通常以内源形式在特定环境条件下在特定发育阶段存在于特定细胞中的分子或序列。
本文中在涉及核酸或蛋白质时使用术语“异源”表明核酸或蛋白质包括至少两个不会天然地在同一分子中一同出现的片段。例如,当涉及核酸片段或蛋白质片段时使用术语“异源”表明核酸或蛋白质包括两个或多个子序列,该子序列没有在本质上彼此相同的关系(例如,连接在一起)中发现。例如,核酸载体的“异源”区域是另一核酸分子内或与另一核酸分子连接的核酸的片段,所述另一核酸分子没有被发现与其他分子本质上相关。例如,核酸载体的异源区域可包括如下编码序列,其侧面具有没有发现与该编码序列本质上相关的序列。类似地,蛋白质的“异源”区域是另一肽分子内的或与另一肽分子连接的氨基酸的片段,所述另一肽分子没有被发现与其他肽分子本质上相关(例如,融合蛋白或带有标签的蛋白)。类似地,核酸或蛋白质可包括异源标签或异源分泌物或定位序列。
“密码子优化”利用了密码子的简并性,如指定氨基酸的三碱基对密码子组合的多样性所展现的那样,并且,所述密码子优化总体上包括通过由宿主细胞基因中更加频繁使用的或最频繁使用的密码子取代天然序列中的至少一个密码子并同时保留天然氨基酸序列来修饰核酸序列以提高其在特定宿主细胞中的表达的过程。例如,编码Cas9蛋白质的核酸可被修饰为与天然生成的核酸序列相比取代了给定的原核细胞或真核细胞中具有较高使用频率的密码子,所述原核细胞或真核细胞包括细菌细胞、酵母细胞、人细胞、非人细胞、哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞、仓鼠细胞或任何其他宿主细胞。密码子使用表格易于获取自例如,在“密码子使用数据库(Codon Usage Database)”。这些表格可以多种方式进行调节。参见,Nakamura等人,(2000)Nucleic Acids Research 28:292,该参考文献的全部内容通过引用并入本文,用于所有目的。还可获得用于在特定宿主中进行表达的特定序列的密码子的优化的计算机算法(参见例如,Gene Forge)。
“启动子”是DNA的调节性区域,其通常包括能够指向RNA聚合酶II以在特定的多核苷酸序列的合适的转录起始位点启动RNA合成的TATA盒。启动子还可包括影响转录启动速度的其他区域。本文公开的启动子序列调节可操作地连接的多核苷酸的转录。启动子在本文公开的细胞类型(例如,真核细胞、非人类哺乳动物细胞、人类细胞、啮齿动物细胞、多能细胞、单细胞期胚胎、分化的细胞或其组合)中的一种或多种中可具有活性。例如,启动子可以是组成性活性启动子、条件性启动子、可诱导的启动子、时间限制启动子(例如,发育调节的启动子)或空间限制启动子(例如,细胞特异性或组织特异性启动子)。启动子的实例可在例如WO2013/176772中找到,该参考文献的全部内容通过引入并入本文,用于所有目的。
组成性启动子是一种在所有组织或所有发育阶段的具体组织中均具有活性的启动子。组成性启动子的实例包括:人巨细胞病毒立即早期(hCMV)启动子,小鼠巨细胞病毒立即早期(mCMV)启动子,人延长因子1α(hEF1α)启动子,小鼠延长因子1α(mEF1α)启动子,小鼠磷酸甘油酯激酶(PGK)启动子,鸡β肌动蛋白杂合体启动子(CAG或CBh),SV40早期启动子以及β2微管蛋白启动子。
可诱导的启动子的实例包括例如:化学调节启动子和物理调节启动子。化学调节启动子包括例如:乙醇调节的启动子(例如,乙醇脱氢酶(alcA)基因启动子),四环素调节的启动子(例如,四环素响应的启动子,四环素操作子序列(tetO),tet-On启动子或tet-Off启动子),类固醇调节的启动子(例如,大鼠糖皮质激素受体,雌激素受体的启动子,或蜕皮素受体的启动子),或金属调节的启动子(例如,金属蛋白启动子)。物理调节的启动子包括例如:温度调节的启动子(例如,热休克启动子)和光调节的启动子(例如,光诱导的启动子或光抑制的启动子)。
组织特异性启动子可以是例如:神经元特异性启动子,神经胶质特异性启动子,肌肉细胞特异性启动子,心脏细胞特异性启动子,肾细胞特异性启动子,骨细胞特异性启动子,内皮细胞特异性启动子或免疫细胞特异性启动子(例如,B细胞启动子或T细胞启动子)。
发育调节的启动子包括例如:仅在胚胎发育阶段具有活性的启动子或仅在成体细胞中具有活性的启动子。
“可操作地连接”或“被可操作地连接的”包括两个或多个成分(例如,启动子和另一序列元件)并列在一起,使这两个成分正常发挥作用并使得所述成分中的至少一个能够调节在其他成分中的至少一个之后发挥功能。例如,如果启动子响应一个或多个转录调节因子的存在或不存在控制编码序列的转录水平,那么所述启动子可以可操作地连接至所述编码序列。可操作的连接可包括彼此邻近的序列或反向作用的序列(例如,调节性序列可远距离发挥作用以控制所述编码序列的转录)。
核酸的“互补”是指核酸的一个链中的核苷酸序列根据其碱基的方向性与相对的核酸链上的另一序列形成氢键。DNA中的互补碱基通常是A与T和C与G。在RNA中,互补碱基通常是C与G和U与A。互补性可以是完全互补的或者大量/充分互补的。两个核酸之间的完全互补是指两个核酸可形成二倍体,其中,该二倍体中的每个碱基通过沃森-克里克(Watson-Crick)碱基配对原则与互补碱基键合。“大量”或“充分”互补是指一个链中的序列不与相对链中的序列全部和/或完全互补,但是在这两个链上的碱基之间出现足够的键合以在一系列杂交条件(例如,盐浓度和温度)下形成稳定的杂交复合物。这些条件可使用序列和预测杂交的链的Tm(熔融温度)的标准数学计算方法进行预测,或可使用常规方法由经验确定Tm来进行预测。Tm包括两个核酸链之间形成的杂交复合物群发生50%变性(即,双链核酸分子群的一半解离成单链)的温度。在低于Tm温度的条件下,有利于形成杂交复合物,而在高于Tm温度的条件下,有利于杂交复合物中的链发生熔融或分离。可使用例如Tm=81.5+0.41(%G+C)估算在1M NaCl水溶液中具有已知的G+C含量的核酸的Tm,虽然其他已知的Tm计算方法需要考虑核酸的结构特征。
“杂交条件”包括通过互补链相互作用和氢键合将一个核酸链结合至另一核酸链以生成杂交复合物的累积环境。这些条件包括含有核酸的水溶液或有机溶液的化学成分及其浓度(例如,盐、螯合剂、甲酰胺)以及混合物的温度。诸如孵育时间的长度或反应腔室的尺寸之类的其他因素可有助于所述环境。参见,例如,Sambrook等人,Molecular Cloning,ALaboratory Manual,2.sup.nd ed.,pp.1.90-1.91,9.47-9.51,1 1.47-11.57(ColdSpring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,1989),该参考文献的全部内容通过引用并入本文,用于所有目的。
虽然在碱基之间可能会发生错配,但是,杂交要求两个核酸包含互补的序列。适于在两个核酸之间发生杂交的条件取决于核酸的长度和互补的程度,其是本领域熟知的可变量。两个核苷酸序列之间的互补程度越大,具有那些序列的核酸的杂交体的熔融温度(Tm)的数值越大。对于具有较短的互补片段(例如,35个核苷酸或更少的核苷酸互补,30个核苷酸或更少的核苷酸互补,25个核苷酸或更少的核苷酸互补,22个核苷酸或更少的核苷酸互补,20个核苷酸或更少的核苷酸互补,或18个核苷酸或更少的核苷酸互补)的核酸之间的杂交而言,错配位置变得非常重要(参见上述Sambrook等人,11.7-11.8)。通常,可杂交的核酸的长度为至少约10个核苷酸。可杂交的核酸的示例性的最小长度包括至少约15个核苷酸,至少约20个核苷酸,至少约22个核苷酸,至少约25个核苷酸,以及至少约30个核苷酸。而且,温度和洗涤溶液的盐浓度可根据诸如互补区域的长度和互补程度之类的因素进行必要地调节。
多核苷酸的序列不需要与待进行特异性杂交的其靶向核酸的序列100%互补。而且,多核苷酸可在一个或多个片段上进行杂交,使得中间的片段或邻近片段不涉及杂交事件(例如,环结构或发夹结构)。多核苷酸(例如,gRNA)可包括与其所靶定的靶向核酸序列内的目标区域具有至少70%序列互补性,至少80%序列互补性,至少90%序列互补性,至少95%序列互补性,至少99%序列互补性或100%序列互补性。例如,18个至20个核苷酸与目标区域互补并且因此进行特异性杂交的gRNA可表现出90%的互补性。在该实例中,剩余的非互补性核苷酸可以是成簇的或穿插在互补核苷酸之间并且无需彼此相邻或与互补的核苷酸相邻。
核酸内核酸序列的特定片段之间的互补百分比可使用BLAST(碱基局部比对检索工具,basic local alignment search tool)程序和PowerBLAST程序(Altschul等人,(1990)J.Mol.Biol.215:403-410;Zhang and Madden(1997)Genome Res.7:649-656)进行常规确定或通过使用Gap程序(Wisconsin Sequence Analysis Package,Version 8forUnix,Genetics Computer Group,University Research Park,Madison Wis.),使用默认设置进行常规确定,所述Gap程序使用Smith和Waterman算法(Adv.Appl.Math.,1981,2,482-489)。
本文提供的方法和组合物使用多种不同的成分。全文中的一些成分可具有活性变体和片段。这些成分包括例如:Cas蛋白质,CRISPR RNA,tracrRNA,和向导RNA。这些成分中的每一个的生物活性在本文中进行描述。术语“功能”是指蛋白质或核酸(或其片段或变体)展现出生物活性或功能的固有能力。这些生物活性或功能可包括例如:Cas蛋白质结合至向导RNA以及结合至目标DNA序列的能力。功能片段或变体的生物功能可以是相同的或相对于原始功能片段或变体实质上可发生改变(例如,关于其特异性或选择性或效率),但是仍然保留其基本生物功能。
术语“变体”是指不同于种群中的最普遍的序列的核苷酸序列(例如,一个核苷酸的差异)或者不同于种群中的最普遍的序列的蛋白质序列(例如,一个氨基酸的差异)。
涉及蛋白质的术语“片段”是指比全长蛋白质具有更短或更少的氨基酸的蛋白质。涉及核酸的术语“片段”是指比全长核酸具有更短或更少的核苷酸的核酸。片段可以是例如N-末端片段(即,除去了蛋白质的C末端部分),C-末端片段(即,除去了蛋白质的N末端部分),或内部片段。
涉及两个多核苷酸或多肽序列的上下文中的“序列一致性”或“一致性”涉及在特定比对窗口上进行最大一致性比对时两个序列中的相同残基。当针对蛋白质使用序列一致性的百分比时,不一致的残基位置通常由于保守氨基酸的取代而不同,其中,氨基酸残基被具有类似化学性质(例如,电荷或疏水性)的其他氨基酸残基取代并且因此不会改变分子的功能特性。当序列的不同之处在于保守取代时,序列一致性百分比可向上调节以校正取代的保守性。因这种保守取代而不同的序列被称为具有“序列类似性”或“类似性”。本领域熟知进行这种调节的方式。通常,这涉及将保守取代记为部分错配而非完全错配,从而增加序列一致性百分比。因此,例如,在等同氨基酸计分为1并且非保守取代计分为0的条件下,保守取代的计分为0和1之间。例如,如在程序PC/GENE(Intelligenetics,Mountain View,California)中所实施的,计算保守取代的计分。
“序列一致性的百分比”包括通过在比较窗口上比较两个最佳比对的序列(完全匹配的残基的最大数目)所确定的数值,其中,对于两个序列的最佳比对而言,比较窗口中的多核苷酸序列的一部分可包括相比于参比序列(其不包括添加或删除)的添加或删除(即,空隙)。百分比如下进行计算:确定两个序列中出现等同的核酸碱基或氨基酸残基的位置数目以获得匹配的位置数目,匹配的位置数目除以比较窗口中的总位置数目并乘以100以得到序列一致性百分数。除非另有说明(例如,较短的序列包括连接的异源序列),比较窗口是全长的进行比较的两个较短的序列。
除非另有说明,序列一致性/类似性数值包括通过使用如下参数的GAP版本10而获得的数值,所述参数为:对于核苷酸序列的%一致性和%相似性使用50的GAP权重和3的长度权重以及nwsgapdna.cmp计分矩阵,对于氨基酸序列的%一致性和%相似性使用8的GAP权重和2的长度权重以及BLOSUM62计分矩阵,或其任何等同程序。“等同程序”包括任何序列比较程序,对于所考虑的任何两个序列而言,当与GAP版本10生成的相应比对比较时,所述序列比较程序产生具有等同的核苷酸或氨基酸残基匹配和序列一致性等同百分比的比对。
术语“保守氨基酸取代”是指使用类似尺寸、电荷或极性的不同氨基酸取代通常存在于序列中的氨基酸。保守取代的实例包括将非极性(疏水)残基(例如,异亮氨酸、缬氨酸或亮氨酸)取代为另一非极性残基。类似地,保守取代的实例包括将一个极性(亲水性)残基取代为另一极性残基,例如,精氨酸和赖氨酸之间的取代,谷氨酰胺和天冬酰胺之间的取代,或甘氨酸和丝氨酸之间的取代。此外,将碱性残基(例如,赖氨酸、精氨酸或组氨酸)取代为另一碱性残基或将一个酸性残基(例如,天冬氨酸或谷氨酸)取代为另一酸性残基是保守取代的其他实例。非保守取代的实例包括将非极性(疏水)氨基酸残基(例如,异亮氨酸、缬氨酸、亮氨酸、丙氨酸或甲硫氨酸)取代为极性(亲水)残基(例如,半胱氨酸、谷氨酰胺、谷氨酸或赖氨酸)和/或将极性残基取代为非极性残基。典型的氨基酸分类在下表1中予以总结。
表1.氨基酸分类
Figure BDA0003645747480000171
术语“体外(in vitro)”包括人工环境以及在人工环境(例如,试管)中发生的加工或反应。术语“体内(in vivo)”包括天然环境(例如,细胞或生物体或人体)以及在天然环境中发生的加工或反应。术语“离体(ex vivo)”包括已从个体体内取出的细胞以及在该细胞中发生的加工或反应。
术语“报告体基因”是指具有编码基因产物(通常为酶)的序列的核酸,在将包含可操作地连接至内源或异源启动子和/或增强子元件的报告体基因序列的构建体引入至含有(或可能含有)活化所述启动子和/或增强子元件所必需的因子的细胞中时易于定量分析所述基因产物。报告体基因的实例包括但不限于:编码β-半乳糖苷酶(lacZ)的基因,细菌氯霉素乙酰转移酶(cat)基因,萤火虫荧光素酶基因,编码β-葡萄糖醛酸酶(GUS)的基因,以及编码荧光蛋白的基因。“报告体蛋白”是指由报告体基因编码的蛋白质。
本文使用的术语“荧光报告体蛋白”是指可基于荧光进行检测的报告体蛋白,其中,所述荧光可直接来自于报告体蛋白,来自于报告体蛋白在荧光底物上的活性或来自于对荧光标记的化合物结合具有亲和性的蛋白质。荧光蛋白的实例包括绿色荧光蛋白(例如,GFP,GFP-2,tagGFP,turboGFP,eGFP,Emerald,Azami Green,Monomeric Azami Green,CopGFP,AceGFP,ZsGreenl),黄色荧光蛋白(例如,YFP,eYFP,Citrine,Venus,YPet,PhiYFP,ZsYellowl),蓝色荧光蛋白(例如,BFP,eBFP,eBFP2,Azurite,mKalamal,GFPuv,Sapphire,T-sapphire),青色荧光蛋白(例如,CFP,eCFP,Cerulean,CyPet,AmCyanl,Midoriishi-Cyan),红色荧光蛋白(例如,RFP,mKate,mKate2,mPlum,DsRed monomer,mCherry,mRFP1,DsRed-Express,DsRed2,DsRed-Monomer,HcRed-Tandem,HcRedl,AsRed2,eqFP611,mRaspberry,mStrawberry,Jred),橙色荧光蛋白(例如,mOrange,mKO,Kusabira-Orange,Monomeric Kusabira-Orange,mTangerine,tdTomato)和任何其他合适的可通过流式细胞术方法检测其在细胞中的存在的荧光蛋白。
响应双链断裂(DSB)的修复主要通过两种保守DNA修复通路:同源重组(HR)和非同源性末端结合(NHEJ)而发生。参见,Kasparek&Humphrey(2011)Seminars in Cell&Dev.Biol.22:886-897,其全部内容通过引用并入本文,用于所有目的。同样,由外源供体核酸介导的目标核酸的修复可包括两个多核苷酸之间的遗传信息进行交换的任何过程。
术语“重组”包括在两个多核苷酸之间发生遗传信息交换的任何过程并且“重组”可通过任何机理发生。重组可通过同源定向修复(HDR)或同源重组(HR)发生。HDR或HR包括可能需要核苷酸序列同源性的核酸修复形式,使用作为用于修复“目标”分子(即,经历了双链断裂的分子)的模板的“供体”分子并且引起遗传信息从供体转移至靶标。在不受任何特定理论的限制的条件下,这些转移可能会涉及在断裂的靶标和供体之间形成的异源双链DNA的错配校正和/或合成依赖的链退火和/或相关过程,在所述合成依赖的链退火过程中,所述供体用于再合成将会成为靶标的一部分的遗传信息。在一些情况下,供体多核苷酸、供体多核苷酸的一部分、供体多核苷酸的拷贝或供体多核苷酸的拷贝的一部分整合进入靶标DNA。参见,Wang等人,(2013)Cell 153:910-918;Mandalos等人,(2012)PLOS ONE 7:e45768:1-9;and Wang等人,(2013)Nat Biotechnol.31:530-532,这些参考文献中的每一个的全部内容通过引用并入本文,用于所有目的。
NHEJ包括通过使断裂末端彼此直接连接或使断裂末端连接至外源序列而无需同源模板而对核酸中的双链断裂进行修复。通过NHEJ进行非邻近序列的连接通常可在双链断裂的位点附近产生删除、插入或位移。例如,NHEJ还可通过使断裂末端与外源供体核酸的末端直接连接(例如,基于NHEJ的捕获)而产生外源供体核酸的定向整合。当同源定向修复(HDR)通路不易于使用(例如,在未分化的细胞,初始细胞和难以进行同源DNA修复的细胞中)时,这种NHEJ介导的定向整合对于外源供体核酸的插入而言是优选的。此外,与同源定向修复形成鲜明对照的是,不太需要涉及裂解位点(超出由Cas介导的裂解产生的悬挂)侧面较大区域的序列一致性的知识,这些知识在尝试向具有对其基因组序列不太了解的基因组的生物体内进行定向插入时是有益的。整合可通过将外源供体核酸和裂解的基因组序列之间的平端进行连接或通过使用外源供体核酸连接粘性末端(即,具有5’或3’的悬挂)来进行,其中,所述外源供体核酸位于与由裂解的基因组序列中的Cas蛋白质生成的那些悬挂相容的悬挂的侧面。参见例如,US 2011/020722,WO 2014/033644,WO 2014/089290,andMaresca等人,(2013)GenomeRes.23(3):539-546,这些参考文献中的每一个的全部内容通过引用并入本文,用于所有目的。如果平端被连接,那么可能需要靶点切除和/或供体切除以生成片段连接所需的微同源区域,靶点切除和/或供体切除可能会在靶向序列中产生不想要的改变。
组合物或方法“包含”或“包括”一种或多种所记载的成分可能包括其他未特别记载的成分。例如,“包含”或“包括”蛋白质的组合物可能只含有蛋白质或含有蛋白质以及其他成分。过渡性措辞“基本由…构成”是指权利要求的范围被解释为包含权利要求中所记载的指定成分以及不会实质上影响要求保护的发明的基本特征和新特征的那些成分。因此,本发明的权利要求中所使用的术语“基本由…构成”无意被解释为等同于“包含”。
“任选的”或“任选地”是指后续描述的事件或情况可能发生或可能不发生并且该描述包括所述事件或情况发生的实例和所述事件或所述情况不发生的实例。
数值范围的指定包括所述范围内的或所述范围所限定的所有整数以及该范围内由整数限定的所有子范围。
除非另有明确说明,术语“约”包括所述值的测量误差的标准偏差(例如,SEM)范围内的值。
术语“和/或”是指并且包括所列出的相关项目中的一个或多个中的任何可能的组合或所有可能的组合并且当使用可选术语“或”时包括缺少某些组合。
术语“或”是指具体列表中的任何一个成员并且还包括所列出的成员中的任何组合。
除非另有明确说明,单数形式的冠词“a”,“an”以及“the”包括复数指代物。例如,术语“单数形式的Cas蛋白质”或“至少一个Cas蛋白质”可包括多个Cas蛋白质,包括其混合物。
统计学上显著的是指p≤0.05。
I.概述
CRISPR/Cas9系统是一种用于基因组工程化的有力工具。这种系统在体内的一种限制在于需要同时将所有成分引入至活体生物体中。引入这些成分的典型方法是将DNA构建体瞬时转染至将会产生合适的RNA和蛋白质的细胞中。虽然这种方法很有效,但是这种方法具有固有缺陷,这是因为细胞必须依赖于质粒DNA构建体先经历转录再进行翻译,随后使Cas9蛋白质与sgRNA成分发生相互作用。本领域需要更好的方法和工具来更加有效地评价CRISPR/Cas试剂的体内活性并且评价靶定特定组织或细胞类型的不同的体内递送方法和参数。
本文提供用于评价CRISPR/Cas介导的非同源末端连接(NHEJ)的活性和/或CRISPR/Cas诱导的目标基因组基因座与外源供体核酸体内或离体重组的方法和组合物。所述方法和组合物使用包含Cas表达盒(例如,基因组整合的Cas表达盒)的细胞和非人类动物,从而使得Cas蛋白质是组成性可获得的,或者例如以组织特异性的方式或时间特异性的方式可获得的。
因为仅需要将向导RNA引入至非人类动物,因此,包含Cas表达盒的非人类动物简化了用于测试CRISPR/Cas成分的体内递送和体内活性的方法。此外,Cas表达盒任选地可以是条件性Cas表达盒,其可以在特定组织或发育阶段选择性地表达,从而降低了Cas介导的体内毒性的风险,或者,Cas表达盒可以被组成性表达,从而能够测试任何类型和所有类型的细胞、组织和器官中的活性。
本文还提供了用于产生和使用这些非人类动物以测试和测量CRISPR/Cas核酸酶体内修饰目标基因组基因座的能力的方法和组合物。在一些这样的测试和测量CRISPR/Cas核酸酶体内修饰目标基因组基因座的方法中,向导RNA可通过AAV-介导的递送被递送至Cas-就绪的非人类动物。如实施例1所示,AAV介导的将向导RNA递送至Cas9就绪的小鼠以及具体地AAV8-介导的将向导RNA递送至肝脏使得CRISPR/Cas的靶定水平显著高于通过LNP或HDD将向导RNA递送至Cas9就绪的小鼠或显著高于通过LNP或HDD将Cas9和向导RNA这两者递送至野生型小鼠。
II.包含Cas表达盒的非人类动物||
本文提供使用包含Cas表达盒的非人类动物或细胞评价成簇的规律间隔的短回文重复序列(CRISPR)/CRISPR相关(Cas)系统或该系统的成分(例如,将向导RNA引入非人类动物或细胞)体内或离体修饰目标基因组基因座的能力的方法和组合物。
CRISPR/Cas系统包括Cas基因的表达或定向活化所涉及的转录体和其他元件。CRISPR/Cas系统可以是例如,I型系统,II型系统或III型系统。可选地,CRISPR/Cas系统可以是V型系统(例如,V-A亚型或V-B亚型)。在本文公开的组合物和方法中使用的CRISPR/Cas系统可以是非天然生成的。“非天然生成的”系统包括显示出人工参与的任何事件,例如,从系统的天然生成的状态改变或突变而来的系统中的一个或多个成分,至少基本上不含与系统本质上天然相关的至少一种其他成分,或与系统非天然相关的至少一种其他成分相关联。例如,非天然生成的CRISPR/Cas系统可使用包含非天然一同生成的gRNA和Cas蛋白质的CRISPR复合物,非天然生成的Cas蛋白质或非天然生成的gRNA。
本文公开的方法和组合物使用CRISPR/Cas系统,测试CRISPR复合物(包含与Cas蛋白质复合的向导RNA(gRNA))体内诱导目标基因组基因座中的位点定向裂解事件以通过非同源末端连接(NHEJ),在外源供体核酸存在的条件下通过同源定向修复或通过任何其他修复或组合方法修复所述目标基因组基因座的能力。
A.Cas9就绪的非人类动物
本文公开的细胞和非人类动物包括Cas表达盒。Cas蛋白质通常包括至少一个可与向导RNA(gRNA,其在下文详细描述)发生相互作用的RNA识别结构域或RNA结合结构域,以及核酸酶结构域。核酸酶结构域对核酸裂解具有催化活性,所述核酸裂解包括核酸分子的共价键的断裂。裂解可产生平端或交错端,并且其可以是单链的或双链的。Cas蛋白质可具有完全裂解活性以在目标核酸中产生双链断裂(例如,带有平端的双链断裂),或其可以是在目标核酸中产生单链断裂的切口酶。
包括Cas表达盒的细胞或非人类动物具有仅需要递送向导RNA以检测CRISPR/Cas介导的对目标基因组基因座的修饰的优点。
(1)Cas表达盒
本文所述的细胞和非人类动物包含Cas表达盒。所述Cas表达盒可被稳定地整合至所述细胞或非人类动物的基因组(即,整合至染色体)中,或者其可位于染色体的外部(例如,染色体外复制DNA)。任选地,Cas表达盒被稳定地整合至基因组中。稳定整合的Cas表达盒可被随机整合至非人类动物的基因组(即,转基因),或者其可被整合至非人类动物的基因组的预定区域中(即,敲入)。任选地,Cas表达盒被稳定地整合至本文其他地方描述的安全港。稳定整合有Cas表达盒的目标基因组基因座对于Cas表达盒而言可以是杂合的或者对于Cas表达盒而言可以是纯合的。
由Cas表达盒编码的Cas蛋白质可以是任何Cas蛋白质(例如,Cas9蛋白质),其实例在下文中描述。编码的Cas蛋白质可还包含一种或多种细胞核定位信号(NLS)(例如,N-末端NLS和C-末端NLS),并且编码Cas蛋白质的序列可以是被优化为用于下文描述的细胞或非人类动物的密码子。例如,这种表达盒可编码包含如下氨基酸序列的蛋白质,或编码基本由如下氨基酸序列构成的蛋白质,或编码由如下氨基酸序列构成的蛋白质,所述氨基酸序列与SEQ ID NO:19中列出的Cas9蛋白质序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%的一致性。编码序列可包含如下序列,基本由如下序列构成或由如下序列构成,所述序列与SEQ ID NO:30中列出的Cas9编码序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%的一致性。
Cas表达盒的实例包括聚腺苷酸化信号下游的Cas编码序列或侧面具有由位点特异性重组酶识别的重组酶识别位点的转录终止子下游的Cas编码序列。所述聚腺苷酸化信号或转录终止子防止Cas蛋白质转录和表达。然而,在暴露于位点特异性重组酶之后,聚腺苷酸化信号或转录终止子将会被删除,并且Cas蛋白质可被表达。
如果以组织特异性的方式或者发育阶段特异性的方式删除了聚腺苷酸化信号或转录终止子,那么,Cas表达盒的这种结构能够在包含Cas表达盒的非人类动物体内产生组织特异性表达或发育阶段特异性表达。这可降低由于Cas蛋白质在细胞或非人类动物体内表达的延长或Cas蛋白质在不期望的发育阶段或在非人类动物体内的不期望的细胞或组织类型中表达而引起的毒性。例如,毒性可能是由于脱靶位点的裂解和中断而产生的。参见,例如,Parikh等人,(2015)PLoS One 10(1):e0116484。可诱导的表达也可能是有益的,这是因为编辑某些组织(例如,免疫细胞)中的一些基因可能是有害的,并且可能会产生免疫反应。例如,在一些情况下,如果某个基因在整个个体中发生突变,那么可能是致死性的,但是如果这个基因在特定组织或细胞类型中发生突变,那么这可能是有益的。如果包含Cas表达盒的非人类动物还包含可操作地连接至组织特异性或发育阶段特异性启动子(例如,用于肝脏特异性表达的白蛋白启动子或用于胰腺特异性表达的胰岛素2启动子)的位点特异性重组酶,那么可以实现以组织特异性的方式或发育阶段特异性的方式删除聚腺苷酸化信号或转录终止子。类似地,对肝脏或其他组织具有特异性的LNP制剂可用于递送重组酶,或对于特定组织具有特异性的AAV递送方法或AAV血清型(例如,用于肝脏的AAV8,或用于胰腺的AAV定向注射)可用于递送重组酶。可以仅删除那些组织或那些发育阶段的聚腺苷酸化信号或转录终止子,从而能够进行Cas蛋白质的组织特异性表达或发育阶段特异性表达。在一个实例中,Cas蛋白质可以肝脏特异性的方式被表达。已用于研发非人类动物的这些“重组酶删除”株(recombinase delete strain)的这些启动子的实例在本文的其他地方公开。
可使用任何转录终止子或聚腺苷酸化信号。本文使用的“转录终止子”是指导致转录终止的DNA序列。在真核细胞中,转录终止子由蛋白质因子识别,并且在终止之后进行聚腺苷酸化(这是一种在存在poly(A)聚合酶的条件下将poly(A)尾端添加至mRNA转录子中的过程)。哺乳动物poly(A)信号通常由长度为约45个核苷酸的核心序列构成,该核心序列的侧面可能具有用于提高裂解和聚腺苷酸化效率的多种辅助序列。核心序列由mRNA中高度保守的上游元件(AATAAA或AAUAAA,被称为poly A识别基序或poly A识别序列,其由裂解和聚腺苷酸化特异性因子(CPSF)识别)和难以界定的下游区域(Us中富含或Gs和Us中富含的区域)构成,所述下游区域由裂解刺激因子(CstF)限制。可使用的转录终止子的实例包括例如:人生长激素(HGH)聚腺苷酸化信号,猿猴病毒40(SV40)晚期聚腺苷酸化信号,兔β-球蛋白聚腺苷酸化信号,牛生长激素(BGH)聚腺苷酸化信号,磷酸甘油酸酯激酶(PGK)聚腺苷酸化信号,AOXI转录终止序列,CYC1转录终止序列,或适于调节真核细胞中的基因表达的任何已知的转录终止序列。
位点特异性重组酶包括可促进重组酶识别位点之间的重组的酶,其中,单个核酸内两个重组位点被从物理上分隔开或者两个重组位点位于不同的核酸上。重组酶的实例包括Cre,Flp和Dre重组酶。Cre重组酶基因的一个实例是Crei,其中,编码Cre重组酶的两个外显子被内含子分隔开以防止其在原核细胞中表达。这种重组酶可还包含细胞核定位信号以促进定位至细胞核(例如,NLS-Crei)。重组酶识别位点包括被位点特异性重组酶识别的并且可作为重组事件的底物的核苷酸序列。重组酶识别位点的实例包括FRT,FRT11,FRT71,attp,att,rox,and lox sites such as loxP,lox511,lox2272,lox66,lox71,loxM2,和lox5171。
Cas表达盒可以可操作地连接至任何合适的用于在非人类动物体内表达的启动子。所述非人类动物可以是本文其他地方描述的任何合适的非人类动物。作为一个实例,Cas表达盒可以可操作地连接至目标基因组基因座的内源启动子(例如,Rosa26启动子)。可选地,Cas表达盒可以可操作地连接至外源启动子,例如,组成性活性启动子(例如,CAG启动子或与巨细胞病毒(CMV)立即早期增强子(CAGG)连接的鸡β肌动蛋白启动子/增强子),条件性启动子,可诱导的启动子,时间限制的启动子(例如,发育调节的启动子)或空间限制的启动子(例如,细胞特异性或组织特异性启动子)。这些启动子是本领域熟知的并且在本文其他地方进行了讨论。示例性的CAGG启动子在SEQ ID NO:38中列出或者包含如下序列,基本由如下序列构成或者由如下序列构成,所述序列与SEQ ID NO:38中列出的序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%的一致性。
本文公开的Cas表达盒还可包含其他成分。Cas表达盒可还包含位于Cas表达盒的5’端的3’剪接序列和/或位于Cas表达盒的3’端的Cas蛋白质的编码序列之后的另一聚腺苷酸化信号。Cas表达盒可还包含选择盒,该选择盒包含例如耐药蛋白的编码序列。合适的选择标志物的实例包括:新霉素磷酸转移酶(neor),潮霉素B磷酸转移酶(hygr),嘌呤霉素-N-乙酰转移酶(puror),灭瘟素S脱氢酶(bsrr),黄嘌呤/鸟嘌呤磷酸核糖转移酶(gpt)以及单纯疱疹病毒胸苷激酶(HSV-k)。任选地,选择盒的侧面可具有位点特异性重组酶的重组酶识别位点。如果Cas表达盒还包含位于上述Cas编码序列上游的聚腺苷酸化信号侧面的重组酶识别位点,那么任选地,将由不同的重组酶识别的不同的重组酶识别位点组用在选择盒的侧面。可选地,相同的重组酶识别位点组可位于Cas编码序列上游的聚腺苷酸化信号和选择盒这两者的侧面。示例性的neor-聚腺苷酸化序列在SEQ ID NO:37中列出或者其包含如下序列,基本由如下序列构成或由如下序列构成,所述序列为与SEQ ID NO:37中列出的序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%的一致性。
Cas表达盒可还包含编码蛋白质标签(例如,3x FLAG标签)的核酸。这样的标签的实例在SEQ ID NO:23中列出,其任选地由SEQ ID NO:34编码。例如,所述标签可以位于Cas蛋白质的N-末端,Cas蛋白质的C-末端,或Cas蛋白质的内部。例如,这种表达盒可编码如下蛋白质,其包含与SEQ ID NO:22中列出的3x FLAG-Cas9蛋白质序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%的一致性的氨基酸序列,或基本由该氨基酸序列构成或由该氨基酸序列构成,或者包含与SEQ ID NO:16中列出的3x FLAG-Cas9-P2A-eGFP蛋白质序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%的一致性的氨基酸序列,或基本由该氨基酸序列构成或由该氨基酸序列构成。编码序列可包含与SEQ ID NO:31中列出的3xFLAG-Cas9编码序列或SEQ ID NO:29中列出的3xFLAG-Cas9-P2A-eGFP编码序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%一致性的序列,基本由该序列构成,或由该序列构成。
Cas表达盒可还包含编码一种或多种报告体蛋白(例如,荧光蛋白(例如,绿色荧光蛋白))的核酸。可使用任何合适的报告体蛋白。例如,可使用本文其他地方描述的荧光报告体蛋白或可使用非荧光报告体蛋白。荧光报告体蛋白的实例在本文的其他地方提供。非荧光报告体蛋白包括例如:在组化分析或生物发光分析中使用的报告体蛋白,例如β-半乳糖苷酶,荧光素酶(例如,海肾荧光素酶,萤火虫荧光素酶和NanoLuc荧光素酶)以及β-葡萄糖醛酸酶。Cas表达盒可包括可在流式细胞分析法中检测到的报告体蛋白(例如,诸如绿色荧光蛋白之类的荧光报告体蛋白)和/或可在组化分析中检测到的报告体蛋白(例如,β-半乳糖苷酶蛋白)。这种组化分析的一个实例是通过水解X-Gal(5-溴-4-氯-3-吲哚基-b-D-半乳糖苷)通过组化方法使β-半乳糖苷酶的原位表达可视化,其产生蓝色沉淀,或者使用诸如β-甲基伞酮半乳糖苷(MUG)和荧光素双半乳糖苷(FDG)之类的荧光底物使β-半乳糖苷酶的原位表达可视化。
这些情况下的Cas表达盒包括多顺反子核酸。例如,所述核酸可包含由介入的内部核糖体进入位点(IRES)或介入的2A肽编码序列分隔开的Cas蛋白质编码序列和报告体蛋白编码序列(以任何顺序均可)。多顺反子表达构建体同时表达两个或多个来自相同mRNA的不同蛋白质(即,相同启动子产生的转录体)。用于蛋白质的多顺反子表达的合适的策略包括例如,使用2A肽和使用内部核糖体进入位点(IRES)。例如,这些核酸可包含由介入的内部核糖体进入位点(IRES)或介入的2A肽编码序列分隔开的两个或多个报告体蛋白的编码序列。作为一个实例,这种多顺反子载体可使用一个或多个内部核糖体进入位点(IRES)以允许从mRNA的内部区域开始进行翻译。作为另一实例,这种多顺反子载体可使用一个或多个2A肽。这些肽是较小的“自裂解”肽,其通常具有18至22个氨基酸的长度,并且这些肽通过相同的mRNA产生等摩尔水平的多种基因。核糖体跳过2A肽的C-末端的甘氨酰基-脯氨酰基肽键的合成,在2A肽及其相邻下游肽之间产生“裂解”。参见,例如,Kim等人,(2011)PLoS One 6(4):e18556,其全部内容通过引用并入本文,用于所有目的。“裂解”在C-末端上发现的甘氨酸和脯氨酸之间发生,这意味着上游顺反子将会具有若干个额外的残基添加至末端,同时下游顺反子将会从脯氨酸开始。因此,“裂解除去”的下游肽在其N-末端具有脯氨酸。2A-介导的裂解是所有真核细胞中的常见现象。已从小核糖核酸病毒,昆虫病毒和C型轮状病毒中识别出2A肽。参见,例如,Szymczak等人,(2005)Expert Opin Biol Ther 5:627-638,其全部内容通过引用并入本文,用于所有目的。可使用的2A肽的实例包括明脉扁刺蛾病毒(Thosea asigna virus)2A(T2A);猪捷申病毒(porcine teschovirus)-12A(P2A);马鼻炎A病毒(equine rhinitis A virus,ERAV)2A(E2A)和FMDV 2A(F2A)。示例性的T2A,P2A,E2A和F2A序列包括如下序列:T2A(EGRGSLLTCGDVEENPGP;SEQ ID NO:2);P2A(ATNFSLLKQAGDVEENPGP;SEQ ID NO:3);E2A(QCTNYALLKLAGDVESNPGP;SEQ ID NO:4);和F2A(VKQTLNFDLLKLAGDVESNPGP;SEQ ID NO:5)。GSG残基可加至这些肽的任一种的5’端以改善裂解效率。带有添加在5’端的GSG残基的P2A的示例性的编码序列在SEQ ID NO:32中列出或者包括与SEQ ID NO:32中列出的序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%一致性的序列,基本由该序列构成或者由该序列构成。例如,这样的表达盒可编码如下蛋白质,该蛋白质包含与SEQ ID NO:13中列出的Cas9-P2A-eGFP蛋白质序列或SEQ ID NO:16中列出的3xFLAG-Cas9-P2A-eGFP蛋白质序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%一致性的氨基酸序列,基本由该氨基酸序列构成或由该氨基酸序列构成。编码序列可包含与SEQ ID NO:28中列出的Cas9-P2A-eGFP编码序列或SEQ IDNO:29中列出的3xFLAG-Cas9-P2A-eGFP编码序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%一致性的序列,基本由该序列构成,或由该序列构成。
Cas表达盒可还包含其他元件,例如转录后调节元件或Cas编码序列下游的聚腺苷酸化信号。示例性的转录后调节元件是土拨鼠肝炎病毒(woodchuck hepatitis virus)转录后调节元件(WPRE),其在SEQ IDNO:35中列出或者包含与SEQ ID NO:35中列出的序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%一致性的序列,基本由该序列构成,或者由该序列构成。示例性的聚腺苷酸化信号是SEQ IDNO:36中列出的牛生长激素聚腺苷酸化信号,或包含与SEQ ID NO:36中列出的序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%一致性的序列,基本由该序列构成,或者由该序列构成。
一个示例性的Cas表达盒在5’至3’方向上包括:(a)3’剪接序列;(b)侧面具有重组酶的第一和第二重组酶识别位点(例如,Cre重组酶的loxP位点)的聚腺苷酸化信号;(c)Cas蛋白质编码序列(例如,NLS-Cas9编码序列,例如,其中,NLS位于N-末端并且NLS位于C-末端);(d)2A蛋白质编码序列(例如,P2A编码序列);以及(e)报告体蛋白(例如,荧光报告体蛋白,例如,绿色荧光蛋白)的编码序列。参见,例如,图1和图14中的MAID2599。这种表达盒可包含与SEQ ID NO:1中列出的序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%一致性的序列,基本由该序列构成或者由该序列构成。例如,这种表达盒可编码如下蛋白质,该蛋白质包含与SEQ ID NO:13中列出的Cas9-P2A-eGFP蛋白质序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%一致性的氨基酸序列,基本由该氨基酸序列构成或者由该氨基酸序列构成。
另一示例性的Cas表达盒在5’至3’方向上包括:(a)3’剪接序列;(b)Cas蛋白质编码序列(例如,NLS-Cas9编码序列,例如,在N-末端具有NLS并且在C-末端具有NLS);(c)2A蛋白质编码序列(例如,P2A编码序列);以及(d)报告体蛋白(例如,荧光报告体蛋白,例如,绿色荧光蛋白)的编码序列。参见,例如,图14中的MAID2600。这样的表达盒可包含与SEQ IDNO:12中列出的序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%一致性的序列,基本由该序列构成或者由该序列构成。例如,这样的表达盒可编码如下蛋白质,该蛋白质包含与SEQ ID NO:13中列出的Cas9-P2A-eGFP蛋白质序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%一致性的氨基酸序列,基本由该氨基酸序列构成或由该氨基酸序列构成。
另一示例性的Cas表达盒在5’至3’方向上包括:(a)3’剪接序列;(b)侧面具有重组酶的第一和第二重组酶识别位点(例如,Cre重组酶的loxP位点)的聚腺苷酸化信号;以及(c)Cas蛋白质编码序列(例如,NLS-Cas9编码序列,例如,在N-末端具有NLS并且在C-末端具有NLS)。参见,例如,图14中的MAID2600。这样的表达盒可包含与SEQ ID NO:17中列出的序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%一致性的序列,基本由该序列构成或者由该序列构成。例如,这样的表达盒可编码如下蛋白质,该蛋白质包含与SEQ ID NO:19中列出的Cas9蛋白质序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%一致性的氨基酸序列,基本由该氨基酸序列构成或由该氨基酸序列构成。
另一示例性的Cas表达盒在5’至3’方向上包括:(a)3’剪接序列;以及(b)Cas蛋白质编码序列(例如,NLS-Cas9编码序列,例如,在N-末端具有NLS并且在C-末端具有NLS)。参见,例如,图14中的MAID2661。这样的表达盒可包含与SEQ ID NO:18中列出的序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%一致性的序列,基本由该序列构成或者由该序列构成。例如,这样的表达盒可编码如下蛋白质,该蛋白质包含与SEQ ID NO:19中列出的Cas9蛋白质序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%一致性的氨基酸序列,基本由该氨基酸序列构成或由该氨基酸序列构成。
另一示例性的Cas表达盒在5’至3’方向上包括:(a)外源启动子(例如,组成性启动子,例如,CAGG启动子);(b)侧面具有重组酶的第一和第二重组酶识别位点(例如,Cre重组酶的loxP位点)的聚腺苷酸化信号;(c)Cas蛋白质编码序列(例如,NLS-Cas9编码序列,例如,在N-末端具有NLS并且在C-末端具有NLS,任选地,在N-末端或C-末端具有标签,例如,在N-末端具有3xFLAG标签);(d)2A蛋白编码序列(例如,P2A编码序列);以及(e)报告体蛋白(例如,荧光报告体蛋白,例如,绿色荧光蛋白)的编码序列。参见,例如,图14中的MAID2658。这样的表达盒可包含与SEQ ID NO:14中列出的序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%一致性的序列,基本由该序列构成或者由该序列构成。例如,这样的表达盒可编码如下蛋白质,该蛋白质包含与SEQ ID NO:16中列出的3xFLAG-Cas9-P2A-eGFP蛋白质序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%一致性的氨基酸序列,基本由该氨基酸序列构成或由该氨基酸序列构成。
另一示例性的Cas表达盒在5’至3’方向上包括:(a)外源启动子(例如,组成性启动子,例如,CAGG启动子);(b)Cas蛋白质编码序列(例如,NLS-Cas9编码序列,例如,在N-末端具有NLS并且在C-末端具有NLS,任选地,在N-末端或C-末端具有标签,例如,在N-末端具有3xFLAG标签);(c)2A蛋白编码序列(例如,P2A编码序列);以及(d)报告体蛋白(例如,荧光报告体蛋白,例如,绿色荧光蛋白)的编码序列。参见,例如,图14中的MAID2659。这样的表达盒可包含与SEQ ID NO:15中列出的序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%一致性的序列,基本由该序列构成或者由该序列构成。例如,这样的表达盒可编码如下蛋白质,该蛋白质包含与SEQ ID NO:16中列出的3xFLAG-Cas9-P2A-eGFP蛋白质序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%一致性的氨基酸序列,基本由该氨基酸序列构成或由该氨基酸序列构成。
另一示例性的Cas表达盒在5’至3’方向上包括:(a)外源启动子(例如,组成性启动子,例如,CAGG启动子);(b)侧面具有重组酶的第一和第二重组酶识别位点(例如,Cre重组酶的loxP位点)的聚腺苷酸化信号;以及(c)Cas蛋白质编码序列(例如,NLS-Cas9编码序列,例如,在N-末端具有NLS并且在C-末端具有NLS,任选地,在N-末端或C-末端具有标签,例如,在N-末端具有3xFLAG标签)。参见,例如,图14中的MAID2672。这样的表达盒可包含与SEQ IDNO:20中列出的序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%一致性的序列,基本由该序列构成或者由该序列构成。例如,这样的表达盒可编码如下蛋白质,该蛋白质包含与SEQ ID NO:22中列出的3xFLAG-Cas9蛋白质序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%一致性的氨基酸序列,基本由该氨基酸序列构成或由该氨基酸序列构成。
另一示例性的Cas表达盒在5’至3’方向上包括:(a)外源启动子(例如,组成性启动子,例如,CAGG启动子);以及(b)Cas蛋白质编码序列(例如,NLS-Cas9编码序列,例如,在N-末端具有NLS并且在C-末端具有NLS,任选地,在N-末端或C-末端具有标签,例如,在N-末端具有3xFLAG标签)。参见,例如,图14中的MAID2673。这样的表达盒可包含与SEQ ID NO:21中列出的序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%一致性的序列,基本由该序列构成或者由该序列构成。例如,这样的表达盒可编码如下蛋白质,该蛋白质包含与SEQ ID NO:22中列出的3xFLAG-Cas9蛋白质序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%一致性的氨基酸序列,基本由该氨基酸序列构成或由该氨基酸序列构成。
本文所述的Cas表达盒可以是任何形式。例如,Cas表达盒可以位于载体中或质粒中,例如,病毒载体。Cas表达盒可以可操作地连接至能够在除去上游聚腺苷酸化信号之后定向Cas蛋白质的表达的表达构建体中的启动子。可选地,Cas表达盒可以位于本文其他地方定义的靶向载体中。例如,所述靶向载体可包含位于Cas表达盒侧面的同源臂,其中,所述同源臂适于与期望的目标基因组基因座进行定向重组以促进基因组整合。
本文所述的Cas表达盒可位于体外,它们可位于离体(例如,基因组整合的或染色体外)细胞内(例如,胚胎干细胞内),或者它们可位于生物体(例如,非人类动物)体内(例如,基因组整合的或染色体外)。如果是离体的情况,Cas表达盒可位于来自任何生物体的任何类型的细胞内,例如,全能细胞,例如,胚胎干细胞(例如,小鼠或大鼠胚胎干细胞)或者诱导多能性干细胞(例如,人诱导多能性干细胞)。如果是体内的情况,Cas表达盒可位于任何类型的生物体内(例如,本文其他地方进一步描述的非人类动物)。
(2)Cas蛋白质和编码Cas蛋白质的多核苷酸
Cas蛋白质通常包含可与向导RNA(gRNA,下文中详细描述)发生相互作用的至少一个RNA识别结构域或至少一个RNA结合结构域。Cas蛋白质可还包含核酸酶结构域(例如,DNase或RNase结构域),DNA结合结构域,解旋酶结构域,蛋白质-蛋白质相互作用结构域,二聚化结构域和其他结构域。一些这样的结构域(例如DNase结构域)可来自于原生Cas蛋白质。可添加其他这样的结构域以产生修饰的Cas蛋白质。核酸酶结构域对核酸裂解具有催化活性,所述核酸裂解包括核酸分子的共价键的断裂。裂解可产生平端或交错端,并且其可以是单链或双链裂解。例如,野生型Cas9蛋白质通常会产生平端裂解产物。可选地,野生型Cpf1蛋白质(例如,FnCpf1)可产生带有5-核苷酸5’悬挂的裂解产物,其中,裂解发生在非目标链上的PAM序列的第18个碱基对之后以及目标链上的第23个碱基之后。Cas蛋白质可具有完全裂解活性以在目标基因组基因座处产生双链断裂(例如,带有平端的双链断裂),或者Cas蛋白质可以是在目标基因组基因座处产生单链断裂的切口酶。
Cas蛋白质的实例包括Cas1,Cas1B,Cas2,Cas3,Cas4,Cas5,Cas5e(CasD),Cas6,Cas6e,Cas6f,Cas7,Cas8a1,Cas8a2,Cas8b,Cas8c,Cas9(Csn1 or Csx12),Cas10,Cas10d,CasF,CasG,CasH,Csy1,Csy2,Csy3,Cse1(CasA),Cse2(CasB),Cse3(CasE),Cse4(CasC),Csc1,Csc2,Csa5,Csn2,Csm2,Csm3,Csm4,Csm5,Csm6,Cmr1,Cmr3,Cmr4,Cmr5,Cmr6,Csb1,Csb2,Csb3,Csx17,Csx14,Csx10,Csx16,CsaX,Csx3,Csx1,Csx15,Csf1,Csf2,Csf3,Csf4,和Cu1966,以及它们的同系物或修饰形式。
示例性的Cas蛋白质是Cas9蛋白质或从Cas9蛋白质衍生得到的蛋白质。Cas9蛋白质获自II型CRISPR/Cas系统并且通常与保守结构共享四个关键基序。基序1,2和4是类RuvC基序,并且基序3是HNH基序。示例性的Cas9蛋白质来自产脓链球菌(Streptococcuspyogenes),嗜热链球菌(Streptococcus thermophilus),链球菌属(Streptococcus sp.),金黄色葡萄球菌(Staphylococcus aureus),拟诺卡氏菌(Nocardiopsis dassonvillei),始旋链霉素(Streptomyces pristinaespiralis),绿色产色链霉菌(Streptomycesviridochromogenes),绿色产色链霉菌(Streptomyces viridochromogenes),玫瑰链孢囊菌(Streptosporangium roseum),玫瑰链孢囊菌(Streptosporangium roseum),酯环酸芽孢杆菌(Alicyclobacillus acidocaldarius),假真菌样芽孢杆菌(Bacilluspseudomycoides),还原砸酸盐芽孢杆菌(Bacillus selenitireducens),西伯利亚微杆菌(Exiguobacterium sibiricum),保加利亚乳杆菌(Lactobacillus delbrueckii),唾液乳杆菌(Lactobacillus salivarius),海洋微颤菌(Microscilla marina),伯克氏菌目(Burkholderiales bacterium),Polaromonas naphthalenivorans,极单胞菌(Polaromonas sp.),海洋固氮蓝藻(Crocosphaera watsonii),蓝杆藻(Cyanothece sp.),铜绿微囊藻(Microcystis aeruginosa),聚球藻(Synechococcus sp.),阿拉伯糖醋盐杆菌(Acetohalobium arabaticum),Ammonifex degensii,嗜热厌氧菌(Caldicelulosiruptorbecscii),Candidatus Desulforudis,肉毒杆菌(Clostridium botulinum),艰难梭菌(Clostridium difficile),大芬戈尔德菌(Finegoldia magna),嗜热盐碱厌氧菌(Natranaerobius thermophilus),Pelotomaculum thermopropionicum,喜温硫杆菌(Acidithiobacillus caldus),嗜酸氧化亚铁硫杆菌(Acidithiobacillusferrooxidans),Allochromatium vinosum,海杆状菌(Marinobactersp.),嗜盐亚硝化球菌(Nitrosococcushalophilus),瓦氏亚硝化球菌(Nitrosococcuswatsoni),河豚毒素假交替单胞菌(Pseudoalteromonashaloplanktis),成簇细枝菌(Ktedonobacterracemifer),调查甲烷盐菌(Methanohalobiumevestigatum),多变鱼腥藻(Anabaenavariabilis),泡沫节球菌(Nodularia spumigena),念球藻(Nostoc sp.),极大节螺藻(Arthrospira maxima),钝顶节螺藻(Arthrospira platensis),节旋藻(Arthrospira sp.),鞘丝藻(Lyngbya sp.),原型微鞘藻(Microcoleus chthonoplastes),颤藻(Oscillatoria sp.),Petrotogamobilis,Thermosipho africanus,Acaryochloris marina,脑膜炎双球菌(Neisseriameningitidis)或空肠弯曲菌(Campylobacter jejuni)。Cas9家族成员中的其他实例在WO2014/131833中描述,其全部内容通过引用并入本文,用于所有目的。来自化脓性链球菌(S.pyogenes)的Cas9(SpCas9)(SwissProt登录号:Q99ZW2)是示例性的Cas9蛋白质。来自金黄色葡萄糖球菌(S.aureus)的Cas9(SaCas9)(UniPort登录号:J7RUA5)是另一示例性的Cas9蛋白质。来自空肠弯曲菌(Campylobacter jejuni)的Cas9(CjCas9)(UniPort登录号为:Q0P897)是另一示例性的Cas9蛋白质。参见,例如,Kim等人,(2017)Nat.Comm.8:14500,其全部内容通过引用并入本文,用于所有目的。SaCas9比SpCas9小,并且,CjCas9比SaCas9和SpCas9小。
Cas蛋白质的另一实例是Cpf1(来自普氏菌属(Prevotella)和弗浪西斯氏菌1(Francisella 1)的CRISPR)蛋白质。Cpf1是包含与Cas9的对应结构域具有同源性的类RuvC核酸酶结构域以及Cas9的特有的富精氨酸簇的对应物的较大的蛋白质(约1300个氨基酸)。然而,Cpf1缺乏存在于Cas9蛋白质中的HNH核酸酶结构域,并且类Ruv-C结构域在Cpf1序列中是连续的,这与Cas9形成鲜明对照,Ruv-C结构域包含包括HNH结构域在内的较长的插入体。参见例如,Zetsche等人,(2015)Cell 163(3):759-771,其全部内容通过引用并入本文,用于所有目的。示例性的Cpf1蛋白质来自土拉弗朗西斯菌1(Francisella tularensis 1),土拉弗朗西斯菌亚种novicida(Francisella tularensis subsp.novicida),Prevotellaalbensis,毛螺旋菌科细菌MC2017 1(Lachnospiraceae bacterium MC2017 1),丁酸弧菌(Butyrivibrio proteoclasticus),佩莱格里尼菌科细菌GW2011_GWA2_33_10(Peregrinibacteria bacterium GW2011_GWA2_33_10),Parcubacteria细菌GW2011_GWC2_44_17(Parcubacteria bacterium GW2011_GWC2_44_17),Smithella sp.SCADC,氨基酸球菌属BV3L6(Acidaminococcus sp.BV3L6),毛螺菌科细菌MA2020(Lachnospiraceaebacterium MA2020),Candidatus Methanoplasma termitum,挑剔真杆菌(Eubacteriumeligens),牛眼莫拉氏菌237(Moraxella bovoculi 237),Leptospira inadai,毛螺菌科细菌ND2006(Lachnospiraceae bacterium ND2006),狗口腔红棕色单胞菌3(Porphyromonascrevioricanis 3),解糖胨普雷沃菌(Prevotella disiens),以及猕猴卟啉单胞菌(Porphyromonas macacae)。来自新泽西弗朗西斯菌U112(Francisella novicida U112)的Cpf1(FnCpf1,UniProt登录号:A0Q7Q2)是示例性的Cpf1蛋白质。
Cas蛋白质可以是野生型蛋白质(即,天然生成的那些),修饰的Cas蛋白质(即,Cas蛋白质变体)或者野生型或修饰的Cas蛋白质的片段。Cas蛋白质也可以是关于野生型或修饰的Cas蛋白质的催化活性的活性变体或片段。关于催化活性的活性变体或片段可包含与野生型或修饰的Cas蛋白质或其部分具有至少80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或更高的序列一致性,其中,活性变体保留了在期望的裂解位点进行切断的能力并且因此保留了切口诱导活性或双链断裂诱导活性。切口诱导活性或双链断裂诱导活性的分析方法是本领域已知的并且该分析方法通常测量在包含裂解位点的DNA底物上的Cas蛋白质的整体活性和特异性。
Cas蛋白质可被修饰为提高或降低核酸结合亲和性,核酸结合特异性和酶活性中的一种或多种。Cas蛋白质还可被修饰为改变蛋白质的任何其他活性或性质,例如稳定性。例如,Cas蛋白质的一个或多个核酸酶结构域可以被修饰、删除或灭活,或者Cas蛋白质可被截短以除去对蛋白质功能非必需的结构域或优化(例如,提高或降低)Cas蛋白质的活性或性质。
修饰的Cas蛋白质的一个实例是修饰的SpCas9-HF1蛋白质,其是产脓链球菌Cas9的高保真度变体,其带有设计为降低非特异性DNA接触的改变(N497A/R661A/Q695A/Q926A)。参见,例如,Kleinstiver等人,(2016)Nature 529(7587):490-495,其全部内容通过引用并入本文,用于所有目的。修饰的Cas蛋白质的另一实例是设计为降低脱靶效应的修饰的eSpCas9变体(K848A/K1003A/R1060A)。参见,例如,Slaymaker等人,(2016)Science351(6268):84-88,其全部内容通过引用并入本文,用于所有目的。其他SpCas9变体包括K855A和K810A/K1003A/R1060A。
Cas蛋白质可包括至少一个核酸酶结构域,例如,DNase结构域。例如,野生型Cpf1蛋白质通常包含裂解目标DNA的双链的类RuvC结构域,其可能处于二聚结构中。Cas蛋白质还可包含至少两个核酸酶结构域,例如,DNase结构域。例如,野生型Cas9蛋白质通常包含类RuvC核酸酶结构域和类HNH核酸酶结构域。RuvC和HNH结构域可分别切割双链DNA的不同链以在DNA中产生双链断裂。参见,例如,Jinek等人,(2012)Science 337:816-821,其全部内容通过引用并入本文,用于所有目的。
核酸酶结构域中的一个或多个可被删除或发生突变,这样它们不再是功能性的或具有降低的核酸酶活性。例如,如果Cas9蛋白质中的核酸酶结构域中的一个被删除或发生突变,得到的Cas9蛋白质可被称为切口酶并且可在双链DNA中的向导RNA靶向序列处产生单链断裂,但不会产生双链断裂(即,它可裂解互补链或非互补链,但不会裂解这两者)。将Cas9转化成切口酶的突变的实例是在来自化脓性链球菌的Cas9的RuvC结构域中的D10A(在Cas9的位置10将天冬氨酸盐突变为丙氨酸)突变。类似地,来自化脓性链球菌的Cas9的HNH结构域中的H939A(氨基酸位置839处组氨酸突变为丙氨酸),H840A(氨基酸位置840处组氨酸突变为丙氨酸)或N863A(氨基酸位置N863处天冬酰胺突变为丙氨酸)可将Cas9转化为切口酶。将Cas9转化为切口酶的突变的其他实例包括对来自嗜热链球菌(S.thermophilus)的Cas9进行的相应突变。参见,例如,Sapranauskas等人,(2011)Nucleic Acids Research39:9275-9282和WO 2013/141680,其中的每一个的全部内容通过引用并入本文,用于所有目的。这些突变可使用诸如位点定向突变形成,PCR介导的突变形成,或总基因合成之类的方法产生。产生切口酶的其他突变的实例可在例如WO 2013/176772和WO 2013/142578中找到,其中的每一个的全部内容通过引用并入本文,用于所有目的。
本领域还已知使金黄色葡萄球菌Cas9蛋白质的催化结构域中的突变失活的实例。例如,金黄色葡萄球菌Cas9酶(SaCas9)可包含位置N580的取代(例如,N580A取代)和位置D10的取代(例如,D10A取代),从而产生核酸酶惰性Cas蛋白质。参见,例如,WO 2016/106236,其全部内容通过引用并入本文,用于所有目的。
本领域还已知使Cpf1蛋白质的催化结构域中的突变失活的实例。对于来自新泽西弗朗西斯菌U112(Francisella novicida U112)的Cpf1(FnCpf1),来自氨基酸球菌属BV3L6(Acidaminococcus sp.BV3L6)的Cpf1(AsCpf1),来自毛螺菌科细菌ND2006(Lachnospiraceae bacterium ND2006)的Cpf1(LbCpf1)以及来自牛眼莫拉氏菌237(Moraxella bovoculi237)的Cpf1(MbCpf1 Cpf1)而言,这些突变可包括AsCpf1的位置908,993或1263处的突变或Cpf1直系同源物中的相应位置处的突变,或者LbCpf1的位置832,925,947或1180处的突变或Cpf1直系同源物中的相应位置处的突变。这些突变可包括例如,AsCpf1的突变D908A,E993A和D1263A中的一个或多个或者Cpf1直系同源物中的相应突变中的一个或多个,或LbCpf1的D832A,E925A,D947A和D1180A中的一个或多个或者Cpf1直系同源物中的相应突变中的一个或多个。参见,例如,US 2016/0208243,其全部内容通过引用并入本文,用于所有目的。
Cas蛋白质还可以可操作地连接至作为融合蛋白的异源多肽。例如,Cas蛋白质可融合至裂解结构域或表观遗传修饰结构域。参见,WO2014/089290,其全部内容通过引用并入本文,用于所有目的。Cas蛋白质还可融合至提供提高的或降低的稳定性的异源多肽。融合的结构域或异源多肽可位于N-末端,C-末端或Cas蛋白质内部。
作为一个实例,Cas蛋白质可融合至提供亚细胞定位的一个或多个异源多肽。这些异源多肽可包括例如:一个或多个核定位信号(NLS),例如,用于靶向细胞核的单组分SV40NLS和/或双组分α-内输蛋白NLS,用于靶向线粒体的线粒体定位信号,ER滞留信号,等等。参见,例如,Lange等人,(2007)J.Biol.Chem.282:5101-5105,其全部内容通过引用并入本文,用于所有目的。这些亚细胞定位信号可位于Cas蛋白质的N-端,C-端或任何其他地方。NLS可包含碱性氨基酸的延伸并且可以是单组分序列或双组分序列。任选地,Cas蛋白质可包含两个或多个NLS,包括N-末端的NLS(例如,α-内输蛋白NLS或单组分NLS)和C-末端NLS(例如,SV40 NLS或双组分NLS)。Cas蛋白质还可以包含位于N-末端的两个或多个NLS和/或位于C-末端的两个或多个NLS。
Cas蛋白质还可以可操作地连接至细胞渗透结构域或蛋白转导结构域。例如,所述细胞渗透结构域可衍生自HIV-1TAT蛋白质,来自人乙型肝炎病毒的TLM细胞渗透基序,MPG,Pep-1,VP22,来自单纯性疱疹病毒的细胞渗透肽或聚精氨酸肽序列。参见,例如,WO2014/089290和WO2013/176772,其每一个的全部内容通过引用并入本文,用于所有目的。所述细胞渗透结构域可位于Cas蛋白质的N-末端,C-末端或任何其他地方。
Cas蛋白质还可以可操作地连接至易于跟踪或纯化的异源多肽,例如,荧光蛋白,纯化标签或表位标签。荧光蛋白的实例包括绿色荧光蛋白(例如,GFP,GFP-2,tagGFP,turboGFP,eGFP,Emerald,Azami Green,Monomeric Azami Green,CopGFP,AceGFP,ZsGreenl),黄色荧光蛋白(例如,YFP,eYFP,Citrine,Venus,YPet,PhiYFP,ZsYellowl),蓝色荧光蛋白(例如,eBFP,eBFP2,Azurite,mKalamal,GFPuv,Sapphire,T-sapphire),青色荧光蛋白(例如,eCFP,Cerulean,CyPet,AmCyanl,Midoriishi-Cyan),红色荧光蛋白(例如,mKate,mKate2,mPlum,DsRed monomer,mCherry,mRFP1,DsRed-Express,DsRed2,DsRed-Monomer,HcRed-Tandem,HcRedl,AsRed2,eqFP611,mRaspberry,mStrawberry,Jred),橙色荧光蛋白(例如,mOrange,mKO,Kusabira-Orange,Monomeric Kusabira-Orange,mTangerine,tdTomato)和任何其他合适的荧光蛋白。标签的实例包括谷胱甘肽-S-转移酶(GST),甲壳素结合蛋白(CBP),麦芽糖结合蛋白,硫氧还蛋白(TRX),聚(NANP),串联亲和纯化(TAP)标签,myc,AcV5,AU1,AU5,E,ECS,E2,FLAG,血球凝集素(HA),nus,Softag 1,Softag3,Strep,SBP,Glu-Glu,HSV,KT3,S,S1,T7,V5,VSV-G,组氨酸(His),生物素羟基载体蛋白(BCCP)和钙调蛋白。
编码Cas蛋白质的核酸可以是被优化为在特定细胞或生物体中有效翻译为蛋白质的密码子。例如,编码Cas蛋白质的核酸可被修饰为取代在人细胞、非人类细胞、哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞或任何其他目标宿主细胞中相对于天然生成的多核苷酸序列具有更高的使用频率的密码子。
(3)向导RNA
“向导RNA”或“gRNA”是结合至Cas蛋白质(例如,Cas9蛋白质)并使该Cas蛋白质靶向目标DNA中的特定位置的RNA分子。向导RNA可包含两个片段:“DNA靶向片段”和“蛋白质结合片段”。“片段”包括诸如RNA中的核苷酸的连续延伸片段之类的分子的某个部分或区域。诸如Cas9的gRNA之类的一些gRNA可包含两个不同的RNA分子:“活化RNA”(例如,tracrRNA)和“靶向RNA”(例如CRISPR RNA或crRNA)。其他gRNA是单个RNA分子(单个RNA多核苷酸),其还可称为“单分子gRNA”,“单个向导RNA”或“sgRNA”。参见,例如,WO 2013/176772,WO 2014/065596,WO 2014/089290,WO 2014/093622,WO 2014/099750,WO 2013/142578,和WO 2014/131833,其中的每一个的全部内容通过引用并入本文,用于所有目的。对于Cas9而言,例如,单个向导RNA可包含(例如通过连接体)融合至tracrRNA的crRNA。对于Cpf1而言,例如,只需要crRNA就可实现与目标序列的结合和/或裂解目标序列。术语“向导RNA”和“gRNA”包括双分子(即,模块化)gRNA和单分子gRNA。
示例性的双分子gRNA包含类crRNA(“CRISPR RNA”或“靶向RNA”或“crRNA”或“crRNA重复序列”)分子和对应的类tracrRNA(“反式激活CRISPR RNA”,或“活化RNA”或“tracrRNA”)分子。crRNA包含gRNA的DNA靶向片段(单链)和形成gRNA的蛋白质结合片段的dsRNA双倍体的一半的核苷酸延伸序列(即,crRNA尾部)。位于DNA靶向片段的下游(3’)的crRNA尾部的实例包含GUUUUAGAGCUAUGCU(SEQ ID NO:25),基本由GUUUUAGAGCUAUGCU(SEQID NO:25)构成或由GUUUUAGAGCUAUGCU(SEQ ID NO:25)构成。本文公开的DNA靶向片段中的任一个可连接至SEQ ID NO:25的5’端以形成crRNA。
对应的tracrRNA(活化RNA)包含形成gRNA的蛋白质结合片段的dsRNA双倍体的另一半的核苷酸延伸序列。crRNA的核苷酸延伸序列与tracrRNA的核苷酸延伸序列互补并杂交以形成gRNA的蛋白质结合结构域的dsRNA双倍体。这样,每个crRNA可被认为具有对应的tracrRNA。tracrRNA序列的实例包含AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUU(SEQ ID NO:26),基本由AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUU(SEQ ID NO:26)构成或由AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUU(SEQ ID NO:26)构成。
在既需要crRNA又需要tracrRNA的系统中,crRNA和对应的tracrRNA杂交形成gRNA。在仅需要crRNA的系统中,crRNA可以是gRNA。crRNA还提供通过杂交至相对链(即,互补链)而靶向向导RNA靶向序列的单链DNA靶向片段。如果用于在细胞内进行修饰,给定的crRNA或tracrRNA分子的提取序列可被设计为对使用了RNA分子的物种具有特异性。参见,例如,Mali等人,(2013)Science 339:823-826;Jinek等人,(2012)Science337:816-821;Hwang等人,(2013)Nat.Biotechnol.31:227-229;Jiang等人,(2013)Nat.Biotechnol.31:233-239;以及Cong等人,(2013)Science 339:819-823,上述参考文献中的每一个的全部内容通过引用并入本文,用于所有目的。
给定的gRNA的DNA-靶向片段(crRNA)包含与目标DNA中的序列(即,向导RNA靶向序列的相对链上的向导RNA识别序列的互补链)互补的核苷酸序列。gRNA的DNA靶向片段以序列特异性的方式通过杂交(即,碱基配对)与目标DNA发生相互作用。这样,DNA-靶向片段的核苷酸序列可发生改变并且决定了目标DNA中的gRNA和目标DNA发生相互作用的位置。目标gRNA的DNA-靶向片段可被修饰为与目标DNA内的任何期望的序列进行杂交。天然生成的crRNA基于CRISPR/Cas系统和生物体而不同,但是通常包含长度为21个核苷酸至72个核苷酸的靶向片段,其侧面具有长度为21个核苷酸至46个核苷酸的两个正向重复序列(DR)(参见,例如,WO 2014/131833,其全部内容通过引用并入本文,用于所有目的)。在化脓性链球菌的情况下,DR的长度为36个核苷酸并且靶向片段的长度为30个核苷酸。位于3’的DR与对应的tracrRNA互补并且与对应的tracrRNA杂交,其进而结合至Cas蛋白质。
DNA-靶向片段的长度可以为至少约12个核苷酸,至少约15个核苷酸,至少约17个核苷酸,至少约18个核苷酸,至少约19个核苷酸,至少约20个核苷酸,至少约25个核苷酸,至少约30个核苷酸,至少约35个核苷酸,至少约40个核苷酸。这样的DNA-靶向片段的长度可以为约12个核苷酸至约100个核苷酸,约12个核苷酸至约80个核苷酸,约12个核苷酸至约50个核苷酸,约12个核苷酸至约40个核苷酸,约12个核苷酸至约30个核苷酸,约12个核苷酸至约25个核苷酸,或约12个核苷酸至约20个核苷酸。例如,DNA靶向片段可以为约15个核苷酸至约25个核苷酸(例如,约17个核苷酸至约20个核苷酸或约17个核苷酸,约18个核苷酸,约19个核苷酸或约20个核苷酸)。参见,例如,US 2016/0024523,其全部内容通过引用并入本文,用于所有目的。对于来自化脓性链球菌的Cas9而言,典型的DNA-靶向片段的长度为16个核苷酸至20个核苷酸或17个核苷酸至20个核苷酸。对于来自金黄色葡萄球菌的Cas9而言,典型的DNA-靶向片段的长度为21个核苷酸至23个核苷酸。对于Cpf1而言,典型的DNA-靶向片段的长度为至少16个核苷酸或至少18个核苷酸。
TracrRNA可以是任何形式(例如,全长tracrRNA或部分活性tracrRNA)并且具有不同的长度。它们可包括初级转录体或加工过的形式。例如,tracrRNA(作为单个向导RNA的一部分或作为双分子gRNA的一部分作为单个的分子)可包含全部或部分野生型tracrRNA序列(例如,约为或多于约20,26,32,45,48,54,63,67,85个野生型tracrRNA的核苷酸或者更多),基本由全部或部分野生型tracrRNA序列(例如,约为或多于约20,26,32,45,48,54,63,67,85个野生型tracrRNA的核苷酸或者更多)构成或由全部或部分野生型tracrRNA序列(例如,约为或多于约20,26,32,45,48,54,63,67,85个野生型tracrRNA的核苷酸或者更多)构成。来自化脓性链球菌的野生型tracrRNA序列的实例包括171个核苷酸,89个核苷酸,75个核苷酸和65个核苷酸的版本。参见,例如,Deltcheva等人,(2011)Nature471:602-607;WO2014/093661,其每一个的全部内容通过引用并入本文,用于所有目的。单个向导RNA(sgRNA)中的tracrRNA的实例包括在sgRNA的+48,+54,+67和+85版本中发现的tracrRNA片段,其中,“+n”表示多达野生型tracrRNA的+n个核苷酸被包括在sgRNA中。参见,US 8,697,359,其全部内容通过引用并入本文,用于所有目的。
DNA靶向序列和目标DNA中的向导RNA识别序列的互补链之间的互补百分比可为至少60%(例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少97%,至少98%,至少99%,或100%)。DNA靶向序列和目标DNA中的向导RNA识别序列的互补链之间的互补百分比可为至少60%,超过约20个连续核苷酸互补。作为实例,DNA靶向序列和目标DNA中的向导RNA识别序列的互补链之间的互补百分比为100%,目标DNA的互补链中的向导RNA识别序列的互补链的5’端具有14个连续核苷酸互补并且其余部分的互补百分比为0%这么低。在这种情况下,DNA-靶向序列被认为长度为14个核苷酸。作为另一实例,DNA-靶向序列和目标DNA中的向导RNA识别序列的互补链之间的互补百分比为100%,目标DNA的互补链中的向导RNA识别序列的互补链的5’端具有7个连续核苷酸互补并且其余部分的互补百分比为0%这么低。在这种情况下,DNA靶向序列被认为长度为7个核苷酸。在一些向导RNA中,DNA靶向序列中的至少17个核苷酸与目标DNA互补。例如,DNA靶向序列的长度可以为20个核苷酸并且可包含与向导RNA识别序列的互补链的1个,2个或3个错配。任选地,所述错配不与前间区序列邻近基序(PAM)序列相邻(例如,错配位于DNA靶向序列的5’端或者错配远离PAM序列至少2个碱基对,至少3个碱基对,至少4个碱基对,至少5个碱基对,至少6个碱基对,至少7个碱基对,至少8个碱基对,至少9个碱基对,至少10个碱基对,至少11个碱基对,至少12个碱基对,至少13个碱基对,至少14个碱基对,至少15个碱基对,至少16个碱基对,至少17个碱基对,至少18个碱基对,或至少19个碱基对)。
gRNA的蛋白结合片段可包含彼此互补的核苷酸的两个延伸片段。蛋白结合片段的互补核苷酸进行杂交形成双链RNA双倍体(dsRNA)。目标gRNA的蛋白结合片段与Cas蛋白质发生相互作用并且gRNA通过DNA-靶向片段将结合的Cas蛋白质定向至目标DNA中的特定核苷酸序列。
单个向导RNA具有DNA靶向片段和骨架序列(即,向导RNA的蛋白结合序列或Cas结合序列)。例如,这种向导RNA具有5’DNA靶向片段和3’骨架序列。示例性的骨架序列包括如下序列,基本由如下序列构成或由如下序列构成:
GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCU(版本1;SEQ ID NO:27);GUUGGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(版本2;SEQ ID NO:6);
GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(版本3;SEQ ID NO:7);以及
GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(版本4;SEQ ID NO:8)。靶向任何向导RNA靶向序列的向导RNA可包括例如:位于融合至向导RNA的3’端上的示例性的向导RNA骨架序列中的任一个的向导RNA的5’端上的DNA靶向片段。也就是说,本文公开的DNA靶向片段中的任一个可连接至SEQ IDNO:27,6,7或8中的任一个的5’端以形成单个向导RNA(嵌合向导RNA)。本文其他地方公开的向导RNA版本1,2,3和4涉及分别与骨架版本1,2,3和4连接的DNA靶向片段。
向导RNA可包括提供额外的期望特性(例如,修饰的或调节的稳定性,亚细胞定位,荧光标签跟踪,蛋白质或蛋白质复合物的结合位点,等等)的修饰或序列。这些修饰的实例包括例如:5’帽(例如,7-甲基鸟苷酸帽(m7G));3’聚腺苷酸化尾(即,3’poly(A)尾);核糖开关序列(例如,允许由蛋白质和/或蛋白质复合物调节稳定性和/或调节可及性);稳定性控制序列,形成dsRNA双倍体的序列(即,发夹),将RNA定向至亚细胞位置(例如,细胞核,线粒体,叶绿体,等等)的修饰或序列;提供跟踪的修饰或序列(例如,直接偶联至荧光分子、偶联至有利于荧光检测的基团、允许进行荧光检测的序列,等等);为蛋白质提供结合位点的修饰或序列(例如,作用于DNA上的蛋白质,包括DNA甲基转移酶,DNA脱甲基酶,组蛋白乙酰转移酶,组蛋白脱乙酰酶,等等),以及它们的组合。修饰的其他实例包括工程化的茎环双倍体结构,工程化的凸出区域,茎环双倍体结构的工程化的发夹3’,或其任何组合。参见例如,US2015/0376586,其全部内容通过引用并入本文,用于所有目的。凸出部分可以是由类crRNA区域和最小的类tracrRNA区域构成的双倍体内的核苷酸的未配对区域。在双倍体的一侧,凸出部分可包括未配对的5’-XXY-3’,其中,X是任何嘌呤并且Y可以是可与相对链上的核苷酸形成摇摆碱基对的核苷酸,在双倍体的另一侧,凸出部分可包含未配对的核苷酸区域。
未修饰的核酸可易于发生降解。外源核酸还可诱导固有免疫反应。修饰可有助于引入稳定性并且降低免疫原性。向导RNA可包括修饰的核苷和修饰的核苷酸,包括例如下列中的一种或多种:(1)改变或取代磷酸二酯骨架连接中的未连接的磷酸盐氧中的一个或两个和/或连接的磷酸盐氧中的一个或多个;(2)改变或取代核糖中的成分,例如,改变或取代核糖上的2’羟基;(3)由脱磷酸连接体取代磷酸基团;(4)修饰或取代天然生成的碱基;(5)取代或修饰核糖-磷酸酯骨架;(6)修饰寡核苷酸的3’端或5’端(例如,除去,修饰或取代末端磷酸酯基团或基团的结合);以及(7)修饰糖类。其他可能的向导RNA修饰包括修饰或取代尿嘧啶或聚-尿嘧啶束(poly-uracil tract)。参见,例如,WO 2015/048577和US2016/0237455,其每一个的全部内容通过引用并入本文,用于所有目的。类似的修饰可作用于Cas编码核酸,例如,Cas mRNA。
作为一个实例,向导RNA的5’或3’端的核苷酸可包括硫代磷酸键(例如,碱基可具有作为硫代磷酸基团的修饰的磷酸酯基团)。例如,向导RNA可包括位于向导RNA的5’端或3’端的2个,3个或4个末端核苷酸之间的硫代磷酸键。作为另一实例,位于向导RNA的5’端和/或3’端的核苷酸可具有2’-O-甲基修饰。例如,向导RNA可包括位于向导RNA的5’端和/或3’端(例如,5’端)的2个,3个或4个末端核苷酸的2’-O-甲基修饰。参见,例如,WO 2017/173054A1和Finn等人,(2018)Cell Reports 22:1-9,其每一个的全部内容通过引用并入本文,用于所有目的。在一个特定的实例中,向导RNA包括位于前三个5’和3’末端RNA残基处的2’-O甲基类似物和3’-硫代磷酸核苷酸间键合。在另一特定实例中,向导RNA被修饰为由2’-O-甲基类似物取代不与Cas9蛋白质发生相互作用的所有2’OH基团,并且,与Cas9具有最小相互作用的向导RNA的尾部区域被5’和3’硫代磷酸核苷酸间键修饰。参见,例如,Yin等人,(2017)Nat.Biotech.35(12):1179-1187,其全部内容通过引用并入本文,用于所有目的。
本文提供任何形式的向导RNA。例如,以RNA的形式提供gRNA,作为两个分子(不同的crRNA和tracrRNA)或作为一个分子(sgRNA),并且任选地,提供与Cas蛋白质的复合物形式的RNA。gRNA还可以以编码gRNA的DNA的形式提供。编码gRNA的DNA可编码单个RNA分子(sgRNA)或不同的RNA分子(例如,不同的crRNA和tracrRNA)。在后一种情况下,编码gRNA的DNA可作为DNA分子或作为分别编码crRNA和tracrRNA的不同的DNA分子提供。
当以DNA的形式提供gRNA时,gRNA可在细胞中瞬时表达,条件性表达或组成性表达。编码gRNA的DNA可稳定地整合至细胞的基因组中并且可操作地连接至在细胞中具有活性的启动子。可选地,编码gRNA的DNA可以可操作地连接至表达构建体中的启动子。例如,编码gRNA的DNA可位于包含异源核酸的载体中,例如,编码Cas蛋白质的核酸。可选地,编码gRNA的DNA可以位于载体中或质粒中,所述载体或质粒从包含编码Cas蛋白质的核酸的载体中分离出来。可用于这种表达构建体的启动子包括例如在下列细胞中的一种或多种中具有活性的启动子:真核细胞、人细胞、非人类细胞、哺乳动物细胞、非人类哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞、仓鼠细胞、兔细胞、多能细胞、胚胎干(ES)细胞、成体干细胞、发育受限的祖细胞、诱导多能干(iPS)细胞或单细胞期胚胎。这些启动子可以是例如,条件性启动子,可诱导启动子,组成性启动子或组织特异性启动子。这些启动子还可以是例如,双向启动子。合适的启动子的特定实例包括RNA聚合酶III启动子,例如,人U6启动子,大鼠U6聚合酶III启动子或小鼠U6聚合酶III启动子。
可选地,gRNA可通过各种不同的其他方法制备。例如,gRNA可使用例如T7 RNA聚合酶通过体外转录进行制备(参见,例如,WO2014/089290和WO 2014/065596,其每一个的全部内容通过引用并入本文,用于所有目的)。向导RNA还可以是通过化学合成制备的通过合成方法产生的分子。
(4)向导RNA识别序列和向导RNA靶向序列
术语“向导RNA识别序列”包括存在于如下目标DNA中的核酸序列,只要存在足够的结合条件所述目标DNA将会结合gRNA的DNA靶向片段。本文使用的术语向导RNA识别序列包含目标双链DNA的两个链(即,与向导RNA杂交的互补链上的序列以及与前间区序列邻近基序(PAM)邻近的非互补链上的对应序列)。本文使用的术语“向导RNA靶向序列”具体地是指与PAM邻近的非互补链上的序列(即,PAM的上游或5’)。也就是说,向导RNA靶向序列是指与在互补链上与向导RNA杂交的序列对应的非互补链上的序列。向导RNA靶向序列等同于向导RNA的DNA靶向片段,但是由胸腺嘧啶替代了尿嘧啶。作为一个实例,Cas9酶的向导RNA靶向序列是指在与5’-NGG-3’PAM邻近的非互补链上的序列。向导RNA识别序列包括设计为与向导RNA具有互补性的序列,其中,向导RNA识别序列的互补链和向导RNA的DNA靶向序列之间的杂交促进CRISPR复合物的形成。只要具有足以导致杂交并促进CRISPR复合物的形成的互补性,就不必要求具有完全互补。向导RNA识别序列或向导RNA靶向序列还包括Cas蛋白质的裂解位点,其在下文中详细描述。向导RNA识别序列或向导RNA靶向序列可包含任何多核苷酸,其可位于例如细胞的细胞核内或细胞质内或位于细胞的细胞器(例如线粒体或叶绿体)内。
目标DNA内的向导RNA识别序列可被Cas蛋白质或gRNA靶定(即,与Cas蛋白质或gRNA结合,或与Cas蛋白质或gRNA杂交或与Cas蛋白质或gRNA互补)。合适的DNA/RNA结合条件包括通常存在于细胞中的生理条件。本领域已知其他合适的DNA/RNA结合条件(例如,无细胞系统中的条件)(参见,例如,Molecular Cloning:A Laboratory Manual,3rd Ed.(Sambrook等人,Harbor Laboratory Press 2001),其全部内容通过引用并入本文,用于所有目的)。与Cas蛋白或gRNA互补并杂交的目标DNA的链可被称为“互补链”,并且与“互补链”互补的目标DNA的链(因此,其不与Cas蛋白质或gRNA互补)可被称为“非互补链”或“模板链”。
Cas蛋白质可在待与gRNA的DNA靶向片段结合的目标DNA中存在的核酸序列的内部或外部的位点处裂解核酸。“裂解位点”包括Cas蛋白质产生单链断裂或双链断裂的核酸位置。例如,CRISPR复合物(包含与向导RNA识别序列的互补链杂交并与Cas蛋白复合的gRNA)的形成可导致在待与gRNA的DNA靶向片段结合的目标DNA中存在的核酸序列中或附近(例如,距离所述核酸序列的1个,2个,3个,4个,5个,6个,7个,8个,9个,10个,20个,50个或更多个碱基对内)发生一个链的断裂或两个链的断裂。如果裂解位点位于待与gRNA的DNA靶向片段结合的核酸序列外部,那么,裂解位点仍被认为位于“向导RNA识别序列”内或“向导RNA靶向序列”内。裂解位点可仅位于核酸的一个链上或位于核酸的两个链上。裂解位点可位于核酸的两个链上的相同位置(产生平端)或位于每个链上的不同位点(产生交错端(即,悬挂))。例如,可通过使用两个Cas蛋白质产生交错端,每个Cas蛋白质在不同链上的不同裂解位点产生单个链断裂,从而产生双链断裂。例如,第一切口酶可在双链DNA(dsDNA)的第一链上产生单链断裂并且第二切口酶可在dsDNA的第二链上产生单链断裂,这就产生了悬挂序列。在一些情况下,第一链上的切口酶的向导RNA识别序列或向导RNA靶向序列与第二链上的切口酶的向导RNA识别序列或向导RNA靶向序列分隔开至少2个碱基对,至少3个碱基对,至少4个碱基对,至少5个碱基对,至少6个碱基对,至少7个碱基对,至少8个碱基对,至少9个碱基对,至少10个碱基对,至少15个碱基对,至少20个碱基对,至少25个碱基对,至少30个碱基对,至少40个碱基对,至少50个碱基对,至少75个碱基对,至少100个碱基对,至少250个碱基对,至少500个碱基对,或至少1,000个碱基对。
Cas蛋白质对目标DNA的位点特异性结合和/或裂解可发生在不同的位置,这由(i)gRNA和目标DNA之间的碱基对互补性和(ii)目标DNA中的被称为前间区序列邻近基序(PAM)的短基序确定。PAM可位于与向导RNA杂交的链相对的非互补链上的向导RNA靶向序列的侧面。任选地,向导RNA靶向序列的侧面可具有PAM的3’端。可选地,向导RNA靶向序列的侧面可具有PAM的5’端。例如,Cas蛋白质的裂解位点可位于PAM序列的上游或下游约1个碱基对至约10个碱基对或约2个碱基对至约5碱基对(例如,3个碱基对)的位置。在一些情况下(例如,当使用来自化脓性链球菌的Cas9或使用紧密相关的Cas9时),非互补链的PAM序列可以是5’-N1GG-3’,其中N1是任何DNA核苷酸并且就是目标DNA的非互补链的向导RNA识别序列的3’(即,就是向导RNA靶向序列的3’)。这样,互补链的PAM序列可以是5’-CCN2-3’,其中,N2是任何DNA核苷酸并且就是目标DNA的互补链的向导RNA识别序列的5’。在一些这样的情况下,N1和N2可以是互补的并且N1-N2碱基对可以是任何碱基对(例如,N1=C并且N2=G,N1=G并且N2=C;N1=A并且N2=T;或N1=T,并且N2=A)。在Cas9来自金黄色葡萄糖球菌的情况下,PAM可以是NNGRRT或NNGRR,其中,N可以是A,G,C,或T,并且R可以是G或A。在Cas9来自空肠弯曲菌的情况下,PAM可以是例如NNNNACAC或NNNNRYAC,其中,N可以是A,G,C,或T,并且R可以是G或A。在一些情况(例如,对于FnCpf1而言)下,PAM序列可以是5’端的上游并且具有序列5’-TTN-3’。
除了PAM序列之外,下文还提供向导RNA靶向序列的实例。例如,向导RNA靶向序列可以是就在由Cas9蛋白质识别的NGG基序之前的20个核苷酸的DNA序列。这些向导RNA靶向序列连同PAM序列的实例是GN19NGG(SEQ ID NO:9)或N20NGG(SEQ ID NO:10)。参见,例如,WO2014/165825,其全部内容通过引用并入本文,用于所有目的。5’端的鸟嘌呤可通过RNA聚合酶促进细胞内的转录。向导RNA靶向序列连同PAM序列的其他实例可包括5’端的两个鸟嘌呤核苷酸(例如,GGN20NGG,SEQ ID NO:11)以通过T7聚合酶促进体外有效转录。参见,例如,WO2014/065596,其全部内容通过引用并入本文,用于所有目的。其他向导RNA靶向序列连同PAM序列的长度可为SEQ ID NO:9-11的4个核苷酸至22个核苷酸,其包括5’G或GG以及3’GG或NGG。其他向导RNA靶向序列的长度为SEQ ID NO:9-11的14个核苷酸至20个核苷酸。
向导RNA识别序列或向导RNA靶向序列可以是细胞内源的或外源性的任何核酸序列。向导RNA识别序列或向导RNA靶向序列可以是编码基因产物(例如蛋白质)的序列或非编码序列(例如,调节性序列)或可包括这两者。
B.包含Cas表达盒的细胞和非人类动物
本文还提供包含本文所述的Cas表达盒的细胞和非人类动物。所述Cas表达盒可稳定地整合至细胞或非人类动物的基因组(即,整合至染色体)或者其可位于染色体的外部(例如,染色体外复制DNA)。任选地,Cas表达盒稳定地整合至基因组。稳定整合的Cas表达盒可以随机地整合至非人类动物的基因组(即,转基因的),或其可整合至非人类动物的基因组的预定区域(即,敲入)。任选地,Cas表达盒稳定地整合至基因组的预定区域,例如安全港基因座。稳定整合有Cas表达盒的目标基因组基因座对于Cas表达盒而言可以是杂合的,或者对于Cas表达盒而言可以是纯合的。双倍体生物体在每个基因组基因座处具有两个等位基因。每对等位基因代表特定基因组基因座的基因分型。如果在特定基因座处具有两个等同的等位基因,那么基因分型被描述为纯合的,如果在特定基因座处的两个等位基因是不同的,那么基因分型被描述为杂合的。
本文提供的细胞可以是例如,真核细胞,其包括例如:真菌细胞(例如,酵母),植物细胞,动物细胞,哺乳动物细胞,非人类哺乳动物细胞和人类细胞。术语“动物”包括哺乳动物,鱼类和鸟类。哺乳动物细胞可以是例如:非人类哺乳动物细胞,人类细胞,啮齿动物细胞,大鼠细胞,小鼠细胞或仓鼠细胞。其他非人类哺乳动物包括例如:非人类灵长动物,猴子,猿猴,猫,狗,兔,马,公牛,鹿,野牛,家畜(例如,牛科动物,例如,奶牛,阉牛等等;绵羊属动物,例如,绵羊,山羊等等,以及猪科动物,例如,猪和野猪)。鸟类包括例如:鸡,火鸡,鸵鸟,鹅,鸭子等等。本文还包括家养动物和农业动物。术语“非人类”排除了人类。
细胞还可以是任何类型的未分化的状态或分化的状态。例如,细胞可以是全能细胞,多能细胞(例如,人多能细胞或非人类多能细胞,例如,小鼠胚胎干(ES)细胞或大鼠ES细胞)或者非多能细胞。全能细胞包括可产生任何细胞类型的未分化的细胞,并且多能细胞包括具有发育成多于一种分化的细胞类型的能力的未分化的细胞。这些多能和/或全能细胞可以是例如,ES细胞或类ES细胞,例如,诱导多能性干(iPS)细胞。ES细胞包括胚胎衍生的全能细胞或多能细胞,其能够有助于在引入胚胎中之后使胚胎发育成任何组织。ES细胞可衍生自囊胚的内部细胞团并且能够分化成三种脊椎动物胚层(内胚层,外胚层和中胚层)中的任一胚层的细胞。
人多能细胞的实例包括人ES细胞,人成体干细胞,发育限制的人祖细胞,以及人诱导多能性干(iPS)细胞(例如,始发态人iPS细胞和原始人iPS细胞)。诱导多能干细胞包括从分化的成体细胞直接衍生得到的多能干细胞。人iPS细胞可通过向细胞中引入特定的重编程因子组而生成,所述重编程因子组可包括例如,Oct3/4,Sox家族转录因子(例如,Sox1,Sox2,Sox3,Sox15),Myc家族转录因子(例如,c-Myc,1-Myc,n-Myc),Krüppel-样家族(KLF)转录因子(例如,KLF1,KLF2,KLF4,KLF5),和/或相关转录因子,例如,NANOG,LIN28,和/或Glis1。人iPS细胞还可例如通过使用miRNA,模拟转录因子的作用的小分子或细胞谱系特异性分子(lineage specifier))而生成。人iPS细胞通过其分化成三种脊椎动物胚层(例如,内胚层,外胚层或中胚层)中的任何细胞的能力来表征。人iPS细胞还可通过其在合适的体外培养条件下无限繁殖的能力来表征。参见,例如,Takahashi and Yamanaka(2006)Cell126:663-676,该参考文献的全部内容通过引用并入本文,用于所有目的。始发态人ES细胞和始发态人iPS细胞包括表达与植入后的外胚层细胞的特性类似的特性并且进行细胞谱系特异性化和分化的细胞。原始人ES细胞和原始人iPS细胞包括表达与植入前的胚胎的内部细胞团的ES细胞的特性类似的特性并且不进行细胞谱系特异性化的细胞。参见,例如,Nichols and Smith(2009)Cell Stem Cell 4:487-492,该参考文献的全部内容通过引用并入本文,用于所有目的。
本文提供的细胞还可以是生殖细胞(例如,精子或卵细胞)。所述细胞可以是有丝分裂感受态细胞或有丝分裂惰性细胞,减数分裂感受态细胞或减数分裂惰性细胞。类似地,细胞还可以是初级体细胞或非初级体细胞的细胞。体细胞包括不是配子,生殖细胞,配子母细胞或未分化的干细胞的任何细胞。例如,细胞可以是肝细胞,肾脏细胞,造血细胞,内皮细胞,上皮细胞,成纤维细胞,间充质细胞,角化细胞,血细胞,黑素细胞,单核细胞,单核细胞,单核细胞前体,B细胞,红细胞-巨核细胞,嗜酸性粒细胞,巨噬细胞,T细胞,胰岛β细胞,外分泌细胞,胰腺祖细胞,内分泌祖细胞,脂肪细胞,前脂肪细胞,神经细胞,胶质细胞,神经干细胞,神经细胞,成肝细胞(hepatoblasts),肝细胞,心肌细胞,骨骼肌成肌细胞,平滑肌细胞,导管细胞,腺泡细胞,α细胞,β细胞,δ细胞,PP细胞,胆管上皮细胞,白色或棕色脂肪细胞,或视细胞(例如,小梁网细胞,视网膜色素上皮细胞,视网膜微血管内皮细胞,视网膜周细胞,结膜上皮细胞,结膜成纤维细胞,虹膜色素上皮细胞,角膜细胞,晶状体上皮细胞,非色素纤毛上皮细胞,眼脉络成纤维细胞,感光细胞,神经节细胞,双极细胞,水平细胞或无长突细胞)。
本文提供的合适的细胞还包括初级细胞。初级细胞包括直接从生物体,器官或组织中分离出来的细胞或细胞培养物。初级细胞包括既未转化的也非永生的细胞。它们包括自生物体,器官或组织获得的任何细胞,所述细胞先前没有在组织培养中进行传代或先前已经在组织培养中进行了传代但是无法在组织培养中进行无限传代。这些细胞可通过常规技术进行分离并且包括例如:体细胞,造血细胞,内皮细胞,上皮细胞,成纤维细胞,间充质细胞,角化细胞,黑素细胞,单核细胞,单核细胞,脂肪细胞,前脂肪细胞,神经细胞,胶质细胞,成肝细胞,骨骼肌成肌细胞,和平滑肌细胞。例如,初级细胞可衍生自结缔组织,肌肉组织,神经系统组织或上皮组织。
本文提供的其他合适的细胞包括非永生的细胞。非永生的细胞包括来自多细胞生物体的细胞,所述多细胞生物体通常不会无限繁殖但是由于突变或发生改变其逃避了正常的细胞老化而能够继续进行分化。所述突变或改变可以自然发生或有意诱导。非永生的细胞的实例包括中国仓鼠卵巢(CHO)细胞,人胚胎肾脏细胞(例如,HEK293细胞或293T细胞),以及小鼠胚胎成纤维细胞(例如,3T3细胞)。本领域熟知多种类型的非永生细胞。非永生细胞或初级细胞包括通常用于培养或表达重组基因或蛋白质的细胞。
本文提供的细胞还包括单细胞期胚胎(即,已受精的卵细胞或受精卵)。这种单细胞期胚胎可来自于任何遗传背景(例如,小鼠BALB/c,小鼠C57BL/6,小鼠129,或它们的组合),可以是新鲜的或冷冻的并且可源自于自然繁殖或体外受精。
本文提供的细胞可以是正常的健康细胞或可以是患病的或带有突变的细胞。
包含本文描述的Cas表达盒的非人类动物可由本文其他地方描述的方法产生。术语“动物”包括哺乳动物,鱼类和鸟类。哺乳动物包括例如:人类,非人类灵长类动物,猴子,猿猴,猫,狗,马,公牛,鹿,野牛,绵羊,兔,啮齿动物(例如,小鼠,大鼠,仓鼠以及豚鼠)以及家畜(例如,牛科动物,例如,奶牛和阉牛,绵羊科动物,例如,绵羊和山羊,以及猪科动物,例如,猪和野猪)。鸟类包括例如:鸡,火鸡,鸵鸟,鹅以及鸭子。本文还包括家养动物和农业动物。术语“非人类动物”排除了人类。优选的非人类动物包括例如:啮齿动物,例如,小鼠和大鼠。
非人类动物可来自于任何遗传背景。例如,合适的小鼠可来自于129种系,C57BL/6种系,129种系和C57BL/6种系的混合,BALB/c种系,或Swiss Webster种系。129种系的实例包括129P1,129P2,129P3,129X1,129S1(例如,129S1/SV,129S1/Svlm),129S2,129S4,129S5,129S9/SvEvH,129S6(129/SvEvTac),129S7,129S8,129T1,和129T2。参见,例如,Festing等人,(1999)Mammalian Genome 10(8):836,其全部内容通过引用并入本文,用于所有目的。C57BL种系的实例包括C57BL/A,C57BL/An,C57BL/GrFa,C57BL/Kal_wN,C57BL/6,C57BL/6J,C57BL/6ByJ,C57BL/6NJ,C57BL/10,C57BL/10ScSn,C57BL/10Cr,和C57BL/Ola。合适的小鼠还可来自于前述129种系和前述C57BL/6种系的混合(例如,50%129和50%C57BL/6)。类似地,合适的小鼠可来自于前述129种系的混合或前述BL/6种系的混合(例如,129S6(129/SvEvTac)种系)。
类似地,大鼠可来自于任何大鼠种系,包括例如,ACI大鼠种系,Dark Agouti(DA)大鼠种系,Wistar大鼠种系,LEA大鼠种系,Sprague Dawley(SD)大鼠种系或Fischer大鼠种系(例如,Fisher F344或Fisher F6)。大鼠还可获自于衍生自上述两种或多种种系的混合的种系。例如,合适的大鼠可获自DA种系或ACI种系。ACI大鼠种系被表征为具有黑色刺豚鼠,其具有白色腹部和足部以及RT1av1单体型。这些种系可获自包括Harlan实验室在内的多种不同的来源。Dark Agouti(DA)大鼠种系被表征为具有刺豚鼠外表和RT1av1单体型。这些大鼠获自包括Charles River和Harlan实验室在内的多种不同的来源。在一些情况下,合适的大鼠可来自同系交配大鼠种系。参见例如,US2014/0235933,其全部内容通过引用并入本文,用于所有目的。
C.目标基因组基因座
本文描述的Cas表达盒可基因组整合至细胞或非人类动物中的目标基因组基因座处。可使用任何能够表达基因的目标基因组基因座。
其中可稳定地整合有Cas表达盒的目标基因组基因座的实例是非人类动物的基因组中的安全港基因座。整合的外源DNA和宿主基因组之间的相互作用可限制整合的可靠性和安全性并且可产生明显的表型作用,该表型作用不是由于靶定的基因修饰而产生的,但是其由于在周围的内源基因上产生的无意的整合作用而产生。例如,随机插入的转基因可经历位置效应和沉默,使得其表达不可靠并且不可预测。同样,将外源DNA整合至染色体基因座可影响周围内源基因和染色质,从而改变细胞行为和表型。安全港基因座包括染色体基因座,其中,转基因或其他外源核酸插入体可在所有目标组织中稳定且可靠地表达,不会明显地改变细胞行为或表型(即,不会对宿主细胞产生任何有害作用)。参见,例如,Sadelain等人,(2012)Nat.Rev.Cancer 12:51-58,其全部内容通过引用并入本文,用于所有目的。任选地,安全港基因座是插入的基因序列的表达不被任何来自邻近基因的通读表达扰动的基因座。例如,安全港基因座可包括如下染色体基因座,其中,外源DNA可以以可预见的方式整合至其中并且发挥作用而不会不利地影响内源基因结构或表达。安全港基因座可包括基因外区域或基因内区域,例如,非必需的、非必要的或可被中断而不会产生明显的表型后果的基因内的基因座。
例如,人体内的Rosa26基因座及其等同物在所有组织中提供开放的染色质结构并且在胚胎发育过程中以及成人体内泛表达。参见,例如,Zambrowicz等人,(1997)Proc.Natl.Acad.Sci.USA 94:3789-3794,该参考文献的全部内容通过引用并入本文,用于所有目的。此外,Rosa26基因座可被高效靶定并且Rosa26基因的中断不会产生明显表型。安全港基因座的其他实例包括CCR5,HPRT,AAVS1和白蛋白。参见,例如,美国专利US7,888,121;US7,972,854;US7,914,796;US7,951,925;US8,110,379;US8,409,861;US8,586,526,以及美国专利公开US2003/0232410;US2005/0208489;US2005/0026157;US2006/0063231;US2008/0159996;US2010/00218264;US2012/0017290;US2011/0265198;US2013/0137104;US2013/0122591;US2013/0177983;US2013/0177960;以及US2013/0122591,上述美国专利以及美国专利公开中的每一个的全部内容通过引用并入本文,用于所有目的。安全港基因座(例如,Rosa26基因座)的双等位基因的靶定不会产生阴性结果,因此,不同的基因或报告体可被靶定至两个Rosa26等位基因。在一个实例中,Cas表达盒被整合至Rosa26基因座的内含子(例如,Rosa26基因座的第一内含子)中。
D.重组酶删除的非人类动物(Recombinase Deleter Non-Human Animals)
包含Cas表达盒的细胞或非人类动物可还包含重组酶表达盒,其驱动位点特异性重组酶的表达,其中,所述Cas表达盒包含位于侧面具有被本文所述的位点特异性重组酶识别的重组酶识别位点的聚腺苷酸化信号或转录终止子下游的Cas编码序列。位点特异性重组酶包括可促进重组酶识别位点之间的重组的酶,其中,单个核酸中的两个重组位点在物理上被分隔开或者两个重组位点位于不同的核酸上。重组酶的实例包括Cre,Flp和Dre重组酶。Cre重组酶基因的一个实例是Crei,其中,编码Cre重组酶的两个外显子被内含子分隔开以防止其在原核细胞中的表达。这样的重组酶可还包含细胞核定位信号以促进定位至细胞核(NLS-Crei)。重组酶识别位点包括由位点特异性重组酶识别的并且可用作重组事件的底物的核苷酸序列。重组酶识别位点的实例包括FRT,FRT11,FRT71,attp,att,rox和lox位点(例如,loxP,lox511,lox2272,lox66,lox71,loxM2,和lox5171)。
Cas表达盒和重组酶表达盒可以整合至不同的目标基因组基因座,或者它们可被基因组整合至相同的目标基因座(例如,Rosa26基因座,例如,整合在Rosa26基因座的第一内含子中)。例如,细胞或非人类动物对于Cas表达盒和重组酶表达盒中的每一个而言可以是杂合的,其中,目标基因组基因座中的一个等位基因包括Cas表达盒,并且目标基因组基因座的另一等位基因包含重组酶表达盒。
重组酶表达盒中的重组酶基因可以可操作地连接至任何合适的启动子。启动子的实例在本文的其他地方公开。例如,启动子可以是组织特异性启动子(例如,用于肝脏特异性表达的白蛋白启动子或用于胰腺特异性表达的胰岛素2启动子)或发育阶段特异性启动子。这些启动子提供的优势在于Cas的表达可以在期望的组织中被选择性地活化或者仅在期望的发育阶段被选择性地活化,从而降低了Cas介导体内毒性的可能。用于小鼠重组酶删除株(recombinase delete strain)的示例性的启动子的非限定性列表在表2中提供。
表2.在小鼠重组酶删除株中使用的示例性的启动子
Figure BDA0003645747480000551
Figure BDA0003645747480000561
Figure BDA0003645747480000571
Figure BDA0003645747480000581
Figure BDA0003645747480000591
Figure BDA0003645747480000601
III.评价CRISPR/Cas的体内活性的方法
本文提供各种不同的用于评价CRISPR/Cas递送至活体动物的组织和器官以及用于评价CRISPR/Cas在活体动物的组织和器官中的活性的方法。这些方法利用包含本文其他地方描述的Cas表达盒的非人类动物。
A.测试CRISPR/Cas体内或离体修饰目标基因组基因座的能力的方法
本文提供各种不同的使用本文所述的包括Cas表达盒的非人类动物评价CRISPR/Cas切口酶或核酸酶体内修饰目标基因组基因座的能力的方法。这些方法可包括:(a)向所述非人类动物体内引入设计为靶向目标基因组基因座的向导RNA靶向序列的向导RNA,以及(b)评价对目标基因座的修饰。当向导RNA与Cas蛋白质形成复合物且使Cas蛋白质定向至目标基因组基因座,并且Cas/向导RNA复合物裂解了向导RNA靶向序列,触发细胞进行修复(例如,如果不存在供体序列的话,通过非同源末端连接)时,诱导对目标基因组基因座的修饰。
任选地,可引入两个或多个向导RNA,其每一个被设计为靶向目标基因组基因座中的不同向导RNA靶向序列。例如,两个向导RNA可被设计为切除这两个向导RNA靶向序列之间的基因组序列。在第一向导RNA与Cas蛋白质形成复合物且使Cas定向至目标基因组基因座,第二向导RNA与Cas蛋白质形成复合物且使Cas蛋白质定向至目标基因组基因座,第一Cas/向导RNA复合物裂解第一向导RNA靶向序列并且第二Cas/向导RNA复合物裂解第二向导RNA靶向序列,从而切除介入的序列时,诱导对目标基因组基因座的修饰。可选地,可引入两个或多个向导RNA,其中的每一个被设计为靶向不同基因组基因座的不同向导RNA靶向序列(即,复用)。
任选地,向所述非人类动物体内引入能够与目标基因组基因座重组并且修饰目标基因组基因座的外源供体核酸。任选地,Cas蛋白质可栓系于本文其他地方描述的外源供体核酸。任选地,可引入两个或多个外源供体核酸,其中的每一个能够与不同的目标基因组基因座重组并且修饰不同的目标基因组基因座。例如,当向导RNA与Cas蛋白质形成复合物且使Cas蛋白质定向至目标基因组基因座,Cas/向导RNA复合物裂解了向导RNA靶向序列并且目标基因组基因座与外源供体核酸重组以修饰目标基因组基因座时,将会诱导对目标基因组基因座的修饰。所述外源供体核酸可与目标基因组基因座通过例如同源定向修复(HDR)或通过NHEJ介导的插入进行重组。可使用任何类型的外源供体核酸,其实例在本文的其他地方提供。
同样,本文提供的用于评价CRISPR/Cas体内活性的各种不同的方法还可使用包括本文其他地方描述的Cas表达盒的细胞评价CRISPR/Cas的离体活性。
向导RNA和任选的外源供体核酸可通过本文其他地方公开的任何递送方法(例如,AAV,LNP或HDD)以及任何给药途径被引入细胞或非人类动物。在特定的方法中,向导RNA通过AAV-介导的递送进行递送。例如,当靶定肝脏时,可使用AAV8。
用于评价对目标基因组基因座的修饰的方法在本文其他地方提供并且是熟知的。对目标基因组基因座的修饰的评价可在本文其他地方公开的任何细胞类型,任何组织类型或任何器官类型中进行。在一些方法中,对目标基因组基因座的修饰的评价在肝细胞中进行(例如,评价肝细胞中目标基因组基因座表达的分泌的蛋白质的血清水平)。例如,目标基因组基因座包括目标基因并且评价可包括测量目标基因的表达或由目标基因编码的蛋白质的活性。可选地或此外,评价可包括对分离自非人类动物的一种或多种细胞中的目标基因组基因座进行测序。评价可包括从非人类动物中分离目标器官或组织以及评价目标器官或组织中的对目标基因组基因座的修饰。评价还可包括评价对目标器官或组织中的两种或多种不同的细胞类型中的目标基因组基因座的修饰。类似地,评价可包括从非人类动物中分离非目标器官或组织(例如,两种或多种非目标器官或组织)以及评价对非目标器官或组织中的目标基因组基因座的修饰。
(1)外源供体核酸
本文公开的方法和组合物利用外源供体核酸修饰目标基因组基因座,随后采用Cas蛋白裂解所述目标基因组基因座。在这些方法中,Cas蛋白质裂解目标基因组基因座以产生单链断裂(切口)或双链断裂,并且外源供体核酸通过非同源末端连接(NHEJ)介导的连接或通过同源定向修复事件重组目标基因组基因座。任选地,采用外源供体核酸进行修复除去或干扰向导RNA靶向序列或Cas裂解位点,使得已被靶定的等位基因无法被Cas蛋白质再次靶定。
外源供体核酸可包含脱氧核糖核酸(DNA)或核糖核酸(RNA),它们可以是单链的或双链的,并且它们可以是线性形式或环状形式。例如,外源供体核酸可以是单链寡脱氧核苷酸(ssODN)。参见,例如,Yoshimi等人,(2016)Nat.Commun.7:10431,其全部内容通过引用并入本文,用于所有目的。示例性的外源供体核酸的长度为约50个核苷酸至约5kb,约50个核苷酸至约3kb,或约50个核苷酸至约1,000个核苷酸。其他示例性的外源供体核酸的长度为约40个核苷酸至约200个核苷酸。例如,外源供体核酸的长度可以为约50-60个核苷酸,60-70个核苷酸,70-80个核苷酸,80-90个核苷酸,90-100个核苷酸,100-110个核苷酸,110-120个核苷酸,120-130个核苷酸,130-140个核苷酸,140-150个核苷酸,150-160个核苷酸,160-170个核苷酸,170-180个核苷酸,180-190个核苷酸,或190-200个核苷酸。可选地,外源供体核酸的长度可以为约50-100个核苷酸,100-200个核苷酸,200-300个核苷酸,300-400个核苷酸,400-500个核苷酸,500-600个核苷酸,600-700个核苷酸,700-800个核苷酸,800-900个核苷酸,或900-1000个核苷酸。可选地,外源供体核酸的长度可以为约1-1.5kb,1.5-2kb,2-2.5kb,2.5-3kb,3-3.5kb,3.5-4kb,4-4.5kb,或4.5-5kb。可选地,外源供体核酸的长度可以为例如不超过5kb,4.5kb,4kb,3.5kb,3kb,2.5kb,2kb,1.5kb,1kb,900个核苷酸,800个核苷酸,700个核苷酸,600个核苷酸,500个核苷酸,400个核苷酸,300个核苷酸,200个核苷酸,100个核苷酸,或50个核苷酸。外源供体核酸(例如,靶向载体)还可以更长。
在一个实例中,外源供体核酸是长度为约80个核苷酸至约200个核苷酸的ssODN。在另一实例中,外源供体核酸是长度为约80个核苷酸至约3kb的ssODN。这样的ssODN可具有同源臂,例如,其长度为约40个核苷酸至约60个核苷酸。这样的ssODN还可具有例如长度为约30个核苷酸至100个核苷酸的同源臂。所述同源臂可以是对称的(例如,每个同源臂的长度均为40个核苷酸或60个核苷酸)或所述同源臂可以是非对称的(例如,一个同源臂的长度为36个核苷酸,另一同源臂的长度为91个核苷酸)。
外源供体核酸可包括提供额外的理想特性(例如,改良的或调节的稳定性,采用荧光标记跟踪或检测,用于蛋白质或蛋白质复合物的结合位点,等等)的修饰或序列。外源供体核酸可包含一个或多个荧光标记,纯化标签,表位标签或其组合。例如,外源供体核酸可包含一个或多个荧光标记(例如,荧光蛋白或其他荧光团或染料),例如,至少一个荧光标记,至少2个荧光标记,至少3个荧光标记,至少4个荧光标记或至少5个荧光标记。示例性的荧光标记包括诸如荧光素(例如,6-羧基荧光素(6-FAM))之类的荧光团,德克萨斯红,HEX,Cy3,Cy5,Cy5.5,Pacific Blue,5-(和6-)-羧基四甲基罗丹明(TAMRA)和Cy7。用于标记寡核苷酸的多种荧光染料是商业上可获得的(例如,可获自Integrated DNA Technologies)。这些荧光标记(例如,内部荧光标记)可用于例如检测外源供体核酸,所述外源供体核酸已直接整合至具有与外源供体核酸的末端相容的凸出端的裂解的目标核酸。标记或标签可位于外源供体核酸内的5’端,3’端或位于外源供体核酸内部。例如,外源供体核酸可以在5’端与来自Integrated DNA Technologies的IR700荧光团(
Figure BDA0003645747480000631
700)偶联。
外源供体核酸可还包含核酸插入体,该核酸插入体包括待整合至目标基因组基因座的DNA片段。核酸插入体在目标基因组基因座处的整合可导致将目标核酸序列添加至目标基因组基因座,删除目标基因组基因座处的目标核酸序列或取代目标基因组基因座处的目标核酸序列(即,删除和插入)。一些外源供体核酸被设计为在目标基因组基因座处插入核酸插入体而不会在目标基因组基因座处产生任何相应的删除。其他外源供体核酸被设计为删除目标基因组基因座处的目标核酸序列而不会产生核酸插入体的任何相应插入。其他外源供体核酸被设计为删除目标基因组基因座处的目标核酸序列并且使用核酸插入体将其取代。
在目标基因组基因座处被删除和/或取代的核酸插入体或相应核酸可具有各种不同的长度。目标基因组基因座处的被删除和/或取代的示例性的核酸插入体或相应的核酸的长度为约1个核苷酸至约5kb或约1个核苷酸至约1,000个核苷酸。例如,在目标基因组基因座处被删除和/或取代的核酸插入体或相应的核酸的长度可以为约1-10个核苷酸,10-20个核苷酸,20-30个核苷酸,30-40个核苷酸,40-50个核苷酸,50-60个核苷酸,60-70个核苷酸,70-80个核苷酸,80-90个核苷酸,90-100个核苷酸,100-110个核苷酸,110-120个核苷酸,120-130个核苷酸,130-140个核苷酸,140-150个核苷酸,150-160个核苷酸,160-170个核苷酸,170-180个核苷酸,180-190个核苷酸,或190-120个核苷酸。同样,目标基因组基因座处的被删除和/或取代的核酸插入体或相应核酸的长度可以为1-100个核苷酸,100-200个核苷酸,200-300个核苷酸,300-400个核苷酸,400-500个核苷酸,500-600个核苷酸,600-700个核苷酸,700-800个核苷酸,800-900个核苷酸,或900-1000个核苷酸。同样,在目标基因组基因座处被删除和/或取代的核酸插入体或相应的核酸的长度可以为约1-1.5kb,1.5-2kb,2-2.5kb,2.5-3kb,3-3.5kb,3.5-4kb,4-4.5kb,或4.5-5kb,或者更长。
核酸插入体可包含与取代靶定的所有序列或部分序列同源或直系同源的序列。例如,核酸插入体可包含如下序列:该序列与目标基因组基因座处取代靶定的序列相比包含一个或多个点突变(例如,1个,2个,3个,4个,5个或更多)。任选地,这些点突变可在编码的多肽中产生保守氨基酸取代(例如,谷氨酸[Glu,E]取代天冬氨酸[Asp,D])。
(2)用于非同源末端连接介导的插入的供体核酸
一些外源供体核酸在5’端和/或3’端具有短单链区域,其与目标基因组基因座处由Cas-蛋白介导的裂解产生的一个或多个悬挂互补。这些悬挂还可被称为5’和3’同源臂。例如,一些外源供体核酸在5’端和/或3’端具有短单链区域,其与由目标基因组基因座处的5’和/或3’目标序列的Cas蛋白介导的裂解产生的一个或多个悬挂互补。一些这样的外源供体核酸具有仅位于5’端或仅位于3‘端的互补区域。例如,一些这样的外源供体核酸具有仅位于5’端与目标基因组基因座处的5’目标序列产生的悬挂互补的互补区域或具有仅位于3’端与目标基因组基因座处的3’目标序列产生的悬挂互补的互补区域。其他这样的外源供体核酸在5’端和3’端均具有互补区域。例如,其他这样的外源供体核酸具有位于5’和3’这两端的分别与目标基因组基因座处的Cas介导的裂解产生的第一和第二悬挂互补的互补区域。例如,如果外源供体核酸是双链的,那么单链互补区域可从供体核酸的顶部链的5’端和供体核酸的底部链的5’端延伸出来,从而在每一端产生5’悬挂。可选地,单链互补区域可从供体核酸的顶部链的3’端和模板的底部链的3’端延伸出来,从而产生3’悬挂。
互补区域可具有任何足以促进外源供体核酸和目标核酸之间的连接的长度。示例性的互补区域的长度为约1个核苷酸至约5个核苷酸,约1个核苷酸至约25个核苷酸,或约5个核苷酸至约150个核苷酸。例如,互补区域的长度可以为至少约1个核苷酸,2个核苷酸,3个核苷酸,4个核苷酸,5个核苷酸,6个核苷酸,7个核苷酸,8个核苷酸,9个核苷酸,10个核苷酸,11个核苷酸,12个核苷酸,13个核苷酸,14个核苷酸,15个核苷酸,16个核苷酸,17个核苷酸,18个核苷酸,19个核苷酸,20个核苷酸,21个核苷酸,22个核苷酸,23个核苷酸,24个核苷酸,或25个核苷酸。可选地,互补区域的长度可以为约5-10个核苷酸,10-20个核苷酸,20-30个核苷酸,30-40个核苷酸,40-50个核苷酸,50-60个核苷酸,60-70个核苷酸,70-80个核苷酸,80-90个核苷酸,90-100个核苷酸,100-110个核苷酸,110-120个核苷酸,120-130个核苷酸,130-140个核苷酸,或140-150个核苷酸,或者更长。
这些互补区域可以与两对切口酶产生的悬挂互补。带有交错端的两个双链断裂可通过使用产生第一双链断裂的裂解DNA的相对链的第一和第二切口酶以及产生第二双链断裂的裂解DNA的相对链的第三和第四切口酶产生。例如,Cas蛋白质可用于在与第一、第二、第三和第四向导RNA对应的第一、第二、第三和第四向导RNA靶向序列上产生切口。所述第一和第二向导RNA靶向序列可位于产生第一裂解位点的位置,这样由第一和第二切口酶在DNA的第一和第二链上产生的切口产生了双链断裂(即,第一裂解位点包含位于第一和第二向导RNA靶向序列内的切口)。类似地,第三和第四向导RNA靶向序列可位于产生第二裂解位点的位置,这样,由第三和第四切口酶在DNA的第一和第二链上产生的切口产生了双链断裂(即,第二裂解位点包含位于第三和第四向导RNA靶向序列内的切口)。任选地,位于第一和第二向导RNA靶向序列和/或第三和第四向导RNA靶向序列内的切口可以是产生悬挂的偏置切口。偏置窗口可以是例如至少约5bp,10bp,20bp,30bp,40bp,50bp,60bp,70bp,80bp,90bp,100bp或更大。参见,Ran等人,(2013)Cell 154:1380-1389;Mali等人,(2013)Nat.Biotech.31:833-838;和Shen等人,(2014)Nat.Methods 11:399-404,其每一个的全部内容通过引用并入本文,用于所有目的。在这些情况下,双链外源供体核酸可使用如下单链互补区域设计,所述单链互补区域与由第一和第二向导RNA靶向序列内的切口产生的悬挂以及由第三和第四向导RNA靶向序列内的切口产生的悬挂互补。这样的外源供体核酸随后可通过非同源末端连接介导的连接插入。
(3)通过同源定向修复进行插入的供体核酸
一些外源供体核酸包含同源臂。如果外源供体核酸还包含核酸插入体,那么所述同源臂可位于所述核酸插入体的侧面。为了便于参考,本文中的同源臂被称为5’和3’(即,上游和下游)同源臂。该术语涉及同源臂与外源供体核酸内的核酸插入体的相对位置。5’和3’同源臂对应于目标基因组基因座内的区域,该区域在本文中被分别称为“5’靶向序列”和“3’靶向序列”。
当两个区域彼此之间共享足够水平的序列一致性时,同源臂和靶向序列彼此之间“对应”以作为同源重组反应的底物。术语“同源”包括与对应序列等同或与对应序列共享序列一致性的DNA序列。给定的目标序列和在外源供体核酸中发现的对应的同源臂之间的序列一致性可以是允许同源重组发生的任何程度的序列一致性。例如,外源供体核酸(或其片段)的同源臂和目标序列(或其片段)共享的序列一致性的量可以是至少50%,55%,60%,65%,70%,75%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或100%序列一致性,从而所述序列经历同源重组。而且,同源臂和对应的目标序列之间的具有同源性的对应区域可具有足以促进同源重组的任何长度。示例性的同源臂的长度为约25个核苷酸至约2.5kb,约25个核苷酸至约1.5kb或约25个核苷酸至约500个核苷酸。例如,给定的同源臂(或同源臂中的每一个)和/或对应的目标序列可包含长度为约25-30个核苷酸,30-40个核苷酸,40-50个核苷酸,50-60个核苷酸,60-70个核苷酸,70-80个核苷酸,80-90个核苷酸,90-100个核苷酸,100-150个核苷酸,150-200个核苷酸,200-250个核苷酸,250-300个核苷酸,300-350个核苷酸,350-400个核苷酸,400-450个核苷酸,或450-500个核苷酸的具有同源性的对应区域,这样,同源臂具有足以与目标核酸内的对应的目标序列进行同源重组的同源性。可选地,给定的同源臂(或每个同源臂)和/或对应的目标序列可包含长度为约0.5kb至约1kb,约1kb至约1.5kb,约1.5kb至约2kb,或约2kb至约2.5kb的同源性对应区域。例如,同源臂中的每一个的长度可为约750个核苷酸。同源臂可以是对称的(每个同源臂具有大约相同的长度)或可以是非对称的(一个同源臂比另一个长)。
当CRISPR/Cas系统与外源供体核酸联合使用时,5’和3’目标序列任选地位于足够靠近Cas裂解位点的位置(例如,足够靠近向导RNA靶向序列的位置之内),从而促进Cas裂解位点处单链断裂(切口)或双链断裂之后目标序列和同源臂之间发生同源重组事件。术语“Cas裂解位点”包括由Cas酶产生切口或双链断裂的DNA序列(例如,与向导RNA复合的Cas9蛋白)。目标基因座内的与外源供体核酸的5’和3’同源臂对应的目标序列位于“足够靠近Cas裂解位点的位置”,只要该距离能够促进Cas裂解位点处单链断裂或双链断裂之后5’和3’目标序列和同源臂之间发生同源重组事件。因此,对应于外源供体核酸的5’和/或3’同源臂的目标序列可以是例如位于给定的Cas裂解位点的至少1个核苷酸之内,或给定的Cas裂解位点的至少10个核苷酸至约1,000个核苷酸之内。作为实例,Cas裂解位点可以就在目标序列中的至少一个或两个的附近。
对应于外源供体核酸的同源臂的目标序列和Cas裂解位点之间的空间关系可发生改变。例如,目标序列可位于Cas裂解位点的5’端,目标序列可位于Cas裂解位点的3’端,或目标序列可位于Cas裂解位点的侧面。
B.优化CRISPR/Cas体内或离体切除目标基因组核酸的能力的方法
本文提供用于优化将CRISPR/Cas递送至细胞或非人类动物或优化CRISPR/Cas的体内活性的各种不同的方法。这些方法可包括,例如:(a)在第一非人类动物或第一细胞中第一次执行测试CRISPR/Cas修饰上文所述的目标基因组基因座的能力的方法;(b)改变可变量并且使用改变的可变量在第二非人类动物(即,相同的种类)或第二细胞中再次执行上述方法;以及(c)将步骤(a)中对目标基因组基因座的修饰与步骤(b)中对目标基因组基因座的修饰进行比较,并且选择产生对目标基因组基因座更有效的修饰的方法。
对目标基因组基因座的更加有效的修饰可以是指基于非人类动物或细胞中的期望作用的不同事件。例如,对目标基因组基因座的更加有效的修饰可以是指更高的效率,更高的精确度,更高的一致性或更高的特异性中的一种或多种或全部。更高的效率是指对目标基因组基因座的更高水平的修饰(例如,靶定特定目标细胞类型中,特定目标组织中,或特定目标器官中更高百分比的细胞)。更高的精确度是指对目标基因组基因座的更加精确的修饰(例如,更高百分比的靶定细胞具有相同的修饰或具有期望的修饰而不产生额外的不期望的插入和删除(例如,NHEJ插入/缺失))。更高的一致性是指如果靶定多于一种类型的细胞、组织或器官的话,对不同类型的靶定的细胞、组织或器官中的目标基因组基因座产生更加一致的修饰(例如,在目标器官中对更多的细胞类型进行修饰)。如果靶定特定器官的话,更高的一致性还可以是指在器官内的所有位置中产生更加一致的修饰。更高的特异性可以是指对靶定的基因组基因座或靶定的基因座具有更高的特异性,对靶定的细胞类型具有更高的特异性,对靶定的组织类型具有更高的特异性,或者对靶定的器官具有更高的特异性。例如,提高的基因组基因座特异性是指对脱靶的基因组基因座具有较少的修饰(例如,在不期望的,脱靶的基因组基因座处对较低百分比的靶定细胞进行修饰,而对目标基因组基因座进行修饰)。同样,如果靶定特定细胞类型、组织类型或器官类型的话,提高的细胞类型特异性、组织特异性或器官类型特异性是指对脱靶的细胞类型、组织类型或器官类型具有较少的修饰(例如,当靶定特定器官(例如,肝脏)的话,对不期望靶定的器官或组织中的细胞具有较少的修饰)。
被改变的可变量可以是任何参数。作为一个实例,被改变的可变量可以是将向导RNA(或包装在AAV中的向导RNA)和外源供体核酸中的一种或多种或全部引入至细胞或非人类动物中的包装方法或递送方法。递送方法的实例在本文的其他地方公开,例如,LNP,HDD和AAV。例如,改变的可变量可以是AAV血清型。作为另一实例,改变的可变量可以是将向导RNA(例如,包装在AAV中的向导RNA)和外源供体核酸中的一种或多种或全部引入细胞或非人类动物中的给药途径。给药途径的实例在本文的其他地方公开,例如,静脉内,玻璃体内,脑实质内以及鼻灌注。
作为另一实例,改变的可变量可以是引入的向导RNA(例如,包装在AAV中的向导RNA)和引入的外源供体核酸中的一种或多种或全部的浓度或量。作为另一实例,改变的可变量可以是相对于引入的外源供体核酸的浓度或量的引入的向导RNA(例如,包装在AAV中的向导RNA)的浓度或量。
作为另一实例,改变的可变量可以是相对于测量一种或多种报告体蛋白的表达或活性的时机引入向导RNA(例如,包装在AAV中的向导RNA)和外源供体核酸中的一种或多种或全部的时机。作为另一实例,改变的可变量可以是引入向导RNA(例如,包装在AAV中的向导RNA)和外源供体核酸中的一种或多种或全部的次数或频率。作为另一实例,改变的可变量可以是相对于引入外源供体核酸的时机引入向导RNA的时机。
作为另一实例,改变的可变量可以是引入的向导RNA和外源供体核酸中的一种或多种或全部的形式。例如,向导RNA以DNA的形式或RNA的形式引入。外源供体核酸可以是DNA,RNA,单链,双链,线性,环状等等。类似地,各个成分可包含稳定性修饰,降低脱靶作用的修饰,促进递送的修饰等等的各种不同的组合。作为另一实例,改变的可变量可以是引入的向导RNA(例如,引入具有不同序列的不同向导RNA)和引入的外源供体核酸(例如,引入具有不同序列的不同外源供体核酸)中的一种或多种或全部。
C.将向导RNA和其他成分引入细胞或非人类动物
本文公开的方法包括向细胞或非人类动物引入向导RNA和外源供体核酸中的一个或多个或全部。“引入”包括以使核酸或蛋白质接近细胞的内部或接近非人类动物内的细胞的内部的方式向细胞或非人类动物呈递核酸或蛋白质。所述引入可通过任何方式完成并且上述成分中的两个或多个(例如,上述成分中的两个或所有成分)可同时或按顺序以任何组合引入至细胞或非人类动物。例如,可在引入向导RNA之前将外源供体核酸引入细胞或非人类动物,或者可在引入向导RNA之后引入外源供体核酸(例如,可在引入向导RNA之前或之后的约1小时,2小时,3小时,4小时,8小时,12小时,24小时,36小时,48小时或72小时给药外源供体核酸)。参见,例如,US 2015/0240263和US 2015/0110762,其每一个的全部内容通过引用并入本文,用于所有目的。此外,上述成分中的两种或多种可通过相同的递送方法或不同的递送方法引入至细胞或非人类动物。类似地,上述成分中的两种或多种可通过相同的给药途径或不同的给药途径引入至非人类动物。
向导RNA可以RNA的形式(例如,体外转录的RNA)或编码向导RNA的DNA的形式引入至细胞中。当以DNA的形式引入向导RNA时,编码向导RNA的DNA可以可操作地连接至在细胞中具有活性的启动子。例如,向导RNA可通过AAV递送并在U6启动子下体内表达。这样的DNA可以位于一个或多个表达构建体中。例如,这些表达构建体可以是单个核酸分子的成分。可选地,它们可以任何组合被分开在两个或多个核酸分子之间(即,编码一个或多个CRISPRRNA的DNA和编码一个或多个tracrRNA的DNA可以是不同的核酸分子的成分)。
编码向导RNA的核酸可以可操作地连接至表达构建体中的启动子。表达构建体包括任何能够定向目标基因或其他目标核酸序列的表达的核酸构建体并且所述核酸构建体可将这样的目标核酸序列转移至目标细胞。可在表达构建体中使用的合适的启动子包括例如在下列细胞中的一种或多种中具有活性的启动子:真核细胞,人细胞,非人类细胞,哺乳动物细胞,非人类哺乳动物细胞,啮齿动物细胞,小鼠细胞,大鼠细胞,仓鼠细胞,兔细胞,多能细胞,胚胎干(ES)细胞,成体干细胞,发育受限祖细胞,诱导多能性干(iPS)细胞或单细胞期胚胎。这些启动子可以是例如条件性启动子,可诱导启动子,组成性启动子或组织特异性启动子。任选地,所述启动子可以是驱动向导RNA在一个方向上表达并且驱动另一成分在另一方向上表达的双向启动子。这些双向启动子可由如下成分构成:(1)包含3个外部控制元件的完整传统单向Pol III启动子:远端序列元件(DSE),近端序列元件(PSE)和TATA盒;和(2)包括在反方向上融合至DSE的5’末端的PSE和TATA盒的第二碱性Pol III启动子。例如,在H1启动子中,DSE接近PSE和TATA盒并且所述启动子可通过产生杂交启动子在双向上产生,在所述杂交启动子中,反向转录通过添加源自U6启动子的PSE和TATA盒来控制。参见,例如,US2016/0074535,其全部内容通过引用并入本文,用于所有目的。使用双向启动子同时表达编码向导RNA的基因和另一成分能够产生紧凑表达盒以促进递送。
外源供体核酸和向导RNA(或编码向导RNA的核酸)可在包含载体的组合物中提供,所述载体提高了外源供体核酸或向导RNA的稳定性(例如,延长了其在给定的存储条件(例如,-20℃,4℃或室温)下的存储时间段,在该时间段内降解产物仍然低于阈值,例如,低于起始核酸或蛋白质的重量的0.5%;或者提高了体内稳定性)。这种载体的非限定性实例包括聚(乳酸)(PLA)微球,聚(D,L-乳酸-co-羟基乙酸)(PLGA)微球,脂质体,胶束,反相胶束,脂质卷(lipid cochleate)和脂质微管。
本文提供各种不同的方法和组合物将核酸或蛋白质引入细胞或非人类动物。将核酸引入各种不同的细胞类型中的方法是本领域已知的并且包括例如,稳定转染法,瞬时转染法和病毒介导的方法。
转染规程以及将核酸序列引入细胞中的操作规程可能各不相同。非限定性的转染方法包括使用脂质体,纳米颗粒,磷酸钙(Graham等人,(1973)Virology 52(2):456–67,Bacchetti等人,(1977)Proc.Natl.Acad.Sci.USA74(4):1590–4,以及Kriegler,M(1991).Transfer and Expression:A Laboratory Manual.New York:W.H.Freeman andCompany.pp.96–97),树枝状聚合物,或诸如DEAE-葡聚糖或聚乙烯亚胺之类的阳离子聚合物的基于化学的转染方法。非化学方法包括电穿孔,Sono-穿孔,和光转染。基于颗粒的转染包括使用基因枪或磁性辅助转染(Bertram(2006)Current PharmaceuticalBiotechnology 7,277–28)。病毒方法也可用于转染。
将核酸或蛋白质引入细胞内还可以由电穿孔介导,由胞质内注射介导,由病毒感染介导,由腺病毒介导,由腺相关病毒介导,由慢病毒介导,由逆转录病毒介导,由转染介导,由脂质介导的转染介导,或由核转染(nucleofection)介导。核转染是一种改进的电穿孔技术,其不仅能够将核酸底物递送至细胞质而且还可以通过核膜将核酸底物递送至细胞核内。此外,在本文公开的方法中使用核转染相对于常规电穿孔需要少得多的细胞(例如,相对于常规电穿孔需要7百万个细胞,其仅需要约2百万个细胞)。在一个实例中,核转染使用
Figure BDA0003645747480000721
NUCLEOFECTORTM系统进行。
将核酸或蛋白质引入细胞(例如,受精卵)内还可通过显微注射完成。在受精卵(即,单细胞期胚胎)中,显微注射可进入母本和/或父本原核中或进入细胞质内。如果显微注射只进入一个原核中,父本原核由于其具有较大的尺寸而是优选的。可选地,显微注射可通过注射进入细胞核/原核和细胞质这两者来实施:首先可将针头引入细胞核/原核内并注射第一量,并且在将所述针头从单细胞期胚胎中移出时,向细胞质中注射第二量。实施显微注射的方法是本领域熟知的。参见,例如,Nagy等人,(Nagy A,Gertsenstein M,VinterstenK,Behringer R.,2003,Manipulating the Mouse Embryo.Cold Spring Harbor,NewYork:Cold Spring Harbor Laboratory Press);还可参见Meyer等人,(2010)Proc.Natl.Acad.Sci.USA 107:15022-15026以及Meyer等人,(2012)Proc.Natl.Acad.Sci.USA 109:9354-9359。
用于将核酸或蛋白质引入细胞内或非人类动物体内的其他方法可包括例如,载体递送,颗粒介导的递送,核外体介导的递送,脂质纳米颗粒介导的递送,细胞渗透肽介导的递送,或可植入设备介导的递送。作为特定实例,可将核酸或蛋白质引入至诸如聚(乳酸)(PLA)微球,聚(D,L-乳酸-co-羟基乙酸)(PLGA)微球,脂质体,胶束,反相胶束,脂质卷(lipid cochleate)或脂质微管之类的载体中的细胞或非人类动物。递送至非人类动物的一些特定实例包括流体力学递送,病毒介导的递送(例如,腺相关病毒(AAV)介导的递送)和脂质纳米颗粒介导的递送。
将核酸和蛋白质引入细胞或非人类动物还可通过流体力学递送(HDD)完成。流体力学递送作为一种体内递送细胞内DNA的方法而出现。对于将基因递送至实质细胞而言,只需要将必需DNA序列通过所选择的血管进行注射,这消除了与目前的病毒载体和合成载体相关的安全顾虑。当将DNA注射至血流中时,DNA能够到达接近血液的不同组织中的细胞。流体力学递送使用将大量溶液快速注射进入循环中的不可压缩的血液中产生的力以克服内皮的物理障碍和细胞膜的物理障碍,所述细胞膜防止较大的且细胞膜不可渗透的化合物进入实质细胞。除了DNA的递送之外,该方法可用于体内有效细胞内递送RNA,蛋白质和其他小化合物。参见,例如,Bonamassa等人,(2011)Pharm.Res.28(4):694-701,其全部内容通过引用并入本文,用于所有目的。
引入核酸还可通过病毒介导的递送(例如,AAV-介导的递送或慢病毒介导的递送)完成。其他示例性的病毒/病毒载体包括逆转录病毒,腺病毒,牛痘病毒,痘病毒以及单纯疱疹病毒。所述病毒可感染分化的细胞,未分化的细胞或分化的和未分化的细胞这两者。所述病毒可整合至宿主基因组中,或者,可选地,所述病毒未整合至宿主基因组中。这些病毒还可被工程化以具有降低的免疫性。病毒可以是能够进行复制的或可以是复制有缺陷的(例如,缺乏一种或多种多轮病毒复制和/或包装所必需的基因)。病毒可导致瞬时表达,长期表达(例如,至少1周,两周,1个月,2个月,或3个月),或者永久表达(例如,Cas9和/或gRNA的永久表达)。示例性的病毒滴度(例如,AAV滴度)包括1012个载体基因组/mL,1013个载体基因组/mL,1014个载体基因组/mL,1015个载体基因组/mL和1016个载体基因组/mL。
ssDNA AAV基因组由两个开放阅读框Rep和Cap构成,其侧面具有两个允许互补DNA链合成的倒置末端重复序列(inverted terminal repeat)。当构建AAV转移质粒时,转基因被放置于两个ITR之间并且Rep和Cap可以反式提供。除了Rep和Cap之外,AAV可能需要包含来自腺病毒的基因的辅助质粒。这些基因(E4,E2a和VA)介导AAV复制。例如,转移质粒,Rep/Cap和辅助质粒可被转染至含有腺病毒基因E1+的HEK293细胞中以产生感染的AAV颗粒。可选地,Rep,Cap和腺病毒辅助基因可被合并至单个质粒中。类似的包装细胞和包装方法可用于其他病毒,例如,逆转录病毒。
已识别了AAV的多种血清型。这些血清型的区别在于其所感染的细胞类型(即,其趋向性),这使得特定细胞类型被优先转导。CNS组织的血清型包括AAV1,AAV2,AAV4,AAV5,AAV8,和AAV9。心脏组织的血清型包括AAV1,AAV8和AAV9。肾脏组织的血清型包括AAV2。肺组织的血清型包括AAV4,AAV5,AAV6和AAV9。胰腺组织的血清型包括AAV8。光感受器细胞的血清型包括AAV2,AAV5和AAV8。视网膜色素上皮组织的血清型包括AAV1,AAV2,AAV4,AAV5,和AAV8。骨骼肌组织的血清型包括AAV1,AAV6,AAV7,AAV8,和AAV9。肝脏组织的血清型包括AAV7,AAV8和AAV9,尤其是AAV8。
趋向性还可通过假型进行细分,其是衣壳和来自不同病毒血清型的基因组的混合。例如,AAV2/5表示病毒包含包装在血清型5的衣壳中的血清2的基因组。假型病毒的使用可改善转导效率并且改变趋向性。源自不同血清型的杂交衣壳还可用于改变病毒趋向性。例如,AAV-DJ包含来自八个血清型的杂交衣壳并且在各种不同的细胞类型中在体内显示出较高的传染性。AAV-DJ8是显示出AAV-DJ性质但带有提高的脑部摄入的另一实例。AAV血清型还可通过突变进行修饰。AAV2的突变修饰的实例包括Y444F,Y500F,Y730F,和S662V。AAV3的突变修饰的实例包括Y705F,Y731F和T492V。AAV6的突变修饰的实例包括S663V和T492V。其他假型/修饰的AAV变体包括AAV2/1,AAV2/6,AAV2/7,AAV2/8,AAV2/9,AAV2.5,AAV8.2,和AAV/SASTG。
为了加快转基因表达,可使用自身互补的AAV(scAAV)变体。因为AAV依赖于细胞的DNA复制装置以合成AAV的单链DNA基因组的互补链,因此可延缓转基因表达。为了解决这种延缓,可使用包含能够在感染之后自发退火的互补序列的scAAV,从而消除进行宿主细胞DNA合成的需求。然而,还可使用单链AAV(ssAAV)载体。
为了增加包装容量,较长的转基因可在两个AAV转移质粒之间分离开,第一部分具有3’剪接供体并且第二部分具有5’剪接受体。在细胞的共感染之后,这些病毒形成串联体,被剪接在一起,并且可表达全长转基因。虽然这使得更长的转基因进行表达,但是表达不够有效。用于增加容量的类似的方法使用了同源重组。例如,可在两个转移质粒之间分开转基因,但是分开的转基因之间具有大量序列重叠,这样共表达诱导同源重组以及全长转基因的表达。
引入核酸和蛋白质还可通过脂质纳米颗粒(LNP)介导的递送来完成。例如,LNP介导的递送可用于递送RNA形式的向导RNA。通过这些方法进行的递送导致向导RNA的瞬时呈现并且生物可降解的脂质改善了清除率,改善了耐受性并降低了免疫原性。脂质制剂可保护生物分子不发生降解,而同时改善它们的细胞摄入。脂质纳米颗粒是包含多种彼此通过分子间作用力而物理相关联的脂质分子的颗粒。这些脂质纳米颗粒包括微球(包括单层和多层囊泡,例如,脂质体),分散相乳液,胶束或悬浮液中的内部相。这些脂质纳米颗粒可用于包裹一种或多种核酸或蛋白质用于递送。包含阳离子脂质的制剂可用于递送诸如核酸之类的聚阴离子。可包括的其他脂质是中性脂质(即,不带电荷的或两性脂质),阴离子脂质,提高转染的辅助脂质以及增加纳米颗粒在体内的存在时间长度的隐形脂质。合适的阳离子脂质,中性脂质,阴离子脂质,辅助脂质和隐形脂质的实例可在WO2016/010840A1中找到,其全部内容通过引用并入本文,用于所有目的。示例性的脂质纳米颗粒可包含阳离子脂质和一种或多种其他成分。在一个实例中,其他成分可包含诸如胆固醇之类的辅助脂质。在另一实例中,其他成分可包含诸如胆固醇之类的辅助脂质和诸如DSPC之类的中性脂质。在另一实例中,其他成分可包含诸如胆固醇之类的辅助脂质,诸如DSPC之类的任选的中性脂质,以及诸如S010,S024,S027,S031,或S033之类的隐形脂质(stealth lipid)。
LNP可包含下列成分中的一种或多种或者全部:(i)用于包裹和胞内逃逸的脂质;(ii)用于稳定的中性脂质;(iii)用于稳定的辅助脂质;以及(iv)隐形脂质。参见,例如,Finn等人,(2018)Cell Reports 22:1-9和WO 2017/173054 A1,其每一个的全部内容通过引用并入本文,用于所有目的。在一些LNP中,载体(cargo)可包括向导RNA或编码向导RNA的核酸。在一些LNP中,载体(cargo)可包括向导RNA或编码向导RNA的核酸以及外源供体核酸。
用于包裹和胞内逃逸的脂质可以是阳离子脂质。脂质还可以是生物可降解的脂质,例如,生物可降解的可电离的脂质。合适的脂质的一个实例是脂质A或LP01,其是(9Z,12Z)-3-((4,4-双(辛基氧)丁酰基)氧)-2-((((3-(二乙基氨基)丙氧基)羰基)氧)甲基)丙基十八烷-9,12-二烯酸酯,也称为3-((4,4-双(辛基氧)丁酰基)氧)-2-((((3-(二乙基氨基)丙氧基)羰基)氧)甲基)丙基(9Z,12Z)-十八烷-9,12-二烯酸酯。参见,例如,Finn等人,(2018)Cell Reports22:1-9和WO 2017/173054 A1,其每一个的全部内容通过引用并入本文,用于所有目的。合适的脂质的另一实例是脂质B,其是((5-((二甲基氨基)甲基)-1,3-亚苯基)双(氧))双(辛烷-8,1-二基)双(癸酸盐),也称为((5-((二甲基氨基)甲基)-1,3-亚苯基)双(氧))双(辛烷-8,1-二基)双(癸酸盐)。合适的脂质的另一实例是脂质C,其是2-((4-(((3-(二甲基氨基)丙氧基)羰基)氧)十六酰基)氧)丙烷-1,3-二基(9Z,9’Z,12Z,12’Z)-双(十八烷-9,12-二烯酸酯)。合适的脂质的另一实例是脂质D,其是3-(((3-(二甲基氨基)丙氧基)羰基)氧)-13-(辛酰基氧)十三烷基3-辛基十一酸酯。其他合适的脂质包括4-(N,N-二甲基胺基)丁酸-6,9,28,31-四烯-19-基4-(二甲基氨基)丁酸酯(heptatriaconta-6,9,28,31-tetraen-19-yl 4-(dimethylamino)butanoate,也称为Dlin-MC3-DMA(MC3))。
用于本文所述的LNP的一些这样的脂质是体内可生物降解的。例如,包含这种脂质的LNP包括其中至少75%的脂质在8小时内,10小时内,12小时内,24小时内或48小时内或者3天内,4天内,5天内,6天内,7天内或10天内从血浆中清除的那些LNP。作为另一实例,LNP中至少50%的脂质在8小时内,10小时内,12小时内,24小时内或48小时内或者3天内,4天内,5天内,6天内,7天内或10天内从血浆中清除。
这些脂质可以是基于其所在的培养基的pH可电离的。例如,在弱酸性培养基中,脂质可被质子化并且因此带有正电荷。相反,在弱碱性培养基中,例如,pH为约7.35的血液中,脂质可不被质子化,因此不带有电荷。在一些实施方式中,在pH为至少约9,9.5或10的条件下脂质可以被质子化。这样的脂质的带电荷的能力与其固有pKa相关。例如,脂质可独立地具有约5.8至约6.2的pKa。
中性脂质发挥稳定并改善LNP的加工的作用。合适的中性脂质的实例包括多种不同的中性的,不带电荷的或两性脂质。用于本文公开的内容中的中性磷脂的实例包括但不限于:5-十七烷基苯-1,3-二醇(间苯二酚),二棕榈酰基磷脂酰胆碱(DPPC),二硬脂酰基磷脂酰胆碱(DSPC),磷酰胆碱(DOPC),二肉豆蔻酰基磷脂酰胆碱(DMPC),磷脂酰胆碱(PLPC),1,2-二硬脂酰基-sn-甘油-3-磷酸胆碱(DAPC),磷脂酰乙醇胺(PE),卵黄磷脂酰胆碱(EPC),二月桂酰基磷脂酰胆碱(DLPC),二肉豆蔻酰基磷脂酰胆碱(DMPC),1-肉豆蔻酰基-2-棕榈酰基磷脂酰胆碱(MPPC),1-棕榈酰基-2-肉豆蔻酰基磷脂酰胆碱(PMPC),1-棕榈酰基-2-硬脂酰基磷脂酰胆碱(PSPC),1,2-二花生酰基-sn-甘油-3-磷酸胆碱(DBPC),1-硬脂酰基-2-棕榈酰基磷脂酰胆碱(SPPC),1,2-双二十碳烯酰基-sn-甘油-3-磷酸胆碱(DEPC),棕榈酰基油酰基磷脂酰胆碱(POPC),溶血磷脂酰胆碱,二油酰基磷脂酰乙醇胺(DOPE),二亚油酰基磷脂酰胆碱,二硬脂酰基磷脂酰乙醇胺(DSPE),二肉豆蔻酰基磷脂酰乙醇胺(DMPE),二棕榈酰基磷脂酰乙醇胺(DPPE),棕榈酰基油酰基磷脂酰乙醇胺(POPE),溶血磷脂酰乙醇胺以及它们的组合。例如,中性磷脂可选自二硬脂酰基磷脂酰胆碱(DSPC)和二肉豆蔻酰基磷脂酰乙醇胺(DMPE)。
辅助脂质包括提高转染的脂质。通过辅助脂质提高转染的机理可包括提高颗粒稳定性。在一些情况下,辅助脂质可提高膜融合性。辅助脂质包括类固醇,固醇以及烷基间苯二酚。合适的辅助脂质的实例包括胆固醇,5-十七烷基间苯二酚,以及胆固醇半琥珀酸酯。在一个实例中,辅助脂质可以是胆固醇或胆固醇半琥珀酸酯。
隐形脂质包括改变纳米颗粒可在体内存在的时间长度的脂质。隐形脂质可通过例如降低颗粒聚集以及控制颗粒尺寸有助于制剂的加工。隐形脂质可调节LNP的药代动力学。合适的隐形脂质包括具有连接至脂质基团的亲水头端的脂质。
隐形脂质的亲水头端基团可包括例如选自基于如下聚合物的聚合物基团:PEG(有时称为聚乙二醇),聚噁唑啉,聚乙烯醇,聚丙三醇,聚(N-乙烯吡咯烷酮),聚氨基酸,以及聚N-(2-羟丙基)甲基丙烯酰胺。术语PEG是指任何聚乙二醇或其他聚亚甲基醚聚合物。在一些LNP制剂中,PEG是PEG-2K,也称为PEG2000,其平均分子量为约2,000道尔顿。参见例如,WO2017/173054A1,其全部内容通过引用并入本文,用于所有目的。
隐形脂质的脂质基团可衍生自例如甘油二酯或二酰基甘酰胺,包括含有二烷基甘油或二烷基甘酰胺基团的那些,所述二烷基甘油或二烷基甘酰胺基团具有长度独立地为含有约C4至约C40饱和或不饱和碳原子的烷基链,其中,所述链可包含诸如酰胺或酯之类的一个或多个官能团。二烷基甘油或二烷基甘酰胺还可包含一个或多个取代的烷基。
作为一个实例,隐形脂质可选自:PEG-二月桂酰基甘油,PEG-二肉豆蔻酰基甘油(PEG-DMG),PEG-二棕榈酰基甘油,PEG-二硬脂酰基甘油(PEG-DSPE),PEG-二月桂基甘酰胺,PEG-二肉豆蔻基甘酰胺,PEG-二棕榈酰基甘酰胺,和PEG-二硬脂酰基甘酰胺,PEG-胆固醇(l-[8'-(胆甾-5-烯-3[β]-氧)甲酰胺-3',6'-二氧辛烷基]氨基甲酰-[Ω]-甲基-聚乙二醇,PEG-DMB(3,4-双十四氧苄基-[Ω]-甲基-聚乙二醇醚),1,2-二肉豆蔻酰基-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000](PEG2k-DMG),1,2-二硬脂酰基-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000](PEG2k-DSPE),1,2-二硬脂酰基-sn-甘油,甲氧基聚乙二醇(PEG2k-DSG),聚乙二醇-2000-二甲基丙烯酸酯(PEG2k-DMA),以及1,2-二硬酯基氧丙基-3-胺-N-[甲氧基(聚乙二醇)-2000](PEG2k-DSA)。在一种特定实例中,隐形脂质可以是PEG2k-DMG。
制剂中,LNP可包含不同摩尔比例的各个组分的脂质。CCD脂质的mol-%可以是例如约30mol-%至约60mol-%,约35mol-%至约55mol-%,约40mol-%至约50mol-%,约42mol-%至约47mol-%,或约45%。辅助脂质的mol-%可以为例如约30mol-%至约60mol-%,约35mol-%至约55mol-%,约40mol-%至约50mol-%,约41mol-%至约46mol-%,或约44mol-%。中性脂质的mol-%可以为例如约1mol-%至约20mol-%,约5mol-%至约15mol-%,约7mol-%至约12mol-%,或约9mol-%。隐形脂质的mol-%可以为例如约1mol-%至约10mol-%,约1mol-%至约5mol-%,约1mol-%至约3mol-%,约2mol-%,或约1mol-%。
LNP中生物可降解脂质(N)的带有正电荷的氨基基团与待包裹的核酸的带有负电荷的磷酸基团(P)之间可具有不同比例。这可在数学上由方程式N/P表示。例如,N/P比例可以为约0.5至约100,约1至约50,约1至约25,约1至约10,约1至约7,约3至约5,约4至约5,约4,约4.5或约5。
在一些LNP中,载体可包含外源供体核酸和gRNA。外源供体核酸和gRNA可具有不同比例。例如,LNP制剂可包括如下比例的外源供体核酸和gRNA核酸:约25:1至约1:25,约10:1至约1:10,约5:1至约1:5,或约1:1。可选地,LNP制剂可包括如下比例的外源供体核酸和gRNA核酸:约1:1至约1:5,约5:1至约1:1,约10:1,或约1:10。可选地,LNP制剂可包括如下比例的外源供体核酸和gRNA核酸:约1:10,25:1,10:1,5:1,3:1,1:1,1:3,1:5,1:10,或1:25。
合适的LNP的具体实例具有4.5的氮磷比(N/P)并且包含摩尔比为45:44:9:2的生物可降解的阳离子脂质,胆固醇,DSPC和PEG2k-DMG。生物可降解的阳离子脂质可以是(9Z,12Z)-3-((4,4-双(辛基氧)丁酰基)氧)-2-((((3-(二乙基氨基)丙基)羰基)氧)甲基)丙基十八碳-9,12-二烯酸酯,也称为3-((4,4-双(辛基氧)丁酰基)氧)-2-((((3-(二乙基氨基)丙基)羰基)氧)甲基)丙基(9Z,12Z)-十八碳-9,12-二烯酸酯。参见,例如,Finn等人,(2018)Cell Reports22:1-9,其全部内容通过引用并入本文,用于所有目的。合适的LNP的另一具体实例包含摩尔比为50:38.5:10:1.5的Din-MC3-DMA(MC3),胆固醇,DSPC,以及PEG-DMG。
可选择降低免疫原性的递送模式。例如,gRNA和外源供体核酸可通过不同的模式进行递送(例如,双模态递送)。这些不同的模式可赋予目标递送分子(例如,gRNA或编码gRNA的核酸,或外源供体核酸/修复模板)不同的药效学或药代动力学性质。例如,不同的模式可产生不同的组织分布,不同的半衰期或不同的时间分布。一些递送模式(例如,递送通过自体复制或基因组整合留存在细胞中的核酸载体)产生更持久的表达并且更加持久地存在于分子中,而其他递送模式是瞬时的并且不太持久(例如,递送RNA或蛋白质)。以更加瞬时的方式递送各个成分(例如RNA或蛋白质)可确保Cas/gRNA复合物仅仅存在较短的时间段并且仅在较短的时间段内具有活性并且可降低免疫原性。这些瞬时递送还可降低脱靶修饰的可能性。
体内给药可通过合适的途径进行,例如,肠胃外给药,静脉内给药,口服给药,皮下给药,动脉内给药,颅内给药,鞘内给药,腹膜内给药,局部给药,鼻内给药或肌肉内给药。全身给药模式包括例如:口服途径和肠胃外途径。肠胃外途径的实例包括静脉内途径,动脉内途径,骨内途径,肌肉内途径,皮内途径,皮下途径,鼻内途径和腹膜内途径。具体实例是静脉内输注。局部给药模式包括例如:鞘内途径,脑室内途径,脑实质内途径(例如,定位脑实质内递送至纹状体(例如,递送至尾状核内或硬膜内),大脑皮层,中央前回,海马体(例如,递送至齿状回或CA3区域),颞叶皮层,杏仁核,额叶皮层,丘脑,小脑,髓质,下丘脑,顶盖,被盖或黑质),眼内途径,框内途径,结膜下途径,玻璃体内途径,视网膜下途径和经虹膜途径。相比于全身给药(例如,静脉内给药)而言,明显较少量(与全身方式相比)的成分可在局部给药(例如,脑实质内给药或玻璃体内给药)时发挥作用。局部给药模式还可降低或消除当全身给药治疗有效量的成分时可能产生的潜在的毒副作用的发生率。
体内给药可通过任何合适的途径进行,包括例如:肠胃外途径,静脉内途径,口服途径,皮下途径,动脉内途径,颅内途径,鞘内途径,腹膜内途径,局部途径,鼻内途径,或者肌肉内途径。特定的实例是静脉内输注。鼻灌注和玻璃体内注射是其他具体实例。含有向导RNA(或编码向导RNA的核酸)的组合物可使用一种或多种生理学和药学上可接受的载体,稀释剂,赋形剂或助剂配制。剂型可依赖于所选择的给药途径。术语“药学上可接受的”是指载体,稀释剂,赋形剂或助剂与制剂的其他成分相容并且对制剂的接受者不会产生实质的有害作用。
给药频率和剂量次数可取决于外源供体核酸或向导RNA(或编码向导RNA的核酸)的半衰期,以及给药途径等等因素。将核酸或蛋白质引入细胞或非人类动物中可进行一次或在一段时间段内进行多次。例如,引入可在一段时间段内进行至少两次,至少三次,至少四次,至少五次,至少六次,至少七次,至少八次,至少九次,至少10次,至少11次,至少12次,至少13次,至少14次,至少15次,至少16次,至少17次,至少18次,至少19次或至少20次。
D.测量CRISPR/Cas的体内活性并且评价对目标基因组基因座的修饰
本文公开的方法可还包括评价目标基因组基因座的修饰。用于检测或测量表达或活性的方法将取决于被修饰的目标基因组基因座。
例如,如果目标基因组基因座包括编码RNA或蛋白质的基因,并且想要进行的修饰是改变编码的RNA或蛋白质的表达,那么,评价对目标基因组基因座的修饰的方法可包括测量编码的RNA或蛋白质的表达或活性。例如,如果编码的蛋白质是释放至血清的蛋白质,那么可测量编码的蛋白质的血清水平。测量RNA和蛋白质的水平和活性的分析方法是本领域熟知的。
可选地,本文公开的方法可还包括识别具有修饰的目标基因组基因座的细胞,在修饰的目标基因组基因座中,序列已通过非同源末端连接(例如,存在小的插入或删除(indels))进行修饰,随后通过CRISPR/Cas裂解序列,其中,位于两个向导RNA靶向序列之间的目标基因组基因座处的序列已被切除,或者,其中,目标基因组基因座已通过与外源供体核酸的重组而被修饰。可使用各种不同的方法识别具有靶定的基因组修饰的细胞。筛选可包括对亲本染色体的等位基因的修饰(MOA)进行评价的定量分析法。例如,所述定量分析法可通过定量PCR(例如,实时PCR(qPCR))进行。实时PCR可利用识别目标基因座的第一引物组和识别非目标参比基因座的第二引物组。引物组可包括识别扩增的序列的荧光探针。合适的定量分析法的其他实例包括荧光介导原位杂交(FISH),比较基因组杂交,等温DNA扩增,与固定化探针的定量杂交,
Figure BDA0003645747480000811
探针,
Figure BDA0003645747480000812
分子信标探针或ECLIPSETM探针技术(参见,例如,US 2005/0144655,其全部内容通过引用并入本文,用于所有目的)。
还可使用第二代测序(NGS)进行筛选。第二代测序还可被称为“NGS”或“大规模平行测序”或“高通量测序”。除了MOA分析方法之外,还可使用NGS作为筛选工具以定义靶定的基因修饰的确切本质以及整个细胞类型或组织类型或器官类型中靶定的基因修饰是否一致。
评价非人类动物体内的目标基因组基因座的修饰可在来自任何组织或器官的任何细胞类型中进行。例如,对目标基因组基因座的修饰可在来自相同组织或器官的多种细胞类型中进行或者可在来自组织或器官中的多种位置的细胞中进行。这可提供关于目标组织或器官中何种类型的细胞被修饰或CRISPR/Cas到达并修饰组织或器官的哪个部分的信息。作为另一实例,目标基因组基因座的修饰可在多种类型的组织或多种器官中进行评价。在靶定特定组织或器官的方法中,这可提供关于如何有效靶定组织或器官以及其他组织或器官中是否产生脱靶作用的信息。
在一些特定的实例中,Cas9就绪的非人类动物可用于评估各种不同的向导RNA的编辑速率。向导RNA可作为单个向导RNA(修饰的和未修饰的)或双倍体RNA被引入,或在U6启动子下被表达(例如,通过AAV)。Cas9就绪的非人类动物还可与包含人源化的等位基因的非人类动物表达向导RNA的非人类动物杂交,用于在疾病模型中进行评估。
IV.产生包含Cas表达盒和/或重组酶表达盒的非人类动物的方法
本文提供各种不同的方法产生包含本文其他地方公开的Cas表达盒和重组酶表达盒中的一种或多种或全部的非人类动物。用于产生遗传修饰的生物体的任何方便的方法或操作规程适于产生这种遗传修饰的非人类动物。参见,例如,Cho等人,(2009)CurrentProtocols in Cell Biology42:19.11:19.11.1–19.11.22和Gama Sosa等人,(2010)BrainStruct.Funct.214(2-3):91-109,其每一个的全部内容通过引用并入本文,用于所有目的。这些遗传修饰的非人类动物可通过例如在靶定基因座(例如,诸如Rosa26之类的安全港基因座)敲入基因或通过使用随机整合的转基因产生。参见,例如,WO 2014/093622和WO2013/176772,其每一个的全部内容通过引用并入本文,用于所有目的。将构建体靶定至Rosa26基因座的方法例如在US 2012/0017290,US 2011/0265198,和US 2013/0236946(其每一个的全部内容通过引用并入本文,用于所有目的)中描述。
例如,产生包含本文其他地方描述的Cas表达盒和重组酶表达盒中的一种或多种或全部的非人类动物的方法可包括:(1)修饰多能细胞的基因组以包含Cas表达盒和重组酶表达盒中的一种或多种或全部;(2)识别或选择包含Cas表达盒和重组酶表达盒中的一种或多种或全部的遗传修饰的多能细胞;(3)将所述遗传修饰的多能细胞引入非人类动物宿主胚胎;以及(4)将所述宿主胚胎植入代孕母体并在代孕母体内孕育。任选地,可孵育包含修饰的多能细胞(例如,非人类ES细胞)的宿主胚胎直至囊胚阶段,随后将其植入代孕母体并在代孕母体中孕育以产生F0非人类动物。随后代孕母体可产生包含Cas表达盒和重组酶表达盒中的一种或多种或全部的F0代非人类动物。
所述方法可进一步包括识别具有修饰的目标基因组基因座的细胞或动物。可使用各种不同的方法识别具有靶定的基因组修饰的细胞和动物。
筛选步骤可包括例如:评价亲代染色体的等位基因修饰(MOA)的定量分析方法。例如,定量分析方法可通过定量PCR(例如,实时PCR(qPCR))进行。实时PCR可使用识别目标基因座的第一引物组和识别非目标参比基因座的第二引物组。引物组可包括识别扩增的序列的荧光探针。
合适的定量分析方法的其他实例包括荧光原位杂交(FISH),比较基因组杂交,等温DNA扩增,与固定化探针的定量杂交,
Figure BDA0003645747480000831
探针,
Figure BDA0003645747480000832
分子信标探针,或ECLIPSETM探针技术(参见,例如,US 2005/0144655,其全部内容通过引用并入本文,用于所有目的)。
合适的多能细胞的实例是胚胎干(ES)细胞(例如,小鼠ES细胞或大鼠ES细胞)。修饰的多能细胞可例如通过如下步骤产生:(a)向细胞内引入包含插入体核酸的一个或多个靶向载体,其中,所述插入体核酸的侧面具有与5’和3’靶向位点对应的5’和3’同源臂,其中,所述插入体核酸包含Cas表达盒和重组酶表达盒中的一种或多种或全部;以及(b)识别在其基因组中包含整合在目标基因组基因座处的插入体核酸的至少一个细胞。可选地,修饰的多能细胞可通过如下步骤产生:(a)向细胞中引入(i)核酸酶试剂,其中,所述核酸酶试剂诱导目标基因组基因座内的目标序列处产生切口或双链断裂;和(ii)包含插入体核酸的一个或多个靶向载体,所述插入体核酸的侧面具有与5’和3’目标位点对应的5’和3’同源臂,所述5’和3’目标位点位于足够靠近目标序列的位置,其中,插入体核酸包括Cas表达盒和重组酶表达盒中的一种或多种或全部;和(c)识别包含位于目标基因组基因座处的修饰(例如,整合插入体核酸)的至少一个细胞。可使用诱导切口或双链断裂产生期望的目标序列的任何核酸酶试剂。合适的核酸酶的实例包括类转录活化因子核酸酶(TALEN),锌指核酸酶(ZFN),大范围核酸酶以及成簇的规律间隔的短回文重复序列(CRISPR)/CRISPR-相关(Cas)系统或这些系统的成分(例如,CRISPR/Cas9)。参见,例如,US 2013/0309670和US2015/0159175,其每一个的全部内容通过引用并入本文,用于所有目的。
供体细胞可在任何阶段引入至宿主胚胎,例如,囊胚阶段或前桑葚胚(pre-morula)阶段(即,四细胞阶段或八细胞阶段)。产生能够通过胚系遗传基因修饰的后代。参见,例如,美国专利US7,294,754,其全部内容通过引用并入本文,用于所有目的。
可选地,产生本文其他地方描述的非人类动物的方法可包括:(1)使用上文所述的用于修饰多能细胞的方法修饰单细胞期胚胎的基因组以包括Cas表达盒和重组酶表达盒中的一种或多种或全部;(2)选择遗传修饰的胚胎;以及(3)将遗传修饰的胚胎植入代孕母体并在代孕母体中进行孕育。产生能够通过胚系遗传基因修饰的后代。
细胞核转移技术还可用于产生非人类哺乳动物。简言之,细胞核转移的方法可包括如下步骤:(1)从卵细胞中除去细胞核或提供除去细胞核的卵细胞;(2)分离或提供待与除去细胞核的卵细胞结合的供体细胞或细胞核;(3)将细胞或细胞核插入除去细胞核的卵细胞以形成重新构成的细胞;(4)将重新构成的细胞植入动物的子宫以形成胚胎;以及(5)使胚胎发育。在这些方法中,卵细胞通常提取自死亡的动物,虽然它们也可分离自活体动物的输卵管和/或卵巢。卵细胞可在多种熟知的培养基中发育成熟,随后除去细胞核。除去卵细胞的细胞核可以多种熟知的方式进行。将供体细胞或细胞核插入除去细胞核的卵细胞以形成重新构成的细胞可通过在透明带下进行供体细胞的显微注射随后进行融合来完成。融合可通过在接触/融合平面上施加DC电脉冲来诱导(电融合),通过使细胞暴露于融合促进化学试剂(例如,聚乙二醇)来诱导,或通过使诸如仙台病毒(Sendai virus)之类的病毒失活来诱导。可在细胞核供体和受体卵细胞的融合之前,过程中和/或之后通过电学方式和/或非电学方式活化重新构成的细胞。活化方法包括电脉冲,化学诱导休克,精子穿透,增加卵细胞中的二价阳离子的水平,以及降低卵细胞中细胞蛋白质的磷酸化作用(通过激酶抑制剂的方式)。活化的重新构成的细胞或胚胎可在熟知的培养基中培养并随后转移至动物的子宫。参见,例如,US 2008/0092249,WO 1999/005266,US 2004/0177390,WO 2008/017234,和美国专利US7,612,250,其每一个的全部内容通过引用并入本文,用于所有目的。
本文提供的各种不同的方法能够产生基因修饰的非人类F0动物,其中,基因修饰的F0动物的细胞包括Cas表达盒和重组酶表达盒中的一种或多种或全部。基于用于产生F0动物的方法,能够发现F0动物体内具有Cas表达盒和重组酶表达盒中的一种或多种或全部的细胞的数量将会发生改变。通过例如
Figure BDA0003645747480000851
方法将供体ES细胞引入来自相应的生物体(例如,8细胞阶段小鼠胚胎)的前桑葚阶段胚胎能够产生更高百分比的F0动物的细胞群,从而包括具有目标核苷酸序列的细胞,所述目标核苷酸序列包含靶定的基因修饰。例如,非人类F0动物的至少50%,60%,65%,70%,75%,85%,86%,87%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或100%的细胞分布可包含具有靶定的修饰的细胞群。
基因修饰的F0动物的细胞可以是对于Cas表达盒和重组酶表达盒中的一种或多种或全部而言的杂合的或可以是对于Cas表达盒和重组酶表达盒中的一种或多种或全部而言的纯合的。
上文或下文记载的所有专利的提交文件,网页内容,其他公开出版物,登录号等等的全部内容通过引用并入本文用于所有目的,这与将专利的提交文件,网页内容,其他公开出版物,登录号等等中的每一个单独地且特别地通过引用并入本文的程度相同。如果序列的不同版本与不同时间的登录号相关,那么意味着版本与本申请的有效提交日期的登录号相关。有效提交日期是指早于实际提交日期或涉及登录号的优先权申请(如果有的话)的提交日期。同样,如果不同版本的公开出版物、网页等在不同的时间公开,那么,除非另有说明,是指与申请的有效提交日期最近的日期公开的版本。除非另有明确说明,本发明的任何特征、步骤、元素、实施方式或方面可与任何其他联合使用。虽然本发明已通过举例说明和实例的方式进行了一些详细描述为了明确和理解本发明,但是明显的是,可在所附的权利要求的范围内做出一些改变和修饰。
对序列的简要描述
所附的序列表中列出的核苷酸和氨基酸序列显示为使用标准字母缩写用于核苷酸碱基以及三字母编码用于氨基酸。核苷酸序列遵循在序列的5’端开始并且正向书写至3’端(即,每一行从左至右)的标准惯例。仅显示了每个核苷酸序列的一个链,但是可被理解的是通过参考所显示的链互补链也包括在本文内。当提供编码氨基酸序列的核苷酸序列时,应当理解的是,还提供了编码相同氨基酸的密码子简并变体。氨基酸序列遵循在序列的氨基末端开始并正向书写至羧基末端(即,每一行从左至右)的标准惯例。
表3.对序列的描述
Figure BDA0003645747480000861
Figure BDA0003645747480000871
Figure BDA0003645747480000881
实施例
实施例1.Cas9就绪的小鼠的验证
CRISPR/Cas9(一种RNA向导的DNA核酸内切酶)催化DNA在其RNA向导的结合位点产生双链断裂(DSB)。示例性的RNA向导可由与87-核苷酸反式激活RNA(tracrRNA)连接的42-核苷酸CRISPR RNA(crRNA)构成。tracrRNA与crRNA互补并且与crRNA碱基配对,形成功能性crRNA/tracrRNA向导。这种双倍体RNA与Cas9蛋白质结合以形成活性核糖核蛋白(RNP),其可识别与crRNA的20-核苷酸向导部分具有互补性的基因组。链断裂的第二要求在于Cas9蛋白质必须识别与crRNA的向导部分(crRNA靶向序列)互补的序列直接相邻的前间区序列邻近基序(PAM)。可选地,活性RNP复合物还可通过使用单个向导RNA(sgRNA)取代crRNA/tracrRNA双倍体形成,单个向导RNA(sgRNA)通过共价连接crRNA和tracrRNA形成。例如,这样的sgRNA可通过将crRNA的20核苷酸向导部分与加工过的tracrRNA序列直接融合而形成。sgRNA可以相同的方式与Cas9蛋白质和DNA这两者发生相互作用并且产生与crRNA/tracrRNA双倍体类似的效率。CRISPR细菌天然防御机制已表现出在哺乳动物细胞内有效发挥作用并且激活断裂诱导的内源修复通路。当在基因组中发生双链断裂时,修复通路将会通过经典途径或可选的非同源末端连接(NHEJ)途径或同源重组(也称为同源定向修复(HDR))尝试修复DNA,如果有合适的模板的话。我们可利用这些途径促进哺乳动物细胞内基因组区域的位点特异性删除或外源DNA的插入或HDR。
CRISPR/Cas9系统是一种强有力的基因组工程化工具。然而,对该体系的体内使用的一个限制在于需要同时将所有成分引入至活体生物体中。将这些成分引入至细胞中的典型方法是将DNA构建体瞬时转染至将会产生合适的RNA和蛋白质的细胞中。虽然这种方法非常有效,但是该方法具有固有缺陷,这是因为细胞必须依赖质粒DNA构建体先经过转录随后进行翻译,随后使Cas9蛋白质与sgRNA成分发生相互作用。我们认为Cas9诱导的突变频率和重组频率可通过具有组成性可获得的蛋白质得到极大改善。
野生型Cas9编码序列(CDS)是被优化用于在小鼠中表达的密码子。随后合并了N-末端单组分细胞核定位(NLS)信号,C-末端双组分NLS和C末端P2A连接的GFP荧光报告体。Cas9表达盒(MAID2599)在图1和图14以及SEQ ID NO:1中描述。P2A-GFP可用于更好地跟踪Cas9的体内表达。这些成分连同先前液氧混合(floxed)的新霉素耐药盒(neo盒)和合适的剪接信号以及较强的聚腺苷酸化(polyA)信号被工程化至小鼠基因组的Rosa26基因座的第一内含子中。Cas9表达盒中的成分在5’至3’方向上在表4中显示,并且在除去液氧混合的新霉素盒之后的Cas9等位基因的各个成分在表5中显示。由等位基因编码的Cas9-P2A-eGFP蛋白质序列在SEQ ID NO:13中列出。
表4.MAID2599 Cas9等位基因中的各个成分
Figure BDA0003645747480000901
表5.MAID2600 Cas9等位基因的各个成分
成分 SEQ ID NO:12中的核苷酸区域
小鼠Rosa26上游序列 1-170
LoxP位点 300-333
Kozak序列 382-391
密码子-被优化的Cas9编码序列 388-4560
N-末端单组分NLS 397-417
C-末端双组分NLS 4513-4560
P2A编码序列 4561-4626
eGFP编码序列 4627-5340
土拨鼠肝炎病毒转录后调节性元件(WPRE) 5390-5986
牛生长激素聚腺苷酸化信号(bGH polyA) 5987-6202
小鼠Rosa26下游序列 6262-6411
在通过Cre重组酶的作用除去盒之后,新霉素耐药基因通常被有效转录和翻译;然而,Cas9 CDS通常不会由于存在强poly(A)区域而被表达,这可有效阻断贯通转录(run-through transcription)。在通过Cre重组酶的作用除去neo盒之后,Cas9和GFP蛋白质的杂交mRNA通常会通过Rosa26启动子被组成性表达。在除去neo盒之前和之后靶定的细胞通过等位基因缺失筛选首次被检验到,从而检测靶向载体在Rosa26基因座处的单个位点特异性整合。Cas9和GFP的表达通过从靶定的mESC中提取总RNA来验证,随后通过逆转录以产生cDNA和
Figure BDA0003645747480000911
qPCR,从而检测逆转录的cDNA(RT-qPCR)。总之,所产生的系统能够在mESC和从其衍生得到的小鼠中连续或条件性地表达(需要除去新霉素耐药盒)一致水平的Cas9蛋白质。
另一版本被设计为不带有P2A-eGFP(MAID2660)。参见图14。Cas9表达盒中5’至3’的方向上的各个成分在表6中显示,并且除去液氧混合的新霉素盒的Cas9等位基因的各个成分在表7中显示。由等位基因编码的Cas9蛋白质序列在SEQ ID NO:19中列出。
表6.MAID2660 Cas9等位基因的成分
Figure BDA0003645747480000921
表7.MAID2661 Cas9等位基因的成分
成分 SEQ ID NO:18中的核苷酸区域
小鼠Rosa26上游序列 1-170
LoxP位点 300-333
Kozak序列 382-391
密码子-被优化的Cas9编码序列 388-4560
N-末端单组分NLS 397-417
C-末端双组分NLS 4513-4560
牛生长激素聚腺苷酸化信号(bGH polyA) 4566-4781
小鼠Rosa26下游序列 4841-4990
此外,设计了带有外源CAGG启动子和3xFLAG标签序列的两个版本。第一版本包括P2A-eGFP(MAID2658),并且第二版本被设计为不带有P2A-eGFP(MAID2672)。参见图14。CAGG-Cas9表达盒的第一版本的在5’至3’方向上的各个成分在表8中显示,并且除去液氧混合的新霉素盒之后的CAGG-Cas9等位基因的第一版本的各个成分在表9中显示。由该等位基因编码的3xFLAG-Cas9-P2A-eGFP蛋白质序列在SEQ ID NO:16中列出。CAGG-Cas9表达盒的第二版本的在5’至3’方向上的各个成分在表10中显示,并且除去了液氧混合的新霉素盒之后的CAGG-Cas9等位基因的第二版本的各个成分在表11中显示。由该等位基因编码的3xFLAG-Cas9蛋白质序列在SEQ ID NO:22中列出。
表8.MAID2658 Cas9等位基因的成分
Figure BDA0003645747480000931
表9.MAID2659 Cas9等位基因的成分
Figure BDA0003645747480000941
表10.MAID2672 Cas9等位基因的成分
Figure BDA0003645747480000942
表11.MAID2673 Cas9等位基因的成分
Figure BDA0003645747480000951
为了验证MAID2599/MAID2600系统,使用靶定第一目标基因的起始密码子区域和终止密码子区域的两个sgRNA转染带有新霉素盒和不带有新霉素盒的Cas9 mESC(分别为MAID2599和MAID2600)。参见图2A。随后通过等位基因缺失筛选分析Cas9裂解效率以评价gRNA-靶定的Cas9裂解位点中具有插入删除突变的mESC克隆的比例。还确定了一个或两个目标等位基因上Cas9裂解位点之间的DNA被删除(导致无效突变)的mESC克隆的比例。Cas9能够仅在新霉素盒和poly(A)(终止序列)被除去(MAID2600)时诱导基因组改变。为了更好地评价有关同源定向修复的基因组编辑的能力,引入靶向第二目标基因的sgRNA以及作为点突变供体的单链寡脱氧核苷酸(ssODN)。参见图2B。本文描述的组成性Cas9表达系统与通过质粒和ssODN引入Cas9和sgRNA的传统方法进行比较。当与表达sgRNA的质粒合并时,本文描述的Cas9表达系统能够活化断裂诱导的内源修复通路,从而以与通过外源质粒表达Cas9和sgRNA时的频率相同的频率合并期望的点突变。然而,当本文所述的Cas9表达系统与直接递送的sgRNA合并时,本文所述的Cas9系统以接近质粒递送方法的效率的两倍的效率诱导同源定向插入突变形成。
为了确定活体小鼠中内源表达的Cas9的有效性,使用
Figure BDA0003645747480000961
方法将这些靶定的mESC显微注射至8细胞小鼠胚胎中。参见,例如,US 7,576,259;US 7,659,442;US 7,294,754;US 2008/007800;以及Poueymirou等人,(2007)Nature Biotech.25(1):91-99,其每一个的全部内容通过引用并入本文,用于所有目的。具体而言,在透明带中建立小孔以促进靶定的mESC的注射。这些被注射的8-细胞胚胎被转移至代孕母体以产生带有转基因的活体幼崽。在代孕母体的妊娠期之后,被注射的胚胎产生F0小鼠,其不带有可检测的宿主胚胎分布。完全ES细胞衍生的小鼠是正常的、健康的且有生育能力的(带有种系遗传)。从盒删除的F0小鼠(MAID2600)中收获组织用于GFP可视化,Cas9 mRNA表达和Cas9蛋白质的表达。参见图3A至图3F(亮视场和GFP可视化)以及图4A至图4C(图4A和图4C:Cas9 mRNA的表达,图4B:蛋白质的表达)。图3D显示了杂合的Rosa26Cas9小鼠(MAID2600)中的eGFP表达,但是缺少相应的eGFP在野生型小鼠的肝脏中的表达,图3E显示杂合的Rosa26 Cas9小鼠中的eGFP的表达,但是缺少相应的eGFP在野生型小鼠的肾脏中的表达,图3F显示了杂合的Rosa26 Cas9小鼠中eGFP的表达,但是缺少相应的eGFP在野生型小鼠的脑部的表达。同样,如RT-qPCR所分析的,Cas9 mRNA的表达在杂合的Rosa26 Cas9小鼠的脑部、心脏、肾脏、肝脏、肺、四头肌、脾脏和胸腺中观察到,但是在野生型小鼠的相应的组织中没有观察到Cas9mRNA的表达。参见图4A和图4C。在实验中,通过RT-qPCR分析来自每种组织的等质量的RNA。数据显示Cas9就绪的小鼠在所有组织中以易于检测的水平表达Cas9 mRNA。从Cas9就绪的小鼠中收获各种不同的组织。从十四个小鼠中收获三种组织并且从四个小鼠中收获额外五种组织以评价小鼠之间的差异以及小鼠中各个组织之间的差异。这些组织中的每一种具有提取的RNA。基因组DNA被降解,这样其不算作qPCR反应。RNA被逆转录并且随后将对Cas9具有特异性的分析方法用于检测Cas9转录体。如所预期的,Cas9小鼠表现出显著表达(ct值低于30),而WT小鼠显示出30以及更高的ct值,这说明Cas9蛋白质没有产生内源表达。
类似地,使用1:250稀释度的ThermoFisher Cas9抗体MA5-23519以及作为对照的肌动蛋白通过western印迹确定的Cas9蛋白质的表达表明Cas9蛋白质在杂合的Rosa26Cas9小鼠(MAID2600)的脾脏、肝脏和脑部中表达,而在野生型小鼠的相同组织中没有观察到Cas9蛋白质。参见图4B。所有三种测试说明在所有被分析的组织中表达水平一致。
通过脂质纳米颗粒(LNP)递送将sgRNA引入至分离自盒删除的Cas9小鼠(MAID2600)的初级肝细胞而进行目标基因3(其编码由肝脏分泌的且在血清中发现的蛋白质)敲除的实验。参见图5B。作为对照,通过在分离自野生型(WT)小鼠的初级肝细胞中表达外源Cas9匹配地进行相同方法引入sgRNA。参见图5A。通过第二代测序(NGS)评价非同源末端连接以测量在目标基因3基因座处的插入/缺失(indel)频率。在实验中使用三种条件:(1)LNP介导的GFP mRNA和对照(即,dead)sg RNA的递送,(2)LNP介导的GFP mRNA和目标基因3sgRNA的递送,以及(3)LNP介导的Cas9 mRNA和目标基因3sgRNA的递送。对于每种条件而言,测试了四种浓度的mRNA:15.6ng/mL,62.5ng/mL,250ng/mL,和1000ng/mL。在野生型初级小鼠肝细胞中,仅在引入Cas9 mRNA和目标基因3sgRNA这两者时观察到插入/缺失频率的剂量依赖性增加。相反,在Cas9就绪的初级小鼠肝细胞中,在引入目标基因3向导RNA和对照GFP mRNA而非Cas9mRNA时观察到类似的剂量依赖作用,并且插入/缺失频率的水平基本与还引入了Cas9 mRNA时所观察到的水平相等。
通过流体动力学DNA递送(HDD),脂质纳米颗粒(LNP)递送,或通过尾静脉注射引入带有sgRNA表达序列的腺相关病毒(AAV)将sgRNA引入至盒删除的Cas9小鼠(MAID2600)而进行体内敲除目标基因3的实验。参见图6A至图6D。作为对照,通过在野生型(WT)小鼠中表达外源Cas9匹配地进行相同的方法引入sgRNA。对于LNP介导的递送而言,测试了如下三组小鼠:(1)Cas9就绪的小鼠(3雄性+3雌性;2mg/kg对照sgRNA+GFP mRNA);(2)Cas9就绪的小鼠(3雄性+3雌性;用于目标基因3的2mg/kg sgRNA+GFP mRNA);以及(3)WT小鼠(3雄性+3雌性;用于目标基因3的2mg/kg sgRNA+Cas9 mRNA)。对于AAV-介导的递送而言,测了如下两组小鼠:(1)Cas9就绪的小鼠(3雄性+3雌性;用于目标基因3的AAV8-sgRNA);以及(2)WT小鼠(3雄性+3雌性;用于目标基因3的AAV8-sgRNA+AAV8-Cas9)。对于HDD而言,测试了如下两组小鼠:(1)Cas9就绪的小鼠(3雄性+3雌性;用于目标基因3的sgRNA);以及(2)WT小鼠(3雄性+3雌性;用于目标基因3的sgRNA+Cas9)。Cas9就绪的小鼠一致地且明显地具有比带有外源Cas9表达的WT小鼠更多的靶定基因的失活。
令人惊讶的是,AAV8介导的将目标基因3sgRNA递送至Cas9就绪的小鼠(MAID2600)比在靶定的肝脏目标基因3处的LNP介导的递送或HDD更加有效。参见图6A至图6D。此外,AAV8介导的将目标基因3sgRNA递送至Cas9就绪的小鼠比AAV8介导的将目标基因3sgRNA和Cas9这两者递送至WT小鼠更加有效,而在使用LNP-介导的递送或使用HDD的条件下并未观察到这两者之间具有明显差异。参见图6A至图6D。这些结果表明AAV-介导的将向导RNA递送至Cas9就绪的小鼠对于体内测定gRNA活性而言是特别有效的方式。在引入CRISPR/Cas成分之后第7天和第21天测量了雌性和雄性小鼠中的由目标基因3编码的蛋白质(即,目标蛋白质3)的血清水平。所测试的小鼠包括Cas9就绪的小鼠和野生型小鼠。对照包括既未引入Cas9也未引入目标基因3sgRNA的Cas9就绪的小鼠和WT小鼠。流体力学递送向导RNA或Cas9和向导RNA的组合并未以相对于其中既未引入Cas9也未引入向导RNA的对照WT小鼠更加明显的方式降低目标蛋白质3的血清水平。对于LNP介导的递送而言,将sgRNA引入至Cas9就绪的小鼠产生与其中引入了Cas9和sgRNA这两者的WT小鼠类似的目标蛋白质血清水平,并且,这些条件中的每一个相比于其中既未引入Cas9也未引入向导RNA的Cas9就绪的对照小鼠使得目标蛋白质3的血清水平降低约50%。然而,对于AAV8-介导的递送,将sgRNA递送至Cas9就绪的小鼠使得目标蛋白质3的血清水平相比于引入了Cas9和sgRNA这两者的WT小鼠降低了七倍,甚至使得相比于既未引入Cas9也未引入向导RNA的对照WT小鼠产生更加显著的目标蛋白质3血清水平的降低。21天后,通过AAV8引入了sgRNA的Cas9就绪的小鼠中,目标蛋白质3的血清水平下降至接近检测限。
图7显示了在脂质纳米颗粒(LNP)仅递送sgRNA或递送sgRNA和Cas9 mRNA,流体动力学(HDD)仅递送sgRNA质粒或sgRNA质粒和Cas9质粒,或AAV8仅递送sgRNA或递送sgRNA和Cas9之后一个月野生型小鼠和盒删除的Cas9小鼠(MAID2600)的肝脏中目标基因3基因座处的NHEJ活性百分比(添加/缺失频率)。通过NGS测量了基因座处带有插入/缺失(indel)的肝细胞的百分比。向导RNA或Cas9和向导RNA的组合的流体动力学递送产生较低的indel百分比。对于LNP-介导的递送而言,将sgRNA引入至Cas9就绪的小鼠产生与其中引入了Cas9和sgRNA这两者的WT小鼠类似的indel百分比,并且这些条件中的每一种产生约40%的indel百分比水平。然而,对于AAV8-介导的递送而言,将sgRNA递送至Cas9就绪的小鼠产生比其中引入了Cas9和sgRNA这两者的WT小鼠(约35%)大得多的indel(约75%)百分比,甚至产生比其中既未引入Cas9也未引入向导RNA的对照WT小鼠更加显著增加的indel百分比。
在收获的组织中还进行了第二代测序(NGS)。扩增子测序随后用于评价收获的组织中的编辑数量。特定的目标引物被设计为产生约300bp的产物,其略微偏离了围绕向导的预期切割位点的中心。引物具有添加至其中的“适体”序列,所述“适体”序列使得单个样品在次级PCR反应中带有条码。一旦添加了条码,样品被全部放在一起并且加载至MiSeq。在目标区域上预期进行五千次至一万次读取。随后运行带有信息的程序以对读取结果进行绘图,从而确定每个编辑的精确序列。随后,程序对WT(未编辑)读取结果进行计数并且提供对所有已编辑的读取结果进行的编辑类型的分类(评价在预期的编辑区域进行碱基对的添加和/或删除的数目)。
通过将带有靶定目标基因4的外显子2的sgRNA的Cas9引入至分离自野生型(WT)小鼠的初级肝细胞进行敲除目标基因4(其编码II型膜结合糖蛋白)的实验。测试了五种不同的sgRNA(向导1-5)。通过脂质体将Cas9/sgRAN核糖核蛋白(RNP)复合物引入至细胞中。随后通过第二代测序(NGS)评价非同源末端连接,从而测量在目标基因4基因座处的indel频率。编辑百分比是总NHEJ事件相对于总读取结果的测量值。NHEJ事件被认为是在切割位点前后20bp中发生的所有编辑(插入,删除,碱基改变)。向导1-5的编辑百分比如下:35.4%,37.4%,43.8%,51.2%,和55.8%(数据未显示)。
通过AAV8将相同的五种sgRNA引入至不同的盒删除的Cas9小鼠(MAID2600)进行目标基因4的体内敲除实验。具体而言,将由U6启动子表达的各个向导包装在AAV8中并通过尾静脉注射将其引入至6至12周龄的盒删除的Cas9小鼠中。引入的病毒载量为1x 1011至1x1012,体积大约为50-100μL。注射后3至4周收获肝脏。编辑百分比被计算为初级肝细胞中的编辑百分比并且在图8A中显示。编辑水平与初级肝细胞中观察到的编辑水平一致并且事实上更高。还测试了自目标基因4转录的mRNA的表达水平。如图8B所示,每种gRNA降低了注射后3至4周收获的肝脏中的目标基因4转录的mRNA的相对水平。
还进行了测试肝脏中若干种其他目标基因中的编辑百分比的实验。在每种实验中,小鼠的年龄为约6至12周。对于每种目标基因而言,针对关键外显子设计了五种不同的向导RNA。通过尾静脉注射由体积为约50-100μL病毒载量为1x1011至1x1012的AAV8递送向导RNA。注射后3至4周收获肝脏。如前所述测定编辑百分比。表12中显示了通过AAV8-gRNA的递送在盒删除的Cas9小鼠(MAID2600)的肝脏中的编辑百分比。每种基因的最佳gRNA在肝脏中产生48%至70%的体内编辑。
表12.肝脏中的编辑百分比
目标基因 向导#1 向导#2 向导#3 向导#4 向导#5
5 49.4% 37.1% 43.3% 21.3% 35.7%
6 25.6% 68.9% 44.8% 63.3% 42.1%
7 43.5% 36.1% 30.0% 48.2% 41.4%
8 24.5% 35.2% 66.1% 56.3% 45.5%
9 27.8% 32.7% 47.4% 65.0% 38.9%
4 52.3% 58.8% 63.6% 57.0% 61.5%
实施例2.Cas9就绪的小鼠的可诱导性的验证
实施例1中描述的LSL-Cas9等位基因(MAID2599)包括Cas9编码序列的上游的液氧混合的强poly(A)区域(lox-stop-lox,或LSL)。在通过Cre重组酶作用除去盒之前,新霉素耐药基因通常被有效地转录和翻译;然而,Cas9 CDS由于存在强poly(A)区域而不会正常地表达,这可有效阻断贯通转录。在通过Cre重组酶的作用除去neo盒之后,Cas9和GFP蛋白质的杂交mRNA通常被Rosa26启动子组成性表达。这使得Cas9等位基因是可诱导的。出于以下原因这是有益的。编辑某些组织(例如,免疫细胞)中的一些基因可能是有害的,这会潜在地引起免疫反应。此外,在一些情况下,靶定的个体整体上进行基因突变可能是致死性的,而在特定组织或细胞类型中的基因突变会是有益的。MAID2599等位基因的可诱导的本质对通过组织特异性或细胞特异性方式仅活化Cas9而编辑的组织和细胞类型具有更高的特异性。
为了测试Cas9的表达在肝脏中的体内可诱导性,在Precision NanosystemsBenchtop NanoAssmblr上配制了含有Cre重组酶mRNA的脂质纳米颗粒(LNP)。将来自Trilink的Cre mRNA(批号#7211)在10mM柠檬酸钠中进行稀释并且以3:1的比例通过NanoAssemblr盒与摩尔比为50:10:38.5:1.5的阳离子脂质,DSPC,胆固醇和PEG-DMG的脂质组合进行混合。该制剂易于被肝脏吸收。得到的LNP-Cre以1mg/kg的量通过LSL-Cas9小鼠(MAID2599)的尾静脉进行注射。在对照小鼠中,未注射LNP-Cre。1周后,宰杀小鼠并且收获器官用于western分析(其使用抗-Cas9(7A9)单克隆抗体(Invitrogen Cat#MA5-23519)和抗-肌动蛋白(C4)单克隆抗体(Millipore Sigma Cat#MAB1501))。来自盒删除的Cas9小鼠(MAID2600)的器官用作阳性对照。在这些小鼠中,已通过Cre重组酶删除了LSL盒。结果在图9中显示,其显示了通过用于肝脏特异性基因编辑的LNP-Cre递送对肝脏特异性Cas9活化的概念验证。
随后体内测试了Cas9介导的基因编辑的可诱导性。LNP-Cre如上所述的进行配制。向如下几组小鼠给药LNP-Cre和AAV8-gRNA靶定的目标基因3(通过尾静脉注射进行共注射):(1)由LNP-Cre和AAV8-gRNA处理的3LSL-Cas9小鼠;(2)由LNP-Cre和PBS处理的3LSL-Cas9小鼠;(3)由PBS和AAV8-gRNA处理的3LSL-Cas9小鼠;(4)仅由PBS处理的3LSL-Cas9小鼠;(5)由LNP-Cre处理的3盒删除的Cas9小鼠;(6)由AAV8-gRNA处理的3盒删除的Cas9小鼠;(7)由PBS处理的3盒删除的Cas9小鼠;以及(8)3WT小鼠(未处理的)。在递送了LNP-Cre的组中,以1mg/kg的浓度递送LNP-Cre。在递送AAV8-gRNA的组中,以约2x 1011的病毒载量递送AAV8-gRNA。注射后1周和3周,给小鼠抽血用于血清化学测试并且测量目标蛋白质3的循环血清水平。在第三周,还收获组织用于NGS和western分析。通过ELISA测量目标蛋白质3的血清水平。结果在图10中显示。递送LNP-Cre以及AAV8-gRNA至LSL-Cas9小鼠产生目标蛋白质3的血清水平的降低,这与在递送了AAV8-gRNA的盒删除的Cas9小鼠中所观察到的降低一致。这些ELISA结果与注射后3周的小鼠中分离的肝脏中的目标基因3的编辑百分比的NGS结果一致。参见图11。
接着,使LSL-Cas9小鼠与来自Jax(3601-Tg(Alb-cre)21Mgn;MAID3601)的白蛋白-Cre小鼠杂交,在白蛋白-Cre小鼠中,白蛋白启动子可操作地连接至Cre重组酶编码序列并且驱动其在肝脏中进行表达。杂交之后,从小鼠中收获若干组织进行western印迹分析。从没有与白蛋白-Cre小鼠杂交的LSL-Cas9小鼠中收获相应的组织。随后进行测量肝脏和大脑中Cas9表达的western印迹。使用肌动蛋白作为负载对照。Cas9的预期尺寸为150.48kD,并且肌动蛋白的预期尺寸为41.25kD。使用了17.5μg的肝脏蛋白细胞溶解产物和脑蛋白细胞溶解产物。使用TruCut v2 Cas9(17.5μg)作为阳性对照。如图12A所示,在LSL-Cas9/Alb-Cre小鼠的肝脏中观察到Cas9表达但是在LSL-Cas9小鼠的肝脏中没有观察到Cas9表达。在任何小鼠的脑组织中均未观察到Cas9的表达(参见图12B),这证实了在肝脏中特异性诱导Cas9的表达。
在这些小鼠中进行测试Cas9介导的体内基因编辑的实验。实验包括通过尾静脉注射向如下五组8至12周龄的小鼠注射AAV8-gRNA靶定的目标基因3:(1)3只LSL-Cas9:Alb-Cre小鼠(MAID2599 Het,MAID3601Het);(2)3只WT:Alb-Cre小鼠(MAID2599 WT,MAID3601Het);(3)3只LSL-Cas9:WT小鼠(MAID2599 Het,MAID3601 WT);(4)3只Cas9小鼠(MAID2600Het or Hom);和(5)3只75/25(50500WT)小鼠。每组中没有注射AAV8-gRNA的小鼠作为对照。在递送了AAV8-gRNA的组中,递送的病毒载量为约2x1011。注射后1周,从小鼠中取血用于血清化学分析和ELISA分析。注射后三周,从小鼠中取血并收获组织。结果在图13中显示。LSL-Cas9小鼠与白蛋白-Cre小鼠的杂交并随后注射AAV8-gRNA使得目标蛋白质3的血清水平降低,这与递送了AAV8-gRNA的盒删除的Cas9小鼠中观察到的降低一致。
本文所述的Cas9就绪的小鼠系统能够诱导比基于外源引入Cas9的其他方法更强的基因编辑。而且,该系统可基于新霉素盒的删除条件性表达Cas9。通过将该系统与各种不同的Cre删除的小鼠谱系组合,可控制Cas9诱导的基因组编辑的时机并且可在体内提供组织特异性Cas9表达。
序列表
<110> 瑞泽恩制药公司
<120> CAS转基因小鼠胚胎干细胞和小鼠及其应用
<130> 57766-516569
<150> US 62/539,275
<151> 2017-07-31
<160> 38
<170> PatentIn version 3.5
<210> 1
<211> 8628
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<222> (1)..(170)
<223> 小鼠Rosa26上游
<220>
<221> misc_feature
<222> (300)..(333)
<223> LoxP
<220>
<221> misc_feature
<222> (424)..(2489)
<223> Neo-PolyA
<220>
<221> misc_feature
<222> (2517)..(2550)
<223> LoxP
<220>
<221> misc_feature
<222> (2599)..(2608)
<223> Kozak
<220>
<221> misc_feature
<222> (2605)..(6777)
<223> Cas9
<220>
<221> misc_feature
<222> (2614)..(2634)
<223> 单组分 NLS
<220>
<221> misc_feature
<222> (6730)..(6777)
<223> 双组分 NLS
<220>
<221> misc_feature
<222> (6778)..(6843)
<223> P2A
<220>
<221> misc_feature
<222> (6844)..(7557)
<223> eGFP
<220>
<221> misc_feature
<222> (7607)..(8203)
<223> WPRE
<220>
<221> misc_feature
<222> (8204)..(8419)
<223> bGH polyA
<220>
<221> misc_feature
<222> (8479)..(8628)
<223> 小鼠Rosa26下游
<400> 1
ctgcagtgga gtaggcgggg agaaggccgc acccttctcc ggagggggga ggggagtgtt 60
gcaatacctt tctgggagtt ctctgctgcc tcctggcttc tgaggaccgc cctgggcctg 120
ggagaatccc ttccccctct tccctcgtga tctgcaactc cagtctttct agttgaccag 180
ctcggcggtg acctgcacgt ctagggcgca gtagtccagg gtttccttga tgatgtcata 240
cttatcctgt cccttttttt tccacagggc gcgccactag tggatccgga acccttaata 300
taacttcgta taatgtatgc tatacgaagt tattaggtcc ctcgacctgc aggaattgtt 360
gacaattaat catcggcata gtatatcggc atagtataat acgacaaggt gaggaactaa 420
accatgggat cggccattga acaagatgga ttgcacgcag gttctccggc cgcttgggtg 480
gagaggctat tcggctatga ctgggcacaa cagacaatcg gctgctctga tgccgccgtg 540
ttccggctgt cagcgcaggg gcgcccggtt ctttttgtca agaccgacct gtccggtgcc 600
ctgaatgaac tgcaggacga ggcagcgcgg ctatcgtggc tggccacgac gggcgttcct 660
tgcgcagctg tgctcgacgt tgtcactgaa gcgggaaggg actggctgct attgggcgaa 720
gtgccggggc aggatctcct gtcatctcac cttgctcctg ccgagaaagt atccatcatg 780
gctgatgcaa tgcggcggct gcatacgctt gatccggcta cctgcccatt cgaccaccaa 840
gcgaaacatc gcatcgagcg agcacgtact cggatggaag ccggtcttgt cgatcaggat 900
gatctggacg aagagcatca ggggctcgcg ccagccgaac tgttcgccag gctcaaggcg 960
cgcatgcccg acggcgatga tctcgtcgtg acccatggcg atgcctgctt gccgaatatc 1020
atggtggaaa atggccgctt ttctggattc atcgactgtg gccggctggg tgtggcggac 1080
cgctatcagg acatagcgtt ggctacccgt gatattgctg aagagcttgg cggcgaatgg 1140
gctgaccgct tcctcgtgct ttacggtatc gccgctcccg attcgcagcg catcgccttc 1200
tatcgccttc ttgacgagtt cttctgaggg gatccgctgt aagtctgcag aaattgatga 1260
tctattaaac aataaagatg tccactaaaa tggaagtttt tcctgtcata ctttgttaag 1320
aagggtgaga acagagtacc tacattttga atggaaggat tggagctacg ggggtggggg 1380
tggggtggga ttagataaat gcctgctctt tactgaaggc tctttactat tgctttatga 1440
taatgtttca tagttggata tcataattta aacaagcaaa accaaattaa gggccagctc 1500
attcctccca ctcatgatct atagatctat agatctctcg tgggatcatt gtttttctct 1560
tgattcccac tttgtggttc taagtactgt ggtttccaaa tgtgtcagtt tcatagcctg 1620
aagaacgaga tcagcagcct ctgttccaca tacacttcat tctcagtatt gttttgccaa 1680
gttctaattc catcagaagc ttgcagatct gcgactctag aggatctgcg actctagagg 1740
atcataatca gccataccac atttgtagag gttttacttg ctttaaaaaa cctcccacac 1800
ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt gtttattgca 1860
gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt 1920
tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca tgtctggatc 1980
tgcgactcta gaggatcata atcagccata ccacatttgt agaggtttta cttgctttaa 2040
aaaacctccc acacctcccc ctgaacctga aacataaaat gaatgcaatt gttgttgtta 2100
acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 2160
ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 2220
atcatgtctg gatctgcgac tctagaggat cataatcagc cataccacat ttgtagaggt 2280
tttacttgct ttaaaaaacc tcccacacct ccccctgaac ctgaaacata aaatgaatgc 2340
aattgttgtt gttaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat 2400
cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact 2460
catcaatgta tcttatcatg tctggatccc catcaagctg atccggaacc cttaatataa 2520
cttcgtataa tgtatgctat acgaagttat taggtccctc gacctgcagc ccaagctagt 2580
gcccgggaat tcgctagggc caccatggac aagcccaaga aaaagcggaa agtgaagtac 2640
agcatcggcc tggacatcgg caccaactct gtgggctggg ccgtgatcac cgacgagtac 2700
aaggtgccca gcaagaaatt caaggtgctg ggcaacaccg acaggcacag catcaagaag 2760
aacctgatcg gcgccctgct gttcgacagc ggcgaaacag ccgaggccac cagactgaag 2820
agaaccgcca gaagaagata caccaggcgg aagaacagga tctgctatct gcaagagatc 2880
ttcagcaacg agatggccaa ggtggacgac agcttcttcc acagactgga agagtccttc 2940
ctggtggaag aggacaagaa gcacgagaga caccccatct tcggcaacat cgtggacgag 3000
gtggcctacc acgagaagta ccccaccatc taccacctga gaaagaaact ggtggacagc 3060
accgacaagg ccgacctgag actgatctac ctggccctgg cccacatgat caagttcaga 3120
ggccacttcc tgatcgaggg cgacctgaac cccgacaaca gcgacgtgga caagctgttc 3180
atccagctgg tgcagaccta caaccagctg ttcgaggaaa accccatcaa cgccagcggc 3240
gtggacgcca aggctatcct gtctgccaga ctgagcaaga gcagaaggct ggaaaatctg 3300
atcgcccagc tgcccggcga gaagaagaac ggcctgttcg gcaacctgat tgccctgagc 3360
ctgggcctga cccccaactt caagagcaac ttcgacctgg ccgaggatgc caaactgcag 3420
ctgagcaagg acacctacga cgacgacctg gacaacctgc tggcccagat cggcgaccag 3480
tacgccgacc tgttcctggc cgccaagaac ctgtctgacg ccatcctgct gagcgacatc 3540
ctgagagtga acaccgagat caccaaggcc cccctgagcg cctctatgat caagagatac 3600
gacgagcacc accaggacct gaccctgctg aaagctctcg tgcggcagca gctgcctgag 3660
aagtacaaag aaatcttctt cgaccagagc aagaacggct acgccggcta catcgatggc 3720
ggcgctagcc aggaagagtt ctacaagttc atcaagccca tcctggaaaa gatggacggc 3780
accgaggaac tgctcgtgaa gctgaacaga gaggacctgc tgagaaagca gagaaccttc 3840
gacaacggca gcatccccca ccagatccac ctgggagagc tgcacgctat cctgagaagg 3900
caggaagatt tttacccatt cctgaaggac aaccgggaaa agatcgagaa gatcctgacc 3960
ttcaggatcc cctactacgt gggccccctg gccagaggca acagcagatt cgcctggatg 4020
accagaaaga gcgaggaaac catcaccccc tggaacttcg aggaagtggt ggacaagggc 4080
gccagcgccc agagcttcat cgagagaatg acaaacttcg ataagaacct gcccaacgag 4140
aaggtgctgc ccaagcacag cctgctgtac gagtacttca ccgtgtacaa cgagctgacc 4200
aaagtgaaat acgtgaccga gggaatgaga aagcccgcct tcctgagcgg cgagcagaaa 4260
aaggccatcg tggacctgct gttcaagacc aacagaaaag tgaccgtgaa gcagctgaaa 4320
gaggactact tcaagaaaat cgagtgcttc gactccgtgg aaatctccgg cgtggaagat 4380
agattcaacg cctccctggg cacataccac gatctgctga aaattatcaa ggacaaggac 4440
ttcctggata acgaagagaa cgaggacatt ctggaagata tcgtgctgac cctgacactg 4500
tttgaggacc gcgagatgat cgaggaaagg ctgaaaacct acgctcacct gttcgacgac 4560
aaagtgatga agcagctgaa gagaaggcgg tacaccggct ggggcaggct gagcagaaag 4620
ctgatcaacg gcatcagaga caagcagagc ggcaagacaa tcctggattt cctgaagtcc 4680
gacggcttcg ccaaccggaa cttcatgcag ctgatccacg acgacagcct gacattcaaa 4740
gaggacatcc agaaagccca ggtgtccggc cagggcgact ctctgcacga gcatatcgct 4800
aacctggccg gcagccccgc tatcaagaag ggcatcctgc agacagtgaa ggtggtggac 4860
gagctcgtga aagtgatggg cagacacaag cccgagaaca tcgtgatcga gatggctaga 4920
gagaaccaga ccacccagaa gggacagaag aactcccgcg agaggatgaa gagaatcgaa 4980
gagggcatca aagagctggg cagccagatc ctgaaagaac accccgtgga aaacacccag 5040
ctgcagaacg agaagctgta cctgtactac ctgcagaatg gccgggatat gtacgtggac 5100
caggaactgg acatcaacag actgtccgac tacgatgtgg accatatcgt gcctcagagc 5160
tttctgaagg acgactccat cgataacaaa gtgctgactc ggagcgacaa gaacagaggc 5220
aagagcgaca acgtgccctc cgaagaggtc gtgaagaaga tgaagaacta ctggcgacag 5280
ctgctgaacg ccaagctgat tacccagagg aagttcgata acctgaccaa ggccgagaga 5340
ggcggcctga gcgagctgga taaggccggc ttcatcaaga ggcagctggt ggaaaccaga 5400
cagatcacaa agcacgtggc acagatcctg gactcccgga tgaacactaa gtacgacgaa 5460
aacgataagc tgatccggga agtgaaagtg atcaccctga agtccaagct ggtgtccgat 5520
ttccggaagg atttccagtt ttacaaagtg cgcgagatca acaactacca ccacgcccac 5580
gacgcctacc tgaacgccgt cgtgggaacc gccctgatca aaaagtaccc taagctggaa 5640
agcgagttcg tgtacggcga ctacaaggtg tacgacgtgc ggaagatgat cgccaagagc 5700
gagcaggaaa tcggcaaggc taccgccaag tacttcttct acagcaacat catgaacttt 5760
ttcaagaccg aaatcaccct ggccaacggc gagatcagaa agcgccctct gatcgagaca 5820
aacggcgaaa ccggggagat cgtgtgggat aagggcagag acttcgccac agtgcgaaag 5880
gtgctgagca tgccccaagt gaatatcgtg aaaaagaccg aggtgcagac aggcggcttc 5940
agcaaagagt ctatcctgcc caagaggaac agcgacaagc tgatcgccag aaagaaggac 6000
tgggacccca agaagtacgg cggcttcgac agccctaccg tggcctactc tgtgctggtg 6060
gtggctaagg tggaaaaggg caagtccaag aaactgaaga gtgtgaaaga gctgctgggg 6120
atcaccatca tggaaagaag cagctttgag aagaacccta tcgactttct ggaagccaag 6180
ggctacaaag aagtgaaaaa ggacctgatc atcaagctgc ctaagtactc cctgttcgag 6240
ctggaaaacg gcagaaagag aatgctggcc tctgccggcg aactgcagaa gggaaacgag 6300
ctggccctgc ctagcaaata tgtgaacttc ctgtacctgg cctcccacta tgagaagctg 6360
aagggcagcc ctgaggacaa cgaacagaaa cagctgtttg tggaacagca taagcactac 6420
ctggacgaga tcatcgagca gatcagcgag ttctccaaga gagtgatcct ggccgacgcc 6480
aatctggaca aggtgctgtc tgcctacaac aagcacaggg acaagcctat cagagagcag 6540
gccgagaata tcatccacct gttcaccctg acaaacctgg gcgctcctgc cgccttcaag 6600
tactttgaca ccaccatcga ccggaagagg tacaccagca ccaaagaggt gctggacgcc 6660
accctgatcc accagagcat caccggcctg tacgagacaa gaatcgacct gtctcagctg 6720
ggaggcgaca agagacctgc cgccactaag aaggccggac aggccaaaaa gaagaaggga 6780
agcggagcca ctaacttctc cctgttgaaa caagcagggg atgtcgaaga gaatcccggg 6840
ccagtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 6900
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 6960
ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 7020
ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 7080
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 7140
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 7200
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 7260
aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 7320
ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 7380
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 7440
tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 7500
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 7560
acgcgtatgc atggccggcc ctgcaggaat tcgatatcaa gcttatcgat aatcaacctc 7620
tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct ccttttacgc 7680
tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt atggctttca 7740
ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg tggcccgttg 7800
tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact ggttggggca 7860
ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct attgccacgg 7920
cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg ttgggcactg 7980
acaattccgt ggtgttgtcg gggaaatcat cgtcctttcc ttggctgctc gcctgtgttg 8040
ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc aatccagcgg 8100
accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt cgccttcgcc 8160
ctcagacgag tcggatctcc ctttgggccg cctccccgca tcgcgacctc gacctcgact 8220
gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc cttgaccctg 8280
gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc gcattgtctg 8340
agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg ggaggattgg 8400
gaagacaatg gcaggcatgc tggggaacta gtggtgccag ggcgtgccct tgggctcccc 8460
gggcgcggcg gccatcgctc gagtaaaatt ggagggacaa gacttcccac agattttcgg 8520
ttttgtcggg aagtttttta ataggggcaa ataaggaaaa tgggaggata ggtagtcatc 8580
tggggtttta tgcagcaaaa ctacaggtta ttattgcttg tgatccgc 8628
<210> 2
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 2
Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro
1 5 10 15
Gly Pro
<210> 3
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 3
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly Pro
<210> 4
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 4
Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp Val Glu Ser
1 5 10 15
Asn Pro Gly Pro
20
<210> 5
<211> 22
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 5
Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val
1 5 10 15
Glu Ser Asn Pro Gly Pro
20
<210> 6
<211> 82
<212> RNA
<213> 人工序列
<220>
<223> 合成的
<400> 6
guuggaacca uucaaaacag cauagcaagu uaaaauaagg cuaguccguu aucaacuuga 60
aaaaguggca ccgagucggu gc 82
<210> 7
<211> 76
<212> RNA
<213> 人工序列
<220>
<223> 合成的
<400> 7
guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60
ggcaccgagu cggugc 76
<210> 8
<211> 86
<212> RNA
<213> 人工序列
<220>
<223> 合成的
<400> 8
guuuaagagc uaugcuggaa acagcauagc aaguuuaaau aaggcuaguc cguuaucaac 60
uugaaaaagu ggcaccgagu cggugc 86
<210> 9
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<222> (2)..(21)
<223> n = A, T, C, or G
<400> 9
gnnnnnnnnn nnnnnnnnnn ngg 23
<210> 10
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<222> (1)..(21)
<223> n = A, T, C, or G
<400> 10
nnnnnnnnnn nnnnnnnnnn ngg 23
<210> 11
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<222> (3)..(23)
<223> n = A, T, C, or G
<400> 11
ggnnnnnnnn nnnnnnnnnn nnngg 25
<210> 12
<211> 6411
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<222> (1)..(170)
<223> 小鼠Rosa26上游
<220>
<221> misc_feature
<222> (300)..(333)
<223> LoxP
<220>
<221> misc_feature
<222> (382)..(391)
<223> Kozak
<220>
<221> misc_feature
<222> (388)..(4560)
<223> Cas9
<220>
<221> misc_feature
<222> (397)..(417)
<223> 单组分 NLS
<220>
<221> misc_feature
<222> (4513)..(4560)
<223> 双组分 NLS
<220>
<221> misc_feature
<222> (4561)..(4626)
<223> P2A
<220>
<221> misc_feature
<222> (4627)..(5340)
<223> eGFP
<220>
<221> misc_feature
<222> (5390)..(5986)
<223> WPRE
<220>
<221> misc_feature
<222> (5987)..(6202)
<223> bGH PolyA
<220>
<221> misc_feature
<222> (6262)..(6411)
<223> 小鼠Rosa26下游
<400> 12
ctgcagtgga gtaggcgggg agaaggccgc acccttctcc ggagggggga ggggagtgtt 60
gcaatacctt tctgggagtt ctctgctgcc tcctggcttc tgaggaccgc cctgggcctg 120
ggagaatccc ttccccctct tccctcgtga tctgcaactc cagtctttct agttgaccag 180
ctcggcggtg acctgcacgt ctagggcgca gtagtccagg gtttccttga tgatgtcata 240
cttatcctgt cccttttttt tccacagggc gcgccactag tggatccgga acccttaata 300
taacttcgta taatgtatgc tatacgaagt tattaggtcc ctcgacctgc agcccaagct 360
agtgcccggg aattcgctag ggccaccatg gacaagccca agaaaaagcg gaaagtgaag 420
tacagcatcg gcctggacat cggcaccaac tctgtgggct gggccgtgat caccgacgag 480
tacaaggtgc ccagcaagaa attcaaggtg ctgggcaaca ccgacaggca cagcatcaag 540
aagaacctga tcggcgccct gctgttcgac agcggcgaaa cagccgaggc caccagactg 600
aagagaaccg ccagaagaag atacaccagg cggaagaaca ggatctgcta tctgcaagag 660
atcttcagca acgagatggc caaggtggac gacagcttct tccacagact ggaagagtcc 720
ttcctggtgg aagaggacaa gaagcacgag agacacccca tcttcggcaa catcgtggac 780
gaggtggcct accacgagaa gtaccccacc atctaccacc tgagaaagaa actggtggac 840
agcaccgaca aggccgacct gagactgatc tacctggccc tggcccacat gatcaagttc 900
agaggccact tcctgatcga gggcgacctg aaccccgaca acagcgacgt ggacaagctg 960
ttcatccagc tggtgcagac ctacaaccag ctgttcgagg aaaaccccat caacgccagc 1020
ggcgtggacg ccaaggctat cctgtctgcc agactgagca agagcagaag gctggaaaat 1080
ctgatcgccc agctgcccgg cgagaagaag aacggcctgt tcggcaacct gattgccctg 1140
agcctgggcc tgacccccaa cttcaagagc aacttcgacc tggccgagga tgccaaactg 1200
cagctgagca aggacaccta cgacgacgac ctggacaacc tgctggccca gatcggcgac 1260
cagtacgccg acctgttcct ggccgccaag aacctgtctg acgccatcct gctgagcgac 1320
atcctgagag tgaacaccga gatcaccaag gcccccctga gcgcctctat gatcaagaga 1380
tacgacgagc accaccagga cctgaccctg ctgaaagctc tcgtgcggca gcagctgcct 1440
gagaagtaca aagaaatctt cttcgaccag agcaagaacg gctacgccgg ctacatcgat 1500
ggcggcgcta gccaggaaga gttctacaag ttcatcaagc ccatcctgga aaagatggac 1560
ggcaccgagg aactgctcgt gaagctgaac agagaggacc tgctgagaaa gcagagaacc 1620
ttcgacaacg gcagcatccc ccaccagatc cacctgggag agctgcacgc tatcctgaga 1680
aggcaggaag atttttaccc attcctgaag gacaaccggg aaaagatcga gaagatcctg 1740
accttcagga tcccctacta cgtgggcccc ctggccagag gcaacagcag attcgcctgg 1800
atgaccagaa agagcgagga aaccatcacc ccctggaact tcgaggaagt ggtggacaag 1860
ggcgccagcg cccagagctt catcgagaga atgacaaact tcgataagaa cctgcccaac 1920
gagaaggtgc tgcccaagca cagcctgctg tacgagtact tcaccgtgta caacgagctg 1980
accaaagtga aatacgtgac cgagggaatg agaaagcccg ccttcctgag cggcgagcag 2040
aaaaaggcca tcgtggacct gctgttcaag accaacagaa aagtgaccgt gaagcagctg 2100
aaagaggact acttcaagaa aatcgagtgc ttcgactccg tggaaatctc cggcgtggaa 2160
gatagattca acgcctccct gggcacatac cacgatctgc tgaaaattat caaggacaag 2220
gacttcctgg ataacgaaga gaacgaggac attctggaag atatcgtgct gaccctgaca 2280
ctgtttgagg accgcgagat gatcgaggaa aggctgaaaa cctacgctca cctgttcgac 2340
gacaaagtga tgaagcagct gaagagaagg cggtacaccg gctggggcag gctgagcaga 2400
aagctgatca acggcatcag agacaagcag agcggcaaga caatcctgga tttcctgaag 2460
tccgacggct tcgccaaccg gaacttcatg cagctgatcc acgacgacag cctgacattc 2520
aaagaggaca tccagaaagc ccaggtgtcc ggccagggcg actctctgca cgagcatatc 2580
gctaacctgg ccggcagccc cgctatcaag aagggcatcc tgcagacagt gaaggtggtg 2640
gacgagctcg tgaaagtgat gggcagacac aagcccgaga acatcgtgat cgagatggct 2700
agagagaacc agaccaccca gaagggacag aagaactccc gcgagaggat gaagagaatc 2760
gaagagggca tcaaagagct gggcagccag atcctgaaag aacaccccgt ggaaaacacc 2820
cagctgcaga acgagaagct gtacctgtac tacctgcaga atggccggga tatgtacgtg 2880
gaccaggaac tggacatcaa cagactgtcc gactacgatg tggaccatat cgtgcctcag 2940
agctttctga aggacgactc catcgataac aaagtgctga ctcggagcga caagaacaga 3000
ggcaagagcg acaacgtgcc ctccgaagag gtcgtgaaga agatgaagaa ctactggcga 3060
cagctgctga acgccaagct gattacccag aggaagttcg ataacctgac caaggccgag 3120
agaggcggcc tgagcgagct ggataaggcc ggcttcatca agaggcagct ggtggaaacc 3180
agacagatca caaagcacgt ggcacagatc ctggactccc ggatgaacac taagtacgac 3240
gaaaacgata agctgatccg ggaagtgaaa gtgatcaccc tgaagtccaa gctggtgtcc 3300
gatttccgga aggatttcca gttttacaaa gtgcgcgaga tcaacaacta ccaccacgcc 3360
cacgacgcct acctgaacgc cgtcgtggga accgccctga tcaaaaagta ccctaagctg 3420
gaaagcgagt tcgtgtacgg cgactacaag gtgtacgacg tgcggaagat gatcgccaag 3480
agcgagcagg aaatcggcaa ggctaccgcc aagtacttct tctacagcaa catcatgaac 3540
tttttcaaga ccgaaatcac cctggccaac ggcgagatca gaaagcgccc tctgatcgag 3600
acaaacggcg aaaccgggga gatcgtgtgg gataagggca gagacttcgc cacagtgcga 3660
aaggtgctga gcatgcccca agtgaatatc gtgaaaaaga ccgaggtgca gacaggcggc 3720
ttcagcaaag agtctatcct gcccaagagg aacagcgaca agctgatcgc cagaaagaag 3780
gactgggacc ccaagaagta cggcggcttc gacagcccta ccgtggccta ctctgtgctg 3840
gtggtggcta aggtggaaaa gggcaagtcc aagaaactga agagtgtgaa agagctgctg 3900
gggatcacca tcatggaaag aagcagcttt gagaagaacc ctatcgactt tctggaagcc 3960
aagggctaca aagaagtgaa aaaggacctg atcatcaagc tgcctaagta ctccctgttc 4020
gagctggaaa acggcagaaa gagaatgctg gcctctgccg gcgaactgca gaagggaaac 4080
gagctggccc tgcctagcaa atatgtgaac ttcctgtacc tggcctccca ctatgagaag 4140
ctgaagggca gccctgagga caacgaacag aaacagctgt ttgtggaaca gcataagcac 4200
tacctggacg agatcatcga gcagatcagc gagttctcca agagagtgat cctggccgac 4260
gccaatctgg acaaggtgct gtctgcctac aacaagcaca gggacaagcc tatcagagag 4320
caggccgaga atatcatcca cctgttcacc ctgacaaacc tgggcgctcc tgccgccttc 4380
aagtactttg acaccaccat cgaccggaag aggtacacca gcaccaaaga ggtgctggac 4440
gccaccctga tccaccagag catcaccggc ctgtacgaga caagaatcga cctgtctcag 4500
ctgggaggcg acaagagacc tgccgccact aagaaggccg gacaggccaa aaagaagaag 4560
ggaagcggag ccactaactt ctccctgttg aaacaagcag gggatgtcga agagaatccc 4620
gggccagtga gcaagggcga ggagctgttc accggggtgg tgcccatcct ggtcgagctg 4680
gacggcgacg taaacggcca caagttcagc gtgtccggcg agggcgaggg cgatgccacc 4740
tacggcaagc tgaccctgaa gttcatctgc accaccggca agctgcccgt gccctggccc 4800
accctcgtga ccaccctgac ctacggcgtg cagtgcttca gccgctaccc cgaccacatg 4860
aagcagcacg acttcttcaa gtccgccatg cccgaaggct acgtccagga gcgcaccatc 4920
ttcttcaagg acgacggcaa ctacaagacc cgcgccgagg tgaagttcga gggcgacacc 4980
ctggtgaacc gcatcgagct gaagggcatc gacttcaagg aggacggcaa catcctgggg 5040
cacaagctgg agtacaacta caacagccac aacgtctata tcatggccga caagcagaag 5100
aacggcatca aggtgaactt caagatccgc cacaacatcg aggacggcag cgtgcagctc 5160
gccgaccact accagcagaa cacccccatc ggcgacggcc ccgtgctgct gcccgacaac 5220
cactacctga gcacccagtc cgccctgagc aaagacccca acgagaagcg cgatcacatg 5280
gtcctgctgg agttcgtgac cgccgccggg atcactctcg gcatggacga gctgtacaag 5340
taaacgcgta tgcatggccg gccctgcagg aattcgatat caagcttatc gataatcaac 5400
ctctggatta caaaatttgt gaaagattga ctggtattct taactatgtt gctcctttta 5460
cgctatgtgg atacgctgct ttaatgcctt tgtatcatgc tattgcttcc cgtatggctt 5520
tcattttctc ctccttgtat aaatcctggt tgctgtctct ttatgaggag ttgtggcccg 5580
ttgtcaggca acgtggcgtg gtgtgcactg tgtttgctga cgcaaccccc actggttggg 5640
gcattgccac cacctgtcag ctcctttccg ggactttcgc tttccccctc cctattgcca 5700
cggcggaact catcgccgcc tgccttgccc gctgctggac aggggctcgg ctgttgggca 5760
ctgacaattc cgtggtgttg tcggggaaat catcgtcctt tccttggctg ctcgcctgtg 5820
ttgccacctg gattctgcgc gggacgtcct tctgctacgt cccttcggcc ctcaatccag 5880
cggaccttcc ttcccgcggc ctgctgccgg ctctgcggcc tcttccgcgt cttcgccttc 5940
gccctcagac gagtcggatc tccctttggg ccgcctcccc gcatcgcgac ctcgacctcg 6000
actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc 6060
ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt 6120
ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat 6180
tgggaagaca atggcaggca tgctggggaa ctagtggtgc cagggcgtgc ccttgggctc 6240
cccgggcgcg gcggccatcg ctcgagtaaa attggaggga caagacttcc cacagatttt 6300
cggttttgtc gggaagtttt ttaatagggg caaataagga aaatgggagg ataggtagtc 6360
atctggggtt ttatgcagca aaactacagg ttattattgc ttgtgatccg c 6411
<210> 13
<211> 1651
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<220>
<221> MISC_FEATURE
<222> (1)..(1391)
<223> Cas9
<220>
<221> MISC_FEATURE
<222> (1392)..(1413)
<223> P2A
<220>
<221> MISC_FEATURE
<222> (1414)..(1651)
<223> eGFP
<400> 13
Met Asp Lys Pro Lys Lys Lys Arg Lys Val Lys Tyr Ser Ile Gly Leu
1 5 10 15
Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
20 25 30
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
35 40 45
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
50 55 60
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
65 70 75 80
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
85 90 95
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
100 105 110
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
115 120 125
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
130 135 140
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
145 150 155 160
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
165 170 175
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
180 185 190
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
195 200 205
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
210 215 220
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
225 230 235 240
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
245 250 255
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
260 265 270
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
275 280 285
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
290 295 300
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
305 310 315 320
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
325 330 335
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
340 345 350
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
355 360 365
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
370 375 380
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
385 390 395 400
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
405 410 415
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
420 425 430
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
435 440 445
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
450 455 460
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
465 470 475 480
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
485 490 495
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
500 505 510
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
515 520 525
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
530 535 540
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
545 550 555 560
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
565 570 575
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
580 585 590
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
595 600 605
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
610 615 620
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
625 630 635 640
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
645 650 655
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
660 665 670
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
675 680 685
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
690 695 700
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
705 710 715 720
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
725 730 735
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
740 745 750
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
755 760 765
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
770 775 780
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
785 790 795 800
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
805 810 815
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
820 825 830
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile
835 840 845
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
850 855 860
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu
865 870 875 880
Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
885 890 895
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
900 905 910
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu
915 920 925
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser
930 935 940
Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val
945 950 955 960
Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp
965 970 975
Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His
980 985 990
Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr
995 1000 1005
Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr
1010 1015 1020
Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys
1025 1030 1035
Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe
1040 1045 1050
Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro
1055 1060 1065
Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys
1070 1075 1080
Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln
1085 1090 1095
Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser
1100 1105 1110
Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala
1115 1120 1125
Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser
1130 1135 1140
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys
1145 1150 1155
Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile
1160 1165 1170
Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe
1175 1180 1185
Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile
1190 1195 1200
Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys
1205 1210 1215
Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu
1220 1225 1230
Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His
1235 1240 1245
Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln
1250 1255 1260
Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu
1265 1270 1275
Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn
1280 1285 1290
Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro
1295 1300 1305
Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr
1310 1315 1320
Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile
1325 1330 1335
Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr
1340 1345 1350
Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp
1355 1360 1365
Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr Lys Lys
1370 1375 1380
Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Gly Ala Thr Asn Phe
1385 1390 1395
Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro
1400 1405 1410
Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu
1415 1420 1425
Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser
1430 1435 1440
Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys
1445 1450 1455
Phe Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu
1460 1465 1470
Val Thr Thr Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro
1475 1480 1485
Asp His Met Lys Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu
1490 1495 1500
Gly Tyr Val Gln Glu Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn
1505 1510 1515
Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val
1520 1525 1530
Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys Glu Asp Gly Asn
1535 1540 1545
Ile Leu Gly His Lys Leu Glu Tyr Asn Tyr Asn Ser His Asn Val
1550 1555 1560
Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly Ile Lys Val Asn Phe
1565 1570 1575
Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val Gln Leu Ala Asp
1580 1585 1590
His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu Leu
1595 1600 1605
Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu Ser Lys Asp
1610 1615 1620
Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr
1625 1630 1635
Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys
1640 1645 1650
<210> 14
<211> 10439
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<222> (1)..(170)
<223> 小鼠Rosa26上游
<220>
<221> misc_feature
<222> (195)..(1913)
<223> CAGG 启动子
<220>
<221> misc_feature
<222> (1996)..(2029)
<223> LoxP
<220>
<221> misc_feature
<222> (2120)..(4185)
<223> Neo-PolyA
<220>
<221> misc_feature
<222> (4213)..(4246)
<223> LoxP
<220>
<221> misc_feature
<222> (4341)..(4350)
<223> Kozak
<220>
<221> misc_feature
<222> (4350)..(4415)
<223> 3xFLAG
<220>
<221> misc_feature
<222> (4416)..(8588)
<223> Cas9
<220>
<221> misc_feature
<222> (4425)..(4445)
<223> 单组分 NLS
<220>
<221> misc_feature
<222> (8541)..(8588)
<223> 双组分 NLS
<220>
<221> misc_feature
<222> (8589)..(8654)
<223> P2A
<220>
<221> misc_feature
<222> (8655)..(9368)
<223> eGFP
<220>
<221> misc_feature
<222> (9418)..(10014)
<223> WPRE
<220>
<221> misc_feature
<222> (10015)..(10230)
<223> bGH PolyA
<220>
<221> misc_feature
<222> (10290)..(10439)
<223> 小鼠Rosa26下游
<400> 14
ctgcagtgga gtaggcgggg agaaggccgc acccttctcc ggagggggga ggggagtgtt 60
gcaatacctt tctgggagtt ctctgctgcc tcctggcttc tgaggaccgc cctgggcctg 120
ggagaatccc ttccccctct tccctcgtga tctgcaactc cagtctttct ccttaattaa 180
ggcctccaag gcctactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 240
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 300
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 360
ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 420
aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 480
ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 540
tagtcatcgc tattaccatg gtcgaggtga gccccacgtt ctgcttcact ctccccatct 600
cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt tgtgcagcga 660
tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc gaggggcggg 720
gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc 780
cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg 840
ggagtcgctg cgacgctgcc ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc 900
gccccggctc tgactgaccg cgttactccc acaggtgagc gggcgggacg gcccttctcc 960
tccgggctgt aattagcgct tggtttaatg acggcttgtt tcttttctgt ggctgcgtga 1020
aagccttgag gggctccggg agggcccttt gtgcgggggg agcggctcgg ggggtgcgtg 1080
cgtgtgtgtg tgcgtgggga gcgccgcgtg cggctccgcg ctgcccggcg gctgtgagcg 1140
ctgcgggcgc ggcgcggggc tttgtgcgct ccgcagtgtg cgcgagggga gcgcggccgg 1200
gggcggtgcc ccgcggtgcg gggggggctg cgaggggaac aaaggctgcg tgcggggtgt 1260
gtgcgtgggg gggtgagcag ggggtgtggg cgcgtcggtc gggctgcaac cccccctgca 1320
cccccctccc cgagttgctg agcacggccc ggcttcgggt gcggggctcc gtacggggcg 1380
tggcgcgggg ctcgccgtgc cgggcggggg gtggcggcag gtgggggtgc cgggcggggc 1440
ggggccgcct cgggccgggg agggctcggg ggaggggcgc ggcggccccc ggagcgccgg 1500
cggctgtcga ggcgcggcga gccgcagcca ttgcctttta tggtaatcgt gcgagagggc 1560
gcagggactt cctttgtccc aaatctgtgc ggagccgaaa tctgggaggc gccgccgcac 1620
cccctctagc gggcgcgggg cgaagcggtg cggcgccggc aggaaggaaa tgggcgggga 1680
gggccttcgt gcgtcgccgc gccgccgtcc ccttctccct ctccagcctc ggggctgtcc 1740
gcggggggac ggctgccttc gggggggacg gggcagggcg gggttcggct tctggcgtgt 1800
gaccggcggc tctagagcct ctgctaacca tgttcatgcc ttcttctttt tcctacagct 1860
cctgggcaac gtgctggtta ttgtgctgtc tcatcatttt ggcaaagaat tcgctaggag 1920
aattgatttg ataccgcggg ccctaagtcg acatttaaat catttaaatc cactagtgga 1980
tccggaaccc ttaatataac ttcgtataat gtatgctata cgaagttatt aggtccctcg 2040
acctgcagga attgttgaca attaatcatc ggcatagtat atcggcatag tataatacga 2100
caaggtgagg aactaaacca tgggatcggc cattgaacaa gatggattgc acgcaggttc 2160
tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg 2220
ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac 2280
cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc 2340
cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg 2400
gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga 2460
gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg 2520
cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg 2580
tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt 2640
cgccaggctc aaggcgcgca tgcccgacgg cgatgatctc gtcgtgaccc atggcgatgc 2700
ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg 2760
gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga 2820
gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc 2880
gcagcgcatc gccttctatc gccttcttga cgagttcttc tgaggggatc cgctgtaagt 2940
ctgcagaaat tgatgatcta ttaaacaata aagatgtcca ctaaaatgga agtttttcct 3000
gtcatacttt gttaagaagg gtgagaacag agtacctaca ttttgaatgg aaggattgga 3060
gctacggggg tgggggtggg gtgggattag ataaatgcct gctctttact gaaggctctt 3120
tactattgct ttatgataat gtttcatagt tggatatcat aatttaaaca agcaaaacca 3180
aattaagggc cagctcattc ctcccactca tgatctatag atctatagat ctctcgtggg 3240
atcattgttt ttctcttgat tcccactttg tggttctaag tactgtggtt tccaaatgtg 3300
tcagtttcat agcctgaaga acgagatcag cagcctctgt tccacataca cttcattctc 3360
agtattgttt tgccaagttc taattccatc agaagcttgc agatctgcga ctctagagga 3420
tctgcgactc tagaggatca taatcagcca taccacattt gtagaggttt tacttgcttt 3480
aaaaaacctc ccacacctcc ccctgaacct gaaacataaa atgaatgcaa ttgttgttgt 3540
taacttgttt attgcagctt ataatggtta caaataaagc aatagcatca caaatttcac 3600
aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc 3660
ttatcatgtc tggatctgcg actctagagg atcataatca gccataccac atttgtagag 3720
gttttacttg ctttaaaaaa cctcccacac ctccccctga acctgaaaca taaaatgaat 3780
gcaattgttg ttgttaactt gtttattgca gcttataatg gttacaaata aagcaatagc 3840
atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa 3900
ctcatcaatg tatcttatca tgtctggatc tgcgactcta gaggatcata atcagccata 3960
ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc ctgaacctga 4020
aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat aatggttaca 4080
aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg cattctagtt 4140
gtggtttgtc caaactcatc aatgtatctt atcatgtctg gatccccatc aagctgatcc 4200
ggaaccctta atataacttc gtataatgta tgctatacga agttattagg tccctcgacc 4260
tgcagcccaa gctagtgccc gggtaggtcc ctcgacctgc agcccaagct agatcgaatt 4320
cggccggcct tcgaacacgt gccaccatgg actataagga ccacgacgga gactacaagg 4380
atcatgatat tgattacaaa gacgatgacg ataagatgga caagcccaag aaaaagcgga 4440
aagtgaagta cagcatcggc ctggacatcg gcaccaactc tgtgggctgg gccgtgatca 4500
ccgacgagta caaggtgccc agcaagaaat tcaaggtgct gggcaacacc gacaggcaca 4560
gcatcaagaa gaacctgatc ggcgccctgc tgttcgacag cggcgaaaca gccgaggcca 4620
ccagactgaa gagaaccgcc agaagaagat acaccaggcg gaagaacagg atctgctatc 4680
tgcaagagat cttcagcaac gagatggcca aggtggacga cagcttcttc cacagactgg 4740
aagagtcctt cctggtggaa gaggacaaga agcacgagag acaccccatc ttcggcaaca 4800
tcgtggacga ggtggcctac cacgagaagt accccaccat ctaccacctg agaaagaaac 4860
tggtggacag caccgacaag gccgacctga gactgatcta cctggccctg gcccacatga 4920
tcaagttcag aggccacttc ctgatcgagg gcgacctgaa ccccgacaac agcgacgtgg 4980
acaagctgtt catccagctg gtgcagacct acaaccagct gttcgaggaa aaccccatca 5040
acgccagcgg cgtggacgcc aaggctatcc tgtctgccag actgagcaag agcagaaggc 5100
tggaaaatct gatcgcccag ctgcccggcg agaagaagaa cggcctgttc ggcaacctga 5160
ttgccctgag cctgggcctg acccccaact tcaagagcaa cttcgacctg gccgaggatg 5220
ccaaactgca gctgagcaag gacacctacg acgacgacct ggacaacctg ctggcccaga 5280
tcggcgacca gtacgccgac ctgttcctgg ccgccaagaa cctgtctgac gccatcctgc 5340
tgagcgacat cctgagagtg aacaccgaga tcaccaaggc ccccctgagc gcctctatga 5400
tcaagagata cgacgagcac caccaggacc tgaccctgct gaaagctctc gtgcggcagc 5460
agctgcctga gaagtacaaa gaaatcttct tcgaccagag caagaacggc tacgccggct 5520
acatcgatgg cggcgctagc caggaagagt tctacaagtt catcaagccc atcctggaaa 5580
agatggacgg caccgaggaa ctgctcgtga agctgaacag agaggacctg ctgagaaagc 5640
agagaacctt cgacaacggc agcatccccc accagatcca cctgggagag ctgcacgcta 5700
tcctgagaag gcaggaagat ttttacccat tcctgaagga caaccgggaa aagatcgaga 5760
agatcctgac cttcaggatc ccctactacg tgggccccct ggccagaggc aacagcagat 5820
tcgcctggat gaccagaaag agcgaggaaa ccatcacccc ctggaacttc gaggaagtgg 5880
tggacaaggg cgccagcgcc cagagcttca tcgagagaat gacaaacttc gataagaacc 5940
tgcccaacga gaaggtgctg cccaagcaca gcctgctgta cgagtacttc accgtgtaca 6000
acgagctgac caaagtgaaa tacgtgaccg agggaatgag aaagcccgcc ttcctgagcg 6060
gcgagcagaa aaaggccatc gtggacctgc tgttcaagac caacagaaaa gtgaccgtga 6120
agcagctgaa agaggactac ttcaagaaaa tcgagtgctt cgactccgtg gaaatctccg 6180
gcgtggaaga tagattcaac gcctccctgg gcacatacca cgatctgctg aaaattatca 6240
aggacaagga cttcctggat aacgaagaga acgaggacat tctggaagat atcgtgctga 6300
ccctgacact gtttgaggac cgcgagatga tcgaggaaag gctgaaaacc tacgctcacc 6360
tgttcgacga caaagtgatg aagcagctga agagaaggcg gtacaccggc tggggcaggc 6420
tgagcagaaa gctgatcaac ggcatcagag acaagcagag cggcaagaca atcctggatt 6480
tcctgaagtc cgacggcttc gccaaccgga acttcatgca gctgatccac gacgacagcc 6540
tgacattcaa agaggacatc cagaaagccc aggtgtccgg ccagggcgac tctctgcacg 6600
agcatatcgc taacctggcc ggcagccccg ctatcaagaa gggcatcctg cagacagtga 6660
aggtggtgga cgagctcgtg aaagtgatgg gcagacacaa gcccgagaac atcgtgatcg 6720
agatggctag agagaaccag accacccaga agggacagaa gaactcccgc gagaggatga 6780
agagaatcga agagggcatc aaagagctgg gcagccagat cctgaaagaa caccccgtgg 6840
aaaacaccca gctgcagaac gagaagctgt acctgtacta cctgcagaat ggccgggata 6900
tgtacgtgga ccaggaactg gacatcaaca gactgtccga ctacgatgtg gaccatatcg 6960
tgcctcagag ctttctgaag gacgactcca tcgataacaa agtgctgact cggagcgaca 7020
agaacagagg caagagcgac aacgtgccct ccgaagaggt cgtgaagaag atgaagaact 7080
actggcgaca gctgctgaac gccaagctga ttacccagag gaagttcgat aacctgacca 7140
aggccgagag aggcggcctg agcgagctgg ataaggccgg cttcatcaag aggcagctgg 7200
tggaaaccag acagatcaca aagcacgtgg cacagatcct ggactcccgg atgaacacta 7260
agtacgacga aaacgataag ctgatccggg aagtgaaagt gatcaccctg aagtccaagc 7320
tggtgtccga tttccggaag gatttccagt tttacaaagt gcgcgagatc aacaactacc 7380
accacgccca cgacgcctac ctgaacgccg tcgtgggaac cgccctgatc aaaaagtacc 7440
ctaagctgga aagcgagttc gtgtacggcg actacaaggt gtacgacgtg cggaagatga 7500
tcgccaagag cgagcaggaa atcggcaagg ctaccgccaa gtacttcttc tacagcaaca 7560
tcatgaactt tttcaagacc gaaatcaccc tggccaacgg cgagatcaga aagcgccctc 7620
tgatcgagac aaacggcgaa accggggaga tcgtgtggga taagggcaga gacttcgcca 7680
cagtgcgaaa ggtgctgagc atgccccaag tgaatatcgt gaaaaagacc gaggtgcaga 7740
caggcggctt cagcaaagag tctatcctgc ccaagaggaa cagcgacaag ctgatcgcca 7800
gaaagaagga ctgggacccc aagaagtacg gcggcttcga cagccctacc gtggcctact 7860
ctgtgctggt ggtggctaag gtggaaaagg gcaagtccaa gaaactgaag agtgtgaaag 7920
agctgctggg gatcaccatc atggaaagaa gcagctttga gaagaaccct atcgactttc 7980
tggaagccaa gggctacaaa gaagtgaaaa aggacctgat catcaagctg cctaagtact 8040
ccctgttcga gctggaaaac ggcagaaaga gaatgctggc ctctgccggc gaactgcaga 8100
agggaaacga gctggccctg cctagcaaat atgtgaactt cctgtacctg gcctcccact 8160
atgagaagct gaagggcagc cctgaggaca acgaacagaa acagctgttt gtggaacagc 8220
ataagcacta cctggacgag atcatcgagc agatcagcga gttctccaag agagtgatcc 8280
tggccgacgc caatctggac aaggtgctgt ctgcctacaa caagcacagg gacaagccta 8340
tcagagagca ggccgagaat atcatccacc tgttcaccct gacaaacctg ggcgctcctg 8400
ccgccttcaa gtactttgac accaccatcg accggaagag gtacaccagc accaaagagg 8460
tgctggacgc caccctgatc caccagagca tcaccggcct gtacgagaca agaatcgacc 8520
tgtctcagct gggaggcgac aagagacctg ccgccactaa gaaggccgga caggccaaaa 8580
agaagaaggg aagcggagcc actaacttct ccctgttgaa acaagcaggg gatgtcgaag 8640
agaatcccgg gccagtgagc aagggcgagg agctgttcac cggggtggtg cccatcctgg 8700
tcgagctgga cggcgacgta aacggccaca agttcagcgt gtccggcgag ggcgagggcg 8760
atgccaccta cggcaagctg accctgaagt tcatctgcac caccggcaag ctgcccgtgc 8820
cctggcccac cctcgtgacc accctgacct acggcgtgca gtgcttcagc cgctaccccg 8880
accacatgaa gcagcacgac ttcttcaagt ccgccatgcc cgaaggctac gtccaggagc 8940
gcaccatctt cttcaaggac gacggcaact acaagacccg cgccgaggtg aagttcgagg 9000
gcgacaccct ggtgaaccgc atcgagctga agggcatcga cttcaaggag gacggcaaca 9060
tcctggggca caagctggag tacaactaca acagccacaa cgtctatatc atggccgaca 9120
agcagaagaa cggcatcaag gtgaacttca agatccgcca caacatcgag gacggcagcg 9180
tgcagctcgc cgaccactac cagcagaaca cccccatcgg cgacggcccc gtgctgctgc 9240
ccgacaacca ctacctgagc acccagtccg ccctgagcaa agaccccaac gagaagcgcg 9300
atcacatggt cctgctggag ttcgtgaccg ccgccgggat cactctcggc atggacgagc 9360
tgtacaagta aacgcgtatg catggccggc cctgcaggaa ttcgatatca agcttatcga 9420
taatcaacct ctggattaca aaatttgtga aagattgact ggtattctta actatgttgc 9480
tccttttacg ctatgtggat acgctgcttt aatgcctttg tatcatgcta ttgcttcccg 9540
tatggctttc attttctcct ccttgtataa atcctggttg ctgtctcttt atgaggagtt 9600
gtggcccgtt gtcaggcaac gtggcgtggt gtgcactgtg tttgctgacg caacccccac 9660
tggttggggc attgccacca cctgtcagct cctttccggg actttcgctt tccccctccc 9720
tattgccacg gcggaactca tcgccgcctg ccttgcccgc tgctggacag gggctcggct 9780
gttgggcact gacaattccg tggtgttgtc ggggaaatca tcgtcctttc cttggctgct 9840
cgcctgtgtt gccacctgga ttctgcgcgg gacgtccttc tgctacgtcc cttcggccct 9900
caatccagcg gaccttcctt cccgcggcct gctgccggct ctgcggcctc ttccgcgtct 9960
tcgccttcgc cctcagacga gtcggatctc cctttgggcc gcctccccgc atcgcgacct 10020
cgacctcgac tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt 10080
ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat 10140
cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg 10200
gggaggattg ggaagacaat ggcaggcatg ctggggaact agtggtgcca gggcgtgccc 10260
ttgggctccc cgggcgcggc ggccatcgct cgagtaaaat tggagggaca agacttccca 10320
cagattttcg gttttgtcgg gaagtttttt aataggggca aataaggaaa atgggaggat 10380
aggtagtcat ctggggtttt atgcagcaaa actacaggtt attattgctt gtgatccgc 10439
<210> 15
<211> 8222
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<222> (1)..(170)
<223> 小鼠Rosa26上游
<220>
<221> misc_feature
<222> (195)..(1913)
<223> CAGG 启动子
<220>
<221> misc_feature
<222> (1996)..(2029)
<223> LoxP
<220>
<221> misc_feature
<222> (2124)..(2133)
<223> Kozak
<220>
<221> misc_feature
<222> (2133)..(2198)
<223> 3xFLAG
<220>
<221> misc_feature
<222> (2199)..(6371)
<223> Cas9
<220>
<221> misc_feature
<222> (2208)..(2228)
<223> 单组分 NLS
<220>
<221> misc_feature
<222> (6324)..(6371)
<223> 双组分 NLS
<220>
<221> misc_feature
<222> (6372)..(6437)
<223> P2A
<220>
<221> misc_feature
<222> (6438)..(7151)
<223> eGFP
<220>
<221> misc_feature
<222> (7201)..(7797)
<223> WPRE
<220>
<221> misc_feature
<222> (7798)..(8013)
<223> bGH PolyA
<220>
<221> misc_feature
<222> (8073)..(8222)
<223> 小鼠Rosa26下游
<400> 15
ctgcagtgga gtaggcgggg agaaggccgc acccttctcc ggagggggga ggggagtgtt 60
gcaatacctt tctgggagtt ctctgctgcc tcctggcttc tgaggaccgc cctgggcctg 120
ggagaatccc ttccccctct tccctcgtga tctgcaactc cagtctttct ccttaattaa 180
ggcctccaag gcctactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 240
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 300
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 360
ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 420
aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 480
ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 540
tagtcatcgc tattaccatg gtcgaggtga gccccacgtt ctgcttcact ctccccatct 600
cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt tgtgcagcga 660
tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc gaggggcggg 720
gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc 780
cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg 840
ggagtcgctg cgacgctgcc ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc 900
gccccggctc tgactgaccg cgttactccc acaggtgagc gggcgggacg gcccttctcc 960
tccgggctgt aattagcgct tggtttaatg acggcttgtt tcttttctgt ggctgcgtga 1020
aagccttgag gggctccggg agggcccttt gtgcgggggg agcggctcgg ggggtgcgtg 1080
cgtgtgtgtg tgcgtgggga gcgccgcgtg cggctccgcg ctgcccggcg gctgtgagcg 1140
ctgcgggcgc ggcgcggggc tttgtgcgct ccgcagtgtg cgcgagggga gcgcggccgg 1200
gggcggtgcc ccgcggtgcg gggggggctg cgaggggaac aaaggctgcg tgcggggtgt 1260
gtgcgtgggg gggtgagcag ggggtgtggg cgcgtcggtc gggctgcaac cccccctgca 1320
cccccctccc cgagttgctg agcacggccc ggcttcgggt gcggggctcc gtacggggcg 1380
tggcgcgggg ctcgccgtgc cgggcggggg gtggcggcag gtgggggtgc cgggcggggc 1440
ggggccgcct cgggccgggg agggctcggg ggaggggcgc ggcggccccc ggagcgccgg 1500
cggctgtcga ggcgcggcga gccgcagcca ttgcctttta tggtaatcgt gcgagagggc 1560
gcagggactt cctttgtccc aaatctgtgc ggagccgaaa tctgggaggc gccgccgcac 1620
cccctctagc gggcgcgggg cgaagcggtg cggcgccggc aggaaggaaa tgggcgggga 1680
gggccttcgt gcgtcgccgc gccgccgtcc ccttctccct ctccagcctc ggggctgtcc 1740
gcggggggac ggctgccttc gggggggacg gggcagggcg gggttcggct tctggcgtgt 1800
gaccggcggc tctagagcct ctgctaacca tgttcatgcc ttcttctttt tcctacagct 1860
cctgggcaac gtgctggtta ttgtgctgtc tcatcatttt ggcaaagaat tcgctaggag 1920
aattgatttg ataccgcggg ccctaagtcg acatttaaat catttaaatc cactagtgga 1980
tccggaaccc ttaatataac ttcgtataat gtatgctata cgaagttatt aggtccctcg 2040
acctgcagcc caagctagtg cccgggtagg tccctcgacc tgcagcccaa gctagatcga 2100
attcggccgg ccttcgaaca cgtgccacca tggactataa ggaccacgac ggagactaca 2160
aggatcatga tattgattac aaagacgatg acgataagat ggacaagccc aagaaaaagc 2220
ggaaagtgaa gtacagcatc ggcctggaca tcggcaccaa ctctgtgggc tgggccgtga 2280
tcaccgacga gtacaaggtg cccagcaaga aattcaaggt gctgggcaac accgacaggc 2340
acagcatcaa gaagaacctg atcggcgccc tgctgttcga cagcggcgaa acagccgagg 2400
ccaccagact gaagagaacc gccagaagaa gatacaccag gcggaagaac aggatctgct 2460
atctgcaaga gatcttcagc aacgagatgg ccaaggtgga cgacagcttc ttccacagac 2520
tggaagagtc cttcctggtg gaagaggaca agaagcacga gagacacccc atcttcggca 2580
acatcgtgga cgaggtggcc taccacgaga agtaccccac catctaccac ctgagaaaga 2640
aactggtgga cagcaccgac aaggccgacc tgagactgat ctacctggcc ctggcccaca 2700
tgatcaagtt cagaggccac ttcctgatcg agggcgacct gaaccccgac aacagcgacg 2760
tggacaagct gttcatccag ctggtgcaga cctacaacca gctgttcgag gaaaacccca 2820
tcaacgccag cggcgtggac gccaaggcta tcctgtctgc cagactgagc aagagcagaa 2880
ggctggaaaa tctgatcgcc cagctgcccg gcgagaagaa gaacggcctg ttcggcaacc 2940
tgattgccct gagcctgggc ctgaccccca acttcaagag caacttcgac ctggccgagg 3000
atgccaaact gcagctgagc aaggacacct acgacgacga cctggacaac ctgctggccc 3060
agatcggcga ccagtacgcc gacctgttcc tggccgccaa gaacctgtct gacgccatcc 3120
tgctgagcga catcctgaga gtgaacaccg agatcaccaa ggcccccctg agcgcctcta 3180
tgatcaagag atacgacgag caccaccagg acctgaccct gctgaaagct ctcgtgcggc 3240
agcagctgcc tgagaagtac aaagaaatct tcttcgacca gagcaagaac ggctacgccg 3300
gctacatcga tggcggcgct agccaggaag agttctacaa gttcatcaag cccatcctgg 3360
aaaagatgga cggcaccgag gaactgctcg tgaagctgaa cagagaggac ctgctgagaa 3420
agcagagaac cttcgacaac ggcagcatcc cccaccagat ccacctggga gagctgcacg 3480
ctatcctgag aaggcaggaa gatttttacc cattcctgaa ggacaaccgg gaaaagatcg 3540
agaagatcct gaccttcagg atcccctact acgtgggccc cctggccaga ggcaacagca 3600
gattcgcctg gatgaccaga aagagcgagg aaaccatcac cccctggaac ttcgaggaag 3660
tggtggacaa gggcgccagc gcccagagct tcatcgagag aatgacaaac ttcgataaga 3720
acctgcccaa cgagaaggtg ctgcccaagc acagcctgct gtacgagtac ttcaccgtgt 3780
acaacgagct gaccaaagtg aaatacgtga ccgagggaat gagaaagccc gccttcctga 3840
gcggcgagca gaaaaaggcc atcgtggacc tgctgttcaa gaccaacaga aaagtgaccg 3900
tgaagcagct gaaagaggac tacttcaaga aaatcgagtg cttcgactcc gtggaaatct 3960
ccggcgtgga agatagattc aacgcctccc tgggcacata ccacgatctg ctgaaaatta 4020
tcaaggacaa ggacttcctg gataacgaag agaacgagga cattctggaa gatatcgtgc 4080
tgaccctgac actgtttgag gaccgcgaga tgatcgagga aaggctgaaa acctacgctc 4140
acctgttcga cgacaaagtg atgaagcagc tgaagagaag gcggtacacc ggctggggca 4200
ggctgagcag aaagctgatc aacggcatca gagacaagca gagcggcaag acaatcctgg 4260
atttcctgaa gtccgacggc ttcgccaacc ggaacttcat gcagctgatc cacgacgaca 4320
gcctgacatt caaagaggac atccagaaag cccaggtgtc cggccagggc gactctctgc 4380
acgagcatat cgctaacctg gccggcagcc ccgctatcaa gaagggcatc ctgcagacag 4440
tgaaggtggt ggacgagctc gtgaaagtga tgggcagaca caagcccgag aacatcgtga 4500
tcgagatggc tagagagaac cagaccaccc agaagggaca gaagaactcc cgcgagagga 4560
tgaagagaat cgaagagggc atcaaagagc tgggcagcca gatcctgaaa gaacaccccg 4620
tggaaaacac ccagctgcag aacgagaagc tgtacctgta ctacctgcag aatggccggg 4680
atatgtacgt ggaccaggaa ctggacatca acagactgtc cgactacgat gtggaccata 4740
tcgtgcctca gagctttctg aaggacgact ccatcgataa caaagtgctg actcggagcg 4800
acaagaacag aggcaagagc gacaacgtgc cctccgaaga ggtcgtgaag aagatgaaga 4860
actactggcg acagctgctg aacgccaagc tgattaccca gaggaagttc gataacctga 4920
ccaaggccga gagaggcggc ctgagcgagc tggataaggc cggcttcatc aagaggcagc 4980
tggtggaaac cagacagatc acaaagcacg tggcacagat cctggactcc cggatgaaca 5040
ctaagtacga cgaaaacgat aagctgatcc gggaagtgaa agtgatcacc ctgaagtcca 5100
agctggtgtc cgatttccgg aaggatttcc agttttacaa agtgcgcgag atcaacaact 5160
accaccacgc ccacgacgcc tacctgaacg ccgtcgtggg aaccgccctg atcaaaaagt 5220
accctaagct ggaaagcgag ttcgtgtacg gcgactacaa ggtgtacgac gtgcggaaga 5280
tgatcgccaa gagcgagcag gaaatcggca aggctaccgc caagtacttc ttctacagca 5340
acatcatgaa ctttttcaag accgaaatca ccctggccaa cggcgagatc agaaagcgcc 5400
ctctgatcga gacaaacggc gaaaccgggg agatcgtgtg ggataagggc agagacttcg 5460
ccacagtgcg aaaggtgctg agcatgcccc aagtgaatat cgtgaaaaag accgaggtgc 5520
agacaggcgg cttcagcaaa gagtctatcc tgcccaagag gaacagcgac aagctgatcg 5580
ccagaaagaa ggactgggac cccaagaagt acggcggctt cgacagccct accgtggcct 5640
actctgtgct ggtggtggct aaggtggaaa agggcaagtc caagaaactg aagagtgtga 5700
aagagctgct ggggatcacc atcatggaaa gaagcagctt tgagaagaac cctatcgact 5760
ttctggaagc caagggctac aaagaagtga aaaaggacct gatcatcaag ctgcctaagt 5820
actccctgtt cgagctggaa aacggcagaa agagaatgct ggcctctgcc ggcgaactgc 5880
agaagggaaa cgagctggcc ctgcctagca aatatgtgaa cttcctgtac ctggcctccc 5940
actatgagaa gctgaagggc agccctgagg acaacgaaca gaaacagctg tttgtggaac 6000
agcataagca ctacctggac gagatcatcg agcagatcag cgagttctcc aagagagtga 6060
tcctggccga cgccaatctg gacaaggtgc tgtctgccta caacaagcac agggacaagc 6120
ctatcagaga gcaggccgag aatatcatcc acctgttcac cctgacaaac ctgggcgctc 6180
ctgccgcctt caagtacttt gacaccacca tcgaccggaa gaggtacacc agcaccaaag 6240
aggtgctgga cgccaccctg atccaccaga gcatcaccgg cctgtacgag acaagaatcg 6300
acctgtctca gctgggaggc gacaagagac ctgccgccac taagaaggcc ggacaggcca 6360
aaaagaagaa gggaagcgga gccactaact tctccctgtt gaaacaagca ggggatgtcg 6420
aagagaatcc cgggccagtg agcaagggcg aggagctgtt caccggggtg gtgcccatcc 6480
tggtcgagct ggacggcgac gtaaacggcc acaagttcag cgtgtccggc gagggcgagg 6540
gcgatgccac ctacggcaag ctgaccctga agttcatctg caccaccggc aagctgcccg 6600
tgccctggcc caccctcgtg accaccctga cctacggcgt gcagtgcttc agccgctacc 6660
ccgaccacat gaagcagcac gacttcttca agtccgccat gcccgaaggc tacgtccagg 6720
agcgcaccat cttcttcaag gacgacggca actacaagac ccgcgccgag gtgaagttcg 6780
agggcgacac cctggtgaac cgcatcgagc tgaagggcat cgacttcaag gaggacggca 6840
acatcctggg gcacaagctg gagtacaact acaacagcca caacgtctat atcatggccg 6900
acaagcagaa gaacggcatc aaggtgaact tcaagatccg ccacaacatc gaggacggca 6960
gcgtgcagct cgccgaccac taccagcaga acacccccat cggcgacggc cccgtgctgc 7020
tgcccgacaa ccactacctg agcacccagt ccgccctgag caaagacccc aacgagaagc 7080
gcgatcacat ggtcctgctg gagttcgtga ccgccgccgg gatcactctc ggcatggacg 7140
agctgtacaa gtaaacgcgt atgcatggcc ggccctgcag gaattcgata tcaagcttat 7200
cgataatcaa cctctggatt acaaaatttg tgaaagattg actggtattc ttaactatgt 7260
tgctcctttt acgctatgtg gatacgctgc tttaatgcct ttgtatcatg ctattgcttc 7320
ccgtatggct ttcattttct cctccttgta taaatcctgg ttgctgtctc tttatgagga 7380
gttgtggccc gttgtcaggc aacgtggcgt ggtgtgcact gtgtttgctg acgcaacccc 7440
cactggttgg ggcattgcca ccacctgtca gctcctttcc gggactttcg ctttccccct 7500
ccctattgcc acggcggaac tcatcgccgc ctgccttgcc cgctgctgga caggggctcg 7560
gctgttgggc actgacaatt ccgtggtgtt gtcggggaaa tcatcgtcct ttccttggct 7620
gctcgcctgt gttgccacct ggattctgcg cgggacgtcc ttctgctacg tcccttcggc 7680
cctcaatcca gcggaccttc cttcccgcgg cctgctgccg gctctgcggc ctcttccgcg 7740
tcttcgcctt cgccctcaga cgagtcggat ctccctttgg gccgcctccc cgcatcgcga 7800
cctcgacctc gactgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc 7860
cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg 7920
catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca 7980
agggggagga ttgggaagac aatggcaggc atgctgggga actagtggtg ccagggcgtg 8040
cccttgggct ccccgggcgc ggcggccatc gctcgagtaa aattggaggg acaagacttc 8100
ccacagattt tcggttttgt cgggaagttt tttaataggg gcaaataagg aaaatgggag 8160
gataggtagt catctggggt tttatgcagc aaaactacag gttattattg cttgtgatcc 8220
gc 8222
<210> 16
<211> 1673
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<220>
<221> MISC_FEATURE
<222> (1)..(22)
<223> 3xFLAG
<220>
<221> MISC_FEATURE
<222> (23)..(1413)
<223> Cas9
<220>
<221> MISC_FEATURE
<222> (1414)..(1435)
<223> P2A
<220>
<221> MISC_FEATURE
<222> (1436)..(1673)
<223> eGFP
<400> 16
Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp Tyr
1 5 10 15
Lys Asp Asp Asp Asp Lys Met Asp Lys Pro Lys Lys Lys Arg Lys Val
20 25 30
Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly Trp Ala
35 40 45
Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu
50 55 60
Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu
65 70 75 80
Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr
85 90 95
Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln
100 105 110
Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His
115 120 125
Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg
130 135 140
His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys
145 150 155 160
Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp
165 170 175
Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys
180 185 190
Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser
195 200 205
Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu
210 215 220
Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile
225 230 235 240
Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala
245 250 255
Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala
260 265 270
Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala
275 280 285
Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu
290 295 300
Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu
305 310 315 320
Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg
325 330 335
Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys
340 345 350
Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val
355 360 365
Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser
370 375 380
Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu
385 390 395 400
Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu
405 410 415
Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg
420 425 430
Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu
435 440 445
His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp
450 455 460
Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr
465 470 475 480
Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg
485 490 495
Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp
500 505 510
Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp
515 520 525
Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr
530 535 540
Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr
545 550 555 560
Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala
565 570 575
Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln
580 585 590
Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu
595 600 605
Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His
610 615 620
Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu
625 630 635 640
Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu
645 650 655
Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe
660 665 670
Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp
675 680 685
Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser
690 695 700
Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg
705 710 715 720
Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp
725 730 735
Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His
740 745 750
Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln
755 760 765
Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys
770 775 780
Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln
785 790 795 800
Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly
805 810 815
Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn
820 825 830
Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly
835 840 845
Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp
850 855 860
Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser
865 870 875 880
Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser
885 890 895
Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp
900 905 910
Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn
915 920 925
Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly
930 935 940
Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val
945 950 955 960
Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp
965 970 975
Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val
980 985 990
Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn
995 1000 1005
Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly
1010 1015 1020
Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
1025 1030 1035
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1040 1045 1050
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1055 1060 1065
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1070 1075 1080
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1085 1090 1095
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1100 1105 1110
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1115 1120 1125
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1130 1135 1140
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1145 1150 1155
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu
1160 1165 1170
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1175 1180 1185
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1190 1195 1200
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1205 1210 1215
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1220 1225 1230
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1235 1240 1245
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
1250 1255 1260
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
1265 1270 1275
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1280 1285 1290
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
1295 1300 1305
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
1310 1315 1320
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
1325 1330 1335
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
1340 1345 1350
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr
1355 1360 1365
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
1370 1375 1380
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Lys
1385 1390 1395
Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1400 1405 1410
Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1415 1420 1425
Val Glu Glu Asn Pro Gly Pro Val Ser Lys Gly Glu Glu Leu Phe
1430 1435 1440
Thr Gly Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn
1445 1450 1455
Gly His Lys Phe Ser Val Ser Gly Glu Gly Glu Gly Asp Ala Thr
1460 1465 1470
Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys Thr Thr Gly Lys Leu
1475 1480 1485
Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu Thr Tyr Gly Val
1490 1495 1500
Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys Gln His Asp Phe
1505 1510 1515
Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile
1520 1525 1530
Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val Lys
1535 1540 1545
Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile
1550 1555 1560
Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr
1565 1570 1575
Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys
1580 1585 1590
Asn Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp
1595 1600 1605
Gly Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile
1610 1615 1620
Gly Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr
1625 1630 1635
Gln Ser Ala Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met
1640 1645 1650
Val Leu Leu Glu Phe Val Thr Ala Ala Gly Ile Thr Leu Gly Met
1655 1660 1665
Asp Glu Leu Tyr Lys
1670
<210> 17
<211> 7207
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<222> (1)..(170)
<223> 小鼠Rosa26上游
<220>
<221> misc_feature
<222> (300)..(333)
<223> LoxP
<220>
<221> misc_feature
<222> (424)..(2489)
<223> Neo-PolyA
<220>
<221> misc_feature
<222> (2517)..(2550)
<223> LoxP
<220>
<221> misc_feature
<222> (2599)..(2608)
<223> Kozak
<220>
<221> misc_feature
<222> (2605)..(6777)
<223> Cas9
<220>
<221> misc_feature
<222> (2614)..(2634)
<223> 单组分 NLS
<220>
<221> misc_feature
<222> (6730)..(6777)
<223> 双组分 NLS
<220>
<221> misc_feature
<222> (6783)..(6998)
<223> bGH PolyA
<220>
<221> misc_feature
<222> (7058)..(7207)
<223> 小鼠Rosa26下游
<400> 17
ctgcagtgga gtaggcgggg agaaggccgc acccttctcc ggagggggga ggggagtgtt 60
gcaatacctt tctgggagtt ctctgctgcc tcctggcttc tgaggaccgc cctgggcctg 120
ggagaatccc ttccccctct tccctcgtga tctgcaactc cagtctttct agttgaccag 180
ctcggcggtg acctgcacgt ctagggcgca gtagtccagg gtttccttga tgatgtcata 240
cttatcctgt cccttttttt tccacagggc gcgccactag tggatccgga acccttaata 300
taacttcgta taatgtatgc tatacgaagt tattaggtcc ctcgacctgc aggaattgtt 360
gacaattaat catcggcata gtatatcggc atagtataat acgacaaggt gaggaactaa 420
accatgggat cggccattga acaagatgga ttgcacgcag gttctccggc cgcttgggtg 480
gagaggctat tcggctatga ctgggcacaa cagacaatcg gctgctctga tgccgccgtg 540
ttccggctgt cagcgcaggg gcgcccggtt ctttttgtca agaccgacct gtccggtgcc 600
ctgaatgaac tgcaggacga ggcagcgcgg ctatcgtggc tggccacgac gggcgttcct 660
tgcgcagctg tgctcgacgt tgtcactgaa gcgggaaggg actggctgct attgggcgaa 720
gtgccggggc aggatctcct gtcatctcac cttgctcctg ccgagaaagt atccatcatg 780
gctgatgcaa tgcggcggct gcatacgctt gatccggcta cctgcccatt cgaccaccaa 840
gcgaaacatc gcatcgagcg agcacgtact cggatggaag ccggtcttgt cgatcaggat 900
gatctggacg aagagcatca ggggctcgcg ccagccgaac tgttcgccag gctcaaggcg 960
cgcatgcccg acggcgatga tctcgtcgtg acccatggcg atgcctgctt gccgaatatc 1020
atggtggaaa atggccgctt ttctggattc atcgactgtg gccggctggg tgtggcggac 1080
cgctatcagg acatagcgtt ggctacccgt gatattgctg aagagcttgg cggcgaatgg 1140
gctgaccgct tcctcgtgct ttacggtatc gccgctcccg attcgcagcg catcgccttc 1200
tatcgccttc ttgacgagtt cttctgaggg gatccgctgt aagtctgcag aaattgatga 1260
tctattaaac aataaagatg tccactaaaa tggaagtttt tcctgtcata ctttgttaag 1320
aagggtgaga acagagtacc tacattttga atggaaggat tggagctacg ggggtggggg 1380
tggggtggga ttagataaat gcctgctctt tactgaaggc tctttactat tgctttatga 1440
taatgtttca tagttggata tcataattta aacaagcaaa accaaattaa gggccagctc 1500
attcctccca ctcatgatct atagatctat agatctctcg tgggatcatt gtttttctct 1560
tgattcccac tttgtggttc taagtactgt ggtttccaaa tgtgtcagtt tcatagcctg 1620
aagaacgaga tcagcagcct ctgttccaca tacacttcat tctcagtatt gttttgccaa 1680
gttctaattc catcagaagc ttgcagatct gcgactctag aggatctgcg actctagagg 1740
atcataatca gccataccac atttgtagag gttttacttg ctttaaaaaa cctcccacac 1800
ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt gtttattgca 1860
gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt 1920
tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca tgtctggatc 1980
tgcgactcta gaggatcata atcagccata ccacatttgt agaggtttta cttgctttaa 2040
aaaacctccc acacctcccc ctgaacctga aacataaaat gaatgcaatt gttgttgtta 2100
acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 2160
ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 2220
atcatgtctg gatctgcgac tctagaggat cataatcagc cataccacat ttgtagaggt 2280
tttacttgct ttaaaaaacc tcccacacct ccccctgaac ctgaaacata aaatgaatgc 2340
aattgttgtt gttaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat 2400
cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact 2460
catcaatgta tcttatcatg tctggatccc catcaagctg atccggaacc cttaatataa 2520
cttcgtataa tgtatgctat acgaagttat taggtccctc gacctgcagc ccaagctagt 2580
gcccgggaat tcgctagggc caccatggac aagcccaaga aaaagcggaa agtgaagtac 2640
agcatcggcc tggacatcgg caccaactct gtgggctggg ccgtgatcac cgacgagtac 2700
aaggtgccca gcaagaaatt caaggtgctg ggcaacaccg acaggcacag catcaagaag 2760
aacctgatcg gcgccctgct gttcgacagc ggcgaaacag ccgaggccac cagactgaag 2820
agaaccgcca gaagaagata caccaggcgg aagaacagga tctgctatct gcaagagatc 2880
ttcagcaacg agatggccaa ggtggacgac agcttcttcc acagactgga agagtccttc 2940
ctggtggaag aggacaagaa gcacgagaga caccccatct tcggcaacat cgtggacgag 3000
gtggcctacc acgagaagta ccccaccatc taccacctga gaaagaaact ggtggacagc 3060
accgacaagg ccgacctgag actgatctac ctggccctgg cccacatgat caagttcaga 3120
ggccacttcc tgatcgaggg cgacctgaac cccgacaaca gcgacgtgga caagctgttc 3180
atccagctgg tgcagaccta caaccagctg ttcgaggaaa accccatcaa cgccagcggc 3240
gtggacgcca aggctatcct gtctgccaga ctgagcaaga gcagaaggct ggaaaatctg 3300
atcgcccagc tgcccggcga gaagaagaac ggcctgttcg gcaacctgat tgccctgagc 3360
ctgggcctga cccccaactt caagagcaac ttcgacctgg ccgaggatgc caaactgcag 3420
ctgagcaagg acacctacga cgacgacctg gacaacctgc tggcccagat cggcgaccag 3480
tacgccgacc tgttcctggc cgccaagaac ctgtctgacg ccatcctgct gagcgacatc 3540
ctgagagtga acaccgagat caccaaggcc cccctgagcg cctctatgat caagagatac 3600
gacgagcacc accaggacct gaccctgctg aaagctctcg tgcggcagca gctgcctgag 3660
aagtacaaag aaatcttctt cgaccagagc aagaacggct acgccggcta catcgatggc 3720
ggcgctagcc aggaagagtt ctacaagttc atcaagccca tcctggaaaa gatggacggc 3780
accgaggaac tgctcgtgaa gctgaacaga gaggacctgc tgagaaagca gagaaccttc 3840
gacaacggca gcatccccca ccagatccac ctgggagagc tgcacgctat cctgagaagg 3900
caggaagatt tttacccatt cctgaaggac aaccgggaaa agatcgagaa gatcctgacc 3960
ttcaggatcc cctactacgt gggccccctg gccagaggca acagcagatt cgcctggatg 4020
accagaaaga gcgaggaaac catcaccccc tggaacttcg aggaagtggt ggacaagggc 4080
gccagcgccc agagcttcat cgagagaatg acaaacttcg ataagaacct gcccaacgag 4140
aaggtgctgc ccaagcacag cctgctgtac gagtacttca ccgtgtacaa cgagctgacc 4200
aaagtgaaat acgtgaccga gggaatgaga aagcccgcct tcctgagcgg cgagcagaaa 4260
aaggccatcg tggacctgct gttcaagacc aacagaaaag tgaccgtgaa gcagctgaaa 4320
gaggactact tcaagaaaat cgagtgcttc gactccgtgg aaatctccgg cgtggaagat 4380
agattcaacg cctccctggg cacataccac gatctgctga aaattatcaa ggacaaggac 4440
ttcctggata acgaagagaa cgaggacatt ctggaagata tcgtgctgac cctgacactg 4500
tttgaggacc gcgagatgat cgaggaaagg ctgaaaacct acgctcacct gttcgacgac 4560
aaagtgatga agcagctgaa gagaaggcgg tacaccggct ggggcaggct gagcagaaag 4620
ctgatcaacg gcatcagaga caagcagagc ggcaagacaa tcctggattt cctgaagtcc 4680
gacggcttcg ccaaccggaa cttcatgcag ctgatccacg acgacagcct gacattcaaa 4740
gaggacatcc agaaagccca ggtgtccggc cagggcgact ctctgcacga gcatatcgct 4800
aacctggccg gcagccccgc tatcaagaag ggcatcctgc agacagtgaa ggtggtggac 4860
gagctcgtga aagtgatggg cagacacaag cccgagaaca tcgtgatcga gatggctaga 4920
gagaaccaga ccacccagaa gggacagaag aactcccgcg agaggatgaa gagaatcgaa 4980
gagggcatca aagagctggg cagccagatc ctgaaagaac accccgtgga aaacacccag 5040
ctgcagaacg agaagctgta cctgtactac ctgcagaatg gccgggatat gtacgtggac 5100
caggaactgg acatcaacag actgtccgac tacgatgtgg accatatcgt gcctcagagc 5160
tttctgaagg acgactccat cgataacaaa gtgctgactc ggagcgacaa gaacagaggc 5220
aagagcgaca acgtgccctc cgaagaggtc gtgaagaaga tgaagaacta ctggcgacag 5280
ctgctgaacg ccaagctgat tacccagagg aagttcgata acctgaccaa ggccgagaga 5340
ggcggcctga gcgagctgga taaggccggc ttcatcaaga ggcagctggt ggaaaccaga 5400
cagatcacaa agcacgtggc acagatcctg gactcccgga tgaacactaa gtacgacgaa 5460
aacgataagc tgatccggga agtgaaagtg atcaccctga agtccaagct ggtgtccgat 5520
ttccggaagg atttccagtt ttacaaagtg cgcgagatca acaactacca ccacgcccac 5580
gacgcctacc tgaacgccgt cgtgggaacc gccctgatca aaaagtaccc taagctggaa 5640
agcgagttcg tgtacggcga ctacaaggtg tacgacgtgc ggaagatgat cgccaagagc 5700
gagcaggaaa tcggcaaggc taccgccaag tacttcttct acagcaacat catgaacttt 5760
ttcaagaccg aaatcaccct ggccaacggc gagatcagaa agcgccctct gatcgagaca 5820
aacggcgaaa ccggggagat cgtgtgggat aagggcagag acttcgccac agtgcgaaag 5880
gtgctgagca tgccccaagt gaatatcgtg aaaaagaccg aggtgcagac aggcggcttc 5940
agcaaagagt ctatcctgcc caagaggaac agcgacaagc tgatcgccag aaagaaggac 6000
tgggacccca agaagtacgg cggcttcgac agccctaccg tggcctactc tgtgctggtg 6060
gtggctaagg tggaaaaggg caagtccaag aaactgaaga gtgtgaaaga gctgctgggg 6120
atcaccatca tggaaagaag cagctttgag aagaacccta tcgactttct ggaagccaag 6180
ggctacaaag aagtgaaaaa ggacctgatc atcaagctgc ctaagtactc cctgttcgag 6240
ctggaaaacg gcagaaagag aatgctggcc tctgccggcg aactgcagaa gggaaacgag 6300
ctggccctgc ctagcaaata tgtgaacttc ctgtacctgg cctcccacta tgagaagctg 6360
aagggcagcc ctgaggacaa cgaacagaaa cagctgtttg tggaacagca taagcactac 6420
ctggacgaga tcatcgagca gatcagcgag ttctccaaga gagtgatcct ggccgacgcc 6480
aatctggaca aggtgctgtc tgcctacaac aagcacaggg acaagcctat cagagagcag 6540
gccgagaata tcatccacct gttcaccctg acaaacctgg gcgctcctgc cgccttcaag 6600
tactttgaca ccaccatcga ccggaagagg tacaccagca ccaaagaggt gctggacgcc 6660
accctgatcc accagagcat caccggcctg tacgagacaa gaatcgacct gtctcagctg 6720
ggaggcgaca agagacctgc cgccactaag aaggccggac aggccaaaaa gaagaagtga 6780
gtcgacctcg acctcgactg tgccttctag ttgccagcca tctgttgttt gcccctcccc 6840
cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc ctttcctaat aaaatgagga 6900
aattgcatcg cattgtctga gtaggtgtca ttctattctg gggggtgggg tggggcagga 6960
cagcaagggg gaggattggg aagacaatgg caggcatgct ggggaactag tggtgccagg 7020
gcgtgccctt gggctccccg ggcgcggcgg ccatcgctcg agtaaaattg gagggacaag 7080
acttcccaca gattttcggt tttgtcggga agttttttaa taggggcaaa taaggaaaat 7140
gggaggatag gtagtcatct ggggttttat gcagcaaaac tacaggttat tattgcttgt 7200
gatccgc 7207
<210> 18
<211> 4990
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<222> (1)..(170)
<223> 小鼠Rosa26上游
<220>
<221> misc_feature
<222> (300)..(333)
<223> LoxP
<220>
<221> misc_feature
<222> (382)..(391)
<223> Kozak
<220>
<221> misc_feature
<222> (388)..(4560)
<223> Cas9
<220>
<221> misc_feature
<222> (397)..(417)
<223> 单组分 NLS
<220>
<221> misc_feature
<222> (4513)..(4560)
<223> 双组分 NLS
<220>
<221> misc_feature
<222> (4566)..(4781)
<223> bGH PolyA
<220>
<221> misc_feature
<222> (4841)..(4990)
<223> 小鼠Rosa26下游
<400> 18
ctgcagtgga gtaggcgggg agaaggccgc acccttctcc ggagggggga ggggagtgtt 60
gcaatacctt tctgggagtt ctctgctgcc tcctggcttc tgaggaccgc cctgggcctg 120
ggagaatccc ttccccctct tccctcgtga tctgcaactc cagtctttct agttgaccag 180
ctcggcggtg acctgcacgt ctagggcgca gtagtccagg gtttccttga tgatgtcata 240
cttatcctgt cccttttttt tccacagggc gcgccactag tggatccgga acccttaata 300
taacttcgta taatgtatgc tatacgaagt tattaggtcc ctcgacctgc agcccaagct 360
agtgcccggg aattcgctag ggccaccatg gacaagccca agaaaaagcg gaaagtgaag 420
tacagcatcg gcctggacat cggcaccaac tctgtgggct gggccgtgat caccgacgag 480
tacaaggtgc ccagcaagaa attcaaggtg ctgggcaaca ccgacaggca cagcatcaag 540
aagaacctga tcggcgccct gctgttcgac agcggcgaaa cagccgaggc caccagactg 600
aagagaaccg ccagaagaag atacaccagg cggaagaaca ggatctgcta tctgcaagag 660
atcttcagca acgagatggc caaggtggac gacagcttct tccacagact ggaagagtcc 720
ttcctggtgg aagaggacaa gaagcacgag agacacccca tcttcggcaa catcgtggac 780
gaggtggcct accacgagaa gtaccccacc atctaccacc tgagaaagaa actggtggac 840
agcaccgaca aggccgacct gagactgatc tacctggccc tggcccacat gatcaagttc 900
agaggccact tcctgatcga gggcgacctg aaccccgaca acagcgacgt ggacaagctg 960
ttcatccagc tggtgcagac ctacaaccag ctgttcgagg aaaaccccat caacgccagc 1020
ggcgtggacg ccaaggctat cctgtctgcc agactgagca agagcagaag gctggaaaat 1080
ctgatcgccc agctgcccgg cgagaagaag aacggcctgt tcggcaacct gattgccctg 1140
agcctgggcc tgacccccaa cttcaagagc aacttcgacc tggccgagga tgccaaactg 1200
cagctgagca aggacaccta cgacgacgac ctggacaacc tgctggccca gatcggcgac 1260
cagtacgccg acctgttcct ggccgccaag aacctgtctg acgccatcct gctgagcgac 1320
atcctgagag tgaacaccga gatcaccaag gcccccctga gcgcctctat gatcaagaga 1380
tacgacgagc accaccagga cctgaccctg ctgaaagctc tcgtgcggca gcagctgcct 1440
gagaagtaca aagaaatctt cttcgaccag agcaagaacg gctacgccgg ctacatcgat 1500
ggcggcgcta gccaggaaga gttctacaag ttcatcaagc ccatcctgga aaagatggac 1560
ggcaccgagg aactgctcgt gaagctgaac agagaggacc tgctgagaaa gcagagaacc 1620
ttcgacaacg gcagcatccc ccaccagatc cacctgggag agctgcacgc tatcctgaga 1680
aggcaggaag atttttaccc attcctgaag gacaaccggg aaaagatcga gaagatcctg 1740
accttcagga tcccctacta cgtgggcccc ctggccagag gcaacagcag attcgcctgg 1800
atgaccagaa agagcgagga aaccatcacc ccctggaact tcgaggaagt ggtggacaag 1860
ggcgccagcg cccagagctt catcgagaga atgacaaact tcgataagaa cctgcccaac 1920
gagaaggtgc tgcccaagca cagcctgctg tacgagtact tcaccgtgta caacgagctg 1980
accaaagtga aatacgtgac cgagggaatg agaaagcccg ccttcctgag cggcgagcag 2040
aaaaaggcca tcgtggacct gctgttcaag accaacagaa aagtgaccgt gaagcagctg 2100
aaagaggact acttcaagaa aatcgagtgc ttcgactccg tggaaatctc cggcgtggaa 2160
gatagattca acgcctccct gggcacatac cacgatctgc tgaaaattat caaggacaag 2220
gacttcctgg ataacgaaga gaacgaggac attctggaag atatcgtgct gaccctgaca 2280
ctgtttgagg accgcgagat gatcgaggaa aggctgaaaa cctacgctca cctgttcgac 2340
gacaaagtga tgaagcagct gaagagaagg cggtacaccg gctggggcag gctgagcaga 2400
aagctgatca acggcatcag agacaagcag agcggcaaga caatcctgga tttcctgaag 2460
tccgacggct tcgccaaccg gaacttcatg cagctgatcc acgacgacag cctgacattc 2520
aaagaggaca tccagaaagc ccaggtgtcc ggccagggcg actctctgca cgagcatatc 2580
gctaacctgg ccggcagccc cgctatcaag aagggcatcc tgcagacagt gaaggtggtg 2640
gacgagctcg tgaaagtgat gggcagacac aagcccgaga acatcgtgat cgagatggct 2700
agagagaacc agaccaccca gaagggacag aagaactccc gcgagaggat gaagagaatc 2760
gaagagggca tcaaagagct gggcagccag atcctgaaag aacaccccgt ggaaaacacc 2820
cagctgcaga acgagaagct gtacctgtac tacctgcaga atggccggga tatgtacgtg 2880
gaccaggaac tggacatcaa cagactgtcc gactacgatg tggaccatat cgtgcctcag 2940
agctttctga aggacgactc catcgataac aaagtgctga ctcggagcga caagaacaga 3000
ggcaagagcg acaacgtgcc ctccgaagag gtcgtgaaga agatgaagaa ctactggcga 3060
cagctgctga acgccaagct gattacccag aggaagttcg ataacctgac caaggccgag 3120
agaggcggcc tgagcgagct ggataaggcc ggcttcatca agaggcagct ggtggaaacc 3180
agacagatca caaagcacgt ggcacagatc ctggactccc ggatgaacac taagtacgac 3240
gaaaacgata agctgatccg ggaagtgaaa gtgatcaccc tgaagtccaa gctggtgtcc 3300
gatttccgga aggatttcca gttttacaaa gtgcgcgaga tcaacaacta ccaccacgcc 3360
cacgacgcct acctgaacgc cgtcgtggga accgccctga tcaaaaagta ccctaagctg 3420
gaaagcgagt tcgtgtacgg cgactacaag gtgtacgacg tgcggaagat gatcgccaag 3480
agcgagcagg aaatcggcaa ggctaccgcc aagtacttct tctacagcaa catcatgaac 3540
tttttcaaga ccgaaatcac cctggccaac ggcgagatca gaaagcgccc tctgatcgag 3600
acaaacggcg aaaccgggga gatcgtgtgg gataagggca gagacttcgc cacagtgcga 3660
aaggtgctga gcatgcccca agtgaatatc gtgaaaaaga ccgaggtgca gacaggcggc 3720
ttcagcaaag agtctatcct gcccaagagg aacagcgaca agctgatcgc cagaaagaag 3780
gactgggacc ccaagaagta cggcggcttc gacagcccta ccgtggccta ctctgtgctg 3840
gtggtggcta aggtggaaaa gggcaagtcc aagaaactga agagtgtgaa agagctgctg 3900
gggatcacca tcatggaaag aagcagcttt gagaagaacc ctatcgactt tctggaagcc 3960
aagggctaca aagaagtgaa aaaggacctg atcatcaagc tgcctaagta ctccctgttc 4020
gagctggaaa acggcagaaa gagaatgctg gcctctgccg gcgaactgca gaagggaaac 4080
gagctggccc tgcctagcaa atatgtgaac ttcctgtacc tggcctccca ctatgagaag 4140
ctgaagggca gccctgagga caacgaacag aaacagctgt ttgtggaaca gcataagcac 4200
tacctggacg agatcatcga gcagatcagc gagttctcca agagagtgat cctggccgac 4260
gccaatctgg acaaggtgct gtctgcctac aacaagcaca gggacaagcc tatcagagag 4320
caggccgaga atatcatcca cctgttcacc ctgacaaacc tgggcgctcc tgccgccttc 4380
aagtactttg acaccaccat cgaccggaag aggtacacca gcaccaaaga ggtgctggac 4440
gccaccctga tccaccagag catcaccggc ctgtacgaga caagaatcga cctgtctcag 4500
ctgggaggcg acaagagacc tgccgccact aagaaggccg gacaggccaa aaagaagaag 4560
tgagtcgacc tcgacctcga ctgtgccttc tagttgccag ccatctgttg tttgcccctc 4620
ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga 4680
ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca 4740
ggacagcaag ggggaggatt gggaagacaa tggcaggcat gctggggaac tagtggtgcc 4800
agggcgtgcc cttgggctcc ccgggcgcgg cggccatcgc tcgagtaaaa ttggagggac 4860
aagacttccc acagattttc ggttttgtcg ggaagttttt taataggggc aaataaggaa 4920
aatgggagga taggtagtca tctggggttt tatgcagcaa aactacaggt tattattgct 4980
tgtgatccgc 4990
<210> 19
<211> 1391
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 19
Met Asp Lys Pro Lys Lys Lys Arg Lys Val Lys Tyr Ser Ile Gly Leu
1 5 10 15
Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
20 25 30
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
35 40 45
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
50 55 60
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
65 70 75 80
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
85 90 95
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
100 105 110
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
115 120 125
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
130 135 140
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
145 150 155 160
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
165 170 175
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
180 185 190
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
195 200 205
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
210 215 220
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
225 230 235 240
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
245 250 255
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
260 265 270
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
275 280 285
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
290 295 300
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
305 310 315 320
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
325 330 335
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
340 345 350
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
355 360 365
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
370 375 380
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
385 390 395 400
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
405 410 415
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
420 425 430
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
435 440 445
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
450 455 460
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
465 470 475 480
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
485 490 495
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
500 505 510
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
515 520 525
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
530 535 540
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
545 550 555 560
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
565 570 575
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
580 585 590
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
595 600 605
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
610 615 620
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
625 630 635 640
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
645 650 655
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
660 665 670
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
675 680 685
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
690 695 700
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
705 710 715 720
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
725 730 735
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
740 745 750
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
755 760 765
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
770 775 780
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
785 790 795 800
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
805 810 815
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
820 825 830
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile
835 840 845
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
850 855 860
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu
865 870 875 880
Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
885 890 895
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
900 905 910
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu
915 920 925
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser
930 935 940
Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val
945 950 955 960
Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp
965 970 975
Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His
980 985 990
Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr
995 1000 1005
Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr
1010 1015 1020
Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys
1025 1030 1035
Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe
1040 1045 1050
Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro
1055 1060 1065
Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys
1070 1075 1080
Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln
1085 1090 1095
Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser
1100 1105 1110
Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala
1115 1120 1125
Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser
1130 1135 1140
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys
1145 1150 1155
Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile
1160 1165 1170
Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe
1175 1180 1185
Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile
1190 1195 1200
Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys
1205 1210 1215
Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu
1220 1225 1230
Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His
1235 1240 1245
Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln
1250 1255 1260
Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu
1265 1270 1275
Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn
1280 1285 1290
Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro
1295 1300 1305
Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr
1310 1315 1320
Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile
1325 1330 1335
Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr
1340 1345 1350
Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp
1355 1360 1365
Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr Lys Lys
1370 1375 1380
Ala Gly Gln Ala Lys Lys Lys Lys
1385 1390
<210> 20
<211> 9673
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<222> (1)..(170)
<223> 小鼠Rosa26上游
<220>
<221> misc_feature
<222> (205)..(1923)
<223> CAGG 启动子
<220>
<221> misc_feature
<222> (2006)..(2039)
<223> LoxP
<220>
<221> misc_feature
<222> (2130)..(4195)
<223> Neo-PolyA
<220>
<221> misc_feature
<222> (4223)..(4256)
<223> LoxP
<220>
<221> misc_feature
<222> (4351)..(4360)
<223> Kozak
<220>
<221> misc_feature
<222> (4360)..(4425)
<223> 3xFLAG
<220>
<221> misc_feature
<222> (4426)..(8598)
<223> Cas9
<220>
<221> misc_feature
<222> (4435)..(4455)
<223> 单组分 NLS
<220>
<221> misc_feature
<222> (8551)..(8598)
<223> 双组分 NLS
<220>
<221> misc_feature
<222> (8645)..(9241)
<223> WPRE
<220>
<221> misc_feature
<222> (9249)..(9464)
<223> bGH PolyA
<220>
<221> misc_feature
<222> (9524)..(9673)
<223> 小鼠Rosa26下游
<400> 20
ctgcagtgga gtaggcgggg agaaggccgc acccttctcc ggagggggga ggggagtgtt 60
gcaatacctt tctgggagtt ctctgctgcc tcctggcttc tgaggaccgc cctgggcctg 120
ggagaatccc ttccccctct tccctcgtga tctgcaactc cagtctttct ccttaattaa 180
acgcgtctgg cctcgcgagt gtgtactagt tattaatagt aatcaattac ggggtcatta 240
gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc 300
tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg 360
ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg 420
gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa 480
tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac 540
atctacgtat tagtcatcgc tattaccatg gtcgaggtga gccccacgtt ctgcttcact 600
ctccccatct cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt 660
tgtgcagcga tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc 720
gaggggcggg gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc 780
cgaaagtttc cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg 840
cggcgggcgg ggagtcgctg cgacgctgcc ttcgccccgt gccccgctcc gccgccgcct 900
cgcgccgccc gccccggctc tgactgaccg cgttactccc acaggtgagc gggcgggacg 960
gcccttctcc tccgggctgt aattagcgct tggtttaatg acggcttgtt tcttttctgt 1020
ggctgcgtga aagccttgag gggctccggg agggcccttt gtgcgggggg agcggctcgg 1080
ggggtgcgtg cgtgtgtgtg tgcgtgggga gcgccgcgtg cggctccgcg ctgcccggcg 1140
gctgtgagcg ctgcgggcgc ggcgcggggc tttgtgcgct ccgcagtgtg cgcgagggga 1200
gcgcggccgg gggcggtgcc ccgcggtgcg gggggggctg cgaggggaac aaaggctgcg 1260
tgcggggtgt gtgcgtgggg gggtgagcag ggggtgtggg cgcgtcggtc gggctgcaac 1320
cccccctgca cccccctccc cgagttgctg agcacggccc ggcttcgggt gcggggctcc 1380
gtacggggcg tggcgcgggg ctcgccgtgc cgggcggggg gtggcggcag gtgggggtgc 1440
cgggcggggc ggggccgcct cgggccgggg agggctcggg ggaggggcgc ggcggccccc 1500
ggagcgccgg cggctgtcga ggcgcggcga gccgcagcca ttgcctttta tggtaatcgt 1560
gcgagagggc gcagggactt cctttgtccc aaatctgtgc ggagccgaaa tctgggaggc 1620
gccgccgcac cccctctagc gggcgcgggg cgaagcggtg cggcgccggc aggaaggaaa 1680
tgggcgggga gggccttcgt gcgtcgccgc gccgccgtcc ccttctccct ctccagcctc 1740
ggggctgtcc gcggggggac ggctgccttc gggggggacg gggcagggcg gggttcggct 1800
tctggcgtgt gaccggcggc tctagagcct ctgctaacca tgttcatgcc ttcttctttt 1860
tcctacagct cctgggcaac gtgctggtta ttgtgctgtc tcatcatttt ggcaaagaat 1920
tcgctaggag aattgatttg ataccgcggg ccctaagtcg acatttaaat catttaaatc 1980
cactagtgga tccggaaccc ttaatataac ttcgtataat gtatgctata cgaagttatt 2040
aggtccctcg acctgcagga attgttgaca attaatcatc ggcatagtat atcggcatag 2100
tataatacga caaggtgagg aactaaacca tgggatcggc cattgaacaa gatggattgc 2160
acgcaggttc tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga 2220
caatcggctg ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt 2280
ttgtcaagac cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat 2340
cgtggctggc cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg 2400
gaagggactg gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg 2460
ctcctgccga gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc 2520
cggctacctg cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga 2580
tggaagccgg tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag 2640
ccgaactgtt cgccaggctc aaggcgcgca tgcccgacgg cgatgatctc gtcgtgaccc 2700
atggcgatgc ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg 2760
actgtggccg gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata 2820
ttgctgaaga gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg 2880
ctcccgattc gcagcgcatc gccttctatc gccttcttga cgagttcttc tgaggggatc 2940
cgctgtaagt ctgcagaaat tgatgatcta ttaaacaata aagatgtcca ctaaaatgga 3000
agtttttcct gtcatacttt gttaagaagg gtgagaacag agtacctaca ttttgaatgg 3060
aaggattgga gctacggggg tgggggtggg gtgggattag ataaatgcct gctctttact 3120
gaaggctctt tactattgct ttatgataat gtttcatagt tggatatcat aatttaaaca 3180
agcaaaacca aattaagggc cagctcattc ctcccactca tgatctatag atctatagat 3240
ctctcgtggg atcattgttt ttctcttgat tcccactttg tggttctaag tactgtggtt 3300
tccaaatgtg tcagtttcat agcctgaaga acgagatcag cagcctctgt tccacataca 3360
cttcattctc agtattgttt tgccaagttc taattccatc agaagcttgc agatctgcga 3420
ctctagagga tctgcgactc tagaggatca taatcagcca taccacattt gtagaggttt 3480
tacttgcttt aaaaaacctc ccacacctcc ccctgaacct gaaacataaa atgaatgcaa 3540
ttgttgttgt taacttgttt attgcagctt ataatggtta caaataaagc aatagcatca 3600
caaatttcac aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca 3660
tcaatgtatc ttatcatgtc tggatctgcg actctagagg atcataatca gccataccac 3720
atttgtagag gttttacttg ctttaaaaaa cctcccacac ctccccctga acctgaaaca 3780
taaaatgaat gcaattgttg ttgttaactt gtttattgca gcttataatg gttacaaata 3840
aagcaatagc atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg 3900
tttgtccaaa ctcatcaatg tatcttatca tgtctggatc tgcgactcta gaggatcata 3960
atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc 4020
ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat 4080
aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg 4140
cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtctg gatccccatc 4200
aagctgatcc ggaaccctta atataacttc gtataatgta tgctatacga agttattagg 4260
tccctcgacc tgcagcccaa gctagtgccc gggtaggtcc ctcgacctgc agcccaagct 4320
agatcgaatt cggccggcct tcgaacacgt gccaccatgg actataagga ccacgacgga 4380
gactacaagg atcatgatat tgattacaaa gacgatgacg ataagatgga caagcccaag 4440
aaaaagcgga aagtgaagta cagcatcggc ctggacatcg gcaccaactc tgtgggctgg 4500
gccgtgatca ccgacgagta caaggtgccc agcaagaaat tcaaggtgct gggcaacacc 4560
gacaggcaca gcatcaagaa gaacctgatc ggcgccctgc tgttcgacag cggcgaaaca 4620
gccgaggcca ccagactgaa gagaaccgcc agaagaagat acaccaggcg gaagaacagg 4680
atctgctatc tgcaagagat cttcagcaac gagatggcca aggtggacga cagcttcttc 4740
cacagactgg aagagtcctt cctggtggaa gaggacaaga agcacgagag acaccccatc 4800
ttcggcaaca tcgtggacga ggtggcctac cacgagaagt accccaccat ctaccacctg 4860
agaaagaaac tggtggacag caccgacaag gccgacctga gactgatcta cctggccctg 4920
gcccacatga tcaagttcag aggccacttc ctgatcgagg gcgacctgaa ccccgacaac 4980
agcgacgtgg acaagctgtt catccagctg gtgcagacct acaaccagct gttcgaggaa 5040
aaccccatca acgccagcgg cgtggacgcc aaggctatcc tgtctgccag actgagcaag 5100
agcagaaggc tggaaaatct gatcgcccag ctgcccggcg agaagaagaa cggcctgttc 5160
ggcaacctga ttgccctgag cctgggcctg acccccaact tcaagagcaa cttcgacctg 5220
gccgaggatg ccaaactgca gctgagcaag gacacctacg acgacgacct ggacaacctg 5280
ctggcccaga tcggcgacca gtacgccgac ctgttcctgg ccgccaagaa cctgtctgac 5340
gccatcctgc tgagcgacat cctgagagtg aacaccgaga tcaccaaggc ccccctgagc 5400
gcctctatga tcaagagata cgacgagcac caccaggacc tgaccctgct gaaagctctc 5460
gtgcggcagc agctgcctga gaagtacaaa gaaatcttct tcgaccagag caagaacggc 5520
tacgccggct acatcgatgg cggcgctagc caggaagagt tctacaagtt catcaagccc 5580
atcctggaaa agatggacgg caccgaggaa ctgctcgtga agctgaacag agaggacctg 5640
ctgagaaagc agagaacctt cgacaacggc agcatccccc accagatcca cctgggagag 5700
ctgcacgcta tcctgagaag gcaggaagat ttttacccat tcctgaagga caaccgggaa 5760
aagatcgaga agatcctgac cttcaggatc ccctactacg tgggccccct ggccagaggc 5820
aacagcagat tcgcctggat gaccagaaag agcgaggaaa ccatcacccc ctggaacttc 5880
gaggaagtgg tggacaaggg cgccagcgcc cagagcttca tcgagagaat gacaaacttc 5940
gataagaacc tgcccaacga gaaggtgctg cccaagcaca gcctgctgta cgagtacttc 6000
accgtgtaca acgagctgac caaagtgaaa tacgtgaccg agggaatgag aaagcccgcc 6060
ttcctgagcg gcgagcagaa aaaggccatc gtggacctgc tgttcaagac caacagaaaa 6120
gtgaccgtga agcagctgaa agaggactac ttcaagaaaa tcgagtgctt cgactccgtg 6180
gaaatctccg gcgtggaaga tagattcaac gcctccctgg gcacatacca cgatctgctg 6240
aaaattatca aggacaagga cttcctggat aacgaagaga acgaggacat tctggaagat 6300
atcgtgctga ccctgacact gtttgaggac cgcgagatga tcgaggaaag gctgaaaacc 6360
tacgctcacc tgttcgacga caaagtgatg aagcagctga agagaaggcg gtacaccggc 6420
tggggcaggc tgagcagaaa gctgatcaac ggcatcagag acaagcagag cggcaagaca 6480
atcctggatt tcctgaagtc cgacggcttc gccaaccgga acttcatgca gctgatccac 6540
gacgacagcc tgacattcaa agaggacatc cagaaagccc aggtgtccgg ccagggcgac 6600
tctctgcacg agcatatcgc taacctggcc ggcagccccg ctatcaagaa gggcatcctg 6660
cagacagtga aggtggtgga cgagctcgtg aaagtgatgg gcagacacaa gcccgagaac 6720
atcgtgatcg agatggctag agagaaccag accacccaga agggacagaa gaactcccgc 6780
gagaggatga agagaatcga agagggcatc aaagagctgg gcagccagat cctgaaagaa 6840
caccccgtgg aaaacaccca gctgcagaac gagaagctgt acctgtacta cctgcagaat 6900
ggccgggata tgtacgtgga ccaggaactg gacatcaaca gactgtccga ctacgatgtg 6960
gaccatatcg tgcctcagag ctttctgaag gacgactcca tcgataacaa agtgctgact 7020
cggagcgaca agaacagagg caagagcgac aacgtgccct ccgaagaggt cgtgaagaag 7080
atgaagaact actggcgaca gctgctgaac gccaagctga ttacccagag gaagttcgat 7140
aacctgacca aggccgagag aggcggcctg agcgagctgg ataaggccgg cttcatcaag 7200
aggcagctgg tggaaaccag acagatcaca aagcacgtgg cacagatcct ggactcccgg 7260
atgaacacta agtacgacga aaacgataag ctgatccggg aagtgaaagt gatcaccctg 7320
aagtccaagc tggtgtccga tttccggaag gatttccagt tttacaaagt gcgcgagatc 7380
aacaactacc accacgccca cgacgcctac ctgaacgccg tcgtgggaac cgccctgatc 7440
aaaaagtacc ctaagctgga aagcgagttc gtgtacggcg actacaaggt gtacgacgtg 7500
cggaagatga tcgccaagag cgagcaggaa atcggcaagg ctaccgccaa gtacttcttc 7560
tacagcaaca tcatgaactt tttcaagacc gaaatcaccc tggccaacgg cgagatcaga 7620
aagcgccctc tgatcgagac aaacggcgaa accggggaga tcgtgtggga taagggcaga 7680
gacttcgcca cagtgcgaaa ggtgctgagc atgccccaag tgaatatcgt gaaaaagacc 7740
gaggtgcaga caggcggctt cagcaaagag tctatcctgc ccaagaggaa cagcgacaag 7800
ctgatcgcca gaaagaagga ctgggacccc aagaagtacg gcggcttcga cagccctacc 7860
gtggcctact ctgtgctggt ggtggctaag gtggaaaagg gcaagtccaa gaaactgaag 7920
agtgtgaaag agctgctggg gatcaccatc atggaaagaa gcagctttga gaagaaccct 7980
atcgactttc tggaagccaa gggctacaaa gaagtgaaaa aggacctgat catcaagctg 8040
cctaagtact ccctgttcga gctggaaaac ggcagaaaga gaatgctggc ctctgccggc 8100
gaactgcaga agggaaacga gctggccctg cctagcaaat atgtgaactt cctgtacctg 8160
gcctcccact atgagaagct gaagggcagc cctgaggaca acgaacagaa acagctgttt 8220
gtggaacagc ataagcacta cctggacgag atcatcgagc agatcagcga gttctccaag 8280
agagtgatcc tggccgacgc caatctggac aaggtgctgt ctgcctacaa caagcacagg 8340
gacaagccta tcagagagca ggccgagaat atcatccacc tgttcaccct gacaaacctg 8400
ggcgctcctg ccgccttcaa gtactttgac accaccatcg accggaagag gtacaccagc 8460
accaaagagg tgctggacgc caccctgatc caccagagca tcaccggcct gtacgagaca 8520
agaatcgacc tgtctcagct gggaggcgac aagagacctg ccgccactaa gaaggccgga 8580
caggccaaaa agaagaagtg ataaatgcat ggccggccct gcaggaattc gatatcaagc 8640
ttatcgataa tcaacctctg gattacaaaa tttgtgaaag attgactggt attcttaact 8700
atgttgctcc ttttacgcta tgtggatacg ctgctttaat gcctttgtat catgctattg 8760
cttcccgtat ggctttcatt ttctcctcct tgtataaatc ctggttgctg tctctttatg 8820
aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg cactgtgttt gctgacgcaa 8880
cccccactgg ttggggcatt gccaccacct gtcagctcct ttccgggact ttcgctttcc 8940
ccctccctat tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc tggacagggg 9000
ctcggctgtt gggcactgac aattccgtgg tgttgtcggg gaaatcatcg tcctttcctt 9060
ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac gtccttctgc tacgtccctt 9120
cggccctcaa tccagcggac cttccttccc gcggcctgct gccggctctg cggcctcttc 9180
cgcgtcttcg ccttcgccct cagacgagtc ggatctccct ttgggccgcc tccccgcatc 9240
gataccgtcg acctcgacct cgactgtgcc ttctagttgc cagccatctg ttgtttgccc 9300
ctcccccgtg ccttccttga ccctggaagg tgccactccc actgtccttt cctaataaaa 9360
tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct attctggggg gtggggtggg 9420
gcaggacagc aagggggagg attgggaaga caatggcagg catgctgggg aactagtggt 9480
gccagggcgt gcccttgggc tccccgggcg cggcggccat cgctcgagta aaattggagg 9540
gacaagactt cccacagatt ttcggttttg tcgggaagtt ttttaatagg ggcaaataag 9600
gaaaatggga ggataggtag tcatctgggg ttttatgcag caaaactaca ggttattatt 9660
gcttgtgatc cgc 9673
<210> 21
<211> 7456
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<222> (1)..(170)
<223> 小鼠Rosa26上游
<220>
<221> misc_feature
<222> (205)..(1923)
<223> CAGG 启动子
<220>
<221> misc_feature
<222> (2006)..(2039)
<223> LoxP
<220>
<221> misc_feature
<222> (2134)..(2143)
<223> Kozak
<220>
<221> misc_feature
<222> (2143)..(2208)
<223> 3xFLAG
<220>
<221> misc_feature
<222> (2209)..(6381)
<223> Cas9
<220>
<221> misc_feature
<222> (2218)..(2238)
<223> 单组分 NLS
<220>
<221> misc_feature
<222> (6334)..(6381)
<223> 双组分 NLS
<220>
<221> misc_feature
<222> (6428)..(7024)
<223> WPRE
<220>
<221> misc_feature
<222> (7032)..(7247)
<223> bGH PolyA
<220>
<221> misc_feature
<222> (7307)..(7456)
<223> 小鼠Rosa26下游
<400> 21
ctgcagtgga gtaggcgggg agaaggccgc acccttctcc ggagggggga ggggagtgtt 60
gcaatacctt tctgggagtt ctctgctgcc tcctggcttc tgaggaccgc cctgggcctg 120
ggagaatccc ttccccctct tccctcgtga tctgcaactc cagtctttct ccttaattaa 180
acgcgtctgg cctcgcgagt gtgtactagt tattaatagt aatcaattac ggggtcatta 240
gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc 300
tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg 360
ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg 420
gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa 480
tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac 540
atctacgtat tagtcatcgc tattaccatg gtcgaggtga gccccacgtt ctgcttcact 600
ctccccatct cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt 660
tgtgcagcga tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc 720
gaggggcggg gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc 780
cgaaagtttc cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg 840
cggcgggcgg ggagtcgctg cgacgctgcc ttcgccccgt gccccgctcc gccgccgcct 900
cgcgccgccc gccccggctc tgactgaccg cgttactccc acaggtgagc gggcgggacg 960
gcccttctcc tccgggctgt aattagcgct tggtttaatg acggcttgtt tcttttctgt 1020
ggctgcgtga aagccttgag gggctccggg agggcccttt gtgcgggggg agcggctcgg 1080
ggggtgcgtg cgtgtgtgtg tgcgtgggga gcgccgcgtg cggctccgcg ctgcccggcg 1140
gctgtgagcg ctgcgggcgc ggcgcggggc tttgtgcgct ccgcagtgtg cgcgagggga 1200
gcgcggccgg gggcggtgcc ccgcggtgcg gggggggctg cgaggggaac aaaggctgcg 1260
tgcggggtgt gtgcgtgggg gggtgagcag ggggtgtggg cgcgtcggtc gggctgcaac 1320
cccccctgca cccccctccc cgagttgctg agcacggccc ggcttcgggt gcggggctcc 1380
gtacggggcg tggcgcgggg ctcgccgtgc cgggcggggg gtggcggcag gtgggggtgc 1440
cgggcggggc ggggccgcct cgggccgggg agggctcggg ggaggggcgc ggcggccccc 1500
ggagcgccgg cggctgtcga ggcgcggcga gccgcagcca ttgcctttta tggtaatcgt 1560
gcgagagggc gcagggactt cctttgtccc aaatctgtgc ggagccgaaa tctgggaggc 1620
gccgccgcac cccctctagc gggcgcgggg cgaagcggtg cggcgccggc aggaaggaaa 1680
tgggcgggga gggccttcgt gcgtcgccgc gccgccgtcc ccttctccct ctccagcctc 1740
ggggctgtcc gcggggggac ggctgccttc gggggggacg gggcagggcg gggttcggct 1800
tctggcgtgt gaccggcggc tctagagcct ctgctaacca tgttcatgcc ttcttctttt 1860
tcctacagct cctgggcaac gtgctggtta ttgtgctgtc tcatcatttt ggcaaagaat 1920
tcgctaggag aattgatttg ataccgcggg ccctaagtcg acatttaaat catttaaatc 1980
cactagtgga tccggaaccc ttaatataac ttcgtataat gtatgctata cgaagttatt 2040
aggtccctcg acctgcagcc caagctagtg cccgggtagg tccctcgacc tgcagcccaa 2100
gctagatcga attcggccgg ccttcgaaca cgtgccacca tggactataa ggaccacgac 2160
ggagactaca aggatcatga tattgattac aaagacgatg acgataagat ggacaagccc 2220
aagaaaaagc ggaaagtgaa gtacagcatc ggcctggaca tcggcaccaa ctctgtgggc 2280
tgggccgtga tcaccgacga gtacaaggtg cccagcaaga aattcaaggt gctgggcaac 2340
accgacaggc acagcatcaa gaagaacctg atcggcgccc tgctgttcga cagcggcgaa 2400
acagccgagg ccaccagact gaagagaacc gccagaagaa gatacaccag gcggaagaac 2460
aggatctgct atctgcaaga gatcttcagc aacgagatgg ccaaggtgga cgacagcttc 2520
ttccacagac tggaagagtc cttcctggtg gaagaggaca agaagcacga gagacacccc 2580
atcttcggca acatcgtgga cgaggtggcc taccacgaga agtaccccac catctaccac 2640
ctgagaaaga aactggtgga cagcaccgac aaggccgacc tgagactgat ctacctggcc 2700
ctggcccaca tgatcaagtt cagaggccac ttcctgatcg agggcgacct gaaccccgac 2760
aacagcgacg tggacaagct gttcatccag ctggtgcaga cctacaacca gctgttcgag 2820
gaaaacccca tcaacgccag cggcgtggac gccaaggcta tcctgtctgc cagactgagc 2880
aagagcagaa ggctggaaaa tctgatcgcc cagctgcccg gcgagaagaa gaacggcctg 2940
ttcggcaacc tgattgccct gagcctgggc ctgaccccca acttcaagag caacttcgac 3000
ctggccgagg atgccaaact gcagctgagc aaggacacct acgacgacga cctggacaac 3060
ctgctggccc agatcggcga ccagtacgcc gacctgttcc tggccgccaa gaacctgtct 3120
gacgccatcc tgctgagcga catcctgaga gtgaacaccg agatcaccaa ggcccccctg 3180
agcgcctcta tgatcaagag atacgacgag caccaccagg acctgaccct gctgaaagct 3240
ctcgtgcggc agcagctgcc tgagaagtac aaagaaatct tcttcgacca gagcaagaac 3300
ggctacgccg gctacatcga tggcggcgct agccaggaag agttctacaa gttcatcaag 3360
cccatcctgg aaaagatgga cggcaccgag gaactgctcg tgaagctgaa cagagaggac 3420
ctgctgagaa agcagagaac cttcgacaac ggcagcatcc cccaccagat ccacctggga 3480
gagctgcacg ctatcctgag aaggcaggaa gatttttacc cattcctgaa ggacaaccgg 3540
gaaaagatcg agaagatcct gaccttcagg atcccctact acgtgggccc cctggccaga 3600
ggcaacagca gattcgcctg gatgaccaga aagagcgagg aaaccatcac cccctggaac 3660
ttcgaggaag tggtggacaa gggcgccagc gcccagagct tcatcgagag aatgacaaac 3720
ttcgataaga acctgcccaa cgagaaggtg ctgcccaagc acagcctgct gtacgagtac 3780
ttcaccgtgt acaacgagct gaccaaagtg aaatacgtga ccgagggaat gagaaagccc 3840
gccttcctga gcggcgagca gaaaaaggcc atcgtggacc tgctgttcaa gaccaacaga 3900
aaagtgaccg tgaagcagct gaaagaggac tacttcaaga aaatcgagtg cttcgactcc 3960
gtggaaatct ccggcgtgga agatagattc aacgcctccc tgggcacata ccacgatctg 4020
ctgaaaatta tcaaggacaa ggacttcctg gataacgaag agaacgagga cattctggaa 4080
gatatcgtgc tgaccctgac actgtttgag gaccgcgaga tgatcgagga aaggctgaaa 4140
acctacgctc acctgttcga cgacaaagtg atgaagcagc tgaagagaag gcggtacacc 4200
ggctggggca ggctgagcag aaagctgatc aacggcatca gagacaagca gagcggcaag 4260
acaatcctgg atttcctgaa gtccgacggc ttcgccaacc ggaacttcat gcagctgatc 4320
cacgacgaca gcctgacatt caaagaggac atccagaaag cccaggtgtc cggccagggc 4380
gactctctgc acgagcatat cgctaacctg gccggcagcc ccgctatcaa gaagggcatc 4440
ctgcagacag tgaaggtggt ggacgagctc gtgaaagtga tgggcagaca caagcccgag 4500
aacatcgtga tcgagatggc tagagagaac cagaccaccc agaagggaca gaagaactcc 4560
cgcgagagga tgaagagaat cgaagagggc atcaaagagc tgggcagcca gatcctgaaa 4620
gaacaccccg tggaaaacac ccagctgcag aacgagaagc tgtacctgta ctacctgcag 4680
aatggccggg atatgtacgt ggaccaggaa ctggacatca acagactgtc cgactacgat 4740
gtggaccata tcgtgcctca gagctttctg aaggacgact ccatcgataa caaagtgctg 4800
actcggagcg acaagaacag aggcaagagc gacaacgtgc cctccgaaga ggtcgtgaag 4860
aagatgaaga actactggcg acagctgctg aacgccaagc tgattaccca gaggaagttc 4920
gataacctga ccaaggccga gagaggcggc ctgagcgagc tggataaggc cggcttcatc 4980
aagaggcagc tggtggaaac cagacagatc acaaagcacg tggcacagat cctggactcc 5040
cggatgaaca ctaagtacga cgaaaacgat aagctgatcc gggaagtgaa agtgatcacc 5100
ctgaagtcca agctggtgtc cgatttccgg aaggatttcc agttttacaa agtgcgcgag 5160
atcaacaact accaccacgc ccacgacgcc tacctgaacg ccgtcgtggg aaccgccctg 5220
atcaaaaagt accctaagct ggaaagcgag ttcgtgtacg gcgactacaa ggtgtacgac 5280
gtgcggaaga tgatcgccaa gagcgagcag gaaatcggca aggctaccgc caagtacttc 5340
ttctacagca acatcatgaa ctttttcaag accgaaatca ccctggccaa cggcgagatc 5400
agaaagcgcc ctctgatcga gacaaacggc gaaaccgggg agatcgtgtg ggataagggc 5460
agagacttcg ccacagtgcg aaaggtgctg agcatgcccc aagtgaatat cgtgaaaaag 5520
accgaggtgc agacaggcgg cttcagcaaa gagtctatcc tgcccaagag gaacagcgac 5580
aagctgatcg ccagaaagaa ggactgggac cccaagaagt acggcggctt cgacagccct 5640
accgtggcct actctgtgct ggtggtggct aaggtggaaa agggcaagtc caagaaactg 5700
aagagtgtga aagagctgct ggggatcacc atcatggaaa gaagcagctt tgagaagaac 5760
cctatcgact ttctggaagc caagggctac aaagaagtga aaaaggacct gatcatcaag 5820
ctgcctaagt actccctgtt cgagctggaa aacggcagaa agagaatgct ggcctctgcc 5880
ggcgaactgc agaagggaaa cgagctggcc ctgcctagca aatatgtgaa cttcctgtac 5940
ctggcctccc actatgagaa gctgaagggc agccctgagg acaacgaaca gaaacagctg 6000
tttgtggaac agcataagca ctacctggac gagatcatcg agcagatcag cgagttctcc 6060
aagagagtga tcctggccga cgccaatctg gacaaggtgc tgtctgccta caacaagcac 6120
agggacaagc ctatcagaga gcaggccgag aatatcatcc acctgttcac cctgacaaac 6180
ctgggcgctc ctgccgcctt caagtacttt gacaccacca tcgaccggaa gaggtacacc 6240
agcaccaaag aggtgctgga cgccaccctg atccaccaga gcatcaccgg cctgtacgag 6300
acaagaatcg acctgtctca gctgggaggc gacaagagac ctgccgccac taagaaggcc 6360
ggacaggcca aaaagaagaa gtgataaatg catggccggc cctgcaggaa ttcgatatca 6420
agcttatcga taatcaacct ctggattaca aaatttgtga aagattgact ggtattctta 6480
actatgttgc tccttttacg ctatgtggat acgctgcttt aatgcctttg tatcatgcta 6540
ttgcttcccg tatggctttc attttctcct ccttgtataa atcctggttg ctgtctcttt 6600
atgaggagtt gtggcccgtt gtcaggcaac gtggcgtggt gtgcactgtg tttgctgacg 6660
caacccccac tggttggggc attgccacca cctgtcagct cctttccggg actttcgctt 6720
tccccctccc tattgccacg gcggaactca tcgccgcctg ccttgcccgc tgctggacag 6780
gggctcggct gttgggcact gacaattccg tggtgttgtc ggggaaatca tcgtcctttc 6840
cttggctgct cgcctgtgtt gccacctgga ttctgcgcgg gacgtccttc tgctacgtcc 6900
cttcggccct caatccagcg gaccttcctt cccgcggcct gctgccggct ctgcggcctc 6960
ttccgcgtct tcgccttcgc cctcagacga gtcggatctc cctttgggcc gcctccccgc 7020
atcgataccg tcgacctcga cctcgactgt gccttctagt tgccagccat ctgttgtttg 7080
cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata 7140
aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt 7200
ggggcaggac agcaaggggg aggattggga agacaatggc aggcatgctg gggaactagt 7260
ggtgccaggg cgtgcccttg ggctccccgg gcgcggcggc catcgctcga gtaaaattgg 7320
agggacaaga cttcccacag attttcggtt ttgtcgggaa gttttttaat aggggcaaat 7380
aaggaaaatg ggaggatagg tagtcatctg gggttttatg cagcaaaact acaggttatt 7440
attgcttgtg atccgc 7456
<210> 22
<211> 1413
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<220>
<221> MISC_FEATURE
<222> (1)..(22)
<223> 3xFLAG
<220>
<221> MISC_FEATURE
<222> (23)..(1413)
<223> Cas9
<400> 22
Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp Tyr
1 5 10 15
Lys Asp Asp Asp Asp Lys Met Asp Lys Pro Lys Lys Lys Arg Lys Val
20 25 30
Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly Trp Ala
35 40 45
Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu
50 55 60
Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu
65 70 75 80
Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr
85 90 95
Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln
100 105 110
Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His
115 120 125
Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg
130 135 140
His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys
145 150 155 160
Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp
165 170 175
Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys
180 185 190
Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser
195 200 205
Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu
210 215 220
Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile
225 230 235 240
Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala
245 250 255
Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala
260 265 270
Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala
275 280 285
Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu
290 295 300
Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu
305 310 315 320
Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg
325 330 335
Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys
340 345 350
Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val
355 360 365
Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser
370 375 380
Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu
385 390 395 400
Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu
405 410 415
Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg
420 425 430
Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu
435 440 445
His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp
450 455 460
Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr
465 470 475 480
Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg
485 490 495
Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp
500 505 510
Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp
515 520 525
Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr
530 535 540
Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr
545 550 555 560
Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala
565 570 575
Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln
580 585 590
Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu
595 600 605
Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His
610 615 620
Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu
625 630 635 640
Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu
645 650 655
Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe
660 665 670
Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp
675 680 685
Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser
690 695 700
Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg
705 710 715 720
Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp
725 730 735
Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His
740 745 750
Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln
755 760 765
Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys
770 775 780
Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln
785 790 795 800
Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly
805 810 815
Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn
820 825 830
Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly
835 840 845
Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp
850 855 860
Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser
865 870 875 880
Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser
885 890 895
Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp
900 905 910
Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn
915 920 925
Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly
930 935 940
Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val
945 950 955 960
Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp
965 970 975
Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val
980 985 990
Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn
995 1000 1005
Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly
1010 1015 1020
Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
1025 1030 1035
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1040 1045 1050
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1055 1060 1065
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1070 1075 1080
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1085 1090 1095
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1100 1105 1110
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1115 1120 1125
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1130 1135 1140
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1145 1150 1155
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu
1160 1165 1170
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1175 1180 1185
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1190 1195 1200
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1205 1210 1215
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1220 1225 1230
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1235 1240 1245
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
1250 1255 1260
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
1265 1270 1275
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1280 1285 1290
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
1295 1300 1305
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
1310 1315 1320
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
1325 1330 1335
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
1340 1345 1350
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr
1355 1360 1365
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
1370 1375 1380
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Lys
1385 1390 1395
Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1400 1405 1410
<210> 23
<211> 22
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 23
Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp Tyr
1 5 10 15
Lys Asp Asp Asp Asp Lys
20
<210> 24
<211> 238
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 24
Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val
1 5 10 15
Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu
20 25 30
Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys
35 40 45
Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu
50 55 60
Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys Gln
65 70 75 80
His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg
85 90 95
Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val
100 105 110
Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile
115 120 125
Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn
130 135 140
Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly
145 150 155 160
Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val
165 170 175
Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro
180 185 190
Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu Ser
195 200 205
Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val
210 215 220
Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys
225 230 235
<210> 25
<211> 16
<212> RNA
<213> 人工序列
<220>
<223> 合成的
<400> 25
guuuuagagc uaugcu 16
<210> 26
<211> 67
<212> RNA
<213> 人工序列
<220>
<223> 合成的
<400> 26
agcauagcaa guuaaaauaa ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg 60
gugcuuu 67
<210> 27
<211> 77
<212> RNA
<213> 人工序列
<220>
<223> 合成的
<400> 27
guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60
ggcaccgagu cggugcu 77
<210> 28
<211> 4953
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<222> (1)..(4173)
<223> Cas9
<220>
<221> misc_feature
<222> (4174)..(4239)
<223> P2A
<220>
<221> misc_feature
<222> (4240)..(4953)
<223> eGFP
<400> 28
atggacaagc ccaagaaaaa gcggaaagtg aagtacagca tcggcctgga catcggcacc 60
aactctgtgg gctgggccgt gatcaccgac gagtacaagg tgcccagcaa gaaattcaag 120
gtgctgggca acaccgacag gcacagcatc aagaagaacc tgatcggcgc cctgctgttc 180
gacagcggcg aaacagccga ggccaccaga ctgaagagaa ccgccagaag aagatacacc 240
aggcggaaga acaggatctg ctatctgcaa gagatcttca gcaacgagat ggccaaggtg 300
gacgacagct tcttccacag actggaagag tccttcctgg tggaagagga caagaagcac 360
gagagacacc ccatcttcgg caacatcgtg gacgaggtgg cctaccacga gaagtacccc 420
accatctacc acctgagaaa gaaactggtg gacagcaccg acaaggccga cctgagactg 480
atctacctgg ccctggccca catgatcaag ttcagaggcc acttcctgat cgagggcgac 540
ctgaaccccg acaacagcga cgtggacaag ctgttcatcc agctggtgca gacctacaac 600
cagctgttcg aggaaaaccc catcaacgcc agcggcgtgg acgccaaggc tatcctgtct 660
gccagactga gcaagagcag aaggctggaa aatctgatcg cccagctgcc cggcgagaag 720
aagaacggcc tgttcggcaa cctgattgcc ctgagcctgg gcctgacccc caacttcaag 780
agcaacttcg acctggccga ggatgccaaa ctgcagctga gcaaggacac ctacgacgac 840
gacctggaca acctgctggc ccagatcggc gaccagtacg ccgacctgtt cctggccgcc 900
aagaacctgt ctgacgccat cctgctgagc gacatcctga gagtgaacac cgagatcacc 960
aaggcccccc tgagcgcctc tatgatcaag agatacgacg agcaccacca ggacctgacc 1020
ctgctgaaag ctctcgtgcg gcagcagctg cctgagaagt acaaagaaat cttcttcgac 1080
cagagcaaga acggctacgc cggctacatc gatggcggcg ctagccagga agagttctac 1140
aagttcatca agcccatcct ggaaaagatg gacggcaccg aggaactgct cgtgaagctg 1200
aacagagagg acctgctgag aaagcagaga accttcgaca acggcagcat cccccaccag 1260
atccacctgg gagagctgca cgctatcctg agaaggcagg aagattttta cccattcctg 1320
aaggacaacc gggaaaagat cgagaagatc ctgaccttca ggatccccta ctacgtgggc 1380
cccctggcca gaggcaacag cagattcgcc tggatgacca gaaagagcga ggaaaccatc 1440
accccctgga acttcgagga agtggtggac aagggcgcca gcgcccagag cttcatcgag 1500
agaatgacaa acttcgataa gaacctgccc aacgagaagg tgctgcccaa gcacagcctg 1560
ctgtacgagt acttcaccgt gtacaacgag ctgaccaaag tgaaatacgt gaccgaggga 1620
atgagaaagc ccgccttcct gagcggcgag cagaaaaagg ccatcgtgga cctgctgttc 1680
aagaccaaca gaaaagtgac cgtgaagcag ctgaaagagg actacttcaa gaaaatcgag 1740
tgcttcgact ccgtggaaat ctccggcgtg gaagatagat tcaacgcctc cctgggcaca 1800
taccacgatc tgctgaaaat tatcaaggac aaggacttcc tggataacga agagaacgag 1860
gacattctgg aagatatcgt gctgaccctg acactgtttg aggaccgcga gatgatcgag 1920
gaaaggctga aaacctacgc tcacctgttc gacgacaaag tgatgaagca gctgaagaga 1980
aggcggtaca ccggctgggg caggctgagc agaaagctga tcaacggcat cagagacaag 2040
cagagcggca agacaatcct ggatttcctg aagtccgacg gcttcgccaa ccggaacttc 2100
atgcagctga tccacgacga cagcctgaca ttcaaagagg acatccagaa agcccaggtg 2160
tccggccagg gcgactctct gcacgagcat atcgctaacc tggccggcag ccccgctatc 2220
aagaagggca tcctgcagac agtgaaggtg gtggacgagc tcgtgaaagt gatgggcaga 2280
cacaagcccg agaacatcgt gatcgagatg gctagagaga accagaccac ccagaaggga 2340
cagaagaact cccgcgagag gatgaagaga atcgaagagg gcatcaaaga gctgggcagc 2400
cagatcctga aagaacaccc cgtggaaaac acccagctgc agaacgagaa gctgtacctg 2460
tactacctgc agaatggccg ggatatgtac gtggaccagg aactggacat caacagactg 2520
tccgactacg atgtggacca tatcgtgcct cagagctttc tgaaggacga ctccatcgat 2580
aacaaagtgc tgactcggag cgacaagaac agaggcaaga gcgacaacgt gccctccgaa 2640
gaggtcgtga agaagatgaa gaactactgg cgacagctgc tgaacgccaa gctgattacc 2700
cagaggaagt tcgataacct gaccaaggcc gagagaggcg gcctgagcga gctggataag 2760
gccggcttca tcaagaggca gctggtggaa accagacaga tcacaaagca cgtggcacag 2820
atcctggact cccggatgaa cactaagtac gacgaaaacg ataagctgat ccgggaagtg 2880
aaagtgatca ccctgaagtc caagctggtg tccgatttcc ggaaggattt ccagttttac 2940
aaagtgcgcg agatcaacaa ctaccaccac gcccacgacg cctacctgaa cgccgtcgtg 3000
ggaaccgccc tgatcaaaaa gtaccctaag ctggaaagcg agttcgtgta cggcgactac 3060
aaggtgtacg acgtgcggaa gatgatcgcc aagagcgagc aggaaatcgg caaggctacc 3120
gccaagtact tcttctacag caacatcatg aactttttca agaccgaaat caccctggcc 3180
aacggcgaga tcagaaagcg ccctctgatc gagacaaacg gcgaaaccgg ggagatcgtg 3240
tgggataagg gcagagactt cgccacagtg cgaaaggtgc tgagcatgcc ccaagtgaat 3300
atcgtgaaaa agaccgaggt gcagacaggc ggcttcagca aagagtctat cctgcccaag 3360
aggaacagcg acaagctgat cgccagaaag aaggactggg accccaagaa gtacggcggc 3420
ttcgacagcc ctaccgtggc ctactctgtg ctggtggtgg ctaaggtgga aaagggcaag 3480
tccaagaaac tgaagagtgt gaaagagctg ctggggatca ccatcatgga aagaagcagc 3540
tttgagaaga accctatcga ctttctggaa gccaagggct acaaagaagt gaaaaaggac 3600
ctgatcatca agctgcctaa gtactccctg ttcgagctgg aaaacggcag aaagagaatg 3660
ctggcctctg ccggcgaact gcagaaggga aacgagctgg ccctgcctag caaatatgtg 3720
aacttcctgt acctggcctc ccactatgag aagctgaagg gcagccctga ggacaacgaa 3780
cagaaacagc tgtttgtgga acagcataag cactacctgg acgagatcat cgagcagatc 3840
agcgagttct ccaagagagt gatcctggcc gacgccaatc tggacaaggt gctgtctgcc 3900
tacaacaagc acagggacaa gcctatcaga gagcaggccg agaatatcat ccacctgttc 3960
accctgacaa acctgggcgc tcctgccgcc ttcaagtact ttgacaccac catcgaccgg 4020
aagaggtaca ccagcaccaa agaggtgctg gacgccaccc tgatccacca gagcatcacc 4080
ggcctgtacg agacaagaat cgacctgtct cagctgggag gcgacaagag acctgccgcc 4140
actaagaagg ccggacaggc caaaaagaag aagggaagcg gagccactaa cttctccctg 4200
ttgaaacaag caggggatgt cgaagagaat cccgggccag tgagcaaggg cgaggagctg 4260
ttcaccgggg tggtgcccat cctggtcgag ctggacggcg acgtaaacgg ccacaagttc 4320
agcgtgtccg gcgagggcga gggcgatgcc acctacggca agctgaccct gaagttcatc 4380
tgcaccaccg gcaagctgcc cgtgccctgg cccaccctcg tgaccaccct gacctacggc 4440
gtgcagtgct tcagccgcta ccccgaccac atgaagcagc acgacttctt caagtccgcc 4500
atgcccgaag gctacgtcca ggagcgcacc atcttcttca aggacgacgg caactacaag 4560
acccgcgccg aggtgaagtt cgagggcgac accctggtga accgcatcga gctgaagggc 4620
atcgacttca aggaggacgg caacatcctg gggcacaagc tggagtacaa ctacaacagc 4680
cacaacgtct atatcatggc cgacaagcag aagaacggca tcaaggtgaa cttcaagatc 4740
cgccacaaca tcgaggacgg cagcgtgcag ctcgccgacc actaccagca gaacaccccc 4800
atcggcgacg gccccgtgct gctgcccgac aaccactacc tgagcaccca gtccgccctg 4860
agcaaagacc ccaacgagaa gcgcgatcac atggtcctgc tggagttcgt gaccgccgcc 4920
gggatcactc tcggcatgga cgagctgtac aag 4953
<210> 29
<211> 5019
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<222> (1)..(66)
<223> 3xFLAG
<220>
<221> misc_feature
<222> (67)..(4239)
<223> Cas9
<220>
<221> misc_feature
<222> (4240)..(4305)
<223> P2A
<220>
<221> misc_feature
<222> (4306)..(5019)
<223> eGFP
<400> 29
gactataagg accacgacgg agactacaag gatcatgata ttgattacaa agacgatgac 60
gataagatgg acaagcccaa gaaaaagcgg aaagtgaagt acagcatcgg cctggacatc 120
ggcaccaact ctgtgggctg ggccgtgatc accgacgagt acaaggtgcc cagcaagaaa 180
ttcaaggtgc tgggcaacac cgacaggcac agcatcaaga agaacctgat cggcgccctg 240
ctgttcgaca gcggcgaaac agccgaggcc accagactga agagaaccgc cagaagaaga 300
tacaccaggc ggaagaacag gatctgctat ctgcaagaga tcttcagcaa cgagatggcc 360
aaggtggacg acagcttctt ccacagactg gaagagtcct tcctggtgga agaggacaag 420
aagcacgaga gacaccccat cttcggcaac atcgtggacg aggtggccta ccacgagaag 480
taccccacca tctaccacct gagaaagaaa ctggtggaca gcaccgacaa ggccgacctg 540
agactgatct acctggccct ggcccacatg atcaagttca gaggccactt cctgatcgag 600
ggcgacctga accccgacaa cagcgacgtg gacaagctgt tcatccagct ggtgcagacc 660
tacaaccagc tgttcgagga aaaccccatc aacgccagcg gcgtggacgc caaggctatc 720
ctgtctgcca gactgagcaa gagcagaagg ctggaaaatc tgatcgccca gctgcccggc 780
gagaagaaga acggcctgtt cggcaacctg attgccctga gcctgggcct gacccccaac 840
ttcaagagca acttcgacct ggccgaggat gccaaactgc agctgagcaa ggacacctac 900
gacgacgacc tggacaacct gctggcccag atcggcgacc agtacgccga cctgttcctg 960
gccgccaaga acctgtctga cgccatcctg ctgagcgaca tcctgagagt gaacaccgag 1020
atcaccaagg cccccctgag cgcctctatg atcaagagat acgacgagca ccaccaggac 1080
ctgaccctgc tgaaagctct cgtgcggcag cagctgcctg agaagtacaa agaaatcttc 1140
ttcgaccaga gcaagaacgg ctacgccggc tacatcgatg gcggcgctag ccaggaagag 1200
ttctacaagt tcatcaagcc catcctggaa aagatggacg gcaccgagga actgctcgtg 1260
aagctgaaca gagaggacct gctgagaaag cagagaacct tcgacaacgg cagcatcccc 1320
caccagatcc acctgggaga gctgcacgct atcctgagaa ggcaggaaga tttttaccca 1380
ttcctgaagg acaaccggga aaagatcgag aagatcctga ccttcaggat cccctactac 1440
gtgggccccc tggccagagg caacagcaga ttcgcctgga tgaccagaaa gagcgaggaa 1500
accatcaccc cctggaactt cgaggaagtg gtggacaagg gcgccagcgc ccagagcttc 1560
atcgagagaa tgacaaactt cgataagaac ctgcccaacg agaaggtgct gcccaagcac 1620
agcctgctgt acgagtactt caccgtgtac aacgagctga ccaaagtgaa atacgtgacc 1680
gagggaatga gaaagcccgc cttcctgagc ggcgagcaga aaaaggccat cgtggacctg 1740
ctgttcaaga ccaacagaaa agtgaccgtg aagcagctga aagaggacta cttcaagaaa 1800
atcgagtgct tcgactccgt ggaaatctcc ggcgtggaag atagattcaa cgcctccctg 1860
ggcacatacc acgatctgct gaaaattatc aaggacaagg acttcctgga taacgaagag 1920
aacgaggaca ttctggaaga tatcgtgctg accctgacac tgtttgagga ccgcgagatg 1980
atcgaggaaa ggctgaaaac ctacgctcac ctgttcgacg acaaagtgat gaagcagctg 2040
aagagaaggc ggtacaccgg ctggggcagg ctgagcagaa agctgatcaa cggcatcaga 2100
gacaagcaga gcggcaagac aatcctggat ttcctgaagt ccgacggctt cgccaaccgg 2160
aacttcatgc agctgatcca cgacgacagc ctgacattca aagaggacat ccagaaagcc 2220
caggtgtccg gccagggcga ctctctgcac gagcatatcg ctaacctggc cggcagcccc 2280
gctatcaaga agggcatcct gcagacagtg aaggtggtgg acgagctcgt gaaagtgatg 2340
ggcagacaca agcccgagaa catcgtgatc gagatggcta gagagaacca gaccacccag 2400
aagggacaga agaactcccg cgagaggatg aagagaatcg aagagggcat caaagagctg 2460
ggcagccaga tcctgaaaga acaccccgtg gaaaacaccc agctgcagaa cgagaagctg 2520
tacctgtact acctgcagaa tggccgggat atgtacgtgg accaggaact ggacatcaac 2580
agactgtccg actacgatgt ggaccatatc gtgcctcaga gctttctgaa ggacgactcc 2640
atcgataaca aagtgctgac tcggagcgac aagaacagag gcaagagcga caacgtgccc 2700
tccgaagagg tcgtgaagaa gatgaagaac tactggcgac agctgctgaa cgccaagctg 2760
attacccaga ggaagttcga taacctgacc aaggccgaga gaggcggcct gagcgagctg 2820
gataaggccg gcttcatcaa gaggcagctg gtggaaacca gacagatcac aaagcacgtg 2880
gcacagatcc tggactcccg gatgaacact aagtacgacg aaaacgataa gctgatccgg 2940
gaagtgaaag tgatcaccct gaagtccaag ctggtgtccg atttccggaa ggatttccag 3000
ttttacaaag tgcgcgagat caacaactac caccacgccc acgacgccta cctgaacgcc 3060
gtcgtgggaa ccgccctgat caaaaagtac cctaagctgg aaagcgagtt cgtgtacggc 3120
gactacaagg tgtacgacgt gcggaagatg atcgccaaga gcgagcagga aatcggcaag 3180
gctaccgcca agtacttctt ctacagcaac atcatgaact ttttcaagac cgaaatcacc 3240
ctggccaacg gcgagatcag aaagcgccct ctgatcgaga caaacggcga aaccggggag 3300
atcgtgtggg ataagggcag agacttcgcc acagtgcgaa aggtgctgag catgccccaa 3360
gtgaatatcg tgaaaaagac cgaggtgcag acaggcggct tcagcaaaga gtctatcctg 3420
cccaagagga acagcgacaa gctgatcgcc agaaagaagg actgggaccc caagaagtac 3480
ggcggcttcg acagccctac cgtggcctac tctgtgctgg tggtggctaa ggtggaaaag 3540
ggcaagtcca agaaactgaa gagtgtgaaa gagctgctgg ggatcaccat catggaaaga 3600
agcagctttg agaagaaccc tatcgacttt ctggaagcca agggctacaa agaagtgaaa 3660
aaggacctga tcatcaagct gcctaagtac tccctgttcg agctggaaaa cggcagaaag 3720
agaatgctgg cctctgccgg cgaactgcag aagggaaacg agctggccct gcctagcaaa 3780
tatgtgaact tcctgtacct ggcctcccac tatgagaagc tgaagggcag ccctgaggac 3840
aacgaacaga aacagctgtt tgtggaacag cataagcact acctggacga gatcatcgag 3900
cagatcagcg agttctccaa gagagtgatc ctggccgacg ccaatctgga caaggtgctg 3960
tctgcctaca acaagcacag ggacaagcct atcagagagc aggccgagaa tatcatccac 4020
ctgttcaccc tgacaaacct gggcgctcct gccgccttca agtactttga caccaccatc 4080
gaccggaaga ggtacaccag caccaaagag gtgctggacg ccaccctgat ccaccagagc 4140
atcaccggcc tgtacgagac aagaatcgac ctgtctcagc tgggaggcga caagagacct 4200
gccgccacta agaaggccgg acaggccaaa aagaagaagg gaagcggagc cactaacttc 4260
tccctgttga aacaagcagg ggatgtcgaa gagaatcccg ggccagtgag caagggcgag 4320
gagctgttca ccggggtggt gcccatcctg gtcgagctgg acggcgacgt aaacggccac 4380
aagttcagcg tgtccggcga gggcgagggc gatgccacct acggcaagct gaccctgaag 4440
ttcatctgca ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac caccctgacc 4500
tacggcgtgc agtgcttcag ccgctacccc gaccacatga agcagcacga cttcttcaag 4560
tccgccatgc ccgaaggcta cgtccaggag cgcaccatct tcttcaagga cgacggcaac 4620
tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc tggtgaaccg catcgagctg 4680
aagggcatcg acttcaagga ggacggcaac atcctggggc acaagctgga gtacaactac 4740
aacagccaca acgtctatat catggccgac aagcagaaga acggcatcaa ggtgaacttc 4800
aagatccgcc acaacatcga ggacggcagc gtgcagctcg ccgaccacta ccagcagaac 4860
acccccatcg gcgacggccc cgtgctgctg cccgacaacc actacctgag cacccagtcc 4920
gccctgagca aagaccccaa cgagaagcgc gatcacatgg tcctgctgga gttcgtgacc 4980
gccgccggga tcactctcgg catggacgag ctgtacaag 5019
<210> 30
<211> 4173
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 30
atggacaagc ccaagaaaaa gcggaaagtg aagtacagca tcggcctgga catcggcacc 60
aactctgtgg gctgggccgt gatcaccgac gagtacaagg tgcccagcaa gaaattcaag 120
gtgctgggca acaccgacag gcacagcatc aagaagaacc tgatcggcgc cctgctgttc 180
gacagcggcg aaacagccga ggccaccaga ctgaagagaa ccgccagaag aagatacacc 240
aggcggaaga acaggatctg ctatctgcaa gagatcttca gcaacgagat ggccaaggtg 300
gacgacagct tcttccacag actggaagag tccttcctgg tggaagagga caagaagcac 360
gagagacacc ccatcttcgg caacatcgtg gacgaggtgg cctaccacga gaagtacccc 420
accatctacc acctgagaaa gaaactggtg gacagcaccg acaaggccga cctgagactg 480
atctacctgg ccctggccca catgatcaag ttcagaggcc acttcctgat cgagggcgac 540
ctgaaccccg acaacagcga cgtggacaag ctgttcatcc agctggtgca gacctacaac 600
cagctgttcg aggaaaaccc catcaacgcc agcggcgtgg acgccaaggc tatcctgtct 660
gccagactga gcaagagcag aaggctggaa aatctgatcg cccagctgcc cggcgagaag 720
aagaacggcc tgttcggcaa cctgattgcc ctgagcctgg gcctgacccc caacttcaag 780
agcaacttcg acctggccga ggatgccaaa ctgcagctga gcaaggacac ctacgacgac 840
gacctggaca acctgctggc ccagatcggc gaccagtacg ccgacctgtt cctggccgcc 900
aagaacctgt ctgacgccat cctgctgagc gacatcctga gagtgaacac cgagatcacc 960
aaggcccccc tgagcgcctc tatgatcaag agatacgacg agcaccacca ggacctgacc 1020
ctgctgaaag ctctcgtgcg gcagcagctg cctgagaagt acaaagaaat cttcttcgac 1080
cagagcaaga acggctacgc cggctacatc gatggcggcg ctagccagga agagttctac 1140
aagttcatca agcccatcct ggaaaagatg gacggcaccg aggaactgct cgtgaagctg 1200
aacagagagg acctgctgag aaagcagaga accttcgaca acggcagcat cccccaccag 1260
atccacctgg gagagctgca cgctatcctg agaaggcagg aagattttta cccattcctg 1320
aaggacaacc gggaaaagat cgagaagatc ctgaccttca ggatccccta ctacgtgggc 1380
cccctggcca gaggcaacag cagattcgcc tggatgacca gaaagagcga ggaaaccatc 1440
accccctgga acttcgagga agtggtggac aagggcgcca gcgcccagag cttcatcgag 1500
agaatgacaa acttcgataa gaacctgccc aacgagaagg tgctgcccaa gcacagcctg 1560
ctgtacgagt acttcaccgt gtacaacgag ctgaccaaag tgaaatacgt gaccgaggga 1620
atgagaaagc ccgccttcct gagcggcgag cagaaaaagg ccatcgtgga cctgctgttc 1680
aagaccaaca gaaaagtgac cgtgaagcag ctgaaagagg actacttcaa gaaaatcgag 1740
tgcttcgact ccgtggaaat ctccggcgtg gaagatagat tcaacgcctc cctgggcaca 1800
taccacgatc tgctgaaaat tatcaaggac aaggacttcc tggataacga agagaacgag 1860
gacattctgg aagatatcgt gctgaccctg acactgtttg aggaccgcga gatgatcgag 1920
gaaaggctga aaacctacgc tcacctgttc gacgacaaag tgatgaagca gctgaagaga 1980
aggcggtaca ccggctgggg caggctgagc agaaagctga tcaacggcat cagagacaag 2040
cagagcggca agacaatcct ggatttcctg aagtccgacg gcttcgccaa ccggaacttc 2100
atgcagctga tccacgacga cagcctgaca ttcaaagagg acatccagaa agcccaggtg 2160
tccggccagg gcgactctct gcacgagcat atcgctaacc tggccggcag ccccgctatc 2220
aagaagggca tcctgcagac agtgaaggtg gtggacgagc tcgtgaaagt gatgggcaga 2280
cacaagcccg agaacatcgt gatcgagatg gctagagaga accagaccac ccagaaggga 2340
cagaagaact cccgcgagag gatgaagaga atcgaagagg gcatcaaaga gctgggcagc 2400
cagatcctga aagaacaccc cgtggaaaac acccagctgc agaacgagaa gctgtacctg 2460
tactacctgc agaatggccg ggatatgtac gtggaccagg aactggacat caacagactg 2520
tccgactacg atgtggacca tatcgtgcct cagagctttc tgaaggacga ctccatcgat 2580
aacaaagtgc tgactcggag cgacaagaac agaggcaaga gcgacaacgt gccctccgaa 2640
gaggtcgtga agaagatgaa gaactactgg cgacagctgc tgaacgccaa gctgattacc 2700
cagaggaagt tcgataacct gaccaaggcc gagagaggcg gcctgagcga gctggataag 2760
gccggcttca tcaagaggca gctggtggaa accagacaga tcacaaagca cgtggcacag 2820
atcctggact cccggatgaa cactaagtac gacgaaaacg ataagctgat ccgggaagtg 2880
aaagtgatca ccctgaagtc caagctggtg tccgatttcc ggaaggattt ccagttttac 2940
aaagtgcgcg agatcaacaa ctaccaccac gcccacgacg cctacctgaa cgccgtcgtg 3000
ggaaccgccc tgatcaaaaa gtaccctaag ctggaaagcg agttcgtgta cggcgactac 3060
aaggtgtacg acgtgcggaa gatgatcgcc aagagcgagc aggaaatcgg caaggctacc 3120
gccaagtact tcttctacag caacatcatg aactttttca agaccgaaat caccctggcc 3180
aacggcgaga tcagaaagcg ccctctgatc gagacaaacg gcgaaaccgg ggagatcgtg 3240
tgggataagg gcagagactt cgccacagtg cgaaaggtgc tgagcatgcc ccaagtgaat 3300
atcgtgaaaa agaccgaggt gcagacaggc ggcttcagca aagagtctat cctgcccaag 3360
aggaacagcg acaagctgat cgccagaaag aaggactggg accccaagaa gtacggcggc 3420
ttcgacagcc ctaccgtggc ctactctgtg ctggtggtgg ctaaggtgga aaagggcaag 3480
tccaagaaac tgaagagtgt gaaagagctg ctggggatca ccatcatgga aagaagcagc 3540
tttgagaaga accctatcga ctttctggaa gccaagggct acaaagaagt gaaaaaggac 3600
ctgatcatca agctgcctaa gtactccctg ttcgagctgg aaaacggcag aaagagaatg 3660
ctggcctctg ccggcgaact gcagaaggga aacgagctgg ccctgcctag caaatatgtg 3720
aacttcctgt acctggcctc ccactatgag aagctgaagg gcagccctga ggacaacgaa 3780
cagaaacagc tgtttgtgga acagcataag cactacctgg acgagatcat cgagcagatc 3840
agcgagttct ccaagagagt gatcctggcc gacgccaatc tggacaaggt gctgtctgcc 3900
tacaacaagc acagggacaa gcctatcaga gagcaggccg agaatatcat ccacctgttc 3960
accctgacaa acctgggcgc tcctgccgcc ttcaagtact ttgacaccac catcgaccgg 4020
aagaggtaca ccagcaccaa agaggtgctg gacgccaccc tgatccacca gagcatcacc 4080
ggcctgtacg agacaagaat cgacctgtct cagctgggag gcgacaagag acctgccgcc 4140
actaagaagg ccggacaggc caaaaagaag aag 4173
<210> 31
<211> 4239
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<222> (1)..(66)
<223> 3xFLAG
<220>
<221> misc_feature
<222> (67)..(4239)
<223> Cas9
<400> 31
gactataagg accacgacgg agactacaag gatcatgata ttgattacaa agacgatgac 60
gataagatgg acaagcccaa gaaaaagcgg aaagtgaagt acagcatcgg cctggacatc 120
ggcaccaact ctgtgggctg ggccgtgatc accgacgagt acaaggtgcc cagcaagaaa 180
ttcaaggtgc tgggcaacac cgacaggcac agcatcaaga agaacctgat cggcgccctg 240
ctgttcgaca gcggcgaaac agccgaggcc accagactga agagaaccgc cagaagaaga 300
tacaccaggc ggaagaacag gatctgctat ctgcaagaga tcttcagcaa cgagatggcc 360
aaggtggacg acagcttctt ccacagactg gaagagtcct tcctggtgga agaggacaag 420
aagcacgaga gacaccccat cttcggcaac atcgtggacg aggtggccta ccacgagaag 480
taccccacca tctaccacct gagaaagaaa ctggtggaca gcaccgacaa ggccgacctg 540
agactgatct acctggccct ggcccacatg atcaagttca gaggccactt cctgatcgag 600
ggcgacctga accccgacaa cagcgacgtg gacaagctgt tcatccagct ggtgcagacc 660
tacaaccagc tgttcgagga aaaccccatc aacgccagcg gcgtggacgc caaggctatc 720
ctgtctgcca gactgagcaa gagcagaagg ctggaaaatc tgatcgccca gctgcccggc 780
gagaagaaga acggcctgtt cggcaacctg attgccctga gcctgggcct gacccccaac 840
ttcaagagca acttcgacct ggccgaggat gccaaactgc agctgagcaa ggacacctac 900
gacgacgacc tggacaacct gctggcccag atcggcgacc agtacgccga cctgttcctg 960
gccgccaaga acctgtctga cgccatcctg ctgagcgaca tcctgagagt gaacaccgag 1020
atcaccaagg cccccctgag cgcctctatg atcaagagat acgacgagca ccaccaggac 1080
ctgaccctgc tgaaagctct cgtgcggcag cagctgcctg agaagtacaa agaaatcttc 1140
ttcgaccaga gcaagaacgg ctacgccggc tacatcgatg gcggcgctag ccaggaagag 1200
ttctacaagt tcatcaagcc catcctggaa aagatggacg gcaccgagga actgctcgtg 1260
aagctgaaca gagaggacct gctgagaaag cagagaacct tcgacaacgg cagcatcccc 1320
caccagatcc acctgggaga gctgcacgct atcctgagaa ggcaggaaga tttttaccca 1380
ttcctgaagg acaaccggga aaagatcgag aagatcctga ccttcaggat cccctactac 1440
gtgggccccc tggccagagg caacagcaga ttcgcctgga tgaccagaaa gagcgaggaa 1500
accatcaccc cctggaactt cgaggaagtg gtggacaagg gcgccagcgc ccagagcttc 1560
atcgagagaa tgacaaactt cgataagaac ctgcccaacg agaaggtgct gcccaagcac 1620
agcctgctgt acgagtactt caccgtgtac aacgagctga ccaaagtgaa atacgtgacc 1680
gagggaatga gaaagcccgc cttcctgagc ggcgagcaga aaaaggccat cgtggacctg 1740
ctgttcaaga ccaacagaaa agtgaccgtg aagcagctga aagaggacta cttcaagaaa 1800
atcgagtgct tcgactccgt ggaaatctcc ggcgtggaag atagattcaa cgcctccctg 1860
ggcacatacc acgatctgct gaaaattatc aaggacaagg acttcctgga taacgaagag 1920
aacgaggaca ttctggaaga tatcgtgctg accctgacac tgtttgagga ccgcgagatg 1980
atcgaggaaa ggctgaaaac ctacgctcac ctgttcgacg acaaagtgat gaagcagctg 2040
aagagaaggc ggtacaccgg ctggggcagg ctgagcagaa agctgatcaa cggcatcaga 2100
gacaagcaga gcggcaagac aatcctggat ttcctgaagt ccgacggctt cgccaaccgg 2160
aacttcatgc agctgatcca cgacgacagc ctgacattca aagaggacat ccagaaagcc 2220
caggtgtccg gccagggcga ctctctgcac gagcatatcg ctaacctggc cggcagcccc 2280
gctatcaaga agggcatcct gcagacagtg aaggtggtgg acgagctcgt gaaagtgatg 2340
ggcagacaca agcccgagaa catcgtgatc gagatggcta gagagaacca gaccacccag 2400
aagggacaga agaactcccg cgagaggatg aagagaatcg aagagggcat caaagagctg 2460
ggcagccaga tcctgaaaga acaccccgtg gaaaacaccc agctgcagaa cgagaagctg 2520
tacctgtact acctgcagaa tggccgggat atgtacgtgg accaggaact ggacatcaac 2580
agactgtccg actacgatgt ggaccatatc gtgcctcaga gctttctgaa ggacgactcc 2640
atcgataaca aagtgctgac tcggagcgac aagaacagag gcaagagcga caacgtgccc 2700
tccgaagagg tcgtgaagaa gatgaagaac tactggcgac agctgctgaa cgccaagctg 2760
attacccaga ggaagttcga taacctgacc aaggccgaga gaggcggcct gagcgagctg 2820
gataaggccg gcttcatcaa gaggcagctg gtggaaacca gacagatcac aaagcacgtg 2880
gcacagatcc tggactcccg gatgaacact aagtacgacg aaaacgataa gctgatccgg 2940
gaagtgaaag tgatcaccct gaagtccaag ctggtgtccg atttccggaa ggatttccag 3000
ttttacaaag tgcgcgagat caacaactac caccacgccc acgacgccta cctgaacgcc 3060
gtcgtgggaa ccgccctgat caaaaagtac cctaagctgg aaagcgagtt cgtgtacggc 3120
gactacaagg tgtacgacgt gcggaagatg atcgccaaga gcgagcagga aatcggcaag 3180
gctaccgcca agtacttctt ctacagcaac atcatgaact ttttcaagac cgaaatcacc 3240
ctggccaacg gcgagatcag aaagcgccct ctgatcgaga caaacggcga aaccggggag 3300
atcgtgtggg ataagggcag agacttcgcc acagtgcgaa aggtgctgag catgccccaa 3360
gtgaatatcg tgaaaaagac cgaggtgcag acaggcggct tcagcaaaga gtctatcctg 3420
cccaagagga acagcgacaa gctgatcgcc agaaagaagg actgggaccc caagaagtac 3480
ggcggcttcg acagccctac cgtggcctac tctgtgctgg tggtggctaa ggtggaaaag 3540
ggcaagtcca agaaactgaa gagtgtgaaa gagctgctgg ggatcaccat catggaaaga 3600
agcagctttg agaagaaccc tatcgacttt ctggaagcca agggctacaa agaagtgaaa 3660
aaggacctga tcatcaagct gcctaagtac tccctgttcg agctggaaaa cggcagaaag 3720
agaatgctgg cctctgccgg cgaactgcag aagggaaacg agctggccct gcctagcaaa 3780
tatgtgaact tcctgtacct ggcctcccac tatgagaagc tgaagggcag ccctgaggac 3840
aacgaacaga aacagctgtt tgtggaacag cataagcact acctggacga gatcatcgag 3900
cagatcagcg agttctccaa gagagtgatc ctggccgacg ccaatctgga caaggtgctg 3960
tctgcctaca acaagcacag ggacaagcct atcagagagc aggccgagaa tatcatccac 4020
ctgttcaccc tgacaaacct gggcgctcct gccgccttca agtactttga caccaccatc 4080
gaccggaaga ggtacaccag caccaaagag gtgctggacg ccaccctgat ccaccagagc 4140
atcaccggcc tgtacgagac aagaatcgac ctgtctcagc tgggaggcga caagagacct 4200
gccgccacta agaaggccgg acaggccaaa aagaagaag 4239
<210> 32
<211> 66
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 32
ggaagcggag ccactaactt ctccctgttg aaacaagcag gggatgtcga agagaatccc 60
gggcca 66
<210> 33
<211> 714
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 33
gtgagcaagg gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc 60
gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc 120
aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc 180
gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcag 240
cacgacttct tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc 300
aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg 360
aaccgcatcg agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag 420
ctggagtaca actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc 480
atcaaggtga acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac 540
cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac 600
ctgagcaccc agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg 660
ctggagttcg tgaccgccgc cgggatcact ctcggcatgg acgagctgta caag 714
<210> 34
<211> 66
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 34
gactataagg accacgacgg agactacaag gatcatgata ttgattacaa agacgatgac 60
gataag 66
<210> 35
<211> 597
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 35
cgataatcaa cctctggatt acaaaatttg tgaaagattg actggtattc ttaactatgt 60
tgctcctttt acgctatgtg gatacgctgc tttaatgcct ttgtatcatg ctattgcttc 120
ccgtatggct ttcattttct cctccttgta taaatcctgg ttgctgtctc tttatgagga 180
gttgtggccc gttgtcaggc aacgtggcgt ggtgtgcact gtgtttgctg acgcaacccc 240
cactggttgg ggcattgcca ccacctgtca gctcctttcc gggactttcg ctttccccct 300
ccctattgcc acggcggaac tcatcgccgc ctgccttgcc cgctgctgga caggggctcg 360
gctgttgggc actgacaatt ccgtggtgtt gtcggggaaa tcatcgtcct ttccttggct 420
gctcgcctgt gttgccacct ggattctgcg cgggacgtcc ttctgctacg tcccttcggc 480
cctcaatcca gcggaccttc cttcccgcgg cctgctgccg gctctgcggc ctcttccgcg 540
tcttcgcctt cgccctcaga cgagtcggat ctccctttgg gccgcctccc cgcatcg 597
<210> 36
<211> 216
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 36
cgacctcgac ctcgactgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg 60
tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa 120
ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca 180
gcaaggggga ggattgggaa gacaatggca ggcatg 216
<210> 37
<211> 2066
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 37
atgggatcgg ccattgaaca agatggattg cacgcaggtt ctccggccgc ttgggtggag 60
aggctattcg gctatgactg ggcacaacag acaatcggct gctctgatgc cgccgtgttc 120
cggctgtcag cgcaggggcg cccggttctt tttgtcaaga ccgacctgtc cggtgccctg 180
aatgaactgc aggacgaggc agcgcggcta tcgtggctgg ccacgacggg cgttccttgc 240
gcagctgtgc tcgacgttgt cactgaagcg ggaagggact ggctgctatt gggcgaagtg 300
ccggggcagg atctcctgtc atctcacctt gctcctgccg agaaagtatc catcatggct 360
gatgcaatgc ggcggctgca tacgcttgat ccggctacct gcccattcga ccaccaagcg 420
aaacatcgca tcgagcgagc acgtactcgg atggaagccg gtcttgtcga tcaggatgat 480
ctggacgaag agcatcaggg gctcgcgcca gccgaactgt tcgccaggct caaggcgcgc 540
atgcccgacg gcgatgatct cgtcgtgacc catggcgatg cctgcttgcc gaatatcatg 600
gtggaaaatg gccgcttttc tggattcatc gactgtggcc ggctgggtgt ggcggaccgc 660
tatcaggaca tagcgttggc tacccgtgat attgctgaag agcttggcgg cgaatgggct 720
gaccgcttcc tcgtgcttta cggtatcgcc gctcccgatt cgcagcgcat cgccttctat 780
cgccttcttg acgagttctt ctgaggggat ccgctgtaag tctgcagaaa ttgatgatct 840
attaaacaat aaagatgtcc actaaaatgg aagtttttcc tgtcatactt tgttaagaag 900
ggtgagaaca gagtacctac attttgaatg gaaggattgg agctacgggg gtgggggtgg 960
ggtgggatta gataaatgcc tgctctttac tgaaggctct ttactattgc tttatgataa 1020
tgtttcatag ttggatatca taatttaaac aagcaaaacc aaattaaggg ccagctcatt 1080
cctcccactc atgatctata gatctataga tctctcgtgg gatcattgtt tttctcttga 1140
ttcccacttt gtggttctaa gtactgtggt ttccaaatgt gtcagtttca tagcctgaag 1200
aacgagatca gcagcctctg ttccacatac acttcattct cagtattgtt ttgccaagtt 1260
ctaattccat cagaagcttg cagatctgcg actctagagg atctgcgact ctagaggatc 1320
ataatcagcc ataccacatt tgtagaggtt ttacttgctt taaaaaacct cccacacctc 1380
cccctgaacc tgaaacataa aatgaatgca attgttgttg ttaacttgtt tattgcagct 1440
tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc atttttttca 1500
ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctggatctgc 1560
gactctagag gatcataatc agccatacca catttgtaga ggttttactt gctttaaaaa 1620
acctcccaca cctccccctg aacctgaaac ataaaatgaa tgcaattgtt gttgttaact 1680
tgtttattgc agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata 1740
aagcattttt ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc 1800
atgtctggat ctgcgactct agaggatcat aatcagccat accacatttg tagaggtttt 1860
acttgcttta aaaaacctcc cacacctccc cctgaacctg aaacataaaa tgaatgcaat 1920
tgttgttgtt aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac 1980
aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat 2040
caatgtatct tatcatgtct ggatcc 2066
<210> 38
<211> 1719
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 38
actagttatt aatagtaatc aattacgggg tcattagttc atagcccata tatggagttc 60
cgcgttacat aacttacggt aaatggcccg cctggctgac cgcccaacga cccccgccca 120
ttgacgtcaa taatgacgta tgttcccata gtaacgccaa tagggacttt ccattgacgt 180
caatgggtgg agtatttacg gtaaactgcc cacttggcag tacatcaagt gtatcatatg 240
ccaagtacgc cccctattga cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag 300
tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt catcgctatt 360
accatggtcg aggtgagccc cacgttctgc ttcactctcc ccatctcccc cccctcccca 420
cccccaattt tgtatttatt tattttttaa ttattttgtg cagcgatggg ggcggggggg 480
gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg ggcgaggcgg 540
agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt tatggcgagg 600
cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcggggag tcgctgcgac 660
gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc cggctctgac 720
tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg ggctgtaatt 780
agcgcttggt ttaatgacgg cttgtttctt ttctgtggct gcgtgaaagc cttgaggggc 840
tccgggaggg ccctttgtgc ggggggagcg gctcgggggg tgcgtgcgtg tgtgtgtgcg 900
tggggagcgc cgcgtgcggc tccgcgctgc ccggcggctg tgagcgctgc gggcgcggcg 960
cggggctttg tgcgctccgc agtgtgcgcg aggggagcgc ggccgggggc ggtgccccgc 1020
ggtgcggggg gggctgcgag gggaacaaag gctgcgtgcg gggtgtgtgc gtgggggggt 1080
gagcaggggg tgtgggcgcg tcggtcgggc tgcaaccccc cctgcacccc cctccccgag 1140
ttgctgagca cggcccggct tcgggtgcgg ggctccgtac ggggcgtggc gcggggctcg 1200
ccgtgccggg cggggggtgg cggcaggtgg gggtgccggg cggggcgggg ccgcctcggg 1260
ccggggaggg ctcgggggag gggcgcggcg gcccccggag cgccggcggc tgtcgaggcg 1320
cggcgagccg cagccattgc cttttatggt aatcgtgcga gagggcgcag ggacttcctt 1380
tgtcccaaat ctgtgcggag ccgaaatctg ggaggcgccg ccgcaccccc tctagcgggc 1440
gcggggcgaa gcggtgcggc gccggcagga aggaaatggg cggggagggc cttcgtgcgt 1500
cgccgcgccg ccgtcccctt ctccctctcc agcctcgggg ctgtccgcgg ggggacggct 1560
gccttcgggg gggacggggc agggcggggt tcggcttctg gcgtgtgacc ggcggctcta 1620
gagcctctgc taaccatgtt catgccttct tctttttcct acagctcctg ggcaacgtgc 1680
tggttattgt gctgtctcat cattttggca aagaattcg 1719

Claims (134)

1.一种测试CRISPR/Cas核酸酶体内修饰目标基因组基因座的能力的方法,包括:
(a)向啮齿动物体内引入设计为靶向目标基因组基因座处的向导RNA靶向序列的向导RNA,
其中,所述啮齿动物在其种系中,在Rosa26基因座处包含基因组整合的Cas9表达盒,
其中,所述Cas9表达盒包含Cas9蛋白质的编码序列,其中所述Cas9蛋白质包含SEQ IDNO:19中列出的完整序列,以及
其中,所述向导RNA通过腺相关病毒(AAV)介导的递送被引入;以及
(b)评价对所述目标基因组基因座的修饰。
2.根据权利要求1所述的方法,其中,所述啮齿动物为大鼠或小鼠。
3.根据权利要求1或2所述的方法,其中所述AAV是AAV7、AAV8或AAV9,且步骤(b)包括评估对肝脏中所述目标基因组基因座的修饰。
4.根据权利要求3所述的方法,其中所述AAV是AAV8。
5.根据权利要求1、2和4中任意一项所述的方法,其中,将所述AAV给药于所述啮齿动物的途径是静脉内注射、脑实质内注射、腹膜内注射、鼻灌注或玻璃体内注射。
6.根据权利要求1、2和4中任意一项所述的方法,其中,在步骤(a)中引入外源供体核酸,其中,所述外源供体核酸被设计为与所述目标基因组基因座重组。
7.根据权利要求6所述的方法,其中,所述外源供体核酸是单链寡脱氧核苷酸(ssODN)。
8.根据权利要求1、2、4和7中任意一项所述的方法,其中,所述目标基因组基因座包括目标基因,并且步骤(b)包括测量所述目标基因的表达或由所述目标基因编码的蛋白质的活性。
9.根据权利要求1、2、4和7中任意一项所述的方法,其中,步骤(b)包括对分离自所述啮齿动物的一种或多种细胞中的目标基因组基因座进行测序。
10.根据权利要求1、2、4和7中任意一项所述的方法,其中,步骤(b)包括从所述非啮齿动物中分离目标器官或组织并且评价对所述目标器官或组织中的目标基因组基因座的修饰。
11.根据权利要求10所述的方法,其中,步骤(b)包括评价对所述目标器官或组织中的两种或多种不同的细胞类型中的目标基因组基因座的修饰。
12.根据权利要求1、2、4、7和11中任意一项所述的方法,其中,步骤(b)包括从所述啮齿动物中分离非目标器官或组织并且评价对所述非目标器官或组织中的目标基因组基因座的修饰。
13.根据权利要求1、2、4、7和11中任意一项所述的方法,其中,所述Cas9表达盒还包括所述Cas9蛋白质的编码序列上游的聚腺苷酸化信号,其中,所述聚腺苷酸化信号的侧面具有重组酶识别位点,并且,其中,所述Cas9表达盒中的聚腺苷酸化信号以组织特异性的方式被删除。
14.根据权利要求13所述的方法,其中,在所述肝脏中已删除了所述Cas9蛋白质的编码序列上游的所述聚腺苷酸化信号。
15.根据权利要求13所述的方法,其中,所述识别所述Cas9表达盒中的重组酶识别位点的重组酶是Cre重组酶。
16.根据权利要求15所述的方法,其中,所述啮齿动物还包含基因组整合的Cre重组酶表达盒,所述基因组整合的Cre重组酶表达盒包含可操作地连接至组织特异性启动子的Cre重组酶编码序列。
17.根据权利要求15或16所述的方法,其中,所述Cre重组酶基因可操作地连接至表2列出的启动子中的一个。
18.根据权利要求1、2、4、7和11中任意一项所述的方法,其中,所述Cas9表达盒还包含所述Cas9蛋白质的编码序列上游的聚腺苷酸化信号,其中,所述聚腺苷酸化信号的侧面具有重组酶识别位点,并且,其中,所述方法还包括以组织特异性的方式向所述啮齿动物体内引入重组酶。
19.根据权利要求18所述的方法,其中,所述重组酶通过腺相关病毒(AAV)介导的递送或脂质纳米颗粒(LNP)介导的递送被引入。
20.根据权利要求1、2、4、7、11、14-16和19中任意一项所述的方法,其中,所述Cas9表达盒还包含荧光蛋白编码序列。
21.根据权利要求20所述的方法,其中,所述Cas9表达盒包括多顺反子核酸,所述多顺反子核酸包含由介入的内部核糖体进入位点(IRES)或介入的2A肽编码序列分隔开的所述Cas9蛋白质的编码序列和所述荧光蛋白编码序列。
22.根据权利要求21所述的方法,其中,所述Cas9表达盒中的多顺反子核酸包括由介入的P2A肽编码序列分隔开的所述Cas9蛋白质的编码序列和绿色荧光蛋白编码序列。
23.根据权利要求1、2、4、7、11、14-16和19中任意一项所述的方法,其中,所述Cas9表达盒不包括荧光蛋白编码序列。
24.根据权利要求1、2、4、7、11、14-16、19、21和22中任意一项所述的方法,其中,所述Cas9蛋白质还包含蛋白质标签。
25.根据权利要求1、2、4、7、11、14-16、19、21和22中任意一项所述的方法,其中,所述Cas9表达盒的5’端还包含3’剪接序列。
26.根据权利要求1、2、4、7、11、14-16、19、21和22中任意一项所述的方法,其中,所述Cas9表达盒可操作地连接至内源启动子。
27.根据权利要求1、2、4、7、11、14-16、19、21和22中任意一项所述的方法,其中,所述Cas9表达盒可操作地连接至外源组成性启动子。
28.根据权利要求1、2、4、7、11、14-16、19、21和22中任意一项所述的方法,其中,所述Cas9表达盒编码包含SEQ ID NO:13、16或22中列出的序列的蛋白质。
29.根据权利要求1、2、4、7、11、14-16、19、21和22中任意一项所述的方法,其中,所述Cas9表达盒包含SEQ ID NO:28、29、30或31中列出的序列。
30.根据权利要求29所述的方法,其中,所述Cas9表达盒包含SEQ ID NO:1、12、14、15、17、18、20或21中列出的序列。
31.根据权利要求1、2、4、7、11、14-16、19、21、22和30中任意一项所述的方法,其中,所述Cas9表达盒被整合至所述Rosa26基因座的第一内含子中。
32.根据权利要求1、2、4、7、11、14-16、19、21、22和30中任意一项所述的方法,其中,所述啮齿动物对于所述Cas9表达盒而言是杂合的。
33.根据权利要求1、2、4、7、11、14-16、19、21、22和30中任意一项所述的方法,其中,所述啮齿动物对于所述Cas9表达盒而言是纯合的。
34.根据权利要求1、2、4、7、11、14-16、19、21、22和30中任意一项所述的方法,其中,所述AAV是通过静脉内注射递送至所述啮齿动物的AAV8,
其中,所述Cas9表达盒可操作地连接至所述内源Rosa26启动子、插入所述Rosa26基因座的第一内含子中,并且在5’至3’方向上包括:(i)3’剪接序列;和(ii)所述Cas9蛋白质的编码序列;并且
其中,步骤(b)包括评价对所述啮齿动物的肝脏中的目标基因组基因座的修饰。
35.一种优化CRISPR/Cas核酸酶体内修饰目标基因组基因座的能力的方法,包括:
(I)在第一啮齿动物中第一次执行权利要求1、2、4、7、11、14-16、19、21、22和30中任意一项所述的方法;
(II)改变可变量并且在第二啮齿动物中使用改变的可变量再次执行步骤(I)的方法;以及
(III)将步骤(I)中的对所述目标基因组基因座的修饰与步骤(II)中的对所述目标基因组基因座的修饰进行比较并且选择对所述目标基因组基因座的修饰具有较高的效率、较高的精确度、较高的一致性或较高的特异性中的一种或多种的方法。
36.根据权利要求35所述的方法,其中,所述啮齿动物是大鼠或小鼠。
37.根据权利要求35或36所述的方法,其中,步骤(II)中改变的可变量是AAV血清型。
38.根据权利要求35或36所述的方法,其中,步骤(II)中改变的可变量是将所述向导RNA引入至所述啮齿动物的给药途径。
39.根据权利要求35或36所述的方法,其中,步骤(II)中改变的可变量是引入至所述啮齿动物的向导RNA的浓度或量。
40.根据权利要求35或36所述的方法,其中,步骤(II)中改变的可变量是引入至所述啮齿动物的向导RNA。
41.根据权利要求35或36所述的方法,其中,所述方法包括引入外源供体核酸,并且,其中,步骤(II)中改变的可变量是将所述外源供体核酸引入至所述啮齿动物的递送方法。
42.根据权利要求35或36所述的方法,其中,所述方法包括引入外源供体核酸,并且,步骤(II)中改变的可变量是将所述外源供体核酸引入至所述啮齿动物的给药途径。
43.根据权利要求35或36所述的方法,其中,所述方法包括引入外源供体核酸,并且,步骤(II)中改变的可变量是引入至所述啮齿动物的所述外源供体核酸的浓度或量。
44.根据权利要求35或36所述的方法,其中,所述方法包括引入外源供体核酸,并且,步骤(II)中改变的可变量是相对于引入至所述啮齿动物的外源供体核酸的浓度或量的引入至所述啮齿动物的向导RNA的浓度或量。
45.根据权利要求35或36所述的方法,其中,步骤(II)中改变的可变量是引入至所述啮齿动物的所述外源供体核酸。
46.一种啮齿动物基因组,其包含在Rosa26基因座处基因组整合的Cas9表达盒,其中,所述Cas9表达盒包含Cas9蛋白的编码序列,并且,其中,所述Cas9蛋白包含SEQ ID NO:19中列出的完整序列。
47.根据权利要求46所述的啮齿动物基因组,其中,所述啮齿动物是大鼠或小鼠。
48.根据权利要求46或47所述的啮齿动物基因组,其中,所述Cas9表达盒进一步包括位于所述Cas9蛋白质的编码序列上游的聚腺苷酸化信号,其中所述聚腺苷酸化信号的侧面具有重组酶识别位点。
49.根据权利要求48所述的啮齿动物基因组,其中,识别所述Cas9表达盒中的重组酶识别位点的重组酶是Cre重组酶。
50.根据权利要求49所述的啮齿动物基因组,其中,所述啮齿动物基因组还包含基因组整合的Cre重组酶表达盒,所述基因组整合的Cre重组酶表达盒包含可操作地连接至组织特异性启动子的Cre重组酶编码序列。
51.根据权利要求49所述的啮齿动物基因组,其中,所述Cre重组酶基因可操作地连接至表2列出的启动子中的一个。
52.根据权利要求46、47和49-51中任意一项所述的啮齿动物基因组,其中,所述Cas9表达盒还包含荧光蛋白编码序列。
53.根据权利要求52所述的啮齿动物基因组,其中,所述Cas9表达盒包括多顺反子核酸,所述多顺反子核酸包含由介入的内部核糖体进入位点(IRES)或介入的2A肽编码序列分隔开的所述Cas9蛋白质的编码序列和荧光蛋白编码序列。
54.根据权利要求53所述的啮齿动物基因组,其中,所述Cas9表达盒中的多顺反子核酸包括由介入的P2A肽编码序列分隔开的所述Cas9蛋白质的编码序列和绿色荧光蛋白编码序列。
55.根据权利要求46、47和49-51中任意一项所述的啮齿动物基因组,其中,所述Cas9表达盒还不包括荧光蛋白编码序列。
56.根据权利要求46、47、49-51、53和54中任意一项所述的啮齿动物基因组,其中,所述Cas9蛋白质包含蛋白质标签。
57.根据权利要求46、47、49-51、53和54中任意一项所述的啮齿动物基因组,其中,所述Cas9表达盒的5’端还包含3’剪接序列。
58.根据权利要求46、47、49-51、53和54中任意一项所述的啮齿动物基因组,其中,所述Cas9表达盒可操作地连接至内源启动子。
59.根据权利要求46、47、49-51、53和54中任意一项所述的啮齿动物基因组,其中,所述Cas9表达盒可操作地连接至外源组成性启动子。
60.根据权利要求46、47、49-51、53和54中任意一项所述的啮齿动物基因组,其中,所述Cas9表达盒编码包含SEQ ID NO:13、16或22中列出的序列的蛋白质。
61.根据权利要求46、47、49-51、53和54中任意一项所述的啮齿动物基因组,其中,所述Cas9表达盒包含SEQ ID NO:28、29、30或31中列出的序列。
62.根据权利要求61所述的啮齿动物基因组,其中,所述Cas9表达盒包含SEQ ID NO:1、12、14、15、17、18、20或21中列出的序列。
63.根据权利要求46、47、49-51、53、54和62中任意一项所述的啮齿动物基因组,其中,所述Cas9表达盒被整合至所述Rosa26基因座的第一内含子中。
64.根据权利要求46、47、49-51、53、54和62中任意一项所述的啮齿动物基因组,其中,所述啮齿动物基因组对于所述Cas9表达盒而言是杂合的。
65.根据权利要求46、47、49-51、53、54和62中任意一项所述的啮齿动物基因组,其中,所述啮齿动物基因组对于所述Cas9表达盒而言是纯合的。
66.根据权利要求46、47、49-51、53、54和62中任意一项所述的啮齿动物基因组,其中,所述Cas9表达盒可操作地连接至内源Rosa26启动子、插入Rosa26基因座的第一内含子中,并且在5’至3’方向上包括:(i)3’剪接序列;和(ii)所述Cas9蛋白质的编码序列。
67.一种啮齿动物细胞,其包含在Rosa26基因座处基因组整合的Cas9表达盒,其中,所述Cas9表达盒包含Cas9蛋白质的编码序列,其中,所述Cas9蛋白质包含SEQ ID NO:19中列出的完整序列,以及
其中,所述啮齿动物细胞不是胚胎干(ES)细胞。
68.根据权利要求67所述的啮齿动物细胞,其中,所述啮齿动物为大鼠或小鼠。
69.根据权利要求67或68所述的啮齿动物细胞,其中,所述Cas9表达盒还包括所述Cas9蛋白质的编码序列上游的聚腺苷酸化信号,其中,所述聚腺苷酸化信号的侧面具有重组酶识别位点。
70.根据权利要求69所述的啮齿动物细胞,其中,识别所述Cas9表达盒中的重组酶识别位点的重组酶是Cre重组酶。
71.根据权利要求70所述的啮齿动物细胞,其中,所述啮齿动物还包含基因组整合的Cre重组酶表达盒,所述基因组整合的Cre重组酶表达盒包含可操作地连接至组织特异性启动子的Cre重组酶编码序列。
72.根据权利要求70所述的啮齿动物细胞,其中,所述Cre重组酶基因可操作地连接至表2列出的启动子中的一个。
73.根据权利要求67、68和70-72中任意一项所述的啮齿动物细胞,其中,所述Cas9表达盒还包含荧光蛋白编码序列。
74.根据权利要求73所述的啮齿动物细胞,其中,所述Cas9表达盒包括多顺反子核酸,所述多顺反子核酸包含由介入的内部核糖体进入位点(IRES)或介入的2A肽编码序列分隔开的所述Cas9蛋白质的编码序列和荧光蛋白编码序列。
75.根据权利要求74所述的啮齿动物细胞,其中,所述Cas9表达盒中的多顺反子核酸包括由介入的P2A肽编码序列分隔开的所述Cas9蛋白质的编码序列和绿色荧光蛋白编码序列。
76.根据权利要求67、68和70-72中任意一项所述的啮齿动物细胞,其中,所述Cas9表达盒还不包括荧光蛋白编码序列。
77.根据权利要求67、68、70-72、74和75中任意一项所述的啮齿动物细胞,其中,所述Cas9蛋白质包含蛋白质标签。
78.根据权利要求67、68、70-72、74和75中任意一项所述的啮齿动物细胞,其中,所述Cas9表达盒的5’端还包含3’剪接序列。
79.根据权利要求67、68、70-72、74和75中任意一项所述的啮齿动物细胞,其中,所述Cas9表达盒可操作地连接至内源启动子。
80.根据权利要求67、68、70-72、74和75中任意一项所述的啮齿动物细胞,其中,所述Cas9表达盒可操作地连接至外源组成性启动子。
81.根据权利要求67、68、70-72、74和75中任意一项所述的啮齿动物细胞,其中,所述Cas9表达盒编码包含SEQ ID NO:13、16或22中列出的序列的蛋白质。
82.根据权利要求67、68、70-72、74和75中任意一项所述的啮齿动物细胞,其中,所述Cas9表达盒包含SEQ ID NO:28、29、30或31中列出的序列。
83.根据权利要求82所述的啮齿动物细胞,其中,所述Cas9表达盒包含SEQ ID NO:1、12、14、15、17、18、20或21中列出的序列。
84.根据权利要求67、68、70-72、74、75和83中任意一项所述的啮齿动物细胞,其中,所述Cas9表达盒被整合至所述Rosa26基因座的第一内含子中。
85.根据权利要求67、68、70-72、74、75和83中任意一项所述的啮齿动物细胞,其中,所述啮齿动物细胞对于所述Cas9表达盒而言是杂合的。
86.根据权利要求67、68、70-72、74、75和83中任意一项所述的啮齿动物细胞,其中,所述啮齿动物细胞对于所述Cas9表达盒而言是纯合的。
87.根据权利要求67、68、70-72、74、75和83中任意一项所述的啮齿动物细胞,其中,所述Cas9表达盒可操作地连接至内源Rosa26启动子、插入所述Rosa26基因座的第一内含子中,并且在5’至3’方向上包括:(i)3’剪接序列;和(ii)所述Cas9蛋白质的编码序列。
88.一种制造啮齿动物的方法,所述啮齿动物在其种系中包含基因组整合的Cas9表达盒,包括:
(a)修饰啮齿动物胚胎干(ES)细胞的基因组,以包含在Rosa26基因座处基因组整合的Cas9表达盒,其中,所述Cas9表达盒包含Cas9蛋白质的编码序列,其中,所述Cas9蛋白质包含SEQ ID NO:19中列出的完整序列;
(b)识别或选择包含所述Cas9表达盒的遗传修饰的啮齿动物ES细胞;
(c)将所述遗传修饰的啮齿动物ES细胞引入啮齿动物宿主胚胎;以及
(d)将所述啮齿动物宿主胚胎植入啮齿动物代孕母体并在所述啮齿动物代孕母体内孕育。
89.根据权利要求88所述的方法,其中,所述啮齿动物为大鼠或小鼠。
90.一种制造啮齿动物的方法,所述啮齿动物在其种系中包含基因组整合的Cas9表达盒,包括:
(a)修饰啮齿动物单细胞期胚胎的基因组,以包含在所述Rosa26基因座处基因组整合的Cas9表达盒,其中,所述Cas9表达盒包含Cas9蛋白质的编码序列,其中,所述Cas9蛋白质包含SEQ ID NO:19中列出的完整序列;
(b)选择包含所述Cas9表达盒的遗传修饰的啮齿动物单细胞期胚胎;以及
(c)将所述遗传修饰的啮齿动物单细胞期胚胎植入啮齿动物代孕母体并在所述啮齿动物代孕母体内孕育。
91.根据权利要求90所述的方法,其中,所述啮齿动物为大鼠或小鼠。
92.根据权利要求88-91所述的方法,其中,所述Cas9表达盒还包括所述Cas9蛋白质的编码序列上游的聚腺苷酸化信号,其中,所述聚腺苷酸化信号的侧面具有重组酶识别位点。
93.根据权利要求88-91所述的方法,其中,所述Cas9表达盒还包括所述Cas9蛋白质的编码序列上游的聚腺苷酸化信号,其中,所述聚腺苷酸化信号的侧面具有重组酶识别位点,并且,其中,所述Cas9表达盒中的聚腺苷酸化信号以组织特异性的方式被删除。
94.根据权利要求93所述的方法,其中,在所述肝脏中已删除了所述Cas9蛋白质的编码序列上游的所述聚腺苷酸化信号。
95.根据权利要求93所述的方法,其中,识别所述Cas9表达盒中的重组酶识别位点的重组酶是Cre重组酶。
96.根据权利要求95所述的方法,其中,所述啮齿动物还包含基因组整合的Cre重组酶表达盒,所述基因组整合的Cre重组酶表达盒包含可操作地连接至组织特异性启动子的Cre重组酶编码序列。
97.根据权利要求95所述的方法,其中,所述Cre重组酶基因可操作地连接至表2列出的启动子中的一个。
98.根据权利要求88-91和94-97中任意一项所述的方法,其中,所述Cas9表达盒还包含荧光蛋白编码序列。
99.根据权利要求98所述的方法,其中,所述Cas9表达盒包括多顺反子核酸,所述多顺反子核酸包含由介入的内部核糖体进入位点(IRES)或介入的2A肽编码序列分隔开的所述Cas9蛋白质的编码序列和荧光蛋白编码序列。
100.根据权利要求99所述的方法,其中,所述Cas9表达盒中的多顺反子核酸包括由介入的P2A肽编码序列分隔开的所述Cas9蛋白质的编码序列和绿色荧光蛋白编码序列。
101.根据权利要求88-91和94-97中任意一项所述的方法,其中,所述Cas9表达盒还不包括荧光蛋白编码序列。
102.根据权利要求88-91、94-97、99和100中任意一项所述的方法,其中,所述Cas9蛋白质包含蛋白质标签。
103.根据权利要求88-91、94-97、99和100中任意一项所述的方法,其中,所述Cas9表达盒的5’端还包含3’剪接序列。
104.根据权利要求88-91、94-97、99和100中任意一项所述的方法,其中,所述Cas9表达盒可操作地连接至内源启动子。
105.根据权利要求88-91、94-97、99和100中任意一项所述的方法,其中,所述Cas9表达盒可操作地连接至外源组成性启动子。
106.根据权利要求88-91、94-97、99和100中任意一项所述的方法,其中,所述Cas9表达盒编码包含SEQ ID NO:13、16或22中列出的序列的蛋白质。
107.根据权利要求88-91、94-97、99和100中任意一项所述的方法,其中,所述Cas9表达盒包含SEQ ID NO:28、29、30或31中列出的序列。
108.根据权利要求107所述的方法,其中,所述Cas9表达盒包含SEQ ID NO:1、12、14、15、17、18、20或21中列出的序列。
109.根据权利要求88-91、94-97、99、100和108中任意一项所述的方法,其中,所述Cas9表达盒被整合至是说Rosa26基因座的第一内含子中。
110.根据权利要求88-91、94-97、99、100和108中任意一项所述的方法,其中,所述啮齿动物对于所述Cas9表达盒而言是杂合的。
111.根据权利要求88-91、94-97、99、100和108中任意一项所述的方法,其中,所述啮齿动物对于所述Cas9表达盒而言是纯合的。
112.根据权利要求88-91、94-97、99、100和108中任意一项所述的方法,其中,所述Cas9表达盒可操作地连接至内源Rosa26启动子、插入所述Rosa26基因座的第一内含子中,并且在5’至3’方向上包括:(i)3’剪接序列;和(ii)所述Cas9蛋白质的编码序列。
113.一种测试CRISPR/Cas核酸酶体内修饰目标基因组基因座的能力的方法,包括:
(a)向非人类动物体内引入设计为靶向目标基因组基因座处的向导RNA靶向序列的向导RNA,
其中,所述非人类动物包含基因组整合的Cas表达盒,所述基因组整合的Cas表达盒包含Cas蛋白质的编码序列,所述Cas蛋白质还包含一个或多个核定位信号,以及
其中,所述向导RNA通过腺相关病毒(AAV)介导的递送引入,其中所述AAV是AAV8;以及
(b)评价对所述非人类动物的肝脏中的所述目标基因组基因座的修饰。
114.根据权利要求113所述的方法,其中,将所述AAV给药于所述非人类动物的途径是静脉内注射、脑实质内注射、腹膜内注射、鼻灌注或玻璃体内注射。
115.根据权利要求113或114所述的方法,其中,在步骤(a)中引入外源供体核酸,其中,所述外源供体核酸被设计为与所述目标基因组基因座重组,可选地,其中,所述外源供体核酸是单链寡脱氧核苷酸(ssODN)。
116.根据权利要求113或114所述的方法,其中,所述非人类动物为大鼠或小鼠。
117.根据权利要求116所述的方法,其中,所述非人类动物为所述大鼠。
118.根据权利要求113、114和117中任意一项所述的方法,其中:
(I)所述目标基因组基因座包括目标基因,并且步骤(b)包括测量所述目标基因的表达或由所述目标基因编码的蛋白质的活性;和/或
(II)步骤(b)包括对分离自所述非人类动物的一种或多种细胞中的所述目标基因组基因座进行测序;和/或
(III)步骤(b)包括从所述非人类动物中分离目标器官或组织并且评价对所述目标器官或组织中的目标基因组基因座的修饰,可选地,其中,步骤(b)包括评价对所述目标器官或组织中的两种或多种不同的细胞类型中的目标基因组基因座的修饰;和/或
(IV)步骤(b)包括从所述非人类动物中分离非目标器官或组织并且评价对所述非目标器官或组织中的目标基因组基因座的修饰。
119.根据权利要求113、114和117中任意一项所述的方法,其中,所述Cas蛋白质是Cas9蛋白质,可选地,其中,所述Cas9蛋白质包含蛋白质标签。
120.根据权利要求113、114和117中任意一项所述的方法,其中,所述Cas表达盒还包括所述Cas蛋白质的编码序列上游的聚腺苷酸化信号,其中,所述聚腺苷酸化信号的侧面具有重组酶识别位点,并且,其中,所述Cas表达盒中的聚腺苷酸化信号在肝脏中以组织特异性的方式被删除。
121.根据权利要求120所述的方法,其中,识别所述Cas表达盒中的重组酶识别位点的重组酶是Cre重组酶,可选地,其中,所述非人类动物还包含基因组整合的Cre重组酶表达盒,所述基因组整合的Cre重组酶表达盒包含可操作地连接至组织特异性启动子的Cre重组酶编码序列,且可选地,其中,所述Cre重组酶基因可操作地连接至大鼠白蛋白启动子或小鼠白蛋白启动子。
122.根据权利要求113、114和117中任意一项所述的方法,其中,所述Cas表达盒还包含所述Cas蛋白质的编码序列上游的聚腺苷酸化信号,其中,所述聚腺苷酸化信号的侧面具有重组酶识别位点,并且,其中,所述方法还包括以组织特异性的方式向所述非人类动物体内引入重组酶,可选地,其中,所述重组酶通过腺相关病毒(AAV)介导的递送或脂质纳米颗粒(LNP)介导的递送被引入。
123.根据权利要求113、114、117和121中任意一项所述的方法,其中,所述Cas表达盒还包含荧光蛋白编码序列,可选地,其中,所述Cas表达盒包括多顺反子核酸,所述多顺反子核酸包含由介入的内部核糖体进入位点(IRES)或介入的2A肽编码序列分隔开的所述Cas蛋白质的编码序列和荧光蛋白编码序列,且可选地,其中,所述Cas表达盒中的多顺反子核酸包括由介入的P2A肽编码序列分隔开的所述Cas蛋白质的编码序列和绿色荧光蛋白编码序列。
124.根据权利要求113、114、117和121中任意一项所述的方法,其中,所述Cas表达盒还不包括荧光蛋白编码序列。
125.根据权利要求113、114、117和121中任意一项所述的方法,其中,所述Cas表达盒的5’端还包含3’剪接序列。
126.根据权利要求113、114、117和121中任意一项所述的方法,其中,所述Cas表达盒可操作地连接至内源启动子。
127.根据权利要求113、114、117和121中任意一项所述的方法,其中,所述Cas表达盒可操作地连接至外源组成性启动子。
128.根据权利要求113、114、117和121中任意一项所述的方法,其中,所述Cas表达盒编码包含SEQ ID NO:13、16、19或22中列出的序列的蛋白质,可选地,其中,所述Cas表达盒包含SEQ ID NO:28、29、30或31中列出的序列,且可选地,其中,所述Cas表达盒包含SEQ IDNO:1、12、14、15、17、18、20或21中列出的序列。
129.根据权利要求113、114、117和121中任意一项所述的方法,其中,所述Cas表达盒被整合至安全港基因座中,可选地,其中,所述安全港基因座为Rosa26基因座,且可选地,其中,所述Cas表达盒被整合至所述Rosa26基因座的第一内含子中。
130.根据权利要求113、114、117和121中任意一项所述的方法,其中,所述非人类动物对于所述Cas表达盒而言是杂合的。
131.根据权利要求113、114、117和121中任意一项所述的方法,其中,所述非人类动物对于所述Cas表达盒而言是纯合的。
132.根据权利要求113、114、117和121中任意一项所述的方法,其中,所述非人类动物是小鼠,
其中,所述AAV8通过静脉内注射递送至所述非人类动物,且
其中,所述Cas表达盒可操作地连接至内源Rosa26启动子、插入Rosa26基因座的第一内含子中,并且在5’至3’方向上包括:(i)3’剪接序列;以及(ii)所述Cas蛋白质的编码序列还包含一个或多个核定位信号,其中所述Cas蛋白质为Cas9蛋白质。
133.一种优化CRISPR/Cas核酸酶体内修饰目标基因组基因座的能力的方法,包括:
(I)在第一非人类动物中第一次执行权利要求113、114、117和121中任意一项所述的方法;
(II)改变可变量并且在第二非人类动物中使用改变的可变量再次执行步骤(I)的方法;以及
(III)将步骤(I)中的对所述目标基因组基因座的修饰与步骤(II)中的对所述目标基因组基因座的修饰进行比较并且选择对所述目标基因组基因座的修饰具有较高的效率、较高的精确度、较高的一致性或较高的特异性中的一种或多种的方法。
134.根据权利要求133所述的方法,其中
(1)步骤(II)中改变的可变量是将所述向导RNA引入至所述非人类动物的给药途径;
(2)步骤(II)中改变的可变量是引入至所述非人类动物的所述向导RNA的浓度或量;
(3)步骤(II)中改变的可变量是引入至所述非人类动物的所述向导RNA;
(4)其中,所述方法包括引入外源供体核酸,并且,其中,步骤(II)中改变的可变量是将所述外源供体核酸引入所述非人类动物的递送方法或给药途径;
(5)其中,所述方法包括引入外源供体核酸,且步骤(II)中改变的可变量为引入所述非人动物体内的所述外源供体核酸的浓度或量;
(6)其中,所述方法包括引入外源供体核酸,且步骤(II)中改变的可变量是相对于引入至所述非人类动物的外源供体核酸的浓度或量的引入至所述非人类动物的向导RNA的浓度或量;或者
(7)其中,所述方法包括引入外源供体核酸,且步骤(II)中改变的可变量是引入至所述反人类动物的外源供体核酸。
CN202210528912.0A 2017-07-31 2018-07-31 Cas转基因小鼠胚胎干细胞和小鼠及其应用 Pending CN115074343A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201762539275P 2017-07-31 2017-07-31
US62/539,275 2017-07-31
PCT/US2018/044615 WO2019028032A1 (en) 2017-07-31 2018-07-31 EMBRYONIC STEM CELLS OF TRANSGENIC MOUSE CASES AND MICE AND USES THEREOF
CN201880044435.2A CN110891420B (zh) 2017-07-31 2018-07-31 Cas转基因小鼠胚胎干细胞和小鼠及其应用

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201880044435.2A Division CN110891420B (zh) 2017-07-31 2018-07-31 Cas转基因小鼠胚胎干细胞和小鼠及其应用

Publications (1)

Publication Number Publication Date
CN115074343A true CN115074343A (zh) 2022-09-20

Family

ID=63350596

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201880044435.2A Active CN110891420B (zh) 2017-07-31 2018-07-31 Cas转基因小鼠胚胎干细胞和小鼠及其应用
CN202210528912.0A Pending CN115074343A (zh) 2017-07-31 2018-07-31 Cas转基因小鼠胚胎干细胞和小鼠及其应用

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201880044435.2A Active CN110891420B (zh) 2017-07-31 2018-07-31 Cas转基因小鼠胚胎干细胞和小鼠及其应用

Country Status (12)

Country Link
US (3) US11130999B2 (zh)
EP (1) EP3585159A1 (zh)
JP (2) JP7359753B2 (zh)
KR (1) KR20200032693A (zh)
CN (2) CN110891420B (zh)
AU (1) AU2018309716A1 (zh)
BR (1) BR112020001364A2 (zh)
CA (1) CA3067872A1 (zh)
IL (1) IL272334A (zh)
MX (1) MX2020001178A (zh)
SG (1) SG11201912235PA (zh)
WO (1) WO2019028032A1 (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019028032A1 (en) 2017-07-31 2019-02-07 Regeneron Pharmaceuticals, Inc. EMBRYONIC STEM CELLS OF TRANSGENIC MOUSE CASES AND MICE AND USES THEREOF
US11781131B2 (en) 2019-03-18 2023-10-10 Regeneron Pharmaceuticals, Inc. CRISPR/Cas dropout screening platform to reveal genetic vulnerabilities associated with tau aggregation
CN113631700A (zh) 2019-03-18 2021-11-09 瑞泽恩制药公司 用于鉴定tau接种或聚集的基因修饰因子的CRISPR/Cas筛选平台
MX2021011956A (es) 2019-04-03 2021-12-15 Regeneron Pharma Metodos y composiciones para la insercion de secuencias codificantes de anticuerpos en un locus de puerto seguro.
US20200362345A1 (en) * 2019-05-17 2020-11-19 Massachusetts Institute Of Technology Engineered post-poly a signal rna and uses thereof
EP3813522A1 (en) 2019-06-14 2021-05-05 Regeneron Pharmaceuticals, Inc. Models of tauopathy
EP4054651A1 (en) 2019-11-08 2022-09-14 Regeneron Pharmaceuticals, Inc. Crispr and aav strategies for x-linked juvenile retinoschisis therapy
JP2023516052A (ja) 2020-03-04 2023-04-17 リジェネロン・ファーマシューティカルズ・インコーポレイテッド B4galt1媒介性機能の齧歯類モデル
KR20240023030A (ko) * 2021-05-20 2024-02-20 신테니 테라퓨틱스, 인코포레이티드 게놈 세이프 하버
CN113999873B (zh) * 2021-12-31 2022-05-20 北京市疾病预防控制中心 一种基因修饰的非人动物的构建方法及其应用
WO2023212616A2 (en) * 2022-04-27 2023-11-02 Alpha Teknova, Inc. Detection, quantification, and expression analysis of full viral capsids
WO2023220603A1 (en) * 2022-05-09 2023-11-16 Regeneron Pharmaceuticals, Inc. Vectors and methods for in vivo antibody production
WO2023235725A2 (en) 2022-05-31 2023-12-07 Regeneron Pharmaceuticals, Inc. Crispr-based therapeutics for c9orf72 repeat expansion disease
CN115992178A (zh) * 2022-08-08 2023-04-21 首都医科大学附属北京天坛医院 核心蛋白聚糖转基因小鼠的制备方法及应用

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140179770A1 (en) * 2012-12-12 2014-06-26 Massachusetts Institute Of Technology Delivery, engineering and optimization of systems, methods and compositions for sequence manipulation and therapeutic applications
CN103911376A (zh) * 2014-04-03 2014-07-09 南京大学 CRISPR-Cas9靶向敲除乙肝病毒cccDNA及其特异性sgRNA
CN104178461A (zh) * 2014-08-14 2014-12-03 北京蛋白质组研究中心 携带cas9的重组腺病毒及其应用
WO2016049163A2 (en) * 2014-09-24 2016-03-31 The Broad Institute Inc. Use and production of chd8+/- transgenic animals with behavioral phenotypes characteristic of autism spectrum disorder
WO2016049024A2 (en) * 2014-09-24 2016-03-31 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for modeling competition of multiple cancer mutations in vivo

Family Cites Families (91)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5523226A (en) 1993-05-14 1996-06-04 Biotechnology Research And Development Corp. Transgenic swine compositions and methods
WO1999005266A2 (en) 1997-07-26 1999-02-04 Wisconsin Alumni Research Foundation Trans-species nuclear transfer
US6586251B2 (en) 2000-10-31 2003-07-01 Regeneron Pharmaceuticals, Inc. Methods of modifying eukaryotic cells
US20050144655A1 (en) 2000-10-31 2005-06-30 Economides Aris N. Methods of modifying eukaryotic cells
AUPR451401A0 (en) 2001-04-20 2001-05-24 Monash University A method of nuclear transfer
CN100575485C (zh) 2002-01-23 2009-12-30 犹他大学研究基金会 使用锌指核酸酶的定向染色体诱变
EP2368982A3 (en) 2002-03-21 2011-10-12 Sangamo BioSciences, Inc. Methods and compositions for using zinc finger endonucleases to enhance homologous recombination
US7612250B2 (en) 2002-07-29 2009-11-03 Trustees Of Tufts College Nuclear transfer embryo formation method
US9447434B2 (en) 2002-09-05 2016-09-20 California Institute Of Technology Use of chimeric nucleases to stimulate gene targeting
US7888121B2 (en) 2003-08-08 2011-02-15 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
US8409861B2 (en) 2003-08-08 2013-04-02 Sangamo Biosciences, Inc. Targeted deletion of cellular DNA sequences
US7972854B2 (en) 2004-02-05 2011-07-05 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
KR20070060115A (ko) 2004-09-16 2007-06-12 상가모 바이오사이언스 인코포레이티드 단백질 생산을 위한 조성물 및 방법
PT1802193E (pt) 2004-10-19 2014-06-23 Regeneron Pharma Método para gerar um murganho homozigótico para uma modificação genética
EP2206782A1 (en) 2006-05-25 2010-07-14 Sangamo BioSciences, Inc. Methods and compositions for gene inactivation
EP2213731B1 (en) 2006-05-25 2013-12-04 Sangamo BioSciences, Inc. Variant foki cleavage half-domains
JP4692417B2 (ja) 2006-06-30 2011-06-01 富士ゼロックス株式会社 画像形成装置
CN101117633B (zh) 2006-08-03 2011-07-20 上海交通大学附属儿童医院 一种细胞核移植方法
US8110379B2 (en) 2007-04-26 2012-02-07 Sangamo Biosciences, Inc. Targeted integration into the PPP1R12C locus
WO2008149176A1 (en) 2007-06-06 2008-12-11 Cellectis Meganuclease variants cleaving a dna target sequence from the mouse rosa26 locus and uses thereof
EP2277218A4 (en) 2008-04-11 2011-10-19 Utc Power Corp FUEL CELL AND BIPOLAR PLATE HAVING A COLLECTOR PUMP
SG185367A1 (en) 2010-04-26 2012-12-28 Sangamo Biosciences Inc Genome editing of a rosa locus using zinc-finger nucleases
CA2798988C (en) 2010-05-17 2020-03-10 Sangamo Biosciences, Inc. Tal-effector (tale) dna-binding polypeptides and uses thereof
EP3498833B1 (en) 2011-09-21 2023-08-16 Sangamo Therapeutics, Inc. Methods and compositions for regulation of transgene expression
US9222105B2 (en) 2011-10-27 2015-12-29 Sangamo Biosciences, Inc. Methods and compositions for modification of the HPRT locus
WO2013141680A1 (en) 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
EP2847335B1 (en) 2012-04-25 2018-06-27 Regeneron Pharmaceuticals, Inc. Nuclease-mediated targeting with large targeting vectors
PE20150336A1 (es) 2012-05-25 2015-03-25 Univ California Metodos y composiciones para la modificacion de adn objetivo dirigida por arn y para la modulacion de la transcripcion dirigida por arn
WO2014033644A2 (en) 2012-08-28 2014-03-06 Novartis Ag Methods of nuclease-based genetic engineering
CN116064533A (zh) 2012-10-23 2023-05-05 基因工具股份有限公司 用于切割靶dna的组合物及其用途
KR101844123B1 (ko) 2012-12-06 2018-04-02 시그마-알드리치 컴퍼니., 엘엘씨 Crispr-기초된 유전체 변형과 조절
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
RU2699523C2 (ru) 2012-12-17 2019-09-05 Президент Энд Фэллоуз Оф Харвард Коллидж Рнк-направляемая инженерия генома человека
ES2904803T3 (es) 2013-02-20 2022-04-06 Regeneron Pharma Modificación genética de ratas
EP2922393B2 (en) 2013-02-27 2022-12-28 Helmholtz Zentrum München - Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) Gene editing in the oocyte by cas9 nucleases
CN113563476A (zh) 2013-03-15 2021-10-29 通用医疗公司 遗传和表观遗传调节蛋白至特定基因组基因座的rna引导的靶向
US9234213B2 (en) 2013-03-15 2016-01-12 System Biosciences, Llc Compositions and methods directed to CRISPR/Cas genomic engineering systems
WO2014165825A2 (en) 2013-04-04 2014-10-09 President And Fellows Of Harvard College Therapeutic uses of genome editing with crispr/cas systems
PT3456831T (pt) 2013-04-16 2021-09-10 Regeneron Pharma Modificação alvejada do genoma de rato
WO2014190181A1 (en) 2013-05-22 2014-11-27 Northwestern University Rna-directed dna cleavage and gene editing by cas9 enzyme from neisseria meningitidis
DK3011031T3 (da) 2013-06-17 2020-12-21 Broad Inst Inc Fremføring og anvendelse af crispr-cas-systemerne, vektorer og sammensætninger til levermålretning og -terapi
DK3011032T3 (da) 2013-06-17 2020-01-20 Broad Inst Inc Fremføring, modificering og optimering af systemer, fremgangsmåder og sammensætninger til målretning mod og modellering af sygdomme og forstyrrelser i postmitotiske celler
US20160264982A1 (en) 2013-07-16 2016-09-15 Shanghai Institutes For Biological Sciences, Chinese Academy Of Sciences Method for plant genome site-directed modification
US11306328B2 (en) 2013-07-26 2022-04-19 President And Fellows Of Harvard College Genome engineering
CN105637087A (zh) 2013-09-18 2016-06-01 科马布有限公司 方法、细胞与生物体
IL297607B2 (en) 2013-09-23 2024-01-01 Regeneron Pharma Non-human animals with a humanized gene for SIGNAL-REGULATORY PROTEIN
WO2015048577A2 (en) 2013-09-27 2015-04-02 Editas Medicine, Inc. Crispr-related methods and compositions
AU2014337248B2 (en) 2013-10-17 2020-09-24 Sangamo Therapeutics, Inc. Delivery methods and compositions for nuclease-mediated genome engineering
CN105980568B (zh) 2013-12-11 2019-12-03 瑞泽恩制药公司 用于靶向修饰基因组的方法和组合物
US20150166984A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting alpha-antitrypsin point mutations
US10370680B2 (en) 2014-02-24 2019-08-06 Sangamo Therapeutics, Inc. Method of treating factor IX deficiency using nuclease-mediated targeted integration
US11186843B2 (en) 2014-02-27 2021-11-30 Monsanto Technology Llc Compositions and methods for site directed genomic modification
EP3152221A4 (en) 2014-05-20 2018-01-24 Regents of the University of Minnesota Method for editing a genetic sequence
WO2015191693A2 (en) 2014-06-10 2015-12-17 Massachusetts Institute Of Technology Method for gene editing
ES2788426T3 (es) 2014-06-16 2020-10-21 Univ Johns Hopkins Composiciones y métodos para la expresión de ARNs de guía de CRISPR utilizando el promotor de H1
PT3155099T (pt) 2014-06-23 2018-04-20 Regeneron Pharma Montagem de dna mediada por nuclease
US20150376587A1 (en) 2014-06-25 2015-12-31 Caribou Biosciences, Inc. RNA Modification to Engineer Cas9 Activity
RU2771532C2 (ru) 2014-06-26 2022-05-05 Регенерон Фармасьютикалз, Инк. Способы и композиции для нацеленных генетических модификаций и способы их применения
EP2966170A1 (en) 2014-07-10 2016-01-13 Heinrich-Pette-Institut Leibniz-Institut für experimentelle Virologie-Stiftung bürgerlichen Rechts - HBV inactivation
WO2016010840A1 (en) 2014-07-16 2016-01-21 Novartis Ag Method of encapsulating a nucleic acid in a lipid nanoparticle host
AU2015317370A1 (en) 2014-09-19 2017-03-23 Regeneron Pharmaceuticals, Inc. Chimeric antigen receptors
DK3212789T3 (da) 2014-10-31 2020-07-27 Massachusetts Inst Technology Massiv parallel kombinatorisk genetik til crispr
CA2963820A1 (en) 2014-11-07 2016-05-12 Editas Medicine, Inc. Methods for improving crispr/cas-mediated genome-editing
KR20230070319A (ko) 2014-11-21 2023-05-22 리제너론 파마슈티칼스 인코포레이티드 쌍 형성된 가이드 rna를 사용하는 표적화된 유전자 변형을 위한 방법 및 조성물
WO2016089866A1 (en) 2014-12-01 2016-06-09 President And Fellows Of Harvard College Rna-guided systems for in vivo gene editing
WO2016106236A1 (en) 2014-12-23 2016-06-30 The Broad Institute Inc. Rna-targeting system
CN104498493B (zh) * 2014-12-30 2017-12-26 武汉大学 CRISPR/Cas9特异性敲除乙型肝炎病毒的方法以及用于特异性靶向HBV DNA的gRNA
CN113388670B (zh) 2015-01-09 2024-02-02 生物辐射实验室股份有限公司 检测基因组编辑
CN107429263A (zh) 2015-01-15 2017-12-01 斯坦福大学托管董事会 调控基因组编辑的方法
US10787523B2 (en) 2015-01-29 2020-09-29 University Of Massachusetts Nanoparticle-protein complex for intracellular protein delivery
WO2016132122A1 (en) 2015-02-17 2016-08-25 University Of Edinburgh Assay construct
US20180245073A1 (en) 2015-02-23 2018-08-30 Voyager Therapeutics, Inc. Regulatable expression using adeno-associated virus (aav)
US20180110877A1 (en) 2015-04-27 2018-04-26 The Trustees Of The University Of Pennsylvania DUAL AAV VECTOR SYSTEM FOR CRISPR/Cas9 MEDIATED CORRECTION OF HUMAN DISEASE
US10179918B2 (en) 2015-05-07 2019-01-15 Sangamo Therapeutics, Inc. Methods and compositions for increasing transgene activity
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
EP3159407A1 (en) 2015-10-23 2017-04-26 Silence Therapeutics (London) Ltd Guide rnas, methods and uses
MX2018005389A (es) 2015-11-20 2018-09-05 Regeneron Pharma Animales no humanos que tienen un gen 3 de activacion linfocitaria humanizado.
EP3392337B1 (en) 2015-12-18 2024-03-06 Japan Science and Technology Agency Genetic modification non-human organism, egg cells, fertilized eggs, and method for modifying target genes
CN105647968B (zh) 2016-02-02 2019-07-23 浙江大学 一种CRISPR/Cas9工作效率快速测试系统及其应用
EP3436077A1 (en) 2016-03-30 2019-02-06 Intellia Therapeutics, Inc. Lipid nanoparticle formulations for crispr/cas components
WO2018007871A1 (en) 2016-07-08 2018-01-11 Crispr Therapeutics Ag Materials and methods for treatment of transthyretin amyloidosis
GB201619876D0 (en) 2016-11-24 2017-01-11 Cambridge Entpr Ltd Controllable transcription
EP3551757A1 (en) 2016-12-08 2019-10-16 Intellia Therapeutics, Inc. Modified guide rnas
AU2017374042B2 (en) 2016-12-09 2024-02-15 Acuitas Therapeutics, Inc. Delivery of target specific nucleases
CN110582302A (zh) 2016-12-14 2019-12-17 利甘达尔股份有限公司 用于核酸和/或蛋白有效负载递送的组合物和方法
WO2018132936A1 (en) 2017-01-17 2018-07-26 Guangzhou Institutes Of Biomedicine And Health, Chinese Academy Of Sciences Genetical alternation and disease modelling using cre-dependent cas9 expressing mammals
WO2019028032A1 (en) 2017-07-31 2019-02-07 Regeneron Pharmaceuticals, Inc. EMBRYONIC STEM CELLS OF TRANSGENIC MOUSE CASES AND MICE AND USES THEREOF
US11690921B2 (en) 2018-05-18 2023-07-04 Sangamo Therapeutics, Inc. Delivery of target specific nucleases
AU2019282824A1 (en) 2018-06-08 2021-01-07 Intellia Therapeutics, Inc. Modified guide RNAS for gene editing
EP3810148A4 (en) 2018-06-19 2022-06-08 The Board Of Regents Of The University Of Texas System LIPID NANOPARTICLE COMPOSITIONS FOR DELIVERING MRNA AND LONG NUCLEIC ACIDS

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140179770A1 (en) * 2012-12-12 2014-06-26 Massachusetts Institute Of Technology Delivery, engineering and optimization of systems, methods and compositions for sequence manipulation and therapeutic applications
CN103911376A (zh) * 2014-04-03 2014-07-09 南京大学 CRISPR-Cas9靶向敲除乙肝病毒cccDNA及其特异性sgRNA
CN104178461A (zh) * 2014-08-14 2014-12-03 北京蛋白质组研究中心 携带cas9的重组腺病毒及其应用
WO2016049163A2 (en) * 2014-09-24 2016-03-31 The Broad Institute Inc. Use and production of chd8+/- transgenic animals with behavioral phenotypes characteristic of autism spectrum disorder
WO2016049024A2 (en) * 2014-09-24 2016-03-31 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for modeling competition of multiple cancer mutations in vivo

Also Published As

Publication number Publication date
US11130999B2 (en) 2021-09-28
CN110891420A (zh) 2020-03-17
CN110891420B (zh) 2022-06-03
RU2020105343A (ru) 2021-09-02
SG11201912235PA (en) 2020-01-30
IL272334A (en) 2020-03-31
JP2020532952A (ja) 2020-11-19
KR20200032693A (ko) 2020-03-26
MX2020001178A (es) 2020-09-25
US20210392862A1 (en) 2021-12-23
RU2020105343A3 (zh) 2021-11-11
AU2018309716A1 (en) 2020-01-16
BR112020001364A2 (pt) 2020-08-11
US11866794B2 (en) 2024-01-09
US20190032155A1 (en) 2019-01-31
JP2023165953A (ja) 2023-11-17
WO2019028032A1 (en) 2019-02-07
CA3067872A1 (en) 2019-02-07
EP3585159A1 (en) 2020-01-01
US20240093316A1 (en) 2024-03-21
JP7359753B2 (ja) 2023-10-11

Similar Documents

Publication Publication Date Title
CN110891420B (zh) Cas转基因小鼠胚胎干细胞和小鼠及其应用
CN111885915B (zh) 使用crispr/cas系统对动物进行转录调制
US20210261985A1 (en) Methods and compositions for assessing crispr/cas-mediated disruption or excision and crispr/cas-induced recombination with an exogenous donor nucleic acid in vivo
CN111163633B (zh) 包含人源化ttr基因座的非人类动物及其使用方法
US20190032156A1 (en) Methods and compositions for assessing crispr/cas-induced recombination with an exogenous donor nucleic acid in vivo
WO2021195079A1 (en) Non-human animals comprising a humanized ttr locus comprising a v30m mutation and methods of use
RU2782358C2 (ru) Экспрессирующие cas мышиные эмбриональные стволовые клетки и мыши и их применения
RU2782356C2 (ru) Способы и композиции для оценки опосредованного crispr/cas разрушения или вырезания и индуцированной crispr/cas рекомбинации с экзогенной донорской нуклеиновой кислотой in vivo
US20230081547A1 (en) Non-human animals comprising a humanized klkb1 locus and methods of use

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination