CN113271982A - 通过靶向肌营养相关蛋白基因来治疗肌营养不良的方法 - Google Patents

通过靶向肌营养相关蛋白基因来治疗肌营养不良的方法 Download PDF

Info

Publication number
CN113271982A
CN113271982A CN201980075173.0A CN201980075173A CN113271982A CN 113271982 A CN113271982 A CN 113271982A CN 201980075173 A CN201980075173 A CN 201980075173A CN 113271982 A CN113271982 A CN 113271982A
Authority
CN
China
Prior art keywords
lys
leu
glu
ile
asp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201980075173.0A
Other languages
English (en)
Other versions
CN113271982B (zh
Inventor
吉见英治
吉冈克郎
山形哲也
秦元宝
伊恩·罗伯特·汤普生
尼德西·康纳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Morris Medical Co ltd
Original Assignee
Morris Medical Co ltd
Astellas Pharma Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Morris Medical Co ltd, Astellas Pharma Inc filed Critical Morris Medical Co ltd
Publication of CN113271982A publication Critical patent/CN113271982A/zh
Application granted granted Critical
Publication of CN113271982B publication Critical patent/CN113271982B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • C07K14/4705Regulators; Modulating activity stimulating, promoting or activating activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P21/00Drugs for disorders of the muscular or neuromuscular system
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4707Muscular dystrophy
    • C07K14/4708Duchenne dystrophy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16041Use of virus, viral particle or viral elements as a vector
    • C12N2740/16043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Virology (AREA)
  • Orthopedic Medicine & Surgery (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Neurology (AREA)
  • Physical Education & Sports Medicine (AREA)
  • Epidemiology (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

预期可用于治疗或预防杜氏肌营养不良或贝克肌营养不良的多核苷酸,所述多核苷酸包含以下碱基序列:(a)编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列,和(b)编码向导RNA的碱基序列,所述向导RNA靶向人肌营养相关蛋白基因的表达调节区中SEQ ID NO:104、105、135、141、153、167或172所示区域中长度为18至24个核苷酸的连续区域。

Description

通过靶向肌营养相关蛋白基因来治疗肌营养不良的方法
相关申请的交叉引用
本申请要求2018年11月16日提交的美国临时专利申请第62/768,474号、2019年6月13日提交的美国临时专利申请第62/861,039号以及2019年11月7日提交的美国临时专利申请第62/931,925号的优先权,所述申请各自的内容通过引用全部并入本文。
技术领域
本发明涉及通过靶向人肌营养相关蛋白(Utrophin,UTRN)基因来治疗肌营养不良的方法等。更特别地,本发明涉及通过使用靶向人UTRN基因的特定序列的向导RNA以及转录激活子和CRISPR效应蛋白的融合蛋白激活人UTRN基因的表达来治疗或预防肌营养不良的方法和药剂等。
背景技术
肌营养不良是与进行性肌萎缩和肌无力相关的遗传性疾病的总称。在肌营养不良中,由X染色体上的肌营养不良蛋白基因突变引起的肌营养不良包括杜氏肌营养不良(DUCHENNE muscular dystrophy,DMD)及其轻度型、贝克肌营养不良(BECKER musculardystrophy,BMD)。
DMD是最常见的遗传性进行性肌肉疾病,每3,500名新出生的男性中就有1名患上DMD。其临床症状包括从约2至5岁开始的肌无力,此后肌无力的进一步发展,到约10岁前的步行不能,以及在二十多岁时因心力衰竭或呼吸衰竭而死亡(参见WO 2009/044383,通过引用全部并入本文)。
已知DMD是由肌营养不良蛋白基因的突变引起的。肌营养不良蛋白基因存在于X染色体上,是一个由约220万个DNA碱基组成的巨大基因。它从DNA转录成mRNA前体,通过剪接进一步去除内含子,并产生了由79个外显子组成的mRNA(约14kb)。该mRNA被翻译成3685个氨基酸以产生肌营养不良蛋白。肌营养不良蛋白参与维持肌肉细胞的膜稳定性。在DMD患者中,由于在肌营养不良蛋白基因中发生突变,因此肌营养不良蛋白几乎不表达并且不能维持肌肉细胞的结构,从而导致肌无力。
BMD也是由肌营养不良蛋白基因突变引起的;但是,与DMD相比,其症状通常较轻。DMD和BMD的临床症状之间的差异是基于DMD中功能性的肌营养不良蛋白几乎不表达,而BMD中却产生了不完整但功能性的肌营养不良蛋白。
即使到现在,还没有有效的药物作为针对肌营养不良的病因治疗,只是进行了诸如施用类固醇的对症治疗。已经提出了多种治疗策略来治疗DMD和BMD,且作为策略之一的基因治疗方法已经引起关注。基因治疗的目的是通过向具有突变的肌肉细胞补充正常肌营养不良蛋白基因来实现正常肌营养不良蛋白的表达。然而,全长的肌营养不良蛋白cDNA相对较大,长度为约14kb;因此,对于某些载体,例如腺相关病毒(AAV)载体,可以被封包的DNA的尺寸限制可能是一个问题。作为这个问题的一种解决方案,已经提出了使用具有最小功能域的截短型肌营养不良蛋白基因(小型/微型肌营养不良蛋白基因)的方法(参见Sakamoto M.等人,《生物化学与生物物理学研究通讯(Biochem Biophys Res Commun)》,2002年5月17日;293(4):1265-72,通过引用全部并入本文)。考虑到向缺乏肌营养不良蛋白的DMD患者中引入肌营养不良蛋白可能会引起免疫反应,因此还报道了使用肌营养相关蛋白(在本说明书中有时也称为“UTRN”等)来降低这种免疫反应的手段(参见Gilbert R.等人,《人基因治疗(Hum Gene Ther)》,1999年5月20日;10(8):1299-310,通过引用全部并入本文)。肌营养相关蛋白是一种与肌营养不良蛋白高度同源的细胞骨架蛋白,存在于正常和DMD肌肉中,但含量很低。与肌营养不良蛋白一样,肌营养相关蛋白cDNA非常大(超过10kb)。已知肌营养相关蛋白能够补偿肌营养不良蛋白的肌肉细胞膜稳定功能(参见Gilbert R.等人,《人基因治疗》,1999年5月20日;10(8):1299-310和Liao H.等人,《细胞(Cell)》,2017年12月14日;171(7):1495-507,通过引用全部并入本文)。
作为靶向肌营养相关蛋白的基因治疗,例如,WO2015/018503公开了一项涉及用于在骨骼或心肌组织中表达基因的重组腺相关病毒(AAV)载体的发明,所述载体包含肌肉特异性启动子和编码融合蛋白的基因,其中所述融合蛋白包含:
a)转录激活元件和
b)DNA结合元件,
其中所述融合蛋白当在所述骨骼或心肌组织中表达时能够增加肌营养相关蛋白的表达(参见WO2015/018503,通过引用全部并入本文)。在本发明中,锌指蛋白用作DNA结合元件。
另一方面,近年来已经开发出一种使用核酸酶活性失活的Cas9(dCas9)和转录激活结构域或转录抑制结构域的组合的系统,其中通过使用向导RNA而不切割靶基因的DNA序列将所述蛋白质靶向靶基因来控制靶基因的表达(WO2013/176772,通过引用全部并入本文)。预期其可应用于临床(参见Dominguez A.等人,《自然评论-分子细胞生物学(Nat RevMol Cell Biol)》,2016年1月;17(1):5-15,通过引用全部并入本文)。但是,存在一个问题,即编码dCas9、向导RNA和共转录激活子的复合物的序列超出了最常见的病毒载体(例如AAV)的容量,最常见的病毒载体代表了最有希望的体内基因递送方法(参见Liao H.等人,《细胞》,2017年12月14日;171(7):1495-507,通过引用全部并入本文)。
2017年,报道了(a)通过向引入有Cas9基因的DMD模型小鼠(mdx小鼠)施用携带靶向小鼠UTRN并抑制Cas9的DNA切割能力的向导RNA(dgUtrn)和转录激活结构域的AAV,UTRN的表达水平增加,抓取力也得到了提高,以及(b)通过向mdx小鼠共同注射携带Cas9的AAV和携带上述dgUtrn和转录激活结构域的AAV,抓取力得到了提高(参见Liao H.等人,《细胞》,2017年12月14日;171(7):1495-507,通过引用全部并入本文)。
发明内容
因此,本发明的一个目的是提供一种治疗肌营养不良(特别是DMD和BMD)的新方法。
这一目的以及其它目的,在以下详细描述中将变得显而易见,这些目的已经通过本发明人的以下发现而实现,即,可以通过使用靶向人UTRN基因的特定序列的向导RNA以及转录激活子和核酸酶缺陷型CRISPR效应蛋白的融合蛋白来强烈激活人UTRN基因(基因ID:7402)的表达。另外,本发明人发现,可以通过携带编码所述融合蛋白的碱基序列和编码所述向导RNA的碱基序列的单个AAV载体,使用小型核酸酶缺陷型CRISPR效应蛋白和小型转录激活子来强烈激活人UTRN基因的表达。
因此,本发明提供:
(1)一种多核苷酸,所述多核苷酸包含以下碱基序列:
(a)编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列,和
(b)编码向导RNA的碱基序列,所述向导RNA靶向人肌营养相关蛋白基因的表达调节区中SEQ ID NO:104、105、135、141、153、167或172所示区域中长度为18至24个核苷酸的连续区域。
(2)根据(1)所述的多核苷酸,其中所述编码向导RNA的碱基序列包含SEQ ID NO:45、46、58、59、60、135、141、153、155、156、157、159、167或172所示的碱基序列,或SEQ IDNO:45、46、58、59、60、135、141、153、155、156、157、159、167或172所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列。
(3)根据(1)或(2)所述的多核苷酸,所述多核苷酸包含至少两种不同的编码所述向导RNA的碱基序列。
(4)根据(1)至(3)中任一项所述的多核苷酸,其中所述转录激活子是包含RTA的转录激活结构域和VP64的肽。
(5)根据(4)所述的多核苷酸,其中所述转录激活子包含SEQ ID NO:117所示的氨基酸序列,或与SEQ ID NO:117所示的氨基酸序列具有至少90%同一性的氨基酸序列。
(6)根据(1)至(5)中任一项所述的多核苷酸,其中所述核酸酶缺陷型CRISPR效应蛋白是dCas9。
(7)根据(6)所述的多核苷酸,其中所述dCas9来源于金黄色葡萄球菌(Staphylococcus aureus)。
(8)根据(1)至(7)中任一项所述的多核苷酸,所述多核苷酸进一步包含用于所述编码向导RNA的碱基序列的启动子序列和/或用于所述编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列的启动子序列。
(9)根据(8)所述的多核苷酸,其中所述用于编码向导RNA的碱基序列的启动子序列选自U6启动子、SNR6启动子、SNR52启动子、SCR1启动子、RPR1启动子、U3启动子和H1启动子。
(10)根据(8)或(9)所述的多核苷酸,其中所述用于编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列的启动子序列选自EFS启动子、EF-1α启动子、CMV启动子、CK8启动子、MHC启动子、Des启动子、CAG启动子和MYOD启动子。
(11)根据(8)至(10)中任一项所述的多核苷酸,
其中所述编码向导RNA的碱基序列包含SEQ ID NO:45、46或59所示的碱基序列,或SEQ ID NO:45、46或59所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列,
所述转录激活子包含SEQ ID NO:117所示的氨基酸序列,或与SEQ ID NO:117所示的氨基酸序列具有至少90%同一性的氨基酸序列,
所述核酸酶缺陷型CRISPR效应蛋白是来源于金黄色葡萄球菌的dCas9,
所述用于编码向导RNA的碱基序列的启动子序列是U6启动子,且
所述用于编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列的启动子序列是CK8启动子。
(12)根据(11)所述的多核苷酸,
其中所述编码向导RNA的碱基序列包含SEQ ID NO:59所示的碱基序列,或SEQ IDNO:59所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列。
(13)一种载体,所述载体包含根据(1)至(12)中任一项所述的多核苷酸。
(14)根据(13)所述的载体,其中所述载体是质粒载体或病毒载体。
(15)根据(14)所述的载体,其中所述病毒载体选自腺相关病毒(AAV)载体、腺病毒载体和慢病毒载体。
(16)根据(15)所述的载体,其中所述AAV载体选自AAV1、AAV2、AAV6、AAV7、AAV8、AAV9、AAV587MTP、AAV588MTP、AAV-B1、AAVM41、AAVrh74、AAVS1_P1和AAVS10_P1。
(17)根据(16)所述的载体,其中所述AAV载体是AAV9。
(18)一种药物组合物,所述药物组合物包含根据(1)至(12)中任一项所述的多核苷酸或根据(13)至(17)中任一项所述的载体。
(19)根据(18)所述的药物组合物,所述药物组合物用于治疗或预防杜氏肌营养不良或贝克肌营养不良。
(20)一种治疗或预防杜氏肌营养不良或贝克肌营养不良的方法,所述方法包括向有此需要的对象施用根据(1)至(12)中任一项所述的多核苷酸或根据(13)至(17)中任一项所述的载体。
(21)根据(1)至(12)中任一项所述的多核苷酸或根据(13)至(17)中任一项所述的载体用于治疗或预防杜氏肌营养不良或贝克肌营养不良的用途。
(22)根据(1)至(12)中任一项所述的多核苷酸或根据(13)至(17)中任一项所述的载体在制备用于治疗或预防杜氏肌营养不良或贝克肌营养不良的药物组合物中的用途。
(23)一种核糖核蛋白,所述核糖核蛋白包含以下:
(c)核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白,和
(d)靶向人肌营养相关蛋白基因的表达调节区中SEQ ID NO:104、105、135、141、153、167或172所示区域中长度为18至24个核苷酸的连续区域的向导RNA。
(24)根据(23)所述的核糖核蛋白,其中所述向导RNA包含SEQ ID NO:194、195、196、197、198、199、200、201、202、203、204、205、206或207所示的碱基序列,或SEQ ID NO:194、195、196、197、198、199、200、201、202、203、204、205、206或207所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列。
(25)根据(23)或(24)所述的核糖核蛋白,其中所述转录激活子是包含RTA的转录激活结构域和VP64的肽。
(26)根据(25)所述的核糖核蛋白,其中所述转录激活子包含SEQ ID NO:117所示的氨基酸序列,或与SEQ ID NO:117所示的氨基酸序列具有至少90%同一性的氨基酸序列。
(27)根据(23)至(26)中任一项所述的核糖核蛋白,其中所述核酸酶缺陷型CRISPR效应蛋白是dCas9。
(28)根据(27)所述的核糖核蛋白,其中所述dCas9来源于金黄色葡萄球菌。
(29)根据(23)至(28)中任一项所述的核糖核蛋白,
其中所述向导RNA包含SEQ ID NO:194、195或197所示的碱基序列,或SEQ ID NO:194、195或197所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列,
其中所述转录激活子包含SEQ ID NO:117所示的氨基酸序列,或与SEQ ID NO:117所示的氨基酸序列具有至少90%同一性的氨基酸序列,且
其中所述核酸酶缺陷型CRISPR效应蛋白是来源于金黄色葡萄球菌的dCas9。
(30)根据(29)所述的核糖核蛋白,其中所述向导RNA包含SEQ ID NO:197所示的碱基序列或SEQ ID NO:197所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列。
(31)一种组合物或试剂盒,所述组合物或试剂盒包含以下用于激活人肌营养相关蛋白基因的表达:
(e)核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白,或编码所述融合蛋白的多核苷酸,和
(f)靶向人肌营养相关蛋白基因的表达调节区中SEQ ID NO:104、105、135、141、153、167或172所示区域中长度为18至24个核苷酸的连续区域的向导RNA,或编码所述向导RNA的多核苷酸。
(32)根据(31)所述的组合物或试剂盒,其中所述向导RNA包含SEQ ID NO:194、195、196、197、198、199、200、201、202、203、204、205、206或207所示的碱基序列,或SEQ IDNO:194、195、196、197、198、199、200、201、202、203、204、205、206或207所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列。
(33)根据(31)或(32)所述的组合物或试剂盒,包含至少两种不同的向导RNA。
(34)根据(31)至(33)中任一项所述的组合物或试剂盒,其中所述转录激活子是包含RTA的转录激活结构域和VP64的肽。
(35)根据(34)所述的组合物或试剂盒,其中所述转录激活子包含SEQ ID NO:117所示的氨基酸序列,或与SEQ ID NO:117所示的氨基酸序列具有至少90%同一性的氨基酸序列。
(36)根据(31)至(35)中任一项所述的组合物或试剂盒,其中所述核酸酶缺陷型CRISPR效应蛋白是dCas9。
(37)根据(36)所述的组合物或试剂盒,其中所述dCas9来源于金黄色葡萄球菌。
(38)根据(31)至(37)中任一项所述的组合物或试剂盒,
其中所述组合物或试剂盒包含编码所述融合蛋白的多核苷酸和编码所述向导RNA的多核苷酸,且
其中所述编码融合蛋白的多核苷酸进一步包含用于所述融合蛋白的启动子序列,且/或所述编码向导RNA的多核苷酸进一步包含用于所述向导RNA的启动子序列。
(39)根据(38)所述的组合物或试剂盒,其中所述用于向导RNA的启动子序列选自U6启动子、SNR6启动子、SNR52启动子、SCR1启动子、RPR1启动子、U3启动子和H1启动子。
(40)根据(38)或(39)所述的组合物或试剂盒,其中所述用于融合蛋白的启动子序列选自EFS启动子、EF-1α启动子、CMV启动子、CK8启动子、MHC启动子、Des启动子、CAG启动子和MYOD启动子。
(41)根据(38)至(40)中任一项所述的组合物或试剂盒,其中所述向导RNA包含SEQID NO:194、195或197所示的碱基序列,或SEQ ID NO:194、195或197所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列,
其中所述转录激活子包含SEQ ID NO:117所示的氨基酸序列,或与SEQ ID NO:117所示的氨基酸序列具有至少90%同一性的氨基酸序列,
其中所述核酸酶缺陷型CRISPR效应蛋白是来源于金黄色葡萄球菌的dCas9,
其中所述用于向导RNA的启动子序列是U6启动子,且
其中所述用于融合蛋白的启动子序列是CK8启动子。
(42)根据(41)所述的组合物或试剂盒,其中所述向导RNA包含SEQ ID NO:197所示的碱基序列,或SEQ ID NO:197所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列。
(43)一种治疗或预防DUCCHENNE肌营养不良或贝克肌营养不良的方法,所述方法包括施用以下(e)和(f):
(e)核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白,或编码所述融合蛋白的多核苷酸,和
(f)靶向人肌营养相关蛋白基因的表达调节区中SEQ ID NO:104、105、135、141、153、167或172所示区域中长度为18至24个核苷酸的连续区域的向导RNA,或编码所述向导RNA的多核苷酸。
(44)根据(43)所述的方法,其中所述向导RNA包含SEQ ID NO:194、195、196、197、198、199、200、201、202、203、204、205、206或207所示的碱基序列,或SEQ ID NO:194、195、196、197、198、199、200、201、202、203、204、205、206或207所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列,或编码所述向导RNA的多核苷酸。
(45)根据(43)或(44)所述的方法,包含至少两种不同的向导RNA。
(46)根据(43)至(45)中任一项所述的方法,其中所述转录激活子是包含RTA的转录激活结构域和VP64的肽。
(47)根据(46)所述的方法,其中所述转录激活子包含SEQ ID NO:117所示的氨基酸序列,或与SEQ ID NO:117所示的氨基酸序列具有至少90%同一性的氨基酸序列。
(48)根据(43)至(47)中任一项所述的方法,其中所述核酸酶缺陷型CRISPR效应蛋白是dCas9。
(49)根据(48)所述的方法,其中所述dCas9来源于金黄色葡萄球菌。
(50)根据(43)至(49)中任一项所述的方法,
其中所述方法包括施用编码所述融合蛋白的多核苷酸和编码所述向导RNA的多核苷酸,且
其中所述编码融合蛋白的多核苷酸进一步包含用于所述融合蛋白的启动子序列,且/或所述编码向导RNA的多核苷酸进一步包含用于所述向导RNA的启动子序列。
(51)根据(50)所述的方法,其中所述用于向导RNA的启动子序列选自U6启动子、SNR6启动子、SNR52启动子、SCR1启动子、RPR1启动子、U3启动子和H1启动子。
(52)根据(50)或(51)所述的方法,其中所述用于融合蛋白的启动子序列选自EFS启动子、EF-1α启动子、CMV启动子、CK8启动子、MHC启动子、Des启动子、CAG启动子和MYOD启动子。
(53)根据(50)至(52)中任一项所述的方法,其中所述向导RNA包含SEQ ID NO:194、195或197所示的碱基序列,或SEQ ID NO:194、195或197所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列,
其中所述转录激活子包含SEQ ID NO:117所示的氨基酸序列,或与SEQ ID NO:117所示的氨基酸序列具有至少90%同一性的氨基酸序列,
其中所述核酸酶缺陷型CRISPR效应蛋白是来源于金黄色葡萄球菌的dCas9,
其中所述用于向导RNA的启动子序列是U6启动子,且
其中所述用于融合蛋白的启动子序列是CK8启动子。
(54)根据(53)所述的方法,其中所述向导RNA包含SEQ ID NO:197所示的碱基序列,或SEQ ID NO:197所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列。
(55)以下(e)及(f)在制备用于治疗或预防杜氏肌营养不良或贝克肌营养不良的药物组合物中的用途:
(e)核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白,或编码所述融合蛋白的多核苷酸,和
(f)靶向人肌营养相关蛋白基因的表达调节区中SEQ ID NO:104、105、135、141、153、167或172所示区域中长度为18至24个核苷酸的连续区域的向导RNA,或编码所述向导RNA的多核苷酸。
(56)根据(55)所述的用途,其中所述向导RNA包含SEQ ID NO:194、195、196、197、198、199、200、201、202、203、204、205、206或207所示的碱基序列,或SEQ ID NO:194、195、196、197、198、199、200、201、202、203、204、205、206或207所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列。
(57)根据(55)或(56)所述的用途,包含至少两种不同的向导RNA。
(58)根据(55)至(57)中任一项所述的用途,其中所述转录激活子是包含RTA的转录激活结构域和VP64的肽。
(59)根据(58)所述的用途,其中所述转录激活子包含SEQ ID NO:117所示的氨基酸序列,或与SEQ ID NO:117所示的氨基酸序列具有至少90%同一性的氨基酸序列。
(60)根据(55)至(59)中任一项所述的用途,其中所述核酸酶缺陷型CRISPR效应蛋白是dCas9。
(61)根据(60)所述的用途,其中所述dCas9来源于金黄色葡萄球菌。
(62)根据(55)至(61)中任一项所述的用途,
其中所述用途包括编码所述融合蛋白的多核苷酸的用途以及编码所述向导RNA的多核苷酸的用途,且
其中所述编码融合蛋白的多核苷酸进一步包含用于所述融合蛋白的启动子序列,且/或所述编码向导RNA的多核苷酸进一步包含用于所述向导RNA的启动子序列。
(63)根据(62)所述的用途,其中所述用于向导RNA的启动子序列选自U6启动子、SNR6启动子、SNR52启动子、SCR1启动子、RPR1启动子、U3启动子和H1启动子。
(64)根据(62)或(63)所述的用途,其中所述用于融合蛋白的启动子序列选自EFS启动子、EF-1α启动子、CMV启动子、CK8启动子、MHC启动子、Des启动子、CAG启动子和MYOD启动子。
(65)根据(62)至(64)中任一项所述的用途,其中所述向导RNA包含SEQ ID NO:194、195或197所示的碱基序列,或SEQ ID NO:194、195或197所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列,
其中所述转录激活子包含SEQ ID NO:117所示的氨基酸序列,或与SEQ ID NO:117所示的氨基酸序列具有至少90%同一性的氨基酸序列,
其中所述核酸酶缺陷型CRISPR效应蛋白是来源于金黄色葡萄球菌的dCas9,
其中所述用于向导RNA的启动子序列是U6启动子,且
其中所述用于融合蛋白的启动子序列是CK8启动子。
(66)根据(65)所述的用途,其中所述向导RNA包含SEQ ID NO:197所示的碱基序列,或SEQ ID NO:197所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列。
发明效果
根据本发明,可以激活人肌营养相关蛋白基因的表达,因此,预期本发明能够治疗DMD和BMD。
附图说明
当结合附图考虑以下详细描述时,将容易更完整地理解本发明及其许多附带优点,因为通过以下详细描述将使本发明得到更好的理解,其中:
在图1中,上图示出了人UTRN基因中启动子A的区域,中图示出了启动子B的区域,且示出了相应区域中确定的24种靶向序列的位置(向导编号sgED3-1至sgED3-24(SEQ IDNO:129至152))。在图1中,下图示出了HEK293FT细胞中通过使用包含由SEQ ID NO:129至152所示的靶向序列编码的crRNA的sgRNA和3种不同的dSaCas9-转录激活子融合蛋白(dSaCas9-VP64(SEQ ID NO:188)、dSaCas9-VPH(SEQ ID NO:189)、dSaCas9-VPR(SEQ IDNO:190))的组合对人UTRN基因表达的激活(N=3,误差条表示标准偏差)。当分别使用特异性结合包含向导编号sgED3-6和sgED3-7(SEQ ID NO:134和135)的区域(区域A)和包含向导编号sgED3-13(SEQ ID NO:141)的另一个区域(区域B)的sgRNA时,与使用对照sgRNA的情况相比,人UTRN基因的表达被强烈激活。在3种dSaCas9-转录激活子融合蛋白中,使用dSaCas9-VPR融合蛋白时的激活效果最强。
在图2中,上图示出了在人UTRN基因的启动子A的区域中确定的靶向序列(向导编号sgED3-1至sgED3-20和sgED3-25至sgED3-48(SEQ ID NO:129至148和153至176))的位置。在图2中,下图示出了HEK293FT细胞中通过使用包含由靶向序列向导编号sgED3-6、sgED3-13、sgED3-25至sgED3-48(SEQ ID NO:134、141、153至176)编码的crRNA的sgRNA和dSaCas9-VPR的组合对人UTRN基因表达的激活(N=3,误差条表示标准偏差)。当分别使用特异性结合包含靶向序列向导编号sgED3-6、sgED3-13、sgED3-25至sgED3-32、sgED3-39、sgED3-40、sgED3-44(SEQ ID NO:134、141、153至160、167、168和172)的区域的sgRNA时,与使用对照sgRNA的情况相比,人UTRN基因表达被激活了不少于两倍。
图3示出了通过使用质粒载体对各sgRNA的功能的验证结果(N=1)。制备表达包含由靶向序列向导编号sgED3-6、sgED3-13、sgED3-25、sgED3-27、sgED3-30、sgED3-31、sgED3-39、sgED3-40或sgED3-44(SEQ ID NO:134、141、153、155、158、159、167、168或172)编码的crRNA的sgRNA的pAAV-EFS-dSaCas9[-25]-miniVR-U6-sgRNA AIO质粒,并将所述质粒转染到HEK293FT细胞中,并验证其功能。与对照sgRNA相比,当使用包含由靶向序列向导编号sgED3-6、sgED3-13、sgED3-25、sgED3-27、sgED3-30、sgED3-31、sgED3-39、sgED3-40或sgED3-44(SEQ ID NO:134、141、153、155、158、159、167、168或172)编码的crRNA的sgRNA时,观察到人UTRN基因表达的激活。
图4示出了通过使用AAV载体对各sgRNA的功能的验证结果(N=1)。使用表达包含由靶向序列向导编号sgED3-6、sgED3-30或sgED3-31(SEQ ID NO:134、158或159))编码的crRNA的sgRNA的pAAV-EFS-dSaCas9[-25]-miniVR-U6-sgRNA AIO质粒产生AAV2,将其转导至HEK293FT细胞中。与对照sgRNA相比,在包含由靶向序列向导编号sgED3-6、sgED3-30或sgED3-31(SEQ ID NO:134、158或159)编码的crRNA的所有sgRNA中,都观察到了人UTRN基因的激活。
图5示出了pAAV-EFS-dSaCas9[-25]-miniVR-U6-sgRNA AIO质粒的构建体。
在图6中,图A示出了人骨骼肌细胞中基因组的H3K4me3和H3K27Ac图谱,以及人UTRN基因的推定的增强子区域E1、E2和E3以及推定的启动子区域P1和P2。图B至F示出了各向导编号所示的靶向序列(SEQ ID NO:4至103所示的序列)的位置。
图7示出了HSMM细胞中通过使用包含由各向导编号所示的靶向序列(SEQ ID NO:4至103所示的序列)编码的crRNA的srRNA和dSaCas9-miniVR对人UTRN基因表达的激活的评估结果(N=2)。
在图8中,上图示出了5种靶向序列向导编号145、146、205、208、210(SEQ ID NO:45、46、58、59和60)各自与食蟹猴(Macaca fascicularis)的同源性以及所定位的区域。下图示出了5种靶向序列的组合,它们与食蟹猴的同源性和所定位的区域。
图9示出了在5种不同的HSMM细胞中通过使用包含由靶向序列向导编号145、146、205、208、210(SEQ ID NO:45、46、58、59和60)编码的crRNA的sgRNA(分别或其组合)和dSaCas9-miniVR,对人UTRN基因表达的激活(N=2)。
图10示出了在pED260、pED261或pED263质粒骨架中包含由靶向序列向导编号145、146或208编码的crRNA的sgRNA上调了UTRN。相对mRNA表达是分别从瞬时表达pED260、pED261或pED263骨架中向导编号145、146或208的HEK293FT细胞确定的。数据表示为3次重复实验的平均值+标准偏差(N=3,误差条表示标准偏差)。
在图11中,左图示出了施加了各AAV9样品和标记的SDS-PAGE的泳道布局,右图示出了SDS-PAGE的图像。泳道11旁的值表示分子量(kDa)。从各AAV样品中检测到三种衣壳蛋白(VP1、VP2和VP3,分别为87kDa、72kDa和62kDa)。这些结果表明,克隆到质粒(pED261-145、pED261-146、pED261-208、pED263-145、pED263-146和pED263-208)中的目标基因可以封包到AAV9中。
图12示出了在HSMM细胞中通过使用3种AAV9(AAV9-ED261-145、AAV9-ED261-208和AAV9-ED263-208)对人UTRN基因表达的激活(N=3-4,对于AAV组;N=8,对于非AAV对照。误差条表示标准误差)。这些AAV9激活了人UTRN基因的表达。
图13示出了靶向性向导相对于非靶向性向导标准化的RNA测序结果,绘制为log 2倍数变化对比标准化计数的平均值的图(图A:向导编号145对比NTg1;图B:向导编号146对比NTg1;图C:向导编号208对比NTg1)。
具体实施方式
下面详细说明本发明的实施方式。
1.多核苷酸
本发明提供了一种包含以下碱基序列的多核苷酸(下文中有时称为“本发明的多核苷酸”):
(a)编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列,和
(b)编码向导RNA的碱基序列,所述向导RNA靶向人肌营养相关蛋白基因的表达调节区中SEQ ID NO:104、105、135、141、153、167或172所示区域中长度为18至24个核苷酸的连续区域(即18至24个连续核苷酸)。
将本发明的多核苷酸引入到所需细胞中并转录以产生核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白,以及靶向人UTRN基因的表达调节区的特定区域的向导RNA。这些融合蛋白和向导RNA形成复合物(下文中,所述复合物有时称为“核糖核蛋白;RNP”)并协同作用于上述特定区域,从而激活人UTRN基因的转录。
(1)定义
在本说明书中,“人肌营养相关蛋白(UTRN)基因的表达调节区”是指其中RNP结合到所述区域可以激活人UTRN基因的表达的任何区域。即,人UTRN基因的表达调节区可以存在于人UTRN基因的任何区域,诸如启动子区、增强子区、内含子和外显子等,只要RNP结合激活人UTRN基因的表达即可。在本说明书中,当表达调节区由特定序列示出时,表达调节区在概念上包含有义链序列和反义链序列。
在本发明中,核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白被向导RNA募集到人UTRN基因的表达调节区中的特定区域中。在本说明书中,“靶向......的向导RNA”是指“将融合蛋白募集到......中的向导RNA”。
在本说明书中,“向导RNA(也称为“gRNA”)”是包含基因组特异性CRISPR-RNA(称为“crRNA”)的RNA。crRNA是与靶向序列(下文描述)的互补序列结合的RNA。当Cpf1用作CRISPR效应蛋白时,“向导RNA”是指包含由crRNA和与其5'末端连接的特异性序列组成的RNA的RNA(例如,在FnCpf 1的情况下,SEQ ID NO:106所示的RNA序列)。当Cas9用作CRISPR效应蛋白时,“向导RNA”是指嵌合体RNA(称为“单个向导RNA(sgRNA)”),包含crRNA和与其3'末端连接的反式激活crRNA(称为“tracrRNA”)(例如,参见Zhang F.等人,《人类分子遗传学(Hum MolGenet)》,2014年9月15日;23(R1):R40-6和Zetsche B.等人,《细胞》,2015年10月22日;163(3):759-71,通过引用全部并入本文)。
在本说明书中,将与在人UTRN基因的表达调节区中与crRNA结合的序列互补的序列称为“靶向序列”。即,在本说明书中,“靶向序列”是存在于人UTRN基因的表达调节区中且与PAM(前间隔子相邻基序)相邻的DNA序列。当Cpf1用作CRISPR效应蛋白时,PAM与靶向序列的5'侧相邻。当Cas9用作CRISPR效应蛋白时,PAM与靶向序列的3'侧相邻。靶向序列可以存在于人UTRN基因的表达调节区的有义链序列侧或反义链序列侧(参见,例如,上述Zhang F.等人,《人类分子遗传学》,2014年9月15日;23(R1):R40-6和Zetsche B.等人,《细胞》,2015年10月22日;163(3):759-71,通过引用全部并入本文)。
(2)核酸酶缺陷型CRISPR效应蛋白
在本发明中,使用核酸酶缺陷型CRISPR效应蛋白,将与其融合的转录激活子募集到人UTRN基因的表达调节区中。用于本发明的核酸酶缺陷型CRISPR效应蛋白(下文中简称为“CRISPR效应蛋白”)没有特别限制,只要它与gRNA形成复合物并被募集到人UTRN基因的表达调节区中即可。例如,可以包括核酸酶缺陷型Cas9(下文中有时也称为“dCas9”)或核酸酶缺陷型Cpf1(下文中有时也称为“dCpf1”)。
上述dCas9的实例包括但不限于以下各者的核酸酶缺陷型变体:酿脓链球菌(Streptococcus pyogenes)来源的Cas9(SpCas9;PAM序列:NGG(N为A、G、T或C,以下相同))、嗜热链球菌(Streptococcus thermophilus)来源的Cas9(StCas9;PAM序列:NNAGAAW(W为A或T,以下相同))、脑膜炎奈瑟氏球菌(Neisseria meningitidis)来源的Cas9(NmCas9;PAM序列:NNNNGATT),或金黄色葡萄球菌(Staphylococcus aureus)来源的Cas9(SaCas9;PAM序列:NNGRRT(R为A或G,以下相同)等(例如,参见Nishimasu等人,《细胞》,2014年2月27日;156(5):935-49,Esvelt KM等人,《自然方法学(Nat Methods)》,2013年11月;10(11):1116-21,Zhang Y.《分子细胞(Mol Cell)》,2015年10月15日;60(2):242-55,以及Friedland AE等人,《基因组生物学(Genome Biol)》,2015年11月24日;16:257,通过引用全部并入本文)。例如,在SpCas9的情况下,可以使用其中第10位Asp残基被转化为Ala残基并且第840位His残基被转化为Ala残基的双突变体(有时称为“dSpCas9”)(参见,例如,上述Nishimasu等人,《细胞》,2014)。或者,在SaCas9的情况下,可以使用其中第10位Asp残基被转化为Ala残基并且第580位Asn残基被转化为Ala残基的双突变体(SEQ ID NO:107),或者其中第10位Asp残基被转化为Ala残基并且第557位His残基被转化为Ala残基的双突变体(SEQ ID NO:108)(下文中,这些双突变体中的任何一个有时称为“dSaCas9”)(参见,例如Friedland AE等人,《基因组生物学》,2015,通过引用全部并入本文)。
另外,在本发明的一个实施方式中,作为dCas9,也可以使用通过修饰上述dCas9的氨基酸序列的一部分而得到的变体,所述变体与gRNA形成复合体并被募集到人UTRN基因的表达调节区中。此类变体的实例包括具有部分缺失的氨基酸序列的截短型变体。在本发明的一个实施方式中,作为dCas9,可以使用在PCT/JP2019/022795和PCT/JP2019/041751中公开的变体,通过引用全部并入本文。具体地,也可以使用通过从其中第10位Asp残基被转化为Ala残基且第580位Asn残基被转化为Ala残基的dSaCas9双突变体中缺失第721位至第745位氨基酸而获得的dSaCas9(SEQ ID NO:109),或其中缺失的部分被肽连接子替换的dSaCas9(例如,SEQ ID NO:111所示者,其中缺失的部分被GGSGGS连接子(SEQ ID NO:110)替换,和SEQ ID NO:214所示者,其中缺失的部分被SGGGS连接子(SEQ ID NO:213)替换,等)(下文中,这些双突变体中的任何一个有时称为“dSaCas9[-25]”),或通过从作为上述dSaCas9双突变体中缺失第482位至第648位氨基酸而获得的dSaCas9(SEQ ID NO:112),或其中缺失的部分被肽连接子替换的dSaCas9(SEQ ID NO:113所示者,其中缺失的部分被GGSGGS连接子替换)。
上述dCpf1的实例包括但不限于以下各者的核酸酶缺陷型变体:来源于新凶手弗朗西丝氏菌(Francisella novicida)的Cpf1(FnCpf1;PAM序列:NTT)、来源于氨基球菌属(Acidaminococcus sp.)的Cpf1(AsCpf1;PAM序列:NTTT),或来源于毛螺科菌(Lachnospiraceae bacterium)的Cpf1(LbCpf1;PAM序列:NTTT)等(参见,例如,Zetsche B.等人,《细胞》,2015年10月22日;163(3):759-71,Yamano T等人,《细胞》,2016年5月5日;165(4):949-62,和Yamano T等人,《分子细胞》,2017年8月17日;67(4):633-45,通过引用全部并入本文)。例如,在FnCpf1的情况下,可以使用其中第917位Asp残基转化为Ala残基且第1006位Glu残基转化为Ala残基的双突变体(例如,参见上述Zetsche B等人,《细胞》,2015,通过引用全部并入本文)。在本发明的一个实施方式中,作为dCpf1,也可以使用通过修饰上述dCpf1的氨基酸序列的一部分而获得的变体,所述变体与gRNA形成复合物并被募集到人UTRN基因的表达调节区中。
在本发明的一个实施方式中,dCas9用作核酸酶缺陷型CRISPR效应蛋白。在一个实施方式中,dCas9是dSaCas9,且在特定的实施方式中,dSaCas9是dSaCas9[-25]。
包含编码CRISPR效应蛋白的碱基序列的多核苷酸可以通过例如以下步骤克隆:基于其cDNA序列信息,合成覆盖编码所述蛋白质的所需部分的区域的寡DNA引物,并通过PCR方法使用从产生所述蛋白质的细胞制备的总RNA或mRNA级分作为模板扩增所述多核苷酸。另外,包含编码核酸酶缺陷型CRISPR效应蛋白的碱基序列的多核苷酸可以通过以已知的定点诱变方法将突变引入到编码克隆的CRISPR效应蛋白的核苷酸序列中以将在对DNA切割活性重要的位置处的氨基酸残基(例如,可以包括但不限于:在SaCas9的情况下,第10位Asp残基、第557位His残基和第580位Asn残基;在FnCpf1的情况下,第917位Asp残基和第1006位Glu残基等)转化成其它氨基酸而获得。
或者,包含编码核酸酶缺陷型CRISPR效应蛋白的碱基序列的多核苷酸可以通过化学合成或化学合成与PCR方法或Gibson组装方法的组合,基于其cDNA序列信息而获得,且还可以进一步构建为经过密码子优化以产生适合在人体内表达的密码子的碱基序列。
(3)转录激活子
在本发明中,人UTRN基因表达通过与核酸酶缺陷型CRISPR效应蛋白融合的转录激活子的作用而被激活。在本说明书中,“转录激活子”是指能够激活人UTRN基因的基因转录的蛋白质或保留其功能的肽片段。用于本发明的转录激活子没有特别限制,只要其可以激活人UTRN基因的表达即可。例如,其包括VP64、VPH、VPR、miniVR和microVR,其具有转录激活能力的变体等。VP64是由SEQ ID NO:114所示的50个氨基酸组成的肽。VPH是VP64、p65和HSF1的融合蛋白,具体地,是由SEQ ID NO:115所示的376个氨基酸组成的肽。VPR是VP64、p65和爱泼斯坦-巴尔病毒(Epstein-Barr virus)的复制和转录激活子(RTA)的融合蛋白,例如,由SEQ ID NO:116所示的523个氨基酸组成的肽、由SEQ ID NO:216所示的519个氨基酸组成的肽等。VP64、VPH和VPR是已知的并且在例如以下文献中详细公开:Chavez A.等人,《自然方法学》,2016年7月;13(7):563-7和Chavez A.等人,《自然方法学》,2015年4月;12(4):326-8,通过引用全部并入本文。在本发明的一个实施方式中,作为转录激活子,可以使用包含RTA的转录激活结构域和VP64的肽。RTA的转录激活结构域是已知的并且在例如以下文献中公开:《病毒学杂志(J Virol)》,1992年9月;66(9):5500-8,通过引用全部并入本文。作为这种肽的序列,miniVR是由SEQ ID NO:117所示的167个氨基酸组成的肽,microVR是由SEQ ID NO:118所示的140个氨基酸组成的肽。SEQ ID NO:117所示的氨基酸序列由如下氨基酸序列组成,其中RTA的较短的转录激活结构域,即RTA的第493位至第605位氨基酸残基,和VP64以G-S-G-S连接子(SEQ ID NO:209)连接。SEQ ID NO:118所示的氨基酸序列由如下氨基酸序列组成,其中RTA的更短的转录激活结构域,即RTA的第520位至第605位氨基酸残基,和VP64以G-S-G-S连接子连接。miniVR和microVR的详情在PCT/JP2019/030972中进行了描述,通过引用全部并入本文。任何上述转录激活子都可以进行任何修饰和/或改变,只要其保持其转录激活能力即可。例如,作为本发明中的转录激活子,还可以使用(i)包含SEQID NO:117所示的氨基酸序列的肽,(ii)包含SEQ ID NO:117所示但其中缺失、替换、插入和/或添加了1个或几个(例如2、3、4、5或更多个)氨基酸的氨基酸序列的肽,(iii)包含与SEQ ID NO:117所示的氨基酸序列具有不小于90%(例如90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或以上)同一性的氨基酸序列的肽,(iv)由SEQ ID NO:117所示但其中缺失、替换、插入和/或添加了1个或几个(例如2、3、4、5或更多个)氨基酸的氨基酸序列组成的肽,或(v)由与SEQ ID NO:117所示的氨基酸序列具有不小于90%(例如90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或以上)同一性的氨基酸序列组成的肽,只要其保持其转录激活能力即可。例如,作为本发明中的转录激活子,还可以使用(i)包含SEQ ID NO:118所示的氨基酸序列的肽,(ii)包含SEQ ID NO:118所示但其中缺失、替换、插入和/或添加了1个或几个(例如2、3、4、5或更多个)氨基酸的氨基酸序列的肽,(iii)由与SEQ ID NO:118中所示的氨基酸序列具有不小于90%(例如90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或以上)同一性的氨基酸序列组成的肽,(iv)由SEQ ID NO:118所示但其中缺失、替换、插入和/或添加了1个或几个(例如2、3、4、5或更多个)氨基酸的氨基酸序列组成的肽,或(v)由与SEQ ID NO:118所示的氨基酸序列具有不小于90%(例如90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或以上)同一性的氨基酸序列组成的肽,只要其保持其转录激活能力即可。
包含编码转录激活子的碱基序列的多核苷酸可以通过化学合成或化学合成与PCR方法或Gibson组装方法的组合来构建。此外,包含编码转录激活子的碱基序列的多核苷酸还可以被构建为密码子优化的DNA序列,成为适合于在人体内表达的密码子。
包含编码转录激活子和核酸酶缺陷型CRISPR效应蛋白的融合蛋白的碱基序列的多核苷酸可以通过将编码核酸酶缺陷型CRISPR效应蛋白的碱基序列与编码转录激活子的碱基序列直接或在添加编码连接子、NLS(核定位信号)、标签和/或其它的碱基序列后连接来制备。在本发明中,转录激活子可以与CRISPR效应蛋白的N-末端或C-末端融合。作为连接子,可以使用氨基酸数为约2至50的连接子,其具体实例包括但不限于其中甘氨酸(G)和丝氨酸(S)交替连接的G-S-G-S连接子,及类似物。
(4)向导RNA
在本发明中,核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白可以被向导RNA募集到人UTRN基因的表达调节区。如上述“(1)定义”中所述,向导RNA包含crRNA,且所述crRNA与靶向序列的互补序列结合。crRNA可能不与靶向序列的互补序列完全互补,只要向导RNA可以将融合蛋白募集到靶区域即可,且可以包含靶向序列中缺失、替换、插入和/或添加了至少1至3个碱基的碱基序列。
当dCas9用作核酸酶缺陷型CRISPR效应蛋白时,例如,可以使用已发布的gRNA设计网站(CRISPR Design Tool、CRISPR direct等)确定靶向序列。具体而言,从靶基因(即人UTRN基因)的序列中,列出了长度为约20个核苷酸的候选靶向序列,其中PAM(例如,在SaCas9的情况下,NNGRRT)与其3'侧相邻,且可以将这些候选靶向序列中在人基因组中具有少量脱靶位点的序列用作靶向序列。靶向序列的碱基长度为18至24个核苷酸,优选为20至23个核苷酸,更优选为21至23个核苷酸。作为预测脱靶位点数目的初步筛选,许多生物信息学工具是已知的且可公开获得,可用于预测脱靶效应最低的靶向序列。其实例包括诸如Benchling(https://benchling.com)和COSMID(具有错配、插入和缺失的CRISPR脱靶位点)(可在互联网https://crispr.bme.gatech.edu上找到)的生物信息学工具。使用这些,可以总结出与gRNA靶向的碱基序列的相似性。当要使用的gRNA设计软件不具有搜索靶基因组的脱靶位点的功能时,例如,可以通过对靶基因组进行关于候选靶向序列的3'侧的8至12个核苷酸(具有靶向核苷酸序列高识别能力的种子序列)的Blast搜索来搜索脱靶位点。
在本发明的一个实施方式中,在存在于人6号染色体(Chr 6)的GRCh38.p12位置上的区域中,以下五个区域可能是人UTRN基因的表达调节区。组蛋白修饰图谱强力表明这些区域为表达调节区。因此,在本发明的一个实施方式中,在存在于人6号染色体(Chr 6)的GRCh38.p12位置上的以下五个区域中的至少一个区域中,靶向序列的长度可以为18至24个核苷酸,优选为20至23个核苷酸,更优选为21至23个核苷酸:
(1)144,215,500-144,217,000,
(2)144,248,500-144,249,800,
(3)144,264,000-144,267,000,
(4)144,283,900-144,288,300,
(5)144,292,500-144,295,500。
在本发明的一个实施方式中,在存在于上述区域(3)中的SEQ ID NO:104所示的区域中或存在于上述区域(4)中的SEQ ID NO:105、135、141、153、167或172所示的区域中,靶向序列的长度可以是连续的18至24个核苷酸,优选为20至23个核苷酸,更优选为21至23个核苷酸。
在本发明的另一个实施方式中,靶向序列可以是SEQ ID NO:45、46、58、59、60、135、141、153、155、156、157、159、167或172所示的碱基序列。SEQ ID NO:45和46所示的碱基序列是包含在上述SEQ ID NO:104所示区域中的靶向序列,且SEQ ID NO:58、59、60、155、156、157和159所示的碱基序列是包含在上述SEQ ID NO:105所示区域中的靶向序列。
在本发明的一个实施方式中,编码crRNA的碱基序列可以是与靶向序列相同的碱基序列。例如,当将SEQ ID NO:4所示的靶向序列(AGAAAAGCGGCCCCTAGGGGC)作为编码crRNA的碱基序列引入细胞时,从所述序列转录的crRNA是AGAAAAGCGGCCCCUAGGGGC(SEQ ID NO:119),并与GCCCCTAGGGGCCGCTTTTCT(SEQ ID NO:120)结合,后者是与SEQ ID NO:4所示的碱基序列互补的序列,且存在于人UTRN基因的表达调节区中。在另一个实施方式中,可以使用靶向序列中缺失、替换、插入和/或添加了至少1至3个碱基的碱基序列作为编码crRNA的碱基序列,只要向导RNA可以募集融合蛋白至靶区域即可。因此,在本发明的一个实施方式中,作为编码crRNA的碱基序列,可以使用SEQ ID NO:45、46、58、59、60、135、141、153、155、156、157、159、167或172所示的碱基序列,或SEQ ID NO:45、46、58、59、60、135、141、153、155、156、157、159、167或172所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列。
在本发明的一个实施方式中,SEQ ID NO:45、46、58、59、60,135、141、153、155、156、157、159、167或172所示的碱基序列可以用作编码crRNA的碱基序列以分别产生包含SEQ ID NO:194、195、196、197、198、199、200、201、202、203、204、205、206或207所示的crRNA的gRNA。在本发明的另一个实施方式中,gRNA可以包含SEQ ID NO:194、195、196、197、198、199、200、201、202、203、204、205、206或207所示的碱基序列,或SEQ ID NO:194、195、196、197、198、199、200、201、202、203、204、205、206或207所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列。
当dCpf1用作核酸酶缺陷型CRISPR效应蛋白时,可以将编码gRNA的碱基序列设计为编码在5'末端连接有特定RNA的crRNA的DNA序列。本领域普通技术人员可以根据要使用的dCpf1适当地选择所述与crRNA的5'末端连接的RNA和编码所述RNA的DNA序列。例如,当使用dFnCpf1时,其中SEQ ID NO:121,即AATTTCTACTGTTGTAGAT连接到靶向序列的5'侧的碱基序列可以用作编码gRNA的碱基序列(转录成RNA时,带下划线部分的序列形成碱基对以形成茎环结构)。要添加到5'末端的序列可以是通常用于各种Cpf1蛋白的序列,其中缺失、替换、插入和/或添加了至少1至6个碱基,只要转录后gRNA可以将融合蛋白募集到表达调节区即可。
当dCas9用作CRISPR效应蛋白时,可以将编码gRNA的碱基序列设计为其中编码已知tracrRNA的DNA序列连接到编码crRNA的DNA序列的3'末端的DNA序列。本领域普通技术人员可以根据要使用的dCas9适当地选择这样的tracrRNA和编码所述tracrRNA的DNA序列。例如,当使用dSaCas9时,SEQ ID NO:122所示的碱基序列用作编码tracrRNA的DNA序列。编码tracrRNA的DNA序列可以是编码通常用于各种Cas9蛋白的tracrRNA的碱基序列,其中缺失、替换、插入和/或添加了至少1至6个碱基,只要转录后gRNA可以将融合蛋白募集到表达调节区即可。
包含以此方式设计的编码gRNA的碱基序列的多核苷酸可以使用已知的DNA合成方法化学合成。
在本发明的另一个实施方式中,本发明的多核苷酸可以包含至少两种不同的编码gRNA的碱基序列。例如,多核苷酸可以包含至少两种不同的编码向导RNA的碱基序列,其中所述至少两种不同的碱基序列选自包含SEQ ID NO:45、46、58、59、60、135、141、153、155、156、157、159、167或172所示序列的碱基序列。在本发明的一个实施方式中,多核苷酸可以包含至少两种不同的编码向导RNA的碱基序列,其中所述至少两种不同的碱基序列选自包含SEQ ID NO:45、46或59所示序列的碱基序列。
(5)启动子序列
在本发明的一个实施方式中,启动子序列可以可操作地连接至编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列和/或编码gRNA的碱基序列各自的上游。可能连接的启动子没有特别限制,只要它在靶细胞中显示出启动子活性即可。可能连接至编码融合蛋白的碱基序列上游的启动子序列的实例包括但不限于EFS启动子、EF-1α启动子、CMV(巨细胞病毒)启动子、CK8启动子、MHC启动子、MLC启动子、Des启动子、cTnC启动子、MYOD启动子、hTERT启动子、SRα启动子、SV40启动子、LTR启动子、CAG启动子、RSV(劳斯氏肉瘤病毒)启动子等。可能连接至编码gRNA的碱基序列上游的启动子序列的实例包括但不限于为pol III启动子的U6启动子、SNR6启动子、SNR52启动子、SCR1启动子、RPR1启动子、U3启动子、H1启动子和tRNA启动子等。在本发明的一个实施方式中,当多核苷酸包含两种以上编码向导RNA的碱基序列时,单个启动子序列可以可操作地连接至所述两种以上碱基序列的上游。在另一个实施方式中,启动子序列可以可操作地连接至两种以上碱基序列各自的上游,其中可操作地连接至各碱基序列的启动子序列可以相同或不同。
在本发明的一个实施方式中,可以使用肌肉特异性启动子作为连接至编码上述融合蛋白的碱基序列上游的启动子序列。肌肉特异性启动子的实例包括但不限于CK8启动子、CK6启动子、CK1启动子、CK7启动子、CK9启动子、心肌肌钙蛋白C启动子、α肌动蛋白启动子、肌球蛋白重链激酶(MHCK)启动子、肌球蛋白轻链2A启动子、肌营养不良蛋白启动子、肌肉肌酸激酶启动子、dMCK启动子、tMCK启动子、enh348 MCK启动子、合成C5-12(Syn)启动子、Myf5启动子、MLC1/3f启动子、MYOD启动子、Myog启动子、Pax7启动子、Des启动子等(关于肌肉特异性启动子的详情,参见,例如,US2011/0212529A、McCarthy JJ等人,《骨骼肌(SkeletalMuscle)》,2012年5月;2(1):8,Wang B.等人,《基因治疗(Gene Ther)》(2008年11月;15(22):1489-99,通过引用全部并入本文)。
在本发明的一个实施方式中,U6启动子可以用作编码gRNA的碱基序列的启动子序列,CK8启动子可以用作编码融合蛋白的碱基序列的启动子序列。具体地,对于U6启动子,可以使用以下碱基序列:(i)SEQ ID NO:128所示的碱基序列,(ii)SEQ ID NO:128所示但其中缺失、替换、插入和/或添加了1个或几个(例如2、3、4、5或更多个)碱基的碱基序列,在靶细胞中具有启动子活性,或(iii)与SEQ ID NO:128所示的碱基序列具有不小于90%(例如90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或以上)同一性的碱基序列,在靶细胞中显示出启动子活性。对于CK8启动子,可以使用以下碱基序列:(i)SEQ ID NO:191所示的碱基序列,(ii)SEQ ID NO:191所示但其中缺失、替换、插入和/或添加了1个或几个(例如2、3、4、5或更多个)碱基的碱基序列,在靶细胞中具有启动子活性,或(iii)与SEQ ID NO:191所示的碱基序列具有不小于90%(例如90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或以上)同一性的碱基序列,在靶细胞中显示出启动子活性。
(6)其它碱基序列
此外,本发明的多核苷酸除了上述提及的那些以外,可以进一步包含例如多腺苷酸化(polyA)信号、Kozak共有序列等已知序列,以达成提高由编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列的转录产生的mRNA的翻译效率的目的。例如,本发明中的多腺苷酸化信号可以包括hGH polyA、bGH polyA、2x sNRP-1 polyA(参见US7557197B2,通过引用全部并入本文)等。另外,本发明的多核苷酸可以包含编码连接子序列的碱基序列、编码NLS的碱基序列和/或编码标签的碱基序列。
(7)本发明的示例性实施方式
在本发明的一个实施方式中,提供了一种多核苷酸,所述多核苷酸包含:
编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列,
用于所述编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列的启动子序列,
一种或两种编码向导RNA的碱基序列,其中所述一种或两种碱基序列选自包含SEQID NO:45、46或59所示序列的碱基序列,或包含SEQ ID NO:45、46或59所示但其中缺失、替换、插入和/或添加了1至3个碱基的序列的碱基序列,以及
用于所述编码向导RNA的碱基序列的U6启动子,
其中所述核酸酶缺陷型CRISPR效应蛋白是dSaCas9或dSaCas9[-25],
其中所述转录激活子选自VP64、VPH、VPR、miniVR和microVR,且
其中所述用于编码融合蛋白的碱基序列的启动子序列选自EF-1α启动子、EFS启动子和CK8启动子。
所述多核苷酸可以进一步包含hGH polyA、bGH polyA或2xsNRP-1 polyA。
在本发明的一个实施方式中,提供了一种多核苷酸,所述多核苷酸包含:
编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列,
用于所述编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列的CK8启动子,
一种或两种编码向导RNA的碱基序列,其中所述一种或两种碱基序列选自包含SEQID NO:45、46或59所示序列的碱基序列,或包含SEQ ID NO:45、46或59所示但其中缺失、替换、插入和/或添加了1至3个碱基的序列的碱基序列,以及
用于所述编码向导RNA的碱基序列的U6启动子,
其中所述核酸酶缺陷型CRISPR效应蛋白是dSaCas9或dSaCas9[-25],且
其中所述转录激活子是miniVR或microVR。
所述多核苷酸可以进一步包含bGH polyA或2x sNRP-1 polyA。
在本发明的一个实施方式中,提供了一种多核苷酸,所述多核苷酸包含:
编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列,
用于所述编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列的CK8启动子,
一种或两种编码向导RNA的碱基序列,其中所述一种或两种碱基序列选自包含SEQID NO:45、46或59所示序列的碱基序列,或包含SEQ ID NO:45、46或59所示但其中缺失、替换、插入和/或添加了1至3个碱基的序列的碱基序列,以及
用于所述编码向导RNA的碱基序列的U6启动子,
其中所述核酸酶缺陷型CRISPR效应蛋白是dSaCas9,且
其中所述转录激活子是miniVR。
所述多核苷酸可以进一步包含bGH polyA或2x sNRP-1 polyA。
在本发明的一个实施方式中,提供了一种多核苷酸,所述多核苷酸包含:
编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列,
用于所述编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列的CK8启动子,
一种或两种编码向导RNA的碱基序列,其中所述一种或两种碱基序列选自包含SEQID NO:45、46或59所示序列的碱基序列,或包含SEQ ID NO:45、46或59所示但其中缺失、替换、插入和/或添加了1至3个碱基的序列的碱基序列,以及
用于所述编码向导RNA的碱基序列的U6启动子,
其中所述核酸酶缺陷型CRISPR效应蛋白是dSaCas9,且
其中所述转录激活子是microVR。
所述多核苷酸可以进一步包含bGH polyA或2x sNRP-1 polyA。
在本发明的一个实施方式中,提供了一种多核苷酸,所述多核苷酸包含:
编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列,
用于所述编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列的CK8启动子,
编码向导RNA的碱基序列,包含SEQ ID NO:59所示的碱基序列,或SEQ ID NO:59所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列,以及
用于所述编码向导RNA的碱基序列的U6启动子,
其中所述核酸酶缺陷型CRISPR效应蛋白是dSaCas9,且
其中所述转录激活子是miniVR。
所述多核苷酸可以进一步包含2x sNRP-1 polyA。
在本发明的一个实施方式中,提供了一种多核苷酸,所述多核苷酸包含:
编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列,
用于所述编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列的CK8启动子,
编码向导RNA的碱基序列,包含SEQ ID NO:59所示的碱基序列,或SEQ ID NO:59所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列,以及
用于所述编码向导RNA的碱基序列的U6启动子,
其中所述核酸酶缺陷型CRISPR效应蛋白是dSaCas9,且
其中所述转录激活子是microVR。
所述多核苷酸可以进一步包含2x sNRP-1 polyA。
在本发明的多核苷酸的一个实施方式中,多核苷酸从5'末端开始依次包含(i)编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列和(ii)编码gRNA的碱基序列。在另一个实施方式中,多核苷酸从5'末端开始依次包含(ii)编码gRNA的碱基序列和(i)编码核酸酶缺陷型CRISPR效应蛋白与转录激活子的融合蛋白的碱基序列。
2.载体
本发明提供了一种包含本发明的多核苷酸的载体(下文中有时称为“本发明的载体”)。本发明的载体可以是质粒载体或病毒载体。
当本发明的载体是质粒载体时,所使用的质粒载体没有特别限制,且可以是任何质粒载体,诸如克隆质粒载体和表达质粒载体。通过用已知方法将本发明的多核苷酸插入质粒载体中来制备质粒载体。
当本发明的载体是病毒载体时,使用的病毒载体没有特别限制,其实例包括但不限于腺病毒载体、腺相关病毒(AAV)载体、慢病毒载体、逆转录病毒载体、仙台病毒载体等。在本说明书中,“病毒载体”还包括其衍生物。考虑到在基因治疗中的用途,优选使用AAV载体,原因在于它能够长时间表达转基因,且它衍生自非致病性病毒并具有高安全性。
可以通过已知方法制备包含本发明的多核苷酸的病毒载体。简而言之,制备插入有本发明的多核苷酸的用于病毒表达的质粒载体,将所述载体转染到合适的宿主细胞中以允许瞬时产生包含本发明的多核苷酸的病毒载体,并收集病毒载体。
在本发明的一个实施方式中,当使用AAV载体时,AAV载体的血清型没有特别限制,只要可以激活靶标中人UTRN基因的表达即可,且可以使用AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAVrh.10等中的任何一个(对于AAV的各种血清型,参见,例如,WO2005/033321和EP2341068(A1),通过引用全部并入本文)。AAV变体的实例包括但不限于具有修饰的衣壳的新血清型(例如,WO 2012/057363,通过引用全部并入本文)等。例如,在本发明的一个实施方式中,可以使用具有修饰的衣壳以提高对肌肉细胞的感染性的新血清型,诸如AAV587MTP、AAV588MTP、AAV-B1、AAVM41、AAVS1_P1和AAVS10_P1等(参见Yu等人,《基因治疗》2009年4月;16(8):953-62,Choudhury等人,《分子治疗》,2016年4月;24(7):1247-57,Yang等人,《美国科学院院报(Proc Natl Acad Sci USA)》(2009年3月10日;106(10):3946-51和WO2019/207132,通过引用全部并入本文)。
当制备AAV载体时,可以使用诸如以下的已知方法:(1)使用质粒的方法,(2)使用杆状病毒的方法,(3)使用单纯疱疹病毒的方法,(4)使用腺病毒的方法,或(5)使用酵母的方法(例如,《应用微生物学与生物技术(Appl Microbiol Biotechnol)》,2018;102(3):1045-1054等,通过引用全部并入本文)。例如,当通过使用质粒的方法制备AAV载体时,首先,制备在野生型AAV基因组序列的两个末端包含反向的末端重复序列(ITR)并插入有本发明的多核苷酸代替编码Rep蛋白和衣壳蛋白的DNA的载体质粒。另一方面,将编码形成病毒粒子所必需的Rep蛋白和衣壳蛋白的DNA插入其它质粒中。此外,将包含负责AAV增殖所必需的腺病毒的辅助作用的基因(E1A、E1B、E2A、VA和E4orf6)的质粒制备为腺病毒辅助质粒。将这三种质粒共转染到宿主细胞中使得在细胞中产生重组AAV(即,AAV载体)。作为宿主细胞,优选使用能够提供负责上述辅助作用的基因的一部分基因产物(蛋白质)的细胞(例如293细胞等)。当使用这种细胞时,不必在上述腺病毒辅助质粒中携带编码可以从宿主细胞提供的蛋白质的基因。产生的AAV载体存在于细胞核中。因此,通过以下步骤来制备所需的AAV载体:用冻融破坏宿主细胞,收集病毒,然后通过使用氯化铯的密度梯度超速离心法,柱法等对病毒级分进行分离和纯化。
AAV载体在安全性、基因转导效率等方面具有很大的优势,且用于基因治疗。然而,已知可以封包在AAV载体中的多核苷酸的大小是有限制的。例如,在本发明的一个实施方式中,包括包含编码dSaCas9和miniVR或microVR的融合蛋白的碱基序列、编码靶向人UTRN的表达调节区的gRNA的碱基序列以及作为启动子序列的EFS启动子序列或CK8启动子序列和U6启动子序列,以及ITR部分在内的多核苷酸的碱基长度的全长为约4.85kb,且它们可以被封包在单个AAV载体中。
3.药物组合物
本发明还提供了一种包含本发明的多核苷酸或本发明的载体的药物组合物(下文中有时称为“本发明的药物组合物”)。本发明的药物组合物可以用于治疗或预防DMD或BMD。
本发明的药物组合物包含本发明的多核苷酸或本发明的载体作为活性成分,且可以制备成包含这种活性成分(即,本发明的多核苷酸或本发明的载体)和通常药学上可接受的载剂的制剂。
本发明的药物组合物经肠胃外施用,且可以局部或全身施用。本发明的药物组合物可以通过但不限于例如静脉内施用、动脉内施用、皮下施用、腹膜内施用或肌肉内施用来施用。
本发明的药物组合物向对象施用的剂量没有特别限制,只要它是用于治疗和/或预防的有效量即可。可以根据活性成分、剂型、对象的年龄和体重、施用方案、施用方法等适当地优化。
在本发明的一个实施方式中,本发明的药物组合物不仅可以施用于患有DMD或BMD的对象,而且还可以预防性地施用于基于遗传背景分析等将来可能发展为DMD或BMD的对象。本说明书中的术语“治疗”除了治愈疾病以外,还包括疾病缓解。另外,术语“预防”除了预防疾病发作以外,还可以包括延迟疾病发作。本发明的药物组合物也可以称为“本发明的药剂”等。
4.治疗或预防DMD或BMD的方法
本发明还提供一种用于治疗或预防DMD或BMD的方法,所述方法包括向有此需要的对象施用本发明的多核苷酸或本发明的载体(下文中有时称为“本发明的方法”)。另外,本发明包括用于治疗或预防DMD或BMD的本发明的多核苷酸或本发明的载体。此外,本发明包括本发明的多核苷酸或本发明的载体在制备用于治疗或预防DMD或BMD的药物组合物中的用途。
本发明的方法可以通过向患有DMD或BMD的对象施用上述本发明的药物组合物来实践,且剂量、施用途径、对象等与上述相同。
症状的测量可以在使用本发明的方法开始治疗之前以及在治疗之后的任何时间进行,以确定对象对治疗的反应。
本发明的方法可以改善对象的骨骼肌和/或心肌的功能。要改善功能的肌肉没有特别限制,且可以列举任何肌肉和肌肉群。
5.核糖核蛋白
本发明提供了一种核糖核酸蛋白,所述核糖核酸蛋白包含以下(下文中有时称为“本发明的RNP”):
(c)核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白,和
(d)靶向人肌营养相关蛋白基因的表达调节区中SEQ ID NO:104、105、135、141、153、167或172所示区域中长度为18至24个核苷酸的连续区域的向导RNA。
作为包含在本发明的RNP中的核酸酶缺陷型CRISPR效应蛋白、转录激活子和向导RNA,可以使用在上述“1.多核苷酸”部分中详细说明的核酸酶缺陷型CRISPR效应蛋白、转录激活子和向导RNA。包含在本发明的RNP中的核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白可以通过例如将编码所述融合蛋白的多核苷酸引入到细胞、细菌或其它生物中以允许表达而产生,或由体外翻译系统通过使用所述多核苷酸而产生。另外,包含在本发明的RNP中的向导RNA可以通过例如化学合成或体外转录系统通过使用编码向导RNA的多核苷酸而产生。将由此制备的融合蛋白和向导RNA混合以制备本发明的RNP。必要时,可以混合其它物质,诸如金粒子。为了将本发明的RNP直接递送至靶细胞、组织等,可以通过已知方法将RNP封装在脂质纳米粒子(LNP)中。可以通过已知方法将本发明的RNP引入至靶细胞、组织等中。对于封装在LNP中和引入方法,可以参考例如,Lee K.等人,《自然-生物医学工程(NatBiomed Eng)》,2017;1:889-901,WO 2016/153012,通过引用全部并入本文,等等。
在本发明的一个实施方式中,本发明的RNP中所包含的向导RNA靶向存在于人6号染色体(Chr 6)的GRCh38.p12位置上的以下五个区域中至少一个区域中连续的18至24个核苷酸长度,优选20至23个核苷酸长度,更优选21至23个核苷酸长度:
(1)144,215,500-144,217,000,
(2)144,248,500-144,249,800,
(3)144,264,000-144,267,000,
(4)144,283,900-144,288,300,
(5)144,292,500-144,295,500。
在一个实施方式中,向导RNA靶向SEQ ID NO:104、105、135、141、153、167或172所示的DNA序列中连续的18至24个核苷酸长度,优选20至23个核苷酸长度,更优选为21至23个核苷酸长度的碱基序列。在一个实施方式中,向导RNA靶向包含SEQ ID NO:45、46、58、59、60、135、141、153、155、156、157、159、167或172所示的全部或一部分序列的区域。在本发明的一个实施方式中,可以使用包含SEQ ID NO:194、195、196、197、197、198、199、200、201、202、203、204、205、206或207所示的crRNA的向导RNA,或SEQ ID NO:194、195、196、197、198、199、200、201、202、203、204、205、206或207所示但其中分别缺失、替换、插入和/或添加了1至3个碱基的碱基序列。
6.其它
本发明还提供了一种组合物或试剂盒,所述组合物或试剂盒包含以下用于激活人肌营养相关蛋白基因的表达:
(e)核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白,或编码所述融合蛋白的多核苷酸,和
(f)靶向人肌营养相关蛋白基因的表达调节区中SEQ ID NO:104、105、135、141、153、167或172所示区域中长度为18至24个核苷酸的连续区域的向导RNA,或编码所述向导RNA的多核苷酸。
本发明还提供了一种治疗或预防杜氏肌营养不良或贝克肌营养不良的方法,所述方法包括施用以下(e)和(f):
(e)核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白,或编码所述融合蛋白的多核苷酸,和
(f)靶向人肌营养相关蛋白基因的表达调节区中SEQ ID NO:104、105、135、141、153、167或172所示区域中长度为18至24个核苷酸的连续区域的向导RNA,或编码所述向导RNA的多核苷酸。
本发明还提供以下(e)和(f)在制备用于治疗或预防杜氏肌营养不良或贝克肌营养不良的药物组合物中的用途:
(e)核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白,或编码所述融合蛋白的多核苷酸,和
(f)靶向人肌营养相关蛋白基因的表达调节区中SEQ ID NO:104、105、135、141、153、167或172所示区域中长度为18至24个核苷酸的连续区域的向导RNA,或编码所述向导RNA的多核苷酸。
作为本发明中的核酸酶缺陷型CRISPR效应蛋白、转录激活子、向导RNA以及编码它们的多核苷酸和携带它们的载体,可以使用在上述“1.多核苷酸”、“2.载体”和“5.核糖核蛋白”部分中详细说明的那些。上述(e)和(f)的剂量、施用途径、对象、制剂等与在“3.DMD或BMD的治疗或预防剂”中所述的相同。
在以下示例性实施方式的描述过程中,本发明的其它特征将变得显而易见,所述示例性实施方式是为了说明本发明而给出的,而并不旨在限制本发明。
实施例
这些实施例描述了在人UTRN基因的指定的表达调节区中,使用dCas9与转录激活子的融合蛋白来增强基因表达,从而使得人UTRN基因表达被选择性激活。基因表达修饰的目的是增强野生型人UTRN基因产物的表达,补充了缺陷型肌营养不良蛋白基因产物的功能。实施例还描述了赋予人UTRN基因的选择性激活而对其它基因的表达影响最小的特异性基因组区域的定义。如本文所述和所示,本发明增强人UTRN基因表达的方法代表了一种新的治疗或预防策略,用于改善由缺陷型肌营养不良蛋白引起的缺陷型肌肉功能。
实施例1.使用HEK293FT细胞筛选针对人肌营养相关蛋白基因的gRNA
在这个实施例中,我们举例说明了使用本文所述的方法通过靶向UTRN基因的指定的表达调节区来实现UTRN基因的激活。所述方法通过设计合适的sgRNA序列,利用Cas9和sgRNA的复合物的性质,以将其募集到基因组的所需基因座。所述方法还利用SaCas9蛋白的核酸酶缺陷形式(D10A和N580A突变体(SEQ ID NO:107)或D10A和H557A突变体(SEQ ID NO:108);dSaCas9)来保持基因组序列完整,但将各种转录/表观遗传功能性结构域或基序拴系至dSaCas9,以实现对sgRNA序列所靶向的预期基因座的所需修饰,如Gilbert LA等人,《细胞》,2013年7月;154(2):442-51,以及Gilbert LA等人,《细胞》,2014年10月;159(3):647-61所述,通过引用全部并入本文。
在这个实施例中,我们说明了本文所述的方法可以用于激活野生型UTRN的表达。sgRNA被设计成靶向UTRN基因的表达调节区,赋予选择性和有效的基因激活。图1示出了人UTRN基因座和两个预测的转录起始位点(TSS)(上图和中图)。UTRN基因的TSS通过查询FANTOM5人promoterome数据库来鉴定(www.fantom.gsc.riken.jp,《自然》2014年3月;507(7493):462-70,通过引用全部并入本文)。报告了UTRN基因的两个启动子区域(启动子A和B),我们已经测试了这两个启动子的激活情况。向导RNA序列被设计成覆盖以上区域,以便确定这些区域内的有效和选择性的治疗序列。
(1)实验方法
sgRNA序列的选择
查看UTRN基因启动子区域周围的序列(启动子A,约4.4kb(Chr6:GRCh38/hg38;144,283,900-144,288,300)和启动子B,约2.6kb(Chr6:GRCh38/hg38;144,342,683-144,345,311)),以寻找dSaCas9和sgRNA复合体会结合的潜在识别序列。查看所述区域以寻找具有序列NNGRRT的原间隔子相邻基序(PAM)。鉴定了与PAM相邻的靶向序列。靶向序列(与靶DNA杂交的一部分gRNA)的长度被设为21个核苷酸。根据Benchench软件(https:// benchling.com)生成的预测特异性和效率选择靶向序列,且其均匀分布在所选区域中。还参考了来自ENCODE研究(ENCODE项目联盟,《自然》,2012年9月;489:57-74,通过引用全部并入本文)中UTRN表达调节区周围的表观遗传信息,以选择与所述基因的功能元件结合的可能性高的gRNA。
测试了表1中列出的24种靶向序列(向导编号sgED3-1至sgED3-24(SEQ ID NO:129至152))对UTRN基因表达的调节功能(下文中,表1中列出的靶向序列有时称为“sgED3系列”。
UTRN基因中靶向序列的位置也在图1中示出(上图和中图)。
将选择的24种靶向序列和对照非靶向性靶向序列(SEQ ID NO:177)分别与编码tracr RNA的DNA序列(SEQ ID NO:122)融合以形成sgRNA序列,并将其克隆到来自Genecopoeia的pCRISPR-LvSG03载体(#pCRISPR-LvSG03)中。所获得的载体在本说明书中表示为pCRISPR-LvSG03 sgRNA表达载体。sgRNA的表达受U6启动子驱动,所述载体在SV40启动子下表达mCherry-IRES-嘌呤霉素基因,从而有助于追踪和选择sgRNA表达细胞。
效应分子的克隆
核酸酶缺陷型SaCas9蛋白(D10A和N580A,或D10A和H557A;dSaCas9)充当以直接融合蛋白形式拴系功能性结构域/基序的主要骨架。dSaCas9连接了两个核定位信号(NLS)在其N末端(SEQ ID NO:178所示的氨基酸序列,SEQ ID NO:179所示的DNA序列)和C末端(SEQID NO:180所示的氨基酸序列,SEQ ID NO:181所示的DNA序列),以使效应分子能够有效定位至细胞核。
在一个实施例中,将编码具有D10A和N580A突变的dSaCas9的DNA序列在其C末端与编码合成氨基酸转录激活部分VP64、VPH或VPR的DNA序列融合(参见Chavez A等人,《自然方法学》,2016年7月;13(7):563-67和Chavez A等人,《自然方法学》,2015年4月;12(4):326-8,通过引用全部并入本文)(SEQ ID NO:182、183或184)。所获得的融合蛋白在本说明书中分别表示为dSaCas9-VP64、dSaCas9-VPH或dSaCas9-VPR融合蛋白。
融合蛋白被募集到UTRN基因的表达调节区,从而发挥其转录激活作用。结果,增强了UTRN基因的表达。
在一个实施例中,将编码缺少氨基酸721-745的dSaCas9蛋白(dSaCas9[-25],(SEQID NO:214))的DNA序列在其C端与编码合成氨基酸转录激活子miniVR的DNA序列融合(参见PCT/JP2019/030972,通过引用全部并入本文)(SEQ ID NO:185)。所获得的融合蛋白在本说明书中表示为dSaCas9[-25]-miniVR融合蛋白(SEQ ID NO:186)。
为了表达dSaCas9-VP64、dSaCas9-VPH、dSaCas9-VPR和dSaCas9[-25]-miniVR融合蛋白,将编码所述融合蛋白的DNA片段克隆到来自Genecopoeia的CP-LvC9NU-09慢病毒表达载体(目录号CP-LvC9NU-09)中。用融合蛋白编码序列替换原始载体中的Cas9编码序列,从而产生包含编码dSaCas9-VP64、dSaCas9-VPH、dSaCas9-VPR或dSaCas9[-25]-miniVR四种融合蛋白之一的DNA片段的CP-LvC9NU-09慢病毒表达载体。在本说明书中,所得载体分别表示为CP-LvdSaCas9-VP64-09、CP-LvdSaCas9-VPH-09、CP-LvdSaCas9-VPR-09或CP-LvdSaCas9[-25]-miniVR-09质粒。所述载体使用EF1a启动子表达效应分子,并使用SV40启动子表达eGFP-IRES-新霉素基因。
为了在腺相关病毒载体中表达,将编码dSaCas9[-25]-miniVR融合蛋白的DNA片段、U6启动子和sgRNA克隆到来自Takara的pAAV-CMV载体(#6234)中。将CMV启动子替换为EFS启动子(SEQ ID NO:187)。从原始载体中除去β-珠蛋白内含子,并将hGH poly-A替换为牛GH polyA(bGH polyA)。所获得的载体从其5'末端到其3'末端依次包含ITR、EFS启动子、dCas9、miniVR、bGH polyA、U6启动子、sgRNA和ITR(图5),在本说明书中表示为pAAV-EFS-dSaCas9[-25]-miniVR-U6-sgRNA AIO质粒。
细胞培养和转染
转染前24小时,将HEK293FT细胞(Thermo Fisher#R70007)以每孔75,000个细胞的密度接种到24孔板(CORNING#351147)中,并在补充有10%FBS和2mM新鲜L-谷氨酰胺、1mM丙酮酸钠和非必需氨基酸的DMEM培养基(Thermo Fisher#11140050)中培养。为了在慢病毒表达载体中表达,根据制造商的说明,细胞用500ng CP-LvdSaCas9-VP64-09、CP-LvdSaCas9-VPH-09、CP-LvdSaCas9-VPR-09或CP-LvdSaCas9[-25]-miniVR-09质粒和500ng pCRISPR-LvSG03 sgRNA表达载体,使用1.5μl Lipofectamine 2000(Life Technologies#11668019)转染。用嘌呤霉素(1μg/ml)选择转染的细胞。为了在腺相关病毒载体中表达,根据制造商的说明,细胞用500ng pAAV-EFS-dSaCas9[-25]-miniVR-U6-sgRNA AIO质粒,使用1.5μlLipofectamine 2000(Life Technologies#11668019)转染。不用嘌呤霉素选择转染的细胞。
为了进行基因表达分析,将转染的细胞在37℃下5%CO2中培养,并在转染后72h收获,并在RLT缓冲液(Qiagen#74104)中裂解,以使用RNeasy试剂盒(Qiagen#74104)提取总RNA。
基因表达分析
为了进行Taqman分析,使用TaqManTM高容量RNA转cDNA试剂盒(AppliedBiosystems#4387406),以20μl的体积使用1.5μg的总RNA生成cDNA。用水将生成的cDNA稀释20倍,每个Taqman反应使用6.33μl。UTRN和HPRT基因的Taqman引物和探针获自AppliedBiosystems。使用Taqman基因表达预混液(Thermo Fisher#4369016)在Roche LightCycler96或LightCycler 480中运行Taqman反应,并使用LightCycler 96分析软件进行分析。UTRN基因的表达水平通过HPRT基因的表达水平进行标准化。
Taqman探针产品ID:
UTRN:HS01125994_m1(FAM)
HPRT:Hs99999909_m1(FAM,VIC)
Taqman QPCR条件:
步骤1:95℃,10分钟
步骤2:95℃,15秒
步骤3:60℃,30秒
重复步骤2和3:40次
腺相关病毒(AAV)的产生
腺相关病毒血清型2(AAV2)粒子是使用在150mm培养皿(Corning)中以每个培养皿9,000,000个细胞的密度接种,并在补充有10%FBS、2mM新鲜L-谷氨酰胺、1mM丙酮酸钠和非必需氨基酸的DMEM培养基(Thermo Fisher#11140050)中培养的AAVpro 293T细胞(Takara#632273)生成的。细胞用14.85μg pRC2-mi342和pHelper载体(Takara#6234)和含有81μlTransIT-VirusGen(Mirus Bio#MIR6703)的14.85μg pAAV-EFS-dsaCas9[-25]-miniVR-U6-sgRNA AIO质粒转染。72小时后,根据制造商在AAV2无辅助系统方案(Takara#6230)中的说明,以每个150mm培养皿550μl收获细胞并提取AAV2粗品。
用AAV2转导细胞
为了转导HEK293FT细胞(Thermo Fisher#R70007),将每孔75,000个细胞接种到24孔板(CORNING#351147)中,并在补充有10%FBS和2mM新鲜L-谷氨酰胺、1mM丙酮酸钠和非必需氨基酸的DMEM培养基(Thermo Fisher#11140050)中孵育16小时。将培养基替换为1000μl新鲜培养基,包含10μl或1μl(分别为1:100或1:1000稀释)的AAV2粗品。在随后的72h孵育后,将细胞裂解,并根据制造商的说明(Qiagen#74192)提取总RNA(RNeasy Plus 96试剂盒),并如Taqman在“基因表达分析”中所述确定肌营养相关蛋白的过表达。
表1.用于筛选UTRN基因的表达调节区的靶向序列
表1-1.
Figure BDA0003065982350000461
表1-2.
145 sgED3-17 144287760 1 AGCGTTCTGAAGGGAGAGTTA GTGAAT 75.62 42.44
146 sgED3-18 144287920 -1 CAGAAGGCTAGGTGAGAAACT GAGAAT 64.29 34.34
147 sgED3-19 144288078 -1 AATTTGAGTACACTTAAGGCA AAGGAT 74.85 24.36
148 sgED3-20 144288193 -1 AGATACAGCAGAAAAGGTGAT CAGAGT 59.61 52
149 sgED3-21 144343311 1 GACACATGCAGAAGTGACAGC AGGAGT 62.51 64.83
150 sgED3-22 144344138 -1 AGCAGCCTTCGAACTGCACAC TGGGAT 85.61 69.44
151 sgED3-23 144344637 -1 TCTAGATGGCAGTAAACAGCA CAGAGT 72.98 81.01
152 sgED3-24 144345218 -1 GGCTGCTCCAATCATTTTGGT TTGAAT 79.1 56.17
153 sgED3-25 144284787 -1 GAGTCCGGAGACCGAACCAGA ATGGAT 91.54 23.9
154 sgED3-26 144284810 -1 GAACCGTGCGTGCCGGGAGCC GGGAGT 86.09 1
155 sgED3-27 144284837 -1 GCTGGCCTGGGGCGCGCGCTC CAGAGT 78.51 0.56
156 sgED3-28 144285003 -1 AAGATCAGCCCCACTACGTTC CCGGGT 94.71 15.9
157 sgED3-29 144285172 1 CCGGAGGCGAGCCCCTTCCCG GGGGGT 82.7 14.59
158 sgED3-30 144285207 -1 GGAGGGTGGGGCGCAGGACCG CTGGGT 68.11 4.19
159 sgED3-31 144285227 -1 GAGCGCTGGAGGCGGAGGAGG GAGGGT 40.4 5.54
160 sgED3-32 144285325 1 CCTCTCTCGCGCACAAAGTTG TGGAGT 92.3 13.5
161 sgED3-33 144285460 1 GGGAGCGGCGCCCCCCTTCTT TTGGGT 92.82 3.72
162 sgED3-34 144285496 -1 CACCAACTTTGCCAAACGCTA CAGAGT 90.69 15.32
163 sgED3-35 144285722 -1 GGAGTAACCGCGGGGGTGTGT GCGAGT 90.76 15.84
164 sgED3-36 144285896 1 GAATGGGGCGGGGGCCGGGAG GAGGAT 47.73 3.79
表1-3.
165 sgED3-37 144285926 1 TCTTTCTGTGGTTCTTCCGCC TGGGAT 81.43 25.49
166 sgED3-38 144286089 -1 TTTGGATCGTTCACAACTAGT ACGGAT 92.05 18.73
167 sgED3-39 144286240 1 AGAGGGGACGTGGCCTCTTAG GAGAGT 83.03 23.82
168 sgED3-40 144286311 1 GTCCACAGGAGAGGGTGGGCA GAGGGT 38.6 9.03
169 sgED3-41 144286418 1 GCTCCCAAGGGTGGGGCTCCG GAGAGT 75.62 5.83
170 sgED3-42 144286683 1 TTTCAGATGGCAGGTTGTTCA AAGGAT 84.92 0.55
171 sgED3-43 144286895 1 CTTTCCCAGCCTTCAGGTCAG CCGGAT 70.16 23.24
172 sgED3-44 144286993 1 GCGCGCGGAGCTCGGGGGAGG CCGGAT 58.97 0.54
173 sgED3-45 144287068 -1 TGAGGCCGGTGCAACTTACAA AGGAAT 94 33.46
174 sgED3-46 144287139 1 TGGGCGTGGGAGACGCAGCCT GCGGAT 73.4 1.47
175 sgED3-47 144287184 1 AGGTGGAGGAATGCGAAGCTT GTGGGT 87 21.29
176 sgED3-48 144287284 1 AGACAACTCTTTAACTCTCCT TTGGGT 78.9 15.46
在表1中,“位置”表示当使用SaCas9时,链中存在靶向序列的核苷酸的切割位置。
在表1的“链”项中,1表示有义链,-1表示反义链。
(2)结果
图1示出了与对照sgRNA相比,三种不同的dSaCas9-激活子融合蛋白(dSaCas9-VP64、dSaCas9-VPH和dSaCas9-VPR)对UTRN基因表达的激活。对照sgRNA包含ACGGAGGCUAAGCGUCGCAAG(SEQ ID NO:215)和tracrRNA序列,且被设计为它在人基因组中的任何序列上均没有靶标。包含分别由向导编号sgED3-6、sgED3-7或sgED3-13(SEQ ID NO:134、135或141)编码的crRNA的sgRNA通过募集dSaCas9-激活子融合蛋白到UTRN基因的表达调节区来激活UTRN基因的表达。dSaCas9-VPR融合蛋白的激活作用最强。
根据以上结果,由向导编号sgED3-6至sgED3-7(SEQ ID NO 134至135)(表1)覆盖的对应于Chr6:GRCh38/hg38;144,285,000-144,286,000(图1)的约1.0kb区域(区域A)以及位于向导编号sgED3-13(SEQ ID NO 141)周围的对应于Chr6:GRCh38/hg38;144,287,000-144,287,300的约0.3kb区域(区域B)赋予了UTRN基因表达的有效激活。与向导编号sgED3-6、sgED3-7和sgED3-13(SEQ ID NO:134、135和141)编码的crRNA相比,启动子B赋予的UTRN基因的激活相对较弱。
在图2中,进一步用另外的24种sgRNA(表1,向导编号sgED3-25至sgED3-48(SEQ IDNo:153至176))和dSaCas9-VPR筛选跨越区域A和B的对应于Chr6:GRCh38/hg38;144,284,750-144,287,300的区域,以发现更有效的UTRN基因激活。包含分别由向导编号sgED3-6、sgED3-13、sgED3-25至sgED3-32、sgED3-39、sgED3-40和sgED3-44(SEQ ID NO:134、141、153至160、167、168和172)编码的crRNA的sgRNA激活的UTRN基因表达是上述对照sgRNA的两倍以上。
在图3中,对于一些包含分别由向导编号sgED3-6、sgED3-13、sgED3-25、sgED3-27、sgED3-30、sgED3-31、sgED3-39、sgED3-40和sgED3-44(SEQ ID NO:134、141、153、155、158、159、167、168和172)编码的crRNA的有效sgRNA,分别制备pAAV-EFS-dSaCas9[-25]-miniVR-U6-sgRNA AIO质粒,然后转染到HEK293FT细胞中以验证功能。与上述对照sgRNA相比,观察到不同sgRNA对UTRN基因不同程度的诱导。
在图4中,制得携带EFS-dSaCas9[-25]-miniVR-U6-sgRNA的AAV2,并转导HEK293FT细胞。作为sgRNA,使用包含分别由向导编号sgED3-6、sgED3-30或sgED3-31(SEQ ID NO:134、158或159)编码的crRNA的sgRNA。对于所有三种sgRNA,与上述对照sgRNA相比,观察到了UTRN基因诱导。
实施例2.使用HSMM细胞筛选针对人肌营养相关蛋白基因的gRNA
(1)实验方法
UTRN靶向序列的选择
根据人骨骼肌细胞中基因组的H3K4me3和H3K27Ac图谱,查看人UTRN基因推定的增强子(称为E)和启动子(称为P)区域周围大约13.2kb的序列,以寻找可以被与gRNA复合的核酸酶缺陷型SaCas9(D10A和N580A突变体;dSaCas9[SEQ ID NO:123(蛋白质)])靶向的序列,在本文中定义为靶向序列。所靶向的基因组区域相对于UTRN基因的位置如图6所示,其坐标如下所示:
1.Chr6:GRCh38.p12;144215500-144217000->约1.5kb(称为P2)
2.Chr6:GRCh38.p12;144248500-144249800->约1.3kb(称为E1)
3.Chr6:GRCh38.p12;144264000-144267000->约3.0kb(称为E2)
4.Chr6:GRCh38.p12;144283900-144288300->约4.4kb(称为P1)
5.Chr6:GRCh38.p12;144292500-144295500->约3.0kb(称为E3)
靶向序列是由与具有序列NNGRRT的原间隔子相邻基序(PAM)相邻的21个核苷酸的片段指定(5'-21nt靶向序列-NNGRRT-3'),并经过过滤以包括大部分完美匹配食蟹猴(Macaca fascicularis)基因组的相应区域(靶向序列和PAM序列)的序列(在表3中列为“TRUE”)。
慢病毒转移质粒(pED176)的构建
pLentiCRISPR v2是从Genscript(https://www.genscript.com)购得,并进行了以下修饰:SpCas9 gRNA骨架序列替换为SaCas9 gRNA骨架序列(SEQ ID NO:124);SpCas9替换为与密码子优化的VP64-迷你型miniRTA(也称为迷你型miniVR)[SEQ ID NO:125(DNA)和126(蛋白质)]融合的dSaCas9。迷你型miniVR转录激活结构域可以通过激活转录来激活基因表达。迷你型miniVR拴系在dSaCas9(D10A和N580A突变体)的C末端,下文中称为dSaCas9-迷你型miniVR(SEQ ID NO:192(DNA)和193(蛋白质)),并由在包含各靶向序列编码的crRNA的gRNA指导下靶向人UTRN基因的推定的增强子或启动子区域(图6)。所产生的骨架质粒被命名为pED176。
gRNA克隆
将三种对照非靶向性靶向序列(表3,SEQ ID NO:1至3)和100种靶向序列(表3,SEQID NO:4至103)克隆到pED176中。正向和反向寡核苷酸是由Integrated DNA Technologies按以下格式合成:正向:5'CACC(G)-20至21个碱基对的靶向序列-3',以及反向:5'AAAC-20至21个碱基对的反向补体靶向序列-(C)-3',其中如果靶标不以G开头,则添加括号中的碱基。将寡核苷酸以100μM再悬浮于Tris-EDTA缓冲液(pH 8.0)中。在NE Buffer 3.1(NewEngland Biolabs(NEB)#B7203S)中,在10μl反应物中混合1μl各互补寡核苷酸。将反应物加热至95℃,并在热循环仪中冷却至25℃,由此使寡核苷酸退火成具有与克隆至pED176相容的粘性突出末端。将退火的寡核苷酸与已用BsmBI消化并经凝胶纯化的慢病毒转移质粒pED176组合,并根据制造商的方案用T4 DNA连接酶(NEB#M0202S)连接。根据制造商的方案,将2μl的连接反应物转化到10μl的NEB稳定感受态细胞(NEB#C3040I)中。所得的构建体通过U6启动子(SEQ ID NO:128)驱动包含3'末端与tracrRNA(guuuuaguacucuggaaacagaaucuacuaaaacaaggcaaaaugccguguuuaucucgucaacuuguuggcgagauuuuuu(SEQ ID NO:127))融合的由各个靶向序列编码的crRNA的sgRNA的表达,所述tracrRNA由添加有U6聚合酶TTTTTT末端信号的SaCas9 gRNA骨架序列编码。
慢病毒的产生
将HEK293TA细胞(Genecopoeia#LT008)以0.75×106个细胞/孔接种在6孔细胞培养皿(VWR#10062-892)中的2ml生长培养基(补充有10%FBS和2mM新鲜L-谷氨酰胺、1mM丙酮酸钠和非必需氨基酸的DMEM培养基(Thermo Fisher#11140050))中,并在37℃/5%CO2下孵育24小时。第二天,根据制造商的方案,使用1.5μg封包质粒混合物[1μg封包质粒(参见pCMVdelta R8.2;addgene#12263)和0.5μg包膜表达质粒(参见pCMV-VSV-G;addgene#8454)]和1μg含有编码dSaCas9-miniVR和指定sgRNA的序列的转移质粒设置TransIT-VirusGEN转染反应(Mirus Bio#MIR6700)。转染后48小时,通过使培养基上清液通过0.45μm PES过滤器(VWR#10218-488)收获慢病毒。在准备使用之前,将经纯化且等分的慢病毒保存在-80℃的冰箱中。
HSMM细胞的转导
如表2所示,来自5位年龄在0-35岁之间的不同人供体的原代骨骼肌成肌细胞(HSMM)获自Lonza Inc。
表2.
供体编号 批号 年龄(岁) 性别
1 650386 35
2 657512 34
3 542368 0
4 629287 19
5 655307 18
细胞在来自Lonza的原代骨骼肌细胞生长培养基[SkGMTM-2骨骼肌生长BulletKit培养基(#CC-3245),所述培养基包含有含骨骼肌成肌细胞生长所需的SkBMTM-2基础培养基(#CC-3246)和SkGMTM-2 SingleQuotsTM补充剂(#CC-3244)的培养系统]中培养。CC-3246包含1x SkBMTM-2基础培养基,500mL。1x SkGMTM-2SingleQuotsTM补充包(#CC-3244)包含:
1个红盖小瓶的GA-1000,0.50mL
1个绿盖小瓶的hEGF,0.50mL
1个天然盖小瓶的地塞米松,0.50mL
1瓶FBS,50.00mL
1瓶L-谷氨酰胺,10.00mL
根据制造商的说明,将CC-3244的成分添加到500ml培养基(#CC-3246)中。
为了进行转导,将细胞以0.125-0.33×106个细胞/孔接种在含有生长培养基的6孔细胞培养皿(VWR#10062-894)中,并在37℃/5%CO2下孵育24小时。第二天,将补充有8μg/ml聚凝胺的1.5ml生长培养基(Sigma#TR-1003-G)和1.0ml对应于包含与tracrRNA融合的由各个靶向序列(表3)编码的crRNA的各sgRNA的慢病毒上清液(见上文)添加到各孔中。通过使用Lenti-XTM qRT-PCR滴定试剂盒(Clontech#631235)测量,慢病毒滴度范围为108至109个粒子/毫升。将细胞与慢病毒一起孵育6小时之后,去除病毒培养基并替换为新鲜的生长培养基。转导后72小时,向细胞供以选择培养基[补充有0.5μg/ml嘌呤霉素的生长培养基(Sigma#P8833-100MG)]。每2至3天为细胞提供新鲜的选择培养基。将细胞置于选择培养基中7至10天后,收获细胞,并按照制造商的指导,使用RNeasy 96试剂盒(Qiagen#74182)提取RNA。
以相同方式进行两种病毒的共转导实验,病毒总量与单一病毒转导相等。
基因表达分析
为了进行基因表达分析,根据高容量cDNA逆转录试剂盒(Applied Biosystems;Thermo Fisher#4368813)方案,以10μl的体积从约0.05至0.8μg的总RNA产生cDNA。将cDNA稀释10倍,并使用Taqman快速高级预混物(Thermo Fisher#4444557),根据制造商的方案进行分析。Taqman探针(UTRN:测定Id Hs01125994_m1 FAM;HPRT:测定Id Hs99999909_m1VIC_PL)从Life Technologies获得。按照Taqman快速高级预混物方案的指导,由QuantStudio 5实时PCR系统对基于Taqman探针的实时PCR反应进行处理和分析。
数据分析
对于各样品和三个对照,通过将UTRN探针的3个技术重复样品的平均Ct值减去HPRT探针的3个技术重复样品的平均Ct值(平均Ct UTRN-平均Ct HPRT)来计算ΔCt值。使用式2-(ΔCt)确定各样品的表达值。然后将各实验的样品表达值(表3;SEQ ID NO:4至103)相对于3个对照表达值(表3;SEQ ID NO:1至3)的平均值标准化,以确定各样品的相对UTRN表达。分析每次筛选的两个生物学重复样品,并计算所有实验的平均值(表3)。
(2)结果
RNP对UTRN基因表达的激活
产生慢病毒,其将针对各靶向序列的dSaCas9-miniVR和sgRNA的表达盒递送给来自5个不同供体的原代HSMM细胞(表2)。由于细胞的生长速度,大多数测定是对来自供体#3的HSMM细胞(表2)进行的。针对嘌呤霉素抗性对转导细胞进行选择,且使用Taqman测定法对UTRN表达进行定量(表3)。将各样品的表达值相对于用对照sgRNA(表3;SEQ ID NO:1至3)转导的细胞中的UTRN表达的平均值标准化。对供体#3的重复样品测量平均表达水平(表3;和图7)。
表3.用于筛选UTRN基因的表达调节区的靶向序列。
表3-1.
Figure BDA0003065982350000541
表3-2.
26 78 144449756 21 1 TGGTTCCAAGCTAGTACTTCA TRUE 1.03 0.78
27 80 144264074 21 1 ATGTTCACAAAATAAATTTAA TRUE 0.99 0.75
28 86 144264238 21 1 CCTTTATGGTCACCTTCTCTG TRUE 1.2 0.79
29 87 144264250 21 1 CCTTCTCTGCTGAGTAAAAAT TRUE 1.09 1.07
30 88 144264297 21 1 AAGGTGGCCAAAAAAGAACCC FALSE 1.28 1.37
31 91 144264318 21 -1 AAGGAAGAGAGAGGCAAGAAA TRUE 1.43 1.04
32 95 144264449 21 -1 TAAAGAATTCTAGCACTGGAA TRUE 0.62 0.51
33 106 144264745 21 1 AAATGTGTCATGTGTTGGTTA TRUE 0.89 0.8
34 114 144265048 21 1 AAAAATGAAAATTGCAACTTC TRUE 1.01 0.65
35 115 144265058 21 1 ATTGCAACTTCTAGAATTTAA TRUE 0.79 0.57
36 121 144265214 21 1 CAGCTGGAGTGGGCCACGTAA TRUE 1.19 1.25
37 123 144265304 21 -1 ATTTTTGCATATTTCTTTGGT TRUE 1.14 0.64
38 125 144265450 21 -1 AGTGACCTGCTGATTTCTCTA TRUE 1.38 0.74
39 127 144265606 21 1 CTTTCCCCATTGTTCAGGACT TRUE 1.1 0.82
40 135 144265764 21 1 TTGGTTGATAAATTTGTATAT TRUE 1.41 0.82
41 136 144265795 21 -1 TCTCTAGTTCATTTTTTAGCT TRUE 1.17 0.82
42 139 144266101 21 -1 TCCTTCAACTTCAAGACAACA TRUE 0.87 0.66
43 140 144266147 21 -1 GCTCCTCCTGCTGGATGGGGG TRUE 1.36 0.8
44 141 144266158 21 -1 CTCTATTTCCAGCTCCTCCTG TRUE 1.08 0.86
45 145 144266243 21 1 GTACAGTTAGTGCTACTAGGA TRUE 3.2 1.43
46 146 144266254 21 1 GCTACTAGGACAGGATGCTGG TRUE 2.5 1.23
47 148 144266287 21 -1 CCCCAGCTGTGCCTCTGTTTT TRUE 1.42 0.72
48 149 144266297 21 1 TTCCCAAAACAGAGGCACAGC TRUE 1.36 0.87
49 151 144266338 21 -1 GTTTTGAAACTGGTAGCAGCT TRUE 1.52 1.2
50 175 144283934 21 1 aaactgatgcttgttaaatga TRUE 1.05 0.91
51 176 144283943 21 1 cttgttaaatgaatgaatGAA TRUE 1.34 0.89
52 178 144283973 21 -1 AATCCAAAGGATTAACTTGAA TRUE 1.48 1.09
53 179 144283981 21 1 TACCCATTTCAAGTTAATCCT TRUE 1.3 1.02
54 183 144284099 21 1 TGCCCCCTCCCTGGAGCACTT TRUE 1.39 0.65
55 192 144284640 21 1 AGCAACGTCAGCAAACTGAGA TRUE 1.06 0.96
表3-3.
56 193 144284644 21 1 ACGTCAGCAAACTGAGATGGG TRUE 1.29 0.63
57 202 144284810 21 -1 GAACCGTGCGTGCCGGGAGCC TRUE 1.15 0.95
58 205 144285129 21 -1 GGGGTCCGCTCTCCAGATGAG FALSE 2.28 1.8
59 208 144285207 21 -1 GGAGGGTGGGGCGCAGGACCG TRUE 2.29 1.59
60 210 144285325 21 1 CCTCTCTCGCGCACAAAGTTG FALSE 1.88 1.76
61 211 144285429 21 1 TCTGGCTCCAGAAGCCGATTG TRUE 1.11 1.01
62 214 144285603 21 1 ACAAGTAAGGGGCGTTTTCAG TRUE 1.14 0.78
63 218 144285756 21 -1 GAGCTGGCCAAGGGCTCCTCT TRUE 1.3 0.82
64 219 144285770 21 1 TAGAGGAGCCCTTGGCCAGCT TRUE 1.34 0.86
65 224 144285972 21 1 CCAAGTCCCAGAGTCGAAGAT TRUE 1.25 0.87
66 234 144286311 21 1 GTCCACAGGAGAGGGTGGGCA TRUE 1.38 0.87
67 236 144286403 21 1 CTCTGGGTGGTTGCTGCTCCC TRUE 1 0.73
68 239 144286550 21 -1 TCAGTTGCAGCAAGAGATCCC TRUE 1.12 0.92
69 262 144287288 21 -1 ATTTTAGGTAAACACCCAAAG TRUE 1.35 0.78
70 275 144287912 21 -1 taggtgagaaactgagaatca TRUE 1.45 0.77
71 276 144287920 21 -1 cagaaggctaggtgagaaact TRUE 1.3 0.69
72 283 144288096 21 -1 GCCATTAATGGCCAGAGGAAT TRUE 1.71 0.91
73 286 144288193 21 -1 AGATACAGCAGAAAAGGTGAT TRUE 1.13 0.92
74 288 144288268 21 1 AATTTGAAAAATCACCTTGAG TRUE 1.47 0.81
75 289 144292526 21 -1 cagttgattcatctgtacagc TRUE 1.1 1.01
76 290 144292529 21 1 tttttgactctggctgtacag TRUE 1.26 1.21
77 291 144292541 21 1 gctgtacagatgaatcaactg TRUE 2.12 1.08
78 295 144292639 21 -1 ATCTCCCCTTTGAGTTTGTCT TRUE 1.31 0.88
79 296 144292651 21 -1 CTGTTCAAAAATATCTCCCCT TRUE 1.31 1.03
80 297 144292708 21 1 AAAATTACACAGAACTCCACC TRUE 1.69 1.06
81 300 144292779 21 -1 TTTTTTGTCTTTAAAGTGACA TRUE 1.12 0.7
82 303 144293063 21 1 TCTTGTTTTAAAATATGCTTT TRUE 1.15 1.11
83 308 144293185 21 -1 CTCTGTTATATTTACATATGT TRUE 1.05 0.73
84 311 144293308 21 -1 TATAAATATCAAAGGTCTTAC TRUE 0.88 0.73
85 316 144293537 21 -1 cctagggaaaaactctagaaa TRUE 1.17 0.82
表3-4.
86 318 144293638 21 1 acaccatgaaaatctaatatt TRUE 1.09 0.93
87 322 144293778 21 -1 agatgtgctagagtaaagaaa TRUE 1.25 0.93
88 323 144293791 21 -1 GTATGATCTGTTCagatgtgc TRUE 1.55 1.17
89 330 144294147 21 1 TTTAAAGATTATCAAATTGCT TRUE 1.23 0.71
90 332 144294262 21 1 ATATGAATCACATTCTTTTGG TRUE 1.33 0.93
91 334 144294294 21 1 TGCAAAAGCCAGTAGATAAAT TRUE 1.01 0.81
92 335 144294300 21 1 AGCCAGTAGATAAATTTGGAT TRUE 0.8 1.01
93 339 144294447 21 1 TTTTAGTTTAGATTAAGTCAT TRUE 0.81 0.84
94 342 144294575 21 -1 AAGAAACCTGGAAGAGCAGAT TRUE 1.07 1.1
95 343 144294603 21 1 GGTTTCTTTTTTGGGGGGAAA TRUE 1.37 0.93
96 350 144294924 21 1 TATGGTTGTAGTATACTTGCC TRUE 1.24 1.02
97 351 144294930 21 1 TGTAGTATACTTGCCTTGGGT TRUE 1.07 0.83
98 352 144294934 21 1 GTATACTTGCCTTGGGTTTGG TRUE 1.11 0.93
99 358 144295231 21 1 ACATGAAATAATAAAATGGTT TRUE 0.86 1.03
100 360 144295268 21 -1 ATTATTGAATGAAATAGCAGT TRUE 0.86 1.06
101 363 144295330 21 -1 ACAACACTGACAGCAACAGAA TRUE 0.89 0.97
102 366 144295418 21 1 AGTGTGTCAGCTGGCTCCATG TRUE 1.09 1.14
103 367 144295435 21 1 CATGTGGAGTTCTTGACAGTT TRUE 1.03 0.98
在表3中,“坐标”表示当使用SaCas9时对于所有示出的gRNA可能的SaCas9切割位点。
如图7所示,所测试的100种靶向序列当中,5种靶向序列示出了在供体HSMM#3细胞中对UTRN mRNA表达的一致上调(向导编号145、146、205、208和210(SEQ ID NO:45、46、58、59和60))。这些序列中有2种,即145号(SEQ ID NO:45)、146号(SEQ ID NO:46)聚集在增强子E2区域,而其余3种,即205号(SEQ ID NO:58)、208号(SEQ ID NO:59)和210号(SEQ IDNO:60)聚集在启动子P1区域。向导编号205、208和210分别与实施例1中的sgED3-6、sgED3-30和sgED3-32相同。
在这5种靶向序列中,145号、146号和208号这3种序列与食蟹猴基因组的相应区域100%匹配。另一方面,这些序列中的2种,即205号和210号与食蟹猴基因组的相应区域不匹配(图8)。
当单独测试时,这5种靶向序列一致地示出了在5个不同供体HSMM中UTRN mRNA表达上调约2至4倍(图9)。在启动子区中的向导编号205、208或210和增强子区中的向导编号145或146的组合(图8中示意性示出)中,2种组合,即向导编号205和145(205+145)以及向导编号208和145(208+145),使得在5种不同的HSMM供体中UTRN表达上调约3至7倍(图9)。
实施例3.AAV顺式质粒的生成和评估
(1)实验方法
AAV AIO顺式质粒的构建
如表4中所示,所有测试的质粒骨架pED260(SEQ ID NO:210)、pED261(SEQ ID NO:211)和pED263(SEQ ID NO:212)含有相同的全长dSaCas9、CK8启动子和U6启动子的碱基序列,替换pAAV-CMV载体(Takara#6234)的ITR之间的序列。其区别在于激活子部分、polyA序列,即pED260、pED261包含miniVR,而pED263包含microVR作为激活子部分,且pED260具有bGH polyA,而pED261、pED263具有2个SNRP-1 polyA序列(SEQ ID NO:208)。
表4.
Figure BDA0003065982350000581
*ITR之间的核苷酸长度(含ITR核苷酸)
将包含由靶向序列向导编号145、146或208编码的crRNA的sgRNA的各寡核苷酸克隆到这些骨架中的各者中,以创建用于测试的多合一(AIO)质粒。产生的各AIO质粒表示为pAAV-CK8-dSaCas9-miniVR-bGH polyA-U6-sgRNA#145(pED260-145)、pAAV-CK8-dSaCas9-miniVR-bGH polyA-U6-sgRNA#146(pED260-146)、pAAV-CK8-dSaCas9-miniVR-bGHpolyA-U6-sgRNA#208(pED260-208)、pAAV-CK8-dSaCas9-miniVR-2×sNRP-1 polyA-U6-sgRNA#145(pED261-145)、pAAV-CK8-dSaCas9-miniVR-2×sNRP-1polyA-U6-sgRNA#146(pED261-146)、pAAV-CK8-dSaCas9-miniVR-2×sNRP-1 polyA-U6-sgRNA#208(pED261-208)、pAAV-CK8-dSaCas9-microVR-2×sNRP-1polyA-U6-sgRNA#145(pED263-145)、pAAV-CK8-dSaCas9-microVR-2×sNRP-1 polyA-U6-sgRNA#146(pED263-146)或pAAV-CK8-dSaCas9-microVR-2×sNRP-1polyA-U6-sgRNA#208(pED263-208),如表4所示。
已知与人基因组的任何部分都不同源的两个不同序列被用作阴性对照,并被称为非靶向性向导(NTg1(SEQ ID NO:1)和NTg2(SEQ IDNO:2))。NTg1或NTg2的各寡核苷酸也被克隆到各自的骨架中,并用作对照质粒。
HEK293FT细胞的转染
将HEK293FT细胞(Thermo Fisher#R70007)以5×104个细胞/孔接种在24孔细胞培养皿(CORNING#351147)中的0.5ml生长培养基(补充有10%FBS和2mM新鲜L-谷氨酰胺、1mM丙酮酸钠和非必需氨基酸的DMEM培养基(Thermo Fisher#11140050))中,在37℃/5%CO2下孵育24小时。第二天,根据制造商的方案,用0.5μg质粒设置lipofectamine-2000转染反应(Thermo Fisher#11668019),所述质粒包含编码dSaCas9-miniVR或dSaCas9-microVR和包含实施例2中选择的靶向序列向导编号145(SEQ ID NO:45)、146(SEQ ID NO:46)或208(SEQID NO:59))(表4)的sgRNA的序列。
转染后48小时,按照制造商的指导,收获细胞并用RNeasy 96试剂盒(Qiagen#74182)提取RNA。
基因表达分析
为了进行基因表达分析,根据高容量cDNA逆转录试剂盒(Applied Biosystems;Thermo Fisher#4368813)方案,以10μl的体积从约0.5μg的总RNA产生cDNA。将cDNA稀释10倍,并使用Taqman快速高级预混物(Thermo Fisher#4444557),根据制造商的方案进行分析。Taqman探针(UTRN:测定Id Hs01125994_m1 FAM;HPRT:测定Id Hs99999909_m1 VIC_PL)从Thermo Fisher获得。按照Taqman快速高级预混物方案的指导,用QuantStudio 5实时PCR系统对基于Taqman探针的实时PCR反应进行处理和分析。
数据分析
对于含有NTg1或NTg2的质粒,结果的平均值示出为CtrlX2。
对于各样品,通过将非靶向性向导对照的3个技术重复样品的平均Ct值减去各样品的3个技术重复样品的平均Ct值,计算出各探针的ΔCt值。
ΔCt UTRN=平均对照Ct UTRN-平均样本Ct UTRN。
ΔCt HPRT=平均对照Ct HPRT-平均样本Ct HPRT。
然后通过将各样品的UTRN的Ct值减去HPRT的Ct值来计算Δ(ΔCt)值。
Δ(ΔCt)=ΔCt UTRN-ΔCt HPRT。
使用式2(Δ(ΔCt))确定各样品的表达值。
(2)结果
存在包含由靶向序列向导编号145(SEQ ID NO:45)或146(SEQ ID NO:46)或208(SEQ ID NO:59)编码的crRNA的sgRNA时,所有3个受测骨架(pED260、261和263)能够上调HEK293FT细胞中的UTRN(图10)。
实施例4.携带dSaCas9、转录激活子和sgRNA的重组AAV9的产生
(1)实验方法
腺相关病毒(AAV)的产生
使用293T细胞(ATCC CRL-3216)产生腺相关病毒血清型9(AAV9)粒子,所述细胞以每个T225烧瓶(Corning)0.96×107-1.8×107个细胞的密度接种,并在补充有10%FBS的DMEM培养基(Thermo Fisher#11995-065)中培养。pRC9质粒的构建如下:将AAV9衣壳序列(参见JP5054975B)亚克隆到pRC2-mi342质粒(Takara#6230)中,以替换AAV2衣壳序列。用20μg pRC9质粒和pHelper载体(Takara#6230)和20μg实施例3中使用的6种AIO质粒之一,即pED261-145、pED261-146、pED261-208、pED263-145、pED263-146或pED263-208转染细胞,每个T225烧瓶用180μl TransIT-293转染试剂(Mirus Bio#MIR2700)。转染后一天,将培养基更换为补充有2%FBS的DMEM培养基。72小时后,收获细胞,并使用AAVpro纯化试剂盒(所有血清型)(Takara#6666)根据制造商的说明提取和纯化AAV。使用AAVpro滴定试剂盒(用于实时PCR)(Takara#6233)测量纯化的AAV的滴度。所产生的各AAV表示为AAV9-ED261-145、AAV9-ED261-146、AAV9-ED261-208、AAV9-ED263-145、AAV9-ED263-146或AAV9-ED263-208。
AAV的验证
在用NuPAGE样品还原剂、抗氧化剂和缓冲液(Thermo Fisher#NP0009、#NP0005、#NP0007)制备AAV样品后,使用NuPAGE 4至12%Bis-Tris蛋白凝胶1.0mm×12孔(ThermoFisher#NP0322BOX)通过SDS-PAGE检查AAV衣壳蛋白。各AAV的施加量为1.0×1010vg/泳道。用Oriole荧光凝胶染料溶液(BioRad#161-0495)对凝胶进行染色后,用具有紫外线激发光和580nm滤光片的ChemiDocTMTouch(BioRad)捕获图像。
(2)结果
在T225烧瓶中产生的AAV9的滴度值计算如下。
表5.
AVV名称 浓度(vg/mL)
AAV9-ED261-145 1.82×10<sup>12</sup>
AAV9-ED261-146 3.66×10<sup>12</sup>
AAV9-ED261-208 2.11×10<sup>12</sup>
AAV9-ED263-145 2.43×10<sup>12</sup>
AAV9-ED263-146 6.00×10<sup>12</sup>
AAV9-ED263-208 1.43×10<sup>12</sup>
在SDS-PAGE中,从各AAV样品中检测到3种衣壳蛋白(VP1、VP2和VP3,分别为87kDa、72kDa和62kDa)(图11)。这些结果表明,克隆到AAV AIO质粒中的包括dSaCas9和转录激活子在内的目标基因可以被封包到AAV9中。
实施例5.携带dSaCas9、转录激活子和sgRNA的重组AAV9对肌营养相关蛋白的上调的体外药理评估
(1)实验方法
AAV9产生
使用293T细胞(ATCC#CRL-3216)产生腺相关病毒血清型9(AAV9)粒子,所述细胞以4.77×107个细胞/700mL/细胞堆叠5烧瓶(Corning)的密度接种,并在补充有10%FBS(Hyclone#SH30070.03)、1%MEM(Sigma#M7145)、1%青霉素/链霉素(Thermo Fisher#15070-063)和2.5%HEPES(Sigma#H0887)的DMEM培养基中培养。三天后,用227.9μg在实施例4中构建的pRC9质粒、pHelper载体(Takara#6230)和在实施例3中使用的3种AIO质粒之一,即pED261-145、pED261-208或pED263-208转染细胞,每瓶含683.7μl聚乙烯亚胺Max(2mg/mL)(Polysciences#24765-2)。转染后6天,用Triton X-100(终浓度0.2%)(Roche#10789704001)收获细胞。对AAV样品进行离心,过滤,浓缩,并使用色谱法(AKTA avant 25,GE Healthcare和POROS CaptureSelect AAV Resins色谱柱,Thermo Fisher)纯化,然后使用CsCl进行超速离心(Optima XE-90,Beckman Coulter)。透析靶级分后,使用AAVpro滴定试剂盒(用于实时PCR)(Takara#6233)测量AAV的滴度。获得了AAV9-ED261-145、AAV9-ED261-208和AAV9-ED263-208。
细胞培养和AAV感染
将人骨骼肌成肌细胞(HSMM,Lonza#CC-2580,批号18TL211617)以每孔100,000个细胞的密度接种到覆盖有胶原蛋白I的24孔板(IWAKI#4820-010)中,并在补充有500U/mL青霉素/链霉素(Thermo Fisher#15070063)的SkGMTM-2骨骼肌细胞生长培养基2BulletKitTM(Lonza#CC-3245)中在37℃,5%CO2下培养2天。将培养基替换为分化培养基(补充有2%FBS(GE Healthcare#SH30070.03)和500U/mL青霉素/链霉素的DMEM培养基(Sigma#D6429)),并在37℃,5%CO2下将细胞培养3天。为了进行AAV感染,将培养基替换为500μL新鲜分化培养基,其中含有0.2、1.0或5.0×1011vg/mL AAV9-ED261-145、AAV9-ED261-208或AAV9-ED263-208。感染后,将感染的细胞在37℃,5%CO2下培养3-4天,并使用RNeasy Plus Mini试剂盒(Qiagen#74134)根据制造商的说明提取总RNA。将未感染AAV的细胞中的RNA设为对照,并示出为AAV(-)。
基因表达分析
对于Taqman qPCR,使用SuperScriptTM VILOTM cDNA合成试剂盒(Thermo Fisher#11754250),以20μL反应体积将250ng总RNA转化为cDNA。用水将cDNA稀释5倍,并将2μL用于qPCR。用QuantStudioTM 12K Flex实时PCR系统(Thermo Fisher)进行qPCR,最终体积为10μL,包含针对UTRN的Taqman探针(Thermo Fisher#Hs01125994_m1,FAM)、针对HPRT1的Taqman探针(Thermo Fisher#Hs02800695_m1,FAM)和TaqManTMUniversal PCR预混物(ThermoFisher#4324018)。qPCR循环条件如下:在95℃下10分钟,然后进行45次在95℃下15秒和在60℃下1分钟的循环。使用QuantStudioTM12K Flex软件(Thermo Fisher)分析数据。用各基因的标准曲线分析表达值,且将UTRN基因的表达水平相对于HPRT1基因的表达水平进行标准化。
(2)结果
通过将AAV9-ED261-145、AAV9-ED261-208或AAV9-ED263-208施加至HSMM细胞中,发现了肌营养相关蛋白mRNA上调,这表明携带dSaCas9、miniVR或microVR和包含向导编号145或208的sgRNA的转基因的AAV9对人肌肉细胞中的肌营养相关蛋白上调具有药理作用(图12)。
实施例6:使用RNA测序分析的脱靶分析
(1)实验方法
慢病毒的产生
将HEK293TA细胞(Genecopoeia#LT008)以0.75×106个细胞/孔接种在6孔细胞培养皿(VWR#10062-892)中的2ml生长培养基(补充有10%FBS和2mM新鲜L-谷氨酰胺、1mM丙酮酸钠和非必需氨基酸的DMEM培养基(Thermo Fisher#11140050))中并在37℃/5%CO2下孵育24小时。第二天,按照制造商的方案,使用1.5μg封包质粒混合物[1μg封包质粒(参见pCMVdelta R8.2;addgene#12263)和0.5μg包膜表达质粒(参见pCMV-VSV-G);addgene#8454)]和1μg转移质粒设置TransIT-VirusGEN转染反应,所述转移质粒包含编码dSaCas9-miniVR和包含实施例2中选择的靶向序列(即向导编号145(SEQ ID NO:45)、146(SEQ ID NO:46)、208(SEQ ID NO:59)或NTg1(非靶向性向导-1)(SEQ ID NO:1))的sgRNA的碱基序列。转染后48至72小时,通过使培养基上清液通过0.45μm PES过滤器(VWR#10218-488)收获慢病毒。在准备使用之前,将经纯化且等分的慢病毒保存在-80℃的冰箱中。
HSMM细胞的转导和RNA样品制备
从Lonza Inc.获得年龄为0岁的人供体的原代骨骼肌成肌细胞(HSMM)(批号542368)。将细胞在来自Lonza的原代骨骼肌细胞生长培养基[SkGMTM-2骨骼肌生长BulletKit培养基(#CC-3245),其包含有含骨骼肌成肌细胞生长所需的SkBMTM-2基础培养基(#CC-3246)和SkGMTM-2SingleQuotsTM补充剂(#CC-3244)的培养系统]中培养。为了进行转导,将细胞以0.125×106个细胞/孔接种在含有生长培养基的6孔细胞培养皿(VWR#10062-894)中,并在37℃/5%CO2下孵育24小时。第二天,向各孔中添加补充有8μg/ml聚凝胺(Sigma#TR-1003-G)和1.0ml对应于包含由各个靶向序列(向导编号145(SEQ ID NO:45)、146(SEQ ID NO:46)或208(SEQ ID NO:59))编码的crRNA和tracrRNA的各sgRNA的慢病毒上清液(滴度范围为0.2至2×109拷贝/ml,通过使用Lenti-XTM qRT-PCR滴定试剂盒(Clontech#631235)测量)的1.5ml生长培养基。将细胞与慢病毒一起孵育6小时,然后去除病毒培养基并替换为新鲜的生长培养基。转导后72小时,向细胞供以选择培养基[补充有0.5μg/ml嘌呤霉素的生长培养基(Sigma#P8833-100MG)]。每2至3天为细胞提供新鲜的选择培养基。细胞在选择培养基中7至10天后,按照制造商的指导收获细胞并用RNeasy 96试剂盒(Qiagen#74182)提取RNA。用作对照的NTg1(非靶向性向导1)向导的序列为ACGGAGGCTAAGCGTCGCAA(SEQ ID NO:1)。
脱靶分析
由GeneWiz,LLC进行Illumina测序,其中RNA文库是使用NEBNext Ultra RNA文库制备试剂盒(Ipswich,MA,USA,NEB#E7530L)根据制造商的方案制备。测序文库聚集在Illumina HiSeq流动槽的三个泳道上,并使用2×150配对末端配置进行测序。将产生的原始序列数据(.bcl文件)转换为fastq文件,并使用Illumina的bcl2fastq2.17软件进行多路分解,其中索引序列识别允许一个不匹配项。使用STAR比对器将fastq文件与人基因组装体GRCh38.p12比对。使用DESeq2进行差异分析,并使用定制R脚本通过plotly(https://plot.ly)生成图。
(2)结果
相对于非靶向性向导1(NTg1)标准化各向导的mRNA水平的全基因组倍数变化。每个点代表一个基因。X轴示出了基因的平均表达水平。Y轴示出了相对于NTg1样品,基因表达的log-2倍数变化。水平Log2=0以上的基因表示实验样品(例如,向导编号145)中的基因表达高于NTg1样品,水平Log2=0以下的基因表明实验样品中的基因表达低于NTg1样品。示出了在实验样品中比在NTg1样品中高度上调或下调的基因的基因ID。不同的gRNA诱导了不同的基因表达变化(图13A:向导编号145,13B:向导编号146,13C:向导编号208)。向导编号208似乎触发了较少的其它基因表达变化,同时示出了出良好的UTRN基因上调。
实施例7.对肌营养相关蛋白上调的药理作用的体内评估
(1)实验方法
动物和免疫抑制方案
在本研究中使用AAV9血清反应阴性的食蟹猴(雄性)。驯化一周后,向所述食蟹猴口服施用0.75mg/kg/天的泼尼松龙磷酸钠(Abcam#ab142456)。AAV施用前14天开始给药,一直持续到处死。
AAV9治疗和肌肉组织取样
向食蟹猴经由头静脉静脉内施用1.0或6.0×1013vg/kg的AAV9-ED261-208(SignaGen制)。为了进行股四头肌活检,通过肌肉内施用10mg/kg的氯胺酮盐酸盐和0.08mg/kg的美托咪定盐酸盐将猴麻醉,并在AAV施用前19天和施用后28天获取50至200mg样品。施用AAV9后56天,处死猴子,并获取各肌肉和心脏样本。将样品在液氮中冷冻并应用于基因和蛋白质表达分析。
肌肉组织样品的基因和蛋白质表达分析
对于Taqman qPCR,使用RNeasy纤维组织Mini试剂盒(Qiagen#74704)从肌肉样品中提取总RNA,并使用SuperscriptTM VILOTM cDNA合成试剂盒(Thermo Fisher#11754250)转化为cDNA。用针对UTRN的Taqman探针(Thermo Fisher#Mf01126001_m1,FAM)、针对HPRT1的Taqman探针(Thermo Fisher,#Hs02800695_m1,FAM),和TaqManTM通用PCR预混物(ThermoFisher,#4324018)与QuantStudioTM 12K Flex实时PCR系统(Thermo Fisher)进行qPCR。UTRN基因的表达水平相对于HPRT1基因进行标准化。
对于蛋白质表达分析,用含有蛋白酶和磷酸酶抑制剂混合物(Thermo Fisher#78441)的RIPA缓冲液(Millipore#20-188)制备全肌肉裂解物,并应用于SDS-PAGE和Western印迹法。使用针对肌营养相关蛋白的第一抗体(SantaCruz#SC-33700)和辣根过氧化物酶标记的第二抗体(Cell Signaling#7076)检测肌营养相关蛋白蛋白。
工业适用性
根据本发明,可以激活UTRN基因在人细胞中的表达。因此,本发明预期对治疗和/或预防DMD和BMD极其有用。
若在本文中指定一个数值限制或范围,则包括端点。此外,数值限制或范围内的所有值和子范围被明确包括在内,如同明确地写出一般。
如本文中所使用,词“一个”和“一种”等有“一个(种)或多个(种)”的意思。
显然,本发明的许多修改和变化根据上述教导是可能的。因此,应理解,在所附权利要求的范围内,本发明可以以不同于本文中具体描述的其它方式实施。
上述所有专利和其它参考文献通过引入全部并入本文,如同详细描述一般。
序列表
<110> 安斯泰来制药株式会社(Astellas Pharma Inc. )
摩大力斯医疗株式会社(Modalis Therapeutics Corporation)
<120> 通过靶向肌营养相关蛋白基因来治疗肌营养不良的方法
<130> 092955
<150> US62/768,474
<151> 2018-11-16
<150> US62/861,039
<151> 2019-06-13
<150> US62/931,925
<151> 2019-11-07
<160> 216
<170> PatentIn version 3.5
<210> 1
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 对照非靶向性靶向序列
<400> 1
acggaggcta agcgtcgcaa 20
<210> 2
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 对照非靶向性靶向序列
<400> 2
cgcttccgcg gcccgttcaa 20
<210> 3
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 对照非靶向性靶向序列
<400> 3
gtaggcgcgc cgctctctac 20
<210> 4
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 4
agaaaagcgg cccctagggg c 21
<210> 5
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 5
caaacacaca ccagcaaact t 21
<210> 6
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 6
tgaaagcgca actggagggc c 21
<210> 7
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 7
acccacgcgg acatatgtcc a 21
<210> 8
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 8
atccaatgga catatgtccg c 21
<210> 9
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 9
gagggggagg gctgtgacct g 21
<210> 10
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 10
atttggtggt cagggagcaa g 21
<210> 11
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 11
aatgaaacca aagacagctt c 21
<210> 12
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 12
ccaaaatcct ttaatgaatc a 21
<210> 13
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 13
tacagattcc atgattcatt a 21
<210> 14
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 14
ggaacaaacc aaaatccttt a 21
<210> 15
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 15
atctgtttgt ggggaaatct t 21
<210> 16
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 16
caaacagatt tcagtatttt c 21
<210> 17
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 17
gtggtgattt atgttactgg t 21
<210> 18
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 18
tgagtctttc aagttccttt c 21
<210> 19
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 19
agatcatttt tggcttcaaa c 21
<210> 20
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 20
tggcttcaaa ctagaatgtc c 21
<210> 21
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 21
gatctatcta tagacaccaa a 21
<210> 22
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 22
tgcttcttcc aggcttgagt g 21
<210> 23
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 23
accgctttgc ttcttccagg c 21
<210> 24
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 24
aagcctggaa gaagcaaagc g 21
<210> 25
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 25
cttctgaatc agaattccta a 21
<210> 26
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 26
tggttccaag ctagtacttc a 21
<210> 27
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 27
atgttcacaa aataaattta a 21
<210> 28
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 28
cctttatggt caccttctct g 21
<210> 29
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 29
ccttctctgc tgagtaaaaa t 21
<210> 30
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 30
aaggtggcca aaaaagaacc c 21
<210> 31
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 31
aaggaagaga gaggcaagaa a 21
<210> 32
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 32
taaagaattc tagcactgga a 21
<210> 33
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 33
aaatgtgtca tgtgttggtt a 21
<210> 34
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 34
aaaaatgaaa attgcaactt c 21
<210> 35
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 35
attgcaactt ctagaattta a 21
<210> 36
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 36
cagctggagt gggccacgta a 21
<210> 37
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 37
atttttgcat atttctttgg t 21
<210> 38
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 38
agtgacctgc tgatttctct a 21
<210> 39
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 39
ctttccccat tgttcaggac t 21
<210> 40
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 40
ttggttgata aatttgtata t 21
<210> 41
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 41
tctctagttc attttttagc t 21
<210> 42
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 42
tccttcaact tcaagacaac a 21
<210> 43
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 43
gctcctcctg ctggatgggg g 21
<210> 44
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 44
ctctatttcc agctcctcct g 21
<210> 45
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 45
gtacagttag tgctactagg a 21
<210> 46
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 46
gctactagga caggatgctg g 21
<210> 47
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 47
ccccagctgt gcctctgttt t 21
<210> 48
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 48
ttcccaaaac agaggcacag c 21
<210> 49
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 49
gttttgaaac tggtagcagc t 21
<210> 50
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 50
aaactgatgc ttgttaaatg a 21
<210> 51
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 51
cttgttaaat gaatgaatga a 21
<210> 52
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 52
aatccaaagg attaacttga a 21
<210> 53
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 53
tacccatttc aagttaatcc t 21
<210> 54
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 54
tgccccctcc ctggagcact t 21
<210> 55
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 55
agcaacgtca gcaaactgag a 21
<210> 56
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 56
acgtcagcaa actgagatgg g 21
<210> 57
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 57
gaaccgtgcg tgccgggagc c 21
<210> 58
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 58
ggggtccgct ctccagatga g 21
<210> 59
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 59
ggagggtggg gcgcaggacc g 21
<210> 60
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 60
cctctctcgc gcacaaagtt g 21
<210> 61
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 61
tctggctcca gaagccgatt g 21
<210> 62
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 62
acaagtaagg ggcgttttca g 21
<210> 63
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 63
gagctggcca agggctcctc t 21
<210> 64
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 64
tagaggagcc cttggccagc t 21
<210> 65
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 65
ccaagtccca gagtcgaaga t 21
<210> 66
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 66
gtccacagga gagggtgggc a 21
<210> 67
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 67
ctctgggtgg ttgctgctcc c 21
<210> 68
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 68
tcagttgcag caagagatcc c 21
<210> 69
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 69
attttaggta aacacccaaa g 21
<210> 70
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 70
taggtgagaa actgagaatc a 21
<210> 71
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 71
cagaaggcta ggtgagaaac t 21
<210> 72
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 72
gccattaatg gccagaggaa t 21
<210> 73
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 73
agatacagca gaaaaggtga t 21
<210> 74
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 74
aatttgaaaa atcaccttga g 21
<210> 75
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 75
cagttgattc atctgtacag c 21
<210> 76
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 76
tttttgactc tggctgtaca g 21
<210> 77
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 77
gctgtacaga tgaatcaact g 21
<210> 78
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 78
atctcccctt tgagtttgtc t 21
<210> 79
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 79
ctgttcaaaa atatctcccc t 21
<210> 80
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 80
aaaattacac agaactccac c 21
<210> 81
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 81
ttttttgtct ttaaagtgac a 21
<210> 82
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 82
tcttgtttta aaatatgctt t 21
<210> 83
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 83
ctctgttata tttacatatg t 21
<210> 84
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 84
tataaatatc aaaggtctta c 21
<210> 85
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 85
cctagggaaa aactctagaa a 21
<210> 86
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 86
acaccatgaa aatctaatat t 21
<210> 87
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 87
agatgtgcta gagtaaagaa a 21
<210> 88
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 88
gtatgatctg ttcagatgtg c 21
<210> 89
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 89
tttaaagatt atcaaattgc t 21
<210> 90
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 90
atatgaatca cattcttttg g 21
<210> 91
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 91
tgcaaaagcc agtagataaa t 21
<210> 92
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 92
agccagtaga taaatttgga t 21
<210> 93
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 93
ttttagttta gattaagtca t 21
<210> 94
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 94
aagaaacctg gaagagcaga t 21
<210> 95
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 95
ggtttctttt ttggggggaa a 21
<210> 96
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 96
tatggttgta gtatacttgc c 21
<210> 97
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 97
tgtagtatac ttgccttggg t 21
<210> 98
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 98
gtatacttgc cttgggtttg g 21
<210> 99
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 99
acatgaaata ataaaatggt t 21
<210> 100
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 100
attattgaat gaaatagcag t 21
<210> 101
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 101
acaacactga cagcaacaga a 21
<210> 102
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 102
agtgtgtcag ctggctccat g 21
<210> 103
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 103
catgtggagt tcttgacagt t 21
<210> 104
<211> 32
<212> DNA
<213> 智人(Homo sapiens)
<400> 104
gtacagttag tgctactagg acaggatgct gg 32
<210> 105
<211> 494
<212> DNA
<213> 智人(Homo sapiens)
<400> 105
gagcgcgcgc cccaggccag ccaagcgccg agccgggctg ctgcgggctg ggagggcgcg 60
cagggccggc gctgattgac ggggcgcgca gtcaggtgac ttggggcgcc aagttcccga 120
cgcggtggcc gcggtgaccg ccgaggcccg gcagacgctg acccgggaac gtagtggggc 180
tgatcttccg gaacaaagtt gctgggccgg cggcggcggg gcgagagcgc cgagggggag 240
ccggagcgct gcagaggcgc gggccggagg gctggcgctg atctgcaccc ttctcatctg 300
gagagcggac ccctggctgc ccggaggcga gccccttccc ggggggtggg ggcggcaacg 360
cgcgacccag cggtcctgcg ccccaccctc cctcctccgc ctccagcgct cggctccaac 420
aaaggggcag gcccgcagcg gggaggagga ggaggagccg ccgaaggagc gagcctctct 480
cgcgcacaaa gttg 494
<210> 106
<211> 19
<212> RNA
<213> 新凶手弗朗西丝氏菌(Francisella novicid)
<220>
<221> misc_feature
<222> (1)..(19)
<223> crRNA的5'-柄
<400> 106
aauuucuacu guuguagau 19
<210> 107
<211> 1053
<212> PRT
<213> 金黄色葡萄球菌(Staphylococcus aureus)
<220>
<221> 变体
<222> (10)..(10)
<223> Asp残基转化成Ala残基
<220>
<221> 变体
<222> (580)..(580)
<223> Asn残基转化成Ala残基
<400> 107
Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val
1 5 10 15
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
20 25 30
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
35 40 45
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
50 55 60
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65 70 75 80
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
85 90 95
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
485 490 495
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
500 505 510
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
515 520 525
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
530 535 540
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro
545 550 555 560
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
565 570 575
Gln Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
580 585 590
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
595 600 605
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
610 615 620
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
625 630 635 640
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
645 650 655
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
660 665 670
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
675 680 685
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
690 695 700
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
705 710 715 720
Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys
725 730 735
Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu
740 745 750
Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp
755 760 765
Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile
770 775 780
Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu
785 790 795 800
Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu
805 810 815
Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His
820 825 830
Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly
835 840 845
Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr
850 855 860
Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile
865 870 875 880
Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp
885 890 895
Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr
900 905 910
Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val
915 920 925
Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser
930 935 940
Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala
945 950 955 960
Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly
965 970 975
Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile
980 985 990
Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met
995 1000 1005
Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys
1010 1015 1020
Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu
1025 1030 1035
Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1040 1045 1050
<210> 108
<211> 1053
<212> PRT
<213> 金黄色葡萄球菌(Staphylococcus aureus)
<220>
<221> 变体
<222> (10)..(10)
<223> Asp残基转化成Ala残基
<220>
<221> 变体
<222> (557)..(557)
<223> His残基转化成Ala残基
<400> 108
Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val
1 5 10 15
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
20 25 30
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
35 40 45
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
50 55 60
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65 70 75 80
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
85 90 95
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
485 490 495
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
500 505 510
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
515 520 525
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
530 535 540
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp Ala Ile Ile Pro
545 550 555 560
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
565 570 575
Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
580 585 590
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
595 600 605
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
610 615 620
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
625 630 635 640
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
645 650 655
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
660 665 670
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
675 680 685
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
690 695 700
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
705 710 715 720
Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys
725 730 735
Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu
740 745 750
Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp
755 760 765
Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile
770 775 780
Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu
785 790 795 800
Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu
805 810 815
Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His
820 825 830
Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly
835 840 845
Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr
850 855 860
Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile
865 870 875 880
Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp
885 890 895
Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr
900 905 910
Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val
915 920 925
Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser
930 935 940
Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala
945 950 955 960
Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly
965 970 975
Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile
980 985 990
Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met
995 1000 1005
Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys
1010 1015 1020
Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu
1025 1030 1035
Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1040 1045 1050
<210> 109
<211> 1028
<212> PRT
<213> 人工序列
<220>
<223> 氨基酸残基(dSaCas9的第721位至第745位氨基酸残基)缺失突变体
<220>
<221> 变体
<222> (10)..(10)
<223> Asp残基转化成Ala残基
<220>
<221> 变体
<222> (580)..(580)
<223> Asn残基转化成Ala残基
<400> 109
Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val
1 5 10 15
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
20 25 30
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
35 40 45
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
50 55 60
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65 70 75 80
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
85 90 95
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
485 490 495
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
500 505 510
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
515 520 525
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
530 535 540
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro
545 550 555 560
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
565 570 575
Gln Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
580 585 590
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
595 600 605
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
610 615 620
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
625 630 635 640
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
645 650 655
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
660 665 670
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
675 680 685
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
690 695 700
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
705 710 715 720
Thr Glu Gln Glu Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys
725 730 735
His Ile Lys Asp Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys
740 745 750
Lys Pro Asn Arg Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys
755 760 765
Asp Asp Lys Gly Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr
770 775 780
Asp Lys Asp Asn Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu
785 790 795 800
Lys Leu Leu Met Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys
805 810 815
Leu Ile Met Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr
820 825 830
Tyr Glu Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn
835 840 845
Gly Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala
850 855 860
His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val Val
865 870 875 880
Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp Asn Gly
885 890 895
Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile Lys Lys Glu
900 905 910
Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu Ala Lys Lys Leu
915 920 925
Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala Ser Phe Tyr Asn Asn
930 935 940
Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr Arg Val Ile Gly Val Asn
945 950 955 960
Asn Asp Leu Leu Asn Arg Ile Glu Val Asn Met Ile Asp Ile Thr Tyr
965 970 975
Arg Glu Tyr Leu Glu Asn Met Asn Asp Lys Arg Pro Pro Arg Ile Ile
980 985 990
Lys Thr Ile Ala Ser Lys Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp
995 1000 1005
Ile Leu Gly Asn Leu Tyr Glu Val Lys Ser Lys Lys His Pro Gln
1010 1015 1020
Ile Ile Lys Lys Gly
1025
<210> 110
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> GGSGGS连接子
<400> 110
Gly Gly Ser Gly Gly Ser
1 5
<210> 111
<211> 1034
<212> PRT
<213> 人工序列
<220>
<223> 具有GGSGGS连接子的氨基酸残基(dSaCas9的第721位至第745位氨基酸残基)缺失突变体
<220>
<221> 变体
<222> (10)..(10)
<223> Asp残基转化成Ala残基
<220>
<221> 变体
<222> (580)..(580)
<223> Asn残基转化成Ala残基
<220>
<221> MISC_FEATURE
<222> (721)..(726)
<223> GGSGGS连接子
<400> 111
Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val
1 5 10 15
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
20 25 30
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
35 40 45
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
50 55 60
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65 70 75 80
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
85 90 95
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
485 490 495
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
500 505 510
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
515 520 525
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
530 535 540
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro
545 550 555 560
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
565 570 575
Gln Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
580 585 590
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
595 600 605
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
610 615 620
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
625 630 635 640
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
645 650 655
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
660 665 670
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
675 680 685
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
690 695 700
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
705 710 715 720
Gly Gly Ser Gly Gly Ser Thr Glu Gln Glu Tyr Lys Glu Ile Phe Ile
725 730 735
Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr Lys Tyr
740 745 750
Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn Asp Thr
755 760 765
Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile Val Asn
770 775 780
Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys Lys Leu
785 790 795 800
Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp Pro Gln
805 810 815
Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp Glu Lys
820 825 830
Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu Thr Lys
835 840 845
Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys Tyr Tyr
850 855 860
Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr Pro Asn
865 870 875 880
Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp
885 890 895
Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu
900 905 910
Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr
915 920 925
Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile
930 935 940
Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr
945 950 955 960
Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val Asn
965 970 975
Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn Asp Lys
980 985 990
Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr Gln Ser Ile
995 1000 1005
Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr Glu Val Lys
1010 1015 1020
Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1025 1030
<210> 112
<211> 886
<212> PRT
<213> 人工序列
<220>
<223> 氨基酸残基(dSaCas9的第482位至第648位氨基酸残基)缺失突变体
<220>
<221> 变体
<222> (10)..(10)
<223> Asp残基转化成Ala残基
<400> 112
Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val
1 5 10 15
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
20 25 30
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
35 40 45
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
50 55 60
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65 70 75 80
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
85 90 95
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Thr Arg Tyr Ala Thr Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr
485 490 495
Phe Arg Val Asn Asn Leu Asp Val Lys Val Lys Ser Ile Asn Gly Gly
500 505 510
Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn
515 520 525
Lys Gly Tyr Lys His His Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala
530 535 540
Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu Asp Lys Ala Lys Lys Val
545 550 555 560
Met Glu Asn Gln Met Phe Glu Glu Lys Gln Ala Glu Ser Met Pro Glu
565 570 575
Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile Phe Ile Thr Pro His Gln
580 585 590
Ile Lys His Ile Lys Asp Phe Lys Asp Tyr Lys Tyr Ser His Arg Val
595 600 605
Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr
610 615 620
Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile Val Asn Asn Leu Asn Gly
625 630 635 640
Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser
645 650 655
Pro Glu Lys Leu Leu Met Tyr His His Asp Pro Gln Thr Tyr Gln Lys
660 665 670
Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr
675 680 685
Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys
690 695 700
Asp Asn Gly Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu
705 710 715 720
Asn Ala His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys
725 730 735
Val Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp
740 745 750
Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile Lys
755 760 765
Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu Ala Lys
770 775 780
Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala Ser Phe Tyr
785 790 795 800
Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr Arg Val Ile Gly
805 810 815
Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val Asn Met Ile Asp Ile
820 825 830
Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn Asp Lys Arg Pro Pro Arg
835 840 845
Ile Ile Lys Thr Ile Ala Ser Lys Thr Gln Ser Ile Lys Lys Tyr Ser
850 855 860
Thr Asp Ile Leu Gly Asn Leu Tyr Glu Val Lys Ser Lys Lys His Pro
865 870 875 880
Gln Ile Ile Lys Lys Gly
885
<210> 113
<211> 892
<212> PRT
<213> 人工序列
<220>
<223> 具有GGSGGS连接子的氨基酸残基(dSaCas9的第482位至第648位氨基酸残基)缺失突变体
<220>
<221> 变体
<222> (10)..(10)
<223> Asp残基转化成Ala残基
<220>
<221> MISC_FEATURE
<222> (482)..(487)
<223> GGSGGS连接子
<400> 113
Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val
1 5 10 15
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
20 25 30
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
35 40 45
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
50 55 60
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65 70 75 80
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
85 90 95
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Gly Gly Ser Gly Gly Ser Thr Arg Tyr Ala Thr Arg Gly Leu Met
485 490 495
Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys Val
500 505 510
Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys
515 520 525
Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp Ala
530 535 540
Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu
545 550 555 560
Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys Gln
565 570 575
Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile
580 585 590
Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr
595 600 605
Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn
610 615 620
Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile
625 630 635 640
Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys
645 650 655
Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp
660 665 670
Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp
675 680 685
Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu
690 695 700
Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys
705 710 715 720
Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr
725 730 735
Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg
740 745 750
Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys
755 760 765
Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys
770 775 780
Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu
785 790 795 800
Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu
805 810 815
Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu
820 825 830
Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn
835 840 845
Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr Gln
850 855 860
Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr Glu Val
865 870 875 880
Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
885 890
<210> 114
<211> 50
<212> PRT
<213> 人工序列
<220>
<223> VP64
<400> 114
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu
1 5 10 15
Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe
20 25 30
Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp
35 40 45
Met Leu
50
<210> 115
<211> 376
<212> PRT
<213> 人工序列
<220>
<223> VPH
<400> 115
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu
1 5 10 15
Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe
20 25 30
Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp
35 40 45
Met Leu Ser Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Gly Ser Pro
50 55 60
Ser Gly Gln Ile Ser Asn Gln Ala Leu Ala Leu Ala Pro Ser Ser Ala
65 70 75 80
Pro Val Leu Ala Gln Thr Met Val Pro Ser Ser Ala Met Val Pro Leu
85 90 95
Ala Gln Pro Pro Ala Pro Ala Pro Val Leu Thr Pro Gly Pro Pro Gln
100 105 110
Ser Leu Ser Ala Pro Val Pro Lys Ser Thr Gln Ala Gly Glu Gly Thr
115 120 125
Leu Ser Glu Ala Leu Leu His Leu Gln Phe Asp Ala Asp Glu Asp Leu
130 135 140
Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Gly Val Phe Thr Asp Leu
145 150 155 160
Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Val
165 170 175
Ser Met Ser His Ser Thr Ala Glu Pro Met Leu Met Glu Tyr Pro Glu
180 185 190
Ala Ile Thr Arg Leu Val Thr Gly Ser Gln Arg Pro Pro Asp Pro Ala
195 200 205
Pro Thr Pro Leu Gly Thr Ser Gly Leu Pro Asn Gly Leu Ser Gly Asp
210 215 220
Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser
225 230 235 240
Gln Ile Ser Ser Ser Gly Gln Gly Gly Gly Gly Ser Gly Phe Ser Val
245 250 255
Asp Thr Ser Ala Leu Leu Asp Leu Phe Ser Pro Ser Val Thr Val Pro
260 265 270
Asp Met Ser Leu Pro Asp Leu Asp Ser Ser Leu Ala Ser Ile Gln Glu
275 280 285
Leu Leu Ser Pro Gln Glu Pro Pro Arg Pro Pro Glu Ala Glu Asn Ser
290 295 300
Ser Pro Asp Ser Gly Lys Gln Leu Val His Tyr Thr Ala Gln Pro Leu
305 310 315 320
Phe Leu Leu Asp Pro Gly Ser Val Asp Thr Gly Ser Asn Asp Leu Pro
325 330 335
Val Leu Phe Glu Leu Gly Glu Gly Ser Tyr Phe Ser Glu Gly Asp Gly
340 345 350
Phe Ala Glu Asp Pro Thr Ile Ser Leu Leu Thr Gly Ser Glu Pro Pro
355 360 365
Lys Ala Lys Asp Pro Thr Val Ser
370 375
<210> 116
<211> 523
<212> PRT
<213> 人工序列
<220>
<223> VPR
<400> 116
Glu Ala Ser Gly Ser Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu
1 5 10 15
Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
20 25 30
Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp
35 40 45
Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Ile Asn Ser Arg Ser Ser
50 55 60
Gly Ser Ser Gln Tyr Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu
65 70 75 80
Glu Lys Arg Lys Arg Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys
85 90 95
Ser Pro Phe Ser Gly Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile
100 105 110
Ala Val Pro Ser Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln
115 120 125
Pro Tyr Pro Phe Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe
130 135 140
Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu
145 150 155 160
Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro
165 170 175
Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro
180 185 190
Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys
195 200 205
Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu
210 215 220
Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp
225 230 235 240
Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln
245 250 255
Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro
260 265 270
Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala
275 280 285
Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu
290 295 300
Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp
305 310 315 320
Met Asp Phe Ser Ala Leu Leu Gly Ser Gly Ser Gly Ser Arg Asp Ser
325 330 335
Arg Glu Gly Met Phe Leu Pro Lys Pro Glu Ala Gly Ser Ala Ile Ser
340 345 350
Asp Val Phe Glu Gly Arg Glu Val Cys Gln Pro Lys Arg Ile Arg Pro
355 360 365
Phe His Pro Pro Gly Ser Pro Trp Ala Asn Arg Pro Leu Pro Ala Ser
370 375 380
Leu Ala Pro Thr Pro Thr Gly Pro Val His Glu Pro Val Gly Ser Leu
385 390 395 400
Thr Pro Ala Pro Val Pro Gln Pro Leu Asp Pro Ala Pro Ala Val Thr
405 410 415
Pro Glu Ala Ser His Leu Leu Glu Asp Pro Asp Glu Glu Thr Ser Gln
420 425 430
Ala Val Lys Ala Leu Arg Glu Met Ala Asp Thr Val Ile Pro Gln Lys
435 440 445
Glu Glu Ala Ala Ile Cys Gly Gln Met Asp Leu Ser His Pro Pro Pro
450 455 460
Arg Gly His Leu Asp Glu Leu Thr Thr Thr Leu Glu Ser Met Thr Glu
465 470 475 480
Asp Leu Asn Leu Asp Ser Pro Leu Thr Pro Glu Leu Asn Glu Ile Leu
485 490 495
Asp Thr Phe Leu Asn Asp Glu Cys Leu Leu His Ala Met His Ile Ser
500 505 510
Thr Gly Leu Ser Ile Phe Asp Thr Ser Leu Phe
515 520
<210> 117
<211> 167
<212> PRT
<213> 人工序列
<220>
<223> miniVR
<400> 117
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu
1 5 10 15
Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe
20 25 30
Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp
35 40 45
Met Leu Gly Ser Gly Ser Pro Ala Pro Ala Val Thr Pro Glu Ala Ser
50 55 60
His Leu Leu Glu Asp Pro Asp Glu Glu Thr Ser Gln Ala Val Lys Ala
65 70 75 80
Leu Arg Glu Met Ala Asp Thr Val Ile Pro Gln Lys Glu Glu Ala Ala
85 90 95
Ile Cys Gly Gln Met Asp Leu Ser His Pro Pro Pro Arg Gly His Leu
100 105 110
Asp Glu Leu Thr Thr Thr Leu Glu Ser Met Thr Glu Asp Leu Asn Leu
115 120 125
Asp Ser Pro Leu Thr Pro Glu Leu Asn Glu Ile Leu Asp Thr Phe Leu
130 135 140
Asn Asp Glu Cys Leu Leu His Ala Met His Ile Ser Thr Gly Leu Ser
145 150 155 160
Ile Phe Asp Thr Ser Leu Phe
165
<210> 118
<211> 140
<212> PRT
<213> 人工序列
<220>
<223> microVR
<400> 118
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu
1 5 10 15
Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe
20 25 30
Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp
35 40 45
Met Leu Gly Ser Gly Ser Arg Glu Met Ala Asp Thr Val Ile Pro Gln
50 55 60
Lys Glu Glu Ala Ala Ile Cys Gly Gln Met Asp Leu Ser His Pro Pro
65 70 75 80
Pro Arg Gly His Leu Asp Glu Leu Thr Thr Thr Leu Glu Ser Met Thr
85 90 95
Glu Asp Leu Asn Leu Asp Ser Pro Leu Thr Pro Glu Leu Asn Glu Ile
100 105 110
Leu Asp Thr Phe Leu Asn Asp Glu Cys Leu Leu His Ala Met His Ile
115 120 125
Ser Thr Gly Leu Ser Ile Phe Asp Thr Ser Leu Phe
130 135 140
<210> 119
<211> 21
<212> RNA
<213> 智人(Homo sapiens)
<220>
<221> misc_feature
<222> (1)..(21)
<223> 对应于靶序列(SEQ ID NO:4)的crRNA
<400> 119
agaaaagcgg ccccuagggg c 21
<210> 120
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<220>
<221> misc_feature
<222> (1)..(21)
<223> 与靶序列(SEQ ID NO:4)互补的序列
<400> 120
gcccctaggg gccgcttttc t 21
<210> 121
<211> 19
<212> DNA
<213> 新凶手弗朗西丝氏菌(Francisella novicid)
<220>
<221> misc_feature
<222> (1)..(19)
<223> crRNA的5'-柄
<400> 121
aatttctact gttgtagat 19
<210> 122
<211> 83
<212> DNA
<213> 金黄色葡萄球菌(Staphylococcus aureus)
<220>
<221> misc_feature
<222> (1)..(83)
<223> 编码tracrRNA的序列
<400> 122
gttttagtac tctggaaaca gaatctacta aaacaaggca aaatgccgtg tttatctcgt 60
caacttgttg gcgagatttt ttt 83
<210> 123
<211> 1053
<212> PRT
<213> 金黄色葡萄球菌(Staphylococcus aureus)
<220>
<221> 变体
<222> (10)..(10)
<223> Asp残基转化成Ala残基
<220>
<221> 变体
<222> (580)..(580)
<223> Asn残基转化成Ala残基
<400> 123
Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val
1 5 10 15
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
20 25 30
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
35 40 45
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
50 55 60
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65 70 75 80
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
85 90 95
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
485 490 495
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
500 505 510
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
515 520 525
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
530 535 540
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro
545 550 555 560
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
565 570 575
Gln Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
580 585 590
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
595 600 605
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
610 615 620
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
625 630 635 640
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
645 650 655
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
660 665 670
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
675 680 685
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
690 695 700
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
705 710 715 720
Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys
725 730 735
Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu
740 745 750
Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp
755 760 765
Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile
770 775 780
Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu
785 790 795 800
Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu
805 810 815
Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His
820 825 830
Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly
835 840 845
Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr
850 855 860
Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile
865 870 875 880
Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp
885 890 895
Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr
900 905 910
Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val
915 920 925
Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser
930 935 940
Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala
945 950 955 960
Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly
965 970 975
Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile
980 985 990
Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met
995 1000 1005
Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys
1010 1015 1020
Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu
1025 1030 1035
Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1040 1045 1050
<210> 124
<211> 76
<212> DNA
<213> 金黄色葡萄球菌(Staphylococcus aureus)
<220>
<221> misc_feature
<222> (1)..(76)
<223> SaCas9 gRNA骨架序列
<400> 124
gttttagtac tctggaaaca gaatctacta aaacaaggca aaatgccgtg tttatctcgt 60
caacttgttg gcgaga 76
<210> 125
<211> 501
<212> DNA
<213> 人工序列
<220>
<223> miniVR DNA
<400> 125
gatgcactcg atgattttga cctcgatatg cttgggagtg atgcgctcga tgacttcgat 60
ttggatatgc ttggatctga tgccctcgac gatttcgacc ttgatatgct cgggtcagac 120
gctttggatg actttgacct tgacatgctg gggagcggct cccccgcacc ggcagttaca 180
ccggaggcca gtcacttgct cgaagatcct gacgaggaaa ccagccaggc cgtaaaggcg 240
ttgcgggaga tggctgacac agtaataccc caaaaagagg aggctgcgat ttgtgggcag 300
atggatttgt cccaccctcc accgagaggt catcttgacg aattgacaac gacgctcgaa 360
tccatgaccg aggacctgaa cctcgatagc ccgctcaccc ccgagttgaa tgagatcctg 420
gatacatttc ttaatgatga gtgtttgctt cacgcaatgc atatttctac gggtcttagt 480
attttcgaca cgagcctgtt t 501
<210> 126
<211> 167
<212> PRT
<213> 人工序列
<220>
<223> miniVR蛋白
<400> 126
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu
1 5 10 15
Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe
20 25 30
Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp
35 40 45
Met Leu Gly Ser Gly Ser Pro Ala Pro Ala Val Thr Pro Glu Ala Ser
50 55 60
His Leu Leu Glu Asp Pro Asp Glu Glu Thr Ser Gln Ala Val Lys Ala
65 70 75 80
Leu Arg Glu Met Ala Asp Thr Val Ile Pro Gln Lys Glu Glu Ala Ala
85 90 95
Ile Cys Gly Gln Met Asp Leu Ser His Pro Pro Pro Arg Gly His Leu
100 105 110
Asp Glu Leu Thr Thr Thr Leu Glu Ser Met Thr Glu Asp Leu Asn Leu
115 120 125
Asp Ser Pro Leu Thr Pro Glu Leu Asn Glu Ile Leu Asp Thr Phe Leu
130 135 140
Asn Asp Glu Cys Leu Leu His Ala Met His Ile Ser Thr Gly Leu Ser
145 150 155 160
Ile Phe Asp Thr Ser Leu Phe
165
<210> 127
<211> 82
<212> RNA
<213> 金黄色葡萄球菌(Staphylococcus aureus)
<220>
<221> misc_feature
<222> (1)..(82)
<223> tracrRNA
<400> 127
guuuuaguac ucuggaaaca gaaucuacua aaacaaggca aaaugccgug uuuaucucgu 60
caacuuguug gcgagauuuu uu 82
<210> 128
<211> 241
<212> DNA
<213> 人工序列
<220>
<223> U6启动子
<400> 128
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattagaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
c 241
<210> 129
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 129
cttgttaaat gaatgaatga a 21
<210> 130
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 130
tgtcctagaa accttacaag g 21
<210> 131
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 131
ggtttattgc tggcttaata t 21
<210> 132
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 132
acgtcagcaa actgagatgg g 21
<210> 133
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 133
ttttcggata atctgaataa g 21
<210> 134
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 134
ggggtccgct ctccagatga g 21
<210> 135
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 135
ggctcctcta ggagtttgac a 21
<210> 136
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 136
taatgtgact acagcccccg a 21
<210> 137
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 137
ccaagtccca gagtcgaaga t 21
<210> 138
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 138
tcagttgcag caagagatcc c 21
<210> 139
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 139
cctcctcctc gaaaaacgca c 21
<210> 140
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 140
gggagggtcg gctcagacct a 21
<210> 141
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 141
gggtagttct gcggtgacgg a 21
<210> 142
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 142
attttaggta aacacccaaa g 21
<210> 143
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 143
gaaacacagt aaaagaaaac g 21
<210> 144
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 144
taagatttta ggaattatac a 21
<210> 145
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 145
agcgttctga agggagagtt a 21
<210> 146
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 146
cagaaggcta ggtgagaaac t 21
<210> 147
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 147
aatttgagta cacttaaggc a 21
<210> 148
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 148
agatacagca gaaaaggtga t 21
<210> 149
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 149
gacacatgca gaagtgacag c 21
<210> 150
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 150
agcagccttc gaactgcaca c 21
<210> 151
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 151
tctagatggc agtaaacagc a 21
<210> 152
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 152
ggctgctcca atcattttgg t 21
<210> 153
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 153
gagtccggag accgaaccag a 21
<210> 154
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 154
gaaccgtgcg tgccgggagc c 21
<210> 155
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 155
gctggcctgg ggcgcgcgct c 21
<210> 156
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 156
aagatcagcc ccactacgtt c 21
<210> 157
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 157
ccggaggcga gccccttccc g 21
<210> 158
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 158
ggagggtggg gcgcaggacc g 21
<210> 159
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 159
gagcgctgga ggcggaggag g 21
<210> 160
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 160
cctctctcgc gcacaaagtt g 21
<210> 161
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 161
gggagcggcg ccccccttct t 21
<210> 162
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 162
caccaacttt gccaaacgct a 21
<210> 163
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 163
ggagtaaccg cgggggtgtg t 21
<210> 164
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 164
gaatggggcg ggggccggga g 21
<210> 165
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 165
tctttctgtg gttcttccgc c 21
<210> 166
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 166
tttggatcgt tcacaactag t 21
<210> 167
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 167
agaggggacg tggcctctta g 21
<210> 168
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 168
gtccacagga gagggtgggc a 21
<210> 169
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 169
gctcccaagg gtggggctcc g 21
<210> 170
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 170
tttcagatgg caggttgttc a 21
<210> 171
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 171
ctttcccagc cttcaggtca g 21
<210> 172
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 172
gcgcgcggag ctcgggggag g 21
<210> 173
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 173
tgaggccggt gcaacttaca a 21
<210> 174
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 174
tgggcgtggg agacgcagcc t 21
<210> 175
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 175
aggtggagga atgcgaagct t 21
<210> 176
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 176
agacaactct ttaactctcc t 21
<210> 177
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 编码对照sgRNA的crRNA的序列
<400> 177
acggaggcta agcgtcgcaa g 21
<210> 178
<211> 16
<212> PRT
<213> 人工序列
<220>
<223> 核定位信号
<400> 178
Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala Ala
1 5 10 15
<210> 179
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> 编码SEQ ID NO 178的NLS的DNA序列
<400> 179
gccccaaaga agaagcggaa ggtcggtatc cacggagtcc cagcagcc 48
<210> 180
<211> 16
<212> PRT
<213> 人工序列
<220>
<223> 核定位信号
<400> 180
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 181
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> 编码SEQ ID NO 180的NLS的DNA序列
<400> 181
aaaaggccgg cggccacgaa aaaggccggc caggcaaaaa agaaaaag 48
<210> 182
<211> 3414
<212> DNA
<213> 人工序列
<220>
<223> 编码dSaCas9(D10A, N580A)-VP64的DNA序列
<400> 182
atggccccaa agaagaagcg gaaggtcggt atccacggag tcccagcagc caagcggaac 60
tacatcctgg gcctggccat cggcatcacc agcgtgggct acggcatcat cgactacgag 120
acacgggacg tgatcgatgc cggcgtgcgg ctgttcaaag aggccaacgt ggaaaacaac 180
gagggcaggc ggagcaagag aggcgccaga aggctgaagc ggcggaggcg gcatagaatc 240
cagagagtga agaagctgct gttcgactac aacctgctga ccgaccacag cgagctgagc 300
ggcatcaacc cctacgaggc cagagtgaag ggcctgagcc agaagctgag cgaggaagag 360
ttctctgccg ccctgctgca cctggccaag agaagaggcg tgcacaacgt gaacgaggtg 420
gaagaggaca ccggcaacga gctgtccacc aaagagcaga tcagccggaa cagcaaggcc 480
ctggaagaga aatacgtggc cgaactgcag ctggaacggc tgaagaaaga cggcgaagtg 540
cggggcagca tcaacagatt caagaccagc gactacgtga aagaagccaa acagctgctg 600
aaggtgcaga aggcctacca ccagctggac cagagcttca tcgacaccta catcgacctg 660
ctggaaaccc ggcggaccta ctatgaggga cctggcgagg gcagcccctt cggctggaag 720
gacatcaaag aatggtacga gatgctgatg ggccactgca cctacttccc cgaggaactg 780
cggagcgtga agtacgccta caacgccgac ctgtacaacg ccctgaacga cctgaacaat 840
ctcgtgatca ccagggacga gaacgagaag ctggaatatt acgagaagtt ccagatcatc 900
gagaacgtgt tcaagcagaa gaagaagccc accctgaagc agatcgccaa agaaatcctc 960
gtgaacgaag aggatattaa gggctacaga gtgaccagca ccggcaagcc cgagttcacc 1020
aacctgaagg tgtaccacga catcaaggac attaccgccc ggaaagagat tattgagaac 1080
gccgagctgc tggatcagat tgccaagatc ctgaccatct accagagcag cgaggacatc 1140
caggaagaac tgaccaatct gaactccgag ctgacccagg aagagatcga gcagatctct 1200
aatctgaagg gctataccgg cacccacaac ctgagcctga aggccatcaa cctgatcctg 1260
gacgagctgt ggcacaccaa cgacaaccag atcgctatct tcaaccggct gaagctggtg 1320
cccaagaagg tggacctgtc ccagcagaaa gagatcccca ccaccctggt ggacgacttc 1380
atcctgagcc ccgtcgtgaa gagaagcttc atccagagca tcaaagtgat caacgccatc 1440
atcaagaagt acggcctgcc caacgacatc attatcgagc tggcccgcga gaagaactcc 1500
aaggacgccc agaaaatgat caacgagatg cagaagcgga accggcagac caacgagcgg 1560
atcgaggaaa tcatccggac caccggcaaa gagaacgcca agtacctgat cgagaagatc 1620
aagctgcacg acatgcagga aggcaagtgc ctgtacagcc tggaagccat ccctctggaa 1680
gatctgctga acaacccctt caactatgag gtggaccaca tcatccccag aagcgtgtcc 1740
ttcgacaaca gcttcaacaa caaggtgctc gtgaagcagg aagaagccag caagaagggc 1800
aaccggaccc cattccagta cctgagcagc agcgacagca agatcagcta cgaaaccttc 1860
aagaagcaca tcctgaatct ggccaagggc aagggcagaa tcagcaagac caagaaagag 1920
tatctgctgg aagaacggga catcaacagg ttctccgtgc agaaagactt catcaaccgg 1980
aacctggtgg ataccagata cgccaccaga ggcctgatga acctgctgcg gagctacttc 2040
agagtgaaca acctggacgt gaaagtgaag tccatcaatg gcggcttcac cagctttctg 2100
cggcggaagt ggaagtttaa gaaagagcgg aacaaggggt acaagcacca cgccgaggac 2160
gccctgatca ttgccaacgc cgatttcatc ttcaaagagt ggaagaaact ggacaaggcc 2220
aaaaaagtga tggaaaacca gatgttcgag gaaaagcagg ccgagagcat gcccgagatc 2280
gaaaccgagc aggagtacaa agagatcttc atcacccccc accagatcaa gcacattaag 2340
gacttcaagg actacaagta cagccaccgg gtggacaaga agcctaatag agagctgatt 2400
aacgacaccc tgtactccac ccggaaggac gacaagggca acaccctgat cgtgaacaat 2460
ctgaacggcc tgtacgacaa ggacaatgac aagctgaaaa agctgatcaa caagagcccc 2520
gaaaagctgc tgatgtacca ccacgacccc cagacctacc agaaactgaa gctgattatg 2580
gaacagtacg gcgacgagaa gaatcccctg tacaagtact acgaggaaac cgggaactac 2640
ctgaccaagt actccaaaaa ggacaacggc cccgtgatca agaagattaa gtattacggc 2700
aacaaactga acgcccatct ggacatcacc gacgactacc ccaacagcag aaacaaggtc 2760
gtgaagctgt ccctgaagcc ctacagattc gacgtgtacc tggacaatgg cgtgtacaag 2820
ttcgtgaccg tgaagaatct ggatgtgatc aaaaaagaaa actactacga agtgaatagc 2880
aagtgctatg aggaagctaa gaagctgaag aagatcagca accaggccga gtttatcgcc 2940
tccttctaca acaacgatct gatcaagatc aacggcgagc tgtatagagt gatcggcgtg 3000
aacaacgacc tgctgaaccg gatcgaagtg aacatgatcg acatcaccta ccgcgagtac 3060
ctggaaaaca tgaacgacaa gaggcccccc aggatcatta agacaatcgc ctccaagacc 3120
cagagcatta agaagtacag cacagacatt ctgggcaacc tgtatgaagt gaaatctaag 3180
aagcaccctc agatcatcaa aaagggcaaa aggccggcgg ccacgaaaaa ggccggccag 3240
gcaaaaaaga aaaagtctag agatgcttta gacgattttg acttagatat gcttggttca 3300
gacgcgttag acgacttcga cctagacatg ttaggctcag atgcattgga cgacttcgat 3360
ttagatatgt tgggctccga tgccctagat gactttgatt tggatatgct ataa 3414
<210> 183
<211> 4392
<212> DNA
<213> 人工序列
<220>
<223> 编码dSaCas9(D10A, N580A)-VPH的DNA序列
<400> 183
atggccccaa agaagaagcg gaaggtcggt atccacggag tcccagcagc caagcggaac 60
tacatcctgg gcctggccat cggcatcacc agcgtgggct acggcatcat cgactacgag 120
acacgggacg tgatcgatgc cggcgtgcgg ctgttcaaag aggccaacgt ggaaaacaac 180
gagggcaggc ggagcaagag aggcgccaga aggctgaagc ggcggaggcg gcatagaatc 240
cagagagtga agaagctgct gttcgactac aacctgctga ccgaccacag cgagctgagc 300
ggcatcaacc cctacgaggc cagagtgaag ggcctgagcc agaagctgag cgaggaagag 360
ttctctgccg ccctgctgca cctggccaag agaagaggcg tgcacaacgt gaacgaggtg 420
gaagaggaca ccggcaacga gctgtccacc aaagagcaga tcagccggaa cagcaaggcc 480
ctggaagaga aatacgtggc cgaactgcag ctggaacggc tgaagaaaga cggcgaagtg 540
cggggcagca tcaacagatt caagaccagc gactacgtga aagaagccaa acagctgctg 600
aaggtgcaga aggcctacca ccagctggac cagagcttca tcgacaccta catcgacctg 660
ctggaaaccc ggcggaccta ctatgaggga cctggcgagg gcagcccctt cggctggaag 720
gacatcaaag aatggtacga gatgctgatg ggccactgca cctacttccc cgaggaactg 780
cggagcgtga agtacgccta caacgccgac ctgtacaacg ccctgaacga cctgaacaat 840
ctcgtgatca ccagggacga gaacgagaag ctggaatatt acgagaagtt ccagatcatc 900
gagaacgtgt tcaagcagaa gaagaagccc accctgaagc agatcgccaa agaaatcctc 960
gtgaacgaag aggatattaa gggctacaga gtgaccagca ccggcaagcc cgagttcacc 1020
aacctgaagg tgtaccacga catcaaggac attaccgccc ggaaagagat tattgagaac 1080
gccgagctgc tggatcagat tgccaagatc ctgaccatct accagagcag cgaggacatc 1140
caggaagaac tgaccaatct gaactccgag ctgacccagg aagagatcga gcagatctct 1200
aatctgaagg gctataccgg cacccacaac ctgagcctga aggccatcaa cctgatcctg 1260
gacgagctgt ggcacaccaa cgacaaccag atcgctatct tcaaccggct gaagctggtg 1320
cccaagaagg tggacctgtc ccagcagaaa gagatcccca ccaccctggt ggacgacttc 1380
atcctgagcc ccgtcgtgaa gagaagcttc atccagagca tcaaagtgat caacgccatc 1440
atcaagaagt acggcctgcc caacgacatc attatcgagc tggcccgcga gaagaactcc 1500
aaggacgccc agaaaatgat caacgagatg cagaagcgga accggcagac caacgagcgg 1560
atcgaggaaa tcatccggac caccggcaaa gagaacgcca agtacctgat cgagaagatc 1620
aagctgcacg acatgcagga aggcaagtgc ctgtacagcc tggaagccat ccctctggaa 1680
gatctgctga acaacccctt caactatgag gtggaccaca tcatccccag aagcgtgtcc 1740
ttcgacaaca gcttcaacaa caaggtgctc gtgaagcagg aagaagccag caagaagggc 1800
aaccggaccc cattccagta cctgagcagc agcgacagca agatcagcta cgaaaccttc 1860
aagaagcaca tcctgaatct ggccaagggc aagggcagaa tcagcaagac caagaaagag 1920
tatctgctgg aagaacggga catcaacagg ttctccgtgc agaaagactt catcaaccgg 1980
aacctggtgg ataccagata cgccaccaga ggcctgatga acctgctgcg gagctacttc 2040
agagtgaaca acctggacgt gaaagtgaag tccatcaatg gcggcttcac cagctttctg 2100
cggcggaagt ggaagtttaa gaaagagcgg aacaaggggt acaagcacca cgccgaggac 2160
gccctgatca ttgccaacgc cgatttcatc ttcaaagagt ggaagaaact ggacaaggcc 2220
aaaaaagtga tggaaaacca gatgttcgag gaaaagcagg ccgagagcat gcccgagatc 2280
gaaaccgagc aggagtacaa agagatcttc atcacccccc accagatcaa gcacattaag 2340
gacttcaagg actacaagta cagccaccgg gtggacaaga agcctaatag agagctgatt 2400
aacgacaccc tgtactccac ccggaaggac gacaagggca acaccctgat cgtgaacaat 2460
ctgaacggcc tgtacgacaa ggacaatgac aagctgaaaa agctgatcaa caagagcccc 2520
gaaaagctgc tgatgtacca ccacgacccc cagacctacc agaaactgaa gctgattatg 2580
gaacagtacg gcgacgagaa gaatcccctg tacaagtact acgaggaaac cgggaactac 2640
ctgaccaagt actccaaaaa ggacaacggc cccgtgatca agaagattaa gtattacggc 2700
aacaaactga acgcccatct ggacatcacc gacgactacc ccaacagcag aaacaaggtc 2760
gtgaagctgt ccctgaagcc ctacagattc gacgtgtacc tggacaatgg cgtgtacaag 2820
ttcgtgaccg tgaagaatct ggatgtgatc aaaaaagaaa actactacga agtgaatagc 2880
aagtgctatg aggaagctaa gaagctgaag aagatcagca accaggccga gtttatcgcc 2940
tccttctaca acaacgatct gatcaagatc aacggcgagc tgtatagagt gatcggcgtg 3000
aacaacgacc tgctgaaccg gatcgaagtg aacatgatcg acatcaccta ccgcgagtac 3060
ctggaaaaca tgaacgacaa gaggcccccc aggatcatta agacaatcgc ctccaagacc 3120
cagagcatta agaagtacag cacagacatt ctgggcaacc tgtatgaagt gaaatctaag 3180
aagcaccctc agatcatcaa aaagggcaaa aggccggcgg ccacgaaaaa ggccggccag 3240
gcaaaaaaga aaaagtctag agatgcttta gacgattttg acttagatat gcttggttca 3300
gacgcgttag acgacttcga cctagacatg ttaggctcag atgcattgga cgacttcgat 3360
ttagatatgt tgggctccga tgccctagat gactttgatt tggatatgct aagttccgga 3420
tctccgaaaa agaaacgcaa agttggtagc ccttcagggc agatcagcaa ccaggccctg 3480
gctctggccc ctagctccgc tccagtgctg gcccagacta tggtgccctc tagtgctatg 3540
gtgcctctgg cccagccacc tgctccagcc cctgtgctga ccccaggacc accccagtca 3600
ctgagcgctc cagtgcccaa gtctacacag gccggcgagg ggactctgag tgaagctctg 3660
ctgcacctgc agttcgacgc tgatgaggac ctgggagctc tgctggggaa cagcaccgat 3720
cccggagtgt tcacagacct ggcctccgtg gacaactctg agtttcagca gctgctgaat 3780
cagggcgtgt ccatgtctca tagtacagcc gaaccaatgc tgatggagta ccccgaagcc 3840
attacccggc tggtgaccgg cagccagcgg ccccccgacc ccgctccaac tcccctggga 3900
accagcggcc tgcctaatgg gctgtccgga gatgaagact tctcaagcat cgctgatatg 3960
gactttagtg ccctgctgtc acagatttcc tctagtgggc agggaggagg tggaagcggc 4020
ttcagcgtgg acaccagtgc cctgctggac ctgttcagcc cctcggtgac cgtgcccgac 4080
atgagcctgc ctgaccttga cagcagcctg gccagtatcc aagagctcct gtctccccag 4140
gagcccccca ggcctcccga ggcagagaac agcagcccgg attcagggaa gcagctggtg 4200
cactacacag cgcagccgct gttcctgctg gaccccggct ccgtggacac cgggagcaac 4260
gacctgccgg tgctgtttga gctgggagag ggctcctact tctccgaagg ggacggcttc 4320
gccgaggacc ccaccatctc cctgctgaca ggctcggagc ctcccaaagc caaggacccc 4380
actgtctcct ga 4392
<210> 184
<211> 4821
<212> DNA
<213> 人工序列
<220>
<223> 编码dSaCas9(D10A, N580A)-VPR的DNA序列
<400> 184
atggccccaa agaagaagcg gaaggtcggt atccacggag tcccagcagc caagcggaac 60
tacatcctgg gcctggccat cggcatcacc agcgtgggct acggcatcat cgactacgag 120
acacgggacg tgatcgatgc cggcgtgcgg ctgttcaaag aggccaacgt ggaaaacaac 180
gagggcaggc ggagcaagag aggcgccaga aggctgaagc ggcggaggcg gcatagaatc 240
cagagagtga agaagctgct gttcgactac aacctgctga ccgaccacag cgagctgagc 300
ggcatcaacc cctacgaggc cagagtgaag ggcctgagcc agaagctgag cgaggaagag 360
ttctctgccg ccctgctgca cctggccaag agaagaggcg tgcacaacgt gaacgaggtg 420
gaagaggaca ccggcaacga gctgtccacc aaagagcaga tcagccggaa cagcaaggcc 480
ctggaagaga aatacgtggc cgaactgcag ctggaacggc tgaagaaaga cggcgaagtg 540
cggggcagca tcaacagatt caagaccagc gactacgtga aagaagccaa acagctgctg 600
aaggtgcaga aggcctacca ccagctggac cagagcttca tcgacaccta catcgacctg 660
ctggaaaccc ggcggaccta ctatgaggga cctggcgagg gcagcccctt cggctggaag 720
gacatcaaag aatggtacga gatgctgatg ggccactgca cctacttccc cgaggaactg 780
cggagcgtga agtacgccta caacgccgac ctgtacaacg ccctgaacga cctgaacaat 840
ctcgtgatca ccagggacga gaacgagaag ctggaatatt acgagaagtt ccagatcatc 900
gagaacgtgt tcaagcagaa gaagaagccc accctgaagc agatcgccaa agaaatcctc 960
gtgaacgaag aggatattaa gggctacaga gtgaccagca ccggcaagcc cgagttcacc 1020
aacctgaagg tgtaccacga catcaaggac attaccgccc ggaaagagat tattgagaac 1080
gccgagctgc tggatcagat tgccaagatc ctgaccatct accagagcag cgaggacatc 1140
caggaagaac tgaccaatct gaactccgag ctgacccagg aagagatcga gcagatctct 1200
aatctgaagg gctataccgg cacccacaac ctgagcctga aggccatcaa cctgatcctg 1260
gacgagctgt ggcacaccaa cgacaaccag atcgctatct tcaaccggct gaagctggtg 1320
cccaagaagg tggacctgtc ccagcagaaa gagatcccca ccaccctggt ggacgacttc 1380
atcctgagcc ccgtcgtgaa gagaagcttc atccagagca tcaaagtgat caacgccatc 1440
atcaagaagt acggcctgcc caacgacatc attatcgagc tggcccgcga gaagaactcc 1500
aaggacgccc agaaaatgat caacgagatg cagaagcgga accggcagac caacgagcgg 1560
atcgaggaaa tcatccggac caccggcaaa gagaacgcca agtacctgat cgagaagatc 1620
aagctgcacg acatgcagga aggcaagtgc ctgtacagcc tggaagccat ccctctggaa 1680
gatctgctga acaacccctt caactatgag gtggaccaca tcatccccag aagcgtgtcc 1740
ttcgacaaca gcttcaacaa caaggtgctc gtgaagcagg aagaagccag caagaagggc 1800
aaccggaccc cattccagta cctgagcagc agcgacagca agatcagcta cgaaaccttc 1860
aagaagcaca tcctgaatct ggccaagggc aagggcagaa tcagcaagac caagaaagag 1920
tatctgctgg aagaacggga catcaacagg ttctccgtgc agaaagactt catcaaccgg 1980
aacctggtgg ataccagata cgccaccaga ggcctgatga acctgctgcg gagctacttc 2040
agagtgaaca acctggacgt gaaagtgaag tccatcaatg gcggcttcac cagctttctg 2100
cggcggaagt ggaagtttaa gaaagagcgg aacaaggggt acaagcacca cgccgaggac 2160
gccctgatca ttgccaacgc cgatttcatc ttcaaagagt ggaagaaact ggacaaggcc 2220
aaaaaagtga tggaaaacca gatgttcgag gaaaagcagg ccgagagcat gcccgagatc 2280
gaaaccgagc aggagtacaa agagatcttc atcacccccc accagatcaa gcacattaag 2340
gacttcaagg actacaagta cagccaccgg gtggacaaga agcctaatag agagctgatt 2400
aacgacaccc tgtactccac ccggaaggac gacaagggca acaccctgat cgtgaacaat 2460
ctgaacggcc tgtacgacaa ggacaatgac aagctgaaaa agctgatcaa caagagcccc 2520
gaaaagctgc tgatgtacca ccacgacccc cagacctacc agaaactgaa gctgattatg 2580
gaacagtacg gcgacgagaa gaatcccctg tacaagtact acgaggaaac cgggaactac 2640
ctgaccaagt actccaaaaa ggacaacggc cccgtgatca agaagattaa gtattacggc 2700
aacaaactga acgcccatct ggacatcacc gacgactacc ccaacagcag aaacaaggtc 2760
gtgaagctgt ccctgaagcc ctacagattc gacgtgtacc tggacaatgg cgtgtacaag 2820
ttcgtgaccg tgaagaatct ggatgtgatc aaaaaagaaa actactacga agtgaatagc 2880
aagtgctatg aggaagctaa gaagctgaag aagatcagca accaggccga gtttatcgcc 2940
tccttctaca acaacgatct gatcaagatc aacggcgagc tgtatagagt gatcggcgtg 3000
aacaacgacc tgctgaaccg gatcgaagtg aacatgatcg acatcaccta ccgcgagtac 3060
ctggaaaaca tgaacgacaa gaggcccccc aggatcatta agacaatcgc ctccaagacc 3120
cagagcatta agaagtacag cacagacatt ctgggcaacc tgtatgaagt gaaatctaag 3180
aagcaccctc agatcatcaa aaagggcaaa aggccggcgg ccacgaaaaa ggccggccag 3240
gcaaaaaaga aaaagtctag agatgcttta gacgattttg acttagatat gcttggttca 3300
gacgcgttag acgacttcga cctagacatg ttaggctcag atgcattgga cgacttcgat 3360
ttagatatgt tgggctccga tgccctagat gactttgatt tggatatgct aagttccgga 3420
tctccgaaaa agaaacgcaa agttggtagc cagtacctgc ccgacaccga cgaccggcac 3480
cggatcgagg aaaagcggaa gcggacctac gagacattca agagcatcat gaagaagtcc 3540
cccttcagcg gccccaccga ccctagacct ccacctagaa gaatcgccgt gcccagcaga 3600
tccagcgcca gcgtgccaaa acctgccccc cagccttacc ccttcaccag cagcctgagc 3660
accatcaact acgacgagtt ccctaccatg gtgttcccca gcggccagat ctctcaggcc 3720
tctgctctgg ctccagcccc tcctcaggtg ctgcctcagg ctcctgctcc tgcaccagct 3780
ccagccatgg tgtctgcact ggctcaggca ccagcacccg tgcctgtgct ggctcctgga 3840
cctccacagg ctgtggctcc accagcccct aaacctacac aggccggcga gggcacactg 3900
tctgaagctc tgctgcagct gcagttcgac gacgaggatc tgggagccct gctgggaaac 3960
agcaccgatc ctgccgtgtt caccgacctg gccagcgtgg acaacagcga gttccagcag 4020
ctgctgaacc agggcatccc tgtggcccct cacaccaccg agcccatgct gatggaatac 4080
cccgaggcca tcacccggct cgtgacaggc gctcagaggc ctcctgatcc agctcctgcc 4140
cctctgggag caccaggcct gcctaatgga ctgctgtctg gcgacgagga cttcagctct 4200
atcgccgata tggatttctc agccttgctg ggctctggca gcggcagccg ggattccagg 4260
gaagggatgt ttttgccgaa gcctgaggcc ggctccgcta ttagtgacgt gtttgagggc 4320
cgcgaggtgt gccagccaaa acgaatccgg ccatttcatc ctccaggaag tccatgggcc 4380
aaccgcccac tccccgccag cctcgcacca acaccaaccg gtccagtaca tgagccagtc 4440
gggtcactga ccccggcacc agtccctcag ccactcgatc cagcgcccgc agtgactccc 4500
gaggccagtc acctgttgga agatcccgat gaagagacca gccaggctgt caaagccctt 4560
cgggagatgg ccgatactgt gattccccag aaggaagagg ctgcaatctg tggccaaatg 4620
gacctttccc atccgccccc aaggggccat ctggatgagc tgacaaccac acttgagtcc 4680
atgaccgagg atctgaacct ggactcaccc ctgaccccgg aattgaacga gattctggat 4740
accttcctga acgacgagtg cctcttgcat gccatgcata tcagcacagg actgtccatc 4800
ttcgacacat ctctgttttg a 4821
<210> 185
<211> 3726
<212> DNA
<213> 人工序列
<220>
<223> 编码具有SGGGS连接子的dSaCas9[-25](D10A, N580A)-miniVR的DNA序列
<400> 185
atggccccaa agaagaagcg gaaggtcggt atccacggag tcccagcagc caagcggaac 60
tacatcctgg gcctggccat cggcatcacc agcgtgggct acggcatcat cgactacgag 120
acacgggacg tgatcgatgc cggcgtgcgg ctgttcaaag aggccaacgt ggaaaacaac 180
gagggcaggc ggagcaagag aggcgccaga aggctgaagc ggcggaggcg gcatagaatc 240
cagagagtga agaagctgct gttcgactac aacctgctga ccgaccacag cgagctgagc 300
ggcatcaacc cctacgaggc cagagtgaag ggcctgagcc agaagctgag cgaggaagag 360
ttctctgccg ccctgctgca cctggccaag agaagaggcg tgcacaacgt gaacgaggtg 420
gaagaggaca ccggcaacga gctgtccacc aaagagcaga tcagccggaa cagcaaggcc 480
ctggaagaga aatacgtggc cgaactgcag ctggaacggc tgaagaaaga cggcgaagtg 540
cggggcagca tcaacagatt caagaccagc gactacgtga aagaagccaa acagctgctg 600
aaggtgcaga aggcctacca ccagctggac cagagcttca tcgacaccta catcgacctg 660
ctggaaaccc ggcggaccta ctatgaggga cctggcgagg gcagcccctt cggctggaag 720
gacatcaaag aatggtacga gatgctgatg ggccactgca cctacttccc cgaggaactg 780
cggagcgtga agtacgccta caacgccgac ctgtacaacg ccctgaacga cctgaacaat 840
ctcgtgatca ccagggacga gaacgagaag ctggaatatt acgagaagtt ccagatcatc 900
gagaacgtgt tcaagcagaa gaagaagccc accctgaagc agatcgccaa agaaatcctc 960
gtgaacgaag aggatattaa gggctacaga gtgaccagca ccggcaagcc cgagttcacc 1020
aacctgaagg tgtaccacga catcaaggac attaccgccc ggaaagagat tattgagaac 1080
gccgagctgc tggatcagat tgccaagatc ctgaccatct accagagcag cgaggacatc 1140
caggaagaac tgaccaatct gaactccgag ctgacccagg aagagatcga gcagatctct 1200
aatctgaagg gctataccgg cacccacaac ctgagcctga aggccatcaa cctgatcctg 1260
gacgagctgt ggcacaccaa cgacaaccag atcgctatct tcaaccggct gaagctggtg 1320
cccaagaagg tggacctgtc ccagcagaaa gagatcccca ccaccctggt ggacgacttc 1380
atcctgagcc ccgtcgtgaa gagaagcttc atccagagca tcaaagtgat caacgccatc 1440
atcaagaagt acggcctgcc caacgacatc attatcgagc tggcccgcga gaagaactcc 1500
aaggacgccc agaaaatgat caacgagatg cagaagcgga accggcagac caacgagcgg 1560
atcgaggaaa tcatccggac caccggcaaa gagaacgcca agtacctgat cgagaagatc 1620
aagctgcacg acatgcagga aggcaagtgc ctgtacagcc tggaagccat ccctctggaa 1680
gatctgctga acaacccctt caactatgag gtggaccaca tcatccccag aagcgtgtcc 1740
ttcgacaaca gcttcaacaa caaggtgctc gtgaagcagg aagaagccag caagaagggc 1800
aaccggaccc cattccagta cctgagcagc agcgacagca agatcagcta cgaaaccttc 1860
aagaagcaca tcctgaatct ggccaagggc aagggcagaa tcagcaagac caagaaagag 1920
tatctgctgg aagaacggga catcaacagg ttctccgtgc agaaagactt catcaaccgg 1980
aacctggtgg ataccagata cgccaccaga ggcctgatga acctgctgcg gagctacttc 2040
agagtgaaca acctggacgt gaaagtgaag tccatcaatg gcggcttcac cagctttctg 2100
cggcggaagt ggaagtttaa gaaagagcgg aacaaggggt acaagcacca cgccgaggac 2160
gccctgatca ttgccaacgc cgatttcatc ttcaaagagt ggaagaaatc cggcggcggt 2220
tcgaccgagc aggagtacaa agagatcttc atcacccccc accagatcaa gcacattaag 2280
gacttcaagg actacaagta cagccaccgg gtggacaaga agcctaatag agagctgatt 2340
aacgacaccc tgtactccac ccggaaggac gacaagggca acaccctgat cgtgaacaat 2400
ctgaacggcc tgtacgacaa ggacaatgac aagctgaaaa agctgatcaa caagagcccc 2460
gaaaagctgc tgatgtacca ccacgacccc cagacctacc agaaactgaa gctgattatg 2520
gaacagtacg gcgacgagaa gaatcccctg tacaagtact acgaggaaac cgggaactac 2580
ctgaccaagt actccaaaaa ggacaacggc cccgtgatca agaagattaa gtattacggc 2640
aacaaactga acgcccatct ggacatcacc gacgactacc ccaacagcag aaacaaggtc 2700
gtgaagctgt ccctgaagcc ctacagattc gacgtgtacc tggacaatgg cgtgtacaag 2760
ttcgtgaccg tgaagaatct ggatgtgatc aaaaaagaaa actactacga agtgaatagc 2820
aagtgctatg aggaagctaa gaagctgaag aagatcagca accaggccga gtttatcgcc 2880
tccttctaca acaacgatct gatcaagatc aacggcgagc tgtatagagt gatcggcgtg 2940
aacaacgacc tgctgaaccg gatcgaagtg aacatgatcg acatcaccta ccgcgagtac 3000
ctggaaaaca tgaacgacaa gaggcccccc aggatcatta agacaatcgc ctccaagacc 3060
cagagcatta agaagtacag cacagacatt ctgggcaacc tgtatgaagt gaaatctaag 3120
aagcaccctc agatcatcaa aaagggcaaa aggccggcgg ccacgaaaaa ggccggccag 3180
gcaaaaaaga aaaagggatc cggtgctaga aagcttgatg ctttagacga ttttgactta 3240
gatatgcttg gttcagacgc gttagacgac ttcgacctag acatgttagg ctcagatgca 3300
ttggacgact tcgatttaga tatgttgggc tccgatgccc tagatgactt tgatttggat 3360
atgctaggat ctggtagccc agcgcccgca gtgactcccg aggccagtca cctgttggaa 3420
gatcccgatg aagaaaccag ccaggctgtc aaagcccttc gggagatggc cgatactgtg 3480
attccccaga aggaagaggc tgcaatctgt ggccaaatgg acctttccca tccgccccca 3540
aggggccatc tggatgagct gacaaccaca cttgagtcca tgaccgagga tctgaacctg 3600
gactcacccc tgaccccgga attgaacgag attctggata ccttcctgaa cgacgagtgc 3660
ctcttgcatg ccatgcatat cagcacagga ctgtccatct tcgacacatc tctgtttgtc 3720
gactga 3726
<210> 186
<211> 1241
<212> PRT
<213> 人工序列
<220>
<223> 具有SGGGS连接子的dSaCas9[-25](D10A和N580A)-miniVR
<220>
<221> 信号
<222> (1)..(17)
<223> 核定位信号
<220>
<221> 肽
<222> (18)..(1049)
<223> 具有SGGGS连接子的dSaCas9[-25](D10A和N580A)
<220>
<221> 变体
<222> (26)..(26)
<223> Asp残基转化成Ala残基
<220>
<221> 变体
<222> (596)..(596)
<223> Asn残基转化成Ala残基
<220>
<221> 肽
<222> (737)..(741)
<223> SGGGS连接子
<220>
<221> 信号
<222> (1050)..(1068)
<223> 核定位信号
<220>
<221> 肽
<222> (1073)..(1239)
<223> miniVR
<400> 186
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val
20 25 30
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
35 40 45
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
50 55 60
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
65 70 75 80
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
85 90 95
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
100 105 110
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
115 120 125
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
130 135 140
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
145 150 155 160
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
165 170 175
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
180 185 190
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
195 200 205
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
210 215 220
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
225 230 235 240
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
245 250 255
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
260 265 270
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
275 280 285
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
290 295 300
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
305 310 315 320
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
325 330 335
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
340 345 350
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
355 360 365
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
370 375 380
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
385 390 395 400
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
405 410 415
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
420 425 430
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
435 440 445
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
450 455 460
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
465 470 475 480
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
485 490 495
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
500 505 510
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
515 520 525
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
530 535 540
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
545 550 555 560
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro
565 570 575
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
580 585 590
Gln Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
595 600 605
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
610 615 620
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
625 630 635 640
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
645 650 655
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
660 665 670
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
675 680 685
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
690 695 700
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
705 710 715 720
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
725 730 735
Ser Gly Gly Gly Ser Thr Glu Gln Glu Tyr Lys Glu Ile Phe Ile Thr
740 745 750
Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr Lys Tyr Ser
755 760 765
His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn Asp Thr Leu
770 775 780
Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile Val Asn Asn
785 790 795 800
Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys Lys Leu Ile
805 810 815
Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp Pro Gln Thr
820 825 830
Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp Glu Lys Asn
835 840 845
Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu Thr Lys Tyr
850 855 860
Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly
865 870 875 880
Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser
885 890 895
Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val
900 905 910
Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp
915 920 925
Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu
930 935 940
Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala
945 950 955 960
Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr Arg
965 970 975
Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val Asn Met
980 985 990
Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn Asp Lys Arg
995 1000 1005
Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr Gln Ser Ile
1010 1015 1020
Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr Glu Val Lys
1025 1030 1035
Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly Lys Arg Pro Ala
1040 1045 1050
Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Gly
1055 1060 1065
Ala Arg Lys Leu Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
1070 1075 1080
Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser
1085 1090 1095
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala
1100 1105 1110
Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Gly Ser Pro Ala
1115 1120 1125
Pro Ala Val Thr Pro Glu Ala Ser His Leu Leu Glu Asp Pro Asp
1130 1135 1140
Glu Glu Thr Ser Gln Ala Val Lys Ala Leu Arg Glu Met Ala Asp
1145 1150 1155
Thr Val Ile Pro Gln Lys Glu Glu Ala Ala Ile Cys Gly Gln Met
1160 1165 1170
Asp Leu Ser His Pro Pro Pro Arg Gly His Leu Asp Glu Leu Thr
1175 1180 1185
Thr Thr Leu Glu Ser Met Thr Glu Asp Leu Asn Leu Asp Ser Pro
1190 1195 1200
Leu Thr Pro Glu Leu Asn Glu Ile Leu Asp Thr Phe Leu Asn Asp
1205 1210 1215
Glu Cys Leu Leu His Ala Met His Ile Ser Thr Gly Leu Ser Ile
1220 1225 1230
Phe Asp Thr Ser Leu Phe Val Asp
1235 1240
<210> 187
<211> 256
<212> DNA
<213> 人工序列
<220>
<223> EFS启动子序列
<400> 187
taggtcttga aaggagtggg aattggctcc ggtgcccgtc agtgggcaga gcgcacatcg 60
cccacagtcc ccgagaagtt ggggggaggg gtcggcaatt gatccggtgc ctagagaagg 120
tggcgcgggg taaactggga aagtgatgtc gtgtactggc tccgcctttt tcccgagggt 180
gggggagaac cgtatataag tgcagtagtc gccgtgaacg ttctttttcg caacgggttt 240
gccgccagaa cacagg 256
<210> 188
<211> 1137
<212> PRT
<213> 人工序列
<220>
<223> dSaCas9(D10A和N580A)-VP64
<220>
<221> 信号
<222> (1)..(17)
<223> 核定位信号
<220>
<221> 肽
<222> (18)..(1069)
<223> dSaCas9(D10A和N580A)
<220>
<221> 变体
<222> (26)..(26)
<223> Asp残基转化成Ala残基
<220>
<221> 变体
<222> (596)..(596)
<223> Asn残基转化成Ala残基
<220>
<221> 信号
<222> (1070)..(1085)
<223> 核定位信号
<220>
<221> 肽
<222> (1088)..(1137)
<223> VP64
<400> 188
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val
20 25 30
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
35 40 45
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
50 55 60
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
65 70 75 80
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
85 90 95
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
100 105 110
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
115 120 125
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
130 135 140
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
145 150 155 160
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
165 170 175
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
180 185 190
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
195 200 205
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
210 215 220
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
225 230 235 240
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
245 250 255
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
260 265 270
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
275 280 285
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
290 295 300
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
305 310 315 320
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
325 330 335
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
340 345 350
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
355 360 365
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
370 375 380
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
385 390 395 400
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
405 410 415
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
420 425 430
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
435 440 445
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
450 455 460
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
465 470 475 480
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
485 490 495
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
500 505 510
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
515 520 525
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
530 535 540
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
545 550 555 560
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro
565 570 575
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
580 585 590
Gln Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
595 600 605
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
610 615 620
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
625 630 635 640
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
645 650 655
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
660 665 670
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
675 680 685
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
690 695 700
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
705 710 715 720
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
725 730 735
Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys
740 745 750
Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu
755 760 765
Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp
770 775 780
Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile
785 790 795 800
Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu
805 810 815
Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu
820 825 830
Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His
835 840 845
Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly
850 855 860
Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr
865 870 875 880
Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile
885 890 895
Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp
900 905 910
Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr
915 920 925
Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val
930 935 940
Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser
945 950 955 960
Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala
965 970 975
Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly
980 985 990
Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile
995 1000 1005
Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn
1010 1015 1020
Met Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser
1025 1030 1035
Lys Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn
1040 1045 1050
Leu Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys
1055 1060 1065
Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys
1070 1075 1080
Lys Lys Ser Arg Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
1085 1090 1095
Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser
1100 1105 1110
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala
1115 1120 1125
Leu Asp Asp Phe Asp Leu Asp Met Leu
1130 1135
<210> 189
<211> 1463
<212> PRT
<213> 人工序列
<220>
<223> dSaCas9(D10A和N580A)-VPH
<220>
<221> 信号
<222> (1)..(17)
<223> 核定位信号
<220>
<221> 肽
<222> (18)..(1069)
<223> dSaCas9(D10A和N580A)
<220>
<221> 变体
<222> (26)..(26)
<223> Asp残基转化成Ala残基
<220>
<221> 变体
<222> (596)..(596)
<223> Asp残基转化成Ala残基
<220>
<221> 信号
<222> (1070)..(1085)
<223> 核定位信号
<220>
<221> 肽
<222> (1088)..(1463)
<223> VPH
<400> 189
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val
20 25 30
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
35 40 45
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
50 55 60
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
65 70 75 80
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
85 90 95
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
100 105 110
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
115 120 125
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
130 135 140
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
145 150 155 160
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
165 170 175
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
180 185 190
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
195 200 205
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
210 215 220
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
225 230 235 240
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
245 250 255
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
260 265 270
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
275 280 285
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
290 295 300
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
305 310 315 320
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
325 330 335
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
340 345 350
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
355 360 365
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
370 375 380
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
385 390 395 400
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
405 410 415
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
420 425 430
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
435 440 445
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
450 455 460
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
465 470 475 480
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
485 490 495
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
500 505 510
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
515 520 525
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
530 535 540
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
545 550 555 560
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro
565 570 575
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
580 585 590
Gln Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
595 600 605
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
610 615 620
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
625 630 635 640
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
645 650 655
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
660 665 670
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
675 680 685
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
690 695 700
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
705 710 715 720
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
725 730 735
Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys
740 745 750
Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu
755 760 765
Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp
770 775 780
Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile
785 790 795 800
Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu
805 810 815
Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu
820 825 830
Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His
835 840 845
Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly
850 855 860
Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr
865 870 875 880
Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile
885 890 895
Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp
900 905 910
Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr
915 920 925
Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val
930 935 940
Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser
945 950 955 960
Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala
965 970 975
Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly
980 985 990
Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile
995 1000 1005
Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn
1010 1015 1020
Met Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser
1025 1030 1035
Lys Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn
1040 1045 1050
Leu Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys
1055 1060 1065
Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys
1070 1075 1080
Lys Lys Ser Arg Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
1085 1090 1095
Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser
1100 1105 1110
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala
1115 1120 1125
Leu Asp Asp Phe Asp Leu Asp Met Leu Ser Ser Gly Ser Pro Lys
1130 1135 1140
Lys Lys Arg Lys Val Gly Ser Pro Ser Gly Gln Ile Ser Asn Gln
1145 1150 1155
Ala Leu Ala Leu Ala Pro Ser Ser Ala Pro Val Leu Ala Gln Thr
1160 1165 1170
Met Val Pro Ser Ser Ala Met Val Pro Leu Ala Gln Pro Pro Ala
1175 1180 1185
Pro Ala Pro Val Leu Thr Pro Gly Pro Pro Gln Ser Leu Ser Ala
1190 1195 1200
Pro Val Pro Lys Ser Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu
1205 1210 1215
Ala Leu Leu His Leu Gln Phe Asp Ala Asp Glu Asp Leu Gly Ala
1220 1225 1230
Leu Leu Gly Asn Ser Thr Asp Pro Gly Val Phe Thr Asp Leu Ala
1235 1240 1245
Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Val
1250 1255 1260
Ser Met Ser His Ser Thr Ala Glu Pro Met Leu Met Glu Tyr Pro
1265 1270 1275
Glu Ala Ile Thr Arg Leu Val Thr Gly Ser Gln Arg Pro Pro Asp
1280 1285 1290
Pro Ala Pro Thr Pro Leu Gly Thr Ser Gly Leu Pro Asn Gly Leu
1295 1300 1305
Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser
1310 1315 1320
Ala Leu Leu Ser Gln Ile Ser Ser Ser Gly Gln Gly Gly Gly Gly
1325 1330 1335
Ser Gly Phe Ser Val Asp Thr Ser Ala Leu Leu Asp Leu Phe Ser
1340 1345 1350
Pro Ser Val Thr Val Pro Asp Met Ser Leu Pro Asp Leu Asp Ser
1355 1360 1365
Ser Leu Ala Ser Ile Gln Glu Leu Leu Ser Pro Gln Glu Pro Pro
1370 1375 1380
Arg Pro Pro Glu Ala Glu Asn Ser Ser Pro Asp Ser Gly Lys Gln
1385 1390 1395
Leu Val His Tyr Thr Ala Gln Pro Leu Phe Leu Leu Asp Pro Gly
1400 1405 1410
Ser Val Asp Thr Gly Ser Asn Asp Leu Pro Val Leu Phe Glu Leu
1415 1420 1425
Gly Glu Gly Ser Tyr Phe Ser Glu Gly Asp Gly Phe Ala Glu Asp
1430 1435 1440
Pro Thr Ile Ser Leu Leu Thr Gly Ser Glu Pro Pro Lys Ala Lys
1445 1450 1455
Asp Pro Thr Val Ser
1460
<210> 190
<211> 1606
<212> PRT
<213> 人工序列
<220>
<223> dSaCas9(D10A和N580A)-VPR
<220>
<221> 信号
<222> (1)..(17)
<223> 核定位信号
<220>
<221> 肽
<222> (18)..(1069)
<223> dSaCas9(D10A和N580A)
<220>
<221> 变体
<222> (26)..(26)
<223> Asp残基转化成Ala残基
<220>
<221> 变体
<222> (596)..(596)
<223> Asn残基转化成Ala残基
<220>
<221> 信号
<222> (1070)..(1085)
<223> 核定位信号
<220>
<221> 肽
<222> (1088)..(1606)
<223> VPR
<400> 190
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val
20 25 30
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
35 40 45
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
50 55 60
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
65 70 75 80
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
85 90 95
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
100 105 110
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
115 120 125
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
130 135 140
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
145 150 155 160
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
165 170 175
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
180 185 190
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
195 200 205
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
210 215 220
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
225 230 235 240
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
245 250 255
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
260 265 270
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
275 280 285
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
290 295 300
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
305 310 315 320
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
325 330 335
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
340 345 350
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
355 360 365
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
370 375 380
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
385 390 395 400
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
405 410 415
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
420 425 430
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
435 440 445
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
450 455 460
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
465 470 475 480
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
485 490 495
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
500 505 510
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
515 520 525
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
530 535 540
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
545 550 555 560
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro
565 570 575
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
580 585 590
Gln Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
595 600 605
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
610 615 620
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
625 630 635 640
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
645 650 655
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
660 665 670
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
675 680 685
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
690 695 700
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
705 710 715 720
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
725 730 735
Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys
740 745 750
Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu
755 760 765
Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp
770 775 780
Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile
785 790 795 800
Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu
805 810 815
Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu
820 825 830
Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His
835 840 845
Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly
850 855 860
Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr
865 870 875 880
Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile
885 890 895
Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp
900 905 910
Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr
915 920 925
Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val
930 935 940
Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser
945 950 955 960
Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala
965 970 975
Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly
980 985 990
Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile
995 1000 1005
Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn
1010 1015 1020
Met Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser
1025 1030 1035
Lys Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn
1040 1045 1050
Leu Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys
1055 1060 1065
Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys
1070 1075 1080
Lys Lys Ser Arg Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
1085 1090 1095
Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser
1100 1105 1110
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala
1115 1120 1125
Leu Asp Asp Phe Asp Leu Asp Met Leu Ser Ser Gly Ser Pro Lys
1130 1135 1140
Lys Lys Arg Lys Val Gly Ser Gln Tyr Leu Pro Asp Thr Asp Asp
1145 1150 1155
Arg His Arg Ile Glu Glu Lys Arg Lys Arg Thr Tyr Glu Thr Phe
1160 1165 1170
Lys Ser Ile Met Lys Lys Ser Pro Phe Ser Gly Pro Thr Asp Pro
1175 1180 1185
Arg Pro Pro Pro Arg Arg Ile Ala Val Pro Ser Arg Ser Ser Ala
1190 1195 1200
Ser Val Pro Lys Pro Ala Pro Gln Pro Tyr Pro Phe Thr Ser Ser
1205 1210 1215
Leu Ser Thr Ile Asn Tyr Asp Glu Phe Pro Thr Met Val Phe Pro
1220 1225 1230
Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro
1235 1240 1245
Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met
1250 1255 1260
Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala
1265 1270 1275
Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr
1280 1285 1290
Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln
1295 1300 1305
Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp
1310 1315 1320
Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe
1325 1330 1335
Gln Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr
1340 1345 1350
Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val
1355 1360 1365
Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly
1370 1375 1380
Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe
1385 1390 1395
Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Gly Ser Gly
1400 1405 1410
Ser Gly Ser Arg Asp Ser Arg Glu Gly Met Phe Leu Pro Lys Pro
1415 1420 1425
Glu Ala Gly Ser Ala Ile Ser Asp Val Phe Glu Gly Arg Glu Val
1430 1435 1440
Cys Gln Pro Lys Arg Ile Arg Pro Phe His Pro Pro Gly Ser Pro
1445 1450 1455
Trp Ala Asn Arg Pro Leu Pro Ala Ser Leu Ala Pro Thr Pro Thr
1460 1465 1470
Gly Pro Val His Glu Pro Val Gly Ser Leu Thr Pro Ala Pro Val
1475 1480 1485
Pro Gln Pro Leu Asp Pro Ala Pro Ala Val Thr Pro Glu Ala Ser
1490 1495 1500
His Leu Leu Glu Asp Pro Asp Glu Glu Thr Ser Gln Ala Val Lys
1505 1510 1515
Ala Leu Arg Glu Met Ala Asp Thr Val Ile Pro Gln Lys Glu Glu
1520 1525 1530
Ala Ala Ile Cys Gly Gln Met Asp Leu Ser His Pro Pro Pro Arg
1535 1540 1545
Gly His Leu Asp Glu Leu Thr Thr Thr Leu Glu Ser Met Thr Glu
1550 1555 1560
Asp Leu Asn Leu Asp Ser Pro Leu Thr Pro Glu Leu Asn Glu Ile
1565 1570 1575
Leu Asp Thr Phe Leu Asn Asp Glu Cys Leu Leu His Ala Met His
1580 1585 1590
Ile Ser Thr Gly Leu Ser Ile Phe Asp Thr Ser Leu Phe
1595 1600 1605
<210> 191
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> CK8启动子序列
<400> 191
ctagactagc atgctgccca tgtaaggagg caaggcctgg ggacacccga gatgcctggt 60
tataattaac ccagacatgt ggctgccccc ccccccccaa cacctgctgc ctctaaaaat 120
aaccctgcat gccatgttcc cggcgaaggg ccagctgtcc cccgccagct agactcagca 180
cttagtttag gaaccagtga gcaagtcagc ccttggggca gcccatacaa ggccatgggg 240
ctgggcaagc tgcacgcctg ggtccggggt gggcacggtg cccgggcaac gagctgaaag 300
ctcatctgct ctcaggggcc cctccctggg gacagcccct cctggctagt cacaccctgt 360
aggctcctct atataaccca ggggcacagg ggctgccctc attctaccac cacctccaca 420
gcacagacag acactcagga gccagccagc 450
<210> 192
<211> 3762
<212> DNA
<213> 人工序列
<220>
<223> 编码dSaCas9(D10A, N580A)-miniVR的DNA序列
<400> 192
atggccccaa agaagaagcg gaaggtcggt atccacggag tcccagcagc caagcggaac 60
tacatcctgg gcctggccat cggcatcacc agcgtgggct acggcatcat cgactacgag 120
acacgggacg tgatcgatgc cggcgtgcgg ctgttcaaag aggccaacgt ggaaaacaac 180
gagggcaggc ggagcaagag aggcgccaga aggctgaagc ggcggaggcg gcatagaatc 240
cagagagtga agaagctgct gttcgactac aacctgctga ccgaccacag cgagctgagc 300
ggcatcaacc cctacgaggc cagagtgaag ggcctgagcc agaagctgag cgaggaagag 360
ttctctgccg ccctgctgca cctggccaag agaagaggcg tgcacaacgt gaacgaggtg 420
gaagaggaca ccggcaacga gctgtccacc aaagagcaga tcagccggaa cagcaaggcc 480
ctggaagaga aatacgtggc cgaactgcag ctggaacggc tgaagaaaga cggcgaagtg 540
cggggcagca tcaacagatt caagaccagc gactacgtga aagaagccaa acagctgctg 600
aaggtgcaga aggcctacca ccagctggac cagagcttca tcgacaccta catcgacctg 660
ctggaaaccc ggcggaccta ctatgaggga cctggcgagg gcagcccctt cggctggaag 720
gacatcaaag aatggtacga gatgctgatg ggccactgca cctacttccc cgaggaactg 780
cggagcgtga agtacgccta caacgccgac ctgtacaacg ccctgaacga cctgaacaat 840
ctcgtgatca ccagggacga gaacgagaag ctggaatatt acgagaagtt ccagatcatc 900
gagaacgtgt tcaagcagaa gaagaagccc accctgaagc agatcgccaa agaaatcctc 960
gtgaacgaag aggatattaa gggctacaga gtgaccagca ccggcaagcc cgagttcacc 1020
aacctgaagg tgtaccacga catcaaggac attaccgccc ggaaagagat tattgagaac 1080
gccgagctgc tggatcagat tgccaagatc ctgaccatct accagagcag cgaggacatc 1140
caggaagaac tgaccaatct gaactccgag ctgacccagg aagagatcga gcagatctct 1200
aatctgaagg gctataccgg cacccacaac ctgagcctga aggccatcaa cctgatcctg 1260
gacgagctgt ggcacaccaa cgacaaccag atcgctatct tcaaccggct gaagctggtg 1320
cccaagaagg tggacctgtc ccagcagaaa gagatcccca ccaccctggt ggacgacttc 1380
atcctgagcc ccgtcgtgaa gagaagcttc atccagagca tcaaagtgat caacgccatc 1440
atcaagaagt acggcctgcc caacgacatc attatcgagc tggcccgcga gaagaactcc 1500
aaggacgccc agaaaatgat caacgagatg cagaagcgga accggcagac caacgagcgg 1560
atcgaggaaa tcatccggac caccggcaaa gagaacgcca agtacctgat cgagaagatc 1620
aagctgcacg acatgcagga aggcaagtgc ctgtacagcc tggaagccat ccctctggaa 1680
gatctgctga acaacccctt caactatgag gtggacgcca tcatccccag aagcgtgtcc 1740
ttcgacaaca gcttcaacaa caaggtgctc gtgaagcagg aagaagccag caagaagggc 1800
aaccggaccc cattccagta cctgagcagc agcgacagca agatcagcta cgaaaccttc 1860
aagaagcaca tcctgaatct ggccaagggc aagggcagaa tcagcaagac caagaaagag 1920
tatctgctgg aagaacggga catcaacagg ttctccgtgc agaaagactt catcaaccgg 1980
aacctggtgg ataccagata cgccaccaga ggcctgatga acctgctgcg gagctacttc 2040
agagtgaaca acctggacgt gaaagtgaag tccatcaatg gcggcttcac cagctttctg 2100
cggcggaagt ggaagtttaa gaaagagcgg aacaaggggt acaagcacca cgccgaggac 2160
gccctgatca ttgccaacgc cgatttcatc ttcaaagagt ggaagaaact ggacaaggcc 2220
aaaaaagtga tggaaaacca gatgttcgag gaaaagcagg ccgagagcat gcccgagatc 2280
gaaaccgagc aggagtacaa agagatcttc atcacccccc accagatcaa gcacattaag 2340
gacttcaagg actacaagta cagccaccgg gtggacaaga agcctaatag agagctgatt 2400
aacgacaccc tgtactccac ccggaaggac gacaagggca acaccctgat cgtgaacaat 2460
ctgaacggcc tgtacgacaa ggacaatgac aagctgaaaa agctgatcaa caagagcccc 2520
gaaaagctgc tgatgtacca ccacgacccc cagacctacc agaaactgaa gctgattatg 2580
gaacagtacg gcgacgagaa gaatcccctg tacaagtact acgaggaaac cgggaactac 2640
ctgaccaagt actccaaaaa ggacaacggc cccgtgatca agaagattaa gtattacggc 2700
aacaaactga acgcccatct ggacatcacc gacgactacc ccaacagcag aaacaaggtc 2760
gtgaagctgt ccctgaagcc ctacagattc gacgtgtacc tggacaatgg cgtgtacaag 2820
ttcgtgaccg tgaagaatct ggatgtgatc aaaaaagaaa actactacga agtgaatagc 2880
aagtgctatg aggaagctaa gaagctgaag aagatcagca accaggccga gtttatcgcc 2940
tccttctaca acaacgatct gatcaagatc aacggcgagc tgtatagagt gatcggcgtg 3000
aacaacgacc tgctgaaccg gatcgaagtg aacatgatcg acatcaccta ccgcgagtac 3060
ctggaaaaca tgaacgacaa gaggcccccc aggatcatta agacaatcgc ctccaagacc 3120
cagagcatta agaagtacag cacagacatt ctgggcaacc tgtatgaagt gaaatctaag 3180
aagcaccctc agatcatcaa aaagggcaaa aggccggcgg ccacgaaaaa ggccggccag 3240
gcaaaaaaga aaaaggctag cgatgcactc gatgattttg acctcgatat gcttgggagt 3300
gatgcgctcg atgacttcga tttggatatg cttggatctg atgccctcga cgatttcgac 3360
cttgatatgc tcgggtcaga cgctttggat gactttgacc ttgacatgct ggggagcggc 3420
tcccccgcac cggcagttac accggaggcc agtcacttgc tcgaagatcc tgacgaggaa 3480
accagccagg ccgtaaaggc gttgcgggag atggctgaca cagtaatacc ccaaaaagag 3540
gaggctgcga tttgtgggca gatggatttg tcccaccctc caccgagagg tcatcttgac 3600
gaattgacaa cgacgctcga atccatgacc gaggacctga acctcgatag cccgctcacc 3660
cccgagttga atgagatcct ggatacattt cttaatgatg agtgtttgct tcacgcaatg 3720
catatttcta cgggtcttag tattttcgac acgagcctgt tt 3762
<210> 193
<211> 1254
<212> PRT
<213> 人工序列
<220>
<223> dSaCas9(D10A, N580A)-miniVR
<400> 193
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val
20 25 30
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
35 40 45
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
50 55 60
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
65 70 75 80
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
85 90 95
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
100 105 110
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
115 120 125
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
130 135 140
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
145 150 155 160
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
165 170 175
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
180 185 190
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
195 200 205
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
210 215 220
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
225 230 235 240
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
245 250 255
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
260 265 270
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
275 280 285
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
290 295 300
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
305 310 315 320
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
325 330 335
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
340 345 350
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
355 360 365
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
370 375 380
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
385 390 395 400
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
405 410 415
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
420 425 430
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
435 440 445
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
450 455 460
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
465 470 475 480
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
485 490 495
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
500 505 510
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
515 520 525
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
530 535 540
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
545 550 555 560
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp Ala Ile Ile Pro
565 570 575
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
580 585 590
Gln Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
595 600 605
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
610 615 620
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
625 630 635 640
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
645 650 655
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
660 665 670
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
675 680 685
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
690 695 700
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
705 710 715 720
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
725 730 735
Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys
740 745 750
Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu
755 760 765
Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp
770 775 780
Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile
785 790 795 800
Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu
805 810 815
Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu
820 825 830
Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His
835 840 845
Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly
850 855 860
Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr
865 870 875 880
Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile
885 890 895
Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp
900 905 910
Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr
915 920 925
Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val
930 935 940
Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser
945 950 955 960
Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala
965 970 975
Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly
980 985 990
Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile
995 1000 1005
Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn
1010 1015 1020
Met Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser
1025 1030 1035
Lys Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn
1040 1045 1050
Leu Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys
1055 1060 1065
Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys
1070 1075 1080
Lys Lys Ala Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
1085 1090 1095
Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser
1100 1105 1110
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala
1115 1120 1125
Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Gly Ser Pro Ala
1130 1135 1140
Pro Ala Val Thr Pro Glu Ala Ser His Leu Leu Glu Asp Pro Asp
1145 1150 1155
Glu Glu Thr Ser Gln Ala Val Lys Ala Leu Arg Glu Met Ala Asp
1160 1165 1170
Thr Val Ile Pro Gln Lys Glu Glu Ala Ala Ile Cys Gly Gln Met
1175 1180 1185
Asp Leu Ser His Pro Pro Pro Arg Gly His Leu Asp Glu Leu Thr
1190 1195 1200
Thr Thr Leu Glu Ser Met Thr Glu Asp Leu Asn Leu Asp Ser Pro
1205 1210 1215
Leu Thr Pro Glu Leu Asn Glu Ile Leu Asp Thr Phe Leu Asn Asp
1220 1225 1230
Glu Cys Leu Leu His Ala Met His Ile Ser Thr Gly Leu Ser Ile
1235 1240 1245
Phe Asp Thr Ser Leu Phe
1250
<210> 194
<211> 21
<212> RNA
<213> 智人(Homo sapiens)
<220>
<221> misc_feature
<222> (1)..(21)
<223> 对应于靶序列(SEQ ID NO:45)的crRNA
<400> 194
guacaguuag ugcuacuagg a 21
<210> 195
<211> 21
<212> RNA
<213> 智人(Homo sapiens)
<220>
<221> misc_feature
<222> (1)..(21)
<223> 对应于靶序列(SEQ ID NO:46)的crRNA
<400> 195
gcuacuagga caggaugcug g 21
<210> 196
<211> 21
<212> RNA
<213> 智人(Homo sapiens)
<220>
<221> misc_feature
<222> (1)..(21)
<223> 对应于靶序列(SEQ ID NO:58)的crRNA
<400> 196
gggguccgcu cuccagauga g 21
<210> 197
<211> 21
<212> RNA
<213> 智人(Homo sapiens)
<220>
<221> misc_feature
<222> (1)..(21)
<223> 对应于靶序列(SEQ ID NO:59)的crRNA
<400> 197
ggaggguggg gcgcaggacc g 21
<210> 198
<211> 21
<212> RNA
<213> 智人(Homo sapiens)
<220>
<221> misc_feature
<222> (1)..(21)
<223> 对应于靶序列(SEQ ID NO:60)的crRNA
<400> 198
ccucucucgc gcacaaaguu g 21
<210> 199
<211> 21
<212> RNA
<213> 智人(Homo sapiens)
<220>
<221> misc_feature
<222> (1)..(21)
<223> 对应于靶序列(SEQ ID NO:135)的crRNA
<400> 199
ggcuccucua ggaguuugac a 21
<210> 200
<211> 21
<212> RNA
<213> 智人(Homo sapiens)
<220>
<221> misc_feature
<222> (1)..(21)
<223> 对应于靶序列(SEQ ID NO:141)的crRNA
<400> 200
ggguaguucu gcggugacgg a 21
<210> 201
<211> 21
<212> RNA
<213> 智人(Homo sapiens)
<220>
<221> misc_feature
<222> (1)..(21)
<223> 对应于靶序列(SEQ ID NO:153)的crRNA
<400> 201
gaguccggag accgaaccag a 21
<210> 202
<211> 21
<212> RNA
<213> 智人(Homo sapiens)
<220>
<221> misc_feature
<222> (1)..(21)
<223> 对应于靶序列(SEQ ID NO:155)的crRNA
<400> 202
gcuggccugg ggcgcgcgcu c 21
<210> 203
<211> 21
<212> RNA
<213> 智人(Homo sapiens)
<220>
<221> misc_feature
<222> (1)..(21)
<223> 对应于靶序列(SEQ ID NO:156)的crRNA
<400> 203
aagaucagcc ccacuacguu c 21
<210> 204
<211> 21
<212> RNA
<213> 智人(Homo sapiens)
<220>
<221> misc_feature
<222> (1)..(21)
<223> 对应于靶序列(SEQ ID NO:157)的crRNA
<400> 204
ccggaggcga gccccuuccc g 21
<210> 205
<211> 21
<212> RNA
<213> 智人(Homo sapiens)
<220>
<221> misc_feature
<222> (1)..(21)
<223> 对应于靶序列(SEQ ID NO:159)的crRNA
<400> 205
gagcgcugga ggcggaggag g 21
<210> 206
<211> 21
<212> RNA
<213> 智人(Homo sapiens)
<220>
<221> misc_feature
<222> (1)..(21)
<223> 对应于靶序列(SEQ ID NO:167)的crRNA
<400> 206
agaggggacg uggccucuua g 21
<210> 207
<211> 21
<212> RNA
<213> 智人(Homo sapiens)
<220>
<221> misc_feature
<222> (1)..(21)
<223> 对应于靶序列(SEQ ID NO:172)的crRNA
<400> 207
gcgcgcggag cucgggggag g 21
<210> 208
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 2x sNRP-1 polyA序列
<400> 208
aaataaaata cgaaatgaaa taaaatacga aatg 34
<210> 209
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> GSGS连接子
<400> 209
Gly Ser Gly Ser
1
<210> 210
<211> 8288
<212> DNA
<213> 人工序列
<220>
<223> pED260质粒
<400> 210
cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg 60
cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatgca gctggcacga 120
caggtttccc gactggaaag cgggcagtga gcgcaacgca attaatgtga gttagctcac 180
tcattaggca ccccaggctt tacactttat gcttccggct cgtatgttgt gtggaattgt 240
gagcggataa caatttcaca caggaaacag ctatgaccat gattacgaat tgcctgcagg 300
cagctgcgcg ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc 360
tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 420
actaggggtt cctatcgata tcactcgagg cgttgctaga ctagcatgct gcccatgtaa 480
ggaggcaagg cctggggaca cccgagatgc ctggttataa ttaacccaga catgtggctg 540
cccccccccc cccaacacct gctgcctcta aaaataaccc tgcatgccat gttcccggcg 600
aagggccagc tgtcccccgc cagctagact cagcacttag tttaggaacc agtgagcaag 660
tcagcccttg gggcagccca tacaaggcca tggggctggg caagctgcac gcctgggtcc 720
ggggtgggca cggtgcccgg gcaacgagct gaaagctcat ctgctctcag gggcccctcc 780
ctggggacag cccctcctgg ctagtcacac cctgtaggct cctctatata acccaggggc 840
acaggggctg ccctcattct accaccacct ccacagcaca gacagacact caggagccag 900
ccagcagagc tctctggcta actaccggtg ccaccatggc cccaaagaag aagcggaagg 960
tcggtatcca cggagtccca gcagccaagc ggaactacat cctgggcctg gccatcggca 1020
tcaccagcgt gggctacggc atcatcgact acgagacacg ggacgtgatc gatgccggcg 1080
tgcggctgtt caaagaggcc aacgtggaaa acaacgaggg caggcggagc aagagaggcg 1140
ccagaaggct gaagcggcgg aggcggcata gaatccagag agtgaagaag ctgctgttcg 1200
actacaacct gctgaccgac cacagcgagc tgagcggcat caacccctac gaggccagag 1260
tgaagggcct gagccagaag ctgagcgagg aagagttctc tgccgccctg ctgcacctgg 1320
ccaagagaag aggcgtgcac aacgtgaacg aggtggaaga ggacaccggc aacgagctgt 1380
ccaccaaaga gcagatcagc cggaacagca aggccctgga agagaaatac gtggccgaac 1440
tgcagctgga acggctgaag aaagacggcg aagtgcgggg cagcatcaac agattcaaga 1500
ccagcgacta cgtgaaagaa gccaaacagc tgctgaaggt gcagaaggcc taccaccagc 1560
tggaccagag cttcatcgac acctacatcg acctgctgga aacccggcgg acctactatg 1620
agggacctgg cgagggcagc cccttcggct ggaaggacat caaagaatgg tacgagatgc 1680
tgatgggcca ctgcacctac ttccccgagg aactgcggag cgtgaagtac gcctacaacg 1740
ccgacctgta caacgccctg aacgacctga acaatctcgt gatcaccagg gacgagaacg 1800
agaagctgga atattacgag aagttccaga tcatcgagaa cgtgttcaag cagaagaaga 1860
agcccaccct gaagcagatc gccaaagaaa tcctcgtgaa cgaagaggat attaagggct 1920
acagagtgac cagcaccggc aagcccgagt tcaccaacct gaaggtgtac cacgacatca 1980
aggacattac cgcccggaaa gagattattg agaacgccga gctgctggat cagattgcca 2040
agatcctgac catctaccag agcagcgagg acatccagga agaactgacc aatctgaact 2100
ccgagctgac ccaggaagag atcgagcaga tctctaatct gaagggctat accggcaccc 2160
acaacctgag cctgaaggcc atcaacctga tcctggacga gctgtggcac accaacgaca 2220
accagatcgc tatcttcaac cggctgaagc tggtgcccaa gaaggtggac ctgtcccagc 2280
agaaagagat ccccaccacc ctggtggacg acttcatcct gagccccgtc gtgaagagaa 2340
gcttcatcca gagcatcaaa gtgatcaacg ccatcatcaa gaagtacggc ctgcccaacg 2400
acatcattat cgagctggcc cgcgagaaga actccaagga cgcccagaaa atgatcaacg 2460
agatgcagaa gcggaaccgg cagaccaacg agcggatcga ggaaatcatc cggaccaccg 2520
gcaaagagaa cgccaagtac ctgatcgaga agatcaagct gcacgacatg caggaaggca 2580
agtgcctgta cagcctggaa gccatccctc tggaagatct gctgaacaac cccttcaact 2640
atgaggtgga cgccatcatc cccagaagcg tgtccttcga caacagcttc aacaacaagg 2700
tgctcgtgaa gcaggaagaa gccagcaaga agggcaaccg gaccccattc cagtacctga 2760
gcagcagcga cagcaagatc agctacgaaa ccttcaagaa gcacatcctg aatctggcca 2820
agggcaaggg cagaatcagc aagaccaaga aagagtatct gctggaagaa cgggacatca 2880
acaggttctc cgtgcagaaa gacttcatca accggaacct ggtggatacc agatacgcca 2940
ccagaggcct gatgaacctg ctgcggagct acttcagagt gaacaacctg gacgtgaaag 3000
tgaagtccat caatggcggc ttcaccagct ttctgcggcg gaagtggaag tttaagaaag 3060
agcggaacaa ggggtacaag caccacgccg aggacgccct gatcattgcc aacgccgatt 3120
tcatcttcaa agagtggaag aaactggaca aggccaaaaa agtgatggaa aaccagatgt 3180
tcgaggaaaa gcaggccgag agcatgcccg agatcgaaac cgagcaggag tacaaagaga 3240
tcttcatcac cccccaccag atcaagcaca ttaaggactt caaggactac aagtacagcc 3300
accgggtgga caagaagcct aatagagagc tgattaacga caccctgtac tccacccgga 3360
aggacgacaa gggcaacacc ctgatcgtga acaatctgaa cggcctgtac gacaaggaca 3420
atgacaagct gaaaaagctg atcaacaaga gccccgaaaa gctgctgatg taccaccacg 3480
acccccagac ctaccagaaa ctgaagctga ttatggaaca gtacggcgac gagaagaatc 3540
ccctgtacaa gtactacgag gaaaccggga actacctgac caagtactcc aaaaaggaca 3600
acggccccgt gatcaagaag attaagtatt acggcaacaa actgaacgcc catctggaca 3660
tcaccgacga ctaccccaac agcagaaaca aggtcgtgaa gctgtccctg aagccctaca 3720
gattcgacgt gtacctggac aatggcgtgt acaagttcgt gaccgtgaag aatctggatg 3780
tgatcaaaaa agaaaactac tacgaagtga atagcaagtg ctatgaggaa gctaagaagc 3840
tgaagaagat cagcaaccag gccgagttta tcgcctcctt ctacaacaac gatctgatca 3900
agatcaacgg cgagctgtat agagtgatcg gcgtgaacaa cgacctgctg aaccggatcg 3960
aagtgaacat gatcgacatc acctaccgcg agtacctgga aaacatgaac gacaagaggc 4020
cccccaggat cattaagaca atcgcctcca agacccagag cattaagaag tacagcacag 4080
acattctggg caacctgtat gaagtgaaat ctaagaagca ccctcagatc atcaaaaagg 4140
gcaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag ggatccggtg 4200
ctagagatgc actcgatgat tttgacctcg atatgcttgg gagtgatgcg ctcgatgact 4260
tcgatttgga tatgcttgga tctgatgccc tcgacgattt cgaccttgat atgctcgggt 4320
cagacgcttt ggatgacttt gaccttgaca tgctggggag cggctccccc gcaccggcag 4380
ttacaccgga ggccagtcac ttgctcgaag atcctgacga ggaaaccagc caggccgtaa 4440
aggcgttgcg ggagatggct gacacagtaa taccccaaaa agaggaggct gcgatttgtg 4500
ggcagatgga tttgtcccac cctccaccga gaggtcatct tgacgaattg acaacgacgc 4560
tcgaatccat gaccgaggac ctgaacctcg atagcccgct cacccccgag ttgaatgaga 4620
tcctggatac atttcttaat gatgagtgtt tgcttcacgc aatgcatatt tctacgggtc 4680
ttagtatttt cgacacgagc ctgtttgtcg actgagaatt cctagagctc gctgatcagc 4740
ctcgactgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt 4800
gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca 4860
ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga 4920
ggattgggaa gagaatagca ggcatgctgg ggaggtaccg agggcctatt tcccatgatt 4980
ccttcatatt tgcatatacg atacaaggct gttagagaga taattggaat taatttgact 5040
gtaaacacaa agatattagt acaaaatacg tgacgtagaa agtaataatt tcttgggtag 5100
tttgcagttt taaaattatg ttttaaaatg gactatcata tgcttaccgt aacttgaaag 5160
tatttcgatt tcttggcttt atatatcttg tggaaaggac gaaacaccgg agaccacggc 5220
aggtctcagt tttagtactc tggaaacaga atctactaaa acaaggcaaa atgccgtgtt 5280
tatctcgtca acttgttggc gagatttttg cggccgcgat ctaggaaccc ctagtgatgg 5340
agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg 5400
cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agctgcctgc 5460
aggcagcttg gcactggccg tcgttttaca acgtcgtgac tgggaaaacc ctggcgttac 5520
ccaacttaat cgccttgcag cacatccccc tttcgccagc tggcgtaata gcgaagaggc 5580
ccgcaccgat cgcccttccc aacagttgcg cagcctgaat ggcgaatggc gcctgatgcg 5640
gtattttctc cttacgcatc tgtgcggtat ttcacaccgc atacgtcaaa gcaaccatag 5700
tacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc 5760
gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc 5820
acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt 5880
agtgctttac ggcacctcga ccccaaaaaa cttgatttgg gtgatggttc acgtagtggg 5940
ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt 6000
ggactcttgt tccaaactgg aacaacactc aaccctatct cgggctattc ttttgattta 6060
taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt 6120
aacgcgaatt ttaacaaaat attaacgttt acaattttat ggtgcactct cagtacaatc 6180
tgctctgatg ccgcatagtt aagccagccc cgacacccgc caacacccgc tgacgcgccc 6240
tgacgggctt gtctgctccc ggcatccgct tacagacaag ctgtgaccgt ctccgggagc 6300
tgcatgtgtc agaggttttc accgtcatca ccgaaacgcg cgagacgaaa gggcctcgtg 6360
atacgcctat ttttataggt taatgtcatg ataataatgg tttcttagac gtcaggtggc 6420
acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat acattcaaat 6480
atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg aaaaaggaag 6540
agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc attttgcctt 6600
cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga tcagttgggt 6660
gcacgagtgg gttacatcga actggatctc aacagcggta agatccttga gagttttcgc 6720
cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg cgcggtatta 6780
tcccgtattg acgccgggca agagcaactc ggtcgccgca tacactattc tcagaatgac 6840
ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac agtaagagaa 6900
ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact tctgacaacg 6960
atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca tgtaactcgc 7020
cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg tgacaccacg 7080
atgcctgtag caatggcaac aacgttgcgc aaactattaa ctggcgaact acttactcta 7140
gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg accacttctg 7200
cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg tgagcgtgga 7260
agccgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat cgtagttatc 7320
tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc tgagataggt 7380
gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat actttagatt 7440
gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt tgataatctc 7500
atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc cgtagaaaag 7560
atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa 7620
aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac tctttttccg 7680
aaggtaactg gcttcagcag agcgcagata ccaaatactg ttcttctagt gtagccgtag 7740
ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct gctaatcctg 7800
ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga ctcaagacga 7860
tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac acagcccagc 7920
ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg agaaagcgcc 7980
acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt cggaacagga 8040
gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc tgtcgggttt 8100
cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg gagcctatgg 8160
aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc ttttgctcac 8220
atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc ctttgagtga 8280
gctgatac 8288
<210> 211
<211> 8090
<212> DNA
<213> 人工序列
<220>
<223> pED261质粒
<400> 211
cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg 60
cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatgca gctggcacga 120
caggtttccc gactggaaag cgggcagtga gcgcaacgca attaatgtga gttagctcac 180
tcattaggca ccccaggctt tacactttat gcttccggct cgtatgttgt gtggaattgt 240
gagcggataa caatttcaca caggaaacag ctatgaccat gattacgaat tgcctgcagg 300
cagctgcgcg ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc 360
tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 420
actaggggtt cctatcgata tcactcgagg cgttgctaga ctagcatgct gcccatgtaa 480
ggaggcaagg cctggggaca cccgagatgc ctggttataa ttaacccaga catgtggctg 540
cccccccccc cccaacacct gctgcctcta aaaataaccc tgcatgccat gttcccggcg 600
aagggccagc tgtcccccgc cagctagact cagcacttag tttaggaacc agtgagcaag 660
tcagcccttg gggcagccca tacaaggcca tggggctggg caagctgcac gcctgggtcc 720
ggggtgggca cggtgcccgg gcaacgagct gaaagctcat ctgctctcag gggcccctcc 780
ctggggacag cccctcctgg ctagtcacac cctgtaggct cctctatata acccaggggc 840
acaggggctg ccctcattct accaccacct ccacagcaca gacagacact caggagccag 900
ccagcagagc tctctggcta actaccggtg ccaccatggc cccaaagaag aagcggaagg 960
tcggtatcca cggagtccca gcagccaagc ggaactacat cctgggcctg gccatcggca 1020
tcaccagcgt gggctacggc atcatcgact acgagacacg ggacgtgatc gatgccggcg 1080
tgcggctgtt caaagaggcc aacgtggaaa acaacgaggg caggcggagc aagagaggcg 1140
ccagaaggct gaagcggcgg aggcggcata gaatccagag agtgaagaag ctgctgttcg 1200
actacaacct gctgaccgac cacagcgagc tgagcggcat caacccctac gaggccagag 1260
tgaagggcct gagccagaag ctgagcgagg aagagttctc tgccgccctg ctgcacctgg 1320
ccaagagaag aggcgtgcac aacgtgaacg aggtggaaga ggacaccggc aacgagctgt 1380
ccaccaaaga gcagatcagc cggaacagca aggccctgga agagaaatac gtggccgaac 1440
tgcagctgga acggctgaag aaagacggcg aagtgcgggg cagcatcaac agattcaaga 1500
ccagcgacta cgtgaaagaa gccaaacagc tgctgaaggt gcagaaggcc taccaccagc 1560
tggaccagag cttcatcgac acctacatcg acctgctgga aacccggcgg acctactatg 1620
agggacctgg cgagggcagc cccttcggct ggaaggacat caaagaatgg tacgagatgc 1680
tgatgggcca ctgcacctac ttccccgagg aactgcggag cgtgaagtac gcctacaacg 1740
ccgacctgta caacgccctg aacgacctga acaatctcgt gatcaccagg gacgagaacg 1800
agaagctgga atattacgag aagttccaga tcatcgagaa cgtgttcaag cagaagaaga 1860
agcccaccct gaagcagatc gccaaagaaa tcctcgtgaa cgaagaggat attaagggct 1920
acagagtgac cagcaccggc aagcccgagt tcaccaacct gaaggtgtac cacgacatca 1980
aggacattac cgcccggaaa gagattattg agaacgccga gctgctggat cagattgcca 2040
agatcctgac catctaccag agcagcgagg acatccagga agaactgacc aatctgaact 2100
ccgagctgac ccaggaagag atcgagcaga tctctaatct gaagggctat accggcaccc 2160
acaacctgag cctgaaggcc atcaacctga tcctggacga gctgtggcac accaacgaca 2220
accagatcgc tatcttcaac cggctgaagc tggtgcccaa gaaggtggac ctgtcccagc 2280
agaaagagat ccccaccacc ctggtggacg acttcatcct gagccccgtc gtgaagagaa 2340
gcttcatcca gagcatcaaa gtgatcaacg ccatcatcaa gaagtacggc ctgcccaacg 2400
acatcattat cgagctggcc cgcgagaaga actccaagga cgcccagaaa atgatcaacg 2460
agatgcagaa gcggaaccgg cagaccaacg agcggatcga ggaaatcatc cggaccaccg 2520
gcaaagagaa cgccaagtac ctgatcgaga agatcaagct gcacgacatg caggaaggca 2580
agtgcctgta cagcctggaa gccatccctc tggaagatct gctgaacaac cccttcaact 2640
atgaggtgga cgccatcatc cccagaagcg tgtccttcga caacagcttc aacaacaagg 2700
tgctcgtgaa gcaggaagaa gccagcaaga agggcaaccg gaccccattc cagtacctga 2760
gcagcagcga cagcaagatc agctacgaaa ccttcaagaa gcacatcctg aatctggcca 2820
agggcaaggg cagaatcagc aagaccaaga aagagtatct gctggaagaa cgggacatca 2880
acaggttctc cgtgcagaaa gacttcatca accggaacct ggtggatacc agatacgcca 2940
ccagaggcct gatgaacctg ctgcggagct acttcagagt gaacaacctg gacgtgaaag 3000
tgaagtccat caatggcggc ttcaccagct ttctgcggcg gaagtggaag tttaagaaag 3060
agcggaacaa ggggtacaag caccacgccg aggacgccct gatcattgcc aacgccgatt 3120
tcatcttcaa agagtggaag aaactggaca aggccaaaaa agtgatggaa aaccagatgt 3180
tcgaggaaaa gcaggccgag agcatgcccg agatcgaaac cgagcaggag tacaaagaga 3240
tcttcatcac cccccaccag atcaagcaca ttaaggactt caaggactac aagtacagcc 3300
accgggtgga caagaagcct aatagagagc tgattaacga caccctgtac tccacccgga 3360
aggacgacaa gggcaacacc ctgatcgtga acaatctgaa cggcctgtac gacaaggaca 3420
atgacaagct gaaaaagctg atcaacaaga gccccgaaaa gctgctgatg taccaccacg 3480
acccccagac ctaccagaaa ctgaagctga ttatggaaca gtacggcgac gagaagaatc 3540
ccctgtacaa gtactacgag gaaaccggga actacctgac caagtactcc aaaaaggaca 3600
acggccccgt gatcaagaag attaagtatt acggcaacaa actgaacgcc catctggaca 3660
tcaccgacga ctaccccaac agcagaaaca aggtcgtgaa gctgtccctg aagccctaca 3720
gattcgacgt gtacctggac aatggcgtgt acaagttcgt gaccgtgaag aatctggatg 3780
tgatcaaaaa agaaaactac tacgaagtga atagcaagtg ctatgaggaa gctaagaagc 3840
tgaagaagat cagcaaccag gccgagttta tcgcctcctt ctacaacaac gatctgatca 3900
agatcaacgg cgagctgtat agagtgatcg gcgtgaacaa cgacctgctg aaccggatcg 3960
aagtgaacat gatcgacatc acctaccgcg agtacctgga aaacatgaac gacaagaggc 4020
cccccaggat cattaagaca atcgcctcca agacccagag cattaagaag tacagcacag 4080
acattctggg caacctgtat gaagtgaaat ctaagaagca ccctcagatc atcaaaaagg 4140
gcaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag ggatccggtg 4200
ctagagatgc actcgatgat tttgacctcg atatgcttgg gagtgatgcg ctcgatgact 4260
tcgatttgga tatgcttgga tctgatgccc tcgacgattt cgaccttgat atgctcgggt 4320
cagacgcttt ggatgacttt gaccttgaca tgctggggag cggctccccc gcaccggcag 4380
ttacaccgga ggccagtcac ttgctcgaag atcctgacga ggaaaccagc caggccgtaa 4440
aggcgttgcg ggagatggct gacacagtaa taccccaaaa agaggaggct gcgatttgtg 4500
ggcagatgga tttgtcccac cctccaccga gaggtcatct tgacgaattg acaacgacgc 4560
tcgaatccat gaccgaggac ctgaacctcg atagcccgct cacccccgag ttgaatgaga 4620
tcctggatac atttcttaat gatgagtgtt tgcttcacgc aatgcatatt tctacgggtc 4680
ttagtatttt cgacacgagc ctgtttgtcg actgagaatt caaataaaat acgaaatgaa 4740
ataaaatacg aaatgggtac cgagggccta tttcccatga ttccttcata tttgcatata 4800
cgatacaagg ctgttagaga gataattgga attaatttga ctgtaaacac aaagatatta 4860
gtacaaaata cgtgacgtag aaagtaataa tttcttgggt agtttgcagt tttaaaatta 4920
tgttttaaaa tggactatca tatgcttacc gtaacttgaa agtatttcga tttcttggct 4980
ttatatatct tgtggaaagg acgaaacacc ggagaccacg gcaggtctca gttttagtac 5040
tctggaaaca gaatctacta aaacaaggca aaatgccgtg tttatctcgt caacttgttg 5100
gcgagatttt tgcggccgcg atctaggaac ccctagtgat ggagttggcc actccctctc 5160
tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg 5220
cccgggcggc ctcagtgagc gagcgagcgc gcagctgcct gcaggcagct tggcactggc 5280
cgtcgtttta caacgtcgtg actgggaaaa ccctggcgtt acccaactta atcgccttgc 5340
agcacatccc cctttcgcca gctggcgtaa tagcgaagag gcccgcaccg atcgcccttc 5400
ccaacagttg cgcagcctga atggcgaatg gcgcctgatg cggtattttc tccttacgca 5460
tctgtgcggt atttcacacc gcatacgtca aagcaaccat agtacgcgcc ctgtagcggc 5520
gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc 5580
ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc 5640
cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc 5700
gaccccaaaa aacttgattt gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg 5760
gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact 5820
ggaacaacac tcaaccctat ctcgggctat tcttttgatt tataagggat tttgccgatt 5880
tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa 5940
atattaacgt ttacaatttt atggtgcact ctcagtacaa tctgctctga tgccgcatag 6000
ttaagccagc cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc 6060
ccggcatccg cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt 6120
tcaccgtcat caccgaaacg cgcgagacga aagggcctcg tgatacgcct atttttatag 6180
gttaatgtca tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg 6240
cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga 6300
caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat 6360
ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca 6420
gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc 6480
gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca 6540
atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg 6600
caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca 6660
gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata 6720
accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag 6780
ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg 6840
gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca 6900
acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta 6960
atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct 7020
ggctggttta ttgctgataa atctggagcc ggtgagcgtg gaagccgcgg tatcattgca 7080
gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag 7140
gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat 7200
tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt 7260
taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa 7320
cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 7380
gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 7440
gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 7500
agagcgcaga taccaaatac tgttcttcta gtgtagccgt agttaggcca ccacttcaag 7560
aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 7620
agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 7680
cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 7740
accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 7800
aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 7860
ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 7920
cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 7980
gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 8040
tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac 8090
<210> 212
<211> 8000
<212> DNA
<213> 人工序列
<220>
<223> pED263质粒
<400> 212
cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg 60
cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatgca gctggcacga 120
caggtttccc gactggaaag cgggcagtga gcgcaacgca attaatgtga gttagctcac 180
tcattaggca ccccaggctt tacactttat gcttccggct cgtatgttgt gtggaattgt 240
gagcggataa caatttcaca caggaaacag ctatgaccat gattacgaat tgcctgcagg 300
cagctgcgcg ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc 360
tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 420
actaggggtt cctatcgata tcactcgagg cgttgctaga ctagcatgct gcccatgtaa 480
ggaggcaagg cctggggaca cccgagatgc ctggttataa ttaacccaga catgtggctg 540
cccccccccc cccaacacct gctgcctcta aaaataaccc tgcatgccat gttcccggcg 600
aagggccagc tgtcccccgc cagctagact cagcacttag tttaggaacc agtgagcaag 660
tcagcccttg gggcagccca tacaaggcca tggggctggg caagctgcac gcctgggtcc 720
ggggtgggca cggtgcccgg gcaacgagct gaaagctcat ctgctctcag gggcccctcc 780
ctggggacag cccctcctgg ctagtcacac cctgtaggct cctctatata acccaggggc 840
acaggggctg ccctcattct accaccacct ccacagcaca gacagacact caggagccag 900
ccagcagagc tctctggcta actaccggtg ccaccatggc cccaaagaag aagcggaagg 960
tcggtatcca cggagtccca gcagccaagc ggaactacat cctgggcctg gccatcggca 1020
tcaccagcgt gggctacggc atcatcgact acgagacacg ggacgtgatc gatgccggcg 1080
tgcggctgtt caaagaggcc aacgtggaaa acaacgaggg caggcggagc aagagaggcg 1140
ccagaaggct gaagcggcgg aggcggcata gaatccagag agtgaagaag ctgctgttcg 1200
actacaacct gctgaccgac cacagcgagc tgagcggcat caacccctac gaggccagag 1260
tgaagggcct gagccagaag ctgagcgagg aagagttctc tgccgccctg ctgcacctgg 1320
ccaagagaag aggcgtgcac aacgtgaacg aggtggaaga ggacaccggc aacgagctgt 1380
ccaccaaaga gcagatcagc cggaacagca aggccctgga agagaaatac gtggccgaac 1440
tgcagctgga acggctgaag aaagacggcg aagtgcgggg cagcatcaac agattcaaga 1500
ccagcgacta cgtgaaagaa gccaaacagc tgctgaaggt gcagaaggcc taccaccagc 1560
tggaccagag cttcatcgac acctacatcg acctgctgga aacccggcgg acctactatg 1620
agggacctgg cgagggcagc cccttcggct ggaaggacat caaagaatgg tacgagatgc 1680
tgatgggcca ctgcacctac ttccccgagg aactgcggag cgtgaagtac gcctacaacg 1740
ccgacctgta caacgccctg aacgacctga acaatctcgt gatcaccagg gacgagaacg 1800
agaagctgga atattacgag aagttccaga tcatcgagaa cgtgttcaag cagaagaaga 1860
agcccaccct gaagcagatc gccaaagaaa tcctcgtgaa cgaagaggat attaagggct 1920
acagagtgac cagcaccggc aagcccgagt tcaccaacct gaaggtgtac cacgacatca 1980
aggacattac cgcccggaaa gagattattg agaacgccga gctgctggat cagattgcca 2040
agatcctgac catctaccag agcagcgagg acatccagga agaactgacc aatctgaact 2100
ccgagctgac ccaggaagag atcgagcaga tctctaatct gaagggctat accggcaccc 2160
acaacctgag cctgaaggcc atcaacctga tcctggacga gctgtggcac accaacgaca 2220
accagatcgc tatcttcaac cggctgaagc tggtgcccaa gaaggtggac ctgtcccagc 2280
agaaagagat ccccaccacc ctggtggacg acttcatcct gagccccgtc gtgaagagaa 2340
gcttcatcca gagcatcaaa gtgatcaacg ccatcatcaa gaagtacggc ctgcccaacg 2400
acatcattat cgagctggcc cgcgagaaga actccaagga cgcccagaaa atgatcaacg 2460
agatgcagaa gcggaaccgg cagaccaacg agcggatcga ggaaatcatc cggaccaccg 2520
gcaaagagaa cgccaagtac ctgatcgaga agatcaagct gcacgacatg caggaaggca 2580
agtgcctgta cagcctggaa gccatccctc tggaagatct gctgaacaac cccttcaact 2640
atgaggtgga cgccatcatc cccagaagcg tgtccttcga caacagcttc aacaacaagg 2700
tgctcgtgaa gcaggaagaa gccagcaaga agggcaaccg gaccccattc cagtacctga 2760
gcagcagcga cagcaagatc agctacgaaa ccttcaagaa gcacatcctg aatctggcca 2820
agggcaaggg cagaatcagc aagaccaaga aagagtatct gctggaagaa cgggacatca 2880
acaggttctc cgtgcagaaa gacttcatca accggaacct ggtggatacc agatacgcca 2940
ccagaggcct gatgaacctg ctgcggagct acttcagagt gaacaacctg gacgtgaaag 3000
tgaagtccat caatggcggc ttcaccagct ttctgcggcg gaagtggaag tttaagaaag 3060
agcggaacaa ggggtacaag caccacgccg aggacgccct gatcattgcc aacgccgatt 3120
tcatcttcaa agagtggaag aaactggaca aggccaaaaa agtgatggaa aaccagatgt 3180
tcgaggaaaa gcaggccgag agcatgcccg agatcgaaac cgagcaggag tacaaagaga 3240
tcttcatcac cccccaccag atcaagcaca ttaaggactt caaggactac aagtacagcc 3300
accgggtgga caagaagcct aatagagagc tgattaacga caccctgtac tccacccgga 3360
aggacgacaa gggcaacacc ctgatcgtga acaatctgaa cggcctgtac gacaaggaca 3420
atgacaagct gaaaaagctg atcaacaaga gccccgaaaa gctgctgatg taccaccacg 3480
acccccagac ctaccagaaa ctgaagctga ttatggaaca gtacggcgac gagaagaatc 3540
ccctgtacaa gtactacgag gaaaccggga actacctgac caagtactcc aaaaaggaca 3600
acggccccgt gatcaagaag attaagtatt acggcaacaa actgaacgcc catctggaca 3660
tcaccgacga ctaccccaac agcagaaaca aggtcgtgaa gctgtccctg aagccctaca 3720
gattcgacgt gtacctggac aatggcgtgt acaagttcgt gaccgtgaag aatctggatg 3780
tgatcaaaaa agaaaactac tacgaagtga atagcaagtg ctatgaggaa gctaagaagc 3840
tgaagaagat cagcaaccag gccgagttta tcgcctcctt ctacaacaac gatctgatca 3900
agatcaacgg cgagctgtat agagtgatcg gcgtgaacaa cgacctgctg aaccggatcg 3960
aagtgaacat gatcgacatc acctaccgcg agtacctgga aaacatgaac gacaagaggc 4020
cccccaggat cattaagaca atcgcctcca agacccagag cattaagaag tacagcacag 4080
acattctggg caacctgtat gaagtgaaat ctaagaagca ccctcagatc atcaaaaagg 4140
gcaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag ggatccgatg 4200
cactcgatga ttttgacctc gatatgcttg ggagtgatgc gctcgatgac ttcgatttgg 4260
atatgcttgg atctgatgcc ctcgacgatt tcgaccttga tatgctcggg tcagacgctt 4320
tggatgactt tgaccttgac atgctgggga gcggctcccg ggagatggct gacacagtaa 4380
taccccaaaa agaggaggct gcgatttgtg ggcagatgga tttgtcccac cctccaccga 4440
gaggtcatct tgacgaattg acaacgacgc tcgaatccat gaccgaggac ctgaacctcg 4500
atagcccgct cacccccgag ttgaatgaga tcctggatac atttcttaat gatgagtgtt 4560
tgcttcacgc aatgcatatt tctacgggtc ttagtatttt cgacacgagc ctgtttgtcg 4620
actgagaatt caaataaaat acgaaatgaa ataaaatacg aaatgggtac cgagggccta 4680
tttcccatga ttccttcata tttgcatata cgatacaagg ctgttagaga gataattgga 4740
attaatttga ctgtaaacac aaagatatta gtacaaaata cgtgacgtag aaagtaataa 4800
tttcttgggt agtttgcagt tttaaaatta tgttttaaaa tggactatca tatgcttacc 4860
gtaacttgaa agtatttcga tttcttggct ttatatatct tgtggaaagg acgaaacacc 4920
ggagaccacg gcaggtctca gttttagtac tctggaaaca gaatctacta aaacaaggca 4980
aaatgccgtg tttatctcgt caacttgttg gcgagatttt tgcggccgcg atctaggaac 5040
ccctagtgat ggagttggcc actccctctc tgcgcgctcg ctcgctcact gaggccgggc 5100
gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc 5160
gcagctgcct gcaggcagct tggcactggc cgtcgtttta caacgtcgtg actgggaaaa 5220
ccctggcgtt acccaactta atcgccttgc agcacatccc cctttcgcca gctggcgtaa 5280
tagcgaagag gcccgcaccg atcgcccttc ccaacagttg cgcagcctga atggcgaatg 5340
gcgcctgatg cggtattttc tccttacgca tctgtgcggt atttcacacc gcatacgtca 5400
aagcaaccat agtacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg 5460
cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct 5520
tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta 5580
gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgattt gggtgatggt 5640
tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg 5700
ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat ctcgggctat 5760
tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt 5820
taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt ttacaatttt atggtgcact 5880
ctcagtacaa tctgctctga tgccgcatag ttaagccagc cccgacaccc gccaacaccc 5940
gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg cttacagaca agctgtgacc 6000
gtctccggga gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg cgcgagacga 6060
aagggcctcg tgatacgcct atttttatag gttaatgtca tgataataat ggtttcttag 6120
acgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa 6180
atacattcaa atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat 6240
tgaaaaagga agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg 6300
gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa 6360
gatcagttgg gtgcacgagt gggttacatc gaactggatc tcaacagcgg taagatcctt 6420
gagagttttc gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt 6480
ggcgcggtat tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat 6540
tctcagaatg acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg 6600
acagtaagag aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta 6660
cttctgacaa cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat 6720
catgtaactc gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag 6780
cgtgacacca cgatgcctgt agcaatggca acaacgttgc gcaaactatt aactggcgaa 6840
ctacttactc tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca 6900
ggaccacttc tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc 6960
ggtgagcgtg gaagccgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt 7020
atcgtagtta tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc 7080
gctgagatag gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat 7140
atactttaga ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt 7200
tttgataatc tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac 7260
cccgtagaaa agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc 7320
ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca 7380
actctttttc cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgttcttcta 7440
gtgtagccgt agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct 7500
ctgctaatcc tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg 7560
gactcaagac gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc 7620
acacagccca gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta 7680
tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg 7740
gtcggaacag gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt 7800
cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg 7860
cggagcctat ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg 7920
ccttttgctc acatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc 7980
gcctttgagt gagctgatac 8000
<210> 213
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> SGGGS连接子
<400> 213
Ser Gly Gly Gly Ser
1 5
<210> 214
<211> 1033
<212> PRT
<213> 人工序列
<220>
<223> 具有SGGGS连接子的氨基酸残基(dSaCas9的第721位至第745位氨基酸残基)缺失突变体
<220>
<221> 变体
<222> (10)..(10)
<223> Asp残基转化成Ala残基
<220>
<221> 变体
<222> (580)..(580)
<223> Asn残基转化成Ala残基
<220>
<221> MISC_FEATURE
<222> (721)..(725)
<223> SGGGS连接子
<400> 214
Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val
1 5 10 15
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
20 25 30
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
35 40 45
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
50 55 60
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65 70 75 80
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
85 90 95
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
485 490 495
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
500 505 510
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
515 520 525
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
530 535 540
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro
545 550 555 560
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
565 570 575
Gln Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
580 585 590
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
595 600 605
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
610 615 620
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
625 630 635 640
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
645 650 655
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
660 665 670
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
675 680 685
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
690 695 700
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
705 710 715 720
Ser Gly Gly Gly Ser Thr Glu Gln Glu Tyr Lys Glu Ile Phe Ile Thr
725 730 735
Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr Lys Tyr Ser
740 745 750
His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn Asp Thr Leu
755 760 765
Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile Val Asn Asn
770 775 780
Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys Lys Leu Ile
785 790 795 800
Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp Pro Gln Thr
805 810 815
Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp Glu Lys Asn
820 825 830
Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu Thr Lys Tyr
835 840 845
Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly
850 855 860
Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser
865 870 875 880
Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val
885 890 895
Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp
900 905 910
Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu
915 920 925
Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala
930 935 940
Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr Arg
945 950 955 960
Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val Asn Met
965 970 975
Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn Asp Lys Arg
980 985 990
Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr Gln Ser Ile Lys
995 1000 1005
Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr Glu Val Lys Ser
1010 1015 1020
Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1025 1030
<210> 215
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 对照sgRNA中包含的crRNA
<400> 215
acggaggcua agcgucgcaa g 21
<210> 216
<211> 519
<212> PRT
<213> 人工序列
<220>
<223> VPR
<400> 216
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu
1 5 10 15
Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe
20 25 30
Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp
35 40 45
Met Leu Ser Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Gly Ser Gln
50 55 60
Tyr Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu Glu Lys Arg Lys
65 70 75 80
Arg Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys Ser Pro Phe Ser
85 90 95
Gly Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile Ala Val Pro Ser
100 105 110
Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln Pro Tyr Pro Phe
115 120 125
Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe Pro Thr Met Val
130 135 140
Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro
145 150 155 160
Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met
165 170 175
Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro
180 185 190
Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala
195 200 205
Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp
210 215 220
Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe
225 230 235 240
Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn
245 250 255
Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu Met Glu
260 265 270
Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro
275 280 285
Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu
290 295 300
Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser
305 310 315 320
Ala Leu Leu Gly Ser Gly Ser Gly Ser Arg Asp Ser Arg Glu Gly Met
325 330 335
Phe Leu Pro Lys Pro Glu Ala Gly Ser Ala Ile Ser Asp Val Phe Glu
340 345 350
Gly Arg Glu Val Cys Gln Pro Lys Arg Ile Arg Pro Phe His Pro Pro
355 360 365
Gly Ser Pro Trp Ala Asn Arg Pro Leu Pro Ala Ser Leu Ala Pro Thr
370 375 380
Pro Thr Gly Pro Val His Glu Pro Val Gly Ser Leu Thr Pro Ala Pro
385 390 395 400
Val Pro Gln Pro Leu Asp Pro Ala Pro Ala Val Thr Pro Glu Ala Ser
405 410 415
His Leu Leu Glu Asp Pro Asp Glu Glu Thr Ser Gln Ala Val Lys Ala
420 425 430
Leu Arg Glu Met Ala Asp Thr Val Ile Pro Gln Lys Glu Glu Ala Ala
435 440 445
Ile Cys Gly Gln Met Asp Leu Ser His Pro Pro Pro Arg Gly His Leu
450 455 460
Asp Glu Leu Thr Thr Thr Leu Glu Ser Met Thr Glu Asp Leu Asn Leu
465 470 475 480
Asp Ser Pro Leu Thr Pro Glu Leu Asn Glu Ile Leu Asp Thr Phe Leu
485 490 495
Asn Asp Glu Cys Leu Leu His Ala Met His Ile Ser Thr Gly Leu Ser
500 505 510
Ile Phe Asp Thr Ser Leu Phe
515

Claims (26)

1.一种多核苷酸,所述多核苷酸包含以下碱基序列:
(a)编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列,和
(b)编码向导RNA的碱基序列,所述向导RNA靶向人肌营养相关蛋白基因的表达调节区中SEQ ID NO:104、105、135、141、153、167或172所示区域中长度为18至24个核苷酸的连续区域。
2.根据权利要求1所述的多核苷酸,其中所述编码向导RNA的碱基序列包含SEQ ID NO:45、46、58、59、60、135、141、153、155、156、157、159、167或172所示的碱基序列,或SEQ IDNO:45、46、58、59、60、135、141、153、155、156、157、159、167或172所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列。
3.根据权利要求1或2所述的多核苷酸,所述多核苷酸包含至少两种不同的编码所述向导RNA的碱基序列。
4.根据权利要求1至3中任一项所述的多核苷酸,其中所述转录激活子是包含RTA的转录激活结构域和VP64的肽。
5.根据权利要求4所述的多核苷酸,其中所述转录激活子包含SEQ ID NO:117所示的氨基酸序列,或与SEQ ID NO:117所示的氨基酸序列具有至少90%同一性的氨基酸序列。
6.根据权利要求1至5中任一项所述的多核苷酸,其中所述核酸酶缺陷型CRISPR效应蛋白是dCas9。
7.根据权利要求6所述的多核苷酸,其中所述dCas9来源于金黄色葡萄球菌(Staphylococcus aureus)。
8.根据权利要求1至7中任一项所述的多核苷酸,所述多核苷酸进一步包含用于所述编码向导RNA的碱基序列的启动子序列和/或用于编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列的启动子序列。
9.根据权利要求8所述的多核苷酸,其中所述用于编码向导RNA的碱基序列的启动子序列选自U6启动子、SNR6启动子、SNR52启动子、SCR1启动子、RPR1启动子、U3启动子和H1启动子。
10.根据权利要求8或9所述的多核苷酸,其中所述用于编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列的启动子序列选自EFS启动子、EF-1α启动子、CMV启动子、CK8启动子、MHC启动子、Des启动子、CAG启动子和MYOD启动子。
11.根据权利要求8至10中任一项所述的多核苷酸,
其中所述编码向导RNA的碱基序列包含SEQ ID NO:45、46或59所示的碱基序列,或SEQID NO:45、46或59所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列,
所述转录激活子包含SEQ ID NO:117所示的氨基酸序列,或与SEQ ID NO:117所示的氨基酸序列具有至少90%同一性的氨基酸序列,
所述核酸酶缺陷型CRISPR效应蛋白是来源于金黄色葡萄球菌的dCas9,
所述用于编码向导RNA的碱基序列的启动子序列是U6启动子,且
所述用于编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列的启动子序列是CK8启动子。
12.根据权利要求11所述的多核苷酸,
其中所述编码向导RNA的碱基序列包含SEQ ID NO:59所示的碱基序列,或SEQ ID NO:59所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列。
13.一种载体,所述载体包含根据权利要求1至12中任一项所述的多核苷酸。
14.根据权利要求13所述的载体,其中所述载体是质粒载体或病毒载体。
15.根据权利要求14所述的载体,其中所述病毒载体选自腺相关病毒(AAV)载体、腺病毒载体和慢病毒载体。
16.根据权利要求15所述的载体,其中所述AAV载体选自AAV1、AAV2、AAV6、AAV7、AAV8、AAV9、AAV587MTP、AAV588MTP、AAV-B1、AAVM41、AAVrh74、AAVS1_P1和AAVS10_P1。
17.根据权利要求16所述的载体,其中所述AAV载体是AAV9。
18.一种药物组合物,所述药物组合物包含根据权利要求1至12中任一项所述的多核苷酸或根据权利要求13至17中任一项所述的载体。
19.根据权利要求18所述的药物组合物,所述药物组合物用于治疗或预防杜氏肌营养不良或贝克肌营养不良。
20.一种用于治疗或预防杜氏肌营养不良或贝克肌营养不良的方法,所述方法包括向有此需要的对象施用根据权利要求1至12中任一项所述的多核苷酸或根据权利要求13至17中任一项所述的载体。
21.根据权利要求1至12中任一项所述的多核苷酸或根据权利要求13至17中任一项所述的载体用于治疗或预防杜氏肌营养不良或贝克肌营养不良的用途。
22.根据权利要求1至12中任一项所述的多核苷酸或根据权利要求13至17中任一项所述的载体在制备用于治疗或预防杜氏肌营养不良或贝克肌营养不良的药物组合物中的用途。
23.一种核糖核蛋白,所述核糖核蛋白包含以下:
(c)核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白,和
(d)靶向人肌营养相关蛋白基因的表达调节区中SEQ ID NO:104、105、135、141、153、167或172所示区域中长度为18至24个核苷酸的连续区域的向导RNA。
24.一种组合物或试剂盒,所述组合物或试剂盒包含以下用于激活人肌营养相关蛋白基因的表达:
(e)核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白,或编码所述融合蛋白的多核苷酸,和
(f)靶向人肌营养相关蛋白基因的表达调节区中SEQ ID NO:104、105、135、141、153、167或172所示区域中长度为18至24个核苷酸的连续区域的向导RNA,或编码所述向导RNA的多核苷酸。
25.一种用于治疗或预防DUCCHENNE肌营养不良或贝克肌营养不良的方法,所述方法包括向有此需要的对象施用以下(e)和(f):
(e)核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白,或编码所述融合蛋白的多核苷酸,和
(f)靶向人肌营养相关蛋白基因的表达调节区中SEQ ID NO:104、105、135、141、153、167或172所示区域中长度为18至24个核苷酸的连续区域的向导RNA,或编码所述向导RNA的多核苷酸。
26.以下(e)和(f)在制备用于治疗或预防杜氏肌营养不良或贝克肌营养不良的药物组合物中的用途:
(e)核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白,或编码所述融合蛋白的多核苷酸,和
(f)靶向人肌营养相关蛋白基因的表达调节区中SEQ ID NO:104、105、135、141、153、167或172所示区域中长度为18至24个核苷酸的连续区域的向导RNA,或编码所述向导RNA的多核苷酸。
CN201980075173.0A 2018-11-16 2019-11-15 通过靶向肌营养相关蛋白基因来治疗肌营养不良的方法 Active CN113271982B (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201862768474P 2018-11-16 2018-11-16
US62/768,474 2018-11-16
US201962861039P 2019-06-13 2019-06-13
US62/861,039 2019-06-13
US201962931925P 2019-11-07 2019-11-07
US62/931,925 2019-11-07
PCT/JP2019/045716 WO2020101042A1 (en) 2018-11-16 2019-11-15 Method for treating muscular dystrophy by targeting utrophin gene

Publications (2)

Publication Number Publication Date
CN113271982A true CN113271982A (zh) 2021-08-17
CN113271982B CN113271982B (zh) 2024-07-30

Family

ID=68988228

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980075173.0A Active CN113271982B (zh) 2018-11-16 2019-11-15 通过靶向肌营养相关蛋白基因来治疗肌营养不良的方法

Country Status (15)

Country Link
US (1) US11473071B2 (zh)
EP (1) EP3880255A1 (zh)
JP (2) JP7069426B2 (zh)
KR (1) KR20210093954A (zh)
CN (1) CN113271982B (zh)
AU (1) AU2019381460A1 (zh)
BR (1) BR112021009481A2 (zh)
CA (1) CA3119618A1 (zh)
CO (1) CO2021006957A2 (zh)
IL (1) IL283123A (zh)
MX (1) MX2021005720A (zh)
PH (1) PH12021551122A1 (zh)
SG (1) SG11202105030VA (zh)
TW (1) TW202033224A (zh)
WO (1) WO2020101042A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024153186A1 (zh) * 2023-01-18 2024-07-25 昆明理工大学 针对utrophin激活治疗杜氏肌营养不良的sgRNA和应用

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102008496B1 (ko) * 2013-03-25 2019-08-07 삼성전자주식회사 단일 센서를 이용하여 기구물의 이동 방향 및 속도를 검출하는 방법 및 장치.
CA3096713A1 (en) 2018-04-19 2019-10-24 The Regents Of The University Of California Compositions and methods for gene editing
EP3805386A4 (en) * 2018-06-08 2022-03-23 Modalis Therapeutics Corporation MODIFIED CAS9 PROTEIN AND USE THEREOF
CN112585266A (zh) * 2018-08-07 2021-03-30 摩大力斯医疗株式会社 新型转录激活物
WO2021230385A1 (en) 2020-05-15 2021-11-18 Astellas Pharma Inc. Method for treating muscular dystrophy by targeting utrophin gene
US20230272433A1 (en) 2020-09-29 2023-08-31 Genethon Enhancing Utrophin Expression in Cell by Inducing Mutations Within Utrophin Regulatory Elements and Therapeutic Use Thereof
KR102421411B1 (ko) 2021-10-29 2022-07-18 주식회사 케이에스비튜젠 옥시라세탐을 포함하는 근이영양증 예방 또는 치료용 조성물
JP2024516750A (ja) 2021-04-26 2024-04-16 ケイエスビー トゥジェン インコーポレイテッド オキシラセタムを含む筋肉疾患の予防または治療用組成物
CN113563428B (zh) * 2021-06-22 2022-08-02 呈诺再生医学科技(珠海横琴新区)有限公司 特定空间结构多肽及其在制备iPSC中的应用
WO2023190935A1 (en) * 2022-03-31 2023-10-05 Modalis Therapeutics Corporation Method for treating myopathies by targeting titin gene

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1439051A (zh) * 2000-04-28 2003-08-27 肖啸 编码抗肌萎缩蛋白小基因的dna序列及其使用方法
CN104540946A (zh) * 2012-05-16 2015-04-22 Rana医疗有限公司 用于调节utrn表达的组合物和方法
CN105658805A (zh) * 2013-06-05 2016-06-08 杜克大学 Rna指导的基因编辑和基因调节
US20160303255A1 (en) * 2013-08-05 2016-10-20 Consiglio Nazionale Delle Richerche Compositions and methods for treatment of muscular dystrophy
WO2017139505A2 (en) * 2016-02-11 2017-08-17 The Regents Of The University Of California Methods and compositions for modifying a mutant dystrophin gene in a cell's genome
WO2018169983A1 (en) * 2017-03-13 2018-09-20 President And Fellows Of Harvard College Methods of modulating expression of target nucleic acid sequences in a cell

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2448120A1 (en) 2001-05-24 2002-11-28 Genzyme Corporation Muscle-specific expression vectors
NZ532635A (en) 2001-11-13 2007-05-31 Univ Pennsylvania A method of identifying unknown adeno-associated virus (AAV) sequences and a kit for the method
DK2292780T3 (en) 2003-09-30 2017-12-04 Univ Pennsylvania Clades and sequences of adeno-associated virus (AAV), vectors containing them, and uses thereof
CA2553676A1 (en) 2004-01-28 2005-08-11 Research Development Foundation Human soluble neuropilin-1 primary polyadenylation signal and uses thereof
ITRM20070523A1 (it) 2007-10-05 2009-04-06 Consiglio Nazionale Ricerche Acido nucleico codificante per una proteina regolatrice specifica della trascrizione dell'utrofina proteina da esso codificata e sue applicazioni
CN103189507A (zh) 2010-10-27 2013-07-03 学校法人自治医科大学 用于向神经系统细胞导入基因的腺相关病毒粒子
DK2800811T3 (en) 2012-05-25 2017-07-17 Univ Vienna METHODS AND COMPOSITIONS FOR RNA DIRECTIVE TARGET DNA MODIFICATION AND FOR RNA DIRECTIVE MODULATION OF TRANSCRIPTION
TW201642837A (zh) 2015-03-24 2016-12-16 Kyowa Hakko Kirin Co Ltd 含有核酸之脂質奈米粒子
WO2017049407A1 (en) * 2015-09-23 2017-03-30 UNIVERSITé LAVAL Modification of the dystrophin gene and uses thereof
US11674128B2 (en) * 2016-12-12 2023-06-13 Tsinghua University Engineering of a minimal SaCas9 CRISPR/Cas system for gene editing and transcriptional regulation optimized by enhanced guide RNA
CN110612113B (zh) * 2017-02-07 2024-03-26 加利福尼亚大学董事会 单倍体机能不全的基因疗法
WO2018204764A1 (en) * 2017-05-05 2018-11-08 Camp4 Therapeutics Corporation Identification and targeted modulation of gene signaling networks
CN112040988A (zh) 2018-04-27 2020-12-04 海德堡大学 修饰的aav衣壳多肽用于治疗肌肉疾病
WO2019236081A1 (en) * 2018-06-06 2019-12-12 Salk Institute For Biological Studies Targeted gene activation using modified guide rna

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1439051A (zh) * 2000-04-28 2003-08-27 肖啸 编码抗肌萎缩蛋白小基因的dna序列及其使用方法
CN104540946A (zh) * 2012-05-16 2015-04-22 Rana医疗有限公司 用于调节utrn表达的组合物和方法
CN105658805A (zh) * 2013-06-05 2016-06-08 杜克大学 Rna指导的基因编辑和基因调节
US20160303255A1 (en) * 2013-08-05 2016-10-20 Consiglio Nazionale Delle Richerche Compositions and methods for treatment of muscular dystrophy
WO2017139505A2 (en) * 2016-02-11 2017-08-17 The Regents Of The University Of California Methods and compositions for modifying a mutant dystrophin gene in a cell's genome
WO2018169983A1 (en) * 2017-03-13 2018-09-20 President And Fellows Of Harvard College Methods of modulating expression of target nucleic acid sequences in a cell

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
LIAO HK等: "In Vivo Target Gene Activation via CRISPR/Cas9-Mediated Trans-epigenetic Modulation", 《CELL》, vol. 171, no. 07, pages 1495 - 1507 *
MIN YL等: "CRISPR Correction of Duchenne Muscular Dystrophy", 《ANNU REV MED》, vol. 70, pages 239 - 255, XP055661993, DOI: 10.1146/annurev-med-081117-010451 *
WOJTAL D等: "Spell Checking Nature: Versatility of CRISPR/Cas9 for Developing Treatments for Inherited Disorders", 《AM J HUM GENET》, vol. 98, no. 01, pages 90 - 101, XP029381495, DOI: 10.1016/j.ajhg.2015.11.012 *
WONG TWY等: "Therapeutic Applications of CRISPR/Cas for Duchenne Muscular Dystrophy", 《CURR GENE THER》, vol. 17, no. 04, pages 301 - 308 *
董奇超等: "Duchenne型肌营养不良基因治疗研究进展", 《中国当代儿科杂志》, vol. 20, no. 08, pages 691 - 697 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024153186A1 (zh) * 2023-01-18 2024-07-25 昆明理工大学 针对utrophin激活治疗杜氏肌营养不良的sgRNA和应用

Also Published As

Publication number Publication date
PH12021551122A1 (en) 2021-11-22
CN113271982B (zh) 2024-07-30
US20210355464A1 (en) 2021-11-18
JP2022509560A (ja) 2022-01-20
KR20210093954A (ko) 2021-07-28
MX2021005720A (es) 2021-07-21
JP7069426B2 (ja) 2022-05-17
US11473071B2 (en) 2022-10-18
AU2019381460A1 (en) 2021-06-17
IL283123A (en) 2021-06-30
WO2020101042A1 (en) 2020-05-22
WO2020101042A8 (en) 2020-07-30
JP2022115976A (ja) 2022-08-09
EP3880255A1 (en) 2021-09-22
CA3119618A1 (en) 2020-05-22
SG11202105030VA (en) 2021-06-29
CO2021006957A2 (es) 2021-06-10
TW202033224A (zh) 2020-09-16
BR112021009481A2 (pt) 2021-08-17

Similar Documents

Publication Publication Date Title
CN113271982B (zh) 通过靶向肌营养相关蛋白基因来治疗肌营养不良的方法
ES2659031T3 (es) Vectores y secuencias para el tratamiento de enfermedades
CA2457652C (en) Soluble t cell receptor
AU2018235957B2 (en) Engraftable cell-based immunotherapy for long-term delivery of therapeutic proteins
CN107904254B (zh) 一种应用大肠杆菌胞外生产n-糖基化重组蛋白的方法
CN105154462B (zh) 一种利用骨架蛋白Fn3在大肠杆菌体内建立N-糖基化受体蛋白模型的方法
CN112779292B (zh) 构建瘦肉率高、生长快且抗蓝耳病和系列腹泻病的优质猪核移植供体细胞的方法及其应用
CN112779291B (zh) 构建瘦肉率高、生长快、繁殖力高且抗系列流行病的优质猪核移植供体细胞的方法及其应用
CN111417407A (zh) 用于非清髓性骨髓重建的方法和组合物
CN105154461B (zh) 一种利用骨架蛋白Fn3在大肠杆菌体内建立N-糖基化效率检测受体蛋白模型的方法
KR20220047538A (ko) 트랜스진 발현을 위한 방법 및 조성물
CN116083398A (zh) 分离的Cas13蛋白及其应用
CN114990157B (zh) 用于构建lmna基因突变的扩张型心肌病模型猪核移植供体细胞的基因编辑系统及其应用
CN112522169B (zh) 一种高产杆菌霉素l的基因工程菌及其构建方法和应用
KR20220142502A (ko) 근육 특이적 핵산 조절 요소 및 이의 방법 및 용도
CN110139676A (zh) 使用病毒的基因编辑方法
CN115298307A (zh) 核酸调节元件的新组合及其方法和用途
KR101956042B1 (ko) 표적 단백질 내 l-디하이드록시페닐알라닌의 도입 방법
CN106191087B (zh) 一种基于骨架蛋白Fn3制备流感嗜血杆菌类人源糖链的方法
CN112522309B (zh) 重症免疫缺陷猪源重组细胞及其制备方法和试剂盒
US20040224340A1 (en) Displacing a plasmid in a bacterial population
CN112575033B (zh) Crispr系统及其在构建scn1a基因突变的癫痫性脑病克隆猪核供体细胞中的应用
CN112899306B (zh) Crispr系统及其在构建gabrg2基因突变的克隆猪核供体细胞中的应用
CN112522255B (zh) CRISPR/Cas9系统及其在构建胰岛素受体底物基因缺陷的猪源重组细胞中的应用
KR20240022552A (ko) 효소적 핵산 합성을 위한 조성물 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40055072

Country of ref document: HK

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20231129

Address after: Tokyo, Japan

Applicant after: Morris Medical Co.,Ltd.

Address before: Tokyo, Japan

Applicant before: ASTELLAS PHARMA Inc.

Applicant before: Morris Medical Co.,Ltd.

GR01 Patent grant
GR01 Patent grant