CN116987686A - 一种工程优化的核酸酶、向导rna、编辑系统和应用 - Google Patents

一种工程优化的核酸酶、向导rna、编辑系统和应用 Download PDF

Info

Publication number
CN116987686A
CN116987686A CN202210442471.2A CN202210442471A CN116987686A CN 116987686 A CN116987686 A CN 116987686A CN 202210442471 A CN202210442471 A CN 202210442471A CN 116987686 A CN116987686 A CN 116987686A
Authority
CN
China
Prior art keywords
sequence
nuclease
gene
ascas12f1
guide rna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210442471.2A
Other languages
English (en)
Inventor
季泉江
吴兆韡
潘登
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ShanghaiTech University
Original Assignee
ShanghaiTech University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ShanghaiTech University filed Critical ShanghaiTech University
Priority to CN202210442471.2A priority Critical patent/CN116987686A/zh
Priority to PCT/CN2022/113357 priority patent/WO2023206872A1/zh
Publication of CN116987686A publication Critical patent/CN116987686A/zh
Pending legal-status Critical Current

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/10Cells modified by introduction of foreign genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Epidemiology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Mycology (AREA)
  • Cell Biology (AREA)
  • Immunology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明属于生物医药领域,公开了一种工程优化的极小型CRISPR/AsCas12f1的新型基因组编辑系统及其方法和应用,其包括:一种新型工程优化向导RNA变体,及包含该变体序列的表达构建体;多种工程优化的AsCas12f1核酸酶变体,及包含这些变体序列的表达构建体。本发明公开的工程优化的CRISPR/AsCas12f1基因编辑系统,其特征在于野生向导RNA或向导RNA变体与野生AsCas12f1核酸酶或其变体的任意组合。利用本发明优化的基因编辑系统可以实现细胞内的精准编辑基因编辑;且具有极高的编辑效率与适用性。

Description

一种工程优化的核酸酶、向导RNA、编辑系统和应用
技术领域
本发明属于生物技术领域,具体涉及一种一种工程优化的核酸酶、向导RNA、编辑系统和应用,特别涉及一种工程优化的极小型CRISPR/AsCas12f1的新型基因组编辑系统及其应用和编辑方法。
背景技术
基因组编辑技术是指利用基因编辑机器,例如可编程的核酸酶(分子剪刀),打断特定的基因序列,进而引入基因的插入、缺失或置换,实现对生物体基因组DNA特定片段进行改造,从而达到对目标基因进行编辑的一种基因工程技术。
自CRISPR/Cas(Clustered regularly interspaced short palindromicrepeats)基因组编辑系统问世以来,由于其简便性和高效性,已经被广泛应用于生物学、医学、农业等各领域的基础与应用研究。Cas核酸酶利用向导RNA可在多种细胞的基因组特定靶点定位,对其进行切割从而产生DNA双链断裂,然后利用细胞内源或外加的DNA修复机制,例如同源重组和非同源重组末端连接的修复机制实现编辑。根据不同DNA修复通路的激活,基因组编辑将会导致基因的失活或者突变的校正。通过融合失活的Cas核酸酶与碱基脱氨酶或者逆转录酶,CRISPR/Cas系统还可以进一步被改造成碱基编辑系统和先导编辑系统,广泛应用于生物学、农学研究以及疾病治疗。
目前广泛使用的CRISPR/Cas基因组编辑系统主要包括以CRISPR/Cas9和CRISPR/Cas12a两种类型。在这两种类型的基因组编辑系统中,CRISPR效应蛋白核酸酶Cas9和Cas12a均是含有超过1000个氨基酸的大型蛋白,以其为核心开发的基因编辑器均具有较大的分子尺寸,难以被腺相关病毒等常用载体有效包装和递送,这导致CRISPR/Cas9和CRISPR/Cas12a在向细胞递送过程中存在巨大问题。现有技术中存在的极小型核酸酶CRISPR-AsCas12f1基因编辑系统其核酸酶仅包含422个氨基酸,基因尺寸不到Cas9和Cas12a的一半,天然具有基因编辑能力,可在细菌和哺乳动物细胞中实现高效的基因编辑。得益于其紧凑的分子尺寸,无论CRISPR-AsCas12f1基因编辑系统自身,还是其衍生基因编辑工具都能十分容易的实现单AAV的包装与递送。但目前天然AsCas12f1核酸酶的基因编辑能力仍相对低于广泛应用的Cas9和Cas12a核酸酶,限制了AsCas12f1核酸酶在基因编辑领域的应用。因此,对CRISPR-AsCas12f1基因编辑系统进行工程化改造提高基因编辑的活性意义重大。
发明内容
本发明所要解决的技术问题是克服现有技术中极小型核酸酶的低基因编辑效率,提供一种工程优化的基因编辑系统及其应用和方法:特别是工程优化的极小型CRISPR/AsCas12f1的新型基因组编辑系统及其应用编辑方法。利用本发明中的优化基因编辑系统或者方法可以在细胞内的目标基因上进行精准敲除或精准编辑。
本发明主要通过以下技术方案解决上述技术问题。
本发明的目的之一是提供一种突变型AsCas12f1核酸酶,所述突变型AsCas12f1核酸酶与野生型AsCas12f1核酸酶具有至少50%以上同一性,且相对于野生型AsCas12f1核酸酶包含第80位、第104位、第364位氨基酸中的一个或几个位点突变。
本发明另一目的是提供一种突变型向导RNA,其包含tracrRNA序列和crRNA序列;所述crRNA序列包含能够与靶序列杂交的基因靶向区段和tracr配对物序列;所述tracrRNA序列和tracr配对物序列构成向导RNA的骨架序列;
其中,所述tracrRNA包含如SEQ ID NO.47所示的核苷酸序列或其变体序列;
所述tracr配对物序列包含如SEQ ID NO.48所示的核苷酸序列或其变体序列。
优选地,所述向导RNA还包括连接链序列。
本发明的另一目的是提供一种分离的多核苷酸,其编码如上所述的突变型AsCas12f1核酸酶或如上所述的向导RNA。
本发明的另一目的是提供一种构建体,所述构建体单独或同时含有如上所述的分离的多核苷酸。即,编码所述突变型AsCas12f1核酸酶的分离的多核苷酸和编码所述向导RNA的分离的多核苷酸可以位于相同或不同构建体上。
本发明的另一目的是提供一种表达系统,所述表达系统含有如上所述的构建体或基因组中整合有外源的如上所述的多核苷酸。
本发明的另一目的是提供一种基因编辑系统,所述基因编辑系统包括如上所述的突变型AsCas12f1核酸酶或其编码多核苷酸,以及向导RNA或其编码多核苷酸。或,本发明所述的基因编辑系统包含核酸酶或其编码多核苷酸,以及如上所述的突变型向导RNA或其编码多核苷酸。
本发明的另一目的是提供一种药物组合物,其包含如上所述的基因编辑系统,以及药学上可接受的载体。
本发明的另一目的是提供一种基因编辑方法,将靶基因与如上所述的基因编辑系统接触,以实现靶基因的编辑。
本发明的另一目的是提供如上所述的突变型AsCas12f1核酸酶、突变型向导RNA、分离的多核苷酸、构建体、表达系统、基因编辑系统、药物组合物或方法在体内、离体细胞或无细胞环境中对靶基因和/或其相关多肽进行基因编辑中的应用。
本发明的另一目的是提供一种遗传修饰的细胞,其通过如上所述的基因编辑系统、药物组合物或所述的方法进行基因编辑获得。
本发明的积极进步效果:
本发明中,经工程优化的向导RNA变体—sgRNA_T1在测试靶点上的基因插入/删除效率相比野生向导RNA—sgRNA_V1,性能提升了5-15%。在sgRNA_T1基础上组合AsCas12f1核酸酶变体,例如AsCas12f1-K80R,AsCas12f1-A104R,AsCas12f1-D364R,AsCas12f1-A104+K80R,AsCas12f1-A104+D364R,AsCas12f1-K80R+A104+D364R均能更进一步提升基因插入/删除效率20-30%。本发明中工程优化的CRISPR/AsCas12f1基因编辑系统相比原始野生系统,在哺乳动物细胞中的11个基因的27个靶位点的基因编辑效率均有明显提高。本发明进一步提高了极小型CRISPR/Cas12f系统在细胞基因编辑中的适用性,可以实现细胞内的精准编辑基因编辑。
附图说明
图1为原始野生AsCas12f1核酸酶分别组合sgRNA_V1和sgRNA_T1的哺乳动物细胞基因编辑结果比较图。如图所示,sgRNA_T1可在APOB、HEXA、PDCD1、TP53和VEGFA基因上6个靶位点明显提升基因编辑效率。
图2为在sgRNA_T1基础上,分别组合原始野生AsCas12f1核酸酶和6种AsCas12f1核酸酶变体的哺乳动物细胞基因编辑结果比较图。如图所示,6种变体均可在APOB、PDCD1和VEGFA基因上3个靶位点上提升基因编辑效率。其中AsCas12f1-Evo1效果最佳。
图3为原始野生CRISPR/AsCas12f1系统与工程优化的CRISPR/AsCas12f1系统在哺乳动物细胞中基因编辑效果的比较图。如图所示,工程优化后的CRISPR/AsCas12f1基因编辑系统可11个基因的27个靶位点上显著提升基因编辑效率。
图4为原始野生CRISPR/AsCas12f1系统与工程优化的CRISPR/AsCas12f1系统在体外切割DNA效果的比较图。如图所示,工程优化后的CRISPR/AsCas12f1基因编辑系统能显著提升体外DNA切割的速度。
图1~4中,WT代表野生型AsCas12f1核酸酶,V1代表野生型向导RNA-sgRNA_V1,T1代表向导RNA变体-sgRNA_T1。
具体实施方式
为更好的说明本发明的目的、技术方案和积极进步的效果,下面将结合附图和具体实施例对本发明作进一步阐述。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。例如,通过融合失活的工程优化AsCas12f1和碱基脱氨酶开发基于AsCas12f1的单碱基编辑系统;通过融合失活的AsCas12f1和逆转录酶开发基于AsCas12f1的Prime编辑系统;通过融合失活的AsCas12f1和转录激活因子,开发基于AsCas12f1的转录激活系统;通过融合失活的AsCas12f1核酸表观修饰酶,开发基于AsCas12f1的表观修饰系统;利用失活的AsCas12f1,开发基于AsCas12f1的转录抑制系统。
本发明中主要使用的CRISPR系统是V-F型CRISPR/Cas12f系统,其中效应蛋白主要为原始野生Acidibacillus sulfuroxidans Cas12f1(AsCas12f1)核酸酶及其各种变体,其中向导RNA主要为原始野生sgRNA_V1和变体sgRNA_T1。AsCas12f1核酸酶或其变体在对应的向导RNA或变体的指导下能准确定位到目标基因,对基因组DNA进行切割,实现基因组DNA双链断裂。利用宿主细胞自身或外源的修复机制,该系统能够高效和精确地实现活细胞内基因编辑。
本发明的目的之一是提供一种突变型AsCas12f1核酸酶,所述突变型AsCas12f1核酸酶与野生型AsCas12f1核酸酶具有至少50%以上同一性,且相对于野生型AsCas12f1核酸酶包含第80位、第104位、第364位氨基酸中的一个或几个位点突变;即所述变异型AsCas12f1核酸酶可以包括一个第80位氨基酸的突变,或一个第104位氨基酸的突变,或一个第364位氨基酸的突变,或同时包含第80位和第104位氨基酸的突变,或同时包含第80位和第364位氨基酸的突变,或同时包含第80位、第104位和第364位氨基酸的突变。所述各位点突变后的氨基酸可以相同或不同,优选地,各位点突变后的氨基酸相同,即当所述突变型AsCas12f1核酸酶包含两个或三个位点突变时,所述两个突变或三个突变位点突变为相同或不同的氨基酸,优选突变为相同的氨基酸;例如,两个突变或三个突变位点突变为与野生型位点不同的其他任一氨基酸。在一些实施方式中,所述突变是指突变为精氨酸。在一些实施方式中,一个氨基酸的突变是指突变为精氨酸。在另一些实施方式中,两个或三个氨基酸的突变是指突变为精氨酸。在一些实施方式中,本发明提供一种或几种工程优化的AsCas12f1核酸酶变体,及包含这些变体序列的表达构建体。
本发明所述的AsCas12f1核酸酶变体有AsCas12f1-K80R,AsCas12f1-A104R,AsCas12f1-D364R,AsCas12f1-A104+K80R,AsCas12f1-A104+D364R,AsCas12f1-K80R+A104+D364R。其中最优选的变体为AsCas12f1-K80R+A104+D364R(以下简称AsCas12f1-Evo1)。
其中,变体AsCas12f1-K80R氨基酸序列优选包含如下所示的序列:MIKVYRYEIVKPLDLDWKEFGTILRQLQQETRFALNKATQLAWEWMGFSSDYKDNHGEYPKSKDILGYTNVHGYAYHTIRTKAYRLNSGNLSQTIKRATDRFKAYQKEILRGDMSIPSYKRDIPLDLIKENISVNRMNHGDYIASLSLLSNPAKQEMNVKRKISVIIIVRGAGKTIMDRILSGEYQVSASQIIHDDRKNKWYLNISYDFEPQTRVLDLNKIMGIDLGVAVAVYMAFQHTPARYKLEGGEIENFRRQVESRRISMLRQGKYAGGARGGHGRDKRIKPIEQLRDKIANFRDTTNHRYSRYIVDMAIKEGCGTIQMEDLTNIRDIGSRFLQNWTYYDLQQKIIYKAEEAGIKVIKIDPQYTSQRCSECGNIDSGNRIGQAIFKCRACGYEANADYNAARNIAIPNIDKIIAESIK(SEQ ID NO.1);
变体AsCas12f1-A104R氨基酸序列优选包含如下所示的序列:MIKVYRYEIVKPLDLDWKEFGTILRQLQQETRFALNKATQLAWEWMGFSSDYKDNHGEYPKSKDILGYTNVHGYAYHTIKTKAYRLNSGNLSQTIKRATDRFKRYQKEILRGDMSIPSYKRDIPLDLIKENISVNRMNHGDYIASLSLLSNPAKQEMNVKRKISVIIIVRGAGKTIMDRILSGEYQVSASQIIHDDRKNKWYLNISYDFEPQTRVLDLNKIMGIDLGVAVAVYMAFQHTPARYKLEGGEIENFRRQVESRRISMLRQGKYAGGARGGHGRDKRIKPIEQLRDKIANFRDTTNHRYSRYIVDMAIKEGCGTIQMEDLTNIRDIGSRFLQNWTYYDLQQKIIYKAEEAGIKVIKIDPQYTSQRCSECGNIDSGNRIGQAIFKCRACGYEANADYNAARNIAIPNIDKIIAESIK(SEQ ID NO.2);
变体AsCas12f1-D364R氨基酸序列优选包含如下所示的序列:MIKVYRYEIVKPLDLDWKEFGTILRQLQQETRFALNKATQLAWEWMGFSSDYKDNHGEYPKSKDILGYTNVHGYAYHTIKTKAYRLNSGNLSQTIKRATDRFKAYQKEILRGDMSIPSYKRDIPLDLIKENISVNRMNHGDYIASLSLLSNPAKQEMNVKRKISVIIIVRGAGKTIMDRILSGEYQVSASQIIHDDRKNKWYLNISYDFEPQTRVLDLNKIMGIDLGVAVAVYMAFQHTPARYKLEGGEIENFRRQVESRRISMLRQGKYAGGARGGHGRDKRIKPIEQLRDKIANFRDTTNHRYSRYIVDMAIKEGCGTIQMEDLTNIRDIGSRFLQNWTYYDLQQKIIYKAEEAGIKVIKIRPQYTSQRCSECGNIDSGNRIGQAIFKCRACGYEANADYNAARNIAIPNIDKIIAESIK(SEQ ID NO.3);
变体AsCas12f1-A104R+K80R氨基酸序列优选包含如下所示的序列:MIKVYRYEIVKPLDLDWKEFGTILRQLQQETRFALNKATQLAWEWMGFSSDYKDNHGEYPKSKDILGYTNVHGYAYHTIRTKAYRLNSGNLSQTIKRATDRFKRYQKEILRGDMSIPSYKRDIPLDLIKENISVNRMNHGDYIASLSLLSNPAKQEMNVKRKISVIIIVRGAGKTIMDRILSGEYQVSASQIIHDDRKNKWYLNISYDFEPQTRVLDLNKIMGIDLGVAVAVYMAFQHTPARYKLEGGEIENFRRQVESRRISMLRQGKYAGGARGGHGRDKRIKPIEQLRDKIANFRDTTNHRYSRYIVDMAIKEGCGTIQMEDLTNIRDIGSRFLQNWTYYDLQQKIIYKAEEAGIKVIKIDPQYTSQRCSECGNIDSGNRIGQAIFKCRACGYEANADYNAARNIAIPNIDKIIAESIK(SEQ ID NO.4);
突变体AsCas12f1-A104R+D364R氨基酸序列优选包含如下所示的序列:MIKVYRYEIVKPLDLDWKEFGTILRQLQQETRFALNKATQLAWEWMGFSSDYKDNHGEYPKSKDILGYTNVHGYAYHTIKTKAYRLNSGNLSQTIKRATDRFKRYQKEILRGDMSIPSYKRDIPLDLIKENISVNRMNHGDYIASLSLLSNPAKQEMNVKRKISVIIIVRGAGKTIMDRILSGEYQVSASQIIHDDRKNKWYLNISYDFEPQTRVLDLNKIMGIDLGVAVAVYMAFQHTPARYKLEGGEIENFRRQVESRRISMLRQGKYAGGARGGHGRDKRIKPIEQLRDKIANFRDTTNHRYSRYIVDMAIKEGCGTIQMEDLTNIRDIGSRFLQNWTYYDLQQKIIYKAEEAGIKVIKIRPQYTSQRCSECGNIDSGNRIGQAIFKCRACGYEANADYNAARNIAIPNIDKIIAESIK(SEQ ID NO.5);
变体AsCas12f1-K80R+A104R+D364R(后称AsCas12f1-Evo1)氨基酸序列优选包含如下所示的序列:
MIKVYRYEIVKPLDLDWKEFGTILRQLQQETRFALNKATQLAWEWMGFSSDYKDNHGEYPKSKDILGYTNVHGYAYHTIRTKAYRLNSGNLSQTIKRATDRFKRYQKEILRGDMSIPSYKRDIPLDLIKENISVNRMNHGDYIASLSLLSNPAKQEMNVKRKISVIIIVRGAGKTIMDRILSGEYQVSASQIIHDDRKNKWYLNISYDFEPQTRVLDLNKIMGIDLGVAVAVYMAFQHTPARYKLEGGEIENFRRQVESRRISMLRQGKYAGGARGGHGRDKRIKPIEQLRDKIANFRDTTNHRYSRYIVDMAIKEGCGTIQMEDLTNIRDIGSRFLQNWTYYDLQQKIIYKAEEAGIKVIKIRPQYTSQRCSECGNIDSGNRIGQAIFKCRACGYEANADYNAARNIAIPNIDKIIAESIK(SEQ ID NO.6)。
本发明另一目的是提供一种突变型向导RNA(gRNA),其包含tracrRNA序列和crRNA序列和连接链序列;所述crRNA序列包含能够与靶序列杂交的基因靶向区段和tracr配对物序列;所述tracrRNA序列和tracr配对物序列构成向导RNA的骨架序列;
其中,所述tracrRNA包含如SEQ ID NO.47所示的核苷酸序列或其变体序列;所述tracr配对物序列包含如SEQ ID NO.48所示的核苷酸序列或其变体序列。
野生型sgRNA_V1对应的tracrRNA序列:
5’-auucgucgguucagcgacgauaagccgagaagugccaauaaaacuguuaagugguuugguaacgcucgguaagguagccaaaaggcugaaacuccgugcacaaagaccgcacggacgcuucacauauagcucauaaac(SEQID NO.47);
在一实施方式中,所述变体的tracrRNA序列为SEQ ID NO.50,即sgRNA_T1对应的tracrRNA序列:
5’-auucgucgguucagcgacgauaagccgagaagugccaauaaaacuguuaagugguuugguaacgcucgguaagguagccaaaaggcugaaacuccgugcacaaagaccgcacggacgcuucaca(SEQ ID NO.50);
野生型sgRNA_V1对应的tracrRNA配对物序列:
5’-guuugcgagcuagcuuguggagugugaac(SEQ ID NO.48);
在一实施方式中,所述变体的tracrRNA配对物序列为SEQ ID NO.51,即sgRNA_T1对应的tracrRNA配对物序列:5’-uguggagugugaac(SEQ ID NO.51);
本发明所述向导RNA中,所述tracr RNA序列和tracr配对物序列之间还包括连接链序列;优选地,所述连接链序列包含5’-AAGG、5’-UACU或其变体序列。所述连接链的变体序列是在5’-AAGG、5’-UACU序列的基础上,增加、减少或替换一个或多个核苷酸后获得的序列。本发明所述的野生型sgRNA_V1中tracr RNA序列和tracr配对物序列之间的连接链序列为:5’-AAGG。在一实施方式中,突变型sgRNA_T1中tracr RNA序列和tracr配对物序列之间的连接链序列为:5’-UACU。
本发明所述突变型向导RNA包含在所述tracrRNA中互补配对的碱基对的一个或多个中,配对碱基互换位置后获得的tracrRNA。例如,tracrRNA的第7位碱基C与第16位碱基G互补配对,在将7位设置为G,第16位设置为C后获得的tracrRNA也能实现本发明的技术效果。
本发明所述突变型向导RNA包含在tracrRNA与tracr配对物序列互补配对的碱基对的一个或多个中,配对碱基互换位置后获得的tracrRNA和tracr配对物序列。例如,tracrRNA第119位碱基U与tracr配对物的第21位碱基A互补配对,在将tracrRNA第119位碱基设置为A,tracr配对物第21位设置为U后获得的tracrRNA和tracr配对物序列也能实现本发明的技术效果。
本发明所述突变型向导RNA中,所述基因靶向区段为与靶基因中的靶序列互补的核苷酸序列,位于所述crRNA序列的3’端;所述基因靶向区段识别靶向序列上的PAM序列;优选PAM序列为5’-TTR,其中R代表A或G。所述基因靶向区段靶向PAM序列之后长度为12~40bp的核酸片段;例如可以是13-20、18-25、22-32、26-37、30-38、32-40个核苷酸的长度,优选的长度为20bp。在一实施方式中,所述的基因靶向区段较佳地为PAM序列之后长度为20bp的核酸片段所对应的RNA序列。在一优选实施方式中,所述基因靶向区段选自SEQ ID NO.19。本发明中,所述向导RNA的靶向区段与靶基因的靶序列之间的互补性百分比可以为至少50%(例如,至少55%,至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少97%,至少98%,至少99%或100%)。本发明所述突变型向导RNA中,所述基因靶向区段靶向细胞基因组中的至少一个靶序列。
在一些实施方式中,所述突变型向导RNA还包含转录终止子。
本发明所述突变型向导RNA中,所述向导RNA可以为两条链,一条链包含tracrRNA序列,另一条链包含crRNA序列,其中所述tracr配对物序列与所述tracrRNA序列杂交,并形成茎-环结构。本发明所述向导RNA中,所述crRNA序列与所述tracrRNA序列能够通过连接链连接在一起,形成单条的向导RNA骨架序列,即所述向导RNA为一条链,其从5’端至3’端依次包含所述tracr RNA序列、连接链序列和crRNA序列。当所述向导RNA为一条链时,所述tracrRNA序列的3’端与crRNA序列的5’端通过连接链连接。
本发明所述向导RNA中,crRNA与tracrRNA序列作为两条单独的RNA序列,在同时存在情况下可以介导核酸酶如AsCas12f1核酸内切酶活性。或向导RNA骨架序列和与靶序列杂交的DNA-靶向区段连接后得到的针对靶序列的完整向导RNA表达构建体,同样可以介导核酸酶如AsCas12f1核酸内切酶活性。
本发明所述向导RNA中,所述基因靶向区段包含与靶基因中的序列互补的核苷酸序列,该基因靶向序列通过杂交(即碱基配对)以序列特异性方式与靶基因相互作用。可以通过例如基因工程的方式修饰gRNA的基因靶向序列,以使得gRNA与靶基因内的任何所需序列杂交。gRNA通过上述基因靶向序列将结合的多肽引导至靶基因内的特定核苷酸序列。
在一些实施方式中,靶基因是DNA序列。在一些实施方式中,靶基因是RNA序列。
本发明还提供了对所述向导RNA进行改造的方法,包括但不限于对trans-activating CRISPR RNA(tracrRNA)和CRISPR RNA(crRNA)的单独改造以及组合改造。所述的改造方法包括但不限于对tracrRNA或crRNA的截断、延长或替换不同序列。
本发明所述向导RNA中,所述tracrRNA的变体序列是指在所述SEQ ID NO.47所示的核苷酸序列的5’端和/或3’端增加、减少或替换部分核苷酸后获得的序列。优选地,所述tracrRNA的变体序列是指在所述SEQ ID NO.47所示的核苷酸序列的5’端和/或3’端减少核苷酸后获得的序列,即,可以只在5’端减少或截断一定个数的核苷酸,或只在3’端减少或截断一定数量的核苷酸,或同时在5’端和3’端减少或截断一定个数的核苷酸。进一步优选地,所述tracrRNA的变体序列是指在所述SEQ ID NO.47所示的核苷酸序列的5’端和/或3’端减少1~50nt核苷酸后获得的序列。进一步优选地,所述tracrRNA的变体序列是指在所述SEQID NO.47所示的核苷酸序列的3’端减少14nt核苷酸后获得的序列。
所述tracr配对物序列的变体序列是指在所述SEQ ID NO.48所示的核苷酸序列的5’端和/或3’端增加、减少或替换部分核苷酸后获得的序列;优选地,所述tracr配对物序列的变体序列是指在所述SEQ ID NO.48所示的核苷酸序列的5’端和/或3’端减少核苷酸后获得的序列。即,可以只在5’端减少或截断一定个数的核苷酸,或只在3’端减少或截断一定数量的核苷酸,或同时在5’端和3’端减少或截断一定个数的核苷酸。进一步优选地,所述tracr配对物序列的变体序列是指在所述SEQ ID NO.48所示的核苷酸序列的5’端减少1~29nt核苷酸后获得的序列。进一步优选地,所述tracr配对物序列的变体序列是指在所述SEQ ID NO.48所示的核苷酸序列的5’端减少15nt核苷酸后获得的序列。
在一些优选实施方式中,所述tracrRNA的变体序列是指在所述SEQ ID NO.47所示的核苷酸序列的3’端减少14nt核苷酸获得的序列,序列如SEQ ID NO.50所示。
在另一些优选实施方式中,所述tracr配对物序列的变体序列是指在所述SEQ IDNO.48所示的核苷酸序列的5’端减少15nt核苷酸获得的序列;序列如SEQ ID NO.51所示。
在另一些优选实施方式中,所述突变型向导RNA的骨架序列的核苷酸序列如SEQID NO.52所示。优选的向导RNA在哺乳动物细胞基因组编辑中,对同一靶序列显示有更高的基因删除和/或基因切割效率。
在一优选实施方式中,本发明提供一种CRISPR/AsCas12f1基因编辑系统的新型工程优化向导RNA(又称为sgRNA_T1),及包含该变体序列的表达构建体。本发明所述的工程优化的向导RNA序列相比原始野生型向导RNA序列(sgRNA_V1)共截短了29nt,优选的向导RNA的完整序列如下所示:5’-auucgucgguucagcgacgauaagccgagaagugccaauaaaacuguuaagugguuugguaacgcucgguaagguagccaaaaggcugaaacuccgugcacaaagaccgcacggacgcuucacauacuuguggagugugaacCUCUCAAGACCCACAAUCCA-3’(SEQ ID NO.9);其中,tracrRNA序列如SEQ IDNO.50所示;tracr配对物序列如SEQ ID NO.51所示;骨架序列为SEQ ID NO.9中不含靶向基因区段的序列,为5’-auucgucgguucagcgacgauaagccgagaagugccaauaaaacuguuaagugguuugguaacgcucgguaagguagccaaaaggcugaaacuccgugcacaaagaccgcacggacgcuucacauacuuguggagugugaac(SEQ ID NO.52)。
其中下划线部分为所述的靶向序列:5’-CUCUCAAGACCCACAAUCCA-3’(SEQ IDNO.19);可与靶基因上优选的PAM序列之后长度为20bp的DNA片段进行碱基互补配对。优选的PAM序列为5’-TTR,其中R代表A或G。划线序列可根据靶基因位点的不同进行相应的替换。
野生型向导RNA序列(sgRNA_V1)的完整序列如SEQ ID NO.10所示:5’-auucgucgguucagcgacgauaagccgagaagugccaauaaaacuguuaagugguuugguaacgcucgguaagguagccaaaaggcugaaacuccgugcacaaagaccgcacggacgcuucacauauagcucauaaacAAGG guuugcgagcuagcuuguggagugugaacCUCUCAAGACCCACAAUCCA-3’;其中,tracrRNA序列如SEQ ID NO.47所示;tracr配对物序列如SEQ ID NO.48所示;骨架序列为5’-auucgucgguucagcgacgauaagccgagaagugccaauaaaacuguuaagugguuugguaacgcucgguaagguagccaaaaggcugaaacuccgugcacaaagaccgcacggacgcuucacauauagcucauaaacAAGG guuugcgagcuagcuuguggagugugaac(SEQ ID NO.49)。
本发明还提供了修饰型突变向导RNA,其可以通过修饰用于实现与靶基因内的任何所需序列杂交;或者,通过对gRNA修饰来改变gRNA本身的特性,如通过修饰增强gRNA的稳定性,包括但不限于通过增加其对细胞中存在的核糖核酸酶(RNase)降解的抗性,从而延长其在细胞中的半衰期;或者,其可以通过修饰用于增强包含gRNA和核酸内切酶(例如AsCas12f1核酸酶)的CRISPR-AsCas12f1基因组编辑复合体的形成或其稳定性;或者,其可以通过修饰用于增强基因组编辑复合体的特异性;或者,其可以通过修饰用于增强基因组编辑复合体与基因组中靶序列之间相互作用的起始位点,稳定性或动力学;或者,其可以通过修饰用于降低引入细胞中的RNA引发先天免疫反应的可能性或程度等。本发明中,可以通过对gRNA修饰来改变CRISPR-AsCas12f1系统(如下文中所述)的多种特性,如增强CRISPR-AsCas12f1基因组编辑复合物的形成、中靶活性、特异性、稳定性或动力学特性。可以采用本领域已知的修饰方式对RNA进行修饰,包括但不限于在嘧啶的核糖、碱基残基或RNA的3'端的反向碱基上的2'-氟、2'-氨基修饰等。本发明中,可以采用任意一种修饰或多种修饰组合对gRNA进行修饰。在一些实施方式中,通过修饰引入细胞中的sgRNA,以编辑任何一个或多个基因组的基因座。
本发明的另一目的是提供一种分离的多核苷酸,其编码如上所述的突变型AsCas12f1核酸酶或如上所述的向导RNA。
本发明的另一目的是提供一种构建体,所述构建体含有如上所述的分离的多核苷酸。所述构建体通常可以通过将所述分离的多核苷酸插入合适的表达载体中构建获得,本领域技术人员可选择合适的表达载体。所述构建体例如可以是重组表达载体,可以使用任何合适的表达载体,只要它与宿主细胞相容即可,包括但不限于,病毒载体(例如基于痘苗病毒的病毒载体;脊髓灰质炎病毒;腺病毒;腺相关病毒;SV40;单纯疱疹病毒;人免疫缺陷病毒;反转录病毒载体(例如鼠白血病病毒,脾脏坏死病毒,以及衍生自反转录病毒的载体,例如劳斯肉瘤病毒,Harvey肉瘤病毒,禽类白血病病毒,慢病毒,人免疫缺陷病毒,骨髓增生肉瘤病毒和乳腺肿瘤病毒)等。
在某些实施方式中,在相同细胞中同时使用多种核酸酶或gRNA以同时调节相同靶基因或不同靶基因上的不同位置的转录。当多个核酸酶或gRNA同时使用时,它们可以存在于相同的表达载体上或不同的载体上,也可以同时表达;当存在于相同的载体上时,它们可以在相同的控制元件下进行表达。
在某些实施方式中,编码核酸酶或gRNA的核苷酸序列可操作地连接至控制元件,例如转录控制元件,例如启动子。在某些实施方式中,编码核酸酶或gRNA的核苷酸序列可操作地连接至诱导型启动子。在某些实施方式中,编码核酸酶或gRNA的核苷酸序列可操作地连接至组成型启动子。转录控制元件可以在真核细胞,例如哺乳动物细胞(HEK293T细胞);或原核细胞(例如细菌或古细菌细胞)中起作用。在某些实施方式中,编码核酸酶或gRNA的核苷酸序列可操作地连接至多个控制元件,其允许在原核和真核细胞两者中表达编码核酸酶或gRNA的核苷酸序列。
本发明中,所述核酸酶或gRNA可以通过人工合成方式进行合成,从而使得能够容易地对其进行多种修饰。所述修饰可以采用本领域公知的任何修饰方式,例如,使用polyA尾巴,添加5'帽类似物,5'或3'非翻译区(UTR),5'或3'端包括硫代磷酸化2’-O-甲基核苷酸或用磷酸酶处理以去除5'末端磷酸酯等。
在一些实施方案中,所述编码核酸酶或gRNA的核苷酸序列包含一种或多种修饰,其可用于例如增强活性,稳定性或特异性,改变递送,减少宿主细胞中的先天免疫应答或用于其他增强。
在一些实施方式中,将增强编码核酸酶或gRNA的核苷酸序列的活性,细胞分布或细胞摄取的一个或多个靶向部分或缀合物化学连接至核酸酶或gRNA。所述靶向部分或缀合物可包括与功能基团共价结合的缀合物基团;缀合物基团包括报告分子,多胺,聚乙二醇。在一些实施方式中,将增强药效学性质的基团连接至核酸酶或gRNA,增强药效学性质的基团包括改善摄取,增强对降解的抗性和/或增强与靶核酸的序列特异性杂交的基团。
本发明中,包含编码核酸酶或gRNA的多核苷酸的核酸可以是核酸模拟物。例如具有优良杂交性质的多核苷酸模拟物肽核酸等。
本发明中,所述核酸酶或gRNA,或编码核酸酶或gRNA的多核苷酸适用任何生物或体外环境,包括但不限于是细菌、古细菌、真菌、原生生物、植物或动物。相应地,适用的靶细胞包括但不限于细菌细胞、古细菌细胞、真菌细胞、原生生物细胞、植物细胞或动物细胞。适用的靶细胞可以是任何类型的细胞,包括干细胞,体细胞等。
本发明的另一目的是提供一种表达系统,所述表达系统含有如上所述的构建体或基因组中整合有外源的如上所述的多核苷酸。所述表达系统的宿主细胞选自真核细胞或原核细胞;优选地,所述宿主细胞选自小鼠细胞、人细胞。
本发明的另一目的是提供一种基因编辑系统,所述基因编辑系统包括如上所述的突变型AsCas12f1核酸酶或其编码多核苷酸,以及向导RNA或其编码多核苷酸。或,本发明所述的基因编辑系统包含核酸酶或其编码多核苷酸,以及如上所述的突变型向导RNA或其编码多核苷酸。本发明提供的一种工程优化的CRISPR/AsCas12f1基因编辑系统特征在于野生向导RNA或向导RNA变体与野生AsCas12f1核酸酶或其变体的任意组合使用。当满足以下任一条件即可视为属于该系统范畴:
(1)野生型AsCas12f1核酸酶与优选的向导RNA变体—sgRNA_T1的组合使用。
(2)任意优选的AsCas12f1核酸酶变体与野生型向导RNA—sgRNA_V1的组合使用。
(3)任意优选的AsCas12f1核酸酶变体与优选的向导RNA变体—sgRNA_T1的组合使用。
组合使用的方式包括但不限于本领域常规,例如,在同一构建体中同时表达野生型向导RNA或向导RNA变体与野生型AsCas12f1核酸酶或其变体;在不同构建体中分别表达野生型向导RNA或向导RNA变体与野生型AsCas12f1核酸酶或其变体;体外配伍野生型向导RNA或向导RNA变体与野生型AsCas12f1核酸酶或其变体等。
本发明所述编辑系统中,编码所述核酸酶的多核苷酸包括:只编码核酸酶的编码序列;核酸酶的编码序列和各种附加编码序列;核酸酶的编码序列(和任选的附加编码序列)以及非编码序列。编码所述向导RNA的多核苷酸包括:只编码向导RNA的编码序列;向导RNA的编码序列和各种附加编码序列;向导RNA的编码序列(和任选的附加编码序列)以及非编码序列。在一些实施方式中,所述基因编辑系统包含一个或多个载体;所述一个或多个载体包含(i)第一调控元件,所述第一调控元件可操作地连接至所述核酸酶的编码多核苷酸;以及(ii)第二调控元件,所述第二调控元件可操作地连接至所述向导RNA核苷酸序列的编码多核苷酸;所述(i)和(ii)位于相同或不同载体上。在一些实施方式中,所述基因编辑系统包含(i)核酸酶或其变体,以及(ii)包含所述向导RNA的编码序列的载体。在另一实施方式中,所述系统包含gRNA和核酸酶复合物。
所述第一调控元件可以调控所述核酸酶或其变体的编码多核苷酸的转录。所述核酸酶或其变体的编码多核苷酸可以是一个或多个,所述第一调控元件可以是一个或多个。所述第二调控元件可以调控所述向导RNA的编码多核苷酸的转录。所述向导RNA的编码多核苷酸可以是一个或多个,所述第二调控元件可以是一个或多个。
本发明所述系统可以包含一个gRNA或同时包含多个gRNA。在一实施方式中,所述系统同时包含多个gRNA以同时修饰相同靶标DNA或不同靶标DNA上的不同位置。在一实施方案中,两个或更多个向导RNA靶向相同的基因或转录本或基因座。在一实施方案中,两个或更多个向导RNA靶向不同的不相关基因座。在一些实施方案中,两个或更多个向导RNA靶向不同但相关的基因座。
本发明所述基因编辑系统中,当所述向导RNA为如上所述的突变型向导RNA时,所述核酸酶是CRISPR核酸酶;优选地,所述核酸酶选自Cas9、Cas12、Cas13蛋白家族或其变体;进一步优选地,所述Cas核酸酶选自SpCas9及其突变体、SaCas9及其突变体、Cas12a及其突变体或Cas12f及其突变体;更进一步优选为Cas12f及其突变体。在一些实施方式中,核酸酶直接作为蛋白提供;例如可以使用原生质球转化用外源蛋白和/或核酸转化真菌的方式。可以通过任何合适的方法将核酸酶引入细胞,如注射方式等。本发明所述基因编辑系统识别靶向序列上的PAM序列;优选地PAM序列为5’-TTR,其中R代表A或G。所述基因编辑系统靶向PAM序列之后长度为12~40bp的核酸片段,优选的长度为20bp。所述基因编辑系统靶向细胞基因组中的至少一个靶序列。
在某些实施方式中,编码核酸酶的核酸为DNA。在某些实施方式中,编码核酸酶的核酸为RNA。在某些实施方式中,编码核酸酶的核酸是表达载体,例如重组表达载体。可以使用任何合适的表达载体,只要它与宿主细胞相容即可,包括但不限于,病毒载体(例如基于痘苗病毒的病毒载体;脊髓灰质炎病毒;腺病毒;腺相关病毒;SV40;单纯疱疹病毒;人免疫缺陷病毒;反转录病毒载体(例如鼠白血病病毒,脾脏坏死病毒,以及衍生自反转录病毒的载体,例如劳斯肉瘤病毒,Harvey肉瘤病毒,禽类白血病病毒,慢病毒,人免疫缺陷病毒,骨髓增生肉瘤病毒和乳腺肿瘤病毒)等。
在一实施方式中,所述核酸酶为野生型AsCas12f1,编码所述AsCas12f1核酸酶的核酸如SEQ ID NO.7所示。在一实施方式中,本发明提供了AsCas12f1核酸酶密码子优化的多核苷酸序列,与SEQ ID NO:7具有至少90%、92%、93%、94%、95%、96%、97%、98%、99%、99.2%、99.5%、99.8%、99.9%或100%序列同源性,其编码具有与原始天然核苷酸序列编码的多肽相同功能的多肽。
在某些实施方式中,编码核酸酶的核苷酸序列可操作地连接至控制元件,例如转录控制元件,例如启动子。在某些实施方式中,编码核酸酶的核苷酸序列可操作地连接至诱导型启动子。在某些实施方式中,编码核酸酶的核苷酸序列可操作地连接至组成型启动子。转录控制元件可以在真核细胞,例如哺乳动物细胞(HEK293T细胞);或原核细胞(例如细菌或古细菌细胞)中起作用。在某些实施方式中,编码核酸酶的核苷酸序列可操作地连接至多个控制元件,其允许在原核和真核细胞两者中表达编码核酸酶的核苷酸序列。在一些实施方案中,所述编码核酸酶的多核苷酸序列可操作地连接至用于在细胞或体外环境中表达的合适的核定位信号。
本发明中,所述编码核酸酶的多核苷酸可以通过人工合成方式进行合成,例如通过化学方法合成,从而使得能够容易地对其进行多种修饰。所述修饰可以采用本领域公知的任何修饰方式。在一些实施方案中,所述编码核酸酶的多核苷酸包含一种或多种修饰,从而使得能够容易地并入许多修饰,例如增强转录活性,改变酶活性,提高其翻译或稳定性(例如增加其对蛋白水解、降解的抗性)或特异性,改变溶解性,改变递送,减少宿主细胞中的先天免疫应答。所述修饰可以采用本领域公知的任何修饰方式。在一些实施方式中,通过修饰引入细胞中的编码核酸酶的DNA或RNA,以编辑任何一个或多个基因组的基因座。在一些实施方式中,编码核酸酶的核酸序列是修饰的核酸,例如密码子优化的。所述修饰可以是单一修饰,或组合修饰。
本发明中,包含编码核酸酶的多核苷酸的核酸可以是核酸模拟物。例如具有优良杂交性质的多核苷酸模拟物肽核酸等。
本发明中,所述核酸酶,或编码核酸酶的多核苷酸适用于任何生物或体外环境,包括但不限于是细菌(如大肠杆菌、肺炎克雷伯氏菌)、古细菌、真菌、原生生物、植物或动物。相应地,适用的靶细胞包括但不限于真核细胞和原核细胞,例如是细菌细胞、古细菌细胞、真菌细胞、原生生物细胞、植物细胞或动物细胞;所述真核细胞包含哺乳动物细胞和植物细胞,所述原核细胞包括大肠杆菌和肺炎克雷伯氏菌。适用的靶细胞可以是任何类型的细胞,包括干细胞,体细胞等。本发明优选用于哺乳动物细胞HEK293T细胞。所述细胞可以是体内的或离体的。在某些实施方式中,所述核酸酶或编码核酸酶的核酸配制在脂质体或脂质纳米颗粒中。
本发明所述系统中,核酸酶和gRNA可以在宿主细胞中形成复合物,识别靶向基因(如靶向DNA)序列上的PAM序列;所述CRISPR/AsCas12f1基因编辑系统的靶向序列为PAM序列之后长度为20bp的核酸片段(如DNA片段)。在一实施方式中,所述复合物可以选择性地调节宿主细胞中靶DNA的转录。基因编辑系统能够切割靶向DNA的双链,造成DNA断裂。
在一实施方式中,所述系统包含重组表达载体。在一实施方式中,所述系统包含重组表达载体,所述重组表达载体包含(i)编码gRNA的核苷酸序列,其中所述gRNA包含:(a)包含与靶DNA中的序列互补的核苷酸序列的第一区段;和(b)与核酸酶相互作用的第二区段;和(ii)编码核酸酶的核苷酸序列,其中所述核酸酶包含:(a)与所述gRNA相互作用的RNA-结合部分;和(b)调节靶DNA内转录的活性部分,其中靶DNA内调节的转录的位点由所述gRNA确定。
本发明中,还可以通过修饰、突变、DNA改组等方式形成核酸酶变体,使得核酸酶变体具有改善的所期望的特征,例如功能、活性、动力学、半衰期等。所述修饰例如可以是氨基酸的缺失、插入或取代,再例如可以是用来自不同核酸酶的同源或异源切割结构域(例如CRISPR-相关核酸酶的HNH结构域)置换核酸酶如AsCas12f1的“切割结构域”);通过本领域已知的DNA结合和/或DNA修饰蛋白的任何修饰方法,如甲基化作用、脱甲基作用、乙酰化作用等,例如可以改变AsCas12f1核酸酶的DNA靶向性。所述DNA改组是指在不同来源的AsCas12f1核酸酶的DNA序列之间交换序列片段,以产生编码具有RNA-指导的内切核酸酶活性的合成蛋白的嵌合DNA序列。所述修饰、突变、DNA改组等可以是单一使用或组合使用。
在一些实施方式中,所述Cas蛋白及其突变体选自:
(I)野生型Cas蛋白或其片段,具有受RNA引导的核酸结合活性;
(II)与(I)的氨基酸序列具有至少50%序列同源性的变体,且具有受RNA引导的核酸结合活性;
(III)根据(I)或(II),其进一步包括核定位信号片段;
(IV)根据(I)或(II)或(III),其进一步包含:
(a)一种或多种修饰或突变,其产生具有相比修饰或突变前显著减小的核酸内切酶活性,或使核酸内切酶活性丧失;和/或
(b)具有其他功能活性的多肽或结构域;
(V)根据(I)或(II)或(III),所述Cas蛋白具有核酸内切酶活性。
在一些实施方式中,核酸酶如AsCas12f1可以通过与其他酶成分或其他成分结合使用,以进一步开发核酸酶如AsCas12f1的各种潜在应用。作为(IV)下的变体非限制性的例子,例如是通过融合失活的核酸酶如AsCas12f1和碱基脱氨酶开发基于AsCas12f1核酸酶的单碱基编辑系统;通过融合失活的AsCas12f1和逆转录酶开发基于AsCas12f1核酸酶的Prime编辑系统;通过融合失活的AsCas12f1和转录激活因子,开发基于AsCas12f1核酸酶的转录激活系统;通过融合失活的AsCas12f1和核酸表观修饰酶,开发基于AsCas12f1核酸酶的表观修饰系统;利用失活的AsCas12f1,开发基于AsCas12f1核酸酶的转录抑制系统。
AsCas12f1核酸酶变体可以具有如下特定性质,包括但不限于:
具有增强的或降低的与靶位结合的能力,或保留了与靶位结合的能力;
具有增强的或降低的核糖核酸内切酶和/或核酸内切酶活性,或保留了核糖核酸内切酶和/或核酸内切酶活性;
具有脱氨酶活性,其可作用于胞嘧啶、鸟嘌呤或腺嘌呤碱基,并随后通过脱氨基位点复制并在细胞内修复,分别产生鸟嘌呤、胸腺嘧啶和鸟嘌呤;
具有调节靶DNA的转录的活性,可以是增加也可以是减少靶DNA中特定位置处的靶DNA转录;
具有改变的DNA靶向性;
增加或降低或维持的稳定性;
可以切割靶DNA的互补链,但具有降低的切割靶DNA的非互补链的能力;
可以切割靶DNA的非互补链,但具有降低的切割靶DNA的互补链的能力;
具有降低的切割靶DNA的互补链和非互补链两者的能力;
具有修饰与DNA相关的多肽(例如组蛋白)的酶活性,酶活性可以是甲基转移酶活性、脱甲基酶活性、乙酰转移酶活性、脱乙酰酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、脱泛素活性、核糖基化活性等中的一种或几种(通过这些酶活性催化对蛋白的共价修饰;例如,AsCas12f1核酸酶变体通过甲基化作用、乙酰化作用、泛素化、磷酸化作用等,修饰组蛋白,以引起组蛋白相关DNA的结构变化,从而控制DNA的结构和特性)。
在一些实施方式中,AsCas12f1核酸酶变体无切割活性。在一些实施方式中,AsCas12f1核酸酶变体具有单链切割活性。在一些实施方式中,AsCas12f1核酸酶变体具有双链切割活性。
具有增强的活性或能力是指,相对于野生型AsCas12f1核酸酶,具有提升至少1%、5%、10%、20%、30%、40%、50%的活性或能力。
具有降低的活性和能力是指相对于野生型AsCas12f1核酸酶,具有小于50%、小于40%、小于30%、小于20%、小于10%、小于5%或小于1%的活性或能力。
本发明所述的这些小的AsCas12f1及其变体可用作本发明下文所述的任何系统、组合物、试剂盒和方法中。
如果没有另外说明,术语“AsCas12f1”、“AsCas12f1核酸酶”包括野生型AsCas12f1核酸酶以及其所有变体,本领域技术人员可以通过常规手段可以确定AsCas12f1核酸酶变体的类型,而不受限于上文所例举的那些。
本发明所述系统中的各组成部分可通过载体方式来运送。例如,对于多核苷酸,可以采用的方法包括但不限于纳米颗粒、脂质体、核糖核蛋白、小分子RNA-缀合物、嵌合体和RNA-融合蛋白复合物等。
本发明所述的系统还可以进一步包括一个或多个供体模板。在某些实施方式中,所述供体模板包含用于插入靶基因的供体序列。
本发明所述系统可以在细胞中的多个位置处编辑或修饰DNA,以用于基因治疗,包括但不限于用于疾病的基因治疗,用于生物学研究,用于农作物抗性改进或提高产量等。
本发明还提供了一种组合物,其包含如上所述的核酸酶或编码其的多核苷酸、gRNA或编码其的多核苷酸、重组表达载体、系统中的一种或几种,还可以包括可接受的载体、介质等。所述可接受的载体、介质例如无菌水或生理盐水、稳定剂、赋形剂、抗氧化剂(抗坏血酸等)、缓冲剂(磷酸、枸橼酸、其它的有机酸等)、防腐剂、表面活性剂(PEG、Tween等)、螯合剂(EDTA等)、粘合剂等。而且,也可含有其它低分子量的多肽;血清白蛋白、明胶或免疫球蛋白等蛋白质;甘氨酸、谷酰胺、天冬酰胺、精氨酸和赖氨酸等氨基酸;多糖和单糖等糖类或碳水化物;甘露糖醇或山梨糖醇等糖醇。当制备用于注射的水溶液时,例如生理盐水、含有葡萄糖或其它的辅助药物的等渗溶液,如D-山梨糖醇、D-甘露糖、D-甘露糖醇、氯化钠,可并用适当的增溶剂例如醇(乙醇等)、多元醇(丙二醇,PEG等)、非离子表面活性剂(吐温80,HCO-50)等。在一些实施方式中,组合物包含gRNA和用于稳定核酸的缓冲液。
本发明还提供了一种试剂盒,其包括如上所述的系统或组合物。所述试剂盒还可以进一步包括一种或多种例如选自:稀释缓冲液;洗涤缓冲液;对照试剂等的额外试剂。在一些实施方式中,所述试剂盒包括(a)根据上文所述的AsCas12f1核酸酶或编码AsCas12f1核酸酶的核酸;和(b)gRNA或编码所述gRNA的核酸,其中所述gRNA能够将所述AsCas12f1核酸酶或其变体指导至靶多核苷酸序列。在某些实施方式中,所述试剂盒进一步含有包含异源多核苷酸序列的供体模板,其中所述异源多核苷酸序列能够被插入所述靶多核苷酸序列中。
本发明还提供了一种基因编辑方法,将靶基因与如上所述的基因编辑系统接触,以实现靶基因的编辑。本发明方法可以用于在细胞中或在体内、离体细胞或无细胞系统中靶向、编辑、修饰或操纵靶基因(如靶DNA),所述方法包括:将如上所述的AsCas12f1核酸酶或编码其的多核苷酸、gRNA或编码其的多核苷酸、重组表达载体、系统、组合物等引入试剂盒体内、离体细胞或无细胞系统中,对靶基因进行靶向、编辑、修饰或操纵。在一实施方式中,所述方法包括如下:
(a)将所述AsCas12f1核酸酶或编码AsCas12f1核酸酶的核酸引入体内、离体细胞或无细胞系统中;和
(b)引入所述gRNA(sgRNA)或适合于原位产生这种sgRNA的核酸(例如,DNA);和
(c)使细胞或靶基因与AsCas12f1核酸酶或编码AsCas12f1核酸酶的核酸、gRNA(sgRNA)或适合于原位产生这种sgRNA的核酸接触,以在所述靶基因中产生一个或多个切割、切口或编辑;其中所述AsCas12f1核酸酶通过其加工的或未加工形式的gRNA被指导至所述靶基因。
在一些实施方式中,本发明所述基因编辑方法包括下列步骤:
i)将所述AsCas12f1核酸酶或其编码多核苷酸、以及所述向导RNA或其编码多核苷酸引入细胞中;
ii)由所述AsCas12f1核酸酶介导,在靶基因中产生一种或多种切口,或靶向、编辑、修饰或操纵所述靶基因。
在一优选实施方式中,本发明提供一种基于工程优化的CRISPR/AsCas12f1基因编辑系统的体外DNA的切割方法,包括:野生向导RNA或向导RNA变体与野生AsCas12f1核酸酶或其变体,以及靶DNA序列在特定缓冲液内混合反应。
本发明中所述的体外DNA切割方法可为本领域常规,例如,在本发明一较佳实施例中:所述的切割方法在含有50mM NaCl、5mM MgCl2、10mM Tris-HCl,pH=7.5的缓冲溶液中进行。本发明中,所述AsCas12f核酸酶的用量可同本领域中其他Cas核酸酶进行反应时的用量,例如,在本发明一较佳实施例中:所述AsCas12f核酸酶与所述完整的向导RNA的摩尔比为1:2;所述切割方法的反应温度较佳地为45℃、反应速率比较的时间梯度较佳地为0、0.5、1、2、4、8、16、32、64分钟。所述的靶向序列较佳地为PAM序列之后长度为20bp的DNA片段。
本发明所述基因编辑方法中,所述AsCas12f1核酸酶通过加工或未加工形式的向导RNA引导至靶基因。所述AsCas12f1核酸酶和向导RNA形成复合物,识别所述靶基因上的PAM序列。在一些优选实施方式中,所述方法进一步包括将包含异源多核苷酸序列的供体模板引入细胞中的步骤。
本发明还提供如上所述的向导RNA、分离的多核苷酸、构建体、表达系统、基因编辑系统、药物组合物或所述的方法在体内、离体细胞或无细胞环境中对靶基因和/或其相关多肽进行基因编辑中的应用。所述离体细胞选自细菌细胞、古细菌细胞、真菌细胞、原生生物细胞、病毒细胞、植物细胞和动物细胞中的至少一种。所述基因编辑选自由:基因切割、基因删除、基因插入、点突变、转录抑制、转录激活、碱基编辑和引导编辑构成的群组,包括但不限于:
切割靶基因;
操控靶基因的表达;
遗传修饰靶基因;
遗传修饰靶基因相关多肽;
用于在靶基因的任何所需位置处的有意和受控的损伤;
用于在靶基因的任何所需位置处的有意和受控的修复;
引入双链断裂以外的方式修饰靶基因(AsCas12f1核酸酶具有酶活性,其以除引入双链断裂以外的方式修饰靶基因;所述酶活性可以是AsCas12f1本身所具有的,或通过例如将具有酶活性的异源多肽融合到AsCas12f1核酸酶形成嵌合AsCas12f1核酸酶获得的,所述酶活性包括但不限于甲基转移酶活性、脱氨作用活性、歧化酶活性、烷基化活性、脱甲基酶活性、DNA修复活性、转座酶活性、重组酶活性、DNA损伤活性、脱嘌呤活性、氧化活性、嘧啶二聚体形成活性等)。
优选地,所述基因编辑为基因删除或者基因切割;所述基因编辑可用于实现包括但不限于致病位点的修正、基因功能研究、增强细胞功能、细胞治疗等中的一种或几种。
本发明AsCas12f1核酸酶或编码其的多核苷酸、gRNA或编码其的多核苷酸、重组表达载体、系统、组合物和试剂盒可以应用于研究领域,诊断领域,工业领域(例如微生物工程),药物发现(例如高通量筛选),靶标确认,影像学领域以及治疗领域等。
在一些实施方式中,所述靶基因为靶DNA。在一些实施方式中,靶DNA可以是未与DNA相关蛋白结合的体外裸DNA。在一些实施方式中,靶DNA是体外细胞中的染色体DNA。在一些实施方式中,所述靶基因为靶RNA。在一些实施方式中,将靶DNA与包含所述AsCas12f1核酸酶和gRNA的靶向复合物接触,gRNA通过包含与靶DNA互补的核苷酸序列,为靶向复合物提供靶特异性;AsCas12f1核酸酶提供位点特异性活性。在一些实施方式中,靶向复合物修饰靶DNA,从而导致例如DNA切割、DNA甲基化作用、DNA损伤、DNA修复等。在一些实施方式中,靶向复合物修饰与靶DNA相关多肽(例如,组蛋白、DNA-结合蛋白等),从而导致例如靶DNA相关多肽-组蛋白的甲基化、组蛋白乙酰化、组蛋白泛素化等。
本发明所述方法中,可以通过公知的方法将AsCas12f1核酸酶或包含编码AsCas12f1核酸酶的多肽的核苷酸序列的核酸引入细胞。同样地,可以通过公知的方法将gRNA或包含编码gRNA的核苷酸序列的核酸引入细胞。公知的方法包括,DEAE-葡聚糖介导的转染、脂质体介导的转染、病毒或噬菌体感染、脂质转染法、转染、接合、原生质体融合、聚乙烯亚胺介导的转染、电穿孔、磷酸钙沉淀、基因枪、磷酸钙沉淀、显微注射、纳米颗粒介导的核酸递送等。例如通过电穿孔、氯化钙转染、显微注射和脂质转染法等递送质粒。对于病毒载体递送,使细胞与包含编码gRNA和/或AsCas12f1核酸酶和/或嵌合AsCas12f1核酸酶的核酸和/或供体多核苷酸的病毒颗粒接触。
在一些实施方式中,本发明所述应用或方法中,核酸酶切割细胞中的靶DNA以产生双链断裂,然后由细胞通常以下列方式进行修复:非同源末端连接(NHEJ)和同源性指导的修复。
本发明还提供了一种遗传修饰的细胞,包括已用上述AsCas12f1核酸酶或编码其的多核苷酸、gRNA或编码其的多核苷酸、重组表达载体、系统、组合物对宿主细胞进行了遗传修饰。
本发明中,gRNA和/或AsCas12f1核酸酶和/或重组表达载体和/或供体多核苷酸的有效剂量对于本领域技术人员而言是常规的。可以根据不同的施用途径以及治疗的病症的特性来确定。
本发明中,所述细菌或原核细菌可以是大肠杆菌、肺炎克雷伯氏菌、卵形拟杆菌、空肠弯曲菌、腐生葡萄球菌、粪肠球菌、多形拟杆菌、普通拟杆菌、单形拟杆菌、干酪乳杆菌、脆弱拟杆菌、鲁氏不动杆菌、具核梭杆菌、乔氏拟杆菌、拟南芥拟杆菌、鼠李糖乳杆菌、马赛拟杆菌、粪副拟杆菌、死亡梭杆菌和短双歧杆菌等。
本发明中,所述真核细胞包括但不限于是哺乳动物细胞、真菌等真核生物细胞。所述真菌包括酵母、曲霉,例如可以是酿酒酵母、多形汉逊酵母、毕赤酵母、脆壁克鲁维氏酵母、乳酸克鲁维氏酵母,以及栗酒裂殖酵母、白假丝酵母、杜氏假丝酵母、光滑假丝酵母、季也蒙假丝酵母、乳酒假丝酵母、克鲁斯假丝酵母、葡萄牙假丝酵母、梅林假丝酵母、嗜油假丝酵母、近平滑假丝酵母、热带假丝酵母和产朊假丝酵母、烟曲霉、黄曲霉、黑曲霉、棒曲霉、灰绿曲霉群、构巢曲霉、米曲霉、土曲霉、焦曲霉和杂色曲霉等。
在本发明的实施例中,公开了一种基于极小型CRISPR/AsCas12f1核酸酶的新型基因组编辑方法。该发明显示,通过向导RNA的导向和定位功能,AsCas12f1能够精确切割基因组DNA,实现基因组DNA双链断裂。利用宿主细胞自身或外源的修复机制,该系统能够高效和精确地实现活细胞内基因编辑。
术语“AsCas12f1”、“AsCas12f1核酸酶”、“AsCas12f1多肽”、“AsCas12f1蛋白”、“AsCas12f1蛋白质”可互换使用。
术语“向导RNA”、“向导RNA”、“gRNA”、“单一gRNA”和“嵌合gRNA”可互换使用。
术语“一”或“一个”实体是指一个或多个该实体;因此,术语“一”(或“一个”),“一个或多个”和“至少一个”在本文中可互换使用。
术语“同源性”或“同一性”或“相似性”是指两个肽之间或两个核酸分子之间的序列相似性。同源性可以通过比对不同多肽或核酸分子中的相对应位置来确定,当被比较分子序列中的同一位置在不同序列中被相同的碱基或氨基酸占据时,那么该分子在该位置是同源的。序列之间的同源程度由序列共有的匹配或同源位置的数目的函数决定。“不相关的”或“非同源的”序列与本发明所公开的序列之一的同源性应小于20%。
多核苷酸或多核苷酸区域(或多肽或多肽区域)与另一多核苷酸或多核苷酸区域(或多肽或多肽区域)具有一定百分比的序列同源性(例如,20%、30%、40%、50%、60%、70%、80%、90%、95%、98%或99%)是指比对时,被比对的两个序列中有该百分比的碱基(或氨基酸)是相同的。该比对和百分比同源性或序列同一性可以使用本领域已知的软件程序和方法来确定。
在本发明中,术语“多核苷酸”和“寡核苷酸”可互换使用,并且它们是指任何长度的核苷酸的聚合形式,无论是脱氧核糖核苷酸还是核糖核苷酸或其类似物。多核苷酸可以具有任何三维结构并且可以执行已知或未知的任何功能。多核苷酸的实例包括但不限于如下这些:基因或基因片段(包括探针,引物,EST或SAGE标签),外显子,内含子,信使RNA(mRNA),转运RNA,核糖体RNA,核酶,cDNA,dsRNA,siRNA,miRNA,重组多核苷酸,分支多核苷酸,质粒,载体,任何序列的分离的DNA,任何序列的分离的RNA,核酸探针和引物。多核苷酸也包含经过修饰的核苷酸,例如甲基化的核苷酸和核苷酸类似物。如果多核苷酸上存在修饰,该修饰可以在组装多核苷酸之前或之后赋予。核苷酸序列可以被非核苷酸组分打断。多核苷酸可以在聚合后被进一步修饰,例如通过偶联被标记组分所标记。该术语同时指双链和单链多核苷酸分子。除非另有说明或要求,否则本发明公开的多核苷酸的任何实施方案包括其双链形式和已知或预测能构成双链形式的两条互补单链形式中的任一种。
当将其应用于多核苷酸时,术语“编码”是指多核苷酸“编码”多肽,意即在其天然状态下或当通过本领域技术人员公知的方法操作时,其可以通过转录和/或翻译以产生目的多肽和/或其片段,或产生能够编码该目的多肽和/或其片段的mRNA。反义链是指与该多核苷酸互补的序列,并且可以从中推导出编码序列。
术语“基因组DNA”表示生物的基因组的DNA,包括细菌、古细菌、真菌、原生生物、病毒、植物或动物的基因组的DNA。
术语“操纵”DNA包括结合、在一条链产生切口、或切割DNA的两条链,或包括修饰或编辑DNA或与DNA结合的多肽。操纵DNA可以沉默、激活或调节由所述DNA编码的RNA或多肽的表达(使其不转录,或降低转录活性,或使其不翻译,或降低翻译水平),或防止或增强多肽与DNA的结合。切割可通过多种方法进行,例如磷酸二酯键的酶促或化学水解;可单链切割或双链切割;DNA切割可导致平头末端或交错末端的产生。
术语“可杂交的”或“互补的”或“基本上互补的”是指,核酸(例如RNA)包含核苷酸序列,该序列使得其能够在适当的体外和/或体内温度和溶液离子强度条件下以序列特异性的、反平行的方式与另一核酸非共价地结合,即,形成沃森-克里克碱基对和/或G/U碱基对、“退火”或“杂交”。
在本领域中可以理解,多核苷酸的序列不需要与其可特异性杂交的靶核酸的序列100%互补。多核苷酸可在一个或多个区段上杂交。多核苷酸可包含与其所靶向的靶核酸序列内的靶区域的至少70%、至少80%、至少90%、至少95%、至少99%或100%的序列互补性。
术语“肽”、“多肽”和“蛋白”在本发明中可互换地使用,且表示任何长度的氨基酸的聚合形式,其可以包括编码和非编码的氨基酸,化学或生物化学修饰或衍生的氨基酸,和具有修饰的肽主链的多肽。
术语“编码”特定RNA的DNA序列是转录为RNA的DNA核酸序列。DNA多核苷酸可以编码被翻译成蛋白的RNA(mRNA),或者DNA多核苷酸可以编码不被翻译成蛋白质的RNA(例如,tRNA、rRNA或gRNA;也称为“非编码”RNA或“ncRNA”)。“蛋白编码序列”或编码特定蛋白或多肽的序列是在合适调节序列的控制下,在体内或体外转录成mRNA(在DNA的情况下)并翻译(在mRNA的情况下)成多肽的核酸序列。
术语“载体”或“表达载体”是复制子,诸如质粒、噬菌体、病毒或粘粒,可以在其上附着另一种DNA区段,即,“插入片段”,以便实现附着的区段在细胞中的复制。
术语“表达盒”包含可操作地连接至启动子的DNA编码序列。“可操作地连接的”表示并列连接,各组分处于允许它们以其预期方式起作用的关系中。术语“重组表达载体”或“DNA构建体”在本发明中互换地用于表示包含载体和至少一个插入片段的DNA分子。重组表达载体通常是为了表达和/或扩增插入片段的目的或为了构建其它重组核苷酸序列而产生。
当外源DNA例如重组表达载体已经被引入细胞内时,细胞已被所述DNA“遗传上修饰”或“转化”或“转染”。外源DNA的存在导致永久或短暂的遗传改变。转化DNA整合或不整合到细胞的基因组中。
术语“靶DNA”是包含“靶位点”或“靶序列”的DNA多核苷酸。术语“靶位点”、“靶序列”、“靶原间隔区DNA”或“原间隔区样序列”在本发明中互换地用于表示存在于靶DNA中的核酸序列,如果存在足够的用于结合的条件,则gRNA的DNA-靶向区段将与其结合。RNA分子包含与靶DNA内的靶序列结合、杂交或互补的序列,从而将结合的多肽靶向至靶DNA内的特定位置(靶序列)。“切割”是指DNA分子的共价主链的断裂。
术语“核酸酶”和“内切核酸酶”可互换使用,用于指具有用于多核苷酸切割的内切核酸降解催化活性的酶。核酸酶的“切割结构域”或“活性结构域”或“核酸酶结构域”是指在核酸酶内具有用于DNA切割的催化活性的多肽序列或结构域。切割结构域可以包含在单个多肽链中,或者切割活性可以由两个或多个多肽的缔合产生。
术语“定位多肽”或“RNA-结合位点指导的多肽”是指结合RNA并靶向至特定DNA序列的多肽。
术语“引导序列”或DNA-靶向区段(或“DNA-靶向序列”)包含与在本发明中称为“原间隔区样”序列的靶DNA内的特定序列互补的核苷酸序列(靶DNA的互补链)。
术语“重组”是指在两个多核苷酸之间交换遗传信息的过程。本发明中使用的“同源性指导的修复(HDR)”表示例如在细胞中双链断裂修复期间发生的特殊化形式的DNA修复。这个过程需要核苷酸序列同源性,使用“供体”分子为“靶”分子(即,经历双链断裂的分子)的修复提供模板,并导致遗传信息从供体转移至靶。如果供体多核苷酸不同于靶分子,并且供体多核苷酸的部分或全部序列被并入到靶DNA中,则同源性指导的修复可能导致靶分子序列的改变(例如插入、缺失、突变)。
术语“非同源末端连接(NHEJ)”是指在不需要同源模板的情况下通过将断裂末端彼此直接连接来修复DNA中的双链断裂。NHEJ经常导致双链断裂位点附近的核苷酸序列缺失。
术语“治疗”包括防止疾病或症状的发生;抑制疾病或症状或减轻疾病。
术语“个体”、“受试者”、“宿主”和“患者”在本发明中可互换地使用,并且表示期望对其进行诊断、治疗或疗法的任何哺乳动物受试者,特别是人。
实施例中未注明具体技术或条件者,按照本领域内的文献所描述的常规技术或条件,或者按照产品制造商的说明书进行。实施例中所用引物均由上海生工生物工程股份有限公司和苏州金唯智生物科技有限公司合成,所用试剂或仪器未注明生产厂商者,视为可通过正规渠道商购得的常规产品。
实施例1原始野生型AsCas12f1核酸酶与向导RNA变体—sgRNA_T1在哺乳动物细胞中的基因编辑
本实施例中所述的原始野生型向导RNA—sgRNA_V1的编码基因序列为:5’-attcgtcggttcagcgacgataagccgagaagtgccaataaaactgttaagtggtttggtaacgctcggtaaggtagccaaaaggctgaaactccgtgcacaaagaccgcacggacgcttcacatatagctcataaacaagggtttgcgagctagcttgtggagtgtgaacCTCTCAAGACCCACAATCCA-3’(SEQ ID NO.11);
本实施例中所述的工程优化后的向导RNA变体—sgRNA_T1的编码基因序列为:5’-attcgtcggttcagcgacgataagccgagaagtgccaataaaactgttaagtggtttggtaacgctcggtaaggtagccaaaaggctgaaactccgtgcacaaagaccgcacggacgcttcacatacttgtggagtgtgaacCTCTCAAGAC CCACAATCCA-3’(SEQ ID NO.12);
向导RNA的编码基因序列中下划线的20bp序列可根据需要编辑的靶位点进行合理的设计和替换。靶位点应位于靶基因上,靶位点的5’上游应包含有优选的PAM序列,其序列特征应为5’-TTR,其中R代表A或G。
本实施例中所述的原始野生型AsCas12f1使用了较佳的针对人密码子优化的AsCas12f1编码基因,其序列为5’-atgatcaaggtgtacagatacgagatcgtgaagcctctggacctggactggaaggagttcggcaccatcctgagacagctgcagcaggaaaccagattcgccctgaataaggccacacagctggcctgggagtggatgggcttcagcagcgactacaaggataaccacggcgagtaccccaagagcaaggacatcctgggctacaccaacgtgcacggctacgcctaccacaccatcaagacaaaggcctacagactgaactctggaaatctgagccagaccatcaagagagccacagacaggttcaaggcctaccagaaggagatcctgcgcggcgacatgtctatccccagctacaagagggacatccccctggacctgatcaaggagaacatctccgtgaacaggatgaatcacggcgactacatcgccagcctgtctctgctgagcaaccccgccaagcaggagatgaacgtgaagagaaagatctccgtgatcatcatcgtgaggggcgccggcaagaccatcatggacagaatcctgtccggcgagtaccaggtgagcgccagccagattatccacgacgaccggaagaacaagtggtacctgaacatcagctacgacttcgagccacagaccagagtgctggacctgaacaagatcatgggcattgacctgggcgtggccgtggccgtgtacatggccttccagcacacccccgccaggtacaagctggagggcggcgagattgagaacttcaggaggcaggtggagagccggcgcatctccatgctgagacagggcaagtacgccggcggcgccaggggcggccacggcagagacaagagaatcaagcccattgagcagctgagggataagatcgccaatttcagagacaccaccaatcaccggtacagcagatacatcgtggacatggccatcaaggagggctgcggcacaatccagatggaggatctgacaaacatcagagacatcggcagcagattcctgcagaactggacctactacgacctgcagcagaagatcatctacaaggccgaggaggccggcatcaaagtgatcaagatcgacccccagtacaccagccagagatgctccgagtgcggcaacatcgactccggcaacagaatcggccaggccatctttaagtgccgggcctgcggctacgaggccaacgccgactacaacgccgcccggaatatcgccatccccaacatcgacaagatcatcgccgagagcattaag-3’(SEQ ID NO.7);
优选的pCMV-AsCas12f1-T1质粒序列(表达野生型AsCas12f1核酸酶与向导RNA变体—sgRNA_T1)为:5’-ggtaccgattagtgaacggatctcgacggtatcgatcacgagactagcctcgagcggccgcccccttcaccgagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccGattcgtcggttcagcgacgataagccgagaagtgccaataaaactgttaagtggtttggtaacgctcggtaaggtagccaaaaggctgaaactccgtgcacaaagaccgcacggacgcttcacatacttgtggagtgtgaacCTCTCAAGACCCACAATCCAtttttttgaattctcgacctcgagacaaatggcagtattcatccacaattttaaaagaaaaggggggattggggggtacagtgcaggggaaagaatagtagacataatagcaacagacatacaaactaaagaattacaaaaacaaattacaaaaattcaaaattttcgggtttattacagggacagcagagatccactttggccgcggctcgagggggttggggttgcgccttttccaaggcagccctgggtttgcgcagggacgcggctgctctgggcgtggttccgggaaacgcagcggcgccgaccctgggactcgcacattcttcacgtccgttcgcagcgtcacccggatcttcgccgctacccttgtgggccccccggcgacgcttcctgctccgcccctaagtcgggaaggttccttgcggttcgcggcgtgccggacgtgacaaacggaagccgcacgtctcactagtaccctcgcagacggacagcgccagggagcaatggcagcgcgccgaccgcgatgggctgtggccaatagcggctgctcagcagggcgcgccgagagcagcggccgggaaggggcggtgcgggaggcggggtgtggggcggtagtgtgggccctgttcctgcccgcgcggtgttccgcattctgcaagcctccggagcgcacgtcggcagtcggctccctcgttgaccgaatcaccgacctctctccccagggggatccaccggagcttaccatgaccgagtacaagcccacggtgcgcctcgccacccgcgacgacgtccccagggccgtacgcaccctcgccgccgcgttcgccgactaccccgccacgcgccacaccgtcgatccggaccgccacatcgagcgggtcaccgagctgcaagaactcttcctcacgcgcgtcgggctcgacatcggcaaggtgtgggtcgcggacgacggcgccgcggtggcggtctggaccacgccggagagcgtcgaagcgggggcggtgttcgccgagatcggcccgcgcatggccgagttgagcggttcccggctggccgcgcagcaacagatggaaggcctcctggcgccgcaccggcccaaggagcccgcgtggttcctggccaccgtcggcgtctcgcccgaccaccagggcaagggtctgggcagcgccgtcgtgctccccggagtggaggcggccgagcgcgccggggtgcccgccttcctggaaacctccgcgccccgcaacctccccttctacgagcggctcggcttcaccgtcaccgccgacgtcgaggtgcccgaaggaccgcgcacctggtgcatgacccgcaagcccggtgcctgacgcccgccccacgacccgcagcgcccgaccgaaaggagcgcacgaccccatgcatcggtacctttaagaccaatgacttacaaggcagctgtagatcttagccactttctagagtcggggcggccggccgcttcgagcagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtttcaggttcagggggaggtgtgggaggttttttaaagcaagtaaaacctctacaaatgtggtaaaatcgataaggatccgtcgaccgatgcccttgagagccttcaacccagtcagctccttccggtgggcgcggggcatgactatcgtcgccgcacttatgactgtcttctttatcatgcaactcgtaggacaggtgccggcagcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcaatgctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaaggacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatgataccgcgggacccacgctcaccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccacctgcaggaaacagctatgaccatgattacgccaagctctagctagaggtcgacggtatcgagccccagctggttctttccgcctcagaagccatagagcccaccgcatccccagcatgcctgctattgtcttcccaatcctcccccttgctgtcctgccccaccccaccccccagaatagaatgacacctactcagacaatgcgatgcaatttcctcattttattaggaaaggacagtgggagtggcaccttccagggtcaaggaaggcacgggggaggggcaaacaacagatggctggcaactagaaggcacagtcgaggctgatcagcgggtttaaactcaatggtgatggtgatgatgaccggttagactttcctcttcttcttgggagaaccaccagacttaatgctctcggcgatgatcttgtcgatgttggggatggcgatattccgggcggcgttgtagtcggcgttggcctcgtagccgcaggcccggcacttaaagatggcctggccgattctgttgccggagtcgatgttgccgcactcggagcatctctggctggtgtactgggggtcgatcttgatcactttgatgccggcctcctcggccttgtagatgatcttctgctgcaggtcgtagtaggtccagttctgcaggaatctgctgccgatgtctctgatgtttgtcagatcctccatctggattgtgccgcagccctccttgatggccatgtccacgatgtatctgctgtaccggtgattggtggtgtctctgaaattggcgatcttatccctcagctgctcaatgggcttgattctcttgtctctgccgtggccgcccctggcgccgccggcgtacttgccctgtctcagcatggagatgcgccggctctccacctgcctcctgaagttctcaatctcgccgccctccagcttgtacctggcgggggtgtgctggaaggccatgtacacggccacggccacgcccaggtcaatgcccatgatcttgttcaggtccagcactctggtctgtggctcgaagtcgtagctgatgttcaggtaccacttgttcttccggtcgtcgtggataatctggctggcgctcacctggtactcgccggacaggattctgtccatgatggtcttgccggcgcccctcacgatgatgatcacggagatctttctcttcacgttcatctcctgcttggcggggttgctcagcagagacaggctggcgatgtagtcgccgtgattcatcctgttcacggagatgttctccttgatcaggtccagggggatgtccctcttgtagctggggatagacatgtcgccgcgcaggatctccttctggtaggccttgaacctgtctgtggctctcttgatggtctggctcagatttccagagttcagtctgtaggcctttgtcttgatggtgtggtaggcgtagccgtgcacgttggtgtagcccaggatgtccttgctcttggggtactcgccgtggttatccttgtagtcgctgctgaagcccatccactcccaggccagctgtgtggccttattcagggcgaatctggtttcctgctgcagctgtctcaggatggtgccgaactccttccagtccaggtccagaggcttcacgatctcgtatctgtacaccttgatcatgactttcctcttcttcttgggGGCcatggtggcggctctccctatagtgagtcgtattagcggccgcggatctctagcggatctgacggttcactaaaccagctctgcttatatagacctcccaccgtacacgcctaccgcccatttgcgtcaatggggcggagttgttacgacattttggaaagtcccgttgattttggtgccaaaacaaactcccattgacgtcaatggggtggagacttggaaatccccgtgagtcaaaccgctatccacgcccattgatgtactgccaaaaccgcatcaccatggtaatagcgatgactaatacgtagatgtactgccaagtaggaaagtcccataaggtcatgtactgggcataatgccaggcgggccatttaccgtcattgacgtcaatagggggcgtacttggcatatgatacacttgatgtactgccaagtgggcagtttaccgtaaatactccacccattgacgtcaatggaaagtccctattggcgttactatgggaacatacgtcattattgacgtcaatgggcgggggtcgttgggcggtcagccaggcgggccatttaccgtaagttatgtaacgcggaactccatatatgggctatgaactaatgaccccgtaattgattactattaataactagtcaataatcaatgtcaacgcgtatatctggcccgtacatcgcgaagcagcgcaaaacgcctaaccctaagcagattcttcatgcaattgtcggtcaagaatcgatagtactaacatacgctctccatcaaaacaaaacgaaacaaaacaaactagcaaaataggctgtccccagtgcaagtgcaggtgccagaacatttctctatcgata-3’(SEQ IDNO.8);
表达野生型AsCas12f1核酸酶与野生型RNA—sgRNA_V1的质粒采用pCMV-AsCas12f1-T1质粒相似的构建方法获得。
质粒序列中下划线的20bp序列可根据需要编辑靶位点进行合理的设计和替换。靶位点应位于靶基因上,靶位点的5’上游应包含有优选的PAM序列,其序列特征应为5’-TTR,其中R代表A或G。质粒中靶序列的替换方法可采用本领域内常规的技术方法,例如Goldengate assembly或Gibson assembly。
本实施例中,靶序列为如下:
APOB_L1:CTGTCGACACCCAGAATCAT(SEQ ID NO.13);
HEXA_L1:AGTATACGCTTCCACAGAAA(SEQ ID NO.14);
PDCD1_L1:CTGTGAGCTCTAGTCCCCAC(SEQ ID NO.15);
TP53_L2:AGGCATCACTGCCCCCTGAT(SEQ ID NO.16);
VEGFA_L1:CTCTCAAGACCCACAATCCA(SEQ ID NO.17);
VEGFA_L2:AAGAAGGGATGTGGTGCATT(SEQ ID NO.18);
本实施例中,以人胚胎肾细胞HEK293T为实验所用细胞。
在含有10%FBS的DMEM培养基中培养活化后的HEK293T细胞,待细胞生长密度至90%左右传代至24孔板中,每孔细胞数量约为1.0×105个。16-18小时后,用1.5μL的lipofectamine3000分别转染1000ng的含不同靶序列的表达野生型AsCas12f1核酸酶、sgRNA_V1或sgRNA_T1的基因编辑质粒至细胞中。24小时后,加入嘌呤霉素达到终浓度为2μg/ml进行筛选。继续培养48小时后,消化贴壁细胞,提取基因组DNA。PCR扩增靶向序列的目的基因片段,胶回收后的PCR产物用NEBuffer2(NEB)进行退火。随后在反应体系加入T7endonuclease1,37℃酶切15min后加入6×Gel Loading Dye终止反应。反应产物通过6%的TBE-PAGE分离,并通过4S Red dye进行染色成像。
图1为原始野生型AsCas12f1核酸酶分别组合sgRNA_V1和sgRNA_T1的哺乳动物细胞基因编辑结果比较图。如图所示,sgRNA_T1可在APOB、HEXA、PDCD1、TP53和VEGFA基因上6个靶位点明显提升基因编辑效率。
实施例2 AsCas12f1核酸酶变体与sgRNA_T1在哺乳动物细胞中的基因编辑
以实施例1中构建的pCMV-AsCas12f1-T1质粒为模板,分别使用针对不同氨基酸残基的点突变引物进行环式聚合酶延伸克隆,获得6种带有一种或多种氨基酸残基点突变的AsCas12f1核酸酶变体质粒,其可以用于哺乳动物细胞基因编辑。
用于构建AsCas12f1核酸酶变体的质粒的引物如下:
K80R-Rv:gcgggtctcacAGAacaaaggcctacagactgaactc(SEQ ID NO.20);
K80R-Fw:gcgggtctcaTCTgatggtgtggtaggcgtagccg(SEQ ID NO.21);
A104R-Rv:gcgggtctcaAGAtaccagaaggagatcctgcgcg(SEQ ID NO.22);
A104R-Fw:gcgggtctcaaTCTcttgaacctgtctgtggctctc(SEQ ID NO.23);
D364R-Rv:gcgggtctcaAGAccccagtacaccagccagagatg(SEQ ID NO.24);
D364R-Fw:gcgggtctcagTCTgatcttgatcactttgatgccgg(SEQ ID NO.25);
PCR产物经Dpn1消化处理后进行溶液回收,由Golden gate assembly技术组装后,转化大肠杆菌DH5α感受态细胞,涂布带有氨苄青霉素的LBA平板,挑取单克隆扩大培养,提取质粒,测序鉴定后,获得pCMV-AsCas12f1-T1-K80R,pCMV-AsCas12f1-T1-A104R,pCMV-AsCas12f1-T1-D364R,pCMV-AsCas12f1-T1-A104+K80R,pCMV-AsCas12f1-T1-A104+D364R,pCMV-AsCas12f1-T1-K80R+A104+D364R(Evo1)质粒,其编码的核酸酶变体分别为AsCas12f1-K80R,AsCas12f1-A104R,AsCas12f1-D364R,AsCas12f1-A104+K80R,AsCas12f1-A104+D364R,AsCas12f1-K80R+A104+D364R,氨基酸分别为SEQ ID NO.1~6。
参考实施例1中的靶序列替换方法,在各变体质粒中分别插入靶序列APOB_L1,PDCD1_L1和VEGFA_L1。
参考实施例1,以人胚胎肾细胞HEK293T为实验细胞,进行基因编辑测试。
图2为在sgRNA_T1基础上,分别组合原始野生型AsCas12f1核酸酶和6种AsCas12f1核酸酶变体的哺乳动物细胞基因编辑结果比较图。如图所示,6种AsCas12f1核酸酶变体均可在APOB、PDCD1和VEGFA基因上3个靶位点上提升基因编辑效率;其中AsCas12f1-Evo1效果最佳。
实施例3工程优化的CRISPR/AsCas12f1基因编辑系统在哺乳动物细胞中的基因编辑应用
本实施例中所述的工程优化的向导RNA变体为sgRNA_T1。
本实施例中所述的工程优化的AsCas12f1核酸酶变体为AsCas12f1-Evo1。
本实施例中所述的工程优化的CRISPR/AsCas12f1基因编辑系统为AsCas12f1-Evo1和sgRNA_T1的组合。
参考实施例1中的靶序列替换方法,在pCMV-AsCas12f1-T1-K80R+A104+D364R(Evo1)质粒中分别插入靶序列AAVS1-L1~L8,APOB_L1,DNMT1_L1,HBG_L1~L2,HEXA_L1,IFNγ_L1,PCSK9_L1,PDCD1_L1,PRNP_L1,TP53_L1~L6,VEGFA_L1~L4;靶序列如下:
AAVS1_L1:AGGAAAGAAGGATGGAGAAA(SEQ ID NO.26);
AAVS1_L2:CCTGGACACCCCGTTCTCCT(SEQ ID NO.27);
AAVS1_L3:CTTACGATGGAGCCAGAGAG(SEQ ID NO.28);
AAVS1_L4:CCTGTGAGATAAGGCCAGTA(SEQ ID NO.29);
AAVS1_L5:CTGCCTCCAGGGATCCTGTG(SEQ ID NO.30);
AAVS1_L6:GCCACCTCTCCATCCTCTTG(SEQ ID NO.31);
AAVS1_L7:TCTGTCCCCTCCACCCCACA(SEQ ID NO.32);
AAVS1_L8:GGCAGCTCCCCTACCCCCCT(SEQ ID NO.33);
APOB_L1:CTGTCGACACCCAGAATCAT(SEQ ID NO.13);
DNMT1_L1:TGTGGCCACAAGGCTCAGTT(SEQ ID NO.34);
HBG_L1:CCTTGTCAAGGCTATTGGTC(SEQ ID NO.35);
HBG_L2:CCTTGTTCCGATTCAGTCAT(SEQ ID NO.36);
HEXA_L1:AGTATACGCTTCCACAGAAA(SEQ ID NO.14);
IFNγ_L1:ACGATGAGACAGACCCATTA(SEQ ID NO.37);
PCSK9_L1:CCCAGAGCATCCCGTGGAAC(SEQ ID NO.38);
PDCD1_L1:CTGTGAGCTCTAGTCCCCAC(SEQ ID NO.15);
PRNP_L1:TGGCCACATGGAGTGACCTG(SEQ ID NO.39);
TP53_L1:ATAAGAGGTCCCAAGACTTA(SEQ ID NO.40);
TP53_L2:AGGCATCACTGCCCCCTGAT(SEQ ID NO.16);
TP53_L3:TCCTGCTTGCTTACCTCGCT(SEQ ID NO.41);
TP53_L4:CCTCTTTCCTAGCACTGCCC(SEQ ID NO.42);
TP53_L5:GCTGGGGAGAGGAGCTGGTG(SEQ ID NO.43);
TP53_L6:CTTACCTCGCTTAGTGCTCC(SEQ ID NO.44);
VEGFA_L1:CTCTCAAGACCCACAATCCA(SEQ ID NO.17);
VEGFA_L2:AAGAAGGGATGTGGTGCATT(SEQ ID NO.18);
VEGFA_L3:CTGTGATTTCCCCACAAAAG(SEQ ID NO.45);
VEGFA_L4:CCTCTTCCGGCCTGGATTGT(SEQ ID NO.46);
参考实施例1,以人胚胎肾细胞HEK293T为实验细胞,进行基因编辑测试。
图3为原始野生CRISPR/AsCas12f1系统与工程优化的CRISPR/AsCas12f1系统在哺乳动物细胞中基因编辑效果的比较图。如图所示,工程优化后的CRISPR/AsCas12f1基因编辑系统可在11个基因的27个靶位点上显著提升基因编辑效率。
实施例4工程优化的CRISPR/AsCas12f1基因编辑系统在体外DNA切割中的应用
本实施例中的sgRNA_T1由本领域内常规技术方法,例如体外转录法进行制备。可使用HiScribe T7 High Yield RNA Synthesis Kit(NEB)试剂盒进行制备。制备后的sgRNA_T1经过酚氯仿抽提和乙醇沉淀进行纯化。
本实施例中的野生原始AsCas12f1核酸酶和变体核酸酶由本领域内常规技术方法,例如大肠杆菌重组表达和亲和层析技术进行制备。将核酸酶表达构建体转化入大肠杆菌表达菌株BL21(DE3)。次日将转化子转接入1L的LB培养基中,37℃条件下进行震荡培养。当OD600到达0.6时,在培养液中加入0.25mL 1MIPTG,在16℃继续培养过夜。收集过夜后的菌株,超声破碎后,用HisTrap Ni-NTA(Cytiva)层析柱进行纯化。纯化后的蛋白,使用HRV3c蛋白酶去除标签,后经过HiLoad 16/600Superdex 200pg分子筛(Cytiva)进一步纯化。纯化后的蛋白保存在1000mM NaCl,10mM Tris-HCl,pH=7.5,1mM DTT的缓冲液中。
本实施例中DNA底物由本领域内常规技术方法,例如聚合酶链式反应PCR进行制备。切割底物中包含sgRNA_T1中的靶序列,且靶序列上游包含有PAM序列,其序列特征为5’-TTR,其中R代表A或G。
本实施例中所述的工程优化的CRISPR/AsCas12f1基因编辑系统为AsCas12f1-Evo1和sgRNA_T1的组合。
体外DNA切割实验在50mM NaCl,10mM MgCl2,10mM Tris-HCl,pH=7.5条件中进行。总反应体积为20μL,其中包括10nM切割底物,500nM AsCas12f1和1000nM向导RNA。反应时间为0、0.5、1、2、4、8、16、32、64分钟,反应温度为45℃。反应结束后加入6×Gel LoadingDye终止反应。反应产物通过1%的琼脂糖胶分离,并通过4S Red dye进行染色成像。
图4为原始野生CRISPR/AsCas12f1系统与工程优化的CRISPR/AsCas12f1系统在体外切割DNA效果的比较图。如图所示,工程优化后的CRISPR/AsCas12f1基因编辑系统能显著提升体外DNA切割的效率和速度。
最后应当说明的是,虽然以上详细描述了本发明实施例的具体方式,但是本领域的技术人员应当理解,这些仅是举例说明,在不背离本发明的原理和实质的前提下,可以对本发明的实施方式进行修改或者等同替换。因此,本发明的保护范围由所附权利要求书限定。
序列表
<110> 上海科技大学
<120> 一种工程优化的核酸酶、向导RNA、编辑系统和应用
<160> 52
<170> SIPOSequenceListing 1.0
<210> 1
<211> 422
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 1
Met Ile Lys Val Tyr Arg Tyr Glu Ile Val Lys Pro Leu Asp Leu Asp
1 5 10 15
Trp Lys Glu Phe Gly Thr Ile Leu Arg Gln Leu Gln Gln Glu Thr Arg
20 25 30
Phe Ala Leu Asn Lys Ala Thr Gln Leu Ala Trp Glu Trp Met Gly Phe
35 40 45
Ser Ser Asp Tyr Lys Asp Asn His Gly Glu Tyr Pro Lys Ser Lys Asp
50 55 60
Ile Leu Gly Tyr Thr Asn Val His Gly Tyr Ala Tyr His Thr Ile Arg
65 70 75 80
Thr Lys Ala Tyr Arg Leu Asn Ser Gly Asn Leu Ser Gln Thr Ile Lys
85 90 95
Arg Ala Thr Asp Arg Phe Lys Ala Tyr Gln Lys Glu Ile Leu Arg Gly
100 105 110
Asp Met Ser Ile Pro Ser Tyr Lys Arg Asp Ile Pro Leu Asp Leu Ile
115 120 125
Lys Glu Asn Ile Ser Val Asn Arg Met Asn His Gly Asp Tyr Ile Ala
130 135 140
Ser Leu Ser Leu Leu Ser Asn Pro Ala Lys Gln Glu Met Asn Val Lys
145 150 155 160
Arg Lys Ile Ser Val Ile Ile Ile Val Arg Gly Ala Gly Lys Thr Ile
165 170 175
Met Asp Arg Ile Leu Ser Gly Glu Tyr Gln Val Ser Ala Ser Gln Ile
180 185 190
Ile His Asp Asp Arg Lys Asn Lys Trp Tyr Leu Asn Ile Ser Tyr Asp
195 200 205
Phe Glu Pro Gln Thr Arg Val Leu Asp Leu Asn Lys Ile Met Gly Ile
210 215 220
Asp Leu Gly Val Ala Val Ala Val Tyr Met Ala Phe Gln His Thr Pro
225 230 235 240
Ala Arg Tyr Lys Leu Glu Gly Gly Glu Ile Glu Asn Phe Arg Arg Gln
245 250 255
Val Glu Ser Arg Arg Ile Ser Met Leu Arg Gln Gly Lys Tyr Ala Gly
260 265 270
Gly Ala Arg Gly Gly His Gly Arg Asp Lys Arg Ile Lys Pro Ile Glu
275 280 285
Gln Leu Arg Asp Lys Ile Ala Asn Phe Arg Asp Thr Thr Asn His Arg
290 295 300
Tyr Ser Arg Tyr Ile Val Asp Met Ala Ile Lys Glu Gly Cys Gly Thr
305 310 315 320
Ile Gln Met Glu Asp Leu Thr Asn Ile Arg Asp Ile Gly Ser Arg Phe
325 330 335
Leu Gln Asn Trp Thr Tyr Tyr Asp Leu Gln Gln Lys Ile Ile Tyr Lys
340 345 350
Ala Glu Glu Ala Gly Ile Lys Val Ile Lys Ile Asp Pro Gln Tyr Thr
355 360 365
Ser Gln Arg Cys Ser Glu Cys Gly Asn Ile Asp Ser Gly Asn Arg Ile
370 375 380
Gly Gln Ala Ile Phe Lys Cys Arg Ala Cys Gly Tyr Glu Ala Asn Ala
385 390 395 400
Asp Tyr Asn Ala Ala Arg Asn Ile Ala Ile Pro Asn Ile Asp Lys Ile
405 410 415
Ile Ala Glu Ser Ile Lys
420
<210> 2
<211> 422
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 2
Met Ile Lys Val Tyr Arg Tyr Glu Ile Val Lys Pro Leu Asp Leu Asp
1 5 10 15
Trp Lys Glu Phe Gly Thr Ile Leu Arg Gln Leu Gln Gln Glu Thr Arg
20 25 30
Phe Ala Leu Asn Lys Ala Thr Gln Leu Ala Trp Glu Trp Met Gly Phe
35 40 45
Ser Ser Asp Tyr Lys Asp Asn His Gly Glu Tyr Pro Lys Ser Lys Asp
50 55 60
Ile Leu Gly Tyr Thr Asn Val His Gly Tyr Ala Tyr His Thr Ile Lys
65 70 75 80
Thr Lys Ala Tyr Arg Leu Asn Ser Gly Asn Leu Ser Gln Thr Ile Lys
85 90 95
Arg Ala Thr Asp Arg Phe Lys Arg Tyr Gln Lys Glu Ile Leu Arg Gly
100 105 110
Asp Met Ser Ile Pro Ser Tyr Lys Arg Asp Ile Pro Leu Asp Leu Ile
115 120 125
Lys Glu Asn Ile Ser Val Asn Arg Met Asn His Gly Asp Tyr Ile Ala
130 135 140
Ser Leu Ser Leu Leu Ser Asn Pro Ala Lys Gln Glu Met Asn Val Lys
145 150 155 160
Arg Lys Ile Ser Val Ile Ile Ile Val Arg Gly Ala Gly Lys Thr Ile
165 170 175
Met Asp Arg Ile Leu Ser Gly Glu Tyr Gln Val Ser Ala Ser Gln Ile
180 185 190
Ile His Asp Asp Arg Lys Asn Lys Trp Tyr Leu Asn Ile Ser Tyr Asp
195 200 205
Phe Glu Pro Gln Thr Arg Val Leu Asp Leu Asn Lys Ile Met Gly Ile
210 215 220
Asp Leu Gly Val Ala Val Ala Val Tyr Met Ala Phe Gln His Thr Pro
225 230 235 240
Ala Arg Tyr Lys Leu Glu Gly Gly Glu Ile Glu Asn Phe Arg Arg Gln
245 250 255
Val Glu Ser Arg Arg Ile Ser Met Leu Arg Gln Gly Lys Tyr Ala Gly
260 265 270
Gly Ala Arg Gly Gly His Gly Arg Asp Lys Arg Ile Lys Pro Ile Glu
275 280 285
Gln Leu Arg Asp Lys Ile Ala Asn Phe Arg Asp Thr Thr Asn His Arg
290 295 300
Tyr Ser Arg Tyr Ile Val Asp Met Ala Ile Lys Glu Gly Cys Gly Thr
305 310 315 320
Ile Gln Met Glu Asp Leu Thr Asn Ile Arg Asp Ile Gly Ser Arg Phe
325 330 335
Leu Gln Asn Trp Thr Tyr Tyr Asp Leu Gln Gln Lys Ile Ile Tyr Lys
340 345 350
Ala Glu Glu Ala Gly Ile Lys Val Ile Lys Ile Asp Pro Gln Tyr Thr
355 360 365
Ser Gln Arg Cys Ser Glu Cys Gly Asn Ile Asp Ser Gly Asn Arg Ile
370 375 380
Gly Gln Ala Ile Phe Lys Cys Arg Ala Cys Gly Tyr Glu Ala Asn Ala
385 390 395 400
Asp Tyr Asn Ala Ala Arg Asn Ile Ala Ile Pro Asn Ile Asp Lys Ile
405 410 415
Ile Ala Glu Ser Ile Lys
420
<210> 3
<211> 422
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 3
Met Ile Lys Val Tyr Arg Tyr Glu Ile Val Lys Pro Leu Asp Leu Asp
1 5 10 15
Trp Lys Glu Phe Gly Thr Ile Leu Arg Gln Leu Gln Gln Glu Thr Arg
20 25 30
Phe Ala Leu Asn Lys Ala Thr Gln Leu Ala Trp Glu Trp Met Gly Phe
35 40 45
Ser Ser Asp Tyr Lys Asp Asn His Gly Glu Tyr Pro Lys Ser Lys Asp
50 55 60
Ile Leu Gly Tyr Thr Asn Val His Gly Tyr Ala Tyr His Thr Ile Lys
65 70 75 80
Thr Lys Ala Tyr Arg Leu Asn Ser Gly Asn Leu Ser Gln Thr Ile Lys
85 90 95
Arg Ala Thr Asp Arg Phe Lys Ala Tyr Gln Lys Glu Ile Leu Arg Gly
100 105 110
Asp Met Ser Ile Pro Ser Tyr Lys Arg Asp Ile Pro Leu Asp Leu Ile
115 120 125
Lys Glu Asn Ile Ser Val Asn Arg Met Asn His Gly Asp Tyr Ile Ala
130 135 140
Ser Leu Ser Leu Leu Ser Asn Pro Ala Lys Gln Glu Met Asn Val Lys
145 150 155 160
Arg Lys Ile Ser Val Ile Ile Ile Val Arg Gly Ala Gly Lys Thr Ile
165 170 175
Met Asp Arg Ile Leu Ser Gly Glu Tyr Gln Val Ser Ala Ser Gln Ile
180 185 190
Ile His Asp Asp Arg Lys Asn Lys Trp Tyr Leu Asn Ile Ser Tyr Asp
195 200 205
Phe Glu Pro Gln Thr Arg Val Leu Asp Leu Asn Lys Ile Met Gly Ile
210 215 220
Asp Leu Gly Val Ala Val Ala Val Tyr Met Ala Phe Gln His Thr Pro
225 230 235 240
Ala Arg Tyr Lys Leu Glu Gly Gly Glu Ile Glu Asn Phe Arg Arg Gln
245 250 255
Val Glu Ser Arg Arg Ile Ser Met Leu Arg Gln Gly Lys Tyr Ala Gly
260 265 270
Gly Ala Arg Gly Gly His Gly Arg Asp Lys Arg Ile Lys Pro Ile Glu
275 280 285
Gln Leu Arg Asp Lys Ile Ala Asn Phe Arg Asp Thr Thr Asn His Arg
290 295 300
Tyr Ser Arg Tyr Ile Val Asp Met Ala Ile Lys Glu Gly Cys Gly Thr
305 310 315 320
Ile Gln Met Glu Asp Leu Thr Asn Ile Arg Asp Ile Gly Ser Arg Phe
325 330 335
Leu Gln Asn Trp Thr Tyr Tyr Asp Leu Gln Gln Lys Ile Ile Tyr Lys
340 345 350
Ala Glu Glu Ala Gly Ile Lys Val Ile Lys Ile Arg Pro Gln Tyr Thr
355 360 365
Ser Gln Arg Cys Ser Glu Cys Gly Asn Ile Asp Ser Gly Asn Arg Ile
370 375 380
Gly Gln Ala Ile Phe Lys Cys Arg Ala Cys Gly Tyr Glu Ala Asn Ala
385 390 395 400
Asp Tyr Asn Ala Ala Arg Asn Ile Ala Ile Pro Asn Ile Asp Lys Ile
405 410 415
Ile Ala Glu Ser Ile Lys
420
<210> 4
<211> 422
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 4
Met Ile Lys Val Tyr Arg Tyr Glu Ile Val Lys Pro Leu Asp Leu Asp
1 5 10 15
Trp Lys Glu Phe Gly Thr Ile Leu Arg Gln Leu Gln Gln Glu Thr Arg
20 25 30
Phe Ala Leu Asn Lys Ala Thr Gln Leu Ala Trp Glu Trp Met Gly Phe
35 40 45
Ser Ser Asp Tyr Lys Asp Asn His Gly Glu Tyr Pro Lys Ser Lys Asp
50 55 60
Ile Leu Gly Tyr Thr Asn Val His Gly Tyr Ala Tyr His Thr Ile Arg
65 70 75 80
Thr Lys Ala Tyr Arg Leu Asn Ser Gly Asn Leu Ser Gln Thr Ile Lys
85 90 95
Arg Ala Thr Asp Arg Phe Lys Arg Tyr Gln Lys Glu Ile Leu Arg Gly
100 105 110
Asp Met Ser Ile Pro Ser Tyr Lys Arg Asp Ile Pro Leu Asp Leu Ile
115 120 125
Lys Glu Asn Ile Ser Val Asn Arg Met Asn His Gly Asp Tyr Ile Ala
130 135 140
Ser Leu Ser Leu Leu Ser Asn Pro Ala Lys Gln Glu Met Asn Val Lys
145 150 155 160
Arg Lys Ile Ser Val Ile Ile Ile Val Arg Gly Ala Gly Lys Thr Ile
165 170 175
Met Asp Arg Ile Leu Ser Gly Glu Tyr Gln Val Ser Ala Ser Gln Ile
180 185 190
Ile His Asp Asp Arg Lys Asn Lys Trp Tyr Leu Asn Ile Ser Tyr Asp
195 200 205
Phe Glu Pro Gln Thr Arg Val Leu Asp Leu Asn Lys Ile Met Gly Ile
210 215 220
Asp Leu Gly Val Ala Val Ala Val Tyr Met Ala Phe Gln His Thr Pro
225 230 235 240
Ala Arg Tyr Lys Leu Glu Gly Gly Glu Ile Glu Asn Phe Arg Arg Gln
245 250 255
Val Glu Ser Arg Arg Ile Ser Met Leu Arg Gln Gly Lys Tyr Ala Gly
260 265 270
Gly Ala Arg Gly Gly His Gly Arg Asp Lys Arg Ile Lys Pro Ile Glu
275 280 285
Gln Leu Arg Asp Lys Ile Ala Asn Phe Arg Asp Thr Thr Asn His Arg
290 295 300
Tyr Ser Arg Tyr Ile Val Asp Met Ala Ile Lys Glu Gly Cys Gly Thr
305 310 315 320
Ile Gln Met Glu Asp Leu Thr Asn Ile Arg Asp Ile Gly Ser Arg Phe
325 330 335
Leu Gln Asn Trp Thr Tyr Tyr Asp Leu Gln Gln Lys Ile Ile Tyr Lys
340 345 350
Ala Glu Glu Ala Gly Ile Lys Val Ile Lys Ile Asp Pro Gln Tyr Thr
355 360 365
Ser Gln Arg Cys Ser Glu Cys Gly Asn Ile Asp Ser Gly Asn Arg Ile
370 375 380
Gly Gln Ala Ile Phe Lys Cys Arg Ala Cys Gly Tyr Glu Ala Asn Ala
385 390 395 400
Asp Tyr Asn Ala Ala Arg Asn Ile Ala Ile Pro Asn Ile Asp Lys Ile
405 410 415
Ile Ala Glu Ser Ile Lys
420
<210> 5
<211> 422
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 5
Met Ile Lys Val Tyr Arg Tyr Glu Ile Val Lys Pro Leu Asp Leu Asp
1 5 10 15
Trp Lys Glu Phe Gly Thr Ile Leu Arg Gln Leu Gln Gln Glu Thr Arg
20 25 30
Phe Ala Leu Asn Lys Ala Thr Gln Leu Ala Trp Glu Trp Met Gly Phe
35 40 45
Ser Ser Asp Tyr Lys Asp Asn His Gly Glu Tyr Pro Lys Ser Lys Asp
50 55 60
Ile Leu Gly Tyr Thr Asn Val His Gly Tyr Ala Tyr His Thr Ile Lys
65 70 75 80
Thr Lys Ala Tyr Arg Leu Asn Ser Gly Asn Leu Ser Gln Thr Ile Lys
85 90 95
Arg Ala Thr Asp Arg Phe Lys Arg Tyr Gln Lys Glu Ile Leu Arg Gly
100 105 110
Asp Met Ser Ile Pro Ser Tyr Lys Arg Asp Ile Pro Leu Asp Leu Ile
115 120 125
Lys Glu Asn Ile Ser Val Asn Arg Met Asn His Gly Asp Tyr Ile Ala
130 135 140
Ser Leu Ser Leu Leu Ser Asn Pro Ala Lys Gln Glu Met Asn Val Lys
145 150 155 160
Arg Lys Ile Ser Val Ile Ile Ile Val Arg Gly Ala Gly Lys Thr Ile
165 170 175
Met Asp Arg Ile Leu Ser Gly Glu Tyr Gln Val Ser Ala Ser Gln Ile
180 185 190
Ile His Asp Asp Arg Lys Asn Lys Trp Tyr Leu Asn Ile Ser Tyr Asp
195 200 205
Phe Glu Pro Gln Thr Arg Val Leu Asp Leu Asn Lys Ile Met Gly Ile
210 215 220
Asp Leu Gly Val Ala Val Ala Val Tyr Met Ala Phe Gln His Thr Pro
225 230 235 240
Ala Arg Tyr Lys Leu Glu Gly Gly Glu Ile Glu Asn Phe Arg Arg Gln
245 250 255
Val Glu Ser Arg Arg Ile Ser Met Leu Arg Gln Gly Lys Tyr Ala Gly
260 265 270
Gly Ala Arg Gly Gly His Gly Arg Asp Lys Arg Ile Lys Pro Ile Glu
275 280 285
Gln Leu Arg Asp Lys Ile Ala Asn Phe Arg Asp Thr Thr Asn His Arg
290 295 300
Tyr Ser Arg Tyr Ile Val Asp Met Ala Ile Lys Glu Gly Cys Gly Thr
305 310 315 320
Ile Gln Met Glu Asp Leu Thr Asn Ile Arg Asp Ile Gly Ser Arg Phe
325 330 335
Leu Gln Asn Trp Thr Tyr Tyr Asp Leu Gln Gln Lys Ile Ile Tyr Lys
340 345 350
Ala Glu Glu Ala Gly Ile Lys Val Ile Lys Ile Arg Pro Gln Tyr Thr
355 360 365
Ser Gln Arg Cys Ser Glu Cys Gly Asn Ile Asp Ser Gly Asn Arg Ile
370 375 380
Gly Gln Ala Ile Phe Lys Cys Arg Ala Cys Gly Tyr Glu Ala Asn Ala
385 390 395 400
Asp Tyr Asn Ala Ala Arg Asn Ile Ala Ile Pro Asn Ile Asp Lys Ile
405 410 415
Ile Ala Glu Ser Ile Lys
420
<210> 6
<211> 422
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 6
Met Ile Lys Val Tyr Arg Tyr Glu Ile Val Lys Pro Leu Asp Leu Asp
1 5 10 15
Trp Lys Glu Phe Gly Thr Ile Leu Arg Gln Leu Gln Gln Glu Thr Arg
20 25 30
Phe Ala Leu Asn Lys Ala Thr Gln Leu Ala Trp Glu Trp Met Gly Phe
35 40 45
Ser Ser Asp Tyr Lys Asp Asn His Gly Glu Tyr Pro Lys Ser Lys Asp
50 55 60
Ile Leu Gly Tyr Thr Asn Val His Gly Tyr Ala Tyr His Thr Ile Arg
65 70 75 80
Thr Lys Ala Tyr Arg Leu Asn Ser Gly Asn Leu Ser Gln Thr Ile Lys
85 90 95
Arg Ala Thr Asp Arg Phe Lys Arg Tyr Gln Lys Glu Ile Leu Arg Gly
100 105 110
Asp Met Ser Ile Pro Ser Tyr Lys Arg Asp Ile Pro Leu Asp Leu Ile
115 120 125
Lys Glu Asn Ile Ser Val Asn Arg Met Asn His Gly Asp Tyr Ile Ala
130 135 140
Ser Leu Ser Leu Leu Ser Asn Pro Ala Lys Gln Glu Met Asn Val Lys
145 150 155 160
Arg Lys Ile Ser Val Ile Ile Ile Val Arg Gly Ala Gly Lys Thr Ile
165 170 175
Met Asp Arg Ile Leu Ser Gly Glu Tyr Gln Val Ser Ala Ser Gln Ile
180 185 190
Ile His Asp Asp Arg Lys Asn Lys Trp Tyr Leu Asn Ile Ser Tyr Asp
195 200 205
Phe Glu Pro Gln Thr Arg Val Leu Asp Leu Asn Lys Ile Met Gly Ile
210 215 220
Asp Leu Gly Val Ala Val Ala Val Tyr Met Ala Phe Gln His Thr Pro
225 230 235 240
Ala Arg Tyr Lys Leu Glu Gly Gly Glu Ile Glu Asn Phe Arg Arg Gln
245 250 255
Val Glu Ser Arg Arg Ile Ser Met Leu Arg Gln Gly Lys Tyr Ala Gly
260 265 270
Gly Ala Arg Gly Gly His Gly Arg Asp Lys Arg Ile Lys Pro Ile Glu
275 280 285
Gln Leu Arg Asp Lys Ile Ala Asn Phe Arg Asp Thr Thr Asn His Arg
290 295 300
Tyr Ser Arg Tyr Ile Val Asp Met Ala Ile Lys Glu Gly Cys Gly Thr
305 310 315 320
Ile Gln Met Glu Asp Leu Thr Asn Ile Arg Asp Ile Gly Ser Arg Phe
325 330 335
Leu Gln Asn Trp Thr Tyr Tyr Asp Leu Gln Gln Lys Ile Ile Tyr Lys
340 345 350
Ala Glu Glu Ala Gly Ile Lys Val Ile Lys Ile Arg Pro Gln Tyr Thr
355 360 365
Ser Gln Arg Cys Ser Glu Cys Gly Asn Ile Asp Ser Gly Asn Arg Ile
370 375 380
Gly Gln Ala Ile Phe Lys Cys Arg Ala Cys Gly Tyr Glu Ala Asn Ala
385 390 395 400
Asp Tyr Asn Ala Ala Arg Asn Ile Ala Ile Pro Asn Ile Asp Lys Ile
405 410 415
Ile Ala Glu Ser Ile Lys
420
<210> 7
<211> 1266
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
atgatcaagg tgtacagata cgagatcgtg aagcctctgg acctggactg gaaggagttc 60
ggcaccatcc tgagacagct gcagcaggaa accagattcg ccctgaataa ggccacacag 120
ctggcctggg agtggatggg cttcagcagc gactacaagg ataaccacgg cgagtacccc 180
aagagcaagg acatcctggg ctacaccaac gtgcacggct acgcctacca caccatcaag 240
acaaaggcct acagactgaa ctctggaaat ctgagccaga ccatcaagag agccacagac 300
aggttcaagg cctaccagaa ggagatcctg cgcggcgaca tgtctatccc cagctacaag 360
agggacatcc ccctggacct gatcaaggag aacatctccg tgaacaggat gaatcacggc 420
gactacatcg ccagcctgtc tctgctgagc aaccccgcca agcaggagat gaacgtgaag 480
agaaagatct ccgtgatcat catcgtgagg ggcgccggca agaccatcat ggacagaatc 540
ctgtccggcg agtaccaggt gagcgccagc cagattatcc acgacgaccg gaagaacaag 600
tggtacctga acatcagcta cgacttcgag ccacagacca gagtgctgga cctgaacaag 660
atcatgggca ttgacctggg cgtggccgtg gccgtgtaca tggccttcca gcacaccccc 720
gccaggtaca agctggaggg cggcgagatt gagaacttca ggaggcaggt ggagagccgg 780
cgcatctcca tgctgagaca gggcaagtac gccggcggcg ccaggggcgg ccacggcaga 840
gacaagagaa tcaagcccat tgagcagctg agggataaga tcgccaattt cagagacacc 900
accaatcacc ggtacagcag atacatcgtg gacatggcca tcaaggaggg ctgcggcaca 960
atccagatgg aggatctgac aaacatcaga gacatcggca gcagattcct gcagaactgg 1020
acctactacg acctgcagca gaagatcatc tacaaggccg aggaggccgg catcaaagtg 1080
atcaagatcg acccccagta caccagccag agatgctccg agtgcggcaa catcgactcc 1140
ggcaacagaa tcggccaggc catctttaag tgccgggcct gcggctacga ggccaacgcc 1200
gactacaacg ccgcccggaa tatcgccatc cccaacatcg acaagatcat cgccgagagc 1260
attaag 1266
<210> 8
<211> 6810
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
ggtaccgatt agtgaacgga tctcgacggt atcgatcacg agactagcct cgagcggccg 60
cccccttcac cgagggccta tttcccatga ttccttcata tttgcatata cgatacaagg 120
ctgttagaga gataattgga attaatttga ctgtaaacac aaagatatta gtacaaaata 180
cgtgacgtag aaagtaataa tttcttgggt agtttgcagt tttaaaatta tgttttaaaa 240
tggactatca tatgcttacc gtaacttgaa agtatttcga tttcttggct ttatatatct 300
tgtggaaagg acgaaacacc gattcgtcgg ttcagcgacg ataagccgag aagtgccaat 360
aaaactgtta agtggtttgg taacgctcgg taaggtagcc aaaaggctga aactccgtgc 420
acaaagaccg cacggacgct tcacatactt gtggagtgtg aacctctcaa gacccacaat 480
ccattttttt gaattctcga cctcgagaca aatggcagta ttcatccaca attttaaaag 540
aaaagggggg attggggggt acagtgcagg ggaaagaata gtagacataa tagcaacaga 600
catacaaact aaagaattac aaaaacaaat tacaaaaatt caaaattttc gggtttatta 660
cagggacagc agagatccac tttggccgcg gctcgagggg gttggggttg cgccttttcc 720
aaggcagccc tgggtttgcg cagggacgcg gctgctctgg gcgtggttcc gggaaacgca 780
gcggcgccga ccctgggact cgcacattct tcacgtccgt tcgcagcgtc acccggatct 840
tcgccgctac ccttgtgggc cccccggcga cgcttcctgc tccgccccta agtcgggaag 900
gttccttgcg gttcgcggcg tgccggacgt gacaaacgga agccgcacgt ctcactagta 960
ccctcgcaga cggacagcgc cagggagcaa tggcagcgcg ccgaccgcga tgggctgtgg 1020
ccaatagcgg ctgctcagca gggcgcgccg agagcagcgg ccgggaaggg gcggtgcggg 1080
aggcggggtg tggggcggta gtgtgggccc tgttcctgcc cgcgcggtgt tccgcattct 1140
gcaagcctcc ggagcgcacg tcggcagtcg gctccctcgt tgaccgaatc accgacctct 1200
ctccccaggg ggatccaccg gagcttacca tgaccgagta caagcccacg gtgcgcctcg 1260
ccacccgcga cgacgtcccc agggccgtac gcaccctcgc cgccgcgttc gccgactacc 1320
ccgccacgcg ccacaccgtc gatccggacc gccacatcga gcgggtcacc gagctgcaag 1380
aactcttcct cacgcgcgtc gggctcgaca tcggcaaggt gtgggtcgcg gacgacggcg 1440
ccgcggtggc ggtctggacc acgccggaga gcgtcgaagc gggggcggtg ttcgccgaga 1500
tcggcccgcg catggccgag ttgagcggtt cccggctggc cgcgcagcaa cagatggaag 1560
gcctcctggc gccgcaccgg cccaaggagc ccgcgtggtt cctggccacc gtcggcgtct 1620
cgcccgacca ccagggcaag ggtctgggca gcgccgtcgt gctccccgga gtggaggcgg 1680
ccgagcgcgc cggggtgccc gccttcctgg aaacctccgc gccccgcaac ctccccttct 1740
acgagcggct cggcttcacc gtcaccgccg acgtcgaggt gcccgaagga ccgcgcacct 1800
ggtgcatgac ccgcaagccc ggtgcctgac gcccgcccca cgacccgcag cgcccgaccg 1860
aaaggagcgc acgaccccat gcatcggtac ctttaagacc aatgacttac aaggcagctg 1920
tagatcttag ccactttcta gagtcggggc ggccggccgc ttcgagcaga catgataaga 1980
tacattgatg agtttggaca aaccacaact agaatgcagt gaaaaaaatg ctttatttgt 2040
gaaatttgtg atgctattgc tttatttgta accattataa gctgcaataa acaagttaac 2100
aacaacaatt gcattcattt tatgtttcag gttcaggggg aggtgtggga ggttttttaa 2160
agcaagtaaa acctctacaa atgtggtaaa atcgataagg atccgtcgac cgatgccctt 2220
gagagccttc aacccagtca gctccttccg gtgggcgcgg ggcatgacta tcgtcgccgc 2280
acttatgact gtcttcttta tcatgcaact cgtaggacag gtgccggcag cgctcttccg 2340
cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc 2400
actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt 2460
gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc 2520
ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa 2580
acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc 2640
ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg 2700
cgctttctca atgctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc 2760
tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc 2820
gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca 2880
ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact 2940
acggctacac tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg 3000
gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt 3060
ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct 3120
tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga 3180
gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa 3240
tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac 3300
ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga 3360
taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgggacc 3420
cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca 3480
gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta 3540
gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg 3600
tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc 3660
gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg 3720
ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt 3780
ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt 3840
cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata 3900
ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc 3960
gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac 4020
ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa 4080
ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct 4140
tcctttttca atattattga agcatttatc agggttattg tctcatgagc ggatacatat 4200
ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc 4260
cacctgcagg aaacagctat gaccatgatt acgccaagct ctagctagag gtcgacggta 4320
tcgagcccca gctggttctt tccgcctcag aagccataga gcccaccgca tccccagcat 4380
gcctgctatt gtcttcccaa tcctccccct tgctgtcctg ccccacccca ccccccagaa 4440
tagaatgaca cctactcaga caatgcgatg caatttcctc attttattag gaaaggacag 4500
tgggagtggc accttccagg gtcaaggaag gcacggggga ggggcaaaca acagatggct 4560
ggcaactaga aggcacagtc gaggctgatc agcgggttta aactcaatgg tgatggtgat 4620
gatgaccggt tagactttcc tcttcttctt gggagaacca ccagacttaa tgctctcggc 4680
gatgatcttg tcgatgttgg ggatggcgat attccgggcg gcgttgtagt cggcgttggc 4740
ctcgtagccg caggcccggc acttaaagat ggcctggccg attctgttgc cggagtcgat 4800
gttgccgcac tcggagcatc tctggctggt gtactggggg tcgatcttga tcactttgat 4860
gccggcctcc tcggccttgt agatgatctt ctgctgcagg tcgtagtagg tccagttctg 4920
caggaatctg ctgccgatgt ctctgatgtt tgtcagatcc tccatctgga ttgtgccgca 4980
gccctccttg atggccatgt ccacgatgta tctgctgtac cggtgattgg tggtgtctct 5040
gaaattggcg atcttatccc tcagctgctc aatgggcttg attctcttgt ctctgccgtg 5100
gccgcccctg gcgccgccgg cgtacttgcc ctgtctcagc atggagatgc gccggctctc 5160
cacctgcctc ctgaagttct caatctcgcc gccctccagc ttgtacctgg cgggggtgtg 5220
ctggaaggcc atgtacacgg ccacggccac gcccaggtca atgcccatga tcttgttcag 5280
gtccagcact ctggtctgtg gctcgaagtc gtagctgatg ttcaggtacc acttgttctt 5340
ccggtcgtcg tggataatct ggctggcgct cacctggtac tcgccggaca ggattctgtc 5400
catgatggtc ttgccggcgc ccctcacgat gatgatcacg gagatctttc tcttcacgtt 5460
catctcctgc ttggcggggt tgctcagcag agacaggctg gcgatgtagt cgccgtgatt 5520
catcctgttc acggagatgt tctccttgat caggtccagg gggatgtccc tcttgtagct 5580
ggggatagac atgtcgccgc gcaggatctc cttctggtag gccttgaacc tgtctgtggc 5640
tctcttgatg gtctggctca gatttccaga gttcagtctg taggcctttg tcttgatggt 5700
gtggtaggcg tagccgtgca cgttggtgta gcccaggatg tccttgctct tggggtactc 5760
gccgtggtta tccttgtagt cgctgctgaa gcccatccac tcccaggcca gctgtgtggc 5820
cttattcagg gcgaatctgg tttcctgctg cagctgtctc aggatggtgc cgaactcctt 5880
ccagtccagg tccagaggct tcacgatctc gtatctgtac accttgatca tgactttcct 5940
cttcttcttg ggggccatgg tggcggctct ccctatagtg agtcgtatta gcggccgcgg 6000
atctctagcg gatctgacgg ttcactaaac cagctctgct tatatagacc tcccaccgta 6060
cacgcctacc gcccatttgc gtcaatgggg cggagttgtt acgacatttt ggaaagtccc 6120
gttgattttg gtgccaaaac aaactcccat tgacgtcaat ggggtggaga cttggaaatc 6180
cccgtgagtc aaaccgctat ccacgcccat tgatgtactg ccaaaaccgc atcaccatgg 6240
taatagcgat gactaatacg tagatgtact gccaagtagg aaagtcccat aaggtcatgt 6300
actgggcata atgccaggcg ggccatttac cgtcattgac gtcaataggg ggcgtacttg 6360
gcatatgata cacttgatgt actgccaagt gggcagttta ccgtaaatac tccacccatt 6420
gacgtcaatg gaaagtccct attggcgtta ctatgggaac atacgtcatt attgacgtca 6480
atgggcgggg gtcgttgggc ggtcagccag gcgggccatt taccgtaagt tatgtaacgc 6540
ggaactccat atatgggcta tgaactaatg accccgtaat tgattactat taataactag 6600
tcaataatca atgtcaacgc gtatatctgg cccgtacatc gcgaagcagc gcaaaacgcc 6660
taaccctaag cagattcttc atgcaattgt cggtcaagaa tcgatagtac taacatacgc 6720
tctccatcaa aacaaaacga aacaaaacaa actagcaaaa taggctgtcc ccagtgcaag 6780
tgcaggtgcc agaacatttc tctatcgata 6810
<210> 9
<211> 162
<212> RNA
<213> 人工序列(Artificial Sequence)
<400> 9
auucgucggu ucagcgacga uaagccgaga agugccaaua aaacuguuaa gugguuuggu 60
aacgcucggu aagguagcca aaaggcugaa acuccgugca caaagaccgc acggacgcuu 120
cacauacuug uggaguguga accucucaag acccacaauc ca 162
<210> 10
<211> 191
<212> RNA
<213> 人工序列(Artificial Sequence)
<400> 10
auucgucggu ucagcgacga uaagccgaga agugccaaua aaacuguuaa gugguuuggu 60
aacgcucggu aagguagcca aaaggcugaa acuccgugca caaagaccgc acggacgcuu 120
cacauauagc ucauaaacaa ggguuugcga gcuagcuugu ggagugugaa ccucucaaga 180
cccacaaucc a 191
<210> 11
<211> 191
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
attcgtcggt tcagcgacga taagccgaga agtgccaata aaactgttaa gtggtttggt 60
aacgctcggt aaggtagcca aaaggctgaa actccgtgca caaagaccgc acggacgctt 120
cacatatagc tcataaacaa gggtttgcga gctagcttgt ggagtgtgaa cctctcaaga 180
cccacaatcc a 191
<210> 12
<211> 162
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
attcgtcggt tcagcgacga taagccgaga agtgccaata aaactgttaa gtggtttggt 60
aacgctcggt aaggtagcca aaaggctgaa actccgtgca caaagaccgc acggacgctt 120
cacatacttg tggagtgtga acctctcaag acccacaatc ca 162
<210> 13
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
ctgtcgacac ccagaatcat 20
<210> 14
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
agtatacgct tccacagaaa 20
<210> 15
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
ctgtgagctc tagtccccac 20
<210> 16
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
aggcatcact gccccctgat 20
<210> 17
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
ctctcaagac ccacaatcca 20
<210> 18
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
aagaagggat gtggtgcatt 20
<210> 19
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<400> 19
cucucaagac ccacaaucca 20
<210> 20
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
gcgggtctca cagaacaaag gcctacagac tgaactc 37
<210> 21
<211> 35
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
gcgggtctca tctgatggtg tggtaggcgt agccg 35
<210> 22
<211> 35
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
gcgggtctca agataccaga aggagatcct gcgcg 35
<210> 23
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
gcgggtctca atctcttgaa cctgtctgtg gctctc 36
<210> 24
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
gcgggtctca agaccccagt acaccagcca gagatg 36
<210> 25
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
gcgggtctca gtctgatctt gatcactttg atgccgg 37
<210> 26
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
aggaaagaag gatggagaaa 20
<210> 27
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
cctggacacc ccgttctcct 20
<210> 28
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
cttacgatgg agccagagag 20
<210> 29
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
cctgtgagat aaggccagta 20
<210> 30
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
ctgcctccag ggatcctgtg 20
<210> 31
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
gccacctctc catcctcttg 20
<210> 32
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
tctgtcccct ccaccccaca 20
<210> 33
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
ggcagctccc ctacccccct 20
<210> 34
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
tgtggccaca aggctcagtt 20
<210> 35
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
ccttgtcaag gctattggtc 20
<210> 36
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
ccttgttccg attcagtcat 20
<210> 37
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
acgatgagac agacccatta 20
<210> 38
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
cccagagcat cccgtggaac 20
<210> 39
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
tggccacatg gagtgacctg 20
<210> 40
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
ataagaggtc ccaagactta 20
<210> 41
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
tcctgcttgc ttacctcgct 20
<210> 42
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
cctctttcct agcactgccc 20
<210> 43
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
gctggggaga ggagctggtg 20
<210> 44
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
cttacctcgc ttagtgctcc 20
<210> 45
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
ctgtgatttc cccacaaaag 20
<210> 46
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
cctcttccgg cctggattgt 20
<210> 47
<211> 138
<212> RNA
<213> 人工序列(Artificial Sequence)
<400> 47
auucgucggu ucagcgacga uaagccgaga agugccaaua aaacuguuaa gugguuuggu 60
aacgcucggu aagguagcca aaaggcugaa acuccgugca caaagaccgc acggacgcuu 120
cacauauagc ucauaaac 138
<210> 48
<211> 29
<212> RNA
<213> 人工序列(Artificial Sequence)
<400> 48
guuugcgagc uagcuugugg agugugaac 29
<210> 49
<211> 171
<212> RNA
<213> 人工序列(Artificial Sequence)
<400> 49
auucgucggu ucagcgacga uaagccgaga agugccaaua aaacuguuaa gugguuuggu 60
aacgcucggu aagguagcca aaaggcugaa acuccgugca caaagaccgc acggacgcuu 120
cacauauagc ucauaaacaa ggguuugcga gcuagcuugu ggagugugaa c 171
<210> 50
<211> 124
<212> RNA
<213> 人工序列(Artificial Sequence)
<400> 50
auucgucggu ucagcgacga uaagccgaga agugccaaua aaacuguuaa gugguuuggu 60
aacgcucggu aagguagcca aaaggcugaa acuccgugca caaagaccgc acggacgcuu 120
caca 124
<210> 51
<211> 14
<212> RNA
<213> 人工序列(Artificial Sequence)
<400> 51
uguggagugu gaac 14
<210> 52
<211> 142
<212> RNA
<213> 人工序列(Artificial Sequence)
<400> 52
auucgucggu ucagcgacga uaagccgaga agugccaaua aaacuguuaa gugguuuggu 60
aacgcucggu aagguagcca aaaggcugaa acuccgugca caaagaccgc acggacgcuu 120
cacauacuug uggaguguga ac 142

Claims (25)

1.一种突变型AsCas12f1核酸酶,其特征在于,所述突变型AsCas12f1核酸酶与野生型AsCas12f1核酸酶具有至少50%以上同一性,且相对于野生型AsCas12f1核酸酶包含第80位、第104位、第364位氨基酸中的一个或几个位点突变。
2.如权利要求1所述的AsCas12f1核酸酶变体,其特征在于,当所述突变型AsCas12f1核酸酶包含两个或三个位点突变时,所述突变是指突变为相同或不同的氨基酸;优选地,突变为相同的氨基酸。
3.如权利要求1所述的AsCas12f1核酸酶变体,其特征在于,所述突变型AsCas12f1核酸酶的氨基酸序列如SEQ ID NO.1~6所示。
4.一种突变型向导RNA,其特征在于,其包含tracrRNA序列和crRNA序列;所述crRNA序列包含能够与靶序列杂交的基因靶向区段和tracr配对物序列;所述tracr RNA序列和tracr配对物序列和连接链序列构成向导RNA的骨架序列;其中,所述tracrRNA包含如SEQID NO.47所示的核苷酸序列或其变体序列;所述tracr配对物序列包含如SEQ ID NO.48所示的核苷酸序列或其变体序列。
5.如权利要求4所述的向导RNA,其特征在于,包含以下至少任一项:
1)所述tracr RNA序列和tracr配对物序列之间还包括连接链序列;优选地,所述连接链序列包含5’-AAGG、5’-UACU或其变体序列;
2)所述基因靶向区段位于所述crRNA序列的3’端;
3)所述向导RNA包含在所述tracrRNA中互补配对的碱基对的一个或多个互换位置后获得的tracrRNA;
4)所述向导RNA包含在tracrRNA与tracr配对物序列互补配对的碱基对的一个或多个互换位置后获得的tracrRNA和tracr配对物序列;
5)所述基因靶向区段识别靶向序列上的PAM序列;优选地PAM序列为5’-TTR,其中R代表A或G;
6)所述基因靶向区段靶向PAM序列之后长度为12~40bp的核酸片段;优选的长度为20bp;
7)所述基因靶向区段靶向细胞基因组中的至少一个靶序列;
8)所述基因靶向区段靶向的靶序列DNA和/或RNA;
9)所述向导RNA为两条链,一条链包含所述tracrRNA序列,另一条链包含所述crRNA序列;
10)所述向导RNA为一条链,从5’端至3’端依次包含所述tracrRNA序列、连接链序列和crRNA序列。
6.如权利要求4或5所述的向导RNA,其特征在于,包括以下至少任一项:
1)所述tracrRNA的变体序列是指在所述SEQ ID NO.47所示的核苷酸序列的5’端和/或3’端增加、减少或替换部分核苷酸后获得的序列;优选地,所述tracrRNA的变体序列是指在所述SEQ ID NO.47所示的核苷酸序列的5’端和/或3’端减少核苷酸后获得的序列;
2)所述tracr配对物序列的变体序列是指在所述SEQ ID NO.48所示的核苷酸序列的5’端和/或3’端增加、减少或替换部分核苷酸后获得的序列;优选地,所述tracr配对物序列的变体序列是指在所述SEQ ID NO.48所示的核苷酸序列的5’端和/或3’端减少核苷酸后获得的序列;
3)所述连接链序列的变体序列是指在5’-AAGG、5’-UACU的5’端和/或3’端增加、减少或替换部分核苷酸后获得的序列;
4)所述tracrRNA与tracr配对物序列之间的连接链序列为5’-AAGG或5’-UACU;优选地,为5’-UACU。
7.如权利要求6所述的向导RNA,其特征在于,包括以下至少任一项:
1)所述tracrRNA的变体序列是指在所述SEQ ID NO.47所示的核苷酸序列的5’端和/或3’端减少1~50nt核苷酸后获得的序列;优选地,在3’端减少14nt核苷酸;优选地,所述tracrRNA的变体序列如SEQ ID NO.50所示;
2)所述tracr配对物序列的变体序列是指在所述SEQ ID NO.48所示的核苷酸序列的5’端减少1~29nt核苷酸后获得的序列;优选地,减少15nt核苷酸;优选地,所述tracrRNA配对物序列如SEQ ID NO.51所示。
8.如权利要求7所述的向导RNA,其特征在于,所述向导RNA的骨架序列的核苷酸序列如SEQ ID NO.52所示。
9.一种分离的多核苷酸,其特征在于,其编码如权利要求1~3任一项所述的突变型AsCas12f1核酸酶。
10.一种分离的多核苷酸,其特征在于,其编码如权利要求4~8任一项所述的向导RNA。
11.一种构建体,其特征在于,所述构建体单独或同时含有如权利要求9所述的分离的多核苷酸、如权利要求10所述的分离的多核苷酸。
12.一种表达系统,其特征在于,所述表达系统含有如权利要求11所述的构建体,或基因组中整合有外源的如权利要求11所述的构建体。
13.如权利要求12所述的表达系统,其特征在于,所述表达系统的宿主细胞选自真核细胞或原核细胞;优选地,所述宿主细胞选自小鼠细胞、人细胞。
14.一种基因编辑系统,其特征在于,选自以下至少任一项:
1)所述基因编辑系统包含如权利要求1~3任一项所述的突变型AsCas12f1核酸酶或其编码多核苷酸以及向导RNA或其编码多核苷酸;
2)所述基因编辑系统包含核酸酶或其编码多核苷酸如权利要求4~8任一项所述的突变型向导RNA或其编码多核苷酸。
15.如权利要求14所述的基因编辑系统,其特征在于,
1)中,所述向导RNA为野生型向导RNA或其变体;优选地,所述野生型向导RNA为sgRNA_V1,所述野生型向导RNA的变体为sgRNA_T1;和/或,
2)中,所述核酸酶为Cas蛋白及其突变体;优选地,选自Cas9、Cas12、Cas13蛋白家族及其突变体;进一步优选地,选自Cas12f及其突变体。
16.如权利要求15所述的基因编辑系统,其特征在于,所述Cas蛋白及其突变体选自:
(I)野生型Cas蛋白或其片段,具有受RNA引导的核酸结合活性;
(II)与(I)的氨基酸序列具有至少50%序列同源性的变体,且具有受RNA引导的核酸结合活性;
(III)根据(I)或(II),其进一步包括核定位信号片段;
(IV)根据(I)或(II)或(III),其进一步包含:
(a)一种或多种修饰或突变,其产生具有相比修饰或突变前显著减小的核酸内切酶活性,或使核酸内切酶活性丧失;和/或
(b)具有其他功能活性的多肽或结构域;
(V)根据(I)或(II)或(III),所述Cas蛋白具有核酸内切酶活性。
17.如权利要求14所述的基因编辑系统,其特征在于,包括以下至少任一项:
1)所述基因编辑系统包含一个或多个载体;所述一个或多个载体包含(i)第一调控元件,所述第一调控元件可操作地连接至所述核酸酶的编码多核苷酸;以及(ii)第二调控元件,所述第二调控元件可操作地连接至所述向导RNA核苷酸序列的编码多核苷酸;
所述(i)和(ii)位于相同或不同载体上;
2)所述基因编辑系统包含(i)核酸酶,以及(ii)所述向导RNA的编码多核苷酸的载体;
3)所述基因编辑系统包含(i)核酸酶的编码多核苷酸的载体,以及(ii)所述向导RNA;
4)所述基因编辑系统包含(i)核酸酶,以及(ii)向导RNA。
18.如权利要求14-17任一项所述的基因编辑系统,其特征在于,包括以下至少任一项:
1)所述基因编辑系统识别靶向序列上的PAM序列;优选地PAM序列为5’-TTR,其中R代表A或G;
2)所述基因编辑系统靶向PAM序列之后长度为12~40bp的核酸片段,优选的长度为20bp;
3)所述基因编辑系统靶向细胞基因组中的至少一个靶序列;
4)所述基因编辑系统靶向的靶序列DNA和/或RNA。
19.一种药物组合物,其特征在于,其包含如权利要求14-18任一所述的基因编辑系统,以及药学上可接受的载体。
20.一种基因编辑方法,其特征在于,将靶基因与如权利要求14-18任一项所述的基因编辑系统接触,以实现靶基因的编辑。
21.如权利要求20所述的基因编辑方法,其特征在于,包括下列步骤:
i)将所述核酸酶或其编码多核苷酸、以及所述向导RNA或其编码多核苷酸引入细胞中;
ii)由所述核酸酶介导,在靶基因中产生一种或多种切口,或靶向、编辑、修饰或操纵所述靶基因。
22.如权利要求20或21所述的基因编辑方法,其特征在于,包括以下至少任一项:
1)所述靶基因为体内基因组上的靶基因、或离体细胞中的靶基因、或在体外无细胞环境中的靶基因;
2)所述核酸酶通过加工或未加工形式的向导RNA引导至靶基因;
3)所述核酸酶和向导RNA形成复合物,识别所述靶基因上的PAM序列;
4)所述基因编辑系统的靶向序列为PAM序列之后长度为12~40bp的核酸片段,优选PAM序列之后长度为20bp的核酸片段;
5)所述方法进一步包括将包含异源多核苷酸序列的供体模板引入细胞中的步骤。
23.如权利要求1~3任一项所述的突变型AsCas12f1核酸酶或如权利要求4~8任一项所述的突变型向导RNA或如权利要求9或10所述的分离的多核苷酸或如权利要求11所述的构建体或如权利要求12或13所述的表达系统或如权利要求14~18任一项所述的基因编辑系统或如权利要求19所述的药物组合物或如权利要求20-22任一所述的方法在体内、离体细胞或无细胞环境中对靶基因和/或其相关多肽进行基因编辑中的应用。
24.如权利要求23所述的应用,其特征在于,包括以下至少任一项:
1)所述基因编辑选自由:基因切割、基因删除、基因插入、点突变、转录抑制、转录激活、先导编辑、碱基编辑和引导编辑构成的群组;优选地,所述基因编辑为基因删除和/或基因切割;
2)所述离体细胞选自细菌细胞、古细菌细胞、真菌细胞、原生生物细胞、病毒细胞、植物细胞和动物细胞中的至少一种;
3)所述基因编辑用于实现致病位点的修正、基因功能研究、增强细胞功能、细胞治疗至少任一。
25.一种遗传修饰的细胞,其通过如权利要求14~18任一项所述的基因编辑系统或如权利要求19所述的药物组合物或如权利要求20~22任一项所述的方法进行基因编辑获得。
CN202210442471.2A 2022-04-25 2022-04-25 一种工程优化的核酸酶、向导rna、编辑系统和应用 Pending CN116987686A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210442471.2A CN116987686A (zh) 2022-04-25 2022-04-25 一种工程优化的核酸酶、向导rna、编辑系统和应用
PCT/CN2022/113357 WO2023206872A1 (zh) 2022-04-25 2022-08-18 一种工程优化的核酸酶、向导rna、编辑系统和应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210442471.2A CN116987686A (zh) 2022-04-25 2022-04-25 一种工程优化的核酸酶、向导rna、编辑系统和应用

Publications (1)

Publication Number Publication Date
CN116987686A true CN116987686A (zh) 2023-11-03

Family

ID=88517102

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210442471.2A Pending CN116987686A (zh) 2022-04-25 2022-04-25 一种工程优化的核酸酶、向导rna、编辑系统和应用

Country Status (2)

Country Link
CN (1) CN116987686A (zh)
WO (1) WO2023206872A1 (zh)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020123887A2 (en) * 2018-12-14 2020-06-18 Pioneer Hi-Bred International, Inc. Novel crispr-cas systems for genome editing
US20230212612A1 (en) * 2020-05-28 2023-07-06 Shanghaitech University Genome editing system and method

Also Published As

Publication number Publication date
WO2023206872A1 (zh) 2023-11-02

Similar Documents

Publication Publication Date Title
US20040043468A1 (en) Synthetic internal ribosome entry sites and methods of identifying same
KR20160128306A (ko) 돌연변이유발 방법
CN104342406B (zh) 热稳定性增强的甲酸脱氢酶突变体及其制备方法
CN104342410B (zh) 一种酮还原酶突变体及其制备方法
CN104342411B (zh) 活性增强的酮还原酶突变体、编码序列及其制备方法
CN104342412B (zh) 用于生产(s)-4-氯-3-羟基丁酸乙酯的酮还原酶突变体
CN113584134B (zh) 一种基于CRISPR-Cas9的等温核酸检测系统及其方法和应用
CN104694452B (zh) 一种高产普鲁兰酶的重组枯草芽孢杆菌及其构建方法
CN1995384A (zh) 一种快速方便转基因插入位点鉴定技术
CN112522205B (zh) 一种过表达血管紧张素转换酶2的细胞系及其制备方法与应用
CN113122513B (zh) 一种丹参p450突变体及其应用
KR102280546B1 (ko) 세포 내재성 dna 변형 효소를 사용하여 표적화된 dna의 핵산 염기를 특이적으로 변환시키는, 세포의 핵산 서열의 변환 방법 및 이에 사용하는 분자 복합체
US20040101520A1 (en) Recombination method
CN111214496A (zh) 一种重组溶瘤病毒在制备治疗淋巴瘤药物组合物中的用途
CN113755518B (zh) 一种构建重组解脂耶氏酵母的方法与应用
CN113846019B (zh) 一种海洋微拟球藻靶向表观基因组遗传调控方法
CN101492685A (zh) 一种重组表达载体的基因序列及其构建方法
CN116987686A (zh) 一种工程优化的核酸酶、向导rna、编辑系统和应用
CN109337851B (zh) 一种在枯草芽孢杆菌的芽孢表面高效展示海藻糖合酶的方法
KR20130078265A (ko) 감염력이 있는 구제역바이러스 O형 cDNA 클론 및 클론의 전체염기서열
CN109957551B (zh) 表达人β-防御素2的重组痘苗病毒及其应用
KR102422842B1 (ko) 크리스퍼 간섭을 이용한 rna 번역 조절용 조성물
AT509050B1 (de) Hydrolase-aktivator aus trichoderma reesei
CN113528450B (zh) 一种水稻原生质体高效生物素标记体系的建立及应用
CN113122512B (zh) 一种用于制备丹参酮类化合物的丹参p450突变体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination