CN114269930A - 用于增强基因组编辑的crispr/cas和核酸外切酶的卷曲螺旋介导的栓系 - Google Patents

用于增强基因组编辑的crispr/cas和核酸外切酶的卷曲螺旋介导的栓系 Download PDF

Info

Publication number
CN114269930A
CN114269930A CN202080058818.2A CN202080058818A CN114269930A CN 114269930 A CN114269930 A CN 114269930A CN 202080058818 A CN202080058818 A CN 202080058818A CN 114269930 A CN114269930 A CN 114269930A
Authority
CN
China
Prior art keywords
protein
cell
heterodimerization
cas9
crispr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080058818.2A
Other languages
English (en)
Inventor
R·杰拉拉
D·莱恩什切克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kemisky Society
Original Assignee
Kemisky Society
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kemisky Society filed Critical Kemisky Society
Publication of CN114269930A publication Critical patent/CN114269930A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1055Protein x Protein interaction, e.g. two hybrid selection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04005Cytidine deaminase (3.5.4.5)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明提供一种使用通过不同系统栓系至核酸外切酶的CRISPR/Cas系统用于增强基因组工程化的方法。通过经由形成卷曲螺旋的异二聚化肽或经由异二聚化系统连接Cas9和核酸外切酶,在期望的基因组区域发生较大的插入缺失突变,导致较高的基因组编辑率。这种新的改进的CRISPR/Cas系统可用于需要和期望基因组工程化的各个领域中的不同细胞来源和生物体。

Description

用于增强基因组编辑的CRISPR/CAS和核酸外切酶的卷曲螺旋 介导的栓系
技术领域
作为CRISPR/Cas系统的一部分的Cas9蛋白与核酸外切酶通过形成卷曲螺旋(coiled-coil)的肽进行的异二聚化增加了细胞中感兴趣基因组区域中的插入缺失突变的发生率,导致较高程度的基因组工程化,这被利用于需要基因组编辑的所有领域中。
背景技术
CRISPR(成簇的规律间隔的短回文重复序列)/Cas(CRISPR相关)系统,用作基因组编辑的工具,并且源自细菌和古菌,作为它们适应性免疫系统的一部分来对抗传染性病毒。当病毒入侵原核生物时,短病毒DNA片段整合至CRISPR基因座中,这是CRISPR免疫的关键。在第二次遭遇病毒时,转录来自CRISPR基因座的包含病毒序列的RNA。该RNA与病毒DNA互补,并介导Cas9蛋白靶向基因组中的序列。这种特异性靶向导致DNA切割,从而使病毒标靶沉默。
这种在期望的基因组区域处的特异性靶向和DNA切割使CRISPR/Cas系统成为基因组编辑的有力的新工具。Cas9蛋白或其变体由gRNA(指导RNA)指导至基因组内其互补的特异性位点或感兴趣区域(ROI)。Cas9识别的唯一需要是基因组中存在短PAM(前间隔序列邻近基序)序列。取决于Cas9来源,识别不同的PAM序列。在特定Cas9靶向ROI后,发生位点特异性双链断裂(DSB),其长度和频率各不相同。DSB的修复和它们的操作导致感兴趣基因(GOI)的敲除或敲入。
然后用细胞修复机制修复DSB,主要是使用易错经典非同源末端连接(c-NHEJ),它是DNA切割非依赖性的。其它修复机制,如alt-EJ(替代末端连接)、HR(同源重组)、SSA(单链退火)以DNA切割依赖性方式起作用。C-NHEJ主要引入几个核苷酸长的插入缺失(indel)突变,所述突变可通过移码或缺失导致功能基因失活,从而导致一定百分比或程度的GOI的敲除。C-NHEJ通过简单的平末端序列同源非依赖性连接过程修复Cas9介导的平末端DSB。可选地,可以切割DSB,留下3'或5'单链DNA(ssDNA)突出端。当通过HR修复DSB时,需要特定DNA模板作为用于修复的来源。通常姐妹染色单体在典型无错误过程中被链侵入,导致位点特异性整合。这通常用于敲入产生,其中包含的外源DNA作为模板反应。ssDNA突出端也可以通过诱变修复机制修复,即SSA,其中发生大同源性下的退火,导致较大的缺失而无插入。Alt-EJ使用微同源性下的退火,导致诱变的插入缺失突变。
取决于插入缺失突变的大小和频率,可以实现较高的敲除率。当在DSB后进行额外的DNA切割时,发生较大的基因组重排。DNA切割和随后的DNA修复用于提高使用CRISPR/Cas的基因组编辑的效率。特定核酸外切酶(例如人EXO1、TREX2)与CRISPR/Cas系统的共表达可以增加突变的大小,导致较高频率的GOI的敲入或敲除。
发明内容
本发明提供了一种用于CRISPR/Cas系统的实施方案,用于基于通过不同的异二聚化系统的Cas9蛋白与核酸外切酶的栓系(tethering),在基因组修饰和编辑方面实现较高的效率。CRISPR/Cas系统和核酸外切酶的栓系导致对GOI的较高百分比或程度的基因组修饰或切割DNA以允许较高同源性用于较大百分比的敲入。
本公开提供通过使用CRISPR/Cas系统改进的基因组编辑的新系统。本文的基因组编辑包括DNA切割和序列修复。DSB由通过一种或两种gRNA指导至特定基因组位点的蛋白Cas9或其变体或Cas9切口酶(HNH-突变切口酶或RuvC-突变切口酶)形成。用于增强基因组编辑的该系统可用于活的哺乳动物和非哺乳动物(例如植物)细胞。
CRISPR/Cas系统和特定核酸外切酶的异二聚化是通过使用形成卷曲螺旋(CC)的异二聚化肽来实现的,所述异二聚化肽在其C-或N-末端与Cas9蛋白表达,并且在其C-或N-末端与特定核酸外切酶表达,因此,Cas9与特定核酸外切酶栓系(tethered)。Cas9与特定核酸外切酶的栓系使核酸外切酶靠近DSB以影响DNA切割。在DSB处配置特定核酸外切酶改善了DNA切割,从而使3'和/或5'DNA突出端更长。较长的DNA突出端在DNA上链和下链之间产生较大的非同源性,从而在较高程度的DSB修复后产生较大的插入缺失突变。由于二聚体形成肽,实现了Cas9蛋白或其变体或Cas9切口酶和特定核酸外切酶的异二聚化。异二聚化肽表达卷曲螺旋结构基序,即α-螺旋的七联体(heptads of alpha-helices)中的氨基酸残基之间的疏水和静电相互作用的组合。
本公开提出了通过额外的异二聚化系统的CRISPR/Cas系统和特定核酸外切酶的栓系。所述系统是基于异二聚化(HD)结构域(不同的蛋白-蛋白伴侣;HD系统)的选择,当存在一种以上的可提供外部调节信号的诱导剂(inductor)时,其允许在细胞中调节表达。取决于蛋白-蛋白伴侣对的使用,用于异二聚化的诱导剂可以是光(例如蓝光、红光等)或化学性质。这样的化学诱导剂可以是小分子,例如雷帕霉素类似物(rapalog)、赤霉素和/或脱落酸。
当存在适当的异二聚化信号时,HD系统的蛋白伴侣会二聚化成功能形式。HD系统的一个伴侣与Cas9蛋白或其变体或Cas9切口酶连接。所选异二聚化系统的另一伴侣与特定核酸外切酶偶联。通过分别地添加起到促进异二聚化的作用的适当波长下的外部光或小的化学诱导剂或调节剂(例如雷帕霉素类似物、赤霉素或脱落酸),HD系统的两个伴侣二聚化为异二聚体。HD系统的两个蛋白伴侣的异二聚化允许特定核酸外切酶靠近CRISPR/Cas系统介导的DSB的点。在DSB处并置(Juxtaposition)特定核酸外切酶增强了DNA切割,从而使3'和/或5'DNA突出端更长。较长的DNA突出端在DNA上链和下链之间产生较大的非同源性,从而在较高程度的DSB修复后产生较大的插入缺失突变。
本发明基于使用具有特定核酸外切酶的HD来提供修饰的CRSIPR/Cas系统。增强的基因组编辑包括在哺乳动物和非哺乳动物细胞中、在确定的基因座处敲除和敲入期望的GOI。
附图说明
图1:用于增强基因组工程化的方法的作用的示意图,所述方法使用通过形成卷曲螺旋的异二聚化肽栓系至核酸外切酶的根据本发明所述的CRISPR/Cas系统。A)通过使用由Cas9蛋白和gRNA组成的简单CRISPR/Cas系统,形成DSB,然后通过细胞修复机制进行修复,导致一定程度或百分比的基因组编辑。B)通过使用简单CRISPR/Cas系统和特定核酸外切酶(例如EXOIII)的共表达,形成DSB。然后通过特定核酸外切酶额外地切割暴露的DNA链,以5'或3'方式产生DNA突出端。再次,通过细胞修复机制修复具有产生的DNA突出端的DSB,导致与简单CRISPR/Cas系统相比为较高程度或百分比的基因组编辑。C)通过使用经由形成卷曲螺旋的异二聚化肽栓系至特定核酸外切酶(例如EXOIII)的CRISPR/Cas系统,形成DSB。然后通过特定核酸外切酶额外地切割暴露的DNA链,产生与在其中共表达CRISPR/Cas和核酸外切酶的系统中产生的突出端相比为甚至更大的DNA突出端。再次,通过细胞修复机制修复具有产生的DNA突出端的DSB,导致与简单CRISPR/Cas系统或其中共表达CRISPR/Cas和核酸外切酶的系统相比为甚至更高的程度和百分比的基因组编辑。
图2:eGFP基因组区域中的基因组编辑。通过Cas9和gRNA的共表达,指导向eGFP基因组区域,对eGFP基因组区域进行修饰。当Cas9、gRNA与核酸外切酶共表达时,发生较大的基因组编辑,其中EXO1、EXOIII、FEN1、WRN或mTREX2是所使用的核酸外切酶中的至少一种。eGFP基因组编辑导致eGFP荧光降低。
图3:人MYD88基因组区域中的基因组编辑。通过Cas9和gRNA的共表达,指导向人MYD88基因组区域,对人MYD88基因组区域进行修饰。当Cas9、gRNA与核酸外切酶共表达时,发生较大的基因组编辑,其中EXO1、EXOIII或mTREX2是所使用的核酸外切酶中的至少一种。当使用通过异二聚体卷曲螺旋形成肽栓系至特定核酸外切酶的CRISPR/Cas系统时,发生更大的基因组编辑,其中Cas9-P3或Cas9-P4是Cas9变体之一,P3-EXO1、P4-EXO1、P3-EXOIII、P4-EXOIII、P3-mTREX2或P4-mTREX2是表达的核酸外切酶的变体之一。A)人MYD88基因组编辑导致插入缺失突变,通过T7E1检验检测。B)MYD88基因组区域工程化的插入缺失检测(%)。
图4:人VEGF基因组区域中的基因组编辑。通过Cas9和gRNA的共表达,指导向人VEGF基因组区域,对人VEGF基因组区域进行修饰。当Cas9、gRNA与核酸外切酶共表达时,发生较大的基因组编辑,其中EXO1、EXOIII或mTREX2是所使用的核酸外切酶中的至少一种。当使用通过异二聚体卷曲螺旋形成肽栓系至特定核酸外切酶的CRISPR/Cas系统时,发生更大的基因组编辑,其中Cas9-P3或Cas9-P4是Cas9变体之一,P3-EXO1、P4-EXO1、P3-EXOIII、P4-EXOIII、P3-mTREX2或P4-mTREX2是表达的核酸外切酶的变体之一。A)人VEGF基因组编辑导致插入缺失突变,通过T7E1检验检测。B)VEGF基因组区域工程化的插入缺失检测(%)。
图5:人EMX1基因组区域中的基因组编辑。通过Cas9和gRNA的共表达,指导向人EMX1基因组区域,对人EMX1基因组区域进行修饰。当Cas9、gRNA与核酸外切酶共表达时,发生较大的基因组编辑,其中EXO1、EXOIII或mTREX2是所使用的核酸外切酶中的至少一种。当使用通过异二聚体卷曲螺旋形成肽栓系至特定核酸外切酶的CRISPR/Cas系统时,发生更大的基因组编辑,其中Cas9-P3或Cas9-P4是Cas9变体之一,P3-EXO1、P4-EXO1、P3-EXOIII、P4-EXOIII、P3-mTREX2或P4-mTREX2是表达的核酸外切酶的变体之一。A)人EMX1基因组编辑导致插入缺失突变,通过T7E1检验检测。B)EMX1基因组区域工程化的插入缺失检测(%)。
图6:等效Cas9蛋白表达。以与在仅表达Cas9或Cas9与核酸外切酶共表达时相同的方式表达Cas9蛋白,其中EXO1、EXOIII或mTREX2是所使用的核酸外切酶中的至少一种。当使用通过异二聚体卷曲螺旋形成肽栓系至特定核酸外切酶的CRISPR/Cas系统时,观察到相同的Cas9表达,其中Cas9-P3或Cas9-P4是Cas9变体之一,P3-EXO1、P4-EXO1、P3-EXOIII、P4-EXOIII、P3-mTREX2、或P4-mTREX2是表达的核酸外切酶的变体之一。通过免疫印迹和免疫检测来检测Cas9的表达。
图7:人MYD88基因组区域中的基因组编辑。通过Cas9和gRNA的共表达,指导向人MYD88基因组区域,对人MYD88基因组区域进行修饰。当Cas9、gRNA与核酸外切酶共表达时,发生较大的基因组编辑,其中EXO1、EXOIII或mTREX2是所使用的核酸外切酶中的至少一种。当使用通过异二聚体卷曲螺旋形成肽栓系至特定核酸外切酶的CRISPR/Cas系统时,发生更大的基因组编辑,其中Cas9-P3或Cas9-P4是Cas9变体之一,P3-EXO1、P4-EXO1、P3-EXOIII、P4-EXOIII、P3-mTREX2或P4-mTREX2是表达的核酸外切酶的变体之一。进行下一代测序以检测编辑的基因组区域的大小。
图8:由于CRISPR/Cas作用增加,不存在人MYD88“脱靶”基因组编辑。通过Cas9和gRNA的共表达,指导向人MYD88基因组区域,对人MYD88基因组区域进行修饰。当Cas9、gRNA与核酸外切酶共表达时,发生较大的基因组编辑,其中EXO1、EXOIII或mTREX2是所使用的核酸外切酶中的至少一种。当使用通过异二聚体卷曲螺旋形成肽栓系至特定核酸外切酶的CRISPR/Cas系统时,发生更大的基因组编辑,其中Cas9-P3或Cas9-P4是Cas9变体之一,P3-EXO1、P4-EXO1、P3-EXOIII、P4-EXOIII、P3-mTREX2或P4-mTREX2是表达的核酸外切酶的变体之一。通过T7E1检验筛选了人MYD88基因靶向gRNA“脱靶”位点的三个预测的编码区。A)预测的“脱靶”位点1(人ANKRD52基因)基因组编辑不导致插入缺失突变,通过T7E1检验检测。B)预测的“脱靶”位点2(人FUT9基因)基因组编辑不导致插入缺失突变,通过T7E1检验检测。C)预测的“脱靶”位点3(人PSKH2基因)基因组编辑不导致插入缺失突变,通过T7E1检验检测。
图9:K562-fLUC细胞的生物发光信号(光子/秒)的减少。设计了靶向BCR-ABL染色体易位的gRNA。通过生物发光信号的下降检测到BCR-ABL染色体易位处的CRISPR/Cas基因组编辑导致细胞死亡。通过Cas9和gRNA的共表达,指导向人BCR-ABL染色体易位基因组区域,对人BCR-ABL基因组区域进行修饰。当Cas9、gRNA与核酸外切酶共表达时,发生较大的基因组编辑,其中EXO1、EXOIII或mTREX2是所使用的核酸外切酶中的至少一种。当使用通过异二聚体卷曲螺旋形成肽栓系至特定核酸外切酶的CRISPR/Cas系统时,发生更大的基因组编辑,其中Cas9-P3或Cas9-P4是Cas9变体之一,P3-EXO1、P4-EXO1、P3-EXOIII、P4-EXOIII、P3-mTREX2或P4-mTREX2是表达的核酸外切酶的变体之一。
图10:人BCR-ABL基因组区域中的基因组编辑。通过Cas9和gRNA的共表达,指导向人BCR-ABL基因组区域,对人BCR-ABL8基因组区域进行修饰。当Cas9、gRNA与核酸外切酶共表达时,发生较大的基因组编辑,其中EXOIII是所使用的核酸外切酶中的至少一种。当使用通过异二聚体卷曲螺旋形成肽栓系至特定核酸外切酶的CRISPR/Cas系统时,发生更大的基因组编辑,其中Cas9-P3是Cas9变体之一,P4-EXOIII是表达的核酸外切酶的变体之一。当使用Cas9-N5和N6-EXOIII变体时,发生甚至更大的基因组编辑,显示形成卷曲螺旋的肽的较强的异二聚化亲和力。
具体实施方式
定义
如本文所用,术语CRISPR/Cas系统涉及一种以上的gRNA,其将催化活性Cas9或其变体或失活切口酶Cas9或其变体蛋白指导至期望的基因组位点,在该位点处、在适当的PAM识别后通过特定Cas9作用形成DSB形式。本发明中的Cas9蛋白在N-或C-末端处与异二聚化系统融合,允许与特定核酸外切酶栓系。
如本文所用,Cas蛋白涉及识别NGG或NAG PAM的Cas9及其变体和源自化脓性链球菌(Streptococcus pyogenes)的同源物。本发明还依赖于源自所有类型的CRISPR系统的所有其它DNA催化活性或失活核酸内切酶(dCas9)或切口酶。
如本文所用,APOBEC多肽涉及具有脱氨酶活性并与Cas9及其变体连接并导致单碱基编辑的蛋白。
如本文所用,基因组编辑涉及由于CRISPR/Cas系统及其导致DSB的能力而对基因组和/或非基因组DNA的任何修饰。从而进行单碱基编辑、敲入或敲除细胞和/或生物体。
如本文所用,生物体涉及任何活的生物体。
如本文所用,术语核酸外切酶涉及能够在3'和/或5'方向从多核苷酸链切割核苷酸并且在N-或C-末端处连接至异二聚化系统的任何种类的酶。
如本文所用,术语“异二聚化系统”是指一对肽或肽结构域,它们形成卷曲螺旋或在存在用于二聚化的诱导剂或信号的情况下连接。如本文所用,术语“异二聚化”是指通过共价或非共价相互作用连接至不同类型的其它结构域的蛋白结构域或肽对。如本文所用,术语“组成型二聚化结构域”是指它们自己独立连接的二聚化结构域,诸如,例如卷曲螺旋。如本文所用,术语“诱导型异二聚化结构域”是指仅在存在异二聚化诱导剂的情况中合并的异二聚化结构域。
术语“异二聚化诱导剂”是指信号、化学或非化学配体,其引起彼此不具有内在亲和力并且在不存在异二聚化配体或信号时不可独立地连接的蛋白结构域的异二聚化。根据本发明所述的异二聚化诱导剂可以是小分子,例如雷帕霉素类似物、脱落酸或赤霉素。根据本发明,异二聚化诱导剂也可以是具有特定波长的光。
如本文所用,光诱导的异二聚化系统是指蛋白伴侣CIB1或其同源物和CRY2PHR,其源自拟南芥(Arabidopsis thaliana),或是在存在具有特定波长、约450nm的蓝光的情况下合成地产生并异二聚化。另一种蓝光诱导的异二聚化系统是LOVpep和ePDZB蛋白伴侣,其源自燕麦(Avena sativa)。本发明还涉及650nm波长红光诱导的异二聚化系统,其中使用蛋白伴侣PIF和PHYB或其合成同源物。本发明所依赖的另一种光诱导的异二聚化系统是来自巨叶属物种(Gigantea sp.)的FKF1和GI蛋白伴侣的异二聚化。
如本文所用,术语“化学配体”是指可以结合至蛋白、优选地结合至FKBP-FRB异二聚化结构域小分子,例如雷帕霉素及其雷帕霉素类似物;可以结合至蛋白、优选地结合至ABI-PYL1和GID-GAI1异二聚化结构域植物激素,例如脱落酸和赤霉素。
如本文所用,术语形成卷曲螺旋的肽对是指表达卷曲螺旋结构基序的任何肽对、异二聚化肽或同二聚化肽,所述卷曲螺旋结构基序是导致异二聚化或同二聚化的α-螺旋的七联体中的氨基酸残基之间的疏水和静电相互作用的组合。
如本文所用,术语“正交(orthogonal)”是指单独地发生工程化CRISPR/Cas系统的组分通过不同的异二聚化系统栓系至特定核酸外切酶的特征,即不同异二聚化系统的各部分不与内源或外源信号通路的其它异二聚化系统的部分相互作用。正交系统的主要特征是各系统的输入信号导致异二聚化,与其它系统或它们的输入和输出信号的存在与否无关。
如本文所用,术语“细胞”是指真核或原核细胞、细胞生物体或多细胞生物体(细胞系),其作为已用作核酸的受体(recipient)的单细胞实体培养,并包括已通过包含核酸来进行基因修饰的原始细胞的子细胞。该术语主要是指较高发育的真核生物体、优选脊椎动物、优选哺乳动物的细胞。本发明还依赖于非脊椎动物细胞,优选植物细胞。
术语“细胞”还指人细胞系和植物细胞。自然地,由于自然、随机或计划突变的结果,一个细胞的后代在形态形式及其DNA补体(complement)方面不一定与亲本完全相同。“基因修饰的宿主细胞”(也称为“重组宿主细胞”)是其中已引入核酸的宿主细胞。以将合适的核酸或重组核酸引入合适的真核宿主细胞中的方式形成真核基因修饰的宿主细胞。下文中的发明包括含有(瞬时或稳定)携带根据本发明所述的操纵子记录(operon record)的根据本发明所述的核酸的宿主细胞和生物体。合适的宿主细胞是本领域已知的并且包括真核细胞。已知蛋白可以在以下生物体的细胞中表达:人、啮齿动物、牛、猪(pork)、家禽、兔等。宿主细胞可以包括原代细胞系或永生化细胞系的培养细胞系。
如本文所用,术语“核酸”是指任何长度的核苷酸(核糖核苷酸或脱氧核糖核苷酸)的聚合形式,并且不限于单链、双链、或更高链的DNA或RNA、基因组DNA、cDNA、DNA-RNA杂交,或具有由嘌呤和嘧啶碱基或其它天然、化学或生化修饰的、合成的或衍生的核苷酸碱基制成的硫代磷酸酯聚合物骨架的聚合物。
如本文所用,术语“蛋白”是指任何长度的氨基酸的聚合形式,其表达任何功能,例如定位至特定位置、定位至特定DNA序列、促进和引发化学反应、转录调节。
如本文所用,术语“重组”是指作为产生具有不同于天然宿主系统中的内源性核酸的结构编码或非编码序列的构建体的克隆、限制和/或连接的各种组合的产物的特定核酸(DNA或RNA)。
通过科学领域已知的常规方法将载体插入至宿主细胞,这些方法涉及转化或转染并包括:化学诱导的插入、电穿孔、显微注射、DNA脂质体转染、细胞超声处理、基因轰击、病毒DNA输入以及其它方法。DNA的进入可为瞬时的或稳定的。瞬时是指用不将本发明所述的DNA混入细胞基因组的载体插入DNA。通过将本发明所述的DNA混入宿主基因组中来实现稳定插入。本发明所述的DNA的插入,特别是用于制备具有稳定混入的本发明所述的核酸如DNA的宿主生物体,可以通过标志物的存在来筛选。标志物的DNA序列是指对抗生素或化学品有耐性,并且可以包含在本发明所述的DNA载体上或单独的载体上。
将通过不同的异二聚化系统与特定核酸外切酶栓系的CRISPR/Cas的插入作为质粒DNA或作为mRNA或蛋白或作为RNA:蛋白复合物递送至细胞,其中通过不同的异二聚化系统有特定核酸外切酶栓系的CRISPR/Cas系统的不同部分可以作为DNA或RNA或蛋白。
本发明的详细描述
本发明涉及一种增强的CRISPR/Cas系统,该系统由与Cas蛋白和特定核酸外切酶连接的不同的异二聚化(HD)系统或卷曲螺旋形成肽对的两种正交蛋白伴侣的组合构成,所述系统在添加异二聚化的诱导剂的情况下或通过形成卷曲螺旋的肽对的内在亲和力而重构。在功能上,增强的CRISPR/Cas系统影响较高的基因组编辑率,这是基于在较高百分比的基因修饰的细胞或生物体中出现的较大插入和/或缺失突变。
对本发明的基因修饰的细胞或生物体的通过不同的异二聚化系统栓系至特定核酸外切酶的增强的CRISPR/Cas系统的激活的化学和非化学控制,在例如癌症治疗、新模型生物体生产、新药开发等不同的研究领域提供了一种新的基因编辑方式。
本发明提供包含第一组分(a)和第二组分(b)的组合,其中
a)第一组分包含与第一蛋白或蛋白结构域融合的能够诱导双链DNA断裂的核酸内切酶或能够诱导DNA切口的切口酶、优选地Cas蛋白或其突变体,和
b)第二组分包含融合至第二蛋白或蛋白结构域的核酸外切酶,
其中第一和第二组分能够通过第一蛋白或蛋白结构域和第二蛋白或蛋白结构域的相互作用而彼此异二聚化。
本发明的组合代表修饰的CRISPR/Cas系统。第一组分(a)的核酸内切酶可以特别是Cas蛋白、Cas切口酶或dCas9蛋白。第二组分(b)可以特别是核酸外切酶或胞苷脱氨酶,特别是APOBEC蛋白。
根据本发明的一个特定方面,第一蛋白或蛋白结构域和第二蛋白或结构域的异二聚化可通过化学或非化学信号诱导。第一组分的(至少一种)第一蛋白或蛋白结构域可以是选定的化学或非化学诱导型异二聚化系统的单个蛋白伴侣(例如ABI-PYL1、FKBP-FRB或DmrC-DmrA、GAI-GID1)或非化学诱导型异二聚化系统的单个蛋白伴侣(例如CIBN-CRY2PHR、LOvpep-ePDZb、PIF-PHYB、FKF1-GI),其与Cas蛋白或其变体基因融合;例如:CIBN或LOVpep或PIF或FKF1或ABI或FKBP或GAI可以连接至Cas蛋白或其变体(例如Cas9、Cas9切口酶、Cpf1)。
第二组分的第二蛋白或蛋白结构域可以是选定的异二聚化系统的第二蛋白伴侣(例如ABI-PYL1、FKBP-FRB或DmrC-DmrA、GAI-GID1、CIBN-CRY2PHR、LOvpep-ePDZb、PIF-PHYB、FKF1-GI),其与特定核酸外切酶(例如人EXO1、EXOIII大肠杆菌(E.coli)、TREX2等)基因融合。
异二聚化(HD)的化学诱导剂的添加可通过两种蛋白伴侣(即至少一种蛋白或蛋白结构域和第二蛋白或蛋白结构域)的异二聚化来引发第一组分和第二组分的异二聚化,从而产生栓系特定核酸外切酶的功能修饰的CRISPR/Cas系统,这可影响任何GOI的基因组修饰。
用于引发a)第一组分的至少一种第一蛋白或蛋白结构域和b)第二组分的第二蛋白或蛋白结构域的异二聚化的化学诱导剂可以是,例如,用于引发FKBP-FRB HD系统(至少一种第一蛋白结构域是FKBP,第二蛋白结构域是FRB)的异二聚化的雷帕霉素类似物(例如雷帕霉素),用于引发ABI-PYL1 HD系统(至少一种第一蛋白结构域是ABI,第二蛋白结构域是PYL1)的异二聚化的脱落酸,用于引发GID-GA1 HD系统(至少一种第一蛋白结构域是GID,第二蛋白结构域是GA1)的异二聚化的赤霉素,或任何其它相关的生理化学信号。
异二聚化(HD)的非化学诱导剂的添加可通过两种蛋白伴侣(即至少一种蛋白或蛋白结构域和第二蛋白或蛋白结构域)的异二聚化来引发第一组分和第二组分的异二聚化,从而产生与特定核酸外切酶栓系的功能修饰的CRISPR/Cas系统,这可影响任何GOI的基因组修饰。
用于引发a)第一组分的至少一种第一蛋白或蛋白结构域和b)第二组分的第二蛋白或蛋白结构域的异二聚化的非化学诱导剂可以是具有适当波长的光,例如用于引发CIBN-CRY2PHR HD系统(至少一种第一蛋白结构域是CIBN,第二蛋白结构域是CRY2PHR)或LOVpep-ePDZb HD系统(至少一种第一蛋白结构域是LOVpep,第二蛋白结构域是ePDZb)的异二聚化的蓝光(例如,450nm波长)。用于光诱导的异二聚化的其它诱导剂是用于引发PIF-PHYB HD系统(至少一种第一蛋白结构域是PIF,第二蛋白结构域是PHYB)的异二聚化、或用于引发FKF1-GI HD系统(至少一种第一蛋白结构域是FKF1,第二蛋白结构域是GI)的异二聚化的红光(例如650nm波长),或任何其它相关的生理非化学信号。
在本发明的另一个实施方案中,可以使用肽对来实现核酸内切酶或切口酶(例如,Cas蛋白或其变体或突变体)与特定核酸外切酶之间的异二聚化,所述肽对由于内在亲和力和静电相互作用而形成卷曲螺旋,从而使特定核酸外切酶靠近DSB,允许核酸外切酶以3'和/或5'方式额外地切割DNA。在该实施方案中,通过用特定核酸外切酶的额外地切割DNA来增强常规CRISPR/Cas系统的功能,可以导致与其中CRISPR/Cas和特定核酸外切酶在试验细胞或生物体中共表达的正常CRISPR/Cas系统相比为较大百分比的基因组修饰(参见,例如图1)。
肽对卷曲螺旋诱导的异二聚化系统的第一组分可以是来自形成选定肽对(例如P3-P4、N5-N6、P3S-P4S等)的卷曲螺旋的肽对的至少一种肽或肽结构域,其基因融合至Cas蛋白或其变体;例如:P3、N5或P3S可以连接至Cas9蛋白或其变体(例如Cas9、Cas9切口酶、Cpf1等)。
肽对卷曲螺旋诱导的异二聚化系统的第二组分可以是来自形成选定肽对(例如P3-P4、N5-N6、P3S-P4S等)的卷曲螺旋的肽对的至少一种肽或肽结构域,其基因融合至特定核酸外切酶(人EXO1、EXOIII大肠杆菌、TREX2等)。
在本发明的另一个实施方案中,形成卷曲螺旋的肽对的选定对是基于它们的物理特性(例如Kd值、它们的正交特性等)来选择的。形成卷曲螺旋的肽对可以具有强异二聚化特性:例如,肽对N5-N6表现出与肽对P3S-P4S相比为较强的异二聚化亲和力。由此得出,使用形成卷曲螺旋的N5-N6异二聚化肽用于与特定核酸外切酶栓系的增强的CRISPR/Cas系统的基因组编辑百分比与其中使用形成卷曲螺旋的P3S-P4S异二聚化肽对的实例相比为较大的,所述使用形成卷曲螺旋的P3S-P4S异二聚化肽对的实例表现不良异二聚化特性。
在另一个实施方案中,形成卷曲螺旋的肽对的异二聚化可以通过使用以平行(例如N5-N6、P3-P4等)或反平行(例如P3-AP4)方式异二聚化的肽对来获得。
在另一个实施方案中,使用异二聚化系统将CRISPR/Cas系统与特定核酸外切酶栓系、使用特定核酸外切酶进行额外的DNA切割和基因组编辑中的后续改进不增强CRISPR/Cas系统的可能的脱靶活性。
在另一个实施方案中,根据本发明所述的通过不同异二聚化系统栓系至特定核酸外切酶的修饰的CRISPR/Cas系统包含至少一种第一蛋白结构域和/或第二蛋白结构域的若干重复,例如,卷曲螺旋的10个重复。在该实施方案中,可以进一步增强基因组编辑。然后,至少一种第一蛋白结构域的若干重复(例如肽对的卷曲螺旋的10个重复)可以结合至第二蛋白结构域的若干重复(例如卷曲螺旋的10个重复),所述第二蛋白结构域融合至特定核酸外切酶。在添加适当的化学诱导剂之后,包含具有若干重复的至少一种第一蛋白结构域的第一组分与包含具有若干重复的第二蛋白结构域的第二组分异二聚化。在该实施方案中,重复可以起到组成型二聚化结构域的作用,其根据化学诱导剂的异二聚化信号组装成正交卷曲螺旋对。
在另一个实施方案中,第一组分的化学信号诱导型异二聚化蛋白复合物的至少一种第一蛋白结构域选自由以下对组成的组:
i)FKBP和FRB;
ii)FKBP和钙调神经磷酸酶催化亚基A(CnA);
iii)FKBP和亲环蛋白;
iv)旋转酶B(GyrB)和GyrB;
v)DmrA和DmrC;
vi)ABI和PYL1;和
vii)GAI和GID1,和
第二组分的第二蛋白结构域选自由以下对组成的组:
i)FKBP和FRB;
ii)FKBP和钙调神经磷酸酶催化亚基A(CnA);
iii)FKBP和亲环蛋白;
iv)旋转酶B(GyrB)和GyrB;
v)DmrA和DmrC;
vi)ABI和PYL1;和
vii)GAI和GID1。
在另一个实施方案中,第一组分的光信号诱导型异二聚化蛋白复合物的至少一种第一蛋白结构域选自由以下对组成的组:
i)CIB1和CRY2;
ii)LOV和PDZ;
iii)PIF和PHYB;
iv)FKF1-GI
v)UVR8-COP1,
第二组分的第二蛋白结构域选自由以下对组成的组:
i)CIB1和CRY2;
ii)LOV和PDZ;
iii)PIF和PHYB;
iv)FKF1-GI
v)UVR8-COP1。
在本发明的另一个实施方案中,至少一种第一蛋白结构域和第二蛋白结构域可以来自两种不同的蛋白并且可以具有直系同源特性。
本发明还提供分离的核酸分子或分离的核酸分子的组合,其包含编码如上所定义的根据本发明所述的组合的第一组分(a)的第一核酸序列和编码如上所定义的根据本发明所述的组合的第二组分(b)的第二核酸序列。本发明还提供了编码本发明核酸分子(一种以上)的载体,优选表达载体。
特别地,本发明提供包含序列的分离的核酸分子,所述序列包含依据所附序列表的SEQ ID NO:1-18或由其组成。本发明还提供包含核酸序列的载体,所述核酸序列包含依据所附序列表的SEQ ID NO:1-18或由其组成。
本发明还提供编码用于本发明的蛋白分离的分离的核酸的载体。
本发明还提供一种细胞或生物体,其包含如上所定义的根据本发明所述的组合、核酸分子(一种以上)或载体,前提是该细胞不是人生殖细胞系细胞。
本发明还提供如上所定义的根据本发明所述的组合、核酸分子(一种以上)或载体在医学中的用途、或用作药物的用途。本发明还提供如上所定义的根据本发明所述的组合、核酸分子(一种以上)或载体在治疗癌症的方法中的用途。在本发明的一个实施方案中,上述用途包括使用异二聚化的化学诱导剂。优选地,用于治疗癌症的方法的细胞是修饰的T细胞。优选地,根据本发明所述的前述用途的要治疗的癌症类型包括CML、B细胞淋巴瘤、急性成淋巴细胞性白血病、慢性淋巴细胞白血病、霍奇金和非霍奇金淋巴瘤、间皮瘤、卵巢癌、前列腺癌等。
本发明还提供一种以更有效的方式制备敲除细胞或生物体的方法,其中本发明提供如上所定义的根据本发明所述的组合、核酸分子(一种以上)或载体,其中通过栓系核酸外切酶来增强基因组编辑。
本发明还提供一种以更有效的方式制备敲入细胞或生物体的方法,其中本发明提供如上所定义的根据本发明所述的组合、核酸分子(一种以上)或载体,其中通过栓系核酸外切酶和通过共添加模板DNA来增强基因组编辑。
本发明还提供如上所定义的根据本发明所述的组合、核酸分子(一种以上)或载体用作用于燃料开发(fuel development)等的药物新来源的工具。
下文中更详细描述的实施例旨在最好地描述本发明。这些实施例不限制本发明的范围,而仅仅是为了提供本发明及其用途的更好的理解。
实施例1:用于通过不同的异二聚化系统与特定核酸外切酶栓系的修饰的CRISPR/Cas系统的构建体的制备
编码通过不同的异二聚化系统与特定核酸外切酶栓系的修饰的CRISPR/Cas系统的DNA的制备。为了制备DNA构建体,发明人使用分子生物学方法,例如:感受态大肠杆菌细胞的化学转化、质粒DNA分离、聚合酶链式反应(PCR)、逆转录-PCR、PCR连接、核酸浓度测定、DNA琼脂糖凝胶电泳、从琼脂糖凝胶分离DNA片段、DNA的化学合成、由限制性酶的DNA限制,质粒载体的切割、DNA片段的连接、大量的质粒DNA的纯化。实验技术和方法的确切过程对于该领域的专家来说是众所周知的,并且描述于分子生物学手册。
所有的工作都是使用无菌技术进行的,这也是本领域的专家所众所周知的。通过化学转化将所有质粒、完整构建体和部分构建体转化至细菌大肠杆菌(Escherichiacoli)。已使用去除内毒素的DNA分离试剂盒分离用于转染至细胞系(动物或人类)的质粒。
在所述情况中,Cas9蛋白选自所有类型的CRISPR系统。核酸外切酶在已知的核酸外切酶中选择。Cas9通过肽接头在C末端与不同异二聚化系统的不同蛋白结构域连接或与来自形成卷曲螺旋的肽对的肽连接。核酸外切酶通过肽接头在N末端与不同异二聚化系统的不同蛋白结构域连接或与来自形成卷曲螺旋的肽对的肽连接。
根据本发明所述的Cas9和某些核酸外切酶的序列列于表1中。所有操纵子均通过根据本领域专家已知的方法的技术来制备。将操纵子插入至适用于真核生物系统的质粒中。发明人通过测序和限制性分析确证核苷酸序列的适用性。
表1:示例性人工工程化NFAT2转录因子的组分的融合蛋白。
Figure BDA0003511296730000171
Figure BDA0003511296730000181
培养细胞培养物的方法和技术对于本领域专家来说是众所周知的,因此简要描述以说明实施的实施例。在37℃和5%CO2下生长来自HEK293T细胞系的细胞。对于培养,使用含有10%FBS的DMEM培养基,其含有所有必需的营养物质和生长因子。在37℃和5%CO2下、在含有10%FBS的RPMI培养基中生长细胞K562。当细胞培养物达到合适的密度时,将细胞移植至新的培养瓶(breading flask)和/或稀释。为了在实验中使用细胞,通过血细胞计数器确定细胞数,并在转染HEK293细胞前18-24小时以1x105每孔的密度接种至具有24个孔的微量滴定板上。在37℃和5%CO2下孵育接种的板,直至细胞达到50-70%汇合度并准备好通过转染试剂进行转染。根据转染试剂制造商(例如,JetPei,Lipofectamine 2000)的说明进行转染,并使适用于所使用的微量滴定板。使用Neon电穿孔系统在10μl电穿孔吸头中对K562(1x104)进行电穿孔。然后将细胞置于12孔板的孔中的含有10%FBS的RPMI培养基中。如果使用化学和非化学诱导的异二聚化系统,则在第二天添加用于异二聚化的诱导剂。转染后48小时,分离基因组DNA并PCR扩增期望的区域。接下来进行T7E1(T7核酸内切酶1)检验以确定插入缺失突变的百分比。
实施例2.限定用于增强eGFP基因组区域处的基因组编辑的与CRISPR/Cas系统共表达的最成功的核酸外切酶
为了检测使用的特定核酸外切酶与CRISPR/Cas系统的最有效的核酸外切酶共表达。使用稳定表达eGFP的HEK293细胞系。
将稳定表达eGFP细胞HEK293T接种在24孔板中,在实验前一天用编码一种检测的核酸外切酶的质粒和编码CRISPR/Cas系统的分别的质粒转染HEK293T;Cas9蛋白来自化脓性链球菌,gRNA(eGFP基因组区域中的靶向序列:GGCGAGGGCGATGCCACCTA)。
为了分析特定核酸外切酶和CRISPR/Cas系统的共表达的基因组编辑活性,在转染48小时后在流式细胞仪上分析细胞。我们分别测定了细胞种群中的荧光强度,并以MFI的%(平均荧光强度)显示结果
结果:
从图2可以清楚地看出,特定核酸外切酶和CRISPR/Cas系统的共表达增强了eGFP基因组区域的基因组编辑,由于用CRISPR/Cas系统和特定核酸外切酶转染的所有细胞样品中荧光减弱。CRISPR/Cas系统的共表达靶向eGFP GOI,并且源自大肠杆菌的EXOIII显示最高的试验细胞的编辑百分比,因为最低的MOI百分比。
实施例3.通过形成卷曲螺旋的异二聚化肽对与特定核酸外切酶栓系的修饰的CRISPR/Cas系统的活性
为了测试通过异二聚化肽对与特定核酸外切酶栓系的修饰的CRISPR/Cas系统的活性,使用HEK293细胞来确定通过异二聚化肽对与特定核酸外切酶栓系的修饰的CRISPR/Cas系统的活性。用表达通过异二聚化肽对与特定核酸外切酶栓系的CRISPR/Cas系统的构建体转染细胞;所述CRISPR/Cas系统为例如Cas9-P3或Cas9-P4与P3-EXO1或P4-EXO1或P3-EXOIII或P4-EXOIII或P3-mTREX2的组合。对于对照,用常规CRISPR/Cas9系统转染细胞或将细胞与CRISPR/Cas9系统和特定核酸外切酶(例如EXO1或EXOIII或mTREX2)共表达。使用了用于人EMX1基因的gRNA(靶向序列:GAGTCCGAGCAGAAGAAGAA)或用于人VEGF基因的gRNA(靶向序列:GGTGAGTGAGTGTGTGCGTG)或用于人MYD88的gRNA(GGCTGAGAAGCCTTTACAGG)。48小时从转染的细胞中分离基因组DNA,并对预测的DSB周围的基因组区域进行PCR扩增。然后进行T7E1检验。通过Syber金染色的PAGE(聚丙烯酰胺凝胶电泳)凝胶分析来确定插入缺失突变的存在和定量。通过ImageJ软件计算插入缺失突变的百分比。还从150个碱基对长的扩增子进行下一代测序(NGS)。
结果:
图3A中来自由适当的构建体转染的细胞的T7E1处理的样品的PAGE凝胶分析表明,当使用通过P3肽栓系至EXOIII的Cas9-P4时,人MYD88基因的基因组编辑在所有试验样品中最高。当用表达Cas9-P3和P4-EXOIII的构建体转染细胞时,观察到基因组编辑的适度减少。与使用Cas9、靶向人MYD88基因的gRNA和特定核酸外切酶(例如EXO1或EXOIII或mTREX2)的共表达的细胞样品相比,在其中使用通过异二聚化肽对(P3-P4)与特定核酸外切酶(EXO1或EXOIII或mTREX2)栓系的修饰的CRISPR/Cas系统的所有情况中,基因组编辑为较高的。当使用其中仅使用Cas9和靶向人MYD88基因的gRNA的常规CRISPR/Cas系统时,其中使用通过异二聚化肽对(P3-P4)与特定核酸外切酶(EXO1或EXOIII或mTREX2)栓系的修饰的CRISPR/Cas系统的基因组编辑也较高。图3B以图形方式显示了插入缺失存在的百分比,这是通过PAGE分析确定的,描述于图3A。
图4A中来自由适当的构建体转染的细胞的T7E1处理的样品的PAGE凝胶分析表明,当使用通过P4异二聚化肽栓系至EXOIII的Cas9-P3时,人VEGF基因的基因组编辑在所有试验样品中最高。当由表达Cas9-P4和P3-EXOIII的构建体转染细胞时,观察到基因组编辑的适度减少。与使用Cas9、靶向人VEGF基因的gRNA和特定核酸外切酶(例如EXO1或EXOIII或mTREX2)的共表达的细胞样品相比,基因组编辑较高。当使用其中仅使用Cas9和靶向人VEGF基因的gRNA的常规CRISPR/Cas系统时,其中使用通过异二聚化肽对(P3-P4)与特定核酸外切酶(EXO1或EXOIII)栓系的修饰的CRISPR/Cas系统的基因组编辑也较高。图4B以图形方式显示了插入缺失存在的百分比,这是通过PAGE分析确定的,描述于图4A。
图5A中来自由适当的构建体转染的细胞的T7E1处理的样品的PAGE凝胶分析表明,当使用通过P3肽栓系至EXOIII的Cas9-P4时,人EMX1基因的基因组编辑在所有试验样品中最高。当由表达Cas9-P3和P4-EXOIII的构建体转染细胞时,观察到基因组编辑的适度减少。与使用Cas9、靶向人EMX1基因的gRNA和特定核酸外切酶(例如EXO1或EXOIII或mTREX2)的共表达的细胞样品相比,在其中使用通过异二聚化肽对(P3-P4)与特定核酸外切酶(EXO1或EXOIII或mTREX2)栓系的修饰的CRISPR/Cas系统的所有情况中,基因组编辑较高。当使用其中仅使用Cas9和靶向人EMX1基因的gRNA的常规CRISPR/Cas系统时,其中使用通过异二聚化肽对(P3-P4)与特定核酸外切酶(EXO1或EXOIII或mTREX2)栓系的修饰的CRISPR/Cas系统的基因组编辑也较高。图5B以图形方式显示了插入缺失存在的百分比,这是通过PAGE分析确定的,描述于图5A。
图6显示来自NGS的结果。对来自用空载体pcDNA3或用常规Cas9或用与EXOIII共表达的Cas9或用Cas9-P4和P3-EXOIII转染的细胞的150个碱基对PCR扩增子进行测序。在所有情况中,使用靶向人MYD88基因的gRNA。在仅表达pcDNA3的样品中未观察到碱基对缺失。在仅表达Cas9和gRNA的样品中观察到九个碱基对缺失。在Cas9和gRNA与EXOIII共表达的样品中观察到14个碱基对缺失。在表达与P3-EXOIII栓系的Cas9-P4和gRNA的样品中观察到40个碱基对缺失。符号(i)描绘了预测的Cas9切割位点。
实施例4:通过异二聚化肽对与特定核酸外切酶栓系的修饰的CRISPR/Cas系统的基因组编辑不是由于较高的Cas9蛋白表达
由于较高的cas9蛋白表达,可以增强对于期望的GOI的较高的基因组编辑百分比。通过异二聚化肽对与特定核酸外切酶栓系的修饰的CRISPR/Cas系统的基因组编辑不是由于较高的Cas9蛋白表达。
为了通过实验确定通过异二聚化肽对与特定核酸外切酶栓系的修饰的CRISPR/Cas系统的较高基因组编辑不是由于Cas9蛋白过表达,我们通过免疫印迹和抗Cas9特异性免疫检测来可视化Cas9蛋白含量。为了显示相同的Cas9蛋白表达,用表达空pcDNA3质粒、通过异二聚化肽对与特定核酸外切酶栓系的CRISPR/Cas系统的构建体转染HEK293细胞;所述CRISPR/Cas系统为例如Cas9-P3与P4-EXOIII的组合。对于对照,用常规CRISPR/Cas9系统转染细胞或将细胞与CRISPR/Cas9系统和特定核酸外切酶(例如EXOIII)共表达。使用了用于人MYD88的gRNA(靶序列:GGCTGAGAAGCCTTTACAGG)。制备48小时细胞裂解物。在SDS PAGE凝胶分析中分析通过标准BCA检验确定的相同量的蛋白。然后,进行免疫印迹转移,然后用特异性抗Cas9抗体对膜进行染色。
结果:
图7显示所有试验样品中的Cas9蛋白含量为相等的。Cas9蛋白的条带强度对于用其中仅表达Cas9和gRNA的常规CRISPR/Cas9系统转染的细胞的细胞裂解物是相同的,或者对于用于Cas9和特定核酸外切酶(例如EXOIII)和gRNA的共表达的细胞的细胞裂解物是相同的,和对于通过异二聚化肽对与特定核酸外切酶栓系的CRISPR/Cas系统如Cas9-P3与P4-EXOIII的组合转染的细胞的细胞裂解物是相同的。在仅转染空载体的样品中,不存在Cas9蛋白条带。
实施例5:由于通过异二聚化肽对与特定核酸外切酶栓系的修饰的CRISPR/Cas系统的较高的基因组编辑不增加脱靶位点处的不需要的基因组修饰
当使用具有增强的功能的CRISPR/Cas系统时,存在CRISPR/Cas的增加的中靶作用还具有额外的放大的脱靶效应的一些可能性。为了表明通过异二聚化肽对与特定核酸外切酶栓系的修饰的CRISPR/Cas系统不在由对于CRISPR/Cas的指定构建体转染的HEK293细胞的脱靶位点处增加不需要的基因组修饰。在转染48小时后进行标准T7E1检验,分析MYD88gRNA(靶序列:GGCTGAGAAGCCTTTACAGG)的三个潜在脱靶位点。由于用于gRNA设计和评分的生物信息学工具,预测了MYD88 gRNA的三个潜在脱靶位点,例如:脱靶位点1发现于ANKRD52基因中(靶序列:ACTGTAAAGGCTGCTCTCCC);脱靶位点2预测在FUT9基因中(靶序列:TGCAGAGGAGCCTTTACATG),脱靶位点3确定在PSKH2基因中(靶序列:GCCAGACAAGGCTTTACAGG)。
结果:
图8中描述的来自由适当的构建体转染的细胞的T7E1处理的样品的PAGE凝胶分析表明,不发生人MYD88基因gRNA(靶序列:GGCTGAGAAGCCTTTACAGG)的三个预测的可能脱靶位点的基因组编辑。在图8A中,描述了对于发现于ANKRD52基因中(靶序列:ACTGTAAAGGCTGCTCTCCC)的脱靶位点1的、来自转染的细胞的T7E1处理的样品的PAGE凝胶分析。由于不存在DNA条带切割,不存在插入缺失突变。在用空(pcDNA3)载体或用其中仅表达Cas9和gRNA的常规CRISPR/Cas9系统转染的样品中无DNA条带切割。在用于Cas9和特定核酸外切酶(例如EXOIII)和gRNA的共表达的细胞中、以及用通过异二聚化肽对与特定核酸外切酶栓系的CRISPR/Cas系统转染的细胞中也没有看到DNA条带切割;例如Cas9-P3与P4-EXOIII的组合。
在图8B中,描述了对于发现于FUT9基因中(靶序列:TGCAGAGGAGCCTTTACATG)的脱靶位点2的、来自转染的细胞的T7E1处理的样品的PAGE凝胶分析。由于不存在DNA条带切割,不存在插入缺失突变。用空(pcDNA3)载体或用其中仅表达Cas9和gRNA的常规CRISPR/Cas9系统转染的样品中无DNA条带切割。在用于Cas9和特定核酸外切酶(例如EXOIII)和gRNA的共表达的细胞中、以及用通过异二聚化肽对与特定核酸外切酶栓系的CRISPR/Cas系统转染的细胞中也没有看到DNA条带切割;例如Cas9-P3与P4-EXOIII的组合。
在图8C中,描述了对于发现于PSKH2基因中(靶序列:GCCAGACAAGGCTTTACAGG)的脱靶位点3的、来自转染的细胞的T7E1处理的样品的PAGE凝胶分析。存在DNA条带切割,但在用空(pcDNA3)载体或用其中仅表达Cas9和gRNA的常规CRISPR/Cas9系统转染的样品中也存在DNA条带切割,因此表明试验区域中存在SNP。在用于Cas9和特定核酸外切酶(例如EXOIII)和gRNA的共表达的细胞中、以及用通过异二聚化肽对与特定核酸外切酶栓系的CRISPR/Cas系统转染的细胞中也看到DNA条带切割;例如Cas9-P3与P4-EXOIII的组合,但作为插入缺失突变确定标准的条带强度在所有样品中为相同的。
实施例6:通过异二聚化肽对与特定核酸外切酶栓系的修饰的CRISPR/Cas系统具有抗癌治疗特性
当癌症的原因是基因组重排时,通过异二聚化肽对与特定核酸外切酶栓系的修饰的CRISPR/Cas系统具有抗癌治疗特性。在所有病例中,CML(慢性髓细胞性白血病(chronicmyelogenous leukemia))患者携带染色体9和22之间的费城染色体或BCR-ABL融合基因(t9,22;q34;q11)。该染色体具有编码作为酪氨酸激酶信号蛋白的杂合激酶的致病作用。这种激酶的组成信号导致细胞不受控制地分裂和增殖。为了确定可能的抗CML治疗选择,用指定的CRISPR/Cas9构建体的质粒DNA对携带BCR-ABL融合基因的K562细胞(稳定表达萤火虫荧光素酶;K562-fLUC)进行电穿孔。使用具有靶向序列GACCTGTCTTTTAGACAGGC的gRNA用于将Cas9指导至BCR-ABL融合基因。对K562-fLUC细胞进行电穿孔72小时后,添加D-荧光素(Xenogen)并通过使用
Figure BDA0003511296730000241
Lumina Series III(Perkin Elmer)测定生物发光。使用Living
Figure BDA0003511296730000242
4.5.2(Perkin Elmer)分析数据。
为了试验通过异二聚化肽对与特定核酸外切酶栓系的修饰的CRISPR/Cas系统的活性,使用K562细胞来确定通过异二聚化肽对与特定核酸外切酶栓系的修饰的CRISPR/Cas系统的活性。用表达通过异二聚化肽对与特定核酸外切酶栓系的CRISPR/Cas系统的构建体对细胞进行电穿孔;所述CRISPR/Cas系统为例如Cas9-P3或Cas9-P4或Cas9-N5与P4-EXOIII或P3-EXOIII或N6-EXOIII的组合。对于对照,用常规CRISPR/Cas9系统对细胞进行电穿孔,或者将细胞与CRISPR/Cas9系统和特定核酸外切酶(例如EXOIII)共表达。使用了用于人BCR-ABL融合基因的gRNA(靶向序列GACCTGTCTTTTAGACAGGC)。48小时后,从细胞中分离基因组DNA,并对预测的DSB周围的基因组区域进行PCR扩增。接下来进行T7E1检验。通过Syber金染PAGE(聚丙烯酰胺凝胶电泳)凝胶分析来确定插入缺失突变的存在和定量。通过ImageJ软件计算插入缺失突变的百分比。
结果:
图9显示CRISPR/Cas构建体电穿孔后K562-fLUC细胞的细胞种群的生物发光。生物发光减少表明由于BCR-ABL融合基因基因组区域处的基因组编辑导致的细胞死亡。与用空pcDNA3载体进行电穿孔的细胞相比,在用其中仅表达Cas9和gRNA的常规CRISPR/Cas9系统进行电穿孔的细胞中看到生物发光信号的下降。当使用Cas9和特定核酸外切酶(例如EXOIII)和gRNA的共表达时,观察到生物发光的额外的下降。在用通过异二聚化肽对与特定核酸外切酶栓系的CRISPR/Cas系统进行电穿孔的细胞中观察到由于BCR-ABL融合基因基因组区域处的最高基因组编辑和其后的细胞死亡导致的最大的生物发光信号丧失;CRISPR/Cas系统为例如Cas9-P3或Cas9-P4与P4-EXOIII或P3-EXOIII和相应的gRNA的组合。
图10A中来自由适当的构建体转染的细胞的T7E1处理的样品的PAGE凝胶分析表明,当使用通过N6肽栓系至EXOIII的Cas9-N5时,人BCR-ABL融合基因的基因组编辑在所有试验样品中最高。当用表达Cas9-P3和P4-EXOIII的构建体转染细胞时、或在与Cas9、靶向人BCR-ABL基因的gRNA和特定核酸外切酶(例如EXOIII)共表达的细胞样品中,观察到基因组编辑的适度减少,但当仅使用Cas9和gRNA时,所有样品中的基因组编辑都较高。当用空载体对细胞进行电穿孔时,没有发生基因编辑。图10B以图形方式显示了插入缺失存在的百分比,这是通过PAGE分析确定的,描述于图10A。
将通过以下项进一步描述本发明:
1.通过异二聚化系统与核酸外切酶栓系的修饰的CRISPR/Cas系统,其包含两种组分:
a)第一组分,其包含与化学和非化学信号诱导型异二聚化蛋白复合物的至少一种第一蛋白结构域融合的Cas蛋白,和
b)第二组分,其包含融合至第二蛋白结构域的特定核酸外切酶,所述第二蛋白结构域结合至化学和非化学信号诱导型异二聚化蛋白复合物的至少一种第一蛋白结构域。
2.通过形成卷曲螺旋的异二聚化肽对与特定核酸外切酶栓系的修饰的CRISPR/Cas系统,其包含两种组分:
a)第一组分,其包含与形成卷曲螺旋的肽对的至少一种第一肽融合的Cas蛋白,和
b)第二组分,其包含融合至形成卷曲螺旋的肽对的第二肽的特定核酸外切酶。
3.项1的通过异二聚化系统与特定核酸外切酶栓系的修饰的CRISPR/Cas系统,其中第一组分的化学和非化学信号诱导型异二聚化蛋白复合物的至少一种第一蛋白结构域选自由以下对组成的组:
i)FKBP和FRB;
ii)FKBP和钙调磷酸酶催化亚基A(CnA);
iii)FKBP和亲环蛋白;
iv)旋转酶B(GyrB)和GyrB;
v)DmrA和DmrC;
vi)ABI和PYL1;
vii)GAI和GID1;
viii)CIB1和CRY2
ix)LOV和PDZ;
x)PIF和PHYB;
xi)FKF1-GI
xii)UVR8-COP1。
其中第二组分的第二蛋白结构域选自由以下对组成的组:
i)FKBP和FRB;
ii)FKBP和钙调磷酸酶催化亚基A(CnA);
iii)FKBP和亲环蛋白;
iv)旋转酶B(GyrB)和GyrB;
v)DmrA和DmrC;
vi)ABI和PYL1;
vii)GAI和GID1;
viii)CIB1和CRY2
ix)LOV和PDZ;
x)PIF和PHYB;
xi)FKF1-GI
xii)UVR8-COP1。
4.项2的通过异二聚化肽对与特定核酸外切酶栓系的修饰的CRISPR/Cas系统,其中肽对选自形成卷曲螺旋的任何天然和非天然来源的肽。
5.项1和3的通过异二聚化系统与特定核酸外切酶栓系的修饰的CRISPR/Cas系统、或项2和4的通过形成卷曲螺旋的异二聚化肽对与特定核酸外切酶栓系的修饰的CRISPR/Cas系统,使用来自任何CRISPR类型系统的核酸内切酶或一种以上的切口酶。
6.项1和3和5的通过异二聚化系统与特定核酸外切酶栓系的修饰的CRISPR/Cas系统、或项2和4-5的通过形成卷曲螺旋的异二聚化肽对与特定核酸外切酶栓系的修饰的CRISPR/Cas系统,使用导致一个以上的DSB或一个以上的DNA切口的来自任何CRISPR类型系统的核酸内切酶或一种以上的切口酶。
7.项1和3和5-6的通过异二聚化系统与特定核酸外切酶栓系的修饰的CRISPR/Cas系统、或项2和4-6的通过形成卷曲螺旋的异二聚化肽对与特定核酸外切酶栓系的修饰的CRISPR/Cas系统,使用任何以3'和/或5'方式切割DNA链的酶。
8.项6和7的通过异二聚化系统与特定核酸外切酶栓系的修饰的CRISPR/Cas系统、或项6和7的通过形成卷曲螺旋的异二聚化肽对与特定核酸外切酶栓系的修饰的CRISPR/Cas系统,影响任何选定的基因组区域处的基因组编辑。
9.项8的通过异二聚化系统与特定核酸外切酶栓系的修饰的CRISPR/Cas系统、或项8的通过形成卷曲螺旋的异二聚化肽对与特定核酸外切酶栓系的修饰的CRISPR/Cas系统,影响由任何设计的一种以上的gRNA的、在任何选定基因组区域处的基因组编辑。
10.项8和9的通过异二聚化系统与特定核酸外切酶栓系的修饰的CRISPR/Cas系统、或项8和9的通过形成卷曲螺旋的异二聚化肽对与特定核酸外切酶栓系的修饰的CRISPR/Cas系统,影响原核细胞和真核细胞中的基因组编辑。
11.项10的通过异二聚化系统与特定核酸外切酶栓系的修饰的CRISPR/Cas系统、或项10的通过形成卷曲螺旋的异二聚化肽对与特定核酸外切酶栓系的修饰的CRISPR/Cas系统的作用后形成的DSB在任何细胞修复机制中修复。
12.项11的通过异二聚化系统与特定核酸外切酶栓系的修饰的CRISPR/Cas系统、或项11的通过形成卷曲螺旋的异二聚化肽对与特定核酸外切酶栓系的修饰的CRISPR/Cas系统用于敲入和敲除细胞或生物体产生。
13.对于敲入产生,项11的通过异二聚化系统与特定核酸外切酶栓系的修饰的CRISPR/Cas系统、或项11的通过形成卷曲螺旋的异二聚化肽对与特定核酸外切酶栓系的修饰的CRISPR/Cas系统,存在额外的DNA模板。
14.项13的DNA模板作为ssDNA或dsDNA存在。
15.项1和4和6-14的通过异二聚化系统与特定核酸外切酶栓系的修饰的CRISPR/Cas系统包含能够诱导与核酸外切酶栓系的修饰的CRISPR/Cas系统的功能重建的异二聚化的化学和非化学诱导剂。
16.项1和3的调节系统,其中至少一种第一蛋白结构域和第二蛋白结构域来自两种不同的蛋白并且具有直系同源特性。
17.项2和4的肽对以平行和反平行的形式形成卷曲螺旋。
18.项1和4和6-16的异二聚化系统,其中在存在异二聚化的化学诱导剂的情况下,第一组分和第二组分形成异二聚体以形成化学信号诱导型异二聚化蛋白复合物,其中所述化学诱导剂优选为小分子。
19.项1和4和6-16的异二聚化系统,其中在存在异二聚化的非化学诱导剂的情况下,第一组分和第二组分形成异二聚体以形成非化学信号诱导型异二聚化蛋白复合物,其中所述非化学诱导剂优选是具有指定波长的光,适用于异二聚化系统蛋白伴侣。
20.项12的通过异二聚化系统与特定核酸外切酶栓系的修饰的CRISPR/Cas系统、或项12的通过形成卷曲螺旋的异二聚化肽对与特定核酸外切酶栓系的修饰的CRISPR/Cas系统编辑BCR-ABL融合基因,从而导致减少的细胞脱离(deviation)和增殖。
21.一种分离的核酸,其包含编码项1-20的通过异二聚化系统与特定核酸外切酶栓系的修饰的CRISPR/Cas系统、或项1-20的通过形成卷曲螺旋的异二聚化肽对与特定核酸外切酶栓系的修饰的CRISPR/Cas系统的a)第一组分和/或b)第二组分的核酸。
22.一种载体,其一种以上的编码项21的分离的核酸。
23.项1-20的通过异二聚化系统与特定核酸外切酶栓系的修饰的CRISPR/Cas系统、或项1-20的通过形成卷曲螺旋的异二聚化肽对与特定核酸外切酶栓系的修饰的CRISPR/Cas系统作为CasRNP的递送。
24.一种细胞或生物体,其包含项1-23的系统。
25.来自项24的细胞或生物体在作为药物、疾病模型、药物开发模型、生物燃料生产、新食品发现、治疗癌症的方法、治疗基因组突变衍生疾病的方法中的用途。
26.项3的异二聚化系统和来自权利要求4的形成卷曲螺旋的异二聚化肽对可用于将dCas9或Cas9切口酶与胞苷脱氨酶APOBEC栓系。
Figure BDA0003511296730000301
Figure BDA0003511296730000311
Figure BDA0003511296730000321
Figure BDA0003511296730000331
Figure BDA0003511296730000341
Figure BDA0003511296730000351
Figure BDA0003511296730000361
Figure BDA0003511296730000371
Figure BDA0003511296730000381
Figure BDA0003511296730000391
Figure BDA0003511296730000401
Figure BDA0003511296730000411
Figure BDA0003511296730000421
Figure BDA0003511296730000431
Figure BDA0003511296730000441
Figure BDA0003511296730000451
Figure BDA0003511296730000461
Figure BDA0003511296730000471
Figure BDA0003511296730000481
Figure BDA0003511296730000491
Figure BDA0003511296730000501
Figure BDA0003511296730000511
Figure BDA0003511296730000521
Figure BDA0003511296730000531
Figure BDA0003511296730000541
Figure BDA0003511296730000551
Figure BDA0003511296730000561
Figure BDA0003511296730000571
Figure BDA0003511296730000581
Figure BDA0003511296730000591
序列表
<110> 国家化学研究所(National Institute of Chemistry)
<120> 用于增强基因组编辑的CRISPR/CAS和核酸外切酶的卷曲螺旋介导的栓系
<130> 69116P WO
<160> 29
<170> PatentIn 版本 3.5
<210> 1
<211> 4308
<212> DNA
<213> 人工序列
<220>
<223> Cas9-P4
<400> 1
atggccccaa agaagaagcg gaaggtcggt atccacggag tcccagcagc cgacaagaag 60
tacagcatcg gcctggacat cggcaccaac tctgtgggct gggccgtgat caccgacgag 120
tacaaggtgc ccagcaagaa attcaaggtg ctgggcaaca ccgaccggca cagcatcaag 180
aagaacctga tcggagccct gctgttcgac agcggcgaaa cagccgaggc cacccggctg 240
aagagaaccg ccagaagaag atacaccaga cggaagaacc ggatctgcta tctgcaagag 300
atcttcagca acgagatggc caaggtggac gacagcttct tccacagact ggaagagtcc 360
ttcctggtgg aagaggataa gaagcacgag cggcacccca tcttcggcaa catcgtggac 420
gaggtggcct accacgagaa gtaccccacc atctaccacc tgagaaagaa actggtggac 480
agcaccgaca aggccgacct gcggctgatc tatctggccc tggcccacat gatcaagttc 540
cggggccact tcctgatcga gggcgacctg aaccccgaca acagcgacgt ggacaagctg 600
ttcatccagc tggtgcagac ctacaaccag ctgttcgagg aaaaccccat caacgccagc 660
ggcgtggacg ccaaggccat cctgtctgcc agactgagca agagcagacg gctggaaaat 720
ctgatcgccc agctgcccgg cgagaagaag aatggcctgt tcggaaacct gattgccctg 780
agcctgggcc tgacccccaa cttcaagagc aacttcgacc tggccgagga tgccaaactg 840
cagctgagca aggacaccta cgacgacgac ctggacaacc tgctggccca gatcggcgac 900
cagtacgccg acctgtttct ggccgccaag aacctgtccg acgccatcct gctgagcgac 960
atcctgagag tgaacaccga gatcaccaag gcccccctga gcgcctctat gatcaagaga 1020
tacgacgagc accaccagga cctgaccctg ctgaaagctc tcgtgcggca gcagctgcct 1080
gagaagtaca aagagatttt cttcgaccag agcaagaacg gctacgccgg ctacattgac 1140
ggcggagcca gccaggaaga gttctacaag ttcatcaagc ccatcctgga aaagatggac 1200
ggcaccgagg aactgctcgt gaagctgaac agagaggacc tgctgcggaa gcagcggacc 1260
ttcgacaacg gcagcatccc ccaccagatc cacctgggag agctgcacgc cattctgcgg 1320
cggcaggaag atttttaccc attcctgaag gacaaccggg aaaagatcga gaagatcctg 1380
accttccgca tcccctacta cgtgggccct ctggccaggg gaaacagcag attcgcctgg 1440
atgaccagaa agagcgagga aaccatcacc ccctggaact tcgaggaagt ggtggacaag 1500
ggcgcttccg cccagagctt catcgagcgg atgaccaact tcgataagaa cctgcccaac 1560
gagaaggtgc tgcccaagca cagcctgctg tacgagtact tcaccgtgta taacgagctg 1620
accaaagtga aatacgtgac cgagggaatg agaaagcccg ccttcctgag cggcgagcag 1680
aaaaaggcca tcgtggacct gctgttcaag accaaccgga aagtgaccgt gaagcagctg 1740
aaagaggact acttcaagaa aatcgagtgc ttcgactccg tggaaatctc cggcgtggaa 1800
gatcggttca acgcctccct gggcacatac cacgatctgc tgaaaattat caaggacaag 1860
gacttcctgg acaatgagga aaacgaggac attctggaag atatcgtgct gaccctgaca 1920
ctgtttgagg acagagagat gatcgaggaa cggctgaaaa cctatgccca cctgttcgac 1980
gacaaagtga tgaagcagct gaagcggcgg agatacaccg gctggggcag gctgagccgg 2040
aagctgatca acggcatccg ggacaagcag tccggcaaga caatcctgga tttcctgaag 2100
tccgacggct tcgccaacag aaacttcatg cagctgatcc acgacgacag cctgaccttt 2160
aaagaggaca tccagaaagc ccaggtgtcc ggccagggcg atagcctgca cgagcacatt 2220
gccaatctgg ccggcagccc cgccattaag aagggcatcc tgcagacagt gaaggtggtg 2280
gacgagctcg tgaaagtgat gggccggcac aagcccgaga acatcgtgat cgaaatggcc 2340
agagagaacc agaccaccca gaagggacag aagaacagcc gcgagagaat gaagcggatc 2400
gaagagggca tcaaagagct gggcagccag atcctgaaag aacaccccgt ggaaaacacc 2460
cagctgcaga acgagaagct gtacctgtac tacctgcaga atgggcggga tatgtacgtg 2520
gaccaggaac tggacatcaa ccggctgtcc gactacgatg tggaccatat cgtgcctcag 2580
agctttctga aggacgactc catcgacaac aaggtgctga ccagaagcga caagaaccgg 2640
ggcaagagcg acaacgtgcc ctccgaagag gtcgtgaaga agatgaagaa ctactggcgg 2700
cagctgctga acgccaagct gattacccag agaaagttcg acaatctgac caaggccgag 2760
agaggcggcc tgagcgaact ggataaggcc ggcttcatca agagacagct ggtggaaacc 2820
cggcagatca caaagcacgt ggcacagatc ctggactccc ggatgaacac taagtacgac 2880
gagaatgaca agctgatccg ggaagtgaaa gtgatcaccc tgaagtccaa gctggtgtcc 2940
gatttccgga aggatttcca gttttacaaa gtgcgcgaga tcaacaacta ccaccacgcc 3000
cacgacgcct acctgaacgc cgtcgtggga accgccctga tcaaaaagta ccctaagctg 3060
gaaagcgagt tcgtgtacgg cgactacaag gtgtacgacg tgcggaagat gatcgccaag 3120
agcgagcagg aaatcggcaa ggctaccgcc aagtacttct tctacagcaa catcatgaac 3180
tttttcaaga ccgagattac cctggccaac ggcgagatcc ggaagcggcc tctgatcgag 3240
acaaacggcg aaaccgggga gatcgtgtgg gataagggcc gggattttgc caccgtgcgg 3300
aaagtgctga gcatgcccca agtgaatatc gtgaaaaaga ccgaggtgca gacaggcggc 3360
ttcagcaaag agtctatcct gcccaagagg aacagcgata agctgatcgc cagaaagaag 3420
gactgggacc ctaagaagta cggcggcttc gacagcccca ccgtggccta ttctgtgctg 3480
gtggtggcca aagtggaaaa gggcaagtcc aagaaactga agagtgtgaa agagctgctg 3540
gggatcacca tcatggaaag aagcagcttc gagaagaatc ccatcgactt tctggaagcc 3600
aagggctaca aagaagtgaa aaaggacctg atcatcaagc tgcctaagta ctccctgttc 3660
gagctggaaa acggccggaa gagaatgctg gcctctgccg gcgaactgca gaagggaaac 3720
gaactggccc tgccctccaa atatgtgaac ttcctgtacc tggccagcca ctatgagaag 3780
ctgaagggct cccccgagga taatgagcag aaacagctgt ttgtggaaca gcacaagcac 3840
tacctggacg agatcatcga gcagatcagc gagttctcca agagagtgat cctggccgac 3900
gctaatctgg acaaagtgct gtccgcctac aacaagcacc gggataagcc catcagagag 3960
caggccgaga atatcatcca cctgtttacc ctgaccaatc tgggagcccc tgccgccttc 4020
aagtactttg acaccaccat cgaccggaag aggtacacca gcaccaaaga ggtgctggac 4080
gccaccctga tccaccagag catcaccggc ctgtacgaga cacggatcga cctgtctcag 4140
ctgggaggcg acgatccaaa aaagaagaga aaggtaggcg gctctggcgg cggctccgga 4200
ggctctagcc cggaagataa aattgctcag ctgaaacaaa aaatccaagc gctgaaacag 4260
gaaaaccagc agctggaaga ggaaaacgcc gcactggaat atggttaa 4308
<210> 2
<211> 4308
<212> DNA
<213> 人工序列
<220>
<223> Cas9-P3
<400> 2
atggccccaa agaagaagcg gaaggtcggt atccacggag tcccagcagc cgacaagaag 60
tacagcatcg gcctggacat cggcaccaac tctgtgggct gggccgtgat caccgacgag 120
tacaaggtgc ccagcaagaa attcaaggtg ctgggcaaca ccgaccggca cagcatcaag 180
aagaacctga tcggagccct gctgttcgac agcggcgaaa cagccgaggc cacccggctg 240
aagagaaccg ccagaagaag atacaccaga cggaagaacc ggatctgcta tctgcaagag 300
atcttcagca acgagatggc caaggtggac gacagcttct tccacagact ggaagagtcc 360
ttcctggtgg aagaggataa gaagcacgag cggcacccca tcttcggcaa catcgtggac 420
gaggtggcct accacgagaa gtaccccacc atctaccacc tgagaaagaa actggtggac 480
agcaccgaca aggccgacct gcggctgatc tatctggccc tggcccacat gatcaagttc 540
cggggccact tcctgatcga gggcgacctg aaccccgaca acagcgacgt ggacaagctg 600
ttcatccagc tggtgcagac ctacaaccag ctgttcgagg aaaaccccat caacgccagc 660
ggcgtggacg ccaaggccat cctgtctgcc agactgagca agagcagacg gctggaaaat 720
ctgatcgccc agctgcccgg cgagaagaag aatggcctgt tcggaaacct gattgccctg 780
agcctgggcc tgacccccaa cttcaagagc aacttcgacc tggccgagga tgccaaactg 840
cagctgagca aggacaccta cgacgacgac ctggacaacc tgctggccca gatcggcgac 900
cagtacgccg acctgtttct ggccgccaag aacctgtccg acgccatcct gctgagcgac 960
atcctgagag tgaacaccga gatcaccaag gcccccctga gcgcctctat gatcaagaga 1020
tacgacgagc accaccagga cctgaccctg ctgaaagctc tcgtgcggca gcagctgcct 1080
gagaagtaca aagagatttt cttcgaccag agcaagaacg gctacgccgg ctacattgac 1140
ggcggagcca gccaggaaga gttctacaag ttcatcaagc ccatcctgga aaagatggac 1200
ggcaccgagg aactgctcgt gaagctgaac agagaggacc tgctgcggaa gcagcggacc 1260
ttcgacaacg gcagcatccc ccaccagatc cacctgggag agctgcacgc cattctgcgg 1320
cggcaggaag atttttaccc attcctgaag gacaaccggg aaaagatcga gaagatcctg 1380
accttccgca tcccctacta cgtgggccct ctggccaggg gaaacagcag attcgcctgg 1440
atgaccagaa agagcgagga aaccatcacc ccctggaact tcgaggaagt ggtggacaag 1500
ggcgcttccg cccagagctt catcgagcgg atgaccaact tcgataagaa cctgcccaac 1560
gagaaggtgc tgcccaagca cagcctgctg tacgagtact tcaccgtgta taacgagctg 1620
accaaagtga aatacgtgac cgagggaatg agaaagcccg ccttcctgag cggcgagcag 1680
aaaaaggcca tcgtggacct gctgttcaag accaaccgga aagtgaccgt gaagcagctg 1740
aaagaggact acttcaagaa aatcgagtgc ttcgactccg tggaaatctc cggcgtggaa 1800
gatcggttca acgcctccct gggcacatac cacgatctgc tgaaaattat caaggacaag 1860
gacttcctgg acaatgagga aaacgaggac attctggaag atatcgtgct gaccctgaca 1920
ctgtttgagg acagagagat gatcgaggaa cggctgaaaa cctatgccca cctgttcgac 1980
gacaaagtga tgaagcagct gaagcggcgg agatacaccg gctggggcag gctgagccgg 2040
aagctgatca acggcatccg ggacaagcag tccggcaaga caatcctgga tttcctgaag 2100
tccgacggct tcgccaacag aaacttcatg cagctgatcc acgacgacag cctgaccttt 2160
aaagaggaca tccagaaagc ccaggtgtcc ggccagggcg atagcctgca cgagcacatt 2220
gccaatctgg ccggcagccc cgccattaag aagggcatcc tgcagacagt gaaggtggtg 2280
gacgagctcg tgaaagtgat gggccggcac aagcccgaga acatcgtgat cgaaatggcc 2340
agagagaacc agaccaccca gaagggacag aagaacagcc gcgagagaat gaagcggatc 2400
gaagagggca tcaaagagct gggcagccag atcctgaaag aacaccccgt ggaaaacacc 2460
cagctgcaga acgagaagct gtacctgtac tacctgcaga atgggcggga tatgtacgtg 2520
gaccaggaac tggacatcaa ccggctgtcc gactacgatg tggaccatat cgtgcctcag 2580
agctttctga aggacgactc catcgacaac aaggtgctga ccagaagcga caagaaccgg 2640
ggcaagagcg acaacgtgcc ctccgaagag gtcgtgaaga agatgaagaa ctactggcgg 2700
cagctgctga acgccaagct gattacccag agaaagttcg acaatctgac caaggccgag 2760
agaggcggcc tgagcgaact ggataaggcc ggcttcatca agagacagct ggtggaaacc 2820
cggcagatca caaagcacgt ggcacagatc ctggactccc ggatgaacac taagtacgac 2880
gagaatgaca agctgatccg ggaagtgaaa gtgatcaccc tgaagtccaa gctggtgtcc 2940
gatttccgga aggatttcca gttttacaaa gtgcgcgaga tcaacaacta ccaccacgcc 3000
cacgacgcct acctgaacgc cgtcgtggga accgccctga tcaaaaagta ccctaagctg 3060
gaaagcgagt tcgtgtacgg cgactacaag gtgtacgacg tgcggaagat gatcgccaag 3120
agcgagcagg aaatcggcaa ggctaccgcc aagtacttct tctacagcaa catcatgaac 3180
tttttcaaga ccgagattac cctggccaac ggcgagatcc ggaagcggcc tctgatcgag 3240
acaaacggcg aaaccgggga gatcgtgtgg gataagggcc gggattttgc caccgtgcgg 3300
aaagtgctga gcatgcccca agtgaatatc gtgaaaaaga ccgaggtgca gacaggcggc 3360
ttcagcaaag agtctatcct gcccaagagg aacagcgata agctgatcgc cagaaagaag 3420
gactgggacc ctaagaagta cggcggcttc gacagcccca ccgtggccta ttctgtgctg 3480
gtggtggcca aagtggaaaa gggcaagtcc aagaaactga agagtgtgaa agagctgctg 3540
gggatcacca tcatggaaag aagcagcttc gagaagaatc ccatcgactt tctggaagcc 3600
aagggctaca aagaagtgaa aaaggacctg atcatcaagc tgcctaagta ctccctgttc 3660
gagctggaaa acggccggaa gagaatgctg gcctctgccg gcgaactgca gaagggaaac 3720
gaactggccc tgccctccaa atatgtgaac ttcctgtacc tggccagcca ctatgagaag 3780
ctgaagggct cccccgagga taatgagcag aaacagctgt ttgtggaaca gcacaagcac 3840
tacctggacg agatcatcga gcagatcagc gagttctcca agagagtgat cctggccgac 3900
gctaatctgg acaaagtgct gtccgcctac aacaagcacc gggataagcc catcagagag 3960
caggccgaga atatcatcca cctgtttacc ctgaccaatc tgggagcccc tgccgccttc 4020
aagtactttg acaccaccat cgaccggaag aggtacacca gcaccaaaga ggtgctggac 4080
gccaccctga tccaccagag catcaccggc ctgtacgaga cacggatcga cctgtctcag 4140
ctgggaggcg acgatccaaa aaagaagaga aaggtaggcg gctctggcgg cggctccgga 4200
ggctcttccc cggaagatga gatccagcaa ctggaagaag aaatcgctca gctggaacag 4260
aaaaacgcag cgctgaaaga gaaaaaccag gcgctgaaat acggttaa 4308
<210> 3
<211> 4293
<212> DNA
<213> 人工序列
<220>
<223> Cas9-N5
<400> 3
atggccccaa agaagaagcg gaaggtcggt atccacggag tcccagcagc cgacaagaag 60
tacagcatcg gcctggacat cggcaccaac tctgtgggct gggccgtgat caccgacgag 120
tacaaggtgc ccagcaagaa attcaaggtg ctgggcaaca ccgaccggca cagcatcaag 180
aagaacctga tcggagccct gctgttcgac agcggcgaaa cagccgaggc cacccggctg 240
aagagaaccg ccagaagaag atacaccaga cggaagaacc ggatctgcta tctgcaagag 300
atcttcagca acgagatggc caaggtggac gacagcttct tccacagact ggaagagtcc 360
ttcctggtgg aagaggataa gaagcacgag cggcacccca tcttcggcaa catcgtggac 420
gaggtggcct accacgagaa gtaccccacc atctaccacc tgagaaagaa actggtggac 480
agcaccgaca aggccgacct gcggctgatc tatctggccc tggcccacat gatcaagttc 540
cggggccact tcctgatcga gggcgacctg aaccccgaca acagcgacgt ggacaagctg 600
ttcatccagc tggtgcagac ctacaaccag ctgttcgagg aaaaccccat caacgccagc 660
ggcgtggacg ccaaggccat cctgtctgcc agactgagca agagcagacg gctggaaaat 720
ctgatcgccc agctgcccgg cgagaagaag aatggcctgt tcggaaacct gattgccctg 780
agcctgggcc tgacccccaa cttcaagagc aacttcgacc tggccgagga tgccaaactg 840
cagctgagca aggacaccta cgacgacgac ctggacaacc tgctggccca gatcggcgac 900
cagtacgccg acctgtttct ggccgccaag aacctgtccg acgccatcct gctgagcgac 960
atcctgagag tgaacaccga gatcaccaag gcccccctga gcgcctctat gatcaagaga 1020
tacgacgagc accaccagga cctgaccctg ctgaaagctc tcgtgcggca gcagctgcct 1080
gagaagtaca aagagatttt cttcgaccag agcaagaacg gctacgccgg ctacattgac 1140
ggcggagcca gccaggaaga gttctacaag ttcatcaagc ccatcctgga aaagatggac 1200
ggcaccgagg aactgctcgt gaagctgaac agagaggacc tgctgcggaa gcagcggacc 1260
ttcgacaacg gcagcatccc ccaccagatc cacctgggag agctgcacgc cattctgcgg 1320
cggcaggaag atttttaccc attcctgaag gacaaccggg aaaagatcga gaagatcctg 1380
accttccgca tcccctacta cgtgggccct ctggccaggg gaaacagcag attcgcctgg 1440
atgaccagaa agagcgagga aaccatcacc ccctggaact tcgaggaagt ggtggacaag 1500
ggcgcttccg cccagagctt catcgagcgg atgaccaact tcgataagaa cctgcccaac 1560
gagaaggtgc tgcccaagca cagcctgctg tacgagtact tcaccgtgta taacgagctg 1620
accaaagtga aatacgtgac cgagggaatg agaaagcccg ccttcctgag cggcgagcag 1680
aaaaaggcca tcgtggacct gctgttcaag accaaccgga aagtgaccgt gaagcagctg 1740
aaagaggact acttcaagaa aatcgagtgc ttcgactccg tggaaatctc cggcgtggaa 1800
gatcggttca acgcctccct gggcacatac cacgatctgc tgaaaattat caaggacaag 1860
gacttcctgg acaatgagga aaacgaggac attctggaag atatcgtgct gaccctgaca 1920
ctgtttgagg acagagagat gatcgaggaa cggctgaaaa cctatgccca cctgttcgac 1980
gacaaagtga tgaagcagct gaagcggcgg agatacaccg gctggggcag gctgagccgg 2040
aagctgatca acggcatccg ggacaagcag tccggcaaga caatcctgga tttcctgaag 2100
tccgacggct tcgccaacag aaacttcatg cagctgatcc acgacgacag cctgaccttt 2160
aaagaggaca tccagaaagc ccaggtgtcc ggccagggcg atagcctgca cgagcacatt 2220
gccaatctgg ccggcagccc cgccattaag aagggcatcc tgcagacagt gaaggtggtg 2280
gacgagctcg tgaaagtgat gggccggcac aagcccgaga acatcgtgat cgaaatggcc 2340
agagagaacc agaccaccca gaagggacag aagaacagcc gcgagagaat gaagcggatc 2400
gaagagggca tcaaagagct gggcagccag atcctgaaag aacaccccgt ggaaaacacc 2460
cagctgcaga acgagaagct gtacctgtac tacctgcaga atgggcggga tatgtacgtg 2520
gaccaggaac tggacatcaa ccggctgtcc gactacgatg tggaccatat cgtgcctcag 2580
agctttctga aggacgactc catcgacaac aaggtgctga ccagaagcga caagaaccgg 2640
ggcaagagcg acaacgtgcc ctccgaagag gtcgtgaaga agatgaagaa ctactggcgg 2700
cagctgctga acgccaagct gattacccag agaaagttcg acaatctgac caaggccgag 2760
agaggcggcc tgagcgaact ggataaggcc ggcttcatca agagacagct ggtggaaacc 2820
cggcagatca caaagcacgt ggcacagatc ctggactccc ggatgaacac taagtacgac 2880
gagaatgaca agctgatccg ggaagtgaaa gtgatcaccc tgaagtccaa gctggtgtcc 2940
gatttccgga aggatttcca gttttacaaa gtgcgcgaga tcaacaacta ccaccacgcc 3000
cacgacgcct acctgaacgc cgtcgtggga accgccctga tcaaaaagta ccctaagctg 3060
gaaagcgagt tcgtgtacgg cgactacaag gtgtacgacg tgcggaagat gatcgccaag 3120
agcgagcagg aaatcggcaa ggctaccgcc aagtacttct tctacagcaa catcatgaac 3180
tttttcaaga ccgagattac cctggccaac ggcgagatcc ggaagcggcc tctgatcgag 3240
acaaacggcg aaaccgggga gatcgtgtgg gataagggcc gggattttgc caccgtgcgg 3300
aaagtgctga gcatgcccca agtgaatatc gtgaaaaaga ccgaggtgca gacaggcggc 3360
ttcagcaaag agtctatcct gcccaagagg aacagcgata agctgatcgc cagaaagaag 3420
gactgggacc ctaagaagta cggcggcttc gacagcccca ccgtggccta ttctgtgctg 3480
gtggtggcca aagtggaaaa gggcaagtcc aagaaactga agagtgtgaa agagctgctg 3540
gggatcacca tcatggaaag aagcagcttc gagaagaatc ccatcgactt tctggaagcc 3600
aagggctaca aagaagtgaa aaaggacctg atcatcaagc tgcctaagta ctccctgttc 3660
gagctggaaa acggccggaa gagaatgctg gcctctgccg gcgaactgca gaagggaaac 3720
gaactggccc tgccctccaa atatgtgaac ttcctgtacc tggccagcca ctatgagaag 3780
ctgaagggct cccccgagga taatgagcag aaacagctgt ttgtggaaca gcacaagcac 3840
tacctggacg agatcatcga gcagatcagc gagttctcca agagagtgat cctggccgac 3900
gctaatctgg acaaagtgct gtccgcctac aacaagcacc gggataagcc catcagagag 3960
caggccgaga atatcatcca cctgtttacc ctgaccaatc tgggagcccc tgccgccttc 4020
aagtactttg acaccaccat cgaccggaag aggtacacca gcaccaaaga ggtgctggac 4080
gccaccctga tccaccagag catcaccggc ctgtacgaga cacggatcga cctgtctcag 4140
ctgggaggcg acgatccaaa aaagaagaga aaggtaggcg gctctggcgg cggctccgga 4200
ggctctgaga tcgccgccct ggaggccaag atcgccgccc tgaaggccaa gaacgccgcc 4260
ctgaaggccg agatcgccgc cctggaggcc taa 4293
<210> 4
<211> 4293
<212> DNA
<213> 人工序列
<220>
<223> Cas9-N6
<400> 4
atggccccaa agaagaagcg gaaggtcggt atccacggag tcccagcagc cgacaagaag 60
tacagcatcg gcctggacat cggcaccaac tctgtgggct gggccgtgat caccgacgag 120
tacaaggtgc ccagcaagaa attcaaggtg ctgggcaaca ccgaccggca cagcatcaag 180
aagaacctga tcggagccct gctgttcgac agcggcgaaa cagccgaggc cacccggctg 240
aagagaaccg ccagaagaag atacaccaga cggaagaacc ggatctgcta tctgcaagag 300
atcttcagca acgagatggc caaggtggac gacagcttct tccacagact ggaagagtcc 360
ttcctggtgg aagaggataa gaagcacgag cggcacccca tcttcggcaa catcgtggac 420
gaggtggcct accacgagaa gtaccccacc atctaccacc tgagaaagaa actggtggac 480
agcaccgaca aggccgacct gcggctgatc tatctggccc tggcccacat gatcaagttc 540
cggggccact tcctgatcga gggcgacctg aaccccgaca acagcgacgt ggacaagctg 600
ttcatccagc tggtgcagac ctacaaccag ctgttcgagg aaaaccccat caacgccagc 660
ggcgtggacg ccaaggccat cctgtctgcc agactgagca agagcagacg gctggaaaat 720
ctgatcgccc agctgcccgg cgagaagaag aatggcctgt tcggaaacct gattgccctg 780
agcctgggcc tgacccccaa cttcaagagc aacttcgacc tggccgagga tgccaaactg 840
cagctgagca aggacaccta cgacgacgac ctggacaacc tgctggccca gatcggcgac 900
cagtacgccg acctgtttct ggccgccaag aacctgtccg acgccatcct gctgagcgac 960
atcctgagag tgaacaccga gatcaccaag gcccccctga gcgcctctat gatcaagaga 1020
tacgacgagc accaccagga cctgaccctg ctgaaagctc tcgtgcggca gcagctgcct 1080
gagaagtaca aagagatttt cttcgaccag agcaagaacg gctacgccgg ctacattgac 1140
ggcggagcca gccaggaaga gttctacaag ttcatcaagc ccatcctgga aaagatggac 1200
ggcaccgagg aactgctcgt gaagctgaac agagaggacc tgctgcggaa gcagcggacc 1260
ttcgacaacg gcagcatccc ccaccagatc cacctgggag agctgcacgc cattctgcgg 1320
cggcaggaag atttttaccc attcctgaag gacaaccggg aaaagatcga gaagatcctg 1380
accttccgca tcccctacta cgtgggccct ctggccaggg gaaacagcag attcgcctgg 1440
atgaccagaa agagcgagga aaccatcacc ccctggaact tcgaggaagt ggtggacaag 1500
ggcgcttccg cccagagctt catcgagcgg atgaccaact tcgataagaa cctgcccaac 1560
gagaaggtgc tgcccaagca cagcctgctg tacgagtact tcaccgtgta taacgagctg 1620
accaaagtga aatacgtgac cgagggaatg agaaagcccg ccttcctgag cggcgagcag 1680
aaaaaggcca tcgtggacct gctgttcaag accaaccgga aagtgaccgt gaagcagctg 1740
aaagaggact acttcaagaa aatcgagtgc ttcgactccg tggaaatctc cggcgtggaa 1800
gatcggttca acgcctccct gggcacatac cacgatctgc tgaaaattat caaggacaag 1860
gacttcctgg acaatgagga aaacgaggac attctggaag atatcgtgct gaccctgaca 1920
ctgtttgagg acagagagat gatcgaggaa cggctgaaaa cctatgccca cctgttcgac 1980
gacaaagtga tgaagcagct gaagcggcgg agatacaccg gctggggcag gctgagccgg 2040
aagctgatca acggcatccg ggacaagcag tccggcaaga caatcctgga tttcctgaag 2100
tccgacggct tcgccaacag aaacttcatg cagctgatcc acgacgacag cctgaccttt 2160
aaagaggaca tccagaaagc ccaggtgtcc ggccagggcg atagcctgca cgagcacatt 2220
gccaatctgg ccggcagccc cgccattaag aagggcatcc tgcagacagt gaaggtggtg 2280
gacgagctcg tgaaagtgat gggccggcac aagcccgaga acatcgtgat cgaaatggcc 2340
agagagaacc agaccaccca gaagggacag aagaacagcc gcgagagaat gaagcggatc 2400
gaagagggca tcaaagagct gggcagccag atcctgaaag aacaccccgt ggaaaacacc 2460
cagctgcaga acgagaagct gtacctgtac tacctgcaga atgggcggga tatgtacgtg 2520
gaccaggaac tggacatcaa ccggctgtcc gactacgatg tggaccatat cgtgcctcag 2580
agctttctga aggacgactc catcgacaac aaggtgctga ccagaagcga caagaaccgg 2640
ggcaagagcg acaacgtgcc ctccgaagag gtcgtgaaga agatgaagaa ctactggcgg 2700
cagctgctga acgccaagct gattacccag agaaagttcg acaatctgac caaggccgag 2760
agaggcggcc tgagcgaact ggataaggcc ggcttcatca agagacagct ggtggaaacc 2820
cggcagatca caaagcacgt ggcacagatc ctggactccc ggatgaacac taagtacgac 2880
gagaatgaca agctgatccg ggaagtgaaa gtgatcaccc tgaagtccaa gctggtgtcc 2940
gatttccgga aggatttcca gttttacaaa gtgcgcgaga tcaacaacta ccaccacgcc 3000
cacgacgcct acctgaacgc cgtcgtggga accgccctga tcaaaaagta ccctaagctg 3060
gaaagcgagt tcgtgtacgg cgactacaag gtgtacgacg tgcggaagat gatcgccaag 3120
agcgagcagg aaatcggcaa ggctaccgcc aagtacttct tctacagcaa catcatgaac 3180
tttttcaaga ccgagattac cctggccaac ggcgagatcc ggaagcggcc tctgatcgag 3240
acaaacggcg aaaccgggga gatcgtgtgg gataagggcc gggattttgc caccgtgcgg 3300
aaagtgctga gcatgcccca agtgaatatc gtgaaaaaga ccgaggtgca gacaggcggc 3360
ttcagcaaag agtctatcct gcccaagagg aacagcgata agctgatcgc cagaaagaag 3420
gactgggacc ctaagaagta cggcggcttc gacagcccca ccgtggccta ttctgtgctg 3480
gtggtggcca aagtggaaaa gggcaagtcc aagaaactga agagtgtgaa agagctgctg 3540
gggatcacca tcatggaaag aagcagcttc gagaagaatc ccatcgactt tctggaagcc 3600
aagggctaca aagaagtgaa aaaggacctg atcatcaagc tgcctaagta ctccctgttc 3660
gagctggaaa acggccggaa gagaatgctg gcctctgccg gcgaactgca gaagggaaac 3720
gaactggccc tgccctccaa atatgtgaac ttcctgtacc tggccagcca ctatgagaag 3780
ctgaagggct cccccgagga taatgagcag aaacagctgt ttgtggaaca gcacaagcac 3840
tacctggacg agatcatcga gcagatcagc gagttctcca agagagtgat cctggccgac 3900
gctaatctgg acaaagtgct gtccgcctac aacaagcacc gggataagcc catcagagag 3960
caggccgaga atatcatcca cctgtttacc ctgaccaatc tgggagcccc tgccgccttc 4020
aagtactttg acaccaccat cgaccggaag aggtacacca gcaccaaaga ggtgctggac 4080
gccaccctga tccaccagag catcaccggc ctgtacgaga cacggatcga cctgtctcag 4140
ctgggaggcg acgatccaaa aaagaagaga aaggtaggcg gctctggcgg cggctccgga 4200
ggctctaaga tcgccgccct gaaggccgag atcgccgccc tggaggccga gaacgccgcc 4260
ctggaggcca agatcgccgc cctgaaggcc taa 4293
<210> 5
<211> 4305
<212> DNA
<213> 人工序列
<220>
<223> Cas9-P3S
<400> 5
atggccccaa agaagaagcg gaaggtcggt atccacggag tcccagcagc cgacaagaag 60
tacagcatcg gcctggacat cggcaccaac tctgtgggct gggccgtgat caccgacgag 120
tacaaggtgc ccagcaagaa attcaaggtg ctgggcaaca ccgaccggca cagcatcaag 180
aagaacctga tcggagccct gctgttcgac agcggcgaaa cagccgaggc cacccggctg 240
aagagaaccg ccagaagaag atacaccaga cggaagaacc ggatctgcta tctgcaagag 300
atcttcagca acgagatggc caaggtggac gacagcttct tccacagact ggaagagtcc 360
ttcctggtgg aagaggataa gaagcacgag cggcacccca tcttcggcaa catcgtggac 420
gaggtggcct accacgagaa gtaccccacc atctaccacc tgagaaagaa actggtggac 480
agcaccgaca aggccgacct gcggctgatc tatctggccc tggcccacat gatcaagttc 540
cggggccact tcctgatcga gggcgacctg aaccccgaca acagcgacgt ggacaagctg 600
ttcatccagc tggtgcagac ctacaaccag ctgttcgagg aaaaccccat caacgccagc 660
ggcgtggacg ccaaggccat cctgtctgcc agactgagca agagcagacg gctggaaaat 720
ctgatcgccc agctgcccgg cgagaagaag aatggcctgt tcggaaacct gattgccctg 780
agcctgggcc tgacccccaa cttcaagagc aacttcgacc tggccgagga tgccaaactg 840
cagctgagca aggacaccta cgacgacgac ctggacaacc tgctggccca gatcggcgac 900
cagtacgccg acctgtttct ggccgccaag aacctgtccg acgccatcct gctgagcgac 960
atcctgagag tgaacaccga gatcaccaag gcccccctga gcgcctctat gatcaagaga 1020
tacgacgagc accaccagga cctgaccctg ctgaaagctc tcgtgcggca gcagctgcct 1080
gagaagtaca aagagatttt cttcgaccag agcaagaacg gctacgccgg ctacattgac 1140
ggcggagcca gccaggaaga gttctacaag ttcatcaagc ccatcctgga aaagatggac 1200
ggcaccgagg aactgctcgt gaagctgaac agagaggacc tgctgcggaa gcagcggacc 1260
ttcgacaacg gcagcatccc ccaccagatc cacctgggag agctgcacgc cattctgcgg 1320
cggcaggaag atttttaccc attcctgaag gacaaccggg aaaagatcga gaagatcctg 1380
accttccgca tcccctacta cgtgggccct ctggccaggg gaaacagcag attcgcctgg 1440
atgaccagaa agagcgagga aaccatcacc ccctggaact tcgaggaagt ggtggacaag 1500
ggcgcttccg cccagagctt catcgagcgg atgaccaact tcgataagaa cctgcccaac 1560
gagaaggtgc tgcccaagca cagcctgctg tacgagtact tcaccgtgta taacgagctg 1620
accaaagtga aatacgtgac cgagggaatg agaaagcccg ccttcctgag cggcgagcag 1680
aaaaaggcca tcgtggacct gctgttcaag accaaccgga aagtgaccgt gaagcagctg 1740
aaagaggact acttcaagaa aatcgagtgc ttcgactccg tggaaatctc cggcgtggaa 1800
gatcggttca acgcctccct gggcacatac cacgatctgc tgaaaattat caaggacaag 1860
gacttcctgg acaatgagga aaacgaggac attctggaag atatcgtgct gaccctgaca 1920
ctgtttgagg acagagagat gatcgaggaa cggctgaaaa cctatgccca cctgttcgac 1980
gacaaagtga tgaagcagct gaagcggcgg agatacaccg gctggggcag gctgagccgg 2040
aagctgatca acggcatccg ggacaagcag tccggcaaga caatcctgga tttcctgaag 2100
tccgacggct tcgccaacag aaacttcatg cagctgatcc acgacgacag cctgaccttt 2160
aaagaggaca tccagaaagc ccaggtgtcc ggccagggcg atagcctgca cgagcacatt 2220
gccaatctgg ccggcagccc cgccattaag aagggcatcc tgcagacagt gaaggtggtg 2280
gacgagctcg tgaaagtgat gggccggcac aagcccgaga acatcgtgat cgaaatggcc 2340
agagagaacc agaccaccca gaagggacag aagaacagcc gcgagagaat gaagcggatc 2400
gaagagggca tcaaagagct gggcagccag atcctgaaag aacaccccgt ggaaaacacc 2460
cagctgcaga acgagaagct gtacctgtac tacctgcaga atgggcggga tatgtacgtg 2520
gaccaggaac tggacatcaa ccggctgtcc gactacgatg tggaccatat cgtgcctcag 2580
agctttctga aggacgactc catcgacaac aaggtgctga ccagaagcga caagaaccgg 2640
ggcaagagcg acaacgtgcc ctccgaagag gtcgtgaaga agatgaagaa ctactggcgg 2700
cagctgctga acgccaagct gattacccag agaaagttcg acaatctgac caaggccgag 2760
agaggcggcc tgagcgaact ggataaggcc ggcttcatca agagacagct ggtggaaacc 2820
cggcagatca caaagcacgt ggcacagatc ctggactccc ggatgaacac taagtacgac 2880
gagaatgaca agctgatccg ggaagtgaaa gtgatcaccc tgaagtccaa gctggtgtcc 2940
gatttccgga aggatttcca gttttacaaa gtgcgcgaga tcaacaacta ccaccacgcc 3000
cacgacgcct acctgaacgc cgtcgtggga accgccctga tcaaaaagta ccctaagctg 3060
gaaagcgagt tcgtgtacgg cgactacaag gtgtacgacg tgcggaagat gatcgccaag 3120
agcgagcagg aaatcggcaa ggctaccgcc aagtacttct tctacagcaa catcatgaac 3180
tttttcaaga ccgagattac cctggccaac ggcgagatcc ggaagcggcc tctgatcgag 3240
acaaacggcg aaaccgggga gatcgtgtgg gataagggcc gggattttgc caccgtgcgg 3300
aaagtgctga gcatgcccca agtgaatatc gtgaaaaaga ccgaggtgca gacaggcggc 3360
ttcagcaaag agtctatcct gcccaagagg aacagcgata agctgatcgc cagaaagaag 3420
gactgggacc ctaagaagta cggcggcttc gacagcccca ccgtggccta ttctgtgctg 3480
gtggtggcca aagtggaaaa gggcaagtcc aagaaactga agagtgtgaa agagctgctg 3540
gggatcacca tcatggaaag aagcagcttc gagaagaatc ccatcgactt tctggaagcc 3600
aagggctaca aagaagtgaa aaaggacctg atcatcaagc tgcctaagta ctccctgttc 3660
gagctggaaa acggccggaa gagaatgctg gcctctgccg gcgaactgca gaagggaaac 3720
gaactggccc tgccctccaa atatgtgaac ttcctgtacc tggccagcca ctatgagaag 3780
ctgaagggct cccccgagga taatgagcag aaacagctgt ttgtggaaca gcacaagcac 3840
tacctggacg agatcatcga gcagatcagc gagttctcca agagagtgat cctggccgac 3900
gctaatctgg acaaagtgct gtccgcctac aacaagcacc gggataagcc catcagagag 3960
caggccgaga atatcatcca cctgtttacc ctgaccaatc tgggagcccc tgccgccttc 4020
aagtactttg acaccaccat cgaccggaag aggtacacca gcaccaaaga ggtgctggac 4080
gccaccctga tccaccagag catcaccggc ctgtacgaga cacggatcga cctgtctcag 4140
ctgggaggcg acgatccaaa aaagaagaga aaggtaggcg gctctggcgg cggctccgga 4200
ggctctagcc ccgaggacga gatccagcag ctggaggagg agatcagcca gctggagcag 4260
aagaacagcc agctgaagga gaagaaccag cagctgaagt actaa 4305
<210> 6
<211> 4305
<212> DNA
<213> 人工序列
<220>
<223> Cas9-P4S
<400> 6
atggccccaa agaagaagcg gaaggtcggt atccacggag tcccagcagc cgacaagaag 60
tacagcatcg gcctggacat cggcaccaac tctgtgggct gggccgtgat caccgacgag 120
tacaaggtgc ccagcaagaa attcaaggtg ctgggcaaca ccgaccggca cagcatcaag 180
aagaacctga tcggagccct gctgttcgac agcggcgaaa cagccgaggc cacccggctg 240
aagagaaccg ccagaagaag atacaccaga cggaagaacc ggatctgcta tctgcaagag 300
atcttcagca acgagatggc caaggtggac gacagcttct tccacagact ggaagagtcc 360
ttcctggtgg aagaggataa gaagcacgag cggcacccca tcttcggcaa catcgtggac 420
gaggtggcct accacgagaa gtaccccacc atctaccacc tgagaaagaa actggtggac 480
agcaccgaca aggccgacct gcggctgatc tatctggccc tggcccacat gatcaagttc 540
cggggccact tcctgatcga gggcgacctg aaccccgaca acagcgacgt ggacaagctg 600
ttcatccagc tggtgcagac ctacaaccag ctgttcgagg aaaaccccat caacgccagc 660
ggcgtggacg ccaaggccat cctgtctgcc agactgagca agagcagacg gctggaaaat 720
ctgatcgccc agctgcccgg cgagaagaag aatggcctgt tcggaaacct gattgccctg 780
agcctgggcc tgacccccaa cttcaagagc aacttcgacc tggccgagga tgccaaactg 840
cagctgagca aggacaccta cgacgacgac ctggacaacc tgctggccca gatcggcgac 900
cagtacgccg acctgtttct ggccgccaag aacctgtccg acgccatcct gctgagcgac 960
atcctgagag tgaacaccga gatcaccaag gcccccctga gcgcctctat gatcaagaga 1020
tacgacgagc accaccagga cctgaccctg ctgaaagctc tcgtgcggca gcagctgcct 1080
gagaagtaca aagagatttt cttcgaccag agcaagaacg gctacgccgg ctacattgac 1140
ggcggagcca gccaggaaga gttctacaag ttcatcaagc ccatcctgga aaagatggac 1200
ggcaccgagg aactgctcgt gaagctgaac agagaggacc tgctgcggaa gcagcggacc 1260
ttcgacaacg gcagcatccc ccaccagatc cacctgggag agctgcacgc cattctgcgg 1320
cggcaggaag atttttaccc attcctgaag gacaaccggg aaaagatcga gaagatcctg 1380
accttccgca tcccctacta cgtgggccct ctggccaggg gaaacagcag attcgcctgg 1440
atgaccagaa agagcgagga aaccatcacc ccctggaact tcgaggaagt ggtggacaag 1500
ggcgcttccg cccagagctt catcgagcgg atgaccaact tcgataagaa cctgcccaac 1560
gagaaggtgc tgcccaagca cagcctgctg tacgagtact tcaccgtgta taacgagctg 1620
accaaagtga aatacgtgac cgagggaatg agaaagcccg ccttcctgag cggcgagcag 1680
aaaaaggcca tcgtggacct gctgttcaag accaaccgga aagtgaccgt gaagcagctg 1740
aaagaggact acttcaagaa aatcgagtgc ttcgactccg tggaaatctc cggcgtggaa 1800
gatcggttca acgcctccct gggcacatac cacgatctgc tgaaaattat caaggacaag 1860
gacttcctgg acaatgagga aaacgaggac attctggaag atatcgtgct gaccctgaca 1920
ctgtttgagg acagagagat gatcgaggaa cggctgaaaa cctatgccca cctgttcgac 1980
gacaaagtga tgaagcagct gaagcggcgg agatacaccg gctggggcag gctgagccgg 2040
aagctgatca acggcatccg ggacaagcag tccggcaaga caatcctgga tttcctgaag 2100
tccgacggct tcgccaacag aaacttcatg cagctgatcc acgacgacag cctgaccttt 2160
aaagaggaca tccagaaagc ccaggtgtcc ggccagggcg atagcctgca cgagcacatt 2220
gccaatctgg ccggcagccc cgccattaag aagggcatcc tgcagacagt gaaggtggtg 2280
gacgagctcg tgaaagtgat gggccggcac aagcccgaga acatcgtgat cgaaatggcc 2340
agagagaacc agaccaccca gaagggacag aagaacagcc gcgagagaat gaagcggatc 2400
gaagagggca tcaaagagct gggcagccag atcctgaaag aacaccccgt ggaaaacacc 2460
cagctgcaga acgagaagct gtacctgtac tacctgcaga atgggcggga tatgtacgtg 2520
gaccaggaac tggacatcaa ccggctgtcc gactacgatg tggaccatat cgtgcctcag 2580
agctttctga aggacgactc catcgacaac aaggtgctga ccagaagcga caagaaccgg 2640
ggcaagagcg acaacgtgcc ctccgaagag gtcgtgaaga agatgaagaa ctactggcgg 2700
cagctgctga acgccaagct gattacccag agaaagttcg acaatctgac caaggccgag 2760
agaggcggcc tgagcgaact ggataaggcc ggcttcatca agagacagct ggtggaaacc 2820
cggcagatca caaagcacgt ggcacagatc ctggactccc ggatgaacac taagtacgac 2880
gagaatgaca agctgatccg ggaagtgaaa gtgatcaccc tgaagtccaa gctggtgtcc 2940
gatttccgga aggatttcca gttttacaaa gtgcgcgaga tcaacaacta ccaccacgcc 3000
cacgacgcct acctgaacgc cgtcgtggga accgccctga tcaaaaagta ccctaagctg 3060
gaaagcgagt tcgtgtacgg cgactacaag gtgtacgacg tgcggaagat gatcgccaag 3120
agcgagcagg aaatcggcaa ggctaccgcc aagtacttct tctacagcaa catcatgaac 3180
tttttcaaga ccgagattac cctggccaac ggcgagatcc ggaagcggcc tctgatcgag 3240
acaaacggcg aaaccgggga gatcgtgtgg gataagggcc gggattttgc caccgtgcgg 3300
aaagtgctga gcatgcccca agtgaatatc gtgaaaaaga ccgaggtgca gacaggcggc 3360
ttcagcaaag agtctatcct gcccaagagg aacagcgata agctgatcgc cagaaagaag 3420
gactgggacc ctaagaagta cggcggcttc gacagcccca ccgtggccta ttctgtgctg 3480
gtggtggcca aagtggaaaa gggcaagtcc aagaaactga agagtgtgaa agagctgctg 3540
gggatcacca tcatggaaag aagcagcttc gagaagaatc ccatcgactt tctggaagcc 3600
aagggctaca aagaagtgaa aaaggacctg atcatcaagc tgcctaagta ctccctgttc 3660
gagctggaaa acggccggaa gagaatgctg gcctctgccg gcgaactgca gaagggaaac 3720
gaactggccc tgccctccaa atatgtgaac ttcctgtacc tggccagcca ctatgagaag 3780
ctgaagggct cccccgagga taatgagcag aaacagctgt ttgtggaaca gcacaagcac 3840
tacctggacg agatcatcga gcagatcagc gagttctcca agagagtgat cctggccgac 3900
gctaatctgg acaaagtgct gtccgcctac aacaagcacc gggataagcc catcagagag 3960
caggccgaga atatcatcca cctgtttacc ctgaccaatc tgggagcccc tgccgccttc 4020
aagtactttg acaccaccat cgaccggaag aggtacacca gcaccaaaga ggtgctggac 4080
gccaccctga tccaccagag catcaccggc ctgtacgaga cacggatcga cctgtctcag 4140
ctgggaggcg acgatccaaa aaagaagaga aaggtaggcg gctctggcgg cggctccgga 4200
ggctctagcc ccgaggacaa gatcagccag ctgaagcaga agatccagca gctgaagcag 4260
gagaaccagc agctggagga ggagaacagc cagctggagt actaa 4305
<210> 7
<211> 4305
<212> DNA
<213> 人工序列
<220>
<223> Cas9-AP4
<400> 7
atggccccaa agaagaagcg gaaggtcggt atccacggag tcccagcagc cgacaagaag 60
tacagcatcg gcctggacat cggcaccaac tctgtgggct gggccgtgat caccgacgag 120
tacaaggtgc ccagcaagaa attcaaggtg ctgggcaaca ccgaccggca cagcatcaag 180
aagaacctga tcggagccct gctgttcgac agcggcgaaa cagccgaggc cacccggctg 240
aagagaaccg ccagaagaag atacaccaga cggaagaacc ggatctgcta tctgcaagag 300
atcttcagca acgagatggc caaggtggac gacagcttct tccacagact ggaagagtcc 360
ttcctggtgg aagaggataa gaagcacgag cggcacccca tcttcggcaa catcgtggac 420
gaggtggcct accacgagaa gtaccccacc atctaccacc tgagaaagaa actggtggac 480
agcaccgaca aggccgacct gcggctgatc tatctggccc tggcccacat gatcaagttc 540
cggggccact tcctgatcga gggcgacctg aaccccgaca acagcgacgt ggacaagctg 600
ttcatccagc tggtgcagac ctacaaccag ctgttcgagg aaaaccccat caacgccagc 660
ggcgtggacg ccaaggccat cctgtctgcc agactgagca agagcagacg gctggaaaat 720
ctgatcgccc agctgcccgg cgagaagaag aatggcctgt tcggaaacct gattgccctg 780
agcctgggcc tgacccccaa cttcaagagc aacttcgacc tggccgagga tgccaaactg 840
cagctgagca aggacaccta cgacgacgac ctggacaacc tgctggccca gatcggcgac 900
cagtacgccg acctgtttct ggccgccaag aacctgtccg acgccatcct gctgagcgac 960
atcctgagag tgaacaccga gatcaccaag gcccccctga gcgcctctat gatcaagaga 1020
tacgacgagc accaccagga cctgaccctg ctgaaagctc tcgtgcggca gcagctgcct 1080
gagaagtaca aagagatttt cttcgaccag agcaagaacg gctacgccgg ctacattgac 1140
ggcggagcca gccaggaaga gttctacaag ttcatcaagc ccatcctgga aaagatggac 1200
ggcaccgagg aactgctcgt gaagctgaac agagaggacc tgctgcggaa gcagcggacc 1260
ttcgacaacg gcagcatccc ccaccagatc cacctgggag agctgcacgc cattctgcgg 1320
cggcaggaag atttttaccc attcctgaag gacaaccggg aaaagatcga gaagatcctg 1380
accttccgca tcccctacta cgtgggccct ctggccaggg gaaacagcag attcgcctgg 1440
atgaccagaa agagcgagga aaccatcacc ccctggaact tcgaggaagt ggtggacaag 1500
ggcgcttccg cccagagctt catcgagcgg atgaccaact tcgataagaa cctgcccaac 1560
gagaaggtgc tgcccaagca cagcctgctg tacgagtact tcaccgtgta taacgagctg 1620
accaaagtga aatacgtgac cgagggaatg agaaagcccg ccttcctgag cggcgagcag 1680
aaaaaggcca tcgtggacct gctgttcaag accaaccgga aagtgaccgt gaagcagctg 1740
aaagaggact acttcaagaa aatcgagtgc ttcgactccg tggaaatctc cggcgtggaa 1800
gatcggttca acgcctccct gggcacatac cacgatctgc tgaaaattat caaggacaag 1860
gacttcctgg acaatgagga aaacgaggac attctggaag atatcgtgct gaccctgaca 1920
ctgtttgagg acagagagat gatcgaggaa cggctgaaaa cctatgccca cctgttcgac 1980
gacaaagtga tgaagcagct gaagcggcgg agatacaccg gctggggcag gctgagccgg 2040
aagctgatca acggcatccg ggacaagcag tccggcaaga caatcctgga tttcctgaag 2100
tccgacggct tcgccaacag aaacttcatg cagctgatcc acgacgacag cctgaccttt 2160
aaagaggaca tccagaaagc ccaggtgtcc ggccagggcg atagcctgca cgagcacatt 2220
gccaatctgg ccggcagccc cgccattaag aagggcatcc tgcagacagt gaaggtggtg 2280
gacgagctcg tgaaagtgat gggccggcac aagcccgaga acatcgtgat cgaaatggcc 2340
agagagaacc agaccaccca gaagggacag aagaacagcc gcgagagaat gaagcggatc 2400
gaagagggca tcaaagagct gggcagccag atcctgaaag aacaccccgt ggaaaacacc 2460
cagctgcaga acgagaagct gtacctgtac tacctgcaga atgggcggga tatgtacgtg 2520
gaccaggaac tggacatcaa ccggctgtcc gactacgatg tggaccatat cgtgcctcag 2580
agctttctga aggacgactc catcgacaac aaggtgctga ccagaagcga caagaaccgg 2640
ggcaagagcg acaacgtgcc ctccgaagag gtcgtgaaga agatgaagaa ctactggcgg 2700
cagctgctga acgccaagct gattacccag agaaagttcg acaatctgac caaggccgag 2760
agaggcggcc tgagcgaact ggataaggcc ggcttcatca agagacagct ggtggaaacc 2820
cggcagatca caaagcacgt ggcacagatc ctggactccc ggatgaacac taagtacgac 2880
gagaatgaca agctgatccg ggaagtgaaa gtgatcaccc tgaagtccaa gctggtgtcc 2940
gatttccgga aggatttcca gttttacaaa gtgcgcgaga tcaacaacta ccaccacgcc 3000
cacgacgcct acctgaacgc cgtcgtggga accgccctga tcaaaaagta ccctaagctg 3060
gaaagcgagt tcgtgtacgg cgactacaag gtgtacgacg tgcggaagat gatcgccaag 3120
agcgagcagg aaatcggcaa ggctaccgcc aagtacttct tctacagcaa catcatgaac 3180
tttttcaaga ccgagattac cctggccaac ggcgagatcc ggaagcggcc tctgatcgag 3240
acaaacggcg aaaccgggga gatcgtgtgg gataagggcc gggattttgc caccgtgcgg 3300
aaagtgctga gcatgcccca agtgaatatc gtgaaaaaga ccgaggtgca gacaggcggc 3360
ttcagcaaag agtctatcct gcccaagagg aacagcgata agctgatcgc cagaaagaag 3420
gactgggacc ctaagaagta cggcggcttc gacagcccca ccgtggccta ttctgtgctg 3480
gtggtggcca aagtggaaaa gggcaagtcc aagaaactga agagtgtgaa agagctgctg 3540
gggatcacca tcatggaaag aagcagcttc gagaagaatc ccatcgactt tctggaagcc 3600
aagggctaca aagaagtgaa aaaggacctg atcatcaagc tgcctaagta ctccctgttc 3660
gagctggaaa acggccggaa gagaatgctg gcctctgccg gcgaactgca gaagggaaac 3720
gaactggccc tgccctccaa atatgtgaac ttcctgtacc tggccagcca ctatgagaag 3780
ctgaagggct cccccgagga taatgagcag aaacagctgt ttgtggaaca gcacaagcac 3840
tacctggacg agatcatcga gcagatcagc gagttctcca agagagtgat cctggccgac 3900
gctaatctgg acaaagtgct gtccgcctac aacaagcacc gggataagcc catcagagag 3960
caggccgaga atatcatcca cctgtttacc ctgaccaatc tgggagcccc tgccgccttc 4020
aagtactttg acaccaccat cgaccggaag aggtacacca gcaccaaaga ggtgctggac 4080
gccaccctga tccaccagag catcaccggc ctgtacgaga cacggatcga cctgtctcag 4140
ctgggaggcg acgatccaaa aaagaagaga aaggtaggcg gctctggcgg cggctccgga 4200
ggctctagcc ccgaggacga gctggccgcc aacgaggagg agctgcagca gaacgagcag 4260
aagctggccc agatcaagca gaagctgcag gccatcaagt actaa 4305
<210> 8
<211> 957
<212> DNA
<213> 人工序列
<220>
<223> P4-EXOIII
<400> 8
agcccggaag ataaaattgc tcagctgaaa caaaaaatcc aagcgctgaa acaggaaaac 60
cagcagctgg aagaggaaaa cgccgcactg gaatatggtg gcggctctgg cggcggctcc 120
ggaggctctg atccaaaaaa gaagagaaag gtaaaatttg tctcttttaa tatcaacggc 180
ctgcgcgcca gacctcacca gcttgaagcc atcgtcgaaa agcaccaacc ggatgtgatt 240
ggcctgcagg agacaaaagt tcatgacgat atgtttccgc tcgaagaggt ggcgaagctc 300
ggctacaacg tgttttatca cgggcagaaa ggccattatg gcgtggcgct gctgaccaaa 360
gagacgccga ttgccgtgcg tcgcggcttt cccggtgacg acgaagaggc gcagcggcgg 420
attattatgg cggaaatccc ctcactgctg ggtaatgtca ccgtgatcaa cggttacttc 480
ccgcagggtg aaagccgcga ccatccgata aaattcccgg caaaagcgca gttttatcag 540
aatctgcaaa actacctgga aaccgaactc aaacgtgata atccggtact gattatgggc 600
gatatgaata tcagccctac agatctggac atcggcattg gcgaagaaaa ccgtaagcgc 660
tggctgcgta ccggtaaatg ctctttcctg ccggaagagc gcgaatggat ggacaggctg 720
atgagctggg ggttggtcga taccttccgc catgcgaatc cgcaaacagc agatcgtttc 780
tcatggtttg attaccgctc aaaaggtttt gacgataacc gtggtctgcg catcgacctg 840
ctgctcgcca gccaaccgct ggcagaatgt tgcgtagaaa ccggcatcga ctatgaaatc 900
cgcagcatgg aaaaaccgtc cgatcacgcc cccgtctggg cgaccttccg ccgctaa 957
<210> 9
<211> 957
<212> DNA
<213> 人工序列
<220>
<223> P3-EXOIII
<400> 9
tccccggaag atgagatcca gcaactggaa gaagaaatcg ctcagctgga acagaaaaac 60
gcagcgctga aagagaaaaa ccaggcgctg aaatacggtg gcggctctgg cggcggctcc 120
ggaggctctg atccaaaaaa gaagagaaag gtaaaatttg tctcttttaa tatcaacggc 180
ctgcgcgcca gacctcacca gcttgaagcc atcgtcgaaa agcaccaacc ggatgtgatt 240
ggcctgcagg agacaaaagt tcatgacgat atgtttccgc tcgaagaggt ggcgaagctc 300
ggctacaacg tgttttatca cgggcagaaa ggccattatg gcgtggcgct gctgaccaaa 360
gagacgccga ttgccgtgcg tcgcggcttt cccggtgacg acgaagaggc gcagcggcgg 420
attattatgg cggaaatccc ctcactgctg ggtaatgtca ccgtgatcaa cggttacttc 480
ccgcagggtg aaagccgcga ccatccgata aaattcccgg caaaagcgca gttttatcag 540
aatctgcaaa actacctgga aaccgaactc aaacgtgata atccggtact gattatgggc 600
gatatgaata tcagccctac agatctggac atcggcattg gcgaagaaaa ccgtaagcgc 660
tggctgcgta ccggtaaatg ctctttcctg ccggaagagc gcgaatggat ggacaggctg 720
atgagctggg ggttggtcga taccttccgc catgcgaatc cgcaaacagc agatcgtttc 780
tcatggtttg attaccgctc aaaaggtttt gacgataacc gtggtctgcg catcgacctg 840
ctgctcgcca gccaaccgct ggcagaatgt tgcgtagaaa ccggcatcga ctatgaaatc 900
cgcagcatgg aaaaaccgtc cgatcacgcc cccgtctggg cgaccttccg ccgctaa 957
<210> 10
<211> 939
<212> DNA
<213> 人工序列
<220>
<223> N5-EXOIII
<400> 10
gagatcgccg ccctggaggc caagatcgcc gccctgaagg ccaagaacgc cgccctgaag 60
gccgagatcg ccgccctgga ggccggcggc tctggcggcg gctccggagg ctctgatcca 120
aaaaagaaga gaaaggtaaa atttgtctct tttaatatca acggcctgcg cgccagacct 180
caccagcttg aagccatcgt cgaaaagcac caaccggatg tgattggcct gcaggagaca 240
aaagttcatg acgatatgtt tccgctcgaa gaggtggcga agctcggcta caacgtgttt 300
tatcacgggc agaaaggcca ttatggcgtg gcgctgctga ccaaagagac gccgattgcc 360
gtgcgtcgcg gctttcccgg tgacgacgaa gaggcgcagc ggcggattat tatggcggaa 420
atcccctcac tgctgggtaa tgtcaccgtg atcaacggtt acttcccgca gggtgaaagc 480
cgcgaccatc cgataaaatt cccggcaaaa gcgcagtttt atcagaatct gcaaaactac 540
ctggaaaccg aactcaaacg tgataatccg gtactgatta tgggcgatat gaatatcagc 600
cctacagatc tggacatcgg cattggcgaa gaaaaccgta agcgctggct gcgtaccggt 660
aaatgctctt tcctgccgga agagcgcgaa tggatggaca ggctgatgag ctgggggttg 720
gtcgatacct tccgccatgc gaatccgcaa acagcagatc gtttctcatg gtttgattac 780
cgctcaaaag gttttgacga taaccgtggt ctgcgcatcg acctgctgct cgccagccaa 840
ccgctggcag aatgttgcgt agaaaccggc atcgactatg aaatccgcag catggaaaaa 900
ccgtccgatc acgcccccgt ctgggcgacc ttccgccgc 939
<210> 11
<211> 939
<212> DNA
<213> 人工序列
<220>
<223> N6-EXOIII
<400> 11
aagatcgccg ccctgaaggc cgagatcgcc gccctggagg ccgagaacgc cgccctggag 60
gccaagatcg ccgccctgaa ggccggcggc tctggcggcg gctccggagg ctctgatcca 120
aaaaagaaga gaaaggtaaa atttgtctct tttaatatca acggcctgcg cgccagacct 180
caccagcttg aagccatcgt cgaaaagcac caaccggatg tgattggcct gcaggagaca 240
aaagttcatg acgatatgtt tccgctcgaa gaggtggcga agctcggcta caacgtgttt 300
tatcacgggc agaaaggcca ttatggcgtg gcgctgctga ccaaagagac gccgattgcc 360
gtgcgtcgcg gctttcccgg tgacgacgaa gaggcgcagc ggcggattat tatggcggaa 420
atcccctcac tgctgggtaa tgtcaccgtg atcaacggtt acttcccgca gggtgaaagc 480
cgcgaccatc cgataaaatt cccggcaaaa gcgcagtttt atcagaatct gcaaaactac 540
ctggaaaccg aactcaaacg tgataatccg gtactgatta tgggcgatat gaatatcagc 600
cctacagatc tggacatcgg cattggcgaa gaaaaccgta agcgctggct gcgtaccggt 660
aaatgctctt tcctgccgga agagcgcgaa tggatggaca ggctgatgag ctgggggttg 720
gtcgatacct tccgccatgc gaatccgcaa acagcagatc gtttctcatg gtttgattac 780
cgctcaaaag gttttgacga taaccgtggt ctgcgcatcg acctgctgct cgccagccaa 840
ccgctggcag aatgttgcgt agaaaccggc atcgactatg aaatccgcag catggaaaaa 900
ccgtccgatc acgcccccgt ctgggcgacc ttccgccgc 939
<210> 12
<211> 951
<212> DNA
<213> 人工序列
<220>
<223> P3S-EXOIII
<400> 12
agccccgagg acgagatcca gcagctggag gaggagatca gccagctgga gcagaagaac 60
agccagctga aggagaagaa ccagcagctg aagtacggcg gctctggcgg cggctccgga 120
ggctctgatc caaaaaagaa gagaaaggta aaatttgtct cttttaatat caacggcctg 180
cgcgccagac ctcaccagct tgaagccatc gtcgaaaagc accaaccgga tgtgattggc 240
ctgcaggaga caaaagttca tgacgatatg tttccgctcg aagaggtggc gaagctcggc 300
tacaacgtgt tttatcacgg gcagaaaggc cattatggcg tggcgctgct gaccaaagag 360
acgccgattg ccgtgcgtcg cggctttccc ggtgacgacg aagaggcgca gcggcggatt 420
attatggcgg aaatcccctc actgctgggt aatgtcaccg tgatcaacgg ttacttcccg 480
cagggtgaaa gccgcgacca tccgataaaa ttcccggcaa aagcgcagtt ttatcagaat 540
ctgcaaaact acctggaaac cgaactcaaa cgtgataatc cggtactgat tatgggcgat 600
atgaatatca gccctacaga tctggacatc ggcattggcg aagaaaaccg taagcgctgg 660
ctgcgtaccg gtaaatgctc tttcctgccg gaagagcgcg aatggatgga caggctgatg 720
agctgggggt tggtcgatac cttccgccat gcgaatccgc aaacagcaga tcgtttctca 780
tggtttgatt accgctcaaa aggttttgac gataaccgtg gtctgcgcat cgacctgctg 840
ctcgccagcc aaccgctggc agaatgttgc gtagaaaccg gcatcgacta tgaaatccgc 900
agcatggaaa aaccgtccga tcacgccccc gtctgggcga ccttccgccg c 951
<210> 13
<211> 951
<212> DNA
<213> 人工序列
<220>
<223> P4S-EXOIII
<400> 13
agccccgagg acaagatcag ccagctgaag cagaagatcc agcagctgaa gcaggagaac 60
cagcagctgg aggaggagaa cagccagctg gagtacggcg gctctggcgg cggctccgga 120
ggctctgatc caaaaaagaa gagaaaggta aaatttgtct cttttaatat caacggcctg 180
cgcgccagac ctcaccagct tgaagccatc gtcgaaaagc accaaccgga tgtgattggc 240
ctgcaggaga caaaagttca tgacgatatg tttccgctcg aagaggtggc gaagctcggc 300
tacaacgtgt tttatcacgg gcagaaaggc cattatggcg tggcgctgct gaccaaagag 360
acgccgattg ccgtgcgtcg cggctttccc ggtgacgacg aagaggcgca gcggcggatt 420
attatggcgg aaatcccctc actgctgggt aatgtcaccg tgatcaacgg ttacttcccg 480
cagggtgaaa gccgcgacca tccgataaaa ttcccggcaa aagcgcagtt ttatcagaat 540
ctgcaaaact acctggaaac cgaactcaaa cgtgataatc cggtactgat tatgggcgat 600
atgaatatca gccctacaga tctggacatc ggcattggcg aagaaaaccg taagcgctgg 660
ctgcgtaccg gtaaatgctc tttcctgccg gaagagcgcg aatggatgga caggctgatg 720
agctgggggt tggtcgatac cttccgccat gcgaatccgc aaacagcaga tcgtttctca 780
tggtttgatt accgctcaaa aggttttgac gataaccgtg gtctgcgcat cgacctgctg 840
ctcgccagcc aaccgctggc agaatgttgc gtagaaaccg gcatcgacta tgaaatccgc 900
agcatggaaa aaccgtccga tcacgccccc gtctgggcga ccttccgccg c 951
<210> 14
<211> 951
<212> DNA
<213> 人工序列
<220>
<223> AP4-EXOIII
<400> 14
agccccgagg acgagctggc cgccaacgag gaggagctgc agcagaacga gcagaagctg 60
gcccagatca agcagaagct gcaggccatc aagtacggcg gctctggcgg cggctccgga 120
ggctctgatc caaaaaagaa gagaaaggta aaatttgtct cttttaatat caacggcctg 180
cgcgccagac ctcaccagct tgaagccatc gtcgaaaagc accaaccgga tgtgattggc 240
ctgcaggaga caaaagttca tgacgatatg tttccgctcg aagaggtggc gaagctcggc 300
tacaacgtgt tttatcacgg gcagaaaggc cattatggcg tggcgctgct gaccaaagag 360
acgccgattg ccgtgcgtcg cggctttccc ggtgacgacg aagaggcgca gcggcggatt 420
attatggcgg aaatcccctc actgctgggt aatgtcaccg tgatcaacgg ttacttcccg 480
cagggtgaaa gccgcgacca tccgataaaa ttcccggcaa aagcgcagtt ttatcagaat 540
ctgcaaaact acctggaaac cgaactcaaa cgtgataatc cggtactgat tatgggcgat 600
atgaatatca gccctacaga tctggacatc ggcattggcg aagaaaaccg taagcgctgg 660
ctgcgtaccg gtaaatgctc tttcctgccg gaagagcgcg aatggatgga caggctgatg 720
agctgggggt tggtcgatac cttccgccat gcgaatccgc aaacagcaga tcgtttctca 780
tggtttgatt accgctcaaa aggttttgac gataaccgtg gtctgcgcat cgacctgctg 840
ctcgccagcc aaccgctggc agaatgttgc gtagaaaccg gcatcgacta tgaaatccgc 900
agcatggaaa aaccgtccga tcacgccccc gtctgggcga ccttccgccg c 951
<210> 15
<211> 840
<212> DNA
<213> 人工序列
<220>
<223> P3-TREX2
<400> 15
tccccggaag atgagatcca gcaactggaa gaagaaatcg ctcagctgga acagaaaaac 60
gcagcgctga aagagaaaaa ccaggcgctg aaatacggtg gcggctctgg cggcggctcc 120
ggaggctcta tgtctgagcc acctcgggct gagacctttg tattcctgga cctagaagcc 180
actgggctcc caaacatgga ccctgagatt gcagagatat ccctttttgc tgttcaccgc 240
tcttccctgg agaacccaga acgggatgat tctggttcct tggtgctgcc ccgtgttctg 300
gacaagctca cactgtgcat gtgcccggag cgccccttta ctgccaaggc cagtgagatt 360
actggtttga gcagcgaaag cctgatgcac tgcgggaagg ctggtttcaa tggcgctgtg 420
gtaaggacac tgcagggctt cctaagccgc caggagggcc ccatctgcct tgtggcccac 480
aatggcttcg attatgactt cccactgctg tgcacggagc tacaacgtct gggtgcccat 540
ctgccccaag acactgtctg cctggacaca ctgcctgcat tgcggggcct ggaccgtgct 600
cacagccacg gcaccagggc tcaaggccgc aaaagctaca gcctggccag tctcttccac 660
cgctacttcc aggctgaacc cagtgctgcc cattcagcag aaggtgatgt gcacaccctg 720
cttctgatct tcctgcatcg tgctcctgag ctgctcgcct gggcagatga gcaggcccgc 780
agctgggctc atattgagcc catgtacgtg ccacctgatg gtccaagcct cgaagcctga 840
<210> 16
<211> 837
<212> DNA
<213> 人工序列
<220>
<223> P4-TREX2
<400> 16
agcccggaag ataaaattgc tcagctgaaa caaaaaatcc aagcgctgaa acaggaaaac 60
cagcagctgg aagaggaaaa cgccgcactg gaatatggtg gcggctctgg cggcggctcc 120
ggaggctctt ctgagccacc tcgggctgag acctttgtat tcctggacct agaagccact 180
gggctcccaa acatggaccc tgagattgca gagatatccc tttttgctgt tcaccgctct 240
tccctggaga acccagaacg ggatgattct ggttccttgg tgctgccccg tgttctggac 300
aagctcacac tgtgcatgtg cccggagcgc ccctttactg ccaaggccag tgagattact 360
ggtttgagca gcgaaagcct gatgcactgc gggaaggctg gtttcaatgg cgctgtggta 420
aggacactgc agggcttcct aagccgccag gagggcccca tctgccttgt ggcccacaat 480
ggcttcgatt atgacttccc actgctgtgc acggagctac aacgtctggg tgcccatctg 540
ccccaagaca ctgtctgcct ggacacactg cctgcattgc ggggcctgga ccgtgctcac 600
agccacggca ccagggctca aggccgcaaa agctacagcc tggccagtct cttccaccgc 660
tacttccagg ctgaacccag tgctgcccat tcagcagaag gtgatgtgca caccctgctt 720
ctgatcttcc tgcatcgtgc tcctgagctg ctcgcctggg cagatgagca ggcccgcagc 780
tgggctcata ttgagcccat gtacgtgcca cctgatggtc caagcctcga agcctga 837
<210> 17
<211> 2668
<212> DNA
<213> 人工序列
<220>
<223> P3-EXO1
<400> 17
tccccggaag atgagatcca gcaactggaa gaagaaatcg ctcagctgga acagaaaaac 60
gcagcgctga aagagaaaaa ccaggcgctg aaatacggtg gcggctctgg cggcggctcc 120
ggaggctctg cgatcgccat ggggatacag ggattgctac aatttatcaa agaagcttca 180
gaacccatcc atgtgaggaa gtataaaggg caggtagtag ctgtggatac atattgctgg 240
cttcacaaag gagctattgc ttgtgctgaa aaactagcca aaggtgaacc tactgatagg 300
tatgtaggat tttgtatgaa atttgtaaat atgttactat ctcatgggat caagcctatt 360
ctcgtatttg atggatgtac tttaccttct aaaaaggaag tagagagatc tagaagagaa 420
agacgacaag ccaatcttct taagggaaag caacttcttc gtgaggggaa agtctcggaa 480
gctcgagagt gtttcacccg gtctatcaat atcacacatg ccatggccca caaagtaatt 540
aaagctgccc ggtctcaggg ggtagattgc ctcgtggctc cctatgaagc tgatgcgcag 600
ttggcctatc ttaacaaagc gggaattgtg caagccataa ttacagagga ctcggatctc 660
ctagcttttg gctgtaaaaa ggtaatttta aagatggacc agtttggaaa tggacttgaa 720
attgatcaag ctcggctagg aatgtgcaga cagcttgggg atgtattcac ggaagagaag 780
tttcgttaca tgtgtattct ttcaggttgt gactacctgt catcactgcg tgggattgga 840
ttagcaaagg catgcaaagt cctaagacta gccaataatc cagatatagt aaaggttatc 900
aagaaaattg gacattatct caagatgaat atcacggtac cagaggatta catcaacggg 960
tttattcggg ccaacaatac cttcctctat cagctagttt ttgatcccat caaaaggaaa 1020
cttattcctc tgaacgccta tgaagatgat gttgatcctg aaacactaag ctacgctggg 1080
caatatgttg atgattccat agctcttcaa atagcacttg gaaataaaga tataaatact 1140
tttgaacaga tcgatgacta caatccagac actgctatgc ctgcccattc aagaagtcat 1200
agttgggatg acaaaacatg tcaaaagtca gctaatgtta gcagcatttg gcataggaat 1260
tactctccca gaccagagtc gggtactgtt tcagatgccc cacaattgaa ggaaaatcca 1320
agtactgtgg gagtggaacg agtgattagt actaaagggt taaatctccc aaggaaatca 1380
tccattgtga aaagaccaag aagtgcagag ctgtcagaag atgacctgtt gagtcagtat 1440
tctctttcat ttacgaagaa gaccaagaaa aatagctctg aaggcaataa atcattgagc 1500
ttttctgaag tgtttgtgcc tgacctggta aatggaccta ctaacaaaaa gagtgtaagc 1560
actccaccta ggacgagaaa taaatttgca acatttttac aaaggaaaaa tgaagaaagt 1620
ggtgcagttg tggttccagg gaccagaagc aggttttttt gcagttcaga ttctactgac 1680
tgtgtatcaa acaaagtgag catccagcct ctggatgaaa ctgctgtcac agataaagag 1740
aacaatctgc atgaatcaga gtatggagac caagaaggca agagactggt tgacacagat 1800
gtagcacgta attcaagtga tgacattccg aataatcata ttccaggtga tcatattcca 1860
gacaaggcaa cagtgtttac agatgaagag tcctactctt ttgagagcag caaatttaca 1920
aggaccattt caccacccac tttgggaaca ctaagaagtt gttttagttg gtctggaggt 1980
cttggagatt tttcaagaac gccgagcccc tctccaagca cagcattgca gcagttccga 2040
agaaagagcg attcccccac ctctttgcct gagaataata tgtctgatgt gtcgcagtta 2100
aagagcgagg agtccagtga cgatgagtct catcccttac gagaaggggc atgttcttca 2160
cagtcccagg aaagtggaga attctcactg cagagttcaa atgcatcaaa gctttctcag 2220
tgctctagta aggactctga ttcagaggaa tctgattgca atattaagtt acttgacagt 2280
caaagtgacc agacctccaa gctatgttta tctcatttct caaaaaaaga cacacctcta 2340
aggaacaagg ttcctgggct atataagtcc agttctgcag actctctttc tacaaccaag 2400
atcaaacctc taggacctgc cagagccagt gggctgagca agaagccggc aagcatccag 2460
aagagaaagc atcataatgc cgagaacaag ccggggttac agatcaaact caatgagctc 2520
tggaaaaact ttggatttaa aaaagattct gaaaagcttc ctccttgtaa gaaacccctg 2580
tccccagtca gagataacat ccaactaact ccagaagcgg aagaggatat atttaacaaa 2640
cctgaatgtg gccgtgttca aagagcaa 2668
<210> 18
<211> 2668
<212> DNA
<213> 人工序列
<220>
<223> P4-EXO1
<400> 18
agcccggaag ataaaattgc tcagctgaaa caaaaaatcc aagcgctgaa acaggaaaac 60
cagcagctgg aagaggaaaa cgccgcactg gaatatggtg gcggctctgg cggcggctcc 120
ggaggctctg cgatcgccat ggggatacag ggattgctac aatttatcaa agaagcttca 180
gaacccatcc atgtgaggaa gtataaaggg caggtagtag ctgtggatac atattgctgg 240
cttcacaaag gagctattgc ttgtgctgaa aaactagcca aaggtgaacc tactgatagg 300
tatgtaggat tttgtatgaa atttgtaaat atgttactat ctcatgggat caagcctatt 360
ctcgtatttg atggatgtac tttaccttct aaaaaggaag tagagagatc tagaagagaa 420
agacgacaag ccaatcttct taagggaaag caacttcttc gtgaggggaa agtctcggaa 480
gctcgagagt gtttcacccg gtctatcaat atcacacatg ccatggccca caaagtaatt 540
aaagctgccc ggtctcaggg ggtagattgc ctcgtggctc cctatgaagc tgatgcgcag 600
ttggcctatc ttaacaaagc gggaattgtg caagccataa ttacagagga ctcggatctc 660
ctagcttttg gctgtaaaaa ggtaatttta aagatggacc agtttggaaa tggacttgaa 720
attgatcaag ctcggctagg aatgtgcaga cagcttgggg atgtattcac ggaagagaag 780
tttcgttaca tgtgtattct ttcaggttgt gactacctgt catcactgcg tgggattgga 840
ttagcaaagg catgcaaagt cctaagacta gccaataatc cagatatagt aaaggttatc 900
aagaaaattg gacattatct caagatgaat atcacggtac cagaggatta catcaacggg 960
tttattcggg ccaacaatac cttcctctat cagctagttt ttgatcccat caaaaggaaa 1020
cttattcctc tgaacgccta tgaagatgat gttgatcctg aaacactaag ctacgctggg 1080
caatatgttg atgattccat agctcttcaa atagcacttg gaaataaaga tataaatact 1140
tttgaacaga tcgatgacta caatccagac actgctatgc ctgcccattc aagaagtcat 1200
agttgggatg acaaaacatg tcaaaagtca gctaatgtta gcagcatttg gcataggaat 1260
tactctccca gaccagagtc gggtactgtt tcagatgccc cacaattgaa ggaaaatcca 1320
agtactgtgg gagtggaacg agtgattagt actaaagggt taaatctccc aaggaaatca 1380
tccattgtga aaagaccaag aagtgcagag ctgtcagaag atgacctgtt gagtcagtat 1440
tctctttcat ttacgaagaa gaccaagaaa aatagctctg aaggcaataa atcattgagc 1500
ttttctgaag tgtttgtgcc tgacctggta aatggaccta ctaacaaaaa gagtgtaagc 1560
actccaccta ggacgagaaa taaatttgca acatttttac aaaggaaaaa tgaagaaagt 1620
ggtgcagttg tggttccagg gaccagaagc aggttttttt gcagttcaga ttctactgac 1680
tgtgtatcaa acaaagtgag catccagcct ctggatgaaa ctgctgtcac agataaagag 1740
aacaatctgc atgaatcaga gtatggagac caagaaggca agagactggt tgacacagat 1800
gtagcacgta attcaagtga tgacattccg aataatcata ttccaggtga tcatattcca 1860
gacaaggcaa cagtgtttac agatgaagag tcctactctt ttgagagcag caaatttaca 1920
aggaccattt caccacccac tttgggaaca ctaagaagtt gttttagttg gtctggaggt 1980
cttggagatt tttcaagaac gccgagcccc tctccaagca cagcattgca gcagttccga 2040
agaaagagcg attcccccac ctctttgcct gagaataata tgtctgatgt gtcgcagtta 2100
aagagcgagg agtccagtga cgatgagtct catcccttac gagaaggggc atgttcttca 2160
cagtcccagg aaagtggaga attctcactg cagagttcaa atgcatcaaa gctttctcag 2220
tgctctagta aggactctga ttcagaggaa tctgattgca atattaagtt acttgacagt 2280
caaagtgacc agacctccaa gctatgttta tctcatttct caaaaaaaga cacacctcta 2340
aggaacaagg ttcctgggct atataagtcc agttctgcag actctctttc tacaaccaag 2400
atcaaacctc taggacctgc cagagccagt gggctgagca agaagccggc aagcatccag 2460
aagagaaagc atcataatgc cgagaacaag ccggggttac agatcaaact caatgagctc 2520
tggaaaaact ttggatttaa aaaagattct gaaaagcttc ctccttgtaa gaaacccctg 2580
tccccagtca gagataacat ccaactaact ccagaagcgg aagaggatat atttaacaaa 2640
cctgaatgtg gccgtgttca aagagcaa 2668
<210> 19
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> eGFP基因组区域中的靶向序列
<400> 19
ggcgagggcg atgccaccta 20
<210> 20
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人EMX1基因靶向序列
<400> 20
gagtccgagc agaagaagaa 20
<210> 21
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人VEGF基因靶向序列
<400> 21
ggtgagtgag tgtgtgcgtg 20
<210> 22
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人MYD88基因靶向序列
<400> 22
ggctgagaag cctttacagg 20
<210> 23
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人ANKRD52基因靶向序列
<400> 23
actgtaaagg ctgctctccc 20
<210> 24
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人FUT9基因靶序列
<400> 24
tgcagaggag cctttacatg 20
<210> 25
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人PSKH2基因靶向序列
<400> 25
gccagacaag gctttacagg 20
<210> 26
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人BCR-ABL融合基因靶向序列
<400> 26
gacctgtctt ttagacaggc 20
<210> 27
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 等效Cas9蛋白表达 - pcDNA3
<400> 27
ggaggctgag aagcctttac aggtggccgc tgtagacagc 40
<210> 28
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 等效Cas9蛋白表达 - Cas9
<400> 28
ggaggctgag aaggtggccg ctgtagacag c 31
<210> 29
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 等效Cas9蛋白表达 - Cas9+EXO3
<400> 29
ggaggcaggt ggccgctgta gacagc 26

Claims (16)

1.一种组合,其包含第一组分(a)和第二组分(b),其中
a)所述第一组分包含与第一蛋白或蛋白结构域融合的能够诱导双链DNA断裂的核酸内切酶或能够诱导DNA切口的切口酶、优选地Cas蛋白或其突变体,和
b)所述第二组分包含融合至第二蛋白或蛋白结构域的核酸外切酶或胞苷脱氨酶、优选地APOBEC蛋白,
其中所述第一组分和第二组分能够通过所述第一蛋白或蛋白结构域和所述第二蛋白或蛋白结构域的相互作用而彼此异二聚化。
2.根据权利要求1所述的组合,其中所述第一蛋白或蛋白结构域和所述第二蛋白或结构域的异二聚化是通过化学或非化学信号诱导的。
3.根据权利要求2所述的组合,其中所述化学诱导异二聚化是小分子,例如雷帕霉素类似物、赤霉素或脱落酸或任何已知的小分子。
4.根据权利要求2所述的组合,其中所述非化学信号诱导异二聚化是具有预定波长的光。
5.根据前述权利要求中任一项所述的组合,其中所述第一蛋白或蛋白结构域与所述第二蛋白或结构域组合形成卷曲螺旋结构,特别是平行或反平行取向的卷曲螺旋结构。
6.根据权利要求1-4中任一项所述的组合,其中所述第一蛋白或蛋白结构域和所述第二蛋白或结构域选自
i)FKBP和FRB;
ii)FKBP和钙调磷酸酶催化亚基A(CnA);
iii)FKBP和亲环蛋白;
iv)旋转酶B(GyrB)和GyrB;
v)DmrA和DmrC;
vi)ABI和PYL1;
vii)GAI和GID1;
viii)CIB1和CRY2;
ix)LOV和PDZ;
x)PIF和PHYB;
xi)FKF1-GI;和
xii)UVR8-COP1。
7.根据前述权利要求中任一项所述的组合,其还包含供体DNA分子,所述供体DNA分子是单链或双链DNA分子,特别是单链DNA分子,其中所述供体DNA分子可携带期望的突变。
8.根据权利要求1-7中任一项所述的组合,其中所述第一蛋白或蛋白结构域与所述第二蛋白或蛋白结构域组合形成卷曲螺旋结构,其中所述第一组分包含Cas9或Cas9切口酶和所述第二组分包含核酸外切酶,或其中所述第一组分包含dCas9和所述第二组分包含胞苷脱氨酶,优选地APOBEC。
9.一种核酸分子或多种核酸分子的组合,其包含编码根据权利要求8任一项所述的组合的所述第一组分(a)的第一核酸序列和编码根据权利要求8任一项所述的组合的所述第二组分(b)的第二核酸序列。
10.一种载体,其包含一种以上的根据权利要求9所述的核酸分子。
11.一种细胞或生物体,其包含根据权利要求1-8中任一项所述的组合、一种以上的根据权利要求8所述的核酸分子或根据权利要求10所述的载体,前提是所述细胞不是人生殖细胞系细胞。
12.根据权利要求1-8中任一项所述的组合、根据权利要求9所述的核酸分子、根据权利要求10所述的载体或根据权利要求11所述的细胞或生物体在医学中、特别是在包括真核靶细胞或真核靶生物体中的基因组编辑的方法中的用途。
13.根据权利要求12所述的组合、核酸分子、载体、细胞或生物体的用途,其中所述靶细胞是脊椎动物靶细胞,特别是哺乳动物靶细胞,优选人靶细胞,例如包括真核靶生物体的诱导或胚胎多能干细胞、特别是人诱导或胚胎多能干细胞的干细胞,前提是所述细胞不是人生殖细胞系细胞,或其中所述靶生物体是哺乳动物靶生物体,特别是人。
14.根据权利要求12或13所述的组合、核酸分子、载体、细胞或生物体的用途,其中所述基因组编辑包括将供体DNA分子引入所述靶细胞或靶生物体,所述供体DNA分子任选地携带期望的突变,所述供体DNA分子是单链或双链DNA分子,特别是单链DNA分子。
15.一种用于编辑真核靶细胞或真核靶生物体的基因组的方法,所述方法包括将根据权利要求1-8中任一项所限定的组合、根据权利要求9所述的核酸分子或根据权利要求10所述的载体引入所述靶细胞或靶生物体,前提是所述细胞不是人生殖细胞系细胞。
16.根据权利要求1-8中任一项所限定的组合、根据权利要求9所述的核酸分子或根据权利要求10所述的载体在用于真核靶细胞中、特别是哺乳动物靶细胞中、更特别是人靶细胞中的基因组编辑中的体外用途,前提是所述细胞不是人生殖细胞系细胞。
CN202080058818.2A 2019-08-20 2020-08-19 用于增强基因组编辑的crispr/cas和核酸外切酶的卷曲螺旋介导的栓系 Pending CN114269930A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP19192490.1 2019-08-20
EP19192490.1A EP3783104A1 (en) 2019-08-20 2019-08-20 Coiled-coil mediated tethering of crispr-cas and exonucleases for enhanced genome editing
PCT/EP2020/073143 WO2021032759A1 (en) 2019-08-20 2020-08-19 Coiled-coil mediated tethering of crispr/cas and exonucleases for enhanced genome editing

Publications (1)

Publication Number Publication Date
CN114269930A true CN114269930A (zh) 2022-04-01

Family

ID=67659418

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080058818.2A Pending CN114269930A (zh) 2019-08-20 2020-08-19 用于增强基因组编辑的crispr/cas和核酸外切酶的卷曲螺旋介导的栓系

Country Status (4)

Country Link
US (1) US20220307011A1 (zh)
EP (2) EP3783104A1 (zh)
CN (1) CN114269930A (zh)
WO (1) WO2021032759A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4223877A1 (en) * 2022-02-08 2023-08-09 Eberhard Karls Universität Tübingen Medizinische Fakultät System and method for editing genomic dna to modulate splicing
WO2023185697A2 (en) * 2022-03-29 2023-10-05 Accuredit Therapeutics (Suzhou) Co., Ltd. Compositions and methods for treatment of transthyretin amyloidosis

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012118717A2 (en) * 2011-02-28 2012-09-07 Seattle Children's Research Institute Coupling endonucleases with end-processing enzymes drive high efficiency gene disruption
WO2013009525A1 (en) * 2011-07-08 2013-01-17 Cellectis S.A. Method for increasing the efficiency of double-strand break-induced mutagenssis
US20150044772A1 (en) * 2013-08-09 2015-02-12 Sage Labs, Inc. Crispr/cas system-based novel fusion protein and its applications in genome editing
WO2015089427A1 (en) * 2013-12-12 2015-06-18 The Broad Institute Inc. Crispr-cas systems and methods for altering expression of gene products, structural information and inducible modular cas enzymes
CN105247066A (zh) * 2013-03-15 2016-01-13 通用医疗公司 使用RNA引导的FokI核酸酶(RFN)提高RNA引导的基因组编辑的特异性
WO2017011721A1 (en) * 2015-07-15 2017-01-19 Rutgers, The State University Of New Jersey Nuclease-independent targeted gene editing platform and uses thereof
WO2017053879A1 (en) * 2015-09-24 2017-03-30 Editas Medicine, Inc. Use of exonucleases to improve crispr/cas-mediated genome editing
WO2017070633A2 (en) * 2015-10-23 2017-04-27 President And Fellows Of Harvard College Evolved cas9 proteins for gene editing
US20170349913A1 (en) * 2016-06-02 2017-12-07 Sigma-Aldrich Co., Llc Using programmable dna binding proteins to enhance targeted genome modification
WO2018069782A2 (en) * 2016-10-12 2018-04-19 Kemijski Institut A combination of split orthogonal proteases with dimerization domains that allow for assembly
CN109021111A (zh) * 2018-02-23 2018-12-18 上海科技大学 一种基因碱基编辑器
US20190010519A1 (en) * 2016-01-12 2019-01-10 The Regents Of The University Of California Compositions and methods for enhanced genome editing
WO2019051278A1 (en) * 2017-09-07 2019-03-14 The Board Of Trustees Of The Leland Stanford Junior University NUCLEASE SYSTEMS FOR GENETIC ENGINEERING
WO2019123014A1 (en) * 2017-12-22 2019-06-27 G+Flas Life Sciences Chimeric genome engineering molecules and methods

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11542509B2 (en) * 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012118717A2 (en) * 2011-02-28 2012-09-07 Seattle Children's Research Institute Coupling endonucleases with end-processing enzymes drive high efficiency gene disruption
WO2013009525A1 (en) * 2011-07-08 2013-01-17 Cellectis S.A. Method for increasing the efficiency of double-strand break-induced mutagenssis
CN105247066A (zh) * 2013-03-15 2016-01-13 通用医疗公司 使用RNA引导的FokI核酸酶(RFN)提高RNA引导的基因组编辑的特异性
US20150044772A1 (en) * 2013-08-09 2015-02-12 Sage Labs, Inc. Crispr/cas system-based novel fusion protein and its applications in genome editing
WO2015089427A1 (en) * 2013-12-12 2015-06-18 The Broad Institute Inc. Crispr-cas systems and methods for altering expression of gene products, structural information and inducible modular cas enzymes
WO2017011721A1 (en) * 2015-07-15 2017-01-19 Rutgers, The State University Of New Jersey Nuclease-independent targeted gene editing platform and uses thereof
WO2017053879A1 (en) * 2015-09-24 2017-03-30 Editas Medicine, Inc. Use of exonucleases to improve crispr/cas-mediated genome editing
WO2017070633A2 (en) * 2015-10-23 2017-04-27 President And Fellows Of Harvard College Evolved cas9 proteins for gene editing
CN108513575A (zh) * 2015-10-23 2018-09-07 哈佛大学的校长及成员们 核碱基编辑器及其用途
US20190010519A1 (en) * 2016-01-12 2019-01-10 The Regents Of The University Of California Compositions and methods for enhanced genome editing
US20170349913A1 (en) * 2016-06-02 2017-12-07 Sigma-Aldrich Co., Llc Using programmable dna binding proteins to enhance targeted genome modification
WO2018069782A2 (en) * 2016-10-12 2018-04-19 Kemijski Institut A combination of split orthogonal proteases with dimerization domains that allow for assembly
WO2019051278A1 (en) * 2017-09-07 2019-03-14 The Board Of Trustees Of The Leland Stanford Junior University NUCLEASE SYSTEMS FOR GENETIC ENGINEERING
WO2019123014A1 (en) * 2017-12-22 2019-06-27 G+Flas Life Sciences Chimeric genome engineering molecules and methods
CN109021111A (zh) * 2018-02-23 2018-12-18 上海科技大学 一种基因碱基编辑器

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
BERND ZETSCHE等: "A split-Cas9 architecture for inducible genome editing and transcription modulation", 《NATURE BIOTECHNOLOGY》, vol. 33, pages 139 - 145 *

Also Published As

Publication number Publication date
US20220307011A1 (en) 2022-09-29
EP4017976A1 (en) 2022-06-29
WO2021032759A1 (en) 2021-02-25
EP3783104A1 (en) 2021-02-24

Similar Documents

Publication Publication Date Title
US10314297B2 (en) DNA knock-in system
US11932883B2 (en) CRISPR-associated (Cas) protein
JP6878468B2 (ja) 標的ゲノム修飾を増強するためのプログラム可能なdna結合タンパク質の使用
JP7423520B2 (ja) Cas9ベースノックイン方針の効力を改善するための組成物及び方法
Foley et al. Rapid mutation of endogenous zebrafish genes using zinc finger nucleases made by Oligomerized Pool ENgineering (OPEN)
CN109306361B (zh) 一种新的a/t到g/c碱基定点转换的基因编辑系统
KR20170027743A (ko) 표적화된 좌를 변형시키는 방법 및 조성물
EP3307883A1 (en) Thermostable cas9 nucleases
CN110770342A (zh) Dna被编辑了的真核细胞的制造方法、和在该方法中使用的试剂盒
JP7138712B2 (ja) ゲノム編集のためのシステム及び方法
CN111373041A (zh) 用于基因组编辑和调节转录的crispr/cas系统和方法
WO2019046636A1 (en) CRISPR BASED EDITION OF HDR TYPE WITH DOUBLE SELECTION
Dumeau et al. Introducing gene deletions by mouse zygote electroporation of Cas12a/Cpf1
CN114269930A (zh) 用于增强基因组编辑的crispr/cas和核酸外切酶的卷曲螺旋介导的栓系
EP3402884A1 (en) Gene modification assays
WO2021178432A1 (en) Rna-guided genome recombineering at kilobase scale
JP2024501892A (ja) 新規の核酸誘導型ヌクレアーゼ
CN116970590B (zh) 小于380个氨基酸的超级迷你型基因编辑器及其应用
Viedma Present and future of CRISPR/Cas systems in Biotechnology
TW201840849A (zh) 編輯核酸序列之組成物及方法
WO2011053998A2 (en) Targeting of modifying enzymes for protein evolution
Kong et al. Retron Editing for Precise Genome Editing without Exogenous Donor DNA in Human Cells
Tong et al. Template-based genome editing directed by the SviCas3
Viedma Presente y futuro de los Sistemas CRISPR/Cas en Biotecnología
CN115851720A (zh) 基因敲入方法及其在构建内源性融合基因和原代细胞基因敲入中的应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination