CN111148833A - 改变细胞具有的双链dna的目标部位的方法 - Google Patents

改变细胞具有的双链dna的目标部位的方法 Download PDF

Info

Publication number
CN111148833A
CN111148833A CN201980003718.7A CN201980003718A CN111148833A CN 111148833 A CN111148833 A CN 111148833A CN 201980003718 A CN201980003718 A CN 201980003718A CN 111148833 A CN111148833 A CN 111148833A
Authority
CN
China
Prior art keywords
dna
cell
sequence
nucleic acid
promoter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201980003718.7A
Other languages
English (en)
Other versions
CN111148833B (zh
Inventor
西田敬二
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kobe University NUC
Original Assignee
Kobe University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kobe University NUC filed Critical Kobe University NUC
Publication of CN111148833A publication Critical patent/CN111148833A/zh
Application granted granted Critical
Publication of CN111148833B publication Critical patent/CN111148833B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2497Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing N- glycosyl compounds (3.2.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/02Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2) hydrolysing N-glycosyl compounds (3.2.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04005Cytidine deaminase (3.5.4.5)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Mycology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明提供一种改变细胞具有的双链DNA的目标部位的方法,该方法包括以下工序:使与选择的双链DNA中的目标核苷酸序列特异性结合的核酸序列识别模块和核酸碱基转换酶或DNA糖苷酶结合而成的复合体、包含插入序列的供体DNA与所述双链DNA接触,将所述目标部位置换为所述插入序列或者在所述目标部位插入所述插入序列,在所述目标部位不会切断所述双链DNA的至少一条链。

Description

改变细胞具有的双链DNA的目标部位的方法
技术领域
本发明涉及能够使用同源重组来改变细胞具有的双链DNA的特定区域内的目标部位而不伴随DNA的双链断裂(无断裂或单链断裂)的双链DNA的改变方法。
背景技术
已知CRISPR(成簇的规律间隔的短回文重复序列,clustered regularlyinterspaced short palindromic repeats)及CRISPR相关(CRISPR-associated;Cas)蛋白质以依赖于单向导RNA(sgRNA)和前间区序列邻近基序(PAM)的方式切断目标DNA从而作为细菌的适应性免疫系统发挥作用。在具有DNA双链断裂(DSB)的修复路径的真核生物中,来自酿脓链球菌(Streptococcus pyogenes)的Cas9核酸酶作为强有力的基因组编辑工具被广泛使用(例如,非专利文献1、2)。在采用非同源末端连接(NHEJ)路径的DSB修复过程中,在目标DNA中导入小的插入和/或缺失(indels),产生部位特异性突变或基因破坏。虽然效率依赖于宿主细胞,但是,通过提供包含目标区域的同源臂的供体DNA,能够促进同源重组修复(HDR)以更准确地进行编辑。然而,采用上述以往的方法时,由于随着双链DNA的断裂,会伴随预期以外的基因组改变,因此,存在具有强细胞毒性、染色体易位等副作用、损害基因治疗的可靠性、核苷酸改变导致的存活细胞数量极少等共同的课题。另外,也报告了使用Cas9切口酶(nCas9)的同源重组(非专利文献1、2),但与Cas9核酸酶相比,重组发生效率大多非常低(非专利文献3)。另外,在本发明人已知的范围内,并没有报告使用两种核酸酶活性失活的Cas9(dCas9)的同源重组。
最近,验证了在目标基因座直接编辑核苷酸而不使用包含目标区域的同源臂的供体DNA、且由脱氨酶介导的目标碱基编辑(例如,专利文献1、非专利文献4~6)。该技术利用DNA脱氨化来代替核酸酶介导的DNA断裂,因此,对细胞的毒性低,而且能够在精确位置导入突变。
现有技术文献
专利文献
专利文献1:国际公开第2015/133554号。
非专利文献
非专利文献1:Mali,P.et al.,Science 339:823-827(2013);
非专利文献2:Cong,L.et al.,Science 339:819-823(2013);
非专利文献3:Ran,F.A.et al.,Nat Protoc,8:2281-2308(2013);
非专利文献4:Komor,A.C.et al.,Nature 61:5985-91(2016);
非专利文献5:Nishida,K.et al.,Science 102:553-563(2016);
非专利文献6:Ma,Y.et al.,Nat.Methods 1-9(2016)doi:10.1038/nmeth.4027。
发明内容
发明所要解决的问题
然而,由于该技术使用脱氨酶,因此,对能够导入的突变的类型、突变部位产生制约,另外,不能改变基因的方向、组合,不能敲入基因片段等。因此,本发明的课题在于提供使用脱氨酶等核酸碱基转换酶或DNA糖苷酶的新的DNA改变技术,该新的DNA改变技术在不受能够导入的突变的类型、突变部位制约的情况下能够改变基因的方向、组合或者敲入基因片段。
解决问题的技术手段
对于分裂的细胞,特别严重的DNA损伤方式是DNA双链的两条链被切断的障碍,作为修复该障碍的机构,已知同源重组和非同源末端再连接。另一方面,在DNA双链的一条链损伤的情况下,主要通过作为对由烷基化、脱氨化导致的损伤进行修复的机构的碱基切除修复、涉及几十对碱基的较大规模的对双链变形那样的损伤进行的修复机构即核苷酸切除修复(nucleotide excision repair:NER)进行修复。虽然没有针对比例等进行验证,但是已知即使在DNA双链的一条链损伤的情况下也会诱导互补链修复。
然而,并没有对互补链修复相对于碱基切除修复的活性的程度进行充分的验证,并没有积极地进行利用碱基切除修复且采用同源重组的DNA编辑。在本发明人已知的范围内,并没有这样的DNA编辑的报告。在这种情况下,本发明人得到了以下构思:通过使用核酸碱基转换酶使细胞内DNA引起脱氨化、脱碱基,从而能够诱导互补链修复,此时通过使供体DNA与该DNA接触,能进行使用同源重组的DNA重组。基于该构思进行研究,结果发现了通过使核酸序列识别模块和核酸碱基转换酶结合而成的复合体、包含插入序列的供体DNA与目标DNA接触,能够抑制对细胞的毒性并且进行DNA同源重组,而且,在优选的实施方式中,令人惊讶的是,在目标部位产生了接近100%的同源重组活性。本发明人基于这些认识进一步进行专心研究,结果完成了本发明。
即,本发明如下所述。
[1]一种改变细胞具有的双链DNA的目标部位的方法,包括以下工序:使与选择的双链DNA中的目标核苷酸序列特异性结合的核酸序列识别模块和核酸碱基转换酶或DNA糖苷酶结合而成的复合体、包含插入序列的供体DNA与所述双链DNA接触,将所述目标部位置换为所述插入序列或者在所述目标部位插入所述插入序列,在所述目标部位不会切断所述双链DNA的至少一条链。
[2]如[1]所述的方法,所述供体DNA包含与目标部位的邻接区域相同的序列。
[3]如[1]或[2]所述的方法,所述核酸序列识别模块选自由Cas效应蛋白质的至少一种DNA切断能力失活的CRISPR-Cas系统、锌指基序、TAL效应因子以及PPR基序组成的组。
[4]如[1]~[3]中任一项所述的方法,所述核酸序列识别模块是Cas效应蛋白质的两种DNA切断能力中的仅一种DNA切断能力失活的CRISPR-Cas系统。
[5]如[1]~[3]中任一项所述的方法,所述核酸序列识别模块是Cas效应蛋白质的两种DNA切断能力失活的CRISPR-Cas系统。
[6]如[1]~[5]中任一项所述的方法,所述核酸碱基转换酶为脱氨酶。
[7]如[6]所述的方法,所述脱氨酶为胞苷脱氨酶。
[8]如[7]所述的方法,所述胞苷脱氨酶为PmCDA1。
[9]如[1]~[8]中任一项所述的方法,双链DNA与复合体的接触通过向所述细胞导入编码所述复合体的核酸来进行。
[10]如[1]~[9]中任一项所述的方法,所述细胞为原核生物细胞或真核生物细胞。
[11]如[10]所述的方法,所述细胞为微生物细胞。
[12]如[10]所述的方法,所述细胞为植物细胞、昆虫细胞或动物细胞。
[13]如[12]所述的方法,所述动物细胞为脊椎动物细胞。
[14]如[13]所述的方法,所述脊椎动物细胞为哺乳类动物细胞。
发明效果
根据本发明,提供一种使用脱氨酶等核酸碱基转换酶或DNA糖苷酶的新的DNA改变技术,其能够改变基因的方向、组合,或敲入基因片段,而不受能够导入的突变的类型、突变部位制约。本发明的DNA改变技术能够改变目标部位而不切断双链DNA,因此,能将伴随断裂的预期以外的改编、毒性抑制得较低,而且,与以往的方法相比,能更高效地改变目标部位。
附图说明
图1表示由互补链修饰引起的基因组改变的机制的概略图。通过将核酸序列识别模块与核酸碱基转换酶或DNA糖苷酶结合而成的复合体、重组用供体DNA导入细胞,能够进行插入序列的高效敲入。
图2表示使用dCas9-CDA或nCas9-CDA、以及供体DNA,能够导入目标部位的突变。载体1525:pRS415_dCas9-CDA+CAN(mut);载体1526:pRS415_nCas9-CDA+CAN(mut);载体1059:pRS426_SNR52-Can7R-sgRNA;载体1149:pRS426_SNR52-Can10R-sgRNA
图3表示使用预先在Ade1与Ade1的启动子区域之间导入了标志物开关(markerswitch)的酿酒酵母(BY4741株)的重组的评价系统。如果标志物开关在同源区域通过重组而翻转,则Ade1的功能恢复,菌落的颜色从红变为白。
图4表示使用图3的重组的评价系统的重组反应的验证实验的结果。质粒载体(以下,有时简称为“载体”)1553:nCas9-CDA_UraAde target 2(目标核苷酸序列:cctttagcggcttaactgtg(序列号9));载体1557:nCas9-CDA_UraAde target 6(目标核苷酸序列:ggcccaggtattgttagcgg(序列号10))、载体1559:nCas9-CDA_UraAde target 8(目标核苷酸序列:ttggcggataatgcctttag(序列号11));载体1560:nCas9-CDA_UraAde target 9(目标核苷酸序列:tgcagttgggttaagaatac(序列号12))、载体1562:nCas9-CDA_UraAdetarget 11(目标核苷酸序列:gctaacatcaaaaggcctct(序列号13));载体1565:dCas9-CDA_UraAde target 3(目标核苷酸序列:ttggcggataatgcctttag(序列号14))。上述载体(1553、1557、1559、1560、1562、1565)相当于将载体1059(序列号5)的序列的第3890个~第3909个的碱基序列置换为上述各目标核苷酸序列后的载体。另外,载体编号的最后两位与图4的目标部位的数字对应。
图5表示使用本发明的DNA改变方法的敲入或敲除方法的示意图。
图6表示使用图5的方法的敲入或敲除的验证实验的结果。
图7表示实施例5中进行的使用动物细胞的重组的评价系统的概略图和实验条件。
图8表示使用图7的重组的评价系统的重组反应的验证实验的结果。图的横轴表示同源重组率(%)。
图9表示实施例6中进行的使用动物细胞的重组的评价系统的概略图和实验条件。
图10表示使用图9的重组的评价系统的重组反应的验证实验的结果。图的纵轴表示同源重组率(%)。
图11表示实施例7中进行的使用动物细胞的重组的评价系统的概略图和实验条件。
图12表示使用图11的重组的评价系统的重组反应的验证实验的结果。图的横轴表示同源重组率(%)。
具体实施方式
本发明提供在不切断要改变的双链DNA(例如,染色体DNA、线粒体DNA、叶绿体DNA;以下,也将它们统称为“基因组DNA”)的至少一条链的情况下通过将该双链DNA中的目标部位置换为外源的供体DNA所含的插入序列、或者在所述目标部位插入所述插入序列来改变所述双链DNA的该目标部位的方法(以下,有时简称为“本发明的方法”)。该方法的特征在于,包括使与所述双链DNA中的目标核苷酸序列特异性结合的核酸序列识别模块和核酸碱基转换酶或DNA糖苷酶(以下,有时简称为“核酸碱基转换酶等”)结合而成的复合体、包含插入序列的供体DNA与所述双链DNA接触的工序。
在本发明中,双链DNA的“改变”是指DNA链上的某一核苷酸(例如,dA、dC、dG或dT)或核苷酸序列被置换为其他核苷酸或核苷酸序列、或者在DNA链上的某一核苷酸之间插入其他核苷酸或核苷酸序列。此处,对待改变的双链DNA没有特别的限制,优选为基因组DNA。
在本发明中,“供体DNA”是指包含外源的插入序列的DNA,通常,在供体DNA中包含与邻接于目标部位的目标部位的上游侧和下游侧两处区域(以下,也称为“邻接区域”)的序列相同的两种序列(以下,也称为“同源臂”)。在区别各同源臂的情况下,有时以“5’同源臂”和“3’同源臂”来区别。另外,双链DNA的“目标部位”是指被供体DNA所含的插入序列置换的区域或者该插入序列被插入的核苷酸之间,在该目标部位不包含所述邻接序列。
与目标部位的邻接区域相同的序列不仅可以为完全相同的序列,只要在细胞内能引起同源重组,也可以是相对于完全相同的序列具有优选80%以上(例如85%以上、90%以上、95%以上、96%以上、97%以上、98%以上、99%以上)的同一性的序列。
根据需要,在插入序列中能够包含药剂抗性基因(例如,卡那霉素抗性基因、氨苄西林抗性基因、嘌呤霉素抗性基因等)、胸苷激酶基因、白喉毒素基因等选择标志物序列、绿色荧光蛋白质(GFP)、红色荧光蛋白质、β葡萄糖醛酸酶(GUS)、FLAG等报告基因序列等。另外,在细胞筛选等结束后等,为了能够切除这些基因,在它们前后也可以具有LoxP序列、FRT序列或转座子特异性末端反向序列(PiggyBac末端重复序列)。作为优选的转座子,例如,可举出来自鳞翅目昆虫的转座子piggyBac等(Kaji,K.et al.,Nature,458:771-775(2009),Woltjen et al.,Nature,458:766-770(2009),WO 2010/012077)。或者,也可以像Oji A etal.,Sci Rep,6:31666(2016)等所记载那样,共转导包含上述药剂抗性基因的表达载体,进行短暂性(几天左右的)药剂选择。对于插入序列是否插入目标部位、是否与目标部位置换,除了能够通过对序列进行解读来确认,也能够通过Southern印迹杂交或PCR法筛选从细胞中分离提取的染色体DNA等来确认,在供体DNA中存在上述药剂抗性基因等的情况下,也能够将它们的表达作为指标来确认。
供体DNA可以为直链状(例如,合成双链DNA),可以为环状(例如,质粒DNA),另外,也可以为单链DNA(例如,单链寡聚脱氧核苷酸(ssODN)),还可以为双链DNA。供体DNA能够根据插入序列的碱基长度、宿主细胞的同源重组活性等适当设计。例如,插入序列为100个碱基长度以下的情况下,通常使用ssODN或合成双链DNA,在比100个碱基更长的情况下,通常使用合成双链DNA或质粒DNA。对供体DNA的长度也没有特别的限制,能够根据插入序列的长度等适当设计。对插入序列的长度没有特别的限制,通常在1个碱基长度~几万个碱基长度的范围(例如,在ssODN的情况下,为100个碱基长度以下(例如,70碱基以下、50碱基以下))内能够根据目的适当设计。另外,对各同源臂的长度也没有特别的限制,当供体DNA为ssODN时,通常使用10个碱基长度~150个碱基长度的同源臂,当供体DNA为合成双链DNA时,通常使用10~5000个碱基长度的同源臂,当供体DNA为质粒DNA时,通常使用100个碱基长度~5000个碱基长度的同源臂,优选使用500个碱基长度~1000个碱基长度的同源臂。这些供体DNA能够参照公知文献(例如,Ochiai H,Int J Mol Sci,16:21128-21137(2015),Hockemeyer D et al.,Nat Biotefchnol,27:851-857(2009))来设计。
在本发明中,“核酸序列识别模块”是指具有特异性识别并结合DNA链上的特定核苷酸序列(即,目标核苷酸序列)的能力的分子或分子复合体。通过核酸序列识别模块与目标核苷酸序列结合,与该模块连接的核酸碱基转换酶等能够特异性作用于双链DNA中的核酸碱基转换酶等的目标部位(即,目标核苷酸序列及其附近的核苷酸)。
如后述的实施例所述,通过将核酸碱基转换酶和核酸序列识别模块的复合体、供体DNA导入细胞来验证目标部位能够改变。并不希望其受到任何理论的限制,作为采用该方法改变目标部位的机制,如下推测。该核酸碱基转换酶将存在于目标部位的碱基转换为其他碱基,通过DNA糖苷酶去除该转换的碱基,通过AP核酸内切酶、DNA聚合酶、DNA连接酶等碱基切除修复(base excision repair:BER)路径的下游酶对由脱碱基反应而产生的无碱基部位(无嘌呤或嘧啶的(AP)位点)进行处理。另一方面,认为未完成BER而存在的异常核苷酸、错配结构导致互补链修复路径也被活化,在目标部位和供体DNA所含的区域引起同源重组,目标部位产生改变。因此,推测即使在使用DNA糖苷酶的情况下,该酶也使目标部位产生脱碱基,从而产生同样的改变,因此,不仅核酸碱基转换酶,DNA糖苷酶也适用于本发明的方法。
在本发明中,“核酸碱基转换酶”是指通过催化将DNA碱基的嘌呤或嘧啶环上的取代基转换为其他基团或原子的反应从而能够在不切断DNA链的情况下将目标核苷酸转换为其他核苷酸的酶。
在本发明中,“DNA糖苷酶”是指水解DNA的N-糖苷键的酶。DNA糖苷酶本来在BER中发挥从DNA中去除损伤的碱基的作用,但是,在本发明中,优选其能作用于DNA中的正常碱基(即,dC、dT、dA或dG或者它们受到表观遗传修饰的碱基)。本来不与正常的碱基反应或反应性低、但因突变而获得对正常碱基的反应性或反应性提高的突变DNA糖苷酶也包括在本发明中的DNA糖苷酶中,能够优选使用。对于采用该酶的脱碱基反应而产生的无碱基部位(无嘌呤或嘧啶的(AP)位点),通过AP核酸内切酶、DNA聚合酶、DNA连接酶等BER路径的下游的酶进行处理。
另外,“对无变形的双螺旋结构的DNA的反应性足够低”是指,仅以将细胞毒性抑制至对细胞存活没有影响的程度的频率引起在形成无变形的双螺旋结构的DNA的区域内的脱碱基反应。此处,“无变形的双螺旋结构的DNA”是指处于形成牢固的双螺旋结构的状态(即,非松弛双螺旋DNA(或者,也简称为非松弛DNA)),不仅不包括形成对的碱基完全解离的单链DNA状态的DNA,而且不包括虽然形成碱基对但双螺旋结构解开并松懈的双链(松弛双链DNA)的状态的DNA。作为对无变形的双螺旋结构的DNA的反应性足够低的DNA糖苷酶,可举出对无变形的双螺旋结构的DNA的反应性天生足够低的DNA糖苷酶、与野生型相比导入了使对无变形的双螺旋结构的DNA的反应性更低的突变的突变DNA糖苷酶等。进一步,切成两个片段的作为分裂酶(split enzyme)的DNA糖苷酶也包括在本发明中的“对无变形的双螺旋结构的DNA的反应性足够低的DNA糖苷酶”中,该DNA糖苷酶设计成各片段与切成两个核酸序列识别模块中的任意一个结合而形成两个复合体,两个复合体重折叠时,该核酸序列识别模块能够与目标核苷酸序列特异性结合,通过该特异性结合该DNA糖苷酶能够催化脱碱基反应。
在本发明中,“核酸改变酶复合体”是指包括上述核酸序列识别模块与核酸碱基转换酶或DNA糖苷酶连接而成的复合体、且赋予了特定的核苷酸序列识别能力的具有核酸碱基转换反应或脱碱基反应的催化功能的分子复合体。此处,“复合体”不仅包括由多个分子构成的复合体,还包括像融合蛋白质那样在单一分子内具有核酸序列识别模块和核酸碱基转换酶等的复合体。
对于本发明中使用的核酸碱基转换酶而言,只要能够催化上述反应,就没有特别的限制,例如,可举出催化将氨基转换为羰基的脱氨化反应的、属于核酸/核苷酸脱氨酶超家族的脱氨酶。优选地,可举出能够将胞嘧啶或5-甲基胞嘧啶分别转换为尿嘧啶或胸腺嘧啶的胞苷脱氨酶、能够将腺嘌呤转换为次黄嘌呤的腺苷脱氨酶、能够将鸟嘌呤转换为黄嘌呤的鸟苷脱氨酶等。作为胞苷脱氨酶,更优选地,可举出在脊椎动物的获得性免疫中在免疫球蛋白基因中导入突变的酶即活化诱导胞苷脱氨酶(以下,也称为“AID”)等。
对核酸碱基转换酶的来源没有特别的限制,例如,能够使用来自七鳃鳗的PmCDA1(Petromyzon marinus cytosine deaminase 1)、来自哺乳动物(例如,人、猪、牛、马、猴等)的AID(Activation-induced cytidine deaminase;AICDA)。例如,PmCDA1的cDNA的碱基序列和氨基酸序列能够参照基因银行登记号EF094822和ABO15149,人AID的cDNA的碱基序列和氨基酸序列能够参照基因银行登记号NM_020661和NP_065712。从酶活性的观点出发,优选PmCDA1。
只要本发明中使用的DNA糖苷酶能够催化水解DNA的N-糖苷键并使碱基脱离的反应,就没有特别的限制,从提高基因组编辑技术的通用性的观点出发,优选能够作用于正常碱基(即,dC、dT、dA或dG、或者它们经过表观遗传修饰后的碱基,例如,5-甲基胞嘧啶等)的DNA糖苷酶。作为这种酶,例如,可举出具有催化使胞嘧啶脱离的反应的CDG活性的酶、具有催化使胸腺嘧啶脱离的反应的TDG活性的酶、具有催化使5-甲基胞嘧啶脱离的反应的活性(5-mCDG活性)的酶等,具体而言,可举出胸腺嘧啶DNA糖苷酶、氧鸟嘌呤糖基化酶、烷基腺嘌呤DNA糖苷酶(例如,酵母3-甲基腺嘌呤-DNA糖苷酶(MAG1)等)等。以往,本发明人报告了通过使用对无变形的双螺旋结构的DNA(非松弛DNA)的反应性足够低的DNA糖苷酶作为DNA糖苷酶,能够降低细胞毒性并高效地改变目标序列(国际公开第2016/072399号)。因此,作为DNA糖苷酶,优选使用对无变形的双螺旋结构的DNA的反应性足够低的DNA糖苷酶。作为这种DNA糖苷酶,可举出国际公开第2016/072399号记载的具有胞嘧啶-DNA糖苷酶(CDG)活性和/或胸腺嘧啶-DNA糖苷酶(TDG)活性的UNG(尿嘧啶-DNA糖苷酶)突变体、来自牛痘病毒的UDG突变体。
作为所述UNG突变体的具体例,可举出酵母UNG1的N222D/L304A双重突变体、N222D/R308E双重突变体、N222D/R308C双重突变体、Y164A/L304A双重突变体、Y164A/R308E双重突变体、Y164A/R308C双重突变体、Y164G/L304A双重突变体、Y164G/R308E双重突变体、Y164G/R308C双重突变体、N222D/Y164A/L304A三重突变体、N222D/Y164A/R308E三重突变体、N222D/Y164A/R308C三重突变体、N222D/Y164G/L304A三重突变体、N222D/Y164G/R308E三重突变体、N222D/Y164G/R308C三重突变体等。当使用其他UNG来代替酵母UNG1的情况下,只要使用在上述各突变体对应的氨基酸中导入了同样突变的突变体即可。例如,作为赋予TDG活性能的突变即与酵母UNG1的Y164A或Y164G突变对应的大肠杆菌的UNG突变,可举出Y66A或Y66G,作为人的UNG突变,可举出Y147A或Y147G。作为赋予CDG活性能的突变即与酵母UNG1的N222D突变对应的大肠杆菌的UNG突变,可举出N123D,作为人的UNG突变,可举出N204D。作为对无变形的双螺旋结构的DNA的反应性低的、且与酵母UNG1的L304A、R308E或R308C突变对应的大肠杆菌的UNG突变,可举出L191A、R195E或R195C,作为人的UNG突变,可举出L272A、R276E或R276C。作为来自牛痘病毒的UDG突变体,可举出N120D突变体(赋予CDG活性能)、Y70G突变体(赋予TDG活性能)、Y70A突变体(赋予TDG活性能)、N120D/Y70G双重突变体、N120D/Y70A双重突变体等。或者,也可以是切成两个片段的作为分裂酶的DNA糖苷酶,其设计成各片段与切成两个的核酸序列识别模块中的任意一个结合而形成两个复合体,两个复合体重折叠时,该核酸序列识别模块能够与目标核苷酸序列特异性结合,通过该特异性结合该DNA糖苷酶能够催化脱碱基反应。对分裂酶而言,例如能够参照国际公开第2016/072399号,Nat Biotechnol.33(2):139-142(2015)、PNAS 112(10):2984-2989(2015)的记载来设计和制备。
对UNG的来源没有特别的限制,例如,能够使用来自大肠杆菌的ung(Varshney,U.et al.(1988)J.Biol.Chem.,263,7776-7784)、来自酵母、哺乳动物(例如,人、小鼠、猪、牛、马、猴等)等的UNG1或UNG2、或者来自病毒(例如,痘病毒科(牛痘病毒等)、疱疹病毒科等)的UDG。
对于通过本发明的核酸改变酶复合体的核酸序列识别模块识别的双链DNA中的目标核苷酸序列而言,只要该模块能特异性结合,就没有特别的限制,可以是双链DNA中的任意的序列。对于目标核苷酸序列的长度而言,只要核酸序列识别模块足以特异性结合即可,例如,当在哺乳动物的基因组DNA中的特定部位导入突变时,根据该基因组大小,目标核苷酸序列的长度为12个核苷酸以上,优选为15个核苷酸以上,更优选为17个核苷酸以上。对于长度的上限没有特别的限制,优选为25个核苷酸以下,更优选为22个核苷酸以下。如后述的实施例所示,在目标核苷酸序列存在于目标部位、与同源臂相同的序列以及包含一部分与同源臂相同的序列的区域的任意一种实验体系中,均验证了高改变效率,因此,目标核苷酸序列可以存在于目标部位,也可以存在于与同源臂相同的序列的至少一部分区域,还可以存在于与同源臂相同的序列的附近区域。
作为本发明的核酸改变酶复合体的核酸序列识别模块,例如,除了Cas效应蛋白质(也称Cas核酸酶)中的至少一种DNA切断能力失活的CRISPR-Cas系统(以下,也称“CRISPR-突变Cas”)、锌指基序、TAL(transcription activator-like,转录激活因子样)效应因子和PPR(pentatricopeptide repeat,五肽重复)基序等以外,能够使用包括限制性酶、转录因子、RNA聚合酶等能与DNA特异性结合的蛋白质的DNA结合域且不具有DNA双链断裂能力的片段等,但并不限定于此。优选地,可举出CRISPR-突变Cas、锌指基序、TAL效应因子、PPR基序等。在本说明书中,也将所述至少一种DNA切断能力失活的Cas效应蛋白质称为Cas效应蛋白质的突变体。
锌指基序是将3~6个Cys2His2型的不同锌指单元(一个锌指识别约3个碱基)连接而成的,能够识别9~18个碱基的目标核苷酸序列。锌指基序能够通过模块化组装(Modularassembly)法Nat Biotechnol(2002)20:135-141)、OPEN法(Mol Cell(2008)31:294-301)、CoDA法(Nat Methods(2011)8:67-69)、大肠杆菌单杂交法(Nat Biotechnol(2008)26:695-701)等公知的方法来制备。对于锌指基序的制备的详细情况,能够参照日本专利第4968498号公报。
TAL效应因子具有以约34个氨基酸为单位的模块的重复结构,通过一个模块的第12个和第13个的氨基酸残基(称为RVD)来确定结合稳定性和碱基特异性。各模块的独立性高,因此,仅通过连接模块能够制备对于目标核苷酸序列具有特异性的TAL效应因子。对于TAL效应因子而言,建立利用开放资源的制备方法(REAL法(Curr Protoc Mol Biol(2012)Chapter 12:Unit 12.15)、FLASH法(Nat Biotechnol(2012)30:460-465)、Golden Gate法(Nucleic Acids Res(2011)39:e82)等),能够比较简单地设计针对目标核苷酸序列的TAL效应因子。对于TAL效应因子的制备的详细情况,能够参照日本特表2013-513389号公报。
PPR基序配置为通过由35氨基酸构成且识别一个核酸碱基的PPR基序的连续来识别特定的核苷酸序列,仅通过各基序的第1、4和ii(-2)个氨基酸来识别目标碱基。由于不依赖于基序构成,没有来自两侧基序的干扰,因此,与TAL效应因子同样地,仅通过连接PPR基序就能够制备对于目标核苷酸序列具有特异性的PPR蛋白质。对于PPR基序的制备的详细情况,能够参照日本特开2013-128413号公报。
另外,在使用限制性酶、转录因子、RNA聚合酶等片段的情况下,由于这些蛋白质的DNA结合域是众所周知的,因此,能够容易地设计并构建包含该结构域且不具有DNA双链断裂能力的片段。
上述任意一种核酸序列识别模块也能够以与上述核酸碱基转换酶等的融合蛋白质的形式提供,或者也可以使SH3结构域、PDZ结构域、GK结构域、GB结构域等蛋白质结合域和各自的结合伙伴分别与核酸序列识别模块和核酸碱基转换酶等融合,并通过该结构域与其结合伙伴的相互作用以蛋白质复合体的形式提供。或者,也能够分别使内含肽(intein)与核酸序列识别模块和核酸碱基转换酶等融合,通过各蛋白质合成后的连接来连接二者。
包含核酸序列识别模块和核酸碱基转换酶等结合而得的复合体(包含融合蛋白质)而成的本发明的核酸改变酶复合体与双链DNA的接触通过在具有目标双链DNA(例如,基因组DNA)的细胞中导入编码该复合体的核酸来实施。在本说明书中,编码核酸改变酶复合体的核酸包含编码核酸序列识别模块的碱基序列以及编码核酸碱基转换酶或DNA糖苷酶的碱基序列,在该核酸序列识别模块为CRISPR-Cas系统的情况下,还包含编码向导RNA的序列。
因此,对于核酸序列识别模块和核酸碱基转换酶等而言,优选的是,以核酸的形式来制备,所述核酸为编码核酸序列识别模块和核酸碱基转换酶的融合蛋白质的核酸,或者为以在利用结合域、内含肽等翻译成蛋白质后能在宿主细胞内形成复合体那样的形式分别编码核酸序列识别模块和核酸碱基转换酶的核酸。此处,核酸既可以是DNA,也可以是RNA。在DNA的情况下,优选为双链DNA,以在宿主细胞内在功能性启动子的控制下配置的表达载体的形式提供。在RNA的情况下,优选为单链RNA。
核酸序列识别模块和核酸碱基转换酶等结合而得的本发明的复合体并不伴随DNA双链断裂(DSB),因此,能够进行毒性低的基因组编辑,本发明的方法能够适用于范围宽的生物材料。因此,导入编码核酸序列识别模块和/或核酸碱基转换酶等的核酸的细胞也能够包括从作为原核生物的大肠杆菌等细菌、作为低等真核生物的酵母等微生物的细胞到包括人等哺乳动物的脊椎动物、昆虫、植物等高等真核生物的细胞在内的所有生物种的细胞。
编码锌指基序、TAL效应因子、PPR基序等核酸序列识别模块的DNA能够通过针对各模块的上述任意一种方法来获得。编码限制性酶、转录因子、RNA聚合酶等序列识别模块的DNA例如通过如下方法进行克隆:基于它们的cDNA序列信息,以覆盖编码该蛋白质的所期望的部分(包括DNA结合域的部分)的区域的方式合成寡DNA引物,使用由产生该蛋白质的细胞制备的总RNA或mRNA组分作为模板,通过RT-PCR法进行扩增。
编码核酸碱基转换酶等的DNA(即,编码核酸碱基转换酶的DNA或编码DNA糖苷酶的DNA)也同样地通过如下方法进行克隆:以使用的酶的cDNA序列信息为基础合成寡DNA引物,使用由产生该酶的细胞制备的总RNA或mRNA组分作为模板,通过RT-PCR法进行扩增。例如,编码七鳃鳗的PmCDA1的DNA通过如下方法进行克隆:以在NCBI数据库中登记的cDNA序列(登记号EF094822)为基础针对CDS的上游和下游设计适当的引物,能够通过RT-PCR法由来自七鳃鳗的mRNA进行克隆。另外,编码人AID的DNA通过如下方法进行克隆:以在NCBI数据库中登记的cDNA序列(登记号AB040431)为基础针对CDS的上游和下游设计适当的引物,例如能够通过RT-PCR法由来自人淋巴结的mRNA进行克隆。另外,供体DNA也能够基于目标部位的序列信息等与上述同样地进行克隆。
克隆化的DNA保持原状态或根据期望通过限制性酶消化、或者在附加适当的连接子和/或核定位信号(在目标双链DNA为线粒体、叶绿体DNA的情况下,为各细胞器定位信号)后,与编码核酸序列识别模块的DNA连接,从而能够制备编码融合蛋白质的DNA。或者,也可以通过分别使编码结合域或其结合伙伴的DNA与编码核酸序列识别模块的DNA和编码核酸碱基转换酶等的DNA融合、或者使编码分离内含肽的DNA与两个DNA融合,由此,能够使核酸序列识别转换模块和核酸碱基转换酶等在宿主细胞内被翻译后形成复合体。在这些情况下,根据期望也能够在一个或两个DNA的适当位置连接连接子和/或核定位信号。另外,供体DNA可以作为单一DNA制备,也可以以编码核酸序列识别模块和/或核酸碱基转换酶等的核酸和单一DNA的形式提供。
对于编码核酸序列识别模块的DNA、编码核酸碱基转换酶等的DNA、供体DNA,也能够通过化学合成DNA链或者利用PCR法、无缝克隆(Gibson Assembly)法将合成的一部分重叠的寡DNA短链连接,来构建编码其全长的DNA。在供体DNA为单链核酸的情况下,作为除化学合成DNA链以外的方法,例如,通过限制性酶将包含该DNA的质粒DNA消化为单链,用RNA聚合酶合成RNA后,通过逆转录酶合成cDNA,通过RNaseH将RNA链分化,从而能够制备。或者,也能够通过切口酶型限制性酶消化包含供体DNA的质粒,并经过采用电泳的分离/纯化来制备。通过与化学合成或PCR法或无缝克隆法的组合构建全长DNA的优点在于,根据导入该DNA的宿主能够在CDS全长设计使用密码子。在异源DNA表达时,通过将该DNA序列转换为宿主生物中使用频率高的密码子,能够期待蛋白质表达量增大。对于使用的宿主中的密码子使用频率的数据,例如能够使用日本(公益财团法人)KazusaDNA研究所的主页公开的遗传密码使用频率数据库(http://www.kazusa.or.jp/codon/index.html)、或者也可以参照记载各宿主中的密码子使用频率的文献。只要参照获得的数据和要导入的DNA序列,在该DNA序列中使用的密码子中将在宿主中使用频率低的密码子转换为编码同一氨基酸且使用频率高的密码子即可。
另外,在将除目标核苷酸序列和PAM序列以外的部位作为目标部位的情况下,有可能在改变后还剩余这些序列,因核酸改变酶等而发生核酸碱基转换反应或脱碱基反应,因此,优选的是,以使这些序列被去除的方式设计供体DNA、或者在同源臂上的目标核苷酸序列或PAM序列中导入沉默突变。
包含编码核酸序列识别模块和/或核酸碱基转换酶等的DNA的表达载体例如能够通过将该DNA与适当的表达载体中的启动子的下游连接来制备。
作为表达载体,能够使用来自大肠杆菌的质粒(例如,pBR322、pBR325、pUC12、pUC13);来自枯草菌的质粒(例如,pUB110、pTP5、pC194);来自酵母的质粒(例如,pSH19、pSH15);昆虫细胞表达质粒(例如pFast-Bac);动物细胞表达质粒(例如,pA1-11、pXT1、pRc/CMV、pRc/RSV、pcDNAI/Neo);λ噬菌体等噬菌体;杆状病毒等昆虫病毒载体(例如,BmNPV、AcNPV);逆转录病毒、牛痘病毒、腺病毒等动物病毒载体等。
作为启动子,只要其是与基因的表达中使用的宿主相应的适当的启动子,就可以使用任意一种。在伴随DSB的以往方法中,存在毒性导致宿主细胞的存活率显著降低的情况,因此,优选使用诱导启动子来增加细胞数量直至诱导开始,但是,由于即便使本发明的核酸改变酶复合体表达也能得到充分的细胞增殖,因此,组成型启动子也能够没有限定地使用。
例如,当宿主为动物细胞时,能够使用SRα启动子、SV40启动子、LTR启动子、CMV(巨细胞病毒)启动子、RSV(劳氏肉瘤病毒)启动子、MoMuLV(莫洛尼氏鼠白血病病毒)LTR、HSV-TK(单纯疱疹病毒胸苷激酶)启动子等。其中,优选CMV启动子、SRα启动子等。
当宿主为大肠杆菌时,优选trp启动子、lac启动子、recA启动子、λPL启动子、lpp启动子、T7启动子等。
当宿主为芽孢杆菌属菌时,优选SPO1启动子、SPO2启动子、penP启动子等。
当宿主为酵母时,优选Gal1/10启动子、PHO5启动子、PGK启动子、GAP启动子、ADH启动子等。
当宿主为昆虫细胞时,优选多角体启动子、P10启动子等。
当宿主为植物细胞时,优选CaMV35S启动子、CaMV19S启动子、NOS启动子等。
作为表达载体,除了上述以外,根据期望能够使用含有增强子、剪接信号、终止子、poly-A加接信号、药剂抗性基因、营养缺陷型互补基因等选择标志物、复制起点等的表达载体。
例如,以对编码上述核酸序列识别模块和/或核酸碱基转换酶等的DNA进行编码的载体为模板,通过本领域公知的体外转录系统转录为mRNA,从而能够制备编码核酸序列识别模块和/或核酸碱基转换酶等的RNA。
将包含编码核酸序列识别模块和/或核酸碱基转换酶等的DNA的表达载体导入宿主细胞并培养该宿主细胞,从而能够使核酸序列识别模块与核酸碱基转换酶等的复合体在细胞内表达。
作为宿主,例如,能够使用埃希氏杆菌属菌、芽孢杆菌属菌、酵母、昆虫细胞、昆虫、动物细胞等。
作为埃希氏杆菌属菌,例如,能够使用大肠杆菌(Escherichia coli)K12·DH1〔Proc.Natl.Acad.Sci.USA,60,160(1968)〕、大肠杆菌JM103〔Nucleic Acids Research,9,309(1981)〕、大肠杆菌JA221〔Journal of Molecular Biology,120,517(1978)〕、大肠杆菌HB101〔Journal of Molecular Biology,41,459(1969)〕、大肠杆菌C600〔Genetics,39,440(1954)〕等。
作为芽孢杆菌属菌,例如,能够使用枯草杆菌(Bacillus subtilis)MI114〔Gene,24,255(1983)〕、枯草杆菌207-21〔Journal of Biochemistry,95,87(1984)〕等。
作为酵母,例如,能够使用酿酒酵母(Saccharomyces cerevisiae)AH22、AH22R-、NA87-11A、DKD-5D、20B-12、粟酒裂殖酵母(Schizosaccharomyces pombe)NCYC1913、NCYC2036、毕赤酵母(Pichia pastoris)KM71等。
作为昆虫细胞,例如,当病毒为AcNPV时,能够使用来自甘蓝夜蛾的幼虫的确立细胞株(草地贪夜蛾细胞;Sf细胞)、来自粉纹夜蛾(Trichoplusia ni)的中肠的MG1细胞、来自粉纹夜蛾卵的High FiveTM细胞、来自甘蓝夜蛾(Mamestra brassicae)的细胞、来自盐泽灯蛾(Estigmena acrea)的细胞等。当病毒为BmNPV时,作为昆虫细胞,能够使用来自蚕的确立细胞株(家蚕N细胞;BmN细胞)等。作为该Sf细胞,例如,能够使用Sf9细胞(ATCC CRL1711)、Sf21细胞〔以上,In Vivo,13,213-217(1977)〕等。
作为昆虫,例如,能够使用蚕的幼虫、果蝇、蟋蟀等〔Nature,315,592(1985)〕。
作为动物细胞,例如,能够使用猴COS-7细胞、猴Vero细胞、中国地鼠卵巢(CHO)细胞、dhfr基因缺失CHO细胞、小鼠L细胞,小鼠AtT-20细胞、小鼠骨髓瘤细胞、大鼠GH3细胞、人胚胎肾细胞(例如HEK293细胞)、人肝癌细胞(例如HepG2)、人FL细胞等细胞株、人及其他哺乳动物的iPS细胞、ES细胞等多能干细胞、由各种组织制备的原代培养细胞。进一步,也能够使用斑马鱼胚胎、非洲爪蟾卵母细胞等。
作为植物细胞,能够使用由各种植物(例如,稻、小麦、玉米等谷物;番茄、黄瓜、茄子等经济作物;康乃馨、洋桔梗等园艺植物;烟草、拟南芥等实验植物等)制备的悬浮培养细胞、愈伤组织、原生质体、叶切片、根切片等。
表达载体的导入能够根据宿主的种类按照公知的方法(例如,溶菌酶法、感受态法、PEG法、CaCl2共沉淀法、电穿孔法、微注射法、基因枪法、脂转染法、农杆菌法等)来实施。也能够通过同样的方法将供体DNA导入细胞。当以不同分子的形式导入表达载体和供体DNA时,表达载体和供体DNA的导入既可以同时进行,也可以在不同的时机进行。
大肠杆菌例如能够按照Proc.Natl.Acad.Sci.USA,69,2110(1972)、Gene,17,107(1982)等记载的方法进行转化。
芽孢杆菌属菌例如能够按照Molecular&General Genetics,168,111(1979)等记载的方法进行载体导入。
酵母例如能够按照Methods in Enzymology,194,182-187(1991)、Proc.Natl.Acad.Sci.USA,75,1929(1978)等记载的方法进行载体导入。
昆虫细胞和昆虫例如能够按照Bio/Technology,6,47-55(1988)等记载的方法进行载体导入。
动物细胞例如能够按照细胞工学附册8新细胞工学实验方案,263-267(1995)(秀润社发行)、Virology,52,456(1973)记载的方法进行载体导入。
导入载体和供体DNA的细胞的培养能够根据宿主的种类按照公知的方法来实施。
例如,当培养大肠杆菌或芽孢杆菌属菌时,作为用于培养的培养基,优选液体培养基。另外,优选培养基含有转化体的生长所需的碳源、氮源、无机物等。此处,作为碳源,例如,可举出葡萄糖、糊精、可溶性淀粉、蔗糖等;作为氮源,例如,可举出铵盐类、硝酸盐类、玉米浆、蛋白胨、酪蛋白、肉提取物、豆粉、马铃薯提取液等无机或有机物质;作为无机物,例如,可举出氯化钙、磷酸二氢钠、氯化镁等。另外,也可以在培养基中添加酵母提取物、维生素类、生长促进因子等。培养基的pH优选为约5~约8。
作为培养大肠杆菌的培养基,例如,优选包含葡萄糖、酪蛋白氨基酸的M9培养基〔Journal of Experiments in Molecular Genetics,431-433,Cold Spring HarborLaboratory,New York 1972〕。根据需要,为了使启动子高效地发挥作用,例如,也可以在培养基中添加像3β-吲哚丙烯酸那样的药剂。大肠杆菌的培养通常在约15~约43℃的条件下进行。根据需要,也可以进行通气、搅拌。
芽孢杆菌属菌的培养通常在约30~约40℃的条件下进行。根据需要,也可以进行通气、搅拌。
作为培养酵母的培养基,例如,可举出伯克霍尔德(Burkholder)基础培养基〔Proc.Natl.Acad.Sci.USA,77,4505(1980)〕、含有0.5%酪蛋白氨基酸的SD培养基〔Proc.Natl.Acad.Sci.USA,81,5330(1984)〕等。培养基的pH优选为约5~约8。培养通常在约20℃~约35℃的条件下进行。根据需要,也可以进行通气、搅拌。
作为培养昆虫细胞或昆虫的培养基,例如能够使用在Grace's昆虫培养基〔Nature,195,788(1962)〕中适当加入失活的10%牛血清等添加物的培养基等。培养基的pH优选为约6.2~约6.4。培养通常在约27℃的条件下进行。根据需要,也可以进行通气、搅拌。
作为培养动物细胞的培养基,例如,能够使用含有约5~约20%的胎牛血清的最低必需培养基(MEM)〔Science,122,501(1952)〕、杜尔贝科(Dulbecco)改良伊格尔(Eagle)培养基(DMEM)〔Virology,8,396(1959)〕、RPMI 1640培养基〔The Journal of the AmericanMedical Association,199,519(1967)〕、199培养基〔Proceeding of the Society forthe Biological Medicine,73,1(1950)〕等。培养基的pH优选为约6~约8。培养通常在约30℃~约40℃的条件下进行。根据需要,也可以进行通气、搅拌。
作为培养植物细胞的培养基,能够使用MS培养基、LS培养基、B5培养基等。培养基的pH优选为约5~约8。培养通常在约20℃~约30℃的条件下进行。根据需要,也可以进行通气、搅拌。
如上所述,能够使核酸序列识别模块与核酸碱基转换酶等的复合体即核酸改变酶复合体在细胞内表达。
通过微注射法、脂转染法等能够将编码核酸序列识别模块和/或核酸碱基转换酶等的RNA导入宿主细胞。RNA导入能够进行一次、或者隔开适当的间隔反复进行多次(例如,2~5次)。
对于锌指基序而言,与目标核苷酸序列特异性结合的锌指的制备效率不高,而且,结合特异性高的锌指的筛选繁杂,因此,大量制备实际发挥作用的锌指基序并不容易。与锌指基序相比,TAL效应因子、PPR基序的目标核酸序列识别的自由度高,但由于需要每次根据目标核苷酸序列设计并构建巨大的蛋白质,因此,在效率方面仍存在问题。
相对于此,CRISPR-Cas系统通过与目标核苷酸序列互补的向导RNA识别目标双链DNA的序列,因此,仅合成能与目标核苷酸序列特异性杂交的寡DNA,就能够靶向任意的序列。
因此,在本发明的更优选实施方式中,作为核酸序列识别模块,能够仅使用Cas效应蛋白质的仅一种DNA切断能力失活或两种DNA切断能力失活的CRISPR-Cas系统(CRISPR-突变Cas)。
使用CRISPR-突变Cas的本发明的核酸序列识别模块以包含与目标核苷酸序列互补的序列的CRISPR-RNA(crRNA)、根据需要招募突变Cas效应蛋白质所需的反式激活RNA(tracrRNA)(在需要tracrRNA的情况下,能够以与crRNA的嵌合RNA的形式提供)、以及突变Cas效应蛋白质的复合体的形式提供。将与突变Cas效应蛋白质结合来构成核酸序列识别模块的、由crRNA单独构成或由crRNA与tracrRNA的嵌合RNA构成的RNA分子统称为“向导RNA”。使用不导入突变的CRISPR/Cas系统的情况也是同样的。
对于本发明中使用的Cas效应蛋白质而言,只要能与向导RNA形成复合体并且能识别并结合于目的基因中的目标核苷酸序列和与其邻接的前间区序列邻近基序(PAM),就没有特别的限定,优选为Cas9(也称为Cas9核酸酶)或Cpf1(也称为Cpf1核酸酶)。作为Cas9,例如,可举出来自酿脓链球菌(Streptococcus pyogenes)的Cas9(SpCas9;PAM序列NGG(N为A、G、T或C。以下相同))、来自嗜热链球菌(Streptococcus thermophilus)的Cas9(StCas9;PAM序列NNAGAAW)、来自脑膜炎双球菌(Neisseria meningitidis)的Cas9(MmCas9;PAM序列NNNNGATT)等,但并不限定于此。优选为PAM的制约少的SpCas9(实质为2个碱基,理论上几乎能够靶向基因组上的任何位置)。另外,作为Cpf1,例如,可举出来自新凶手弗朗西丝氏菌(Francisella novicida)的Cpf1(FnCpf1;PAM序列NTT)、来自氨基酸球菌属(Acidaminococcus sp.)的Cpf1(AsCpf1;PAM序列NTTT)、来自毛螺科菌(Lachnospiraceaebacterium)的Cpf1(LbCpf1;PAM序列NTTT)等,但并不限定于此。作为本发明中使用的突变Cas效应蛋白质(有时简称为突变Cas),能够使用Cas效应蛋白质的双链DNA的两条链的切断能力失活的突变Cas效应蛋白质以及具有仅使一条链的切断能力失活的切口酶活性的突变Cas效应蛋白质中的任意一种。例如,在SpCas9的情况下,能够使用第10个Asp残基转换为Ala残基且缺乏与向导RNA形成互补链的链的相反链的切断能力的(因此,对与向导RNA形成互补链的链具有切口酶活性)D10A突变体、或者第840个His残基用Ala残基转换且缺乏与向导RNA形成互补链的链的切断能力的(因此,对与向导RNA形成互补链的链的相反链具有切口酶活性)H840A突变体及其双重突变体(dCas9)。另外,在FnCpf1的情况下,能够使用第917个Asp残基转换为Ala残基(D917A)或者第1006个Glu残基转换为Ala残基(E1006A)、且缺乏两条链的切断能力的突变体。只要缺乏双链DNA的至少一条链的切断能力即可,其他突变Cas也同样地能够使用。
编码Cas效应蛋白质(包含突变Cas,以下同样)的DNA能够通过与针对编码碱基切除修复的抑制剂的DNA的上述方法同样的方法,由产生该酶的细胞克隆。另外,突变Cas能够通过以下方法获取:使用本领域公知的定向诱变法在克隆化的编码Cas的DNA中导入突变,使得用其他氨基酸转换对DNA切断活性重要的部位的氨基酸残基(例如,在SpCas9的情况下,可举出第10个的Asp残基、第840个的His残基;在FnCpf1的情况下,可举出第917个的Asp残基、第1006个的Glu残基等,但并不限定于此)。
或者,编码Cas效应蛋白质的DNA也能够通过与针对编码核酸序列识别模块的DNA、编码核酸碱基转换酶的DNA的上述方法同样的方法,采用与化学合成或PCR法或无缝克隆法的组合构建为具有适于使用的宿主细胞中的表达的密码子使用的DNA。
根据目标细胞,编码得到的Cas效应蛋白质和/或核酸改变酶和/或碱基切除修复的抑制剂的DNA能够插入与上述同样的表达载体的启动子的下游。
另一方面,对于编码向导RNA的DNA,设计包括与目标核苷酸序列互补的核苷酸序列(本说明书中,也称为“导向序列(targeting sequence)”)的crRNA序列(例如,当招募FnCpf1作为Cas效应蛋白质时,能够使用在导向序列的5’侧包含序列号1;AAUUUCUACUGUUGUAGAU的crRNA,划线部分的序列形成碱基对而构成茎环结构)的编码序列、或者连接包括与目标核苷酸序列互补的核苷酸序列的crRNA编码序列以及根据需要已知的tracrRNA编码序列(例如,作为招募Cas9作为Cas效应蛋白质时的tracrRNA编码序列,为gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt;序列号2或gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtggtgctttt;序列号3)而得的寡DNA序列,使用DNA/RNA合成仪能够进行化学合成。
此处,“目标链”是指目标核苷酸序列中与crRNA杂交的链,将在其相反链因目标链与crRNA的杂交而成为单链状的链称为“非目标链(non-targetedstrand)”。当用一条链表示目标核苷酸序列时(例如表示PAM序列的情况、表示目标核苷酸序列与PAM的位置关系的情况等),用非目标链的序列来代表。
对于导向序列的长度,只要能与目标核苷酸序列特异性结合,就没有特别的限定,例如为15~30个核苷酸,优选为18~25个核苷酸。
导向序列的设计例如通过以下方法进行:当使用Cas9作为Cas效应蛋白质时,使用公开的向导RNA设计网站(CRISPR Design Tool,CRISPRdirect等),从目的基因的CDS序列中列出在3’侧邻接PAM(例如,在SpCas9的情况下,为NGG)的20mer序列,当在从其5’端至3’的方向将7个核苷酸以内的C转换为T时,选择在目的基因编码的蛋白质中产生氨基酸变化那样的序列。另外,在使用除20mer以外的导向序列的长度的情况下,也能够选择适当序列。从这些候选中,能够使用目的宿主基因组中的脱靶位点数少的候选序列作为导向序列。在使用的向导RNA设计软件中没有检索宿主基因组的脱靶位点的功能时,例如,针对候选序列的3’侧的8~12个核苷酸(目标核苷酸序列的识别能力高的seed序列),通过对宿主基因组实施Blast检索,能够检索脱靶位点。
编码向导RNA的DNA也能够插入与上述同样的表达载体,作为启动子,优选使用polIII系的启动子(例如,SNR6、SNR52、SCR1、RPR1、U3、U6、H1启动子等)以及终止子(例如,PolyT序列(T6序列等))。
编码向导RNA(crRNA或crRNA-tracrRNA嵌合)的DNA能够通过设计将与目标核苷酸序列的目标链互补的序列和已知的tracrRNA序列(在招募Cas9的情况下)或crRNA的直接重复序列(在招募Cpf1的情况下)连接而得的寡RNA序列并使用DNA/RNA合成仪来化学合成。
编码突变Cas和/或核酸碱基转换酶等的DNA或RNA、向导RNA-tracrRNA或编码它的DNA能够根据宿主通过与上述同样的方法导入宿主细胞。
对于以往的人工核酸酶而言,由于伴随DNA双链断裂(DSB),因此,以基因组内的序列为目标时,会引起认为由染色体的无序断裂(脱靶断裂)导致的增殖抑制和细胞死亡。在本发明中,并不切断DNA,而利用DNA碱基上取代基的转换反应(特别是脱氨化反应)或脱碱基反应以及之后的修复机构进行目标部位的改变,因此,能够实现毒性的显著降低。
在本发明的方法中,也能够使用不同位置的多个目标核苷酸序列来改变目标部位。因此,在本发明的一实施方式中,能够使用分别与不同目标核苷酸序列特异性结合的两种以上的核酸序列识别模块。在该情况下,这些核酸序列识别模块中的各一个与核酸碱基转换酶等形成核酸改变酶复合体。此处,能够使用共同的核酸碱基转换酶等。例如,当使用CRISPR-Cas系统作为核酸序列识别模块时,使用共同的Cas效应蛋白质和核酸碱基转换酶等的复合体(包含融合蛋白质),作为向导RNA(crRNA或crRNA-tracrRNA嵌合),能够制备并使用两种以上的与不同目标核苷酸序列分别形成互补链的2个以上的crRNA或者2个以上的crRNA中的每一个与tracrRNA的嵌合RNA。另一方面,在使用锌指基序、TAL效应因子等作为核酸序列识别模块的情况下,例如,能够使核酸碱基转换酶等与和不同目标核苷酸特异性结合的各核酸序列识别模块融合。
为了使本发明的核酸改变酶复合体在宿主细胞内表达,如上所述将包含编码该核酸改变酶复合体的DNA的表达载体导入宿主细胞,为了高效地导入突变,优选维持规定期间以上且规定水平以上的核酸改变酶复合体的表达。从这种观点出发,可靠地将该表达载体编入宿主基因组,但是,核酸改变酶复合体的持续表达增大了脱靶断裂的风险,因此,优选在成功地实现目标部位的改变后,快速地去除。作为用于去除编入宿主基因组的DNA的方法,可举出使用Cre-loxP系、FLP-FRT系的方法、使用转座子的方法等。
或者,在所期望的时期引起核酸反应,仅在目标部位的改变被固定所需的期间使本发明的核酸改变酶复合体在宿主细胞内短暂表达,由此,能够避免脱靶断裂的风险而且高效地实现宿主基因组的编辑。本领域技术人员能够基于使用的培养条件等适当确定优选的表达诱导期间。编码本发明的核酸改变酶复合体的核酸的表达诱导期间可以在不会使宿主细胞产生副作用的范围内超出上述“目标部位的改变被固定所需的期间”并延长。
作为使本发明的核酸改变酶复合体在所期望的时期短暂表达所期望的期间的方法,可举出制备以能够控制表达期间的方式包含编码该核酸改变酶复合体的核酸(在突变CRISPR-Cas系统中,编码向导RNA的DNA和编码Cas效应蛋白质和核酸改变酶等的DNA)的构建体(表达载体),并导入宿主内的方法。作为“能够控制表达期间的方式”,具体而言,可举出将编码本发明的核酸改变酶复合体的核酸处于诱导性的调节区域的控制下。对“诱导性的调节区域”没有特别的限定,例如,可举出温度敏感(ts)突变阻抑物与被其控制的操纵基因的操纵子。作为ts突变阻抑物,例如,可举出来自λ噬菌体的cI阻抑物的ts突变体,但并不限定于此。在λ噬菌体cI阻抑物(ts)的情况下,在30℃以下(例如,28℃)的条件下与操纵基因结合从而抑制下游的基因表达,而在37℃以上(例如,42℃)的高温条件下,由于从操纵基因解离,因此诱导基因表达。因此,通常,在30℃以下培养导入了编码核酸改变酶复合体的核酸的宿主细胞,在适当的时期将温度提高至37℃以上并培养规定期间,使其进行同源重组,在目标基因中导入突变后,快速回到30℃以下,从而能够使目标基因的表达被抑制的期间达到最短,即使在靶向对于宿主细胞而言必需基因的情况下,也能够控制副作用并且高效地编辑。
在利用温度敏感突变的情况下,例如,通过将载体的自主复制所需的蛋白质的温度敏感突变体搭载在包含编码本发明的核酸改变酶复合体的DNA的载体中,由此,在该核酸改变酶复合体表达后,不能快速自主复制,随着细胞分裂,该载体自然脱落。作为这种温度敏感突变蛋白质,可举出pSC101ori的复制所需的Rep101 ori的温度敏感突变体,但并不限定于此。对于Rep101ori(ts)而言,在30℃以下(例如28℃),能够作用于pSC101 ori而进行质粒的自主复制,但达到37℃以上(例如42℃)时,功能消失,质粒不能自主复制。因此,通过与上述λ噬菌体的cI阻抑物(ts)联合使用,能够同时进行本发明的核酸改变酶复合体的短暂表达和质粒去除。
另外,在诱导启动子(例如,lac启动子(通过IPTG诱导)、cspA启动子(通过冷激诱导)、araBAD启动子(通过阿拉伯糖诱导)等)的控制下将编码本发明的核酸改变酶复合体的DNA导入宿主细胞内,在适当的时期在培养基中添加诱导物质(或从培养基去除)来诱导该核酸改变酶复合体的表达,培养规定期间,进行核酸改变反应,在目标基因导入突变后,能够实现核酸改变酶复合体的短暂表达。
以下,通过实施例对本发明进行说明。但是,本发明并不限定于这些实施例。
实施例
<酿酒酵母的细胞株的培养、转化、表达诱导>
使用酿酒酵母Saccharomyces cerevisiae BY4741株(亮氨酸和尿嘧啶营养缺陷型),通过符合标准YPDA培养基或SD培养基的营养缺陷型的缺陷型(dropout)组成进行培养。对于培养,在25℃至30℃之间进行采用琼脂板的静置培养或采用液体培养基的震动培养。对于转化,采用醋酸锂法,用符合适当的营养缺陷型的SD培养基进行选择。对于使用半乳糖的表达诱导,用适当的SD培养基预培养一夜后,在将碳源由2%葡萄糖替换为2%棉子糖的SR培养基中继代培养,培养一夜,再在将碳源替换为0.2%半乳糖的SGal培养基中继代培养,培养3小时至两夜左右,进行表达诱导。
对于存活细胞数量和Can1突变率的测定,将细胞悬浮液适当稀释并涂布在SD板培养基以及SD-Arg+60mg/l刀豆氨酸板培养基或SD+300mg/l刀豆氨酸板培养基中,对3天后出现的菌落数进行计数并作为存活细胞数量。将SD板中的存活菌落数作为总细胞数量,将刀豆氨酸板中的存活菌落数作为耐性突变株数,算出并评价突变率。对于突变导入部位,通过菌落PCR法对包含各株的目的基因区域的DNA片段进行扩增后,进行DNA测序,基于酵母基因组数据库(http://www.yeastgenome.org/)的序列进行比对解析并鉴定。
<动物细胞的细胞株的培养、表达诱导>
使用添加了10μg/mL嘌呤霉素(美国生命技术公司)和10%胎牛血清(FBS)(法国Biosera公司,尼艾莱(Nuaille))的DME-glutamax培养基(赛默飞世尔科技公司)在37℃、5%CO2条件下对人胚胎肾细胞(HEK293T细胞)进行培养。采用5%胰蛋白酶进行细胞的回收。用37℃的水浴溶解在冷藏器(deep freezer)中保存的HEK293T细胞,播种到75T-烧瓶,以达到5×106个细胞。培养1-3天后回收细胞,播种到24孔板的各孔,以达到0.5×105个细胞/孔。培养1-3天后,使用各500ng/孔的下述质粒(效应质粒和报告质粒)(总计1μg/孔)、200nM的供体DNA、1.5μl的FugeneHD(普洛麦格公司(プロメガ)),对60-80%汇合状态的各孔的细胞进行转染。将各实施例中使用的供体DNA示于表1。转染72小时后回收细胞,使用FACS检测iRFP和EGFP的荧光。通过下述式,根据检测到的细胞数量算出重组效率(%)。
表1
Figure BDA0002377973960000261
数学式1
Figure BDA0002377973960000271
<核酸操作>
DNA通过PCR法、限制性酶处理、连接、无缝克隆法、人工化学合成中的任意一种方法加工并构建。对质粒而言,作为酵母/大肠杆菌穿梭载体使用亮氨酸选择用pRS415和尿嘧啶选择用pRS426作为骨架。质粒采用大肠杆菌株XL-10gold或DH5α进行扩增,采用醋酸锂法导入酵母。
<酿酒酵母用构建体的构建>
同源臂、向导RNA、插入序列等序列参照酵母基因组的数据库(https://www.yeastgenome.org/)来设计。载体构建按照Nishida K.et al.,Science 16:353(6305)(2016)doi:10.1126/science.aaf8729记载的方法来进行。1×gRNA载体相当于将序列号15的序列的第5871个~第5890个碱基序列置换为L86或M4的目标核苷酸序列的互补序列而得的载体。2×gRNA载体相当于将序列号16的序列的第2638个~第2657个碱基序列置换为L86、L87、L88、L93以及R90中的任意一个目标核苷酸序列的互补序列且将序列号16的第6293个~第6312个碱基序列置换为L87、R89、R90、R91以及R92中的任意一个目标核苷酸序列的互补序列而得的载体。上述目标核苷酸如下所述。
L86:CGAACAGAGTAAACCGAATC(序列号17)
L87:AGCACTATCAAGGCTAATAA(序列号18)
L88:GCGAACTTGAAGAATAACCA(序列号19)
R89:TCACCTAACTCAGACATTAT(序列号20)
R90:TTGCTGATTCTATTTACAAA(序列号21)
R91:GCAAACTCTATTCTTGGTGC(序列号22)
R92:ACCAGAGTATCATCCATGTC(序列号23)
L93:AATTCGGACACTTTAGGGTT(序列号24)
M4:AGATATTATACCTGGACCCC(序列号25)
<动物细胞用构建体的构建>
pcDNA3.1载体骨架和CMV、PmCDA1、Cas9、H1、sgRNA的各序列来自Nishida等2016的论文。各突变通过PCR法导入。EF1、iRFP和mEGFP片段通过人工基因合成制备。通过无缝克隆或连接反应插入或置换片段。
分别用序列号42~44表示制成的载体SY4(H1_sgRNA、CMV_mEGFP)(报告质粒)、载体SY45(CMV_Cas9-PmCDA1、EF1_iRFP)以及载体SY45(CMV_Cas9、EF1_iRFP)的序列。载体SY45(CMV_nCas9(D10A)-PmCDA1、EF1_iRFP)相当于序列号43中将第770~772个碱基置换为gct而得的载体。载体SY45(CMV_nCas9(H840A)-PmCDA1、EF1_iRFP)相当于序列号43中将第3260~3262个碱基置换为gct而得的载体。载体SY45(CMV_dCas9-PmCDA1、EF1_iRFP)相当于序列号43中将第770~772个碱基置换为gct且将第3260~3262个碱基置换为gct而得的载体。另外,载体SY45(CMV_nCas9(D10A)、EF1_iRFP)相当于序列号44中将第3724~3726个碱基置换为gct而得的载体。载体SY45(CMV_nCas9(H840A)、EF1_iRFP)相当于序列号44中将第6214~6216个碱基置换为gct而得的载体。载体SY45(CMV_dCas9、EF1_iRFP)相当于序列号44中将第3724~3726个碱基置换为gct且将第6214~6216个碱基置换为gct而得的载体。
<细胞的DNA的测序>
通过FACS分取iRFP阳性细胞,然后提取基因组DNA和导入的质粒DNA后,制备以下的样品,在以下的条件下进行PCR并对目的部位进行扩增。
样品制备:
Figure BDA0002377973960000281
PCR的条件:在94℃条件下保持2分钟后,将在94℃条件下45秒、55℃条件下45秒、72℃条件下1分钟30秒的循环进行33次循环,最后在72℃条件下保持5分钟。
作为扩增用引物,使用以下的SY157和SY182。扩增产物的大小为1554bp。
SY157:TTCTGCTTGTCGGCCATGAT(序列号47)
SY182:AGGCAAGGCTTGACCGACAATT(序列号48)
切出扩增产物,使用快速基因(Fastgene)纯化后,对各纯化产物和pGEM-teasy载体进行TA克隆,用该载体转化大肠杆菌(JM109)。然后,每个样品采集24个菌落(选择蓝白色),通过Mini prep(使用快速基因(Fastgene))纯化质粒DNA。
然后,制备以下的测序混合液,外包给金唯智公司(Genewiz)来获得序列信息。
Figure BDA0002377973960000291
最后,使用Snapgene软件对获得的序列信息进行比对。
实施例1:使用dCas9-CDA和供体DNA、或nCas9-CDA和供体DNA将插入序列插入目标 部位
通过质粒载体1525(序列号4的第6036个碱基为g,第6037个碱基为c)或1526(序列号4的第6036个碱基为c,第6037个碱基为a)、1059(序列号5)或1149(相当于将序列号5的序列的第3890个~第3909个碱基序列置换为TCCAATAACGGAATCCAACT(序列号6)而得的载体)对酿酒酵母BY4741株进行双重转化,通过营养缺陷型培养基(SD-Leu-Ura)选择。用S-Leu-Ura 2%棉子糖培养基培养一夜。在S-Leu-Ura 2%棉子糖+0.02%半乳糖培养基中以1/32稀释,在30℃条件下培养一夜。以10倍稀释在SD-Ura-Leu和SD-Ura-Leu+刀豆氨酸板上点样。两天后,对刀豆氨酸耐性菌落进行序列解析。其结果是,确认了突变插入到目标部位(图2)。
实施例2:重组的评价系统的构建
将用SmaI/HpaI处理质粒载体1548(序列号7)而得到的DNA片段转化在BY4741株中,用SD-Ura培养基选择。通过序列解析确认编入Ade1区域。
实施例3:使用重组的评价系统的重组反应的验证实验
将上述任意一个质粒载体转化在验证实验株中,用SD-Leu-Ura培养基选择。用S-Leu-Ura 2%棉子糖培养基培养一夜。将在S-Leu 2%棉子糖+0.02%(或0.2%)半乳糖培养基中以1/32稀释,并在30℃条件下培养一夜的菌株作为5代。为了获得20代,反复进行1/32稀释共4次。以10倍稀释在SD-Leu板上点样,两天后,对菌落数和颜色进行评价。其结果是,Ade1功能恢复,变白的菌落以高频率出现,因此,通过本发明的方法,显示出在目标部位的同源重组的诱导(图4)。
实施例4:本发明的敲入或敲除的验证实验
通过质粒载体1251(序列号8)和2×gRNA载体对酿酒酵母BY4741株进行双重转化,通过营养缺陷型培养基(SD-Leu-Ura)进行选择。用S-Leu-Ura2%棉子糖培养基培养一夜。在S-Leu-Ura 2%棉子糖+0.2%半乳糖培养基中以1/32稀释,在30℃条件下培养一夜。以10倍稀释在SD-Ura-Leu和SD-Ura-Leu(+刀豆氨酸)板中点样,两天后,对刀豆氨酸耐性菌落进行序列解析。其结果是,通过本发明的方法能够高效地实现敲入(图6)。
实施例5:动物细胞中的重组反应的验证实验
使用单链寡DNA(70碱基长度)(表1)作为供体DNA,验证是否在动物细胞(HEK293T细胞)中产生重组反应。将实验的概略图示于图7。作为报告质粒,使用载体SY4(H1_sgRNA、CMV_mEGFP),作为效应质粒,使用载体SY45(CMV_Cas9-PmCDA1、EF1_iRFP)、载体SY45(CMV_nCas9(D10A)-PmCDA1、EF1_iRFP)、载体SY45(CMV_nCas9(H840A)-PmCDA1、EF1_iRFP)、载体SY45(CMV_dCas9-PmCDA1、EF1_iRFP)、载体SY45(CMV_Cas9、EF1_iRFP)、载体SY45(CMV_nCas9(D10A)、EF1_iRFP)、载体SY45(CMV_nCas9(H840A)、EF1_iRFP)或载体SY45(CMV_dCas9、EF1_iRFP)。当使用Fw2、Fw3作为供体DNA时,在成功地产生同源重组的情况下,在编码EGFP的序列中产生开始密码子,结果确认了EGFP的表达。Fw1是设计成即使产生同源重组在编码EGFP的序列中也不会产生开始密码子的供体DNA,其作为阴性对照使用。Fw3是Fw2的同源臂的1个碱基被置换(c→g)而成的,用于验证即使在同源臂与目标部位的邻接区域并不完全相同的情况下,是否也产生同源重组反应以及是否也能够导入多个不同部位的突变。
将结果示于图8。表明了与使用nCas9的情况相比,在使用nCas9-pmCDA1的情况下,同源重组效率高,表现出与使用Cas9的情况同等以上的同源重组效率。另外,即使在使用dCas9-pmCDA1的情况下,也确认了显著的同源重组。确认了在使用Fw2作为供体DNA的情况和使用Fw3作为供体DNA的情况下,同源重组率存在显著的差异。
实施例6:供体DNA的碱基数以及互补链的种类(正链(Fw)或反链(Rv))对同源重组 反应的影响的验证
验证了使用单链寡DNA(50个碱基长度)(表1)作为供体DNA在动物细胞(HEK293T细胞)中是否产生重组反应。将实验的概略图示于图9。作为报告质粒,使用载体SY4(H1_sgRNA、CMV_mEGFP),作为效应质粒,使用载体SY45(CMV_nCas9(D10A))-PmCDA1、EF1_iRFP)或载体SY45(CMV_nCas9(H840A))-PmCDA1。
将结果示于图10。表明了50个碱基长度的单链寡DNA也能够同源重组,互补链为Fw、Rv中的任意一个都能够同源重组,而且,nCas9采用nCas9(D10A)和nCas9(H840A)中的任意一种形式都能够同源重组。
实施例7:供体DNA的同源臂的验证
使用具有针对不同的同源区域的同源臂的供体DNA(表1),验证了通过同源区域进行同源重组反应的效率的变化。将实验的概略图示于图11。作为报告质粒,使用载体SY4(H1_sgRNA、CMV_mEGFP),作为效应质粒,使用载体SY45(CMV_nCas9(D10A))-PmCDA1、EF1_iRFP)或载体SY45(CMV_nCas9(H840A))-PmCDA1。
将结果示于图12。表明了当以同源区域的产生切口的部位至基于PmCDA1的脱氨酶部位为中心时,设计供体DNA使得该区域的3’侧的同源臂比5’侧的同源臂更长,同源重组的效率提高。
实施例8:哺乳动物细胞的DNA中的改变的验证
使用与实施例5中的使用Fw2的实验相同的gRNA和供体DNA,验证DNA中的改变。将结果示于以下表2。验证了与使用Cas9的情况相比,在使用nCas9(D10A)-PmCDA1和nCas9(H840A)-PmCDA1的情况下,显著抑制了作为副产物的插入和/或缺失的产生,即,降低了细胞毒性。需要说明的是,本实施例中使用的DNA的用语包括基因组DNA和质粒DNA两种。
表2
载体 是否SEQ 插入和/或缺失 置换
nCas9(D10A) 23/24 0/23 1/23
Cas9 22/24 5/22 0/22
nCas9(D10A)-CDA1 23/24 1/23 0/23
nCas9(H840A)-CDA1 22/24 0/22 3/22
本研究中的置换表示在gRNA目标序列中能观察到的碱基置换。
需要说明的是,并没有确认像认为CDA1发挥作用的碱基置换C→T那样的突变。
如上所述,在使用nCas9-CDA的情况下,同源重组的效率为使用Cas9的情况的同等程度以上,也能够避免使用Cas9的情况下产生的作为副产物的插入和/或缺失、高细胞毒性。因此,使用nCas9-CDA的方法能够比以往的方法更有益和有用。进一步,通过使用nCas9-CDA,与以避免在使用Cas9时产生的上述问题为目的而使用的nCas9相比,更能实现高效率。
本申请以在日本申请的日本特愿2018-059073(申请日:2018年3月26日)为基础,其内容全部包括在本说明书中。
工业实用性
根据本发明,提供使用脱氨酶等核酸碱基转换酶或DNA糖苷酶的新的DNA改变技术,其在不受能够导入的突变的类型、突变部位制约的情况下能够改变基因的方向、组合或者敲入基因片段。本发明的DNA改变技术能够在不切断双链DNA的情况下改变目标部位,因此,能够将伴随断裂的预期以外的改编、毒性抑制得低,而且,与以往方法相比,能够更高效地改变目标部位,因而极其有用。
序列表
<110> 国立大学法人神户大学
<120> 改变细胞具有的双链DNA的目标部位的方法
<130> 092857
<150> JP 2018-059073
<151> 2018-03-26
<160> 48
<170> PatentIn version 3.5
<210> 1
<211> 19
<212> RNA
<213> 新凶手弗朗西丝氏菌(Francisella novicida)
<220>
<221> misc_structure
<222> (1)..(19)
<223> crRNA的直接重复序列(crRNA direct repeat sequence)
<400> 1
aauuucuacu guuguagau 19
<210> 2
<211> 83
<212> DNA
<213> 酿脓链球菌(Streptococcus pyogenes)
<220>
<221> misc_structure
<222> (1)..(83)
<223> tracrRNA
<400> 2
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60
ggcaccgagt cggtgctttt ttt 83
<210> 3
<211> 83
<212> DNA
<213> 酿脓链球菌(Streptococcus pyogenes)
<220>
<221> misc_structure
<222> (1)..(83)
<223> tracrRNA
<400> 3
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60
ggcaccgagt cggtggtgct ttt 83
<210> 4
<211> 12344
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221>
<222>
<223> 质粒载体1525(dCas9/nCas9-CDA)(Plasmid Vector 1525(dCas9/nCas9-CDA))
<220>
<221> misc_structure
<222> (70)..(573)
<223> CEN/ARS
<220>
<221> 启动子(promoter)
<222> (610)..(714)
<223> AmpR启动子(AmpR pro)
<220>
<221> rep_origin
<222> (1746)..(2334)
<223> ori
<220>
<221> 启动子(promoter)
<222> (2852)..(3516)
<223> GAL1,10 启动子(GAL1,10 promoter)
<220>
<221> misc_feature
<222> (3068)..(3185)
<223> Gal4 UAS
<220>
<221> 基因(gene)
<222> (3519)..(7655)
<223> dCas9(D10A, H840A)/nCas9(D10A)
<220>
<221> 突变(mutation)
<222> (3546)..(3548)
<223> D10A
<220>
<221> 突变(mutation)
<222> (6036)..(6038)
<223> H840A或野生型(H840A or Wild Type)
<220>
<221> misc_feature
<222> (7635)..(7655)
<223> SV40 NLS
<220>
<221> misc_feature
<222> (7686)..(7856)
<223> 失效SH3(dead SH3)
<220>
<221> misc_feature
<222> (7863)..(7928)
<223> 3xFLAG
<220>
<221> 基因(gene)
<222> (7935)..(8558)
<223> PmCDA1
<220>
<221> 终止子(terminator)
<222> (8589)..(8776)
<223> ADH1终止子(ADH1 terminator)
<220>
<221> misc_feature
<222> (8862)..(9209)
<223> CAN1(突变)片段(CAN1(mut) fragment)
<220>
<221> 突变(mutation)
<222> (8875)..(8875)
<223> 突变1(Mutation 1)
<220>
<221> 突变(mutation)
<222> (8911)..(8911)
<223> 突变2(Mutation 2)
<220>
<221> 启动子(promoter)
<222> (10171)..(10575)
<223> 酿酒酵母LEU2 LEU2启动子(S. cerevisiae LEU2 LEU2 prom)
<220>
<221> 基因(gene)
<222> (10588)..(11682)
<223> 酿酒酵母LEU2(S. cerevisiae LEU2)
<400> 4
gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 60
cttaggacgg atcgcttgcc tgtaacttac acgcgcctcg tatcttttaa tgatggaata 120
atttgggaat ttactctgtg tttatttatt tttatgtttt gtatttggat tttagaaagt 180
aaataaagaa ggtagaagag ttacggaatg aagaaaaaaa aataaacaaa ggtttaaaaa 240
atttcaacaa aaagcgtact ttacatatat atttattaga caagaaaagc agattaaata 300
gatatacatt cgattaacga taagtaaaat gtaaaatcac aggattttcg tgtgtggtct 360
tctacacaga caagatgaaa caattcggca ttaatacctg agagcaggaa gagcaagata 420
aaaggtagta tttgttggcg atccccctag agtcttttac atcttcggaa aacaaaaact 480
attttttctt taatttcttt ttttactttc tatttttaat ttatatattt atattaaaaa 540
atttaaatta taattatttt tatagcacgt gatgaaaagg acccaggtgg cacttttcgg 600
ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa tatgtatccg 660
ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa gagtatgagt 720
attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct tcctgttttt 780
gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg 840
ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg ccccgaagaa 900
cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt atcccgtatt 960
gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga cttggttgag 1020
tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga attatgcagt 1080
gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac gatcggagga 1140
ccgaaggagc taaccgcttt ttttcacaac atgggggatc atgtaactcg ccttgatcgt 1200
tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac gatgcctgta 1260
gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct agcttcccgg 1320
caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct gcgctcggcc 1380
cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg gtctcgcggt 1440
atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat ctacacgacg 1500
ggcagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg tgcctcactg 1560
attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat tgatttaaaa 1620
cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa 1680
atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga 1740
tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg 1800
ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact 1860
ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac 1920
cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg 1980
gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg 2040
gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga 2100
acgacctaca ccgaactgag atacctacag cgtgagcatt gagaaagcgc cacgcttccc 2160
gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg 2220
agggagcttc caggggggaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc 2280
tgacttgagc gtcgattttt gtgatgctcg tcaggggggc cgagcctatg gaaaaacgcc 2340
agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca catgttcttt 2400
cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg agctgatacc 2460
gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc ggaagagcgc 2520
ccaatacgca aaccgcctct ccccgcgcgt tggccgattc attaatgcag ctggcacgac 2580
aggtttcccg actggaaagc gggcagtgag cgcaacgcaa ttaatgtgag ttagctcact 2640
cattaggcac cccaggcttt acactttatg cttccggctc gtatgttgtg tggaattgtg 2700
agcggataac aatttcacac aggaaacagc tatgaccatg attacgccaa gctcgaaatt 2760
aaccctcact aaagggaaca aaagctggta ccgggcccga attctctcct tctcttaggt 2820
ggcagagcag gtggagggtc gaccatacta gtttcaaaaa ttcttacttt ttttttggat 2880
ggacgcaaag aagtttaata atcatattac atggcattac caccatatac atatccatat 2940
acatatccat atctaatctt acttatatgt tgtggaaatg taaagagccc cattatctta 3000
gcctaaaaaa accttctctt tggaactttc agtaatacgc ttaactgctc attgctatat 3060
tgaagtacgg attagaagcc gccgagcggg tgacagccct ccgaaggaag actctcctcc 3120
gtgcgtcctc gtcttcaccg gtcgcgttcc tgaaacgcag atgtgcctcg cgccgcactg 3180
ctccgaacaa taaagattct acaatactag cttttatggt tatgaagagg aaaaattggc 3240
agtaacctgg ccccacaaac cttcaaatga acgaatcaaa ttaacaacca taggatgata 3300
atgcgattag ttttttagcc ttatttctgg ggtaattaat cagcgaagcg atgatttttg 3360
atctattaac agatatataa atgcaaaaac tgcataacca ctttaactaa tactttcaac 3420
attttcggtt tgtattactt cttattcaaa tgtaataaaa gtatcaacaa aaaattgtta 3480
atatacctct atactttaac gtcaaggaga aaaaacccat ggacaagaag tactccattg 3540
ggctcgctat cggcacaaac agcgtcggtt gggccgtcat tacggacgag tacaaggtgc 3600
cgagcaaaaa attcaaagtt ctgggcaata ccgatcgcca cagcataaag aagaacctca 3660
ttggcgccct cctgttcgac tccggggaga cggccgaagc cacgcggctc aaaagaacag 3720
cacggcgcag atatacccgc agaaagaatc ggatctgcta cctgcaggag atctttagta 3780
atgagatggc taaggtggat gactctttct tccataggct ggaggagtcc tttttggtgg 3840
aggaggataa aaagcacgag cgccacccaa tctttggcaa tatcgtggac gaggtggcgt 3900
accatgaaaa gtacccaacc atatatcatc tgaggaagaa gcttgtagac agtactgata 3960
aggctgactt gcggttgatc tatctcgcgc tggcgcatat gatcaaattt cggggacact 4020
tcctcatcga gggggacctg aacccagaca acagcgatgt cgacaaactc tttatccaac 4080
tggttcagac ttacaatcag cttttcgaag agaacccgat caacgcatcc ggagttgacg 4140
ccaaagcaat cctgagcgct aggctgtcca aatcccggcg gctcgaaaac ctcatcgcac 4200
agctccctgg ggagaagaag aacggcctgt ttggtaatct tatcgccctg tcactcgggc 4260
tgacccccaa ctttaaatct aacttcgacc tggccgaaga tgccaagctt caactgagca 4320
aagacaccta cgatgatgat ctcgacaatc tgctggccca gatcggcgac cagtacgcag 4380
accttttttt ggcggcaaag aacctgtcag acgccattct gctgagtgat attctgcgag 4440
tgaacacgga gatcaccaaa gctccgctga gcgctagtat gatcaagcgc tatgatgagc 4500
accaccaaga cttgactttg ctgaaggccc ttgtcagaca gcaactgcct gagaagtaca 4560
aggaaatttt cttcgatcag tctaaaaatg gctacgccgg atacattgac ggcggagcaa 4620
gccaggagga attttacaaa tttattaagc ccatcttgga aaaaatggac ggcaccgagg 4680
agctgctggt aaagcttaac agagaagatc tgttgcgcaa acagcgcact ttcgacaatg 4740
gaagcatccc ccaccagatt cacctgggcg aactgcacgc tatcctcagg cggcaagagg 4800
atttctaccc ctttttgaaa gataacaggg aaaagattga gaaaatcctc acatttcgga 4860
taccctacta tgtaggcccc ctcgcccggg gaaattccag attcgcgtgg atgactcgca 4920
aatcagaaga gaccatcact ccctggaact tcgaggaagt cgtggataag ggggcctctg 4980
cccagtcctt catcgaaagg atgactaact ttgataaaaa tctgcctaac gaaaaggtgc 5040
ttcctaaaca ctctctgctg tacgagtact tcacagttta taacgagctc accaaggtca 5100
aatacgtcac agaagggatg agaaagccag cattcctgtc tggagagcag aagaaagcta 5160
tcgtggacct cctcttcaag acgaaccgga aagttaccgt gaaacagctc aaagaagact 5220
atttcaaaaa gattgaatgt ttcgactctg ttgaaatcag cggagtggag gatcgcttca 5280
acgcatccct gggaacgtat cacgatctcc tgaaaatcat taaagacaag gacttcctgg 5340
acaatgagga gaacgaggac attcttgagg acattgtcct cacccttacg ttgtttgaag 5400
atagggagat gattgaagaa cgcttgaaaa cttacgctca tctcttcgac gacaaagtca 5460
tgaaacagct caagaggcgc cgatatacag gatgggggcg gctgtcaaga aaactgatca 5520
atgggatccg agacaagcag agtggaaaga caatcctgga ttttcttaag tccgatggat 5580
ttgccaaccg gaacttcatg cagttgatcc atgatgactc tctcaccttt aaggaggaca 5640
tccagaaagc acaagtttct ggccaggggg acagtcttca cgagcacatc gctaatcttg 5700
caggtagccc agctatcaaa aagggaatac tgcagaccgt taaggtcgtg gatgaactcg 5760
tcaaagtaat gggaaggcat aagcccgaga atatcgttat cgagatggcc cgagagaacc 5820
aaactaccca gaagggacag aagaacagta gggaaaggat gaagaggatt gaagagggta 5880
taaaagaact ggggtcccaa atccttaagg aacacccagt tgaaaacacc cagcttcaga 5940
atgagaagct ctacctgtac tacctgcaga acggcaggga catgtacgtg gatcaggaac 6000
tggacatcaa tcggctctcc gactacgacg tggatsmtat cgtgccccag tcttttctca 6060
aagatgattc tattgataat aaagtgttga caagatccga taaaaataga gggaagagtg 6120
ataacgtccc ctcagaagaa gttgtcaaga aaatgaaaaa ttattggcgg cagctgctga 6180
acgccaaact gatcacacaa cggaagttcg ataatctgac taaggctgaa cgaggtggcc 6240
tgtctgagtt ggataaagcc ggcttcatca aaaggcagct tgttgagaca cgccagatca 6300
ccaagcacgt ggcccaaatt ctcgattcac gcatgaacac caagtacgat gaaaatgaca 6360
aactgattcg agaggtgaaa gttattactc tgaagtctaa gctggtctca gatttcagaa 6420
aggactttca gttttataag gtgagagaga tcaacaatta ccaccatgcg catgatgcct 6480
acctgaatgc agtggtaggc actgcactta tcaaaaaata tcccaagctt gaatctgaat 6540
ttgtttacgg agactataaa gtgtacgatg ttaggaaaat gatcgcaaag tctgagcagg 6600
aaataggcaa ggccaccgct aagtacttct tttacagcaa tattatgaat tttttcaaga 6660
ccgagattac actggccaat ggagagattc ggaagcgacc acttatcgaa acaaacggag 6720
aaacaggaga aatcgtgtgg gacaagggta gggatttcgc gacagtccgg aaggtcctgt 6780
ccatgccgca ggtgaacatc gttaaaaaga ccgaagtaca gaccggaggc ttctccaagg 6840
aaagtatcct cccgaaaagg aacagcgaca agctgatcgc acgcaaaaaa gattgggacc 6900
ccaagaaata cggcggattc gattctccta cagtcgctta cagtgtactg gttgtggcca 6960
aagtggagaa agggaagtct aaaaaactca aaagcgtcaa ggaactgctg ggcatcacaa 7020
tcatggagcg atcaagcttc gaaaaaaacc ccatcgactt tctcgaggcg aaaggatata 7080
aagaggtcaa aaaagacctc atcattaagc ttcccaagta ctctctcttt gagcttgaaa 7140
acggccggaa acgaatgctc gctagtgcgg gcgagctgca gaaaggtaac gagctggcac 7200
tgccctctaa atacgttaat ttcttgtatc tggccagcca ctatgaaaag ctcaaagggt 7260
ctcccgaaga taatgagcag aagcagctgt tcgtggaaca acacaaacac taccttgatg 7320
agatcatcga gcaaataagc gaattctcca aaagagtgat cctcgccgac gctaacctcg 7380
ataaggtgct ttctgcttac aataagcaca gggataagcc catcagggag caggcagaaa 7440
acattatcca cttgtttact ctgaccaact tgggcgcgcc tgcagccttc aagtacttcg 7500
acaccaccat agacagaaag cggtacacct ctacaaagga ggtcctggac gccacactga 7560
ttcatcagtc aattacgggg ctctatgaaa caagaatcga cctctctcag ctcggtggag 7620
acagcagggc tgaccccaag aagaagagga aggtgggtgg aggaggttct ggaggtggag 7680
gttctgcaga gtatgtgcgg gccctctttg actttaatgg gaatgatgaa gaagatcttc 7740
cctttaagaa aggagacatc ctgagaatcc gggataagcc tgaagagcag tggtggaatg 7800
cagaggacag cgaaggaaag agggggatga ttcttgtccc ttacgtggag aagtattccg 7860
gagactataa ggaccacgac ggagactaca aggatcatga tattgattac aaagacgatg 7920
acgataagtc taggatgacc gacgctgagt acgtgagaat ccatgagaag ttggacatct 7980
acacgtttaa gaaacagttt ttcaacaaca aaaaatccgt gtcgcataga tgctacgttc 8040
tctttgaatt aaaacgacgg ggtgaacgta gagcgtgttt ttggggctat gctgtgaata 8100
aaccacagag cgggacagaa cgtggcattc acgccgaaat ctttagcatt agaaaagtcg 8160
aagaatacct gcgcgacaac cccggacaat tcacgataaa ttggtactca tcctggagtc 8220
cttgtgcaga ttgcgctgaa aagatcttag aatggtataa ccaggagctg cgggggaacg 8280
gccacacttt gaaaatctgg gcttgcaaac tctattacga gaaaaatgcg aggaatcaaa 8340
ttgggctgtg gaacctcaga gataacgggg ttgggttgaa tgtaatggta agtgaacact 8400
accaatgttg caggaaaata ttcatccaat cgtcgcacaa tcaattgaat gagaatagat 8460
ggcttgagaa gactttgaag cgagctgaaa aacgacggag cgagttgtcc attatgattc 8520
aggtaaaaat actccacacc actaagagtc ctgctgtttc tagaggctcc ggataaggat 8580
cctaataagc gaatttctta tgatttatga tttttattat taaataagtt ataaaaaaaa 8640
taagtgtata caaattttaa agtgactctt aggttttaaa acgaaaattc ttattcttga 8700
gtaactcttt cctgtaggtc aggttgcttt ctcaggtata gcatgaggtc gctcttattg 8760
accacacctc taccggcatg ccgagcaaat gcctgcaaat cgctcccggg caaaaaaccc 8820
cctcaagacc cgtttagagg ccccaagggg ttatgctatg cattccgtta ttggtgaaac 8880
ccaggtgcct ggggtccagg tataatatct taggataaaa acgaagggag gttcttaggt 8940
tgggtttcct ctttgattaa cgctgccttc acatttcaag gtactgaact agttggtatc 9000
actgctggtg aagctgcaaa ccccagaaaa tccgttccaa gagccatcaa aaaagttgtt 9060
ttccgtatct taaccttcta cattggctct ctattattca ttggactttt agttccatac 9120
aatgacccta aactaacaca atctacttcc tacgtttcta cttctccctt tattattgct 9180
attgagaact ctggtacaaa ggttttgccg cggtggagct ccaattcgcc ctatagtgag 9240
tcgtattaca attcactggc cgtcgtttta caacgtcgtg actgggaaaa ccctggcgtt 9300
acccaactta atcgccttgc agcacatccc cccttcgcca gctggcgtaa tagcgaagag 9360
gcccgcaccg atcgcccttc ccaacagttg cgcagcctga atggcgaatg gcgcgacgcg 9420
ccctgtagcg gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca 9480
cttgccagcg ccctagcgcc cgctcctttc gctttcttcc cttcctttct cgccacgttc 9540
gccggctttc cccgtcaagc tctaaatcgg gggctccctt tagggttccg atttagtgct 9600
ttacggcacc tcgaccccaa aaaacttgat tagggtgatg gttcacgtag tgggccatcg 9660
ccctgataga cggtttttcg ccctttgacg ttggagtcca cgttctttaa tagtggactc 9720
ttgttccaaa ctggaacaac actcaaccct atctcggtct attcttttga tttataaggg 9780
attttgccga tttcggccta ttggttaaaa aatgagctga tttaacaaaa atttaacgcg 9840
aattttaaca aaatattaac gtttacaatt tcctgatgcg gtattttctc cttacgcatc 9900
tgtgcggtat ttcacaccgc atatcgaccc tcgaggagaa cttctagtat atccacatac 9960
ctaatattat tgccttatta aaaatggaat cggaacaatt acatcaaaat ccacattctc 10020
ttcaaaatca attgtcctgt acttccttgt tcatgtgtgt tcaaaaacgt tatatttata 10080
ggataattat actctatttc tcaacaagta attggttgtt tggccgagcg gtctaaggcg 10140
cctgattcaa gaaatatctt gaccgcagtt aactgtggga atactcaggt atcgtaagat 10200
gcaagagttc gaatctctta gcaaccatta tttttttcct caacataacg agaacacaca 10260
ggggcgctat cgcacagaat caaattcgat gactggaaat tttttgttaa tttcagaggt 10320
cgcctgacgc atataccttt ttcaactgaa aaattgggag aaaaaggaaa ggtgagaggc 10380
cggaaccggc ttttcatata gaatagagaa gcgttcatga ctaaatgctt gcatcacaat 10440
acttgaagtt gacaatatta tttaaggacc tattgttttt tccaataggt ggttagcaat 10500
cgtcttactt tctaactttt cttacctttt acatttcagc aatatatata tatatttcaa 10560
ggatatacca ttctaatgtc tgcccctatg tctgccccta agaagatcgt cgttttgcca 10620
ggtgaccacg ttggtcaaga aatcacagcc gaagccatta aggttcttaa agctatttct 10680
gatgttcgtt ccaatgtcaa gttcgatttc gaaaatcatt taattggtgg tgctgctatc 10740
gatgctacag gtgtcccact tccagatgag gcgctggaag cctccaagaa ggttgatgcc 10800
gttttgttag gtgctgtggg tggtcctaaa tggggtaccg gtagtgttag acctgaacaa 10860
ggtttactaa aaatccgtaa agaacttcaa ttgtacgcca acttaagacc atgtaacttt 10920
gcatccgact ctcttttaga cttatctcca atcaagccac aatttgctaa aggtactgac 10980
ttcgttgttg tcagagaatt agtgggaggt atttactttg gtaagagaaa ggaagacgat 11040
ggtgatggtg tcgcttggga tagtgaacaa tacaccgttc cagaagtgca aagaatcaca 11100
agaatggccg ctttcatggc cctacaacat gagccaccat tgcctatttg gtccttggat 11160
aaagctaatg ttttggcctc ttcaagatta tggagaaaaa ctgtggagga aaccatcaag 11220
aacgaattcc ctacattgaa ggttcaacat caattgattg attctgccgc catgatccta 11280
gttaagaacc caacccacct aaatggtatt ataatcacca gcaacatgtt tggtgatatc 11340
atctccgatg aagcctccgt tatcccaggt tccttgggtt tgttgccatc tgcgtccttg 11400
gcctctttgc cagacaagaa caccgcattt ggtttgtacg aaccatgcca cggttctgct 11460
ccagatttgc caaagaataa ggttgaccct atcgccacta tcttgtctgc tgcaatgatg 11520
ttgaaattgt cattgaactt gcctgaagaa ggtaaggcca ttgaagatgc agttaaaaag 11580
gttttggatg caggtatcag aactggtgat ttaggtggtt ccaacagtac caccgaagtc 11640
ggtgatgctg tcgccgaaga agttaagaaa atccttgctt aaaaagattc tcttttttta 11700
tgatatttgt acataaactt tataaatgaa attcataata gaaacgacac gaaattacaa 11760
aatggaatat gttcataggg tagacgaaac tatatacgca atctacatac atttatcaag 11820
aaggagaaaa aggaggatag taaaggaata caggtaagca aattgatact aatggctcaa 11880
cgtgataagg aaaaagaatt gcactttaac attaatattg acaaggagga gggcaccaca 11940
caaaaagtta ggtgtaacag aaaatcatga aactacgatt cctaatttga tattggagga 12000
ttttctctaa aaaaaaaaaa atacaacaaa taaaaaacac tcaatgacct gaccatttga 12060
tggagtttaa gtcaatacct tcttgaacca tttcccataa tggtgaaagt tccctcaaga 12120
attttactct gtcagaaacg gccttacgac gtagtcgata tggtgcactc tcagtacaat 12180
ctgctctgat gccgcatagt taagccagcc ccgacacccg ccaacacccg ctgacgcgcc 12240
ctgacgggct tgtctgctcc cggcatccgc ttacagacaa gctgtgaccg tctccgggag 12300
ctgcatgtgt cagaggtttt caccgtcatc accgaaacgc gcga 12344
<210> 5
<211> 6274
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221>
<222>
<223> 质粒载体1059(Can1-7R)(Plasmid Vector 1059(Can1-7R))
<220>
<221> rep_origin
<222> (69)..(1411)
<223> 2个微小ori(2 micro ori)
<220>
<221> 启动子(promoter)
<222> (1438)..(1542)
<223> AmpR启动子(AmpR promoter)
<220>
<221> 基因(gene)
<222> (1543)..(2403)
<223>
<220>
<221> rep_origin
<222> (2574)..(3162)
<223> ori
<220>
<221> 启动子(promoter)
<222> (3621)..(3889)
<223> SNR52启动子(SNR52 promoter)
<220>
<221> misc_feature
<222> (3890)..(3909)
<223> Can1-7R
<220>
<221> misc_structure
<222> (3910)..(3992)
<223> tracrRNA
<220>
<221> 终止子(terminator)
<222> (3995)..(4008)
<223> Sup4终止子(Sup4 term)
<220>
<221> 终止子(terminator)
<222> (4014)..(4261)
<223> CYC1终止子(CYC1 terminator)
<220>
<221> 启动子(promoter)
<222> (4280)..(4298)
<223> T7启动子(T7 promoter)
<220>
<221> rep_origin
<222> (4469)..(4924)
<223> f1 ori
<220>
<221> 基因(gene)
<222> (5055)..(5858)
<223> URA3
<220>
<221> 启动子(promoter)
<222> (5859)..(6074)
<223> URA3启动子(URA3 promoter)
<400> 5
gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 60
cttagtatga tccaatatca aaggaaatga tagcattgaa ggatgagact aatccaattg 120
aggagtggca gcatatagaa cagctaaagg gtagtgctga aggaagcata cgataccccg 180
catggaatgg gataatatca caggaggtac tagactacct ttcatcctac ataaatagac 240
gcatataagt acgcatttaa gcataaacac gcactatgcc gttcttctca tgtatatata 300
tatacaggca acacgcagat ataggtgcga cgtgaacagt gagctgtatg tgcgcagctc 360
gcgttgcatt ttcggaagcg ctcgttttcg gaaacgcttt gaagttccta ttccgaagtt 420
cctattctct agaaagtata ggaacttcag agcgcttttg aaaaccaaaa gcgctctgaa 480
gacgcacttt caaaaaacca aaaacgcacc ggactgtaac gagctactaa aatattgcga 540
ataccgcttc cacaaacatt gctcaaaagt atctctttgc tatatatctc tgtgctatat 600
ccctatataa cctacccatc cacctttcgc tccttgaact tgcatctaaa ctcgacctct 660
acatttttta tgtttatctc tagtattact ctttagacaa aaaaattgta gtaagaacta 720
ttcatagagt gaatcgaaaa caatacgaaa atgtaaacat ttcctatacg tagtatatag 780
agacaaaata gaagaaaccg ttcataattt tctgaccaat gaagaatcat caacgctatc 840
actttctgtt cacaaagtat gcgcaatcca catcggtata gaatataatc ggggatgcct 900
ttatcttgaa aaaatgcacc cgcagcttcg ctagtaatca gtaaacgcgg gaagtggagt 960
caggcttttt ttatggaaga gaaaatagac accaaagtag ccttcttcta accttaacgg 1020
acctacagtg caaaaagtta tcaagagact gcattataga gcgcacaaag gagaaaaaaa 1080
gtaatctaag atgctttgtt agaaaaatag cgctctcggg atgcattttt gtagaacaaa 1140
aaagaagtat agattctttg ttggtaaaat agcgctctcg cgttgcattt ctgttctgta 1200
aaaatgcagc tcagattctt tgtttgaaaa attagcgctc tcgcgttgca tttttgtttt 1260
acaaaaatga agcacagatt cttcgttggt aaaatagcgc tttcgcgttg catttctgtt 1320
ctgtaaaaat gcagctcaga ttctttgttt gaaaaattag cgctctcgcg ttgcattttt 1380
gttctacaaa atgaagcaca gatgcttcgt tcaggtggca cttttcgggg aaatgtgcgc 1440
ggaaccccta tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa 1500
taaccctgat aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc 1560
cgtgtcgccc ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa 1620
acgctggtga aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa 1680
ctggatctca acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg 1740
atgagcactt ttaaagttct gctatgtggc gcggtattat cccgtattga cgccgggcaa 1800
gagcaactcg gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc 1860
acagaaaagc atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc 1920
atgagtgata acactgcggc caacttactt ctgacaacga tcggaggacc gaaggagcta 1980
accgcttttt tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag 2040
ctgaatgaag ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatggcaaca 2100
acgttgcgca aactattaac tggcgaacta cttactctag cttcccggca acaattaata 2160
gactggatgg aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc 2220
tggtttattg ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca 2280
ctggggccag atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca 2340
actatggatg aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg 2400
taactgtcag accaagttta ctcatatata ctttagattg atttaaaact tcatttttaa 2460
tttaaaagga tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt 2520
gagttttcgt tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat 2580
cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg 2640
gtttgtttgc cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga 2700
gcgcagatac caaatactgt ccttctagtg tagccgtagt taggccacca cttcaagaac 2760
tctgtagcac cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt 2820
ggcgataagt cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag 2880
cggtcgggct gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc 2940
gaactgagat acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag 3000
gcggacaggt atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca 3060
gggggaaacg cctggtatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt 3120
cgatttttgt gatgctcgtc aggggggcgg agcctatgga aaaacgccag caacgcggcc 3180
tttttacggt tcctggcctt ttgctggcct tttgctcaca tgttctttcc tgcgttatcc 3240
cctgattctg tggataaccg tattaccgcc tttgagtgag ctgataccgc tcgccgcagc 3300
cgaacgaccg agcgcagcga gtcagtgagc gaggaagcgg aagagcgccc aatacgcaaa 3360
ccgcctctcc ccgcgcgttg gccgattcat taatgcagct ggcacgacag gtttcccgac 3420
tggaaagcgg gcagtgagcg caacgcaatt aatgtgagtt acctcactca ttaggcaccc 3480
caggctttac actttatgct tccggctcct atgttgtgtg gaattgtgag cggataacaa 3540
tttcacacag gaaacagcta tgaccatgat tacgccaagc gcgcaattaa ccctcactaa 3600
agggaacaaa agctggagct tctttgaaaa gataatgtat gattatgctt tcactcatat 3660
ttatacagaa acttgatgtt ttctttcgag tatatacaag gtgattacat gtacgtttga 3720
agtacaactc tagattttgt agtgccctct tgggctagcg gtaaaggtgc gcattttttc 3780
acaccctaca atgttctgtt caaaagattt tggtcaaacg ctgtagaagt gaaagttggt 3840
gcgcatgttt cggcgttcga aacttctccg cagtgaaaga taaatgatct tatccttaga 3900
tattataccg ttttagagct agaaatagca agttaaaata aggctagtcc gttatcaact 3960
tgaaaaagtg gcaccgagtc ggtggtgctt tttttgtttt ttatgtcttc gagtcatgta 4020
attagttatg tcacgcttac gttcacgccc tccccccaca tccgctctaa ccgaaaagga 4080
aggagttaga caacctgaag tctaggtccc tatttatttt tttatagtta tgttagtatt 4140
aagaacgtta tttatatttc aaatttttct tttttttctg tacagacgcg tgtacgcatg 4200
taacattata ctgaaaacct tgcttgagaa ggttttggga cgctcgaagg ctttaatttg 4260
cggccggtac ccaattcgcc ctatagtgag tcgtattacg cgcgctcact ggccgtcgtt 4320
ttacaacgtc gtgactggga aaaccctggc gttacccaac ttaatcgcct tgcagcacat 4380
ccccctttcg ccagctggcg taatagcgaa gaggcccgca ccgatcgccc ttcccaacag 4440
ttgcgcagcc tgaatggcga atggcgcgac gcgccctgta gcggcgcatt aagcgcggcg 4500
ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct 4560
ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat 4620
cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt 4680
gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg 4740
acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac 4800
cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta 4860
aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgtttaca 4920
atttcctgat gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcatagggt 4980
aataactgat ataattaaat tgaagctcta atttgtgagt ttagtataca tgcatttact 5040
tataatacag ttttttagtt ttgctggccg catcttctca aatatgcttc ccagcctgct 5100
tttctgtaac gttcaccctc taccttagca tcccttccct ttgcaaatag tcctcttcca 5160
acaataataa tgtcagatcc tgtagagacc acatcatcca cggttctata ctgttgaccc 5220
aatgcgtctc ccttgtcatc taaacccaca ccgggtgtca taatcaacca atcgtaacct 5280
tcatctcttc cacccatgtc tctttgagca ataaagccga taacaaaatc tttgtcgctc 5340
ttcgcaatgt caacagtacc cttagtatat tctccagtag atagggagcc cttgcatgac 5400
aattctgcta acatcaaaag gcctctaggt tcctttgtta cttcttctgc cgcctgcttc 5460
aaaccgctaa caatacctgg gcccaccaca ccgtgtgcat tcgtaatgtc tgcccattct 5520
gctattctgt atacacccgc agagtactgc aatttgactg tattaccaat gtcagcaaat 5580
tttctgtctt cgaagagtaa aaaattgtac ttggcggata atgcctttag cggcttaact 5640
gtgccctcca tggaaaaatc agtcaagata tccacatgtg tttttagtaa acaaattttg 5700
ggacctaatg cttcaactaa ctccagtaat tccttggtgg tacgaacatc caatgaagca 5760
cacaagtttg tttgcttttc gtgcatgata ttaaatagct tggcagcaac aggactagga 5820
tgagtagcag cacgttcctt atatgtagct ttcgacatga tttatcttcg tttcctgcag 5880
gtttttgttc tgtgcagttg ggttaagaat actgggcaat ttcatgtttc ttcaacacta 5940
catatgcgta tatataccaa tctaagtctg tgctccttcc ttcgttcttc cttctgttcg 6000
gagattaccg aatcaaaaaa atttcaagga aaccgaaatc aaaaaaaaga ataaaaaaaa 6060
aatgatgaat tgaattgaaa agctgtggta tggtgcactc tcagtacaat ctgctctgat 6120
gccgcatagt taagccagcc ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct 6180
tgtctgctcc cggcatccgc ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt 6240
cagaggtttt caccgtcatc accgaaacgc gcga 6274
<210> 6
<211> 20
<212> DNA
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 6
tccaataacg gaatccaact 20
<210> 7
<211> 3648
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221>
<222>
<223> 质粒载体1548(Plasmid Vector 1548)
<220>
<221> 启动子(promoter)
<222> (1)..(8)
<223> AmpR启动子(AmpR promoter)
<220>
<221> misc_feature
<222> (97)..(182)
<223> ade1 pro 同源(ade1 pro homology)
<220>
<221> 基因(gene)
<222> (288)..(1091)
<223> URA3
<220>
<221> 启动子(promoter)
<222> (1092)..(1307)
<223> URA3启动子(URA3 promoter)
<220>
<221> misc_feature
<222> (1359)..(1538)
<223> URA3开关同源(URA3 switch homology)
<220>
<221> misc_feature
<222> (1544)..(1633)
<223> Ade ORF起始同源(Ade ORF start homology)
<220>
<221> rep_origin
<222> (1932)..(2520)
<223> ori
<220>
<221> 基因(gene)
<222> (2691)..(3551)
<223> AmpR
<220>
<221> 启动子(promoter)
<222> (3552)..(3648)
<223> AmpR启动子(AmpR promoter)
<400> 7
gttccgcgca catttccccg aaaagtgcca cctgacgtct aagaaaccat tattatcatg 60
acattaacct ataaaaatag gcgtatcacg aggcccgggt tttatctttt gcagttggta 120
ctattaagaa caatcgaatc ataagcattg cttacaaaga atacacatac gaaatattaa 180
cgcatctgtg cggtatttca caccgcatag ggtaataact gatataatta aattgaagct 240
ctaatttgtg agtttagtat acatgcattt acttataata cagtttttta gttttgctgg 300
ccgcatcttc tcaaatatgc ttcccagcct gcttttctgt aacgttcacc ctctacctta 360
gcatcccttc cctttgcaaa tagtcctctt ccaacaataa taatgtcaga tcctgtagag 420
accacatcat ccacggttct atactgttga cccaatgcgt ctcccttgtc atctaaaccc 480
acaccgggtg tcataatcaa ccaatcgtaa ccttcatctc ttccacccat gtctctttga 540
gcaataaagc cgataacaaa atctttgtcg ctcttcgcaa tgtcaacagt acccttagta 600
tattctccag tagataggga gcccttgcat gacaattctg ctaacatcaa aaggcctcta 660
ggttcctttg ttacttcttc tgccgcctgc ttcaaaccgc taacaatacc tgggcccacc 720
acaccgtgtg cattcgtaat gtctgcccat tctgctattc tgtatacacc cgcagagtac 780
tgcaatttga ctgtattacc aatgtcagca aattttctgt cttcgaagag taaaaaattg 840
tacttggcgg ataatgcctt tagcggctta actgtgccct ccatggaaaa atcagtcaag 900
atatccacat gtgtttttag taaacaaatt ttgggaccta atgcttcaac taactccagt 960
aattccttgg tggtacgaac atccaatgaa gcacacaagt ttgtttgctt ttcgtgcatg 1020
atattaaata gcttggcagc aacaggacta ggatgagtag cagcacgttc cttatatgta 1080
gctttcgaca tgatttatct tcgtttcctg caggtttttg ttctgtgcag ttgggttaag 1140
aatactgggc aatttcatgt ttcttcaaca ctacatatgc gtatatatac caatctaagt 1200
ctgtgctcct tccttcgttc ttccttctgt tcggagatta ccgaatcaaa aaaatttcaa 1260
agaaaccgaa atcaaaaaaa agaataaaaa aaaaatgatg aattgaattg aaaagctgtg 1320
gtatggtgca ctctcagtac aatctgctct gatgccgcac agttaagccg ctaaaggcat 1380
tatccgccaa gtacaatttt ttactcttcg aagacagaaa atttgctgac attggtaata 1440
cagtcaaatt gcagtactct gcgggtgtat acagaatagc agaatgggca gacattacga 1500
atgcacacgg tgtggtgggc ccaggtattg ttagcggtgg agggtcaatt acgaagactg 1560
aactggacgg tatattgcca ttggtggcca gaggtaaagt tagagacata tatgaggtag 1620
acgctggtac gttaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga 1680
aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt 1740
attgggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg 1800
cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac 1860
gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg 1920
ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca 1980
agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc 2040
tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc 2100
ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag 2160
gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc 2220
ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca 2280
gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg 2340
aagtggtggc ctaactacgg ctacactaga agaacagtat ttggtatctg cgctctgctg 2400
aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct 2460
ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa 2520
gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa 2580
gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa 2640
tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc 2700
ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctga 2760
ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc cagtgctgca 2820
atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa ccagccagcc 2880
ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca gtctattaat 2940
tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc 3000
attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt cagctccggt 3060
tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc 3120
ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact catggttatg 3180
gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc tgtgactggt 3240
gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg 3300
gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct catcattgga 3360
aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc cagttcgatg 3420
taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag cgtttctggg 3480
tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac acggaaatgt 3540
tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg ttattgtctc 3600
atgagcggat acatatttga atgtatttag aaaaataaac aaataggg 3648
<210> 8
<211> 12060
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221>
<222>
<223> 质粒载体1251(Plasmid Vector 1251)
<220>
<221> misc_feature
<222> (70)..(573)
<223> CEN/ARS
<220>
<221> rep_origin
<222> (1746)..(2334)
<223> ori
<220>
<221> 启动子(promoter)
<222> (2852)..(3516)
<223> 酿酒酵母启动子的GAL1与GAL10基因(GAL1 and GAL10 genes of S.cerevisiae promoter)
<220>
<221> 基因(gene)
<222> (3519)..(7655)
<223> Cas9
<220>
<221> misc_feature
<222> (7635)..(7655)
<223> SV40的NLS(NLS of SV40)
<220>
<221> misc_feature
<222> (7686)..(7856)
<223> 失效SH3(dead SH3)
<220>
<221> misc_feature
<222> (7863)..(7928)
<223> 3串联FLAG(three tandem FLAG)
<220>
<221> 基因(gene)
<222> (7935)..(8558)
<223> PmCDA1
<220>
<221> 终止子(terminator)
<222> (8589)..(8776)
<223> 酿酒酵母ADH1终止子(S. cerevisiae ADH1 terminator)
<220>
<221> rep_origin
<222> (9132)..(9587)
<223> f1 ori
<220>
<221> 启动子(promoter)
<222> (9887)..(10291)
<223> 酿酒酵母LEU2启动子(S. cerevisiae LEU2 prom)
<220>
<221> 基因(gene)
<222> (10304)..(11398)
<223> 酿酒酵母LEU2(S. cerevisiae LEU2)
<400> 8
gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 60
cttaggacgg atcgcttgcc tgtaacttac acgcgcctcg tatcttttaa tgatggaata 120
atttgggaat ttactctgtg tttatttatt tttatgtttt gtatttggat tttagaaagt 180
aaataaagaa ggtagaagag ttacggaatg aagaaaaaaa aataaacaaa ggtttaaaaa 240
atttcaacaa aaagcgtact ttacatatat atttattaga caagaaaagc agattaaata 300
gatatacatt cgattaacga taagtaaaat gtaaaatcac aggattttcg tgtgtggtct 360
tctacacaga caagatgaaa caattcggca ttaatacctg agagcaggaa gagcaagata 420
aaaggtagta tttgttggcg atccccctag agtcttttac atcttcggaa aacaaaaact 480
attttttctt taatttcttt ttttactttc tatttttaat ttatatattt atattaaaaa 540
atttaaatta taattatttt tatagcacgt gatgaaaagg acccaggtgg cacttttcgg 600
ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa tatgtatccg 660
ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa gagtatgagt 720
attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct tcctgttttt 780
gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg 840
ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg ccccgaagaa 900
cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt atcccgtatt 960
gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga cttggttgag 1020
tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga attatgcagt 1080
gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac gatcggagga 1140
ccgaaggagc taaccgcttt ttttcacaac atgggggatc atgtaactcg ccttgatcgt 1200
tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac gatgcctgta 1260
gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct agcttcccgg 1320
caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct gcgctcggcc 1380
cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg gtctcgcggt 1440
atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat ctacacgacg 1500
ggcagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg tgcctcactg 1560
attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat tgatttaaaa 1620
cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa 1680
atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga 1740
tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg 1800
ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact 1860
ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac 1920
cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg 1980
gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg 2040
gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga 2100
acgacctaca ccgaactgag atacctacag cgtgagcatt gagaaagcgc cacgcttccc 2160
gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg 2220
agggagcttc caggggggaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc 2280
tgacttgagc gtcgattttt gtgatgctcg tcaggggggc cgagcctatg gaaaaacgcc 2340
agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca catgttcttt 2400
cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg agctgatacc 2460
gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc ggaagagcgc 2520
ccaatacgca aaccgcctct ccccgcgcgt tggccgattc attaatgcag ctggcacgac 2580
aggtttcccg actggaaagc gggcagtgag cgcaacgcaa ttaatgtgag ttagctcact 2640
cattaggcac cccaggcttt acactttatg cttccggctc gtatgttgtg tggaattgtg 2700
agcggataac aatttcacac aggaaacagc tatgaccatg attacgccaa gctcgaaatt 2760
aaccctcact aaagggaaca aaagctggta ccgggcccga attctctcct tctcttaggt 2820
ggcagagcag gtggagggtc gaccatacta gtttcaaaaa ttcttacttt ttttttggat 2880
ggacgcaaag aagtttaata atcatattac atggcattac caccatatac atatccatat 2940
acatatccat atctaatctt acttatatgt tgtggaaatg taaagagccc cattatctta 3000
gcctaaaaaa accttctctt tggaactttc agtaatacgc ttaactgctc attgctatat 3060
tgaagtacgg attagaagcc gccgagcggg tgacagccct ccgaaggaag actctcctcc 3120
gtgcgtcctc gtcttcaccg gtcgcgttcc tgaaacgcag atgtgcctcg cgccgcactg 3180
ctccgaacaa taaagattct acaatactag cttttatggt tatgaagagg aaaaattggc 3240
agtaacctgg ccccacaaac cttcaaatga acgaatcaaa ttaacaacca taggatgata 3300
atgcgattag ttttttagcc ttatttctgg ggtaattaat cagcgaagcg atgatttttg 3360
atctattaac agatatataa atgcaaaaac tgcataacca ctttaactaa tactttcaac 3420
attttcggtt tgtattactt cttattcaaa tgtaataaaa gtatcaacaa aaaattgtta 3480
atatacctct atactttaac gtcaaggaga aaaaacccat ggacaagaag tactccattg 3540
ggctcgctat cggcacaaac agcgtcggtt gggccgtcat tacggacgag tacaaggtgc 3600
cgagcaaaaa attcaaagtt ctgggcaata ccgatcgcca cagcataaag aagaacctca 3660
ttggcgccct cctgttcgac tccggggaga cggccgaagc cacgcggctc aaaagaacag 3720
cacggcgcag atatacccgc agaaagaatc ggatctgcta cctgcaggag atctttagta 3780
atgagatggc taaggtggat gactctttct tccataggct ggaggagtcc tttttggtgg 3840
aggaggataa aaagcacgag cgccacccaa tctttggcaa tatcgtggac gaggtggcgt 3900
accatgaaaa gtacccaacc atatatcatc tgaggaagaa gcttgtagac agtactgata 3960
aggctgactt gcggttgatc tatctcgcgc tggcgcatat gatcaaattt cggggacact 4020
tcctcatcga gggggacctg aacccagaca acagcgatgt cgacaaactc tttatccaac 4080
tggttcagac ttacaatcag cttttcgaag agaacccgat caacgcatcc ggagttgacg 4140
ccaaagcaat cctgagcgct aggctgtcca aatcccggcg gctcgaaaac ctcatcgcac 4200
agctccctgg ggagaagaag aacggcctgt ttggtaatct tatcgccctg tcactcgggc 4260
tgacccccaa ctttaaatct aacttcgacc tggccgaaga tgccaagctt caactgagca 4320
aagacaccta cgatgatgat ctcgacaatc tgctggccca gatcggcgac cagtacgcag 4380
accttttttt ggcggcaaag aacctgtcag acgccattct gctgagtgat attctgcgag 4440
tgaacacgga gatcaccaaa gctccgctga gcgctagtat gatcaagcgc tatgatgagc 4500
accaccaaga cttgactttg ctgaaggccc ttgtcagaca gcaactgcct gagaagtaca 4560
aggaaatttt cttcgatcag tctaaaaatg gctacgccgg atacattgac ggcggagcaa 4620
gccaggagga attttacaaa tttattaagc ccatcttgga aaaaatggac ggcaccgagg 4680
agctgctggt aaagcttaac agagaagatc tgttgcgcaa acagcgcact ttcgacaatg 4740
gaagcatccc ccaccagatt cacctgggcg aactgcacgc tatcctcagg cggcaagagg 4800
atttctaccc ctttttgaaa gataacaggg aaaagattga gaaaatcctc acatttcgga 4860
taccctacta tgtaggcccc ctcgcccggg gaaattccag attcgcgtgg atgactcgca 4920
aatcagaaga gaccatcact ccctggaact tcgaggaagt cgtggataag ggggcctctg 4980
cccagtcctt catcgaaagg atgactaact ttgataaaaa tctgcctaac gaaaaggtgc 5040
ttcctaaaca ctctctgctg tacgagtact tcacagttta taacgagctc accaaggtca 5100
aatacgtcac agaagggatg agaaagccag cattcctgtc tggagagcag aagaaagcta 5160
tcgtggacct cctcttcaag acgaaccgga aagttaccgt gaaacagctc aaagaagact 5220
atttcaaaaa gattgaatgt ttcgactctg ttgaaatcag cggagtggag gatcgcttca 5280
acgcatccct gggaacgtat cacgatctcc tgaaaatcat taaagacaag gacttcctgg 5340
acaatgagga gaacgaggac attcttgagg acattgtcct cacccttacg ttgtttgaag 5400
atagggagat gattgaagaa cgcttgaaaa cttacgctca tctcttcgac gacaaagtca 5460
tgaaacagct caagaggcgc cgatatacag gatgggggcg gctgtcaaga aaactgatca 5520
atgggatccg agacaagcag agtggaaaga caatcctgga ttttcttaag tccgatggat 5580
ttgccaaccg gaacttcatg cagttgatcc atgatgactc tctcaccttt aaggaggaca 5640
tccagaaagc acaagtttct ggccaggggg acagtcttca cgagcacatc gctaatcttg 5700
caggtagccc agctatcaaa aagggaatac tgcagaccgt taaggtcgtg gatgaactcg 5760
tcaaagtaat gggaaggcat aagcccgaga atatcgttat cgagatggcc cgagagaacc 5820
aaactaccca gaagggacag aagaacagta gggaaaggat gaagaggatt gaagagggta 5880
taaaagaact ggggtcccaa atccttaagg aacacccagt tgaaaacacc cagcttcaga 5940
atgagaagct ctacctgtac tacctgcaga acggcaggga catgtacgtg gatcaggaac 6000
tggacatcaa tcggctctcc gactacgacg tggatgctat cgtgccccag tcttttctca 6060
aagatgattc tattgataat aaagtgttga caagatccga taaaaataga gggaagagtg 6120
ataacgtccc ctcagaagaa gttgtcaaga aaatgaaaaa ttattggcgg cagctgctga 6180
acgccaaact gatcacacaa cggaagttcg ataatctgac taaggctgaa cgaggtggcc 6240
tgtctgagtt ggataaagcc ggcttcatca aaaggcagct tgttgagaca cgccagatca 6300
ccaagcacgt ggcccaaatt ctcgattcac gcatgaacac caagtacgat gaaaatgaca 6360
aactgattcg agaggtgaaa gttattactc tgaagtctaa gctggtctca gatttcagaa 6420
aggactttca gttttataag gtgagagaga tcaacaatta ccaccatgcg catgatgcct 6480
acctgaatgc agtggtaggc actgcactta tcaaaaaata tcccaagctt gaatctgaat 6540
ttgtttacgg agactataaa gtgtacgatg ttaggaaaat gatcgcaaag tctgagcagg 6600
aaataggcaa ggccaccgct aagtacttct tttacagcaa tattatgaat tttttcaaga 6660
ccgagattac actggccaat ggagagattc ggaagcgacc acttatcgaa acaaacggag 6720
aaacaggaga aatcgtgtgg gacaagggta gggatttcgc gacagtccgg aaggtcctgt 6780
ccatgccgca ggtgaacatc gttaaaaaga ccgaagtaca gaccggaggc ttctccaagg 6840
aaagtatcct cccgaaaagg aacagcgaca agctgatcgc acgcaaaaaa gattgggacc 6900
ccaagaaata cggcggattc gattctccta cagtcgctta cagtgtactg gttgtggcca 6960
aagtggagaa agggaagtct aaaaaactca aaagcgtcaa ggaactgctg ggcatcacaa 7020
tcatggagcg atcaagcttc gaaaaaaacc ccatcgactt tctcgaggcg aaaggatata 7080
aagaggtcaa aaaagacctc atcattaagc ttcccaagta ctctctcttt gagcttgaaa 7140
acggccggaa acgaatgctc gctagtgcgg gcgagctgca gaaaggtaac gagctggcac 7200
tgccctctaa atacgttaat ttcttgtatc tggccagcca ctatgaaaag ctcaaagggt 7260
ctcccgaaga taatgagcag aagcagctgt tcgtggaaca acacaaacac taccttgatg 7320
agatcatcga gcaaataagc gaattctcca aaagagtgat cctcgccgac gctaacctcg 7380
ataaggtgct ttctgcttac aataagcaca gggataagcc catcagggag caggcagaaa 7440
acattatcca cttgtttact ctgaccaact tgggcgcgcc tgcagccttc aagtacttcg 7500
acaccaccat agacagaaag cggtacacct ctacaaagga ggtcctggac gccacactga 7560
ttcatcagtc aattacgggg ctctatgaaa caagaatcga cctctctcag ctcggtggag 7620
acagcagggc tgaccccaag aagaagagga aggtgggtgg aggaggttct ggaggtggag 7680
gttctgcaga gtatgtgcgg gccctctttg actttaatgg gaatgatgaa gaagatcttc 7740
cctttaagaa aggagacatc ctgagaatcc gggataagcc tgaagagcag tggtggaatg 7800
cagaggacag cgaaggaaag agggggatga ttcttgtccc ttacgtggag aagtattccg 7860
gagactataa ggaccacgac ggagactaca aggatcatga tattgattac aaagacgatg 7920
acgataagtc taggatgacc gacgctgagt acgtgagaat ccatgagaag ttggacatct 7980
acacgtttaa gaaacagttt ttcaacaaca aaaaatccgt gtcgcataga tgctacgttc 8040
tctttgaatt aaaacgacgg ggtgaacgta gagcgtgttt ttggggctat gctgtgaata 8100
aaccacagag cgggacagaa cgtggcattc acgccgaaat ctttagcatt agaaaagtcg 8160
aagaatacct gcgcgacaac cccggacaat tcacgataaa ttggtactca tcctggagtc 8220
cttgtgcaga ttgcgctgaa aagatcttag aatggtataa ccaggagctg cgggggaacg 8280
gccacacttt gaaaatctgg gcttgcaaac tctattacga gaaaaatgcg aggaatcaaa 8340
ttgggctgtg gaacctcaga gataacgggg ttgggttgaa tgtaatggta agtgaacact 8400
accaatgttg caggaaaata ttcatccaat cgtcgcacaa tcaattgaat gagaatagat 8460
ggcttgagaa gactttgaag cgagctgaaa aacgacggag cgagttgtcc attatgattc 8520
aggtaaaaat actccacacc actaagagtc ctgctgtttc tagaggctcc ggataaggat 8580
cctaataagc gaatttctta tgatttatga tttttattat taaataagtt ataaaaaaaa 8640
taagtgtata caaattttaa agtgactctt aggttttaaa acgaaaattc ttattcttga 8700
gtaactcttt cctgtaggtc aggttgcttt ctcaggtata gcatgaggtc gctcttattg 8760
accacacctc taccggcatg ccgagcaaat gcctgcaaat cgctcccggg caaaaaaccc 8820
cctcaagacc cgtttagagg ccccaagggg ttatgctatg catactgata taattaaatt 8880
gaagctctaa tttgtgagtt tagtatacat gcataccaag cttccgcggt ggagctccaa 8940
ttcgccctat agtgagtcgt attacaattc actggccgtc gttttacaac gtcgtgactg 9000
ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca catcccccct tcgccagctg 9060
gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg 9120
cgaatggcgc gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 9180
cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 9240
ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 9300
gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 9360
acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 9420
ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 9480
ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 9540
acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcct gatgcggtat 9600
tttctcctta cgcatctgtg cggtatttca caccgcatat cgaccctcga ggagaacttc 9660
tagtatatcc acatacctaa tattattgcc ttattaaaaa tggaatcgga acaattacat 9720
caaaatccac attctcttca aaatcaattg tcctgtactt ccttgttcat gtgtgttcaa 9780
aaacgttata tttataggat aattatactc tatttctcaa caagtaattg gttgtttggc 9840
cgagcggtct aaggcgcctg attcaagaaa tatcttgacc gcagttaact gtgggaatac 9900
tcaggtatcg taagatgcaa gagttcgaat ctcttagcaa ccattatttt tttcctcaac 9960
ataacgagaa cacacagggg cgctatcgca cagaatcaaa ttcgatgact ggaaattttt 10020
tgttaatttc agaggtcgcc tgacgcatat acctttttca actgaaaaat tgggagaaaa 10080
aggaaaggtg agaggccgga accggctttt catatagaat agagaagcgt tcatgactaa 10140
atgcttgcat cacaatactt gaagttgaca atattattta aggacctatt gttttttcca 10200
ataggtggtt agcaatcgtc ttactttcta acttttctta ccttttacat ttcagcaata 10260
tatatatata tttcaaggat ataccattct aatgtctgcc cctatgtctg cccctaagaa 10320
gatcgtcgtt ttgccaggtg accacgttgg tcaagaaatc acagccgaag ccattaaggt 10380
tcttaaagct atttctgatg ttcgttccaa tgtcaagttc gatttcgaaa atcatttaat 10440
tggtggtgct gctatcgatg ctacaggtgt cccacttcca gatgaggcgc tggaagcctc 10500
caagaaggtt gatgccgttt tgttaggtgc tgtgggtggt cctaaatggg gtaccggtag 10560
tgttagacct gaacaaggtt tactaaaaat ccgtaaagaa cttcaattgt acgccaactt 10620
aagaccatgt aactttgcat ccgactctct tttagactta tctccaatca agccacaatt 10680
tgctaaaggt actgacttcg ttgttgtcag agaattagtg ggaggtattt actttggtaa 10740
gagaaaggaa gacgatggtg atggtgtcgc ttgggatagt gaacaataca ccgttccaga 10800
agtgcaaaga atcacaagaa tggccgcttt catggcccta caacatgagc caccattgcc 10860
tatttggtcc ttggataaag ctaatgtttt ggcctcttca agattatgga gaaaaactgt 10920
ggaggaaacc atcaagaacg aattccctac attgaaggtt caacatcaat tgattgattc 10980
tgccgccatg atcctagtta agaacccaac ccacctaaat ggtattataa tcaccagcaa 11040
catgtttggt gatatcatct ccgatgaagc ctccgttatc ccaggttcct tgggtttgtt 11100
gccatctgcg tccttggcct ctttgccaga caagaacacc gcatttggtt tgtacgaacc 11160
atgccacggt tctgctccag atttgccaaa gaataaggtt gaccctatcg ccactatctt 11220
gtctgctgca atgatgttga aattgtcatt gaacttgcct gaagaaggta aggccattga 11280
agatgcagtt aaaaaggttt tggatgcagg tatcagaact ggtgatttag gtggttccaa 11340
cagtaccacc gaagtcggtg atgctgtcgc cgaagaagtt aagaaaatcc ttgcttaaaa 11400
agattctctt tttttatgat atttgtacat aaactttata aatgaaattc ataatagaaa 11460
cgacacgaaa ttacaaaatg gaatatgttc atagggtaga cgaaactata tacgcaatct 11520
acatacattt atcaagaagg agaaaaagga ggatagtaaa ggaatacagg taagcaaatt 11580
gatactaatg gctcaacgtg ataaggaaaa agaattgcac tttaacatta atattgacaa 11640
ggaggagggc accacacaaa aagttaggtg taacagaaaa tcatgaaact acgattccta 11700
atttgatatt ggaggatttt ctctaaaaaa aaaaaaatac aacaaataaa aaacactcaa 11760
tgacctgacc atttgatgga gtttaagtca ataccttctt gaaccatttc ccataatggt 11820
gaaagttccc tcaagaattt tactctgtca gaaacggcct tacgacgtag tcgatatggt 11880
gcactctcag tacaatctgc tctgatgccg catagttaag ccagccccga cacccgccaa 11940
cacccgctga cgcgccctga cgggcttgtc tgctcccggc atccgcttac agacaagctg 12000
tgaccgtctc cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga 12060
<210> 9
<211> 20
<212> DNA
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 9
cctttagcgg cttaactgtg 20
<210> 10
<211> 20
<212> DNA
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 10
ggcccaggta ttgttagcgg 20
<210> 11
<211> 20
<212> DNA
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 11
ttggcggata atgcctttag 20
<210> 12
<211> 20
<212> DNA
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 12
tgcagttggg ttaagaatac 20
<210> 13
<211> 20
<212> DNA
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 13
gctaacatca aaaggcctct 20
<210> 14
<211> 20
<212> DNA
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 14
ttggcggata atgcctttag 20
<210> 15
<211> 7250
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221>
<222>
<223> 质粒载体1xgRNA Can杂交(Plasmid Vector 1xgRNA Can cross)
<220>
<221> 基因(gene)
<222> (133)..(993)
<223> AmpR
<220>
<221> 启动子(promoter)
<222> (994)..(1098)
<223> AmpR启动子(AmpR promoter)
<220>
<221> rep_origin
<222> (1125)..(2467)
<223> 2个微小ori(2 micro ori)
<220>
<221> misc_feature
<222> (2521)..(2994)
<223> Can1_左臂(Can1_Left arm)
<220>
<221> 启动子(promoter)
<222> (3231)..(3446)
<223> URA3启动子(URA3 promoter)
<220>
<221> 基因(gene)
<222> (3447)..(4250)
<223> URA3
<220>
<221> rep_origin
<222> (4381)..(4836)
<223> f1 ori
<220>
<221> misc_feature
<222> (5054)..(5507)
<223> Can1_右臂(Can1_Right Arm)
<220>
<221> 终止子(terminator)
<222> (5519)..(5766)
<223> CYC1终止子(CYC1 terminator)
<220>
<221> 终止子(terminator)
<222> (5772)..(5785)
<223> Sup4终止子(Sup4 term)
<220>
<221> misc_structure
<222> (5788)..(5870)
<223> tracrRNA
<220>
<221> misc_feature
<222> (5871)..(5890)
<223> 靶1R(target1R)
<220>
<221> 启动子(promoter)
<222> (5891)..(6159)
<223> SNR52启动子(SNR52 promoter)
<220>
<221> misc_feature
<222> (6222)..(6238)
<223> M13 rev
<220>
<221> misc_feature
<222> (6246)..(6262)
<223> lac操纵基因(lac operator)
<220>
<221> 启动子(promoter)
<222> (6270)..(6300)
<223> lac启动子(lac promoter)
<220>
<221> rep_origin
<222> (6624)..(7212)
<223> ori
<400> 15
gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac 60
ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac 120
ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt 180
tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt 240
accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt 300
atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc 360
cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa 420
tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg 480
tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt 540
gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc 600
agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt 660
aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg 720
gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac 780
tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc 840
gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt 900
tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg 960
aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat attattgaag 1020
catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa 1080
acaaataggg gttccgcgca catttccccg aaaagtgcca cctgaacgaa gcatctgtgc 1140
ttcattttgt agaacaaaaa tgcaacgcga gagcgctaat ttttcaaaca aagaatctga 1200
gctgcatttt tacagaacag aaatgcaacg cgaaagcgct attttaccaa cgaagaatct 1260
gtgcttcatt tttgtaaaac aaaaatgcaa cgcgagagcg ctaatttttc aaacaaagaa 1320
tctgagctgc atttttacag aacagaaatg caacgcgaga gcgctatttt accaacaaag 1380
aatctatact tcttttttgt tctacaaaaa tgcatcccga gagcgctatt tttctaacaa 1440
agcatcttag attacttttt ttctcctttg tgcgctctat aatgcagtct cttgataact 1500
ttttgcactg taggtccgtt aaggttagaa gaaggctact ttggtgtcta ttttctcttc 1560
cataaaaaaa gcctgactcc acttcccgcg tttactgatt actagcgaag ctgcgggtgc 1620
attttttcaa gataaaggca tccccgatta tattctatac cgatgtggat tgcgcatact 1680
ttgtgaacag aaagtgatag cgttgatgat tcttcattgg tcagaaaatt atgaacggtt 1740
tcttctattt tgtctctata tactacgtat aggaaatgtt tacattttcg tattgttttc 1800
gattcactct atgaatagtt cttactacaa tttttttgtc taaagagtaa tactagagat 1860
aaacataaaa aatgtagagg tcgagtttag atgcaagttc aaggagcgaa aggtggatgg 1920
gtaggttata tagggatata gcacagagat atatagcaaa gagatacttt tgagcaatgt 1980
ttgtggaagc ggtattcgca atattttagt agctcgttac agtccggtgc gtttttggtt 2040
ttttgaaagt gcgtcttcag agcgcttttg gttttcaaaa gcgctctgaa gttcctatac 2100
tttctagaga ataggaactt cggaatagga acttcaaagc gtttccgaaa acgagcgctt 2160
ccgaaaatgc aacgcgagct gcgcacatac agctcactgt tcacgtcgca cctatatctg 2220
cgtgttgcct gtatatatat atacatgaga agaacggcat agtgcgtgtt tatgcttaaa 2280
tgcgtactta tatgcgtcta tttatgtagg atgaaaggta gtctagtacc tcctgtgata 2340
ttatcccatt ccatgcgggg tatcgtatgc ttccttcagc actacccttt agctgttcta 2400
tatgctgcca ctcctcaatt ggattagtct catccttcaa tgctatcatt tcctttgata 2460
ttggatcata ctaagaaacc attattatca tgacattaac ctataaaaat aggcgcatgc 2520
ttattagcct tgatagtgct gaaaaaaaga aaaaaaacaa aaaaaagaaa taaaataacg 2580
gcaaacagca aaggccacag aaccgtattc atgttacttc tgcaatatca atcacttact 2640
ggcaagtgcg tataaattaa acctatttct ttatcatcat atttacttat atctttaaca 2700
gattccaaac cctaaagtgt ccgaattttc aatagggcga acttgaagaa taaccaaggt 2760
caataatata tcttttagta taaccctgaa atttgcccta tagaaatcta gggtttctgt 2820
gtggtttccg ggtgagtcat acggcttttt tgaatttctt tttttgcagt tgtctctatc 2880
aatgaaaatt tcgaggaaga cgataaggtt aagataagta gataagagaa tgatacgaga 2940
taaagcacaa attagcagaa agaagagtgg ttgcgaacag agtaaaccga atcagacgtc 3000
agacctaggt catgccgagg ccctttcgtc tcgcgcgttt cggtgatgac ggtgaaaacc 3060
tctgacacat gcagctcccg gagacggtca cagcttgtct gtaagcggat gccgggagca 3120
gacaagcccg tcagggcgcg tcagcgggtg ttggcgggtg tcggggctgg cttaactatg 3180
cggcatcaga gcagattgta ctgagagtgc accataccac agcttttcaa ttcaattcat 3240
catttttttt ttattctttt ttttgatttc ggtttccttg aaattttttt gattcggtaa 3300
tctccgaaca gaaggaagaa cgaaggaagg agcacagact tagattggta tatatacgca 3360
tatgtagtgt tgaagaaaca tgaaattgcc cagtattctt aacccaactg cacagaacaa 3420
aaacctgcag gaaacgaaga taaatcatgt cgaaagctac atataaggaa cgtgctgcta 3480
ctcatcctag tcctgttgct gccaagctat ttaatatcat gcacgaaaag caaacaaact 3540
tgtgtgcttc attggatgtt cgtaccacca aggaattact ggagttagtt gaagcattag 3600
gtcccaaaat ttgtttacta aaaacacatg tggatatctt gactgatttt tccatggagg 3660
gcacagttaa gccgctaaag gcattatccg ccaagtacaa ttttttactc ttcgaagaca 3720
gaaaatttgc tgacattggt aatacagtca aattgcagta ctctgcgggt gtatacagaa 3780
tagcagaatg ggcagacatt acgaatgcac acggtgtggt gggcccaggt attgttagcg 3840
gtttgaagca ggcggcagaa gaagtaacaa aggaacctag aggccttttg atgttagcag 3900
aattgtcatg caagggctcc ctatctactg gagaatatac taagggtact gttgacattg 3960
cgaagagcga caaagatttt gttatcggct ttattgctca aagagacatg ggtggaagag 4020
atgaaggtta cgattggttg attatgacac ccggtgtggg tttagatgac aagggagacg 4080
cattgggtca acagtataga accgtggatg atgtggtctc tacaggatct gacattatta 4140
ttgttggaag aggactattt gcaaagggaa gggatgctaa ggtagagggt gaacgttaca 4200
gaaaagcagg ctgggaagca tatttgagaa gatgcggcca gcaaaactaa aaaactgtat 4260
tataagtaaa tgcatgtata ctaaactcac aaattagagc ttcaatttaa ttatatcagt 4320
tattacccta tgcggtgtga aataccgcac agatgcgtaa ggagaaaata ccgcatcagg 4380
aaattgtaaa cgttaatatt ttgttaaaat tcgcgttaaa tttttgttaa atcagctcat 4440
tttttaacca ataggccgaa atcggcaaaa tcccttataa atcaaaagaa tagaccgaga 4500
tagggttgag tgttgttcca gtttggaaca agagtccact attaaagaac gtggactcca 4560
acgtcaaagg gcgaaaaacc gtctatcagg gcgatggccc actacgtgaa ccatcaccct 4620
aatcaagttt tttggggtcg aggtgccgta aagcactaaa tcggaaccct aaagggagcc 4680
cccgatttag agcttgacgg ggaaagccgg cgaacgtggc gagaaaggaa gggaagaaag 4740
cgaaaggagc gggcgctagg gcgctggcaa gtgtagcggt cacgctgcgc gtaaccacca 4800
cacccgccgc gcttaatgcg ccgctacagg gcgcgtcgcg ccattcgcca ttcaggctgc 4860
gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag ctggcgaaag 4920
ggggatgtgc tgcaaggcga ttaagttggg taacgccagg gttttcccag tcacgacgtt 4980
gtaaaacgac ggccagtgag cgcgcgtaat acgactcact atagggcgaa ttgggtactc 5040
ctaggttaat taagataatg tctgagttag gtgagtattc taaattagaa aacaaagagc 5100
ttagaacgga gtttgaattg acaaattttc cttttccagg cacaactgat aacgactccg 5160
atgacggaag ccaagggcag aactctttga atatcattac tcctgacatg gatgatactc 5220
tggttaatga tgtacttcga gaaaacgata aaaagtctag tatgagaatg gcttttatga 5280
atctagcaaa ctctattctt ggtgccggaa taattactca gccgttcgcg atcaaaaatg 5340
ctggtatatt aggcgggcta ttatcatacg tagccctcgg atttatagtt gattggacgt 5400
taagacttat tgtcattaac ttgactcttg ctggcaagag aacataccag ggtacggtcg 5460
aacatgtaat gggtaaaaaa gggaaattgc tgattctatt tacaaactgg taccggccgc 5520
aaattaaagc cttcgagcgt cccaaaacct tctcaagcaa ggttttcagt ataatgttac 5580
atgcgtacac gcgtctgtac agaaaaaaaa gaaaaatttg aaatataaat aacgttctta 5640
atactaacat aactataaaa aaataaatag ggacctagac ttcaggttgt ctaactcctt 5700
ccttttcggt tagagcggat gtggggggag ggcgtgaacg taagcgtgac ataactaatt 5760
acatgactcg aagacataaa aaacaaaaaa agcaccaccg actcggtgcc actttttcaa 5820
gttgataacg gactagcctt attttaactt gctatttcta gctctaaaac gaaaagggga 5880
tcctattgac gatcatttat ctttcactgc ggagaagttt cgaacgccga aacatgcgca 5940
ccaactttca cttctacagc gtttgaccaa aatcttttga acagaacatt gtagggtgtg 6000
aaaaaatgcg cacctttacc gctagcccaa gagggcacta caaaatctag agttgtactt 6060
caaacgtaca tgtaatcacc ttgtatatac tcgaaagaaa acatcaagtt tctgtataaa 6120
tatgagtgaa agcataatca tacattatct tttcaaagaa gctccagctt ttgttccctt 6180
tagtgatcac gtccggattg cggccgcttg gcgtaatcat ggtcatagct gtttcctgtg 6240
tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa 6300
gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct 6360
ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga 6420
ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 6480
gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 6540
tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 6600
aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 6660
aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 6720
ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 6780
tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc 6840
agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 6900
gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 6960
tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 7020
acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 7080
tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 7140
caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 7200
aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 7250
<210> 16
<211> 7672
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221>
<222>
<223> 质粒载体2xgRNA Can杂交(Plasmid Vector 2xgRNA Can cross)
<220>
<221> 基因(gene)
<222> (133)..(993)
<223> AmpR
<220>
<221> 启动子(promoter)
<222> (994)..(1098)
<223> AmpR启动子(AmpR promoter)
<220>
<221> rep_origin
<222> (1125)..(2467)
<223> 2个微小ori(2 micro ori)
<220>
<221> 终止子(terminator)
<222> (2539)..(2552)
<223> Sup4终止子(Sup4 term)
<220>
<221> misc_structure
<222> (2555)..(2637)
<223> tracrRNA
<220>
<221> misc_feature
<222> (2638)..(2657)
<223> 靶1R(target1R)
<220>
<221> 启动子(promoter)
<222> (2658)..(2926)
<223> SNR52启动子(SNR52 promoter)
<220>
<221> misc_feature
<222> (2943)..(3416)
<223> Can1_左臂(Can1_Left arm)
<220>
<221> 启动子(promoter)
<222> (3653)..(3868)
<223> URA3启动子(URA3 promoter)
<220>
<221> 基因(gene)
<222> (3869)..(4672)
<223> URA3
<220>
<221> rep_origin
<222> (4803)..(5258)
<223> f1 ori
<220>
<221> misc_feature
<222> (5476)..(5929)
<223> Can1_右臂(Can1_Right Arm)
<220>
<221> 终止子(terminator)
<222> (5941)..(6188)
<223> CYC1终止子(CYC1 terminator)
<220>
<221> 终止子(terminator)
<222> (6194)..(6207)
<223> Sup4终止子(Sup4 term)
<220>
<221> misc_structure
<222> (6210)..(6292)
<223> tracrRNA
<220>
<221> misc_feature
<222> (6293)..(6312)
<223> 靶2R(target2R)
<220>
<221> 启动子(promoter)
<222> (6313)..(6581)
<223> SNR52启动子(SNR52 promoter)
<220>
<221> rep_origin
<222> (7046)..(7634)
<223> ori
<400> 16
gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac 60
ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac 120
ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt 180
tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt 240
accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt 300
atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc 360
cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa 420
tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg 480
tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt 540
gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc 600
agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt 660
aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg 720
gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac 780
tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc 840
gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt 900
tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg 960
aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat attattgaag 1020
catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa 1080
acaaataggg gttccgcgca catttccccg aaaagtgcca cctgaacgaa gcatctgtgc 1140
ttcattttgt agaacaaaaa tgcaacgcga gagcgctaat ttttcaaaca aagaatctga 1200
gctgcatttt tacagaacag aaatgcaacg cgaaagcgct attttaccaa cgaagaatct 1260
gtgcttcatt tttgtaaaac aaaaatgcaa cgcgagagcg ctaatttttc aaacaaagaa 1320
tctgagctgc atttttacag aacagaaatg caacgcgaga gcgctatttt accaacaaag 1380
aatctatact tcttttttgt tctacaaaaa tgcatcccga gagcgctatt tttctaacaa 1440
agcatcttag attacttttt ttctcctttg tgcgctctat aatgcagtct cttgataact 1500
ttttgcactg taggtccgtt aaggttagaa gaaggctact ttggtgtcta ttttctcttc 1560
cataaaaaaa gcctgactcc acttcccgcg tttactgatt actagcgaag ctgcgggtgc 1620
attttttcaa gataaaggca tccccgatta tattctatac cgatgtggat tgcgcatact 1680
ttgtgaacag aaagtgatag cgttgatgat tcttcattgg tcagaaaatt atgaacggtt 1740
tcttctattt tgtctctata tactacgtat aggaaatgtt tacattttcg tattgttttc 1800
gattcactct atgaatagtt cttactacaa tttttttgtc taaagagtaa tactagagat 1860
aaacataaaa aatgtagagg tcgagtttag atgcaagttc aaggagcgaa aggtggatgg 1920
gtaggttata tagggatata gcacagagat atatagcaaa gagatacttt tgagcaatgt 1980
ttgtggaagc ggtattcgca atattttagt agctcgttac agtccggtgc gtttttggtt 2040
ttttgaaagt gcgtcttcag agcgcttttg gttttcaaaa gcgctctgaa gttcctatac 2100
tttctagaga ataggaactt cggaatagga acttcaaagc gtttccgaaa acgagcgctt 2160
ccgaaaatgc aacgcgagct gcgcacatac agctcactgt tcacgtcgca cctatatctg 2220
cgtgttgcct gtatatatat atacatgaga agaacggcat agtgcgtgtt tatgcttaaa 2280
tgcgtactta tatgcgtcta tttatgtagg atgaaaggta gtctagtacc tcctgtgata 2340
ttatcccatt ccatgcgggg tatcgtatgc ttccttcagc actacccttt agctgttcta 2400
tatgctgcca ctcctcaatt ggattagtct catccttcaa tgctatcatt tcctttgata 2460
ttggatcata ctaagaaacc attattatca tgacattaac ctataaaaat aggcgcatgt 2520
cgactacccg ggaactcgag acataaaaaa caaaaaaagc accaccgact cggtgccact 2580
ttttcaagtt gataacggac tagccttatt ttaacttgct atttctagct ctaaaacgaa 2640
aaggggatcc tattgacgat catttatctt tcactgcgga gaagtttcga acgccgaaac 2700
atgcgcacca actttcactt ctacagcgtt tgaccaaaat cttttgaaca gaacattgta 2760
gggtgtgaaa aaatgcgcac ctttaccgct agcccaagag ggcactacaa aatctagagt 2820
tgtacttcaa acgtacatgt aatcaccttg tatatactcg aaagaaaaca tcaagtttct 2880
gtataaatat gagtgaaagc ataatcatac attatctttt caaagaattc accggtgcat 2940
gcttattagc cttgatagtg ctgaaaaaaa gaaaaaaaac aaaaaaaaga aataaaataa 3000
cggcaaacag caaaggccac agaaccgtat tcatgttact tctgcaatat caatcactta 3060
ctggcaagtg cgtataaatt aaacctattt ctttatcatc atatttactt atatctttaa 3120
cagattccaa accctaaagt gtccgaattt tcaatagggc gaacttgaag aataaccaag 3180
gtcaataata tatcttttag tataaccctg aaatttgccc tatagaaatc tagggtttct 3240
gtgtggtttc cgggtgagtc atacggcttt tttgaatttc tttttttgca gttgtctcta 3300
tcaatgaaaa tttcgaggaa gacgataagg ttaagataag tagataagag aatgatacga 3360
gataaagcac aaattagcag aaagaagagt ggttgcgaac agagtaaacc gaatcagacg 3420
tcagacctag gtcatgccga ggccctttcg tctcgcgcgt ttcggtgatg acggtgaaaa 3480
cctctgacac atgcagctcc cggagacggt cacagcttgt ctgtaagcgg atgccgggag 3540
cagacaagcc cgtcagggcg cgtcagcggg tgttggcggg tgtcggggct ggcttaacta 3600
tgcggcatca gagcagattg tactgagagt gcaccatacc acagcttttc aattcaattc 3660
atcatttttt ttttattctt ttttttgatt tcggtttcct tgaaattttt ttgattcggt 3720
aatctccgaa cagaaggaag aacgaaggaa ggagcacaga cttagattgg tatatatacg 3780
catatgtagt gttgaagaaa catgaaattg cccagtattc ttaacccaac tgcacagaac 3840
aaaaacctgc aggaaacgaa gataaatcat gtcgaaagct acatataagg aacgtgctgc 3900
tactcatcct agtcctgttg ctgccaagct atttaatatc atgcacgaaa agcaaacaaa 3960
cttgtgtgct tcattggatg ttcgtaccac caaggaatta ctggagttag ttgaagcatt 4020
aggtcccaaa atttgtttac taaaaacaca tgtggatatc ttgactgatt tttccatgga 4080
gggcacagtt aagccgctaa aggcattatc cgccaagtac aattttttac tcttcgaaga 4140
cagaaaattt gctgacattg gtaatacagt caaattgcag tactctgcgg gtgtatacag 4200
aatagcagaa tgggcagaca ttacgaatgc acacggtgtg gtgggcccag gtattgttag 4260
cggtttgaag caggcggcag aagaagtaac aaaggaacct agaggccttt tgatgttagc 4320
agaattgtca tgcaagggct ccctatctac tggagaatat actaagggta ctgttgacat 4380
tgcgaagagc gacaaagatt ttgttatcgg ctttattgct caaagagaca tgggtggaag 4440
agatgaaggt tacgattggt tgattatgac acccggtgtg ggtttagatg acaagggaga 4500
cgcattgggt caacagtata gaaccgtgga tgatgtggtc tctacaggat ctgacattat 4560
tattgttgga agaggactat ttgcaaaggg aagggatgct aaggtagagg gtgaacgtta 4620
cagaaaagca ggctgggaag catatttgag aagatgcggc cagcaaaact aaaaaactgt 4680
attataagta aatgcatgta tactaaactc acaaattaga gcttcaattt aattatatca 4740
gttattaccc tatgcggtgt gaaataccgc acagatgcgt aaggagaaaa taccgcatca 4800
ggaaattgta aacgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 4860
attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 4920
gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga acgtggactc 4980
caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg aaccatcacc 5040
ctaatcaagt tttttggggt cgaggtgccg taaagcacta aatcggaacc ctaaagggag 5100
cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg aagggaagaa 5160
agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg gtcacgctgc gcgtaaccac 5220
cacacccgcc gcgcttaatg cgccgctaca gggcgcgtcg cgccattcgc cattcaggct 5280
gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa 5340
agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg 5400
ttgtaaaacg acggccagtg agcgcgcgta atacgactca ctatagggcg aattgggtac 5460
tcctaggtta attaagataa tgtctgagtt aggtgagtat tctaaattag aaaacaaaga 5520
gcttagaacg gagtttgaat tgacaaattt tccttttcca ggcacaactg ataacgactc 5580
cgatgacgga agccaagggc agaactcttt gaatatcatt actcctgaca tggatgatac 5640
tctggttaat gatgtacttc gagaaaacga taaaaagtct agtatgagaa tggcttttat 5700
gaatctagca aactctattc ttggtgccgg aataattact cagccgttcg cgatcaaaaa 5760
tgctggtata ttaggcgggc tattatcata cgtagccctc ggatttatag ttgattggac 5820
gttaagactt attgtcatta acttgactct tgctggcaag agaacatacc agggtacggt 5880
cgaacatgta atgggtaaaa aagggaaatt gctgattcta tttacaaact ggtaccggcc 5940
gcaaattaaa gccttcgagc gtcccaaaac cttctcaagc aaggttttca gtataatgtt 6000
acatgcgtac acgcgtctgt acagaaaaaa aagaaaaatt tgaaatataa ataacgttct 6060
taatactaac ataactataa aaaaataaat agggacctag acttcaggtt gtctaactcc 6120
ttccttttcg gttagagcgg atgtgggggg agggcgtgaa cgtaagcgtg acataactaa 6180
ttacatgact cgaagacata aaaaacaaaa aaagcaccac cgactcggtg ccactttttc 6240
aagttgataa cggactagcc ttattttaac ttgctatttc tagctctaaa acgaaaaggg 6300
gatcctattg acgatcattt atctttcact gcggagaagt ttcgaacgcc gaaacatgcg 6360
caccaacttt cacttctaca gcgtttgacc aaaatctttt gaacagaaca ttgtagggtg 6420
tgaaaaaatg cgcaccttta ccgctagccc aagagggcac tacaaaatct agagttgtac 6480
ttcaaacgta catgtaatca ccttgtatat actcgaaaga aaacatcaag tttctgtata 6540
aatatgagtg aaagcataat catacattat cttttcaaag aagctccagc ttttgttccc 6600
tttagtgatc acgtccggat tgcggccgct tggcgtaatc atggtcatag ctgtttcctg 6660
tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 6720
aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 6780
ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 6840
gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 6900
tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 6960
aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 7020
gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 7080
aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 7140
ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 7200
tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 7260
tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 7320
ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 7380
tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 7440
ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca gtatttggta 7500
tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 7560
aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 7620
aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct ca 7672
<210> 17
<211> 20
<212> DNA
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 17
cgaacagagt aaaccgaatc 20
<210> 18
<211> 20
<212> DNA
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 18
agcactatca aggctaataa 20
<210> 19
<211> 20
<212> DNA
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 19
gcgaacttga agaataacca 20
<210> 20
<211> 20
<212> DNA
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 20
tcacctaact cagacattat 20
<210> 21
<211> 20
<212> DNA
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 21
ttgctgattc tatttacaaa 20
<210> 22
<211> 20
<212> DNA
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 22
gcaaactcta ttcttggtgc 20
<210> 23
<211> 20
<212> DNA
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 23
accagagtat catccatgtc 20
<210> 24
<211> 20
<212> DNA
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 24
aattcggaca ctttagggtt 20
<210> 25
<211> 20
<212> DNA
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 25
agatattata cctggacccc 20
<210> 26
<211> 23
<212> DNA
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 26
cccagttgga ttccgttatt gga 23
<210> 27
<211> 23
<212> DNA
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 27
ccaggtataa tatctaagga taa 23
<210> 28
<211> 94
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221>
<222>
<223> 质粒载体的一部分1059(Can1-7R)或质粒载体1148(Can1-11R)(Part ofPlasmid Vector 1059(Can1-7R) or Plasmid Vector 1148(Can1-11R))
<400> 28
ggttatgcta tgcattccgt tattggtgaa acccaggtgc ctggggtcca ggtataatat 60
cttaggataa aaacgaaggg aggttcttag gttg 94
<210> 29
<211> 94
<212> DNA
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 29
ccggcccagt tggattccgt tattggagaa acccaggtgc ctggggtcca ggtataatat 60
ctaaggataa aaacgaaggg aggttcttag gttg 94
<210> 30
<211> 23
<212> DNA
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 30
ccaggtataa tatctaagga taa 23
<210> 31
<211> 23
<212> DNA
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 31
ccgttattgg agaaacccag gtg 23
<210> 32
<211> 70
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221>
<222>
<223> 供体DNA(donor DNA)
<400> 32
gcgctaccgg actcagatct accggcccag ttggaatgta ggtggtgagc aagggcgagg 60
agctgttcac 70
<210> 33
<211> 70
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221>
<222>
<223> 供体DNA(donor DNA)
<400> 33
gcgctaccgg actcagatct accggcccag ttggaatgta gatggtgagc aagggcgagg 60
agctgttcac 70
<210> 34
<211> 70
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221>
<222>
<223> 供体DNA(donor DNA)
<400> 34
gcgctaccgg actcagatct acgggcccag ttggaatgta gatggtgagc aagggcgagg 60
agctgttcac 70
<210> 35
<211> 70
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221>
<222>
<223> 供体DNA(donor DNA)
<400> 35
gtgaacagct cctcgccctt gctcaccacc tacattccaa ctgggccggt agatctgagt 60
ccggtagcgc 70
<210> 36
<211> 70
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221>
<222>
<223> 供体DNA(donor DNA)
<400> 36
gtgaacagct cctcgccctt gctcaccatc tacattccaa ctgggccggt agatctgagt 60
ccggtagcgc 70
<210> 37
<211> 70
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221>
<222>
<223> 供体DNA(donor DNA)
<400> 37
gtgaacagct cctcgccctt gctcaccatc tacattccaa ctgggcccgt agatctgagt 60
ccggtagcgc 70
<210> 38
<211> 70
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221>
<222>
<223> 供体DNA(donor DNA)
<400> 38
ccgtcagatc cgctagcgct accggactca gatctaccgg cccagttgga atgtagatgg 60
tgagcaaggg 70
<210> 39
<211> 70
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221>
<222>
<223> 供体DNA(donor DNA)
<400> 39
gatctaccgg cccagttgga atgtagatgg tgagcaaggg cgaggagctg ttcaccgggg 60
tggtgcccat 70
<210> 40
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221>
<222>
<223> 供体DNA(donor DNA)
<400> 40
actcagatct accggcccag ttggaatgta gatggtgagc aagggcgagg 50
<210> 41
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221>
<222>
<223> 供体DNA(donor DNA)
<400> 41
cctcgccctt gctcaccatc tacattccaa ctgggccggt agatctgagt 50
<210> 42
<211> 6189
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221>
<222>
<223> 载体SY4(H1_sgRNA,CMV_mEGFP)(报告质粒)(Vector SY4(H1_sgRNA,CMV_mEGFP)(Reporter plasmid))
<220>
<221> 启动子(promoter)
<222> (263)..(491)
<223> H1启动子(H1 promoter)
<220>
<221> misc_structure
<222> (512)..(587)
<223> gRNA支架(gRNA scaffold)
<220>
<221> 增强子(enhancer)
<222> (602)..(981)
<223> CMV增强子(CMV enhancer)
<220>
<221> 启动子(promoter)
<222> (982)..(1185)
<223> CMV启动子(CMV promoter)
<220>
<221> misc_feature
<222> (1231)..(1250)
<223> KI_靶2(KI_target2)
<220>
<221> misc_feature
<222> (1236)..(1255)
<223> eGFP开关靶(eGFP switch target)
<220>
<221> misc_feature
<222> (1247)..(1249)
<223> 起始密码子(Start codon)
<220>
<221> 基因(gene)
<222> (1254)..(1969)
<223> EGFP
<220>
<221> polyA_信号(polyA_signal)
<222> (2012)..(2236)
<223> bGH poly(A)
<220>
<221> rep_origin
<222> (2282)..(2710)
<223> f1 ori
<220>
<221> 启动子(promoter)
<222> (2724)..(3053)
<223> SV40启动子(SV40 promoter)
<220>
<221> rep_origin
<222> (2904)..(3039)
<223> SV40 ori
<220>
<221> 基因(gene)
<222> (3070)..(3669)
<223> PuroR
<220>
<221> misc_structure
<222> (3683)..(4271)
<223> WPRE
<220>
<221> rep_origin
<222> (4468)..(5053)
<223> ori
<220>
<221> 基因(gene)
<222> (5224)..(6084)
<223> AmpR
<220>
<221> 启动子(promoter)
<222> (6085)..(6189)
<223> AmpR启动子(AmpR promoter)
<400> 42
cacatttccc cgaaaagtgc cacctgacgt cgacggatcg ggagatctcc cgatccccta 60
tggtgcactc tcagtacaat ctgctctgat gccgcatagt taagccagta tctgctccct 120
gcttgtgtgt tggaggtcgc tgagtagtgc gcgagcaaaa tttaagctac aacaaggcaa 180
ggcttgaccg acaattgcat gaagaatctg cttagggtta ggcgttttgc gctgcttcgc 240
gatgtacggg ccagatatac gcaattcgaa cgctgacgtc atcaacccgc tccaaggaat 300
cgcgggccca gtgtcactag gcgggaacac ccagcgcgcg tgcgccctgg caggaagatg 360
gctgtgaggg acaggggagt ggcgccctgc aatatttgca tgtcgctatg tgttctggga 420
aatcaccata aacgtgaaat gtctttggat ttgggaatct tataagttct gtatgaggac 480
cacagatccc ccacctacat tccaactggg cgttttagag ctagaaatag caagttaaaa 540
taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt ttttacgcgt 600
tgacattgat tattgactag ttattaatag taatcaatta cggggtcatt agttcatagc 660
ccatatatgg agttccgcgt tacataactt acggtaaatg gcccgcctgg ctgaccgccc 720
aacgaccccc gcccattgac gtcaataatg acgtatgttc ccatagtaac gccaataggg 780
actttccatt gacgtcaatg ggtggagtat ttacggtaaa ctgcccactt ggcagtacat 840
caagtgtatc atatgccaag tacgccccct attgacgtca atgacggtaa atggcccgcc 900
tggcattatg cccagtacat gaccttatgg gactttccta cttggcagta catctacgta 960
ttagtcatcg ctattaccat ggtgatgcgg ttttggcagt acatcaatgg gcgtggatag 1020
cggtttgact cacggggatt tccaagtctc caccccattg acgtcaatgg gagtttgttt 1080
tggcaccaaa atcaacggga ctttccaaaa tgtcgtaaca actccgcccc attgacgcaa 1140
atgggcggta ggcgtgtacg gtgggaggtc tatataagca gagctggttt agtgaaccgt 1200
cagatccgct agcgctaccg gactcagatc taccggccca gttggaatgt aggtggtgag 1260
caagggcgag gagctgttca ccggggtggt gcccatcctg gtcgagctgg acggcgacgt 1320
aaacggccac aagttcagcg tgtccggcga gggcgagggc gatgccacct acggcaagct 1380
gaccctgaag ttcatctgca ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac 1440
caccttcacc tacggcgtgc agtgcttcag ccgctacccc gaccacatga agcagcacga 1500
cttcttcaag tccgccatgc ccgaaggcta cgtccaggag cgcaccatct tcttcaagga 1560
cgacggcaac tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc tggtgaaccg 1620
catcgagctg aagggcatcg acttcaagga ggacggcaac atcctggggc acaagctgga 1680
gtacaactac aacagccaca acgtctatat catggccgac aagcagaaga acggcatcaa 1740
ggtgaacttc aagatccgcc acaacatcga ggacggcagc gtgcagctcg ccgaccacta 1800
ccagcagaac acccccatcg gcgacggccc cgtgctgctg cccgacaacc actacctgag 1860
cacccagtcc gccctgagca aagaccccaa cgagaagcgc gatcacatgg tcctgctgga 1920
gttcgtgacc gccgccggga tcactcacgg catggacgag ctgtacaagg ctcgagctca 1980
agcttaagtt taaaccgctg atcagcctcg actgtgcctt ctagttgcca gccatctgtt 2040
gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac tgtcctttcc 2100
taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat tctggggggt 2160
ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca tgctggggat 2220
gcggtgggct ctatggcttc tgaggcggaa agaaccagct ggggctctag ggggtatccc 2280
cacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc 2340
gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc 2400
acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt 2460
agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg 2520
ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt 2580
ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta 2640
taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt 2700
aacgcgaatt aattctgtgg aatgtgtgtc agttagggtg tggaaagtcc ccaggctccc 2760
cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccagg tgtggaaagt 2820
ccccaggctc cccagcaggc agaagtatgc aaagcatgca tctcaattag tcagcaacca 2880
tagtcccgcc cctaactccg cccatcccgc ccctaactcc gcccagttcc gcccattctc 2940
cgccccatgg ctgactaatt ttttttattt atgcagaggc cgaggccgcc tctgcctctg 3000
agctattcca gaagtagtga ggaggctttt ttggaggcct aggcttttgc aaaaagctcc 3060
cggtctagaa tgaccgagta caagcccacg gtgcgcctcg ccacccgcga cgacgtcccc 3120
cgggccgtac gcaccctcgc cgccgcgttc gccgactacc ccgccacgcg ccacaccgtc 3180
gacccggacc gccacatcga gcgggtcacc gagctgcaag aactcttcct cacgcgcgtc 3240
gggctcgaca tcggcaaggt gtgggtcgcg gacgacggcg ccgcggtggc ggtctggacc 3300
acgccggaga gcgtcgaagc gggggcggtg ttcgccgaga tcggcccgcg catggccgag 3360
ttgagcggtt cccggctggc cgcgcagcaa cagatggaag gcctcctggc gccgcaccgg 3420
cccaaggagc ccgcgtggtt cctggccacc gtcggcgtct cgcccgacca ccagggcaag 3480
ggtctgggca gcgccgtcgt gctccccgga gtggaggcgg ccgagcgcgc cggggtgccc 3540
gccttcctgg agacctccgc gccccgcaac ctccccttct acgagcggct cggcttcacc 3600
gtcaccgccg acgtcgaggt gcccgaagga ccgcgcacct ggtgcatgac ccgcaagccc 3660
ggtgcctaga cgcgtctgga acaatcaacc tctggattac aaaatttgtg aaagattgac 3720
tggtattctt aactatgttg ctccttttac gctatgtgga tacgctgctt taatgccttt 3780
gtatcatgct attgcttccc gtatggcttt cattttctcc tccttgtata aatcctggtt 3840
gctgtctctt tatgaggagt tgtggcccgt tgtcaggcaa cgtggcgtgg tgtgcactgt 3900
gtttgctgac gcaaccccca ctggttgggg cattgccacc acctgtcagc tcctttccgg 3960
gactttcgct ttccccctcc ctattgccac ggcggaactc atcgccgcct gccttgcccg 4020
ctgctggaca ggggctcggc tgttgggcac tgacaattcc gtggtgttgt cggggaagct 4080
gacgtccttt ccatggctgc tcgcctgtgt tgccacctgg attctgcgcg ggacgtcctt 4140
ctgctacgtc ccttcggccc tcaatccagc ggaccttcct tcccgcggcc tgctgccggc 4200
tctgcggcct cttccgcgtc ttcgccttcg ccctcagacg agtcggatct ccctttgggc 4260
cgcctccccg cctggaatta attctgcggc cgcttcctcg ctcactgact cgctgcgctc 4320
ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 4380
agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 4440
ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca 4500
caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 4560
gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 4620
cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta 4680
tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 4740
gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 4800
cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 4860
tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagaa cagtatttgg 4920
tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg 4980
caaacaaacc accgctggta gcggtttttt tgtttgcaag cagcagatta cgcgcagaaa 5040
aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 5100
aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 5160
tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 5220
cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 5280
catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg 5340
ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat 5400
aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat 5460
ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg 5520
caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc 5580
attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa 5640
agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc 5700
actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt 5760
ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag 5820
ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt 5880
gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag 5940
atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac 6000
cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc 6060
gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca 6120
gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg 6180
ggttccgcg 6189
<210> 43
<211> 10648
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221>
<222>
<223> 载体SY45(CMV_Cas9-PmCDA1,EF1_iRFP)(效应质粒)(Vector SY45(CMV_Cas9-PmCDA1,EF1_iRFP)(Effector plasmid))
<220>
<221> 增强子(enhancer)
<222> (23)..(402)
<223> CMV增强子(CMV enhancer)
<220>
<221> 启动子(promoter)
<222> (403)..(606)
<223> CMV启动子(CMV promoter)
<220>
<221> 启动子(promoter)
<222> (651)..(669)
<223> T7启动子(T7 promoter)
<220>
<221> misc_feature
<222> (689)..(691)
<223> Kozak序列(Kozak sequence)
<220>
<221> misc_signal
<222> (692)..(742)
<223> NLS单元(NLS unit)
<220>
<221> misc_signal
<222> (698)..(718)
<223> SV40 NLS
<220>
<221> 基因(gene)
<222> (743)..(4879)
<223> Cas9
<220>
<221> misc_signal
<222> (4859)..(4879)
<223> SV40 NLS
<220>
<221> misc_structure
<222> (4910)..(5080)
<223> 失效SH3 hs(dead SH3 hs)
<220>
<221> misc_signal
<222> (5087)..(5152)
<223> 3xFLAG hs
<220>
<221> 基因(gene)
<222> (5159)..(5782)
<223> HsPmCDA1
<220>
<221> polyA_信号(polyA_signal)
<222> (5799)..(5920)
<223> SV40 poly(A)信号(SV40 poly(A) signal)
<220>
<221> rep_origin
<222> (6026)..(6614)
<223> ori
<220>
<221> 基因(gene)
<222> (6788)..(7645)
<223> AmpR
<220>
<221> 启动子(promoter)
<222> (7646)..(7750)
<223> AmpR启动子(AmpR promoter)
<220>
<221> 启动子(promoter)
<222> (8145)..(9322)
<223> EF-1alpha启动子(EF-1alpha promoter)
<220>
<221> 内含子(Intron)
<222> (8376)..(9313)
<223> EF-1alpha 内含子A(EF-1alpha intron A)
<220>
<221> 基因(gene)
<222> (9349)..(10284)
<223> iRFP670
<220>
<221> misc_feature
<222> (9349)..(9352)
<223> Kozak序列(Kozak sequence)
<220>
<221> polyA_信号(polyA_signal)
<222> (10314)..(10538)
<223> bGH poly(A)
<400> 43
gggtaacgcc agggtacgcg ttgacattga ttattgacta gttattaata gtaatcaatt 60
acggggtcat tagttcatag cccatatatg gagttccgcg ttacataact tacggtaaat 120
ggcccgcctg gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt 180
cccatagtaa cgccaatagg gactttccat tgacgtcaat gggtggagta tttacggtaa 240
actgcccact tggcagtaca tcaagtgtat catatgccaa gtacgccccc tattgacgtc 300
aatgacggta aatggcccgc ctggcattat gcccagtaca tgaccttatg ggactttcct 360
acttggcagt acatctacgt attagtcatc gctattacca tggtgatgcg gttttggcag 420
tacatcaatg ggcgtggata gcggtttgac tcacggggat ttccaagtct ccaccccatt 480
gacgtcaatg ggagtttgtt ttggcaccaa aatcaacggg actttccaaa atgtcgtaac 540
aactccgccc cattgacgca aatgggcggt aggcgtgtac ggtgggaggt ctatataagc 600
agagctctct ggctaactag agaacccact gcttactggc ttatcgaaat taatacgact 660
cactataggg agacccaagc tggctagcga aatggcaccg aagaagaagc gtaaagtcgg 720
aatccacgga gttcctgcgg caatggacaa gaagtactcc attgggctcg atatcggcac 780
aaacagcgtc ggttgggccg tcattacgga cgagtacaag gtgccgagca aaaaattcaa 840
agttctgggc aataccgatc gccacagcat aaagaagaac ctcattggcg ccctcctgtt 900
cgactccggg gagacggccg aagccacgcg gctcaaaaga acagcacggc gcagatatac 960
ccgcagaaag aatcggatct gctacctgca ggagatcttt agtaatgaga tggctaaggt 1020
ggatgactct ttcttccata ggctggagga gtcctttttg gtggaggagg ataaaaagca 1080
cgagcgccac ccaatctttg gcaatatcgt ggacgaggtg gcgtaccatg aaaagtaccc 1140
aaccatatat catctgagga agaagcttgt agacagtact gataaggctg acttgcggtt 1200
gatctatctc gcgctggcgc atatgatcaa atttcgggga cacttcctca tcgaggggga 1260
cctgaaccca gacaacagcg atgtcgacaa actctttatc caactggttc agacttacaa 1320
tcagcttttc gaagagaacc cgatcaacgc atccggagtt gacgccaaag caatcctgag 1380
cgctaggctg tccaaatccc ggcggctcga aaacctcatc gcacagctcc ctggggagaa 1440
gaagaacggc ctgtttggta atcttatcgc cctgtcactc gggctgaccc ccaactttaa 1500
atctaacttc gacctggccg aagatgccaa gcttcaactg agcaaagaca cctacgatga 1560
tgatctcgac aatctgctgg cccagatcgg cgaccagtac gcagaccttt ttttggcggc 1620
aaagaacctg tcagacgcca ttctgctgag tgatattctg cgagtgaaca cggagatcac 1680
caaagctccg ctgagcgcta gtatgatcaa gcgctatgat gagcaccacc aagacttgac 1740
tttgctgaag gcccttgtca gacagcaact gcctgagaag tacaaggaaa ttttcttcga 1800
tcagtctaaa aatggctacg ccggatacat tgacggcgga gcaagccagg aggaatttta 1860
caaatttatt aagcccatct tggaaaaaat ggacggcacc gaggagctgc tggtaaagct 1920
taacagagaa gatctgttgc gcaaacagcg cactttcgac aatggaagca tcccccacca 1980
gattcacctg ggcgaactgc acgctatcct caggcggcaa gaggatttct accccttttt 2040
gaaagataac agggaaaaga ttgagaaaat cctcacattt cggataccct actatgtagg 2100
ccccctcgcc cggggaaatt ccagattcgc gtggatgact cgcaaatcag aagagaccat 2160
cactccctgg aacttcgagg aagtcgtgga taagggggcc tctgcccagt ccttcatcga 2220
aaggatgact aactttgata aaaatctgcc taacgaaaag gtgcttccta aacactctct 2280
gctgtacgag tacttcacag tttataacga gctcaccaag gtcaaatacg tcacagaagg 2340
gatgagaaag ccagcattcc tgtctggaga gcagaagaaa gctatcgtgg acctcctctt 2400
caagacgaac cggaaagtta ccgtgaaaca gctcaaagaa gactatttca aaaagattga 2460
atgtttcgac tctgttgaaa tcagcggagt ggaggatcgc ttcaacgcat ccctgggaac 2520
gtatcacgat ctcctgaaaa tcattaaaga caaggacttc ctggacaatg aggagaacga 2580
ggacattctt gaggacattg tcctcaccct tacgttgttt gaagataggg agatgattga 2640
agaacgcttg aaaacttacg ctcatctctt cgacgacaaa gtcatgaaac agctcaagag 2700
gcgccgatat acaggatggg ggcggctgtc aagaaaactg atcaatggga tccgagacaa 2760
gcagagtgga aagacaatcc tggattttct taagtccgat ggatttgcca accggaactt 2820
catgcagttg atccatgatg actctctcac ctttaaggag gacatccaga aagcacaagt 2880
ttctggccag ggggacagtc ttcacgagca catcgctaat cttgcaggta gcccagctat 2940
caaaaaggga atactgcaga ccgttaaggt cgtggatgaa ctcgtcaaag taatgggaag 3000
gcataagccc gagaatatcg ttatcgagat ggcccgagag aaccaaacta cccagaaggg 3060
acagaagaac agtagggaaa ggatgaagag gattgaagag ggtataaaag aactggggtc 3120
ccaaatcctt aaggaacacc cagttgaaaa cacccagctt cagaatgaga agctctacct 3180
gtactacctg cagaacggca gggacatgta cgtggatcag gaactggaca tcaatcggct 3240
ctccgactac gacgtggatc atatcgtgcc ccagtctttt ctcaaagatg attctattga 3300
taataaagtg ttgacaagat ccgataaaaa tagagggaag agtgataacg tcccctcaga 3360
agaagttgtc aagaaaatga aaaattattg gcggcagctg ctgaacgcca aactgatcac 3420
acaacggaag ttcgataatc tgactaaggc tgaacgaggt ggcctgtctg agttggataa 3480
agccggcttc atcaaaaggc agcttgttga gacacgccag atcaccaagc acgtggccca 3540
aattctcgat tcacgcatga acaccaagta cgatgaaaat gacaaactga ttcgagaggt 3600
gaaagttatt actctgaagt ctaagctggt ctcagatttc agaaaggact ttcagtttta 3660
taaggtgaga gagatcaaca attaccacca tgcgcatgat gcctacctga atgcagtggt 3720
aggcactgca cttatcaaaa aatatcccaa gcttgaatct gaatttgttt acggagacta 3780
taaagtgtac gatgttagga aaatgatcgc aaagtctgag caggaaatag gcaaggccac 3840
cgctaagtac ttcttttaca gcaatattat gaattttttc aagaccgaga ttacactggc 3900
caatggagag attcggaagc gaccacttat cgaaacaaac ggagaaacag gagaaatcgt 3960
gtgggacaag ggtagggatt tcgcgacagt ccggaaggtc ctgtccatgc cgcaggtgaa 4020
catcgttaaa aagaccgaag tacagaccgg aggcttctcc aaggaaagta tcctcccgaa 4080
aaggaacagc gacaagctga tcgcacgcaa aaaagattgg gaccccaaga aatacggcgg 4140
attcgattct cctacagtcg cttacagtgt actggttgtg gccaaagtgg agaaagggaa 4200
gtctaaaaaa ctcaaaagcg tcaaggaact gctgggcatc acaatcatgg agcgatcaag 4260
cttcgaaaaa aaccccatcg actttctcga ggcgaaagga tataaagagg tcaaaaaaga 4320
cctcatcatt aagcttccca agtactctct ctttgagctt gaaaacggcc ggaaacgaat 4380
gctcgctagt gcgggcgagc tgcagaaagg taacgagctg gcactgccct ctaaatacgt 4440
taatttcttg tatctggcca gccactatga aaagctcaaa gggtctcccg aagataatga 4500
gcagaagcag ctgttcgtgg aacaacacaa acactacctt gatgagatca tcgagcaaat 4560
aagcgaattc tccaaaagag tgatcctcgc cgacgctaac ctcgataagg tgctttctgc 4620
ttacaataag cacagggata agcccatcag ggagcaggca gaaaacatta tccacttgtt 4680
tactctgacc aacttgggcg cgcctgcagc cttcaagtac ttcgacacca ccatagacag 4740
aaagcggtac acctctacaa aggaggtcct ggacgccaca ctgattcatc agtcaattac 4800
ggggctctat gaaacaagaa tcgacctctc tcagctcggt ggagacagca gggctgaccc 4860
caagaagaag aggaaggtgg gtggaggagg taccggcggt ggaggctcag cagaatacgt 4920
acgagctctg tttgacttca atgggaatga cgaggaggat ctccccttta agaagggcga 4980
tattctccgc atcagagata agcccgaaga acaatggtgg aatgccgagg atagcgaagg 5040
gaaaaggggc atgattctgg tgccatatgt ggagaaatat tccggtgact acaaagacca 5100
tgatggggat tacaaagacc acgacatcga ctacaaagac gacgacgata aatcagggat 5160
gacagacgcc gagtacgtgc gcattcatga gaaactggat atttacacct tcaagaagca 5220
gttcttcaac aacaagaaat ctgtgtcaca ccgctgctac gtgctgtttg agttgaagcg 5280
aaggggcgaa agaagggctt gcttttgggg ctatgccgtc aacaagcccc aaagtggcac 5340
cgagagagga atacacgctg agatattcag tatccgaaag gtggaagagt atcttcggga 5400
taatcctggg cagtttacga tcaactggta ttccagctgg agtccttgcg ctgattgtgc 5460
cgagaaaatt ctggaatggt ataatcagga acttcgggga aacgggcaca cattgaaaat 5520
ctgggcctgc aagctgtact acgagaagaa tgcccggaac cagataggac tctggaatct 5580
gagggacaat ggtgtaggcc tgaacgtgat ggtttccgag cactatcagt gttgtcggaa 5640
gattttcatc caaagctctc ataaccagct caatgaaaac cgctggttgg agaaaacact 5700
gaaacgtgcg gagaagcgga gatccgagct gagcatcatg atccaggtca agattctgca 5760
taccactaag tctccagccg tttagcttcg cccaccccaa cttgtttatt gcagcttata 5820
atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc 5880
attctagttg tggtttgtcc aaactcatca atgtatctta gcggccgcca ccgcggtgga 5940
gctccagctt ttgttccctt tagtgagggt taattgcgcg ccagcaaaag gccaggaacc 6000
gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 6060
aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 6120
ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 6180
tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 6240
tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 6300
ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 6360
tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 6420
ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta 6480
tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 6540
aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 6600
aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 6660
aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 6720
ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 6780
acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 6840
ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 6900
gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa 6960
taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 7020
tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 7080
gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 7140
cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 7200
aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 7260
cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 7320
tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 7380
gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag 7440
tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 7500
gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 7560
ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 7620
cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 7680
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 7740
gggttccgcg cacatttccc cgaaaagtgc cacctaaatt gtaagcgtta atattttgtt 7800
aaaattcgcg ttaaattttt gttaaatcag ctcatttttt aaccaatagg ccgaaatcgg 7860
caaaatccct tataaatcaa aagaatagac cgagataggg ttgagtgttg ttccagtttg 7920
gaacaagagt ccactattaa agaacgtgga ctccaacgtc aaagggcgaa aaaccgtcta 7980
tcagggcgat ggcccactac gtgaaccatc accctaatca agttttttgg ggtcgaggtg 8040
ccgtaaagca ctaaatcgga accctaaagg gagcccccga tttagagctt gacggggaaa 8100
gccgcagcta atggaccttc taggtcttga aaggagtggg aattggctcc ggtgcccgtc 8160
agtgggcaga gcgcacatcg cccacagtcc ccgagaagtt ggggggaggg gtcggcaatt 8220
gaaccggtgc ctagagaagg tggcgcgggg taaactggga aagtgatgtc gtgtactggc 8280
tccgcctttt tcccgagggt gggggagaac cgtatataag tgcagtagtc gccgtgaacg 8340
ttctttttcg caacgggttt gccgccagaa cacaggtaag tgccgtgtgt ggttcccgcg 8400
ggcctggcct ctttacgggt tatggccctt gcgtgccttg aattacttcc actggctgca 8460
gtacgtgatt cttgatcccg agcttcgggt tggaagtggg tgggagagtt cgaggccttg 8520
cgcttaagga gccccttcgc ctcgtgcttg agttgaggcc tggcctgggc gctggggccg 8580
ccgcgtgcga atctggtggc accttcgcgc ctgtctcgct gctttcgata agtctctagc 8640
catttaaaat ttttgatgac ctgctgcgac gctttttttc tggcaagata gtcttgtaaa 8700
tgcgggccaa gatctgcaca ctggtatttc ggtttttggg gccgcgggcg gcgacggggc 8760
ccgtgcgtcc cagcgcacat gttcggcgag gcggggcctg cgagcgcggc caccgagaat 8820
cggacggggg tagtctcaag ctggccggcc tgctctggtg cctggcctcg cgccgccgtg 8880
tatcgccccg ccctgggcgg caaggctggc ccggtcggca ccagttgcgt gagcggaaag 8940
atggccgctt cccggccctg ctgcagggag ctcaaaatgg aggacgcggc gctcgggaga 9000
gcgggcgggt gagtcaccca cacaaaggaa aagggccttt ccgtcctcag ccgtcgcttc 9060
atgtgactcc acggagtacc gggcgccgtc caggcacctc gattagttct cgagcttttg 9120
gagtacgtcg tctttaggtt ggggggaggg gttttatgcg atggagtttc cccacactga 9180
gtgggtggag actgaagtta ggccagcttg gcacttgatg taattctcct tggaatttgc 9240
cctttttgag tttggatctt ggttcattct caagcctcag acagtggttc aaagtttttt 9300
tcttccattt caggtgtcgt gaggaatttc gacccggatc cggccaccat ggcgcgtaag 9360
gtcgatctca cctcctgcga tcgcgagccg atccacatcc ccggcagcat tcagccgtgc 9420
ggctgcctgc tagcctgcga cgcgcaggcg gtgcggatca cgcgcattac ggaaaatgcc 9480
ggcgcgttct ttggacgcga aactccgcgg gtcggtgagc tactcgccga ttacttcggc 9540
gagaccgaag cccatgcgct gcgcaacgca ctggcgcagt cctccgatcc aaagcgaccg 9600
gcgctgatct tcggttggcg cgacggcctg accggccgca ccttcgacat ctcactgcat 9660
cgccatgacg gtacatcgat catcgagttc gagcctgcgg cggccgaaca ggccgacaat 9720
ccgctgcggc tgacgcggca gatcatcgcg cgcaccaaag aactgaagtc gctcgaagag 9780
atggccgcac gggtgccgcg ctatctgcag gcgatgctcg gctatcaccg cgtgatgttg 9840
taccgcttcg cggacgacgg ctccgggatg gtgatcggcg aggcgaagcg cagcgacctc 9900
gagagctttc tcggtcagca ctttccggcg tcgctggtcc cgcagcaggc gcggctactg 9960
tacttgaaga acgcgatccg cgtggtctcg gattcgcgcg gcatcagcag ccggatcgtg 10020
cccgagcacg acgcctccgg cgccgcgctc gatctgtcgt tcgcgcacct gcgcagcatc 10080
tcgccctgcc atctcgaatt tctgcggaac atgggcgtca gcgcctcgat gtcgctgtcg 10140
atcatcattg acggcacgct atggggattg atcatctgtc atcattacga gccgcgtgcc 10200
gtgccgatgg cgcagcgcgt cgcggccgaa atgttcgccg acttcttatc gctgcacttc 10260
accgccgccc accaccaacg ctaagcggcc gcgactctaa ccggtctcag aagccataga 10320
gcccaccgca tccccagcat gcctgctatt gtcttcccaa tcctccccct tgctgtcctg 10380
ccccacccca ccccccagaa tagaatgaca cctactcaga caatgcgatg caatttcctc 10440
attttattag gaaaggacag tgggagtggc accttccagg gtcaaggaag gcacggggga 10500
ggggcaaaca acagatggct ggcaactaga aggcacagtc gaggctgatc attcaggctg 10560
cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa 10620
gggggatgtg ctgcaaggcg attaagtt 10648
<210> 44
<211> 10120
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221>
<222>
<223> 载体SY45(CMV_Cas9,EF1_iRFP)(效应质粒)(Vector SY45(CMV_Cas9,EF1_iRFP)(Effector plasmid))
<220>
<221> 启动子(promoter)
<222> (76)..(1253)
<223> EF-1alpha启动子(EF-1alpha promoter)
<220>
<221> 内含子(Intron)
<222> (307)..(1244)
<223> EF-1alpha 内含子A(EF-1alpha intron A)
<220>
<221> 基因(gene)
<222> (1280)..(2215)
<223> iRFP670
<220>
<221> misc_feature
<222> (1280)..(1283)
<223> Kozak序列(Kozak sequence)
<220>
<221> polyA_信号(polyA_signal)
<222> (2245)..(2469)
<223> bGH poly(A)
<220>
<221> 启动子(promoter)
<222> (2677)..(2905)
<223> H1启动子(H1 promoter)
<220>
<221> misc_feature
<222> (2925)..(2925)
<223> 靶1(target1)
<220>
<221> misc_structure
<222> (2926)..(3001)
<223> gRNA支架(gRNA scaffold)
<220>
<221> 增强子(enhancer)
<222> (3016)..(3395)
<223> CMV增强子(CMV enhancer)
<220>
<221> 增强子(promoter)
<222> (3396)..(3599)
<223> CMV增强子(CMV promoter)
<220>
<221> misc_signal
<222> (3646)..(3696)
<223> NLS单元(NLS unit)
<220>
<221> misc_signal
<222> (3652)..(3672)
<223> SV40 NLS
<220>
<221> 基因(gene)
<222> (3697)..(7836)
<223> Cas9
<220>
<221> misc_signal
<222> (7813)..(7833)
<223> SV40 NLS
<220>
<221> polyA_信号(polyA_signal)
<222> (7850)..(7971)
<223> SV40 poly(A)信号(SV40 poly(A) signal)
<220>
<221> rep_origin
<222> (8077)..(8665)
<223> ori
<220>
<221> 基因(gene)
<222> (8839)..(9696)
<223> AmpR
<220>
<221> 启动子(promoter)
<222> (9697)..(9801)
<223> AmpR启动子(AmpR promoter)
<400> 44
ggagcccccg atttagagct tgacggggaa agccgcagct aatggacctt ctaggtcttg 60
aaaggagtgg gaattggctc cggtgcccgt cagtgggcag agcgcacatc gcccacagtc 120
cccgagaagt tggggggagg ggtcggcaat tgaaccggtg cctagagaag gtggcgcggg 180
gtaaactggg aaagtgatgt cgtgtactgg ctccgccttt ttcccgaggg tgggggagaa 240
ccgtatataa gtgcagtagt cgccgtgaac gttctttttc gcaacgggtt tgccgccaga 300
acacaggtaa gtgccgtgtg tggttcccgc gggcctggcc tctttacggg ttatggccct 360
tgcgtgcctt gaattacttc cactggctgc agtacgtgat tcttgatccc gagcttcggg 420
ttggaagtgg gtgggagagt tcgaggcctt gcgcttaagg agccccttcg cctcgtgctt 480
gagttgaggc ctggcctggg cgctggggcc gccgcgtgcg aatctggtgg caccttcgcg 540
cctgtctcgc tgctttcgat aagtctctag ccatttaaaa tttttgatga cctgctgcga 600
cgcttttttt ctggcaagat agtcttgtaa atgcgggcca agatctgcac actggtattt 660
cggtttttgg ggccgcgggc ggcgacgggg cccgtgcgtc ccagcgcaca tgttcggcga 720
ggcggggcct gcgagcgcgg ccaccgagaa tcggacgggg gtagtctcaa gctggccggc 780
ctgctctggt gcctggcctc gcgccgccgt gtatcgcccc gccctgggcg gcaaggctgg 840
cccggtcggc accagttgcg tgagcggaaa gatggccgct tcccggccct gctgcaggga 900
gctcaaaatg gaggacgcgg cgctcgggag agcgggcggg tgagtcaccc acacaaagga 960
aaagggcctt tccgtcctca gccgtcgctt catgtgactc cacggagtac cgggcgccgt 1020
ccaggcacct cgattagttc tcgagctttt ggagtacgtc gtctttaggt tggggggagg 1080
ggttttatgc gatggagttt ccccacactg agtgggtgga gactgaagtt aggccagctt 1140
ggcacttgat gtaattctcc ttggaatttg ccctttttga gtttggatct tggttcattc 1200
tcaagcctca gacagtggtt caaagttttt ttcttccatt tcaggtgtcg tgaggaattt 1260
cgacccggat ccggccacca tggcgcgtaa ggtcgatctc acctcctgcg atcgcgagcc 1320
gatccacatc cccggcagca ttcagccgtg cggctgcctg ctagcctgcg acgcgcaggc 1380
ggtgcggatc acgcgcatta cggaaaatgc cggcgcgttc tttggacgcg aaactccgcg 1440
ggtcggtgag ctactcgccg attacttcgg cgagaccgaa gcccatgcgc tgcgcaacgc 1500
actggcgcag tcctccgatc caaagcgacc ggcgctgatc ttcggttggc gcgacggcct 1560
gaccggccgc accttcgaca tctcactgca tcgccatgac ggtacatcga tcatcgagtt 1620
cgagcctgcg gcggccgaac aggccgacaa tccgctgcgg ctgacgcggc agatcatcgc 1680
gcgcaccaaa gaactgaagt cgctcgaaga gatggccgca cgggtgccgc gctatctgca 1740
ggcgatgctc ggctatcacc gcgtgatgtt gtaccgcttc gcggacgacg gctccgggat 1800
ggtgatcggc gaggcgaagc gcagcgacct cgagagcttt ctcggtcagc actttccggc 1860
gtcgctggtc ccgcagcagg cgcggctact gtacttgaag aacgcgatcc gcgtggtctc 1920
ggattcgcgc ggcatcagca gccggatcgt gcccgagcac gacgcctccg gcgccgcgct 1980
cgatctgtcg ttcgcgcacc tgcgcagcat ctcgccctgc catctcgaat ttctgcggaa 2040
catgggcgtc agcgcctcga tgtcgctgtc gatcatcatt gacggcacgc tatggggatt 2100
gatcatctgt catcattacg agccgcgtgc cgtgccgatg gcgcagcgcg tcgcggccga 2160
aatgttcgcc gacttcttat cgctgcactt caccgccgcc caccaccaac gctaagcggc 2220
cgcgactcta accggtctca gaagccatag agcccaccgc atccccagca tgcctgctat 2280
tgtcttccca atcctccccc ttgctgtcct gccccacccc accccccaga atagaatgac 2340
acctactcag acaatgcgat gcaatttcct cattttatta ggaaaggaca gtgggagtgg 2400
caccttccag ggtcaaggaa ggcacggggg aggggcaaac aacagatggc tggcaactag 2460
aaggcacagt cgaggctgat cattcaggct gcgcaactgt tgggaagggc gatcggtgcg 2520
ggcctcttcg ctattacgcc agctggcgaa agggggatgt gctgcaaggc gattaagttg 2580
ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg acggccagtg agcgcgcgta 2640
atacgactca ctatagggcg aattgggtac cgggccaatt cgaacgctga cgtcatcaac 2700
ccgctccaag gaatcgcggg cccagtgtca ctaggcggga acacccagcg cgcgtgcgcc 2760
ctggcaggaa gatggctgtg agggacaggg gagtggcgcc ctgcaatatt tgcatgtcgc 2820
tatgtgttct gggaaatcac cataaacgtg aaatgtcttt ggatttggga atcttataag 2880
ttctgtatga ggaccacaga tccccagaag agccggcgct cttcagtttt agagctagaa 2940
atagcaagtt aaaataaggc tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg 3000
ctttttttac gcgttgacat tgattattga ctagttatta atagtaatca attacggggt 3060
cattagttca tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc 3120
ctggctgacc gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag 3180
taacgccaat agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc 3240
acttggcagt acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg 3300
gtaaatggcc cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc 3360
agtacatcta cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca 3420
atgggcgtgg atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca 3480
atgggagttt gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg 3540
ccccattgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata agcagagctc 3600
tctggctaac tagagaaccc actgcttact ggcttatcgg ccaccatggc accgaagaag 3660
aagcgtaaag tcggaatcca cggagttcct gcggcaatgg acaagaagta ctccattggg 3720
ctcgatatcg gcacaaacag cgtcggttgg gccgtcatta cggacgagta caaggtgccg 3780
agcaaaaaat tcaaagttct gggcaatacc gatcgccaca gcataaagaa gaacctcatt 3840
ggcgccctcc tgttcgactc cggggagacg gccgaagcca cgcggctcaa aagaacagca 3900
cggcgcagat atacccgcag aaagaatcgg atctgctacc tgcaggagat ctttagtaat 3960
gagatggcta aggtggatga ctctttcttc cataggctgg aggagtcctt tttggtggag 4020
gaggataaaa agcacgagcg ccacccaatc tttggcaata tcgtggacga ggtggcgtac 4080
catgaaaagt acccaaccat atatcatctg aggaagaagc ttgtagacag tactgataag 4140
gctgacttgc ggttgatcta tctcgcgctg gcgcatatga tcaaatttcg gggacacttc 4200
ctcatcgagg gggacctgaa cccagacaac agcgatgtcg acaaactctt tatccaactg 4260
gttcagactt acaatcagct tttcgaagag aacccgatca acgcatccgg agttgacgcc 4320
aaagcaatcc tgagcgctag gctgtccaaa tcccggcggc tcgaaaacct catcgcacag 4380
ctccctgggg agaagaagaa cggcctgttt ggtaatctta tcgccctgtc actcgggctg 4440
acccccaact ttaaatctaa cttcgacctg gccgaagatg ccaagcttca actgagcaaa 4500
gacacctacg atgatgatct cgacaatctg ctggcccaga tcggcgacca gtacgcagac 4560
ctttttttgg cggcaaagaa cctgtcagac gccattctgc tgagtgatat tctgcgagtg 4620
aacacggaga tcaccaaagc tccgctgagc gctagtatga tcaagcgcta tgatgagcac 4680
caccaagact tgactttgct gaaggccctt gtcagacagc aactgcctga gaagtacaag 4740
gaaattttct tcgatcagtc taaaaatggc tacgccggat acattgacgg cggagcaagc 4800
caggaggaat tttacaaatt tattaagccc atcttggaaa aaatggacgg caccgaggag 4860
ctgctggtaa agcttaacag agaagatctg ttgcgcaaac agcgcacttt cgacaatgga 4920
agcatccccc accagattca cctgggcgaa ctgcacgcta tcctcaggcg gcaagaggat 4980
ttctacccct ttttgaaaga taacagggaa aagattgaga aaatcctcac atttcggata 5040
ccctactatg taggccccct cgcccgggga aattccagat tcgcgtggat gactcgcaaa 5100
tcagaagaga ccatcactcc ctggaacttc gaggaagtcg tggataaggg ggcctctgcc 5160
cagtccttca tcgaaaggat gactaacttt gataaaaatc tgcctaacga aaaggtgctt 5220
cctaaacact ctctgctgta cgagtacttc acagtttata acgagctcac caaggtcaaa 5280
tacgtcacag aagggatgag aaagccagca ttcctgtctg gagagcagaa gaaagctatc 5340
gtggacctcc tcttcaagac gaaccggaaa gttaccgtga aacagctcaa agaagactat 5400
ttcaaaaaga ttgaatgttt cgactctgtt gaaatcagcg gagtggagga tcgcttcaac 5460
gcatccctgg gaacgtatca cgatctcctg aaaatcatta aagacaagga cttcctggac 5520
aatgaggaga acgaggacat tcttgaggac attgtcctca cccttacgtt gtttgaagat 5580
agggagatga ttgaagaacg cttgaaaact tacgctcatc tcttcgacga caaagtcatg 5640
aaacagctca agaggcgccg atatacagga tgggggcggc tgtcaagaaa actgatcaat 5700
gggatccgag acaagcagag tggaaagaca atcctggatt ttcttaagtc cgatggattt 5760
gccaaccgga acttcatgca gttgatccat gatgactctc tcacctttaa ggaggacatc 5820
cagaaagcac aagtttctgg ccagggggac agtcttcacg agcacatcgc taatcttgca 5880
ggtagcccag ctatcaaaaa gggaatactg cagaccgtta aggtcgtgga tgaactcgtc 5940
aaagtaatgg gaaggcataa gcccgagaat atcgttatcg agatggcccg agagaaccaa 6000
actacccaga agggacagaa gaacagtagg gaaaggatga agaggattga agagggtata 6060
aaagaactgg ggtcccaaat ccttaaggaa cacccagttg aaaacaccca gcttcagaat 6120
gagaagctct acctgtacta cctgcagaac ggcagggaca tgtacgtgga tcaggaactg 6180
gacatcaatc ggctctccga ctacgacgtg gatcatatcg tgccccagtc ttttctcaaa 6240
gatgattcta ttgataataa agtgttgaca agatccgata aaaatagagg gaagagtgat 6300
aacgtcccct cagaagaagt tgtcaagaaa atgaaaaatt attggcggca gctgctgaac 6360
gccaaactga tcacacaacg gaagttcgat aatctgacta aggctgaacg aggtggcctg 6420
tctgagttgg ataaagccgg cttcatcaaa aggcagcttg ttgagacacg ccagatcacc 6480
aagcacgtgg cccaaattct cgattcacgc atgaacacca agtacgatga aaatgacaaa 6540
ctgattcgag aggtgaaagt tattactctg aagtctaagc tggtctcaga tttcagaaag 6600
gactttcagt tttataaggt gagagagatc aacaattacc accatgcgca tgatgcctac 6660
ctgaatgcag tggtaggcac tgcacttatc aaaaaatatc ccaagcttga atctgaattt 6720
gtttacggag actataaagt gtacgatgtt aggaaaatga tcgcaaagtc tgagcaggaa 6780
ataggcaagg ccaccgctaa gtacttcttt tacagcaata ttatgaattt tttcaagacc 6840
gagattacac tggccaatgg agagattcgg aagcgaccac ttatcgaaac aaacggagaa 6900
acaggagaaa tcgtgtggga caagggtagg gatttcgcga cagtccggaa ggtcctgtcc 6960
atgccgcagg tgaacatcgt taaaaagacc gaagtacaga ccggaggctt ctccaaggaa 7020
agtatcctcc cgaaaaggaa cagcgacaag ctgatcgcac gcaaaaaaga ttgggacccc 7080
aagaaatacg gcggattcga ttctcctaca gtcgcttaca gtgtactggt tgtggccaaa 7140
gtggagaaag ggaagtctaa aaaactcaaa agcgtcaagg aactgctggg catcacaatc 7200
atggagcgat caagcttcga aaaaaacccc atcgactttc tcgaggcgaa aggatataaa 7260
gaggtcaaaa aagacctcat cattaagctt cccaagtact ctctctttga gcttgaaaac 7320
ggccggaaac gaatgctcgc tagtgcgggc gagctgcaga aaggtaacga gctggcactg 7380
ccctctaaat acgttaattt cttgtatctg gccagccact atgaaaagct caaagggtct 7440
cccgaagata atgagcagaa gcagctgttc gtggaacaac acaaacacta ccttgatgag 7500
atcatcgagc aaataagcga attctccaaa agagtgatcc tcgccgacgc taacctcgat 7560
aaggtgcttt ctgcttacaa taagcacagg gataagccca tcagggagca ggcagaaaac 7620
attatccact tgtttactct gaccaacttg ggcgcgcctg cagccttcaa gtacttcgac 7680
accaccatag acagaaagcg gtacacctct acaaaggagg tcctggacgc cacactgatt 7740
catcagtcaa ttacggggct ctatgaaaca agaatcgacc tctctcagct cggtggagac 7800
agcagggctg accccaagaa gaagaggaag gtgtagcttc gcccacccca acttgtttat 7860
tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt 7920
tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt agcggccgcc 7980
accgcggtgg agctccagct tttgttccct ttagtgaggg ttaattgcgc gccagcaaaa 8040
ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga 8100
cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag 8160
ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct 8220
taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg 8280
ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc 8340
ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt 8400
aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta 8460
tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaagaac 8520
agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc 8580
ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat 8640
tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc 8700
tcagtggaac gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt 8760
cacctagatc cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta 8820
aacttggtct gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct 8880
atttcgttca tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg 8940
cttaccatct ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga 9000
tttatcagca ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt 9060
atccgcctcc atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt 9120
taatagtttg cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt 9180
tggtatggct tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat 9240
gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc 9300
cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc 9360
cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat 9420
gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc cacatagcag 9480
aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt 9540
accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc 9600
ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa 9660
gggaataagg gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg 9720
aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa 9780
taaacaaata ggggttccgc gcacatttcc ccgaaaagtg ccacctaaat tgtaagcgtt 9840
aatattttgt taaaattcgc gttaaatttt tgttaaatca gctcattttt taaccaatag 9900
gccgaaatcg gcaaaatccc ttataaatca aaagaataga ccgagatagg gttgagtgtt 9960
gttccagttt ggaacaagag tccactatta aagaacgtgg actccaacgt caaagggcga 10020
aaaaccgtct atcagggcga tggcccacta cgtgaaccat caccctaatc aagttttttg 10080
gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 10120
<210> 45
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221>
<222>
<223> eGFP开关靶(eGFP switch target)
<400> 45
taccggccca gttggaatgt aggtggtg 28
<210> 46
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221>
<222>
<223> eGFP开关靶(eGFP switch target)
<400> 46
taccggccca gttggaatgt agatggtg 28
<210> 47
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221>
<222>
<223> PCR引物(PCR Primer)
<400> 47
ttctgcttgt cggccatgat 20
<210> 48
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221>
<222>
<223> PCR引物(PCR Primer)
<400> 48
aggcaaggct tgaccgacaa tt 22

Claims (14)

1.一种改变细胞具有的双链DNA的目标部位的方法,其中,包括以下工序:使与选择的双链DNA中的目标核苷酸序列特异性结合的核酸序列识别模块和核酸碱基转换酶或DNA糖苷酶结合而成的复合体、包含插入序列的供体DNA与所述双链DNA接触,将所述目标部位置换为所述插入序列或者在所述目标部位插入所述插入序列,在所述目标部位不会切断所述双链DNA的至少一条链。
2.如权利要求1所述的方法,其中,所述供体DNA包含与目标部位的邻接区域相同的序列。
3.如权利要求1或2所述的方法,其中,所述核酸序列识别模块选自由Cas效应蛋白质的至少一种DNA切断能力失活的CRISPR-Cas系统、锌指基序、TAL效应因子以及PPR基序组成的组。
4.如权利要求1~3中任一项所述的方法,其中,所述核酸序列识别模块是Cas效应蛋白质的两种DNA切断能力中的仅一种DNA切断能力失活的CRISPR-Cas系统。
5.如权利要求1~3中任一项所述的方法,其中,所述核酸序列识别模块是Cas效应蛋白质的两种DNA切断能力失活的CRISPR-Cas系统。
6.如权利要求1~5中任一项所述的方法,其中,所述核酸碱基转换酶为脱氨酶。
7.如权利要求6所述的方法,其中,所述脱氨酶为胞苷脱氨酶。
8.如权利要求7所述的方法,其中,所述胞苷脱氨酶为PmCDA1。
9.如权利要求1~8中任一项所述的方法,其中,双链DNA与复合体的接触通过向所述细胞导入编码所述复合体的核酸来进行。
10.如权利要求1~9中任一项所述的方法,其中,所述细胞为原核生物细胞或真核生物细胞。
11.如权利要求10所述的方法,其中,所述细胞为微生物细胞。
12.如权利要求10所述的方法,其中,所述细胞为植物细胞、昆虫细胞或动物细胞。
13.如权利要求12所述的方法,其中,所述动物细胞为脊椎动物细胞。
14.如权利要求13所述的方法,其中,所述脊椎动物细胞为哺乳类动物细胞。
CN201980003718.7A 2018-03-26 2019-03-26 改变细胞具有的双链dna的目标部位的方法 Active CN111148833B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2018-059073 2018-03-26
JP2018059073 2018-03-26
PCT/JP2019/012807 WO2019189147A1 (ja) 2018-03-26 2019-03-26 細胞の有する二本鎖dnaの標的部位を改変する方法

Publications (2)

Publication Number Publication Date
CN111148833A true CN111148833A (zh) 2020-05-12
CN111148833B CN111148833B (zh) 2021-04-02

Family

ID=68061818

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980003718.7A Active CN111148833B (zh) 2018-03-26 2019-03-26 改变细胞具有的双链dna的目标部位的方法

Country Status (9)

Country Link
US (1) US11041169B2 (zh)
EP (1) EP3660152A4 (zh)
JP (3) JP6727680B2 (zh)
KR (1) KR102287880B1 (zh)
CN (1) CN111148833B (zh)
BR (1) BR112020019301A2 (zh)
CA (1) CA3095291C (zh)
SG (1) SG11202009319YA (zh)
WO (1) WO2019189147A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023024089A1 (zh) * 2021-08-26 2023-03-02 华东师范大学 实现a到c和/或a到t碱基突变的碱基编辑系统及其应用

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3194019A1 (en) 2020-09-04 2022-03-10 National University Corporation Kobe University Miniaturized cytidine deaminase-containing complex for modifying double-stranded dna

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106459957A (zh) * 2014-03-05 2017-02-22 国立大学法人神户大学 用于特异性转变靶向dna序列的核酸碱基的基因组序列的修饰方法及其使用的分子复合体
WO2017043656A1 (ja) * 2015-09-09 2017-03-16 国立大学法人神戸大学 標的化したdna配列の核酸塩基を特異的に変換する、グラム陽性菌のゲノム配列の変換方法、及びそれに用いる分子複合体
WO2017043573A1 (ja) * 2015-09-09 2017-03-16 国立大学法人神戸大学 標的化したdna配列の核酸塩基を特異的に変換するゲノム配列の改変方法及びそれに用いる分子複合体
WO2017090761A1 (ja) * 2015-11-27 2017-06-01 国立大学法人神戸大学 標的化したdna配列の核酸塩基を特異的に変換する、単子葉植物のゲノム配列の変換方法、及びそれに用いる分子複合体

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003251286B2 (en) 2002-01-23 2007-08-16 The University Of Utah Research Foundation Targeted chromosomal mutagenesis using zinc finger nucleases
WO2010012077A1 (en) 2008-07-28 2010-02-04 Mount Sinai Hospital Compositions, methods and kits for reprogramming somatic cells
WO2011072246A2 (en) 2009-12-10 2011-06-16 Regents Of The University Of Minnesota Tal effector-mediated dna modification
JP2013128413A (ja) 2010-03-11 2013-07-04 Kyushu Univ Pprモチーフを利用したrna結合性蛋白質の改変方法
PT2800811T (pt) 2012-05-25 2017-08-17 Univ California Métodos e composições para modificação de adn alvo dirigida por arn e para modulação dirigida por arn de transcrição
US20150044772A1 (en) * 2013-08-09 2015-02-12 Sage Labs, Inc. Crispr/cas system-based novel fusion protein and its applications in genome editing
DK3216867T3 (da) * 2014-11-04 2020-06-22 Univ Kobe Nat Univ Corp Fremgangsmåde til at modificere genomsekvens for at introducere specifik mutation i tilsigtet dna-sekvens ved base-fjernelsesreaktion og molekylekompleks anvendt dertil
WO2017053312A1 (en) 2015-09-21 2017-03-30 The Regents Of The University Of California Compositions and methods for target nucleic acid modification
IL294014B1 (en) * 2015-10-23 2024-03-01 Harvard College Nucleobase editors and their uses
JP6907856B2 (ja) 2016-10-04 2021-07-21 信越化学工業株式会社 (メタ)アクリル酸トリイソプロピルシリルと(メタ)アクリル酸誘導体の共重合体およびその製造方法
FI3636753T3 (fi) 2017-06-08 2024-05-03 Univ Osaka Menetelmä DNA-muokatun eukaryoottisen solun valmistamiseksi
WO2018230731A1 (ja) 2017-06-16 2018-12-20 国立大学法人 長崎大学 がん遺伝子の転写調節領域

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106459957A (zh) * 2014-03-05 2017-02-22 国立大学法人神户大学 用于特异性转变靶向dna序列的核酸碱基的基因组序列的修饰方法及其使用的分子复合体
WO2017043656A1 (ja) * 2015-09-09 2017-03-16 国立大学法人神戸大学 標的化したdna配列の核酸塩基を特異的に変換する、グラム陽性菌のゲノム配列の変換方法、及びそれに用いる分子複合体
WO2017043573A1 (ja) * 2015-09-09 2017-03-16 国立大学法人神戸大学 標的化したdna配列の核酸塩基を特異的に変換するゲノム配列の改変方法及びそれに用いる分子複合体
WO2017090761A1 (ja) * 2015-11-27 2017-06-01 国立大学法人神戸大学 標的化したdna配列の核酸塩基を特異的に変換する、単子葉植物のゲノム配列の変換方法、及びそれに用いる分子複合体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
GAUDELLI NM等: "Programmable base editing of A T to G C", 《NATURE》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023024089A1 (zh) * 2021-08-26 2023-03-02 华东师范大学 实现a到c和/或a到t碱基突变的碱基编辑系统及其应用

Also Published As

Publication number Publication date
JP2020191879A (ja) 2020-12-03
WO2019189147A1 (ja) 2019-10-03
US11041169B2 (en) 2021-06-22
CA3095291C (en) 2022-10-11
EP3660152A1 (en) 2020-06-03
CA3095291A1 (en) 2019-10-03
SG11202009319YA (en) 2020-10-29
JP6727680B2 (ja) 2020-07-22
KR102287880B1 (ko) 2021-08-09
EP3660152A4 (en) 2020-07-15
JP7250349B2 (ja) 2023-04-03
US20200270631A1 (en) 2020-08-27
JPWO2019189147A1 (ja) 2020-04-30
BR112020019301A2 (pt) 2021-01-05
KR20200123255A (ko) 2020-10-28
JP2023063448A (ja) 2023-05-09
CN111148833B (zh) 2021-04-02

Similar Documents

Publication Publication Date Title
KR102147005B1 (ko) Fad2 성능 유전자좌 및 표적화 파단을 유도할 수 있는 상응하는 표적 부위 특이적 결합 단백질
CA2683497C (en) .delta.8 desaturases and their use in making polyunsaturated fatty acids
CN109563505A (zh) 用于真核细胞的组装系统
KR20210044795A (ko) 고 처리량 대사 공학에서 CRISPRi의 응용
DK2324120T3 (en) Manipulating SNF1 protein kinase OF REVISION OF OIL CONTENT IN OLEAGINOUS ORGANISMS
KR20190116282A (ko) 복수의 숙주를 위한 다중 dna 구조체의 조립 및 편집을 위한 모듈식 범용 플라스미드 디자인 전략
DK2443248T3 (en) IMPROVEMENT OF LONG-CHAIN POLYUM Saturated OMEGA-3 AND OMEGA-6 FATTY ACID BIOS SYNTHESIS BY EXPRESSION OF ACYL-CoA LYSOPHOSPHOLIPID ACYL TRANSFERASES
CN101815432A (zh) 涉及编码核苷二磷酸激酶(ndk)多肽及其同源物的基因的用于修改植物根构造的方法
CN101827938A (zh) 涉及rt1基因、相关的构建体和方法的具有改变的根构造的植物
KR20190138274A (ko) 클로스트리디움 박테리아의 변형을 위한 최적화된 유전 툴
CN114181957B (zh) 一种基于病毒加帽酶的稳定t7表达系统及其在真核生物中表达蛋白质的方法
CN109996874A (zh) 10-甲基硬脂酸的异源性产生
CN111094569A (zh) 光控性病毒蛋白质、其基因及包含该基因的病毒载体
CN111148833B (zh) 改变细胞具有的双链dna的目标部位的方法
KR20220163950A (ko) Aav 생산을 위한 이중 이기능성 벡터
CN112430622A (zh) 一种FokI和dCpf1融合蛋白表达载体及其介导的定点基因编辑方法
CN115927299A (zh) 增加双链rna产生的方法和组合物
CN101883843A (zh) 破坏过氧化物酶体生物合成因子蛋白(pex)以改变含油真核生物中多不饱和脂肪酸和总脂质含量
CN101868545B (zh) 具有改变的根构造的植物、涉及编码富含亮氨酸重复序列激酶(llrk)多肽及其同源物的基因的相关构建体和方法
AU2017252409A1 (en) Compositions and methods for nucleic acid expression and protein secretion in bacteroides
KR20220161297A (ko) 신규 세포주
CN112513072A (zh) 慢病毒载体转化的t-rapa细胞在改善溶酶体贮积症中的应用
CN112852884B (zh) 一种环形rna敲低载体快速构建试剂盒及其应用
KR20230082026A (ko) 유전자의 발현을 동시에 조절하기 위한 조성물 및 방법
CN114959919A (zh) 一种构建酿酒酵母人工小启动子文库的方法及应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant