CN110446782A - 利用细胞内在性的dna修饰酶将靶向化的dna的核酸碱基特异地替换的、细胞的核酸序列的替换方法、以及用于该方法的分子复合体 - Google Patents

利用细胞内在性的dna修饰酶将靶向化的dna的核酸碱基特异地替换的、细胞的核酸序列的替换方法、以及用于该方法的分子复合体 Download PDF

Info

Publication number
CN110446782A
CN110446782A CN201880020115.3A CN201880020115A CN110446782A CN 110446782 A CN110446782 A CN 110446782A CN 201880020115 A CN201880020115 A CN 201880020115A CN 110446782 A CN110446782 A CN 110446782A
Authority
CN
China
Prior art keywords
dna
leu
lys
cell
glu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201880020115.3A
Other languages
English (en)
Other versions
CN110446782B (zh
Inventor
西田敬二
近藤昭彦
荒添贵之
吉冈伸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kobe University NUC
Original Assignee
Kobe University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kobe University NUC filed Critical Kobe University NUC
Priority to CN202410165335.2A priority Critical patent/CN118006597A/zh
Publication of CN110446782A publication Critical patent/CN110446782A/zh
Application granted granted Critical
Publication of CN110446782B publication Critical patent/CN110446782B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2330/00Production
    • C12N2330/50Biochemical production, i.e. in a transformed host cell
    • C12N2330/51Specially adapted vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明提供一种方法,其为改变细胞所具有的DNA的靶向部位的方法,其包括以下的工序:用诱导该细胞中内在的DNA修饰酶的因子刺激该细胞的工序,以及通过使可与选择出的DNA中的靶核苷酸序列特异性地结合的核酸序列识别模块和DNA修饰酶结合模块结合而得到的复合体与该DNA接触,从而使得该靶向部位的1个以上的核苷酸缺失或替换为其它的1个以上的核苷酸,或者将1个以上的核苷酸插入于该靶向部位的工序。

Description

利用细胞内在性的DNA修饰酶将靶向化的DNA的核酸碱基特异 地替换的、细胞的核酸序列的替换方法、以及用于该方法的分 子复合体
技术领域
本发明涉及一种核酸序列的改变方法以及用于该方法的核酸序列识别模块与DNA修饰酶结合模块的复合体,该核酸序列的改变方法可在不向细胞内导入外因性的DNA修饰酶以及编码其的核酸的状态下,改变细胞内的靶DNA的特定区域内的核酸碱基。
背景技术
近年来,作为在各种各样的生物物种中将目的基因·基因组区域进行改变的技术,基因组编辑受人注目。以往,关于基因组编辑的技法,提出了一种利用人工核酸酶的方法,该人工核酸酶通过将具有非序列依赖性的DNA切断能力的分子与具有序列识别能力的分子进行组合而得到(非专利文献1)。
例如,报道有以下的方法:使用锌指核酸酶(ZFN),在宿主的植物细胞或昆虫细胞中在DNA的靶向基因座进行重组的方法,其中,所述锌指核酸酶(ZFN)通过将锌指(zinc finger)DNA结合结构域与非特异性的DNA切断结构域连结而得到(专利文献1);
使用转录激活因子样效应物核酸酶(transcription activator-like effectornuclease、TALEN),在特定的核苷酸序列内或相邻于其的部位,将靶基因切断·修饰的方法,其中,所述TALEN通过将植物病原菌黄单胞菌属(xanthomonas)所具有的DNA结合模块即转录激活因子样(TAL)效应物与DNA内切核酸酶(endonuclease)连结而得到(专利文献2);
或者,利用CRISPR-Cas9系统的方法,其中,所述CRISPR-Cas9系统通过将真细菌(eubacteria)或古细菌所具有的在获得性免疫系统中发挥功能的DNA序列CRISPR(Clustered Regularly interspaced short palindromic repeats、成簇的规律间隔短回文重复序列)和、与CRISPR一起具有重要作用的核酸酶Cas(CRISPR-associated)蛋白质家族进行组合而得到(专利文献3)等。另外,最近,作为CRISPR-Cas系统的新的内切核酸酶,报告有Cpf1(非专利文献2)。此外,也报告有一种使用将PPR蛋白质与核酸酶连结而得到的人工核酸酶,在该特定序列的近旁切断靶基因的方法,其中,所述PPR蛋白质构成为:通过由35个氨基酸构成并且识别1个核酸碱基的PPR基序的连续,从而识别特定的核苷酸序列(专利文献4)。
此外,最近,本发明人等报告了以下内容:使用对脱氨化反应进行催化的脱氨酶,通过将该脱氨酶与具有DNA序列识别能力的分子连结而得到的复合体导入于宿主细胞,从而在包括酵母或大肠杆菌在内的各种生物物种中,在不伴随着DNA双链切断(double-stranded DNA breaks、DSB)的状态下,成功地通过在包含特定的DNA序列的区域中的核酸碱基替换而改变基因组序列(专利文献5、非专利文献3)。
现有技术文献
专利文献
专利文献1:日本特许第4968498号公报
专利文献2:日本特表2013-513389号公报
专利文献3:日本特表2010-519929号公报
专利文献4:日本特开2013-128413号公报
专利文献5:国际公开第2015/133554号
非专利文献
非专利文献1:Kelvin M Esvelt,Harris H Wang(2013)Genome-scaleengineering for systems and synthetic biology,Molecular Systems Biology 9:641
非专利文献2:Bernd Zetsche et al.(2015)Cpf1 Is a Single RNA-GuidedEndonuclease of a Class 2CRISPR-Cas System,Cell 163:759-771
非专利文献3:Nishida Keiji et al.(2016)Targeted nucleotide editing usinghybrid prokaryotic and vertebrate adaptive immune systems,Science 6:353(6305)
发明内容
发明所要解决的课题
但是,迄今为止提出的上述基因组编辑技术是以将外因性的DNA修饰酶导入于细胞为前提,但是存在因使用该外因性的DNA修饰酶导致的细胞毒性等副作用或、该DNA修饰酶向细胞内或靶DNA部位的传递(delivery)的问题。因此,本发明的目的在于提供新型的DNA编辑的技法特别是基因组编辑的技法、以及用于此技法的核酸序列识别模块与DNA修饰酶结合模块的复合体,所述DNA编辑的技法可通过利用细胞内在性的DNA修饰酶从而提高安全性,另外可避免传递的制约。
用于解决课题的手段
本发明人等通过制作一种复合体并将该复合体导入于细胞内,在诱导该DNA修饰酶的因子的存在下培养了该细胞,该复合体使将目的DNA序列靶向化的核酸序列识别模块具有与细胞内在性的DNA修饰酶结合的功能。其结果,不使用外因性的DNA修饰酶的情况下,成功地将突变导入至目的基因的靶核苷酸序列以及其近旁。
本发明人等基于这些见解而进一步反复进行研究,结果完成本发明。
即,本发明如下所述。
[1]一种方法,其为改变细胞所具有的DNA的靶向部位的方法,其包括以下的工序:
用诱导该细胞中内在的DNA修饰酶的因子刺激该细胞的工序,以及
使可与选择出的DNA中的靶核苷酸序列特异性地结合的核酸序列识别模块与DNA修饰酶结合模块结合而得到的复合体,与该DNA接触,从而使得该靶向部位的1个以上的核苷酸缺失或替换为其它的1个以上的核苷酸,或者将1个以上的核苷酸插入于该靶向部位的工序。
[2]根据[1]所述的方法,其中,在不切断前述DNA的至少一条链的状态下进行前述靶向部位的改变。
[3]根据[1]或[2]所述的方法,其中,前述核酸序列识别模块选自由Cas的至少1种DNA切断能力失活了的CRISPR-Cas系统、锌指基序(zinc finger motif)、TAL效应物以及PPR基序组成的组。
[4]根据[1]~[3]中任一项所述的方法,其中,前述核酸序列识别模块是Cas的至少1种DNA切断能力失活了的CRISPR-Cas系统。
[5]根据[1]~[4]中任一项所述的方法,其中,前述DNA修饰酶结合模块选自由针对DNA修饰酶的抗体、肽适体以及核酸适体组成的组。
[6]根据[1]~[4]中任一项所述的方法,其中,前述DNA修饰酶结合模块是选自由Vif、Bet蛋白质、TopoIIβ、IQGAP2以及ZNF335以及它们的片段(fragment)组成的组中的至少1种。
[7]根据[1]~[6]中任一项所述的方法,其中,前述DNA修饰酶结合模块的靶酶是脱氨酶。
[8]根据[7]所述的方法,其中,前述脱氨酶是属于APOBEC家族的蛋白质。
[9]根据[7]或[8]所述的方法,其中,由核酸序列识别模块和DNA修饰酶结合模块结合而得到的复合体,进一步结合了碱基切除修复的抑制因子(inhibitor)。
[10]根据[1]~[9]中任一项所述的方法,其中,诱导前述DNA修饰酶的因子是选自由干扰素(interferon)、琥珀酸脱氢酶阻碍剂以及低氧条件组成的组中的1个以上。
[11]根据[1]~[10]中任一项所述的方法,其中,通过将编码该复合体的核酸导入于前述细胞,培养该细胞而在细胞内表达该复合体,从而进行前述DNA与前述复合体的接触。
[12]根据[1]~[11]中任一项所述的方法,其中,用诱导DNA修饰酶的因子刺激细胞,是通过在该因子的存在下培养该细胞来进行的。
[13]根据[1]~[12]中任一项所述的方法,其中,前述细胞为脊椎动物细胞。
[14]根据[13]所述的方法,其中,前述脊椎动物细胞为哺乳类动物细胞。
[15]根据[1]~[14]中任一项所述的方法,其中,前述DNA为双链DNA。
[16]一种复合体,其为可与DNA中的靶核苷酸序列特异性地结合的核酸序列识别模块和DNA修饰酶结合模块结合而得到的复合体,该核酸序列识别模块是Cas的至少1种DNA切断能力失活了的CRISPR-Cas系统,使该靶向部位的1个以上的核苷酸缺失或替换为其它的1个以上的核苷酸,或者将1个以上的核苷酸插入于该靶向部位。
[17]一种核酸,其编码[16]所述的复合体。
[18]一种DNA的靶向部位的改变剂,其含有[16]所述的复合体或者[17]所述的核酸。
[19]一种方法,其为改变细胞所具有的双链DNA的靶向部位的方法,其包括以下的工序:
用诱导该细胞中内在的DNA修饰酶的因子刺激该细胞的工序,以及
通过使可与选择出的双链DNA中的靶核苷酸序列特异性地结合的核酸序列识别模块与该双链DNA进行接触,从而使得该靶向部位的1个以上的核苷酸缺失或替换为其它的1个以上的核苷酸,或者将1个以上的核苷酸插入于该靶向部位的工序。
发明效果
根据本发明的DNA编辑,由于在DNA的修饰反应中不使用外来因子,因而降低副作用风险。另外,可将在DNA编辑中使用的构建体进行小型化,可提高传递效率。进一步,通过利用细胞中内在的DNA修饰酶,从而可利用瞬时作用而调节活性,可降低脱靶作用的风险。
附图说明
图1表示在实施例中使用的本发明的DNA的靶向化部位的改变方法的机理的示意图。图1中,IFN表示干扰素(是作为抗病毒因子诱导特定的防御基因表达的因子),IFN诱导型的内在性脱氨酶表示利用IFN被表达诱导的抗病毒性的脱氨酶组(Apobec等),dVif(Vif的突变体)表示与内在性脱氨酶进行结合的衔接蛋白(adapter protein)。
图2表示实施例中使用的DNA编辑用质粒的示意图。
图3表示实施例中使用的DNA编辑用质粒的示意图。
具体实施方式
本发明提供,通过利用细胞中内在的(本说明书中,亦称为“细胞内在性的”)DNA修饰酶,将该细胞内的DNA中的靶核苷酸序列以及其近旁的核苷酸替换为其它的核苷酸等等,改变该DNA的该靶向部位的方法(以下,亦称为“本发明的方法”)。此处“细胞中内在的”、“细胞内在性的”指该细胞生来具有。
本发明的方法的特征在于,其包括以下的工序:
用诱导细胞内在性的DNA修饰酶的因子(以下,亦称为“DNA修饰酶诱导因子”)刺激该细胞的工序,以及
通过使可与该DNA中的靶核苷酸序列特异性地结合的核酸序列识别模块和DNA修饰酶结合模块结合而得到的复合体(以下,亦称为“本发明的复合体”),在该细胞内与该DNA接触,从而将该靶向部位、即将靶核苷酸序列以及其近旁的核苷酸替换为其它的核苷酸等工序。
在本发明中,所谓DNA的“改变”指:DNA链上的某个核苷酸(例如dC),被替换为其它的核苷酸(例如dT、dA、dG或dU),或缺失,或者在DNA链上的某个核苷酸间插入核苷酸或者核苷酸序列。此处,被改变的DNA,只要是细胞所具有的(即,细胞内存在的)DNA则没有特别限制,可以是细胞内在性的DNA(例如,染色体DNA、线粒体DNA、叶绿体DNA;以下,亦将它们总括而称为“基因组DNA”),或者也可以是外来的DNA(例如,源自被细胞感染了的病毒的DNA)。另外,前述DNA可以是单链DNA、双链DNA中的任一个,优选为双链DNA。作为双链DNA,优选举出基因组DNA。另外,所谓DNA的“靶向部位”指,核酸序列识别模块特异性地识别而结合的“靶核苷酸序列”的全部或者一部分、或者其与该靶核苷酸序列的近旁(5’上游以及3’下游中的任一方或两方)。另外,所谓“靶核苷酸序列”指DNA中的核酸序列识别模块所结合的序列。
在本发明中所谓“DNA修饰酶”指可修饰DNA的细胞内在性的酶,利用该修饰直接地或间接地产生DNA的改变。作为这样的DNA的修饰反应,举出:切断DNA的单链或双链的反应(以下,亦称为“DNA链切断反应”)、不直接伴随DNA链的切断的反应、即将核酸碱基的嘌呤或嘧啶环上的取代基替换为其它的基团或原子的反应(以下,亦称为“核酸碱基替换反应”)(例:碱基的脱氨基化反应)、将DNA的N-糖苷键水解的反应(以下,亦称为“脱碱基反应”)等。
在本发明中,所谓“DNA修饰酶诱导因子”指,可直接或者间接地提高细胞内在性的DNA修饰酶的表达的分子、及/或可将该DNA修饰酶进行活性化的因子(除了包括分子之外,还包括氧浓度、光、紫外线、温度、酸、碱等的物理化学性刺激等)。只要具有这样的功能,本发明的方法中使用的DNA修饰酶诱导因子就没有特别限制,例如举出蛋白质(包括肽,以下相同。)(例:转录因子、干扰素(IFN)、白细胞介素、丝裂原(Mitogen)等)、低分子化合物等。关于DNA修饰酶诱导因子,可使用市售品,也可使用利用公知的方法制作出的产品。
所谓干扰素(IFN)是指,在动物体内细胞对病原体(特别是病毒)或肿瘤细胞等异物的侵入做出反应而分泌的蛋白质,通过用IFN刺激细胞,从而诱导抗病毒蛋白质(例:属于APOBEC(apolipoprotein B mRNA-editing enzyme catalytic polypeptide-like、载脂蛋白B mRNA编辑酶催化多肽样)家族的蛋白质等)的表达。作为本发明中使用的干扰素没有特别限定,但是举出I型干扰素(例:IFN-α、IFN-β、IFN-ω、IFN-ε、IFN-κ)、II型干扰素(例:IFN-γ)、III型干扰素(例:IFN-λ)等,特别优选I型干扰素,其中优选IFN-α以及IFN-β。干扰素可以是天然型也可以是基因重组型,也可以是结合了聚乙二醇(PEG)等高分子体而得到的PEG化干扰素。在使用干扰素的情况时,宿主细胞与作为干扰素的来源的生物优选为相同(例如,在使用人细胞的情况时,优选使用人干扰素)。另外,也可使用诱导IFN的产生的因子。作为相关的因子,举出病毒等的(疑似的)感染、疫苗、外来的DNA或RNA、双链RNA类似物(double stranded RNA analog)[poly(I:C)](例如,Trapp S1,et al.,(2009)J.Virol,83(2):884-895)、干扰素基因的刺激因子(stimulator)、TANK结合激酶1(TANK-bindingkinase 1)等。
作为本发明中使用的白细胞介素,例如举出已知可诱导属于APOBEC家族的蛋白质(以下略记为“APOBEC”。)(特别是属于APOBEC3家族的蛋白质(以下略记为“APOBEC3”。))、即可提高该蛋白质的表达及/或活性的IL-2、IL-7、IL-15、IL-27等。
作为本发明中使用的丝裂原,例如举出已知可诱导APOBEC(特别是APOBEC3)的佛波酯(phorbol ester)(例:佛波醇肉豆蔻酸酯乙酸酯(phorbol myristate acetate、PMA)、植物血凝素(PHA)等)(例如,Stopak S.Kim,et al.,(2007)J.Biol Chem.,282(6):3539-3546;Rose KM1,et al.,(2004)J.Biol Chem.,279(40):41744-41749)等。
作为本发明中使用的低分子化合物,例如举出已知可诱导APOBEC(特别是APOBEC3)的在日本特开2011-231053号公报中记载的化合物、国际公开第2016-164889号公报中记载的琥珀酸脱氢酶的阻碍剂(例:Atpenin A5、丙二酸盐、二氮嗪(DZX)、苹果酸盐以及草酰乙酸盐、3-硝基丙酸、硝酰基(nitroxyl)、萎锈灵(carboxin)、TTFA等)等。
DNA修饰酶诱导因子不限定于它们,本领域技术人员可根据成为标靶的DNA修饰酶的种类适宜使用公知的蛋白质或化合物、物理化学性刺激等。DNA修饰酶诱导因子可仅使用1种,也可使用2种以上(例如,并用干扰素与琥珀酸脱氢酶的阻碍剂,并用干扰素与低氧条件等)。
用DNA修饰酶诱导因子刺激细胞的方法没有特别限制,例如举出在DNA修饰酶诱导因子的存在下培养细胞的方法。具体而言,可通过向用于培养细胞的培养基或缓冲液中添加DNA修饰酶诱导因子,或者在该因子为低氧等物理化学性刺激的情况时,可通过在存在该刺激的条件下培养细胞,从而进行。或者,也举出将编码DNA修饰酶诱导因子的核酸(优选为DNA)导入于细胞内,在该细胞内表达该因子的方法。
对开始用DNA修饰酶诱导因子刺激细胞的时机也没有特别限制,例如,通过将编码该复合体的核酸导入于该细胞来进行细胞内的靶DNA与本发明的复合体的接触的情况时,可以是该导入工序之前、之后、以及同时中的任一个。本发明的方法,可通过调整用DNA修饰酶诱导因子刺激细胞的期间,从而调整产生DNA的修饰反应的期间。因此,通过DNA的修饰反应产生,仅在固定靶向部位的改变所必需的期间用DNA修饰酶诱导因子刺激细胞,从而可一边避免宿主基因组中的脱靶作用的风险,一边可高效地实现靶序列的编辑。从刺激细胞期间的调整的容易性的观点考虑,优选在DNA修饰酶诱导因子的存在下培养该细胞的方法(例如,DNA修饰酶诱导因子为蛋白质、低分子化合物等时,将该因子添加于培养基或缓冲液中的方法)。添加于培养基或缓冲液中的期间,虽然因宿主细胞的种类或培养条件、成为标靶的DNA修饰酶的种类等而不同,但是在要改变的DNA为细胞内在性的DNA的情况时,通常必需经由至少数个世代的细胞分裂,因而认为2-3天左右是必需的。另一方面,在要改变的DNA是外来DNA的情况时,通常不需要经由细胞分裂,因而与细胞内在性的DNA的情况相比较,可缩短期间。本领域技术人员可基于所使用的培养条件等适宜确定适合的表达诱导期间。
添加于培养基的DNA修饰酶诱导因子的含量,只要进行靶DNA的改变就没有特别限制。在使用干扰素作为DNA修饰酶诱导因子的情况时,可优选成为10~100000IU(国际单位)、更优选成为100~20000IU、进一步优选成为500~5000IU地添加于培养基。另外,在使用ApteninA5作为DNA修饰酶诱导因子的情况时,可优选成为0.5μΜ~10μΜ、更优选成为1μΜ~3μΜ地添加于培养基。本领域技术人员可基于所使用的DNA修饰酶诱导因子、细胞的种类、培养条件等适宜确定优选的含量或效价(力価)等。
另一方面,作为DNA修饰酶诱导因子为物理化学性刺激的优选的一个例子,举出低氧条件。例如报告有属于APOBEC家族的蛋白质可在暴露于低氧条件的情况下进行活性化(例如,国际公开第2016-164889号公报)。作为将细胞暴露于低氧条件的方法,例如举出在低氧状态的气氛下培养细胞的方法等。此处所谓“低氧状态”指是低于大气中的氧浓度的氧浓度。作为相关的氧浓度,例如为15%以下,优选为10%以下,更优选为5%以下,进一步优选为1%以下,另外优选为0.1%以上。
或者,在将编码DNA修饰酶诱导因子的核酸(优选为DNA)导入于细胞内,于该细胞内表达该因子时,可与后述的编码核酸序列识别模块及/或DNA修饰酶结合模块的核酸同样地操作,导入于细胞内。在使用编码DNA修饰酶诱导因子的DNA时,通过将该DNA置于诱导性的调节区域的控制下,从而可通过在培养细胞的培养基或缓冲液中,添加及/或去除可将该调节区域进行活性化的物质,从而调整该细胞内的DNA修饰酶诱导因子的表达期间,由此可以调整产生DNA的修饰反应的期间。作为该“诱导性的调节区域”,可同样地使用关于编码本发明的复合体的核酸的表达调节而后述的调节区域。
在本发明中所谓“核酸序列识别模块”指具有将DNA链上的特定的核苷酸序列(即靶核苷酸序列)特异性地识别并结合的能力的分子或分子复合体。通过使核酸序列识别模块结合于靶核苷酸序列,从而介由连结于该模块的DNA修饰酶结合模块,可以使得细胞内在性的DNA修饰酶特异性地起作用于DNA的靶向部位。
在本发明中所谓“DNA修饰酶结合模块”指具有与DNA修饰酶结合的能力的分子或分子复合体。
本发明的复合体是,包含上述核酸序列识别模块与DNA修饰酶结合模块连结而得到的复合体而成的、被赋予了特定的核苷酸序列识别能力以及与细胞内在性的DNA修饰酶相结合的结合能力的分子复合体。此处,“复合体”不仅仅包括由多个分子构成的复合体,而且也包括如融合蛋白质那样在单一的分子内具有核酸序列识别模块与DNA修饰酶结合模块的复合体。
在本发明中,成为DNA修饰酶结合模块要结合的标靶的细胞内在性的DNA修饰酶(以下,亦称为“靶酶”)没有特别限制,例如举出核酸酶(例:内切核酸酶、外切核酸酶等)、重组酶(recombinase)、DNA旋转酶、DNA聚合酶、DNA拓扑异构酶、端粒酶、转座酶、脱氨酶、DNA糖基化酶(DNA glycosylase)等。从减轻细胞毒性的观点考虑,DNA的改变优选利用不切断双链DNA中的至少一条链的反应(例:DNA上的核酸碱基替换反应、脱碱基反应)来进行,而不是利用双链DNA链的切断反应来进行。作为对核酸碱基替换反应、脱碱基反应进行催化的DNA修饰酶,例如举出:对将氨基替换为羰基的脱氨化反应进行催化的、属于核酸/核苷酸脱氨酶超级家族的脱氨酶,对DNA的N-糖苷键的水解进行催化的DNA糖基化酶(例:胸腺嘧啶DNA糖基化酶、氧代鸟嘌呤糖基化酶、烷基腺嘌呤DNA糖基化酶(例:酵母3-甲基腺嘌呤-DNA糖基化酶(MAG1))等)等。作为优选的脱氨酶,举出:可分别将胞嘧啶或5-甲基胞嘧啶替换为尿嘧啶或胸腺嘧啶的胞苷脱氨酶、可将腺嘌呤替换为次黄嘌呤的腺苷脱氨酶、可将鸟嘌呤替换为黄嘌呤的鸟苷脱氨酶等。作为胞苷脱氨酶,更优选举出APOBEC。人的方面,作为APOBEC,包括:APOBEC1、APOBEC2、APOBEC3(例:APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D(APOBEC3E)、APOBEC3F、APOBEC3G、APOBEC3H)、APOBEC4、在脊椎动物的获得性免疫中将突变导入于免疫球蛋白(immunogloblin)基因的酶即活化诱导胞嘧啶核苷脱氨酶(activation-induced cytidine deaminase、AID)等。
本发明的方法中使用的DNA修饰酶结合模块,只要可与如上所述那样的细胞内在性的DNA修饰酶结合,则没有特别限制,例如举出针对成为标靶的DNA修饰酶的抗体、肽适体、核酸适体、其它的结合于DNA修饰酶的蛋白质等。DNA修饰酶结合模块可根据成为标靶的DNA修饰酶的种类而适宜选择。这些DNA修饰酶结合模块可利用与成为标靶的DNA修饰酶结合为公知的物质,或者,也可利用通过下述的方法制作出的分子。编码DNA修饰酶结合模块的DNA,可以以成为目的的DNA修饰酶结合模块的氨基酸序列、核酸序列的信息为基础,适宜制作。
本发明的方法中使用的抗体,可以为多克隆抗体以及单克隆抗体中的任一个,抗体中也包括抗体片段(例:F(ab’)2、Fab’、Fab、Fv、scFv等)。抗体可利用公知的免疫学技法制作。肽适体是由氨基酸构成的适体,并且与抗体同样地是可结合于特定的靶分子的肽分子。关于肽适体,可基于噬菌体展示法或细胞表层展示法(例如,Whaley,S.R.,et al.,(2000),Nature,405,665-668)进行筛选和制作。核酸适体是由RNA、DNA、修饰核苷酸或它们的混合物构成的适体。关于适体,可按照公知的方法(例如,Ellington et al.,(1990),Nature,346,818-822;Tuerk et al.,(1990)Science,249,505-510)进行筛选和制作。
作为结合于DNA修饰酶的蛋白质,例如举出已知结合于APOBEC(特别是,APOBEC3)的人类免疫缺陷病毒(HIV)、猴免疫缺陷病毒(SIVmac)的Vif(Virion InfectivityFactor、病毒颗粒感染性因子)、泡沫病毒(foamy virus)的Bet(Bromodomain and extra-terminal、溴结构域和超末端)蛋白质、TopoIIβ(Topoisomerase 2-beta、拓扑异构酶2-β)、IQGAP2、ZNF335(别称:NIF1)、CD81、MLL、APOBEC3G的C末端(第196-384氨基酸残基)(例如,Schumacher,April Jean,Ph.D.,UNIVERSITY OF MINNESOTA,(2008)199,pages;3313466)、它们的片段(以下,只要没有特别的预先说明,则在蛋白质中也包括其片段)等,但是不限定于它们。这些蛋白质也可实施改变(有时会将被改变了的蛋白质称为蛋白质的“突变体”)。例如,关于Vif,由于已知与E3泛素连接酶(ubiquitin ligase)复合体结合,促进APOBEC3的蛋白质分解(例如,Stanley et al.(2008)Journal of virology,8656-8663;Guo et al.(2014)Nature,55,229-233),因而使用Vif的情况时,优选实施使得对APOBEC3以外的蛋白质的结合性发生缺损的改变。作为这样的改变,例如举出使得Vif蛋白质(refseq号:AAF20197)的N末端的数个(例如,11个、10个、9个、8个、7个等)氨基酸发生缺失,且将第145亮氨酸残基取代为其它的氨基酸残基(例如,丙氨酸残基)等,但是不限定于这些改变。即使在使用除了Vif以外的蛋白质的情况时,也可基于蛋白质的功能、与靶分子的结合部位、立体结构等而适宜地实施改变。关于上述蛋白质的片段,只要具有与DNA修饰酶结合的结合区域就没有特别限制,例如举出通过将与DNA修饰酶的结合区域以外的区域(例如,具有蛋白质的催化活性的区域)去除而得到的片段等。作为相关的片段,具体举出由TopoIIβ(refseq号:NP_001059)的第452~591氨基酸残基构成的肽、由IQGAP2(refseq号:NP_006624)的第466~547氨基酸残基构成的肽、由ZNF335(refseq号:NP_071378)的第745~893氨基酸残基构成的肽等,但是它们只是例示,只要是本领域技术人员就可适宜地设计片段。另外,如由后述的实施例表示的那样,即使在组合了IQGAP2与ZNF335的情况时,也示出了靶向部位被改变的情况(表2),因而也可将上述的结合于DNA修饰酶的蛋白质组合而使用。
在本发明中,所谓“碱基切除修复”是生物所具有的DNA修复机制中的1个,意味着通过利用酶将碱基发生了损伤的部分切下而再次接合,从而修复碱基的损伤的机制。关于具有损伤的碱基的切除,利用将DNA的N-糖苷键水解的酶即DNA糖基化酶而进行,利用AP内切核酸酶、DNA聚合酶、DNA连接酶等碱基切除修复(BER)路径的下游的酶而对利用该酶进行脱碱基反应的结果生成的没有碱基的部位(apurinic/apyrimidic(AP)site、无嘌呤/无嘧啶(AP)位点)进行处理。作为参与这些BER路径的基因或蛋白质,举出UNG(NM_003362)、SMUG1(NM_014311)、MBD4(NM_003925)、TDG(NM_003211)、OGG1(NM_002542)、MYH(NM_012222)、NTHL1(NM_002528)、MPG(NM_002434)、NEIL1(NM_024608)、NEIL2(NM_145043)、NEIL3(NM_018248)、APE1(NM_001641)、APE2(NM_014481)、LIG3(NM_013975)、XRCC1(NM_006297)、ADPRT(PARP1)(NM_0016718)、ADPRTL2(PARP2)(NM_005484)等(括弧内表示登记了各个基因(cDNA)的碱基序列信息的refseq号。),但是不受限于它们。
在本发明中所谓“碱基切除修复的抑制因子”指,通过阻碍上述BER路径中的任一个阶段,或阻碍该BER路径中被动员的分子的表达自身,在结果上阻碍BER的物质。关于本发明中使用的碱基切除修复的抑制因子,只要是在结果上阻碍BER的抑制因子则没有特别限制,但是从效率的观点考虑,优选位于BER路径的上游的DNA糖基化酶的阻碍剂。作为本发明中使用的DNA糖基化酶的阻碍剂,举出胸腺嘧啶DNA糖基化酶的阻碍剂、尿嘧啶DNA糖基化酶的阻碍剂、氧代鸟嘌呤DNA糖基化酶的阻碍剂、烷基鸟嘌呤DNA糖基化酶的阻碍剂等,但是不受限于它们。例如,在DNA修饰酶结合模块的靶酶为胞苷脱氨酶的情况时,由于会阻碍由突变生成的DNA的U:G或G:U错配的修复,因而使用尿嘧啶DNA糖基化酶的阻碍剂是合适的。
作为这样的尿嘧啶DNA糖基化酶的阻碍剂,举出源自作为枯草杆菌(Bacillussubtilis)噬菌体(bacteriophage)的PBS1的尿嘧啶DNA糖基化酶阻碍剂(UGI)、或源自作为枯草杆菌噬菌体的PBS2的尿嘧啶DNA糖基化酶阻碍剂(UGI)(Wang,Z.,and Mosbaugh,D.W.(1988)J.Bacteriol.170,1082-1091),但是不受限于这些,只要是上述DNA的错配的修复阻碍剂,就可用于本发明。特别是,关于源自PBS2的UGI,由于亦知难以引起DNA上的从C到T以外的突变或切断以及重组这样的效果,因而使用源自PBS2的UGI是合适的。
如上所述,在碱基切除修复(BER)机制中,利用DNA糖基化酶切除碱基时,AP内切核酸酶将切口(nick)加入于无碱基部位(AP部位),进一步利用外切核酸酶将AP部位完全地切除。AP部位被切除时,DNA聚合酶以相反链的碱基为模板新制作碱基,最后DNA连接酶将切口填埋而完成修复。已知,失去了酶活性但是保持着与AP部位的结合能力的突变AP内切核酸酶会竞争性地阻碍BER。因此,这些突变AP内切核酸酶也可作为本发明的碱基切除修复的抑制因子使用。突变AP内切核酸酶的来源没有特别限制,例如可使用源自大肠杆菌、酵母、哺乳动物(例:人、小鼠、猪、牛、马、猴等)等的AP内切核酸酶。例如,人Ape1的氨基酸序列可参照UniprotKB No.P27695。作为失去了酶活性但是保持着与AP部位的结合能力的突变AP内切核酸酶的例子,举出作为活性位点或辅因子的Mg结合位点发生了突变的蛋白质。例如,人Ape1的情况时,举出E96Q、Y171A、Y171F、Y171H、D210N、D210A、N212A等。
利用本发明的复合体的核酸序列识别模块而被识别的DNA中的靶核苷酸序列,只要该模块可特异性地结合,就没有特别限制,可以是DNA中的任意的序列。关于靶核苷酸序列的长度,只要对核酸序列识别模块特异性地结合充分的即可,根据靶DNA的尺寸,例如为12个核苷酸以上,优选为15个核苷酸以上,更优选为18个核苷酸以上。长度的上限没有特别限制,优选为25个核苷酸以下,更优选为22个核苷酸以下。
作为本发明的复合体的核酸序列识别模块,例如,除了可使用Cas的至少1种DNA切断能力失活了的CRISPR-Cas系统(以下,亦称为“CRISPR-突变Cas”)、锌指基序、TAL效应物以及PPR基序等之外,还可使用:包含限制性内切酶、转录因子、RNA聚合酶等可与DNA特异性地结合的蛋白质的DNA结合结构域、并且不具有DNA双链切断能力的片段等,但不限定于它们。优选举出CRISPR-突变Cas、锌指基序、TAL效应物、PPR基序等。
锌指基序是使3~6个Cys2His2型的不同的锌指单元(1指识别约3个碱基)进行连结而得到的锌指基序,可识别9~18个碱基的靶核苷酸序列。可利用Modular assembly法(Nat Biotechnol(2002)20:135-141)、OPEN法(Mol Cell(2008)31:294-301)、CoDA法(NatMethods(2011)8:67-69)、大肠杆菌one-hybrid法(Nat Biotechnol(2008)26:695-701)等公知的技法而制作锌指基序。关于锌指基序的制作的详细情况,可参照上述专利文献1。
TAL效应物具有以约34个氨基酸为单元的模块的重复结构,利用1个模块的第12以及13氨基酸残基(被称作RVD)而确定结合稳定性与碱基特异性。由于各模块的独立性高,因而可仅通过将模块进行接合,制作对靶核苷酸序列特异性的TAL效应物。关于TAL效应物,确立了利用了开放资源(open resource)的制作方法(REAL法(Curr Protoc Mol Biol(2012)Chapter 12:Unit 12.15)、FLASH法(Nat Biotechnol(2012)30:460-465)、Golden Gate法(Nucleic Acids Res(2011)39:e82)等),可比较简便地设计针对靶核苷酸序列的TAL效应物。TAL效应物的制作的详细情况可参照上述专利文献2。
PPR基序被构成为通过由35氨基酸构成并且识别1个核酸碱基的PPR基序的连续而识别特定的核苷酸序列,仅以各基序的第1、4以及ii(-2)的氨基酸而识别靶碱基。对基序构成没有依赖性,没有来自两侧的基序的干涉,因而与TAL效应物同样地,可仅通过将PPR基序进行接合,从而制作对靶核苷酸序列特异性的PPR蛋白质。PPR基序的制作的详细情况可参照上述专利文献4。
另外,使用限制性内切酶、转录因子、RNA聚合酶等的片段的情况时,由于这些蛋白质的DNA结合结构域是众所周知的,因而可容易地设计、构建包含该结构域且不具有DNA双链切断能力的片段。
上述任一个核酸序列识别模块,在上述DNA修饰酶结合模块为蛋白质时,也可以以与其的融合蛋白质的形式提供,或者,也可使SH3结构域、PDZ结构域、GK结构域、GB结构域等蛋白质结合结构域和它们的结合伴侣(binding partner),分别与核酸序列识别模块和DNA修饰酶结合模块融合,介由该结构域与其结合伴侣的相互作用,以蛋白质复合体的形式提供。或者,也可使内含肽(intein)分别与核酸序列识别模块和DNA修饰酶结合模块融合,利用各蛋白质合成后的连接(ligation),将两者进行连结。
包含核酸序列识别模块与DNA修饰酶结合模块结合而得到的复合体(包括融合蛋白质。)而成的本发明的复合体与DNA的接触,优选通过将编码该复合体的核酸导入于具有目的DNA(例:基因组DNA)的细胞从而实施。
因此,核酸序列识别模块与DNA修饰酶结合模块,优选以编码它们的融合蛋白质的核酸的形式制备,或者,优选以可利用结合结构域、内含肽等而翻译为蛋白质之后在宿主细胞内形成复合体那样的形态,以分别编码它们的核酸的形式制备。此处核酸可以是DNA也可以是RNA,但优选为DNA。在DNA的情况时,优选为双链DNA,以在宿主细胞内在功能性的启动子的控制下配置的表达载体的形态提供。
核酸序列识别模块与DNA修饰酶结合模块结合而得到的本发明的复合体,可进行毒性低的DNA编辑,本发明的基因改变方法可适用于广泛的生物材料。因此,导入有编码核酸序列识别模块及/或DNA修饰酶结合模块的核酸的细胞,也可包括:从作为原核生物的大肠杆菌等细菌、作为下等真核生物的酵母等微生物的细胞到包括人等哺乳动物的脊椎动物、昆虫、植物等高等真核生物的细胞的、所有生物物种的细胞。
编码锌指基序、TAL效应物、PPR基序等核酸序列识别模块的DNA,可利用关于各模块在上面叙述的任一种方法而取得。关于编码限制性内切酶、转录因子、RNA聚合酶等的序列识别模块的DNA,例如可通过基于它们的cDNA序列信息,按照覆盖编码该蛋白质的所期望的部分(即,包含DNA结合结构域的部分)的区域的方式合成低聚DNA引物,使用由产生该蛋白质的细胞制备出的全RNA或者mRNA组分(日语:画分)作为模板,利用RT-PCR法进行扩增,从而克隆。
编码DNA修饰酶结合模块、DNA修饰酶诱导因子或碱基切除修复的抑制因子的DNA,也同样地可通过根据所使用的蛋白质等的cDNA序列信息而合成低聚DNA引物,使用由产生该蛋白质等的细胞制备出的全RNA或者mRNA组分作为模板,利用RT-PCR法而扩增,从而克隆。例如,使用HIV的Vif作为DNA修饰酶结合模块时,编码该蛋白质的DNA,可根据NCBI数据库中登记的cDNA序列(accession No.AF200477),针对CDS的上游以及下游设计适当的引物,通过从感染HIV的细胞提取出的RNA,利用RT-PCR法进行克隆。
克隆化而得到的DNA,可以原样地、或者根据期望用限制性内切酶消化,或附加适当的连接子(linker)及/或核转运信号(目的DNA为线粒体或叶绿体DNA时,各细胞器转运信号)之后,与编码核酸序列识别模块的DNA连接,从而制备编码融合蛋白质的DNA。在以融合蛋白质的形式表达核酸序列识别模块与DNA修饰酶结合模块时,例如可在融合蛋白质的两末端、或核酸序列识别模块与DNA修饰酶结合模块之间附加核转运信号。核转运信号没有特别限制,例如举出源自SV40的核转运信号(例:序列号7、序列号9)。
或者,也可以通过分别使编码结合结构域或者其结合伴侣的DNA融合于编码核酸序列识别模块的DNA与编码DNA修饰酶结合模块的DNA,或者也可以通过使编码分离内含肽的DNA融合于各自的DNA,从而使得核酸序列识别模块与DNA修饰酶结合模块在宿主细胞内被翻译出来之后,形成复合体。在这些情况时,也可根据期望在各自的DNA的适当的位置处连结连接子及/或核转运信号。
编码核酸序列识别模块的DNA以及编码DNA修饰酶结合模块的DNA(以及在通过将编码DNA修饰酶诱导因子的DNA导入于该细胞内进行表达从而进行该DNA修饰酶诱导因子对细胞的刺激的情况时,编码该因子的DNA;以下,在括弧中记载的情况下相同。),也可以通过化学性地合成DNA链,或者也可通过将所合成出的部分重叠(overlap)的低聚DNA短链利用PCR法或Gibson Assembly法进行连接,从而构建编码其全长的DNA。利用化学合成或PCR法或者Gibson Assembly法的组合而构建全长DNA的操作的优点在于,可根据导入该DNA的宿主,在CDS全长范围设计使用密码子(使用コドン)。在异种DNA的表达之时,可通过将该DNA序列替换为在宿主生物中使用频率高的密码子,从而期待蛋白质表达量的增大。所使用的宿主中的密码子使用频率的数据,例如可使用Kazusa DNA Research Institute((公財)かずさDNA研究所)的主页中公开的遗传密码(遺伝暗号)使用频率数据库(http://www.kazusa.or.jp/codon/index.html),或者也可参照记述了各宿主中的密码子使用频率的文献。只要参照所获取的数据与想要导入的DNA序列,将在该DNA序列中使用的密码子之中在宿主中使用频率低的密码子,替换为编码相同的氨基酸并且使用频率高的密码子即可。例如,在宿主细胞为人细胞的情况时,可使用在人的密码子使用方面最优化的编码核酸序列识别模块及/或DNA修饰酶结合模块的序列。也可同样地构建编码碱基切除修复的抑制因子的DNA。
包含编码核酸序列识别模块的DNA及/或编码DNA修饰酶结合模块的DNA(及/或编码DNA修饰酶诱导因子的DNA)的表达载体,例如可通过将该DNA连结于适当的表达载体中的启动子的下游从而制造。此外,关于前述表达载体,也可以使之包含编码碱基切除修复的抑制因子的DNA地制造。
作为表达载体,使用源自大肠杆菌的质粒(例:pBR322、pBR325、pUC12、pUC13);源自枯草杆菌的质粒(例:pUB110、pTP5、pC194);源自酵母的质粒(例:pSH19、pSH15);昆虫细胞表达质粒(例:pFast-Bac);动物细胞表达质粒(例:pA1-11、pXT1、pRc/CMV、pRc/RSV、pcDNAI/Neo);λ噬菌体等噬菌体;杆状病毒(baculovirus)等昆虫病毒载体(vector)(例:BmNPV、AcNPV);逆转录病毒(retrovirus)、痘苗病毒(vaccinia virus)、腺病毒(adenovirus)等动物病毒载体等。
作为启动子,只要是对应在基因的表达中使用的宿主而言恰当的启动子,就可以是任何的启动子。在伴随着DSB的以往方法中,由于毒性而存在宿主细胞的生存率显著降低的情况,因而理想的是事先增加细胞数量直至使用诱导启动子开始诱导为止,但是在诱导作为细胞内在性的DNA修饰酶的不伴随DSB的酶的情况时,即使表达本发明的复合体也可期待充分的细胞增殖,因而组成型启动子也可不受限制地使用。
例如,在宿主为动物细胞的情况时,使用SRα启动子、SV40启动子、LTR启动子、CMV(巨细胞病毒、cytomegalovirus)启动子、RSV(劳斯肉瘤病毒、Rous sarcoma virus)启动子、MoMuLV(莫洛尼小鼠白血病病毒、Moloney murine leukemia virus)LTR、HSV-TK(单纯疱疹病毒胸苷激酶、purified herpesvirus thymidine kinase)启动子等。其中,优选CMV启动子、SRα启动子等。
宿主为大肠杆菌的情况时,优选trp启动子、lac启动子、recA启动子、λPL启动子、lpp启动子、T7启动子等。
宿主为芽孢杆菌属菌的情况时,优选SPO1启动子、SPO2启动子、penP启动子等。
宿主为酵母的情况时,优选Gal1/10启动子、PHO5启动子、PGK启动子、GAP启动子、ADH启动子等。
宿主为昆虫细胞的情况时,优选多角体蛋白(polyhedrin)启动子、P10启动子等。
宿主为植物细胞的情况时,优选CaMV35S启动子、CaMV19S启动子、NOS启动子等。
表达载体可根据期望含有:终止子(例:NOS终止子、豌豆rbcS3A终止子、热冲击(shock)蛋白质(HSP)17.3终止子等)、翻译增强子(translation enhancer)(例:源自水稻的乙醇脱氢酶5’非翻译区域(Os ADH-5’UTR)、源自CaMV、烟草花叶病毒(TMV)的Ω序列等)、3’调节区域(例:源自水稻的肌动蛋白基因(Act1)3’UTR等)、聚A附加信号、耐药性基因(例:G418耐受性基因(nPtII)、耐潮霉素(hygromycin)性基因(hpt)等)的选择标记等。
编码核酸序列识别模块的RNA及/或编码DNA修饰酶结合模块的RNA(及/或编码DNA修饰酶诱导因子的RNA),例如可通过以包含上述的编码核酸序列识别模块的DNA及/或编码DNA修饰酶结合模块的DNA(及/或编码DNA修饰酶诱导因子的DNA)的表达载体为模板,利用自身公知的体外转录系统(in vitro transcription system)而转录为mRNA,从而制备。编码碱基切除修复的抑制因子的RNA也可同样地制备。
通过将包含编码核酸序列识别模块及/或DNA修饰酶结合模块的DNA的表达载体导入于宿主细胞,培养该宿主细胞,从而可在细胞内表达核酸序列识别模块与DNA修饰酶结合模块的复合体。
作为宿主,例如使用埃希氏菌属菌、芽孢杆菌属菌、酵母、昆虫细胞、昆虫、动物细胞等。
作为埃希氏菌属菌,例如使用大肠杆菌(Escherichia coli)K12·DH1[Proc.Natl.Acad.Sci.USA,60,160(1968)],大肠杆菌JM103[Nucleic Acids Research,9,309(1981)],大肠杆菌JA221[Journal of Molecular Biology,120,517(1978)],大肠杆菌HB101[Journal of Molecular Biology,41,459(1969)],大肠杆菌C600[Genetics,39,440(1954)]等。
作为芽孢杆菌属菌,例如使用枯草芽孢杆菌(Bacillus subtilis)MI114[Gene、24,255(1983)],枯草芽孢杆菌207-21[Journal of Biochemistry,95,87(1984)]等。
作为酵母,例如使用酿酒酵母(Saccharomyces cerevisiae)AH22、AH22R-,NA87-11A,DKD-5D、20B-12、粟酒裂殖酵母(Schizosaccharomyces pombe)NCYC1913,NCYC2036,巴斯德毕赤酵母(Pichia pastoris)KM71等。
作为昆虫细胞,例如,在病毒为AcNPV时,使用源自夜盗蛾的幼虫的株化细胞(Spodoptera frugiperda cell;Sf细胞)、源自粉纹夜蛾(Trichoplusia ni)的中肠的MG1细胞、源自粉纹夜蛾的卵的High FiveTM细胞、源自甘蓝夜蛾(Mamestra brassicae)的细胞、源自Estigmena acrea的细胞等。在病毒为BmNPV的情况下,关于昆虫细胞,使用源自蚕的株化细胞(Bombyx mori N细胞;BmN细胞)等。作为该Sf细胞,例如,使用Sf9细胞(ATCCCRL1711)、Sf21细胞[以上,In Vivo,13,213-217(1977)]等。
作为昆虫,例如使用蚕的幼虫、果蝇、蟋蟀(cricket)等[Nature、315、592(1985)]。
作为动物细胞,例如使用:猴COS-7细胞、猴Vero细胞、中国仓鼠(Chinesehamster)卵巢(CHO)细胞、dhfr基因缺损CHO细胞、小鼠L细胞、小鼠AtT-20细胞、小鼠骨髓瘤(mouse myeloma)细胞、大鼠GH3细胞、源自人类胎儿肾脏的细胞(例:HEK293细胞)、源自人肝癌的细胞(例:HepG2)、人FL细胞等的细胞株、人以及其它的哺乳动物的iPS细胞和/或ES细胞等多功能干细胞、由各种组织制备出的初代培养细胞。此外,也可使用斑马鱼胚、非洲爪蟾卵母细胞(Xenopus laevis)等。
作为植物细胞,使用由各种植物(例如,水稻、小麦、玉米等谷物,西红柿、黄瓜、茄子等经济作物,香石竹(carnation)、洋桔梗等园艺植物,烟草、拟南芥等实验植物等)制备出的悬浮培养细胞、愈伤组织(callus)、原生质体(protoplast)、叶切片、根切片等。
上述任一个宿主细胞可以是半数体(一倍体),也可以是倍数体(例:二倍体、三倍体、四倍体等)。在以往的突变导入技法中,原则上,仅将突变导入于同源染色体(homologous chromosome)中的一条,变为异源的(hetero)基因型,因而若不是显性突变则不表达所期望的性状,并且在同源化(ホモ化)方面耗费工夫与时间,不良情况多。与此相对,根据本发明,在利用使用以CRISPR-突变Cas为代表的核酸序列识别模块的本发明的方法而进行靶DNA的改变时,存在可将突变导入于基因组内的同源染色体上的所有等位基因中的可能性,因而即使是隐性突变也可在当代就表达所期望的性状,可克服以往方法的问题。
表达载体的导入,可以根据宿主的种类,按照公知的方法(例如,溶菌酶(lysozyme)法、感受态法(competent method)、PEG法、CaCl2共沉淀法、电穿孔法(electroporation method)、微注射法、粒子枪法(particle gun method)、脂质体转染法(lipofection method)、农杆菌法等)而实施。
大肠杆菌例如可按照Proc.Natl.Acad.Sci.USA,69,2110(1972)、Gene、17、107(1982)等中记载的方法进行转化。
芽孢杆菌属菌例如可按照Molecular&General Genetics,168,111(1979)等中记载的方法导入载体。
酵母例如可按照Methods in Enzymology,194,182-187(1991)、Proc.Natl.Acad.Sci.USA,75,1929(1978)等中记载的方法导入载体。
昆虫细胞以及昆虫例如可按照Bio/Technology,6,47-55(1988)等中记载的方法导入载体。
动物细胞例如可按照细胞工程学附册8新细胞工程学实验方案(protocol),263-267(1995)(秀润社发行),Virology,52,456(1973)中记载的方法导入载体。
关于导入了载体的细胞的培养,可根据宿主的种类,按照公知的方法实施。
例如,培养大肠杆菌或芽孢杆菌属菌时,作为培养中使用的培养基,优选液体培养基。另外,培养基优选含有对于转化体的生长繁殖必需的碳源、氮源、无机物等。此处,作为碳源,例如举出葡萄糖、糊精(dextrin)、可溶性淀粉、蔗糖等;作为氮源,例如举出铵盐类、硝酸盐类、玉米浆(corn steep liquor)、蛋白胨(peptone)、酪蛋白、肉浸膏、大豆粕、马铃薯提取液等无机物质或有机物质;作为无机物,例如举出氯化钙、磷酸二氢钠、氯化镁等。另外,也可向培养基中添加酵母抽提物、维生素类、生长促进因子等。培养基的pH优选为约5~约8。
作为培养大肠杆菌的情况时的培养基,例如优选为含有葡萄糖、酪蛋白氨基酸的M9培养基[Journal of Experiments in Molecular Genetics,431-433,Cold Spring HarborLaboratory,New York 1972]。根据需要,为了使启动子高效地动作,例如也可将3β-吲哚基丙烯酸那样的化学试剂添加于培养基。大肠杆菌的培养通常在约15℃~约43℃进行。也可根据需要进行通气、搅拌。
芽孢杆菌属菌的培养,通常在约30~约40℃进行。也可根据需要进行通气、搅拌。
作为培养酵母的情况时的培养基,例如举出伯克霍尔德(Burkholder)最小培养基[Proc.Natl.Acad.Sci.USA,77,4505(1980)]、含有0.5%酪蛋白氨基酸的SD培养基[Proc.Natl.Acad.Sci.USA,81、5330(1984)]等。培养基的pH优选为约5~约8。通常在约20℃~约35℃进行培养。也可根据需要进行通气、搅拌。
作为培养昆虫细胞或昆虫的情况时的培养基,例如使用通过向Grace’s InsectMedium[Nature、195,788(1962)]中适当加入灭活化(inactivation)了的10%牛血清等添加物而得到的培养基等。培养基的pH优选为约6.2~约6.4。通常在约27℃下进行培养。也可根据需要进行通气、搅拌。
作为培养动物细胞的情况时的培养基,例如使用含有约5~约20%的胎牛血清的最小必需培养基(MEM)[Science、122,501(1952)]、达尔伯克改良伊格尔培养基(Dulbecco’sModified Eagle’s Medium、DMEM)[Virology,8,396(1959)]、RPMI 1640培养基[TheJournal of the American Medical Association,199,519(1967)]、199培养基[Proceeding of the Society for the Biological Medicine,73,1(1950)]等。培养基的pH优选为约6~约8。通常在约30℃~约40℃下进行培养。也可根据需要进行通气、搅拌。
作为培养植物细胞的培养基,使用MS培养基、LS培养基、B5培养基等。培养基的pH优选为约5~约8。培养通常在约20℃~约30℃下进行。也可根据需要进行通气、搅拌。
如上所述地操作,可在细胞内表达核酸序列识别模块与DNA修饰酶结合模块的复合体、即本发明的复合体。
编码核酸序列识别模块及/或DNA修饰酶结合模块的RNA向宿主细胞的导入,可通过微注射法、脂质体转染法等而进行。RNA导入可以进行1次,或者可以设置适当的间隔而反复地进行多次(例如2~5次)。
认为:从导入于细胞内的表达载体,表达核酸序列识别模块与DNA修饰酶结合模块的复合体时,该核酸序列识别模块特异性地识别目的DNA(例:基因组DNA)内的靶核苷酸序列而结合。而后,连结于该核酸序列识别模块的DNA修饰酶结合模块,与接受DNA修饰酶诱导因子的刺激而诱导出的细胞内在性的DNA修饰酶结合,在该DNA修饰酶的作用下,在靶向部位(靶核苷酸序列的全部或者一部分或它们的近旁)产生DNA链或碱基的修饰。
在靶DNA为双链的情况时,在靶向部位的正义链(sense strand)或者反义链(antisense strand)发生DNA的修饰。在DNA的修饰是DNA链的切断的情况时,在利用碱基切除修复(BER)、核苷酸切除修复(NER)、单链切断修复、非同源末端连接(NHEJ)、同源重组(HR)等修复机制进行修复之时,导入各种突变。在DNA的修饰不直接伴随DNA链的切断的情况时,在双链DNA内生成错配、没有碱基的部位(AP部位)(apurinic/apyrimidic(AP)site),在将其修复的过程中导入突变。例如,在使用了可结合于APOBEC等胞苷脱氨酶的DNA修饰酶结合模块的情况时,靶向部位的正义链或者反义链上的胞嘧啶被替换为尿嘧啶,生成U:G或者G:U错配。通过在不正确地修复此错配的状态下,以相反链的碱基与替换了的链的碱基形成对的方式进行修复(在上述的例子中,T-A或者A-T),在修复之时进一步取代为其它的核苷酸(例如,U→A、G),或者生成1个至数十个碱基的缺失或者插入,从而导入各种突变。另外,例如,在使用了可结合于DNA糖基化酶的DNA修饰酶结合模块时,在靶向部位的正义链或者反义链产生脱碱基反应,在双链DNA中的一条链产生无碱基部位(AP部位)。于是,细胞内的碱基切除修复(BER)系进行动作,首先AP内切核酸酶识别AP部位而将DNA片链的磷酸键切断,外切核酸酶将脱碱基了的核苷酸切除。接着,DNA聚合酶以相反链DNA为模板新插入核苷酸,在最后DNA连接酶将接口修复。通过在该BER中的任一个阶段发生修复错误,从而导入各种突变。
关于锌指基序,由于特异性地结合于靶核苷酸序列的锌指的制作效率不高,另外,结合特异性高的锌指的拣选(選別)是繁杂的,因而不容易制作许多实际上发挥功能的锌指基序。关于TAL效应物和PPR基序,与锌指基序相比靶向核酸序列识别的自由度高,但是由于需要每次根据靶核苷酸序列设计、构建巨大的蛋白质,因而在效率方面留下问题。
与此相对,CRISPR-Cas系统由于利用与靶核苷酸序列互补的向导RNA而识别目的DNA的序列,因而仅通过合成可与靶核苷酸序列特异性地形成杂合体(hybrid)的低聚DNA,即可将任意的序列标靶化。
因此,在本发明的更优选的实施方式中,作为核酸序列识别模块,使用Cas效应物蛋白质的至少1种DNA切断能力失活了的CRISPR-Cas系统即CRISPR-突变Cas。
使用了CRISPR-突变Cas的本发明的核酸序列识别模块以复合体的形式提供,该复合体是:包含与靶核苷酸序列互补的序列的CRISPR-RNA(crRNA)与、根据需要的对突变Cas效应物蛋白质的募集(recruit)必需的trans-activating RNA(tracrRNA)(在需要tracrRNA时,可以以与crRNA的嵌合RNA的形式提供)与、突变Cas效应物蛋白质的复合体。将与突变Cas效应物蛋白质进行组合而构成核酸序列识别模块的、单独的crRNA或者由crRNA与tracrRNA的嵌合RNA构成的RNA分子,统称为“向导RNA”。在使用核酸适体作为DNA修饰酶结合模块的情况时,核酸适体优选与向导RNA结合。向导RNA与核酸适体结合而得到的核酸,可利用公知的方法(例如,Mali et al.,(2013),Nat Biotechnol,31(9),833-838)而制作。
本发明中使用的Cas效应物蛋白质,只要是可通过与向导RNA形成复合体从而将目的基因中的靶核苷酸序列与相邻于其的前间区序列邻近基序(protospacer adjacentmotif、PAM)进行识别并且结合的属于class 2CRISPR系统的效应物蛋白质,就没有特别限制,优选为Cas9或Cpf1。关于Cas9,例如举出源自化脓性链球菌(Streptococcus pyogenes)的Cas9(SpCas9;PAM序列(5’→3’方向;下同)NGG(N为A、G、T或C。下同))、源自嗜热链球菌(Streptococcus thermophilus)的Cas9(StCas9;PAM序列NNAGAAW)、源自脑膜炎奈瑟菌(Neisseria meningitidis)的Cas9(MmCas9;PAM序列NNNNGATT)等,但是不限于它们。优选为基于PAM的制约少的SpCas9(实质上是2个碱基,理论上基因组上的大致任何部位都可靶向化)。另外,作为Cpf1,例如举出源自新凶手弗朗西斯菌(Francisella novicida)的Cpf1(FnCpf1;PAM序列TTN)、源自氨基酸球菌属(Acidaminococcus sp.)的Cpf1(AsCpf1;PAM序列TTTN)、源自毛螺旋菌科细菌(Lachnospiraceae bacterium)的Cpf1(LbCpf1;PAM序列TTTN)等,但是不限于它们。作为本发明中使用的突变Cas效应物蛋白质(以下,有时会略记为“突变Cas”),将Cas效应物蛋白质的双链DNA中的两条链的切断能力失活了的突变Cas效应物蛋白质、以及仅仅将一条链的切断能力失活了的具有切口酶(nickase)活性的突变Cas效应物蛋白质均可以使用。例如,在SpCas9的情况时,可使用:第10的Asp残基替换为Ala残基的、与向导RNA形成互补链的链的相反链的切断能力欠缺的(因此,具有针对与向导RNA形成互补链的链的切口酶活性的)D10A突变体,或者,第840的His残基替换为Ala残基的、与向导RNA形成互补链的链的切断能力欠缺的(因此,具有针对与向导RNA形成互补链的链的相反链的切口酶活性的)H840A突变体,以及其双重突变体(dCas9)。另外,在FnCpf1的情况时,可使用第917Asp残基替换为Ala残基(D917A)、或者第1006Glu残基替换为Ala残基(E1006A)的、两条链的切断能力欠缺的突变体。只要使得双链DNA的至少一条链的切断能力欠缺,也可同样地使用其它的突变Cas。
利用与上述锌指等的连结样式相同的技法,以与突变Cas的复合体的形式提供DNA修饰酶结合模块。或者,也可利用由作为RNA适体的MS2F6、PP7等与它们的结合蛋白质而得到的RNA scaffold,使DNA修饰酶结合模块与突变Cas进行结合。向导RNA中的靶序列(targeting sequence)与靶核苷酸序列形成互补链,突变Cas被募集于向导RNA中的其它的区域(即,crRNA中的除了靶序列以外的序列,或者接续于crRNA的tracrRNA)而识别PAM,但是无法将DNA中的一条链或两条链切断,连结于突变Cas的DNA修饰酶结合模块与DNA修饰酶进行结合,在该DNA修饰酶的作用下,在靶向部位(可在包含靶核苷酸序列的全部或者一部分的数百碱基的范围内适当调节)产生修饰,将DNA链切断,或者在靶DNA为双链DNA的情况时,在DNA内产生错配或AP部位。通过这些DNA链的切断、错配或AP部位未被正确地修复的状态下,修复成相反链的碱基与替换了的链的碱基形成对,或者在修复之时进一步替换为其它的核苷酸,或者生成1至数十碱基的缺失或者插入,从而导入各种突变。
在使用CRISPR-突变Cas作为核酸序列识别模块的情况时,也与使用锌指等作为核酸序列识别模块时同样地,核酸序列识别模块与DNA修饰酶结合模块优选以编码它们的核酸(优选为DNA)的形态导入于具有目的DNA的细胞中。
编码Cas效应物蛋白质(例:Cas9、Cpf1)的DNA,可利用与关于编码DNA修饰酶结合模块的DNA而在上面叙述了的内容同样的方法,从产生该蛋白质的细胞克隆。另外,关于突变Cas,可通过向编码克隆化而得到的Cas的DNA,使用自身公知的部位特异性突变诱发法,以将对于DNA切断活性重要的部位的氨基酸残基(例如,在SpCas9的情况时,举出第10的Asp残基、第840的His残基,在FnCpf1的情况时,举出第917Asp残基、第1006Glu残基、第1255Asp残基等,但是不限定于它们)替换为其它的氨基酸的方式导入突变,从而取得。另外,也可用化学合成或PCR法或者Gibson Assembly法的组合构建全长DNA,从而根据导入该DNA的宿主而在CDS全长设计使用密码子。例如,作为导入了这样的突变的、适于人细胞中表达的具有密码子使用的SpCas9 DNA,举出具有序列号4所表示的核苷酸序列的DNA。
所获得的编码突变Cas的DNA及/或编码DNA修饰酶结合模块的DNA,可根据宿主细胞,插入于与上述同样的表达载体的启动子的下游。在表达载体中,如上所述,可根据期望含有终止子、翻译增强子、3’调节区域、聚A附加信号、耐药性基因等选择标记等。
另一方面,编码向导RNA的DNA,可通过设计包含与靶核苷酸序列互补的核苷酸序列(本说明书中,亦称为“靶序列(targeting sequence)”)的、crRNA序列(例如,募集FnCpf1作为Cas效应物蛋白质的情况时,可使用在靶序列的5’侧包含序列号10;AAUUUCUACUGUUGUAGAU的crRNA,下划线部的序列彼此形成碱基对并且取茎-环(stem-loop)结构)的编码序列、或者、将crRNA编码序列与根据需要的已知的tracrRNA编码序列(例如,作为在募集Cas9作为Cas效应物蛋白质的情况时的tracrRNA编码序列,是gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc;序列号11)进行连结而得到的低聚DNA序列,并且使用DNA/RNA合成仪,从而化学合成。在靶DNA为双链的情况时,crRNA序列包含与靶核苷酸序列“靶链(targeted strand)”互补的核苷酸序列。
此处所谓“靶链”指与靶核苷酸序列的crRNA形成杂合体的一条链,将其相反链、即因靶链与crRNA形成杂合体而成为单链状的链称为“非靶链(non-targeted strand)”。另外,由于推定DNA的修饰反应通常在成为单链状的非靶链上产生的情况多,因而由单条链表现靶核苷酸序列的情况时(例如,标记PAM序列的情况时、或表示靶核苷酸序列与PAM的位置关系的情况时等),设定用非靶链的序列代表。
靶序列的长度,只要可特异性地结合于靶核苷酸序列,就没有特别限制,例如为15~30个核苷酸,优选为18~25个核苷酸。靶核苷酸序列的选择,受限制于与该序列的3’侧(Cas9的情况时)或者5’侧(Cpf1的情况时)相邻的PAM的存在,但是根据酵母等的知识,在通过将CRISPR-突变Cas9与胞苷脱氨酶进行组合的系统中,不论靶核苷酸序列的长度如何,存在从其5’端起在3’方向上处于7个核苷酸以内的位置的C容易被取代这样的规则性,因而存在通过适当选择靶核苷酸序列的长度从而使得可导入突变的碱基的部位进行位移(shift)的可能性。由此,可至少部分性地解除基于PAM(在SpCas9中是NGG)的制约,可期待突变导入的自由度进一步变高。
关于靶序列的设计,例如在使用Cas9作为Cas效应物蛋白质的情况时,可通过使用公开的向导RNA设计网站(CRISPR Design Tool、CRISPRdirect等),从目的基因的CDS序列之中挑选(list up)在3’侧邻接PAM(例如,SpCas9的情况时,NGG)的20mer序列,在将从其5’端起在3’方向上7个核苷酸以内的C替换为T的情况时,选择在目的基因所编码的蛋白质中产生氨基酸变化那样的序列,从而进行。此外,在使靶序列的长度在例如18~25个核苷酸的范围进行变化的情况时,同样地,选择存在从其5’端起在3’方向上在7个核苷酸以内因向T的碱基替换而产生氨基酸变化的C的序列。从这些候选之中,可使用宿主的基因组中的脱靶位点数量少的候选序列作为靶序列。在所使用的向导RNA设计软件没有检索宿主的基因组的脱靶位点的功能的情况时,例如关于候选序列的3’侧的8~12个核苷酸(靶核苷酸序列的识别能力高的seed序列),可通过对宿主的基因组施加Blast检索,从而检索脱靶位点。
关于编码向导RNA(例如,crRNA或crRNA-tracrRNA嵌合体)的DNA,可通过设计将与靶核苷酸序列的靶链互补的序列与、已知的tracrRNA序列(募集Cas9的情况时)或crRNA的同向重复序列(募集Cpf1的情况时)进行连结而得到的低聚RNA序列,并且使用DNA/RNA合成仪,从而化学合成。编码向导RNA的DNA也可插入于与上述同样的表达载体,但是作为启动子,优选使用pol III系的启动子(例:SNR6、SNR52、SCR1、RPR1、U3、U6、H1启动子等)以及终止子(例:聚T序列(T6序列;tttttt等))。
编码突变Cas的DNA、编码DNA修饰酶结合模块的DNA、编码向导RNA的DNA,可根据宿主,利用与上述同样的方法导入于宿主细胞。
本发明人等报告了:在使用了脱氨酶与核酸序列识别模块的复合体的基因组编辑(以下,有时会称为“Target AID”。)(专利文献5)方面,将切断不同的链的2种具有切口酶活性的突变Cas的效果进行了比较,结果是,在一方中,突变部位集中于靶核苷酸序列的中央附近,与此相对,在另一方中,从靶核苷酸序列中在数百碱基的区域随机地导入了多种多样的突变,在本发明中也可期待同样的效果。因此,通过选择切口酶切断的链,从而可在特定的核苷酸或核苷酸区域精确地导入突变,或者在比较宽广的范围随机地导入多种多样的突变,也可根据目的而适宜地使用。例如,只要将前者的技术应用于基因疾病iPS细胞,则通过在由患者自身的细胞制作出的iPS细胞中修复病原基因的突变,然后分化为目的体细胞,从而可制作更加降低了排斥风险的细胞移植疗法剂。
另外,本发明人等在Target AID中,通过针对接近的多个靶核苷酸序列制作序列识别模块,同时使用,从而相比于以单独的核苷酸序列为标靶的情况,通过使用出芽酵母而确认了突变导入效率大幅提高,在本发明中也可期待同样的效果。从在两个靶核苷酸序列的一部分发生重复那样的情况下,到两者分离了600bp左右的场合时,该效果也同样地实现突变诱导。另外,在靶DNA为双链DNA的情况时,在靶核苷酸序列是相同方向(即,靶链处于相同链上)的情况与靶核苷酸序列是相对方向(即,双链DNA的两条链成为靶链)的情况中的任一个情况中都可以发生。
另外,也可将位置完全不同的多个DNA区域设为标靶而改变。因此,在本发明的优选的一个实施方式中,可使用与不同的靶核苷酸序列(例如,在靶DNA为细胞内在性的DNA的情况时,也可以是1个目的基因内,也可以处于不同的2个以上的目的基因内。)分别特异性地结合的2种以上的核酸序列识别模块。在此情况时,这些核酸序列识别模块中的各1个与DNA修饰酶结合模块形成复合体。此处DNA修饰酶结合模块可使用共通的DNA修饰酶结合模块。例如,在使用CRISPR-Cas系统作为核酸序列识别模块的情况时,Cas效应物蛋白质与DNA修饰酶结合模块的复合体(包括融合蛋白质)可使用共通的复合体;作为向导RNA,可制作并使用:包含与不同的靶核苷酸序列分别形成互补链的2个以上的crRNA中的各个crRNA的、2种以上的向导RNA。另一方面,在使用锌指基序、或TAL效应物等作为核酸序列识别模块的情况时,例如可使DNA修饰酶结合模块融合于与不同的靶向核苷酸特异性地结合的各核酸序列识别模块上。
为了在宿主细胞内表达本发明的复合体,如上所述,将包含编码核酸序列识别模块的DNA与编码DNA修饰酶结合模块的DNA的表达载体(两DNA可以处于各别的载体上,也可以处于单一的载体上),或将编码各模块的RNA导入于宿主细胞,但是为了高效地导入突变,优选以一定期间以上、在一定水平以上维持本发明的复合体的表达。从相关的观点考虑,导入可在宿主细胞内自主复制的表达载体(例如质粒等)是可靠的,但是由于该质粒等是外来DNA,因而优选在顺利地实现突变导入之后迅速地去除。因此,虽然根据宿主细胞的种类等而变动,但例如优选在从表达载体导入起经过6小时~2天后,使用本技术领域中公知的各种质粒去除法,从宿主细胞将导入了的质粒去除。
另一方面,作为用于去除编入于宿主基因组DNA的外来DNA的手段,举出使用Cre-loxP系的方法或使用转座子(transposon)的方法等。
或者,只要可获得对突变导入充分的本发明的复合体的表达,那么另外也优选:通过使用在宿主细胞内不具有自主复制能力的表达载体(例如,欠缺在宿主细胞中发挥功能的复制起点及/或编码对复制必需的蛋白质的基因的载体等)和/或RNA,利用瞬时表达,由此将突变导入于目的DNA。
或者,通过在所期望的时期,仅仅以对于引发DNA的修饰反应并且固定靶向部位的改变所必需的期间,使本发明的复合体在宿主细胞内瞬时地表达,从而可一边避免脱靶作用的风险,一边高效地实现宿主DNA的编辑。对于引发DNA的修饰反应并且固定靶向部位的改变所必需的期间,可与用上述的DNA修饰酶诱导因子刺激细胞的期间同样地适当确定。本发明的复合体的表达诱导期间,也可在不使得宿主细胞产生不优选的副作用的范围,超过上述的期间而延长。
作为在所期望时期以所期望的期间瞬时地表达本发明的复合体的手段,举出如下的方法,即制作以可控制该复合体的表达期间的形态包含编码该复合体的DNA[即编码核酸序列识别模块的DNA(在CRISPR-Cas系统方面,指编码向导RNA的DNA与编码突变Cas的DNA)、以及编码DNA修饰酶结合模块的DNA(在CRISPR-Cas系统方面,编码DNA修饰酶结合模块的DNA,依据该模块为蛋白质或RNA,可以与分别编码突变Cas的DNA或编码向导RNA的DNA进行连结)]的构建体(表达载体),导入于宿主细胞内的方法。作为“可控制表达期间的形态”,具体举出:将编码本发明的复合体的DNA置于诱导性的调节区域的控制下的形态。“诱导性的调节区域”没有特别限制,例如,在细菌(例:大肠杆菌)或酵母等微生物细胞中,举出温度感受性(ts)突变阻遏子(repressor)与受其控制的操纵基因(operator)的操纵子。作为ts突变阻遏子,例如举出源自λ噬菌体的cI阻遏子的ts突变体,但是不限定于此。在λ噬菌体cI阻遏子(ts)的情况时,在30℃以下(例:28℃)结合于操纵基因而抑制着下游的基因表达,但是在37℃以上(例:42℃)的高温时从操纵基因解离,因而诱导基因表达。因此,通常在30℃以下培养导入了编码本发明的复合体的DNA的宿主细胞,通过在恰当时期将温度提高到37℃以上培养一定期间而表达本发明的复合体,利用该复合体所募集了的细胞内在性的DNA修饰酶而进行DNA的修饰反应,将突变导入于靶向基因,之后迅速地返回到30℃以下,从而可将抑制靶基因的表达的期间设为最短。因此,即使在将对于宿主细胞而言必需的基因设为标靶的情况时,也可一边压制副作用一边高效地编辑。
在利用温度感受性突变时,例如,通过将对于载体的自主复制必需的蛋白质的温度感受性突变体搭载于包含编码本发明的复合体的DNA的载体,从而在该复合体的表达后,无法迅速地进行自主复制,随着细胞分裂,该载体自然地脱落。作为这样的温度感受性突变蛋白质,举出对于pSC101 ori的复制必需的Rep101 ori的温度感受性突变体,但是不限定于此。Rep101 ori(ts)为30℃以下(例:28℃)时,作用于pSC101 ori从而可使得质粒进行自主复制,但是变为37℃以上(例:42℃)时则失去功能,质粒变得无法自主复制。因此,通过与上述λ噬菌体的cI阻遏子(ts)并用,从而可同时进行本发明的复合体的瞬时表达与质粒去除。
另一方面,在将动物细胞、昆虫细胞、植物细胞等高等真核细胞设为宿主细胞的情况时,通过将编码本发明的复合体的DNA,在诱导启动子(例:金属硫蛋白(metallothionein)启动子(用重金属离子诱导)、热休克蛋白质启动子(用热休克诱导)、Tet-ON/Tet-OFF系启动子(用四环素(tetracycline)或其衍生物的添加或去除而诱导)、甾体响应性启动子(用甾体激素或其衍生物诱导)等)的控制下导入于宿主细胞内,在恰当时期向培养基中添加诱导物质(或从培养基去除)而诱导该复合体的表达,培养一定期间,利用该复合体所募集的细胞内在性的DNA修饰酶而进行DNA的修饰反应,将突变导入于靶向基因,然后将前述诱导物质从培养基去除(或添加于培养基),从而可实现本发明的复合体的瞬时表达。
此外,在大肠杆菌等的原核细胞中,也可利用诱导启动子。作为这样的诱导启动子,例如举出lac启动子(用IPTG诱导)、cspA启动子(用冷休克诱导)、araBAD启动子(用阿拉伯糖诱导)等,但是不限定于它们。
或者,也可利用上述的诱导启动子作为在将动物细胞、昆虫细胞、植物细胞等高等真核细胞设为宿主细胞的情况时的载体切除机构。即,通过在载体中搭载编码在宿主细胞中发挥功能的对复制起点与其复制必需的蛋白质的核酸(例如,如果是动物细胞,则是SV40ori与大T抗原(large T antigen)、oriP与EBNA-1等),利用上述诱导启动子而控制编码该蛋白质的核酸的表达,由此虽然在诱导物质存在下可使得载体进行自主复制,但去除诱导物质时变得无法自主复制,随着细胞分裂,载体自然地脱落(在Tet-OFF系载体中,相反地通过添加四环素(tetracycline)、强力霉素(doxycycline)而变得无法自主复制)。
根据本发明人等的研究,可存在如下的情况:若使用DNA修饰酶诱导因子而使细胞内在性的DNA修饰酶的表达、或活性充分上升,则即使不使用DNA修饰酶结合模块,也可以仅使用核酸序列识别模块改变靶DNA。虽然不期望受约束于任何的理论,但是作为具有可能性的机理,认为:在通过使核酸序列识别模块进行结合而生成的靶向部位的双螺旋结构的变形处(歪み),能够接触以充分的量存在的该DNA修饰酶的频率是增加的,并且作用于靶向部位从而改变目的DNA。
因此,在本发明的另一实施方式中提供一种方法,其包括以下的工序:
用诱导细胞内在性的DNA修饰酶的因子而刺激该细胞的工序,以及
通过使得可与选择出的双链DNA中的靶核苷酸序列特异性地结合的核酸序列识别模块与该双链DNA进行接触,从而使得该靶向部位的1个以上的核苷酸缺失或替换为其它的1个以上的核苷酸,或者将1个以上的核苷酸插入于该靶向部位的工序。
以下,通过实施例来说明本发明。但本发明不限定于这些实施例。
实施例
1.载体构建
1-1.Cas9、nCas9、nCas9-dVif、dVif-nCas9或nCas9-PmCDA1表达载体
实施例中使用的DNA编辑用质粒载体的概要图示于图1。通过以pNeo载体为基础,向源自人类胎儿肾脏的细胞(HEK293T细胞)进行转染(transfection),从而构建了进行基因导入的质粒载体。作为质粒载体,使用了将次黄嘌呤鸟嘌呤磷酸核糖转移酶(hypoxanthine-guanine phosphoribosyl-transferase、HPRT)基因的外显子(exon)6设为标靶的1907c(Cas9)、1907n(nCas9-PmCDA1)、1907n-cugi(nCas9-PmCDA1-UGI)、1921(nCas9)、1923(nCas9-dVif)、1924(dVif-nCas9)以及作为对照的pNeo。1907c(Cas9)、1907n(nCas9-PmCDA1)、1907n-cugi(nCas9-PmCDA1-UGI)以及1921(nCas9),通过以在非专利文献3中使用的载体为基础,将向导RNA的靶序列,从HPRT基因的外显子6的开始点变更为第24~第43序列(aatgcagactttgctttcct:序列号12)(site 3)从而构建。作为编码nCas9(D10A)的DNA,使用了包含由序列号4表示的碱基序列的DNA。关于1923(nCas9-dVif)、1924(dVif-nCas9),如以下所述地制作。首先,针对1921(nCas9)进行限制性内切酶位点的追加与不需要的序列的切除,从而构建了载体1922(序列号13)。关于HIV的dVif片段,参照了数据库上的作为Vif序列的GenBank:AF200477.1。关于前述序列的ORF的28-576碱基,通过将第433-435碱基(CTA)改变为GCT,从而合成导入了L145A突变的人工基因(将碱基序列示于序列号1,将氨基酸序列示于序列号2。另外,将通过在5’侧附加AvrII的识别部位并且在3’侧附加NheI的识别部位而得到的碱基序列示于序列号3。),利用限制性内切酶切断与连接而插入于1922,由此制作出1923(nCas9-dVif)以及1924(dVif-nCas9)。在图2中示出所制作出的载体1923(nCas9-dVif)以及1924(dVif-nCas9)的示意图。
通过将前述载体导入于HEK293T细胞,在细胞内表达,从而形成了crRNA-tracrRNA与、Cas9、nCas9、nCas9-dVif、dVif-nCas9或nCas9-PmCDA1的复合体。
1-2.UGI-nCas9-dVif、dVif-nCas9-UGI、TopBv2(TopoIIβisoform 2)-nCas9、 nCas9-IQGAP2466-547-ZNF335745-893或nCas9-PmCDA1-UGI表达载体
以1-1.的步骤为参考,制作将HPRT基因的特定区域设为标靶(靶序列(site 1):tcgagatgtgatgaaggaga;序列号27)的、载体1923-2(UGI-nCas9-dVif:序列号28)、载体1924-2(dVif-nCas9-UGI:序列号29)、载体1931(TopBv2452-591-nCas9:序列号30)以及载体1932(nCas9-IQGAP2466-547-ZNF335745-893:序列号31),另外为比较实验用制作出载体1907(nCas9-PmCDA1-UGI:序列号32)。编码TopBv2、IQGAP2以及ZNF335的片段的碱基序列,分别参照数据库上的序列即refseq号:NM_001068、NM_006633以及NM_022095而进行设计。在图3中示出,所制作出的载体1923-2、1924-2、1931以及1932的示意图。分别将编码UGI的碱基序列以及UGI的氨基酸序列示于序列号19以及20,分别将编码TopBv2452-591的碱基序列以及TopBv2452-591的氨基酸序列示于序列号21和22,分别将编码IQGAP2466-547的碱基序列以及IQGAP2466-547的氨基酸序列示于序列号23以及24,分别将编码ZNF335745-893的碱基序列以及ZNF335745-893的氨基酸序列示于序列号25以及26。
2.细胞株·培养·转化·表达诱导
2-1.1-1的载体的导入系
按照以下的步骤来进行使用了上述1-1的载体的实验。使用了源自人类胎儿肾脏的细胞(HEK293T细胞)。对于细胞,使用添加了100μg/mL青霉素-链霉素(Life Technologies,Carlsbad,CA,USA)以及10%胎牛血清(FBS)(Biosera,Nuaille,France)的DME-glutamax培养基(Thermo Fisher Scientific,USA),在37℃、5%CO2条件下进行了培养。在细胞的回收方面使用了5%胰蛋白酶。
利用37℃的水浴溶解在低温冰箱(Deep Freezer)中保存了的HEK293T细胞,以成为5x106 cells地在75T-flask中进行了接种。在培养1-3天后将细胞回收,以成为0.5x105cells/well地在24孔板(well plate)的各孔(well)进行了接种。在培养1-3天后,对60-80%融合性的(confluent)状态的各孔的细胞,使用3μl的脂质体(Lipofectamine)2000(Life Technologies,Carlsbad,USA)将约1μg上述的各质粒DNA进行了转染。在转染5小时后,交换为包含G418(0.125mg/mL)(InvivoGen,USA)与干扰素α(IFNα)(2000IU)(Takara Bio)或干扰素γ(2000IU)(PeproTech,Inc.)的培养基。作为对照,使用了仅包含G418的培养基。
2-2.1-2的载体的导入系
在使用了上述1-2的载体的实验中,按照以下的步骤来进行。将细胞(HEK293或者HepG2)以成为1x105cells/well地在24孔板的各孔中进行接种,进行了一夜培养。接着,利用FugeneHD(Promega)而转染(DNA1μg/well,FugeneHD 1.5μl/well),在16小时后将培养基进行了交换。此时,在HEK293的情况时,从OPTI-MEM,交换为DMEM+10%FBS+P/S(青霉素-链霉素)+嘌呤霉素(puromycin)(1μg/ml)+/-IFNα(10000U/ml),在HepG2的情况时,从OPTI-MEM,交换为DMEM+10%FBS+P/S+1%NEAA(非必需氨基酸)+嘌呤霉素(1μg/ml)+/-IFNa(10000U/ml)。在6天间,继续进行基于嘌呤霉素的选择(selection)。此时,每48小时将培养基进行了交换。
3.序列解析
3-1.1-1的载体的导入系
通过上述2-1而回收的细胞,按照下面的步骤提取基因组DNA,进行了序列解析。为了序列解析,在培养3天后回收各细胞,提取基因组DNA。将所提取的基因组DNA设为模板,使用以HPRT基因的外显子6为标靶的正向引物(5’-ATTCCAGAATATCTCCATGTAGATTTTGGT-3’:序列号14)以及反向引物(5’-AATTCCAGGAGGTCCAGATCTTCAGGGCCC-3’:序列号15),将靶区域进行了扩增。将扩增的DNA片段设为模板,使用正向引物(5’-TCTTTCCCTACACGACGCTCTTCCGATCTATTCCAGAATATCTCCATGTAGATTTTGGT-3’:序列号16)以及反向引物(5’-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTTTAGGCAAGGAAGTGACTGTAATTATGAGC-3’:序列号17),获得了附加了NGS解析用的接头(adapter)的约300bp的扩增片段。在各样品中附加索引序列(indexsequence),然后使用MiSeq Reagent Kit v3以及MiSeq sequencing system(Illumina)而进行了基于双端(pair end)的深度测序(deep sequencing)。在解析中,使用了CLCGenomics Workbench 7.0(Filgen)。将结果示于表1。表中,indel表示插入缺失,数字表示核苷酸的取代比例(%)。在干扰素的存在下培养表达了nCas9与dVif的复合体的细胞的情况时,发生插入缺失及/或碱基取代,碱基取代的大部分是从胞嘧啶取代为胸腺嘧啶。另外,插入缺失以及碱基取代的比例,与使用了外因性的脱氨酶的以往方法(Target-AID)为相同程度。此外,在表中的核酸碱基的第19个T与第20个C,较多地发现碱基的取代,但是由于在pNeo也高频率地发现取代,因而认为这些突变是序列的误差(error)。
[表1]
3-2.1-2的载体的导入系
通过上述2.2而回收的细胞,按照下面的步骤提取基因组DNA,进行了序列解析。HEK293细胞在第6天的时间点回收,HepG2细胞在48小时的恢复培养后回收,使用NucleoSpinTissue XS(Takara Bio),提取了基因组DNA。进行1st PCR(DNA聚合酶:KOD FX NEO(东洋纺)、引物对(primer set):正向引物(5’-TTTGGTACTTGTTCAGCTTTATTCAAGTGG-3’:序列号33);反向引物(5’-ACAATAGCTCTTCAGTCTGATAAAATCTAC-3’:序列号34)),利用电泳确认条带(band),使用Exo/Sap(赛默飞世尔科技(Thermo Fisher Scientific))进行纯化,获得了1100bp的扩增片段。接着,将纯化后的PCR产物设为模板,进行2nd PCR(DNA聚合酶:KOD FXNEO、引物对:正向引物(5’-TCTTTCCCTACACGACGCTCTTCCGATCTTAGGACTGAACGTCTTGCTC-3’:序列号35);反向引物(5’-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCAGTCATAGGAATGGATCTATCAC-3’:序列号36)),利用电泳确认条带,使用Exo/Sap进行纯化,获得了220bp的扩增片段。进一步,将纯化后的PCR产物设为模板,进行3rd PCR(Q5 DNA聚合酶(New EnglandBiolabs)、引物对:序列号14以及15),使用AMPure XP(贝克曼库尔特(Beckman Coulter))进行纯化,获得了附加了NGS解析用的接头的约150bp的扩增片段。对于使用AMPure XP进行了纯化之后的样品,利用Multina(岛津)确认了条带。对于样品,以由Multina获得的条带(浓度)为参考而跑电泳(pool),利用Qubit(Thermo Fisher Scientific)测定样品的浓度,将样品以成为10nM的方式进行稀释,用Qubit确认了是10nM。将10nM的样品稀释为1nM,将1nM的样品进行了变性处理。之后,以成为1.5pM地进行了稀释。将4nM PhiX(Illumina)进行变性处理,其后以成为1.5pM地进行了稀释。将500μl的样品(1.5pM)与100μl的PhiX(1.5pM)进行混合,应用于卡盒(cartridge)。起动Miniseq(Illumina),进行了测序。将结果示于表2。表中,indel表示插入缺失(其中,在表2中没有检测到indel),数字表示核苷酸的取代比例(%)。在干扰素的存在下培养了表达了UGI、nCas9以及dVif的复合体的HEK293细胞的情况时,发生了从胞嘧啶向胸腺嘧啶的碱基取代。同样地,在干扰素的存在下培养了表达了nCas9与、TopBv2或IQGAP2以及ZNF335的复合体的细胞的情况时,产生了从胞嘧啶向胸腺嘧啶的碱基取代。另外,在干扰素的存在下培养表达了UGI、nCas9以及dVif的复合体的HepG2细胞的情况时,发生了从胞嘧啶向胸腺嘧啶的碱基取代。在使用了HepG2细胞的情况时,碱基取代的比例与使用了外因性的脱氨酶的以往方法(Target-AID)为相同程度。
[表2]
Hek293细胞 HPRT位点1
1923-2:UGI-nCas9-Vif
1924-2:Vif-nCas9-UGI
1931:TopBv2-nCas9
1932:nCas9-ZF
HepG2细胞 HPRT位点1
1924-2:vif-nCas9-UGI
1907:nCas9-CDA-ugi(参考数据)
本申请以在日本申请的日本特愿2017-056727(申请日:2017年3月22日)为基础,其内容全部包含于本说明书中。
产业上的可利用性
根据本发明,由于在DNA的改变反应中不使用外来的酶,因而是安全的,而且利用在DNA编辑中使用的构建体的小型化,从而可实现传递效率提高了的DNA编辑,极其有用。
序列表
<110> 国立大学法人神户大学(NATIONAL UNIVERSITY CORPORATION KOBEUNIVERSITY)
<120> 利用细胞内在性的DNA修饰酶将靶向化的DNA的核酸碱基特异地替换的、细胞的核酸序列的替换方法、以及用于该方法的分子复合体
<130> 092729
<150> JP 2017-056727
<151> 2017-03-22
<160> 37
<170> PatentIn version 3.5
<210> 1
<211> 549
<212> DNA
<213> 人类免疫缺陷病毒(Human immunodeficiency virus)
<220>
<221> CDS
<222> (1)..(549)
<220>
<221> misc_difference
<222> (406)..(408)
<223> 人工突变(artificial mutation)
<400> 1
gtg tgg caa gta gac agg atg agg att aga aca tgg aac agt tta gta 48
Val Trp Gln Val Asp Arg Met Arg Ile Arg Thr Trp Asn Ser Leu Val
1 5 10 15
aaa cat cac atg tat atc tca aag aaa gca aaa aat tgg ttt tat aga 96
Lys His His Met Tyr Ile Ser Lys Lys Ala Lys Asn Trp Phe Tyr Arg
20 25 30
cat cac ttt gaa agc agt cat cca aga gta agt tca gaa gta cac atc 144
His His Phe Glu Ser Ser His Pro Arg Val Ser Ser Glu Val His Ile
35 40 45
cca cta ggg gat gct aga tta gta gta aga aca tat tgg ggt ctg cat 192
Pro Leu Gly Asp Ala Arg Leu Val Val Arg Thr Tyr Trp Gly Leu His
50 55 60
aca gga gaa aaa gat tgg cac ttg ggt aat ggg gtg tcc ata gaa tgg 240
Thr Gly Glu Lys Asp Trp His Leu Gly Asn Gly Val Ser Ile Glu Trp
65 70 75 80
aga cta aga aga tat agc aca caa ata gat cct gac ctg gca gac caa 288
Arg Leu Arg Arg Tyr Ser Thr Gln Ile Asp Pro Asp Leu Ala Asp Gln
85 90 95
cta att cat ctg cat tat ttt aat tgt ttt tca gac tct gcc ata agg 336
Leu Ile His Leu His Tyr Phe Asn Cys Phe Ser Asp Ser Ala Ile Arg
100 105 110
aaa gcc ata tta gga caa gta gtt aga cct aga tgt gac tat caa gca 384
Lys Ala Ile Leu Gly Gln Val Val Arg Pro Arg Cys Asp Tyr Gln Ala
115 120 125
gga cat aac aag gta gga tct gct caa tat ttg gca ctg aaa gca tta 432
Gly His Asn Lys Val Gly Ser Ala Gln Tyr Leu Ala Leu Lys Ala Leu
130 135 140
gta aca cca gta agg aca agg cca cct ttg cct agt gtt agg aaa tta 480
Val Thr Pro Val Arg Thr Arg Pro Pro Leu Pro Ser Val Arg Lys Leu
145 150 155 160
gca gag gac aga tgg aac aag ccc cag aaa acc agg ggt ccc aga ggg 528
Ala Glu Asp Arg Trp Asn Lys Pro Gln Lys Thr Arg Gly Pro Arg Gly
165 170 175
agc cat aca atg aat gga cat 549
Ser His Thr Met Asn Gly His
180
<210> 2
<211> 183
<212> PRT
<213> 人类免疫缺陷病毒(Human immunodeficiency virus)
<400> 2
Val Trp Gln Val Asp Arg Met Arg Ile Arg Thr Trp Asn Ser Leu Val
1 5 10 15
Lys His His Met Tyr Ile Ser Lys Lys Ala Lys Asn Trp Phe Tyr Arg
20 25 30
His His Phe Glu Ser Ser His Pro Arg Val Ser Ser Glu Val His Ile
35 40 45
Pro Leu Gly Asp Ala Arg Leu Val Val Arg Thr Tyr Trp Gly Leu His
50 55 60
Thr Gly Glu Lys Asp Trp His Leu Gly Asn Gly Val Ser Ile Glu Trp
65 70 75 80
Arg Leu Arg Arg Tyr Ser Thr Gln Ile Asp Pro Asp Leu Ala Asp Gln
85 90 95
Leu Ile His Leu His Tyr Phe Asn Cys Phe Ser Asp Ser Ala Ile Arg
100 105 110
Lys Ala Ile Leu Gly Gln Val Val Arg Pro Arg Cys Asp Tyr Gln Ala
115 120 125
Gly His Asn Lys Val Gly Ser Ala Gln Tyr Leu Ala Leu Lys Ala Leu
130 135 140
Val Thr Pro Val Arg Thr Arg Pro Pro Leu Pro Ser Val Arg Lys Leu
145 150 155 160
Ala Glu Asp Arg Trp Asn Lys Pro Gln Lys Thr Arg Gly Pro Arg Gly
165 170 175
Ser His Thr Met Asn Gly His
180
<210> 3
<211> 573
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Vif变体构建体(Vif variant construct)
<400> 3
cctaggggta ccgaaatggt gtggcaagta gacaggatga ggattagaac atggaacagt 60
ttagtaaaac atcacatgta tatctcaaag aaagcaaaaa attggtttta tagacatcac 120
tttgaaagca gtcatccaag agtaagttca gaagtacaca tcccactagg ggatgctaga 180
ttagtagtaa gaacatattg gggtctgcat acaggagaaa aagattggca cttgggtaat 240
ggggtgtcca tagaatggag actaagaaga tatagcacac aaatagatcc tgacctggca 300
gaccaactaa ttcatctgca ttattttaat tgtttttcag actctgccat aaggaaagcc 360
atattaggac aagtagttag acctagatgt gactatcaag caggacataa caaggtagga 420
tctgctcaat atttggcact gaaagcatta gtaacaccag taaggacaag gccacctttg 480
cctagtgtta ggaaattagc agaggacaga tggaacaagc cccagaaaac caggggtccc 540
agagggagcc atacaatgaa tggacatgct agc 573
<210> 4
<211> 4116
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人密码子优化的Cas9(Cas9 codon-optimized for human)
<220>
<221> CDS
<222> (1)..(4116)
<400> 4
atg gac aag aag tac tcc att ggg ctc gmt atc ggc aca aac agc gtc 48
Met Asp Lys Lys Tyr Ser Ile Gly Leu Xaa Ile Gly Thr Asn Ser Val
1 5 10 15
ggt tgg gcc gtc att acg gac gag tac aag gtg ccg agc aaa aaa ttc 96
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
aaa gtt ctg ggc aat acc gat cgc cac agc ata aag aag aac ctc att 144
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
ggc gcc ctc ctg ttc gac tcc ggg gag acg gcc gaa gcc acg cgg ctc 192
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
aaa aga aca gca cgg cgc aga tat acc cgc aga aag aat cgg atc tgc 240
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
tac ctg cag gag atc ttt agt aat gag atg gct aag gtg gat gac tct 288
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
ttc ttc cat agg ctg gag gag tcc ttt ttg gtg gag gag gat aaa aag 336
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
cac gag cgc cac cca atc ttt ggc aat atc gtg gac gag gtg gcg tac 384
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
cat gaa aag tac cca acc ata tat cat ctg agg aag aag ctt gta gac 432
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
agt act gat aag gct gac ttg cgg ttg atc tat ctc gcg ctg gcg cat 480
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
atg atc aaa ttt cgg gga cac ttc ctc atc gag ggg gac ctg aac cca 528
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
gac aac agc gat gtc gac aaa ctc ttt atc caa ctg gtt cag act tac 576
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
aat cag ctt ttc gaa gag aac ccg atc aac gca tcc gga gtt gac gcc 624
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
aaa gca atc ctg agc gct agg ctg tcc aaa tcc cgg cgg ctc gaa aac 672
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
ctc atc gca cag ctc cct ggg gag aag aag aac ggc ctg ttt ggt aat 720
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
ctt atc gcc ctg tca ctc ggg ctg acc ccc aac ttt aaa tct aac ttc 768
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
gac ctg gcc gaa gat gcc aag ctt caa ctg agc aaa gac acc tac gat 816
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
gat gat ctc gac aat ctg ctg gcc cag atc ggc gac cag tac gca gac 864
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
ctt ttt ttg gcg gca aag aac ctg tca gac gcc att ctg ctg agt gat 912
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
att ctg cga gtg aac acg gag atc acc aaa gct ccg ctg agc gct agt 960
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
atg atc aag cgc tat gat gag cac cac caa gac ttg act ttg ctg aag 1008
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
gcc ctt gtc aga cag caa ctg cct gag aag tac aag gaa att ttc ttc 1056
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
gat cag tct aaa aat ggc tac gcc gga tac att gac ggc gga gca agc 1104
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
cag gag gaa ttt tac aaa ttt att aag ccc atc ttg gaa aaa atg gac 1152
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
ggc acc gag gag ctg ctg gta aag ctt aac aga gaa gat ctg ttg cgc 1200
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
aaa cag cgc act ttc gac aat gga agc atc ccc cac cag att cac ctg 1248
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
ggc gaa ctg cac gct atc ctc agg cgg caa gag gat ttc tac ccc ttt 1296
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
ttg aaa gat aac agg gaa aag att gag aaa atc ctc aca ttt cgg ata 1344
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
ccc tac tat gta ggc ccc ctc gcc cgg gga aat tcc aga ttc gcg tgg 1392
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
atg act cgc aaa tca gaa gag acc atc act ccc tgg aac ttc gag gaa 1440
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
gtc gtg gat aag ggg gcc tct gcc cag tcc ttc atc gaa agg atg act 1488
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
aac ttt gat aaa aat ctg cct aac gaa aag gtg ctt cct aaa cac tct 1536
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
ctg ctg tac gag tac ttc aca gtt tat aac gag ctc acc aag gtc aaa 1584
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
tac gtc aca gaa ggg atg aga aag cca gca ttc ctg tct gga gag cag 1632
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
aag aaa gct atc gtg gac ctc ctc ttc aag acg aac cgg aaa gtt acc 1680
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
gtg aaa cag ctc aaa gaa gac tat ttc aaa aag att gaa tgt ttc gac 1728
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
tct gtt gaa atc agc gga gtg gag gat cgc ttc aac gca tcc ctg gga 1776
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
acg tat cac gat ctc ctg aaa atc att aaa gac aag gac ttc ctg gac 1824
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
aat gag gag aac gag gac att ctt gag gac att gtc ctc acc ctt acg 1872
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
ttg ttt gaa gat agg gag atg att gaa gaa cgc ttg aaa act tac gct 1920
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
cat ctc ttc gac gac aaa gtc atg aaa cag ctc aag agg cgc cga tat 1968
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
aca gga tgg ggg cgg ctg tca aga aaa ctg atc aat ggg atc cga gac 2016
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
aag cag agt gga aag aca atc ctg gat ttt ctt aag tcc gat gga ttt 2064
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
gcc aac cgg aac ttc atg cag ttg atc cat gat gac tct ctc acc ttt 2112
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
aag gag gac atc cag aaa gca caa gtt tct ggc cag ggg gac agt ctt 2160
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
cac gag cac atc gct aat ctt gca ggt agc cca gct atc aaa aag gga 2208
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
ata ctg cag acc gtt aag gtc gtg gat gaa ctc gtc aaa gta atg gga 2256
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
agg cat aag ccc gag aat atc gtt atc gag atg gcc cga gag aac caa 2304
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
act acc cag aag gga cag aag aac agt agg gaa agg atg aag agg att 2352
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
gaa gag ggt ata aaa gaa ctg ggg tcc caa atc ctt aag gaa cac cca 2400
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
gtt gaa aac acc cag ctt cag aat gag aag ctc tac ctg tac tac ctg 2448
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
cag aac ggc agg gac atg tac gtg gat cag gaa ctg gac atc aat cgg 2496
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
ctc tcc gac tac gac gtg gat smt atc gtg ccc cag tct ttt ctc aaa 2544
Leu Ser Asp Tyr Asp Val Asp Xaa Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
gat gat tct att gat aat aaa gtg ttg aca aga tcc gat aaa aat aga 2592
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
ggg aag agt gat aac gtc ccc tca gaa gaa gtt gtc aag aaa atg aaa 2640
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
aat tat tgg cgg cag ctg ctg aac gcc aaa ctg atc aca caa cgg aag 2688
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
ttc gat aat ctg act aag gct gaa cga ggt ggc ctg tct gag ttg gat 2736
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
aaa gcc ggc ttc atc aaa agg cag ctt gtt gag aca cgc cag atc acc 2784
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
aag cac gtg gcc caa att ctc gat tca cgc atg aac acc aag tac gat 2832
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
gaa aat gac aaa ctg att cga gag gtg aaa gtt att act ctg aag tct 2880
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
aag ctg gtc tca gat ttc aga aag gac ttt cag ttt tat aag gtg aga 2928
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
gag atc aac aat tac cac cat gcg cat gat gcc tac ctg aat gca gtg 2976
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
gta ggc act gca ctt atc aaa aaa tat ccc aag ctt gaa tct gaa ttt 3024
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
gtt tac gga gac tat aaa gtg tac gat gtt agg aaa atg atc gca 3069
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
aag tct gag cag gaa ata ggc aag gcc acc gct aag tac ttc ttt 3114
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
tac agc aat att atg aat ttt ttc aag acc gag att aca ctg gcc 3159
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
aat gga gag att cgg aag cga cca ctt atc gaa aca aac gga gaa 3204
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
aca gga gaa atc gtg tgg gac aag ggt agg gat ttc gcg aca gtc 3249
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
cgg aag gtc ctg tcc atg ccg cag gtg aac atc gtt aaa aag acc 3294
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
gaa gta cag acc gga ggc ttc tcc aag gaa agt atc ctc ccg aaa 3339
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
agg aac agc gac aag ctg atc gca cgc aaa aaa gat tgg gac ccc 3384
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
aag aaa tac ggc gga ttc gat tct cct aca gtc gct tac agt gta 3429
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
ctg gtt gtg gcc aaa gtg gag aaa ggg aag tct aaa aaa ctc aaa 3474
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
agc gtc aag gaa ctg ctg ggc atc aca atc atg gag cga tca agc 3519
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
ttc gaa aaa aac ccc atc gac ttt ctc gag gcg aaa gga tat aaa 3564
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
gag gtc aaa aaa gac ctc atc att aag ctt ccc aag tac tct ctc 3609
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
ttt gag ctt gaa aac ggc cgg aaa cga atg ctc gct agt gcg ggc 3654
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
gag ctg cag aaa ggt aac gag ctg gca ctg ccc tct aaa tac gtt 3699
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
aat ttc ttg tat ctg gcc agc cac tat gaa aag ctc aaa ggg tct 3744
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
ccc gaa gat aat gag cag aag cag ctg ttc gtg gaa caa cac aaa 3789
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
cac tac ctt gat gag atc atc gag caa ata agc gaa ttc tcc aaa 3834
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
aga gtg atc ctc gcc gac gct aac ctc gat aag gtg ctt tct gct 3879
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
tac aat aag cac agg gat aag ccc atc agg gag cag gca gaa aac 3924
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
att atc cac ttg ttt act ctg acc aac ttg ggc gcg cct gca gcc 3969
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
ttc aag tac ttc gac acc acc ata gac aga aag cgg tac acc tct 4014
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
aca aag gag gtc ctg gac gcc aca ctg att cat cag tca att acg 4059
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
ggg ctc tat gaa aca aga atc gac ctc tct cag ctc ggt gga gac 4104
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
agc agg gct gac 4116
Ser Arg Ala Asp
1370
<210> 5
<211> 1372
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (10)..(10)
<223> 位点10的“Xaa”代表Asp或Ala(The ’Xaa’ at location 10 stands for Asp,or Ala)
<220>
<221> misc_feature
<222> (840)..(840)
<223> 位点840的“Xaa”代表Asp、Ala、His或Pro(The ’Xaa’ at location 840 standsfor Asp, Ala, His, or Pro)
<220>
<223> 合成的构建体(Synthetic Construct)
<400> 5
Met Asp Lys Lys Tyr Ser Ile Gly Leu Xaa Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Xaa Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
Ser Arg Ala Asp
1370
<210> 6
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> SV40衍生的核定位信号(SV40-derived nuclear localization signal)
<220>
<221> CDS
<222> (1)..(21)
<400> 6
cct aag aag aar mgk aar gtw 21
Pro Lys Lys Lys Xaa Lys Xaa
1 5
<210> 7
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (5)..(5)
<223> 位点5的“Xaa”代表Arg或Ser(The ’Xaa’ at location 5 stands for Arg, orSer.)
<220>
<221> misc_feature
<222> (7)..(7)
<223> 位点7的“Xaa”代表Val(The ’Xaa’ at location 7 stands for Val.)
<220>
<223> 合成的构建体(Synthetic Construct)
<400> 7
Pro Lys Lys Lys Xaa Lys Xaa
1 5
<210> 8
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> SV40衍生的核定位信号(SV40-derived nuclear localization signal)
<220>
<221> CDS
<222> (1)..(51)
<220>
<221> misc_feature
<222> (6)..(6)
<223> n是a, c, g, 或 t
<220>
<221> misc_feature
<222> (9)..(9)
<223> n是a, c, g, 或 t
<220>
<221> misc_feature
<222> (27)..(27)
<223> n是a, c, g, 或 t
<220>
<221> misc_feature
<222> (30)..(30)
<223> n是a, c, g, 或 t
<220>
<221> misc_feature
<222> (39)..(39)
<223> n是a, c, g, 或 t
<220>
<221> misc_feature
<222> (42)..(42)
<223> n是a, c, g, 或 t
<220>
<221> misc_feature
<222> (45)..(45)
<223> n是a, c, g, 或 t
<220>
<221> misc_feature
<222> (48)..(48)
<223> n是a, c, g, 或 t
<220>
<221> misc_feature
<222> (51)..(51)
<223> n是a, c, g, 或 t
<400> 8
atg gcn ccn aar aar aar agr aar gtn ggn ath cay ggn gtn ccn gcn 48
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
gcn 51
Ala
<210> 9
<211> 17
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的构建体(Synthetic Construct)
<400> 9
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala
<210> 10
<211> 19
<212> RNA
<213> 新凶手弗朗西斯菌(Francisella novicida)
<220>
<221> misc_structure
<222> (1)..(19)
<223> crRNA同向重复序列(crRNA direct repeat sequence.)
<400> 10
aauuucuacu guuguagau 19
<210> 11
<211> 76
<212> DNA
<213> 化脓性链球菌(Streptococcus pyogenes)
<220>
<221> misc_structure
<222> (1)..(76)
<223> tracrRNA
<400> 11
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60
ggcaccgagt cggtgc 76
<210> 12
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 12
aatgcagact ttgctttcct 20
<210> 13
<211> 8604
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 载体1922的完整核苷酸序列(Complete nucleotide sequence of vector1922)
<220>
<221> 启动子
<222> (2233)..(2461)
<223> H1 启动子(H1 promoter)
<220>
<221> misc_feature
<222> (2462)..(2481)
<223> 靶(HPRT位点3)(Target(HPRT site 3))
<220>
<221> misc_structure
<222> (2482)..(2557)
<223> tracrRNA
<220>
<221> 启动子
<222> (2572)..(2826)
<223> CMV启动子(CMV promoter)
<220>
<221> misc_feature
<222> (3232)..(3237)
<223> NheI识别位点(NheI recognition site)
<220>
<221> misc_feature
<222> (3241)..(3291)
<223> NLS
<220>
<221> 基因
<222> (3292)..(7407)
<223> nCas9
<220>
<221> misc_feature
<222> (7408)..(7428)
<223> NLS
<220>
<221> misc_feature
<222> (7444)..(7449)
<223> AvrII识别位点(AvrII recognition site)
<220>
<221> misc_feature
<222> (7453)..(7506)
<223> T2A
<220>
<221> 基因
<222> (7513)..(7767)
<223> NeoR
<400> 13
ggccgccacc gcggtggagc tccagctttt gttcccttta gtgagggtta attgcgcgct 60
tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac 120
acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac 180
tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc 240
tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttccg 300
cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc 360
actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt 420
gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc 480
ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa 540
acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc 600
ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg 660
cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc 720
tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc 780
gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca 840
ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact 900
acggctacac tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg 960
gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt 1020
ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct 1080
tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga 1140
gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa 1200
tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac 1260
ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga 1320
taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc 1380
cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca 1440
gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta 1500
gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg 1560
tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc 1620
gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg 1680
ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt 1740
ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt 1800
cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata 1860
ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc 1920
gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac 1980
ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa 2040
ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct 2100
tcctttttca atattattga agcatttatc agggttattg tctcatgagc ggatacatat 2160
ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc 2220
caccggtgta ccaattcgaa cgctgacgtc atcaacccgc tccaaggaat cgcgggccca 2280
gtgtcactag gcgggaacac ccagcgcgcg tgcgccctgg caggaagatg gctgtgaggg 2340
acaggggagt ggcgccctgc aatatttgca tgtcgctatg tgttctggga aatcaccata 2400
aacgtgaaat gtctttggat ttgggaatct tataagttct gtatgaggac cacagatccc 2460
caatgcagac tttgctttcc tgttttagag ctagaaatag caagttaaaa taaggctagt 2520
ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt ttttacgcgt tgacattgat 2580
tattgactag ttattaatag taatcaatta cggggtcatt agttcatagc ccatatatgg 2640
agttccgcgt tacataactt acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc 2700
gcccattgac gtcaataatg acgtatgttc ccatagtaac gccaataggg actttccatt 2760
gacgtcaatg ggtggagtat ttacggtaaa ctgcccactt ggcagtacat caagtgtatc 2820
atatgccaag tacgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg 2880
cccagtacat gaccttatgg gactttccta cttggcagta catctacgta ttagtcatcg 2940
ctattaccat ggtgatgcgg ttttggcagt acatcaatgg gcgtggatag cggtttgact 3000
cacggggatt tccaagtctc caccccattg acgtcaatgg gagtttgttt tggcaccaaa 3060
atcaacggga ctttccaaaa tgtcgtaaca actccgcccc attgacgcaa atgggcggta 3120
ggcgtgtacg gtgggaggtc tatataagca gagctctctg gctaactaga gaacccactg 3180
cttactggct tatcgaaatt aatacgactc actataggga gacccaagct ggctagcgaa 3240
atggcaccga agaagaagcg taaagtcgga atccacggag ttcctgcggc aatggacaag 3300
aagtactcca ttgggctcgc tatcggcaca aacagcgtcg gttgggccgt cattacggac 3360
gagtacaagg tgccgagcaa aaaattcaaa gttctgggca ataccgatcg ccacagcata 3420
aagaagaacc tcattggcgc cctcctgttc gactccgggg agacggccga agccacgcgg 3480
ctcaaaagaa cagcacggcg cagatatacc cgcagaaaga atcggatctg ctacctgcag 3540
gagatcttta gtaatgagat ggctaaggtg gatgactctt tcttccatag gctggaggag 3600
tcctttttgg tggaggagga taaaaagcac gagcgccacc caatctttgg caatatcgtg 3660
gacgaggtgg cgtaccatga aaagtaccca accatatatc atctgaggaa gaagcttgta 3720
gacagtactg ataaggctga cttgcggttg atctatctcg cgctggcgca tatgatcaaa 3780
tttcggggac acttcctcat cgagggggac ctgaacccag acaacagcga tgtcgacaaa 3840
ctctttatcc aactggttca gacttacaat cagcttttcg aagagaaccc gatcaacgca 3900
tccggagttg acgccaaagc aatcctgagc gctaggctgt ccaaatcccg gcggctcgaa 3960
aacctcatcg cacagctccc tggggagaag aagaacggcc tgtttggtaa tcttatcgcc 4020
ctgtcactcg ggctgacccc caactttaaa tctaacttcg acctggccga agatgccaag 4080
cttcaactga gcaaagacac ctacgatgat gatctcgaca atctgctggc ccagatcggc 4140
gaccagtacg cagacctttt tttggcggca aagaacctgt cagacgccat tctgctgagt 4200
gatattctgc gagtgaacac ggagatcacc aaagctccgc tgagcgctag tatgatcaag 4260
cgctatgatg agcaccacca agacttgact ttgctgaagg cccttgtcag acagcaactg 4320
cctgagaagt acaaggaaat tttcttcgat cagtctaaaa atggctacgc cggatacatt 4380
gacggcggag caagccagga ggaattttac aaatttatta agcccatctt ggaaaaaatg 4440
gacggcaccg aggagctgct ggtaaagctt aacagagaag atctgttgcg caaacagcgc 4500
actttcgaca atggaagcat cccccaccag attcacctgg gcgaactgca cgctatcctc 4560
aggcggcaag aggatttcta cccctttttg aaagataaca gggaaaagat tgagaaaatc 4620
ctcacatttc ggatacccta ctatgtaggc cccctcgccc ggggaaattc cagattcgcg 4680
tggatgactc gcaaatcaga agagaccatc actccctgga acttcgagga agtcgtggat 4740
aagggggcct ctgcccagtc cttcatcgaa aggatgacta actttgataa aaatctgcct 4800
aacgaaaagg tgcttcctaa acactctctg ctgtacgagt acttcacagt ttataacgag 4860
ctcaccaagg tcaaatacgt cacagaaggg atgagaaagc cagcattcct gtctggagag 4920
cagaagaaag ctatcgtgga cctcctcttc aagacgaacc ggaaagttac cgtgaaacag 4980
ctcaaagaag actatttcaa aaagattgaa tgtttcgact ctgttgaaat cagcggagtg 5040
gaggatcgct tcaacgcatc cctgggaacg tatcacgatc tcctgaaaat cattaaagac 5100
aaggacttcc tggacaatga ggagaacgag gacattcttg aggacattgt cctcaccctt 5160
acgttgtttg aagataggga gatgattgaa gaacgcttga aaacttacgc tcatctcttc 5220
gacgacaaag tcatgaaaca gctcaagagg cgccgatata caggatgggg gcggctgtca 5280
agaaaactga tcaatgggat ccgagacaag cagagtggaa agacaatcct ggattttctt 5340
aagtccgatg gatttgccaa ccggaacttc atgcagttga tccatgatga ctctctcacc 5400
tttaaggagg acatccagaa agcacaagtt tctggccagg gggacagtct tcacgagcac 5460
atcgctaatc ttgcaggtag cccagctatc aaaaagggaa tactgcagac cgttaaggtc 5520
gtggatgaac tcgtcaaagt aatgggaagg cataagcccg agaatatcgt tatcgagatg 5580
gcccgagaga accaaactac ccagaaggga cagaagaaca gtagggaaag gatgaagagg 5640
attgaagagg gtataaaaga actggggtcc caaatcctta aggaacaccc agttgaaaac 5700
acccagcttc agaatgagaa gctctacctg tactacctgc agaacggcag ggacatgtac 5760
gtggatcagg aactggacat caatcggctc tccgactacg acgtggatca tatcgtgccc 5820
cagtcttttc tcaaagatga ttctattgat aataaagtgt tgacaagatc cgataaaaat 5880
agagggaaga gtgataacgt cccctcagaa gaagttgtca agaaaatgaa aaattattgg 5940
cggcagctgc tgaacgccaa actgatcaca caacggaagt tcgataatct gactaaggct 6000
gaacgaggtg gcctgtctga gttggataaa gccggcttca tcaaaaggca gcttgttgag 6060
acacgccaga tcaccaagca cgtggcccaa attctcgatt cacgcatgaa caccaagtac 6120
gatgaaaatg acaaactgat tcgagaggtg aaagttatta ctctgaagtc taagctggtc 6180
tcagatttca gaaaggactt tcagttttat aaggtgagag agatcaacaa ttaccaccat 6240
gcgcatgatg cctacctgaa tgcagtggta ggcactgcac ttatcaaaaa atatcccaag 6300
cttgaatctg aatttgttta cggagactat aaagtgtacg atgttaggaa aatgatcgca 6360
aagtctgagc aggaaatagg caaggccacc gctaagtact tcttttacag caatattatg 6420
aattttttca agaccgagat tacactggcc aatggagaga ttcggaagcg accacttatc 6480
gaaacaaacg gagaaacagg agaaatcgtg tgggacaagg gtagggattt cgcgacagtc 6540
cggaaggtcc tgtccatgcc gcaggtgaac atcgttaaaa agaccgaagt acagaccgga 6600
ggcttctcca aggaaagtat cctcccgaaa aggaacagcg acaagctgat cgcacgcaaa 6660
aaagattggg accccaagaa atacggcgga ttcgattctc ctacagtcgc ttacagtgta 6720
ctggttgtgg ccaaagtgga gaaagggaag tctaaaaaac tcaaaagcgt caaggaactg 6780
ctgggcatca caatcatgga gcgatcaagc ttcgaaaaaa accccatcga ctttctcgag 6840
gcgaaaggat ataaagaggt caaaaaagac ctcatcatta agcttcccaa gtactctctc 6900
tttgagcttg aaaacggccg gaaacgaatg ctcgctagtg cgggcgagct gcagaaaggt 6960
aacgagctgg cactgccctc taaatacgtt aatttcttgt atctggccag ccactatgaa 7020
aagctcaaag ggtctcccga agataatgag cagaagcagc tgttcgtgga acaacacaaa 7080
cactaccttg atgagatcat cgagcaaata agcgaattct ccaaaagagt gatcctcgcc 7140
gacgctaacc tcgataaggt gctttctgct tacaataagc acagggataa gcccatcagg 7200
gagcaggcag aaaacattat ccacttgttt actctgacca acttgggcgc gcctgcagcc 7260
ttcaagtact tcgacaccac catagacaga aagcggtaca cctctacaaa ggaggtcctg 7320
gacgccacac tgattcatca gtcaattacg gggctctatg aaacaagaat cgacctctct 7380
cagctcggtg gagacagcag ggctgacccc aagaagaaga ggaaggtggg tggaggaggt 7440
acccctagga ccgaaggcag gggaagcctt ctgacttgtg gggatgtgga agaaaaccct 7500
ggtccatcta gaatgattga acaagatgga ttgcacgcag gttctccggc cgcttgggtg 7560
gagaggctat tcggctatga ctgggcacaa cagacaatcg gctgctctga tgccgccgtg 7620
ttccggctgt cagcgcaggg gcgcccggtt ctttttgtca agaccgacct gtccggtgcc 7680
ctgaatgaac tgcaggacga ggcagcgcgg ctatcgtggc tggccacgac gggcgttcct 7740
tgcgcagctg tgctcgacgt tgtcactgaa gcgggaaggg actggctgct attgggcgaa 7800
gtgccggggc aggatctcct gtcatctcac cttgctcctg ccgagaaagt atccatcatg 7860
gctgatgcaa tgcggcggct gcatacgctt gatccggcta cctgcccatt cgaccaccaa 7920
gcgaaacatc gcatcgagcg agcacgtact cggatggaag ccggtcttgt cgatcaggat 7980
gatctggacg aagagcatca ggggctcgcg ccagccgaac tgttcgccag gctcaaggcg 8040
cgcatgcccg acggcgagga tctcgtcgtg acccatggcg atgcctgctt gccgaatatc 8100
atggtggaaa atggccgctt ttctggattc atcgactgtg gccggctggg tgtggcggac 8160
cgctatcagg acatagcgtt ggctacccgt gatattgctg aagagcttgg cggcgaatgg 8220
gctgaccgct tcctcgtgct ttacggtatc gccgctcccg attcgcagcg catcgccttc 8280
tatcgccttc ttgacgagtt cttctgagcg ggactctggg gttcgaaatg accgaccaag 8340
cgacgcccaa cctgccatca cgagatttcg attccaccgc cgccttctat gaaaggttgg 8400
gcttcggaat cgttttccgg gacgccggct ggatgatcct ccagcgcggg gatctcatgc 8460
tggagttctt cgcccacccc aacttgttta ttgcagctta taatggttac aaataaagca 8520
atagcatcac aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt 8580
ccaaactcat caatgtatct tagc 8604
<210> 14
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 14
attccagaat atctccatgt agattttggt 30
<210> 15
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 15
aattccagga ggtccagatc ttcagggccc 30
<210> 16
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 16
tctttcccta cacgacgctc ttccgatcta ttccagaata tctccatgta gattttggt 59
<210> 17
<211> 64
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 17
gtgactggag ttcagacgtg tgctcttccg atctttaggc aaggaagtga ctgtaattat 60
gagc 64
<210> 18
<211> 26
<212> DNA
<213> 智人(Homo sapiens)
<400> 18
acaatgcaga ctttgctttc cttggt 26
<210> 19
<211> 252
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 为真核细胞表达而优化的PBS2-衍生的Ugi CDS(PBS2-derived Ugi CDSoptimized for eucaryotic cell expression)
<220>
<221> CDS
<222> (1)..(252)
<400> 19
atg acc aac ctt tcc gac atc ata gag aag gaa aca ggc aaa cag ttg 48
Met Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu
1 5 10 15
gtc atc caa gag tcg ata ctc atg ctt cct gaa gaa gtt gag gag gtc 96
Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val
20 25 30
att ggg aat aag ccg gaa agt gac att ctc gta cac act gcg tat gat 144
Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp
35 40 45
gag agc acc gat gag aac gtg atg ctg ctc acg tca gat gcc cca gag 192
Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu
50 55 60
tac aaa ccc tgg gct ctg gtg att cag gac tct aat gga gag aac aag 240
Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys
65 70 75 80
atc aag atg cta 252
Ile Lys Met Leu
<210> 20
<211> 84
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的构建体(Synthetic Construct)
<400> 20
Met Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu
1 5 10 15
Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val
20 25 30
Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp
35 40 45
Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu
50 55 60
Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys
65 70 75 80
Ile Lys Met Leu
<210> 21
<211> 420
<212> DNA
<213> 智人(Homo sapiens)
<220>
<221> CDS
<222> (1)..(420)
<223> TopBv2 (452-591)的片段(fragment of TopBv2 (452-591))
<400> 21
aaa ggt att ccc aaa ctg gat gat gct aat gat gct ggt ggt aaa cat 48
Lys Gly Ile Pro Lys Leu Asp Asp Ala Asn Asp Ala Gly Gly Lys His
1 5 10 15
tcc ctg gag tgt aca ctg ata tta aca gag gga gac tct gcc aaa tca 96
Ser Leu Glu Cys Thr Leu Ile Leu Thr Glu Gly Asp Ser Ala Lys Ser
20 25 30
ctg gct gtg tct gga tta ggt gtg att gga cga gac aga tac gga gtt 144
Leu Ala Val Ser Gly Leu Gly Val Ile Gly Arg Asp Arg Tyr Gly Val
35 40 45
ttt cca ctc agg ggc aaa att ctt aat gta cgg gaa gct tct cat aaa 192
Phe Pro Leu Arg Gly Lys Ile Leu Asn Val Arg Glu Ala Ser His Lys
50 55 60
cag atc atg gaa aat gct gaa ata aat aat att att aaa ata gtt ggt 240
Gln Ile Met Glu Asn Ala Glu Ile Asn Asn Ile Ile Lys Ile Val Gly
65 70 75 80
cta caa tat aag aaa agt tac gat gat gca gaa tct ctg aaa acc tta 288
Leu Gln Tyr Lys Lys Ser Tyr Asp Asp Ala Glu Ser Leu Lys Thr Leu
85 90 95
cgc tat gga aag att atg att atg acc gat cag gat caa gat ggt tct 336
Arg Tyr Gly Lys Ile Met Ile Met Thr Asp Gln Asp Gln Asp Gly Ser
100 105 110
cac ata aaa ggc ctg ctt att aat ttc atc cat cac aat tgg cca tca 384
His Ile Lys Gly Leu Leu Ile Asn Phe Ile His His Asn Trp Pro Ser
115 120 125
ctt ttg aag cat ggt ttt ctt gaa gag ttc att act 420
Leu Leu Lys His Gly Phe Leu Glu Glu Phe Ile Thr
130 135 140
<210> 22
<211> 140
<212> PRT
<213> 智人(Homo sapiens)
<400> 22
Lys Gly Ile Pro Lys Leu Asp Asp Ala Asn Asp Ala Gly Gly Lys His
1 5 10 15
Ser Leu Glu Cys Thr Leu Ile Leu Thr Glu Gly Asp Ser Ala Lys Ser
20 25 30
Leu Ala Val Ser Gly Leu Gly Val Ile Gly Arg Asp Arg Tyr Gly Val
35 40 45
Phe Pro Leu Arg Gly Lys Ile Leu Asn Val Arg Glu Ala Ser His Lys
50 55 60
Gln Ile Met Glu Asn Ala Glu Ile Asn Asn Ile Ile Lys Ile Val Gly
65 70 75 80
Leu Gln Tyr Lys Lys Ser Tyr Asp Asp Ala Glu Ser Leu Lys Thr Leu
85 90 95
Arg Tyr Gly Lys Ile Met Ile Met Thr Asp Gln Asp Gln Asp Gly Ser
100 105 110
His Ile Lys Gly Leu Leu Ile Asn Phe Ile His His Asn Trp Pro Ser
115 120 125
Leu Leu Lys His Gly Phe Leu Glu Glu Phe Ile Thr
130 135 140
<210> 23
<211> 246
<212> DNA
<213> 智人(Homo sapiens)
<220>
<221> CDS
<222> (1)..(246)
<223> IQGAP2 (466-547)的片段(fragment of IQGAP2 (466-547))
<400> 23
gaa ggg aat cct ttg agg act tta gaa act ttg ctc cta cct act gcg 48
Glu Gly Asn Pro Leu Arg Thr Leu Glu Thr Leu Leu Leu Pro Thr Ala
1 5 10 15
aat att agt gat gtg gac cca gcc cat gcc cag cac tac cag gat gtt 96
Asn Ile Ser Asp Val Asp Pro Ala His Ala Gln His Tyr Gln Asp Val
20 25 30
tta tac cat gct aaa tca cag aaa ctc gga gac tct gag agt gtt tcc 144
Leu Tyr His Ala Lys Ser Gln Lys Leu Gly Asp Ser Glu Ser Val Ser
35 40 45
aaa gtg ctt tgg ctg gat gag ata cag caa gcc gtc gat gat gcc aac 192
Lys Val Leu Trp Leu Asp Glu Ile Gln Gln Ala Val Asp Asp Ala Asn
50 55 60
gtg gac aag gac aga gca aaa caa tgg gtt act ctg gtg gtt gat gtt 240
Val Asp Lys Asp Arg Ala Lys Gln Trp Val Thr Leu Val Val Asp Val
65 70 75 80
aat cag 246
Asn Gln
<210> 24
<211> 82
<212> PRT
<213> 智人(Homo sapiens)
<400> 24
Glu Gly Asn Pro Leu Arg Thr Leu Glu Thr Leu Leu Leu Pro Thr Ala
1 5 10 15
Asn Ile Ser Asp Val Asp Pro Ala His Ala Gln His Tyr Gln Asp Val
20 25 30
Leu Tyr His Ala Lys Ser Gln Lys Leu Gly Asp Ser Glu Ser Val Ser
35 40 45
Lys Val Leu Trp Leu Asp Glu Ile Gln Gln Ala Val Asp Asp Ala Asn
50 55 60
Val Asp Lys Asp Arg Ala Lys Gln Trp Val Thr Leu Val Val Asp Val
65 70 75 80
Asn Gln
<210> 25
<211> 447
<212> DNA
<213> 智人(Homo sapiens)
<220>
<221> CDS
<222> (1)..(447)
<223> NIF-ZFN335_745-893 (466-547)的片段(fragment of NIF-ZFN335_745-893(466-547))
<400> 25
agt tcc cca gga cct cct gag ata ccc cca gag gcg aca act ttc cag 48
Ser Ser Pro Gly Pro Pro Glu Ile Pro Pro Glu Ala Thr Thr Phe Gln
1 5 10 15
tca tct gag gct ccc tca ttg ctc tgt tct gac acc ctg ggc ggc gcc 96
Ser Ser Glu Ala Pro Ser Leu Leu Cys Ser Asp Thr Leu Gly Gly Ala
20 25 30
acc atc atc tac cag caa gga gct gag gag tcg aca gcg atg gcc acg 144
Thr Ile Ile Tyr Gln Gln Gly Ala Glu Glu Ser Thr Ala Met Ala Thr
35 40 45
cag aca gcc ttg gat ctt ctg ctg aac atg agt gct cag cgg gaa ctg 192
Gln Thr Ala Leu Asp Leu Leu Leu Asn Met Ser Ala Gln Arg Glu Leu
50 55 60
ggg ggc aca gcc ctg cag gtg gct gtg gtg aag tcg gaa gat gtg gaa 240
Gly Gly Thr Ala Leu Gln Val Ala Val Val Lys Ser Glu Asp Val Glu
65 70 75 80
gca ggg tta gca tcc cct ggt ggg cag ccc tcc cct gaa ggt gcc act 288
Ala Gly Leu Ala Ser Pro Gly Gly Gln Pro Ser Pro Glu Gly Ala Thr
85 90 95
cca cag gtc gtc acc ctc cac gtg gca gag cca ggg ggc ggt gca gca 336
Pro Gln Val Val Thr Leu His Val Ala Glu Pro Gly Gly Gly Ala Ala
100 105 110
gcc gag agc cag cta ggc cct cct gac cta ccg cag atc acc ctg gca 384
Ala Glu Ser Gln Leu Gly Pro Pro Asp Leu Pro Gln Ile Thr Leu Ala
115 120 125
cct ggt cca ttt ggt ggg act ggc tac agt gtc atc aca gca ccc cct 432
Pro Gly Pro Phe Gly Gly Thr Gly Tyr Ser Val Ile Thr Ala Pro Pro
130 135 140
atg gag gag gga aca 447
Met Glu Glu Gly Thr
145
<210> 26
<211> 149
<212> PRT
<213> 智人(Homo sapiens)
<400> 26
Ser Ser Pro Gly Pro Pro Glu Ile Pro Pro Glu Ala Thr Thr Phe Gln
1 5 10 15
Ser Ser Glu Ala Pro Ser Leu Leu Cys Ser Asp Thr Leu Gly Gly Ala
20 25 30
Thr Ile Ile Tyr Gln Gln Gly Ala Glu Glu Ser Thr Ala Met Ala Thr
35 40 45
Gln Thr Ala Leu Asp Leu Leu Leu Asn Met Ser Ala Gln Arg Glu Leu
50 55 60
Gly Gly Thr Ala Leu Gln Val Ala Val Val Lys Ser Glu Asp Val Glu
65 70 75 80
Ala Gly Leu Ala Ser Pro Gly Gly Gln Pro Ser Pro Glu Gly Ala Thr
85 90 95
Pro Gln Val Val Thr Leu His Val Ala Glu Pro Gly Gly Gly Ala Ala
100 105 110
Ala Glu Ser Gln Leu Gly Pro Pro Asp Leu Pro Gln Ile Thr Leu Ala
115 120 125
Pro Gly Pro Phe Gly Gly Thr Gly Tyr Ser Val Ile Thr Ala Pro Pro
130 135 140
Met Glu Glu Gly Thr
145
<210> 27
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 27
tcgagatgtg atgaaggaga 20
<210> 28
<211> 9228
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 载体1923-2的完整核苷酸序列(Complete nucleotide sequence of vector1923-2)
<220>
<221> misc_feature
<222> (167)..(188)
<223> CAP结合位点(CAP binding site)
<220>
<221> rep_origin
<222> (476)..(1064)
<223> ori
<220>
<221> 基因
<222> (1235)..(2095)
<223> AmpR
<220>
<221> 启动子
<222> (2096)..(2200)
<223> AmpR启动子(AmpR promoter)
<220>
<221> 启动子
<222> (2233)..(2461)
<223> H1 启动子(H1 promoter)
<220>
<221> misc_feature
<222> (2462)..(2481)
<223> 靶(HPRT位点1)(Target (HPRT site 1))
<220>
<221> misc_structure
<222> (2482)..(2557)
<223> tracrRNA
<220>
<221> 增强子
<222> (2572)..(2951)
<223> CMV增强子(CMV enhancer)
<220>
<221> 启动子
<222> (2952)..(3155)
<223> CMV启动子(CMV promoter)
<220>
<221> 启动子
<222> (3200)..(3218)
<223> T7启动子(T7 promoter)
<220>
<221> 基因
<222> (3247)..(3498)
<223> UGI
<220>
<221> misc_feature
<222> (3502)..(3504)
<223> kozac
<220>
<221> misc_feature
<222> (3505)..(3555)
<223> NLS单元(NLS unit)
<220>
<221> misc_feature
<222> (3511)..(3531)
<223> SV40 NLS
<220>
<221> 基因
<222> (3556)..(7692)
<223> nCas9 (D10A)
<220>
<221> misc_feature
<222> (7672)..(7692)
<223> SV40 NLS
<220>
<221> 基因
<222> (7714)..(8262)
<223> dVif
<220>
<221> misc_feature
<222> (7714)..(7722)
<223> CBFβ结合(CBF beta binding)
<220>
<221> misc_feature
<222> (8272)..(8325)
<223> T2A
<220>
<221> 基因
<222> (8332)..(8931)
<223> PuroR
<220>
<221> 聚A信号(polyA_signal)
<222> (9105)..(9226)
<223> SV40聚A信号(SV40 poly(A) signal)
<400> 28
ggccgccacc gcggtggagc tccagctttt gttcccttta gtgagggtta attgcgcgct 60
tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac 120
acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac 180
tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc 240
tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttccg 300
cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc 360
actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt 420
gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc 480
ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa 540
acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc 600
ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg 660
cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc 720
tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc 780
gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca 840
ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact 900
acggctacac tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg 960
gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt 1020
ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct 1080
tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga 1140
gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa 1200
tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac 1260
ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga 1320
taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc 1380
cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca 1440
gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta 1500
gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg 1560
tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc 1620
gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg 1680
ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt 1740
ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt 1800
cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata 1860
ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc 1920
gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac 1980
ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa 2040
ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct 2100
tcctttttca atattattga agcatttatc agggttattg tctcatgagc ggatacatat 2160
ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc 2220
caccggtgta ccaattcgaa cgctgacgtc atcaacccgc tccaaggaat cgcgggccca 2280
gtgtcactag gcgggaacac ccagcgcgcg tgcgccctgg caggaagatg gctgtgaggg 2340
acaggggagt ggcgccctgc aatatttgca tgtcgctatg tgttctggga aatcaccata 2400
aacgtgaaat gtctttggat ttgggaatct tataagttct gtatgaggac cacagatccc 2460
ctcgagatgt gatgaaggag agttttagag ctagaaatag caagttaaaa taaggctagt 2520
ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt ttttacgcgt tgacattgat 2580
tattgactag ttattaatag taatcaatta cggggtcatt agttcatagc ccatatatgg 2640
agttccgcgt tacataactt acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc 2700
gcccattgac gtcaataatg acgtatgttc ccatagtaac gccaataggg actttccatt 2760
gacgtcaatg ggtggagtat ttacggtaaa ctgcccactt ggcagtacat caagtgtatc 2820
atatgccaag tacgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg 2880
cccagtacat gaccttatgg gactttccta cttggcagta catctacgta ttagtcatcg 2940
ctattaccat ggtgatgcgg ttttggcagt acatcaatgg gcgtggatag cggtttgact 3000
cacggggatt tccaagtctc caccccattg acgtcaatgg gagtttgttt tggcaccaaa 3060
atcaacggga ctttccaaaa tgtcgtaaca actccgcccc attgacgcaa atgggcggta 3120
ggcgtgtacg gtgggaggtc tatataagca gagctctctg gctaactaga gaacccactg 3180
cttactggct tatcgaaatt aatacgactc actataggga gacccaagct ggctaggggt 3240
accgaaatga ccaacctttc cgacatcata gagaaggaaa caggcaaaca gttggtcatc 3300
caagagtcga tactcatgct tcctgaagaa gttgaggagg tcattgggaa taagccggaa 3360
agtgacattc tcgtacacac tgcgtatgat gagagcaccg atgagaacgt gatgctgctc 3420
acgtcagatg ccccagagta caaaccctgg gctctggtga ttcaggactc taatggagag 3480
aacaagatca agatgctagc cgaaatggca ccgaagaaga agcgtaaagt cggaatccac 3540
ggagttcctg cggcaatgga caagaagtac tccattgggc tcgctatcgg cacaaacagc 3600
gtcggttggg ccgtcattac ggacgagtac aaggtgccga gcaaaaaatt caaagttctg 3660
ggcaataccg atcgccacag cataaagaag aacctcattg gcgccctcct gttcgactcc 3720
ggggagacgg ccgaagccac gcggctcaaa agaacagcac ggcgcagata tacccgcaga 3780
aagaatcgga tctgctacct gcaggagatc tttagtaatg agatggctaa ggtggatgac 3840
tctttcttcc ataggctgga ggagtccttt ttggtggagg aggataaaaa gcacgagcgc 3900
cacccaatct ttggcaatat cgtggacgag gtggcgtacc atgaaaagta cccaaccata 3960
tatcatctga ggaagaagct tgtagacagt actgataagg ctgacttgcg gttgatctat 4020
ctcgcgctgg cgcatatgat caaatttcgg ggacacttcc tcatcgaggg ggacctgaac 4080
ccagacaaca gcgatgtcga caaactcttt atccaactgg ttcagactta caatcagctt 4140
ttcgaagaga acccgatcaa cgcatccgga gttgacgcca aagcaatcct gagcgctagg 4200
ctgtccaaat cccggcggct cgaaaacctc atcgcacagc tccctgggga gaagaagaac 4260
ggcctgtttg gtaatcttat cgccctgtca ctcgggctga cccccaactt taaatctaac 4320
ttcgacctgg ccgaagatgc caagcttcaa ctgagcaaag acacctacga tgatgatctc 4380
gacaatctgc tggcccagat cggcgaccag tacgcagacc tttttttggc ggcaaagaac 4440
ctgtcagacg ccattctgct gagtgatatt ctgcgagtga acacggagat caccaaagct 4500
ccgctgagcg ctagtatgat caagcgctat gatgagcacc accaagactt gactttgctg 4560
aaggcccttg tcagacagca actgcctgag aagtacaagg aaattttctt cgatcagtct 4620
aaaaatggct acgccggata cattgacggc ggagcaagcc aggaggaatt ttacaaattt 4680
attaagccca tcttggaaaa aatggacggc accgaggagc tgctggtaaa gcttaacaga 4740
gaagatctgt tgcgcaaaca gcgcactttc gacaatggaa gcatccccca ccagattcac 4800
ctgggcgaac tgcacgctat cctcaggcgg caagaggatt tctacccctt tttgaaagat 4860
aacagggaaa agattgagaa aatcctcaca tttcggatac cctactatgt aggccccctc 4920
gcccggggaa attccagatt cgcgtggatg actcgcaaat cagaagagac catcactccc 4980
tggaacttcg aggaagtcgt ggataagggg gcctctgccc agtccttcat cgaaaggatg 5040
actaactttg ataaaaatct gcctaacgaa aaggtgcttc ctaaacactc tctgctgtac 5100
gagtacttca cagtttataa cgagctcacc aaggtcaaat acgtcacaga agggatgaga 5160
aagccagcat tcctgtctgg agagcagaag aaagctatcg tggacctcct cttcaagacg 5220
aaccggaaag ttaccgtgaa acagctcaaa gaagactatt tcaaaaagat tgaatgtttc 5280
gactctgttg aaatcagcgg agtggaggat cgcttcaacg catccctggg aacgtatcac 5340
gatctcctga aaatcattaa agacaaggac ttcctggaca atgaggagaa cgaggacatt 5400
cttgaggaca ttgtcctcac ccttacgttg tttgaagata gggagatgat tgaagaacgc 5460
ttgaaaactt acgctcatct cttcgacgac aaagtcatga aacagctcaa gaggcgccga 5520
tatacaggat gggggcggct gtcaagaaaa ctgatcaatg ggatccgaga caagcagagt 5580
ggaaagacaa tcctggattt tcttaagtcc gatggatttg ccaaccggaa cttcatgcag 5640
ttgatccatg atgactctct cacctttaag gaggacatcc agaaagcaca agtttctggc 5700
cagggggaca gtcttcacga gcacatcgct aatcttgcag gtagcccagc tatcaaaaag 5760
ggaatactgc agaccgttaa ggtcgtggat gaactcgtca aagtaatggg aaggcataag 5820
cccgagaata tcgttatcga gatggcccga gagaaccaaa ctacccagaa gggacagaag 5880
aacagtaggg aaaggatgaa gaggattgaa gagggtataa aagaactggg gtcccaaatc 5940
cttaaggaac acccagttga aaacacccag cttcagaatg agaagctcta cctgtactac 6000
ctgcagaacg gcagggacat gtacgtggat caggaactgg acatcaatcg gctctccgac 6060
tacgacgtgg atcatatcgt gccccagtct tttctcaaag atgattctat tgataataaa 6120
gtgttgacaa gatccgataa aaatagaggg aagagtgata acgtcccctc agaagaagtt 6180
gtcaagaaaa tgaaaaatta ttggcggcag ctgctgaacg ccaaactgat cacacaacgg 6240
aagttcgata atctgactaa ggctgaacga ggtggcctgt ctgagttgga taaagccggc 6300
ttcatcaaaa ggcagcttgt tgagacacgc cagatcacca agcacgtggc ccaaattctc 6360
gattcacgca tgaacaccaa gtacgatgaa aatgacaaac tgattcgaga ggtgaaagtt 6420
attactctga agtctaagct ggtctcagat ttcagaaagg actttcagtt ttataaggtg 6480
agagagatca acaattacca ccatgcgcat gatgcctacc tgaatgcagt ggtaggcact 6540
gcacttatca aaaaatatcc caagcttgaa tctgaatttg tttacggaga ctataaagtg 6600
tacgatgtta ggaaaatgat cgcaaagtct gagcaggaaa taggcaaggc caccgctaag 6660
tacttctttt acagcaatat tatgaatttt ttcaagaccg agattacact ggccaatgga 6720
gagattcgga agcgaccact tatcgaaaca aacggagaaa caggagaaat cgtgtgggac 6780
aagggtaggg atttcgcgac agtccggaag gtcctgtcca tgccgcaggt gaacatcgtt 6840
aaaaagaccg aagtacagac cggaggcttc tccaaggaaa gtatcctccc gaaaaggaac 6900
agcgacaagc tgatcgcacg caaaaaagat tgggacccca agaaatacgg cggattcgat 6960
tctcctacag tcgcttacag tgtactggtt gtggccaaag tggagaaagg gaagtctaaa 7020
aaactcaaaa gcgtcaagga actgctgggc atcacaatca tggagcgatc aagcttcgaa 7080
aaaaacccca tcgactttct cgaggcgaaa ggatataaag aggtcaaaaa agacctcatc 7140
attaagcttc ccaagtactc tctctttgag cttgaaaacg gccggaaacg aatgctcgct 7200
agtgcgggcg agctgcagaa aggtaacgag ctggcactgc cctctaaata cgttaatttc 7260
ttgtatctgg ccagccacta tgaaaagctc aaagggtctc ccgaagataa tgagcagaag 7320
cagctgttcg tggaacaaca caaacactac cttgatgaga tcatcgagca aataagcgaa 7380
ttctccaaaa gagtgatcct cgccgacgct aacctcgata aggtgctttc tgcttacaat 7440
aagcacaggg ataagcccat cagggagcag gcagaaaaca ttatccactt gtttactctg 7500
accaacttgg gcgcgcctgc agccttcaag tacttcgaca ccaccataga cagaaagcgg 7560
tacacctcta caaaggaggt cctggacgcc acactgattc atcagtcaat tacggggctc 7620
tatgaaacaa gaatcgacct ctctcagctc ggtggagaca gcagggctga ccccaagaag 7680
aagaggaagg tgggtggagg aggtaccgaa atggtgtggc aagtagacag gatgaggatt 7740
agaacatgga acagtttagt aaaacatcac atgtatatct caaagaaagc aaaaaattgg 7800
ttttatagac atcactttga aagcagtcat ccaagagtaa gttcagaagt acacatccca 7860
ctaggggatg ctagattagt agtaagaaca tattggggtc tgcatacagg agaaaaagat 7920
tggcacttgg gtaatggggt gtccatagaa tggagactaa gaagatatag cacacaaata 7980
gatcctgacc tggcagacca actaattcat ctgcattatt ttaattgttt ttcagactct 8040
gccataagga aagccatatt aggacaagta gttagaccta gatgtgacta tcaagcagga 8100
cataacaagg taggatctgc tcaatatttg gcactgaaag cattagtaac accagtaagg 8160
acaaggccac ctttgcctag tgttaggaaa ttagcagagg acagatggaa caagccccag 8220
aaaaccaggg gtcccagagg gagccataca atgaatggac atgctaggac cgaaggcagg 8280
ggaagccttc tgacttgtgg ggatgtggaa gaaaaccctg gtccatctag aatgaccgag 8340
tacaagccca cggtgcgcct cgccacccgc gacgacgtcc cccgggccgt acgcaccctc 8400
gccgccgcgt tcgccgacta ccccgccacg cgccacaccg tcgacccgga ccgccacatc 8460
gagcgggtca ccgagctgca agaactcttc ctcacgcgcg tcgggctcga catcggcaag 8520
gtgtgggtcg cggacgacgg cgccgcggtg gcggtctgga ccacgccgga gagcgtcgaa 8580
gcgggggcgg tgttcgccga gatcggcccg cgcatggccg agttgagcgg ttcccggctg 8640
gccgcgcagc aacagatgga aggcctcctg gcgccgcacc ggcccaagga gcccgcgtgg 8700
ttcctggcca ccgtcggcgt ctcgcccgac caccagggca agggtctggg cagcgccgtc 8760
gtgctccccg gagtggaggc ggccgagcgc gccggggtgc ccgccttcct ggagacctcc 8820
gcgccccgca acctcccctt ctacgagcgg ctcggcttca ccgtcaccgc cgacgtcgag 8880
gtgcccgaag gaccgcgcac ctggtgcatg acccgcaagc ccggtgcctg agcgggactc 8940
tggggttcga aatgaccgac caagcgacgc ccaacctgcc atcacgagat ttcgattcca 9000
ccgccgcctt ctatgaaagg ttgggcttcg gaatcgtttt ccgggacgcc ggctggatga 9060
tcctccagcg cggggatctc atgctggagt tcttcgccca ccccaacttg tttattgcag 9120
cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt 9180
cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttagc 9228
<210> 29
<211> 9198
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 载体1924-2的完整核苷酸序列(Complete nucleotide sequence of vector1924-2)
<220>
<221> rep_origin
<222> (476)..(1064)
<223> ori
<220>
<221> 基因
<222> (1235)..(2095)
<223> AmpR
<220>
<221> 启动子
<222> (2096)..(2200)
<223> AmpR启动子(AmpR promoter)
<220>
<221> 启动子
<222> (2233)..(2461)
<223> H1 启动子(H1 promoter)
<220>
<221> 基因
<222> (2462)..(2481)
<223> HPRT外显子(HPRT exon)
<220>
<221> misc_feature
<222> (2462)..(2481)
<223> 靶(HPRT位点1)(Target (HPRT site 1))
<220>
<221> misc_structure
<222> (2482)..(2557)
<223> tracrRNA
<220>
<221> 增强子
<222> (2572)..(2951)
<223> CMV增强子(CMV enhancer)
<220>
<221> 启动子
<222> (2952)..(3155)
<223> CMV启动子(CMV promoter)
<220>
<221> 启动子
<222> (3200)..(3218)
<223> T7启动子(T7 promoter)
<220>
<221> 基因
<222> (3250)..(3798)
<223> dVif
<220>
<221> misc_feature
<222> (3250)..(3258)
<223> CBFβ结合(CBF beta binding)
<220>
<221> misc_feature
<222> (3805)..(3807)
<223> kozac
<220>
<221> misc_feature
<222> (3808)..(3858)
<223> NLS单元(NLS unit)
<220>
<221> misc_feature
<222> (3814)..(3834)
<223> SV40 NLS
<220>
<221> 基因
<222> (3859)..(7962)
<223> nCas9 (D10A)
<220>
<221> misc_feature
<222> (7963)..(7983)
<223> SV40 NLS
<220>
<221> 基因
<222> (7990)..(8241)
<223> UGI
<220>
<221> misc_feature
<222> (8242)..(8295)
<223> T2A
<220>
<221> 基因
<222> (8302)..(8901)
<223> PuroR
<220>
<221> 聚A信号(polyA_signal)
<222> (9075)..(9196)
<223> SV40聚A信号(SV40 poly(A) signal)
<400> 29
ggccgccacc gcggtggagc tccagctttt gttcccttta gtgagggtta attgcgcgct 60
tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac 120
acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac 180
tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc 240
tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttccg 300
cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc 360
actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt 420
gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc 480
ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa 540
acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc 600
ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg 660
cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc 720
tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc 780
gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca 840
ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact 900
acggctacac tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg 960
gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt 1020
ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct 1080
tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga 1140
gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa 1200
tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac 1260
ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga 1320
taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc 1380
cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca 1440
gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta 1500
gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg 1560
tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc 1620
gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg 1680
ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt 1740
ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt 1800
cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata 1860
ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc 1920
gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac 1980
ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa 2040
ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct 2100
tcctttttca atattattga agcatttatc agggttattg tctcatgagc ggatacatat 2160
ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc 2220
caccggtgta ccaattcgaa cgctgacgtc atcaacccgc tccaaggaat cgcgggccca 2280
gtgtcactag gcgggaacac ccagcgcgcg tgcgccctgg caggaagatg gctgtgaggg 2340
acaggggagt ggcgccctgc aatatttgca tgtcgctatg tgttctggga aatcaccata 2400
aacgtgaaat gtctttggat ttgggaatct tataagttct gtatgaggac cacagatccc 2460
ctcgagatgt gatgaaggag agttttagag ctagaaatag caagttaaaa taaggctagt 2520
ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt ttttacgcgt tgacattgat 2580
tattgactag ttattaatag taatcaatta cggggtcatt agttcatagc ccatatatgg 2640
agttccgcgt tacataactt acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc 2700
gcccattgac gtcaataatg acgtatgttc ccatagtaac gccaataggg actttccatt 2760
gacgtcaatg ggtggagtat ttacggtaaa ctgcccactt ggcagtacat caagtgtatc 2820
atatgccaag tacgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg 2880
cccagtacat gaccttatgg gactttccta cttggcagta catctacgta ttagtcatcg 2940
ctattaccat ggtgatgcgg ttttggcagt acatcaatgg gcgtggatag cggtttgact 3000
cacggggatt tccaagtctc caccccattg acgtcaatgg gagtttgttt tggcaccaaa 3060
atcaacggga ctttccaaaa tgtcgtaaca actccgcccc attgacgcaa atgggcggta 3120
ggcgtgtacg gtgggaggtc tatataagca gagctctctg gctaactaga gaacccactg 3180
cttactggct tatcgaaatt aatacgactc actataggga gacccaagct ggctaggggt 3240
accgaaatgg tgtggcaagt agacaggatg aggattagaa catggaacag tttagtaaaa 3300
catcacatgt atatctcaaa gaaagcaaaa aattggtttt atagacatca ctttgaaagc 3360
agtcatccaa gagtaagttc agaagtacac atcccactag gggatgctag attagtagta 3420
agaacatatt ggggtctgca tacaggagaa aaagattggc acttgggtaa tggggtgtcc 3480
atagaatgga gactaagaag atatagcaca caaatagatc ctgacctggc agaccaacta 3540
attcatctgc attattttaa ttgtttttca gactctgcca taaggaaagc catattagga 3600
caagtagtta gacctagatg tgactatcaa gcaggacata acaaggtagg atctgctcaa 3660
tatttggcac tgaaagcatt agtaacacca gtaaggacaa ggccaccttt gcctagtgtt 3720
aggaaattag cagaggacag atggaacaag ccccagaaaa ccaggggtcc cagagggagc 3780
catacaatga atggacatgc tagcgaaatg gcaccgaaga agaagcgtaa agtcggaatc 3840
cacggagttc ctgcggcaat ggacaagaag tactccattg ggctcgctat cggcacaaac 3900
agcgtcggtt gggccgtcat tacggacgag tacaaggtgc cgagcaaaaa attcaaagtt 3960
ctgggcaata ccgatcgcca cagcataaag aagaacctca ttggcgccct cctgttcgac 4020
tccggggaga cggccgaagc cacgcggctc aaaagaacag cacggcgcag atatacccgc 4080
agaaagaatc ggatctgcta cctgcaggag atctttagta atgagatggc taaggtggat 4140
gactctttct tccataggct ggaggagtcc tttttggtgg aggaggataa aaagcacgag 4200
cgccacccaa tctttggcaa tatcgtggac gaggtggcgt accatgaaaa gtacccaacc 4260
atatatcatc tgaggaagaa gcttgtagac agtactgata aggctgactt gcggttgatc 4320
tatctcgcgc tggcgcatat gatcaaattt cggggacact tcctcatcga gggggacctg 4380
aacccagaca acagcgatgt cgacaaactc tttatccaac tggttcagac ttacaatcag 4440
cttttcgaag agaacccgat caacgcatcc ggagttgacg ccaaagcaat cctgagcgct 4500
aggctgtcca aatcccggcg gctcgaaaac ctcatcgcac agctccctgg ggagaagaag 4560
aacggcctgt ttggtaatct tatcgccctg tcactcgggc tgacccccaa ctttaaatct 4620
aacttcgacc tggccgaaga tgccaagctt caactgagca aagacaccta cgatgatgat 4680
ctcgacaatc tgctggccca gatcggcgac cagtacgcag accttttttt ggcggcaaag 4740
aacctgtcag acgccattct gctgagtgat attctgcgag tgaacacgga gatcaccaaa 4800
gctccgctga gcgctagtat gatcaagcgc tatgatgagc accaccaaga cttgactttg 4860
ctgaaggccc ttgtcagaca gcaactgcct gagaagtaca aggaaatttt cttcgatcag 4920
tctaaaaatg gctacgccgg atacattgac ggcggagcaa gccaggagga attttacaaa 4980
tttattaagc ccatcttgga aaaaatggac ggcaccgagg agctgctggt aaagcttaac 5040
agagaagatc tgttgcgcaa acagcgcact ttcgacaatg gaagcatccc ccaccagatt 5100
cacctgggcg aactgcacgc tatcctcagg cggcaagagg atttctaccc ctttttgaaa 5160
gataacaggg aaaagattga gaaaatcctc acatttcgga taccctacta tgtaggcccc 5220
ctcgcccggg gaaattccag attcgcgtgg atgactcgca aatcagaaga gaccatcact 5280
ccctggaact tcgaggaagt cgtggataag ggggcctctg cccagtcctt catcgaaagg 5340
atgactaact ttgataaaaa tctgcctaac gaaaaggtgc ttcctaaaca ctctctgctg 5400
tacgagtact tcacagttta taacgagctc accaaggtca aatacgtcac agaagggatg 5460
agaaagccag cattcctgtc tggagagcag aagaaagcta tcgtggacct cctcttcaag 5520
acgaaccgga aagttaccgt gaaacagctc aaagaagact atttcaaaaa gattgaatgt 5580
ttcgactctg ttgaaatcag cggagtggag gatcgcttca acgcatccct gggaacgtat 5640
cacgatctcc tgaaaatcat taaagacaag gacttcctgg acaatgagga gaacgaggac 5700
attcttgagg acattgtcct cacccttacg ttgtttgaag atagggagat gattgaagaa 5760
cgcttgaaaa cttacgctca tctcttcgac gacaaagtca tgaaacagct caagaggcgc 5820
cgatatacag gatgggggcg gctgtcaaga aaactgatca atgggatccg agacaagcag 5880
agtggaaaga caatcctgga ttttcttaag tccgatggat ttgccaaccg gaacttcatg 5940
cagttgatcc atgatgactc tctcaccttt aaggaggaca tccagaaagc acaagtttct 6000
ggccaggggg acagtcttca cgagcacatc gctaatcttg caggtagccc agctatcaaa 6060
aagggaatac tgcagaccgt taaggtcgtg gatgaactcg tcaaagtaat gggaaggcat 6120
aagcccgaga atatcgttat cgagatggcc cgagagaacc aaactaccca gaagggacag 6180
aagaacagta gggaaaggat gaagaggatt gaagagggta taaaagaact ggggtcccaa 6240
atccttaagg aacacccagt tgaaaacacc cagcttcaga atgagaagct ctacctgtac 6300
tacctgcaga acggcaggga catgtacgtg gatcaggaac tggacatcaa tcggctctcc 6360
gactacgacg tggatcatat cgtgccccag tcttttctca aagatgattc tattgataat 6420
aaagtgttga caagatccga taaaaataga gggaagagtg ataacgtccc ctcagaagaa 6480
gttgtcaaga aaatgaaaaa ttattggcgg cagctgctga acgccaaact gatcacacaa 6540
cggaagttcg ataatctgac taaggctgaa cgaggtggcc tgtctgagtt ggataaagcc 6600
ggcttcatca aaaggcagct tgttgagaca cgccagatca ccaagcacgt ggcccaaatt 6660
ctcgattcac gcatgaacac caagtacgat gaaaatgaca aactgattcg agaggtgaaa 6720
gttattactc tgaagtctaa gctggtctca gatttcagaa aggactttca gttttataag 6780
gtgagagaga tcaacaatta ccaccatgcg catgatgcct acctgaatgc agtggtaggc 6840
actgcactta tcaaaaaata tcccaagctt gaatctgaat ttgtttacgg agactataaa 6900
gtgtacgatg ttaggaaaat gatcgcaaag tctgagcagg aaataggcaa ggccaccgct 6960
aagtacttct tttacagcaa tattatgaat tttttcaaga ccgagattac actggccaat 7020
ggagagattc ggaagcgacc acttatcgaa acaaacggag aaacaggaga aatcgtgtgg 7080
gacaagggta gggatttcgc gacagtccgg aaggtcctgt ccatgccgca ggtgaacatc 7140
gttaaaaaga ccgaagtaca gaccggaggc ttctccaagg aaagtatcct cccgaaaagg 7200
aacagcgaca agctgatcgc acgcaaaaaa gattgggacc ccaagaaata cggcggattc 7260
gattctccta cagtcgctta cagtgtactg gttgtggcca aagtggagaa agggaagtct 7320
aaaaaactca aaagcgtcaa ggaactgctg ggcatcacaa tcatggagcg atcaagcttc 7380
gaaaaaaacc ccatcgactt tctcgaggcg aaaggatata aagaggtcaa aaaagacctc 7440
atcattaagc ttcccaagta ctctctcttt gagcttgaaa acggccggaa acgaatgctc 7500
gctagtgcgg gcgagctgca gaaaggtaac gagctggcac tgccctctaa atacgttaat 7560
ttcttgtatc tggccagcca ctatgaaaag ctcaaagggt ctcccgaaga taatgagcag 7620
aagcagctgt tcgtggaaca acacaaacac taccttgatg agatcatcga gcaaataagc 7680
gaattctcca aaagagtgat cctcgccgac gctaacctcg ataaggtgct ttctgcttac 7740
aataagcaca gggataagcc catcagggag caggcagaaa acattatcca cttgtttact 7800
ctgaccaact tgggcgcgcc tgcagccttc aagtacttcg acaccaccat agacagaaag 7860
cggtacacct ctacaaagga ggtcctggac gccacactga ttcatcagtc aattacgggg 7920
ctctatgaaa caagaatcga cctctctcag ctcggtggag accccaagaa gaaaagaaaa 7980
gtcggtacca tgaccaacct ttccgacatc atagagaagg aaacaggcaa acagttggtc 8040
atccaagagt cgatactcat gcttcctgaa gaagttgagg aggtcattgg gaataagccg 8100
gaaagtgaca ttctcgtaca cactgcgtat gatgagagca ccgatgagaa cgtgatgctg 8160
ctcacgtcag atgccccaga gtacaaaccc tgggctctgg tgattcagga ctctaatgga 8220
gagaacaaga tcaagatgct agaaggcagg ggaagccttc tgacttgtgg ggatgtggaa 8280
gaaaaccctg gtccatctag aatgaccgag tacaagccca cggtgcgcct cgccacccgc 8340
gacgacgtcc cccgggccgt acgcaccctc gccgccgcgt tcgccgacta ccccgccacg 8400
cgccacaccg tcgacccgga ccgccacatc gagcgggtca ccgagctgca agaactcttc 8460
ctcacgcgcg tcgggctcga catcggcaag gtgtgggtcg cggacgacgg cgccgcggtg 8520
gcggtctgga ccacgccgga gagcgtcgaa gcgggggcgg tgttcgccga gatcggcccg 8580
cgcatggccg agttgagcgg ttcccggctg gccgcgcagc aacagatgga aggcctcctg 8640
gcgccgcacc ggcccaagga gcccgcgtgg ttcctggcca ccgtcggcgt ctcgcccgac 8700
caccagggca agggtctggg cagcgccgtc gtgctccccg gagtggaggc ggccgagcgc 8760
gccggggtgc ccgccttcct ggagacctcc gcgccccgca acctcccctt ctacgagcgg 8820
ctcggcttca ccgtcaccgc cgacgtcgag gtgcccgaag gaccgcgcac ctggtgcatg 8880
acccgcaagc ccggtgcctg agcgggactc tggggttcga aatgaccgac caagcgacgc 8940
ccaacctgcc atcacgagat ttcgattcca ccgccgcctt ctatgaaagg ttgggcttcg 9000
gaatcgtttt ccgggacgcc ggctggatga tcctccagcg cggggatctc atgctggagt 9060
tcttcgccca ccccaacttg tttattgcag cttataatgg ttacaaataa agcaatagca 9120
tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac 9180
tcatcaatgt atcttagc 9198
<210> 30
<211> 8859
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 载体1931的完整核苷酸序列(Complete nucleotide sequence of vector1931)
<220>
<221> rep_origin
<222> (476)..(1064)
<223> ori
<220>
<221> 基因
<222> (1235)..(2095)
<223> AmpR
<220>
<221> 启动子
<222> (2096)..(2200)
<223> AmpR启动子(AmpR promoter)
<220>
<221> 启动子
<222> (2233)..(2461)
<223> H1 启动子(H1 promoter)
<220>
<221> misc_feature
<222> (2462)..(2481)
<223> 靶(HPRT位点1)(Target (HPRT site 1))
<220>
<221> misc_structure
<222> (2482)..(2557)
<223> tracrRNA
<220>
<221> 增强子
<222> (2572)..(2951)
<223> CMV增强子(CMV enhancer)
<220>
<221> 启动子
<222> (2952)..(3155)
<223> CMV启动子(CMV promoter)
<220>
<221> 基因
<222> (3253)..(3672)
<223> TopBv2 (452-591)的片段(fragment of TopBv2 (452-591))
<220>
<221> misc_feature
<222> (3691)..(3741)
<223> NLS单元(NLS unit)
<220>
<221> misc_feature
<222> (3697)..(3717)
<223> SV40 NLS
<220>
<221> 基因
<222> (3742)..(7878)
<223> nCas9 (D10A)
<220>
<221> misc_feature
<222> (7858)..(7878)
<223> SV40 NLS
<220>
<221> misc_feature
<222> (7903)..(7956)
<223> T2A
<220>
<221> 基因
<222> (7963)..(8562)
<223> PuroR
<220>
<221> 聚A信号(polyA_signal)
<222> (8736)..(8857)
<223> SV40聚A信号(SV40 poly(A) signal)
<400> 30
ggccgccacc gcggtggagc tccagctttt gttcccttta gtgagggtta attgcgcgct 60
tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac 120
acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac 180
tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc 240
tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttccg 300
cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc 360
actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt 420
gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc 480
ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa 540
acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc 600
ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg 660
cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc 720
tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc 780
gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca 840
ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact 900
acggctacac tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg 960
gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt 1020
ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct 1080
tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga 1140
gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa 1200
tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac 1260
ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga 1320
taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc 1380
cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca 1440
gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta 1500
gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg 1560
tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc 1620
gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg 1680
ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt 1740
ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt 1800
cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata 1860
ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc 1920
gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac 1980
ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa 2040
ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct 2100
tcctttttca atattattga agcatttatc agggttattg tctcatgagc ggatacatat 2160
ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc 2220
caccggtgta ccaattcgaa cgctgacgtc atcaacccgc tccaaggaat cgcgggccca 2280
gtgtcactag gcgggaacac ccagcgcgcg tgcgccctgg caggaagatg gctgtgaggg 2340
acaggggagt ggcgccctgc aatatttgca tgtcgctatg tgttctggga aatcaccata 2400
aacgtgaaat gtctttggat ttgggaatct tataagttct gtatgaggac cacagatccc 2460
ctcgagatgt gatgaaggag agttttagag ctagaaatag caagttaaaa taaggctagt 2520
ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt ttttacgcgt tgacattgat 2580
tattgactag ttattaatag taatcaatta cggggtcatt agttcatagc ccatatatgg 2640
agttccgcgt tacataactt acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc 2700
gcccattgac gtcaataatg acgtatgttc ccatagtaac gccaataggg actttccatt 2760
gacgtcaatg ggtggagtat ttacggtaaa ctgcccactt ggcagtacat caagtgtatc 2820
atatgccaag tacgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg 2880
cccagtacat gaccttatgg gactttccta cttggcagta catctacgta ttagtcatcg 2940
ctattaccat ggtgatgcgg ttttggcagt acatcaatgg gcgtggatag cggtttgact 3000
cacggggatt tccaagtctc caccccattg acgtcaatgg gagtttgttt tggcaccaaa 3060
atcaacggga ctttccaaaa tgtcgtaaca actccgcccc attgacgcaa atgggcggta 3120
ggcgtgtacg gtgggaggtc tatataagca gagctctctg gctaactaga gaacccactg 3180
cttactggct tatcgaaatt aatacgactc actataggga gacccaagct ggctagcgaa 3240
atgggtaccg gaaaaggtat tcccaaactg gatgatgcta atgatgctgg tggtaaacat 3300
tccctggagt gtacactgat attaacagag ggagactctg ccaaatcact ggctgtgtct 3360
ggattaggtg tgattggacg agacagatac ggagtttttc cactcagggg caaaattctt 3420
aatgtacggg aagcttctca taaacagatc atggaaaatg ctgaaataaa taatattatt 3480
aaaatagttg gtctacaata taagaaaagt tacgatgatg cagaatctct gaaaacctta 3540
cgctatggaa agattatgat tatgaccgat caggatcaag atggttctca cataaaaggc 3600
ctgcttatta atttcatcca tcacaattgg ccatcacttt tgaagcatgg ttttcttgaa 3660
gagttcatta ctggaggtga ccctagcgaa atggcaccga agaagaagcg taaagtcgga 3720
atccacggag ttcctgcggc aatggacaag aagtactcca ttgggctcgc tatcggcaca 3780
aacagcgtcg gttgggccgt cattacggac gagtacaagg tgccgagcaa aaaattcaaa 3840
gttctgggca ataccgatcg ccacagcata aagaagaacc tcattggcgc cctcctgttc 3900
gactccgggg agacggccga agccacgcgg ctcaaaagaa cagcacggcg cagatatacc 3960
cgcagaaaga atcggatctg ctacctgcag gagatcttta gtaatgagat ggctaaggtg 4020
gatgactctt tcttccatag gctggaggag tcctttttgg tggaggagga taaaaagcac 4080
gagcgccacc caatctttgg caatatcgtg gacgaggtgg cgtaccatga aaagtaccca 4140
accatatatc atctgaggaa gaagcttgta gacagtactg ataaggctga cttgcggttg 4200
atctatctcg cgctggcgca tatgatcaaa tttcggggac acttcctcat cgagggggac 4260
ctgaacccag acaacagcga tgtcgacaaa ctctttatcc aactggttca gacttacaat 4320
cagcttttcg aagagaaccc gatcaacgca tccggagttg acgccaaagc aatcctgagc 4380
gctaggctgt ccaaatcccg gcggctcgaa aacctcatcg cacagctccc tggggagaag 4440
aagaacggcc tgtttggtaa tcttatcgcc ctgtcactcg ggctgacccc caactttaaa 4500
tctaacttcg acctggccga agatgccaag cttcaactga gcaaagacac ctacgatgat 4560
gatctcgaca atctgctggc ccagatcggc gaccagtacg cagacctttt tttggcggca 4620
aagaacctgt cagacgccat tctgctgagt gatattctgc gagtgaacac ggagatcacc 4680
aaagctccgc tgagcgctag tatgatcaag cgctatgatg agcaccacca agacttgact 4740
ttgctgaagg cccttgtcag acagcaactg cctgagaagt acaaggaaat tttcttcgat 4800
cagtctaaaa atggctacgc cggatacatt gacggcggag caagccagga ggaattttac 4860
aaatttatta agcccatctt ggaaaaaatg gacggcaccg aggagctgct ggtaaagctt 4920
aacagagaag atctgttgcg caaacagcgc actttcgaca atggaagcat cccccaccag 4980
attcacctgg gcgaactgca cgctatcctc aggcggcaag aggatttcta cccctttttg 5040
aaagataaca gggaaaagat tgagaaaatc ctcacatttc ggatacccta ctatgtaggc 5100
cccctcgccc ggggaaattc cagattcgcg tggatgactc gcaaatcaga agagaccatc 5160
actccctgga acttcgagga agtcgtggat aagggggcct ctgcccagtc cttcatcgaa 5220
aggatgacta actttgataa aaatctgcct aacgaaaagg tgcttcctaa acactctctg 5280
ctgtacgagt acttcacagt ttataacgag ctcaccaagg tcaaatacgt cacagaaggg 5340
atgagaaagc cagcattcct gtctggagag cagaagaaag ctatcgtgga cctcctcttc 5400
aagacgaacc ggaaagttac cgtgaaacag ctcaaagaag actatttcaa aaagattgaa 5460
tgtttcgact ctgttgaaat cagcggagtg gaggatcgct tcaacgcatc cctgggaacg 5520
tatcacgatc tcctgaaaat cattaaagac aaggacttcc tggacaatga ggagaacgag 5580
gacattcttg aggacattgt cctcaccctt acgttgtttg aagataggga gatgattgaa 5640
gaacgcttga aaacttacgc tcatctcttc gacgacaaag tcatgaaaca gctcaagagg 5700
cgccgatata caggatgggg gcggctgtca agaaaactga tcaatgggat ccgagacaag 5760
cagagtggaa agacaatcct ggattttctt aagtccgatg gatttgccaa ccggaacttc 5820
atgcagttga tccatgatga ctctctcacc tttaaggagg acatccagaa agcacaagtt 5880
tctggccagg gggacagtct tcacgagcac atcgctaatc ttgcaggtag cccagctatc 5940
aaaaagggaa tactgcagac cgttaaggtc gtggatgaac tcgtcaaagt aatgggaagg 6000
cataagcccg agaatatcgt tatcgagatg gcccgagaga accaaactac ccagaaggga 6060
cagaagaaca gtagggaaag gatgaagagg attgaagagg gtataaaaga actggggtcc 6120
caaatcctta aggaacaccc agttgaaaac acccagcttc agaatgagaa gctctacctg 6180
tactacctgc agaacggcag ggacatgtac gtggatcagg aactggacat caatcggctc 6240
tccgactacg acgtggatca tatcgtgccc cagtcttttc tcaaagatga ttctattgat 6300
aataaagtgt tgacaagatc cgataaaaat agagggaaga gtgataacgt cccctcagaa 6360
gaagttgtca agaaaatgaa aaattattgg cggcagctgc tgaacgccaa actgatcaca 6420
caacggaagt tcgataatct gactaaggct gaacgaggtg gcctgtctga gttggataaa 6480
gccggcttca tcaaaaggca gcttgttgag acacgccaga tcaccaagca cgtggcccaa 6540
attctcgatt cacgcatgaa caccaagtac gatgaaaatg acaaactgat tcgagaggtg 6600
aaagttatta ctctgaagtc taagctggtc tcagatttca gaaaggactt tcagttttat 6660
aaggtgagag agatcaacaa ttaccaccat gcgcatgatg cctacctgaa tgcagtggta 6720
ggcactgcac ttatcaaaaa atatcccaag cttgaatctg aatttgttta cggagactat 6780
aaagtgtacg atgttaggaa aatgatcgca aagtctgagc aggaaatagg caaggccacc 6840
gctaagtact tcttttacag caatattatg aattttttca agaccgagat tacactggcc 6900
aatggagaga ttcggaagcg accacttatc gaaacaaacg gagaaacagg agaaatcgtg 6960
tgggacaagg gtagggattt cgcgacagtc cggaaggtcc tgtccatgcc gcaggtgaac 7020
atcgttaaaa agaccgaagt acagaccgga ggcttctcca aggaaagtat cctcccgaaa 7080
aggaacagcg acaagctgat cgcacgcaaa aaagattggg accccaagaa atacggcgga 7140
ttcgattctc ctacagtcgc ttacagtgta ctggttgtgg ccaaagtgga gaaagggaag 7200
tctaaaaaac tcaaaagcgt caaggaactg ctgggcatca caatcatgga gcgatcaagc 7260
ttcgaaaaaa accccatcga ctttctcgag gcgaaaggat ataaagaggt caaaaaagac 7320
ctcatcatta agcttcccaa gtactctctc tttgagcttg aaaacggccg gaaacgaatg 7380
ctcgctagtg cgggcgagct gcagaaaggt aacgagctgg cactgccctc taaatacgtt 7440
aatttcttgt atctggccag ccactatgaa aagctcaaag ggtctcccga agataatgag 7500
cagaagcagc tgttcgtgga acaacacaaa cactaccttg atgagatcat cgagcaaata 7560
agcgaattct ccaaaagagt gatcctcgcc gacgctaacc tcgataaggt gctttctgct 7620
tacaataagc acagggataa gcccatcagg gagcaggcag aaaacattat ccacttgttt 7680
actctgacca acttgggcgc gcctgcagcc ttcaagtact tcgacaccac catagacaga 7740
aagcggtaca cctctacaaa ggaggtcctg gacgccacac tgattcatca gtcaattacg 7800
gggctctatg aaacaagaat cgacctctct cagctcggtg gagacagcag ggctgacccc 7860
aagaagaaga ggaaggtggg tggaggaggt acccctagga ccgaaggcag gggaagcctt 7920
ctgacttgtg gggatgtgga agaaaaccct ggtccatcta gaatgaccga gtacaagccc 7980
acggtgcgcc tcgccacccg cgacgacgtc ccccgggccg tacgcaccct cgccgccgcg 8040
ttcgccgact accccgccac gcgccacacc gtcgacccgg accgccacat cgagcgggtc 8100
accgagctgc aagaactctt cctcacgcgc gtcgggctcg acatcggcaa ggtgtgggtc 8160
gcggacgacg gcgccgcggt ggcggtctgg accacgccgg agagcgtcga agcgggggcg 8220
gtgttcgccg agatcggccc gcgcatggcc gagttgagcg gttcccggct ggccgcgcag 8280
caacagatgg aaggcctcct ggcgccgcac cggcccaagg agcccgcgtg gttcctggcc 8340
accgtcggcg tctcgcccga ccaccagggc aagggtctgg gcagcgccgt cgtgctcccc 8400
ggagtggagg cggccgagcg cgccggggtg cccgccttcc tggagacctc cgcgccccgc 8460
aacctcccct tctacgagcg gctcggcttc accgtcaccg ccgacgtcga ggtgcccgaa 8520
ggaccgcgca cctggtgcat gacccgcaag cccggtgcct gagcgggact ctggggttcg 8580
aaatgaccga ccaagcgacg cccaacctgc catcacgaga tttcgattcc accgccgcct 8640
tctatgaaag gttgggcttc ggaatcgttt tccgggacgc cggctggatg atcctccagc 8700
gcggggatct catgctggag ttcttcgccc accccaactt gtttattgca gcttataatg 8760
gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt tcactgcatt 8820
ctagttgtgg tttgtccaaa ctcatcaatg tatcttagc 8859
<210> 31
<211> 9141
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 载体1932的完整核苷酸序列(Complete nucleotide sequence of vector1932)
<220>
<221> rep_origin
<222> (476)..(1064)
<223> ori
<220>
<221> 基因
<222> (1235)..(2095)
<223> AmpR
<220>
<221> 启动子
<222> (2096)..(2200)
<223> AmpR启动子(AmpR promoter)
<220>
<221> 启动子
<222> (2233)..(2461)
<223> H1 启动子(H1 promoter)
<220>
<221> misc_feature
<222> (2462)..(2481)
<223> 靶(HPRT位点1)(Target (HPRT site 1))
<220>
<221> misc_structure
<222> (2482)..(2557)
<223> tracrRNA
<220>
<221> 增强子
<222> (2572)..(2951)
<223> CMV增强子(CMV enhancer)
<220>
<221> 启动子
<222> (2952)..(3155)
<223> CMV启动子(CMV promoter)
<220>
<221> misc_feature
<222> (3241)..(3291)
<223> NLS单元(NLS unit)
<220>
<221> misc_feature
<222> (3247)..(3267)
<223> SV40 NLS
<220>
<221> 基因
<222> (3292)..(7428)
<223> nCas9 (D10A)
<220>
<221> misc_feature
<222> (7408)..(7428)
<223> SV40 NLS
<220>
<221> 基因
<222> (7447)..(7692)
<223> IQGAP2 (466-547)的片段(fragment of IQGAP2 (466-547))
<220>
<221> 基因
<222> (7717)..(8163)
<223> NIF-ZFN335_745-893 (466-547)的片段(fragment of NIF-ZFN335_745-893(466-547))
<220>
<221> misc_feature
<222> (8185)..(8238)
<223> T2A
<220>
<221> 基因
<222> (8245)..(8844)
<223> PuroR
<220>
<221> 聚A信号(polyA_signal)
<222> (9018)..(9139)
<223> SV40聚A信号(SV40 poly(A) signal)
<400> 31
ggccgccacc gcggtggagc tccagctttt gttcccttta gtgagggtta attgcgcgct 60
tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac 120
acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac 180
tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc 240
tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttccg 300
cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc 360
actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt 420
gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc 480
ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa 540
acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc 600
ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg 660
cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc 720
tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc 780
gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca 840
ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact 900
acggctacac tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg 960
gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt 1020
ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct 1080
tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga 1140
gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa 1200
tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac 1260
ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga 1320
taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc 1380
cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca 1440
gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta 1500
gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg 1560
tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc 1620
gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg 1680
ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt 1740
ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt 1800
cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata 1860
ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc 1920
gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac 1980
ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa 2040
ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct 2100
tcctttttca atattattga agcatttatc agggttattg tctcatgagc ggatacatat 2160
ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc 2220
caccggtgta ccaattcgaa cgctgacgtc atcaacccgc tccaaggaat cgcgggccca 2280
gtgtcactag gcgggaacac ccagcgcgcg tgcgccctgg caggaagatg gctgtgaggg 2340
acaggggagt ggcgccctgc aatatttgca tgtcgctatg tgttctggga aatcaccata 2400
aacgtgaaat gtctttggat ttgggaatct tataagttct gtatgaggac cacagatccc 2460
ctcgagatgt gatgaaggag agttttagag ctagaaatag caagttaaaa taaggctagt 2520
ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt ttttacgcgt tgacattgat 2580
tattgactag ttattaatag taatcaatta cggggtcatt agttcatagc ccatatatgg 2640
agttccgcgt tacataactt acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc 2700
gcccattgac gtcaataatg acgtatgttc ccatagtaac gccaataggg actttccatt 2760
gacgtcaatg ggtggagtat ttacggtaaa ctgcccactt ggcagtacat caagtgtatc 2820
atatgccaag tacgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg 2880
cccagtacat gaccttatgg gactttccta cttggcagta catctacgta ttagtcatcg 2940
ctattaccat ggtgatgcgg ttttggcagt acatcaatgg gcgtggatag cggtttgact 3000
cacggggatt tccaagtctc caccccattg acgtcaatgg gagtttgttt tggcaccaaa 3060
atcaacggga ctttccaaaa tgtcgtaaca actccgcccc attgacgcaa atgggcggta 3120
ggcgtgtacg gtgggaggtc tatataagca gagctctctg gctaactaga gaacccactg 3180
cttactggct tatcgaaatt aatacgactc actataggga gacccaagct ggctagcgaa 3240
atggcaccga agaagaagcg taaagtcgga atccacggag ttcctgcggc aatggacaag 3300
aagtactcca ttgggctcgc tatcggcaca aacagcgtcg gttgggccgt cattacggac 3360
gagtacaagg tgccgagcaa aaaattcaaa gttctgggca ataccgatcg ccacagcata 3420
aagaagaacc tcattggcgc cctcctgttc gactccgggg agacggccga agccacgcgg 3480
ctcaaaagaa cagcacggcg cagatatacc cgcagaaaga atcggatctg ctacctgcag 3540
gagatcttta gtaatgagat ggctaaggtg gatgactctt tcttccatag gctggaggag 3600
tcctttttgg tggaggagga taaaaagcac gagcgccacc caatctttgg caatatcgtg 3660
gacgaggtgg cgtaccatga aaagtaccca accatatatc atctgaggaa gaagcttgta 3720
gacagtactg ataaggctga cttgcggttg atctatctcg cgctggcgca tatgatcaaa 3780
tttcggggac acttcctcat cgagggggac ctgaacccag acaacagcga tgtcgacaaa 3840
ctctttatcc aactggttca gacttacaat cagcttttcg aagagaaccc gatcaacgca 3900
tccggagttg acgccaaagc aatcctgagc gctaggctgt ccaaatcccg gcggctcgaa 3960
aacctcatcg cacagctccc tggggagaag aagaacggcc tgtttggtaa tcttatcgcc 4020
ctgtcactcg ggctgacccc caactttaaa tctaacttcg acctggccga agatgccaag 4080
cttcaactga gcaaagacac ctacgatgat gatctcgaca atctgctggc ccagatcggc 4140
gaccagtacg cagacctttt tttggcggca aagaacctgt cagacgccat tctgctgagt 4200
gatattctgc gagtgaacac ggagatcacc aaagctccgc tgagcgctag tatgatcaag 4260
cgctatgatg agcaccacca agacttgact ttgctgaagg cccttgtcag acagcaactg 4320
cctgagaagt acaaggaaat tttcttcgat cagtctaaaa atggctacgc cggatacatt 4380
gacggcggag caagccagga ggaattttac aaatttatta agcccatctt ggaaaaaatg 4440
gacggcaccg aggagctgct ggtaaagctt aacagagaag atctgttgcg caaacagcgc 4500
actttcgaca atggaagcat cccccaccag attcacctgg gcgaactgca cgctatcctc 4560
aggcggcaag aggatttcta cccctttttg aaagataaca gggaaaagat tgagaaaatc 4620
ctcacatttc ggatacccta ctatgtaggc cccctcgccc ggggaaattc cagattcgcg 4680
tggatgactc gcaaatcaga agagaccatc actccctgga acttcgagga agtcgtggat 4740
aagggggcct ctgcccagtc cttcatcgaa aggatgacta actttgataa aaatctgcct 4800
aacgaaaagg tgcttcctaa acactctctg ctgtacgagt acttcacagt ttataacgag 4860
ctcaccaagg tcaaatacgt cacagaaggg atgagaaagc cagcattcct gtctggagag 4920
cagaagaaag ctatcgtgga cctcctcttc aagacgaacc ggaaagttac cgtgaaacag 4980
ctcaaagaag actatttcaa aaagattgaa tgtttcgact ctgttgaaat cagcggagtg 5040
gaggatcgct tcaacgcatc cctgggaacg tatcacgatc tcctgaaaat cattaaagac 5100
aaggacttcc tggacaatga ggagaacgag gacattcttg aggacattgt cctcaccctt 5160
acgttgtttg aagataggga gatgattgaa gaacgcttga aaacttacgc tcatctcttc 5220
gacgacaaag tcatgaaaca gctcaagagg cgccgatata caggatgggg gcggctgtca 5280
agaaaactga tcaatgggat ccgagacaag cagagtggaa agacaatcct ggattttctt 5340
aagtccgatg gatttgccaa ccggaacttc atgcagttga tccatgatga ctctctcacc 5400
tttaaggagg acatccagaa agcacaagtt tctggccagg gggacagtct tcacgagcac 5460
atcgctaatc ttgcaggtag cccagctatc aaaaagggaa tactgcagac cgttaaggtc 5520
gtggatgaac tcgtcaaagt aatgggaagg cataagcccg agaatatcgt tatcgagatg 5580
gcccgagaga accaaactac ccagaaggga cagaagaaca gtagggaaag gatgaagagg 5640
attgaagagg gtataaaaga actggggtcc caaatcctta aggaacaccc agttgaaaac 5700
acccagcttc agaatgagaa gctctacctg tactacctgc agaacggcag ggacatgtac 5760
gtggatcagg aactggacat caatcggctc tccgactacg acgtggatca tatcgtgccc 5820
cagtcttttc tcaaagatga ttctattgat aataaagtgt tgacaagatc cgataaaaat 5880
agagggaaga gtgataacgt cccctcagaa gaagttgtca agaaaatgaa aaattattgg 5940
cggcagctgc tgaacgccaa actgatcaca caacggaagt tcgataatct gactaaggct 6000
gaacgaggtg gcctgtctga gttggataaa gccggcttca tcaaaaggca gcttgttgag 6060
acacgccaga tcaccaagca cgtggcccaa attctcgatt cacgcatgaa caccaagtac 6120
gatgaaaatg acaaactgat tcgagaggtg aaagttatta ctctgaagtc taagctggtc 6180
tcagatttca gaaaggactt tcagttttat aaggtgagag agatcaacaa ttaccaccat 6240
gcgcatgatg cctacctgaa tgcagtggta ggcactgcac ttatcaaaaa atatcccaag 6300
cttgaatctg aatttgttta cggagactat aaagtgtacg atgttaggaa aatgatcgca 6360
aagtctgagc aggaaatagg caaggccacc gctaagtact tcttttacag caatattatg 6420
aattttttca agaccgagat tacactggcc aatggagaga ttcggaagcg accacttatc 6480
gaaacaaacg gagaaacagg agaaatcgtg tgggacaagg gtagggattt cgcgacagtc 6540
cggaaggtcc tgtccatgcc gcaggtgaac atcgttaaaa agaccgaagt acagaccgga 6600
ggcttctcca aggaaagtat cctcccgaaa aggaacagcg acaagctgat cgcacgcaaa 6660
aaagattggg accccaagaa atacggcgga ttcgattctc ctacagtcgc ttacagtgta 6720
ctggttgtgg ccaaagtgga gaaagggaag tctaaaaaac tcaaaagcgt caaggaactg 6780
ctgggcatca caatcatgga gcgatcaagc ttcgaaaaaa accccatcga ctttctcgag 6840
gcgaaaggat ataaagaggt caaaaaagac ctcatcatta agcttcccaa gtactctctc 6900
tttgagcttg aaaacggccg gaaacgaatg ctcgctagtg cgggcgagct gcagaaaggt 6960
aacgagctgg cactgccctc taaatacgtt aatttcttgt atctggccag ccactatgaa 7020
aagctcaaag ggtctcccga agataatgag cagaagcagc tgttcgtgga acaacacaaa 7080
cactaccttg atgagatcat cgagcaaata agcgaattct ccaaaagagt gatcctcgcc 7140
gacgctaacc tcgataaggt gctttctgct tacaataagc acagggataa gcccatcagg 7200
gagcaggcag aaaacattat ccacttgttt actctgacca acttgggcgc gcctgcagcc 7260
ttcaagtact tcgacaccac catagacaga aagcggtaca cctctacaaa ggaggtcctg 7320
gacgccacac tgattcatca gtcaattacg gggctctatg aaacaagaat cgacctctct 7380
cagctcggtg gagacagcag ggctgacccc aagaagaaga ggaaggtggg tggaggaggt 7440
accggagaag ggaatccttt gaggacttta gaaactttgc tcctacctac tgcgaatatt 7500
agtgatgtgg acccagccca tgcccagcac taccaggatg ttttatacca tgctaaatca 7560
cagaaactcg gagactctga gagtgtttcc aaagtgcttt ggctggatga gatacagcaa 7620
gccgtcgatg atgccaacgt ggacaaggac agagcaaaac aatgggttac tctggtggtt 7680
gatgttaatc agggaggccc tagggaaatg ggaggcagtt ccccaggacc tcctgagata 7740
cccccagagg cgacaacttt ccagtcatct gaggctccct cattgctctg ttctgacacc 7800
ctgggcggcg ccaccatcat ctaccagcaa ggagctgagg agtcgacagc gatggccacg 7860
cagacagcct tggatcttct gctgaacatg agtgctcagc gggaactggg gggcacagcc 7920
ctgcaggtgg ctgtggtgaa gtcggaagat gtggaagcag ggttagcatc ccctggtggg 7980
cagccctccc ctgaaggtgc cactccacag gtcgtcaccc tccacgtggc agagccaggg 8040
ggcggtgcag cagccgagag ccagctaggc cctcctgacc taccgcagat caccctggca 8100
cctggtccat ttggtgggac tggctacagt gtcatcacag caccccctat ggaggaggga 8160
acaggagggt cacctactag gaccgaaggc aggggaagcc ttctgacttg tggggatgtg 8220
gaagaaaacc ctggtccatc tagaatgacc gagtacaagc ccacggtgcg cctcgccacc 8280
cgcgacgacg tcccccgggc cgtacgcacc ctcgccgccg cgttcgccga ctaccccgcc 8340
acgcgccaca ccgtcgaccc ggaccgccac atcgagcggg tcaccgagct gcaagaactc 8400
ttcctcacgc gcgtcgggct cgacatcggc aaggtgtggg tcgcggacga cggcgccgcg 8460
gtggcggtct ggaccacgcc ggagagcgtc gaagcggggg cggtgttcgc cgagatcggc 8520
ccgcgcatgg ccgagttgag cggttcccgg ctggccgcgc agcaacagat ggaaggcctc 8580
ctggcgccgc accggcccaa ggagcccgcg tggttcctgg ccaccgtcgg cgtctcgccc 8640
gaccaccagg gcaagggtct gggcagcgcc gtcgtgctcc ccggagtgga ggcggccgag 8700
cgcgccgggg tgcccgcctt cctggagacc tccgcgcccc gcaacctccc cttctacgag 8760
cggctcggct tcaccgtcac cgccgacgtc gaggtgcccg aaggaccgcg cacctggtgc 8820
atgacccgca agcccggtgc ctgagcggga ctctggggtt cgaaatgacc gaccaagcga 8880
cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa aggttgggct 8940
tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat ctcatgctgg 9000
agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa taaagcaata 9060
gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca 9120
aactcatcaa tgtatcttag c 9141
<210> 32
<211> 10219
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 载体1907的完整核苷酸序列(Complete nucleotide sequence of vector1907)
<220>
<221> 基因
<222> (1238)..(2095)
<223> AmpR
<220>
<221> 启动子
<222> (2882)..(3110)
<223> H1 启动子(H1 promoter)
<220>
<221> misc_feature
<222> (3111)..(3130)
<223> 靶(HPRT位点1)(Target (HPRT site 1))
<220>
<221> misc_structure
<222> (3131)..(3206)
<223> tracrRNA
<220>
<221> 增强子
<222> (3221)..(3600)
<223> CMV增强子(CMV enhancer)
<220>
<221> 启动子
<222> (3601)..(3804)
<223> CMV启动子(CMV promoter)
<220>
<221> misc_feature
<222> (3890)..(3940)
<223> NLS单元(NLS unit)
<220>
<221> misc_feature
<222> (3896)..(3916)
<223> SV40 NLS
<220>
<221> 基因
<222> (3941)..(8077)
<223> nCas9 (D10A)
<220>
<221> misc_feature
<222> (8057)..(8077)
<223> SV40 NLS
<220>
<221> misc_feature
<222> (8108)..(8278)
<223> dead SH3 hs
<220>
<221> misc_feature
<222> (8285)..(8350)
<223> 3xFLAG hs
<220>
<221> 基因
<222> (8357)..(8980)
<223> HsPmCDA1
<220>
<221> misc_feature
<222> (8984)..(9004)
<223> SV40 NLS
<220>
<221> 基因
<222> (9011)..(9262)
<223> UGI
<220>
<221> misc_feature
<222> (9263)..(9316)
<223> T2A
<220>
<221> 基因
<222> (9323)..(9922)
<223> PuroR
<220>
<221> 聚A信号(polyA_signal)
<222> (10096)..(10217)
<223> SV40聚A信号(SV40 poly(A) signal)
<400> 32
ggccgccacc gcggtggagc tccagctttt gttcccttta gtgagggtta attgcgcgct 60
tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac 120
acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac 180
tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc 240
tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttccg 300
cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc 360
actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt 420
gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc 480
ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa 540
acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc 600
ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg 660
cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc 720
tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc 780
gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca 840
ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact 900
acggctacac tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg 960
gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt 1020
ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct 1080
tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga 1140
gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa 1200
tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac 1260
ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga 1320
taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc 1380
cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca 1440
gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta 1500
gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg 1560
tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc 1620
gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg 1680
ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt 1740
ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt 1800
cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata 1860
ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc 1920
gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac 1980
ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa 2040
ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct 2100
tcctttttca atattattga agcatttatc agggttattg tctcatgagc ggatacatat 2160
ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc 2220
cacctaaatt gtaagcgtta atattttgtt aaaattcgcg ttaaattttt gttaaatcag 2280
ctcatttttt aaccaatagg ccgaaatcgg caaaatccct tataaatcaa aagaatagac 2340
cgagataggg ttgagtgttg ttccagtttg gaacaagagt ccactattaa agaacgtgga 2400
ctccaacgtc aaagggcgaa aaaccgtcta tcagggcgat ggcccactac gtgaaccatc 2460
accctaatca agttttttgg ggtcgaggtg ccgtaaagca ctaaatcgga accctaaagg 2520
gagcccccga tttagagctt gacggggaaa gccggcgaac gtggcgagaa aggaagggaa 2580
gaaagcgaaa ggagcgggcg ctagggcgct ggcaagtgta gcggtcacgc tgcgcgtaac 2640
caccacaccc gccgcgctta atgcgccgct acagggcgcg tcccattcgc cattcaggct 2700
gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa 2760
agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg 2820
ttgtaaaacg acggccagtg agcgcgcgta atacgactca ctatagggcg aattgggtac 2880
caattcgaac gctgacgtca tcaacccgct ccaaggaatc gcgggcccag tgtcactagg 2940
cgggaacacc cagcgcgcgt gcgccctggc aggaagatgg ctgtgaggga caggggagtg 3000
gcgccctgca atatttgcat gtcgctatgt gttctgggaa atcaccataa acgtgaaatg 3060
tctttggatt tgggaatctt ataagttctg tatgaggacc acagatcccc ccgagatgtc 3120
atgaaagaga gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac 3180
ttgaaaaagt ggcaccgagt cggtgctttt tttacgcgtt gacattgatt attgactagt 3240
tattaatagt aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt 3300
acataactta cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg 3360
tcaataatga cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg 3420
gtggagtatt tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt 3480
acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg 3540
accttatggg actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg 3600
gtgatgcggt tttggcagta catcaatggg cgtggatagc ggtttgactc acggggattt 3660
ccaagtctcc accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac 3720
tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg 3780
tgggaggtct atataagcag agctctctgg ctaactagag aacccactgc ttactggctt 3840
atcgaaatta atacgactca ctatagggag acccaagctg gctagcgaaa tggcaccgaa 3900
gaagaagcgt aaagtcggaa tccacggagt tcctgcggca atggacaaga agtactccat 3960
tgggctcgct atcggcacaa acagcgtcgg ttgggccgtc attacggacg agtacaaggt 4020
gccgagcaaa aaattcaaag ttctgggcaa taccgatcgc cacagcataa agaagaacct 4080
cattggcgcc ctcctgttcg actccgggga gacggccgaa gccacgcggc tcaaaagaac 4140
agcacggcgc agatataccc gcagaaagaa tcggatctgc tacctgcagg agatctttag 4200
taatgagatg gctaaggtgg atgactcttt cttccatagg ctggaggagt cctttttggt 4260
ggaggaggat aaaaagcacg agcgccaccc aatctttggc aatatcgtgg acgaggtggc 4320
gtaccatgaa aagtacccaa ccatatatca tctgaggaag aagcttgtag acagtactga 4380
taaggctgac ttgcggttga tctatctcgc gctggcgcat atgatcaaat ttcggggaca 4440
cttcctcatc gagggggacc tgaacccaga caacagcgat gtcgacaaac tctttatcca 4500
actggttcag acttacaatc agcttttcga agagaacccg atcaacgcat ccggagttga 4560
cgccaaagca atcctgagcg ctaggctgtc caaatcccgg cggctcgaaa acctcatcgc 4620
acagctccct ggggagaaga agaacggcct gtttggtaat cttatcgccc tgtcactcgg 4680
gctgaccccc aactttaaat ctaacttcga cctggccgaa gatgccaagc ttcaactgag 4740
caaagacacc tacgatgatg atctcgacaa tctgctggcc cagatcggcg accagtacgc 4800
agaccttttt ttggcggcaa agaacctgtc agacgccatt ctgctgagtg atattctgcg 4860
agtgaacacg gagatcacca aagctccgct gagcgctagt atgatcaagc gctatgatga 4920
gcaccaccaa gacttgactt tgctgaaggc ccttgtcaga cagcaactgc ctgagaagta 4980
caaggaaatt ttcttcgatc agtctaaaaa tggctacgcc ggatacattg acggcggagc 5040
aagccaggag gaattttaca aatttattaa gcccatcttg gaaaaaatgg acggcaccga 5100
ggagctgctg gtaaagctta acagagaaga tctgttgcgc aaacagcgca ctttcgacaa 5160
tggaagcatc ccccaccaga ttcacctggg cgaactgcac gctatcctca ggcggcaaga 5220
ggatttctac ccctttttga aagataacag ggaaaagatt gagaaaatcc tcacatttcg 5280
gataccctac tatgtaggcc ccctcgcccg gggaaattcc agattcgcgt ggatgactcg 5340
caaatcagaa gagaccatca ctccctggaa cttcgaggaa gtcgtggata agggggcctc 5400
tgcccagtcc ttcatcgaaa ggatgactaa ctttgataaa aatctgccta acgaaaaggt 5460
gcttcctaaa cactctctgc tgtacgagta cttcacagtt tataacgagc tcaccaaggt 5520
caaatacgtc acagaaggga tgagaaagcc agcattcctg tctggagagc agaagaaagc 5580
tatcgtggac ctcctcttca agacgaaccg gaaagttacc gtgaaacagc tcaaagaaga 5640
ctatttcaaa aagattgaat gtttcgactc tgttgaaatc agcggagtgg aggatcgctt 5700
caacgcatcc ctgggaacgt atcacgatct cctgaaaatc attaaagaca aggacttcct 5760
ggacaatgag gagaacgagg acattcttga ggacattgtc ctcaccctta cgttgtttga 5820
agatagggag atgattgaag aacgcttgaa aacttacgct catctcttcg acgacaaagt 5880
catgaaacag ctcaagaggc gccgatatac aggatggggg cggctgtcaa gaaaactgat 5940
caatgggatc cgagacaagc agagtggaaa gacaatcctg gattttctta agtccgatgg 6000
atttgccaac cggaacttca tgcagttgat ccatgatgac tctctcacct ttaaggagga 6060
catccagaaa gcacaagttt ctggccaggg ggacagtctt cacgagcaca tcgctaatct 6120
tgcaggtagc ccagctatca aaaagggaat actgcagacc gttaaggtcg tggatgaact 6180
cgtcaaagta atgggaaggc ataagcccga gaatatcgtt atcgagatgg cccgagagaa 6240
ccaaactacc cagaagggac agaagaacag tagggaaagg atgaagagga ttgaagaggg 6300
tataaaagaa ctggggtccc aaatccttaa ggaacaccca gttgaaaaca cccagcttca 6360
gaatgagaag ctctacctgt actacctgca gaacggcagg gacatgtacg tggatcagga 6420
actggacatc aatcggctct ccgactacga cgtggatcat atcgtgcccc agtcttttct 6480
caaagatgat tctattgata ataaagtgtt gacaagatcc gataaaaata gagggaagag 6540
tgataacgtc ccctcagaag aagttgtcaa gaaaatgaaa aattattggc ggcagctgct 6600
gaacgccaaa ctgatcacac aacggaagtt cgataatctg actaaggctg aacgaggtgg 6660
cctgtctgag ttggataaag ccggcttcat caaaaggcag cttgttgaga cacgccagat 6720
caccaagcac gtggcccaaa ttctcgattc acgcatgaac accaagtacg atgaaaatga 6780
caaactgatt cgagaggtga aagttattac tctgaagtct aagctggtct cagatttcag 6840
aaaggacttt cagttttata aggtgagaga gatcaacaat taccaccatg cgcatgatgc 6900
ctacctgaat gcagtggtag gcactgcact tatcaaaaaa tatcccaagc ttgaatctga 6960
atttgtttac ggagactata aagtgtacga tgttaggaaa atgatcgcaa agtctgagca 7020
ggaaataggc aaggccaccg ctaagtactt cttttacagc aatattatga attttttcaa 7080
gaccgagatt acactggcca atggagagat tcggaagcga ccacttatcg aaacaaacgg 7140
agaaacagga gaaatcgtgt gggacaaggg tagggatttc gcgacagtcc ggaaggtcct 7200
gtccatgccg caggtgaaca tcgttaaaaa gaccgaagta cagaccggag gcttctccaa 7260
ggaaagtatc ctcccgaaaa ggaacagcga caagctgatc gcacgcaaaa aagattggga 7320
ccccaagaaa tacggcggat tcgattctcc tacagtcgct tacagtgtac tggttgtggc 7380
caaagtggag aaagggaagt ctaaaaaact caaaagcgtc aaggaactgc tgggcatcac 7440
aatcatggag cgatcaagct tcgaaaaaaa ccccatcgac tttctcgagg cgaaaggata 7500
taaagaggtc aaaaaagacc tcatcattaa gcttcccaag tactctctct ttgagcttga 7560
aaacggccgg aaacgaatgc tcgctagtgc gggcgagctg cagaaaggta acgagctggc 7620
actgccctct aaatacgtta atttcttgta tctggccagc cactatgaaa agctcaaagg 7680
gtctcccgaa gataatgagc agaagcagct gttcgtggaa caacacaaac actaccttga 7740
tgagatcatc gagcaaataa gcgaattctc caaaagagtg atcctcgccg acgctaacct 7800
cgataaggtg ctttctgctt acaataagca cagggataag cccatcaggg agcaggcaga 7860
aaacattatc cacttgttta ctctgaccaa cttgggcgcg cctgcagcct tcaagtactt 7920
cgacaccacc atagacagaa agcggtacac ctctacaaag gaggtcctgg acgccacact 7980
gattcatcag tcaattacgg ggctctatga aacaagaatc gacctctctc agctcggtgg 8040
agacagcagg gctgacccca agaagaagag gaaggtgggt ggaggaggta ccggcggtgg 8100
aggctcagca gaatacgtac gagctctgtt tgacttcaat gggaatgacg aggaggatct 8160
cccctttaag aagggcgata ttctccgcat cagagataag cccgaagaac aatggtggaa 8220
tgccgaggat agcgaaggga aaaggggcat gattctggtg ccatatgtgg agaaatattc 8280
cggtgactac aaagaccatg atggggatta caaagaccac gacatcgact acaaagacga 8340
cgacgataaa tcagggatga cagacgccga gtacgtgcgc attcatgaga aactggatat 8400
ttacaccttc aagaagcagt tcttcaacaa caagaaatct gtgtcacacc gctgctacgt 8460
gctgtttgag ttgaagcgaa ggggcgaaag aagggcttgc ttttggggct atgccgtcaa 8520
caagccccaa agtggcaccg agagaggaat acacgctgag atattcagta tccgaaaggt 8580
ggaagagtat cttcgggata atcctgggca gtttacgatc aactggtatt ccagctggag 8640
tccttgcgct gattgtgccg agaaaattct ggaatggtat aatcaggaac ttcggggaaa 8700
cgggcacaca ttgaaaatct gggcctgcaa gctgtactac gagaagaatg cccggaacca 8760
gataggactc tggaatctga gggacaatgg tgtaggcctg aacgtgatgg tttccgagca 8820
ctatcagtgt tgtcggaaga ttttcatcca aagctctcat aaccagctca atgaaaaccg 8880
ctggttggag aaaacactga aacgtgcgga gaagcggaga tccgagctga gcatcatgat 8940
ccaggtcaag attctgcata ccactaagtc tccagccgtt ggtcccaaga agaaaagaaa 9000
agtcggtacc atgaccaacc tttccgacat catagagaag gaaacaggca aacagttggt 9060
catccaagag tcgatactca tgcttcctga agaagttgag gaggtcattg ggaataagcc 9120
ggaaagtgac attctcgtac acactgcgta tgatgagagc accgatgaga acgtgatgct 9180
gctcacgtca gatgccccag agtacaaacc ctgggctctg gtgattcagg actctaatgg 9240
agagaacaag atcaagatgc tagaaggcag gggaagcctt ctgacttgtg gggatgtgga 9300
agaaaaccct ggtccatcta gaatgaccga gtacaagccc acggtgcgcc tcgccacccg 9360
cgacgacgtc ccccgggccg tacgcaccct cgccgccgcg ttcgccgact accccgccac 9420
gcgccacacc gtcgacccgg accgccacat cgagcgggtc accgagctgc aagaactctt 9480
cctcacgcgc gtcgggctcg acatcggcaa ggtgtgggtc gcggacgacg gcgccgcggt 9540
ggcggtctgg accacgccgg agagcgtcga agcgggggcg gtgttcgccg agatcggccc 9600
gcgcatggcc gagttgagcg gttcccggct ggccgcgcag caacagatgg aaggcctcct 9660
ggcgccgcac cggcccaagg agcccgcgtg gttcctggcc accgtcggcg tctcgcccga 9720
ccaccagggc aagggtctgg gcagcgccgt cgtgctcccc ggagtggagg cggccgagcg 9780
cgccggggtg cccgccttcc tggagacctc cgcgccccgc aacctcccct tctacgagcg 9840
gctcggcttc accgtcaccg ccgacgtcga ggtgcccgaa ggaccgcgca cctggtgcat 9900
gacccgcaag cccggtgcct gagcgggact ctggggttcg aaatgaccga ccaagcgacg 9960
cccaacctgc catcacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc 10020
ggaatcgttt tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag 10080
ttcttcgccc accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc 10140
atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa 10200
ctcatcaatg tatcttagc 10219
<210> 33
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 33
tttggtactt gttcagcttt attcaagtgg 30
<210> 34
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 34
acaatagctc ttcagtctga taaaatctac 30
<210> 35
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 35
tctttcccta cacgacgctc ttccgatctt aggactgaac gtcttgctc 49
<210> 36
<211> 58
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 36
gtgactggag ttcagacgtg tgctcttccg atctcagtca taggaatgga tctatcac 58
<210> 37
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 37
ctcgagatgt gatgaaggag a 21

Claims (19)

1.一种方法,其为改变细胞所具有的DNA的靶向部位的方法,其包括以下的工序:
用诱导该细胞中内在的DNA修饰酶的因子刺激该细胞的工序,以及
使可与选择出的DNA中的靶核苷酸序列特异性地结合的核酸序列识别模块与、DNA修饰酶结合模块进行结合而得到的复合体,与该DNA进行接触,从而使得该靶向部位的1个以上的核苷酸缺失或替换为其它的1个以上的核苷酸,或者将1个以上的核苷酸插入于该靶向部位的工序。
2.根据权利要求1所述的方法,其中,在不切断所述DNA的至少一条链的状态下进行所述靶向部位的改变。
3.根据权利要求1或2所述的方法,其中,所述核酸序列识别模块选自由Cas的至少1种DNA切断能力失活了的CRISPR-Cas系统、锌指基序、TAL效应物以及PPR基序组成的组。
4.根据权利要求1~3中任一项所述的方法,其中,所述核酸序列识别模块是Cas的至少1种DNA切断能力失活了的CRISPR-Cas系统。
5.根据权利要求1~4中任一项所述的方法,其中,所述DNA修饰酶结合模块选自由针对DNA修饰酶的抗体、肽适体以及核酸适体组成的组。
6.根据权利要求1~4中任一项所述的方法,其中,所述DNA修饰酶结合模块是选自由Vif、Bet蛋白质、TopoIIβ、IQGAP2以及ZNF335以及它们的片段组成的组中的至少1种。
7.根据权利要求1~6中任一项所述的方法,其中,所述DNA修饰酶结合模块的靶酶是脱氨酶。
8.根据权利要求7所述的方法,其中,所述脱氨酶是属于APOBEC家族的蛋白质。
9.根据权利要求7或8所述的方法,其中,将核酸序列识别模块和DNA修饰酶结合模块结合而得到的复合体,进一步结合了碱基切除修复的抑制因子。
10.根据权利要求1~9中任一项所述的方法,其中,诱导所述DNA修饰酶的因子是选自由干扰素、琥珀酸脱氢酶阻碍剂以及低氧条件组成的组中的1个以上。
11.根据权利要求1~10中任一项所述的方法,其中,通过将编码该复合体的核酸导入于所述细胞,培养该细胞而在细胞内表达该复合体,从而进行所述DNA与所述复合体的接触。
12.根据权利要求1~11中任一项所述的方法,其中,用诱导DNA修饰酶的因子刺激细胞,是通过在该因子的存在下培养该细胞从而进行的。
13.根据权利要求1~12中任一项所述的方法,其中,所述细胞是脊椎动物细胞。
14.根据权利要求13所述的方法,其中,所述脊椎动物细胞是哺乳类动物细胞。
15.根据权利要求1~14中任一项所述的方法,其中,所述DNA是双链DNA。
16.一种复合体,其为通过将可与DNA中的靶核苷酸序列特异性地结合的核酸序列识别模块和DNA修饰酶结合模块结合而得到的复合体,该核酸序列识别模块是Cas的至少1种DNA切断能力失活了的CRISPR-Cas系统,使得该靶向部位的1个以上的核苷酸缺失或替换为其它的1个以上的核苷酸,或者将1个以上的核苷酸插入于该靶向部位。
17.一种核酸,其编码权利要求16所述的复合体。
18.一种DNA的靶向部位的改变剂,其含有权利要求16所述的复合体或者权利要求17所述的核酸。
19.一种方法,其为改变细胞所具有的双链DNA的靶向部位的方法,其包括以下的工序:
用诱导该细胞中内在的DNA修饰酶的因子刺激该细胞的工序,以及
通过使可与选择出的双链DNA中的靶核苷酸序列特异性地结合的核酸序列识别模块与该双链DNA进行接触,从而使得该靶向部位的1个以上的核苷酸缺失或替换为其它的1个以上的核苷酸,或者将1个以上的核苷酸插入于该靶向部位的工序。
CN201880020115.3A 2017-03-22 2018-03-20 一种改变细胞所具有的dna的靶向部位的方法以及用于该方法的复合体 Active CN110446782B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410165335.2A CN118006597A (zh) 2017-03-22 2018-03-20 一种改变细胞中dna的靶向部位的方法以及用于该方法的复合体

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2017-056727 2017-03-22
JP2017056727 2017-03-22
PCT/JP2018/011198 WO2018174097A1 (ja) 2017-03-22 2018-03-20 細胞内在性のdna修飾酵素を利用して標的化したdnaの核酸塩基を特異的に変換する、細胞の核酸配列の変換方法、及びそれに用いる分子複合体

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202410165335.2A Division CN118006597A (zh) 2017-03-22 2018-03-20 一种改变细胞中dna的靶向部位的方法以及用于该方法的复合体

Publications (2)

Publication Number Publication Date
CN110446782A true CN110446782A (zh) 2019-11-12
CN110446782B CN110446782B (zh) 2024-03-01

Family

ID=63585387

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201880020115.3A Active CN110446782B (zh) 2017-03-22 2018-03-20 一种改变细胞所具有的dna的靶向部位的方法以及用于该方法的复合体
CN202410165335.2A Pending CN118006597A (zh) 2017-03-22 2018-03-20 一种改变细胞中dna的靶向部位的方法以及用于该方法的复合体

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202410165335.2A Pending CN118006597A (zh) 2017-03-22 2018-03-20 一种改变细胞中dna的靶向部位的方法以及用于该方法的复合体

Country Status (9)

Country Link
US (2) US11845953B2 (zh)
EP (1) EP3604519A4 (zh)
JP (1) JP7133856B2 (zh)
KR (1) KR102280546B1 (zh)
CN (2) CN110446782B (zh)
BR (1) BR112019019673A2 (zh)
CA (1) CA3057432C (zh)
SG (1) SG11201908782XA (zh)
WO (1) WO2018174097A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3794130A4 (en) 2018-05-16 2022-07-27 Synthego Corporation METHODS AND SYSTEMS FOR DESIGN AND USE OF GUIDE RNA
US20230040261A1 (en) * 2020-03-11 2023-02-09 North Carolina State University Compositions, methods, and systems for genome editing technology

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016072399A1 (ja) * 2014-11-04 2016-05-12 国立大学法人神戸大学 脱塩基反応により標的化したdna配列に特異的に変異を導入する、ゲノム配列の改変方法、並びにそれに用いる分子複合体
WO2017015015A1 (en) * 2015-07-17 2017-01-26 Emory University Crispr-associated protein from francisella and uses related thereto
CN106459957A (zh) * 2014-03-05 2017-02-22 国立大学法人神户大学 用于特异性转变靶向dna序列的核酸碱基的基因组序列的修饰方法及其使用的分子复合体

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003251286B2 (en) 2002-01-23 2007-08-16 The University Of Utah Research Foundation Targeted chromosomal mutagenesis using zinc finger nucleases
US7393923B2 (en) * 2004-11-08 2008-07-01 The Regents Of The University Of California Red-shifted fluorescent proteins mPlum and mRaspberry and polynucleotides encoding the same
US8198046B2 (en) * 2006-07-11 2012-06-12 Danisco Us Inc. KEX2 cleavage regions of recombinant fusion proteins
RU2531343C2 (ru) 2007-03-02 2014-10-20 ДюПон Ньютришн Байосайенсиз АпС, Способ генерирования заквасочной культуры, заквасочная культура и способ ферментации с ее использованием
US20110104787A1 (en) * 2009-11-05 2011-05-05 President And Fellows Of Harvard College Fusion Peptides That Bind to and Modify Target Nucleic Acid Sequences
WO2011072246A2 (en) 2009-12-10 2011-06-16 Regents Of The University Of Minnesota Tal effector-mediated dna modification
JP2013128413A (ja) 2010-03-11 2013-07-04 Kyushu Univ Pprモチーフを利用したrna結合性蛋白質の改変方法
JP2011231053A (ja) 2010-04-28 2011-11-17 Kumamoto Univ Apobec3発現向上剤及び抗hiv剤
WO2016070129A1 (en) 2014-10-30 2016-05-06 President And Fellows Of Harvard College Delivery of negatively charged proteins using cationic lipids
US11007182B2 (en) 2015-04-09 2021-05-18 Health Research, Inc. Use of atpenin to activate innate immunity
JP7044373B2 (ja) 2015-07-15 2022-03-30 ラトガース,ザ ステート ユニバーシティ オブ ニュージャージー ヌクレアーゼ非依存的な標的化遺伝子編集プラットフォームおよびその用途
JP6727082B2 (ja) 2015-09-16 2020-07-22 日本製紙株式会社 感熱記録体
CN114908093A (zh) * 2016-02-26 2022-08-16 朗泽科技新西兰有限公司 用于c1固定菌的crispr/cas系统
WO2018035466A1 (en) * 2016-08-18 2018-02-22 The Board Of Trustees Of The Leland Stanford Junior University Targeted mutagenesis
CA3082922C (en) * 2017-11-22 2024-02-13 National University Corporation Kobe University Complex for genome editing having stability and few side-effects, and nucleic acid coding same

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106459957A (zh) * 2014-03-05 2017-02-22 国立大学法人神户大学 用于特异性转变靶向dna序列的核酸碱基的基因组序列的修饰方法及其使用的分子复合体
WO2016072399A1 (ja) * 2014-11-04 2016-05-12 国立大学法人神戸大学 脱塩基反応により標的化したdna配列に特異的に変異を導入する、ゲノム配列の改変方法、並びにそれに用いる分子複合体
WO2017015015A1 (en) * 2015-07-17 2017-01-26 Emory University Crispr-associated protein from francisella and uses related thereto

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
ALEXIS C KOMOR ET AL.: "Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage", 《NATURE》 *
ALEXIS C KOMOR ET AL.: "Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage", 《NATURE》, vol. 533, no. 7603, 19 May 2016 (2016-05-19), pages 2 - 3, XP093078921, DOI: 10.1038/nature17946 *
CHRISTOPH SEEGER ET AL.: "Complete Spectrum of CRISPR/Cas9-induced Mutations on HBV cccDNA", 《MOL THER》 *
CHRISTOPH SEEGER ET AL.: "Complete Spectrum of CRISPR/Cas9-induced Mutations on HBV cccDNA", 《MOL THER》, vol. 24, no. 7, 31 August 2016 (2016-08-31), pages 1259 *
HAL P BOGERD ET AL.: "Specific induction of endogenous viral restriction factors using CRISPR/Cas-derived transcriptional activators", 《PROC NATL ACAD SCI U S A》 *
HAL P BOGERD ET AL.: "Specific induction of endogenous viral restriction factors using CRISPR/Cas-derived transcriptional activators", 《PROC NATL ACAD SCI U S A》, vol. 112, no. 52, 14 December 2015 (2015-12-14), pages 7249, XP055381170, DOI: 10.1073/pnas.1516305112 *

Also Published As

Publication number Publication date
BR112019019673A2 (pt) 2020-04-22
JP7133856B2 (ja) 2022-09-09
SG11201908782XA (en) 2019-10-30
US20240117384A1 (en) 2024-04-11
CA3057432A1 (en) 2019-11-28
KR20190131081A (ko) 2019-11-25
US11845953B2 (en) 2023-12-19
EP3604519A4 (en) 2021-01-06
CN110446782B (zh) 2024-03-01
US20200010856A1 (en) 2020-01-09
CA3057432C (en) 2023-08-08
KR102280546B1 (ko) 2021-07-22
JPWO2018174097A1 (ja) 2020-01-30
WO2018174097A1 (ja) 2018-09-27
CN118006597A (zh) 2024-05-10
EP3604519A1 (en) 2020-02-05

Similar Documents

Publication Publication Date Title
CN113831407B (zh) 用于使用多个引导rna来破坏免疫耐受性的方法
JP6462069B2 (ja) 標的化したdna配列の核酸塩基を特異的に変換するゲノム配列の改変方法及びそれに用いる分子複合体
AU2014273089B2 (en) A LAGLIDADG homing endonuclease cleaving the C-C Chemokine Receptor Type-5 (CCR5) gene and uses thereof
JP7197363B2 (ja) ヌクレアーゼを使用するヒト神経幹細胞のゲノム編集
JP6670743B2 (ja) Ii型crisprシステムにおける新規のコンパクトなcas9足場
CA3111432A1 (en) Novel crispr enzymes and systems
JP2021003107A (ja) Cas9ニッカーゼ活性を用いて正確なdna切断をもたらすための方法
AU2003218382B2 (en) Methods and compositions for using zinc finger endonucleases to enhance homologous recombination
JP2021506251A (ja) 新規rnaプログラム可能エンドヌクレアーゼ系、ならびにゲノム編集および他の適用におけるその使用
US20040043468A1 (en) Synthetic internal ribosome entry sites and methods of identifying same
CA2989834A1 (en) Crispr enzymes and systems
CN110770342A (zh) Dna被编辑了的真核细胞的制造方法、和在该方法中使用的试剂盒
KR102151065B1 (ko) 동물 배아의 염기 교정용 조성물 및 염기 교정 방법
DK3098310T3 (en) METHOD OF PREPARING DNA UNIT COMPOSITION AND PROCEDURE FOR PRODUCING CONCATENAT DNA
KR20220017939A (ko) 인간화 알부민 좌위를 포함하는 비-인간 동물
CN110446782B (zh) 一种改变细胞所具有的dna的靶向部位的方法以及用于该方法的复合体
JP7361109B2 (ja) C2c1ヌクレアーゼに基づくゲノム編集のためのシステムおよび方法
US20040101520A1 (en) Recombination method
KR20130078265A (ko) 감염력이 있는 구제역바이러스 O형 cDNA 클론 및 클론의 전체염기서열
US7265262B2 (en) Telomerizing nuclear donor cells and improving the efficiency on nuclear transfer
CN113025651B (zh) 靶向HBV核心启动子的药物筛选细胞模型、Triciribine及结构类似物新应用
KR102422842B1 (ko) 크리스퍼 간섭을 이용한 rna 번역 조절용 조성물
KR102563238B1 (ko) 제2형 중증급성호흡기증후군 코로나바이러스에 대한 감수성이 증가된 동물모델용 형질전환 돼지 및 이의 제조방법
CN107828876A (zh) 可共价结合底物的标签蛋白在clip中的应用
KR20220136677A (ko) 인간 면역 글로불린 Fc 및 목적단백질을 생산하는 조류의 제조방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant