CN113846096A - Rna-导向的转录调控 - Google Patents

Rna-导向的转录调控 Download PDF

Info

Publication number
CN113846096A
CN113846096A CN202110830978.0A CN202110830978A CN113846096A CN 113846096 A CN113846096 A CN 113846096A CN 202110830978 A CN202110830978 A CN 202110830978A CN 113846096 A CN113846096 A CN 113846096A
Authority
CN
China
Prior art keywords
dna
nucleic acid
cell
rna
rnas
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110830978.0A
Other languages
English (en)
Inventor
乔治·M·丘奇
普拉尚特·G·马利
凯文·M·埃斯弗特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harvard College
Original Assignee
Harvard College
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harvard College filed Critical Harvard College
Publication of CN113846096A publication Critical patent/CN113846096A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/635Externally inducible repressor mediated regulation of gene expression, e.g. tetR inducible by tetracyline
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3513Protein; Peptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Mycology (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Peptides Or Proteins (AREA)
  • Saccharide Compounds (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Lubricants (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

提供了RNA‑导向的转录调控。具体包括一种改变细胞中DNA靶标核酸的方法,包括向所述细胞引入编码两种或更多种RNA的第一外源核酸,其中每种RNA与所述DNA靶标核酸中相邻位点互补,向所述细胞引入编码至少一种Cas9蛋白切口酶的第二外源核酸,所述Cas9蛋白切口酶具有一个非活性核酸酶结构域并由所述两种或更多种RNA导向,且其中表达所述两种或更多种RNA和所述至少一种Cas9蛋白切口酶,并且其中所述至少一种Cas9蛋白切口酶与所述两种或更多种RNA共定位至所述DNA靶标核酸,并且切割所述DNA靶标核酸,从而导致产生两个或更多个相邻切口。

Description

RNA-导向的转录调控
相关申请数据
本申请主张2013年6月4日提交的美国临时专利申请No.61/830787的优先权,并且该专利申请出于所有目的以其全部内容作为参考并入本文。
政府权益的声明
本发明是在根据国家卫生研究院的授权号No.P50 HG005550和能源部的DE-FG02-02ER63445的政府资助下完成的。政府对本发明具有一定的权利。
背景技术
细菌和古细菌CRISPR-Cas系统依赖于与侵袭性外源核酸内存在的指导互补序列降解的Cas蛋白的复合物中的短向导RNA。参见Deltcheva,E.等人,CRISPR RNA maturationby trans-encoded small RNA and host factor RNase III.Nature 471,602-607(2011);Gasiunas,G.,Barrangou,R.,Horvath,P.&Siksnys,V.Cas9-crRNAribonucleoprotein complex mediates specific DNA cleavage for adaptiveimmunity in bacteria.Proceedings of the National Academy of Sciences of theUnited States of America 109,E2579-2586(2012);Jinek,M.等人,A programmabledual-RNA-guided DNA endonuclease in adaptive bacterial immunity.Science 337,816-821(2012);Sapranauskas,R.等人,The Streptococcus thermophilus CRISPR/Cassystem provides immunity in Escherichia coli.Nucleic acids research 39,9275-9282(2011);和Bhaya,D.,Davison,M.&Barrangou,R.CRISPR-Cas systems in bacteriaand archaea:versatile small RNAs for adaptive defense and regulation.Annualreview of genetics 45,273-297(2011)。近期化脓性链球菌(S.pyogenes)II型CRISPR系统的体外重组表明融合至正常反式编码的tracrRNA(“反式-激活CRISPR RNA”)的crRNA(“CRISPR RNA”)足以指导Cas9蛋白序列特异性地切割与crRNA匹配的靶标DNA序列。表达与靶标位点同源的gRNA导致Cas9招募和靶标DNA的降解。参见H.Deveau等人,Phage responseto CRISPR-encoded resistance in Streptococcus thermophilus.Journal ofBacteriology 190,1390(Feb,2008)。
发明内容
本发明公开的方面涉及向导RNA(guide RNA)、DNA结合蛋白和双链DNA靶标序列的复合物。根据某些方面,本发明公开范围内的DNA结合蛋白包括与向导RNA和与将复合物导向至双链DNA序列的向导RNA形成复合物的蛋白,其中所述复合物结合至所述DNA序列。本发明公开的这一方面可以称为RNA和DNA结合蛋白向或与双链DNA的共定位。以这种方式,DNA结合蛋白-向导RNA复合物可以用于定位转录调控因子蛋白或结构域于靶标DNA处,从而调控靶标DNA的表达。
根据某些方面,提供了调控细胞中靶标核酸表达的方法,其包括向所述细胞引入编码与DNA(脱氧核糖核酸)互补的一种或多种RNA(核糖核酸)的第一外源核酸,其中所述DNA包括靶标核酸,向所述细胞引入编码结合至DNA并由一种或多种RNA导向的RNA导向核酸酶无效的DNA结合蛋白(RNA guided nuclease-null DNA binding protein)的第二外源核酸,向所述细胞引入编码转录调控因子蛋白或结构域的第三外源核酸,其中表达了所述一种或多种RNA、RNA导向核酸酶无效的DNA结合蛋白和转录调控因子蛋白或结构域,其中所述一种或多种RNA、RNA导向核酸酶无效的DNA结合蛋白和转录调控因子蛋白或结构域共定位至所述DNA并且其中所述转录调控因子蛋白或结构域调控所述靶标核酸的表达。
根据一个方面,编码RNA导向核酸酶无效的DNA结合蛋白的外源核酸还编码融合至RNA导向核酸酶无效的DNA结合蛋白的转录调控因子蛋白或结构域。根据一个方面,编码一种或多种RNA的外源核酸还编码RNA结合结构域的靶标,并且编码转录调控因子蛋白或结构域的外源核酸还编码融合至转录调控因子蛋白或结构域的RNA结合结构域。
根据一个方面,所述细胞是真核细胞。根据一个方面,所述细胞是酵母细胞、植物细胞或动物细胞。根据一个方面,所述细胞是哺乳动物细胞。
根据一个方面,所述RNA为约10至约500个核苷酸。根据一个方面,所述RNA为约20至约100个核苷酸。
根据一个方面,所述转录调控因子蛋白或结构域是转录活化因子。根据一个方面,所述转录调控因子蛋白或结构域上调靶标核酸的表达。根据一个方面,所述转录调控因子蛋白或结构域上调靶标核酸的表达以治疗疾病或有害状况(detrimental condition)。根据一个方面,所述靶标核酸与疾病或有害状况有关。
根据一个方面,一种或多种RNA是向导RNA。根据一个方面,一种或多种RNA是tracrRNA-crRNA融合体。根据一个方面,向导RNA包括间隔序列和示踪伴侣序列(tracermate sequence)。向导RNA还可以包括tracr序列,所述序列的一部分杂交至tracr伴侣序列。向导RNA还可以包括接头核酸序列,其将示踪伴侣序列(tracer mate sequence)和tracr序列连接以产生tracrRNA-crRNA融合体。间隔序列结合至靶标DNA,如通过杂交。
根据一个方面,向导RNA包括截短间隔序列。根据一个方面,向导RNA包括在间隔序列5'端具有1个碱基截短(truncation)的截短间隔序列(truncated spacer sequence)。根据一个方面,向导RNA包括在间隔序列5'端具有2个碱基截短的截短间隔序列。根据一个方面,向导RNA包括在间隔序列5'端具有3个碱基截短的截短间隔序列。根据一个方面,向导RNA包括在间隔序列5'端具有4个碱基截短的截短间隔序列。因此,间隔序列可以在间隔序列的5'端具有1至4个碱基截短。
根据某些实施方式,间隔序列可以包括杂交至靶标核酸序列的约16至约20个核苷酸。根据某些实施方式,间隔序列可以包括杂交至靶标核酸序列的约20个核苷酸。
根据某些方面,接头核酸序列可以包括约4至约6个核酸。
根据某些方面,tracr序列可以包括约60至约500个核酸。根据某些方面,tracr序列可以包括约64至约500个核酸。根据某些方面,tracr序列可以包括约65至约500个核酸。根据某些方面,tracr序列可以包括约66至约500个核酸。根据某些方面,tracr序列可以包括约67至约500个核酸。根据某些方面,tracr序列可以包括约68至约500个核酸。根据某些方面,tracr序列可以包括约69至约500个核酸。根据某些方面,tracr序列可以包括约70至约500个核酸。根据某些方面,tracr序列可以包括约80至约500个核酸。根据某些方面,tracr序列可以包括约90至约500个核酸。根据某些方面,tracr序列可以包括约100至约500个核酸。
根据某些方面,tracr序列可以包括约60至约200个核酸。根据某些方面,tracr序列可以包括约64至约200个核酸。根据某些方面,tracr序列可以包括约65至约200个核酸。根据某些方面,tracr序列可以包括约66至约200个核酸。根据某些方面,tracr序列可以包括约67至约200个核酸。根据某些方面,tracr序列可以包括约68至约200个核酸。根据某些方面,tracr序列可以包括约69至约200个核酸。根据某些方面,tracr序列可以包括约70至约200个核酸。根据某些方面,tracr序列可以包括约80至约200个核酸。根据某些方面,tracr序列可以包括约90至约200个核酸。根据某些方面,tracr序列可以包括约100至约200个核酸。
图5B中显示了示例性向导RNA。
根据一个方面,所述DNA是基因组DNA、线粒体DNA、病毒DNA或外源DNA。
根据某些方面,提供了调控细胞中靶标核酸表达的方法,其包括向所述细胞引入编码与DNA(脱氧核糖核酸)互补的一种或多种RNA(核糖核酸)的第一外源核酸,其中所述DNA包括靶标核酸,向所述细胞引入编码结合至DNA并由一种或多种RNA导向的II型CRISPR系统的RNA导向核酸酶无效的DNA结合蛋白的第二外源核酸,向所述细胞引入编码转录调控因子蛋白或结构域的第三外源核酸,其中表达了所述一种或多种RNA、II型CRISPR系统的RNA导向核酸酶无效的DNA结合蛋白和转录调控因子蛋白或结构域,其中所述一种或多种RNA、II型CRISPR系统的RNA导向核酸酶无效的DNA结合蛋白和转录调控因子蛋白或结构域共定位至所述DNA并且其中所述转录调控因子蛋白或结构域调控所述靶标核酸的表达。
根据一个方面,编码II型CRISPR系统的RNA导向核酸酶无效的DNA结合蛋白的外源核酸还编码了融合至II型CRISPR系统的RNA导向核酸酶无效的DNA结合蛋白的转录调控因子蛋白或结构域。根据一个方面,编码一种或多种RNA的外源核酸还编码了RNA结合结构域的靶标,并且编码转录调控因子蛋白或结构域的外源核酸还编码了融合至转录调控因子蛋白或结构域的RNA结合结构域。
根据一个方面,所述细胞是真核细胞。根据一个方面,所述细胞是酵母细胞、植物细胞或动物细胞。根据一个方面,所述细胞是哺乳动物细胞。
根据一个方面,所述RNA为约10至约500个核苷酸。根据一个方面,所述RNA为约20至约100个核苷酸。
根据一个方面,所述转录调控因子蛋白或结构域是转录活化因子。根据一个方面,所述转录调控因子蛋白或结构域上调靶标核酸的表达。根据一个方面,所述转录调控因子蛋白或结构域上调靶标核酸的表达以治疗疾病或有害状况。根据一个方面,所述靶标核酸与疾病或有害状况有关。
根据一个方面,一种或多种RNA是向导RNA。根据一个方面,一种或多种RNA是tracrRNA-crRNA融合体。
根据一个方面,所述DNA是基因组DNA、线粒体DNA、病毒DNA或外源DNA。
根据某些方面,提供了调控细胞中靶标核酸表达的方法,其包括向所述细胞引入编码与DNA(脱氧核糖核酸)互补的一种或多种RNA(核糖核酸)的第一外源核酸,其中所述DNA包括靶标核酸,向所述细胞引入编码结合至DNA并由一种或多种RNA导向的核酸酶无效的Cas9蛋白的第二外源核酸,向所述细胞引入编码转录调控因子蛋白或结构域的第三外源核酸,其中表达了所述一种或多种RNA、核酸酶无效的Cas9蛋白和转录调控因子蛋白或结构域,其中所述一种或多种RNA、核酸酶无效的Cas9蛋白和转录调控因子蛋白或结构域共定位至所述DNA并且其中所述转录调控因子蛋白或结构域调控所述靶标核酸的表达。
根据一个方面,编码核酸酶无效的Cas9蛋白的外源核酸还编码了融合至核酸酶无效的Cas9蛋白的转录调控因子蛋白或结构域。根据一个方面,编码一种或多种RNA的外源核酸还编码了RNA结合结构域的靶标,并且编码转录调控因子蛋白或结构域的外源核酸还编码了融合至转录调控因子蛋白或结构域的RNA结合结构域。
根据一个方面,所述细胞是真核细胞。根据一个方面,所述细胞是酵母细胞、植物细胞或动物细胞。根据一个方面,所述细胞是哺乳动物细胞。
根据一个方面,所述RNA为约10至约500个核苷酸。根据一个方面,所述RNA为约20至约100个核苷酸。
根据一个方面,所述转录调控因子蛋白或结构域是转录活化因子。根据一个方面,所述转录调控因子蛋白或结构域上调靶标核酸的表达。根据一个方面,所述转录调控因子蛋白或结构域上调靶标核酸的表达以治疗疾病或有害状况。根据一个方面,所述靶标核酸与疾病或有害状况有关。
根据一个方面,一种或多种RNA是向导RNA。根据一个方面,一种或多种RNA是tracrRNA-crRNA融合体。
根据一个方面,所述DNA是基因组DNA、线粒体DNA、病毒DNA或外源DNA。
根据一个方面,提供了细胞,所述细胞包括编码与DNA互补的一种或多种RNA的第一外源核酸,其中所述DNA包括靶标核酸,编码RNA导向核酸酶无效的DNA结合蛋白的第二外源核酸和编码转录调控因子蛋白或结构域的第三外源核酸,其中所述一种或多种RNA、RNA导向核酸酶无效的DNA结合蛋白和转录调控因子蛋白或结构域是靶标核酸的共定位复合物的元件(成员,member)。
根据一个方面,编码RNA导向核酸酶无效的DNA结合蛋白的外源核酸还编码融合至RNA导向核酸酶无效的DNA结合蛋白的转录调控因子蛋白或结构域。根据一个方面,编码一种或多种RNA的外源核酸还编码了RNA结合结构域的靶标,并且编码转录调控因子蛋白或结构域的外源核酸还编码了融合至转录调控因子蛋白或结构域的RNA结合结构域。
根据一个方面,所述细胞是真核细胞。根据一个方面,所述细胞是酵母细胞、植物细胞或动物细胞。根据一个方面,所述细胞是哺乳动物细胞。
根据一个方面,所述RNA为约10至约500个核苷酸。根据一个方面,所述RNA为约20至约100个核苷酸。
根据一个方面,所述转录调控因子蛋白或结构域是转录活化因子。根据一个方面,所述转录调控因子蛋白或结构域上调靶标核酸的表达。根据一个方面,所述转录调控因子蛋白或结构域上调靶标核酸的表达以治疗疾病或有害状况。根据一个方面,所述靶标核酸与疾病或有害状况有关。
根据一个方面,一种或多种RNA是向导RNA。根据一个方面,一种或多种RNA是tracrRNA-crRNA融合体。
根据一个方面,所述DNA是基因组DNA、线粒体DNA、病毒DNA或外源DNA。
根据某些方面,所述RNA导向核酸酶无效的DNA结合蛋白是II型CRISPR系统的RNA导向核酸酶无效的DNA结合蛋白。根据某些方面,所述RNA导向核酸酶无效的DNA结合蛋白是核酸酶无效的Cas9蛋白。
根据一个方面,提供了改变细胞中DNA靶标核酸的方法,所述方法包括向所述细胞引入编码两种或更多种RNA的第一外源核酸,其中每种RNA与DNA靶标核酸中相邻位点互补,向所述细胞引入编码至少一种RNA导向的DNA结合蛋白切口酶(nickase)并由两种或更多种RNA导向的第二外源核酸,其中表达了所述两种或更多种RNA和所述至少一种RNA导向的DNA结合蛋白切口酶并且其中所述至少一种RNA导向的DNA结合蛋白切口酶与所述两种或更多种RNA共定位至DNA靶标核酸并且切割(nick)DNA靶标核酸,从而导致产生了两个或更多个相邻的切口(nick)。
根据一个方面,提供了改变细胞中DNA靶标核酸的方法,所述方法包括向所述细胞引入编码两种或更多种RNA的第一外源核酸,其中每种RNA与DNA靶标核酸中相邻位点互补,向所述细胞引入编码至少一种II型CRISPR系统的RNA导向的DNA结合蛋白切口酶并由两种或更多种RNA导向的第二外源核酸,其中表达了所述两种或更多种RNA和所述至少一个II型CRISPR系统的RNA导向的DNA结合蛋白切口酶并且其中所述至少一种II型CRISPR系统的RNA导向的DNA结合蛋白切口酶与所述两种或更多种RNA共定位至DNA靶标核酸并且切割DNA靶标核酸,从而导致产生了两个或更多个相邻的切口。
根据一个方面,提供了改变细胞中DNA靶标核酸的方法,所述方法包括向所述细胞引入编码两种或更多种RNA的第一外源核酸,其中每种RNA与DNA靶标核酸中相邻位点互补,向所述细胞引入编码至少一种Cas9蛋白切口酶的第二外源核酸,所述切口酶具有一个非活性核酸酶结构域并由两种或更多种RNA导向,其中表达了所述两种或更多种RNA和所述至少一种Cas9蛋白切口酶并且其中所述至少一种Cas9蛋白切口酶与所述两种或更多种RNA共定位至DNA靶标核酸并且切割DNA靶标核酸,从而导致产生了两个或更多个相邻的切口。
根据改变DNA靶标核酸的方法,所述两个或更多个相邻切口在双链DNA的相同链上。根据一个方面,所述两个或更多个相邻切口在双链DNA的相同链上并导致产生了同源重组。根据一个方面,所述两个或更多个相邻切口在双链DNA的不同链上。根据一个方面,所述两个或更多个相邻切口在双链DNA的不同链上并且产生了双链断裂。根据一个方面,所述两个或更多个相邻切口在双链DNA的不同链上并且产生了双链断裂,从而导致产生了非同源末端接合(nonhomologous end joining)。根据一个方面,所述两个或更多个相邻切口在双链DNA的不同链上并且彼此之间相对偏移。根据一个方面,所述两个或更多个相邻切口在双链DNA的不同链上并且彼此之间相对偏移,并产生了双链断裂。根据一个方面,所述两个或更多个相邻切口在双链DNA的不同链上并且彼此之间相对偏移,并产生了双链断裂,从而导致产生了非同源末端接合。根据一个方面,所述方法还包括向所述细胞引入编码供体核酸序列的第三外源核酸,其中所述两个或更多个切口导致产生了靶标核酸与供体核酸序列的同源重组。
根据一个方面,提供了改变细胞中DNA靶标核酸的方法,所述方法包括向所述细胞引入编码两种或更多种RNA的第一外源核酸,其中每种RNA与DNA靶标核酸中相邻位点互补,向所述细胞引入编码至少一种RNA导向的DNA结合蛋白切口酶并且由两种或更多种RNA导向的第二外源核酸,并且其中表达了所述两种或更多种RNA和所述至少一种RNA导向的DNA结合蛋白切口酶,并且其中所述至少一种RNA导向的DNA结合蛋白切口酶与所述两种或更多种RNA共定位至DNA靶标核酸并且切割DNA靶标核酸,从而导致产生了两个或更多个相邻切口,并且其中所述两个或更多个相邻切口在双链DNA的不同链上并产生了双链断裂,从而导致靶标核酸片段化(断裂,fragmentation),借此防止靶标核酸的表达。
根据一个方面,提供了改变细胞中DNA靶标核酸的方法,所述方法包括向所述细胞引入编码两种或更多种RNA的第一外源核酸,其中每种RNA与DNA靶标核酸中相邻位点互补,向所述细胞引入编码至少一种II型CRISPR系统的RNA导向的DNA结合蛋白切口酶并且由两种或更多种RNA导向的第二外源核酸,并且其中表达了所述两种或更多种RNA和所述至少一个II型CRISPR系统的RNA导向的DNA结合蛋白切口酶,并且其中所述至少一种II型CRISPR系统的RNA导向的DNA结合蛋白切口酶与所述两种或更多种RNA共定位至DNA靶标核酸并且切割DNA靶标核酸,从而导致产生了两个或更多个相邻切口,并且其中所述两个或更多个相邻切口在双链DNA的不同链上并产生了双链断裂,从而导致靶标核酸片段化,借此防止靶标核酸的表达。
根据一个方面,提供了改变细胞中DNA靶标核酸的方法,所述方法包括向所述细胞引入编码两种或更多种RNA的第一外源核酸,其中每种RNA与DNA靶标核酸中相邻位点互补,向所述细胞引入编码至少一种具有一个非活性核酸酶结构域的Cas9蛋白切口酶并且由两种或更多种RNA导向的第二外源核酸,并且其中表达了所述两种或更多种RNA和所述至少一种Cas9蛋白切口酶,并且其中所述至少一种Cas9蛋白切口酶与所述两种或更多种RNA共定位至DNA靶标核酸并且切割DNA靶标核酸,从而导致产生了两个或更多个相邻切口,并且其中所述两个或更多个相邻切口在双链DNA的不同链上并产生了双链断裂,从而导致靶标核酸片段化,借此防止靶标核酸的表达。
根据一个方面,提供了细胞,所述细胞包括编码两种或更多种RNA的第一外源核酸,其中每种RNA与DNA靶标核酸中相邻位点互补,和编码至少一种RNA导向的DNA结合蛋白切口酶的第二外源核酸,并且其中所述两种或更多种RNA和所述至少一种RNA导向的DNA结合蛋白切口酶是DNA靶标核酸的共定位复合物的元件。
根据一个方面,所述RNA导向的DNA结合蛋白切口酶是II型CRISPR系统的RNA导向的DNA结合蛋白切口酶。根据一个方面,所述RNA导向的DNA结合蛋白切口酶是具有一个非活性核酸酶结构域的Cas9蛋白切口酶。
根据一个方面,所述细胞是真核细胞。根据一个方面,所述细胞是酵母细胞、植物细胞或动物细胞。根据一个方面,所述细胞是哺乳动物细胞。
根据一个方面,所述RNA包括约10至约500个核苷酸。根据一个方面,所述RNA包括约20至约100个核苷酸。
根据一个方面,所述靶标核酸与疾病或有害状况有关。
根据一个方面,所述两种或更多种RNA是向导RNA。根据一个方面,所述两种或更多种RNA是tracrRNA-crRNA融合体。
根据一个方面,所述DNA靶标核酸是基因组DNA、线粒体DNA、病毒DNA或外源DNA。
在以下本发明实施方式和附图的说明中并且根据权利要求,本发明某些实施方式的其它特征和优势将变得更加充分而明显。
附图说明
本专利或专利申请文件包含彩图。通过索取并付出必要的费用,官方将提供带有彩图的本专利或专利申请公开的复制件。根据以下与附图结合的说明性实施方式的详细说明,将更充分地理解本发明实施方式的上述及其它特征和优势,其中:
图1A和图1B是RNA导向的转录激活的示意图。图1C是报告子构建体的设计。图1D显示了数据,该数据表明Cas9N-VP64融合体显示了RNA导向的转录激活,如通过荧光激活细胞分类术(荧光激活细胞分选,FACS)和免疫荧光测定(IF)两者所测定的。图1E显示了FACS的测定数据,1F显示了在存在Cas9N、MS2-VP64和具有适当MS2适体(aptamer)结合位点的gRNA的情况下来自报告子构建体的gRNA序列特异性转录激活。图1F显示了数据,该数据显示了通过单个gRNA和多个gRNA的转录诱导。
图2A显示了评价Cas9-gRNA复合物和TALE靶向谱图(landscape)的方法。图2B显示了数据,该数据表明平均来说,Cas9-gRNA复合物对其靶标序列中的1-3个突变耐受。图2C显示了数据,该数据表明除了定位至PAM序列的那些之外,Cas9-gRNA复合物在很大程度上对点突变不敏感。图2D显示了热图数据(heat plot data),其表明2个碱基错配的引入显著损害了Cas9-gRNA复合物活性。图2E显示了数据,该数据表明平均来说,18聚体(18-mer)TALE显示对其靶标序列中的1-2个突变耐受。图2F显示了数据,该数据表明与Cas9-gRNA复合物类似,18聚体TALE在很大程度上对其靶标中错配的单碱基不敏感。图2G显示了热图数据,其表明2个碱基错配的引入显著损害了18聚体TALE的活性。
图3A显示了向导RNA设计的示意图。图3B显示了数据,该数据显示了对于导致5'突出的偏移切口(off-set nicks)和导致3'突出的偏移切口的非同源末端接合的百分比。图3C显示了数据,该数据显示了对于导致5'突出(overhang)的偏移切口和导致3'突出的偏移切口的靶向(targeting)的百分比。
图4A是RuvC PDB ID:4EP4(蓝色)位置D7(左图)中金属配位残基的示意图,来自PDB ID的HNH核酸内切酶结构域的示意图:3M7K(橙色)和4H9D(青色),其包括配位的Mg-离子(灰色球体)和来自3M7K的DNA(紫色)(中图),和分析的突变体列表(右图)。图4B显示了数据,该数据显示了对于Cas9突变体m3和m4的不可检测的核酸酶活性,以及它们各个与VP64的融合。图4C是图4B中数据的高分辨率检查。
图5A是确定Cas9-gRNA活性的同源重组测定的示意图。图5B显示了具有随机序列插入的向导RNA以及同源重组的百分比。
图6A是OCT4基因的向导RNA的示意图。图6B显示了对于启动子-荧光素酶报告子构建体的转录激活。图6C显示了通过内源基因的qPCR的转录激活。
图7A是REX1基因的向导RNA的示意图。图7B显示了对于启动子-荧光素酶报告子构建体的转录激活。图7C显示了通过内源基因的qPCR的转录激活。
图8A显示了用于计算归一化(normalized)表达水平的高水平特异性分析处理流程的示意图。图8B显示了对于偏倚构建体文库(biasedconstruct library)内产生的错配数目的结合位点百分比的分布数据。左图:理论分布。右图:从真实(实际的,actual)TALE构建体文库观察到的分布。图8C显示了对于错配数目的聚集至结合位点的标签计数(tagcount)的百分比分布数据。左图:从阳性对照样品观察的分布。右图:从其中诱导了非控制TALE(non-control TALE)的样品观察的分布。
图9A显示了对于Cas9-gRNA复合物的靶标谱图的分析数据,其显示了对其靶标序列中1-3个突变的耐受。图9B显示了对于Cas9-gRNA复合物的靶标谱图的分析数据,其显示除了定位至PAM序列的那些之外,对点突变不敏感。图9C显示了对于Cas9-gRNA复合物的靶向谱图分析的热图数据,该数据显示2个碱基错配的引入显著损害了活性。图9D显示了来自核酸酶介导的HR测定的数据,其确认了化脓性链球菌(S.pyogenes)Cas9预测的PAM是NGG,还有NAG。
图10A显示了来自核酸酶介导的HR测定的数据,其确认18聚体TALE耐受其靶标序列中的多个突变。图10B显示了3种不同大小(18聚体、14聚体和10聚体)的TALE的靶向谱图的分析数据。图10C显示10聚体TALE的数据,显示了接近单碱基错配的分辨率。图10D显示10聚体TALE的热图数据,显示了接近单碱基错配的分辨率。
图11A显示了设计的向导RNA。图11B显示了多个向导RNA的非同源末端接合的百分比。
图12A显示了Sox2基因。图12B显示了Nanog基因。
图13A-13F显示了两个其它Cas9-gRNA复合物的靶向图谱。
图14A显示了两种gRNA(野生型(SEQ ID NO:88)和突变型(SEQ ID NO:89-90))的特异性谱图。用红色突出显示序列差异。图14B和14C显示了该测定对正在评价的gRNA是特异性的(根据图13D重新作图的数据)。
图15A-15D显示了在相对于靶标的间隔序列中具有单碱基或双碱基错配(红色突出显示)的gRNA2(图15A-B)和gRNA3(图15C-D)。序列如SEQ ID NO:91-131中所示。
图16A-16D显示了使用核酸酶测定测试的2个独立gRNA:在它们间隔子的5'端具有截短的gRNAl(图16A-B)和gRNA3(图16C-D)。序列如SEQ ID NO:66、185-186和133-140所示。
图17A-17B显示了使用核酸酶介导的HR测定确认了化脓性链球菌(S.pyogenes)Cas9的PAM是NGG,还有NAG。序列如SEQ ID NO:67-69和141所示。
图18A-18B显示了使用核酸酶介导的HR测定确认18聚体TALE耐受其靶标序列中的多个突变。序列如SEQ ID NO:70-73所示。
图19A-19C显示了TALE单体特异性相对于TALE蛋白特异性的比较。序列如SEQ IDNO:142-150所示。
图20A-20B显示了与偏移切口(off-set nicking)有关的数据。序列如SEQ ID NO:151-158所示。
图21A-21C显示了偏移切口和NHEJ谱图。序列如SEQ ID NO:159-184和187所示。
具体实施方式
本发明公开的实施方式基于以调控靶标核酸的方式将转录调控因子蛋白或结构域共定位至DNA的DNA结合蛋白的应用。本领域技术人员容易知晓这些DNA结合蛋白出于多种目的结合至DNA。这些DNA结合蛋白可以是天然存在的。包括在本发明公开范围内的DNA结合蛋白包括可以由在本文中称为向导RNA(guide RNA)的RNA导向的那些。根据这一方面,向导RNA和RNA导向的DNA结合蛋白在DNA上形成了共定位复合物。根据某些方面,所述DNA结合蛋白可以是核酸酶无效的DNA结合蛋白(nuclease-null DNA binding protein)。根据这一方面,所述核酸酶无效的DNA结合蛋白可以通过具有核酸酶活性的DNA结合蛋白的改变或修饰产生。具有核酸酶活性的这些DNA结合蛋白是本领域技术人员已知的,并且包括天然存在的具有核酸酶活性的DNA结合蛋白,如存在于(例如)II型CRISPR系统中的Cas9蛋白。在本领域中很好地记录了这些Cas9蛋白和II型CRISPR系统。参见Makarova等人,Nature Reviews,Microbiology,第9卷,June 2011,第467-477页(包括所有补充信息),其以其全部内容作为参考并入本文。
示例性的具有核酸酶活性的DNA结合蛋白起作用来造成切口或切割双链DNA。这些核酸酶活性可以通过具有显示出核酸酶活性的一个或多个多肽序列的DNA结合蛋白产生。这些示例性DNA结合蛋白可以具有两个不同的核酸酶结构域,其中每个结构域分别负责切割双链DNA的特定链或为其造成切口。本领域技术人员已知的示例性的具有核酸酶活性的多肽序列包括McrA-HNH核酸酶相关结构域和RuvC-样核酸酶结构域。因此,示例性DNA结合蛋白是本质上含有McrA-HNH核酸酶相关结构域和RuvC-样核酸酶结构域中的一个或多个的那些。根据某些方面,改变或另外修饰所述DNA结合蛋白以使核酸酶活性失活。这些改变或修饰包括改变一个或多个氨基酸以使核酸酶活性或核酸酶结构域失活。这些修饰包括除去显示出核酸酶活性的一个或多个多肽序列(即核酸酶结构域),从而使得在所述DNA结合蛋白中不存在显示出核酸酶活性的一个或多个多肽序列(即核酸酶结构域)。基于本发明公开,使核酸酶活性失活的其它修饰将对本领域技术人员是显而易见的。因此,核酸酶无效的DNA结合蛋白包括经修饰而使核酸酶活性失活的多肽序列或使核酸酶活性失活的一个或多个多肽序列的去除。即使核酸酶活性失活,核酸酶无效的DNA结合蛋白保留了与DNA结合的能力。因此,DNA结合蛋白包括DNA结合所需的一个或多个多肽序列,但是可以缺少显示出核酸酶活性的一种或多种或者全部核酸酶序列。因此,DNA结合蛋白包括DNA结合所需的一个或多个多肽序列,但是可以具有显示出失活的核酸酶活性的一种或多种或者全部核酸酶序列。
根据一个方面,可以修饰或改变具有两个或更多个核酸酶结构域的DNA结合蛋白使除所述核酸酶结构域之一以外的核酸酶结构域都失活。该修饰或改变的DNA结合蛋白被称为DNA结合蛋白切口酶,从而所述DNA结合蛋白仅对双链DNA中的一条链切割或造成切口。当通过RNA导向至DNA时,所述DNA结合蛋白切口酶被称为RNA导向的DNA结合蛋白切口酶。
示例性的DNA结合蛋白是缺少核酸酶活性的II型CRISPR系统的RNA导向的DNA结合蛋白。示例性的DNA结合蛋白是核酸酶无效的Cas9蛋白。示例性的DNA结合蛋白是Cas9蛋白切口酶。
在化脓性链球菌(S.pyogenes)中,通过蛋白质中两个催化结构域:切割DNA互补链的HNH结构域和切割非互补链的RuvC样结构域介导的过程,Cas9产生了前间区序列邻近基序(PAM,protospacer-adjacent motif)上游3bp的钝性末端(平头末端,blunt-ended)双链断裂。参见Jinke等人,Science 337,816-821(2012),该文献以其全部内容作为参考并入本文。已知Cas9蛋白存在于多种II型CRISPR系统中,包括下列:如在Makarova等人,NatureReviews,Microbiology,第9卷,June 2011,第467-477页的补充信息中鉴别的:海沼甲烷球菌(Methanococcus maripaludis)C7;白喉棒杆菌(Corynebacterium diphtheriae);有效棒杆菌(Corynebacterium efficiens)YS-314;乳发酵短杆菌(Corynebacteriumglutamicum)ATCC 13032Kitasato;乳发酵短杆菌(Corynebacterium glutamicum)ATCC13032Bielefeld;乳发酵短杆菌R(Corynebacterium glutamicum R);克氏棒杆菌(Corynebacterium kroppenstedtii)DSM 44385;脓肿分枝杆菌(Mycobacteriumabscessus)ATCC 19977;皮诺卡氏菌(Nocardia farcinica)IFM10152;灰暗诺卡氏菌诺卡氏菌(Rhodococcus erythropolis)PR4;Rhodococcus jostii RHA1;混浊红球菌(Rhodococcus opacus)B4 uid36573;解纤维热酸菌(Acidothermus cellulolyticus)11B;氯酚节杆菌(Arthrobacter chlorophenolicus)A6;Kribbella flavida DSM17836uid43465;弯曲嗜热单孢菌(Thermomonospora curvata)DSM 43183;齿双歧杆菌(Bifidobacterium dentium)Bdl;长双歧杆菌(Bifidobacterium longum)DJO10A;Slackiaheliotrinireducens DSM 20476;Persephonella marina EX HI;脆弱拟杆菌(Bacteroides fragilis)NCTC 9434;黄褐二氧化碳嗜纤维菌(Capnocytophaga ochracea)DSM 7271;嗜冷黄杆菌(Flavobacterium psychrophilum)JIP02 86;嗜粘蛋白阿克曼氏菌(Akkermansia muciniphila)ATCC BAA 835;卡斯特玫瑰弯菌(Roseiflexuscastenholzii)DSM 13941;玫瑰弯菌(Roseiflexus)RSI;集胞蓝细菌属(Synechocystis)PCC6803;微小亚历山大藻(Elusimicrobium minutum)Peil91;未培养的白蚁1组细菌种系型(uncultured Termite group 1bacterium phylotype)Rs D17;产琥珀酸丝状杆菌(Fibrobacter succinogenes)S85;蜡状芽孢杆菌(Bacillus cereus)ATCC 10987;英诺克李斯特菌(Listeria innocua);干酪乳杆菌(Lactobacillus casei);鼠李糖乳杆菌(Lactobacillus rhamnosus)GG;唾液乳杆菌(Lactobacillus salivarius)UCC118;无乳链球菌(Streptococcus agalactiae)A909;无乳链球菌(Streptococcus agalactiae)NEM316;无乳链球菌(Streptococcus agalactiae)2603;停乳链球菌马样亚种(Streptococcus dysgalactiae equisimilis)GGS 124;马链球菌兽瘟亚种(Streptococcus equi zooepidemicus)MGCS10565;解没食子酸链球菌(Streptococcusgallolyticus)UCN34 uid46061;格氏链球菌(Streptococcus gordonii)Challis亚种CHI;变形链球菌(Streptococcus mutans)NN2025 uid46353;变形链球菌(Streptococcusmutans);酿脓链球菌(Streptococcus pyogenes)Ml GAS;酿脓链球菌(Streptococcuspyogenes)MGAS5005;酿脓链球菌(Streptococcus pyogenes)MGAS2096;酿脓链球菌(Streptococcus pyogenes)MGAS9429;酿脓链球菌(Streptococcus pyogenes)MGAS10270;酿脓链球菌(Streptococcus pyogenes)MGAS6180;酿脓链球菌(Streptococcus pyogenes)MGAS315;酿脓链球菌(Streptococcus pyogenes)SSI-1;酿脓链球菌(Streptococcuspyogenes)MGAS10750;酿脓链球菌(Streptococcus pyogenes)NZ131;嗜热链球菌(Streptococcus thermophiles)CNRZ1066;嗜热链球菌(Streptococcus thermophiles)LMD-9;嗜热链球菌(Streptococcus thermophiles)LMG 18311;肉毒梭状芽孢杆菌(Clostridium botulinum)A3 Loch Maree;肉毒梭状芽孢杆菌(Clostridium botulinum)BEklund 17B;肉毒梭状芽孢杆菌(Clostridium botulinum)Ba4 657;肉毒梭状芽孢杆菌(Clostridium botulinum)F Langeland;解纤维梭菌(Clostridium cellulolyticum)H10;大芬戈尔德菌(Finegoldia magna)ATCC 29328;直肠真杆菌(Eubacterium rectale)ATCC33656;鸡败血支原体(Mycoplasmagallisepticum);运动支原体(Mycoplasma mobile)163K;穿透支原体(Mycoplasma penetrans);关节液支原体(Mycoplasma synoviae)53;鼠放线菌(Streptobacillus moniliformis)DSM 12112;慢生根瘤菌(Bradyrhizobium)BTAil;汉堡硝化杆菌(Nitrobacter hamburgensis)X14;Rhodopseudomonas palustrisBisB18;Rhodopseudomonas palustris BisB5;食清洁剂细小棒菌(Parvibaculumlavamentivorans)DS-1;Dinoroseobacter shibae DFL 12;重氮营养葡糖酸醋杆菌(Gluconacetobacter diazotrophicus)Pal 5FAPERJ;重氮营养葡糖酸醋杆菌(Gluconacetobacter diazotrophicus)Pal 5JGI;固氮螺菌(Azospirillum)B510uid46085;深红红螺菌(Rhodospirillum rubrum)ATCC 11170;Diaphorobacter TPSYuid29975;艾森虹蝴肾杆菌(Verminephrobacter eiseniae)EF01-2;脑膜炎奈瑟氏球菌(Neisseria meningitides)053442;脑膜炎奈瑟氏球菌(Neisseriameningitides)αl4;脑膜炎奈瑟氏球菌(Neisseria meningitides)Z2491;需盐脱硫弧菌(Desulfovibriosalexigens)DSM 2638;空肠弯曲菌(Campylobacter jejuni)doylei 269 97;空肠弯曲菌(Campylobacter jejuni)81116;空肠弯曲菌(Campylobacter jejuni);红嘴鸥弯曲杆菌(Campylobacter lari)RM2100;肝螺杆菌(Helicobacter hepaticus);产琥珀酸沃林氏菌(Wolinella succinogenes);奥氏甲苯单胞菌(Tolumonas auensis)DSM9187;大西洋假交替单胞菌(Pseudoalteromonas atlantica)T6c;乌贼希瓦菌(Shewanella pealeana)ATCC700345;侵肺军团菌(Legionellapneumophila)Paris;产琥珀酸放线杆菌(Actinobacillussuccinogenes)130Z;多杀杆菌(Pasteurella multocida);野兔热弗朗西丝氏菌(Francisellatularensis)novicida U112;野兔热弗朗西丝氏菌(Francisellatularensis)holarctica;野兔热弗朗西丝氏菌(Francisella tularensis)FSC 198;野兔热弗朗西丝氏菌(Francisella tularensis)tularensis;野兔热弗朗西丝氏菌(Francisella tularensis)WY96-3418;和齿垢密螺旋体(Treponema denticola)ATCC35405。因此,本发明公开的方面涉及存在于II型CRISPR系统中的Cas9蛋白,其使得核酸酶无效或使得成为如本文所述的切口酶。
在文献中,本领域技术人员可以将Cas9蛋白称为Csnl。以下显示了作为本文所述实验的主体的化脓性链球菌(S.pyogenes)Cas9蛋白序列。参见Deltcheva等人,Nature471,602-607(2011),该文献以其全部内容作为参考并入本文。
Figure BDA0003175539690000151
根据本文所述的RNA导向的基因组调控方法的某些方面,改变Cas9以降低、显著降低或消除核酸酶活性。根据一个方面,通过改变RuvC核酸酶结构域或HNH核酸酶结构域来降低、显著降低或消除Cas9核酸酶活性。根据一个方面,使RuvC核酸酶结构域失活。根据一个方面,使HNH核酸酶结构域失活。根据一个方面,使RuvC核酸酶结构域和HNH核酸酶结构域失活。根据其它方面,提供了Cas9蛋白,其中RuvC核酸酶结构域和HNH核酸酶结构域失活。根据其它方面,提供了RuvC核酸酶结构域和HNH核酸酶结构域失活的程度的核酸酶无效的Cas9蛋白。根据其它方面,提供了Cas9切口酶,其中RuvC核酸酶结构域或者HNH核酸酶结构域中的任一个失活,借此使剩余的核酸酶结构域对于核酸酶活性保持活性。以这样的方式,仅对双链DNA的一条链切割或造成切口。
根据其它方面,提供了核酸酶无效的Cas9蛋白,其中改变或另外除去Cas9中的一个或多个氨基酸以提供核酸酶无效的Cas9蛋白。根据一个方面,所述氨基酸包括D10和H840。参见Jinke等人,Science 337,816-821(2012)。根据其它方面,所述氨基酸包括D839和N863。根据一个方面,用降低、基本消除或消除核酸酶活性的氨基酸取代D10、H840、D839和H863中的一个或多个。根据一个方面,用丙氨酸取代D10、H840、D839和H863中的一个或多个或全部。根据一个方面,具有被降低、基本消除或消除核酸酶活性的氨基酸(如丙氨酸)取代的D10、H840、D839和H863中的一个或多个或全部的Cas9蛋白被称为核酸酶无效的Cas9或Cas9N并且其显示出降低或消除的核酸酶活性,或者在检测水平范围内不存在或基本不存在核酸酶活性。根据这一方面,使用已知测定,Cas9N的核酸酶活性可以是不可检测的,即低于已知测定的检测水平。
根据一个方面,核酸酶无效的Cas9蛋白包括保留了所述蛋白质结合DNA并由RNA导向的能力的它的同源物(homolog)和直系同源物(ortholog)。根据一个方面,核酸酶无效的Cas9蛋白包括如对来自化脓性链球菌(S.pyogenes)的天然存在的Cas9所描述的并且具有被丙氨酸取代的D10、H840、D839和H863中的一个或多个或全部的序列,和与其具有至少30%、40%、50%、60%、70%、80%、90%、95%、98%或99%的同源性并且是DNA结合蛋白的蛋白质序列,如RNA导向的DNA结合蛋白。
根据一个方面,核酸酶无效的Cas9蛋白包括除了RuvC核酸酶结构域和HNH核酸酶结构域的蛋白质序列之外的如对来自化脓性链球菌(S.pyogenes)的天然存在的Cas9所描述的序列,以及与其具有至少30%、40%、50%、60%、70%、80%、90%、95%、98%或99%的同源性并且是DNA结合蛋白的蛋白质序列,如RNA导向的DNA结合蛋白。以这样的方式,本发明公开的方面包括负责DNA结合,例如,负责与向导RNA共定位和结合至DNA的蛋白质序列以及与其同源的蛋白质序列,并且不需要包括RuvC核酸酶结构域和HNH核酸酶结构域的蛋白质序列(至DNA结合不需要的程度),这是因为这些结构域可以是失活的或从天然存在的Cas9蛋白的蛋白质序列中除去以产生核酸酶无效的Cas9蛋白。
出于本发明公开的目的,图4A显示了与Cas9具有同源性的已知蛋白质结构中的金属配位残基。基于Cas9序列中的位置标记残基。左图:RuvC结构,PDB ID:4EP4(蓝色)位置D7,其对应于Cas9序列中的D10,并将其在Mg-离子配位位置突出显示。中图:来自PDB ID:3M7K(橙色)和4H9D(青色)的HNH核酸内切酶结构域的结构,其包括配位的Mg-离子(灰色球体)和来自3M7K的DNA(紫色)。3M7K和4H9D位置D53和N77中的残基D92和N113,其对Cas9氨基酸D839和N863具有序列同源性,并将其显示为棒状(stick)。右图:制备并分析核酸酶活性的突变体列表:Cas9野生型;用丙氨酸取代D10的Cas9m1;用丙氨酸取代D10并用丙氨酸取代H840的Cas9m2;用丙氨酸取代D10、用丙氨酸取代H840和用丙氨酸取代D839的Cas9m3;以及用丙氨酸取代D10、用丙氨酸取代H840、用丙氨酸取代D839、用丙氨酸取代N863的Cas9m4。
如图4B所示,通过靶标位点的深度测序,Cas9突变体:m3和m4以及它们各自与VP64的融合体显示出不可检测的核酸酶活性。图显示了相对于基因组位置的突变频率,其中红线划分了gRNA靶标。图4C是图4B中数据的高分辨率检查,并且该图确认突变图谱(mutationlandscape)显示了与未修饰位点可比较的谱图。
根据一个方面,提供了工程设计的Cas9-gRNA系统,其通过将转录激活结构域连接至核酸酶无效的Cas9或向导RNA使得能够在人细胞中进行RNA导向的基因组调控。根据本发明公开的一个方面,将一个或多个转录调节蛋白或结构域(这些术语是可互换使用的)结合或以其他方式连接到核酸酶缺乏型Cas9或者一个或多个向导RNA(gRNA)。转录调控结构域对应于靶标位点。因此,本发明公开的方面包括通过将这些结构域融合、连接或结合至Cas9N或gRNA中的任一个来将转录调控结构域定位至靶标位点的方法和材料。
根据一个方面,提供了能够转录激活的Cas9N-融合蛋白。根据一个方面,VP64激活结构域(参见Zhang等人,Nature Biotechnology 29,149-153(2011),该文献以其全部内容作为参考并入本文)结合、融合、连接或以其他方式链接(tether)至Cas9N的C末端。根据一个方法,通过Cas9N蛋白向靶标基因组DNA的位点提供了转录调控结构域。根据一个方法,在细胞内与一个或多个向导RNA一起提供了融合至转录调控结构域的Cas9N。具有融合其上的转录调控结构域的Cas9N结合在靶标基因组DNA处或附近。一个或多个向导RNA结合在靶标基因组DNA处或附近。转录调控结构域调控靶标基因的表达。根据具体方面,当与启动子附近的gRNA靶标序列结合时,Cas9N-VP64融合体激活了报告子构建体的转录,借此显示RNA导向的转录激活。
根据一个方面,提供了能够转录激活的gRNA-融合蛋白。根据一个方面,将VP64激活结构域结合、融合、连接或以其他方式链接至gRNA。根据一个方法,通过gRNA向靶标基因组DNA的位点提供了转录调控结构域。根据一个方法,在细胞内与Cas9N蛋白一起提供了融合至转录调控结构域的gRNA。Cas9N结合在靶标基因组DNA处或附近。具有融合其上的转录调控蛋白或结构域的一个或多个向导RNA结合在靶标基因组DNA处或附近。转录调控结构域调控靶标基因的表达。根据具体方面,Cas9N蛋白和与转录调控结构域融合的gRNA激活了报告子构建体的转录,借此显示RNA导向的转录激活。
通过将随机序列插入到gRNA并测定Cas9的功能,鉴别了将耐受修饰的gRNA的区域,从而构建了能够转录调控的gRNA链(tether)。在嵌合gRNA的crRNA部分的5'端或tracrRNA部分的3'端具有随机序列插入的gRNA保留了功能性,同时嵌合gRNA的tracrRNA支架部分中的插入导致功能丧失。参见图5A-B,其总结了gRNA对随机碱基插入的灵活性。图5A是确定Cas9-gRNA活性的同源重组(HR)测定的示意图。如图5B所示,在嵌合gRNA的crRNA部分的5'端或tracrRNA部分的3'端具有随机序列插入的gRNA保留了功能性,同时嵌合gRNA的tracrRNA支架部分中的插入导致功能丧失。通过红色核苷酸显示了gRNA序列中的插入点。不希望受科学理论的束缚,5'末端处随机碱基插入的活性提高可以是由于更长的gRNA的半衰期的提高所造成的。
要将VP64连接至gRNA,将MS2噬菌体外壳蛋白结合RNA茎环的两个拷贝添加(附连,append)至gRNA的3'端。参见Fusco等人,CurrentBiology.CB13,161-167(2003),该文献以其全部内容作为参考并入本文。与Cas9N和MS2-VP64融合蛋白一起表达了这些嵌合gRNA。在存在所有3种组分的情况下观察到了来自报告子构建体的序列特异性转录激活。
图1A是RNA导向的转录激活的示意图。如图1A所示,为了产生能够转录激活的Cas9N-融合蛋白,将VP64激活结构域直接链接至Cas9N的C末端。如图1B所示,为了产生能够转录激活的gRNA链,将MS2噬菌体外壳蛋白结合RNA茎环的两个拷贝添加至gRNA的3'端。与Cas9N和MS2-VP64融合蛋白一起表达了这些嵌合gRNA。图1C显示了用于测定转录激活的报告子构建体的设计。两个报告子具有不同的gRNA靶标位点,并且共有控制TALE-TF靶标位点(control TALE-TF target site)。如图1D所示,Cas9N-VP64融合体显示了RNA导向的转录激活,如通过荧光激活细胞分类术(FACS)和免疫荧光测定(IF)两者所测定的。具体地,尽管控制TALE-TF激活两个报告子,但是Cas9N-VP64融合体以gRNA序列特异性的方式激活报告子。如图1E所示,仅在存在所有3种组分:Cas9N、MS2-VP64和具有适当的MS2适体结合位点的gRNA时,通过FACS和IF两者观察到了来自报告子构建体的gRNA序列特异性转录激活。
根据某些方面,提供了使用Cas9N、一个或多个gRNA和转录调控蛋白或结构域的用于调控内源基因的方法。根据一个方面,内源基因可以是任何所需基因,在本文中称为靶标基因。根据一个示例性方面,用于调控的基因靶标包括ZFP42(REX1)和POU5F1(OCT4),两者均紧密调控参与多潜能性维持的基因。如图1F所示,对REX1基因设计了靶向转录起始位点的DNA上游的~5kb延伸的10个gRNA(用绿色突出显示了DNA酶超敏感位点)。使用启动子-荧光素酶报告子构建体(参见Takahashi等人,Cell 131 861-872(2007),该文献以其全部内容作为参考并入本文)或者直接通过内源基因的qPCR测定转录激活。
图6A-C涉及使用Cas9N-VP64的RNA导向的OCT4调控。如图6A所示,对OCT4基因设计了靶向转录起始位点的DNA上游~5kb延伸的21个gRNA。用绿色突出了DNA酶超敏感位点。图6B显示了使用启动子-荧光素酶报告子构建体的转录激活。图6C显示了直接通过内源基因的qPCR的转录激活。尽管单个gRNA的引入适度刺激了转录,但是多个gRNA协同作用以刺激稳健的多倍转录激活。
图7A-C涉及使用Cas9N、MS2-VP64和gRNA+2X-MS2适体的RNA导向的REX1调控。如图7A所示,对REX1基因设计了靶向转录起始位点的DNA上游的~5kb延伸的10个gRNA。用绿色突出了DNA酶超敏感位点。图7B显示了使用启动子-荧光素酶报告子构建体的转录激活。图7C显示了直接通过内源基因的qPCR的转录激活。尽管单个gRNA的引入适度刺激了转录,但是多个gRNA协同作用以刺激稳健的多倍转录激活。在一个方面,gRNA上2X-MS2适体的缺少不会导致转录激活。参见Maeder等人,Nature Methods 10,243-245(2013)和Perez-Pinera等人,Nature Methods 10,239-242(2013),以上每篇文献以其全部内容作为参考并入本文。
因此,方法涉及使用多个向导RNA与Cas9N蛋白和转录调控蛋白或结构域以调控靶标基因的表达。
Cas9和gRNA链接法均是有效的,其中前者显示出~1.5-2倍更高的效力。与3组分复合物装配体(复合物组装体,complex assembly)相反,这种差异可能是由于对2-组分的需要所造成的。然而,在原理上,gRNA链接法能够使不同的gRNA募集不同的效应子结构域,只要每个gRNA使用不同的RNA-蛋白质相互作用对。参见Karyer-Bibens等人,Biology ofthe Cell/Under the Auspices of the European Cell Biology Organization 100,125-138(2008),该文献以其全部内容作为参考并入本文。根据本发明公开的一个方面,可以使用特异性向导RNA和一般性Cas9N蛋白(即对于不同的靶标基因,相同或类似的Cas9N蛋白)调控不同的靶标基因。根据一个方面,提供了使用相同或相似的Cas9N的多基因调控(multiplex gene regulation)方法。
本发明公开所述的方法还涉及使用本文所述的Cas9N蛋白和向导RNA编辑靶标基因以提供人细胞的多重基因工程和表观遗传工程(epigenetic engineering)。以Cas9-gRNA靶向作为问题(参见Jiang等人,Nature Biotechnology 31,233-239(2013),该文献以其全部内容作为参考并入本文),提供了深入探询Cas9对极大空间的靶标序列变化的亲合力的方法。因此,本发明公开的方面提供了对人细胞中Cas9靶向的直接高通量数据读取,同时避免了由dsDNA切割毒性所引起的问题复杂性以及使用天然核酸酶-活性的Cas9的特异性测试所引起的致突变修复。
本发明公开的其它方面涉及一般用于靶标基因的转录调控的DNA结合蛋白或系统的应用。基于本发明公开,本领域技术人员将容易地鉴别示例性DNA结合系统。这些DNA结合系统不需要具有任何核酸酶活性,如天然存在的Cas9蛋白所具有的。因此,这些DNA结合系统不需要使核酸酶活性失活。一个示例性DNA结合系统是TALE。作为基因组编辑工具,通常使用TALE-FokI二聚体,并且对于基因组调控,已显示TAEL-VP64融合体是高度有效的。根据一个方面,使用图2A所示的方法评价TALE特异性。设计了构建体文库,其中文库的每个元素包含驱动dTomato荧光蛋白的最小启动子。在转录起始位点m的下游插入24bp(A/C/G)随机转录本标签,同时在启动子上游布置两个TF结合位点:一个是所有文库元素共有的恒定DNA序列,第二个是具有“偏倚”结合位点文库的可变特征,所述结合位点是工程设计的以跨过提供了远离靶标序列的多种突变组合的大的序列集合,设计可编程DNA靶向复合物进行结合。这是通过使用工程设计的简并寡核苷酸实现的,所述简并寡核苷酸在每个位置具有的核苷酸频率使得靶标序列核苷酸以79%的频率出现,并且彼此核苷酸以7%的频率出现。参见Patwardhan等人,Nature Biotechnology 30,265-270(2012),该文献以其全部内容作为参考并入本文。然后,对报告子文库测序以显示24bp dTomato转录本标签和它们在文库元素中相应的“偏倚”靶标位点之间的结合。转录本标签(transcript tag)较大的多样性确保标签在不同靶标之间的共有将是极少见的,而靶标序列的偏倚构建是指具有较少突变的位点将比具有较多突变的位点结合更多标签。然后,通过工程设计结合共有DNA位点的控制-TF或工程设计结合靶标位点的靶标-TF刺激dTomato报告基因的转录。通过对刺激的细胞进行RNAseq,测量了每个样品中每个表达的转录本标签的丰度,然后使用先前建立的结合表,将其制图回到它们相应的结合位点。预期控制-TF将同等程度地激发所有文库成员,这是因为所有文库元素共有其结合位点,而预期靶标-TF将表达的成员的分布偏向于它优先靶向的那些。通过将对靶标-TF所获得的标签计数除以对控制-TF(对照-TF,control-TF)所获得的那些标签计数,在步骤5中使用了该假定以计算每个结合位点的归一化表达水平。
如图2B所示,Cas9-gRNA复合物的靶向谱图显示平均来说,它对其靶标序列中的1-3个突变耐受。如图2C所示,除了定位至PAM序列的那些之外,Cas9-gRNA复合物在很大程度上还对点突变不敏感。值得注意地,该数据显示对化脓性链球菌(S.pyogenes)Cas9预测的PAM不只是NGG,还是NAG。如图2D所示,引入2个碱基错配显著损害了Cas9-gRNA复合物的活性,然而这仅当这些定位至gRNA靶标序列的3'端附近的8-10个碱基时(在热图中,从5'端开始,从1至23标记了靶标序列位置)。
使用本文所述的转录特异性测定确定了另一种广泛使用的基因组编辑工具TALE结构域的突变耐受性。如图2E所示,18聚体TALE的TALE脱靶向数据(off-targeting data)显示平均来说,它可以耐受其靶标序列中1-2个突变,但是不能激活大多数其靶标中的3碱基错配变体。如图2F所示,与Cas9-gRNA复合物类似,18聚体TALE在很大程度上对其靶标中错配的单碱基不敏感。如图2G所示,2个碱基错配的引入显著损害了18聚体TALE的活性。对于更接近其靶标序列5'端的错配,TALE活性更敏感(在热图中,从5'端开始,从1至18标记了靶标序列位置)。
使用核酸酶测定中的靶向实验确认了结果,所述核酸酶测定是针对于评价不同大小的TALE的靶向图谱的图10A-C的主体。如图10A所示,使用核酸酶介导的HR测定确认18聚体TALE耐受其靶标序列中的多个突变。如图10B所示,使用图2中所述的方法,分析了3种不同大小(18聚体、14聚体和10聚体)的TALE的靶标谱图。较短的TALE(14聚体和10聚体)在它们的靶向中逐渐更具有特异性,但是在活性方面也降低了几乎一个数量级。如图10C和10D所示,10聚体TALE显示了接近单碱基的错配分辨率,其对具有2个错配的靶标丧失了几乎全部活性(在热图中,从5'端开始,从1至10标记了靶标序列位置)。总的来说,这些数据表示工程设计的较短的TALE可以在基因组工程应用中获得较高的特异性,而TALE核酸酶应用中对FokI二聚作用的要求是避免脱靶标效应所必需的。参见Kim人,Proceedings of theNational Academy of Sciences of the United States of America 93,1156-1160(1996)和Pattanayak等人,Nature Methods 8,765-770(2011),以上每篇文献以其全部内容作为参考并入本文。
图8A-C涉及用于根据实验数据计算通过实施例说明的归一化表达水平的高水平特异性分析处理流程。如图8A所示,通过结合位点序列的偏倚分布以及将引入报告基因转录本的随机序列24bp标签(顶部)产生了构建体文库。转录的标签是高度简并的,从而它们应该对Cas9或TALE结合序列绘制多对一图(many-to-one)。对构建体文库测序(第三水平,左图)以建立与结合位点共发生的标签,从而导致产生了结合位点相对于转录标签(第4水平,左图)的结合(association)表。可以立刻使用文库条形码(在本文中用浅蓝色和浅黄色表示;水平1-4,左图)对于不同结合位点构建的多个构建体文库测序。然后,将构建体文库转染到细胞群体中,并在群体样品中诱导一组不同的Cas9/gRNA或TALE转录因子(第2水平,右图)。始终用靶向构建体内固定结合位点序列的固定TALE激活剂诱导一个样品(最高水平,绿框);该样品用作阳性对照(绿色样品,还通过+符号表示)。然后,对从诱导样品中的报告子mRNA分子产生的cDNA测序并分析以获得样品中每个标签的标签计数(第3和4水平,右图)。和构建体文库测序一样,通过附加样品条形码对多个样品(包括阳性对照)测序并分析。这里,浅红色表示已测序并用阳性对照(绿色)分析的一个非对照样品。由于在每次读数中仅转录标签出现,而构建体结合位点不出现,因此使用得自构建体文库测序的结合位点相对于标签结合表计算每个样品中的每个结合位点表达的总标签计数(第5水平)。然后,通过将它们除以阳性对照样品中获得的标签(得分,tallies),将每个非阳性对照样品的计数(得分,tallies)转化为对每个结合位点归一化的表达水平。在图2B和2E以及在图9A和图10B中提供了通过错配数目的归一化表达水平图的实例。在该整个处理流程中,未覆盖错误标签、与构建体文库不可结合的标签以及与多个结合位点明显共有的标签的一些过滤水平。图8B显示了对于偏倚构建体文库内产生的错配数目的结合位点的百分比的示例分布。左图:理论分布。右图:从真实TALE构建体文库观察到的分布。图8C显示了对于错配数目的聚集至结合位点的标签计数的百分比的示例分布。左图:从阳性对照样品观察的分布。右图:从其中诱导了非控制TALE(非对照TALE)的样品观察的分布。由于阳性对照TALE结合至构建体中的固定位点,聚集的标签计数的分布密切反映了图8B中的结合位点分布,而由于具有较少错配的位点引起较高的表达水平,因此对于非对照TALE样品,分布偏向于左侧。下图:通过将对靶标-TF所获得的标签计数除以对控制-TF获得的那些,计算这些之间的相对富集度,其显示了相对于靶标位点中突变数目的平均表达水平。
使用不同的Cas9-gRNA复合物产生的特异性数据再次证实了这些结果。图9A所示,不同的Cas9-gRNA复合物对其靶标序列中的1-3个突变耐受。如图9B所示,除了定位至PAM序列的那些之外,Cas9-gRNA复合物还在很大程度上对点突变不敏感。如图9C所示,然而2个碱基错配的引入显著损害了活性(在热图中,从5'端开始,从1至23标记了靶标序列位置)。如图9D所示,使用核酸酶介导的HR测定确认了对于化脓性链球菌(S.pyogenes)Cas9预测的PAM是NGG,还有NAG。
根据某些方面,根据本文所述的方法提高结合特异性。由于多个复合物之间的协同作用是Cas9N-VP64靶标基因激活中的因素,因此Cas9N的转录调控应用自然具有相当的特异性,这是因为单个脱靶标结合事件应具有极小影响。根据一个方面,在基因组-编辑方法中使用了偏移切口。大多数切口很少导致NHEJ事件(参见Certo等人,Nature Methods 8,671-676(2011),该文献以其全部内容作为参考并入本文),因此最大程度降低了脱靶标切口的影响。相反,对于引起基因破坏,引起偏移切口以产生双链断裂(DSB)是非常有效的。根据某些方面,与3'突出相比,5'突出产生了更显著的NHEJ事件。类似地,相比于NHEJ事件,3'突出有利于HR,尽管当产生5'突出时,HR事件的总数显著较低。因此,提供了方法用于使用切口进行同源重组和使用偏移切口以产生双链断裂从而最大程度降低脱靶标Cas9-gRNA活性的影响。
图3A-C涉及多重偏移切口(偏移切割,off-set nicking)和使用向导RNA降低脱靶标结合(脱靶结合,off-target binding)的方法。如图3A所示,一旦引入靶向的切口或断裂,使用交通信号灯报告子(traffic light reporter)同时测定HR和NHEJ事件。通过HDR途径分辨的DNA切割事件使GFP序列恢复,而致突变NHEJ导致移码,从而使GFP处于框外,而使下游mCherry序列处于框内。对于该测定,设计了覆盖200bp DNA延伸(链段,stretch)的14个gRNA:7个靶向正义链(U1-7),7个靶向反义链(D1-7)。使用在互补链上产生缺口的Cas9D10A突变体,将gRNA不同的双向组合(two-way combination)用于引起一定范围的程序化5'或3'突出(指明了14个gRNA产生切口的位点)。如图3B所示,对于引起基因破坏,引起偏移切口以产生双链断裂(DSB)是非常有效的。值得注意地,与3'突出相反,导致5'突出的偏移切口导致产生了更多的NHEJ事件。如图3C所示,产生3'突出还有利于HR相比于NHEJ事件的比值,但是当产生5'突出时,HR事件的总数显著较低。
图11A-B涉及Cas9D10A切口酶介导的NHEJ。如图11A所示,一旦引入靶向的切口或双链断裂,使用交通信号灯报告子(traffic light reporter)测定NHEJ事件。简要地,一旦引入DNA切割事件,如果断裂通过致突变NHEJ,则GFP被翻译在框外,而使得下游mCherry序列处于框内,从而导致产生红色荧光。设计了覆盖200bp DNA延伸的14个gRNA:7个靶向正义链(U1-7),7个靶向反义链(D1-7)。如图11B所示,观察到与在所有靶标中导致产生DSB和稳健NHEJ的野生型Cas9不同,大部分切口(使用Cas9D 10A突变体)很少导致NHEJ事件。所有14个位点位于邻接的200bp DNA延伸内,并且观察到靶向效力相差超过10倍。
根据某些方面,本文描述了调控细胞中靶标核酸表达的方法,其包括将一个或多个、两个或更多个、或多个外源核酸引入所述细胞。引入所述细胞的外源核酸编码一种或多种向导RNA、一种或多种核酸酶无效的Cas9蛋白和转录调控因子蛋白或结构域。总地来说,将向导RNA、核酸酶无效的Cas9蛋白和转录调控因子蛋白或结构域称为共定位复合物,从而本领域技术人员将该术语理解为向导RNA、核酸酶无效的Cas9蛋白和转录调控因子蛋白或结构域结合至DNA并且调控靶标核酸表达的程度。根据某些其它方面,引入所述细胞的外源核酸编码一种或多种向导RNA和Cas9蛋白切口酶。总地来说,将向导RNA Cas9蛋白切口酶称为共定位复合物,从而本领域技术人员将该术语理解为向导RNA和Cas9蛋白切口酶结合至DNA并且使靶标核酸产生切口的程度。
根据本发明公开的细胞包括其中如本文所述可以引入并表达外源核酸的任何细胞。应理解本文所述的本发明公开的基本概念不受细胞类型限制。根据本发明公开的细胞包括真核细胞、原核细胞、动物细胞、植物细胞、真菌细胞、古细菌细胞、真细菌细胞等。细胞包括真核细胞,如酵母细胞、植物细胞和动物细胞。具体的细胞包括哺乳动物细胞。另外,细胞包括其中对于调控靶标核酸是有益的或期望的任何细胞。这些细胞可以包括特定蛋白表达不足,从而导致疾病或有害状况的那些。本领域技术人员容易地知道这些疾病或有害状况。根据本发明公开,可以通过本文所述的方法和转录活化因子靶向负责表达特定蛋白的核酸,从而导致靶标核酸上调和特定蛋白的相应表达。以这样的方式,本文所述的方法提供了治疗性治疗。
靶标核酸包括如本文所述的共定位复合物可以用于调控或使其产生切口的任何核酸序列。靶标核酸包括基因。出于本发明公开的目的,DNA(如双链DNA)可以包括靶标核酸,并且共定位复合物可以结合至或另外与所述DNA一起共定位至所述靶标核酸处或与之相邻或在其附近,并且以其中共定位复合物可以对所述靶标核酸具有所需效果的方式进行。这些靶标核酸可以包括内源(或天然存在)的核酸和外源(或外来)核酸。基于本发明公开,技术人员将能够容易地鉴别或设计共定位至DNA(包括靶标核酸)的向导RNA和Cas9蛋白。技术人员将能够进一步鉴别同样共定位至DNA(包括靶标核酸)的转录调控因子蛋白或结构域。DNA包括基因组DNA、线粒体DNA、病毒DNA或外源DNA。
可以使用本领域技术人员对这种引入已知的任何方法将外来核酸(即不是细胞天然核酸组成的一部分的那些)引入细胞。这些方法包括转染、转导、病毒转导、微注射、脂质转染、核转染、纳米颗粒轰击、转化、结合(conjugation)等。使用易于可辨别的文献来源,本领域技术人员将易于理解和改变这些方法。
作为转录活化因子的转录调控因子蛋白或结构域包括基于本发明公开本领域技术人员易于可辨别的VP16和VP64等。
疾病和有害状况是以特定蛋白表达的异常丧失为特征的那些。可以通过特定蛋白的上调治疗这些疾病或有害状况。因此,提供了治疗疾病或有害状况的方法,其中如本文所述的共定位复合物缔合或以其他方式结合至DNA(包括靶标核酸),而共定位复合物的转录活化因子上调靶标核酸的表达。例如,上调促进棕色脂肪分化和代谢吸收提高的PRDM16及其它基因可以用于治疗代谢综合征或者肥胖症。激活抗炎基因对于自身免疫和心血管疾病是有用的。激活肿瘤抑制基因对治疗癌症是有用的。基于本发明公开,本领域技术人员将容易地鉴别这些疾病和有害状况。
作为本发明公开的代表描述了以下实施例。不应将这些实施例视为对本发明公开范围的限制,这是因为参考本发明公开、附图和所附权利要求,这些及其它等价实施方式将是明显的。
实施例I
Cas9突变体
调查了与Cas9同源的具有已知结构的序列以鉴别Cas9中可以除去其RuvC和HNH结构域天然活性的候选突变。使用HHpred(万维网toolkit.tuebingen.mpg.de/hhpred),对完整蛋白质数据库(full Protein Data Bank)(2013年1月)查询Cas9的全长序列。该查询返回了与Cas9的HNH结构域具有显著序列同源性的两个不同的HNH核酸内切酶:PacI和假定核酸内切酶(PDB ID分别为:3M7K和4H9D)。检查这些蛋白质以找到参与镁离子配位的残基。然后,在与Cas9的序列对比中鉴别了相应的残基。在每个结构中,鉴别了两个Mg-配位侧链,其与Cas9中相同的氨基酸类型比对。它们是3M7K D92和N113,和4H9D D53和N77。这些残基对应于Cas9 D839和N863。还报道PacI残基D92和N113向丙氨酸的突变使得核酸酶催化能力不足。基于该分析,做出了Cas9突变D839A和N863A。另外,HHpred还预测了Cas9和嗜热栖热菌(Thermus thermophilus)RuvC(PDB ID:4EP4)的N-末端之间的同源性。该序列比对覆盖了先前报道的消除了Cas9中RuvC结构域功能的突变D10A。为了将其确认为适合的突变,如前所述确定了金属结合残基。在4EP4中,D7帮助配位镁离子。该位置具有对应于Cas9 D10的序列同源性,从而确认该突变有助于帮助消除金属结合,并因此从Cas9 RuvC结构域消除催化活性。
实施例II
质粒构建
使用Quikchange试剂盒(Agilent technologies)产生Cas9突变体。靶标gRNA表达构建体(1)作为单个gBlock直接从IDT订购并克隆至pCR-Bluntll-TOPO载体(Invitrogen);或者(2)通过Genewiz常规(定制,custom)合成;或者(3)使用寡核苷酸的吉布森拼接(Gibson assembly)拼接至gRNA克隆载体(质粒#41824)。通过具有终止密码子和拼接到来自Addgene的EGIP慢病毒载体的适当片段的GFP序列的融合PCR拼装(PCR assembly)构建了用于涉及断裂的GFP的HR报告子测定的载体。然后,使用这些慢病毒载体建立GFP报告子稳定的系。使用标准规程构建了在本研究中使用的TALEN。参见Sanjana人,Nature Protocols7,171-192(2012),该文献以其全部内容作为参考并入本文。使用标准PCR融合规程程序进行Cas9N和MS2 VP64融合。OCT4和REX1的启动子荧光素酶构建体得自Addgene(质粒#17221和质粒#17222)。
实施例III
细胞培养和转染
在补充有10%胎牛血清(FBS,Invitrogen)、青霉素/链霉素(pen/strep,Invitrogen)和非必需氨基酸(NEAA,Invitrogen)的高葡萄糖杜尔贝科改良的伊格尔培养基(DMEM,Invitrogen)中培养HEK 293T细胞。将细胞在加湿的培育箱中维持在37℃和5%CO2
涉及核酸酶测定的转染如下所示:根据生产商的规程,使用Lipofectamine 2000,用2μg Cas9质粒、2μg gRNA和/或2μg DNA供体质粒转染0.4×106个细胞。转染后3天收获细胞并通过FACS分析,或者对于基因组切割的直接测定,使用DNAeasy试剂盒(Qiagen)提取~1×106个细胞的基因组DNA。对于这些测定,实施PCR以通过来源于细胞的基因组DNA扩增靶标区域,并且通过覆盖度>200000个读取的MiSeq个人测序仪(Personal Sequencer)(Illumina)对扩增子深度测序。分析测序数据以估计NHEJ效率。
对于涉及转录激活测定的转染:用(1)2μg Cas9N-VP64质粒、2μggRNA和/或0.25μg报告子构建体;或者(2)2μg Cas9N质粒、2μg MS2-VP64、2μg gRNA-2XMS2适体和/或0.25μg报告子构建体转染0.4×106个细胞。转染后24-48小时收获细胞,并使用FACS或免疫荧光法进行测定,或者提取它们的总RNA并随后通过RT-PCR分析这些提取物。在本文中,使用了来自Invitrogen的OCT4和REX1的标准taqman探针,并对每个样品,对GAPDH进行归一化。
对于涉及Cas9-gRNA复合物和TALE的特异性谱图的转录激活测定的转染:用(1)2μg Cas9N-VP64质粒、2μg gRNA和0.25μg报告子文库;或者(2)2μg TALE-TF质粒和0.25μg报告子文库;或者(3)2μg对照-TF质粒和0.25μg报告子文库转染0.4×l06个细胞。转染后24小时收获细胞(以避免处于饱和形式的报告子的刺激)。使用RNAeasy-plus试剂盒(Qiagen)进行总RNA提取,并且使用Superscript-III(Invitrogen)进行标准RT-PCR。通过转录本-标签的靶向pcr扩增产生了用于下一代测序的文库。
实施例IV
用于Cas9-TF和TALE-TF报告子表达水平计算的计算和序列分析
图8A中显示了该过程的高水平逻辑流程,并且本文提供了额外细节。对于构建体文库组成的细节,参见图8A(水平1)和8B。
测序:对于Cas9实验,作为Illumina MiSeq上的150bp重叠的配对末端读取获得了构建体文库(图8A,水平3,左图)和报告基因cDNA序列(图8A,水平3,右图),而对于TALE实验,作为Illumina MiSeq上的51bp不重叠的配对末端读取获得了相应序列。
构建体文库序列处理:比对:对于Cas9实验,使用novoalign V2.07.17(万维网novocraft.com/main/index/php)将配对读取与对应于被成对的8bp文库条形码侧接的234bp构建体的一组250bp参考序列进行比对(参见图8A,第3水平,左图)。在对novoalign提供的参考序列中,将23bp简并Cas9结合位点区域和24bp简并转录本标签区域(参见图8A,第1水平)称为Ns,同时明确提供了构建体文库条形码。对于TALE实验,除了参考序列长度为203bp并且简并结合位点区域的长度为18bp(相对于23bp)之外,使用了相同的程序。有效性检查:对于其中将每个读取对的左和右读取分别与参考序列比对的所包含文件的Novoalign输出。对唯一地与参考序列进行比对的仅有的读取对进行额外的有效性条件,并且保留了通过所有这些条件的仅有的读取对。有效性条件包括:(i)两个构建体文库条形码中的每一个必须在至少4个位置与参考序列条形码比对,并且对于相同的构建体文库,两个条形码必须与条形码对比对。(ii)与参考序列的N区域比对的所有碱基必须被novoalign称为As、Cs、Gs、Gs或Ts。注意:在参考N区域,Cas9和TALE实验均不左右读取重叠,因此不会出现这些N碱基的模糊novoalign调用的可能性。(iii)同样地,在这些区域中必须出现无novoalign调用的插入或缺失。(iv)在转录本标签区中必须出现无Ts(由于这些随机序列仅是从As、Cs和Gs产生的)。在读取对拒绝文件中收集违反这些条件中任一条的读取对。使用常规(定制,custom)perl脚本实现这些有效性检查。
诱导的样品报告基因cDNA序列处理:比对:首先使用SeqPrep(从万维网github.com/jstjohn/SeqPrep下载)将重叠读取对合并成79bp的共同片段(commonsegment),然后使用novoalign(以上版本)将这些79bp的共同片段作为不配对的单个读取与一组参考序列比对(参见图8A,第3水平,右图),其中(对于构建体文库序列),将24bp简并转录本标签称为Ns,同时明确提供了样品条形码。TALE和Cas9 cDNA序列区两者均对应于被成对的8bp样品条形码序列侧接的相同的63bp cDNA区。有效性检查:除了以下情况外,应用了用于构建体文库测序的相同条件(参见上文):(a)在本发明中,由于读取对的在先SeqPrep合并,有效性处理不必须过滤读取对中的两种读取的唯一比对,而是仅过滤合并读取的唯一比对;(b)在cDNA序列读取中仅出现转录本标签,因此有效性处理仅适用于参考序列的这些标签区域,并且也不适用于单独的结合位点区域。
结合位点相对于转录本标签结合的表的汇编:使用常规perl从验证的构建体文库序列中产生这些表(图8A,第4水平,左图)。尽管在整个构建体文库中由A、C和G碱基组成的24bp标签序列应基本上是唯一的(共有概率=~2.8e-11),但是结合位点相对于标签结合的早期分析显示事实上多个结合序列共有标签序列的不可忽略部分,这可能主要由结合序列中的序列错误或用于产生构建体文库的寡聚物中的寡聚合成错误的组合所造成的。除了标签共有之外,如果由于它们可能来自的构建体文库的条形码错配使它们不清楚,则在验证的读取对中发现与结合位点结合的标签还可以存在于构建体文库读取对拒绝文件中。最后,标签序列本身可能含有序列错误。为了处理这些误差来源,用三种属性对标签分类:(i)安全相对于不安全,其中不安全表示标签可以存在于构建体文库拒绝的读取对文件中;共有相对于非共有,其中共有表示发现标签与多个结合位点序列有关,和2+相对于仅1-,其中2+表示在验证的构建体文库序列中至少出现两次并因此认为不太可能含有序列错误的标签。将这三个标准结合获得了与每个结合位点有关的8类标签,最安全的(但最不丰富的)种类仅包含安全、非共有、2+标签;和最不安全的(但最丰富的)种类包含不考虑安全、共有或出现次数的所有标签。
归一化表达水平的计算:使用常规perl代码实现图8A、水平5-6中表明的步骤。首先,使用先前对构建体文库计算的结合位点相对于转录本标签表,对每个结合位点计算(aggregate)对每个诱导的样品获得的标签计数的总和(参见图8C)。对于每个样品,然后将每个结合位点的标签计数总和除以阳性对照样品的标签计数总和以产生归一化表达水平。有关这些计算的其它考虑包括:
1.对于每个样品,在不可能在结合位点相对于转录本标签结合表中存在的有效性-检查的cDNA基因序列中发现了“新型”标签的亚型(亚组,subset)。在后续计算中忽略这些标签。
2.在结合位点相对于转录本标签结合表中,对如上所述的八类标签的每一类进行了如上所述的标签计数总和计算(aggregation)。由于构建体文库中结合位点偏倚而频繁产生了类似于中央序列的序列,但是具有错配数目增加的序列逐渐减少,因此具有较少错配的结合位点通常聚集成大量的标签,而具有更多错配的结合位点聚集成较少数目。因此,尽管通常期望使用最安全的标签种类,但是可以基于每个结合位点的标签的小数目来评价具有两个或更多个错配的结合位点,从而使得安全计数和比值在统计学上更不可靠,即使标签本身是更可靠的。在这些情况下,使用了所有标签。出于这种考虑,从对于n个错配位置,单独集合的标签计数的数目随着错配位置的组合数目增长的事实获得了一些补偿(等于
Figure BDA0003175539690000291
),并且补偿随着n显著提高;因此,对于不同数目n的错配,集合的标签计数的平均值(如图2b、2e和图9A和10B所示)基于n≥2时,统计学上非常大的组的集合的标签计数。
3.最后,构建到TALE构建体文库中的结合位点为18bp并且基于这些18bp序列分配标签结合,但是使用程序化以结合18bp构建体结合位点区域内中央14bp或10bp区域的TALE进行一些实验。在对于这些TALE计算表达水平时,基于结合表中18bp结合位点的相应区域,将标签集合至结合位点,从而忽略了该区域之外的结合位点错配。
实施例V
使用Cas9N-VP64的RNA-导向的SOX2和NANOG调控
本文所述的sgRNA(适体-修饰的单个导向RNA)链接方法使得不同的sgRNA招募不同的效应子结构域,只要每个sgRNA使用不同的RNA-蛋白质相互作用对,从而使得能够使用相同的Cas9N-蛋白质进行多重基因调控。对于图12A SOX2和图12B NANOG基因,设计了靶向转录起始位点上游~1kb的DNA延伸的10个gRNA。用绿色突出显示了DNA酶的超敏感位点。测定了通过内源基因的qPCR的转录激活。在两种情况下,尽管单个gRNA的引入适度刺激了转录,但是多个gRNA协同作用以刺激稳健的多倍转录激活。数据为平均值+/-SEM(N=3)。如图12A-B所示,通过启动子DNA上游~1kb延伸内的sgRNA靶向调控两个其它基因SOX2和NANOG。与转录起始位点邻近的sgRNA导致了稳健的基因激活。
实施例VI
评价Cas9-gRNA复合物的靶向图谱
使用图2中所述的方法,分析了两个其它Cas9-gRNA复合物(图13A-C)和(图13D-F)的靶向图谱。两种gRNA具有非常不同的特异性谱,其中gRNA2耐受多至2-3个错配,gRNA3仅耐受最多1个。在一个碱基错配(图13B、13E)和两个碱基错配图(图13C、13F)中反映了这些方面。在图13C和13F中,用含有“x”的灰框表示可用数据不足以计算归一化表达水平的碱基错配对,为了改善数据显示,用含有星号“*”的黄框表示超出色标顶部的归一化表达水平为离群值的错配对。统计显著性符号为:对于p<.0005/n,***;对于P<.005/n,**;对于p<.05/n,*;对于P>=.05/n,N.S.(非显著性),其中n是比较数目(参见表2)。
实施例VII
验证,报告子测定的特异性
如图14A-C所示,使用两种不同的sgRNA:Cas9复合物产生特异性数据。确认对正在评价的sgRNA,测定是特异的,这是因为相应的突变体sgRNA不能刺激报告子文库。图14A:使用针对野生型gRNA靶标序列设计的报告子文库评价了两种gRNA(野生型和突变型;用红色突出显示序列差异)的特异性谱图。图14B:确认对正在评价的gRNA,该测定是特异性的(根据图13D重新作图的数据),这是因为相应的突变体gRNA不能刺激报告子文库。统计显著性符号为:对于p<.0005/n,***;对于P<.005/n,**;对于p<.05/n,*;对于P>=.05/n,N.S.(非显著性),其中n是比较数目(参见表2)。不同的sgRNA可以具有不同的特异性谱图(图13A、13D),具体地,sgRNA2耐受多至3个错配,而sgRNA3仅耐受多至1个。对错配最大的灵敏度定位至间隔子(spacer)的3’端,尽管在其它位置处也观察到了错配影响活性。
实施例VIII
验证,单碱基和双碱基gRNA错配
如图15A-D所示,通过测定的sgRNA中间隔子3’端12bp内单碱基错配导致可检测靶向的靶向实验进行确认。然而,该区域内2bp错配导致活力显著损失。使用核酸酶测定,测试了2个独立的gRNA:在相对于靶标的间隔序列中具有单碱基或双碱基错配(红色突出显示)的gRNA2(图15A-B)和gRNA3(图15C-D)。确认在测定的gRNA中间隔子3’端12bp内的单碱基错配导致了可检测的靶向,然而该区域内2bp的错配导致了活性快速损失。与图13的结果一致,这些结果还突出显示了不同gRNA之间特异性谱图的差异。数据是平均值+/-SEM(N=3)。
实施例IX
验证,5'gRNA截短
如图16A-D所示,间隔子5'部分中的截短导致保留了sgRNA的活性。使用核酸酶测定,测试了2个独立的gRNA:在它们间隔子的5'端具有截短的gRNAl(图16A-B)和gRNA3(图16C-D)。观察到对1-3bp 5'截短是良好耐受的,但是较大的缺失导致活性损失。数据为平均值+/-SEM(N=3)。
实施例X
验证,化脓性链球菌(S.pyogenes)PAM
如图17A-B所示,使用核酸酶介导的HR测定确认了化脓性链球菌(S.pyogenes)Cas9的PAM是NGG,还有NAG。数据为平均值+/-SEM(N=3)。根据另外的研究,扫描了在不含共有靶标序列最后13nt的交替的NGG靶标的人外显子中生成的约190K Cas9靶标组,以确定是否存在在先前13nt中具有错配的交替的NAG位点或NGG位点。发现仅有0.4%没有这类交替靶标。
实施例XI
验证,TALE突变
使用核酸酶介导的HR测定(图18A-B)确认18聚体TALE耐受其靶标序列中的多个突变。如图18A-B所示,靶标中间的某些突变导致了较高的TALE活性,如通过核酸酶测定中的靶向实验所确定的。
实施例XII
TALE单体特异性相对于TALE蛋白特异性
为了脱除单个重复序列可变的双氨基酸残基(重复可变双残基,repeat-variablediresidues)(RVD)的作用,确认了RVD的选择的确有助于碱基特异性,但是总体上TALE特异性还是蛋白结合能的函数。图19A-C显示了TALE单体特异性相对于TALE蛋白特异性的比较。图19A:使用图2中所述的修饰方法,分析了具有6个NI或6个NH重复的邻接的组的2个14聚体TALE-TF的靶标图谱。在该方法中,生成了在中间具有简并6聚体序列的缩减的报告子文库,并将其用于测定TALE-TF特异性。图19B-C:在两种情况下,注意到富集了预期的靶标序列(即,对于NI重复,具有6个As的序列,和对于NH重复,具有6个Gs的序列)。这些TALE中的每一个仍耐受中央6聚体靶标序列中的1-2个错配。尽管单体的选择的确有助于基底特异性(base specificity),但是总体上TALE特异性还是蛋白结合能的函数。根据一个方面,在基因组工程应用中较短的工程设计的TALE或者具有高和低亲合力单体组成的TALE导致了较高的特异性,并且当使用较短的TALE时,核酸酶应用中的FokI二聚使得能够进一步降低脱靶标作用。
实施例XIII
偏移切口,天然位点
图20A-B显示了与偏移切口(off-set nicking)有关的数据。在基因组编辑的背景中,产生偏移切口以生成DSB。大多数切口不会导致非同源末端接合(NHEJ)介导的插入缺失(indel),并因此当引起偏移切口时,脱靶标单个切口事件将可能导致极低的插入缺失率。对于在两个合并的报告子位点和在天然AAVS1基因组位点引起基因破环来说,引起偏移切口以产生DSB是有效的。图20A:靶向具有覆盖200bp DNA延伸的8个gRNA的天然AAVS1位点:4个靶向正义链(s1-4),4个靶向反义链(as1-4)。使用在互补链上产生切口的Cas9D10A突变体,将gRNA不同的双向组合(two-way combination)用于引起一定范围的程序化5'或3'突出。图20B:使用基于Sanger测序的测定,观察到尽管单个gRNA不会引起可检测的NHEJ事件,但是对于引起基因破环来说,引起偏移切口以产生DSB是非常有效的。值得注意地,与3'突出相反,导致5'突出的偏移切口导致产生了更多的NHEJ事件。在条棒上方突出显示了Sanger测序克隆的数目,并且在相应X轴图例下方表明了预测的突出长度。
实施例XIV
偏移切口,NHEJ谱图
图21A-C涉及偏移切口和NHEJ谱图。显示了三种不同的偏移切口组合的代表性Sanger测序结果,其中通过框突出显示了靶向gRNA的位置。此外,与同源重组(HR)介导的修复的标准模型一致,通过偏移切口的5'突出工程设计产生了比3'突出更稳健的NHEJ事件(图3B)。除了NHEJ刺激之外,当产生5'突出时,观察到了稳健的HR诱导。3'突出的产生不会导致HR率的改善(图3C)。
实施例XV
表1
用于内源基因调控的gRNA靶标
列出了Cas9-gRNA介导的激活实验中使用的REX1、OCT4、SOX2和NANOG启动子中的靶标。
Figure BDA0003175539690000331
实施例XVI
表2
Cas9-gRNA和TALE特异性数据统计分析的总结
表2(a)用于比较结合至具有特定数目的靶标位点突变的靶标序列的TALE或Cas9-VP64激活剂的归一化表达水平的P-值。通过“图”列中所指明的图中的箱形图显示了归一化的表达水平,其中箱(box)通过靶标位点的错配数目表示这些水平的分布。使用t检验,对每个箱形图中连续的错配数目对计算P-值,其中t检验是一个样品或两个样品t检验(参见方法)。使用Bonferroni校正的P-值阈值评价统计显著性,其中校正基于每个箱形图内比较的数目。统计显著性符号为:对于p<.0005/n,***;对于P<.005/n,**;对于p<.05/n,*;对于P>=.05/n,N.S.(非显著性),其中n是比较数目。表2(b)图2D中种子区域(seed region)的统计特征:log10(P-值)表明了相对于所有其它位置对,对于在20bp靶标位点的3'端的候选种子区域内突变的那些位置对,结合至具有两种突变的靶标序列的Cas9N VP64+gRNA的表达值之间的分离度。在靶标位点的最后8-9bp中发现了最大的分离,其通过最大-log10(P-值)(上方突出显示)表示。这些位置可以理解为表示该靶标位点的“种子”区域的起始。有关如何计算P-值的信息,参见方法中“种子区域的统计特征”一节。
Figure BDA0003175539690000351
实施例XVII
实施例中的蛋白质和RNA的序列
A.以下显示了基于m4突变体的Cas9N-VP64激活剂构建体的序列。以显示最高活性的Cas9m4 VP64和Cas9m4 VP64N融合蛋白形式构建了三种形式。还构建了m3和m2突变体的相应载体(图4A)(突出显示了NLS和VF64结构域)。
>Cas9m4 VP64
Figure BDA0003175539690000361
Figure BDA0003175539690000371
Figure BDA0003175539690000381
>Cas9m4 VP64N序列
Figure BDA0003175539690000382
Figure BDA0003175539690000391
Figure BDA0003175539690000401
>Cas9m4 VP64C
Figure BDA0003175539690000402
Figure BDA0003175539690000411
Figure BDA0003175539690000421
B.以下提供了具有2X MS2适体结构域的MS2-激活剂构建体以及相应gRNA骨架载体(backbone vector)的序列(突出显示了NLS、VP64、gRNA间隔子和MS2-结合RNA茎环结构域)。以显示最高活性的MS2vp64N融合蛋白形式构建了前者的两种形式。
>MS2VP64N
Figure BDA0003175539690000431
>MS2VP64C
Figure BDA0003175539690000432
>gRNA2XMS2
Figure BDA0003175539690000441
C.以下列出了dTomato荧光基转录激活报告子序列(突出显示了IScel控制-TF靶标、gRNA靶标、minCMV启动子和FLAG标签+dTomato序列)。
>TF报告子1
Figure BDA0003175539690000442
>TF报告子2
Figure BDA0003175539690000451
D.以下提供了用于TALE和Cas9-gRNA特异性测定的报告子文库的一般形式(突出显示了IScel控制-TF靶标、gRNA/TALE靶标位点(对于gRNA,23bp,对于TALE,18bp)、minCMV启动子、RNA条形码和dTomato序列)。
>特异性报告子文库
Figure BDA0003175539690000452
序列表
<110> 哈佛大学校长及研究员协会(President and Fellows of Harvard College)
<120> RNA-导向的转录调控
<130> 010498.00503
<140> PCT/US14/040868
<141> 2014-06-04
<150> US 61/830787
<151> 2013-06-04
<160> 184
<170> PatentIn version 3.5
<210> 1
<211> 1368
<212> PRT
<213> 酿脓链球菌(Streptococcus pyogenes)
<400> 1
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 2
<211> 4332
<212> DNA
<213> 人工序列
<220>
<223> VP64-激活剂构建体
<400> 2
gccaccatgg acaagaagta ctccattggg ctcgctatcg gcacaaacag cgtcggctgg 60
gccgtcatta cggacgagta caaggtgccg agcaaaaaat tcaaagttct gggcaatacc 120
gatcgccaca gcataaagaa gaacctcatt ggcgccctcc tgttcgactc cggggagacg 180
gccgaagcca cgcggctcaa aagaacagca cggcgcagat atacccgcag aaagaatcgg 240
atctgctacc tgcaggagat ctttagtaat gagatggcta aggtggatga ctctttcttc 300
cataggctgg aggagtcctt tttggtggag gaggataaaa agcacgagcg ccacccaatc 360
tttggcaata tcgtggacga ggtggcgtac catgaaaagt acccaaccat atatcatctg 420
aggaagaagc ttgtagacag tactgataag gctgacttgc ggttgatcta tctcgcgctg 480
gcgcatatga tcaaatttcg gggacacttc ctcatcgagg gggacctgaa cccagacaac 540
agcgatgtcg acaaactctt tatccaactg gttcagactt acaatcagct tttcgaagag 600
aacccgatca acgcatccgg agttgacgcc aaagcaatcc tgagcgctag gctgtccaaa 660
tcccggcggc tcgaaaacct catcgcacag ctccctgggg agaagaagaa cggcctgttt 720
ggtaatctta tcgccctgtc actcgggctg acccccaact ttaaatctaa cttcgacctg 780
gccgaagatg ccaagcttca actgagcaaa gacacctacg atgatgatct cgacaatctg 840
ctggcccaga tcggcgacca gtacgcagac ctttttttgg cggcaaagaa cctgtcagac 900
gccattctgc tgagtgatat tctgcgagtg aacacggaga tcaccaaagc tccgctgagc 960
gctagtatga tcaagcgcta tgatgagcac caccaagact tgactttgct gaaggccctt 1020
gtcagacagc aactgcctga gaagtacaag gaaattttct tcgatcagtc taaaaatggc 1080
tacgccggat acattgacgg cggagcaagc caggaggaat tttacaaatt tattaagccc 1140
atcttggaaa aaatggacgg caccgaggag ctgctggtaa agcttaacag agaagatctg 1200
ttgcgcaaac agcgcacttt cgacaatgga agcatccccc accagattca cctgggcgaa 1260
ctgcacgcta tcctcaggcg gcaagaggat ttctacccct ttttgaaaga taacagggaa 1320
aagattgaga aaatcctcac atttcggata ccctactatg taggccccct cgcccgggga 1380
aattccagat tcgcgtggat gactcgcaaa tcagaagaga ccatcactcc ctggaacttc 1440
gaggaagtcg tggataaggg ggcctctgcc cagtccttca tcgaaaggat gactaacttt 1500
gataaaaatc tgcctaacga aaaggtgctt cctaaacact ctctgctgta cgagtacttc 1560
acagtttata acgagctcac caaggtcaaa tacgtcacag aagggatgag aaagccagca 1620
ttcctgtctg gagagcagaa gaaagctatc gtggacctcc tcttcaagac gaaccggaaa 1680
gttaccgtga aacagctcaa agaagactat ttcaaaaaga ttgaatgttt cgactctgtt 1740
gaaatcagcg gagtggagga tcgcttcaac gcatccctgg gaacgtatca cgatctcctg 1800
aaaatcatta aagacaagga cttcctggac aatgaggaga acgaggacat tcttgaggac 1860
attgtcctca cccttacgtt gtttgaagat agggagatga ttgaagaacg cttgaaaact 1920
tacgctcatc tcttcgacga caaagtcatg aaacagctca agaggcgccg atatacagga 1980
tgggggcggc tgtcaagaaa actgatcaat gggatccgag acaagcagag tggaaagaca 2040
atcctggatt ttcttaagtc cgatggattt gccaaccgga acttcatgca gttgatccat 2100
gatgactctc tcacctttaa ggaggacatc cagaaagcac aagtttctgg ccagggggac 2160
agtcttcacg agcacatcgc taatcttgca ggtagcccag ctatcaaaaa gggaatactg 2220
cagaccgtta aggtcgtgga tgaactcgtc aaagtaatgg gaaggcataa gcccgagaat 2280
atcgttatcg agatggcccg agagaaccaa actacccaga agggacagaa gaacagtagg 2340
gaaaggatga agaggattga agagggtata aaagaactgg ggtcccaaat ccttaaggaa 2400
cacccagttg aaaacaccca gcttcagaat gagaagctct acctgtacta cctgcagaac 2460
ggcagggaca tgtacgtgga tcaggaactg gacatcaatc ggctctccga ctacgacgtg 2520
gctgctatcg tgccccagtc ttttctcaaa gatgattcta ttgataataa agtgttgaca 2580
agatccgata aagctagagg gaagagtgat aacgtcccct cagaagaagt tgtcaagaaa 2640
atgaaaaatt attggcggca gctgctgaac gccaaactga tcacacaacg gaagttcgat 2700
aatctgacta aggctgaacg aggtggcctg tctgagttgg ataaagccgg cttcatcaaa 2760
aggcagcttg ttgagacacg ccagatcacc aagcacgtgg cccaaattct cgattcacgc 2820
atgaacacca agtacgatga aaatgacaaa ctgattcgag aggtgaaagt tattactctg 2880
aagtctaagc tggtctcaga tttcagaaag gactttcagt tttataaggt gagagagatc 2940
aacaattacc accatgcgca tgatgcctac ctgaatgcag tggtaggcac tgcacttatc 3000
aaaaaatatc ccaagcttga atctgaattt gtttacggag actataaagt gtacgatgtt 3060
aggaaaatga tcgcaaagtc tgagcaggaa ataggcaagg ccaccgctaa gtacttcttt 3120
tacagcaata ttatgaattt tttcaagacc gagattacac tggccaatgg agagattcgg 3180
aagcgaccac ttatcgaaac aaacggagaa acaggagaaa tcgtgtggga caagggtagg 3240
gatttcgcga cagtccggaa ggtcctgtcc atgccgcagg tgaacatcgt taaaaagacc 3300
gaagtacaga ccggaggctt ctccaaggaa agtatcctcc cgaaaaggaa cagcgacaag 3360
ctgatcgcac gcaaaaaaga ttgggacccc aagaaatacg gcggattcga ttctcctaca 3420
gtcgcttaca gtgtactggt tgtggccaaa gtggagaaag ggaagtctaa aaaactcaaa 3480
agcgtcaagg aactgctggg catcacaatc atggagcgat caagcttcga aaaaaacccc 3540
atcgactttc tcgaggcgaa aggatataaa gaggtcaaaa aagacctcat cattaagctt 3600
cccaagtact ctctctttga gcttgaaaac ggccggaaac gaatgctcgc tagtgcgggc 3660
gagctgcaga aaggtaacga gctggcactg ccctctaaat acgttaattt cttgtatctg 3720
gccagccact atgaaaagct caaagggtct cccgaagata atgagcagaa gcagctgttc 3780
gtggaacaac acaaacacta ccttgatgag atcatcgagc aaataagcga attctccaaa 3840
agagtgatcc tcgccgacgc taacctcgat aaggtgcttt ctgcttacaa taagcacagg 3900
gataagccca tcagggagca ggcagaaaac attatccact tgtttactct gaccaacttg 3960
ggcgcgcctg cagccttcaa gtacttcgac accaccatag acagaaagcg gtacacctct 4020
acaaaggagg tcctggacgc cacactgatt catcagtcaa ttacggggct ctatgaaaca 4080
agaatcgacc tctctcagct cggtggagac agcagggctg accccaagaa gaagaggaag 4140
gtggaggcca gcggttccgg acgggctgac gcattggacg attttgatct ggatatgctg 4200
ggaagtgacg ccctcgatga ttttgacctt gacatgcttg gttcggatgc ccttgatgac 4260
tttgacctcg acatgctcgg cagtgacgcc cttgatgatt tcgacctgga catgctgatt 4320
aactctagat ga 4332
<210> 3
<211> 4365
<212> DNA
<213> 人工序列
<220>
<223> VP64-激活剂构建体
<400> 3
gccaccatgc ccaagaagaa gaggaaggtg ggaaggggga tggacaagaa gtactccatt 60
gggctcgcta tcggcacaaa cagcgtcggc tgggccgtca ttacggacga gtacaaggtg 120
ccgagcaaaa aattcaaagt tctgggcaat accgatcgcc acagcataaa gaagaacctc 180
attggcgccc tcctgttcga ctccggggag acggccgaag ccacgcggct caaaagaaca 240
gcacggcgca gatatacccg cagaaagaat cggatctgct acctgcagga gatctttagt 300
aatgagatgg ctaaggtgga tgactctttc ttccataggc tggaggagtc ctttttggtg 360
gaggaggata aaaagcacga gcgccaccca atctttggca atatcgtgga cgaggtggcg 420
taccatgaaa agtacccaac catatatcat ctgaggaaga agcttgtaga cagtactgat 480
aaggctgact tgcggttgat ctatctcgcg ctggcgcata tgatcaaatt tcggggacac 540
ttcctcatcg agggggacct gaacccagac aacagcgatg tcgacaaact ctttatccaa 600
ctggttcaga cttacaatca gcttttcgaa gagaacccga tcaacgcatc cggagttgac 660
gccaaagcaa tcctgagcgc taggctgtcc aaatcccggc ggctcgaaaa cctcatcgca 720
cagctccctg gggagaagaa gaacggcctg tttggtaatc ttatcgccct gtcactcggg 780
ctgaccccca actttaaatc taacttcgac ctggccgaag atgccaagct tcaactgagc 840
aaagacacct acgatgatga tctcgacaat ctgctggccc agatcggcga ccagtacgca 900
gacctttttt tggcggcaaa gaacctgtca gacgccattc tgctgagtga tattctgcga 960
gtgaacacgg agatcaccaa agctccgctg agcgctagta tgatcaagcg ctatgatgag 1020
caccaccaag acttgacttt gctgaaggcc cttgtcagac agcaactgcc tgagaagtac 1080
aaggaaattt tcttcgatca gtctaaaaat ggctacgccg gatacattga cggcggagca 1140
agccaggagg aattttacaa atttattaag cccatcttgg aaaaaatgga cggcaccgag 1200
gagctgctgg taaagcttaa cagagaagat ctgttgcgca aacagcgcac tttcgacaat 1260
ggaagcatcc cccaccagat tcacctgggc gaactgcacg ctatcctcag gcggcaagag 1320
gatttctacc cctttttgaa agataacagg gaaaagattg agaaaatcct cacatttcgg 1380
ataccctact atgtaggccc cctcgcccgg ggaaattcca gattcgcgtg gatgactcgc 1440
aaatcagaag agaccatcac tccctggaac ttcgaggaag tcgtggataa gggggcctct 1500
gcccagtcct tcatcgaaag gatgactaac tttgataaaa atctgcctaa cgaaaaggtg 1560
cttcctaaac actctctgct gtacgagtac ttcacagttt ataacgagct caccaaggtc 1620
aaatacgtca cagaagggat gagaaagcca gcattcctgt ctggagagca gaagaaagct 1680
atcgtggacc tcctcttcaa gacgaaccgg aaagttaccg tgaaacagct caaagaagac 1740
tatttcaaaa agattgaatg tttcgactct gttgaaatca gcggagtgga ggatcgcttc 1800
aacgcatccc tgggaacgta tcacgatctc ctgaaaatca ttaaagacaa ggacttcctg 1860
gacaatgagg agaacgagga cattcttgag gacattgtcc tcacccttac gttgtttgaa 1920
gatagggaga tgattgaaga acgcttgaaa acttacgctc atctcttcga cgacaaagtc 1980
atgaaacagc tcaagaggcg ccgatataca ggatgggggc ggctgtcaag aaaactgatc 2040
aatgggatcc gagacaagca gagtggaaag acaatcctgg attttcttaa gtccgatgga 2100
tttgccaacc ggaacttcat gcagttgatc catgatgact ctctcacctt taaggaggac 2160
atccagaaag cacaagtttc tggccagggg gacagtcttc acgagcacat cgctaatctt 2220
gcaggtagcc cagctatcaa aaagggaata ctgcagaccg ttaaggtcgt ggatgaactc 2280
gtcaaagtaa tgggaaggca taagcccgag aatatcgtta tcgagatggc ccgagagaac 2340
caaactaccc agaagggaca gaagaacagt agggaaagga tgaagaggat tgaagagggt 2400
ataaaagaac tggggtccca aatccttaag gaacacccag ttgaaaacac ccagcttcag 2460
aatgagaagc tctacctgta ctacctgcag aacggcaggg acatgtacgt ggatcaggaa 2520
ctggacatca atcggctctc cgactacgac gtggctgcta tcgtgcccca gtcttttctc 2580
aaagatgatt ctattgataa taaagtgttg acaagatccg ataaagctag agggaagagt 2640
gataacgtcc cctcagaaga agttgtcaag aaaatgaaaa attattggcg gcagctgctg 2700
aacgccaaac tgatcacaca acggaagttc gataatctga ctaaggctga acgaggtggc 2760
ctgtctgagt tggataaagc cggcttcatc aaaaggcagc ttgttgagac acgccagatc 2820
accaagcacg tggcccaaat tctcgattca cgcatgaaca ccaagtacga tgaaaatgac 2880
aaactgattc gagaggtgaa agttattact ctgaagtcta agctggtctc agatttcaga 2940
aaggactttc agttttataa ggtgagagag atcaacaatt accaccatgc gcatgatgcc 3000
tacctgaatg cagtggtagg cactgcactt atcaaaaaat atcccaagct tgaatctgaa 3060
tttgtttacg gagactataa agtgtacgat gttaggaaaa tgatcgcaaa gtctgagcag 3120
gaaataggca aggccaccgc taagtacttc ttttacagca atattatgaa ttttttcaag 3180
accgagatta cactggccaa tggagagatt cggaagcgac cacttatcga aacaaacgga 3240
gaaacaggag aaatcgtgtg ggacaagggt agggatttcg cgacagtccg gaaggtcctg 3300
tccatgccgc aggtgaacat cgttaaaaag accgaagtac agaccggagg cttctccaag 3360
gaaagtatcc tcccgaaaag gaacagcgac aagctgatcg cacgcaaaaa agattgggac 3420
cccaagaaat acggcggatt cgattctcct acagtcgctt acagtgtact ggttgtggcc 3480
aaagtggaga aagggaagtc taaaaaactc aaaagcgtca aggaactgct gggcatcaca 3540
atcatggagc gatcaagctt cgaaaaaaac cccatcgact ttctcgaggc gaaaggatat 3600
aaagaggtca aaaaagacct catcattaag cttcccaagt actctctctt tgagcttgaa 3660
aacggccgga aacgaatgct cgctagtgcg ggcgagctgc agaaaggtaa cgagctggca 3720
ctgccctcta aatacgttaa tttcttgtat ctggccagcc actatgaaaa gctcaaaggg 3780
tctcccgaag ataatgagca gaagcagctg ttcgtggaac aacacaaaca ctaccttgat 3840
gagatcatcg agcaaataag cgaattctcc aaaagagtga tcctcgccga cgctaacctc 3900
gataaggtgc tttctgctta caataagcac agggataagc ccatcaggga gcaggcagaa 3960
aacattatcc acttgtttac tctgaccaac ttgggcgcgc ctgcagcctt caagtacttc 4020
gacaccacca tagacagaaa gcggtacacc tctacaaagg aggtcctgga cgccacactg 4080
attcatcagt caattacggg gctctatgaa acaagaatcg acctctctca gctcggtgga 4140
gacagcaggg ctgaccccaa gaagaagagg aaggtggagg ccagcggttc cggacgggct 4200
gacgcattgg acgattttga tctggatatg ctgggaagtg acgccctcga tgattttgac 4260
cttgacatgc ttggttcgga tgcccttgat gactttgacc tcgacatgct cggcagtgac 4320
gcccttgatg atttcgacct ggacatgctg attaactcta gatga 4365
<210> 4
<211> 4425
<212> DNA
<213> 人工序列
<220>
<223> VP64-激活剂构建体
<400> 4
gccaccatgg acaagaagta ctccattggg ctcgctatcg gcacaaacag cgtcggctgg 60
gccgtcatta cggacgagta caaggtgccg agcaaaaaat tcaaagttct gggcaatacc 120
gatcgccaca gcataaagaa gaacctcatt ggcgccctcc tgttcgactc cggggagacg 180
gccgaagcca cgcggctcaa aagaacagca cggcgcagat atacccgcag aaagaatcgg 240
atctgctacc tgcaggagat ctttagtaat gagatggcta aggtggatga ctctttcttc 300
cataggctgg aggagtcctt tttggtggag gaggataaaa agcacgagcg ccacccaatc 360
tttggcaata tcgtggacga ggtggcgtac catgaaaagt acccaaccat atatcatctg 420
aggaagaagc ttgtagacag tactgataag gctgacttgc ggttgatcta tctcgcgctg 480
gcgcatatga tcaaatttcg gggacacttc ctcatcgagg gggacctgaa cccagacaac 540
agcgatgtcg acaaactctt tatccaactg gttcagactt acaatcagct tttcgaagag 600
aacccgatca acgcatccgg agttgacgcc aaagcaatcc tgagcgctag gctgtccaaa 660
tcccggcggc tcgaaaacct catcgcacag ctccctgggg agaagaagaa cggcctgttt 720
ggtaatctta tcgccctgtc actcgggctg acccccaact ttaaatctaa cttcgacctg 780
gccgaagatg ccaagcttca actgagcaaa gacacctacg atgatgatct cgacaatctg 840
ctggcccaga tcggcgacca gtacgcagac ctttttttgg cggcaaagaa cctgtcagac 900
gccattctgc tgagtgatat tctgcgagtg aacacggaga tcaccaaagc tccgctgagc 960
gctagtatga tcaagcgcta tgatgagcac caccaagact tgactttgct gaaggccctt 1020
gtcagacagc aactgcctga gaagtacaag gaaattttct tcgatcagtc taaaaatggc 1080
tacgccggat acattgacgg cggagcaagc caggaggaat tttacaaatt tattaagccc 1140
atcttggaaa aaatggacgg caccgaggag ctgctggtaa agcttaacag agaagatctg 1200
ttgcgcaaac agcgcacttt cgacaatgga agcatccccc accagattca cctgggcgaa 1260
ctgcacgcta tcctcaggcg gcaagaggat ttctacccct ttttgaaaga taacagggaa 1320
aagattgaga aaatcctcac atttcggata ccctactatg taggccccct cgcccgggga 1380
aattccagat tcgcgtggat gactcgcaaa tcagaagaga ccatcactcc ctggaacttc 1440
gaggaagtcg tggataaggg ggcctctgcc cagtccttca tcgaaaggat gactaacttt 1500
gataaaaatc tgcctaacga aaaggtgctt cctaaacact ctctgctgta cgagtacttc 1560
acagtttata acgagctcac caaggtcaaa tacgtcacag aagggatgag aaagccagca 1620
ttcctgtctg gagagcagaa gaaagctatc gtggacctcc tcttcaagac gaaccggaaa 1680
gttaccgtga aacagctcaa agaagactat ttcaaaaaga ttgaatgttt cgactctgtt 1740
gaaatcagcg gagtggagga tcgcttcaac gcatccctgg gaacgtatca cgatctcctg 1800
aaaatcatta aagacaagga cttcctggac aatgaggaga acgaggacat tcttgaggac 1860
attgtcctca cccttacgtt gtttgaagat agggagatga ttgaagaacg cttgaaaact 1920
tacgctcatc tcttcgacga caaagtcatg aaacagctca agaggcgccg atatacagga 1980
tgggggcggc tgtcaagaaa actgatcaat gggatccgag acaagcagag tggaaagaca 2040
atcctggatt ttcttaagtc cgatggattt gccaaccgga acttcatgca gttgatccat 2100
gatgactctc tcacctttaa ggaggacatc cagaaagcac aagtttctgg ccagggggac 2160
agtcttcacg agcacatcgc taatcttgca ggtagcccag ctatcaaaaa gggaatactg 2220
cagaccgtta aggtcgtgga tgaactcgtc aaagtaatgg gaaggcataa gcccgagaat 2280
atcgttatcg agatggcccg agagaaccaa actacccaga agggacagaa gaacagtagg 2340
gaaaggatga agaggattga agagggtata aaagaactgg ggtcccaaat ccttaaggaa 2400
cacccagttg aaaacaccca gcttcagaat gagaagctct acctgtacta cctgcagaac 2460
ggcagggaca tgtacgtgga tcaggaactg gacatcaatc ggctctccga ctacgacgtg 2520
gctgctatcg tgccccagtc ttttctcaaa gatgattcta ttgataataa agtgttgaca 2580
agatccgata aagctagagg gaagagtgat aacgtcccct cagaagaagt tgtcaagaaa 2640
atgaaaaatt attggcggca gctgctgaac gccaaactga tcacacaacg gaagttcgat 2700
aatctgacta aggctgaacg aggtggcctg tctgagttgg ataaagccgg cttcatcaaa 2760
aggcagcttg ttgagacacg ccagatcacc aagcacgtgg cccaaattct cgattcacgc 2820
atgaacacca agtacgatga aaatgacaaa ctgattcgag aggtgaaagt tattactctg 2880
aagtctaagc tggtctcaga tttcagaaag gactttcagt tttataaggt gagagagatc 2940
aacaattacc accatgcgca tgatgcctac ctgaatgcag tggtaggcac tgcacttatc 3000
aaaaaatatc ccaagcttga atctgaattt gtttacggag actataaagt gtacgatgtt 3060
aggaaaatga tcgcaaagtc tgagcaggaa ataggcaagg ccaccgctaa gtacttcttt 3120
tacagcaata ttatgaattt tttcaagacc gagattacac tggccaatgg agagattcgg 3180
aagcgaccac ttatcgaaac aaacggagaa acaggagaaa tcgtgtggga caagggtagg 3240
gatttcgcga cagtccggaa ggtcctgtcc atgccgcagg tgaacatcgt taaaaagacc 3300
gaagtacaga ccggaggctt ctccaaggaa agtatcctcc cgaaaaggaa cagcgacaag 3360
ctgatcgcac gcaaaaaaga ttgggacccc aagaaatacg gcggattcga ttctcctaca 3420
gtcgcttaca gtgtactggt tgtggccaaa gtggagaaag ggaagtctaa aaaactcaaa 3480
agcgtcaagg aactgctggg catcacaatc atggagcgat caagcttcga aaaaaacccc 3540
atcgactttc tcgaggcgaa aggatataaa gaggtcaaaa aagacctcat cattaagctt 3600
cccaagtact ctctctttga gcttgaaaac ggccggaaac gaatgctcgc tagtgcgggc 3660
gagctgcaga aaggtaacga gctggcactg ccctctaaat acgttaattt cttgtatctg 3720
gccagccact atgaaaagct caaagggtct cccgaagata atgagcagaa gcagctgttc 3780
gtggaacaac acaaacacta ccttgatgag atcatcgagc aaataagcga attctccaaa 3840
agagtgatcc tcgccgacgc taacctcgat aaggtgcttt ctgcttacaa taagcacagg 3900
gataagccca tcagggagca ggcagaaaac attatccact tgtttactct gaccaacttg 3960
ggcgcgcctg cagccttcaa gtacttcgac accaccatag acagaaagcg gtacacctct 4020
acaaaggagg tcctggacgc cacactgatt catcagtcaa ttacggggct ctatgaaaca 4080
agaatcgacc tctctcagct cggtggagac agcagggctg accccaagaa gaagaggaag 4140
gtggaggcca gcggttccgg acgggctgac gcattggacg attttgatct ggatatgctg 4200
ggaagtgacg ccctcgatga ttttgacctt gacatgcttg gttcggatgc ccttgatgac 4260
tttgacctcg acatgctcgg cagtgacgcc cttgatgatt tcgacctgga catgctgatt 4320
aactctagag cggccgcaga tccaaaaaag aagagaaagg tagatccaaa aaagaagaga 4380
aaggtagatc caaaaaagaa gagaaaggta gatacggccg catag 4425
<210> 5
<211> 587
<212> DNA
<213> 人工序列
<220>
<223> MS2-激活剂构建体
<400> 5
ccaccatggg acctaagaaa aagaggaagg tggcggccgc ttctagaatg gcttctaact 60
ttactcagtt cgttctcgtc gacaatggcg gaactggcga cgtgactgtc gccccaagca 120
acttcgctaa cgggatcgct gaatggatca gctctaactc gcgttcacag gcttacaaag 180
taacctgtag cgttcgtcag agctctgcgc agaatcgcaa atacaccatc aaagtcgagg 240
tgcctaaagg cgcctggcgt tcgtacttaa atatggaact aaccattcca attttcgcca 300
cgaattccga ctgcgagctt attgttaagg caatgcaagg tctcctaaaa gatggaaacc 360
cgattccctc agcaatcgca gcaaactccg gcatctacga ggccagcggt tccggacggg 420
ctgacgcatt ggacgatttt gatctggata tgctgggaag tgacgccctc gatgattttg 480
accttgacat gcttggttcg gatgcccttg atgactttga cctcgacatg ctcggcagtg 540
acgcccttga tgatttcgac ctggacatgc tgattaactc tagatga 587
<210> 6
<211> 681
<212> DNA
<213> 人工序列
<220>
<223> MS2-激活剂构建体
<400> 6
gccaccatgg gacctaagaa aaagaggaag gtggcggccg cttctagaat ggcttctaac 60
tttactcagt tcgttctcgt cgacaatggc ggaactggcg acgtgactgt cgccccaagc 120
aacttcgcta acgggatcgc tgaatggatc agctctaact cgcgttcaca ggcttacaaa 180
gtaacctgta gcgttcgtca gagctctgcg cagaatcgca aatacaccat caaagtcgag 240
gtgcctaaag gcgcctggcg ttcgtactta aatatggaac taaccattcc aattttcgcc 300
acgaattccg actgcgagct tattgttaag gcaatgcaag gtctcctaaa agatggaaac 360
ccgattccct cagcaatcgc agcaaactcc ggcatctacg aggccagcgg ttccggacgg 420
gctgacgcat tggacgattt tgatctggat atgctgggaa gtgacgccct cgatgatttt 480
gaccttgaca tgcttggttc ggatgccctt gatgactttg acctcgacat gctcggcagt 540
gacgcccttg atgatttcga cctggacatg ctgattaact ctagagcggc cgcagatcca 600
aaaaagaaga gaaaggtaga tccaaaaaag aagagaaagg tagatccaaa aaagaagaga 660
aaggtagata cggccgcata g 681
<210> 7
<211> 557
<212> DNA
<213> 人工序列
<220>
<223> MS2-激活剂构建体
<220>
<221> misc_feature
<222> (320)..(339)
<223> 其中N是G, A, T或C
<400> 7
tgtacaaaaa agcaggcttt aaaggaacca attcagtcga ctggatccgg taccaaggtc 60
gggcaggaag agggcctatt tcccatgatt ccttcatatt tgcatatacg atacaaggct 120
gttagagaga taattagaat taatttgact gtaaacacaa agatattagt acaaaatacg 180
tgacgtagaa agtaataatt tcttgggtag tttgcagttt taaaattatg ttttaaaatg 240
gactatcata tgcttaccgt aacttgaaag tatttcgatt tcttggcttt atatatcttg 300
tggaaaggac gaaacaccgn nnnnnnnnnn nnnnnnnnng ttttagagct agaaatagca 360
agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgctctgc 420
aggtcgactc tagaaaacat gaggatcacc catgtctgca gtattcccgg gttcattaga 480
tcctaaggta cctaattgcc tagaaaacat gaggatcacc catgtctgca ggtcgactct 540
agaaattttt tctagac 557
<210> 8
<211> 882
<212> DNA
<213> 人工序列
<220>
<223> 活化报告子构建体
<400> 8
tagggataac agggtaatag tgtcccctcc accccacagt ggggcgaggt aggcgtgtac 60
ggtgggaggc ctatataagc agagctcgtt tagtgaaccg tcagatcgcc tggagaattc 120
gccaccatgg actacaagga tgacgacgat aaaacttccg gtggcggact gggttccacc 180
gtgagcaagg gcgaggaggt catcaaagag ttcatgcgct tcaaggtgcg catggagggc 240
tccatgaacg gccacgagtt cgagatcgag ggcgagggcg agggccgccc ctacgagggc 300
acccagaccg ccaagctgaa ggtgaccaag ggcggccccc tgcccttcgc ctgggacatc 360
ctgtcccccc agttcatgta cggctccaag gcgtacgtga agcaccccgc cgacatcccc 420
gattacaaga agctgtcctt ccccgagggc ttcaagtggg agcgcgtgat gaacttcgag 480
gacggcggtc tggtgaccgt gacccaggac tcctccctgc aggacggcac gctgatctac 540
aaggtgaaga tgcgcggcac caacttcccc cccgacggcc ccgtaatgca gaagaagacc 600
atgggctggg aggcctccac cgagcgcctg tacccccgcg acggcgtgct gaagggcgag 660
atccaccagg ccctgaagct gaaggacggc ggccactacc tggtggagtt caagaccatc 720
tacatggcca agaagcccgt gcaactgccc ggctactact acgtggacac caagctggac 780
atcacctccc acaacgagga ctacaccatc gtggaacagt acgagcgctc cgagggccgc 840
caccacctgt tcctgtacgg catggacgag ctgtacaagt aa 882
<210> 9
<211> 882
<212> DNA
<213> 人工序列
<220>
<223> 活化报告子构建体
<400> 9
tagggataac agggtaatag tggggccact agggacagga ttggcgaggt aggcgtgtac 60
ggtgggaggc ctatataagc agagctcgtt tagtgaaccg tcagatcgcc tggagaattc 120
gccaccatgg actacaagga tgacgacgat aaaacttccg gtggcggact gggttccacc 180
gtgagcaagg gcgaggaggt catcaaagag ttcatgcgct tcaaggtgcg catggagggc 240
tccatgaacg gccacgagtt cgagatcgag ggcgagggcg agggccgccc ctacgagggc 300
acccagaccg ccaagctgaa ggtgaccaag ggcggccccc tgcccttcgc ctgggacatc 360
ctgtcccccc agttcatgta cggctccaag gcgtacgtga agcaccccgc cgacatcccc 420
gattacaaga agctgtcctt ccccgagggc ttcaagtggg agcgcgtgat gaacttcgag 480
gacggcggtc tggtgaccgt gacccaggac tcctccctgc aggacggcac gctgatctac 540
aaggtgaaga tgcgcggcac caacttcccc cccgacggcc ccgtaatgca gaagaagacc 600
atgggctggg aggcctccac cgagcgcctg tacccccgcg acggcgtgct gaagggcgag 660
atccaccagg ccctgaagct gaaggacggc ggccactacc tggtggagtt caagaccatc 720
tacatggcca agaagcccgt gcaactgccc ggctactact acgtggacac caagctggac 780
atcacctccc acaacgagga ctacaccatc gtggaacagt acgagcgctc cgagggccgc 840
caccacctgt tcctgtacgg catggacgag ctgtacaagt aa 882
<210> 10
<211> 912
<212> DNA
<213> 人工序列
<220>
<223> 特异性报告子文库
<220>
<221> misc_feature
<222> (22)..(44)
<223> 其中N是G, A, T或C
<220>
<221> misc_feature
<222> (154)..(177)
<223> 其中N是G, A, T或C
<400> 10
tagggataac agggtaatag tnnnnnnnnn nnnnnnnnnn nnnncgaggt aggcgtgtac 60
ggtgggaggc ctatataagc agagctcgtt tagtgaaccg tcagatcgcc tggagaattc 120
gccaccatgg actacaagga tgacgacgat aaannnnnnn nnnnnnnnnn nnnnnnnact 180
tccggtggcg gactgggttc caccgtgagc aagggcgagg aggtcatcaa agagttcatg 240
cgcttcaagg tgcgcatgga gggctccatg aacggccacg agttcgagat cgagggcgag 300
ggcgagggcc gcccctacga gggcacccag accgccaagc tgaaggtgac caagggcggc 360
cccctgccct tcgcctggga catcctgtcc ccccagttca tgtacggctc caaggcgtac 420
gtgaagcacc ccgccgacat ccccgattac aagaagctgt ccttccccga gggcttcaag 480
tgggagcgcg tgatgaactt cgaggacggc ggtctggtga ccgtgaccca ggactcctcc 540
ctgcaggacg gcacgctgat ctacaaggtg aagatgcgcg gcaccaactt cccccccgac 600
ggccccgtaa tgcagaagaa gaccatgggc tgggaggcct ccaccgagcg cctgtacccc 660
cgcgacggcg tgctgaaggg cgagatccac caggccctga agctgaagga cggcggccac 720
tacctggtgg agttcaagac catctacatg gccaagaagc ccgtgcaact gcccggctac 780
tactacgtgg acaccaagct ggacatcacc tcccacaacg aggactacac catcgtggaa 840
cagtacgagc gctccgaggg ccgccaccac ctgttcctgt acggcatgga cgagctgtac 900
aagtaagaat tc 912
<210> 11
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 11
ctggcggatc actcgcggtt agg 23
<210> 12
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 12
cctcggcctc caaaagtgct agg 23
<210> 13
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 13
acgctgattc ctgcagatca ggg 23
<210> 14
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 14
ccaggaatac gtatccacca ggg 23
<210> 15
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 15
gccacaccca agcgatcaaa tgg 23
<210> 16
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 16
aaataataca ttctaaggta agg 23
<210> 17
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 17
gctactgggg aggctgaggc agg 23
<210> 18
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 18
tagcaataca gtcacattaa tgg 23
<210> 19
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 19
ctcatgtgat ccccccgtct cgg 23
<210> 20
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 20
ccgggcagag agtgaacgcg cgg 23
<210> 21
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 21
ttccttccct ctcccgtgct tgg 23
<210> 22
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 22
tctctgcaaa gcccctggag agg 23
<210> 23
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 23
aatgcagttg ccgagtgcag tgg 23
<210> 24
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 24
cctcagcctc ctaaagtgct ggg 23
<210> 25
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 25
gagtccaaat cctctttact agg 23
<210> 26
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 26
gagtgtctgg atttgggata agg 23
<210> 27
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 27
cagcacctca tctcccagtg agg 23
<210> 28
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 28
tctaaaaccc agggaatcat ggg 23
<210> 29
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 29
cacaaggcag ccagggatcc agg 23
<210> 30
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 30
gatggcaagc tgagaaacac tgg 23
<210> 31
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 31
tgaaatgcac gcatacaatt agg 23
<210> 32
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 32
ccagtccaga cctggccttc tgg 23
<210> 33
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 33
cccagaaaaa cagaccctga agg 23
<210> 34
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 34
aagggttgag cacttgttta ggg 23
<210> 35
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 35
atgtctgagt tttggttgag agg 23
<210> 36
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 36
ggtcccttga aggggaagta ggg 23
<210> 37
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 37
tggcagtcta ctcttgaaga tgg 23
<210> 38
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 38
ggcacagtgc cagaggtctg tgg 23
<210> 39
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 39
taaaaataaa aaaactaaca ggg 23
<210> 40
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 40
tctgtggggg acctgcactg agg 23
<210> 41
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 41
ggccagaggt caaggctagt ggg 23
<210> 42
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 42
cacgaccgaa acccttctta cgg 23
<210> 43
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 43
gttgaatgaa gacagtctag tgg 23
<210> 44
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 44
taagaacaga gcaagttacg tgg 23
<210> 45
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 45
tgtaaggtaa gagaggagag cgg 23
<210> 46
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 46
tgacacacca actcctgcac tgg 23
<210> 47
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 47
tttacccact tccttcgaaa agg 23
<210> 48
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 48
gtggctggca ggctggctct ggg 23
<210> 49
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 49
ctcccccggc ctcccccgcg cgg 23
<210> 50
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 50
caaaacccgg cagcgaggct ggg 23
<210> 51
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 51
aggagccgcc gcgcgctgat tgg 23
<210> 52
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 52
cacacacacc cacacgagat ggg 23
<210> 53
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 53
gaagaagcta aagagccaga ggg 23
<210> 54
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 54
atgagaattt caataacctc agg 23
<210> 55
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 55
tcccgctctg ttgcccaggc tgg 23
<210> 56
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 56
cagacaccca ccaccatgcg tgg 23
<210> 57
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 57
tcccaattta ctgggattac agg 23
<210> 58
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 58
tgatttaaaa gttggaaacg tgg 23
<210> 59
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 59
tctagttccc cacctagtct ggg 23
<210> 60
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 60
gattaactga gaattcacaa ggg 23
<210> 61
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶向探针
<400> 61
cgccaggagg ggtgggtcta agg 23
<210> 62
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 报告子构建体
<400> 62
gtcccctcca ccccacagtg ggg 23
<210> 63
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 报告子构建体
<400> 63
ggggccacta gggacaggat tgg 23
<210> 64
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 64
taatactttt atctgtcccc tccaccccac agtggggcca ctagggacag gattggtgac 60
agaaaagccc c 71
<210> 65
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 65
ggggccacta gggacaggat 20
<210> 66
<211> 80
<212> RNA
<213> 人工序列
<220>
<223> 向导RNA
<400> 66
guuuuagagc uagaaauagc aaguuaaaau aaggcuagcu uguuaucaac uugaaaaagu 60
ggcaccgagu cggugcuuuu 80
<210> 67
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 67
gtcccctcca ccccacagtg cag 23
<210> 68
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 68
gtcccctcca ccccacagtg caa 23
<210> 69
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 69
gtcccctcca ccccacagtg cgg 23
<210> 70
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 70
tgtcccctcc accccacagt ggggccacta gggacaggat tggtgacaga aa 52
<210> 71
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 71
tgtccccccc accccacagt ggggccacta gggacaggat tggtgacaga aa 52
<210> 72
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 72
aaaaccctcc accccacagt ggggccacta gggacaggat tggtgacaga aa 52
<210> 73
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 73
tgtcccctcc ttttttcagt ggggccacta gggacaggat tggtgacaga aa 52
<210> 74
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 74
caccggggtg gtgcccatcc tgg 23
<210> 75
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 75
ggtgcccatc ctggtcgagc tgg 23
<210> 76
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 76
cccatcctgg tcgagctgga cgg 23
<210> 77
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 77
ggccacaagt tcagcgtgtc cgg 23
<210> 78
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 78
cgcaaataag agctcaccta cgg 23
<210> 79
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 79
ctgaagttca tctgcaccac cgg 23
<210> 80
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 80
ccggcaagct gcccgtgccc tgg 23
<210> 81
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 81
gaccaggatg ggcaccaccc cgg 23
<210> 82
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 82
gccgtccagc tcgaccagga tgg 23
<210> 83
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 83
ggccggacac gctgaacttg tgg 23
<210> 84
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 84
taacagggta atgtcgaggc cgg 23
<210> 85
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 85
aggtgagctc ttatttgcgt agg 23
<210> 86
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 86
cttcagggtc agcttgccgt agg 23
<210> 87
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 87
gggcacgggc agcttgccgg tgg 23
<210> 88
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 88
gagatgatcg ccccttcttc tgg 23
<210> 89
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 89
gagatgatcg ccccttcttc 20
<210> 90
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 90
gtgatgaccg gccgttcttc 20
<210> 91
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 91
gtcccctcca ccccacagtg ggg 23
<210> 92
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 92
gagatgatcg cccgttcttc tgg 23
<210> 93
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 93
guccccucca ccccacagug 20
<210> 94
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 94
guccccucca ccccacaguc 20
<210> 95
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 95
guccccucca ccccacagag 20
<210> 96
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 96
guccccucca ccccacacug 20
<210> 97
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 97
guccccucca ccccacugug 20
<210> 98
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 98
guccccucca ccccagagug 20
<210> 99
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 99
guccccucca ccccucagug 20
<210> 100
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 100
guccccucca cccgacagug 20
<210> 101
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 101
guccccucca ccgcacagug 20
<210> 102
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 102
guccccucca cgccacagug 20
<210> 103
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 103
guccccucca gcccacagug 20
<210> 104
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 104
guccccuccu ccccacagug 20
<210> 105
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 105
guccccucga ccccacagug 20
<210> 106
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 106
guccccucca ccccacagac 20
<210> 107
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 107
guccccucca ccccacucug 20
<210> 108
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 108
guccccucca ccccugagug 20
<210> 109
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 109
guccccucca ccggacagug 20
<210> 110
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 110
guccccucca ggccacagug 20
<210> 111
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 111
guccccucgu ccccacagug 20
<210> 112
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 112
ggggccacta gggacaggat ggg 23
<210> 113
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 113
gagaugaucg ccccuucuuc 20
<210> 114
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 114
gagaugaucg ccccuucuug 20
<210> 115
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 115
gagaugaucg ccccuucuac 20
<210> 116
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 116
gagaugaucg ccccuucauc 20
<210> 117
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 117
gagaugaucg ccccuuguuc 20
<210> 118
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 118
gagaugaucg ccccuacuuc 20
<210> 119
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 119
gagaugaucg ccccaucuuc 20
<210> 120
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 120
gagaugaucg cccguucuuc 20
<210> 121
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 121
gagaugaucg ccgcuucuuc 20
<210> 122
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 122
gagaugaucg cgccuucuuc 20
<210> 123
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 123
gagaugaucg gcccuucuuc 20
<210> 124
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 124
gagaugaucc ccccuucuuc 20
<210> 125
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 125
gagaugaugg ccccuucuuc 20
<210> 126
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 126
gagaugaucg ccccuucuag 20
<210> 127
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 127
gagaugaucg ccccuugauc 20
<210> 128
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 128
gagaugaucg ccccaacuuc 20
<210> 129
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 129
gagaugaucg ccgguucuuc 20
<210> 130
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 130
gagaugaucg ggccuucuuc 20
<210> 131
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 131
gagaugaugc ccccuucuuc 20
<210> 132
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 132
gagatgatcg ccccttcttc tgg 23
<210> 133
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 133
ggggccacua gggacaggau 20
<210> 134
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 134
gggccacuag ggacaggau 19
<210> 135
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 135
ggccacuagg gacaggau 18
<210> 136
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 136
gccacuaggg acaggau 17
<210> 137
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 137
gagaugaucg ccccuucuuc 20
<210> 138
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 138
gaugaucgcc ccuucuuc 18
<210> 139
<211> 15
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 139
gaucgccccu ucuuc 15
<210> 140
<211> 11
<212> RNA
<213> 人工序列
<220>
<223> RNA靶标序列
<400> 140
gccccuucuu c 11
<210> 141
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 141
gtcccctcca ccccacagtg c 21
<210> 142
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<220>
<221> misc_feature
<222> (5)..(10)
<223> 其中N是G, A, T或C
<400> 142
tgtcnnnnnn accc 14
<210> 143
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 143
tgtcaaaaaa accc 14
<210> 144
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 144
tgtcgggggg accc 14
<210> 145
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 145
tgtcaaaaaa accc 14
<210> 146
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 146
tgtcgggggg accc 14
<210> 147
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 147
tgtccccccc accc 14
<210> 148
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 148
tgtctttttt accc 14
<210> 149
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 149
tgtccccccc accc 14
<210> 150
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 150
tgtctttttt accc 14
<210> 151
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 151
ggatcctgtg tccccgagct ggg 23
<210> 152
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 152
gttaatgtgg ctctggttct ggg 23
<210> 153
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 153
ggggccacta gggacaggat tgg 23
<210> 154
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 154
cttcctagtc tcctgatatt ggg 23
<210> 155
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 155
tggtcccagc tcggggacac agg 23
<210> 156
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 156
agaaccagag ccacattaac cgg 23
<210> 157
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 157
gtcaccaatc ctgtccctag tgg 23
<210> 158
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 158
agacccaata tcaggagact agg 23
<210> 159
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 159
gggatcctgt gtccccgagc tgggaccacc ttatattccc agggccggtt aatgtggctc 60
tggttctggg tactt 75
<210> 160
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 160
gggatcctgt gtccccgagc tgggaccacc ttatattccc agggccggtt aatgtggttc 60
tgggtactt 69
<210> 161
<211> 113
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 161
gggatcctgt gtccccgagc tgggaccacc ttatattccc agggcagggc cggttggacc 60
accttatatt cccagggcag ggccggttaa tgtggctctg gttctgggta ctt 113
<210> 162
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 162
gggatcctgt gtccccgtct ggttctgggt actt 34
<210> 163
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 163
gggatcctgt gtccccgagc tgggaccacc ttatattctg ggtactt 47
<210> 164
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 164
gggatcctgt ggtactt 17
<210> 165
<211> 93
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 165
agggccggtt aatgtggctc tggttctggg tacttttatc tgtcccctcc accccacagt 60
ggggccacta gggacaggat tggtgacaga aaa 93
<210> 166
<211> 83
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 166
agggccggtt aatgaatgtg gctctggttc tgggtacttt tatctgtccc ctccacccca 60
cagtggggcc actagacaga aaa 83
<210> 167
<211> 76
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 167
agggccggtt aatgtggctc tggttctggg tacttttatc tgtcccccag tggggccact 60
gattggtgac agaaaa 76
<210> 168
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 168
agggccggtt caggattggt gacagaaaa 29
<210> 169
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 169
agggccggtt aatgtggcga ttggtgacag aaaa 34
<210> 170
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 170
agggccggtt aatgtggctc tggttctggg tacttttatc tgtccccgat tggtgacaga 60
aaa 63
<210> 171
<211> 84
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 171
agggccggtt aatgtggctc tggttctggg tacttttatc tgtcccctcc accccacagt 60
ggggacagga ttggtgacag aaaa 84
<210> 172
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 172
agggccggtt aatgtggtga cagaaaa 27
<210> 173
<211> 105
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 173
agggccggtt aatgtggctc tggttctggg tacttttatc tgtcccctcc accccagggg 60
acagtctgtc ccctccaccc cagggacagg attggtgaca gaaaa 105
<210> 174
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 174
agggccggtt aatgtggctc tggttctggg tacttttatc tgtcccctcc accactaggg 60
acaggattgg tgacagaaaa 80
<210> 175
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 175
cccacagtgg ggccactagg gacaggattg gtgacagaaa agccccatac ccc 53
<210> 176
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 176
cccacagtgg ggccactacc cc 22
<210> 177
<211> 96
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 177
cccacagtgg ggccactagt agaaaagccc catccttagg cctcccccat ccttaggcct 60
cctccttcct agtctcctga tattgggtct aacccc 96
<210> 178
<211> 94
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 178
cccacagtgg ggccactagg gacaggattg gtgacagaaa agccccatcc ttaggcctcc 60
tccttcctag tctcctgata ttgggtctaa cccc 94
<210> 179
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 179
cccacagtgg ggccaccctt aggcctcctc cttcctagtc tcctgatatt gggtctaacc 60
cc 62
<210> 180
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 180
cccacagtgg ggccactagt gatattgggt ctaacccc 38
<210> 181
<211> 94
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 181
cccacagtgg ggccactagg gacaggattg gtgacaaaaa agccccatcc ttacgcctcc 60
tccttcctag tctcctgata ttgggtctaa cccc 94
<210> 182
<211> 65
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 182
cccacagtgg ggccactagg gacaggcctc ctccttccta gtctcctgat attgggtcta 60
acccc 65
<210> 183
<211> 102
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 183
cccacagtgg ggccactagg gacaggggga caggattggt gacagaaaag ccccatcctt 60
aggcctcctc cttcctagtc tcctgatatt gggtctaacc cc 102
<210> 184
<211> 76
<212> DNA
<213> 人工序列
<220>
<223> 靶标寡核苷酸序列
<400> 184
cccacaggat tggtgacaga aaagccccat ccttaggcct cctccttcct agtctcctga 60
tattgggtct aacccc 76

Claims (43)

1.一种改变细胞中DNA靶标核酸的方法,包括
向所述细胞引入编码两种或更多种RNA的第一外源核酸,其中每种RNA与所述DNA靶标核酸中相邻位点互补,
向所述细胞引入编码至少一种Cas9蛋白切口酶的第二外源核酸,所述Cas9蛋白切口酶具有一个非活性核酸酶结构域并由所述两种或更多种RNA导向,且
其中表达所述两种或更多种RNA和所述至少一种Cas9蛋白切口酶,并且其中所述至少一种Cas9蛋白切口酶与所述两种或更多种RNA共定位至所述DNA靶标核酸,并且切割所述DNA靶标核酸,从而导致产生两个或更多个相邻切口。
2.根据权利要求1所述的方法,其中所述两个或更多个相邻切口在双链DNA的相同链上。
3.根据权利要求1所述的方法,其中所述两个或更多个相邻切口在双链DNA的相同链上并导致产生同源重组。
4.根据权利要求1所述的方法,其中所述两个或更多个相邻切口在双链DNA的不同链上。
5.根据权利要求1所述的方法,其中所述两个或更多个相邻切口在双链DNA的不同链上并且产生双链断裂。
6.根据权利要求1所述的方法,其中所述两个或更多个相邻切口在双链DNA的不同链上并且产生双链断裂,从而导致非同源末端接合。
7.根据权利要求1所述的方法,其中所述两个或更多个相邻切口在双链DNA的不同链上并且彼此之间相对偏移。
8.根据权利要求1所述的方法,其中所述两个或更多个相邻切口在双链DNA的不同链上并且彼此之间相对偏移,并产生双链断裂。
9.根据权利要求1所述的方法,其中所述两个或更多个相邻切口在双链DNA的不同链上并且彼此之间相对偏移,并产生双链断裂,从而导致非同源末端接合。
10.根据权利要求1所述的方法,还包括向所述细胞引入编码供体核酸序列的第三外源核酸,其中所述两个或更多个切口导致产生所述靶标核酸与所述供体核酸序列的同源重组。
11.一种细胞,包括
编码两种或更多种RNA的第一外源核酸,其中每种RNA与DNA靶标核酸中相邻位点互补,和
编码至少一种具有一个非活性核酸酶结构域的Cas9蛋白切口酶的第二外源核酸,并且其中所述两种或更多种RNA和所述至少一种Cas9蛋白切口酶是所述DNA靶标核酸的共定位复合物的元件。
12.根据权利要求11所述的细胞,其中所述细胞是真核细胞。
13.根据权利要求11所述的细胞,其中所述细胞是酵母细胞、植物细胞或动物细胞。
14.根据权利要求11所述的细胞,其中所述RNA包括约10至约500个核苷酸。
15.根据权利要求11所述的细胞,其中所述RNA包括约20至约100个核苷酸。
16.根据权利要求11所述的细胞,其中所述靶标核酸与疾病或有害状况有关。
17.根据权利要求11所述的细胞,其中所述两种或更多种RNA是向导RNA。
18.根据权利要求11所述的细胞,其中所述两种或更多种RNA是tracrRNA-crRNA融合体。
19.根据权利要求11所述的细胞,其中所述DNA靶标核酸是基因组DNA、线粒体DNA、病毒DNA或外源DNA。
20.一种改变细胞中DNA靶标核酸的方法,包括
向所述细胞引入编码两种或更多种RNA的第一外源核酸,其中每种RNA与所述DNA靶标核酸中相邻位点互补,
向所述细胞引入编码至少一种Cas9蛋白切口酶的第二外源核酸,所述Cas9蛋白切口酶具有一个非活性核酸酶结构域并由两种或更多种RNA导向,且
其中表达所述两种或更多种RNA和所述至少一种Cas9蛋白切口酶,并且其中所述至少一种Cas9蛋白切口酶与所述两种或更多种RNA共定位至所述DNA靶标核酸,并且切割所述DNA靶标核酸,从而导致产生两个或更多个相邻切口,且
其中所述两个或更多个相邻切口在所述双链DNA的不同链上,并且产生双链断裂,从而导致所述靶标核酸片段化,借此防止所述靶标核酸的表达。
21.一种改变细胞中DNA靶标核酸的方法,包括
向所述细胞引入编码两种或更多种RNA的第一外源核酸,其中每种RNA与所述DNA靶标核酸中相邻位点互补,
向所述细胞引入编码至少一种RNA导向的DNA结合蛋白切口酶的第二外源核酸,且
其中表达所述两种或更多种RNA和所述至少一种RNA导向的DNA结合蛋白切口酶,并且其中所述至少一种RNA导向的DNA结合蛋白切口酶与所述两种或更多种RNA共定位至所述DNA靶标核酸,并且切割所述DNA靶标核酸,从而导致产生两个或更多个相邻切口。
22.根据权利要求21所述的方法,其中所述两个或更多个相邻切口在双链DNA的相同链上。
23.根据权利要求21所述的方法,其中所述两个或更多个相邻切口在双链DNA的相同链上并导致产生同源重组。
24.根据权利要求21所述的方法,其中所述两个或更多个相邻切口在双链DNA的不同链上。
25.根据权利要求21所述的方法,其中所述两个或更多个相邻切口在双链DNA的不同链上并且产生双链断裂。
26.根据权利要求21所述的方法,其中所述两个或更多个相邻切口在双链DNA的不同链上并且产生双链断裂,从而导致非同源末端接合。
27.根据权利要求21所述的方法,其中所述两个或更多个相邻切口在双链DNA的不同链上并且彼此之间相对偏移。
28.根据权利要求21所述的方法,其中所述两个或更多个相邻切口在双链DNA的不同链上并且彼此之间相对偏移,并产生双链断裂。
29.根据权利要求21所述的方法,其中所述两个或更多个相邻切口在双链DNA的不同链上并且彼此之间相对偏移,并产生双链断裂,从而导致非同源末端接合。
30.根据权利要求21所述的方法,还包括向所述细胞引入编码供体核酸序列的第三外源核酸,其中所述两个或更多个切口导致产生所述靶标核酸与所述供体核酸序列的同源重组。
31.一种细胞,包括
编码两种或更多种RNA的第一外源核酸,其中每种RNA与DNA靶标核酸中相邻位点互补,和
编码至少一种RNA导向的DNA结合蛋白切口酶的第二外源核酸,并且其中所述两种或更多种RNA和所述至少一种RNA导向的DNA结合蛋白切口酶是所述DNA靶标核酸的共定位复合物的元件。
32.根据权利要求31所述的细胞,其中所述细胞是真核细胞。
33.根据权利要求31所述的细胞,其中所述细胞是酵母细胞、植物细胞或动物细胞。
34.根据权利要求31所述的细胞,其中所述RNA包括约10至约500个核苷酸。
35.根据权利要求31所述的细胞,其中所述RNA包括约20至约100个核苷酸。
36.根据权利要求31所述的细胞,其中所述靶标核酸与疾病或有害状况有关。
37.根据权利要求31所述的细胞,其中所述两种或更多种RNA是向导RNA。
38.根据权利要求31所述的细胞,其中所述两种或更多种RNA是tracrRNA-crRNA融合体。
39.根据权利要求31所述的细胞,其中所述DNA靶标核酸是基因组DNA、线粒体DNA、病毒DNA或外源DNA。
40.一种改变细胞中DNA靶标核酸的方法,包括
向所述细胞引入编码两种或更多种RNA的第一外源核酸,其中每种RNA与所述DNA靶标核酸中相邻位点互补,
向所述细胞引入编码至少一种RNA导向的DNA结合蛋白切口酶的第二外源核酸,且
其中表达所述两种或更多种RNA和所述至少一种RNA导向的DNA结合蛋白切口酶,并且其中所述至少一种RNA导向的DNA结合蛋白切口酶与所述两种或更多种RNA共定位至所述DNA靶标核酸,并且切割所述DNA靶标核酸,从而导致产生两个或更多个相邻切口,和
其中所述两个或更多个相邻切口在所述双链DNA的不同链上,并且产生双链断裂,从而导致所述靶标核酸片段化,借此防止所述靶标核酸的表达。
41.根据权利要求21所述的方法,其中所述至少一种RNA导向的DNA结合蛋白切口酶是II型CRISPR系统的RNA导向的DNA结合蛋白切口酶。
42.根据权利要求31所述的细胞,其中所述至少一种RNA导向的DNA结合蛋白切口酶是II型CRISPR系统的RNA导向的DNA结合蛋白切口酶。
43.根据权利要求40所述的方法,其中所述至少一种RNA导向的DNA结合蛋白切口酶是II型CRISPR系统的RNA导向的DNA结合蛋白切口酶。
CN202110830978.0A 2013-06-04 2014-06-04 Rna-导向的转录调控 Pending CN113846096A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361830787P 2013-06-04 2013-06-04
US61/830,787 2013-06-04
CN201480043971.2A CN105451778B (zh) 2013-06-04 2014-06-04 Rna-导向的转录调控

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201480043971.2A Division CN105451778B (zh) 2013-06-04 2014-06-04 Rna-导向的转录调控

Publications (1)

Publication Number Publication Date
CN113846096A true CN113846096A (zh) 2021-12-28

Family

ID=52008736

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202110830978.0A Pending CN113846096A (zh) 2013-06-04 2014-06-04 Rna-导向的转录调控
CN201480043971.2A Active CN105451778B (zh) 2013-06-04 2014-06-04 Rna-导向的转录调控

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201480043971.2A Active CN105451778B (zh) 2013-06-04 2014-06-04 Rna-导向的转录调控

Country Status (15)

Country Link
US (2) US11981917B2 (zh)
EP (3) EP3003392B1 (zh)
JP (5) JP6621738B2 (zh)
KR (3) KR102282990B1 (zh)
CN (2) CN113846096A (zh)
AU (3) AU2014274939B2 (zh)
BR (1) BR112015030491A8 (zh)
CA (2) CA2914638A1 (zh)
ES (1) ES2930537T3 (zh)
IL (3) IL284773B2 (zh)
MX (2) MX2015016798A (zh)
MY (2) MY197877A (zh)
RU (2) RU2756865C2 (zh)
SG (3) SG10201913068PA (zh)
WO (1) WO2014197568A2 (zh)

Families Citing this family (86)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3613852A3 (en) 2011-07-22 2020-04-22 President and Fellows of Harvard College Evaluation and improvement of nuclease cleavage specificity
US11021737B2 (en) 2011-12-22 2021-06-01 President And Fellows Of Harvard College Compositions and methods for analyte detection
US9637739B2 (en) * 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
CN110643600A (zh) * 2012-10-23 2020-01-03 基因工具股份有限公司 用于切割靶dna的系统及其用途
WO2014093709A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Methods, models, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof
MX2015007550A (es) 2012-12-12 2017-02-02 Broad Inst Inc Suministro, modificación y optimización de sistemas, métodos y composiciones para la manipulación de secuencias y aplicaciones terapéuticas.
EP3553174A1 (en) * 2012-12-17 2019-10-16 President and Fellows of Harvard College Rna-guided human genome engineering
US10138509B2 (en) 2013-03-12 2018-11-27 President And Fellows Of Harvard College Method for generating a three-dimensional nucleic acid containing matrix
US9234213B2 (en) 2013-03-15 2016-01-12 System Biosciences, Llc Compositions and methods directed to CRISPR/Cas genomic engineering systems
KR102282990B1 (ko) 2013-06-04 2021-07-28 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 Rna-가이드된 전사 조절
US20140356956A1 (en) 2013-06-04 2014-12-04 President And Fellows Of Harvard College RNA-Guided Transcriptional Regulation
JP6702858B2 (ja) 2013-06-17 2020-06-03 ザ・ブロード・インスティテュート・インコーポレイテッド ウイルス成分を使用して障害および疾患をターゲティングするためのCRISPR−Cas系および組成物の送達、使用および治療上の適用
EP4245853A3 (en) * 2013-06-17 2023-10-18 The Broad Institute, Inc. Optimized crispr-cas double nickase systems, methods and compositions for sequence manipulation
EP3725885A1 (en) 2013-06-17 2020-10-21 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof
EP3011029B1 (en) 2013-06-17 2019-12-11 The Broad Institute, Inc. Delivery, engineering and optimization of tandem guide systems, methods and compositions for sequence manipulation
AU2014281028B2 (en) 2013-06-17 2020-09-10 Massachusetts Institute Of Technology Delivery and use of the CRISPR-Cas systems, vectors and compositions for hepatic targeting and therapy
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9322037B2 (en) 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
US9228207B2 (en) 2013-09-06 2016-01-05 President And Fellows Of Harvard College Switchable gRNAs comprising aptamers
US9737604B2 (en) 2013-09-06 2017-08-22 President And Fellows Of Harvard College Use of cationic lipids to deliver CAS9
ES2681622T3 (es) * 2013-09-18 2018-09-14 Kymab Limited Métodos, células y organismos
US9834791B2 (en) 2013-11-07 2017-12-05 Editas Medicine, Inc. CRISPR-related methods and compositions with governing gRNAS
EP3080271B1 (en) 2013-12-12 2020-02-12 The Broad Institute, Inc. Systems, methods and compositions for sequence manipulation with optimized functional crispr-cas systems
US9068179B1 (en) 2013-12-12 2015-06-30 President And Fellows Of Harvard College Methods for correcting presenilin point mutations
CN111206032A (zh) 2013-12-12 2020-05-29 布罗德研究所有限公司 用于基因组编辑的crispr-cas系统和组合物的递送、用途和治疗应用
SG10201804973TA (en) 2013-12-12 2018-07-30 Broad Inst Inc Compositions and Methods of Use of Crispr-Cas Systems in Nucleotide Repeat Disorders
WO2015089364A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Crystal structure of a crispr-cas system, and uses thereof
WO2015134812A1 (en) 2014-03-05 2015-09-11 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating usher syndrome and retinitis pigmentosa
DK3116997T3 (da) 2014-03-10 2019-08-19 Editas Medicine Inc Crispr/cas-relaterede fremgangsmåder og sammensætninger til behandling af lebers kongenitale amaurose 10 (lca10)
US11141493B2 (en) 2014-03-10 2021-10-12 Editas Medicine, Inc. Compositions and methods for treating CEP290-associated disease
US11339437B2 (en) 2014-03-10 2022-05-24 Editas Medicine, Inc. Compositions and methods for treating CEP290-associated disease
US10323073B2 (en) 2014-03-20 2019-06-18 UNIVERSITé LAVAL CRISPR-based methods and products for increasing frataxin levels and uses thereof
US11242525B2 (en) 2014-03-26 2022-02-08 Editas Medicine, Inc. CRISPR/CAS-related methods and compositions for treating sickle cell disease
AU2015298571B2 (en) 2014-07-30 2020-09-03 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
NZ728437A (en) 2014-08-27 2018-02-23 Caribou Biosciences Inc Methods for increasing cas9-mediated engineering efficiency
CA2963820A1 (en) 2014-11-07 2016-05-12 Editas Medicine, Inc. Methods for improving crispr/cas-mediated genome-editing
JP7068821B2 (ja) 2014-12-03 2022-05-17 アジレント・テクノロジーズ・インク 化学修飾を有するガイドrna
WO2016094867A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Protected guide rnas (pgrnas)
WO2016094874A1 (en) * 2014-12-12 2016-06-16 The Broad Institute Inc. Escorted and functionalized guides for crispr-cas systems
AU2016246450B2 (en) 2015-04-06 2022-03-17 Agilent Technologies, Inc. Chemically modified guide RNAs for CRISPR/Cas-mediated gene regulation
GB201506509D0 (en) 2015-04-16 2015-06-03 Univ Wageningen Nuclease-mediated genome editing
AU2016253150B2 (en) 2015-04-24 2022-04-21 Editas Medicine, Inc. Evaluation of Cas9 molecule/guide RNA molecule complexes
EP3294896A1 (en) 2015-05-11 2018-03-21 Editas Medicine, Inc. Optimized crispr/cas9 systems and methods for gene editing in stem cells
AU2016276702B2 (en) 2015-06-09 2022-07-28 Editas Medicine, Inc. CRISPR/CAS-related methods and compositions for improving transplantation
US9790490B2 (en) * 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
CN108290933A (zh) 2015-06-18 2018-07-17 布罗德研究所有限公司 降低脱靶效应的crispr酶突变
US10648020B2 (en) 2015-06-18 2020-05-12 The Broad Institute, Inc. CRISPR enzymes and systems
WO2016205759A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Engineering and optimization of systems, methods, enzymes and guide scaffolds of cas9 orthologs and variants for sequence manipulation
AU2016326711B2 (en) 2015-09-24 2022-11-03 Editas Medicine, Inc. Use of exonucleases to improve CRISPR/Cas-mediated genome editing
CN108513575A (zh) 2015-10-23 2018-09-07 哈佛大学的校长及成员们 核碱基编辑器及其用途
GB2559526B (en) 2015-11-03 2021-02-17 Harvard College Method and apparatus for volumetric imaging of a three-dimensional nucleic acid containing matrix
US20190264186A1 (en) * 2016-01-22 2019-08-29 The Broad Institute Inc. Crystal structure of crispr cpf1
US11512311B2 (en) 2016-03-25 2022-11-29 Editas Medicine, Inc. Systems and methods for treating alpha 1-antitrypsin (A1AT) deficiency
EP3433363A1 (en) 2016-03-25 2019-01-30 Editas Medicine, Inc. Genome editing systems comprising repair-modulating enzyme molecules and methods of their use
US11236313B2 (en) 2016-04-13 2022-02-01 Editas Medicine, Inc. Cas9 fusion molecules, gene editing systems, and methods of use thereof
CN116200465A (zh) 2016-04-25 2023-06-02 哈佛学院董事及会员团体 用于原位分子检测的杂交链反应方法
EP3604527B1 (en) * 2016-06-02 2021-05-12 Sigma-Aldrich Co., LLC Using programmable dna binding proteins to enhance targeted genome modification
US10767175B2 (en) 2016-06-08 2020-09-08 Agilent Technologies, Inc. High specificity genome editing using chemically modified guide RNAs
WO2017216771A2 (en) * 2016-06-17 2017-12-21 Genesis Technologies Limited Crispr-cas system, materials and methods
BR112019001887A2 (pt) 2016-08-02 2019-07-09 Editas Medicine Inc composições e métodos para o tratamento de doença associada a cep290
WO2018027078A1 (en) 2016-08-03 2018-02-08 President And Fellows Of Harard College Adenosine nucleobase editors and uses thereof
CA3033327A1 (en) 2016-08-09 2018-02-15 President And Fellows Of Harvard College Programmable cas9-recombinase fusion proteins and uses thereof
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
KR20240007715A (ko) 2016-10-14 2024-01-16 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵염기 에디터의 aav 전달
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
TW201839136A (zh) 2017-02-06 2018-11-01 瑞士商諾華公司 治療血色素異常症之組合物及方法
EP3592853A1 (en) 2017-03-09 2020-01-15 President and Fellows of Harvard College Suppression of pain by gene editing
JP2020510439A (ja) 2017-03-10 2020-04-09 プレジデント アンド フェローズ オブ ハーバード カレッジ シトシンからグアニンへの塩基編集因子
WO2018170184A1 (en) 2017-03-14 2018-09-20 Editas Medicine, Inc. Systems and methods for the treatment of hemoglobinopathies
SG11201908658TA (en) 2017-03-23 2019-10-30 Harvard College Nucleobase editors comprising nucleic acid programmable dna binding proteins
AU2017407272B2 (en) * 2017-03-30 2024-06-13 Kyoto University Method for inducing exon skipping by genome editing
WO2018201086A1 (en) 2017-04-28 2018-11-01 Editas Medicine, Inc. Methods and systems for analyzing guide rna molecules
EP3622070A2 (en) 2017-05-10 2020-03-18 Editas Medicine, Inc. Crispr/rna-guided nuclease systems and methods
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
WO2018227114A1 (en) 2017-06-09 2018-12-13 Editas Medicine, Inc. Engineered cas9 nucleases
CN107266583B (zh) * 2017-06-27 2021-02-09 深圳大学 一种基于格氏嗜盐碱杆菌Argonaute靶向激活基因转录的方法
EP3652312A1 (en) 2017-07-14 2020-05-20 Editas Medicine, Inc. Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites
US11732274B2 (en) 2017-07-28 2023-08-22 President And Fellows Of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE)
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
CN111757937A (zh) 2017-10-16 2020-10-09 布罗德研究所股份有限公司 腺苷碱基编辑器的用途
CA3089331A1 (en) 2018-03-19 2019-09-26 Regeneron Pharmaceuticals, Inc. Transcription modulation in animals using crispr/cas systems
GB201813011D0 (en) 2018-08-10 2018-09-26 Vib Vzw Means and methods for drought tolerance in crops
DE112020001342T5 (de) 2019-03-19 2022-01-13 President and Fellows of Harvard College Verfahren und Zusammensetzungen zum Editing von Nukleotidsequenzen
EP4146804A1 (en) 2020-05-08 2023-03-15 The Broad Institute Inc. Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
WO2023039586A1 (en) 2021-09-10 2023-03-16 Agilent Technologies, Inc. Guide rnas with chemical modification for prime editing

Family Cites Families (161)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4123610A (en) 1977-03-09 1978-10-31 The United States Government Nucleic acid crosslinking agent and affinity inactivation of nucleic acids therewith
US5525464A (en) 1987-04-01 1996-06-11 Hyseq, Inc. Method of sequencing by hybridization of oligonucleotide probes
US4981985A (en) 1987-10-20 1991-01-01 Trustees Of The University Of Pennsylvania Synthesis of photolabile chelators for multivalent cations
US4844617A (en) 1988-01-20 1989-07-04 Tencor Instruments Confocal measuring microscope with automatic focusing
US5151189A (en) 1990-09-17 1992-09-29 Gelman Sciences, Inc. Cationic charge modified microporous membrane
WO1993016176A1 (en) 1992-02-13 1993-08-19 Bio-Metric Systems, Inc. Immobilization of chemical species in crosslinked matrices
US5594235A (en) 1993-06-17 1997-01-14 Ultrapointe Corporation Automated surface acquisition for a confocal microscope
US5578832A (en) 1994-09-02 1996-11-26 Affymetrix, Inc. Method and apparatus for imaging a sample on a device
SE9400522D0 (sv) 1994-02-16 1994-02-16 Ulf Landegren Method and reagent for detecting specific nucleotide sequences
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
US5830708A (en) 1995-06-06 1998-11-03 Advanced Tissue Sciences, Inc. Methods for production of a naturally secreted extracellular matrix
US6284284B1 (en) 1995-06-06 2001-09-04 Advanced Tissue Sciences, Inc. Compositions and methods for production and use of an injectable naturally secreted extracellular matrix
CN1195872C (zh) 1996-06-06 2005-04-06 林克斯治疗公司 通过连接经编码的衔接子进行测序
US5948617A (en) 1997-06-13 1999-09-07 Biospeparations, Inc. Methods of in situ hybridization
US6083726A (en) 1998-02-03 2000-07-04 Lucent Technologies, Inc. Methods for polynucleotide synthesis and articles for polynucleotide hybridization
ATE423314T1 (de) 1998-06-24 2009-03-15 Illumina Inc Dekodierung von matrixartig-angeordneten sensoren durch mikropartikel
WO2000050642A1 (en) 1999-02-23 2000-08-31 Caliper Technologies Corp. Sequencing by incorporation
US6534266B1 (en) 1999-04-22 2003-03-18 Albert Einstein College Of Medicine Of Yeshiva University Assay of transcription sites by multi-fluor fish
US20020015952A1 (en) 1999-07-30 2002-02-07 Anderson Norman G. Microarrays and their manufacture by slicing
AU8015300A (en) 1999-10-12 2001-04-23 Ohio State University, The Reactive polymeric valve, dispensing devices and methods using same
WO2001037266A1 (en) 1999-11-17 2001-05-25 The Research Foundation Of State University Of New York Three dimensional data storage device and method for reading
EP1263773A4 (en) 2000-03-14 2005-08-31 Active Motif OLIGONUCLEOTIDE ANALOGUES, METHODS OF SYNTHESIS AND METHODS OF IMPLEMENTATION
ATE364722T1 (de) 2000-06-02 2007-07-15 Bayer Corp Verfahren zum nachweis und zur lokalisierung von genen in situ durch hybridisierung einer verzweigten dna
AU3090102A (en) 2000-12-14 2002-06-24 Gen Probe Inc Method and kit for enhancing the association rates of polynucleotides
EP2801624B1 (en) 2001-03-16 2019-03-06 Singular Bio, Inc Arrays and methods of use
US7473767B2 (en) 2001-07-03 2009-01-06 The Institute For Systems Biology Methods for detection and quantification of analytes in complex mixtures
US20060248349A1 (en) 2001-09-24 2006-11-02 Rathjen Alicemarie G Method for preparing and using personal and genetic profiles
WO2003031591A2 (en) 2001-10-10 2003-04-17 Superarray Bioscience Corporation Detecting targets by unique identifier nucleotide tags
GB2382137A (en) 2001-11-20 2003-05-21 Mats Gullberg Nucleic acid enrichment
US20090246879A1 (en) 2002-12-20 2009-10-01 Callida Genomics Materials and Methods Relating to Nano-Tags and Nano-Brands
EP1590477B1 (en) 2003-01-29 2009-07-29 454 Corporation Methods of amplifying and sequencing nucleic acids
US8105771B2 (en) 2003-02-26 2012-01-31 Callida Genomics, Inc. Random array DNA analysis by hybridization
CN102135661B (zh) 2003-05-20 2014-06-04 卢西德有限公司 用于对患者身体所选位置进行成像的共焦显微镜
US7255994B2 (en) 2003-06-10 2007-08-14 Applera Corporation Ligation assay
US7193054B2 (en) 2003-08-26 2007-03-20 University Of Rochester Nanofabrication using actin filaments
WO2005049851A2 (en) 2003-11-14 2005-06-02 University Of Utah Research Foundation Methods, articles, and compositions for identifying oligonucleotides
US7381529B2 (en) 2003-12-31 2008-06-03 Intel Corporation Methods and compositions for detecting nucleic acids using scanning probe microscopy and nanocodes
JP2007526772A (ja) 2004-02-27 2007-09-20 プレジデント・アンド・フェロウズ・オブ・ハーバード・カレッジ インサイチュー配列決定用ポロニー蛍光ビーズ
US20050191687A1 (en) 2004-02-27 2005-09-01 Tianxin Wang Method for multiplexed analyte detection
WO2006076017A2 (en) 2004-04-30 2006-07-20 Applera Corporation Methods and kits for identifying target nucleotides in mixed populations
US20060024711A1 (en) 2004-07-02 2006-02-02 Helicos Biosciences Corporation Methods for nucleic acid amplification and sequence determination
US7253947B2 (en) 2004-10-07 2007-08-07 New York University Portable automated confocal microscope
KR101176245B1 (ko) * 2004-11-09 2012-08-22 엔존 파마슈티컬즈, 인코포레이티드 HIF-1a 발현의 억제를 위한 효능적 LNA 올리고뉴클레오티드
US7393665B2 (en) 2005-02-10 2008-07-01 Population Genetics Technologies Ltd Methods and compositions for tagging and identifying polynucleotides
ITRM20050068A1 (it) 2005-02-17 2006-08-18 Istituto Naz Per Le Malattie I Metodo per la rivelazione di acidi nucleici di agenti patogeni batterici o di parassiti nelle urine.
US7727721B2 (en) 2005-03-08 2010-06-01 California Institute Of Technology Hybridization chain reaction amplification for in situ imaging
US20060234261A1 (en) 2005-03-08 2006-10-19 Pierce Niles A Colorimetric readout of hybridization chain reaction
US20070020650A1 (en) 2005-04-01 2007-01-25 Avak Kahvejian Methods for detecting proteins
AU2006336403A1 (en) 2005-04-08 2007-08-02 Mycosol, Inc. Stilbazium research assays
EP1910537A1 (en) 2005-06-06 2008-04-16 454 Life Sciences Corporation Paired end sequencing
US7842793B2 (en) 2005-06-14 2010-11-30 The California Institute Of Technology Methods of making nucleic acid nanostructures
EP1907571B1 (en) 2005-06-15 2017-04-26 Complete Genomics Inc. Nucleic acid analysis by random mixtures of non-overlapping fragments
CN104673903B (zh) 2005-06-20 2018-11-13 领先细胞医疗诊断有限公司 检测单个细胞中的核酸和鉴定异质大细胞群中罕见细胞的方法
US8486621B2 (en) 2005-08-11 2013-07-16 Cornell Research Foundation, Inc. Nucleic acid-based matrixes
US20100015607A1 (en) 2005-12-23 2010-01-21 Nanostring Technologies, Inc. Nanoreporters and methods of manufacturing and use thereof
US7864996B2 (en) 2006-02-17 2011-01-04 Lucid, Inc. System for macroscopic and confocal imaging of tissue
US20090220968A1 (en) 2006-03-10 2009-09-03 President And Fellows Of Harvard College Methods and Apparatus for Near Field Irradiation
GB0605584D0 (en) 2006-03-20 2006-04-26 Olink Ab Method for analyte detection using proximity probes
US20070231823A1 (en) 2006-03-23 2007-10-04 Mckernan Kevin J Directed enrichment of genomic DNA for high-throughput sequencing
US8975216B2 (en) 2006-03-30 2015-03-10 Pacific Biosciences Of California Articles having localized molecules disposed thereon and methods of producing same
US8241573B2 (en) 2006-03-31 2012-08-14 Illumina, Inc. Systems and devices for sequence by synthesis analysis
CA2649725A1 (en) 2006-04-19 2007-10-25 Applera Corporation Reagents, methods, and libraries for gel-free bead-based sequencing
US7964347B2 (en) 2006-06-15 2011-06-21 Krassen Dimitrov Labels for electronic detection of individual molecules and methods for their detection
EP2057435A4 (en) 2006-06-23 2011-04-20 Life Technologies Corp SYSTEMS AND METHOD FOR COOLING IN DEVICES FOR BIOLOGICAL ANALYSIS
US7745129B1 (en) 2006-07-12 2010-06-29 Kenneth David Schatz Methods for sequencing of a necleic acid
US20100009868A1 (en) 2006-09-11 2010-01-14 The Arizona Board of Regents a body corporate acti ng for and behalf of Arizona State university Self-Assembled Combinatorial Encoding Nanoarrays for Multiplexed Biosensing
US20090208965A1 (en) 2006-10-25 2009-08-20 Ikonisys, Inc. Automated method for detecting cancers and high grade hyperplasias
US9201063B2 (en) 2006-11-16 2015-12-01 General Electric Company Sequential analysis of biological samples
GB2457402B (en) 2006-12-01 2011-10-19 Univ Columbia Four-color DNA sequencing by synthesis using cleavable fluorescent nucleotide reversible terminators
US20080269068A1 (en) 2007-02-06 2008-10-30 President And Fellows Of Harvard College Multiplex decoding of sequence tags in barcodes
DK2126130T3 (en) 2007-03-02 2015-06-29 Dupont Nutrition Biosci Aps CULTURES WITH IMPROVED phage resistance
US8145677B2 (en) 2007-03-27 2012-03-27 Faleh Jassem Al-Shameri Automated generation of metadata for mining image and text data
EP2155770B1 (en) 2007-05-16 2013-10-16 California Institute of Technology A versatile nucleic acid hairpin motif for programming biomolecular self-assembly pathways
ES2559313T3 (es) 2007-06-19 2016-02-11 Stratos Genomics Inc. Secuenciación de ácidos nucleicos de alto rendimiento por expansión
WO2009018576A1 (en) 2007-08-02 2009-02-05 Biodesic Compositions and methods for analyte detection and quantitation
JP2010539982A (ja) 2007-10-01 2010-12-24 アプライド バイオシステムズ, エルエルシー チェイスライゲーション配列決定法
CA2701726A1 (en) 2007-10-04 2009-04-09 Halcyon Molecular Sequencing nucleic acid polymers with electron microscopy
US20090139311A1 (en) 2007-10-05 2009-06-04 Applied Biosystems Inc. Biological Analysis Systems, Devices, and Methods
WO2009065093A2 (en) 2007-11-17 2009-05-22 University Of Medicine And Dentistry Of New Jersey Use of stem cells for wound healing
CN101586150B (zh) 2008-05-23 2016-09-28 陕西佰美基因股份有限公司 检测探针、通用寡核苷酸芯片及核酸检测方法及其用途
WO2010011961A2 (en) 2008-07-25 2010-01-28 University Of Georgia Research Foundation, Inc. Prokaryotic rnai-like system and methods of use
CN102171234A (zh) 2008-08-05 2011-08-31 康奈尔大学 光交联核酸水凝胶
CA2733609C (en) 2008-08-14 2018-03-06 Nanostring Technologies, Inc. Stable nanoreporters
US20100076057A1 (en) * 2008-09-23 2010-03-25 Northwestern University TARGET DNA INTERFERENCE WITH crRNA
US9156010B2 (en) 2008-09-23 2015-10-13 Bio-Rad Laboratories, Inc. Droplet-based assay system
US20100087325A1 (en) 2008-10-07 2010-04-08 Illumina, Inc. Biological sample temperature control system and method
WO2010054108A2 (en) 2008-11-06 2010-05-14 University Of Georgia Research Foundation, Inc. Cas6 polypeptides and methods of use
US8309306B2 (en) 2008-11-12 2012-11-13 Nodality, Inc. Detection composition
EP3587594B1 (en) 2008-12-19 2022-04-13 President and Fellows of Harvard College Particle-assisted nucleic acid sequencing
JP4528345B2 (ja) 2009-01-28 2010-08-18 シャープ株式会社 動画再生装置、動画再生方法、動画再生方法をコンピュータで実現するためのプログラム及びそのプログラムを記録した記録媒体
FR2948475A1 (fr) 2009-07-24 2011-01-28 Bionext Procede de caracterisation d'objets tridimensionnels
US8431151B2 (en) 2009-08-06 2013-04-30 Syracuse University Antimicrobial nanostructured hydrogel web containing silver
AU2010306862B2 (en) 2009-10-13 2015-08-27 Bruker Spatial Biology, Inc. Protein detection via nanoreporters
CA2778249C (en) 2009-11-03 2018-12-04 Htg Molecular Diagnostics, Inc. Quantitative nuclease protection sequencing (qnps)
US9089512B2 (en) 2009-12-18 2015-07-28 President And Fellows Of Harvard College Active scaffolds for on-demand drug and cell delivery
WO2011100617A2 (en) 2010-02-12 2011-08-18 Life Technologies Corporation Nucleic acid, biomolecule and polymer identifier codes
WO2011112634A2 (en) 2010-03-08 2011-09-15 California Institute Of Technology Molecular indicia of cellular constituents and resolving the same by super-resolution technologies in single cells
US10087431B2 (en) 2010-03-10 2018-10-02 The Regents Of The University Of California Methods of generating nucleic acid fragments
GB201004292D0 (en) 2010-03-15 2010-04-28 Olink Ab Assay for localised detection of analytes
PL2556171T3 (pl) 2010-04-05 2016-04-29 Prognosys Biosciences Inc Oznaczenia biologiczne kodowane przestrzennie
EP2569425B1 (en) 2010-05-10 2016-07-06 The Regents of The University of California Endoribonuclease compositions and methods of use thereof
WO2011143583A1 (en) 2010-05-13 2011-11-17 Illumina, Inc. Binding assays for markers
HUE037359T2 (hu) 2010-07-09 2018-08-28 Cergentis B V A fontos V3-D genom-régió szekvenálási stratégiái
WO2012056440A1 (en) 2010-10-28 2012-05-03 Nanodoc Ltd. COMPOSITIONS AND METHODS FOR ACTIVATING EXPRESSION BY A SPECIFIC ENDOGENOUS miRNA
WO2012058638A2 (en) 2010-10-29 2012-05-03 President And Fellows Of Harvard College Nucleic acid nanostructure barcode probes
US8859201B2 (en) 2010-11-16 2014-10-14 Nabsys, Inc. Methods for sequencing a biomolecule by detecting relative positions of hybridized probes
BR112013020773B1 (pt) 2011-02-15 2023-01-24 Leica Biosystems Newcastle Limited Método para a detecção localizada in situ de rna, método para a determinação da presença e da localização de uma sequência genética e método para a localização e/ou detecção in situ de um rna específico
JP5687514B2 (ja) 2011-02-17 2015-03-18 株式会社日立ハイテクノロジーズ 核酸配列解析装置
EP2500436B1 (en) 2011-03-17 2016-05-25 Institut Pasteur Method, probe and kit for DNA in situ hybridation and use thereof
US20150086981A1 (en) 2011-05-04 2015-03-26 Genovoxx Gmbh Nucleoside-triphosphate conjugate and methods for the use thereof
US9617598B2 (en) 2011-05-27 2017-04-11 President And Fellows Of Harvard College Methods of amplifying whole genome of a single cell
US20140113376A1 (en) 2011-06-01 2014-04-24 Rotem Sorek Compositions and methods for downregulating prokaryotic genes
PL222511B1 (pl) 2011-06-08 2016-08-31 Międzynarodowy Inst Biologii Molekularnej I Komórkowej W Warszawie Endorybonukleazy dsRNA
CA2850509C (en) 2011-10-14 2023-08-01 President And Fellows Of Harvard College Sequencing by structure assembly
GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
DK2836226T3 (en) 2012-02-24 2017-09-18 Hutchinson Fred Cancer Res COMPOSITIONS AND PROCEDURES FOR TREATING HEMOGLOBINOPATHY
GB2504240B (en) 2012-02-27 2015-05-27 Cellular Res Inc Compositions and kits for molecular counting of nucleic acids
AU2013225950B2 (en) 2012-02-29 2018-02-15 Sangamo Therapeutics, Inc. Methods and compositions for treating huntington's disease
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
WO2013141680A1 (en) 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX
DK3401400T3 (da) * 2012-05-25 2019-06-03 Univ California Fremgangsmåder og sammensætninger til rna-styret mål-dna-modifikation og til rna-styret transskriptionsmodulering
SG196730A1 (en) 2012-07-16 2014-02-13 Agency Science Tech & Res Methods for reading data from a storage medium using a reader and storage devices
US11225683B2 (en) 2012-07-20 2022-01-18 Lsi Medience Corporation Photocoupling method using probe containing photoresponsive nucleic acids
EP2880171B1 (en) 2012-08-03 2018-10-03 The Regents of The University of California Methods and compositions for controlling gene expression by rna processing
EP2885670B1 (en) 2012-08-15 2021-01-27 Lucid, Inc. Systems and methods for imaging tissue
CN102908119A (zh) 2012-09-26 2013-02-06 温州医学院眼视光研究院 一种共焦扫描成像系统及其像差控制方法
CN110643600A (zh) * 2012-10-23 2020-01-03 基因工具股份有限公司 用于切割靶dna的系统及其用途
JP6620018B2 (ja) 2012-12-06 2019-12-11 シグマ−アルドリッチ・カンパニー・リミテッド・ライアビリティ・カンパニーSigma−Aldrich Co., LLC Crisprに基づくゲノム修飾および制御
CN105658796B (zh) 2012-12-12 2021-10-26 布罗德研究所有限公司 用于序列操纵的crispr-cas组分系统、方法以及组合物
MX2015007550A (es) * 2012-12-12 2017-02-02 Broad Inst Inc Suministro, modificación y optimización de sistemas, métodos y composiciones para la manipulación de secuencias y aplicaciones terapéuticas.
US8993233B2 (en) 2012-12-12 2015-03-31 The Broad Institute Inc. Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains
PT2896697E (pt) 2012-12-12 2015-12-31 Massachusetts Inst Technology Engenharia de sistemas, métodos e composições guia otimizadas para a manipulação de sequências
WO2014093694A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Crispr-cas nickase systems, methods and compositions for sequence manipulation in eukaryotes
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
EP3553174A1 (en) 2012-12-17 2019-10-16 President and Fellows of Harvard College Rna-guided human genome engineering
CN113005148A (zh) 2013-01-16 2021-06-22 爱默蕾大学 Cas9-核酸复合物及其相关用途
US9411930B2 (en) 2013-02-01 2016-08-09 The Regents Of The University Of California Methods for genome assembly and haplotype phasing
US10138509B2 (en) 2013-03-12 2018-11-27 President And Fellows Of Harvard College Method for generating a three-dimensional nucleic acid containing matrix
EP2971167B1 (en) 2013-03-14 2019-07-31 Caribou Biosciences, Inc. Compositions and methods of nucleic acid-targeting nucleic acids
US9234213B2 (en) 2013-03-15 2016-01-12 System Biosciences, Llc Compositions and methods directed to CRISPR/Cas genomic engineering systems
US20140273230A1 (en) 2013-03-15 2014-09-18 Sigma-Aldrich Co., Llc Crispr-based genome modification and regulation
US9330295B2 (en) 2013-03-15 2016-05-03 Brown University Spatial sequencing/gene expression camera
CA2907198C (en) 2013-03-15 2019-12-10 The General Hospital Corporation Using rna-guided foki nucleases (rfns) to increase specificity for rna-guided genome editing
DK2992115T3 (da) 2013-04-30 2020-06-02 California Inst Of Techn Multipleksmærkning af molekyler ved stregkodning med sekventiel hybridisering
US10510435B2 (en) 2013-04-30 2019-12-17 California Institute Of Technology Error correction of multiplex imaging analysis by sequential hybridization
CA2913865C (en) * 2013-05-29 2022-07-19 Cellectis A method for producing precise dna cleavage using cas9 nickase activity
US20140356956A1 (en) 2013-06-04 2014-12-04 President And Fellows Of Harvard College RNA-Guided Transcriptional Regulation
KR102282990B1 (ko) 2013-06-04 2021-07-28 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 Rna-가이드된 전사 조절
EP4245853A3 (en) 2013-06-17 2023-10-18 The Broad Institute, Inc. Optimized crispr-cas double nickase systems, methods and compositions for sequence manipulation
EP3058091B1 (en) 2013-10-18 2020-03-25 The Broad Institute, Inc. Spatial and cellular mapping of biomolecules in situ by high-throughput sequencing
WO2015089473A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Engineering of systems, methods and optimized guide compositions with new architectures for sequence manipulation
GB201401885D0 (en) 2014-02-04 2014-03-19 Olink Ab Proximity assay with detection based on hybridisation chain reaction (HCR)
EP3108218A4 (en) 2014-02-21 2017-11-15 Massachusetts Institute Of Technology Expansion microscopy
KR102105236B1 (ko) 2014-11-21 2020-04-28 나노스트링 테크놀로지스, 인크. 무효소 및 무증폭 시퀀싱
EP3262192B1 (en) 2015-02-27 2020-09-16 Becton, Dickinson and Company Spatially addressable molecular barcoding
ES2934982T3 (es) 2015-03-30 2023-02-28 Becton Dickinson Co Métodos para la codificación con códigos de barras combinatorios
GB2559526B (en) 2015-11-03 2021-02-17 Harvard College Method and apparatus for volumetric imaging of a three-dimensional nucleic acid containing matrix
US10386300B2 (en) 2015-12-21 2019-08-20 Verily Life Sciences Llc Spectrally and spatially multiplexed fluorescent probes for in situ cell labeling
WO2017161251A1 (en) 2016-03-17 2017-09-21 President And Fellows Of Harvard College Methods for detecting and identifying genomic nucleic acids
CA3029625A1 (en) 2016-07-05 2018-01-11 California Institute Of Technology Fractional initiator hybridization chain reaction
CN117551741A (zh) 2017-03-31 2024-02-13 乌尔蒂维尤股份有限公司 Dna-抗原交换和扩增

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
EUNJI KIM等: "Pricision genome engineering with programmable DNA-nicking enzyme", GENOME RESEARCH, vol. 22, pages 1327 - 1333 *
MALI P.等: "RNA-guided Human Genome Engineering via Cas9", SCIENCE, vol. 339, pages 823 - 826, XP055469277, DOI: 10.1126/science.1232033 *
MALI, PRASHANT: "RNA-Guided human genome engineering via cas9", SCIENCE, vol. 339, no. 6121, pages 823 - 826 *
RAN, F.ANN: "Double nicking by RNA-Guided CRISPR Cas9 for enhanced genome editing specifictiy", CELL, vol. 154, no. 6, pages 1380 - 1389, XP055299681, DOI: 10.1016/j.cell.2013.08.021 *
TILEY L.S.等: "The VP16 transcription activation domain is functional when targeted to a promoter-proximal RNA sequence", GENES DEV., vol. 6, no. 11, pages 2077 - 2087, XP055299531, DOI: 10.1101/gad.6.11.2077 *

Also Published As

Publication number Publication date
JP2021045153A (ja) 2021-03-25
SG11201509962QA (en) 2016-01-28
RU2015156198A (ru) 2017-07-14
NZ715280A (en) 2021-06-25
CA2914638A1 (en) 2014-12-11
BR112015030491A8 (pt) 2022-07-26
MY177814A (en) 2020-09-23
MY197877A (en) 2023-07-22
AU2020203977A1 (en) 2020-07-02
EP3603679A1 (en) 2020-02-05
RU2690935C2 (ru) 2019-06-06
RU2019114706A3 (zh) 2020-09-25
BR112015030491A2 (pt) 2017-07-25
IL242959B (en) 2021-08-31
EP3003392A2 (en) 2016-04-13
KR102512979B1 (ko) 2023-03-22
JP2016521554A (ja) 2016-07-25
AU2014274939A1 (en) 2016-01-07
MX2021009672A (es) 2021-09-08
MX2015016798A (es) 2016-10-26
IL284773B1 (en) 2023-05-01
EP4159243A1 (en) 2023-04-05
IL284773B2 (en) 2023-09-01
KR20160014036A (ko) 2016-02-05
NZ753950A (en) 2021-09-24
US20230131972A1 (en) 2023-04-27
RU2015156198A3 (zh) 2018-05-08
JP2022166077A (ja) 2022-11-01
JP6621738B2 (ja) 2019-12-18
JP2019122384A (ja) 2019-07-25
US20240175057A1 (en) 2024-05-30
NZ753951A (en) 2021-09-24
EP3003392B1 (en) 2019-10-23
AU2021221488B2 (en) 2024-03-28
AU2020203977B2 (en) 2021-05-27
US11981917B2 (en) 2024-05-14
EP3003392A4 (en) 2017-05-03
WO2014197568A2 (en) 2014-12-11
SG10201710030QA (en) 2018-01-30
SG10201913068PA (en) 2020-02-27
JP2024012387A (ja) 2024-01-30
IL284773A (en) 2021-08-31
RU2756865C2 (ru) 2021-10-06
CN105451778B (zh) 2021-08-03
WO2014197568A3 (en) 2015-03-12
AU2021221488A1 (en) 2021-09-16
CA3176690A1 (en) 2014-12-11
CN105451778A (zh) 2016-03-30
ES2930537T3 (es) 2022-12-16
RU2019114706A (ru) 2019-10-11
KR20230042154A (ko) 2023-03-27
JP7119055B2 (ja) 2022-08-16
KR102282990B1 (ko) 2021-07-28
EP3603679B1 (en) 2022-08-10
JP7376650B2 (ja) 2023-11-08
AU2014274939B2 (en) 2020-03-19
KR20210095235A (ko) 2021-07-30
JP7036511B2 (ja) 2022-03-15
IL302205A (en) 2023-06-01

Similar Documents

Publication Publication Date Title
CN105451778B (zh) Rna-导向的转录调控
US10767194B2 (en) RNA-guided transcriptional regulation
AU2020200163B2 (en) Orthogonal Cas9 proteins for RNA-guided gene regulation and editing
NZ753951B2 (en) Rna-guided transcriptional regulation
NZ753950B2 (en) Rna-guided transcriptional regulation
NZ715280B2 (en) Rna-guided transcriptional regulation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination