CN116209674A - Krab融合阻遏物以及用于阻遏基因表达的方法和组合物 - Google Patents

Krab融合阻遏物以及用于阻遏基因表达的方法和组合物 Download PDF

Info

Publication number
CN116209674A
CN116209674A CN202180053675.0A CN202180053675A CN116209674A CN 116209674 A CN116209674 A CN 116209674A CN 202180053675 A CN202180053675 A CN 202180053675A CN 116209674 A CN116209674 A CN 116209674A
Authority
CN
China
Prior art keywords
leu
lys
glu
krab
asp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180053675.0A
Other languages
English (en)
Inventor
M·泰帕乐
N·阿莱拉苏尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Toronto
Original Assignee
University of Toronto
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Toronto filed Critical University of Toronto
Publication of CN116209674A publication Critical patent/CN116209674A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1051Gene trapping, e.g. exon-, intron-, IRES-, signal sequence-trap cloning, trap vectors
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • C07K14/4703Inhibitors; Suppressors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/635Externally inducible repressor mediated regulation of gene expression, e.g. tetR inducible by tetracyline
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/70Fusion polypeptide containing domain for protein-protein interaction
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • C07K2319/81Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor containing a Zn-finger domain for DNA binding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/14Type of nucleic acid interfering N.A.
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

一种异源转录阻遏物,其包含DNA靶向结构域,优选无催化活性的DNA靶向蛋白如CRISPR‑Cas蛋白;和选自由ZIM3‑KRAB、ZIM2‑KRAB、ZNF554‑KRAB、ZNF264‑KRAB、ZNF324‑KRAB、ZNF354A‑KRAB、ZFP82‑KRAB和ZNF669‑KRAB组成的组的KRAB结构域。本文还提供了编码或表达所述转录阻遏物的表达构建体、载体和细胞,以及用于靶基因的转录阻遏的系统和方法,以及用于制备和使用它们的组合物、试剂盒和试剂。

Description

KRAB融合阻遏物以及用于阻遏基因表达的方法和组合物
相关家族成员
本PCT申请要求2020年8月14日提交的美国专利申请序列号63/065,953的优先权权益,该美国专利申请通过引用并入本文。
序列表的并入
2021年8月13日创建的序列表“2223-P61944PC00_SequenceLi sting”(56320字节)的计算机可读形式通过引用并入本文中。
技术领域
本公开涉及用于转录阻遏的试剂和方法,特别是涉及异源KRAB结构域在转录阻遏物中用于靶向转录阻遏的用途。
引言
与Krüppel相关盒(KRAB)转录阻遏结构域融合的无催化活性的dCas9已被广泛用作称为CRISPRi的遗传筛选工具[1-4]。CRISPRi缺乏由DNA双链断裂形成引起的Cas9的非特异性细胞毒性,允许沉默非编码RNA,并使得能够发现远端调控区[1,5,6]。然而,在许多情况下,CRISPRi不能如基于活性Cas9的基因敲除筛选(CRISPR-KO)那么稳健地起作用。例如,CRISPRi比CRISPR-KO[7]对gRNA选择更敏感。此外,即使CRISPRi起作用,基因沉默常常也只是部分的,这限制了该方法的实用性[8]。通过在一方面设计更高效的gRNA文库[7,9]并且在另一方面尝试与dCas9融合的不同阻遏物构建体[9–11],已经部分地解决了这些挑战。所有这些方法都使用来自强效转录阻遏物KOX1(ZNF10)[10]的充分表征的KRAB结构域。最近,对更好的阻遏物的系统搜索产生了由融合到KOX1 KRAB结构域的甲基-CpG结合蛋白2(MeCP2)组成的二分阻遏物(bipartite repressor)。KRAB-MeCP2-dCas9阻遏物在多重测定中的表现优于KOX1 KRAB-dCas9[8]。
发明内容
细胞、组织和生物体中的基因表达的精确受控调控是组织工程改造、基于细胞的疗法和基因疗法中的主要挑战之一。细胞中的受控基因表达通过经由转染或病毒转导外源地引入cDNA,或通过引入序列特异性转录调控因子来实现。这些调控因子包括与转录阻遏结构域融合从而阻遏基因表达的锌指核酸酶、tet阻遏物及其变体、转录激活因子样效应物(TALE)或无酶活性的Cas9(dCas9)。内源基因座的调控是一个特别有吸引力的选项,因为它用较大cDNA避免了病毒滴度的急剧下降,并能够以组织特异性方式沉默基因表达。
目前,只有少数效应物结构域被用于转录阻遏。用于CRISPR抑制(CRISPRi)的最常用的结构域是ZNF10蛋白的Kruppel相关框(KRAB)结构域,但是最近一种将ZNF10 KRAB与甲基CpG结合蛋白2(MeCP2)一起使用的二分系统被证明在沉默多个基因方面更有效。尽管CRISPRi被广泛使用,但它有两个主要局限。首先,大多数gRNA不能高效地起作用,因此需要对多种gRNA进行广泛测试以鉴定功能性gRNA。这是例如全基因组CRISPRi筛选的主要局限。第二个问题是,即使在gRNA起作用时,转录阻遏的程度也可能不是最佳的。也就是说,KRAB融合仅部分地沉默基因表达。
发明人已经鉴定出这样的蛋白质结构域,该蛋白质结构域在与基因的启动子或3'UTR栓连时,导致比利用目前可用的系统时的基因表达阻遏更完全的基因表达阻遏。本发明人测试了57个不同的与无酶活性的dCas9融合的KRAB(Kruppel相关框)结构域,以获得它们沉默由SV40启动子驱动的EGFP报告基因的能力。这些KRAB结构域表现出从基本上没有阻遏到几乎完全阻遏的广泛范围的阻遏能力(图5)。值得注意的是,来自KOX1的KRAB结构域并没有非常稳健地阻遏报告基因。这很重要,因为KOX1 KRAB目前在所有基于CRISPRi的平台中都被用于调控人类细胞中的基因表达,而CRISPRi的广泛采用因它的不可预测的性质而受到阻碍。例如,许多用于CRISPRi的gRNA不起作用,而当它们起作用时,它们常常仅部分地阻遏转录。因此,许多实验室都在尝试开发更强效的平台。最近的一个平台,dCas9-KOX1KRAB-MeCP2[8]比KOX1 KRAB结构域更好地起作用,因为它使用串联的两个阻遏物结构域。然而,如本文所述,包括ZIM3KRAB结构域在内的其他KRAB结构域在多个不同基因座处的表现优于该平台(图6)。因此,与现有系统相比,本文所述的平台促进了对翻译的稳健阻遏。这种系统在数个应用中将非常有用,该应用包括但不限于:用于鉴定对基因表达重要的调控元件的CRISPRi筛选;非编码转录本的CRISPRi沉默;和用于同时阻遏多个基因的大染色体结构域的沉默。这将有利于沉默例如牵涉于人类疾病的微复制。此外,因为KRAB结构域只有ˉ200bp长,因此它与例如KRAB-MeCP2融合体相比,有助于更有效地包装例如腺病毒载体。
本文描述的这种系统不限于dCas9,而是可以与其他基因阻遏物靶向系统,如包含选定的ZnF DNA结合结构域的工程化锌指、tet阻遏物或TALE偶联。基于TALE-KRAB的转录阻遏物载体已被用于敲低多个基因靶标,如Zhang等人,2015[22]所述,并且已被用于真核启动子的四环素可逆沉默[23]。
因此,一个方面是异源转录阻遏物,其包含:
DNA靶向结构域,任选地为CRISPR-Cas蛋白,优选地为无酶活性的CRISPR-CAS 9蛋白、锌指结构域、tet-阻遏物或TALE;
和至少一个选自由ZIM3-KRAB、ZIM2-KRAB、ZNF554-KRAB、ZNF264-KRAB、ZNF324-KRAB、ZNF354A-KRAB、ZFP82-KRAB和ZNF669-KRAB组成的组的KRAB结构域。
另一个方面是编码转录阻遏物的分离的核酸,或包含所述核酸的表达构建体、载体或细胞。
一个方面包括表达构建体,其包含可操作地连接至一个或多个启动子和/或一个或多个转录终止位点的本文所述的核酸。
一个方面包括包含本文所述的核酸或表达构建体的载体,任选地其中该载体是腺病毒或慢病毒载体。
一个方面包括包含本文所述的转录阻遏物、核酸、表达构建体或载体的细胞。
进一步的方面包括转录阻遏系统,其包括:
本文所述的异源转录阻遏物、本文所述的核酸、本文所述的表达构建体、本文所述的载体或本文所述的细胞,其中所述DNA靶向结构域包含CRISPR-Cas蛋白,和
至少一种gRNA和/或诱导剂。
一个方面包括阻遏细胞中靶基因的转录的方法,该方法包括:a)将本文描述的转录阻遏物、核酸、表达构建体或载体引入到细胞中;以及b)在合适的条件下培养细胞,以使得至少一个KRAB结构域阻遏靶基因的转录。
一个方面包括筛选方法,该方法包括:a)将转录阻遏物、一种或多种核酸、一种或多种表达构建体或一种或多种本文所述的载体引入到多个细胞中,其中DNA靶向结构域包含CRISPR-Cas蛋白和多种gRNA;或者将多种gRNA引入到本文所述的细胞群中,其中DNA靶向结构域包含CRISPR-Cas蛋白;b)培养该多个细胞,以使得一种或多种gRNA与CRISPR-Cas蛋白缔合并将转录阻遏物引导至CRISPR靶位点,以使得至少一个KRAB结构域阻遏靶基因的转录;c)任选地用一定量的测试药物或毒素进行处理;d)任选地培养该多个细胞一段时间以允许gRNA丢失或富集;以及e)收集该多个细胞或其子集。
一个方面包括包含本文所述的转录阻遏物、核酸、表达构建体、载体或细胞的组合物。
一个方面包括试剂盒,其包括小瓶和本文所述的异源转录阻遏物、核酸、表达构建体、载体、细胞或组合物,以及任选的以下中的一者或多者:诱导剂、gRNA或gRNA表达构建体。
前面的章节仅作为实例提供,并不旨在限制本公开和所附权利要求书的范围。根据本发明的权利要求、描述和实施例,本领域普通技术人员将理解与本公开的组合物和方法相关的附加目的和优点。例如,本公开的各个方面和实施方案可以以多种组合使用,本说明书明确地考虑了所有这些组合。这些额外的优势、目的和实施方案明确地包括在本公开的范围内。本文中用于说明本公开背景的出版物和其他材料,以及在特定情况下用于提供与实践相关的附加细节的出版物和其它材料通过引用并入,并且为了方便起见,在所附的参考文献章节中列出。
附图说明
本公开的进一步目的、特征和优点从结合示出本公开的说明性实施方案的附图进行的以下详细描述中显而易见,在附图中:
图1a-h示出高度强效的KRAB结构域的鉴定。a,用于测定KRAB结构域活性的两个报告基因的示意图。文氏图指示出在HEK293T细胞、K562细胞或这两种细胞系内测定的KRAB结构域的数目。b,将稳定表达gRNA的HEK293T报告基因细胞系用KRAB-dCas9融合构建体感染,并且在21天后用流式细胞术分析EGFP表达。突出显示了用于当前的CRISPRi实施的KOX1KRAB–dCas9和KOX1 KRAB–MeCP2–dCas9。c,K562报告基因细胞的沉默结果。如b中那样执行测定,不同之处在于dCas9构建体还表达DsRed(KRAB–dCas9–P2A–DsRed)。在b和c中,EGFP荧光针对仅表达gRNA的报告基因细胞进行了归一化。d,KRAB结构域的阻遏活性与通过利用全长KRAB锌指蛋白的亲和纯化-质谱法回收的TRIM28肽数目之间的相关性(来自参考文献9的数据)。e,如在HEK293T细胞中通过LUMIER测定所测量的KRAB结构域的阻遏活性与它们与TRIM28的相互作用之间的相关性。相互作用强度被示出为超过阴性对照诱饵(EGFP)的倍数变化。示出的值是两个生物学重复的平均值。Spearman相关性是在没有对d和e进行多重假设校正的情况下根据log10转换数据计算的。f,ZIM3 KRAB和KOX1 KRAB通过基于ABA的二聚化系统被招募到SV40-EGFP报告基因。g,通过用100μM ABA处理细胞诱导EGFP沉默。9天后,将ABA洗掉或者再继续该处理11天。通过流式细胞术测量EGFP表达,并且将其针对表达Nanoluc–PYL1的报告基因细胞作归一化。示出的值是两个生物学重复的平均值。误差条表示标准偏差。h,通过用100μM ABA处理表达SV40-EGFP报告基因细胞的KRAB-PYL1和ABI1-dCas9来诱导EGFP沉默。ABA处理40天后,将ABA洗掉,并且再用流式细胞术跟踪EGFP 48天。将EGFP荧光针对类似地被招募到报告基因的萤火虫荧光素酶-dCas9融合体的荧光作归一化。示出的值来自单个生物重复。
图2a-e示出了在CRISPRi应用中对ZIM3 KRAB-dCas9融合体进行的基准测试。a,持续7天用单种gRNA将dCas9融合体招募到ERK1和SEL1L启动子,并且使用RT-qPCR量化信使RNA表达。将表达水平针对不表达gRNA的HEK293T细胞的表达水平作归一化。使用对多个假设进行Bonferroni校正的双尾学生t检验来评估统计显著性。n,三个独立的慢病毒感染。b,指示的dCas9融合体被招募到CD81启动子并且在感染后7天通过流式细胞术测量CD81表面表达。c,dCas9融合体与五个不同的gRNA一起或作为一个池被招募到HBEGF。7天后,通过连续稀释测量细胞系对DTA的敏感性。虚线指示HBEGF敲除细胞(顶部)或不含gRNA的细胞的敏感性。右图,计算了gRNA2的半数最大生长抑制(GI50)曲线。数据以平均值±sd(n,每个浓度的三个经处理孔)表示。GI50值是使用GraphPad Prism使用“log(抑制剂)与响应(三个参数)”非线性拟合计算的。d,将稳定表达dCas9融合体的HEK293T细胞用全基因组Dolcetto A组gRNA文库感染,并在培养21天后测量gRNA表现(representation)。ROC曲线是基于靶向金标准必需基因和非必需基因的gRNA的耗尽计算的。平均gRNA耗尽被用于基因水平指标。e,在引导物或基因水平上为每个筛选计算AUROC。为了直接将我们的结果与之前在HEK293T细胞中进行的筛选进行比较,仅分析了这两个筛选所针对的基因的子集。
图3示出A)KRAB-dCas9融合体的表达和阻遏活性。通过蛋白质印迹测量表达;B)KRAB沉默活性与通过亲和纯化全长KRAB结构域蛋白回收的TRIM28肽之间的相关性(数据来自BioPlex/Huttlin等人,2018和Imbeault等人,2019);和C)将指示的dCas9融合体招募到两个内源性启动子并且通过qRT-PCR测量基因表达。D)TRIM28在HEK293T、K562和A375细胞中的表达水平。
图4A-C显示了将KRAB结构域栓连到基因组基因座以阻遏转录。dCas9-KRAB融合体可以被栓连到启动子(A)、远端调控位点(B)或潜在的远端非调控位点(C)以阻遏转录。在远端非调控性位点的情况下,KRAB结构域可以诱导扩散到侧翼区的异染色质的形成。
图5显示KRAB表现出一系列转录阻遏活性。dCas9-KRAB融合体被招募到驱动EGFP表达的SV40启动子。在用dCas9-KRAB融合体感染后21天测量荧光。虚线示出由与海肾荧光素酶(RLuc)融合的dCas9诱导的阻遏。
图6显示与ZIM3的KRAB结构域融合的dCas9在沉默基因表达方面比与单独KOX1的KRAB结构域融合或者与KOX1 KRAB和MeCP2融合的dCas9更有效。HEK293T细胞被靶向ERK1、SEL1L、BLM和MET启动子的gRNA以及被dCas9融合体感染。
图7A-C显示ZIM3 KRAB结构域比KOX1 KRAB更高效地阻遏来自EGFP报告基因的3'UTR的转录。A)KRAB结构域通过基于脱落酸的邻近诱导系统被招募到dCas9。B)K562细胞中AAVS1基因座中的报告基因。C)细胞在用100μM脱落酸处理5天或14天后(或在未经处理时)的EGFP荧光。
图8示出了表达靶向SV40启动子的指示的dCas9融合体的HEK293T SV40-EGFP报告基因细胞系的RNA-seq分析。差异表达的转录本(绝对log2倍数变化>0.5和FDR<0.05)以实心圆示出。
图9A-C是一系列图表和免疫印迹。A,KRAB-dCas9融合体在HEK293T报告基因细胞系和K562报告基因细胞系中的功效之间的相关性。使用log10转换值计算相关性。B,不同KOX1 KRAB和ZIM3 KRAB结构域构建体的比较。将指示的KRAB-dCas9融合体招募到A375和HEK293T细胞中的CD81启动子(左)或HEK293T细胞中的SV40-EGFP报告基因(右),并且通过流式细胞术测量EGFP荧光。KOX1(1-75)pLX311是一种用于先前CRISPRi研究中的慢病毒构建体。构建体标签中的数字是指融合体中包含的KOX1(Uniprot P21506-1)和ZIM3(Q96PE6-1)的氨基酸。C,dCas9融合蛋白的表达水平通过使用Cas9特异性抗体的蛋白质印迹法进行测定。
具体实施方式
以下是为帮助本领域技术人员实施本公开而提供的详细描述。除非另外定义,否则本文使用的所有技术术语和科学术语具有与本公开所属领域的普通技术人员通常所理解的相同的含义。本文中所使用的术语仅仅是为了描述具体实施方案,并且并不意图限制本公开。本文中提及的所有出版物、专利申请、专利、附图和其他参考文献的全文均以引用的方式明确地并入本文。
I.定义
如本文所用,除非另外指明,否则以下术语可具有下面赋予它们的含义。然而,应当理解,本领域普通技术人员已知或理解的其他含义也是可能的,并且在本公开的范围内。本文中提及的所有出版物、专利申请、专利和其他参考文献的全文均以引用的方式并入本文。在冲突的情况下,以本说明书(包括定义)为准。另外,所述材料、方法和实例仅是说明性的而不是旨在限制。
如本文所用的术语“核酸”、“寡核苷酸”、“引物”意指两个或更多个共价连接的核苷酸。除非上下文另有明确指示,否则该术语一般包括但不限于脱氧核糖核酸(DNA)和核糖核酸(RNA),它们可以是单链的(ss)或双链的(ds)。例如,本公开的核酸分子或多核苷酸可由单链和双链DNA、作为单链区和双链区的混合物的DNA、单链和双链RNA,以及作为单链区和双链区的混合物的RNA、包含DNA和RNA(其可以是单链的或更典型地是双链的,或单链区和双链区的混合物)的杂合分子组成。此外,核酸分子可由包含RNA或DNA或RNA和DNA两者的三链区组成。如本文所用的术语“寡核苷酸”一般是指长度为至多200个碱基对的核酸,并且可以是单链或双链的。本文提供的序列可以是DNA序列或RNA序列,但应理解,所提供的序列涵盖DNA和RNA,以及互补的RNA和DNA序列,除非上下文另有明确指示。例如,序列5'-GAATCC-3'被理解为包括5'-GAAUCC-3'、5'-GGATTC-3'和5'GGAUUC-3'。
如本文所用的术语“功能变体”包括本文公开的多肽序列的修饰形式(modification),该修饰形式以基本相同的方式执行与本文公开的多肽分子基本相同的功能。例如,功能变体可以包括本文描述的多肽的活性片段,例如保留转录阻遏活性和/或共阻遏物(例如TRIM28)相互作用的N-和/或C-端截短体。功能变体可包括具有一个或多个经取代的氨基酸并且/或者至少保留与未修饰序列的最小序列同一性的变体。例如,功能变体可以包含每十个氨基酸至多1个、2个、3个或更多个氨基酸的取代。例如,功能变体可包含与本文公开的序列具有至少80%,或至少90%,或至少95%序列同一性的序列。功能变体还可以包含本文公开的序列的经保守取代的氨基酸序列。取代性氨基酸变体是其中序列中的至少一个残基已被移除并在其位置插入了不同残基的变体。取代性氨基酸变体的一个实例是保守氨基酸取代。可以例如使用本文描述的方法鉴定保留转录阻遏活性和/或共阻遏物相互作用的功能变体,诸如活性片段。
如本文所用的“保守氨基酸取代”是其中一个氨基酸残基被另一个氨基酸残基替代而不消除蛋白质的所需特性的取代。合适的保守氨基酸取代可以通过将具有相似疏水性、极性和R-链长度的氨基酸彼此取代来进行。保守取代的实例包括以一种非极性(疏水)残基如丙氨酸、异亮氨酸、缬氨酸、亮氨酸或甲硫氨酸取代另一种,以一种极性(亲水)残基取代另一种(诸如在精氨酸和赖氨酸之间的取代、在谷氨酰胺和天冬酰胺之间的取代、在甘氨酸和丝氨酸之间的取代),以一种碱性残基如赖氨酸、精氨酸或组氨酸取代另一种,或以一种酸性残基如天冬氨酸或谷氨酸取代另一种。短语“保守取代”还包括使用化学衍生的残基或非天然氨基酸代替非衍生的残基,条件是这样的多肽展现出必需的活性。
如本文所用的术语“异源转录阻遏物”或“本文描述的转录阻遏物”意指工程化的融合蛋白或工程化的多聚体,诸如包含选自ZIM3-KRAB、ZIM2-KRAB、ZNF554-KRAB、ZNF264-KRAB、ZNF324-KRAB、ZNF354A-KRAB、ZFP82-KRAB和ZNF669-KRAB以及它们的功能变体的KRAB结构域,以及DNA靶向结构域的二聚体。
转录阻遏物可进一步包含提供KRAB结构域和/或DNA靶向结构域和/或靶DNA之间的功能性相互作用的相互作用系统的一种或多种相互作用组分。术语“相互作用组分”在本文中用于涵盖相互作用系统的一个或多个组分,该组分一起提供所述功能相互作用。如本文所用的术语“相互作用系统”旨在涵盖允许共价或非共价相互作用和/或组成型或诱导型相互作用的相互作用组分。此类相互作用系统可以包括例如肽接头,任选地为蛋白酶敏感肽接头;一种或多种二聚体、三聚体或更高阶多聚化组分,诸如相互作用结构域,任选地为诱导型二聚体、三聚体或多聚化组分,任选地为诱导型相互作用结构域;和/或一种或多种可以调节转录阻遏物亚细胞定位的组分。该相互作用系统可以包括两种或更多种组分。
DNA靶向结构域和KRAB结构域可以例如共价连接为单个多肽(例如融合蛋白)的结构域,或者可以通过相互作用组分,诸如例如在某些条件下相互作用的相互作用结构域连接(例如连接为二聚体)。因此,异源转录阻遏物可包含单一多肽,或可包含含有DNA靶向结构域和第一相互作用组分(诸如二聚体相互作用结构域)的第一多肽,和含有KRAB结构域和第二相互作用组分(诸如二聚体相互作用结构域)的第二多肽,其中第一和第二二聚体相互作用结构域可以例如在某些条件下相互作用。更高阶多聚化系统,诸如SunTag系统(Tenenbaum等人,2014),也在本文中考虑范围之内。
KRAB结构域和/或DNA靶向结构域和/或靶DNA之间的相互作用可以使用多种诱导型相互作用系统来控制。例如,KRAB结构域和DNA靶向结构域可以通过蛋白酶敏感接头,诸如在存在NS3抑制剂(例如格拉瑞韦)时稳定的自切割NS3蛋白酶结构域连接。在另一个实例中,DNA靶向结构域和/或KRAB结构域向细胞核的定位可以由相互作用组分,诸如定位结构域,例如使用雌激素受体配体结合结构域变体的经他莫昔芬调控的细胞核定位来控制。在进一步的实例中,DNA靶向结构域可以连接至第一相互作用组分(诸如第一相互作用结构域)并且KRAB结构域可以连接至第二相互作用组分(诸如第二相互作用结构域),以使得第一和第二相互作用结构域相互作用。
如本文所用,术语“相互作用结构域”意指第一多肽(例如第一二聚体相互作用结构域)中的序列基序,该序列基序能够与包含第二多肽(例如第二二聚体相互作用结构域)中的序列基序的结合配偶体相互作用。特别地,该术语旨在涵盖第一或第二相互作用二聚体结构域,它们一起形成例如在合适的诱导条件下二聚化的异源二聚体对。其他相互作用结构域也被具体考虑并且可以由技术人员根据期望的特征来鉴定。合适的诱导型相互作用结构域对包括但不限于:可以用例如雷帕霉素或AP21967诱导的FKBP/FRB(FK506结合蛋白/FKBP雷帕霉素结合)、可以用例如脱落酸诱导的PYL/ABI、可以用例如赤霉素或赤霉酸诱导的GID1/GAI,和可由例如蓝光和/或温度诱导的pMag/nMag。
DNA靶向结构域可以是任何合适的DNA靶向结构域。优选地,DNA靶向结构域是无酶活性的序列特异性DNA靶向蛋白,诸如CRISPR-Cas蛋白,任选地为dCas9;具有定制DNA结合特异性的锌指DNA结合结构域;tet-阻遏物及其变体;或转录激活因子样效应物(TALE)蛋白。有酶活性的Cas9在它将会导致阻遏时,例如在引导物是截短的引导物时(参见例如[24])也可以被使用。
如本文所用的术语“KRAB结构域”或Krüppel相关框(KRAB)结构域是指约75个氨基酸的多肽结构域及其变体,诸如其活性片段或者根据上下文,在许多Krueppel型C2H2锌指蛋白(ZFP)中发现的编码所述结构域的核酸。在本文所述的阻遏物中,活性片段可为约60个氨基酸。例如,对于ZIM3,它可以是VTFEDVTVNFTQGEWQRLNPEQRN LYRDVMLENYSNLVSVGQGETTKPDVILRLEQGKEPWL(SEQ ID NO:2),其对应于ZIM3的氨基酸8至69(SEQ ID NO:3)。例如,活性片段可以是氨基酸4-76。活性片段的实例公开在本文中,例如公开在图9中。其他KRAB结构域的活性片段可以通过任何合适的比对方法,例如SM ART一致比对鉴定。
异源转录阻遏物可以是KRAB N端或C端融合体,例如该融合体的顺序可以是KRAB结构域-DNA靶向结构域或DNA靶向结构域-KRAB结构域(参见例如[25]、[26],[27]和[28])。KRAB结构域可以通过接头融合至DNA靶向结构域。例如,可以使用甘氨酸和甘氨酸丝氨酸接头。实施例中描述的转录阻遏物在KRAB结构域融合至dCas9的C端时使用Gly4接头,并且在KRAB结构域融合至dCas9的N端时使用Gly3SerGly3Ser。也可以使用其他接头。
如本文所用的术语“CRISPR-Cas”或“Cas”是指CRISPR成簇的规律间隔的短回文重复序列-CRISPR相关(CRISPR-Cas)蛋白,该蛋白结合RNA并且通过其所结合至的RNA靶向于特定DNA序列。CRISPR-Cas是II类单体Cas蛋白,例如II型Cas,诸如Cas9。Cas9蛋白可以是来自化脓性链球菌(Streptococcus pyogene)、新弗朗西斯菌(Francisella novicida)、耐苏氏放线菌(A.Naesulndii)、金黄色葡萄球菌(Staphylococcus aureus)或脑膜炎奈瑟菌(Neisseria menin gitidis)的Cas9。任选地,Cas9来自化脓性链球菌。Cas蛋白也可以是例如来自氨基酸球菌属种(Acidaminococcus sp.)、毛螺菌科细菌(Lachnospiraceaebacterium)或土拉弗朗西斯菌(Francisella tularensis)(这些已被证明可以充当dCas变体)的Cas12a(例如dCas12a),也可以使用CasΦ(Cas12j)和CasX(Cas12e)。
如本文所用,术语“dCas9”是指无酶活性(或死的)Cas9,该Cas9缺乏DNA核酸内切酶活性但保留了靶DNA结合活性。例如,dCAS9包含RuvC1和HNH核酸酶结构域中的CAS9和D10A/H840A突变的序列。任选地,dCas9是这样的蛋白质,该蛋白质包含与由SEQ ID NO:1编码的蛋白质具有至少80%、至少90%、至少95%、至少99%或100%序列同一性的氨基酸序列并且包含D10A/H840A突变并且保留了Cas9靶DNA结合活性(例如结合gRNA和靶位点)。类似地,dCas12a指的是无酶活性的Cas12a。
如本文所用的术语“引导RNA”、“引导物(guide)”或“gRNA”是指与特定DNA序列杂交并且最少包含间隔区序列的工程化RNA分子。引导RNA可以进一步包含结合CRISPR-Cas蛋白的蛋白结合区段。引导RNA的与特定DNA序列杂交的部分在本文中称为核酸靶向序列或间隔区序列。引导物的蛋白结合区段可包含例如tracrRNA和/或直接重复序列(directrepeat)。根据上下文,术语“引导物”或“引导RNA”可以指单独的间隔区序列,或包含间隔区序列和蛋白结合区段的RNA分子。引导RNA可以由相应的DNA序列表示。当酶是Cas9时,引导物可以是例如如[24]中描述的包含15个或更少的与靶位点互补的核苷酸的截短的引导物。例如,当Cas9与截短的引导物相互作用时,Cas9的DNA结合能力保持不变,同时其核酸分解活性被消除。可以使用保持Cas结合能力的任何长度的引导物。
如本文所用的术语“间隔区”或“间隔区序列”是指引导物的与靶序列或靶序列的一部分形成或能够形成RNA-DNA双链体的部分。间隔区序列可以与特定的CRISPR靶序列互补或对应。间隔区序列的核苷酸序列可以决定CRISPR靶序列并且可以被设计或构造成靶向期望的CRISPR靶位点。
如本文所用的术语“tracrRNA”是指“反式编码的crRNA”,该反式编码的crRNA可以例如与CRISPR-Cas蛋白(诸如Cas9)相互作用并且可以连接至引导RNA或者形成引导RNA的一部分。tracrRNA可以是来自例如化脓性链球菌的tracrRNA。tracrRNA可以具有例如5'-gtttcagagctatgctggaaacagcatagcaagttgaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc-3'(SEQ ID NO:11)的序列。也可以使用其他tracrRNA。合适的tracrRNA可由本领域技术人员鉴定,包括例如5'-GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGC-3'(SEQ ID NO:12)或5'-GTTTCAGAGCTACAGCAGAAATGCTGTAGCAAGTTGAAAT-3'(SEQ ID NO:13)。
如本文所用的术语“CRISPR靶位点”或“CRISPR-Cas靶位点”意指活化的CRISPR-Cas蛋白(例如CRISPR-Cas蛋白,诸如与引导RNA结合的dCas9)将在合适的条件下结合至的核酸。CRISPR靶位点包含原型间隔区相邻基序(protospacer-adjacent motif,PAM)和CRISPR靶序列(即与活化的CRISPR-Cas蛋白所结合至的引导物的间隔区序列对应)。PAM的序列和相对于CRISPR靶序列的相对位置将取决于CRISPR-Cas蛋白的类型。例如,Cas9或dCas9的CRISPR靶位点可以包含,从5'到3',15到25、16到24、17到23、18到22或19到21个核苷酸,任选地20个核苷酸的靶序列,该靶序列的后面是具有序列NGG的3个核苷酸的PAM。因此,Cas9靶位点可具有序列5'-N1NGG-3',其中N1的长度为15至25、16至24、17至23、18至22或19至21个核苷酸,任选地长度为20个核苷酸或介于15和25之间并包括在内的任何整数。
CRISPR靶位点可以位于任何合适的基因组基因座中。例如,CRISPR靶位点可以位于启动子、增强子、3'UTR或其他调控元件中,位于基因中,任选地内含子或外显子中,位于与非编码RNA对应的基因座中,或者位于基因间区中。
位于细胞核中的靶DNA需要可以进入细胞核的转录阻遏物。因此,转录阻遏物可以定位于细胞核并且/或者可以包含例如一种或多种细胞核定位信号(NLS),任选一种或多种SV40 NLS。任选地,转录阻遏物包含两种或更多种NLS。任选地,转录阻遏物可包含一种或多种N-端NLS、一种或多种C-端NLS,或一种或多种N-端和一种或多种C-端NLS。特别考虑了其他构造。
也可以用标签标记转录阻遏物。例如,合适的标签包括但不限于Myc、FLAG、HA、V5、ALFA、T7、6xHis、VSV-G、S-tag、AviTag、StrepTag II、CBP、GFP、mCherry。例如,如实施例中所述并且如SEQ ID NO:17所示,异源转录阻遏物可包含标记如mCherry。该标记可以在N端、C端或异源转录阻遏物的两个组分之间,诸如DNA靶向结构域和KRAB结构域之间融合。
在提供数值范围的情况下,应该理解在该范围的上下限值之间的每个中间值(除非上下文另外清楚地指出,否则该中间值达到下限值单位的十分之一)和在所陈述范围中的任何其它陈述的值或中间值涵盖在说明书内。涵盖从任何下限值到任何上限值的范围。这些较小范围的可独立地包括于该较小范围中的上限值和下限值也涵盖在说明书内,受制于所陈述范围内任何特别排除的限值。在所陈述范围包括限值中的一个限值或两个限值的情况下,不包括那些所包括的限值中的任一个限值或两个限值的范围也包括在说明书中。
必须指出,如本文和在所附权利要求书中所使用,单数形式“一个(a)/一种(an)”和“该/所述(the)”包括复数个指示物,除非上下文另外清楚地指出。
本文的详细描述和权利要求书内的所有数值都通过“约”或“大约”指示值修改,并且考虑了本领域普通技术人员将预期的实验误差和变化。
如本文在专利说明书和权利要求书中所用的短语“和/或(以及/或者,并且/或者)”应理解为意指如此结合的要素,即,在一些情况下结合存在并且在另一些情况下分离地存在的要素中的“任一个要素或两个要素”。用“和/或(以及/或者,并且/或者)”列出的多个要素应以相同方式解读,即,如此结合的要素中的“一个要素或多个要素”。除了通过“和/或(以及/或者,并且/或者)”句子具体标识的要素之外,其它要素也可以任选地存在,无论与具体标识的那些要素相关或无关。
如本文在专利说明书和权利要求书中所使用,“或(或者)”应理解为具有与如上文所定义的“和/或(以及/或者,并且/或者)”相同的含义。例如,当将清单中的项分列时,“或(或者)”或“和/或(以及/或者,并且/或者)”应解释为包含性的,即,不仅包括许多要素或要素清单中的至少一个要素,而且包括许多要素或要素清单中的超过一个要素,以及任选的另外未列出的项。仅当术语有明确相反的指示(诸如“......中的仅一个”或“......中的刚好一个”),或者当在权利要求书中使用时,“由......组成”将指包括许多要素或要素清单中的刚好一个要素。一般来说,如本文中所用的术语“或(或者)”在后面存在排他性术语(诸如“......中的任一个”、“......中的一个”、“......中的仅一个”或“......中的刚好一个”)时,仅应解释为指示排他性替代物(即,“一个或另一个,而非两个”)。
在权利要求书以及以上专利说明书中,所有过渡性短语,诸如“包含”、“包括”、“携有”、“具有”、“含有”、“涉及”、“容纳”、“由......组成”等都应理解为开放式的(open-ended),即,意指包括(但不限于)。仅过渡性短语“由......组成”和“基本上由......组成”分别应是封闭或半封闭的过渡性短语。
如本文在专利说明书和权利要求书中所使用,短语“......中的至少一个”在提及一个或多个要素的清单时,应理解为意指选自要素清单中的任一个或多个要素的至少一个要素,但不一定包括要素清单内具体列举的每一和每个要素中的至少一者,并且不排除要素清单中的要素的任何组合。这个定义还允许可以任选地存在短语“至少一个”所指的要素清单内具体标识的要素以外的要素,不论是否与那些具体标识的要素相关。
如本文所用的术语“约”意指加或减所提及数字的10%-15%、5-10%,或任选地约5%。
还应当理解,在本文描述的包括多于一个步骤或动作的某些方法中,该方法的步骤或动作的顺序不一定限于该方法的步骤或动作被叙述的顺序,除非上下文另有指示。
虽然还可在本公开的实践或测试中使用类似于或等同于本文所述的材料和方法的任何材料和方法,但现在描述以下材料和方法。
II.材料和方法
本文描述了异源转录阻遏物和用于使用DNA靶向结构域(诸如无酶活性的CRISPR-Cas蛋白和KRAB结构域)进行转录阻遏的系统。如实施例中证实的,与现有的基于KOX1KRAB-dCas9的转录阻遏物相比,包含dCas9或dCas12a和至少一个选自由ZIM3、ZNF554、ZNF264、ZNF324、ZNF354A、ZFP82和ZNF669以及它们的变体组成的组的KRAB结构域的融合蛋白在转录阻遏方面具有更大的效力,与TRIM28更强地相互作用,对gRNA选择的敏感性较低,以及/或者对靶位置的敏感性较低。如实施例中进一步证实的,这些融合蛋白可被用于高通量筛选,例如以对必需基因进行细胞活力筛选。在实施例中还证实,包含dCas9-ABI1融合蛋白和ZIM3 KRAB-PYL1融合蛋白的诱导型转录阻遏物可在脱落酸存在下诱导转录阻遏。
dCas序列可以是基于序列f
因此,本公开的一个方面包括异源转录阻遏物,其包含DNA靶向结构域,优选无酶活性的序列特异性DNA结合蛋白(诸如CRISPR-Cas蛋白),和至少一个选自由表现出比KOX1KRAB或KOX1 KRAB MeCP2更强的KRAB/TRIM28相互作用的KRAB蛋白(任选地为ZIM3-KRAB、ZIM2-KRAB、ZNF554-KRAB、ZNF264-KRAB、ZNF324-KRAB、ZNF354A-KRAB、ZFP82-KRAB和ZNF669-KRAB)组成的组的KRAB结构域。
DNA靶向结构域和KRAB结构域可以共价连接为例如单个多肽的结构域,或者可以是通过一种或多种相互作用组分(诸如相互作用结构域)连接和/或在某些条件下相互作用的单独的多肽。因此,在一个实施方案中,转录阻遏物是单一多肽。在另一个实施方案中,转录阻遏物进一步包含一对(即第一和第二)相互作用结构域,任选二聚体相互作用结构域,任选一对在合适条件下二聚化的诱导型二聚体相互作用结构域。例如,转录阻遏物可包含含有DNA靶向结构域和第一二聚体相互作用结构域(任选地为诱导型二聚化结构域)的第一多肽,以及含有KRAB结构域和第二二聚体相互作用结构域(任选地为诱导型二聚化结构域)的第二多肽,任选地,第一诱导型二聚化结构域和第二诱导型二聚化结构域在一种或多种诱导剂存在下相互作用。
如实施例中所示,包含ABI1和PYL1的异源转录阻遏物的二聚化可以通过添加脱落酸来诱导。因此,在一个实施方案中,转录阻遏物包含第一和第二诱导型二聚化结构域,该第一和第二诱导型二聚化结构域在存在诱导剂的情况下提供可诱导的转录阻遏。技术人员可以容易地鉴定和选择可以一起使用的合适的诱导型二聚化结构域。可以使用任何合适的诱导型二聚化结构域,例如可以通过添加脱落酸来诱导ABI1和PYL1的二聚化。其他诱导型系统包括那些基于利用雷帕霉素、赤霉酸/赤霉素的诱导的系统和基于分裂dCas9的系统。例如GID1和GAI的二聚化可由赤霉素诱导,并且FKBP和FRB的二聚化可用雷帕霉素或其类似物(例如雷帕霉素类似物(rapalog))诱导。本文还考虑了更高阶多聚化系统,诸如SunTag系统(Tenenbaum等人,2014)。
也可以使用其他诱导型系统控制DNA靶向结构域和KRAB结构域之间的相互作用。其他系统(其不依赖于二聚化)包括格拉瑞韦诱导的稳定性(Tague等人,2018年)或他莫昔芬调控的使用雌激素受体配体结合结构域变体的细胞核定位。在格拉瑞韦诱导的稳定性的情况下,DNA靶向结构域和KRAB结构域将通过自切割NS3蛋白酶结构域连接。只有在存在格拉瑞韦(其抑制NS3活性)的情况下,DNA靶向结构域和KRAB结构域才会保持在一起并且调控基因表达。
在一个实施方案中,所述至少一个KRAB结构域包含两个或更多个KRAB结构域,任选地两个或更多个串联KRAB结构域,任选地两个或更多个相同的或两个或更多个不同的KRAB结构域。KRAB结构域可以例如是如例如图1b和/或图1c所示在HEK293和/或K562细胞中展现出更大阻遏物数据的KRAB结构域。合适的KRAB结构域包括SEQ ID NO:2-10和18中所示的KRAB结构域或其功能变体。在一个实施方案中,所述至少一个KRAB结构域包含这样的氨基酸,该氨基酸具有与SEQ ID NO:2-10和18中的KRAB结构域中的任一者,例如与登录号Q96PE6-1(UniProt)相关的KRAB结构域具有至少80%、至少90%、至少95%或至少99%序列同一性的序列,并且保留了与例如所述KRAB结构域(例如SEQ ID NO:2-10或18或例如与登录号Q96PE6-1相关的KRAB结构域)或例如KOX1 KRAB MeCP2相同的转录阻遏活性和/或与TRIM28的相互作用(例如在转录阻遏活性和/或与TRIM28的相互作用方面与例如所述KRAB结构域(例如SEQ ID NO:2-10或18或例如与登录号Q96PE6-1相关的KRAB结构域)或例如KOX1 KRAB MeCP2一样有效)。在一个实施方案中,所述至少一个KRAB结构域是ZIM3 KRAB结构域,该结构域任选地具有与登录号Q96PE6-1(UniProt)或SEQ ID NO:2(或SEQ ID NO:3的KRAB结构域)具有至少80%、至少90%、至少95%或至少99%序列同一性的序列的氨基酸,并且在转录阻遏活性和/或与TRIM28的相互作用方面与例如所述KRAB结构域(例如ZIM3KRAB结构域)或例如KOX1 KRAB MeCP2一样有效(例如,保留了与例如所述KRAB结构域(例如ZIM3 KRAB结构域)或例如KOX1 KRAB MeCP2相同的转录阻遏活性和/或与TRIM28的相互作用)。
如本文所用的与......一样有效意指与野生型KRAB结构域(即非变体KRAB)相比,保留了至少80%、至少85%、至少90%、至少95%或至少99%的转录阻遏活性和/或共阻遏物相互作用。变体(诸如截短体)的转录阻遏物活性和/或共阻遏物相互作用可以例如使用本文描述的方法来确定。例如,可以使用实施例中描述的一个或多个EGFP报告基因系统来确定转录阻遏物活性。可以在控制每个DNA结合部分(例如dCas9)的表达水平的同时将变体拴连至相同的报告基因或内源环境(context)。在报告基因或靶基因的所诱导表达中检测到的与亲本KRAB相比的任何差异都可能促成变体的影响。共阻遏物相互作用可以例如通过例如如实施例中所示的亲和纯化-质谱法(AP-MS)来确定。
ZIM3的KRAB结构域是ZIM3的62aa(aa 8-69)。一些KRAB结构域更长。
在一个实施方案中,所述至少一个KRAB结构域是人KRAB结构域。在另一个实施方案中,KRAB结构域包含至少55个、至少60个、至少65个或至少70个氨基酸。在另一个实施方案中,KRAB结构域包含一个或多个突变。
在一个实施方案中,所述至少一个KRAB结构域是任选地串联的两个或三个KRAB结构域。
DNA靶向结构域可以选自多种DNA靶向结构域。例如,DNA靶向结构域可以选自工程化或天然锌指DNA结合结构域、转录激活因子样效应物(TALE)、dCas9、dCas12或其他Cas家族蛋白,或来自真核生物或原核生物的其他天然DNA结合结构域(DBD)(例如Forkhead、基本螺旋-环-螺旋、亮氨酸拉链、同源结构域、细胞核激素受体)。在定制ZF、TALE或Cas家族蛋白的情况下,KRAB结构域可以以受控方式被带到基因组中的单个基因座。在天然DNA结合结构域的情况下,KRAB结构域将被带到给定转录因子结合至的所有基因座,从而增强/替代内源性TF的功能。
在一个实施方案中,无酶活性的序列特异性DNA结合蛋白是CRISPR-Cas蛋白,诸如dCas9。无酶活性的CRISPR-Cas蛋白保留gRNA和靶DNA结合活性。例如,D10A/H840A的突变会在RuvC1和HNH核酸酶结构域中引入突变并导致失活。在一个实施方案中,CRISPR-Cas蛋白是dCas9,其具有SEQ ID NO:1的氨基酸序列或与SEQ ID NO:1具有至少80%、至少90%、至少95%或至少99%序列同一性的氨基酸序列,并且包含D10A/H840A或相应的突变,并且保留gRNA和靶DNA结合活性。技术人员可以鉴定落入本公开范围内的其他无酶活性的CRISPR-Cas蛋白。
示例性异源转录阻遏物核酸提供在SEQ ID NO:14、16和17中。在一个实施方案中,异源转录阻遏物可包含由所述核酸编码的氨基酸序列,或与由SEQ ID NO:14、16或17的DNA靶向结构域和KRAB结构域部分编码的氨基酸序列具有至少80%、至少90%、至少95%或至少99%序列同一性的氨基酸序列。此类多肽的编码多肽(融合体或在表达和激活时)的活性与例如SEQ ID NO:14、16或17一样有效(例如提供与例如SEQ ID NO:14、16或17一样有效的转录阻遏)。
在一个实施方案中,转录阻遏物包括第一和第二相互作用组分(例如,诱导型蛋白二聚化结构域),该第一和第二相互作用组分在诱导剂存在下提供诱导型转录阻遏。本领域技术人员可以容易地鉴定和选择合适的相互作用组分,诸如可以一起使用的诱导型二聚化结构域。可以使用蛋白质二聚化结构域和诱导剂的任何合适的诱导型组合,例如ABI1和PYL1的二聚化可以通过添加脱落酸来诱导。其他诱导型系统包括那些基于利用雷帕霉素、赤霉酸/赤霉素的诱导的系统和基于分裂dCas9的系统。例如GID1和GAI的二聚化可由赤霉素诱导,并且FKBP和FRB的二聚化可用雷帕霉素或其类似物(例如雷帕霉素类似物(rapalog))诱导。其他诱导剂可包括用于诱导基于生长素的二聚化的生长素,其中生长素处理导致TIR1富含亮氨酸重复序列区(LRR)与生长素诱导型降解决定子(AID)序列或他莫昔芬和相关分子雌激素的相互作用以用于受体配体-结合结构域(LBD)融合,其中ERLBD将构建体保留在细胞质中,直到用他莫昔芬处理。
在一个实施方案中,KRAB结构域通过接头与DNA靶向结构域融合。在一个实施方案中,两个或更多个KRAB结构域通过一个或多个接头融合在一起。例如,可以使用甘氨酸和甘氨酸丝氨酸接头。实施例中描述的转录阻遏物在KRAB结构域融合至dCas9的C端时使用Gly4接头,并且在KRAB结构域融合至dCas9的N端时使用Gly3SerGly3Ser。也可以使用其他接头。
在一个实施方案中,转录阻遏物包含一种或多种细胞核定位信号(NLS)。可以使用任何合适的NLS。任选地,NLS是SV40 NLS。该一种或多种NLS可以是一种或多种N-端NLS、一种或多种C-端NLS、一种或多种内部NLS和/或它们的组合。
如本文所述,转录阻遏物可由核酸编码和/或由表达构建体表达。因此,本公开的一个方面是编码本文所述的转录阻遏物的核酸。例如,该核酸可以是SEQ ID NO:14、16或17中任一者的核酸,与SEQ ID NO:14、16或17具有至少80%、至少90%、至少95%、至少99%或100%序列同一性的序列,其中异源转录阻遏物,例如阻遏物转录的有效性与SEQ ID NO:14、16或17几乎一样,例如是SEQ ID NO:14、16或17的至少80%、至少85%,或至少90%,如例如在如本文所述的测定中所评估的。所述序列同一性是例如相对于DNA靶向结构域和KRAB结构域而言的。其他部分、接头、NLS等可以完全不同。
相关方面是表达构建体,该表达构建体包含编码可操作地连接至启动子和转录终止位点的转录阻遏物的核酸。可以使用任何合适的启动子。合适的启动子可由本领域技术人员鉴定,并且可包括例如CMV、EF1A或PGK。例如,SEQ ID NO:15的启动子和增强子序列可用于表达构建体中。也可以使用诱导型启动子。
在一个实施方案中,构建体是载体。可以使用任何合适的载体。合适的载体可由本领域技术人员鉴定,并且可包括病毒载体,任选地慢病毒载体或腺病毒载体。该载体也可以是自我复制的病毒RNA复制子或质粒。
合适的载体可以包括例如用于表达目的核酸(例如gRNA或阻遏物或它们的组分)的启动子、聚A(polyA)尾巴、用于增加表达的稳定性的3'UTR元件(如WPRE)、绝缘子序列、慢病毒包装信号,和/或抗生素抗性标志物。诸如启动子的组分为真核启动子。核酸可以可操作地连接至启动子序列,任选地真核启动子序列,和其他元件。本领域技术人员可以鉴定另外的合适的组分。
在另一个实施方案中,转录阻遏物、核酸、构建体或载体在细胞中。可以使用任何合适的细胞,该合适的细胞可以由技术人员基于期望的应用来确定。该细胞可以来自任何生物体,任选地来自哺乳动物。任选地,该细胞是哺乳动物细胞,诸如人细胞或啮齿动物细胞,任选地是小鼠细胞。任选地,该细胞是细胞系。该细胞系可以是任何合适的细胞系。该细胞可以是原代细胞。在一个实施方案中,该细胞是T细胞。在另一个实施方案中,该细胞是疾病细胞,任选地是癌细胞。在又一个实施方案中,该细胞是干细胞,任选地是诱导多能干细胞。
转录阻遏物、核酸、构建体或载体可以以任何合适的方式被引入到细胞中,例如通过转染被引入到细胞中。合适的转染试剂和方法在本领域中是照常规实践的并且可以由技术人员鉴定。任选地,该构建体是病毒载体,任选地是慢病毒载体,并且通过转导被引入到细胞中。合适的转导方法在本领域中是照常规实践的并且可以由技术人员鉴定。
在一些实施方案中,该细胞稳定表达异源转录阻遏物,任选地,该细胞被稳定转导,例如使用包含编码异源转录阻遏物的核酸的病毒制备。
另一个方面是转录阻遏系统,该转录阻遏系统包含本文所述的转录阻遏物、编码该转录阻遏物的核酸,或包含所述核酸的构建体或载体,或表达该转录阻遏物的细胞。在基于CRISPR-Cas的系统的情况下,该系统包含至少一种gRNA。在基于诱导型二聚化结构域的系统的情况下,该系统任选地包含至少一种诱导剂。
还提供了一种组合物,该组合物包含本文所述的异源转录阻遏物、本文所述的核酸、本文所述的构建体、本文所述的载体、本文所述的细胞和/或本文所述的转录阻遏系统。该组合物可以包含载剂(诸如BSA),或根据组合物组分合适的稀释剂(任选地为水或缓冲盐水)。该组合物可以包含多种组分,诸如转录阻遏物、核酸、构建体、载体或包含相同或不同元件的细胞。
本文还提供了例如用于阻遏靶基因转录或执行本文所述方法的试剂盒,该试剂盒包括本文所述的转录阻遏物,核酸,表达构建体或编码本文所述的转录阻遏物的载体,或表达本文所述的转录阻遏物的细胞,以及任选的容纳该转录阻遏物、核酸、表达构建体、载体、细胞或组合物的小瓶。该试剂盒可包括前面提到的组分中的一种或多种。任选地,该试剂盒包括gRNA表达构建体(例如,编码操作性地连接至启动子序列(任选地真核启动子序列)的gRNA的核酸)、诱导剂和/或用于实施本文描述的方法的说明书。
本文还描述了阻遏细胞中靶基因的转录的方法。如实施例中所证明的,本公开的转录阻遏物可以靶向于基因组基因座,诸如启动子以阻遏细胞中靶基因的转录。
如本文所述,用于转录调控的另一水平的控制物(control)可以利用化学诱导的与例如雷帕霉素类似物或脱落酸的二聚化来添加。在这种情况下,一半(例如DNA结合部分)将与FKBP或PYL1融合,而另一半(例如KRAB结构域)与FRB或ABI1融合。用雷帕霉素类似物或脱落酸处理将分别诱导FKBP与FRB或者PYL1与ABI1之间的相互作用,从而导致暂时调控的基因表达。如实施例中所示,包含ABI1和PYL1的异源转录阻遏物的二聚化可以通过添加脱落酸来诱导。本领域技术人员可以容易地鉴定和选择可一起使用的合适的诱导型二聚化结构域和诱导剂。可以使用蛋白质二聚化结构域和诱导剂的任何合适的诱导型组合,例如ABI1和PYL1的二聚化可以通过添加脱落酸来诱导。其他诱导型系统包括那些基于利用雷帕霉素、赤霉酸/赤霉素的诱导的系统和基于分裂dCas9的系统。例如GID1和GAI的二聚化可由赤霉素诱导,并且FKBP和FRB的二聚化可用雷帕霉素或其类似物(例如雷帕霉素类似物(rapalog))诱导。本文还考虑了更高阶多聚化系统,诸如SunTag系统(Tenenbaum等人,2014)。
也可以使用其他诱导型系统控制DNA靶向结构域和KRAB结构域之间的相互作用。其他系统(其不依赖于二聚化)包括格拉瑞韦诱导的稳定性(Tague等人,2018年)或他莫昔芬调控的使用雌激素受体配体结合结构域变体的细胞核定位。在格拉瑞韦诱导的稳定性的情况下,DNA靶向结构域和KRAB结构域将通过自切割NS3蛋白酶结构域连接。只有在存在格拉瑞韦(其抑制NS3活性)的情况下,DNA结合结构域和KRAB结构域才会保持在一起并且调控基因表达。
因此,本公开的一个方面是阻遏细胞中靶基因表达的方法,该方法包括将本文所述的转录阻遏物引入到该细胞中,以及在合适的条件下培养该细胞以使得DNA靶向结构域将转录阻遏物引导至靶位点并且至少一个KRAB结构域阻遏该靶基因的转录。在其中转录阻遏物包含CRISPR-Cas的实施方案中,该方法进一步包括将至少一种靶向细胞中期望基因组基因座的gRNA引入到该细胞中,以及在合适的条件下培养细胞,以使得该至少一种gRNA与CRISPR-Cas蛋白缔合并且引导CRISPR-Cas蛋白将转录阻遏物引导至CRISPR靶位点,以使得该至少一个KRAB结构域阻遏靶基因的转录。在其中转录阻遏物在DNA靶向结构域和KRAB结构域中的每一者中均包含诱导型二聚化结构域的实施方案中,该方法进一步包括将至少一种诱导剂引入到该细胞中以及在使第一和第二诱导型二聚化结构域缔合从而使得该至少一个KRAB结构域阻遏靶基因的转录的合适条件下培养该细胞。在一个实施方案中,该细胞在受试者中。因此,在一个实施方案中,该方法用于阻遏动物模型中靶基因的表达。例如,本发明的方法可被用于小鼠或其他啮齿动物模型和哺乳动物(诸如人类)的离体或体内应用中。例如,该系统可被用于CAR-T回路或者在基于AAV或脂质纳米颗粒的递送后控制基因表达。
本文所述的方法可被用于鉴定或筛选对于细胞活力或感兴趣的表型重要的一个或多个基因组基因座。举例来说,本文所述的方法可被用于筛选对于对感兴趣的毒素(诸如白喉毒素)的抗性或敏感性重要的基因或其调控元件。在另一个实例中,本文描述的方法可被用于鉴定对于感兴趣的蛋白质(诸如CD81)的表达重要的调控元件。在进一步的实例中,本文所述的方法可在高通量筛选方法中被用于通过筛选在某些条件(例如随着时间的推移进行的药物治疗)下在细胞群中表现过度或不足(over-or under-represented)的gRNA来筛选细胞类型中的必需或非必需基因。它们可被用于鉴定响应(或不响应)于基于KRAB结构域的阻遏的调控元件,或者可被用于鉴定癌症细胞增殖所必需的调控元件。其他应用可以由本领域技术人员确定。
上面的公开总体地描述了本申请。通过参考以下具体实施例可以得到更完整的理解。这些实施例仅出于说明的目的而描述,并且不旨在限制本公开的范围。考虑了形式改变和等效物替代,因为环境可能会暗示或出现应急情况。尽管本文中已使用了特定术语,但此类术语旨在处于描述性含义,而不是用于限制的目的。
以下非限制性实施例是对本发明的举例说明:
III.实施例
实施例1.高度强效的KRAB结构域的鉴定。
人类基因组编码超过350种KRAB结构域蛋白[11-13]。据推测,当与dCas9融合时,KRAB结构域在沉默基因表达的能力方面会有所不同。57个人类KRAB结构域单独地融合到dCas9的N端,并且在被招募到两种不同的从基因组上整合的报告基因构建体之一时经受了活性的测定。在一者中,它们被招募到驱动HEK293T细胞中EGFP表达的SV40启动子[14],而在另一者中,它们被拴连至K562细胞中PGK1-EGFP-pA报告基因的聚腺苷酸化位点下游的7xTetO阵列[15](图1a)。KRAB结构域具有从几乎完全沉默到完全没有变化的截然不同的效果(图1b、图1c和图5)。该差异无法由dCas9融合体的表达水平来解释(图3)。此外,结果在该两个报告基因之间一致(Rsq=0.59;图1A),这表明该效果不是细胞类型特异性的(见图9)。KRAB也融合到dCas9的C端,具有相似的结果(参见实施例5和图3)。
有趣的是,与几个其他KRAB结构域(诸如来自ZIM3基因的KRAB结构域)相比,来自KOX1的KRAB结构域并不是特别强的阻遏物(图1b、图1c和图5)。即使是比仅KOX1 KRAB更强效的KOX1 KRAB-MeCP2融合体(图1b、c和图5),也未能使报告基因完全沉默。然后通过测定先前报告的慢病毒KOX1-dCas9构建体[9,16](图1B和图9)确定该结果不是由于载体设计所致。先前报告的构建体效力的适度提高可能是由于注释的KRAB结构域的N端存在额外的九个氨基酸。在载体设计中向KOX1 KRAB结构域添加侧翼序列略微提高了该KOX1 KRAB结构域的活性——但它仍然明显弱于许多其他KRAB结构域。
KRAB结构域通过与TRIM28/KAP1相互作用诱导沉默,该TRIM28/KAP1充当异染色质诱导蛋白复合物的支架[17]。然而,并非所有KRAB结构域蛋白都与TRIM28相互作用[10,15]。为了评估TRIM28结合和沉默之间的关系,将KRAB活性与在具有全长KRAB结构域蛋白的三个独立亲和纯化/质谱数据集中回收的TRIM28肽的数目进行比较[10,15,16]。在每种情况下,KRAB/TRIM28相互作用的强度与报告基因测定中的阻遏程度之间存在显著正相关性(图1d和图3)。然后使用成对定量相互作用测定LUMIER对49个KRAB-EGFP融合体与TRIM28的相互作用进行谱分析[14]。同样,存在显著正相关性(对于K562和HEK293T,Rsq分别为0.46和0.25;图1e)。因此,与TRIM28的相互作用强度似乎是KRAB结构域沉默活性的主要决定因素。有趣的是,KOX1 KRAB-MeCP2融合体与TRIM28的相互作用比仅KOX1 KRAB更强(图1e),这表明KRAB-MeCP2融合体在CRISPRi中的效力的提高可能是由于TRIM28相互作用增强所致。
方法如实施例4中所描述。
实施例2–时间动力学特性
KRAB结构域活动的差异可以用它们的内在效力或它们独特的时间动力学来解释。为了区分这些选项,使用了化学诱导的二聚化系统。植物蛋白ABI1和PYL1之间的相互作用是由脱落酸(ABA)以可逆方式诱导的(图1f)。产生了表达ABI1-dCas9和靶向SV40启动子上两个位点的gRNA的克隆SV40-EGFP报告基因细胞系。然后用与PYL1融合的ZIM3或KOX1 KRAB结构域感染这些细胞,并且将这些细胞用ABA处理20天(图1g,实线)。ZIM3和KOX1 KRAB结构域均以相似的动力学诱导阻遏,但ZIM3 KRAB尽管表达水平较低,但达到了更高水平的阻遏(图1g、图2c和图9)。当ABA在9天后被撤回时,这两个KRAB结构域的去阻遏以类似的动力学发生(图1g,虚线)。因此,KRAB结构域效力的差异不是由于KOX1 KRAB诱导的阻遏的动力学较慢所致。然而,在40天的沉默和随后的ABA清除后,KOX1 KRAB-PYL1表达细胞几乎完全恢复了EGFP表达,而在ZIM3 KRAB-PYL1表达细胞中,EGFP表达仅达到原始水平的10%(图1h)。这些结果表明,ZIM3 KRAB的延长的招募可以诱导表达的永久沉默,而KOX1 KRAB似乎主要通过可逆机制发挥作用。这与之前的研究一致,这表明KRAB结构域可以经由可逆和不可逆机制介导沉默。
实施例3.在CRISPRi应用中对ZIM3 KRAB-dCas9融合体进行基准测试。
测试了非常高效的KRAB结构域优于当前型式的CRISPRi的能力。ZIM3 KRAB结构域是在这两种细胞系中测得的最强阻遏物,也是最强的TRIM28相互作用物(interactor)之一。首先,将ZIM3-KRAB-dCas9、KOX1-KRAB-dCas9、KOX1-KRAB-MeCP2-dCas9和阴性对照Nanoluc-dCas9招募到HEK293T细胞中的五个内源启动子,并通过qRT-PCR评估沉默。在五个例子中的四个例子中,ZIM3 KRAB沉默的表达显著优于KOX1 KRAB或KOX1 KRAB-MeCP2(图2A、图3和图6)。为了测试这些差异是否转化为蛋白质水平,将这些构建体靶向于细胞表面抗原CD81的启动子。ZIM3 KRAB能够降低CD81表面蛋白表达,降低效果比其他两种构建体好高达10倍(图2B)。
测定了KRAB构建体在对抗白喉毒素(DTA)毒性方面的作用。DTA毒性完全取决于HB-EGF,即该毒素的细胞表面受体[18]。如图所示,与KOX1 KRAB或KOX1-MeCP2的阻遏相比,用dCas9-ZIM3沉默白喉毒素(DTA)受体HBEGF导致显著更高的对DTA的抗性。值得注意的是,即使是少量的该受体也足以使毒素内吞,从而导致细胞死亡。该构建体首先靶向于具有五种gRNA的池的HB-EGF启动子。在这种情况下,所有KRAB构建体都使细胞对DTA具有显著抗性,但是ZIM3 KRAB的作用与HB-EGF敲除细胞的作用最接近(图2C)。然而,当单独测试每种gRNA时,差异更加明显。除了一种完全无活性的gRNA外,ZIM3 KRAB是最强效的效应物。在三种gRNA的情况下,它的效果几乎无法与HB-EGF KO细胞区分开来(图2C)。此外,ZIM3 KRAB似乎对gRNA选择的敏感性低于其他两种构建体。特别是,HB-EGF gRNA#2对KOX1 KRAB没有表现出活性,在添加MeCP2时得到适度改善,并且对ZIM3 KRAB完全有效(图2C)。
还测试了KRAB构建体对gRNA位置的敏感性。使ZIM3 KRAB和KOX1 KRAB-MeCP2靶向小鼠胚胎成纤维细胞中GFP报告基因的上游和下游。当靶向于启动子时,这两种构建体都部分地沉默了GFP,KOX1 KRAB-MeCP2比ZIM3稍微更高效。然而,当靶向报告基因的下游时,只有ZIM3沉默了GFP表达,这证明ZIM3可比KOX1 KRAB-MeCP2更有效地从远端位点沉默基因表达。
最后,在大规模无偏筛选中研究了该三种KRAB效应物构建体的性能。在稳定表达ZIM3 KRAB-dCas9、KOX1 KRAB-dCas9、KOX1 KRAB-MeCP2-dCas9或Nanoluc-dCas9的HEK293T细胞中执行细胞活力丢失筛选。用最近描述的靶向18,901个基因的Dolcetto Set A gRNA文库(每个基因有三种gRNA)感染这些细胞,并在21天后测量这些细胞的gRNA耗尽。将在利用每种构建体时靶向金标准必需基因和非必需基因的gRNA的相对耗尽与接受者工作特征(ROC)曲线进行比较。如先前所报告的,基于ROC下面积(AUROC),KOX1 KRAB-MeCP2比单独KOX1 KRAB更高效,无论是在gRNA水平还是基因水平下计算都是如此(gRNA水平为0.62与0.70,基因水平为0.66与0.75;图2D、图2E)。相比之下,ZIM3 KRAB显著优于这两种构建体,AUROC分别为0.84(gRNA水平)和0.90(基因水平;图2D、图2E)。应该注意的是,此处报告的AUROC值略低于已针对像K562和A3759之类的其他细胞系中的CRISPRi筛选所报告的值,但与之前在HEK293T细胞中进行的筛选一致[8](图2D、2E)。较低的效率可能是由于TRIM28在HEK293T细胞中的表达水平较低所致(图3)。然而,这些结果强烈支持报告基因和单个内源基因的初步结果:ZIM3 KRAB结构域是一种异常强的转录阻遏物。
综上所述,本文描述了与目前存在的系统相比,在靶基因沉默方面显著更有效并且对gRNA选择更不敏感的高效KRAB结构域。ZIM3KRAB阻遏物在需要高度稳健的基因沉默或受限于对靶向每个基因的多种gRNA的需求的应用,诸如遗传相互作用谱分析或Perturb-Seq中可能特别有价值[19–21]。
实施例4.
方法:
细胞培养.将包括SV40-EGFP报告基因细胞系(来自斯坦福大学的Lei Stanley Qi实验室的礼物)在内的所有HEK293T细胞都维持在含有10%胎牛血清(FBS)和1%青霉素-链霉素的Dulbecco改良Eagle培养基(DMEM)中。由于SV40-EGFP报告基因细胞系最初是通过随机整合慢病毒生成的,因此制作了克隆系以确保EGFP及其靶向gRNA的均匀高表达水平。将K562报告基因细胞(IRCCS圣拉斐尔科学研究所(IRCCS San Raffaele ScientificInstitute)的Angelo Lombardo实验室的礼物)维持在补充有10% FBS和1%青霉素-链霉素的Iscove改良Dulbecco(IMDM)中。将K562细胞用靶向整合在AAVS1基因座中的EGFP表达盒下游的TetO阵列的单种gRNA感染。然后将这些细胞用于后续的沉默实验,同时始终选择相同的高EBFP2+细胞,该细胞用作用于gRNA表达的替代物。然后,将这些细胞在高感染复数下用含有每个与dCas9融合的阻遏物变体的慢病毒转导。分别通过用6μg/ml和10μg/ml杀稻瘟素进行两轮选择来对HEK293T和K562报告基因细胞进行处理,并且将该细胞维持三周,之后用流式细胞术测量报告基因。照常规对所有细胞系进行支原体污染测试。
质粒设计.将单个阻遏物克隆到与Gateway相容的慢病毒载体中,该载体具有C端人类密码子优化的化脓性链球菌dCas9,该dCas9具有N端SV40细胞核定位信号(NLS)和两个C端SV40 NLS。如先前所解释的,组成型表达EGFP的HEK293T细胞系最初被靶向。对HEK293T稳定细胞系的子集执行了针对Cas9的蛋白质印迹探测,以解释任何可变的表达水平。在测试K562报告基因系时,将C端P2A-dsRed添加到dCas9中作为用于表达的替代物,并且在随后的流式细胞术测量期间仅对高dsRed+细胞进行门控。每个KRAB结构域都是PCR扩增的或直接合成的,从而允许在KRAB结构域侧翼具有取自内源性蛋白质并且尽可能如由UniProt注释的30个额外的氨基酸。将靶向单个内源基因的sgRNA克隆到基于U6的嘌呤霉素抗性pLCKO中。将靶向报告基因的sgRNA克隆到改良的pLCKO中,以从hPGK启动子共表达EBFP2。
病毒生产.对于小规模病毒生产,慢病毒是通过在含有比例为8:6:1的感兴趣的构建体、psPAX2和pVSV-G的6孔板上瞬时转染低传代HEK293T细胞而产生的。根据制造商的方案使用Lipofectamine2000(Thermo)执行转染。对于汇集的gRNA文库的大规模生产,如前所述[29]使用XtremeGENE9(Roche)在多个15-cm培养皿上对HEK293T细胞进行转染。转染后6-8小时,将培养基更换为收获培养基(DMEM+1.1g/100mL BSA),并在转染后36小时通过使病毒穿过0.45μm过滤器来收集病毒。
RT-qPCR.将稳定表达阻遏物-dCas9融合体的HEK293T细胞作为技术复制物在48孔板上用每个单种gRNA或gRNA池独立地感染。感染后24小时,用1μg/ml嘌呤霉素选择细胞并将该细胞在24孔板上传代9天。使用TRI试剂(Sigma)提取总RNA。将Luna通用单步RT-qPCR试剂盒(NEB)用在50ng总RNA上,循环条件为:55℃ 10分钟,95℃ 1分钟,40个循环的95℃ 10秒和60℃30秒(读板),随后是60-95℃的熔解曲线。将引物设计为跨越外显子-外显子接合部,并且经由2–ΔΔCt方法将表达针对管家基因RPL13A作归一化。
对白喉毒素的敏感性.在6孔板上用每个单种gRNA或等摩尔gRNA池转导稳定表达阻遏物-dCas9融合体的HEK293T细胞。感染后24小时,将细胞传代到10-cm培养皿上,并用1.5μg/ml嘌呤霉素选择3天。选择完成后,在毒素处理前24小时将细胞接种在96孔板上,以在第二天达到40%汇合。白喉毒素在施加前在储存缓冲液中被连续稀释。将接种的细胞用连续稀释的白喉毒素处理48小时。去除含有毒素的培养基,将细胞用1X PBS洗涤一次,并进一步与含有alamarBlue试剂的新鲜培养基以1:5的比例一起孵育90和180分钟。通过使用读板器(Biotech)测量alamarBlue染料荧光来记录细胞活力。通过用来自TKOv3文库的靶向HBEGF的gRNA转染px459质粒来产生HB-EGF敲除细胞系。用1.5ug/ml嘌呤霉素筛选经转染的细胞3天。由surveyor测定法确认敲除。
CRISPRi.在具有一系列病毒体积(0、50、100、150、200、250和500μl)的15-cm培养皿上测定每个细胞系的病毒滴度。以导致约30%活力的剂量对具有每种阻遏物-dCas9衍生物的异质表达的经验证的HEK293T细胞进行转导。转导后24小时使用1μg/ml嘌呤霉素进行选择,从而在48-72小时(T0)内完成选择。在约30%的感染效率下,足够的细胞被转导从而实现每种dCas9变体的>500倍的初始表现。将细胞在两个技术重复物中传代和维持,同时始终维持250倍的覆盖率。在选择T14和T21后沉淀细胞,并且将细胞在干冰上快速冷冻以分离基因组DNA。
LUMIER.使用聚乙烯亚胺用C端标识有EGFP-3xFLAG的KRAB结构域转染在C端稳定表达NLuc标识的TRIM28的293T细胞。转染后两天,将细胞在PBS中洗涤,在HENG缓冲液中裂解并转移到包被有单克隆抗FLAG M2抗体的384孔板中。将板在低温下孵育3小时,用HENG缓冲液洗涤,并用读板器测量发光。之后,测量针对HRP缀合的抗FLAG抗体的ELISA信号作为表达的对照。
实施例5
接下来,我们测试了在ZIM3和KOX1之间的效力上观察到的差异是否是由于融合蛋白的取向所致。我们通过在dCas9的C端插入与KOX1-KRAB、KOX1-MeCP2或ZIM3-KRAB融合的mCherry来改良原始CRISPRi质粒(27)。将表达单个靶向启动子的gRNA的SV40-EGFP细胞用每个阻遏物转导。在感染后两周对表达相似水平的mCherry(dCas9-KRAB的替代物)的细胞进行门控。ZIM3 KRAB比KOX1 KRAB或KOX1 KRAB-MeCP2融合体更强效,即使当在广泛使用的骨架中与dCas9的C端融合时也是如此。结果示于图3中。另外的方法如实施例4中所描述述。
实施例6
诱导型系统
ZIM3 KRAB阻遏物的性能在[14]中描述的诱导型阻遏系统中进行了测试。将K562报告基因细胞用ABI-dCas9和靶向整合在AAVS1基因座中的EGFP表达盒下游的TetO阵列的单种gRNA转导。然后用含有与PYL1融合的ZIM3或KOX1 KRAB结构域的慢病毒以高感染复数感染这些细胞。两轮选择后,用100μM脱落酸处理细胞,并在招募5天和14天后通过流式细胞术测量EGFP水平(图7)。与之前使用直接融合的实验类似,ZIM3-PYL1表现出与KOX1-PYL1相比更好的沉默。另外的方法如实施例4中所描述。
实施例7–评估KRAB介导的沉默的脱靶效应
更强效地阻遏中靶基因可能会对潜在的脱靶产生更明显的影响。这是通过在用与ZIM3 KRAB、KOX1 KRAB、KOX1 KRAB-MeCP2或Nanoluc融合的dCas9感染后30天对SV40-EGFP报告基因细胞的转录组进行测序来评估的。在受ZIM3 KRAB-dCas9感染的细胞中,除了EGFP本身之外,还有十个基因被显著下调或上调(图8)。事实上,这比任何其他构建体的受影响的基因都少(图8)。此外,该十个基因中没有一个含有在转录起始位点的2kb内的预测的gRNA脱靶物,这表明ZIM3KRAB结构域的功效增加不会导致脱靶基因的额外沉默。另外的方法如实施例4中所描述。
序列表
dCAS9 SEQ ID NO:1
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENI IHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
Zim3的KRAB结构域(SEQ ID NO:2)
VTFEDVTVNFTQGEWQRLNPEQRNLYRDVMLENYSNLVSVGQGETTKPDVILRLEQGKEPWL
SEQ ID NO:3-10和18中的KRAB结构域以粗体显示。
ZIM3(Q9NZV7)(SEQ ID NO:3)
Figure BDA0004101149660000361
ZNF554(Q86TJ5)(SEQ ID NO:4)
Figure BDA0004101149660000362
ZNF264(O43296)(SEQ ID NO:5)
Figure BDA0004101149660000363
ZNF324(O75467)(SEQ ID NO:6)
Figure BDA0004101149660000364
ZNF669(Q96BR6)(SEQ ID NO:7)
Figure BDA0004101149660000365
ZNF354A(O60765)(SEQ ID NO:8)
Figure BDA0004101149660000366
Figure BDA0004101149660000371
ZFP82(Q8N141)(SEQ ID NO:9)
Figure BDA0004101149660000372
ZNF566(Q969W8)(SEQ ID NO:10)
Figure BDA0004101149660000373
ZIM2(Q9NZV7)(SEQ ID NO:18)
Figure BDA0004101149660000374
/>
Tracr序列
5’-gtttcagagctatgctggaaacagcatagcaagttgaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc-3’(SEQ ID NO:11)
5’-GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGC-3’(SEQ ID NO:12)
tracr-v2
5’-GTTTCAGAGCTACAGCAGAAATGCTGTAGCAAGTTGAAAT-3’(SEQ ID NO:13)
用于融合构建体ZIM3-KRAB–HA标识的dCAS9的启动子和增强子(SEQ ID NO:15)
CMV启动子+增强子
Figure BDA0004101149660000381
融合构建体ZIM3-KRAB–HA标识的dCAS9(SEQ ID NO:14)
Figure BDA0004101149660000382
融合构建体ZIM3-KRAB-PYL1(SEQ ID NO:16)
ZIM3-KRAB PYL1,终止*
Figure BDA0004101149660000391
-dCas9-mCherry-ZIM3-KRAB(SEQ ID NO:17)
Figure BDA0004101149660000392
5’-N1NGG-3’
其中N1的长度为15至25、16至24、17至23、18至22,或19至21个核苷酸,任选地长度为20个核苷酸或者介于15和25之间并包括在内的任何数字。
参考文献
1.Fulco,C.P.et al.Systematic mapping of functional enhancer-promoterconnections with CRISPR interference.Science(New York,NY)354,769-773(2016).
2.Gilbert,L.A.et al.Genome-Scale CRISPR-Mediated Control of GeneRepression and Activation.Cell 159,647-661(2014).
3.Kampmann,M.CRISPRi and CRISPRa Screens in Mammalian Cells forPrecision Biology and Medicine.ACS Chem.Biol.13,406-416(2018).
4.Qi,L.S.et al.Repurposing CRISPR as an RNA-guided platform forsequence-specific control of gene expression.Cell 152,1173-1183(2013).
5.Liu,S.J.et al.CRISPRi-based genome-scale identification offunctional long noncoding RNA loci in human cells.Science 355,eaah7111(2017).
6.Meyers,R.M.et al.Computational correction of copy number e仟ectimproves specificity of CRISPR-Cas9 essentiality screens in cancercells.Nature Genetics 49,1779-1784(2017).
7.Horlbeck,M.A.et al.Compact and highly active next-generationlibraries for CRISPR-mediated gene repression and activation.eLife 5,e19760(2016).
8.Yeo,N.C.et al.An enhanced CRISPR repressor fortargetedmammaliangene regulation.Nat Methods 15,611-616(2018).
9.Sanson,K.R.et al.Optimized libraries for CRISPR-Cas9 geneticscreens with multiple modalities.NatCommun 9,1-15(2018).
10.Margolin,J.F.et al.Kruppel-associated boxes are potenttranscriptional repression domains.Proceedings of the National Academy ofSciences 91,4509-4513(1994).
11.Helleboid,P.et al.The interactome of KRAB zinc finger proteinsreveals the evolutionary history of their functional diversification.EMBO J(2019)
doi:10.15252/embj.2018101220.
12.Murphy,K.E.et al.The Transcriptional Repressive Activity of KRABZinc Finger Proteins Does Not Correlate with Their Ability to RecruitTRIM28.PLOS ONE11,e0163555(2016).
13.Schmitges,F.W.et al.Multiparameter functional diversity of humanC2H2 zinc finger proteins.Genome Res.26,1742-1752(2016).
14.Gao,Y.et al.Complex transcriptional modulation with orthogonal andinducible dCas9 regulators.Nature Methods 13,1043-1049(2016).
15.Amabile,A.et al.Inheritable Silencing of Endogenous Genes by Hit-and-Run Targeted Epigenetic Editing.Cell 167,219-232.e14(2016).
16.Rosenbluh,J.et al.Complementary information derived from CRISPRCas9 mediated gene deletion and suppression.Nat Commun 8,15403(2017).
17.Ecco,G.,Imbeault,M.&Trono,D.KRAB zinc finger proteins.Development(Cambridge,England)144,2719-2729(2017)
18.Naglich,J.G.,Metherall,J.E.,Russell,D.W.&Eidels,L.Expressioncloning of a diphtheria toxin receptor:identity with a heparin-binding EGF-like growth factor precursor.Cell 69,1051-1061(1992).
19.Dixit,A.et al.Perturb-Seq:Dissecting Molecular Circuits withScalable Single-Cell RNA Profiling of Pooled Genetic Screens.Cell 167,1853-1866.e17(2016).
20.Norman,T.M.et al.Exploring genetic interaction manifoldsconstructed from rich single-cell phenotypes.Science 365,786-793(2019).
21.Horlback,M.A.et al.Mappingthe Genetic Landscape of HumanCells.Cell 174,953-967.e22(2018).
22.Zhang et al A Multicolor Panel of TALE-KRAB based transcriptionalrepressor vectors enabling knockdown of multiple gene targets.Sci Rep 4,7338(2015)
https://doi.org/10.1038/srep07338.
23.Deuschle,U et al Tetracycline-reversible silencing of eukaryoticpromoters.MCB 15,1907(1995).
24.Kiani S et al.Cas9 gRNA engineering for genome editing,activationand repression.Nature Methods 12,1051(2015).
25.Beerli R.R.et al Toward controlling gene expression at will:Specific regulation of the erbS-2/HER-2 promoter by using polydactylzincfinger proteins constructed from modular building blocks PNAS 95,14628(1995).
26.https://www.nature.com/articles/ncomms1962
27.Gilbert LA,Larson MH,Morsut L,Liu Z,Brar GA,Torres SE,Stern-Ginossar N,Brandman O,Whitehead EH,Doudna JA,Lim WA,Weissman JS,QiLSCell.2013 Jul 9.pii:S0092-8674(13)00826-X.doi:10.1016/j.call.2013.06.044https://www.cell.com/fulltext/S0092-8674(13)00826-XCell.2013 Jul9.pii:s0092-8674(13)00826-X.doi:10.1016/j.cell.2013.06.044.
28.https://www.nature.com/articles/s41467-018-07901-8
29.https://www.cell.com/cell/fulltext/S0092-8674(15)01495-
序列表
<110> 多伦多大学管理委员会(The Governing Council of the University ofToronto)
<120> KRAB融合阻遏物以及用于阻遏基因表达的方法和组合物
<130> 2223-P61944PC00
<150> US 63/065,953
<151> 2020-08-14
<160> 18
<170> PatentIn version 3.5
<210> 1
<211> 1368
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<400> 1
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 2
<211> 62
<212> PRT
<213> 智人(Homo sapiens)
<400> 2
Val Thr Phe Glu Asp Val Thr Val Asn Phe Thr Gln Gly Glu Trp Gln
1 5 10 15
Arg Leu Asn Pro Glu Gln Arg Asn Leu Tyr Arg Asp Val Met Leu Glu
20 25 30
Asn Tyr Ser Asn Leu Val Ser Val Gly Gln Gly Glu Thr Thr Lys Pro
35 40 45
Asp Val Ile Leu Arg Leu Glu Gln Gly Lys Glu Pro Trp Leu
50 55 60
<210> 3
<211> 100
<212> PRT
<213> 智人(Homo sapiens)
<400> 3
Met Asn Asn Ser Gln Gly Arg Val Thr Phe Glu Asp Val Thr Val Asn
1 5 10 15
Phe Thr Gln Gly Glu Trp Gln Arg Leu Asn Pro Glu Gln Arg Asn Leu
20 25 30
Tyr Arg Asp Val Met Leu Glu Asn Tyr Ser Asn Leu Val Ser Val Gly
35 40 45
Gln Gly Glu Thr Thr Lys Pro Asp Val Ile Leu Arg Leu Glu Gln Gly
50 55 60
Lys Glu Pro Trp Leu Glu Glu Glu Glu Val Leu Gly Ser Gly Arg Ala
65 70 75 80
Glu Lys Asn Gly Asp Ile Gly Gly Gln Ile Trp Lys Pro Lys Asp Val
85 90 95
Lys Glu Ser Leu
100
<210> 4
<211> 144
<212> PRT
<213> 智人(Homo sapiens)
<400> 4
Met Phe Ser Gln Glu Glu Arg Met Ala Ala Gly Tyr Leu Pro Arg Trp
1 5 10 15
Ser Gln Glu Leu Val Thr Phe Glu Asp Val Ser Met Asp Phe Ser Gln
20 25 30
Glu Glu Trp Glu Leu Leu Glu Pro Ala Gln Lys Asn Leu Tyr Arg Glu
35 40 45
Val Met Leu Glu Asn Tyr Arg Asn Val Val Ser Leu Glu Ala Leu Lys
50 55 60
Asn Gln Cys Thr Asp Val Gly Ile Lys Glu Gly Pro Leu Ser Pro Ala
65 70 75 80
Gln Thr Ser Gln Val Thr Ser Leu Ser Ser Trp Thr Gly Tyr Leu Leu
85 90 95
Phe Gln Pro Val Ala Ser Ser His Leu Glu Gln Arg Glu Ala Leu Trp
100 105 110
Ile Glu Glu Lys Gly Thr Pro Gln Ala Ser Cys Ser Asp Trp Met Thr
115 120 125
Val Leu Arg Asn Gln Asp Ser Thr Tyr Lys Lys Val Ala Leu Gln Glu
130 135 140
<210> 5
<211> 105
<212> PRT
<213> 智人(Homo sapiens)
<400> 5
Met Ala Ala Ala Val Leu Thr Asp Arg Ala Gln Val Ser Val Thr Phe
1 5 10 15
Asp Asp Val Ala Val Thr Phe Thr Lys Glu Glu Trp Gly Gln Leu Asp
20 25 30
Leu Ala Gln Arg Thr Leu Tyr Gln Glu Val Met Leu Glu Asn Cys Gly
35 40 45
Leu Leu Val Ser Leu Gly Cys Pro Val Pro Lys Ala Glu Leu Ile Cys
50 55 60
His Leu Glu His Gly Gln Glu Pro Trp Thr Arg Lys Glu Asp Leu Ser
65 70 75 80
Gln Asp Thr Cys Pro Gly Asp Lys Gly Lys Pro Lys Thr Thr Glu Pro
85 90 95
Thr Thr Cys Glu Pro Ala Leu Ser Glu
100 105
<210> 6
<211> 92
<212> PRT
<213> 智人(Homo sapiens)
<400> 6
Met Ala Phe Glu Asp Val Ala Val Tyr Phe Ser Gln Glu Glu Trp Gly
1 5 10 15
Leu Leu Asp Thr Ala Gln Arg Ala Leu Tyr Arg Arg Val Met Leu Asp
20 25 30
Asn Phe Ala Leu Val Ala Ser Leu Gly Leu Ser Thr Ser Arg Pro Arg
35 40 45
Val Val Ile Gln Leu Glu Arg Gly Glu Glu Pro Trp Val Pro Ser Gly
50 55 60
Thr Asp Thr Thr Leu Ser Arg Thr Thr Tyr Arg Arg Arg Asn Pro Gly
65 70 75 80
Ser Trp Ser Leu Thr Glu Asp Arg Asp Val Ser Gly
85 90
<210> 7
<211> 127
<212> PRT
<213> 智人(Homo sapiens)
<400> 7
Met His Phe Arg Arg Pro Asp Pro Cys Arg Glu Pro Leu Ala Ser Pro
1 5 10 15
Ile Gln Asp Ser Val Ala Phe Glu Asp Val Ala Val Asn Phe Thr Gln
20 25 30
Glu Glu Trp Ala Leu Leu Asp Ser Ser Gln Lys Asn Leu Tyr Arg Glu
35 40 45
Val Met Gln Glu Thr Cys Arg Asn Leu Ala Ser Val Gly Ser Gln Trp
50 55 60
Lys Asp Gln Asn Ile Glu Asp His Phe Glu Lys Pro Gly Lys Asp Ile
65 70 75 80
Arg Asn His Ile Val Gln Arg Leu Cys Glu Ser Lys Glu Asp Gly Gln
85 90 95
Tyr Gly Glu Val Val Ser Gln Ile Pro Asn Leu Asp Leu Asn Glu Asn
100 105 110
Ile Ser Thr Gly Leu Lys Pro Cys Glu Cys Ser Ile Cys Gly Lys
115 120 125
<210> 8
<211> 105
<212> PRT
<213> 智人(Homo sapiens)
<400> 8
Met Ala Ala Gly Gln Arg Glu Ala Arg Pro Gln Val Ser Leu Thr Phe
1 5 10 15
Glu Asp Val Ala Val Leu Phe Thr Arg Asp Glu Trp Arg Lys Leu Ala
20 25 30
Pro Ser Gln Arg Asn Leu Tyr Arg Asp Val Met Leu Glu Asn Tyr Arg
35 40 45
Asn Leu Val Ser Leu Gly Leu Pro Phe Thr Lys Pro Lys Val Ile Ser
50 55 60
Leu Leu Gln Gln Gly Glu Asp Pro Trp Glu Val Glu Lys Asp Gly Ser
65 70 75 80
Gly Val Ser Ser Leu Gly Ser Lys Ser Ser His Lys Thr Thr Lys Ser
85 90 95
Thr Gln Thr Gln Asp Ser Ser Phe Gln
100 105
<210> 9
<211> 97
<212> PRT
<213> 智人(Homo sapiens)
<400> 9
Met Ala Leu Arg Ser Val Met Phe Ser Asp Val Ser Ile Asp Phe Ser
1 5 10 15
Pro Glu Glu Trp Glu Tyr Leu Asp Leu Glu Gln Lys Asp Leu Tyr Arg
20 25 30
Asp Val Met Leu Glu Asn Tyr Ser Asn Leu Val Ser Leu Gly Cys Phe
35 40 45
Ile Ser Lys Pro Asp Val Ile Ser Ser Leu Glu Gln Gly Lys Glu Pro
50 55 60
Trp Lys Val Val Arg Lys Gly Arg Arg Gln Tyr Pro Asp Leu Glu Thr
65 70 75 80
Lys Tyr Glu Thr Lys Lys Leu Ser Leu Glu Asn Asp Ile Tyr Glu Ile
85 90 95
Asn
<210> 10
<211> 107
<212> PRT
<213> 智人(Homo sapiens)
<400> 10
Met Ala Gln Glu Ser Val Met Phe Ser Asp Val Ser Val Asp Phe Ser
1 5 10 15
Gln Glu Glu Trp Glu Cys Leu Asn Asp Asp Gln Arg Asp Leu Tyr Arg
20 25 30
Asp Val Met Leu Glu Asn Tyr Ser Asn Leu Val Ser Met Gly His Ser
35 40 45
Ile Ser Lys Pro Asn Val Ile Ser Tyr Leu Glu Gln Gly Lys Glu Pro
50 55 60
Trp Leu Ala Asp Arg Glu Leu Thr Arg Gly Gln Trp Pro Val Leu Glu
65 70 75 80
Ser Arg Cys Glu Thr Lys Lys Leu Phe Leu Lys Lys Glu Ile Tyr Glu
85 90 95
Ile Glu Ser Thr Gln Trp Glu Ile Met Glu Lys
100 105
<210> 11
<211> 86
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<400> 11
gtttcagagc tatgctggaa acagcatagc aagttgaaat aaggctagtc cgttatcaac 60
ttgaaaaagt ggcaccgagt cggtgc 86
<210> 12
<211> 76
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<400> 12
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60
ggcaccgagt cggtgc 76
<210> 13
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<400> 13
gtttcagagc tacagcagaa atgctgtagc aagttgaaat 40
<210> 14
<211> 1550
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<220>
<221> MISC_FEATURE
<222> (1)..(8)
<223> 侧翼
<220>
<221> MISC_FEATURE
<222> (9)..(108)
<223> ZIM3-KRAB
<220>
<221> MISC_FEATURE
<222> (109)..(117)
<223> 侧翼
<220>
<221> MISC_FEATURE
<222> (149)..(1516)
<223> dCas9
<220>
<221> MISC_FEATURE
<222> (1518)..(1526)
<223> HA
<220>
<221> MISC_FEATURE
<222> (1533)..(1539)
<223> NLS
<220>
<221> MISC_FEATURE
<222> (1542)..(1548)
<223> NLS
<400> 14
Thr Ser Leu Tyr Lys Lys Val Gly Met Asn Asn Ser Gln Gly Arg Val
1 5 10 15
Thr Phe Glu Asp Val Thr Val Asn Phe Thr Gln Gly Glu Trp Gln Arg
20 25 30
Leu Asn Pro Glu Gln Arg Asn Leu Tyr Arg Asp Val Met Leu Glu Asn
35 40 45
Tyr Ser Asn Leu Val Ser Val Gly Gln Gly Glu Thr Thr Lys Pro Asp
50 55 60
Val Ile Leu Arg Leu Glu Gln Gly Lys Glu Pro Trp Leu Glu Glu Glu
65 70 75 80
Glu Val Leu Gly Ser Gly Arg Ala Glu Lys Asn Gly Asp Ile Gly Gly
85 90 95
Gln Ile Trp Lys Pro Lys Asp Val Lys Glu Ser Leu Tyr Pro Thr Phe
100 105 110
Leu Tyr Lys Val Val Gly Gly Ser Gly Gly Ser Pro Lys Lys Lys Arg
115 120 125
Lys Val Gly Arg Val Cys Arg Ile Ser Ser Leu Arg Tyr Arg Gly Pro
130 135 140
Gly Ile Ala Thr Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly
145 150 155 160
Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro
165 170 175
Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys
180 185 190
Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu
195 200 205
Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys
210 215 220
Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys
225 230 235 240
Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu
245 250 255
Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp
260 265 270
Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys
275 280 285
Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu
290 295 300
Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly
305 310 315 320
Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu
325 330 335
Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser
340 345 350
Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg
355 360 365
Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly
370 375 380
Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe
385 390 395 400
Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys
405 410 415
Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp
420 425 430
Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile
435 440 445
Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro
450 455 460
Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu
465 470 475 480
Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys
485 490 495
Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
500 505 510
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu
515 520 525
Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu
530 535 540
Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His
545 550 555 560
Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp
565 570 575
Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu
580 585 590
Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser
595 600 605
Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp
610 615 620
Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile
625 630 635 640
Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu
645 650 655
Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu
660 665 670
Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu
675 680 685
Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn
690 695 700
Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile
705 710 715 720
Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn
725 730 735
Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
740 745 750
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val
755 760 765
Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu
770 775 780
Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys
785 790 795 800
Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn
805 810 815
Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys
820 825 830
Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp
835 840 845
Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln
850 855 860
Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
865 870 875 880
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
885 890 895
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala
900 905 910
Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg
915 920 925
Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu
930 935 940
Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr
945 950 955 960
Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu
965 970 975
Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln
980 985 990
Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser
995 1000 1005
Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val
1010 1015 1020
Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys
1025 1030 1035
Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
1040 1045 1050
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln
1055 1060 1065
Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu
1070 1075 1080
Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile
1085 1090 1095
Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp
1100 1105 1110
Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn
1115 1120 1125
Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr
1130 1135 1140
Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr
1145 1150 1155
Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser
1160 1165 1170
Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser
1175 1180 1185
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly
1190 1195 1200
Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly
1205 1210 1215
Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys
1220 1225 1230
Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val
1235 1240 1245
Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn
1250 1255 1260
Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys
1265 1270 1275
Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val
1280 1285 1290
Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val
1295 1300 1305
Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu
1310 1315 1320
Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val
1325 1330 1335
Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu
1340 1345 1350
Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu
1355 1360 1365
Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe
1370 1375 1380
Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu
1385 1390 1395
Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr
1400 1405 1410
Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1415 1420 1425
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn
1430 1435 1440
Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile
1445 1450 1455
His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys
1460 1465 1470
Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys
1475 1480 1485
Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu
1490 1495 1500
Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ala Tyr
1505 1510 1515
Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Gly Ser Gly Ser Pro
1520 1525 1530
Lys Lys Lys Arg Lys Val Glu Asp Pro Lys Lys Lys Arg Lys Val
1535 1540 1545
Asp Gly
1550
<210> 15
<211> 554
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<220>
<221> misc_feature
<222> (531)..(554)
<223> 侧翼
<220>
<221> misc_feature
<223> CMV 启动子+增强子
<400> 15
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 60
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 120
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 180
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 240
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 300
catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 360
atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 420
ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 480
acggtgggag gtctatataa gcagagctct ctggctaact gtcgggatca acaagtttgt 540
acaaaaaagt tggc 554
<210> 16
<211> 321
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<220>
<221> MISC_FEATURE
<222> (1)..(8)
<223> 侧翼
<220>
<221> MISC_FEATURE
<222> (9)..(108)
<223> ZIM3-KRAB
<220>
<221> MISC_FEATURE
<222> (109)..(117)
<223> 侧翼
<220>
<221> MISC_FEATURE
<222> (140)..(321)
<223> PYL1
<400> 16
Thr Ser Leu Tyr Lys Lys Val Gly Met Asn Asn Ser Gln Gly Arg Val
1 5 10 15
Thr Phe Glu Asp Val Thr Val Asn Phe Thr Gln Gly Glu Trp Gln Arg
20 25 30
Leu Asn Pro Glu Gln Arg Asn Leu Tyr Arg Asp Val Met Leu Glu Asn
35 40 45
Tyr Ser Asn Leu Val Ser Val Gly Gln Gly Glu Thr Thr Lys Pro Asp
50 55 60
Val Ile Leu Arg Leu Glu Gln Gly Lys Glu Pro Trp Leu Glu Glu Glu
65 70 75 80
Glu Val Leu Gly Ser Gly Arg Ala Glu Lys Asn Gly Asp Ile Gly Gly
85 90 95
Gln Ile Trp Lys Pro Lys Asp Val Lys Glu Ser Leu Tyr Pro Thr Phe
100 105 110
Leu Tyr Lys Val Val Asp Ile Gln His Ser Gly Gly Arg Ser Ser Gly
115 120 125
Ser Gly Ser Thr Ser Gly Ser Gly Lys Thr Gly Gly Gly Gly Ala Pro
130 135 140
Thr Gln Asp Glu Phe Thr Gln Leu Ser Gln Ser Ile Ala Glu Phe His
145 150 155 160
Thr Tyr Gln Leu Gly Asn Gly Arg Cys Ser Ser Leu Leu Ala Gln Arg
165 170 175
Ile His Ala Pro Pro Glu Thr Val Trp Ser Val Val Arg Arg Phe Asp
180 185 190
Arg Pro Gln Ile Tyr Lys His Phe Ile Lys Ser Cys Asn Val Ser Glu
195 200 205
Asp Phe Glu Met Arg Val Gly Cys Thr Arg Asp Val Asn Val Ile Ser
210 215 220
Gly Leu Pro Ala Asn Thr Ser Arg Glu Arg Leu Asp Leu Leu Asp Asp
225 230 235 240
Asp Arg Arg Val Thr Gly Phe Ser Ile Thr Gly Gly Glu His Arg Leu
245 250 255
Arg Asn Tyr Lys Ser Val Thr Thr Val His Arg Phe Glu Lys Glu Glu
260 265 270
Glu Glu Glu Arg Ile Trp Thr Val Val Leu Glu Ser Tyr Val Val Asp
275 280 285
Val Pro Glu Gly Asn Ser Glu Glu Asp Thr Arg Leu Phe Ala Asp Thr
290 295 300
Val Ile Arg Leu Asn Leu Gln Lys Leu Ala Ser Ile Thr Glu Ala Met
305 310 315 320
Asn
<210> 17
<211> 1749
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<220>
<221> MISC_FEATURE
<222> (1)..(1368)
<223> dCas9
<220>
<221> MISC_FEATURE
<222> (1370)..(1378)
<223> HA
<220>
<221> MISC_FEATURE
<222> (1385)..(1391)
<223> NLS
<220>
<221> MISC_FEATURE
<222> (1394)..(1400)
<223> NLS
<220>
<221> MISC_FEATURE
<222> (1414)..(1648)
<223> mCherry
<220>
<221> MISC_FEATURE
<222> (1654)..(1749)
<223> ZIM3-KRAB
<400> 17
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Gly Ser Gly
1370 1375 1380
Ser Pro Lys Lys Lys Arg Lys Val Glu Asp Pro Lys Lys Lys Arg
1385 1390 1395
Lys Val Asp Gly Ile Gly Ser Gly Ser Asn Gly Ser Ser Gly Ser
1400 1405 1410
Met Val Ser Lys Gly Glu Glu Asp Asn Met Ala Ile Ile Lys Glu
1415 1420 1425
Phe Met Arg Phe Lys Val His Met Glu Gly Ser Val Asn Gly His
1430 1435 1440
Glu Phe Glu Ile Glu Gly Glu Gly Glu Gly Arg Pro Tyr Glu Gly
1445 1450 1455
Thr Gln Thr Ala Lys Leu Lys Val Thr Lys Gly Gly Pro Leu Pro
1460 1465 1470
Phe Ala Trp Asp Ile Leu Ser Pro Gln Phe Met Tyr Gly Ser Lys
1475 1480 1485
Ala Tyr Val Lys His Pro Ala Asp Ile Pro Asp Tyr Leu Lys Leu
1490 1495 1500
Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg Val Met Asn Phe Glu
1505 1510 1515
Asp Gly Gly Val Val Thr Val Thr Gln Asp Ser Ser Leu Gln Asp
1520 1525 1530
Gly Glu Phe Ile Tyr Lys Val Lys Leu Arg Gly Thr Asn Phe Pro
1535 1540 1545
Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly Trp Glu Ala
1550 1555 1560
Ser Ser Glu Arg Met Tyr Pro Glu Asp Gly Ala Leu Lys Gly Glu
1565 1570 1575
Ile Lys Gln Arg Leu Lys Leu Lys Asp Gly Gly His Tyr Asp Ala
1580 1585 1590
Glu Val Lys Thr Thr Tyr Lys Ala Lys Lys Pro Val Gln Leu Pro
1595 1600 1605
Gly Ala Tyr Asn Val Asn Ile Lys Leu Asp Ile Thr Ser His Asn
1610 1615 1620
Glu Asp Tyr Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly Arg
1625 1630 1635
His Ser Thr Gly Gly Met Asp Glu Leu Tyr Gly Gly Gly Gly Gly
1640 1645 1650
Met Gly Arg Val Thr Phe Glu Asp Val Thr Val Asn Phe Thr Gln
1655 1660 1665
Gly Glu Trp Gln Arg Leu Asn Pro Glu Gln Arg Asn Leu Tyr Arg
1670 1675 1680
Asp Val Met Leu Glu Asn Tyr Ser Asn Leu Val Ser Val Gly Gln
1685 1690 1695
Gly Glu Thr Thr Lys Pro Asp Val Ile Leu Arg Leu Glu Gln Gly
1700 1705 1710
Lys Glu Pro Trp Leu Glu Glu Glu Glu Val Leu Gly Ser Gly Arg
1715 1720 1725
Ala Glu Lys Asn Gly Asp Ile Gly Gly Gln Ile Trp Lys Pro Lys
1730 1735 1740
Asp Val Lys Glu Ser Leu
1745
<210> 18
<211> 95
<212> PRT
<213> 智人(Homo sapiens)
<400> 18
Met Ala Gly Ser Gln Phe Pro Asp Phe Lys His Leu Gly Thr Phe Leu
1 5 10 15
Val Phe Glu Glu Leu Val Thr Phe Glu Asp Val Leu Val Asp Phe Ser
20 25 30
Pro Glu Glu Leu Ser Ser Leu Ser Ala Ala Gln Arg Asn Leu Tyr Arg
35 40 45
Glu Val Met Leu Glu Asn Tyr Arg Asn Leu Val Ser Leu Gly His Gln
50 55 60
Phe Ser Lys Pro Asp Ile Ile Ser Arg Leu Glu Glu Glu Glu Ser Tyr
65 70 75 80
Ala Met Glu Thr Asp Ser Arg His Thr Val Ile Cys Gln Gly Glu
85 90 95

Claims (21)

1.一种异源转录阻遏物,其包含:
DNA靶向结构域,任选地CRISPR-Cas蛋白,优选无酶活性的CRISPR-CAS 9蛋白、锌指结构域、tet-阻遏物或TALE;和至少一个选自由ZIM3-KRAB、ZIM2-KRAB、ZNF554-KRAB、ZNF264-KRAB、ZNF324-KRAB、ZNF354A-KRAB、ZFP82-KRAB和ZNF669-KRAB组成的组的KRAB结构域。
2.如权利要求1所述的转录阻遏物,其进一步包含至少一种相互作用组分。
3.如权利要求1或权利要求2所述的转录阻遏物,其中所述DNA靶向结构域和KRAB结构域是单一多肽的结构域。
4.如权利要求2所述的转录阻遏物,其包含:
含有所述DNA靶向结构域和第一相互作用组分的第一多肽,和
含有KRAB结构域和第二相互作用组分的第二多肽,
其中所述第一和第二相互作用组分在合适的条件下相互作用。
5.如权利要求4所述的转录阻遏物,其中所述第一和第二相互作用组分形成在诱导条件下相互作用的诱导型异源二聚体对,任选地ABI1和PYL1。
6.如权利要求1至5中任一项所述的转录阻遏物,其中所述DNA靶向结构域是无酶活性的CRISPR-Cas蛋白,任选地为dCas9或dCas12a。
7.如权利要求1至6中任一项所述的转录阻遏物,其中至少一个KRAB结构域选自SEQ IDNO:4-10或19的KRAB结构域中的任一者,任选地ZIM3-KRAB。
8.如权利要求1至7中任一项所述的转录阻遏物,其进一步包含一种或多种细胞核定位信号(NLS),任选地SV40 NLS。
9.如权利要求1至8中任一项所述的转录阻遏物,其中所述转录阻遏物具有SEQ ID NO:14、16或17的氨基酸序列,或所述DNA靶向结构域及其KRAB结构域部分的至少80%、85%、90%、95%或99%。
10.一种分离的核酸,其编码权利要求1至9中任一项所述的转录阻遏物。
11.一种表达构建体,其包含可操作地连接至一种或多种启动子和一个或多个转录终止位点的权利要求10所述的核酸。
12.一种载体,其包含权利要求10所述的核酸或权利要求11所述的表达构建体,任选地其中所述载体是腺病毒或慢病毒载体。
13.一种细胞,其包含权利要求1至9中任一项所述的转录阻遏物、权利要求10所述的核酸、权利要求1所述的表达构建体或权利要求12所述的载体。
14.一种转录阻遏系统,其包含:
a)权利要求1至9中任一项所述的异源转录阻遏物、权利要求10所述的核酸、权利要求11所述的表达构建体、权利要求12所述的载体或权利要求13所述的细胞,其中所述DNA靶向结构域包含CRISPR-Cas蛋白;和任选的
b)至少一种gRNA和/或至少一种诱导剂。
15.如权利要求14所述的转录阻遏系统,其中所述至少一种gRNA靶向基因的调控元件,任选地所述调控元件是启动子区、增强子区或远端调控位点。
16.一种阻遏细胞中靶基因的转录的方法,所述方法包括:
a)将权利要求1-9中任一项所述的转录阻遏物、权利要求10所述的核酸、权利要求11所述的表达构建体或权利要求12所述的载体引入到所述细胞中;以及
b)在合适的条件下培养所述细胞,以使得至少一个KRAB结构域阻遏所述靶基因的转录。
17.如权利要求16所述的方法,其中所述DNA靶向结构域包含CRISPR-Cas蛋白,所述方法进一步包括将至少一种gRNA引入到所述细胞中,以及在合适的条件下培养所述细胞,以使得所述至少一种gRNA与所述CRISPR-Cas蛋白缔合从而将所述转录阻遏物引导至CRISPR靶位点。
18.一种筛选方法,所述方法包括:
a)将权利要求1至9中任一项所述的转录阻遏物、权利要求10所述的核酸、权利要求11所述的表达构建体或权利要求12所述的载体引入到多个细胞中,其中所述DNA靶向结构域包含CRISPR-Cas蛋白和多种gRNA;或者将多种gRNA引入到根据权利要求13所述的细胞群中,其中所述DNA靶向结构域包含CRISPR-Cas蛋白;
b)培养所述多个细胞以使得一种或多种gRNA与所述CRISPR-Cas蛋白缔合并且将所述转录阻遏物引导至CRISPR靶位点,以使得所述至少一个KRAB结构域阻遏靶基因的转录;
c)任选地用一定量的测试药物或毒素进行处理;
d)任选地培养所述多个细胞一段时间以允许gRNA丢失或富集;以及
e)收集所述多个细胞或其子集。
19.如权利要求18所述的方法,其中所述方法进一步包括鉴定在所述多个细胞或其子集中过度表现或表达不足的一种或多种gRNA。
20.一种组合物,其包含权利要求1至9中任一项所述的转录阻遏物、权利要求10所述的核酸、权利要求11所述的表达构建体、权利要求12所述的载体或权利要求13所述的细胞。
21.一种试剂盒,其包括小瓶和权利要求1至9中任一项所述的异源转录阻遏物,权利要求10所述的核酸,权利要求11所述的表达构建体,权利要求12所述的载体,权利要求13所述的细胞或权利要求20所述的组合物和任选的以下中的一者或多者:诱导剂、gRNA或gRNA表达构建体。
CN202180053675.0A 2020-08-14 2021-08-14 Krab融合阻遏物以及用于阻遏基因表达的方法和组合物 Pending CN116209674A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063065953P 2020-08-14 2020-08-14
US63/065,953 2020-08-14
PCT/CA2021/051121 WO2022032397A1 (en) 2020-08-14 2021-08-14 Krab fusion repressors and methods and compositions for repressing gene expression

Publications (1)

Publication Number Publication Date
CN116209674A true CN116209674A (zh) 2023-06-02

Family

ID=80246872

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180053675.0A Pending CN116209674A (zh) 2020-08-14 2021-08-14 Krab融合阻遏物以及用于阻遏基因表达的方法和组合物

Country Status (8)

Country Link
US (1) US20230287391A1 (zh)
EP (1) EP4196505A1 (zh)
JP (1) JP2023537158A (zh)
KR (1) KR20230045612A (zh)
CN (1) CN116209674A (zh)
AU (1) AU2021325586A1 (zh)
CA (1) CA3189185A1 (zh)
WO (1) WO2022032397A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117143257A (zh) * 2023-10-31 2023-12-01 深圳市帝迈生物技术有限公司 Trim28-krab-znf10二元复合物、制备方法及用于前列腺癌筛查的试剂盒

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023200998A2 (en) * 2022-04-13 2023-10-19 Duke University Effector domains for crispr-cas systems
WO2023250130A2 (en) * 2022-06-24 2023-12-28 The Regents Of The University Of California Compositions and methods involving adgrg6

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4010004A4 (en) * 2019-08-07 2023-09-13 Altius Institute For Biomedical Sciences COMPOSITIONS AND METHODS OF GENE EXPRESSION MODULATION

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117143257A (zh) * 2023-10-31 2023-12-01 深圳市帝迈生物技术有限公司 Trim28-krab-znf10二元复合物、制备方法及用于前列腺癌筛查的试剂盒
CN117143257B (zh) * 2023-10-31 2024-02-09 深圳市帝迈生物技术有限公司 Trim28-krab-znf10二元复合物、制备方法及用于前列腺癌筛查的试剂盒

Also Published As

Publication number Publication date
KR20230045612A (ko) 2023-04-04
WO2022032397A1 (en) 2022-02-17
CA3189185A1 (en) 2022-02-17
JP2023537158A (ja) 2023-08-30
EP4196505A1 (en) 2023-06-21
US20230287391A1 (en) 2023-09-14
AU2021325586A1 (en) 2023-03-23

Similar Documents

Publication Publication Date Title
Sourisseau et al. Regulation of PCNA and cyclin D1 expression and epithelial morphogenesis by the ZO-1-regulated transcription factor ZONAB/DbpA
CN116209674A (zh) Krab融合阻遏物以及用于阻遏基因表达的方法和组合物
Sieweke et al. MafB is an interaction partner and repressor of Ets-1 that inhibits erythroid differentiation
Kitchen et al. Sumoylation modulates a domain in CTCF that activates transcription and decondenses chromatin
CA2336707A1 (en) Xiap ires and uses thereof
Katsuoka et al. Direct and specific functional evaluation of the Nrf2 and MafG heterodimer by introducing a tethered dimer into small Maf-deficient cells
CN108949794B (zh) 一种tale表达载体及其快速构建方法和应用
Tarapore et al. DNA binding and transcriptional activation by the Ski oncoprotein mediated by interaction with NFI
Wang et al. Metal-responsive transcription factor-1 (MTF-1) selects different types of metal response elements at low vs. high zinc concentration
Tan et al. Functional dissection of transcription factor ZBRK1 reveals zinc fingers with dual roles in DNA-binding and BRCA1-dependent transcriptional repression
RU2739593C2 (ru) Система презентации пептидов на клеточной поверхности
US20100055701A1 (en) Fusion proteins for imaging the nucleus and chromosomes of live cells
CN110218732B (zh) 一种非洲猪瘟病毒串联基因、共表达载体、构建方法及应用
Brodu et al. Dual requirement for the EcR/USP nuclear receptor and the dGATAb factor in an ecdysone response in Drosophila melanogaster
CN109055375B (zh) 一种crispr辅助反式增强子激活基因表达的方法及其应用
Dyer et al. The HMG domain protein SSRP1/PREIIBF is involved in activation of the human embryonic β-like globin gene
CN106591366A (zh) 一种快速筛选sgRNA的基因敲除试剂盒及方法
Fatima et al. Interactome of the inhibitory isoform of the nuclear transporter Importin 13
Zhao et al. Induction of G1 cell cycle arrest and P15INK4b expression by ECRG1 through interaction with Miz‐1
JP6141327B2 (ja) タンパク質存在量の測定による細胞内結合事象の検出
CN117321209A (zh) 用于蛋白质表达的系统和方法
Shimoyama et al. Synergistic action of MLL, a TRX protein with template activating factor-I, a histone chaperone
CN110117818A (zh) 检测单基因突变的crispr高通量生物芯片
US20030148521A1 (en) Conditionally replicative and conditionally active viruses
CN103409464A (zh) 一种pCMV-RBE-TK1-N2-EF1α-hFIXml质粒及其构建方法和应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination