CN109055375B - 一种crispr辅助反式增强子激活基因表达的方法及其应用 - Google Patents

一种crispr辅助反式增强子激活基因表达的方法及其应用 Download PDF

Info

Publication number
CN109055375B
CN109055375B CN201810835298.6A CN201810835298A CN109055375B CN 109055375 B CN109055375 B CN 109055375B CN 201810835298 A CN201810835298 A CN 201810835298A CN 109055375 B CN109055375 B CN 109055375B
Authority
CN
China
Prior art keywords
artificial sequence
enhancer
dna
trans
dcas9
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810835298.6A
Other languages
English (en)
Other versions
CN109055375A (zh
Inventor
王进科
徐新慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN201810835298.6A priority Critical patent/CN109055375B/zh
Publication of CN109055375A publication Critical patent/CN109055375A/zh
Application granted granted Critical
Publication of CN109055375B publication Critical patent/CN109055375B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription

Abstract

本发明公开了一种CRISPR辅助反式增强子激活基因表达的方法,其特征在于,通过CRISPR系统将增强子DNA反式募集到靶基因上,依靠反式增强子DNA本身以及反式增强子DNA与CRISPR系统的互作,激活靶基因表达。本发明通过对常规引导RNA(sgRNA)的改造发展了一种捕获sgRNA(csgRNA);借助dCas9‑AD/csgRNA复合物中csgRNA与带单链突出巨细胞病毒(CMV)增强子DNA的杂交,将CMV增强子反式募集到靶基因上,高效激活靶基因的表达。该方法在生物医学中具有广泛应用价值,可以应用在制备生物检测及治疗试剂中。

Description

一种CRISPR辅助反式增强子激活基因表达的方法及其应用
技术领域
本发明属于生物医学技术领域,具体涉及一种CRISPR辅助的反式增强子激活基因表达的方法及其应用。
背景技术
人工激活基因的表达在基础生物学研究和生物医学应用中具有重要作用。例如,基因的功能往往是通过在基础研究中人工激活其在细胞或体内的表达来探索的。在生物医学中,通常需要通过激活内源基因将细胞重编程为诱导干(iPS) 细胞或其他分化细胞。在医学上,癌症可以通过抑制各种激酶,激活增强免疫力,细胞凋亡和分化的相关基因来治疗。因此,各种人工基因激活剂已经被开发。例如,激活域融合锌指(ZF),转录激活物样效应因子(TALE)和成簇规则间隔短回文重复序列(CRISPR)相关蛋白已经开发用于基因激活。在这些蛋白质和复合物中,CRISPR相关(Cas)蛋白因其简单性而被广泛使用。
CRISPR最初是一种细菌免疫系统,通过酶消化侵入的噬菌体DNA。该系统已经发展成为高效的基因编辑工具。此外,该系统也被开发成为一种新型的基因调控工具。例如,灭活的Cas9(dCas9)及其相关的单链向导RNA(sgRNA) 在近年来被最广泛地用于调节基因表达。所以,dCas9和sgRNA已被广泛用于激活或抑制基因表达。例如,dCas9蛋白与各种基因激活或阻遏结构域如VP48, VP160,VP64,VPR(VP64-p65-Rta)和KRAB融合。此外,dCas9蛋白还与具有转录调控功能的其他功能域融合,如p300,LSD1,Dnmt3a和Tet1。基于这些结构域,已经开发出更多精心设计的活化剂用于更有效地激活哺乳动物细胞中的靶基因,如SunTag(dcas9-GCN4/sgRNA加scFV-VP64)和SPH (dCas9-GCN4/sgRNA加scFV-p65-HSF1)。更复杂的一些诱导型dCas9系统已经开发用于控制细胞中dCas9激活剂的活性,例如光激活的CRISPR/Cas9效应因子,混合药物诱导型CRISPR/Cas9技术(HIT)和通过基于人抗体的化学诱导二聚体(AbCID)门控的CRISPR活化剂。 这些典型的dCas9融合蛋白在其体内应用受到限制使 它们很难被腺相关病毒(AAV)包装,AAV是一种最适合非整合型基因治疗载体的类型,但是其包装能力有限。
除了设计dCas9之外,sgRNA还被设计用于开发新的基于dCas9的激活剂。与dCas9工程相比,sgRNA可以被更加简单,灵活且高效地重新设计。此外,由于其有限的病毒包装长度,工程化的sgRNA更有助于基于dCas9的活化剂在体内的应用。最广泛使用的工程化sgRNA是在3'末端与s2环(sgRNA-MS适体) 融合的sgRNA,可以与转录激活结构域VP64-HSF1融合的二聚化MS2噬菌体外壳蛋白结合(MS2-VP64-HSF1,MPH)。该系统现在被称为协同活化介质(SAM) 系统。类似地,另一种基于sgRNA的dCas9激活剂被开发,命名为Casilio系统,由dCas9蛋白组成,sCRNA附加有RNA结合蛋白Pumilio/FBF(PUF)的一个或多个结合位点(sgRNA-PBS)以及与PUF结构域(PUF融合体)融合的效应子(例如VP64和p65-HSF1)。以相同的方式,通过延伸sgRNA构建模块化支架RNA编码目标基因座和调节作用,包括效应子蛋白募集位点。对于这些募集 RNA模块,充分表征的病毒RNA序列MS2,PP7和com分别由MCP,PCP和 Com RNA结合蛋白识别。转录激活结构域VP64与每种相应的RNA结合蛋白融合。通过延伸sgRNA包括识别特定信号的修饰的核糖开关,创建了基于 CRISPR-Cas9的“信号导体”,调节内源基因的转录对应感兴趣的外源或内源信号 (比如药物)。显然,这些嵌合sgRNA受其长的复合RNA适体和同源RNA结合融合蛋白的限制。
尽管已经开发了基于变体dCas9的激活剂,但目前基于dCas9的转录激活剂在内源性基因激活和重编程方面仍然是低效的。通过系统地比较它们在不同细胞类型和物种(人,小鼠,和果蝇),发现与dCas9-VP64相比,大多数第二代活化剂显示出显著的活化水平,其中三种活化剂包括VPR,SAM和Suntag是最有效的。在各种目标基因和细胞环境中,VPR、SAM和Suntag系统始终优于以前的VP64。此外,就基因表达的倍数增加而言,VPR、SAM和Suntag一般落入彼此的数量级之内。更重要的是,尝试通过融合VPR、SAM和Suntag来构建改进的嵌合活化剂是不成功的。因此,未来通过探索其他独特的结构或新的活化区域来改善基于dCas9的活化剂。
基因激活对基础生物学研究和生物医学至关重要。因此,各种基因激活剂被开发,例如激活域的融合锌指(ZF)、转录激活剂样效应因子(TALE)和成簇规则间隔短回文重复序列(CRISPR)相关蛋白质,其中CRISPR蛋白质灭活Cas9 (dCas9)因其优点而被广泛使用。然而,目前的基因激活剂仍然受到其低效基因活化活性的限制。
大约三十年前,人类巨细胞病毒(CMV)增强子/启动子(以下简称CMV 增强子)被发现是一种具有高转录活性的天然哺乳动物启动子。后来的研究逐渐发现,在各种哺乳动物细胞中,CMV增强子是已知的最强启动子。因此,这种增强子已被广泛用于驱动各种基因在哺乳动物细胞中的异位表达。例如,CMV 增强子也被用于激活转基因动物的广泛组织中的外源基因的异位表达,基因工程产生蛋白质和人类基因治疗。我们最近通过改变该增强子中的天然NF-κB结合位点为人工选择具有高结合亲和力的NF-κB结合序列,来进一步改善CMV增强子的转录活性。
增强子(enhancer)是基因组中的一段DNA序列,距离其所调控的基因位置较远,上面有转录因子的结合靶点。增强子所在的DNA可通过弯曲形成环 (loop)结构使增强子上结合的转录因子与启动上结合的转录机器(由通用转录因子与RNA聚合酶)相互作用,促进基因的表达。由于增强子调控其靶基因是通过DNA 共线性(即在一条DNA链上)实现,因此增强子是典型的顺式(cis) 调控元件。而转录因子等基因表达调控因子是通过与DNA 结合实现其基因表达调控功能,因此转录因子是典型的反式(trans)调控因子。基于增强子对基因表达调控的机理,我们推测如果利用一种DNA结合蛋白将具有强转录激活活性的增强DNA锚定到靶基因启动子区,该种增强子DNA也许像基因组中的天然增强子一样激活基因表达。由于这种形式的增强子不与靶基因DNA共线,而是通过DNA结合蛋白募集到靶基因上,其作用方式类似转录因子的作用方式,因此我们将其称为反式增强子(trans enhancer),以便区分于基因组中的天然顺式增强子(cis enhancer)。
发明内容
发明目的:针对现有技术存在的问题,本发明提供一种CRISPR辅助反式增强子激活基因表达的方法,该方法是一种全新的新方法,即CRISPR辅助反式增强子,通过将dCas9-VP64/sgRNA与广泛使用的强增强子——巨细胞病毒(CMV) 增强子相结合来高效激活基因表达。在该方法中,使用CMV增强子的末端与 sgRNA伸长的3'末端退火,并通过dCas9-VP64/sgRNA以反式形式将CMV增强子DNA招募到靶向基因上。反式增强子如天然环状顺式增强子一样激活基因转录。本发明发现反式增强子可以激活各种细胞中的外源报告基因和各种内源基因,活化效率比目前的dCas9激活剂显著提高,反式增强子激活转录因子HNF4α和E47的表达,诱导肝癌细胞和胰腺癌细胞的显著分化。
本发明还提供了一种CRISPR辅助反式增强子激活基因表达的方法的应用。
技术方案:为了实现上述目的,如本发明所述一种CRISPR辅助反式增强子激活基因表达的方法,通过CRISPR系统将增强子DNA反式募集到靶基因上,依靠反式增强子DNA本身以及反式增强子DNA与CRISPR系统的互作,激活靶基因表达。
其中,所述CRISPR系统指CRISPR蛋白与其引导RNA(sgRNA)形成的可与靶DNA序列结合的复合物。
作为优选,所述与靶DNA序列结合的复合物为死亡Cas9(dCas9)蛋白与其sgRNA结合形成的复合物dCas9/sgRNA。
其中,所述dCas9包括常规dCas9蛋白以及经过基因融合改造过的dCas9 蛋白。
进一步地,所述经过基因融合改造过的dCas9蛋白为融合各种激活域(AD) 的dCas9蛋白;
其中,激活域包括VP64、VPR等。
其中,所述sgRNA为常规引导RNA(sgRNA)经改造后发展的一种捕获 sgRNA(capture sgRNA,csgRNA);所述csgRNA的3′末端增加了一段序列作为捕获序列,用以捕获增强子DNA。
其中,所述捕获序列为一种经过人工设计,与人全基因组DNA序列同源性极低的序列。
作为优选,所述捕获序列为5′-AATCG GGCCG ACGGC AAACA TACC-3′、 5′-GGAACCTTAC GAATA CCAGA TGCT-3′与5′-ATCTA GTGGA ACCTC AAACA TACC-3′;其中5′-GGAACCTTAC GAATA CCAGA TGCT-3′效果最佳。
其中,捕获序列也可以添加在csgRNA的5′末端。
其中,所述反式增强子DNA是一段末端带有一段单链DNA的双链DNA,该增强子DNA具有激活基因表达的功能。
作为优选,反式增强子DNA为人巨细胞病毒(CMV)增强子。
进一步地,所述反式增强子DNA末端的单链DNA可与csgRNA的3′末端捕获序列退火杂交。
其中,所述CRISPR系统包括CRISPR蛋白表达载体与csgRNA表达载体、 CRISPR蛋白与csgRNA表达载体,或CRISPR蛋白与csgRNA。这些不同类型的分子或其表达产物可与反式增强子DNA经转染进入细胞,激活细胞内靶基因的表达。
本发明所述靶基因包括10个内源基因:HNF4α、E47、Ascl1、Ngn2、Oct4、 Sox2、Nanog、TNFAIP3(A20)、CASP9和CSF3;也可以针对与上述靶基因类似的基因。
本发明所述的CRISPR辅助反式增强子激活基因表达的方法在制备生物检测及治疗试剂中的应用。
在本发明dCas9-sgRNA复合物是目前常用的序列特异性DNA结合蛋白,本发明到运用这种复合物,将强活性CMV增强子DNA片段反式募集到靶基因上,以激活细胞内靶基因的表达,以期获得一种新的基因激活技术,进一步改进与提高基于dCas9-sgRNA复合物的基因表达调控水平。
在本发明中,通过环状结构模拟天然增强子激活基因表达,利用 dCas9/sgRNA与CMV增强子组合来开发了一种新的基于dCas9的激活剂。 sgRNA的3'末端被重新设计以添加与双链CMV增强子的末端互补的短捕获序列。CMV增强子通过dCas9/sgRNA锚定到靶基因的启动子区域。因此, dCas9/sgRNA募集的CMV增强子以反式形式的天然环状顺式增强子起作用。本发明发现新的激活剂可以有效激活6种细胞中的多种基因,包括293T、HepG2、 PANC-1、HeLa、A549和HT29。此外,新的激活剂激活HepG2细胞中的转录因子HNF4α和PANC-1细胞中的E47的表达可导致这些癌细胞的分化。
作为典型的应用,基于dCas9的转录激活因子最近已经被用于通过激活内源基因实现重新编程体外和体内的细胞。例如,可以通过使用dCas9-SunTag-VP64 激活内源性Oct4和Sox2来将成纤维细胞重编程为多能性细胞(iPS细胞)。可以通过使用VP64、dCas9-VP64激活内源性Brn2、Ascl1和Myt11基因将小鼠胚胎成纤维细胞转化为诱导的神经元细胞。在小鼠疾病模型中,MPH可激活体内靶基因以改善I型糖尿病,急性肾损伤和肌营养不良症。SPH可通过激活Ascl1, Neurog2和Neurod1基因使体内的大脑星形胶质细胞直接有效地转化为功能性神经元。这些研究使得CRISPR疗法的水平有所提高。然而,基于dCas9的转录激活因子在内源性基因激活和重编程方面仍然效率低下。
在本发明中开发了一种新的基于dCas9的基因激活系统,通过一个简单的嵌合sgRNA与dCas9结合以及招募反向CMV增强子靶向基因。这项发明揭示,反式增强子由dCas9-VP64/csgRNA和sCMV组成,可以高效激活在各种哺乳动物细胞中的外源和内源基因表达,比目前广泛使用的dCas9-VP64和dCas9-VPR 更有效。因此,本发明开发了一种激活内源基因的反式增强子新策略,这是第一个用反式增强子DNA激活基因表达的报告。这种创造性策略比目前基于dCas9 的基因激活系统具有优势。
在本发明中,只有一种csgRNA总是用于激活各种细胞中的所有靶基因。这与报道的dCas9/sgRNA基因激活系统不同。目前,在各种dCas9/sgRNA系统中,多种sgRNA已经用于几乎所有报道的基因激活。一般来说,三种或更多种sgRNA 经常被用于靶向感兴趣的基因。在许多具有不同数量的sgRNA的对比测定中,一种sgRNA产生非常低或不可检测的表达。与目前的多重sgRNA策略相比,本发明的方法大大简化了sgRNA的选择、设计和制备,毕竟并非所有的基因都适合在其启动子区域设计多个sgRNAs。另外,多个sgRNA的表达是困难的,因为每个sgRNA必须由长的U6启动子独立转录。
可以看出,与目前报道的工程化sgRNA相比,本发明的csgRNA是非常简单的工程化sgRNA。目前的dCas9/sgRNA激活系统通常使用一种长链复合嵌合 sgRNAs,它含有各种RNA结合蛋白的多个串联适体,如SAMsgRNA(MS2), Casilio sgRNA(Pumilio/FBF)和支架RNAMCP,PCP和Com)。本发明提出的 csgRNA指在正常sgRNA末端增加24bp的短序列。应该指出,本发明最初设计的三种带有不同的捕获序列的csgRNAs(csgRNA1、csgRNA2和csgRNA3),实验中发现它们都在反式增强系统中发挥作用,但其中csgRNA2性能最佳。应该指出,捕获序列是人为设计的,因此它们在人类细胞中没有互补序列,这对于它们与sCMV的高效特异性退火很重要。本发明发明还揭示了sCMV可以与人类细胞核中的csgRNA退火。这种相互作用通过dCas9/csgRNA成功地将反式增强子DNA募集到靶基因。显然,这种相互作用比目前sCas9激活系统中使用的RNA 适体和RNA结合蛋白之间的相互作用更简单。这为细胞中的生物分子募集开发了一种新方法,这可能有助于未来的应用。
很明显,反式增强子技术有助于体外应用,例如体外细胞重编程和基因激活发挥功能。然而,不得不说,反式增强子在体内应用方面仍然面临着困难。反式增强子使用线性CMV增强子DNA片段,其具有与csgRNA的3'末端互补的单链突出端。除非将体外预制备的反式增强子与纳米颗粒基因载体一起与 dCas9-VP64和csgRNA的表达载体共转染,否则难以在体内细胞中产生这种反式增强子DNA。然而,目前的反式增强子不能被带入体内细胞,但目前最有效的体内转基因病毒载体如AAV已被FDA批准用于临床应用。应该设想其他新策略来解决反式增强子体内应用的问题。例如,将DNA结合结构域与能够将反式增强子与其结合位点结合的dCas9融合。
在本发明中,选择了由反式增强子激活的10个内源基因,包括HNF4α、E47、 Ascl1、Ngn2、Oct4、Sox2、Nanog、TNFAIP3(A20)、CASP9和CSF3。这些基因不是随机选择的。这些基因大部分是转录因子,包括HNF4α、 E47、 Ascl1、 Ngn2、Sox2、Oct4和Nanog。已报道Ascl1、Ngn2和Sox2的组合被用于将成纤维细胞直接重编程为神经细胞。Oct4、Sox2和Nanog的组合已被广泛用于将成纤维细胞重编程为iPS细胞。HNF4α和E47已被用于将肝癌细胞和胰腺癌细胞分化为正常细胞。TNFAIP3(A20)是一种众所周知的天然NF-κB抑制剂,具有治疗NF-κB-过活化的疾病如炎症和癌症的潜力。Caspase9是造成细胞凋亡的关键基因。CSF3编码粒细胞集落刺激因子(G-CSF),是一种刺激骨髓产生粒细胞和干细胞并将其释放到血液中的糖蛋白,广泛用于化疗以增强癌症患者的免疫力。本发明发现,在所有转染的细胞中,包括HNF4α、E47、Ascl1、Ngn2、TNFAIP3 (A20)和CSF3在内的基因均被反式增强子高度激活。
有益效果:与现有技术相比,本发明具有如下优点:
本发明CRISPR辅助反式增强子激活基因表达的方法开发了一种新的基于 dCas9的基因激活系统,通过一个简单的嵌合sgRNA与dCas9结合以及招募反向CMV增强子靶向基因。本发明发明中反式增强子由dCas9-VP64/csgRNA和 sCMV组成,可以高效激活在各种哺乳动物细胞中的外源和内源基因表达,比目前广泛使用的dCas9-VP64和dCas9-VPR更有效。因此,本发明开发了一种激活内源基因的反式增强子新策略。这是第一个用反式增强子DNA激活基因表达的报告。这种创造性策略比目前基于dCas9的基因激活系统具有优势。
本发明开发了一种CRISPR辅助反式增强子激活基因表达的新方法。该方法通过对常规引导RNA(sgRNA)的改造发展了一种捕获sgRNA(csgRNA),如本发明使用的csgRNA1、csgRNA2和csgRNA3;借助dCas9-AD/csgRNA复合物中csgRNA与带单链突出巨细胞病毒(CMV)增强子DNA的杂交,将CMV增强子反式募集到靶基因上,高效激活靶基因的表达。该方法在生物医学中具有广泛应用价值,可以应用在制备生物检测及治疗试剂中。
附图说明
图1为CRISPR辅助反式增强子激活基因表达的原理示意图;在sgRNA的 3'末端添加捕获序列,用于捕获具有可与sgRNA的捕获序列退火的单链突出端的反式CMV增强子。捕获的反式CMV增强子可以像天然环状顺式增强子一样起作用以激活感兴趣的基因(包括外源和内源基因)的转录;
图2为用于蓝白筛选的sgRNA载体的构建示意图;
图3为Cas9/csgRNA对靶序列切割实验示意图;
图4为在293T细胞中,通过CRISPR辅助反式增强子在HNF4α启动子控制下激活外源报告基因ZsGreen,细胞用各种载体转染,荧光显微镜下拍摄细胞并用流式细胞术鉴定它们的荧光强度的示意图;为了揭示转录激活性能,同时进行不同对照组转染实验;
图5为在HepG2细胞中,通过CRISPR辅助反式增强子在HNF4α启动子的控制下激活外源报告基因ZsGreen,分别用三种转录激活系统(包括 dCas9-VP64/sgRNA,dCas9/csgRNA&sCMV,和dCas9-VP64/csgRNA&sCMV) 连同报告基因载体共转染细胞,荧光显微镜下拍摄细胞,流式细胞术鉴定其荧光强度的示意图,为了揭示转录激活性能,同时进行不同对照组转染实验;
图6为A549细胞中,各种激活剂在HNF4α启动子控制下激活报告基因 ZsGreen,拍摄细胞并通过流式细胞术定量荧光强度的示意图;
图7为HeLa细胞中,各种激活剂在HNF4α启动子控制下激活报告基因ZsGreen,拍摄细胞并通过流式细胞术定量荧光强度的示意图;
图8为SKOV3细胞中,各种激活剂在HNF4α启动子控制下激活报告基因 ZsGreen,拍摄细胞并通过流式细胞术定量荧光强度的示意图;
图9为PANC1细胞中,各种激活剂在HNF4α启动子控制下激活报告基因 ZsGreen,拍摄细胞并通过流式细胞术定量荧光强度的示意图;
图10为HT29细胞中,各种激活剂在HNF4α启动子控制下激活报告基因 ZsGreen,拍摄细胞并通过流式细胞术定量荧光强度的示意图;
图11为在多种细胞中,通过CRISPR辅助反式增强子在HNF4α启动子控制下激活外源报告基因ZsGreen,(a)用三种不同的转录激活系统转染细胞以激活报告基因ZsGreen,用流式细胞术鉴定细胞的荧光的示意图,并显示为平均荧光强度(MFI);(b)反式增强子与VPR的比较,用三种不同的转录激活系统转染细胞以激活报告基因ZsGreen,用流式细胞术鉴定细胞的荧光的示意图,并分析具有特定荧光强度的细胞的百分比,Lipo:lipofection;VP64: dCas9-VP64/csgRNA;dCas9-VPR/csgRNA;VP64-CMV:dCas9-VP64/csgRNA 和sCMV;
图12为CRISPR辅助反式增强子激活内源基因表达,用三种不同的转录激活系统转染七种不同的细胞系以激活10种内源基因的表达的示意图;通过qPCR 检测基因转录,表达水平显示为管家基因β肌动蛋白的相对RNA表达的倍数;
图13为HNF4α激活的HepG2细胞和E47激活的PANC-1细胞中的基因表达和细胞生理表型变化的示意图;(a)HNF4α激活的HepG2细胞中基因表达变化,(b)E47激活的PANC-1细胞中基因表达变化,(c)HNF4α激活的HepG2 细胞和E47激活的PANC-1细胞的细胞周期变化,(d)HNF4α激活的HepG2细胞和E47激活的PANC-1细胞中细胞迁移能力变化;
图14为伤口愈合测定示意图;用dCas9-VP64/csgRNA(VP64)和 dCas9-VP64/csgRNA&sCMV(Trans-CMV)转染细胞以激活HepG2细胞中的内源基因HNF4α和PANC-1细胞中的E47;(a)迁移的HepG2细胞,(b)迁移的 PANC-1细胞;
图15为transwell分析的示意图;用dCas9-VP64/csgRNA(VP64)和 dCas9-VP64/csgRNA&sCMV(Trans-CMV)转染细胞以激活HepG2细胞中的内源基因HNF4α和PANC-1细胞中E47的表达;(a)迁移的HepG2细胞,(b)迁移的PANC-1细胞;
图16为各种系统在293T细胞中激活内源性HNF4α基因的示意图;用各种系统转染293T细胞以激活内源性HNF4α基因,用qPCR检测HNF4α和β肌动蛋白(β-action)基因表达,HNF4α表达水平显示为β肌动蛋白表达水平的倍数。
具体实施方式
以下结合附图和实施例对本发明作进一步说明。
CRISPR辅助反式增强子激活基因表达的原理图解
图1通过CRISPR-辅助反式增强子激活基因表达的原理示意图。通过向正常 sgRNA序列的3'末端添加捕获序列来修饰sgRNA,产生3'末端延伸的sgRNA。由于新设计的sgRNA将用于捕获反式增强子DNA,将其命名为捕获式sgRNA (csgRNA)。相应地,设计具有游离单链3'末端的线性双链CMV增强子序列;将CMV片段命名为粘性CMV(sCMV),可以通过与csgRNA的3'捕获序列末端退火而与csgRNA相互作用。通过这些csgRNA和sCMV设计,当csgRNA将dCas9蛋白引导到位于感兴趣基因的启动子区域中的靶位点时,sCMV将被捕获到与gDNA结合的dCas9/csgRNA。这个相互作用过程将把sCMV锚定到感兴趣基因的启动子区域。因此锚定的sCMV可以激活感兴趣基因如天然环状顺式增强子的转录。由于dCas9/csgRNA锚定的sCMV在转录中起转录因子的作用,因此它可以被认为是反式增强子,与在顺式中起作用的天然增强子相反。
实施例1
载体构建
实验方法:
为了将CRISPR/dCas9表达系统应用于细胞中的转染,构建了含有由U6启动子驱动的sgRNA的质粒。使用Pfu高保真聚合酶(Transgen,AS221-01),利用引物Lac-px-F(表1)和Lac-px-R(表1)克隆了来自pEASY-Blunt-simple (Transgen,CB101-01)的两端具有BbsI和BsaI位点的lac操纵子序列。将该 lac操纵子序列连接到px458(Addgene质粒ID:42230)中以构建px458-lac。将连接产物转化到感受态细胞DH5α中,然后筛选蓝色菌落。通过测序验证 px458-lac。然后设计了三个侧翼序列。使用正向引物(U6-F;表1)和含有不同侧翼序列的三种反向引物之一的U6-1-R(表1)、U6-2-R(表1)和U6-3-R(表 1),通过PCR扩增将侧翼序列添加到gRNA支架序列的3'-末端,其中克隆在 px458-lac中的gRNA支架序列用作模板。将产物克隆到pEASY-Blunt-simple中,产生了称为pEASY-csgRNA(图2)的csgRNA表达载体。csgRNA是指具有3' 延伸序列的捕获sgRNA。所有延伸序列的长度均为24-bp。
表1.用于载体构建中高保真扩增的引物(SEQ ID NO.1-9)。
Figure BDA0001744360440000091
Figure BDA0001744360440000101
选择HNF4α、TCF3(E47)、ASCL1、Ngn2、Oct4、Nanog、TNFAIP3、CASP9、 CSF3和Sox2这10个重要基因作为靶标。每个基因特异性的sgRNA靶位点由 CHOPCHOP(https://chopchop.rc.fas.harvard.edu/)设计。表达特定csgRNA的 pEASY-csgRNA用图2所述的步骤构建。化学合成的互补寡核苷酸(表2)具有 20bp靶特异性区域,侧翼为两个BbsI位点,稀释至10μM并以相同的摩尔混合。反应中每种寡核苷酸的最终浓度是1μM。充分混合后,互补寡核苷酸在高温 (95℃)下变性并通过自然冷却过程退火。将杂交产物稀释800倍,然后连接到 pEASY-csgRNA中。连接反应体系(10μL)由1μL BbsI,0.3μL T4DNA连接酶,1μL 10×T4DNA连接酶缓冲液,10×BSA(牛血清白蛋白)(终浓度0.1 mg/mL),50ng质粒pEASY-csgRNA,和ddH2O达到10μl总反应体积。连接反应为:10个循环包括37℃5分钟和16℃10分钟,37℃30分钟和80℃5分钟。将连接产物导入DH5α感受态细胞中,并通过在具有100μg/mL氨苄青霉素,40 μL 20mg/mL X-gal和40μL 0.1M IPTG的LB琼脂平板上进行蓝白色筛选来筛选白色克隆。载体通过测序验证。然后使用正向引物U6-F和反向引物U6-R、 U6-1-R、U6-2-R和U6-3中的一种通过PCR从质粒pEASY-csgRNAs扩增线性 sgRNA或csgRNA表达序列-R。引物U6-F和U6-R用于扩增正常的sgRNA表达模板(命名为U6-sgRNA),引物U6-F和U6-1/2/3-R用于扩增csgRNA表达模板 (命名为U6-csgRNA)。PCR产物通过PCR纯化试剂盒(Axygen)纯化。这些序列作为sgRNA转录模板,用于将细胞转染。
表2.用于制备sgRNA的靶特异性区域(20bp)的寡核苷酸(SEQ ID NO.10-29)。
Figure BDA0001744360440000102
Figure BDA0001744360440000111
S:正义;AS:反义。
通过使用正向引物(CMV-F;表3)和具有特定侧翼序列的反向引物之一 (CMV-1-R,CMV-2R或CMV-3-R;表3)从pEGFP-N1扩增CMV增强子/启动子的完整序列。扩增的CMV启动子片段在其一端具有Nt.BbvCI位点。然后将扩增的CMV启动子片段用Nt.BbvCI消化。将消化的CMV启动子片段与互补寡核苷酸(CS-1-R,CS-2-R或CS-3-R;表3)混合,然后在85℃变性10分钟。然后将变性的混合物自然冷却至室温。互补寡核苷酸具有与CMV启动子片段的最终3'单链末端相同的序列。使用互补的寡核苷酸从CMV启动子片段去除变性的寡核苷酸。CMV启动子片段用PCR纯化试剂盒纯化并用作线性粘端CMV (sCMV)启动子片段。使用未处理的CMV启动子片段作为平端CMV(bCMV) 对照。
表3.用于载体构建中高保真扩增的引物。(SEQ ID NO.30-36)
Figure BDA0001744360440000121
将HNF4α启动子序列克隆到ZsGreen基因的上游来构建ZsGreen报告载体。使用引物HNF4α-P-F和HNF4α-P-R(表4)通过PCR从HepG2细胞的基因组 DNA扩增1000bp的HNF4α启动子序列。然后将启动子序列连接到产生HNF4α启动子报告载体pEZX-HP-ZsGreen的pEZX-ZsGreen中。载体 pcDNA-dCas9-VP64购自Addgene(质粒ID:47107)。删除pcDNA-dCas9-VP64中的VP64序列以构建pcDNA-dCas9。将VP64-p65-Rta(VPR)转录激活结构域序列连接到pcDNA-dCas9中以构建pcDNA-dCas9-VPR。
表4.用于载体构建中高保真扩增的引物(SEQ ID NO.37-38)。
Figure BDA0001744360440000122
实验结果:
通过上述载体构建实验,经测序获得如下载体序列:
pEASY-U6-csgRNA-1骨架载体(SEQ ID NO.39):
GAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGC TGTTAGAGAGATAATTGGAATTAATTTGACTGTAAACACAAAGATATTAGTA CAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAA AATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTC GATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGGGTCTTCAG CGCCCAATACGCAAACCGCCTCTCCCCGCGCGTTGGCCGATTCATTAATGC AGCTGGCACGACAGGTTTCCCGACTGGAAAGCGGGCAGTGAGCGCAACG CAATTAATGTGAGTTAGCTCACTCATTAGGCACCCCAGGCTTTACACTTTAT GCTTCCGGCTCGTATGTTGTGTGGAATTGTGAGCGGATAACAATTTCACAC AGGAAACAGCTATGACCATGATTACGCCAAGCTGCCCTTAAGGGCAGCTTC AATTCGCCCTATAGTGAGTCGTATTACAATTCACTGGCCGTCGTTTTACAAC GTCGTGACTGGGAAAACCCTGGCGTTACCCAACTTAATCGCCTTGCAGCAC ATCCCCCTTTCGCCAGCTGGCGTAATAGCGAAGAGGCCCGCACCGATCGCC CTTCCCAACAGTTGCGCAGCCTGAATGGCGAATGGACGCGAAGACCTGTT TTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGA AAAAGTGGCACCGAGTCGGTGCAATCGGGCCGACGGCAAACATACCTTT TTT(其中粗体序列为捕获序列)
pEASY-U6-csgRNA-2骨架载体(SEQ ID NO.40):
GAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGC TGTTAGAGAGATAATTGGAATTAATTTGACTGTAAACACAAAGATATTAGTA CAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAA AATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTC GATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGGGTCTTCAG CGCCCAATACGCAAACCGCCTCTCCCCGCGCGTTGGCCGATTCATTAATGC AGCTGGCACGACAGGTTTCCCGACTGGAAAGCGGGCAGTGAGCGCAACG CAATTAATGTGAGTTAGCTCACTCATTAGGCACCCCAGGCTTTACACTTTAT GCTTCCGGCTCGTATGTTGTGTGGAATTGTGAGCGGATAACAATTTCACAC AGGAAACAGCTATGACCATGATTACGCCAAGCTGCCCTTAAGGGCAGCTTC AATTCGCCCTATAGTGAGTCGTATTACAATTCACTGGCCGTCGTTTTACAAC GTCGTGACTGGGAAAACCCTGGCGTTACCCAACTTAATCGCCTTGCAGCAC ATCCCCCTTTCGCCAGCTGGCGTAATAGCGAAGAGGCCCGCACCGATCGCC CTTCCCAACAGTTGCGCAGCCTGAATGGCGAATGGACGCGAAGACCTGTT TTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGA AAAAGTGGCACCGAGTCGGTGCGGAACCTTACGAATACCAGATGCTTTT TTT(其中粗体序列为捕获序列)
pEASY-U6-csgRNA-3骨架载体(SEQ ID NO.41):
GAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGC TGTTAGAGAGATAATTGGAATTAATTTGACTGTAAACACAAAGATATTAGTA CAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAA AATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTC GATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGGGTCTTCAG CGCCCAATACGCAAACCGCCTCTCCCCGCGCGTTGGCCGATTCATTAATGC AGCTGGCACGACAGGTTTCCCGACTGGAAAGCGGGCAGTGAGCGCAACG CAATTAATGTGAGTTAGCTCACTCATTAGGCACCCCAGGCTTTACACTTTAT GCTTCCGGCTCGTATGTTGTGTGGAATTGTGAGCGGATAACAATTTCACAC AGGAAACAGCTATGACCATGATTACGCCAAGCTGCCCTTAAGGGCAGCTTC AATTCGCCCTATAGTGAGTCGTATTACAATTCACTGGCCGTCGTTTTACAAC GTCGTGACTGGGAAAACCCTGGCGTTACCCAACTTAATCGCCTTGCAGCAC ATCCCCCTTTCGCCAGCTGGCGTAATAGCGAAGAGGCCCGCACCGATCGCC CTTCCCAACAGTTGCGCAGCCTGAATGGCGAATGGACGCGAAGACCTGTT TTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGA AAAAGTGGCACCGAGTCGGTGCATCTAGTGGAACCTCAAACATACCTTT TTT(其中粗体序列为捕获序列)
常规sgRNA转录模版(SEQ ID NO.42):
GAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGC TGTTAGAGAGATAATTGGAATTAATTTGACTGTAAACACAAAGATATTAGTA CAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAA AATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTC GATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGGNNNNNNN NNNNNNNNNNNNNGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTA GTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTT
csgRNA-1转录模版(SEQ ID NO.43):
GAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGC TGTTAGAGAGATAATTGGAATTAATTTGACTGTAAACACAAAGATATTAGTA CAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAA AATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTC GATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGGNNNNNNN NNNNNNNNNNNNNGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTA GTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCAATCGGGCCGACGGCAAACATACCTTTTTT
csgRNA-2转录模版(SEQ ID NO.44):
GAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGC TGTTAGAGAGATAATTGGAATTAATTTGACTGTAAACACAAAGATATTAGTA CAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAA AATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTC GATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGGNNNNNNN NNNNNNNNNNNNNGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTA GTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCGGAACCTTACGAATACCAGATGCTTTTTTT
csgRNA-3转录模版(SEQ ID NO.45):
GAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGC TGTTAGAGAGATAATTGGAATTAATTTGACTGTAAACACAAAGATATTAGTA CAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAA AATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTC GATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGGNNNNNNN NNNNNNNNNNNNNGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTA GTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCATCTAGTGGAACCTCAAACATACCTTTTTT
sgRNA序列(SEQ ID NO.46):
NNNNNNNNNNNNNNNNNNNNGUUUUAGAGCUAGAAAUAGCAAGUU AAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGG UGCUUUU
csgRNA-1序列(SEQ ID NO.47):
NNNNNNNNNNNNNNNNNNNNGUUUUAGAGCUAGAAAUAGCAAGUU AAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGG UGCAAUCGGGCCGACGGCAAACAUACCUUUU
csgRNA-2序列(SEQ ID NO.48):
NNNNNNNNNNNNNNNNNNNNGUUUUAGAGCUAGAAAUAGCAAGUU AAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGG UGCGGAACCUUACGAAUACCAGAUGCUUUUU
csgRNA-3序列(SEQ ID NO.49):
NNNNNNNNNNNNNNNNNNNNGUUUUAGAGCUAGAAAUAGCAAGUU AAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGG UGCAUCUAGUGGAACCUCAAACAUACCUUUU
sCMV-1序列(SEQ ID NO.50):
5’-TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATAT ATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCG CCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAA CGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAA CTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTAT TGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGAC CTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTA CCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTG ACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGT TTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCA GAGCTGCTGAGGGGTATGTTTGCCGTCGGCCCGATT
sCMV-2序列(SEQ ID NO.51):
TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATAT GGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCC CAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACG CCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACT GCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTG ACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTT ATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCA TGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACT CACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTT GGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAG CTGCTGAGGAGCATCTGGTATTCGTAAGGTTCC
sCMV-3序列(SEQ ID NO.52):
TAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATAT GGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCC CAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACG CCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACT GCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTG ACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTT ATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCA TGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACT CACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTT GGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAG CTGCTGAGGGGTATGTTTGAGGTTCCACTAGAT
HNF4a启动子报告载体(SEQ ID NO.53):
TGAGATCCAAAACTGAGACAAAAGAAACGGGGCTGTTCCAAAAAAA AAGCTAGGTGGCAGGTGTCTAACATGCCAGGGAGCTAAAACAGAGTGTGT GAGTTTCAGCAGCAGGTTGAATTTAGAATGGGGAAGGAGACCAGAGGAGA CGCCAGACAGGATGACTTTGTCCCATTGGCCTGGAGGCAGCCCCATGTTTC TCCACCCCTCATATCACTCACCAGTTTGTAATAGTATCTTTGAATGACGATCT GATTAAGGTCCGTCTCCTCCATTAGTCCACAAGTTTCGGGGGTACATCTACT TTGCTCATTTCCATATCCCCAGAGTCTAGCACAAGGCCTGGTACATAGTAGG TGCTCAATAAATATGTTAGATGAAAGGAAGATAACACCTCTATGTACTAGCA GTGAGACTCCAGGCATGCAATTTCTCTCTGTCCTTCAGTCCCTTCATCTCAA GGTTTAATTTAAATATGGTAACGCCTGTATGCAACTCCCAGCATCCAGTAGG CACTCACTAAACACAGTTCTCCACCCTCCTTTTTTCCTCTGCCCCTCCCTCG GTTTTCCCACTACTTCCTGCATGGTGACACACCCATAGTTTGGAGCCATAAA ACCCAACCCAGGTTGGACTCTCACCTCTCCAGCCCCTTCTGCTCCGGCCCTGTCCTCAAATTGGGGGGCTGATGTCCCCATACACCTGGCTCTGGGTTCCCCT AACCCCAGAGTGCAGGACTAGGACCCGAGTGGACCTCAGGTCTGGCCAGG TCGCCATTGCCATGGAGACAGCAACAGTCCCCAGCCGCGGGTTCCCTAAGT GACTGGTTACTCTTTAACGTATCCACCCACCTTGGGTGATTAGAAGAATCAA TAAGATAACCGGGCGGTGGCAGCTGGCCGCACTCACCGCCTTCCTGGTGG ACGGGCTCCTGGTGGCTGTGCTGCTGCTGTGAGCGGGCCCCTGCTCCTCCA TGCCCCCAGCTCTCCGGCTGGGTGGGCTTAAGCTTCTCGACTTCCAGCTTG GCATAGAGGGTATATAATGGAAGCTCGACTTCCAGATCCGGTACTGTTGGTA AAGCCACCGGATCCAGCCACCATGGCCCAGTCCAAGCACGGCCTGACCAA GGAGATGACCATGAAGTACCGCATGGAGGGCTGCGTGGACGGCCACAAGT TCGTGATCACCGGCGAGGGCATCGGCTACCCCTTCAAGGGCAAGCAGGCC ATCAACCTGTGCGTGGTGGAGGGCGGCCCCTTGCCCTTCGCCGAGGACATC TTGTCCGCCGCCTTCATGTACGGCAACCGCGTGTTCACCGAGTACCCCCAG GACATCGTCGACTACTTCAAGAACTCCTGCCCCGCCGGCTACACCTGGGAC CGCTCCTTCCTGTTCGAGGACGGCGCCGTGTGCATCTGCAACGCCGACATC ACCGTGAGCGTGGAGGAGAACTGCATGTACCACGAGTCCAAGTTCTACGG CGTGAACTTCCCCGCCGACGGCCCCGTGATGAAGAAGATGACCGACAACT GGGAGCCCTCCTGCGAGAAGATCATCCCCGTGCCCAAGCAGGGCATCTTG AAGGGCGACGTGAGCATGTACCTGCTGCTGAAGGACGGTGGCCGCTTGCG CTGCCAGTTCGACACCGTGTACAAGGCCAAGTCCGTGCCCCGCAAGATGC CCGACTGGCACTTCATCCAGCACAAGCTGACCCGCGAGGACCGCAGCGAC GCCAAGAACCAGAAGTGGCACCTGACCGAGCACGCCATCGCCTCCGGCTC CGCCTTGCCCGCCGCGCACCCGGGTTACTCTAGAGTCGGGGCGGCCGGCTA G
实施例2
捕获序列对sgRNA功能的影响
实验方法:
用Cas9/csgRNA切割DNA:选择靶向HNF4α启动子序列的sgRNA。通过使用T7RNA聚合酶(M0251S,NEB)的体外转录来制备sgRNA。sgRNA转录模板通过用正向引物HNF4α-T7-F(表5)对sgRNA表达质粒(pEASY-csgRNA) 中克隆的sgRNA编码序列进行PCR扩增来制备;正向引物含有T7启动子序列 (TAATACGACTCACTATAG,转录起始于3'G),以及四种反向引物之一U6-R, U6-1-R、U6-2-R和U6-3-R(表1)。制备正常的sgRNA(HNF4α-sgRNA)和三种csgRNA(HNF4α-csgRNA)。使用引物HNF4α-sP-F和HNF4α-sP-R(表5)通过PCR从pEZX-HP-ZsGreen-A扩增732-bp HNF4α启动子片段。Cas9消化反应体系(30μL)由1×Cas9核酸酶反应缓冲液,1μM Cas9核酸酶(NEB,M0386T) 和300nM HNF4α-sgRNA或HNF4α-csgRNA组成。Cas9核酸酶反应首先在25℃孵育10分钟。然后向Cas9反应物中加入400ng纯化的732-bp HNF4α启动子片段,并在37℃温育15分钟。最后,将Cas9核酸酶在65℃下灭活10分钟。反应体系电泳检测在1.5%琼脂糖凝胶中进行。
表5.用于载体构建中高保真扩增的引物(SEQ ID NO.54-56)。
Figure BDA0001744360440000191
实验结果:
将延伸的捕获序列添加至sgRNA支架用于sCMV增强子片段的末端退火。为了观察添加的捕获序列是否影响sgRNA的功能,我们通过体外转录合成了靶向HNF4α启动子相同位点的正常sgRNA和三种csgRNA。三种csgRNA具有不同的捕获序列。我们使用这些sgRNA与Cas9核酸内切酶结合用于剪切732-bp 的HNF4α启动子片段。结果表明,目标DNA可以被所有的sgRNAs消化,包括三种具有变体捕获序列的csgRNAs(图3)。这表明捕获序列对sgRNA功能没有影响。
实施例3
通过反式增强子激活外源报告基因
实验方法:
细胞培养和转染:
从中国科学院上海生命科学研究院细胞资源中心获得293T、HepG2、A549、 SKOV3、HT29、PANC-1和HeLa,并在37℃和5%(v/v)CO2的培养箱培养。细胞在含有10%FBS、100U/mL青霉素和100μg/mL链霉素的Dulbecco's Modified Eagle Medium(DMEM)或Roswell ParkMemorial Institute(RPMI)1640 培养基中培养。细胞在12孔板的每个孔中汇合度>70%时,用800ng总DNA,包括500ng质粒(pcDNA-dCas9、pcDNA-dCas9-VP64或pcDNA-dCas9-VPR),150ng线性sgRNA表达模板,(U6-sgRNA或U6-csgRNA)和150ng线性CMV,溶解于Lipofectamine 2000(ThermoFisher Scientific)脂质体中使用以下方案转染。对于每次转染,当细胞生长至4×105/孔的密度时,将细胞与600μL的Opti-MEM (ThermoFisherScientific)在37℃下培养0.5小时。每次转染制备100 μLOpti-MEM,800ng总DNA,100μLOpti-MEM和4μL Lipofectamine 2000的原液。然后将溶液涡旋并在室温下温育5分钟。此后,将Opti-MEM/Lipofectamine 溶液加入储存在100μL Opti-MEM中的单独等分试样中,涡旋,并在室温下温育20分钟,然后加入到每个孔中。将细胞与转染溶液一起温育4小时后,用800 μL含有10%FBS的新鲜DMEM或RPMI 1640培养基替换每个孔的培养基。细胞在37℃和5%CO2下再孵育36小时。在实验结束时,并在200×放大倍数下的荧光显微镜(Olympus)下拍照并观察所有细胞。
具有粘端(sCMV)或平端(bCMV)的CMV线性片段被用作与其他成分混合的激活因子。在激活HNF4α启动子报告基因时,用HNF4α-sgRNA、 pcDNA-dCas9-VP64和pEZX-HP-ZsGreen共转染293T细胞作为VP64对照组,用HNF4α-csgRNA、pcDNA-dCas9-VP64、CMV线性片段和pEZX-HP-ZsGreen 共转染293T细胞作为反式-CMV组。在激活内源基因时,用sgRNA和pcDNA-dCas9-VP64共转染细胞作为VP64对照组,csgRNA、pcDNA-dCas9-VP64 和CMV线性片段共转染细胞作为反式CMV组。
实验结果:
为了观察CRISPR-辅助反式增强子是否能够激活基因表达,构建了HNF4α启动子的报告基因载体pEZX-HP-ZsGreen。然后我们用sCMV、dCas9和csgRNA2 转染293T细胞。我们发现该系统激活了报告基因ZsGreen的表达(图4; dCas9/csgRNA2-sCMV)。激活水平与dCas9-VP64/sgRNA相似。因为在转染试验中使用了没有融合转录激活结构域如VP64的dCas9,这表明sCMV不仅可以与细胞中dCas9/csgRNA相互作用,而且还可以作为转录因子激活基因的表达。然而,dCas9/csgRNA&sCMV系统的激活水平远低于顺式CMV增强子的激活强度。
为了改善dCas9/csgRNA和sCMV系统的转录激活能力,接着用 dCas9-VP64/csgRNA2和sCMV系统转染293T细胞。结果,发现该系统极大地激活了报告基因的表达(图4;dCas9-VP64/csgRNA2-sCMV)。作为对照,使用 dCas9-VP64/csgRNA2和bCMV(bCMV)系统获得了与dCas9-VP64/sgRNA相似的激活水平(图4),表明sCMV真正促成基因表达的激活。更重要的是,发现与dCas9蛋白融合的VP64可以显著改善sCMV的功能,可能是通过添加或者协同作用。然后用另外两种csgRNAs,csgRNA1和csgRNA3以及dCas9-VP64 和sCMV转染293T细胞。发现这两种csgRNAs也获得了高水平的激活效果(图 4),尽管不如csgRNA2的效果好。另一组对照实验中,转染dCas9/csgRNA2& bCMV也证实了反式sCMV没有转录激活功能(图4)。
为了证实反式增强子的功能,还在293T细胞中进行了更多的阴性对照转染实验,包括唯一的dCas9-VP64、sgRNA和pEZX-HP-ZsGreen以及dCas9-VP64 加上pEZX-HP-ZsGreen。这些转染实验全都不能激活报告基因表达(图4)。这些数据证实反式增强子sCMV可以通过与dCas9/csgRNA组合起到转录激活作用。此外,与dCas9融合的典型转录激活结构域VP64可以进一步提高反式增强子sCMV的转录激活性能。因此,采用dCas9-VP64/csgRNA2&sCMV系统对 CRISPR辅助反式增强子做更多功能特征的实验。
转染293T细胞显示dCas9-VP64/csgRNA2&sCMV系统具有最高的转录激活能力。为了验证不同类型细胞中反式增强子系统的多功能性,使用 dCas9-VP64/csgRNA2&sCMV系统和报告载体转染了6种细胞系,包括HepG2 (图5),A549(图6),HeLa(图7),SKOV3(图8),PANC-1(图9)和HT29 (图10)。作为对照实验,还使用dCas9-VP64/sgRNA和dCas9/csgRNA2&sCMV 与报告基因载体一起转染了所有细胞。结果与转染293T细胞的结果相似。 dCas9-VP64/csgRNA2&sCMV在所有细胞系中显示出最高的转录激活效率(图 5~图10)。应该指出的是,在所有细胞系中,dCas9/csgRNA2&sCMV系统总是比dCas9-VP64/sgRNA显示更高的转录激活效率(图5~图10),这证实了反式转录激活能力是因为dCas9/csgRNA2&sCMV系统不含反式激活结构域,如VP64。在所有转染的细胞系中,dCas9-VP64/csgRNA2&sCMV系统的最高性能表明反式sCMV与dCas9融合的反式激活结构域VP64在激活基因转录中具有协同作用。转染细胞实验的两组生物学重复的荧光强度(MFI)进一步支持了这些观察结果(图11a)。
实施例4
反式CMV增强子与VPR的比较
实验方法:
细胞培养和转染:同实施例3。
实验结果:
VPR转录激活结构域具有比VP64更高的转录激活能力已被证实。因此,接下来将反式增强子与这种强烈的转录激活域进行比较。分别用 dCas9-VP64/csgRNA,dCas9-VPR/csgRNA和dCas9-VP64/csgRNA&sCMV与 ZsGreen报告基因构体共转染293T和HepG2细胞。结果表明,dCas9-VPR/csgRNA 比dCas9-VP64/csgRNA具有更好的转录激活效率,正如以前的许多研究报告(图 11b)。然而,dCas9-VP64/csgRNA&sCMV显示出比dCas9-VPR/csgRNA高得多的转录激活效率(图11b)。此外,发现前者在任何荧光强度阈值下激活ZsGreen 表达的细胞多于后者。这意味着反式增强子sCMV不仅能使更多的细胞产生荧光,而且使更多的细胞产生比dCas9-VPR/sgRNA更高的荧光强度。这些数据进一步证明了CRISPR-辅助反式增强子的巨大转录激活能力。
实施例5
反式增强子激活内源基因
实验方法:
细胞培养和转染:同实施例3。
定量RT-PCR:使用TRIzol TM(Invitrogen)试剂从转染的细胞中提取总RNA。在1×Hifair TMⅢSuperMix(YEASEN,11137ES50)组成的20μl体系中由高达 3μg总RNA合成cDNA。使用GADPH mRNA作为对照将所有mRNA水平归一化。根据制造商的方案,使用ABI Step OnePlus(Applied Biosystems)通过定量 PCR分析不同处理的细胞的转录水平。定量PCR使用的引物在补充表6中列出。
表6.qPCR引物(SEQ ID NO.57-78)。
Figure BDA0001744360440000221
实验结果:
为了研究转录增强子对内源基因的转录激活,选择了10个基因作为激活靶点,包括HNF4α、E47(TCF3)、ASCL1、Ngn2、Oct4、Nanog、TNFAIP3、CASP9、 CSF3和Sox2。为这些基因中的每一个设计了一个启动子靶向sgRNA。然后用 dCas9-VP64/csgRNA2和sCMV转染7种不同的细胞系。同时,用 dCas9-VP64/sgRNA和dCas9/csgRNA&sCMV同时转染所有细胞作为对照。通过 qPCR检测基因转录后,计算转染dCas9/csgRNA2和sCMV的细胞中靶基因相对于仅转染Lipofectamine 2000的细胞中的靶基因表达的倍数。通过比较这10种基因在不同细胞系中的转录激活效应,发现dCas9-VP64/csgRNA2&sCMV总是在所有细胞中所有基因中是最高转录激活(图12)。如在外源基因激活中,在所有细胞中,dCas9/csgRNA&sCMV可以比dCas9-VP64/sgRNA更好地激活靶基因。同时发现HNF4α、TCF3、ASCL1、Ngn2、TNFAIP3和CSF3等6个基因的表达总是在所有细胞中被三个系统高度激活。然而,包括Oct4、Sox2、Nanog和CASP9 在内的其他4种基因的表达活性较低。这些结果表明CRISPR-辅助反式增强子可以激活各种细胞中内源基因的表达。这些结果还表明反式sCMV与dCas9融合反式激活结构域VP64在激活基因转录中具有协同作用。
实施例6
反式增强子激活内源基因后肿瘤细胞基因表达变化及分化
实验方法:
细胞培养和转染:同实施例3。
定量RT-PCR:使用TRIzol TM(Invitrogen)试剂从转染的细胞中提取总RNA。在1×Hifair TMⅢSuperMix(YEASEN,11137ES50)组成的20μl体系中由高达 3μg总RNA合成cDNA。使用GADPH mRNA作为对照将所有mRNA水平归一化。根据制造商的方案,使用ABI Step OnePlus(Applied Biosystems)通过定量 PCR分析不同处理的细胞的转录水平。定量PCR使用的引物在表7中列出。
表7.qPCR引物(SEQ ID NO.79-120)
Figure BDA0001744360440000231
Figure BDA0001744360440000241
统计分析:数据表示为平均值±标准差(SD),伴随独立进行的实验数量,并通过T检验进行分析。认为p<0.05的差异具有统计学意义。
伤口愈合迁移分析(细胞划痕实验):将细胞接种在24孔板(Costar, Cambridge,MA)中并培养至汇合(过夜)。然后用dCas9-VP64/sgRNA或 dCas9-VP64/csgRNA和sCMV转染细胞以激活靶基因。将细胞转染4小时后。除去转染培养基并将细胞与新鲜的完全培养基一起培养36小时。将细胞单层用无菌移液管尖端打伤,然后用PBS冲洗以除去细胞碎片。将受伤的单层细胞在完全培养基中培养48小时,并通过显微镜观察图像。
Transwell分析:使用或者不使用反式CMV增强子转染细胞以激活靶基因。转染36小时后,将细胞移出培养基并用PBS洗涤三次。然后将细胞用胰蛋白酶消化并用培养基重新悬浮。重悬细胞稀释至1×105个细胞/mL。在24孔板中,每孔加入1mL培养基,然后将transwell小室加入孔中。最后,在每个transwell 中加入2×104个细胞(200μL)。然后将24孔板置于设定在37℃和5%CO2的培养箱中48小时。将细胞通过transwell室侵入并粘附于孔表面,固定并用吖啶橙染色并在荧光显微镜下计数。
吖啶橙染色:转染并在新鲜培养基中培养后,每种细胞系用PBS洗涤两次,然后在室温下用100μg/mL吖啶橙(AO)染色10分钟。然后在荧光显微镜 (Olympus)下以200×放大倍数观察细胞并照相。
实验结果:
最后,探索了反式增强子是否可用于激活与肿瘤分化治疗相关的关键基因。选择了两种报道的诱导肿瘤细胞分化的转录因子HNF4α和E47。据报道,前者可诱导癌细胞HepG2的分化,后者诱导癌细胞PANC-1的分化。
首先用靶向HNF4α和E47基因启动子区域中的单个位点的dCas9/csgRNA 和sCMV系统分别转染HepG2和PANC-1细胞。基因表达的qPCR检测表明这两个基因在转染的癌细胞中高度活化(图12;见HepG2和PANC-1细胞)。此外,随着HNF4α在HepG2细胞中的激活,CD133和CD90的表达下调(图13a)。相比之下,p21的表达高度上调。参与建立或维持多能性的一些典型基因(包括 Oct3/4、Sox2、Nanog、c-Myc、LIN28和Klf4)的表达也下调。相反,与健康肝功能有关的多种基因(包括GS、BR、ALDOB、CYP1a2、PEPCK、APOCIII、 G-6-P和HPD)的表达高度上调(图13a)。
类似地,当PANC-1细胞中的E47基因被激活时,CD133和CD90的表达被下调(图13b)。相反,p21和TP53INP1的表达高度上调。参与建立或维持多能性的一些典型基因(包括Oct3/4、Sox2、Nanog、c-Myc、LIN28和Klf4)的表达下调,而与健康胰腺相关的几个基因的表达显著上调,包括MIST1,PRSS2, CELA3A和CPA2(图13b)。E47诱导的细胞周期停滞需要p21和TP53INP1。 MIST1通常调节腺泡成熟途径。基因PRSS2、CELA3A和CPA2分别编码消化酶胰蛋白酶,弹性蛋白酶3和羧肽酶A2。
除检测基因表达外,还检测了转染细胞的生理表型,包括增殖,迁移和侵袭。我们通过检测细胞周期来表征细胞增殖。结果表明,反式增强子激活的HNF4α和E47分别诱导HepG2和PANC-1细胞显著的细胞生长停滞(增加了G0/G1细胞)(图13c)。细胞划痕实验揭示,通过反式增强子的转染,两种细胞系的迁移能力显著降低(图13d;图14)。Transwell实验还揭示,反式增强子转染导致两种细胞系的侵袭能力显著降低(图15)。转染细胞的这些生理变化与前面检测的基因表达变化一致。
实施例7
由VPR和CMV组成的反式增强子激活内源基因
实验方法:
细胞培养和转染:同实施例3。
流式细胞术:
用流式细胞术(Calibur,BD,USA)定量测定细胞的荧光强度。使用BD 软件完成流式细胞术数据分析和图形制备。
定量RT-PCR:
使用TRIzol TM(Invitrogen)试剂从转染的细胞中提取总RNA。在1×Hifair TMⅢSuperMix(YEASEN,11137ES50)组成的20μl体系中由高达3μg总RNA 合成cDNA。使用GADPHmRNA作为对照将所有mRNA水平归一化。根据制造商的方案,使用ABI Step One Plus(Applied Biosystems)通过定量PCR分析不同处理的细胞的转录水平。定量PCR使用的引物在补充表3中列出。
统计分析:数据表示为平均值±标准差(SD),伴随独立进行的实验数量,并通过T检验进行分析。认为p<0.05的差异具有统计学意义。
实验结果:
最后,dCas9-VPR/csgRNA和sCMV的组合可以获得比dCas9-VP64/csgRNA 和sCMV更高的转录激活。因此,使用dCas9-VP64和dCas9-VPR与csgRNA和 sCMV一起转染293T细胞激活内源基因HNF4α。发现在激活HNF4α表达上面, dCas9-VPR/csgRNA和sCMV总是比dCas9-VP64/csgRNA和sCMV获得显著的更低的水平(图16)。
序列表
<110> 东南大学
<120> 一种CRISPR辅助反式增强子激活基因表达的方法及其应用
<160> 120
<170> SIPOSequenceListing 1.0
<210> 1
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
acggtctcgc accgggtctt cagcgcccaa tacgcaaacc gcctc 45
<210> 2
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
tcggtctcca aacaggtctt cgcgtccatt cgccattcag gctgcgc 47
<210> 3
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
gagggcctat ttcccatgat tcc 23
<210> 4
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
aaaaaagcac cgactcggtg ccactttttc 30
<210> 5
<211> 56
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
aaaaaaaagg tatgtttgcc gtcggcccga ttgcaccgac tcggtgccac tttttc 56
<210> 6
<211> 56
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
aaaaaaaagg tatgtttgcc gtcggcccga ttgcaccgac tcggtgccac tttttc 56
<210> 7
<211> 56
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
aaaaaaaaag gtatgtttga ggttccacta gagcaccgac tcggtgccac tttttc 56
<210> 8
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
ccgctcgagg ccaccatgga ctacaaagac catg 34
<210> 9
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
ataagaatgc ggccgctcaa actttgcgtt tctttttcgg gctagc 46
<210> 10
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
aggaagacgg caccggccag tcacttaggg aacccggttt gggtcttcga 50
<210> 11
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
tcgaagaccc aaaccgggtt ccctaagtga ctggccggtg ccgtcttcct 50
<210> 12
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
aggaagacgg caccgggcgc acgggccccg cgggacgttt gggtcttcga 50
<210> 13
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
tcgaagaccc aaacgtcccg cggggcccgt gcgcccggtg ccgtcttcct 50
<210> 14
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
aggaagacgg caccggagcc gctcgctgca gcagcggttt gggtcttcga 50
<210> 15
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
tcgaagaccc aaaccgctgc tgcagcgagc ggctccggtg ccgtcttcct 50
<210> 16
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
aggaagacgg caccggctga caggaggagg aggcgggttt gggtcttcga 50
<210> 17
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
tcgaagaccc aaacccgcct cctcctcctg tcagccggtg ccgtcttcct 50
<210> 18
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
aggaagacgg caccggggaa aaccgggaga cacaacgttt gggtcttcga 50
<210> 19
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
tcgaagaccc aaacgttgtg tctcccggtt ttccccggtg ccgtcttcct 50
<210> 20
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
aggaagacgg caccggagag taacccagac taggtggttt gggtcttcga 50
<210> 21
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
tcgaagaccc aaaccaccta gtctgggtta ctctccggtg ccgtcttcct 50
<210> 22
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
aggaagacgg caccggccgc cccgcccggt ccctgcgttt gggtcttcga 50
<210> 23
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
tcgaagaccc aaacgcaggg accgggcggg gcggccggtg ccgtcttcct 50
<210> 24
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
aggaagacgg caccggggtg acgtgaggtc agtgcggttt gggtcttcga 50
<210> 25
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
tcgaagaccc aaaccgcact gacctcacgt caccccggtg ccgtcttcct 50
<210> 26
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
aggaagacgg caccggggga ggaagggagt ttgagggttt gggtcttcga 50
<210> 27
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
tcgaagaccc aaaccctcaa actcccttcc tcccccggtg ccgtcttcct 50
<210> 28
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
aggaagacgg caccggggag gagggggcag gcgagggttt gggtcttcga 50
<210> 29
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
tcgaagaccc aaaccctcgc ctgccccctc ctccccggtg ccgtcttcct 50
<210> 30
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
tagttattaa tagtaatcaa ttacgggg 28
<210> 31
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
aatcgggccg acggcaaaca tacccctcag cagctctgct tatatagacc tcccacc 57
<210> 38
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
ggaaccttac gaataccaga tgctcctcag cagctctgct tatatagacc tcccacc 57
<210> 32
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
atctagtgga acctcaaaca tacccctcag cagctctgct tatatagacc tcccacc 57
<210> 33
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
ggggtatgtt tgccgtcggc ccgatt 26
<210> 34
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
ggagcatctg gtattcgtaa ggttcc 26
<210> 35
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
ggggtatgtt tgaggttcca ctagat 26
<210> 36
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
ccgctcgagt gagatccaaa actgagacaa aagaaacggg gctg 44
<210> 37
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
cccaagctta agcccaccca gccggagagc tgggggcatg gagg 44
<210> 39
<211> 820
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg ggtcttcagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 300
tcattaatgc agctggcacg acaggtttcc cgactggaaa gcgggcagtg agcgcaacgc 360
aattaatgtg agttagctca ctcattaggc accccaggct ttacacttta tgcttccggc 420
tcgtatgttg tgtggaattg tgagcggata acaatttcac acaggaaaca gctatgacca 480
tgattacgcc aagctgccct taagggcagc ttcaattcgc cctatagtga gtcgtattac 540
aattcactgg ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt tacccaactt 600
aatcgccttg cagcacatcc ccctttcgcc agctggcgta atagcgaaga ggcccgcacc 660
gatcgccctt cccaacagtt gcgcagcctg aatggcgaat ggacgcgaag acctgtttta 720
gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa aagtggcacc 780
gagtcggtgc aatcgggccg acggcaaaca tacctttttt 820
<210> 40
<211> 820
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg ggtcttcagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 300
tcattaatgc agctggcacg acaggtttcc cgactggaaa gcgggcagtg agcgcaacgc 360
aattaatgtg agttagctca ctcattaggc accccaggct ttacacttta tgcttccggc 420
tcgtatgttg tgtggaattg tgagcggata acaatttcac acaggaaaca gctatgacca 480
tgattacgcc aagctgccct taagggcagc ttcaattcgc cctatagtga gtcgtattac 540
aattcactgg ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt tacccaactt 600
aatcgccttg cagcacatcc ccctttcgcc agctggcgta atagcgaaga ggcccgcacc 660
gatcgccctt cccaacagtt gcgcagcctg aatggcgaat ggacgcgaag acctgtttta 720
gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa aagtggcacc 780
gagtcggtgc ggaaccttac gaataccaga tgcttttttt 820
<210> 41
<211> 820
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg ggtcttcagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 300
tcattaatgc agctggcacg acaggtttcc cgactggaaa gcgggcagtg agcgcaacgc 360
aattaatgtg agttagctca ctcattaggc accccaggct ttacacttta tgcttccggc 420
tcgtatgttg tgtggaattg tgagcggata acaatttcac acaggaaaca gctatgacca 480
tgattacgcc aagctgccct taagggcagc ttcaattcgc cctatagtga gtcgtattac 540
aattcactgg ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt tacccaactt 600
aatcgccttg cagcacatcc ccctttcgcc agctggcgta atagcgaaga ggcccgcacc 660
gatcgccctt cccaacagtt gcgcagcctg aatggcgaat ggacgcgaag acctgtttta 720
gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa aagtggcacc 780
gagtcggtgc atctagtgga acctcaaaca tacctttttt 820
<210> 42
<211> 353
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg gnnnnnnnnn nnnnnnnnnn ngttttagag ctagaaatag caagttaaaa 300
taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt ttt 353
<210> 43
<211> 377
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg gnnnnnnnnn nnnnnnnnnn ngttttagag ctagaaatag caagttaaaa 300
taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcaat cgggccgacg 360
gcaaacatac ctttttt 377
<210> 44
<211> 377
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg gnnnnnnnnn nnnnnnnnnn ngttttagag ctagaaatag caagttaaaa 300
taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcgga accttacgaa 360
taccagatgc ttttttt 377
<210> 45
<211> 377
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg gnnnnnnnnn nnnnnnnnnn ngttttagag ctagaaatag caagttaaaa 300
taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcatc tagtggaacc 360
tcaaacatac ctttttt 377
<210> 46
<211> 77
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
nnnnnnnnnn nnnnnnnnnn gagagcagaa aagcaagaaa aaaggcagcc gacaacgaaa 60
aagggcaccg agcgggc 77
<210> 47
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
nnnnnnnnnn nnnnnnnnnn gagagcagaa aagcaagaaa aaaggcagcc gacaacgaaa 60
aagggcaccg agcgggcaac gggccgacgg caaacaacc 99
<210> 48
<211> 96
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
nnnnnnnnnn nnnnnnnnnn gagagcagaa aagcaagaaa aaaggcagcc gacaacgaaa 60
aagggcaccg agcgggcgga accacgaaac cagagc 96
<210> 49
<211> 96
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
nnnnnnnnnn nnnnnnnnnn gagagcagaa aagcaagaaa aaaggcagcc gacaacgaaa 60
aagggcaccg agcgggcaca gggaacccaa acaacc 96
<210> 50
<211> 599
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360
catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420
atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480
ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540
acggtgggag gtctatataa gcagagctgc tgaggggtat gtttgccgtc ggcccgatt 599
<210> 51
<211> 599
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360
catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420
atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480
ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540
acggtgggag gtctatataa gcagagctgc tgaggagcat ctggtattcg taaggttcc 599
<210> 52
<211> 599
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360
catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420
atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480
ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540
acggtgggag gtctatataa gcagagctgc tgaggggtat gtttgaggtt ccactagat 599
<210> 53
<211> 1830
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
tgagatccaa aactgagaca aaagaaacgg ggctgttcca aaaaaaaagc taggtggcag 60
gtgtctaaca tgccagggag ctaaaacaga gtgtgtgagt ttcagcagca ggttgaattt 120
agaatgggga aggagaccag aggagacgcc agacaggatg actttgtccc attggcctgg 180
aggcagcccc atgtttctcc acccctcata tcactcacca gtttgtaata gtatctttga 240
atgacgatct gattaaggtc cgtctcctcc attagtccac aagtttcggg ggtacatcta 300
ctttgctcat ttccatatcc ccagagtcta gcacaaggcc tggtacatag taggtgctca 360
ataaatatgt tagatgaaag gaagataaca cctctatgta ctagcagtga gactccaggc 420
atgcaatttc tctctgtcct tcagtccctt catctcaagg tttaatttaa atatggtaac 480
gcctgtatgc aactcccagc atccagtagg cactcactaa acacagttct ccaccctcct 540
tttttcctct gcccctccct cggttttccc actacttcct gcatggtgac acacccatag 600
tttggagcca taaaacccaa cccaggttgg actctcacct ctccagcccc ttctgctccg 660
gccctgtcct caaattgggg ggctgatgtc cccatacacc tggctctggg ttcccctaac 720
cccagagtgc aggactagga cccgagtgga cctcaggtct ggccaggtcg ccattgccat 780
ggagacagca acagtcccca gccgcgggtt ccctaagtga ctggttactc tttaacgtat 840
ccacccacct tgggtgatta gaagaatcaa taagataacc gggcggtggc agctggccgc 900
actcaccgcc ttcctggtgg acgggctcct ggtggctgtg ctgctgctgt gagcgggccc 960
ctgctcctcc atgcccccag ctctccggct gggtgggctt aagcttctcg acttccagct 1020
tggcatagag ggtatataat ggaagctcga cttccagatc cggtactgtt ggtaaagcca 1080
ccggatccag ccaccatggc ccagtccaag cacggcctga ccaaggagat gaccatgaag 1140
taccgcatgg agggctgcgt ggacggccac aagttcgtga tcaccggcga gggcatcggc 1200
taccccttca agggcaagca ggccatcaac ctgtgcgtgg tggagggcgg ccccttgccc 1260
ttcgccgagg acatcttgtc cgccgccttc atgtacggca accgcgtgtt caccgagtac 1320
ccccaggaca tcgtcgacta cttcaagaac tcctgccccg ccggctacac ctgggaccgc 1380
tccttcctgt tcgaggacgg cgccgtgtgc atctgcaacg ccgacatcac cgtgagcgtg 1440
gaggagaact gcatgtacca cgagtccaag ttctacggcg tgaacttccc cgccgacggc 1500
cccgtgatga agaagatgac cgacaactgg gagccctcct gcgagaagat catccccgtg 1560
cccaagcagg gcatcttgaa gggcgacgtg agcatgtacc tgctgctgaa ggacggtggc 1620
cgcttgcgct gccagttcga caccgtgtac aaggccaagt ccgtgccccg caagatgccc 1680
gactggcact tcatccagca caagctgacc cgcgaggacc gcagcgacgc caagaaccag 1740
aagtggcacc tgaccgagca cgccatcgcc tccggctccg ccttgcccgc cgcgcacccg 1800
ggttactcta gagtcggggc ggccggctag 1830
<210> 54
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
ttctaatacg actcactata gggagcaggt tgaatttaga atgg 44
<210> 55
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
tagtaggtgc tcaataaata tgttag 26
<210> 56
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
ggctttacca acagtaccgg atct 24
<210> 57
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 57
gacattcggg cgaagaagat 20
<210> 58
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 58
aagatgatgg ctttgaggta gg 22
<210> 59
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 59
tcatccacaa agccctcatc 20
<210> 60
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 60
catcattcca gttccgagta tca 23
<210> 61
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 61
acgagcgtat gggctacca 19
<210> 62
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 62
gttattgctt gagtgatccg gg 22
<210> 63
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 63
ccgactccta cagtgggcta 20
<210> 64
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 64
cgctgacgtg ttctcctcg 19
<210> 65
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 65
cgcggccaac aagaagatg 19
<210> 66
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 66
cgacgagtag gatgagaccg 20
<210> 67
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 67
aggaagagga cgtgttagtg c 21
<210> 68
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 68
gcaatcgtgt accagaccca g 21
<210> 69
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 69
gtgaaccagc gcatggacag 20
<210> 70
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 70
tctgcgagct ggtcatggag 20
<210> 71
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 71
cttgaatccc gaatggaaag gg 22
<210> 72
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 72
gtgtatatcc cagggtgatc ctc 23
<210> 73
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 73
cctggaacag tcccttctat aac 23
<210> 74
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 74
tcactcatct tcacacgtct tc 22
<210> 75
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 75
cgaactaaca ggcaagcagc aaag 24
<210> 76
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 76
agagcaccga catcaccaaa tcc 23
<210> 77
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 77
ggatttggtc gtattggg 18
<210> 78
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 78
ggaagatggt gatgggatt 19
<210> 79
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 79
cggaagaccc cagtcca 17
<210> 80
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 80
acgaaggctc tggtccacta 20
<210> 81
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 81
acatgaaaag acctggggg 19
<210> 82
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 82
gatctggtgt cccagcatg 19
<210> 83
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 83
tgtaagtggt tcaacgtgcg 20
<210> 84
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 84
cctcaccctc cttcaagctc 20
<210> 85
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 85
gctgcttaga cgctggattt 20
<210> 86
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 86
ctcctcctcg tcgcagtaga 20
<210> 87
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 87
gcggcaaaac ctacacaaag 20
<210> 88
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 88
ccccgtgtgt ttacggtagt 20
<210> 89
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 89
ggatgtccgt cagaacccat 20
<210> 90
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 90
ccctccagtg gtgtctcggt g 21
<210> 91
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 91
cctgcttgta tgctggagtc 20
<210> 92
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 92
gaaaagtcgt tgatgttgga 20
<210> 93
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 93
acaaggtgct gcgggaatca 20
<210> 94
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 94
actggtggga ggggtaggtg 20
<210> 95
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 95
aggaggactc ttctctccca a 21
<210> 96
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 96
gattcatctg cagccaggat 20
<210> 97
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 97
ctggcctctg ccatcttctg 20
<210> 98
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 98
ttagcctcct tgctcacatg c 21
<210> 99
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 99
gtgtccctct agtctatgaa gc 22
<210> 100
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 100
attgacttga tcctccagat ac 22
<210> 101
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 101
gggtactcct tgttgttgc 19
<210> 102
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 102
aaatcccaga actcagagaa c 21
<210> 103
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 103
ggctccatga ctgtgggatc 20
<210> 104
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 104
ttcagctgca cagcccagaa 20
<210> 105
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 105
ttgggaaggt gaagtttgc 19
<210> 106
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 106
gcatttgggc agtttaggaa 20
<210> 107
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 107
gccctttttg ggcatatcta ct 22
<210> 108
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 108
ctgcctggac gttgacgaa 19
<210> 109
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 109
ctgcagacat tctctgggaa a 21
<210> 110
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 110
gcaccatgat tctgaagatg a 21
<210> 111
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 111
aaaccttctc attgaacatc cc 22
<210> 112
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 112
ccattgtgct tgacttgcc 19
<210> 113
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 113
ccagcactac cagcagca 18
<210> 114
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 114
aggactgggc gctaggtg 18
<210> 115
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 115
gttgcagctg ctgttgctgc c 21
<210> 116
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 116
tgtcattgtc cagagtccgg c 21
<210> 117
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 117
ctcgtgtgtg gcctgtggca 20
<210> 118
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 118
ccagaaacaa agctggtcac a 21
<210> 119
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 119
gccctttttg ggcatatcta ct 22
<210> 120
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 120
ctgcctggac gttgacgaa 19

Claims (6)

1.一种CRISPR辅助反式增强子激活基因表达的方法,其特征在于,通过CRISPR系统将增强子DNA反式募集到靶基因上,依靠反式增强子DNA本身以及反式增强子DNA与CRISPR系统的互作,激活靶基因表达;所述反式募集具体过程为:常规引导RNA通过增加序列改造而成的一种捕获sgRNA,捕获sgRNA的3′末端增加了一段序列作为捕获序列,所述反式增强子DNA是一段末端带有一段单链DNA的双链DNA,反式增强子DNA末端的单链DNA可与捕获sgRNA的3′末端捕获序列退火杂交;所述CRISPR系统指CRISPR蛋白与其引导RNA形成的可与靶DNA序列结合的复合物,所述与靶DNA序列结合的复合物为dCas9蛋白与其sgRNA结合形成的复合物dCas9/sgRNA。
2.根据权利要求1所述的CRISPR辅助反式增强子激活基因表达的方法,其特征在于,所述dCas9包括常规dCas9蛋白以及经过基因融合改造过的dCas9蛋白。
3.根据权利要求2所述的CRISPR辅助反式增强子激活基因表达的方法,其特征在于,所述经过基因融合改造过的dCas9蛋白为融合各种激活域的dCas9蛋白。
4.根据权利要求1所述的CRISPR辅助反式增强子激活基因表达的方法,其特征在于,所述捕获序列为5′ -AATCG GGCCG ACGGC AAACA TACC-3′、 5′-GGAAC CTTAC GAATA CCAGATGCT-3′或5′-ATCTA GTGGA ACCTC AAACA TACC-3′。
5.根据权利要求1所述的CRISPR辅助反式增强子激活基因表达的方法,其特征在于,所述CRISPR系统包括dCas9蛋白表达载体与捕获sgRNA表达载体、dCas9蛋白与捕获sgRNA表达载体,或dCas9蛋白与捕获sgRNA。
6.一种权利要求1所述的CRISPR辅助反式增强子激活基因表达的方法在制备生物检测及治疗试剂中的应用。
CN201810835298.6A 2018-07-26 2018-07-26 一种crispr辅助反式增强子激活基因表达的方法及其应用 Active CN109055375B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810835298.6A CN109055375B (zh) 2018-07-26 2018-07-26 一种crispr辅助反式增强子激活基因表达的方法及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810835298.6A CN109055375B (zh) 2018-07-26 2018-07-26 一种crispr辅助反式增强子激活基因表达的方法及其应用

Publications (2)

Publication Number Publication Date
CN109055375A CN109055375A (zh) 2018-12-21
CN109055375B true CN109055375B (zh) 2021-11-12

Family

ID=64836577

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810835298.6A Active CN109055375B (zh) 2018-07-26 2018-07-26 一种crispr辅助反式增强子激活基因表达的方法及其应用

Country Status (1)

Country Link
CN (1) CN109055375B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109929865B (zh) * 2019-03-11 2022-03-08 东南大学 基于gal4-uas系统的crispr辅助反式增强子激活基因表达的方法及其应用
CN110760546B (zh) * 2019-09-03 2021-07-23 广州医科大学 制备心脏祖细胞的方法
CN115209924A (zh) * 2021-02-07 2022-10-18 辉大(上海)生物科技有限公司 Rna腺相关病毒(raav)载体及其用途

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105658805A (zh) * 2013-06-05 2016-06-08 杜克大学 Rna指导的基因编辑和基因调节
CN107922942A (zh) * 2015-03-13 2018-04-17 杰克逊实验室 三组分crispr/cas复合系统及其用途

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105658805A (zh) * 2013-06-05 2016-06-08 杜克大学 Rna指导的基因编辑和基因调节
CN107922942A (zh) * 2015-03-13 2018-04-17 杰克逊实验室 三组分crispr/cas复合系统及其用途

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Beyond editing: repurposing CRISPR–Cas9 for precision genome regulation and interrogation;Dominguez et al.;《nature reviews》;20151216;第17卷;第5-15页 *

Also Published As

Publication number Publication date
CN109055375A (zh) 2018-12-21

Similar Documents

Publication Publication Date Title
CN109055375B (zh) 一种crispr辅助反式增强子激活基因表达的方法及其应用
CN110656090B (zh) 一种表达质粒、用于包装容量增加的二代腺病毒的细胞株及其应用
KR20220038706A (ko) 조작된 rna를 사용한 내인성 adar을 활용한 타겟 rna 편집
CN107759701B (zh) 嵌合抗原受体、其修饰的NK细胞、编码DNA、mRNA、表达载体、制备方法和应用
KR20190072559A (ko) 세포외 공간으로부터 표적 진핵 세포의 세포질 및/또는 핵으로 폴리펩타이드 카고를 전달하기 위한 합리적으로-설계된 합성 펩타이드 셔틀제, 이의 용도, 이와 관련된 방법 및 키트
WO2015100929A1 (zh) 利用CRISPR/Cas9系统构建真核基因敲除文库的方法
CN107043774B (zh) 一种嵌合强启动子及其用途
CN108949794B (zh) 一种tale表达载体及其快速构建方法和应用
KR20230045612A (ko) Krab 융합 억제제 및 유전자 발현을 억제하기 위한 방법 및 조성물
CN109321571A (zh) 一种利用CRISPR/Cas9制备重组猪伪狂犬病毒的方法
CN110218732B (zh) 一种非洲猪瘟病毒串联基因、共表达载体、构建方法及应用
CN113549656A (zh) 一种用于多基因转化的慢病毒载体表达系统
CN111088282B (zh) Aavs1和h11安全港位点在重组表达蛋白中的应用
CN113512564A (zh) 以iPSC来源的细胞为载体、基因治疗湿性年龄相关性黄斑变性
CN114350615B (zh) Stat2基因缺失细胞株及其制备方法和应用
CN102061310B (zh) 人fhl1c真核表达载体的构建及其应用
CN110747232A (zh) 一种长效稳定表达的杆状病毒载体及其构建方法
CN109456992B (zh) 原儿茶酸调控的多功能基因表达平台及其应用
CN109371167A (zh) 用于检测CRISPR/Cas9基因编辑系统切割基因产生移码突变的基因元件及应用
CN114369619A (zh) 基因敲除用报告载体和载体系统及应用
CN103131709B (zh) zfx基因的RNA干扰片段及其控制小鼠性别的应用
CN102994550A (zh) 在动物细胞或动物组织中表达外源基因的方法
CN113980915B (zh) 一种新型的表达cxcl10的复制型溶瘤腺病毒和应用
KR102590276B1 (ko) 조직 특이적 발현을 위한 융합 프로모터 및 이의 용도
CN110295148A (zh) 一种快速构建3型鸭甲肝病毒反向遗传株的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant