一种靶向敲除HPV URR基因的DNA结合蛋白、系统及其应用
技术领域
本发明涉及基因编辑技术领域,尤其是一种靶向敲除HPV URR基因的DNA结合蛋白、系统及其应用。
背景技术
人乳头瘤病毒(Human Papillomavirus,HPV)感染是全球范围最常见的性传播疾病之一。它与人类免疫缺陷病毒(Human Immunodeficiency Virus,HIV)、乙型肝炎病毒(Hepatitis B Virus,HBV)等一样,同属于传染性致瘤病毒。流行病学研究表明,约80%的女性在一生中至少会感染一次HPV,而男性的几率约50%。其中,低危型HPV持续感染可引起皮肤、生殖器和肛周疣的发生,而高危型HPV持续感染则会导致宫颈癌、外阴癌、阴道癌及阴茎癌、肛周癌等恶性肿瘤,同时也会增加HIV感染的机会。近年来,随着社会经济的发展,我国HPV感染逐渐泛滥,且有年轻化趋势,已成为一个严重的社会公共卫生问题。
大样本的研究表明,几乎所有的宫颈癌及大多数子宫颈上皮内瘤变(cervicalintraepithelial neoplasia,CIN)II~III级都存在HPV感染,生殖道感染高危型HPV是妇女宫颈癌和CIN高发的主要危险因素。高危型HPV感染以16型、18型多见,其中,16型多见于宫颈鳞癌,HPV18型多见于宫颈腺癌。在宫颈癌标本HPV检测中,HPV16型可占高达51.0%,HPV18型可占高达25.0%。许多前瞻性研究已经表明,HPV-DNA阳性的患者发展为CIN-III级或浸润型宫颈癌的危险性相比HPV-DNA阴性的患者更高。一直有报道感染HPV16增加了患者CIN-II/III级进展为宫颈癌的危险性。因此,治疗和预防HPV感染,尤其是高危型16型,对治疗和预防宫颈癌以及其他HPV感染相关疾病极为重要。
目前少数发达国家主要通过接种多价疫苗来预防HPV感染。但即使是最先进的九价疫苗也无法完全覆盖不同种族人群的全部感染型别。同时,很大一部分已经存在HPV感染的人群无法接受疫苗的接种;而不断突变的病毒致病基因也给预防性疫苗的应用带来了挑战。此外,HPV疫苗价格昂贵,在中国及其他发展中国家推行全民HPV疫苗接种,在经济、依从性和效果上均难以保障。最重要的一点是,HPV作为一种致瘤性病毒,目前尚无有效的治疗性抗体或药物,导致已经存在HPV感染的人群既无法接受疫苗的接种,亦无药物来清除HPV,只能定期筛查随访。长期反复的筛查给广大患者带来了严重的心理压力及经济负担,部分人群甚至失访。一旦出现高危HPV持续感染并引起相应癌变时需手术治疗。以宫颈癌为例,发现癌前病变进行宫颈锥切会引起宫颈机能不全,导致流产、早产;并且一旦进展为宫颈浸润癌则需手术切除子宫,使患者完全丧失生育功能。因此,HPV感染作为一种威胁人类健康的重大传染性疾病,亟需开发有效的治疗手段,改变HPV感染人群“无保护、难治疗、重负担”的临床现状。
在此背景下,随着对基因功能研究的深入,临床把抗病毒治疗方向转向个体化基因编辑领域。基因编辑工具运用于抗病毒治疗的首要问题是明确治疗靶点。确切证据表明,HPV整合入宿主基因组形成持续感染是宫颈癌发生发展的必要条件。整合入人基因组的HPV可持续表达E6和E7两种早期癌蛋白维持和促进癌变进程,E6蛋白在细胞内与E6相关蛋白(E6-associatedprotein,E6AP)和抑癌蛋白p53形成三聚体复合物,诱导p53蛋白的泛素化并经过蛋白酶体途径降解;此外,E6也可以通过直接与p53基因结合阻断p53的转录。p53功能的缺失或蛋白的降解使得细胞逃避正常的细胞周期调控,可无限增殖。E7蛋白则抑制另一个抑癌蛋白RB1的活性,从而激活E2F转录因子家族,使得细胞的增殖能力增强,并能逃脱细胞周期对细胞生存的影响。在E6和E7蛋白的共同作用下,受感染的细胞增殖能力增强,不受细胞周期的控制,最终获得了肿瘤细胞所具有的恶性表型。因此,高危型HPV的持续感染,尤其是E6和E7蛋白的持续表达是宫颈癌发生发展的重要致病因素,而E6E7癌蛋白持续高表达的主要受HPV上游调控序列URR的调控。URR区包括多个转录因子结合位点,发挥增强子作用驱动病毒癌基因转录;并且URR区含有多个HPV复制起始位点,整合后的URR可以在独立于细胞周期本身的复制周期,开始独立复制,同时带动其两端侧翼序列的人基因组共同复制,导致人基因组重排,结构变异,最终促进癌变。因此,近年来HPV URR区也逐渐受到了重视,成为了宫颈癌基因治疗的重要靶标。
在明确HPV致癌关键元件的前提下,可利用基因编辑工具定向切除致癌元件,清除病毒达到逆转癌变的效果。目前的基因编辑技术主要包括ZFN、TALEN和CRISPR系统。CRISPR系统虽然具有较高的切割效率,但其严重的脱靶效应大大限制了它在临床转化中的应用,会引起多种不良反应,甚至癌症发生。而获得有效的ZFN所需的工作量大,花费也十分昂贵,价格昂贵、切割效率低,限制了其应用。
类转录激活因子效应物核酸酶(transcription activator-like effectornuclease,TALEN)由DNA结合蛋白(TALEs蛋白)和核酸酶Fok I构成,当TALEs蛋白结合到相邻的两个目标序列区域,核酸酶Fok I形成二聚体进行切割,造成DNA的双链断裂(Double-stand break,DSB),从而进行基因编辑。DNA结合蛋白TALEs发现于一种植物致病菌黄单胞杆菌中,它通常由10~30个重复单元串联构成,每个重复单位能够识别1个DNA碱基。每个重复单元由34个氨基酸残基组成,其中第12、13位氨基酸残基是高度可变的,因此被称为重复可变双残基(repeat variable diresidue,RVD)。每个重复单位的RVD负责识别1个DNA碱基,不同的RVD能够特异地识别4种碱基中的1种或多种。大部分研究中采用的RVDs用于识别不同碱基,主要是:Asn和Ile(NI)用于识别A碱基,Asn和Gly(NG)用于识别T碱基,Asn和Asn(NN)或者Asn和His(NH)用于识别G碱基,His和Asp(HD)用于识别C碱基。将不同的TALE重复单元串联起来,可设计出能够识别靶标序列的TALE。
相较于ZFN和CRISPR系统,TALEN具有以下明显优势:1)筛选更为便利:TALEN筛选更为简便,它不需要复杂的筛选过程,只需要简单的分子克隆技术就可以在实验室制造出高效的TALEN,而ZFNs需要付出大量的劳动,甚至是巨额的花费。2)特异性识别DNA能力强:TALEs由10~30个重复单元串联构成,每个重复单位能够识别1个DNA碱基,因此可识别10~30个碱基,相较于ZFNs和CRISPR系统而言,识别的碱基序列更长,特异性更强,脱靶率更低。3)TALE可达600-800个氨基酸残基,Cas9则由1000-1300余个氨基酸构成,相较于CRISPR系统而言,分子量更小,更有利于其递送。特别是在一些难以通过传统方法实现基因打靶的模式生物、经济物种或建立的细胞系中,TALEN技术将发挥不可替代的作用。
发明内容
基于上述问题,本发明的目的在于克服上述现有技术的不足之处而提供一种可靶向敲除HPV URR基因的DNA结合蛋白。
为实现上述目的,本发明采取的技术方案包括以下几个方面:
在第一个方面,本发明提供了一种DNA结合蛋白,所述DNA结合蛋白包括一对蛋白,所述一对蛋白的氨基酸序列分别包括如SEQ ID NO.1、SEQ ID NO.2所示的多肽。需要说明的是,本发明的DNA结合蛋白包括但不限于SEQ ID NO.1、SEQ ID NO.2所示的多肽,还可以是与SEQ ID NO.1、SEQ ID NO.2所示的多肽具有90%以上序列一致性的多肽,只要该多肽能与HPV URR基因相邻的两个目标序列区域结合即可。
优选地,所述一对蛋白相应的核苷酸序列如SEQ ID NO.7和SEQ ID NO.8所示。
在第二个方面,本发明提供了一种用于靶向敲除HPV URR基因的TALEN系统,所述系统包括上述的DNA结合蛋白。需要说明的是,本发明的TALEN系统可用于敲除包括但不限于高危型HPV16和低危型HPV,还可以用于敲除高危型HPV16和低危型HPV的亚型。
优选地,所述系统还包括核酸酶Fok I。更优选地,所述Fok I为野生型Fok I。
在第三个方面,本发明提供了一种质粒,所述质粒表达所述的DNA结合蛋白。
优选地,所述质粒还表达核酸酶Fok I。更优选地,所述质粒基于载体pCGS652构建所得。
在第四个方面,本发明提供了所述的TALEN系统或所述的质粒在制备治疗人乳头瘤病毒导致的疾病的药物中的应用。
优选地,所述人乳头瘤病毒导致的疾病为疣或恶性肿瘤。更优选地,所述疣为皮肤疣、生殖器疣或肛周疣;所述恶性肿瘤为宫颈癌、外阴癌、阴道癌、阴茎癌或肛周癌。
在第五个方面,本发明提供了一种治疗人乳头瘤病毒导致的疾病的药物,所述药物中含有所述的TALEN系统或所述的质粒。
优选地,所述人乳头瘤病毒导致的疾病为疣或恶性肿瘤。更优选地,所述疣为皮肤疣、生殖器疣或肛周疣;所述恶性肿瘤为宫颈癌、外阴癌、阴道癌、阴茎癌或肛周癌。
综上所述,本发明的有益效果为:
本发明利用构建的靶向高危型HPV16 URR的TALEN表达质粒,通过将表达质粒转染到细胞中,破坏URR的序列,从而破坏其调控癌基因E6/E7的功能,进一步致使E6/E7癌基因表达下调,从而失去致癌特性,甚至直接由于DSB(双链断裂)过多导致细胞凋亡,达到降低病毒负荷、清除病毒及病变细胞、逆转癌变的目的。因此,靶向高危型HPV16 URR的TALEN具有重要的临床应用价值。
附图说明
图1为TALEN结合并敲除高危型HPV16 URR基因作用示意图;
图2为实施例中应用靶向HPV16 URR的TALEN诱导SiHa细胞凋亡增加的结果图,其中Blank代表未处理的SiHa细胞凋亡率,Vector代表空载体(仅含有载体,不含有TALEN碱基序列)转染后的SiHa细胞凋亡率,HPV16-URR-T1、HPV16-URR-T2、HPV16-URR-T3、HPV16-URR-T4分别代表HPV16-URR-T1、HPV16-URR-T2、HPV16-URR-T3、HPV16-URR-T4的TALEN表达质粒转染后的SiHa细胞凋亡率,结果显示HPV16-URR-T1具有阳性切割作用;
图3为实施例中应用靶向HPV16 URR的TALEN未能诱导HeLa细胞凋亡增加的结果图,其中Blank代表未处理的HeLa细胞凋亡率,Vector代表空载体(仅含有载体,不含有TALEN序列)转染后的HeLa细胞凋亡率,HPV16-URR-T1、HPV16-URR-T2、HPV16-URR-T3、HPV16-URR-T4分别代表HPV16-URR-T1、HPV16-URR-T2、HPV16-URR-T3、HPV16-URR-T4的TALEN表达质粒转染后的HeLa细胞凋亡率,结果显示HPV16-URR-T1具有阳性切割作用;
图4为实施例中应用靶向HPV16 URR的TALEN未能诱导HEK293细胞凋亡增加的结果图,其中Blank代表未处理的HEK293细胞凋亡率,Vector代表空载体(仅含有载体,不含有TALEN序列)转染后的HEK293细胞凋亡率,HPV16-URR-T1、HPV16-URR-T2、HPV16-URR-T3、HPV16-URR-T4分别代表HPV16-URR-T1、HPV16-URR-T2、HPV16-URR-T3、HPV16-URR-T4转染后的HEK293细胞凋亡率,结果显示HPV16-URR-T1具有阳性切割作用;
图5为实施例中应用靶向HPV16 URR的TALEN转染SiHa细胞的结果图。
具体实施方式
在一些实施例中,本发明公开了包括针对高危型人乳头瘤病毒HPV16 URR致癌基因序列的TALEN质粒构建方法,并利用TALEN靶向敲除高危型人乳头瘤病毒URR致癌基因的方法。
在一些实施例中,本发明提供一种利用TALEN高效低毒地敲除高危型人乳头瘤病毒HPV16 URR致癌基因的应用方法,其中所述的高危型人乳头瘤病毒包括但不限于HPV16亚型。本发明采取了如下技术方案:
1.Fok I酶选用的是野生型的Fok I;
2.TALEN针对HPV16的URR致癌元件;
3.以下步骤针对高危型HPV16,但不限于其亚型:
1)本发明针对的DNA序列分别为:HPV16 URR碱基序列(NCBI数据库RefSeq:NC_001526.2)和HPV18 URR碱基序列(作为对照,NCBI数据库RefSeq:NC_001357.1)。利用在线TALEN设计工具(http://www.talendesign.org/),针对HPV16的URR致癌元件设计4对TALEN,并通过细胞实验挑选了切割效率较高的1对TALEN。
2)构建TALEN的真核表达载体。选定位点后,将TALEN的碱基序列克隆到表达载体pCGS652上(载体骨架参考为:http://www.addgene.org/62220/),构建TALEN的真核表达载体质粒,构建完成后,通过常规测序比对确定构建载体序列正确无突变,挑选出完全正确的克隆进行扩增并提取质粒。
3)本发明提供利用TALEN特异性地敲除高危型HPV16的URR致癌基因的方法。即,靶向HPV16 URR基因的TALEN仅能特异性地敲除HPV16 URR基因(参见图1),对HPV18以及其他HPV亚型的URR基因无敲除作用。
4)本发明提供利用TALEN特异性诱导相应HPV16阳性细胞的凋亡增加和增殖抑制的方法。所述特异性指HPV 16阳性细胞的特异性,以靶向HPV16 URR基因的TALEN为例,仅能特异性的诱导HPV16阳性的细胞(如SiHa)的凋亡增加和增殖抑制,对HPV18阳性的细胞(如HeLa)和HPV阴性的细胞(如HEK293等)无促进凋亡和抑制增殖的作用。
为更好的说明本发明的目的、技术方案和优点,下面将结合附图和具体实施例对本发明作进一步说明。如无特别说明,本发明中的实验方法均为常规方法。如无特别说明,本发明中的试剂浓度均为质量浓度。
本发明中使用的引物设计均使用Primer3 Plus在线引物设计工具(http://www.primer3plus.com/cgi-bin/dev/primer3plus.cgi)完成,由苏州金唯智生物科技有限公司合成;qRT-PCR试剂采用SuperScriptTM III PlatinumTM One-Step qRT-PCR Kit,购自thermo fisher(货号为Code No.11732020)。
实施例1 TALEN表达载体的构建
从NCBI网站中查询获得URR癌基因的全长序列信息,利用TALEN在线设计网站(http://www.talendesign.org/),针对HPV16的URR致癌元件设计4对TALEN,并通过细胞实验验证并挑选了切割效率较高的1对TALEN。
挑选的HPV16 URR靶位点序列如下:
·HPV16-URR-T1:T GCACATGGGTGTGTGCAA accgattttgggtt ACACATTTACAAGCA A(SEQ ID NO.1)
·HPV16-URR-T2:T GTATAAAACTAAGGGCG taaccgaaatcggt TGAACCGAAACCGGTT A(SEQ ID NO.2)
·HPV16-URR-T3:C TAAGGGCGTAACCGAAAT cggttgaaccgaaa CCGGTTAGTATAAAAGCAG(SEQ ID NO.3)
·HPV16-URR-T4:C ATGTATAAAACTAAG ggcgtaaccgaaat CGGTTGAACCGAAACCG G(SEQ ID NO.4)
验证并挑选的具有阳性切割效应的靶向HPV16 URR的1对TALEN(HPV16-URR-T1)的TALE模块序列为:
·P16-URR-T1-L:NH HD NI HD NI NG NH NH NH NG NH NG NH NG NH HD NI NI(SEQ ID NO.5)
·P16-URR-T1-R:NG NH HD NG NG NH NG NI NI NI NG NH NG NH NG(SEQ IDNO.6)
其中,Asn和Ile(NI)用于识别A碱基,Asn和Gly(NG)用于识别T碱基,Asn和Asn(NN)或者Asn和His(NH)用于识别G碱基,His和Asp(HD)用于识别C碱基。
TALE模块的碱基序列如下:
P16-URR-T1-L:
CTATCGCCAGCAACGGTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACATTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACATTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACATTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACGGTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACAATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACATTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACTCCGGACCAAGTGGTGGCTATCGCCAGCCACGATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACATTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACAATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCCACGATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACGGTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACTCCGGACCAAGTGGTGGCTATCGCCAGCCACGATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACATTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACAATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACATTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACAATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACAATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACATTGGCGGCAAGCAAGCGCTCGAAAGCATTGTGGCCCAGCTGAGCCGGCCTGATCCGGCGTTGGCCGCGTTGACC(SEQ ID NO.7)
P16-URR-T1-R:
CTATCGCCAGCAACAATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACTCCGGACCAAGTGGTGGCTATCGCCAGCCACGATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACGGTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACGGTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACAATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACGGTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACTCCGGACCAAGTGGTGGCTATCGCCAGCCACGATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACTCCGGACCAAGTGGTGGCTATCGCCAGCCACGATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACATTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACAATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCCACGATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACGGTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACAATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACAATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACATTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACTCCGGACCAAGTGGTGGCTATCGCCAGCCACGATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACTCCGGACCAAGTGGTGGCTATCGCCAGCCACGATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACATTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACGGTGGCGGCAAGCAAGCGCTCGAAAGCATTGTGGCCCAGCTGAGCCGGCCTGATCCGGCGTTGGCCGCGTTGACC(SEQ ID NO.8)
TALEN的表达载体构建方法参考引文(Gan et al Cell Syst.2016Sep 21.pii:S2405-4712(16)30262-9.doi:10.1016/j.cels.2016.08.007.)中的构建方法完成构建,将TALEN的碱基序列克隆到表达载体pCGS652上,构建TALEN的真核表达载体质粒,构建完成后,通过常规测序比对确定构建载体序列正确无突变,挑选出完全正确的克隆进行扩增并提取质粒。质粒的扩增、提取参照《分子克隆实验指南》第三版。
实施例2 TALEN转染细胞、诱导细胞凋亡
将靶向HPV16 URR的成对TALEN共转染到细胞后表达出来的TALEN可以迅速的识别HPV16 URR并与之结合,随后发挥切割效应。TALEN形成的DSB末端为钝性末端(blunt end),主要通过不受细胞周期限制的NHEJ途径快速修复,从而引入小片段的插入或缺失(indel),导致移码突变,最终使得URR功能丧失(驱动E6、E7癌基因转录),HPV16 E6、E7癌蛋白的表达受到抑制。另一方面,DSB修复不及时并积累,会诱发细胞程序性死亡机制,直接清除携带HPV的病变细胞。由于E6/E7蛋白的表达是HPV感染细胞获得永生化的前提条件,因此,E6/E7蛋白的表达受到抑制后,HPV感染细胞表现为增殖能力下降,凋亡增加。
具体操作步骤如下:
(1)细胞培养
HPV16阳性宫颈癌细胞系SiHa、HPV18阳性宫颈癌细胞系HeLa和人胚肾细胞系HEK293用含有10%血清的DMEM完全培养基在37℃、5%CO2培养箱里培养。待细胞融合度达到80%时用0.25%的胰酶消化后,用DMEM完全培养基终止消化,接种到12孔板中,继续培养24小时。
(2)质粒转染
24小时后,确认细胞贴壁良好,细胞融合度达到70%,即可进行转染。每孔转染2ugTALEN-L和2ug TALEN-R,使用Roche公司的X-tremeGENE HP DNA Transfection Reagent转染试剂按照说明书要求进行转染,以等量的空载体(共计4μg)作为阴性对照。转染后的细胞继续在37℃、5%CO2培养箱中培养。
(3)细胞凋亡的检测
转染48小时后,常规使用0.25%的胰酶消化细胞,收集细胞到离心管中,常温条件下300g离心5分钟,PBS洗涤一次,常温条件下300g离心5分钟。使用南京凯基生物的AnnexinV-FITC/PI细胞凋亡检测试剂盒(货号:KGA-107)中的Binding Buffer重悬细胞,分别加入Annexin V-FITC和PI,室温避光孵育15分钟。Beckman公司的CytoFLEX流式细胞仪检测细胞凋亡。
试验结果如图2~4所示,转入TALEN-L+TALEN-R的SiHa细胞凋亡明显增加,而转入等量空载体的SiHa细胞的凋亡未见明显增加。转染TALEN-L+TALEN-R的HeLa和HEK293细胞的凋亡都未见明显增加。
实施例3 TALEN的切割效率验证
TALEN在细胞内发挥作用后切割形成的DSBs,可以迅速的诱导细胞进行自我修复。在真核生物细胞中,为避免DNA断裂造成的DNA降解对细胞生存的影响,细胞大多采用NHEJ的方式将两断端直接相连,但是这种易错的修复方式极易在断裂点处引入小片段的基因插入或缺失,引起密码子的框移突变,最终使得靶基因的表达受到阻碍。此时,若将这种已经过TALEN剪切又经细胞错误修复的碱基序列与未处理的正常的(野生型的)碱基序列混合后退火延伸,即可形成一种在剪切位点处存在错配的特殊的杂交双链(与修复后的碱基插入或缺失相对应)。这种杂交双链可被T7 Endonuclease I识别并在错配处切断。
因此,细胞转染TALEN后,由于转染效率的限制,小部分没有成功转染的细胞的DNA序列没有被改变,而大部分成功转染的细胞在表达了TALEN后即可切割DNA序列。将这所有细胞的总基因组DNA提取出来,即可得到既含有切割后修复的DNA序列也含有未被处理的野生型序列的混合产物。再经PCR扩增,得到切割后修复的DNA序列和野生型序列的混合PCR产物,将此混合产物纯化后直接退火延伸,即可形成杂交双链,再应用T7 Endonuclease I进行酶切处理,就能识别并切断杂交双链,通过琼脂糖凝胶电泳即可分辨。
具体实验步骤如下:
(1)细胞的培养
人宫颈癌细胞系SiHa(HPV16阳性)的融合度达70%以上时,常规0.25%胰酶消化,接种到12孔板中,每孔种植细胞量约5×105个,继续在37℃、5%CO2培养箱中培养过夜。
(2)质粒的转染
细胞培养过夜后,相差显微镜下观察细胞贴壁良好,细胞融合度达到70%以上,即可进行质粒转染。每孔转染2ug TALEN-L和2ug TALEN-R,使用Roche公司的X-tremeGENE HPDNA Transfection Reagent转染试剂按照说明书要求进行转染,以等量的空载体(共计4μg)作为阴性对照。转染后的细胞继续在37℃、5%CO2培养。
(3)基因组DNA的提取
转染48小时后,常规0.25%的胰酶消化,用DMEM完全培养基终止消化,收集细胞到离心管中,300g离心5分钟,弃除培养基,PBS洗涤一次,再次300g离心5分钟,弃除PBS,获得细胞渣,使用细胞基因组提取试剂盒(全式金生物技术有限公司,货号:EE101-01)提取细胞基因组DNA,测量DNA浓度>50ng/μL。
(4)引物的设计
根据HPV16 URR基因序列设计引物,引物两端横跨靶点(产物长度优选400~600bp,并且靶点距离引物两段的距离应当有所差别,以便在琼脂糖凝胶电泳时能有效的区分切开的两个小片段)。本实施例中与HPV16 URR相对应的引物序列为:
HPV16 URR-F:gcgtgccaaatccctgtttt(SEQ ID NO.9)
HPV16 URR-R:cctcacgtcgcagtaactgt(SEQ ID NO.10)
设计PCR产物长度约583bp,引物两端距离TALEN切割位点的长度分别约308bp/275bp,388bp/195bp,398bp/185bp,384bp/199bp。
(5)PCR反应
以上述提取的基因组DNA为模版,用上述引物进行PCR反应。本实验使用的高保真DNA聚合酶为北京全式金生物科技有限公司的TransStart FastPfu DNA Polymerase(货号:AP221)。
PCR反应体系:
PCR反应程序:95℃、2min;95℃、20sec,60℃、20sec,72℃、30sec,35cycles;72℃、5min;4℃保持。
PCR反应完成后,先取少量PCR产物进行琼脂糖凝胶电泳,根据电泳结果初步判定PCR产物的浓度以及条带大小是否正确等。确定无误后,使用GeneJET PCR PurificationKit(Thermo Scientific公司,#K0701)按照说明书要求进行PCR产物纯化。纯化完成后,取2μL纯化产物进行琼脂糖凝胶电泳确定产物成功纯化出来,同时使用NanoDrop(ThermoScientific公司)测量纯化产物的浓度。
(6)T7 Endonuclease I酶切反应及琼脂糖凝胶电泳
本实验使用的T7 Endonuclease I以及配套的10×NEB Buffer 2购自NewEngland Biolabs公司(货号:M0302S)。操作步骤如下:
取200ng纯化PCR产物进行如下反应:
反应体系:
退火条件:
退火反应完成后,杂交双链已经形成,此时再加入T7 Endonuclease I 1μL,震荡混匀后,37℃孵育30分钟完成切割,加入2μL 0.25M EDTA溶液终止酶切反应。反应完成后,使用2%琼脂糖凝胶进行电泳,电泳相关实验步骤参照《分子克隆实验指南》第二版中的琼脂糖凝胶电泳部分。
实施例4 TALEN对HPV16 E6/E7 mRNA转录水平的影响
(1)样品RNA的抽提
①取冻存已裂解的细胞,室温放置5分钟使其完全溶解。
②两相分离每1ml的TRIZOL试剂裂解的样品中加入0.2ml的氯仿,盖紧管盖。手动剧烈振荡管体15秒后,15到30℃孵育2到3分钟。4℃下12000rpm离心15分钟。离心后混合液体将分为下层的红色酚氯仿相,中间层以及无色水相上层。RNA全部被分配于水相中。水相上层的体积大约是匀浆时加入的TRIZOL试剂的60%。
③RNA沉淀将水相上层转移到一干净无RNA酶的离心管中。加等体积异丙醇混合以沉淀其中的RNA,混匀后15到30℃孵育10分钟后,于4℃下12000rpm离心10分钟。此时离心前不可见的RNA沉淀将在管底部和侧壁上形成胶状沉淀块。
④RNA清洗移去上清液,每1ml TRIZOL试剂裂解的样品中加入至少1ml的75%乙醇(75%乙醇用DEPC H2O配制),清洗RNA沉淀。混匀后,4℃下7000rpm离心5分钟。
⑤RNA干燥小心吸去大部分乙醇溶液,使RNA沉淀在室温空气中干燥5-10分钟。
⑥溶解RNA沉淀溶解RNA时,先加入无RNA酶的水40μl用枪反复吹打几次,使其完全溶解,获得的RNA溶液保存于-80℃待用。
(2)按下表1配制PCR反应液(反应液配制均在冰上进行):
表1 PCR反应体系
试剂 |
使用量 |
终浓度 |
SYBR Premix ExTaq(Tli RNaseH Plus)(2×) |
10μl |
1× |
PCR Forward Primer(10μM) |
0.4μl |
0.2μM<sup>*1</sup> |
PCR Reverse Primer(10μM) |
0.4μl |
0.2μM<sup>*1</sup> |
DNA模板(<100ng)<sup>*2</sup> |
2μl |
|
灭菌水 |
7.2μl |
|
Total |
20μl |
|
应用Applied Biosystems 7500Fast Real-Time PCR System进行Real Time PCR反应,反应程序采用两步法PCR扩增标准程序:
Stage 1:预变性
Reps:1
95℃30秒
Stage 2:PCR反应
Reps:40
95℃5秒
60℃30~34秒。
结果如图5所示,其中显示转染后HPV16 E6/E7 mRNA表达水平降低,图中Blank代表未处理的SiHa细胞HPV16 E6/E7表达水平,Vector代表空载体(仅含有载体,不含有TALEN序列)转染后的SiHa细胞HPV16 E6/E7表达水平,E6代表TALEN转染后的SiHa细胞HPV16 E6mRNA表达水平,E7代表TALEN转染后的SiHa细胞HPV16 E7 mRNA表达水平。
HPV16-URR-T1、HPV16-URR-T2、HPV16-URR-T3、HPV16-URR-T4分别代表HPV16-URR-T1、HPV16-URR-T2、HPV16-URR-T3、HPV16-URR-T4转染后SiHa细胞的HPV16 E6/E7 mRNA表达水平,结果显示HPV16-URR-T1具有阳性切割作用,可引起HPVE6和E7 mRNA表达下降。
最后应当说明的是,以上实施例仅用以说明本发明的技术方案而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。
SEQUENCE LISTING
<110> 广州鼓润医疗科技有限公司
<120> 一种靶向敲除HPV URR基因的DNA结合蛋白、系统及其应用
<130> 2019
<160> 8
<170> PatentIn version 3.5
<210> 1
<211> 49
<212> DNA
<213> Human Papillomavirus
<400> 1
tgcacatggg tgtgtgcaaa ccgattttgg gttacacatt tacaagcaa 49
<210> 2
<211> 49
<212> DNA
<213> Human Papillomavirus
<400> 2
tgtataaaac taagggcgta accgaaatcg gttgaaccga aaccggtta 49
<210> 3
<211> 52
<212> DNA
<213> Human Papillomavirus
<400> 3
ctaagggcgt aaccgaaatc ggttgaaccg aaaccggtta gtataaaagc ag 52
<210> 4
<211> 48
<212> DNA
<213> Human Papillomavirus
<400> 4
catgtataaa actaagggcg taaccgaaat cggttgaacc gaaaccgg 48
<210> 5
<211> 36
<212> PRT
<213> 人工序列
<400> 5
Asn His His Asp Asn Ile His Asp Asn Ile Asn Gly Asn His Asn His
1 5 10 15
Asn His Asn Gly Asn His Asn Gly Asn His Asn Gly Asn His His Asp
20 25 30
Asn Ile Asn Ile
35
<210> 6
<211> 30
<212> PRT
<213> 人工序列
<400> 6
Asn Gly Asn His His Asp Asn Gly Asn Gly Asn His Asn Gly Asn Ile
1 5 10 15
Asn Ile Asn Ile Asn Gly Asn His Asn Gly Asn His Asn Gly
20 25 30
<210> 7
<211> 1925
<212> DNA
<213> 人工序列
<400> 7
ctatcgccag caacggtggc ggcaagcaag cgctcgaaac ggtgcagcgg ctgttgccgg 60
tgctgtgcca ggaccatggc ctgaccccgg accaagtggt ggctatcgcc agcaacattg 120
gcggcaagca agcgctcgaa acggtgcagc ggctgttgcc ggtgctgtgc caggaccatg 180
gcctgacccc ggaccaagtg gtggctatcg ccagcaacat tggcggcaag caagcgctcg 240
aaacggtgca gcggctgttg ccggtgctgt gccaggacca tggcctgacc ccggaccaag 300
tggtggctat cgccagcaac attggcggca agcaagcgct cgaaacggtg cagcggctgt 360
tgccggtgct gtgccaggac catggcctga ccccggacca agtggtggct atcgccagca 420
acggtggcgg caagcaagcg ctcgaaacgg tgcagcggct gttgccggtg ctgtgccagg 480
accatggcct gaccccggac caagtggtgg ctatcgccag caacaatggc ggcaagcaag 540
cgctcgaaac ggtgcagcgg ctgttgccgg tgctgtgcca ggaccatggc ctgaccccgg 600
accaagtggt ggctatcgcc agcaacattg gcggcaagca agcgctcgaa acggtgcagc 660
ggctgttgcc ggtgctgtgc caggaccatg gcctgactcc ggaccaagtg gtggctatcg 720
ccagccacga tggcggcaag caagcgctcg aaacggtgca gcggctgttg ccggtgctgt 780
gccaggacca tggcctgacc ccggaccaag tggtggctat cgccagcaac attggcggca 840
agcaagcgct cgaaacggtg cagcggctgt tgccggtgct gtgccaggac catggcctga 900
ccccggacca agtggtggct atcgccagca acaatggcgg caagcaagcg ctcgaaacgg 960
tgcagcggct gttgccggtg ctgtgccagg accatggcct gaccccggac caagtggtgg 1020
ctatcgccag ccacgatggc ggcaagcaag cgctcgaaac ggtgcagcgg ctgttgccgg 1080
tgctgtgcca ggaccatggc ctgaccccgg accaagtggt ggctatcgcc agcaacggtg 1140
gcggcaagca agcgctcgaa acggtgcagc ggctgttgcc ggtgctgtgc caggaccatg 1200
gcctgactcc ggaccaagtg gtggctatcg ccagccacga tggcggcaag caagcgctcg 1260
aaacggtgca gcggctgttg ccggtgctgt gccaggacca tggcctgacc ccggaccaag 1320
tggtggctat cgccagcaac attggcggca agcaagcgct cgaaacggtg cagcggctgt 1380
tgccggtgct gtgccaggac catggcctga ccccggacca agtggtggct atcgccagca 1440
acaatggcgg caagcaagcg ctcgaaacgg tgcagcggct gttgccggtg ctgtgccagg 1500
accatggcct gaccccggac caagtggtgg ctatcgccag caacattggc ggcaagcaag 1560
cgctcgaaac ggtgcagcgg ctgttgccgg tgctgtgcca ggaccatggc ctgaccccgg 1620
accaagtggt ggctatcgcc agcaacaatg gcggcaagca agcgctcgaa acggtgcagc 1680
ggctgttgcc ggtgctgtgc caggaccatg gcctgacccc ggaccaagtg gtggctatcg 1740
ccagcaacaa tggcggcaag caagcgctcg aaacggtgca gcggctgttg ccggtgctgt 1800
gccaggacca tggcctgacc ccggaccaag tggtggctat cgccagcaac attggcggca 1860
agcaagcgct cgaaagcatt gtggcccagc tgagccggcc tgatccggcg ttggccgcgt 1920
tgacc 1925
<210> 8
<211> 1925
<212> DNA
<213> 人工序列
<400> 8
ctatcgccag caacaatggc ggcaagcaag cgctcgaaac ggtgcagcgg ctgttgccgg 60
tgctgtgcca ggaccatggc ctgactccgg accaagtggt ggctatcgcc agccacgatg 120
gcggcaagca agcgctcgaa acggtgcagc ggctgttgcc ggtgctgtgc caggaccatg 180
gcctgacccc ggaccaagtg gtggctatcg ccagcaacgg tggcggcaag caagcgctcg 240
aaacggtgca gcggctgttg ccggtgctgt gccaggacca tggcctgacc ccggaccaag 300
tggtggctat cgccagcaac ggtggcggca agcaagcgct cgaaacggtg cagcggctgt 360
tgccggtgct gtgccaggac catggcctga ccccggacca agtggtggct atcgccagca 420
acaatggcgg caagcaagcg ctcgaaacgg tgcagcggct gttgccggtg ctgtgccagg 480
accatggcct gaccccggac caagtggtgg ctatcgccag caacggtggc ggcaagcaag 540
cgctcgaaac ggtgcagcgg ctgttgccgg tgctgtgcca ggaccatggc ctgactccgg 600
accaagtggt ggctatcgcc agccacgatg gcggcaagca agcgctcgaa acggtgcagc 660
ggctgttgcc ggtgctgtgc caggaccatg gcctgactcc ggaccaagtg gtggctatcg 720
ccagccacga tggcggcaag caagcgctcg aaacggtgca gcggctgttg ccggtgctgt 780
gccaggacca tggcctgacc ccggaccaag tggtggctat cgccagcaac attggcggca 840
agcaagcgct cgaaacggtg cagcggctgt tgccggtgct gtgccaggac catggcctga 900
ccccggacca agtggtggct atcgccagca acaatggcgg caagcaagcg ctcgaaacgg 960
tgcagcggct gttgccggtg ctgtgccagg accatggcct gaccccggac caagtggtgg 1020
ctatcgccag ccacgatggc ggcaagcaag cgctcgaaac ggtgcagcgg ctgttgccgg 1080
tgctgtgcca ggaccatggc ctgaccccgg accaagtggt ggctatcgcc agcaacggtg 1140
gcggcaagca agcgctcgaa acggtgcagc ggctgttgcc ggtgctgtgc caggaccatg 1200
gcctgacccc ggaccaagtg gtggctatcg ccagcaacaa tggcggcaag caagcgctcg 1260
aaacggtgca gcggctgttg ccggtgctgt gccaggacca tggcctgacc ccggaccaag 1320
tggtggctat cgccagcaac aatggcggca agcaagcgct cgaaacggtg cagcggctgt 1380
tgccggtgct gtgccaggac catggcctga ccccggacca agtggtggct atcgccagca 1440
acattggcgg caagcaagcg ctcgaaacgg tgcagcggct gttgccggtg ctgtgccagg 1500
accatggcct gactccggac caagtggtgg ctatcgccag ccacgatggc ggcaagcaag 1560
cgctcgaaac ggtgcagcgg ctgttgccgg tgctgtgcca ggaccatggc ctgactccgg 1620
accaagtggt ggctatcgcc agccacgatg gcggcaagca agcgctcgaa acggtgcagc 1680
ggctgttgcc ggtgctgtgc caggaccatg gcctgacccc ggaccaagtg gtggctatcg 1740
ccagcaacat tggcggcaag caagcgctcg aaacggtgca gcggctgttg ccggtgctgt 1800
gccaggacca tggcctgacc ccggaccaag tggtggctat cgccagcaac ggtggcggca 1860
agcaagcgct cgaaagcatt gtggcccagc tgagccggcc tgatccggcg ttggccgcgt 1920
tgacc 1925