CN102864158A

CN102864158A - 用于基因定点修饰的tale重复片段的高效合成方法

Info

Publication number: CN102864158A
Application number: CN2012103802062A
Authority: CN
Inventors: 魏文胜; 杨君娇; 袁鹏飞
Original assignee: Peking University
Current assignee: Guangzhou Ji Yin Medical Technology Co., Ltd.
Priority date: 2012-09-29
Filing date: 2012-09-29
Publication date: 2013-01-09
Anticipated expiration: 2032-09-29
Also published as: CN102864158B

Abstract

本发明涉及一种TALE重复片段的合成方法。本发明通过对用于PCR扩增的DNA模板以及引物的设计，使用尿嘧啶脱氧核糖核苷酸切除法用尿嘧啶切除试剂（uracil-specific excision reagent：USER）制造DNA片段两端的粘性末端，将含单个、二个或三个TALE重复单位的多个DNA片段按正确顺序连接进载体，获得能表达特异性结合靶基因的TALE蛋白的重组载体，并利用重组载体在细胞中完成靶基因敲除、敲入或过表达、抑制表达。本发明方法省时、简便、正确率高，能够实现高通量、自动化需求。

Description

用于基因定点修饰的TALE重复片段的高效合成方法

技术领域

本发明涉及生物基因工程技术，具体地说涉及应用于基因（特别是真核基因）定点修饰的TALE重复片段的合成方法。

背景技术

TALEs(Transcription activator like effectors)在自然界中，是多种黄单胞菌属（Xanthomonas）产生的用于激活宿主基因表达或促进自身群落化的第三类分泌蛋白(Boch and Bonas,2010;Bogdanove et al.,2010;Scholze and Boch,2011)。有报道证明TALEs蛋白核酸结合域的氨基酸序列与其靶位点的核酸序列有较恒定的关系，TALEs蛋白中含有高度保守、以33-35个氨基酸为单元组成的串联重复序列，每个单元中第12、13位氨基酸负责识别和结合特异的一位核苷酸序列(比如NI识别A,HD识别C,NG识别T，NN识别G以及A，等等)。通过这种关系，TALEs可以特异性结合靶点DNA(Boch et al.,2009;Moscou andBogdanove,2009)。TALEs成功解决了锌指蛋白不能识别任意目标基因序列，以及识别序列经常受上下游序列影响识别特性的问题，是目前将效应蛋白带到特定核酸序列的最有效方法之一(Bogdanove andVoytas,2011)。基于TALE的这一特性，已经发展出多种应用，用于定点修饰或编辑真核基因表达，包括TALE-nuclease chimeras(TALENs)技术（用于基因敲除）(Miller et al.,2011)、TALE介导的特定基因的转录激活(Miller et al.,2011)或者抑制(Cong et al.,2012;Garg et al.,2012;Mahfouz et al.,2012)。

由于任一定制的TALE通常包含大约十个以上的高度重复片段（34a.a./段）,其表达载体的合成难度很大。在近期的研究中，已有多个科研机构利用这种氨基酸与核酸序列的对应关系，模块化组装TALEs，特异性结合目的核酸序列(Briggs et al.,2012;Cermak et al.,2011;Garg et al.,2012;Huang et al.,2011;Li et al.,2012;Li et al.,2011;Morbitzer et al.,2011;Reyon et al.,2012;Sanjana et al.,2012;Weber etal.,2011;Zhang et al.,2011)，但依然存在效率低、周期长、操作繁琐、前体材料种类繁多或花费大等各种不同的问题。

具体来说，2011年Tomas Cermak发表在Nucleic Acids Research上的文章借助亚克隆手段通过不同载体构建粘性末端，根据TALE的不同重复单元所处不同位置选择亚克隆的载体，通过酶切制造唯一位置上特异的粘性末端，这样就可以实现不同的重复单元按照一定顺序进行连接。由于受到连接效率和载体构建的限制只能设计1-10位置的重复单元，所以合成TALE只能分两步进行。另外，此方法准备工作非常复杂，至少需要五天时间(Cermak et al.,2011)。

Rene Geibler小组在上一方法的基础上建立了名为“Golden TALETechnology”的合成方法，将利用亚克隆制造特定位置粘性末端的载体数量缩减为六个，而优化了不同分组之间的克隆载体，从而实现更加高效率更加准确而又不延长时间的方法(Geissler et al.,2011)。

北京大学张博教授发表了一个名为“单元合成”的方法，该方法利用SpeI和NheI两个核酸酶的位点特性设计了两两一组的合成单元，此法准确性高，但是耗时较长(Huang et al.,2011)。

Bing Yang小组提出了名为“modular assembly”的合成方法，该方法利用密码子的简并性通过BsmBI酶切的方法使得每个重复单元可以获得八个不同的粘性末端，所以TALE合成就以位置互相区别的八个组的重复单元为基础进行，一定程度上提高了效率(Li et al.,2011)。以上方法均有各自不同的优缺点，但是同时面临的一个问题就是难以实现TALE的大批量生产。

2012年4月，《自然—生物技术》刊登了来自美国麻省总医院研究人员的最新研究成果，Joung和同事开发了一种称为FLASH（fastligation based automatable solid-phase high-throughput）的快速链接自动化固相高通量的系统，通过在磁珠上装配编码TALEN的基因片段，借助外部磁铁保持位置实现固定化的链接，所需要时间大大缩短，有利于合成的自动化。该方法具有前期准备工作量非常大和前处理比较麻烦等劣势(Reyon et al.,2012)。

发明内容

本发明目的是提供一种用于基因（特别是真核基因）定点修饰的TALE重复序列的合成方法，可用于高通量生产。

本发明使用尿嘧啶脱氧核糖核苷酸切除法用尿嘧啶切除试剂（uracil-specific excision reagent：USER）制造DNA片段两端的粘性末端，通过对用于PCR扩增的DNA模板以及引物的设计，将含单个、二个或三个TALE重复单位的多个DNA片段按正确顺序连接进载体，获得能表达特异性结合靶基因的TALE蛋白的重组载体，并利用重组载体在细胞中完成靶基因敲除、敲入或过表达、抑制表达。

本发明中，术语“TALE重复序列”：除了中间DNA碱基识别区域（RVDs：region of variable di-nucleotides）外，每个TALE重复序列的氨基酸序列都相同。

术语“TALE重复片段”：用于编码TALE重复序列的DNA片段。

术语“DNA模板”，用于合成连接单体的模板，本发明利用密码子简并性的特点，设计了四种DNA单体模板，分别命名为W，X,Y和Z类型。在RVDs编码区域外，这四种序列有较大的差异，但是它们所编码的氨基酸序列则完全相同。

术语“连接单体”，用于合成TALE重复序列的单体，所述连接单体利用本发明设计的16对引物，PCR扩增上述四种DNA单体模板，得到含有尿嘧啶酶切位点的核苷酸序列。

术语“二联体”“三联体”“多联体”，上述两个连接单体按顺序连接形成二联体；上述三个单体按顺序连接形成三联体；上述四个及以上单体按顺序连接形成多联体。

术语“TALE三重复单元”、“预组装三体”，作为PCR扩增的模板，包含三联体组合的可能种类，这些TALE三体满足以下条件：在任意一个TALE三体中同样的DNA序列类型（W，X，Y或Z）不能重复出现以保证PCR产物的唯一性。

本发明提供用于合成TALE重复序列的连接单体，所述连接单体为编码TALE重复序列的DNA片段，所述DNA片段两端具有尿嘧啶酶切位点；所述尿嘧啶酶切后，相邻两连接单体间具有唯一匹配的粘性末端。

所述TALE重复序列除了中间DNA碱基识别区域（RVDs：regionof variable di-nucleotides）外，每个TALE序列的氨基酸序列都相同，所以按顺序串联及合成编码TALE的DNA序列极其困难。本发明利用密码子简并性的特点，设计了四种DNA序列，分别命名为W，X,Y和Z类型。在RVDs编码区域外，这四种序列有较大的差异，但是它们所编码的氨基酸序列则完全相同（见表1）。

所述DNA模板核苷酸序列如SEQ ID NO 1-16任一所示；

W type module：SEQ ID NO 1-4；

X type module：SEQ ID NO 5-8；

Y type module：SEQ ID NO 9-12；

Z type module：SEQ ID NO 13-16。

表1 W、X、Y和Z四种单体模板的序列表

注：其中NNNNNN代表编码RVDs的核酸序列

优选地，编码识别四种不同碱基的RVDs序列分别和上述四种序列类型中的三种配合，组成总共12种编码单个TALE片段的DNA单体模板（TALE monomer）（见表2）。

表2 12种结合不同DNA碱基的TAL effector单体模板（1-mers）集合

本发明还提供了32个含尿嘧啶脱氧核糖核苷酸（下称dUTP或简称U）的引物，这些引物和上述12种TALE单体为模板通过PCR扩增反应后，用尿嘧啶DNA糖基化酶和糖基化DNA裂解酶的混合物（USER）处理，片段上的dUTP及其5’端的短片段就会脱落，裸露出5’缩进的粘性末端。

引物设计原则：利用含dUTP的引物扩增相应的模板，使得两个相邻连接单体间的粘性末端相互匹配，且不匹配的粘性末端之间至少有2碱基的区别。以此来保证完成特异性的连接，因此可以按需求合成任意一种TALE序列。

所述引物的核苷酸序列如SEQ ID NO.17-48所示。

其中，用于扩增W type module的引物：

下游：（SEQ ID NO.17-20）

R-Ww：5’-AGACCGUGTGCTTGGCAGAGCACCGGA

R-Wx：5’-ACCGTGUGCTTGGCAGAGCACCGGAAGG

R-Wy：5’-AAGACCGTGUGCTTGGCAGAGCACCGGAAGG

R-Wz：5’-AAACCGTGUGCTTGGCAGAGCACCGGAAGG中的任一种；

上游：（SEQ ID NO.21-24）

F-Ww：5’-ACGGTCUGACACCAGAGCAAGTAGTGGCTATTG

F-Wx：5’-ATGGCCUGACACCAGAGCAAGTAGTGGCTATTG

F-Wy：5’-AGCAAGUAGTGGCTATTGCAAG

F-Wz：5’-AGAGCAAGUAGTGGCTATTGCAAG中的任一种；

用于扩增X type module的引物：

下游：（SEQ ID NO.25-28）

R-Xw：5’-AGGCCAUGCGCCTGACAAAGGACAGGCAA

R-Xx：5’-ATGCGCCUGACAAAGGACAGGCAAAAGTCTTTGGACT

R-Xy：

5’-ACGACTTGCUCAGGCGTAAGGCCATGCGCCTGACAAAGGACA

R-Xz：5’-ACCTGTUCGGGGGTCAAGCCATGCGCCTGACAAAGGACA中的任一种；

上游：（SEQ ID NO.29-32）

F-Xw：5’-ACACGGUCTCACTCCGGAACAGGTGGTCGCA

F-Xx：5’-AGGCGCAUGGCCTCACTCCGGAACAGGTGGTCGCA

F-Xy:5’-ACTCACUCCGGAACAGGTGGTCGCAATCG

F-Xz：5’-ATGGGCTCACUCCGGAACAGGTGGTCGCAATCG中的任一种；

用于扩增Y type module的引物：

下游：（SEQ ID NO.33-36）

R-Yw：5’-ACTTGCUCTGGTGTCAGTCCGTGGGCTTGGCACAAAACGG

R-Yx：5’-AGTGAGUCCGTGGGCTTGGCACAAAACGG

R-Yy：5’-AAGTCCGUGGGCTTGGCACAAAACGGGC

R-Yz：5’-AATCCGUGGGCTTGGCACAAAACGGGC中的任一种；

上游：（SEQ ID NO.37-40）

F-Yw：5’-ACACGGTCTUACGCCTGAGCAAGTCGTTGCG

F-Yx：5’-AGCAAGTCGUTGCGATCGCCTCC

F-Yy：5’-ACGGACTUACGCCTGAGCAAGTCGTTGCGATC

F-Yz：5’-ATGGGCTUACGCCTGAGCAAGTCGTTGCG中的任一种

用于扩增Z type module的引物：

下游：（SEQ ID NO.41-44）

R-Zw：5’-ACTTGCTCUGGTGTCAGCCCATGAGCCTGACACAGTACTGG

R-Zx：5’-AGTGAGCCCAUGAGCCTGACACAGTACTGGGAGCA

R-Zy：5’-AAGCCCAUGAGCCTGACACAGTACTGGGAGCA

R-Zz:

5’-ACAACCTGUTCGGGGGTCAACCCATGAGCCTGACACAGTACTGGGAGC中的任一种

上游：（SEQ ID NO.45-48）

F-Zw：5’-ACACGGTTUGACCCCCGAACAGGTTGTAGCC

F-Zx：5’-AACAGGUTGTAGCCATAGCTTCT

F-Zy：5’-ACGGATUGACCCCCGAACAGGTTGTAGCC

F-Zz：5’-ACAGGTTGUAGCCATAGCTTCT中的任一种。

其中SEQ ID NO.17和SEQ ID NO.21引物对、SEQ ID NO.25和SEQ ID NO.29引物对、SEQ ID NO.33和SEQ ID NO.37引物对、SEQ ID NO.41和SEQ ID NO.45引物对除外。

所述32个含尿嘧啶脱氧核糖核苷酸（下称dUTP或简称U）的引物具有相互匹配的粘性末端，如表3所示。

表3具有相配粘性末端的对应引物表

注:1、表中在同一行的正向及反向引物为互补引物，也就是说PCR片段经过USER酶或者BsmBI酶切之后，在这两种引物端能够形成可以互相连接的粘性末端。

2、表中在不同行的正向或反向引物均为不互补引物，在任何情况下不会形成匹配连接的粘性末端。

3、下划线处为USER酶酶切位点或者BsmBI酶识别位点

本发明所述连接单体以这12种单体为模板，所述12种模板组合将能够产生所有不同组合顺序的TALE片段。各个连接单体将由PCR合成，其用于相邻片段连接的粘性末端的产生借助于USER酶反应体系。

本发明同时构建了含有TALE蛋白N端、C端非重复区域及ccdB自杀基因，并融合了FokI内切酶活性结构域或VP64转录激活区域的载体，通过BsmBI(Esp3I)内切酶切割可以产生重复单位与载体之间的3’缩进粘性末端（见图1和2）。为了将这些合成的TALE重复序列片段连入合适的表达载体，本发明另外设计了四对含BsmBI(Esp3I)酶切位点的引物（见表3）。

为进一步提高合成效率，本发明预组装了总共64种TALE三重复单元（TALE trimer）。这个集合涵盖了所有可能的三体组合的可能种类，将被用作PCR扩增的模板。这些TALE三体满足以下条件：在任意一个三体中同样的DNA序列类型（W，X，Y或者Z）不能重复出现以保证PCR产物的唯一性（见表4）。

表464种结合不同DNA碱基的TAL effector三体(3-mers)集合

A^wA^yA^z

A^wG^zA^y

C^yA^wA^z

C^yG^zA^w

G^zA^wA^y

G^xG^zA^w

T^xA^wA^y

T^xG^zA^w

A^zA^wC^y

A^wG^zC^y

C^yA^wC^x

C^yG^zC^x

G^zA^wC^y

G^xG^zC^y

T^xA^wC^y

T^xG^zC^y

A^yA^wG^z

A^wG^zG^x

C^yA^wG^z

C^yG^zG^x

G^zA^wG^y

G^zG^xG^y

T^xA^wG^z

T^xG^zG^y

A^yA^wT^x

A^wG^zT^x

C^yA^wT^x

C^yG^zT^x

G^zA^wT^x

G^yG^zT^x

T^xA^wT^z

T^xG^zT^w

A^wC^yA^z

A^wT^xA^z

C^xC^yA^w

C^yT^xA^w

G^zC^yA^w

G^zT^xA^w

T^xC^yA^w

T^zT^xA^w

A^wC^yC^x

A^wT^xC^y

C^yC^wC^x

C^yT^xC^w

G^zC^yC^w

G^zT^xC^y

T^xC^yC^w

T^zT^xC^y

A^wC^yG^z

A^wT^xG^z

C^wC^yG^z

C^yT^xG^z

G^zC^yG^x

G^zT^xG^y

T^xC^yG^z

T^wT^xG^z

A^wC^yT^x

A^wT^xT^z

C^wC^yT^x

C^yT^xT^z

G^zC^yT^x

G^zT^xT^w

T^xC^yT^w

T^xT^zT^w

本发明应用一种特异性切割尿嘧啶的酶，是UDG和核酸内切酶VIII的混合物，UDG催化尿嘧啶碱基的切除，形成一个脱碱基（脱嘧啶）位点，但同时保持了磷酸二酯键骨架的完整性。核酸内切酶VIII的裂解酶活性则分别在脱碱基位点的3′端和5′端裂解磷酸二酯键骨架，释放无碱基的脱氧核糖。含U引物PCR扩增出的片段，利用USER酶处理，迅速产生TALE重复单位间相互配对5′缩进的粘性末端，该粘性末端的长度可由引物序列控制，本发明设计粘性末端均不短于7bp；而现有的方法都是使用内切酶产生粘性末端，长度仅为4bp，且限制性酶切位点有限，对于小单链DNA末端连接有困难。较长的粘性末端保证了足够的多样性，使得连接多片段时的准确性优于目前已发表的各种构建方法。

具体包括以下步骤：

1）序列确定和模板及引物选择：根据目标DNA序列查阅表格2确定模板，然后根据表3确定引物。唯一需要注意的是，如果在同一个三体上所用的正向及反向引物在USER处理后产生可自身连接的粘性末端（表3），则只扩增该三体的前两体，将第三个单元归并到下一三体组合。用于扩增TALE重复片段的引物集合如表5所示。

表5用于PCR扩增TALE重复片段的引物集合

2）PCR扩增反应：反应只能使用PfuTurbo Cx(Agilent)或者Taqpolymerase，30循环(95°C,30s denaturation;60°C,30s annealing;72°C,30s extension)。

3）USER处理及连接反应：PCR产物可以直接进行USER^TM酶处理（37℃，15分钟）以及随后的连接反应（T4 ligase,30min at 16℃）。在同一组反应中，不能出现相同的粘性末端以避免错误连接。

4）琼脂糖凝胶电泳回收正确连接的DNA片段，然后和含有ccdB的表达载体进行基于BsmBI位点的酶切连接。转化大肠杆菌感受态细胞，用菌落PCR、质粒酶切等方法鉴定重组子并测序无误后，即完成了重组TALE蛋白的质粒构建。

用针对特定基因构建的重组质粒转染细胞系，可完成对靶基因的敲除、敲入或过表达、抑制表达。

本发明还提供另一种构建方法，不同之处在于使用免疫磁珠：这一方法使用生物素偶联的引物（Biotin-F-W5,Biotin-F-X5,Biotin-F-Y5或者Biotin-F-Z5）PCR扩增和5′端载体连接的第一个TALE单体或三联体，然后利用磁珠偶联的链霉亲和素实现固相化的重复链接，具体程序参阅文献(Reyon et al.,2012)。在操作简易度及效率方面，方法1优于2。但方法2回避了琼脂糖凝胶电泳回收步骤，更有利于实现自动化需求，操作流程见图4。

本发明的有益效果：

（1）本发明对TALE构建的起始设计（PCR模板及引物选择）简便，易于掌握。

（2）本发明对TALE蛋白重复单位的核苷酸序列进行序列简并性优化所设计的W、X、Y、Z四种不同的核苷酸序列，制造了重复片段之间的区分度，使得PCR扩增产生唯一片段，效率及准确度大大提高。

（3）本发明使用dUTP切除法形成TALE重复单位间的粘性末端，该粘性末端的长度可由引物序列控制，所述粘性末端长度均不短于7bp；而现有的方法都是使用内切酶产生粘性末端，长度仅为4bp。较长的粘性末端保证了足够的多样性，使得我们连接多片段时的准确性优于目前已发表的各种构建方法。

（4）含U引物PCR扩增出的片段，可以利用USER酶处理，迅速产生相互配对5’缩进的粘性末端，不仅高效迅速，而且无需纯化步骤，还能够实现多片段（>6片段）同时连接。优于酶切等其他技术手段。

（5）64种含有三TALE模块的模板质粒设计及构建，不仅极大提高了合成速度，而且由于每一个模块RVD两侧的序列不重复，保证了PCR扩增的单一性和纯度。

（6）整个操作流程不仅整体耗时少（可在一天内完成针对特定基因的TALE蛋白表达质粒构建，而现有的其他方法花费时间为1天至数周不等），需要人工操作的步骤也非常简便，极大地提高了效率，减少了错误率。单个TALE表达载体构建通常可以在5-7小时内完成，而单人可以同时操作10-20个载体构建，能够实现高通量构建TALE表达载体。

（7）序列验证证明，合成的正确率极高。

（8）和其他方法学不同，可以用一个统一的载体装载组装好的TALE片段，而无需用四种载体。

（9）易于扩展：可以使用同样的策略装载、搭建不同的碱基识别RVDs，包括未来可能发现的任意一种新型RVDs。

（10）能够实现高通量、自动化需求。

附图说明

图1为pGL3-TALEN载体示意图；

图2为pLenti-TALE-TA载体示意图；

图3为本发明方法1的操作流程；

图4为本发明方法2的操作流程；

图5为PvuII酶切验证结果；其中，M：标准分子量marker（全式金）；Ctr.为未经TALENs转染的HeLa细胞；Exp.为TALENs作用细胞；

图6为含50ng/ml白喉毒素培养基培养72小时结果；其中Ctr.为未经TALENs转染的HeLa细胞；Exp.为TALENs作用细胞；

图7为TALE-VP64转录激活蛋白对萤火虫荧光素酶报告基因的激活效果。

具体实施方式

以下实施例用于说明本发明，但不用来限制本发明的范围。在不背离本发明精神和实质的情况下，对本发明方法、步骤或条件所作的修改或替换，均属于本发明的范围。

除非特别指明，实施例中所用的技术手段为本领域技术人员所熟知的常规手段。

实施例1 构建用于上调人类NTF-3基因的TALE-TA表达载体

选择人类NTF-3基因的转录激活结合位点，确定载体、模板和引物，查找人类NTF-3基因的启动子区域，选择序列(T)GGAGCCATCTGGCCGGGT作为TALE转录激活因子的结合位点。要合成的TALE重复区域可拆分为六个三单位片段：GGA,GCC,ATC,TGG，CCG，GGT。在模板列表（表4）中查找到这几个片段的序列结构为：G^XG^ZA^W,G^ZC^YC^W,A^WT^XC^Y,T^XG^ZG^Y,C^WC^YG^Z,G^YG^ZT^X

根据模板结构及前、后片段结构，在引物表（表5）中选择引物如下：

表6引物选择表

模板	上游引物	下游引物
			G^XG^ZA^W	F-X5	R-Wz
G^ZC^YC^W	F-Zw	R-Ww
			A^WT^XC^Y	F-Ww	R-Yx
T^XG^ZG^Y	F-Xy	R-Yw
			C^WC^YG^Z	F-Wy	R-Zy
G^YG^ZT^X	F-Yz	R-X3

TALE重复序列的PCR扩增、产物酶切、连接及转化。

用PfuTurbo Cx(Agilent)或者Taq酶PCR扩增以上六个片段，在PCR产物中直接加入尿嘧啶DNA糖基化酶和糖基化DNA裂解酶混合物（USER），37℃温育20min。

混合片段1（G^XG^ZA^W）和片段2（G^ZC^YC^W），加入T4连接酶及其缓冲液，对片段3和4、片段5和6做同样处理，16℃反应2h。将以上三组片段混合，补充连接酶，继续反应2h，加入上样缓冲液，琼脂糖凝胶电泳，回收正确大小的连接产物。

用BsmBⅠ内切酶处理连接产物与pGL3-TALEN载体（图1所示，该载体是将CMV启动子、入核信号肽、TALE蛋白N端非重复序列、ccdB自杀基因、TALE蛋白C端非重复序列及FokI活性结构域按顺序克隆进pGL3-basic载体构建而成），之后混合、连接，转化大肠杆菌感受态DH5α。PCR鉴定重组子，提质粒并测序验证。

实施例2 利用TALENs实现特定基因的敲除

1.针对特定基因选择需合成的TALENs序列。

人类HBEGF基因又被称为DTR基因，该基因产物是白喉毒素在宿主细胞中的受体。该基因被敲除后，宿主细胞应该会对白喉毒素产生完全抗性。

在NCBI（http://www.ncbi.nl m.nih.gov/gene/）数据库中查找人类HBEGF基因的外显子序列信息，并针对该序列设计所用的TALENs。该区域位于HBEGF基因第二个外显子的第81-126位。序列如下：

CCCACTGTATCCACGgaccagctgctaccccTAGGAGGCGGCCGGG

其中大写字母为TALENs结合区域，小写字母为Spacer区域。所需合成TALE为CCCACTGTATCCACG、CCCGGCCGCCTCCTA。Spacer区域中含有一个PvuII酶切位点（下划线标注）。

2.利用ULtiMATE方法合成TALENs。

要合成的TALE重复区域可拆分为六个三单位片段：CCC ACTGTA TCC ACG；CCC GGC CGC CTC CTA。

在模板列表（表4）中查找到这几个片段的序列结构，并从表格5中选择引物。

表7引物选择表

模板	上游引物	下游引物
			C^yC^wC^x	F-Y5	R-Xw
A^wC^yT^x	F-Wx	R-Xz
			G^zT^xA^w	F-Zx	R-Wx
T^xC^yC^w	F-Xw	R-Ww
			A^wC^yG^z	F-Ww	R-Z3

表8引物选择表

模板	上游引物	下游引物
			C^yC^wC^x	F-Y5	R-Xx
G^xG^zC^y	F-Xx	R-Yy
			C^yG^zC^x	F-Yy	R-Xy
C^yT^xC^w	F-Yx	R-Wy
			C^yT^xA^w	F-Yw	R-W3

用PfuTurbo Cx(Agilent)或者Taq酶PCR扩增以上十二个片段，然后在PCR产物中直接加入尿嘧啶DNA糖基化酶和糖基化DNA裂解酶混合物（USER），37℃温育15min。

分别混合两个不同的TALEN片段，加入T4连接酶及其缓冲液，16℃反应30min。加入上样缓冲液，琼脂糖凝胶电泳，回收正确大小的连接产物。

用BsmBⅠ内切酶处理连接产物与pGL3-TALEN载体（见图1），之后混合、连接，转化大肠杆菌感受态DH5α。PCR鉴定重组子，提质粒并测序验证。

3.转染细胞，检测HBEGF基因敲除效率。

本实验使用由DMEM（Invitrogen）培养基培养的HeLa细胞。使用AAD-1001S Nucleofector II（Lonza）电转仪，将0.75μg上游TALEN、0.75μg下游TALEN以及0.5μgpcDNA6-puro质粒转染至1×10⁶个Hela细胞。转染完成后在37℃培养24小时（CO₂5%），然后转移至30℃继续培养72小时。随后将细胞培养至含有2μg/ml嘌呤霉素的培养基中37摄氏度培养48小时，杀死未转染进质粒的细胞，即可进行下一步检测。

提取上一步骤获得的HeLa细胞的基因组DNA，设计引物进行基因组PCR扩增TALEN结合区域：

上游引物：GTGGCCGCCGCTTCGAAAGTGAC；

下游引物：GTCCAAGGATGGGGGGCCTCCA；退火温度65℃，产物全长503bp，并且只在Spacer中含有一个PvuII酶切位点，酶切后产生104bp和399bp两个片段。产物纯化后（全式金PCR产物纯化试剂盒），使用PvuII（TAKARA）进行酶切，琼脂糖凝胶电泳确定在设计的Spacer区域出现片段缺失的概率在50%以上（图5）。

于此同时，使用含50ng/ml的白喉毒素的培养基（该浓度为白喉毒素在HeLa细胞中致死浓度的5倍）培养HeLa细胞，观察抗性表型（图6）。

结果表明，通过ULtiMATE技术路线合成的针对白喉毒素受体基因的TALENs表达载体可以实现有效的HBEGF基因敲除（效率超过50%），而且敲除结果在功能性检测中得到证实。

实施例3 用报告基因检测TALE-VP64转录激活蛋白的作用

用本发明所述方法合成靶位点分别为(T)CTGGCCAAATACGTA,(T)C TGGCCTTTTACGTA,(T)CTGGCCCCCTACGTA,(T)CTGGCCGGGTACGTA的四个TALE重复区域，并装载到融合了TALE非重复区域和VP64转录激活蛋白的真核表达载体pLenti-TALE-TA载体中（见图2，该载体是将CMV启动子、TALE蛋白N端非重复序列、ccdB自杀基因、TALE蛋白C端非重复序列、入核信号肽及VP64转录激活蛋白按顺序克隆进pLentiLox3.7载体构建而成）。

构建在启动子区域分别含有上述四个靶位点的、由miniCMV启动子介导萤火虫荧光素酶(firefly luciferase)基因表达的四个报告质粒（见图7a）。用X-tremeGENE HP转染试剂(Roche)将报告质粒分别转染进HEK293T细胞，并加入含1μg/ml嘌呤霉素的培养基培养3天，再更换普通含10%血清的DMEM培养基培养，以利用质粒自带的嘌呤霉素抗性基因筛选出单克隆。

向每个单克隆细胞株中分别转染四个TALE-VP64转录激活蛋白表达载体（见图7a），并共转染pRL-TK海肾荧光素(renillaluciferase)表达质粒作为内参。48小时后，裂解细胞，通过荧光素酶活性检测来测量细胞中两种荧光素酶的相对表达量，并分析萤火虫荧光素酶报告基因被TALE-VP64蛋白激活表达的程度。

结果如图7b所示，分别针对含有AAA,TTT,CCC,GGG靶位点的TALE对于靶位点相对应的报告质粒都表现出了明显的激活，其中针对GGG的TALE所用RVD为NN，据报道对G和A都有结合，在图7中也有明显表现。而TALE重复序列与靶位点不完全配合的组合，与负对照相比虽有激活，但幅度远小于上述几组。

这一结果说明用本方法合成的TALE-VP64转录激活蛋白具有良好的激活效率和特异性。

虽然，上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述，但在本发明基础上，可以对之作一些修改或改进，这对本领域技术人员而言是显而易见的。因此，在不偏离本发明精神的基础上所做的这些修改或改进，均属于本发明要求保护的范围。

Claims

1.用于合成TALE重复序列的连接单体，所述连接单体为编码TALE重复序列的DNA片段，所述DNA片段两端具有尿嘧啶酶切位点。

2.根据权利要求1所述的连接单体，其特征在于，根据密码子简并性，除RVDs以外，所述连接单体编码相同的氨基酸序列。

3.根据权利要求2所述的连接单体，其特征在于，所述连接单体经尿嘧啶酶切后，相邻两连接单体间具有唯一匹配的粘性末端。

4.根据权利要求1-3任一项所述的连接单体，其特征在于，其为以下引物的扩增产物：

下游引物任选SEQ ID NO 17-20、上游引物任选SEQ ID NO21-24，其中SEQ ID NO 17和SEQ ID NO 21引物对除外；所述引物的DNA模板为SEQ ID NO 1-4任一所示；

或下游引物任选SEQ ID NO 25-28、上游引物任选SEQ IDNO.29-3，其中SEQ ID NO 25和SEQ ID NO 29引物对除外；所述引物的DNA模板为SEQ ID NO 5-8任一所示；

或下游引物任选SEQ ID NO 33-36、上游引物任选SEQ ID NO37-40，其中SEQ ID NO 33和SEQ ID NO 37引物对除外；所述引物的DNA模板为SEQ ID NO 9-12任一所示；

或下游引物任选SEQ ID NO 41-44、上游引物任选SEQ ID NO45-48，其中SEQ ID NO 41和SEQ ID NO 45引物对除外；所述引物的DNA模板为SEQ ID NO 13-16任一所示。

5.由权利要求1-4任一项所述连接单体组装的二联体、三联体或多联体。

6.含有权利要求1-4任一项所述连接单体或权利要求5所述二联体、三联体或多联体的载体。

7.利用权利要求1-4任一项所述连接单体合成TALE重复片段的方法，其特征在于，包括如下步骤：

1）PCR扩增任意连接单体；

2）用尿嘧啶酶切试剂切割任意连接单体，再将切割的任意连接单体通过匹配的粘性末端相连；

3）重复采用步骤2）所述的酶切-连接的操作组装成含有任意重复单元、任意排列顺序的单体串联重复序列。

8.根据权利要求7所述的方法，其特征在于，所述PCR扩增条件为：Pfu Turbo Cx或Taq聚合酶，95°C变性30s；60°C退火20s；72°C延伸20s，30个循环。

9.根据权利要求7所述的方法，其特征在于，利用生物素-磁珠偶联的链霉亲和素进行DNA片段的连接。

10.权利要求1-4任一项所述连接单体、权利要求5所述三联体或权利要求6所述载体在基因敲除、基因敲入、过表达或抑制表达中的应用。