CN106566839B - 一种转录激活样效应子的模块组装方法 - Google Patents
一种转录激活样效应子的模块组装方法 Download PDFInfo
- Publication number
- CN106566839B CN106566839B CN201510641583.0A CN201510641583A CN106566839B CN 106566839 B CN106566839 B CN 106566839B CN 201510641583 A CN201510641583 A CN 201510641583A CN 106566839 B CN106566839 B CN 106566839B
- Authority
- CN
- China
- Prior art keywords
- unit
- module
- asisi
- sequence
- nhei
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 239000012636 effector Substances 0.000 title claims abstract description 12
- 238000013518 transcription Methods 0.000 title claims abstract description 9
- 230000035897 transcription Effects 0.000 title claims abstract description 9
- 108090000790 Enzymes Proteins 0.000 claims abstract description 35
- 102000004190 Enzymes Human genes 0.000 claims abstract description 35
- 238000010367 cloning Methods 0.000 claims abstract description 27
- 239000013598 vector Substances 0.000 claims abstract description 11
- 238000010459 TALEN Methods 0.000 claims abstract description 8
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 claims abstract description 8
- 108091008146 restriction endonucleases Proteins 0.000 claims abstract description 8
- 230000002103 transcriptional effect Effects 0.000 claims abstract description 5
- 238000011144 upstream manufacturing Methods 0.000 claims abstract description 4
- 239000013612 plasmid Substances 0.000 claims description 56
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 claims description 38
- 150000001413 amino acids Chemical class 0.000 claims description 23
- 239000013604 expression vector Substances 0.000 claims description 22
- 239000012634 fragment Substances 0.000 claims description 21
- 235000001014 amino acid Nutrition 0.000 claims description 19
- 230000000694 effects Effects 0.000 claims description 18
- 108091026890 Coding region Proteins 0.000 claims description 13
- 238000003776 cleavage reaction Methods 0.000 claims description 12
- 230000007017 scission Effects 0.000 claims description 12
- 238000001976 enzyme digestion Methods 0.000 claims description 10
- 239000013599 cloning vector Substances 0.000 claims description 9
- 238000002474 experimental method Methods 0.000 claims description 8
- 238000003780 insertion Methods 0.000 claims description 5
- 230000037431 insertion Effects 0.000 claims description 5
- 230000001131 transforming effect Effects 0.000 claims description 4
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims description 3
- 235000004279 alanine Nutrition 0.000 claims description 2
- 239000002773 nucleotide Substances 0.000 claims description 2
- 125000003729 nucleotide group Chemical group 0.000 claims description 2
- 230000003252 repetitive effect Effects 0.000 claims description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 claims 1
- 125000003275 alpha amino acid group Chemical group 0.000 claims 1
- 238000010276 construction Methods 0.000 abstract description 45
- 238000005516 engineering process Methods 0.000 abstract description 11
- 238000010362 genome editing Methods 0.000 abstract description 6
- 230000032965 negative regulation of cell volume Effects 0.000 description 28
- 108020005196 Mitochondrial DNA Proteins 0.000 description 13
- 210000004027 cell Anatomy 0.000 description 13
- 238000013461 design Methods 0.000 description 9
- 108091034117 Oligonucleotide Proteins 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 238000012163 sequencing technique Methods 0.000 description 6
- 108020004414 DNA Proteins 0.000 description 5
- 101710163270 Nuclease Proteins 0.000 description 5
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 4
- 239000013613 expression plasmid Substances 0.000 description 4
- 230000002438 mitochondrial effect Effects 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 108091033409 CRISPR Proteins 0.000 description 3
- 125000000010 L-asparaginyl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])C(=O)N([H])[H] 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- 238000000137 annealing Methods 0.000 description 3
- 230000006698 induction Effects 0.000 description 3
- 108090000623 proteins and genes Proteins 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 108010042407 Endonucleases Proteins 0.000 description 2
- 102000004533 Endonucleases Human genes 0.000 description 2
- 208000026350 Inborn Genetic disease Diseases 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- 230000027455 binding Effects 0.000 description 2
- 239000000539 dimer Substances 0.000 description 2
- 230000005782 double-strand break Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 210000003470 mitochondria Anatomy 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000006780 non-homologous end joining Effects 0.000 description 2
- 230000009437 off-target effect Effects 0.000 description 2
- 235000018102 proteins Nutrition 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000010008 shearing Methods 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 238000010354 CRISPR gene editing Methods 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 102000012330 Integrases Human genes 0.000 description 1
- 108010061833 Integrases Proteins 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- 208000024556 Mendelian disease Diseases 0.000 description 1
- 102000055027 Protein Methyltransferases Human genes 0.000 description 1
- 108700040121 Protein Methyltransferases Proteins 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 241000589634 Xanthomonas Species 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 244000000005 bacterial plant pathogen Species 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 108020001778 catalytic domains Proteins 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 230000007850 degeneration Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000008774 maternal effect Effects 0.000 description 1
- 230000004898 mitochondrial function Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 230000010627 oxidative phosphorylation Effects 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000009790 rate-determining step (RDS) Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000008263 repair mechanism Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000012772 sequence design Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
Images
Landscapes
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种转录激活样效应子的模块组装方法,属于基因组工程领域。所述组装方法具体如下:基于UA法,在TALEs自然单元模块序列的基础上设计了一种新的人工单元模块序列,命名为偏单元(或X单元)。在其两端引入XbaI和NheI同尾酶识别位点的同时,于RVD区上游独特的引入了AsiSI限制性内切酶位点,构成XbaI‑AsiSI‑NheI偏单元(X单元)。同尾酶的引入便于克隆连接,而AsiSI酶切位点的引入则使基础一单元的构建,及后续的定向克隆更加容易,提高克隆效率。该组装法适用于TALEN、mtTALEN等技术中的模块定向组装,简便易行,具有普遍适用性。建立了一种转录激活样效应子的模块组装方法。
Description
技术领域
本发明属于基因组工程领域,具体地说,涉及一种转录激活样效应子的模块组装方法。
背景技术
目前,常用的基因组编辑技术主要包括以下三种:锌指蛋白(zinc fingerproteins,ZFPs)技术、转录激活因子样效应因子(transcription activator-likeeffectors,TALEs)技术、CRISPR(clustered regularly interspaced short palindromicrepeats)技术。它们的大致原理都是通过造成靶向DNA双链断裂(double-strand breaks,DSBs),引发细胞内固有的非同源末端连接(nonhomologous end joining,NHEJ)或同源重组(homology-directed repair,HDR)两种修复机制对DSBs处进行修复,引入插入或缺失突变。其中,TALEs技术自2009年被开发以来,不断完善。较之ZFPs技术,在序列的选择上更为灵活,不具有上下文依赖效应,特异性更高。较之新兴的CRISPR/Cas9技术,脱靶效率较低,是三者中现阶段发展最为成熟的基因组编辑技术。
TALE是植物致病菌黄单胞杆菌Xanthomonas通过III型分泌系统注入到宿主细胞内的一类蛋白效应子。TALEs的N端和C端高度保守,N端包含III型转运信号(translocationsignal),C端包含核定位信号(nuclear localization signal,NLS)、亮氨酸拉链结构(leucine zipper,LZ)和酸性转录激活域(activation domain,AD)。N端和C端之间的中间部分是DNA结合结构域串联重复单元(central repear domain,CRD),包含1.5-33.5个重复单元,每个重复单元含有33-35个氨基酸,多数为34个氨基酸,其中第12和13位氨基酸高度可变,被称为重复可变区(repeat-variable diresidue,RVD),其他氨基酸高度保守,最后一个重复较短,由20个氨基酸组成,称为半个重复单元(0.5unit),每种单元专一识别一个碱基。目前从天然TALEs中发现的多数RVDs中,His/Asp(HD)对应碱基C、Asn/Gly(NG)对应碱基T、Asn/Ile(NI)对应碱基A、Asn/Asn(NN)对应碱基G/A,其中,与碱基G对应的RVD还有NK、NH两种,它们识别G的专一性好于NN,但亲和力较弱。重复可变区重复数目和重复类型的不同,决定了TALEs与寄主识别的特异性。
现在使用的各种人工TALEs系统都源于对天然TALEs的改造,结构上具有相似性。改造后,TALEs的N端只保留136个氨基酸,C端删除NLS和AD后仅剩63个氨基酸,并在N端前添加NLS和Flag(或HA)标签。TALEs蛋白的C端可人工融合相关催化域,如核酸酶、激活子、抑制子、甲基化酶、整合酶等(如图1所示)。其中,在C端融合FokI II型核酸酶后构成的TALE核酸酶(TALENs),可由CRD区识别靶向目标序列,并通过左右两臂FokI形成的FokI二聚体对靶向DNA处造成双链断裂,实现对基因组的有效编辑。
线粒体是存在于大多数真核生物细胞中的细胞器,主要通过氧化磷酸化以ATP的形式为细胞活动提供能量。线粒体DNA(mitochondrial DNA,mtDNA)长度为16,569kb,基因排列紧凑,除与mtDNA复制及转录有关的一小段区域外,无内含子序列。mtDNA表现为母系遗传,突变率高,是细胞核内DNA的10倍左右。mtDNA的突变是导致人类线粒体遗传病及衰老性疾病的重要原因之一。截至目前,已鉴定出超过500多个致病性突变来自mtDNA,而针对mtDNA相关序列的精确改造能力则相对缺乏。
继2006年,Michal Minczuk等将ZFN首次作用于mtDNA,2013年8月,Sandra RBacman等也首次将TALEN用于清除病人线粒体内的突变型mtDNA。这两种基于ZFPs技术、TALEs技术的线粒体基因组编辑工具都为更好的进行线粒体功能研究、线粒体遗传病的治疗等提供了可能。几乎与此同时,本实验室也已完成mtTALEN的构建,并应用本实验室研发的CRD快速连接系统完成了相关CRD的组装,进行活性检测。
CRD的组装是TALEs技术应用的限速步骤,直接影响它的应用效率和构建成本、构建规模。目前,CRD的组装方法有很多,主要分为Golden Gate法、FLASH法和UA法。其中,Golden Gate法基于质粒载体酶切或PCR扩增得到基础单元序列,利用II型核酸内切酶识别位点与切割位点不同的特点,设计出一系列不同的粘性末端,一次连接n个基础单元,可得到n联体模块序列。该方法需准备大量的模块库,以及设计II型核酸酶的识别位点与切割位点,较为繁琐且连接效率有待检验。FLASH法利用生物素-亲和素系统,将重复模块序列一端固定,根据靶向目标序列于另一端递加基础或联体模块序列,至全长序列。该方法对设备和试剂要求高,需准备各种n联体单元模块库。UA法遵循简单原始的方法,根据靶序列选择相应的一单元基础模块序列,两两相连,一变二、二变四,以此类推,最终得到全长序列。该方法涉及大量的克隆步骤,比较耗时,但连接效率较高,序列保真性较好。以上方法中,GoldenGate法和FLASH法,较UA法虽省时,但筛选较为困难、成本较高;UA法虽耗时,但容易筛选、成本较低。若不涉及高通量实验,UA法是一种实用的组装方法。
本发明基于UA法,在TALEs自然单元模块序列的基础上,设计了一种新的人工单元模块序列,命名为XbaI-AsiSI-NheI偏单元(X单元)。该单元的设计,使得重复模块的定向克隆组装更加容易,提高了克隆效率。建立了一种转录激活样效应子的模块组装方法。
发明内容
本发明的目的在于,提供一种转录激活样效应子的模块组装方法。
本发明基于UA法,在TALEs自然单元模块序列的基础上,设计了一种新的人工单元模块序列,命名为偏单元(或X单元)。在偏单元编码序列的两端引入XbaI和NheI同尾酶识别位点的同时(也可为其它同尾酶),在其RVD区上游独特地引入了AsiSI限制性内切酶位点,构成XbaI-AsiSI-NheI偏单元(X单元)。两同尾酶的引入可有效进行模块的定向克隆组装,而AsiSI酶切位点的引入则使基础一单元的构建,以及后续的定向克隆更加容易。
所述TALEs自然单元模块序列一般包含34个氨基酸,由102个碱基对编码。如图2A所示自然单元序列为:LTPEQVVAIASNGGGKQALETVQRLLPVLCQAHG,RVD为NG,对应识别碱基T,其氨基酸序列如SED ID NO.1所示。
所述XbaI-AsiSI-NheI偏单元(或X单元)编码序列,从上一个单元的第19位亮氨酸(Leu,L)开始,到下一个单元的第18位丙氨酸(Ale,A)结尾。如图2B所示该偏单元序列为:LETVQRLLPVLCQAHGLTPEQVVAIASNGGGKQA,RVD为NG,对应识别碱基T。
所述RVD区NG对应识别碱基T,根据目前研究,还有NI对应识别碱基A、HD对应识别碱基C、NN/NK/NH对应识别碱基G,其中,与碱基G对应的三种RVD,虽NK/NH识别G的专一性好于NN,但亲和力较弱,故本发明首先选择识别碱基G的对应氨基酸NN进行后续实验,但并不以此限定本发明。
识别碱基(A、C、G、T)对应的各偏单元序列具见表1:
注:粗体横线部分表示RVD区的氨基酸。
所述XbaI-AsiSI-NheI偏单元(X单元)编码序列,在不影响正常氨基酸序列的同时,利用氨基酸密码简并性原则,在5’端引入XbaI酶切位点-TCTAGA-,3’端引入NheI酶切位点-GCTAGC-(也可为SpeI酶切位点-ACTAGT-)。XbaI-NheI(SpeI)为同尾酶,当前一个X单元的3’端NheI粘性末端与后一个X单元的5’端XbaI粘性末端配对连接后,连接接头处序列变为-GCTAGA-,此时两个限制性酶切位点同时被破坏,不能再次被XbaI、NheI识别。如此类推,后续X单元头尾连接时XbaI-NheI同尾酶克隆连接策略就可以被重复使用。
所述XbaI-AsiSI-NheI偏单元(X单元)DNA编码序列如图2C所示,5’-TCTAGAGACCGTGCAACGGCTGCTCCCAGTTCTCTGTCAAGCCCACGGCCTGACTCCTGAGCAAGTTGTAGCGATCGCAAGTAATGGGGGTGGCAAACAGGCGCTAGC-3’共108bps,从第2位碱基开始编码,至103位编码34个氨基酸,RVD区碱基为AATGGG,对应氨基酸NG,识别碱基T。该序列5’端含XbaI酶切位点、3’端含NheI酶切位点、RVD区上游第71-78位独特地引入了限制性酶切位点AsiSI(-GCGATCGC-),用于基础一单元的构建以及CRD定向克隆入TALEs骨架。
所述TALEs基础一单元,根据AsiSI酶切位点的有无分为活动一单元模块(含AsiSI酶切位点)和固定一单元模块(不含AsiSI酶切位点)。
所述活动一单元模块位于TALEs重复模块的首位,命名为X+序列,依次标记为A+、C+、G+、T+。它们的碱基序列除RVD区外均相同,可不考虑重复性。
所述固定一单元模块位于第2位及后续位置。为了降低TALEs编码序列的重复性,我们根据TALEs氨基酸密码子简并原则,再次设计了非RVD区不完全重复的模块编码序列,序列经排列组合后的计算结果相当庞大,最后从中选取氨基酸序列一致,碱基序列不同但差异率并非最大(折中差异性)的4种基本型,即X1、X2、X3、X4。构建含有4种RVD(NI、HD、NN、NG)的固定一单元模块,依次标记为A1、A2、A3、A4;C1、C2、C3、C4;G1、G2、G3、G4;T1、T2、T3、T4。
所述TALEs基础一单元的相关序列,具体如下:
1)基础一单元RVD区碱基序列分别对应的氨基酸及识别碱基,具见表2:
2)基础一单元的碱基序列基本型,具见表3:
注:粗体波浪线部分表示AsiSI酶切位点;粗体横线部分表示RVD区对应的6个碱基(N为A、C、G、T)。
3)基础一单元的碱基序列,具见表4:
注:粗体波浪线部分表示AsiSI酶切位点;粗体横线部分表示RVD区对应的6个碱基。
本发明涉及的TALEs模块组装方法,在XbaI-AsiSI-NheI偏单元(X单元)的基础上完成。
所述TALEs模块组装,主要涉及两种载体:
1)用于基础一单元构建、多单元模块库构建及模块组装的克隆载体质粒pUC19(或其它)。
2)用于靶向编辑DNA的TALENs表达载体质粒对pCS2-peas和pCS2-perr(或其它)。
所述TALEs模块组装,主要涉及以下几步:
1)含0.5单元模块的TALENs表达载体质粒对改造;
2)活动一单元(X+)的构建;
3)固定一单元(X1、X2、X3、X4)的构建;
4)多单元模块库的构建及CRD组装;
5)含靶向目标序列的TALENs表达载体质粒对的构建。
所述TALENs表达载体质粒对改造,由于本发明所用表达载体质粒对的TALENs骨架N、C端之间本身含有0.5单元(即自然单元序列的前20个氨基酸),如图3所示,通过对该部分的重新设计,于RVD前后引入AsiSI、XbaI两酶切位点,将组装好的CRD经AsiSI/NheI酶切后,由AsiSI/XbaI两酶切位点连入,NheI/XbaI两位点连接后的序列仍包含对应自然单元第18-20位的氨基酸序列ALE,序列不变,位置恰好是自然重复单元最后0.5单元的末尾序列ALE。根据研究表明,最后0.5单元16、17位氨基酸既可以是RP、也可以是KQ。通过对表达载体质粒的改造,定向克隆时无需再单独连接0.5单元。此外,因X+序列中AsiSI/NheI间的片段为连入TALENs表达载体的有效片段,则X+碱基序列的设计可不考虑重复性。
所述活动一单元(X+)的构建,以T+质粒的构建为例。如图4A所示,分别合成两对大小不等且含有合适限制性酶切位点的寡核苷酸片段(T-S1/T-S2、T-L1/T-L2),经退火后,分两次由合适的酶切位点连入克隆载体质粒中,最终连入的T+碱基序列如图4B所示。由于X+的碱基序列无需考虑重复性,则A+、C+、G+质粒的构建可在T+质粒的基础上通过一步克隆,替换AsiSI/NheI间的碱基序列来完成(如图4C所示)。
所述固定一单元(X1、X2、X3、X4)的构建,以X1质粒的构建为例。如图5所示,分别合成两对大小不等且含有合适限制性酶切位点的寡核苷酸片段(A1-L1/A1-L2、A1-S1/A1-S2),退火后的混合模板经PCR(A1-L1/A1-S2引物对)扩增,得A1序列,由XbaI/NheI酶切位点连入克隆载体中,得A1质粒。在A1序列的基础上,经相应引物对扩增,可得C1、G1、T1序列,最终得到C1、G1、T1质粒。X2、X3、X4的构建方法与之相同。
所述多单元模块库的构建,可在固定一单元的基础上完成,构建流程如图6所示。根据各模块的组装模式,前一个模块的NheI/SacI酶切产物为载体(Vector),后一个模块的XbaI/SacI酶切产物为插入片段(Insert),构建多单元模块质粒。
所述多单元模块库的构建,可以使后续的CRD组装效率大大提高。TALEs中央重复模块的数目在1.5-33.5之间变化,在6.5时才具有诱导活性,在10.5或以上时,具有强诱导报告基因活性,12.5时几乎达到最大活性。为了兼顾CRD的长度与结合特异性,在缩小分子量的同时防止脱靶效应的发生,故本发明首先选择12.5个重复单元模块进行组装,但并不以此限定本发明。
所述多单元模块库的构建,因CRD的组装需根据靶向目标序列选择相应的多单元模块分多步克隆完成,而选择的多单元模块间(或模块本身)需按固定一单元4种碱基序列基本型(见表3、表4)将其平均且间隔开来。故,如采用双单元模块库,模块标记为XiXj(i≠j),Xi(X=A、C、G、T;i=1、2、3、4)有16个元素,模块组合数N=C(1,16)*C(1,12)=192,完成一个12.5单元的CRD组装需4步克隆实验(一步克隆实验约需3天);如采用三单元模块库,模块标记为XiXjXk(i≠j≠k),Xi(X=A、C、G、T;i=1、2、3、4)有16个元素,模块组合数N=C(1,16)*C(1,12)*C(1,8)=1536,完成一个12.5单元的CRD组装需3步克隆实验。虽然,较CRD组装时间而言,三单元模块库的构建优于双单元模块库,但基于4种固定一单元基本型,三单元模块库在模块的组合上更加灵活多变,共有1536种,远远大于双单元模块库的192种,模块库的规模较大。基于本实验室的实验条件,本发明首先选择并完成了192种双单元模块库的构建,但并不以此限定本发明,如有条件的科研单位或公司还可进一步通过本方法、或改进的高通量连接法,进一步完成三单元、四单元等模块库的构建。
所述双单元模块库的构建,其具体的XiXj(i≠j)模块构成如表5所示:
所述含靶向目标序列的TALENs表达载体质粒对的构建,其构建流程如图7所示,利用本实验室构建的双单元模块库,经4步克隆实验完成CRD在克隆载体中的组装后,再以该克隆载体AsiSI/NheI酶切产物为插入片段、TALENs表达载体的AsiSI/XbaI酶切产物为载体,一步克隆得含有靶向目标序列的TALENs表达载体。
本发明的一种转录激活样效应子的模块组装方法,具有如下优点:
1)偏单元首尾处同尾酶的引入,可有效进行相关模块的定向克隆连接,提高了TALENs中CRD的组装效率。
2)AsiSI酶切位点的独特引入,使得基础一单元的构建变得非常容易。同时,最后组装成功的CRD可通过AsiSI-NheI双酶切位点定向克隆入TALEs骨架的AsiSI-XbaI之间,不受末位0.5模块RVD的限制,提高了靶序列设计的灵活性和CRD组装效率,优于目前使用较多的NheI单切点克隆。
3)多变的基础一单元基本型设计,在降低TALENs编码序列重复性的同时,提高了TALENs的表达效率。
4)采用该模块组装方法,不仅成本很低(只需几种常见的工具酶,如XbaI、AsiSI、NheI、SacI等),而且手段简单(涉及分子生物实验中最常用到的分子克隆手段等),便于实验室普及。
5)该模块组装法,在提高克隆效率的同时,又保证了TALENs编码序列的高保真性,使得TALENs编码序列重复性可控,可应用于TALEN、mtTALEN等技术中的模块定向组装。
附图说明
图1为人工TALEs的结构示意图。
图2为本发明的偏单元构建示意图。其中,图2A为TALEs自然单元模块序列;图2B为本发明构建的偏单元模块序列;图2C为本发明构建的偏单元模块碱基序列。
图3为本发明的TALENs表达载体质粒改造示意图。
图4为本发明的活动一单元构建流程示意图。其中,图4A为含T+模块的克隆质粒构建示意图;图4B为T+碱基序列;图4C为含A+、C+、G+模块的质粒构建示意图
图5为本发明的固定一单元构建流程示意图。
图6为本发明的多单元模块库构建流程示意图。
图7为本发明的含靶向目标序列的TALENs表达载体构建流程示意图。
图8为pCS2-12.5U-L/R质粒对鉴定结果。其中,图8A为pCS2-12.5U-L/R质粒对酶切鉴定图;图8B为pCS2-12.5U-L正反向测序结果图。
图9为pCS2-12.5U-L/R质粒对活性检测图。
具体实施方式
以下通过具体实施例对本发明进一步说明,但并不限定本发明。在本发明基础上,所做的同类型改进均属于本发明要求保护的范围。
实施例1
TALENs表达载体的改造
本实施例采用的TALENs表达载体质粒对(pCS2-peas、pCS2-perr),为人工改造后的TALENs精简处理骨架,C端融合有FokI II型核酸内切酶,N、C两端之间含有0.5单元模块。本发明通过对0.5单元模块部分的重新设计(如图3所示),于RVD前后分别引入AsiSI、XbaI酶切位点,便于组装完成的CRD以AsiSI-NheI双酶切定向克隆插入表达载体,改造后的TALENs表达载体质粒对分别命名为:pCS2-0.5U-peas和pCS2-0.5U-perr
具体步骤如下:1)分别以pCS2-peas、pCS2-perr两质粒为模板,由0.5-N-F/0.5-N-R引物对扩增全长质粒,引入AsiSI、XbaI两酶切位点;2)PCR产物,经DpnI消化后,直接转化、挑单克隆、PCR鉴定(鉴定引物对pCS2-NF/pCS2-CR)、鉴定正确样品测序。最终,分别得到改造后的TALENs表达载体质粒对pCS2-0.5U-peas和pCS2-0.5U-perr。
相关引物序列具见表6:
注:粗体波浪线部分表示AsiSI酶切位点;粗体横线部分表示RVD区NG对应的6个碱基。
实施例2
TALENs基础一单元的构建
本发明所述TALEs基础一单元,根据AsiSI酶切位点的有无,分为活动一单元(含AsiSI酶切位点)和固定一单元(不含AsiSI酶切位点)。本实施例采用的TALEs模块组装克隆载体质粒为pUC19,也可为其它质粒,并不限定本发明。
2.1活动一单元的构建:
活动一单元(X+)位于TALEs重复模块首位,依次标记为A+、C+、G+、T+,其碱基序列除RVD区外均相同。构建流程如图4所示,通过合成两对寡核苷酸片段,经退火后,分两次连入克隆载体质粒中,得到T+质粒。再以T+质粒为基础,经一步克隆,分别得到A+、C+、G+三种质粒。
具体步骤如下:1)分别合成两对寡核苷酸片段T-S1/T-S2、T-L1/T-L2,经退火后,得到片段T-L、T-S;2)对pUC19质粒做BamHI/SacI双酶切,将片段T-S连入后,经鉴定得正确质粒;3)对步骤2)所得质粒做XbaI/AsiSI双酶切,将片段T-L连入,得到包含T+序列片段的pUC19-T+质粒;4)分别合成三对寡核苷酸片段A-S1/A-S2、C-S1/C-S2、G-S1/G-S2,退火后,分别连入AsiSI/NheI双酶切后的pUC19-T+质粒中,得到分别包含A+、C+、G+序列的质粒pUC19-A+、pUC19-C+、pUC19-G+。
相关引物序列具见表7:
注:粗体波浪线部分表示相关酶切位点;粗体横线部分表示RVD区对应的6个碱基。
2.2固定一单元的构建:
固定一单元(X1、X2、X3、X4)位于第2位及后续位置,为了降低TALEs编码序列的重复性,本发明设计了4种非RVD区不完全重复的模块编码序列基本型,分别构建含有4种RVD(NI、HD、NN、NG)的固定一单元模块,依次标记为A1、A2、A3、A4;C1、C2、C3、C4;G1、G2、G3、G4;T1、T2、T3、T4。构建流程如图5所示,通过合成两对寡核苷酸片段,退火后的混合模板经PCR扩增得相应Xi序列,最终得到pUC19-Xi质粒(X=A、C、G、T,i=1、2、3、4)。
以X1质粒的构建为例,具体步骤如下:1)分别合成两对寡核苷酸片段A1-S1/A1-S2、A1-L1/A1-L2,经退火后,得到片段A1-L、A1-S;2)以A1-L、A1-S为混合模板,由A1-L1/A1-S2引物对,扩增得到A1序列;3)分别以XbaI/NheI双酶切后的pUC19-A+质粒、A1序列片段为载体和插入片段,经连接、转化、挑单克隆鉴定、鉴定正确样品测序,得pUC19-A1质粒;4)C1-S2、G1-S2、T1-S2分别与A1-L1组成引物对,以pUC19-A1为模板,经PCR扩增得C1、G1、T1序列,同步骤3)所述方法,最终得pUC19-C1、pUC19-G1、pUC19-T1。X2、X3、X4质粒的构建方法与之相同。
X1质粒构建的相关引物序列具见表8:
注:粗体波浪线部分表示相关酶切位点;粗体横线部分表示RVD区对应的6个碱基。
X2质粒构建的相关引物序列具见表9:
注:粗体波浪线部分表示相关酶切位点;粗体横线部分表示RVD区对应的6个碱基。
X3质粒构建的相关引物序列具见表10:
注:粗体波浪线部分表示相关酶切位点;粗体横线部分表示RVD区对应的6个碱基。
X4质粒构建的相关引物序列具见表11:
注:粗体波浪线部分表示相关酶切位点;粗体横线部分表示RVD区对应的6个碱基。
实施例3
多单元模块库的构建
本发明所述多单元模块库的构建,可在固定一单元基础上完成(如图6所示)。固定一单元有4种碱基序列基本型(见表3、表4),经排列组合计算,如采用双单元模块库,则模块组合数为192;如采用三单元模块库,则模块组合数为1536。经比较,本实施例首先选择构建双单元模块库,但并不以此限定本发明。
具体步骤如下:根据双单元模块的组装模式,前一个模块的NheI/SacI酶切产物为载体,后一个模块的XbaI/SacI酶切产物为插入片段,经连接、转化、挑单克隆鉴定、鉴定正确样品测序,得相应双单元模块。
实施例4
CRD的组装及活性鉴定
本发明所述的CRD组装,可在本实验室构建的双单元模块库基础上完成(如图7所示)。所述活性鉴定,可在核基因组中整合有靶向目标序列的细胞系中完成,该方法已申请发明专利(申请号:201510454752.X)。
4.1靶向目标序列的选择及CRD组装:
本发明所述CRD组装方法,可用于TALEN、mtTALEN等技术中的模块定向组装。鉴于,本实验室已完成mtTALEN的构建,本实施例首先在mtDNA中选择靶向目标序列,但并不以此限定本发明。
首先,利用TALE-NT2.0在线工具,设计TALENs识别位点和剪切位点。由于FokI核酸酶以二聚体的形式实现对靶向DNA的有效编辑,则需同时构建左右两臂,即Left-arm、Right-arm。又因TALEs中央重复模块的数目在10.5或以上时,具有强诱导报告基因活性,12.5时几乎达到最大活性,为了兼顾CRD的长度与结合特异性,在缩小分子量的同时防止脱靶效应的发生。本实施例首先选择mtDNA(NC_012920.1)中的16347-16387位为靶向目标序列(5’-TCAAATCCCTTCTCGTCCCCATGGATGACCCCCCTCAGATA-3’),并从中分别选取了含有12.5个TALEs模块的左右两臂进行组装,即Left-arm:5’-CAAATCCCTTCTC-3’;Right-arm:5’-ATCTGAGGGGGGT-3’,以验证本发明所述组装方法的可行性,以及TALEN的靶向剪切活性。
其次,根据左右两臂中的12.5个TALEs模块,除第一个碱基选择活动一单元(X+)外,其余碱基均以本实验室构建的双单元模块库(见表5)为基础,从中挑选相应模块,原则上尽量将固定一单元四种基本型(X1、X2、X3、X4)的数目平均且间隔开。
本实施例涉及的左右两臂模块选择如下:
Left-arm:5’-C+A1A2A3T4C2C1C3T4T1C2T3C4-3’;
Right-arm,5’-A+T4C2T1G2A1G3G2G4G1G3G2T4-3’
最后,如图7所示流程,构建TALEN表达质粒对。以Left-arm为例,本实施例构建具体流程如下:1)按Left-arm的模块选择,从双单元模块库中分别挑选6个模块两两组装为四单元模块库,即A1A2+A3T4、C2C1+C3T4、T1C2+T3C4;2)前两个四单元模块分别为载体和插入片段,组装为8单元模块,即A1A2A3T4+C2C1C3T4;3)以步骤2)所得8单元模块为载体、步骤1)所得最后一个四单元模块为插入片段,组装为12单元模块,即A1A2A3T4C2C1C3T4+T1C2T3C4;4)以活动一单元pUC19-C+为载体,步骤3)所得12单元模块为插入片段,组装为13单元模块,即C+A1A2A3T4C2C1C3T4T1C2T3C4;5)以TALENs表达质粒为载体、步骤4)所得13单元模块为插入片段,分别经AsiSI/XbaI和AsiSI/NheI酶切后组装,得含有靶向目标序列的TALENs表达质粒,命名为pCS2-12.5U-L。Right-arm构建方法同理,命名为pCS2-12.5U-R。分别对pCS2-12.5U-L/R做AsiSI/BamHI进行酶切鉴定,片段大小为1448bp(如图8A所示),pCS2-12.5U-L正反向测序结果与理论序列比对,完全正确(如图8B所示),pCS2-12.5U-R同理。
4.2TALENs靶向剪切活性鉴定:
鉴于,本实施例涉及的靶向目标序列在mtDNA中选择。根据本实验室已申请的发明专利:一种筛选线粒体基因组编辑工具靶向目标序列的方法(申请号:201510454752.X),可在核基因组中整合有相应靶向目标序列的细胞系中完成。
具体步骤如下:1)利用转基因技术,在HEK293细胞中构建核基因组含有本实施例所述mtDNA(NC_012920.1)16347-16387位靶向目标序列(5’-TCAAATCCCTTCTCGTCCCCATGGATGACCCCCCTCAGATA-3’)的细胞系;2)将该细胞系接种于35mm细胞培养皿中;3)将pCS2-12.5U-L/R质粒对瞬时转染于细胞中,48小时后收细胞提基因组;4)特异性引物对PCR扩增一段含有靶向剪切位置的序列,反向引物测序;5)测序结果峰图如图9所示,在靶向目标序列处有明显的套峰出现,则该TALENs质粒对具有剪切活性。
Claims (9)
1.一种转录激活样效应子的模块组装方法,其特征在于,基于UA法在TALEs自然单元模块序列的基础上,设计了一种新的人工单元序列,即XbaI-AsiSI-NheI偏单元或X单元,其DNA编码序列为5’-TCTAGAGACCGTGCAACGGCTGCTCCCAGTTCTCTGTCAAGCCCACGGCCTGACTCCTGAGCAAGTTGTAGCGATCGCAAGTNNNNNNGGTGGCAAACAGGCGCTAGC-3’共108bps,从第2位碱基开始编码,至103位编码34个氨基酸,于5’端引入XbaI酶切位点-TCTAGA-,3’端引入NheI酶切位点-GCTAGC-,也可为SpeI酶切位点-ACTAGT-,RVD区碱基如NNNNNN所示,N代表A、C、G、T,并在其上游第71-78位独特地引入限制性酶切位点AsiSI-GCGATCGC-,用于基础一单元与多单元模块库的构建以及CRD双酶切定向克隆,完成TALEs模块组装。
2.如权利要求1所述的转录激活样效应子的模块组装方法,其特征在于,所述的XbaI-AsiSI-NheI偏单元或X单元编码序列,从上一个单元的第19位亮氨酸Leu开始,到下一个单元的第18位丙氨酸Ala结尾。
3.如权利要求1所述的转录激活样效应子的模块组装方法,其特征在于,XbaI-AsiSI-NheI偏单元或X单元的RVD区,NG对应识别碱基T、NI对应识别碱基A、HD对应识别碱基C、NN/NK/NH对应识别碱基G,其中,碱基G的三种对应氨基酸首选NN进行后续实验,各识别碱基对应的氨基酸序列如SEQ ID NO.2-SEQ ID N0.5所示。
4.如权利要求1所述的转录激活样效应子的模块组装方法,其特征在于,在XbaI-AsiSI-NheI偏单元或X单元的基础上完成,主要涉及如下几步:
1)含0.5单元模块的TALENs表达载体质粒对改造;
2)活动一单元X+的构建;
3)固定一单元X1、X2、X3、X4的构建;
4)多单元模块库的构建及CRD组装;
5)含靶向目标序列的TALENs表达载体质粒对的构建。
5.如权利要求4所述的转录激活样效应子的模块组装方法,其特征在于,在该质粒对自身所含0.5单元RVD区前后分别引入AsiSI、XbaI两酶切位点,组装好的CRD经AsiSI/NheI酶切后,由AsiSI/XbaI两酶切位点连入,定向克隆时无需再单独连接0.5单元。
6.如权利要求4所述的转录激活样效应子的模块组装方法,其特征在于,可根据AsiSI酶切位点的有无分为活动一单元模块,即含AsiSI酶切位点和固定一单元模块,即不含AsiSI酶切位点,其中:
1)所述活动一单元模块位于TALEs重复模块的首位,命名为X+序列,依次标记为A+、C+、G+、T+,它们的碱基序列除RVD区外均相同,其核苷酸序列如SEQ ID NO.11、SEQ ID NO.16、SEQ ID NO.21、SEQ ID N0.26所示;
2)所述固定一单元模块位于第2位及后续位置,为了降低TALEs编码序列的重复性,设计了4种非RVD不完全重复的固定一单元模块编码序列基本型,即X1、X2、X3、X4,依次标记为A1、A2、A3、A4;C1、C2、C3、C4;G1、G2、G3、G4;T1、T2、T3、T4,其核苷酸序列如SEQ ID NO.12-SEQ IDN0.15、SEQ ID NO.17-SEQ ID N0.20、SEQ ID NO.22-SEQ ID N0.25、SEQ ID N0.27-SEQ IDN0.30所示。
7.如权利要求4所述的转录激活样效应子的模块组装方法,其特征在于,可在固定一单元的基础上完成,根据各模块的组装模式,前一个模块的NheI/SacI酶切产物为载体,后一个模块的XbaI/SacI酶切产物为插入片段,构建多单元模块质粒。
8.如权利要求4所述的转录激活样效应子的模块组装方法,其特征在于,可根据靶向目标序列选择相应的多单元模块分多步克隆完成,选择的多单元模块间或模块本身需按固定一单元4种碱基序列基本型将其平均且间隔开来。
9.如权利要求4所述的转录激活样效应子的模块组装方法,其特征在于,可利用多单元模块库经多步克隆实验完成CRD在克隆载体中的组装后,以该克隆载体AsiSI/NheI酶切产物为插入片段、TALENs表达载体的AsiSI/XbaI酶切产物为载体,一步克隆得到含有靶向目标序列的TALENs表达载体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510641583.0A CN106566839B (zh) | 2015-10-08 | 2015-10-08 | 一种转录激活样效应子的模块组装方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510641583.0A CN106566839B (zh) | 2015-10-08 | 2015-10-08 | 一种转录激活样效应子的模块组装方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106566839A CN106566839A (zh) | 2017-04-19 |
CN106566839B true CN106566839B (zh) | 2021-07-16 |
Family
ID=58507259
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510641583.0A Active CN106566839B (zh) | 2015-10-08 | 2015-10-08 | 一种转录激活样效应子的模块组装方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106566839B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102584955A (zh) * | 2011-12-31 | 2012-07-18 | 北京唯尚立德生物科技有限公司 | 一种转录激活子样效应因子的固相合成方法 |
CN102787125A (zh) * | 2011-08-05 | 2012-11-21 | 北京大学 | 一种构建tale重复序列的方法 |
-
2015
- 2015-10-08 CN CN201510641583.0A patent/CN106566839B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102787125A (zh) * | 2011-08-05 | 2012-11-21 | 北京大学 | 一种构建tale重复序列的方法 |
CN102584955A (zh) * | 2011-12-31 | 2012-07-18 | 北京唯尚立德生物科技有限公司 | 一种转录激活子样效应因子的固相合成方法 |
Non-Patent Citations (5)
Title |
---|
Crystal structure of a TALE protein reveals an extended N-terminal DNA binding region;Gao, HS等;《CELL RESEARCH》;20121231;第22卷(第12期);1716-1720 * |
Heritable gene targeting in zebrafish using customized TALENs;Huang P等;《Nat Biotechnol》;20110831;第29卷(第8期);699-700 * |
Improved specificity of TALE-based genome editing using an expanded RVD repertoire;Miller, Jeffrey C等;《NATURE METHODS》;20150531;第12卷(第5期);465-471 * |
TALENs 新型模块组装法及活性鉴定方法;高敬;《生物技术通报》;20161231;第32卷(第1期);220-228 * |
类转录激活因子效应物核酸酶(TALEN)介导的基因组定点修饰技术;沈延等;《遗传 HEREDITAS (Beijing)》;20130430;第35卷(第4期);395―409 * |
Also Published As
Publication number | Publication date |
---|---|
CN106566839A (zh) | 2017-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3118319B1 (en) | Transcription activator-like effector assembly | |
AU2017204909B2 (en) | Using rna-guided foki nucleases (rfns) to increase specificity for rna-guided genome editing | |
ES2784754T3 (es) | Métodos y composiciones para modificar un locus objetivo | |
US10011850B2 (en) | Using RNA-guided FokI Nucleases (RFNs) to increase specificity for RNA-Guided Genome Editing | |
JP2018099136A (ja) | 部位特異的酵素および使用方法 | |
US20160017393A1 (en) | Directed endonucleases for repeatable nucleic acid cleavage | |
CN113373130A (zh) | Cas12蛋白、含有Cas12蛋白的基因编辑系统及应用 | |
WO2016135507A1 (en) | Nucleic acid editing systems | |
JP7138712B2 (ja) | ゲノム編集のためのシステム及び方法 | |
US20240209332A1 (en) | Enzymes with ruvc domains | |
CN105154436A (zh) | 包含突变的核酸内切酶识别区dna及其基因组编辑应用 | |
Karagyaur et al. | Practical recommendations for improving efficiency and accuracy of the CRISPR/Cas9 genome editing system | |
JP2022512868A (ja) | C2c1ヌクレアーゼに基づくゲノム編集のためのシステムおよび方法 | |
Zhang et al. | Rapid assembly of customized TALENs into multiple delivery systems | |
Wang et al. | Long sequence insertion via CRISPR/Cas gene-editing with transposase, recombinase, and integrase | |
WO2022066335A1 (en) | Systems and methods for transposing cargo nucleotide sequences | |
CN110499335B (zh) | CRISPR/SauriCas9基因编辑系统及其应用 | |
CN106566839B (zh) | 一种转录激活样效应子的模块组装方法 | |
CN110551762A (zh) | CRISPR/ShaCas9基因编辑系统及其应用 | |
CN113564145B (zh) | 用于胞嘧啶碱基编辑的融合蛋白及其应用 | |
CN114990093A (zh) | 氨基酸序列小的蛋白序列mini rfx-cas13d | |
US20190309283A1 (en) | Method for preparing long-chain single-stranded dna | |
CN111454367B (zh) | 一种碱基编辑分子及其用途 | |
CN110551763A (zh) | CRISPR/SlutCas9基因编辑系统及其应用 | |
Curtis et al. | Recombinant DNA, vector design, and construction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
DD01 | Delivery of document by public notice | ||
DD01 | Delivery of document by public notice |
Addressee: Nie Linghu Document name: Deemed not to have been notified |
|
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20210803 Address after: 102602 high end industrial area of China (Beijing) pilot Free Trade Zone, No. 0028, block D, No. 12 Yushun Road, Daxing District, Beijing Patentee after: Yunyiyi (Beijing) Technology Co.,Ltd. Address before: 100071 No. 17 West Fengtai Road, Beijing, Fengtai District Patentee before: Nie Lingyun |