发明内容
本发明提供一种精准高效的转基因载体及其构建方法和应用。本发明以MC R方法为基础,通过Cas9的自身催化作用在进行精准基因修饰的过程中,将外源目的基因以及Cas9基因一起转入家蚕基因组,获得纯合体。
本发明的技术方案如下:一种精准高效的转基因载体,所述转基因载体通过编码CRISPR/Cas9蛋白的基因、gRNAs的DNA模板、目的基因侧翼的同源臂和需要转入的目的基因完整地组装到同一质粒载体中获得。
进一步地,所述转基因载体中还引入有启动子和调控元件。
进一步地,所述目的基因为EGFP基因或DsRed基因。
所述目的基因对应的gRNA1的序列如SEQ ID NO.1所示;目的基因对应的gRNA2的序列如SEQ ID NO.2所示。gRNA1和gRNA2配合Cas9蛋白可以在家蚕基因组需要定点转入目的基因的地方进行切割形成DNA double-strand br eaks(DSBs),实现精准转基因。
进一步地,所述目的基因对应的同源臂HA1的序列如SEQ ID NO.3所示;所述目的基因对应的同源臂HA2的序列如SEQ ID NO.4所示。
进一步地,所述目的基因、gRNA1、gRNA2、Cas9序列、p2A肽、同源臂HA1、同源臂HA2、U6启动子、BmFIBH启动子和骨架载体利用同源重组酶重组连接,相邻片段连接时有15~25个bp的重合区域。
所述骨架载体以pMD19-T质粒载体为模板,用高保真Pfsion DNA聚合酶扩增,扩增后的线性化骨架载体割胶纯化,去除环状模板pMD19-T质粒。
本发明第二方面,提供一种精准高效的转基因载体的构建方法,所述构建方法包括以下步骤:
步骤(1)针对目的基因以及目的基因侧翼进行序列分析,从NCBI中检索家蚕的BmFIBH基因序列,定位到Fib-H基因的完整CDS序列后,选取CDS序列的上游和下游即可得到合适的目的基因的同源臂(一般的同源臂的长度选在500bp到1000bp之间);
步骤(2)针对目的基因以及目的基因侧翼进行序列分析,结合已有在线软件与gRNA脚本共同预测靶位点,根据靶位点获得gRNA体外转录模板;
步骤(3)将获得的编码CRISPR/Cas9蛋白的基因、gRNAs的DNA模板、目的基因侧翼的同源臂和需要转入的目的基因完整地组装到同一质粒载体中得到转基因载体;
步骤(4)将获得的转基因载体转染细胞或生物体中。
本发明第三方面,提供所述转基因载体在转基因或基因修饰中的应用。
本发明的特点如下:本发明以MCR方法为基础,通过Cas9的自身催化作用在进行精准基因修饰的过程中,将外源目的基因以及Cas9基因一起转入家蚕基因组,在G0代中就可以产生纯合体,即一个拷贝上产生的突变就会自动传播到其等位基因上。CRISPR/Cas9介导的转基因策略可以在家蚕细胞以及家蚕G0代产生转基因的纯合基因型。本发明认为该策略可能是通过整合到基因组中的Cas9基因以及gRNAs自我催化切割,对未被整合的野生型位点进行自动切割,提高整合效率,直到基因组中完全没有gRNAs特异性识别的位点为止。即使是整合到基因组里的载体的数量极少,理论上通过自动催化功能,目的插入片段也可以传遍整个基因组形成纯合体。
与现有技术相比,本发明具有以下有益效果:本发明可以显著减少实验室进行基因操作的工作量以及后续杂交等,缩短了纯合体产生的时间,显著提高了转基因的效率。
具体实施方式
下面结合具体实施例对本发明的技术方案做进一步详细说明,但本发明并不局限于以下技术方案。
以下实施例中的Cas9序列和EGFP基因或DsRed基因基因的序列可以在NCBI查询得到,本发明通过北京擎科新业生物技术有限公司合成引物,在相关载体上PCR扩增得到Cas9序列和EGFP基因或DsRed基因。骨架载体以pMD19-T载体为模板,用高保真Pfsion DNA聚合酶扩增骨架载体,扩增后的线性化骨架载体割胶纯化,去除环状模板质粒,-20℃保存备用,查询NCBI得到启动子U6和P2A序列后,通过北京擎科新业生物技术有限公司直接合成相关序列。
实施例1
本实施例整体的实验路线如图1所示:
1、gRNA获取:
从NCBI中检索家蚕的BmFIBH基因序列(GenBank:AF226688.1)。利用2015年才整合家蚕基因组的Cas9-gRNA靶位点预测网页版(http://crispr.dbcls.jp/),在该基因上、下游400bp DNA序列内设计候选gRNA靶位点。候选靶位点信息(如表1)。
2、骨架载体获取:
以pMD19-T载体为模板,用高保真Pfsion DNA聚合酶扩增骨架载体。扩增后的线性化骨架载体割胶纯化,去除环状模板质粒,-20℃保存备用。
3、同源臂获取:
同源臂的选取尽量靠近产生DBS的位置,距离PAM序列(NGG),2到3个碱基处。以家蚕基因组为PCR扩增模板,用高保真Pfsion DNA聚合酶扩增前同源臂(HA1)和后同源臂(HA2)
4、Cas9序列获取:
以本实验室保存的pCS7-Cas9质粒为模板,用高保真Pfsion DNA聚合酶扩增完整Cas9编码序列,连接克隆载体,Sanger测序后,-20℃保存备用。
家蚕转基因MCR载体工作流程
基于In-fusion一步法同源重组技术,将编码CRISPR/Cas9蛋白的基因、gR NAs的DNA模板、同源臂和需要转入的目的基因完整地组装到同一个质粒载体中。通过引入适当的启动子和调控元件让目的基因以及Cas9基因一起转入基因组内,并且通过Cas9的自我催化作用,实现G0代产生一定比例的纯合转基因个体。具体的MCR转基因载体工作流程如图2所示。
(A-C)包含Cas9元件,一对靶向gRNAs和目的基因上下游同源序列的转基因质粒。(A)表示翻译后的Cas9与载体中转录的gRNAs作用,在目的基因的5’端和3’端切割,形成DNA双链断裂,再通过同源重组将核心的Cas9-gRNAs元件插入到靶位点[(B)和(C)];(D-F)表示插入的Cas9-gRNAs表达Cas9蛋白,转录生成gRNAs,进而产生更多的DNA双链断裂(D),通过同源重组介导将DNA双链断裂自动传播到等位基因上,最终得到纯合体[(E)和(F)]。HA1和HA2表示的是目的基因侧翼的同源臂。
家蚕转基因MCR载体构建
gRNA的转录模板在体外扩增及纯化见图3,图3中泳道1至泳道5分别表示sgRNA1-191、sgRNA1-206、sgRNA2-4、sgRNA2-157以及sgRNA2-178体外转录模板。L自下而上依次为100、250、500、750、1000和2000nt。
Cas9-sgRNA活性体外验证(图4)
Cas9-sgRNA活性体外验证如图4所示,图4中泳道1和3为体外检测sgR NA1-191和sgRNA1-206靶位点活性的底物序列(1133bp),泳道5、7和9分别为体外检测sgRNA2-4、sgRNA2-157以及sgRNA2-178靶位点活性的底物序列(785bp)。泳道2、4、6、8和10分别为检测对应的sgRNAs体外切割后反应液。由图4可见,sgRNA1-206和sgRNA2-4与Cas9配合具有较高的切割活性,其他的gRNAs未见切割反应后特异性条带或者活性很低。L自下而上依次为100、250、500、750、1000和2000nt。
MCR转基因载体中gRNAs的确定
具体的gRNAs序列见表2。
MCR转基因载体各元件的连接
将获得的片段gRNAs、Cas9完整序列、P2A序列、HA1、HA2、转入的标记基因(EGFP/DsRed)、U6启动子、BmFIBH启动子、骨架载体进行重组连接。由于每个片段与其相邻片段都有大约20bp的重合区域。利用同源重组酶,将11个大小在100bp至4200bp范围内的DNA片段重组起来。具体实验条件:目的DNA片段和线性化载体以摩尔比1﹕4至3﹕1加到0.25μL PCR管中进行反应,骨架载体的用量为200ng。反应体系如表3,混匀后在50℃孵育30-40min,然后转移到冰上。使用10μL反应液转化到200μL感受态细胞效率大于5×107cfu/μg感受态细胞中,剩余连接液可以保存在-20℃备用。具体流程示意图见图5。
MCR转基因载体图谱与验证
所有MCR转基因载体中所需DNA元件分别割胶回收纯化,克隆测序至序列完全正确后,在In-Fusion反应液中进行连接反应。转化感受态大肠杆菌DH5α后,挑取转化子使用检测引物进行菌落PCR检测并克隆测序(图6和图7)。选取阳性菌落提取质粒DNA,利用Not I单酶切以及Nco I和Cla I双酶切验证,酶切鉴定结果与预期目的片段大小合适(图8)。最终确定的MCR转基因载体(PMD-HA1-U-gRNAs-FIBH-Cas9-P2A-EGFP-HA2,下文称作pCas9-EGFP载体;PMD-HA1-U-gRNAs-U-Cas9-P2A-DsRed-HA2,下文称作pCas9-DsRed载体)图谱如图9所示。
图6中泳道1和泳道5为HA2片段、泳道2和泳道3为HA1片段、泳道4和泳道7为U6启动子片段、泳道6为EGFP片段、泳道8为DsRed片段,L自下而上依次为100、250、500、750、1000和2000nt;图7中各检测引物PCR扩增的片段测序结果。
高效表达pCas9-EGFP载体DZNU-Bm-12细胞系的构建
本实施例通过构建MCR转基因载体pCas9-EGFP质粒,采用脂质分子技术开发的具有更高效率转染质粒DNA和极低毒性的Attractene转染试剂转染家蚕DZNU-Bm-12细胞,30h后观察到发绿色荧光的细胞(图10);表明P2A肽段自切割正常、BmFIBH基因启动子具有较强的转录活性,能够成功转录编码Cas9蛋白以及EGFP蛋白的基因。
随着细胞不断传代,至转染后第10天,筛选到的pCas9-EGFP-DZNU-Bm-12细胞系呈现比较亮的绿色荧光。本实施例用pCas9-EGFP质粒特异性引物对细胞基因组进行PCR扩增,配合细胞观察,从基因和蛋白水平检测了DZNU-Bm-12细胞中pCas9-EGFP质粒表达情况。结果表明,转染pCas9-EGFP质粒后的细胞基因组中检测到特异性MCR载体目的基因、在野生型细胞基因组中检测未能检测到(图11)。这表明Cas9和EGFP基因已经成功导入到一部分的DZNU-Bm-12细胞基因组并能稳定表达。
图10中细胞转染后30h和10d,在白光和绿色荧光下观察DZNU-Bm-12细胞照片。图中的线段长度表示200μm。图11中细胞转染后10d,提取细胞基因组,pCas9-EGFP载体特异性引物扩增出的目的条带。泳道1和3的基因组为野生型,泳道2和4的基因组带绿色荧光的突变型。
MCR介导的转基因家蚕的表型观察
本实验通过显微注射和基因枪导入MCR转基因载体进入家蚕卵,结果表明pCas9-DsRed质粒在卵中的成功瞬时表达(图12),但是由于孵化率低,成功孵化出幼虫的个体,没有观察到红色荧光;在化蛹前成功观察到pCas9-EGFP质粒表达的绿色荧光(图13)。筛选观察到荧光的幼虫,进一步检测这些个体的基因型。
图12中A-D为显微注射pCas9-DsRed质粒后观察到的DsRed瞬时表达;E-H为基因枪导入pCas9-DsRed质粒后,观察到弱的DsRed瞬时表达。白色箭头表示DsRed荧光。
图13中A和B为野生型家蚕5龄末期,C和D为显微注射pCas9-EGFP质粒后成功孵化的家蚕5龄末期。A和C在白光下拍摄、B和D在荧光显微镜下拍摄。白色三角形表示家蚕丝腺中有EGFP表达。图中的线段长度表示1cm。
MCR载体介导的转基因家蚕表型统计与基因型鉴定
显微注射注射48h后开始,就可以在体视荧光显微镜下观察到瞬时表达MCR载体的家蚕卵。随着发育的进行,瞬时表达产生的荧光会越来越弱,直至大多数家蚕卵都检测不到荧光。通过观察成功孵化的蚁蚕,统计表型。
为了检测该MCR转基因效率,本实施例分别收集了G0代显微注射操作后正常孵化并且能观察到荧光的个体3、4龄期以及化蛹时褪去的表皮,提取基因组DNA。用两对锚定引物和一对MCR载体中间特异性引物(图14)对表皮DNA进行PCR扩增(图15)后测序,与对照组比较。无杂峰并且序列与家蚕基因组DNA以及MCR载体上对应序列一致,则表明MCR转基因载体成功介导目的基因转入该个体基因组并且为纯合子;有杂峰并且序列与家蚕基因组DNA以及MCR载体上对应序列基本一致或者只能比对到其中的一部分,则表明MCR转基因载体成功介导目的基因转入该个体基因组并且为杂合子;不能扩增目的片段或者测序后与对照组比对不上的判为该个体基因组中不存在MCR载体介导的转基因成分(图16和图17)。
统计突变个体数与未突变个体数,计算转基因效率。统计结果如表4所示,共随机检测了14个能观察到绿色荧光的注射pCas9-EGFP质粒的个体,其中有10个成功检测到转基因载体中的特异性片段,并且9个个体为纯合子,所以转基因效率大约为71.4%(10/14)。
根据以上实验结果,CRISPR/Cas9介导的转基因策略可以在家蚕细胞以及家蚕G0代产生转基因的纯合基因型。本实施例初步分析认为该策略可能是通过整合到基因组中的Cas9基因以及gRNAs自我催化切割,对未被整合的野生型位点进行自动切割,提高整合效率,直到基因组中完全没有gRNAs特异性识别的位点为止。即使是整合到基因组里的载体的数量极少,理论上通过自动催化功能,目的插入片段也可以传遍整个基因组,形成纯合体。
以上5对检测引物PCR扩增出目的条带后,克隆测序、比对结果。图16中无杂峰并且序列与家蚕基因组DNA以及MCR载体上对应序列一致,则表明MCR转基因载体成功介导目的基因转入该个体基因组并且为纯合子;图17有杂峰并且序列与家蚕基因组DNA以及MCR载体上对应序列基本一致或者只能比对到其中的一部分,则表明MCR转基因载体成功介导目的基因转入该个体基因组并且为杂合子。
SEQUENCE LISTING
<110> 云南瑞火生物科技有限公司
<120> 一种精准高效的转基因载体及其构建方法和应用
<130> 2017.09.18
<160> 4
<170> PatentIn version 3.3
<210> 1
<211> 100
<212> DNA
<213> 人工合成
<400> 1
ggttgtggca tcacgccgat gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt 100
<210> 2
<211> 100
<212> DNA
<213> 人工合成
<400> 2
ggcggatata gcagacgtga gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt 100
<210> 3
<211> 929
<212> DNA
<213> 人工合成
<400> 3
tagcgagact aacgaacagc aattcatttt tatatacaca gatttatgtt accggggtct 60
agtgacctaa acgacttcag ctctaacact aggctaactc aggcttagta gcctggtcct 120
agtgttagat ttgaagtcgt ctaatgcaaa gattattgga tctgatggat ccgtaaggac 180
gtgtctagag cgtcgacggt gactagctcc tgcgtgatca ggaaaaatgt ggaaagctta 240
acgattttgt cacattttac ttatcacaac ttgtttttat aataattcgc ttaaatgagc 300
agctattact taatctcgta gtggtttttg acaaaatcag cttctttaga actaaaatat 360
catttttttc gtaatttttt taatgaaaaa tgctctagtg ttataccttt ccaaaatcac 420
cattaattag gtagtgttta agcttgttgt acaaaactgc cacacgcatt tttttctcca 480
ctgtaggttg tagttacgcg aaaacaaaat cgttctgtga aaattcaaac aaaaatattt 540
tttcgtaaaa acacttatca atgagtaaag taacaattca tgaataattt catgtaaaaa 600
aaaaatacta gaaaaggaat ttttcattac gagatgctta aaaatctgtt tcaaggtaga 660
gatttttcga tatttcggaa aattttgtaa aactgtaaat ccgtaaaatt ttgctaaaca 720
tatattgtgt tgttttggta agtattgacc caagctatca cctcctgcag tatgtcgtgc 780
taattactgg acacattgta taacagttcc actgtattga caataataaa acctcttcat 840
tgacttgaga atgtctggac agatttggct ttgtattttt gatttacaaa tgtttttttg 900
gtgatttacc catccaaggc attctccag 929
<210> 4
<211> 416
<212> DNA
<213> 人工合成
<400> 4
gcttcctctg tgtcatctgc ttcatctcgc agttacgact attctcgtcg taacgtccgc 60
aaaaactgtg gaattcctag aagacaacta gttgttaaat tcagagcact gccttgtgtg 120
aattgctaat ttttaatata aaataaccct tgtttcttac ttcgtcctgg atacatctat 180
gttttttttt tcgttaataa atgagagcat ttaagttatt gtttttaatt actttttttt 240
agaaaacaga tttcggattt tttgtatgca ttttatttga atgtactaat ataatcaatt 300
aatcaatgaa ttcatttatt taagggataa caataatcca tgaattcaca tgcacattta 360
agacaaaact aaattacaat aggttcatat aaaaacaaca agtatgcctt ctcaac 416