一种基于大数据的直缘乌头DNA条形码及直缘乌头的鉴定
方法
技术领域
本发明涉及分子鉴定技术领域,尤其涉及一种基于大数据的直缘乌头DNA条形码,及利用该DNA条形码鉴定直缘乌头的方法。
背景技术
直缘乌头(Aconitum transsectum Diels),又名大草乌、草乌、小黑牛,为毛莨科乌头属多年生草本植物,分布于我国云南西北部丽江玉龙山,民间常用于治疗跌打损伤、风湿骨痛等症。直缘乌头的块根是已知药用草乌中最大的,因富含草乌甲素(Bulleyaconitine A)近年来被大量栽培。草乌甲素为二萜生物碱,是目前临床疗效最好,有效剂量和中毒剂量差异最大的作用于外周神经系统的非成瘾性镇痛药物,以草乌甲素为原料的片剂、胶囊剂等剂型作为镇痛药可作为长期用药。然而,与乌头属的其他植物一样,直缘乌头的块根也有大毒。乌头属植物在我国有200余种,在云南省分布的就有70余种,依靠传统的形态分类或显微鉴定的方法在乌头属药用物种的鉴别上存在局限性。为便于规范用药,如何快速准确的鉴定直缘乌头这一问题急需解决。
DNA条形码技术(DNA Barcoding)是通过对一个或多个标准目的基因的DNA序列进行分析,从而快速、准确地进行物种鉴定的技术。近几年来,DNA条形码技术已经被证明是一个行之有效的生物鉴定手段,不仅可对传统鉴定方法作强有力的补充,而且因为其更客观、准确,突破以往对经验的过渡依赖,能帮助鉴定物种。不同的基因片段对不同物种的鉴定能力存在很大差异,根据本发明人的前期研究和已有的研究报道发现,基因片段matK,trnH-psbA和ITS对乌头属物种有一定的鉴别能力,但仍无法有效的将直缘乌头与其他常用的乌头属药用植物进行区分。本发明将在对乌头属药用植物同一物种进行多地方广泛采样的基础上,先构建不同物种的DNA条形码大数据库,然后从中获得直缘乌头的特有信息位点,实现快速鉴定。
发明内容
有鉴于此,本发明的目的在于提供一种基于大数据的直缘乌头DNA条形码,及利用该DNA条形码鉴定直缘乌头的方法,实现快速鉴定,提高鉴定结果的可靠性和准确率。
本发明的技术方案如下:
本发明提供一种基于大数据的直缘乌头DNA条形码,所述DNA条形码为由引物序列SEQ ID NO.1和SEQ ID NO.2扩增得到的总长为443bp的序列,其中第106-112bp为碱基ACTAAGA,第201-210bp为碱基CCTATCTATA。
优选的,所述DNA条形码的序列如SEQ ID NO.3所示。
本发明还提供一种基于大数据DNA条形码的直缘乌头鉴定方法,包括以下步骤:
(1)提取待测样本DNA;
(2)利用DNA条形码引物进行PCR扩增,得到443bp的扩增产物,所述DNA条形码引物序列为SEQ ID NO.1和SEQ ID NO.2;
(3)对所述扩增产物进行测序,按照下列特异性位点进行直缘乌头物种鉴别的序列特征比对:第106-112bp为碱基ACTAAGA,第201-210bp为碱基CCTATCTATA;
若扩增产物符合上述条件,则该待测样本为直缘乌头。
优选的,所述PCR的扩增体系为20μL,组份配比如下:10μmol/L正反向引物各0.5μL,2×Taq PCR MasterMix 10μL,50~100ng/L模板DNA 1.0μL,ddH2O 8μL。
进一步优选的,所述PCR的扩增条件为:95℃预变性2min,1个循环;95℃变性30s,52℃退火1min,72℃延伸2min,35个循环;72℃延伸7min。
优选的,本发明所述测序采用双向测序,所述测序的引物序列如SEQ ID NO.1和SEQ ID NO.2所示。
进一步优选的,所述测序的反应体系为5μL:其中ddH2O 3μL,10μmol/L测序引物0.5μL,测序反应混合物0.5μL,PCR纯化产物1μL。
更优选的,所述测序的反应条件为:96℃预变性10s,50℃退火5s,60℃延伸4min,33个循环。
与现有技术相比,本发明具有以下优点:
本发明通过广泛调查直缘乌头的野外分布区、主要栽培区、野外同域分布物种以及近缘药用物种的资料信息,然后尽可能的进行多个地方采样,构建样品的DNA条形码大数据库,比较并发现直缘乌头特有的序列信息位点,进一步获得其特有的可用于鉴定的DNA条形码。
与传统的形态学鉴定方法以及之前的少数供试物种相比,本发明首次通过对直缘乌头及其近缘的乌头属药用物种进行多地方广泛取样,首次利用psbK-psbI序列作为DNA条形码鉴定直缘乌头,可通过对psbK-psbI序列进行PCR扩增和测序,直接获得鉴定结果,检测结果准确性高、可重复性高,鉴定过程快速,耗时短。
附图说明
图1为构建乌头属药用植物所用的部分样品的PCR扩增产物图谱,其中,位于中间位置的“M”为GeneRuler 100bp Plus DNA Ladder;
图2为乌头属药用植物所用的部分样品比对序列。
具体实施方式
本发明通过广泛调查直缘乌头的野外分布区、主要栽培区、野外同域分布物种以及近缘药用物种的资料信息,然后尽可能的进行多个地方采样,通过构建样品的DNA条形码大数据库,比较并发现直缘乌头特有的序列信息位点,进一步获得其特有的可用于鉴定的DNA条形码。
本发明的直缘乌头DNA条形码为由引物序列SEQ ID NO.1和SEQ ID NO.2扩增得到的总长为443bp的序列,在该序列中,特异性识别位点为:第106-112bp为碱基ACTAAGA,第201-210bp为碱基CCTATCTATA。本发明的扩增引物采用的是psbK-psbI序列的引物,扩增得到的443bp的序列中,根据上述特异性位点的碱基种类即可鉴定直缘乌头。
由于本发明的直缘乌头DNA条形码是基于广泛调查直缘乌头的野外分布区、主要栽培区、野外同域分布物种以及近缘药用物种的资料信息,尽可能多获得的乌头属药用植物材料得到的,考虑到了不同物种间或同一物种内可能存在不同个体间变异位点异同的问题,是一种基于大数据的直缘乌头DNA条形码。采用本发明的上述直缘乌头DNA条形码能够快速准确的对直缘乌头进行鉴定,缩短了鉴定时间,提高了鉴定结果的可靠性和准确性。
本发明通过对待测样本的DNA进行提取,通过对扩增产物进行测序,将扩增产物的序列与本发明直缘乌头DNA条形码中的特异识别位点进行比对,直接获得鉴定结果。检测过程快速,结果准确性高,可用于药用植物直缘乌头的快速鉴定。
本发明中,待测样本的DNA提取方法采用本领域技术人员所熟知的方法。在本发明具体实施例中,采用改良的4×CTAB法提取待测样本的总DNA。本发明对待测样本中DNA来源没有特殊限定,可以为待测样本的叶子、根或茎。
本发明中PCR扩增及对扩增引物进行测序时所用的序列如下:
psbK-R:5'-TTAGCCTTTGTTTGGCAAG-3',(SEQ ID NO.1)
psbI-F:5'-AGAGTTTGAGAGTAAGCAT',(SEQ ID NO.2)。
本发明中,PCR扩增方法及对扩增产物进行测序的方法采用本领域技术人员所熟知的方法即可。
本发明优选采用20μL的PCR扩增体系,组份配比为:10μmol/L正反向引物各0.5μL,2×Taq PCR MasterMix 10μL,50~100ng/L模板DNA 1.0μL,ddH2O8μL。其中,Taq PCRMasterMix中含有0.1U/μl Taq聚合酶,500μM dNTP,20mM Tris-HCl(pH 8.3),100mM KCl,3mM MgCl2。本发明对扩增体系中的试剂来源没有特殊限定,扩增体系中所用试剂均可采用本领域技术人员所熟知的商用试剂。
PCR的扩增条件为:95℃预变性2min,1个循环;95℃变性30s,52℃退火1min,72℃延伸2min,35个循环;72℃延伸7min。上述扩增体系及扩增条件下所有备筛选的样本DNA序列均能成功扩增。本领域技术人员可以在上述技术方案的基础上对扩增体系和扩增条件进行适当合理调整,如改变扩增体系的体积、组分的浓度、调整扩增的温度及时间等,均属于本发明的保护范围。本发明优选对扩增产物进行纯化。采用本领域技术人员所熟知的纯化方法进行即可。若扩增得到443bp的扩增产物,则待测样本有可能为直缘乌头,通过测序比对特异性识别位点对待测样本是否为直缘乌头进行进一步鉴定。
本发明对测序的方式没有特殊限定,采用本领域技术人员所熟知的测序方法,如单向测序或双向测序。在本发明具体实施了中,优选采用双向测序。
本发明中优选采用5μL的测序反应体系:ddH2O 3μL,10μmol/L测序引物0.5μL,测序反应混合物0.5μL,PCR纯化产物1μL。其中测序所用试剂均可采用本领域中所熟知的商用试剂。测序的反应条件优选为:96℃预变性10s,50℃退火5s,60℃延伸4min,33个循环。本领域技术人员可以在上述技术方案的基础上对测序反应体系和测序条件进行适当合理调整,如改变反应体系的体积、组分的浓度、调整测序的温度及时间等,均属于本发明的保护范围。反应完成后,将产物进行沉降、纯化、热变性后,上机进行测序。本发明对沉降、纯化、热变性及测序过程没有特殊限定,采用本领技术人员所熟知的方法。
将测序结果与本发明的直缘乌头DNA条形码进行比对,若满足下列条件则待测样本为直缘乌头:第106-112bp为碱基ACTAAGA,第201-210bp为碱基CCTATCTATA。
本发明采用通用引物及本领域技术人员均能操作的PCR扩增和测序方法即可对其进行快速鉴定,检测过程快速、结果准确性高。
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例对本发明进行详细的说明,但是不能把它们理解为对本发明保护范围的限定。
实施例1:
1、乌头属药用植物标本的采集和保存
查阅文献和国内各大标本馆的馆藏信息,根据DNA条形码的采样要求制定野外采样策略,每个物种尽可能的采集其分布区内不同地方的多个个体,所有个体的叶片用硅胶干燥保存,用于后续的总DNA提取。本发明共获得了40余种(含变种)130份的叶片材料。其中,直缘乌头的样品来自1个野外分布区、3个栽培区,共计12份。材料清单和样品来源见表1。
表1乌头属药用植物标本及来源
2、总DNA提取
利用改良的4×CTAB法提取上述乌头属植物叶片的总DNA,具体步骤如下:
(1)将研钵洗净于烘箱中烘干备用,提取总DNA前用酒精灼烧研钵,杵子,勺子以灭菌。
(2)选取干净的叶片放在研钵中,用液氮冷却材料待水分完全损失后,用力研磨材料使之呈粉末状,然后将研磨好的材料转移到预冷的2ml的离心管中。
(3)在2ml的离心管中加入1ml预热的4×CTAB提取液和2μlβ-巯基乙醇(2%V/V),使材料完全分散在提取液中,在65℃水浴锅中温浴约1.5小时,期间摇匀3~5次。
(4)将温浴的材料取出置于室温下,待冷却至室温后加入等体积的氯仿-异戊醇(体积比24:1)溶液,摇匀5~10分钟,然后以10000~12000转/分钟离心5分钟。
(5)将上清液(约700~800μl)转移到一新的离心管中(注意在吸取过中不要把杂质吸起来),再加入等体积的氯仿-异戊醇(体积比24:1),摇匀5~10分钟,然后以10000~12000转/分钟离心5~10分钟。
(6)将上清液(约450~600μl)转移到一新的离心管中,加入70%体积的异丙醇,沉降DNA,轻轻颠倒2~3次,可见白色絮状沉淀,室温或4℃冰箱中静置30分钟以上,然后10000~12000转离心5~10分钟,弃上清。
(7)用200μl的70%的乙醇和无水乙醇各洗2次,瞬时离心20~30s后弃上清,然后将离心管放在37℃烘箱中(或室温下)使乙醇挥发。待总DNA干燥后加30~50μl TE溶液和1~2μl RNase A于37℃烘箱中用核糖核酸酶(RNaseA)消化2~3小时,然后于-20℃(或4℃)冰箱中保存备用。
3、PCR扩增反应
DNA浓度用紫外分光光度计(UV-VIS spectrophotometer(TU-1800))检测,最后稀释到50~100ng/μL备用。
采用下列引物扩增核糖体DNApsbK-psbI序列:
psbK-R:5'-TTAGCCTTTGTTTGGCAAG-3',(SEQ ID NO.1)
psbI-F:5'-AGAGTTTGAGAGTAAGCAT',(SEQ ID NO.2)。
PCR反应体系为20μL,组份配比如下:正反向引物(10μmol/L)各0.5μL,总DNA 1.0μL(50~100ng/μL),2×TaqPCRMasterMix 10μL,其中,TaqPCR MasterMix中含有0.1U/μlTaqPolymerase(Tiangen),500μM dNTP each,20mM Tris-HCl(pH 8.3),100mM KCl,3mMMgCl2;加ddH2O 8μL。
在以下扩增条件下所有备筛选的引物均能成功扩增:95℃预变性2min,1个循环;95℃变性30s,52℃退火1min,72℃延伸2min,35个循环;结束后72℃延伸7min,4℃保存。
对扩增产物进行纯化,方法按试剂盒(上海生工Sangon)说明操作。使用1.5%的琼脂糖凝胶电泳检测PCR产物,结果证明,本发明扩增条件下所有备筛选的乌头属样本引物均能成功扩增。部分样品电泳图谱参见图1。
4、扩增产物测序
测序反应试剂使用ABI公司的PRISM Dye Terminator Cycle SequencingReactionKit,双向测序。
测序反应体系为5μL:其中ddH2O 3μL,测序引物0.5μL(10μmol/L),测序反应混合物(mix,Big Dye v3.1)0.5μL,PCR纯化产物1μL。
测序引物的序列同步骤3中的扩增引物序列,即SEQ ID NO.1和SEQ ID NO.2。
测序反应条件为:96℃预变性10s,50℃退火5s,60℃延伸4min,33个循环;结束后加20μL沉降剂(无水乙醇:3M醋酸钠=20:1),4℃沉降过夜。沉降产物经70%酒精纯化后加20μL ddH2O在95℃条件下变性2分钟后上样,在ABI 3730自动测序仪上测序。
5、数据分析
运用软件SeqMan(DNAstar)和BioEdit(ver 7.0.0)对测序结果分别进行拼接和比对。矩阵中的插入缺失用“-”代替,构建所有样品的psbK-psbI序列矩阵,获得psbK-psbI序列的数据库。
6、序列比对及直缘乌头的序列特征
序列比对的结果为:整个矩阵全长484bp,由130条序列构成。其中,样品涵盖直缘乌头的野生个体、主要栽培区样品、野外同域分布物种以及近缘药用物种共40种(含变种)。在矩阵中,直缘乌头所有样品的psbK-psbI序列识别位点为:在第118-124bp位置为碱基“ACTAAGA”,第213-222bp位置为碱基“CCTATCTATA”,这些17个碱基在矩阵均以插入的形式存在,其他样品则为缺失。
若仅看单个物种的序列,所有不同来源的直缘乌头扩增序列一致,用引物psbK-R和psbI-F扩增得到的扩增产物序列如SEQ ID NO.3所示,序列总长为443bp,其中第106-112bp为碱基“ACTAAGA”,第201-210bp为碱基“CCTATCTATA”,这些17个碱基为直缘乌头的特有位点。根据本发明所获得直缘乌头的特异信息位点可以作为直缘乌头的DNA条形码用于直缘乌头的鉴定。本发明的鉴定方法仅利用上述引物,通过PCR扩增和测序方法,通过识别上述特异性位点即可对直缘乌头进行快速鉴定。
实施例2
以药材种植区和野外所采集的无花无果的直缘乌头和其他乌头属植株叶片为材料,采用实施例1的方法进行DNA提取,PCR扩增和测序,鉴定结果显示,从已知的直缘乌头植物所获得psbK-psbI-序列在第118-124bp位置为碱基“ACTAAGA”,第213-222bp位置为碱基“CCTATCTATA”,而其他未知乌头属植物未见上述特异性位点。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
序列表
<110> 中国科学院昆明植物研究所
<120> 一种基于大数据的直缘乌头DNA条形码及直缘乌头的鉴定方法
<160> 3
<170> SIPOSequenceListing 1.0
<210> 1
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
ttagcctttg tttggcaag 19
<210> 2
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
agagtttgag agtaagcat 19
<210> 3
<211> 443
<212> DNA
<213> Aconitum transsectum
<400> 3
atagattatc catttttata ccacatattc cattttgaca ccaaaccaag aaataaagtg 60
gtttctctaa aagaaaggaa gtttcataaa tttatttgta ataagactaa gaactaagac 120
aagaagactc tttcggtatt aaaattatct tttatgcgca caacacaatt caattagttt 180
tttattgtgg ggaccctata cctatctata cctatatagt atagggtcct tgttcactgg 240
aagtagaagg ttagaatgag gaagtgaggt gatctagatt catcgcgctt atccaagaat 300
ttccatgttt gaattgaggg ttcacaatgt aagacttatc tgatcttatc aattgattgt 360
tagaatcttt ttttttattg aaaaaatctt gaatgttttg tttgtaggac agtattaaag 420
attttatcga aaactgacag cag 443