CN114990201B - 一种基于粪便总dna应用于不同遗传分析的可行性评估方法 - Google Patents

一种基于粪便总dna应用于不同遗传分析的可行性评估方法 Download PDF

Info

Publication number
CN114990201B
CN114990201B CN202210639547.0A CN202210639547A CN114990201B CN 114990201 B CN114990201 B CN 114990201B CN 202210639547 A CN202210639547 A CN 202210639547A CN 114990201 B CN114990201 B CN 114990201B
Authority
CN
China
Prior art keywords
dna
nudna
mtdna
host
fecal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210639547.0A
Other languages
English (en)
Other versions
CN114990201A (zh
Inventor
徐艳春
崔靓玉
杨淑慧
刘博洋
兰天明
李晓平
刘欢
张小芳
李海盟
朱翌馨
张乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BGI Shenzhen Co Ltd
Northeast Forestry University
Original Assignee
BGI Shenzhen Co Ltd
Northeast Forestry University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BGI Shenzhen Co Ltd, Northeast Forestry University filed Critical BGI Shenzhen Co Ltd
Priority to CN202210639547.0A priority Critical patent/CN114990201B/zh
Publication of CN114990201A publication Critical patent/CN114990201A/zh
Application granted granted Critical
Publication of CN114990201B publication Critical patent/CN114990201B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6851Quantitative amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/40Population genetics; Linkage disequilibrium
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/20Sequence assembly

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Zoology (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Immunology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Ecology (AREA)
  • Physiology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

一种基于粪便总DNA应用于不同遗传分析的可行性评估方法,属于分子生物学技术领域。为了填补当前粪便DNA应用于不同遗传分析场景下的质控方法以及可行性标准的空白,本发明以细菌的16srRNA基因、动物线粒体基因组上的ND5基因和核基因组上的RPS27A基因为目标,采用相应引物建立荧光定量PCR体系,分别测定粪便总DNA中细菌DNA、动物线粒体DNA(mtDNA)和核DNA(nuDNA)的拷贝数。以细菌DNA的拷贝数为参照,构建了mtDNA和nuDNA相对丰度(RmtDNA、RnuDNA)两个指标,并分别建立了粪便DNA应用于以PCR技术为基础的SNP分型、STR分型和以高通量测序技术为基础的线粒体基因组组装和全基因组重测序场景下的成功率与RmtDNA和RnuDNA的关系模型,作为预评估粪便DNA在不同遗传分析中可用性的工具。

Description

一种基于粪便总DNA应用于不同遗传分析的可行性评估方法
技术领域
本发明属于分子生物学技术领域,具体涉及一种基于粪便总DNA应用于不同遗传分析的可行性评估方法。
背景技术
在野生动物相关研究中,粪便由于可获得性高,可在不伤害、不接触动物的前提下进行采样,并且数量充足、易于收集,目前已成为获取野外或部分饲养动物遗传信息最为常用的非损伤性材料。利用粪便中提取的DNA进行分子生物学分析,不仅可以了解动物的种属、性别、个体识别等个体水平的信息,也可以了解其种群特征,如估算和监测种群数量的动态变化、遗传多样性、群体遗传结构、种群系统发育史、种群间的基因交流等。这些分析为野生动物的生态学、生物学研究提供了坚实的数据基础,在保护生物学和分子生态学领域中得到了广泛应用。
然而在实际应用中,以粪便DNA为模板的分析结果普遍存在着PCR扩增失败、等位基因缺失、等位基因信号峰不平衡、以及基因组重测序中与参考基因组比对率过低等诸多问题。造成这些现象的根本原因在于,粪便中的总DNA中除了动物DNA(或称宿主DNA)外,还包含大量的肠道微生物DNA和残存的食物DNA。其中动物DNA主要来源于脱落的肠上皮细胞,又称内源性DNA,仅占粪便总DNA的极小部分(例如,黑猩猩为0.5%-5.2%,狒狒为0.01%-3.1%);而外源性DNA以细菌DNA为主体,占据粪便总DNA的95%以上。在大量外源性DNA的干扰下,含量极低的动物DNA参与生化反应的机率大大减少,从而降低了实验的成功率和数据的可靠性。
如果提取的粪便DNA杂质不足以影响实验效果,那么宿主DNA的占比就是实验成功率的决定性因素。不同的应用场景对宿主DNA的占比有着不同的要求,如nuDNA的扩增要高于mtDNA,STR的分型要高于SNP,基因组重测序要高于其他分析。为了克服以上问题,不得不采用多次平行实验的方法来提高数据的可信度,浪费了大量的时间、人力和物力。如果能够对粪便DNA中宿主DNA的占比进行预先评估,就能在确保数据可靠性的前提下大大减少不必要的实验。然而迄今为止针对各个应用场景下质控的方法和标准仍是空白。
发明内容
为了填补当前粪便DNA应用于不同遗传分析场景下的质控方法以及可行性标准的空白,本发明围绕来源于不同物种、不同质量的粪便中所提取的总DNA,针对SNP分析、STR分型、基于高通量测序的线粒体基因组组装和全基因组重测序遗传分析场景,提供了可用性的评估方法以及对应的质控标准,具体评估方法包括如下步骤:
(1)采取绝对荧光定量PCR检测技术对粪便总DNA中的细菌DNA和宿主DNA的拷贝数进行精准测定;所述宿主DNA为mtDNA和nuDNA;
(2)以宿主DNA与细菌DNA拷贝数的比值作为质控指标,建立质控指标与不同遗传分析场景下的实验成功率之间的关系模型,用于评估粪便总DNA在不同遗传分析场景中的可行性。
进一步地限定,步骤(1)选用16S rRNA基因、ND5基因和RPS27A基因分别作为绝对荧光定量PCR检测中细菌DNA、宿主mtDNA和宿主nuDNA的检测基因。
进一步地限定,针对16S rRNA基因设计的细菌DNA通用引物为核苷酸序列如SEQID NO.1所示的Bc-16sR1和核苷酸序列如SEQ ID NO.2所示的Bc-16sR2,目的片段为186bp。
进一步地限定,针对ND5基因设计的宿主mtDNA通用引物为核苷酸序列如SEQ IDNO.3所示的Mt-ND51和核苷酸序列如SEQ ID NO.4所示的Mt-ND52,目的片段为106bp。
进一步地限定,针对RPS27A基因设计的宿主nuDNA通用引物为核苷酸序列如SEQID NO.5所示的Nu-S27A1和核苷酸序列如SEQ ID NO.6所示的Nu-S27A2,目的片段为142bp。
进一步地限定,步骤1)中针对三对引物Bc-16sR1/Bc-16sR2、Mt-ND51/Mt-ND52、Nu-S27A1/Nu-S27A建立的绝对荧光定量PCR反应体系为10μL,组成为1μL DNA模板、5μL TBGreen Premix ExTaqII(Takara)、浓度为10μmol/L的上下游引各0.4μL以及3.2μL去离子水。
进一步地限定,步骤1)中针对三对引物Bc-16sR1/Bc-16sR2、Mt-ND51/Mt-ND52、Nu-S27A1/Nu-S27A2建立的绝对荧光定量PCR反应条件为:95℃/5min;(95℃/10s,56℃/30s,72℃/30s)×40个循环;95℃/10s,65℃/5s,95℃/15s。
针对野生动物研究中常用的SNP、STR、线粒体基因组组装和基因组重测序四种遗传分析场景,本发明将粪便中宿主DNA的相对丰度与以上各个应用场景下遗传分析结果的成功率之间建立了关系模型,并提出了具体的质量标准。在粪便DNA应用于遗传分析实验前,通过对宿主DNA相对丰度进行测定,并将其与质量标准进行比较,即可预估相关实验的成功几率。
进一步地限定,步骤(2)所述由宿主DNA与细菌DNA拷贝数的比值构成的质控指标为宿主mtDNA的相对丰度RmtDNA以及宿主nuDNA的相对丰度RnuDNA,分别对应着粪便总DNA中对于宿主mtDNA和宿主nuDNA富集的效率。
进一步地限定,RmtDNA的计算方法为:RmtDNA=Cmt/Cbc,其中,Cmt为引物Mt-ND51/Mt-ND52扩增产物的拷贝数,Cbc为引物Bc-16sR1/Bc-16sR2扩增产物的拷贝数;RnuDNA的计算方法为:RnuDNA=Cnu/Cbc,其中,Cnu为引物Nu-S27A1/Nu-S27A扩增产物的拷贝数,Cbc为引物Bc-16sR1/Bc-16sR2扩增产物的拷贝数。
进一步地限定,质控指标与不同遗传分析场景下的实验成功率之间的关系模型具体如下:
以粪便总DNA为模板进行SNP分析时,SNP位点扩增成功率SSNP与RnuDNA之间的关系模型为:SSNP=56.90+43.10×(1-exp(-RnuDNA/0.014)),当RnuDNA达到E-01数量级时,SNP位点扩增成功率可达100%;
以粪便总DNA为模板进行STR分型时,STR位点扩增成功率SSTR与RnuDNA之间的关系模型为:SSTR=exp(4.62-0.005/(RnuDNA+0.0014)),当RnuDNA达到E-01数量级时,STR位点扩增成功率达到80%以上,而RnuDNA达到E+00数量级及以上时,STR位点扩增成功率可达100%;
以粪便总DNA为模板进行高通量测序时,当RmtDNA达到E-01数量级及以上时,可以稳定实现线粒体基因组的完整组装;
以粪便总DNA为模板进行高通量测序时,RnuDNA和样本序列与参考基因组的比对率(Rmap)之间的关系模型为:Rmap=313.77×RnuDNA 0.36,当RnuDNA达到E-01数量级及以上时,Rmap与采用高质量模板(如血液,肌肉等中提取的DNA)相近。
本发明的有益效果:
(1)本发明建立了“宿主DNA相对丰度”这一针对粪便DNA的质控指标,将其与SNP分析、STR分析、线粒体基因组组装和全基因组重测序的成功率之间建立了明确的关系模型,并提出了基于mtDNA、nuDNA与细菌DNA相对丰度的质控标准,为利用粪便DNA开展遗传分析实验的效果进行预评估提供了一种简单实用的方法。使用者可以根据预评估结果有效避免质量达不到标准的样品进入后续实验流程,从而节省大量的人力、物力、时间和经费;也可以决定是否需要对DNA进行提纯、富集处理,最大限度地避免珍贵样品因盲目试验而造成的无谓浪费。上述效果是目前以粪便DNA为模板的实验分析中特别亟需,但迄今又未曾做到的。
(2)本发明建立的质控方法和质控指标具有广泛的适用性,对于来源于任何哺乳动物、任何性别、不同采集环境、保存条件、储存时间的粪便样品以及通过各类DNA提取方法所获得的粪便DNA均可进行评估。
(3)本发明的质控方法仅需绝对荧光定量PCR这一项实验检测即可完成,操作简单、易行,无需贵重仪器,一般普通实验室即可满足;通量灵活可调,对于少量样本和大规模样本均可进行评估。
(4)本发明提供了完整的质控方案,包含所有关键性的实验操作,可供使用者直接引用,无需另行优化修改。
附图说明
图1为引物Bc-16sR1/Bc-16sR2、Mt-ND51/Mt-ND52和Nu-S27A1/Nu-S27A2荧光定量PCR的标准曲线;其中图1中的A为引物Bc-16sR1/Bc-16sR2的标准曲线,图1中的B为引物Mt-ND51/Mt-ND52的标准曲线,图1中的C为引物Nu-S27A1/Nu-S27A2建立的标准曲线;
图2为以粪便总DNA为模板,SNP分型成功率(SSNP)与mtDNA相对丰度(RmtDNA)之间的曲线关系图;
图3为以粪便总DNA为模板,STR分型成功率(SSTR)与nuDNA相对丰度(RnuDNA)之间的曲线关系图;
图4为应用粪便DNA进行全基因组重测序时,测序序列与参考基因组的比对率(Rmap)与nuDNA相对丰度(RnuDNA)之间的曲线关系图。
具体实施方式
下面结合具体实施例(包括附图)对本发明作进一步的说明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
实施例1:基于粪便总DNA应用于不同遗传分析的可行性评估方法
1、目标基因的选择。
评估粪便总DNA中细菌DNA的拷贝数选用肠道微生物研究中广泛应用的16S rRNA作为目标基因,评估动物mtDNA的拷贝数选择较为保守的ND5基因,评估动物nuDNA的拷贝数选择高等动物中高度保守的管家基因RPS27A。
2、目标基因的通用引物设计。
以偶蹄目、食肉目、灵长目、长鼻目的代表物种的16S rRNA、ND5、RPS27A基因序列为模板,用Primer Premier 5.0软件设计荧光定量PCR引物。为了尽量提高对DNA降解的耐受力,将扩增片段长度设置在100bp~200bp范围。上述三个基因分别得到通用引物Bc-16sR1/Bc-16sR2、Mt-ND51/Mt-ND52以及Nu-S27A1/Nu-S27A2,具体信息如表1。
表1基因16S rRNA、ND5、RPS27A通用引物的具体信息
3、定量PCR反应体系与条件。
上述三对引物的定量PCR扩增均采用10μL的反应体系,包含1μLDNA提取液、5μL TBGreen Premix ExTaqII(Takara)、上下游引物(10μmol/L)各0.4μL以及3.2μL去离子水。针对三对引物的反应程序也完全一致,扩增段:95℃/5min;95℃/10s,56℃/30s,72℃/30s,进行40个循环;融解段:95℃/10s,65℃/5s,95℃/15s。
4、绝对定量标准品的制备。
(1)目标基因扩增与纯化回收。
选取大肠杆菌(Escherichia coli)的菌液和梅花鹿(Cervus nippon)的肌肉样本为材料,分别采用细菌基因组DNA提取试剂盒(TIANGEN)和基因组DNA小量提取试剂盒(Axygen)提取总DNA。获得的大肠杆菌总DNA用引物Bc-16sR1/Bc-16sR2进行PCR扩增,梅花鹿肌肉的总DNA分别采用引物Mt-ND51/Mt-ND52和Nu-S27A1/Nu-S27A2进行扩增。反应总体积均为50μL,包含TaKaRa Taq(5U/μL)0.25μL、10×PCR Buffer(Mg2+Free)5μL、MgCl2(25mmol/L)3μL、dNTP Mixture(各2.5mmol/L)4μL、上下游引物(10mmol/L)各1μL、模板DNA5μL以及无菌去离子水30.75μL;反应条件均为:94℃/3min;94℃/40s,56℃/30s,72℃/35s,进行35个循环;72℃/8min。所有扩增产物通过2%琼脂糖凝胶电泳检测,割胶后采用DNA纯化回收试剂盒(TIANGEN)进行回收。
(2)目标基因克隆。
将上述回收产物分别连接到pMD18-T载体上,反应体系为10μL,包含1μLpMD18-T克隆载体(Takara,50ng/μL),5μL SolutionI(Takara)和4μL纯化回收产物。将产物转化到大肠杆菌DH5α感受态细胞(Takara)中,吸取已转化的感受态细胞涂布于含有氨苄青霉素(终浓度100μg/mL)的LB固体培养基上,37℃恒温下倒置过夜培养。用灭菌牙签挑取单个菌落放入含有氨苄青霉素(终浓度100μg/mL)的LB液体培养基内在37℃下震荡培养10h。
取1μL菌液作为模版,分别用引物Bc-16sR1/Bc-16sR2、Mt-ND51/Mt-ND52和Nu-S27A1/Nu-S27A2进行PCR扩增。扩增体系为10μL,包含2×RapidTaq Master Mix(诺唯赞)5μL、上下游引物(10mmol/L)各0.2μL、DNA模板1μL以及去离子水3.6μL。反应条件为94℃/4min;94℃/30s,56℃/30s,72℃/30s,进行35个循环;72℃/8min。扩增产物经过2%琼脂糖凝胶电泳检测,选取阳性克隆的菌液进行Sanger测序,将测得序列与目标基因的序列进行比对,确认完全相同后,用质粒小量抽提试剂盒(TIANGEN)从菌液中提取质粒DNA。
(3)重组质粒拷贝数计算。
通过超微量分光光度计测定提取的质粒DNA的浓度,根据以下公式对引物PCR产物重组质粒的浓度进行计算:
C=NA×P×10-9/660L
其中C为重组质粒的浓度,单位是copies/μL;NA为阿伏伽德罗常数,6.02×1023;P为质粒DNA的浓度,单位ng/μL,L为扩增产物的长度,单位是碱基数。本实施例中测定的Bc-16sR1/Bc-16sR2、Mt-ND51/Mt-ND52、Nu-S27A1/Nu-S27A2三对引物扩增产物的重组质粒DNA浓度分别为3.14×1012copies/μL、3.26×1010copies/μL、3.14×1010copies/μL。
5、标准曲线的建立。
根据所测浓度,用无菌去离子水将重组质粒DNA按10倍梯度进行稀释,选取浓度在101~107量级的稀释产物作为标准品,采用上述描述的荧光定量PCR的体系与条件,分别对引物Bc-16sR1/Bc-16sR2、Mt-ND51/Mt-ND52以及Nu-S27A1/Nu-S27A2的标准曲线进行绘制。
结果如图1所示,引物Bc-16sR1/Bc-16sR2的标准曲线为y=-3.28x+35.148,R2=0.99,扩增效率为101.78%;引物Mt-ND51/Mt-ND52的标准曲线为y=-3.29x+36.217,R2=0.99,扩增效率为101.35%;引物Nu-S27A1/Nu-S27A2的标准曲线为y=-3.29x+36.189,R2=0.99,扩增效率为101.35%。其中横坐标x代表初始模板拷贝数的对数,纵坐标y代表循环阈值Ct,即每个反应管内的荧光信号到达设定阈值时所经历的循环数。
三个标准曲线的R2值全部大于0.98,表明Ct值与初始模板拷贝数Log值之间存在极强的相关性;同时扩增效率全部介于90%~110%之间,表明三对引物的扩增效果接近理想状态,荧光定量PCR的定量结果准确可靠。
在实际应用中,我们将待测的粪便DNA按照以上建立的荧光定量PCR体系和扩增程序,分别用三对引物进行扩增,根据得到的Ct值即可计算该样本中单位体积内16srRNA、ND5、RPS27A的拷贝数,以此分别代表细菌DNA(Cbc)、动物mtDNA(Cmt)以及nuDNA的含量(Cnu)。再根据公式计算动物mtDNA的相对丰度(RmtDNA):
RmtDNA=Cmt/Cbc
根据公式计算动物nuDNA的相对丰度(RnuDNA):
RnuDNA=Cnu/Cbc
采用RmtDNA和RnuDNA即可用于预估粪便DNA在后续不同分子遗传学分析场景下的效果。
实施例2:粪便DNA用于核基因组SNP位点分型时可用性的评估
选取7头黄牛、5只狗的粪便和对应个体的血液,采用SDS裂解法和血液基因组DNA小量试剂盒(Axygen)分别提取总DNA,并用于SNP分型实验,每个物种进行10个位点的检测。
以血液DNA的分型结果为标准,把对应个体粪便DNA分型中的假基因扩增、等位基因缺失、无扩增结果等情况都被判定为扩增失败,因此得出实际成功率(SSNPA)。再按照实施例1中的操作方法测定粪便DNA中动物nuDNA的相对丰度(RnuDNA)。根据RnuDNA和SNP分型成功率(SSNP)之间的关系模型:
SSNP=56.90+43.10×(1-exp(-RnuDNA/0.014))
估算每份粪便DNA的成功率(SSNPE),如图2所示。
本实施例中12份粪便DNA样本中的RnuDNA的范围从7.18E-03~1.32E-01。每份样本10个位点的估算成功率SSNPE为59.96%~100.00%,实际成功率SSNPA为60.00%~100.00%。把SSNPE和SSNPA进行线性回归发现,SSNPE=1.02×SSNPA,R2=0.53。表明SSNPE和SSNPA之间有较高的符合度,SSNP的估算模型是有效的。
实施例3:粪便DNA用于STR位点分型时可用性的评估
选取6只东北虎、5只狗、8只北极狐、7只马鹿的粪便和对应个体的血液,按照实施例2的方法对其进行DNA提取。将得到的粪便DNA和血液DNA全部用于STR分型实验,其中东北虎、狗、北极狐各检测4个位点,马鹿检测8个位点。
以血液DNA的分型结果为标准,把对应个体粪便DNA分型中的假基因扩增、等位基因缺失、无扩增结果等情况都被判定为扩增失败,因此得出实际成功率(SSTRA)。再按照实施例1中的操作方法测定粪便DNA中动物nuDNA的相对丰度(RnuDNA)。根据RnuDNA和STR分型成功率(SSTR)之间的关系模型:
SSTR=exp(4.62-0.005/(RnuDNA+0.0014))
估算每份粪便DNA的成功率(SSTRE),如图3所示。
本例中26份粪便DNA样本中的RnuDNA的范围从9.32E-04~4.39E-01。每份样本的估算成功率SSTRE为11.89%~100.35%,实际成功率SSTRA为20.00%~100.00%。线性回归得出SSTRE和SSTRA的关系为:SSTRE=0.92×SSTRA,R2=0.70。表明SSTRE和SSTRA之间有较高的符合度,SSTR的估算模型是有效的。
实施例4:粪便DNA用于线粒体基因组成环组装时可用性的评估
选取来源于10个物种的35份粪便(如表2),通过SDS裂解法对以上粪便进行DNA提取。将全部粪便DNA应用于全基因组高通量测序,测序深度为30×。通过软件Bamtools对下机数据中的线粒体DNA序列进行过滤,随后,通过NOVOplasty对各个样本的线粒体基因组进行组装。
表2粪便样本的信息汇总
在以粪便DNA为模板进行线粒体基因组组装时,严重的序列错误和无法组装成完整的基因组,都被判定为组装失败。同时,按照实施例1对粪便DNA中动物mtDNA的相对丰度(RmtDNA)进行测定,将其与线粒体基因组组装的成功与否建立联系,结果如表3所示。
表3粪便DNA中mtDNA的相对丰度(RmtDNA)与线粒体基因组组装成功与否的对应关系
表3显示,尽管RmtDNA较低时,粪便DNA也可完整组装线粒体基因组,但其效果并不稳定;只有当RmtDNA达到1E-01及以上时,组装的成功率达到100%。
实施例5:粪便DNA用于基因组重测序时可用性的评估
采取实施例4中全部粪便样品高通量测序的下机数据,通过软件BWA与对应物种的参考基因组进行比对,得到每个样品的reads与参考基因组的实际比对率(RmapA)。按照实施例1对每份粪便DNA中动物nuDNA的相对丰度(RnuDNA)进行测定,并按照RnuDNA和样本序列与参考基因组的比对率(Rmap)之间的关系模型:
Rmap=313.77×FnuDNA 0.36
估算比对率(RmapE),如图4所示。
本实施例中35份粪便DNA样本中的RnuDNA的范围从6.02E-06~4.19E-02。每份样本的估算比对率RmapE为4.14%~100.14%,实际比对率RmapA为3.00%~99.52%。线性回归得出RmapE和RmapA的关系为:RmapE=1.02×RmapA,R2=0.59,表明RmapE和RmapA之间有较高的符合度,Rmap的估算模型是有效的。
虽然本发明已以较佳的实施例公开如上,但其并非用以限定本发明,任何熟悉此技术的人,在不脱离本发明精神和范围内,都可以做各种的改动与修饰,因此,本发明的保护范围应该以权利要求书所界定的为准。
SEQUENCE LISTING
<110> 东北林业大学 深圳华大生命科学研究院
<120> 一种基于粪便总DNA应用于不同遗传分析的可行性评估方法
<160> 6
<170> PatentIn version 3.5
<210> 1
<211> 25
<212> DNA
<213> 人工合成
<400> 1
catgaagtcg gaatcgctag taatc 25
<210> 2
<211> 24
<212> DNA
<213> 人工合成
<400> 2
ctacggctac cttgttacga cttc 24
<210> 3
<211> 20
<212> DNA
<213> 人工合成
<400> 3
cacgtcgtat accaacgcct 20
<210> 4
<211> 21
<212> DNA
<213> 人工合成
<400> 4
gggttgtcct aggagtgcaa a 21
<210> 5
<211> 21
<212> DNA
<213> 人工合成
<400> 5
ggtcagacaa catttgccac a 21
<210> 6
<211> 25
<212> DNA
<213> 人工合成
<400> 6
acagcaggtt tgtacttttt aggtg 25

Claims (7)

1.一种基于粪便总DNA应用于不同遗传分析的可行性评估方法,其特征在于,所述不同遗传分析为SNP分析、STR分型、基于高通量测序的线粒体基因组组装和全基因组重测序,所述可行性评估方法适用于来源于不同物种、不同质量的粪便中提取到的总DNA,具体方法包括如下步骤:
(1)采取绝对荧光定量PCR检测技术对粪便总DNA中的细菌DNA和宿主DNA的拷贝数进行精准测定;所述宿主DNA为mtDNA和nuDNA;选用16S rRNA基因、ND5基因和RPS27A基因分别作为绝对荧光定量PCR检测中细菌DNA、宿主mtDNA和宿主nuDNA的检测基因;
(2)以宿主DNA与细菌DNA拷贝数的比值作为质控指标,建立质控指标与不同遗传分析场景下的实验成功率之间的关系模型,用于评估粪便总DNA在不同遗传分析场景中的可行性;由宿主DNA与细菌DNA拷贝数的比值构成的质控指标为宿主mtDNA的相对丰度RmtDNA以及宿主nuDNA的相对丰度RnuDNA,分别对应着粪便总DNA中对于宿主mtDNA和宿主nuDNA富集的效率;质控指标与不同遗传分析场景下的实验成功率之间的关系模型具体如下:
以粪便总DNA为模板进行SNP分析时,SNP位点扩增成功率SSNP与RnuDNA之间的关系模型为:SSNP=56.90+43.10×(1-exp(-RnuDNA/0.014)),当RnuDNA达到E-01数量级时,SNP位点扩增成功率可达100%;
以粪便总DNA为模板进行STR分型时,STR位点扩增成功率SSTR与RnuDNA之间的关系模型为:SSTR=exp(4.62-0.005/(RnuDNA+0.0014)),当RnuDNA达到E-01数量级时,STR位点扩增成功率达到80%以上,而RnuDNA达到E+00数量级及以上时,STR位点扩增成功率可达100%;
以粪便总DNA为模板进行基于高通量测序的线粒体基因组组装时,当RmtDNA达到E-01数量级及以上时,可以稳定实现线粒体基因组的完整组装;
以粪便总DNA为模板进行全基因组重测序时,RnuDNA和样本序列与参考基因组的比对率(Rmap)之间的关系模型为:Rmap=313.77×RnuDNA 0.36,当RnuDNA达到E-01数量级及以上时,Rmap与采用高质量模板相近。
2.根据权利要求1所述的可行性评估方法,其特征在于,针对16S rRNA基因设计的细菌DNA通用引物为核苷酸序列如SEQ ID NO.1所示的Bc-16sR1和核苷酸序列如SEQ ID NO.2所示的Bc-16sR2。
3.根据权利要求1所述的可行性评估方法,其特征在于,针对ND5基因设计的宿主mtDNA通用引物为核苷酸序列如SEQ ID NO.3所示的Mt-ND51和核苷酸序列如SEQ ID NO.4所示的Mt-ND52。
4.根据权利要求1所述的可行性评估方法,其特征在于,针对RPS27A基因设计的宿主nuDNA通用引物为核苷酸序列如SEQ ID NO.5所示的Nu-S27A1和核苷酸序列如SEQ ID NO.6所示的Nu-S27A2。
5.根据权利要求2-4任意一项所述的可行性评估方法,其特征在于,步骤1)中针对三对引物Bc-16sR1/Bc-16sR2、Mt-ND51/Mt-ND52、Nu-S27A1/Nu-S27A建立的绝对荧光定量PCR反应体系为10μL,组成为1μL DNA模板、5μL TB Green Premix ExTaqII、浓度为10μmol/L的上下游引各0.4μL以及3.2μL去离子水。
6.根据权利要求2-4任意一项所述的可行性评估方法,其特征在于,步骤1)中针对三对引物Bc-16sR1/Bc-16sR2、Mt-ND51/Mt-ND52、Nu-S27A1/Nu-S27A2建立的绝对荧光定量PCR反应条件为:95℃/5min;95℃/10s,56℃/30s,72℃/30s,进行40个循环;95℃/10s,65℃/5s,95℃/15s。
7.根据权利要求1所述的可行性评估方法,其特征在于,RmtDNA的计算方法为:RmtDNA=Cmt/Cbc,其中,Cmt为ND5基因的拷贝数,Cbc为16S rRNA基因的拷贝数;RnuDNA的计算方法为:RnuDNA=Cnu/Cbc,其中,Cnu为RPS27A基因的拷贝数,Cbc为16S rRNA基因的拷贝数。
CN202210639547.0A 2022-06-08 2022-06-08 一种基于粪便总dna应用于不同遗传分析的可行性评估方法 Active CN114990201B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210639547.0A CN114990201B (zh) 2022-06-08 2022-06-08 一种基于粪便总dna应用于不同遗传分析的可行性评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210639547.0A CN114990201B (zh) 2022-06-08 2022-06-08 一种基于粪便总dna应用于不同遗传分析的可行性评估方法

Publications (2)

Publication Number Publication Date
CN114990201A CN114990201A (zh) 2022-09-02
CN114990201B true CN114990201B (zh) 2024-05-03

Family

ID=83032688

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210639547.0A Active CN114990201B (zh) 2022-06-08 2022-06-08 一种基于粪便总dna应用于不同遗传分析的可行性评估方法

Country Status (1)

Country Link
CN (1) CN114990201B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008056325A2 (en) * 2006-11-06 2008-05-15 Universidade Do Porto Process for animal species identification in samples with genetic material based on mitochondrial dna size variation
CN110709522A (zh) * 2017-04-04 2020-01-17 建喾立嗣股份公司 生物样本核酸质量的测定方法
CN113186185A (zh) * 2020-01-14 2021-07-30 东北林业大学 一种从哺乳动物粪便中高效富集宿主dna的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008056325A2 (en) * 2006-11-06 2008-05-15 Universidade Do Porto Process for animal species identification in samples with genetic material based on mitochondrial dna size variation
CN110709522A (zh) * 2017-04-04 2020-01-17 建喾立嗣股份公司 生物样本核酸质量的测定方法
CN113186185A (zh) * 2020-01-14 2021-07-30 东北林业大学 一种从哺乳动物粪便中高效富集宿主dna的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
粪便 DNA 分析技术在分子生态学研究中的机遇与挑战;单磊等;《兽类学报》;20181231;第38卷(第3期);第235-246页 *

Also Published As

Publication number Publication date
CN114990201A (zh) 2022-09-02

Similar Documents

Publication Publication Date Title
Wang et al. Development and validation of the AmpFℓSTR® identifiler® direct PCR amplification kit: A multiplex assay for the direct amplification of single‐source samples
CN112941201B (zh) 一种用于多细胞种属鉴别和交叉污染检测的混合引物及其使用方法
CN116656832A (zh) 一种淡水鱼类线粒体12s通用宏条形码扩增引物及其应用方法
CN114959066A (zh) 一种影响猪肌内脂肪含量性状的分子标记及应用
Thies Molecular approaches to studying the soil biota
CN114196761A (zh) 一种主选父系品种猪饲料报酬的液相芯片的制作方法
CN114990201B (zh) 一种基于粪便总dna应用于不同遗传分析的可行性评估方法
CN116083605B (zh) 一种包含67个高效能常染色体微单倍型的遗传标记体系及其检测引物和应用
CN102732514B (zh) 趋化因子受体9基因作为牛优良超数排卵性状分子标记的鉴定方法及其应用
CN109182546B (zh) 用于穿山甲亲子鉴定的ssr荧光标记引物及应用
CN108823327B (zh) 樟树全基因组ssr分子标记及其制备方法和应用
CN106636065B (zh) 一种全基因组高效基因区富集测序方法
CN115851973A (zh) 实时荧光PCR快速检测人类InDel遗传多态性的方法、试剂盒和应用
CN112251516B (zh) 利用猪7号染色体检测猪达标体重日龄的方法及其试剂盒
CN111733256A (zh) 一种基于Cytb基因片段的蛇鮈和长蛇鮈的分子鉴别方法
CN110747280B (zh) 与马寒冷适应性相关的te标记及其应用
CN112375841A (zh) 一种木霉属真菌rpb2分子标记基因简并引物组及其应用
CN109750106B (zh) 一种评价公牛精子活力高低的长链非编码rna组合及其检测方法和应用
CN108676904B (zh) 引物对、试剂和试剂盒及其应用和鉴定紫花苜蓿产品中是否含有花生的方法
CN111455071A (zh) 猪8号染色体上与二花脸猪全部胎次总产仔数相关的snp标记的检测方法与应用
CN107858439A (zh) 一种藏酋猴线粒体D‑loop区的特异性引物及检测方法和应用
KR100901817B1 (ko) 한우 생산이력체계 구축용 프라이머 세트 및 이를 이용한한우 개체 판별방법
CN113151493B (zh) 一种长白山东方蜜蜂ssr标记引物组、pcr鉴定方法以及应用
CN108774645B (zh) 一种与谷子码数性状相关的snp标记及其检测引物和应用
CN112375842A (zh) 一种木霉属真菌tef1分子标记基因简并引物组及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant