CN113881787A - 唾液斑中微生物群落结构变化在预测唾液斑迹残留时间中的应用 - Google Patents

唾液斑中微生物群落结构变化在预测唾液斑迹残留时间中的应用 Download PDF

Info

Publication number
CN113881787A
CN113881787A CN202010630365.8A CN202010630365A CN113881787A CN 113881787 A CN113881787 A CN 113881787A CN 202010630365 A CN202010630365 A CN 202010630365A CN 113881787 A CN113881787 A CN 113881787A
Authority
CN
China
Prior art keywords
salivary
spot
microbial community
community structure
saliva
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010630365.8A
Other languages
English (en)
Other versions
CN113881787B (zh
Inventor
张瑾
杨雪莹
刘开会
史祺云
王鹏
高珊
张颖
郝金萍
徐小玉
畅晶晶
张广锋
朱典
郭柯利
杜猛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Forensic Science Ministry of Public Security PRC
Original Assignee
Institute of Forensic Science Ministry of Public Security PRC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Forensic Science Ministry of Public Security PRC filed Critical Institute of Forensic Science Ministry of Public Security PRC
Priority to CN202010630365.8A priority Critical patent/CN113881787B/zh
Priority claimed from CN202010630365.8A external-priority patent/CN113881787B/zh
Publication of CN113881787A publication Critical patent/CN113881787A/zh
Application granted granted Critical
Publication of CN113881787B publication Critical patent/CN113881787B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Zoology (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了唾液斑中微生物群落结构变化在预测唾液斑迹残留时间中的应用。本发明提供了检测唾液斑迹中微生物群落结构的物质在预测唾液斑迹残留时间中的应用。或本发明提供了检测唾液斑迹中微生物群落结构的物质在制备预测唾液斑迹残留时间产品中的应用。本发明应用16S扩增子测序技术,刻画了唾液斑迹中微生物群落结构随残留时间变化规律,并应用机器学习(随机森林)模型建立唾液斑迹残留时间预测方法,为案件快速侦办、深度发掘涉案生物物证信息、提升证据价值、提升法医DNA办案能力提供理论依据和技术支撑。

Description

唾液斑中微生物群落结构变化在预测唾液斑迹残留时间中的 应用
技术领域
本发明属于生物技术领域,尤其涉及一种唾液斑中微生物群落结构变化在预测唾液斑迹残留时间中的应用。
背景技术
唾液斑迹是各类案事件现场最为常见的生物物证种类之一,既包括口腔拭子样本,也包括烟蒂、餐饮具擦拭物、咬痕等等可能粘附有口腔上皮细胞的微量现场检材,通过现有的DNA STR检验,可以为案件侦办提供个体识别和亲子鉴定信息。
烟蒂样本是各类案事件现场最为常见的唾液斑类生物检材,其中蕴含大量来自于供体口腔的核酸信息。在刑事科学技术领域,烟蒂样本分析方法成熟,检验成功率高,可通过STR等常规DNA分析手段,提供个体识别和亲子鉴定的重要依据,为涉案人员识别、案件侦办、法庭审判提供线索和依据。在常规法医物证检验的基础上,准确判断烟蒂样本残留时间,可为人员涉案关系梳理、案发时间推断、案发过程重建提供线索,进一步提升证据价值。
然而,在当前公安机关案件中,面临着大量的发生在涉及人员复杂的商场、宾馆、网吧等公共场所,监控视频存在死角、不能有效覆盖,人员流动大、技侦手段不能有效识别,无明确嫌疑对象、大规模排查成本过高,DNA STR比中犯罪嫌疑人拒不交代、又不能明确排除的案件。由于以上制约因素,这类案件在侦办中往往无法及时明确案发时间、梳理人员关系、重建案发过程、划定排查范围,继而导致案件不能快速有效侦办。
推断现场生物斑迹遗留时间,和推断尸体死亡时间一样,是一条较为有效、直接的工作途径,可以从时间维度为案件侦办提供方向、为嫌疑人排查提供线索、为法庭审判完善证据。正是由于现场生物斑迹遗留时间在案件侦办中的独特作用,近年来已越来越被法庭科学研究人员重视,并运用光谱成像、PCR等光学、生物学方法从细胞、蛋白、DNA、RNA、微生物等不同角度开展了大量研究,然而由于载体材质、样本需求量、方法灵敏度等的限制,尚未形成可应用于办案实战的生物斑迹残留时间预测方法。
微生物的存在是广泛的,不仅存在于人体口腔、肠道、生殖道、皮肤等各种组织,还存在于土壤、水域等自然环境,在尸体内外环境中也有广泛存在。微生物群落结构的变化规律也可能在尸体死亡时间推断、指掌纹遗留时间推断、土壤地域来源推断中具有广泛的应用潜力。
扩增子测序主要通过对特定长度的PCR产物进行测序分析,是研究环境微生物多样性及群落组成差异的重要技术手段之一。一般分为16S rDNA测序、18S rDNA测序、ITS测序及功能基因区域测序。其中,16S rDNA为编码原核生物核糖体小亚基rRNA的DNA序列,具有10个保守区域和9个高变区域(V1-V9),其中保守区在细菌间差异不大,高变区具有属或种的特异性,对16S rDNA某个高变区进行测序,被认为是最适于细菌系统发育和分类鉴定的指标。扩增子测序技术,成本低廉、周期较短、对样品质量要求较低,广泛应用于各种环境体系微生物研究中,所需样本无需分离培养,在客观真实地反应生境内DNA组成的同时,也适应现场唾液斑迹等涉案生物物证微量、不可重复的特性。
发明内容
本发明一个目的是提供检测唾液斑迹中微生物群落结构的物质的用途。
本发明提供了检测唾液斑迹中微生物群落结构的物质在预测唾液斑迹残留时间中的应用。
或本发明提供了检测唾液斑迹中微生物群落结构的物质在制备预测唾液斑迹残留时间产品中的应用。
上述应用中,所述物质包括用于扩增唾液斑迹16sDNA的引物。
所述物质还包括提取口腔拭子样本中微生物基因组DNA的试剂、记载测序和/或注释用软件的可读载体及记载比对用数据库的可读载体。
在本发明的实施例中,用于扩增唾液斑迹16sDNA的引物为用于扩增唾液斑迹16sDNA的V4区的引物;所述引物由序列表中序列1和序列表中序列2所示的DNA分子组成。
本发明另一个目的是提供一种预测案件现场唾液斑迹残留时间的方法。
本发明提供的方法,包括如下步骤:
A1)建立训练集和检测案件现场唾液斑的微生物群落结构;
所述建立训练集的方法包括如下步骤:
A1)-1、收集案件现场周围健康人的唾液样本,再将所有所述健康人唾液样本保存;提取不同保存时间的各个健康人的唾液样本中微生物的基因组DNA,扩增16sDNA,测序,得到16sDNA测序结果;
A1)-2、对A1)-2得到的所述16sDNA测序结果注释,得到不同保存时间的唾液样本中的微生物群落结构;将所述唾液样本的不同保存时间和不同保存时间下对应的微生物群落状态构成训练集;
所述检测案件现场唾液斑的微生物群落结构的方法包括如下步骤:
A1)-3、提取所述案件现场唾液斑中微生物的基因组DNA,扩增16sDNA,测序,得到16sDNA测序结果;
A1)-4、再对A1)-3得到的所述16sDNA测序结果注释,得到案件现场唾液斑中微生物群落结构;
A2)采用随机森林法对所述训练集进行计算,获得重要变量;
A3)将所述案件现场唾液斑中微生物群落结构通过随机森林法,以所述A2获得的重要变量为依据,与所述训练集比对,获得待测唾液斑迹的遗留时间。
上述方法中,A1)-1中,所述保存时间小于等于150天。
上述方法中,A1)-1中,所述保存为在实验室室内环境条件下保存;
所述实验室室内环境条件如下:室温为19-28℃、室内湿度为20-63%。
在本发明的实施例中扩增16sDNA采用的引物为用于扩增唾液斑迹16sDNA的V4区的引物;所述引物由序列表中序列1和序列表中序列2所示的DNA分子组成。
上述方法中,所述注释采用的软件为Uparse(Uparse v7.0.1001,http://drive5.com/uparse/)、MUSCLE(Version 3.8.31,http://www.drive5.com/muscle/)、Qiime软件(Version 1.9.1)、R软件(Version 2.15.3),比对的数据库为SILVA(http://www.arb-silva.de/)的SSUrRNA数据库。
记载上述注释采用的软件的可读载体、记载权注释采用的数据库的可读载体和用于扩增唾液斑迹中微生物16sDNA的引物在预测唾液斑迹残留时间中的应用也是本发明保护的范围。
上述微生物群落是指在一定区域里,或一定生境里,各种微生物种群相互松散结合,或有组织紧凑结合的一种结构单位。
本研究着眼于法庭科学的新领域——法医微生物学,应用16S扩增子测序技术,旨在通过研究唾液斑迹微生物群落结构变化规律,应用机器学习(随机森林)模型建立唾液斑迹残留时间预测方法。
本研究应用16S扩增子测序技术,刻画了唾液斑迹中微生物群落结构随残留时间变化规律,并应用机器学习(随机森林)模型建立唾液斑迹残留时间预测方法,为案件快速侦办、深度发掘涉案生物物证信息、提升证据价值、提升法医DNA办案能力提供理论依据和技术支撑。
本发明的实验证明,随着时间推移,离体唾液斑中的微生物群落结构在物种分布、相对丰度等方面均发生显著改变,具有显著的时间相关性,并且这一变化规律与生境对照组不同,与环境温度、湿度的改变无显著相关,为基于微生物群落结构变化规律的唾液斑遗留时间推断提供可能。同时,本发明选择实验室室内环境(室温、室内湿度、普通室内光照)作为样本保存环境,贴近多数室内案发现场实际情况,得出的唾液斑微生物群落结构变化规律易于在实际案件侦办中推广应用。
在基于微生物群落结构应用随机森林分析进行的唾液斑残留时间推断中,三组样本可以较好区分,组间AUC值均大于0.7,分析方法可靠、结果满意。这一分析结果是令人振奋的,实现了离体唾液斑迹遗留时间推断从无到有的突破,在一定程度上,可能为案发时间推断提供参考。
附图说明
图1为实验组门水平物种相对丰度展示。
图2为实验组属水平物种相对丰度展示。
图3为环境对照组门水平物种相对丰度展示。
图4为实验组基于Unweighted Unifrac距离PCoA分析。
图5为生境对照组基于Unweighted Unifrac距离PCoA分析。
图6为环境对照组基于Unweighted Unifrac距离PCoA分析。
图7为实验组基于Unweighted Unifrac距离NMDS分析。
图8为生境对照组基于Unweighted Unifrac距离NMDS分析。
图9为环境对照组基于Unweighted Unifrac距离NMDS分析。
图10为随机森林模型不同mtry和ntree组合的错误率展示。
图11为随机森林模型D0_14与D21_60样本组间ROC分析(AUC值)。
图12为随机森林模型D0_14与D90_150样本组间ROC分析(AUC值)。
图13为随机森林模型D90_150与D21_60样本组间ROC分析(AUC值)。
图14为随机森林模型重要变量MeanDecreaseAccuracy展示(Top30)。
具体实施方式
下述实施例中所使用的实验方法如无特殊说明,均为常规方法。
下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1、唾液斑中微生物群落结构变化在预测唾液斑迹残留时间中的应用
一、训练集的获得
1、样本采集与微生物基因组DNA的提取
按照如下组别分组:
1)实验组
选取无关北京长期居住健康志愿者19人(男性9人、女性10人),采集口腔拭子样本,自然风干后,置于室温环境(温度:19-28℃,相对湿度20-63%)保存,分别于0d(采集后4h)、7d、14d、21d、28d、60d、90d、120d、150d提取样本DNA进行检测(脱组1人次)。
2)生境对照组
自首次采集起,第7d、14d、21d、28d、60d、90d、120d、150d分别再次采集口腔拭子(脱组10人次)样本提取DNA进行检测。
3)环境对照组
取空白拭子暴露于实验环境保存,分别于0d(暴露4h后)、7d、14d、21d、28d、60d、90d、120d、150d提取样本DNA进行检测(ECD28脱组)。
2、16sDNA的扩增与测序
以上述各组各个样本的微生物DNA为模板,用如下引物进行扩增,得到16sDNA的V4区扩增子。
表1所用引物序列
Figure BDA0002564605640000051
将上述16sDNA扩增子使用
Figure BDA0002564605640000052
DNA PCR-Free Sample Preparation Kit(Illumina,美国)建库试剂盒进行文库构建,构建好的文库经过Qubit2.0(ThermoScientific,美国)和Agilent Bioanalyzer 2100(Agilent,美国)定量,文库合格后,使用HiSeq2500 PE250对16SDNA的V4区进行测序。
将不同保存时间的唾液斑样本的测序数据进行拼接、过滤处理得到有效数据(Effective Tags)。
3、OTU分析和物种注释
利用Uparse软件(Uparse v7.0.1001,http://drive5.com/uparse/)对所有样品的全部Effective Tags进行聚类,默认以97%的一致性(Identity)将序列聚类成为OTUs(Operational Taxonomic Units),同时会选取OTUs的代表性序列,依据其算法原则,筛选的是OTUs中出现频数最高的序列作为OTUs的代表序列。对OTUs代表序列进行物种注释,用Mothur方法与SILVA(http://www.arb-silva.de/)的SSUrRNA数据库进行物种注释分析(设定阈值为0.8-1),获得分类学信息并分别在各个分类水平:kingdom(界),phylum(门),class(纲),order(目),family(科),genus(属),species(种)统计各样本的群落组成。使用MUSCLE(Version 3.8.31,http://www.drive5.com/muscle/)软件进行快速多序列比对,得到所有OTUs代表序列的系统发生关系。最后对各样品的数据进行均一化处理,以样品中数据量最少的为标准进行均一化处理,后续的Alpha多样性分析和Beta多样性分析都是基于均一化处理后的数据。将唾液样本的不同保存时间和不同保存时间下对应的微生物群落状态构成训练集。
4、对训练集进行分析
1)物种丰度
对不同保存时间的唾液斑样本数据进行统计,平均获得744个OTUs。分析不同保存时间的唾液斑样本可知,各组样本共有OTU数目为547个,特有OTU数目为65-403个不等。物种组成的差异,为将不同遗留时间唾液斑样本归类奠定了重要基础,也为进一步实现唾液斑遗留时间推断提供可能。
根据物种注释结果,选取每个样品或分组在各分类水平(Phylum、Class、Order、Family、Genus)上最大丰度排名前10的物种,生成物种相对丰度柱形累加图。
实验组:在口腔细菌物种聚类OTU门水平分析中(图1),不同保存时间的9个样本组中,除一些含量稀少的门外,厚壁菌门(Phylum Firmicutes)和变形菌门(PhylumProteobacteria)相对丰度较高。同时,随着保存时间的延长,口腔细菌群落结构发生明显变化。在0-14天内,随着样本保存时间延长,厚壁菌门(Phylum Firmicutes)所占比例逐渐升高,保存21天后,占比逐渐下降趋于平稳。样本保存7-14天后,变形菌门(PhylumProteobacteria)占比下降,21天后占比回升趋于平稳。保存7天后,蓝细菌门(PhylumCyanobacteria)占比显著升高,14天后逐渐下降。
相应的,多数微生物种群在纲、目、科、属水平(图2)呈现与门水平相同的变化趋势,比较有代表性的有芽孢杆菌纲(Bacilli):芽孢杆菌目(Bacillales)、芽孢杆菌科(Bacillaceae)、Pseudogracilibacillus和乳杆菌目(Lactobacillales)、链球菌科(Streptococcaceae)、链球菌属(Streptococcus);β-变形菌纲(Betaproteobacteria):奈瑟菌目(Neisseriales)、奈瑟菌属(Neisseria);γ-变形菌纲(Gammaproteobacteria):巴斯德氏菌目(Pasteurellales)、巴斯德氏菌科(Pasteurellaceae);Chloroplast纲:unidentified_Chloroplast目、unidentified_Chloroplast科、unidentified_Chloroplast属。另一方面,一些微生物种群在纲目科属水平表现出了特有变化规律,如丹毒丝菌纲(Erysipelotrichia)、丹毒丝菌目(Erysipelotrichales)、丹毒丝菌科(Erysipelotrichaceae)、支原体属(Allobaculum)除在样本保存21天表现出与门水平相同的变化趋势外,在保存90-120天后占比显著上升;α-变形菌纲(Alphaproteobacteria):立克次体目(Rickettsiales)、Mitochondri、unidentified_Mitochondria在样本保存7天后占比显著上升并达到峰值。
环境对照组结果如图3所示,环境对照组中厚壁菌门(Phylum Firmicutes)占比随时间推移逐渐升高,变形菌门(Phylum Proteobacteria)占比在7-14天呈升高趋势、21天后呈下降趋势,而(Phylum Bacteroidetes)占比变化剧烈,这些优势物种在门、纲、目、科、属水平(纲以下水平不做具体展示)的变化趋势均与实验组不同,提示环境微生物对离体唾液斑微生物群落结构影响较小。另一方面,在环境监测记录中注意到,实验环境温度始终在19-28℃上下波动,相对湿度总体在20-63%,由于季节变化,在样本保存80天后相对湿度显著下降:前80天平均相对湿度为49.05%,后70天平均相对湿度为28.77%,这一变化与实验样本微生物群落结构变化不呈现显著相关。
因此,微生物种群在门、纲、目、科、属不同水平表现出的具有各自特点的变化规律,且与环境微生物不具有显著相关性,为唾液斑迹遗留时间推断提供了良好的实现途径。
2)多样品比较分析
基于OUT注释结果,用Qiime软件(Version 1.9.1)计算Unifrac距离。使用R软件(Version 2.15.3)绘制PCoA和NMDS图。PCoA分析使用R软件的WGCNA,stats和ggplot2软件包,NMDS分析使用R软件的vegan软件包。
(1)主坐标分析(PCoA)
主坐标分析(PCoA,Principal Co-ordinates Analysis),是通过一系列的特征值和特征向量排序从多维数据中提取出最主要的元素和结构。基于UnweightedUnifrac距离进行PCoA分析,并选取贡献率最大的主坐标组合作图。样品距离越接近,表示物种组成结构越相似,群落结构相似度高的样品倾向于聚集在一起,群落差异很大的样品则会远远分开。
结果表明(图4),保存7-150天的样本与新鲜采集样本相比均有不同程度的细菌群落结构差异,并且呈现出随着保存时间延长差异变大的趋势,保存60天后的各组样本与新鲜样本组完全偏离,表明唾液斑在离体环境中细菌群落结构发生规律性变化。而在生境对照实验中(图5),间隔7-150天后重新采集的口腔拭子样本与首次采集样本相比,其细菌群落结构在一定程度上发生改变,但并不呈现规律性。同时,环境检测实验中(图6),保存7天和14天的样本、保存60天、90天、120天和150天的样本表现出明显的聚集,提示随着时间推移,环境微生物群落结构可能发生时间相关性改变。因此,认为,实验样本与生境对照样本细菌群落结构变化规律不同,实验样本和环境检测样本细菌群落变化规律呈现时间相关性。这一变化规律使得唾液斑离体时间推断成为可能。
(2)无度量多维标定法(NMDS)统计
无度量多维标定法(NMDS,Non-Metric Multi-Dimensional Scaling)统计是一种适用于生态学研究的排序方法。NMDS是非线性模型,其设计目的是为了克服线性模型(如PCoA)的缺点,更好地反映生态学数据的非线性结构。
基于Unweighted Unifrac距离进行NMDS分析,结果表明,实验组样本(图7,图中D0、D7、D14、D21、D28、D60、D90、D120、D150分别代表遗留时间相同的一组样本)、生境对照组样本(图8)和环境检测组样本(图9)呈现出与PCoA分析相似的变化规律,进一步证明了唾液斑在离体环境中细菌群落结构发生变化的规律性和可靠性,并为应用细菌群落变化规律进行唾液斑离体时间推断提供依据。
上述分析中,物种丰度、PCoA、NMDS都将遗留时间相同的样本归为一组进行分析,结果表明,实验组样本微生物群落结构随着保存时间的延长发生了规律性改变,且这种变化呈不受环境微生物和采集时间影响的显著时间相关性,为基于唾液样本微生物群落结构进行遗留时间预测提供了可靠依据。在获得不同遗留时间样本菌群结构变化规律的同时,也用唾液样本的遗留时间和不同遗留时间的唾液样本中的菌群结构构成训练集,用于唾液样本遗留时间预测。
因此,上述获得的实验组全部数据就是后面随机森林分析使用的训练集。
二、基于微生物群落结构的重要变量的唾液斑遗留时间初步推断
原理:
随机森林(RandomForest)是一种基于分类树算法的经典机器学习模型。作为一种有监督的机器学习方法,它在模式识别领域具有重要的应用。其原理也是通过将数据分为训练集和测试集,通过训练集不断的训练分类函数达到最优的分类效果,再用测试集对分类效果进行验证。对于建立好的模型,可以通过交叉验证(Cross-validation)或者受试者工作特征曲线(receiver operating characteristic curve,ROC)的方法对模型的性能进行评估。在生态学的研究中,随机森林算法主要是构建分类模型,并对分类或分组起重要作用的特征(Biomarker)进行筛选。
本研究将随机森林分析方法引入法庭科学研究,应用于唾液斑残留时间分析。基于物种丰度的随机森林的分析,对不同分类水平,按梯度选取不同数量的物种,构建随机森林模型。通过MeanDecreaseAccuracy筛选出重要的物种,之后对每个模型做交叉验证(默认10-fold)并绘制ROC曲线。
上述一得到不同遗留时间的唾液斑迹微生物群落结构在物种分布、相对丰度等方面都有较大差异,通过主坐标分析(PCoA,Principal Co-ordinates Analysis),可将特征相似度较高的样本聚集在一起、将差异较大的样本远远分开,随着遗留时间的延长,唾液斑样本分离程度越大。
进一步,应用随机森林分析方法,将微生物群落结构分析应用于唾液残留时间分析。为了契合办案实际,将训练集全部样本(即实验组样本)以时间段划分为三组:①残留时间0-14天,②残留时间21-60天,③残留时间90-150天。
如前所述,过滤、拼接、去除嵌合体得到的有效数据(CleanReads),使用Uparse软件(Uparse v7.0.1001,http://drive5.com/uparse/)对所有样品的全部Clean Reads进行聚类,默认以97%的一致性(Identity)将序列聚类成为OTUs(Operational TaxonomicUnits)。同时会选取OTUs的代表性序列,依据其算法原则,筛选的是OTUs中出现频数最高的序列作为OTUs的代表序列,使用基于RDP classifier(http://sourceforge.net/projects/rdp-classifier/)的Silva数据库(Version128)(http://www.arb-silva.de/)进行序列比对得到物种的注释信息。
使用R软件(Version2.15.3)中的'randomFores'软件包对数据集进行了随机森林分类训练。该模型(训练集)使用十乘交叉验证对“mtry(the number of variables)”和“ntree(the number of trees)”进行修正。使用“pROC”软件包通过基于AUC评分的ROC分析评估了预测模型的性能。同时,为了衡量变量的重要性,计算了Mean Decrease Accuracy作为特征选择的关键指标。
交叉验证结果表明,当以mtry230和ntree 100为组合时,可以获得最为理想的结果,即可获得2.3%的最低错误率(图10)。当mtry为230、ntree为100时,可以根据样本微生物OTU的相对丰度区分残留时间分别为0-14天、21-60天、90-150天的三个样本组,并获得较为理想的AUC值(通常认为,AUC值>0.7,表明随机森林分析性能良好,组间区分度较高,可用于样本归类分析)。其中,残留时间为0-14天的样本组可与残留时间为21-60天或90-150天的样本组完全分离,预测全部正确,AUC值均为1(图11、12);残留时间为21-60天和90-150天的两组样本见存在少量误判,但AUC值为0.728(图13),具有较好的区分度,可以进行样本归类和残留时间预测。在分析方法构建期间,也可以在特征选择的过程中从数据集中识别重要变量。根据MeanDecreaseAccuracy,最重要的指标是Syntrophomonas,其次依次是Romboutsia,Collinsella,Allobaculum和Actinomyces等230个微生物属(图14、表2)。因此,可将这些OTUs作为预测不同残留时间的良好指标,在办案实践中可以将未知残留时间样本带入该方法的建立的随机森林分析方法中,进行样本归类和残留时间推断。本发明的训练集的重要变量为表2所示的230个微生物属。
表2重要变量OUT注释信息
Figure BDA0002564605640000091
Figure BDA0002564605640000101
Figure BDA0002564605640000111
Figure BDA0002564605640000121
总体而言,以唾液斑微生物群落结构为基础,应用随机森林分析方法,可以进行唾液斑残留时间分析,并且在交叉验证中取得可靠的结果,为案件现场唾液斑残留时间分析提供了方法。
因此,可以建立案件现场唾液斑残留时间预测方法,具体步骤如下:
A1)建立训练集和检测案件现场唾液斑的微生物群落结构;
所述建立训练集的方法包括如下步骤:
A1)-1、收集案件现场周围健康人的唾液样本,再将所有所述健康人唾液样本保存;提取不同保存时间的各个健康人的唾液样本中微生物的基因组DNA,扩增16sDNA,测序,得到16sDNA测序结果;
A1)-2、对A1)-2得到的所述16sDNA测序结果注释,得到不同保存时间的唾液样本中微生物群落结构;将所述唾液样本的不同保存时间和不同保存时间下对应的微生物群落状态构成训练集;
所述检测案件现场唾液斑的微生物群落结构的方法包括如下步骤:
A1)-3、提取所述案件现场唾液斑中微生物的基因组DNA,扩增16sDNA,测序,得到16sDNA测序结果;
A1)-4、再对A1)-3得到的所述16sDNA测序结果注释,得到案件现场唾液斑中微生物群落结构;
A2)采用随机森林法对所述训练集进行计算,获得重要变量;
A3)将所述案件现场唾液斑中微生物群落结构通过随机森林法,以所述A2获得的重要变量为依据,与所述训练集比对,获得待测唾液斑迹的遗留时间。
上述训练集中的样本来自案件现场周围群体(案件现场所在地或疑似涉案人员来源地区长住人员,一般建议范围为相关地区县级行政区划单位)。
上述健康人的数量为19人(男性9人,女性10人);
上述训练集建立采用的样本保存时间小于等于150天。
上述保存为实验室室内环境(室温为19-28℃、室内湿度为20-63%、光照为普通室内自然光)
上述微生物群落是指在一定区域里,或一定生境里,各种微生物种群相互松散结合,或有组织紧凑结合的一种结构单位。本发明指口腔微生物中细菌的种类和丰度。
本发明的实验有如下结论:
1、唾液斑中微生物群落结构变化规律
为保证构建规律的普适性和稳定性,本实验只重点关注了占比较高的细菌门类,而不将占比稀少的细菌门类作为规律构建核心指标。
实验结果表明,唾液斑微生物群落结构会随着遗留时间的推移发生规律性改变。在主坐标分析(PCoA)和无度量多维标定法(NMDS)统计中,可以看出,随着时间推移,唾液斑微生物群落结构改变日渐显著。在物种相对丰度分析中,不同遗留时间的唾液斑微生物群落结构在不同分类水平(Phylum、Class、Order、Family、Genus)也表现出了相同的变化趋势。同时,间隔不同时间重新采集的新鲜唾液斑微生物群落结构并未发生规律性改变。
综上,本研究得出唾液斑微生物群落结构变化规律如下:
1、离体唾液斑微生物群落结构变化规律与生理状态下变化规律不同,呈现时间相关性。
2、在实验环境下(离体150天内,温度19-28℃,相对湿度20-63%),离体唾液斑微生物群落结构变化规律与环境微生物变化规律不同,且受环境温度、相对湿度变化影响较小。
2、基于微生物群落结构分析的现场唾液斑遗留时间推断建议
研究表明,离体唾液斑迹微生物群落结构呈现时间相关的变化规律,且与采集时间、环境温湿度变化无显著相关,可为唾液斑遗留时间推断、确定案发时间提供理论基础。
根据研究中基于微生物群落结构分析的唾液斑遗留时间推断结果,提出以下现场唾液斑迹遗留时间推断建议:
1、严格划定方法应用范围:室内案发现场(室温、室内湿度、普通室内光照)。
2、检材样本要求:唾液斑迹,残留时间为0~150天。
3、推断结果应用价值:虽然本研究的随机森林模型中残留时间0-14天与残留时间21-60天和90-150天的样本可以完全分离,交叉验证结果全部正确,但样本量有限,在案件实际应用中,应根据案件实际情况,结合其它相关物证,综合考量残留时间推断结果的应用价值。
4、推断斑迹遗留时间,应以不影响获得DNA STR分型为前提。提取现场检材后,应当首先完成DNA STR检验等必要的检验鉴定,再根据案件侦办实际情况确定是否需要进行遗留时间推断。
实施例2、基于微生物群落结构变化进行烟蒂残留时间预测
一、训练集的获得
本实施例2的训练集为实施例1的训练集。
二、重要变量的获得
本实施例2的训练集为实施例1的表2所示的230个种属的重要变量。
三、检测案件现场唾液斑的微生物群落结构
1、样本采集与制备
采集北京地区残留时间为90天、120天、150天的烟蒂样本各3枚,提取样本微生物DNA进行检测。
2、16sDNA的扩增与测序
以上述各组各个样本的微生物DNA为模板,用表1所示的引物进行扩增,得到16sDNAV4区扩增子。
将上述16sDNA扩增子使用
Figure BDA0002564605640000141
DNA PCR-Free Sample Preparation Kit(Illumina,美国)建库试剂盒进行文库构建,构建好的文库经过Qubit2.0(ThermoScientific,美国)和Agilent Bioanalyzer 2100(Agilent,美国)定量,文库合格后,使用HiSeq2500 PE250对16S V4区进行测序。
3、OTU分析和物种注释
利用Uparse软件(Uparse v7.0.1001,http://drive5.com/uparse/)对所有样品的全部Effective Tags进行聚类,默认以97%的一致性(Identity)将序列聚类成为OTUs(Operational Taxonomic Units),同时会选取OTUs的代表性序列,依据其算法原则,筛选的是OTUs中出现频数最高的序列作为OTUs的代表序列。对OTUs代表序列进行物种注释,用Mothur方法与SILVA(http://www.arb-silva.de/)的SSUrRNA数据库进行物种注释分析(设定阈值为0.8~1),获得分类学信息并分别在各个分类水平:kingdom(界),phylum(门),class(纲),order(目),family(科),genus(属),species(种)统计各样本的群落组成。使用MUSCLE(Version 3.8.31,http://www.drive5.com/muscle/)软件进行快速多序列比对,得到所有OTUs代表序列的系统发生关系。
使用R软件(Version2.15.3)中的随机森林'randomFores'软件包,以上述二的230个物种作为重要变量,与上述一的训练集比对,进行样本归类分析。
以待测样本归入训练集中各组(D0_14、D90_150、D21_60)的可能性为判断依据,可能性最高的训练集分组即为该待测样本的预测残留时间范围,结果如下表3所示,可以看出,表3所示9个待测烟蒂样本归入训练集各组的可能性及预测残留时间结果,预测残留时间范围全部覆盖其真实残留时间,预测结果正确。
表3烟蒂样本残留时间预测结果
Figure BDA0002564605640000151
上述结果表明,本方法应用前期构建的随机森林模型,基于烟蒂样本微生物群落结构变化规律,准确预测出烟蒂样本残留时间范围,在实验样本范围内预测结果全部正确,实验方法成熟,预测结果正确,为刑事技术办案实践和法庭科学领域相关研究提供了良好方法与借鉴。
SEQUENCE LISTING
<110>公安部物证鉴定中心
<120>唾液斑中微生物群落结构变化在预测唾液斑迹残留时间中的应用
<160> 2
<170> PatentIn version 3.5
<210> 1
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<221> misc_feature
<222> (9) ..(9)
<223> m =a或c
<400> 1
gtgccagcmg ccgcggtaa 19
<210> 2
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<221> misc_feature
<222> (8) ..(8)
<223> h =a或c或t
<220>
<221> misc_feature
<222> (9) ..(9)
<223> V =a或c或g
<220>
<221> misc_feature
<222> (14) ..(14)
<223> w =a或t
<400> 2
ggactachvg ggtwtctaat 20

Claims (9)

1.检测唾液斑迹中微生物群落结构的物质在预测唾液斑迹残留时间中的应用。
2.检测唾液斑迹中微生物群落结构的物质在制备预测唾液斑迹残留时间产品中的应用。
3.根据权利要求1或2所述的应用,其特征在于:所述物质包括用于扩增唾液斑迹16sDNA的引物。
4.一种预测案件现场唾液斑迹残留时间的方法,包括如下步骤:
A1)建立训练集和检测案件现场唾液斑的微生物群落结构;
所述建立训练集的方法包括如下步骤:
A1)-1、收集案件现场周围健康人的唾液样本,再将所有所述健康人唾液样本保存;提取不同保存时间的各个健康人的唾液样本中微生物的基因组DNA,扩增16sDNA,测序,得到16sDNA测序结果;
A1)-2、对A1)-2得到的所述16sDNA测序结果注释,得到不同保存时间的唾液样本中微生物群落结构;将所述唾液样本的不同保存时间和不同保存时间下对应的微生物群落状态构成训练集;
所述检测案件现场唾液斑的微生物群落结构的方法包括如下步骤:
A1)-3、提取所述案件现场唾液斑中微生物的基因组DNA,扩增16sDNA,测序,得到16sDNA测序结果;
A1)-4、再对A1)-3得到的所述16sDNA测序结果注释,得到案件现场唾液斑中微生物群落结构;
A2)采用随机森林法对所述训练集进行计算,获得重要变量;
A3)将所述案件现场唾液斑中微生物群落结构通过随机森林法,以所述A2获得的重要变量为依据,与所述训练集比对,获得待测唾液斑迹的遗留时间。
5.根据权利要求4所述的方法,其特征在于:
A1)-1中,所述保存时间小于等于150天。
6.根据权利要求4或5所述的方法,其特征在于:
A1)-1中,所述保存为在实验室室内环境条件下保存;
和/或,所述实验室室内环境条件如下:室温为19-28℃、室内湿度为20-63%。
7.根据权利要求4-6中任一所述的方法,其特征在于:
所述注释采用的软件为Uparse、MUSCLE、Qiime软件和R软件,所述比对的数据库为SILVA的SSUrRNA数据库。
8.记载权利要求7中所述软件的可读载体、记载权利要求7中所述数据库的可读载体和用于扩增唾液斑迹中微生物16sDNA的引物在预测唾液斑迹残留时间中的应用。
9.记载权利要求7中所述软件的可读载体、记载权利要求7中所述数据库的可读载体和用于扩增唾液斑迹16sDNA的引物在制备预测唾液斑迹残留时间产品中的应用。
CN202010630365.8A 2020-07-01 唾液斑中微生物群落结构变化在预测唾液斑迹残留时间中的应用 Active CN113881787B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010630365.8A CN113881787B (zh) 2020-07-01 唾液斑中微生物群落结构变化在预测唾液斑迹残留时间中的应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010630365.8A CN113881787B (zh) 2020-07-01 唾液斑中微生物群落结构变化在预测唾液斑迹残留时间中的应用

Publications (2)

Publication Number Publication Date
CN113881787A true CN113881787A (zh) 2022-01-04
CN113881787B CN113881787B (zh) 2024-09-27

Family

ID=

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106916889A (zh) * 2017-02-16 2017-07-04 苏州贝斯派生物科技有限公司 快速检测唾液dna中微生物污染的试剂、试剂盒与其应用
WO2020018954A1 (en) * 2018-07-20 2020-01-23 Predentome, Inc. Methods and systems for oral microbiome analysis
CN111206079A (zh) * 2019-12-17 2020-05-29 西安交通大学 基于微生物组测序数据和机器学习算法的死亡时间推断方法
CN111261222A (zh) * 2018-12-03 2020-06-09 中国科学院青岛生物能源与过程研究所 口腔微生物群落检测模型的构建方法及其应用

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106916889A (zh) * 2017-02-16 2017-07-04 苏州贝斯派生物科技有限公司 快速检测唾液dna中微生物污染的试剂、试剂盒与其应用
WO2020018954A1 (en) * 2018-07-20 2020-01-23 Predentome, Inc. Methods and systems for oral microbiome analysis
CN111261222A (zh) * 2018-12-03 2020-06-09 中国科学院青岛生物能源与过程研究所 口腔微生物群落检测模型的构建方法及其应用
CN111206079A (zh) * 2019-12-17 2020-05-29 西安交通大学 基于微生物组测序数据和机器学习算法的死亡时间推断方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
EIRIK NATAAS HANSSEN 等: "fluid prediction from microbial patterns for forensic application", 《FORENSIC SCIENCE INTERNATIONAL: GENETICS》, vol. 30, pages 10 - 17, XP085151331, DOI: 10.1016/j.fsigen.2017.05.009 *
KATELYN D WEINBRECHT 等: "Time-dependent loss of mRNA transcripts from forensic stains", 《RESEARCH AND REPORTS IN FORENSIC MEDICAL SCIENCE》, vol. 7, pages 1 - 12 *
SUAAD ALSHEHHI 等: "Estimating time since deposition using quantification of RNA degradation in body fluid-specific markers", 《FORENSIC SCIENCE INTERNATIONAL》, vol. 289, pages 58 - 63 *
张瑾 等: "现场生物斑迹遗留时间推断研究进展", 《中国法医学杂志》, vol. 33, no. 1, pages 39 *
权冰娥 等: "推断唾液斑遗留时间的实验性研究", 《中国法医学杂志》, vol. 34, no. 6, pages 539 - 544 *

Similar Documents

Publication Publication Date Title
Sweeney et al. Root traits explain rhizosphere fungal community composition among temperate grassland plant species
Pozo et al. Species richness of yeast communities in floral nectar of southern Spanish plants
Dobay et al. Microbiome-based body fluid identification of samples exposed to indoor conditions
Ellison et al. The influence of habitat and phylogeny on the skin microbiome of amphibians in Guatemala and Mexico
Brinkerhoff et al. Factors affecting the microbiome of Ixodes scapularis and Amblyomma americanum
Morris et al. Microbial abundance, composition, and function in nectar are shaped by flower visitor identity
Deakin et al. Spatial structuring of soil microbial communities in commercial apple orchards
Tringe et al. A renaissance for the pioneering 16S rRNA gene
Meres et al. Dysbiosis in epizootic shell disease of the American lobster (Homarus americanus)
Estrada-Peña et al. High throughput sequencing and network analysis disentangle the microbial communities of ticks and hosts within and between ecosystems
Del Olmo-Ruiz et al. Interannual variation and host affiliations of endophytic fungi associated with ferns at La Selva, Costa Rica
Young et al. Massively parallel sequencing is unlocking the potential of environmental trace evidence
Bletz et al. Skin microbiota differs drastically between co-occurring frogs and newts
Procopio et al. “Touch microbiome” as a potential tool for forensic investigation: a pilot study
Matsuoka et al. Temporal distance decay of similarity of ectomycorrhizal fungal community composition in a subtropical evergreen forest in Japan
Fischer et al. Field assessment of hybridization between Laricobius nigrinus and L. rubidus, predators of Adelgidae
Teng et al. MALDI-TOF MS for identification of Tsukamurella species: Tsukamurella tyrosinosolvens as the predominant species associated with ocular infections
Perez-Lamarque et al. Structure and specialization of mycorrhizal networks in phylogenetically diverse tropical communities
Del Chierico et al. Identification and typing of free-living Acanthamoeba spp. by MALDI-TOF MS Biotyper
Risely et al. Gut microbiota individuality is contingent on temporal scale and age in wild meerkats
O’Keeffe et al. Parasites, niche modification and the host microbiome: a field survey of multiple parasites
Montarry et al. Spatio-temporal distribution of Erysiphe necator genetic groups and their relationship with disease levels in vineyards
Ashe et al. Characterization of bacterial community dynamics of the human mouth throughout decomposition via metagenomic, metatranscriptomic, and culturing techniques
US20180330044A1 (en) Methods Associated With A Database That Stores A Plurality Of Reference Genomes
JP6193996B2 (ja) 質量分析による微生物同定における混合物の検出

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination