CN115859174A - 一种细菌性脑膜炎分类模型构建方法及其在识别脑脊液宏基因组测序假阳性结果中的应用 - Google Patents
一种细菌性脑膜炎分类模型构建方法及其在识别脑脊液宏基因组测序假阳性结果中的应用 Download PDFInfo
- Publication number
- CN115859174A CN115859174A CN202310019023.6A CN202310019023A CN115859174A CN 115859174 A CN115859174 A CN 115859174A CN 202310019023 A CN202310019023 A CN 202310019023A CN 115859174 A CN115859174 A CN 115859174A
- Authority
- CN
- China
- Prior art keywords
- bacterial meningitis
- classification model
- sequencing
- cerebrospinal fluid
- false positive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 206010027202 Meningitis bacterial Diseases 0.000 title claims abstract description 112
- 201000009904 bacterial meningitis Diseases 0.000 title claims abstract description 112
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 68
- 238000013145 classification model Methods 0.000 title claims abstract description 67
- 210000001175 cerebrospinal fluid Anatomy 0.000 title claims abstract description 46
- 238000010276 construction Methods 0.000 title claims description 20
- 230000014509 gene expression Effects 0.000 claims abstract description 41
- 238000000034 method Methods 0.000 claims abstract description 29
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 23
- 244000052769 pathogen Species 0.000 claims abstract description 15
- 230000001717 pathogenic effect Effects 0.000 claims abstract description 14
- 244000052616 bacterial pathogen Species 0.000 claims description 24
- 238000001514 detection method Methods 0.000 claims description 22
- 239000002299 complementary DNA Substances 0.000 claims description 11
- 108020004707 nucleic acids Proteins 0.000 claims description 11
- 150000007523 nucleic acids Chemical class 0.000 claims description 11
- 102000039446 nucleic acids Human genes 0.000 claims description 11
- 238000007405 data analysis Methods 0.000 claims description 6
- 238000007477 logistic regression Methods 0.000 claims description 4
- 239000013642 negative control Substances 0.000 claims description 4
- 238000003745 diagnosis Methods 0.000 abstract description 10
- 238000004458 analytical method Methods 0.000 abstract description 7
- 238000012216 screening Methods 0.000 abstract description 5
- 201000010099 disease Diseases 0.000 abstract description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 4
- 238000011109 contamination Methods 0.000 description 12
- 238000012360 testing method Methods 0.000 description 11
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 7
- 208000015181 infectious disease Diseases 0.000 description 6
- 201000009906 Meningitis Diseases 0.000 description 5
- 238000003759 clinical diagnosis Methods 0.000 description 5
- 230000035945 sensitivity Effects 0.000 description 5
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 4
- 102100029344 ATP synthase protein 8 Human genes 0.000 description 3
- 102100029394 Homeobox protein PKNOX1 Human genes 0.000 description 3
- 101000700892 Homo sapiens ATP synthase protein 8 Proteins 0.000 description 3
- 101000912191 Homo sapiens Cystatin-B Proteins 0.000 description 3
- 101000884770 Homo sapiens Cystatin-M Proteins 0.000 description 3
- 101001125957 Homo sapiens Homeobox protein PKNOX1 Proteins 0.000 description 3
- 108091006965 SLC35G3 Proteins 0.000 description 3
- 102100032208 Solute carrier family 35 member G3 Human genes 0.000 description 3
- 241001147736 Staphylococcus capitis Species 0.000 description 3
- 239000011324 bead Substances 0.000 description 3
- 241000588626 Acinetobacter baumannii Species 0.000 description 2
- 102100026891 Cystatin-B Human genes 0.000 description 2
- 241000193985 Streptococcus agalactiae Species 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 244000000010 microbial pathogen Species 0.000 description 2
- 238000003908 quality control method Methods 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 1
- 208000035143 Bacterial infection Diseases 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 206010057190 Respiratory tract infections Diseases 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 241000295644 Staphylococcaceae Species 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 241000192087 Staphylococcus hominis Species 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 208000022362 bacterial infectious disease Diseases 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000008499 blood brain barrier function Effects 0.000 description 1
- 210000001218 blood-brain barrier Anatomy 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000010805 cDNA synthesis kit Methods 0.000 description 1
- 208000025222 central nervous system infectious disease Diseases 0.000 description 1
- 230000002490 cerebral effect Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000009533 lab test Methods 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000012372 quality testing Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供了一种利用细菌性脑膜炎分类模型识别脑脊液宏基因组测序假阳性结果的方法,涉及疾病诊疗技术领域。本发明提供了一种细菌性脑膜炎分类模型的构建方法,通过筛选细菌性脑膜炎相关宿主基因,构建得到了细菌性脑膜炎分类模型得分公式。同时,本发明还提供了利用所述细菌性脑膜炎分类模型识别脑脊液宏基因组测序假阳性结果的方法,基于同时检测脑脊液中病原体序列和人类基因表达谱的宏基因组测序方法,将所述的细菌性脑膜炎分类模型与宏基因组病原菌诊断结果进行联合分析,能够准确地识别污染导致的宏基因组测序假阳性结果,提高宏基因组测序检测病原菌的准确性。
Description
技术领域
本发明涉及疾病诊疗技术领域,具体涉及一种细菌性脑膜炎分类模型构建方法及其在识别脑脊液宏基因组测序假阳性结果中的应用。
背景技术
细菌性脑膜炎是由细菌等病原体感染引起的严重中枢神经系统感染性疾病。细菌性脑膜炎在婴幼儿尤其多见,由于婴幼儿大脑发育不完善,抵抗力弱,病原菌易经过血脑屏障进入脑内,疾病进展快,治疗不及时其致残致死率高,严重影响儿童的生命健康。因此早期精准诊断并及时给予合理治疗至关重要。
脑脊液(CSF)检查是诊断细菌性脑膜炎的主要手段。由于抗生素的普遍应用等导致脑脊液培养阳性率低,约为20%~30%,且耗时长,不利于疾病的早期、快速诊断。PCR方法能够提高病原检出率,但检测靶标有限,且依赖临床医生的经验。脑脊液污染在一定范围内也普遍存在,可能原因包括采样污染、标本交叉污染和设备污染,最常见的污染物为葡萄球菌。污染会产生假阳性结果,导致临床误诊、医疗资源浪费和不合适的抗生素使用。
宏基因组测序(mNGS)可以获得脑脊液样品中存在所有微生物基因组序列信息,有助于无偏好的所有检测病原体。测序技术的发展和成本的降低给宏基因组应用到脑膜炎临床诊断提供了重要基础。宏基因组同样无法区分感染和污染,这为宏基因组的大规模应用提供了障碍。
结合宿主脑脊液感染指标进行联合诊断有助于识别污染等假阳性结果,临床上常通过脑脊液白细胞计数等生化常规指标经验性地鉴别污染和细菌感染,但灵敏性和特异性较差,容易漏诊误诊。因此寻找新的量化指标尤为重要。基于宿主基因表达谱的分类模型是现阶段感染鉴别的研究热点,已在呼吸道感染中有良好表现,但在儿童细菌性脑膜炎尚未见相关报道。因此,如何基于宿主基因表达谱构建细菌性脑膜炎分类模型,用来识别污染导致的宏基因组测序假阳性结果以及提高病原菌诊断准确性等问题仍旧亟需解决。
发明内容
有鉴于此,本发明的目的在于提供一种利用细菌性脑膜炎分类模型识别脑脊液宏基因组测序假阳性结果的方法,将宏基因组病原菌检测结果与细菌性脑膜炎分类模型进行联合分析,能够准确的识别污染导致的脑膜炎假阳性结果。
为解决上述技术问题,本发明提供了以下技术方案:
本发明提供了一种细菌性脑膜炎分类模型的构建方法,所述构建方法包括如下步骤:
收集细菌性脑膜炎患者和阴性对照的脑脊液样本,对所述脑脊液样本中的核酸进行测序、数据分析获得所述脑脊液样本中基因的表达量;
根据所述基因的表达量结果建立细菌性脑膜炎逻辑回归模型,即可得到细菌性脑膜炎的分类模型公式;所述脑膜炎的分类模型公式如下:
其中,X=(0.556×CST6表达量)+(0.027×SLC35G3表达量)+(0.490×PKNOX1表达量)+(-0.984×MTATP8表达量);
所述的构建方法构建得到的细菌性脑膜炎得分(Y),根据所述细菌性脑膜炎得分(Y)的阈值区分细菌性脑膜炎患者与阴性;所述细菌性脑膜炎得分(Y)的阈值为0.5;所述(Y)<0.5时,患者判定为阴性;所述(Y)≥0.5时,患者判定为细菌性脑膜炎。
优选的,所述核酸包括DNA和RNA;所述RNA经反转录成cDNA,利用所述cDNA和DNA共同构建文库后进行测序。
优选的,所述测序为宏基因组测序。
优选的,所述数据分析包括如下步骤:
将测序所得数据比对到人类参考基因组序列,统计比对到所述参考基因组外显子区域的reads数目,即得所述脑脊液样本中基因的表达量。
优选的,所述人类参考基因组序列为UCUC数据库中人类hg19或hg38参考基因组。
本发明提供了上述的构建方法得到的细菌性脑膜炎分类模型在识别脑脊液测序假阳性结果中的应用。
本发明还提供了一种识别脑脊液宏基因组测序假阳性结果的方法,所述方法包括如下步骤:
利用上述构建方法得到的细菌性脑膜炎分类模型计算细菌性脑膜炎得分(Y);经所述的脑膜炎分类结果与患者的病原菌检测结果进行比较分析,即可识别脑脊液宏基因组测序的假阳性结果。
优选的,所述细菌性脑膜炎得分(Y)的阈值为0.5;所述(Y)<0.5时,患者判定为阴性;所述(Y)≥0.5时,患者判定为细菌性脑膜炎。
优选的,所述患者的病原菌检测结果由宏基因组测序得到。
优选的,若宏基因组测序检出病原菌,且细菌性脑膜炎分类模型结果为细菌性脑膜炎类别,则病原菌检测结果为真;若宏基因组测序检出病原菌,但细菌性脑膜炎分类模型结果判定为阴性,则为污染等引起的假阳性结果。
本发明的有益技术效果:
本发明提供了一种细菌性脑膜炎分类模型的构建方法,通过筛选细菌性脑膜炎相关的宿主基因CST6、SLC35G3、PKNOX1和MTATP8,构建得到了细菌性脑膜炎分类模型及得分公式。同时,本发明还提供了利用所述细菌性脑膜炎分类模型识别脑脊液宏基因组测序假阳性结果的方法,基于同时检测脑脊液中病原体序列和宿主基因表达谱的宏基因组测序方法,将所述的细菌性脑膜炎分类模型与宏基因组病原菌诊断结果进行联合分析,经试验证实,本发明所述方法能够准确的识别污染导致的脑膜炎假阳性结果,有效的提高了宏基因组测序检测病原菌的准确性。
附图说明
图1为细菌性脑膜炎分类模型在训练集样本中的表现结果。
图2为细菌性脑膜炎分类模型在测试集样本中的表现结果。
图3为应用分类模型识别脑脊液污染样本的分析流程。
具体实施方式
本发明提供了一种细菌性脑膜炎分类模型的构建方法,所述构建方法包括如下步骤:
收集细菌性脑膜炎患者的脑脊液样本,对所述脑脊液样本中的核酸进行测序、数据分析获得所述脑脊液样本中基因的表达量;
根据所述基因的表达量结果建立细菌性脑膜炎逻辑回归模型,即可得到细菌性脑膜炎的分类模型公式:
其中,X=(0.556×CST6表达量)+(0.027×SLC35G3表达量)+(0.490×PKNOX1表达量)+(-0.984×MTATP8表达量);
所述的构建方法构建得到的细菌性脑膜炎得分(Y),根据所述细菌性脑膜炎得分(Y)的阈值区分细菌性脑膜炎患者与阴性;所述细菌性脑膜炎得分(Y)的阈值为0.5;所述(Y)<0.5时,患者判定为阴性;所述(Y)≥0.5时,患者判定为细菌性脑膜炎。
本发明中,所述核酸包括DNA和RNA;所述RNA经反转录成cDNA,利用所述cDNA和DNA共同构建文库后进行测序。本发明对所述核酸的提取方法并没有特殊限定,在本发明的具体实施例中,所述核酸的提取方法优选为磁珠法。本发明中,所述cDNA和DNA构建文库优选的包括如下步骤:DNA和cDNA经超声波打断,进行末端修补,添加测序接头,纯化连接产物,PCR扩增及质检。
本发明中,所述测序优选为宏基因组测序;所述宏基因组测序所得的测序数据即reads序列优选的利用Trimmomatic等软件进行质控。
本发明中,所述数据分析优选的包括如下步骤:将测序所得数据比对到人类参考基因组序列,统计比对到所述参考基因组外显子区域的reads数目,即得所述脑脊液样本中基因的表达量。本发明中,所述人类参考基因组序列优选为UCUC数据库中人类hg19参考基因组或人类hg38参考基因组。
本发明提供了上述的构建方法得到的细菌性脑膜炎分类模型在识别脑脊液测序假阳性结果中的应用。
本发明还提供了一种识别脑脊液宏基因组测序假阳性结果的方法,所述方法包括如下步骤:
利用上述构建方法得到的细菌性脑膜炎分类模型计算细菌性脑膜炎得分(Y);经所述的脑膜炎分类结果与患者的病原菌检测结果进行比较分析,即可识别脑脊液宏基因组测序的假阳性结果。
本发明中,所述细菌性脑膜炎得分(Y)的阈值为0.5;所述(Y)<0.5时,患者判定为阴性;所述(Y)≥0.5时,患者判定为细菌性脑膜炎。本发明中,所述患者的病原体检测结果优选的由宏基因组测序得到;所述患者的病原体检测结果优选的由如下步骤得到:将reads比对到人参考基因组去除人源序列,然后将剩余序列与病原微生物参考数据库进行比对和物种分类,检测样本中是否含有病原菌,检出病原菌的样本随后进行后续分析。
本发明中,若宏基因组测序检出病原菌,且细菌性脑膜炎分类模型结果为细菌性脑膜炎类别,则病原菌检测结果为真;若宏基因组测序检出病原菌,但细菌性脑膜炎分类模型结果判定为阴性,则为污染等引起的假阳性结果。
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例对本发明进行详细的说明,但是不能把它们理解为对本发明保护范围的限定。
下述实施例中,如无特殊说明,均为常规方法。
下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1
建立细菌性脑膜炎分类模型
1.收集细菌性脑膜炎患者样本
采集54例脑脊液样本,其中包括32例细菌性脑膜炎患者的脑脊液样本和22例阴性脑脊液样本。所有样本信息完整,包括患者基本信息、实验室检查结果、临床诊断及治疗信息。细菌性脑膜炎类别指的是临床诊断为细菌性脑膜炎,病原学检测为阳性;阴性样本类别即患者无感染症状及表现,病原学检查阴性。
2.同时检测DNA和RNA的宏基因组方法
(1)核酸提取纯化及预处理
参照QIAGEN核酸提取试剂盒采取蛋白酶消化和磁珠吸附的方法获得纯化的DNA和RNA;利用“Transcriptor first strand cDNA synthesis kit”试剂盒将RNA反转成cDNA;逆转录完成后将cDNA用NEB公司的“mRNA Second Strand Synthesis Module”进行二链合成。
(2)宏基因组文库构建
DNA和cDNA参照NEB公司“Ultra TM II DNA Library Prep Kit”试剂盒构建测序文库,具体如下:
超声波将DNA打断成500bp左右的短片段;末端添加A碱基,添加测序接头;采用磁珠法对连接产物进行纯化;利用通用引物,对连接产物进行PCR;文库质检,使用Qubit测定文库浓度。
(3)上机测序
利用Illumina测序平台进行双端150bp的宏基因组测序,产出FASTQ格式原始测序数据(reads)。
3.利用宏基因组测序检测病原菌
利用FastQC软件进行质控,并利用Trimmomatic软件过滤低质量序列;利用bowtie2等比对软件比对到人参考基因组去除人源序列;利用kraken2软件将剩余序列与病原微生物参考数据库进行比对和物种分类,检测脑脊液样本中的病原菌。结果显示,细菌性脑膜炎患者样本中检出了鲍曼不动杆菌、大肠杆菌、无乳链球菌等病原菌,与细菌性脑膜炎诊断结果一致。
4.构建细菌性脑膜炎分类模型
(1)获得宿主基因表达量
利用STAR比对软件将测序片段比对到UCSC数据库中人类hg19或hg38参考基因组。利用featureCounts软件统计比对到基因外显子区域的reads数目,得到脑脊液样本中宿主基因的表达量。
(2)构建细菌性脑膜炎分类模型
运用DaMiRseq软件去除年龄、性别等混杂因素的影响,并筛选出细菌性脑膜炎和阴性对照之间的差异表达基因;
使用R语言glmnet软件构建二分类逻辑回归模型,以DaMiRseq软件筛选出的差异表达基因为输入数据,运用glmnet软件cv.glmnet函数构建低复杂度、适度拟合的细菌性脑膜炎分类模型。
具体步骤为:所有宿主基因A经DamiRseq软件筛选得到基因集B;基因集B作为分类模型的输入数据,从中经过筛选得到了计算分类模型得分用到的基因集C。C就是用于计算数值Y所用的基因集:CST6、SLC35G3、PKNOX1、MTATP8。
根据所述基因的表达量结果建立细菌性脑膜炎分类模型,模型公式如下:
其中,(Y)为细菌性脑膜炎得分,X=(0.556×CST6表达量)+(0.027×SLC35G3表达量)+(0.490×PKNOX1表达量)+(-0.984×MTATP8表达量)。
4.评估分类模型的表现
根据建立的细菌性脑膜炎分类模型,计算患者的细菌性脑膜炎得分(Y)(表1)。(Y)取值范围为0-1,以0.5作为阈值,(Y)<0.5则将患者划分为阴性,(Y)≥0.5则将患者划分为细菌性脑膜炎类别。
以患者实际临床信息作为金标准,其中48例样本分类正确,6例样本分类错误。运用受试者工作特征曲线(ROC曲线)分析评估分类模型的表现,结果如图1。由图1可以看出,本发明建立的细菌性脑膜炎分类模型表现良好,曲线下面积(AUC)为0.947,灵敏度(sensitivity)为90.6%,特异度(specificity)为86.4%。
表1测试集样本的诊断信息、模型所用宿主基因的表达量及细菌性脑膜炎分类模型结果
实施例2
验证细菌性脑膜炎分类模型的表现
1.收集脑脊液样本作为测试集
采集在深圳市儿童医院就诊的细菌性脑膜炎患者和阴性对照的脑脊液标本共28例作为测试集。样本信息完整,包括患者基本信息、病原学检测结果、临床诊断及治疗情况。其中16例为细菌性脑膜炎样本,12例为阴性样本,具体信息见表2。
2.测试集样本进行宏基因组测序
采用实施例1的方法进行宏基因组测序及病原体检测。样本中检出了鲍曼不动杆菌、无乳链球菌等病原菌,与诊断结果一致。
3.计算测试集样本的细菌性脑膜炎得分
根据实施例2建立的细菌性脑膜炎分类模型得分公式计算得分Y,公式为:
其中,X=(0.556×CST6表达量)+(0.027×SLC35G3表达量)+(0.490×PKNOX1表达量)+(-0.984×MTATP8表达量),(Y)取值为0.5。
根据分类模型公式计算出的测试集样本的细菌性脑膜炎得分(Y)见表2。其中(Y)<0.5的患者有11例,被预测为阴性(n=10);(Y)≥0.5的患者有17例,被判定为细菌性脑膜炎(n=17)。
表2测试集样本的诊断信息、模型所用宿主基因的表达量及细菌性脑膜炎分类模型结果
4.细菌性脑膜炎分类模型在测试集中表现良好
以患者实际诊断信息作为金标准,大部分样本(25/28,89%)例样本的预测结果与金标准一致,只有3例样本的分类结果与金标准不一致。运用受试者工作特征曲线(ROC)分析评估模型的准确性,结果见图2。
由图2可以看出,本发明所述模型同样在测试集样本中表现良好,曲线下面积(AUC)为0.969,灵敏度(sensitivity)为93.8%,特异度(specificity)为83.3%,进一步验证了分类模型的能力。
实施例3
应用分类模型识别污染导致的假阳性测序结果
1.收集疑似污染的脑脊液样本
收集到3例疑似污染的临床脑脊液样本,这些样本的生化常规指标和临床表现基本正常,但是按照实施例1的步骤进行的宏基因组测序结果显示病原菌阳性(表3),其中样本1和2检出头状葡萄球菌,样本3检出人葡萄球菌(表3),皆为常见的污染菌。临床医生怀疑这3例样本为污染导致的假阳性结果。
表3宏基因组测序结果
样本 | 宏基因组测序结果 | 标准化reads数 |
1 | 人葡萄球菌 | 23.7 |
2 | 头状葡萄球菌 | 28.5 |
3 | 头状葡萄球菌 | 108.0 |
2.细菌性脑膜炎分类模型得分
根据实施例1中的细菌性脑膜炎分类模型对这三个样本进行判分。流程见图3,模型结果如表4。
表4细菌性脑膜炎分类模型结果
3.病原体检测和脑脊液分类模型联合分析
综合病原体检测结果和细菌性脑膜炎分类模型结果进行综合分析,对于病原菌检测阳性的样本:
(1)如果分类模型结果为细菌性脑膜炎类别,则为感染;
(2)如果分类模型结果为阴性类别,则为假阳性检测结果。
1-3号样本的病原菌检测结果为阳性,但是细菌性脑膜炎分类模型皆为阴性类别,说明这3个样本是污染引起的假阳性结果。
上述结果表明本发明可以有效识别由污染引起的假阳性宏基因组测序结果。
可以看出,三个样本的分类结果均为阴性样本而非细菌性脑膜炎,这表明这些样本很有可能是污染引起的假阳性宏基因组测序结果,与临床诊断相符。
根据以上实施例可以看出,本发明构建了细菌性脑膜炎分类模型,可以有效区分细菌性脑膜炎和阴性样本,利用所述细菌性脑膜炎分类模型可以识别污染等导致的宏基因组测序假阳性结果,可以提高宏基因组测序病原菌检测的准确性。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种细菌性脑膜炎分类模型的构建方法,其特征在于,所述构建方法包括如下步骤:
收集细菌性脑膜炎患者及阴性对照的脑脊液样本,对所述脑脊液样本中的核酸进行测序、数据分析获得所述脑脊液样本中基因的表达量;
根据所述基因的表达量结果建立细菌性脑膜炎逻辑回归模型,即可得到细菌性脑膜炎分类模型公式如下:
其中,X=(0.556×CST6表达量)+(0.027×SLC35G3表达量)+(0.490×PKNOX1表达量)+(-0.984×MTATP8表达量);
所述的构建方法构建得到的细菌性脑膜炎得分(Y),根据所述细菌性脑膜炎得分(Y)的阈值区分细菌性脑膜炎患者与阴性;所述细菌性脑膜炎得分(Y)的阈值为0.5;所述(Y)<0.5时,患者判定为阴性;所述(Y)≥0.5时,患者判定为细菌性脑膜炎。
2.根据权利要求1所述的构建方法,其特征在于,所述核酸包括DNA和RNA;所述RNA经反转录成cDNA,利用所述cDNA和DNA共同构建文库后进行测序。
3.根据权利要求1或2所述的构建方法,其特征在于,所述测序为宏基因组测序。
4.根据权利要求1所述的构建方法,其特征在于,所述数据分析包括如下步骤:
将测序所得数据比对到人类参考基因组序列,统计比对到所述参考基因组外显子区域的reads数目,即得所述脑脊液样本中人类基因的表达量。
5.根据权利要求4所述的构建方法,其特征在于,所述人类参考基因组序列为UCUC数据库中人类hg19参考基因组或人类hg38参考基因组。
6.权利要求1-5任意一项所述的构建方法得到的细菌性脑膜炎分类模型在识别脑脊液宏基因组测序假阳性结果中的应用。
7.一种识别脑脊液宏基因组测序假阳性结果的方法,其特征在于,所述方法包括如下步骤:
利用权利要求1所述构建方法得到的细菌性脑膜炎分类模型计算细菌性脑膜炎得分(Y);经所述的模型判分结果与患者的病原菌检测结果进行比较分析,即可识别脑脊液宏基因组测序的假阳性结果。
8.根据权利要求7所述的方法,其特征在于,所述细菌性脑膜炎得分(Y)的阈值为0.5;所述(Y)<0.5时,患者判定为阴性;所述(Y)≥0.5时,患者判定为细菌性脑膜炎。
9.根据权利要求7所述的方法,其特征在于,所述患者的病原菌检测结果由宏基因组测序得到。
10.根据权利要求7所述的方法,其特征在于,若宏基因组测序检出病原菌,且所述的细菌性脑膜炎分类模型判断为细菌性脑膜炎,则宏基因组测序病原菌检测结果为真;若宏基因组测序检出病原菌,但所述的细菌性脑膜炎分类模型判断为阴性,则为假阳性结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310019023.6A CN115859174A (zh) | 2023-01-06 | 2023-01-06 | 一种细菌性脑膜炎分类模型构建方法及其在识别脑脊液宏基因组测序假阳性结果中的应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310019023.6A CN115859174A (zh) | 2023-01-06 | 2023-01-06 | 一种细菌性脑膜炎分类模型构建方法及其在识别脑脊液宏基因组测序假阳性结果中的应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115859174A true CN115859174A (zh) | 2023-03-28 |
Family
ID=85657042
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310019023.6A Pending CN115859174A (zh) | 2023-01-06 | 2023-01-06 | 一种细菌性脑膜炎分类模型构建方法及其在识别脑脊液宏基因组测序假阳性结果中的应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115859174A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090221021A1 (en) * | 2005-12-14 | 2009-09-03 | Martin Chalumeau | Distinction between bacterial meningitis and viral meningitis |
US20170016920A1 (en) * | 2014-02-27 | 2017-01-19 | Fundação Oswaldo Cruz (Fiocruz) | Qualitative predictive method for differential diagnosis of pneumococcal, meningococcal and viral meningitis, method and kit for differential diagnosis of meningitis |
CN111394486A (zh) * | 2020-04-09 | 2020-07-10 | 复旦大学附属儿科医院 | 基于宏基因组测序的儿童感染性疾病病原检测及鉴定方法 |
CN111394799A (zh) * | 2020-03-11 | 2020-07-10 | 广州赛哲生物科技股份有限公司 | 一种脑膜炎病原体宏基因组二代测序文库的构建方法及其试剂盒 |
CN113571128A (zh) * | 2021-08-05 | 2021-10-29 | 深圳华大因源医药科技有限公司 | 一种用于宏基因组学病原体检测参考阈值建立的方法 |
CN115537462A (zh) * | 2022-10-13 | 2022-12-30 | 深圳市儿童医院 | 一种同时检测病原菌和宿主基因表达量的测序方法及在细菌性脑膜炎诊断和预后中的应用 |
-
2023
- 2023-01-06 CN CN202310019023.6A patent/CN115859174A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090221021A1 (en) * | 2005-12-14 | 2009-09-03 | Martin Chalumeau | Distinction between bacterial meningitis and viral meningitis |
US20170016920A1 (en) * | 2014-02-27 | 2017-01-19 | Fundação Oswaldo Cruz (Fiocruz) | Qualitative predictive method for differential diagnosis of pneumococcal, meningococcal and viral meningitis, method and kit for differential diagnosis of meningitis |
CN111394799A (zh) * | 2020-03-11 | 2020-07-10 | 广州赛哲生物科技股份有限公司 | 一种脑膜炎病原体宏基因组二代测序文库的构建方法及其试剂盒 |
CN111394486A (zh) * | 2020-04-09 | 2020-07-10 | 复旦大学附属儿科医院 | 基于宏基因组测序的儿童感染性疾病病原检测及鉴定方法 |
CN113571128A (zh) * | 2021-08-05 | 2021-10-29 | 深圳华大因源医药科技有限公司 | 一种用于宏基因组学病原体检测参考阈值建立的方法 |
CN115537462A (zh) * | 2022-10-13 | 2022-12-30 | 深圳市儿童医院 | 一种同时检测病原菌和宿主基因表达量的测序方法及在细菌性脑膜炎诊断和预后中的应用 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113689912B (zh) | 基于宏基因组测序的微生物对比结果校正的方法和系统 | |
CN111041089B (zh) | Covid-19感染的宿主标志物的应用 | |
CN113160882B (zh) | 一种基于三代测序的病原微生物宏基因组检测方法 | |
CN111378788B (zh) | 辅助covid-19诊断的菌种标志物及其应用 | |
CN111394486A (zh) | 基于宏基因组测序的儿童感染性疾病病原检测及鉴定方法 | |
CN114898800B (zh) | 一种预测肺炎克雷伯菌对头孢曲松敏感性的方法及系统 | |
CN115537462B (zh) | 一种同时检测病原菌和宿主基因表达量的测序方法及在细菌性脑膜炎诊断和预后中的应用 | |
CN114854847A (zh) | 构建鉴定感染性疾病和非感染性疾病的机器学习模型的方法 | |
CN115651990B (zh) | 用于预测大肠埃希菌对抗生素药敏表型的特征基因组合、试剂盒及测序方法 | |
CN116656851A (zh) | 一种生物标志物及其在慢性阻塞性肺疾病诊断方面的应用 | |
CN115859174A (zh) | 一种细菌性脑膜炎分类模型构建方法及其在识别脑脊液宏基因组测序假阳性结果中的应用 | |
CN113355438B (zh) | 一种血浆微生物物种多样性评估方法、装置和存储介质 | |
CN114214438B (zh) | 胆道菌群检测试剂在制备预测胆道结石术后早期复发的试剂中的应用 | |
CN112011605B (zh) | 微生物菌群在疾病诊断中的应用 | |
CN113470752A (zh) | 一种基于纳米孔测序仪的细菌测序数据鉴定方法 | |
CN114196779A (zh) | 基于靶向测序的病原微生物检测方法及试剂盒 | |
CN109182577B (zh) | 自闭症生物标志物及其应用 | |
CN114107454A (zh) | 基于宏基因/宏转录组测序的呼吸道感染病原检测方法 | |
CN115418406B (zh) | 用于预测肺炎克雷伯菌对抗生素药敏表型的特征基因组合、试剂盒及测序方法 | |
CN116072215A (zh) | 病原体检测方法和系统 | |
US20240011105A1 (en) | Analysis of microbial fragments in plasma | |
TWI797593B (zh) | 基於總體基因體定序之定序文庫的建構方法、病原檢測方法及其病原檢測系統(一) | |
Broderick | Paediatric respiratory disease and the microbiota: noisy signals and opportunities for intervention | |
CN110396537B (zh) | 哮喘生物标志物及其用途 | |
CN114369665A (zh) | 基于NanoString平台检测基因融合用于辅助诊断软组织肉瘤的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |