CN113284560B - 病原检测背景微生物判断方法及应用 - Google Patents

病原检测背景微生物判断方法及应用 Download PDF

Info

Publication number
CN113284560B
CN113284560B CN202110466657.7A CN202110466657A CN113284560B CN 113284560 B CN113284560 B CN 113284560B CN 202110466657 A CN202110466657 A CN 202110466657A CN 113284560 B CN113284560 B CN 113284560B
Authority
CN
China
Prior art keywords
microorganism
background
microorganisms
burkholderia
pseudomonas
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110466657.7A
Other languages
English (en)
Other versions
CN113284560A (zh
Inventor
许腾
何福生
李晓蕾
谢淑媚
王小锐
李永军
苏杭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Vision Gene Technology Co ltd
Guangzhou Weiyuan Medical Equipment Co ltd
Guangzhou Weiyuan Medical Laboratory Co ltd
Shenzhen Weiyuan Medical Technology Co ltd
Original Assignee
Guangzhou Weiyuan Medical Equipment Co ltd
Guangzhou Weiyuan Medical Laboratory Co ltd
Shenzhen Weiyuan Medical Technology Co ltd
Weiyuan Shenzhen Medical Research Center Co ltd
Guangzhou Vision Gene Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Weiyuan Medical Equipment Co ltd, Guangzhou Weiyuan Medical Laboratory Co ltd, Shenzhen Weiyuan Medical Technology Co ltd, Weiyuan Shenzhen Medical Research Center Co ltd, Guangzhou Vision Gene Technology Co ltd filed Critical Guangzhou Weiyuan Medical Equipment Co ltd
Priority to CN202110466657.7A priority Critical patent/CN113284560B/zh
Publication of CN113284560A publication Critical patent/CN113284560A/zh
Application granted granted Critical
Publication of CN113284560B publication Critical patent/CN113284560B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • Biotechnology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及一种病原检测背景微生物判断方法及应用,属于生物信息学分析技术领域。该判断方法包括以下步骤:确定核心背景微生物列表:取若干生物样本,将其中各微生物基因序列数据比对至相应微生物的特征序列区域,与核酸提取浓度或文库浓度进行相关性检验,得到相关性呈负相关的微生物列表,得核心背景微生物列表;确定核心背景微生物校正指数CBI:以上述核心背景微生物列表中所有微生物的特异性比对序列数之和为CBI;背景序列判断:将待测样本中微生物的特异性比对序列数与所述CBI相除得判断值。采用该方法可以背景微生物指数的大小来校正背景相关微生物,根据校正后的量来判断样本中该病原微生物是否存在,能够更为准确的判断结果。

Description

病原检测背景微生物判断方法及应用
技术领域
本发明涉及生物信息学分析技术领域,特别是涉及一种病原检测背景微生物判断方法及应用。
背景技术
病原宏基因组学(mNGS)是一种不依赖于培养,直接从临床标本提取核酸并检测病原体的高通量测序技术。与传统临床的实验室检测方法相比,病原mNGS是基于核酸水平对序列进行检测,可以突破不同病原体类型的局限性,无偏向性的全面覆盖数千种病原体,同时鉴定细菌、真菌、病毒和寄生虫等多种类型病原微生物,病原mNGS已逐渐成为临床微生物鉴定领域的重要工具。
然而mNGS的准确性受到污染物——样本中并不真正存在的DNA序列——的影响。mNGS实验中有两种主要的污染物类型,外部污染和内部污染,它们是由不同的来源引起的。外部污染是由被测样本外部引起的,潜在污染源包括研究对象或研究人员的身体,实验室环境等;而内部污染来自于样本收集工具、提取核酸需要用到的实验耗材、文库构建需要用到的试剂等。
可以通过实验室技术来减少污染,例如紫外线辐射,“超纯化”和/或试剂的酶处理以及分离PCR前和PCR后区域。但是,即使是最佳的实验室方法也不能完全消除DNA污染。例如,生产这些实验耗材或者试剂要用到工程菌,工程菌核酸残留是必不可免的问题,通过对耗材进行处理或者严格实验室控制的方法只能消除部分污染。
实践中最常用的方法是通过计算的方法去除污染,可分为两种类型:
一种是直接去掉背景微生物的方法,比如同时设置一批阴性空白对照,通过去掉在空白对照中常见的微生物序列来去除污染;或者根据mNGS高宿主率的特点,用背景污染的核酸占比与样本核酸比例成反比的特点来去除潜在的微生物。这类型的方法只能获得潜在的背景污染列表,使用一刀切的方法,直接去掉这些微生物。但是临床常见病原体,比如鲍曼不动杆菌、铜绿假单胞菌、肺炎克雷伯菌、嗜麦芽窄食单胞菌、大肠杆菌、粪肠球菌、粘质沙雷菌等,都是同时存在于核酸提取背景或者试剂背景中的微生物,并不能判断样本中该微生物究竟是背景污染还是来源于样本本身的。
另一种是方法是通过加入内参进行定量,去除相对丰度在阈值以下的微生物,该方法对于内参的要求较高,需要定量准确且复杂度高的一个内参集,操作较为复杂。但实际操作中,我们发现不同的样本类型由于需要的前处理步骤不同,什么时候加入内参是会对最终定量的结果有不同影响的,不同样本类型需要单独计算相应的阈值,另外该方法基于严格假定背景微生物的核酸是个稳定的常量,在实践操作中经常发现不同批次的实验耗材的背景污染还是会有波动的,因此容易出现批次假阳或者假阴问题。
发明内容
基于此,有必要针对上述问题,提供一种病原检测背景微生物判断方法,采用该方法,可以背景微生物指数的大小来校正背景相关微生物,根据校正后的量来判断样本中该病原微生物是否存在,能够更为准确的判断结果。
一种病原检测背景微生物判断方法,包括以下步骤:
确定核心背景微生物列表:取若干生物样本,测序,获得高频且稳定出现在样本中的微生物种类,并获得该微生物的特异性比对序列数,将相应样本的核酸提取浓度或文库浓度与该微生物的特异性比对序列数进行相关性检验,得到相关性呈负相关的微生物列表,去除此列表中既是背景又是病原的微生物以及常见微生态细菌,即得核心背景微生物列表;
确定核心背景微生物校正指数CBI:以上述核心背景微生物列表中所有微生物的特异性比对序列数之和为CBI;
背景序列判断:将待测样本中微生物的特异性比对序列数与所述CBI相除得到判断值,当所述判断值大于阈值,则判断为所述待测样本中真实存在该微生物,当所述判断值小于等于阈值,则判断为所述待测样本中的序列为背景序列。
本发明人在充分调研实际实验工作中出现背景污染序列的情况后得出,mNGS测序常见微生物可以归类为三块:(1)来源于不同样品类型的微生态细菌,比如血液采集时来源于皮肤的表皮葡萄球菌,采集呼吸道样品时来源于口腔的罗氏菌、副流感菌,实验室环境相关的随机微生物污染,其中实验室微生物污染可以通过严格管理实验室环境来降低;(2)一些常见的病原微生物,比如鲍曼不动杆菌、铜绿假单胞菌、嗜麦芽窄食单胞菌、肺炎克雷伯菌、大肠杆菌、粪肠球菌、粘质沙雷菌等,同时这些微生物也是需要判断是病原还是背景的微生物;(3)耗材或者试剂相关微生物,对于这些微生物,需要去除那些经常出现的病原微生物,本发明中重点分析判断的微生物(核心背景微生物)就属于这部分。
基于上述基础及实验分析后,本发明人提出一种核心背景微生物校正指数(CBI)的概念,用背景微生物指数的大小来校正背景相关微生物的方法,根据校正后的量(判断值)来判断样本中该病原微生物是否存在,该方法也属于内参方法,但非常简洁和巧妙。
该CBI判断理论的基础是,常见的背景微生物主要来源于提取核酸需要用到的实验耗材、文库构建需要用到的试剂,这些东西通常是大批量标准生产的产品,有着严格的工艺标准,因此,里面的背景微生物构成和各自核酸的量应该较为稳定。然而,该方法需要排除掉那些来源于实验室操作的随机污染或者采样污染的背景,即只分析高频且稳定出现在样本中的微生物,以及需要排除既是常见病原又是背景的那些微生物,由于这些背景波动较大,会影响CBI的可靠性。
CBI是由这些核心背景集构成,当这个核心背景集的结构构成比较复杂时,那么测序得到的序列反映核酸浓度的稳定性就会比定量投入的内参更好,并且由背景指数来校正背景,即使是出现批次的背景核酸量的波动性,那么整体的上升或者下降并不影响校正的效果。
而且本发明由于无需投入定量内参,无需额外操作,可以利用历史所有的数据来获得稳定的核心背景集微生物列表,用历史大数据进行评估判断区分效果。
同时,对于所有微生物,CBI校正后的值可以进行样本间大小的比较,因此也同时具备了可以进行定量的特性,作用广泛,应用可扩展性高。所以,这种CBI的方法策略可扩展性好,稳健,有效性高。
在其中一个实施例中,所述确定核心背景微生物列表步骤中,所述相关性检验为pearson相关性检验和spearman相关性检验。可以理解的,基于背景污染与样本核酸总量成反比的规律,可通过相关性检验呈负相关获得背景微生物列表,以pearson相关性检验以及spearman相关性检验同时显著且负相关为背景微生物的判断标准,具有较高的准确性。
在其中一个实施例中,所述确定核心背景微生物列表步骤中,将若干生物样本按收集测序时间顺序分为至少2个数据集,每个数据集中均包括得到的全部样本类型(肺泡灌洗液、痰液、脑脊液、咽拭子、血液、组织等),所述相关性呈负相关的微生物列表中的微生物在>40%的数据集中均呈负相关。
对于核心背景微生物列表的确定,需寻找到那些在样品里面普遍存在的微生物,这些微生物需要在历史不同时期都普遍存在,并且在不同样品类型里面普遍存在的,可通过将样本划分为不同数据集进行分析,确定微生物为普遍存在的。
在其中一个实施例中,所述确定核心背景微生物列表步骤中,所述高频且稳定出现指该微生物在所有生物样本中出现的频率≥25%,且出现在所有的数据集中。将出现频率设定于≥25%,且出现在所有的数据集中,可有效排除来源于实验室操作的随机污染或者采样污染的背景。
在其中一个实施例中,所述确定核心背景微生物列表步骤中,所述既是背景又是病原的那些微生物以及常见微生态细菌包括:鲍曼不动杆菌、铜绿假单胞菌、大肠埃希菌、表皮葡萄球菌、皮肤痤疮杆菌、嗜麦芽窄食单胞菌。可以理解的,为提高本发明判断方法的稳定性,需要去除那些经常在样品中真实存在的微生物,比如一些微生态、常见病原菌。本领域技术人员可根据具体的实验需求,对上述微生物名单进行增减。
在其中一个实施例中,所述核心背景微生物列表包括以下微生物:
Acinetobacter_bereziniae(别氏不动杆菌)
Acinetobacter_guillouiae(桂林不动杆菌)
Acinetobacter_johnsonii(约氏不动杆菌)
Acinetobacter_junii(琼氏不动杆菌)
Acinetobacter_lwoffii(洛菲不动杆菌)
Acinetobacter_schindleri(申氏不动杆菌)
Acinetobacter_ursingii(乌尔辛不动杆菌)
Bosea_lupini
Brevundimonas_diminuta(缺陷短波单胞菌)
Brevundimonas_vesicularis(泡囊短波单胞菌)
Burkholderia_ambifaria(须芒草伯克霍尔德菌)
Burkholderia_cepacia(洋葱伯克霍尔德菌)
Burkholderia_diffusa(广泛伯克霍尔德菌)
Burkholderia_gladioli(唐菖蒲伯克霍尔德菌)
Burkholderia_oklahomensis(俄克拉荷马伯克霍尔德菌)
Burkholderia_pseudomallei(类鼻疽伯克霍尔德菌)
Burkholderia_pyrrocinia(吡咯素伯克霍尔德菌)
Burkholderia_thailandensis(泰国伯克霍尔德菌)
Burkholderia_ubonensis(乌汶伯克霍尔德菌)
Burkholderia_vietnamiensis(越南伯克霍尔德菌)
Cloacibacterium_normanense
Comamonas_terrigena
Corynebacterium_aurimucosum(粘金黄棒状杆菌)
Corynebacterium_callunae(美棒状杆菌)
Cutibacterium_granulosum
Delftia_acidovorans(食酸代尔夫特菌)
Delftia_tsuruhatensis(代尔夫特菌)
Ensifer_adhaerens(粘着剑菌)
Hafnia_alvei(蜂房哈夫尼菌)
Hafnia_paralvei(副蜂房哈夫尼菌)
Kocuria_palustris(沼泽库克菌)
Malassezia_globosa(球形马拉色菌)
Methylobacterium_aquaticum(水生甲基杆菌)
Methylobacterium_extorquens(扭脱甲基杆菌)
Methylobacterium_radiotolerans(耐辐射甲基杆菌)
Micrococcus_luteus(藤黄微球菌)
Moraxella_osloensis(奥斯陆莫拉菌)
Mycobacterium_mucogenicum(产粘液分枝杆菌)
Obesumbacterium_proteus(变形肥杆菌)
Ochrobactrum_anthropi(人苍白杆菌)
Paraburkholderia_fungorum
Paracoccus_sanguinis
Pseudomonas_chlororaphis(绿针假单胞菌)
Pseudomonas_entomophila(虫媒假单胞菌)
Pseudomonas_fluorescens(荧光假单胞菌)
Pseudomonas_fulva(黄褐假单胞菌)
Pseudomonas_monteilii(蒙氏假单胞菌)
Pseudomonas_oleovorans(噬油假单胞菌)
Pseudomonas_putida(恶臭假单胞菌)
Pseudomonas_stutzeri(斯氏假单胞菌)
Pseudomonas_veronii(维龙假单胞菌)
Ralstonia_pickettii(皮氏罗尔斯顿菌)
Ralstonia_solanacearum(青枯罗尔斯顿菌)
Rhodococcus_erythropolis(红城红球菌)
Rhodococcus_fascians(束红球菌)
Sphingobium_xenophagum(噬异物鞘脂菌)
Sphingobium_yanoikuyae(矢野口鞘脂菌)
Sphingomonas_echinoides(多刺形鞘氨醇单胞菌)
Sphingomonas_melonis(甜瓜鞘氨醇单胞菌)
Sphingomonas_parapaucimobilis(类少动鞘氨醇单胞菌)
Sphingomonas_paucimobilis(少动鞘氨醇单胞菌)
Sphingopyxis_alaskensis(阿拉斯加鞘氨醇盒菌)
Xanthomonas_campestris(野油菜黄单胞菌)。
在其中一个实施例中,所述核心背景微生物校正指数CBI值通过以下方法计算得到:将测序获得微生物基因数据比对至微生物基因组数据库,获得每种核心背景微生物的特异性比对序列数,将所有核心背景微生物的特异序列数进行加和,即得CBI值。
在其中一个实施例中,所述背景序列判断步骤中,所述阈值通过以下方法得到:预先取若干阴性样本和阳性样本,按照上述方法,将待测样本中微生物的特异性比对序列数与所述CBI相除得到判断值,分别得到阴性样本和阳性样本的判断值,根据若干所述阴性样本和阳性样本的判断值确定该微生物的阈值。
本发明还公开了上述的病原检测背景微生物判断方法在病原微生物检测分析中的应用。
将上述方法应用于病原微生物检测分析中,用核心背景微生物校正指数CBI的大小来校正背景相关微生物,根据校正后的量来判断样本中该病原微生物是否存在,能够更为准确的判断结果,提高了检测分析准确性。
本发明还公开了一种病原微生物检测系统,包括:
检测模块,用于对待测样本进行微生物特异性序列定量检测;
分析模块,获取上述微生物定量检测数据,按照权利要求1-8任一项所述的方法进行分析,判断待测样本中微生物的序列是否为背景序列;
输出模块,将上述判断结果输出。
与现有技术相比,本发明具有以下有益效果:
本发明的一种病原检测背景微生物判断方法,根据每个样本的核心背景微生物校正指数CBI,用它进行校正获得可在样本间进行比较的值,通过判断该值是否高于阈值来决定是否样本中真实存在该微生物,能够具体到对每个样本做出准确的统计学判断。
且本发明的判断方法并不需要加入内参,无需额外的实验操作,能够利用历史所有的样本来评估,并且由于是采用背景来校正背景相关微生物的方法,属于“解铃还需系铃人”的策略,并不受批次背景核酸量整体上升或者下降的影响,属于非常简洁高效稳健的方法。同时,对于所有微生物,CBI校正后的数据可以进行样本间大小的比较,因此也同时具备了可以进行定量的特性,作用广泛,应用可扩展性高。
附图说明
图1为实施例1中病原检测背景微生物判断方法步骤流程示意图;
图2为实施例1中鲍曼不动杆菌阳性样品与阴性样品CBI校正后判断值的盒子图;
图3为实施例1中ROC曲线图;
图4为实施例2中ROC曲线图。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的较佳实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容的理解更加透彻全面。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
以下实施例所用试剂,如无特别说明,均为常规市售可得;以下实施例所采用方法,如无特别说明,均为按照常规方法可实现。
实施例1
一种病原检测背景微生物判断方法,如图1所示,包括以下步骤:
1、确定核心背景微生物列表。
1.1样本分析。
取在本公司广州实验室测序的约2万例mNGS测序的DNA样本,按样本的时间顺序,每2000个样本作为一个数据集(每个数据集里面都同时包含了各种类型的样本,如肺泡灌洗液、痰液、脑脊液、咽拭子、血液、组织等)。
首先获得在该数据集里面出现频率大于25%,且出现在所有的数据集中的微生物,即高频且稳定出现在样本中的微生物种类。
之后计算这些样本的核酸提取浓度或文库浓度与每种微生物的特异性比对序列数的pearson相关性检验和spearman相关性检验。
具体的,本实施例中对各微生物的特异性比对序列数为将测序得到的基因数据比对至本司CN 201910779825.0的中国发明专利所公开技术方案构建得到的病原微生物基因组数据库。但可以理解的,如采用其他数据库也是适用的。
对于在多个数据集(>40%的数据集)里面同时满足pearson相关性检验显著负相关且spearman相关性检验显著负相关的微生物(稳定存在于不同采样时间的不同类型的样本中),即得到相关性呈负相关的微生物列表。
再去除经常在样本中真实存在的病原微生物(既是背景又是病原的微生物)以及一些微生态细菌(这些会影响背景指数的稳定性),如鲍曼不动杆菌、铜绿假单胞菌、大肠埃希菌、表皮葡萄球菌、皮肤痤疮杆菌、嗜麦芽窄食单胞菌等。最后获得一个核心背景微生物列表,如下表1所示。
这个列表里面的微生物基本不在样本中真实存在,但是却与那些既是背景又是病原的微生物息息相关(比如核酸提取的柱子上会残留不少不动杆菌属的核酸,会影响到鲍曼不动杆菌的判断),我们定义这个核心背景微生物的总特异性比对序列数为核心背景微生物校正指数CBI。
本实施分析得到的核心背景微生物列表如下所示。
表1.核心背景微生物列表
Figure BDA0003044335220000071
Figure BDA0003044335220000081
Figure BDA0003044335220000091
注:英文为该微生物英文名,“-”表示无相应中文名。
2、确定核心背景微生物校正指数CBI
按照上述表格中的核心背景微生物列表,根据下式(1)计算CBI。
CBI=∑m∈LUnique_Read_Of_microbiome_m (1)
式中:L为核心背景微生物列表中微生物。
3、背景序列判断
将待测样本中鲍曼不动杆菌的特异性比对序列数与上述CBI相除得判断值,按照下式(2)进行判断。当所述判断值大于阈值T,则判断为所述待测样本中真实存在该微生物,当所述判断值小于等于阈值T,则判断为所述待测样本中的特征序列为背景序列。
Figure BDA0003044335220000092
本实例中,由于mNGS测序受样品宿主率的影响,有很多临床样品并没有测到鲍曼不动杆菌的特异性序列,甚至是有部分样品没有测到鲍曼不动杆菌的序列,我们从约2万例DNA临床样品里面,回顾性收集了11725例有鲍曼不动杆菌特异性比对序列的样品,其中1031例样品是鲍曼不动杆菌阳性样品。
计算每个样本的判断值,即将样本中鲍曼不动杆菌的特异性比对序列数与CBI相除,然后观察样品中鲍曼不动杆菌阳性样品与阴性样品是否有明显的区分度。结果如图2所示。
图2中,左边是鲍曼不动杆菌阳性样品,用CBI校正后的值的盒子图分布;右边是鲍曼不动杆菌阴性(背景)样品,用鲍曼不动杆菌阳性样品与阴性样品。可以看到,阴性样品的值分布呈现非常标准的正态分布,这与模型的假设是一致的。简单以0.04作为阈值,可以看到假阴性的比例为7%,假阳性的比例为3.6%(部分是气凝胶污染导致的强阳污染)。即本发明判断方法的区分度清晰,性能好。
4、评估判断效果。
我们随机取上述11725例测到有鲍曼不动杆菌样本中的9728例样本,按上述公式1,2计算判断值,然后按ROC模型所得阈值T判断检测得到鲍曼不动杆菌是否为背景序列。
ROC曲线如图3所示,以阈值为0.046判断,AUC值为0.996,特异性为0.969,敏感性为0.969。
上述结果说明,采用本发明的病原检测背景微生物判断方法,能够准确判断测序所得微生物序列是否为试剂耗材背景引入,且不存在批次假阳或者假阴问题。
实施例2
收集639例临床样品作为验证集,采用实施例1的方法分析判断样本中的特征序列是否为背景序列。
按照实施例1的方法测序,获得其中鲍曼不动杆菌基因序列数据,按照上述方法分析,建立模型,绘制ROC曲线,结果如图4所示,以阈值为0.041判断,AUC值为0.992,特异性为0.942,敏感性为0.983。
上述结果说明,本发明的病原检测背景微生物判断方法,对于不同来源批次的样本均能达到较好的区分效果,具有判断稳定性高,实用性强的优势。
可以理解的,上述实施例中判断方法适用样本类型广泛,不受样品类型限制,DNA或者RNA都可以,同时该模型并不只是限制在上述鲍曼不动杆菌,其他微生物也同样适用。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (9)

1.一种病原检测背景微生物判断方法,其特征在于,包括以下步骤:
确定核心背景微生物列表:取若干生物样本,测序,获得高频且稳定出现在样本中的微生物种类,并获得该微生物的特异性比对序列数,将相应样本的核酸提取浓度或文库浓度与该微生物的特异性比对序列数进行相关性检验,得到相关性呈负相关的微生物列表,去除此列表中既是背景又是病原的微生物以及常见微生态细菌,即得核心背景微生物列表;
确定核心背景微生物校正指数CBI:以上述核心背景微生物列表中所有微生物的特异性比对序列数之和为CBI;
背景序列判断:将待测样本中微生物的特异性比对序列数与所述CBI相除得到判断值,当所述判断值大于阈值,则判断为所述待测样本中真实存在该微生物,当所述判断值小于等于阈值,则判断为所述待测样本中的序列为背景序列。
2.根据权利要求1所述的病原检测背景微生物判断方法,其特征在于,所述确定核心背景微生物列表步骤中,所述相关性检验为pearson相关性检验和spearman相关性检验。
3.根据权利要求2所述的病原检测背景微生物判断方法,其特征在于,所述确定核心背景微生物列表步骤中,将若干生物样本按收集测序时间顺序分为至少2个数据集,每个数据集中均包括得到的全部样本类型,所述相关性呈负相关的微生物列表中的微生物在>40%的数据集中均呈负相关。
4.根据权利要求3所述的病原检测背景微生物判断方法,其特征在于,所述确定核心背景微生物列表步骤中,所述高频且稳定出现指该微生物在所有生物样本中出现的频率≥25%,且出现在所有的数据集中。
5.根据权利要求1所述的病原检测背景微生物判断方法,其特征在于,所述确定核心背景微生物列表步骤中,所述既是背景又是病原的那些微生物以及常见微生态细菌包括:鲍曼不动杆菌、铜绿假单胞菌、大肠埃希菌、表皮葡萄球菌、皮肤痤疮杆菌、嗜麦芽窄食单胞菌。
6.根据权利要求1所述的病原检测背景微生物判断方法,其特征在于,所述核心背景微生物列表包括以下微生物:
Acinetobacter_bereziniae(别氏不动杆菌)
Acinetobacter_guillouiae(桂林不动杆菌)
Acinetobacter_johnsonii(约氏不动杆菌)
Acinetobacter_junii(琼氏不动杆菌)
Acinetobacter_lwoffii(洛菲不动杆菌)
Acinetobacter_schindleri(申氏不动杆菌)
Acinetobacter_ursingii(乌尔辛不动杆菌)
Bosea_lupini
Brevundimonas_diminuta(缺陷短波单胞菌)
Brevundimonas_vesicularis(泡囊短波单胞菌)
Burkholderia_ambifaria(须芒草伯克霍尔德菌)
Burkholderia_cepacia(洋葱伯克霍尔德菌)
Burkholderia_diffusa(广泛伯克霍尔德菌)
Burkholderia_gladioli(唐菖蒲伯克霍尔德菌)
Burkholderia_oklahomensis(俄克拉荷马伯克霍尔德菌)
Burkholderia_pseudomallei(类鼻疽伯克霍尔德菌)
Burkholderia_pyrrocinia(吡咯素伯克霍尔德菌)
Burkholderia_thailandensis(泰国伯克霍尔德菌)
Burkholderia_ubonensis(乌汶伯克霍尔德菌)
Burkholderia_vietnamiensis(越南伯克霍尔德菌)
Cloacibacterium_normanense
Comamonas_terrigena
Corynebacterium_aurimucosum(粘金黄棒状杆菌)
Corynebacterium_callunae(美棒状杆菌)
Cutibacterium_granulosum
Delftia_acidovorans(食酸代尔夫特菌)
Delftia_tsuruhatensis(代尔夫特菌)
Ensifer_adhaerens(粘着剑菌)
Hafnia_alvei(蜂房哈夫尼菌)
Hafnia_paralvei(副蜂房哈夫尼菌)
Kocuria_palustris(沼泽库克菌)
Malassezia_globosa(球形马拉色菌)
Methylobacterium_aquaticum(水生甲基杆菌)
Methylobacterium_extorquens(扭脱甲基杆菌)
Methylobacterium_radiotolerans(耐辐射甲基杆菌)
Micrococcus_luteus(藤黄微球菌)
Moraxella_osloensis(奥斯陆莫拉菌)
Mycobacterium_mucogenicum(产粘液分枝杆菌)
Obesumbacterium_proteus(变形肥杆菌)
Ochrobactrum_anthropi(人苍白杆菌)
Paraburkholderia_fungorum
Paracoccus_sanguinis
Pseudomonas_chlororaphis(绿针假单胞菌)
Pseudomonas_entomophila(虫媒假单胞菌)
Pseudomonas_fluorescens(荧光假单胞菌)
Pseudomonas_fulva(黄褐假单胞菌)
Pseudomonas_monteilii(蒙氏假单胞菌)
Pseudomonas_oleovorans(噬油假单胞菌)
Pseudomonas_putida(恶臭假单胞菌)
Pseudomonas_stutzeri(斯氏假单胞菌)
Pseudomonas_veronii(维龙假单胞菌)
Ralstonia_pickettii(皮氏罗尔斯顿菌)
Ralstonia_solanacearum(青枯罗尔斯顿菌)
Rhodococcus_erythropolis(红城红球菌)
Rhodococcus_fascians(束红球菌)
Sphingobium_xenophagum(噬异物鞘脂菌)
Sphingobium_yanoikuyae(矢野口鞘脂菌)
Sphingomonas_echinoides(多刺形鞘氨醇单胞菌)
Sphingomonas_melonis(甜瓜鞘氨醇单胞菌)
Sphingomonas_parapaucimobilis(类少动鞘氨醇单胞菌)
Sphingomonas_paucimobilis(少动鞘氨醇单胞菌)
Sphingopyxis_alaskensis(阿拉斯加鞘氨醇盒菌)
Xanthomonas_campestris(野油菜黄单胞菌)。
7.根据权利要求1所述的病原检测背景微生物判断方法,其特征在于,所述核心背景微生物校正指数CBI值通过以下方法计算得到:
将测序获得微生物基因数据比对至微生物基因组数据库,获得每种核心背景微生物的特异性比对序列数,将所有核心背景微生物的特异序列数进行加和,即得CBI值。
8.根据权利要求1所述的病原检测背景微生物判断方法,其特征在于,所述背景序列判断步骤中,所述阈值通过以下方法得到:预先取若干阴性样本和阳性样本,按照上述方法,将待测样本中微生物的特异性比对序列数与所述CBI相除得到判断值,分别得到阴性样本和阳性样本的判断值,根据若干所述阴性样本和阳性样本的判断值确定该微生物的阈值。
9.一种病原微生物检测系统,其特征在于,包括:
检测模块,用于对待测样本进行微生物特异性序列定量检测;
分析模块,获取上述微生物定量检测数据,按照权利要求1-8任一项所述的方法进行分析,判断待测样本中微生物的序列是否为背景序列;
输出模块,将上述判断结果输出。
CN202110466657.7A 2021-04-28 2021-04-28 病原检测背景微生物判断方法及应用 Active CN113284560B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110466657.7A CN113284560B (zh) 2021-04-28 2021-04-28 病原检测背景微生物判断方法及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110466657.7A CN113284560B (zh) 2021-04-28 2021-04-28 病原检测背景微生物判断方法及应用

Publications (2)

Publication Number Publication Date
CN113284560A CN113284560A (zh) 2021-08-20
CN113284560B true CN113284560B (zh) 2022-05-17

Family

ID=77277512

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110466657.7A Active CN113284560B (zh) 2021-04-28 2021-04-28 病原检测背景微生物判断方法及应用

Country Status (1)

Country Link
CN (1) CN113284560B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114038501B (zh) * 2021-12-21 2022-05-27 广州金匙医学检验有限公司 一种基于机器学习的背景菌判定方法
CN115440299A (zh) * 2022-08-25 2022-12-06 中国科学院心理研究所 确定背景微生物的方法、设备、介质和程序产品
CN117051129B (zh) * 2023-10-10 2024-03-22 瑞因迈拓科技(广州)有限公司 一种微生物检测背景菌阈值设定方法及其应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105525033A (zh) * 2014-09-29 2016-04-27 天津华大基因科技有限公司 检测血液中微生物的方法及装置
CN109082479A (zh) * 2017-06-14 2018-12-25 深圳华大基因研究院 从样本中鉴定微生物物种的方法和装置

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060210967A1 (en) * 2004-07-02 2006-09-21 Agan Brian K Re-sequencing pathogen microarray
US8478544B2 (en) * 2007-11-21 2013-07-02 Cosmosid Inc. Direct identification and measurement of relative populations of microorganisms with direct DNA sequencing and probabilistic methods
US20150242565A1 (en) * 2012-08-01 2015-08-27 Bgi Shenzhen Method and device for analyzing microbial community composition
BR112017021318A2 (pt) * 2015-04-09 2018-06-26 Koninklijke Philips N.V. método implementado por computador, e mídia legível por computador
US20160364523A1 (en) * 2015-06-11 2016-12-15 Seven Bridges Genomics Inc. Systems and methods for identifying microorganisms
EP3384025A4 (en) * 2015-12-04 2019-07-03 Biome Makers Inc. MICROBIAL-BASED IDENTIFICATION, MONITORING AND IMPROVEMENT OF FERMENTATION PROCESSES AND PRODUCTS
KR20190080825A (ko) * 2016-03-21 2019-07-08 다나-파버 캔서 인스티튜트 인크. T-세포 기능소실 상태-특이적 유전자 발현 조절인자 및 그 용도
CN110612446B (zh) * 2017-03-31 2023-07-04 美国卫生和人力服务部 分离新抗原-特异性t细胞受体序列的方法
CN110462064A (zh) * 2017-04-18 2019-11-15 深圳华大生命科学研究院 基于外泌体核酸进行微生物检测的方法及其应用
CN111164706B (zh) * 2017-08-14 2024-01-16 普梭梅根公司 疾病相关的微生物组表征过程
CN110875082B (zh) * 2018-09-04 2022-05-31 深圳华大因源医药科技有限公司 一种基于靶向扩增测序的微生物检测方法和装置
CA3123940A1 (en) * 2019-01-07 2020-07-16 Pivot Bio, Inc. Plant colonization assays using natural microbial barcodes
US20200258595A1 (en) * 2019-02-11 2020-08-13 International Business Machines Corporation Methods of filtering sequenced microbiome samples
CN110349630B (zh) * 2019-06-21 2023-03-14 深圳华大因源医药科技有限公司 血液宏基因组测序数据的分析方法、装置及其应用
CN110473594B (zh) * 2019-08-22 2020-05-05 广州微远基因科技有限公司 病原微生物基因组数据库及其建立方法
CN110751984B (zh) * 2019-10-31 2020-07-14 广州微远医疗器械有限公司 宏基因组或宏转录组测序数据自动化分析方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105525033A (zh) * 2014-09-29 2016-04-27 天津华大基因科技有限公司 检测血液中微生物的方法及装置
CN109082479A (zh) * 2017-06-14 2018-12-25 深圳华大基因研究院 从样本中鉴定微生物物种的方法和装置

Also Published As

Publication number Publication date
CN113284560A (zh) 2021-08-20

Similar Documents

Publication Publication Date Title
CN113284560B (zh) 病原检测背景微生物判断方法及应用
Underwood et al. FragSeq: transcriptome-wide RNA structure probing using high-throughput sequencing
CN110349630B (zh) 血液宏基因组测序数据的分析方法、装置及其应用
Gohl et al. Systematic improvement of amplicon marker gene methods for increased accuracy in microbiome studies
Morandi et al. Genome-scale deconvolution of RNA structure ensembles
Parekh et al. The impact of amplification on differential expression analyses by RNA-seq
CN109273053B (zh) 一种高通量测序的微生物数据处理方法
Kuleshov et al. Whole-genome haplotyping using long reads and statistical methods
Ramette Quantitative community fingerprinting methods for estimating the abundance of operational taxonomic units in natural microbial communities
Harris et al. Comparison of normalization methods for construction of large, multiplex amplicon pools for next-generation sequencing
CN113160882B (zh) 一种基于三代测序的病原微生物宏基因组检测方法
CN111607639A (zh) 基于内参进行宏基因组病原定量检测的方法和装置
CN113066533B (zh) 一种mNGS病原体数据分析方法
CN113270145B (zh) 判断背景引入微生物序列的方法及其应用
Pechlivanis et al. Detecting SARS-CoV-2 lineages and mutational load in municipal wastewater and a use-case in the metropolitan area of Thessaloniki, Greece
US20130045878A1 (en) Process for identification of pathogens
EP2419846A1 (en) Methods for nucleic acid quantification
Fabyanic et al. Quantitative single cell 5hmC sequencing reveals non-canonical gene regulation by non-CG hydroxymethylation
Peimbert et al. A hitchhiker’s guide to metatranscriptomics
Acera Mateos et al. Prediction of m6A and m5C at single-molecule resolution reveals a transcriptome-wide co-occurrence of RNA modifications
Amir Microbiome analysis using 16S amplicon sequencing: from samples to ASVs
Vaks New method of evaluation of limit of detection in molecular diagnostics
Dannemann et al. 'maskBAD'-a package to detect and remove Affymetrix probes with binding affinity differences
Goyal et al. Revolutionizing Medical Microbiology: How Molecular and Genomic Approaches Are Changing Diagnostic Techniques
CN117051129B (zh) 一种微生物检测背景菌阈值设定方法及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20230828

Address after: Room 303, G10, South China new material innovation park, building 3, No. 31, Kefeng Road, Guangzhou hi tech Industrial Development Zone, Guangdong 510130

Patentee after: GUANGZHOU VISION GENE TECHNOLOGY Co.,Ltd.

Patentee after: Guangzhou Weiyuan Medical Equipment Co.,Ltd.

Patentee after: Guangzhou Weiyuan medical laboratory Co.,Ltd.

Patentee after: Shenzhen Weiyuan Medical Technology Co.,Ltd.

Address before: Room 303, G10, South China new material innovation park, building 3, No. 31, Kefeng Road, Guangzhou hi tech Industrial Development Zone, Guangdong 510130

Patentee before: GUANGZHOU VISION GENE TECHNOLOGY Co.,Ltd.

Patentee before: Guangzhou Weiyuan Medical Equipment Co.,Ltd.

Patentee before: Guangzhou Weiyuan medical laboratory Co.,Ltd.

Patentee before: Shenzhen Weiyuan Medical Technology Co.,Ltd.

Patentee before: Weiyuan (Shenzhen) Medical Research Center Co.,Ltd.

TR01 Transfer of patent right