CN112992351A - 一种人体肠道健康状态的特征表达方法及其评估方法 - Google Patents
一种人体肠道健康状态的特征表达方法及其评估方法 Download PDFInfo
- Publication number
- CN112992351A CN112992351A CN202110255643.0A CN202110255643A CN112992351A CN 112992351 A CN112992351 A CN 112992351A CN 202110255643 A CN202110255643 A CN 202110255643A CN 112992351 A CN112992351 A CN 112992351A
- Authority
- CN
- China
- Prior art keywords
- group
- samples
- sample
- strain
- input sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 241000282414 Homo sapiens Species 0.000 title claims abstract description 28
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000011156 evaluation Methods 0.000 title abstract description 11
- 230000007413 intestinal health Effects 0.000 title abstract description 11
- 230000036541 health Effects 0.000 claims abstract description 39
- 241000894006 Bacteria Species 0.000 claims abstract description 29
- 210000001035 gastrointestinal tract Anatomy 0.000 claims description 17
- 230000000968 intestinal effect Effects 0.000 claims description 14
- 241000894007 species Species 0.000 claims description 13
- 201000010099 disease Diseases 0.000 claims description 8
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 8
- 230000003862 health status Effects 0.000 claims description 8
- 230000003115 biocidal effect Effects 0.000 claims description 5
- 238000010885 neutral beam injection Methods 0.000 claims description 4
- 230000001580 bacterial effect Effects 0.000 claims description 3
- 238000011160 research Methods 0.000 abstract description 4
- 238000012216 screening Methods 0.000 description 14
- 230000006872 improvement Effects 0.000 description 6
- 244000005700 microbiome Species 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 210000000936 intestine Anatomy 0.000 description 2
- 238000013178 mathematical model Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 208000023275 Autoimmune disease Diseases 0.000 description 1
- 241001146702 Candidatus Entotheonella factor Species 0.000 description 1
- 208000017667 Chronic Disease Diseases 0.000 description 1
- 208000001145 Metabolic Syndrome Diseases 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 201000000690 abdominal obesity-metabolic syndrome Diseases 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 235000013361 beverage Nutrition 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供了一种人体肠道健康状态的特征表达方法及其评估方法,其中人体肠道健康状态的特征表达方法包括:准备A组样本和B组样本;计算各个菌种在A组样本和B组样本的频率和相对丰度,得到A组样本的优势菌集合GA和B组样本的优势菌集合GB;根据输入样本的各个菌种的相对丰度,得到输入样本的alpha多样性参数;通过A组样本的聚类中心点和聚类半径等计算输入样本与A组样本的相似度;通过输入样本中输入样本中优势菌集合GA的集体丰度以及输入样本中优势菌集合GB的集体丰度得到输入样本的健康系数。采用本发明的技术方案,可以对一些具体研究领域的健康状况进行定量分析和评估,从而让客户更好地了解自己的身体健康状态。
Description
技术领域
本发明属于生命科学和数据挖掘技术领域,尤其涉及一种人体肠道健康状态的特征表达方法及其评估方法。
背景技术
人体内的肠道微生态环境和大量复杂的慢性疾病有关,如肠道微生物和癌症、自身免疫疾病和代谢综合症之间存在联系。国内外的大量研究发现肠道微生物可用于阐明大量疾病的病理机制,也可被用于开发一些顽固疾病的干预策略。由于人类摄入的食品饮料在进入血液代谢之前要经过肠道微生物环境的预处理,人体内的肠道环境可能在宿主健康和疾病中发挥重要作用,这一领域的深入研究和知识转化有利于开发新型的分析测试或定量方法,例如可以根据肠道微生物的丰度指标描述宿主的健康状况。事实上目前用肠道菌群作为标志物进行健康检测,是菌群转化研究的热点之一。
目前的肠道微生物学在开发基于无创型粪便的测试、动态监测和预测健康方面有望发挥重要作用。人们可以通过持续监测自己的肠道微生物丰度的显著变化或异常,或者通过把自己的肠道微生物检测结果和健康组基线数据比较,来进一步了解自己的身体健康状态,从而选择适合自己的健康干预方式;但是对于个体的健康状况,并不能给出定量的分析评价。
发明内容
针对以上技术问题,本发明公开了一种人体肠道健康状态的特征表达方法及其评估方法,提供了一种多角度优势菌群的筛选方案,并在此基础上构建用于描述人体肠道健康状态的数学模型,该方法有利于肠道微生物标志物的筛选,并对一些具体研究领域的健康状况做定量分析描述。
对此,本发明采用的技术方案为:
一种人体肠道健康状态的特征表达方法,其特征在于,其包括:
步骤S1,准备A组样本和B组样本,其中A组样本中每种菌种的平均相对丰度小于θAr,并含有长寿高龄样本,B组样本存在平均相对丰度大于θBr的菌种;
步骤S2,计算各个菌种在A组样本和B组样本的频率和相对丰度,得到A组样本的优势菌集合GA和B组样本的优势菌集合GB;
步骤S3,根据输入样本的各个菌种的相对丰度,得到输入样本的alpha多样性参数;
步骤S4,根据A组中各个样本不同菌种的相对丰度,得到A组样本的聚类中心点和聚类半径radius_A;并根据输入样本的不同菌种的相对丰度,计算输入样本和A组各样本的欧氏距离,得到输入样本与A组样本的欧氏距离最小值min_A_distance;计算输入样本和B组各样本的欧氏距离,得到输入样本与B组样本的欧氏距离最小值min_B_distance;
若min_A_distance<min_B_distance,则采用如下公式计算得到相似度similarity;
similarity=(radius_A-distance)/radius_A;
其中,distance为输入样本与A组样本的聚类中心点的欧式距离;similarity最大值为1,也可以为负值,负值表示不相似。
若min_A_distance≥min_B_distance,则similarity=0;
步骤S5,计算输入样本中优势菌集合GA的集体丰度TA,以及输入样本中优势菌集合GB的集体丰度TB,采用如下公式计算得到输入样本的健康系数factor;
factor=log10(TA/TB)。
进一步的,所述长寿高龄样本的数量在A组样本中的占比不少于30%。
进一步的,所述长寿高龄样本中,95岁以上老人数量比例不小于11%,85岁以上老人数量比例不小于21%。
作为本发明的进一步改进,步骤S1中,对样本进行预处理,删掉不合格样本。
作为本发明的进一步改进,对于A组样本,过滤掉有疾病史和抗生素服用史的样本。
作为本发明的进一步改进,步骤S2中,
菌种j在A组样本中的频率为PA,j=cA,j/NA;
菌种j在B组样本中的频率为PB,j=cB,j/NB;
其中,j为菌种的序号,cA,j为A组样本中含有菌种j的样本数,NA为A组样本的总数;cB,j为B组样本中含有菌种j的样本数,NB为B组样本的总数;
其中,i为A组样本中的样本序号,ri,j为菌种j在样本i中的相对丰度;
其中,k为B组样本中的样本序号,rk,j为菌种j在样本k中的相对丰度;
计算A组样本、B组样本菌群中不同菌种的频率差异参数dPAB,j=PA,j-PB,j,
计算A组样本、B组样本菌群中不同菌种的相对丰度差异参数dRAB,j=ARA,j-ARB,j;
若菌种j满足dPAB,j≥θp1>0,dRAB,j≥θR1>0,则筛选为A组的优势菌种,这些菌种记为优势菌集合GA;若菌种j满足dPBA,j≥θp2>0,dRBA,j≥θR2>0,则筛选为B组的优势菌种,这些菌种记为优势菌集合GB;其中,θp1为A组优势菌种的频率阈值,θR1为A组优势菌种的丰度阈值,θp2为B组优势菌种的频率阈值,θR2为B组优势菌种的丰度阈值。
作为本发明的进一步改进,步骤S3中,根据输入样本的alpha多样性参数与A组样本、B组样本的alpha多样性参数进行比较,确定输入样本属于A组样本或B组样本的范围。
作为本发明的进一步改进,所述输入样本的alpha多样性参数采用如下公式计算得到:
alpha=∑|rjln(rj)|,其中,rj为菌种j在输入样本的相对丰度。
本发明还公开了一种人体肠道健康状态的评估方法,其包括:
根据如上任意一项所述的人体肠道健康状态的特征表达方法得到输入样本的alpha多样性参数,输入样本的相似度similarity和输入样本的健康系数factor,进行肠道健康状况评估,得到健康状况。
作为本发明的进一步改进,若alpha>alpha_A_min,similarity≥θsim,健康系数factor>0,则该输入样本的健康状态为健康肠型;
其中,alpha_A_min为A组样本的菌种丰度多样性的最小值;θsim为设定的相似度阈值。
与现有技术相比,本发明的有益效果为:
采用本发明的技术方案,提供了一种多角度优势菌群的筛选方案,并在此基础上构建了用于描述人体肠道健康状态的数学模型,采用该数学模型,可以有利于肠道微生物标志物的筛选,可以对一些具体研究领域的健康状况进行定量分析和评估,可以更好的了解自己的身体健康状态。
附图说明
图1是本发明一种人体肠道健康状态的特征表达方法的样本数据处理部分的流程图。
图2是本发明一种人体肠道健康状态的特征表达方法的参数输出的流程图。
具体实施方式
下面对本发明的较优的实施例作进一步的详细说明。
一种人体肠道健康状态的特征表达方法,其包括:
步骤S1,准备A组样本和B组样本,对样本进行预处理,删掉不合格样本,A组样本,过滤掉有疾病史和抗生素服用史的样本。
其中A组样本中每种菌种的平均相对丰度小于15%,并含有不少于30%的长寿高龄样本,B组样本存在平均相对丰度大于20%的菌种;本实施例中,95岁以上老人数量比例不小于11%,85岁以上老人数量比例不小于21%。
步骤S2,计算各个菌种在A组样本和B组样本的频率和相对丰度,得到A组样本的优势菌集合GA和B组样本的优势菌集合GB;具体包括:
菌种j在A组样本中的频率为PA,j=cA,j/NA;
菌种j在B组样本中的频率为PB,j=cB,j/NB;
其中,j为菌种的序号,cA,j为A组样本中含有菌种j的样本数,NA为A组样本的总数;cB,j为B组样本中含有菌种j的样本数,NB为B组样本的总数;
其中,i为A组样本中的样本序号,ri,j为菌种j在样本i中的相对丰度;
其中,k为B组样本中的样本序号,rk,j为菌种j在样本k中的相对丰度;
计算A组样本、B组样本菌群中不同菌种的频率差异参数dPAB,j=PA,j-PB,j,
计算A组样本、B组样本菌群中不同菌种的相对丰度差异参数dRAB,j=ARA,j-ARB,j;
若菌种j满足dPAB,j≥θp1>0,dRAB,j≥θR1>0,则筛选为A组的优势菌种,这些菌种记为优势菌集合GA;若菌种j满足dPBA,j≥θp2>0,dRBA,j≥θR2>0,则筛选为B组的优势菌种,这些菌种记为优势菌集合GB;
其中,θp1为A组优势菌种的频率阈值,如可设置为2,4,6,8,9等,θR1为A组优势菌种的丰度阈值,如可设置为0.5,1.0,1.5,2.0等;θp2为B组优势菌种的频率阈值,如可设置为0.5,1.0,1.5,2.0等,θR2为B组优势菌种的丰度阈值,如可设置为0.5,1.0,1.5,2.0等。
步骤S3,根据输入样本的各个菌种的相对丰度,得到输入样本的alpha多样性参数,公式如下:
alpha=∑|rjln(rj)|其中,rj为菌种j在输入样本的相对丰度。
根据输入样本的alpha多样性参数与A组样本、B组样本的alpha多样性参数进行比较,确定输入样本属于A组样本或B组样本的范围。
步骤S4,根据A组中各个样本不同菌种的相对丰度,得到A组样本的聚类中心点和聚类半径radius_A;并根据输入样本的不同菌种的相对丰度,计算输入样本和A组各样本的欧氏距离,得到输入样本与A组样本的欧氏距离最小值min_A_distance;计算输入样本和B组各样本的欧氏距离,得到输入样本与B组样本的欧氏距离最小值min_B_distance;
若min_A_distance<min_B_distance,则采用如下公式计算得到相似度similarity;
similarity=(radius_A-distance)/radius_A;
其中,distance为输入样本与A组样本的聚类中心点的欧式距离;
若min_A_distance≥min_B_distance,则similarity=0;
步骤S5,计算输入样本中优势菌集合GA的集体丰度TA,以及输入样本中优势菌集合GB的集体丰度TB,采用如下公式计算得到输入样本的健康系数factor;
factor=log10(TA/TB)。
本实施例还提供了一种人体肠道健康状态的评估方法,其包括:
将输入样本的alpha多样性参数,输入样本的相似度similarity和输入样本的健康系数factor,与判决标准对比进行肠道健康状况评估,得到健康状况。
若alpha>alpha_A_min,similarity≥θsim,健康系数factor>0,则该输入样本的健康状态为健康肠型;
其中,alpha_A_min为A组样本的菌种丰度多样性的最小值;θsim为设定的相似度阈值。
下面结合具体的实施例进行说明:
1、样本说明和预处理,对于样本的处理过程详见图1。
已知两组样本,年龄分布在20-120岁间,样本特征为通过16s测序后得到的肠道环境中的菌群相对丰度值。这样每个样本相当于一个矩阵中一行向量,组成为:编号+年龄+采样地址+疾病类型+抗生素类型+OTU1+OTU2+...+OTULen,OTU是样本中某一菌群的相对丰度值,每个样本有80个OTU特征值。
A组样本特征:A组样本中每种菌种的平均相对丰度小于15%,其中95岁以上老人数量比例不小于11%,85岁以上老人数量比例不小于21%,也就是说该组中有大量长寿型高龄老人富集;并过滤掉有疾病史和抗生素服用史的样本。
B组样本特征:B组样本存在平均相对丰度大于20%的菌种;
对这两组样本,若某个菌群OTUi在85%的样本中的相对丰度小于1.0*10-5,则把此项OTUi特征过滤掉,这样就会过滤掉大量相对丰度接近于0的特征。
所得的样本如下表,这里假定A和B各100个样本:
2、筛选优势菌
(1)统计A和B组中不同菌种的平均相对丰度:
设样本A和B中微生物菌种的相对丰度已知,设i为A组或B组中的样本序号j为某种菌在样本中的序号。统计:
菌种j在A组样本中的频率为PA,j=cA,j/NA;
菌种j在B组样本中的频率为PB,j=cB,j/NB;
其中,j为菌种的序号,cA,j为A组样本中含有菌种j的样本数,NA为A组样本的总数;cB,j为B组样本中含有菌种j的样本数,NB为B组样本的总数;
其中,i为A组样本中的样本序号,ri,j为菌种j在样本i中的相对丰度;
其中,k为B组样本中的样本序号,rk,j为菌种j在样本k中的相对丰度;
本实施例计算结果如下表:
index | otu1 | otu2 | otu3 | ... | Otu80 |
A组频率 | 0.47147 | 0.98708 | 0.64047 | ... | 0.25403 |
A组平均相对丰度 | 2.81 | 52.19 | 1.06 | ... | 0.17 |
B组频率 | 0.37308 | 0.98796 | 0.45514 | ... | 0.17505 |
B组平均相对丰度 | 1.64 | 154.33 | 0.49 | ... | 0.07 |
(2)菌种差异性评估参数:
定义A,B组频率差异评估参数dPAB,j,对应公式:dPAB,j=PA,j-PB,j,
定义A,B组相对丰度差异评估参数dRAB,j,对应公式:dRAB,j=ARA,j-ARB,j;
根据上表中的频率值和平均相对丰度、以及这两个公式即可计算出A,B组菌群的频率差异和相对丰度差异。
(3)优势菌种的筛选方法:
如果某菌种的频率差异和相对丰度同时满足以下阈值条件:
dPAB,j≥θp1>0(θP1为筛选合格条件菌种的阈值,如可设置为2,4,6,8,9等);
dRAB,j≥θR1>0(θR1为筛选合格条件菌种的阈值,如可设置为0.5,1.0,1.5,2.0等)
则把A组中的这些菌种称为“A类优势菌种”,记为GA;
同样地,如果某菌种的频率差异和相对丰度同时满足以下阈值条件:
dPBA,j≥θp2>0(θP2为筛选合格条件菌种的阈值,如可设置为1.2,1.5,1.8,2.0等)
dRBA,j≥θR2>0(θR2为筛选合格条件菌种的阈值,如可设置为0.5,1.0,1.5,2.0等)
也可以筛选出B组中的“B类优势菌种”,记为GB。
本实施例中计算出的A组和B组优势菌如下表,其中A组阈值为θp1=2,θR1=0.5,B组阈值为θp2=2,θR2=0.5;最终筛选出A组优势菌20种,B组优势菌8种。
3、健康肠型的表示方法,如图2所示进行计算。
(1)计算A组和B组样本的alpha多样性
统计A组所有样本的alpha值并记录最小值(alpha_A_min)和最大值(alpha_A_max),统计B组所有样本的alpha值并记录最小值(alpha_B_min)和最大值(alpha_B_max)。
实际应用中,可按照下式计算输入样本sample_in的alpha多样性参数,然后依次与A和B的alpha值比较,看是否属于A或B范围。
本实施例根据公式alpha=∑|rjln(rj)|(rj为菌种j在输入样本的相对丰度),计算所得的多样性结果如下表:
index | alpha多样性 |
sample1 | 1.53 |
sample2 | 3.2 |
sample3 | 0.63 |
sample4 | 2.12 |
sample5 | 2.36 |
sample6 | 1.80 |
... | ... |
本例中计算得到:alpha_A_min=0.76,alpha_A_max=5.76;alpha_B_min=0.16,alpha_B_max=2.34。sample_in的alpha多样性参数为4.20,可见属于A。如果是1.2,则该条件无法判断sample_in属于A还是B类。
(2)健康肠型相似度
记录A组聚类中心点对应样本,以及该中心到其它样本的距离,记录最远距离作为A组半径radius_A;本实施例计算的A组的欧氏距离如下表,A组半径为对应的最大欧氏距离2.30。
index | 欧氏距离 |
Sample6 | 0.65 |
Sample7 | 0.9 |
Sample8 | 1.52 |
Sample15 | 2.30 |
Sample16 | 0.72 |
Sample17 | 1.21 |
... | ... |
同样的,记录B组聚类中心点对应样本,以及该中心到其它样本的距离,记录最远距离作为B组半径radius_B;本实施例计算的B组的欧氏距离如下表,B组半径为对应的最大欧氏距离3.54。
index | 欧氏距离 |
sample1 | 2.69 |
sample2 | 0.68 |
sample3 | 1.75 |
sample4 | 3.54 |
sample5 | 0.77 |
Sample9 | 1.80 |
... | ... |
依次计算输入样本sample_in和A组各样本的欧氏距离,最后选择欧氏距离最小值,计为min_A_distance=0.70;
依次计算样本sample_in和B组各样本的欧氏距离,最后选择欧氏距离最小值,计为min_B_distance=1.70;
由于0.70<1.70,则计算输入样本sample_in和A组聚类中心点的欧氏距离,用此距离判断该样本和A组距离的相似度,该相似度公式如下:
similarity=(radius_A-distance)/radius_A,当distance=0.56,本例中similarity=0.756;
输出相似度similarity。
(3)优势菌群的比较
计算输入样本中优势菌集合GA的集体丰度TA,以及输入样本中优势菌集合GB的集体丰度TB,采用如下公式计算得到输入样本的健康系数factor;
factor=log10(TA/TB)。
计算输入样本sample_in的优势菌集合GA的集体丰度TA=0.415,优势菌集合GB的集体丰度TB=0.201,则factor=0.304。
4、判决
由以上过程,对于输入样本,本方法可以计算出3个参数:alpha多样性参数,肠型相似度similarity,健康系数factor。根据着三项参数,可以判断输入样本的健康状态。
判决方法:
(1)多样性满足:alpha>alpha_A_min或alpha_B_min,本例中sample_in的alpha多样性参数为4.20,满足A类的多样性参数范围条件。
(2)相似度满足:similarity≥θsim,其中θsim为设定的相似度阈值,例如可以取θsim=0.6。本例中0.756>0.6,满足相似性条件。
(3)健康系数满足:阳性,即factor>0。本例中0.304>0,满足健康系数样性条件。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
Claims (9)
1.一种人体肠道健康状态的特征表达方法,其特征在于,其包括:
步骤S1,准备A组样本和B组样本,其中A组样本中每种菌种的平均相对丰度小于θAr,B组样本存在平均相对丰度大于θBr的菌种;
步骤S2,计算各个菌种在A组样本和B组样本的频率和相对丰度,得到A组样本的优势菌集合GA和B组样本的优势菌集合GB;
步骤S3,根据输入样本的各个菌种的相对丰度,得到输入样本的alpha多样性参数;
步骤S4,根据A组中各个样本不同菌种的相对丰度,得到A组样本的聚类中心点和聚类半径radius_A;并根据输入样本的不同菌种的相对丰度,计算输入样本和A组各样本的欧氏距离,得到输入样本与A组样本的欧氏距离最小值min_A_distance;计算输入样本和B组各样本的欧氏距离,得到输入样本与B组样本的欧氏距离最小值min_B_distance;
若min_A_distance<min_B_distance,则采用如下公式计算得到相似度similarity;
similarity=(radius_A-distance)/radius_A;
其中,distance为输入样本与A组样本的聚类中心点的欧式距离;
若min_A_distance≥min_B_distance,则similarity=0;
步骤S5,计算输入样本中优势菌集合GA的集体丰度TA,以及输入样本中优势菌集合GB的集体丰度TB,采用如下公式计算得到输入样本的健康系数factor;
factor=log10(TA/TB)。
2.根据权利要求1所述的人体肠道健康状态的特征表达方法,其特征在于:步骤S1中,对样本进行预处理,删掉不合格样本。
3.根据权利要求2所述的人体肠道健康状态的特征表达方法,其特征在于:对于A组样本,过滤掉有疾病史和抗生素服用史的样本。
4.根据权利要求3所述的人体肠道健康状态的特征表达方法,其特征在于:步骤S2中,
菌种j在A组样本中的频率为PA,j=cA,j/NA;
菌种j在B组样本中的频率为PB,j=cB,j/NB;
其中,j为菌种的序号,cA,j为A组样本中含有菌种j的样本数,NA为A组样本的总数;cB,j为B组样本中含有菌种j的样本数,NB为B组样本的总数;
其中,i为A组样本中的样本序号,ri,j为菌种j在样本i中的相对丰度;
其中,k为B组样本中的样本序号,rk,j为菌种j在样本k中的相对丰度;
计算A组样本、B组样本菌群中不同菌种的频率差异参数dPAB,j=PA,j-PB,j,
计算A组样本、B组样本菌群中不同菌种的相对丰度差异参数dRAB,j=ARA,j-ARB,j;
若菌种j满足dPAB,j≥θp1>0,dRAB,j≥θR1>0,则筛选为A组的优势菌种,这些菌种记为优势菌集合GA;若菌种j满足dPBA,j≥θp2>0,dRBA,j≥θR2>0,则筛选为B组的优势菌种,这些菌种记为优势菌集合GB;其中,θp1为A组优势菌种的频率阈值,θR1为A组优势菌种的丰度阈值,θp2为B组优势菌种的频率阈值,θR2为B组优势菌种的丰度阈值。
5.根据权利要求4所述的人体肠道健康状态的特征表达方法,其特征在于:步骤S3中,根据输入样本的alpha多样性参数与A组样本、B组样本的alpha多样性参数进行比较,确定输入样本属于A组样本或B组样本的范围。
6.根据权利要求1所述的人体肠道健康状态的特征表达方法,其特征在于:θBr≥20%,θAr≥15%。
7.根据权利要求1所述的人体肠道健康状态的特征表达方法,其特征在于:A组样本中,95岁以上老人数量比例不小于11%,85岁以上老人数量比例不小于21%。
8.一种人体肠道健康状态的评估方法,其特征在于,其包括:
根据如权利要求1~7任意一项所述的人体肠道健康状态的特征表达方法得到输入样本的alpha多样性参数、输入样本的相似度similarity和输入样本的健康系数factor,进行肠道健康状况评估,得到健康状况。
9.根据权利要求8所述的人体肠道健康状态的评估方法,其特征在于:
若alpha>alpha_A_min,similarity≥θsim,健康系数factor>0,则该输入样本的健康状态为健康肠型;
其中,alpha_A_min为A组样本的菌种丰度多样性的最小值;θsim为设定的相似度阈值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110255643.0A CN112992351B (zh) | 2021-03-09 | 2021-03-09 | 一种人体肠道健康状态的特征表达方法及其评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110255643.0A CN112992351B (zh) | 2021-03-09 | 2021-03-09 | 一种人体肠道健康状态的特征表达方法及其评估方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112992351A true CN112992351A (zh) | 2021-06-18 |
CN112992351B CN112992351B (zh) | 2024-03-08 |
Family
ID=76336190
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110255643.0A Active CN112992351B (zh) | 2021-03-09 | 2021-03-09 | 一种人体肠道健康状态的特征表达方法及其评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112992351B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113486954A (zh) * | 2021-07-06 | 2021-10-08 | 广西爱生生命科技有限公司 | 一种肠道微生态差异菌分类处理方法及肠道健康评估方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108133744A (zh) * | 2017-12-25 | 2018-06-08 | 北京数果科技有限公司 | 基于肠道菌群检测的人体健康检测方法及其系统 |
CN110144415A (zh) * | 2019-04-23 | 2019-08-20 | 大连大学 | 一种基于肠道菌群预测引进奶牛健康和免疫力水平方法 |
US20200164000A1 (en) * | 2018-10-29 | 2020-05-28 | Crestovo Holdings Llc | Compositions and methods for treating disorders related to a gut dysbiosis |
CN111370069A (zh) * | 2020-02-26 | 2020-07-03 | 康美华大基因技术有限公司 | 一种人体肠道菌群检测方法、装置及存储介质 |
FR3099770A1 (fr) * | 2019-08-05 | 2021-02-12 | Luxia Scientific | Methode d’analyse de la perte de diversite bacterienne du microbiome intestinal humain |
-
2021
- 2021-03-09 CN CN202110255643.0A patent/CN112992351B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108133744A (zh) * | 2017-12-25 | 2018-06-08 | 北京数果科技有限公司 | 基于肠道菌群检测的人体健康检测方法及其系统 |
US20200164000A1 (en) * | 2018-10-29 | 2020-05-28 | Crestovo Holdings Llc | Compositions and methods for treating disorders related to a gut dysbiosis |
CN110144415A (zh) * | 2019-04-23 | 2019-08-20 | 大连大学 | 一种基于肠道菌群预测引进奶牛健康和免疫力水平方法 |
FR3099770A1 (fr) * | 2019-08-05 | 2021-02-12 | Luxia Scientific | Methode d’analyse de la perte de diversite bacterienne du microbiome intestinal humain |
CN111370069A (zh) * | 2020-02-26 | 2020-07-03 | 康美华大基因技术有限公司 | 一种人体肠道菌群检测方法、装置及存储介质 |
Non-Patent Citations (1)
Title |
---|
徐海燕;马慧敏;王彦杰;赵飞燕;刘亚华;海棠;张和平;孙志宏;: "肥胖人群肠道细菌多样性研究", 中国食品学报, no. 01, 31 January 2018 (2018-01-31), pages 6 - 16 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113486954A (zh) * | 2021-07-06 | 2021-10-08 | 广西爱生生命科技有限公司 | 一种肠道微生态差异菌分类处理方法及肠道健康评估方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112992351B (zh) | 2024-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Thøgersen et al. | Archetypal analysis of diverse Pseudomonas aeruginosa transcriptomes reveals adaptation in cystic fibrosis airways | |
CN107075446B (zh) | 用于肥胖症相关疾病的生物标记物 | |
CN111206079B (zh) | 基于微生物组测序数据和机器学习算法的死亡时间推断方法 | |
CN112992351A (zh) | 一种人体肠道健康状态的特征表达方法及其评估方法 | |
CN113174444A (zh) | 孕早期肠道细菌的妊娠期糖尿病生物标志物及筛选与应用 | |
CN114724620A (zh) | 一种肺炎克雷伯菌亚胺培南药物敏感性机器学习预测模型 | |
CN114121275A (zh) | 一种基于大数据遗传代谢病筛查效率提升的智能分析方法 | |
CN114707608A (zh) | 医疗质控数据处理方法、装置、设备、介质及程序产品 | |
CN114023386A (zh) | 宏基因组数据分析及特征菌筛选方法 | |
CN114550831A (zh) | 一种基于深度学习特征提取的胃癌蛋白质组学分型框架识别方法 | |
CN114369673B (zh) | 结直肠腺瘤生物标志物、试剂盒及生物标志物的筛选方法 | |
CN114891904A (zh) | 用于儿童asd诊断的母源肠道菌群标志物及其应用 | |
WO2016049927A1 (en) | Biomarkers for obesity related diseases | |
CN113486954B (zh) | 一种肠道微生态差异菌分类处理方法及肠道健康评估方法 | |
CN113080999A (zh) | 一种基于脑电信号的儿童谵妄预测方法及系统 | |
Lee et al. | Svm classification model of similar bacteria species using negative marker: Based on matrix-assisted laser desorption/ionization time-of-flight mass spectrometry | |
Jabeer et al. | Identifying taxonomic biomarkers of colorectal cancer in human intestinal microbiota using multiple feature selection methods | |
CN117402984A (zh) | 儿童克罗恩病生物标志物、试剂盒及方法 | |
CN115881229B (zh) | 基于肠道微生物信息的过敏预测模型构建方法 | |
CN115472227A (zh) | 基于多维肠道菌群特征的标记方法及其应用 | |
KR102577230B1 (ko) | 머신러닝 모델을 이용하여 장 질환 유무를 판별하는 방법 및 진단 장치 | |
CN114214438B (zh) | 胆道菌群检测试剂在制备预测胆道结石术后早期复发的试剂中的应用 | |
CN211578386U (zh) | 一种宏基因组分析装置 | |
CN117976051A (zh) | 一种宏基因组测序数据分析方法、计算机介质、系统 | |
CN116064913A (zh) | 一种基于宏基因组胆囊真菌的基因库及微生物标志物和应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |