CN109584952A - 一种人体微生物菌群生态网络结构和功能变异的识别方法 - Google Patents
一种人体微生物菌群生态网络结构和功能变异的识别方法 Download PDFInfo
- Publication number
- CN109584952A CN109584952A CN201811435419.4A CN201811435419A CN109584952A CN 109584952 A CN109584952 A CN 109584952A CN 201811435419 A CN201811435419 A CN 201811435419A CN 109584952 A CN109584952 A CN 109584952A
- Authority
- CN
- China
- Prior art keywords
- data
- microorganism
- variation
- human
- projection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明属于生物医学信息分析领域,公开了一种人体微生物菌群生态网络结构和功能变异的识别方法,利用人体不同状态的各个分类阶层的丰度值,量化各微生物物种间的相互关系,通过分析在不同的人体状态下,微生物群落在T2空间投影的差异情况,识别微生物菌群的变异。本发明对均值变异与协方差变异共同识别,克服了均值假设检验等典型变异微生物识别方法存在的无法识别离散程度变异情况的缺陷;提出了微生物菌群子空间的概念,实现了对微生物菌群复杂关系的识别,克服了仅对单一微生物菌群变异情况识别的传统方法的缺陷;提供了微生物变异情况的量化的评价方法,为分析微生群落的变异与人类疾病发生发展的关提供了量化支持。
Description
技术领域
本发明属于生物医学信息分析领域,尤其涉及一种人体微生物菌群生态网络结构和功能变异的识别方法。
背景技术
目前,业内常用的现有技术是这样的:
微生物群落是指在一定区域里,或一定生境里,各种微生物种群相互松散结合,或有组织紧凑结合的一种结构单位。微生物以群落的形式存在人体的各个器官中,微生物群落的生态特征可分为结构特征和功能特征,其中结构特征描述微生物群落成员的种类、丰度及其在不同环境条件下的更替。对微生物群落结构特征可以从微生物的各个分类单位如门纲科目属种甚至菌株水平数目来分析,人体不同部位具有不同的生存条件,包括温度、湿度、营养源、酸碱度、富氧程度、生长的基质等,因此,不同身体部位的微生物种类也不相同。与此同时,每个人所携带的微生物种类及其相对数量也是具有个体差异的,“微生物谱”受性别、饮食、气候、年龄、职业、卫生习惯差异的影响。而功能特征则描述群落的行为:底物代谢过程;与宿主或环境以及群落内其他成员相互拮抗和共生的关系。微生物群落的种群结构及种间相互作用是影响其生态功能的决定因素。研究表明,微生物群落之间的相互关系与人类大部分疾病的发生发展有密切的关系。
由于传统的微生物培养方法只能分离约1%环境中的微生物,,大量未培养的微生物如同地球上的"暗物质",在相应生境中存在种类到底有多少,如何发挥功能,传统微生物学方法已经不能全面解答。基于高通量测序技术的16SrRNA测序分析技术和宏基因组测序技术能分别对特定环境中全部微生物的16srRNA基因或总DNA(也称宏基因组,metagenomic)进行克隆,并通过构建宏基因组文库,测序和生物生息学分析等手段获得各个分类阶层的群落特征,物种功能,属和种间的相互关系。由于不同的人体状态(包括性别、饮食、气候、年龄、职业、卫生习惯、健康状态等)下,例如健康与疾病,偏瘦与肥胖,摄入食物偏碳水化合物与偏肉类蛋白质,男性与女性等,人体所携带的微生物种类及其相对数量也是具有个体差异的,有效且量化的识别并表达该差异,可以为研究微生群落的变异与人类疾病发生发展的关系,奠定基础。
综上所述,现有技术存在的问题是:
现有技术,例如均值假设检验等典型变异微生物识别方法存在的无法识别离散程度变异情况的缺陷;
现有技术仅对单一微生物菌群变异情况识别,无法对微生物菌群之间存在的复杂关系的变化进行描述;
对变异微生物的识别停留在定性或半定量阶段,没有提供微生物变异情况的量化的评价方法。
解决上述技术问题的难度和意义:
微生物变异量化+多维识别的生物学意义,当前微生物生态的网络与疾病的发生发展密切关联,然而常规的差异物种的鉴定方法常常漏掉一些丰度上差异不显著,但在健康状态和疾病状态上功能差异非常明显的物种,该方法在于协助鉴别在疾病发生发展的进程中起关键作用的重要微生物,为下一步通过实验探寻重要的标记物缩小了范围,并奠定了理论基础。
在对微生物差异识别时,单一微生物下(一维情况),如何综合考虑微生物丰度以及丰度离散程度,将两者同时纳入到变异评价方法中,是本发明的一个技术难点。
在对微生物差异识别时,多种微生物(多维情况),如何综合考虑微生物丰度信息、丰度离散程度信息,以及微生物之间的共生、拮抗关系信息,将三者同时纳入到变异评价方法中,是本发明的一个技术难点。
在进行微生物(菌群)变异程度评价时,如何建立起量化的度量方法,使得评价结果横向上(不同的微生物菌群间)、纵向上(不同的样本间)可比较,是本发明的一个技术难点。
发明内容
针对现有技术存在的问题,本发明提供了一种人体微生物菌群生态网络结构和功能变异的识别方法。具体是通过分析在不同的人体状态下,微生物群落在T2空间投影的差异情况,识别微生物群落的变异,为研究微生菌群的变异与人类疾病发生发展的关系,以及疾病防治和诊断提供支撑。
本发明是这样实现的,一种人体微生物菌群生态网络结构和功能变异的识别方法通过计算微生物群落在T2空间投影的差异情况,得到微生物组在不同人体状态下的变异大小,为分析微生群落的变异与人类疾病发生发展的关提供支持。
具体包括:
步骤一:获取用于开展微生物群落结构和功能变异量化评价与的人体微生物组数据。
步骤二:计算人体微生物组T2空间投影基线。
步骤三:计算微生物组在T2空间投影数据。
步骤四:去除微生物组在T2空间投影数据异常点。
步骤五:计算人体微生物组在T2空间投影的变异情况。
进一步,步骤一所述获取人体微生物组丰度或相对丰度数据,其具体实现过程如下:(1)获取人体状态数据;(2)建立微生物种群子空间;(3)获取人体微生物组丰度或相对丰度数据。
进一步,步骤二所述计算人体微生物组T2空间投影基线,其具体实现过程如下:(1)计算各微生物丰度或相对丰度均值,以及微生物间协方差;(2)微生物组T2空间投影基线。
进一步,步骤三所述计算计算微生物组在T2空间投影数据,其具体实现过程如下:(1)计算某状态下(记为Sa状态)微生物组数据在其他状态下(记为Sb状态)基线下投影数据;(2)计算Sb状态微生物组数据在Sa状态基线下投影数据;(3)计算Sa状态微生物组数据在Sa状态基线下投影数据;(4)计算Sb状态微生物组数据在Sb状态基线下投影数据。
进一步,步骤四所述去除微生物组在T2空间投影数据异常点,其具体实现过程如下:(1)去除Sa状态下微生物组数据在Sb状态基线下投影数据的异常点;(2)去除Sb状态微生物组数据在Sa状态基线下投影数据异常点;(3)去除Sa状态微生物组数据在Sa状态基线下投影数据异常点;(4)去除Sb状态微生物组数据在Sb状态基线下投影数据异常点。
进一步,步骤五所述计算人体微生物组在T2空间投影的变异情况,其具体实现过程如下:(1)开展投影数据服从分布的核函数估计;(2)计算子空间内人体微生物组变异程度,获取其量化评价值;(3)对有效子空间进行遍历,获得各个子空间变异程度,识别为变异空间。
本发明的另一目的在于提供一种实现所述人体微生物菌群生态网络结构和功能变异的识别方法的计算机程序。
本发明的另一目的在于提供一种实现所述人体微生物菌群生态网络结构和功能变异的识别方法的信息数据处理终端。
本发明的另一目的在于提供一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行所述的人体微生物菌群生态网络结构和功能变异的识别方法。
本发明的另一目的在于提供一种实现所述人体微生物菌群生态网络结构和功能变异的识别方法的人体微生物菌群生态网络结构和功能变异的识别设备。
综上所述,本发明的优点及积极效果为:
本发明利用人体不同状态的各个分类阶层的丰度值,量化各微生物物种间的相互关系,通过分析在不同的人体状态下,微生物群落在T2空间投影的差异情况,识别微生物菌群的变异,为研究微生群落的变异与人类疾病发生发展的关系,提供支持。
如图6仿真数据所示,四个个数据集的平均和标准划分是无法区分的,尽管它们明显不同。然而,当比较X轴或Y轴PM评分和X-Y关系的PM评分时,在大多数成对比较中,可以观察到显著差异。
本发明的优点还有:
对均值变异与协方差变异共同识别,克服了均值假设检验等典型变异微生物识别方法存在的无法识别离散程度变异情况的缺陷;
提出了微生物菌群子空间的概念,实现了对微生物菌群复杂关系的识别,克服了仅对单一微生物菌群变异情况识别的传统方法的缺陷;
提供了微生物变异情况的量化的评价方法,量化指标具备对称性。
提供了微生物变异情况的量化的评价方法,量化指标线性可比,值域[0,1]之间,值越大,变异情况越大。
提供了微生物变异情况的量化的评价方法,该方法适用于单一微生物差异的比较及高维微生物菌落差异的比较,数学形式统一。
基于微生物变异情况的量化的评价方法,提出了变异空间识别方法,为研究微生群落的变异与人类疾病发生发展的关提供了量化支持。
附图说明
图1是本发明实施例提供的人体微生物菌群生态网络结构和功能变异的识别方法流程图。
图2是本发明实施例提供的为函数图像。
图3是本发明实施例提供的函数图像。
图4是本发明实施例提供的函数图像。
图5是本发明实施例提供的函数图像。
图6是本发明实施例提供的仿真实验中基于均值的统计量与PM的比较图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
下面结合具体分析对本发明的应用作进一步描述。
图1本发明实施例提供的人体微生物菌群生态网络结构和功能变异的识别方法,包括:
步骤一:获取用于开展微生物群落结构和功能变异量化评价与的人体微生物组数据。
1)记人体状态S={S1,S2,…Sn};Sj下人体微生物样本量为Nj;微生物组中包含的微生物种类为OTU={OTU1,OTU2,…OTUp};
2)建立OTU的子空间为则OTU有效子空间L的数量为个;
3)获取人体微生物组丰度或相对丰度数据。处于某状态Sj下人体微生物第i个样本丰度或相对丰度数据记为其中i={N1,N2,…Nn},有某状态Sj下空间内人体微生物第i个样本丰度或相对丰度数据记为不引起歧义的情况下,简记为
例:本实施例以Zeller,G.et al.Potential of fecal microbiota for early-stage detection of colorectal cancer.Mol.Syst.Biol.10,766–766(2014)提供的数据展开,部分数据见附录1.
该数据集人体状态分别为CRC(结肠癌)、H(健康),记为S={S1,S2},S1为CRC组,S2为H组。S1样本量为N1=41,S2样本量为N2=74。微生物组中包含的微生物种类为Acetanaerobacterium、Acidaminococcus、Akkermansia、Alistipes、Anaerosporobacter、Ruminococcus等。本实施例数据集中微生物种类有6种,微生物的子空间共有个,本实施例以 为例展开,其他子空间的遍历类似。
步骤二:计算人体微生物组T2空间投影基线。
2.1对Sj下内微生物组丰度数据或相对丰度数据计算各微生物均值:
计算各微生物间协方差:
有
2.2建立Sj下内微生物组T2空间投影基线为 其向量形式记为
例:针对计算S1即CRC投影基线:
有:
计算S2即H组投影基线:
有:
步骤三:计算微生物组在T2空间投影数据。
3.1计算内微生物组在状态Sa下的丰度数据或相对丰度数据在Sb的T2空间投影基线上的投影数据其中:
3.2计算内微生物组在状态Sb下的丰度数据或相对丰度数据在Sa的T2空间投影基线上的投影数据其中:
3.3计算内微生物组在状态Sa下的丰度数据或相对丰度数据在其T2空间投影基线上的投影数据其中:
3.4计算内微生物组在状态Sb下的丰度数据或相对丰度数据在其T2空间投影基线上的投影数据其中:
例:计算得到微生物组在T2空间投影数据为:
见下表:
见下表:
i | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
投影 | 1.355454 | 2.080886 | 0.702625 | 0.820838 | 0.863181 | 0.509024 | 0.772626 |
i | 8 | 9 | 10 | 11 | 12 | 13 | 14 |
投影 | 0.215543 | 0.609996 | 0.4548 | 0.881353 | 3.337069 | 10.59203 | 0.824896 |
i | 15 | 16 | 17 | 18 | 19 | 20 | 21 |
投影 | 1.024471 | 1.331899 | 1.60142 | 0.318439 | 1.087214 | 0.359334 | 1.195799 |
i | 22 | 23 | 24 | 25 | 26 | 27 | 28 |
投影 | 1.152533 | 0.663164 | 1.170266 | 24.07675 | 0.460404 | 8.393381 | 29.96924 |
i | 29 | 30 | 31 | 32 | 33 | 34 | 35 |
投影 | 66.60623 | 1.276489 | 46.47576 | 1.600459 | 2.450686 | 1.097358 | 32.26747 |
i | 36 | 37 | 38 | 39 | 40 | 41 | 42 |
投影 | 0.581475 | 1.596618 | 6.01197 | 5.147501 | 3.114974 | 0.990445 | 1.640455 |
i | 43 | 44 | 45 | 46 | 47 | 48 | 49 |
投影 | 0.690771 | 2.777366 | 2.084678 | 9.967667 | 1.007435 | 3.303488 | 3.578533 |
i | 50 | 51 | 52 | 53 | 54 | 55 | 56 |
投影 | 0.435074 | 0.81748 | 0.743957 | 1.395573 | 0.676076 | 0.289242 | 0.50381 |
i | 57 | 58 | 59 | 60 | 61 | 62 | 63 |
投影 | 6.206737 | 0.501045 | 11.33899 | 0.561231 | 8.564652 | 10.91862 | 1.570757 |
i | 64 | 65 | 66 | 67 | 68 | 69 | 70 |
投影 | 0.145896 | 9.976554 | 7.178227 | 0.602173 | 0.41788 | 1.01136 | 2.004774 |
i | 71 | 72 | 73 | 74 | - | - | - |
投影 | 0.875188 | 0.340972 | 0.497094 | 0.831668 | - | - | - |
见下表:
i | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
投影 | 0.401572 | 2.812179 | 0.429854 | 1.17377 | 0.228357 | 1.080002 | 4.822124 |
i | 8 | 9 | 10 | 11 | 12 | 13 | 14 |
投影 | 1.986988 | 0.464543 | 16.69188 | 0.031064 | 0.990206 | 1.009816 | 0.682768 |
i | 15 | 16 | 17 | 18 | 19 | 20 | 21 |
投影 | 0.486771 | 1.089224 | 1.270824 | 1.130766 | 0.399179 | 0.388738 | 0.832443 |
i | 22 | 23 | 24 | 25 | 26 | 27 | 28 |
投影 | 0.45937 | 2.123072 | 0.582207 | 1.302159 | 0.064594 | 0.022037 | 1.483427 |
i | 29 | 30 | 31 | 32 | 33 | 34 | 35 |
投影 | 1.955494 | 0.375586 | 1.602863 | 0.320097 | 0.304313 | 2.950598 | 0.445354 |
i | 36 | 37 | 38 | 39 | 40 | 41 | - |
投影 | 11.97871 | 1.584658 | 10.81835 | 1.40741 | 0.818883 | 0.997749 | - |
见下表:
i | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
投影 | 0.917516 | 0.210343 | 0.551396 | 1.301352 | 0.641499 | 0.079154 | 0.542459 |
i | 8 | 9 | 10 | 11 | 12 | 13 | 14 |
投影 | 0.094349 | 0.529602 | 0.049459 | 0.601865 | 0.518326 | 2.302484 | 0.051108 |
i | 15 | 16 | 17 | 18 | 19 | 20 | 21 |
投影 | 0.777871 | 0.881214 | 1.007492 | 0.12251 | 0.749503 | 0.227443 | 0.800243 |
i | 22 | 23 | 24 | 25 | 26 | 27 | 28 |
投影 | 0.777381 | 0.456676 | 0.095245 | 6.149827 | 0.468832 | 1.87491 | 10.2865 |
i | 29 | 30 | 31 | 32 | 33 | 34 | 35 |
投影 | 58.61863 | 0.858785 | 12.45682 | 1.006996 | 0.244552 | 0.75214 | 8.301048 |
i | 36 | 37 | 38 | 39 | 40 | 41 | 42 |
投影 | 0.406629 | 1.005014 | 1.288856 | 0.811421 | 0.452199 | 0.769618 | 0.111157 |
i | 43 | 44 | 45 | 46 | 47 | 48 | 49 |
投影 | 0.592219 | 0.373327 | 2.963269 | 2.016968 | 1.07841 | 0.477925 | 0.571012 |
i | 50 | 51 | 52 | 53 | 54 | 55 | 56 |
投影 | 0.103098 | 0.559849 | 0.602364 | 0.913931 | 0.0437 | 0.166445 | 0.27173 |
i | 57 | 58 | 59 | 60 | 61 | 62 | 63 |
投影 | 1.155747 | 0.204302 | 2.417962 | 0.354324 | 1.750581 | 2.288536 | 0.994435 |
i | 64 | 65 | 66 | 67 | 68 | 69 | 70 |
投影 | 0.237124 | 1.987209 | 1.34158 | 0.47239 | 0.196806 | 0.066251 | 0.155419 |
i | 71 | 72 | 73 | 74 | - | - | - |
投影 | 0.625748 | 0.342567 | 0.500714 | 0.023636 | - | - | - |
步骤四:去除微生物组在T2空间投影数据异常点。
4.1设定异常点筛选阈值σ,σ>0。
4.2计算的1/4,1/2,3/4分位点,分别记为及去除大于的数据,剩余的数据记为
4.3计算的1/4,1/2,3/4分位点,分别记为及去除大于的数据,剩余的数据记为
4.4计算的1/4,1/2,3/4分位点,分别记为及去除大于的数据,剩余的数据记为
4.5计算的1/4,1/2,3/4分位点,分别记为及去除大于的数据,剩余的数据记为
例:设定σ=1.5。
计算得到的1/4,1/2,3/4分位点,分别为 及计算 去除异常点后,得到见下表。
i | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
投影 | 0.1527 | 0.3715 | 0.5419 | 0.1370 | 0.8219 | 0.0505 | 0.8013 |
i | 8 | 9 | 10 | 11 | 12 | 13 | 14 |
投影 | 0.3145 | 0.3121 | 0.2984 | 1.2258 | 0.1166 | 0.5380 | 0.2158 |
i | 15 | 16 | 17 | 18 | 19 | 20 | 21 |
投影 | 0.9854 | 0.8419 | 0.1075 | 0.3433 | 0.1222 | 0.5699 | 0.2509 |
i | 22 | 23 | 24 | 25 | 26 | 27 | 28 |
投影 | 0.0001 | 0.3412 | 0.2093 | 0.9619 | 0.2043 | 1.0082 | 0.1397 |
i | 29 | 30 | 31 | 32 | 33 | - | - |
投影 | 0.5060 | 0.4573 | 0.9988 | 1.3163 | 1.3003 | - | - |
计算得到的1/4,1/2,3/4分位点,分别为 及
计算:
去除异常点后,得到见下表。
计算得到的1/4,1/2,3/4分位点,分别为 及
计算:
去除异常点后,得到见下表。
i | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
投影 | 0.401572 | 0.429854 | 1.17377 | 0.228357 | 1.080002 | 1.986988 | 0.464543 |
i | 8 | 9 | 10 | 11 | 12 | 13 | 14 |
投影 | 0.031064 | 0.990206 | 1.009816 | 0.682768 | 0.486771 | 1.089224 | 1.270824 |
i | 15 | 16 | 17 | 18 | 19 | 20 | 21 |
投影 | 1.130766 | 0.399179 | 0.388738 | 0.832443 | 0.4594 | 2.1231 | 0.5822 |
i | 22 | 23 | 24 | 25 | 26 | 27 | 28 |
投影 | 1.3022 | 0.0646 | 0.0220 | 1.483427 | 1.955494 | 0.375586 | 1.602863 |
i | 29 | 30 | 31 | 32 | 33 | 34 | 35 |
投影 | 0.320097 | 0.304313 | 0.445354 | 1.584658 | 1.40741 | 0.818883 | 0.997749 |
计算得到的1/4,1/2,3/4分位点,分别为 及
计算:
去除异常点后,得到见下表。
步骤五:计算人体微生物组在T2空间投影的变异情况。
5.1按照Scott,D.W.(1992)Multivariate Density Estimation.Theory,Practice and Visualization.New York:Wiley及Sheather,S.J.and Jones M.C.(1991)Areliable data-based bandwidth selection method for kernel densityestimation.J.Roy.Statist.Soc.B,683–690提供的方法,分别计算服从分布的核函数估计,分别记估计得出的概率密度分布函数分别为
5.2分别计算的最大值、最小值,记:
5.3计算:
其中
5.4计算:
其中
5.5计算内人体微生物组状态Sa与状态Sb下变异情况值域为[0,1],值越大,表明状态Sa与状态Sb下,内人体微生物组变异程度越高。
5.6对2p-1个有效子空间进行遍历,获得各个子空间变异程度设定阈值Ω,Ω>0,识别为变异空间。
例:对服从分布进行核函数估计,记估计得出的概率密度分布函数为图像见附图2.
对服从分布进行核函数估计,记估计得出的概率密度分布函数为 图像见附图3.
对服从分布进行核函数估计,记估计得出的概率密度分布函数为 图像见附图4.
对服从分布进行核函数估计,记估计得出的概率密度分布函数为 图像见附图5.
计算:
有
于是
于是:
有
于是
于是
计算内人体微生物组状态S1(结肠癌CRC)与状态Sb(健康H)下变异情况 即两者变异值为0.1831525.
计算有效子空间变异情况如下表。
设定Ω=0.6,即可以得到变异空间,如下表。
附录1:crc_zeller数据集
本发明实施例提供一种人体微生物菌群生态网络结构和功能变异的识别设备。
下面结合仿真实验对本发明的应用作进一步描述。
如图6仿真数据所示,四个个数据集的平均和标准划分是无法区分的,尽管它们明显不同。然而,当比较X轴或Y轴PM评分和X-Y关系的PM评分时,在大多数成对比较中,可以观察到显著差异。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用全部或部分地以计算机程序产品的形式实现,所述计算机程序产品包括一个或多个计算机指令。在计算机上加载或执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输)。所述计算机可读取存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘SolidState Disk(SSD))等。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种人体微生物菌群生态网络结构和功能变异的识别方法,其特征在于,所述人体微生物菌群生态网络结构和功能变异的识别方法包括:
步骤一:获取用于开展微生物群落结构和功能变异量化评价与的人体微生物组数据。
步骤二:计算人体微生物组T2空间投影基线。
步骤三:计算微生物组在T2空间投影数据。
步骤四:去除微生物组在T2空间投影数据异常点。
步骤五:计算人体微生物组在T2空间投影的变异情况。
2.如权利要求1所述的人体微生物菌群生态网络结构和功能变异的识别方法,其特征在于,步骤一具体包括:
记人体状态S={S1,S2,...Sn};Sj下人体微生物样本量为j;微生物组中包含的微生物种类为OTU={OTU1,OTU2,...OTUp};
建立OTU的子空间为则OTU有效子空间的数量为个;
获取人体微生物组丰度或相对丰度数据:处于某状态Sj下人体微生物第i个样本丰度或相对丰度数据记为其中i={N1,N2,…Nn},有某状态Sj下空间内人体微生物第i个样本丰度或相对丰度数据记为 不引起歧义的情况下,为
3.如权利要求1所述的人体微生物菌群生态网络结构和功能变异的识别方法,其特征在于,步骤二具体包括:
对Sj下内微生物组丰度数据或相对丰度数据计算各微生物均值:
计算各微生物间协方差:
有
建立Sj下内微生物组T2空间投影基线为
向量形式记为
4.如权利要求1所述的人体微生物菌群生态网络结构和功能变异的识别方法,其特征在于,步骤三具体包括:
1)计算内微生物组在状态Sa下的丰度数据或相对丰度数据在Sb的T2空间投影基线上的投影数据
其中:
2)计算内微生物组在状态Sb下的丰度数据或相对丰度数据在Sa的T2空间投影基线上的投影数据
其中:
3)计算内微生物组在状态Sa下的丰度数据或相对丰度数据在其T2空间投影基线上的投影数据
其中:
4)计算内微生物组在状态Sb下的丰度数据或相对丰度数据在其T2空间投影基线上的投影数据
其中:
5.如权利要求1所述的人体微生物菌群生态网络结构和功能变异的识别方法,其特征在于,步骤四中,包括:去除Sa状态下微生物组数据在Sb状态基线下投影数据的异常点;去除Sb状态微生物组数据在Sa状态基线下投影数据异常点;去除Sa状态微生物组数据在Sa状态基线下投影数据异常点;去除Sb状态微生物组数据在Sb状态基线下投影数据异常点;
具体包括:
a)设定异常点筛选阈值σ,σ>0;
b)计算的1/4,1/2,3/4分位点,分别记为及去除大于的数据;
剩余的数据记为
c)计算的1/4,1/2,3/4分位点,分别记为及去除大于的数据;
剩余的数据记为
d)计算的1/4,1/2,3/4分位点,分别记为及去除大于的数据,剩余的数据记为
e)计算的1/4,1/2,3/4分位点,分别记为及去除大于的数据,剩余的数据记为
6.如权利要求1所述的人体微生物菌群生态网络结构和功能变异的识别方法,其特征在于,步骤五包括:
开展投影数据服从分布的核函数估计;
计算子空间内人体微生物组变异程度,获取其量化评价值;
对有效子空间进行遍历,获得各个子空间变异程度,识别为变异空间。
7.一种实现权利要求1~6任意一项所述人体微生物菌群生态网络结构和功能变异的识别方法的计算机程序。
8.一种实现权利要求1~6任意一项所述人体微生物菌群生态网络结构和功能变异的识别方法的信息数据处理终端。
9.一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行如权利要求1-6任意一项所述的人体微生物菌群生态网络结构和功能变异的识别方法。
10.一种实现权利要求1~6任意一项所述人体微生物菌群生态网络结构和功能变异的识别方法的人体微生物菌群生态网络结构和功能变异的识别设备。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811435419.4A CN109584952B (zh) | 2018-11-28 | 2018-11-28 | 一种人体微生物菌群生态网络结构和功能变异的识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811435419.4A CN109584952B (zh) | 2018-11-28 | 2018-11-28 | 一种人体微生物菌群生态网络结构和功能变异的识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109584952A true CN109584952A (zh) | 2019-04-05 |
CN109584952B CN109584952B (zh) | 2023-04-18 |
Family
ID=65925229
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811435419.4A Active CN109584952B (zh) | 2018-11-28 | 2018-11-28 | 一种人体微生物菌群生态网络结构和功能变异的识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109584952B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113012810A (zh) * | 2019-12-18 | 2021-06-22 | 中国科学院昆明动物研究所 | 基于微生物功能团挖掘方法所获得的fba口腔菌群功能团 |
CN114999574A (zh) * | 2022-08-01 | 2022-09-02 | 中山大学 | 一种肠道菌群大数据的并行识别分析方法及系统 |
CN115098836A (zh) * | 2022-07-25 | 2022-09-23 | 天津医科大学总医院 | 一种评估多个环境因素对阴道微生态影响的方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140179726A1 (en) * | 2011-05-19 | 2014-06-26 | Virginia Commonwealth University | Gut microflora as biomarkers for the prognosis of cirrhosis and brain dysfunction |
US20140335534A1 (en) * | 2013-05-09 | 2014-11-13 | The Procter & Gamble Company | Method And System For Identifying A Biomarker Indicative Of Health Condition |
CN105209918A (zh) * | 2013-05-09 | 2015-12-30 | 宝洁公司 | 生物标记鉴定方法和系统 |
CN107430644A (zh) * | 2015-03-27 | 2017-12-01 | 遗传分析股份有限公司 | 用于测定胃肠道菌群失调的方法 |
-
2018
- 2018-11-28 CN CN201811435419.4A patent/CN109584952B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140179726A1 (en) * | 2011-05-19 | 2014-06-26 | Virginia Commonwealth University | Gut microflora as biomarkers for the prognosis of cirrhosis and brain dysfunction |
US20140335534A1 (en) * | 2013-05-09 | 2014-11-13 | The Procter & Gamble Company | Method And System For Identifying A Biomarker Indicative Of Health Condition |
CN105209918A (zh) * | 2013-05-09 | 2015-12-30 | 宝洁公司 | 生物标记鉴定方法和系统 |
CN107430644A (zh) * | 2015-03-27 | 2017-12-01 | 遗传分析股份有限公司 | 用于测定胃肠道菌群失调的方法 |
Non-Patent Citations (5)
Title |
---|
CHARLES W. CHAMP: "Multivariate Statistical Process Control with Industrial Applications", 《JOURNAL OF QUALITY TECHNOLOGY》 * |
MOMIAO XIONG等: "Generalized T2 Test for Genome Association Studies", 《AJHG》 * |
吴昌晶等: "微生物组学中的高维计数和成分数据分析", 《中国科学:数学》 * |
徐微微: "高维数据降维可视化研究及其在生物医学中的应用", 《中国博士学位论文全文数据库(信息科技辑)》 * |
范华南等: "中度和重度牙周炎患者龈下细菌多样性和群落结构分析", 《JOURNAL OF ORAL SCIENCE RESEARCH》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113012810A (zh) * | 2019-12-18 | 2021-06-22 | 中国科学院昆明动物研究所 | 基于微生物功能团挖掘方法所获得的fba口腔菌群功能团 |
CN115098836A (zh) * | 2022-07-25 | 2022-09-23 | 天津医科大学总医院 | 一种评估多个环境因素对阴道微生态影响的方法及装置 |
CN115098836B (zh) * | 2022-07-25 | 2022-11-11 | 天津医科大学总医院 | 一种评估多个环境因素对阴道微生态影响的方法及装置 |
CN114999574A (zh) * | 2022-08-01 | 2022-09-02 | 中山大学 | 一种肠道菌群大数据的并行识别分析方法及系统 |
CN114999574B (zh) * | 2022-08-01 | 2022-12-27 | 中山大学 | 一种肠道菌群大数据的并行识别分析方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109584952B (zh) | 2023-04-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Xia et al. | Hypothesis testing and statistical analysis of microbiome | |
Xia et al. | A logistic normal multinomial regression model for microbiome compositional data analysis | |
Matsumoto et al. | SCOUP: a probabilistic model based on the Ornstein–Uhlenbeck process to analyze single-cell expression data during differentiation | |
Smirnova et al. | PERFect: PERmutation Filtering test for microbiome data | |
Hong et al. | Conditional screening for ultra-high dimensional covariates with survival outcomes | |
Di et al. | Ultra high content image analysis and phenotype profiling of 3D cultured micro-tissues | |
CN109584952A (zh) | 一种人体微生物菌群生态网络结构和功能变异的识别方法 | |
WO2020140848A1 (zh) | 肠道微生物测序数据处理方法、装置、存储介质及处理器 | |
Li et al. | High efficiency classification of children with autism spectrum disorder | |
Zhang et al. | The effect of tissue composition on gene co-expression | |
CN110021344B (zh) | 鉴别和分类宏基因组样本中的操作分类单元的方法和系统 | |
Xia et al. | Introductory overview of statistical analysis of microbiome data | |
Austin et al. | Contamination source modeling with SCRuB improves cancer phenotype prediction from microbiome data | |
WO2020147557A1 (zh) | 肠道微生物测序数据处理方法、装置、存储介质及处理器 | |
Song et al. | Bayesian hierarchical models for high‐dimensional mediation analysis with coordinated selection of correlated mediators | |
CN115272797A (zh) | 分类器的训练方法、使用方法、装置、设备及存储介质 | |
Woloszynek et al. | Exploring thematic structure in 16S rRNA marker gene surveys | |
Sanchez-Taltavull et al. | Bayesian correlation analysis for sequence count data | |
Hu et al. | Predicting molecular traits from tissue morphology through self-interactive multi-instance learning | |
ARIMURA et al. | A review on radiomics for personalized medicine in cancer treatment | |
Ma et al. | Assessing and interpreting the within-body biogeography of human microbiome diversity | |
Cao et al. | Pattern recognition in high-content cytomics screens for target discovery-case studies in endocytosis | |
Alquicira-Hernandez et al. | scPred: single cell prediction using singular value decomposition and machine learning classification | |
Ma | Joint microbial and metabolomic network estimation with the censored Gaussian graphical model | |
Monnier et al. | A novel batch-effect correction method for scRNA-seq data based on Adversarial Information Factorization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |