CN117279622A - 基因组数据和分析数据的分析 - Google Patents

基因组数据和分析数据的分析 Download PDF

Info

Publication number
CN117279622A
CN117279622A CN202280031908.1A CN202280031908A CN117279622A CN 117279622 A CN117279622 A CN 117279622A CN 202280031908 A CN202280031908 A CN 202280031908A CN 117279622 A CN117279622 A CN 117279622A
Authority
CN
China
Prior art keywords
additional
abundance
sample
reactant
individual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280031908.1A
Other languages
English (en)
Inventor
尼克尔·M·斯科特
詹姆斯·拉穆勒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cypress Microbiology Co ltd
Original Assignee
Cypress Microbiology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cypress Microbiology Co ltd filed Critical Cypress Microbiology Co ltd
Publication of CN117279622A publication Critical patent/CN117279622A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/60ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to nutrition control, e.g. diets
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/0012Galenical forms characterised by the site of application
    • A61K9/0014Skin, i.e. galenical aspects of topical compositions

Abstract

在一种或更多种实施方式中,基因组数据和分析数据可用于确定环境中可能存在的酶和生物体(例如细菌)的存在。本文中所述的技术可确定这样的候选益生元,其可被提供给环境以便基于所述酶和生物体的存在产生后生元。

Description

基因组数据和分析数据的分析
优先权
本申请要求于2021年4月29日提交的美国临时申请序列号63/181,821的优先权权益,所述申请通过引用整体并入本文。
背景技术
可在多种情况下分析基因组数据(genomics data)和分析数据(analyticaldata)以确定针对多种生物学病症的治疗。将从样品中获得的不同类型的基因组数据和分析数据结合在一起以得到实际有用的结果通常可能具有挑战性。
附图说明
在不一定按比例绘制的附图中,相同的数字可在不同的视图中描述类似的组件。为了容易识别对任何特定要素或行为的讨论,参考数字中最显著的一个或更多个数字是指该要素首次被引入的图号。一些实施方式是通过实例的方式举例说明的,而非限制。
图1示出了基于基因组数据和分析数据确定候选益生元(prebiotic)的过程的流程图。
图2是示出根据一种或更多种示例性实施方式的计算机系统形式的机器组件的框图,所述机器组件可从一个或更多个机器可读介质读取并执行指令,以进行本文中所述的任一种或更多种方法。
图3是示出根据一种或更多种示例性实施方式的可与本文中所述的一种或更多种硬件架构(hardware architecture)结合使用的代表性软件架构(softwarearchitecture)的框图。
图4示出了当添加不同浓度的针对B-丙氨酸的靶向益生元(aTP)时EC panD基因的基因表达倍数变化。使大肠杆菌(E Coli)培养物在LB中生长至OD 1.5,对照样品接受与处理培养物体积相等的另外的生长培养基,所述处理培养物接受所示量的掺有不同浓度的靶向益生元的生长培养基。所有培养物的取样都是在开始或时间=0(T0)以及掺入之后1小时(T1)和3小时(T3)时进行的。表达水平是通过RNA和rtPCR测量的。用于将天冬氨酸转化为B-丙氨酸的基因(panD)显示出相对于对照转录提高2倍,表明B-丙氨酸代谢途径激活。
图5示出了根据本文中的实施方式确定的用于健康皮肤的数种计算机(insilico)预测的靶向益生元。
图6示出了来自其中个体(N=2)在3个皮肤位置处且用TP和载体二者或者仅用载体(对照)一式两份地治疗的实验的结果。在任一部位上均未发现益生元。在对照部位上均未发现任何后生元(postbiotic)神经酰胺。数据是在6小时之后从这些皮肤部位采集拭子,提取然后在Orbitrap上运行的结果(代谢组学)。
图7示出了在此描述的示例生物化学平台,其由体外、离体和原位实验和工作组成,为靶向益生元化合物的安全性、效力、机制和给药提供了证据。下面给出了生物信息学平台的概述,并且在其他地方也进行了强调。
图8示出了来自生长实验的结果,在生长实验中将在LB肉汤(broth)中培养过夜的经验培养物重新稀释到新的具有不同浓度的每种化合物的LB肉汤中使得600nm处的起始光密度(optical density,OD)为0.05。培养物通常在37℃下在振荡下培养5小时,并取样进行OD600读数(图1)。还完成了更长时间的生长实验,以检测自1剂量的TP开始后生元产生的时间。
图9示出了生长曲线实验设计。根据处理将培养物培养5小时或更长时间,但每小时进行OD600读数以评价每种培养物的生长率。
图10示出了后生元驱避剂化合物(Postbiotic Repellent compound)是在添加iTP之后至少3小时产生的。在添加靶向益生元之后后生元产生的实例。在此示出了这样的一个演示:将预测的益生元输入化合物掺入到混合的经验皮肤培养物中,在掺入之后3小时取样以进行GCMS。发现驱避剂输出化合物的水平高于对冈比亚按蚊(Anopheles gambiae)3产生驱避作用所需的水平。
图11示出了化合物毒性/细菌细胞生存力测定。为了测试益生元的毒性,向培养物添加不同浓度。在数个时间点取样。使用来自稀释板的细菌菌落计数来确定活细胞(细胞/mL)。
图12示出了驱虫剂靶向的益生元(insect repellent Targeted Prebiotic,iTP)的安全性和给药生存力测试的实例。在此,将混合的群落微生物组培养物在不同浓度的预测iTP下培养过夜。在所示实验中,发现10mM的TP输入化合物2的剂量太高,并导致丧失生存力(就菌落形成单位(或(colony forming unit)CFU)而言)。
图13示出了在所添加浓度下的针对神经酰胺(ceramide,c)的靶向益生元(Targeted Prebiotics,TP)(在此为鞘氨醇和棕榈酸)下的平均微生物群落生长。从混合的微生物培养收集物(产生自经验皮肤微生物组样品)中,将3种微生物组以一式两份培养,并添加不同浓度的TP掺入物(spike-in)。给出了各时间点的所有实验值的平均值以及标准误差。
图14示出了神经酰胺标准曲线。针对已知浓度的C-24神经酰胺(x轴)的ELISA产生标准曲线。
图15示出了从KEGG产生M的实例。(A)示出了由酶a至f催化的一组示例性反应,(B)A)中反应的连通性,以及(C)将连通性矩阵归一化,使得所有输入化合物总和为1且输出总和为-1
图16示出了驱虫剂化合物在30分钟内产生,并在培养物中保持至少3天。向细菌培养物给予单剂量的输入化合物(图6),并在不同的时间点取样,以确定驱避剂化合物产生的速度以及驱避剂化合物在培养物中稳定的时间,GC-MS。由于空间限制,未示出神经酰胺和透明质酸的数据。
图17示出了神经酰胺靶向的益生元(ceramide Targeted Prebiotic,cTP)在存在宿主细胞的情况下与微生物组一起诱导提高的后生元神经酰胺。后生元的产生持续48小时。在适用的情况下,用3种微生物组群落进行宿主-微生物组测定。对于那些适用的样品,给予1次剂量为0.02%的cTP。
图18示出了在宿主-微生物组测定中,神经酰胺靶向的益生元(cTP)与微生物组一起诱导提高的后生元神经酰胺。载体影响由此产生的后生元产生。在适用的情况下,用3种微生物组群落进行宿主-微生物组测定。对于那些适用的样品,给予1次剂量为0.02%的cTP。制剂2.0包含cTP,(又名BioBloomTM)。“ambrosia”代表“现用的(off the shelf)”公知的防护和湿疹美容霜(barrier and eczema cosmetic cream)。
图19示出了聚集模型和使用该平台来检测益生元和后生元输出的变化的概述。
图20示出了trans-well测定:A.)可在组织培养系统中研究宿主-微生物组代谢物相互作用,其中将人上皮角质细胞接种在6孔板的下腔中,并随后将含有经验微生物组样品的0.4μm膜trans-well插入物放置在孔内。B.)微生物组和宿主细胞共享培养基和处理条件,并培养3小时直至样品收获。
图21示出了在宿主-微生物组(trans-well)系统中,神经酰胺靶向的益生元与在单独添加至人细胞时相比诱导更多的神经酰胺后生元,或者与单独的宿主-微生物组相比诱导更多的神经酰胺后生元。通过ELISA来测量来自trans-well测定的后生元神经酰胺产生。对于所示的每个条,在一式三份的实验中使用了3种不同的微生物组群落。
图22示出了在宿主-微生物组测定中,神经酰胺靶向的益生元(cTP)与微生物组一起诱导提高的后生元神经酰胺。载体影响由此产生的后生元产生。在适用的情况下,用3种微生物组群落进行宿主-微生物组测定。对于那些适用的样品,给予1次剂量为0.02%的cTP。制剂2.0包含cTP,(又名BioBloomTM)。“ambrosia”代表“现用的”公知的防护和湿疹美容霜。
图23示出了宿主-微生物组测定:A)上清液用于细胞因子和细胞毒性,和B)进行细胞ELISA和GCMS以检测神经酰胺的后生元产量。
图24至26示出了细胞因子标志物的结果,表明神经酰胺靶向的益生元减少了宿主-微生物组(trans-well系统)中具有敏感性、刺激性的标志物。在每次测定之前,使用3种微生物组群落培养物(IL-31,图24)、(IL-1α,图25)和(IL-18,图26),并且一式三份地完成实验。
图27示出了靶向的益生元神经酰胺导致直接在皮肤上产生三种长链高分子量的神经酰胺后生元。个体(N=2)在3个皮肤位置处且用TP和载体二者或者仅用载体(对照)一式两份地治疗。数据是在6小时之后从这些皮肤部位采集拭子,提取然后在Orbitrap上运行的结果(代谢组学)。
图28示出了在施加具有cTP的化妆品制剂(也称为BioBloomTM)之前和之后,来自研究参与者的皮肤(n=42)的数种生物体的丰度。参与者是IRB批准的为期15周的临床试验的成员。
图29示出了透明质酸靶向的益生元(hyaluronic acid Targeted Prebiotics,hTP)与微生物组一起诱导提高的益生元HA。载体影响由此产生的后生元产生。在适用的情况下,用3种微生物组群落进行宿主-微生物组测定。对于那些适用的样品,给予1次剂量为0.02%的hTP。
图30示出了来自使用hTP ELISA进行的宿主微生物组(transwell)测定的结果,示出了在存在微生物组的情况下的提高的HA后生元。所有测定均一式三份地进行,并且对于使用微生物组群落的测定,测试N=3种群落(每种也是一式三份)。
图31示出了离体细胞毒性实验,其示出了HA输入物(hTP)比载体或成分(例如角鲨烷)具有更低的细胞毒性。在适用的情况下,使用N=3种微生物组群落,所有实验均一式三份地进行。
具体实施方式
图1示出了基于基因组数据和分析数据来确定候选益生元的过程100的流程图。所述过程可体现在由一种或更多种处理器执行的计算机可读指令中,使得该过程的操作可部分或全部由环境200和系统300的功能组件进行。因此,在一些情况下,下面描述的过程是以其为参考的实例。然而,在另一些实施方式中,针对图1所述过程的至少一些操作可部署在多种其他硬件配置上。因此,针对图1所述的过程并不旨在局限于环境200和系统300,并且可通过一个或更多个附加组件来全部或部分实施。尽管所述流程图可将操作显示为顺序过程,但许多操作可并行或同时进行。另外,可重新安排操作的顺序。当过程的操作完成时,该过程终止。过程可对应于方法、程序、算法等。方法的操作可全部或部分地进行,可与其他方法中的一些或所有操作联合进行,并且可由任意数目的不同系统(例如本文中所述的系统),或其任意部分(例如任何系统中包含的处理器)进行。
图1是示出根据一种或更多种示例性实施方式的基于基因组数据和分析数据来确定候选益生元的过程100的示例性操作的流程图。在操作102处,过程100包括获得包含多个测序读段(sequencing read)的测序数据。多个测序读段可来源于多个样品。
在操作104处,过程100还可包括聚集多个测序读段中的多个单独的测序读段以产生聚集序列。聚集序列可包含来源于从第一个体获得的多个样品中的第一样品的多个序列中的一个或更多个第一序列,以及来源于从第二个体获得的多个样品中的第二样品的多个序列中的一个或更多个第二序列。
在操作106处,过程100可包括分析一个或更多个基因组区,以确定对应于所述一个或更多个基因组区的一种或更多种酶。还可分析所述一个或更多个基因组区,以确定具有包含所述一个或更多个基因组区的相应基因组的一种或更多种生物体。
另外,在操作108处,过程100可包括基于对应于单独基因组区的一种或更多种酶中的至少一种酶,确定对应于所述一个或更多个基因组区中的单独基因组区的生物化学途径。所述至少一种酶可激活与生物化学途径相关的反应。
此外,在操作110处,过程100可包括确定与生物化学途径相关的多种化合物。多种化合物可至少包含第一化合物和第二化合物,所述第一化合物是生物化学途径的反应中的反应物,所述第二化合物是生物化学途径的反应中的产物。
在操作112处,过程110可包括基于对应于单独基因组区的多个所述一个或更多个第一序列,确定存在于第一样品中的一种或更多种酶的第一酶量的第一度量(firstmeasure)。
在操作114处,过程100还可包括基于第一酶量的第一度量来确定反应物是用于治疗存在于一个或更多个第一个体中的一种或更多种生物学病症的候选益生元。
在一个或更多个实例中,可从第一样品获得分析数据。可使用一种或更多种分析型或生物化学技术获得分析数据,所述技术例如一种或更多种质谱技术、一种或更多种液相色谱技术、一种或更多种薄层色谱技术或者多种气相色谱技术。在一个或更多个另外的实例中,可基于分析数据来确定样品中反应物的第一丰度和产物的第二丰度。在多个实例中,基于样品中反应物的第一丰度和产物的第二丰度,反应物可以是候选益生元。
在一个或更多个实例中,可获得包含多个附加测序读段(additional sequencingread)的附加测序数据。多个附加测序读段可来源于多个附加样品。多个附加样品可包含对应于第一组环境条件的第一附加样品和对应于第二组环境条件的第二附加样品。在多个实例中,可聚集多个附加测序读段中的多个单独的附加测序读段以产生附加聚集序列。可分析附加聚集序列,以确定对应于所述附加聚集序列的一个或更多个附加基因组区。此外,可分析所述一个或更多个附加基因组区,以确定对应于所述一个或更多个附加基因组区的一种或更多种附加酶。还可分析所述一个或更多个附加基因组区,以确定具有包含所述一个或更多个附加基因组区的相应基因组的一种或更多种附加生物体。
在多个实例中,可基于附加聚集序列确定存在于第一附加样品中的第一酶的第一量。另外,可基于附加聚集序列确定存在于第二附加样品中的第一酶的第二量。此外,可基于附加聚集体序列确定第一量与第二量之间的一个或更多个差值。
在一个或更多个实例中,可获得从第一附加样品获得的第一附加分析数据和从第二附加样品获得的第二附加分析数据。另外,可基于第一附加分析数据确定反应物的第一附加丰度。还可确定产物的第一附加丰度。在多个实例中,可基于第二附加分析数据确定反应物的第二附加丰度。此外,可基于第二附加分析数据确定产物的第二附加丰度。在一个或更多个实例中,可确定反应物的第一附加丰度与反应物的第二附加丰度之间的一个或更多个第一差值。此外,可确定产物的第一附加丰度与产物的第二附加丰度之间的一个或更多个第二差值。
在多个实例中,可基于聚集序列确定存在于第一样品和第二样品中的多种生物体。还可确定包含在多种生物体内的生物体亚群。生物体亚群可对应于目的生物体群落。在多个实例中,生物体亚群可对应于在一个或更多个样品中具有至少阈值丰度的生物体。
在一个或更多个实例中,可获得来源于第一附加样品的第一附加分析数据。基于第一附加分析数据,可确定第一附加样品中生物体亚群的第一附加丰度度量。单的的第一附加丰度度量可对应于生物体亚群中包含的单独生物体的相应第一丰度度量。另外,可获得来源于第二附加样品的第二附加分析数据。在多个实例中,可基于第二附加分析数据确定第二附加样品中生物体亚群的第二附加丰度度量。单独的第二附加丰度度量可对应于生物体亚群中包含的单独生物体的相应第二丰度度量。在一个或更多个另外的实例中,可确定第一附加丰度度量的至少一部分与第二附加丰度度量的至少一部分之间的一个或更多个差值。
在一个或更多个实例中,可确定反应物的第一附加丰度与反应物的第二附加丰度之间的一个或更多个第一差值一个或更多个第一差值或者产物的第一附加丰度与产物的第二附加丰度之间的一个或更多个第二差值中的至少一者之间的一种或更多种相关性。还可确定第一附加丰度度量的至少一部分与第二附加丰度度量的至少一部分之间的一个或更多个差值之间的一种或更多种附加相关性。在一个或更多个示例性实例中,一种或更多种相关性是使用一种或更多种贝叶斯网络技术确定的。
在多个实例中,可从包含第一制剂的第一环境收集第一附加样品。第一制剂包含第一量的反应物和用于反应物的第一载体物质。另外,可从包含第二制剂的第二环境收集第二附加样品。第二制剂包含第二量的反应物和用于反应物的第二载体物质。在至少一些实例中,反应物的第一量可不同于反应物的第二量。在一个或更多个另外的实例中,用于反应物的第一载体物质可不同于用于反应物的第二载体物质。
在一个或更多个实例中,可确定一个或更多个函数,所述一个或更多个函数可被执行以确定生物体亚群的丰度。可基于第一制剂和第二制剂确定一个或更多个函数。另外,可基于反应物的第一附加丰度与反应物的第二附加丰度之间的一个或更多个第一差值一个或更多个第一差值,或者产物的第一附加丰度与产物的第二附加丰度之间的一个或更多个第二差值中的至少一者之间的一个或更多个差值来确定一个或更多个函数。此外,可基于第一附加丰度度量的至少一部分与第二附加丰度度量的至少一部分之间的一个或更多个差值来确定一个或更多个函数。
在一个或更多个实例中,可产生实施一个或更多个函数的模型。该模型可具有对应于第一环境和第二环境内的条件的多个参数。例如,多个参数中的至少一个参数可对应于样品中的益生元量。一个或更多个参数中的至少一个参数还可对应于制剂中的载体。在多个实例中,可获得对应于多个参数的条件值。至少一部分条件值可与对应于第一环境和第二环境的附加条件值不同。此外,该模型可被执行以确定生物体亚群中包含的至少一部分生物体的丰度。丰度可对应于条件值。在一个或更多个实例中,该模型可使用一种或更多种人工神经网络产生。
在一个或更多个另外的实例中,可产生对应于一个或更多个个体的模拟环境的一种或更多种附加模型。例如,一个或更多个个体表型的模拟环境可使用经验数据产生。在多个实例中,可从存在生物学病症的个体获得基因组数据(例如测序读出)和分析数据。基因组数据和分析数据可用于确定模拟环境,例如其中存在生物学病症例如特应性皮炎的个体中存在的模拟皮肤微生物组。在多个实例中,可基于从其中将一种或更多种制剂施加至个体皮肤的多个个体获得的样品确定一种或更多种附加模型,以模拟个体的皮肤微生物组。可从个体获得基因组学和/或分析数据,以确定附加模型的一个或更多个参数。在至少一些实例中,由附加模型表示的模拟环境可被用于确定给药信息和/或载体信息中的至少一者,从而可使一种或更多种生物化学途径的活性最大化。在一个或更多个举例说明性实例中,可激活一个或更多个生物化学途径,以产生可治疗具有表型的个体皮肤的生物学病症的后生元(post-biotic)。在多个举例说明性实例中,可获得从一个或更多个个体获得的样品并进行多个实验。多个实验可涉及将样品置于对应于不同剂量的候选益生元和不同的用于候选益生元的载体的环境条件下。在这些情况下,分析数据可用于确定产生的与不同的剂量和制剂相关的益生元的量。分析数据可用于产生一种或更多种附加模型,该模型然后可用于预测针对另外给药和/或制剂中包含的载体的后生元的产生。
在多个实例中,第一样品可从第一个体的皮肤获得。另外,第二样品可从第二个体的皮肤获得。第一个体可包括在第一表型中。此外,第二个体可包括在第二表型中。在一个或更多个举例说明性实例中,第一表型可对应于就个体而言存在生物学病症。第二表型可对应于就个体而言不存在生物学病症。在一个或更多个另外的举例说明性实例中,生物学病症对应于与个体皮肤相关的异常。
图2是示出根据一些示例性实施方式的机器200的组件的框图,该机器200能够从机器可读介质(例如,机器可读存储介质)阅读指令并进行本文中讨论的任一种或更多种方法。具体地,图2示出了计算机系统实例形式的机器200的示意图,在机器200中,可执行用于使机器200进行本文中讨论的任一种或更多种方法的指令202(例如,软件、程序、应用、小程序(applet)、app、或其他可执行代码)。因此,指令202可用于实施本文中所述的模块或组件。指令202将通用的非编程机器200转换成特定的机器200,该机器200被编程为以所述方式进行所执行所描述和示出的功能。在一些替代实施方式中,机器200作为独立设备操作,或者可与其他机器耦联(例如,网络化)。在网络化部署中,机器200可在服务器-客户端网络环境中以服务器机器或客户端机器的身份运行,或者在对等(peer-to-peer)(或分布式)网络环境中作为对等机器运行。机器200可包括但不限于服务器计算机、客户端计算机、个人计算机(personal computer,PC)、平板计算机、膝上型计算机(laptop computer)、上网本(netbook)、机顶盒(set-top box,STB)、个人数字助手(personal digital assistant,PDA)、娱乐媒体系统、蜂窝电话、智能电话、移动设备、可穿戴设备(例如智能手表)、智能家居设备(例如智能电器)、其他智能设备、网络电器、网络路由器、网络交换机、网络桥接器、或能够顺序或以其他方式执行指令202的任何机器,指令202指定机器200要采取的行动。此外,虽然仅举例说明了单个机器200,但是术语“机器”应被理解为包括单独或联合执行指令202以进行本文中讨论的任一种或更多种方法的机器的集合。
机器200可包括处理器204、存储器/存储206和I/O组件208,其可被配置为例如通过总线(bus)210相互通信。本文中的“处理器”是指根据控制信号(例如,“命令”、“操作码”、“机器码”等)操纵数据值并产生用于操作机器200的相应输出信号的任何电路或虚拟电路(由在实际处理器204上执行的逻辑模拟的物理电路)。在一种示例性实施方式中,处理器204(例如,中央处理单元(central processing unit,CPU)、精简指令集计算(reducedinstruction set computing,RISC)处理器、复杂指令集计算(complex instruction setcomputing,CISC)处理器、图形处理单元(raphics processing unit,GPU)、数字信号处理器(digital signal processor,DSP)、专用集成电路(application-specific integratedcircuit,ASIC)、射频集成电路(radio-frequency integrated circuit,RFIC)、其他处理器或其任何合适的组合)可包括例如可执行指令202的处理器212和处理器214。术语“处理器”旨在包括多核处理器204,所述多核处理器204可包含可同时执行指令202的两个或更多个独立处理器(有时称为“核”)。尽管图2示出了多个处理器204,但是机器200可包括具有单核的单个处理器212,具有多核的单个处理器212(例如,多核处理器),具有单核的多个处理器212、214,具有多核的多个处理器212、214,或者其任意组合。
存储器/存储206可包括存储器,例如主存储器216或其他存储器,以及存储单元218,二者均可访问处理器204(例如通过总线210)。存储单元218和主存储器216存储体现本文中所述的任一种或更多种方法或功能的指令202。在机器200执行指令202期间,指令202还可完全或部分地驻留在主存储器216内、存储单元218内、至少一个处理器204内(例如,处理器的高速缓冲存储器内)、或其任何合适的组合。因此,主存储器216、存储单元218和处理器204的存储器是机器可读介质的实例。“机器可读介质”在本文中也称为“计算机可读存储介质”,是指能够临时或永久存储指令202和数据的组件、设备或其他有形介质,并且可包括但不限于随机存取存储器(random-access memory,RAM)、只读存储器(read-only memory,ROM)、缓冲存储器、闪存、光学介质、磁性介质、高速缓冲存储器、其他类型的存储器(例如,可擦除可编程只读存储器(erasable programmable read-only memory,EEPROM))和/或其任何合适的组合。术语“机器可读介质”可被认为包括能够存储指令202的单个介质或多个介质(例如,集中式或分布式数据库,或相关联的缓存和服务器)。术语“机器可读介质”还应被认为包括能够存储由机器200执行的指令202(例如,代码)的任何介质或多种介质的组合,使得指令202在由机器200的一种或更多种处理器204执行时,导致机器200执行本文中所述的任一种或更多种方法。因此,“机器可读介质”是指单个存储装置或设备,以及包括多个存储装置或设备的“基于云的”存储系统或存储网络。术语“机器可读介质”本身不包括信号。
I/O组件208可包括广泛多种组件,以接收输入、提供输出、产生输出、传输信息、交换信息、捕获测量结果等。特定机器200中包含的具体I/O组件208将取决于机器的类型。例如,便携式机器(例如移动电话)将可能包括触摸输入设备或其他这样的输入机制,而headless服务器机器将可能不包括这样的触摸输入设备。应理解,I/O组件208可包括图2中未示出的许多其他组件。根据功能对I/O组件208进行分组仅是为了简化下面的讨论,并且该分组决不是限制性的。在多种示例性实施方式中,I/O组件208可包括用户输出组件220和用户输入组件222。用户输出组件220可包括视觉组件(例如显示器,如等离子显示面板(plasma display panel,PDP)、发光二极管(light emitting diode,LED)显示器、液晶显示器(liquid crystal display,LCD)、投影仪或阴极射线管(cathode ray tube,CRT))、声学组件(例如,扬声器)、触觉组件(例如,振动马达、阻力机构)、其他信号发生器,等等。用户输入组件222可包括字母数字输入组件(例如,键盘、被配置为接收字母数字输入的触摸屏、摄影光学键盘(photo-optical keyboard)或其他字母数字输入组件)、基于点的输入组件(例如,鼠标、触摸板、轨迹球、操纵杆、运动传感器或其他指向工具)、触觉输入组件(例如,物理按钮、提供触摸位置或力度或触摸手势的触摸屏或其他触觉输入组件)、音频输入组件(例如,麦克风)等。
在另一些实例性实施方式中,I/O组件208可包括生物识别组件224、运动组件226、环境组件228或位置组件230等广泛多种其他组件。例如,生物识别组件224可包括检测表现(expression)(例如,手部表现、面部表现、声乐表现(vocal expression)、身体姿势或眼睛追踪)、测量生物信号(例如,血压、心率、体温、排汗或脑电波)、识别人(例如,声音识别、视网膜识别、面部识别、指纹识别或基于脑电图的识别)等的组件。运动组件226可包括加速度传感器组件(例如,加速度计)、重力传感器组件、旋转传感器组件(例如,陀螺仪(gyroscope))等。环境组件228可包括例如照明传感器组件(例如,光度计)、温度传感器组件(例如,检测环境温度的一个或更多个温度计)、湿度传感器组件、压力传感器组件(例如,气压计)、声学传感器组件(例如,检测背景噪音的一个或更多个麦克风)、接近传感器组件(例如,检测附近物体的红外传感器)、气体传感器(例如,为了安全检测危险气体的浓度或者测量大气中的污染物的气体检测传感器)、或者可提供对应于周围物理环境的指示、测量结果或者信号的其他组件。位置组件230可包括位置传感器组件(例如,GPS接收器组件)、高度传感器组件(例如,检测可从中导出高度的气压的高度计或气压计)、方位传感器组件(例如,磁力计)等。
可使用广泛多种技术实现通信。I/O组件208可包括可操作以将机器200连接到网络234或设备236的通信组件232。例如,通信组件232可包括网络接口组件或与网络234接口的其他合适的设备。在另一些实例中,通信组件232可包括有线通信组件、无线通信组件、蜂窝通信组件(cellular communication component)、近场通信(near fieldcommunication,NFC)组件、组件(例如,/>Low Energy)、/>组件、以及通过其他形式提供通信的其他通信组件。设备236可以是另一机器200或广泛多种外围设备中的任一种(例如,经由USB连接的外围设备)。
此外,通信组件232可检测标识符,或者包括可操作以用于检测标识符的组件。例如,通信组件232可包括射频识别(radio frequency identification,RFID)标签读取器组件、NFC智能标签检测组件、光学读取器组件(例如,检测一维条形码(例如通用产品代码(Universal Product Code,UPC)条形码)、多维条形码(例如快速响应(Quick Response,QR)码、Aztec码、数据矩阵、Dataglyph、MaxiCode、PDF417、Ultra Code、UCC RSS-2D条形码)和其他光学代码的光学传感器),或者声学检测组件(例如,识别标记的音频信号的麦克风)。另外,可经由通信组件232获得多种信息,例如经由互联网协议(Internet Protocol,IP)地理定位获得位置、经由信号三角测量获得位置、经由检测可指示特定位置的NFC信标信号获得位置,等。
在本文中,“组件”是指具有由功能或子程程调用、分支点、API或者提供以用于特定处理或控制功能的分区或模块化的其他技术定义的边界的装置、物理实体或逻辑。组件可通过其接口与其他组件组合以执行机器过程。组件可以是被设计成与其他组件一起使用的包装的功能硬件单元,并且可以是通常执行相关功能的特定功能的程序的一部分。组件可构成软件组件(例如,包含在机器可读介质上的代码)或硬件组件。“硬件组件”是能够执行某种操作的有形单元,并且可以以某种特定的物理方式配置或排列。在多种示例性实施方式中,一个或更多个计算机系统(例如,独立计算机系统、客户端计算机系统或服务器计算机系统)或者计算机系统的一种或更多种硬件组件(例如,处理器或处理器组)可由软件(例如,应用程序或应用程序部分)配置为进行操作以进行本文中所述的某些操作的硬件组件。
硬件组件也可机械地、电子地或以其任何合适的组合实施。例如,硬件组件可包括被永久配置为进行某些操作的专用电路或逻辑。硬件组件可以是专用处理器,例如现场可编程门阵列(field-programmable gate array,FPGA)或ASIC。硬件组件还可包括由软件临时配置来进行某些操作的可编程逻辑或电路。例如,硬件组件可包括由通用处理器204或其他可编程处理器执行的软件。一旦被这样的软件配置,硬件组件就变成了被唯一定制来进行所配置的功能的特定机器(或机器200的特定组件),而不再是通用处理器204。应当理解,在专用和永久配置的电路中或者在临时配置的电路(例如,由软件配置)中机械地实现硬件组件的决定可由成本和时间考虑来驱动。因此,短语“硬件组件”(或“硬件实施的组件”)应被理解为包含有形的实体,即物理构造的、永久配置(例如,硬接线的)或临时配置(例如,编程的)来以某种方式操作或进行本文描述的某些操作的实体。考虑其中硬件组件被临时配置(例如,编程)的实施方式,每个硬件组件不需要在任何一个时刻被配置或实例化。例如,在硬件组件包含由软件配置成专用处理器的通用处理器204的情况下,通用处理器204可以在不同时间被配置成分别不同的专用处理器(例如,包含不同的硬件组件)。软件相应地配置特定的处理器212、214或处理器204,例如以在一个时刻构成特定的硬件组件,并且在不同的时刻构成不同的硬件组件。
硬件组件可向其他硬件组件提供信息,并从其他硬件组件接收信息。因此,所描述的硬件组件可以被认为是通信耦合的。在多个硬件组件同时存在的情况下,可以通过两个或多个硬件组件之间的信号传输(例如,通过适当的电路和总线)来实现通信。在其中多个硬件组件在不同时间被配置或实例化的实施方式中,这样的硬件组件之间的通信可以例如通过在多个硬件组件可以访问的存储器结构中存储和检索信息来实现。例如,一个硬件组件可以进行操作并将该操作的输出存储在其通信耦合的存储设备中。随后,另一个硬件组件可以访问该存储设备,以检索和处理存储的输出。
硬件组件也可启动与输入或输出装置的通信,并可对资源(例如,信息集合)进行操作。本文描述的示例方法的多种操作可以至少部分地由一个或更多个处理器204来进行,该一个或更多个处理器204被临时配置(例如,通过软件)或永久配置来进行相关操作。无论是临时配置还是永久配置,这样的处理器204都可以构成处理器实施的组件,用于执行本文描述的一个或更多个操作或功能。本文中所用的“处理器实施的组件”指的是使用一个或更多个处理器204实施的硬件组件。类似地,本文描述的方法可以至少部分地由处理器实施,其中特定的处理器212、214或处理器204是硬件的实例。例如,方法的至少一些操作可以由一个或更多个处理器204或处理器实施的组件来进行。此外,还可以操作一个或更多个处理器204来支持“云计算”环境中相关操作的性能或作为“软件即服务”(software as aservice,SaaS)。例如,至少一些操作可以由一组计算机(作为包括处理器204的机器200的示例)进行,其中这些操作可以经由网络234(例如,互联网)以及经由一个或更多个适当的接口(例如,API)来访问。某些操作的性能可以分布在处理器中,不仅驻留在单个机器200中,而且还部署在多个机器上。在一些示例实施方式中,处理器204或处理器实施的组件可以位于单个地理位置(例如,在家庭环境、办公室环境或服务器场内)。在另一些示例实施方式中,处理器204或处理器实施的组件可以分布在多个地理位置。
图3为示出包括示例软件架构302的系统300的框图,其可与本文所述的多种硬件架构结合使用。图3是软件架构的非限制性实例,并且应该理解,可以实施许多另外的架构来促进本文描述的功能。软件架构302可以在硬件例如图2的机器200上执行,该机器200包括处理器204、存储器/存储装置206和输入/输出(I/O)组件208等。示出了代表性的硬件层304,并且其可以代表例如图2的机器200。代表性硬件层304包括具有相关的可执行指令308的处理单元306。可执行指令308代表软件架构302的可执行指令,包括本文所述的方法、组件等的实施方式。硬件层304还包括至少一个存储器或存储模块存储器/存储装置310,其也具有可执行指令308。硬件层304还可以包含其他硬件312。
在图3的示例架构中,软件架构302可概念化为层的栈(stack),其中每层提供特定功能。例如,软件架构302可以包括层例如操作系统314、库316、框架/中间件318、应用320和表示层322。在操作上,应用320或层内的其他组件可以通过软件栈来调用API调用324,并响应于API调用324而接收消息326。所示的层在本质上是代表性的,并且不是所有的软件架构都具有所有的层。例如,一些移动或专用操作系统可能不提供框架/中间件318,而其他可能提供这样的层。另一些软件架构可以包括另外的或不同的层。
操作系统314可管理硬件资源并提供通用服务。操作系统314可包括例如内核328、服务器(service)330和驱动程序332。内核328可以充当硬件和其他软件层之间的抽象层。例如,内核328可以负责存储器管理、处理器管理(例如,调度)、组件管理、联网、安全设置等。服务器330可以为其他软件层提供其他通用服务。驱动程序332负责控制底层硬件或与底层硬件接口。例如,根据硬件配置,驱动程序332包括显示器驱动程序、相机驱动程序、驱动程序、闪存驱动程序、串行通信驱动程序(例如,通用串行总线(Universal Serial Bus,USB)驱动程序)、/>驱动程序、音频驱动程序、电源管理驱动程序等。
库316提供应用320、其他组件或层中的至少一者所使用的通用基础结构(commoninfrastructure)。库316提供允许其他软件组件以比直接与底层操作系统314功能(例如,内核328、服务器330、驱动程序332)连接更容易的方式进行任务的功能。库316可包括系统库334(例如,C标准库),其可以提供功能例如存储器分配功能、字符串处理(stringmanipulation)功能、数学功能等。另外,库316可包括API库336,例如媒体库(例如,支持多种媒体格式例如MPEG4、H.264、MP3、AAC、AMR、JPG、PNG的呈现和操作的库)、图形库(例如,可用于在显示器上的图形内容中呈现二维和三维的OpenGL框架)、数据库库(例如,可提供多种关系数据库功能的SQLite)、网络库(例如,可提供网络浏览功能的WebKit)等。库316还可包括广泛多种的其他库338,以向应用320和其他软件组件/模块提供许多其他API。
框架/中间件318(有时也称为中间件)提供了可由应用320或者其他软件组件/模块使用的更高级的通用基础结构。例如,框架/中间件318可以提供多种图形用户界面功能、高级资源管理、高级位置服务等。框架/中间件318可提供可由应用320或其他软件组件/模块使用的多种其他API,其中一些可专用于特定的操作系统314或平台。
应用320包括内置应用340和第三方应用342。代表性内置应用340的实例可包括但不限于联系人应用、浏览器应用、图书阅读器应用、位置应用、媒体应用、消息应用或游戏应用。第三方应用342可包括由除特定平台的供应商之外的实体使用ANDROIDTM或IOSTM软件开发工具包(software development kit,SDK)开发的应用,并且可以是运行在移动操作系统例如IOSTM、ANDROIDTMPhone或其他移动操作系统的上的移动软件。第三方应用342可调用由移动操作系统(例如操作系统314)提供的API调用324来促进本文描述的功能。
应用320可使用内置操作系统功能(例如,内核328、服务器330、驱动程序332)、库316和框架/中间件318,以创建与系统用户互动的UI。替代地或另外地,在一些系统中,与用户的交互可以通过表示层发生,例如表示层322。在这些系统中,应用/组件“逻辑”可与用户交互的应用/组件的方面相分离。
在不脱离本公开内容范围的情况下,可对所公开的实施方式进行改变和修改。这些和其他改变或修改旨在包括在本公开内容的范围内,如所附权利要求中所表达的一样。
本公开内容的示例实施方式
已经开发了范例方法,以识别、表征和利用益生元来靶向和诱导特定的内源性宿主皮肤微生物群代谢途径,以产生靶后生元。见解是专注于微生物组中存在的冗余功能,而不是分类学差异。对微生物组和生物信息学的深入了解使得能够开发这个平台来解析大型数据集,并识别统计学上显著的益生元化合物,这些化合物诱导与健康皮肤相关的后生元化合物以及其他与昆虫驱避性(insect repellency)商业相关的益生元化合物。经过计算机识别之后,通过实验生物化学平台验证了候选益生元化合物产生所期望的输出后生元化合物,该平台已在潮湿的实验室环境中进行了优化以测量候选益生元和后生元化合物,以及生物信息学流程根据其特定的化学特性来检验微生物集合体(microbial assemblage),并整合来自实验平台的结果。
存在使用生物信息学和生物化学平台开发的多种有利条件(asset)。具体来说,采用了预测的(或计算机的)候选益生元,并表明了确实可以在体外和人皮肤上诱导驱虫后生元作为概念证明。使用相同的平台,发现了神经酰胺后生元的益生元,以及透明质酸后生元的益生元(神经酰胺和透明质酸二者在护肤方面都有重要的商业意义)。神经酰胺和透明质酸二者都有助于皮肤保湿和皮肤屏障。进一步验证了在体外和人实验中使用神经酰胺和透明质酸,并表明了后生元以有效的量产生。
生物信息学平台和生物化学平台二者均已在护肤方面得到验证。这个空间允许更快地将技术商业化。范例允许快速扩大规模,以便可以比其他化合物发现方法更快地产生产品商业化所需的可重复性、适用性和安全性的数据。方法允许产生“常见化合物的新用途”所必需的安全性数据。范例和平台可用于其他环境,如肠、口腔健康、生殖系统、伴侣动物、环境系统等。
验证了生物信息学平台和流程,以预测靶益生元及其后生元。
技术目标1.收集样品和元数据,分类表型,提取DNA,并产生经验皮肤微生物组培养物。成功地:
从许多不同的个体收集了45份皮肤拭子样品用于测序;
从所收集的皮肤拭子中提取足够品质和数量的DNA;
产生了10个混合培养群。
技术目标2.表明微生物组(microbiome)群可以在预测的益生元输入和后生元输出化合物的存在下生存,以评估毒性和基本剂量。成功地:
表明靶益生元在体外不会损害皮肤微生物组;
表明益生元化合物可以安全地供应给1mM至100mM的微生物群。
技术目标3.检验了涉及计算机平台预测的体外益生元输入和靶后生元输出化合物的代谢途径的基因表达,以阐明作用机制。成功地:
表明靶益生元诱导了将益生元转化为后生化合物所需的基因;
添加益生元之后,靶途径的基因表达提高了2倍,表明途径激活。
图4示出了当添加不同浓度的B-丙氨酸(aTP)的靶益生元时,EC panD基因的基因表达变化倍数。将大肠杆菌(E Coli)培养物在LB中培养至OD 1.5,对照样品接受与处理培养物体积相当的另外的生长培养基,处理培养物接受添加了不同浓度的靶益生元的生长培养基,添加量如所示。所有培养物的采样发生在添加开始时或时间=0(T0)以及添加之后1(T1)和3小时(T3)时。通过RNA和rtPCR衡量表达水平。与对照相比,天冬氨酸转化为B-丙氨酸的基因(panD)显示出转录提高2倍,表明B-丙氨酸代谢途径激活。
技术目标4.评估体外从靶益生元的后生元输出。成功地:
确认了平台预测了靶益生元和后生元如在体外预测的那样表现。
确定了用于检测和量化先导预测的后生物输出化合物:2-苯基乙醇、神经酰胺和透明质酸的最佳方法。
开发、基线化和优化了用于体外测量神经酰胺和透明质酸途径输出化合物的方法。
验证了后生元输出化合物在临床相关阈值下在体外产生(通过GC-MS和ELISA进行)。
显示了输出化合物的平均产生时间开始于30分钟,并且在48小时仍可以以临床相关量检测到(图16)。
技术目标5.评估了在体外用预测的益生元输入化合物处理的微生物群的组成和功能。使用宏基因组学来研究在添加预测的输入化合物之后该群的变化。
成功地:
从样品中持续提取足够量的未降解微生物DNA用于测序,平均为14.66ng/μL,远高于鸟枪法测序所需的2ng/μL;
完成基因测序数据的质量控制、注释、处理和基本分析;
使用高通量下一代DNA测序:对数据进行注释和汇编,以产生170M DNA序列用于分析(平均9M序列/样品);
检验样品内部和样品之间的差异;
表明益生元没有改变微生物组群结构;
表明尽管样品间的组成多样性存在差异(分类学差异),但添加益生元输入不会改变样品内的多样性(N=3,一式三份);
表明益生元输入在体外引起靶功能变化;
示例平台方法预测了输入和输出化合物,如图5所示,并发现5种将产生神经酰胺的高概率候选益生元输入化合物,和6种将产生透明质酸后生元的化合物;
验证了之前预测的益生元输入和后生元输出化合物以及它们的代谢途径基因在经处理的群集合中确实不同(N=3),并发现4种其代谢物评分在组间(特应性皮炎vs正常皮肤)具有统计学显著性(p<0.05)的基因。
目标2.表明了预测的靶益生元诱导特定的途径,并在人皮肤上原位产生预测的输出化合物。
技术目标6.评估并验证了这样的方法,其可在人皮肤上使用,以诱导天然微生物群来产生预期的输出化合物。
成功地:
表明当益生元施加于人皮肤时,后生元输出提高;
原位获得候选后生元输出化合物的定量丰度;
表明与人皮肤上的对照相比,输入益生元化合物诱导了210倍的输出后生元化合物。
图6示出了N=2的个体在3个皮肤位置用TP和载体二者或仅用载体(对照)处理,一式两份。任何部位都没有发现益生元。在对照部位上没有发现任何后生元神经酰胺。数据是以下的结果:在6小时之后从这些皮肤部位采集的拭子,提取然后在Orbitrap上运行(代谢组学)。参见G2TO6。
部分2.技术目标、方法和工作
首先关注诱导神经酰胺后生元的益生元,如这些成分及其相关的开发制剂。神经酰胺对皮肤健康至关重要—调节关键过程例如细胞分化、细胞增殖和细胞死亡。神经酰胺是皮肤外部“皮肤屏障”的主要贡献者,并且已知在20岁后会减少。皮肤屏障的损失是皮肤病的已知先兆,所述皮肤病包括特应性皮炎、湿疹和银屑病。
由于神经酰胺益生元具有“常见化合物的新用途”,因此这些作为工作的一部分而产生(从体外、离体和人工作产生)的数据对于构建针对商业化和专利范围(claim)的安全性数据库是必要的。
该平台显示了益生元、剂量和制剂的适用性和可重复性。使用包括生物信息学平台和生物化学平台的范例来表明安全性、剂量、制剂和有效性。
存在靶益生元利用驱虫剂、神经酰胺和透明质酸有利条件产生所期望的后生元的证据。在cTP的实例中,有证据表明cTP及其伴随的载体(制剂)二者对大范围个体的皮肤都是有效的。
部分2.1生物化学平台
G1:评估可重复性、剂量,并产生制剂
在此,以在工作中开发的平台为基础,并在体外在大量多种皮肤微生物组中评估了产生神经酰胺后生元的靶益生元的可重复性和可靠性、剂量和有效性。还为基本制剂筛选了一组载体,并开发了计算机模型,这将有助于减少体外、离体和原位实验的实验参数。
G2:确保离体和体内益生元成分的适用性和安全性
扩大了最近开发的宿主微生物组系统。用来自神经酰胺靶益生元的实例展示了这个系统。用这个系统评估载体并测试其基本安全性。用代谢组学评估了在多种不同的人皮肤类型上神经酰胺后生元的产生。
如图7所示的生物化学平台,由体外、离体和原位实验和工作组成,为靶益生元化合物的安全性、效力、机制和剂量建立证据。下面给出了生物信息学平台的概述,并在其他地方进行了强调。在图7中,虚线箭头表示使用预测方法寻找候选物的初始步骤。然后通过生物化学平台筛选候选物。将生物化学结果提供到制造模型中,该模型随后预测核心成分及其功能。这些模型定义了关键生物体及其参数,并有助于使制剂和实验成形(shape)。
G3:通过预测透明质酸(护肤保健的一种重要成分)的靶益生元,展示了如G1和G2中所述的平台的可扩展性和平台方法的适用性,并随后使用生物化学平台顶部(top)显示安全性、效力并开发了基本化妆品制剂。
生物信息学平台预测了益生元和后生元化合物,以及随后生物化学平台在体外(G1)、离体/体内(G2)测试了它们的适用性和安全性二者,使得能够完成一组基本载体(制剂)。
部分2.2技术概述
G1TO1以皮肤微生物组和代谢组学为基线(baseline),并创建了多种皮肤微生物 组培养物收集物(collection)从面部皮肤拭子样品产生多种经验性皮肤微生物组培养物收集物,所述面部皮肤拭子样品从正在进行的临床研究中的不同种族和年龄的51个个体收集。还从皮肤拭子中提取DNA并完成基因鸟枪法测序和代谢组学,以建立基线。
G1TO2评估体外皮肤培养物收集物中益生元剂量和后生元输出的适用性
在之前的工作中,展示了概念验证工作,即平台确实识别了驱蚊益生元、神经酰胺益生元和透明质酸益生元,它们最终可用于原位制备其各自的后生元。工作仅限于一小组经验皮肤微生物组(N=10)和样品。为了确认未来的护肤益生元在商业上是可行和安全的:检验了来自TO1的多种所产生的皮肤培养物(N=51)中神经酰胺益生元的剂量。还使用生存力/生长测定检验了后生元神经酰胺产生的安全性和剂量,并使用宏基因组学和代谢组学检验了一部分培养物。还比较了单剂量vs多剂量谱。
G1TO3评估益生元的载体及其对多种经验推导出的微生物组培养物的作用评估益生元的一组载体及其对来自TO1的多种经验推导出的微生物组培养物的作用。还开发了计算机模型,其帮助减少测试的参数空间。这有助于产生可以离体测试的制剂(TO4、TO5、TO6),并有助于为商业追求产生最终的化妆品制剂。
G2TO4离体评估制剂剂量和后生元一致性
开发了宿主微生物组离体系统,以评估体外发现(TO2),用于转化为离体系统。这使得有机会直接检验神经酰胺益生元对微生物组的作用以及后生元神经酰胺在皮肤中的积累。在培养物收集物(TO1)中评估了益生元在该系统中的可重复性,以显示适用性。
G2TO5使用离体宿主-微生物组系统评估安全性标志物为了使益生元商业化,必须确保安全性。在宿主微生物组测定系统(TO4)中评估了许多安全性标志物,包括载体(TO3)中的刺激、敏感性、细胞健康和细胞死亡,以及益生元的后生元神经酰胺产生。以前,能够在体外在皮肤微生物组培养物中添加输入益生菌仅30分钟之后,检测到强的后生元神经酰胺输出。在长至72小时之后,还连续检测到后生元神经酰胺。在这里,通过使用离体系统(TO4)测量了不同时间的后生元。检验了样品和个体中随时间变化的输出产生开始和输出半衰期的稳定性和可重复性二者。
G2TO6评估人面部皮肤上的后生元神经酰胺产生。在正在进行的临床研究中,使用代谢组学来评估人皮肤中的后生元神经酰胺产生。这里的主要驱动因素是另外的商业安全性和基本制剂稳定性,以用于有效地递送和施用产品。
延伸(Stretch)G3TO7评估透明质酸(HA)益生元后生元在体外和离体的适用性在此,使用来自TO3和TO5的扩大规模的体外和离体实验以及透明质酸益生元来检验对多种皮肤微生物组群的适用性。再次使用宏基因组测序和代谢组学(TO3)建立模型,以帮助实验室实验。
延伸G3TO8—原位评估透明质酸(HA)的适用性使用TO6中设计的方法,使用正在进行的人皮肤微生物组临床研究,检验人皮肤上的后生元透明质酸产生。
2.3方法和实例
TO1以皮肤微生物组和代谢组学为基线并产生多种皮肤微生物组培养物收集物使用了先前从来自正在进行的临床研究的不同种族和年龄的51个不同个体收集的皮肤拭子样品。对这些样品进行培养,用于使用宏基因组学和代谢组学评估可重复性的实验。也直接对这些拭子进行测序,作为TO1的一部分。用于鸟枪法测序和代谢组学的样品处理方法将用作培养和加标(spike)实验中检验代谢(基因、生物体、代谢途径)的方法。
基线化皮肤样品收集和样品大小:进行了正在进行的纵向临床护肤研究(Integreview IRB#Beta2.0-01)。在事先同意之后,从参与研究的51人中收集了微生物组和代谢组样品的一组基线皮肤拭子。在每个部位使用预先湿润的拭子在面部皮肤区域以1英寸×1英寸进行采样,持续约10秒,在50:50乙醇/水中进行质谱(Mass Spec,MS)分析(代谢组学),或在50mM Tris pH 7.6、1mM EDTA和0.5%吐温20中进行核酸分析(微生物组)。将拭子贴上标签,并在使用前储存在-80℃下。另外,还收集了所有基本人口统计资料包括年龄、种族和性别。遵循为存储这些样品的元数据而建立的任何(x)序列清单(MIxS)的最低信息。这使得这些样品的处理和分析成为可能,这对于促进与战略投资者和投资者的伙伴关系至关重要。该研究的样品数是基于现有资源和基于以前研究中效应大小的计算结果。已经测量了皮肤炎症标志物的效应大小,大约有20%至30%的差异。因此,目标是在每个皮肤组亚类(敏感、非敏感/正常)中至少有15名个体,以获得足够的统计能力(StatMate,基于发明人最近所有的临床研究中的作用大小和2个亚类)。目前招募了51个个体,其中N=17具有敏感皮肤,并且N=34具有非敏感皮肤,并且将继续招募个体。
鉴于对皮肤微生物组中的冗余功能过程感兴趣—基于自我报告的皮肤敏感性表型收集样品—从18岁及以上的人中收集样品,并且不局限于基于性别或种族从个体中收集样品。该研究目前包括这样的个体:年龄在18至74岁之间,男性(N=10)和女性(N=41),多个人种和种族(美洲印第安人或阿拉斯加原住民(N=1)、亚洲人(N=7)、黑人或非裔美国人(N=3)、以及白人(N=40))。继续招募更多的个体,以提高组群的规模和多样性。
创建了多种体外经验微生物组培养物收集物:将皮肤拭子接种在Luria Bertani(LB)肉汤中(这是标准的丰富培养基),然后在37℃下在振荡下培养。对于所有培养物,在培养至对数期后期后,将1ml培养物样品与1ml 50%甘油混合,并在-80℃下冷冻,以备以后实验使用。
基线化微生物组和代谢组皮肤样品:直接从皮肤收集的样品被处理用于宏基因组学鸟枪法测序和代谢组学。培养之前皮肤拭子的鸟枪法测序提供了“核心”微生物组和“核心”功能过程的定性快照并且作为基线,它们允许检验培养中发生的损失(TO2、TO3)。检验了其他人口统计资料和皮肤类型(敏感和非敏感)中微生物组的多样性。根据微生物多样性对样品进行聚类(根据数个量度从最少到最多多样化),并根据这些结果对培养物进行二次采样,以保持处理和实验有效。
样品处理、文库制备和测序:注意这些方法是样品处理和制备的应用方法的实例。
方案的简要概述被包含于此。将使用QIAamp DNA微生物组试剂盒提取微生物组拭子,并对其进行一些修改以提高裂解。虽然这种试剂盒耗竭了宿主DNA,但本发明人知晓需要计算方法和更深入的测序来达到样品中的低丰度微生物。使用从皮肤样品中提取的DNA,将使用Kapa试剂盒(Roche)和llumina/>平台构建库。将选择151bp配对末端测序和350bp的插入大小进行测序。目标是2M读数/样品—基于之前的工作,这个数字对于获得流程和方法的化合物靶标是必要的和充分的。还包括每个泳道的3个样品和3个文库制备重复(来自单个样品),以评估质量控制和技术差异。在不同的泳道中分别对重复样品进行测序。
宏基因组学分析和方法:这些方法通常应用于所有测序样品,并已并入到建立的内部流程中。方法将需要汇编和直接数据库注释二者。首先,对序列进行预处理,包括去除克隆载体序列、品质修剪以去除低品质碱基,以及筛选以去除可验证的序列污染物。没有载体修剪的这些数据的汇编可以产生嵌合重叠群,其中对于大多数阅读而言是共同的载体序列将不相关的序列聚集在一起。
汇编和注释:对于起草基因组汇编,将使用metaSPAdes,这采用了“有效的汇编图处理”,其利用了罕见的变体并包括错误校正,这基于SPAdes。对于每个支架(scaffold),将基于Uniref90中每个基因的最佳匹配来确定特性,如GC含量、覆盖、遗传密码和系统发育亲和谱。基于对这些数据的分析,以及基于涌现自组织映射(emergent self-organizingmap,ESOM)的对四核苷酸频率和时间序列相对丰度分析,将生成包括来自多个样品的支架的基因组草图。在不同样品中发现的相同基因组的支架将被比以对产生更长的片段,利用装配体的片段化依赖于环境(群组成)的这一观察结果。将使用Bowtie进行读取映射(readmapping)。成对读取的信息将用于延伸和连接重叠群,并由汇编者(assembler)填补空位。基于汇编的方法的优点是功能属性可以更直接地与生物环境联系起来。
直接注释:尽管汇编是用于样品组成的有用方法,但也注意到其限制了检验可被抑制的低丰度微生物的能力。因为这个目标的目的是理解在群中驱动功能差异的必须的组件,也将直接注释功能基因。因为将利用来自人皮肤的样品,还受益于大量的公共数据和数据库,所述公共数据和数据库存在有注释的微生物组数据,其主要是为了研究与人相关的生物体而形成的。为了做到这一点,将使用鸟枪法群谱分析、用于读取映射的MetaPhlAn和离心机,以及来自HUMAnN2的另外功能丰度注释,来进行相对于参考基因组的比对。酶学委员会(Enzyme Commission,EC)丰度将从功能丰度中收集,被分位数归一化,并随后进行log2转换,之后进行分析。预计ORFans—不注释任何参考序列的序列—会更罕见,原因包括错误的蛋白质编码序列调用、真正的新颖性或遗传异质性。
代谢组学分析和方法:对样品进行靶向和非靶向代谢组学和化学信息学。将从皮肤上采集的拭子样品用50% EtOH提取,并使用LCMS进行分析。C18柱上的反相梯度将用于色谱,以及分子,其用以非靶标方式运行的高分辨率Orbitrap质谱仪进行分析。将每个样品的数据用MZmine分析以确定特征和相对量化。检测到的特征是从对LCMS数据可用的所有公共谱库和相关研究的化合物参考库搜索的29–31。计算和报告的保留指数以及真实合成参考化合物的注射将为识别提供另外的信息。这些方法为皮肤上的神经酰胺和相关化合物提供了基线。此外,将观察到的神经酰胺与途径富集分析(来自注释的序列数据)叠加,将允许将与敏感皮肤微生物组最相关的生化途径以及与皮肤屏障和神经酰胺最相关的生化途径归入统计堆(bin),以检验任何在安全性方面重要的脱靶效应。
研究表明,皮肤微生物组的基因组大小有很大的差异,但平均基因组大小为5.5kb,每个样品约2M,这些测序数据应足以用于直接注释技术。这些数据,虽然在它们之间进行比较(例如敏感皮肤vs非敏感皮肤的表型)很有吸引力,但也可以作为TO2、TO3、TO4和TO5中实验的基线和比较。由于基于汇编的方法和识别功能基因、相关途径和生物体的另外能力,本发明的方法较少受到“已知”代谢和途径的限制,并可用于寻找新的先前未知的候选益生元和后生元、代谢物,特别是在没有关于与表型的生物和功能关系的先验信息的情况下。对于皮肤病症(如特应性皮炎(atopic dermatitis,AD)、湿疹和银屑病),期望看到神经酰胺和神经酰胺相关途径的提高。事实上,在没有特应性皮炎的人和AD患者之间候选益生元和后生元的这些功能途径上发生了统计学上显著的变化。基于代谢组学和分箱(binning)生物化学途径的表型聚类将共同定位另外的先前未知的相关皮肤炎症代谢物化合物(通过显示组间的统计学差异)以及转而可用于在未来工作中诱导这些代谢物的化合物。预计—基于之前临床研究的效应大小—将需要对<50名个体对象进行测序,以有能力检测敏感皮肤组(2组)之间的差异,但是承认由于测试的复杂性和多种化合物,可能需要另外的样品。虽然积极地从面部皮肤(以及先前研究中使用的皮肤)收集样品拭子,但也从另外的非标准部位(如臂)收集样品。如果看不到组间有意义的统计学差异,可以容易地收集另外的样品。也有可能样品显示的多样性比预期的要少,或者能力比预期的要低,但是会继续通过研究收集样品,以提高样品量、多样性和能力。纵向样品数据收集继续成为模型的区分因素(differentiator),并提高了发现真正有意义的关系的能力。
TO2体外评估益生元剂量和后生元输出的适用性将神经酰胺的益生元商业化需要对大量多种面部微生物组产生一致且可重复的影响。针对神经酰胺后生元的靶益生元不得损害产生这些后生元神经酰胺所需的皮肤微生物群成员。计算机工作表明,神经酰胺产生中涉及的代谢是冗余的,并且虽然已经完成了少量经验性微生物群培养物(N=10)的体外概念验证,但需要确认靶益生元和后生元的产品相关浓度适用于来源于从TO1中收集的不同样品群中的更大量微生物组群。使用毒性和生存力研究来检验这种适用性、可重复性和剂量。从这些实验中,还测量了后生元神经酰胺的产生,同时针对宏基因组学和代谢组学进行了二次采样。使用宏基因组学和代谢组学检验了神经酰胺代谢的共性,预测并检验了代谢变化并创建了模型。
用于评估化合物对多种微生物组的作用的体外实验LB生长培养基中每个经验衍生微生物组的生长曲线,是在存在多种浓度和剂量的益生元和后生元的情况下评估细菌生长的最简单且快捷的方法。如果化合物浓度如此之高,以至于与未处理的培养物相比,它们减少了细胞倍增时间,则该方法允许评估细菌群的生长缺陷。还将对这些实验中的一组进行二次采样用于宏基因组学和代谢组学研究,以检验随着时间的推移,靶益生元和后生元在培养物中诱导的群组成和功能变化。将来自TO1的多样性量度用于选择子样品集。
生长曲线实验:为了进行生长实验,将在LB肉汤中培养过夜的经验培养物反稀释到具有多种浓度的每种化合物的新LB肉汤中,使得600nm处的起始光密度(OD)为0.05。培养物通常在37℃下振荡培养5小时,并且如图9所示采样以获得OD600读数。如图17和18中所示,还完成了更长时间的生长实验,以检验从1剂TP开始的后生元产生时间,因为在添加iTP之后至少3小时产生实例后生元驱虫剂化合物。图16示出了添加靶益生元之后的后生元产生实例。这是预测的益生元输入化合物添加至混合经验皮肤培养物的一个证明,对所述混合经验皮肤培养物在添加之后在3小时时进行采样用于GCMS。发现驱虫剂输出化合物的水平高于对冈比亚按蚊(Anopheles gambiae)产生驱避性所需的水平。
生存力实验测量了化合物对多种微生物组的毒性:在之前的工作中,设计了培养物生存力的加标实验(TO1),以测量靶益生元和后生元神经酰胺对微生物组的长期毒性作用。这里将方法放大至板(图11)。这些实验通过在含有特定浓度的靶益生元、神经酰胺后生元或其他制剂成分的新鲜液体培养基中以1:100稀释过夜培养物来进行。将样品培养过夜,然后在0和16小时时取出100μL样品。在营养琼脂板上铺板之后,对菌落生长进行量化。图12示出了针对微生物组健康和生存力的不同浓度的数种预测TP的测试。
检验了多种微生物群收集物中的益生元和后生元神经酰胺产生。在检验了靶益生元对神经酰胺后生元的耐受之后,在体外测量了实际的后生元产生。在工作中,当研究后生元驱蚊剂时,存在后生元输出值的变异性(variability)(在10%至15%范围内)。对于益生元和神经酰胺后生元,尚未在体外测量在多种微生物组的这种变异性。对每个生长和加标培养实验进行二次采样,并使用酶联免疫吸附测定(enzyme-linked immunosorbentassay,ELISA)进行后生元神经酰胺检测。
神经酰胺益生元和后生元的ELISA检测:在早期工作中,成功开发了一种内部神经酰胺ELISA,以提供对组织培养基、细菌生长培养基和人或细菌来源的细胞沉淀的最佳检测。为了制备用于该ELISA的样品,使用了Folch法进行脂质分离。这里包括这样的概述:将来自实验的最终干燥样品重悬于200ul甲醇中。将100ul每种重悬样品一式两份添加至96孔板,并在4℃下孵育过夜。第二天,使板在通风橱中风干,直到所有的甲醇蒸发。添加由磷酸盐缓冲盐水(phosphate buffered saline,PBS)加3%(w/v)脱脂牛乳组成的封闭缓冲液,在室温下摇动2小时。去除封闭缓冲液,并向每个孔添加含有1:100小鼠IgM抗人神经酰胺C-24抗体的100uL新封闭缓冲液。在4℃下摇动孵育过夜之后,将板用300uL的PBS加0.05%吐温-20洗涤5次。将100uL在PBS中的与辣根过氧化物酶缀合的山羊IgG抗小鼠IgM加3%牛血清白蛋白(BSA)添加至每个孔,并在室温(约22C)下摇动孵育2小时。将板的孔再次用PBS加0.05%吐温-20洗涤5次。此时,使用1×TMB(3,3′,5,5′-四甲基联苯胺)和1×TMB反应终止溶液产生比色产物,在OD450处在读板仪上定量读取。然后将结果与使用神经酰胺C-24连续稀释液产生的已知标准曲线(图14)进行比较,以确定每个样品的神经酰胺量。图17示出了cTP诱导后生元神经酰胺的实例。
使用宏基因组学和代谢组学检验微生物代谢组学的给药:
二次采样方案:由于正在完成许多实验室实验(例如,排除对照和重复,并且假设仅使用单一剂量量的当前样品,最少N=102),为宏基因组学和代谢组学创建了二次采样方案。基于k-均值和层次聚类,选择具有低、中或高微生物多样性的相关原始皮肤测序多样性评估(如β和α多样性和Bray-Curtisβ多样性度量,根据过滤的OTU表计算)的培养物或其他样品,目标是每类5个样品。对30对样品(15对经处理的和15对未经处理的)进行二次采样,用于鸟枪法测序和代谢组学。将10uL培养物等分到100uL管中,并在-80℃下储存,直至处理。然后,按照TO1中描述的方法进行提取、文库制备、测序、QC、注释和代谢组学。在此解释了另外的平台方法。
平台方法和另外的分析:如先前工作中所做的,从宏基因组学鸟枪法数据中确定了驱动培养物中微生物群之间差异的代谢物评分。特别关注神经酰胺途径,并检验其他表现出更受调节的脱靶途径。注意到,小规模的工作和先前的工作所呈现出的表明后生元神经酰胺的益生元以及其他中期代谢物被强靶向(very targeted)。
已将这些数据处理流程化到内部分析流程中。在此,简要解释了在检验基于宏基因组测序的计算机代谢过程的流程中的方法(图15)。计算来自KEGG的代谢组化合物群M。直接从注释的宏基因组数据中发现的酶委员会(EC)数样品丰度(而不是如在初步数据中的预测的宏基因组数据集中发现的)计算G,即包含与过程相关的基因计数的矩阵或向量。G是分位数并且是log2归一化的,并随后乘以M,以得到每种代谢物的预测周转率的加权评分(也见图15第c项)。使用例如PCoA的方法来探索敏感和非敏感表型中神经酰胺代谢物的组之间的区别。还计算了样品生物体内的MetCon评分,但有一些不同之处,如在此所述。G乘以每个样品、每个生物体的丰度分数概率的矩阵,随后乘以M。使用汇编的宏基因组序列数据找到每个样品、每个生物体的注释的基因丰度。这导致每个样品每个生物体MetCon评分。将前10%的评分与从生物体样品代谢物评分中产生的前10%的评分进行比较。
为了比较样品评分,使用Kruskal-Wallis秩和检验。最后,还从实验室培养物的表型(敏感(N=17)vs不敏感(N=34)和人口统计资料方面评估了每种培养物(以及相应的剂量)中存在的核心生物体和功能的稳定性和一致性。为了评估表型的个体的MetCon评分的稳定性和一致性,将使用统计检验如Mantel检验50和Procrustes Analysis51。在添加提出的靶益生元和后生元的情况下分析微生物组群动态。这一技术目标是观察群的变化,因为它与可能含有神经酰胺相关途径的物种相关。到目前为止,还没有发现某些靶益生元的存在和/或后生元的产生会导致某些微生物组物种的竞争超过其他(outcompeting)或替代地下降(alternatively declining)。平台的一部分检验了添加益生元之后可能对皮肤健康产生不利影响的任何非预期的群变化,并证明了安全性。在这里,还利用用代谢组学确认的微生物组和代谢输入和输出创建了计算机模型,这有助于缩小TO3、TO4、TO5和生物化学平台的参数空间。在下面描述了生物化学和生物信息学模型之间的反馈。
在开发了适当的提取方法以检验用于测量的预测后生化合物后,使用体外实验(例如图16)和GC-MS、ELISA或抗体测试,以评估使用预测的靶益生元输入化合物来促进(fuel)特定代谢途径是否会产生有效水平的内源性后生化合物。使用单一和混合群体外培养物,这些培养物与在初步宏基因组学研究中鉴定的预测益生元候选输入营养物一起培养。为了表明益生元输入确实诱导了后生元输出,进行了加标实验(见图11),在该实验中过夜培养物中添加了益生元输入,培养了数个小时,并随后例如通过GC-MS、ELISA或抗体检测进行分析。
使用平台对益生元和后生元进行初步筛选以确定浓度,示出了不会抑制细菌生长或影响培养物的生存力的浓度和安全性。
图13示出了体外生长实验实例。由于天然存在的微生物组群中功能基因含量的差异,因此经验样品将产生定量且定性的多种神经酰胺后生元。虽然预计神经酰胺的组成和响应时间在一个相对较窄的范围内(即10%至15%,如之前测量的那样),但群的响应速度也可能有所不同。本发明人相信,在之前的研究中验证的方法将降低整体技术风险。可能益生元或后生元神经酰胺在一些样品中会导致有害的微生物体群变化。如果是这种情况,那么将完成长期微生物体群作用及其对皮肤环境影响的实验。还能够通过多种给药策略来校正这些变化。由于神经酰胺途径存在于测序数据中,预计当体外添加靶益生元时,这将转化为神经酰胺后生元的产生。如果样品之间的差异范围太大,二次采样方案也可能不足以检测差异。如果是这种情况,则将对更多的实验进行采样,以便能够测试更多的微生物组和代谢组。意识到,体外条件并不模拟人皮肤环境生态位,并且可能无法产生从益生元产生神经酰胺后生元所需的适当蛋白质表达谱,并因此准备根据需要修改实验。
TO3:体外和离体确定和评估益生元的载体制剂
用于微生物组健康和神经酰胺后生元产生的经验证制剂。在前面描述了评估多种微生物体群培养物中益生元生效(validation)的实验(TO2),这里检验了制剂或载体化合物中的益生元。载体为益生元提供了美容方面令人满意(cosmetically pleasing)的递送系统;这也被称为“制剂”。影响组成制剂的载体的因素包括疏水性、pH、溶解度和维持制剂效力的长期稳定性。在这种情况下,载体化合物不能极大地改变微生物组的健康。首先选择已通过溶解度和初始安全性筛选的载体(来源于安全性数据表和文献二者)。例如,这些将包括brontide、角鲨烯和甘油。在多种培养物收集物中筛选了从TO2获得的益生元剂量的制剂。进行生长曲线和加标实验来评估毒性和生存力,如TO2中所讨论的(图1和2)。这组实验确保了不具有会导致皮肤微生物组中生长缺陷或变化的制剂毒性。结果还表明每种制剂将如何影响多种微生物组的长期健康。
从这些生长和生存力实验中,将检验制剂是否产生后生元神经酰胺。这些数据确认了益生元的递送、所期望的后生元的产生这二者的效力和安全性。再次使用TO2中描述的ELISA测定,以及宏基因组学和代谢组学的二次采样实验来检验计算机和途径作用以及脱靶偏移(TO2中描述的方法)。还开发了计算机模型来评价载体和最终制剂针对多种的皮肤微生物组的适合性。所选择的载体可影响微生物组诱导给定途径的能力,从而导致没有后生元产生。这些实验还提供了另外的安全性数据。因此,TO3和TO4允许扩大评估载体的方法,并开发计算机模型来评价所有未来的载体。
用于生物化学和生物信息学平台中的基本制剂和整合的模型尽管平台的初始阶段鉴定了益生元及其后生元化合物,但制剂将需要在逐个益生元的基础上进行设计。通过从这些体外(TO1、TO2、TO3)实验中开发计算机模型来扩展和辅助这一过程,所述模型减少了参数空间(如剂量、时间、载体),使体外和离体实验以及最终的原位实验更加高效和有效。从在这里测试的体外制剂试验中,按照TO2(N=30)个样品再次进行二次采样,用于测序和代谢组学。使用来自这些实验(TO2)和在此在TO3中的宏基因组测序和代谢组学的数据来创建用于面部皮肤生物群落群的模型,以优化后生元化合物的输出。
开发了可被扰动以检验群及其输出代谢物中变化的计算机集合模型,并在此进一步开发。这里开发模型的基本方法只能通过上下文中的数据来表示,因此给出了先前模型的实例来展示这些方法的能力(在此简要总结)。为了创建模型,1)使用从TO1收集的关键生物体的集合来创建一个互动网络;以及步骤2)将该网络表示为从预测的化合物数据(从TO2和TO3收集的)推断的一组明确的关系,以创建预测模型。步骤1实质上是微生物集合的贝叶斯(Bayesian)推理网络的生成,如图19中所示的有向循环图(directed cyclical graph,DAG),其中父节点是环境参数随时间和空间变化的改变,并且子节点是群的相对丰度的改变。在这种情况下,环境参数是预测的代谢物化合物及其从代谢组学估计的质量(TO1、TO2和TO3)。节点之间的有向边表示相关性。这样的网络可以使用实施贝叶斯网络推理的标准软件(例如bayespy python包)基于来自宏基因组数据中存在的预测化合物和生物体的参数来生成。在步骤2,节点的值需要表达为其父节点值的函数。同样,这个问题可以通过未知响应表面学习的标准工具来解决,所述工具例如人工神经网络(artificial neuralnetwork,ANN)工具(一种人工智能方法的形式)。这些生成的ANN从最佳解释数据的数学方程的角度来表示微生物体群结构,并且本发明人使用它们来预测分类单元在时间或空间上的相对丰度,作为变化的环境条件的函数。这些ANN捕捉不同分类单元变化的丰度之间的潜在因果关系,虽然分类单元之间的关系可能通过环境参数中变化的分类单元代理而出现。在这种情况下,通过代谢组学结果或捕获生物化学变化的其他高通量分析方法来参数化所述关系。为了可用性,将模型限制为神经酰胺化合物和代谢组学数据集中的前25种化合物。这些由早期经验数据参数化的模型可以帮助评估所期望表型的一致性(例如特应性皮炎、敏感性或皮肤病症)。最终模型可用于辅助其他实验中的参数化(剂量、TO3、TO4,例如作为临床人群的代替),可与来自LCMS、代谢组学等实验(TO3、、TO4)的结果进行统计学比较、减少时间和成本、以及使得能够理解剂量/制剂,以实现特定的代谢组学谱(例如期望的特定后生元)。
益生元和载体具有可用的安全性数据表(safety data sheet,SDS),其确认每种靶益生元、载体和后生元化合物的无害性质。鉴于此,预计新设计的制剂也很可能是安全的。本发明人一直在使用此处所述的计算机模型来帮助实验室工作,并发现这在先前的实验中是准确的,与经验值的差异在2%至17.4%之内。可以预期的是,将更多的微生物体群多样性(来自皮肤样品的培养物的更多样品)引入到系统中可能会使模型拟合更具挑战性,并导致模型无法收敛,然而关注与益生元神经酰胺化合物周转相关的核心群功能是另一种允许收敛的方法。将平台商业化的一个挑战是许多“安全”化合物和产品对皮肤微生物组的惊人作用。筛选了数种现有的面部护肤产品和护肤载体,并发现它们对微生物组不友好,并会杀伤或改变现有的宿主群。不断改变的群可增加负面和致病生物体,从而可降低皮肤保护屏障并降低皮肤健康。制剂对微生物组安全,对人也安全。这些问题中的许多都早早在测试TO1和TO2中得到了解决,在所述测试中确定了微生物组可耐受的每种成分的最大值。这些发现有助于确定益生元的载体的最终制剂。
TO4:离体评估制剂剂量和后生元一致性
在此,扩大了宿主微生物组trans-well测定系统,以基于从TO1、TO2和TO3获得的知识,检验有效递送益生元所必需的制剂的载体、剂量和时机。在TO5中使用这些测定来评价和生成安全性数据。
使用制剂的宿主微生物组测定
放大宿主微生物组(trans-well)测定开发并验证了宿主微生物组测定系统(图20)。该系统允许在微生物组培养物的存在下培养人细胞。在此,描述了这种方法,并扩大了这种测定。首先,使健康的和汇合的成人上皮角质细胞(adult human epithelialkeratinocyte,HEKa)通过,并使其在Epilife培养基加抗生素加HKGS(humankeratinocytes growth supplement,人角质细胞生长补充剂)中的新16孔组织培养板之间平均分布。将细胞在37℃加5% CO2下培养,直到孔汇合。经验微生物组培养物在LB培养基中过夜制备。实验当天,HEKa板接受1.5ml新的Epilife培养基加HKGS(不含抗生素)。然后每个孔接受带有0.4um膜的trans well插入物。将过夜微生物组培养物细胞离心沉降,除去培养基,并将沉淀重悬于Epilife加HKGS中,使得最终OD600=1.0。将500ul这种混合物添加至trans well的插入部分。然后添加载体和益生元的处理。将实验孵育48小时,同时在时间0、0.5、2、10、24和48小时采样。为了扩大规模,使用带有插入物的12孔形式板,以便使可进行实验和收集数据进行分析的速度加倍。
从宿主-微生物组实验中收集和提取神经酰胺和相关脂质用于分析在宿主-微生物组实验过程期间,收集孔的上清液和细胞二者(图20、21、23),然后可在下游实验中出于多种目的对其进行分析(参见TO5)。首先取出上清液用于另外的分析,向每个孔添加1ml磷酸盐缓冲盐水(PBS),并随后机械地取出细胞。将PBS/细胞混合物以2000g离心沉降5分钟,并去除上清液,将细胞沉淀用于以后的分析。检验细胞和上清液二者中的神经酰胺。通过Folch法提取细胞沉淀。上清液中的后生元神经酰胺也以类似方式收获,除了以最初的Folch比率(3氯仿:1甲醇:1水)使上清液代替水。
在TO2中给出了通过ELISA测量后生元神经酰胺产生的一个实例。还使用二次采样方案(N=30,15个经处理和未处理对)对上清液进行二次采样,用于计算机宏基因组和代谢组分析。
已经进行了数项初步实验,以确定宿主-微生物组方法的可行性和可靠性(图20和23以及例如实施例18、21和22)。使用这些方法,图18示出了用不同载体从cTP产生神经酰胺,以及含有cTP或BioBloomTM的制剂在产生神经酰胺方面如何优于现成的防护霜(“ambrosia”)。此外,这些TP导致神经酰胺的产生超过48小时。
这些新的实验对益生元提高离体神经酰胺浓度的可靠性和可重复性产生了深刻的见解。意识到液体培养基中的组织培养物细胞与微生物组培养物之间的相互作用可能是未确定的(problematic)。已知组织培养物细胞在最好的条件下是脆弱的。然而,这里检验的是皮肤细胞和培养基中神经酰胺的变化,而不是它们的整体健康。另外,已经完成了检验随时间改变量交换的生长培养基和剂量的测定,以找到基于人细胞类型的最佳交换(数据未显示)。也可以采用用培养基的分层皮肤组织方法。
G2TO5使用离体宿主-微生物组系统评估安全性标志物
这里,使用放大的宿主微生物组trans-well测定(TO4)来评估安全性标志物,包括刺激、炎症、敏感性、细胞健康和细胞死亡。这些结果为神经酰胺益生元建立了安全性数据,并且在此作为实例给出的方法可以用于其他候选TP。
用于检验安全性标志物的离体样品的收集:在宿主微生物组trans-well测定之后收集上清液和细胞。在收集每个时间点样品时,取出并丢弃含有微生物组样品的trans-well插入物,并将来自孔的剩余人角质细胞侧的上清液的2×200ul等分试样转移到微量离心管中,并将其冷冻直至用于两种测定(图23)。
使用离体测定评价刺激、炎症和敏感性为了评价刺激、炎症和敏感性—均与皮肤安全性相关,检验了常见的皮肤炎症标志物。为此,目前一直在使用人-微生物组transwell系统(在TO4中描述),并获取上清液样品用于基于多重细胞因子ELISA的系统(MesoScale Discovery[MSD],Rockville,MD)。该MSD系统允许在高通量96孔形式中设置多至10种可定制的细胞因子靶抗体。结果如图24至26所示,使用细胞因子IL-8(刺激和致敏的标志物)、IL-1a(刺激和致敏以及皮肤屏障成熟的标志物)、IL-18(刺激和接触过敏)、IL-31(经表皮失水)和TNF-α(皮肤屏障形成)。
图24至26示出了细胞因子标志物的结果,表明神经酰胺靶益生元减少了宿主微生物组中的敏感性、刺激的标志物(trans-well系统)。在每次测定之前,使用3个微生物组群培养物,并且一式三份完成实验。
在制备MSD细胞因子板之后,将在实验期间在预选时间期间获取的上清液trans-well样品添加至孔。然后使板在MSD检测机中运行,所述检测机可检测皮克量的细胞因子。从每种细胞因子的已知浓度生成标准曲线,以从实验中计算定量的细胞因子浓度。检验了单独宿主细胞、宿主和微生物组以及宿主-微生物组和用于产生后生元神经酰胺的益生元之间细胞因子浓度的定量差异。
评价离体trans-well测定的细胞死亡除了安全性和细胞健康的细胞因子标志物之外,使用Cytotox 96细胞毒性测定(Promega Corp.Madison,WI)来评价来自宿主微生物组测定(TO4)的细胞死亡。这种基于板的测定检测了乳酸脱氢酶(LDH)的胞外活性,乳酸脱氢酶是健康细胞中的胞质酶,但也在细胞溶解过程中释放。释放的LDH表明细胞死亡,其将四唑盐转化为红色的甲产物,这可以用读板仪测量。将在宿主-微生物组实验(TO4)期间收集上清液样品,以检验每个样品板孔中微生物组和制剂二者对人角质形成细胞(宿主细胞)健康的细胞毒性。通过裂解试剂(提供的试剂盒)使细胞完全死亡作为阳性对照,而未经处理的孔将作为阴性对照。定量地比较了来自制剂的宿主细胞死亡与TO3和TO4中培养物中收集的剂量。注意到,将以微生物组培养物本身和上清液为基线,以了解完成了为每个实验所设置的控制组。
基线化了细胞因子和细胞健康和死亡测定。在宿主微生物组测定中测试了数种不同的微生物组群培养物,并检验了这组细胞因子,其中初始数据显示没有严重的安全性问题。细胞死亡测定中的相同样品也显示出细胞毒性提高较少,因此预计更多含有制剂的培养物将产生类似的结果。对这些测定和从宿主微生物组测定系统产生的样品的一个主要担忧是,不知道每种经验微生物组培养物将如何与人角质形成细胞反应。虽然在这些方法方面没有遇到挑战,但在培养基中,一些微生物组样品可能会产生一些对人细胞有害的脱靶代谢物。通过观察宿主微生物组样品的宏基因组学和代谢组学来监测这些脱靶作用的安全性。虽然可能存在潜在有害的经验样品,但计算机的神经酰胺途径的先前皮肤微生物组样品的冗余使得有信心大多数实验将产生表明天然存在的宿主-微生物组相互作用的共生和有益性质的结果。
G2TO6评估人面部皮肤上的后生元神经酰胺产生此处,应用基于先前TO的当前制剂,以检验皮肤微生物组从靶益生元产生后生元的能力,以及确定后生元在皮肤表面(体内)存在多长时间。这些实验将提供对以下的深入了解:产品的安全性,以及需要多久一次施用本发明的产品来实现最佳的护肤保养。
基本皮肤反应评估在一小组群(N=9)试验志愿者中完成了24小时斑贴试验,所述志愿者来自正在进行的“制剂”研究(Beta 1.0研究)(载体TO3和基于先前的发现TO4的益生元剂量)。皮肤反应测试是评估刺激和致敏的常用方法75-77。简而言之,将0.21mL制剂施加于前臂上靠近肘前窝的一小块五分镍币(nickel)大小的区域。在24小时之后,对该区域的任何发红、刺激或致敏进行自我评估。在使用制剂之前进行是很重要的。没有报告发红、刺激或致敏的改变。代谢组学结果未显示出基础刺激标志物的任何增加。
对靶后生元的皮肤微生物组产生的体内检验使用代谢组学来验证后生元产生。已经完成了一项小型(N=3,3个部位,一式两份)研究,以基线化代谢组学的使用,从而有能力检验由于施加神经酰胺后生元的益生元(1%乙醇中的益生元)而产生的变化(图27)。另外,通过以下评估了皮肤上神经酰胺的原位产生:对拭子进行采样,所述拭子:进行了预处理,所述预处理是在EtOH中(有关皮肤代谢物拭子采样的方法,请参见TO1),以及利用在放置益生元的区域的吸附剂PDMS贴剂持续约8小时,以及含有和不含载体的对照样品。将PDMS贴剂在EtOH中提取,并使用GCMS进行分析。通过分析具有已知化合物量的标准品的稀释系列来确定绝对化合物浓度。根据TO1,通过LCMS对拭子进行评估。将临床研究开始时收集的皮肤拭子与一周两天使用制剂之后收集的拭子和PDMS贴剂进行比较。按照TO1中的描述收集拭子。
图28示出了在施加含cTP的化妆品制剂(也称为BioBloomTM)之前和之后,来自研究参与者皮肤(n=42)的数种生物体的丰度。参与者是IRB批准的为期15周的临床试验的成员。
可能的结局和挑战:完成了一项小型代谢组学皮肤研究,该研究是针对2名志愿者(3个部位,一式两份)神经酰胺后生元的产生(图6)。神经酰胺分子量极高。在这里,扩展了这项研究,以显示在人面部皮肤中的可重复性和适用性。知道后生元产生会有一些变异性,但先前的研究表明,这种变异实际上比计算机模型预测的更小。对于后生元的最大输出,预计会有类似的剂量度量,但由于微生物组密度的差异,可能需要调整时机,因为液体培养物比干燥平坦的表面(如皮肤)含有更多的细菌。这些数据将继续为成分和制剂建立安全性谱。预期由于与面部贴剂和从基于液体的培养系统外推至更干燥的体内系统相关的空间问题而导致的差异和变异。贴剂和制剂载体应该有助于维持宿主微生物组的潮湿环境,但是如果没有看到同样量的稳健的后生元产生,那么可能必须设计一些另外的制剂。此外,知道本发明人的体外培养物,离体人-微生物组系统,以及计算机是生命系统的不完美模型。然而,尽管这些不同的方法存在差异,但初始基线和实验一直处于非常严格的定量范围内(0.2%至1.1%以内)。即使在很小的测量空间内,微生物体生态位也可能极其多样。然而,由于专注于微生物功能冗余,因此有能力和潜力在多种人皮肤上获得一致的后生元输出。通过用人面部皮肤的经验证据表明了这一点,从而大大缓解了这种担忧。
G3TO7:实施例2:使用平台—验证透明质酸作为另一微生物组产生的护肤途径,并开发载体制剂
第二优先候选物是透明质酸的益生元。透明质酸是抗衰老化妆品中最常见的成分,并且也是保持皮肤水分和促进健康皮肤屏障的关键成分。透明质酸可存在于含有连接的透明质酸亚基的可变长度链中。在此,在体外和离体条件下评估了益生元对HA的适用性和安全性。
针对透明质酸途径基因和代谢物的经验微生物组样品的评估G1TO1和G1TO2,将分析所收集的基因和代谢物的序列,其表明从靶输入产生透明质酸作为终产物的能力。
体外实验用于评估益生元化合物对多种微生物组中HA的作用筛选了培养物收集物用于生存力、毒性和生长实验,如TO2中所述。这使得能够确定不会影响经验微生物组健康的靶益生元的适当浓度。旨在通过用可耐受浓度的靶益生元进行加标实验,来测试理想的剂量和时机参数。对于生长实验,将在时间0、0.5、2、10、24和48小时采样。对于剂量实验,将在0小时的时间以及再次在3小时的时间时施用加标实验的第一剂量的处理。
体外透明质酸的收获和检测由于透明质酸极易溶于水,并由此易溶于多种培养基,因此不需要采取额外的步骤来评价由经验微生物组样品产生的自由浮动的透明质酸的水平。为了检测液体介质中的透明质酸,使用了ELISA检测试剂盒。
制剂载体的选择如在TO3中所做的,评估了多种载体与针对透明质酸的靶益生元的适当适用性。同样,鉴于brontide、角鲨烯和甘油的化学特性,可以再次将它们与HA一起使用。将针对培养物收集物通过ELISA筛选这些制剂的生存力、毒性、生长(微生物组健康相容性)和透明质酸产生。
如图29所示,透明质酸靶益生元(hTP)在微生物组的情况下诱导增加的后生元HA。载体影响所得的后生元产物。在适用的情况下,对3个微生物组群进行了宿主微生物组测定。对于那些适用的样品,给予1剂0.02%hTP。
构建用于HA产生的计算机模型对这些体外实验进行二次采样,以用于宏基因组学(N=15)和代谢组学(N=15)的每一个,因为已经具有来自TO3的宏基因组学和代谢组学培养物的基线。使用TO3中描述的方法,建立了集合及其功能的计算机模型。通过代谢组学结果来参数化关系。为了可用性,将模型限制为相关的透明质酸化合物和代谢组学数据集中的前25种化合物。同样,这些由早期经验数据参数化的模型可帮助理解实验的参数。
可能的结局和挑战:基于早期工作的早期概念证明,预计培养物中会产生透明质酸。期望透明质酸产生达到有效量(1%至5%)。此外,由于透明质酸是水溶性的,因此期望制剂测试将更加简单,并将提供一个微生物组友好的环境。即使有早期的体外研究努力,还不能完全确定这一过程中涉及的所有基因和机制。预计从测序和代谢组学工作的另外分析能力将产生更全面的表征(TO1,TO6)。此外,主要数据库上的测序注释也缺乏,但是很可能存在具有同源功能的蛋白质,因为已经在一小组培养物中看到在益生元(针对透明质酸)的存在下透明质酸增加的证据。
G3TO8:表明在离体和体内系统二者中均产生透明质酸
正如对TO3至TO6中的神经酰胺益生元所做的一样,在离体和人皮肤上检验了针对靶透明质酸的益生元的产生,以解决未来透明质酸益生元制剂的可行性、安全性和有效性的关键问题。
评价微生物组在离体系统中诱导透明质酸途径的能力为了确定由微生物组促进的靶透明质酸途径在体内是否有效,将首先需要用制剂、微生物组和人上皮细胞对其进行彻底测试。为了做到这一点,将利用在TO4中概述的宿主微生物组trans-well测定。该测定将确保在靶透明质酸益生元制剂存在的情况下,由于微生物组的相互作用,人细胞将获得更高浓度的透明质酸。
如图30中所示,用hTP ELISA进行的宿主微生物组(transwell)测定显示,在微生物组存在的情况下,HA后生元增加。所有测定都是一式三份进行的,并且对于使用微生物组群的测定,测试了N=3个群(也是一式三份)。
测试敏感性和刺激标志物使用TO5中的实验,将检验针对透明质酸后生元的益生元制剂如何影响人内皮角质形成细胞的敏感性、刺激和整体健康。
对来自靶益生元制剂的微生物组诱导的透明质酸进行体内皮肤测试
该目标的最后一个目的是调查消费者组群中透明质酸的产生,并随后确定该产生是否会产生积极的皮肤健康结局。还通过来源于拭子和PDMS斑贴测试方法的GCMS样品评价了透明质酸。
如图31中所示,离体细胞毒性实验表明,与载体或成分(如角鲨烷)相比,HA输入(hTP)的细胞毒性更低。在适用时使用N=3个微生物组群,所有实验一式三份进行。
示例范例-使用其诱导天然皮肤微生物组以产生靶后生元,直接有益于人健康和环境。靶益生元解决方案创造了天然、非常长效和有效的后生元。此外,从神经酰胺的第一成分益生元开始,已经展示了皮肤上产生的三种高分子量神经酰胺的初步数据(图10和27)。根据文献,这些特定的神经酰胺具有已知的抗黑素瘤化合物和减少疤痕的活性。
在产品中直接包含这些精确的后生元化合物在成本上令人望而却步,并且使用典型的生产方法大规模提供在技术上不可行,但是示例范例以低成本和有效水平产生了这些化合物。改变了对配制产品的经济学思考—以及可以使用的化合物。这代表了成分和产品的一次大的技术飞跃。进一步的开发电脑模型—使得能够检验载体中的益生元—以及它们对皮肤的最终作用。长期目标是了解人-微生物组皮肤系统,以便能够设计最大限度地在皮肤上表达有益化合物的产品。
此外,通过原位微生物组激发内源性天然化合物的能力开辟了探索另外的人健康和环境益处的整个领域。除了皮肤、肠,并且甚至在环境中,新产品和新工艺可以以经济有益、环保高效和安全的方式获取天然产品。

Claims (42)

1.方法,其包括:
通过包含一个或更多个计算装置的计算系统获得包括多个测序读段的测序数据,所述计算装置各自包含处理器和存储器,所述多个测序读段来源于多个样品;
通过所述计算系统聚集所述多个测序读段中多个单独的测序读段以产生聚集序列,所述聚集序列包含来源于从第一个体获得的多个样品中的第一样品的多个序列中的一个或更多个第一序列,以及来源于从第二个体获得的多个样品中的第二样品的多个序列中的一个或更多个第二序列;
通过所述计算系统分析一个或更多个基因组区以(i)确定对应于所述一个或更多个基因组区的一种或更多种酶,以及(ii)确定具有包含所述一个或更多个基因组区的相应基因组的一种或更多种生物体;
通过所述计算系统,基于对应于单独基因组区的一种或更多种酶中的至少一种酶,确定对应于所述一个或更多个基因组区中单独基因组区的生物化学途径,其中所述至少一种酶激活与所述生物化学途径相关的反应;
通过所述计算系统确定与所述生物化学途径相关的多种化合物,所述多种化合物至少包括第一化合物和第二化合物,所述第一化合物是所述生物化学途径的反应中的反应物,所述第二化合物是所述生物化学途径的反应中的产物;
通过所述计算系统,基于对应于所述单独基因组区的多个所述一个或更多个第一序列,确定存在于所述第一样品中的一种或更多种酶的第一酶量的第一度量;
通过所述计算系统基于所述第一酶量的第一度量确定所述反应物是用于治疗存在于一个或更多个第一个体中的一种或更多种生物学病症的候选益生元。
2.权利要求1所述的方法,其包括:
通过所述计算系统获得从所述第一样品获得的分析数据;以及
通过所述计算系统基于所述分析数据确定所述样品中所述反应物的第一丰度和所述产物的第二丰度;
其中基于所述样品中所述反应物的第一丰度和所述产物的第二丰度,所述反应物被确定为候选益生元。
3.权利要求2所述的方法,其中所述分析数据通过对所述第一样品和所述第二样品进行一种或更多种质谱操作获得。
4.权利要求1所述的方法,其包括:
通过所述计算系统获得包含多个附加测序读段的附加测序数据,所述多个附加测序读段来源于多个附加样品,所述多个附加样品包括对应于第一组环境条件的第一附加样品和对应于第二组环境条件的第二附加样品;
通过所述计算系统聚集所述多个附加测序读段中的多个单独的附加测序读段,以产生附加聚集序列;
通过所述计算系统分析所述附加聚集序列,以确定对应于所述附加聚集序列的一个或更多个附加基因组区;以及
通过所述计算系统分析所述一个或更多个附加基因组区以(i)确定对应于所述一个或更多个附加基因组区的一种或更多种附加酶,以及(ii)确定具有包含所述一个或更多个附加基因组区的相应基因组的一种或更多种附加生物体。
5.权利要求4所述的方法,其包括:
通过所述计算系统并基于所述附加聚集序列,确定存在于第一附加样品中的第一酶的第一量;
通过所述计算系统并基于所述附加聚集序列,确定存在于第二附加样品中的第一酶的第二量;以及
通过所述计算系统确定所述第一量与所述第二量之间的一个或更多个差值。
6.权利要求5所述的方法,其包括:
通过所述计算系统获得从所述第一附加样品获得的第一附加分析数据;
通过所述计算系统获得从所述第二附加样品获得的第二附加分析数据;以及
通过所述计算系统并基于所述第一附加分析数据,确定所述反应物的第一附加丰度和所述产物的第一附加丰度;
通过所述计算系统并基于所述第二附加分析数据,确定所述反应物的第二附加丰度和所述产物的第二附加丰度;
通过所述计算系统确定所述反应物的第一附加丰度与所述反应物的第二附加丰度之间的一个或更多个第一差值;以及
通过所述计算系统确定所述产物的第一附加丰度与所述产物的第二附加丰度之间的一个或更多个第二差值。
7.权利要求6所述的方法,其包括:
通过所述计算系统并基于所述聚集序列,确定存在于所述第一样品和所述第二样品中的多种生物体;
通过所述计算系统确定所述多种生物体中包含的生物体亚群。
8.权利要求7所述的方法,其包括:
通过所述计算系统获得来源于所述第一附加样品的第一附加分析数据;
通过所述计算系统并基于所述第一附加分析数据,确定所述第一附加样品中所述生物体亚群的第一附加丰度度量,单独的第一附加丰度度量对应于所述生物体亚群中包含的单独生物体的相应第一丰度度量;
通过所述计算系统获得来源于所述第二附加样品的第二附加分析数据;
通过所述计算系统并基于所述第二附加分析数据,确定所述第二附加样品中所述生物体亚群的第二附加丰度度量,单独的第二附加丰度度量对应于所述生物体亚群中包含的单独生物体的相应第二丰度度量;以及
通过所述计算系统确定所述第一附加丰度度量的至少一部分与所述第二附加丰度度量的至少一部分之间的一个或更多个差值。
9.权利要求8所述的方法,其包括:
通过所述计算系统确定(i)与(ii)之间的一种或更多种相关性,其中(i)为所述反应物的第一附加丰度与所述反应物的第二附加丰度之间的一个或更多个第一差值一个或更多个第一差值、或者所述产物的第一附加丰度与所述产物的第二附加丰度之间的一个或更多个第二差值中的至少一者,(ii)为所述第一附加丰度度量的至少一部分与所述第二附加丰度度量的至少一部分之间的一个或更多个差值。
10.权利要求9所述的方法,其中所述一种或更多种相关性使用一种或更多种贝叶斯网络技术确定。
11.权利要求9所述的方法,其中:
所述第一附加样品从包含第一制剂的第一环境收集,所述第一制剂包含第一量的所述反应物和用于所述反应物的第一载体物质;并且
所述第二附加样品从包含第二制剂的第二环境收集,所述第二制剂包含第二量的所述反应物和用于所述反应物的第二载体物质。
12.权利要求11所述的方法,其中所述反应物的第一量不同于所述反应物的第二量。
13.权利要求11所述的方法,其中用于所述反应物的第一载体物质不同于用于所述反应物的第二载体物质。
14.权利要求11所述的方法,其包括:
通过所述计算系统确定用于确定所述生物体亚群的丰度的一个或更多个函数,其中所述一个或更多个函数基于以下来确定:(a)所述第一制剂和所述第二制剂;以及(b)(i)与(ii)之间的一个或更多个差值,其中(i)为所述反应物的第一附加丰度与所述反应物的第二附加丰度之间的一个或更多个第一差值一个或更多个第一差值、或者所述产物的第一附加丰度与所述产物的第二附加丰度之间的一个或更多个第二差值中的至少一者,(ii)为所述第一附加丰度度量的至少一部分与所述第二附加丰度度量的至少一部分之间的一个或更多个差值。
15.权利要求14所述的方法,其包括:
通过所述计算系统产生实施所述一个或更多个函数的模型,所述模型具有对应于所述第一环境和所述第二环境内条件的多个参数。
16.权利要求15所述的方法,其包括:
通过所述计算系统获得对应于所述多个参数的条件值,所述条件值的至少一部分不同于对应于所述第一环境和所述第二环境的附加条件值;以及
通过所述计算系统执行所述模型,以确定所述生物体亚群中包含的生物体中至少一部分的丰度,其中所述丰度对应于所述条件值。
17.权利要求15所述的方法,其中所述模型使用一种或更多种人工神经网络产生。
18.权利要求1所述的方法,其中所述第一样品从第一个体的皮肤获得,并且所述第二样品从第二个体的皮肤获得。
19.权利要求18所述的方法,其中所述第一个体包括在第一表型之内,并且所述第二个体包括在第二表型之内。
20.权利要求19所述的方法,其中所述第一表型对应于就个体而言存在生物学病症,并且所述第二表型对应于就个体而言不存在生物学病症。
21.权利要求20所述的方法,其中所述生物学病症对应于与个体皮肤相关的异常。
22.系统,其包含:
一个或更多个硬件处理器;和
一个或更多个计算机可读存储介质,其包含计算机可读指令,所述计算机可读指令在被所述一个或更多个硬件处理器执行时进行包括以下的操作:
获得包括多个测序读段的测序数据,所述多个测序读段来源于多个样品;
聚集所述多个测序读段中的多个单独的测序读段以产生聚集序列,所述聚集序列包括来源于从第一个体获得的多个样品中的第一样品的多个序列中的一个或更多个第一序列,以及来源于从第二个体获得的多个样品中的第二样品的多个序列中的一个或更多个第二序列;
分析一个或更多个基因组区以(i)确定对应于所述一个或更多个基因组区的一种或更多种酶,以及(ii)确定具有包含所述一个或更多个基因组区的相应基因组的一种或更多种生物体;
基于对应于单独基因组区的一种或更多种酶中的至少一种酶,确定对应于所述一个或更多个基因组区中的单独基因组区的生物化学途径,其中所述至少一种酶激活与所述生物化学途径相关的反应;
确定与所述生物化学途径相关的多种化合物,所述多种化合物至少包括第一化合物和第二化合物,所述第一化合物是所述生物化学途径的反应中的反应物,所述第二化合物是所述生物化学途径的反应中的产物;
基于对应于所述单独基因组区的多个所述一个或更多个第一序列,确定存在于所述第一样品中的一种或更多种酶的第一酶量的第一度量;
基于所述第一酶量的第一度量,确定所述反应物是用于治疗存在于所述一个或更多个第一个体中的一种或更多种生物学病症的候选益生元。
23.权利要求22所述的系统,其中所述一个或更多个计算机可读存储介质包含附加计算机可读指令,所述附加计算机可读指令在被所述一个或更多个硬件处理器执行时进行包括以下的附加操作:
获得从所述第一样品获得的分析数据;以及
基于所述分析数据确定所述样品中所述反应物的第一丰度和所述产物的第二丰度;
其中基于所述样品中所述反应物的第一丰度和所述产物的第二丰度,所述反应物被确定为候选益生元。
24.权利要求23所述的系统,其中所述分析数据通过对所述第一样品和所述第二样品进行一种或更多种质谱操作获得。
25.权利要求22所述的系统,其中所述一个或更多个计算机可读存储介质包含附加计算机可读指令,所述附加计算机可读指令在被所述一个或更多个硬件处理器执行时进行包括以下的附加操作:
获得包含多个附加测序读段的附加测序数据,所述多个附加测序读段来源于多个附加样品,所述多个附加样品包括对应于第一组环境条件的第一附加样品和对应于第二组环境条件的第二附加样品;
聚集所述多个附加测序读段中的多个单独的附加测序读段,以产生附加聚集序列;
分析所述附加聚集序列,以确定对应于所述附加聚集序列的一个或更多个附加基因组区;以及
分析所述一个或更多个附加基因组区以(i)确定对应于所述一个或更多个附加基因组区的一种或更多种附加酶,以及(ii)确定具有包含所述一个或更多个附加基因组区的相应基因组的一种或更多种附加生物体。
26.权利要求25所述的系统,其中所述一个或更多个计算机可读存储介质包含附加计算机可读指令,所述附加计算机可读指令在被所述一个或更多个硬件处理器执行时进行包括以下的附加操作:
基于所述附加聚集序列确定存在于第一附加样品中的第一酶的第一量;
基于所述附加聚集序列确定存在于第二附加样品中的第一酶的第二量;以及
确定所述第一量与所述第二量之间的一个或更多个差值。
27.权利要求26所述的系统,其中所述一个或更多个计算机可读存储介质包含附加计算机可读指令,所述附加计算机可读指令在被所述一个或更多个硬件处理器执行时进行包括以下的附加操作:
获得从所述第一附加样品获得的第一附加分析数据;
获得从所述第二附加样品获得的第二附加分析数据;以及
基于所述第一附加分析数据,确定所述反应物的第一附加丰度和所述产物的第一附加丰度;
基于所述第二附加分析数据,确定所述反应物的第二附加丰度和所述产物的第二附加丰度;
确定所述反应物的第一附加丰度与所述反应物的第二附加丰度之间的一个或更多个第一差值;以及
确定所述产物的第一附加丰度与所述产物的第二附加丰度之间的一个或更多个第二差值。
28.权利要求27所述的系统,其中所述一个或更多个计算机可读存储介质包含附加计算机可读指令,所述附加计算机可读指令在被所述一个或更多个硬件处理器执行时进行包括以下的附加操作:
基于所述聚集序列确定存在于所述第一样品和所述第二样品中的多种生物体;
确定所述多种生物体中包含的生物体亚群。
29.权利要求28所述的系统,其中所述一个或更多个计算机可读存储介质包含附加计算机可读指令,所述附加计算机可读指令在被所述一个或更多个硬件处理器执行时进行包括以下的附加操作:
获得来源于所述第一附加样品的第一附加分析数据;
基于所述第一附加分析数据,确定所述第一附加样品中所述生物体亚群的第一附加丰度度量,单独的第一附加丰度度量对应于所述生物体亚群中包含的单独生物体的相应第一丰度度量;
获得来源于所述第二附加样品的第二附加分析数据;
基于所述第二附加分析数据,确定所述第二附加样品中所述生物体亚群的第二附加丰度度量,单独的第二附加丰度度量对应于所述生物体亚群中包含的单独生物体的相应第二丰度度量;以及
确定所述第一附加丰度度量的至少一部分与所述第二附加丰度度量的至少一部分之间的一个或更多个差值。
30.权利要求29所述的系统,其中所述一个或更多个计算机可读存储介质包含附加计算机可读指令,所述附加计算机可读指令在被所述一个或更多个硬件处理器执行时进行包括以下的附加操作:
确定(i)与(ii)之间的一种或更多种相关性,其中(i)为所述反应物的第一附加丰度与所述反应物的第二附加丰度之间的一个或更多个第一差值一个或更多个第一差值、或者所述产物的第一附加丰度与所述产物的第二附加丰度之间的一个或更多个第二差值中的至少一者,(ii)为所述第一附加丰度度量的至少一部分与所述第二附加丰度度量的至少一部分之间的一个或更多个差值。
31.权利要求30所述的系统,其中所述一种或更多种相关性使用一种或更多种贝叶斯网络技术确定。
32.权利要求30所述的系统,其中:
所述第一附加样品从包含第一制剂的第一环境收集,所述第一制剂包含第一量的所述反应物和用于所述反应物的第一载体物质;并且
所述第二附加样品从包含第二制剂的第二环境收集,所述第二制剂包含第二量的所述反应物和用于所述反应物的第二载体物质。
33.权利要求32所述的系统,其中所述反应物的第一量不同于所述反应物的第二量。
34.权利要求32所述的系统,其中用于所述反应物的第一载体物质不同于用于所述反应物的第二载体物质。
35.权利要求32所述的系统,其中所述一个或更多个计算机可读存储介质包含附加计算机可读指令,所述附加计算机可读指令在被所述一个或更多个硬件处理器执行时进行包括以下的附加操作:
确定用于确定所述生物体亚群的丰度的一个或更多个函数,其中所述一个或更多个函数基于以下来确定:(a)所述第一制剂和所述第二制剂;以及(b)(i)与(ii)之间的一个或更多个差值,其中(i)为所述反应物的第一附加丰度与所述反应物的第二附加丰度之间的一个或更多个第一差值一个或更多个第一差值、或者所述产物的第一附加丰度与所述产物的第二附加丰度之间的一个或更多个第二差值中的至少一者,(ii)为所述第一附加丰度度量的至少一部分与所述第二附加丰度度量的至少一部分之间的一个或更多个差值。
36.权利要求35所述的系统,其中所述一个或更多个计算机可读存储介质包含附加计算机可读指令,所述附加计算机可读指令在被所述一个或更多个硬件处理器执行时进行包括以下的附加操作:
产生实施所述一个或更多个函数的模型,所述模型具有对应于所述第一环境和所述第二环境内条件的多个参数。
37.权利要求36所述的系统,其中所述一个或更多个计算机可读存储介质包含附加计算机可读指令,所述附加计算机可读指令在被所述一个或更多个硬件处理器执行时进行包括以下的附加操作:
获得对应于所述多个参数的条件值,所述条件值的至少一部分不同于对应于所述第一环境和所述第二环境的附加条件值;以及
执行所述模型以确定所述生物体亚群中包含的生物体中至少一部分的丰度,其中所述丰度对应于所述条件值。
38.权利要求36所述的系统,其中所述模型使用一种或更多种人工神经网络产生。
39.权利要求22所述的系统,其中所述第一样品从第一个体的皮肤获得,并且所述第二样品从第二个体的皮肤获得。
40.权利要求39所述的系统,其中所述第一个体包括在第一表型之内,并且所述第二个体包括在第二表型之内。
41.权利要求40所述的系统,其中所述第一表型对应于就个体而言存在生物学病症,并且所述第二表型对应于就个体而言不存在生物学病症。
42.权利要求41所述的系统,其中所述生物学病症对应于与个体皮肤相关的异常。
CN202280031908.1A 2021-04-29 2022-04-29 基因组数据和分析数据的分析 Pending CN117279622A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163181821P 2021-04-29 2021-04-29
US63/181,821 2021-04-29
PCT/US2022/027148 WO2022232657A1 (en) 2021-04-29 2022-04-29 Analyzing genomics data and analytical data

Publications (1)

Publication Number Publication Date
CN117279622A true CN117279622A (zh) 2023-12-22

Family

ID=83847361

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280031908.1A Pending CN117279622A (zh) 2021-04-29 2022-04-29 基因组数据和分析数据的分析

Country Status (3)

Country Link
EP (1) EP4329724A1 (zh)
CN (1) CN117279622A (zh)
WO (1) WO2022232657A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2619526A (en) * 2022-06-07 2023-12-13 Rinocloud Ltd Computer implemented methods, apparatuses and program instructions for predicting changes in a skin microbiome

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060098657A (ko) * 2005-03-03 2006-09-19 한국과학기술연구원 생화학 경로의 모델링과 시뮬레이션 방법 및 시스템
US8099298B2 (en) * 2007-02-14 2012-01-17 Genelex, Inc Genetic data analysis and database tools
US9411930B2 (en) * 2013-02-01 2016-08-09 The Regents Of The University Of California Methods for genome assembly and haplotype phasing
US9523671B2 (en) * 2013-03-28 2016-12-20 Nestec S.A. Indoxyl sulfate as a biomarker of prebiotic efficacy for weight gain prevention
EP3005200A2 (en) * 2013-06-03 2016-04-13 Good Start Genetics, Inc. Methods and systems for storing sequence read data
KR20200110318A (ko) * 2017-12-04 2020-09-23 시벨레 마이크로바이옴, 인크. 표현형을 변경하는 마이크로바이옴 생화학적 경로의 확인 및 조정을 위한 방법 및 조성물

Also Published As

Publication number Publication date
EP4329724A1 (en) 2024-03-06
WO2022232657A1 (en) 2022-11-03

Similar Documents

Publication Publication Date Title
Garza et al. Towards predicting the environmental metabolome from metagenomics with a mechanistic model
Antonelli et al. Statistical workflow for feature selection in human metabolomics data
Mazandu et al. Function prediction and analysis of Mycobacterium tuberculosis hypothetical proteins
Yang et al. Direct MALDI-TOF MS identification of bacterial mixtures
US20120149584A1 (en) Methods of diagnosing and treating microbiome-associated disease using interaction network parameters
De Meulder et al. A computational framework for complex disease stratification from multiple large-scale datasets
Wu et al. Metagenomics biomarkers selected for prediction of three different diseases in Chinese population
Enjalbert et al. Physiological and molecular timing of the glucose to acetate transition in Escherichia coli
US20200202979A1 (en) Nasal-related characterization associated with the nose microbiome
Liu et al. Construction and analysis of gene co-expression networks in Escherichia coli
Wekesa et al. A hybrid prediction method for plant lncRNA-protein interaction
Du et al. A novel feature extraction scheme with ensemble coding for protein–protein interaction prediction
Bianchi et al. A combined proteomics, metabolomics and in vivo analysis approach for the characterization of probiotics in large-scale production
Mazandu et al. Using the underlying biological organization of the Mycobacterium tuberculosis functional network for protein function prediction
Greenwood et al. Feed and host genetics drive microbiome diversity with resultant consequences for production traits in mass-reared black soldier fly (Hermetia illucens) larvae
Zoledowska et al. Metabolic modeling of Pectobacterium parmentieri SCC3193 provides insights into metabolic pathways of plant pathogenic bacteria
CN117279622A (zh) 基因组数据和分析数据的分析
Widłak et al. Serum metabolite profiles in participants of lung cancer screening study; comparison of two independent cohorts
Franco et al. Lipidomic profiling of the epidermis in a mouse model of dermatitis reveals sexual dimorphism and changes in lipid composition before the onset of clinical disease
Pan et al. Gut microbial protein expression in response to dietary patterns in a controlled feeding study: A metaproteomic approach
Nedyalkova et al. Sequence-based prediction of plant allergenic proteins: machine learning classification approach
Wei et al. Exploring local discriminative information from evolutionary profiles for cytokine–receptor interaction prediction
US20190019575A1 (en) Nasal-related characterization associated with the nose microbiome
Murugaiyan et al. Pan-proteomic analysis and elucidation of protein abundance among the closely related Brucella species, Brucella abortus and Brucella melitensis
Wang et al. Predicting potential microbe–disease associations based on multi-source features and deep learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination