CN114174529A - Epi衰老:用于管理健康衰老的新型生态系统 - Google Patents

Epi衰老:用于管理健康衰老的新型生态系统 Download PDF

Info

Publication number
CN114174529A
CN114174529A CN202080054523.8A CN202080054523A CN114174529A CN 114174529 A CN114174529 A CN 114174529A CN 202080054523 A CN202080054523 A CN 202080054523A CN 114174529 A CN114174529 A CN 114174529A
Authority
CN
China
Prior art keywords
subject
dna
age
biological
dna methylation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080054523.8A
Other languages
English (en)
Inventor
戴维·车世瑞
莫西·希夫
黄志发
李慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hong Kong Precision Medicine Technology Ltd
Original Assignee
Hong Kong Precision Medicine Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hong Kong Precision Medicine Technology Ltd filed Critical Hong Kong Precision Medicine Technology Ltd
Publication of CN114174529A publication Critical patent/CN114174529A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Medical Informatics (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Wood Science & Technology (AREA)
  • Evolutionary Biology (AREA)
  • Zoology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Microbiology (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

提供了一种用于通过对生物标志物执行多基因DNA甲基化来计算受试者和跨多个受试者的生物年龄的方法,所述方法包括测量定位于ElovL2基因的推定反义区,即ElovL2 AS1区中的13个CG位点的甲基化状态。进一步地,提供了一种用于以自学习“生态系统”的形式提供针对生活方式改变的推荐的计算机实施的方法,所述自学习“生态系统”使用DNA甲基化时钟的新测量结果作为连续动态结果,以进行生物衰老的生活方式管理。还提供了一种用于计算生物年龄的DNA甲基化生物标志物的组合以及一种用于确定所述生物年龄的试剂盒。进一步地,公开了一种公开的用于计算生物年龄的方法在评估生物干预的效果的方法和筛选抗衰老剂的方法中的用途。

Description

EPI衰老:用于管理健康衰老的新型生态系统
相关申请的交叉引用
本申请根据第119(e)条要求于2019年5月29日提交的标题为“Epi衰老:用于管理健康衰老的新型生态系统(EpiAging:Novel Ecosystem for Managing Healthy Aging)”的美国临时申请序号62/854,226的优先权,每个美国临时申请的内容通过引用并入本文。
序列表
本申请含有序列表,所述序列表已经以ASCII格式电子提交,并且以全文引用的方式特此并入。创建于2020年5月28日的所述ASCII副本被命名为TPC57505_Seq List_ST25.txt并且大小为4,096字节。
技术领域
本发明总体上涉及人DNA中的表观遗传学和DNA甲基化特征,并且具体地涉及基于DNA甲基化特征确定个体的表观遗传衰老和管理健康衰老的方法。更具体地,本发明提供了一种涉及DNA甲基化特征的方法,以进行分子诊断、健康管理和生活方式改变,以用于使用App数字技术实现个性化健康衰老。
背景技术
实足年龄被理解为个体已经活着的年数,而生物年龄,也称为生理年龄,表示个体看起来有多大。因为人的衰老速率不同,所以确定个体的生物年龄是一项挑战。有些人“看起来”且“感觉”比实足年龄老,而其它人看起来比其实足年龄年轻。尽管人的实足年龄与生物年龄总体相关,但情况并非总是如此。与实足年龄相比,生物年龄是更好反映个体的健康、福祉和寿命的参数。作为生理年龄的等价物,生物年龄是包含饮食、运动、睡眠习惯等若干种生活方式因素的反映并受其影响。但是评估个体的生物年龄仍然是一项挑战。重要的是,估计真实生物年龄的需要是由这样的想法驱动的,即,这可能产生将减缓生物衰老速率的干预措施的测试和设计。在过去的几十年期间,已经投入了大量的努力来标识可以预测生物衰老和寿命的不同参数,如虚弱的量度(Ferrucci等人,2002)、头发变白、皮肤衰老(Yanai,Budovsky,Tacutu和Fraifeld,2011)、不同种类白细胞的水平。然而,发现这些标志物中的大多数并不比知道一个人的实足年龄更有优势。
最近,分子生物学的进展已经引入了新的衰老分子量度。“端粒长度”(Monaghan,2010)和“代谢量度”(Hertel等人,2016)已经用于预测生物年龄。然而,尽管端粒的长度随年龄而变化,但是发现实足年龄与端粒长度之间的相关性较弱,并且对寿命的预测能力较低。另外,用于测量端粒长度的技术在技术上要求很高,并且技术错误会混淆年龄的测定。已经使用的另一个量度是测量尿液中的不同代谢物的“代谢年龄评分”(Hertel等人,2016)。这种技术需要复杂的方法以用于测量不同的尿液成分。
随着Horvath发现“表观遗传时钟”(Horvath,2013),生物年龄标志物的研究已经发生了范式转变。此时钟基于对DNA中的353个CG位置处的DNA甲基化时钟的测量。已经发现,与包含端粒长度的任何先前量度以及头发、皮肤、虚弱等其它衰老量度相比,甲基化时钟中包含的基因的甲基化程度与一个人的实足年龄的相关性更强。更重要的是,尽管对于大多数人来说,DNA甲基化时钟与实足时钟非常接近,在某些人身上,所述时钟比实足时钟前进得更快,因此一个人的表观遗传年龄可能远远大于其实足时钟。最近的研究表明,DNA甲基化时钟中的这种进展预测了不同原因导致的过早死亡。最近对总计13,089人的13项不同研究的分析表明,表观遗传时钟能够独立于如年龄、体重指数(BMI)、教育、吸烟、身体活动、饮酒、吸烟和某些合并症等若干风险因素预测全因死亡率(Chen等人,2016)。
Figure BDA0003492186090000021
Pedersen和Hagg最近在《E生物医学(EBiomedicine)》发表的一篇综述总结道:“虽然端粒长度是研究最充分的生物年龄预测因子,但是许多新的预测因子正在出现,表观遗传时钟是目前最好的生物年龄预测因子,因为其与年龄和预测死亡率良好相关(
Figure BDA0003492186090000022
Pedersen和Hagg,2017)。端粒长度测量中的技术偏差也可能导致缺乏一致的结果。”作者总结道:“简而言之,端粒长度得到了广泛验证,但预测能力较低。复合生物标志物尚未得到充分验证,但是有可能成为比端粒更强的预测因子,代谢年龄评分也是如此。考虑到这两个方面,表观遗传时钟目前表现最好(
Figure BDA0003492186090000023
等人,2017)。”
Valentin Max Vetter等人在《柏林衰老研究(Berlin Aging Study)》II中对1895人进行了端粒长度和表观遗传时钟作为生物年龄量度的比较,得出的结论是,尽管“如先前所描述的,在BASE-II队列中,较年轻年龄组的端粒长度显著短于较年长年龄组,但在BASE-II中,端粒长度和实足年龄呈非常弱的负相关性(Rs 2=.013)”。相比之下,这项研究发现,“结果表明,在DNA甲基化(表观遗传时钟)年龄估计与实足年龄之间存在显著正相关性(R2sRs2=0.47),所述显著正相关性在调整协变量(性别、白细胞分布、酒精和吸烟)后仍然存在。”作者得出结论:“总之并且正如预期的那样,发现DNAm年龄是比端粒长度更准确的实足年龄的预测因子(Vetter等人,2018)。”
在苏格兰的两个出生队列的研究中,发现在组合队列分析中,端粒长度解释了2.8%的年龄差异,而表观遗传时钟解释了34.5%的年龄差异。在同一研究中,也是在组合队列分析中,基线表观遗传年龄中一个标准偏差增加与死亡率风险增加25%相关,而在同一模型中,基线端粒长度中一个标准偏差增加与死亡率风险减少11%独立相关(P<0.047)(Marioni等人,2018)。
尽管越来越明显的是,“表观遗传时钟”是迄今为止最准确的生物年龄量度,但是可用的测试需要使用作为有创且高成本的样品的血液对大量位点进行测试,这不适用于大量患者消费者触发的使用。尽管可用的方法足以进行研究和临床相关研究,但是对于以消费者为中心的此测试的使用来说,这是不可行的。因此,需要准确稳健高通量且无创的测试。
本发明以系统的形式提供了问题的解决方案,所述系统在整个健康生态系统内使用新的CG位点集成准确稳健的基于唾液的“Epi衰老测试”,以用于使用与计算机可读介质集成的基于消费者且可行的表观遗传时钟的重复测试进行自学习、自赋能的健康衰老,所述计算机可读介质可替代地被称为应用程序(App),所述应用程序能够实现数据收集和与消费者的通信、数据共享和机器学习技术。目前的方法是高成本的(需要对跨不同基因组的许多CG位点进行DNA甲基化分析)且有创的(使用血液)并且是独立的,并且没有提供用于改善年龄评分的指导。尽管医学文献中推荐了对健康有积极影响的行为的一般概念,但是可能对特定人有用的生活方式改变的确切个性化组合是未知的。本发明公开了一种将使用唾液的基于消费者的“DNA甲基化年龄测试”与App引导的健康和生活方式管理环境集成的系统,所述系统组合了消费者通过App管理的健康方式干预的数据共享、机器学习和个性化。数据完全被设盲且只在消费者之间共享,并且没有其它外部方。消费者共享数据的动机是他/她通过参与共享社区而获得更高质量的改善其健康的建议的事实,因此,通过获得更高质量的生活方式评估和推荐,将共享数据的益处动态地且重复地递送给消费者。
发明目的
本发明的主要目的涉及一种用于计算受试者的生物年龄的方法,所述方法包括以下步骤:从受试者的底物中提取DNA;测量来自所述底物的经提取的DNA中的DNA甲基化以获得DNA甲基化谱;分析所述DNA甲基化谱以获得多基因评分;以及根据所述多基因评分确定所述受试者的所述生物年龄,其中所述提取DNA包括从获自所述受试者的唾液或血液中提取基因组DNA。
本发明的另外的目的涉及一种计算受试者的生物年龄的方法,所述生物年龄从多基因评分得出,所述多基因评分是从针对多基因DNA甲基化生物标志物进行的经测量的DNA甲基化谱中获得的,所述方法包括测量人CG位点中的任何一个和其组合内的CG位点的甲基化状态,所述人CG位点定位于如SEQ ID NO:1中所示的ElovL2基因的推定反义区,即ElovL2AS1区中。
本发明的另一个目的涉及一种用于计算跨多个受试者的生物年龄的方法,所述方法包括以下步骤:从来自多个受试者的多个底物中提取DNA;测量来自多个底物的经提取的DNA中的DNA甲基化以获得DNA甲基化谱;分析所述DNA甲基化谱以获得多基因评分;以及根据所述多基因评分决定跨多个受试者的所述生物年龄,其中所述提取DNA包括从获自多个受试者的唾液或血液中提取基因组DNA。
本发明的又另一个目的涉及一种用于决定受试者的生物年龄的试剂盒,所述试剂盒包括:用于从所述受试者收集底物并使所述底物稳定的装置和试剂;用于读取所述试剂盒上条形码的扫描仪;以及用于收集所述底物并使所述底物稳定的说明书,其中所述底物是受试者的唾液或血液,并且其中所述使底物稳定是用于邮寄所收集的底物以提取DNA,以便测量来自所述底物的经提取的DNA中的DNA甲基化以获得所述受试者的DNA甲基化谱,从而决定所述受试者的生物年龄。
本发明的仍另一个目的涉及一种用于提供针对生活方式改变的推荐的计算机实施的方法,所述方法包括以下步骤:评估计算机可读介质中的如通过共享来自受试者的用户数据而获得的条目;将所述条目与如从所述受试者获得的用于决定受试者的所述生物年龄的试剂盒相匹配以用于决定所述受试者的所述生物年龄;使用所述用于计算受试者的生物年龄的方法或所述用于计算跨多个受试者的生物年龄的方法计算受试者的所述生物年龄,以获得经计算的生物年龄;通过使用对计算机可读介质中的如通过共享来自受试者的用户数据而获得的条目的评估执行统计分析,在机器学习模型中整合针对所述受试者的所述经计算的生物年龄,以获得经整合的数据报告;通过分析所述经整合的数据报告以及如通过共享来自所述受试者的用户数据而获得的问卷答复随时间推移的进展并将所述经整合的数据报告和所述问卷答复与国家协会的推荐进行比较来为所述受试者准备动态报告;以及与所述受试者在所述计算机可读介质上共享所述动态报告,以提供针对生活方式改变的推荐。
本发明的替代性目的涉及一种用于开发计算机可读介质的方法,所述方法包括以下步骤:存储从多个受试者得出的数据;分析所存储的数据;以及构建模型,其中所述存储从多个用户得出的数据的步骤包括基于云的SQL数据库,其中所述分析所述所存储的数据的步骤包括选自深度机器学习、强化学习和机器学习或其组合的组,并且其中所述构建模型的步骤包括使输入问卷测量结果和作为输出的DNA甲基化年龄与实足年龄之间的差值以及如疼痛、血压、BMI和情绪等其它生理和心理输出相关。
发明内容
因此,本发明提供了可用于通过以下方法基于生物年龄的计算评估年龄的进展、生活方式的影响以及提供关于生活方式改变的个性化生活方式推荐的方法和材料:在来自受试者或跨多个受试者的底物中从包含血液和唾液的底物中提取的DNA中的底物中分析位于对针对ElovL2基因的反义mRNA进行编码的基因的上游(ElovL2 AS1区)的CG位点或CG位置的DNA甲基化。
本发明的实施例涉及一种用于计算受试者的生物年龄的方法,所述方法包括以下步骤:从受试者的底物中提取DNA;测量来自所述底物的经提取的DNA中的DNA甲基化以获得DNA甲基化谱;分析所述DNA甲基化谱以获得多基因评分;以及根据所述多基因评分确定所述受试者的所述生物年龄,其中所述提取DNA包括从获自所述受试者的唾液或血液中提取基因组DNA。
由于本发明发现年龄的进展与位于或定位于对针对ElovL2基因的反义mRNA进行编码的基因的上游区(被称为ElovL2 AS1区)的CG位置或CG位点的甲基化高度相关,因此,本发明的另一个实施例涉及一种用于计算受试者的生物年龄的方法,其中所述方法包括测量DNA甲基化的步骤,所述步骤是针对多基因DNA甲基化生物标志物执行的,所述方法包括测量如表1中所描述的人CG位点中的任何一个内的CG位点的甲基化状态,所述表1提供了如本文所公开的出现在人6号染色体上的CG位置和其组合,所述位置定位于如SEQ ID NO:1中所示的ElovL2基因的推定反义区,即ElovL2 AS 1区中。本发明发现,此区的靶向扩增子测序揭示了如表1中所描述的上述13个新型CG位点组合,所述表1提供了如SEQ ID NO:1中所示的ElovL2 AS 1区中的如本文所公开的出现在人6号染色体上的CG位置,所述位置的甲基化与唾液中的生物年龄高度相关。本发明中的线性回归方程揭示了这些位点随年龄的回归系数,其中这些位点的组合加权方程准确地预测了生物年龄。
本发明的实施例公开了一种用于计算跨多个受试者的生物年龄的方法,所述方法包括以下步骤:从来自多个受试者的多个底物中提取DNA;测量来自多个底物的经提取的DNA中的DNA甲基化以获得DNA甲基化谱;分析所述DNA甲基化谱以获得多基因评分;以及根据所述多基因评分决定跨多个受试者的所述生物年龄,其中所述提取DNA包括从获自受试者的唾液或血液中提取基因组DNA。本发明公开了一种通过在单个下一代Miseq测序反应中扩增靶特异性引物顺序、然后是条形码引物,并且进行多路复用测序、数据提取和甲基化定量,通过确定如表1中所描述的CG位点的多基因组中的DNA甲基化来同时在数百人中准确测量唾液中的DNA甲基化年龄的方法,所述表1提供了如SEQ ID NO:1中所示的ElovL2 AS1区中的如本文所公开的出现在人6号染色体上的CG位置。本发明还公开了使用焦磷酸测序决定或甲基化特异性PCR或数字PCR对如表1中所描述的所述DNA甲基化CG位点的甲基化的测量,所述表1提供了如SEQ ID NO:1中所示的ElovL2 AS 1区中的如本文所公开的出现在人6号染色体上的CG位置。本发明公开了预测年龄的多基因加权甲基化评分的计算。
本发明的实施例公开了一种用于决定受试者的生物年龄的试剂盒,所述试剂盒包括:用于从所述受试者收集底物并使所述底物稳定的装置和试剂;用于读取所述试剂盒上条形码的扫描仪;以及用于收集所述底物并使所述底物稳定的说明书,其中所述底物是受试者的唾液或血液,并且其中所述使底物稳定是用于邮寄所收集的底物以提取DNA,以便测量来自所述底物的经提取的DNA中的DNA甲基化以获得所述受试者的DNA甲基化谱,从而决定所述受试者的生物年龄。
本发明的实施例公开了一种用于提供针对生活方式改变的推荐的计算机实施的方法,所述方法包括以下步骤:评估计算机可读介质中的如通过共享来自受试者的用户数据而获得的条目;将所述条目与如本文所描述并从所述受试者中获得的试剂盒相匹配,以用于确定所述受试者的生物年龄;使用如本文所描述的所述用于计算受试者的生物年龄的方法或所述用于计算跨多个受试者的生物年龄的方法计算受试者的所述生物年龄,以获得经计算的生物年龄;通过使用对计算机可读介质中的条目的评估执行统计分析,在机器学习模型中整合针对所述受试者的所述经计算的生物年龄,以获得经整合的数据报告;通过分析所述经整合的数据报告以及如通过共享来自所述受试者的用户数据而获得的问卷答复随时间推移的进展并将所述经整合的数据报告和所述问卷答复与国家协会的推荐进行比较来为所述受试者准备动态报告;以及与所述受试者在所述计算机可读介质上共享所述动态报告,以提供针对生活方式改变的推荐。因此,本发明公开了如本文所公开的计算机实施的方法,这是使用计算机可读介质将唾液中的生物年龄的重复DNA甲基化年龄测量与动态生活方式改变相整合的新型过程,所述计算机可读介质可替代地被称为管理这些改变的App。由于DNA甲基化年龄确定只需要唾液,本发明的公开的方法通过计算机可读介质或App提供了消费者发起的测试顺序,将唾液吐入唾液收集试剂盒,然后将所述唾液收集试剂盒邮寄到实验室以用于DNA提取试剂盒,随后进行DNA甲基化分析。生活方式的改变记录在App中;甲基化数据以及生活方式数据被捕获在数据库中,并且通过如神经网络等机器学习程序进行连续和迭代的分析。
本发明的实施例公开了一种用于开发计算机可读介质的方法,所述方法包括以下步骤:存储从多个受试者得出的数据;分析所存储的数据;以及构建模型,其中所述存储从多个用户得出的数据的步骤包括基于云的SQL数据库,其中所述分析所述所存储的数据的步骤包括选自深度机器学习、强化学习和机器学习或其组合的组,并且其中所述构建模型的步骤包括使输入问卷测量结果和作为输出的DNA甲基化年龄与实足年龄之间的差值以及如疼痛、血压、BMI和情绪等其它生理和心理输出相关。连续分析多个消费者共享的数据以构建模型,所述模型使输入的生活方式改变与通过如本发明所公开的方法提供的DNA甲基化年龄或生物年龄与实足年龄之间的差异的输出相关。如本文所公开的模型应用于个人数据,并且所述模型得出关于个人生活方式改变的推荐。如本文所公开的输入生活方式改变和输出DNA甲基化年龄或生物年龄被迭代地测量并且用于进一步强化学习,同时向消费者的App播送另外的建议。
本发明提供了可以由本领域技术人员用来测量生物年龄以及生活方式改变与DNA甲基化年龄之间的关系的方法。如表1中所描述的DNA甲基化标志物(CGID)可用于消费者发起的基于唾液的测试,所述测试用于确定DNA甲基化衰老或生物年龄,以及用于使用“共享”App或计算机可读介质和机器学习系统报告和修改生活方式参数,所述表1描绘了如本文所公开的SEQ ID NO:1中所示的新发现的基因ElovL2 AS1中的人6号染色体的上游区中的所选CG位置,本发明可用于消费者发起的基于唾液的测试。本发明被证明可用于基于本文所公开的DNA甲基化测量方法使用多基因评分或通过使用本领域技术人员可用的用于测量DNA甲基化的其它方法来测量“生物年龄”,所述DNA甲基化测量方法包含同时对跨数百名个体或受试者进行如本文所公开的SEQ ID NO:1中所示的反义ELOVL2 AS1区的靶向扩增子测序,所述其它方法如下一代亚硫酸氢盐测序、焦磷酸测序、MeDip测序、离子激流测序、Illumina 450K阵列和Epic微阵列。本发明还公开了本发明的效用,用于使用本文所公开的“Epi衰老”App将DNA甲基化测量结果整合到生活方式改变的综合计划内,所述App可以由本领域技术人员使用如Build Fire JS、Ionic、Appcelerator的Titanium SDK、Mobileangular UI和Siberian CMS等开源和其它程序开发。本领域任何技术人员都可以处理的数据将存储在如MySQL等数据库中,存储在如Azure云或亚马逊云等云服务器中。数据将通过如神经网络等机器学习平台使用本领域技术人员可用的如张量流或R统计等开源程序进行分析。本发明公开了本发明在向客户提供动态“个性化”报告以及可能影响其健康衰老的生活方式改变的组合的推荐方面的效用。本发明还公开了“Epi衰老”DNA甲基化测试和App用于通过在推荐的生活方式改变之前和之后发送唾液来测量DNA甲基化年龄,从而测量干预对其生物年龄的影响的效用。
对于本领域技术人员而言,本发明的其它目标、特征和优点将根据以下详细描述而变得显而易见。然而,要理解,尽管指示本发明的一些实施例,但是详细描述和具体实例通过说明性而非限制性方式给出。可以在不脱离其精神的情况下在本发明的范围内进行许多改变和修改,并且本发明包含所有此类修改。
附图说明
图1.由于被称为ElovL2 AS 1区的ElovL2基因的上游反义区中的CG位点的DNA甲基化与年龄相关。描绘了在CG位点周围的人基因组区和如在本文所公开的表1中所描述的ElovL2 AS1区两个CG,即cgl6867657和cg21572722的位置的IGV浏览器视图。公开可用的Illumina450K阵列中的血细胞基因组中CGID的甲基化状态与年龄之间的皮尔逊(Pearson)相关性揭示,顶部CG是cgl6867657,其中皮尔逊积矩相关性系数r=0.934(p=0),并且相邻位点cg21572722与年龄的相关系数为r=0.81004(p=0),描绘了已经发现的CG位点的甲基化状态与ElovL2 AS 1区中的年龄相关。对此CG的基因组位置的检查揭示,所述基因组位置是位于先前未表征的区,即ElovL2反义基因ElovL2 AS1区的13个CG(已指示)序列的成员。
图2.ElovL2 AS1区CG位点与唾液中的年龄高度相关。描绘了ElovL2 AS1区中的CG位点的加权甲基化水平的甲基化评分与公开可用的血液Illumina 450K阵列(GSE40279,n=656和GSE2219,n=60)中的年龄之间的相关性,所述CG位点即如定位于6号染色体中的cgl6867657、cg21572722和如定位于1号染色体中的cg09809672(参见表1的基因组中的位置)。分析揭示了跨所有年龄的甲基化与年龄之间的强相关性。
图3.ElovL2 AS1区CG位点处的甲基化与唾液中的年龄的相关性,以及与Horvath表观遗传时钟的比较。描绘了ElovL2 AS1区CG位点,即cgl687657和cg21572722处的甲基化与唾液中的年龄的相关性,以及其与Horvath表观遗传时钟的比较。A.使用来自GSE78874唾液的DNA甲基化谱的cgl687657和cg21572722(HKG)的组合甲基化评分与年龄之间的相关性。B.使用相同Illumina 450K数据的黄金标准Horvath甲基化时钟评分之间的相关性。C.两个测试的准确度的比较。与黄金标准Horvath时钟相比,这两个位点的综合评分在预测年龄方面的平均偏差较低。
图4.使用13CG ElovL2 AS1多基因评分预测唾液中的年龄。描绘了本发明的效用。A.使用来自65人唾液DNA的甲基化水平,用预测年龄的线性回归方程计算的预测年龄的甲基化评分随ElovL2 AS1区中的CG位点1、5、6、9(针对基因组中的位置,参见表1)的加权甲基化水平的变化。如图1中所描述的ElovL2 AS1区从亚硫酸氢盐转化的唾液DNA中扩增,并且在Miseq下一代测序仪上进行多路复用下一代测序。B.用预测年龄的线性回归方程计算的预测年龄的甲基化评分随ElovL2 AS1区中的CG位点1、2、5、6、9(针对基因组中的位置,参见表1)的加权甲基化水平的变化。C.用预测年龄的线性回归方程计算的预测年龄的甲基化评分随ElovL2 AS1区中的CG位点1、2(针对基因组中的位置,参见表1)的加权甲基化水平的变化。用预测年龄的线性回归方程计算的预测年龄的甲基化评分随ElovL2 AS1区中的所有CG位点(针对基因组中的位置,参见表1)的加权甲基化水平的变化。E.不同甲基化评分的预测值的比较。包含所有13个CG位点的方程优于任何其它组合。
图5.Epi衰老App。描绘了Epi衰老App的主页。
图6.基于Epi衰老App的健康生态系统。描绘了Epi衰老App的效用;以及数据引导的生活方式管理。健康生态系统的中心是Epi衰老App。App允许客户了解DNA甲基化、生物衰老、营养补充剂。app允许客户输入生活方式、心血管健康、情绪、营养、睡眠性别和疼痛数据。app允许客户通过市场订购唾液测试试剂盒。唾液试剂盒通过邮寄方式递送,并且客户扫描条形码,所述条形码为客户分配将电话ID与测试ID链接的ID。客户通过预付费邮寄将唾液试剂盒寄往实验室。来自实验室的甲基化年龄数据和迭代生活方式数据从App和实验室播送到SQL编程数据库。类似地,其它客户将其生活方式数据和DNA甲基化数据发送到数据库。机器学习算法使用深度学习和迭代输入数据来分析数据。计算定义每个输入在确定结果时的权重的模型。通过模型分析个人数据,并且将生活方式的预测要改变结果(δDNA甲基化-实足年龄)的改变递送到App。基于相对于实足年龄的DNA甲基化年龄的改变方向和范围,客户用迭代分析和另外的推荐进行生活方式改变并且订购新的唾液测试,并且本身循环重复。
图7.健康epi生态系统。描绘了健康epi生态系统和其在健康衰老中的效用。Epi衰老App将自己定位于健康生态系统的中心。其允许从著名的国家医学协会实时递送健康建议。创建针对健康提供者和生活方式产品的市场以及针对不同的新型测试的市场。app将数据发送到通用数据服务器,所述通用数据服务器迭代地分析所有信息,并且基于分析提供有关生活方式改变的推荐、可能要进行的测试以及健康提供者和供应商信息。
具体实施方式
在各实施例的描述中,可以对形成描述的一部分的图进行参考,并且在所述附图中,通过图解的方式示出了可以实践本发明的具体实施例。应当理解,在不脱离本发明的范围的情况下,可以利用其它实施例并且可以做出结构的改变。本领域的技术人员良好地理解且通常采用本文所描述或所参考的许多技术和程序。除非另外定义,否则本文所使用的所有技术术语、符号和其它科学术语或专用词旨在具有本发明所属领域的技术人员通常理解的含义。在一些情况下,为了清楚和/或便于参考起见,本文对具有通常理解的含义的术语进行了定义,并且本文中包含这些定义不应被必然解释为代表与本领域通常理解的含义有实质性差异。
附图的所有说明都是为了描述本发明的所选版本,而不是为了限制本发明的范围。
本文所提及的所有公开都通过引用并入本文,以公开和描述与引用公开相关的方面、方法和/或材料。
DNA甲基化是指对DNA分子的化学修饰。已经发现如Illumina Infinium微阵列或基于DNA测序的方法等技术平台对人的DNA甲基化水平进行高度稳健且可重复的测量。人基因组中有超过2800万个CpG或CG基因座。因此,某些基因座被赋予了唯一标识符,如在Illumina CpG或CG基因座数据库中发现的标识符。本文使用CG基因座指定标识符。
定义:
如本文所使用的,术语“CG”是指DNA中的含有胞嘧啶和鸟苷碱基的二核苷酸序列。如本文所使用的,被称为“CG位点”的CG位置是人基因组中的由参考人基因组hgl9中的染色体和核苷酸位置定义的位置。
如本文所使用的,术语“β值”是指通过使用以下对Illumina 450K或EPIC阵列进行归一化和定量而得出的CGID位置处的甲基化水平的计算:甲基化探针与未甲基化探针之间的强度比以及公式:β值=甲基化C强度/(甲基化C强度+未甲基化C强度),所述值介于0与1之间,其中0是完全未甲基化的,并且1是完全甲基化的。
如本文所使用的,术语“决策树”是选自最能预测要解释的应答或结果的许多变量和变量之间的相互作用中的数据挖掘算法类型(Mann等人,2008)。
如本文所使用的,术语“随机森林”是可以选择在确定给定结果或应答时最重要的变量的数据挖掘算法类型(Shi,Seligson,Belldegrun,Palotie和Horvath,2005;Svetnik等人,2003)。
如本文所使用的,术语“套索回归”是用于线性回归模型的变量选择的方法,所述方法鉴定预测具有最小预测错误的结果(应答变量)所需的预测因子的最小子集(Kim,Kim,Jeong,Jeong和Kim,2018)。
如本文所使用的,术语“K均值聚类分析”是将观察结果划分成较小的一组聚类的无监督机器学习方法,其中每个观察结果属于一个聚类(Beauchaine和Beauchaine,2002;Kakushadze和Yu,2017)。
如本文所使用的,术语“强化学习”涉及从数据分析中接收反馈,并且通过反复试验进行学习。一系列成功的决策将导致过程的强化(Zhao,Kosorok和Zeng,2009)。
如本文所使用的,术语“惩罚回归”是指旨在鉴定从更大的生物标志物列表中预测结果所需的最小数量的预测因子的统计方法,如例如在如Goeman,J.J.所描述的R统计包“惩罚”中所实施的,L1惩罚了Cox比例风险模型中的估计(L1 penalized estimation inthe Cox proportional hazards model),《生物统计学杂志(Biometrical Journal)》52(1),70-84。
如本文所使用的,术语“聚类”是指以这样的方式对一组对象进行分组,即同一组中的对象(被称为聚类)比其它组(聚类)中的对象彼此之间更类似(在某种意义上或另一种意义上)。
如本文所使用的,术语“神经网络和深度学习”是指将神经网络并入在若干层中以迭代方式从数据中学习的机器学习方法。神经网络将如生活方式变量等不同的数据输入视为被称为人工神经元的连接单元或节点的集合,所述人工神经元与脑中的神经元一样具有多种相互作用(De Roach,1989;Mupparapu,Wu和Chen,2018;Sherbet,Woo和Dlay,2018)。这些相互作用驱动生物衰老的输出,测量为相对于实足年龄的加速或减速。
如本文所使用的,术语“多个或多基因线性回归”是指估计如多个CG ID中的甲基化百分比等多个“自变量”或“预测因子”和如实足年龄等“因变量”之间的关系的统计方法。当模型中包含如CG ID等若干“自变量”时,此方法确定在预测“结果”(如年龄等因变量)时的每个CG ID的“权重”或系数。
如本文所使用的,术语“皮尔逊相关性”是指估计如CG ID中的甲基化百分比等“自变量”或“预测因子”与如实足年龄等“因变量”之间的相关性的统计方法。皮尔逊积矩相关系数r定量地权衡了指示无相关性的0与指示完全相关性的1之间的相关性(Hardy和Magnello,2002)。
目前公开的方法基于人基因组中的发现的甲基化状态与年龄相关的位点,所述位点是通过在可用公共数据集(GSE61496,GSE98876)中对基因组中的跨450K位点进行一系列年龄与DNA甲基化之间的皮尔逊相关性来发现的,并且使用来自GSE40729的数据验证了如此发现的DNA甲基化标志物。所述分析将cgl6867637鉴定为与年龄相关的最高位点(r=0.934827,p=0)。本发明在6号染色体上发现了人基因组的片段,所述片段是先前描述的年龄相关的ElovL2基因的反义序列,含有在本文中被称为CG位点的13个CG的ElovL2 AS1区所述CG位点是如本文所公开的如下表1中所描述的二核苷酸序列的位置,所述位置的在多元线性回归方程中计算的组合甲基化量度提供唾液中的生物年龄的多基因评分,其中与先前报道的基因组中的位置相比,准确度更高。这些位点先前没有描述,因为其没有包含在Illumina阵列中。因此,本发明公开了新型CG位点,所述新型CG位点的组合加权甲基化水平与年龄相关。本发明在本文进一步证明,通过扩增单个扩增子并使用索引的下一代测序同时测量数百人,可以准确地测量所有13个CG位点的甲基化,从而通过使用本文所公开的“Epi衰老”测试来降低成本并增加通量。受试者或客户订购唾液收集试剂盒,将唾液吐入试剂盒收集管并且将试剂盒发送回实验室,在所述实验室提取DNA,通过亚硫酸氢盐进行转化,并且扩增ElovL2 AS1区和索引。来自200名受试者的扩增子在相同的Miseq反应中进行测序。分析FastQ文件并且确定13个CG位点处的甲基化水平。使用将13个CG位点的加权甲基化值与年龄相关联的方程,计算生物年龄并且与客户共享。
本发明进一步公开并且解决了当前公开的方法在以动态方式计算生物年龄时的效用,以便通过推荐生活方式改变来改善客户的健康衰老。本发明公开了可以从多个生活方式变量之间的关系以及DNA甲基化年龄与生物改变之间的差异的“机器学习”中得出有效的干预。由于生活方式数据和甲基化年龄数据或生物年龄是从多个受试者/用户中动态地收集的,机器学习生活方式参数变化的组合如何与DNA甲基化与生物年龄之间的增加或减少的差异相关。本发明将DNA甲基化测试与以受试者/消费者为中心的分享、学习和生活方式改变相整合。受试者/消费者使用本发明中的如本文所公开的Epi衰老App或计算机可读介质订购并且传达其生活方式决策。改善健康是双向伙伴关系和协作努力,而不是从“博学的无所不知者”的健康专业人员(健康提供者)到“顺从”且被动的患者(健康消费者)的单向指令流。使用Epi衰老App向消费者呈现如从最著名的国家医学协会中提炼出的最佳科学建议。消费者决定采取哪些推荐。消费者使用“全盲的”App分享决策。消费者收到与其手机ID链接的ID,但是对如地址、姓名、电子邮件等个人信息进行了“防火墙”操作。重复分析多个用户的个人干预和结果以及DNA甲基化年龄测试结果,从而整合生理结果和心理结果。使用如神经网络等最先进的机器学习算法,使用例如张量流分析数据。构建了将不同输入参数和DNA甲基化年龄与实足年龄之间的输出δ相关的模型。消费者的个人数据与模型一起使用,并且用于调整的建议是个性化的并且递送给消费者。本发明提供了用于产生受科学启发不断进步的动态推荐模型的宏大平台。本发明提出了随着不断扩展的数据体的使用而动态地改进的“进化”平台。如本发明所公开的,客户的福祉以及学习环境两者在DNA甲基化测试、生活方式改变、共享数据和机器学习之间的动态相互作用中共同进化。
本文所公开的本发明具有多个实施例。在本发明的一个方面中,本发明提供了用于健康衰老的生活方式管理的生物年龄的多基因DNA甲基化标志物,所述多基因DNA甲基化标志物集是使用年龄与跨基因组的全基因组DNA甲基化上的DNA甲基化之间的相关性的皮尔逊相关性分析得出的,所述全基因组DNA甲基化是通过作图方法得出的,如Illumina450K或850K阵列、使用各种下一代测序平台的全基因组亚硫酸氢盐测序、甲基化DNA免疫沉淀(MeDIP)测序或与寡核苷酸阵列杂交或这些方法的组合。
在一个实施例中,本发明提供了一种用于计算受试者的生物年龄的方法,所述方法包括以下步骤:(a)从来自所述受试者的底物中提取DNA;(b)测量来自所述底物的经提取的DNA中的DNA甲基化以获得DNA甲基化谱;(c)分析所述DNA甲基化谱以获得多基因评分;以及(d)根据所述多基因评分测定所述受试者的所述生物年龄,其中所述提取DNA包括从获自所述受试者的唾液或血液中提取基因组DNA。如本文所公开的用于计算受试者的生物年龄的方法,其中所述测量DNA甲基化是使用包括以下的方法执行的:DNA焦磷酸测序、基于质谱(EpityperTM)的甲基化测定、基于PCR的甲基化测定、在选自HiSeq、MiniSeq、MiSeq和NextSeq测序仪的组的平台上进行的靶向扩增子下一代亚硫酸氢盐测序、Ion Torrent测序、甲基化DNA免疫沉淀(MeDIP)测序或与寡核苷酸阵列杂交。如本文所公开的用于计算受试者的生物年龄的方法,其中所述测量DNA甲基化是针对多基因DNA甲基化生物标志物执行的,所述方法包括测量人CG位点和其组合的任何一个内的CG位点的甲基化状态,所述CG位点是如本文所公开的如下表1中所描述的二核苷酸序列的位置,所述位置定位于如SEQ IDNO:1
Figure BDA0003492186090000101
Figure BDA0003492186090000102
中所示的人6号染色体中的ElovL2基因的反义区,即ElovL2 AS1区中。
表1:具有与如SEQ ID NO:1中所示的反义ElovL2基因上游的13个CG位点ElovL2AS1区相对应的CG甲基化位点(CG位点)并且可用于本发明的实施例的位置。
如本申请所包含的表1中发现的在本文各个实施例中使用的CG位点中的所选13个CG二核苷酸在人基因组中的位置,所述表1还提供了在本申请的附图和实例中使用的在1号染色体中的CG位置。
Figure BDA0003492186090000111
*NA表示不可用
在一个实施例中,本发明提供了一种用于计算受试者的生物年龄的方法,所述方法包括以下步骤:(a)从来自所述受试者的底物中提取DNA;(b)测量来自所述底物的经提取的DNA中的DNA甲基化以获得DNA甲基化谱;(c)分析所述DNA甲基化谱以获得多基因评分;以及(d)根据所述多基因评分测定所述受试者的所述生物年龄,其中所述提取DNA包括从获自所述受试者的唾液或血液中提取基因组DNA,所述测量DNA甲基化是使用DNA焦磷酸测序执行的,所述DNA焦磷酸测序包括如SEQ ID NO:2(AGGGGAGTAGGGTAAGTGAG)中所示的正向生物素化引物、如SEQ ID NO:3(ACCATTTCCCCCTAATATATACTT)中所示的反向引物以及如SEQ IDNO:4(GGGAGGAGATTTGTAGGTTT)中所示的焦磷酸测序引物等引物。
在一个实施例中,本发明使用如本文所公开的引物和由制造商(Pyromark,凯杰公司)推荐的焦磷酸测序反应的标准条件,提供了使用含有CG位点和其组合的ElovL2 AS 1区对DNA甲基化年龄进行DNA焦磷酸测序甲基化测定的用途,所述位点是如本文公开的如表1中所描述的二核苷酸序列的位置,其中引物包括如SEQ ID NO:2中所示的正向(生物素化)引物、如SEQ ID NO:3中所示的Elovl2_Rv引物和如SEQ ID NO:4中所示的Elovl2_Seq引物。
在一个实施例中,本发明提供了一种用于计算受试者的生物年龄的方法,所述方法包括以下步骤:(a)从来自所述受试者的底物中提取DNA;(b)测量来自所述底物的经提取的DNA中的DNA甲基化以获得DNA甲基化谱;(c)分析所述DNA甲基化谱以获得多基因评分;以及(d)根据所述多基因评分测定所述受试者的所述生物年龄,其中所述提取DNA包括从获自所述受试者的唾液或血液中提取基因组DNA,其中所述测量DNA甲基化是使用在选自HiSeq、MiniSeq、MiSeq和NextSeq测序仪的组的平台上进行的靶向扩增子下一代亚硫酸氢盐测序执行的,所述靶向扩增子下一代亚硫酸氢盐测序包括如SEQ ID NO:5
(ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNYGGGYGGYGATTTGTAGGTTTAGT)中所示的正向引物和如SEQ ID NO:6
(GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCCCTACACRATACTACTTCTCCCC)中所示的反向引物等引物。
在一个实施例中,本发明提供了多基因多路复用扩增子亚硫酸氢盐测序DNA甲基化测定的用途,其用于通过使用含有CG位点和其组合的ElovL2 AS 1区来测量唾液中的DNA甲基化年龄,所述CG位点是如本文所公开的如表1中所描述的二核苷酸序列的位置,其使用如本文所公开的引物和涉及以下的标准条件:亚硫酸氢盐转化;包括使用:(a)靶特异性引物(PCR1)和(b)条形码引物(PCR 2)的顺序扩增;和单个下一代Miseq测序仪(Illumina)中的多路复用测序;使用Illumina软件的多路分解;使用用于甲基化分析包含Methylkit的标准方法的数据提取和甲基化定量;随后计算加权DNA甲基化评分以用于计算受试者的生物年龄,其中靶特异性引物(PCR 1)是如SEQ ID NO:5(ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNYGGGYGGYGATTTGTAGGTTTAGT)中所示的正向引物和如SEQ ID NO:6(GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCCCTACACRATACTACTTCTCCCC)中所示的反向引物,并且其中条形码引物(PCR 2)是如SEQ ID NO:7(AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGAC)中所示的正向引物以及如SEQ ID NO:8(CAAGCAGAAGACGGCATATACGAGATAGTACATCGGTGACTGGAGTTCAGACGTG)示的反向引物,即条形码索引引物。在如本文所公开的SEQ ID NO:5ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNYGGGYGGYGATTTGTAGGTTTAGT中,黑色碱基(1-45)是衔接子,并且红色碱基(46-62)是靶向序列。在如本文所公开的SEQ ID NO:6GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCCCTACACRATACTACTTC TCCCC中,黑色碱基(1-34)是衔接子,并且红色碱基(35-58)是靶向序列。在如本文所公开的SEQ ID NO:8,条形码引物CAAGCAGAAGACGGCATACGAGATAGTCATCGGTGACTGGAGTTCAGACGTG中,红色碱基(25-32)为索引;使用此索引的至多200个变体。
在一个实施例中,本发明提供了一种用于计算受试者的生物年龄的方法,所述方法包括以下步骤:(a)从来自所述受试者的底物中提取DNA;(b)测量来自所述底物的经提取的DNA中的DNA甲基化以获得DNA甲基化谱;(c)分析所述DNA甲基化谱以获得多基因评分;以及(d)根据所述多基因评分测定所述受试者的所述生物年龄,其中所述测量DNA甲基化是使用选自甲基化特异性PCR和数字PCR的组的基于PCR的甲基化测定执行的。
在一个实施例中,本发明提供了一种用于计算受试者的生物年龄的方法,所述方法包括以下步骤:(a)从来自所述受试者的底物中提取DNA;(b)测量来自所述底物的经提取的DNA中的DNA甲基化以获得DNA甲基化谱;(c)分析所述DNA甲基化谱以获得多基因评分;以及(d)根据所述多基因评分测定所述受试者的所述生物年龄,其中所述分析所述DNA甲基化谱以获得多基因评分包括使用多元线性回归方程或神经网络分析。
在一个实施例中,本发明提供了一种用于计算跨多个受试者的生物年龄的方法,所述方法包括以下步骤:(a)从来自多个受试者的多个底物中提取DNA;(b)测量来自多个底物的经提取的DNA中的DNA甲基化以获得DNA甲基化谱;(c)分析所述DNA甲基化谱以获得多基因评分;以及根据所述多基因评分测定跨多个受试者的所述生物年龄,其中所述提取DNA包括从获自所述受试者的唾液或血液中提取基因组DNA。
在一个实施例中,本发明提供了一种用于计算跨多个受试者的生物年龄的方法,所述方法包括以下步骤:(a)从来自多个受试者的多个底物中提取DNA;(b)测量来自多个底物的经提取的DNA中的DNA甲基化以获得DNA甲基化谱;(c)分析所述DNA甲基化谱以获得多基因评分;以及根据所述多基因评分测定跨多个受试者的所述生物年龄,其中所述提取DNA包括从获自所述受试者的唾液或血液中提取基因组DNA,并且其中所述测量来自多个底物的所述经提取的DNA中的DNA甲基化包括以下步骤:(i)用靶特异性引物扩增从所述多个底物中提取的基因组DNA,以获得PCR产物1;(ii)通过条形码引物扩增步骤(i)的所述PCR产物1,以获得PCR产物2;(iii)使用步骤(ii)的所述PCR产物2在单个下一代Miseq测序反应中执行多路复用测序;(iv)从步骤(iii)的所述多路复用测序中提取数据;以及根据步骤(iv)的经提取的数据对DNA甲基化进行定量,以获得每个底物的DNA甲基化谱。在替代性实施例中,本发明提供了一种用于计算跨多个受试者的生物年龄的方法,其中用于获得PCR产物1的所述靶特异性引物包括如SEQ ID NO:5(ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNYGGGYGGYGATTTGTAGGTTTAGT)中所示的正向引物和如SEQ ID NO:6(GTGACTGGAGTTCAGACGTGTGCTGCTCTTCCGATCTCCCTACACRATACTACTTCTCCCC)引物等引物,并且其中用于获得PCR产物2的所述条形码引物包括如SEQ ID NO:7(AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGAC)中所示的正向引物和如SEQ ID NO:8(CAAGCAGAAGACGGCATACGAGATAGTCATCGGTGACTGGAGTTCAGACGTG)示的反向引物等引物,所述反向引物是条形码索引引物。
在一个实施例中,本发明提供了一种用于计算生物年龄的DNA甲基化生物标志物的组合,其中所述DNA甲基化生物标志物的所述组合包括人CG位点和其组合,所述人CG位点定位于如SEQ ID NO:1中所示的ElovL2基因的推定反义区,即ElovL2 AS 1区中。在本发明的一个实施例中,描绘了定位于如SEQ ID NO:1中所示的ElovL2基因的推定反义区,即ElovL2AS1区中的13个CG位点,所述位点可以单独或组合使用以作为生物年龄的量度。在一个实施例中,本发明提供CG位点和其组合的用途,所述位点是如本发明所公开的如表1中所描述的二核苷酸序列的位置。
在一个实施例中,本发明提供了一种用于测定受试者的生物年龄的试剂盒,所述试剂盒包括:用于从所述受试者收集底物并使所述底物稳定的装置和试剂;用于读取所述试剂盒上条形码的扫描仪;以及用于收集所述底物并使所述底物稳定的说明书,其中所述底物是受试者的唾液或血液,并且其中所述使底物稳定是用于邮寄所收集的底物以提取DNA,以便测量来自所述底物的经提取的DNA中的DNA甲基化以获得所述受试者的DNA甲基化谱,从而测定所述受试者的生物年龄。在替代性实施例中,本发明提供了一种用于测定受试者的生物年龄的试剂盒,其中试剂盒是唾液收集试剂盒,客户或受试者订购试剂盒,将唾液吐入试剂盒收集管中,通过DNA提取试剂盒将所述试剂盒收集管邮寄到实验室,随后进行DNA甲基化分析。在一个实施例中,本发明提供了一种用于从客户中收集唾液样品的试剂盒,所述试剂盒包括用于从客户收集底物并使所述底物稳定的装置和试剂。在一个实施例中,本发明提供了一种试剂盒,所述试剂盒包括用于CG位点和其组合的DNA甲基化测量的装置和试剂,所述位点是如本本文所公开的如表1中所描述的二核苷酸序列的位置。
在一个实施例中,本发明提供了一种用于管理DNA甲基化年龄测试订购、提交、接收检测结果和生活方式管理的应用程序(App)。在一个实施例中,使用开源开发工具来开发App,以含有关于测试的信息、用于订购测试的虚拟购物车、用于扫描唾液试剂盒条形码的扫描功能以及用于从实验室接收测试结果的功能。在一个实施例中,本发明提供要包含在App中的问卷,所述问卷将探索可能影响“健康衰老”的生活方式功能,所述问卷包含基本生理量度、体重、身高、血压、心率等、情绪自我评估、麦吉尔疼痛问卷(McGill painquestionnaire)、饮食和营养问卷、运动问卷以及包含酒精、药物和吸烟的生活方式问题以及其组合。在一个实施例中,所述方法包括对针对问卷的应答执行统计分析,并且在App上向消费者提供动态报告,所述动态报告描述了与如癌症、心脏和中风以及糖尿病等国家协会的推荐相比,针对问卷的应答随时间推移的进展。
在一个实施例中,本发明提供了将从多个用户中得出的数据存储在基于云的SQL数据库中,并且使用“机器学习”用于分析数据,以及构建模型,所述模型使输入问卷测量结果和作为输出的DNA甲基化年龄与实足年龄之间的差值以及如疼痛、血压、BMI和情绪等其它生理和心理输出相关。在另外的实施例中,如本文所公开的其中机器学习选自一组“深度机器学习”数据挖掘方法的本发明包含以下:神经网络;或通过利用来自消费者的反馈强化最有效的生活方式改变的“强化学习”;或包含“随机森林”分析的“机器学习”数据挖掘算法;或包含K均值聚类分析的“机器学习”数据挖掘算法;或包含亚马逊机器学习(AML)的“机器学习”平台;或包含如在阿帕奇海杜普分布式文件系统(Apache Hadoop DistributedFile system)、亚马逊EC2谷歌计算引擎和微软Azure等平台上的H2O.ai产品的“机器学习”软件。
在一个实施例中,本发明提供了一种用于针对生活方式改变提供推荐的计算机实施的方法,所述方法包括以下步骤:(a)评估计算机可读介质中的如通过共享来自受试者的用户数据而获得的条目;(b)将步骤(a)的所述条目与如用于测定受试者的所述生物年龄的试剂盒相匹配,所述试剂盒包括用于从所述受试者收集底物并使所述底物稳定的装置和试剂;用于读取所述试剂盒上条形码的扫描仪;以及用于收集所述底物并使所述底物稳定的说明书,其中所述底物是受试者的唾液或血液,并且其中所述使底物稳定是用于邮寄所收集的底物以提取DNA,以便测量来自所述底物的经提取的DNA中的DNA甲基化以获得所述受试者的DNA甲基化谱,从而测定所述受试者的生物年龄;(c)使用所述方法计算受试者的所述生物年龄,所述方法包括:(i)从来自所述受试者的底物中提取DNA;(ii)测量来自所述底物的经提取的DNA中的DNA甲基化以获得DNA甲基化谱;(iii)分析所述DNA甲基化谱以获得多基因评分;以及(iv)根据所述多基因评分测定所述受试者的所述生物年龄,其中所述提取DNA包括从获自受试者的唾液或血液中提取基因组DNA以获得经计算的生物年龄;(d)通过使用步骤(a)的评估执行统计分析,在机器学习模型中整合步骤(c)的针对所述受试者的所述经计算的生物年龄,以获得经整合的数据报告;(e)通过分析步骤(d)的所述经整合的数据报告以及如通过共享来自所述受试者的用户数据而获得的问卷答复随时间推移的进展并将所述经整合的数据报告和所述问卷答复与国家协会的推荐进行比较来为所述受试者准备动态报告;以及(f)与所述受试者在所述计算机可读介质上共享步骤(e)的所述动态报告,以提供针对生活方式改变的推荐。在另外的实施例中,本发明提供了一种用于提供针对生活方式改变的推荐的计算机实施的方法,其中所述计算机可读介质包括开源开发工具以含有以下:关于测试的信息,所述测试用于基于如本文所公开的方法计算生物年龄;用于订购所述测试的虚拟购物车;用于扫描如本文所公开的用于确定受试者的所述生物年龄的试剂盒的条形码的扫描功能;用于从实验室接收测试结果的功能,并且其中所述开源开发工具包括问卷,所述问卷包含在所述计算机可读介质中以探索影响健康衰老的生活方式功能,所述问卷包含基本生理量度、体重、身高、血压、心率、情绪自我评估、麦吉尔疼痛问卷、饮食和营养问卷、运动问卷以及包含酒精、药物和吸烟的生活方式问题以及其组合。
在替代性实施例中,本发明提供了一种用于针对生活方式改变提供推荐的计算机实施的方法,所述方法包括以下步骤:(a)评估计算机可读介质中的如通过共享来自受试者的用户数据而获得的条目;(b)将步骤(a)的所述条目与如用于测定受试者的所述生物年龄的试剂盒相匹配,所述试剂盒包括用于从所述受试者收集底物并使所述底物稳定的装置和试剂;用于读取所述试剂盒上条形码的扫描仪;以及用于收集所述底物并使所述底物稳定的说明书,其中所述底物是受试者的唾液或血液,并且其中所述使底物稳定是用于邮寄所收集的底物以提取DNA,以便测量来自所述底物的经提取的DNA中的DNA甲基化以获得所述受试者的DNA甲基化谱,从而测定所述受试者的生物年龄;(c)使用所述方法计算受试者的所述生物年龄,所述方法包括:(i)从来自多个受试者的多个底物中提取DNA;(ii)测量来自多个底物的经提取的DNA中的DNA甲基化以获得DNA甲基化谱;(iii)分析所述DNA甲基化谱以获得多基因评分;以及(iv)根据所述多基因评分测定跨多个受试者的所述生物年龄,其中所述提取DNA包括从获自受试者的唾液或血液中提取基因组DNA以获得经计算的生物年龄;(d)通过使用步骤(a)的评估执行统计分析,在机器学习模型中整合步骤(c)的针对所述受试者的所述经计算的生物年龄,以获得经整合的数据报告;(e)通过分析步骤(d)的所述经整合的数据报告以及如通过共享来自所述受试者的用户数据而获得的问卷答复随时间推移的进展并将所述经整合的数据报告和所述问卷答复与国家协会的推荐进行比较来为所述受试者准备动态报告;以及(f)与所述受试者在所述计算机可读介质上共享步骤(e)的所述动态报告,以提供针对生活方式改变的推荐。在另外的实施例中,本发明提供了一种用于提供针对生活方式改变的推荐的计算机实施的方法,其中所述计算机可读介质包括开源开发工具以含有以下:关于测试的信息,所述测试用于基于如本文所公开的方法计算生物年龄;用于订购所述测试的虚拟购物车;用于扫描如本文所公开的用于确定受试者的所述生物年龄的试剂盒的条形码的扫描功能;用于从实验室接收测试结果的功能,并且其中所述开源开发工具包括问卷,所述问卷包含在所述计算机可读介质中以探索影响健康衰老的生活方式功能,所述问卷包含基本生理量度、体重、身高、血压、心率、情绪自我评估、麦吉尔疼痛问卷、饮食和营养问卷、运动问卷以及包含酒精、药物和吸烟的生活方式问题以及其组合。
在又另一个替代性实施例中,本发明提供了一种用于针对生活方式改变提供推荐的计算机实施的方法,所述方法包括以下步骤:(a)评估计算机可读介质中的如通过共享来自受试者的用户数据而获得的条目;(b)将步骤(a)的所述条目与如用于测定受试者的所述生物年龄的试剂盒相匹配,所述试剂盒包括用于从所述受试者收集底物并使所述底物稳定的装置和试剂;用于读取所述试剂盒上条形码的扫描仪;以及用于收集所述底物并使所述底物稳定的说明书,其中所述底物是受试者的唾液或血液,并且其中所述使底物稳定是用于邮寄所收集的底物以提取DNA,以便测量来自所述底物的经提取的DNA中的DNA甲基化以获得所述受试者的DNA甲基化谱,从而测定所述受试者的生物年龄;(c)使用所述方法计算受试者的所述生物年龄,所述方法包括:(i)从来自多个受试者的多个底物中提取DNA;(ii)测量来自多个底物的经提取的DNA中的DNA甲基化以获得DNA甲基化谱;(iii)分析所述DNA甲基化谱以获得多基因评分;(iv)根据所述多基因评分测定跨多个受试者的所述生物年龄,其中所述提取DNA包括从获自受试者的唾液或血液中提取基因组DNA以获得经计算的生物年龄,其中所述测量来自多个底物的所述经提取的DNA中的DNA甲基化包括以下步骤:(1)用靶特异性引物扩增从所述多个底物中提取的基因组DNA,以获得PCR产物1;(2)通过条形码引物扩增步骤(1)的所述PCR产物1,以获得PCR产物2;(3)使用步骤(2)的所述PCR产物2在单个下一代Miseq测序反应中执行多路复用测序;(4)从步骤(3)的所述多路复用测序中提取数据;(5)根据步骤(d)的经提取的数据对DNA甲基化进行定量,以获得每个底物的DNA甲基化谱,(d)通过使用步骤(a)的评估执行统计分析,在机器学习模型中整合步骤(c)的针对所述受试者的所述经计算的生物年龄,以获得经整合的数据报告;(e)通过分析步骤(d)的所述经整合的数据报告以及如通过共享来自所述受试者的用户数据而获得的问卷答复随时间推移的进展并将所述经整合的数据报告和所述问卷答复与国家协会的推荐进行比较来为所述受试者准备动态报告;以及(f)与所述受试者在所述计算机可读介质上共享步骤(e)的所述动态报告,以提供针对生活方式改变的推荐。在另外的实施例中,本发明提供了一种用于提供针对生活方式改变的推荐的计算机实施的方法,其中所述计算机可读介质包括开源开发工具以含有以下:关于测试的信息,所述测试用于基于如本文所公开的方法计算生物年龄;用于订购所述测试的虚拟购物车;用于扫描如本文所公开的用于确定受试者的所述生物年龄的试剂盒的条形码的扫描功能;用于从实验室接收测试结果的功能,并且其中所述开源开发工具包括问卷,所述问卷包含在所述计算机可读介质中以探索影响健康衰老的生活方式功能,所述问卷包含基本生理量度、体重、身高、血压、心率、情绪自我评估、麦吉尔疼痛问卷、饮食和营养问卷、运动问卷以及包含酒精、药物和吸烟的生活方式问题以及其组合。
在一个实施例中,本发明提供了一种用于针对生活方式改变提供推荐的计算机实施的方法,所述方法包括以下步骤:(a)评估计算机可读介质中的如通过共享来自受试者的用户数据而获得的条目;(b)将步骤(a)的所述条目与如用于测定受试者的所述生物年龄的试剂盒相匹配,所述试剂盒包括用于从所述受试者收集底物并使所述底物稳定的装置和试剂;用于读取所述试剂盒上条形码的扫描仪;以及用于收集所述底物并使所述底物稳定的说明书,其中所述底物是受试者的唾液或血液,并且其中所述使底物稳定是用于邮寄所收集的底物以提取DNA,以便测量来自所述底物的经提取的DNA中的DNA甲基化以获得所述受试者的DNA甲基化谱,从而测定所述受试者的生物年龄;(c)使用如本文所公开的用于计算受试者的生物年龄的方法来计算受试者的所述生物年龄;(d)通过使用步骤(a)的评估执行统计分析,在机器学习模型中整合步骤(c)的针对所述受试者的所述经计算的生物年龄,以获得经整合的数据报告;(e)通过分析步骤(d)的所述经整合的数据报告以及如通过共享来自所述受试者的用户数据而获得的问卷答复随时间推移的进展并将所述经整合的数据报告和所述问卷答复与国家协会的推荐进行比较来为所述受试者准备动态报告;以及(f)与所述受试者在所述计算机可读介质上共享步骤(e)的所述动态报告,以提供针对生活方式改变的推荐,其中所述方法包括使用安卓(Android)或苹果(Apple)或微信(WeChat)小程序进行个性化生活方式推荐,从而创建专注于使受试者的生物衰老正常化或减缓的健康生态系统,或者使用跨多个受试者的如云数据预处理等标准数据工作流和管理系统将数据存储在包含亚马逊(Amazon)、阿里云(Ali cloud)或微软Azure(Microsoft Azure)的服务器或云服务器中的企业级对象存储装置中。在另外的实施例中,本发明提供了一种用于提供针对生活方式改变的推荐的计算机实施的方法,其中所述方法包括使用一组人工智能算法计算不同生活方式量度对受试者或跨多个受试者的所述生物年龄的加权贡献,所述一组人工智能算法如随机森林(RF)、支持向量机(SVM)、线性判别分析(LDA)、广义线性模型(GLM)和深度学习(DL),所述加权贡献被动态更新以提供关于生活方式改变的个性化生活方式推荐。
在一个实施例中,本发明提供了一种用于针对生活方式改变提供推荐的计算机实施的方法,所述方法包括以下步骤:(a)评估计算机可读介质中的如通过共享来自受试者的用户数据而获得的条目;(b)将步骤(a)的所述条目与如用于测定受试者的所述生物年龄的试剂盒相匹配,所述试剂盒包括用于从所述受试者收集底物并使所述底物稳定的装置和试剂;用于读取所述试剂盒上条形码的扫描仪;以及用于收集所述底物并使所述底物稳定的说明书,其中所述底物是受试者的唾液或血液,并且其中所述使底物稳定是用于邮寄所收集的底物以提取DNA,以便测量来自所述底物的经提取的DNA中的DNA甲基化以获得所述受试者的DNA甲基化谱,从而测定所述受试者的生物年龄;(c)使用如本文所公开的用于计算跨多个受试者的生物年龄的方法来计算受试者的所述生物年龄;(d)通过使用步骤(a)的评估执行统计分析,在机器学习模型中整合步骤(c)的针对所述受试者的所述经计算的生物年龄,以获得经整合的数据报告;(e)通过分析步骤(d)的所述经整合的数据报告以及如通过共享来自所述受试者的用户数据而获得的问卷答复随时间推移的进展并将所述经整合的数据报告和所述问卷答复与国家协会的推荐进行比较来为所述受试者准备动态报告;以及(f)与所述受试者在所述计算机可读介质上共享步骤(e)的所述动态报告,以提供针对生活方式改变的推荐,其中所述方法包括使用安卓(Android)或苹果(Apple)或微信(WeChat)小程序进行个性化生活方式推荐,从而创建专注于使受试者的生物衰老正常化或减缓的健康生态系统,或者使用跨多个受试者的如云数据预处理等标准数据工作流和管理系统将数据存储在包含亚马逊(Amazon)、阿里云(Ali cloud)或微软Azure(Microsoft Azure)的服务器或云服务器中的企业级对象存储装置中。在另外的实施例中,本发明提供了一种用于提供针对生活方式改变的推荐的计算机实施的方法,其中所述方法包括使用一组人工智能算法计算不同生活方式量度对受试者或跨多个受试者的所述生物年龄的加权贡献,所述一组人工智能算法如随机森林(RF)、支持向量机(SVM)、线性判别分析(LDA)、广义线性模型(GLM)和深度学习(DL),所述加权贡献被动态更新以提供关于生活方式改变的个性化生活方式推荐。
在一个实施例中,本发明提供了一种用于开发计算机可读介质的方法,所述方法包括以下步骤:(a)存储从多个受试者得出的数据;(b)分析步骤(a)的所存储的数据;以及(c)以及构建模型,其中所述存储从多个用户得出的数据的步骤包括基于云的SQL数据库,其中所述分析所述所存储的数据的步骤包括选自深度机器学习、强化学习和机器学习或其组合的组,并且其中所述构建模型的步骤包括使输入问卷测量结果和作为输出的DNA甲基化年龄与实足年龄之间的差值以及如疼痛、血压、BMI和情绪等其它生理和心理输出相关。在另外的实施例中,本发明提供了一种用于开发计算机可读介质的方法,其中所述机器学习包括选自以下的组:包括随机森林分析的数据挖掘算法、或包括K-均值聚类分析的数据挖掘算法、或包括亚马逊机器学习(AML)的平台、或包含阿帕奇海杜普分布式文件系统、亚马逊EC2谷歌计算引擎和微软Azure的平台上的包括H2O.ai产品的软件或其组合。
在一个实施例中,本发明提供了一种用于计算受试者的生物年龄的方法,所述方法包括以下步骤:(a)从来自所述受试者的底物中提取DNA;(b)测量来自所述底物的经提取的DNA中的DNA甲基化以获得DNA甲基化谱;(c)分析所述DNA甲基化谱以获得多基因评分;以及(d)根据所述多基因评分测定所述受试者的所述生物年龄,其中所述提取DNA包括从获自受试者的唾液或血液中提取基因组DNA,所述方法用于评估生物干预对受试者的所述生物年龄的影响的方法中,所述方法包括以下步骤:(i)使用如本文所公开的方法计算受试者的所述生物年龄,以在生物干预之前获得初始生物年龄;(ii)对所述受试者执行生物干预;(iii)在已经执行步骤(ii)之后,对从所述受试者获得的后续底物重复所述步骤(i),以在所述生物干预之后获得所述生物年龄;(iv)在所述生物干预之后,在机器学习模型中整合针对所述受试者的所述生物年龄,以评估所述生物干预对所述受试者的所述生物年龄的影响,其中步骤(ii)的所述生物干预选自营养补充剂、维生素、疗法、测试物质的施用、饮食操纵、代谢操纵、外科手术操纵、社交操纵、行为操纵、环境操纵、感觉操纵、激素操纵和表观遗传操纵或其组合的组,其中所述提取DNA包括从获自受试者的唾液或血液中提取基因组DNA,并且其中在所述生物干预之后,所述在机器学习模型中整合针对所述受试者的所述生物年龄包括在步骤(iii)中评估的所述生物年龄和通过共享来自所述受试者的用户数据而获得的生理参数。
在一个实施例中,本发明提供了一种用于计算跨多个受试者的生物年龄的方法,所述方法包括以下步骤:(a)从来自多个受试者的多个底物中提取DNA;(b)测量来自多个底物的经提取的DNA中的DNA甲基化以获得DNA甲基化谱;(c)分析所述DNA甲基化谱以获得多基因评分;以及根据所述多基因评分测定跨多个受试者的所述生物年龄,其中所述提取DNA包括从获自受试者的唾液或血液中提取基因组DNA,所述方法用于评估生物干预对受试者的所述生物年龄的影响的方法中,所述方法包括以下步骤:(i)使用如本文所公开的方法计算受试者的所述生物年龄,以在生物干预之前获得初始生物年龄;(ii)对所述受试者执行生物干预;(iii)在已经执行步骤(ii)之后,对从所述受试者获得的后续底物重复所述步骤(i),以在所述生物干预之后获得所述生物年龄;(iv)在所述生物干预之后,在机器学习模型中整合针对所述受试者的所述生物年龄,以评估所述生物干预对所述受试者的所述生物年龄的影响,其中步骤(ii)的所述生物干预选自营养补充剂、维生素、疗法、测试物质的施用、饮食操纵、代谢操纵、外科手术操纵、社交操纵、行为操纵、环境操纵、感觉操纵、激素操纵和表观遗传操纵或其组合的组,其中所述提取DNA包括从获自受试者的唾液或血液中提取基因组DNA,并且其中在所述生物干预之后,所述在机器学习模型中整合针对所述受试者的所述生物年龄包括在步骤(iii)中评估的所述生物年龄和通过共享来自所述受试者的用户数据而获得的生理参数。
在一个实施例中,本发明提供了一种用于计算受试者的生物年龄的方法,所述方法包括以下步骤:(a)从来自所述受试者的底物中提取DNA;(b)测量来自所述底物的经提取的DNA中的DNA甲基化以获得DNA甲基化谱;(c)分析所述DNA甲基化谱以获得多基因评分;以及(d)根据所述多基因评分测定所述受试者的所述生物年龄,其中所述提取DNA包括从获自受试者的唾液或血液中提取基因组DNA,所述方法用于筛选作为抗衰老剂的药剂的方法中,所述方法包括以下步骤:(i)使用如本文所公开的方法计算从受试者中获得的底物的年龄,以在生物干预之前获得初始生物年龄;(ii)向所述受试者施用测试剂;(iii)在已经执行步骤(ii)之后,对从所述受试者获得的后续底物重复所述步骤(i),以在所述施用所述测试剂之后获得所述生物年龄;(iv)在所述施用所述测试剂之后,在机器学习模型中整合针对所述受试者的所述生物年龄,以评估已经通过在机器学习模型中进行的整合计算出年龄的减少,以便将所述测试剂确定为所述受试者的抗衰老剂,其中所述提取DNA包括从获自受试者的唾液或血液中提取基因组DNA,并且其中在所述施用所述测试剂之后,所述在机器学习模型中整合针对所述受试者的所述生物年龄包括在步骤(iii)中评估的所述生物年龄和通过共享来自所述受试者的用户数据而获得的生理参数。
在一个实施例中,本发明提供了一种用于计算跨多个受试者的生物年龄的方法,所述方法包括以下步骤:(a)从来自多个受试者的多个底物中提取DNA;(b)测量来自多个底物的经提取的DNA中的DNA甲基化以获得DNA甲基化谱;(c)分析所述DNA甲基化谱以获得多基因评分;以及根据所述多基因评分测定跨多个受试者的所述生物年龄,其中所述提取DNA包括从获自受试者的唾液或血液中提取基因组DNA,所述方法用于筛选作为抗衰老剂的药剂的方法中,所述方法包括以下步骤:(i)使用如本文所公开的方法计算从受试者中获得的底物的年龄,以在生物干预之前获得初始生物年龄;(ii)向所述受试者施用测试剂;(iii)在已经执行步骤(ii)之后,对从所述受试者获得的后续底物重复所述步骤(i),以在所述施用所述测试剂之后获得所述生物年龄;(iv)在所述施用所述测试剂之后,在机器学习模型中整合针对所述受试者的所述生物年龄,以评估已经通过在机器学习模型中进行的整合计算出年龄的减少,以便将所述测试剂确定为所述受试者的抗衰老剂,其中所述提取DNA包括从获自受试者的唾液或血液中提取基因组DNA,并且其中在所述施用所述测试剂之后,所述在机器学习模型中整合针对所述受试者的所述生物年龄包括在步骤(iii)中评估的所述生物年龄和通过共享来自所述受试者的用户数据而获得的生理参数。
实例
以下实例是为了说明本发明而给出的,并且因此不应解释为限制本发明的范围。
实例1:发现ElovL2基因上游DNA区,即ElovL2 AS1区中包含的13个CG位点的加权DNA甲基化水平预测唾液DNA的年龄。
在此实例中,本发明涉及“表观遗传时钟”,其被认为是迄今为止对生物年龄最准确的量度。然而,迄今为止可用的测试需要使用血液测量许多位点(约350个)处的DNA甲基化,这是一种创伤且高成本的方法,不适用于广泛分布的消费产品。尽管可用的方法足以进行研究和临床相关研究,但是对于此测试的消费者驱动的公众使用来说,这是不可行的。因此,本发明提供了一种基于“表观遗传时钟”,具体地DNA甲基化对生物衰老进行准确稳健高通量且无创的测试的方法。在此实例中,本发明提供了用于健康衰老的生活方式管理的生物年龄的多CG DNA甲基化标志物。
发现血液中与年龄相关的CG位点
本发明对来自血液的公开可用的450K Illumina全基因组DNA甲基化阵列(GSE40729)进行皮尔逊相关性分析。选择并分析了先前没有报告过的少量CG位点。发现这些CG位点中的两个位点位于ElovL2基因的反义区的上游,所述区被称为ElovL2 AS 1区,如本文所公开的物理图的图1中的代表性实例所描绘的,其中如其中所示,发现所述位点与年龄高度相关(其中皮尔逊相关性系数r>0.9并且p=0)。如本文所公开的,本发明然后确定两个所述CG位点的组合加权DNA甲基化测量准确地预测了如图2所描绘的独立队列(GSE40279n=656和GSE2219,n=60)中血液DNA的年龄。可以看出,如本文所公开的如SEQ ID NO:1中所示的ElovL2 AS1区中的CG位点的甲基化从胎儿的接近0%发展到90岁老人的接近90%。因此,如SEQ ID NO:1中所示的此ElovL2 AS1区和在所述区内发现的CG位点是如本文所公开的如表1中所描述的二核苷酸序列的位置,单独显示了与年龄的几乎完全相关性,表明少量所述CG位点可能足以确定生物年龄。
ElovL2 AS1区的CG位点预测唾液样品中的年龄
为了评估公开的DNA甲基化年龄测试的广泛适用性,重要的是其不需要合格的健康专业人员来得出生物材料。在此实例中,本发明通过测试针对唾液的公开可用的450KIllumina阵列甲基化数据(GSE78874,n=259),确定了是否有可能使用公开的高度相关的CG位点作为唾液中的年龄预测因子,所述位点是位于本文所公开的如SEQ ID NO:1中所示的ElovL2 AS1区中的如表1中所描述的二核苷酸序列的位置。本发明公开了由以下加权甲基化测量结果构成的甲基化评分:cgl6867657和cg21572722,其是如表1中所描述的二核苷酸序列的位置,并且是如SEQ ID NO:1中所示的区中的CG位点的位置;ElovL2 AS1区连同cg09809672,其是如本文所公开的如表1中所描述的1号染色体中的CG位点,其预测年龄的平均偏差为5.62岁,并且中值偏差为4.74岁。然后,本发明将本文所公开的模型与黄金标准Horvath时钟的准确度进行了比较。如图3所示,ElovL2 AS1区位点的性能略优于Horvath时钟的性能。需要说明的是,ElovL2基因在年龄检测中的价值是本领域已知的。然而,本发明公开了所述过去的知识忽略了这样的事实,即被认为位于ElovL2基因中的两个CG位点(即,cgl6867657和cg21572722)实际上位于ElovL2基因反义取向上的不同基因ElovL2-AS 1基因的上游(参见如本文所公开的图1中所描述的物理描述),其中所述上游区被称为ElovL2AS1区并且如本文公开的如SEQ ID NO:1中所示。ElovL2-AS1基因上游的此区含有所选13个CG位点(参见如上文所公开的表1)。
实例2:亚硫酸氢盐转化、多路复用扩增和下一代测序以及ElovL2 AS1区中的13个CG的甲基化计算。
本公开进一步提供了将唾液与蛋白酶K(200微克在37℃下持续30分钟)在实验室处一起温育,所述唾液要由受试者或客户收集在由其邮寄到实验室的DNA稳定缓冲液(Tris10mM EDTA 10mM,SDS 1%)中。然后使用凯杰公司试剂盒对基因组DNA进行纯化。使用例如EZ DNA亚硫酸氢盐处理试剂盒,将经纯化的DNA用亚硫酸氢钠处理。在标准Taq聚合酶反应中,使用以下引物通过两步PCR反应生成靶向序列文库:
对于PCR 1-扩增与SEQ ID NO:1中所示的序列相对应的扩增子:
如SEQ ID NO:5:中所示的正向引物
Figure BDA0003492186090000201
如SEQ ID NO:6:中所示的反向引物
Figure BDA0003492186090000202
对于PCR 2-对样品进行条形码标记,使用以下引物进行第二PCR反应:
如SEQ ID NO:7:中所示的正向引物
Figure BDA0003492186090000211
如SEQ ID NO:8:中所示的条形码(反向)引物
5’CAAGCAGAAGACGGCATACGAGATAGTCATCGGTGACTGGAGTTCA GACGTG3’(红色碱基25-32为索引;使用此索引的至多200个变体)。
第二组引物为每个样品引入了索引以及反向测序引物和正向测序引物。将来自所有样品的PCR产物2合并并且在AMPpure-XP珠粒(NEB)上纯化。文库通过QPCR进行定量并且装载到MiSeq流动池中。使用BisMark或其它编辑软件将快速Q文件与相关基因组区对准。
实例3:ElovL2-AS1基因区上游区,如SEQ ID NO:1中所示的ElovL2 AS1区中的13个CG位点的优越性能。
接下来,本公开确定当与2个或3个CG位点比较时,公开的13个CG位点的组合加权甲基化评分是否提供优越的预测性能。从香港科学园(Hong Kong Science park)的65名志愿者收集唾液样品,并且如实例2所描述的确定13个CG位点(参见如上文所公开的表1)处的甲基化水平。本公开利用CG位点的不同组合执行了一系列多变量线性回归。如本文所公开的如图4中所示的结果表明,13个CG位点的组合(参见图4的D部分)比4个CG位点的组合(参见图4的A部分)、5个CG的组合(参见图4的B部分)或Illumina 2个CG位点的组合(参见图4的C部分)表现更好。关于13个CG位点的组合优于4个、5个或2个CG位点的较小组合的结果用图4E所示的统计比较数据进一步证明。13CG甲基化评分的皮尔逊积矩相关系数r为0.95(p=1.8×10-33)。
实例4:确定来自客户的唾液样品中的生物年龄。
如上文所讨论的,生物年龄是健康的重要参数。然而,由于如本发明中所公开的测试旨在由受试者进行,所述受试者是在专业医疗保健系统之外的居家客户,重要的是测试简单,不需要医疗专业人员抽血作为优选实施例,这是因为血液采集本身可能是轻度风险的程序,并且可以通过常规平邮将其递送到现有技术实验室设施的中心。因此,本发明公开了ElovL2AS1区中的13个CG位点形成了提供这种机会的Epi衰老测试的基础。在本发明中,如所公开的,客户通过Epi衰老App、网络或电子邮件订购含有稳定缓冲液的唾液检测试剂盒,所述稳定缓冲液使DNA保持稳定长达1个月。稳定缓冲液含有20mM Tris-HCl(pH 8.0)、20mM EDTA、0.5%SDS和1%Triton X-100。条形码试剂盒通过邮寄到达所述受试者的住所。客户用其手机上的扫描仪扫描条形码,并且在App中注册其条形码,所述App将条形码与其手机内部ID链接。按照Epi衰老测试试剂盒中提供的说明,客户将唾液吐入收集管中,并且然后将唾液转移到含有稳定缓冲液的管中,并且将管放置在预付费邮资信封中,并且将其发送到实验室。在实验室中,提取DNA,转化亚硫酸氢盐(化学亚硫酸氢盐转化处理将未甲基化C转化成T,而甲基化C仍保持为C),并且如实例3所描述的扩增ElovL2 AS1区,并且在MiSeq Illumina测序仪上用来自其它患者的样品进行测序。分析fastQ文件并且计算13个CG位点的甲基化值(m)mCGn=CGnC计数/(CGnT计数+CGnC计数)。
然后将这些值输入以下方程以计算生物年龄:
生物年龄=(CGl*87.5643+CG2*6.3301+CG3*-
0.8691+CG4*1.9468+CG5*40.0336+CG6*49.4303+CG7*-
14.7868+CG8*22.9042+CG9*-
49.7942+CG10*111.7467+CG11*41.8108+CG12*0.4144+CG13*-150.8005)-71.6872
然后,生物年龄通过其Epi衰老App发送给客户,或者客户可以使用其条形码ID检索结果。比实足年龄(+5y)大得多的生物年龄是生活方式改变的“危险信号”。客户定期(每6-12个月)测量其生物年龄,并且评估在缩小生物年龄与实足年龄之间的差异方面的进展。
实例5:用于管理生物年龄测试和生活方式数据的Epi衰老App。
本发明公开了符合苹果和安卓操作系统的Epi衰老App(针对所述App的主页,参见图5),并且提供了关于“Epi衰老测试”的信息、如何订购、用于订购的购物车以及与如PayPal或支付宝等电子支付链接。本发明的公开的App的创新方面在于,其将“Epi衰老测试”的基于客户的管理与基于由著名的国家和国际医疗集团的动态推荐的客户驱动的生活方式改变管理系统组合,所述系统是“自报告”、共享数据、机器学习、由迭代机器学习驱动的迭代变化、向客户提供个性化报告和重复评估(参见图6)。“强化学习”系统指导生活方式改变,这种改变对减缓如由DNA甲基化年龄与实足年龄之间的差异确定的衰老加速影响最大。本文所提供的App是由开源且本领域技术人员已知的程序构建的,如Build Fire JS、Ionic、Appcelerator的Titanium SDK、Mobile angular UI和Siberian CMS等。
所述App从苹果商店、谷歌商店和网站下载。所述App需要注册和分配客户ID。所述App激活扫描条形码的扫描仪并且将测试条形码与客户ID链接。数据将链接到这些“盲的”ID。个人数据和客户数据被“防火墙”分开并且标记化,以确保对“衰老”和生活方式数据设全盲。数据管理系统无法访问个人数据。构建了系统来恢复个人ID,所述系统只能由客户使用其电子邮件帐户启动,但是完全不受数据管理系统的影响。对数据设盲是App的基本特征。
app的首页含有若干个按钮(参见图5)。一个按钮链接到关于“衰老”测试的基本信息和科学引用以及公共医学链接,以进一步且深入了解所述领域。
所述信息提供了关于生活方式与“衰老”之间的链接的信息。第二按钮链接到含有一系列链接到生活方式和福祉域的按钮的页面,如“情绪”、“慢性疼痛”、包含摄入如SAMe、维生素等营养补充剂的“营养物”、如血压、心率、体重、身高、空腹血糖水平和其它代谢测试等“生理量度”、药物、滥用药物、酒精、吸烟和客户输入的运动数据。每个部分之前都有从如国家心脏和中风协会或糖尿病协会、美国癌症协会等著名的协会整理而来的推荐。推荐部分含有这些协会的链接,以便客户可以做出自己的判断和决策。生活方式管理部分背后的理念是自授权和客户对他/她的生活方式决策的控制。数据条目是通过移动数字刻度来完成的。是-否条目按刻度为0表示否,并且1表示是。其它可定量的条目按其数量输入。在每个数据条目刻度的顶部,呈现推荐的扩展表示,从而为客户提供其相对于彩色编码的推荐的性能的估计。推荐范围用绿色指示。与推荐的偏差由范围上方的红色和下方的蓝色指示。客户在每个部分数据条目结束时点击保存按钮可以保存数据。一旦输入数据,就提供总结分析报告。还提供了描述与国家推荐相关的随时间进展的图表。一旦实验室衰老测试完成,测试将远程递送到App。客户数据以及其它客户的数据存储在基于云的数据库中,以供进一步分析。
实例6:机器学习驱动的健康和DNA甲基化年龄数据分析以及生活方式改善的个性化推荐。
从多个用户中得出的数据存储在基于云的SQL数据库中(参见图7)。“机器学习”算法用于数据分析,并且正在构建将如疼痛、血压、BMI和情绪等输入问卷测量结果和作为输出DNA甲基化年龄与实足年龄之间的差异相关联的模型。例如,使用如“神经网络”、决策树、随机森林套索回归、K均值聚类分析、强化学习和“惩罚回归”等方法。
如在本发明中公开的方法包括对针对问卷的应答执行统计分析,并且在App上向消费者提供动态报告,所述动态报告描述了与如癌症、心脏和中风以及糖尿病等国家协会的推荐相比,针对问卷的应答随时间推移的进展。
尽管本发明已经结合其优选实施例进行了解释,但是应当理解,在不脱离本发明的精神和范围的情况下,可以做出许多其它可能的修改和变化。
优点
如本发明中所公开的方法相对于本领域已知的方法的创新方面在于,在先前未描述的ElovF2 AS 1区中的13个CG位点的组合对单个扩增子中唾液样品的年龄提供了具有极其高准确度的预测。通过多路复用和使用稳健的下一代测序提高了准确度和简单性。这种方法大大降低了成本,并且使测试适用于作为消费产品的应用。
参考文献
Beauchaine,T.P.和Beauchaine,R.J.,第3版(2002).最大协方差和K均值聚类分析在将案例分类到已知分类群中的比较(A comparison of maximumcovariance and K-means cluster analysis in classifying cases into known taxon groups).《心理学方法(Psychol Methods)》,7(2),245-261。
Bybee,S.M.、Bracken-Grissom,H.、Haynes,B.D.、Hermansen,R.A.、Byers,R.L.、Clement,M.J.、...Crandall,K.A.(2011).靶向扩增子测序(TAS):用于多基因座、多分类群系统发育学的可扩展下一代方法(Targeted amplicon sequencing(TAS):a scalablenext-gen approach to multilocus,multitaxa phylogenetics).《基因组生物学杂志(Genome Biol Evol)》,3,1312-1323.doi:10.1093/gbe/evrl06
Chen,B.H.,Marioni,R.E.,Colicino,E.,Peters,M.J.,Ward-Caviness,C.K.,Tsai,P.C.,...Horvath,S.(2016).基于DNA甲基化的生物年龄量度:预测死亡时间的荟萃分析(DNA methylation-based measures of biological age:meta-analysispredicting time to death).《衰老(Aging)》(纽约奥尔巴尼(Albany NY)),8(9),1844-1865.doi:10.18632/衰老.101020
Colella,S.,Shen,L.,Baggerly,K.A.,Issa,J.P.和Krahe,R.(2003).CpG位点的灵敏且定量的通用焦磷酸测序甲基化分析(Sensitive and quantitative universalPyrosequencing methylation analysis of CpG sites).《生物技术(Biotechniques)》,35(1),146-150。
De Roach,J.N.(1989).神经网络——一种分析临床数据的人工智能方法(Neuralnetworks--an artificial intelligence approach to the analysis of clinicaldata).《澳大利亚医学物理与工程科学(Australas Phys Eng Sci Med)》,12(2),100-106。
Ferrucci,L.,Cavazzini,C.,Corsi,A.,Bartali,B.,Russo,C.R.,Lauretani,F.,...Guralnik,J.M.(2002).老年人虚弱的生物标志物(Biomarkers of frailty inolder persons).《内分泌学研究杂志(J Endocrinol Invest)》,25(10增刊),10-15。
Freire-Aradas,A.,Phillips,C.,Mosquera-Miguel,A.,Giron-Santamaria,L.,Gomez-Tato,A.,Casares de Cal,M.,...Lareu,M.V.(2016).使用公共甲基化数据分析和Agena生物科学EpiTYPER系统开发用于法医年龄估计的甲基化标志物(Development of amethylation marker set for forensic age estimation using analysis of publicmethylation data and the Agena Bioscience EpiTYPER system).《国际法医学:遗传学(Forensic Sci Int Genet.)》,24,65-74.doi:10.1016/J.fsigen.2016.06.005
Hardy,A.和Magnello,M.E.(2002).流行病学统计方法(Statistical methods inepidemiology):Karl Pearson,Ronald Ross,Major Greenwood and Austin BradfordHill,1900-1945.Soz Praventivmed,47(2),80-89。
Hertel,J.,Friedrich,N.,Wittfeld,K.,Pietzner,M.,Budde,K.,Van derAuwera,S.,...Grabe,H.J.(2016).通过代谢组学测量生物年龄:代谢年龄评分(MeasuringBiological Age via Metabonomics:The Metabolic Age Score).《蛋白组学研究杂志(JProteome Res)》,15(2),400-410.doi:10.1021/acs.jproteome.5b00561
Horvath,S.(2013).人组织和细胞类型的DNA甲基化年龄(DNA methylation ageof human tissues and cell types).《基因组生物学(Genome Biol)》,14(10),R115.doi:10.1186/gb-2013-14-10-rl 15
Figure BDA0003492186090000241
J.,Pedersen,N.L.,&Hagg,S.(2017).生物年龄预测因子(BiologicalAge Predictors).《E生物医学(EBioMedicine)》,21,29-36.doi:10.1016/j.ebiom.2017.03.046
Kakushadze,Z.,&Yu,W.(2017).*癌症特征的K均值和聚类模型(*K-means andcluster models for cancer signatures).《生物分子检测定量(Biomol DetectQuantif)》13,7-31.doi:10.1016/j.bdq.2017.07.001
Kim,S.M.,Kim,Y.,Jeong,K.,Jeong,H.,&Kim,J.(2018).使用临床人口统计学数据和超声检查的BIRADS词典诊断乳腺癌的逻辑LASSO回归(Logistic LASSO regressionfor the diagnosis of breast cancer using clinical demographic data and theBIRADS lexicon for ultrasonography).《超声检查(Ultrasonography)》,37(1),36-42.doi:10.14366/usg.16045
Kristensen,L.S.,Mikeska,T.,Krypuy,M.,&Dobrovic,A.(2008).实时后的灵敏熔解分析——甲基化特异性PCR(SMART-MSP):高通量和无探针定量DNA甲基化检测(Sensitive Melting Analysis after Real Time-Methylation Specific PCR(SMART-MSP):high-throughput and probe-free quantitative DNA methylation detection).《核酸研究(Nucleic Acids Res.)》
Mann,J.J.,Ellis,S.P.,Waternaux,C.M.,Liu,X.,Oquendo,M.A.,Malone,K.M.,...Currier,D.(2008).分类树区分主要精神疾病病症中的自杀未遂史:临床决策模型(Classification trees distinguish suicide attempters in major psychiatricdisorders:a model of clinical decision making).《临床精神病学杂志(J ClinPsychiatry)》,69(1),23-31。
Marioni,R.E.,Harris,S.E.,Shah,S.,McRae,A.F.,von Zglinicki,T.,Martin-Ruiz,C.,...Deary,I.J.(2018).表观遗传时钟和端粒长度与实足年龄和死亡率独立相关(The epigenetic clock and telomere length are independently associated withchronological age and mortality).《国际流行病学杂志(Int J Epidemiol)》,47(1),356.doi:10.1093/ije/dyx233
Monaghan,P.(2010).端粒和生活史:其长和短(Telomeres and life histories:the long and the short of it).《纽约科学院年鉴(Ann N Y AcadSci)》,1206,130-142.doi:10.1lll/j.l749-6632.2010.05705.x
Mupparapu,M.、Wu,C.W.,和Chen,Y.C.(2018).人工智能、机器学习、神经网络和深度学习:新牙科诊断的未来概念(Artificial intelligence,machine learning,neuralnetworks,and deep learning:Futuristic concepts for new dental diagnosis).《精粹国际(Quintessence Int)》,49(9),687-688.doi:10.3290/j.qi.a41107
Sherbet,G.V.,Woo,W.L.,&Dlay,S.(2018).基于人工智能的技术在癌症管理中的应用:对人工神经网络部署的评论(Application of Artificial Intelligence-basedTechnology in Cancer Management:A Commentary on the Deployment of ArtificialNeural Networks).《抗癌研究(Anticancer Res)》,35(12),6607-6613.doi:10.21873/抗癌13027
Shi,T.,Seligson,D.,Belldegrun,A.S.,Palotie,A.,&Horvath,S.(2005).组织微阵列谱的肿瘤分类:随机森林聚类应用于肾细胞癌(Tumor classification by tissuemicroarray profiling:random forest clustering applied to renal cellcarcinoma).《现代病理学(Mod Pathol)》,18(4),547-557.doi:10.1038/modpathol.3800322
Svetnik,V.,Liaw,A.,Tong,C.,Culberson,J.C.,Sheridan,R.P.,&Feuston,B.P.(2003).随机森林:用于复合分类和QSAR建模的分类和回归工具(Random forest:aclassification and regression tool for compound classification and QSARmodeling).《化学信息计算科学杂志(JChem InfComput Sci)》,43(6),1947-1958.doi:10.102l/ci034160g
Vetter,V.M.,Meyer,A.,Karbasiyan,M.,Steinhagen-Thiessen,E.,Hopfenmuller,W.,&Demuth,I.(2018).在柏林衰老研究II(BASE-II)中,表观遗传时钟和相对端粒长度在很大程度上表示衰老的不同方面(Epigenetic clock and relativetelomere length represent largely different aspects of aging in the BerlinAging Study II(BASE-II)).《老年学杂志系列A-生物科学和医学科学(J Gerontol ABiol Sci Med Sci.)》doi:10.1093/gerona/glyl84
Yanai,H.,Budovsky,A.,Tacutu,R.,&Fraifeld,V.E.(2011).皮肤伤口愈合率与衰老或长寿表型有关吗?(Is rate of skin wound healing associated with aging orlongevity phenotype?).《生物老年学(Bio gerontology)》,12(6),591-597.doi:10.1007/s 10522-011-9343-6
Yu,M.,Heinzerling,T.J.,&Grady,W.M.(2018).使用液滴数字PCR进行DNA甲基化分析(DNA Methylation Analysis Using Droplet Digital PCR).《分子生物学方法(Methods Mol Biol)》,1768,363-383.doi:10.1007/978-1-4939-7778-9_21
Zhao,Y.,Kosorok,M.R.,&Zeng,D.(2009).癌症临床试验的强化学习设计(Reinforcement learning design for cancer clinical trials).《医学统计学(StatMed)》,28(26),3294-3315.doi:10.1002/sim.3720
序列表
<110> 香港精准医学技术有限公司/HKG EPITHERAPEUTICS LIMITED
<120> EPI衰老:用于管理健康衰老的新型生态系统/Epiaging; Novel Ecosystemfor Managing Healthy Aging
<130> TPC57505
<150> US 62/854,226
<151> 2019-05-29
<160> 8
<170> PatentIn版本3.5
<210> 1
<211> 266
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 1
cgccctcgcg tccgcggcgt cccctgccgg ccgggcggcg atttgcaggt ccagccggcg 60
ccggtttcgc gcggcggctc aacgtccacg gagccccagg aatacccacc cgctgcccag 120
atcggcagcc gctgctgcgg ggagaagcag tatcgtgcag ggcgggcacg ctggtcttgc 180
ttacagttgg gcttcggtgg gtttgaagca cacattaggg ggaaatggct ctgttcctgc 240
aggtttgcgc agtctgggtt tcttag 266
<210> 2
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 2
aggggagtag ggtaagtgag 20
<210> 3
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 3
accatttccc cctaatatat actt 24
<210> 4
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 4
gggaggagat ttgtaggttt 20
<210> 5
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<220>
<221> misc_特征
<222> (34)..(38)
<223> n为a、c、g或t
<400> 5
acactctttc cctacacgac gctcttccga tctnnnnnyg ggyggygatt tgtaggttta 60
gt 62
<210> 6
<211> 58
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 6
gtgactggag ttcagacgtg tgctcttccg atctccctac acratactac ttctcccc 58
<210> 7
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 7
aatgatacgg cgaccaccga gatctacact ctttccctac acgac 45
<210> 8
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 8
caagcagaag acggcatacg agatagtcat cggtgactgg agttcagacg tg 52

Claims (20)

1.一种用于计算受试者的生物年龄的方法,所述方法包括以下步骤:
(a)从来自所述受试者的底物中提取DNA;
(b)测量来自所述底物的经提取的DNA中的DNA甲基化以获得DNA甲基化谱;
(c)分析所述DNA甲基化谱以获得多基因评分;以及
(d)从所述多基因评分决定所述受试者的所述生物年龄,其中所述提取DNA包括从获自所述受试者的唾液或血液中提取基因组DNA。
2.根据权利要求1所述的方法,其中所述测量DNA甲基化是使用包括以下的方法执行的:DNA焦磷酸测序、基于质谱(EpityperTM)的甲基化测定、基于PCR的甲基化测定、在选自HiSeq、MiniSeq、MiSeq和NextSeq测序仪的群组的平台上进行的靶向扩增子下一代亚硫酸氢盐测序、Ion Torrent测序、甲基化DNA免疫沉淀(MeDIP)测序或与寡核苷酸阵列杂交。
3.根据权利要求1所述的方法,其中所述测量DNA甲基化是针对多基因DNA甲基化生物标志物执行的,所述测量DNA甲基化包括测量人类CG位点中的任何一个和其组合内的CG位点的甲基化状态,所述CG位点定位于如SEQ ID NO:1中所示的ElovL2基因的推定反义区,即ElovL2 AS1区中。
4.根据权利要求1所述的方法,其中所述测量DNA甲基化是使用DNA焦磷酸测序执行的,所述DNA焦磷酸测序包括如SEQ ID NO:2中所示的正向生物素化引物、如SEQ ID NO:3中所示的反向引物以及如SEQ ID NO:4中所示的焦磷酸测序引物等引物。
5.根据权利要求1所述的方法,其中所述测量DNA甲基化是使用在选自HiSeq、MiniSeq、MiSeq和NextSeq测序仪的组的平台上进行的靶向扩增子下一代亚硫酸氢盐测序执行的,所述靶向扩增子下一代亚硫酸氢盐测序包括如SEQ ID NO:5中所示的正向引物和如SEQ IDNO:6中所示的反向引物等引物。
6.根据权利要求1所述的方法,其中所述测量DNA甲基化是使用选自甲基化特异性PCR和数字PCR的群组的基于PCR的甲基化测定执行的。
7.根据权利要求1所述的方法,其中所述分析所述DNA甲基化谱以获得多基因评分包括使用多元线性回归方程或神经网络分析。
8.一种用于计算跨多个受试者的生物年龄的方法,所述方法包括以下步骤:
(a)从来自多个受试者的多个底物中提取DNA;
(b)测量来自多个底物的经提取的DNA中的DNA甲基化,以获得DNA甲基化谱;
(c)分析所述DNA甲基化谱,以获得多基因评分;以及
(d)从所述多基因评分,决定跨多个受试者的所述生物年龄,
其中所述提取DNA包括从获自受试者的唾液或血液中提取基因组DNA。
9.根据权利要求8所述的方法,其中所述测量来自多个底物的所述经提取的DNA中的DNA甲基化包括以下步骤:
(a)用靶特异性引物扩增从所述多个底物中提取的基因组DNA,以获得PCR产物1;
(b)通过条形码引物扩增步骤(a)的所述PCR产物1,以获得PCR产物2;
(c)使用步骤(b)的所述PCR产物2在单个下一代Miseq测序反应中执行多路复用测序;
(d)从步骤(c)的所述多路复用测序中提取数据;以及
(e)根据步骤(d)的经提取的数据对DNA甲基化进行定量,以获得每个底物的DNA甲基化谱,
其中所述提取DNA包括从获自受试者的唾液或血液中提取基因组DNA。
10.根据权利要求9所述的方法,其中用于获得PCR产物1的所述靶特异性引物包括如SEQ ID NO:5中所示的正向引物和如SEQ ID NO:6中所示的反向引物等引物,并且其中用于获得PCR产物2的所述条形码引物包括如SEQ ID NO:7中所示的正向引物和如SEQ ID NO:8中所示的反向引物等引物,其是条形码索引引物。
11.一种用于计算生物年龄的DNA甲基化生物标志物的组合,其中所述DNA甲基化生物标志物的所述组合包括人类CG位点和其组合,所述人类CG位点定位于如SEQ ID NO:1中所示的ElovL2基因的推定反义区,即ElovL2 AS 1区中。
12.一种用于决定受试者的生物年龄的试剂盒,所述试剂盒包括:用于从所述受试者收集底物并使所述底物稳定的装置和试剂;用于读取所述试剂盒上条形码的扫描仪;以及用于收集所述底物并使所述底物稳定的说明书,其中所述底物是受试者的唾液或血液,并且其中所述使底物稳定是用于邮寄所收集的底物以提取DNA,以便测量来自所述底物的经提取的DNA中的DNA甲基化,以获得所述受试者的DNA甲基化谱,从而决定所述受试者的生物年龄。
13.一种用于针对生活方式改变提供推荐的计算机实施的方法,所述方法包括以下步骤:
(a)评估计算机可读介质中、通过共享来自受试者的用户数据而获得的条目;
(b)将步骤(a)的所述条目与从所述受试者获得的根据权利要求12所述的用于决定所述受试者的所述生物年龄的试剂盒相匹配;
(c)使用根据权利要求1或8所述的方法计算受试者的所述生物年龄,以获得经计算的生物年龄;
(d)通过使用步骤(a)的评估执行统计分析,在机器学习模型中整合步骤(c)的针对所述受试者的所述经计算的生物年龄,以获得经整合的数据报告;
(e)通过分析步骤(d)的所述经整合的数据报告以及如通过共享来自所述受试者的用户数据而获得的问卷答复随时间推移的进展并将所述经整合的数据报告和所述问卷答复与国家协会的推荐进行比较,而为所述受试者准备动态报告;以及
(f)与所述受试者在所述计算机可读介质上共享步骤(e)的所述动态报告,以针对生活方式改变提供推荐。
14.根据权利要求13所述的计算机实施的方法,其中所述计算机可读介质包括开源开发工具以含有以下内容:关于测试的信息,所述测试用于基于根据权利要求1或8所述的方法计算生物年龄;用于订购所述测试的虚拟购物车;用于扫描根据权利要求12所述的试剂盒的条形码的扫描功能;以及用于从实验室接收测试结果的功能,并且其中所述开源开发工具包括问卷,所述问卷包含在所述计算机可读介质中以探索影响健康衰老的生活方式的功能,所述问卷包含基本生理量度、体重、身高、血压、心率、情绪自我评估、麦吉尔疼痛问卷(McGill pain questionnaire)、饮食和营养问卷、运动问卷以及包含酒精、药物和吸烟的生活方式问题以及其组合。
15.根据权利要求14所述的计算机实施的方法,其中所述方法包括使用安卓(Android)或苹果(Apple)或微信(WeChat)小程序进行个性化生活方式推荐,从而创建专注于使受试者的生物衰老正常化或减缓的健康生态系统,或者使用跨多个受试者的如云数据预处理等标准数据工作流和管理系统将数据存储在包含亚马逊(Amazon)、阿里云(Ali cloud)或微软Azure(Microsoft Azure)的服务器或云服务器中的企业级对象存储装置中。
16.根据权利要求14所述的计算机实施的方法,其中所述方法包括使用一组人工智能算法计算不同生活方式量度对受试者或跨多个受试者的所述生物年龄的加权贡献,所述一组人工智能算法如随机森林(RF)、支持向量机(SVM)、线性判别分析(LDA)、广义线性模型(GLM)和深度学习(DL),所述加权贡献被动态更新以提供关于生活方式改变的个性化生活方式推荐。
17.一种用于开发计算机可读介质的方法,所述方法包括以下步骤:
(a)存储从多个受试者得出的数据;
(b)分析步骤(a)的所存储的数据;以及
(c)构建模型,
其中所述存储从多个用户得出的数据的步骤包括基于云的SQL数据库,
其中所述分析所述所存储的数据的步骤包括选自深度机器学习、强化学习和机器学习或其组合的群组,并且
其中所述构建模型的步骤包括使输入问卷测量结果和作为输出的DNA甲基化年龄与实足年龄之间的差值以及如疼痛、血压、BMI和情绪等其它生理和心理输出相关。
18.根据权利要求17所述的用于开发计算机可读介质的方法,其中所述机器学习包括选自以下的群组:包括随机森林分析的数据挖掘算法、或包括K-均值聚类分析的数据挖掘算法、或包括亚马逊机器学习(AML)的平台、或包含阿帕奇海杜普分布式文件系统(ApacheHadoop Distributed File system)、亚马逊EC2谷歌计算引擎和微软Azure的平台上的包括H2O.ai产品的软件或其组合。
19.根据权利要求1或8所述的方法,其用于评估生物干预对受试者的所述生物年龄的影响的方法中,其包括以下步骤:
(a)使用根据权利要求1或8所述的方法计算受试者的所述生物年龄,以在生物干预之前获得初始生物年龄;
(b)对所述受试者执行生物干预;
(c)在已经执行步骤(b)之后,对从所述受试者获得的后续底物重复所述步骤(a),以在所述生物干预之后获得所述生物年龄;
(d)在所述生物干预之后,在机器学习模型中整合针对所述受试者的所述生物年龄,以评估所述生物干预对所述受试者的所述生物年龄的影响,
其中步骤(b)的所述生物干预选自营养补充剂、维生素、疗法、测试物质的施用、饮食操纵、代谢操纵、外科手术操纵、社交操纵、行为操纵、环境操纵、感觉操纵、激素操纵和表观遗传操纵或其组合的群组,
其中所述提取DNA包括从获自受试者的唾液或血液中提取基因组DNA,并且
其中在所述生物干预之后,所述在机器学习模型中整合针对所述受试者的所述生物年龄包括在步骤(c)中评估的所述生物年龄和通过共享来自所述受试者的用户数据,而获得的生理参数。
20.根据权利要求1或8所述的方法,其用于筛选作为抗衰老剂的药剂的方法中,其包括以下步骤:
(a)使用根据权利要求1或8所述的方法计算从受试者获得的底物的年龄,以在施用测试剂之前获得初始生物年龄;
(b)向所述受试者施用测试剂;
(c)在已经执行步骤(b)之后,对从所述受试者获得的后续底物重复所述步骤(a),以在所述施用所述测试剂之后获得生物年龄;
(d)在所述施用所述测试剂之后,在机器学习模型中整合针对所述受试者的所述生物年龄,以评估是否已经藉由在机器学习模型中进行的整合而计算出年龄的减少,以便将所述测试剂确定为所述受试者的抗衰老剂,
其中所述提取DNA包括从获自所述受试者的唾液或血液中提取基因组DNA,并且
其中在所述施用所述测试剂之后,所述在机器学习模型中整合针对所述受试者的所述生物年龄包括在步骤(c)中评估的所述生物年龄和通过共享来自所述受试者的用户数据而获得的生理参数。
CN202080054523.8A 2019-05-29 2020-05-29 Epi衰老:用于管理健康衰老的新型生态系统 Pending CN114174529A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962854226P 2019-05-29 2019-05-29
US62/854,226 2019-05-29
PCT/IB2020/055146 WO2020240511A1 (en) 2019-05-29 2020-05-29 Epiaging: novel ecosystem for managing healthy aging

Publications (1)

Publication Number Publication Date
CN114174529A true CN114174529A (zh) 2022-03-11

Family

ID=73551984

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080054523.8A Pending CN114174529A (zh) 2019-05-29 2020-05-29 Epi衰老:用于管理健康衰老的新型生态系统

Country Status (11)

Country Link
US (1) US20220228217A1 (zh)
EP (1) EP3963096A4 (zh)
JP (1) JP2022537896A (zh)
KR (1) KR20220016198A (zh)
CN (1) CN114174529A (zh)
AU (1) AU2020285692A1 (zh)
BR (1) BR112021023731A2 (zh)
CA (1) CA3140124A1 (zh)
IL (1) IL288163A (zh)
SG (1) SG11202112378RA (zh)
WO (1) WO2020240511A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11687536B2 (en) * 2020-10-14 2023-06-27 EMC IP Holding Company LLC Pipeline-based system for configuration checking and reporting associated with an information processing system
JP7479317B2 (ja) 2021-03-16 2024-05-08 Kddi株式会社 情報処理装置、方法及びプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110257494A (zh) * 2019-07-19 2019-09-20 华中科技大学 一种获得中国人群个体年龄的方法、系统及扩增检测体系
CN111763742A (zh) * 2019-04-02 2020-10-13 深圳华大法医科技有限公司 甲基化标志物及确定个体年龄的方法和应用
CN114464255A (zh) * 2022-01-28 2022-05-10 北京果壳生物科技有限公司 一种基于dna甲基化水平数据的甲基化年龄评估方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9901668B2 (en) * 2015-03-17 2018-02-27 Fenwal, Inc. Indicating to a medical device performance of an operation by another medical device
US10730058B2 (en) * 2015-09-14 2020-08-04 Fenwal, Inc. Apparatus, systems and methods for storing, treating and/or processing blood and blood components
EP3464642A4 (en) * 2016-05-31 2020-02-19 The Regents of the University of California METHOD FOR EVALUATING, MONITORING AND MODULATING THE AGING PROCESS

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111763742A (zh) * 2019-04-02 2020-10-13 深圳华大法医科技有限公司 甲基化标志物及确定个体年龄的方法和应用
CN110257494A (zh) * 2019-07-19 2019-09-20 华中科技大学 一种获得中国人群个体年龄的方法、系统及扩增检测体系
CN114464255A (zh) * 2022-01-28 2022-05-10 北京果壳生物科技有限公司 一种基于dna甲基化水平数据的甲基化年龄评估方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
A. FREIRE-ARADAS: "Development of a methylation marker set for forensic age estimation using analysis of public methylation data and the Agena Bioscience EpiTYPER system", FORENSIC SCIENCE INTERNATIONAL: GENETICS, vol. 24, 8 June 2016 (2016-06-08), pages 65 - 74, XP029679866, DOI: 10.1016/j.fsigen.2016.06.005 *
JANA NAUE: "Chronological age prediction based on DNA methylation: Massive parallel sequencing and random forest regression", FORENSIC SCIENCE INTERNATIONAL: GENETICS, 1 August 2017 (2017-08-01), pages 19 - 28 *
JONG-LYUL PARK: "Identification and evaluation of age-correlated DNA methylation markers for forensic use", FORENSIC SCIENCE INTERNATIONAL: GENETICS, vol. 23, 17 March 2016 (2016-03-17), pages 64 - 70, XP029567602, DOI: 10.1016/j.fsigen.2016.03.005 *
RENATA ZBIEC´-PIEKARSKA: "Examination of DNA methylation status of the ELOVL2 marker may be useful for human age prediction in forensic science", FORENSIC SCIENCE INTERNATIONAL: GENETICS, vol. 14, 31 December 2015 (2015-12-31), pages 162 - 163 *

Also Published As

Publication number Publication date
KR20220016198A (ko) 2022-02-08
BR112021023731A2 (pt) 2022-01-04
WO2020240511A1 (en) 2020-12-03
SG11202112378RA (en) 2021-12-30
CA3140124A1 (en) 2020-12-03
US20220228217A1 (en) 2022-07-21
JP2022537896A (ja) 2022-08-31
IL288163A (en) 2022-01-01
EP3963096A4 (en) 2023-01-25
AU2020285692A1 (en) 2021-12-02
EP3963096A1 (en) 2022-03-09

Similar Documents

Publication Publication Date Title
US20240153593A1 (en) Population based treatment recommender using cell free dna
US20200027557A1 (en) Multimodal modeling systems and methods for predicting and managing dementia risk for individuals
CN112020565A (zh) 用于确保基于测序的测定的有效性的质量控制模板
US20140040264A1 (en) Method for estimation of information flow in biological networks
JP2003021630A (ja) 臨床診断サービスを提供するための方法
CA3071855C (en) Target-associated molecules for characterization associated with biological targets
CA2877436C (en) Systems and methods for generating biomarker signatures
Hajirasouliha et al. Precision medicine and artificial intelligence: overview and relevance to reproductive medicine
US11915819B2 (en) Methods and systems for multi-omic interventions
Kayser et al. Recent advances in Forensic DNA Phenotyping of appearance, ancestry and age
CN114174529A (zh) Epi衰老:用于管理健康衰老的新型生态系统
US20140180599A1 (en) Methods and apparatus for analyzing genetic information
Radhachandran et al. A machine learning approach to predicting risk of myelodysplastic syndrome
WO2010006414A1 (en) Methods, kits and compositions for determining severity and survival of heart failure in a subject
JP2021508488A (ja) データの解釈、ならびにユーザの遺伝的データ及び腸内マイクロバイオータの組成に関するデータに基づいてユーザに推奨事項を提供するシステム及び方法
González et al. Obtaining relevant genes by analysis of expression arrays with a multi-agent system
JP7160751B2 (ja) 膠原病のリスクを判定する方法
RU2021132994A (ru) Эпиэйджинг: новая экосистема для управления здоровым старением
CN116134546A (zh) 用于诊断检验的有效样本混合的方法和系统
Henry Understanding the Role of Machine Learning in Early Prediction of Diabetes Onset
JPWO2020240511A5 (zh)

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40068808

Country of ref document: HK