JPWO2020074533A5 - - Google Patents
Download PDFInfo
- Publication number
- JPWO2020074533A5 JPWO2020074533A5 JP2021543580A JP2021543580A JPWO2020074533A5 JP WO2020074533 A5 JPWO2020074533 A5 JP WO2020074533A5 JP 2021543580 A JP2021543580 A JP 2021543580A JP 2021543580 A JP2021543580 A JP 2021543580A JP WO2020074533 A5 JPWO2020074533 A5 JP WO2020074533A5
- Authority
- JP
- Japan
- Prior art keywords
- genomic dna
- age
- dna sequences
- individual
- methylation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 229920001850 Nucleic acid sequence Polymers 0.000 claims description 213
- 230000011987 methylation Effects 0.000 claims description 84
- 238000007069 methylation reaction Methods 0.000 claims description 84
- 230000007067 DNA methylation Effects 0.000 claims description 40
- 201000010099 disease Diseases 0.000 claims description 22
- 230000032683 aging Effects 0.000 claims description 20
- 239000000523 sample Substances 0.000 claims description 16
- 238000010972 statistical evaluation Methods 0.000 claims description 15
- 102000004169 proteins and genes Human genes 0.000 claims description 14
- 108090000623 proteins and genes Proteins 0.000 claims description 14
- 238000004458 analytical method Methods 0.000 claims description 12
- 239000000560 biocompatible material Substances 0.000 claims description 12
- 238000003776 cleavage reaction Methods 0.000 claims description 12
- 239000002773 nucleotide Substances 0.000 claims description 12
- 102100011408 ACACA Human genes 0.000 claims description 10
- 101700056202 ACACA Proteins 0.000 claims description 10
- 102100016375 ELOVL2 Human genes 0.000 claims description 10
- 108060002519 ELOVL2 Proteins 0.000 claims description 10
- 102100006439 FURIN Human genes 0.000 claims description 10
- 108090001126 FURIN Proteins 0.000 claims description 10
- 102100001827 GMPS Human genes 0.000 claims description 10
- 101710014647 GMPS Proteins 0.000 claims description 10
- 101700078473 GNAI1 Proteins 0.000 claims description 10
- 102100018520 GNAI1 Human genes 0.000 claims description 10
- 102100018863 GNG2 Human genes 0.000 claims description 10
- 101710037500 GNG2 Proteins 0.000 claims description 10
- 102100014478 GRIA4 Human genes 0.000 claims description 10
- 108060003207 GRIA4 Proteins 0.000 claims description 10
- 102100013127 MAP4 Human genes 0.000 claims description 10
- 101700050767 MAP4 Proteins 0.000 claims description 10
- 101700070835 NCOR2 Proteins 0.000 claims description 10
- 102100015085 NCOR2 Human genes 0.000 claims description 10
- 102100002600 PANK1 Human genes 0.000 claims description 10
- 101700070862 PANK1 Proteins 0.000 claims description 10
- 102100017986 SIRT7 Human genes 0.000 claims description 10
- 101710045143 SIRT7 Proteins 0.000 claims description 10
- 102100017239 SLC1A2 Human genes 0.000 claims description 10
- 108060002238 SLC1A2 Proteins 0.000 claims description 10
- 102100017249 TDRD1 Human genes 0.000 claims description 10
- 108060008114 TDRD1 Proteins 0.000 claims description 10
- 108060008567 TRPV3 Proteins 0.000 claims description 10
- LSNNMFCWUKXFEE-UHFFFAOYSA-M bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 claims description 10
- 201000011510 cancer Diseases 0.000 claims description 10
- 229920003013 deoxyribonucleic acid Polymers 0.000 claims description 10
- 230000000694 effects Effects 0.000 claims description 10
- 238000007855 methylation-specific PCR Methods 0.000 claims description 10
- 101710004939 CRPPA Proteins 0.000 claims description 9
- 102100016158 CRPPA Human genes 0.000 claims description 9
- 102100016170 DAP Human genes 0.000 claims description 8
- 101700075701 DAP Proteins 0.000 claims description 8
- 102100016168 EPAS1 Human genes 0.000 claims description 8
- 101700027987 EPAS1 Proteins 0.000 claims description 8
- 102100014305 GNAQ Human genes 0.000 claims description 8
- 101700035643 GNAQ Proteins 0.000 claims description 8
- 102100017927 INPP5A Human genes 0.000 claims description 8
- 101710013734 INPP5A Proteins 0.000 claims description 8
- 102100002688 NDUFA10 Human genes 0.000 claims description 8
- 101710003006 NDUFA10 Proteins 0.000 claims description 8
- 102100018799 PDE4C Human genes 0.000 claims description 8
- 101700042596 PDE4C Proteins 0.000 claims description 8
- 102100019669 PRKCH Human genes 0.000 claims description 8
- 102100019666 PRKCZ Human genes 0.000 claims description 8
- 101710039135 RXFP3 Proteins 0.000 claims description 8
- 102100018307 RXFP3 Human genes 0.000 claims description 8
- 102100000973 SINHCAF Human genes 0.000 claims description 8
- 108060007549 SINHCAF Proteins 0.000 claims description 8
- 102100017876 USP4 Human genes 0.000 claims description 8
- 108060005941 USP4 Proteins 0.000 claims description 8
- 230000001419 dependent Effects 0.000 claims description 8
- 238000001840 matrix-assisted laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 claims description 8
- 125000003729 nucleotide group Chemical group 0.000 claims description 8
- 108010050991 protein kinase C zeta Proteins 0.000 claims description 8
- 239000000969 carrier Substances 0.000 claims description 7
- 102100007499 ANKRD37 Human genes 0.000 claims description 6
- 101710016121 ANKRD37 Proteins 0.000 claims description 6
- 102100001218 DENND3 Human genes 0.000 claims description 6
- 101710035873 DENND3 Proteins 0.000 claims description 6
- 102000013400 EC 2.1.1.137 Human genes 0.000 claims description 6
- 108010065904 EC 2.1.1.137 Proteins 0.000 claims description 6
- 101700041384 EFHC1 Proteins 0.000 claims description 6
- 102100012566 EFHC1 Human genes 0.000 claims description 6
- 101700059448 EFHD1 Proteins 0.000 claims description 6
- 108060002860 FBXL7 Proteins 0.000 claims description 6
- 102100020074 FBXL7 Human genes 0.000 claims description 6
- 101700036062 FOXE3 Proteins 0.000 claims description 6
- 102100014039 FOXE3 Human genes 0.000 claims description 6
- 102000011852 GATA2 Transcription Factor Human genes 0.000 claims description 6
- 108010075641 GATA2 Transcription Factor Proteins 0.000 claims description 6
- 108060008201 GDNF Proteins 0.000 claims description 6
- 102100000369 GDNF Human genes 0.000 claims description 6
- 102100014297 GPATCH1 Human genes 0.000 claims description 6
- 108060003334 GPATCH1 Proteins 0.000 claims description 6
- 102100007204 HBE1 Human genes 0.000 claims description 6
- 101700003868 HBE1 Proteins 0.000 claims description 6
- 101710023238 HOXD13 Proteins 0.000 claims description 6
- 102100015821 HOXD13 Human genes 0.000 claims description 6
- 102000004344 Interferon Regulatory Factor-2 Human genes 0.000 claims description 6
- 108090000908 Interferon Regulatory Factor-2 Proteins 0.000 claims description 6
- 102100005814 KCNK12 Human genes 0.000 claims description 6
- 101710043978 KCNK12 Proteins 0.000 claims description 6
- 102100010158 KCNS1 Human genes 0.000 claims description 6
- 101700038898 KCNS1 Proteins 0.000 claims description 6
- 102100012022 KLHL42 Human genes 0.000 claims description 6
- 101710042580 KLHL42 Proteins 0.000 claims description 6
- 102100011322 LINC02875 Human genes 0.000 claims description 6
- 101710031535 LINC02875 Proteins 0.000 claims description 6
- 108060004543 MAJIN Proteins 0.000 claims description 6
- 102100011078 MAJIN Human genes 0.000 claims description 6
- 102100006171 MORN1 Human genes 0.000 claims description 6
- 101700016416 MORN1 Proteins 0.000 claims description 6
- 102100003417 MTRNR2L5 Human genes 0.000 claims description 6
- 101710010839 MTRNR2L5 Proteins 0.000 claims description 6
- 101700060969 MYO10 Proteins 0.000 claims description 6
- 102100010075 MYO10 Human genes 0.000 claims description 6
- 102000033195 NRXN3 Human genes 0.000 claims description 6
- 101710027760 NRXN3 Proteins 0.000 claims description 6
- 101710016792 NUP107 Proteins 0.000 claims description 6
- 102100004632 NUP107 Human genes 0.000 claims description 6
- 101700073550 PBX4 Proteins 0.000 claims description 6
- 102100014545 PBX4 Human genes 0.000 claims description 6
- 102100000264 PROS1 Human genes 0.000 claims description 6
- 229940096437 Protein S Drugs 0.000 claims description 6
- 108010066124 Protein S Proteins 0.000 claims description 6
- 102100020567 TLCD5 Human genes 0.000 claims description 6
- 101710032286 TLCD5 Proteins 0.000 claims description 6
- 102000003568 TRPV3 Human genes 0.000 claims description 6
- 102100000397 VPS37C Human genes 0.000 claims description 6
- 101710012837 VPS37C Proteins 0.000 claims description 6
- 101700037854 WASF3 Proteins 0.000 claims description 6
- 102100014947 WASF3 Human genes 0.000 claims description 6
- 102100000489 WDFY2 Human genes 0.000 claims description 6
- 101700065183 WDFY2 Proteins 0.000 claims description 6
- 102100000450 WNT7B Human genes 0.000 claims description 6
- 101700025356 WNT7B Proteins 0.000 claims description 6
- 101710002401 ZNF140 Proteins 0.000 claims description 6
- 102100013570 ZNF140 Human genes 0.000 claims description 6
- 239000012472 biological sample Substances 0.000 claims description 6
- 230000000295 complement Effects 0.000 claims description 6
- 239000000463 material Substances 0.000 claims description 6
- 238000002493 microarray Methods 0.000 claims description 6
- -1 FAM110A Proteins 0.000 claims description 5
- 102100019190 AACS Human genes 0.000 claims description 4
- 102100019955 ATL2 Human genes 0.000 claims description 4
- 101700070791 ATL2 Proteins 0.000 claims description 4
- 206010001897 Alzheimer's disease Diseases 0.000 claims description 4
- 206010003210 Arteriosclerosis Diseases 0.000 claims description 4
- 206010003246 Arthritis Diseases 0.000 claims description 4
- 102100000808 B3GNT9 Human genes 0.000 claims description 4
- 101710028856 B3GNT9 Proteins 0.000 claims description 4
- 206010004446 Benign prostatic hyperplasia Diseases 0.000 claims description 4
- 102100003635 C7orf50 Human genes 0.000 claims description 4
- 101710033401 C7orf50 Proteins 0.000 claims description 4
- 102100013516 CCDC179 Human genes 0.000 claims description 4
- 101710006946 CCDC179 Proteins 0.000 claims description 4
- 102100006219 CUEDC2 Human genes 0.000 claims description 4
- 108060001994 CUEDC2 Proteins 0.000 claims description 4
- 108090000312 Calcium Channels Proteins 0.000 claims description 4
- 102000003922 Calcium Channels Human genes 0.000 claims description 4
- 208000008787 Cardiovascular Disease Diseases 0.000 claims description 4
- 208000002177 Cataract Diseases 0.000 claims description 4
- 102100002765 DIO2 Human genes 0.000 claims description 4
- 101710004354 DIO2 Proteins 0.000 claims description 4
- 101700011083 FLNB Proteins 0.000 claims description 4
- 102100001843 FLNB Human genes 0.000 claims description 4
- 102100017957 GALNTL6 Human genes 0.000 claims description 4
- 101710036133 GALNTL6 Proteins 0.000 claims description 4
- 102100019867 GLT8D1 Human genes 0.000 claims description 4
- 101710005307 GLT8D1 Proteins 0.000 claims description 4
- 102100011439 GPR158 Human genes 0.000 claims description 4
- 101710028546 GPR158 Proteins 0.000 claims description 4
- 206010020772 Hypertension Diseases 0.000 claims description 4
- 206010061218 Inflammation Diseases 0.000 claims description 4
- 101700004018 KLF14 Proteins 0.000 claims description 4
- 102100006528 KLF14 Human genes 0.000 claims description 4
- 102100006811 MKLN1 Human genes 0.000 claims description 4
- 102100003415 MTRNR2L3 Human genes 0.000 claims description 4
- 101710010840 MTRNR2L3 Proteins 0.000 claims description 4
- 101700049202 MYO1C Proteins 0.000 claims description 4
- 102100015279 MYO1C Human genes 0.000 claims description 4
- 208000002780 Macular Degeneration Diseases 0.000 claims description 4
- 102100020130 NT5DC1 Human genes 0.000 claims description 4
- 101710024980 NT5DC1 Proteins 0.000 claims description 4
- 102100003825 OTUD7A Human genes 0.000 claims description 4
- 101710034775 OTUD7A Proteins 0.000 claims description 4
- 208000001132 Osteoporosis Diseases 0.000 claims description 4
- 102100014815 PDIA5 Human genes 0.000 claims description 4
- 101700039544 PDIA5 Proteins 0.000 claims description 4
- 102100017630 POLG2 Human genes 0.000 claims description 4
- 101710040002 POLG2 Proteins 0.000 claims description 4
- 101710038847 PRKCH Proteins 0.000 claims description 4
- 101700055899 PSD3 Proteins 0.000 claims description 4
- 102100017220 PSD3 Human genes 0.000 claims description 4
- 101700068924 PXN Proteins 0.000 claims description 4
- 206010061536 Parkinson's disease Diseases 0.000 claims description 4
- 102100012987 RIPPLY3 Human genes 0.000 claims description 4
- 101710010263 RIPPLY3 Proteins 0.000 claims description 4
- 101700001338 SIK1 Proteins 0.000 claims description 4
- 102100007230 SIM1 Human genes 0.000 claims description 4
- 101700075966 SIM1 Proteins 0.000 claims description 4
- 101710012143 SLC25A17 Proteins 0.000 claims description 4
- 102100013304 SLC25A17 Human genes 0.000 claims description 4
- 102100010798 SLC26A5 Human genes 0.000 claims description 4
- 101710022645 SLC26A5 Proteins 0.000 claims description 4
- 101710035845 TBC1D9 Proteins 0.000 claims description 4
- 102100014527 TBC1D9 Human genes 0.000 claims description 4
- 102100009267 TRPV3 Human genes 0.000 claims description 4
- 208000001072 Type 2 Diabetes Mellitus Diseases 0.000 claims description 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 claims description 4
- 101710010193 ZYG11A Proteins 0.000 claims description 4
- 102100013924 ZYG11A Human genes 0.000 claims description 4
- 108010012842 acetoacetyl-CoA synthetase Proteins 0.000 claims description 4
- 230000004075 alteration Effects 0.000 claims description 4
- 201000001320 atherosclerosis Diseases 0.000 claims description 4
- 239000011324 bead Substances 0.000 claims description 4
- 238000001369 bisulfite sequencing Methods 0.000 claims description 4
- 230000036772 blood pressure Effects 0.000 claims description 4
- 230000003920 cognitive function Effects 0.000 claims description 4
- 239000003814 drug Substances 0.000 claims description 4
- 229940079593 drugs Drugs 0.000 claims description 4
- 239000003344 environmental pollutant Substances 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 claims description 4
- 210000002865 immune cell Anatomy 0.000 claims description 4
- 238000001114 immunoprecipitation Methods 0.000 claims description 4
- 238000000126 in silico method Methods 0.000 claims description 4
- 230000004054 inflammatory process Effects 0.000 claims description 4
- 238000002844 melting Methods 0.000 claims description 4
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 claims description 4
- 229920001239 microRNA Polymers 0.000 claims description 4
- 239000003607 modifier Substances 0.000 claims description 4
- 108010027883 protein kinase C eta Proteins 0.000 claims description 4
- JUJWROOIHBZHMG-UHFFFAOYSA-N pyridine Chemical class C1=CC=NC=C1 JUJWROOIHBZHMG-UHFFFAOYSA-N 0.000 claims description 4
- 238000007619 statistical method Methods 0.000 claims description 4
- 230000001629 suppression Effects 0.000 claims description 4
- 229920000160 (ribonucleotides)n+m Polymers 0.000 claims description 2
- 102000009914 Adenosine deaminases Human genes 0.000 claims description 2
- 108091022188 Adenosine deaminases Proteins 0.000 claims description 2
- 102000008102 Ankyrins Human genes 0.000 claims description 2
- 108010049777 Ankyrins Proteins 0.000 claims description 2
- 102100013518 CCDC175 Human genes 0.000 claims description 2
- 101710006940 CCDC175 Proteins 0.000 claims description 2
- 102100003643 CGNL1 Human genes 0.000 claims description 2
- 101700078675 CGNL1 Proteins 0.000 claims description 2
- 210000003467 Cheek Anatomy 0.000 claims description 2
- 102000008186 Collagen Human genes 0.000 claims description 2
- 108010035532 Collagen Proteins 0.000 claims description 2
- 102000012432 Collagen Type V Human genes 0.000 claims description 2
- 108010022514 Collagen Type V Proteins 0.000 claims description 2
- 102100013694 DLL3 Human genes 0.000 claims description 2
- 101700003144 DLL3 Proteins 0.000 claims description 2
- 102000004190 Enzymes Human genes 0.000 claims description 2
- 108090000790 Enzymes Proteins 0.000 claims description 2
- 108020005198 Long Noncoding RNA Proteins 0.000 claims description 2
- 102100017454 NELL1 Human genes 0.000 claims description 2
- 108090000772 Neuropilin-1 Proteins 0.000 claims description 2
- 102000004316 Oxidoreductases Human genes 0.000 claims description 2
- 108090000854 Oxidoreductases Proteins 0.000 claims description 2
- 108020004532 RAS Proteins 0.000 claims description 2
- 102100020451 RBIS Human genes 0.000 claims description 2
- 101710003886 RBIS Proteins 0.000 claims description 2
- 102100017413 SEZ6L Human genes 0.000 claims description 2
- 101710003130 SEZ6L Proteins 0.000 claims description 2
- 102100015060 SPATA7 Human genes 0.000 claims description 2
- 101710010159 SPATA7 Proteins 0.000 claims description 2
- 102000009329 Sterile alpha motif domain Human genes 0.000 claims description 2
- 108050000172 Sterile alpha motif domain Proteins 0.000 claims description 2
- 229940035893 Uracil Drugs 0.000 claims description 2
- 102000003734 Voltage-gated potassium channels Human genes 0.000 claims description 2
- 108090000013 Voltage-gated potassium channels Proteins 0.000 claims description 2
- 102000024070 binding proteins Human genes 0.000 claims description 2
- 108091007650 binding proteins Proteins 0.000 claims description 2
- 210000004027 cells Anatomy 0.000 claims description 2
- 229920001436 collagen Polymers 0.000 claims description 2
- 229960005188 collagen Drugs 0.000 claims description 2
- 230000002708 enhancing Effects 0.000 claims description 2
- 238000000338 in vitro Methods 0.000 claims description 2
- 239000002679 microRNA Substances 0.000 claims description 2
- 239000003757 phosphotransferase inhibitor Substances 0.000 claims description 2
- 229920001184 polypeptide Polymers 0.000 claims description 2
- 102000004257 potassium channel family Human genes 0.000 claims description 2
- 108020001213 potassium channel family Proteins 0.000 claims description 2
- 238000000513 principal component analysis Methods 0.000 claims description 2
- 230000004952 protein activity Effects 0.000 claims description 2
- 238000003753 real-time PCR Methods 0.000 claims description 2
- 230000011664 signaling Effects 0.000 claims description 2
- 230000021595 spermatogenesis Effects 0.000 claims description 2
- 108091006091 transcriptional repressors Proteins 0.000 claims description 2
- 102100005409 COL23A1 Human genes 0.000 claims 2
- 101710030840 COL23A1 Proteins 0.000 claims 2
- 230000002596 correlated Effects 0.000 claims 1
- 235000007575 Calluna vulgaris Nutrition 0.000 description 1
- 241000353097 Molva molva Species 0.000 description 1
- 108060001608 PYROXD1 Proteins 0.000 description 1
- 102100015316 PYROXD1 Human genes 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
Description
このように、考慮されるCpGが全体的少数であるにもかかわらず、年齢の決定は最初に極めて高精度になり、時間と共に増す信頼度を有する。
本発明は、例えば、以下の項目を提供する。
(項目1)
年齢指標を決定するための方法であって、
(a)各個体について、
(i)ゲノムDNA配列のセットのDNAメチル化レベル、および
(ii)暦年齢
を含む、複数の個体の訓練データセットを準備するステップと、
(b)前記訓練データセットに、Least Absolute Shrinkage
and Selection Operator(LASSO)を含む回帰法を適用し、それにより、前記年齢指標および縮小訓練データセットを決定するステップであって、
独立変数が前記ゲノムDNA配列のメチル化レベルであり、好ましくは従属変数が前記年齢であり、
前記年齢指標が、
(i)集合としての前記ゲノムDNA配列のセットのサブセット、および
(ii)前記集合に含有されるゲノムDNA配列ごとに少なくとも1つの係数
を含み、
前記縮小訓練データセットが、前記訓練データセットのうち、前記LASSOによって除外される前記ゲノムDNA配列のDNAメチル化レベル以外の全てのデータを含む、ステップと
を含む方法。
(項目2)
個体の年齢を決定するための方法であって、
(a)各個体について、
(i)ゲノムDNA配列のセットのDNAメチル化レベル、および
(ii)暦年齢
を含む、複数の個体の訓練データセットを準備するステップと、
(b)前記訓練データセットに、Least Absolute Shrinkage
and Selection Operator(LASSO)を含む回帰法を適用し、それにより、前記年齢指標および縮小訓練データセットを決定するステップであって、
独立変数が前記ゲノムDNA配列のメチル化レベルであり、好ましくは従属変数が前記年齢であり、
前記年齢指標が、
(i)集合としての前記ゲノムDNA配列のセットのサブセット、および
(ii)前記集合に含有されるゲノムDNA配列ごとに少なくとも1つの係数
を含み、
前記縮小訓練データセットが、前記訓練データセットのうち、前記LASSOによって除外されるゲノムDNA配列のDNAメチル化レベル以外の全てのデータを含む、ステップと、
(c)年齢が決定される個体について前記年齢指標に含まれるゲノムDNA配列の少なくとも80%、好ましくは100%に関するDNAメチル化レベルをもたらすステップと、
(d)前記個体の年齢を、そのDNAメチル化レベルおよび前記年齢指標に基づいて決定するステップと
を含み、
好ましくは前記決定された年齢が前記個体の暦年齢と異なり得る、方法。
(項目3)
前記回帰法が、前記LASSOの後にステップワイズ回帰を適用することをさらに含む、項目1または2に記載の方法。
(項目4)
前記ステップワイズ回帰を前記縮小訓練データセットに適用する、項目3に記載の方法。
(項目5)
前記年齢指標に含まれる前記集合が、前記ゲノムDNA配列のセットよりも小さい、項目1から4のいずれかに記載の方法。
(項目6)
前記年齢指標に含まれる前記集合が、前記縮小訓練データセットに含まれるゲノムDNA配列のセットよりも小さい、項目1から5のいずれかに記載の方法。
(項目7)
前記ステップワイズ回帰が双方向除外であり、統計学的に有意でない独立変数が除去され、好ましくは有意レベルが0.05である、項目3から6のいずれかに記載の方法。
(項目8)
前記LASSOを、biglasso Rパッケージを用いて、好ましくはコマンド「cv.biglasso」を適用することによって実施し、好ましくは「nfold」が20である、項目1から7のいずれかに記載の方法。
(項目9)
前記回帰法が、リッジ回帰(L2正則化)を含まないかまたは前記L2正則化パラメータ/ラムダパラメータが0である、項目1から8のいずれかに記載の方法。
(項目10)
前記LASSO L1正則化パラメータ/アルファパラメータが1である、項目1から9のいずれかに記載の方法。
(項目11)
各繰り返しにおいて少なくとも1つのさらなる個体のデータを前記訓練データに追加し、それにより、前記訓練データセットを繰り返し拡大することを含めて、前記年齢指標を繰り返し更新する、項目1から10のいずれかに記載の方法。
(項目12)
1回の更新ラウンドにおいて、さらなる個体のそれぞれに関する追加されるデータが、
(i)最初の訓練データセット、または拡大訓練データセットのいずれかに含まれるゲノムDNA配列のセットの少なくとも5%、好ましくは50%、より好ましくは100%、および/または
(ii)前記縮小訓練データセットに含有されるゲノムDNA配列
に関する前記個体のDNAメチル化レベルを含む、項目11に記載の方法。
(項目13)
前記拡大訓練データセットにデータを寄与する全ての個体に関して存在しないゲノムDNA配列(独立変数)は全て前記拡大訓練データセットから除去する、項目11または12に記載の方法。
(項目14)
1回の更新ラウンドにおいて、メチル化レベルが追加される前記ゲノムDNA配列のセットが、前記さらなる個体(複数可)のそれぞれについて同一である、項目11から13のいずれかに記載の方法。
(項目15)
1回の更新ラウンドが、前記LASSOを前記拡大訓練データセットに適用し、それにより、更新された年齢指標および/または更新された縮小訓練データセットを決定することを含む、項目11から14のいずれかに記載の方法。
(項目16)
前記少なくとも1つのさらなる個体に関するデータが追加される訓練データセットが、最初の縮小訓練データセット、または前記更新された縮小訓練データセットのいずれかであり得る縮小訓練データセットである、項目11から15のいずれかに記載の方法。
(項目17)
前記縮小訓練データセットが、前記繰り返しにおける前の縮小訓練データセットである、項目16に記載の方法。
(項目18)
1回の更新ラウンドが、前記ステップワイズ回帰を前記縮小訓練データセットに適用し、それにより、更新された年齢指標を決定することを含む、項目11から17のいずれかに記載の方法。
(項目19)
1回の更新ラウンドにおいて、少なくとも1つの個体に関するデータを前記訓練データセットおよび/または前記縮小訓練データセットから除去する、項目1から18のいずれかに記載の方法。
(項目20)
個体のデータの追加および/または除去が、前記個体の少なくとも1つの特徴に依存し、前記特徴が、民族、性別、暦年齢、居住地、出生地、少なくとも1つの疾患および/または少なくとも1つの生活様式因子であり、前記生活様式因子が、薬物消費、環境汚染物質への曝露、交代勤務またはストレスから選択される、項目11から19のいずれかに記載の方法。
(項目21)
前記年齢指標の質を決定し、前記質の決定が、
(a)前記訓練データセットにデータを寄与していない複数の個体に関する試験データセットを準備するステップであって、前記試験データセットが、前記個体のそれぞれについて、
(i)前記年齢指標に含まれるゲノムDNA配列のセットの前記DNAメチル化レベル、および
(ii)前記暦年齢
を含む、ステップと、
(b)前記年齢指標の質を統計学的評価および/またはドメイン境界の評価によって決定するステップであって、
前記統計学的評価が、
(i)前記試験データセットに含まれる個体の年齢を決定するステップと、
(ii)前記個体(複数可)の決定された年齢と暦年齢を相関させ、この相関を説明する少なくとも1つの統計学的パラメータを決定するステップと、
(iii)前記統計学的パラメータ(複数可)が、前記年齢指標の許容される質を示すものか否かを判定するステップであって、好ましくは前記統計学的パラメータが決定係数(R 2 )および平均絶対誤差(MAE)から選択され、R 2 が0.50よりも大きい、好ましくは0.70よりも大きい、好ましくは0.90よりも大きい、好ましくは0.98よりも大きいことおよび/またはMAEが6歳未満、好ましくは4歳未満、好ましくは最大1歳であることは、許容される質を示す、ステップと
を含み、
ドメイン境界の評価が、
(iv)前記年齢指標のドメイン境界を決定するステップであって、
前記ドメイン境界が、前記年齢指標に含まれる各ゲノムDNA配列の最小DNAメチル化レベルおよび最大DNAメチル化レベルであり、
前記最小DNAメチル化レベルおよび最大DNAメチル化レベルが、前記年齢指標を決定するために使用された訓練データセットにおいて見いだされる、
ステップと、
(v)前記試験データセットが前記ドメイン境界を超えるかどうかを決定するステップであって、前記ドメイン境界を越えないことは、許容される質を示す、ステップと
を含む、ステップと
を含む、項目1から20のいずれかに記載の方法。
(項目22)
前記訓練データセットおよび/または前記試験データセットが、少なくとも10の個体、好ましくは少なくとも30の個体、好ましくは少なくとも200の個体を含み、好ましくは前記訓練データセットが少なくとも200の個体を含み、かつ前記試験データセットが少なくとも30の個体を含む、項目1から21のいずれかに記載の方法。
(項目23)
前記年齢指標は、その質が許容されないものである場合には更新される、項目21または22に記載の方法。
(項目24)
前記個体の前記年齢は、当該個体のDNAメチル化レベル、および更新された年齢指標に基づいて決定される、項目11から23のいずれかに記載の方法。
(項目25)
前記個体のデータが前記年齢指標の生成に使用される訓練データセットに寄与していない場合には、当該個体の年齢が前記年齢指標のみを用いて決定される、項目2から24のいずれかに記載の方法。
(項目26)
前記データに含まれる個体の数が所定の値に達している、かつ/または前の更新から所定の時間が経過している場合には、前記年齢指標がさらに更新されない、項目1から25のいずれかに記載の方法。
(項目27)
前記訓練データセットに含まれるゲノムDNA配列のセットが、メチル化レベルを暦年齢に関連付けることができるゲノムDNA配列から事前選択されたものである、項目1から26のいずれかに記載の方法。
(項目28)
前記事前選択されたセットが、少なくとも400000、好ましくは少なくとも800000のゲノムDNA配列を含む、項目27に記載の方法。
(項目29)
前記訓練データセットに含まれるゲノムDNA配列が、互いに重複せず、かつ/または対立遺伝子当たり1度しか生じない、項目1から28のいずれかに記載の方法。
(項目30)
前記縮小訓練データセットが、少なくとも90、好ましくは少なくとも100、好ましくは少なくとも140のゲノムDNA配列を含む、項目1から29のいずれかに記載の方法。
(項目31)
前記縮小訓練データセットが、5000未満、好ましくは2000未満、好ましくは500未満、好ましくは350未満、好ましくは300未満のゲノムDNA配列を含む、項目1から30のいずれかに記載の方法。
(項目32)
前記年齢指標が、少なくとも30、好ましくは少なくとも50、好ましくは少なくとも60、好ましくは少なくとも80のゲノムDNA配列を含む、項目1から31のいずれかに記載の方法。
(項目33)
前記年齢指標が、300未満、好ましくは150未満、好ましくは110未満、好ましくは100未満、好ましくは90未満のゲノムDNA配列を含む、項目1から32のいずれかに記載の方法。
(項目34)
個体のゲノムDNA配列の前記DNAメチル化レベルが、前記ゲノムDNA配列を含む前記個体の生物材料の試料において測定されたものである、項目1から33のいずれかに記載の方法。
(項目35)
前記試料が、口腔細胞を含む、項目34に記載の方法。
(項目36)
試料を非侵襲的に得るステップをさらに含む、項目34または35のいずれかに記載の方法。
(項目37)
前記DNAメチル化レベルが、メチル化シーケンシング、バイサルファイトシーケンシング、PCR法、高分解能融解分析(HRM)、メチル化感受性一塩基プライマー伸長(MS-SnuPE)、メチル化感受性一本鎖コンフォメーション分析、メチル感受性切断計数(MSCC)、塩基特異的切断/MALDI-TOF、複合バイサルファイト制限分析(COBRA)、メチル化DNA免疫沈降(MeDIP)、マイクロアレイに基づく方法、ビーズアレイに基づく方法、パイロシーケンシングおよび/またはバイサルファイト処理を伴わない直接シーケンシング(ナノポア技術)によって測定されたものである、項目34から36のいずれかに記載の方法。
(項目38)
個体のゲノムDNA配列の前記DNAメチル化レベルが、塩基特異的切断/MALDI-TOFおよび/またはPCR法で測定されたものであり、塩基特異的切断/MALDI-TOFはAgena技術であり、好ましくは前記PCR法がメチル化特異的PCRである、項目34から37のいずれかに記載の方法。
(項目39)
前記年齢指標に含まれる前記ゲノムDNA配列の前記DNAメチル化レベルが、年齢が決定される個体の前記ゲノムDNA配列を含む生物材料の試料において決定されたものである、項目34から38のいずれかに記載の方法。
(項目40)
cg11330075、cg25845463、cg22519947、cg21807065、cg09001642、cg18815943、cg06335143、cg01636910、cg10501210、cg03324695、cg19432688、cg22540792、cg11176990、cg00097800、cg27320127、cg09805798、cg03526652、cg09460489、cg18737844、cg07802350、cg10522765、cg12548216、cg00876345、cg15761531、cg05990274、cg05972734、cg03680898、cg16593468、cg19301963、cg12732998、cg02536625、cg24088134、cg24319133、cg03388189、cg05106770、cg08686931、cg25606723、cg07782620、cg16781885、cg14231565、cg18339380、cg25642673、cg10240079、cg19851481、cg17665505、cg13333913、cg07291317、cg12238343、cg08478427、cg07625177、cg03230469、cg13154327、cg16456442、cg26430984、cg16867657、cg24724428、cg08194377、cg10543136、cg12650870、cg00087368、cg17760405、cg21628619、cg01820962、cg16999154、cg22444338、cg00831672、cg08044253、cg08960065、cg07529089、cg11607603、cg08097417、cg07955995、cg03473532、cg06186727、cg04733826、cg20425444、cg07513002、cg14305139、cg13759931、cg14756158、cg08662753、cg13206721、cg04287203、cg18768299、cg05812299、cg04028695、cg07120630、cg17343879、cg07766948、cg08856941、cg16950671、cg01520297、cg27540719、cg24954665、cg05211227、cg06831571、cg19112204、cg12804730、cg08224787、cg13973351、cg21165089、cg05087008、cg05396610、cg23677767、cg21962791、cg04320377、cg16245716、cg21460868、cg09275691、cg19215678、cg08118942、cg16322747、cg12333719、cg23128025、cg27173374、cg02032962、cg18506897、cg05292016、cg16673857、cg04875128、cg22101188、cg07381960、cg06279276、cg22077936、cg08457029、cg20576243、cg09965557、cg03741619、cg04525002、cg15008041、cg16465695、cg16677512、cg12658720、cg27394136、cg14681176、cg07494888、cg14911690、cg06161948、cg15609017、cg10321869、cg15743533、cg19702785、cg16267121、cg13460409、cg19810954、cg06945504、cg06153788、およびcg20088545のうちの少なくとも10種、好ましくは少なくとも50種、好ましくは少なくとも70種、好ましくは全て、または連続ヌクレオチド配列の少なくとも70%、好ましくは少なくとも90%を含むその断片を含むゲノムDNA配列の集合。
(項目41)
cg11330075、cg00831672、cg27320127、cg27173374、cg14681176、cg06161948、cg08224787、cg05396610、cg15609017、cg09805798、cg19215678、cg12333719、cg03741619、cg16677512、cg03230469、cg19851481、cg10543136、cg07291317、cg26430984、cg16950671、cg16867657、cg22077936、cg08044253、cg12548216、cg05211227、cg13759931、cg08686931、cg07955995、cg07529089、cg01520297、cg00087368、cg05087008、cg24724428、cg19112204、cg04525002、cg08856941、cg16465695、cg08097417、cg21628619、cg09460489、cg13460409、cg25642673、cg19702785、cg18506897、cg21165089、cg27540719、cg21807065、cg18815943、cg23677767、cg07802350、cg11176990、cg10321869、cg17343879、cg08662753、cg14911690、cg12804730、cg16322747、cg14231565、cg10501210、cg09275691、cg15008041、cg05812299、cg24319133、cg12658720、cg20576243、cg03473532、cg07381960、cg05106770、cg04320377、cg19432688、cg22519947、cg06831571、cg08194377、cg01636910、cg14305139、cg04028695、cg15743533、cg03680898、cg20088545、cg13333913、cg19301963、cg13973351、cg16781885、cg04287203、cg27394136、cg10240079、cg02536625、およびcg23128025の少なくとも4種、好ましくは少なくとも10種、好ましくは少なくとも30種、好ましくは少なくとも70種、好ましくは全て、または連続ヌクレオチド配列の少なくとも70%、好ましくは少なくとも90%を含むその断片を含む、項目39に記載のゲノムDNA配列の集合。
(項目42)
cg11330075、cg00831672、cg27320127、cg27173374、cg14681176、cg06161948、cg08224787、cg05396610、cg15609017、cg09805798、cg19215678、cg12333719、cg03741619、cg03230469、cg19851481、cg10543136、cg07291317、cg26430984、cg16950671、cg16867657、cg13973351、cg16781885、cg04287203、cg27394136、cg10240079、cg02536625、およびcg23128025のうちの少なくとも4種、好ましくは少なくとも10種、好ましくは全てを含む、項目41に記載のゲノムDNA配列の集合。
(項目43)
cg11330075、cg00831672、cg27320127、cg10240079、cg02536625、およびcg23128025のうちの少なくとも4種、好ましくは全てを含む、項目41または42に記載のゲノムDNA配列の集合。
(項目44)
前記ゲノムDNA配列の集合に加えておよび/またはその代わりに、その相補配列を含む、項目40から43のいずれかに記載のゲノムDNA配列の集合。
(項目45)
SIM bHLH転写因子1(SIM1)、微小管関連タンパク質4(MAP4)、プロテインキナーゼCゼータ(PRKCZ)、グルタミン酸イオンチャネル型受容体AMPA型サブユニット4(GRIA4)、BCL10、免疫シグナル伝達アダプター(BCL10)、5’-ヌクレオチダーゼドメイン含有1(NT5DC1)、腫瘍形成能抑制7(ST7)、プロテインキナーゼCイータ(PRKCH)、グリア細胞由来神経栄養因子(GDNF)、ムスケリン1(MKLN1)、エクソシスト複合体成分6B(EXOC6B)、プロテインS(PROS1)、電位依存性カルシウムチャネルサブユニットアルファ1D(CACNA1D)、ケルチ様ファミリーメンバー42(KLHL42)、OTUデユビキチナーゼ7A(OTUD7A)、細胞死関連タンパク質(DAP)、コイルドコイルドメイン含有179(CCDC179)、ヨードチロニン脱ヨード酵素2(DIO2)、一過性受容体電位カチオンチャネルサブファミリーVメンバー3(TRPV3)、MT-RNR2様5(MTRNR2L5)、フィラミンB(FLNB)、フューリン、対塩基性アミノ酸切断酵素(FURIN)、溶質運搬体ファミリー25メンバー17(SLC25A17)、Gパッチドメイン含有1(GPATCH1)、UDP-GlcNAc:ベータGalベータ-1,3-N-アセチルグルコサミニルトランスフェラーゼ9(B3GNT9)、zyg-11ファミリーメンバーA、細胞周期調節因子(ZYG11A)、発作関連6ホモログ様(SEZ6L)、ミオシンX(MYO10)、アセチル-CoAカルボキシラーゼアルファ(ACACA)、Gタンパク質サブユニットアルファi1(GNAI1)、CUEドメイン含有2(CUEDC2)、ホメオボックスD13(HOXD13)、クルッペル様因子14(KLF14)、溶質運搬体ファミリー1メンバー2(SLC1A2)、アセトアセチルCoAシンテターゼ(AACS)、アンキリンリピートおよび無菌アルファモチーフドメイン含有1A(ANKS1A)、マイクロRNA 7641-2(MIR7641-2)、V型コラーゲンアルファ1鎖(COL5A1)、亜ヒ酸塩メチルトランスフェラーゼ(AS3MT)、溶質運搬体ファミリー26メンバー5(SLC26A5)、ヌクレオポリン107(NUP107)、長鎖遺伝子間タンパク質ノンコーディングRNA1797(LINC01797)、ミオシンIC(MYO1C)、アンキリンリピートドメイン37(ANKRD37)、ホスホジエステラーゼ4C(PDE4C)、EFハンドドメイン含有1(EFHC1)、特徴不明のLOC375196(LOC375196)、ELOVL脂肪酸エロンガーゼ2(ELOVL2)、WASタンパク質ファミリーメンバー3(WASF3)、17番染色体オープンリーディングフレーム82(C17orf82)、Gタンパク質共役型受容体158(GPR158)、Fボックスおよびロイシンリッチリピートタンパク質7(FBXL7)、リプリー転写リプレッサー3(RIPPLY3)、ESCRT-IのVPS37Cサブユニット(VPS37C)、ポリペプチドN-アセチルガラクトサミン転移酵素様6(GALNTL6)、DENNドメイン含有3(DENND3)、核受容体コリプレッサー2(NCOR2)、内皮PASドメインタンパク質1(EPAS1)、PBXホメオボックス4(PBX4)、長鎖遺伝子間タンパク質ノンコーディングRNA1531(LINC01531)、配列類似性を有するファミリー110メンバーA(FAM110A)、グリコシルトランスフェラーゼ8ドメイン含有1(GLT8D1)、Gタンパク質サブユニットガンマ2(GNG2)、MT-RNR2様3(MTRNR2L3)、ジンクフィンガータンパク質140(ZNF140)、ras1のキナーゼ抑制因子(KSR1)、タンパク質ジスルフィドイソメラーゼファミリーAメンバー5(PDIA5)、精子形成関連7(SPATA7)、パントテン酸キナーゼ1(PANK1)、ユビキチン特異的ペプチダーゼ4(USP4)、Gタンパク質サブユニットアルファq(GNAQ)、電位依存性カリウムチャネル修飾因子サブファミリーSメンバー1(KCNS1)、DNAポリメラーゼガンマ2、アクセサリーサブユニット(POLG2)、ストークヘッドボックス2(STOX2)、ニューレキシン3(NRXN3)、BMS1、リボソーム生合成因子(BMS1)、フォークヘッドボックスE3(FOXE3)、NADH:ユビキノンオキシドレダクターゼサブユニットA10(NDUFA10)、レラキシンファミリーペプチド受容体3(RXFP3)、GATA結合性タンパク質2(GATA2)、イソプレノイドシンターゼドメイン含有(ISPD)、アデノシンデアミナーゼ、RNA特異的B1(ADARB1)、Wntファミリーメンバー7B(WNT7B)、プレクストリンおよびSec7ドメイン含有3(PSD3)、膜アンカー型ジャンクションタンパク質(MAJIN)、ピリジンヌクレオチド-ジスルフィドオキシドレダクターゼドメイン1(PYROXD1)、シンギュリン様1(CGNL1)、7番染色体オープンリーディングフレーム50(C7orf50)、MORNリピート含有1(MORN1)、アトラスチンGTPアーゼ2(ATL2)、WDリピートおよびFYVEドメイン含有2(WDFY2)、膜貫通タンパク質136(TMEM136)、イノシトールポリリン酸-5-ホスファターゼA(INPP5A)、TBC1ドメインファミリーメンバー9(TBC1D9)、インターフェロン調節因子2(IRF2)、サーチュイン7(SIRT7)、XXIII型コラーゲンアルファ1鎖(COL23A1)、グアニン一リン酸シンターゼ(GMPS)、カリウム2孔ドメインチャネルサブファミリーKメンバー12(KCNK12)、SIN3-HDAC複合体関連因子(SINHCAF)、ヘモグロビンサブユニットイプシロン1(HBE1)、ならびにチューダードメイン含有1(TDRD1)のうちの少なくとも10種、好ましくは少なくとも30種、好ましくは少なくとも50種、好ましくは少なくとも70種、好ましくは全てを含む遺伝子セット。
(項目46)
ISPD、KCNK12、GNG2、SIRT7、GPATCH1、GRIA4、LINC01531、LOC101927577、NCOR2、WASF3、TRPV3、ACACA、GDNF、EFHC1、MYO10、COL23A1、TDRD1、ELOVL2、GNAI1、MAP4、CCDC179、KLF14、ST7、INPP5A、SIM1、SLC1A2、AS3MT、KSR1、DSCR6、IRF2、KCNS1、NRXN3、C11orf85、HBE1、FOXE3、TMEM136、HOXD13、LOC375196、PANK1、MIR107、COL5A1、PBX4、ZNF140、GALNTL6、NUP107、LOC100507250、MTRNR2L5、C17orf82、MKLN1、FURIN、KLHL42、MORN1、ANKS1A、BCL10、DENND3、FAM110A、PROS1、WNT7B、FBXL7、GATA2、VPS37C、NRP1、POLG2、ANKRD37、GMPS、およびWDFY2のうちの少なくとも5種、好ましくは少なくとも10種、好ましくは少なくとも30種、好ましくは全てを含む、項目45に記載の遺伝子セット。
(項目47)
微小管関連タンパク質4(MAP4)、プロテインキナーゼCゼータ(PRKCZ)、グルタミン酸イオンチャネル型受容体AMPA型サブユニット4(GRIA4)、腫瘍形成能抑制7(ST7)、プロテインキナーゼCイータ(PRKCH)、電位依存性カルシウムチャネルサブユニットアルファ1D(CACNA1D)、細胞死関連タンパク質(DAP)、一過性受容体電位カチオンチャネルサブファミリーVメンバー3(TRPV3)、フューリン、対塩基性アミノ酸切断酵素(FURIN)、アセチル-CoAカルボキシラーゼアルファ(ACACA)、Gタンパク質サブユニットアルファi1(GNAI1)、溶質運搬体ファミリー1メンバー2(SLC1A2)、ホスホジエステラーゼ4C(PDE4C)、ELOVL脂肪酸エロンガーゼ2(ELOVL2)、核受容体コリプレッサー2(NCOR2)、内皮PASドメインタンパク質1(EPAS1)、Gタンパク質サブユニットガンマ2(GNG2)、パントテン酸キナーゼ1(PANK1)、ユビキチン特異的ペプチダーゼ4(USP4)、Gタンパク質サブユニットアルファq(GNAQ)、電位依存性カリウムチャネル修飾因子サブファミリーSメンバー1(KCNS1)、DNAポリメラーゼガンマ2、アクセサリーサブユニット(POLG2)、NADH:ユビキノンオキシドレダクターゼサブユニットA10(NDUFA10)、レラキシンファミリーペプチド受容体3(RXFP3)、イソプレノイドシンターゼドメイン含有(ISPD)、イノシトールポリリン酸-5-ホスファターゼA(INPP5A)、サーチュイン7(SIRT7)、グアニン一リン酸シンターゼ(GMPS)、SIN3-HDAC複合体関連因子(SINHCAF)、チューダードメイン含有1(TDRD1)のうちの少なくとも5種、好ましくは少なくとも10種、好ましくは少なくとも20種、好ましくは全てを含む、項目45に記載の遺伝子セット。
(項目48)
前記ゲノムDNA配列の集合が、項目2から39に記載の方法による縮小訓練データセットおよび/または年齢指標に含まれ、
前記遺伝子セットが、タンパク質、またはマイクロRNAもしくは長鎖ノンコーディングRNAをコードする前記ゲノムDNA配列の集合から選択することによって得られる、項目2から39に記載の方法によって得られる項目40から44のいずれかに記載のゲノムDNA配列の集合または項目45から47のいずれかに記載の遺伝子セット。
(項目49)
個体の健康状態の診断における使用のための、項目40から44または48に記載のゲノムDNA配列の集合、または項目45から48のいずれかに記載の遺伝子セット。
(項目50)
前記健康状態が、少なくとも1つの老化関連疾患、少なくとも1つの老化関連疾患に関連付けられる少なくとも1つの表現型、および/またはがんの状態を含み、
前記状態は、前記疾患、または疾患に関連付けられる表現型の非存在、存在、またはステージを示す、
項目49に記載の使用のためのゲノムDNA配列の集合または遺伝子セット。
(項目51)
前記老化関連疾患が、アルツハイマー病、パーキンソン病、アテローム性動脈硬化症、心血管疾患、がん、関節炎、白内障、骨粗鬆症、2型糖尿病、高血圧症、老化黄斑変性症および/または良性前立腺肥大症である、項目50に記載の使用のためのゲノムDNA配列の集合または遺伝子セット。
(項目52)
個体のフィットネス状態を決定するための、項目40から44もしくは48のいずれかに記載のゲノムDNA配列の集合、または項目45から48のいずれかに記載の遺伝子セットの使用。
(項目53)
前記フィットネス状態が、前記個体の血圧、体重、免疫細胞のレベル、炎症のレベルおよび/または認知機能を含む、項目52に記載の使用。
(項目54)
個体の健康状態および/またはフィットネス状態を診断するための方法であって、項目40から44もしくは48のいずれかに記載のゲノムDNA配列の集合、または項目45から48のいずれかに記載の遺伝子セットを準備するステップを含む方法。
(項目55)
前記ゲノムDNA配列を含む前記個体の生体試料中の前記ゲノムDNA配列のメチル化レベルを決定するステップをさらに含む、項目54に記載の方法。
(項目56)
前記健康状態が、少なくとも1つの老化関連疾患、少なくとも1つの老化関連疾患に関連付けられる少なくとも1つの表現型、および/またはがんの状態を含み、
好ましくは前記老化関連疾患が、アルツハイマー病、パーキンソン病、アテローム性動脈硬化症、心血管疾患、がん、関節炎、白内障、骨粗鬆症、2型糖尿病、高血圧症、老化黄斑変性症および/または良性前立腺肥大症であり、かつ/または
前記フィットネス状態が、前記個体の血圧、体重、免疫細胞のレベル、炎症のレベルおよび/または認知機能を含む、
項目54または55に記載の方法。
(項目57)
前記生体試料が、非侵襲的に、好ましくは頬スワブによって得たものである、項目55または56に記載の方法。
(項目58)
老化に影響を及ぼす分子を同定するためのin silicoおよび/またはin vitroスクリーニング方法であって、項目40から44もしくは48のいずれかに記載のゲノムDNA配列の集合、または項目45から48のいずれかに記載の遺伝子セットを準備するステップを含み、
前記分子が、個体に投与されると、少なくとも1つの老化関連疾患、少なくとも1つの老化関連疾患に関連付けられる少なくとも1つの表現型、および/またはがんを好転させる、防止するおよび/または逆転させるものである、方法。
(項目59)
前記ゲノムDNA配列のうちの少なくとも1つのDNAメチル化レベルを決定するステップをさらに含む、項目58に記載の方法。
(項目60)
同定された分子が、個体に投与されると、前記個体における前記ゲノムDNA配列のうちの少なくとも1つのDNAメチル化レベルを上昇させ、かつ/または、前記個体における前記ゲノムDNA配列のうちの少なくとも1つのDNAメチル化レベルを低下させるものである、項目58または59に記載の方法。
(項目61)
前記DNAメチル化レベルが、変更前よりも若い暦年齢に関連付けられるように変更される、項目60に記載の方法。
(項目62)
項目45から48に記載の遺伝子セットを準備し、前記遺伝子セットによってコードされる少なくとも1種のタンパク質の活性を決定するステップをさらに含む、項目58から61のいずれかに記載の方法。
(項目63)
前記同定された分子が、前記遺伝子セットによってコードされる少なくとも1種のタンパク質の活性を阻害し、かつ/または、前記遺伝子セットによってコードされる少なくとも1種のタンパク質の活性を増強するものである、項目62に記載の方法。
(項目64)
前記タンパク質活性が、変更前よりも若い暦年齢に関連付けられるように変更される、項目63に記載の方法。
(項目65)
項目40から44もしくは48のいずれかに記載のゲノムDNA配列の集合、または項目45から48のいずれかに記載の遺伝子セットをスポットとして含むチップであって、各配列が、別々のスポットに含有される、チップ。
(項目66)
少なくとも1つの独特のプライマー対を含むキットであって、
各プライマー対のうち一方のプライマーが、項目40から44もしくは48のいずれかに記載のゲノムDNA配列の集合に含まれるゲノムDNA配列のうちの1つまたは項目45から48のいずれかに記載の遺伝子セットに含まれる遺伝子のうちの1つのリバース鎖に結合するフォワードプライマーであり、他方のプライマーが、フォワード鎖に結合するリバースプライマーであり、
前記フォワードプライマーおよびリバースプライマーの3’末端と相補的な2つのヌクレオチドが、30ヌクレオチド超3000ヌクレオチド未満、好ましくは1000ヌクレオチド未満離れている、
キット。
(項目67)
項目40から44もしくは48のいずれかに記載のゲノムDNA配列の集合に含まれるゲノムDNA配列のうちの1つまたは項目45から48のいずれかに記載の遺伝子セットに含まれる遺伝子のうちの1つと相補的なプローブを少なくとも1つ含むキット。
(項目68)
前記プライマーまたはプローブが、メチル化されたDNAまたはメチル化されていないDNAのいずれかに特異的に結合し、メチル化されていないシトシンが、ウラシルに変換されている、項目65または66に記載のキット。
(項目69)
項目65に記載のチップを含むキット。
(項目70)
生物材料用の容器および/または頬スワブ用の材料をさらに含む、項目51から57のいずれかに記載のキット。
(項目71)
生体試料からゲノムDNAを抽出し、精製し、かつ/または増幅するための材料をさらに含み、前記材料が、スピンカラムおよび/または酵素である、項目66から70のいずれかに記載のキット。
(項目72)
亜硫酸水素塩をさらに含む、項目66から71のいずれかに記載のキット。
(項目73)
項目2から39のいずれかに記載の方法、項目40から44もしくは48のいずれかに記載のゲノムDNA配列の集合、および/または項目45から48のいずれかに記載の遺伝子セットによって得られた年齢指標を含むデータキャリア。
(項目74)
年齢が決定される個体に関する調査票をさらに含み、前記調査票が、無記入であり得るまたは前記個体に関する情報を含み得る、項目66から72のいずれかに記載のキットまたは項目73に記載のデータキャリア。
(項目75)
前記訓練データセット、縮小訓練データセットおよび/または追加されたデータが、前記個体(複数可)に関連付けることができる生活様式またはリスクパターンに関する少なくとも1つの因子をさらに含む、項目1から39のいずれかに記載の方法。
(項目76)
前記因子が、薬物消費、環境汚染物質、交代勤務およびストレスから選択される、項目75に記載の方法。
(項目77)
前記訓練データセットおよび/または前記縮小訓練データセットが、DNAメチル化レベルおよび/またはコードされるタンパク質の活性/レベルが前記生活様式因子のうちの少なくとも1つに関連付けられる配列に限定される、項目75または76に記載の方法。
(項目78)
前記個体の決定された年齢と暦年齢の差に関連付けられる少なくとも1つの生活様式因子を決定するステップをさらに含む、項目75から77のいずれかに記載の方法。
(項目79)
一連の個体中の個体に対する年齢指標を決定する方法であって、前記決定が、前記個体において見いだされるゲノムDNA配列のメチル化のレベルに基づくものであり、
前記個体の年齢に関連付けることができるメチル化のレベルを有するゲノムDNA配列のセットから選択されるゲノムDNA配列の集合のメチル化レベルに基づいて、
前記個体についての年齢指標が、複数の個体についてのゲノムDNA配列のメチル化のレベルの統計学的評価に依拠する様式でもたらされる、方法において、
前記個体についての前記年齢指標が、一連の個体の中で先行する個体について同じ年齢指標を決定するために使用した先行する統計学的評価のために参照した複数の個体とは異なる複数の個体についてのゲノムDNA配列のメチル化のレベルの統計学的評価に依拠する様式でもたらされ、
第1の統計学的評価のために使用された複数の個体が、少なくとも、一連の個体からの追加的な先行する少なくとも1つの個体が含められることによって修正されるという点で、前記複数の個体に差異が生じ、
好ましくは前記個体についての前記年齢指標が、2つの異なる複数の個体についての少なくとも2つの異なる統計学的評価の結果、集合のメチル化レベルから前記年齢指標を算出した場合に使用した少なくとも1つの係数に変化が生じ、かつ/または見いだされる異なるゲノムDNA配列またはCgP遺伝子座のメチル化のレベルが考慮される様式でもたらされる
ことを特徴とする方法。
(項目80)
前記個体の年齢に関連付けることができるメチル化のレベルを有するゲノムDNA配列からゲノムDNA配列のセットを準備するステップと、
複数の個体について、前記セットのゲノムDNA配列のメチル化のレベルを決定するステップと、
前記セットからゲノムDNA配列の集合を選択するステップであって、
前記集合内のゲノムDNA配列の数が前記セット内のゲノムDNA配列の数よりも少ないかまたはそれと等しくなり、
かつ
前記集合の配列のメチル化レベルに基づいて前記個体の年齢を算出することができるように選択するステップと、
前記個体由来の生物材料の試料において、少なくとも前記集合の配列のメチル化のレベルを決定するステップと、
前記集合の配列のメチル化のレベルに基づいて前記個体の年齢を算出するステップと、
特に、統計学的評価を考慮して、前記集合のゲノムDNA配列を再選択する必要があるか否か、および/または前記個体の年齢をメチル化のレベルに基づいて算出するやり方を変更すべきか否かを判定するステップと、
前記判定に応じて、前記個体を含むように個体の群を修正するステップと、
修正された群の個体のメチル化のレベルの決定に基づいて前記セットからゲノムDNA配列の集合を再選択するステップ
および/または
集合のメチル化レベルから前記年齢指標を算出した場合に使用した少なくとも1つの係数を変化させるステップ
のうちの少なくとも1つと
を含む、個体において見いだされるゲノムDNA配列のメチル化のレベルに基づく、項目79に記載の個体の年齢を決定する方法。
(項目81)
前記個体の年齢に関連付けることができるメチル化のレベルを有するゲノムDNA配列からゲノムDNA配列のセットを事前選択するステップと、
複数の個体について、前記事前選択されたゲノムDNA配列のメチル化のレベルを決定するステップと、
前記事前選択されたセットからゲノムDNA配列の集合を選択するステップであって、
前記集合内のゲノムDNA配列の数が前記事前選択されたセット内のゲノムDNA配列の数よりも少なくなり、
前記集合の配列のメチル化レベルに基づいて前記個体の年齢を算出することができ、かつ
算出された年齢に関する統計学的評価は、前記算出された年齢の許容される質を示すように選択するステップと、
前記個体由来の生物材料の試料において前記集合の配列のメチル化のレベルを決定するステップと、
前記集合の配列のメチル化のレベルに基づいて前記個体の年齢を算出するステップと、
前記算出された年齢の質の統計学的評価基準を算出するステップと、
前記統計学的評価基準に従った質が許容されるものであるか否かを判定するステップと、
前記質が許容されるものと判断された場合、前記個体の算出された年齢を出力するステップと、
前記質が許容できないものと判断された場合、ゲノムDNA配列を再選択する必要があることを決定するステップと、
前記個体を含むように個体の群を修正するステップと、
修正された群の個体のメチル化のレベルの決定に基づいて、ゲノムDNA配列の集合を前記事前選択されたサブセットから再選択するステップと
を含む、項目80に記載の個体の年齢を決定する方法。
(項目82)
ゲノムDNA配列の選択が、前記個体のゲノムDNA配列のメチル化レベル、特に、関連性のあるCpG遺伝子座を同定するための少なくとも1つの回帰法、特に、関連性のあるCpGを同定するための主成分分析、LASSO/elastic net回帰および/またはXPG Boost法のうちの少なくとも1つを使用した統計解析に関する値の統計解析に基づく、前記項目のうち一項に記載の年齢を決定する方法。
(項目83)
前記事前選択されたセットが、
少なくとも90のゲノムDNA配列、
好ましくは少なくとも100のゲノムDNA配列、
特に好ましくは少なくとも140のゲノムDNA配列
を含み、
かつ/または
前記事前選択されたセットが、
2000未満のゲノムDNA配列、
特に500未満のゲノムDNA配列、
特に350未満のゲノムDNA配列、
特に170未満のゲノムDNA配列、
特に150未満のゲノムDNA配列
を含み、
かつ/または
前記選択された集合が、
少なくとも30のゲノムDNA配列、
好ましくは少なくとも50のゲノムDNA配列、
特に好ましくは少なくとも60のゲノムDNA配列
を含み、
かつ/または
前記選択された集合が、
150未満のゲノムDNA配列、
特に110未満のゲノムDNA配列、
特に100未満のゲノムDNA配列、
特に90未満のゲノムDNA配列、
特に80未満のゲノムDNA配列、
特に70未満のゲノムDNA配列
を含む、
前記項目のうち一項に記載の年齢を決定する方法。
(項目84)
暦年齢と生物学的年齢の差異を評価するための方法であって、
前記方法項目のうちの一項に従って、メチル化レベルに基づく年齢を決定するステップと、
決定された生物学的年齢を既知の暦年齢と比較するステップであって、
特に、
複数の個体について差異を決定し、複数の個体について前記差異に影響を及ぼす可能性も影響を及ぼさない可能性もある因子を決定し、多数の個体において暦年齢と前記生物学的年齢の差異に対して大きな影響を持つ因子を決定する、ステップと
を含む方法。
(項目85)
1つの固定された集合のものよりも多くのCpG遺伝子座のメチル化レベルを決定し、
1つよりも多くの集合について、前記年齢指標の決定を可能にするデータを、年齢をそれぞれのデータに基づいて算出することができるように準備し、
前記年齢を算出するための1つの集合の選択を、測定された前記個体のある特定のメチル化レベル、または前記個体に関連付けることができる生活様式もしくはリスクパターンに関する因子のいずれかに基づいて行う、
前記項目のうちの一項に記載の方法。
(項目86)
前記個体において見いだされるゲノムDNA配列のメチル化のレベルを、
メチル化シーケンシング/バイサルファイトシーケンシング、
PCR法、特に、メチル化特異的PCR(MSP)、リアルタイムメチル化特異的PCR、定量的メチル化特異的PCR(QMSP)、COLD-PCR、メチル化DNA特異的結合性タンパク質を使用したPCR、標的化多重PCR、リアルタイムPCRおよびマイクロアレイに基づくPCRのうちの少なくとも1つ、
高分解能融解分析(HRM)、
メチル化感受性一塩基プライマー伸長(MS-SnuPE)、
メチル化感受性一本鎖コンフォメーション分析、
メチル感受性切断計数(MSCC)、
塩基特異的切断/MALDI-TOF、例えばAgena、
複合バイサルファイト制限分析(COBRA)、
メチル化DNA免疫沈降(MeDIP)、
マイクロアレイに基づく方法、
ビーズアレイに基づく方法、
パイロシーケンシング、バイサルファイト処理を伴わない直接シーケンシング(ナノポア技術)
のうちの少なくとも1つによって測定する、前記項目のうちの一項に記載の年齢を決定する方法。
(項目87)
前記個体の群を、前記個体を前記群に追加することによって修正する、前記項目のうちの一項に記載の年齢を決定する方法。
(項目88)
前記個体を含むように前記個体の群を修正するステップが、個体の年齢および/または個体のゲノムDNA配列の一部もしくは全部のメチル化レベルとは無関係の因子を特に考慮して、少なくとも1つの他の個体を前記群から除外することを含む、前記項目のうちの一項に記載の年齢を決定する方法。
(項目89)
以下の条件:
前記ゲノムDNA配列において検出されたメチル化レベルの一部または全部が低すぎるとみなされる、
単一の個体の予測年齢が前記個体の既知の暦年齢からあまりにもかけ離れている、
いくつかの個体の予測年齢がいくつかの個体の既知の暦年齢からの系統偏差を示す、
いくつかの個体の予測年齢が前記個体の既知の暦年齢のあちこちに散らばっており、分散が大きすぎるとみなされる、
いくつかの個体の予測年齢が前記個体の既知の暦年齢からの系統偏差を示す、
所与の集合に基づいて年齢が決定された個体の数が所定の数に達した、
前の再選択から指定時間が経過した
のうちの少なくとも1つまたは好ましくはいくつかが満たされた場合、追加的な個体について得られたメチル化レベルに基づいて前記集合を変更する決定を行う、前記項目のうちの一項に記載の年齢を決定する方法。
(項目90)
前記方法の項目のうちの一項に従って年齢を決定することが可能になる様式で得られたおよび/または調製された個体の生物材料用の容器を少なくとも含むキットであって、患者の同定に関する情報を保有する情報媒体も含み、
前記方法の項目のうちの一項に記載の方法を実行するためのもしくはどのように実行されたか、および/または、前記方法の項目に記載の方法によって決定された年齢関連データを含むデータキャリアを作製するためのデータを準備するため、
および/または、前記方法の項目に記載の方法によって決定された年齢関連データを含むデータキャリアを準備するための指示をさらに含む、キット。
(項目91)
老化に影響を及ぼすことに関していくつかの分子をスクリーニングする方法であって、特に項目79に記載の方法において集合のために選択されたゲノムDNA配列を参照することにより、生物学的年齢とよく相関するいくつかのゲノムDNA配列の数を決定するステップと、前記いくつかの分子のうちのある分子が、前記ゲノムDNA配列のメチル化レベルに対する正の効果を有するかどうかを、特にin-silicoにおける決定によって決定するステップとを含む方法。
(項目92)
メチル化レベルの決定における使用のために適合させたいくつかのスポット、特に500未満、好ましくは385未満、特に193未満、特に160未満のスポットを含むチップであって、前記スポットが、cg11330075、cg25845463、cg22519947、cg21807065、cg09001642、cg18815943、cg06335143、cg01636910、cg10501210、cg03324695、cg19432688、cg22540792、cg11176990、cg00097800、cg09805798、cg03526652、cg09460489、cg18737844、cg07802350、cg10522765、cg12548216、cg00876345、cg15761531、cg05990274、cg05972734、cg03680898、cg16593468、cg19301963、cg12732998、cg02536625、cg24088134、cg24319133、cg03388189、cg05106770、cg08686931、cg25606723、cg07782620、cg16781885、cg14231565、cg18339380、cg25642673、cg10240079、cg19851481、cg17665505、cg13333913、cg07291317、cg12238343、cg08478427、cg07625177、cg03230469、cg13154327、cg16456442、cg26430984、cg16867657、cg24724428、cg08194377、cg10543136、cg12650870、cg00087368、cg17760405、cg21628619、cg01820962、cg16999154、cg22444338、cg00831672、cg08044253、cg08960065、cg07529089、cg11607603、cg08097417、cg07955995、cg03473532、cg06186727、cg04733826、cg20425444、cg07513002、cg14305139、cg13759931、cg14756158、cg08662753、cg13206721、cg04287203、cg18768299、cg05812299、cg04028695、cg07120630、cg17343879、cg07766948、cg08856941、cg16950671、cg01520297、cg27540719、cg24954665、cg05211227、cg06831571、cg19112204、cg12804730、cg08224787、cg13973351、cg21165089、cg05087008、cg05396610、cg23677767、cg21962791、cg04320377、cg16245716、cg21460868、cg09275691、cg19215678、cg08118942、cg16322747、cg12333719、cg23128025、cg27173374、cg02032962、cg18506897、cg05292016、cg16673857、cg04875128、cg22101188、cg07381960、cg06279276、cg22077936、cg08457029、cg20576243、cg09965557、cg03741619、cg04525002、cg15008041、cg16465695、cg16677512、cg12658720、cg27394136、cg14681176、cg07494888、cg14911690、cg06161948、cg15609017、cg10321869、cg15743533、cg19702785、cg16267121、cg13460409、cg19810954、cg06945504、cg06153788、およびcg20088545のうちの少なくとも1つのメチル化レベルの決定において使用するために特異的に適合させた少なくとも1つのスポットおよび好ましくはいくつかのスポットを含む、チップ。
(項目93)
前記スポットが、前記項目に列挙されているCpG遺伝子座に対して少なくとも10スポット、好ましくは前記項目に列挙されているCpG遺伝子座に対して20スポット、特に、前記項目に列挙されているCpG遺伝子座に対して少なくとも50スポット、特に、前記項目に列挙されているCpG遺伝子座の全てに対するスポットを含む、項目92に記載のチップ。
本発明は、例えば、以下の項目を提供する。
(項目1)
年齢指標を決定するための方法であって、
(a)各個体について、
(i)ゲノムDNA配列のセットのDNAメチル化レベル、および
(ii)暦年齢
を含む、複数の個体の訓練データセットを準備するステップと、
(b)前記訓練データセットに、Least Absolute Shrinkage
and Selection Operator(LASSO)を含む回帰法を適用し、それにより、前記年齢指標および縮小訓練データセットを決定するステップであって、
独立変数が前記ゲノムDNA配列のメチル化レベルであり、好ましくは従属変数が前記年齢であり、
前記年齢指標が、
(i)集合としての前記ゲノムDNA配列のセットのサブセット、および
(ii)前記集合に含有されるゲノムDNA配列ごとに少なくとも1つの係数
を含み、
前記縮小訓練データセットが、前記訓練データセットのうち、前記LASSOによって除外される前記ゲノムDNA配列のDNAメチル化レベル以外の全てのデータを含む、ステップと
を含む方法。
(項目2)
個体の年齢を決定するための方法であって、
(a)各個体について、
(i)ゲノムDNA配列のセットのDNAメチル化レベル、および
(ii)暦年齢
を含む、複数の個体の訓練データセットを準備するステップと、
(b)前記訓練データセットに、Least Absolute Shrinkage
and Selection Operator(LASSO)を含む回帰法を適用し、それにより、前記年齢指標および縮小訓練データセットを決定するステップであって、
独立変数が前記ゲノムDNA配列のメチル化レベルであり、好ましくは従属変数が前記年齢であり、
前記年齢指標が、
(i)集合としての前記ゲノムDNA配列のセットのサブセット、および
(ii)前記集合に含有されるゲノムDNA配列ごとに少なくとも1つの係数
を含み、
前記縮小訓練データセットが、前記訓練データセットのうち、前記LASSOによって除外されるゲノムDNA配列のDNAメチル化レベル以外の全てのデータを含む、ステップと、
(c)年齢が決定される個体について前記年齢指標に含まれるゲノムDNA配列の少なくとも80%、好ましくは100%に関するDNAメチル化レベルをもたらすステップと、
(d)前記個体の年齢を、そのDNAメチル化レベルおよび前記年齢指標に基づいて決定するステップと
を含み、
好ましくは前記決定された年齢が前記個体の暦年齢と異なり得る、方法。
(項目3)
前記回帰法が、前記LASSOの後にステップワイズ回帰を適用することをさらに含む、項目1または2に記載の方法。
(項目4)
前記ステップワイズ回帰を前記縮小訓練データセットに適用する、項目3に記載の方法。
(項目5)
前記年齢指標に含まれる前記集合が、前記ゲノムDNA配列のセットよりも小さい、項目1から4のいずれかに記載の方法。
(項目6)
前記年齢指標に含まれる前記集合が、前記縮小訓練データセットに含まれるゲノムDNA配列のセットよりも小さい、項目1から5のいずれかに記載の方法。
(項目7)
前記ステップワイズ回帰が双方向除外であり、統計学的に有意でない独立変数が除去され、好ましくは有意レベルが0.05である、項目3から6のいずれかに記載の方法。
(項目8)
前記LASSOを、biglasso Rパッケージを用いて、好ましくはコマンド「cv.biglasso」を適用することによって実施し、好ましくは「nfold」が20である、項目1から7のいずれかに記載の方法。
(項目9)
前記回帰法が、リッジ回帰(L2正則化)を含まないかまたは前記L2正則化パラメータ/ラムダパラメータが0である、項目1から8のいずれかに記載の方法。
(項目10)
前記LASSO L1正則化パラメータ/アルファパラメータが1である、項目1から9のいずれかに記載の方法。
(項目11)
各繰り返しにおいて少なくとも1つのさらなる個体のデータを前記訓練データに追加し、それにより、前記訓練データセットを繰り返し拡大することを含めて、前記年齢指標を繰り返し更新する、項目1から10のいずれかに記載の方法。
(項目12)
1回の更新ラウンドにおいて、さらなる個体のそれぞれに関する追加されるデータが、
(i)最初の訓練データセット、または拡大訓練データセットのいずれかに含まれるゲノムDNA配列のセットの少なくとも5%、好ましくは50%、より好ましくは100%、および/または
(ii)前記縮小訓練データセットに含有されるゲノムDNA配列
に関する前記個体のDNAメチル化レベルを含む、項目11に記載の方法。
(項目13)
前記拡大訓練データセットにデータを寄与する全ての個体に関して存在しないゲノムDNA配列(独立変数)は全て前記拡大訓練データセットから除去する、項目11または12に記載の方法。
(項目14)
1回の更新ラウンドにおいて、メチル化レベルが追加される前記ゲノムDNA配列のセットが、前記さらなる個体(複数可)のそれぞれについて同一である、項目11から13のいずれかに記載の方法。
(項目15)
1回の更新ラウンドが、前記LASSOを前記拡大訓練データセットに適用し、それにより、更新された年齢指標および/または更新された縮小訓練データセットを決定することを含む、項目11から14のいずれかに記載の方法。
(項目16)
前記少なくとも1つのさらなる個体に関するデータが追加される訓練データセットが、最初の縮小訓練データセット、または前記更新された縮小訓練データセットのいずれかであり得る縮小訓練データセットである、項目11から15のいずれかに記載の方法。
(項目17)
前記縮小訓練データセットが、前記繰り返しにおける前の縮小訓練データセットである、項目16に記載の方法。
(項目18)
1回の更新ラウンドが、前記ステップワイズ回帰を前記縮小訓練データセットに適用し、それにより、更新された年齢指標を決定することを含む、項目11から17のいずれかに記載の方法。
(項目19)
1回の更新ラウンドにおいて、少なくとも1つの個体に関するデータを前記訓練データセットおよび/または前記縮小訓練データセットから除去する、項目1から18のいずれかに記載の方法。
(項目20)
個体のデータの追加および/または除去が、前記個体の少なくとも1つの特徴に依存し、前記特徴が、民族、性別、暦年齢、居住地、出生地、少なくとも1つの疾患および/または少なくとも1つの生活様式因子であり、前記生活様式因子が、薬物消費、環境汚染物質への曝露、交代勤務またはストレスから選択される、項目11から19のいずれかに記載の方法。
(項目21)
前記年齢指標の質を決定し、前記質の決定が、
(a)前記訓練データセットにデータを寄与していない複数の個体に関する試験データセットを準備するステップであって、前記試験データセットが、前記個体のそれぞれについて、
(i)前記年齢指標に含まれるゲノムDNA配列のセットの前記DNAメチル化レベル、および
(ii)前記暦年齢
を含む、ステップと、
(b)前記年齢指標の質を統計学的評価および/またはドメイン境界の評価によって決定するステップであって、
前記統計学的評価が、
(i)前記試験データセットに含まれる個体の年齢を決定するステップと、
(ii)前記個体(複数可)の決定された年齢と暦年齢を相関させ、この相関を説明する少なくとも1つの統計学的パラメータを決定するステップと、
(iii)前記統計学的パラメータ(複数可)が、前記年齢指標の許容される質を示すものか否かを判定するステップであって、好ましくは前記統計学的パラメータが決定係数(R 2 )および平均絶対誤差(MAE)から選択され、R 2 が0.50よりも大きい、好ましくは0.70よりも大きい、好ましくは0.90よりも大きい、好ましくは0.98よりも大きいことおよび/またはMAEが6歳未満、好ましくは4歳未満、好ましくは最大1歳であることは、許容される質を示す、ステップと
を含み、
ドメイン境界の評価が、
(iv)前記年齢指標のドメイン境界を決定するステップであって、
前記ドメイン境界が、前記年齢指標に含まれる各ゲノムDNA配列の最小DNAメチル化レベルおよび最大DNAメチル化レベルであり、
前記最小DNAメチル化レベルおよび最大DNAメチル化レベルが、前記年齢指標を決定するために使用された訓練データセットにおいて見いだされる、
ステップと、
(v)前記試験データセットが前記ドメイン境界を超えるかどうかを決定するステップであって、前記ドメイン境界を越えないことは、許容される質を示す、ステップと
を含む、ステップと
を含む、項目1から20のいずれかに記載の方法。
(項目22)
前記訓練データセットおよび/または前記試験データセットが、少なくとも10の個体、好ましくは少なくとも30の個体、好ましくは少なくとも200の個体を含み、好ましくは前記訓練データセットが少なくとも200の個体を含み、かつ前記試験データセットが少なくとも30の個体を含む、項目1から21のいずれかに記載の方法。
(項目23)
前記年齢指標は、その質が許容されないものである場合には更新される、項目21または22に記載の方法。
(項目24)
前記個体の前記年齢は、当該個体のDNAメチル化レベル、および更新された年齢指標に基づいて決定される、項目11から23のいずれかに記載の方法。
(項目25)
前記個体のデータが前記年齢指標の生成に使用される訓練データセットに寄与していない場合には、当該個体の年齢が前記年齢指標のみを用いて決定される、項目2から24のいずれかに記載の方法。
(項目26)
前記データに含まれる個体の数が所定の値に達している、かつ/または前の更新から所定の時間が経過している場合には、前記年齢指標がさらに更新されない、項目1から25のいずれかに記載の方法。
(項目27)
前記訓練データセットに含まれるゲノムDNA配列のセットが、メチル化レベルを暦年齢に関連付けることができるゲノムDNA配列から事前選択されたものである、項目1から26のいずれかに記載の方法。
(項目28)
前記事前選択されたセットが、少なくとも400000、好ましくは少なくとも800000のゲノムDNA配列を含む、項目27に記載の方法。
(項目29)
前記訓練データセットに含まれるゲノムDNA配列が、互いに重複せず、かつ/または対立遺伝子当たり1度しか生じない、項目1から28のいずれかに記載の方法。
(項目30)
前記縮小訓練データセットが、少なくとも90、好ましくは少なくとも100、好ましくは少なくとも140のゲノムDNA配列を含む、項目1から29のいずれかに記載の方法。
(項目31)
前記縮小訓練データセットが、5000未満、好ましくは2000未満、好ましくは500未満、好ましくは350未満、好ましくは300未満のゲノムDNA配列を含む、項目1から30のいずれかに記載の方法。
(項目32)
前記年齢指標が、少なくとも30、好ましくは少なくとも50、好ましくは少なくとも60、好ましくは少なくとも80のゲノムDNA配列を含む、項目1から31のいずれかに記載の方法。
(項目33)
前記年齢指標が、300未満、好ましくは150未満、好ましくは110未満、好ましくは100未満、好ましくは90未満のゲノムDNA配列を含む、項目1から32のいずれかに記載の方法。
(項目34)
個体のゲノムDNA配列の前記DNAメチル化レベルが、前記ゲノムDNA配列を含む前記個体の生物材料の試料において測定されたものである、項目1から33のいずれかに記載の方法。
(項目35)
前記試料が、口腔細胞を含む、項目34に記載の方法。
(項目36)
試料を非侵襲的に得るステップをさらに含む、項目34または35のいずれかに記載の方法。
(項目37)
前記DNAメチル化レベルが、メチル化シーケンシング、バイサルファイトシーケンシング、PCR法、高分解能融解分析(HRM)、メチル化感受性一塩基プライマー伸長(MS-SnuPE)、メチル化感受性一本鎖コンフォメーション分析、メチル感受性切断計数(MSCC)、塩基特異的切断/MALDI-TOF、複合バイサルファイト制限分析(COBRA)、メチル化DNA免疫沈降(MeDIP)、マイクロアレイに基づく方法、ビーズアレイに基づく方法、パイロシーケンシングおよび/またはバイサルファイト処理を伴わない直接シーケンシング(ナノポア技術)によって測定されたものである、項目34から36のいずれかに記載の方法。
(項目38)
個体のゲノムDNA配列の前記DNAメチル化レベルが、塩基特異的切断/MALDI-TOFおよび/またはPCR法で測定されたものであり、塩基特異的切断/MALDI-TOFはAgena技術であり、好ましくは前記PCR法がメチル化特異的PCRである、項目34から37のいずれかに記載の方法。
(項目39)
前記年齢指標に含まれる前記ゲノムDNA配列の前記DNAメチル化レベルが、年齢が決定される個体の前記ゲノムDNA配列を含む生物材料の試料において決定されたものである、項目34から38のいずれかに記載の方法。
(項目40)
cg11330075、cg25845463、cg22519947、cg21807065、cg09001642、cg18815943、cg06335143、cg01636910、cg10501210、cg03324695、cg19432688、cg22540792、cg11176990、cg00097800、cg27320127、cg09805798、cg03526652、cg09460489、cg18737844、cg07802350、cg10522765、cg12548216、cg00876345、cg15761531、cg05990274、cg05972734、cg03680898、cg16593468、cg19301963、cg12732998、cg02536625、cg24088134、cg24319133、cg03388189、cg05106770、cg08686931、cg25606723、cg07782620、cg16781885、cg14231565、cg18339380、cg25642673、cg10240079、cg19851481、cg17665505、cg13333913、cg07291317、cg12238343、cg08478427、cg07625177、cg03230469、cg13154327、cg16456442、cg26430984、cg16867657、cg24724428、cg08194377、cg10543136、cg12650870、cg00087368、cg17760405、cg21628619、cg01820962、cg16999154、cg22444338、cg00831672、cg08044253、cg08960065、cg07529089、cg11607603、cg08097417、cg07955995、cg03473532、cg06186727、cg04733826、cg20425444、cg07513002、cg14305139、cg13759931、cg14756158、cg08662753、cg13206721、cg04287203、cg18768299、cg05812299、cg04028695、cg07120630、cg17343879、cg07766948、cg08856941、cg16950671、cg01520297、cg27540719、cg24954665、cg05211227、cg06831571、cg19112204、cg12804730、cg08224787、cg13973351、cg21165089、cg05087008、cg05396610、cg23677767、cg21962791、cg04320377、cg16245716、cg21460868、cg09275691、cg19215678、cg08118942、cg16322747、cg12333719、cg23128025、cg27173374、cg02032962、cg18506897、cg05292016、cg16673857、cg04875128、cg22101188、cg07381960、cg06279276、cg22077936、cg08457029、cg20576243、cg09965557、cg03741619、cg04525002、cg15008041、cg16465695、cg16677512、cg12658720、cg27394136、cg14681176、cg07494888、cg14911690、cg06161948、cg15609017、cg10321869、cg15743533、cg19702785、cg16267121、cg13460409、cg19810954、cg06945504、cg06153788、およびcg20088545のうちの少なくとも10種、好ましくは少なくとも50種、好ましくは少なくとも70種、好ましくは全て、または連続ヌクレオチド配列の少なくとも70%、好ましくは少なくとも90%を含むその断片を含むゲノムDNA配列の集合。
(項目41)
cg11330075、cg00831672、cg27320127、cg27173374、cg14681176、cg06161948、cg08224787、cg05396610、cg15609017、cg09805798、cg19215678、cg12333719、cg03741619、cg16677512、cg03230469、cg19851481、cg10543136、cg07291317、cg26430984、cg16950671、cg16867657、cg22077936、cg08044253、cg12548216、cg05211227、cg13759931、cg08686931、cg07955995、cg07529089、cg01520297、cg00087368、cg05087008、cg24724428、cg19112204、cg04525002、cg08856941、cg16465695、cg08097417、cg21628619、cg09460489、cg13460409、cg25642673、cg19702785、cg18506897、cg21165089、cg27540719、cg21807065、cg18815943、cg23677767、cg07802350、cg11176990、cg10321869、cg17343879、cg08662753、cg14911690、cg12804730、cg16322747、cg14231565、cg10501210、cg09275691、cg15008041、cg05812299、cg24319133、cg12658720、cg20576243、cg03473532、cg07381960、cg05106770、cg04320377、cg19432688、cg22519947、cg06831571、cg08194377、cg01636910、cg14305139、cg04028695、cg15743533、cg03680898、cg20088545、cg13333913、cg19301963、cg13973351、cg16781885、cg04287203、cg27394136、cg10240079、cg02536625、およびcg23128025の少なくとも4種、好ましくは少なくとも10種、好ましくは少なくとも30種、好ましくは少なくとも70種、好ましくは全て、または連続ヌクレオチド配列の少なくとも70%、好ましくは少なくとも90%を含むその断片を含む、項目39に記載のゲノムDNA配列の集合。
(項目42)
cg11330075、cg00831672、cg27320127、cg27173374、cg14681176、cg06161948、cg08224787、cg05396610、cg15609017、cg09805798、cg19215678、cg12333719、cg03741619、cg03230469、cg19851481、cg10543136、cg07291317、cg26430984、cg16950671、cg16867657、cg13973351、cg16781885、cg04287203、cg27394136、cg10240079、cg02536625、およびcg23128025のうちの少なくとも4種、好ましくは少なくとも10種、好ましくは全てを含む、項目41に記載のゲノムDNA配列の集合。
(項目43)
cg11330075、cg00831672、cg27320127、cg10240079、cg02536625、およびcg23128025のうちの少なくとも4種、好ましくは全てを含む、項目41または42に記載のゲノムDNA配列の集合。
(項目44)
前記ゲノムDNA配列の集合に加えておよび/またはその代わりに、その相補配列を含む、項目40から43のいずれかに記載のゲノムDNA配列の集合。
(項目45)
SIM bHLH転写因子1(SIM1)、微小管関連タンパク質4(MAP4)、プロテインキナーゼCゼータ(PRKCZ)、グルタミン酸イオンチャネル型受容体AMPA型サブユニット4(GRIA4)、BCL10、免疫シグナル伝達アダプター(BCL10)、5’-ヌクレオチダーゼドメイン含有1(NT5DC1)、腫瘍形成能抑制7(ST7)、プロテインキナーゼCイータ(PRKCH)、グリア細胞由来神経栄養因子(GDNF)、ムスケリン1(MKLN1)、エクソシスト複合体成分6B(EXOC6B)、プロテインS(PROS1)、電位依存性カルシウムチャネルサブユニットアルファ1D(CACNA1D)、ケルチ様ファミリーメンバー42(KLHL42)、OTUデユビキチナーゼ7A(OTUD7A)、細胞死関連タンパク質(DAP)、コイルドコイルドメイン含有179(CCDC179)、ヨードチロニン脱ヨード酵素2(DIO2)、一過性受容体電位カチオンチャネルサブファミリーVメンバー3(TRPV3)、MT-RNR2様5(MTRNR2L5)、フィラミンB(FLNB)、フューリン、対塩基性アミノ酸切断酵素(FURIN)、溶質運搬体ファミリー25メンバー17(SLC25A17)、Gパッチドメイン含有1(GPATCH1)、UDP-GlcNAc:ベータGalベータ-1,3-N-アセチルグルコサミニルトランスフェラーゼ9(B3GNT9)、zyg-11ファミリーメンバーA、細胞周期調節因子(ZYG11A)、発作関連6ホモログ様(SEZ6L)、ミオシンX(MYO10)、アセチル-CoAカルボキシラーゼアルファ(ACACA)、Gタンパク質サブユニットアルファi1(GNAI1)、CUEドメイン含有2(CUEDC2)、ホメオボックスD13(HOXD13)、クルッペル様因子14(KLF14)、溶質運搬体ファミリー1メンバー2(SLC1A2)、アセトアセチルCoAシンテターゼ(AACS)、アンキリンリピートおよび無菌アルファモチーフドメイン含有1A(ANKS1A)、マイクロRNA 7641-2(MIR7641-2)、V型コラーゲンアルファ1鎖(COL5A1)、亜ヒ酸塩メチルトランスフェラーゼ(AS3MT)、溶質運搬体ファミリー26メンバー5(SLC26A5)、ヌクレオポリン107(NUP107)、長鎖遺伝子間タンパク質ノンコーディングRNA1797(LINC01797)、ミオシンIC(MYO1C)、アンキリンリピートドメイン37(ANKRD37)、ホスホジエステラーゼ4C(PDE4C)、EFハンドドメイン含有1(EFHC1)、特徴不明のLOC375196(LOC375196)、ELOVL脂肪酸エロンガーゼ2(ELOVL2)、WASタンパク質ファミリーメンバー3(WASF3)、17番染色体オープンリーディングフレーム82(C17orf82)、Gタンパク質共役型受容体158(GPR158)、Fボックスおよびロイシンリッチリピートタンパク質7(FBXL7)、リプリー転写リプレッサー3(RIPPLY3)、ESCRT-IのVPS37Cサブユニット(VPS37C)、ポリペプチドN-アセチルガラクトサミン転移酵素様6(GALNTL6)、DENNドメイン含有3(DENND3)、核受容体コリプレッサー2(NCOR2)、内皮PASドメインタンパク質1(EPAS1)、PBXホメオボックス4(PBX4)、長鎖遺伝子間タンパク質ノンコーディングRNA1531(LINC01531)、配列類似性を有するファミリー110メンバーA(FAM110A)、グリコシルトランスフェラーゼ8ドメイン含有1(GLT8D1)、Gタンパク質サブユニットガンマ2(GNG2)、MT-RNR2様3(MTRNR2L3)、ジンクフィンガータンパク質140(ZNF140)、ras1のキナーゼ抑制因子(KSR1)、タンパク質ジスルフィドイソメラーゼファミリーAメンバー5(PDIA5)、精子形成関連7(SPATA7)、パントテン酸キナーゼ1(PANK1)、ユビキチン特異的ペプチダーゼ4(USP4)、Gタンパク質サブユニットアルファq(GNAQ)、電位依存性カリウムチャネル修飾因子サブファミリーSメンバー1(KCNS1)、DNAポリメラーゼガンマ2、アクセサリーサブユニット(POLG2)、ストークヘッドボックス2(STOX2)、ニューレキシン3(NRXN3)、BMS1、リボソーム生合成因子(BMS1)、フォークヘッドボックスE3(FOXE3)、NADH:ユビキノンオキシドレダクターゼサブユニットA10(NDUFA10)、レラキシンファミリーペプチド受容体3(RXFP3)、GATA結合性タンパク質2(GATA2)、イソプレノイドシンターゼドメイン含有(ISPD)、アデノシンデアミナーゼ、RNA特異的B1(ADARB1)、Wntファミリーメンバー7B(WNT7B)、プレクストリンおよびSec7ドメイン含有3(PSD3)、膜アンカー型ジャンクションタンパク質(MAJIN)、ピリジンヌクレオチド-ジスルフィドオキシドレダクターゼドメイン1(PYROXD1)、シンギュリン様1(CGNL1)、7番染色体オープンリーディングフレーム50(C7orf50)、MORNリピート含有1(MORN1)、アトラスチンGTPアーゼ2(ATL2)、WDリピートおよびFYVEドメイン含有2(WDFY2)、膜貫通タンパク質136(TMEM136)、イノシトールポリリン酸-5-ホスファターゼA(INPP5A)、TBC1ドメインファミリーメンバー9(TBC1D9)、インターフェロン調節因子2(IRF2)、サーチュイン7(SIRT7)、XXIII型コラーゲンアルファ1鎖(COL23A1)、グアニン一リン酸シンターゼ(GMPS)、カリウム2孔ドメインチャネルサブファミリーKメンバー12(KCNK12)、SIN3-HDAC複合体関連因子(SINHCAF)、ヘモグロビンサブユニットイプシロン1(HBE1)、ならびにチューダードメイン含有1(TDRD1)のうちの少なくとも10種、好ましくは少なくとも30種、好ましくは少なくとも50種、好ましくは少なくとも70種、好ましくは全てを含む遺伝子セット。
(項目46)
ISPD、KCNK12、GNG2、SIRT7、GPATCH1、GRIA4、LINC01531、LOC101927577、NCOR2、WASF3、TRPV3、ACACA、GDNF、EFHC1、MYO10、COL23A1、TDRD1、ELOVL2、GNAI1、MAP4、CCDC179、KLF14、ST7、INPP5A、SIM1、SLC1A2、AS3MT、KSR1、DSCR6、IRF2、KCNS1、NRXN3、C11orf85、HBE1、FOXE3、TMEM136、HOXD13、LOC375196、PANK1、MIR107、COL5A1、PBX4、ZNF140、GALNTL6、NUP107、LOC100507250、MTRNR2L5、C17orf82、MKLN1、FURIN、KLHL42、MORN1、ANKS1A、BCL10、DENND3、FAM110A、PROS1、WNT7B、FBXL7、GATA2、VPS37C、NRP1、POLG2、ANKRD37、GMPS、およびWDFY2のうちの少なくとも5種、好ましくは少なくとも10種、好ましくは少なくとも30種、好ましくは全てを含む、項目45に記載の遺伝子セット。
(項目47)
微小管関連タンパク質4(MAP4)、プロテインキナーゼCゼータ(PRKCZ)、グルタミン酸イオンチャネル型受容体AMPA型サブユニット4(GRIA4)、腫瘍形成能抑制7(ST7)、プロテインキナーゼCイータ(PRKCH)、電位依存性カルシウムチャネルサブユニットアルファ1D(CACNA1D)、細胞死関連タンパク質(DAP)、一過性受容体電位カチオンチャネルサブファミリーVメンバー3(TRPV3)、フューリン、対塩基性アミノ酸切断酵素(FURIN)、アセチル-CoAカルボキシラーゼアルファ(ACACA)、Gタンパク質サブユニットアルファi1(GNAI1)、溶質運搬体ファミリー1メンバー2(SLC1A2)、ホスホジエステラーゼ4C(PDE4C)、ELOVL脂肪酸エロンガーゼ2(ELOVL2)、核受容体コリプレッサー2(NCOR2)、内皮PASドメインタンパク質1(EPAS1)、Gタンパク質サブユニットガンマ2(GNG2)、パントテン酸キナーゼ1(PANK1)、ユビキチン特異的ペプチダーゼ4(USP4)、Gタンパク質サブユニットアルファq(GNAQ)、電位依存性カリウムチャネル修飾因子サブファミリーSメンバー1(KCNS1)、DNAポリメラーゼガンマ2、アクセサリーサブユニット(POLG2)、NADH:ユビキノンオキシドレダクターゼサブユニットA10(NDUFA10)、レラキシンファミリーペプチド受容体3(RXFP3)、イソプレノイドシンターゼドメイン含有(ISPD)、イノシトールポリリン酸-5-ホスファターゼA(INPP5A)、サーチュイン7(SIRT7)、グアニン一リン酸シンターゼ(GMPS)、SIN3-HDAC複合体関連因子(SINHCAF)、チューダードメイン含有1(TDRD1)のうちの少なくとも5種、好ましくは少なくとも10種、好ましくは少なくとも20種、好ましくは全てを含む、項目45に記載の遺伝子セット。
(項目48)
前記ゲノムDNA配列の集合が、項目2から39に記載の方法による縮小訓練データセットおよび/または年齢指標に含まれ、
前記遺伝子セットが、タンパク質、またはマイクロRNAもしくは長鎖ノンコーディングRNAをコードする前記ゲノムDNA配列の集合から選択することによって得られる、項目2から39に記載の方法によって得られる項目40から44のいずれかに記載のゲノムDNA配列の集合または項目45から47のいずれかに記載の遺伝子セット。
(項目49)
個体の健康状態の診断における使用のための、項目40から44または48に記載のゲノムDNA配列の集合、または項目45から48のいずれかに記載の遺伝子セット。
(項目50)
前記健康状態が、少なくとも1つの老化関連疾患、少なくとも1つの老化関連疾患に関連付けられる少なくとも1つの表現型、および/またはがんの状態を含み、
前記状態は、前記疾患、または疾患に関連付けられる表現型の非存在、存在、またはステージを示す、
項目49に記載の使用のためのゲノムDNA配列の集合または遺伝子セット。
(項目51)
前記老化関連疾患が、アルツハイマー病、パーキンソン病、アテローム性動脈硬化症、心血管疾患、がん、関節炎、白内障、骨粗鬆症、2型糖尿病、高血圧症、老化黄斑変性症および/または良性前立腺肥大症である、項目50に記載の使用のためのゲノムDNA配列の集合または遺伝子セット。
(項目52)
個体のフィットネス状態を決定するための、項目40から44もしくは48のいずれかに記載のゲノムDNA配列の集合、または項目45から48のいずれかに記載の遺伝子セットの使用。
(項目53)
前記フィットネス状態が、前記個体の血圧、体重、免疫細胞のレベル、炎症のレベルおよび/または認知機能を含む、項目52に記載の使用。
(項目54)
個体の健康状態および/またはフィットネス状態を診断するための方法であって、項目40から44もしくは48のいずれかに記載のゲノムDNA配列の集合、または項目45から48のいずれかに記載の遺伝子セットを準備するステップを含む方法。
(項目55)
前記ゲノムDNA配列を含む前記個体の生体試料中の前記ゲノムDNA配列のメチル化レベルを決定するステップをさらに含む、項目54に記載の方法。
(項目56)
前記健康状態が、少なくとも1つの老化関連疾患、少なくとも1つの老化関連疾患に関連付けられる少なくとも1つの表現型、および/またはがんの状態を含み、
好ましくは前記老化関連疾患が、アルツハイマー病、パーキンソン病、アテローム性動脈硬化症、心血管疾患、がん、関節炎、白内障、骨粗鬆症、2型糖尿病、高血圧症、老化黄斑変性症および/または良性前立腺肥大症であり、かつ/または
前記フィットネス状態が、前記個体の血圧、体重、免疫細胞のレベル、炎症のレベルおよび/または認知機能を含む、
項目54または55に記載の方法。
(項目57)
前記生体試料が、非侵襲的に、好ましくは頬スワブによって得たものである、項目55または56に記載の方法。
(項目58)
老化に影響を及ぼす分子を同定するためのin silicoおよび/またはin vitroスクリーニング方法であって、項目40から44もしくは48のいずれかに記載のゲノムDNA配列の集合、または項目45から48のいずれかに記載の遺伝子セットを準備するステップを含み、
前記分子が、個体に投与されると、少なくとも1つの老化関連疾患、少なくとも1つの老化関連疾患に関連付けられる少なくとも1つの表現型、および/またはがんを好転させる、防止するおよび/または逆転させるものである、方法。
(項目59)
前記ゲノムDNA配列のうちの少なくとも1つのDNAメチル化レベルを決定するステップをさらに含む、項目58に記載の方法。
(項目60)
同定された分子が、個体に投与されると、前記個体における前記ゲノムDNA配列のうちの少なくとも1つのDNAメチル化レベルを上昇させ、かつ/または、前記個体における前記ゲノムDNA配列のうちの少なくとも1つのDNAメチル化レベルを低下させるものである、項目58または59に記載の方法。
(項目61)
前記DNAメチル化レベルが、変更前よりも若い暦年齢に関連付けられるように変更される、項目60に記載の方法。
(項目62)
項目45から48に記載の遺伝子セットを準備し、前記遺伝子セットによってコードされる少なくとも1種のタンパク質の活性を決定するステップをさらに含む、項目58から61のいずれかに記載の方法。
(項目63)
前記同定された分子が、前記遺伝子セットによってコードされる少なくとも1種のタンパク質の活性を阻害し、かつ/または、前記遺伝子セットによってコードされる少なくとも1種のタンパク質の活性を増強するものである、項目62に記載の方法。
(項目64)
前記タンパク質活性が、変更前よりも若い暦年齢に関連付けられるように変更される、項目63に記載の方法。
(項目65)
項目40から44もしくは48のいずれかに記載のゲノムDNA配列の集合、または項目45から48のいずれかに記載の遺伝子セットをスポットとして含むチップであって、各配列が、別々のスポットに含有される、チップ。
(項目66)
少なくとも1つの独特のプライマー対を含むキットであって、
各プライマー対のうち一方のプライマーが、項目40から44もしくは48のいずれかに記載のゲノムDNA配列の集合に含まれるゲノムDNA配列のうちの1つまたは項目45から48のいずれかに記載の遺伝子セットに含まれる遺伝子のうちの1つのリバース鎖に結合するフォワードプライマーであり、他方のプライマーが、フォワード鎖に結合するリバースプライマーであり、
前記フォワードプライマーおよびリバースプライマーの3’末端と相補的な2つのヌクレオチドが、30ヌクレオチド超3000ヌクレオチド未満、好ましくは1000ヌクレオチド未満離れている、
キット。
(項目67)
項目40から44もしくは48のいずれかに記載のゲノムDNA配列の集合に含まれるゲノムDNA配列のうちの1つまたは項目45から48のいずれかに記載の遺伝子セットに含まれる遺伝子のうちの1つと相補的なプローブを少なくとも1つ含むキット。
(項目68)
前記プライマーまたはプローブが、メチル化されたDNAまたはメチル化されていないDNAのいずれかに特異的に結合し、メチル化されていないシトシンが、ウラシルに変換されている、項目65または66に記載のキット。
(項目69)
項目65に記載のチップを含むキット。
(項目70)
生物材料用の容器および/または頬スワブ用の材料をさらに含む、項目51から57のいずれかに記載のキット。
(項目71)
生体試料からゲノムDNAを抽出し、精製し、かつ/または増幅するための材料をさらに含み、前記材料が、スピンカラムおよび/または酵素である、項目66から70のいずれかに記載のキット。
(項目72)
亜硫酸水素塩をさらに含む、項目66から71のいずれかに記載のキット。
(項目73)
項目2から39のいずれかに記載の方法、項目40から44もしくは48のいずれかに記載のゲノムDNA配列の集合、および/または項目45から48のいずれかに記載の遺伝子セットによって得られた年齢指標を含むデータキャリア。
(項目74)
年齢が決定される個体に関する調査票をさらに含み、前記調査票が、無記入であり得るまたは前記個体に関する情報を含み得る、項目66から72のいずれかに記載のキットまたは項目73に記載のデータキャリア。
(項目75)
前記訓練データセット、縮小訓練データセットおよび/または追加されたデータが、前記個体(複数可)に関連付けることができる生活様式またはリスクパターンに関する少なくとも1つの因子をさらに含む、項目1から39のいずれかに記載の方法。
(項目76)
前記因子が、薬物消費、環境汚染物質、交代勤務およびストレスから選択される、項目75に記載の方法。
(項目77)
前記訓練データセットおよび/または前記縮小訓練データセットが、DNAメチル化レベルおよび/またはコードされるタンパク質の活性/レベルが前記生活様式因子のうちの少なくとも1つに関連付けられる配列に限定される、項目75または76に記載の方法。
(項目78)
前記個体の決定された年齢と暦年齢の差に関連付けられる少なくとも1つの生活様式因子を決定するステップをさらに含む、項目75から77のいずれかに記載の方法。
(項目79)
一連の個体中の個体に対する年齢指標を決定する方法であって、前記決定が、前記個体において見いだされるゲノムDNA配列のメチル化のレベルに基づくものであり、
前記個体の年齢に関連付けることができるメチル化のレベルを有するゲノムDNA配列のセットから選択されるゲノムDNA配列の集合のメチル化レベルに基づいて、
前記個体についての年齢指標が、複数の個体についてのゲノムDNA配列のメチル化のレベルの統計学的評価に依拠する様式でもたらされる、方法において、
前記個体についての前記年齢指標が、一連の個体の中で先行する個体について同じ年齢指標を決定するために使用した先行する統計学的評価のために参照した複数の個体とは異なる複数の個体についてのゲノムDNA配列のメチル化のレベルの統計学的評価に依拠する様式でもたらされ、
第1の統計学的評価のために使用された複数の個体が、少なくとも、一連の個体からの追加的な先行する少なくとも1つの個体が含められることによって修正されるという点で、前記複数の個体に差異が生じ、
好ましくは前記個体についての前記年齢指標が、2つの異なる複数の個体についての少なくとも2つの異なる統計学的評価の結果、集合のメチル化レベルから前記年齢指標を算出した場合に使用した少なくとも1つの係数に変化が生じ、かつ/または見いだされる異なるゲノムDNA配列またはCgP遺伝子座のメチル化のレベルが考慮される様式でもたらされる
ことを特徴とする方法。
(項目80)
前記個体の年齢に関連付けることができるメチル化のレベルを有するゲノムDNA配列からゲノムDNA配列のセットを準備するステップと、
複数の個体について、前記セットのゲノムDNA配列のメチル化のレベルを決定するステップと、
前記セットからゲノムDNA配列の集合を選択するステップであって、
前記集合内のゲノムDNA配列の数が前記セット内のゲノムDNA配列の数よりも少ないかまたはそれと等しくなり、
かつ
前記集合の配列のメチル化レベルに基づいて前記個体の年齢を算出することができるように選択するステップと、
前記個体由来の生物材料の試料において、少なくとも前記集合の配列のメチル化のレベルを決定するステップと、
前記集合の配列のメチル化のレベルに基づいて前記個体の年齢を算出するステップと、
特に、統計学的評価を考慮して、前記集合のゲノムDNA配列を再選択する必要があるか否か、および/または前記個体の年齢をメチル化のレベルに基づいて算出するやり方を変更すべきか否かを判定するステップと、
前記判定に応じて、前記個体を含むように個体の群を修正するステップと、
修正された群の個体のメチル化のレベルの決定に基づいて前記セットからゲノムDNA配列の集合を再選択するステップ
および/または
集合のメチル化レベルから前記年齢指標を算出した場合に使用した少なくとも1つの係数を変化させるステップ
のうちの少なくとも1つと
を含む、個体において見いだされるゲノムDNA配列のメチル化のレベルに基づく、項目79に記載の個体の年齢を決定する方法。
(項目81)
前記個体の年齢に関連付けることができるメチル化のレベルを有するゲノムDNA配列からゲノムDNA配列のセットを事前選択するステップと、
複数の個体について、前記事前選択されたゲノムDNA配列のメチル化のレベルを決定するステップと、
前記事前選択されたセットからゲノムDNA配列の集合を選択するステップであって、
前記集合内のゲノムDNA配列の数が前記事前選択されたセット内のゲノムDNA配列の数よりも少なくなり、
前記集合の配列のメチル化レベルに基づいて前記個体の年齢を算出することができ、かつ
算出された年齢に関する統計学的評価は、前記算出された年齢の許容される質を示すように選択するステップと、
前記個体由来の生物材料の試料において前記集合の配列のメチル化のレベルを決定するステップと、
前記集合の配列のメチル化のレベルに基づいて前記個体の年齢を算出するステップと、
前記算出された年齢の質の統計学的評価基準を算出するステップと、
前記統計学的評価基準に従った質が許容されるものであるか否かを判定するステップと、
前記質が許容されるものと判断された場合、前記個体の算出された年齢を出力するステップと、
前記質が許容できないものと判断された場合、ゲノムDNA配列を再選択する必要があることを決定するステップと、
前記個体を含むように個体の群を修正するステップと、
修正された群の個体のメチル化のレベルの決定に基づいて、ゲノムDNA配列の集合を前記事前選択されたサブセットから再選択するステップと
を含む、項目80に記載の個体の年齢を決定する方法。
(項目82)
ゲノムDNA配列の選択が、前記個体のゲノムDNA配列のメチル化レベル、特に、関連性のあるCpG遺伝子座を同定するための少なくとも1つの回帰法、特に、関連性のあるCpGを同定するための主成分分析、LASSO/elastic net回帰および/またはXPG Boost法のうちの少なくとも1つを使用した統計解析に関する値の統計解析に基づく、前記項目のうち一項に記載の年齢を決定する方法。
(項目83)
前記事前選択されたセットが、
少なくとも90のゲノムDNA配列、
好ましくは少なくとも100のゲノムDNA配列、
特に好ましくは少なくとも140のゲノムDNA配列
を含み、
かつ/または
前記事前選択されたセットが、
2000未満のゲノムDNA配列、
特に500未満のゲノムDNA配列、
特に350未満のゲノムDNA配列、
特に170未満のゲノムDNA配列、
特に150未満のゲノムDNA配列
を含み、
かつ/または
前記選択された集合が、
少なくとも30のゲノムDNA配列、
好ましくは少なくとも50のゲノムDNA配列、
特に好ましくは少なくとも60のゲノムDNA配列
を含み、
かつ/または
前記選択された集合が、
150未満のゲノムDNA配列、
特に110未満のゲノムDNA配列、
特に100未満のゲノムDNA配列、
特に90未満のゲノムDNA配列、
特に80未満のゲノムDNA配列、
特に70未満のゲノムDNA配列
を含む、
前記項目のうち一項に記載の年齢を決定する方法。
(項目84)
暦年齢と生物学的年齢の差異を評価するための方法であって、
前記方法項目のうちの一項に従って、メチル化レベルに基づく年齢を決定するステップと、
決定された生物学的年齢を既知の暦年齢と比較するステップであって、
特に、
複数の個体について差異を決定し、複数の個体について前記差異に影響を及ぼす可能性も影響を及ぼさない可能性もある因子を決定し、多数の個体において暦年齢と前記生物学的年齢の差異に対して大きな影響を持つ因子を決定する、ステップと
を含む方法。
(項目85)
1つの固定された集合のものよりも多くのCpG遺伝子座のメチル化レベルを決定し、
1つよりも多くの集合について、前記年齢指標の決定を可能にするデータを、年齢をそれぞれのデータに基づいて算出することができるように準備し、
前記年齢を算出するための1つの集合の選択を、測定された前記個体のある特定のメチル化レベル、または前記個体に関連付けることができる生活様式もしくはリスクパターンに関する因子のいずれかに基づいて行う、
前記項目のうちの一項に記載の方法。
(項目86)
前記個体において見いだされるゲノムDNA配列のメチル化のレベルを、
メチル化シーケンシング/バイサルファイトシーケンシング、
PCR法、特に、メチル化特異的PCR(MSP)、リアルタイムメチル化特異的PCR、定量的メチル化特異的PCR(QMSP)、COLD-PCR、メチル化DNA特異的結合性タンパク質を使用したPCR、標的化多重PCR、リアルタイムPCRおよびマイクロアレイに基づくPCRのうちの少なくとも1つ、
高分解能融解分析(HRM)、
メチル化感受性一塩基プライマー伸長(MS-SnuPE)、
メチル化感受性一本鎖コンフォメーション分析、
メチル感受性切断計数(MSCC)、
塩基特異的切断/MALDI-TOF、例えばAgena、
複合バイサルファイト制限分析(COBRA)、
メチル化DNA免疫沈降(MeDIP)、
マイクロアレイに基づく方法、
ビーズアレイに基づく方法、
パイロシーケンシング、バイサルファイト処理を伴わない直接シーケンシング(ナノポア技術)
のうちの少なくとも1つによって測定する、前記項目のうちの一項に記載の年齢を決定する方法。
(項目87)
前記個体の群を、前記個体を前記群に追加することによって修正する、前記項目のうちの一項に記載の年齢を決定する方法。
(項目88)
前記個体を含むように前記個体の群を修正するステップが、個体の年齢および/または個体のゲノムDNA配列の一部もしくは全部のメチル化レベルとは無関係の因子を特に考慮して、少なくとも1つの他の個体を前記群から除外することを含む、前記項目のうちの一項に記載の年齢を決定する方法。
(項目89)
以下の条件:
前記ゲノムDNA配列において検出されたメチル化レベルの一部または全部が低すぎるとみなされる、
単一の個体の予測年齢が前記個体の既知の暦年齢からあまりにもかけ離れている、
いくつかの個体の予測年齢がいくつかの個体の既知の暦年齢からの系統偏差を示す、
いくつかの個体の予測年齢が前記個体の既知の暦年齢のあちこちに散らばっており、分散が大きすぎるとみなされる、
いくつかの個体の予測年齢が前記個体の既知の暦年齢からの系統偏差を示す、
所与の集合に基づいて年齢が決定された個体の数が所定の数に達した、
前の再選択から指定時間が経過した
のうちの少なくとも1つまたは好ましくはいくつかが満たされた場合、追加的な個体について得られたメチル化レベルに基づいて前記集合を変更する決定を行う、前記項目のうちの一項に記載の年齢を決定する方法。
(項目90)
前記方法の項目のうちの一項に従って年齢を決定することが可能になる様式で得られたおよび/または調製された個体の生物材料用の容器を少なくとも含むキットであって、患者の同定に関する情報を保有する情報媒体も含み、
前記方法の項目のうちの一項に記載の方法を実行するためのもしくはどのように実行されたか、および/または、前記方法の項目に記載の方法によって決定された年齢関連データを含むデータキャリアを作製するためのデータを準備するため、
および/または、前記方法の項目に記載の方法によって決定された年齢関連データを含むデータキャリアを準備するための指示をさらに含む、キット。
(項目91)
老化に影響を及ぼすことに関していくつかの分子をスクリーニングする方法であって、特に項目79に記載の方法において集合のために選択されたゲノムDNA配列を参照することにより、生物学的年齢とよく相関するいくつかのゲノムDNA配列の数を決定するステップと、前記いくつかの分子のうちのある分子が、前記ゲノムDNA配列のメチル化レベルに対する正の効果を有するかどうかを、特にin-silicoにおける決定によって決定するステップとを含む方法。
(項目92)
メチル化レベルの決定における使用のために適合させたいくつかのスポット、特に500未満、好ましくは385未満、特に193未満、特に160未満のスポットを含むチップであって、前記スポットが、cg11330075、cg25845463、cg22519947、cg21807065、cg09001642、cg18815943、cg06335143、cg01636910、cg10501210、cg03324695、cg19432688、cg22540792、cg11176990、cg00097800、cg09805798、cg03526652、cg09460489、cg18737844、cg07802350、cg10522765、cg12548216、cg00876345、cg15761531、cg05990274、cg05972734、cg03680898、cg16593468、cg19301963、cg12732998、cg02536625、cg24088134、cg24319133、cg03388189、cg05106770、cg08686931、cg25606723、cg07782620、cg16781885、cg14231565、cg18339380、cg25642673、cg10240079、cg19851481、cg17665505、cg13333913、cg07291317、cg12238343、cg08478427、cg07625177、cg03230469、cg13154327、cg16456442、cg26430984、cg16867657、cg24724428、cg08194377、cg10543136、cg12650870、cg00087368、cg17760405、cg21628619、cg01820962、cg16999154、cg22444338、cg00831672、cg08044253、cg08960065、cg07529089、cg11607603、cg08097417、cg07955995、cg03473532、cg06186727、cg04733826、cg20425444、cg07513002、cg14305139、cg13759931、cg14756158、cg08662753、cg13206721、cg04287203、cg18768299、cg05812299、cg04028695、cg07120630、cg17343879、cg07766948、cg08856941、cg16950671、cg01520297、cg27540719、cg24954665、cg05211227、cg06831571、cg19112204、cg12804730、cg08224787、cg13973351、cg21165089、cg05087008、cg05396610、cg23677767、cg21962791、cg04320377、cg16245716、cg21460868、cg09275691、cg19215678、cg08118942、cg16322747、cg12333719、cg23128025、cg27173374、cg02032962、cg18506897、cg05292016、cg16673857、cg04875128、cg22101188、cg07381960、cg06279276、cg22077936、cg08457029、cg20576243、cg09965557、cg03741619、cg04525002、cg15008041、cg16465695、cg16677512、cg12658720、cg27394136、cg14681176、cg07494888、cg14911690、cg06161948、cg15609017、cg10321869、cg15743533、cg19702785、cg16267121、cg13460409、cg19810954、cg06945504、cg06153788、およびcg20088545のうちの少なくとも1つのメチル化レベルの決定において使用するために特異的に適合させた少なくとも1つのスポットおよび好ましくはいくつかのスポットを含む、チップ。
(項目93)
前記スポットが、前記項目に列挙されているCpG遺伝子座に対して少なくとも10スポット、好ましくは前記項目に列挙されているCpG遺伝子座に対して20スポット、特に、前記項目に列挙されているCpG遺伝子座に対して少なくとも50スポット、特に、前記項目に列挙されているCpG遺伝子座の全てに対するスポットを含む、項目92に記載のチップ。
Claims (93)
- 年齢指標を決定するための方法であって、
(a)各個体について、
(i)ゲノムDNA配列のセットのDNAメチル化レベル、および
(ii)暦年齢
を含む、複数の個体の訓練データセットを準備するステップと、
(b)前記訓練データセットに、Least Absolute Shrinkage
and Selection Operator(LASSO)を含む回帰法を適用し、それにより、前記年齢指標および縮小訓練データセットを決定するステップであって、
独立変数が前記ゲノムDNA配列のメチル化レベルであり、好ましくは従属変数が前記年齢であり、
前記年齢指標が、
(i)集合としての前記ゲノムDNA配列のセットのサブセット、および
(ii)前記集合に含有されるゲノムDNA配列ごとに少なくとも1つの係数
を含み、
前記縮小訓練データセットが、前記訓練データセットのうち、前記LASSOによって除外される前記ゲノムDNA配列のDNAメチル化レベル以外の全てのデータを含む、ステップと
を含む方法。 - 個体の年齢を決定するための方法であって、
(a)各個体について、
(i)ゲノムDNA配列のセットのDNAメチル化レベル、および
(ii)暦年齢
を含む、複数の個体の訓練データセットを準備するステップと、
(b)前記訓練データセットに、Least Absolute Shrinkage
and Selection Operator(LASSO)を含む回帰法を適用し、それにより、前記年齢指標および縮小訓練データセットを決定するステップであって、
独立変数が前記ゲノムDNA配列のメチル化レベルであり、好ましくは従属変数が前記年齢であり、
前記年齢指標が、
(i)集合としての前記ゲノムDNA配列のセットのサブセット、および
(ii)前記集合に含有されるゲノムDNA配列ごとに少なくとも1つの係数
を含み、
前記縮小訓練データセットが、前記訓練データセットのうち、前記LASSOによって除外されるゲノムDNA配列のDNAメチル化レベル以外の全てのデータを含む、ステップと、
(c)年齢が決定される個体について前記年齢指標に含まれるゲノムDNA配列の少なくとも80%、好ましくは100%に関するDNAメチル化レベルをもたらすステップと、
(d)前記個体の年齢を、そのDNAメチル化レベルおよび前記年齢指標に基づいて決定するステップと
を含み、
好ましくは前記決定された年齢が前記個体の暦年齢と異なり得る、方法。 - 前記回帰法が、前記LASSOの後にステップワイズ回帰を適用することをさらに含む、請求項1または2に記載の方法。
- 前記ステップワイズ回帰を前記縮小訓練データセットに適用する、請求項3に記載の方法。
- 前記年齢指標に含まれる前記集合が、前記ゲノムDNA配列のセットよりも小さい、請求項1から4のいずれかに記載の方法。
- 前記年齢指標に含まれる前記集合が、前記縮小訓練データセットに含まれるゲノムDNA配列のセットよりも小さい、請求項1から5のいずれかに記載の方法。
- 前記ステップワイズ回帰が双方向除外であり、統計学的に有意でない独立変数が除去され、好ましくは有意レベルが0.05である、請求項3から6のいずれかに記載の方法。
- 前記LASSOを、biglasso Rパッケージを用いて、好ましくはコマンド「cv.biglasso」を適用することによって実施し、好ましくは「nfold」が20である、請求項1から7のいずれかに記載の方法。
- 前記回帰法が、リッジ回帰(L2正則化)を含まないかまたは前記L2正則化パラメータ/ラムダパラメータが0である、請求項1から8のいずれかに記載の方法。
- 前記LASSO L1正則化パラメータ/アルファパラメータが1である、請求項1から9のいずれかに記載の方法。
- 各繰り返しにおいて少なくとも1つのさらなる個体のデータを前記訓練データに追加し、それにより、前記訓練データセットを繰り返し拡大することを含めて、前記年齢指標を繰り返し更新する、請求項1から10のいずれかに記載の方法。
- 1回の更新ラウンドにおいて、さらなる個体のそれぞれに関する追加されるデータが、
(i)最初の訓練データセット、または拡大訓練データセットのいずれかに含まれるゲノムDNA配列のセットの少なくとも5%、好ましくは50%、より好ましくは100%、および/または
(ii)前記縮小訓練データセットに含有されるゲノムDNA配列
に関する前記個体のDNAメチル化レベルを含む、請求項11に記載の方法。 - 前記拡大訓練データセットにデータを寄与する全ての個体に関して存在しないゲノムDNA配列(独立変数)は全て前記拡大訓練データセットから除去する、請求項11または12に記載の方法。
- 1回の更新ラウンドにおいて、メチル化レベルが追加される前記ゲノムDNA配列のセットが、前記さらなる個体(複数可)のそれぞれについて同一である、請求項11から13のいずれかに記載の方法。
- 1回の更新ラウンドが、前記LASSOを前記拡大訓練データセットに適用し、それにより、更新された年齢指標および/または更新された縮小訓練データセットを決定することを含む、請求項11から14のいずれかに記載の方法。
- 前記少なくとも1つのさらなる個体に関するデータが追加される訓練データセットが、最初の縮小訓練データセット、または前記更新された縮小訓練データセットのいずれかであり得る縮小訓練データセットである、請求項11から15のいずれかに記載の方法。
- 前記縮小訓練データセットが、前記繰り返しにおける前の縮小訓練データセットである、請求項16に記載の方法。
- 1回の更新ラウンドが、前記ステップワイズ回帰を前記縮小訓練データセットに適用し、それにより、更新された年齢指標を決定することを含む、請求項11から17のいずれかに記載の方法。
- 1回の更新ラウンドにおいて、少なくとも1つの個体に関するデータを前記訓練データセットおよび/または前記縮小訓練データセットから除去する、請求項1から18のいずれかに記載の方法。
- 個体のデータの追加および/または除去が、前記個体の少なくとも1つの特徴に依存し、前記特徴が、民族、性別、暦年齢、居住地、出生地、少なくとも1つの疾患および/または少なくとも1つの生活様式因子であり、前記生活様式因子が、薬物消費、環境汚染物質への曝露、交代勤務またはストレスから選択される、請求項11から19のいずれかに記載の方法。
- 前記年齢指標の質を決定し、前記質の決定が、
(a)前記訓練データセットにデータを寄与していない複数の個体に関する試験データセットを準備するステップであって、前記試験データセットが、前記個体のそれぞれについて、
(i)前記年齢指標に含まれるゲノムDNA配列のセットの前記DNAメチル化レベル、および
(ii)前記暦年齢
を含む、ステップと、
(b)前記年齢指標の質を統計学的評価および/またはドメイン境界の評価によって決定するステップであって、
前記統計学的評価が、
(i)前記試験データセットに含まれる個体の年齢を決定するステップと、
(ii)前記個体(複数可)の決定された年齢と暦年齢を相関させ、この相関を説明する少なくとも1つの統計学的パラメータを決定するステップと、
(iii)前記統計学的パラメータ(複数可)が、前記年齢指標の許容される質を示すものか否かを判定するステップであって、好ましくは前記統計学的パラメータが決定係数(R2)および平均絶対誤差(MAE)から選択され、R2が0.50よりも大きい、好ましくは0.70よりも大きい、好ましくは0.90よりも大きい、好ましくは0.98よりも大きいことおよび/またはMAEが6歳未満、好ましくは4歳未満、好ましくは最大1歳であることは、許容される質を示す、ステップと
を含み、
ドメイン境界の評価が、
(iv)前記年齢指標のドメイン境界を決定するステップであって、
前記ドメイン境界が、前記年齢指標に含まれる各ゲノムDNA配列の最小DNAメチル化レベルおよび最大DNAメチル化レベルであり、
前記最小DNAメチル化レベルおよび最大DNAメチル化レベルが、前記年齢指標を決定するために使用された訓練データセットにおいて見いだされる、
ステップと、
(v)前記試験データセットが前記ドメイン境界を超えるかどうかを決定するステップであって、前記ドメイン境界を越えないことは、許容される質を示す、ステップと
を含む、ステップと
を含む、請求項1から20のいずれかに記載の方法。 - 前記訓練データセットおよび/または前記試験データセットが、少なくとも10の個体、好ましくは少なくとも30の個体、好ましくは少なくとも200の個体を含み、好ましくは前記訓練データセットが少なくとも200の個体を含み、かつ前記試験データセットが少なくとも30の個体を含む、請求項1から21のいずれかに記載の方法。
- 前記年齢指標は、その質が許容されないものである場合には更新される、請求項21または22に記載の方法。
- 前記個体の前記年齢は、当該個体のDNAメチル化レベル、および更新された年齢指標に基づいて決定される、請求項11から23のいずれかに記載の方法。
- 前記個体のデータが前記年齢指標の生成に使用される訓練データセットに寄与していない場合には、当該個体の年齢が前記年齢指標のみを用いて決定される、請求項2から24のいずれかに記載の方法。
- 前記データに含まれる個体の数が所定の値に達している、かつ/または前の更新から所定の時間が経過している場合には、前記年齢指標がさらに更新されない、請求項1から25のいずれかに記載の方法。
- 前記訓練データセットに含まれるゲノムDNA配列のセットが、メチル化レベルを暦年齢に関連付けることができるゲノムDNA配列から事前選択されたものである、請求項1から26のいずれかに記載の方法。
- 前記事前選択されたセットが、少なくとも400000、好ましくは少なくとも800000のゲノムDNA配列を含む、請求項27に記載の方法。
- 前記訓練データセットに含まれるゲノムDNA配列が、互いに重複せず、かつ/または対立遺伝子当たり1度しか生じない、請求項1から28のいずれかに記載の方法。
- 前記縮小訓練データセットが、少なくとも90、好ましくは少なくとも100、好ましくは少なくとも140のゲノムDNA配列を含む、請求項1から29のいずれかに記載の方法。
- 前記縮小訓練データセットが、5000未満、好ましくは2000未満、好ましくは500未満、好ましくは350未満、好ましくは300未満のゲノムDNA配列を含む、請求項1から30のいずれかに記載の方法。
- 前記年齢指標が、少なくとも30、好ましくは少なくとも50、好ましくは少なくとも60、好ましくは少なくとも80のゲノムDNA配列を含む、請求項1から31のいずれかに記載の方法。
- 前記年齢指標が、300未満、好ましくは150未満、好ましくは110未満、好ましくは100未満、好ましくは90未満のゲノムDNA配列を含む、請求項1から32のいずれかに記載の方法。
- 個体のゲノムDNA配列の前記DNAメチル化レベルが、前記ゲノムDNA配列を含む前記個体の生物材料の試料において測定されたものである、請求項1から33のいずれかに記載の方法。
- 前記試料が、口腔細胞を含む、請求項34に記載の方法。
- 試料を非侵襲的に得るステップをさらに含む、請求項34または35のいずれかに記載の方法。
- 前記DNAメチル化レベルが、メチル化シーケンシング、バイサルファイトシーケンシング、PCR法、高分解能融解分析(HRM)、メチル化感受性一塩基プライマー伸長(MS-SnuPE)、メチル化感受性一本鎖コンフォメーション分析、メチル感受性切断計数(MSCC)、塩基特異的切断/MALDI-TOF、複合バイサルファイト制限分析(COBRA)、メチル化DNA免疫沈降(MeDIP)、マイクロアレイに基づく方法、ビーズアレイに基づく方法、パイロシーケンシングおよび/またはバイサルファイト処理を伴わない直接シーケンシング(ナノポア技術)によって測定されたものである、請求項34から36のいずれかに記載の方法。
- 個体のゲノムDNA配列の前記DNAメチル化レベルが、塩基特異的切断/MALDI-TOFおよび/またはPCR法で測定されたものであり、塩基特異的切断/MALDI-TOFはAgena技術であり、好ましくは前記PCR法がメチル化特異的PCRである、請求項34から37のいずれかに記載の方法。
- 前記年齢指標に含まれる前記ゲノムDNA配列の前記DNAメチル化レベルが、年齢が決定される個体の前記ゲノムDNA配列を含む生物材料の試料において決定されたものである、請求項34から38のいずれかに記載の方法。
- cg11330075、cg25845463、cg22519947、cg21807065、cg09001642、cg18815943、cg06335143、cg01636910、cg10501210、cg03324695、cg19432688、cg22540792、cg11176990、cg00097800、cg27320127、cg09805798、cg03526652、cg09460489、cg18737844、cg07802350、cg10522765、cg12548216、cg00876345、cg15761531、cg05990274、cg05972734、cg03680898、cg16593468、cg19301963、cg12732998、cg02536625、cg24088134、cg24319133、cg03388189、cg05106770、cg08686931、cg25606723、cg07782620、cg16781885、cg14231565、cg18339380、cg25642673、cg10240079、cg19851481、cg17665505、cg13333913、cg07291317、cg12238343、cg08478427、cg07625177、cg03230469、cg13154327、cg16456442、cg26430984、cg16867657、cg24724428、cg08194377、cg10543136、cg12650870、cg00087368、cg17760405、cg21628619、cg01820962、cg16999154、cg22444338、cg00831672、cg08044253、cg08960065、cg07529089、cg11607603、cg08097417、cg07955995、cg03473532、cg06186727、cg04733826、cg20425444、cg07513002、cg14305139、cg13759931、cg14756158、cg08662753、cg13206721、cg04287203、cg18768299、cg05812299、cg04028695、cg07120630、cg17343879、cg07766948、cg08856941、cg16950671、cg01520297、cg27540719、cg24954665、cg05211227、cg06831571、cg19112204、cg12804730、cg08224787、cg13973351、cg21165089、cg05087008、cg05396610、cg23677767、cg21962791、cg04320377、cg16245716、cg21460868、cg09275691、cg19215678、cg08118942、cg16322747、cg12333719、cg23128025、cg27173374、cg02032962、cg18506897、cg05292016、cg16673857、cg04875128、cg22101188、cg07381960、cg06279276、cg22077936、cg08457029、cg20576243、cg09965557、cg03741619、cg04525002、cg15008041、cg16465695、cg16677512、cg12658720、cg27394136、cg14681176、cg07494888、cg14911690、cg06161948、cg15609017、cg10321869、cg15743533、cg19702785、cg16267121、cg13460409、cg19810954、cg06945504、cg06153788、およびcg20088545のうちの少なくとも10種、好ましくは少なくとも50種、好ましくは少なくとも70種、好ましくは全て、または連続ヌクレオチド配列の少なくとも70%、好ましくは少なくとも90%を含むその断片を含むゲノムDNA配列の集合。
- cg11330075、cg00831672、cg27320127、cg27173374、cg14681176、cg06161948、cg08224787、cg05396610、cg15609017、cg09805798、cg19215678、cg12333719、cg03741619、cg16677512、cg03230469、cg19851481、cg10543136、cg07291317、cg26430984、cg16950671、cg16867657、cg22077936、cg08044253、cg12548216、cg05211227、cg13759931、cg08686931、cg07955995、cg07529089、cg01520297、cg00087368、cg05087008、cg24724428、cg19112204、cg04525002、cg08856941、cg16465695、cg08097417、cg21628619、cg09460489、cg13460409、cg25642673、cg19702785、cg18506897、cg21165089、cg27540719、cg21807065、cg18815943、cg23677767、cg07802350、cg11176990、cg10321869、cg17343879、cg08662753、cg14911690、cg12804730、cg16322747、cg14231565、cg10501210、cg09275691、cg15008041、cg05812299、cg24319133、cg12658720、cg20576243、cg03473532、cg07381960、cg05106770、cg04320377、cg19432688、cg22519947、cg06831571、cg08194377、cg01636910、cg14305139、cg04028695、cg15743533、cg03680898、cg20088545、cg13333913、cg19301963、cg13973351、cg16781885、cg04287203、cg27394136、cg10240079、cg02536625、およびcg23128025の少なくとも4種、好ましくは少なくとも10種、好ましくは少なくとも30種、好ましくは少なくとも70種、好ましくは全て、または連続ヌクレオチド配列の少なくとも70%、好ましくは少なくとも90%を含むその断片を含む、請求項39に記載のゲノムDNA配列の集合。
- cg11330075、cg00831672、cg27320127、cg27173374、cg14681176、cg06161948、cg08224787、cg05396610、cg15609017、cg09805798、cg19215678、cg12333719、cg03741619、cg03230469、cg19851481、cg10543136、cg07291317、cg26430984、cg16950671、cg16867657、cg13973351、cg16781885、cg04287203、cg27394136、cg10240079、cg02536625、およびcg23128025のうちの少なくとも4種、好ましくは少なくとも10種、好ましくは全てを含む、請求項41に記載のゲノムDNA配列の集合。
- cg11330075、cg00831672、cg27320127、cg10240079、cg02536625、およびcg23128025のうちの少なくとも4種、好ましくは全てを含む、請求項41または42に記載のゲノムDNA配列の集合。
- 前記ゲノムDNA配列の集合に加えておよび/またはその代わりに、その相補配列を含む、請求項40から43のいずれかに記載のゲノムDNA配列の集合。
- SIM bHLH転写因子1(SIM1)、微小管関連タンパク質4(MAP4)、プロテインキナーゼCゼータ(PRKCZ)、グルタミン酸イオンチャネル型受容体AMPA型サブユニット4(GRIA4)、BCL10、免疫シグナル伝達アダプター(BCL10)、5’-ヌクレオチダーゼドメイン含有1(NT5DC1)、腫瘍形成能抑制7(ST7)、プロテインキナーゼCイータ(PRKCH)、グリア細胞由来神経栄養因子(GDNF)、ムスケリン1(MKLN1)、エクソシスト複合体成分6B(EXOC6B)、プロテインS(PROS1)、電位依存性カルシウムチャネルサブユニットアルファ1D(CACNA1D)、ケルチ様ファミリーメンバー42(KLHL42)、OTUデユビキチナーゼ7A(OTUD7A)、細胞死関連タンパク質(DAP)、コイルドコイルドメイン含有179(CCDC179)、ヨードチロニン脱ヨード酵素2(DIO2)、一過性受容体電位カチオンチャネルサブファミリーVメンバー3(TRPV3)、MT-RNR2様5(MTRNR2L5)、フィラミンB(FLNB)、フューリン、対塩基性アミノ酸切断酵素(FURIN)、溶質運搬体ファミリー25メンバー17(SLC25A17)、Gパッチドメイン含有1(GPATCH1)、UDP-GlcNAc:ベータGalベータ-1,3-N-アセチルグルコサミニルトランスフェラーゼ9(B3GNT9)、zyg-11ファミリーメンバーA、細胞周期調節因子(ZYG11A)、発作関連6ホモログ様(SEZ6L)、ミオシンX(MYO10)、アセチル-CoAカルボキシラーゼアルファ(ACACA)、Gタンパク質サブユニットアルファi1(GNAI1)、CUEドメイン含有2(CUEDC2)、ホメオボックスD13(HOXD13)、クルッペル様因子14(KLF14)、溶質運搬体ファミリー1メンバー2(SLC1A2)、アセトアセチルCoAシンテターゼ(AACS)、アンキリンリピートおよび無菌アルファモチーフドメイン含有1A(ANKS1A)、マイクロRNA 7641-2(MIR7641-2)、V型コラーゲンアルファ1鎖(COL5A1)、亜ヒ酸塩メチルトランスフェラーゼ(AS3MT)、溶質運搬体ファミリー26メンバー5(SLC26A5)、ヌクレオポリン107(NUP107)、長鎖遺伝子間タンパク質ノンコーディングRNA1797(LINC01797)、ミオシンIC(MYO1C)、アンキリンリピートドメイン37(ANKRD37)、ホスホジエステラーゼ4C(PDE4C)、EFハンドドメイン含有1(EFHC1)、特徴不明のLOC375196(LOC375196)、ELOVL脂肪酸エロンガーゼ2(ELOVL2)、WASタンパク質ファミリーメンバー3(WASF3)、17番染色体オープンリーディングフレーム82(C17orf82)、Gタンパク質共役型受容体158(GPR158)、Fボックスおよびロイシンリッチリピートタンパク質7(FBXL7)、リプリー転写リプレッサー3(RIPPLY3)、ESCRT-IのVPS37Cサブユニット(VPS37C)、ポリペプチドN-アセチルガラクトサミン転移酵素様6(GALNTL6)、DENNドメイン含有3(DENND3)、核受容体コリプレッサー2(NCOR2)、内皮PASドメインタンパク質1(EPAS1)、PBXホメオボックス4(PBX4)、長鎖遺伝子間タンパク質ノンコーディングRNA1531(LINC01531)、配列類似性を有するファミリー110メンバーA(FAM110A)、グリコシルトランスフェラーゼ8ドメイン含有1(GLT8D1)、Gタンパク質サブユニットガンマ2(GNG2)、MT-RNR2様3(MTRNR2L3)、ジンクフィンガータンパク質140(ZNF140)、ras1のキナーゼ抑制因子(KSR1)、タンパク質ジスルフィドイソメラーゼファミリーAメンバー5(PDIA5)、精子形成関連7(SPATA7)、パントテン酸キナーゼ1(PANK1)、ユビキチン特異的ペプチダーゼ4(USP4)、Gタンパク質サブユニットアルファq(GNAQ)、電位依存性カリウムチャネル修飾因子サブファミリーSメンバー1(KCNS1)、DNAポリメラーゼガンマ2、アクセサリーサブユニット(POLG2)、ストークヘッドボックス2(STOX2)、ニューレキシン3(NRXN3)、BMS1、リボソーム生合成因子(BMS1)、フォークヘッドボックスE3(FOXE3)、NADH:ユビキノンオキシドレダクターゼサブユニットA10(NDUFA10)、レラキシンファミリーペプチド受容体3(RXFP3)、GATA結合性タンパク質2(GATA2)、イソプレノイドシンターゼドメイン含有(ISPD)、アデノシンデアミナーゼ、RNA特異的B1(ADARB1)、Wntファミリーメンバー7B(WNT7B)、プレクストリンおよびSec7ドメイン含有3(PSD3)、膜アンカー型ジャンクションタンパク質(MAJIN)、ピリジンヌクレオチド-ジスルフィドオキシドレダクターゼドメイン1(PYROXD1)、シンギュリン様1(CGNL1)、7番染色体オープンリーディングフレーム50(C7orf50)、MORNリピート含有1(MORN1)、アトラスチンGTPアーゼ2(ATL2)、WDリピートおよびFYVEドメイン含有2(WDFY2)、膜貫通タンパク質136(TMEM136)、イノシトールポリリン酸-5-ホスファターゼA(INPP5A)、TBC1ドメインファミリーメンバー9(TBC1D9)、インターフェロン調節因子2(IRF2)、サーチュイン7(SIRT7)、XXIII型コラーゲンアルファ1鎖(COL23A1)、グアニン一リン酸シンターゼ(GMPS)、カリウム2孔ドメインチャネルサブファミリーKメンバー12(KCNK12)、SIN3-HDAC複合体関連因子(SINHCAF)、ヘモグロビンサブユニットイプシロン1(HBE1)、ならびにチューダードメイン含有1(TDRD1)のうちの少なくとも10種、好ましくは少なくとも30種、好ましくは少なくとも50種、好ましくは少なくとも70種、好ましくは全てを含む遺伝子セット。
- ISPD、KCNK12、GNG2、SIRT7、GPATCH1、GRIA4、LINC01531、LOC101927577、NCOR2、WASF3、TRPV3、ACACA、GDNF、EFHC1、MYO10、COL23A1、TDRD1、ELOVL2、GNAI1、MAP4、CCDC179、KLF14、ST7、INPP5A、SIM1、SLC1A2、AS3MT、KSR1、DSCR6、IRF2、KCNS1、NRXN3、C11orf85、HBE1、FOXE3、TMEM136、HOXD13、LOC375196、PANK1、MIR107、COL5A1、PBX4、ZNF140、GALNTL6、NUP107、LOC100507250、MTRNR2L5、C17orf82、MKLN1、FURIN、KLHL42、MORN1、ANKS1A、BCL10、DENND3、FAM110A、PROS1、WNT7B、FBXL7、GATA2、VPS37C、NRP1、POLG2、ANKRD37、GMPS、およびWDFY2のうちの少なくとも5種、好ましくは少なくとも10種、好ましくは少なくとも30種、好ましくは全てを含む、請求項45に記載の遺伝子セット。
- 微小管関連タンパク質4(MAP4)、プロテインキナーゼCゼータ(PRKCZ)、グルタミン酸イオンチャネル型受容体AMPA型サブユニット4(GRIA4)、腫瘍形成能抑制7(ST7)、プロテインキナーゼCイータ(PRKCH)、電位依存性カルシウムチャネルサブユニットアルファ1D(CACNA1D)、細胞死関連タンパク質(DAP)、一過性受容体電位カチオンチャネルサブファミリーVメンバー3(TRPV3)、フューリン、対塩基性アミノ酸切断酵素(FURIN)、アセチル-CoAカルボキシラーゼアルファ(ACACA)、Gタンパク質サブユニットアルファi1(GNAI1)、溶質運搬体ファミリー1メンバー2(SLC1A2)、ホスホジエステラーゼ4C(PDE4C)、ELOVL脂肪酸エロンガーゼ2(ELOVL2)、核受容体コリプレッサー2(NCOR2)、内皮PASドメインタンパク質1(EPAS1)、Gタンパク質サブユニットガンマ2(GNG2)、パントテン酸キナーゼ1(PANK1)、ユビキチン特異的ペプチダーゼ4(USP4)、Gタンパク質サブユニットアルファq(GNAQ)、電位依存性カリウムチャネル修飾因子サブファミリーSメンバー1(KCNS1)、DNAポリメラーゼガンマ2、アクセサリーサブユニット(POLG2)、NADH:ユビキノンオキシドレダクターゼサブユニットA10(NDUFA10)、レラキシンファミリーペプチド受容体3(RXFP3)、イソプレノイドシンターゼドメイン含有(ISPD)、イノシトールポリリン酸-5-ホスファターゼA(INPP5A)、サーチュイン7(SIRT7)、グアニン一リン酸シンターゼ(GMPS)、SIN3-HDAC複合体関連因子(SINHCAF)、チューダードメイン含有1(TDRD1)のうちの少なくとも5種、好ましくは少なくとも10種、好ましくは少なくとも20種、好ましくは全てを含む、請求項45に記載の遺伝子セット。
- 前記ゲノムDNA配列の集合が、請求項2から39に記載の方法による縮小訓練データセットおよび/または年齢指標に含まれ、
前記遺伝子セットが、タンパク質、またはマイクロRNAもしくは長鎖ノンコーディングRNAをコードする前記ゲノムDNA配列の集合から選択することによって得られる、請求項2から39に記載の方法によって得られる請求項40から44のいずれかに記載のゲノムDNA配列の集合または請求項45から47のいずれかに記載の遺伝子セット。 - 個体の健康状態の診断における使用のための、請求項40から44または48に記載のゲノムDNA配列の集合、または請求項45から48のいずれかに記載の遺伝子セット。
- 前記健康状態が、少なくとも1つの老化関連疾患、少なくとも1つの老化関連疾患に関連付けられる少なくとも1つの表現型、および/またはがんの状態を含み、
前記状態は、前記疾患、または疾患に関連付けられる表現型の非存在、存在、またはステージを示す、
請求項49に記載の使用のためのゲノムDNA配列の集合または遺伝子セット。 - 前記老化関連疾患が、アルツハイマー病、パーキンソン病、アテローム性動脈硬化症、心血管疾患、がん、関節炎、白内障、骨粗鬆症、2型糖尿病、高血圧症、老化黄斑変性症および/または良性前立腺肥大症である、請求項50に記載の使用のためのゲノムDNA配列の集合または遺伝子セット。
- 個体のフィットネス状態を決定するための、請求項40から44もしくは48のいずれかに記載のゲノムDNA配列の集合、または請求項45から48のいずれかに記載の遺伝子セットの使用。
- 前記フィットネス状態が、前記個体の血圧、体重、免疫細胞のレベル、炎症のレベルおよび/または認知機能を含む、請求項52に記載の使用。
- 請求項40から44もしくは48のいずれかに記載のゲノムDNA配列の集合、または請求項45から48のいずれかに記載の遺伝子セットを、個体の健康状態および/またはフィットネス状態の指標として得るための方法であって、請求項40から44もしくは48のいずれかに記載のゲノムDNA配列の集合、または請求項45から48のいずれかに記載の遺伝子セットを準備するステップを含む方法。
- 前記ゲノムDNA配列を含む前記個体の生体試料中の前記ゲノムDNA配列のメチル化レベルを決定するステップをさらに含む、請求項54に記載の方法。
- 前記健康状態が、少なくとも1つの老化関連疾患、少なくとも1つの老化関連疾患に関連付けられる少なくとも1つの表現型、および/またはがんの状態を含み、
好ましくは前記老化関連疾患が、アルツハイマー病、パーキンソン病、アテローム性動脈硬化症、心血管疾患、がん、関節炎、白内障、骨粗鬆症、2型糖尿病、高血圧症、老化黄斑変性症および/または良性前立腺肥大症であり、かつ/または
前記フィットネス状態が、前記個体の血圧、体重、免疫細胞のレベル、炎症のレベルおよび/または認知機能を含む、
請求項54または55に記載の方法。 - 前記生体試料が、非侵襲的に、好ましくは頬スワブによって得たものである、請求項55または56に記載の方法。
- 老化に影響を及ぼす分子を同定するためのin silicoおよび/またはin vitroスクリーニング方法であって、請求項40から44もしくは48のいずれかに記載のゲノムDNA配列の集合、または請求項45から48のいずれかに記載の遺伝子セットを準備するステップを含み、
前記分子が、個体に投与されると、少なくとも1つの老化関連疾患、少なくとも1つの老化関連疾患に関連付けられる少なくとも1つの表現型、および/またはがんを好転させる、防止するおよび/または逆転させるものである、方法。 - 前記ゲノムDNA配列のうちの少なくとも1つのDNAメチル化レベルを決定するステップをさらに含む、請求項58に記載の方法。
- 同定された分子が、個体に投与されると、前記個体における前記ゲノムDNA配列のうちの少なくとも1つのDNAメチル化レベルを上昇させ、かつ/または、前記個体における前記ゲノムDNA配列のうちの少なくとも1つのDNAメチル化レベルを低下させるものである、請求項58または59に記載の方法。
- 前記DNAメチル化レベルが、変更前よりも若い暦年齢に関連付けられるように変更される、請求項60に記載の方法。
- 請求項45から48に記載の遺伝子セットを準備し、前記遺伝子セットによってコードされる少なくとも1種のタンパク質の活性を決定するステップをさらに含む、請求項58から61のいずれかに記載の方法。
- 前記同定された分子が、前記遺伝子セットによってコードされる少なくとも1種のタンパク質の活性を阻害し、かつ/または、前記遺伝子セットによってコードされる少なくとも1種のタンパク質の活性を増強するものである、請求項62に記載の方法。
- 前記タンパク質活性が、変更前よりも若い暦年齢に関連付けられるように変更される、請求項63に記載の方法。
- 請求項40から44もしくは48のいずれかに記載のゲノムDNA配列の集合、または請求項45から48のいずれかに記載の遺伝子セットをスポットとして含むチップであって、各配列が、別々のスポットに含有される、チップ。
- 少なくとも1つの独特のプライマー対を含むキットであって、
各プライマー対のうち一方のプライマーが、請求項40から44もしくは48のいずれかに記載のゲノムDNA配列の集合に含まれるゲノムDNA配列のうちの1つまたは請求項45から48のいずれかに記載の遺伝子セットに含まれる遺伝子のうちの1つのリバース鎖に結合するフォワードプライマーであり、他方のプライマーが、フォワード鎖に結合するリバースプライマーであり、
前記フォワードプライマーおよびリバースプライマーの3’末端と相補的な2つのヌクレオチドが、30ヌクレオチド超3000ヌクレオチド未満、好ましくは1000ヌクレオチド未満離れている、
キット。 - 請求項40から44もしくは48のいずれかに記載のゲノムDNA配列の集合に含まれるゲノムDNA配列のうちの1つまたは請求項45から48のいずれかに記載の遺伝子セットに含まれる遺伝子のうちの1つと相補的なプローブを少なくとも1つ含むキット。
- 前記プライマーまたはプローブが、メチル化されたDNAまたはメチル化されていないDNAのいずれかに特異的に結合し、メチル化されていないシトシンが、ウラシルに変換されている、請求項65または66に記載のキット。
- 請求項65に記載のチップを含むキット。
- 生物材料用の容器および/または頬スワブ用の材料をさらに含む、請求項51から57のいずれかに記載のキット。
- 生体試料からゲノムDNAを抽出し、精製し、かつ/または増幅するための材料をさらに含み、前記材料が、スピンカラムおよび/または酵素である、請求項66から70のいずれかに記載のキット。
- 亜硫酸水素塩をさらに含む、請求項66から71のいずれかに記載のキット。
- 請求項2から39のいずれかに記載の方法、請求項40から44もしくは48のいずれかに記載のゲノムDNA配列の集合、および/または請求項45から48のいずれかに記載の遺伝子セットによって得られた年齢指標を含むデータキャリア。
- 年齢が決定される個体に関する調査票をさらに含み、前記調査票が、無記入であり得るまたは前記個体に関する情報を含み得る、請求項66から72のいずれかに記載のキットまたは請求項73に記載のデータキャリア。
- 前記訓練データセット、縮小訓練データセットおよび/または追加されたデータが、前記個体(複数可)に関連付けることができる生活様式またはリスクパターンに関する少なくとも1つの因子をさらに含む、請求項1から39のいずれかに記載の方法。
- 前記因子が、薬物消費、環境汚染物質、交代勤務およびストレスから選択される、請求項75に記載の方法。
- 前記訓練データセットおよび/または前記縮小訓練データセットが、DNAメチル化レベルおよび/またはコードされるタンパク質の活性/レベルが前記生活様式因子のうちの少なくとも1つに関連付けられる配列に限定される、請求項75または76に記載の方法。
- 前記個体の決定された年齢と暦年齢の差に関連付けられる少なくとも1つの生活様式因子を決定するステップをさらに含む、請求項75から77のいずれかに記載の方法。
- 一連の個体中の個体に対する年齢指標を決定する方法であって、前記決定が、前記個体において見いだされるゲノムDNA配列のメチル化のレベルに基づくものであり、
前記個体の年齢に関連付けることができるメチル化のレベルを有するゲノムDNA配列のセットから選択されるゲノムDNA配列の集合のメチル化レベルに基づいて、
前記個体についての年齢指標が、複数の個体についてのゲノムDNA配列のメチル化のレベルの統計学的評価に依拠する様式でもたらされる、方法において、
前記個体についての前記年齢指標が、一連の個体の中で先行する個体について同じ年齢指標を決定するために使用した先行する統計学的評価のために参照した複数の個体とは異なる複数の個体についてのゲノムDNA配列のメチル化のレベルの統計学的評価に依拠する様式でもたらされ、
第1の統計学的評価のために使用された複数の個体が、少なくとも、一連の個体からの追加的な先行する少なくとも1つの個体が含められることによって修正されるという点で、前記複数の個体に差異が生じ、
好ましくは前記個体についての前記年齢指標が、2つの異なる複数の個体についての少なくとも2つの異なる統計学的評価の結果、集合のメチル化レベルから前記年齢指標を算出した場合に使用した少なくとも1つの係数に変化が生じ、かつ/または見いだされる異なるゲノムDNA配列またはCgP遺伝子座のメチル化のレベルが考慮される様式でもたらされる
ことを特徴とする方法。 - 前記個体の年齢に関連付けることができるメチル化のレベルを有するゲノムDNA配列からゲノムDNA配列のセットを準備するステップと、
複数の個体について、前記セットのゲノムDNA配列のメチル化のレベルを決定するステップと、
前記セットからゲノムDNA配列の集合を選択するステップであって、
前記集合内のゲノムDNA配列の数が前記セット内のゲノムDNA配列の数よりも少ないかまたはそれと等しくなり、
かつ
前記集合の配列のメチル化レベルに基づいて前記個体の年齢を算出することができるように選択するステップと、
前記個体由来の生物材料の試料において、少なくとも前記集合の配列のメチル化のレベルを決定するステップと、
前記集合の配列のメチル化のレベルに基づいて前記個体の年齢を算出するステップと、
特に、統計学的評価を考慮して、前記集合のゲノムDNA配列を再選択する必要があるか否か、および/または前記個体の年齢をメチル化のレベルに基づいて算出するやり方を変更すべきか否かを判定するステップと、
前記判定に応じて、前記個体を含むように個体の群を修正するステップと、
修正された群の個体のメチル化のレベルの決定に基づいて前記セットからゲノムDNA配列の集合を再選択するステップ
および/または
集合のメチル化レベルから前記年齢指標を算出した場合に使用した少なくとも1つの係数を変化させるステップ
のうちの少なくとも1つと
を含む、個体において見いだされるゲノムDNA配列のメチル化のレベルに基づく、請求項79に記載の個体の年齢を決定する方法。 - 前記個体の年齢に関連付けることができるメチル化のレベルを有するゲノムDNA配列からゲノムDNA配列のセットを事前選択するステップと、
複数の個体について、前記事前選択されたゲノムDNA配列のメチル化のレベルを決定するステップと、
前記事前選択されたセットからゲノムDNA配列の集合を選択するステップであって、
前記集合内のゲノムDNA配列の数が前記事前選択されたセット内のゲノムDNA配列の数よりも少なくなり、
前記集合の配列のメチル化レベルに基づいて前記個体の年齢を算出することができ、かつ
算出された年齢に関する統計学的評価は、前記算出された年齢の許容される質を示すように選択するステップと、
前記個体由来の生物材料の試料において前記集合の配列のメチル化のレベルを決定するステップと、
前記集合の配列のメチル化のレベルに基づいて前記個体の年齢を算出するステップと、
前記算出された年齢の質の統計学的評価基準を算出するステップと、
前記統計学的評価基準に従った質が許容されるものであるか否かを判定するステップと、
前記質が許容されるものと判断された場合、前記個体の算出された年齢を出力するステップと、
前記質が許容できないものと判断された場合、ゲノムDNA配列を再選択する必要があることを決定するステップと、
前記個体を含むように個体の群を修正するステップと、
修正された群の個体のメチル化のレベルの決定に基づいて、ゲノムDNA配列の集合を前記事前選択されたサブセットから再選択するステップと
を含む、請求項80に記載の個体の年齢を決定する方法。 - ゲノムDNA配列の選択が、前記個体のゲノムDNA配列のメチル化レベル、特に、関連性のあるCpG遺伝子座を同定するための少なくとも1つの回帰法、特に、関連性のあるCpGを同定するための主成分分析、LASSO/elastic net回帰および/またはXPG Boost法のうちの少なくとも1つを使用した統計解析に関する値の統計解析に基づく、請求項79~81のうち一項に記載の年齢を決定する方法。
- 前記事前選択されたセットが、
少なくとも90のゲノムDNA配列、
好ましくは少なくとも100のゲノムDNA配列、
特に好ましくは少なくとも140のゲノムDNA配列
を含み、
かつ/または
前記事前選択されたセットが、
2000未満のゲノムDNA配列、
特に500未満のゲノムDNA配列、
特に350未満のゲノムDNA配列、
特に170未満のゲノムDNA配列、
特に150未満のゲノムDNA配列
を含み、
かつ/または
前記選択された集合が、
少なくとも30のゲノムDNA配列、
好ましくは少なくとも50のゲノムDNA配列、
特に好ましくは少なくとも60のゲノムDNA配列
を含み、
かつ/または
前記選択された集合が、
150未満のゲノムDNA配列、
特に110未満のゲノムDNA配列、
特に100未満のゲノムDNA配列、
特に90未満のゲノムDNA配列、
特に80未満のゲノムDNA配列、
特に70未満のゲノムDNA配列
を含む、請求項79~82のうち一項に記載の年齢を決定する方法。 - 暦年齢と生物学的年齢の差異を評価するための方法であって、
前記方法請求項のうちの一項に従って、メチル化レベルに基づく年齢を決定するステップと、
決定された生物学的年齢を既知の暦年齢と比較するステップであって、
特に、
複数の個体について差異を決定し、複数の個体について前記差異に影響を及ぼす可能性も影響を及ぼさない可能性もある因子を決定し、多数の個体において暦年齢と前記生物学的年齢の差異に対して大きな影響を持つ因子を決定する、ステップと
を含む方法。 - 1つの固定された集合のものよりも多くのCpG遺伝子座のメチル化レベルを決定し、
1つよりも多くの集合について、前記年齢指標の決定を可能にするデータを、年齢をそれぞれのデータに基づいて算出することができるように準備し、
前記年齢を算出するための1つの集合の選択を、測定された前記個体のある特定のメチル化レベル、または前記個体に関連付けることができる生活様式もしくはリスクパターンに関する因子のいずれかに基づいて行う、請求項79~83のうちの一項に記載の方法。 - 前記個体において見いだされるゲノムDNA配列のメチル化のレベルを、
メチル化シーケンシング/バイサルファイトシーケンシング、
PCR法、特に、メチル化特異的PCR(MSP)、リアルタイムメチル化特異的PCR、定量的メチル化特異的PCR(QMSP)、COLD-PCR、メチル化DNA特異的結合性タンパク質を使用したPCR、標的化多重PCR、リアルタイムPCRおよびマイクロアレイに基づくPCRのうちの少なくとも1つ、
高分解能融解分析(HRM)、
メチル化感受性一塩基プライマー伸長(MS-SnuPE)、
メチル化感受性一本鎖コンフォメーション分析、
メチル感受性切断計数(MSCC)、
塩基特異的切断/MALDI-TOF、例えばAgena、
複合バイサルファイト制限分析(COBRA)、
メチル化DNA免疫沈降(MeDIP)、
マイクロアレイに基づく方法、
ビーズアレイに基づく方法、
パイロシーケンシング、バイサルファイト処理を伴わない直接シーケンシング(ナノポア技術)
のうちの少なくとも1つによって測定する、請求項79~83のうちの一項に記載の年齢を決定する方法。 - 前記個体の群を、前記個体を前記群に追加することによって修正する、請求項79~83および86のうちの一項に記載の年齢を決定する方法。
- 前記個体を含むように前記個体の群を修正するステップが、個体の年齢および/または個体のゲノムDNA配列の一部もしくは全部のメチル化レベルとは無関係の因子を特に考慮して、少なくとも1つの他の個体を前記群から除外することを含む、請求項79~83、86および87のうちの一項に記載の年齢を決定する方法。
- 以下の条件:
前記ゲノムDNA配列において検出されたメチル化レベルの一部または全部が低すぎるとみなされる、
単一の個体の予測年齢が前記個体の既知の暦年齢からあまりにもかけ離れている、
いくつかの個体の予測年齢がいくつかの個体の既知の暦年齢からの系統偏差を示す、
いくつかの個体の予測年齢が前記個体の既知の暦年齢のあちこちに散らばっており、分散が大きすぎるとみなされる、
いくつかの個体の予測年齢が前記個体の既知の暦年齢からの系統偏差を示す、
所与の集合に基づいて年齢が決定された個体の数が所定の数に達した、
前の再選択から指定時間が経過した
のうちの少なくとも1つまたは好ましくはいくつかが満たされた場合、追加的な個体について得られたメチル化レベルに基づいて前記集合を変更する決定を行う、請求項79~83および86~88のうちの一項に記載の年齢を決定する方法。 - 方法の請求項1~39、75~83および85~89のうちの一項に従って年齢を決定することが可能になる様式で得られたおよび/または調製された個体の生物材料用の容器を少なくとも含むキットであって、患者の同定に関する情報を保有する情報媒体も含み、
方法の請求項1~39、75~83および85~89のうちの一項に記載の方法を実行するためのもしくはどのように実行されたか、および/または、方法の請求項1~39、75~83および85~89に記載の方法によって決定された年齢関連データを含むデータキャリアを作製するためのデータを準備するため、
および/または、方法の請求項1~39、75~83および85~89に記載の方法によって決定された年齢関連データを含むデータキャリアを準備するための指示をさらに含む、キット。 - 老化に影響を及ぼすことに関していくつかの分子をスクリーニングする方法であって、特に請求項79に記載の方法において集合のために選択されたゲノムDNA配列を参照することにより、生物学的年齢とよく相関するいくつかのゲノムDNA配列の数を決定するステップと、前記いくつかの分子のうちのある分子が、前記ゲノムDNA配列のメチル化レベルに対する正の効果を有するかどうかを、特にin-silicoにおける決定によって決定するステップとを含む方法。
- メチル化レベルの決定における使用のために適合させたいくつかのスポット、特に500未満、好ましくは385未満、特に193未満、特に160未満のスポットを含むチップであって、前記スポットが、cg11330075、cg25845463、cg22519947、cg21807065、cg09001642、cg18815943、cg06335143、cg01636910、cg10501210、cg03324695、cg19432688、cg22540792、cg11176990、cg00097800、cg09805798、cg03526652、cg09460489、cg18737844、cg07802350、cg10522765、cg12548216、cg00876345、cg15761531、cg05990274、cg05972734、cg03680898、cg16593468、cg19301963、cg12732998、cg02536625、cg24088134、cg24319133、cg03388189、cg05106770、cg08686931、cg25606723、cg07782620、cg16781885、cg14231565、cg18339380、cg25642673、cg10240079、cg19851481、cg17665505、cg13333913、cg07291317、cg12238343、cg08478427、cg07625177、cg03230469、cg13154327、cg16456442、cg26430984、cg16867657、cg24724428、cg08194377、cg10543136、cg12650870、cg00087368、cg17760405、cg21628619、cg01820962、cg16999154、cg22444338、cg00831672、cg08044253、cg08960065、cg07529089、cg11607603、cg08097417、cg07955995、cg03473532、cg06186727、cg04733826、cg20425444、cg07513002、cg14305139、cg13759931、cg14756158、cg08662753、cg13206721、cg04287203、cg18768299、cg05812299、cg04028695、cg07120630、cg17343879、cg07766948、cg08856941、cg16950671、cg01520297、cg27540719、cg24954665、cg05211227、cg06831571、cg19112204、cg12804730、cg08224787、cg13973351、cg21165089、cg05087008、cg05396610、cg23677767、cg21962791、cg04320377、cg16245716、cg21460868、cg09275691、cg19215678、cg08118942、cg16322747、cg12333719、cg23128025、cg27173374、cg02032962、cg18506897、cg05292016、cg16673857、cg04875128、cg22101188、cg07381960、cg06279276、cg22077936、cg08457029、cg20576243、cg09965557、cg03741619、cg04525002、cg15008041、cg16465695、cg16677512、cg12658720、cg27394136、cg14681176、cg07494888、cg14911690、cg06161948、cg15609017、cg10321869、cg15743533、cg19702785、cg16267121、cg13460409、cg19810954、cg06945504、cg06153788、およびcg20088545のうちの少なくとも1つのメチル化レベルの決定において使用するために特異的に適合させた少なくとも1つのスポットおよび好ましくはいくつかのスポットを含む、チップ。
- 前記スポットが、請求項92に列挙されているCpG遺伝子座に対して少なくとも10スポット、好ましくは請求項92に列挙されているCpG遺伝子座に対して20スポット、特に、請求項92に列挙されているCpG遺伝子座に対して少なくとも50スポット、特に、請求項92に列挙されているCpG遺伝子座の全てに対するスポットを含む、請求項92に記載のチップ。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP18199156.3 | 2018-10-08 | ||
EP18199156 | 2018-10-08 | ||
PCT/EP2019/077252 WO2020074533A1 (en) | 2018-10-08 | 2019-10-08 | Method and devices for age determination |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022508597A JP2022508597A (ja) | 2022-01-19 |
JPWO2020074533A5 true JPWO2020074533A5 (ja) | 2022-09-26 |
Family
ID=63857691
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021543580A Pending JP2022508597A (ja) | 2018-10-08 | 2019-10-08 | 年齢を決定するための方法およびデバイス |
Country Status (6)
Country | Link |
---|---|
US (1) | US20210388442A1 (ja) |
EP (1) | EP3864174A1 (ja) |
JP (1) | JP2022508597A (ja) |
CN (1) | CN112840037A (ja) |
CA (1) | CA3113551A1 (ja) |
WO (1) | WO2020074533A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022058980A1 (en) | 2020-09-21 | 2022-03-24 | Insilico Medicine Ip Limited | Methylation data signatures of aging and methods of determining a methylation aging clock |
JP7479317B2 (ja) | 2021-03-16 | 2024-05-08 | Kddi株式会社 | 情報処理装置、方法及びプログラム |
GB202110825D0 (en) * | 2021-07-28 | 2021-09-08 | Ucl Business Ltd | Methods for assessing epigenetic age and cancer risk |
CN114214363B (zh) * | 2021-12-03 | 2024-04-19 | 浙江大学 | 一种抗间充质干细胞衰老修饰方法及其应用 |
WO2023175019A1 (en) * | 2022-03-15 | 2023-09-21 | Genknowme S.A. | Method determining the difference between the biological age and the chronological age of a subject |
WO2024050119A1 (en) * | 2022-09-01 | 2024-03-07 | The Brigham And Women's Hospital, Inc. | Transcriptomic clocks of biological age and lifespan |
WO2024091451A1 (en) * | 2022-10-28 | 2024-05-02 | Biovie Inc. | Methods for the treatment of biological aging |
JP7442221B1 (ja) | 2022-11-15 | 2024-03-04 | 学校法人 岩手医科大学 | 生物学的年齢の計算方法、老化状態の評価方法、CpGサイトの評価方法、プログラム、およびコンピュータ可読記憶媒体 |
CN115841872A (zh) * | 2023-02-22 | 2023-03-24 | 中国疾病预防控制中心环境与健康相关产品安全所 | 老年人寿命预测方法、设备及计算机可读存储介质 |
CN117393044B (zh) * | 2023-12-11 | 2024-02-27 | 四川大学华西医院 | 一种用于轻度认知障碍症早期筛查的试剂盒及诊断系统 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5675829B2 (ja) * | 2009-10-15 | 2015-02-25 | クレッシェンド バイオサイエンス インコーポレイテッド | 炎症性疾患活動性を測定およびモニタリングするためのバイオマーカーおよび方法 |
WO2012162139A1 (en) | 2011-05-20 | 2012-11-29 | The Regents Of The University Of California | Method to estimate age of individual based on epigenetic markers in biological sample |
EP2711431B1 (en) * | 2012-09-24 | 2016-12-14 | Rheinisch-Westfälische Technische Hochschule (RWTH) Aachen | Method for determining the age of a human individual |
WO2015048665A2 (en) | 2013-09-27 | 2015-04-02 | The Regents Of The University Of California | Method to estimate the age of tissues and cell types based on epigenetic markers |
US20160327578A1 (en) * | 2015-05-07 | 2016-11-10 | Boston Heart Diagnostics Corporation | Cholesterol efflux capacity assessment |
CA3207751A1 (en) * | 2015-09-29 | 2017-04-06 | Laboratory Corporation Of America Holdings | Biomarkers and methods for assessing psoriatic arthritis disease activity |
WO2018009696A1 (en) * | 2016-07-06 | 2018-01-11 | Youhealth Biotech, Limited | Colon cancer methylation markers and uses thereof |
KR101873303B1 (ko) * | 2017-01-24 | 2018-07-02 | 연세대학교 산학협력단 | 타액 내 dna 메틸화를 이용한 연령 예측 방법 |
CN106947830B (zh) * | 2017-05-16 | 2019-10-08 | 中山大学附属肿瘤医院 | 用于诊断、预测肝癌疗效和预后的基因甲基化面板 |
-
2019
- 2019-10-08 JP JP2021543580A patent/JP2022508597A/ja active Pending
- 2019-10-08 EP EP19779946.3A patent/EP3864174A1/en active Pending
- 2019-10-08 CA CA3113551A patent/CA3113551A1/en active Pending
- 2019-10-08 US US17/283,775 patent/US20210388442A1/en active Pending
- 2019-10-08 WO PCT/EP2019/077252 patent/WO2020074533A1/en unknown
- 2019-10-08 CN CN201980066591.3A patent/CN112840037A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Naue et al. | Chronological age prediction based on DNA methylation: massive parallel sequencing and random forest regression | |
JP2022508597A (ja) | 年齢を決定するための方法およびデバイス | |
Rosenkranz et al. | Characterizing the mouse ES cell transcriptome with Illumina sequencing | |
Stein et al. | Differential display technology: a general guide | |
US20140228231A1 (en) | Method to estimate age of individual based on epigenetic markers in biological sample | |
Fendri et al. | Microarray expression profiling identifies genes with altered expression in Adolescent Idiopathic Scoliosis | |
JP6224631B2 (ja) | Cd3cd4陽性tリンパ球の同定用のエピジェネティックマーカー | |
García-Pérez et al. | Epigenomic profiling of primate lymphoblastoid cell lines reveals the evolutionary patterns of epigenetic activities in gene regulatory architectures | |
JPWO2020074533A5 (ja) | ||
Deans et al. | Applying stem cells and CRISPR engineering to uncover the etiology of schizophrenia | |
Zufferey et al. | Epigenetics and methylation in the rheumatic diseases | |
Busch et al. | Profiling a plant: expression analysis in Arabidopsis | |
Darnell | Developing global insight into RNA regulation | |
KR102333797B1 (ko) | 경도인지장애 및 알츠하이머성 치매의 선별 진단을 위한 신규 마이크로 rna 바이오마커 | |
WO2010016634A2 (en) | Kits for identification of exposure to phenanthrene and the method of identification of exposure to phenanthrene | |
Ren et al. | Developmental stage related patterns of codon usage and genomic GC content: searching for evolutionary fingerprints with models of stem cell differentiation | |
US20220002797A1 (en) | Full-length rna sequencing | |
Rowley et al. | The platelet transcriptome in health and disease | |
IL261579B2 (en) | Algorithm and in vitro method based on editing of rna for the selection of a certain effect induced by active compounds | |
Rutledge et al. | Gene expression analysis of primordial shoot explants collected from mature white spruce (Picea glauca) trees that differ in their responsiveness to somatic embryogenesis induction | |
Golbargi et al. | Analysis of the epigenetic regulation of TNF receptor superfamily 25 (TNFRSF25) in rheumatoid arthritis | |
Yu et al. | Techniques for assessing telomere length: A methodological review | |
KR102281644B1 (ko) | 지연성 허혈 진단을 위한 insr 유전자 과메틸화 마커 | |
KR102281657B1 (ko) | 지연성 허혈 진단을 위한 cdhr5 유전자 과메틸화 마커 | |
KR102703927B1 (ko) | 핵산 변형 및 식별 방법 |