JP2023002298A - 糖尿病指標値の検出方法 - Google Patents
糖尿病指標値の検出方法 Download PDFInfo
- Publication number
- JP2023002298A JP2023002298A JP2021103461A JP2021103461A JP2023002298A JP 2023002298 A JP2023002298 A JP 2023002298A JP 2021103461 A JP2021103461 A JP 2021103461A JP 2021103461 A JP2021103461 A JP 2021103461A JP 2023002298 A JP2023002298 A JP 2023002298A
- Authority
- JP
- Japan
- Prior art keywords
- gene
- value
- expression
- level
- diabetes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 206010012601 diabetes mellitus Diseases 0.000 title claims abstract description 85
- 238000000034 method Methods 0.000 title claims abstract description 42
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 177
- 230000014509 gene expression Effects 0.000 claims abstract description 134
- 238000001514 detection method Methods 0.000 claims abstract description 51
- 239000003550 marker Substances 0.000 claims abstract description 21
- 239000012472 biological sample Substances 0.000 claims abstract description 17
- 210000004369 blood Anatomy 0.000 claims description 86
- 239000008280 blood Substances 0.000 claims description 86
- 102000039446 nucleic acids Human genes 0.000 claims description 27
- 108020004707 nucleic acids Proteins 0.000 claims description 27
- 150000007523 nucleic acids Chemical class 0.000 claims description 27
- 238000012360 testing method Methods 0.000 claims description 23
- 108010004903 glycosylated serum albumin Proteins 0.000 claims description 22
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 claims description 17
- 101001001648 Homo sapiens Serine/threonine-protein kinase pim-2 Proteins 0.000 claims description 17
- 102100036120 Serine/threonine-protein kinase pim-2 Human genes 0.000 claims description 17
- 239000008103 glucose Substances 0.000 claims description 17
- -1 SNORA10 Proteins 0.000 claims description 12
- 150000002632 lipids Chemical group 0.000 claims description 10
- 101150070234 31 gene Proteins 0.000 claims description 9
- 102100035341 Guanine nucleotide-binding protein G(I)/G(S)/G(T) subunit beta-2 Human genes 0.000 claims description 9
- 101001024278 Homo sapiens Guanine nucleotide-binding protein G(I)/G(S)/G(T) subunit beta-2 Proteins 0.000 claims description 9
- 101001112198 Homo sapiens Putative neutrophil cytosol factor 1B Proteins 0.000 claims description 9
- 101000711456 Homo sapiens Putative speedy protein E7 Proteins 0.000 claims description 9
- 101000663568 Homo sapiens Small proline-rich protein 3 Proteins 0.000 claims description 9
- 102100023615 Putative neutrophil cytosol factor 1B Human genes 0.000 claims description 9
- 102100034038 Putative speedy protein E7 Human genes 0.000 claims description 9
- 102100038979 Small proline-rich protein 3 Human genes 0.000 claims description 9
- 102100029650 EH domain-binding protein 1-like protein 1 Human genes 0.000 claims description 8
- 101001012961 Homo sapiens EH domain-binding protein 1-like protein 1 Proteins 0.000 claims description 8
- 101000718733 Homo sapiens Repetin Proteins 0.000 claims description 8
- 108091034117 Oligonucleotide Proteins 0.000 claims description 8
- 102100026259 Repetin Human genes 0.000 claims description 8
- 102100027667 Carboxy-terminal domain RNA polymerase II polypeptide A small phosphatase 2 Human genes 0.000 claims description 6
- 102100031418 EF-hand domain-containing protein D2 Human genes 0.000 claims description 6
- 101000725947 Homo sapiens Carboxy-terminal domain RNA polymerase II polypeptide A small phosphatase 2 Proteins 0.000 claims description 6
- 101000866913 Homo sapiens EF-hand domain-containing protein D2 Proteins 0.000 claims description 6
- 101000650000 Homo sapiens WW domain binding protein 1-like Proteins 0.000 claims description 6
- 102100028277 WW domain binding protein 1-like Human genes 0.000 claims description 6
- 102100029112 Endothelin-converting enzyme 1 Human genes 0.000 claims description 5
- 101000841259 Homo sapiens Endothelin-converting enzyme 1 Proteins 0.000 claims description 5
- 101000994448 Homo sapiens Keratin, type I cytoskeletal 25 Proteins 0.000 claims description 5
- 101000581151 Homo sapiens Rho GTPase-activating protein 9 Proteins 0.000 claims description 5
- 101001000119 Homo sapiens Unconventional myosin-If Proteins 0.000 claims description 5
- 102100032703 Keratin, type I cytoskeletal 25 Human genes 0.000 claims description 5
- 102100027658 Rho GTPase-activating protein 9 Human genes 0.000 claims description 5
- 108091034056 Small Cajal body specific RNA 16 Proteins 0.000 claims description 5
- 102100035825 Unconventional myosin-If Human genes 0.000 claims description 5
- 108020004999 messenger RNA Proteins 0.000 claims description 5
- 102100025843 Cytohesin-4 Human genes 0.000 claims description 4
- 101000855828 Homo sapiens Cytohesin-4 Proteins 0.000 claims description 4
- 101001081189 Homo sapiens Rho GTPase-activating protein 45 Proteins 0.000 claims description 4
- 101000802094 Homo sapiens mRNA decay activator protein ZFP36L1 Proteins 0.000 claims description 4
- 102100027748 Rho GTPase-activating protein 45 Human genes 0.000 claims description 4
- 102100034702 mRNA decay activator protein ZFP36L1 Human genes 0.000 claims description 4
- 101150072531 10 gene Proteins 0.000 claims description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 65
- 239000000047 product Substances 0.000 description 53
- 108020004414 DNA Proteins 0.000 description 43
- 210000003491 skin Anatomy 0.000 description 24
- 239000000523 sample Substances 0.000 description 18
- 102000004169 proteins and genes Human genes 0.000 description 15
- 239000002299 complementary DNA Substances 0.000 description 13
- 238000003646 Spearman's rank correlation coefficient Methods 0.000 description 12
- 241000282414 Homo sapiens Species 0.000 description 11
- 238000004422 calculation algorithm Methods 0.000 description 11
- 238000009396 hybridization Methods 0.000 description 11
- 238000012549 training Methods 0.000 description 11
- 239000003153 chemical reaction reagent Substances 0.000 description 10
- 238000005259 measurement Methods 0.000 description 10
- 238000010839 reverse transcription Methods 0.000 description 10
- 238000012706 support-vector machine Methods 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 8
- 230000000295 complement effect Effects 0.000 description 8
- 239000000463 material Substances 0.000 description 8
- 238000000926 separation method Methods 0.000 description 8
- 102000053602 DNA Human genes 0.000 description 7
- 102100034343 Integrase Human genes 0.000 description 7
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 7
- 239000007795 chemical reaction product Substances 0.000 description 7
- 238000007796 conventional method Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 6
- 238000007403 mPCR Methods 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 6
- 238000012163 sequencing technique Methods 0.000 description 6
- 238000010276 construction Methods 0.000 description 5
- 238000003199 nucleic acid amplification method Methods 0.000 description 5
- 239000002773 nucleotide Substances 0.000 description 5
- 125000003729 nucleotide group Chemical group 0.000 description 5
- 238000007637 random forest analysis Methods 0.000 description 5
- 210000001519 tissue Anatomy 0.000 description 5
- 239000002250 absorbent Substances 0.000 description 4
- 230000002745 absorbent Effects 0.000 description 4
- 230000003321 amplification Effects 0.000 description 4
- 238000000137 annealing Methods 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 238000000018 DNA microarray Methods 0.000 description 3
- 238000000636 Northern blotting Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 239000011324 bead Substances 0.000 description 3
- 210000001124 body fluid Anatomy 0.000 description 3
- 239000010839 body fluid Substances 0.000 description 3
- 238000010805 cDNA synthesis kit Methods 0.000 description 3
- 238000002790 cross-validation Methods 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 238000002493 microarray Methods 0.000 description 3
- 229920001184 polypeptide Polymers 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 108090000765 processed proteins & peptides Proteins 0.000 description 3
- 102000004196 processed proteins & peptides Human genes 0.000 description 3
- 238000003757 reverse transcription PCR Methods 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 210000002374 sebum Anatomy 0.000 description 3
- 230000028327 secretion Effects 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 210000000434 stratum corneum Anatomy 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 238000012232 AGPC extraction Methods 0.000 description 2
- 102100027211 Albumin Human genes 0.000 description 2
- 108010088751 Albumins Proteins 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 239000004743 Polypropylene Substances 0.000 description 2
- 238000002123 RNA extraction Methods 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 239000000853 adhesive Substances 0.000 description 2
- 230000001070 adhesive effect Effects 0.000 description 2
- 238000010241 blood sampling Methods 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 239000007853 buffer solution Substances 0.000 description 2
- 210000004027 cell Anatomy 0.000 description 2
- 238000003759 clinical diagnosis Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 210000000416 exudates and transudate Anatomy 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 210000004209 hair Anatomy 0.000 description 2
- 230000003053 immunization Effects 0.000 description 2
- 238000003018 immunoassay Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 239000006249 magnetic particle Substances 0.000 description 2
- 238000007410 oral glucose tolerance test Methods 0.000 description 2
- 229920001155 polypropylene Polymers 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 210000003296 saliva Anatomy 0.000 description 2
- 210000001732 sebaceous gland Anatomy 0.000 description 2
- 239000007790 solid phase Substances 0.000 description 2
- 210000004243 sweat Anatomy 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 210000002700 urine Anatomy 0.000 description 2
- 239000003021 water soluble solvent Substances 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 206010049119 Emotional distress Diseases 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 108700039887 Essential Genes Proteins 0.000 description 1
- 206010071602 Genetic polymorphism Diseases 0.000 description 1
- 206010018429 Glucose tolerance impaired Diseases 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 208000001280 Prediabetic State Diseases 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 239000002981 blocking agent Substances 0.000 description 1
- 235000021152 breakfast Nutrition 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000003593 chromogenic compound Substances 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 210000004207 dermis Anatomy 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000007847 digital PCR Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 210000002615 epidermis Anatomy 0.000 description 1
- 210000003499 exocrine gland Anatomy 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 210000004907 gland Anatomy 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 208000035474 group of disease Diseases 0.000 description 1
- 210000003780 hair follicle Anatomy 0.000 description 1
- 210000004408 hybridoma Anatomy 0.000 description 1
- 201000001421 hyperglycemia Diseases 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000001294 liquid chromatography-tandem mass spectrometry Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 238000001840 matrix-assisted laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000006371 metabolic abnormality Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 150000002772 monosaccharides Chemical class 0.000 description 1
- 201000000050 myeloid neoplasm Diseases 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 150000002482 oligosaccharides Chemical class 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 201000009104 prediabetes syndrome Diseases 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 238000007790 scraping Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 210000004927 skin cell Anatomy 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 210000004989 spleen cell Anatomy 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 210000000106 sweat gland Anatomy 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
【課題】糖尿病指標値を検出するための検出マーカー、及び当該検出マーカーを用いた糖尿病指標値の検出方法の提供。【解決手段】被験者から採取された生体試料について、31種の特定の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む、当該被験者の糖尿病指標値の検出方法。【選択図】なし
Description
本発明は、糖尿病指標値の検出マーカーを用いた糖尿病指標値の検出方法に関する。
糖尿病は、インスリン作用の不足による慢性高血糖を主徴とし、種々の特徴的な代謝異常を伴う疾患群である。糖尿病の検査指標には、血糖値(空腹時、経口糖負荷試験(OGTT)2時間、随時)、HbA1c値、グリコアルブミン値等がある。糖尿病の臨床診断においては、空腹時血糖値が126mg/dL以上、HbA1c値が6.5%以上であると糖尿病型に分類され、HbA1c値が5.5~6.5%未満は境界領域と言われる(非特許文献1)。
糖尿病の予防や治療には、継続的に血糖値等の糖尿病指標値を管理することが重要である。現在、自宅において血糖値を測定可能な自己測定器が市販されている。しかしながら、指先採血は痛みが伴い、測定のたびに精神的苦痛もかかる上、採血する際に感染症を引き起こす可能性がある。最近では、Freestyleリブレ(アボットジャパン)のような低侵襲的な血糖モニタリング機器が開発されているが、糖尿病患者向けの医療機器であり、未病領域の人が予防的に使用する類のものではない。そのため、非侵襲的に、痛み無く、糖尿病指標値を簡便に把握できる方法が望まれる。
近年、生体試料中のDNAやRNA等の核酸の解析によりヒトの生体内の現在さらには将来の生理状態を調べる技術が開発されている。生体由来の核酸は、血液等の体液、分泌物、組織等から抽出することができる。さらに最近、皮膚表上脂質(skin surface lipids;SSL)に含まれるRNAを生体の解析用の試料として利用可能であることが報告されている(特許文献1)。
糖尿病 (2012) 55(7): 485-504
本発明は、糖尿病指標値を検出するための検出マーカー、及び当該検出マーカーを用いた糖尿病指標値の検出方法を提供することに関する。
本発明者は、正常型、境界型、糖尿病型のいずれかに属する被験者からSSLを採取し、SSL中に含まれるRNAの発現状態をシーケンス情報として網羅的に解析した結果、特定の遺伝子の発現レベルが糖尿病指標値と有意に相関し、当該遺伝子の発現レベルに基づいて糖尿病指標値を検出できることを見出した。
すなわち、本発明は、以下の1)~3)に係るものである。
1)被験者から採取された生体試料について、下記表1に示す31種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む、当該被験者の糖尿病指標値の検出方法。
2)前記遺伝子又はそれに由来する核酸と特異的にハイブリダイズするオリゴヌクレオチド、又は前記遺伝子の発現産物を認識する抗体を含有する、1)の方法に用いられる糖尿病指標値を検出するための検査用キット。
3)下記表1に示す31種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物からなる、糖尿病指標値を検出するための検出マーカー。
1)被験者から採取された生体試料について、下記表1に示す31種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む、当該被験者の糖尿病指標値の検出方法。
2)前記遺伝子又はそれに由来する核酸と特異的にハイブリダイズするオリゴヌクレオチド、又は前記遺伝子の発現産物を認識する抗体を含有する、1)の方法に用いられる糖尿病指標値を検出するための検査用キット。
3)下記表1に示す31種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物からなる、糖尿病指標値を検出するための検出マーカー。
本発明によれば、簡便且つ非侵襲的に、糖尿病指標値を検出することが可能である。
本明細書中で引用された全ての特許文献、非特許文献、及びその他の刊行物は、その全体が本明細書中において参考として援用される。
本発明において、「核酸」又は「ポリヌクレオチド」と云う用語は、DNA又はRNAを意味する。DNAには、cDNA、ゲノムDNA、及び合成DNAのいずれもが含まれ、「RNA」には、total RNA、mRNA、rRNA、tRNA、non-coding RNA及び合成のRNAのいずれもが含まれる。
本発明において「遺伝子」とは、ヒトゲノムDNAを含む2本鎖DNAの他、cDNAを含む1本鎖DNA(正鎖)、当該正鎖と相補的な配列を有する1本鎖DNA(相補鎖)、及びこれらの断片を包含するものであって、DNAを構成する塩基の配列情報の中に、何らかの生物学的情報が含まれているものを意味する。
また、本発明における「遺伝子」には、特定の塩基配列で表される「遺伝子」だけではなく、その同族体(すなわち、ホモログもしくはオーソログ)、遺伝子多型等の変異体、及び誘導体が包含される。
ここで、本明細書中に開示される遺伝子の名称は、NCBI([www.ncbi.nlm.nih.gov/])に記載のあるOfficial Symbolに従う。
また、本発明における「遺伝子」には、特定の塩基配列で表される「遺伝子」だけではなく、その同族体(すなわち、ホモログもしくはオーソログ)、遺伝子多型等の変異体、及び誘導体が包含される。
ここで、本明細書中に開示される遺伝子の名称は、NCBI([www.ncbi.nlm.nih.gov/])に記載のあるOfficial Symbolに従う。
本発明において、遺伝子の「発現産物」とは、遺伝子の転写産物及び翻訳産物を包含する概念である。「転写産物」とは、遺伝子(DNA)から転写されて生じるRNAであり、「翻訳産物」とは、RNAに基づき翻訳合成される、遺伝子にコードされたタンパク質を意味する。
本発明において、「糖尿病指標値」とは、糖尿病の臨床診断に利用される検査指標を指す。例えば、空腹時血糖値、75g経口糖負荷試験(OGTT)2時間値、随時血糖値、血中HbA1c値、血中グリコアルブミン値、血中1,5-AG(1,5-アンヒドログルシトール)値等が挙げられる。
本発明において、糖尿病指標値の「検出」は、検査、測定、判定又は評価支援等の用語で言い換えることもできる。なお、本発明における糖尿病指標値積の「検出」、「検査」、「測定」、「判定」又は「評価」という用語は、医師による診断を含むものではない。
後述する実施例に示すように、糖尿病指標値として知られている、空腹時血糖値、血中HbA1c値又は血中グリコアルブミン値が正常型、境界型、糖尿病型のいずれかを示す被験者について、以下の手順1)~3)でRNA発現解析を行ったところ、下記表1に示す31種の遺伝子は、SSL中の発現が当該糖尿病指標値のいずれかと正に相関する遺伝子であることが見出された。
1)SSL由来RNAの発現量のデータ(リードカウント値)を取得する。
2)リードカウント値をサンプル被験者間の総リード数の違いを補正したRPM値に変換し、これに整数1を加算した底2の対数値(log2(RPM+1)値)と、糖尿病指標値に整数1を加算した自然対数値(ln(測定値+1)値))の組み合わせについてスピアマンの順位相関係数を求める。
3)スピアマンの順位相関係数(ρ)の大きな遺伝子(上位遺伝子)を抽出・選択する。
1)SSL由来RNAの発現量のデータ(リードカウント値)を取得する。
2)リードカウント値をサンプル被験者間の総リード数の違いを補正したRPM値に変換し、これに整数1を加算した底2の対数値(log2(RPM+1)値)と、糖尿病指標値に整数1を加算した自然対数値(ln(測定値+1)値))の組み合わせについてスピアマンの順位相関係数を求める。
3)スピアマンの順位相関係数(ρ)の大きな遺伝子(上位遺伝子)を抽出・選択する。
上記表1に示す31種の遺伝子は、これまでに糖尿病との関連が報告されていない遺伝子である。
したがって、当該31種の遺伝子群より選択される遺伝子又はその発現産物は糖尿病指標値を検出するための検出マーカーとなり得る。また、当該31種の遺伝子群より選択される遺伝子又はその発現産物の発現レベルに基づいて、被験者の糖尿病指標値の検出が可能である。糖尿病指標値の検出により、糖尿病の病態(病期)を把握することができ、糖尿病の有無の検出や糖尿病発症リスクの検出、糖尿病予備軍、糖尿病患者への指導、治療等に役立てることができる。
当該31種の遺伝子は、それぞれ単独で糖尿病指標値を検出するための検出マーカーとなり得る。
本発明においては、精度向上の観点から、糖尿病指標値として空腹時血糖値を検出するにあたっては、PIM2、RPTN、EHBP1L1、CTDSP2、EFHD2、WBP1L、SNORA10、CYTH4、NCF1B、FLJ45445、ZFP36L1、HMHA1及びFAM25Bからなる13種の遺伝子群より選択される遺伝子又はその発現産物を、空腹時血糖値を検出するための検出マーカーとして用いることが好ましい。当該13種のうち、好ましくは2種以上、より好ましくは5種以上、更に好ましくは13種全てを用いる。また、当該13種のうち、好ましくはPIM2、RPTN、EHBP1L1、CTDSP2、EFHD2及びWBP1L、より好ましくはPIM2、RPTN及びEHBP1L1から選択される1種以上を用いる。
本発明においては、精度向上の観点から、糖尿病指標値として空腹時血糖値を検出するにあたっては、PIM2、RPTN、EHBP1L1、CTDSP2、EFHD2、WBP1L、SNORA10、CYTH4、NCF1B、FLJ45445、ZFP36L1、HMHA1及びFAM25Bからなる13種の遺伝子群より選択される遺伝子又はその発現産物を、空腹時血糖値を検出するための検出マーカーとして用いることが好ましい。当該13種のうち、好ましくは2種以上、より好ましくは5種以上、更に好ましくは13種全てを用いる。また、当該13種のうち、好ましくはPIM2、RPTN、EHBP1L1、CTDSP2、EFHD2及びWBP1L、より好ましくはPIM2、RPTN及びEHBP1L1から選択される1種以上を用いる。
また、精度向上の観点から、糖尿病指標値として血中HbA1c値を検出するにあたっては、SNORA8、PIM2、GNB2、SNORA21、SNORA38、SNORA10、REXO1L2P、SNORA71D、SNORD17、ARHGAP9、SCARNA16、SNORA16A及びSNORA14Bからなる13種の遺伝子群より選択される遺伝子又はその発現産物を、血中HbA1c値を検出するための検出マーカーとして用いることが好ましい。当該13種のうち、好ましくは2種以上、より好ましくは5種以上、更に好ましくは13種全てを用いる。また、当該13種のうち、好ましくはSNORA8、PIM2、GNB2、SNORA21、SNORA38及びSNORA10、より好ましくはSNORA8、PIM2及びGNB2から選択される1種以上を用いる。
また、精度向上の観点から、糖尿病指標値として血中グリコアルブミン値を検出するにあたっては、SPRR3、SPDYE7P、SNORA38、SNORA9、SNORA81、MYO1F、KRT25、NCF1B、SNORD17及びECE1からなる10種の遺伝子群より選択される遺伝子又はその発現産物を、血中グリコアルブミン値を検出するための検出マーカーとして用いることが好ましい。当該10種のうち、好ましくは2種以上、より好ましくは5種以上、更に好ましくは10種全てを用いる。また、当該10種のうち、好ましくはSPRR3、SPDYE7P、SNORA38、SNORA9及びSNORA81、より好ましくはSPRR3、SPDYE7P及びSNORA38から選択される1種以上を用いる。
上記の糖尿病指標値を検出するための検出マーカーとなり得る遺伝子(以下、「標的遺伝子」とも称す)には、糖尿病指標値を検出するための検出マーカーとなり得る限り、当該遺伝子を構成するDNAの塩基配列と実質的に同一の塩基配列を有する遺伝子も包含される。ここで、実質的に同一の塩基配列とは、例えば、相同性計算アルゴリズムNCBI BLASTを用い、期待値=10;ギャップを許す;フィルタリング=ON;マッチスコア=1;ミスマッチスコア=-3の条件にて検索をした場合、当該遺伝子を構成するDNAの塩基配列と90%以上、好ましくは95%以上、より好ましく98%以上、さらに好ましくは99%以上の同一性があることを意味する。
本発明の糖尿病指標値の検出方法は、被験者から採取された生体試料について、標的遺伝子、一態様として、上記表1に示す31種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む。
本発明における被験者は、例えばヒト又は非ヒト哺乳動物であって、糖尿病指標値の検出を所望するか又は必要とする者が挙げられる。例えば、遺伝的に糖尿病リスクが高いと判断される者、糖尿病と判断される可能性がある者、具体的には空腹時血糖値が126mg/dL以上、血中HbA1c値が6.5%以上若しくは血中グリコアルブミン値が18.3%以上の少なくとも1つを満たす者、又は糖尿病リスクが高いと判断される可能性がある者、具体的には空腹時血糖値が110~126mg/dL未満、血中HbA1c値が5.6~6.5%未満若しくは血中グリコアルブミン値が15.6~18.3%未満の少なくとも1つを満たす者が挙げられる。被験者は、好ましくはヒトである。
本発明において用いられる生体試料としては、非侵襲的に採取可能で、本発明の遺伝子が発現変化する細胞、組織及び生体材料であればよい。具体的には皮膚、尿、唾液、汗、角層、皮膚表上脂質(SSL)、組織浸出液等の体液、その他、便、毛髪等が挙げられ、好ましくは皮膚又は皮膚表上脂質(SSL)、より好ましくは皮膚表上脂質(SSL)が挙げられる。
ここで、「皮膚表上脂質(SSL)」とは、皮膚の表上に存在する脂溶性画分をいい、皮脂と呼ばれることもある。一般に、SSLは、皮膚にある皮脂腺等の外分泌腺から分泌された分泌物を主に含み、皮膚表面を覆う薄い層の形で皮膚表上に存在している。SSLは、皮膚細胞で発現したRNAを含む。(前記特許文献1参照)。また本発明において、「皮膚」とは、特に限定しない限り、角層、表皮、真皮、毛包、ならびに汗腺、皮脂腺及びその他の腺等の組織を含む領域の総称である。
被験者の皮膚からのSSLの採取には、皮膚からのSSLの回収又は除去に用いられているあらゆる手段を採用することができる。好ましくは、後述するSSL吸収性素材、SSL接着性素材、又は皮膚からSSLをこすり落とす器具を使用することができる。SSL吸収性素材又はSSL接着性素材としては、SSLに親和性を有する素材であれば特に限定されず、例えばポリプロピレン、パルプ等が挙げられる。皮膚からのSSLの採取手順のより詳細な例としては、あぶら取り紙、あぶら取りフィルム等のシート状素材へSSLを吸収させる方法、ガラス板、テープ等へSSLを接着させる方法、スパーテル、スクレイパー等によりSSLをこすり落として回収する方法、等が挙げられる。SSLの吸着性を向上させるため、脂溶性の高い溶媒を予め含ませたSSL吸収性素材を用いてもよい。一方、SSL吸収性素材は、水溶性の高い溶媒や水分を含んでいるとSSLの吸着が阻害されるため、水溶性の高い溶媒や水分の含有量が少ないことが好ましい。SSL吸収性素材は、乾燥した状態で用いることが好ましい。
SSLが採取される皮膚の部位としては、特に限定されず、頭、顔、首、体幹、手足等の身体の任意の部位の皮膚が挙げられ、皮脂の分泌が多い部位、例えば顔の皮膚が好ましい。
SSLが採取される皮膚の部位としては、特に限定されず、頭、顔、首、体幹、手足等の身体の任意の部位の皮膚が挙げられ、皮脂の分泌が多い部位、例えば顔の皮膚が好ましい。
被験者から採取されたRNA含有SSLは一定期間保存されてもよい。採取されたSSLは、含有するRNAの分解を極力抑えるために、採取後できるだけ速やかに低温条件で保存することが好ましい。本発明における該RNA含有SSLの保存の温度条件は、0℃以下であればよく、好ましくは-20±20℃~-80±20℃、より好ましくは-20±10℃~-80±10℃、さらに好ましくは-20±20℃~-40±20℃、さらに好ましくは-20±10℃~-40±10℃、さらに好ましくは-20±10℃、さらに好ましくは-20±5℃である。該RNA含有SSLの該低温条件での保存の期間は、特に限定されないが、好ましくは12か月以下、例えば6時間以上12ヶ月以下、より好ましくは6ヶ月以下、例えば1日間以上6ヶ月以下、さらに好ましくは3ヶ月以下、例えば3日間以上3ヶ月以下である。
本発明において、標的遺伝子又はその発現産物の発現レベルの測定対象としては、RNAから人工的に合成されたcDNA、そのRNAをエンコードするDNA、そのRNAにコードされるタンパク質、該タンパク質と相互作用をする分子、そのRNAと相互作用する分子、又はそのDNAと相互作用する分子等が挙げられる。ここで、RNA、DNA又はタンパク質と相互作用する分子としては、DNA、RNA、タンパク質、多糖、オリゴ糖、単糖、脂質、脂肪酸、及びこれらのリン酸化物、アルキル化物、糖付加物等、及び上記いずれかの複合体が挙げられる。また、発現レベルとは、当該遺伝子又は発現産物の発現量や活性を包括的に意味する。
本発明の方法においては、好ましい態様として、生体試料としてSSLが用いられるが、この場合にはSSLに含まれるRNAの発現レベルが解析され、具体的にはRNAを逆転写によりcDNAに変換した後、該cDNA又はその増幅産物が測定される。
SSLからのRNAの抽出には、生体試料からのRNAの抽出又は精製に通常使用される方法、例えば、フェノール/クロロホルム法、AGPC(acid guanidinium thiocyanate-phenol-chloroform extraction)法、又はTRIzol(登録商標)、RNeasy(登録商標)、QIAzol(登録商標)等のカラムを用いた方法、シリカをコーティングした特殊な磁性体粒子を用いる方法、Solid Phase Reversible Immobilization磁性体粒子を用いる方法、ISOGEN等の市販のRNA抽出試薬による抽出等を用いることができる。
SSLからのRNAの抽出には、生体試料からのRNAの抽出又は精製に通常使用される方法、例えば、フェノール/クロロホルム法、AGPC(acid guanidinium thiocyanate-phenol-chloroform extraction)法、又はTRIzol(登録商標)、RNeasy(登録商標)、QIAzol(登録商標)等のカラムを用いた方法、シリカをコーティングした特殊な磁性体粒子を用いる方法、Solid Phase Reversible Immobilization磁性体粒子を用いる方法、ISOGEN等の市販のRNA抽出試薬による抽出等を用いることができる。
該逆転写には、解析したい特定のRNAを標的としたプライマーを用いてもよいが、より包括的な核酸の保存及び解析のためにはランダムプライマーを用いることが好ましい。該逆転写には、一般的な逆転写酵素又は逆転写試薬キットを使用することができる。好適には、正確性及び効率性の高い逆転写酵素又は逆転写試薬キットが用いられ、その例としては、M-MLV Reverse Transcriptase及びその改変体、あるいは市販の逆転写酵素又は逆転写試薬キット、例えばPrimeScript(登録商標)Reverse Transcriptaseシリーズ(タカラバイオ社)、SuperScript(登録商標)Reverse Transcriptaseシリーズ(Thermo Scientific社)等が挙げられる。SuperScript(登録商標)III Reverse Transcriptase、SuperScript(登録商標)VILO cDNA Synthesis kit(いずれもThermo Scientific社)等が好ましく用いられる。
該逆転写における伸長反応は、温度を好ましくは42℃±1℃、より好ましくは42℃±0.5℃、さらに好ましくは42℃±0.25℃に調整し、一方、反応時間を好ましくは60分間以上、より好ましくは80~120分間に調整するのが好ましい。
該逆転写における伸長反応は、温度を好ましくは42℃±1℃、より好ましくは42℃±0.5℃、さらに好ましくは42℃±0.25℃に調整し、一方、反応時間を好ましくは60分間以上、より好ましくは80~120分間に調整するのが好ましい。
発現レベルを測定する方法は、RNA、cDNA又はDNAを対象とする場合、これらにハイブリダイズするDNAをプライマーとしたPCR法、リアルタイムRT-PCR法、マルチプレックスPCR、SmartAmp法、LAMP法等に代表される核酸増幅法、これらにハイブリダイズする核酸をプローブとして用いるハイブリダイゼーション法(DNAチップ、DNAマイクロアレイ、ドットブロットハイブリダイゼーション、スロットブロットハイブリダイゼーション、ノーザンブロットハイブリダイゼーション等)、塩基配列を決定する方法(シーケンシング)、又はこれらを組み合わせた方法から選ぶことができる。
PCRでは、解析したい特定のDNAを標的としたプライマーペアを用いて該特定の1種のDNAのみを増幅してもよいが、複数のプライマーペアを用いて同時に複数の特定のDNAを増幅してもよい。好ましくは、該PCRはマルチプレックスPCRである。マルチプレックスPCRは、PCR反応系に複数のプライマー対を同時に使用することで、複数の遺伝子領域を同時に増幅する方法である。マルチプレックスPCRは、市販のキット(例えば、Ion AmpliSeqTranscriptome Human Gene Expression Kit;ライフテクノロジーズジャパン株式会社等)を用いて実施することができる。
該PCRにおけるアニーリング及び伸長反応の温度は、使用するプライマーに依存するため一概には言えないが、上記のマルチプレックスPCRキットは用いる場合、好ましくは62℃±1℃、より好ましくは62℃±0.5℃、さらに好ましくは62℃±0.25℃である。したがって、該PCRでは、好ましくはアニーリング及び伸長反応が1ステップで行われる。該アニーリング及び伸長反応のステップの時間は、増幅すべきDNAのサイズ等に依存して調整され得るが、好ましくは14~18分間である。該PCRにおける変性反応の条件は、増幅すべきDNAに依存して調整され得るが、好ましくは95~99℃で10~60秒間である。上記のような温度及び時間での逆転写及びPCRは、一般的にPCRに使用されるサーマルサイクラーを用いて実行することができる。
該PCRにおけるアニーリング及び伸長反応の温度は、使用するプライマーに依存するため一概には言えないが、上記のマルチプレックスPCRキットは用いる場合、好ましくは62℃±1℃、より好ましくは62℃±0.5℃、さらに好ましくは62℃±0.25℃である。したがって、該PCRでは、好ましくはアニーリング及び伸長反応が1ステップで行われる。該アニーリング及び伸長反応のステップの時間は、増幅すべきDNAのサイズ等に依存して調整され得るが、好ましくは14~18分間である。該PCRにおける変性反応の条件は、増幅すべきDNAに依存して調整され得るが、好ましくは95~99℃で10~60秒間である。上記のような温度及び時間での逆転写及びPCRは、一般的にPCRに使用されるサーマルサイクラーを用いて実行することができる。
当該PCRで得られた反応産物の精製は、反応産物のサイズ分離によって行われることが好ましい。サイズ分離により、目的のPCR反応産物を、PCR反応液中に含まれるプライマーやその他の不純物から分離することができる。DNAのサイズ分離は、例えば、サイズ分離カラムや、サイズ分離チップ、サイズ分離に利用可能な磁気ビーズ等によって行うことができる。サイズ分離に利用可能な磁気ビーズの好ましい例としては、Ampure XP等のSolid Phase Reversible Immobilization(SPRI)磁性ビーズが挙げられる。
精製したPCR反応産物に対して、その後の定量解析を行うために必要なさらなる処理を施してもよい。例えば、DNAのシーケンシングのために、精製したPCR反応産物を、適切なバッファー溶液へと調製したり、PCR増幅されたDNAに含まれるPCRプライマー領域を切断したり、増幅されたDNAにアダプター配列をさらに付加したりしてもよい。例えば、精製したPCR反応産物をバッファー溶液へと調製し、増幅DNAに対してPCRプライマー配列の除去及びアダプターライゲーションを行い、得られた反応産物を、必要に応じて増幅して、定量解析のためのライブラリーを調製することができる。これらの操作は、例えば、SuperScript(登録商標)VILO cDNA Synthesis kit(ライフテクノロジーズジャパン株式会社)に付属している5×VILO RT Reaction Mix、及びIon AmpliSeq Transcriptome Human Gene Expression Kit(ライフテクノロジーズジャパン株式会社)に付属している5×Ion AmpliSeq HiFi Mix、及びIon AmpliSeq Transcriptome Human Gene Expression Core Panelを用いて、各キット付属のプロトコルに従って行うことができる。
ノーザンブロットハイブリダイゼーション法を利用して標的遺伝子又はそれに由来する核酸の発現量を測定する場合は、例えば、まずプローブDNAを放射性同位元素、蛍光物質等で標識し、次いで、得られた標識DNAを、常法に従ってナイロンメンブレン等にトランスファーした生体試料由来のRNAとハイブリダイズさせる。その後、形成された標識DNAとRNAとの二重鎖を、標識物に由来するシグナルを検出することにより測定する方法が挙げられる。
RT-PCR法を用いて標的遺伝子又はそれに由来する核酸の発現量を測定する場合は、例えば、まず生体試料由来のRNAから常法に従ってcDNAを調製し、これを鋳型として本発明の標的遺伝子が増幅できるように調製した一対のプライマー(上記cDNA(-鎖)に結合する正鎖、+鎖に結合する逆鎖)をこれとハイブリダイズさせる。その後、常法に従ってPCR法を行い、得られた増幅二本鎖DNAを検出する。増幅された二本鎖DNAの検出には、予めRI、蛍光物質等で標識しておいたプライマーを用いて上記PCRを行うことによって産生される標識二本鎖DNAを検出する方法等を用いることができる。
DNAマイクロアレイを用いて標的遺伝子又はそれに由来する核酸の発現量を測定する場合は、例えば、支持体に本発明の標的遺伝子由来の核酸(cDNA又はDNA)の少なくとも1種を固定化したアレイを用い、mRNAから調製した標識化cDNA又はcRNAをマイクロアレイ上に結合させ、マイクロアレイ上の標識を検出することによって、mRNAの発現量を測定することができる。
前記アレイに固定化される核酸としては、ストリンジェントな条件下に特異的(すなわち、実質的に目的の核酸のみに)にハイブリダイズする核酸であればよく、例えば、本発明の標的遺伝子の全配列を有する核酸であってもよく、部分配列からなる核酸であってもよい。ここで、「部分配列」とは、少なくとも15~25塩基からなる核酸が挙げられる。ここでストリンジェントな条件は、通常「1×SSC、0.1%SDS、37℃」程度の洗浄条件を挙げることができ、より厳しいハイブリダイズ条件としては「0.5×SSC、0.1%SDS、42℃」程度、さらに厳しいハイブリダイズ条件としては「0.1×SSC、0.1%SDS、65℃」程度の条件を挙げることができる。ハイブリダイズ条件は、J. Sambrook et al., Molecular Cloning: A Laboratory Manual, Thrd Edition, Cold Spring Harbor Laboratory Press (2001)等に記載されている。
前記アレイに固定化される核酸としては、ストリンジェントな条件下に特異的(すなわち、実質的に目的の核酸のみに)にハイブリダイズする核酸であればよく、例えば、本発明の標的遺伝子の全配列を有する核酸であってもよく、部分配列からなる核酸であってもよい。ここで、「部分配列」とは、少なくとも15~25塩基からなる核酸が挙げられる。ここでストリンジェントな条件は、通常「1×SSC、0.1%SDS、37℃」程度の洗浄条件を挙げることができ、より厳しいハイブリダイズ条件としては「0.5×SSC、0.1%SDS、42℃」程度、さらに厳しいハイブリダイズ条件としては「0.1×SSC、0.1%SDS、65℃」程度の条件を挙げることができる。ハイブリダイズ条件は、J. Sambrook et al., Molecular Cloning: A Laboratory Manual, Thrd Edition, Cold Spring Harbor Laboratory Press (2001)等に記載されている。
シーケンシングによって標的遺伝子又はそれに由来する核酸の発現量を測定する場合は、例えば、次世代シーケンサー(例えばIon S5/XLシステム、ライフテクノロジーズジャパン株式会社)が用いて解析することが挙げられる。シーケンシングで作成されたリードの数(リードカウント)に基づいて、RNA発現を定量することができる。
上記の測定に用いられるプローブ又はプライマー、すなわち、本発明の標的遺伝子又はそれに由来する核酸を特異的に認識し増幅するためのプライマー、又は該RNA又はそれに由来する核酸を特異的に検出するためのプローブがこれに該当するが、これらは、当該標的遺伝子を構成する塩基配列に基づいて設計することができる。ここで「特異的に認識する」とは、例えばノーザンブロット法において、実質的に本発明の標的遺伝子又はそれに由来する核酸のみを検出できること、また例えばRT-PCR法において、実質的に当該核酸のみが増幅される如く、当該検出物又は生成物が当該遺伝子又はそれに由来する核酸であると判断できることを意味する。
具体的には、本発明の標的遺伝子を構成する塩基配列からなるDNA又はその相補鎖に相補的な一定数のヌクレオチドを含むオリゴヌクレオチドを利用することができる。ここで「相補鎖」とは、A:T(RNAの場合はU)、G:Cの塩基対からなる2本鎖DNAの一方の鎖に対する他方の鎖を指す。また、「相補的」とは、当該一定数の連続したヌクレオチド領域で完全に相補配列である場合に限られず、好ましくは80%以上、より好ましくは90%以上、さらに好ましくは95%以上の塩基配列上の同一性を有すればよい。
塩基配列の同一性は、前記BLAST等のアルゴリズムにより決定することができる。
斯かるオリゴヌクレオチドは、プライマーとして用いる場合には、特異的なアニーリング及び鎖伸長ができればよく、通常、例えば10塩基以上、好ましくは15塩基以上、より好ましくは20塩基以上、かつ例えば100塩基以下、好ましくは50塩基以下、より好ましくは35塩基以下の鎖長を有するものが挙げられる。また、プローブとして用いる場合には、特異的なハイブリダイゼーションができればよく、本発明の標的遺伝子を構成する塩基配列からなるDNA(又はその相補鎖)の少なくとも一部若しくは全部の配列を有し、例えば10塩基以上、好ましくは15塩基以上、かつ例えば100塩基以下、好ましくは50塩基以下、より好ましくは25塩基以下の鎖長のものが用いられる。
なお、ここで、「オリゴヌクレオチド」は、DNAあるいはRNAであることができ、合成されたものでも天然のものでもよい。又、ハイブリダイゼーションに用いるプローブは、通常標識したものが用いられる。
具体的には、本発明の標的遺伝子を構成する塩基配列からなるDNA又はその相補鎖に相補的な一定数のヌクレオチドを含むオリゴヌクレオチドを利用することができる。ここで「相補鎖」とは、A:T(RNAの場合はU)、G:Cの塩基対からなる2本鎖DNAの一方の鎖に対する他方の鎖を指す。また、「相補的」とは、当該一定数の連続したヌクレオチド領域で完全に相補配列である場合に限られず、好ましくは80%以上、より好ましくは90%以上、さらに好ましくは95%以上の塩基配列上の同一性を有すればよい。
塩基配列の同一性は、前記BLAST等のアルゴリズムにより決定することができる。
斯かるオリゴヌクレオチドは、プライマーとして用いる場合には、特異的なアニーリング及び鎖伸長ができればよく、通常、例えば10塩基以上、好ましくは15塩基以上、より好ましくは20塩基以上、かつ例えば100塩基以下、好ましくは50塩基以下、より好ましくは35塩基以下の鎖長を有するものが挙げられる。また、プローブとして用いる場合には、特異的なハイブリダイゼーションができればよく、本発明の標的遺伝子を構成する塩基配列からなるDNA(又はその相補鎖)の少なくとも一部若しくは全部の配列を有し、例えば10塩基以上、好ましくは15塩基以上、かつ例えば100塩基以下、好ましくは50塩基以下、より好ましくは25塩基以下の鎖長のものが用いられる。
なお、ここで、「オリゴヌクレオチド」は、DNAあるいはRNAであることができ、合成されたものでも天然のものでもよい。又、ハイブリダイゼーションに用いるプローブは、通常標識したものが用いられる。
また、本発明の標的遺伝子の翻訳産物(タンパク質)、当該タンパク質と相互作用する分子、RNAと相互作用する分子、又はDNAと相互作用する分子を測定する場合は、プロテインチップ解析、免疫測定法(例えば、ELISA等)、質量分析(例えば、LC-MS/MS、MALDI-TOF/MS)、1-ハイブリッド法(PNAS 100, 12271-12276(2003))や2-ハイブリッド法(Biol. Reprod. 58, 302-311 (1998))のような方法を用いることができ、対象に応じて適宜選択できる。
例えば、測定対象としてタンパク質が用いられる場合は、本発明の発現産物を特異的に認識する抗体、具体的には発現産物であるタンパク質を他のタンパク質から識別することが可能な構造的特徴部位(エピトープ)を認識する抗体を生体試料と接触させ、当該抗体に結合した試料中のポリペプチド又はタンパク質を検出し、そのレベルを測定することによって実施される。例えば、ウェスタンブロット法によれば、一次抗体として上記の抗体を用いた後、二次抗体として放射性同位元素、蛍光物質又は酵素等で標識した一次抗体に結合する抗体を用いて、その一次抗体を標識し、これら標識物質由来のシグナルを放射線測定器、蛍光検出器等で測定することが行われる。
尚、上記翻訳産物に対する抗体は、ポリクローナル抗体であっても、モノクローナル抗体であってもよい。これらの抗体は、公知の方法に従って製造することができる。具体的には、ポリクローナル抗体は、常法に従って大腸菌等で発現し精製したタンパク質を用いて、あるいは常法に従って当該タンパク質の部分ポリペプチドを合成して、家兎等の非ヒト動物に免疫し、該免疫動物の血清から常法に従って得ることが可能である。
一方、モノクローナル抗体は、常法に従って大腸菌等で発現し精製したタンパク質又は該タンパク質の部分ポリペプチドをマウス等の非ヒト動物に免疫し、得られた脾臓細胞と骨髄腫細胞とを細胞融合させて調製したハイブリドーマ細胞から得ることができる。また、モノクローナル抗体は、ファージディスプレイを用いて作製してもよい(Griffiths, A.D.; Duncan, A.R., Current Opinion in Biotechnology, Volume 9, Number 1, February 1998 , pp. 102-108(7))。
例えば、測定対象としてタンパク質が用いられる場合は、本発明の発現産物を特異的に認識する抗体、具体的には発現産物であるタンパク質を他のタンパク質から識別することが可能な構造的特徴部位(エピトープ)を認識する抗体を生体試料と接触させ、当該抗体に結合した試料中のポリペプチド又はタンパク質を検出し、そのレベルを測定することによって実施される。例えば、ウェスタンブロット法によれば、一次抗体として上記の抗体を用いた後、二次抗体として放射性同位元素、蛍光物質又は酵素等で標識した一次抗体に結合する抗体を用いて、その一次抗体を標識し、これら標識物質由来のシグナルを放射線測定器、蛍光検出器等で測定することが行われる。
尚、上記翻訳産物に対する抗体は、ポリクローナル抗体であっても、モノクローナル抗体であってもよい。これらの抗体は、公知の方法に従って製造することができる。具体的には、ポリクローナル抗体は、常法に従って大腸菌等で発現し精製したタンパク質を用いて、あるいは常法に従って当該タンパク質の部分ポリペプチドを合成して、家兎等の非ヒト動物に免疫し、該免疫動物の血清から常法に従って得ることが可能である。
一方、モノクローナル抗体は、常法に従って大腸菌等で発現し精製したタンパク質又は該タンパク質の部分ポリペプチドをマウス等の非ヒト動物に免疫し、得られた脾臓細胞と骨髄腫細胞とを細胞融合させて調製したハイブリドーマ細胞から得ることができる。また、モノクローナル抗体は、ファージディスプレイを用いて作製してもよい(Griffiths, A.D.; Duncan, A.R., Current Opinion in Biotechnology, Volume 9, Number 1, February 1998 , pp. 102-108(7))。
斯くして、被験者から採取された生体試料中の本発明の標的遺伝子又はその発現産物の発現レベルが測定され、当該発現レベルに基づいて当該被験者の糖尿病指標値が検出される。
具体的には、予め十分な母数を有する任意の集団における本発明の標的遺伝子又はその発現産物の発現レベルを説明変数とし、該集団から得た糖尿病指標値を目的変数とする機械学習を行うことにより、該発現レベルから該糖尿病指標値を予測するための最適な予測モデルを構築する。次いで、構築された予測モデルに基づいて、糖尿病指標値を検出する対象である被験者における該標的遺伝子又はその発現産物の発現レベルから、該被験者の糖尿病指標値の予測値を算出することができる。
予測モデルの構築に用いられる集団としては、対象となる被験者の属性(性別、人種、年代等)が一致した集団であることが好ましい。
発現レベルとしては、上記したように、発現量のデータであるリードカウント値、当該リードカウント値をサンプル間の総リード数の違いを補正したRPM値、当該RPM値を底2の対数値に変換した値(Log2RPM値)又は整数1を加算した底2の対数値(log2(RPM+1)値)、あるいはDESeq2(Love MI et al. Genome Biol. 2014)を用いて補正されたカウント値(Normalized count値)又は整数1を加算した底2の対数値(log2(Normalized count+1)値)を指標として用いるのが好ましい。また、RNA-seqの定量値として一般的な、fragments per kilobase of exon per million reads mapped (FPKM)、reads per kilobase of exon per million reads mapped (RPKM)、transcripts per million (TPM)等によって算出される値であってもよい。また、マイクロアレイ法によって得られるシグナル値、及びその補正値であってもよい。また、RT-PCR等により特定の標的遺伝子のみの解析を行う場合には、対象遺伝子の発現量をハウスキーピング遺伝子の発現量を基準とする相対的な発現量に変換して解析する方法、又は標的遺伝子の領域を含むプラスミドを用いて絶対的なコピー数を定量(絶対定量)して解析する方法が好ましい。デジタルPCR法によって得られるコピー数であってもよい。
一方、糖尿病指標値としては、例えば実測値に整数1を加算した自然対数値(ln(測定値+1)値)を用いることができる。
また精度向上の観点から、予測モデルの構築において本発明の標的遺伝子又はその発現産物の発現レベルに加えて、年齢情報を説明変数に加えても良い。
具体的には、予め十分な母数を有する任意の集団における本発明の標的遺伝子又はその発現産物の発現レベルを説明変数とし、該集団から得た糖尿病指標値を目的変数とする機械学習を行うことにより、該発現レベルから該糖尿病指標値を予測するための最適な予測モデルを構築する。次いで、構築された予測モデルに基づいて、糖尿病指標値を検出する対象である被験者における該標的遺伝子又はその発現産物の発現レベルから、該被験者の糖尿病指標値の予測値を算出することができる。
予測モデルの構築に用いられる集団としては、対象となる被験者の属性(性別、人種、年代等)が一致した集団であることが好ましい。
発現レベルとしては、上記したように、発現量のデータであるリードカウント値、当該リードカウント値をサンプル間の総リード数の違いを補正したRPM値、当該RPM値を底2の対数値に変換した値(Log2RPM値)又は整数1を加算した底2の対数値(log2(RPM+1)値)、あるいはDESeq2(Love MI et al. Genome Biol. 2014)を用いて補正されたカウント値(Normalized count値)又は整数1を加算した底2の対数値(log2(Normalized count+1)値)を指標として用いるのが好ましい。また、RNA-seqの定量値として一般的な、fragments per kilobase of exon per million reads mapped (FPKM)、reads per kilobase of exon per million reads mapped (RPKM)、transcripts per million (TPM)等によって算出される値であってもよい。また、マイクロアレイ法によって得られるシグナル値、及びその補正値であってもよい。また、RT-PCR等により特定の標的遺伝子のみの解析を行う場合には、対象遺伝子の発現量をハウスキーピング遺伝子の発現量を基準とする相対的な発現量に変換して解析する方法、又は標的遺伝子の領域を含むプラスミドを用いて絶対的なコピー数を定量(絶対定量)して解析する方法が好ましい。デジタルPCR法によって得られるコピー数であってもよい。
一方、糖尿病指標値としては、例えば実測値に整数1を加算した自然対数値(ln(測定値+1)値)を用いることができる。
また精度向上の観点から、予測モデルの構築において本発明の標的遺伝子又はその発現産物の発現レベルに加えて、年齢情報を説明変数に加えても良い。
予測モデルの構築に用いるアルゴリズムとしては、機械学習に用いるアルゴリズム等の公知のものを利用することができる。機械学習アルゴリズムの例としては、ランダムフォレスト(Random forest)、線形カーネルのサポートベクターマシン(SVM linear)、rbfカーネルのサポートベクターマシン(SVM rbf)、ニューラルネットワーク(Nerural net)、一般線形モデル(Generalized linear model)、正則化線形判別分析(Regularized linear discriminant analysis)、正則化ロジスティック回帰(Regularized logistic regression)、ラッソ(Least Absolute Shrinkage and Selection Operator)回帰等が挙げられる。構築した予測モデルに検証用のデータを入力して予測値を算出し、当該予測値が実測値と最も適合するモデル、例えば正解率(Accuracy)が最も大きいモデルを最適な予測モデルとして選抜することができる。また、予測値と実測値から検出率(Recall)、精度(Precision)、及びそれらの調和平均であるF値を計算し、そのF値が最も大きいモデルを最適な予測モデルとして選抜することができる。また、予測値と実測値の二乗平均平方根誤差(RMSE)を予測モデルの精度評価指標として用い、そのRMSEの最も小さいモデルを最適な予測モデルとして選抜することができる。
また本発明では、標的遺伝子又はその発現産物の発現レベルを、予め設定した基準値と比較することによって、被験者の糖尿病の有無の検出や糖尿病発症リスクの検出等を行うことができる。具体的には、標的遺伝子又はその発現産物の発現レベルを、予め設定した基準値と比較することによって行われる。
ここで、「基準値」は、糖尿病指標値と、本発明の標的遺伝子又はその発現産物の発現レベルの関係に基づき、予め決定することができる。例えば、ある集団を、糖尿病指標値、例えば、空腹時血糖値、血中HbA1c値又は血中グリコアルブミン値に基づいて糖尿病型(空腹時血糖値:126mg/dL以上、血中HbA1c値:6.5%以上、血中グリコアルブミン値:18.3%以上)、境界型(空腹時血糖値:110~126mg/dL未満、血中HbA1c値:5.6~6.5%未満、血中グリコアルブミン値:15.6~18.3%未満)、正常型(空腹時血糖値:110mg/dL未満、血中HbA1c値:5.6%未満、血中グリコアルブミン値:15.6%未満)の群に分ける。そして、それぞれの群における当該標的遺伝子又はその発現産物の発現レベルの平均値や標準偏差等の統計値を参考に決定した値を、それぞれの群への属否を判別する基準値として決定することができる。
標的遺伝子として複数種の遺伝子を用いる場合は、それぞれ各々の遺伝子又はその発現産物について基準値を求めることが好ましい。
集団としては、対象となる被験者の属性(性別、人種、年代等)が一致した集団であることが好ましい。
標的遺伝子として複数種の遺伝子を用いる場合は、それぞれ各々の遺伝子又はその発現産物について基準値を求めることが好ましい。
集団としては、対象となる被験者の属性(性別、人種、年代等)が一致した集団であることが好ましい。
基準値の決定方法は特に制限されず、公知の手法に従って決定することができる。例えば、判別式(予測モデル)を使用して作成されたROC(Receiver Operating Characteristic Curve)曲線より求めることができる。ROC曲線では、縦軸に陽性患者において陽性の結果がでる確率(感度)と、横軸に陰性患者において陰性の結果がでる確率(特異度)を1から減算した値(偽陽性率)がプロットされる。ROC曲線に示される「真陽性(感度)」及び「偽陽性(1-特異度)」に関し、「真陽性(感度)」-「偽陽性(1-特異度)」が最大となる値(Youden index)を基準値とすることができる。
本発明の糖尿病指標値を検出するための検査用キットは、患者から分離した生体試料における本発明の標的遺伝子又はその発現産物の発現レベルを測定するための検査試薬を含有するものである。具体的には、本発明の標的遺伝子又はそれに由来する核酸と特異的に結合(ハイブリダイズ)するオリゴヌクレオチド(例えば、PCR用のプライマー)を含む、核酸増幅、ハイブリダイゼーションのための試薬、或いは、本発明の標的遺伝子の発現産物(タンパク質)を認識する抗体を含む免疫学的測定のための試薬等が挙げられる。当該キットに包含されるオリゴヌクレオチド、抗体等は、上述したとおり公知の方法により得ることができる。
また、当該検査用キットには、上記抗体や核酸の他、標識試薬、緩衝液、発色基質、二次抗体、ブロッキング剤や、試験に必要な器具やポジティブコントロールやネガティブコントロールとして使用するコントロール試薬、生体試料を採取するための用具(例えば、SSLを採取するためのあぶら取りフィルム等)等を含むことができる。
また、当該検査用キットには、上記抗体や核酸の他、標識試薬、緩衝液、発色基質、二次抗体、ブロッキング剤や、試験に必要な器具やポジティブコントロールやネガティブコントロールとして使用するコントロール試薬、生体試料を採取するための用具(例えば、SSLを採取するためのあぶら取りフィルム等)等を含むことができる。
上述した実施形態に関し、本発明は以下の態様をさらに開示する。
<1>被験者から採取された生体試料について、上記表1に示す31種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む、当該被験者の糖尿病指標値の検出方法。
<2>前記遺伝子が、PIM2、RPTN、EHBP1L1、CTDSP2、EFHD2、WBP1L、SNORA10、CYTH4、NCF1B、FLJ45445、ZFP36L1、HMHA1及びFAM25Bからなる13種の遺伝子群より選択される遺伝子であり、前記糖尿病指標値が空腹時血糖値である<1>記載の検出方法。
<3>前記13種のうち、好ましくは2種以上、より好ましくは5種以上、更に好ましくは13種全ての遺伝子又はその発現産物の発現レベルが測定される<2>記載の検出方法。
<4>前記13種のうち、好ましくはPIM2、RPTN、EHBP1L1、CTDSP2、EFHD2及びWBP1L、より好ましくはPIM2、RPTN及びEHBP1L1から選択される1種以上の遺伝子又はその発現産物の発現レベルが測定される<2>記載の検出方法。
<5>前記遺伝子が、SNORA8、PIM2、GNB2、SNORA21、SNORA38、SNORA10、REXO1L2P、SNORA71D、SNORD17、ARHGAP9、SCARNA16、SNORA16A及びSNORA14Bからなる13種の遺伝子群より選択される遺伝子であり、前記糖尿病指標値が血中HbA1c値である<1>記載の検出方法。
<6>前記13種のうち、好ましくは2種以上、より好ましくは5種以上、更に好ましくは13種全ての遺伝子又はその発現産物の発現レベルが測定される<5>記載の検出方法。
<7>前記13種のうち、好ましくはSNORA8、PIM2、GNB2、SNORA21、SNORA38及びSNORA10、より好ましくはSNORA8、PIM2及びGNB2から選択される1種以上の遺伝子又はその発現産物の発現レベルが測定される<5>記載の検出方法。
<8>前記遺伝子が、SPRR3、SPDYE7P、SNORA38、SNORA9、SNORA81、MYO1F、KRT25、NCF1B、SNORD17及びECE1からなる10種の遺伝子群より選択される遺伝子であり、前記糖尿病指標値が血中グリコアルブミン値である<1>記載の検出方法。
<9>前記10種のうち、好ましくは2種以上、より好ましくは5種以上、更に好ましくは10種全ての遺伝子又はその発現産物の発現レベルが測定される<8>記載の検出方法。
<10>前記10種のうち、好ましくはSPRR3、SPDYE7P、SNORA38、SNORA9及びSNORA81、より好ましくはSPRR3、SPDYE7P及びSNORA38から選択される1種以上の遺伝子又はその発現産物の発現レベルが測定される<8>記載の検出方法。
<11>前記遺伝子又はその発現産物の発現レベルの測定対象が、好ましくはRNAから人工的に合成されたcDNA、そのRNAをエンコードするDNA、そのRNAにコードされるタンパク質、該タンパク質と相互作用をする分子、そのRNAと相互作用する分子、又はそのDNAと相互作用する分子である<1>~<10>のいずれかに記載の検出方法。
<12>前記遺伝子又はその発現産物の発現レベルが、好ましくはmRNAの発現量である<1>~<11>のいずれかに記載の検出方法。
<13>前記生体試料が、被験者の好ましくは皮膚、尿、唾液、汗、角層、皮膚表上脂質(SSL)、組織浸出液等の体液、便又は毛髪であり、より好ましくは皮膚又は皮膚表上脂質(SSL)であり、更に好ましくは皮膚表上脂質(SSL)である<1>~<12>のいずれかに記載の検出方法。
<14>前記遺伝子又はその発現産物の発現レベルに基づいて前記被験者の糖尿病指標値を検出することを含む<1>~<13>のいずれかに記載の検出方法。
<15>好ましくは、前記遺伝子又はその発現産物の発現レベルに基づく予測モデルを用いて糖尿病指標値を検出することを含み、
前記予測モデルが、前記遺伝子又はその発現産物の発現レベルの測定値、又は当該発現レベルの測定値及び被験者の年齢を説明変数とし、糖尿病指標値を目的変数として構築される<1>~<14>のいずれかに記載の検出方法。
<16>前記遺伝子又はそれに由来する核酸と特異的にハイブリダイズするオリゴヌクレオチド、又は前記遺伝子の発現産物を認識する抗体を含有する、<1>~<15>のいずれかに記載の検出方法に用いられる糖尿病指標値を検出するための検査用キット。
<17>前記表1に示す31種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物からなる、糖尿病指標値を検出するための検出マーカー。
<18>前記遺伝子が、PIM2、RPTN、EHBP1L1、CTDSP2、EFHD2、WBP1L、SNORA10、CYTH4、NCF1B、FLJ45445、ZFP36L1、HMHA1及びFAM25Bからなる13種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物であって、糖尿病指標値が空腹時血糖値である、<17>記載の検出マーカー。
<19>前記遺伝子が、SNORA8、PIM2、GNB2、SNORA21、SNORA38、SNORA10、REXO1L2P、SNORA71D、SNORD17、ARHGAP9、SCARNA16、SNORA16A及びSNORA14Bからなる13種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物であって、糖尿病指標値が血中HbA1c値である、<17>記載の検出マーカー。
<20>前記遺伝子が、SPRR3、SPDYE7P、SNORA38、SNORA9、SNORA81、MYO1F、KRT25、NCF1B、SNORD17及びECE1からなる10種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物であって、糖尿病指標値が血中グリコアルブミン値である、<17>記載の検出マーカー。
<3>前記13種のうち、好ましくは2種以上、より好ましくは5種以上、更に好ましくは13種全ての遺伝子又はその発現産物の発現レベルが測定される<2>記載の検出方法。
<4>前記13種のうち、好ましくはPIM2、RPTN、EHBP1L1、CTDSP2、EFHD2及びWBP1L、より好ましくはPIM2、RPTN及びEHBP1L1から選択される1種以上の遺伝子又はその発現産物の発現レベルが測定される<2>記載の検出方法。
<5>前記遺伝子が、SNORA8、PIM2、GNB2、SNORA21、SNORA38、SNORA10、REXO1L2P、SNORA71D、SNORD17、ARHGAP9、SCARNA16、SNORA16A及びSNORA14Bからなる13種の遺伝子群より選択される遺伝子であり、前記糖尿病指標値が血中HbA1c値である<1>記載の検出方法。
<6>前記13種のうち、好ましくは2種以上、より好ましくは5種以上、更に好ましくは13種全ての遺伝子又はその発現産物の発現レベルが測定される<5>記載の検出方法。
<7>前記13種のうち、好ましくはSNORA8、PIM2、GNB2、SNORA21、SNORA38及びSNORA10、より好ましくはSNORA8、PIM2及びGNB2から選択される1種以上の遺伝子又はその発現産物の発現レベルが測定される<5>記載の検出方法。
<8>前記遺伝子が、SPRR3、SPDYE7P、SNORA38、SNORA9、SNORA81、MYO1F、KRT25、NCF1B、SNORD17及びECE1からなる10種の遺伝子群より選択される遺伝子であり、前記糖尿病指標値が血中グリコアルブミン値である<1>記載の検出方法。
<9>前記10種のうち、好ましくは2種以上、より好ましくは5種以上、更に好ましくは10種全ての遺伝子又はその発現産物の発現レベルが測定される<8>記載の検出方法。
<10>前記10種のうち、好ましくはSPRR3、SPDYE7P、SNORA38、SNORA9及びSNORA81、より好ましくはSPRR3、SPDYE7P及びSNORA38から選択される1種以上の遺伝子又はその発現産物の発現レベルが測定される<8>記載の検出方法。
<11>前記遺伝子又はその発現産物の発現レベルの測定対象が、好ましくはRNAから人工的に合成されたcDNA、そのRNAをエンコードするDNA、そのRNAにコードされるタンパク質、該タンパク質と相互作用をする分子、そのRNAと相互作用する分子、又はそのDNAと相互作用する分子である<1>~<10>のいずれかに記載の検出方法。
<12>前記遺伝子又はその発現産物の発現レベルが、好ましくはmRNAの発現量である<1>~<11>のいずれかに記載の検出方法。
<13>前記生体試料が、被験者の好ましくは皮膚、尿、唾液、汗、角層、皮膚表上脂質(SSL)、組織浸出液等の体液、便又は毛髪であり、より好ましくは皮膚又は皮膚表上脂質(SSL)であり、更に好ましくは皮膚表上脂質(SSL)である<1>~<12>のいずれかに記載の検出方法。
<14>前記遺伝子又はその発現産物の発現レベルに基づいて前記被験者の糖尿病指標値を検出することを含む<1>~<13>のいずれかに記載の検出方法。
<15>好ましくは、前記遺伝子又はその発現産物の発現レベルに基づく予測モデルを用いて糖尿病指標値を検出することを含み、
前記予測モデルが、前記遺伝子又はその発現産物の発現レベルの測定値、又は当該発現レベルの測定値及び被験者の年齢を説明変数とし、糖尿病指標値を目的変数として構築される<1>~<14>のいずれかに記載の検出方法。
<16>前記遺伝子又はそれに由来する核酸と特異的にハイブリダイズするオリゴヌクレオチド、又は前記遺伝子の発現産物を認識する抗体を含有する、<1>~<15>のいずれかに記載の検出方法に用いられる糖尿病指標値を検出するための検査用キット。
<17>前記表1に示す31種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物からなる、糖尿病指標値を検出するための検出マーカー。
<18>前記遺伝子が、PIM2、RPTN、EHBP1L1、CTDSP2、EFHD2、WBP1L、SNORA10、CYTH4、NCF1B、FLJ45445、ZFP36L1、HMHA1及びFAM25Bからなる13種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物であって、糖尿病指標値が空腹時血糖値である、<17>記載の検出マーカー。
<19>前記遺伝子が、SNORA8、PIM2、GNB2、SNORA21、SNORA38、SNORA10、REXO1L2P、SNORA71D、SNORD17、ARHGAP9、SCARNA16、SNORA16A及びSNORA14Bからなる13種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物であって、糖尿病指標値が血中HbA1c値である、<17>記載の検出マーカー。
<20>前記遺伝子が、SPRR3、SPDYE7P、SNORA38、SNORA9、SNORA81、MYO1F、KRT25、NCF1B、SNORD17及びECE1からなる10種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物であって、糖尿病指標値が血中グリコアルブミン値である、<17>記載の検出マーカー。
実施例1 SSLから抽出されたRNAを用いた糖尿病指標値の検出(1)
1)被験者及び空腹時血糖値の測定
20~80歳代女性376名を被験者として試験を行った。被験者は試験会場に来る当日の朝食摂取を禁止とし、来場後、医師の監督のもと看護師が定法に従って血液を採取した。本血液を用いて、空腹時血糖値を測定した。その結果、この集団の空腹時血糖値の平均値±標準偏差は93.7±15.4mg/dL、中央値は91mg/dLであった。
1)被験者及び空腹時血糖値の測定
20~80歳代女性376名を被験者として試験を行った。被験者は試験会場に来る当日の朝食摂取を禁止とし、来場後、医師の監督のもと看護師が定法に従って血液を採取した。本血液を用いて、空腹時血糖値を測定した。その結果、この集団の空腹時血糖値の平均値±標準偏差は93.7±15.4mg/dL、中央値は91mg/dLであった。
2)SSL採取
各被験者の全顔からあぶら取りフィルム(5×8cm、ポリプロピレン製、3M社)を用いて皮脂を回収後、該あぶら取りフィルムをバイアルに移し、RNA抽出に使用するまで-80℃にて保存した。
各被験者の全顔からあぶら取りフィルム(5×8cm、ポリプロピレン製、3M社)を用いて皮脂を回収後、該あぶら取りフィルムをバイアルに移し、RNA抽出に使用するまで-80℃にて保存した。
3)RNA調製及びシーケンシング
上記2)のあぶら取りフィルムを適当な大きさに切断し、QIAzol Lysis Reagent(Qiagen)を用いて、付属のプロトコルに準じてRNAを抽出した。抽出されたRNAを元に、SuperScript VILO cDNA Synthesis kit(ライフテクノロジーズジャパン株式会社)を用いて42℃、90分間逆転写を行いcDNAの合成を行った。逆転写反応のプライマーには、キットに付属しているランダムプライマーを使用した。得られたcDNAから、マルチプレックスPCRにより20802遺伝子に由来するDNAを含むライブラリーを調製した。マルチプレックスPCRは、Ion AmpliSeqTranscriptome Human Gene Expression Kit(ライフテクノロジーズジャパン株式会社)を用いて、[99℃、2分→(99℃、15秒→62℃、16分)×20サイクル→4℃、Hold]の条件で行った。得られたPCR産物は、Ampure XP(ベックマン・コールター株式会社)で精製した後に、バッファーの再構成、プライマー配列の消化、アダプターライゲーションと精製、増幅を行い、ライブラリーを調製した。調製したライブラリーをIon 540 Chipにローディングし、Ion S5/XLシステム(ライフテクノロジーズジャパン株式会社)を用いてシーケンシングした。
上記2)のあぶら取りフィルムを適当な大きさに切断し、QIAzol Lysis Reagent(Qiagen)を用いて、付属のプロトコルに準じてRNAを抽出した。抽出されたRNAを元に、SuperScript VILO cDNA Synthesis kit(ライフテクノロジーズジャパン株式会社)を用いて42℃、90分間逆転写を行いcDNAの合成を行った。逆転写反応のプライマーには、キットに付属しているランダムプライマーを使用した。得られたcDNAから、マルチプレックスPCRにより20802遺伝子に由来するDNAを含むライブラリーを調製した。マルチプレックスPCRは、Ion AmpliSeqTranscriptome Human Gene Expression Kit(ライフテクノロジーズジャパン株式会社)を用いて、[99℃、2分→(99℃、15秒→62℃、16分)×20サイクル→4℃、Hold]の条件で行った。得られたPCR産物は、Ampure XP(ベックマン・コールター株式会社)で精製した後に、バッファーの再構成、プライマー配列の消化、アダプターライゲーションと精製、増幅を行い、ライブラリーを調製した。調製したライブラリーをIon 540 Chipにローディングし、Ion S5/XLシステム(ライフテクノロジーズジャパン株式会社)を用いてシーケンシングした。
4)データ解析
(1)使用データ
上記3)で測定したSSL由来RNAの発現量のデータ(リードカウント値)を取得し、サンプル被験者間の総リード数の違いを補正したRPM値に変換した。機械学習モデルの構築には、負の二項分布に従うRPM値を正規分布に近似するため、RPM値に整数1を加算した底2の対数値(log2(RPM+1)値)を用いた。なお、全サンプル被験者の発現量データのうち90%以上のサンプル被験者で欠損値ではない発現量データが得られている2227遺伝子のみ以下の解析に使用した。
また、空腹時血糖値を正規分布に近似するため、上記の測定値に整数1を加算した自然対数値(ln(測定値+1)値)を用いた。
(1)使用データ
上記3)で測定したSSL由来RNAの発現量のデータ(リードカウント値)を取得し、サンプル被験者間の総リード数の違いを補正したRPM値に変換した。機械学習モデルの構築には、負の二項分布に従うRPM値を正規分布に近似するため、RPM値に整数1を加算した底2の対数値(log2(RPM+1)値)を用いた。なお、全サンプル被験者の発現量データのうち90%以上のサンプル被験者で欠損値ではない発現量データが得られている2227遺伝子のみ以下の解析に使用した。
また、空腹時血糖値を正規分布に近似するため、上記の測定値に整数1を加算した自然対数値(ln(測定値+1)値)を用いた。
(2)データセット分割
被験者376名のデータセットのうち、304名のRNAプロファイルデータをモデル構築の訓練データとし、残り72名分のRNAプロファイルデータをモデル精度評価に使用するテストデータとした。
被験者376名のデータセットのうち、304名のRNAプロファイルデータをモデル構築の訓練データとし、残り72名分のRNAプロファイルデータをモデル精度評価に使用するテストデータとした。
(3)特徴量遺伝子の選択
304名分の空腹時血糖値(ln(測定値+1)値)と、全ての遺伝子RNA発現データ(log2(RPM+1)値)の組み合わせについてスピアマンの順位相関係数を求めた。
その結果、スピアマンの順位相関係数(ρ)の大きな遺伝子を抽出し、表2に示す13遺伝子を選択した。これら13遺伝子はいずれもこれまで空腹時血糖値との関連が報告されていない遺伝子である。
304名分の空腹時血糖値(ln(測定値+1)値)と、全ての遺伝子RNA発現データ(log2(RPM+1)値)の組み合わせについてスピアマンの順位相関係数を求めた。
その結果、スピアマンの順位相関係数(ρ)の大きな遺伝子を抽出し、表2に示す13遺伝子を選択した。これら13遺伝子はいずれもこれまで空腹時血糖値との関連が報告されていない遺伝子である。
(4)モデル構築
(a)特徴量遺伝子による予測
訓練データである、SSL由来RNAから選択された前記特徴量遺伝子の発現量のデータ(log2(RPM+1)値)を説明変数とし、空腹時血糖値(ln(測定値+1)値)を目的変数として用い、予測モデルの構築を実施した。予測モデルは、一般線形モデル(Generalized linear model)、ニューラルネットワーク(Nerural net)、ラッソ回帰(Lasso)、ランダムフォレスト(Random forest)、線形カーネルのサポートベクターマシン(SVM linear)、rbfカーネルのサポートベクターマシン(SVM rbf)の6種のアルゴリズムを用いて、10分割交差検証を行って学習させた。各アルゴリズムについて、学習後のモデルに訓練データを入力し、二乗平均平方根誤差(RMSE)を求め、RMSEの最も小さいモデルを採用した。
前記選択したモデルに、テストデータの特徴量遺伝子発現量(log2(RPM+1)値)を入力して、空腹時血糖値(ln(測定値+1)値)の予測値を計算した。最後に、予測値と実測値からスピアマンの順位相関係数を求めた。
(a)特徴量遺伝子による予測
訓練データである、SSL由来RNAから選択された前記特徴量遺伝子の発現量のデータ(log2(RPM+1)値)を説明変数とし、空腹時血糖値(ln(測定値+1)値)を目的変数として用い、予測モデルの構築を実施した。予測モデルは、一般線形モデル(Generalized linear model)、ニューラルネットワーク(Nerural net)、ラッソ回帰(Lasso)、ランダムフォレスト(Random forest)、線形カーネルのサポートベクターマシン(SVM linear)、rbfカーネルのサポートベクターマシン(SVM rbf)の6種のアルゴリズムを用いて、10分割交差検証を行って学習させた。各アルゴリズムについて、学習後のモデルに訓練データを入力し、二乗平均平方根誤差(RMSE)を求め、RMSEの最も小さいモデルを採用した。
前記選択したモデルに、テストデータの特徴量遺伝子発現量(log2(RPM+1)値)を入力して、空腹時血糖値(ln(測定値+1)値)の予測値を計算した。最後に、予測値と実測値からスピアマンの順位相関係数を求めた。
(b)特徴量遺伝子+年齢による予測
訓練データである、SSL由来RNAから選択された前記特徴量遺伝子の発現量のデータ(log2(RPM+1)値)及び被験者年齢を説明変数とし、空腹時血糖値(ln(測定値+1)値)を目的変数として用い、予測モデルの構築を実施した。その後は上記(a)と同様の方法で予測モデルの構築を行い、最後に、予測値と実測値からスピアマンの順位相関係数を求めた。
訓練データである、SSL由来RNAから選択された前記特徴量遺伝子の発現量のデータ(log2(RPM+1)値)及び被験者年齢を説明変数とし、空腹時血糖値(ln(測定値+1)値)を目的変数として用い、予測モデルの構築を実施した。その後は上記(a)と同様の方法で予測モデルの構築を行い、最後に、予測値と実測値からスピアマンの順位相関係数を求めた。
5)結果
特徴量遺伝子13種を用いた予測モデル(ランダムフォレスト)において、テストデータで順位相関係数は0.418(p<0.001)となり、空腹時血糖値の予測が可能であることが示された。特徴量遺伝子13種及び年齢を用いた予測モデル(ラッソ回帰)場合には、0.607(p<0.001)となり予測精度の向上が認められた。
特徴量遺伝子13種を用いた予測モデル(ランダムフォレスト)において、テストデータで順位相関係数は0.418(p<0.001)となり、空腹時血糖値の予測が可能であることが示された。特徴量遺伝子13種及び年齢を用いた予測モデル(ラッソ回帰)場合には、0.607(p<0.001)となり予測精度の向上が認められた。
実施例2 SSLから抽出されたRNAを用いた糖尿病指標値の検出(2)
1)被験者及び血中HbA1c値の測定
被験者は実施例1と同一で、実施例1で採取した血液を用いて、血中HbA1c値を測定した。その結果、この集団の血中HbA1c値の平均値±標準偏差は5.7±0.5%、中央値は5.6%であった。
1)被験者及び血中HbA1c値の測定
被験者は実施例1と同一で、実施例1で採取した血液を用いて、血中HbA1c値を測定した。その結果、この集団の血中HbA1c値の平均値±標準偏差は5.7±0.5%、中央値は5.6%であった。
2)SSL採取、3)RNA調製及びシーケンシング
実施例1と同様に実施した。
実施例1と同様に実施した。
4)データ解析
(1)使用データ
上記3)で測定したSSL由来RNAの発現量のデータ(リードカウント値)を取得し、サンプル被験者間の総リード数の違いを補正したRPM値に変換した。機械学習モデルの構築には、負の二項分布に従うRPM値を正規分布に近似するため、RPM値に整数1を加算した底2の対数値(log2(RPM+1)値)を用いた。なお、全サンプル被験者の発現量データのうち90%以上のサンプル被験者で欠損値ではない発現量データが得られている2227遺伝子のみ以下の解析に使用した。
また、血中HbA1c値を正規分布に近似するため、上記の測定値に整数1を加算した自然対数値(ln(測定値+1)値)を用いた。
(1)使用データ
上記3)で測定したSSL由来RNAの発現量のデータ(リードカウント値)を取得し、サンプル被験者間の総リード数の違いを補正したRPM値に変換した。機械学習モデルの構築には、負の二項分布に従うRPM値を正規分布に近似するため、RPM値に整数1を加算した底2の対数値(log2(RPM+1)値)を用いた。なお、全サンプル被験者の発現量データのうち90%以上のサンプル被験者で欠損値ではない発現量データが得られている2227遺伝子のみ以下の解析に使用した。
また、血中HbA1c値を正規分布に近似するため、上記の測定値に整数1を加算した自然対数値(ln(測定値+1)値)を用いた。
(2)データセット分割
被験者376名のデータセットのうち、304名のRNAプロファイルデータをモデル構築の訓練データとし、残り72名分のRNAプロファイルデータをモデル精度評価に使用するテストデータとした。
被験者376名のデータセットのうち、304名のRNAプロファイルデータをモデル構築の訓練データとし、残り72名分のRNAプロファイルデータをモデル精度評価に使用するテストデータとした。
(3)特徴量遺伝子の選択
304名分の血中HbA1c値(ln(測定値+1)値)と、全ての遺伝子RNA発現データ(log2(RPM+1)値)の組み合わせについてスピアマンの順位相関係数を求めた。
その結果、スピアマンの順位相関係数(ρ)の大きな遺伝子を抽出し、表3に示す13遺伝子を選択した。これら13遺伝子はいずれもこれまで血中HbA1c値との関連が報告されていない遺伝子である。
304名分の血中HbA1c値(ln(測定値+1)値)と、全ての遺伝子RNA発現データ(log2(RPM+1)値)の組み合わせについてスピアマンの順位相関係数を求めた。
その結果、スピアマンの順位相関係数(ρ)の大きな遺伝子を抽出し、表3に示す13遺伝子を選択した。これら13遺伝子はいずれもこれまで血中HbA1c値との関連が報告されていない遺伝子である。
(4)モデル構築
(a)特徴量遺伝子による予測
訓練データである、SSL由来RNAから選択された前記特徴量遺伝子の発現量のデータ(log2(RPM+1)値)を説明変数とし、血中HbA1c値(ln(測定値+1)値)を目的変数として用い、予測モデルの構築を実施した。予測モデルは、一般線形モデル(Generalized linear model)、ニューラルネットワーク(Nerural net)、ラッソ回帰(Lasso)、ランダムフォレスト(Random forest)、線形カーネルのサポートベクターマシン(SVM linear)、rbfカーネルのサポートベクターマシン(SVM rbf)の6種のアルゴリズムを用いて、10分割交差検証を行って学習させた。各アルゴリズムについて、学習後のモデルに訓練データを入力し、二乗平均平方根誤差(RMSE)を求め、RMSEの最も小さいモデルを採用した。
前記選択したモデルに、テストデータの特徴量遺伝子発現量(log2(RPM+1)値)を入力して、血中HbA1c値(ln(測定値+1)値)の予測値を計算した。最後に、予測値と実測値からスピアマンの順位相関係数を求めた。
(a)特徴量遺伝子による予測
訓練データである、SSL由来RNAから選択された前記特徴量遺伝子の発現量のデータ(log2(RPM+1)値)を説明変数とし、血中HbA1c値(ln(測定値+1)値)を目的変数として用い、予測モデルの構築を実施した。予測モデルは、一般線形モデル(Generalized linear model)、ニューラルネットワーク(Nerural net)、ラッソ回帰(Lasso)、ランダムフォレスト(Random forest)、線形カーネルのサポートベクターマシン(SVM linear)、rbfカーネルのサポートベクターマシン(SVM rbf)の6種のアルゴリズムを用いて、10分割交差検証を行って学習させた。各アルゴリズムについて、学習後のモデルに訓練データを入力し、二乗平均平方根誤差(RMSE)を求め、RMSEの最も小さいモデルを採用した。
前記選択したモデルに、テストデータの特徴量遺伝子発現量(log2(RPM+1)値)を入力して、血中HbA1c値(ln(測定値+1)値)の予測値を計算した。最後に、予測値と実測値からスピアマンの順位相関係数を求めた。
(b)特徴量遺伝子+年齢による予測
訓練データである、SSL由来RNAから選択された前記特徴量遺伝子の発現量のデータ(log2(RPM+1)値)及び被験者年齢を説明変数とし、血中HbA1c値(ln(測定値+1)値)を目的変数として用い、予測モデルの構築を実施した。その後は上記(a)と同様の方法で予測モデルの構築を行い、最後に、予測値と実測値からスピアマンの順位相関係数を求めた。
訓練データである、SSL由来RNAから選択された前記特徴量遺伝子の発現量のデータ(log2(RPM+1)値)及び被験者年齢を説明変数とし、血中HbA1c値(ln(測定値+1)値)を目的変数として用い、予測モデルの構築を実施した。その後は上記(a)と同様の方法で予測モデルの構築を行い、最後に、予測値と実測値からスピアマンの順位相関係数を求めた。
5)結果
特徴量遺伝子13種を用いた予測モデル(rbfカーネルのサポートベクターマシン)において、テストデータで順位相関係数は0.267(p<0.05)となり、血中HbA1c値の予測が可能であることが示された。特徴量遺伝子13種及び年齢を用いた予測モデル(ラッソ回帰)の場合には、0.45(p<0.001)となり予測精度の向上が認められた。
特徴量遺伝子13種を用いた予測モデル(rbfカーネルのサポートベクターマシン)において、テストデータで順位相関係数は0.267(p<0.05)となり、血中HbA1c値の予測が可能であることが示された。特徴量遺伝子13種及び年齢を用いた予測モデル(ラッソ回帰)の場合には、0.45(p<0.001)となり予測精度の向上が認められた。
実施例3 SSLから抽出されたRNAを用いた糖尿病指標値の検出(3)
1)被験者及び血中グリコアルブミン値の測定
被験者は実施例1と同一で、実施例1で採取した血液を用いて、血中グリコアルブミン値を測定した。その結果、この集団の血中グリコアルブミン値の平均値±標準偏差は14.6±1.7%、中央値は14.5%であった。
1)被験者及び血中グリコアルブミン値の測定
被験者は実施例1と同一で、実施例1で採取した血液を用いて、血中グリコアルブミン値を測定した。その結果、この集団の血中グリコアルブミン値の平均値±標準偏差は14.6±1.7%、中央値は14.5%であった。
2)SSL採取、3)RNA調製及びシーケンシング
実施例1と同様に実施した。
実施例1と同様に実施した。
4)データ解析
(1)使用データ
上記3)で測定したSSL由来RNAの発現量のデータ(リードカウント値)を取得し、サンプル被験者間の総リード数の違いを補正したRPM値に変換した。機械学習モデルの構築には、負の二項分布に従うRPM値を正規分布に近似するため、RPM値に整数1を加算した底2の対数値(log2(RPM+1)値)を用いた。なお、全サンプル被験者の発現量データのうち90%以上のサンプル被験者で欠損値ではない発現量データが得られている2227遺伝子のみ以下の解析に使用した。
また、血中グリコアルブミン値を正規分布に近似するため、上記の測定値に整数1を加算した自然対数値(ln(測定値+1)値)を用いた。
(1)使用データ
上記3)で測定したSSL由来RNAの発現量のデータ(リードカウント値)を取得し、サンプル被験者間の総リード数の違いを補正したRPM値に変換した。機械学習モデルの構築には、負の二項分布に従うRPM値を正規分布に近似するため、RPM値に整数1を加算した底2の対数値(log2(RPM+1)値)を用いた。なお、全サンプル被験者の発現量データのうち90%以上のサンプル被験者で欠損値ではない発現量データが得られている2227遺伝子のみ以下の解析に使用した。
また、血中グリコアルブミン値を正規分布に近似するため、上記の測定値に整数1を加算した自然対数値(ln(測定値+1)値)を用いた。
(2)データセット分割
被験者376名のデータセットのうち、304名のRNAプロファイルデータをモデル構築の訓練データとし、残り72名分のRNAプロファイルデータをモデル精度評価に使用するテストデータとした。
被験者376名のデータセットのうち、304名のRNAプロファイルデータをモデル構築の訓練データとし、残り72名分のRNAプロファイルデータをモデル精度評価に使用するテストデータとした。
(3)特徴量遺伝子の選択
304名分の血中グリコアルブミン値(ln(測定値+1)値)と、全ての遺伝子RNA発現データ(log2(RPM+1)値)の組み合わせについてスピアマンの順位相関係数を求めた。
その結果、スピアマンの順位相関係数(ρ)の大きな遺伝子を抽出し、表4に示す10遺伝子を選択した。これら10遺伝子はいずれもこれまで血中グリコアルブミン値との関連が報告されていない遺伝子である。
304名分の血中グリコアルブミン値(ln(測定値+1)値)と、全ての遺伝子RNA発現データ(log2(RPM+1)値)の組み合わせについてスピアマンの順位相関係数を求めた。
その結果、スピアマンの順位相関係数(ρ)の大きな遺伝子を抽出し、表4に示す10遺伝子を選択した。これら10遺伝子はいずれもこれまで血中グリコアルブミン値との関連が報告されていない遺伝子である。
(4)モデル構築
(a)特徴量遺伝子による予測
訓練データである、SSL由来RNAから選択された前記特徴量遺伝子の発現量のデータ(log2(RPM+1)値)を説明変数とし、血中グリコアルブミン値(ln(測定値+1)値)を目的変数として用い、予測モデルの構築を実施した。予測モデルは、一般線形モデル(Generalized linear model)、ニューラルネットワーク(Nerural net)、ラッソ回帰(Lasso)、ランダムフォレスト(Random forest)、線形カーネルのサポートベクターマシン(SVM linear)、rbfカーネルのサポートベクターマシン(SVM rbf)の6種のアルゴリズムを用いて、10分割交差検証を行って学習させた。各アルゴリズムについて、学習後のモデルに訓練データを入力し、二乗平均平方根誤差(RMSE)を求め、RMSEの最も小さいモデルを採用した。
前記選択したモデルに、テストデータの特徴量遺伝子発現量(log2(RPM+1)値)を入力して、血中グリコアルブミン値(ln(測定値+1)値)の予測値を計算した。最後に、予測値と実測値からスピアマンの順位相関係数を求めた。
(a)特徴量遺伝子による予測
訓練データである、SSL由来RNAから選択された前記特徴量遺伝子の発現量のデータ(log2(RPM+1)値)を説明変数とし、血中グリコアルブミン値(ln(測定値+1)値)を目的変数として用い、予測モデルの構築を実施した。予測モデルは、一般線形モデル(Generalized linear model)、ニューラルネットワーク(Nerural net)、ラッソ回帰(Lasso)、ランダムフォレスト(Random forest)、線形カーネルのサポートベクターマシン(SVM linear)、rbfカーネルのサポートベクターマシン(SVM rbf)の6種のアルゴリズムを用いて、10分割交差検証を行って学習させた。各アルゴリズムについて、学習後のモデルに訓練データを入力し、二乗平均平方根誤差(RMSE)を求め、RMSEの最も小さいモデルを採用した。
前記選択したモデルに、テストデータの特徴量遺伝子発現量(log2(RPM+1)値)を入力して、血中グリコアルブミン値(ln(測定値+1)値)の予測値を計算した。最後に、予測値と実測値からスピアマンの順位相関係数を求めた。
5)結果
特徴量遺伝子10種を用いた予測モデル(線形カーネルのサポートベクターマシン)において、テストデータで順位相関係数は0.345(p<0.01)となり、血中グリコアルブミン値の予測が可能であることが示された。
特徴量遺伝子10種を用いた予測モデル(線形カーネルのサポートベクターマシン)において、テストデータで順位相関係数は0.345(p<0.01)となり、血中グリコアルブミン値の予測が可能であることが示された。
Claims (13)
- 前記遺伝子又はその発現産物の発現レベルがmRNAの発現量である請求項1記載の検出方法。
- 前記生体試料が被験者の皮膚表上脂質である請求項1又は2記載の検出方法。
- 前記遺伝子又はその発現産物の発現レベルに基づいて前記被験者の糖尿病指標値を検出することを含む請求項1~3のいずれか1項記載の検出方法。
- 前記遺伝子又はその発現産物の発現レベルに基づく予測モデルを用いて糖尿病指標値を検出することを含み、
前記予測モデルが、前記遺伝子又はその発現産物の発現レベルの測定値、又は当該発現レベルの測定値及び被験者の年齢を説明変数とし、糖尿病指標値を目的変数として構築される請求項1~4のいずれか1項記載の検出方法。 - 前記遺伝子が、PIM2、RPTN、EHBP1L1、CTDSP2、EFHD2、WBP1L、SNORA10、CYTH4、NCF1B、FLJ45445、ZFP36L1、HMHA1及びFAM25Bからなる13種の遺伝子群より選択される遺伝子であり、前記糖尿病指標値が空腹時血糖値である請求項1~5のいずれか1項記載の検出方法。
- 前記遺伝子が、SNORA8、PIM2、GNB2、SNORA21、SNORA38、SNORA10、REXO1L2P、SNORA71D、SNORD17、ARHGAP9、SCARNA16、SNORA16A及びSNORA14Bからなる13種の遺伝子群より選択される遺伝子であり、前記糖尿病指標値が血中HbA1c値である請求項1~5のいずれか1項記載の検出方法。
- 前記遺伝子が、SPRR3、SPDYE7P、SNORA38、SNORA9、SNORA81、MYO1F、KRT25、NCF1B、SNORD17及びECE1からなる10種の遺伝子群より選択される遺伝子であり、前記糖尿病指標値が血中グリコアルブミン値である請求項1~5のいずれか1項記載の検出方法。
- 前記遺伝子又はそれに由来する核酸と特異的にハイブリダイズするオリゴヌクレオチド、又は前記遺伝子の発現産物を認識する抗体を含有する、請求項1~8のいずれか1項記載の検出方法に用いられる糖尿病指標値を検出するための検査用キット。
- 前記表1に示す31種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物からなる、糖尿病指標値を検出するための検出マーカー。
- 前記遺伝子が、PIM2、RPTN、EHBP1L1、CTDSP2、EFHD2、WBP1L、SNORA10、CYTH4、NCF1B、FLJ45445、ZFP36L1、HMHA1及びFAM25Bからなる13種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物であって、糖尿病指標値が空腹時血糖値である、請求項10記載の検出マーカー。
- 前記遺伝子が、SNORA8、PIM2、GNB2、SNORA21、SNORA38、SNORA10、REXO1L2P、SNORA71D、SNORD17、ARHGAP9、SCARNA16、SNORA16A及びSNORA14Bからなる13種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物であって、糖尿病指標値が血中HbA1c値である、請求項10記載の検出マーカー。
- 前記遺伝子が、SPRR3、SPDYE7P、SNORA38、SNORA9、SNORA81、MYO1F、KRT25、NCF1B、SNORD17及びECE1からなる10種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物であって、糖尿病指標値が血中グリコアルブミン値である、請求項10記載の検出マーカー。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021103461A JP2023002298A (ja) | 2021-06-22 | 2021-06-22 | 糖尿病指標値の検出方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021103461A JP2023002298A (ja) | 2021-06-22 | 2021-06-22 | 糖尿病指標値の検出方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023002298A true JP2023002298A (ja) | 2023-01-10 |
Family
ID=84797957
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021103461A Pending JP2023002298A (ja) | 2021-06-22 | 2021-06-22 | 糖尿病指標値の検出方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2023002298A (ja) |
-
2021
- 2021-06-22 JP JP2021103461A patent/JP2023002298A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2494065B1 (en) | Means and methods for non-invasive diagnosis of chromosomal aneuploidy | |
US20060099593A1 (en) | Method of diagnosing integration dysfunction syndrome using blood | |
JP2023157965A (ja) | アトピー性皮膚炎の検出方法 | |
WO2021230379A1 (ja) | パーキンソン病の検出方法 | |
JP2023002298A (ja) | 糖尿病指標値の検出方法 | |
WO2022220299A1 (ja) | 乳幼児顔湿疹の症度の検出方法 | |
WO2022220298A1 (ja) | 乳幼児おむつ皮膚炎の症度の検出方法 | |
JP2023002299A (ja) | 内臓脂肪面積の検出方法 | |
JP2023073135A (ja) | 更年期障害の重症度の検出方法 | |
JP2023073134A (ja) | ホットフラッシュの検出方法 | |
JP2023045067A (ja) | 不眠の検出方法 | |
JP2023048810A (ja) | 慢性ストレスレベルの検出方法 | |
JP2022134126A (ja) | アトピー性皮膚炎の症度悪化の検出方法 | |
JP2022134127A (ja) | アトピー性皮膚炎による皮膚痒みの症度悪化の検出方法 | |
JP2022016416A (ja) | アトピー性皮膚炎の重症度の検出方法 | |
JP2023048811A (ja) | 疲労の検出方法 | |
JP2024045047A (ja) | 肥満改善剤の有効性予測方法 | |
JP2021175382A (ja) | 乳幼児アトピー性皮膚炎の検出方法 | |
JP2023069499A (ja) | 乾燥による皮膚表面形状悪化の検出方法 | |
JP2024075099A (ja) | アンモニア代謝能力の検出方法 | |
Dwyer et al. | Myocardial gene expression associated with genetic cardiac hypertrophy in the absence of hypertension | |
JP2024045048A (ja) | 肥満改善剤の有効性予測方法 | |
EP4253547A1 (en) | Method for detecting severity of atopic dermatitis | |
WO2022114201A1 (ja) | アトピー性皮膚炎の症度変化の検出方法 | |
EP2818546B1 (en) | Method for determining rheumatoid arthritis activity indicator, and biomarker used therein |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240328 |