JP2021180654A - パーキンソン病の検出方法 - Google Patents
パーキンソン病の検出方法 Download PDFInfo
- Publication number
- JP2021180654A JP2021180654A JP2021082827A JP2021082827A JP2021180654A JP 2021180654 A JP2021180654 A JP 2021180654A JP 2021082827 A JP2021082827 A JP 2021082827A JP 2021082827 A JP2021082827 A JP 2021082827A JP 2021180654 A JP2021180654 A JP 2021180654A
- Authority
- JP
- Japan
- Prior art keywords
- gene
- expression
- disease
- parkinson
- expression level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 208000018737 Parkinson disease Diseases 0.000 title claims abstract description 142
- 238000000034 method Methods 0.000 title claims abstract description 73
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 253
- 230000014509 gene expression Effects 0.000 claims abstract description 215
- 239000003550 marker Substances 0.000 claims abstract description 23
- 239000012472 biological sample Substances 0.000 claims abstract description 20
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 120
- 102000039446 nucleic acids Human genes 0.000 claims description 28
- 108020004707 nucleic acids Proteins 0.000 claims description 28
- 150000007523 nucleic acids Chemical class 0.000 claims description 28
- 238000001514 detection method Methods 0.000 claims description 22
- 108091008053 gene clusters Proteins 0.000 claims description 20
- 239000000523 sample Substances 0.000 claims description 14
- -1 CCL3 Proteins 0.000 claims description 10
- 108091034117 Oligonucleotide Proteins 0.000 claims description 8
- 150000002632 lipids Chemical class 0.000 claims description 8
- 102100031650 C-X-C chemokine receptor type 4 Human genes 0.000 claims description 7
- 102100036873 Cyclin-I Human genes 0.000 claims description 7
- 102100023227 E3 SUMO-protein ligase EGR2 Human genes 0.000 claims description 7
- 101000922348 Homo sapiens C-X-C chemokine receptor type 4 Proteins 0.000 claims description 7
- 101000713124 Homo sapiens Cyclin-I Proteins 0.000 claims description 7
- 101001049692 Homo sapiens E3 SUMO-protein ligase EGR2 Proteins 0.000 claims description 7
- 238000005259 measurement Methods 0.000 claims description 7
- 102100028472 DNA-directed RNA polymerases I, II, and III subunit RPABC5 Human genes 0.000 claims description 6
- 102100033183 Epithelial membrane protein 1 Human genes 0.000 claims description 6
- 101000723805 Homo sapiens DNA-directed RNA polymerases I, II, and III subunit RPABC5 Proteins 0.000 claims description 6
- 101000850989 Homo sapiens Epithelial membrane protein 1 Proteins 0.000 claims description 6
- 101000650968 Homo sapiens Ribonuclease kappa Proteins 0.000 claims description 5
- 101000701902 Homo sapiens Serpin B4 Proteins 0.000 claims description 5
- 101150111584 RHOA gene Proteins 0.000 claims description 5
- 102100027776 Ribonuclease kappa Human genes 0.000 claims description 5
- 102100030326 Serpin B4 Human genes 0.000 claims description 5
- 102100022387 Transforming protein RhoA Human genes 0.000 claims description 5
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 5
- 108020004999 messenger RNA Proteins 0.000 claims description 5
- 101000601517 Homo sapiens NADH dehydrogenase [ubiquinone] iron-sulfur protein 5 Proteins 0.000 claims description 4
- 101000707534 Homo sapiens Serine incorporator 1 Proteins 0.000 claims description 4
- 102100037701 NADH dehydrogenase [ubiquinone] iron-sulfur protein 5 Human genes 0.000 claims description 4
- 102100031707 Serine incorporator 1 Human genes 0.000 claims description 4
- 201000010099 disease Diseases 0.000 claims description 4
- 102100031831 Adipogenesis regulatory factor Human genes 0.000 claims description 3
- 102100034611 Ankyrin repeat domain-containing protein 12 Human genes 0.000 claims description 3
- 102100035793 CD83 antigen Human genes 0.000 claims description 3
- 102100024445 Cornifelin Human genes 0.000 claims description 3
- 102100039455 Cytochrome b-c1 complex subunit 6, mitochondrial Human genes 0.000 claims description 3
- 102100039061 Cytokine receptor common subunit beta Human genes 0.000 claims description 3
- 101000775473 Homo sapiens Adipogenesis regulatory factor Proteins 0.000 claims description 3
- 101000924485 Homo sapiens Ankyrin repeat domain-containing protein 12 Proteins 0.000 claims description 3
- 101000946856 Homo sapiens CD83 antigen Proteins 0.000 claims description 3
- 101000909804 Homo sapiens Cornifelin Proteins 0.000 claims description 3
- 101000746783 Homo sapiens Cytochrome b-c1 complex subunit 6, mitochondrial Proteins 0.000 claims description 3
- 101001033280 Homo sapiens Cytokine receptor common subunit beta Proteins 0.000 claims description 3
- 101001046668 Homo sapiens Integrin alpha-X Proteins 0.000 claims description 3
- 101100181431 Homo sapiens LCE3D gene Proteins 0.000 claims description 3
- 102100022297 Integrin alpha-X Human genes 0.000 claims description 3
- 108091036429 KCNQ1OT1 Proteins 0.000 claims description 3
- 102100024572 Late cornified envelope protein 3D Human genes 0.000 claims description 3
- 102100037170 Phosphate carrier protein, mitochondrial Human genes 0.000 claims description 3
- 108091006710 SLC25A3 Proteins 0.000 claims description 3
- 101150051922 29 gene Proteins 0.000 claims description 2
- 102100033591 Calponin-2 Human genes 0.000 claims description 2
- 101000945403 Homo sapiens Calponin-2 Proteins 0.000 claims description 2
- 101001044093 Homo sapiens Lipopolysaccharide-induced tumor necrosis factor-alpha factor Proteins 0.000 claims description 2
- 101000970029 Homo sapiens NADH dehydrogenase [ubiquinone] 1 alpha subcomplex subunit 4-like 2 Proteins 0.000 claims description 2
- 101000829212 Homo sapiens Serine/arginine repetitive matrix protein 2 Proteins 0.000 claims description 2
- 101000713459 Homo sapiens Small nuclear ribonucleoprotein G Proteins 0.000 claims description 2
- 102100021607 Lipopolysaccharide-induced tumor necrosis factor-alpha factor Human genes 0.000 claims description 2
- 102100021734 NADH dehydrogenase [ubiquinone] 1 alpha subcomplex subunit 4-like 2 Human genes 0.000 claims description 2
- 102100023657 Serine/arginine repetitive matrix protein 2 Human genes 0.000 claims description 2
- 102100036768 Small nuclear ribonucleoprotein G Human genes 0.000 claims description 2
- 101150072531 10 gene Proteins 0.000 claims 1
- 238000007689 inspection Methods 0.000 claims 1
- 238000012360 testing method Methods 0.000 description 99
- 239000000047 product Substances 0.000 description 66
- 108020004414 DNA Proteins 0.000 description 42
- 210000003491 skin Anatomy 0.000 description 27
- 238000004458 analytical method Methods 0.000 description 23
- 230000003247 decreasing effect Effects 0.000 description 23
- 238000012549 training Methods 0.000 description 16
- 238000004422 calculation algorithm Methods 0.000 description 15
- 102000004169 proteins and genes Human genes 0.000 description 14
- 239000002299 complementary DNA Substances 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 11
- 238000009396 hybridization Methods 0.000 description 11
- 241000894007 species Species 0.000 description 11
- 102100034343 Integrase Human genes 0.000 description 10
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 10
- 238000011156 evaluation Methods 0.000 description 10
- 238000010195 expression analysis Methods 0.000 description 10
- 238000012706 support-vector machine Methods 0.000 description 10
- 238000012795 verification Methods 0.000 description 9
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 8
- 230000000295 complement effect Effects 0.000 description 8
- 239000000463 material Substances 0.000 description 8
- 102000053602 DNA Human genes 0.000 description 7
- 239000007795 chemical reaction product Substances 0.000 description 7
- 239000003153 chemical reaction reagent Substances 0.000 description 7
- 238000007796 conventional method Methods 0.000 description 7
- 150000002500 ions Chemical class 0.000 description 7
- 238000007403 mPCR Methods 0.000 description 7
- 238000007637 random forest analysis Methods 0.000 description 7
- 238000010839 reverse transcription Methods 0.000 description 7
- 238000000926 separation method Methods 0.000 description 7
- 238000003657 Likelihood-ratio test Methods 0.000 description 6
- 230000031018 biological processes and functions Effects 0.000 description 6
- 238000009826 distribution Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 238000007477 logistic regression Methods 0.000 description 6
- 238000012163 sequencing technique Methods 0.000 description 6
- 238000010276 construction Methods 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 238000003199 nucleic acid amplification method Methods 0.000 description 5
- 238000000513 principal component analysis Methods 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 239000002250 absorbent Substances 0.000 description 4
- 230000003321 amplification Effects 0.000 description 4
- 238000000137 annealing Methods 0.000 description 4
- 210000004369 blood Anatomy 0.000 description 4
- 239000008280 blood Substances 0.000 description 4
- 238000000354 decomposition reaction Methods 0.000 description 4
- VYFYYTLLBUKUHU-UHFFFAOYSA-N dopamine Chemical compound NCCC1=CC=C(O)C(O)=C1 VYFYYTLLBUKUHU-UHFFFAOYSA-N 0.000 description 4
- 230000037361 pathway Effects 0.000 description 4
- 210000002374 sebum Anatomy 0.000 description 4
- 230000035945 sensitivity Effects 0.000 description 4
- 210000001519 tissue Anatomy 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 238000000018 DNA microarray Methods 0.000 description 3
- 238000000636 Northern blotting Methods 0.000 description 3
- 206010044565 Tremor Diseases 0.000 description 3
- 230000002745 absorbent Effects 0.000 description 3
- 239000011324 bead Substances 0.000 description 3
- 238000010805 cDNA synthesis kit Methods 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 238000010201 enrichment analysis Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 238000002493 microarray Methods 0.000 description 3
- 229920001184 polypeptide Polymers 0.000 description 3
- 102000004196 processed proteins & peptides Human genes 0.000 description 3
- 108090000765 processed proteins & peptides Proteins 0.000 description 3
- 238000003757 reverse transcription PCR Methods 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 210000001732 sebaceous gland Anatomy 0.000 description 3
- 210000002966 serum Anatomy 0.000 description 3
- 210000000434 stratum corneum Anatomy 0.000 description 3
- 208000024891 symptom Diseases 0.000 description 3
- 102100040006 Annexin A1 Human genes 0.000 description 2
- 102000004363 Aquaporin 3 Human genes 0.000 description 2
- 108090000991 Aquaporin 3 Proteins 0.000 description 2
- 101150050047 BHLHE40 gene Proteins 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 102100026191 Class E basic helix-loop-helix protein 40 Human genes 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 102100033296 Gamma-aminobutyric acid receptor-associated protein-like 1 Human genes 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 101000959738 Homo sapiens Annexin A1 Proteins 0.000 description 2
- 101000926844 Homo sapiens Gamma-aminobutyric acid receptor-associated protein-like 1 Proteins 0.000 description 2
- 101000614442 Homo sapiens Keratin, type I cytoskeletal 16 Proteins 0.000 description 2
- 101000641419 Homo sapiens V-type proton ATPase 16 kDa proteolipid subunit c Proteins 0.000 description 2
- 102100040441 Keratin, type I cytoskeletal 16 Human genes 0.000 description 2
- 239000004743 Polypropylene Substances 0.000 description 2
- 238000002123 RNA extraction Methods 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 238000000692 Student's t-test Methods 0.000 description 2
- 102100034171 V-type proton ATPase 16 kDa proteolipid subunit c Human genes 0.000 description 2
- 239000000853 adhesive Substances 0.000 description 2
- 230000001070 adhesive effect Effects 0.000 description 2
- 102000003802 alpha-Synuclein Human genes 0.000 description 2
- 108090000185 alpha-Synuclein Proteins 0.000 description 2
- 239000000090 biomarker Substances 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 210000001124 body fluid Anatomy 0.000 description 2
- 239000010839 body fluid Substances 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 239000007853 buffer solution Substances 0.000 description 2
- 210000004027 cell Anatomy 0.000 description 2
- 230000007850 degeneration Effects 0.000 description 2
- 229960003638 dopamine Drugs 0.000 description 2
- 210000002615 epidermis Anatomy 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 210000003780 hair follicle Anatomy 0.000 description 2
- 239000006249 magnetic particle Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000004770 neurodegeneration Effects 0.000 description 2
- 208000015122 neurodegenerative disease Diseases 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 239000002773 nucleotide Substances 0.000 description 2
- 125000003729 nucleotide group Chemical group 0.000 description 2
- 229920001155 polypropylene Polymers 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 230000002285 radioactive effect Effects 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 239000007790 solid phase Substances 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 210000003523 substantia nigra Anatomy 0.000 description 2
- 210000000106 sweat gland Anatomy 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 239000003021 water soluble solvent Substances 0.000 description 2
- 101150076401 16 gene Proteins 0.000 description 1
- 206010001541 Akinesia Diseases 0.000 description 1
- 208000024827 Alzheimer disease Diseases 0.000 description 1
- 206010003694 Atrophy Diseases 0.000 description 1
- 206010006100 Bradykinesia Diseases 0.000 description 1
- 101100366714 Caenorhabditis elegans ssl-1 gene Proteins 0.000 description 1
- 241001340526 Chrysoclista linneella Species 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 108700039887 Essential Genes Proteins 0.000 description 1
- 101000616112 Homo sapiens Stress-associated endoplasmic reticulum protein 1 Proteins 0.000 description 1
- 208000006083 Hypokinesia Diseases 0.000 description 1
- WTDRDQBEARUVNC-LURJTMIESA-N L-DOPA Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C(O)=C1 WTDRDQBEARUVNC-LURJTMIESA-N 0.000 description 1
- WTDRDQBEARUVNC-UHFFFAOYSA-N L-Dopa Natural products OC(=O)C(N)CC1=CC=C(O)C(O)=C1 WTDRDQBEARUVNC-UHFFFAOYSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 238000007397 LAMP assay Methods 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 108700011259 MicroRNAs Proteins 0.000 description 1
- 208000019430 Motor disease Diseases 0.000 description 1
- 208000016285 Movement disease Diseases 0.000 description 1
- 206010052904 Musculoskeletal stiffness Diseases 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 208000027886 Parkinson disease 15 Diseases 0.000 description 1
- 206010034277 Pemphigoid Diseases 0.000 description 1
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 206010071390 Resting tremor Diseases 0.000 description 1
- 206010039793 Seborrhoeic dermatitis Diseases 0.000 description 1
- 102100021813 Stress-associated endoplasmic reticulum protein 1 Human genes 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- PJGQNIKJDDVDHR-UHFFFAOYSA-N [S-]C#N.NC([NH3+])=N.ClC(Cl)(Cl)C1=CC=CC=C1 Chemical compound [S-]C#N.NC([NH3+])=N.ClC(Cl)(Cl)C1=CC=CC=C1 PJGQNIKJDDVDHR-UHFFFAOYSA-N 0.000 description 1
- 239000011358 absorbing material Substances 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- VREFGVBLTWBCJP-UHFFFAOYSA-N alprazolam Chemical compound C12=CC(Cl)=CC=C2N2C(C)=NN=C2CN=C1C1=CC=CC=C1 VREFGVBLTWBCJP-UHFFFAOYSA-N 0.000 description 1
- 230000037444 atrophy Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 239000002981 blocking agent Substances 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 208000000594 bullous pemphigoid Diseases 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000009109 curative therapy Methods 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 210000004207 dermis Anatomy 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000007847 digital PCR Methods 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 210000003499 exocrine gland Anatomy 0.000 description 1
- 210000000416 exudates and transudate Anatomy 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 210000004907 gland Anatomy 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 239000004519 grease Substances 0.000 description 1
- 210000004209 hair Anatomy 0.000 description 1
- 210000004408 hybridoma Anatomy 0.000 description 1
- 208000036260 idiopathic disease Diseases 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 210000004558 lewy body Anatomy 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 238000001840 matrix-assisted laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 210000001259 mesencephalon Anatomy 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 150000002772 monosaccharides Chemical class 0.000 description 1
- 201000000050 myeloid neoplasm Diseases 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 150000002482 oligosaccharides Chemical class 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 208000037821 progressive disease Diseases 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 238000007790 scraping Methods 0.000 description 1
- 208000008742 seborrheic dermatitis Diseases 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 210000004927 skin cell Anatomy 0.000 description 1
- 208000017520 skin disease Diseases 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 210000004989 spleen cell Anatomy 0.000 description 1
- 238000000528 statistical test Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 238000002636 symptomatic treatment Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 230000009452 underexpressoin Effects 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6893—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids related to diseases not provided for elsewhere
- G01N33/6896—Neurological disorders, e.g. Alzheimer's disease
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2800/00—Detection or diagnosis of diseases
- G01N2800/28—Neurological disorders
- G01N2800/2835—Movement disorders, e.g. Parkinson, Huntington, Tourette
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Immunology (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Pathology (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Hematology (AREA)
- Urology & Nephrology (AREA)
- Neurology (AREA)
- Neurosurgery (AREA)
- Cell Biology (AREA)
- Food Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- General Physics & Mathematics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
【課題】パーキンソン病を検出するためのマーカー遺伝子、及び該マーカー遺伝子を用いたパーキンソン病の検出方法を提供する。【解決手段】被験者から採取された生体試料について、SNORA16A、SNORA24、SNORA50及びREXO1L2Pからなる4種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む、当該被験者におけるパーキンソン病の検出方法。【選択図】なし
Description
本発明は、パーキンソン病マーカーを用いたパーキンソン病の検出方法に関する。
パーキンソン病は病理学的にはα−シヌクレイン凝集体を主体とするLewy小体の形成と中脳黒質のドーパミン神経細胞の変性、細胞死を主体とする進行性の神経変性疾患で、臨床的には筋強剛、振戦、寡動、歩行障害等の運動障害を主体とする疾患である。
パーキンソン病は、神経変性疾患の中でアルツハイマー病に次いで多く、有病率は10万人に120〜130人といわれ、日本では約14万人の患者がいると推定されている。
パーキンソン病は、神経変性疾患の中でアルツハイマー病に次いで多く、有病率は10万人に120〜130人といわれ、日本では約14万人の患者がいると推定されている。
現状ではパーキンソン病に対する根治療法は存在せず、L−DOPAの補充等による対症療法によって症状コントロールすることがQOL維持に重要であると考えられている。
しかしながら、運動障害の自覚症状が現れるのは中期以降であり、疾患を早期に診断して早期介入を図ることが求められている。
しかしながら、運動障害の自覚症状が現れるのは中期以降であり、疾患を早期に診断して早期介入を図ることが求められている。
パーキンソン病を検出するためのバイオマーカーとしては、α-シヌクレイン蓄積を検出するものの他、循環血清由来のマイクロRNAを検出すること(特許文献1)、血中のフェニルアラニンに対するチロシンの濃度比率を測定すること(特許文献2)等が提案されている。また、パーキンソン病患者の皮膚では、脳と同様、α−シヌクレイン凝集体の形成が認められること(非特許文献1)、パーキンソン病患者において、脂漏性皮膚炎、メラノーマ、水疱性類天疱瘡、酒さ等の皮膚疾患や症状が現れること(非特許文献2)が報告され、パーキンソン病と皮膚の状態に何らかの関係があるとも考えられているが、科学的な関連性は全く不明である。
一方、生体試料中のDNAやRNA等の核酸の解析によりヒトの生体内の現在さらには将来の生理状態を調べる技術が開発されている。核酸を用いた解析は、網羅的な解析方法が確立されており一度の解析で豊富な情報を得られる、及び一塩基多形やRNA機能等に関する多くの研究報告に基づいて解析結果の機能的な紐付けが容易であるといった利点を有する。生体由来の核酸は、血液等の体液、分泌物、組織等から抽出することができるが、最近、皮膚表上脂質(skin surface lipids;SSL)に含まれるRNAを生体の解析用の試料として用いること、SSLから表皮、汗腺、毛包及び皮脂腺のマーカー遺伝子が検出できることが報告されている(特許文献3)。
Rodriguez-Leyva I et al. Ann Clin Transl Neurol. 2014 (modified)
Ravn AH et al. Clin Cosmet Investig Dermatol. 2017
本発明は、パーキンソン病を検出するためのマーカー、及び該マーカーを用いたパーキンソン病の検出方法を提供することに関する。
本発明者らは、パーキンソン病患者と健常者の皮膚からSSLを採取し、SSL中に含まれるRNAの発現状態をシーケンス情報として網羅的に解析した結果、特定の遺伝子の発現レベルが両者の間で有意に異なり、これを指標としてパーキンソン病を検出できることを見出した。
すなわち、本発明は、以下の1)〜3)に係るものである。
1)被験者から採取された生体試料について、SNORA16A、SNORA24、SNORA50及びREXO1L2Pからなる4種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む、当該被験者におけるパーキンソン病の検出方法。
2)前記遺伝子と特異的にハイブリダイズするオリゴヌクレオチド、又は前記遺伝子の発現産物を認識する抗体を含有する、1)の方法に用いられるパーキンソン病を検出するための検査用キット。
3)表3−1〜3−4及び表6−1〜6−2に示される遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物からなる、パーキンソン病の検出マーカー。
1)被験者から採取された生体試料について、SNORA16A、SNORA24、SNORA50及びREXO1L2Pからなる4種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む、当該被験者におけるパーキンソン病の検出方法。
2)前記遺伝子と特異的にハイブリダイズするオリゴヌクレオチド、又は前記遺伝子の発現産物を認識する抗体を含有する、1)の方法に用いられるパーキンソン病を検出するための検査用キット。
3)表3−1〜3−4及び表6−1〜6−2に示される遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物からなる、パーキンソン病の検出マーカー。
本発明によれば、簡便且つ非侵襲的に、パーキンソン病を早期に、高い精度、感度及び特異度で検出することが可能となる。
本明細書中で引用された全ての特許文献、非特許文献、及びその他の刊行物は、その全体が本明細書中において参考として援用される。
本発明において、「核酸」又は「ポリヌクレオチド」と云う用語は、DNA又はRNAを意味する。DNAには、cDNA、ゲノムDNA、及び合成DNAのいずれもが含まれ、「RNA」には、total RNA、mRNA、rRNA、tRNA、non-coding RNA及び合成のRNAのいずれもが含まれる。
本発明において「遺伝子」とは、ヒトゲノムDNAを含む2本鎖DNAの他、cDNAを含む1本鎖DNA(正鎖)、当該正鎖と相補的な配列を有する1本鎖DNA(相補鎖)、及びこれらの断片を包含するものであって、DNAを構成する塩基の配列情報の中に、何らかの生物学的情報が含まれているものを意味する。
また、当該「遺伝子」は特定の塩基配列で表される「遺伝子」だけではなく、これらの同族体(すなわち、ホモログもしくはオーソログ)、遺伝子多型等の変異体、及び誘導体をコードする核酸が包含される。
本明細書中に開示される遺伝子の名称は、NCBI([www.ncbi.nlm.nih.gov/])に記載のあるOfficial Symbolに従う。一方で遺伝子オントロジー(GO)に関しては、String([string-db.org/])に記載のあるPathway ID.に従う。
また、当該「遺伝子」は特定の塩基配列で表される「遺伝子」だけではなく、これらの同族体(すなわち、ホモログもしくはオーソログ)、遺伝子多型等の変異体、及び誘導体をコードする核酸が包含される。
本明細書中に開示される遺伝子の名称は、NCBI([www.ncbi.nlm.nih.gov/])に記載のあるOfficial Symbolに従う。一方で遺伝子オントロジー(GO)に関しては、String([string-db.org/])に記載のあるPathway ID.に従う。
本発明において、遺伝子の「発現産物」とは、遺伝子の転写産物及び翻訳産物を包含する概念である。「転写産物」とは、遺伝子(DNA)から転写されて生じるRNAであり、「翻訳産物」とは、RNAに基づき翻訳合成される、遺伝子にコードされたタンパク質を意味する。
本発明において、「パーキンソン病」とは、黒質緻密層ドーパミン神経細胞の変性を主病変とし、緩徐進行性に運動3徴候(安静時振戦、固縮、運動緩慢及び無動)を発現する特発性、進行性の疾患を意味する。
本発明において、パーキンソン病の「検出」とは、パーキンソン病の存在又は不存在を明らかにする意味であり、検査、測定、判定、評価又は評価支援という用語で言い換えることもできる。なお、本明細書において「判定」又は「評価」という用語は、医師による判定や評価を含むものではない。
本発明のSNORA16A、SNORA24、SNORA50及びREXO1L2Pからなる4種の遺伝子は、後述する実施例に示す、SSL由来RNAの発現量が健常者に対してパーキンソン病患者で有意に上昇(UP)又は低下(DOWN)していることが見出された下記表Aに記載の33種の遺伝子から選択された遺伝子であり、従来パーキンソン病との関連が知られていなかった遺伝子である(表中、太字で示す。)。
表Aに示される33種の遺伝子は、2つの試験(試験1:健常者/パーキンソン病患者
各15名、試験2:健常者/パーキンソン病患者 各50名)の被験者のSSLから抽出されたRNAの発現量のデータ(リードカウント値)をサンプル間の総リード数の違いを補正したRPM値に変換し、当該RPM値を底2の対数値に変換した値(Log2RPM値)を基に、健常者と比較してパーキンソン病患者で、Student’s t−testでp値が0.05以下となるRNAを同定し(試験1:発現上昇遺伝子111種、発現低下遺伝子68種(計179遺伝子、表1−1〜1−5)、試験2:発現上昇遺伝子565種、発現低下遺伝子294種(計859遺伝子、表1−6〜1−27)から、試験1と試験2において共通に上昇した遺伝子(18種)と低下した遺伝子(15種)を選択したものである。
したがって、斯かる179遺伝子及び859遺伝子(重複を除いた計1005遺伝子)からなる群より選択される遺伝子又はその発現産物は、パーキンソン病を検出するためのパーキンソン病マーカーとなり得、中でも表Aに示される33種の遺伝子からなる群より選択される遺伝子又はその発現産物は、好ましいパーキンソン病マーカーである。
表A及び後記表1中、「P値(p value)」とは、統計学的検定において、帰無仮説の下で実際にデータから計算された統計量よりも極端な統計量が観測される確率を示す。したがって「P値」が小さいほど、比較対象間に有意差があるとみなせる。
「UP」で示される遺伝子は、パーキンソン病患者で発現レベルが上がる遺伝子であり、「DOWN」で示される遺伝子は、パーキンソン病患者で発現レベルが下がる遺伝子である。
各15名、試験2:健常者/パーキンソン病患者 各50名)の被験者のSSLから抽出されたRNAの発現量のデータ(リードカウント値)をサンプル間の総リード数の違いを補正したRPM値に変換し、当該RPM値を底2の対数値に変換した値(Log2RPM値)を基に、健常者と比較してパーキンソン病患者で、Student’s t−testでp値が0.05以下となるRNAを同定し(試験1:発現上昇遺伝子111種、発現低下遺伝子68種(計179遺伝子、表1−1〜1−5)、試験2:発現上昇遺伝子565種、発現低下遺伝子294種(計859遺伝子、表1−6〜1−27)から、試験1と試験2において共通に上昇した遺伝子(18種)と低下した遺伝子(15種)を選択したものである。
したがって、斯かる179遺伝子及び859遺伝子(重複を除いた計1005遺伝子)からなる群より選択される遺伝子又はその発現産物は、パーキンソン病を検出するためのパーキンソン病マーカーとなり得、中でも表Aに示される33種の遺伝子からなる群より選択される遺伝子又はその発現産物は、好ましいパーキンソン病マーカーである。
表A及び後記表1中、「P値(p value)」とは、統計学的検定において、帰無仮説の下で実際にデータから計算された統計量よりも極端な統計量が観測される確率を示す。したがって「P値」が小さいほど、比較対象間に有意差があるとみなせる。
「UP」で示される遺伝子は、パーキンソン病患者で発現レベルが上がる遺伝子であり、「DOWN」で示される遺伝子は、パーキンソン病患者で発現レベルが下がる遺伝子である。
上記で発現変動した遺伝子群には、遺伝子オントロジー(GO)エンリッチメント解析によるbiological process(BP)及びKEGG pathwayの探索で、パーキンソン病(hsa05012)と関連するものが含まれることが示された(後記表2参照)。その一方、上記で発現変動した遺伝子群のうち、後記表3−1〜3−4に示した遺伝子は、これまでにパーキンソン病との関係が全く報告されていない遺伝子である。したがって、これらの遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物は、パーキンソン病を検出するための、新規なパーキンソン病マーカーであり、特に試験1と試験2に共通するSNORA16A、SNORA24、SNORA50及びREXO1L2Pからなる群より選択される少なくとも1つの遺伝子又はその発現産物は、新規なパーキンソン病マーカーとして好ましい。より好ましくは該群から選択される2種以上、さらに好ましくは3種以上、よりさらに好ましくは4種全てである。また、上記表Aと後記表Bに共通して含まれるSNORA24を少なくとも含むことが好ましい。
また、発現変動RNAの同定は、RNAの発現量のデータ(リードカウント値)について、例えばDESeq2(Love MI et al. Genome Biol. 2014)を用いて補正されたカウント値(Normalized count値)、あるいは整数1を加算した底2の対数値(Log2(count+1)値)を用いて行うことも可能である。
例えば、上述した2つの試験の被験者のSSLから抽出されたRNAの発現量のデータとしてNormalized count値を用い、健常者と比較してパーキンソン病患者において、尤度比検定によるp値の補正値(FDR)が0.25以下となるRNAを同定すると、試験1では発現上昇遺伝子が74種、発現低下遺伝子が209種、計283遺伝子(表4−1〜4−8)、試験2では発現上昇遺伝子が151種、発現低下遺伝子が308種、計459遺伝子(表4−9〜4−20)が得られる。そして、試験1と試験2において共通に上昇する遺伝子は7種(ANXA1、AQP3、EMP1、KRT16、POLR2L、SERPINB4、SNORA24)、低下する遺伝子は10種(ATP6V0C、BHLHE40、CCL3、CCNI、CXCR4、EGR2、GABARAPL1、RHOA、RNASEK、SERINC1)の計17種(表B)となる。
したがって、斯かる283遺伝子及び459遺伝子(重複を除いた計725遺伝子)からなる群より選択される遺伝子又はその発現産物は、パーキンソン病を検出するためのパーキンソン病マーカーとなり得、中でも表Bに示される17種の遺伝子からなる群より選択される遺伝子又はその発現産物は、好ましいパーキンソン病マーカーであり、これらのうち上記表Aに示される遺伝子と共通する、後記表Cに示される11種の遺伝子群からなる群より選択される遺伝子又はその発現産物は、より好ましいパーキンソン病マーカーである。
例えば、上述した2つの試験の被験者のSSLから抽出されたRNAの発現量のデータとしてNormalized count値を用い、健常者と比較してパーキンソン病患者において、尤度比検定によるp値の補正値(FDR)が0.25以下となるRNAを同定すると、試験1では発現上昇遺伝子が74種、発現低下遺伝子が209種、計283遺伝子(表4−1〜4−8)、試験2では発現上昇遺伝子が151種、発現低下遺伝子が308種、計459遺伝子(表4−9〜4−20)が得られる。そして、試験1と試験2において共通に上昇する遺伝子は7種(ANXA1、AQP3、EMP1、KRT16、POLR2L、SERPINB4、SNORA24)、低下する遺伝子は10種(ATP6V0C、BHLHE40、CCL3、CCNI、CXCR4、EGR2、GABARAPL1、RHOA、RNASEK、SERINC1)の計17種(表B)となる。
したがって、斯かる283遺伝子及び459遺伝子(重複を除いた計725遺伝子)からなる群より選択される遺伝子又はその発現産物は、パーキンソン病を検出するためのパーキンソン病マーカーとなり得、中でも表Bに示される17種の遺伝子からなる群より選択される遺伝子又はその発現産物は、好ましいパーキンソン病マーカーであり、これらのうち上記表Aに示される遺伝子と共通する、後記表Cに示される11種の遺伝子群からなる群より選択される遺伝子又はその発現産物は、より好ましいパーキンソン病マーカーである。
また、上記で発現変動した遺伝子群のうち、後記表6−1〜6−2に示した遺伝子は、これまでにパーキンソン病との関係が全く報告されていない遺伝子である。したがって、これらの遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物は、パーキンソン病を検出するための、新規なパーキンソン病マーカーであり、特に試験1と試験2に共通するSNORA24(表中、太字で示す。)又はその発現産物は、新規なパーキンソン病マーカーとして好ましい。
なお、上記のパーキンソン病マーカーとなり得る遺伝子(以下、「標的遺伝子」とも称す)には、パーキンソン病を検出するためのバイオマーカーとなり得る限り、当該遺伝子を構成するDNAの塩基配列と実質的に同一の塩基配列を有する遺伝子も包含される。ここで、実質的に同一の塩基配列とは、例えば、相同性計算アルゴリズムNCBI BLASTを用い、期待値=10;ギャップを許す;フィルタリング=ON;マッチスコア=1;ミスマッチスコア=−3の条件にて検索をした場合、当該遺伝子を構成するDNAの塩基配列と90%以上、好ましくは95%以上、より好ましくは98%以上、さらに好ましくは99%以上の同一性があることを意味する。
本発明のパーキンソン病の検出方法は、被験者から採取された生体試料について、標的遺伝子、一態様として、SNORA16A、SNORA24、SNORA50及びREXO1L2Pからなる群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む。
本発明のパーキンソン病の検出方法において、生体試料を採取する被験者としては、ヒト及び非ヒト哺乳動物を含む哺乳動物が挙げられ、好ましくはヒトである。被験者がヒトの場合、その性別、年齢及び人種等は特に限定されず、乳児から老人までを含み得る。好ましくは、該被験者は、パーキンソン病の検出を必要とするか又は希望するヒトである。例えば、該被験者は、パーキンソン病の発症が疑われるヒト又は遺伝的にパーキンソン病の素因を有するヒトである。
本発明において用いられる生体試料としては、パーキンソン病の発生、進行に伴い本発明の遺伝子が発現変化する組織及び生体材料であればよい。具体的には臓器、皮膚、血液、尿、唾液、汗、角層、皮膚表上脂質(SSL)、組織浸出液等の体液、血液から調製された血清、血漿、その他、便、毛髪等が挙げられ、好ましくは皮膚、角層又は皮膚表上脂質(SSL)、より好ましくは皮膚表上脂質(SSL)が挙げられる。SSLが採取される皮膚の部位としては、特に限定されず、頭、顔、首、体幹、手足等の身体の任意の部位の皮膚が挙げられ、皮脂の分泌が多い部位、例えば頭又は顔の皮膚が好ましく、顔の皮膚がより好ましい。
ここで、「皮膚表上脂質(SSL)」とは、皮膚の表上に存在する脂溶性画分をいい、皮脂と呼ばれることもある。一般に、SSLは、皮膚にある皮脂腺等の外分泌腺から分泌された分泌物を主に含み、皮膚表面を覆う薄い層の形で皮膚表上に存在している。SSLは、皮膚細胞で発現したRNAを含む(前記特許文献3参照)。また本明細書において、「皮膚」とは、特に限定しない限り、角層、表皮、真皮、毛包、ならびに汗腺、皮脂腺及びその他の腺等の組織を含む領域の総称である。
被験者の皮膚からのSSLの採取には、皮膚からのSSLの回収又は除去に用いられているあらゆる手段を採用することができる。好ましくは、後述するSSL吸収性素材、SSL接着性素材、又は皮膚からSSLをこすり落とす器具を使用することができる。SSL吸収性素材又はSSL接着性素材としては、SSLに親和性を有する素材であれば特に限定されず、例えばポリプロピレン、パルプ等が挙げられる。皮膚からのSSLの採取手順のより詳細な例としては、あぶら取り紙、あぶら取りフィルム等のシート状素材へSSLを吸収させる方法、ガラス板、テープ等へSSLを接着させる方法、スパーテル、スクレイパー等によりSSLをこすり落として回収する方法、等が挙げられる。SSLの吸着性を向上させるため、脂溶性の高い溶媒を予め含ませたSSL吸収性素材を用いてもよい。一方、SSL吸収性素材は、水溶性の高い溶媒や水分を含んでいるとSSLの吸着が阻害されるため、水溶性の高い溶媒や水分の含有量が少ないことが好ましい。SSL吸収性素材は、乾燥した状態で用いることが好ましい。SSLが採取される皮膚の部位としては、特に限定されず、頭、顔、首、体幹、手足等の身体の任意の部位の皮膚が挙げられ、皮脂の分泌が多い部位、例えば顔の皮膚が好ましい。
被験者から採取されたRNA含有SSLは一定期間保存されてもよい。採取されたSSLは、含有するRNAの分解を極力抑えるために、採取後できるだけ速やかに低温条件で保存することが好ましい。本発明における該RNA含有SSLの保存の温度条件は、0℃以下であればよく、好ましくは−20±20℃〜−80±20℃、より好ましくは−20±10℃〜−80±10℃、さらに好ましくは−20±20℃〜−40±20℃、さらに好ましくは−20±10℃〜−40±10℃、さらに好ましくは−20±10℃、さらに好ましくは−20±5℃である。該RNA含有SSLの該低温条件での保存の期間は、特に限定されないが、好ましくは12か月以下、例えば6時間以上12ヶ月以下、より好ましくは6ヶ月以下、例えば1日間以上6ヶ月以下、さらに好ましくは3ヶ月以下、例えば3日間以上3ヶ月以下である。
本発明において、標的遺伝子又はその発現産物の発現レベルの測定対象としては、RNAから人工的に合成されたcDNA、そのRNAをエンコードするDNA、そのRNAにコードされるタンパク質、該タンパク質と相互作用をする分子、そのRNAと相互作用する分子、又はそのDNAと相互作用する分子等が挙げられる。ここで、RNA、DNA又はタンパク質と相互作用する分子としては、DNA、RNA、タンパク質、多糖、オリゴ糖、単糖、脂質、脂肪酸、及びこれらのリン酸化物、アルキル化物、糖付加物等、及び上記いずれかの複合体が挙げられる。また、発現レベルとは、当該遺伝子又は発現産物の発現量や活性を包括的に意味する。
本発明の方法においては、好ましい態様として、生体試料としてSSLが用いられるが、この場合にはSSLに含まれるRNAの発現レベルが解析され、具体的にはRNAを逆転写によりcDNAに変換した後、該cDNA又はその増幅産物が測定される。
SSLからのRNAの抽出には、生体試料からのRNAの抽出又は精製に通常使用される方法、例えば、フェノール/クロロホルム法、AGPC(acid guanidinium thiocyanate−phenol−chloroform extraction)法、又はTRIzol(登録商標)、RNeasy(登録商標)、QIAzol(登録商標)等のカラムを用いた方法、シリカをコーティングした特殊な磁性体粒子を用いる方法、Solid Phase Reversible Immobilization磁性体粒子を用いる方法、ISOGEN等の市販のRNA抽出試薬による抽出等を用いることができる。
SSLからのRNAの抽出には、生体試料からのRNAの抽出又は精製に通常使用される方法、例えば、フェノール/クロロホルム法、AGPC(acid guanidinium thiocyanate−phenol−chloroform extraction)法、又はTRIzol(登録商標)、RNeasy(登録商標)、QIAzol(登録商標)等のカラムを用いた方法、シリカをコーティングした特殊な磁性体粒子を用いる方法、Solid Phase Reversible Immobilization磁性体粒子を用いる方法、ISOGEN等の市販のRNA抽出試薬による抽出等を用いることができる。
該逆転写には、解析したい特定のRNAを標的としたプライマーを用いてもよいが、より包括的な核酸の保存及び解析のためにはランダムプライマーを用いることが好ましい。該逆転写には、一般的な逆転写酵素又は逆転写試薬キットを使用することができる。好適には、正確性及び効率性の高い逆転写酵素又は逆転写試薬キットが用いられ、その例としては、M−MLV Reverse Transcriptase及びその改変体、あるいは市販の逆転写酵素又は逆転写試薬キット、例えばPrimeScript(登録商標)Reverse Transcriptaseシリーズ(タカラバイオ社)、SuperScript(登録商標)Reverse Transcriptaseシリーズ(Thermo Scientific社)等が挙げられる。SuperScript(登録商標)III Reverse Transcriptase、SuperScript(登録商標)VILO cDNA Synthesis kit(いずれもThermo Scientific社)等が好ましく用いられる。
該逆転写における伸長反応は、温度を好ましくは42℃±1℃、より好ましくは42℃±0.5℃、さらに好ましくは42℃±0.25℃に調整し、一方、反応時間を好ましくは60分間以上、より好ましくは80〜120分間に調整するのが好ましい。
該逆転写における伸長反応は、温度を好ましくは42℃±1℃、より好ましくは42℃±0.5℃、さらに好ましくは42℃±0.25℃に調整し、一方、反応時間を好ましくは60分間以上、より好ましくは80〜120分間に調整するのが好ましい。
発現レベルを測定する方法は、RNA、cDNA又はDNAを対象とする場合、これらにハイブリダイズするDNAをプライマーとしたPCR法、リアルタイムRT−PCR法、マルチプレックスPCR、SmartAmp法、LAMP法等に代表される核酸増幅法、これらにハイブリダイズする核酸をプローブとして用いるハイブリダイゼーション法(DNAチップ、DNAマイクロアレイ、ドットブロットハイブリダイゼーション、スロットブロットハイブリダイゼーション、ノーザンブロットハイブリダイゼーション等)、塩基配列を決定する方法(シーケンシング)、又はこれらを組み合わせた方法から選ぶことができる。
PCRでは、解析したい特定のDNAを標的としたプライマーペアを用いて該特定のDNAのみを増幅してもよいが、複数のプライマーペアを用いて複数のDNAを増幅してもよい。好ましくは、該PCRはマルチプレックスPCRである。マルチプレックスPCRは、PCR反応系に複数のプライマー対を同時に使用することで、複数の遺伝子領域を同時に増幅する方法である。マルチプレックスPCRは、市販のキット(例えば、Ion AmpliSeqTranscriptome Human Gene Expression Kit;ライフテクノロジーズジャパン株式会社等)を用いて実施することができる。
該PCRにおけるアニーリング及び伸長反応の温度は、使用するプライマーに依存するため一概には言えないが、上記のマルチプレックスPCRキットは用いる場合、好ましくは62℃±1℃、より好ましくは62℃±0.5℃、さらに好ましくは62℃±0.25℃である。したがって、該PCRでは、好ましくはアニーリング及び伸長反応が1ステップで行われる。該アニーリング及び伸長反応のステップの時間は、増幅すべきDNAのサイズ等に依存して調整され得るが、好ましくは14〜18分間である。該PCRにおける変性反応の条件は、増幅すべきDNAに依存して調整され得るが、好ましくは95〜99℃で10〜60秒間である。上記のような温度及び時間での逆転写及びPCRは、一般的にPCRに使用されるサーマルサイクラーを用いて実行することができる。
該PCRにおけるアニーリング及び伸長反応の温度は、使用するプライマーに依存するため一概には言えないが、上記のマルチプレックスPCRキットは用いる場合、好ましくは62℃±1℃、より好ましくは62℃±0.5℃、さらに好ましくは62℃±0.25℃である。したがって、該PCRでは、好ましくはアニーリング及び伸長反応が1ステップで行われる。該アニーリング及び伸長反応のステップの時間は、増幅すべきDNAのサイズ等に依存して調整され得るが、好ましくは14〜18分間である。該PCRにおける変性反応の条件は、増幅すべきDNAに依存して調整され得るが、好ましくは95〜99℃で10〜60秒間である。上記のような温度及び時間での逆転写及びPCRは、一般的にPCRに使用されるサーマルサイクラーを用いて実行することができる。
当該PCRで得られた反応産物の精製は、反応産物のサイズ分離によって行われることが好ましい。サイズ分離により、目的のPCR反応産物を、PCR反応液中に含まれるプライマーやその他の不純物から分離することができる。DNAのサイズ分離は、例えば、サイズ分離カラムや、サイズ分離チップ、サイズ分離に利用可能な磁気ビーズ等によって行うことができる。サイズ分離に利用可能な磁気ビーズの好ましい例としては、Ampure XP等のSolid Phase Reversible Immobilization(SPRI)磁性ビーズが挙げられる。
精製したPCR反応産物に対して、その後の定量解析を行うために必要なさらなる処理を施してもよい。例えば、DNAのシーケンシングのために、精製したPCR反応産物を、適切なバッファー溶液へと調製したり、PCR増幅されたDNAに含まれるPCRプライマー領域を切断したり、増幅されたDNAにアダプター配列をさらに付加したりしてもよい。例えば、精製したPCR反応産物をバッファー溶液へと調製し、増幅DNAに対してPCRプライマー配列の除去及びアダプターライゲーションを行い、得られた反応産物を、必要に応じて増幅して、定量解析のためのライブラリーを調製することができる。これらの操作は、例えば、SuperScript(登録商標)VILO cDNA Synthesis kit(ライフテクノロジーズジャパン株式会社)に付属している5×VILO RT Reaction Mix、及びIon AmpliSeq Transcriptome Human Gene Expression Kit(ライフテクノロジーズジャパン株式会社)に付属している5×Ion AmpliSeq HiFi Mix、及びIon AmpliSeq Transcriptome Human Gene Expression Core Panelを用いて、各キット付属のプロトコルに従って行うことができる。
ノーザンブロットハイブリダイゼーション法を利用して標的遺伝子又はそれに由来する核酸の発現量を測定する場合は、例えば、まずプローブDNAを放射性同位元素、蛍光物質等で標識し、次いで、得られた標識DNAを、常法に従ってナイロンメンブレン等にトランスファーした生体試料由来のRNAとハイブリダイズさせる。その後、形成された標識DNAとRNAとの二重鎖を、標識物に由来するシグナルを検出することにより測定する方法が挙げられる。
RT−PCR法を用いて標的遺伝子又はそれに由来する核酸の発現量を測定する場合は、例えば、まず生体試料由来のRNAから常法に従ってcDNAを調製し、これを鋳型として本発明の標的遺伝子が増幅できるように調製した一対のプライマー(上記cDNA(−鎖)に結合する正鎖、+鎖に結合する逆鎖)をこれとハイブリダイズさせる。その後、常法に従ってPCR法を行い、得られた増幅二本鎖DNAを検出する。増幅された二本鎖DNAの検出には、予めRI、蛍光物質等で標識しておいたプライマーを用いて上記PCRを行うことによって産生される標識二本鎖DNAを検出する方法等を用いることができる。
DNAマイクロアレイを用いて標的遺伝子又はそれに由来する核酸の発現量を測定する場合は、例えば、支持体に本発明の標的遺伝子由来の核酸(cDNA又はDNA)の少なくとも1種を固定化したアレイを用い、mRNAから調製した標識化cDNA又はcRNAをマイクロアレイ上に結合させ、マイクロアレイ上の標識を検出することによって、mRNAの発現量を測定することができる。
前記アレイに固定化される核酸としては、ストリンジェントな条件下に特異的(すなわち、実質的に目的の核酸のみに)にハイブリダイズする核酸であればよく、例えば、本発明の標的遺伝子の全配列を有する核酸であってもよく、部分配列からなる核酸であってもよい。ここで、「部分配列」とは、少なくとも15〜25塩基からなる核酸が挙げられる。ここでストリンジェントな条件は、通常「1×SSC、0.1%SDS、37℃」程度の洗浄条件を挙げることができ、より厳しいハイブリダイズ条件としては「0.5×SSC、0.1%SDS、42℃」程度、さらに厳しいハイブリダイズ条件としては「0.1×SSC、0.1%SDS、65℃」程度の条件を挙げることができる。ハイブリダイズ条件は、J. Sambrook et al., Molecular Cloning: A Laboratory Manual, Thrd Edition, Cold Spring Harbor Laboratory Press (2001)等に記載されている。
前記アレイに固定化される核酸としては、ストリンジェントな条件下に特異的(すなわち、実質的に目的の核酸のみに)にハイブリダイズする核酸であればよく、例えば、本発明の標的遺伝子の全配列を有する核酸であってもよく、部分配列からなる核酸であってもよい。ここで、「部分配列」とは、少なくとも15〜25塩基からなる核酸が挙げられる。ここでストリンジェントな条件は、通常「1×SSC、0.1%SDS、37℃」程度の洗浄条件を挙げることができ、より厳しいハイブリダイズ条件としては「0.5×SSC、0.1%SDS、42℃」程度、さらに厳しいハイブリダイズ条件としては「0.1×SSC、0.1%SDS、65℃」程度の条件を挙げることができる。ハイブリダイズ条件は、J. Sambrook et al., Molecular Cloning: A Laboratory Manual, Thrd Edition, Cold Spring Harbor Laboratory Press (2001)等に記載されている。
シーケンシングによって標的遺伝子又はそれに由来する核酸の発現量を測定する場合は、例えば、次世代シーケンサー(例えばIon S5/XLシステム、ライフテクノロジーズジャパン株式会社)が用いて解析することが挙げられる。シーケンシングで作成されたリードの数(リードカウント)に基づいて、RNA発現を定量することができる。
上記の測定に用いられるプローブ又はプライマー、すなわち、本発明の標的遺伝子又はそれに由来する核酸を特異的に認識し増幅するためのプライマー、又は該RNA又はそれに由来する核酸を特異的に検出するためのプローブがこれに該当するが、これらは、当該標的遺伝子を構成する塩基配列に基づいて設計することができる。ここで「特異的に認識する」とは、例えばノーザンブロット法において、実質的に本発明の標的遺伝子又はそれに由来する核酸のみを検出できること、また例えばRT−PCR法において、実質的に当該核酸のみが増幅される如く、当該検出物又は生成物が当該遺伝子又はそれに由来する核酸であると判断できることを意味する。
具体的には、本発明の標的遺伝子を構成する塩基配列からなるDNA又はその相補鎖に相補的な一定数のヌクレオチドを含むオリゴヌクレオチドを利用することができる。ここで「相補鎖」とは、A:T(RNAの場合はU)、G:Cの塩基対からなる2本鎖DNAの一方の鎖に対する他方の鎖を指す。また、「相補的」とは、当該一定数の連続したヌクレオチド領域で完全に相補配列である場合に限られず、好ましくは80%以上、より好ましくは90%以上、さらに好ましくは95%以上の塩基配列上の同一性を有すればよい。塩基配列の同一性は、前記BLAST等のアルゴリズムにより決定することができる。
斯かるオリゴヌクレオチドは、プライマーとして用いる場合には、特異的なアニーリング及び鎖伸長ができればよく、通常、例えば10塩基以上、好ましくは15塩基以上、より好ましくは20塩基以上、かつ例えば100塩基以下、好ましくは50塩基以下、より好ましくは35塩基以下の鎖長を有するものが挙げられる。また、プローブとして用いる場合には、特異的なハイブリダイゼーションができればよく、本発明の標的遺伝子を構成する塩基配列からなるDNA(又はその相補鎖)の少なくとも一部若しくは全部の配列を有し、例えば10塩基以上、好ましくは15塩基以上、かつ例えば100塩基以下、好ましくは50塩基以下、より好ましくは25塩基以下の鎖長のものが用いられる。
なお、ここで、「オリゴヌクレオチド」は、DNAあるいはRNAであることができ、合成されたものでも天然のものでもよい。又はイブリダイゼーションに用いるプローブは、通常標識したものが用いられる。
具体的には、本発明の標的遺伝子を構成する塩基配列からなるDNA又はその相補鎖に相補的な一定数のヌクレオチドを含むオリゴヌクレオチドを利用することができる。ここで「相補鎖」とは、A:T(RNAの場合はU)、G:Cの塩基対からなる2本鎖DNAの一方の鎖に対する他方の鎖を指す。また、「相補的」とは、当該一定数の連続したヌクレオチド領域で完全に相補配列である場合に限られず、好ましくは80%以上、より好ましくは90%以上、さらに好ましくは95%以上の塩基配列上の同一性を有すればよい。塩基配列の同一性は、前記BLAST等のアルゴリズムにより決定することができる。
斯かるオリゴヌクレオチドは、プライマーとして用いる場合には、特異的なアニーリング及び鎖伸長ができればよく、通常、例えば10塩基以上、好ましくは15塩基以上、より好ましくは20塩基以上、かつ例えば100塩基以下、好ましくは50塩基以下、より好ましくは35塩基以下の鎖長を有するものが挙げられる。また、プローブとして用いる場合には、特異的なハイブリダイゼーションができればよく、本発明の標的遺伝子を構成する塩基配列からなるDNA(又はその相補鎖)の少なくとも一部若しくは全部の配列を有し、例えば10塩基以上、好ましくは15塩基以上、かつ例えば100塩基以下、好ましくは50塩基以下、より好ましくは25塩基以下の鎖長のものが用いられる。
なお、ここで、「オリゴヌクレオチド」は、DNAあるいはRNAであることができ、合成されたものでも天然のものでもよい。又はイブリダイゼーションに用いるプローブは、通常標識したものが用いられる。
また、本発明の標的遺伝子の翻訳産物(タンパク質)、当該タンパク質と相互作用する分子、RNAと相互作用する分子、又はDNAと相互作用する分子を測定する場合は、プロテインチップ解析、免疫測定法(例えば、ELISA等)、質量分析(例えば、LC−MS/MS、MALDI−TOF/MS)、1−ハイブリッド法(PNAS 100, 12271-12276(2003))や2−ハイブリッド法(Biol. Reprod. 58, 302-311 (1998))のような方法を用いることができ、対象に応じて適宜選択できる。
例えば、測定対象としてタンパク質が用いられる場合は、本発明の発現産物に対する抗体を生体試料と接触させ、当該抗体に結合した試料中のポリペプチドを検出し、そのレベルを測定することによって実施される。例えば、ウェスタンブロット法によれば、一次抗体として上記の抗体を用いた後、二次抗体として放射性同位元素、蛍光物質又は酵素等で標識した一次抗体に結合する抗体を用いて、その一次抗体を標識し、これら標識物質由来のシグナルを放射線測定器、蛍光検出器等で測定することが行われる。
尚、上記翻訳産物に対する抗体は、ポリクローナル抗体であっても、モノクローナル抗体であってもよい。これらの抗体は、公知の方法に従って製造することができる。具体的には、ポリクローナル抗体は、常法に従って大腸菌等で発現し精製したタンパク質を用いて、あるいは常法に従って当該タンパク質の部分ポリペプチドを合成して、家兎等の非ヒト動物に免疫し、該免疫動物の血清から常法に従って得ることが可能である。
一方、モノクローナル抗体は、常法に従って大腸菌等で発現し精製したタンパク質又は該タンパク質の部分ポリペプチドをマウス等の非ヒト動物に免疫し、得られた脾臓細胞と骨髄腫細胞とを細胞融合させて調製したハイブリドーマ細胞から得ることができる。また、モノクローナル抗体は、ファージディスプレイを用いて作製してもよい(Griffiths, A.D.; Duncan, A.R., Current Opinion in Biotechnology, Volume 9, Number 1, February 1998 , pp. 102-108(7))。
例えば、測定対象としてタンパク質が用いられる場合は、本発明の発現産物に対する抗体を生体試料と接触させ、当該抗体に結合した試料中のポリペプチドを検出し、そのレベルを測定することによって実施される。例えば、ウェスタンブロット法によれば、一次抗体として上記の抗体を用いた後、二次抗体として放射性同位元素、蛍光物質又は酵素等で標識した一次抗体に結合する抗体を用いて、その一次抗体を標識し、これら標識物質由来のシグナルを放射線測定器、蛍光検出器等で測定することが行われる。
尚、上記翻訳産物に対する抗体は、ポリクローナル抗体であっても、モノクローナル抗体であってもよい。これらの抗体は、公知の方法に従って製造することができる。具体的には、ポリクローナル抗体は、常法に従って大腸菌等で発現し精製したタンパク質を用いて、あるいは常法に従って当該タンパク質の部分ポリペプチドを合成して、家兎等の非ヒト動物に免疫し、該免疫動物の血清から常法に従って得ることが可能である。
一方、モノクローナル抗体は、常法に従って大腸菌等で発現し精製したタンパク質又は該タンパク質の部分ポリペプチドをマウス等の非ヒト動物に免疫し、得られた脾臓細胞と骨髄腫細胞とを細胞融合させて調製したハイブリドーマ細胞から得ることができる。また、モノクローナル抗体は、ファージディスプレイを用いて作製してもよい(Griffiths, A.D.; Duncan, A.R., Current Opinion in Biotechnology, Volume 9, Number 1, February 1998 , pp. 102-108(7))。
斯くして、被験者から採取された生体試料中の本発明の標的遺伝子又はその発現産物の発現レベルが測定され、当該発現レベルに基づいてパーキンソン病が検出される。検出は、具体的には、測定された本発明の標的遺伝子又はその発現産物の発現レベルを対照レベルと比較することによって行われる。
シーケンシングにより複数の標的遺伝子の発現レベルの解析を行う場合は、上記したように、発現量のデータであるリードカウント値、該リードカウント値をサンプル間の総リード数の違いを補正したRPM値、当該RPM値を底2の対数値に変換した値(Log2RPM値)、あるいはDESeq2を用いて補正されたカウント値(Normalized count値)又は整数1を加算した底2の対数値(Log2(count+1)値)を指標として用いるのが好ましい。また、RNA−seqの定量値として一般的な、fragments per kilobase of exon per million reads mapped (FPKM)、reads per kilobase of exon per million reads mapped (RPKM)、transcripts per million (TPM)などによって算出される値であってもよい。また、マイクロアレイ法によって得られるシグナル値、及びその補正値であってもよい。また、RT−PCRなどにより特定の標的遺伝子のみの解析を行う場合には、対象遺伝子の発現量をハウスキーピング遺伝子の発現量を基準とする相対的な発現量に変換して解析する方法、又は標的遺伝子の領域を含むプラスミドを用いた絶対定量によって得られるコピー数を解析する方法が好ましい。デジタルPCR法によって得られるコピー数であってもよい。
ここで、「対照レベル」とは、例えば、健常人における当該標的遺伝子又はその発現産物の発現レベルが挙げられる。健常人の発現レベルは、健常人集団から測定した当該遺伝子又はその発現産物の発現レベルの統計値(例えば平均値等)であってもよい。標的遺伝子が複数の場合は、各々の遺伝子又はその発現産物について基準発現レベルを求めることが好ましい。
シーケンシングにより複数の標的遺伝子の発現レベルの解析を行う場合は、上記したように、発現量のデータであるリードカウント値、該リードカウント値をサンプル間の総リード数の違いを補正したRPM値、当該RPM値を底2の対数値に変換した値(Log2RPM値)、あるいはDESeq2を用いて補正されたカウント値(Normalized count値)又は整数1を加算した底2の対数値(Log2(count+1)値)を指標として用いるのが好ましい。また、RNA−seqの定量値として一般的な、fragments per kilobase of exon per million reads mapped (FPKM)、reads per kilobase of exon per million reads mapped (RPKM)、transcripts per million (TPM)などによって算出される値であってもよい。また、マイクロアレイ法によって得られるシグナル値、及びその補正値であってもよい。また、RT−PCRなどにより特定の標的遺伝子のみの解析を行う場合には、対象遺伝子の発現量をハウスキーピング遺伝子の発現量を基準とする相対的な発現量に変換して解析する方法、又は標的遺伝子の領域を含むプラスミドを用いた絶対定量によって得られるコピー数を解析する方法が好ましい。デジタルPCR法によって得られるコピー数であってもよい。
ここで、「対照レベル」とは、例えば、健常人における当該標的遺伝子又はその発現産物の発現レベルが挙げられる。健常人の発現レベルは、健常人集団から測定した当該遺伝子又はその発現産物の発現レベルの統計値(例えば平均値等)であってもよい。標的遺伝子が複数の場合は、各々の遺伝子又はその発現産物について基準発現レベルを求めることが好ましい。
また、本発明におけるパーキンソン病の検出は、本発明の標的遺伝子又はその発現産物の発現レベルの上昇/減少により行うこともできる。この場合は、被験者由来の生体試料における標的遺伝子又はその発現産物の発現レベルが、各遺伝子又はその発現産物のカットオフ値(参照値)と比較される。カットオフ値は、予め健常者における当該標的遺伝子又はその発現産物の発現レベルを基準データとして取得しておき、それに基づく発現レベルの平均値や標準偏差等の統計的数値に基づき、適宜決定すれば良い。
さらに、パーキンソン病患者由来の標的遺伝子又はその発現産物の発現レベルと、健常人由来の標的遺伝子又はその発現産物の発現レベルの測定値を利用して、パーキンソン病患者と健常人とを分ける判別式(予測モデル)を構築し、当該判別式を利用して、パーキンソン病を検出することができる。すなわち、パーキンソン病患者由来の標的遺伝子又はその発現産物の発現レベルと、健常者由来の標的遺伝子又はその発現産物の発現レベルの測定値を教師サンプルとして、パーキンソン病患者と健常人を分ける判別式(予測モデル)を構築し、当該判別式に基づいてパーキンソン病患者と健常人を判別するカットオフ値(参照値)を求める。なお、判別式の作成においては、主成分分析(PCA)により次元圧縮を行ない、主要成分を説明変数とすることができる。
そして、被験者から採取された生体試料から標的遺伝子又はその発現産物のレベルを同様に測定し、得られた測定値を当該判別式に代入し、当該判別式から得られた結果を参照値と比較することによって、被検者におけるパーキンソン病の存在又は不存在を評価できる。
そして、被験者から採取された生体試料から標的遺伝子又はその発現産物のレベルを同様に測定し、得られた測定値を当該判別式に代入し、当該判別式から得られた結果を参照値と比較することによって、被検者におけるパーキンソン病の存在又は不存在を評価できる。
ここで、判別式の構築におけるアルゴリズムは、機械学習に用いるアルゴリズムなどの公知のものを利用することができる。機械学習アルゴリズムの例としては、ランダムフォレスト(Random forest)、線形カーネルのサポートベクターマシン(SVM linear)、rbfカーネルのサポートベクターマシン(SVM rbf)、ニューラルネットワーク(Nerural net)、一般線形モデル(Generalized linear model)、正則化線形判別分析(Regularized linear discriminant analysis)、正則化ロジスティック回帰(Regularized logistic regression)などが挙げられる。構築した予測モデルに検証用のデータを入力して予測値を算出し、該予測値が実測値と最も適合するモデル、例えば予測値と実測値から検出率(Recall)、精度(Precision)、及びそれらの調和平均であるF値を計算し、そのF値が最も大きいモデルを最適な予測モデルとして選抜することができる。
カットオフ値(参照値)の決定方法は特に制限されず、公知の手法に従って決定することができる。例えば、判別式を使用して作成されたROC(Receiver Operating Characteristic Curve)曲線より求めることができる。ROC曲線では、縦軸に陽性患者において陽性の結果がでる確率(感度)と、横軸に陰性患者において陰性の結果がでる確率(特異度)を1から減算した値(偽陽性率)がプロットされる。ROC曲線に示される「真陽性(感度)」及び「偽陽性(1−特異度)」に関し、「真陽性(感度)」−「偽陽性(1−特異度)」が最大となる値(Youden index)をカットオフ値(参照値)とすることができる。
後述する実施例に示すとおり、表Aに示す標的遺伝子(33種の遺伝子、又はそれから選択された4種の遺伝子)の発現量データ(Log2RPM値)から得た各主成分の値を説明変数とし、健常者とパーキンソン病患者を目的変数として機械学習アルゴリズムを用いて予測モデルを構築したところ、SNORA16A、SNORA24、SNORA50、REXO1L2Pの4種を用いたモデルでパーキンソン病の予測が可能であることが示された。また、33種を用いたモデルではより高精度なパーキンソン病の予測が可能であることが示された。
したがって、上記パーキンソン病患者群と健常人群とを分ける判別式を作成する場合に、標的遺伝子としてSNORA16A、SNORA24、SNORA50及びREXO1L2Pの4種の標的遺伝子に加えて、表Aに示すそれ以外の29遺伝子から選ばれる少なくとも1つの遺伝子又はその発現産物の発現データを適宜加えること、好ましくは後出の表8に示された変数重要度に基づき、変数重要度が高い遺伝子を適当数加えることにより、高い検出率及び精度を示す判別式が作成でき、より精度の高いパーキンソン病の検出が可能である。具体的には、EGR2、RHOA、CCNI、RNASEK、CSF2RB、SERP1、ANKRD12、SLC25A3の8種が好ましく、さらにCD83、CXCR4、ITGAX、UQCRHの4種を加えた12種が好ましく、さらにKCNQ1OT1、CCL3、C10orf116、SERPINB4、LCE3D、CNFNの6種を加えた18種が好ましく、さらには29種全てを加えるのが好ましい。
あるいは、標的遺伝子としてSNORA16A、SNORA24、SNORA50及びREXO1L2Pの4種の標的遺伝子に加えて、前出の表Aと表Bの両方に発現変動遺伝子として示されている、下記表Cに示す11遺伝子から選ばれるSNORA24以外の少なくとも1つの遺伝子又はその発現産物の発現データを適宜加えることも可能である。
さらに、パーキンソン病患者群と健常人群とを分ける判別式を作成する場合用いる標的遺伝子として、表Bに示す遺伝子から選ばれる少なくとも1つの遺伝子又はその発現産物の発現データを使用することも可能であり、好ましくはSNORA24を含み、それ以外から少なくとも1つを使用することが好ましく、より好ましくは、表Cに示す遺伝子又はその発現産物の発現データを使用し、さらに好ましくは表Bに示す全ての遺伝子又はその発現産物の発現データを使用する。
本発明のパーキンソン病を検出するための検査用キットは、患者から分離した生体試料における本発明の標的遺伝子又はその発現産物の発現レベルを測定するための検査試薬を含有するものである。具体的には、本発明の標的遺伝子又はそれに由来する核酸と特異的に結合(ハイブリダイズ)するオリゴヌクレオチド(例えば、PCR用のプライマー)を含む、核酸増幅、ハイブリダイゼーションのための試薬、或いは、本発明の標的遺伝子の発現産物(タンパク質)を認識する抗体を含む免疫学的測定のための試薬等が挙げられる。当該キットに包含されるオリゴヌクレオチド、抗体等は、上述したとおり公知の方法により得ることができる。
また、当該検査用キットには、上記抗体や核酸の他、標識試薬、緩衝液、発色基質、二次抗体、ブロッキング剤や、試験に必要な器具やコントロール、生体試料を採取するための用具(例えば、SSLを採取するための脂取りフィルムなど)等を含むことができる。
また、当該検査用キットには、上記抗体や核酸の他、標識試薬、緩衝液、発色基質、二次抗体、ブロッキング剤や、試験に必要な器具やコントロール、生体試料を採取するための用具(例えば、SSLを採取するための脂取りフィルムなど)等を含むことができる。
本発明の態様及び好ましい実施態様を以下に示す。
<1>被験者から採取された生体試料について、SNORA16A、SNORA24、SNORA50及びREXO1L2Pからなる4種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む、当該被験者におけるパーキンソン病の検出方法。
<2>SNORA24遺伝子又はその発現産物の発現レベルの測定を少なくとも含む、<1>のパーキンソン病の検出方法。
<3>遺伝子又はその発現産物の発現レベルがmRNAの発現量の測定である、<1>又は<2>の方法。
<4>遺伝子又はその発現産物が前記被験者の皮膚表上脂質に含まれるRNAである、<1>〜<3>のいずれかの方法。
<5>発現レベルの測定値を前記各遺伝子又はその発現産物の参照値と比較し、パーキンソン病の存在又は不存在を評価する、<1>〜<4>のいずれかの方法。
<6>パーキンソン病患者由来の前記遺伝子又はその発現産物の発現レベルと、健常者由来の同遺伝子又はその発現産物の発現レベルの測定値を教師サンプルとして、パーキンソン病患者と健常人を分ける判別式を作成し、被験者から採取された生体試料から得られた同遺伝子又はその発現産物の発現レベルの測定値を当該判別式に代入し、得られた結果を参照値と比較することによって、被検者におけるパーキンソン病の存在又は不存在を評価する、<1>〜<4>のいずれかの方法。
<7>前記4種の遺伝子群の全ての遺伝子又はその発現産物の発現レベルが測定される、<6>の方法。
<8>前記4種の遺伝子群より選択される少なくとも1つの遺伝子の他に、下記の29種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルが測定される、<6>又は<7>の方法、
ANKRD12、C10orf116、CCL3、CCNI、CD83、CNFN、CNN2、CSF2RB、CXCR4、EGR2、EMP1、ITGAX、KCNQ1OT1、LCE3D、LITAF、NDUFA4L2、NDUFS5、POLR2L、RHOA、RNASEK、RPL7A、RPS26、SERINC1、SERP1、SERPINB4、SLC25A3、SNRPG、SRRM2、UQCRH。
<9>前記4種の遺伝子群より選択される少なくとも1つの遺伝子の他に、下記の10種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルが測定される、<8>の方法、
CCL3、CCNI、CXCR4、EGR2、EMP1、POLR2L、RHOA、RNASEK、SERINC1、SERPINB4。
<10>前記4種の遺伝子群より選択される少なくとも1つの遺伝子の他に、下記の16種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルが測定される、<6>又は<7>の方法、
ANXA1、AQP3、ATP6V0C、BHLHE40、CCL3、CCNI、CXCR4、EGR2、EMP1、GABARAPL1、KRT16、POLR2L、RHOA、RNASEK、SERINC1、SERPINB4。
<11>前記4種の遺伝子群より選択される少なくとも1つの遺伝子の他に、後記表3−1〜3−4及び後記表6−1〜6−2に示される遺伝子群より選択される少なくとも1つの遺伝子(但し、前記4種の遺伝子を除く。)又はその発現産物の発現レベルが測定される、<6>又は<7>の方法。
<12>前記4種の遺伝子群より選択される少なくとも1つの遺伝子の他に、後記表1−1〜1−27で示される1005種及び後記表4−1〜4−20で示される725種のうち前記4種の遺伝子を除いた遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルが測定される、<6>又は<7>の方法。
<13>前記遺伝子又はそれに由来する核酸と特異的にハイブリダイズするオリゴヌクレオチド、又は前記遺伝子の発現産物を認識する抗体を含有する、<1>〜<10>のいずれかの方法に用いられるパーキンソン病を検出するための検査用キット。
<14>後記表3−1〜3−4及び後記表6−1〜6−2に示される遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の、パーキンソン病の検出マーカーとしての使用。
<15>SNORA16A、SNORA24、SNORA50及びREXO1L2Pからなる4種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の、パーキンソン病の検出マーカーとしての使用。
<16>後記表3−1〜3−4及び後記表6−1〜6−2に示される遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物からなる、パーキンソン病の検出マーカー。
<17>SNORA16A、SNORA24、SNORA50及びREXO1L2Pからなる4種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物からなる、<16>のパーキンソン病の検出マーカー。
<1>被験者から採取された生体試料について、SNORA16A、SNORA24、SNORA50及びREXO1L2Pからなる4種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む、当該被験者におけるパーキンソン病の検出方法。
<2>SNORA24遺伝子又はその発現産物の発現レベルの測定を少なくとも含む、<1>のパーキンソン病の検出方法。
<3>遺伝子又はその発現産物の発現レベルがmRNAの発現量の測定である、<1>又は<2>の方法。
<4>遺伝子又はその発現産物が前記被験者の皮膚表上脂質に含まれるRNAである、<1>〜<3>のいずれかの方法。
<5>発現レベルの測定値を前記各遺伝子又はその発現産物の参照値と比較し、パーキンソン病の存在又は不存在を評価する、<1>〜<4>のいずれかの方法。
<6>パーキンソン病患者由来の前記遺伝子又はその発現産物の発現レベルと、健常者由来の同遺伝子又はその発現産物の発現レベルの測定値を教師サンプルとして、パーキンソン病患者と健常人を分ける判別式を作成し、被験者から採取された生体試料から得られた同遺伝子又はその発現産物の発現レベルの測定値を当該判別式に代入し、得られた結果を参照値と比較することによって、被検者におけるパーキンソン病の存在又は不存在を評価する、<1>〜<4>のいずれかの方法。
<7>前記4種の遺伝子群の全ての遺伝子又はその発現産物の発現レベルが測定される、<6>の方法。
<8>前記4種の遺伝子群より選択される少なくとも1つの遺伝子の他に、下記の29種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルが測定される、<6>又は<7>の方法、
ANKRD12、C10orf116、CCL3、CCNI、CD83、CNFN、CNN2、CSF2RB、CXCR4、EGR2、EMP1、ITGAX、KCNQ1OT1、LCE3D、LITAF、NDUFA4L2、NDUFS5、POLR2L、RHOA、RNASEK、RPL7A、RPS26、SERINC1、SERP1、SERPINB4、SLC25A3、SNRPG、SRRM2、UQCRH。
<9>前記4種の遺伝子群より選択される少なくとも1つの遺伝子の他に、下記の10種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルが測定される、<8>の方法、
CCL3、CCNI、CXCR4、EGR2、EMP1、POLR2L、RHOA、RNASEK、SERINC1、SERPINB4。
<10>前記4種の遺伝子群より選択される少なくとも1つの遺伝子の他に、下記の16種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルが測定される、<6>又は<7>の方法、
ANXA1、AQP3、ATP6V0C、BHLHE40、CCL3、CCNI、CXCR4、EGR2、EMP1、GABARAPL1、KRT16、POLR2L、RHOA、RNASEK、SERINC1、SERPINB4。
<11>前記4種の遺伝子群より選択される少なくとも1つの遺伝子の他に、後記表3−1〜3−4及び後記表6−1〜6−2に示される遺伝子群より選択される少なくとも1つの遺伝子(但し、前記4種の遺伝子を除く。)又はその発現産物の発現レベルが測定される、<6>又は<7>の方法。
<12>前記4種の遺伝子群より選択される少なくとも1つの遺伝子の他に、後記表1−1〜1−27で示される1005種及び後記表4−1〜4−20で示される725種のうち前記4種の遺伝子を除いた遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルが測定される、<6>又は<7>の方法。
<13>前記遺伝子又はそれに由来する核酸と特異的にハイブリダイズするオリゴヌクレオチド、又は前記遺伝子の発現産物を認識する抗体を含有する、<1>〜<10>のいずれかの方法に用いられるパーキンソン病を検出するための検査用キット。
<14>後記表3−1〜3−4及び後記表6−1〜6−2に示される遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の、パーキンソン病の検出マーカーとしての使用。
<15>SNORA16A、SNORA24、SNORA50及びREXO1L2Pからなる4種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の、パーキンソン病の検出マーカーとしての使用。
<16>後記表3−1〜3−4及び後記表6−1〜6−2に示される遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物からなる、パーキンソン病の検出マーカー。
<17>SNORA16A、SNORA24、SNORA50及びREXO1L2Pからなる4種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物からなる、<16>のパーキンソン病の検出マーカー。
以下、実施例に基づき本発明をさらに詳細に説明するが、本発明はこれに限定されるものではない。
実施例1 SSLから抽出されたRNAを用いたパーキンソン病の検出
1)SSL採取
試験は以下の試験1及び試験2の2回行った。
試験1:健常者(40〜89歳男女)15名、及びパーキンソン病患者(PD)(40〜89歳男女)15名を被験者とした。
試験2:健常者(40〜89歳男)50名、及びPD(40〜89歳男)50名を被験者とした。
PDは、予め脳神経内科医によりパーキンソン病(Hoehn&YahrステージI又はII)の診断を受けていた。各被験者の全顔からあぶら取りフィルム(5×8cm、ポリプロピレン製、3M社)を用いて皮脂を回収後、該あぶら取りフィルムをバイアルに移し、RNA抽出に使用するまで−80℃で、約1ヶ月間保存した。
1)SSL採取
試験は以下の試験1及び試験2の2回行った。
試験1:健常者(40〜89歳男女)15名、及びパーキンソン病患者(PD)(40〜89歳男女)15名を被験者とした。
試験2:健常者(40〜89歳男)50名、及びPD(40〜89歳男)50名を被験者とした。
PDは、予め脳神経内科医によりパーキンソン病(Hoehn&YahrステージI又はII)の診断を受けていた。各被験者の全顔からあぶら取りフィルム(5×8cm、ポリプロピレン製、3M社)を用いて皮脂を回収後、該あぶら取りフィルムをバイアルに移し、RNA抽出に使用するまで−80℃で、約1ヶ月間保存した。
2)RNA調製及びシーケンシング
上記1)のあぶら取りフィルムを適当な大きさに切断し、QIAzol Lysis Reagent(Qiagen)を用いて、付属のプロトコルに準じてRNAを抽出した。抽出されたRNAを元に、SuperScript VILO cDNA Synthesis kit(ライフテクノロジーズジャパン株式会社)を用いて42℃、90分間逆転写を行いcDNAの合成を行った。逆転写反応のプライマーには、キットに付属しているランダムプライマーを使用した。得られたcDNAから、マルチプレックスPCRにより20802遺伝子に由来するDNAを含むライブラリーを調製した。マルチプレックスPCRは、Ion AmpliSeqTranscriptome Human Gene Expression Kit(ライフテクノロジーズジャパン株式会社)を用いて、[99℃、2分→(99℃、15秒→62℃、16分)×20サイクル→4℃、Hold]の条件で行った。得られたPCR産物は、Ampure XP(ベックマン・コールター株式会社)で精製した後に、バッファーの再構成、プライマー配列の消化、アダプターライゲーションと精製、増幅を行い、ライブラリーを調製した。調製したライブラリーをIon 540 Chipにローディングし、Ion S5/XLシステム(ライフテクノロジーズジャパン株式会社)を用いてシーケンシングした。
上記1)のあぶら取りフィルムを適当な大きさに切断し、QIAzol Lysis Reagent(Qiagen)を用いて、付属のプロトコルに準じてRNAを抽出した。抽出されたRNAを元に、SuperScript VILO cDNA Synthesis kit(ライフテクノロジーズジャパン株式会社)を用いて42℃、90分間逆転写を行いcDNAの合成を行った。逆転写反応のプライマーには、キットに付属しているランダムプライマーを使用した。得られたcDNAから、マルチプレックスPCRにより20802遺伝子に由来するDNAを含むライブラリーを調製した。マルチプレックスPCRは、Ion AmpliSeqTranscriptome Human Gene Expression Kit(ライフテクノロジーズジャパン株式会社)を用いて、[99℃、2分→(99℃、15秒→62℃、16分)×20サイクル→4℃、Hold]の条件で行った。得られたPCR産物は、Ampure XP(ベックマン・コールター株式会社)で精製した後に、バッファーの再構成、プライマー配列の消化、アダプターライゲーションと精製、増幅を行い、ライブラリーを調製した。調製したライブラリーをIon 540 Chipにローディングし、Ion S5/XLシステム(ライフテクノロジーズジャパン株式会社)を用いてシーケンシングした。
3)データ解析
i)RNA発現解析1
上記2)で測定した被験者由来のRNAの発現量のデータ(リードカウント値)において、リードカウントが10未満のデータについては欠損値として扱い、サンプル間の総リード数の違いを補正したRPM値に変換した後、欠損値についてはSingular Value Decomposition(SVD)imputationという手法を用いて補填した。但し、全サンプル中被験者の発現量データのうち80%以上のサンプル被験者で欠損値ではない発現量データが得られている遺伝子のみ以下の解析に使用した。解析には、負の二項分布に従うRPM値を正規分布に近似するため、リードカウントのRPM値を底2の対数値に変換したRPM値(Log2RPM値)を用いた。
i)RNA発現解析1
上記2)で測定した被験者由来のRNAの発現量のデータ(リードカウント値)において、リードカウントが10未満のデータについては欠損値として扱い、サンプル間の総リード数の違いを補正したRPM値に変換した後、欠損値についてはSingular Value Decomposition(SVD)imputationという手法を用いて補填した。但し、全サンプル中被験者の発現量データのうち80%以上のサンプル被験者で欠損値ではない発現量データが得られている遺伝子のみ以下の解析に使用した。解析には、負の二項分布に従うRPM値を正規分布に近似するため、リードカウントのRPM値を底2の対数値に変換したRPM値(Log2RPM値)を用いた。
上記で得られた健常者、及びPDのSSL由来RNA発現量(Log2RPM値)を基に、健常者と比較してPDでStudent’s t−testでp値が0.05以下となる発現変動RNAを同定した。試験1では、健常者と比較してPDで111種のRNAが発現上昇し(表1−1〜1−3)、68種が発現低下した(表1−4〜1−5)。一方試験2では、565種のRNAが発現上昇し(表1−6〜1−19)、294種が発現低下した(表1−20〜1−27)。これらの試験1と試験2において共通に発現上昇したRNAは18種、発現低下したRNAは15種であった(表中の太字で示した遺伝子)。
公共データベースであるSTRINGを用いて遺伝子オントロジー(GO)エンリッチメント解析によるbiological process(BP)及びKEGG pathwayの探索を行った。その結果、PD患者において発現上昇あるいは低下した遺伝子群と関連したKEGG pathwayが試験1において30個、試験2において39個得られ、いずれの試験においてもパーキンソン病を示すタームhsa05012(Parkinson’s disease)が含まれることが示された(表2−1〜2−2)。
前記表1−1〜表1−27に示された試験1又は試験2の少なくともいずれかにおいて発現変動が見られた遺伝子について、パーキンソン病との関連性について既報文献を確認したところ、試験1で発現変動が見られた遺伝子のうち表3−1に示す21種及び試験2で発現変動が見られた遺伝子のうち表3−2〜3−4に示す92種は、これまでパーキンソン病との関連性が報告されておらず、これらについては新規のパーキンソン病の検出マーカーとなり得ることが明らかとなった。なお、表中の太字で示した遺伝子は試験1と試験2で共通する遺伝子である。
ii)RNA発現解析2
上記2)で測定した被験者由来のRNAの発現量のデータ(リードカウント値)において、DESeq2という手法を用いて補正した。但し、4161個以上の遺伝子が検出されていないサンプルは除外し、除外後の全サンプル中被験者の発現量データのうち90%以上のサンプル被験者で欠損値ではない発現量データが得られている遺伝子のみ以下の解析に使用した。解析には、DESeq2という手法を用いて補正されたカウント値(Normalized count値)を用いた。
上記2)で測定した被験者由来のRNAの発現量のデータ(リードカウント値)において、DESeq2という手法を用いて補正した。但し、4161個以上の遺伝子が検出されていないサンプルは除外し、除外後の全サンプル中被験者の発現量データのうち90%以上のサンプル被験者で欠損値ではない発現量データが得られている遺伝子のみ以下の解析に使用した。解析には、DESeq2という手法を用いて補正されたカウント値(Normalized count値)を用いた。
上記で得られた健常者、及びPDのSSL由来RNA発現量(Normalized count値)を基に、健常者と比較してPDにおいて尤度比検定によるp値の補正値(FDR)が0.25以下となる発現変動RNAを同定した。試験1では、健常者と比較してPDで74種のRNAが発現上昇し(表4−1〜4−2)、209種が発現低下した(表4−3〜4−8)。一方試験2では、151種のRNAが発現上昇し(表4−9〜4−12)、308種が発現低下した(表4−13〜4−20)。これらの試験1と試験2において共通に発現上昇したRNAは7種、発現低下したRNAは10種であった(表中の太字で示した遺伝子)。
公共データベースであるSTRINGを用いて遺伝子オントロジー(GO)エンリッチメント解析によるbiological process(BP)及びKEGG pathwayの探索を行った。その結果、PD患者において発現上昇あるいは低下した遺伝子群と関連したKEGG pathwayが試験1において30個、試験2において28個得られ、いずれの試験においてもパーキンソン病を示すタームhsa05012(Parkinson’s disease)が含まれることが示された(表5−1〜5−2)。
前記表4−1〜表4−20に示された試験1又は試験2の少なくともいずれかにおいて発現変動が見られた遺伝子について、パーキンソン病との関連性について既報文献を確認したところ、試験1で発現変動が見られた遺伝子のうち表6−1に示す19種及び試験2で発現変動が見られた遺伝子のうち表6−2に示す30種は、これまでパーキンソン病との関連性が報告されておらず、これらについては新規のパーキンソン病の検出マーカーとなり得ることが明らかとなった。なお、表中の太字で示した遺伝子は試験1と試験2で共通する遺伝子である。
実施例2 判別モデルの作成と検証1
1)使用データ
実施例1のRNA発現解析1と同様、被験者からのSSL由来RNAの発現量のデータ(リードカウント値)において、リードカウントが10未満のデータについては欠損値として扱い、サンプル間の総リード数の違いを補正したRPM値に変換した後、欠損値についてはSingular Value Decomposition(SVD)imputationという手法を用いて補填した。但し、全サンプル中80%以上のサンプルで欠損値ではない発現量データが得られている遺伝子のみ以下の解析に使用した。機械学習モデルの構築には、負の二項分布に従うRPM値を正規分布の近似とするため、底2の対数値に変換したRPM値(Log2RPM値)を用いた。
1)使用データ
実施例1のRNA発現解析1と同様、被験者からのSSL由来RNAの発現量のデータ(リードカウント値)において、リードカウントが10未満のデータについては欠損値として扱い、サンプル間の総リード数の違いを補正したRPM値に変換した後、欠損値についてはSingular Value Decomposition(SVD)imputationという手法を用いて補填した。但し、全サンプル中80%以上のサンプルで欠損値ではない発現量データが得られている遺伝子のみ以下の解析に使用した。機械学習モデルの構築には、負の二項分布に従うRPM値を正規分布の近似とするため、底2の対数値に変換したRPM値(Log2RPM値)を用いた。
2)データセット分割
試験1の被験者から得られたRNAプロファイルデータセットのうち、健常者10名及びPD10名の計20名分のRNAプロファイルデータをPD予測モデルの訓練データとし、残り10名分のRNAプロファイルデータをモデル精度の評価に使用するテストデータとした。試験2の被験者から得られたRNAプロファイルデータセットのうち、健常者40名及びPD40名の計80名分のRNAプロファイルデータをPD予測モデルの訓練データとし、残り20名分のRNAプロファイルデータをモデル精度の評価に使用するテストデータとした。
試験1の被験者から得られたRNAプロファイルデータセットのうち、健常者10名及びPD10名の計20名分のRNAプロファイルデータをPD予測モデルの訓練データとし、残り10名分のRNAプロファイルデータをモデル精度の評価に使用するテストデータとした。試験2の被験者から得られたRNAプロファイルデータセットのうち、健常者40名及びPD40名の計80名分のRNAプロファイルデータをPD予測モデルの訓練データとし、残り20名分のRNAプロファイルデータをモデル精度の評価に使用するテストデータとした。
3)特徴量遺伝子の選択
実施例1のRNA発現解析1で、健常者と比較して試験1と試験2においてPD患者で共通に発現上昇した18種のRNAと発現低下した15種のRNA(表1−1〜1−27の太字で示した遺伝子)を特徴量遺伝子として選択し、これらの発現量データを主成分分析により主成分へ変換した後、第1主成分から第10主成分を説明変数とした。また、試験1と試験2においてPD患者で共通に発現上昇した18種のRNAと発現低下した15種のRNAのうち、SNORA16A、SNORA24、SNORA50、REXO1L2Pの4種を特徴量遺伝子として選択し、これらの発現量データを主成分分析により主成分へ変換した後、第1主成分から第4主成分を説明変数とした。
実施例1のRNA発現解析1で、健常者と比較して試験1と試験2においてPD患者で共通に発現上昇した18種のRNAと発現低下した15種のRNA(表1−1〜1−27の太字で示した遺伝子)を特徴量遺伝子として選択し、これらの発現量データを主成分分析により主成分へ変換した後、第1主成分から第10主成分を説明変数とした。また、試験1と試験2においてPD患者で共通に発現上昇した18種のRNAと発現低下した15種のRNAのうち、SNORA16A、SNORA24、SNORA50、REXO1L2Pの4種を特徴量遺伝子として選択し、これらの発現量データを主成分分析により主成分へ変換した後、第1主成分から第4主成分を説明変数とした。
4)モデル構築
訓練データである、SSL由来RNAから選択された前記特徴量遺伝子の発現量のデータ(Log2RPM値)から得た各主成分の値を説明変数とし、健常者(HL)とPDを目的変数として用い、予測モデルの構築を実施した。予測対象項目毎に、ランダムフォレスト(Random forest)、線形カーネルのサポートベクターマシン(SVM linear)、rbfカーネルのサポートベクターマシン(SVM rbf)、ニューラルネットワーク(Nerural net)、一般線形モデル(Generalized linear model)、正則化線形判別分析(Regularized linear discriminant analysis)、正則化ロジスティック回帰(Regularized logistic regression)の7種のアルゴリズムを用いて、10分割交差検証を行って予測モデルを学習させた。各アルゴリズムについて、学習後のモデルにテストデータの前記特徴量遺伝子発現量(Log2RPM値)から得た各主成分の値を入力して、各予測項目のターゲット予測値を計算した。予測値と実測値から検出率(Recall)、精度(Precision)、及びそれらの調和平均であるF値を計算し、そのF値が最も大きいモデルを最適な予測モデルとして選抜した。
訓練データである、SSL由来RNAから選択された前記特徴量遺伝子の発現量のデータ(Log2RPM値)から得た各主成分の値を説明変数とし、健常者(HL)とPDを目的変数として用い、予測モデルの構築を実施した。予測対象項目毎に、ランダムフォレスト(Random forest)、線形カーネルのサポートベクターマシン(SVM linear)、rbfカーネルのサポートベクターマシン(SVM rbf)、ニューラルネットワーク(Nerural net)、一般線形モデル(Generalized linear model)、正則化線形判別分析(Regularized linear discriminant analysis)、正則化ロジスティック回帰(Regularized logistic regression)の7種のアルゴリズムを用いて、10分割交差検証を行って予測モデルを学習させた。各アルゴリズムについて、学習後のモデルにテストデータの前記特徴量遺伝子発現量(Log2RPM値)から得た各主成分の値を入力して、各予測項目のターゲット予測値を計算した。予測値と実測値から検出率(Recall)、精度(Precision)、及びそれらの調和平均であるF値を計算し、そのF値が最も大きいモデルを最適な予測モデルとして選抜した。
5)結果
表7に予測対象項目の、使用アルゴリズム、検出率、精度、F値を示す。また、テストデータにおいて最適な予測モデルにおける予測値と実測値をプロットした混同行列を図1に示す。尚、図中の数値は各象限のサンプル数を示す。
表8にランダムフォレストを用いてモデル構築を行った場合における、各特徴量遺伝子の変数重要度を算出した結果を示す。
表7に予測対象項目の、使用アルゴリズム、検出率、精度、F値を示す。また、テストデータにおいて最適な予測モデルにおける予測値と実測値をプロットした混同行列を図1に示す。尚、図中の数値は各象限のサンプル数を示す。
表8にランダムフォレストを用いてモデル構築を行った場合における、各特徴量遺伝子の変数重要度を算出した結果を示す。
SNORA16A、SNORA24、SNORA50、REXO1L2Pの4種を用いたモデルのF1は試験1において0.67、試験2において0.75、試験1+試験2を統合した場合において0.76となりPDの予測が可能であることが示された。PD患者で上昇したRNA18種と低下したRNA15種の合計33種を用いたモデルのF1は試験1において0.91、試験2において0.80、試験1+試験2を統合した場合において0.82となり、より高精度なPDの予測が可能であることが示された。
実施例3 判別モデルの作成と検証2
1)使用データ
実施例1のRNA発現解析2と同様、被験者からのSSL由来RNAの発現量のデータ(リードカウント値)において、DESeq2という手法を用いて補正した。但し、4161個以上の遺伝子が検出されていないサンプルは除外し、除外後の全サンプル中被験者の発現量データのうち90%以上のサンプル被験者で欠損値ではない発現量データが得られている遺伝子のみ以下の解析に使用した。解析には、DESeq2という手法を用いて補正されたカウント値(Normalized count値)を用いた。
1)使用データ
実施例1のRNA発現解析2と同様、被験者からのSSL由来RNAの発現量のデータ(リードカウント値)において、DESeq2という手法を用いて補正した。但し、4161個以上の遺伝子が検出されていないサンプルは除外し、除外後の全サンプル中被験者の発現量データのうち90%以上のサンプル被験者で欠損値ではない発現量データが得られている遺伝子のみ以下の解析に使用した。解析には、DESeq2という手法を用いて補正されたカウント値(Normalized count値)を用いた。
2)データセット分割
試験1の被験者から得られたRNAプロファイルデータセットのうち、健常者9名及びPD6名の計15名分のRNAプロファイルデータをPD予測モデルの訓練データとし、残りの健常者4名及びPD1名の計5名分のRNAプロファイルデータをモデル精度の評価に使用するテストデータとした。試験2の被験者から得られたRNAプロファイルデータセットのうち、健常者37名及びPD35名の計72名分のRNAプロファイルデータをPD予測モデルの訓練データとし、残りの健常者13名及びPD11名の計24名分のRNAプロファイルデータをモデル精度の評価に使用するテストデータとした。
試験1の被験者から得られたRNAプロファイルデータセットのうち、健常者9名及びPD6名の計15名分のRNAプロファイルデータをPD予測モデルの訓練データとし、残りの健常者4名及びPD1名の計5名分のRNAプロファイルデータをモデル精度の評価に使用するテストデータとした。試験2の被験者から得られたRNAプロファイルデータセットのうち、健常者37名及びPD35名の計72名分のRNAプロファイルデータをPD予測モデルの訓練データとし、残りの健常者13名及びPD11名の計24名分のRNAプロファイルデータをモデル精度の評価に使用するテストデータとした。
3)特徴量遺伝子の選択
実施例1のRNA発現解析2で、健常者と比較して試験1と試験2においてPD患者で共通に発現上昇或いは低下した17種のRNA(表4−1〜4−20の太字で示した遺伝子)を特徴量遺伝子として選択し、これらの発現量データを主成分分析により主成分へ変換した後、第1主成分から第4主成分を説明変数とした。
実施例1のRNA発現解析2で、健常者と比較して試験1と試験2においてPD患者で共通に発現上昇或いは低下した17種のRNA(表4−1〜4−20の太字で示した遺伝子)を特徴量遺伝子として選択し、これらの発現量データを主成分分析により主成分へ変換した後、第1主成分から第4主成分を説明変数とした。
4)モデル構築
訓練データである、SSL由来RNAから選択された前記特徴量遺伝子の発現量のデータ(Normalized count値に1を加算し底2の対数値とした値)から得た各主成分の値を説明変数とし、健常者(HL)とPDを目的変数として用い、予測モデルの構築を実施した。予測対象項目毎に、ランダムフォレスト(Random forest)、線形カーネルのサポートベクターマシン(SVM linear)、rbfカーネルのサポートベクターマシン(SVM rbf)、ニューラルネットワーク(Nerural net)、一般線形モデル(Generalized linear model)、正則化線形判別分析(Regularized linear discriminant analysis)、正則化ロジスティック回帰(Regularized logistic regression)の7種のアルゴリズムを用いて、10分割交差検証を行って予測モデルを学習させた。各アルゴリズムについて、学習後のモデルにテストデータの前記特徴量遺伝子発現量(Normalized count値に1を加算し底2の対数値とした値)から得た各主成分の値を入力して、各予測項目のターゲット予測値を計算した。予測値と実測値から検出率(Recall)、精度(Precision)、及びそれらの調和平均であるF値を計算し、そのF値が最も大きいモデルを最適な予測モデルとして選抜した。
訓練データである、SSL由来RNAから選択された前記特徴量遺伝子の発現量のデータ(Normalized count値に1を加算し底2の対数値とした値)から得た各主成分の値を説明変数とし、健常者(HL)とPDを目的変数として用い、予測モデルの構築を実施した。予測対象項目毎に、ランダムフォレスト(Random forest)、線形カーネルのサポートベクターマシン(SVM linear)、rbfカーネルのサポートベクターマシン(SVM rbf)、ニューラルネットワーク(Nerural net)、一般線形モデル(Generalized linear model)、正則化線形判別分析(Regularized linear discriminant analysis)、正則化ロジスティック回帰(Regularized logistic regression)の7種のアルゴリズムを用いて、10分割交差検証を行って予測モデルを学習させた。各アルゴリズムについて、学習後のモデルにテストデータの前記特徴量遺伝子発現量(Normalized count値に1を加算し底2の対数値とした値)から得た各主成分の値を入力して、各予測項目のターゲット予測値を計算した。予測値と実測値から検出率(Recall)、精度(Precision)、及びそれらの調和平均であるF値を計算し、そのF値が最も大きいモデルを最適な予測モデルとして選抜した。
5)結果
表9に予測対象項目の、使用アルゴリズム、検出率、精度、F値を示す。
表9に予測対象項目の、使用アルゴリズム、検出率、精度、F値を示す。
試験1と試験2のDESeq2による補正後の尤度比検定の結果において、共通に発現上昇、或いは低下した17種のRNAを用いたモデルのF値は試験1において1、試験2において0.87となりPDの予測が可能であることが示された。
実施例4 判別モデルの作成と検証3
1)使用データ
実施例1のRNA発現解析2と同様、被験者からのSSL由来RNAの発現量のデータ(リードカウント値)において、DESeq2という手法を用いて補正した。但し、4161個以上の遺伝子が検出されていないサンプルは除外し、除外後の全サンプル中被験者の発現量データのうち90%以上のサンプル被験者で欠損値ではない発現量データが得られている遺伝子のみ以下の解析に使用した。解析には、DESeq2という手法を用いて補正されたカウント値(Normalized count値)を用いた。
1)使用データ
実施例1のRNA発現解析2と同様、被験者からのSSL由来RNAの発現量のデータ(リードカウント値)において、DESeq2という手法を用いて補正した。但し、4161個以上の遺伝子が検出されていないサンプルは除外し、除外後の全サンプル中被験者の発現量データのうち90%以上のサンプル被験者で欠損値ではない発現量データが得られている遺伝子のみ以下の解析に使用した。解析には、DESeq2という手法を用いて補正されたカウント値(Normalized count値)を用いた。
2)データセット分割
試験1の被験者から得られたRNAプロファイルデータセットのうち、健常者9名及びPD6名の計15名分のRNAプロファイルデータをPD予測モデルの訓練データとし、残りの健常者4名及びPD1名の計5名分のRNAプロファイルデータをモデル精度の評価に使用するテストデータとした。試験2の被験者から得られたRNAプロファイルデータセットのうち、健常者37名及びPD35名の計72名分のRNAプロファイルデータをPD予測モデルの訓練データとし、残りの健常者13名及びPD11名の計24名分のRNAプロファイルデータをモデル精度の評価に使用するテストデータとした。
試験1の被験者から得られたRNAプロファイルデータセットのうち、健常者9名及びPD6名の計15名分のRNAプロファイルデータをPD予測モデルの訓練データとし、残りの健常者4名及びPD1名の計5名分のRNAプロファイルデータをモデル精度の評価に使用するテストデータとした。試験2の被験者から得られたRNAプロファイルデータセットのうち、健常者37名及びPD35名の計72名分のRNAプロファイルデータをPD予測モデルの訓練データとし、残りの健常者13名及びPD11名の計24名分のRNAプロファイルデータをモデル精度の評価に使用するテストデータとした。
3)特徴量遺伝子の選択
実施例1のRNA発現解析2で、健常者と比較して試験1においてPD患者で発現上昇或いは低下した19種のRNA(表6−1に示す遺伝子)、或いは健常者と比較して試験2においてPD患者で発現上昇或いは低下した30種のRNA(表6−2に示す遺伝子)を特徴量遺伝子として選択し、これらの発現量データを主成分分析により主成分へ変換した後、第1主成分から第4主成分を説明変数とした。
実施例1のRNA発現解析2で、健常者と比較して試験1においてPD患者で発現上昇或いは低下した19種のRNA(表6−1に示す遺伝子)、或いは健常者と比較して試験2においてPD患者で発現上昇或いは低下した30種のRNA(表6−2に示す遺伝子)を特徴量遺伝子として選択し、これらの発現量データを主成分分析により主成分へ変換した後、第1主成分から第4主成分を説明変数とした。
4)モデル構築
訓練データである、SSL由来RNAから選択された前記特徴量遺伝子の発現量のデータ(Normalized count値に1を加算し底2の対数値とした値)から得た各主成分の値を説明変数とし、健常者(HL)とPDを目的変数として用い、予測モデルの構築を実施した。予測対象項目毎に、ランダムフォレスト(Random forest)、線形カーネルのサポートベクターマシン(SVM linear)、rbfカーネルのサポートベクターマシン(SVM rbf)、ニューラルネットワーク(Nerural net)、一般線形モデル(Generalized linear model)、正則化線形判別分析(Regularized linear discriminant analysis)、正則化ロジスティック回帰(Regularized logistic regression)の7種のアルゴリズムを用いて、10分割交差検証を行って予測モデルを学習させた。各アルゴリズムについて、学習後のモデルにテストデータの前記特徴量遺伝子発現量(Normalized count値に1を加算し底2の対数値とした値)から得た各主成分の値を入力して、各予測項目のターゲット予測値を計算した。予測値と実測値から検出率(Recall)、精度(Precision)、及びそれらの調和平均であるF値を計算し、そのF値が最も大きいモデルを最適な予測モデルとして選抜した。
訓練データである、SSL由来RNAから選択された前記特徴量遺伝子の発現量のデータ(Normalized count値に1を加算し底2の対数値とした値)から得た各主成分の値を説明変数とし、健常者(HL)とPDを目的変数として用い、予測モデルの構築を実施した。予測対象項目毎に、ランダムフォレスト(Random forest)、線形カーネルのサポートベクターマシン(SVM linear)、rbfカーネルのサポートベクターマシン(SVM rbf)、ニューラルネットワーク(Nerural net)、一般線形モデル(Generalized linear model)、正則化線形判別分析(Regularized linear discriminant analysis)、正則化ロジスティック回帰(Regularized logistic regression)の7種のアルゴリズムを用いて、10分割交差検証を行って予測モデルを学習させた。各アルゴリズムについて、学習後のモデルにテストデータの前記特徴量遺伝子発現量(Normalized count値に1を加算し底2の対数値とした値)から得た各主成分の値を入力して、各予測項目のターゲット予測値を計算した。予測値と実測値から検出率(Recall)、精度(Precision)、及びそれらの調和平均であるF値を計算し、そのF値が最も大きいモデルを最適な予測モデルとして選抜した。
5)結果
表10、表11に予測対象項目の、使用アルゴリズム、検出率、精度、F値を示す。
表10、表11に予測対象項目の、使用アルゴリズム、検出率、精度、F値を示す。
試験1のDESeq2による補正後の尤度比検定の結果において、発現上昇、或いは低下したRNAの内、これまでパーキンソン病との関連性が報告されていない19種のRNAを用いたモデルのF値は1となりPDの予測が可能であることが示された。試験2のDESeq2による補正後の尤度比検定の結果において、発現上昇、或いは低下したRNAの内、これまでパーキンソン病との関連性が報告されていない30種のRNAを用いたモデルのF値は0.87となりPDの予測が可能であることが示された。
実施例5 判別モデルの作成と検証4
1)使用データ
実施例1のRNA発現解析1と同様、被験者からのSSL由来RNAの発現量のデータ(リードカウント値)において、リードカウントが10未満のデータについては欠損値として扱い、サンプル間の総リード数の違いを補正したRPM値に変換した後、欠損値についてはSingular Value Decomposition(SVD)imputationという手法を用いて補填した。但し、全サンプル中80%以上のサンプルで欠損値ではない発現量データが得られている遺伝子のみ以下の解析に使用した。機械学習モデルの構築には、負の二項分布に従うRPM値を正規分布の近似するため、底2の対数値に変換したRPM値(Log2RPM値)を用いた。
1)使用データ
実施例1のRNA発現解析1と同様、被験者からのSSL由来RNAの発現量のデータ(リードカウント値)において、リードカウントが10未満のデータについては欠損値として扱い、サンプル間の総リード数の違いを補正したRPM値に変換した後、欠損値についてはSingular Value Decomposition(SVD)imputationという手法を用いて補填した。但し、全サンプル中80%以上のサンプルで欠損値ではない発現量データが得られている遺伝子のみ以下の解析に使用した。機械学習モデルの構築には、負の二項分布に従うRPM値を正規分布の近似するため、底2の対数値に変換したRPM値(Log2RPM値)を用いた。
2)データセット分割
試験1の被験者から得られたRNAプロファイルデータセットのうち、健常者10名及びPD10名の計20名分のRNAプロファイルデータをPD予測モデルの訓練データとし、残り10名分のRNAプロファイルデータをモデル精度の評価に使用するテストデータとした。試験2の被験者から得られたRNAプロファイルデータセットのうち、健常者40名及びPD40名の計80名分のRNAプロファイルデータをPD予測モデルの訓練データとし、残り20名分のRNAプロファイルデータをモデル精度の評価に使用するテストデータとした。
試験1の被験者から得られたRNAプロファイルデータセットのうち、健常者10名及びPD10名の計20名分のRNAプロファイルデータをPD予測モデルの訓練データとし、残り10名分のRNAプロファイルデータをモデル精度の評価に使用するテストデータとした。試験2の被験者から得られたRNAプロファイルデータセットのうち、健常者40名及びPD40名の計80名分のRNAプロファイルデータをPD予測モデルの訓練データとし、残り20名分のRNAプロファイルデータをモデル精度の評価に使用するテストデータとした。
3)特徴量遺伝子の選択
実施例1のRNA発現解析1で、健常者と比較して試験1においてPD患者で発現上昇或いは低下した21種のRNA(表3−1に示す遺伝子)、或いは健常者と比較して試験2においてPD患者で発現上昇或いは低下した92種のRNA(表3−2〜3−4に示す遺伝子)を特徴量遺伝子として選択し、これらの発現量データを主成分分析により主成分へ変換した後、第1主成分から第4主成分を説明変数とした。
実施例1のRNA発現解析1で、健常者と比較して試験1においてPD患者で発現上昇或いは低下した21種のRNA(表3−1に示す遺伝子)、或いは健常者と比較して試験2においてPD患者で発現上昇或いは低下した92種のRNA(表3−2〜3−4に示す遺伝子)を特徴量遺伝子として選択し、これらの発現量データを主成分分析により主成分へ変換した後、第1主成分から第4主成分を説明変数とした。
4)モデル構築
訓練データである、SSL由来RNAから選択された前記特徴量遺伝子の発現量のデータ(Log2RPM値)から得た各主成分の値を説明変数とし、健常者(HL)とPDを目的変数として用い、予測モデルの構築を実施した。予測対象項目毎に、ランダムフォレスト(Random forest)、線形カーネルのサポートベクターマシン(SVM linear)、rbfカーネルのサポートベクターマシン(SVM rbf)、ニューラルネットワーク(Nerural net)、一般線形モデル(Generalized linear model)、正則化線形判別分析(Regularized linear discriminant analysis)、正則化ロジスティック回帰(Regularized logistic regression)の7種のアルゴリズムを用いて、10分割交差検証を行って予測モデルを学習させた。各アルゴリズムについて、学習後のモデルにテストデータの前記特徴量遺伝子発現量(Log2RPM値)から得た各主成分の値を入力して、各予測項目のターゲット予測値を計算した。予測値と実測値から検出率(Recall)、精度(Precision)、及びそれらの調和平均であるF値を計算し、そのF値が最も大きいモデルを最適な予測モデルとして選抜した。
訓練データである、SSL由来RNAから選択された前記特徴量遺伝子の発現量のデータ(Log2RPM値)から得た各主成分の値を説明変数とし、健常者(HL)とPDを目的変数として用い、予測モデルの構築を実施した。予測対象項目毎に、ランダムフォレスト(Random forest)、線形カーネルのサポートベクターマシン(SVM linear)、rbfカーネルのサポートベクターマシン(SVM rbf)、ニューラルネットワーク(Nerural net)、一般線形モデル(Generalized linear model)、正則化線形判別分析(Regularized linear discriminant analysis)、正則化ロジスティック回帰(Regularized logistic regression)の7種のアルゴリズムを用いて、10分割交差検証を行って予測モデルを学習させた。各アルゴリズムについて、学習後のモデルにテストデータの前記特徴量遺伝子発現量(Log2RPM値)から得た各主成分の値を入力して、各予測項目のターゲット予測値を計算した。予測値と実測値から検出率(Recall)、精度(Precision)、及びそれらの調和平均であるF値を計算し、そのF値が最も大きいモデルを最適な予測モデルとして選抜した。
5)結果
表12、表13に予測対象項目の、使用アルゴリズム、検出率、精度、F値を示す。
表12、表13に予測対象項目の、使用アルゴリズム、検出率、精度、F値を示す。
試験1のLog2RPMによる補正後の検定結果において、発現上昇、或いは低下したRNAの内、これまでパーキンソン病との関連性が報告されていない21種のRNAを用いたモデルのF値は0.91となりPDの予測が可能であることが示された。試験2のLog2RPMによる補正後の検定結果において、発現上昇、或いは低下したRNAの内、これまでパーキンソン病との関連性が報告されていない92種のRNAを用いたモデルのF値は0.9となりPDの予測が可能であることが示された。
Claims (13)
- 被験者から採取された生体試料について、SNORA16A、SNORA24、SNORA50及びREXO1L2Pからなる4種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む、当該被験者におけるパーキンソン病の検出方法。
- SNORA24遺伝子又はその発現産物の発現レベルの測定を少なくとも含む、請求項1記載のパーキンソン病の検出方法。
- 遺伝子又はその発現産物の発現レベルがmRNAの発現量の測定である、請求項1又は2記載の方法。
- 遺伝子又はその発現産物が前記被験者の皮膚表上脂質に含まれるRNAである、請求項1〜3のいずれか1項記載の方法。
- 発現レベルの測定値を前記各遺伝子又はその発現産物の参照値と比較し、パーキンソン病の存在又は不存在を評価する、請求項1〜4のいずれか1項記載の方法。
- パーキンソン病患者由来の前記遺伝子又はその発現産物の発現レベルと、健常者由来の同遺伝子又はその発現産物の発現レベルの測定値を教師サンプルとして、パーキンソン病患者と健常人を分ける判別式を作成し、被験者から採取された生体試料から得られた同遺伝子又はその発現産物の発現レベルの測定値を当該判別式に代入し、得られた結果を参照値と比較することによって、被検者におけるパーキンソン病の存在又は不存在を評価する、請求項1〜4のいずれか1項記載の方法。
- 前記4種の遺伝子群の全ての遺伝子又はその発現産物の発現レベルが測定される、請求項6記載の方法。
- 前記4種の遺伝子群より選択される少なくとも1つの遺伝子の他に、下記の29種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルが測定される、請求項6又は7記載の方法、
ANKRD12、C10orf116、CCL3、CCNI、CD83、CNFN、CNN2、CSF2RB、CXCR4、EGR2、EMP1、ITGAX、KCNQ1OT1、LCE3D、LITAF、NDUFA4L2、NDUFS5、POLR2L、RHOA、RNASEK、RPL7A、RPS26、SERINC1、SERP1、SERPINB4、SLC25A3、SNRPG、SRRM2、UQCRH。 - 前記4種の遺伝子群より選択される少なくとも1つの遺伝子の他に、下記の10種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルが測定される、請求項8記載の方法、
CCL3、CCNI、CXCR4、EGR2、EMP1、POLR2L、RHOA、RNASEK、SERINC1、SERPINB4。 - 前記遺伝子又はそれに由来する核酸と特異的にハイブリダイズするオリゴヌクレオチド、又は前記遺伝子の発現産物を認識する抗体を含有する、請求項1〜9のいずれか1項記載の方法に用いられるパーキンソン病を検出するための検査用キット。
- SNORA16A、SNORA24、SNORA50及びREXO1L2Pからなる4種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物からなる、請求項12記載のパーキンソン病の検出マーカー。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020085430 | 2020-05-14 | ||
JP2020085430 | 2020-05-14 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021180654A true JP2021180654A (ja) | 2021-11-25 |
Family
ID=78525192
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021082827A Pending JP2021180654A (ja) | 2020-05-14 | 2021-05-14 | パーキンソン病の検出方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20230183806A1 (ja) |
EP (1) | EP4151752A1 (ja) |
JP (1) | JP2021180654A (ja) |
CN (1) | CN115605608A (ja) |
WO (1) | WO2021230379A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117051102B (zh) * | 2023-10-12 | 2024-01-26 | 上海爱谱蒂康生物科技有限公司 | 生物标志物组合在制备预测帕金森病的产品中的应用 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6565010B2 (ja) | 2014-10-09 | 2019-08-28 | 有限会社ピコデバイス | パーキンソン病の早期診断方法 |
US11499184B2 (en) | 2016-02-05 | 2022-11-15 | St. John's University | Circulating serum microRNA biomarkers and methods |
EP3372693B1 (en) | 2016-07-08 | 2020-02-12 | Kao Corporation | Method for preparing nucleic acid sample |
GB201812561D0 (en) * | 2018-08-01 | 2018-09-12 | Univ Manchester | Biomarkers and uses thereof |
-
2021
- 2021-05-14 JP JP2021082827A patent/JP2021180654A/ja active Pending
- 2021-05-14 US US17/924,640 patent/US20230183806A1/en active Pending
- 2021-05-14 EP EP21805028.4A patent/EP4151752A1/en active Pending
- 2021-05-14 WO PCT/JP2021/018511 patent/WO2021230379A1/ja unknown
- 2021-05-14 CN CN202180035027.2A patent/CN115605608A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2021230379A1 (ja) | 2021-11-18 |
EP4151752A1 (en) | 2023-03-22 |
US20230183806A1 (en) | 2023-06-15 |
CN115605608A (zh) | 2023-01-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bousman et al. | Preliminary evidence of ubiquitin proteasome system dysregulation in schizophrenia and bipolar disorder: convergent pathway analysis findings from two independent samples | |
US10563262B2 (en) | Biomarkers of traumatic brain injury | |
Kobayashi et al. | High prevalence of genetic alterations in early-onset epileptic encephalopathies associated with infantile movement disorders | |
JP2005312435A (ja) | うつ病の評価方法 | |
US20200165680A1 (en) | Method for detection of traumatic brain injury | |
CN112980941B (zh) | 一种诊断受试者是否患阿尔茨海默病的试剂盒及其用途 | |
WO2021230379A1 (ja) | パーキンソン病の検出方法 | |
JP2023157965A (ja) | アトピー性皮膚炎の検出方法 | |
JP2018504123A (ja) | 自閉症スペクトル障害を有する児童の唾液中のエピジェネティックバイオマーカーの同定 | |
US20210087634A1 (en) | Determination of risk for development of cardiovascular disease by measuring urinary levels of podocin and nephrin messenger rna | |
JP2022520427A (ja) | 脳損傷の唾液バイオマーカー | |
WO2022220299A1 (ja) | 乳幼児顔湿疹の症度の検出方法 | |
JP2021175382A (ja) | 乳幼児アトピー性皮膚炎の検出方法 | |
WO2022059745A1 (ja) | 乳幼児アトピー性皮膚炎の検出方法 | |
Zhang et al. | High Expression of LncRNA XIST as an Index Helping to Diagnose Parkinson’s Disease | |
WO2022009988A1 (ja) | アトピー性皮膚炎の重症度の検出方法 | |
WO2022220298A1 (ja) | 乳幼児おむつ皮膚炎の症度の検出方法 | |
JP2023073135A (ja) | 更年期障害の重症度の検出方法 | |
JP2023048810A (ja) | 慢性ストレスレベルの検出方法 | |
JP2023073134A (ja) | ホットフラッシュの検出方法 | |
JP2023048811A (ja) | 疲労の検出方法 | |
JP2022134127A (ja) | アトピー性皮膚炎による皮膚痒みの症度悪化の検出方法 | |
JP2023045067A (ja) | 不眠の検出方法 | |
CN106834491B (zh) | 乳腺癌预后相关基因突变检测试剂盒及其使用方法 | |
WO2022114200A1 (ja) | アトピー性皮膚炎の症度の検出方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210524 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240326 |