JP2021175381A - Method for detecting infant atopic dermatitis - Google Patents
Method for detecting infant atopic dermatitis Download PDFInfo
- Publication number
- JP2021175381A JP2021175381A JP2020081473A JP2020081473A JP2021175381A JP 2021175381 A JP2021175381 A JP 2021175381A JP 2020081473 A JP2020081473 A JP 2020081473A JP 2020081473 A JP2020081473 A JP 2020081473A JP 2021175381 A JP2021175381 A JP 2021175381A
- Authority
- JP
- Japan
- Prior art keywords
- gene
- atopic dermatitis
- genes
- expression
- expression level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 206010012438 Dermatitis atopic Diseases 0.000 title claims abstract description 98
- 201000008937 atopic dermatitis Diseases 0.000 title claims abstract description 98
- 238000000034 method Methods 0.000 title claims abstract description 78
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 280
- 230000014509 gene expression Effects 0.000 claims abstract description 155
- 239000012472 biological sample Substances 0.000 claims abstract description 20
- 239000003550 marker Substances 0.000 claims abstract description 19
- -1 RASA4CP Proteins 0.000 claims abstract description 16
- 102100022872 Deoxyribonuclease-1-like 1 Human genes 0.000 claims abstract description 12
- 101000902865 Homo sapiens Deoxyribonuclease-1-like 1 Proteins 0.000 claims abstract description 12
- 101000711456 Homo sapiens Putative speedy protein E7 Proteins 0.000 claims abstract description 12
- 102100034038 Putative speedy protein E7 Human genes 0.000 claims abstract description 12
- 102100021038 Arrestin domain-containing protein 4 Human genes 0.000 claims abstract description 11
- 102100021390 C-terminal-binding protein 1 Human genes 0.000 claims abstract description 11
- 102100022735 Diacylglycerol kinase alpha Human genes 0.000 claims abstract description 11
- 102100039327 Enoyl-[acyl-carrier-protein] reductase, mitochondrial Human genes 0.000 claims abstract description 11
- 101000784133 Homo sapiens Arrestin domain-containing protein 4 Proteins 0.000 claims abstract description 11
- 101001044817 Homo sapiens Diacylglycerol kinase alpha Proteins 0.000 claims abstract description 11
- 101000961707 Homo sapiens Enoyl-[acyl-carrier-protein] reductase, mitochondrial Proteins 0.000 claims abstract description 11
- 101000995200 Homo sapiens Neurabin-2 Proteins 0.000 claims abstract description 11
- 101000881614 Homo sapiens Probable RNA-binding protein EIF1AD Proteins 0.000 claims abstract description 11
- 101001051714 Homo sapiens Ribosomal protein S6 kinase beta-2 Proteins 0.000 claims abstract description 11
- 101000878981 Homo sapiens Squalene synthase Proteins 0.000 claims abstract description 11
- 101000596743 Homo sapiens Testis-expressed protein 2 Proteins 0.000 claims abstract description 11
- 101000637855 Homo sapiens Transmembrane protease serine 11E Proteins 0.000 claims abstract description 11
- 101000760227 Homo sapiens Zinc finger protein 335 Proteins 0.000 claims abstract description 11
- 101000964750 Homo sapiens Zinc finger protein 706 Proteins 0.000 claims abstract description 11
- 102100034437 Neurabin-2 Human genes 0.000 claims abstract description 11
- 102100037234 Probable RNA-binding protein EIF1AD Human genes 0.000 claims abstract description 11
- 102100024917 Ribosomal protein S6 kinase beta-2 Human genes 0.000 claims abstract description 11
- 102100037997 Squalene synthase Human genes 0.000 claims abstract description 11
- 102100035105 Testis-expressed protein 2 Human genes 0.000 claims abstract description 11
- 102100032001 Transmembrane protease serine 11E Human genes 0.000 claims abstract description 11
- 102100024773 Zinc finger protein 335 Human genes 0.000 claims abstract description 11
- 102100040664 Zinc finger protein 706 Human genes 0.000 claims abstract description 11
- 101150118453 ctbp-1 gene Proteins 0.000 claims abstract description 11
- 102100035341 Guanine nucleotide-binding protein G(I)/G(S)/G(T) subunit beta-2 Human genes 0.000 claims abstract description 7
- 101001024278 Homo sapiens Guanine nucleotide-binding protein G(I)/G(S)/G(T) subunit beta-2 Proteins 0.000 claims abstract description 7
- 102100023060 Casein kinase I isoform gamma-2 Human genes 0.000 claims abstract description 5
- 101001049881 Homo sapiens Casein kinase I isoform gamma-2 Proteins 0.000 claims abstract description 5
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 54
- 102000039446 nucleic acids Human genes 0.000 claims description 28
- 108020004707 nucleic acids Proteins 0.000 claims description 28
- 150000007523 nucleic acids Chemical class 0.000 claims description 28
- 239000000523 sample Substances 0.000 claims description 16
- 206010003645 Atopy Diseases 0.000 claims description 8
- 108091034117 Oligonucleotide Proteins 0.000 claims description 8
- 150000002632 lipids Chemical class 0.000 claims description 8
- 101150016096 17 gene Proteins 0.000 claims description 6
- 238000005259 measurement Methods 0.000 claims description 6
- 108020004999 messenger RNA Proteins 0.000 claims description 5
- 238000007689 inspection Methods 0.000 claims description 2
- 101150086149 39 gene Proteins 0.000 claims 1
- 239000000047 product Substances 0.000 description 56
- 108020004414 DNA Proteins 0.000 description 41
- 238000007637 random forest analysis Methods 0.000 description 28
- 238000004422 calculation algorithm Methods 0.000 description 24
- 210000003491 skin Anatomy 0.000 description 21
- 238000004458 analytical method Methods 0.000 description 15
- 102000004169 proteins and genes Human genes 0.000 description 15
- 238000010801 machine learning Methods 0.000 description 13
- 239000002299 complementary DNA Substances 0.000 description 12
- 238000010276 construction Methods 0.000 description 11
- 238000003066 decision tree Methods 0.000 description 11
- 238000009396 hybridization Methods 0.000 description 11
- 102100034343 Integrase Human genes 0.000 description 10
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 8
- 239000003153 chemical reaction reagent Substances 0.000 description 8
- 230000000295 complement effect Effects 0.000 description 8
- 238000009826 distribution Methods 0.000 description 8
- 150000002500 ions Chemical class 0.000 description 8
- 102000053602 DNA Human genes 0.000 description 7
- 239000007795 chemical reaction product Substances 0.000 description 7
- 238000007796 conventional method Methods 0.000 description 7
- 238000001514 detection method Methods 0.000 description 7
- 238000007403 mPCR Methods 0.000 description 7
- 238000010839 reverse transcription Methods 0.000 description 7
- 238000000926 separation method Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 201000004624 Dermatitis Diseases 0.000 description 5
- 238000003199 nucleic acid amplification method Methods 0.000 description 5
- 238000012163 sequencing technique Methods 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 230000003321 amplification Effects 0.000 description 4
- 238000000137 annealing Methods 0.000 description 4
- 210000004369 blood Anatomy 0.000 description 4
- 239000008280 blood Substances 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 230000036961 partial effect Effects 0.000 description 4
- 230000035945 sensitivity Effects 0.000 description 4
- 210000002966 serum Anatomy 0.000 description 4
- 238000012706 support-vector machine Methods 0.000 description 4
- 210000001519 tissue Anatomy 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 238000000018 DNA microarray Methods 0.000 description 3
- 238000003657 Likelihood-ratio test Methods 0.000 description 3
- 238000000636 Northern blotting Methods 0.000 description 3
- 239000011358 absorbing material Substances 0.000 description 3
- 239000011324 bead Substances 0.000 description 3
- 239000007853 buffer solution Substances 0.000 description 3
- 238000010805 cDNA synthesis kit Methods 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 238000002493 microarray Methods 0.000 description 3
- 206010037844 rash Diseases 0.000 description 3
- 238000003757 reverse transcription PCR Methods 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 210000001732 sebaceous gland Anatomy 0.000 description 3
- 210000002374 sebum Anatomy 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 101150100859 45 gene Proteins 0.000 description 2
- 101100180602 Caenorhabditis elegans csnk-1 gene Proteins 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 206010015150 Erythema Diseases 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 208000010201 Exanthema Diseases 0.000 description 2
- 102000003855 L-lactate dehydrogenase Human genes 0.000 description 2
- 108700023483 L-lactate dehydrogenases Proteins 0.000 description 2
- 239000004743 Polypropylene Substances 0.000 description 2
- 208000003251 Pruritus Diseases 0.000 description 2
- 238000002123 RNA extraction Methods 0.000 description 2
- 238000003559 RNA-seq method Methods 0.000 description 2
- 102100030326 Serpin B4 Human genes 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 239000002250 absorbent Substances 0.000 description 2
- 239000000853 adhesive Substances 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 208000010668 atopic eczema Diseases 0.000 description 2
- 230000031018 biological processes and functions Effects 0.000 description 2
- 239000000090 biomarker Substances 0.000 description 2
- 210000001124 body fluid Anatomy 0.000 description 2
- 239000010839 body fluid Substances 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 210000002615 epidermis Anatomy 0.000 description 2
- 231100000321 erythema Toxicity 0.000 description 2
- 201000005884 exanthem Diseases 0.000 description 2
- 210000003780 hair follicle Anatomy 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 239000006249 magnetic particle Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 239000002773 nucleotide Substances 0.000 description 2
- 125000003729 nucleotide group Chemical group 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 229920001155 polypropylene Polymers 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 108090000765 processed proteins & peptides Proteins 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 230000002285 radioactive effect Effects 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 230000001568 sexual effect Effects 0.000 description 2
- 239000007790 solid phase Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 108010088201 squamous cell carcinoma-related antigen Proteins 0.000 description 2
- 210000000106 sweat gland Anatomy 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 239000003021 water soluble solvent Substances 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- 101150101112 7 gene Proteins 0.000 description 1
- 102100023698 C-C motif chemokine 17 Human genes 0.000 description 1
- 102100031629 COP9 signalosome complex subunit 1 Human genes 0.000 description 1
- 101100366714 Caenorhabditis elegans ssl-1 gene Proteins 0.000 description 1
- 102100025172 Calpain-1 catalytic subunit Human genes 0.000 description 1
- 108010012236 Chemokines Proteins 0.000 description 1
- 102000019034 Chemokines Human genes 0.000 description 1
- 206010010744 Conjunctivitis allergic Diseases 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 206010013786 Dry skin Diseases 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 108700039887 Essential Genes Proteins 0.000 description 1
- 101000741048 Homo sapiens Alpha-S1-casein Proteins 0.000 description 1
- 101000978362 Homo sapiens C-C motif chemokine 17 Proteins 0.000 description 1
- 101000940485 Homo sapiens COP9 signalosome complex subunit 1 Proteins 0.000 description 1
- 101000934069 Homo sapiens Calpain-1 catalytic subunit Proteins 0.000 description 1
- 101000839025 Homo sapiens Hydroxymethylglutaryl-CoA synthase, cytoplasmic Proteins 0.000 description 1
- 102100028888 Hydroxymethylglutaryl-CoA synthase, cytoplasmic Human genes 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 238000007397 LAMP assay Methods 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 206010030113 Oedema Diseases 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 206010033733 Papule Diseases 0.000 description 1
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 108091030066 RNAIII Proteins 0.000 description 1
- 206010039085 Rhinitis allergic Diseases 0.000 description 1
- 206010039509 Scab Diseases 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 208000002205 allergic conjunctivitis Diseases 0.000 description 1
- 208000026935 allergic disease Diseases 0.000 description 1
- 201000010105 allergic rhinitis Diseases 0.000 description 1
- 230000007815 allergy Effects 0.000 description 1
- 230000037354 amino acid metabolism Effects 0.000 description 1
- 208000006673 asthma Diseases 0.000 description 1
- 208000024998 atopic conjunctivitis Diseases 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000002146 bilateral effect Effects 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 239000002981 blocking agent Substances 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 210000004207 dermis Anatomy 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000007847 digital PCR Methods 0.000 description 1
- 230000037336 dry skin Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010201 enrichment analysis Methods 0.000 description 1
- 210000003979 eosinophil Anatomy 0.000 description 1
- 230000003628 erosive effect Effects 0.000 description 1
- 230000005713 exacerbation Effects 0.000 description 1
- 210000003499 exocrine gland Anatomy 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 210000000416 exudates and transudate Anatomy 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 210000004907 gland Anatomy 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 239000004519 grease Substances 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- ZRALSGWEFCBTJO-UHFFFAOYSA-O guanidinium Chemical compound NC(N)=[NH2+] ZRALSGWEFCBTJO-UHFFFAOYSA-O 0.000 description 1
- 210000004209 hair Anatomy 0.000 description 1
- 210000004408 hybridoma Anatomy 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000003053 immunization Effects 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 208000030603 inherited susceptibility to asthma Diseases 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007803 itching Effects 0.000 description 1
- 230000003780 keratinization Effects 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 230000037356 lipid metabolism Effects 0.000 description 1
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 238000001840 matrix-assisted laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 150000002772 monosaccharides Chemical class 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 201000000050 myeloid neoplasm Diseases 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 150000002482 oligosaccharides Chemical class 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 210000005259 peripheral blood Anatomy 0.000 description 1
- 239000011886 peripheral blood Substances 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000001823 pruritic effect Effects 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 238000007790 scraping Methods 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 210000004927 skin cell Anatomy 0.000 description 1
- 208000017520 skin disease Diseases 0.000 description 1
- 244000005714 skin microbiome Species 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 210000004989 spleen cell Anatomy 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
Description
本発明は、アトピー性皮膚炎マーカーを用いたアトピー性皮膚炎の検出方法に関する。 The present invention relates to a method for detecting atopic dermatitis using an atopic dermatitis marker.
アトピー性皮膚炎(以下、「AD」とも称する)は、アトピー素因を有する者に主に発症する湿疹性皮膚疾患である。アトピー性皮膚炎の典型的な症状は、左右対側性に発生する、慢性及び反復性の痒み、皮疹、紅斑等、ならびに角化不全、バリア能低下、乾燥肌などである。アトピー性皮膚炎の多くは乳幼児に発症し、成長と共に軽快傾向を示すが、近年では成人型や難治性のアトピー性皮膚炎も増加している。 Atopic dermatitis (hereinafter, also referred to as "AD") is an eczema skin disease that mainly develops in persons having an atopic predisposition. Typical symptoms of atopic dermatitis include bilateral, chronic and recurrent itching, rashes, erythema, etc., as well as keratinization deficiency, reduced barrier capacity, and dry skin. Most atopic dermatitis develops in infants and tends to improve with growth, but in recent years, adult-type and refractory atopic dermatitis have also increased.
アトピー性皮膚炎の症度の判断は、肉眼による所見を頼りに行われているのが現状である。所見項目としては、乾燥症状、紅斑、鱗屑、丘疹、掻破痕、浮腫、痂疲の付着、小水疱、びらん、痒診結節など様々が存在するが、いずれも主観的要素が入り込むため、医師の技量により判断に差が生じる可能性を含んでいる。斯様に、アトピー性皮膚炎の症度の判断は客観性に乏しいという問題がある。 At present, the degree of atopic dermatitis is determined by relying on the findings with the naked eye. There are various findings such as dryness, erythema, scales, papules, scratches, edema, adhesion of scabs, vesicles, erosions, and pruritus nodules. There is a possibility that the judgment may differ depending on the skill. Thus, there is a problem that the judgment of the degree of atopic dermatitis is not objective.
近年、バイオマーカーを用いてアトピー性皮膚炎を検出する方法として、血液の末梢血好酸球数、血清総IgE値、LDH(乳酸デヒドロゲナーゼ)値、血清中のThymus and Activation−Regulated Chemokine(TARC)やSquamous cell carcinoma antigen 2(SCCA2)を検出すること(非特許文献1、2、3)や、皮膚細菌叢における黄色ブドウ球菌のagrC変異依存性のRNAIII遺伝子発現量を検出すること(特許文献1)等が提案されているが、必ずしも十分な精度で診断が可能であるとは云えない。 In recent years, as a method for detecting atopic dermatitis using a biomarker, peripheral blood eosinophil count in blood, total serum IgE value, LDH (lactate dehydrogenase) level, and Symus and Activation-Regulated Chemokine (TARC) in serum have been used. And Squamous cell carcinoma antigen 2 (SCCA2) (Non-Patent Documents 1, 2 and 3), and the agrC mutation-dependent RNAIII gene expression level of Staphylococcus aureus in the skin flora (Patent Document 1). ) Etc. have been proposed, but it cannot always be said that diagnosis is possible with sufficient accuracy.
一方、生体試料中のDNAやRNA等の核酸の解析によりヒトの生体内の現在さらには将来の生理状態を調べる技術が開発されている。核酸を用いた解析は、網羅的な解析方法が確立されており一度の解析で豊富な情報を得られる、及び一塩基多形やRNA機能等に関する多くの研究報告に基づいて解析結果の機能的な紐付けが容易であるといった利点を有する。生体由来の核酸は、血液等の体液、分泌物、組織等から抽出することができるが、最近、皮膚表上脂質(skin surface lipids;SSL)に含まれるRNAを生体の解析用の試料として用いること、SSLから表皮、汗腺、毛包及び皮脂腺のマーカー遺伝子が検出できることが報告されている(特許文献2)。 On the other hand, a technique for investigating the current and future physiological states in a human body by analyzing nucleic acids such as DNA and RNA in a biological sample has been developed. For analysis using nucleic acids, a comprehensive analysis method has been established and abundant information can be obtained by one analysis, and the functional analysis results are based on many research reports on monobasic polymorphism and RNA function. It has the advantage of being easy to link. Nucleic acids derived from living organisms can be extracted from body fluids such as blood, secretions, tissues, etc. Recently, RNA contained in skin surface lipids (SSL) is used as a sample for analysis of living organisms. It has been reported that marker genes for epidermis, sweat glands, hair follicles and sebaceous glands can be detected from SSL (Patent Document 2).
本発明は、アトピー性皮膚炎を検出するためのマーカー、及び該マーカーを用いたアトピー性皮膚炎の検出方法を提供することに関する。 The present invention relates to providing a marker for detecting atopic dermatitis and a method for detecting atopic dermatitis using the marker.
本発明者らは、成人のアトピー性皮膚炎患者と健常人からSSLを採取し、SSL中に含まれるRNAの発現状態をシーケンス情報として網羅的に解析した結果、特定の遺伝子の発現レベルが両者の間で有意に異なり、これを指標としてアトピー性皮膚炎を検出できることを見出した。 The present inventors collected SSL from adult patients with atopic dermatitis and healthy subjects, and comprehensively analyzed the expression state of RNA contained in the SSL as sequence information. As a result, the expression levels of specific genes were both. It was found that atopic dermatitis can be detected using this as an index.
すなわち、本発明は、以下の1)〜3)に係るものである。
1)被験者から採取された生体試料について、MECR、RASA4CP、ARRDC4、EIF1AD、FDFT1、ZNF706、TEX2、TMPRSS11E、RPS6KB2、CTBP1、ZNF335、DGKA、PPP1R9B、SPDYE7P、DNASE1L1、GNB2及びCSNK1G2からなる17種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む、当該被験者におけるアトピー性皮膚炎の検出方法。
2)前記遺伝子と特異的にハイブリダイズするオリゴヌクレオチド、又は前記遺伝子の発現産物を認識する抗体を含有する、1)の方法に用いられるアトピー性皮膚炎を検出するための検査用キット。
3)後記表Bに示される210種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物からなる、アトピー性皮膚炎の検出マーカー。
That is, the present invention relates to the following 1) to 3).
1) Regarding biological samples collected from subjects, MECR, RASA4CP, ARRDC4, EIF1AD, FDFT1, ZNF706, TEX2, TMPRSS11E, RPS6KB2, CTBP1, ZNF335, DGKA, PPP1R9B, SPDYE7P, DNASE1L1 A method for detecting atopic dermatitis in a subject, comprising the step of measuring the expression level of at least one gene selected from the group or an expression product thereof.
2) A test kit for detecting atopic dermatitis used in the method 1), which contains an oligonucleotide that specifically hybridizes with the gene or an antibody that recognizes an expression product of the gene.
3) A marker for detecting atopic dermatitis, which comprises at least one gene selected from the 210 gene groups shown in Table B below or an expression product thereof.
本発明によれば、簡便且つ非侵襲的に、アトピー性皮膚炎を早期に、高い精度、感度及び特異度で検出することが可能となる。 According to the present invention, it is possible to detect atopic dermatitis at an early stage with high accuracy, sensitivity and specificity in a simple and non-invasive manner.
本明細書中で引用された全ての特許文献、非特許文献、及びその他の刊行物は、その全体が本明細書中において参考として援用される。 All patented, non-patented, and other publications cited herein are hereby incorporated by reference in their entirety.
本発明において、「核酸」又は「ポリヌクレオチド」と云う用語は、DNA又はRNAを意味する。DNAには、cDNA、ゲノムDNA、及び合成DNAのいずれもが含まれ、「RNA」には、total RNA、mRNA、rRNA、tRNA、non-coding RNA及び合成のRNAのいずれもが含まれる。 In the present invention, the term "nucleic acid" or "polynucleotide" means DNA or RNA. DNA includes any of cDNA, genomic DNA, and synthetic DNA, and "RNA" includes any of total RNA, mRNA, rRNA, tRNA, non-coding RNA, and synthetic RNA.
本発明において「遺伝子」とは、ヒトゲノムDNAを含む2本鎖DNAの他、cDNAを含む1本鎖DNA(正鎖)、当該正鎖と相補的な配列を有する1本鎖DNA(相補鎖)、及びこれらの断片を包含するものであって、DNAを構成する塩基の配列情報の中に、何らかの生物学的情報が含まれているものを意味する。
また、当該「遺伝子」は特定の塩基配列で表される「遺伝子」だけではなく、これらの同族体(すなわち、ホモログもしくはオーソログ)、遺伝子多型等の変異体、及び誘導体をコードする核酸が包含される。
本明細書中に開示される遺伝子の名称は、NCBI([www.ncbi.nlm.nih.gov/])に記載のあるOfficial Symbolに従う。一方で遺伝子オントロジー(GO)に関しては、String([string-db.org/])に記載のあるPathway ID.に従う。
In the present invention, the "gene" refers to double-stranded DNA containing human genomic DNA, single-stranded DNA containing cDNA (positive strand), and single-stranded DNA having a sequence complementary to the positive strand (complementary strand). , And those fragments, which include some biological information in the sequence information of the bases constituting the DNA.
In addition, the "gene" includes not only "genes" represented by specific base sequences, but also nucleic acids encoding these homologues (that is, homologs or orthologs), mutants such as gene polymorphisms, and derivatives. Will be done.
The names of the genes disclosed herein follow the Official Symbol described in NCBI ([www.ncbi.nlm.nih.gov/]). On the other hand, regarding Gene Ontology (GO), Pathway ID. Follow.
本発明において、遺伝子の「発現産物」とは、遺伝子の転写産物及び翻訳産物を包含する概念である。「転写産物」とは、遺伝子(DNA)から転写されて生じるRNAであり、「翻訳産物」とは、RNAに基づき翻訳合成される、遺伝子にコードされたタンパク質を意味する。 In the present invention, the "expression product" of a gene is a concept including a transcript and a translation product of the gene. The "transcription product" is RNA produced by being transcribed from a gene (DNA), and the "translation product" means a protein encoded by a gene that is translated and synthesized based on RNA.
本発明において、「アトピー性皮膚炎」とは、増悪・寛解を繰り返す、そう痒のある湿疹を主病原とする疾患を指し、その患者の多くは、アトピー素因を持つとされている。アトピー素因としては、i)家族歴・既往歴(気管支喘息,アレルギー性鼻炎・結膜炎,アトピー性皮膚炎のうちいずれか,あるいは複数の疾患)、又はii)IgE 抗体を産生し易い素因が挙げられる。 In the present invention, "atopic dermatitis" refers to a disease caused by pruritic eczema, which repeats exacerbations and remissions, and many of the patients are said to have an atopic predisposition. Examples of atopic predisposition include i) family history / medical history (one or more of bronchial asthma, allergic rhinitis / conjunctivitis, and atopic dermatitis), or ii) predisposition to easily produce IgE antibody. ..
本発明において、アトピー性皮膚炎の「検出」とは、アトピー性皮膚炎の存在又は不存在を明らかにする意味であり、検査、測定、判定、評価又は評価支援という用語で言い換えることもできる。なお、本明細書において「判定」又は「評価」という用語は、医師による判定や評価を含むものではない。 In the present invention, "detection" of atopic dermatitis means to clarify the presence or absence of atopic dermatitis, and can be paraphrased by the terms inspection, measurement, judgment, evaluation or evaluation support. In addition, the term "judgment" or "evaluation" in this specification does not include judgment or evaluation by a doctor.
本明細書において、「特徴量」とは機械学習における「説明変数」と同義であり、アトピー性皮膚炎検出マーカーから選択される機械学習に使用する遺伝子又はその発現産物を合わせて「特徴量遺伝子」と称する。 In the present specification, "feature amount" is synonymous with "explanatory variable" in machine learning, and a gene used for machine learning selected from atopic dermatitis detection markers or an expression product thereof is combined to form a "feature amount gene". ".
後述する実施例に示すように、成人の健常者14名及びアトピー性皮膚炎患者29名のSSLから抽出されたRNAの発現量のデータ(リードカウント値)について、DESeq2(Love MI et al. Genome Biol. 2014)を用いて補正されたカウント値(Normalized count値)を用いて、健常者と比較してアトピー性皮膚炎患者における尤度比検定によるp値の補正値(FDR)が0.05未満となるRNAを抽出することにより、発現上昇遺伝子48種、発現低下遺伝子75種(計123遺伝子(表1−1〜1−3)が同定された。表中、「UP」で示される遺伝子は、アトピー性皮膚炎患者で発現レベルが上がる遺伝子であり、「DOWN」で示される遺伝子は、アトピー性皮膚炎患者で発現レベルが下がる遺伝子である。
したがって、斯かる123種の遺伝子群より選択される遺伝子又はその発現産物は、アトピー性皮膚炎を検出するためのアトピー性皮膚炎マーカーとなり得る。当該遺伝子群のうち107遺伝子(表1−1〜1−3において*を付し太字で表示)は、これまでにアトピー性皮膚炎との関係が報告されていない遺伝子である。
As shown in Examples described later, DESeq2 (Love MI et al. Genome) was used for RNA expression level data (read count value) extracted from the SSL of 14 healthy adult subjects and 29 atopic dermatitis patients. Using the count value (Normalized count value) corrected using Biol. 2014), the correction value (FDR) of the p value by the likelihood ratio test in patients with atopic dermatitis was 0.05 compared to healthy subjects. By extracting RNA that is less than, 48 types of up-expression genes and 75 types of down-expression genes (total of 123 genes (Tables 1-1 to 1-3) were identified. Genes indicated by "UP" in the table. Is a gene whose expression level is increased in patients with atopic dermatitis, and a gene represented by "DOWN" is a gene whose expression level is decreased in patients with atopic dermatitis.
Therefore, a gene selected from the 123 gene groups or an expression product thereof can be a marker for atopic dermatitis for detecting atopic dermatitis. Of the gene group, 107 genes (marked with * in Tables 1-1 to 1-3 and indicated in bold) are genes for which no relationship with atopic dermatitis has been reported so far.
また、被験者からの全てのSSL由来RNAの発現量のデータ(7429遺伝子のLog2(RPM+1)値)を説明変数とし、健常者とアトピー性皮膚炎患者を目的変数とし、機械学習アルゴリズムとしてランダムフォレスト(Breiman L. Machine Learning (2001) 45;5-32)を用いて特徴量遺伝子の抽出及び予測モデルの構築を試みた。後述する実施例に示すように、ジニ係数に基づく変数重要度の上位150遺伝子(表3−1〜3−4)を特徴量遺伝子として選択し、これを用いて予測モデルを構築したところ、アトピー性皮膚炎の予測が可能であることが示された。
したがって、斯かる150種の遺伝子群より選択される遺伝子又はその発現産物は、アトピー性皮膚炎を検出するための好適なアトピー性皮膚炎マーカーとなり得る。そして、このうち127遺伝子(表3−1〜3−4において*を付し太字で表示)は、これまでにアトピー性皮膚炎との関係が報告されていない新規なアトピー性皮膚炎マーカーである。後述する実施例に示すように、これら新規のアトピー性皮膚炎マーカーを用いた予測モデルでもアトピー性皮膚炎の予測が可能である。
In addition, data on the expression levels of all SSL-derived RNAs from the subjects (Log 2 (RPM + 1) value of the 7429 gene) were used as explanatory variables, and healthy subjects and patients with atopic dermatitis were used as objective variables, and a random forest was used as a machine learning algorithm. Using (Breiman L. Machine Learning (2001) 45; 5-32), we attempted to extract feature-quantity genes and construct a prediction model. As shown in Examples described later, the top 150 genes with variable importance based on the Gini coefficient (Tables 3-1 to 3-4) were selected as feature genes, and a prediction model was constructed using them. As a result, atopy was constructed. It has been shown that sexual dermatitis can be predicted.
Therefore, a gene selected from such a group of 150 genes or an expression product thereof can be a suitable marker for atopic dermatitis for detecting atopic dermatitis. Of these, 127 genes (marked with * in Tables 3-1 to 3-4 and indicated in bold) are novel atopic dermatitis markers for which no relationship with atopic dermatitis has been reported so far. .. As shown in Examples described later, atopic dermatitis can be predicted even with a prediction model using these novel atopic dermatitis markers.
また、健常者とアトピー性皮膚炎患者で発現変動が見られた上記の123遺伝子又はそのうちの107遺伝子の発現量のデータ(Log2(RPM+1)値)を用いて、同様にランダムフォレストを用いて予測モデルの構築を試みたところ、いずれにおいてもアトピー性皮膚炎の予測が可能であることが示された。 In addition, using the data (Log 2 (RPM + 1) value) of the expression levels of the above 123 genes or 107 genes of which expression fluctuations were observed in healthy subjects and patients with atopic dermatitis, similarly using a random forest. When we tried to build a predictive model, it was shown that atopic dermatitis can be predicted in any case.
また、機械学習アルゴリズムとしてBoruta法(Kursa et al. Fundamental Informaticae (2010) 101;271-286)を用いて特徴量遺伝子の抽出(最大試行回数1000回、p値0.01未満)を行ったところ、45遺伝子(表4)が特徴量遺伝子として抽出され、後述の実施例で示すように、これを用いたランダムフォレストによる予測モデルでアトピー性皮膚炎の予測が可能であることが示された。
したがって、斯かる45種の遺伝子群より選択される遺伝子又はその発現産物は、アトピー性皮膚炎を検出するための好適なアトピー性皮膚炎マーカーとなり得る。そして、このうち39遺伝子(表4において*を付し太字で表示)は、これまでにアトピー性皮膚炎との関係が報告されていない新規なアトピー性皮膚炎マーカーである。後述する実施例に示すように、これら新規のアトピー性皮膚炎マーカーを用いた予測モデルでもアトピー性皮膚炎の予測が可能である。
In addition, the feature gene was extracted using the Boruta method (Kursa et al. Fundamental Informaticae (2010) 101; 271-286) as a machine learning algorithm (maximum number of trials 1000 times, p value less than 0.01). , 45 genes (Table 4) were extracted as feature genes, and as shown in Examples described later, it was shown that atopic dermatitis can be predicted by a prediction model using a random forest using these genes.
Therefore, a gene selected from such a group of 45 genes or an expression product thereof can be a suitable marker for atopic dermatitis for detecting atopic dermatitis. Of these, 39 genes (marked with * in Table 4 and indicated in bold) are novel atopic dermatitis markers for which no relationship with atopic dermatitis has been reported so far. As shown in Examples described later, atopic dermatitis can be predicted even with a prediction model using these novel atopic dermatitis markers.
上述した発現変動解析で抽出された表1−1〜1−3で示される123種の遺伝子群(A)と、ランダムフォレストにより特徴量遺伝子として選択された表3−1〜3−4で示される150種の遺伝子群(B)と、Boruta法により特徴量遺伝子として選択された表4で示される45種の遺伝子群(C)の和(A∪B∪C)である245遺伝子(表A)はアトピー性皮膚炎マーカーとなり、そのうち210遺伝子(表B)は新規なアトピー性皮膚炎マーカーである。
The 123 gene groups (A) shown in Tables 1-1 to 1-3 extracted by the above-mentioned expression fluctuation analysis and Tables 3-1 to 3-4 selected as characteristic amount genes by a random forest are shown. 245 genes (Table A), which is the sum (A∪B∪C) of the 150 gene groups (B) and the 45 gene groups (C) shown in Table 4 selected as the feature amount genes by the Boruta method. ) Is a marker for atopic dermatitis, of which 210 genes (Table B) are novel markers for atopic dermatitis.
本発明のMECR、RASA4CP、ARRDC4、EIF1AD、FDFT1、ZNF706、TEX2、TMPRSS11E、RPS6KB2、CTBP1、ZNF335、DGKA、PPP1R9B、SPDYE7P、DNASE1L1、GNB2及びCSNK1G2からなる17種の遺伝子は、上述した発現変動解析で抽出された表1−1〜1−3で示される123種の遺伝子群(A)と、ランダムフォレストにより特徴量遺伝子として選択された表3−1〜3−4で示される150種の遺伝子群(B)と、Boruta法により特徴量遺伝子として選択された表4で示される45種の遺伝子群(C)に共通する遺伝子(A∩B∩C)であって、従来アトピー性皮膚炎と関連付けられていない遺伝子である(各表において*を付し太字で表示)。したがって、これらの遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物は、アトピー性皮膚炎を検出するための、新規なアトピー性皮膚炎マーカーとして特に有用である。
斯かる17種の遺伝子はそれぞれ単独でアトピー性皮膚炎マーカーとなり得るが、2種以上、好ましくは5種以上、より好ましくは10種以上を組み合わせて用いることが好ましく、17種全てを用いるのがよりさらに好ましい。
MECR, RASA4CP, ARRDC4, EIF1AD, FDFT1, ZNF706, TEX2, TMPRSS11E, RPS6KB2, CTBP1, ZNF335, DGKA, PPP1R9B, SPDYE7P, DNASE1L1, GNB2 and CSNK1 123 gene groups (A) shown in Tables 1-1 to 1-3 extracted and 150 gene groups shown in Tables 3-1 to 3-4 selected as feature genes by random forest. (B) and the gene (A∩B∩C) common to the 45 gene groups (C) shown in Table 4 selected as the feature gene by the Boruta method, and are conventionally associated with atopic dermatitis. Genes that have not been identified (marked with * in each table and shown in bold). Therefore, at least one gene selected from these gene groups or an expression product thereof is particularly useful as a novel atopic dermatitis marker for detecting atopic dermatitis.
Each of these 17 genes can be a marker for atopic dermatitis alone, but it is preferable to use 2 or more, preferably 5 or more, more preferably 10 or more in combination, and it is preferable to use all 17 genes. Even more preferable.
なお、上記のアトピー性皮膚炎マーカーとなり得る遺伝子(以下、「標的遺伝子」とも称す)には、アトピー性皮膚炎を検出するためのバイオマーカーとなり得る限り、当該遺伝子を構成するDNAの塩基配列と実質的に同一の塩基配列を有する遺伝子も包含される。ここで、実質的に同一の塩基配列とは、例えば、相同性計算アルゴリズムNCBI BLASTを用い、期待値=10;ギャップを許す;フィルタリング=ON;マッチスコア=1;ミスマッチスコア=−3の条件にて検索をした場合、当該遺伝子を構成するDNAの塩基配列と90%以上、好ましくは95%以上、さらにより好ましく98%以上の同一性があることを意味する。 The gene that can be a marker for atopic dermatitis (hereinafter, also referred to as "target gene") includes the base sequence of the DNA that constitutes the gene as long as it can be a biomarker for detecting atopic dermatitis. Genes having substantially the same base sequence are also included. Here, with substantially the same base sequence, for example, the homology calculation algorithm NCBI BLAST is used, and the condition of expected value = 10; gap is allowed; filtering = ON; match score = 1; mismatch score = -3. It means that there is 90% or more, preferably 95% or more, and even more preferably 98% or more identity with the base sequence of the DNA constituting the gene.
本発明のアトピー性皮膚炎の検出方法は、被験者から採取された生体試料について、標的遺伝子、一態様として、MECR、RASA4CP、ARRDC4、EIF1AD、FDFT1、ZNF706、TEX2、TMPRSS11E、RPS6KB2、CTBP1、ZNF335、DGKA、PPP1R9B、SPDYE7P、DNASE1L1、GNB2及びCSNK1G2からなる17種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む。 The method for detecting atopic dermatitis of the present invention is a target gene, as one embodiment, MECR, RASA4CP, ARRDC4, EIF1AD, FDFT1, ZNF706, TEX2, TMPRSS11E, RPS6KB2, CTBP1, ZNF335, for a biological sample collected from a subject. It comprises a step of measuring the expression level of at least one gene selected from a group of 17 genes consisting of DGKA, PPP1R9B, SPDYE7P, DNASE1L1, GNB2 and CSNK1G2 or an expression product thereof.
本発明において用いられる生体試料としては、アトピー性皮膚炎の発症、進行に伴い本発明の遺伝子が発現変化する組織及び生体材料であればよい。具体的には臓器、皮膚、血液、尿、唾液、汗、皮膚表上脂質(SSL)、組織浸出液等の体液、血液から調製された血清、血漿、その他、便、毛髪等が挙げられ、好ましくは皮膚または皮膚表上脂質(SSL)、より好ましくは皮膚表上脂質(SSL)が挙げられる。
また、生体試料を採取する被験体は、アトピー性皮膚炎の検出を必要とする人又はアトピー性皮膚炎の発症が疑われる人が好ましく、性別及び年齢は限定されないが、好ましくは成人であり、具体的には16歳以上の人であり、好ましくは20歳以上の人である。
The biological sample used in the present invention may be a tissue or a biomaterial whose expression changes with the onset and progression of atopic dermatitis. Specific examples thereof include body fluids such as organs, skin, blood, urine, saliva, sweat, skin surface lipids (SSL) and tissue exudates, serum prepared from blood, plasma, others, stool, hair and the like, which are preferable. Is skin or skin surface lipid (SSL), more preferably skin surface lipid (SSL).
In addition, the subject for which the biological sample is collected is preferably a person who needs to detect atopic dermatitis or a person who is suspected of developing atopic dermatitis, and is not limited in gender and age, but is preferably an adult. Specifically, it is a person 16 years or older, preferably a person 20 years or older.
ここで、「皮膚表上脂質(SSL)」とは、皮膚の表上に存在する脂溶性画分をいい、皮脂と呼ばれることもある。一般に、SSLは、皮膚にある皮脂腺等の外分泌腺から分泌された分泌物を主に含み、皮膚表面を覆う薄い層の形で皮膚表上に存在している。SSLは、皮膚細胞で発現したRNAを含む。(前記特許文献3参照)。また本明細書において、「皮膚」とは、特に限定しない限り、体表の表皮、真皮、毛包、ならびに汗腺、皮脂腺及びその他の腺等の組織を含む領域の総称である。 Here, "skin surface lipid (SSL)" refers to a fat-soluble fraction existing on the surface of the skin, and is sometimes called sebum. In general, SSL mainly contains secretions secreted from exocrine glands such as sebaceous glands in the skin, and is present on the surface of the skin in the form of a thin layer covering the skin surface. SSL contains RNA expressed in skin cells. (See Patent Document 3 above). Further, in the present specification, "skin" is a general term for regions including the epidermis, dermis, hair follicles, and tissues such as sweat glands, sebaceous glands, and other glands on the body surface, unless otherwise specified.
被験者の皮膚からのSSLの採取には、皮膚からのSSLの回収又は除去に用いられているあらゆる手段を採用することができる。好ましくは、後述するSSL吸収性素材、SSL接着性素材、又は皮膚からSSLをこすり落とす器具を使用することができる。SSL吸収性素材又はSSL接着性素材としては、SSLに親和性を有する素材であれば特に限定されず、例えばポリプロピレン、パルプ等が挙げられる。皮膚からのSSLの採取手順のより詳細な例としては、あぶら取り紙、あぶら取りフィルム等のシート状素材へSSLを吸収させる方法、ガラス板、テープ等へSSLを接着させる方法、スパーテル、スクレイパー等によりSSLをこすり落として回収する方法、等が挙げられる。SSLの吸着性を向上させるため、脂溶性の高い溶媒を予め含ませたSSL吸収性素材を用いてもよい。一方、SSL吸収性素材は、水溶性の高い溶媒や水分を含んでいるとSSLの吸着が阻害されるため、水溶性の高い溶媒や水分の含有量が少ないことが好ましい。SSL吸収性素材は、乾燥した状態で用いることが好ましい。SSLが採取される皮膚の部位としては、特に限定されず、頭、顔、首、体幹、手足等の身体の任意の部位の皮膚が挙げられ、皮脂の分泌が多い部位、例えば顔の皮膚が好ましい。 For the collection of SSL from the subject's skin, any means used to recover or remove SSL from the skin can be employed. Preferably, an SSL-absorbing material, an SSL-adhesive material, or an instrument that scrapes the SSL from the skin, which will be described later, can be used. The SSL-absorbing material or the SSL-adhesive material is not particularly limited as long as it is a material having an affinity for SSL, and examples thereof include polypropylene and pulp. More detailed examples of the procedure for collecting SSL from the skin include a method of absorbing SSL into a sheet-like material such as oil removal paper and oil removal film, a method of adhering SSL to a glass plate, tape, etc., a spatula, a scraper, etc. There is a method of scraping off the SSL and collecting the SSL. In order to improve the adsorptivity of SSL, an SSL-absorbing material containing a highly lipophilic solvent in advance may be used. On the other hand, if the SSL-absorbent material contains a highly water-soluble solvent or water, the adsorption of SSL is inhibited, so that the content of the highly water-soluble solvent or water is preferably small. The SSL-absorbent material is preferably used in a dry state. The part of the skin from which the SSL is collected is not particularly limited, and examples thereof include the skin of any part of the body such as the head, face, neck, trunk, and limbs, and the part where sebum is secreted, for example, the skin of the face. Is preferable.
被験者から採取されたRNA含有SSLは一定期間保存されてもよい。採取されたSSLは、含有するRNAの分解を極力抑えるために、採取後できるだけ速やかに低温条件で保存することが好ましい。本発明における該RNA含有SSLの保存の温度条件は、0℃以下であればよく、好ましくは−20±20℃〜−80±20℃、より好ましくは−20±10℃〜−80±10℃、さらに好ましくは−20±20℃〜−40±20℃、さらに好ましくは−20±10℃〜−40±10℃、さらに好ましくは−20±10℃、さらに好ましくは−20±5℃である。該RNA含有SSLの該低温条件での保存の期間は、特に限定されないが、好ましくは12か月以下、例えば6時間以上12ヶ月以下、より好ましくは6ヶ月以下、例えば1日間以上6ヶ月以下、さらに好ましくは3ヶ月以下、例えば3日間以上3ヶ月以下である。 RNA-containing SSL collected from the subject may be stored for a period of time. The collected SSL is preferably stored under low temperature conditions as soon as possible after collection in order to suppress the decomposition of the contained RNA as much as possible. The storage temperature condition of the RNA-containing SSL in the present invention may be 0 ° C. or lower, preferably −20 ± 20 ° C. to −80 ± 20 ° C., more preferably −20 ± 10 ° C. to −80 ± 10 ° C. , More preferably −20 ± 20 ° C. to −40 ± 20 ° C., further preferably −20 ± 10 ° C. to −40 ± 10 ° C., further preferably −20 ± 10 ° C., still more preferably −20 ± 5 ° C. .. The storage period of the RNA-containing SSL under the low temperature condition is not particularly limited, but is preferably 12 months or less, for example, 6 hours or more and 12 months or less, more preferably 6 months or less, for example, 1 day or more and 6 months or less. More preferably, it is 3 months or less, for example, 3 days or more and 3 months or less.
本発明において、標的遺伝子又はその発現産物の発現レベルの測定対象としては、RNAから人工的に合成されたcDNA、そのRNAをエンコードするDNA、そのRNAにコードされるタンパク質、該タンパク質と相互作用をする分子、そのRNAと相互作用する分子、又はそのDNAと相互作用する分子等が挙げられる。ここで、RNA、DNA又はタンパク質と相互作用する分子としては、DNA、RNA、タンパク質、多糖、オリゴ糖、単糖、脂質、脂肪酸、及びこれらのリン酸化物、アルキル化物、糖付加物等、及び上記いずれかの複合体が挙げられる。また、発現レベルとは、当該遺伝子又は発現産物の発現量や活性を包括的に意味する。 In the present invention, as a target for measuring the expression level of a target gene or an expression product thereof, a cDNA artificially synthesized from RNA, a DNA encoding the RNA, a protein encoded by the RNA, and an interaction with the protein are used. Examples include molecules that interact with RNA, molecules that interact with DNA, and the like. Here, examples of molecules that interact with RNA, DNA or protein include DNA, RNA, proteins, polysaccharides, oligosaccharides, monosaccharides, lipids, fatty acids, their phosphorylates, alkylated products, sugar adducts and the like, and the like. Any of the above complexes can be mentioned. The expression level comprehensively means the expression level and activity of the gene or expression product.
本発明の方法においては、好ましい態様として、生体試料としてSSLが用いられるが、この場合にはSSLに含まれるRNAの発現レベルが解析され、具体的にはRNAを逆転写によりcDNAに変換した後、該cDNA又はその増幅産物が測定される。
SSLからのRNAの抽出には、生体試料からのRNAの抽出又は精製に通常使用される方法、例えば、フェノール/クロロホルム法、AGPC(acid guanidinium thiocyanate−phenol−chloroform extraction)法、又はTRIzol(登録商標)、RNeasy(登録商標)、QIAzol(登録商標)等のカラムを用いた方法、シリカをコーティングした特殊な磁性体粒子を用いる方法、Solid Phase Reversible Immobilization磁性体粒子を用いる方法、ISOGEN等の市販のRNA抽出試薬による抽出等を用いることができる。
In the method of the present invention, SL is used as a biological sample as a preferred embodiment. In this case, the expression level of RNA contained in SSL is analyzed, and specifically, after RNA is converted to cDNA by reverse transcription. , The cDNA or its amplification product is measured.
For the extraction of RNA from SSL, methods commonly used for extracting or purifying RNA from biological samples, such as the phenol / chloroform method, the AGPC (acid guanidinium thiocyanate-phenyl-chromoform extraction) method, or TRIzol®. ), RNAy®, QIAzol® and other columns, silica-coated special magnetic particles, Solid Phase Reversible Imaging magnetic particles, ISOGEN and other commercially available products. Extraction with an RNA extraction reagent or the like can be used.
該逆転写には、解析したい特定のRNAを標的としたプライマーを用いてもよいが、より包括的な核酸の保存及び解析のためにはランダムプライマーを用いることが好ましい。該逆転写には、一般的な逆転写酵素又は逆転写試薬キットを使用することができる。好適には、正確性及び効率性の高い逆転写酵素又は逆転写試薬キットが用いられ、その例としては、M−MLV Reverse Transcriptase及びその改変体、あるいは市販の逆転写酵素又は逆転写試薬キット、例えばPrimeScript(登録商標)Reverse Transcriptaseシリーズ(タカラバイオ社)、SuperScript(登録商標)Reverse Transcriptaseシリーズ(Thermo Scientific社)等が挙げられる。SuperScript(登録商標)III Reverse Transcriptase、SuperScript(登録商標)VILO cDNA Synthesis kit(いずれもThermo Scientific社)等が好ましく用いられる。
該逆転写における伸長反応は、温度を好ましくは42℃±1℃、より好ましくは42℃±0.5℃、さらに好ましくは42℃±0.25℃に調整し、一方、反応時間を好ましくは60分間以上、より好ましくは80〜120分間に調整するのが好ましい。
For the reverse transcription, primers targeting the specific RNA to be analyzed may be used, but it is preferable to use random primers for more comprehensive nucleic acid storage and analysis. A general reverse transcriptase or reverse transcriptase kit can be used for the reverse transcription. Preferably, a highly accurate and efficient reverse transcriptase or reverse transcriptase kit is used, and examples thereof include M-MLV Reverse Transcriptase and its variants, or commercially available reverse transcriptase or reverse transcriptase kits. For example, PrimeScript (registered trademark) Reverse Transcriptase series (Takara Bio Co., Ltd.), SuperScript (registered trademark) Reverse Transcriptase series (Thermo Scientific) and the like can be mentioned. SuperScript (registered trademark) III Reverse Transcriptase, SuperScript (registered trademark) VILO cDNA Synthesis kit (both from Thermo Scientific) and the like are preferably used.
For the extension reaction in the reverse transcription, the temperature is preferably adjusted to 42 ° C. ± 1 ° C., more preferably 42 ° C. ± 0.5 ° C., still more preferably 42 ° C. ± 0.25 ° C., while the reaction time is preferably adjusted to 42 ° C. ± 0.25 ° C. It is preferably adjusted for 60 minutes or more, more preferably 80 to 120 minutes.
発現レベルを測定する方法は、RNA、cDNA又はDNAを対象とする場合、これらにハイブリダイズするDNAをプライマーとしたPCR法、リアルタイムRT−PCR法、マルチプレックスPCR、SmartAmp法、LAMP法等に代表される核酸増幅法、これらにハイブリダイズする核酸をプローブとして用いるハイブリダイゼーション法(DNAチップ、DNAマイクロアレイ、ドットブロットハイブリダイゼーション、スロットブロットハイブリダイゼーション、ノーザンブロットハイブリダイゼーション等)、塩基配列を決定する方法(シーケンシング)、又はこれらを組み合わせた方法から選ぶことができる。 When RNA, cDNA or DNA is targeted, the method for measuring the expression level is represented by the PCR method using the DNA hybridizing to these as a primer, the real-time RT-PCR method, the multiplex PCR, the SmartAmp method, the LAMP method, and the like. Nucleic acid amplification method, hybridization method using nucleic acid hybridizing to these as a probe (DNA chip, DNA microarray, dot blot hybridization, slot blot hybridization, Northern blot hybridization, etc.), method for determining base sequence ( Sequencing) or a combination of these methods can be selected.
PCRでは、解析したい特定のDNAを標的としたプライマーペアを用いて該特定の1種のDNAのみを増幅してもよいが、複数のプライマーペアを用いて同時に複数の特定のDNAを増幅してもよい。好ましくは、該PCRはマルチプレックスPCRである。マルチプレックスPCRは、PCR反応系に複数のプライマー対を同時に使用することで、複数の遺伝子領域を同時に増幅する方法である。マルチプレックスPCRは、市販のキット(例えば、Ion AmpliSeqTranscriptome Human Gene Expression Kit;ライフテクノロジーズジャパン株式会社等)を用いて実施することができる。
該PCRにおけるアニーリング及び伸長反応の温度は、使用するプライマーに依存するため一概には言えないが、上記のマルチプレックスPCRキットは用いる場合、好ましくは62℃±1℃、より好ましくは62℃±0.5℃、さらに好ましくは62℃±0.25℃である。したがって、該PCRでは、好ましくはアニーリング及び伸長反応が1ステップで行われる。該アニーリング及び伸長反応のステップの時間は、増幅すべきDNAのサイズ等に依存して調整され得るが、好ましくは14〜18分間である。該PCRにおける変性反応の条件は、増幅すべきDNAに依存して調整され得るが、好ましくは95〜99℃で10〜60秒間である。上記のような温度及び時間での逆転写及びPCRは、一般的にPCRに使用されるサーマルサイクラーを用いて実行することができる。
In PCR, only one specific DNA may be amplified using a primer pair targeting a specific DNA to be analyzed, but a plurality of specific DNAs may be amplified at the same time using a plurality of primer pairs. May be good. Preferably, the PCR is multiplex PCR. Multiplex PCR is a method of simultaneously amplifying a plurality of gene regions by simultaneously using a plurality of primer pairs in a PCR reaction system. Multiplex PCR can be carried out using a commercially available kit (for example, Ion AmpliSeqTranscriptome Human Gene Expression Kit; Life Technologies Japan Co., Ltd., etc.).
The temperature of the annealing and extension reactions in the PCR cannot be unequivocally determined because it depends on the primers used, but when the above multiplex PCR kit is used, it is preferably 62 ° C ± 1 ° C, more preferably 62 ° C ± 0. It is 5.5 ° C., more preferably 62 ° C. ± 0.25 ° C. Therefore, in the PCR, the annealing and extension reactions are preferably carried out in one step. The time of the annealing and extension reaction steps can be adjusted depending on the size of the DNA to be amplified and the like, but is preferably 14 to 18 minutes. The conditions of the denaturation reaction in the PCR can be adjusted depending on the DNA to be amplified, but are preferably 95 to 99 ° C. for 10 to 60 seconds. Reverse transcription and PCR at temperature and time as described above can be performed using a thermal cycler commonly used for PCR.
当該PCRで得られた反応産物の精製は、反応産物のサイズ分離によって行われることが好ましい。サイズ分離により、目的のPCR反応産物を、PCR反応液中に含まれるプライマーやその他の不純物から分離することができる。DNAのサイズ分離は、例えば、サイズ分離カラムや、サイズ分離チップ、サイズ分離に利用可能な磁気ビーズ等によって行うことができる。サイズ分離に利用可能な磁気ビーズの好ましい例としては、Ampure XP等のSolid Phase Reversible Immobilization(SPRI)磁性ビーズが挙げられる。 Purification of the reaction product obtained by the PCR is preferably performed by size separation of the reaction product. By size separation, the PCR reaction product of interest can be separated from the primers and other impurities contained in the PCR reaction solution. DNA size separation can be performed by, for example, a size separation column, a size separation chip, magnetic beads that can be used for size separation, or the like. Preferred examples of magnetic beads that can be used for size separation include Solid Phase Reversible Imaging (SPRI) magnetic beads such as Aple XP.
精製したPCR反応産物に対して、その後の定量解析を行うために必要なさらなる処理を施してもよい。例えば、DNAのシーケンシングのために、精製したPCR反応産物を、適切なバッファー溶液へと調製したり、PCR増幅されたDNAに含まれるPCRプライマー領域を切断したり、増幅されたDNAにアダプター配列をさらに付加したりしてもよい。例えば、精製したPCR反応産物をバッファー溶液へと調製し、増幅DNAに対してPCRプライマー配列の除去及びアダプターライゲーションを行い、得られた反応産物を、必要に応じて増幅して、定量解析のためのライブラリーを調製することができる。これらの操作は、例えば、SuperScript(登録商標)VILO cDNA Synthesis kit(ライフテクノロジーズジャパン株式会社)に付属している5×VILO RT Reaction Mix、及びIon AmpliSeq Transcriptome Human Gene Expression Kit(ライフテクノロジーズジャパン株式会社)に付属している5×Ion AmpliSeq HiFi Mix、及びIon AmpliSeq Transcriptome Human Gene Expression Core Panelを用いて、各キット付属のプロトコルに従って行うことができる。 The purified PCR reaction product may be subjected to further treatment necessary for subsequent quantitative analysis. For example, for DNA sequencing, the purified PCR reaction product can be prepared into a suitable buffer solution, the PCR primer region contained in the PCR-amplified DNA can be cleaved, or the adapter sequence can be added to the amplified DNA. May be further added. For example, the purified PCR reaction product is prepared into a buffer solution, the PCR primer sequence is removed and adapter ligation is performed on the amplified DNA, and the obtained reaction product is amplified as necessary for quantitative analysis. Library can be prepared. These operations are performed, for example, by 5 × VILO RT Reaction Mix attached to SuperScript (registered trademark) VILO cDNA Synthesis kit (Life Technologies Japan Co., Ltd.) and Ion AmpliSeq Transcriptome Human Gene Expression Japan Co., Ltd. It can be performed according to the protocol included in each kit using the 5 × Ion Ampliseq HiFi Mix and the Ion Ampliseq Transcriptome Human Gene Expression Core Panel included in the kit.
ノーザンブロットハイブリダイゼーション法を利用して標的遺伝子又はそれに由来する核酸の発現量を測定する場合は、例えば、まずプローブDNAを放射性同位元素、蛍光物質等で標識し、次いで、得られた標識DNAを、常法に従ってナイロンメンブレン等にトランスファーした生体試料由来のRNAとハイブリダイズさせる。その後、形成された標識DNAとRNAとの二重鎖を、標識物に由来するシグナルを検出することにより測定する方法が挙げられる。 When measuring the expression level of a target gene or a nucleic acid derived from it using the Northern blot hybridization method, for example, the probe DNA is first labeled with a radioactive isotope, a fluorescent substance, or the like, and then the obtained labeled DNA is used. , Hybridize with RNA derived from a biological sample transferred to a nylon membrane or the like according to a conventional method. Then, a method of measuring the double chain of the formed labeled DNA and RNA by detecting a signal derived from the labeled substance can be mentioned.
RT−PCR法を用いて標的遺伝子又はそれに由来する核酸の発現量を測定する場合は、例えば、まず生体試料由来のRNAから常法に従ってcDNAを調製し、これを鋳型として本発明の標的遺伝子が増幅できるように調製した一対のプライマー(上記cDNA(−鎖)に結合する正鎖、+鎖に結合する逆鎖)をこれとハイブリダイズさせる。その後、常法に従ってPCR法を行い、得られた増幅二本鎖DNAを検出する。増幅された二本鎖DNAの検出には、予めRI、蛍光物質等で標識しておいたプライマーを用いて上記PCRを行うことによって産生される標識二本鎖DNAを検出する方法等を用いることができる。 When measuring the expression level of a target gene or a nucleic acid derived from the target gene using the RT-PCR method, for example, cDNA is first prepared from RNA derived from a biological sample according to a conventional method, and the target gene of the present invention is used as a template. A pair of primers prepared for amplification (a normal chain that binds to the above-mentioned cDNA (-chain) and a reverse chain that binds to the + chain) are hybridized with this. Then, the PCR method is performed according to a conventional method, and the obtained amplified double-stranded DNA is detected. To detect the amplified double-stranded DNA, a method for detecting the labeled double-stranded DNA produced by performing the above PCR using a primer labeled with RI, a fluorescent substance, or the like in advance is used. Can be done.
DNAマイクロアレイを用いて標的遺伝子又はそれに由来する核酸の発現量を測定する場合は、例えば、支持体に本発明の標的遺伝子由来の核酸(cDNA又はDNA)の少なくとも1種を固定化したアレイを用い、mRNAから調製した標識化cDNA又はcRNAをマイクロアレイ上に結合させ、マイクロアレイ上の標識を検出することによって、mRNAの発現量を測定することができる。
前記アレイに固定化される核酸としては、ストリンジェントな条件下に特異的(すなわち、実質的に目的の核酸のみに)にハイブリダイズする核酸であればよく、例えば、本発明の標的遺伝子の全配列を有する核酸であってもよく、部分配列からなる核酸であってもよい。ここで、「部分配列」とは、少なくとも15〜25塩基からなる核酸が挙げられる。ここでストリンジェントな条件は、通常「1×SSC、0.1%SDS、37℃」程度の洗浄条件を挙げることができ、より厳しいハイブリダイズ条件としては「0.5×SSC、0.1%SDS、42℃」程度、さらに厳しいハイブリダイズ条件としては「0.1×SSC、0.1%SDS、65℃」程度の条件を挙げることができる。ハイブリダイズ条件は、J. Sambrook et al., Molecular Cloning: A Laboratory Manual, Thrd Edition, Cold Spring Harbor Laboratory Press (2001)等に記載されている。
When measuring the expression level of a target gene or a nucleic acid derived from the target gene using a DNA microarray, for example, an array in which at least one of the nucleic acids (cDNA or DNA) derived from the target gene of the present invention is immobilized on a support is used. , Labeled cDNA or cRNA prepared from mRNA can be bound on a microarray, and the expression level of mRNA can be measured by detecting the label on the microarray.
The nucleic acid immobilized on the array may be a nucleic acid that specifically hybridizes under stringent conditions (that is, substantially only to the nucleic acid of interest), and for example, all of the target genes of the present invention. It may be a nucleic acid having a sequence or a nucleic acid consisting of a partial sequence. Here, the "partial sequence" includes nucleic acids consisting of at least 15 to 25 bases. Here, stringent conditions can usually include cleaning conditions of about "1 x SSC, 0.1% SDS, 37 ° C.", and stricter hybridization conditions include "0.5 x SSC, 0.1". % SDS, 42 ° C. ”, and more severe hybridization conditions include“ 0.1 × SSC, 0.1% SDS, 65 ° C. ”. Hybridization conditions are described in J. Sambrook et al., Molecular Cloning: A Laboratory Manual, Thrd Edition, Cold Spring Harbor Laboratory Press (2001), etc.
シーケンシングによって標的遺伝子又はそれに由来する核酸の発現量を測定する場合は、例えば、次世代シーケンサー(例えばIon S5/XLシステム、ライフテクノロジーズジャパン株式会社)が用いて解析することが挙げられる。シーケンシングで作成されたリードの数(リードカウント)に基づいて、RNA発現を定量することができる。 When measuring the expression level of a target gene or a nucleic acid derived from the target gene by sequencing, for example, analysis using a next-generation sequencer (for example, Ion S5 / XL system, Life Technologies Japan Co., Ltd.) can be mentioned. RNA expression can be quantified based on the number of reads created by sequencing (read count).
上記の測定に用いられるプローブ又はプライマー、すなわち、本発明の標的遺伝子又はそれに由来する核酸を特異的に認識し増幅するためのプライマー、又は該RNA又はそれに由来する核酸を特異的に検出するためのプローブがこれに該当するが、これらは、当該標的遺伝子を構成する塩基配列に基づいて設計することができる。ここで「特異的に認識する」とは、例えばノーザンブロット法において、実質的に本発明の標的遺伝子又はそれに由来する核酸のみを検出できること、また例えばRT−PCR法において、実質的に当該核酸のみが増幅される如く、当該検出物又は生成物が当該遺伝子又はそれに由来する核酸であると判断できることを意味する。
具体的には、本発明の標的遺伝子を構成する塩基配列からなるDNA又はその相補鎖に相補的な一定数のヌクレオチドを含むオリゴヌクレオチドを利用することができる。ここで「相補鎖」とは、A:T(RNAの場合はU)、G:Cの塩基対からなる2本鎖DNAの一方の鎖に対する他方の鎖を指す。また、「相補的」とは、当該一定数の連続したヌクレオチド領域で完全に相補配列である場合に限られず、好ましくは80%以上、より好ましくは90%以上、さらに好ましくは95%以上の塩基配列上の同一性を有すればよい。塩基配列の同一性は、前記BLAST等のアルゴリズムにより決定することができる。
斯かるオリゴヌクレオチドは、プライマーとして用いる場合には、特異的なアニーリング及び鎖伸長ができればよく、通常、例えば10塩基以上、好ましくは15塩基以上、より好ましくは20塩基以上、かつ例えば100塩基以下、好ましくは50塩基以下、より好ましくは35塩基以下の鎖長を有するものが挙げられる。また、プローブとして用いる場合には、特異的なハイブリダイゼーションができればよく、本発明の標的遺伝子を構成する塩基配列からなるDNA(又はその相補鎖)の少なくとも一部若しくは全部の配列を有し、例えば10塩基以上、好ましくは15塩基以上、かつ例えば100塩基以下、好ましくは50塩基以下、より好ましくは25塩基以下の鎖長のものが用いられる。
なお、ここで、「オリゴヌクレオチド」は、DNAあるいはRNAであることができ、合成されたものでも天然のものでもよい。又はイブリダイゼーションに用いるプローブは、通常標識したものが用いられる。
A probe or primer used for the above measurement, that is, a primer for specifically recognizing and amplifying the target gene of the present invention or a nucleic acid derived from it, or a primer for specifically detecting the RNA or a nucleic acid derived from it. Probes fall into this category, but they can be designed based on the nucleotide sequences that make up the target gene. Here, "specifically recognizing" means that, for example, in Northern blotting, substantially only the target gene of the present invention or a nucleic acid derived from the target gene can be detected, and in, for example, in the RT-PCR method, substantially only the nucleic acid. Means that the detection or product can be determined to be the gene or nucleic acid derived from it so that is amplified.
Specifically, an oligonucleotide containing a DNA consisting of a base sequence constituting the target gene of the present invention or a certain number of nucleotides complementary to the complementary strand thereof can be used. Here, the "complementary strand" refers to the other strand of a double-stranded DNA consisting of A: T (U in the case of RNA) and G: C base pairs with respect to one strand. Further, "complementary" is not limited to the case where the sequence is completely complementary in the fixed number of continuous nucleotide regions, and is preferably 80% or more, more preferably 90% or more, still more preferably 95% or more bases. It suffices to have the sameness on the sequence. The identity of the base sequence can be determined by an algorithm such as BLAST.
When such an oligonucleotide is used as a primer, it suffices if it can perform specific annealing and chain extension, and is usually, for example, 10 bases or more, preferably 15 bases or more, more preferably 20 bases or more, and for example 100 bases or less. Those having a chain length of 50 bases or less, more preferably 35 bases or less can be mentioned. Further, when it is used as a probe, it suffices if specific hybridization can be performed, and it has at least a part or all of a sequence of DNA (or its complementary strand) consisting of a base sequence constituting the target gene of the present invention, for example. A chain length of 10 bases or more, preferably 15 bases or more, and for example 100 bases or less, preferably 50 bases or less, more preferably 25 bases or less is used.
Here, the "oligonucleotide" can be DNA or RNA, and may be synthesized or natural. Alternatively, as the probe used for hybridization, a labeled probe is usually used.
また、本発明の標的遺伝子の翻訳産物(タンパク質)、当該タンパク質と相互作用する分子、RNAと相互作用する分子、又はDNAと相互作用する分子を測定する場合は、プロテインチップ解析、免疫測定法(例えば、ELISA等)、質量分析(例えば、LC−MS/MS、MALDI−TOF/MS)、1−ハイブリッド法(PNAS 100, 12271-12276(2003))や2−ハイブリッド法(Biol. Reprod. 58, 302-311 (1998))のような方法を用いることができ、対象に応じて適宜選択できる。
例えば、測定対象としてタンパク質が用いられる場合は、本発明の発現産物に対する抗体を生体試料と接触させ、当該抗体に結合した試料中のタンパク質を検出し、そのレベルを測定することによって実施される。例えば、ウェスタンブロット法によれば、一次抗体として上記の抗体を用いた後、二次抗体として放射性同位元素、蛍光物質又は酵素等で標識した一次抗体に結合する抗体を用いて、その一次抗体を標識し、これら標識物質由来のシグナルを放射線測定器、蛍光検出器等で測定することが行われる。
尚、上記翻訳産物に対する抗体は、ポリクローナル抗体であっても、モノクローナル抗体であってもよい。これらの抗体は、公知の方法に従って製造することができる。具体的には、ポリクローナル抗体は、常法に従って大腸菌等で発現し精製したタンパク質を用いて、あるいは常法に従って当該タンパク質の部分ポリペプチドを合成して、家兎等の非ヒト動物に免疫し、該免疫動物の血清から常法に従って得ることが可能である。
一方、モノクローナル抗体は、常法に従って大腸菌等で発現し精製したタンパク質又は該タンパク質の部分ポリペプチドをマウス等の非ヒト動物に免疫し、得られた脾臓細胞と骨髄腫細胞とを細胞融合させて調製したハイブリドーマ細胞から得ることができる。また、モノクローナル抗体は、ファージディスプレイを用いて作製してもよい(Griffiths, A.D.; Duncan, A.R., Current Opinion in Biotechnology, Volume 9, Number 1, February 1998 , pp. 102-108(7))。
In addition, when measuring a translation product (protein) of the target gene of the present invention, a molecule that interacts with the protein, a molecule that interacts with RNA, or a molecule that interacts with DNA, protein chip analysis and immunoassay (immunassay) For example, ELISA, etc.), mass spectrometry (eg, LC-MS / MS, MALDI-TOF / MS), 1-hybrid method (PNAS 100, 12271-12276 (2003)) and 2-hybrid method (Biol. Reprod. 58). , 302-311 (1998)) can be used and can be appropriately selected according to the target.
For example, when a protein is used as a measurement target, it is carried out by contacting an antibody against the expression product of the present invention with a biological sample, detecting the protein in the sample bound to the antibody, and measuring the level thereof. For example, according to Western blotting, the above antibody is used as the primary antibody, and then the primary antibody is used as the secondary antibody by using an antibody that binds to the primary antibody labeled with a radioactive isotope, a fluorescent substance, an enzyme or the like. Labeling is performed, and signals derived from these labeling substances are measured with a radiation measuring device, a fluorescence detector, or the like.
The antibody against the translation product may be a polyclonal antibody or a monoclonal antibody. These antibodies can be produced according to known methods. Specifically, the polyclonal antibody immunizes non-human animals such as rabbits by using a protein expressed and purified in Escherichia coli or the like according to a conventional method or by synthesizing a partial polypeptide of the protein according to a conventional method. It can be obtained from the serum of the immunized animal according to a conventional method.
On the other hand, a monoclonal antibody is obtained by immunizing a non-human animal such as a mouse with a protein expressed and purified in Escherichia coli or the like according to a conventional method or a partial polypeptide of the protein, and fusing the obtained spleen cells and myeloma cells. It can be obtained from the prepared hybridoma cells. Monoclonal antibodies may also be prepared using a phage display (Griffiths, AD; Duncan, AR, Current Opinion in Biotechnology, Volume 9, Number 1, February 1998, pp. 102-108 (7)).
斯くして、被験者から採取された生体試料中の本発明の標的遺伝子又はその発現産物の発現レベルが測定され、当該発現レベルに基づいてアトピー性皮膚炎が検出される。検出は、具体的には、測定された本発明の標的遺伝子又はその発現産物の発現レベルを対照レベルと比較することによって行われる。
シーケンシングにより複数の標的遺伝子の発現レベルの解析を行う場合は、上記したように、発現量のデータであるリードカウント値、該リードカウント値をサンプル間の総リード数の違いを補正したRPM値、当該RPM値を底2の対数値に変換した値(Log2RPM値)又は整数1を加算した底2の対数値(Log2(RPM+1)値)、あるいはDESeq2を用いて補正されたカウント値(Normalized count値)又は整数1を加算した底2の対数値(Log2(count+1)値)を指標として用いるのが好ましい。また、RNA−seqの定量値として一般的な、fragments per kilobase of exon per million reads mapped (FPKM)、reads per kilobase of exon per million reads mapped (RPKM)、transcripts per million (TPM)などによって算出される値であってもよい。また、マイクロアレイ法によって得られるシグナル値、及びその補正値であってもよい。また、RT−PCRなどにより特定の標的遺伝子のみ発現レベルの解析を行う場合には、対象遺伝子の発現量をハウスキーピング遺伝子の発現量を基準とする相対的な発現量に変換(相対定量)して解析する方法、又は標的遺伝子の領域を含むプラスミドを用いて絶対的なコピー数を定量(絶対定量)して解析する方法が好ましい。デジタルPCR法によって得られるコピー数であってもよい。
ここで、「対照レベル」とは、例えば、健常人における当該標的遺伝子又はその発現産物の発現レベルが挙げられる。健常人の発現レベルは、健常人集団から測定した当該遺伝子又はその発現産物の発現レベルの統計値(例えば平均値等)であってもよい。標的遺伝子が複数の場合は、各々の遺伝子又はその発現産物について基準発現レベルを求めることが好ましい。
Thus, the expression level of the target gene of the present invention or the expression product thereof in the biological sample collected from the subject is measured, and atopic dermatitis is detected based on the expression level. Detection is specifically performed by comparing the measured expression level of the target gene of the invention or its expression product with the control level.
When analyzing the expression levels of multiple target genes by sequencing, as described above, the read count value, which is the expression level data, and the RPM value obtained by correcting the difference in the total number of reads between the samples. , The value obtained by converting the RPM value into the logarithmic value of the base 2 (Log 2 RPM value), the logarithmic value of the base 2 obtained by adding the integer 1 (Log 2 (RPM + 1) value), or the count value corrected using DESeq2. It is preferable to use (Normalized count value) or the logarithmic value of the base 2 (Log 2 (count + 1) value) obtained by adding an integer 1 as an index. Also, as a quantitative value of RNA-seq, it is commonly used as a quantitative value of RNA-seq. It may be a value. Further, it may be a signal value obtained by the microarray method and a correction value thereof. When analyzing the expression level of only a specific target gene by RT-PCR or the like, the expression level of the target gene is converted into a relative expression level based on the expression level of the housekeeping gene (relative quantification). The method of analysis by quantifying (absolute quantification) the absolute number of copies using a plasmid containing the region of the target gene is preferable. It may be the number of copies obtained by the digital PCR method.
Here, the “control level” includes, for example, the expression level of the target gene or its expression product in a healthy person. The expression level of a healthy person may be a statistical value (for example, an average value) of the expression level of the gene or its expression product measured from a healthy person population. When there are a plurality of target genes, it is preferable to determine the reference expression level for each gene or its expression product.
また、本発明におけるアトピー性皮膚炎の検出は、本発明の標的遺伝子又はその発現産物の発現レベルの上昇/減少により行うこともできる。この場合は、被験者由来の生体試料における標的遺伝子又はその発現産物の発現レベルが、各遺伝子又はその発現産物のカットオフ値(参照値)と比較される。カットオフ値は、予め健常者における当該標的遺伝子又はその発現産物の発現レベルを基準データとして取得しておき、それに基づく発現レベルの平均値や標準偏差等の統計的数値に基づき、適宜決定すれば良い。 Further, the detection of atopic dermatitis in the present invention can also be carried out by increasing / decreasing the expression level of the target gene of the present invention or its expression product. In this case, the expression level of the target gene or its expression product in the biological sample derived from the subject is compared with the cutoff value (reference value) of each gene or its expression product. The cutoff value can be determined as appropriate based on statistical values such as the average value and standard deviation of the expression level based on the expression level of the target gene or its expression product in a healthy subject obtained as reference data in advance. good.
さらに、アトピー性皮膚炎患者由来の標的遺伝子又はその発現産物の発現レベルと、健常人由来の標的遺伝子又はその発現産物の発現レベルの測定値を利用して、アトピー性皮膚炎患者と健常人とを分ける判別式(予測モデル)を構築し、当該判別式を利用して、アトピー性皮膚炎を検出することができる。すなわち、アトピー性皮膚炎患者由来の標的遺伝子又はその発現産物の発現レベルと、健常者由来の標的遺伝子又はその発現産物の発現レベルの測定値を教師サンプルとして、アトピー性皮膚炎患者と健常人を分ける判別式(予測モデル)を構築し、当該判別式に基づいてアトピー性皮膚炎患者と健常人を判別するカットオフ値(参照値)を求める。なお、判別式の作成においては、主成分分析(PCA)により次元圧縮を行ない、主要成分を説明変数とすることができる。
そして、被験者から採取された生体試料から標的遺伝子又はその発現産物のレベルを同様に測定し、得られた測定値を当該判別式に代入し、当該判別式から得られた結果を参照値と比較することによって、被検者におけるアトピー性皮膚炎の存在又は不存在を評価できる。
Furthermore, using the measured values of the expression level of the target gene derived from the atopic dermatitis patient or its expression product and the expression level of the target gene derived from the healthy person or its expression product, the atopic dermatitis patient and the healthy person Atopic dermatitis can be detected by constructing a discriminant formula (prediction model) for dividing the disease and using the discriminant formula. That is, using the measured values of the expression level of the target gene derived from the atopic dermatitis patient or its expression product and the expression level of the target gene derived from the healthy person or its expression product as a teacher sample, the atopic dermatitis patient and the healthy person are selected. A discriminant formula (prediction model) for dividing is constructed, and a cutoff value (reference value) for discriminating between atopic dermatitis patients and healthy subjects is obtained based on the discriminant formula. In creating the discriminant, dimensional compression can be performed by principal component analysis (PCA), and the main component can be used as an explanatory variable.
Then, the level of the target gene or its expression product is measured in the same manner from the biological sample collected from the subject, the obtained measured value is substituted into the discriminant, and the result obtained from the discriminant is compared with the reference value. By doing so, the presence or absence of atopic dermatitis in the subject can be evaluated.
判別式の構築に用いる変数には説明変数と目的変数がある。説明変数としては、例えば、下記の方法で選択した標的遺伝子又はその発現産物の発現レベルを用いることができる。目的変数としては、例えば、そのサンプルが健常人由来かアトピー性皮膚炎患者由来か、を用いることができる。 The variables used to construct the discriminant include explanatory variables and objective variables. As the explanatory variable, for example, the expression level of the target gene or its expression product selected by the following method can be used. As the objective variable, for example, whether the sample is derived from a healthy person or a patient with atopic dermatitis can be used.
特徴量の選択には、判別する2群間の統計学的に有意な差異、例えば、発現レベルが2群間で有意に変動する遺伝子(発現変動遺伝子)またはその発現産物の発現レベルを用いることができる。また、機械学習に用いるアルゴリズムなどの公知のものを利用して特徴量遺伝子を抽出し、その発現レベルを用いたりすることができる。例えば、下記に示すランダムフォレストにおける変数重要度の高い遺伝子またはその発現産物の発現レベルを用いたり、R言語の“Boruta”パッケージなどを用いて特徴量遺伝子を抽出し、その発現レベルを用いたりすることができる。 For the selection of the feature amount, a statistically significant difference between the two groups to be discriminated, for example, a gene whose expression level significantly fluctuates between the two groups (expression fluctuation gene) or the expression level of the expression product thereof is used. Can be done. In addition, a well-known gene such as an algorithm used for machine learning can be used to extract a feature gene and its expression level can be used. For example, the expression level of a gene with high variable importance or its expression product in the random forest shown below is used, or the feature amount gene is extracted using the "Boruta" package of R language and the expression level is used. be able to.
判別式の構築におけるアルゴリズムとしては、機械学習に用いるアルゴリズムなどの公知のものを利用することができる。機械学習アルゴリズムの例としては、ランダムフォレスト(Random forest)、線形カーネルのサポートベクターマシン(SVM linear)、rbfカーネルのサポートベクターマシン(SVM rbf)ニューラルネットワーク(Nerural net)、一般線形モデル(Generalized linear model)、正則化線形判別分析(Regularized linear discriminant analysis)、正則化ロジスティック回帰(Regularized logistic regression)などが挙げられる。構築した予測モデルに検証用のデータを入力して予測値を算出し、該予測値が実測値と最も適合するモデル、例えば正解率(Accuracy)が最も大きいモデルを最適な予測モデルとして選抜することができる。また、予測値と実測値から検出率(Recall)、精度(Precision)、及びそれらの調和平均であるF値を計算し、そのF値が最も大きいモデルを最適な予測モデルとして選抜することができる。 As an algorithm for constructing the discriminant, a known algorithm such as an algorithm used for machine learning can be used. Examples of machine learning algorithms include random forest (Random forest), linear kernel support vector machine (SVM liner), rbf kernel support vector machine (SVM rbf) neural network (Regular net), and generalized linear model. ), Regularized linear discriminant analysis, Regularized logistic regression, and the like. Input verification data into the constructed prediction model to calculate the prediction value, and select the model whose prediction value best matches the measured value, for example, the model with the largest accuracy rate, as the optimum prediction model. Can be done. In addition, the detection rate (Recall), accuracy (Precision), and F value, which is the harmonic mean thereof, can be calculated from the predicted value and the measured value, and the model with the largest F value can be selected as the optimum prediction model. ..
判別式の構築においてランダムフォレストのアルゴリズムを使用する場合、予測モデルの精度の指標として、未知データに対する推定の誤答率(OOB error rate)を算出することができる(Breiman L. Machine Learning (2001) 45;5-32)。 When the random forest algorithm is used in the construction of the discriminant, the estimated error rate (OOB rate) for unknown data can be calculated as an index of the accuracy of the prediction model (Breiman L. Machine Learning (2001)). 45; 5-32).
ランダムフォレストにおいては、ブートストラップ法という手法に従い、全サンプル中から重複を許して、サンプル数の約3分の2のサンプルをランダムに抽出し、決定木と呼ばれる分類器を作成する。この時抽出されなかったサンプルはOut of bug(OOB)と呼ばれ、1本の決定木を用いて、OOBの目的変数の予測を行い、正解ラベルと比較することでその誤答率を算出することができる(決定木におけるOOB error rate)。同様の作業を500回繰り返し行い、500本の決定木におけるOOB error rateの平均値をとった値を、該ランダムフォレストのモデルのOOB error rateとすることができる。 In a random forest, a classifier called a decision tree is created by randomly extracting about two-thirds of the number of samples by allowing duplication from all the samples according to a technique called the bootstrap method. The sample not extracted at this time is called Out of bug (OOB), and the objective variable of OOB is predicted using one decision tree, and the wrong answer rate is calculated by comparing it with the correct answer label. Can be (OOB variable rate in decision tree). The same operation is repeated 500 times, and the value obtained by taking the average value of the OOB erase in 500 decision trees can be used as the OOB erase of the model of the random forest.
なお、ランダムフォレストのモデルを構築する決定木の数(ntree値)は、デフォルトでは500本であるが、必要に応じて任意の本数に変更することができる。さらに、1つの決定木においてサンプルの判別式の作成に用いる変数の数(mtry値)は、デフォルトでは説明変数の数の平方根をとった値であるが、必要に応じて1つから全説明変数の数までの値のいずれかに変更することができる。 The number of decision trees (stream values) for constructing a random forest model is 500 by default, but it can be changed to any number as needed. Furthermore, the number of variables (mtry value) used to create the sample discriminant formula in one decision tree is the value obtained by taking the square root of the number of explanatory variables by default, but if necessary, one to all explanatory variables Can be changed to any of the values up to.
mtry値の決定にはR言語の“caret”パッケージを用いることができる。“caret”パッケージのメソッドにランダムフォレストを指定し、8通りのmtry値を試行し、例えばAccuracyが最大となるmtry値を最適なmtry値として選択することができる。なお、mtry値の試行回数は、必要に応じて任意の試行回数に変更することができる。 The R language "caret" package can be used to determine the mtry value. A random forest can be specified in the method of the "caret" package, eight mtry values can be tried, and for example, the mtry value that maximizes the accuracy can be selected as the optimum mtry value. The number of trials of the mtry value can be changed to any number of trials as needed.
判別式の構築においてランダムフォレストのアルゴリズムを使用する場合、モデルの構築に用いた説明変数の重要度を数値(変数重要度)化することができる。変数重要度の値には、例えば、ジニ係数の減少量(Mean Decrease Gini)を用いることができる。 When the random forest algorithm is used in the construction of the discriminant, the importance of the explanatory variables used in the construction of the model can be quantified (variable importance). For the value of the variable importance, for example, the amount of decrease in the Gini coefficient (Mean Decrease Gini) can be used.
カットオフ値(参照値)の決定方法は特に制限されず、公知の手法に従って決定することができる。例えば、判別式を使用して作成されたROC(Receiver Operating Characteristic Curve)曲線より求めることができる。ROC曲線では、縦軸に陽性患者において陽性の結果がでる確率(感度)と、横軸に陰性患者において陰性の結果がでる確率(特異度)を1から減算した値(偽陽性率)がプロットされる。ROC曲線に示される「真陽性(感度)」及び「偽陽性(1−特異度)」に関し、「真陽性(感度)」−「偽陽性(1−特異度)」が最大となる値(Youden index)をカットオフ値(参照値)とすることができる。 The method for determining the cutoff value (reference value) is not particularly limited, and the cutoff value (reference value) can be determined according to a known method. For example, it can be obtained from a ROC (Receiver Operating Characteristic Curve) curve created by using a discriminant. In the ROC curve, the vertical axis plots the probability of a positive result in a positive patient (sensitivity) and the horizontal axis plots the probability of a negative result in a negative patient (specificity) subtracted from 1 (false positive rate). Will be done. Regarding "true positive (sensitivity)" and "false positive (1-specificity)" shown in the ROC curve, "true positive (sensitivity)"-"false positive (1-specificity)" is the maximum value (Youden). index) can be a cutoff value (reference value).
既に述べたとおり、MECR、RASA4CP、ARRDC4、EIF1AD、FDFT1、ZNF706、TEX2、TMPRSS11E、RPS6KB2、CTBP1、ZNF335、DGKA、PPP1R9B、SPDYE7P、DNASE1L1、GNB2及びCSNK1G2からなる17種の遺伝子、及び当該17種の遺伝子を含む表1−1〜1−3で示される123遺伝子、表3−1〜3−4で示される150遺伝子、又は表4で示される45遺伝子を特徴量遺伝子として、アトピー性皮膚炎の予測が可能な予測モデルを構築することができる。 As already mentioned, MECR, RASA4CP, ARRDC4, EIF1AD, FDFT1, ZNF706, TEX2, TMPRSS11E, RPS6KB2, CTBP1, ZNF335, DGKA, PPP1R9B, SPDYE7P, DNASE1L1, SPDYE7P, DNASE1L1, GNB2 and CSN1 123 genes shown in Tables 1-1 to 1-3, 150 genes shown in Tables 3-1 to 3-4, or 45 genes shown in Table 4 containing genes are used as characteristic amount genes for atopic dermatitis. It is possible to build a predictive model that can be predicted.
したがって、上記アトピー性皮膚炎患者群と健常人群とを分ける判別式を作成する場合に、特徴量遺伝子としてMECR、RASA4CP、ARRDC4、EIF1AD、FDFT1、ZNF706、TEX2、TMPRSS11E、RPS6KB2、CTBP1、ZNF335、DGKA、PPP1R9B、SPDYE7P、DNASE1L1、GNB2及びCSNK1G2からなる17種の遺伝子から選択される1つの遺伝子又は2種以上、好ましくは5種以上、より好ましくは10種以上、よりさらに好ましくは17種全て選択し、その遺伝子又はその発現産物の発現データを用いる。さらに、複数の遺伝子を選択する場合、これら遺伝子の表3−1〜3−4における変数重要度のより上位の遺伝子から順に特徴量遺伝子として選択し、判別式を作成するのが好ましい。また、当該17種の遺伝子に、前記表Aで示される245遺伝子、表1−1〜1−3で示される123遺伝子、表3−1〜3−4で示される150遺伝子又は表4で示される45遺伝子において、当該17種の遺伝子以外の遺伝子から選ばれる少なくとも1つ、5以上、10以上、20以上又は50以上の遺伝子又はその発現産物の発現データを適宜加えることにより、判別式を作成し、アトピー性皮膚炎の検出をすることも可能である。当該17種の遺伝子以外の遺伝子を表3−1〜3−4に示される150遺伝子から選択する場合は、変数重要度のより上位の遺伝子から順に、あるいは変数重要度が上位から50位以内、好ましくは30位以内の遺伝子から特徴量遺伝子を選択しても良い。さらに、当該17種の遺伝子以外の遺伝子を特徴量遺伝子として選択する場合には、表1−1〜1−3、表3−1〜3−4及び表4において*を付し太字で表示された新規のアトピー性皮膚炎マーカーから特徴量遺伝子を選択するのが好ましい。
好ましくは、上記17遺伝子、表1−1〜1−3で示される123遺伝子又は107遺伝子(表1−1〜1−3において*を付し太字で表示)、表3−1〜3−4で示される150遺伝子又は127遺伝子(表3−1〜3−4において*を付し太字で表示)、又は表4で示される45遺伝子又は39遺伝子(表4において*を付し太字で表示)を特徴量遺伝子とする判別式が挙げられる。
Therefore, when creating a discriminant that separates the atopic dermatitis patient group from the healthy subject group, MECR, RASA4CP, ARRDC4, EIF1AD, FDFT1, ZNF706, TEX2, TMPRSS11E, RPS6KB2, CTBP1, ZNF335, DGKA are used as characteristic gene. , PPP1R9B, SPDYE7P, DNASE1L1, GNUB2 and CSNK1G2, one gene or two or more, preferably 5 or more, more preferably 10 or more, still more preferably all 17 , The expression data of the gene or its expression product is used. Further, when a plurality of genes are selected, it is preferable to select the genes having the higher variable importance in Tables 3-1 to 3-4 of these genes as the feature amount genes in order to prepare a discriminant. In addition, the 17 kinds of genes include 245 genes shown in Table A, 123 genes shown in Tables 1-1 to 1-3, 150 genes shown in Tables 3-1 to 3-4, or Table 4. A discriminant formula is created by appropriately adding expression data of at least one, 5 or more, 10 or more, 20 or more or 50 or more genes or their expression products selected from genes other than the 17 kinds of genes among the 45 genes. However, it is also possible to detect atopic dermatitis. When selecting genes other than the 17 genes from the 150 genes shown in Tables 3-1 to 3-4, the genes having the highest variable importance are selected in order, or the variable importance is within the 50th position from the highest. Preferably, the feature amount gene may be selected from the genes within the 30th position. Further, when a gene other than the 17 kinds of genes is selected as a feature gene, * is added in Tables 1-1 to 1-3, Tables 3-1 to 3-4 and Table 4 and displayed in bold. It is preferable to select the feature gene from the novel atopic dermatitis markers.
Preferably, the above 17 genes, 123 genes or 107 genes shown in Tables 1-1 to 1-3 (indicated in bold with * in Tables 1-1 to 1-3), Tables 3-1 to 3-4. 150 genes or 127 genes shown in Table 3 to 127 genes (marked with * in Tables 3-1 to 3-4 and shown in bold), or 45 genes or 39 genes shown in Table 4 (marked with * in Table 4 and shown in bold). There is a discriminant formula in which is a feature amount gene.
本発明のアトピー性皮膚炎を検出するための検査用キットは、患者から分離した生体試料における本発明の標的遺伝子又はその発現産物の発現レベルを測定するための検査試薬を含有するものである。具体的には、本発明の標的遺伝子又はそれに由来する核酸と特異的に結合(ハイブリダイズ)するオリゴヌクレオチド(例えば、PCR用のプライマー)を含む、核酸増幅、ハイブリダイゼーションのための試薬、或いは、本発明の標的遺伝子の発現産物(タンパク質)を認識する抗体を含む免疫学的測定のための試薬等が挙げられる。当該キットに包含されるオリゴヌクレオチド、抗体等は、上述したとおり公知の方法により得ることができる。
また、当該検査用キットには、上記抗体や核酸の他、標識試薬、緩衝液、発色基質、二次抗体、ブロッキング剤や、試験に必要な器具やポジティブコントロールやネガティブコントロールとして使用するコントロール試薬、生体試料を採取するための用具(例えば、SSLを採取するための脂取りフィルムなど)等を含むことができる。
The test kit for detecting atopic dermatitis of the present invention contains a test reagent for measuring the expression level of the target gene of the present invention or an expression product thereof in a biological sample isolated from a patient. Specifically, a reagent for nucleic acid amplification and hybridization, or a reagent containing an oligonucleotide (for example, a primer for PCR) that specifically binds (hybridizes) to the target gene of the present invention or a nucleic acid derived from the target gene. Examples thereof include reagents for immunological measurement containing an antibody that recognizes an expression product (protein) of the target gene of the present invention. The oligonucleotides, antibodies and the like included in the kit can be obtained by a known method as described above.
In addition to the above antibodies and nucleic acids, the test kit includes labeling reagents, buffer solutions, color-developing substrates, secondary antibodies, blocking agents, instruments necessary for testing, and control reagents used as positive and negative controls. A tool for collecting a biological sample (for example, a grease removing film for collecting an SSL) or the like can be included.
本発明の態様及び好ましい実施態様を以下に示す。
<1>被験者から採取された生体試料について、MECR、RASA4CP、ARRDC4、EIF1AD、FDFT1、ZNF706、TEX2、TMPRSS11E、RPS6KB2、CTBP1、ZNF335、DGKA、PPP1R9B、SPDYE7P、DNASE1L1、GNB2及びCSNK1G2からなる17種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む、当該被験者におけるアトピー性皮膚炎の検出方法。
<2>遺伝子又はその発現産物の発現レベルがmRNAの発現量の測定である、<1>の方法。
<3>遺伝子又はその発現産物が前記被験者の皮膚表上脂質に含まれるRNAである、<1>又は<2>の方法。
<4>発現レベルの測定値を前記各遺伝子又はその発現産物の参照値と比較し、アトピー性皮膚炎の存在又は不存在を評価する、<1>〜<3>のいずれかの方法。
<5>アトピー性皮膚患者由来の前記遺伝子又はその発現産物の発現レベルと、健常者由来の同遺伝子又はその発現産物の発現レベルの測定値を教師サンプルとして、アトピー性皮膚炎患者と健常者を分ける判別式を作成し、被験者から採取された生体試料から得られた同遺伝子又はその発現産物の発現レベルの測定値を当該判別式に代入し、得られた結果を参照値と比較することによって、被検者におけるアトピー性皮膚炎の存在又は不存在を評価する、<1>〜<3>のいずれかの方法。
<6>判別式の構築におけるアルゴリズムが、ランダムフォレスト、線形カーネルのサポートベクターマシン、rbfカーネルのサポートベクターマシン、ニューラルネットワーク、一般線形モデル、正則化線形判別分析、又は正則化ロジスティック回帰である<5>の方法。
<7>前記17種の遺伝子群の全ての遺伝子又はその発現産物の発現レベルが測定される、<5>又は<6>の方法。
<8>前記7種の遺伝子群より選択される少なくとも1つの遺伝子の他に、後記表1−1〜1−3で示される1123種、後記表3−1〜3−4で示される150種、表4で示される45種のうち前記17種の遺伝子を除いた遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルが測定される、<5>〜<7>のいずれかの方法。
<9>後記表3−1〜3−4で示される150種がランダムフォレストを用いて抽出された特徴量遺伝子である、<8>の方法。
<10>後記表4で示される45種がBoruta法を用いて抽出された特徴量遺伝子である、<8>の方法。
<11>前記遺伝子又はそれに由来する核酸と特異的にハイブリダイズするオリゴヌクレオチド、又は前記遺伝子の発現産物を認識する抗体を含有する、<1>〜<10>のいずれかの方法に用いられるアトピー性皮膚炎を検出するための検査用キット。
<12>前記Bに示される210種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物からなる、アトピー性皮膚炎の検出マーカー。
<13>MECR、RASA4CP、ARRDC4、EIF1AD、FDFT1、ZNF706、TEX2、TMPRSS11E、RPS6KB2、CTBP1、ZNF335、DGKA、PPP1R9B、SPDYE7P、DNASE1L1、GNB2及びCSNK1G2からなる17種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物である、<12>のアトピー性皮膚炎の検出マーカー。
Aspects and preferred embodiments of the present invention are shown below.
<1> Regarding biological samples collected from subjects, MECR, RASA4CP, ARRDC4, EIF1AD, FDFT1, ZNF706, TEX2, TMPRSS11E, RPS6KB2, CTBP1, ZNF335, DGKA, PPP1R9B, SPDYE7P, DNASE1L1 and GN A method for detecting atopic dermatitis in a subject, comprising the step of measuring the expression level of at least one gene selected from the gene group or an expression product thereof.
<2> The method of <1>, wherein the expression level of the gene or its expression product is a measurement of the expression level of mRNA.
<3> The method of <1> or <2>, wherein the gene or its expression product is RNA contained in the lipid on the skin surface of the subject.
<4> The method according to any one of <1> to <3>, wherein the measured value of the expression level is compared with the reference value of each gene or its expression product to evaluate the presence or absence of atopic dermatitis.
<5> Using the measured values of the expression level of the gene or its expression product derived from atopic dermatitis patients and the expression level of the gene or its expression product derived from healthy subjects as a teacher sample, atopic dermatitis patients and healthy subjects By creating a discriminant formula for division, substituting the measured value of the expression level of the gene or its expression product obtained from the biological sample collected from the subject into the discriminant formula, and comparing the obtained result with the reference value. , Any of <1> to <3> for assessing the presence or absence of atopic dermatitis in a subject.
<6> The algorithm for constructing the discriminant formula is a random forest, a support vector machine for a linear kernel, a support vector machine for an rbf kernel, a neural network, a general linear model, a regularized linear discriminant analysis, or a regularized logistic regression. > Method.
<7> The method of <5> or <6>, wherein the expression levels of all genes of the 17 gene groups or their expression products are measured.
<8> In addition to at least one gene selected from the above 7 gene groups, 1123 genes shown in Tables 1-1 to 1-3 below and 150 genes shown in Tables 3-1 to 3-4 below. , Any one of <5> to <7>, wherein the expression level of at least one gene selected from the gene group excluding the 17 genes among the 45 genes shown in Table 4 or an expression product thereof is measured. the method of.
<9> The method of <8>, wherein the 150 species shown in Tables 3-1 to 3-4 below are feature genes extracted using a random forest.
<10> The method of <8>, wherein the 45 species shown in Table 4 below are feature genes extracted by the Boruta method.
<11> Atopy used in any of the methods <1> to <10>, which contains an oligonucleotide that specifically hybridizes with the gene or a nucleic acid derived from the gene, or an antibody that recognizes an expression product of the gene. A test kit for detecting sexual dermatitis.
<12> A marker for detecting atopic dermatitis, which comprises at least one gene selected from the 210 gene groups shown in B or an expression product thereof.
<13> MECR, RASA4CP, ARRDC4, EIF1AD, FDFT1, ZNF706, TEX2, TMPRSS11E, RPS6KB2, CTBP1, ZNF335, DGKA, PPP1R9B, SPDYE7P, DNASE1L1, GNB2 and CSNK1 A marker for detecting atopic dermatitis of <12>, which is a gene or an expression product thereof.
以下、実施例に基づき本発明をさらに詳細に説明するが、本発明はこれに限定されるものではない。 Hereinafter, the present invention will be described in more detail based on Examples, but the present invention is not limited thereto.
実施例1 SSLから抽出されたRNAにおけるアトピー性皮膚炎関連の発現変動遺伝子の検出
1)SSL採取
成人の健常者(HL)(25〜57歳、男性)14名、及びアトピー性皮膚を有する成人(AD)(23〜56歳、男性)29名を被験者とした。アトピー性皮膚炎の被検者は、皮膚科専門医により、少なくとも顔面部に皮疹を有し、かつ重症度が軽症又は中等症のアトピー性皮膚炎であるとの診断を受けている。各被験者の全顔(AD患者は皮疹部を含む)からあぶら取りフィルム(5×8cm、ポリプロピレン製、3M社)を用いて皮脂を回収後、該あぶら取りフィルムをバイアルに移し、RNA抽出に使用するまで−80℃で、約1ヶ月間保存した。
Example 1 Detection of expression-variable genes related to atopic dermatitis in RNA extracted from SSL 1) SSL collection 14 healthy adults (HL) (25-57 years old, male) and adults with atopic skin 29 subjects (AD) (23-56 years old, male) were used as subjects. Subjects with atopic dermatitis have been diagnosed by a dermatologist as having a rash at least on the face and with mild or moderate severity of atopic dermatitis. After collecting sebum from the entire face of each subject (including the eruption part in AD patients) using an oil removal film (5 x 8 cm, made of polypropylene, 3M company), the oil removal film is transferred to a vial and used for RNA extraction. The mixture was stored at −80 ° C. for about 1 month.
2)RNA調製及びシーケンシング
上記1)のあぶら取りフィルムを適当な大きさに切断し、QIAzol Lysis Reagent(Qiagen)を用いて、付属のプロトコルに準じてRNAを抽出した。抽出されたRNAを元に、SuperScript VILO cDNA Synthesis kit(ライフテクノロジーズジャパン株式会社)を用いて42℃、90分間逆転写を行いcDNAの合成を行った。逆転写反応のプライマーには、キットに付属しているランダムプライマーを使用した。得られたcDNAから、マルチプレックスPCRにより20802遺伝子に由来するDNAを含むライブラリーを調製した。マルチプレックスPCRは、Ion AmpliSeqTranscriptome Human Gene Expression Kit(ライフテクノロジーズジャパン株式会社)を用いて、[99℃、2分→(99℃、15秒→62℃、16分)×20サイクル→4℃、Hold]の条件で行った。得られたPCR産物は、Ampure XP(ベックマン・コールター株式会社)で精製した後に、バッファーの再構成、プライマー配列の消化、アダプターライゲーションと精製、増幅を行い、ライブラリーを調製した。調製したライブラリーをIon 540 Chipにローディングし、Ion S5/XLシステム(ライフテクノロジーズジャパン株式会社)を用いてシーケンシングした。
2) RNA preparation and sequencing The oil-removing film from 1) above was cut to an appropriate size, and RNA was extracted using QIAzol Lysis Reagent (Qiagen) according to the attached protocol. Based on the extracted RNA, cDNA was synthesized by reverse transcription at 42 ° C. for 90 minutes using a SuperScript VILO cDNA Synthesis kit (Life Technologies Japan Co., Ltd.). The random primer included in the kit was used as the primer for the reverse transcription reaction. From the obtained cDNA, a library containing DNA derived from the 20802 gene was prepared by multiplex PCR. Multiplex PCR was performed using Ion AmpliSeqTranscriptome Human Gene Expression Kit (Life Technologies Japan Co., Ltd.) [99 ° C, 2 minutes → (99 ° C, 15 seconds → 62 ° C, 16 minutes) × 20 cycles → 4 ° C, Hold. ] Condition. The obtained PCR product was purified by Aple XP (Beckman Coulter, Inc.), followed by buffer reconstitution, primer sequence digestion, adapter ligation and purification, and amplification to prepare a library. The prepared library was loaded into an Ion 540 Chip and sequenced using an Ion S5 / XL system (Life Technologies Japan KK).
3)データ解析
i)使用データ
上記2)で測定した被験者由来のRNAの発現量のデータ(リードカウント値)において、DESeq2という手法を用いて補正した。但し、全サンプル被験者の発現量データのうち90%以上のサンプル被験者で欠損値ではない発現量データが得られている7429遺伝子のみ以下の解析に使用した。解析には、DESeq2という手法を用いて補正されたカウント値(Normalized count値)を用いた。
3) Data analysis i) Data used The data (read count value) of the expression level of RNA derived from the subject measured in 2) above was corrected using a method called DESeq2. However, only the 7429 gene for which 90% or more of the expression level data of all sample subjects had expression level data that was not a missing value was used in the following analysis. For the analysis, a count value (normalized count value) corrected by using a method called DESeq2 was used.
ii)RNA発現解析
上記i)で測定した健常者、及びADのSSL由来RNA発現量(Normalized count値)を基に、健常者と比較してADにおいて尤度比検定によるp値の補正値(FDR)が0.05未満となるRNA(発現変動遺伝子)を同定した。その結果、75種のRNAがADにおいて低下(DOWN)、48種のRNAがADにおいて上昇(UP)した(表1−1〜1−3)。
ii) RNA expression analysis Based on the healthy subjects measured in i) above and the SSL-derived RNA expression level (Normalized count value) of AD, the p-value corrected by the likelihood ratio test in AD compared with healthy subjects (corrected value of p value by likelihood ratio test). RNA (expression variation gene) having FDR) of less than 0.05 was identified. As a result, 75 kinds of RNA decreased (DOWN) in AD, and 48 kinds of RNA increased (UP) in AD (Tables 1-1 to 1-3).
表1−1〜1−3に示された123遺伝子について、公共データベースであるSTRINGを用いて遺伝子オントロジー(GO)エンリッチメント解析によるbiological process(BP)の探索を行った。その結果、AD患者において発現低下した遺伝子群と関連したBPが27個得られ、脂質代謝やアミノ酸代謝に関するタームが含まれることが示され(表2)。また、発現上昇した遺伝子群と関連したBPが4個得られ、白血球の活性化に関するタームなどが含まれていることが示された(表2)。一方で、前記表1−1〜1−3に示された123遺伝子のうちの107遺伝子(各表において*を付し太字で表示)については、これまでにアトピー性皮膚炎との関連性を示唆する報告がないことから、新規なアトピー性皮膚炎マーカーとなり得ると判断された。 The 123 genes shown in Tables 1-1 to 1-3 were searched for biological processes (BP) by gene ontology (GO) enrichment analysis using STRING, which is a public database. As a result, 27 BPs associated with the underexpressed gene group were obtained in AD patients, and it was shown that they contained terms related to lipid metabolism and amino acid metabolism (Table 2). In addition, four BPs associated with the up-expressed gene group were obtained, and it was shown that they contained terms related to leukocyte activation (Table 2). On the other hand, 107 of the 123 genes shown in Tables 1-1 to 1-3 (indicated in bold with * in each table) have been associated with atopic dermatitis so far. Since there was no suggestive report, it was judged that it could be a novel marker for atopic dermatitis.
実施例2 ランダムフォレストの変数重要度の高い遺伝子を用いた判別モデルの構築
1)使用データ
実施例1と同様の方法で、被験者からのSSL由来RNAの発現量のデータ(リードカウント値)を取得し、サンプル間の総リード数の違いを補正したRPM値に変換した。ただし、全サンプル中90%以上のサンプルで欠損値ではない発現量データが得られている7429遺伝子のみ以下の解析に使用した。機械学習モデルの構築には、負の二項分布に従うRPM値を正規分布に近似するため、整数1を加算した底2の対数値(Log2(RPM+1)値)を用いた。
Example 2 Construction of a discrimination model using genes with high variable importance in random forest 1) Usage data Obtain data (read count value) of the expression level of SSL-derived RNA from the subject by the same method as in Example 1. Then, it was converted into an RNAM value in which the difference in the total number of reads between the samples was corrected. However, only the 7429 gene for which expression level data that was not a missing value was obtained in 90% or more of the samples was used for the following analysis. In constructing the machine learning model, the logarithm of the base 2 (Log 2 (RPM + 1) value) obtained by adding the integer 1 was used in order to approximate the RPM value following the negative binomial distribution to the normal distribution.
2)特徴量遺伝子の選択
ランダムフォレストのアルゴリズムを用いて特徴量遺伝子の選択を行うために、全サンプル中90%以上のサンプルで欠損値ではない発現量データが得られている7429遺伝子のLog2(RPM+1)値を説明変数とし、健常者(HL)とADを目的変数として用いた。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、ジニ係数に基づく変数重要度の上位150遺伝子を算出した(表3−1〜3−4)。そして、これら150遺伝子もしくは、そのうちこれまでにアトピー性皮膚炎との関係が報告されていない127遺伝子(各表において*を付し太字で表示)を特徴量遺伝子として選択した。
2) Selection of feature gene In order to select the feature gene using the random forest algorithm, the expression level data that is not a missing value is obtained in 90% or more of the samples. Log 2 of the 7429 gene. The (RPM + 1) value was used as an explanatory variable, and healthy subjects (HL) and AD were used as objective variables. The random forest algorithm was specified as a method in the "caret" package of R language, and the optimum value of the number of variables (mtry value) used for constructing one decision tree was tuned. Using the mtry value determined by tuning, a random forest algorithm was executed to calculate the top 150 genes of variable importance based on the Gini coefficient (Tables 3-1 to 3-4). Then, these 150 genes or 127 genes whose relationship with atopic dermatitis has not been reported so far (marked with * in each table and indicated in bold) were selected as feature genes.
3)モデル構築
上記150遺伝子または127遺伝子のLog2(RPM+1)値を説明変数とし、HLとADを目的変数として用いた。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、推定誤答率(OOB error rate)を算出した。その結果、150遺伝子を用いた場合のモデルではOOB error rateが6.98%、127遺伝子を用いた場合のモデルでは6.98%であった。
3) Model construction The Log 2 (RPM + 1) value of the above 150 genes or 127 genes was used as an explanatory variable, and HL and AD were used as objective variables. The random forest algorithm was specified as a method in the "caret" package of R language, and the optimum value of the number of variables (mtry value) used for constructing one decision tree was tuned. The random forest algorithm was executed using the mtry value determined by tuning, and the estimated error rate (OOB rate) was calculated. As a result, the OOB erase rate was 6.98% in the model using 150 genes and 6.98% in the model using 127 genes.
実施例3 発現変動遺伝子を用いた判別モデルの構築
1)使用データ
実施例1と同様の方法で、被験者からのSSL由来RNAの発現量のデータ(リードカウント値)を取得し、サンプル間の総リード数の違いを補正したRPM値に変換した。機械学習モデルの構築には、負の二項分布に従うRPM値を正規分布に近似するため、整数1を加算した底2の対数値(log2(RPM+1)値)を用いた。
Example 3 Construction of a discrimination model using expression-variable genes 1) Usage data Data on the expression level of SSL-derived RNA from subjects (read count value) was obtained from the subjects in the same manner as in Example 1, and the total between the samples was obtained. It was converted into an RPM value corrected for the difference in the number of reads. In constructing the machine learning model, the logarithm of the base 2 (log 2 (RPM + 1) value) obtained by adding the integer 1 was used in order to approximate the RPM value following the negative binomial distribution to the normal distribution.
2)特徴量遺伝子の選択
実施例1において健常者(HL)と比較してADで有意に発現が変動していた123遺伝子(表1−1〜1−3)もしくは、そのうちこれまでにアトピー性皮膚炎との関係が報告されていない107遺伝子(各表において*を付し太字で表示)を特徴量遺伝子として選択した。
2) Selection of feature amount genes 123 genes (Tables 1-1 to 1-3) whose expression was significantly changed in AD as compared with healthy subjects (HL) in Example 1, or of which atopic properties have been obtained so far. 107 genes for which no relationship with dermatitis was reported (marked with * in each table and indicated in bold) were selected as feature genes.
3)モデル構築
上記123遺伝子または107遺伝子のLog2(RPM+1)値を説明変数とし、HLとADを目的変数として用いた。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、OOB error rateを算出した。その結果、123遺伝子を用いた場合のモデルではOOB error rateが13.95%、107遺伝子を用いた場合のモデルでは13.95%であった。
3) Model construction The Log 2 (RPM + 1) value of the 123 gene or 107 gene was used as an explanatory variable, and HL and AD were used as objective variables. The random forest algorithm was specified as a method in the "caret" package of R language, and the optimum value of the number of variables (mtry value) used for constructing one decision tree was tuned. Using the mtry value determined by tuning, the random forest algorithm was executed and the OOB eraser rate was calculated. As a result, the OOB erase rate was 13.95% in the model using 123 genes and 13.95% in the model using 107 genes.
実施例4 Boruta法により抽出した特徴量遺伝子を用いた判別モデルの構築
1)使用データ
実施例1と同様の方法で、被験者からのSSL由来RNAの発現量のデータ(リードカウント値)を取得し、サンプル間の総リード数の違いを補正したRPM値に変換した。ただし、全サンプル中90%以上のサンプルで欠損値ではない発現量データが得られている7429遺伝子のみ以下の解析に使用した。機械学習モデルの構築には、負の二項分布に従うRPM値を正規分布に近似するため、整数1を加算した底2の対数値(log2(RPM+1)値)を用いた。
Example 4 Construction of a discrimination model using the feature amount gene extracted by the Boruta method 1) Usage data Data on the expression level of SSL-derived RNA (read count value) from the subject was acquired by the same method as in Example 1. , Converted to an RPM value corrected for the difference in the total number of reads between samples. However, only the 7429 gene for which expression level data that was not a missing value was obtained in 90% or more of the samples was used for the following analysis. In constructing the machine learning model, the logarithm of the base 2 (log 2 (RPM + 1) value) obtained by adding the integer 1 was used in order to approximate the RPM value following the negative binomial distribution to the normal distribution.
2)特徴量遺伝子の選択
全サンプル中90%以上のサンプルで欠損値ではない発現量データが得られている7429遺伝子のLog2(RPM+1)値を説明変数とし、健常者(HL)とADを目的変数として用い、R言語の“Boruta”パッケージのアルゴリズムを実行した。最大試行回数を1000回とし、p値が0.01未満である45遺伝子を算出した(表4)。これら45遺伝子もしくは、そのうちこれまでにアトピー性皮膚炎との関係が報告されていない39遺伝子(表4において*を付し太字で表示)を特徴量遺伝子として選択した。
2) Selection of feature amount gene The Log 2 (RPM + 1) value of the 7429 gene, for which expression level data that is not a missing value is obtained in 90% or more of all samples, is used as an explanatory variable, and a healthy subject (HL) is used. Using AD as the objective variable, the algorithm of the R language "Boruta" package was executed. The maximum number of trials was 1000, and 45 genes having a p-value of less than 0.01 were calculated (Table 4). Of these 45 genes, or 39 genes for which no relationship with atopic dermatitis has been reported so far (marked with * in Table 4 and indicated in bold) were selected as feature genes.
3)モデル構築
上記45遺伝子または39遺伝子のLog2(RPM+1)値を説明変数とし、HLとADを目的変数として用いた。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、OOB error rateを算出した。その結果、45遺伝子を用いた場合のモデルではOOB error rateが6.98%、39遺伝子を用いた場合のモデルでは9.3%であった。
3) Model construction The Log 2 (RPM + 1) value of the above 45 genes or 39 genes was used as an explanatory variable, and HL and AD were used as objective variables. The random forest algorithm was specified as a method in the "caret" package of R language, and the optimum value of the number of variables (mtry value) used for constructing one decision tree was tuned. Using the mtry value determined by tuning, the random forest algorithm was executed and the OOB eraser rate was calculated. As a result, the OOB erase rate was 6.98% in the model using 45 genes and 9.3% in the model using 39 genes.
実施例5 複数の実施例で重複して用いられた特徴量遺伝子に基づく判別モデルの構築
1)使用データ
実施例1と同様の方法で、被験者からのSSL由来RNAの発現量のデータ(リードカウント値)を取得し、サンプル間の総リード数の違いを補正したRMP値に変換した。機械学習モデルの構築には、負の二項分布に従うRPM値を正規分布に近似するため、整数1を加算した底2の対数値(log2(RPM+1)値)を用いた。
Example 5 Construction of a discrimination model based on the feature amount genes duplicated in a plurality of Examples 1) Usage data Data on the expression level of SSL-derived RNA from the subject (read count) in the same manner as in Example 1. Value) was obtained and converted to an RMP value in which the difference in the total number of reads between samples was corrected. In constructing the machine learning model, the logarithm of the base 2 (log 2 (RPM + 1) value) obtained by adding the integer 1 was used in order to approximate the RPM value following the negative binomial distribution to the normal distribution.
2)特徴量遺伝子の選択
実施例2〜4において用いた特徴量遺伝子のうち、実施例2〜4全ての実施例において用いた遺伝子はMECR、RASA4CP、HMGCS1、ARRDC4、EIF1AD、FDFT1、ZNF706、TEX2、TMPRSS11E、RPS6KB2、CTBP1、ZNF335、CAPN1、DGKA、PPP1R9B、SPDYE7P、DNASE1L1、GNB2、CSNK1G2の19遺伝子であった(表5)。これら19遺伝子のうちこれまでにアトピー性皮膚炎との関係が報告されていない17遺伝子(表5において*を付し太字で表示)を特徴量遺伝子として選択した。
2) Selection of feature amount genes Among the feature amount genes used in Examples 2 to 4, the genes used in all Examples 2 to 4 are MECR, RASA4CP, HMGCS1, ARRDC4, EIF1AD, FDFT1, ZNF706, TEX2. , TMPRSS11E, RPS6KB2, CTBP1, ZNF335, CAPN1, DGKA, PPP1R9B, SPDYE7P, DNASE1L1, GNB2, CSNK1G2 (Table 5). Of these 19 genes, 17 genes whose relationship with atopic dermatitis has not been reported so far (marked with * in Table 5 and indicated in bold) were selected as feature genes.
3)モデル構築
上記17遺伝子のLog2(RPM+1)値を説明変数とし、HLとADを目的変数として用いた。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、OOB error rateを算出した。その結果、OOB error rateは6.98%であった。
3) Model construction The Log 2 (RPM + 1) value of the above 17 genes was used as an explanatory variable, and HL and AD were used as objective variables. The random forest algorithm was specified as a method in the "caret" package of R language, and the optimum value of the number of variables (mtry value) used for constructing one decision tree was tuned. Using the mtry value determined by tuning, the random forest algorithm was executed and the OOB eraser rate was calculated. As a result, the OOB error rate was 6.98%.
Claims (12)
In addition to at least one gene selected from the 17 gene groups, 123 species in Tables 1-1 to 1-3 below, 150 species shown in Tables 3-1 to 3-4, or shown in Table 4 The method according to claim 5 or 6, wherein the expression level of at least one gene selected from the gene group excluding the 17 kinds of genes out of 45 kinds of genes or an expression product thereof is measured.
In addition to at least one gene selected from the 17 gene groups, at least 1 selected from the 107 gene group, 127 gene group, and 39 gene group excluding the 17 gene group in the table below. The method according to claim 7 or 8, wherein the expression level of one gene or an expression product thereof is measured.
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020081473A JP2021175381A (en) | 2020-05-01 | 2020-05-01 | Method for detecting infant atopic dermatitis |
PCT/JP2021/017112 WO2021221138A1 (en) | 2020-05-01 | 2021-04-28 | Method for detecting atopic dermatitis |
US17/922,565 US20230235399A1 (en) | 2020-05-01 | 2021-04-28 | Method for detecting atopic dermatitis |
CN202180032407.0A CN115485390A (en) | 2020-05-01 | 2021-04-28 | Method for detecting atopic dermatitis |
EP21795650.7A EP4144862A1 (en) | 2020-05-01 | 2021-04-28 | Method for detecting atopic dermatitis |
JP2023134734A JP2023157965A (en) | 2020-05-01 | 2023-08-22 | Method for detecting atopic dermatitis |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020081473A JP2021175381A (en) | 2020-05-01 | 2020-05-01 | Method for detecting infant atopic dermatitis |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023134734A Division JP2023157965A (en) | 2020-05-01 | 2023-08-22 | Method for detecting atopic dermatitis |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021175381A true JP2021175381A (en) | 2021-11-04 |
Family
ID=78300066
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020081473A Pending JP2021175381A (en) | 2020-05-01 | 2020-05-01 | Method for detecting infant atopic dermatitis |
JP2023134734A Pending JP2023157965A (en) | 2020-05-01 | 2023-08-22 | Method for detecting atopic dermatitis |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023134734A Pending JP2023157965A (en) | 2020-05-01 | 2023-08-22 | Method for detecting atopic dermatitis |
Country Status (1)
Country | Link |
---|---|
JP (2) | JP2021175381A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220132658A (en) * | 2013-08-30 | 2022-09-30 | 인터디지탈 패튼 홀딩스, 인크 | Methods for application specific access control |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005110602A (en) * | 2003-10-09 | 2005-04-28 | Sumitomo Pharmaceut Co Ltd | Disease marker of atopic dermatitis and utilization thereof |
WO2018161062A1 (en) * | 2017-03-03 | 2018-09-07 | Children's Hospital Medical Center | Non-invasive methods for skin sample collection and analysis |
-
2020
- 2020-05-01 JP JP2020081473A patent/JP2021175381A/en active Pending
-
2023
- 2023-08-22 JP JP2023134734A patent/JP2023157965A/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005110602A (en) * | 2003-10-09 | 2005-04-28 | Sumitomo Pharmaceut Co Ltd | Disease marker of atopic dermatitis and utilization thereof |
WO2018161062A1 (en) * | 2017-03-03 | 2018-09-07 | Children's Hospital Medical Center | Non-invasive methods for skin sample collection and analysis |
Non-Patent Citations (2)
Title |
---|
FRONTIERS IN IMMUNOLOGY, vol. Vol. 9, Article 2727, JPN6021028329, 12 December 2018 (2018-12-12), pages 1 - 22, ISSN: 0005063776 * |
実験医学, vol. 35, no. 1, JPN6021028328, January 2017 (2017-01-01), JP, pages 33 - 39, ISSN: 0005063775 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220132658A (en) * | 2013-08-30 | 2022-09-30 | 인터디지탈 패튼 홀딩스, 인크 | Methods for application specific access control |
KR102498472B1 (en) | 2013-08-30 | 2023-02-09 | 인터디지탈 패튼 홀딩스, 인크 | Methods for application specific access control |
US11647414B2 (en) | 2013-08-30 | 2023-05-09 | Interdigital Patent Holdings, Inc. | Methods for application specific access control |
Also Published As
Publication number | Publication date |
---|---|
JP2023157965A (en) | 2023-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10538813B2 (en) | Biomarker panel for diagnosis and prediction of graft rejection | |
US10793911B2 (en) | Host DNA as a biomarker of Crohn's disease | |
US11840742B2 (en) | Method for detecting active tuberculosis | |
JP2023157965A (en) | Method for detecting atopic dermatitis | |
WO2021230379A1 (en) | Method for detecting parkinson disease | |
US20210087634A1 (en) | Determination of risk for development of cardiovascular disease by measuring urinary levels of podocin and nephrin messenger rna | |
JP2021175382A (en) | Method for detecting infant atopic dermatitis | |
WO2022059745A1 (en) | Method for detecting infantile atopic dermatitis | |
WO2022220299A1 (en) | Method for detecting severity of infantile facial eczema | |
WO2022009988A1 (en) | Method for detecting severity of atopic dermatitis | |
WO2022220298A1 (en) | Method for sensing severity of diaper dermatitis in infants and toddlers | |
JP2023048811A (en) | Method for detecting fatigue | |
WO2022186296A1 (en) | Method for detecting deterioration in severity of atopic dermatitis | |
WO2017158152A1 (en) | Diagnosis of chronic obstructive pulmonary disease (copd) | |
JP2023048810A (en) | Method for detecting chronic stress level | |
JP2023073135A (en) | Method for detecting severity of menopausal disorders | |
JP2023073134A (en) | Method for detecting hot flashes | |
WO2022186297A1 (en) | Method for detecting exacerbation of pruritus due to atopic dermatitis | |
JP2023045067A (en) | Method for detecting insomnia | |
CN116377053A (en) | Diagnostic biomarker for coronary artery dilatation and application thereof | |
US20240018593A1 (en) | Method for detecting severity of atopic dermatitis | |
JP2023002298A (en) | Method for detecting diabetes index | |
WO2021044385A1 (en) | Diagnostic and prognostic liquid biopsy biomarkers for asthma |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200625 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20200625 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221101 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20221227 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230228 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20230523 |