KR102612260B1 - 여성의 탈모 진단을 위한 두피 마이크로바이옴 기반바이오 마커, 이를 이용한 탈모를 진단하는 방법, 및 기계 학습을 이용한 마이크로바이옴 기반 바이오 마커를 선별하는 방법 - Google Patents
여성의 탈모 진단을 위한 두피 마이크로바이옴 기반바이오 마커, 이를 이용한 탈모를 진단하는 방법, 및 기계 학습을 이용한 마이크로바이옴 기반 바이오 마커를 선별하는 방법 Download PDFInfo
- Publication number
- KR102612260B1 KR102612260B1 KR1020230091072A KR20230091072A KR102612260B1 KR 102612260 B1 KR102612260 B1 KR 102612260B1 KR 1020230091072 A KR1020230091072 A KR 1020230091072A KR 20230091072 A KR20230091072 A KR 20230091072A KR 102612260 B1 KR102612260 B1 KR 102612260B1
- Authority
- KR
- South Korea
- Prior art keywords
- hair loss
- group
- diagnosing
- women
- microbial
- Prior art date
Links
- 201000004384 Alopecia Diseases 0.000 title claims abstract description 125
- 230000003676 hair loss Effects 0.000 title claims abstract description 99
- 208000024963 hair loss Diseases 0.000 title claims abstract description 99
- 238000000034 method Methods 0.000 title claims abstract description 43
- 239000000090 biomarker Substances 0.000 title claims abstract description 37
- 244000005700 microbiome Species 0.000 title claims abstract description 33
- 210000004761 scalp Anatomy 0.000 title claims abstract description 30
- 238000010801 machine learning Methods 0.000 title claims abstract description 19
- 238000012216 screening Methods 0.000 title description 3
- 238000003745 diagnosis Methods 0.000 claims abstract description 19
- 230000000813 microbial effect Effects 0.000 claims description 34
- 206010068168 androgenetic alopecia Diseases 0.000 claims description 17
- 238000007637 random forest analysis Methods 0.000 claims description 15
- 201000002996 androgenic alopecia Diseases 0.000 claims description 14
- 239000000203 mixture Substances 0.000 claims description 14
- 239000000523 sample Substances 0.000 claims description 14
- 241001136694 Subdoligranulum Species 0.000 claims description 13
- 238000012549 training Methods 0.000 claims description 13
- 241000186000 Bifidobacterium Species 0.000 claims description 12
- 241001202853 Blautia Species 0.000 claims description 12
- 241001143779 Dorea Species 0.000 claims description 12
- 241001057811 Paracoccus <mealybug> Species 0.000 claims description 12
- 241000589516 Pseudomonas Species 0.000 claims description 12
- 238000012360 testing method Methods 0.000 claims description 11
- 238000004458 analytical method Methods 0.000 claims description 9
- 238000010839 reverse transcription Methods 0.000 claims description 9
- 239000003795 chemical substances by application Substances 0.000 claims description 7
- 241001112693 Lachnospiraceae Species 0.000 claims description 5
- 239000012472 biological sample Substances 0.000 claims description 5
- 238000000018 DNA microarray Methods 0.000 claims description 4
- 230000002860 competitive effect Effects 0.000 claims description 4
- 238000003752 polymerase chain reaction Methods 0.000 claims description 4
- 108091033319 polynucleotide Proteins 0.000 claims description 4
- 102000040430 polynucleotide Human genes 0.000 claims description 4
- 239000002157 polynucleotide Substances 0.000 claims description 4
- 230000000295 complement effect Effects 0.000 claims description 3
- 239000002773 nucleotide Substances 0.000 claims description 3
- 125000003729 nucleotide group Chemical group 0.000 claims description 3
- 238000000636 Northern blotting Methods 0.000 claims description 2
- 102000006382 Ribonucleases Human genes 0.000 claims description 2
- 108010083644 Ribonucleases Proteins 0.000 claims description 2
- 238000003556 assay Methods 0.000 claims description 2
- 238000012417 linear regression Methods 0.000 claims description 2
- 238000003753 real-time PCR Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 3
- 241000894006 Bacteria Species 0.000 abstract description 2
- 108090000623 proteins and genes Proteins 0.000 description 21
- 102000004169 proteins and genes Human genes 0.000 description 11
- 241001134638 Lachnospira Species 0.000 description 8
- 241001112724 Lactobacillales Species 0.000 description 7
- 231100000360 alopecia Toxicity 0.000 description 7
- 238000001514 detection method Methods 0.000 description 7
- 108020004414 DNA Proteins 0.000 description 6
- 241000089032 Erysipelatoclostridium Species 0.000 description 6
- 241000722549 Lawsonella Species 0.000 description 6
- 108091034117 Oligonucleotide Proteins 0.000 description 6
- 201000010099 disease Diseases 0.000 description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 6
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 5
- 102000004190 Enzymes Human genes 0.000 description 5
- 108090000790 Enzymes Proteins 0.000 description 5
- 230000001580 bacterial effect Effects 0.000 description 5
- 238000003066 decision tree Methods 0.000 description 5
- 239000013076 target substance Substances 0.000 description 5
- 241001258698 Allisonella Species 0.000 description 4
- 241000148163 Negativibacillus Species 0.000 description 4
- 241001267951 Parasutterella Species 0.000 description 4
- 241001464921 Phascolarctobacterium Species 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 150000007523 nucleic acids Chemical class 0.000 description 4
- 238000003757 reverse transcription PCR Methods 0.000 description 4
- 238000012163 sequencing technique Methods 0.000 description 4
- 108020004465 16S ribosomal RNA Proteins 0.000 description 3
- 108091093088 Amplicon Proteins 0.000 description 3
- 238000007400 DNA extraction Methods 0.000 description 3
- 238000002965 ELISA Methods 0.000 description 3
- 238000008157 ELISA kit Methods 0.000 description 3
- 208000034826 Genetic Predisposition to Disease Diseases 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 239000013068 control sample Substances 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 108090000765 processed proteins & peptides Proteins 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 229920000742 Cotton Polymers 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 239000000074 antisense oligonucleotide Substances 0.000 description 2
- 238000012230 antisense oligonucleotides Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 230000009260 cross reactivity Effects 0.000 description 2
- 239000000104 diagnostic biomarker Substances 0.000 description 2
- 238000007636 ensemble learning method Methods 0.000 description 2
- 230000003645 female-pattern hair loss Effects 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 238000000611 regression analysis Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000007790 scraping Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 229920001817 Agar Polymers 0.000 description 1
- 206010001766 Alopecia totalis Diseases 0.000 description 1
- 206010001767 Alopecia universalis Diseases 0.000 description 1
- 108020000946 Bacterial DNA Proteins 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 238000009007 Diagnostic Kit Methods 0.000 description 1
- 208000003024 Diffuse alopecia Diseases 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 206010018338 Glioma Diseases 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 241000186660 Lactobacillus Species 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- 238000000585 Mann–Whitney U test Methods 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 206010041250 Social phobia Diseases 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 208000004631 alopecia areata Diseases 0.000 description 1
- 208000032775 alopecia universalis congenita Diseases 0.000 description 1
- 230000003698 anagen phase Effects 0.000 description 1
- 210000003484 anatomy Anatomy 0.000 description 1
- 239000003098 androgen Substances 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 238000002591 computed tomography Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000013399 early diagnosis Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000031774 hair cycle Effects 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 229940039696 lactobacillus Drugs 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 230000003273 male-pattern hair loss Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000002552 multiple reaction monitoring Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000002335 preservative effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 208000037821 progressive disease Diseases 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 239000003161 ribonuclease inhibitor Substances 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 239000002453 shampoo Substances 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 201000001297 telogen effluvium Diseases 0.000 description 1
- 230000003797 telogen phase Effects 0.000 description 1
- 208000010603 vasculitis due to ADA2 deficiency Diseases 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
- C12Q1/689—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Biotechnology (AREA)
- Medical Informatics (AREA)
- General Engineering & Computer Science (AREA)
- Immunology (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Epidemiology (AREA)
- Pathology (AREA)
- Bioethics (AREA)
- Databases & Information Systems (AREA)
- Public Health (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
Abstract
여성의 탈모 진단을 위한 두피 마이크로바이옴 기반 바이오 마커, 이를 이용한 탈모를 진단하는 방법, 및 기계 학습을 이용한 마이크로바이옴 기반 바이오 마커를 선별하는 방법에 관한 것으로, 일 양상에 따른 기계 학습을 이용한 탈모 진단 마커를 선별하는 방법에 의하면, 두피 내 모든 박테리아 속의 풍부도 모델을 구축함으로써 탈모환자 특이적인 마커의 후보군을 찾아낼 수 있는 효과가 있고, 상기 방법에 의해 선별된 탈모 진단의 마커는 유의성 있고 정확한 탈모 진단에 이용될 수 있는 효과가 있다.
Description
탈모 진단을 위한 두피 마이크로바이옴 기반 바이오 마커, 이를 이용한 탈모를 진단하는 방법, 및 기계 학습을 이용한 마이크로바이옴 기반 바이오 마커를 선별하는 방법에 관한 것이다.
기계 학습(Machine Learning)에서의 랜덤 포레스트(Random Forest)는 분류, 회귀 분석 등에 사용되는 앙상블 학습 방법의 일종으로서, 훈련 과정에서 구성한 다수의 결정 트리로부터 부류(분류) 또는 평균 예측치(회귀 분석)를 출력함으로써 동작한다. 랜덤 포레스트의 가장 큰 특징은 랜덤성(randomness)에 의해 트리들이 서로 조금씩 다른 특성을 갖는다는 점이다. 이 특성은 각 트리들의 예측(prediction)들이 비상관화(decorrelation)되게 하며, 결과적으로 일반화(generalization) 성능을 향상시킨다. 또한, 랜덤화(randomization)는 포레스트가 노이즈가 포함된 데이터에 대해서도 강인하게 만들어 준다. 랜덤화는 각 트리들의 훈련 과정에서 진행되며, 랜덤 학습 데이터 추출 방법을 이용한 앙상블 학습법인 배깅(bagging)과 랜덤 노드 최적화(randomized node optimization)가 자주 사용된다. 이 두 가지 방법은 서로 동시에 사용되어 랜덤화 특성을 더욱 증진시킬 수 있다. 키넥트에서의 신체 트랙킹, 컴퓨터 단층 촬영 영상 내 해부학 구조 검출 및 위치파악, 다채널 자기공명영상 내 고악성도 신경교종 검출 등 다양한 응용사례를 가지고 있다.
탈모는 성인 4명 중 1명의 비율로 나타나는 유병률이 높은 질환이며 사람의 생명을 위협하거나 활동을 제약하는 질환은 아니지만 이로 인한 자존감 저하와 대인 기피증 같은 심리적 문제로 개인의 사회적 기능을 현저하게 떨어뜨리는 질환이다. 일반적으로 유전적 소인에 의해 모발 성장주기 동안 성장기가 단축되고 휴지기가 길어지면서 두피 정수리에서 모발이 빠지게 되는 서서히 진행되는 진행성 질환이다.
유전적 소인 이외에도 다양한 요인이 탈모를 유발시킬 수 있으므로 각각의 탈모 환자에 맞춘 진료와 치료가 중요하며 초기 진단이 탈모의 진행을 늦출 수 있다. 현재 탈모의 진단은 두피진단기를 통해 촬영된 영상을 토대로 의사가 육안으로 모발의 개수 및 모발의 굵기를 측정하도록 되어 있어 탈모 진단의 오차 범위가 넓으며 객관적인 수치로 증명하는데 한계가 있다.
따라서 의료인의 주관적인 진단이 아닌 객관적 데이터를 활용한 진단과 치료가 필요한 실정이다.
일 양상은 탈모 진단을 위한 마이크로바이옴 기반 바이오 마커를 제공하는 것이다.
다른 양상은 수브돌리그라눌룸(Subdoligranulum), 비피도박테리움(Bifidobacterium), 파라코커스(Paracoccus), 슈도모나스(Pseudomonas), 블라우티아(Blautia), 도레아(Dorea), 라크노스피라새(Lachnospiraceae), 로소넬라(Lawsonella), 알리소넬라 (Allisonella), 파라수테렐라(Parasutterella), 락토바실랄레스(Lactobacillales), 에리시펠라토클로스트리디움(Erysipelatoclostridium), 라크노스피라(Lachnospira), RF39, 파스코락토박테리움(Phascolarctobacterium) 및 네가티피바실러스 (Negativibacillus) 균주로 이루어지는 군에서 선택되는 하나 이상의 미생물 바이오 마커를 검출할 수 있는 제제를 포함하는, 탈모 진단용 조성물을 제공하는 것이다.
또 다른 양상은 상기 탈모 진단용 조성물을 포함하는 탈모 진단용 키트를 제공하는 것이다.
또 다른 양상은 분리된 생물학적 시료로부터 수브돌리그라눌룸, 비피도박테리움, 파라코커스, 슈도모나스, 블라우티아, 도레아, 라크노스피라새, 로소넬라, 알리소넬라 및 파라수테렐라, 로소넬라, 알리소넬라, 파라수테렐라, 락토바실랄레스, 에리시펠라토클로스트리디움, 라크노스피라, RF39, 파스코락토박테리움 및 네가티피바실러스 균주로 이루어지는 군에서 선택되는 하나 이상의 미생물 바이오 마커를 검출하는 단계를 포함하는 탈모를 진단하는 방법 또는 탈모 진단에 관한 정보를 제공 방법을 제공하는 것이다.
또 다른 양상은 기계 학습을 이용한 마이크로바이옴 기반 바이오 마커를 선별하는 방법을 제공하는 것이다.
또 다른 양상은 정상군 및 탈모군의 분리된 시료(예를 들면, 두피)에서 미생물 군집 데이터를 획득하는 단계; 상기 미생물 군집 데이터를 트레이닝 세트와 테스트 세트로 구분하여 기계학습을 수행하여 모델을 생성하는 단계; 및 상기 생성된 모델로부터 정상군과 탈모군에서 차이가 존재하는 미생물 군집을 선별하는 단계를 포함하는 탈모 진단을 위한 바이오 마커를 선별하는 방법을 제공하는 것이다.
또 다른 양상은 상기 생성된 탈모 예측 모델을 제공하는 것이다.
또 다른 양상은, 상기 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공하는 것이다.
일 양상은 탈모 진단을 위한 마이크로바이옴 기반 바이오 마커를 제공한다.
다른 양상은 수브돌리그라눌룸(Subdoligranulum), 비피도박테리움(Bifidobacterium), 파라코커스(Paracoccus), 슈도모나스(Pseudomonas), 블라우티아(Blautia), 도레아(Dorea), 라크노스피라새(Lachnospiraceae), 로소넬라(Lawsonella), 알리소넬라 (Allisonella), 파라수테렐라(Parasutterella), 락토바실랄레스(Lactobacillales), 에리시펠라토클로스트리디움(Erysipelatoclostridium), 라크노스피라(Lachnospira), RF39, 파스코락토박테리움(Phascolarctobacterium) 및 네가티피바실러스 (Negativibacillus) 균주로 이루어지는 군에서 선택되는 하나 이상의 미생물 바이오 마커를 검출할 수 있는 제제를 포함하는, 탈모 진단용 조성물을 제공할 수 있다.
일 구체예에 있어서, 상기 미생물은 두피에서 분리한 것일 수 있다. 구체적으로 두피, 가르마 및 정수리 부위를 멸균된 면봉으로 긁어서 샘플을 채취한 것일 수 있으나, 이에 제한되지 않는다.
본 명세서에서 용어 “탈모” 또는 “탈모증”은, 머리카락이나 털이 어떤 원인에 의하여 정상보다 적거나 없는 상태를 의미할 수 있다.
일 구체예에 있어서, 상기 탈모는 안드로겐성 탈모증(Androgenetic alopecia, AGA), 남성형 탈모, 여성형 탈모, 휴지기 탈모, 원형 탈모, M자형탈모, 전두성 탈모, 전신성 탈모, 감염성 탈모, 노화성 탈모 또는 압박성 탈모 일수 있으나, 이에 제한되지 않고, 머리카락이나 털이 정상보다 적거나 없는 모든 상태를 의미할 수 있다.
본 명세서에서 용어 “안드로겐성 탈모증(Androgenetic alopecia, AGA)”또는 “안드로겐성 탈모”는 여성과 남성 모두에게 나타나는 탈모 유형중 하나로, 유전적인 소인과 남성호르몬인 안드로겐의 작용으로 발생하는 탈모를 의미할 수 있다.
본 명세서에서 용어 “여성형 탈모”또는 “여성형 탈모증”은 이마선은 비교적 잘 유지되지만 정수리의 중심 모발이 점점 가늘어지고 숱이 없어지면서 트리모양으로 진행되는 탈모 또는 여성에게 발생하는 탈모를 의미할 수 있다.
본 명세서에서 용어 “남성형 탈모”또는 “남성형 탈모증”은 앞머리와 정수리 부위의 탈모와 모발의 가늘어짐이 특징인 탈모 또는 남성에게 발생하는 탈모를 의미할 수 있다.
본 명세서에서 용어 “진단”은 특정 질병 또는 상태에 대한 객체의 감수성을 판정하는 것, 객체가 특정 질병 또는 상태를 가지고 있는지 여부를 판정하는 것, 특정 질병 또는 상태인 객체의 예후를 판정하는 것, 또는 이를 모니터링하는 것을 지칭할 수 있다.
본 명세서에서 사용된 용어 “검출”이란, 목적하는 물질의 존재 여부를 측정 및 확인하는 것, 또는 목적하는 물질의 존재 수준의 변화를 측정 및 확인하는 것을 모두 포함하는 의미일 수 있다.
따라서 상기 “제제”는 일 실시예에 따른 탈모 진단 바이오마커에 특이적으로 결합하여 인식할 수 있도록 하거나 증폭시킬 수 있는 제제로서, 구체적으로는 균주 특이적 서열에 특이적으로 결합할 수 있는 프로브(probe), 상기 균주 특이적 서열이 포함된 부위를 포함하는 폴리뉴클레오타이드 또는 이의 상보적인 폴리뉴클레오타이드를 특이적으로 증폭할 수 있는 프라이머(primer) 세트일 수 있다.
일 구체예에 있어서, 상기 균주 특이적 서열은 16s rRNA 서열 또는 이의 일부를 포함하는 것일 수 있다.
본 명세서에서 용어 "마커" 또는 "바이오 마커"는 그의 검출 또는 정량이 잠재적 생물학적위험을 동정하는 수단으로서 사용될 수 있는 환경적인 생화학적 변수를 의미할 수 있다. 구체적으로, 광범위한 미생물로부터 분리될 수 있고 상기 미생물을 동정하는데 사용될 수 있는, 단백질을 포함한 구조적으로 보존된 생물학적 거대분자를 특이적으로 지칭할 수 있다.
본 명세서에서 사용된 용어 "프라이머"는 표적 유전자 서열을 인지하는 정방향 및 역방향의 프라이머로 이루어진 모든 조합의 프라이머 쌍을 포함하고, 상세하게는 특이성 및 민감성을 가지는 분석 결과를 제공하는 프라이머 쌍이다.
본 명세서에서 사용된 용어 "프로브"란 시료 내의 검출하고자 하는 표적 물질과 특이적으로 결합할 수 있는 물질을 의미하며, 상기 결합을 통하여 특이적으로 시료 내의 표적 물질의 존재를 확인할 수 있는 물질을 의미한다. 프로브 분자의 종류는 당업계에서 통상적으로 사용되는 물질로서 제한은 없으나, 바람직하게는 PNA (peptide nucleic acid), LNA (locked nucleic acid), 펩타이드, 폴리펩타이드, 단백질, RNA 또는 DNA 일 수 있다. 보다 구체적으로, 상기 프로브는 바이오 물질로서 생물에서 유래되거나 이와 유사한 것 또는 생체외에서 제조된 것을 포함하는 것으로 예를 들어, 효소, 단백질, 항체, 미생물, 동식물 세포 및 기관, 신경세포, DNA, 및 RNA일 수 있으며, DNA는 cDNA, 게놈 DNA, 올리고뉴클레오타이드를 포함하며, RNA는 게놈 RNA, mRNA, 올리고뉴클레오타이드를 포함하며, 단백질의 예로는 항체, 항원, 효소, 펩타이드 등을 포함할 수 있다.
본 명세서에서 용어, "안티센스 올리고뉴클레오티드"는 특정 유전자(예를 들면, 특정 유전자의 mRNA)의 서열에 상보적인 핵산 서열을 함유하고 있는 DNA 또는 RNA 또는 이들의 유도체일 수 있다. 안티센스 올리고뉴클레오티드의 길이는 6 내지 100 염기, 바람직하게는 8 내지 60 염기, 보다 바람직하게는 10 내지 40 염기일 수 있다.
일 구체예에 있어서, 상기 수브돌리그라눌룸, 비피도박테리움, 파라코커스, 슈도모나스, 블라우티아, 도레아 및 라크노스피라새 균주로 이루어지는 군에서 선택되는 하나 이상의 미생물 바이오 마커는 여성 탈모의 진단을 위한 것일 수 있다.
일 구체예에 있어서, 상기 로소넬라, 알리소넬라, 파라수테렐라, 락토바실랄레스, 에리시펠라토클로스트리디움, 라크노스피라, RF39, 파스코락토박테리움 및 네가티피바실러스 균주로 이루어지는 군에서 선택되는 하나 이상의 미생물 바이오 마커는 남성 탈모의 진단을 위한 것일 수 있다.
다른 양상은 상기 탈모 진단용 조성물을 포함하는 탈모 진단용 키트를 제공한다.
일 구체예에 있어서, 상기 키트는 RT-PCR(Reverse transcription polymerase chain reaction) 키트, DNA 칩 키트, 마이크로어레이 키트, ELISA(Enzyme-linked immunosorbent assay) 키트, 단백질 칩 키트, 래피드(rapid) 키트 또는 MRM(Multiple reaction monitoring) 키트일 수 있다.
또한, 상기 키트는 분석 방법에 적합한 한 종류 또는 그 이상의 다른 구성성분 조성물, 용액 또는 장치를 더 포함하여 구성될 수 있다. 예를 들면, 상기 키트는 역전사 중합효소반응을 수행하기 위해 필요한 필수 요소를 포함하는 키트일 수 있다. 역전사 중합효소반응 키트는 마커 유전자에 대한 특이적인 각각의 프라이머 쌍을 포함한다. 프라이머는 상기 각 유전자의 핵산서열에 특이적인 서열을 가지는 뉴클레오타이드로서, 약 7 bp 내지 50 bp의 길이, 보다 바람직하게는 약 10 bp 내지 30 bp 의 길이이다. 또한 대조군 유전자의 핵산 서열에 특이적인 프라이머를 포함할 수 있다. 그외 역전사 중합효소반응 키트는 테스트 튜브 또는 다른 적절한 컨테이너, 반응 완충액(pH 및 마그네슘 농도는 다양), 데옥시뉴클레오타이드(dNTPs), Taq-폴리머라아제 및 역전사효소와 같은 효소, DNAse, RNAse 억제제 DEPC-수(DEPC-water), 멸균수등을 포함할 수 있다. 또한, 예를 들면, DNA 칩 키트는 유전자 또는 그의 단편에 해당하는 cDNA 또는 올리고뉴클레오티드(oligonucleotide)가 부착되어 있는 기판, 및 형광표식 프로브를 제작하기 위한 시약, 제제, 효소 등을 포함할 수 있다. 또한 기판은 대조군 유전자 또는 그의 단편에 해당하는 cDNA 또는 올리고뉴클레오티드를 포함할 수 있다. 또한, 예를 들면, 상기 키트는 ELISA를 수행하기 위해 필요한 필수 요소를 포함하는 진단 키트일 수 있다. ELISA 키트는 표적 물질에 특이적인 항체를 포함한다. 항체는 각 마커 단백질에 대한 특이성 및 친화성이 높고 다른 단백질에 대한 교차 반응성이 거의 없는 항체로, 단클론 항체, 다클론 항체 또는 재조합 항체이다. 또한 ELISA 키트는 대조군 단백질에 특이적인 항체를 포함할 수 있다. 그 외 ELISA 키트는 결합된 항체를 검출할 수 있는 시약, 예를 들면, 표지된 2차 항체, 발색단(chromophores), 효소(예: 항체와 컨주게이트됨) 및 그의 기질 또는 항체와 결합할 수 있는 다른 물질 등을 포함할 수 있다. 또한, 예를 들면, 상기 키트는 분석결과를 알 수 있는 신속한 테스트를 수행하기 위해 필요한 필수 요소를 포함하는 래피드(rapid) 키트 일 수 있다. 래피드 키트는 단백질에 대한 특이적인 항체를 포함한다. 항체는 각 마커 단백질에 대한 특이성 및 친화성이 높고 다른 단백질에 대한 교차 반응성이 거의 없는 항체로, 단클론 항체, 다클론 항체 또는 재조합 항체이다.
또 다른 양상은 분리된 생물학적 시료로부터 수브돌리그라눌룸, 비피도박테리움, 파라코커스, 슈도모나스, 블라우티아, 도레아, 라크노스피라새, 로소넬라, 알리소넬라, 파라수테렐라, 락토바실랄레스, 에리시펠라토클로스트리디움, 라크노스피라, RF39, 파스코락토박테리움 및 네가티피바실러스 균주로 이루어지는 군에서 선택되는 하나 이상의 미생물 바이오 마커를 검출하는 단계를 포함하는 탈모를 진단하는 방법 또는 탈모 진단에 관한 정보를 제공 방법을 제공한다.
상기 검출, 탈모 및 진단은 전술한 바와 같다.
일 구체예에 있어서, 상기 방법은 상기 수브돌리그라눌룸, 비피도박테리움, 파라코커스, 슈도모나스 및 도레아 균주로 이루어지는 군에서 선택되는 하나 이상의 미생물의 풍부도가 정상 대조군 시료의 미생물의 풍부도가 높은 경우, 또는 상기 블라우티아 및 라크노스피라새 균주로 이루어지는 군에서 선택되는 하나 이상의 미생물의 풍부도가 정상 대조군 시료의 미생물의 풍부도가 낮은 경우, 여성형 탈모로 판단하는 단계를 포함하는 것일 수 있다.
일 구체예에 있어서, 상기 방법은 로소넬라, 알리소넬라, 파라수테렐라, 락토바실랄레스, 에리시펠라토클로스트리디움, 라크노스피라, RF39, 파스코락토박테리움 및 네가티피바실러스 균주로 이루어지는 군에서 선택되는 하나 이상의 미생물의 풍부도가 정상 대조군 시료의 미생물의 풍부도가 낮은 경우, 남성형 탈모로 판단하는 단계를 포함하는 것일 수 있다.
일 구체예에 있어서, 상기 미생물을 검출하기 위한 분석 방법은 중합효소 연쇄 반응 (Polymerase Chain Reaction, PCR), 역전사 중합효소반응(RT-PCR), 경쟁적 역전사 중합효소반응(Competitive RT-PCR), 실시간 역전사 중합효소반응(Real-time RT-PCR, qPCR(quantitative real time polymerase chain reaction)), RNase 보호 분석법(RPA; RNase protection assay), 노던 블랏팅(Northern blotting), DNA 칩 등을 포함할 수 있다.
다른 양상은 정상군 및 탈모군의 분리된 시료(예를 들면, 두피)에서 미생물 군집 데이터를 획득하는 단계; 상기 미생물 군집 데이터를 트레이닝 세트와 테스트 세트로 구분하여 기계학습을 수행하여 모델을 생성하는 단계; 및 상기 생성된 모델로부터 정상군과 탈모군에서 차이가 존재하는 미생물 군집을 선별하는 단계를 포함하는 탈모 진단을 위한 바이오 마커를 선별하는 방법을 제공한다.
일 구체예에 있어서, 상기 미생물 군집 데이터는 생물학적 샘플로부터 실험적으로 측정되거나, 공지된 문헌으로부터 획득하거나, 또는 데이터베이스(DB)에 저장된 데이터를 포함할 수 있다. 상기 데이터베이스는 NCBI(National Center for Biotechnology Information), Gene Expression Omnibus (GEO), European Bioinformatics Institute databases, 또는 European Nucleotide Archive를 포함할 수 있다.
상기 생물학적 샘플로부터 실험적으로 특정하는 방법에 대해서는 상기한 바와 같다.
일 구체예에 있어서, 상기 방법은 상기 데이터를 테스트 세트와 트레이닝 세트로 구분하는 단계를 더 포함할 수 있다. 상기 트레이닝 세트와 테스트 세트의 실험데이터는 소정의 비율(예를 들면, 약 90:10, 약 80:20, 약 75:25, 약 70:30, 약 60:40, 약 50:50, 약 40:60, 약 25:75, 약 20:80, 또는 약 10:90)로 분류될 수 있다. 또한, 상기 트레이닝 세트와 테스트 세트는 복수의 서로 상이한 시료로부터 도출된 데이터를 모두 포함하는 것일 수 있다.
일 구체예에 있어서, 상기 미생물 군집 데이터 및 상기 정상군과 탈모군의 차이는 미생물 풍부도인 것일 수 있다.
일 구체예에 있어서, 상기 기계학습 모델은 LRA(Linear regression analysis) 모델, 랜덤포레스트(Random Forest) 모델,GLMNET(Generalized linear) 모델, 그래디언트 부스팅(Gradient Boosting) 모델 및 XGB(Extreme Gradient Boost) 모델로 이루어지는 군에서 선택되는 하나 이상인 것일 수 있고, 본 명세서의 바람직한 실시예에서 상기 기계학습 모델은 랜덤 포레스트일 수 있다.
일 구체예에 있어서, 랜덤 포레스트 구축 알고리즘은 부트스트랩 샘플링(bootstrop sampling)을 수행하여 데이터 세트를 생성하는 단계; 상기 부트스트랩의 결과로 생성된 데이터 세트로부터 복수의 중요 변수를 랜덤하게 추출하여 의사 결정 나무를 생성하는 단계; 및 상기 의사 결정 나무의 결과를 합치는 앙상블 단계를 포함할 수 있다.
상기 방법에 의해 도출된 탈모 진단을 위한 바이오 마커에 대해서는 상기한 바와 같다.
본 명세서의 또 다른 양상은 상기 생성된 탈모 예측 모델을 제공한다.
또 다른 양상은, 상기 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공한다.
또 다른 양상은, 탈모 진단을 위한 바이오 마커를 선별하기 위한 장치를 제공한다.
상기 장치는, 정상군 및 탈모군의 분리된 두피 시료에서 미생물 군집 데이터를 획득하는 획득부; 상기 미생물 군집 데이터를 트레이닝 세트와 테스트 세트로 구분하여 기계학습을 수행하여 모델을 생성하는 모델 생성부; 및 상기 생성된 모델로부터 정상군과 탈모군에서 차이가 존재하는 미생물 군집을 선별하는 미생물 군집 선별부를 포함하는 것일 수 있다.
일 양상에 따른 기계 학습을 이용한 탈모 진단 마커를 선별하는 방법에 의하면, 두피 내 모든 박테리아 속의 풍부도 모델을 구축함으로써 탈모환자 특이적인 마커의 후보군을 찾아낼 수 있는 효과가 있다.
상기 방법에 의해 선별된 탈모 진단의 마커는 유의성 있고 정확한 탈모 진단에 이용될 수 있는 효과가 있다.
도 1은 랜덤 포레스트 모델을 통해 선정된 여성의 두피 마이크로바이옴 기반 바이오마커를 나타내는 그래프이다.
도 2는 랜덤 포레스트 모델을 통해 선정된 남성의 두피 마이크로바이옴 기반 바이오마커를 나타내는 그래프이다.
도 3은 여성을 대상으로 한 AGA 그룹 및 대조군 그룹(CON)의 균주별 풍부도를 나타내는 그래프이다.
도 4는 남성을 대상으로 한 AGA 그룹 및 대조군 그룹(CON)의 균주별 풍부도를 나타내는 그래프이다.
도 5는 정상인과 탈모인 진단에 대한 모델의 정확도를 보여주는 ROC 곡선 및 AUC 수치를 나타내는 그래프이다.
도 2는 랜덤 포레스트 모델을 통해 선정된 남성의 두피 마이크로바이옴 기반 바이오마커를 나타내는 그래프이다.
도 3은 여성을 대상으로 한 AGA 그룹 및 대조군 그룹(CON)의 균주별 풍부도를 나타내는 그래프이다.
도 4는 남성을 대상으로 한 AGA 그룹 및 대조군 그룹(CON)의 균주별 풍부도를 나타내는 그래프이다.
도 5는 정상인과 탈모인 진단에 대한 모델의 정확도를 보여주는 ROC 곡선 및 AUC 수치를 나타내는 그래프이다.
이하 실시예를 통하여 보다 상세하게 설명한다. 그러나, 이들 실시예는 예시적으로 설명하기 위한 것으로 본 발명의 범위가 이들 실시예에 한정되는 것은 아니다.
참조예 1. 실험 대상자 및 분류
탈모증 또는 두피에 감염성 질환으로 수술을 받은 적이 없으며, 1개월 이내에 항생제를 투여하지 않은 총 141명의 한국 여성 및 남성을 대상으로 실험을 진행하였다. 육안 평가를 통해 기본 유형(BA) 및 특정 유형(SP) 분류 기준(BASP)을 참조하여 대상자를 분류하였다. 탈모 유무에 따라 건강한 46명의 대조군 그룹(CON, 25명의 여성과 21명의 남성) 및 AGA를 가진 95명의 AGA 그룹(AGA, 49명의 여성과 46명의 남성)으로 나누었다.
참조예 2. 미생물 샘플수집
시료 채취 전 1일간 실험 대상자의 헤어케어 제품 및 샴푸 사용을 금지하였다. 샘플링 및 임상 평가는 온도(24±2℃) 및 습도(50±5%)가 일정하게 유지되는 공간에서 수행하였다. 두피, 가르마 및 정수리 부위를 멸균된 면봉으로 긁어서 샘플을 채취하였으며, 0.1% Tween 20, 0.15M 염화나트륨 및 0.1% 한천을 함유한 방부제를 사용하여 두피 미생물을 수집하였다. 모든 미생물 샘플은 DNA 추출 전까지 -80°C에서 즉시 보관되었다.
참조예 3. DNA 추출 및 앰플리콘 시퀀싱
두피세균 DNA는 DNeasy PowerSoil Pro Kit(Qiagen, Hilden, Germany)로 DNA 추출 효율을 높이는 변형된 방법으로 추출하였다. 추출된 DNA의 양과 질은 각각 Qubit® 2.0 Fluorometer(Life Technologies, Carlsbad, CA, United States) 및 NanoDrop 2000/2000c Spectrophotometer(Thermo Fisher Scientific, Waltham, MA, United States)를 사용하여 확인하였다. 특정 속의 종을 구분하는 것보다 다양한 세균의 검출에 우선순위를 두어, 16s rRNA V4-V5 분석을 시행하였다. 구체적으로, 박테리아 종을 구별할 수 있는 16S rRNA 유전자 영역 중 V4-V5 영역을 Illumina Miseq 플랫폼을 사용하여 시퀀싱을 진행하였다. 모든 라이브러리는 KNU NGS 핵심 시설(대한민국 대구)에서 Illumina MiSeq 플랫폼(Illumina, San Diego, CA, USA)을 사용하여 등몰량으로 다중화되고 페어드 엔드(paired-end)(2×300bp) 시퀀싱 되었다.
참조예 4. 시퀀싱 데이터 처리
로우(Raw) 시퀀스 데이터를 QIIME2(Quantitative Insights into Microbial Ecology 2) 파이프라인(버전 2021.4)을 사용하여 분석하였다. 로우 앰플리콘 데이터에서 평균 빈도는 두피 마이크로바이옴의 경우 35,272리드(reads)였다. 앰플리콘 서열 변이체(Amplicon Sequence Variants; ASVs)를 확인하기 위해, 서열을 역다중화(demultiplex) 및 트리밍(trim)하고, DADA2(Q 점수>30, 균일한 길이 240bp)로 잡음을 제거(denoise) 하였다. ASV의 서열은 99% 서열 동일성의 임계값으로 Silva v138 데이터베이스를 사용하는 scikit-learn naive Bayes 기계 학습 분류기를 통해 분류학적으로 식별되었다(silva-138-99-nb-classifier.qza). 미토콘드리아, 엽록체 및 지정되지 않은 분류군 서열은 제거하였다. 두피 세균 샘플들의 서열은 각 샘플의 상이한 시퀀싱 정도(Sequencing Depth)를 정규화를 위해, 3,756리드의 시퀀싱 정도로 희박화(rarefied)되었다. 박테리아 미생물 군집의 기능적 프로파일은 PICRUSt2(Phylogenetic Investigation of Communities by Reconstruction of Unobserved States) v.2.3.0-b 소프트웨어에 의한 커뮤니티의 계통발생학적 조사를 사용하여 예측되었다. 그런 다음 예측된 KEGG(Kyoto Encyclopedia of Genes and Genomes) 직교 풍부도에서 KEGG 경로를 추론하였다.
실시예 1. 랜덤 포레스트 모델을 이용한 탈모 진단 바이오마커 선별
상기 참조예 1 내지 4를 통해 수득한 데이터를 바탕으로 의사결정트리를 만들어 랜덤포레스트 알고리즘을 만들어 탈모 진단에 이용될 수 있는 바이오마커를 선별하였다.
구체적으로, 상기 대상자들의 두피 샘플에서 확인된 모든 박테리아 속의 풍부도는 모델을 구축하기 위한 특징으로 사용되었다. 전체의 샘플은 무작위적으로 7:3의 비율로 트레이닝 세트와 테스트 세트로 나뉘었다. 랜덤 포레스트 모델의 최적 매개변수는 과적합을 방지하기 위해 10-fold cross validation을 기반으로 트레이닝 프로세스의 분류 성능을 최대로 하는 수치로 결정하였다.
이후에, 트레이닝 세트를 사용하여 의사 결정 나무의 모형을 학습시킨 후 학습된 모든 모형을 종합하여 합침으로써 최종 군집인 랜덤 포레스트 모델을 구축하였고, 정상군과 탈모군에서 차이가 나는 두피 마이크로바이옴 기반 바이오마커를 선별하였다. 그 결과는 도 1 및 도 2에 나타내었다.
도 1은 랜덤 포레스트를 통해 선정된 여성의 두피 마이크로바이옴 기반 바이오마커를 나타내는 그래프이다.
도 2는 랜덤 포레스트를 통해 선정된 남성의 두피 마이크로바이옴 기반 바이오마커를 나타내는 그래프이다.
도 1 및 도 2의 그래프들의 가로축(Mean Decrease Accuracy)은 해당 균주로 인한, '탈모 판별 정확도가 얼마나 높은지'를 의미하며, 세로축(색깔 표기)은 해당 균주가 대조군(CON) 및 탈모군(AGA)에서 높은 풍부도로 존재하는지 낮은 풍부도로 존재하는지를 의미한다.
도 1에 따르면, 여성의 경우, Subdoligranulum, Bifidobacterium, Paracoccus, Pseudomonas, Blautia, Dorea, Lachnospiracea의 순으로 높은 정확도를 보였으며, Subdoligranulum, Bifidobacterium, Paracoccus, Pseudomonas 및 Dorea 균주의 경우에는 탈모군에서 대조군(정상군)보다 높은 풍부도를 보이고, Blautia 및 Lachnospiraceae 균주의 경우에는 탈모군에서 대조군(정상군)보다 낮은 풍부도를 보임을 확인하였다. 또한, 특히, Subdoligranulum 균주의 경우, 평균 정확도 감소(Mean Decrease Accuracy)의 값이 5.0 이상이며, 선별된 균주 중 가장 높은 탈모 판별 정확도가 높은 균주임을 알 수 있었다.
도 2에 따르면, 남성의 경우, Lawsonella, Allisonella, Parasutterella, Lactobacillales, Erysipelatoclostridium, Lachnospira, RF39, Phascolarctobacterium, Negativibacillus의 순으로 높은 정확도를 보였으며, 선별된 모든 균주가 탈모군에서 대조군(정상군)보다 낮은 풍부도를 보임을 확인하였다. 또한, 특히, Lawsonella 균주의 경우, 평균 정확도 감소(Mean Decrease Accuracy)의 값이 25 이상이며, 선별된 균주 중 가장 높은 탈모 판별 정확도가 높은 균주임을 알 수 있었다.
이를 통해, 상기 선별된 두피 마이크로바이옴의 정상군과 탈모군의 차이를 이용하여 탈모의 판별이 가능한 것을 알 수 있었다.
실시예 2. 선별된 탈모 진단 바이오마커를 이용한 탈모 진단모델 효율성 평가
2-1. 선별된 균주들의 두피 내 풍부도(Abundance) 분석
랜덤 포레스트 모델을 통해 도출한 바이오마커의 기능을 확인하기 위해, AGA 그룹 및 대조군 그룹(CON)의 균주별 풍부도를 확인하였다.
구체적으로, 참조예 1 내지 4로 부터 수득한 데이터를 바탕으로 바이오마커로 선발된 균주들의 풍부도에 대한 그룹간의 비교를 실시하였다. 유의성 평가를 위해 Wilcoxon rank-sum test를 사용하였으며 p value < 0.05인 균주에 대하여 *로 표시하였다.
도 3은 여성을 대상으로 한 AGA 그룹 및 대조군 그룹(CON)의 균주별 풍부도를 나타내는 그래프이다.
도 4는 남성을 대상으로 한 AGA 그룹 및 대조군 그룹(CON)의 균주별 풍부도를 나타내는 그래프이다.
도 3에 나타낸 바와 같이, 여성의 경우, Subdoligranulum, Bifidobacterium, Paracoccus, Pseudomonas 및 Dorea 균주의 풍부도는 탈모군에서 대조군(정상군)보다 높음을 알 수 있었고, Blautia 및 Lachnospiracea 균주의 풍부도는 탈모군에서 대조군(정상군)보다 낮음을 알 수 있었다. 이러한 결과는 위 기계학습을 이용한 결과와 일치함을 의미한다.
도 4 에 나타낸 바와 같이, 남성의 경우, Lawsonella, Allisonella, Parasutterella, Lactobacillales, Erysipelatoclostridium, Lachnospira, RF39, Phascolarctobacterium 및 Negativibacillus 균주의 풍부도는 탈모군에서 대조군(정상군)보다 낮음을 알 수 있었고, 이러한 결과는 위 기계학습을 이용한 결과와 일치함을 의미한다.
이상의 결과로, 일 구체예의 기계 학습 모델에 따라 도출된 마이크로바이옴 기반 바이오 마커들의 풍부도가 실제 시료에서의 풍부도와 동일한 양상을 나타냄을 알 수 있었다.
2-2. AUC(Area Under the Curve) 확인
추가적으로, 상기 모델의 정확도를 확인하기 위해, ROC(Receiver Operating Characteristics) 곡선의 AUC(Area Under the Curve)를 계산하여 모델의 효율성을 평가하였다. AUC는 트레이닝 세트로 구축된 상기 모델에 대해 테스트 세트를 이용하여 성능을 평가한 결과를 의미한다.
도 5는 정상인과 탈모인 진단에 대한 모델의 정확도를 보여주는 ROC 곡선 및 AUC 수치를 나타내는 그래프이다.
도 5에 따르면, 남성을 대상으로 한 탈모진단 모델의 AUC 수치는 0.808이고, 여성을 대상으로 한 탈모진단 모델의 AUC 수치는 0.592로 나타났다. 이러한 결과는 일 구체예의 기계 학습 모델에 따라 도출된 두피 마이크로바이옴 기반 바이오 마커가 높은 정확도와 민감도를 가짐을 의미한다.
이상의 결과들은 일 구체예에 따른 방법은 탈모에 대한 유의한 마커를 선별할 수 있음을 의미하고, 일 구체예에 따른 방법으로 도출된 16개의 균주들은 탈모를 진단하는데 유용하게 사용될 수 있음을 의미한다.
Claims (14)
- 두피에서 분리한 수브돌리그라눌룸(Subdoligranulum)균주를 포함하는 미생물 바이오 마커를 검출할 수 있는 제제를 포함하는, 여성의 탈모 진단용 조성물.
- 삭제
- 청구항 1에 있어서, 상기 탈모는 안드로겐성 탈모인 것인 여성의 탈모 진단용 조성물.
- 청구항 1에 있어서, 상기 미생물 바이오 마커는 비피도박테리움(Bifidobacterium), 파라코커스(Paracoccus), 슈도모나스(Pseudomonas), 블라우티아(Blautia), 도레아(Dorea) 및 라크노스피라새(Lachnospiraceae) 균주로 이루어지는 군에서 선택되는 하나 이상의 균주를 더 포함하는 것인 여성의 탈모 진단용 조성물.
- 청구항 1에 있어서, 상기 미생물 바이오 마커를 검출할 수 있는 제제는 상기 균주 특이적 서열에 결합할 수 있는 프로브(probe), 상기 균주 특이적 서열이 포함된 부위를 포함하는 폴리뉴클레오타이드 또는 이의 상보적인 폴리뉴클레오타이드를 특이적으로 증폭할 수 있는 프라이머(primer) 세트인 것인, 여성의 탈모 진단용 조성물.
- 청구항 1에 있어서, 상기 미생물 바이오 마커는,
정상군 및 탈모군의 분리된 두피 시료에서 미생물 군집 데이터를 획득하는 단계;
상기 미생물 군집 데이터를 트레이닝 세트와 테스트 세트로 구분하여 기계학습을 수행하여 모델을 생성하는 단계; 및
상기 생성된 모델로부터 정상군과 탈모군에서 차이가 존재하는 미생물 군집을 선별하는 단계를 포함하는 방법으로 선별된 것인 여성의 탈모 진단용 조성물. - 청구항 6에 있어서, 상기 미생물 군집 데이터 및 상기 정상군과 탈모군의 차이는 미생물 풍부도인 것인, 여성의 탈모 진단용 조성물.
- 청구항 6에 있어서, 상기 미생물 군집 데이터는 생물학적 샘플로부터 실험적으로 측정되거나, 공지된 문헌으로부터 획득하거나 또는 데이터베이스(DB)에 저장된 데이터인 것인, 여성의 탈모 진단용 조성물.
- 청구항 6에 있어서, 상기 기계학습 모델은 LRA(Linear regression analysis) 모델, 랜덤포레스트(Random Forest) 모델, GLMNET(Generalized linear) 모델, 그래디언트 부스팅(Gradient Boosting) 모델 및 XGB(Extreme Gradient Boost) 모델로 이루어지는 군에서 선택되는 하나 이상인 것인, 여성의 탈모 진단용 조성물.
- 청구항 1, 3 내지 9 중 어느 한 항의 조성물을 포함하는 여성의 탈모 진단용 키트.
- 두피로부터 수브돌리그라눌룸(Subdoligranulum) 균주를 포함하는 미생물 바이오 마커를 검출하는 단계를 포함하는, 여성의 탈모 진단에 관한 정보를 제공하는 방법.
- 청구항 11에 있어서, 상기 미생물 바이오 마커는 비피도박테리움(Bifidobacterium), 파라코커스(Paracoccus), 슈도모나스(Pseudomonas), 블라우티아(Blautia), 도레아(Dorea) 및 라크노스피라새(Lachnospiraceae) 균주로 이루어지는 군에서 선택되는 하나 이상의 균주를 더 포함하는 것인 여성의 탈모 진단에 관한 정보를 제공하는 방법.
- 청구항 11 또는 청구항 12에 있어서, 상기 수브돌리그라눌룸, 비피도박테리움, 파라코커스, 슈도모나스 및 도레아 균주로 이루어지는 군에서 선택되는 하나 이상의 미생물의 풍부도가 정상군의 풍부도보다 높은 경우, 또는 상기 블라우티아 및 라크노스피라새 균주로 이루어지는 군에서 선택되는 하나 이상의 미생물의 풍부도가 정상군의 풍부도보다 낮은 경우, 탈모로 판단하는 단계를 포함하는 여성의 탈모 진단에 관한 정보를 제공하는 방법.
- 청구항 11 또는 청구항12에 있어서, 상기 검출하는 단계는, 중합효소 연쇄 반응 (Polymerase Chain Reaction, PCR), 역전사 중합효소반응(RT-PCR), 경쟁적 역전사 중합효소반응(Competitive RT-PCR), 실시간 역전사 중합효소반응(Real-time RT-PCR), RNase 보호 분석법(RPA; RNase protection assay), 노던 블랏팅(Northern blotting) 및 DNA 칩으로 이루어지는 군에서 선택되는 하나 이상의 분석방법을 포함하는 것인 여성의 탈모 진단에 관한 정보를 제공하는 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020230091072A KR102612260B1 (ko) | 2023-04-05 | 2023-07-13 | 여성의 탈모 진단을 위한 두피 마이크로바이옴 기반바이오 마커, 이를 이용한 탈모를 진단하는 방법, 및 기계 학습을 이용한 마이크로바이옴 기반 바이오 마커를 선별하는 방법 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020230045031A KR102612258B1 (ko) | 2023-04-05 | 2023-04-05 | 남성의 탈모 진단을 위한 두피 마이크로바이옴 기반 바이오 마커, 이를 이용한 남성의 탈모를 진단하는 방법, 및 기계 학습을 이용한 마이크로바이옴 기반 바이오 마커를 선별하는 방법 |
KR1020230091072A KR102612260B1 (ko) | 2023-04-05 | 2023-07-13 | 여성의 탈모 진단을 위한 두피 마이크로바이옴 기반바이오 마커, 이를 이용한 탈모를 진단하는 방법, 및 기계 학습을 이용한 마이크로바이옴 기반 바이오 마커를 선별하는 방법 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020230045031A Division KR102612258B1 (ko) | 2023-04-05 | 2023-04-05 | 남성의 탈모 진단을 위한 두피 마이크로바이옴 기반 바이오 마커, 이를 이용한 남성의 탈모를 진단하는 방법, 및 기계 학습을 이용한 마이크로바이옴 기반 바이오 마커를 선별하는 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR102612260B1 true KR102612260B1 (ko) | 2023-12-12 |
Family
ID=89159479
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020230045031A KR102612258B1 (ko) | 2023-04-05 | 2023-04-05 | 남성의 탈모 진단을 위한 두피 마이크로바이옴 기반 바이오 마커, 이를 이용한 남성의 탈모를 진단하는 방법, 및 기계 학습을 이용한 마이크로바이옴 기반 바이오 마커를 선별하는 방법 |
KR1020230091072A KR102612260B1 (ko) | 2023-04-05 | 2023-07-13 | 여성의 탈모 진단을 위한 두피 마이크로바이옴 기반바이오 마커, 이를 이용한 탈모를 진단하는 방법, 및 기계 학습을 이용한 마이크로바이옴 기반 바이오 마커를 선별하는 방법 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020230045031A KR102612258B1 (ko) | 2023-04-05 | 2023-04-05 | 남성의 탈모 진단을 위한 두피 마이크로바이옴 기반 바이오 마커, 이를 이용한 남성의 탈모를 진단하는 방법, 및 기계 학습을 이용한 마이크로바이옴 기반 바이오 마커를 선별하는 방법 |
Country Status (1)
Country | Link |
---|---|
KR (2) | KR102612258B1 (ko) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022000419A (ja) * | 2020-06-19 | 2022-01-04 | 国立大学法人九州大学 | 毛髪用組成物 |
-
2023
- 2023-04-05 KR KR1020230045031A patent/KR102612258B1/ko active IP Right Grant
- 2023-07-13 KR KR1020230091072A patent/KR102612260B1/ko active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022000419A (ja) * | 2020-06-19 | 2022-01-04 | 国立大学法人九州大学 | 毛髪用組成物 |
Non-Patent Citations (3)
Title |
---|
Frontiers in Nutrition, 2022, 9, 979876, pp.1-3* * |
Genes, 2022, 13, 1860, pp.1-24* * |
Journal of Dermatological Science 102, 109-115(2021) * |
Also Published As
Publication number | Publication date |
---|---|
KR102612258B1 (ko) | 2023-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11111541B2 (en) | Diagnostic MiRNA markers for Parkinson's disease | |
US20210254179A1 (en) | Set of genes for molecular classifying of medulloblastoma and use thereof | |
CN111411150B (zh) | 诊断肌少症的肠道菌群及其应用 | |
CN112553328B (zh) | 检测基因表达水平的产品及其在制备重度抑郁症诊断工具中的应用 | |
CN106661623A (zh) | 使用miRNA生物标志物相对于多发性硬化诊断视神经脊髓炎 | |
CN104968802A (zh) | 作为诊断标志物的新miRNA | |
US20150100242A1 (en) | Method, kit and array for biomarker validation and clinical use | |
Rolling et al. | Customization of a DADA2-based pipeline for fungal internal transcribed spacer 1 (ITS1) amplicon data sets | |
CN104428426B (zh) | 多发性硬化的诊断miRNA概况 | |
CN113724862B (zh) | 一种结直肠癌生物标志物及其筛选方法和应用 | |
CN113637744A (zh) | 微生物标志物在判断急性胰腺炎病程进展中的应用 | |
KR102612260B1 (ko) | 여성의 탈모 진단을 위한 두피 마이크로바이옴 기반바이오 마커, 이를 이용한 탈모를 진단하는 방법, 및 기계 학습을 이용한 마이크로바이옴 기반 바이오 마커를 선별하는 방법 | |
CN115261499B (zh) | 耐力相关的肠道微生物标记物及其应用 | |
CN114657270B (zh) | 一种基于肠道菌群的阿尔茨海默病生物标志物及其应用 | |
WO2021230379A1 (ja) | パーキンソン病の検出方法 | |
CN113684242A (zh) | 一种基于淋巴结微生物菌群的头颈癌预后生物标志物及其应用 | |
CN113584190A (zh) | 一种诊断草酸钙结石的肠道菌群标志物及其应用 | |
JP2017189166A (ja) | 慢性膿皮症の診断方法及び慢性膿皮症の診断用キット | |
CN111261222B (zh) | 口腔微生物群落检测模型的构建方法 | |
CN111662992A (zh) | 与急性胰腺炎相关的菌群及其应用 | |
CN113637782B (zh) | 与急性胰腺炎病程进展相关的微生物标志物及其应用 | |
CN112048552B (zh) | 诊断重症肌无力的肠道菌群及其应用 | |
CN112634983B (zh) | 病原物种特异pcr引物优化设计方法 | |
WO2024062931A1 (ja) | 神経変性疾患のリスク判定方法及び判定装置 | |
JP7271341B2 (ja) | 歯周病進行リスク測定方法及びキット |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |