KR102550113B1 - 전립선암 진단용 바이오마커 및 이의 용도 - Google Patents
전립선암 진단용 바이오마커 및 이의 용도 Download PDFInfo
- Publication number
- KR102550113B1 KR102550113B1 KR1020210069428A KR20210069428A KR102550113B1 KR 102550113 B1 KR102550113 B1 KR 102550113B1 KR 1020210069428 A KR1020210069428 A KR 1020210069428A KR 20210069428 A KR20210069428 A KR 20210069428A KR 102550113 B1 KR102550113 B1 KR 102550113B1
- Authority
- KR
- South Korea
- Prior art keywords
- hsa
- mir
- prostate cancer
- mirna
- lncrna
- Prior art date
Links
- 206010060862 Prostate cancer Diseases 0.000 title claims abstract description 161
- 208000000236 Prostatic Neoplasms Diseases 0.000 title claims abstract description 159
- 238000003745 diagnosis Methods 0.000 title claims abstract description 31
- 239000000090 biomarker Substances 0.000 title abstract description 90
- 108091070501 miRNA Proteins 0.000 claims abstract description 121
- 239000002679 microRNA Substances 0.000 claims abstract description 121
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 119
- 108020005198 Long Noncoding RNA Proteins 0.000 claims abstract description 101
- 108020004999 messenger RNA Proteins 0.000 claims abstract description 99
- 230000004927 fusion Effects 0.000 claims abstract description 93
- 230000014509 gene expression Effects 0.000 claims abstract description 81
- 238000000034 method Methods 0.000 claims abstract description 55
- 210000002700 urine Anatomy 0.000 claims abstract description 39
- 239000000203 mixture Substances 0.000 claims abstract description 35
- 210000001519 tissue Anatomy 0.000 claims abstract description 12
- 239000003795 chemical substances by application Substances 0.000 claims abstract description 11
- 238000011529 RT qPCR Methods 0.000 claims abstract 3
- 238000004422 calculation algorithm Methods 0.000 claims description 42
- 238000010801 machine learning Methods 0.000 claims description 39
- 238000007477 logistic regression Methods 0.000 claims description 33
- 239000002299 complementary DNA Substances 0.000 claims description 27
- 101000638154 Homo sapiens Transmembrane protease serine 2 Proteins 0.000 claims description 24
- 102100031989 Transmembrane protease serine 2 Human genes 0.000 claims description 24
- 238000010240 RT-PCR analysis Methods 0.000 claims description 23
- 239000012472 biological sample Substances 0.000 claims description 23
- 238000004458 analytical method Methods 0.000 claims description 22
- 238000007637 random forest analysis Methods 0.000 claims description 21
- 239000000523 sample Substances 0.000 claims description 21
- 108091068991 Homo sapiens miR-141 stem-loop Proteins 0.000 claims description 20
- 108091069006 Homo sapiens miR-125b-1 stem-loop Proteins 0.000 claims description 19
- 108091069087 Homo sapiens miR-125b-2 stem-loop Proteins 0.000 claims description 19
- 108091070489 Homo sapiens miR-17 stem-loop Proteins 0.000 claims description 19
- 210000004027 cell Anatomy 0.000 claims description 19
- 108091065163 Homo sapiens miR-30c-1 stem-loop Proteins 0.000 claims description 18
- 108091067641 Homo sapiens miR-30c-2 stem-loop Proteins 0.000 claims description 18
- 238000012706 support-vector machine Methods 0.000 claims description 17
- 108091070365 Homo sapiens miR-30a stem-loop Proteins 0.000 claims description 15
- 238000006243 chemical reaction Methods 0.000 claims description 13
- 108091069089 Homo sapiens miR-146a stem-loop Proteins 0.000 claims description 11
- 108091007767 MALAT1 Proteins 0.000 claims description 11
- 102100034343 Integrase Human genes 0.000 claims description 10
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 claims description 10
- 108091070493 Homo sapiens miR-21 stem-loop Proteins 0.000 claims description 9
- 108091067573 Homo sapiens miR-222 stem-loop Proteins 0.000 claims description 9
- 108091070373 Homo sapiens miR-24-1 stem-loop Proteins 0.000 claims description 9
- 108091070374 Homo sapiens miR-24-2 stem-loop Proteins 0.000 claims description 9
- 108091008065 MIR21 Proteins 0.000 claims description 9
- 238000011304 droplet digital PCR Methods 0.000 claims description 9
- 239000002773 nucleotide Substances 0.000 claims description 9
- 125000003729 nucleotide group Chemical group 0.000 claims description 9
- 210000000582 semen Anatomy 0.000 claims description 8
- 210000004369 blood Anatomy 0.000 claims description 7
- 239000008280 blood Substances 0.000 claims description 7
- 210000002381 plasma Anatomy 0.000 claims description 7
- 210000003296 saliva Anatomy 0.000 claims description 7
- 210000002966 serum Anatomy 0.000 claims description 7
- 108091062138 Homo sapiens miR-1185-2 stem-loop Proteins 0.000 claims description 6
- 108091069018 Homo sapiens miR-27b stem-loop Proteins 0.000 claims description 6
- 108091070395 Homo sapiens miR-31 stem-loop Proteins 0.000 claims description 6
- 108091067535 Homo sapiens miR-375 stem-loop Proteins 0.000 claims description 6
- 108091007424 MIR27B Proteins 0.000 claims description 6
- 230000002860 competitive effect Effects 0.000 claims description 6
- 238000002790 cross-validation Methods 0.000 claims description 6
- 108091069457 Homo sapiens miR-200b stem-loop Proteins 0.000 claims description 5
- 108091069021 Homo sapiens miR-30b stem-loop Proteins 0.000 claims description 5
- 238000000636 Northern blotting Methods 0.000 claims description 5
- 102000006382 Ribonucleases Human genes 0.000 claims description 5
- 108010083644 Ribonucleases Proteins 0.000 claims description 5
- 239000013068 control sample Substances 0.000 claims description 5
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 230000002194 synthesizing effect Effects 0.000 claims description 4
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 3
- 238000002360 preparation method Methods 0.000 claims description 3
- 108091033411 PCA3 Proteins 0.000 claims 3
- 239000012634 fragment Substances 0.000 abstract description 10
- 230000008901 benefit Effects 0.000 abstract description 2
- 238000011477 surgical intervention Methods 0.000 abstract 1
- 206010004446 Benign prostatic hyperplasia Diseases 0.000 description 27
- 208000004403 Prostatic Hyperplasia Diseases 0.000 description 26
- 239000003550 marker Substances 0.000 description 26
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 24
- 108020004414 DNA Proteins 0.000 description 24
- 238000003753 real-time PCR Methods 0.000 description 19
- 101001077417 Gallus gallus Potassium voltage-gated channel subfamily H member 6 Proteins 0.000 description 18
- 101001010792 Homo sapiens Transcriptional regulator ERG Proteins 0.000 description 18
- 108010072866 Prostate-Specific Antigen Proteins 0.000 description 18
- 102100038358 Prostate-specific antigen Human genes 0.000 description 18
- 206010028980 Neoplasm Diseases 0.000 description 17
- 239000000872 buffer Substances 0.000 description 15
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 14
- 201000011510 cancer Diseases 0.000 description 11
- 238000007619 statistical method Methods 0.000 description 10
- 238000012360 testing method Methods 0.000 description 10
- 210000002307 prostate Anatomy 0.000 description 9
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 8
- 238000001514 detection method Methods 0.000 description 8
- 239000006166 lysate Substances 0.000 description 8
- 150000007523 nucleic acids Chemical class 0.000 description 7
- 238000010839 reverse transcription Methods 0.000 description 7
- 238000003556 assay Methods 0.000 description 6
- 238000001574 biopsy Methods 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000011534 incubation Methods 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 5
- 239000004606 Fillers/Extenders Substances 0.000 description 4
- 239000003153 chemical reaction reagent Substances 0.000 description 4
- 238000002591 computed tomography Methods 0.000 description 4
- 230000000875 corresponding effect Effects 0.000 description 4
- 230000036425 denaturation Effects 0.000 description 4
- 238000004925 denaturation Methods 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 239000012528 membrane Substances 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 210000000056 organ Anatomy 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 239000000047 product Substances 0.000 description 4
- 102000004169 proteins and genes Human genes 0.000 description 4
- 108020004463 18S ribosomal RNA Proteins 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 108020004707 nucleic acids Proteins 0.000 description 3
- 102000039446 nucleic acids Human genes 0.000 description 3
- -1 nucleoside triphosphates Chemical class 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 238000001356 surgical procedure Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 102000007469 Actins Human genes 0.000 description 2
- 108010085238 Actins Proteins 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 239000003298 DNA probe Substances 0.000 description 2
- 108010067770 Endopeptidase K Proteins 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- 238000002944 PCR assay Methods 0.000 description 2
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 239000003098 androgen Substances 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 238000010835 comparative analysis Methods 0.000 description 2
- 238000013211 curve analysis Methods 0.000 description 2
- 230000001351 cycling effect Effects 0.000 description 2
- 238000002405 diagnostic procedure Methods 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 238000010828 elution Methods 0.000 description 2
- 206010020718 hyperplasia Diseases 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 201000002528 pancreatic cancer Diseases 0.000 description 2
- 208000008443 pancreatic carcinoma Diseases 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 238000002604 ultrasonography Methods 0.000 description 2
- 238000003260 vortexing Methods 0.000 description 2
- IQVNEKKDSLOHHK-FNCQTZNRSA-N (E,E)-hydramethylnon Chemical compound N1CC(C)(C)CNC1=NN=C(/C=C/C=1C=CC(=CC=1)C(F)(F)F)\C=C\C1=CC=C(C(F)(F)F)C=C1 IQVNEKKDSLOHHK-FNCQTZNRSA-N 0.000 description 1
- QCMYYKRYFNMIEC-UHFFFAOYSA-N COP(O)=O Chemical class COP(O)=O QCMYYKRYFNMIEC-UHFFFAOYSA-N 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 108091092584 GDNA Proteins 0.000 description 1
- 229930186217 Glycolipid Natural products 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 108091030146 MiRBase Proteins 0.000 description 1
- 108700011259 MicroRNAs Proteins 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 208000025174 PANDAS Diseases 0.000 description 1
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 description 1
- 240000004718 Panda Species 0.000 description 1
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 108020004518 RNA Probes Proteins 0.000 description 1
- 239000003391 RNA probe Substances 0.000 description 1
- 239000013614 RNA sample Substances 0.000 description 1
- 206010039491 Sarcoma Diseases 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- 208000009956 adenocarcinoma Diseases 0.000 description 1
- 238000002583 angiography Methods 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 230000027455 binding Effects 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 150000004657 carbamic acid derivatives Chemical class 0.000 description 1
- 231100000504 carcinogenesis Toxicity 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 150000002016 disaccharides Chemical class 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- NAGJZTKCGNOGPW-UHFFFAOYSA-N dithiophosphoric acid Chemical class OP(O)(S)=S NAGJZTKCGNOGPW-UHFFFAOYSA-N 0.000 description 1
- 238000013399 early diagnosis Methods 0.000 description 1
- 235000006694 eating habits Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000007459 endoscopic retrograde cholangiopancreatography Methods 0.000 description 1
- 238000001839 endoscopy Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000000762 glandular Effects 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000002357 laparoscopic surgery Methods 0.000 description 1
- 210000003041 ligament Anatomy 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 238000010841 mRNA extraction Methods 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 238000002595 magnetic resonance imaging Methods 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 238000011880 melting curve analysis Methods 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 150000002772 monosaccharides Chemical class 0.000 description 1
- 238000010202 multivariate logistic regression analysis Methods 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 150000002482 oligosaccharides Chemical class 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 150000008298 phosphoramidates Chemical class 0.000 description 1
- 150000008300 phosphoramidites Chemical class 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 239000013615 primer Substances 0.000 description 1
- 239000002987 primer (paints) Substances 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 210000005267 prostate cell Anatomy 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 210000000664 rectum Anatomy 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000001850 reproductive effect Effects 0.000 description 1
- 239000003161 ribonuclease inhibitor Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- 239000000439 tumor marker Substances 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 210000003708 urethra Anatomy 0.000 description 1
- 230000002485 urinary effect Effects 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/178—Oligonucleotides characterized by their use miRNA, siRNA or ncRNA
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Hospice & Palliative Care (AREA)
- Biophysics (AREA)
- Oncology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
본 발명은 전립선암 진단을 위한 바이오마커 및 이의 용도에 관한 것으로, 더욱 자세하게는 특정 lncRNA, miRNA, 및 융합 유전자의 mRNA, 또는 이의 단편의 발현 수준을 측정할 수 있는 제제를 포함하는 전립선암 진단용 조성물; 상기 바이오마커의 발현 수준을 측정하는 단계를 포함하는 전립선암 진단을 위한 정보를 제공하는 방법; 및 상기 전립선암 진단용 조성물을 포함하는 전립선암 진단용 키트에 관한 것이다. 본 발명은 정상조직 대비 전립선암에서 이상 발현되는 새로운 lncRNA, miRNA, 및 융합 유전자의 mRNA의 조합을 처음으로 규명함에 따라, 이를 바이오마커로 사용함으로써 외과적 시술 없이 비침습적인 방법으로 전립선암을 빠르고 신속하게 진단할 수 있다. 특히, 본 발명의 전립선암 진단용 lncRNA, miRNA, 및 융합 유전자의 mRNA는 대상체의 소변에서 다른 유전자 대비 상대적으로 발현량이 많아 qRT-PCR을 통해 안정적으로 분석이 가능한 이점을 갖는다.
Description
본 발명은 전립선암 진단을 위한 바이오마커 및 이의 용도에 관한 것으로, 더욱 자세하게는 특정 lncRNA, miRNA, 융합 유전자(fusion gene)의 mRNA, 및/또는 이의 단편의 발현 수준을 측정할 수 있는 제제를 포함하는 전립선암 진단용 조성물; 상기 바이오마커의 발현 수준을 측정하는 단계를 포함하는 전립선암 진단을 위한 정보를 제공하는 방법; 및 상기 전립선암 진단용 조성물을 포함하는 전립선암 진단용 키트에 관한 것이다.
전립선은 방광 바로 밑, 직장 앞쪽에 있는 밤톨만 한 크기의 남성 생식기관으로, 정액의 일부를 만들어내고 저장하는 역할을 한다. 위로는 방광경부, 즉 방광에서 요도로 이행하는 부위와 인접해 앞쪽의 치골전립선인대에 고정되어 있고, 아래로는 비뇨생식격막에 의해 고정되어 있다. 전립선에서 발생하는 암의 대부분은 전립선 세포에서 발생하는 선암(샘세포의 암)이다. 종양 조직의 분화 정도와 세포의 특성 등에 따라 유형을 구분할 수 있다.
전립선암(prostate cancer; PCa)은 전세계적으로 가장 흔한 비뇨기계 종양 중 하나로서, 미국에서는 2016년에만 약 180,890명이 전립선암으로 새로이 진단되어 미국 내 전체 신규 종양진단의 10.7%를 차지하며, 유방암과 폐암에 이어 세 번째로 빈번하게 발병이 되는 종양이다. 2009년부터 2013년까지의 통계에 비추어 전세계 100,000명의 남성 중 129.4명이 전립선암을 가지고 있으며 전립선암의 사망률은 2016년 통계로 26,120명에 이른다. 또한 전립선암은 50세 이전에는 흔하지 않은 질환이나 50세를 넘게 되면 급격히 증가하는 양상을 보인다. 최근 평균 수명의 연장으로 국내에서도 노인 남성의 수가 급증하고 전립선암을 조기에 진단하여 전이가 발생하는 등으로 악화되지 않도록 지속적인 관리를 필요로 한다. 특히 사람 전립선암은 뼈로 전이되는 성향을 가지는 것으로 보이며, 안드로겐 의존성 상태로부터 안드로겐 내성 상태로 불가피하게 진행되어 환자의 사망률을 증가시킨다고 알려져 있다. 더욱이, 전립선암 치료를 받은 남성의 약 25%는 병이 재발하여 추가적인 치료를 필요로 하는 질병으로서, 현재 미국에서 남자의 암 사망 원인 중 제2의 원인을 차지하고 있는바 (Jemal A et al., CA Cancer J Clin 2010;60:277-300), 이에 대한 조기진단 및 치료가 필요한 실정이다.
전립선암 진단을 위한 종래기술로는 PSA(Prostate Specific Antigen) 측정 및 바이옵시(biopsy)가 있다. PSA 측정은 전립선암 진단에서 가장 많이 쓰이는 방법으로, 전립선 세포에서 만들어지는 특이 항원 수치를 측정해 전립선암 위험도를 결정짓는 방법이다. 악성 전립선암일수록 PSA 수치는 높으며, 전립선암이 없는 대부분의 남성들은 4ng/mL 미만의 수치를 가지고 있다. 하지만 측정한 PSA 수치가 전립선암의 부재에도 불구하고 굉장히 높거나 혹은 PSA gray zone(PSA 4ng/mL 이상 10ng/mL 이하) 구간에 들어설 경우 바이옵시를 요하게 된다. 바이옵시는 암이 의심되는 장기 부분의 조직을 바늘로 취해 병리조직학적 검사를 통해 환자의 해당 장기에 암, 육종 등의 악성종양 유무를 진단하는 방법이다. 이러한 바이옵시 검사는 환자들의 고통이 크며, 특히 PSA gray zone에서의 전립선암 진단의 정확률은 30% 미만이다. 즉 다시 말해 약 70%의 환자들이 PSA 측정의 한계로 인해 비용이 들고 고통스러운 리바이옵시를 겪게 된다는 단점이 있다.
따라서, 이 같은 불필요한 리바이옵시와 PSA 측정의 한계를 극복 및 대체하기 위해 보다 높은 정확도를 갖는 전립선암 특이적 진단법의 개발이 필요한 실정이다.
이러한 배경 하에, 본 발명은 검사 시의 고통을 피하고 비용의 부담을 줄이기 위하여 전립선암으로 진단된 환자의 소변 샘플 및 비종양 대조군 소변 샘플을 기초로 전립선암 특이적 바이오마커로서 특정 lncRNA, miRNA, 및/또는 mRNA (특히, 융합 유전자의 mRNA)의 조합을 규명하였으며, 이들 lncRNA, miRNA, 및/또는 융합 유전자의 mRNA 바이오마커의 조합이 전립선암의 진단에 유용함을 확인함으로써 본 발명을 완성하였다.
따라서 본 발명의 목적은 전립선암을 효과적으로 진단할 수 있는 조성물을 제공하는 것이다.
본 발명의 또 다른 목적은, 바이오마커를 이용하여 전립선암을 효과적으로 진단하기 위한 정보 제공 방법을 제공하는 것이다.
본 발명의 또 다른 목적은, 상기 조성물을 포함하는 전립선암 진단용 키트를 제공하는 것이다.
본 발명의 또 다른 목적은, 상기 조성물 또는 이를 포함하는 전립선암 진단용 키트를 이용하여 전립선암을 진단하는 방법을 제공하는 것이다.
상기와 같은 본 발명의 목적을 달성하기 위해서,
본 발명은 하기 조합의 발현 수준을 측정할 수 있는 제제를 포함하는 전립선암 진단용 조성물로서, 조합은: (a) lncRNA 및 miRNA, (b) 융합 유전자의 mRNA 및 miRNA, 또는 (c) lncRNA, miRNA 및 융합 유전자의 mRNA이고, 상기 lncRNA는 PCA3 및 MALAT1 중에서 선택되는 적어도 하나이고, 상기 융합 유전자의 mRNA는 TMPRSS2:ERG이고, 상기 miRNA는 hsa_miR_375, hsa_miR_27b_3p, hsa_miR_31_5p, hsa_miR_125b_5p, hsa_miR_146a_3p, hsa_miR_146a_5p, hsa_miR_17_3p, hsa_miR_200b_3p, hsa_miR_21_5p, hsa_miR_1185_2_3p, hsa_miR_141_5p, hsa_miR_222_3p, hsa_miR_24_3p, hsa_miR_30a_3p, hsa_miR_30a_5p, hsa_miR_30b_5p 및 hsa_miR_30c_5p로 이루어진 군으로부터 선택되는 적어도 하나인, 전립선암 진단용 조성물을 제공한다.
일 실시양태에서, 상기 제제는 상기 lncRNA, miRNA 및 융합 유전자의 mRNA에 각각 특이적으로 결합하는 프라이머, 프로브 또는 항체를 포함할 수 있다.
또한, 본 발명은 대상체로부터 분리된 생물학적 시료에서 상기 lncRNA, 융합 유전자의 mRNA, miRNA 또는 이들의 조합의 발현 수준을 측정하는 단계; 및 상기 lncRNA, 융합 유전자의 mRNA, miRNA 또는 이들의 조합의 발현 수준을 정상 대조군 시료의 lncRNA, 융합 유전자의 mRNA, miRNA 또는 이들의 조합의 발현 수준과 비교하는 단계를 포함하는, 전립선암 진단을 위한 정보를 제공하는 방법을 제공한다.
일 실시양태에서, 상기 lncRNA, 융합 유전자의 mRNA, miRNA 또는 이들의 조합의 발현 수준은 역전사효소 중합효소 연쇄반응(RT-PCR), 경쟁적 역전사효소 중합효소 연쇄반응(competitive RT-PCR), 정량적 역전사효소 중합효소반응(quantitative RT-PCR, qPCR), ddPCR(droplet digital PCR), 시퀀싱 (sequencing), RNase 보호 분석법(RNase protection method), 노던 블랏팅(Northern blotting) 또는 유전자 칩 분석법에 의하여 측정될 수 있다.
일 실시양태에서, 상기 발현 수준을 측정하는 단계는: 대상체로부터 분리된 생물학적 시료에서 상기 lncRNA, 융합 유전자의 mRNA, miRNA 또는 이들의 조합을 추출하는 단계; 추출된 lncRNA, 융합 유전자의 mRNA, miRNA 또는 이들의 조합으로부터 cDNA를 합성하는 단계; 합성한 cDNA에 특이적인 프라이머 쌍을 사용하여 cDNA를 증폭하는 단계; 및 증폭된 cDNA를 검출하는 단계를 포함할 수 있다.
일 실시양태에서, 상기 생물학적 시료는 조직, 세포, 소변, 타액, 정액, 전혈, 혈장 또는 혈청일 수 있다. 바람직하게는, 상기 생물학적 시료는 소변일 수 있다.
일 실시양태에서, 상기 lncRNA, 융합 유전자의 mRNA, miRNA 또는 이들의 조합의 발현 수준을 비교하는 단계는: Logistic Regression(LR), Support vector machine(SVM), random forest 및 Multi-Layer-Perceptron으로 이루어진 군으로부터 선택되는 머신 러닝 알고리즘을 이용하여 수행될 수 있다. 바람직하게는, lncRNA, 융합 유전자의 mRNA, miRNA 또는 이들의 조합의 발현 수준을 비교하는 단계는 Logistic Regression(LR)을 이용하여 수행될 수 있다.
또한, 본 발명은 상기 전립선암 진단용 조성물을 포함하는, 전립선암 진단용 키트를 제공한다.
또한, 본 발명은 상기 전립선암 진단용 조성물 또는 이를 포함하는 전립선암 진단용 키트를 이용하여 전립선암을 진단하는 방법을 제공한다.
본 발명은 정상조직 대비 전립선암에서 이상 발현되는 새로운 lncRNA, miRNA, 및 mRNA (특히, 융합 유전자의 mRNA)의 조합을 처음으로 규명함에 따라, 이를 바이오마커로 사용함으로써 외과적 시술 없이 비침습적인 방법으로 전립선암을 빠르고 신속하게 진단할 수 있다. 특히, 본 발명의 전립선암 진단용 lncRNA, miRNA, 및 융합 유전자의 mRNA는 대상체의 소변에서 다른 유전자 대비 상대적으로 발현량이 많아 qPCR을 통해 안정적으로 분석이 가능한 이점을 갖는다.
도 1은 qPCR을 이용한 전립선암(PCa) 스크리닝을 위한 머신 러닝 지원 다중-마커 분석의 개요를 나타낸다.
도 2 및 도 3은 단일 마커 분석에 대한 결과를 나타낸다: 도 2는 표적 유전자 발현의 경향성 분석을 위한 박스 플롯(box plot); 도 3는 바이오마커 성능 분석을 위한 수신기 작동 특성 (Receiver Operator Characteristic; ROC) 곡선 및 곡선하면적(Area Under the Curve; AUC).
도 4는 RFECV 알고리즘을 적용한 결과로서, 최적의 바이오마커 조합을 나타낸다: (a) 4 개의 특징(feature)을 조합시 극댓값(local maximum)이 형성됨; (b) 사용된 바이오마커의 순위.
도 5는 머신 러닝 프로세스 및 단일-바이오마커 기반 ML 분류자 LOOCV 점수를 나타낸다.
도 6은 단일-바이오마커 기반 머신 러닝 평가를 나타낸다.
도 7은 다중-바이오마커 기반 ML 분류자 평가를 나타낸다.
도 8은 ML 분류자 평가 및 특징 분석을 나타내는 것으로, 머신 러닝 지원 다중 마커 분석에 대한 결과를 나타낸다.
도 2 및 도 3은 단일 마커 분석에 대한 결과를 나타낸다: 도 2는 표적 유전자 발현의 경향성 분석을 위한 박스 플롯(box plot); 도 3는 바이오마커 성능 분석을 위한 수신기 작동 특성 (Receiver Operator Characteristic; ROC) 곡선 및 곡선하면적(Area Under the Curve; AUC).
도 4는 RFECV 알고리즘을 적용한 결과로서, 최적의 바이오마커 조합을 나타낸다: (a) 4 개의 특징(feature)을 조합시 극댓값(local maximum)이 형성됨; (b) 사용된 바이오마커의 순위.
도 5는 머신 러닝 프로세스 및 단일-바이오마커 기반 ML 분류자 LOOCV 점수를 나타낸다.
도 6은 단일-바이오마커 기반 머신 러닝 평가를 나타낸다.
도 7은 다중-바이오마커 기반 ML 분류자 평가를 나타낸다.
도 8은 ML 분류자 평가 및 특징 분석을 나타내는 것으로, 머신 러닝 지원 다중 마커 분석에 대한 결과를 나타낸다.
본 발명은 전립선암 진단을 위한 바이오마커에 관한 것이다.
본 발명에서 사용되는 용어 "전립선암"이란, 전립선에서 발생하는 악성 종양으로서 '국소전립선암(localized prostate cancer)' 및 '진행성 전립선암(Advanced prostate cancer)'을 포함하나, 이에 제한되지 않는다.
본 발명에서 사용되는 용어 "진단"이란, 병리 상태의 존재 또는 특징을 확인하는 것을 의미한다. 본 발명에 있어서, 상기 진단은 전립선암의 발병 또는 진행 여부를 확인하는 것으로 해석될 수 있다.
본 발명에서 사용되는 용어 "마커 또는 진단 마커(diagnosis marker)"란 전립선암을 가진 대상체를 정상 세포 또는 정상 대상체와 구분하여 진단할 수 있는 물질로, 정상 세포에 비하여 전립선암이 발병 또는 진행된 세포 또는 대상체에서 증가 또는 감소를 보이는 폴리펩티드, 단백질 또는 핵산(예: lncRNA, miRNA, 또는 mRNA 등), 지질, 당지질, 당단백질 또는 당(단당류, 이당류, 올리고당류 등) 등과 같은 유기 생체 분자들을 포함하나, 이에 제한되지 않는다. 전립선암 진단 마커는 전립선암의 발병 및 진행에 대한 지표가 될 수 있으므로, 전립선암의 발병, 질환의 진행, 질환의 진단에 이용될 수 있다.
본 발명의 목적상, 본 발명의 전립선암 진단 마커는 정상 세포 또는 조직의 세포에 비하여, 전립선암 세포에서 특이적으로 발현 수준의 차이를 보이는 lncRNA, miRNA, 및/또는 융합 유전자의 mRNA의 단편이다.
보다 구체적으로, 본 발명의 lncRNA 전립선암 진단 마커는 PCA3 및 MALAT1 중에서 선택되는 적어도 하나의 것이고, 융합 유전자의 mRNA 전립선암 진단 마커는 TMPRSS2:ERG이고, miRNA 전립선암 진단 마커는 hsa_miR_375, hsa_miR_27b_3p, hsa_miR_31_5p, hsa_miR_125b_5p, hsa_miR_146a_3p, hsa_miR_146a_5p, hsa_miR_17_3p, hsa_miR_200b_3p, hsa_miR_21_5p, hsa_miR_1185_2_3p, hsa_miR_141_5p, hsa_miR_222_3p, hsa_miR_24_3p, hsa_miR_30a_3p, hsa_miR_30a_5p, hsa_miR_30b_5p 및 hsa_miR_30c_5p로 이루어진 군으로부터 선택되는 적어도 하나의 것으로서, 이들은 전립선암이 발병 또는 진행된 세포 또는 대상체에서 증가 또는 감소하는 RNA이다. 상기 마커 중, PCA3, TMPRSS2:ERG 및 MALAT1은 전립선암에서 발현이 증가하며, 나머지는 발현이 감소한다.
일 양태에서, 특히 상기 마커들은 정상 대조군으로부터 전립선암 환자의 진단, 전립선암의 진행 상태를 구분할 수 있는 변별력을 향상시키기 위하여 두 개 이상의 조합으로 사용될 수 있다. 본 발명에 따른 마커 중 이러한 용도에 최적의 효과를 나타내는 lncRNA, mRNA 또는 miRNA의 조합을 선별하여 사용할 수 있으며, 당업자라면 용도에 맞는 적절한 조합을 선택할 수 있을 것이다.
일 양태에서, 상기 마커 lncRNA, mRNA 또는 miRNA의 조합은 환자군에 따른 마커의 상대적 발현량 분석과 ROC 곡선의 AUC 값을 통한 개별 마커 성능 평가를 통하여 선정될 수 있다. 자세하게는, AUC 값이 높거나 기존에 참고 문헌들과 환자군에 따른 경향성이 일치하는 프라이머를 선정하며 이후 추가적으로 multi-variable analysis를 진행하여 선택될 수 있다. 바이오마커별 개별 데이터 분석 결과는 도 2 및 도 3에 개시되어 있다.
일 양태에서, 상기 마커의 조합은 파라미터로서 Leave-One-Out (LOO) 및 Random Forest (RF)를 사용하였을 때, RFECV (Recursive Feature Elimination with Cross-Validation) 알고리즘을 적용한 결과로서 극댓값(local maximum)을 형성하도록 조합된다. 바람직하게는, 상기 마커의 조합은 Logistic Regression(LR)을 이용하여 수행되며, LOOCV (Leave-One-Out Cross-Validation) 값이 0.65 이상이고, AUC 값이 0.70 이상인 것으로 조합될 수 있다. 일례로, 이러한 조합은 lncRNA로 PCA3, 융합 유전자의 mRNA로 TMPRSS2:ERG, 및 miRNA로 hsa_miR_125b_5p, hsa_miR_141_5p, hsa_miR_17_3p 및 hsa_miR_30c_5p의 조합을 포함할 수 있다. 이들 조합에 대한 ROC 곡선은 도 7에 개시되어 있다.
일 양태에서, 상기 마커의 조합은 (a) lncRNA 및 miRNA, (b) 융합 유전자의 mRNA 및 miRNA, 또는 (c) lncRNA, miRNA 및 융합 유전자의 mRNA이고, 상기 lncRNA는 PCA3 및 MALAT1 중에서 선택되는 적어도 하나이고, 상기 융합 유전자의 mRNA는 TMPRSS2:ERG이고, 상기 miRNA는 miRNA는 hsa_miR_125b_5p, hsa_miR_141_5p, hsa_miR_21_5p, hsa_miR_17_3p, hsa_miR_24_3p, hsa_miR_30a_5p, hsa_miR_222_3p 및 hsa_miR_30c_5p로 이루어진 군으로부터 선택되는 적어도 하나일 수 있다.
일 양태에서, 상기 마커의 조합은 lncRNA 및 융합 유전자의 mRNA의 조합이고, 상기 lncRNA는 PCA3 및 MALAT1이고, 상기 융합 유전자의 mRNA는 TMPRSS2:ERG이다.
일 양태에서, 상기 마커는 miRNA이고, 상기 miRNA는 miRNA는 hsa_miR_125b_5p, hsa_miR_141_5p, hsa_miR_21_5p, hsa_miR_17_3p, hsa_miR_24_3p, hsa_miR_30a_5p, hsa_miR_222_3p 및 hsa_miR_30c_5p로 이루어진 군으로부터 선택되는 적어도 두 개이다.
바람직하게는, 상기 마커의 조합은 lncRNA, miRNA 및 융합 유전자의 mRNA의 조합이고, 상기 lncRNA는 PCA3이고, 상기 miRNA는 hsa_miR_125b_5p, hsa_miR_141_5p, hsa_miR_17_3p 및 hsa_miR_30c_5p이다.
일 양태에서, 상기 lncRNA 또는 융합 유전자의 mRNA에 각각 특이적으로 결합하는 프라이머는 다음과 같은 염기서열로 이루어질 수 있다.
일 양태에서, 상기 miRNA는 다음과 같은 염기서열로 이루어질 수 있다.
상기 서열번호 1~18로 기재된 염기서열은 lncRNA 또는 융합 유전자의 mRNA에 특이적으로 결합하는 프라이머의 염기서열이고 상기 서열번호 19~35로 기재된 염기서열은 miRNA 자체의 염기서열이다. miRNA에 특이적으로 결합하는 프라이머는 상기 miRNA 염기서열을 참조하여 설계할 수 있다. 프라이머는 전립선암의 발병 또는 진행 여부를 진단할 수 있는 진단 마커로 활용될 수 있는 lncRNA, miRNA, 및 융합 유전자의 mRNA를 효과적으로 검출할 수 있으며, 프라이머의 염기서열은 진단마커로 활용될 수 있는 lncRNA, miRNA, 및 융합 유전자의 mRNA를 검출하는 데 있어서 일정 정도 변형이 가능하다. 본 기술분야의 당업자라면 이러한 인위적인 변형에 의해 80% 이상, 바람직하게는 90% 이상, 보다 바람직하게는 95% 이상, 가장 바람직하게는 98% 이상의 상동성이 유지되는 염기서열이 본 발명에서 목적하는 전립선암 진단 마커로서 정상 대상체와 전립선암 질환을 가진 대상체 간에 발현량 차이를 유의하게 비교 가능한 한, 본 발명의 상기 염기서열과 균등한 것임을 쉽게 이해할 것이다.
상기 각 마커의 단백질은 공지된 것으로, 예를 들면 상기 각 마커의 서열은 인간 유래의 서열이다.
본 발명에서 사용되는 용어 "생물학적 시료" 또는 "검체"란 인체나 포유동물로부터 얻어지는 모든 고형 또는 액상의 시료, 예컨대, 특정 장기 유래의 조직, 세포, 소변, 타액, 정액, 전혈, 혈장 또는 혈청 시료를 포함하나, 이에 제한되지 않는다.
일 양태에서, 본 발명의 전립선암 진단 마커가 사용되는 생물학적 시료는 전립선암 조직, 세포, 소변, 타액, 정액, 전혈, 혈장 또는 혈청 중에서 선택될 수 있다. 바람직하게는, 본 발명의 전립선암 진단 마커가 사용되는 생물학적 시료는 소변이다.
다른 양태에서, 본 발명에 사용되는 생물학적 시료로서는, 비교 분석을 위해, 전립선암의 판별이 필요한 검사 대상자의 생물학적 시료는 물론, 정상 대조군, 특정 유형의 전립선암 대조군 유래의 생물학적 시료 또한 사용될 수 있다.
본 발명에서 사용되는 용어 "lncRNA, miRNA, 또는 융합 유전자의 mRNA의 발현 수준을 측정할 수 있는 제제"란, 시료에 포함된 해당 lncRNA, miRNA, 융합 유전자의 mRNA 및/또는 이의 단편의 발현 여부를 확인하는 방법에 사용되는 제제를 의미하는데, 바람직하게는 역전사효소 중합효소 연쇄반응, 경쟁적 역전사효소 중합효소 연쇄반응, 정량적 역전사효소 중합효소반응, ddPCR(droplet digital PCR), 시퀀싱 (sequencing), RNase 보호 분석법, 노던 블랏팅 또는 유전자 칩 분석법 등의 방법에 사용되는 표적 유전자에 특이적으로 결합할 수 있는 프라이머, 프로브 또는 항체를 포함할 수 있다. 바람직하게는, lncRNA, miRNA, 또는 융합 유전자의 mRNA의 발현 수준을 측정할 수 있는 제제는 본 발명의 프라이머를 포함한다.
본 발명에서는 역전사효소 중합효소 연쇄반응(RT-PCR)과 정량적 역전사효소 중합효소반응(qPCR)을 이용하여 마커를 검출할 수 있다. 역전사효소 중합효소 연쇄반응이란, 생물학적 시료로부터 RNA, 예컨대 lncRNA, miRNA, 또는 mRNA를 분리한 후, 이로부터 cDNA를 합성하고 특정 프라이머, 또는 프라이머 및 프로브의 조합을 사용하여 특정 유전자를 대량으로 증폭시키는 것을 일컫는다. 실시간 중합효소 연쇄반응(Real-time PCR)으로도 알려진 qPCR은, 형광물질을 PCR법에 응용한 것으로서 특정 프라이머, 또는 프라이머 및 프로브의 조합을 사용하여 반응 중 시료 내에 존재하는 표적 유전자의 증폭과 함께 형광물질의 발광(emission) 정도를 실시간으로 검출하고 정량 분석하여 표적 유전자의 증폭 유무 및 그 양상을 신속하고 정확하게 분석할 수 있는 방법이며, 다수의 표적 유전자의 발현 변화를 확인하여 고속 대량의 실험결과를 스크리닝 하는데 주로 사용된다. 이러한 방법은 예를 들면 (Han, H.; Bearss, D. J.; Browne, L. W.; Calaluce, R.; Nagle, R. B.; Von Hoff, D. D., Identification of differentially expressed genes in pancreatic cancer cells using cDNA microarray. Cancer Res 2002, 62, (10), 2890-6. / Kwang Hyuck Lee, Quatification of DNA as a tumor marker in patients with pancreatic cancer, 대한소화기학회지 2005, 46, 226-32)에 기재되어 있다.
본 발명에서 사용되는 용어 "프라이머"란, 짧은 자유 3말단 수산화기(free 3' hydroxylgroup)를 가지는 핵산서열로 상보적인 템플레이트(template)와 염기쌍(base pair)을 형성할 수 있고 템플레이트 가닥 복사를 위한 시작 지점으로 기능을 하는 짧은 핵산 서열을 의미한다. 프라이머는 적절한 완충용액 및 온도에서 중합반응을 위한 시약(즉, DNA 폴리머레이즈 또는 역전사효소) 및 상이한 4가지 뉴클레오사이드 트리포스페이트의 존재하에서 DNA 합성을 개시할 수 있다.
본 발명에서 사용되는 용어 "프로브"란, 유전자 또는 mRNA와 특이적 결합을 이룰 수 있는 짧게는 수 염기 내지 길게는 수백 염기에 해당하는 RNA 또는 DNA 등의 핵산 단편을 의미하는데, 올리고뉴클레오티드(oligonucleotide) 프로브, 단쇄 DNA(single stranded DNA) 프로브, 이중쇄 DNA(double stranded DNA) 프로브, RNA 프로브 등의 형태로 제작될 수 있고, 보다 용이하게 검출하기 위하여 라벨링될 수 있다.
본 발명의 프라이머 또는 프로브는 포스포르아미다이트 고체 지지체 방법, 또는 기타 널리 공지된 방법을 사용하여 화학적으로 합성할 수 있다. 이러한 핵산서열은 또한 당해 분야에 공지된 많은 수단을 이용하여 변형시킬 수 있다. 이러한 변형의 비-제한적인 예로는 메틸화, 캡화, 천연 뉴클레오타이드 하나 이상의 동족체로의 치환, 및 뉴클레오타이드 간의 변형, 예를 들면, 하전되지 않은 연결체 (예: 메틸 포스포네이트, 포스소트리에스테르, 포스포로아미데이트, 카바메이트 등) 또는 하전된 연결체 (예: 포스포로티오에이트, 포스포로디티오에이트 등)로의 변형이 있다.
일 실시예에서, 본 발명은 전립선암 진단용 바이오마커로서 활용될 수 있는 lncRNA, miRNA, 및 융합 유전자의 mRNA의 조합을 도출하였다. 상기 lncRNA, miRNA, 및 융합 유전자의 mRNA는, 조직학적으로 전립선암으로 진단된 101명의 환자 및 비종양 대조군 62명의 소변 샘플을 qPCR을 통해 분석되었으며, 총 20 개의 유전자, 즉, 2 개의 lncRNA (PCA3, MALAT1), 1 개의 융합 유전자의 mRNA (TMPRSS2:ERG) 및 17 개의 miRNA (hsa_miR_375, hsa_miR_27b_3p, hsa_miR_31_5p, hsa_miR_125b_5p, hsa_miR_146a_3p, hsa_miR_146a_5p, hsa_miR_17_3p, hsa_miR_200b_3p, hsa_miR_21_5p, hsa_miR_1185_2_3p, hsa_miR_141_5p, hsa_miR_222_3p, hsa_miR_24_3p, hsa_miR_30a_3p, hsa_miR_30a_5p, hsa_miR_30b_5p 및 hsa_miR_30c_5p)가 선별되었다. 가장 바람직하게는, 이들 중 비종양 대조군과 종양군에서 발현량의 차이가 관측되는 1 개의 lncRNA (PCA3) 및 1 개의 융합 유전자의 mRNA(TMPRSS2:ERG) 및 4 개의 miRNA(hsa_miR_125b_5p, hsa_miR_141_5p, hsa_miR_17_3p 및 hsa_miR_30c_5p)가 최종 선별되었다.
최종적으로 도출된 본 발명의 1 개의 lncRNA (PCA3) 및 1개의 융합 유전자의 mRNA(TMPRSS2:ERG) 및 4 개의 miRNA (hsa_miR_125b_5p, hsa_miR_141_5p, hsa_miR_17_3p 및 hsa_miR_30c_5p)는 이후 전립선암(101명) 및 전립선비대증(prostate hyperplasia)(62 명) 환자로부터 수득한 총 163 개의 소변 샘플에서 검출마커로의 유용성이 평가되었다. 그 결과, 전체 전립선암 환자의 소변 샘플에서 PCA3, MALAT1에 대한 lncRNA 및 TMPRSS2:ERG에 대한 융합 유전자의 mRNA 바이오마커의 발현 수준이 전립선비대증 대조군에 비해 두드러지게 상향 발현되는 것을 보여주어 이들을 마커로서 선정하였으며, miRNA 바이오마커의 경우 대부분 전립선암 환자의 소변 샘플에서 전립선비대증 대조군에 비해 하향 발현되는 것을 확인하였으며 실험한 모든 miRNA 바이오마커를 마커로서 선정하였다.
이러한 결과를 통하여, 본 발명의 6 개의 마커, 즉 lncRNA (PCA3), 융합 유전자의 mRNA (TMPRSS2:ERG), 및/또는 miRNA (hsa_miR_125b_5p, hsa_miR_141_5p, hsa_miR_17_3p 및 hsa_miR_30c_5p)의 발현 수준을 측정하는 제제를 이용하면 전립선암을 효과적으로 진단할 수 있음을 알 수 있었다.
또한, 본 발명은 전립선암 진단용 조성물 또는 키트를 이용하여 전립선암 진단을 위한 정보를 제공하는 방법에 관한 것이다.
구체적으로, 본 발명의 전립선암 진단을 위한 정보를 제공하는 방법은: 대상체로부터 분리된 생물학적 시료에서 lncRNA, 융합 유전자의 mRNA, miRNA 또는 이들의 조합의 발현 수준을 측정하는 단계; 및 상기 lncRNA, 융합 유전자의 mRNA, miRNA 또는 이들의 조합의 발현 수준을 정상 대조군 시료의 lncRNA, 융합 유전자의 mRNA, miRNA 또는 이들의 조합의 발현 수준과 비교하는 단계를 포함한다. 상기 발현 수준을 측정하는 단계에서 lncRNA, miRNA, 융합 유전자의 mRNA 및/또는 이의 단편의 발현 수준을 측정한 후, 상기 발현 수준을 비교하는 단계에서 lncRNA, miRNA, 융합 유전자의 mRNA 및/또는 이의 단편의 발현 수준을 정상 대조군 시료의 해당 lncRNA, miRNA, 융합 유전자의 mRNA 및/또는 이의 단편의 발현 수준과 비교하여, 마커의 발현 수준이 유의하게 증가하거나 감소하는 경우 전립선암이 발병 또는 진행된 것으로 판정할 수 있다.
일 양태에서, 상기 lncRNA, miRNA, 융합 유전자의 mRNA 및/또는 이의 단편의 발현 수준은 역전사효소 중합효소 연쇄반응, 경쟁적 역전사효소 중합효소 연쇄반응, 정량적 역전사효소 중합효소반응, ddPCR, 시퀀싱, RNase 보호 분석법, 노던 블랏팅 또는 유전자 칩 분석법에 의하여 측정될 수 있으나, 이에 제한되지 않는다.
일 양태에서, 상기 발현 수준을 측정하는 단계는: 대상체로부터 분리된 생물학적 시료에서 PCA3 및 MALAT1를 포함하는 lncRNA, TMPRSS2:ERG를 포함하는 융합 유전자의 mRNA, hsa_miR_375, hsa_miR_27b_3p, hsa_miR_31_5p, hsa_miR_125b_5p, hsa_miR_146a_3p, hsa_miR_146a_5p, hsa_miR_17_3p, hsa_miR_200b_3p, hsa_miR_21_5p, hsa_miR_1185_2_3p, hsa_miR_141_5p, hsa_miR_222_3p, hsa_miR_24_3p, hsa_miR_30a_3p, hsa_miR_30a_5p, hsa_miR_30b_5p 및 hsa_miR_30c_5p를 포함하는 miRNA를 추출하는 단계; 추출된 lncRNA, 융합 유전자의 mRNA 및 miRNA로부터 cDNA를 합성하는 단계; 합성한 cDNA에 특이적인 프라이머 쌍을 사용하여 cDNA를 증폭하는 단계; 및 증폭된 cDNA를 검출하는 단계를 포함한다.
일 양태에서, 상기 생물학적 시료는 피험자로부터 획득한 조직, 세포, 소변, 타액, 정액, 전혈, 혈장 또는 혈청이다. 바람직하게는, 상기 생물학적 시료는 소변이다. 바람직하게는, 상기 소변은 피험자의 전립선 마사지 혹은 DRE(Digital Rectal Examination) 전후에 수집될 수 있다.
일 양태에서, 상기 발현 수준을 비교하는 단계는 전통적인 통계 분석 방법을 이용하여 수행될 수 있다. 바람직하게는, 상기 알고리즘은 Logistic Regression(LR)으로 수행할 수 있다. Logistic Regression(LR) 알고리즘을 이용하여 다중-바이오마커의 발현 수준을 분석하는 경우, 전립선암의 진단, 예측의 정확도를 향상시킬 수 있다. 알고리즘에 관하여는 후술한다.
일 양태에서, 상기 발현 수준을 비교하는 단계는 머신 러닝 알고리즘을 이용하여 수행될 수 있다. 바람직하게는, 상기 알고리즘은 Logistic Regression(LR), Support vector machine(SVM), random forest 및 Multi-Layer-Perceptron으로 이루어진 군으로부터 선택될 수 있다. 머신 러닝 알고리즘을 이용하여 다중-바이오마커의 발현 수준을 분석하는 경우, 전립선암의 진단, 예측의 정확도를 더욱 향상시킬 수 있다. 알고리즘에 관하여는 후술한다.
일 양태에서, 본 발명의 전립선암 진단을 위한 정보를 제공하는 방법은 바이오마커의 분석 결과에 추가하여, 환자의 비단백질 임상정보 즉, 마커 이외의 임상정보를 추가로 사용할 수 있다. 이러한 비단백질 임상정보란, 예를 들면 환자의 나이, 성별, 체중, 식습관, 체질량, 초음파, 전산화 단층촬영(CT), 자기공명영상(MRI), 혈관조영술, 내시경적 역행성 췌담관 조영술, 초음파 내시경, 종양 표지자, 또는 복강경 검사를 포함한다.
또한, 본 발명은 상기 전립선암 진단용 조성물을 포함하는 전립선암 진단용 키트에 관한 것이다.
일 양태에서, 본 발명의 전립선암 진단용 키트는 전립선암 진단 마커인, lncRNA, miRNA, 및 융합 유전자의 mRNA의 발현 수준을 측정함으로써 피험체를 대상으로 하여 전립선암을 진단하는데 사용될 수 있으며, 상기 lncRNA, miRNA, 및 융합 유전자의 mRNA 바이오마커는 두 개 이상의 조합으로 사용될 수 있고, 조합과 관련해서는 앞서 언급한 바와 같다. 바람직하게는, 상기 조합은 1 개의 lncRNA (PCA3) 및 1개의 융합 유전자의 mRNA(TMPRSS2:ERG) 중 하나 이상 및 4 개의 miRNA (hsa_miR_125b_5p, hsa_miR_141_5p, hsa_miR_17_3p 및 hsa_miR_30c_5p) 중 하나 이상을 포함한다. 따라서, 본 발명의 전립선암 진단용 키트는 1 개의 lncRNA (PCA3) 및 1개의 융합 유전자의 mRNA (TMPRSS2:ERG) 중 하나 이상 및 4 개의 miRNA (hsa_miR_125b_5p, hsa_miR_141_5p, hsa_miR_17_3p 및 hsa_miR_30c_5p) 중 하나 이상을 확인하기 위한 폴리뉴클레오티드, 프라이머, 프로브 또는 항체 뿐 아니라 분석 방법에 적합한 한 종류 또는 그 이상의 다른 구성 성분 조성물, 용액 또는 장치가 포함될 수 있다.
일 양태에서, 본 발명의 전립선암 진단용 키트는 RT-PCR을 수행하기 위해 필요한 필수 요소를 포함할 수 있다. RT-PCR 키트는, 상기 유전자에 대한 특이적인 각각의 프라이머 쌍 외에도 테스트 튜브 또는 다른 적절한 컨테이너, 반응 완충액(pH 및 마그네슘 농도는 다양), 데옥시뉴클레오타이드(dNTPs), Taq-폴리머라아제 및 역전사효소와 같은 효소, DNase, RNAse 억제제, DEPC-수(DEPC-water), 멸균수 등을 포함할 수 있다. 또한, 정량 대조군으로 사용되는 유전자에 특이적인 프라이머 쌍을 포함할 수 있다.
다른 양태에서, 본 발명의 전립선암 진단용 키트는 유전자 칩 분석법을 수행하기 위해 필요한 필수 요소를 포함할 수 있다. 유전자 칩 분석용 키트는, 유전자 또는 그의 단편에 해당하는 cDNA가 프로브로 부착되어 있는 기판, 및 형광표식 프로브를 제작하기 위한 시약, 제제, 효소 등을 포함할 수 있다. 또한, 기판은 정량 대조군 유전자 또는 그의 단편에 해당하는 cDNA를 포함할 수 있다.
다른 양태에서, 본 발명의 전립선암 진단용 키트는 상기 lncRNA (PCA3), 융합 유전자의 mRNA (TMPRSS2:ERG) 및 miRNA (hsa_miR_125b_5p, hsa_miR_141_5p, hsa_miR_17_3p 및 hsa_miR_30c_5p) 이외에 종래 알려진 전립선암 진단 바이오마커 유전자 발현 수준을 측정하는 제제를 추가로 포함할 수도 있다.
이러한 본 발명의 바이오마커를 특이적으로 인식하는 물질은 구획이 되어 있는 용기에 개별적으로 분주되어 존재할 수 있으며, 따라서, 본 발명은 본 발명의 마커를 특이적으로 인식할 수 있는 분자를 구획되어 포함하는 장치/기구를 제공한다.
일 양태에서, 본 발명의 전립선암 진단용 키트는 본 발명의 하나 이상의 바이오마커를 검출하기 위한 시약, 장치 및 알고리즘이 내장된 정보처리수단을 추가로 포함할 수 있으며, 상기 알고리즘을 통해 바이오마커의 검출 결과를 전립선암의 진단과 연관시킬 수 있다. 상기 연관은 전립선암 검사 대상자, 정상 대조군 또는 특정 유형의 전립선암을 갖는 환자의 상기 하나 이상의 마커의 발현량 수치를 비교하여, 상기 발현량의 차이에 대한 패턴을 도출하도록 상기 알고리즘을 훈련하는 것을 포함한다.
일 양태에서, 상기 알고리즘의 훈련은 입력값으로 주어지는 바이오마커의 발현량을 산출값으로 주어지는 진단 결과와 맵핑하는 알고리즘을 구축하는 단계; 상기 구축된 알고리즘을 실행하여 상기 마커 발현량과 전립선암의 진단 또는 그 부존재를 맵핑(mapping)하는 단계; 및 상기 구축 실행된 알고리즘의 입력값 및 이에 따른 산출값을 변화시키면서 상기 알고리즘을 수행하여 최적의 알고리즘 맵핑 아키텍쳐(architecture)가 실현되도록 하는 단계를 포함하며, 상기 최적의 알고리즘 맵핑은 상기 정상 대조군 또는 특정 전립선암을 갖는 환자의 마커 발현량과 상기 전립선암 검사 대상자의 마커 발현량 수치를 이용하여 유의한 차이를 규명하고, 이를 전립선암의 진단 또는 부존재에 이용하는 것이다.
본 발명에서는 공지의 알고리즘이 사용될 수 있으며, Logistic Regression(LR), Support vector machine(SVM), random forest, Multi-Layer-Perceptron으로 이루어진 군으로부터 선택될 수 있으나, 이에 제한되지 않는다.
일 양태에서, 본 발명의 전립선암 진단용 키트에 사용되는 생물학적 시료는 전립선암 조직, 세포, 소변, 타액, 정액, 전혈, 혈장 또는 혈청이고, 바람직하게는 소변이며, 비교분석을 위하여 전립선암의 판별이 필요한 환자 유래의 시료, 정상 대조군, 또는 전립선암 대조군 유래의 시료가 또한 사용될 수 있다.
또한, 본 발명은 상기 전립선암 진단용 조성물 또는 키트를 이용하여 전립선암을 진단하는 방법을 제공한다.
이하, 실시예를 통하여 본 발명을 보다 상세히 설명하고자 한다. 이들 실시예는 본 발명을 보다 구체적으로 설명하기 위한 것으로, 본 발명의 범위가 이들 실시예에 한정되는 것은 아니다.
<실시예>
1. 재료 및 방법
소변 샘플 준비
본 실험에서는 서울아산병원에서 제공된 전립선비대증 환자 62 명의 소변 샘플과, 전립선암 환자 101 명의 소변 샘플을 이용하였다. 전립선암 및 전립선비대증 환자에서 치료 시작 전 자가 배뇨 소변, 직장수지검사 직후 배뇨한 소변 및 수술환자의 경우 수술 당일 도뇨관 삽입 시 채취한 소변을 (소변량은 30 ml 이상이 되도록 소변 검체 수집) 채취하여 -80℃ 초저온 냉동고에 보관하였다.
소변 샘플로부터 lncRNA, miRNA, 및 융합 유전자의 mRNA 추출
소변 샘플로부터 lncRNA, miRNA, 및 융합 유전자의 mRNA를 추출하기 위하여 QIAGEN 제품 (cat no. 55114) 을 이용하였다. 500 μl Proteinase K가 피펫팅된 50 ml 원심분리 튜브에 4 ml의 소변 샘플을 첨가하고, 4 ml의 버퍼 ACL (필요에 따라 담체 RNA 포함) 및 1.0 ml의 버퍼 ATL을 첨가하여 30 초 동안 펄스-볼텍싱하여 혼합하였다. 이후, 60℃에서 30 분간 배양하고, 튜브의 용해물에 9.0 ml의 버퍼 ACB를 첨가하여 15-30 초 동안 펄스-볼텍싱하여 완전히 혼합하였다. 그 다음, 용해물-버퍼 ACB 혼합물을 튜브에서 5 분 동안 얼음 상에서 배양하고, QIAamp Mini 컬럼을 QIAvac 24 Plus의 VacConnector에 삽입하고, 개방형 QIAamp Mini 컬럼에 20 ml 튜브 익스텐더를 삽입하였다. 상기 용해물-버퍼 ACB 혼합물을 QIAamp Mini 컬럼의 튜브 익스텐더에 조심스럽게 도포하고, 진공을 켠 후 모든 용해물이 컬럼을 통해 완전히 흡입된 후 진공 펌프를 껐다. QIAamp Mini 컬럼에 600 μl 버퍼 ACW1을 도포하고, 컬럼의 뚜껑을 열어두고 진공을 켠 후 모든 버퍼 ACW1이 QIAamp Mini 컬럼을 통해 추출된 후 진공 펌프를 껐다. QIAamp Mini 컬럼에 750 μl 버퍼 ACW2를 도포하고, 컬럼의 뚜껑을 열어두고 진공을 켠 후 모든 버퍼 ACW2가 QIAamp Mini 컬럼을 통해 추출된 후 진공 펌프를 껐다. 750 μl의 에탄올 (96-100%)을 QIAamp Mini 컬럼에 도포하고, 컬럼의 뚜껑을 열어두고 진공 펌프를 켠 후 모든 에탄올이 스핀 컬럼을 통해 추출된 후 진공을 껐다. QIAamp Mini 컬럼을 깨끗한 2 ml 수집 튜브에 넣고 3 분 동안 최대 속도 (20,000 x g, 14,000 rpm)로 원심분리하였다. QIAamp Mini 컬럼을 깨끗한 2 ml 수집 튜브에 넣고, 뚜껑을 열고 어셈블리를 56℃에서 10 분 동안 배양하여 멤브레인을 완전히 건조시켰다. 깨끗한 1.5 ml 용출 튜브에 QIAamp Mini 컬럼을 놓고 상기 2 ml 수집 튜브를 폐기하고, 20-150 μl의 Buffer AVE를 QIAamp Mini 멤브레인 중앙에 조심스럽게 도포하고, 뚜껑을 닫고 실온에서 3 분 동안 배양하였다. 마지막으로, 마이크로 원심 분리기에서 최대 속도 (20,000 x g, 14,000 rpm)로 1 분 동안 원심분리하여 핵산을 용리하였다.
소변 샘플로부터 miRNA를 추출하기 위하여 QIAGEN 제품 (cat no. 55114)을 이용하였다. 400 μl Proteinase K가 피펫팅된 50 ml 원심분리 튜브에 3 ml의 소변 샘플을 첨가하고, 3.2 ml의 버퍼 ACL (담체 RNA 없음) 및 1.0 ml의 버퍼 ATL을 첨가하여 30 초 동안 펄스-볼텍싱하여 혼합하였다. 이후, 60℃에서 30 분간 배양하고, 튜브의 용해물에 9.0 ml의 버퍼 ACB 및 7.0 ml의 이소프로판올을 첨가하여 15-30 초 동안 펄스-볼텍싱하여 완전히 혼합하였다. 그 다음, 용해물-버퍼 ACB 혼합물을 튜브에서 5 분 동안 얼음 상에서 배양하고, QIAamp Mini 컬럼을 QIAvac 24 Plus의 VacConnector에 삽입하고, 개방형 QIAamp Mini 컬럼에 20 ml 튜브 익스텐더를 삽입하였다. 상기 용해물-버퍼 ACB 혼합물을 QIAamp Mini 컬럼의 튜브 익스텐더에 조심스럽게 도포하고, 진공을 켠 후 모든 용해물이 컬럼을 통해 완전히 흡입된 후 진공 펌프를 껐다. QIAamp Mini 컬럼에 600 μl 버퍼 ACW1을 도포하고, 컬럼의 뚜껑을 열어두고 진공을 켠 후 모든 버퍼 ACW1이 QIAamp Mini 컬럼을 통해 추출된 후 진공 펌프를 껐다. QIAamp Mini 컬럼에 750 μl 버퍼 ACW2를 도포하고, 컬럼의 뚜껑을 열어두고 진공을 켠 후 모든 버퍼 ACW2가 QIAamp Mini 컬럼을 통해 추출된 후 진공 펌프를 껐다. 750 μl의 에탄올 (96-100%)을 QIAamp Mini 컬럼에 도포하고, 컬럼의 뚜껑을 열어두고 진공 펌프를 켠 후 모든 에탄올이 스핀 컬럼을 통해 추출된 후 진공을 껐다. QIAamp Mini 컬럼을 깨끗한 2 ml 수집 튜브에 넣고 3 분 동안 최대 속도 (20,000 x g, 14,000 rpm)로 원심분리하였다. QIAamp Mini 컬럼을 깨끗한 2 ml 수집 튜브에 넣고, 뚜껑을 열고 어셈블리를 56℃에서 10 분 동안 배양하여 멤브레인을 완전히 건조시켰다. 깨끗한 1.5 ml 용출 튜브에 QIAamp Mini 컬럼을 놓고 상기 2 ml 수집 튜브를 폐기하고, 20-150 μl의 Buffer AVE를 QIAamp Mini 멤브레인 중앙에 조심스럽게 도포하고, 뚜껑을 닫고 실온에서 3 분 동안 배양하였다. 마지막으로, 마이크로 원심 분리기에서 최대 속도 (20,000 x g, 14,000 rpm)로 1 분 동안 원심분리하여 핵산을 용리하였다.
소변 샘플로부터 추출된 lncRNA, miRNA, 및 융합 유전자의 mRNA의 cDNA 합성
소변 샘플로부터 추출된 lncRNA, miRNA, 및 융합 유전자의 mRNA로부터 cDNA를 합성하기 위하여 QIAGEN 제품 (cat no. 235311)을 이용하였다. 각 템플릿 RNA를 얼음 상에서 해동하고, gDNA Wipeout Buffer, Quantiscript Reverse Transcriptase, Quantiscript RT Buffer, RT Primer Mix 및 RNase가 없는 물(RNase-free water)을 실온 (15-25℃)에서 해동하였다. 하기의 표 1에 따라 게놈 DNA 제거 반응을 얼음 상에서 준비하고, 혼합한 후 얼음 상에서 보관하였다. 이후, 42℃에서 2 분 동안 배양한 다음, 즉시 얼음 상에 놓고, 하기의 표 2에 따라 역전사 마스터 믹스를 얼음 상에서 제조하였다. 역전사 마스터 믹스를 함유하는 각 튜브에 상기 템플릿 RNA (14 μl)를 추가하고, 42℃에서 15 분 동안 배양한 후, 95℃에서 3 분 동안 배양하여 Quantiscript Reverse Transcriptase를 비활성화하였다. 각 완료된 역전사 반응의 분취량을 실시간 PCR 믹스에 추가하였다.
[표 1] 게놈 DNA 제거 반응 구성성분
[표 2] 역전사 반응 구성성분
소변 샘플로부터 추출된 miRNA로부터 cDNA를 합성하기 위하여 QIAGEN 제품 (cat no. 339340)을 이용하였다. 뉴클레아제가 없는 물(Nuclease-free water)을 사용하여 각 템플릿 RNA 샘플을 5 ng/μl로 희석하고, 하기의 표 3에 따라 역전사 반응을 얼음 상에서 준비하고, 혼합한 후 얼음 상에서 보관하였다. 42℃에서 60 분 동안 배양한 후, 95℃에서 5 분 동안 배양하여 역전사 효소를 가열 비활성화한 다음, 즉시 4℃로 냉각시켰다. 이후, miRNA PCR 어세이를 수행하였다
[표 3] 샘플 당 역전사 반응 설정
정량적 중합효소 연쇄반응 (qPCR)
각 마커의 발현을 측정하기 위하여, Stratagene Mx3000P (Agilent Technologies, California, USA)를 사용하여 정량적 PCR (qPCR)을 3 회 수행하였다. lncRNA, miRNA, 및 융합 유전자의 mRNA 정량화를 위해 이전 단계에서 합성된 cDNA는 PCR 템플릿으로 사용되었으며, 증폭 및 검출에는 ORA™qPCR Green ROX L Mix, 2X (highQu, Kraichtal, Germany)가 사용되었다. 각 튜브의 최종 부피는 ORA™qPCR Green ROX L Mix, 2X (5.0 μl), 사전-희석된 cDNA (4.0 μl), 사전-혼합된 프라이머 세트 (1 μl)로 구성된 10 μl이다. lncRNA 및 융합 유전자의 mRNA의 발현 수준을 측정하기 위하여, cDNA 및 lncRNA 및 융합 유전자의 mRNA용 프라이머의 농도는 최종 부피에서 160 ~ 200 ng, 500 nM이었다. qPCR 순환 조건은 다음과 같다: 95℃에서 15 분 동안 초기 변성(denaturation) 후, 95℃에서 15초 동안 템플릿 변성 및 60℃에서 60초 동안 연신(elongation) 을 50 주기, 그리고 60 ~ 95℃에서 1 주기의 용융 곡선 분석을 마지막으로 수행하였다. miRNA 발현 수준을 측정하기 위하여, cDNA의 농도는 최종 부피에서 12 ~ 16 ng이었다. miRCURY LNA™miRNA PCR 어세이 (QIAGEN, Hilden, Germany)는 miRNA 검출을 위한 프라이머로 사용되었으며, 사용 전에 220 μL 뉴클레아제 없는 물(nuclease free water)로 사전-희석되었다. qPCR 순환 조건은 다음과 같다: 95℃에서 2 분 동안 초기 변성 후 95℃에서 10 초 동안 50 주기의 템플릿 변성, 56℃에서 60 초 동안 신장, 56 내지 95 ℃에서 1 주기의 용융 곡선 분석을 마지막으로 수행하였다. qPCR로 측정된 로우 데이터는 MxPro 소프트웨어로 분석되었다. 모든 프라이머 세트는 아래에 나열되어 있다.
[표 4] Primer sequences(lncRNA 또는 융합 유전자의 mRNA)
[표 5] Sequences(miRNA) from miRBase or GeneGlobe of QIAGEN
단일-바이오마커 분석
lncRNA, miRNA 및 융합 유전자의 mRNA 바이오마커의 진단 능력을 조사하기 위하여, 163개의 소변 cDNA 샘플 (62개의 양성전립선비대증(BPH) 샘플 및 101 개의 전립선암(PCa) 샘플)에서 17 개의 miRNA와 2 개의 lncRNA 및 1 개의 융합 유전자의 mRNA의 발현 수준을 qPCR을 통해 측정하였다. 모든 바이오마커의 발현 프로파일을 18s-rRNA 및 βactin으로 정규화하였다. 양성전립선비대증(BPH) 및 전립선암(PCa) 사이의 유전자 발현 경향은 도 2에 나타냈다. PCA3, MALAT1에 대한 lncRNA 및 TMPRSS2:ERG에 대한 융합 유전자의 mRNA 바이오마커는 전립선암으로 진단된 환자에서 상향-조절을 나타낸다. 17 개의 miRNA에 대한 모든 miRNA 바이오마커는 전립선암에서 하향-조절되는 것으로 검출되었다. 구체적으로, 각 바이오마커의 진단 능력을 ROC 곡선으로 평가하였다. lncRNA 및 miRNA에서 각각 0.79 및 0.85의 가장 높은 AUC 값이 나타났다 (도 3 및 표 6-8).
[표 6] AUC 값 (lncRNA/융합 유전자의 mRNA/miRNA)
[표 7] lncRNA 및 융합 유전자의 mRNA 바이오마커 경향성
UP= up-regulated in cancer / Down= down-regulated in cancer
1.Xue, D et al. Journal of Cellular and Molecular Medicine, 22(6), 3223-3237. (2018); 2.Wang, F., et al. Oncotarget, 5(22), 11091-11102. (2014).; 3.Bussemakers, et al. Cancer Research, 59(23), 5975-5979. (1999); 4.Mao, Zujie et al,Medicine vol. 97,42 (2018); 5Koo, Kevin M., et al. , Scientific reports 6.1: 1-6 (2016).; 6.Urbinati, Giorgia, et al. Molecular Therapy-Nucleic Acids 5 (2016)
[표 8] miRNA 바이오마커 경향성
*mir = precursor sequence / miR = mature sequence
*Up= up-regulated in cancer / Down= down-regulated in cancer
(1.FredsøJ. et al. Eur. Urol. Focus 4, 825-833 (2018); 2.Urabe, F. et al. Clin. Cancer Res. 25, 3016-3025 (2019); 3.Xueping Zhang et al. Clin Exp Metastasis 26(8):965-79(2009); 4.Kati P Porkka et al. Cancer Res 67(13):6130-5 (2007) 참조)
전통적인 통계적 분석 방법 및 머신 러닝 전 데이터 전처리
이전의 단일-바이오마커 분석에 기초하여, lncRNA, miRNA 및 융합 유전자의 mRNA에 대한 바이오마커의 정규화된 발현(-ΔCt)을 병합하였다. 정규화된 발현(-ΔCt)을 병합하기 전에, 데이터 전-처리가 수행되었다: 먼저, 동일한 lncRNA 또는 융합 유전자의 mRNA를 표적으로 하는 바이오마커 중 AUC를 비교하여 lncRNA 또는 융합 유전자의 mRNA 바이오마커 프라이머 (PCA3_4, TMPRSS2:ERG_R3 및 MALAT1_6)를 선택하였다. 다만 TMPRSS2:ERG 융합 유전자의 경우, 가장 높은 AUC를 보여준 바이오마커(TMPRSS2:ERG Fusion_R6)에서 No CT가 빈번하게 관측되어(50% 이상) 차선(TMPRSS2:ERG Fusion_R3, No Ct ratio 5%)을 선택하였다. 둘째, 데이터의 불균형을 방지하기 위해, 동일한 바이오마커에서 블랭크 정규화된 발현을 최소 정규화된 발현으로 처리하였다. 충족된 데이터 세트를 머신 러닝에 적용하기 전에, 최소-최대 스케일링이 수행되었다.
바이오마커의 선택
전립선암/양성전립선비대증(PCa/BPH) 분류자의 성능을 개선하고 단일- 바이오마커의 잠재적 동요(perturbation)에 대한 견고성(robustness)을 제공하기 위하여, 다양한 머신 러닝 알고리즘을 통해 다중-바이오마커 기반 전립선암/양성전립선비대증(PCa/BPH) 분류자를 목표로 하였다. 보다 우수한 성능을 위하여, 최적의 바이오마커 조합을 찾기 위하여, RFECV(Recursive Feature Elimination with Cross-Validation) 알고리즘을 적용하였다. RFECV의 파라미터로서, Leave-One-Out (LOO) 및 Random Forest (RF)가 사용되었다. LOO는 그룹 편향을 최소화하는 데 적합하며, RF는 추가 분석에서 특징 중요도(feature importance)를 제공 할 수 있다. RFECV의 결과로서, 4 개의 특징(feature)이 사용되었을 때 극댓값(local maximum)이 형성되었다 (도 4a-b). 선택된 4 개의 특징은 hsa_miR_125b_5p, hsa_miR_141_5p, hsa_miR_17_3p 및 hsa_miR_30c_5p 이다. 그러나, 선별된 4개의 miRNAs에 이미 널리 연구된 두 가지 추가 특징인 PCA3_4와 TMPRSS2:ERG Fusion_R3 을 포함하기로 결정하였다. 이 특징 선택 프로세스를 통해, 4 개의 miRNA와 1 개의 lncRNA 및 1 개의 융합 유전자의 mRNA가 머신 러닝 (ML)을 위해 선택되었다. 또한 이렇게 선택된 4 개의 miRNA와 1 개의 lncRNA 및 1 개의 융합 유전자의 mRNA로 이루어진 군에서의 조합들이 전통적인 통계적 분석 방법을 위해 사용되었다. 상기 방법은 바이오마커를 선택하는 방법의 예시로 이에 제한되지 않는다
단일-바이오마커에 기초한 머신 러닝
다중-바이오마커 분석을 위한 제어를 제공하기 위해, ML 알고리즘을 사용하여 단일-바이오마커 기반 진단 분류자를 개발하였다. 첫째, 최소-최대 스케일링된 데이터를 트레인 세트 (75%) 및 테스트 세트 (25%)로 무작위로 나누었다. 트레인-테스트 세트 분할 후, 트레인 세트를 이용하여 SVM (Support-Vector-Machine), RF (Random-Forest) 및 LR (Logistic-Regression)을 훈련하였다 (도 2). 전립선암(PCa) 및 양성전립선비대증(BPH) 사이의 수 불균형으로 인해 세 가지 알고리즘 모두에서 클래스 가중치 보상(class weight compensation)이 수행되었다. 트레인 세트 러닝 후, 모든 바이오마커 및 ML 알고리즘에 대해 ROC 곡선, AUC 및 LOOCV 점수가 생성된다. (도 5b-c, 도 6a-e)
바이오마커에 따라, 각 머신 러닝 알고리즘은 AUC 및 LOOCV 점수에서 큰 차이를 나타냈다. SVM, RF, LR 순으로, 평균 AUC는 0.71±0.08 (Standard Deviation), 0.66±0.12, 0.80±0.10 이었으며, 평균 LOOCV 점수는 0.727±0.066, 0.658±0.080, 0.711±0.071 이었다. 이 결과에 따르면, SVM 및 LR은 단일- 바이오마커 기반 ML 분류에 RF보다 더 적합하다. 그러나, AUC 및 LOOCV 점수의 전반적인 경향은 ML 알고리즘보다는 바이오마커의 영향을 크게 받는 것으로 보인다. 위 결과는 단일-바이오마커에 기반하므로, 다중-바이오마커로 동일한 분석이 적용되었을 때 바이오마커간의 조합 시너지로 인해 더 우수한 성적이 기대된다.
다중-바이오마커에 기초한 머신 러닝
다중-바이오마커 기반 전립선암/양성전립선비대증(PCa/BPH) 분류자는 성능 및 견고성(rubustness)의 개선을 목표로 제작되었다. 데이터 전처리 및 머신 러닝 알고리즘 학습은 단일-바이오마커 기반 분류자와 동일하게 수행되었으며, 앞서 제안한 목표를 달성하고자 각 biomarker 조합과 알고리즘마다 GridSearchCV 알고리즘을 통해 파라미터 최적화를 진행했다. 머신 러닝 학습 결과 SVM, RF, LR 순으로 AUC는 0.96, 0.99, 0.96 이었으며(도 7c-e) LOOCV 점수는 0.865, 0.871, 0.834이었다(도 7a). 특징 중요도(Feature importance)의 경우 hsa_miR_125b_5p가 20.2 %, hsa_miR_30c_5p가 20.0 %, hsa_miR_141_5p가 18.2 %, hsa_miR_17_3p가 15.5 %, TMPRSS2:ERG Fusion_R3가 13.3 %, 그리고 PCA3_4가 12.8 % 였다(도 8b). 특징 중요도의 경우 RFECV에서 예측된 것처럼 miRNAs가 과반수 이상의 비중(73.9 %)을 차지하는 것으로 나타났다. PSA level 3~10 환자군을 대상으로 한 분석에서는 SVM, RF, LR 순으로 AUC가 0.94, 1.00, 0.93, LOOCV 점수가 0.865, 0.896, 0.844로 확인되었다. 위의 결과를 종합했을 때 본 연구에서 제안한 lncRNA, fusion gene mRNA 및 miRNA를 동원한 다중- 바이오마커 기반 머신 러닝 분류자는 전통적인 lncRNA, fusion gene mRNA, PSA를 동원한 검사에 비해 높은 진단 성능이 기대된다. 특히, Random Forest 학습 결과 각 miRNAs가 가지는 중요도가 비교적 동등했던 점을 보았을 때, 다중-바이오마커 분류자에서 관찰된 큰 폭의 성능 향상은 특성 간의 시너지 효과에 기반한 것으로 보인다. 본 연구에서 제안한 다중-바이오마커 기반 머신 러닝 분류자는 PSA test의 gray zone(PSA level 3~10)에 해당하는 환자군 또한 효과적으로 분류해냈기에 기존 진단법을 보완하는 역할로도 널리 활용될 수 있다. 더불어 단순한 이진법적 분류를 넘어선 probability 제공을 통해 이후 진단 및 치료 과정에서 환자 맞춤형 치료에 기여할 수 있다. 본 다중-바이오마커 분류자는 현대적인 머신 러닝 기법을 이용하는 만큼 추후 다른 에세이 및 바이오마커와 조합되어 다방면으로 확장될 것이라 기대된다.
다중-바이오마커에 기초한 전통적인 통계적 분석 방법
다중-바이오마커에 기반한 머신 러닝 방법과는 별도로 전통적인 통계적 분석 방법으로 다중-바이오마커 기반 진단 분류자를 개발하였다. 다중- 바이오마커에 기반한 통계적 분석 방법의 데이터 전처리, 통계적 분석 알고리즘, 파라미터, 및 평가 방법은 단일-바이오마커에 기초한 머신 러닝의 경우와 동일하다. 전통적인 통계적 분석 방법의 하나인 Logistic Regression을 사용할 경우 다중-바이오마커의 조합에 따라 값이 달라지지만 AUC의 최대값은 0.90이고, LOOCV 점수의 최대값은 0.88이다. 머신 러닝에 의한 단일-바이오마커 분류자와 비교하였을 때, AUC 및 LOOCV 점수의 상당한 개선이 관찰되었다. 다중-바이오마커에 기반한 머신 러닝의 경우와 마찬가지로 다중-바이오마커에 기반한 전통적인 통계적 분석 방법을 사용할 경우 단일-바이오마커에 기반한 머신 러닝 방법에 비해 성능 및 견고성을 개선시킬 수 있다. 바이오마커를 선정한 방법은 상기에 기술한 바와 동일하지만 전통적인 통계적 분석 방법인 Logistic Regression에서는 선택된 4 개의 miRNA와 1 개의 lncRNA 및 1 개의 융합 유전자의 mRNA 뿐 아니라 이 군으로 구성할 수 있는 모든 조합들을 사용할 수 있다. 이 군으로 구성할 수 있는 모든 다중-바이오마커의 조합들을 사용하여 각각의 AUC 및 LOOCV 점수를 비교하였으며 AUC와 LOOCV의 값에 따라 순위를 매기고 AUC와 LOOCV의 순위를 더하여 그 합이 가장 낮은, 즉 그 합의 순위가 가장 높은 조합부터 차상위 조합을 도출하여 사용할 수 있다. 조합을 구성하는 방법이나 조합의 개수는 분류자의 성능 및 견고성의 중요도를 반영하는 방법에 따라 달라질 수 있으며 최종 적용할 바이오마커의 조합은 순위가 높은 차상위 조합에서 선택할 수 있으며 이에 한정되는 것은 아니다.
Logistic Regression을 통해 전립선암 환자와 전립선 비대증 환자를 구별하기 위한 스코어를 계산할 수 있으며 스코어를 계산하는 방법은 하기와 같다.
1) 개별 바이오마커에 대해 실험군의 최대 발현량은 1, 최소 발현량은 0으로 정규화를 시킨다.
2) 이에 대한 결정 함수(decision fuction) D(x)을 계산하며 다음과 같이 구한다.
D(x) = bias + sum(coefficient * normalized value)
3) 결정 함수(decision fuction)값을 기반으로 sigmoid function F(x)을 계산하여 최종 스코어를 구한다.
F(x) = 1/(1+exp(-D(x)))
4) 최종 스코어를 임계치 0.5를 기준으로 평가하여 스코어 0.5 이상은 전립선암으로 0.5 미만은 전립선비대증으로 판정한다.
Logistic Regression 기법을 통하여 좋은 성능을 보인 바이오마커 군의 조합들과 각 바이오마커에 사용된 바이어스(bias), 계수(coefficient) 및 조합에 따른 AUC 및 LOOCV 값을 구하여 비교할 수 있다.
통계분석 및 머신 러닝을 위한 도구
모든 통계 분석은 R (버전 4.0.2) 및 Python (버전 3.9)으로 수행되었다.
(1) 데이터 전-처리 (데이터 블랭크 및 정규화)
로우 데이터의 전-처리는 R (버전 4.0.2)의 dplyr, reshape2 및 tidyr 패키지를 사용하여 수행되었다. 로우 데이터의 No Ct 값은 blank로 처리되었고, lncRNA, miRNA 및 융합 유전자의 mRNA의 발현 수준은 β과 18s-rRNA의 평균으로 정규화되었다. 정규화는 다음과 같이 수행되었다:
정규화된 발현(-ΔCt) = (Ctβ-actin+Ct18s-rRNA)/2-Cttarget gene
정규화 후, 블랭크 정규화 발현은 동일한 바이오마커에서 최소 정규화 발현으로 처리되었다.
(2) 단일 마커 분석.
단일 마커 분석은 R(버전 4.0.2)의 ggplot2 및 plotROC 패키지를 사용하여 수행되었다. 단일 마커 분석을 위해 lncRNA, miRNA 및 융합 유전자의 mRNA에 대한 바이오마커의 이전에 처리된 정규화된 발현(-ΔCt)을 사용하였다. 두 그룹(양성전립선비대증(BPH) 및 전립선암(PCa)) 간의 유전자 발현 경향을 확인하기 위하여 각 바이오마커의 정규화된 발현(-ΔCt)을 박스 플롯으로 시각화하였다. 또한, 각 바이오마커의 차등 능력(differential ability)을 평가하기 위해 ROC 곡선 분석을 수행하였다.
머신 러닝 알고리즘을 통한 전립선암/양성전립선비대증(PCa/BPH) 분류자 구성
단일-바이오마커 또는 다중-바이오마커에 기반한 전립선암/ 양성전립선비대증(PCa/BPH) 분류자를 생성하기 위하여, Python 3.8.5를 사용하는 맞춤형 머신 러닝 소프트웨어가 Linux에서 실행되었다. 소프트웨어에는 Scikit Learn, Scikit Plot 및 Panda와 같은 개방형 라이브러리가 포함되어 있다. 서포트 벡터 머신의 경우, Scikit Learn의 C-Support Vector Classification이 사용되었다. Radial Basis Function을 커널(kernel)로 사용하였고, 클래스 간의 수 차이를 고려하여 밸런스 클래스 가중치(Balanced Class Weight)를 사용하였다. RF(Random Forest)의 경우, Scikit Learn의 Random Forest Classifier가 사용되었으며, 모델은 균형 잡힌(balanced) 클래스 가중치를 가진 100 개의 의사 결정 분지도(decision tree)로 구성된다. 마지막으로, Logistic Regression도 Scikit Learn에서 가져 왔으며, 균형잡힌 클래스 가중치를 제외한 모든 파라미터가 기본 설정을 따랐다.
머신 러닝 알고리즘에 qPCR 데이터를 도입하기 전에, 데이터 전처리가 수행되었다. 첫째, lncRNA, miRNA 또는 융합 유전자의 mRNA의 양이 매우 적다는 가정하에, 앞서 언급한 바와 같이 비-검출 CT 값을 바이오마커의 최소값으로 채웠다. 최소-최대 스케일러는 0과 1 사이의 CT 값을 정규화하기 위해 충족된 qPCR 데이터에 적용되었다. 정규화된 데이터는 무작위로 트레인 세트 (75%)와 테스트 세트 (25%)로 나뉘었다. 각 머신 러닝 알고리즘은 트레인 세트로 훈련되었으며, 모델 정확도, f1 점수, 수신기 작동 특성 곡선(ROC 곡선), AUC, 및 확률은 테스트 세트를 사용하여 평가되었다. 과적합 문제를 확인하기 위해, 교차 검증도 제공하였다. 특히, 잠재적인 그룹 편향을 피하기 위하여, Leave One Out 알고리즘을 적용하였다.
2. 결과
현재까지 전립선암 특이적 바이오마커에 대한 연구가 많이 진행되어 왔지만, 국소 전립선암의 경우 체액에서의 바이오마커 검출의 민감성과 특이성은 매우 낮은 것으로 보고되었고, PSA(전립선특이항원)는 전립선암을 검출하는데 많이 사용되고 있으나, 암 특이성 마커가 아니므로 종종 잘못 진단되는 경우가 발생하게 되며, 정확한 검진을 위해 전립선 조직 생검을 시행하는 경우 환자의 고통이 심하며 비용도 많이 소요되므로 전립선암 조기 발견을 위한 비침습적 바이오마커가 필요한 실정이었다.
이에, 본 발명의 전립선암 lncRNA, miRNA, 및 융합 유전자의 mRNA 마커의 유용성을 검증하기 위하여, 전립선비대증 대조군 및 전립선암에서 lncRNA, miRNA, 및 융합 유전자의 mRNA의 발현 수준을 비교한 결과, 도 2에서 나타낸 바와 같이, 박스 플롯은 전체 전립선암 소변 샘플에서 lncRNA 및 mRNA 마커 모두 상향 발현되었고, miRNA 마커 모두 하향 발현된 것으로 나타났다.
또한, RFECV 알고리즘을 통해 Random Forest 분석을 통해 도출된 최종적인 1 개의 lncRNA (PCA3) 및 1 개의 융합 유전자의 mRNA (TMPRSS2-ERG) 및 4 개의 miRNA (hsa_miR_125b_5p, hsa_miR_141_5p, hsa_miR_17_3p 및 hsa_miR_30c_5p)의 조합이 특히 검출 마커로서 유용함을 입증하였다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술 분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예 및 실험예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해되어야 한다.
miRNA: MicroRNA
PCa: prostate cancer
BPH: benign prostate hyperplasia
PSA: prostate-specific antigen
PCa: prostate cancer
BPH: benign prostate hyperplasia
PSA: prostate-specific antigen
<110> Sysbiogen Co., Ltd.
<120> Biomarkers for diagnosis of prostate cancer and uses thereof
<130> KPCA200924
<160> 35
<170> KoPatentIn 3.0
<210> 1
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> PCA3_4_F
<400> 1
gagaacaggg gagggagag 19
<210> 2
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> PCA3_4_R
<400> 2
acgttctggg atacatgtgc 20
<210> 3
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> PCA3_C2_F
<400> 3
tgataggtgc agcaaaccac 20
<210> 4
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> PCA3_C2_R
<400> 4
acgttctggg atacatgtgc ag 22
<210> 5
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> TMPRSS2:ERG_R3_F
<400> 5
cctggagcgc ggcaggaagc cttatcagtt g 31
<210> 6
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> TMPRSS2:ERG_R3_R
<400> 6
tcctgctgag ggacgcgtgg gctcatcttg 30
<210> 7
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> TMPRSS2:ERG_R6_F
<400> 7
ggcaggaact ctcctgat 18
<210> 8
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> TMPRSS2:ERG_R6_R
<400> 8
cgtggcacga taactctg 18
<210> 9
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> MALAT1_2_F
<400> 9
gcaggcgttg tgcgtagag 19
<210> 10
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> MALAT1_2_R
<400> 10
ttgccgacct cacggatt 18
<210> 11
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> MALAT1_4_F
<400> 11
gggtgtttac gtagaccaga acc 23
<210> 12
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> MALAT1_4_R
<400> 12
cttccaaaag ccttctgcct tag 23
<210> 13
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> MALAT1_6_F
<400> 13
cttccctagg ggatttcagg 20
<210> 14
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> MALAT1_6_R
<400> 14
gcccacagga acaagtccta 20
<210> 15
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> beta-actin_F
<400> 15
atgtaccctg gcattgccga c 21
<210> 16
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> beta-actin_R
<400> 16
gactcgtcat actcctgctt g 21
<210> 17
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> 18s-rRNA_F
<400> 17
cctggatacc gcagctagga 20
<210> 18
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> 18s-rRNA_R
<400> 18
gcggcgcaat acgaatgccc c 21
<210> 19
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> hsa-miR-1185-2-3p
<400> 19
auauacaggg ggagacucuc au 22
<210> 20
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> hsa-miR-125b-5p
<400> 20
ucccugagac ccuaacuugu ga 22
<210> 21
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> hsa-miR-141-3p
<400> 21
uaacacuguc ugguaaagau gg 22
<210> 22
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> hsa-miR-141-5p
<400> 22
caucuuccag uacaguguug ga 22
<210> 23
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> hsa-miR-146a-5p
<400> 23
ugagaacuga auuccauggg uu 22
<210> 24
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> hsa-miR-17-3p
<400> 24
acugcaguga aggcacuugu ag 22
<210> 25
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> hsa-miR-200b-3p
<400> 25
uaauacugcc ugguaaugau ga 22
<210> 26
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> hsa-miR-21-5p
<400> 26
uagcuuauca gacugauguu ga 22
<210> 27
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> hsa-miR-222-3p
<400> 27
agcuacaucu ggcuacuggg u 21
<210> 28
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> hsa-miR-24-3p
<400> 28
uggcucaguu cagcaggaac ag 22
<210> 29
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> hsa-miR-27b-3p
<400> 29
uucacagugg cuaaguucug c 21
<210> 30
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> hsa-miR-30a-3p
<400> 30
cuuucagucg gauguuugca gc 22
<210> 31
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> hsa-miR-30a-5p
<400> 31
uguaaacauc cucgacugga ag 22
<210> 32
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> hsa-miR-30b-5p
<400> 32
uguaaacauc cuacacucag cu 22
<210> 33
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<223> hsa-miR-30c-5p
<400> 33
uguaaacauc cuacacucuc agc 23
<210> 34
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> hsa-miR-31-5p
<400> 34
aggcaagaug cuggcauagc u 21
<210> 35
<211> 64
<212> RNA
<213> Artificial Sequence
<220>
<223> hsa-mir-375
<400> 35
ccccgcgacg agccccucgc acaaaccgga ccugagcguu uuguucguuc ggcucgcgug 60
aggc 64
Claims (24)
- miRNA의 발현 수준을 측정할 수 있는 제제를 포함하는 전립선암 진단용 조성물로서,
상기 miRNA는 hsa_miR_125b_5p, hsa_miR_17_3p, hsa_miR_141_5p 및 hsa_miR_30c_5p를 포함하는 것인, 머신 러닝 알고리즘을 이용한 전립선암 진단용 조성물. - 제1항에 있어서,
상기 miRNA는 hsa_miR_21_5p, hsa_miR_24_3p, hsa_miR_30a_5p, hsa_miR_222_3p, hsa_miR_375, hsa_miR_27b_3p, hsa_miR_31_5p, hsa_miR_146a_3p, hsa_miR_146a_5p, hsa_miR_200b_3p, hsa_ hsa_miR_1185_2_3p, hsa_miR_30a_3p 및 hsa_miR_30b_5p로 이루어진 군으로부터 선택되는 적어도 하나를 더 포함하는 것인, 전립선암 진단용 조성물. - 제1항에 있어서,
lncRNA 및 융합 유전자의 mRNA로 이루어진 군으로부터 선택된 적어도 하나를 측정하는 제제를 더 포함하는 전립선암 진단용 조성물로서,
상기 lncRNA는 PCA3 및 MALAT1 중에서 선택되는 적어도 하나이고,
상기 융합 유전자의 mRNA는 TMPRSS2:ERG인 것인, 전립선암 진단용 조성물. - 제3항에 있어서,
상기 lncRNA는 PCA3인, 전립선암 진단용 조성물. - 제1항에 있어서,
상기 miRNA는 hsa_miR_21_5p, hsa_miR_24_3p, hsa_miR_30a_5p 및 hsa_miR_222_3p로 이루어진 군으로부터 선택되는 적어도 하나를 더 포함하는 것인, 전립선암 진단용 조성물. - 제1항, 제2항 및 제5항 중 어느 한 항에 있어서,
상기 제제는 miRNA에 각각 특이적으로 결합하는 프라이머 또는 프로브를 포함하는 것을 특징으로 하는, 전립선암 진단용 조성물. - 제3항 또는 제4항에 있어서,
상기 제제는 miRNA, lncRNA 또는 융합 유전자의 mRNA에 각각 특이적으로 결합하는 프라이머 또는 프로브를 포함하는 것을 특징으로 하는, 전립선암 진단용 조성물. - 머신 러닝 알고리즘을 이용하여 전립선암 진단을 위한 정보를 제공하는 방법으로서,
대상체로부터 분리된 생물학적 시료에서 제1항, 제2항 및 제5항 중 어느 한 항의 miRNA의 발현 수준을 측정하는 단계; 및
상기 miRNA의 발현 수준을 정상 대조군 시료의 miRNA의 발현 수준과 비교하는 단계
를 포함하는, 방법. - 제10항에 있어서,
상기 miRNA의 발현 수준은 역전사효소 중합효소 연쇄반응(RT-PCR), 경쟁적 역전사효소 중합효소 연쇄반응(competitive RT-PCR), 정량적 역전사효소 중합효소반응(quantitative RT-PCR, qPCR), ddPCR(droplet digital PCR), 시퀀싱 (sequencing), RNase 보호 분석법(RNase protection method), 노던 블랏팅(Northern blotting) 또는 유전자 칩 분석법에 의하여 측정되는 것을 특징으로 하는, 방법. - 제10항에 있어서,
상기 발현 수준을 측정하는 단계는:
대상체로부터 분리된 생물학적 시료에서 상기 miRNA를 추출하는 단계;
추출된 miRNA로부터 cDNA를 합성하는 단계;
합성한 cDNA에 특이적인 프라이머 쌍을 사용하여 cDNA를 증폭하는 단계; 및
증폭된 cDNA를 검출하는 단계
를 포함하는, 방법. - 제10항에 있어서,
상기 생물학적 시료는 조직, 세포, 소변, 타액, 정액, 전혈, 혈장 또는 혈청인 것을 특징으로 하는, 방법. - 제13항에 있어서,
상기 생물학적 시료는 소변인 것을 특징으로 하는, 방법. - 제10항에 있어서,
상기 miRNA의 발현 수준을 비교하는 단계는:
Logistic Regression(LR), Support vector machine(SVM), random forest 및 Multi-Layer-Perceptron으로 이루어진 군으로부터 선택되는 머신 러닝 알고리즘을 이용하여 수행되는 것을 특징으로 하는, 방법. - 제10항에 있어서,
상기 miRNA의 발현 수준을 비교하는 단계는 Logistic Regression(LR)을 이용하여 수행되며, LOOCV (Leave-One-Out Cross-Validation) 값이 0.65 이상이고, AUC(Area Under the Curve) 값이 0.70이상인, 방법. - 제10항에 있어서,
상기 발현 수준을 측정하는 단계는 lncRNA, 융합 유전자의 mRNA 또는 이들의 조합의 발현을 측정하는 단계를 더 포함하고, 여기서 상기 lncRNA는 PCA3 및 MALAT1 중에서 선택되는 적어도 하나이며, 상기 융합 유전자의 mRNA는 TMPRSS2:ERG이고,
상기 발현 수준을 비교하는 단계는 상기 lncRNA, 융합 유전자의 mRNA 또는 이들의 조합의 발현 수준을 정상 대조군 시료의 lncRNA, 융합 유전자의 mRNA 또는 이들의 조합의 발현 수준과 비교하는 단계를 더 포함하는, 방법. - 제17항에 있어서,
상기 miRNA와, lncRNA, 융합 유전자의 mRNA 또는 이들의 조합의 발현 수준은 역전사효소 중합효소 연쇄반응(RT-PCR), 경쟁적 역전사효소 중합효소 연쇄반응(competitive RT-PCR), 정량적 역전사효소 중합효소반응(quantitative RT-PCR, qPCR), ddPCR(droplet digital PCR), 시퀀싱 (sequencing), RNase 보호 분석법(RNase protection method), 노던 블랏팅(Northern blotting) 또는 유전자 칩 분석법에 의하여 측정되는 것을 특징으로 하는, 방법. - 제17항에 있어서,
상기 발현 수준을 측정하는 단계는:
대상체로부터 분리된 생물학적 시료에서 상기 miRNA와, lncRNA, 융합 유전자의 mRNA 또는 이들의 조합을 추출하는 단계;
추출된 miRNA와, lncRNA, 융합 유전자의 mRNA 또는 이들의 조합으로부터 cDNA를 합성하는 단계;
합성한 cDNA에 특이적인 프라이머 쌍을 사용하여 cDNA를 증폭하는 단계; 및
증폭된 cDNA를 검출하는 단계
를 포함하는, 방법. - 제17항에 있어서,
상기 생물학적 시료는 조직, 세포, 소변, 타액, 정액, 전혈, 혈장 또는 혈청인 것을 특징으로 하는, 방법. - 제20항에 있어서,
상기 생물학적 시료는 소변인 것을 특징으로 하는, 방법. - 제17항에 있어서,
상기 miRNA와, lncRNA, 융합 유전자의 mRNA 또는 이들의 조합의 발현을 측정하는 단계는:
Logistic Regression(LR), Support vector machine(SVM), random forest 및 Multi-Layer-Perceptron으로 이루어진 군으로부터 선택되는 머신 러닝 알고리즘을 이용하여 수행되는 것을 특징으로 하는, 방법. - 제17항에 있어서,
상기 miRNA와, lncRNA, 융합 유전자의 mRNA 또는 이들의 조합의 발현 수준을 비교하는 단계는 Logistic Regression(LR)을 이용하여 수행되며, LOOCV (Leave-One-Out Cross-Validation) 값이 0.65 이상이고, AUC(Area Under the Curve) 값이 0.70이상인, 방법. - 제1항 내지 제5항 중 어느 한 항에 따른 조성물을 포함하는, 머신 러닝 알고리즘을 이용한 전립선암 진단용 키트.
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210069428A KR102550113B1 (ko) | 2021-05-28 | 2021-05-28 | 전립선암 진단용 바이오마커 및 이의 용도 |
PCT/KR2022/007695 WO2022250517A1 (ko) | 2021-05-28 | 2022-05-30 | 전립선암 진단용 바이오마커 및 이의 용도 |
EP22811708.1A EP4365310A1 (en) | 2021-05-28 | 2022-05-30 | Biomarker for diagnosing prostate cancer and use thereof |
KR1020230082463A KR20230106542A (ko) | 2021-05-28 | 2023-06-27 | 전립선암 진단용 바이오마커 및 이의 용도 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210069428A KR102550113B1 (ko) | 2021-05-28 | 2021-05-28 | 전립선암 진단용 바이오마커 및 이의 용도 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020230082463A Division KR20230106542A (ko) | 2021-05-28 | 2023-06-27 | 전립선암 진단용 바이오마커 및 이의 용도 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20220161039A KR20220161039A (ko) | 2022-12-06 |
KR102550113B1 true KR102550113B1 (ko) | 2023-07-03 |
Family
ID=84229115
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210069428A KR102550113B1 (ko) | 2021-05-28 | 2021-05-28 | 전립선암 진단용 바이오마커 및 이의 용도 |
KR1020230082463A KR20230106542A (ko) | 2021-05-28 | 2023-06-27 | 전립선암 진단용 바이오마커 및 이의 용도 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020230082463A KR20230106542A (ko) | 2021-05-28 | 2023-06-27 | 전립선암 진단용 바이오마커 및 이의 용도 |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP4365310A1 (ko) |
KR (2) | KR102550113B1 (ko) |
WO (1) | WO2022250517A1 (ko) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20130043104A (ko) * | 2010-04-06 | 2013-04-29 | 카리스 라이프 사이언스 룩셈부르크 홀딩스 | 질병용 순환 생물학적 지표들 |
WO2016037000A1 (en) * | 2014-09-04 | 2016-03-10 | Miodx | Method of multivariate molecule analysis |
-
2021
- 2021-05-28 KR KR1020210069428A patent/KR102550113B1/ko active IP Right Grant
-
2022
- 2022-05-30 EP EP22811708.1A patent/EP4365310A1/en active Pending
- 2022-05-30 WO PCT/KR2022/007695 patent/WO2022250517A1/ko active Application Filing
-
2023
- 2023-06-27 KR KR1020230082463A patent/KR20230106542A/ko active Application Filing
Non-Patent Citations (3)
Title |
---|
Clin Cancer Res, 25(10): 3016-3025 (2019.02.26.)* |
Clin Chim Acta, 473: 96-105 (2017.08.12.)* |
Eur Urol Focus, 4(6): 825-833 (2017.03.09.)* |
Also Published As
Publication number | Publication date |
---|---|
EP4365310A1 (en) | 2024-05-08 |
WO2022250517A1 (ko) | 2022-12-01 |
KR20230106542A (ko) | 2023-07-13 |
KR20220161039A (ko) | 2022-12-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106414774B (zh) | 胆道癌的检测试剂盒或装置以及检测方法 | |
US20230366034A1 (en) | Compositions and methods for diagnosing lung cancers using gene expression profiles | |
CN109504780B (zh) | 用于肺癌检测的DNA甲基化qPCR试剂盒及使用方法 | |
CN109371133B (zh) | 一组与胰腺癌相关的LncRNA分子标记物及其应用 | |
CN110229899B (zh) | 用于结直肠癌早期诊断或预后预测的血浆标记物组合 | |
CN111424085B (zh) | tRNA来源片段在制备乳腺癌诊断试剂中的应用 | |
KR102052398B1 (ko) | 전립선암 진단용 바이오마커 및 이의 용도 | |
KR102550113B1 (ko) | 전립선암 진단용 바이오마커 및 이의 용도 | |
US7217515B2 (en) | HURP gene as a molecular marker for bladder cancer | |
CN114480636B (zh) | 胆汁细菌作为肝门部胆管癌诊断及预后标志物的用途 | |
CN112391478B (zh) | 外泌体mRNA在乳腺疾病诊断中的应用 | |
CN111808966B (zh) | miRNA在诊断乳腺癌患病风险的应用 | |
US11542559B2 (en) | Methylation-based biomarkers in breast cancer screening, diagnosis, or prognosis | |
CN114410795A (zh) | 基于miRNA特征标记的肝癌早期检测 | |
CN114916233A (zh) | 泛癌症早筛预测方法 | |
CN112176060B (zh) | 一组血浆非编码rna及检测其表达水平的引物组与结直肠癌检测试剂盒 | |
US11676724B1 (en) | Method of calculating diagnostic score for prostate cancer and use thereof | |
EP4212632A1 (en) | Method for calculating prostate cancer diagnostic score, and uses thereof | |
CN114836538B (zh) | 生物标志物在hbv相关肝癌诊断及预后中的应用 | |
CN116083590B (zh) | 一种基因检测试剂盒及其制备方法和应用 | |
KR20220151482A (ko) | 전립선암 진단용 바이오마커 | |
CN115948546A (zh) | 乳腺癌的外泌体miRNA生物标志物及其应用 | |
CN117448442A (zh) | 一种用于检测动脉粥样硬化性心血管疾病的3′端2′-o-甲基化修饰微小核糖核酸组合及其应用 | |
KR20220166744A (ko) | 전립선 암 예후 예측용 바이오마커 및 이의 용도 | |
CN116083583A (zh) | miRNA-483-5p在制备胰腺癌肝转移诊断试剂盒中的应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
AMND | Amendment | ||
X091 | Application refused [patent] | ||
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant |