JP2024521869A - 前立腺癌診断用バイオマーカー及びその使用 - Google Patents
前立腺癌診断用バイオマーカー及びその使用 Download PDFInfo
- Publication number
- JP2024521869A JP2024521869A JP2023573568A JP2023573568A JP2024521869A JP 2024521869 A JP2024521869 A JP 2024521869A JP 2023573568 A JP2023573568 A JP 2023573568A JP 2023573568 A JP2023573568 A JP 2023573568A JP 2024521869 A JP2024521869 A JP 2024521869A
- Authority
- JP
- Japan
- Prior art keywords
- mir
- hsa
- mirna
- prostate cancer
- lncrna
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 206010060862 Prostate cancer Diseases 0.000 title claims abstract description 166
- 208000000236 Prostatic Neoplasms Diseases 0.000 title claims abstract description 162
- 239000000090 biomarker Substances 0.000 title abstract description 131
- 108091070501 miRNA Proteins 0.000 claims abstract description 154
- 239000002679 microRNA Substances 0.000 claims abstract description 154
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 130
- 230000014509 gene expression Effects 0.000 claims abstract description 113
- 108020004999 messenger RNA Proteins 0.000 claims abstract description 107
- 108020005198 Long Noncoding RNA Proteins 0.000 claims abstract description 106
- 230000004927 fusion Effects 0.000 claims abstract description 100
- 238000000034 method Methods 0.000 claims abstract description 64
- 239000000203 mixture Substances 0.000 claims abstract description 45
- 210000002700 urine Anatomy 0.000 claims abstract description 41
- 238000002360 preparation method Methods 0.000 claims abstract description 15
- 210000001519 tissue Anatomy 0.000 claims abstract description 13
- 238000011529 RT qPCR Methods 0.000 claims abstract description 3
- 238000004458 analytical method Methods 0.000 claims description 76
- 238000010801 machine learning Methods 0.000 claims description 72
- 238000004422 calculation algorithm Methods 0.000 claims description 46
- 238000007477 logistic regression Methods 0.000 claims description 46
- 108091069006 Homo sapiens miR-125b-1 stem-loop Proteins 0.000 claims description 45
- 108091069087 Homo sapiens miR-125b-2 stem-loop Proteins 0.000 claims description 45
- 108091070489 Homo sapiens miR-17 stem-loop Proteins 0.000 claims description 45
- 108091065163 Homo sapiens miR-30c-1 stem-loop Proteins 0.000 claims description 45
- 108091067641 Homo sapiens miR-30c-2 stem-loop Proteins 0.000 claims description 45
- 108091068991 Homo sapiens miR-141 stem-loop Proteins 0.000 claims description 44
- 101000638154 Homo sapiens Transmembrane protease serine 2 Proteins 0.000 claims description 37
- 102100031989 Transmembrane protease serine 2 Human genes 0.000 claims description 37
- 238000003757 reverse transcription PCR Methods 0.000 claims description 32
- 239000002299 complementary DNA Substances 0.000 claims description 31
- 239000012472 biological sample Substances 0.000 claims description 25
- 238000007637 random forest analysis Methods 0.000 claims description 23
- 239000000523 sample Substances 0.000 claims description 23
- 238000012706 support-vector machine Methods 0.000 claims description 21
- 210000004027 cell Anatomy 0.000 claims description 18
- 108091070365 Homo sapiens miR-30a stem-loop Proteins 0.000 claims description 17
- 238000002790 cross-validation Methods 0.000 claims description 15
- 108091069089 Homo sapiens miR-146a stem-loop Proteins 0.000 claims description 14
- 108091007767 MALAT1 Proteins 0.000 claims description 13
- 108091070493 Homo sapiens miR-21 stem-loop Proteins 0.000 claims description 10
- 108091067573 Homo sapiens miR-222 stem-loop Proteins 0.000 claims description 10
- 108091070373 Homo sapiens miR-24-1 stem-loop Proteins 0.000 claims description 10
- 108091070374 Homo sapiens miR-24-2 stem-loop Proteins 0.000 claims description 10
- 108091008065 MIR21 Proteins 0.000 claims description 10
- 238000003745 diagnosis Methods 0.000 claims description 10
- 238000011304 droplet digital PCR Methods 0.000 claims description 10
- 230000002860 competitive effect Effects 0.000 claims description 9
- 210000000582 semen Anatomy 0.000 claims description 9
- 210000004369 blood Anatomy 0.000 claims description 8
- 239000008280 blood Substances 0.000 claims description 8
- 210000002381 plasma Anatomy 0.000 claims description 8
- 210000003296 saliva Anatomy 0.000 claims description 8
- 210000002966 serum Anatomy 0.000 claims description 8
- 108091069457 Homo sapiens miR-200b stem-loop Proteins 0.000 claims description 7
- 108091069018 Homo sapiens miR-27b stem-loop Proteins 0.000 claims description 7
- 108091069021 Homo sapiens miR-30b stem-loop Proteins 0.000 claims description 7
- 108091070395 Homo sapiens miR-31 stem-loop Proteins 0.000 claims description 7
- 108091067535 Homo sapiens miR-375 stem-loop Proteins 0.000 claims description 7
- 108091007424 MIR27B Proteins 0.000 claims description 7
- 108091062138 Homo sapiens miR-1185-2 stem-loop Proteins 0.000 claims description 6
- 238000000636 Northern blotting Methods 0.000 claims description 6
- 102000006382 Ribonucleases Human genes 0.000 claims description 6
- 108010083644 Ribonucleases Proteins 0.000 claims description 6
- 238000012163 sequencing technique Methods 0.000 claims description 6
- 230000002194 synthesizing effect Effects 0.000 claims description 6
- 239000013068 control sample Substances 0.000 claims description 5
- 108091033411 PCA3 Proteins 0.000 claims 3
- 238000009007 Diagnostic Kit Methods 0.000 abstract description 11
- 239000012634 fragment Substances 0.000 abstract description 9
- 238000001356 surgical procedure Methods 0.000 abstract description 4
- 230000008901 benefit Effects 0.000 abstract description 2
- 239000003550 marker Substances 0.000 description 47
- 206010004446 Benign prostatic hyperplasia Diseases 0.000 description 27
- 208000004403 Prostatic Hyperplasia Diseases 0.000 description 27
- 238000011156 evaluation Methods 0.000 description 24
- 108010072866 Prostate-Specific Antigen Proteins 0.000 description 19
- 102100038358 Prostate-specific antigen Human genes 0.000 description 19
- 238000003753 real-time PCR Methods 0.000 description 19
- 206010028980 Neoplasm Diseases 0.000 description 17
- 239000000872 buffer Substances 0.000 description 17
- 238000007619 statistical method Methods 0.000 description 13
- 238000012549 training Methods 0.000 description 9
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 8
- 201000011510 cancer Diseases 0.000 description 8
- 238000001514 detection method Methods 0.000 description 8
- 238000012360 testing method Methods 0.000 description 8
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 7
- 238000007781 pre-processing Methods 0.000 description 7
- 210000002307 prostate Anatomy 0.000 description 7
- 238000002591 computed tomography Methods 0.000 description 6
- 150000007523 nucleic acids Chemical class 0.000 description 6
- 102000004169 proteins and genes Human genes 0.000 description 6
- 108020004414 DNA Proteins 0.000 description 5
- 102100034343 Integrase Human genes 0.000 description 5
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 5
- 238000001574 biopsy Methods 0.000 description 5
- 239000006166 lysate Substances 0.000 description 5
- 230000001105 regulatory effect Effects 0.000 description 5
- 238000011282 treatment Methods 0.000 description 5
- 239000004606 Fillers/Extenders Substances 0.000 description 4
- 238000013103 analytical ultracentrifugation Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000003247 decreasing effect Effects 0.000 description 4
- 230000036425 denaturation Effects 0.000 description 4
- 238000004925 denaturation Methods 0.000 description 4
- 230000008030 elimination Effects 0.000 description 4
- 238000003379 elimination reaction Methods 0.000 description 4
- -1 for example Proteins 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 239000012528 membrane Substances 0.000 description 4
- 210000000056 organ Anatomy 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000010839 reverse transcription Methods 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 238000003260 vortexing Methods 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 108020004463 18S ribosomal RNA Proteins 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 108020004707 nucleic acids Proteins 0.000 description 3
- 102000039446 nucleic acids Human genes 0.000 description 3
- 239000002773 nucleotide Substances 0.000 description 3
- 102000007469 Actins Human genes 0.000 description 2
- 108010085238 Actins Proteins 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 239000003298 DNA probe Substances 0.000 description 2
- 108010067770 Endopeptidase K Proteins 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- 238000002944 PCR assay Methods 0.000 description 2
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 2
- 239000003098 androgen Substances 0.000 description 2
- 238000002583 angiography Methods 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 238000010835 comparative analysis Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 230000001351 cycling effect Effects 0.000 description 2
- 230000034994 death Effects 0.000 description 2
- 231100000517 death Toxicity 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000002405 diagnostic procedure Methods 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 235000006694 eating habits Nutrition 0.000 description 2
- 238000010828 elution Methods 0.000 description 2
- 238000007459 endoscopic retrograde cholangiopancreatography Methods 0.000 description 2
- 238000009558 endoscopic ultrasound Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000002357 laparoscopic surgery Methods 0.000 description 2
- 238000002595 magnetic resonance imaging Methods 0.000 description 2
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000011880 melting curve analysis Methods 0.000 description 2
- 125000003729 nucleotide group Chemical group 0.000 description 2
- 201000002528 pancreatic cancer Diseases 0.000 description 2
- 208000008443 pancreatic carcinoma Diseases 0.000 description 2
- 210000005267 prostate cell Anatomy 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 238000002604 ultrasonography Methods 0.000 description 2
- IQVNEKKDSLOHHK-FNCQTZNRSA-N (E,E)-hydramethylnon Chemical compound N1CC(C)(C)CNC1=NN=C(/C=C/C=1C=CC(=CC=1)C(F)(F)F)\C=C\C1=CC=C(C(F)(F)F)C=C1 IQVNEKKDSLOHHK-FNCQTZNRSA-N 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 108091092584 GDNA Proteins 0.000 description 1
- 229930186217 Glycolipid Natural products 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 101150104466 NOCT gene Proteins 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 208000025174 PANDAS Diseases 0.000 description 1
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 description 1
- 240000004718 Panda Species 0.000 description 1
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 108020004518 RNA Probes Proteins 0.000 description 1
- 239000003391 RNA probe Substances 0.000 description 1
- 239000013614 RNA sample Substances 0.000 description 1
- 206010039491 Sarcoma Diseases 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- 208000009956 adenocarcinoma Diseases 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 150000004657 carbamic acid derivatives Chemical class 0.000 description 1
- 231100000504 carcinogenesis Toxicity 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013211 curve analysis Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 239000000104 diagnostic biomarker Substances 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 150000002016 disaccharides Chemical class 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- NAGJZTKCGNOGPW-UHFFFAOYSA-N dithiophosphoric acid Chemical class OP(O)(S)=S NAGJZTKCGNOGPW-UHFFFAOYSA-N 0.000 description 1
- 238000013399 early diagnosis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000000762 glandular Effects 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 206010020718 hyperplasia Diseases 0.000 description 1
- 238000011337 individualized treatment Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 210000003041 ligament Anatomy 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- YACKEPLHDIMKIO-UHFFFAOYSA-N methylphosphonic acid Chemical class CP(O)(O)=O YACKEPLHDIMKIO-UHFFFAOYSA-N 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 150000002772 monosaccharides Chemical class 0.000 description 1
- 238000000491 multivariate analysis Methods 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 150000002482 oligosaccharides Chemical class 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 150000008298 phosphoramidates Chemical class 0.000 description 1
- 150000008300 phosphoramidites Chemical class 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 239000013615 primer Substances 0.000 description 1
- 239000002987 primer (paints) Substances 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 210000000664 rectum Anatomy 0.000 description 1
- 230000001850 reproductive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000003161 ribonuclease inhibitor Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 230000001954 sterilising effect Effects 0.000 description 1
- 238000004659 sterilization and disinfection Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- 239000000439 tumor marker Substances 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 210000003708 urethra Anatomy 0.000 description 1
- 230000002485 urinary effect Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/178—Oligonucleotides characterized by their use miRNA, siRNA or ncRNA
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Hospice & Palliative Care (AREA)
- Biophysics (AREA)
- Oncology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本発明は、前立腺癌診断のためのバイオマーカー及びその使用に関し、より具体的には、特定のlncRNA、miRNA、及び/又は融合遺伝子のmRNA、又はその断片の発現レベルを測定することができる製剤を含む前立腺癌診断用組成物;前記バイオマーカーの発現レベルを測定する工程を含む前立腺癌診断のための情報を提供する方法;及び前記前立腺癌診断用組成物を含む前立腺癌診断用キットに関する。本発明は、正常組織対比前立腺癌で異常発現する新しいlncRNA、miRNA、及び/又は融合遺伝子のmRNAの組み合わせを初めて明らかにしたことにより、これをバイオマーカーとして使用することによって、外科的処置なしに非侵襲的な方法で前立腺癌を素早くかつ迅速に診断することができる。特に、本発明の前立腺癌診断用lncRNA、miRNA、及び融合遺伝子のmRNAは、対象体の尿から他の遺伝子に比べて比較的に発現量が多く、qRT-PCRを通じて安定的に分析が可能な利点を有する。【選択図】図1
Description
本発明は、前立腺癌診断のためのバイオマーカー及びその使用に関し、より具体的には、特定のlncRNA、miRNA、融合遺伝子(融合遺伝子)のmRNA、及び/又はその断片の発現レベルを測定することができる製剤を含む前立腺癌診断用組成物;前記バイオマーカーの発現レベルを測定する工程を含む前立腺癌診断のための情報を提供する方法;及び前記前立腺癌診断用組成物を含む前立腺癌診断用キットに関するものである。
前立腺は、膀胱のすぐ下、直腸の前方にある栗ほどの大きさの男性生殖器官で、精液の一部を作り出し、保存する役割を果たしている。上は膀胱頸部、つまり膀胱から尿道に移行する部位と隣接して前方の恥骨前立腺靭帯に固定されており、下は泌尿生殖隔膜によって固定されている。前立腺に発生する癌のほとんどは、前立腺細胞から発生する腺癌(腺細胞の癌)である。腫瘍組織の分化度と細胞の特性などによってタイプを区分することができる。
前立腺癌(PCa)は、世界で最も一般的な泌尿器系腫瘍の1つであり、米国では2016年にのみ約180,890人が前立腺癌と新たに診断され、米国内の全新規腫瘍診断の10.7%を占め、乳癌と肺癌に続いて3番目に頻繁に発症になる腫瘍である。2009年から2013年までの統計に照らして、全世界100,000人の男性のうち129.4人が前立腺癌を持っており、前立腺癌の死亡率は2016年統計で26,120人に達する。また、前立腺癌は、50歳以前は一般的な疾患ではないが、50歳を越えると急激に増加する傾向がある。近年、平均寿命の延長により、国内でも高齢男性の数が急増し、前立腺癌を早期に診断し、転移が発生するなど悪化しないように持続的な管理が必要である。特にヒト前立腺癌は骨に移転する傾向を有するようであり、アンドロゲン依存性状態からアンドロゲン耐性状態に必然的に進行して患者の死亡率を増加させると知られている。さらに、前立腺癌治療を受ける男性の約25%は病気が再発して追加の治療を必要とする疾患であり現在米国で男性の癌死亡原因のうち第2の原因を占めており(非特許文献1)、これに対する早期診断及び治療が必要な実情である。
前立腺癌診断のための従来技術としては、PSA(前立腺特異抗原)測定及びバイオプシー(biopsy)がある。PSA測定は、前立腺癌診断で最もよく使われる方法で、前立腺細胞で作られる特異抗原数値を測定して前立腺癌のリスクを決定する方法である。悪性前立腺癌であるほどPSA数値は高く、前立腺癌がないほとんどの男性は4ng/mL未満の数値を有している。しかし、測定したPSA数値が前立腺癌の不在にもかかわらず、非常に高いか、あるいはPSAグレーゾーン(PSA4ng/mL以上10ng/mL以下)区間に入る場合、バイオプシーが要になる。バイオプシーは、癌が疑われる臓器部分の組織を針で採取し、病理組織学的検査を通じて患者の該当臓器に癌、肉腫などの悪性腫瘍の有無を診断する方法である。このようなバイオプシー検査は、患者の苦痛が大きく、特にPSAグレーゾーンでの前立腺癌診断の正確率は30%未満である。つまり、約70%の患者がPSA測定の限界のために費用がかかり、痛みを伴うリバイオプシーを経験するという欠点がある。
従って、このような不要なリバイオプシーとPSA測定の限界を克服し置換するために、より高い精度を有する前立腺癌特異的診査法の開発が必要ある。
このような背景下で、本発明は、検査時の苦痛を回避し、費用の負担を軽減するために前立腺癌と診断された患者の尿検体及び非腫瘍対照群尿検体に基づいて、前立腺癌特異的バイオマーカーとして、特定のmiRNAの組み合わせとlncRNA、miRNA、及び/又はmRNA(特に、融合遺伝子のmRNA)の組み合わせを明らかにしており、これらのmiRNAの組み合わせ、lncRNA、miRNA、及び/又は融合遺伝子のmRNAバイオマーカーの組み合わせが前立腺癌の診断に有用であることを確認することによって本発明を完成した。
このような背景下で、本発明は、検査時の苦痛を回避し、費用の負担を軽減するために前立腺癌と診断された患者の尿検体及び非腫瘍対照群尿検体に基づいて、前立腺癌特異的バイオマーカーとして、特定のmiRNAの組み合わせとlncRNA、miRNA、及び/又はmRNA(特に、融合遺伝子のmRNA)の組み合わせを明らかにしており、これらのmiRNAの組み合わせ、lncRNA、miRNA、及び/又は融合遺伝子のmRNAバイオマーカーの組み合わせが前立腺癌の診断に有用であることを確認することによって本発明を完成した。
Jemal A et al., CA Cancer J Clin 2010;60:277-300
そこで、本発明の目的は、前立腺癌を効果的に診断することができる組成物を提供することである。
本発明の別の目的は、バイオマーカーを用いて前立腺癌を効果的に診断するための情報提供方法を提供することである。
本発明の別の目的は、バイオマーカーを用いて前立腺癌を効果的に診断するための情報提供方法を提供することである。
本発明のさらに別の目的は、前記組成物を含む前立腺癌診断用キットを提供することである。
本発明のさらに別の目的は、前記組成物又はそれを含む前立腺癌診断用キットを用いて前立腺癌を診断する方法を提供することである。
本発明のさらに別の目的は、前記組成物又はそれを含む前立腺癌診断用キットを用いて前立腺癌を診断する方法を提供することである。
前記のような本発明の目的を達成するために、
本発明は、miRNAの発現レベルを測定することができる製剤を含む前立腺癌診断用組成物を提供する。
本発明は、miRNAの発現レベルを測定することができる製剤を含む前立腺癌診断用組成物を提供する。
前記miRNAが、hsa_miR_375、hsa_miR_27b_3p、hsa_miR_31_5p、hsa_miR_125b_5p、hsa_miR_146a_3p、hsa_miR_146a_5p、hsa_miR_17_3p、hsa_miR_200b_3p、hsa_miR_21_5p、hsa_miR_1185_2_3p、hsa_miR_141_5p、hsa_miR_222_3p、hsa_miR_24_3p、hsa_miR_30a_3p、hsa_miR_30a_5p、hsa_miR_30b_5p及びhsa_miR_30c_5pからなる群から選択される少なくとも1つであってもよい。好ましくは、前記miRNAが、hsa_miR_125b_5p、hsa_miR_17_3p、hsa_miR_141_5p及びhsa_miR_30c_5pを含むことができる。
前記miRNAが、hsa_miR_125b_5p、hsa_miR_17_3p、hsa_miR_141_5p及びhsa_miR_30c_5pを含み、ここに、hsa_miR_21_5p、hsa_miR_24_3p、hsa_miR_30a_5p、hsa_miR_222_3p、hsa_miR_375、hsa_miR_27b_3p、hsa_miR_31_5p、hsa_miR_146a_3p、hsa_miR_146a_5p、hsa_miR_200b_3p、hsa_miR_1185_2_3p、hsa_miR_30a_3p及びhsa_miR_30b_5pからなる群から選択される少なくとも1つをさらに含むことができる。
一実施様態において、前記組成物は、lncRNA及び融合遺伝子のmRNAからなる群から選択された少なくとも1つをさらに含むことができ、前記lncRNAが、PCA3及びMALAT1から選択される少なくとも1つであってもよく、前記融合遺伝子のmRNAがTMPRSS2:ERGであってもよい。
一実施様態において、前記組成物は、以下の組み合わせの発現レベルを測定することができる製剤を含む前立腺癌診断用組成物であり、組み合わせは、(a)lncRNA及びmiRNA、(b)融合遺伝子のmRNA及びmiRNA、又は(c)lncRNA、miRNA及び融合遺伝子のmRNAであり、前記lncRNAがPCA3及びMALAT1から選択される少なくとも1つであり、前記融合遺伝子のmRNAがTMPRSS2:ERGである、前立腺癌診断用組成物であってもよい。
一実施態様において、前記組成物は、前記miRNAにそれぞれ特異的に結合するプライマー、プローブ及び/又は抗体を含むことができる。
一実施態様において、前記製剤は、前記lncRNA、miRNA及び/又は融合遺伝子のmRNAにそれぞれ特異的に結合するプライマー、プローブ及び/又は抗体を含むことができる。
一実施態様において、前記製剤は、前記lncRNA、miRNA及び/又は融合遺伝子のmRNAにそれぞれ特異的に結合するプライマー、プローブ及び/又は抗体を含むことができる。
また、本発明は、対象体から分離された生物学的試料において前記lncRNA、融合遺伝子のmRNA、miRNA又はそれらの組み合わせの発現レベルを測定する工程;及び前記lncRNA、融合遺伝子のmRNA、miRNA又はそれらの組み合わせの発現レベルを正常対照群の試料のlncRNA、融合遺伝子のmRNA、miRNA又はそれらの組み合わせの発現レベルと比較する工程;を含む、前立腺癌診断のための情報を提供する方法を提供する。
一実施態様において、前記lncRNA、融合遺伝子のmRNA、miRNA又はそれらの組み合わせの発現レベルは、逆転写ポリメラーゼ連鎖反応(RT-PCR)、競合逆転写ポリメラーゼ連鎖反応(競合RT-PCR)、定量的逆転写ポリメラーゼ連鎖反応(定量的RT-PCR、qPCR)、ddPCR(droplet digital PCR)、シークエンシング(sequencing)、RNase保護分析法(RNase protection method)、ノーザンブロット法(Northern blotting)及び/又は遺伝子チップ分析法によって測定することができる。
一実施態様において、前記発現レベルを測定する工程は、対象体から分離された生物学的試料から前記lncRNA、融合遺伝子のmRNA、miRNA又はそれらの組み合わせを抽出する工程;抽出されたlncRNA、融合遺伝子のmRNA、miRNA又はそれらの組み合わせからcDNAを合成する工程;合成したcDNAに特異的なプライマー対を用いてcDNAを増幅する工程;及び増幅されたcDNAを検出する工程;を含むことができる。
一実施態様において、前記生物学的試料は、組織、細胞、尿、唾液、精液、全血、血漿及び/又は血清であってもよい。好ましくは、前記生物学的試料は尿であってもよい。
一実施態様において、前記lncRNA、融合遺伝子のmRNA、miRNA又はそれらの組み合わせの発現レベルを比較する工程は、LR(ロジスティック回帰)、SVM(サポートベクターマシン)、ランダムフォレスト及び多層パーセプトロンからなる群から選択される機械学習アルゴリズムを用いて行うことができる。好ましくは、lncRNA、融合遺伝子のmRNA、miRNA又はそれらの組み合わせの発現レベルを比較する工程は、LR(ロジスティック回帰)を用いて行うことができる。
また、本発明は、前記前立腺癌診断用組成物を含む、前立腺癌診断用キットを提供する。
さらに、本発明は、前記前立腺癌診断用組成物又はそれを含む前立腺癌診断用キットを用いて前立腺癌を診断する方法を提供する。
さらに、本発明は、前記前立腺癌診断用組成物又はそれを含む前立腺癌診断用キットを用いて前立腺癌を診断する方法を提供する。
本発明は、正常組織に比べて前立腺癌で異常発現する新しいmiRNA組み合わせとlncRNA、miRNA、及びmRNA(特に、融合遺伝子のmRNA)の組み合わせを初めて明らかにしたことにより、これをバイオマーカーとして使用することによって、外科的処置なしに非侵襲的な方法で前立腺癌を素早くかつ迅速に診断することができる。特に、本発明の前立腺癌診断用lncRNA、miRNA、及び融合遺伝子のmRNAは、対象体の尿から他の遺伝子に比べて比較的に発現量が多く、qRT-PCRを通じて安定的に分析が可能な利点を有する。
本発明は、前立腺癌診断のためのバイオマーカーに関する。
本発明で使用される用語「前立腺癌」とは、前立腺に発生する悪性腫瘍であり、「極限性前立腺癌」及び「進行性前立腺癌」を含むが、これらに限定されない。
本発明で使用される用語「前立腺癌」とは、前立腺に発生する悪性腫瘍であり、「極限性前立腺癌」及び「進行性前立腺癌」を含むが、これらに限定されない。
本発明で使用される用語「診断」とは、病理状態の存在又は特徴を確認することを意味する。本発明において、前記診断は、前立腺癌の発症又は進行の有無を確認するものと解釈することができる。
本発明で使用される用語「マーカー」又は「診断マーカー(diagnosis marker)」とは、前立腺癌を有する対象体を正常細胞又は正常対象体と区別して診断することができる物質であり、正常細胞と比較して前立腺癌が発症又は進行した細胞又は対象体において増加又は減少を示すポリペプチド、タンパク質又は核酸(例:lncRNA、miRNA、又はmRNAなど)、脂質、糖脂質、糖タンパク質又は糖(単糖類、二糖類、オリゴ糖類など)などの有機生体分子が含まれるが、これらに限定されない。前立腺癌診断マーカーは、前立腺癌の発症及び進行の指標となり得るので、前立腺癌の発症、疾患の進行及び疾患の診断に使用することができる。
本発明の目的において、本発明の前立腺癌診断マーカーは、正常細胞又は組織の細胞と比較して、前立腺癌細胞において特異的に発現レベルの差を示すlncRNA、miRNA、及び/又は融合遺伝子のmRNAの断片である。
より具体的に、本発明のlncRNA前立腺癌診断マーカーは、PCA3及びMALAT1から選択される少なくとも1つであり、融合遺伝子のmRNA前立腺癌診断マーカーは、TMPRSS2:ERGであり、miRNA前立腺癌診断マーカーは、hsa_miR_375、hsa_miR_27b_3p、hsa_miR_31_5p、hsa_miR_125b_5p、hsa_miR_146a_3p、hsa_miR_146a_5p、hsa_miR_17_3p、hsa_miR_200b_3p、hsa_miR_21_5p、hsa_miR_1185_2_3p、hsa_miR_141_5p、hsa_miR_222_3p、hsa_miR_24_3p、hsa_miR_30a_3p、hsa_miR_30a_5p、hsa_miR_30b_5p及びhsa_miR_30c_5pからなる群から選択される少なくとも1つであり、これらは前立腺癌が発症又は進行した細胞又は対象体で増加又は減少するRNAである。前記マーカーのうち、PCA3、TMPRSS2:ERG及びMALAT1は、前立腺癌で発現が増加し、残りは発現が減少する。
一実施形態において、特に前記マーカーは、正常対照群から前立腺癌患者の診断、前立腺癌の進行状態を区別することができる識別力を向上させるために、2つ以上の組み合わせで使用することができる。本発明によるマーカーのうち、これらの用途に最適な効果を示すlncRNA、mRNA及び/又はmiRNAの組み合わせを選択して使用することができ、当業者であれば用途に適した組み合わせを選択することができるであろう。
一実施形態において、前記マーカーlncRNA、mRNA及び/又はmiRNAの組み合わせは、患者群によるマーカーの相対発現量分析とROC曲線のAUC値による個々のマーカー性能評価によって選択することができる。具体的には、AUC値が高いか、既存の参考文献と患者群による傾向性が一致するプライマーを選定し、その後さらに多変量解析を行って選択することができる。バイオマーカーによる個々のデータ分析結果は、図2及び図3に示されている。
一実施形態において、前記マーカーの組み合わせは、パラメータとしてLOO(Leave-One-Out)及びランダムフォレスト(RF)を使用した場合、RFECV(相互検証による再帰的特徴除去)アルゴリズムを適用した結果であり、極値(local maximum)を形成するように組合わせられる。好ましくは、前記マーカーの組み合わせは、LR(ロジスティック回帰)を用いて行われ、LOOCV(1つ抜き交差検証)値が0.65以上、AUC値が0.70以上であるもので組合わせることができる。一例として、このような組み合わせは、miRNAとしてhsa_miR_125b_5p、hsa_miR_141_5p、hsa_miR_17_3p及びhsa_miR_30c_5pの組み合わせを含むことができ、これらの組み合わせに対するROC曲線は図7に開示されている。別一例として、このような組み合わせは、lncRNAとしてPCA3、融合遺伝子のmRNAとしてTMPRSS2:ERG、及びmiRNAとしてhsa_miR_125b_5p、hsa_miR_141_5p、hsa_miR_17_3p及びhsa_miR_30c_5pの組み合わせを含むことができ、これらの組み合わせに対するROC曲線は図9に開示されている。
一実施形態において、前記マーカーの組み合わせは、hsa_miR_375、hsa_miR_27b_3p、hsa_miR_31_5p、hsa_miR_125b_5p、hsa_miR_146a_3p、hsa_miR_146a_5p、hsa_miR_17_3p、hsa_miR_200b_3p、hsa_miR_21_5p、hsa_miR_1185_2_3p、hsa_miR_141_5p、hsa_miR_222_3p、hsa_miR_24_3p、hsa_miR_30a_3p、hsa_miR_30a_5p、hsa_miR_30b_5p及びhsa_miR_30c_5pからなる群から選択される少なくとも1つであってもよく、具体的には、hsa_miR_125b_5p、hsa_miR_141_5p、hsa_miR_17_3p及びhsa_miR_30c_5pであってもよい。
一実施形態において、前記マーカーの組み合わせは、(a)lncRNA及びmiRNA、(b)融合遺伝子のmRNA及びmiRNA、又は(c)lncRNA、miRNA及び融合遺伝子のmRNAであり、前記lncRNAは、PCA3及びMALAT1から選択される少なくとも1つであり、前記融合遺伝子のmRNAは、TMPRSS2:ERGであり、前記miRNAは、hsa_miR_125b_5p、hsa_miR_141_5p、hsa_miR_21_5p、hsa_miR_17_3p、hsa_miR_24_3p、hsa_miR_30a_5p、hsa_miR_222_3p及びhsa_miR_30c_5pからなる群から選択される少なくとも1つであってもよい。
一実施形態において、前記マーカーの組み合わせは、lncRNA及び融合遺伝子のmRNAの組み合わせであり、前記lncRNAは、PCA3及びMALAT1であり、前記融合遺伝子のmRNAは、TMPRSS2:ERGであってもよい。
一実施形態において、前記マーカーは、miRNAであり、前記miRNAは、hsa_miR_125b_5p、hsa_miR_141_5p、hsa_miR_21_5p、hsa_miR_17_3p、hsa_miR_24_3p、hsa_miR_30a_5p、hsa_miR_222_3p及びhsa_miR_30c_5pからなる群から選択される少なくとも2つである。
一実施形態において、前記マーカーの組み合わせは、lncRNA、miRNA及び融合遺伝子のmRNAの組み合わせであり、前記lncRNAは、PCA3であり、前記融合遺伝子のmRNAは、TMPRSS2:ERGであり、前記miRNAは、hsa_miR_125b_5p、hsa_miR_141_5p、hsa_miR_17_3p及びhsa_miR_30c_5pである。
一実施形態において、前記lncRNA及び/又は融合遺伝子のmRNAに、それぞれ特異的に結合するプライマーは以下のような塩基配列からなっていてもよい(配列番号1~14)。
一実施形態において、前記miRNAは、それぞれ以下のような塩基配列からなっていてもよい。
前記配列番号1~14に記載された塩基配列は、lncRNA又は融合遺伝子のmRNAに特異的に結合するプライマーの塩基配列であり、前記配列番号19~35に記載された塩基配列は、miRNA自らの塩基配列である。miRNAに特異的に結合するプローブ又はプライマーは、前記miRNA塩基配列を参照して設計することができる。前記プローブ又はプライマーは、前立腺癌の発症又は進行の有無を診断することができる診断マーカーとして活用できるlncRNA、miRNA、及び/又は融合遺伝子のmRNAを効果的に検出することができ、プライマーの塩基配列は、診断マーカーとして活用できるlncRNA、miRNA、及び/又は融合遺伝子のmRNAを検出するうえで、ある程度の変形が可能である。本技術分野の当業者であれば、このような人工的な変形によって80%以上、好ましくは90%以上、より好ましくは95%以上、最も好ましくは98%以上の相同性が維持される塩基配列が、本発明で目的とする前立腺癌診断マーカーとして、正常な対象体と前立腺癌疾患を有する対象体間で発現量の差を有意に比較できる限り、本発明の前記塩基配列と均等であることを容易に理解できる。
前記各マーカーのタンパク質は公知のものであり、例えば、前記各マーカーの配列はヒト由来の配列であってもよい。
本発明で使用される用語「生物学的試料」又は「検体」とは、人体や哺乳動物から得られるあらゆる固体又は液体の試料、例えば、特定臓器由来の組織、細胞、尿、唾液、精液、全血、血漿又は血清試料を含むが、これらに限定されない。
本発明で使用される用語「生物学的試料」又は「検体」とは、人体や哺乳動物から得られるあらゆる固体又は液体の試料、例えば、特定臓器由来の組織、細胞、尿、唾液、精液、全血、血漿又は血清試料を含むが、これらに限定されない。
一実施形態において、本発明の前立腺癌診断マーカーが使用される生物学的試料は、前立腺癌組織、細胞、尿、唾液、精液、全血、血漿および血清からなる群から選択される少なくとも1つであってもよい。好ましくは、本発明の前立腺癌診断マーカーが使用される生物学的試料は、尿である。
別の実施形態おいて、本発明に使用される生物学的試料としては、比較分析のために、前立腺癌の判別が必要な被検者の生物学的試料はもちろん、正常対照群、特定タイプの前立腺癌対照群由来の生物学的試料も使用することができる。
本発明で使用される用語「lncRNA、miRNA、及び/又は融合遺伝子のmRNAの発現レベルを測定することができる製剤」とは、試料に含まれた当該lncRNA、miRNA、融合遺伝子のmRNA及び/又はこれらの断片の発現の有無を確認する方法に使用される製剤を意味するが、好ましくは逆転写ポリメラーゼ連鎖反応、競合逆転写ポリメラーゼ連鎖反応、定量的逆転写ポリメラーゼ連鎖反応、ddPCR(droplet digital PCR)、シークエンシング(sequencing)、RNase保護分析法、ノーザンブロット法及び/又は遺伝子チップ分析法などの方法に使用される標的遺伝子に特異的に結合できるプライマー、プローブ及び/又は抗体を含むことができる。好ましくは、lncRNA、miRNA、及び/又は融合遺伝子のmRNAの発現レベルを測定することができる製剤であってもよい。
一実施様態において、本発明は、逆転写ポリメラーゼ連鎖反応(RT-PCR)と定量的逆転写ポリメラーゼ連鎖反応(qPCR)を用いてマーカーを検出することができる。逆転写ポリメラーゼ連鎖反応とは、生物学的試料からRNA、例えば、lncRNA、miRNA、又はmRNAを分離した後、そこからcDNAを合成し、特定のプライマー、又はプライマー及びプローブの組み合わせを使用して特定の遺伝子を大量に増幅させることをいう。リアルタイムポリメラーゼ連鎖反応(Real-time PCR)とも知らされたqPCRは、蛍光物質をPCR法に応用したものであり、特定のプライマー、又はプライマー及びプローブの組み合わせを使用して反応中に試料内に存在する標的遺伝子の増幅と一緒に蛍光物質の発光(emission)程度をリアルタイムで検出して定量分析し、標的遺伝子の増幅の有無及びその様相を迅速かつ正確に分析できる方法である。多数の標的遺伝子の発現変化を確認し、高速で大量の実験結果をスクリーニングするために主に使用される。このような方法は、例えば(Han, H.; Bearss, D. J.; Browne, L. W.; Calaluce, R.; Nagle, R. B.; Von Hoff, D. D., Identification of differentially expressed genes in pancreatic cancer cells using cDNA microarray. Cancer Res 2002, 62, (10), 2890-6. / Kwang Hyuck Lee, Quatification of DNA as a tumor marker in patients with pancreatic cancer, 韓国消火器学会誌 2005, 46, 226-32)に記載されている。
本発明で使用される用語「プライマー」とは、短いフリー3’末端水酸化基を有する核酸配列で相補的なテンプルレートと塩基対を形成することができ、テンプルレート鎖をコピーするための開始位置として機能をする短い核酸配列を意味する。プライマーは、適切な緩衝液及び温度で重合反応のための試薬(すなわち、DNAポリメラーゼ又は逆転写酵素)及び異なる4つのヌクレオチドトリホスフェートの存在下でDNA合成を開始することができる。
本発明で使用される用語「プローブ」とは、遺伝子又はmRNAと特異的に結合する短くても数塩基乃至長くても数百塩基に相当するRNA又はDNAなどの核酸断片を意味し、オリゴヌクレオチド(oligonucleotide)プローブ、一本鎖DNAプローブ、二本鎖DNAプローブ、RNAプローブなどの形態で作製することができ、より容易に検出するために標識することができる。
本発明のプライマー又はプローブは、ホスホロアミダイト固体支持体法、又は他の広く公知された方法を使用して化学的に合成することができる。これらの核酸配列は、当該分野に公知の多くの手段を使用して変形させることもできる。このような変形の非制限的な例としては、メチル化、キャップ化、天然ヌクレオチドの1つ以上の同族体への置換、及びヌクレオチド間の変形、例えば、非荷電連結体(例:メチルホスホネート、ホスホトリエステル、ホスホロアミダート、カルバメートなど)又は荷電連結体(例:ホスホロチオエート、ホスホロジチオエイトなど)への変形が挙げられる。
本発明の実施例では、全体前立腺癌患者の尿検体から本発明のバイオマーカーの発現レベルを測定した。その結果、PCA3、MALAT1に対するlncRNA及びTMPRSS2:ERGに対する融合遺伝子のmRNAバイオマーカーの発現レベルが前立腺肥大症対照群に比べて顕著に上方発現することを示し、これらをマーカーとして選定し、miRNAバイオマーカーの場合、ほとんどの前立腺癌患者の尿検体から前立腺肥大症対照群に比べて下方発現されることを確認し、実験したすべてのmiRNAバイオマーカーをマーカーとして選定した。
本発明の別の実施例において、前立腺癌診断用バイオマーカーとして活用できるlncRNA、miRNA、及び/又は融合遺伝子のmRNAの組み合わせを導き出した。前記lncRNA、miRNA、及び/又は融合遺伝子のmRNAは、組織学的に前立腺癌と診断された101人の患者及び非腫瘍対照群62人の尿検体をqPCRにより分析し、合計20個の遺伝子、すなわち、2個のlncRNA(PCA3、MALAT1)、1個の融合遺伝子のmRNA(TMPRSS2:ERG)及び17のmiRNA(hsa_miR_375、hsa_miR_27b_3p、hsa_miR_31_5p、hsa_miR_125b_5p、hsa_miR_146a_3p、hsa_miR_146a_5p、hsa_miR_17_3p、hsa_miR_200b_3p、hsa_miR_21_5p、hsa_miR_1185_2_3p、hsa_miR_141_5p、hsa_miR_222_3p、hsa_miR_24_3p、hsa_miR_30a_3p、hsa_miR_30a_5p、hsa_miR_30b_5p及びhsa_miR_30c_5p)が選択された。最も好ましくは、これらのうち、非腫瘍対照群と腫瘍群で発現量の差が観測される4個のmiRNA(hsa_miR_125b_5p、hsa_miR_141_5p、hsa_miR_17_3p及びhsa_miR_30c_5p)組み合わせが選択され、1個のlncRNA(PCA3)及び1個の融合遺伝子のmRNA(TMPRSS2:ERG)及び4個のmiRNA(hsa_miR_125b_5p、hsa_miR_141_5p、hsa_miR_17_3p及びhsa_miR_30c_5p)組み合わせが選択された。
前記の通りに選別された4個のmiRNA(hsa_miR_125b_5p、hsa_miR_141_5p、hsa_miR_17_3p及びhsa_miR_30c_5p)組み合わせと1個のlncRNA(PCA3)及び1個の融合遺伝子のmRNA(TMPRSS2:ERG)及び4個のmiRNA(hsa_miR_125b_5p、hsa_miR_141_5p、hsa_miR_17_3p及びhsa_miR_30c_5p)の組み合わせは、その後、前立腺癌(101人)及び前立腺肥大症(62人)患者から得られた合計163個の尿検体で検出マーカーとしての有用性が評価された。その結果、本発明の4個のmiRNA(hsa_miR_125b_5p、hsa_miR_141_5p、hsa_miR_17_3p及びhsa_miR_30c_5p)組み合わせの発現レベルを測定する製剤や、本発明の6つのマーカー、すなわちlncRNA(PCA3)、融合遺伝子のmRNA(TMPRSS2:ERG)、及び/又はmiRNA(hsa_miR_125b_5p、hsa_miR_141_5p、hsa_miR_17_3p及びhsa_miR_30c_5p)の発現レベルを測定する製剤を利用すれば前立腺癌を効果的に診断できることが分かった。
また、本発明は、前立腺癌診断用組成物又はキットを用いて前立腺癌診断のための情報を提供する方法に関するものである。
具体的には、本発明の前立腺癌診断のための情報を提供する方法は、対象体から分離された生物学的試料における前記miRNAの発現レベルを測定する工程;及び前記miRNAの発現レベルを正常対照群の試料のmiRNAの発現レベルと比較する工程;を含む。
具体的には、本発明の前立腺癌診断のための情報を提供する方法は、対象体から分離された生物学的試料における前記miRNAの発現レベルを測定する工程;及び前記miRNAの発現レベルを正常対照群の試料のmiRNAの発現レベルと比較する工程;を含む。
前記発現レベルを測定する工程でmiRNAの発現レベルを測定した後、前記発現レベルを比較する工程でmiRNAの発現レベルを正常対照群の試料の当該miRNAの発現レベルと比較し、マーカーの発現レベルが有意に増加又は減少する場合、前立腺癌が発症又は進行したと判定することができる。
一実施形態において、前記miRNAの発現レベルは、逆転写ポリメラーゼ連鎖反応、競合逆転写ポリメラーゼ連鎖反応、定量的逆転写ポリメラーゼ連鎖反応、ddPCR、シークエンシング、RNase保護分析法、ノーザンブロット法及び/又は遺伝子チップ分析法によって測定できるが、これらに限定されない。
一実施形態において、前記発現レベルを測定する工程は、対象体から分離された生物学的試料からhsa_miR_375、hsa_miR_27b_3p、hsa_miR_31_5p、hsa_miR_125b_5p、hsa_miR_146a_3p、hsa_miR_146a_5p、hsa_miR_17_3p、hsa_miR_200b_3p、hsa_miR_21_5p、hsa_miR_1185_2_3p、hsa_miR_141_5p、hsa_miR_222_3p、hsa_miR_24_3p、hsa_miR_30a_3p、hsa_miR_30a_5p、hsa_miR_30b_5p及び/又はhsa_miR_30c_5pを含むmiRNAを抽出する工程;抽出されたmiRNAからcDNAを合成する工程;合成したcDNAに特異的なプライマー対を用いてcDNAを増幅する工程;及び増幅されたcDNAを検出する工程;を含むことができる。
一実施形態において、前記生物学的試料は、被験者から得られた組織、細胞、尿、唾液、精液、全血、血漿及び/又は血清であってもよい。好ましくは、前記生物学的試料は、尿である。好ましくは、前記尿は、被験者の前立腺マッサージ又はDRE(直腸内触診)の前後に採取することができる。
一実施形態において、前記発現レベルを比較する工程は、従来の統計的分析方法を用いて行うことができる。好ましくは、前記アルゴリズムは、LR(ロジスティック回帰)で行うことができる。LR(ロジスティック回帰)アルゴリズムを用いて多重バイオマーカーの発現レベルを分析する場合、前立腺癌の診断、予測の精度を向上することができる。アルゴリズムについては後述する。
一実施形態において、前記発現レベルを比較する工程は、機械学習アルゴリズムを用いて行うことができる。好ましくは、前記アルゴリズムは、LR(ロジスティック回帰)、SVM(サポートベクターマシン)、ランダムフォレスト及び多層パーセプトロンからなる群から選択される。機械学習アルゴリズムを用いて多重バイオマーカーの発現レベルを分析する場合、前立腺癌の診断、予測の精度をさらに向上することができる。アルゴリズムについては、後述する。
前記miRNAの発現レベルを比較する工程は、LR(ロジスティック回帰)を用いて行うことができ、LOOCV(1つ抜き交差検証)値が0.65以上であり、AUC(曲線下面積)値が0.70以上であってもよい。
一実施形態において、本発明の前立腺癌診断のための情報を提供する方法は、バイオマーカーの分析結果に加え、患者の非蛋白質臨床情報、すなわち、マーカー以外の臨床情報をさらに使用することができる。このような非蛋白質臨床情報は、例えば、患者の年齢、性別、体重、食習慣、体質量、超音波、コンピュータ断層撮影(CT)、磁気共鳴映像(MRI)、血管造影術、内視鏡的逆行性胆道膵管造影、超音波内視鏡、腫瘍マーカー、及び/又は腹腔鏡検査を含む。
一実施形態において、前記発現レベルを測定する工程は、lncRNA、融合遺伝子のmRNA、又はそれらの組み合わせの発現レベルを測定する工程をさらに含むことができる。ここで、前記lncRNAは、PCA3及びMALAT1から選択される少なくとも1つであり、前記融合遺伝子のmRNAは、TMPRSS2:ERGであってもよい。また、前記lncRNA、融合遺伝子のmRNA、又はそれらの組み合わせの発現レベルを正常対照群の試料のlncRNA、融合遺伝子のmRNA、又はそれらの組み合わせの発現レベルと比較する工程をさらに含むことができる。前記発現レベルを測定する工程でlncRNA、融合遺伝子のmRNA及び/又はその断片の発現レベルを測定した後、前記発現レベルを比較する工程でlncRNA、融合遺伝子のmRNA及び/又はその断片の発現レベルを正常対照群の試料の当該lncRNA、融合遺伝子のmRNA及び/又はその断片の発現レベルと比較して、マーカーの発現レベルが有意に増加又は減少する場合、前立腺癌が発症又は進行したと判定することができる。
一実施形態において、前記miRNAと、lncRNA、融合遺伝子のmRNA又はそれらの組み合わせの発現レベルは、逆転写ポリメラーゼ連鎖反応、競合逆転写ポリメラーゼ連鎖反応、定量的逆転写ポリメラーゼ連鎖反応、ddPCR、シークエンシング、RNase保護分析法、ノーザンブロット法及び/又は遺伝子チップ分析法によって測定できるが、これらに限定されない。
一実施形態において、前記発現レベルを測定する工程は、対象体から分離された生物学的試料から前記miRNAと、PCA3及びMALAT1を含むlncRNA、TMPRSS2:ERGを含む融合遺伝子のmRNA又はそれらの組み合わせを抽出する工程;抽出されたmiRNAと、lncRNA、融合遺伝子のmRNA又はそれらの組み合わせからcDNAを合成する工程;合成したcDNAに特異的なプライマー対を用いてcDNAを増幅する工程;及び増幅されたcDNAを検出する工程;を含むことができる。
一実施形態において、前記生物学的試料は、被験者から得られた組織、細胞、尿、唾液、精液、全血、血漿及び/又は血清であってもよい。好ましくは、前記生物学的試料は、尿である。好ましくは、前記尿は、被験者の前立腺マッサージあるいはDRE(直腸内触診)の前後に採取することができる。
一実施形態において、前記発現レベルを比較する工程は、従来の統計的分析方法を用いて行うことができる。好ましくは、前記アルゴリズムは、LR(ロジスティック回帰)で行うことができる。LR(ロジスティック回帰)アルゴリズムを用いて多重バイオマーカーの発現レベルを分析する場合、前立腺癌の診断、予測の精度を向上することができる。アルゴリズムについては、後述する。
一実施形態において、前記発現レベルを比較する工程は、機械学習アルゴリズムを用いて行うことができる。好ましくは、前記アルゴリズムは、LR(ロジスティック回帰)、SVM(サポートベクターマシン)、ランダムフォレスト及び多層パーセプトロンからなる群から選択することができる。機械学習アルゴリズムを用いて多重バイオマーカーの発現レベルを分析する場合、前立腺癌の診断、予測の精度をさらに向上することができる。アルゴリズムについては、後述する。
一実施形態において、本発明の前立腺癌診断のための情報を提供する方法は、バイオマーカーの分析結果に加え、患者の非蛋白質臨床情報、すなわち、マーカー以外の臨床情報をさらに使用することができる。このような非蛋白質臨床情報は、例えば、患者の年齢、性別、体重、食習慣、体質量、超音波、コンピュータ断層撮影(CT)、磁気共鳴映像(MRI)、血管造影術、内視鏡的逆行性胆道膵管造影術、超音波内視鏡、腫瘍マーカー、及び/又は腹腔鏡検査を含む。
前記miRNAと、lncRNA、融合遺伝子のmRNA又はそれらの組み合わせの発現レベルを比較する工程は、LR(ロジスティック回帰)を用いて行うことができ、LOOCV(1つ抜き交差検証)値が0.65以上であり、AUC(曲線下面積)値が0.70以上であってもよい。
また、本発明は、前記前立腺癌診断用組成物を含む前立腺癌診断用キットに関するものである。
一実施形態において、本発明の前立腺癌診断用キットは、前立腺癌診断マーカーである、lncRNA、miRNA、及び/又は融合遺伝子のmRNAの発現レベルを測定することにより、被検体を対象として前立腺癌を診断するために使用することができる。前記miRNAの組み合わせについては、前述した通りであり、前記lncRNA、miRNA、及び/又は融合遺伝子のmRNAバイオマーカーは、2つ以上の組み合わせで使用することができ、それらの組み合わせについては、前述した通りである。好ましくは、前記組み合わせは、1個のlncRNA(PCA3)及び1個の融合遺伝子のmRNA(TMPRSS2:ERG)の1つ以上及び4個のmiRNA(hsa_miR_125b_5p、hsa_miR_141_5p、hsa_miR_17_3p及びhsa_miR_30c_5p)の1つ以上を含むことができる。従って、本発明の前立腺癌診断用キットは、1個のlncRNA(PCA3)及び1個の融合遺伝子のmRNA(TMPRSS2:ERG)の1つ以上及び4個のmiRNA(hsa_miR_125b_5p、hsa_miR_141_5p、hsa_miR_17_3p及びhsa_miR_30c_5p)の1つ以上を確認するためのポリヌクレオチド、プライマー、プローブ又は抗体だけでなく、分析方法に適した1つ又は複数の他の構成成分の組成物、溶液又は装置を含むことができる。
一実施形態において、本発明の前立腺癌診断用キットは、前立腺癌診断マーカーである、lncRNA、miRNA、及び/又は融合遺伝子のmRNAの発現レベルを測定することにより、被検体を対象として前立腺癌を診断するために使用することができる。前記miRNAの組み合わせについては、前述した通りであり、前記lncRNA、miRNA、及び/又は融合遺伝子のmRNAバイオマーカーは、2つ以上の組み合わせで使用することができ、それらの組み合わせについては、前述した通りである。好ましくは、前記組み合わせは、1個のlncRNA(PCA3)及び1個の融合遺伝子のmRNA(TMPRSS2:ERG)の1つ以上及び4個のmiRNA(hsa_miR_125b_5p、hsa_miR_141_5p、hsa_miR_17_3p及びhsa_miR_30c_5p)の1つ以上を含むことができる。従って、本発明の前立腺癌診断用キットは、1個のlncRNA(PCA3)及び1個の融合遺伝子のmRNA(TMPRSS2:ERG)の1つ以上及び4個のmiRNA(hsa_miR_125b_5p、hsa_miR_141_5p、hsa_miR_17_3p及びhsa_miR_30c_5p)の1つ以上を確認するためのポリヌクレオチド、プライマー、プローブ又は抗体だけでなく、分析方法に適した1つ又は複数の他の構成成分の組成物、溶液又は装置を含むことができる。
一実施形態において、本発明の前立腺癌診断用キットは、RT-PCRを行うために必要な必須要素を含むことができる。RT-PCRキットは、前記遺伝子に特異的な各プライマー対に加えて、試験管又は他の適切な容器、反応緩衝液(pH及びマグネシウム濃度は異なる)、デオキシヌクレオチド(dNTPs)、Taq-ポリメラーゼ及び逆転写酵素などの酵素、DNase、RNAse抑制剤、DEPC-水、滅菌数などを含むことができる。また、定量対照群として使用される遺伝子に特異的なプライマー対を含むことができる。
別の実施形態において、本発明の前立腺癌診断用キットは、遺伝子チップ分析法を行うために必要な必須要素を含むことができる。遺伝子チップ分析用キットは、遺伝子又はその断片に該当するcDNAがプローブとして付着している基板、及び蛍光標識プローブを作製するための試薬、製剤、酵素などを含むことができる。また、基板は、定量対照群遺伝子又はその断片に該当するcDNAを含むことができる。
別に実施形態において、本発明の前立腺癌診断用キットは、前記バイオマーカー(例えば、lncRNA(PCA3)、融合遺伝子のmRNA(TMPRSS2:ERG)及びmiRNA(hsa_miR_125b_5p、hsa_miR_141_5p、hsa_miR_17_3p及びhsa_miR_30c_5p))以外に従来公知の前立腺癌診断バイオマーカー遺伝子発現レベルを測定する製剤をさらに含むことができる。
このような本発明のバイオマーカーを特異的に認識する物質は、区画となっている容器に個別に分注して存在することができ、これにより、本発明は、本発明のマーカーを特異的に認識できる分子を区画されて含む装置及び/又は機構を提供する。
一実施形態において、本発明の前立腺癌診断用キットは、本発明の1つ以上のバイオマーカーを検出するための試薬、装置及び/又はアルゴリズムが組み込まれた情報処理手段をさらに含み、前記アルゴリズムにより、バイオマーカーの検出結果を前立腺癌の診断と関連付けることができる。前記関連は、前立腺癌の被検者、正常対照群又は特定タイプの前立腺癌を有する患者の前記1つ又は複数のマーカーの発現量を比較して、前記発現量の差に対するパターンを導出するように、前記アルゴリズムを訓練することを含む。
一実施形態において、前記アルゴリズムの訓練は、入力値として与えられるバイオマーカーの発現量を算出値として与えられる診断結果とマッピングするアルゴリズムを構築する工程;前記構築されたアルゴリズムを実行して、前記マーカー発現量と前立腺癌の診断又はその不在をマッピングする工程;及び前記構築実行されたアルゴリズムの入力値及びこれに応じて算出値を変化させながら前記アルゴリズムを実行して、最適なアルゴリズムマッピングアーキテクチャーが実現されるようにする工程;を含み、前記最適なアルゴリズムマッピングは、前記正常対照群又は特定の前立腺癌を有する患者のマーカー発現量と前記前立腺癌の被検者のマーカー発現量との数値を用いて有意な差を明らかにし、これを前立腺癌の診断又は不在に利用するものである。
本発明では、公知のアルゴリズムが使用でき、LR(ロジスティック回帰)、SVM(サポートベクターマシン)、ランダムフォレスト、多層パーセプトロンからなる群から選択されるが、これらに限定されない。
一実施形態において、本発明の前立腺癌診断用キットに用いられる生物学的試料は、前立腺癌組織、細胞、尿、唾液、精液、全血、血漿及び/又は血清であってもよく、好ましくは尿であり、比較分析のために、前立腺癌の判別が必要な患者由来の試料、正常対照群、又は前立腺癌対照群由来の試料を使用することができる。
また、本発明は、前記前立腺癌診断用組成物又はキットを用いて前立腺癌を診断する方法を提供する。
以下、実施例により本発明をより詳細に説明する。これらの実施例は、本発明をより具体的に説明するためのものであり、本発明の範囲がこれらの実施例に限定されるものではない。
以下、実施例により本発明をより詳細に説明する。これらの実施例は、本発明をより具体的に説明するためのものであり、本発明の範囲がこれらの実施例に限定されるものではない。
実施例
1.材料及び方法
・尿検体の準備
本実験では、ソウル牙山病院から入手した前立腺肥大症患者62人の尿検体と、前立腺癌患者101人の尿検体を利用した。前立腺癌及び前立腺肥大症患者で治療開始前の自己排尿の尿、直腸指診検査直後に排尿した尿及び手術患者の場合、手術当日にカテーテル挿入時に採取した尿を(尿の量は、30mL以上になるように尿検体収集)採取し、-80℃の超低温冷凍庫に保管した。
1.材料及び方法
・尿検体の準備
本実験では、ソウル牙山病院から入手した前立腺肥大症患者62人の尿検体と、前立腺癌患者101人の尿検体を利用した。前立腺癌及び前立腺肥大症患者で治療開始前の自己排尿の尿、直腸指診検査直後に排尿した尿及び手術患者の場合、手術当日にカテーテル挿入時に採取した尿を(尿の量は、30mL以上になるように尿検体収集)採取し、-80℃の超低温冷凍庫に保管した。
・尿検体からlncRNA、miRNA、及び融合遺伝子のmRNA抽出
尿検体からlncRNA、miRNA、及び融合遺伝子のmRNAを抽出するために、QIAGEN社製(cat no.55114)を使用した。500μLのプロテイナーゼKがピペットした50mLの遠心分離チューブに4mLの尿検体を加え、4mLのバッファーACL(必要に応じて担体RNA含む)及び1.0mLのバッファーATLを加え、30秒間パルスボルテックスして混合した。次いで、60℃で30分間培養し、チューブの溶解物に9.0mLのバッファーACBを加え、15~30秒間パルスボルテックスして完全に混合した。その後、溶解物-バッファーACB混合物をチューブ内で5分間、氷上で培養し、QIAamp MiniカラムをQIAvac 24 PlusのVacConnectorに挿入し、オープンタイプのQIAamp Miniカラムに20mLチューブエクステンダーを挿入した。前記溶解物-バッファーACB混合物をQIAamp Miniカラムのチューブエクステンダーに注意して塗布し、真空をオンにした後、すべての溶解物を、カラムを通して完全に吸入した後、真空ポンプを止めた。QIAamp Miniカラムに600μLのバッファーACW1を塗布し、カラムの蓋を開けたまま真空をオンにした後、すべてのバッファーACW1がQIAamp Miniカラムを通して抽出された後、真空ポンプをオフした。QIAamp Miniカラムに750μLのバッファーACW2を塗布し、カラムの蓋を開けたまま真空をオンにした後、すべてのバッファーACW2がQIAamp Miniカラムを通して抽出された後、真空ポンプをオフした。750μLのエタノール(96~100%)をQIAamp Miniカラムに塗布し、カラムの蓋を開けたまま真空ポンプをオンにした後、すべてのエタノールがスピンカラムを通して抽出された後、真空をオフした。QIAamp Miniカラムをきれいな2mLの収集チューブに入れ、3分間最大速度(20,000×g、14,000rpm)で遠心分離した。QIAamp Miniカラムをきれいな2mLの収集チューブに入れ、蓋を開け、アセンブリを56℃で10分間培養して、膜を完全に乾燥させた。きれいな1.5mLの溶出チューブにQIAamp Miniカラムを置き、前記2mLの収集チューブを廃棄し、20~150μLのバッファーAVEをQIAamp Mini膜の中央に注意して塗布し、蓋を閉め、室温で3分間培養した。最後に、マイクロ遠心分離機で最大速度(20,000×g、14,000rpm)で1分間遠心分離して、核酸を溶離した。
尿検体からlncRNA、miRNA、及び融合遺伝子のmRNAを抽出するために、QIAGEN社製(cat no.55114)を使用した。500μLのプロテイナーゼKがピペットした50mLの遠心分離チューブに4mLの尿検体を加え、4mLのバッファーACL(必要に応じて担体RNA含む)及び1.0mLのバッファーATLを加え、30秒間パルスボルテックスして混合した。次いで、60℃で30分間培養し、チューブの溶解物に9.0mLのバッファーACBを加え、15~30秒間パルスボルテックスして完全に混合した。その後、溶解物-バッファーACB混合物をチューブ内で5分間、氷上で培養し、QIAamp MiniカラムをQIAvac 24 PlusのVacConnectorに挿入し、オープンタイプのQIAamp Miniカラムに20mLチューブエクステンダーを挿入した。前記溶解物-バッファーACB混合物をQIAamp Miniカラムのチューブエクステンダーに注意して塗布し、真空をオンにした後、すべての溶解物を、カラムを通して完全に吸入した後、真空ポンプを止めた。QIAamp Miniカラムに600μLのバッファーACW1を塗布し、カラムの蓋を開けたまま真空をオンにした後、すべてのバッファーACW1がQIAamp Miniカラムを通して抽出された後、真空ポンプをオフした。QIAamp Miniカラムに750μLのバッファーACW2を塗布し、カラムの蓋を開けたまま真空をオンにした後、すべてのバッファーACW2がQIAamp Miniカラムを通して抽出された後、真空ポンプをオフした。750μLのエタノール(96~100%)をQIAamp Miniカラムに塗布し、カラムの蓋を開けたまま真空ポンプをオンにした後、すべてのエタノールがスピンカラムを通して抽出された後、真空をオフした。QIAamp Miniカラムをきれいな2mLの収集チューブに入れ、3分間最大速度(20,000×g、14,000rpm)で遠心分離した。QIAamp Miniカラムをきれいな2mLの収集チューブに入れ、蓋を開け、アセンブリを56℃で10分間培養して、膜を完全に乾燥させた。きれいな1.5mLの溶出チューブにQIAamp Miniカラムを置き、前記2mLの収集チューブを廃棄し、20~150μLのバッファーAVEをQIAamp Mini膜の中央に注意して塗布し、蓋を閉め、室温で3分間培養した。最後に、マイクロ遠心分離機で最大速度(20,000×g、14,000rpm)で1分間遠心分離して、核酸を溶離した。
尿検体からmiRNAを抽出するために、QIAGEN社製(cat no.55114)を利用した。400μLのプロテイナーゼKがピペットした50mLの遠心分離チューブに3mLの尿検体を加え、3.2mLのバッファーACL(担体RNAなし)及び1.0mLのバッファーATLを加え、30秒間パルスボルテックスして混合した。次いで、60℃で30分間培養し、チューブの溶解物に9.0mLのバッファーACB及び7.0mLのイソプロパノールを加え、15~30秒間パルスボルテックスして完全に混合した。その後、溶解物-バッファーACB混合物をチューブ内で5分間、氷上で培養し、QIAamp MiniカラムをQIAvac 24 PlusのVacConnectorに挿入し、オープンタイプのQIAamp Miniカラムに20mLチューブエクステンダーを挿入した。前記溶解物-バッファーACB混合物をQIAamp Miniカラムのチューブエクステンダーに注意して塗布し、真空をオンにした後、すべての溶解物がカラムを通して完全に吸入された後、真空ポンプをオフした。QIAamp Miniカラムに600μLのバッファーACW1を塗布し、カラムの蓋を開けたまま真空をオンにした後、すべてのバッファーACW1がQIAamp Miniカラムを通して抽出された後、真空ポンプをオフした。QIAamp Miniカラムに750μLのバッファーACW2を塗布し、カラムの蓋を開けたまま真空をオンにした後、すべてのバッファーACW2がQIAamp Miniカラムを通して抽出された後、真空ポンプをオフした。750μLのエタノール(96~100%)をQIAamp Miniカラムに塗布し、カラムの蓋を開けたまま真空ポンプをオンにした後、すべてのエタノールがスピンカラムを通して抽出された後、真空をオフした。QIAamp Miniカラムをきれいな2mLの収集チューブに入れ、3分間最大速度(20,000×g、14,000rpm)で遠心分離した。QIAamp Miniカラムをきれいな2mLの収集チューブに入れ、蓋を開け、アセンブリを56℃で10分間培養して、膜を完全に乾燥させた。きれいな1.5mLの溶出チューブにQIAamp Miniカラムを置き、前記2mLの収集チューブを廃棄し、20~150μLのバッファーAVEをQIAamp Mini膜の中央に注意して塗布し、蓋を閉め、室温で3分間培養した。最後に、マイクロ遠心分離機で最大速度(20,000×g、14,000rpm)で1分間遠心分離して、核酸を溶離した。
・尿検体から抽出されたlncRNA、miRNA、及び融合遺伝子のmRNAのcDNA合成
尿検体から抽出されたlncRNA、miRNA、及び融合遺伝子のmRNAからcDNAを合成するために、QIAGEN社製(cat no.235311)を用いた。各テンプレートRNAを氷上で解凍し、gDNA Wipeout Buffer、Quantiscript逆転写酵素、Quantiscript RT Buffer、RT Primer Mix及びRNaseがない水(RNase-free water)を室温(15~25℃)で解凍した。下記表1に従ってゲノムDNA除去反応を氷上で準備し、混合した後、氷上で保管した。以後、42℃で2分間培養した後、直ぐに氷上に置き、下記表2に従って逆転写マスターミックスを氷上で製造した。逆転写マスターミックスを含む各チューブに、前記テンプレートRNA(14μL)を加え、42℃で15分間培養した後、95℃で3分間培養して、Quantiscript逆転写酵素を非活性化した。各完了された逆転写反応の分取量をリアルタイムPCRミックスに加えた。
尿検体から抽出されたlncRNA、miRNA、及び融合遺伝子のmRNAからcDNAを合成するために、QIAGEN社製(cat no.235311)を用いた。各テンプレートRNAを氷上で解凍し、gDNA Wipeout Buffer、Quantiscript逆転写酵素、Quantiscript RT Buffer、RT Primer Mix及びRNaseがない水(RNase-free water)を室温(15~25℃)で解凍した。下記表1に従ってゲノムDNA除去反応を氷上で準備し、混合した後、氷上で保管した。以後、42℃で2分間培養した後、直ぐに氷上に置き、下記表2に従って逆転写マスターミックスを氷上で製造した。逆転写マスターミックスを含む各チューブに、前記テンプレートRNA(14μL)を加え、42℃で15分間培養した後、95℃で3分間培養して、Quantiscript逆転写酵素を非活性化した。各完了された逆転写反応の分取量をリアルタイムPCRミックスに加えた。
尿検体から抽出されたmiRNAからcDNAを合成するために、QIAGEN社製(cat no.339340)を用いた。ヌクレアーゼがない水を使用し、各テンプレートRNAサンプルを5ng/μLで希釈し、下記表3に従って逆転写反応を氷上で準備し、混合した後、氷上で保管した。42℃で60分間培養した後、95℃で5分間培養し、逆転写酵素を加熱非活性化した後、直ぐに4℃に冷却した。以後、miRNA PCRアッセイを行った。
・定量的ポリメラーゼ連鎖反応(qPCR)
各マーカーの発現を測定するために、ストラタジーンMX3000P(Agilent Technologies社製、米国)を使用して、定量的PCR(qPCR)を3回行った。lncRNA、miRNA、及び融合遺伝子のmRNA定量化のために、以前の工程で合成されたcDNAはPCRテンプレートとして使用された。増幅及び検出には、ORA(登録商標)qPCR Green ROXL Mix、2X(highQu社製、ドイツ)が使用された。各チューブの最終容積は、ORA(登録商標)qPCR Green ROXL Mix、2X(5.0μL)、予め希釈されたcDNA(4.0μL)、予め混合されたプライマーセット(1μL)で構成された10μLである。lncRNA及び融合遺伝子のmRNAの発現レベルを測定するために、cDNA及びlncRNA及び融合遺伝子のmRNA用プライマーの濃度は、最終容積で160~200ng、500nMであった。qPCR循環条件は以下の通りである:95℃で15分間初期変性(denaturation)後、95℃で15秒間テンプレート変性及び60℃で60秒間延伸(elongation)を50周期、そして60~95℃で1周期の溶融曲線分析を最後に行った。miRNA発現レベルを測定するために、cDNAの濃度は最終容積で12~16ngであった。miRCURY LNA(登録商標)miRNA PCRアッセイ(QIAGEN社製、ドイツ)は、miRNA検出のためのプライマーとして使用した。使用前に220μLのヌクレアーゼのない水で予め希釈された。qPCR循環条件は以下の通りである:95℃で2分間初期変性後、95℃で10秒間50周期のテンプレート変性、56℃で60秒間伸張、56~95℃で1周期の溶融曲線分析を最後に行った。qPCRで測定されたロー工データ(Raw data)は、MxProソフトウェアで分析した。すべてのプライマーセットは、以下に示されている。
各マーカーの発現を測定するために、ストラタジーンMX3000P(Agilent Technologies社製、米国)を使用して、定量的PCR(qPCR)を3回行った。lncRNA、miRNA、及び融合遺伝子のmRNA定量化のために、以前の工程で合成されたcDNAはPCRテンプレートとして使用された。増幅及び検出には、ORA(登録商標)qPCR Green ROXL Mix、2X(highQu社製、ドイツ)が使用された。各チューブの最終容積は、ORA(登録商標)qPCR Green ROXL Mix、2X(5.0μL)、予め希釈されたcDNA(4.0μL)、予め混合されたプライマーセット(1μL)で構成された10μLである。lncRNA及び融合遺伝子のmRNAの発現レベルを測定するために、cDNA及びlncRNA及び融合遺伝子のmRNA用プライマーの濃度は、最終容積で160~200ng、500nMであった。qPCR循環条件は以下の通りである:95℃で15分間初期変性(denaturation)後、95℃で15秒間テンプレート変性及び60℃で60秒間延伸(elongation)を50周期、そして60~95℃で1周期の溶融曲線分析を最後に行った。miRNA発現レベルを測定するために、cDNAの濃度は最終容積で12~16ngであった。miRCURY LNA(登録商標)miRNA PCRアッセイ(QIAGEN社製、ドイツ)は、miRNA検出のためのプライマーとして使用した。使用前に220μLのヌクレアーゼのない水で予め希釈された。qPCR循環条件は以下の通りである:95℃で2分間初期変性後、95℃で10秒間50周期のテンプレート変性、56℃で60秒間伸張、56~95℃で1周期の溶融曲線分析を最後に行った。qPCRで測定されたロー工データ(Raw data)は、MxProソフトウェアで分析した。すべてのプライマーセットは、以下に示されている。
・単一バイオマーカー分析
lncRNA、miRNA及び融合遺伝子のmRNAバイオマーカーの診断能力を調べるために、163個の尿cDNAサンプル(62個の良性前立腺肥大症(BPH)サンプル及び101個の前立腺癌(PCa)サンプル)中の17個のmiRNAと2個のlncRNA及び1個の融合遺伝子のmRNAの発現レベルをqPCRによって測定した。すべてのバイオマーカーの発現プロファイルを18s-rRNA及びβ-アクチンで正規化した。良性前立腺肥大症(BPH)と前立腺癌(PCa)との間の遺伝子発現傾向は図2に示した。PCA3、MALAT1に対するlncRNA及びTMPRSS2:ERGに対する融合遺伝子のmRNAバイオマーカーは、前立腺癌と診断された患者において上向き調節を示す。17個のmiRNAに対するすべてのmiRNAバイオマーカーは、前立腺癌において下向き調節されることが検出された。具体的に、各バイオマーカーの診断能力をROC曲線で評価した。lncRNA及びmiRNAにおいて、それぞれ0.79及び0.85の最も高いAUC値が現示された(図3及び表6~8)。
lncRNA、miRNA及び融合遺伝子のmRNAバイオマーカーの診断能力を調べるために、163個の尿cDNAサンプル(62個の良性前立腺肥大症(BPH)サンプル及び101個の前立腺癌(PCa)サンプル)中の17個のmiRNAと2個のlncRNA及び1個の融合遺伝子のmRNAの発現レベルをqPCRによって測定した。すべてのバイオマーカーの発現プロファイルを18s-rRNA及びβ-アクチンで正規化した。良性前立腺肥大症(BPH)と前立腺癌(PCa)との間の遺伝子発現傾向は図2に示した。PCA3、MALAT1に対するlncRNA及びTMPRSS2:ERGに対する融合遺伝子のmRNAバイオマーカーは、前立腺癌と診断された患者において上向き調節を示す。17個のmiRNAに対するすべてのmiRNAバイオマーカーは、前立腺癌において下向き調節されることが検出された。具体的に、各バイオマーカーの診断能力をROC曲線で評価した。lncRNA及びmiRNAにおいて、それぞれ0.79及び0.85の最も高いAUC値が現示された(図3及び表6~8)。
・従来の統計分析方法及び機械学習前のデータ前処理
以前の単一バイオマーカー分析に基づいて、lncRNA、miRNA及び融合遺伝子のmRNAに対するバイオマーカーの正規化された発現(-ΔCt)を併合した。正規化された発現(-ΔCt)を併合する前に、データ前処理を行った:まず、同じlncRNA又は融合遺伝子のmRNAを標的とするバイオマーカーのうち、AUCを比較して、lncRNA又は融合遺伝子のmRNAバイオマーカープライマー(PCA3_4、TMPRSS2:ERG_R3及びMALAT1_6)を選択した。ただし、TMPRSS2:ERG融合遺伝子の場合、最も高いAUCを示したバイオマーカー(TMPRSS2:ERG融合_R6)でNoCTが頻繁に観測され(50%以上)、次善(TMPRSS2:ERG融合_R3、No Ct ratio5%)を選択した。次に、データの不均衡を防止するために、同じバイオマーカーでブランク正規化された発現を最小正規化発現で処理した。満たされたデータセットを機械学習に適用する前に、最小-最大スケーリングが行われた。
以前の単一バイオマーカー分析に基づいて、lncRNA、miRNA及び融合遺伝子のmRNAに対するバイオマーカーの正規化された発現(-ΔCt)を併合した。正規化された発現(-ΔCt)を併合する前に、データ前処理を行った:まず、同じlncRNA又は融合遺伝子のmRNAを標的とするバイオマーカーのうち、AUCを比較して、lncRNA又は融合遺伝子のmRNAバイオマーカープライマー(PCA3_4、TMPRSS2:ERG_R3及びMALAT1_6)を選択した。ただし、TMPRSS2:ERG融合遺伝子の場合、最も高いAUCを示したバイオマーカー(TMPRSS2:ERG融合_R6)でNoCTが頻繁に観測され(50%以上)、次善(TMPRSS2:ERG融合_R3、No Ct ratio5%)を選択した。次に、データの不均衡を防止するために、同じバイオマーカーでブランク正規化された発現を最小正規化発現で処理した。満たされたデータセットを機械学習に適用する前に、最小-最大スケーリングが行われた。
・バイオマーカーの選択
前立腺癌/良性前立腺肥大症(PCa/BPH)分類器の性能を改善し、単一バイオマーカーの潜在的動揺(perturbation)に対するロバストネス(robustness)を提供するために、様々な機械学習アルゴリズムによる多重バイオマーカーベースの前立腺癌/良性前立腺肥大症(PCa/BPH)分類器を目指した。より優れた性能を得るために、最適なバイオマーカー組み合わせを見つけるために、RFECV(相互検証による再帰的特徴除去)アルゴリズムを適用した。RFECVのパラメータとして、LOO(Leave-One-Out)及びランダムフォレスト(RF)が使用された。LOOは、群間の偏向を最小限に抑えるのに適しており、RFはさらなる分析において特徴重要度を提供することができる。RFECVにより、特徴重要度が低い特徴を除去しながら、特徴の数に応じたモデルの性能を計算することができる。すなわち、RFECVの結果極値(local maximum)が形成される特徴(feature)の個数を使用する際に最も優れた性能を予想することができる。これらのRFECVの分析の結果、4つの特徴が使用されたときに極値が形成された(図4A-4B)。選択された4つの特徴は、hsa_miR_125b_5p、hsa_miR_141_5p、hsa_miR_17_3p及びhsa_miR_30c_5pである。特徴重要度の高い4個のmiRNA組み合わせを用いて以降の機械学習ベースの研究を行った。また、選択された4個のmiRNAsに、既に広く研究された2つの追加特徴であるPCA3_4とTMPRSS2:ERG融合_R3を含む研究もさらに行った。前記PCA3_4及びTMPRSS2:ERGも高い特徴重要度を示した。この特徴選択プロセスにより、4個のmiRNA組み合わせ(4個の特徴組み合わせ)、そして、ここに1個のlncRNA及び1個の融合遺伝子のmRNAを追加した組み合わせ(6個の特徴組み合わせ)が機械学習(ML)のために選択された。また、このように選択された4個のmiRNA組み合わせ、そして、ここに1個のlncRNA及び1個の融合遺伝子のmRNAを追加した組み合わせが従来の統計分析方法のために使用された。前記方法は、バイオマーカーを選択する方法の例であり、これに限定されない。
前立腺癌/良性前立腺肥大症(PCa/BPH)分類器の性能を改善し、単一バイオマーカーの潜在的動揺(perturbation)に対するロバストネス(robustness)を提供するために、様々な機械学習アルゴリズムによる多重バイオマーカーベースの前立腺癌/良性前立腺肥大症(PCa/BPH)分類器を目指した。より優れた性能を得るために、最適なバイオマーカー組み合わせを見つけるために、RFECV(相互検証による再帰的特徴除去)アルゴリズムを適用した。RFECVのパラメータとして、LOO(Leave-One-Out)及びランダムフォレスト(RF)が使用された。LOOは、群間の偏向を最小限に抑えるのに適しており、RFはさらなる分析において特徴重要度を提供することができる。RFECVにより、特徴重要度が低い特徴を除去しながら、特徴の数に応じたモデルの性能を計算することができる。すなわち、RFECVの結果極値(local maximum)が形成される特徴(feature)の個数を使用する際に最も優れた性能を予想することができる。これらのRFECVの分析の結果、4つの特徴が使用されたときに極値が形成された(図4A-4B)。選択された4つの特徴は、hsa_miR_125b_5p、hsa_miR_141_5p、hsa_miR_17_3p及びhsa_miR_30c_5pである。特徴重要度の高い4個のmiRNA組み合わせを用いて以降の機械学習ベースの研究を行った。また、選択された4個のmiRNAsに、既に広く研究された2つの追加特徴であるPCA3_4とTMPRSS2:ERG融合_R3を含む研究もさらに行った。前記PCA3_4及びTMPRSS2:ERGも高い特徴重要度を示した。この特徴選択プロセスにより、4個のmiRNA組み合わせ(4個の特徴組み合わせ)、そして、ここに1個のlncRNA及び1個の融合遺伝子のmRNAを追加した組み合わせ(6個の特徴組み合わせ)が機械学習(ML)のために選択された。また、このように選択された4個のmiRNA組み合わせ、そして、ここに1個のlncRNA及び1個の融合遺伝子のmRNAを追加した組み合わせが従来の統計分析方法のために使用された。前記方法は、バイオマーカーを選択する方法の例であり、これに限定されない。
・単一バイオマーカーに基づいた機械学習
多重バイオマーカー分析のための制御を提供するために、MLアルゴリズムを用いて単一バイオマーカーベース診断分類器を開発した。まず、最小-最大スケーリングされたデータを訓練データセット(75%)及びテストデータセット(25%)にランダム分割した。訓練-テストデータセットの分割後、訓練データセットを用いてSVM(サポートベクターマシン)、RF(ランダムフォレスト)及びLR(ロジスティック回帰)を訓練した(図2)。前立腺癌(PCa)と良性前立腺肥大症(BPH)との間の数不均衡により3つのアルゴリズムのすべてでクラス加重値補償(class weight compensation)が行われた。訓練データセット学習後、すべてのバイオマーカー及びMLアルゴリズムに対してROC曲線、AUC及びLOOCVスコアが生成された(図5A~5C、図6A~6E)。
多重バイオマーカー分析のための制御を提供するために、MLアルゴリズムを用いて単一バイオマーカーベース診断分類器を開発した。まず、最小-最大スケーリングされたデータを訓練データセット(75%)及びテストデータセット(25%)にランダム分割した。訓練-テストデータセットの分割後、訓練データセットを用いてSVM(サポートベクターマシン)、RF(ランダムフォレスト)及びLR(ロジスティック回帰)を訓練した(図2)。前立腺癌(PCa)と良性前立腺肥大症(BPH)との間の数不均衡により3つのアルゴリズムのすべてでクラス加重値補償(class weight compensation)が行われた。訓練データセット学習後、すべてのバイオマーカー及びMLアルゴリズムに対してROC曲線、AUC及びLOOCVスコアが生成された(図5A~5C、図6A~6E)。
バイオマーカーによって、各機械学習アルゴリズムはAUC及びLOOCVスコアで大きな違いを示した。SVM、RF、LRの順に、平均AUCは0.71±0.08(標準偏差)、0.66±0.12、0.80±0.10であり、平均LOOCVスコアは0.727±0.066、0.658±0.080、0.711±0.071であった。この結果によると、SVM及びLRは、RFよりも単一バイオマーカーベースML分類に適している。しかし、AUC及びLOOCVスコアの全般的な傾向は、MLアルゴリズムよりもバイオマーカーの影響を大きく受けると考えられる。前記結果は、単一バイオマーカーに基づくため、多重バイオマーカーで同じ分析が適用されたときに、バイオマーカー間の組み合わせシナジーによってより優れた成績が期待される。
・多重バイオマーカーに基づいた機械学習
多重バイオマーカーベースの前立腺癌/良性前立腺肥大症(PCa/BPH)分類器は、性能及びロバストネス(robustness)の改善を目標に作製された。データ前処理及び機械学習アルゴリズム学習は、単一バイオマーカーベース分類器と同じように行われ、前述の目標を達成するために、各バイオマーカーの組み合わせとアルゴリズムごとにGridSearchCVアルゴリズムによりパラメータ最適化を行った。
多重バイオマーカーベースの前立腺癌/良性前立腺肥大症(PCa/BPH)分類器は、性能及びロバストネス(robustness)の改善を目標に作製された。データ前処理及び機械学習アルゴリズム学習は、単一バイオマーカーベース分類器と同じように行われ、前述の目標を達成するために、各バイオマーカーの組み合わせとアルゴリズムごとにGridSearchCVアルゴリズムによりパラメータ最適化を行った。
機械学習の結果、4個のmiRNA組み合わせの場合、SVM、RF、LRの順に、AUCは0.96、0.99、0.96であり(図7C~7E)、LOOCVスコアは0.847、0.865、0.834であった(図7A)。特徴重要度(Feature importance)の場合、hsa_miR_125b_5pが33.1%、hsa_miR_30c_5pが28.8%、hsa_miR_17_3pが20.9%、そして、hsa_miR_141_5pが17.2%であった(図8B)。PSAレベル3~10の患者群を対象とした分析では、SVM、RF、LRの順に、AUCが0.94、0.99、0.91、LOOCVスコアが0.885、0.896、0.854であった。LOOCV(1つ抜き交差検証)は、全体n個のサンプルの中から1個のサンプルおみを除外させてn-1個のサンプルを訓練セットとするモデリングを通じて、合計n個のモデルを検証する方法であり、これにより、サンプルによるランダム性を除去することができ、予測の精度を高めることができる。
6個のバイオマーカー組み合わせの場合、SVM、RF、LRの順に、AUCは0.96、0.99、0.96であり(図9C~9E)、LOOCVスコアは0.865、0.871、0.834であった(図9A)。特徴重要度の場合、hsa_miR_125b_5pが20.2%、hsa_miR_30c_5pが20.0%、hsa_miR_141_5pが18.2%、hsa_miR_17_3pが15.5%、TMPRSS2:ERG融合_R3が13.3%、そして、PCA3_4が12.8%であった(図10B)。特徴重要度の場合、RFECVで予測されたようにmiRNAsが過半数以上の割合(73.9%)を占めることが分かった。PSAレベル3~10の患者群を対象とした分析では、SVM、RF、LRの順に、AUCが0.94、1.00、0.93、LOOCVスコアが0.865、0.896、0.844であることが確認された。
前記結果を総合すると、本研究で提案したmiRNA組み合わせやlncRNA、融合遺伝子mRNA及びmiRNAを動員した多重バイオマーカーベース機械学習分類器は、従来のmiRNA、lncRNA、融合遺伝子mRNA、PSAを動員した検査に比べて高い診断性能が期待される。特に、RV学習の結果、各miRNAsの重要度が比較的同等であったことから、多重バイオマーカー分類器で観察された大幅の性能向上は特性間の相乗効果に基づいていると考えられる。本研究で提案した多重バイオマーカーベース機械学習分類器は、PSAテストのグレーゾーン(PSAレベル3~10)に該当する患者群も効果的に分類したため、既存の診断法を補完する役割としても広く活用できる。さらに、単純な2進法的分類を越えた確率の提供により、その後の診断及び治療仮定で患者個別化治療に寄与することができる。本多重バイオマーカー分類器は、最新の機械学習技法を利用するため、今後、他のアッセイ及びバイオマーカーと組合わせて多方面に拡張されることが期待される。
・多重バイオマーカーに基づいた従来の統計分析方法
多重バイオマーカーに基づいた機械学習方法とは別に、従来の統計分析方法として多重バイオマーカーベース診断分類器を開発した。多重バイオマーカーに基づいた統計分析方法のデータ前処理、統計分析アルゴリズム、パラメータ、及び評価方法は、単一バイオマーカーに基づいた機械学習の場合と同じである。従来の統計分析方法の1つのLR(ロジスティック回帰)を使用すると、多重バイオマーカーの組み合わせによって値が変わるが、AUCの最大値は0.90で、LOOCVスコアの最大値は0.88である。機械学習による単一バイオマーカー分類器と比較して、AUC及びLOOCVスコアの大幅な改善が観察された。多重バイオマーカーに基づいた機械学習の場合と同様に、多重バイオマーカーに基づいた従来の統計分析方法を使用する場合、単一バイオマーカーに基づいた機械学習方法と比較して性能及びロバストネスを改善させることができる。バイオマーカーを選定した方法は前記と同様であるが、従来の統計分析方法であるロジスティック回帰では、選択された4個のmiRNA組み合わせと前記4個のmiRNA、1個のlncRNA及び1個の融合遺伝子のmRNAだけでなく、この群で構成できるすべての組み合わせを使用することができる。この群で構成できるすべての多重バイオマーカーの組み合わせを使用して、それぞれのAUC及びLOOCVスコアを比較し、AUCとLOOCVの値によりランク付けし、AUCとLOOCVの順位を加算してその合計が最も低い、つまりその和の順位が最も高い組み合わせから次上位組み合わせを導出して使用することができる。組み合わせを構成する方法又は組み合わせの数は、分類器の性能及びロバストネスの重要度を反映する方法により変わり、最終適用されるバイオマーカーの組み合わせは、順位の高い次上位組み合わせから選択することができるが、これに限定されない。
多重バイオマーカーに基づいた機械学習方法とは別に、従来の統計分析方法として多重バイオマーカーベース診断分類器を開発した。多重バイオマーカーに基づいた統計分析方法のデータ前処理、統計分析アルゴリズム、パラメータ、及び評価方法は、単一バイオマーカーに基づいた機械学習の場合と同じである。従来の統計分析方法の1つのLR(ロジスティック回帰)を使用すると、多重バイオマーカーの組み合わせによって値が変わるが、AUCの最大値は0.90で、LOOCVスコアの最大値は0.88である。機械学習による単一バイオマーカー分類器と比較して、AUC及びLOOCVスコアの大幅な改善が観察された。多重バイオマーカーに基づいた機械学習の場合と同様に、多重バイオマーカーに基づいた従来の統計分析方法を使用する場合、単一バイオマーカーに基づいた機械学習方法と比較して性能及びロバストネスを改善させることができる。バイオマーカーを選定した方法は前記と同様であるが、従来の統計分析方法であるロジスティック回帰では、選択された4個のmiRNA組み合わせと前記4個のmiRNA、1個のlncRNA及び1個の融合遺伝子のmRNAだけでなく、この群で構成できるすべての組み合わせを使用することができる。この群で構成できるすべての多重バイオマーカーの組み合わせを使用して、それぞれのAUC及びLOOCVスコアを比較し、AUCとLOOCVの値によりランク付けし、AUCとLOOCVの順位を加算してその合計が最も低い、つまりその和の順位が最も高い組み合わせから次上位組み合わせを導出して使用することができる。組み合わせを構成する方法又は組み合わせの数は、分類器の性能及びロバストネスの重要度を反映する方法により変わり、最終適用されるバイオマーカーの組み合わせは、順位の高い次上位組み合わせから選択することができるが、これに限定されない。
ロジスティック回帰を通じて前立腺癌患者と前立腺肥大症患者を区別するためのスコアを計算することができ、スコアを計算する方法は以下のである。
1)このバイオマーカーについて、実験群の最大発現量は1、最小発現量は0で正規化する。
1)このバイオマーカーについて、実験群の最大発現量は1、最小発現量は0で正規化する。
2)これに対する決定関数D(X)を計算し、次のように求める。
D(X)=bias+sum(係数×正規化値)
3)決定関数値をもとに、シグモイド関数F(X)を計算して最終スコアを求める。
D(X)=bias+sum(係数×正規化値)
3)決定関数値をもとに、シグモイド関数F(X)を計算して最終スコアを求める。
F(X)=1/(1+exp(-D(X)))
4)最終スコアを閾値0.5を基準に評価し、スコア0.5以上は前立腺癌、0.5未満は前立腺肥大症と判定する。
4)最終スコアを閾値0.5を基準に評価し、スコア0.5以上は前立腺癌、0.5未満は前立腺肥大症と判定する。
ロジスティック回帰技法を通じて良い性能を示したバイオマーカーグンの組み合わせと、各バイオマーカーに使用されたバイアス(bias)、係数(coefficient)及び組み合わせによるAUC及び1つ抜き交差検証値を求めて比較することができる。
・統計分析及び機械学習のための道具
すべての統計的分析は、R(バージョン4.0.2)及びPython(バージョン3.9)で行われた。
すべての統計的分析は、R(バージョン4.0.2)及びPython(バージョン3.9)で行われた。
(1)データ前処理(データブランク及び正規化)
ローデータ(Raw Data)の前処理は、R(バージョン4.0.2)のdplyr、reshape2及びtidyrパッケージを用いて行われた。ローデータのNo Ct値はブランクとして処理し、lncRNA、miRNA及び融合遺伝子のmRNAの発現レベルはβと18s-rRNAの平均で正規化された。正規化は次のように行われ:
正規化発現(-ΔCt)=(Ct β-アクチン+Ct 18s-rRNA)/2-Ct標的遺伝子
正規化後、ブランク正規化発現は、同じバイオマーカーの最小正規化発現として処理された。
ローデータ(Raw Data)の前処理は、R(バージョン4.0.2)のdplyr、reshape2及びtidyrパッケージを用いて行われた。ローデータのNo Ct値はブランクとして処理し、lncRNA、miRNA及び融合遺伝子のmRNAの発現レベルはβと18s-rRNAの平均で正規化された。正規化は次のように行われ:
正規化発現(-ΔCt)=(Ct β-アクチン+Ct 18s-rRNA)/2-Ct標的遺伝子
正規化後、ブランク正規化発現は、同じバイオマーカーの最小正規化発現として処理された。
(2)単一マーカー分析
単一マーカー分析は、R(バージョン4.0.2)のggplot2及びplotROCパッケージを用いて行われた。単一マーカー分析のために、lncRNA、miRNA及び融合遺伝子のmRNAに対するバイオマーカーの以前に処理された正規化発現(-ΔCt)を使用した。2つの群(良性前立腺肥大症(BPH)と前立腺癌(PCa))と間の遺伝子発現傾向を確認するために、各バイオマーカーの正規発現(-ΔCt)をボックスプロットで視角化した。また、各バイオマーカーの差等能力(differential ability)を評価するためにROC曲線分析を行った。
単一マーカー分析は、R(バージョン4.0.2)のggplot2及びplotROCパッケージを用いて行われた。単一マーカー分析のために、lncRNA、miRNA及び融合遺伝子のmRNAに対するバイオマーカーの以前に処理された正規化発現(-ΔCt)を使用した。2つの群(良性前立腺肥大症(BPH)と前立腺癌(PCa))と間の遺伝子発現傾向を確認するために、各バイオマーカーの正規発現(-ΔCt)をボックスプロットで視角化した。また、各バイオマーカーの差等能力(differential ability)を評価するためにROC曲線分析を行った。
・機械学習アルゴリズムによる前立腺癌/良性前立腺肥大症(PCa/BPH)分類器の構成
単一バイオマーカー又は多重バイオマーカーに基づいた前立腺癌/良性前立腺肥大症(PCa/BPH)分類器を生成するために、Python3.8.5を使用する個別化機械学習ソフトウェアをLinux上で実行した。ソフトウェアには、Scikit Learn、Scikit Plot及びPandaのようなオープンライブラリが含まれている。サポートベクターマシンの場合、Scikit LearnのC-SVC(サポートベクトル分類)が使用された。放射基底関数をカーネルとして使用し、クラス間の数の違いを考慮してバランスクラス加重値(Balanced Class Weight)を使用した。RF(ランダムフォレスト)の場合、Scikit Learnのランダムフォレスト分類器が使用さ、モデルはバランスの取れた(balanced)クラス加重値を有する100個の意思決定木(decision tree)で構成される。最後に、ロジスティック回帰もScikit Learnから取得し、バランスの取れたクラス加重値を除くすべてのパラメータが基本設定に従った。
単一バイオマーカー又は多重バイオマーカーに基づいた前立腺癌/良性前立腺肥大症(PCa/BPH)分類器を生成するために、Python3.8.5を使用する個別化機械学習ソフトウェアをLinux上で実行した。ソフトウェアには、Scikit Learn、Scikit Plot及びPandaのようなオープンライブラリが含まれている。サポートベクターマシンの場合、Scikit LearnのC-SVC(サポートベクトル分類)が使用された。放射基底関数をカーネルとして使用し、クラス間の数の違いを考慮してバランスクラス加重値(Balanced Class Weight)を使用した。RF(ランダムフォレスト)の場合、Scikit Learnのランダムフォレスト分類器が使用さ、モデルはバランスの取れた(balanced)クラス加重値を有する100個の意思決定木(decision tree)で構成される。最後に、ロジスティック回帰もScikit Learnから取得し、バランスの取れたクラス加重値を除くすべてのパラメータが基本設定に従った。
機械学習アルゴリズムにqPCRデータを導入する前に、データ前処理が行われた。まず、lncRNA、miRNA又は融合遺伝子のmRNAの量が非常に少ないことを前提に、前述のように、非検出CT値をバイオマーカーの最小値で埋めた。最少-最大スケーラーは、0と1の間のCT値を正規化するために、満たされたqPCRデータに適用された。正規化データは、ランダムに訓練データセット(75%)とテストデータセット(25%)に分けられた。各機械学習アルゴリズムは、訓練データセットで訓練され、モデル精度、f1スコア、受信者動作特性曲線(ROC曲線)、AUC、及び確率はテストデータセットを使用して評価された。過適合の問題を確認するために、交差検証も行った。特に、潜在的な群偏向を避けるために、LOO(Leave-One-Out)アルゴリズムを適用した。
2.結果
現在まで、前立腺癌特異的バイオマーカーに関する研究がたくさん進行されてきたが、局所前立腺癌の場合、体液でのバイオマーカー検出の感度と特異性は非常に低いことが報告され、PSA(前立腺特異抗原)は、前立腺癌を検出するのに多く使用されているが、癌特異性マーカーではないので、しばしば誤診される場合が発生することになり、正確な検診のために前立腺組生検を施行する場合、患者の苦痛が激しく、費用も多くかかるため、前立腺癌の早期発見のための非侵襲的バイオマーカーが必要な実情であった。
現在まで、前立腺癌特異的バイオマーカーに関する研究がたくさん進行されてきたが、局所前立腺癌の場合、体液でのバイオマーカー検出の感度と特異性は非常に低いことが報告され、PSA(前立腺特異抗原)は、前立腺癌を検出するのに多く使用されているが、癌特異性マーカーではないので、しばしば誤診される場合が発生することになり、正確な検診のために前立腺組生検を施行する場合、患者の苦痛が激しく、費用も多くかかるため、前立腺癌の早期発見のための非侵襲的バイオマーカーが必要な実情であった。
そこで、本発明の前立腺癌lncRNA、miRNA、及び融合遺伝子のmRNAマーカーの有用性を検証するために、前立腺肥大症対照群及び前立腺癌でlncRNA、miRNA、及び融合遺伝子のmRNAの発現レベルを比較した結果、図2に示すように、ボックスプロットは、全体前立腺癌の尿検体でlncRNA及びmRNAマーカーの両方が上向き発現され、miRNAマーカーの両方が下向き発現されたことが示された。
また、RFECVアルゴリズムを介してランダムフォレスト分析によって導き出された4個のmiRNA(hsa_miR_125b_5p、hsa_miR_141_5p、hsa_miR_17_3p及びhsa_miR_30c_5p)の組み合わせが特に検出マーカーとして有用であることが立証され、前記4個のmiRNA組み合わせに1個のlncRNA(PCA3)及び1個の融合遺伝子のmRNA(TMPRSS2-ERG)を追加した組み合わせも検出マーカーとして有用であることが立証された。
以上の本発明の説明は例示的なものであり、本発明が属する技術分野の当業者であれば、本発明の技術思想や本質的な特徴を変更することなく、他の具体的な形態に容易に変形可能であることを理解できるであろう。従って、上記で説明した実施例及び実験例は、すべての面で例示的なものであり、限定的ではないものと理解されるべきである。
miRNA:Micro RNA
PCa:前立腺癌
BPH:前立腺肥大症
PSA:前立腺特異抗原
PCa:前立腺癌
BPH:前立腺肥大症
PSA:前立腺特異抗原
Claims (24)
- miRNAの発現レベルを測定することができる製剤を含む前立腺癌診断用組成物であって、
前記miRNAが、hsa_miR_125b_5p、hsa_miR_17_3p、hsa_miR_141_5p及びhsa_miR_30c_5pを含むものである前立腺癌診断用組成物。 - 前記miRNAが、hsa_miR_21_5p、hsa_miR_24_3p、hsa_miR_30a_5p、hsa_miR_222_3p、hsa_miR_375、hsa_miR_27b_3p、hsa_miR_31_5p、hsa_miR_146a_3p、hsa_miR_146a_5p、hsa_miR_200b_3p、hsa_miR_1185_2_3p、hsa_miR_30a_3p及びhsa_miR_30b_5pからなる群から選択される少なくとも1つをさらに含むものである請求項1に記載の前立腺癌診断用組成物。
- lncRNA及び融合遺伝子のmRNAからなる群から選択された少なくとも1つをさらに含む前立腺癌診断用組成物であり、
前記lncRNAが、PCA3及びMALAT1から選択される少なくとも1つであり、
前記融合遺伝子のmRNAが、TMPRSS2:ERGである請求項1に記載の前立腺癌診断用組成物。 - 前記lncRNAが、PCA3である請求項3に記載の前立腺癌診断用組成物。
- 前記miRNAが、hsa_miR_21_5p、hsa_miR_24_3p、hsa_miR_30a_5p及びhsa_miR_222_3pからなる群から選択される少なくとも1つをさらに含むことである請求項1に記載の前立腺癌診断用組成物。
- 前記製剤は、miRNAにそれぞれ特異的に結合するプライマー又はプローブを含むことを特徴とする請求項1、2及び5のいずれか1項に記載の前立腺癌診断用組成物。
- miRNAが、以下の表に記載の塩基配列からなることを特徴とする請求項6に記載の前立腺癌の診断用組成物:
- 前記製剤が、miRNA、lncRNA又は融合遺伝子のmRNAにそれぞれ特異的に結合するプライマー又はプローブを含むことを特徴とする請求項3又は4に記載の前立腺癌診断用組成物。
- miRNA、lncRNA又は融合遺伝子のmRNAに特異的に結合するプライマーが、以下の表に記載の塩基配列からなることを特徴とする請求項8に記載の前立腺癌診断用組成物:
- 前立腺癌診断のための情報を提供する方法であって、
対象体から分離された生物学的試料における請求項1、2及び5のいずれか1項に記載のmiRNAの発現レベルを測定する工程;及び
前記miRNAの発現レベルを正常対照群の試料のmiRNAの発現レベルと比較する工程;
を;含む、方法。 - 前記miRNAの発現レベルが、逆転写ポリメラーゼ連鎖反応(RT-PCR)、競合逆転写ポリメラーゼ連鎖反応(競合RT-PCR)、定量的逆転写ポリメラーゼ連鎖反応(定量的RT-PCR、qRT-PCR)、ddPCR(droplet digital PCR)、シークエンシング(sequencing)、RNase保護分析法(Rnase protection method)、ノーザンブロット法(Northern blotting)又は遺伝子チップ分析法によって測定されることを特徴とする請求項10に記載の方法。
- 前記発現レベルを測定する工程は、
対象体から分離された生物学的試料から前記miRNAを抽出する工程;
抽出されたmiRNAからcDNAを合成する工程;
合成したcDNAに特異的なプライマー対を用いて、cDNAを増幅する工程;及び
増幅されたcDNAを検出する工程;
を含む請求項10に記載の方法。 - 前記生物学的試料が、組織、細胞、尿、唾液、精液、全血、血漿又は血清であることを特徴とする請求項10に記載の方法。
- 前記生物学的試料が、尿であることを特徴とする請求項13に記載の方法。
- 前記miRNAの発現レベルを比較する工程が、LR(ロジスティック回帰)、SVM(サポートベクターマシン)、ランダムフォレスト及び多層パーセプトロンからなる群から選択される機械学習アルゴリズムを用いて行われることを特徴とする請求項10に記載の方法。
- 前記miRNAの発現レベルを比較する工程が、LR(ロジスティック回帰)を用いて行われ、LOOCV(1つ抜き交差検証)値が0.65以上であり、AUC(曲線下面積)値が0.70以上である請求項10に記載の方法。
- 前記発現レベルを測定する工程が、
lncRNA、融合遺伝子のmRNA又はそれらの組み合わせの発現を測定する工程をさらに含み、ここで、前記lncRNAが、PCA3及びMALAT1から選択される少なくとも1つであり、前記融合遺伝子のmRNAが、TMPRSS2:ERGであり、
前記発現レベルを比較する工程が、前記lncRNA、融合遺伝子のmRNA又はそれらの組み合わせの発現レベルを正常対照群の試料のlncRNA、融合遺伝子のmRNA又はそれらの組み合わせの発現レベルと比較する工程をさらに含む請求項10に記載の方法。 - 前記miRNAと、lncRNA、融合遺伝子のmRNA又はそれらの組み合わせの発現レベルが、逆転写ポリメラーゼ連鎖反応(RT-PCR)、競合逆転写ポリメラーゼ連鎖反応(競合RT-PCR)、定量的逆転写ポリメラーゼ連鎖反応(qPCR)、ddPCR(droplet digital PCR)、シークエンシング(sequencing)、RNase保護分析法(RNase protection method)、ノーザンブロット法(Northern blotting)又は遺伝子チップ分析法によって測定されることを特徴とする請求項17に記載の方法。
- 前記発現レベルを測定する工程は、
対象体から分離された生物学的試料において前記miRNAと、lncRNA、融合遺伝子のmRNA又はそれらの組み合わせを抽出する工程;
抽出されたmiRNAと、lncRNA、融合遺伝子のmRNA又はそれらの組み合わせからcDNAを合成する工程;
合成したcDNAに特異的なプライマー対を用いてcDNAを増幅する工程;及び
増幅されたcDNAを検出する工程;
を含む請求項17に記載の方法。 - 前記生物学的試料が、組織、細胞、尿、唾液、精液、全血、血漿又は血清であることを特徴とする請求項17に記載の方法。
- 前記生物学的試料が、尿であることを特徴とする請求項20に記載の方法。
- 前記miRNAと、lncRNA、融合遺伝子のmRNA又はそれらの組み合わせの発現を測定する工程は、LR(ロジスティック回帰)、SVM(サポートベクターマシン)、ランダムフォレスト及び多層パーセプトロンからなる群から選択される機械学習アルゴリズムを用いて行われることを特徴とする請求項17に記載の方法。
- 前記miRNAと、lncRNA、融合遺伝子のmRNA又はそれらの組み合わせの発現レベルを比較する工程が、LR(ロジスティック回帰)を用いて行われ、LOOCV(1つ抜き交差検証)値が0.65以上であり、AUC(曲線下面積)値が0.70以上である請求項17に記載の方法。
- 請求項1~5のいずれか1項に記載の組成物を含む、前立腺癌診断用キット。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2021-0069428 | 2021-05-28 | ||
KR1020210069428A KR102550113B1 (ko) | 2021-05-28 | 2021-05-28 | 전립선암 진단용 바이오마커 및 이의 용도 |
PCT/KR2022/007695 WO2022250517A1 (ko) | 2021-05-28 | 2022-05-30 | 전립선암 진단용 바이오마커 및 이의 용도 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2024521869A true JP2024521869A (ja) | 2024-06-04 |
JPWO2022250517A5 JPWO2022250517A5 (ja) | 2024-06-11 |
Family
ID=84229115
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023573568A Pending JP2024521869A (ja) | 2021-05-28 | 2022-05-30 | 前立腺癌診断用バイオマーカー及びその使用 |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP4365310A1 (ja) |
JP (1) | JP2024521869A (ja) |
KR (2) | KR102550113B1 (ja) |
WO (1) | WO2022250517A1 (ja) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2011237669B2 (en) * | 2010-04-06 | 2016-09-08 | Caris Life Sciences Switzerland Holdings Gmbh | Circulating biomarkers for disease |
WO2016036994A1 (en) * | 2014-09-04 | 2016-03-10 | Miodx | Method of analysis allowing avoidance of surgery |
-
2021
- 2021-05-28 KR KR1020210069428A patent/KR102550113B1/ko active IP Right Grant
-
2022
- 2022-05-30 JP JP2023573568A patent/JP2024521869A/ja active Pending
- 2022-05-30 EP EP22811708.1A patent/EP4365310A1/en active Pending
- 2022-05-30 WO PCT/KR2022/007695 patent/WO2022250517A1/ko active Application Filing
-
2023
- 2023-06-27 KR KR1020230082463A patent/KR20230106542A/ko active Application Filing
Also Published As
Publication number | Publication date |
---|---|
KR20230106542A (ko) | 2023-07-13 |
WO2022250517A1 (ko) | 2022-12-01 |
KR102550113B1 (ko) | 2023-07-03 |
EP4365310A1 (en) | 2024-05-08 |
KR20220161039A (ko) | 2022-12-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106414774B (zh) | 胆道癌的检测试剂盒或装置以及检测方法 | |
CN106459961B (zh) | 胰腺癌的检测试剂盒或装置以及检测方法 | |
CN105821125A (zh) | 用于内分泌治疗下的乳腺癌复发预测的方法 | |
JP2019522478A (ja) | 遺伝子発現プロファイルを用いた肺癌の診断のための組成物及び方法 | |
US20230257826A1 (en) | Methods for predicting prostate cancer and uses thereof | |
WO2022121960A1 (zh) | 泛癌症早筛预测方法 | |
CN110229899B (zh) | 用于结直肠癌早期诊断或预后预测的血浆标记物组合 | |
WO2011146937A1 (en) | Methods and kits useful in diagnosing nsclc | |
KR102052398B1 (ko) | 전립선암 진단용 바이오마커 및 이의 용도 | |
CN114480636B (zh) | 胆汁细菌作为肝门部胆管癌诊断及预后标志物的用途 | |
WO2020135422A1 (zh) | 健康风险评估方法 | |
KR102550113B1 (ko) | 전립선암 진단용 바이오마커 및 이의 용도 | |
BR112020012280A2 (pt) | composições e métodos para diagnosticar cânceres de pulmão usando perfis de expressão de gene | |
CN112176060B (zh) | 一组血浆非编码rna及检测其表达水平的引物组与结直肠癌检测试剂盒 | |
CN114214423B (zh) | 外泌体miR-30e-5p、IL1B等在肺癌诊断中的应用 | |
CN109022586A (zh) | 一种与宫颈癌辅助诊断相关的血浆miRNA标志物及其应用 | |
US11676724B1 (en) | Method of calculating diagnostic score for prostate cancer and use thereof | |
WO2024174260A1 (zh) | 基于液态活检的癌症早期筛检方法 | |
CN109182520B (zh) | 一种宫颈癌及其癌前病变检测试剂盒及其应用 | |
Hendriksǂ et al. | Detection of high-grade prostate cancer using a urinary molecular | |
KR20220151482A (ko) | 전립선암 진단용 바이오마커 | |
CN116083583A (zh) | miRNA-483-5p在制备胰腺癌肝转移诊断试剂盒中的应用 | |
WO2022190752A1 (ja) | がん検査試薬セット、がん検査試薬セットの製造方法及びがん検査方法 | |
WO2022084170A1 (en) | Method for differential diagnosis of prostate disease and marker for differential diagnosis of prostate disease as well as kit therefor | |
CN117004711A (zh) | 测量乳腺癌局部复发风险的预后标志物的工具及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240528 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240528 |