KR20210137828A - 기계학습 예측모델을 이용한 난소암 진단 방법 및 이를 적용하는 시스템 - Google Patents

기계학습 예측모델을 이용한 난소암 진단 방법 및 이를 적용하는 시스템 Download PDF

Info

Publication number
KR20210137828A
KR20210137828A KR1020200056152A KR20200056152A KR20210137828A KR 20210137828 A KR20210137828 A KR 20210137828A KR 1020200056152 A KR1020200056152 A KR 1020200056152A KR 20200056152 A KR20200056152 A KR 20200056152A KR 20210137828 A KR20210137828 A KR 20210137828A
Authority
KR
South Korea
Prior art keywords
mir
mirna
ovarian cancer
expression level
expression
Prior art date
Application number
KR1020200056152A
Other languages
English (en)
Inventor
안희정
정주연
최민철
황소현
Original Assignee
의료법인 성광의료재단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 의료법인 성광의료재단 filed Critical 의료법인 성광의료재단
Priority to KR1020200056152A priority Critical patent/KR20210137828A/ko
Priority to PCT/KR2021/005843 priority patent/WO2021230604A1/ko
Publication of KR20210137828A publication Critical patent/KR20210137828A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/178Oligonucleotides characterized by their use miRNA, siRNA or ncRNA

Abstract

기계학습 예측모델을 이용하여 난소암을 진단하기 위한 정보제공방법 및 이를 적용하는 시스템에 관한 것으로, 상기 방법에 의하면, 소량의 혈청을 이용하여 수술 전 보다 빠르고 정확하게 난소암을 진단할 수 있는바 난소암을 조기에 진단하고, 불필요한 수술을 피할 수 있으며 최적의 치료 계획을 결정할 수 있다.

Description

기계학습 예측모델을 이용한 난소암 진단 방법 및 이를 적용하는 시스템{Method of ovarian cancer diagnosis using machine learning model and system applying thereof}
기계학습 예측모델을 이용하여 난소암을 진단하기 위한 정보제공방법 및 이를 적용하는 시스템에 관한 것이다.
난소암은 부인암 사망의 주요 원인으로 5년 생존율이 44% 정도로 낮다. 이처럼 난소암의 예후가 나쁜 것은 난소암 조기 발견에 효과적인 스크리닝 검사가 없으며, 해부학적으로 조직검사가 어려운 곳에 위치하고 있어 대부분의 환자가 3기 또는 4기의 진행된 병기에서 진단을 받게 되기 때문이다. 난소 종양이 있는 환자에서 수술 전에 악성과 양성 여부를 구분하는 것은 불필요한 수술을 피하고 최적의 치료 계획을 결정하는데 있어서 매우 중요하다. 혈청 암 항원 125(cancer antigen 125, CA125)는 난소암의 대표적인 종양 표지자로써 난소 악성 종양 알고리즘(risk of ovarian malignancy algorithm, ROMA) 등과 함께 수술 전 감별 진단을 위해 가장 흔히 사용되고 있다. 그러나, CA125의 경우 병기가 낮은(1기 또는 2기) 난소암 환자의 50% 정도에서만 상승된 수치를 나타내고 있기 때문에, 난소암 초기 진단의 민감도와 특이도 측면에서 충분한 효과는 없는 실정이다.
한편, 난소암을 포함한 다양한 고형암 조직에서 정상조직과 비교하여 micro RNA(miR)의 발현 양상에 유의적인 차이를 나타내며 miR의 이러한 조절장애(dysregulation)는 발암 과정의 다양한 단계에 관여하는 것으로 알려져 있다. 한편, 혈중 miR는 암 조직의 miR 발현 상태를 반영하기 때문에 이전의 다양한 연구들에서 난소암 환자 혈액의 순환 유리 miR(free-circulating miR)의 발현 양상을 분석하여 난소암 진단 바이오마커를 개발하려는 시도가 있었다. 그러나, 순환 유리 miR은 혈액 내 존재하는 RNAse에 의해 분해되므로, 안정성이 낮다는 문제점이 있다. 반면, exsomal miR의 경우, 엑소좀 내에 패킹(packing)되어 있어 RNase에 의한 분해를 피할 수 있으므로 안정하며 암세포는 정상세포보다 많은 양의 엑소좀을 분비하기 때문에 엑소좀 miR를 분리하여 분석하는 경우 정상세포로부터 유래된 miR로 인한 교란을 감소시킬 수 있다는 이점이 있다. 따라서, 순환 유리 miR의 문제점을 극복하여 난소암 진단의 민감도와 특이도가 개선된 바이오마커를 개발하는 것이 임상적으로 매우 중요하다.
일 양상은 개체의 시료에서 분리된 하나 이상의 바이오마커의 miRNA의 발현 수준을 측정하여 데이터를 생성하는 단계; 상기 miRNA의 발현 수준 데이터로부터 이상 값을 산출해내는 단계; 및 상기 이상 값 결과에 기초하여 암 진단 정보를 생성하는 것을 포함하는 기계학습 예측 모델을 이용하여 난소암의 진단을 위한 정보제공 방법을 제공하는 것이다.
다른 양상은 개체의 시료에서 분리된 하나 이상의 바이오마커의 miRNA 발현 수준을 측정한 데이터를 수신하는 수신부; 상기 데이터를 학습데이터에 적용하여 이상 값을 산출하는 산출부; 및 상기 이상 값 결과에 기초하여 암 진단 정보를 생성하는 생성부를 포함하는 기계학습 예측 모델을 이용한 난소암 진단 시스템을 제공하는 것이다.
일 양상은 개체의 시료에서 분리된 하나 이상의 바이오마커의 miRNA의 발현 수준을 측정하여 데이터를 생성하는 단계; 상기 miRNA의 발현 수준 데이터로부터 이상 값을 산출해내는 단계; 및 상기 이상 값 결과에 기초하여 암 진단 정보를 생성하는 단계를 포함하는 기계학습 예측 모델을 이용하여 난소암의 진단을 위한 정보제공 방법을 제공한다. 상기 기계학습 예측 모델은 의사결정 트리 모델인 것일 수 있다.
본 명세서에서 용어, "의사결정 트리 모델"은 데이터를 분석하여 이들 사이에 존재하는 패턴을 예측 가능한 규칙들의 조합으로 나타내는 것으로 의사결정 규칙을 나무 구조로 나타내어 전체 자료를 몇 개의 소집단으로 분류하거나 예측을 수행하는 분석 방법이다. 의사결정 트리의 학습 과정은 입력 변수 영역을 두 개로 구분하는 재귀적 분귀(recursive partitioning)와 자세하게 구분된 영역을 통합하는 가지치기(pruning)의 두 가지 과정으로 나뉘어 진다.
상기 개체는 난소암을 진단 하기 위한 대상이 되며, 예를 들어 난소암의 가능성을 예측하기 위한 대상, 난소암의 상태를 진단하기 위한 대상, 예후 예측을 판단하기 위한 대상, 난소암 예방 또는 치료용 약제의 투여량을 결정하기 위한 대상, 난소암의 진행에 따른 치료 방법을 결정하기 위한 대상, 난소암 수술 및 항암 치료 후 재발 가능성을 예측하기 위한 대상 등을 의미한다. 상기 난소암의 가능성을 예측하기 위한 대상은 예를 들어, 난소암의 수술을 받기 전 난소암의 가능성을 예측하기 위한 대상이거나, 초음파, CT 영상 검사 등과 같이 영상의학검사에 의해 종양이 발견된 대상일 수 있으며, 건강검진 등을 통해 난소암을 조기 진단하고자 하는 정상인 등이 그 대상일 수 있다. 상기 개체는 척추동물인 것일 수 있고, 구체적으로 포유류, 양서류, 파충류, 조류 등인 것일 수 있으며, 보다 구체적으로, 포유동물인 것일 수 있고, 예를 들면 인간(Homo sapiens)일 수 있다. 상기 시료는 개체로부터 분리된 조직, 세포, 전혈, 혈청, 혈장, 타액, 객담, 뇌척수액 또는 뇨와 같은 시료 등을 포함할 수 있다.
일 구체예에 있어서, 상기 miRNA는 miR-21, miR-93, miR-141, miR-145, miR-200a, miR-200b 및 miR-200c로 구성된 군에서 선택되는 하나 이상인 것일 수 있다. 또한, 상기 miRNA는 엑소좀(exosome)으로부터 분리된 것일 수 있다. 다른 구체예에 있어서, 종양 표지자(Cancer Antigen, CA) 125의 단백질 발현량을 측정하여 데이터를 획득하는 단계를 추가로 포함할 수 있다.
본 명세서 내 용어, "miRNA(microRNA)"는 21 내지 25 뉴클레오티드의 길이를 갖는 non-coding RNA로서, 목적 mRNA의 3'-비해석부위(untranslated region)에 결합하여 전사 후 (post-transcriptionally) 유전자 발현을 조절함으로써 mRNA 분해 및/또는 전사 억제를 초래한다.
본 명세서 내 용어, "엑소좀"은 혈액에 존재하며 세포간 정보 교환을 위해 세포가 분비하는 직경이 50 내지 100 ㎚ 크기의 나노입자로 세포 내 미세소체(microvesicular body)에서 유래한다. 엑소좀은 증식 세포에서 대부분 분비되며, 혈액, 소변, 타액 및 복수를 포함한 다양한 체액에서 발견된다. 또한, 악성 세포는 정상세포보다 많은 양의 엑소좀을 분비하며, 종양에서 추출된 엑소좀은 이를 분비하는 종양세포를 반영하는 단백질, DNA 및 RNA를 비롯한 다양한 분자 구성 요소를 포함한다. 따라서, 엑소좀은 비침습적으로 수득할 수 있는 체액 내에 풍부하고, 기원 세포의 특성을 반영하기 때문에 난소암에 대해 신뢰할 수 있는 혈청 바이오마커로서 유용하다.
난소암 조직이나 혈액의 순환 유리(free-circulating)miR-145의 경우, 정상 조직 또는 혈액에 비해 발현이 저하되지만 엑소좀 miR-145는 난소암 환자의 혈액에서 발현이 증가된다는 특징이 있다. 또한, 상기 miR-145는 91.7%의 민감도를 나타내는 바, 난소암을 예측하는데 있어서 단일 마커로서 유용하게 이용될 수 있다. 뿐만 아니라, miR-145, miR-200c 및 CA125를 조합할 경우, 민감도가 100%를 나타내는 바, 엑소좀 miR-145 및/또는 miR-200c는 난소암 환자에서 상향 조절됨으로써, 난소암과 양성 병변을 구별하고 CA125의 한계를 극복하기 위한 바이오마커가 될 수 있다.
상기 miRNA의 발현 수준 측정은 난소암을 진단하기 위하여 개체의 시료에서 miRNA의 존재 여부와 발현 정도를 확인하는 과정으로 miRNA의 양을 측정하는 것이다. 이를 위한 분석 방법으로는 역전사 중합효소반응(RT-PCR), 경쟁적 역전사 중합효소반응(Competitive RT-PCR), 실시간 역전사 중합효소반응(Real-time RT-PCR), RNase 보호 분석법(RPA; RNase protection assay), 노던 블랏팅(Northern blotting), DNA 칩 등 역전사 중합효소반응(RT-PCR), 경쟁적 역전사 중합효소반응(Competitive RT-PCR) 등이 있다. 또한, 상기 발현 수준은 miR-21, miR-93, miR-141, miR-145, miR-200a, miR-200b 및 miR-200c로 구성된 군에서 선택되는 하나 이상의 miRNA의 발현 수준 또는 CA125의 발현 수준을 동시에 또는 순차적으로 측정하는 것일 수 있다.
일 구체예에 있어서, 상기 miRNA의 발현 수준 데이터로부터 이상 값을 산출해내는 단계는 miR-21, miR-93, miR-141, miR-145, miR-200a, miR-200b 및 miR-200c로 구성된 군에서 선택되는 하나 이상의 miRNA의 발현 수준 또는 CA125의 발현 수준이 대조군에 비하여 증가한 경우 이상 값인 것으로 판단하여 산출하는 단계이다. 또한, 다른 구체예에 있어서, 상기 miRNA의 발현 수준 데이터로부터 이상 값을 산출해내는 단계는 하기 단계를 포함한다. 구체적으로, 제1 miRNA의 발현값이 X1으로 표시될 때(이 때, 상기 X1는 제1 miRNA가 제2 내지 제n miRNA와 분리될 수 있는 특정 상수이다.) 제1 miRNA를 제2 내지 제n miRNA와 분리하는 단계; 분리된 제2 miRNA의 발현값이 X2로 표시될 때(이때, 상기 x는 제2 miRNA가 제3 내지 제n miRNA와 분리될 수 있는 특정 상수이다.) 제2 miRNA를 제3 내지 제n miRNA와 분리하는 단계; ?? 및 분리된 제n niRNA의 발현값이 Xn으로 표시될 때(이때, 상기 Xn은 상기 제n 내지 제n+m miRNA와 분리될 수 있는 특정 상수이다.) 제n miRNA를 제n+m miRNA와 분리하는 단계를 포함할 수 있다. 이때, 상기 이상 값은 제n miRNA가 제n+1 내지 제n+m miRNA와 분리될 수 있는 발현값으로서, 특정 상수로 나타낸 것일 수 있다.
일 구체예에 있어서, 상기 이상 값 결과에 기초하여 암 진단 정보를 생성하는 단계는 miR-21, miR-93, miR-141, miR-145, miR-200a, miR-200b 및 miR-200c로 구성된 군에서 선택되는 하나 이상의 miRNA의 발현 수준 또는 CA125의 발현 수준이 대조군에 비하여 증가한 경우, 난소암인 것으로 판단하는 단계인 것일 수 있다. 또한, 다른 구체예에 있어서, 상기 단계는 제1 miRNA의 발현값이 X1 이상인 경우 난소암 양성인 것으로 판단하고, X1 미만인 경우 제2 내지 제n miRNA의 발현값을 측정하는 단계; 상기 제2 miRNA의 발현값이 X2 이상인 경우 난소암 양성인 것으로 판단하고, X2 미만인 경우 제3 내지 제n miRNA의 발현값을 측정하는 단계; ... ; 및 상기 제n miRNA의 발현값이 Xn 이상인 경우 난소암 양성인 것으로 판단하고 Xn 미만인 경우 난소암 음성인 것으로 판단하는 단계를 포함할 수 있다.
다른 양상은 개체의 시료에서 분리된 하나 이상의 바이오마커의 miRNA 발현 수준을 측정한 데이터를 수신하는 수신부; 상기 데이터를 학습데이터에 적용하여 이상 값을 산출하는 산출부; 및 상기 이상 값 결과에 기초하여 암 진단 정보를 생성하는 생성부를 포함하는 기계학습 예측 모델을 이용한 난소암 진단 시스템을 제공한다. 일 구체예에서, 상기 시스템은 상기 바이오마커의 miRNA의 발현 양상을 모니터링하는 모니터링부를 추가로 포함하는 것일 수 있다.
도 5 및 6은 일 구체예에 따른 난소암 진단 시스템의 구조도이다. 도 7은 일 구체예에 따른 기계학습 예측모델을 이용한 난소암 조기 진단 방법에 관한 개념도이다.
도 5에 나타난 바와 같이, 일 구체예에 따른 난소암 진단 시스템(100)은 각 기능에 따라 miRNA 발현 수준 측정 데이터 수신부(110), 산출부(120), 생성부(130)으로 구성될 수 있다. 또한, 도 6에 나타난 바와 같이, 일 구체예에 따른 난소암 시스템은 모니터링부(140)을 추가로 포함할 수 있다. 먼저, 수신부(110)는 개체의 시료에서 분리된 하나 이상의 바이오마커의 miRNA 발현 수준 측정 데이터를 수신한다. 상기 miRNA의 구체적인 내용은 전술한 바와 같다. 상기 miRNA 발현 수준의 측정은 난소암을 진단하기 위하여 개체의 시료에서 miRNA의 존재 여부와 발현 정도를 확인하는 과정으로 miRNA의 양을 측정하는 것이다. miRNA 발현 수준 측정의 구체적인 내용은 전술한 바와 같다.
산출부(120)는 상기 miRNA 발현 수준을 측정하여 획득한 데이터를 학습데이터에 적용하여 이상 값을 산출 및 판단한다. 일 구체예에 있어서, miR-21, miR-93, miR-141, miR-145, miR-200a, miR-200b 및 miR-200c로 구성된 군에서 선택되는 하나 이상의 miRNA의 발현 수준 또는 CA125의 발현 수준이 대조군과 비교하여 기준치 이상으로 증가한 경우 이상 값인 것으로 판단하여 산출한다. 다른 구체예에 있어서, 제1 miRNA의 발현값이 X1으로 표시될 때(이 때, 상기 X1는 제1 miRNA가 제2 내지 제n miRNA와 분리될 수 있는 특정 상수이다.) 제1 miRNA를 제2 내지 제n miRNA와 분리할 수 있다. 예를 들어, 상기 이상 값을 산출 및 판단하는 단계는 제1 miRNA의 발현값이 X1으로 표시될 때(이 때, 상기 X1는 제1 miRNA가 제2 내지 제n miRNA와 분리될 수 있는 특정 상수이다.) 제1 miRNA를 제2 내지 제n miRNA와 분리하는 단계; 분리된 제2 miRNA의 발현값이 X2로 표시될 때(이때, 상기 X2는 제2 miRNA가 제3 내지 제n miRNA와 분리될 수 있는 특정 상수이다.) 제2 miRNA를 제3 내지 제n miRNA와 분리하는 단계; 및 분리된 제n niRNA의 발현값이 Xn으로 표시될 때(이때, 상기 Xn은 상기 제n 내지 제n+m miRNA와 분리될 수 있는 특정 상수이다.) 제n miRNA를 제n+m miRNA와 분리하는 단계를 포함하여 이상 값을 산출 및 판단할 수 있다.
생성부(130)은 상기 이상 값 결과에 기초하여 암 진단 정보를 생성한다. 구체적으로, 상기 miRNA 발현 수준이 이상 값으로 판단되어 산출된 경우, 상기 이상 값 결과로부터 개체의 난소암 진단 정보를 생성한다. 진단 정보 생성의 구체적인 내용은 전술한 바와 같다. 상기 난소암 진단 정보는 예를 들어, 개체의 난소암 진행여부를 추가적으로 추적 관찰할 것인지 또는 난소암인 것으로 진단하여 수술을 진행할 것인지를 판단하는 것일 수 있다. 또한, 난소암인 것으로 진단할 경우, 항암화학요법을 진행할 것인지를 판단하는 것일 수 있다.
모니터링부(160)은 바이오마커의 miRNA의 발현 양상을 모니터링한다. 구체적으로, 상기 생성부(130)에서 난소암인 것으로 진단된 개체의 수술 및/또는 항암화학요법 진행 후에 상기 바이오마커의 miRNA 발현 양상을 추적 관찰함으로써 개체의 난소암 재발 여부를 조기에 확인할 수 있다. 예를 들어, 개체에서 상기 바이오마커의 miRNA 발현 수준이 이상 값으로 판단되어 산출된 경우, 개체의 난소암이 재발한 것으로 판단될 수 있다.
도 7 및 도 8은 일 구체예에 따른 의사결정 트리 모델을 적용한 난소암의 진단 방법 및 진단 시스템을 도식화한 것이다. 예를 들어, 개체의 혈청 엑소좀 내 존재하는 miR-200c, miR-145 및 miR-93의 발현 수준을 RT-PCR을 이용해 순차적으로 또는 동시에 측정한 후 발현값에 따라 난소암 양성 여부를 판단할 수 있다. 구체적으로, 먼저 miR-200c의 발현값(Ct)이 0.895 이상인 경우, 난소암 양성인 것으로 판단하고 0.895 미만인 경우 분리된 miR-145 및 miR-93의 발현값을 측정하여 miR-145의 발현값이 1.225 이상인 경우 난소암 양성인 것으로 판단할 수 있다. miR-145의 발현값이 1.225 미만인 경우, miR-93의 발현값을 측정하여 상기 miR-93의 발현값이 1.67 이상인 경우, 난소암 양성인 것으로 판단하고 미만인 경우 난소암 음성인 것으로 판단할 수 있다.
난소 물혹이나 종괴는 부인과 영역에서 많은 환자들의 주요 호소증상(chief complaint) 중 하나이다. 그러나, 난소는 해부학적 위치상 조직검사가 불가능하고 기존의 난소암 종양 표지자의 민감도가 비교적 낮아, 악성 여부를 확인하기 위해서는 전신 마취 하에 개복 수술이 필수적이다. 따라서, 일 양상에 따른 방법은 수술 전 난소암 환자의 혈청을 소량으로 이용하여 CA125, 엑소좀 miR-145, miR-200c, miR-93, miR-21 및 이의 조합의 발현량을 이용하여 난소암을 보다 간편한 방법으로 예측할 수 있으며, 민감도, 특이도 및 정확도가 비교적 우수하여 난소암 위험도가 높은 환자의 치료 계획 수립에 도움을 줄 수 있다. 뿐만 아니라, 정상인의 난소암 조기 진단이 가능할 뿐만 아니라, 수술 전 난소암 환자의 진행 상태 예측, 난소암 수술 및 항암 치료 후 재발 가능성의 추적 관찰이 가능하다는 이점이 있다.
다른 양상은 miR-21, miR-93, miR-141, miR-145, miR-200a, miR-200b 및 miR-200c로 구성된 군에서 선택되는 하나 이상의 miRNA의 발현 수준을 측정하는 제제를 포함하는 난소암 진단용 조성물을 제공한다. 상기 miRNA는 엑소좀(exosome)으로부터 분리된 것일 수 있다. 일 구체예에서, 상기 조성물은 혈청 암 항원(cancer antigen, CA)의 발현 수준을 측정하는 제제를 추가로 포함할 수 있다. 상기 암 항원은 CA125인 것일 수 있다. 상기 CA125는 고분자 당단백으로 난소암 및 자궁내막암 등의 부인과 암에서 증가하며, 난소암의 크기, 병기 결정, 예후 판정, 재발 검출 및 치료 효과 모니터링에 유용하게 사용될 수 있다. 다른 구체예에서, 상기 제제는 miR-200c, miR-145 및 miR-93의 miRNA의 발현 수준을 측정하는 제제를 포함하거나 또는 miR-200c, 및 miR-21의 miRNA의 발현 수준; 및 CA125의 단백질 발현 수준을 측정하는 제제인 것일 수 있다.
다른 양상은 상기 조성물을 포함하는 난소암 진단용 키트를 제공한다. 상기 조성물의 구체적인 내용은 전술한 바와 같다.
상기 키트는 난소암의 진단을 위한 키트일수 있다. 키트는 당업계에 알려진 의미로 사용된다. 상기 키트는 예를 들어, 상기한 바와 같은 miRNA의 발현 수준을 측정하기 위한 제제와 그의 특정 용도에 필요한 항목들을 포함하는 것일 수 있다. 또한 상기한 바와 같은 miRNA의 발현 수준을 측정하기 위한 제제와 함께 그의 사용 방법에 필요한 시약을 포함하는 것일 수 있다.
상기 키트는 miR-21, miR-93, miR-141, miR-145, miR-200a, miR-200b 및 miR-200c로 구성된 군에서 선택되는 하나 이상의 miRNA의 발현 수준을 측정하기 위한, miRNA의 분석 방법에 적합한 하나 또는 그 이상의 다른 구성 성분 또는 장치를 포함할 수 있다.
다른 양상은 개체로부터 분리된 시료에서 miR-21, miR-93, miR-141, miR-145, miR-200a, miR-200b 및 miR-200c로 구성된 군에서 선택되는 하나 이상의 발현 수준을 측정하는 단계; 및 상기 miRNA의 발현 수준을 대조군 시료의 해당 miRNA의 발현 수준과 비교하는 단계를 포함하는 난소암의 진단을 위한 정보를 제공하는 방법을 제공한다.
일 구체예에 따른 방법은 개체로부터 분리된 시료에서 miR-21, miR-93, miR-141, miR-145, miR-200a, miR-200b 및 miR-200c로 구성된 군에서 선택되는 하나 이상의 발현 수준을 측정하는 단계를 포함한다.
일 구체예에 따른 방법은 상기 miRNA의 발현 수준을 대조군 시료의 해당 miRNA의 발현 수준과 비교하는 단계를 포함한다. 예를 들어, 상기 miRNA의 발현 수준이 대조군에 비하여 증가하는 경우, 난소암인 것으로 판단하는 단계를 추가로 포함할 수 있다. 상기 miRNA의 발현 수준은 개체로부터 분리된 혈액에서 증가하는 것일 수 있으며, 구체적으로 혈청 내에서의 발현 수준이 증가하는 것일 수 있다.
일 양상에 따른 방법에 의하면, 소량의 혈청을 이용하여 수술 전 보다 빠르고 정확하게 난소암을 진단할 수 있는바 난소암을 조기에 진단하고, 불필요한 수술을 피할 수 있으며 최적의 치료 계획을 결정할 수 있다. 또한, 수술 후 및 항암 치료가 종료된 후에도 지속적인 모니터링이 가능하므로 난소암의 재발을 조기에 진단할 수 있다. 뿐만 아니라, 2 이상의 바이오마커를 조합할 경우 난소암 예측의 민감도가 우수하여 난소암 위험도가 높은 환자의 수술 및 치료 계획에 도움을 줄 수 있다.
도 1은 양성 난소 낭종(양성) (Benign), 경계성 난소 종양(borderline ovarian tumors, BOT), 고등급 장액성 난소암(high-grade serous ovarian carcinoma, HGSOC) 및 비-고등급 장액성 난소암 (Non-HGSCO) 환자에서 qRT-PCT 방법으로 측정된 혈청 엑소좀 miR-145, miR-200c, miR-21 및 miR-93의 발현 수준을 나타낸 그래프이다. miR-145 및 miR-200c의 발현 수준은 HGSOC과 비-암(non-cancer)(양성/BOT) 그룹 사이에서 현저한 차이를 보였다. 반면, miR-21 및 miR-93의 경우 비-HGSOC 및 비-암(양성/BOT) 그룹 사이에서 현저한 차이를 나타냈다. 수평선은 중앙값을 나타낸다.
도 2는 비-암(양성/BOT) 및 암(HGSOC/비-HGSOC) 그룹 사이의 혈청 엑소좀 miRNA의 발현 차이를 나타낸 그래프이다. miR-145, miR-200 및 miR-93의 발현 수준은 비-암 그룹과 비교하여 암 그룹에서 현저하게 높았다. 수평선은 중앙값을 나타낸다.
도 3은 CA125, 혈청 엑소좀 miR-145, miR-200c, miR-21 및 miR-93으로 수술 전 악성(HGSOC/비-HGSOC)과 비-암(양성/BOT)을 구분하는 ROC 곡선을 나타낸다.
도 4는 일 구체예에 따른 난소암 진단 시스템의 구조도이다.
도 5는 일 구체예에 따른 난소암 진단 시스템의 구조도이다.
도 6은 일 구체예에 따른 기계학습 예측모델을 이용한 난소암 조기 진단 방법에 관한 개념도이다.
도 7은 일 구체예에 따른 miR-200c, miR-145 및 miR-93을 이용하여 난소암을 진단하는 방법에 관한 개념도이다.
도 8은 일 구체예에 따른 miR-200c, miR-21 및 CA125를 이용하여 난소암을 진단하는 방법에 관한 개념도이다.
이하, 본 발명의 이해를 돕기 위하여 바람직한 실시예를 제시한다. 그러나 하기의 실시예는 본 발명을 보다 쉽게 이해하기 위하여 제공되는 것일 뿐, 하기 실시예에 의해 본 발명의 내용이 한정되는 것은 아니다.
[실시예]
실시예 1. 환자 시료의 준비 및 임상적 특성 확인
2016년 10월부터 2018년 4월까지 등록된 분당 차병원에서 수술 예정인 타입이 불확실한 난소 종양 환자 48명의 수술 전 말초 혈액을 채취하였다. 난소 종양을 병리학적으로 최종 진단한 후, 상기 48명의 환자를 양성, 경계성 난소종양(borderline ovarian tumors, BOT), 고등급 장액성 난소암(high-grade serous ovarian carcinomas, HGSOC) 및 비-고등급 장액성 난소암(non-high-grade serous ovarian carcinomas, non-HGSOC)의 그룹으로 분류하였다. 또한, 계명대학교 동산 병원 바이오 뱅크와 인제대학교 백 병원의 바이오 뱅크에서 HGSOC 환자의 수술 전에 채취한 혈청 샘플 20개를 제공받았다. 초기 진단시 환자의 나이, FIGO 병기, 절제 전이, 원격 전이, 국소 재발 또는 전신 재발 등의 임상데이터는 전자차트 및 병리보고서에서 획득하였다. 이 연구는 분당 차병원의 기관 검토위원회의 승인을 받았으며, 모든 환자로부터 정보동의서를 받아 진행하였다.
상기 68명의 환자의 병리학적 진단은 하기 표 1에 나타낸 바와 같다: 양성 난소 낭종(n=10), BOT(n=10), HGSOC (n=39), 및 non-HGSOC (n=9). 또한, non-HGSOC 환자의 조직학적 유형은 투명세포 종양 (clear cell carcinoma) (n=3), 점액 종양 (mucinous carcinoma) (n=4), 자궁 내막 종양 (endometrioid carcinoma) (n=l), 및 저등급 장액성 종양 (low-grade serous carcinoma) (n=l)으로 세부 분류하였다.
양성 난소 낭종
(n=10)
BOT
(n=10)
HGSOC
(n=39)
non-HGSOC
(n=9)
P
나이 평균
(범위)
57.2
(35~70)
41.6
(22~69)
58.1
(35~83)
43.7
(24~65)
<0.001
수술 전 CA125(U/mL) 중앙값(범위) 9.1
(5.3~53.6)
17.8
(5.3~274.1)
539.5
(20.6~19805)
41.6
(10.8~465.6)
<0.001
<35 U/mL N(%) 6(85.7) 6(60.0) 1(2.6) 4(44.4) <0.001
≥35 U/mL 1(14.3) 4(40.0) 38(97.4) 5(55.6)
FIGO 병기 NA NA 6(15.4%) 7(77.8%) 0.004
NA NA 4(10.3%) 0(0)
NA NA 11(28.2%) 1(11.1%)
NA NA 18(46.2%) 1(11.1%)
표 1에 나타난 바와 같이, HGSOC 환자는 4개의 그룹 중 평균 연령이 가장 높았다(p=0.001). 수술 전 혈청 CA125 수치는 양성, BOT, 및 non-HGSOC 그룹보다 HGSOC 그룹에서 유의하게 높았다(p<0.001). 일반적으로 정상 범위의 상한으로 인정되는 35 U/mL의 기준치를 기준으로 CA125의 고도는 HGSOC 그룹에서 97.4%로 양성(14.3%), BOT(40.0%) 및 non-HGSOC(55.6%) 그룹보다 유의하게 높았다. 진단 당시의 FIGO 병기는 HGSCO 그룹과 non-HGSOC 그룹 간에 유의한 차이가 있었다. 대부분의 non-HGSOC 그룹은 병기 Ⅰ기(77.8%)인 반면, HGSOC 그룹의 대부분은 병기 Ⅲ 또는 Ⅳ기(74.4%; p=0.004)였다.
실시예 2. 혈청으로부터 엑소좀의 분리 및 확인
2-1. 혈청 엑소좀의 분리
상기 실시예 1에서 준비한 환자 68명의 혈액 샘플을 실온에서 15분 동안 3,000 rpm으로 원심 분리하였다. 생성된 상등액은 혈청을 나타내며, 상기 혈청을 즉시 500 ㎕의 분취량으로 나뉘어 -80℃에서 보관하였다. 냉동 혈청 샘플을 해동한 후 2,000 x g에서 30분 동안 원심 분리하여 세포 파편(debris)을 제거하였다. 이후, 무세포 혈청을 함유하는 상등액을 0.2배 부피의 엑소좀 분리제(Total Exosome Isolation Reagent) (Thermo Scientific, Worcester, MA)와 결합 시켰다. 상기 혈청 샘플을 4℃에서 10분 동안 인큐베이션 한 후에 10분 동안 10,000 x g에서 원심 분리 하였다. 생등액을 제거한 후 엑소좀 펠렛을 PBS에 재 현탁 시켰다.
2-2. 혈청 엑소좀의 확인
엑소좀이 풍부한 세포 표면 당 단백질인 CD9 및 CD63의 발현에 대한 웨스턴 블랏을 수행하여 추출한 펠렛이 엑소좀이 맞는지 엑소좀 침전 프로코톨(exosome (precipitation protocol)을 사용하여 확인하였다. 구체적으로, 완충액(Pro-Prep, iNtRON Biotechnology, South Korea)을 사용하여 총 단백질을 추출하고 20 ㎍ 의 단백질을 10% SDS-PAGE로 분리하여 PVDF 멤브레인(polyvinylidene fluoride membrane) (GE Health care, Piscataway, NJ)으로 옮겼다. 실온에서 1시간 동안 5% 스팀밀크로 블로킹한 후, 상기 멤브레인을 1차 항체(항-p-액틴 1:1000 (Santa Cruz Biotechnology, Santa Cruz, CA, USA), 항-CD9 1:1000 (Cell Signaling, Danvers, MA, USA) 또는 항-CD63 1:1000 (Abeam, Cambridge, UK))로 4℃에서 밤새 항온 배양한 다음, 홀스래디쉬 퍼옥시다아제-결합(horseradish peroxidase-conjugated) 항-마우스 1:1000 또는 항-래빗 2차 항체 1:1000(Novus Biologicals, Littleton, CO, USA)에 접종하고 실온에서 1시간 동안 배양하였다. 배양 후, 상기 멤브레인을 세척하고 웨스턴 블랏팅 루미놀 시약(Western Blotting Luminol Reagent) (Bio-Rad, Hercules, CA, USA)으로 단백질을 확인하였다.
그 결과, CD9 및 CD63은 난소암 환자(HGSOC 및 non-HGSOC)의 혈청에서 추출한 펠렛에서 쉽게 검출되었다. 즉, 실제로 엑소좀이 적절하게 정제되었음을 확인할 수 있다.
실시예 3. 혈청 엑소좀에서 miRNA의 발현 확인
3-1. 혈청 엑소좀으로부터 RNA 추출
제조사의 프로토콜에 따라 트리졸 시약(Invitrogen, Carlsbad, CA)을 사용하여 엑소좀 펠렛으로부터 miRNA를 포함하는 총 RNA를 추출하였다. 간략하게, 1.0 mL의 트리졸 시약과 200 mL의 클로로포름을 혈청 샘플에 첨가하였다. 4℃, 1,200 x g에서 20분 동안 원심 분리 한 후, 상등액을 이소프로판올 500 μL와 함께 -20℃에서 10분 동안 배양하였다. 혼합물을 4℃, 1,200 x g에서 10분 동안 원심 분리하여 상등액을 제거하고 RNA 팰렛을 75% 에탄올로 세척한 후 12㎕의 RNAse가 없는 물에 용해 시켰다. 나노드롭 ND-1000 분광광도계 (Thermo Scientific, Worcester, MA) 를 사용하여 OD 260/280에서 분리된 RNA의 순도를 결정하였다.
3-2. 혈청 엑소좀에서 miRNA의 발현 확인
공개된 여러 논문을 검색하여 정상조직 대비 난소암 조직에서 발현이 증진 또는 저하되는 것으로 알려진 miR 후보 7개(miR-21, miR-93, miR-141, miR-145, miR-200a, miR-200b 및 miR-200c)에 대해 정량적 실시간 PCR을 사용하여 혈청 엑소좀 RNA에서 후보 miRNA의 발현 수준을 평가하였다. TaqMan microRNA Reverse Transcription Kit (Applied Biosystems, Carlsbad, CA, USA) 및 microRNA-specific stem-loop primers (part of the TaqMan microRNA Assay Kit; Applied Biosystems)를 사용하여 총 RNA(2 ng)를 역전사 시켰다. 혼합물을 16℃에서 30분 간, 42℃에서 30분 간 및 85℃에서 5분 동안 배양하였다. mRNA에 대한 qRT-PCR은 Bio-Rad CFX96 Real-Time PCR Detection System (Bio-Rad, Hercules, CA)을 사용하여 TaqMan miR Assay 프로토콜 (Applied Biosystems Carlsbad, CA, USA)에 따라 수행되었다. 모든 PCR 반응은 이중으로 수행되었다. 표적 miRNA에 대한 상대적 유전자 발현값은 2-△CT 방법을 사용하여 RNU48로 정규화하고 계산하였다.
qRT-PCR 방법으로 측정한 7 종의 혈청 엑소좀 miRNA 중에서 miR-141, miR-200a 및 miR-200b는 환자 그룹에 관계없이 40 PCR 사이클 이상에서도 증폭 곡선이 검출되지 않았다. 즉, 상기 miRNA들은 혈청 엑소좀에서 매우 낮은 수준으로 발현됨을 알 수 있다.
도 1은 양성, BOT, HGSOC 및 non-HGSOC 그룹의 혈청 엑소좀에서 qRT-PCR을 사용하여 검출된 miR-21, miR-93, miR-145 및 miR-200c의 발현 수준을 나타낸다.
그 결과, 도 1a에 나타난 바와 같이, miR-145의 평균 발현 수준은 양성 및 BOT 그룹과 비교하여 HGSOC 그룹에서 유의하게 증가되었으며(각각 47.7배 및 9.9배, p<0.001 및 p=0.001), 양성 그룹(p=0.001)과 비교하여 non-HGSOC 그룹에서 유의하게 증가되었다 (29.6배). 그러나, 양성 vs. BOT, BOT vs. non-HGSOC 및 HGSCO vs. non-HGSOC 사이의 miR-145 수준에는 유의한 차이가 확인되지 않았다. 또한, 도 1b에 나타나 바와 같이, miR-200c의 평균 발현 수준은 HGSOC 그룹에서 양성, BOT 및 non-HGSOC 그룹에 비해 유의하게 증가하였다(각각 46.7배, 34.4배, 25.5배, p<0.001, p<0.001 및 p=0.001). 도 1c 및 1d에 나타난 바와 같이, non-HGSOC 그룹은 양성 및 BOT 그룹과 비교하여 miR-21의 발현이 각각 26.4배, 17.4배 증가하였고, miR-93의 발현이 각각 5.8배 및 5.5배 증가하였다. 반면, HGSOC 그룹과 비교하였을 경우, 유의한 차이가 없음을 확인할 수 있었다.
도 2는 비-암(양성/BOT) 및 암(HGSOC/non-HGSOC) 그룹 사이의 혈청 엑소좀 miRNA의 발현 차이를 나타낸 그래프이다.
도 2에 나타난 바와 같이, 4개의 그룹을 단순히 비-암(양성 및 BOT, n=20)과 암(HGSOC 및 non-HGSOC, n=48)으로 나누었을 때 miR-145, miR-200c 및 miR-93의 발현 수준은 암 그룹에서 유의하게 높은 것을 확인할 수 있었다(각각 p<0.001, p<0.001 및 p=0.001) (도 2a, 2b 및 2d). 한편, 암 그룹에서의 miR-21의 발현 수준은 비-암 그룹보다 약간 더 높았으나 통계학적으로 유의하지는 않았다(p=0.120) (도 2c).
실시예 4. 혈청 CA125와 비교하여 진단 마커로서의 혈청 엑소좀 miRNA의 효과 확인
난소 종양의 감별 진단을 위해 혈청 CA125(>35 U/mL)와 혈청 엑소좀 miRNA의 효과를 비교하기 위하여 ROC 곡선 분석을 수행하였다(양성/BOT vs. HGSOC/non-HGSOC). 구체적으로, ANOVA와 Bonferroni post hoc t-test를 사용하여 4개 질병 그룹 사이의 환자 나이를 비교하였다. Kruskal-Wallis 및 Mann-Whitney U 테스트를 사용하여 4개 질병 그룹 사이의 CA125 수준 및 후보 miRNA의 발현 수준을 비교하였다. Fisher 's exact test를 사용하여 HGSOC 그룹과 non-HGSOC 그룹 간의 FIGO 병기를 비교하였다. Receiver operating characteristic (ROC) 곡선을 생성하고, 마커의 진단 성능을 평가하기 위해 ROC 곡선 아래의 면적(AUC)을 계산하였다. 난소암 예측의 민감도, 특이도 및 정확도는 참 양성(true positive (TP), 참 음성(true negative, TN), 위 음성(false negative, FN) 및 위 양성 (false positive, FP)을 이용하여 하기와 같이 계산하였다:
진단 민감도 = TP/(TP+FN)
특이도 = TN/(TN + FP)
정확도 = (TN + TP)/(TN+TP+FN+FP).
통계 분석은 SPSS 소프트웨어 버전 21.0 (Chicago, IL)을 사용하여 수행되었다. 통계적 차이는 p 값이 0.05 미만일 때 유의한 것으로 간주되었다.
난소암 예측에 있어서 각 miRNA 및 CA125 >35 U/mL의 민감도, 특이도 및 정확도를 하기 표 2에 나타냈다.
진단 마커 민감도 특이도 정확도
단일마커
CA125+ 89.5% 70.6% 84.6%
miR-145+ 91.7% 75.0% 86.8%
miR-200c+ 72.9% 90.0% 77.9%
마커 2개의 조합
CA125+ 및/또는 miR-145+ 97.9% 60.0% 86.8%
CA125+ 및/또는 miR-200c+ 93.8% 70.0% 86.8%
miR-145+ 및/또는 miR-200c+ 93.8%% 65.0% 85.3%
마커 3개의 조합
CA125+ 및 miR-145+ 및/또는 miR-200c+ 100.0% 55.0% 86.8%
표 2에 나타난 바와 같이, miR-145는 민감도(91.7%), 정확도(86.8%)에서 가장 우수한 단일 마커임을 확인할 수 있다. miR-200c는 가장 높은 특이도(90.0%)를 나타냈으나, 상대적으로 낮은 민감도(72.9%)를 나타냈다. CA125 및 miR-145의 조합은 97.9%의 민감도 및 86.8%의 정확도를 나타냈다. 반면, CA125, miR-145 및 miR-200c 세 가지 마커의 조합은 완벽한 민감도(100%)를 보였으나, 특이도(55.0%)가 매우 낮았다.
도 3은 CA125, 혈청 엑소좀 miR-145, miR-200c, miR-21 및 miR-93으로 종양을 예상하기 위한 ROC 곡선을 나타낸다. 도 3에 나타난 바와 같이, CA125, miR-145, miR-200c, miR-21 및 miR-93의 AUC 값(95% 신뢰구간; p 값)은 각각 0.801 (0.662-0.940; p<0.001), 0.910 (0.840-0.980; p<0.001), 0.802 (0.698-0.906; p<0.001), 0.585 (0.444-0.725; p=0.303), 및 0.755 (0.620-0.890; p=0.002)로 나타났다. miR-145 및 miR-200c의 AUC 값은 CA125의 AUC값 보다 높게 나타났다.
즉, 혈청 엑소좀 miR-145 및/또는 miR-200c는 난소암의 양성 병변을 구별함으로써, 수술 전 난소암을 정확하고 빠르게 진단할 수 있다.
실시예 5. 기계학습 예측모델을 통한 민감도, 특이도 및 정확도 평가
5-1. miR-200c, miR-145 및 miR-93을 이용한 분석
상기 실시예 3의 결과에 따라 암 그룹에서 높은 발현도를 나타내는 miR-200c miR-145 및 miR-93에 대하여 기계학습 예측모델 중 하나인 의사결정 트리(Decision Tree) 모델링 방법을 통해 민감도, 특이도 및 정확도를 평가하였다. 먼저, miR-200c miR-145 및 miR-93에 대해 정량적 실시간 PCR을 사용하여 혈청 엑소좀 RNA에서 후보 miRNA의 발현 수준을 측정하였다. 이후, R package인 트리를 사용하여 이들 세 개의 후보 miRNA들로 양성과 음성을 가장 잘 구분할 수 있는 의사결정 트리 모델을 구축하였다. 의사결정 트리 모델은 구축한 결정 트리 모델을 도 7에 나타내었다. 의사결정 트리 모델 구축 초기에, 도 7에서 단계가 하나 더 추가된 모델이었으나, 마지막 단계가 암 예측에 큰 의미를 나타내지 않으므로 가지치기(pruning) 단계에서 그 가지를 제거하였다.
도 7에 나타난 바와 같이, 정량적 실시간 PCR 측정에서 확인된 miR-200c의 발현값(Ct값)이 0.895 이상인 경우, 난소암 양성인 것으로 판단하고, 0.895 미만인 경우 분리된 2개의 후보 miRNA의 발현값을 다시 측정하였다. miR-145의 발현값이 1.225 이상인 경우 난소암 양성인 것으로 판단하고, 미만인 경우에는 miR-93의 발현값을 다시 측정하였다. 이후, miR-93의 발현값이 1.67 이상인 경우, 난소암 양성인 것으로 판단하고 미만인 경우, 음성으로 판단하였다.
상기 결과를 바탕으로 정상(3명), 양성(7명), BOT(10명), HGSOC(39명), 기타 암(9명) 그룹을 포함한 총 68명에 대하여 의사결정 트리 모델의 예측력을 평가하였으며 하기 표 3에 그 결과를 나타내었다.
모델의 예측값 데이터의 실제값 합계
양성 음성
양성으로 예측 45 3 48
음성으로 예측 3 17 20
이후, 상기 표 3의 값을 바탕으로 실시예 4의 계산식에 따라 진단 민감도, 특이도 및 정확도를 계산하였다. 그 결과, 민감도 94%, 특이도 95% 및 정확도 91%를 나타내었다. 즉, 일 양상에 따른 의사결정 트리 모델은 민간도, 특이도 및 정확도가 비교적 우수한 바, 난소암 예측에 유용하게 사용될 수 있다.
5-2. miR-200c, miR-21 및 CA125를 이용한 분석
상기 실시예 3의 결과에 따라 암 그룹에서 높은 발현도를 나타내는 miR-200c, miR-21 및 CA125에 대하여 실시예 5-1과 동일한 방법으로 기계학습 예측모델을 통해 민감도, 특이도 및 정확도를 평가하였다. 먼저, miR-200c, miR-21 및 CA125에 대해 정량적 실시간 PCR을 사용하여 혈청 엑소좀 RNA에서 후보 miRNA의 발현 수준을 측정하였다. 이후, 상기 실시예 5-1과 동일한 방법으로 miR-200c, miR-21 및 CA125에 대한 의사결정 트리 모델을 구축하였고 도 8에 나타내었다. 의사결정 트리 모델 구축 초기에, miR-145도 포함었으나 기계학습 모델에서 학습 데이터를 과하게 학습(overfitting)하는 문제가 발행하여 가지치기 단계를 추가하였고 상기 단계에서 miR-145로 인해 생성된 가지를 모두 제거하여 최종으로 도 8과 같은 모델을 구축하였다.
도 8에 나타난 바와 같이, 정량적 실시간 PCR 측정에서 확인된 miR-200c의 발현값이 0.85 이상인 경우, 난소암 양성인 것으로 판단하고, 0.85 미만인 경우 miR-21과 CA125의 의 발현값을 다시 측정하였다. CA125의 발현값이 53.6 이상인 경우 난소암 양성인 것으로 판단하고, 미만인 경우에는 miR-21의 발현값을 다시 측정하였다. 이후, miR-21의 발현값이 1.02 이상인 경우, 난소암 양성인 것으로 판단하고 미만인 경우, 음성으로 판단하였다.
상기 결과를 바탕으로 상기 실시예 5-1과 동일한 68명에 대하여 의사결정 트리 모델의 예측력을 평가하였으며 하기 표 4에 그 결과를 나타내었다.
모델의 예측값 데이터의 실제값 합계
양성 음성
양성으로 예측 48 5 53
음성으로 예측 0 15 15
이후, 상기 표 4의 값을 바탕으로 실시예 4의 계산식에 따라 진단 민감도, 특이도 및 정확도를 계산하였다. 그 결과, 민감도 100%, 특이도 75% 및 정확도 93%를 나타내었다. 즉, 일 양상에 따른 의사결정 트리 모델은 민감도가 100%를 나타냄으로써 비교적 우수한 바, 난소암 예측에 유용하게 사용될 수 있다.
100: 난소암 진단 시스템
110: 수신부
120: 산출부
130: 생성부
140: 모니터링부

Claims (9)

  1. 개체의 시료에서 분리된 하나 이상의 바이오마커의 miRNA의 발현 수준을 측정하여 데이터를 생성하는 단계;
    상기 miRNA의 발현 수준 데이터로부터 이상 값을 산출해내는 단계; 및
    상기 이상 값 결과에 기초하여 암 진단 정보를 생성하는 것을 포함하는 기계학습 예측 모델을 이용하여 난소암의 진단을 위한 정보제공 방법.
  2. 청구항 1에 있어서, 상기 miRNA는 miR-21, miR-93, miR-141, miR-145, miR-200a, miR-200b 및 miR-200c로 구성된 군에서 선택되는 하나 이상인 것인 방법.
  3. 청구항 1에 있어서, 상기 miRNA는 엑소좀(exosome)으로부터 분리된 것인 방법.
  4. 청구항 1에 있어서, 종양 표지자(Cancer Antigen, CA) 125의 단백질 발현량을 측정하여 데이터를 획득하는 단계를 추가로 포함하는 것인 방법.
  5. 청구항 1에 있어서, 상기 이상 데이터는 상기 하나 이상의 바이오마커의 발현 수준이 대조군에 비하여 증가하였는지 여부에 대한 정보를 생성하는 것인 방법.
  6. 청구항 1에 있어서, 상기 이상 데이터는 제n miRNA의 발현값이 Xn으로 표시될 때(상기 Xn는 제n miRNA가 제n+1 내지 제n+m miRNA와 분리될 수 있는 상수이다.) 제n miRNA가 제n+1 내지 제n+m miRNA와 분리된 것인 방법.
  7. 청구항 1에 있어서, 상기 암 진단 정보는 제n miRNA의 발현값이 Xn 이상인 경우, 난소암 양성인 것으로 판단하는 것인 방법.
  8. 개체의 시료에서 분리된 하나 이상의 바이오마커의 miRNA 발현 수준을 측정한 데이터를 수신하는 수신부;
    상기 데이터를 학습데이터에 적용하여 이상 값을 산출하는 산출부; 및
    상기 이상 값 결과에 기초하여 암 진단 정보를 생성하는 생성부를 포함하는 기계학습 예측 모델을 이용한 난소암 진단 시스템.
  9. 청구항 8에 있어서, 상기 바이오마커의 miRNA의 발현 양상을 모니터링하는 모니터링부를 추가로 포함하는 것인 시스템.

KR1020200056152A 2020-05-11 2020-05-11 기계학습 예측모델을 이용한 난소암 진단 방법 및 이를 적용하는 시스템 KR20210137828A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020200056152A KR20210137828A (ko) 2020-05-11 2020-05-11 기계학습 예측모델을 이용한 난소암 진단 방법 및 이를 적용하는 시스템
PCT/KR2021/005843 WO2021230604A1 (ko) 2020-05-11 2021-05-11 기계학습 예측모델을 이용한 난소암 진단 방법 및 이를 적용하는 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200056152A KR20210137828A (ko) 2020-05-11 2020-05-11 기계학습 예측모델을 이용한 난소암 진단 방법 및 이를 적용하는 시스템

Publications (1)

Publication Number Publication Date
KR20210137828A true KR20210137828A (ko) 2021-11-18

Family

ID=78524560

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200056152A KR20210137828A (ko) 2020-05-11 2020-05-11 기계학습 예측모델을 이용한 난소암 진단 방법 및 이를 적용하는 시스템

Country Status (2)

Country Link
KR (1) KR20210137828A (ko)
WO (1) WO2021230604A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102594143B1 (ko) * 2022-11-10 2023-10-26 서울대학교병원 1차 선행항암화학요법 전후의 ca-125를 이용하여 항암 반응 예후가 우수할 것으로 예측되는 군집을 선별하고, 선별된 군집의 간격종양감축술 생략 여부를 예측하는 방법 및 시스템

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012510813A (ja) * 2008-12-05 2012-05-17 ジ・オハイオ・ステイト・ユニバーシティ・リサーチ・ファウンデイション 卵巣癌の診断および治療のためのマイクロrnaに基づく方法および組成物
KR101944536B1 (ko) * 2016-12-11 2019-02-01 주식회사 딥바이오 뉴럴 네트워크를 이용한 질병의 진단 시스템 및 그 방법
WO2018129535A1 (en) * 2017-01-09 2018-07-12 Dana-Farber Cancer Institute, Inc. Circulating microrna signatures for ovarian cancer

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102594143B1 (ko) * 2022-11-10 2023-10-26 서울대학교병원 1차 선행항암화학요법 전후의 ca-125를 이용하여 항암 반응 예후가 우수할 것으로 예측되는 군집을 선별하고, 선별된 군집의 간격종양감축술 생략 여부를 예측하는 방법 및 시스템

Also Published As

Publication number Publication date
WO2021230604A1 (ko) 2021-11-18

Similar Documents

Publication Publication Date Title
Sun et al. Examining plasma microRNA markers for colorectal cancer at different stages
Ng et al. Identification of serum miR-139-3p as a non-invasive biomarker for colorectal cancer
Yamashita et al. Prognostic significance of HE4 expression in pulmonary adenocarcinoma
Leng et al. A plasma miRNA signature for lung cancer early detection
Lu et al. miR-155 and miR-31 are differentially expressed in breast cancer patients and are correlated with the estrogen receptor and progesterone receptor status
KR20130018438A (ko) 타액 mRNA 프로파일링, 바이오마커 및 관련 방법 및 부품 키트
Speeckaert et al. Human epididymis protein 4 in cancer diagnostics: a promising and reliable tumor marker
Lee et al. Plasma human mammaglobin mRNA associated with poor outcome in patients with breast cancer
Wang et al. Stathmin is a marker of progression and poor prognosis in esophageal carcinoma
Zuberi et al. The conglomeration of diagnostic, prognostic and therapeutic potential of serum miR-199a and its association with clinicopathological features in epithelial ovarian cancer
Rajendiran et al. MicroRNA-940 as a potential serum biomarker for prostate cancer
Jia et al. MAP3K3 overexpression is associated with poor survival in ovarian carcinoma
Mansouri et al. Targeting of BUB1b gene expression in sentinel lymph node biopsies of invasive breast cancer in Iranian female patients
Liu et al. Elevated expression of Thoc1 is associated with aggressive phenotype and poor prognosis in colorectal cancer
Wan et al. Plasma exosome-derived B-cell translation gene 1: a predictive marker for the prognosis in patients with non-small cell lung cancer
KR20190051641A (ko) Gcc2 유전자 또는 단백질을 과발현하는 엑소좀 기반 폐암 진단 또는 예후 예측용 마커 조성물
Hu et al. High expression of Golgi phosphoprotein-3 is associated with poor survival in patients with hepatocellular carcinoma
Liang et al. Triple-high expression of phosphatase and tensin homolog (PTEN), estrogen receptor (ER) and progesterone receptor (PR) may predict favorable prognosis for patients with Type I endometrial carcinoma
KR20210137828A (ko) 기계학습 예측모델을 이용한 난소암 진단 방법 및 이를 적용하는 시스템
Liu et al. NOB1 in non-small-cell lung cancer: Expression profile and clinical significance
Xi et al. Human epididymis protein 4 is a biomarker for transitional cell carcinoma in the urinary system
US20190316205A1 (en) Mmp1 gene transcript for use as a marker for diagnosis of ovarian cancer prognosis, and test method
US20190241971A1 (en) Indoleamine-2,3-dioxygenase assay for prostate cancer diagnosis and prognosis
RU2699792C1 (ru) Способ прогнозирования выживаемости больных светлоклеточным почечно-клеточным раком
WO2012069659A2 (en) Multimarker panel

Legal Events

Date Code Title Description
E902 Notification of reason for refusal