WO2022265392A1

WO2022265392A1 - 난소암 진단용 다중 바이오 마커 및 이의 용도

Info

Publication number: WO2022265392A1
Application number: PCT/KR2022/008478
Authority: WO
Inventors: 권용일
Original assignee: 주식회사 레지온
Priority date: 2021-06-18
Filing date: 2022-06-15
Publication date: 2022-12-22
Also published as: KR102402428B1

Abstract

본 발명은 난소암 진단용 다중 바이오 마커 및 이의 용도에 관한 것으로, 본 발명의 바이오마커 및 이의 조합은 종래 보고된 난소암 바이오마커 보다 현저히 뛰어난 민감도와 특이도로 난소암을 진단할 수 있으며, 특히, 1기 및/또는 2기 난소암의 검출이 가능하여 난소암의 조기 진단이 가능하다. 나아가, 본 발명의 바이오마커는 혈장 단백질 수준을 기반으로 진단이 가능하며, 극소량의 혈액에서도 민감도와 특이도가 뛰어나, 조직 검사를 수반하는 다른 난소암 진단방법에 비해 그 절차가 간단하며, 환자의 고통과 부담을 현저하게 줄일 수 있다. 본 발명의 난소암 바이오마커는 종래 보고된 난소암 바이오마커와 상이하여 기존의 바이오마커와 함께 또는 이를 대체하여 사용할 수 있다는 장점이 있으며, 약물 투여 후 치료효과에 대한 마커로도 사용할 수 있어, 환자에 대한 난소암의 임상적 치료제 스크리닝에 있어서도 매우 유용하게 사용될 수 있다.

Description

난소암 진단용 다중 바이오 마커 및 이의 용도

본 발명은 난소암 진단용 다중 바이오 마커 및 이의 용도에 관한 것으로, MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 둘 이상의 단백질을 포함하는 난소암 진단용 바이오마커 조합, 상기 바이오마커 단백질 또는 이를 코딩하는 유전자 수준을 측정할 수 있는 제제를 포함하는 난소암의 진단용 조성물 또는 키트, 및 상기 바이오마커 조합을 사용한 난소암의 진단 방법 또는 난소암 예방 또는 치료용 약물 스크리닝 방법에 관한 것이다.

난소암은 난소에 발생하는 악성 종양으로 주로 50대 이상의 폐경기 여성에서 자주 발생하는 것으로 나타나며, 자궁경부암과 함께 여성에게 가장 흔한 부인과 암이다. 2019년 건강보험심사평가원의 자료에 의하면, 암으로 사망하는 여성환자의 47%가 난소암으로 사망했으며, 자궁경부암, 유방암, 갑상선 암과 같은 다른 여성암보다 현저하게 높은 치사율을 나타낸다. NIH의 보고에 따르면(NIH, Cancer Stat Facts: Ovarian Cancer), 여성의 1.2% 이상이 난소암을 겪고 있으며, 난소암 환자의 5년 생존률은 단지 49.1%에 불과하다.

특히, 난소암은 증상의 발현 시, 전이 단계에 있는 경우가 많으며, 실제 보고에 의하면, 약 70%의 이상의 환자가 말기 단계(advanced stage)에서 진단되며(Holschneider and Berek, 2000), 약 60%가 전이 이후(distant)에 진단되는 것으로 보고된다 (Siegel et al., 2017; 및 NIH, SEER program). 반면 초기 단계(early stage, localized)에서 진단시 5년 생존률은 92.6%로 매우 높은 수준으로 증가한다. 따라서, 난소암의 생존률 및 치료 가능성을 높이는 가장 유효한 전략은 난소암의 조기진단에 있으나, 현재 임상적으로 사용되는 난소암의 진단은 초음파 또는 촉지를 통한 물리적 검사방법을 통해 종양을 확인한 뒤, 조직검사 또는 혈액검사(CA-125 등)를 통해 악성 여부를 판단하며, 현재로서는 가장 일찍 난소암을 발견할 수 있는 방법이다. 초음파, 촉지 검사를 통한 방법은 종양이 어느 정도 성장된 뒤에야 확인이 가능하며, 악성종양의 정확한 확진을 위해서는 조직검사가 필수적으로 수반되어야 하기 때문에, 매우 인체 침습적이며, 환자에게 고통과 부담을 야기한다. 따라서, 이러한 방법을 대체하기 위한 진단 방법으로 혈액 검사가 고안되었으며, 난소암을 진단하기 위한 혈액 바이오마커의 발굴을 위한 많은 투자와 연구를 통해 CA125, HE4, CEA등의 바이오마커가 보고되었으나, 각각의 바이오마커는 낮은 민감도 및 특이성으로 인해 임상에서 판단의 참고를 위해서만 사용되며, 난소암 확진을 위해 기존의 방법을 대체하기는 어렵다.

난소암의 조기 진단을 위한 가장 일반적인 바이오마커는 CA125이다. 그러나, CA125는 난소암외에도 난소의 자궁선근증(adenomyosis), 자궁근종(uterine myoma), 자궁내막 병리 (endometrial pathology), 자궁내막증(endometriosis)에서도 검출되어, 단일 바이오마커로의 사용에 한계가 있다(Kim et al., 2019). 또한, 조기 진단 마커로서, HE4, IL-2R, prolactin, CA 15-3, CA 19-9, CA 72-4, Cyfra 21-1, TNFR1, TNFR2, IL-6, IL-7, IL-10, TNF-α, TSH, IGFBP1, MMP-7, VCAM-1, eotaxin-1, FSH, LH, ErbB2, ApoA1,TTR, adiponectin, 및 CD40L 등이 보고된 바 있으나, CA125외의 상기 바이오마커들은 민감도 및 특이성이 매우 낮다((Baron et al., 2003; Perkins et al., 2003). 이와 같이, 단일 바이오마커는 난소암을 제외한 다양한 질병에서도 발현이 증가할 수 있으며, 해당 바이오마커를 발현하지 않는 난소암 환자의 진단이 불가능하다. 따라서, 단일 바이오마커를 사용한 난소암의 진단은 매우 낮은 특이도와 민감도를 가져, 정확한 진단에 사용하기 어렵다.

상기 단일 바이오마커의 한계를 극복하기 위한 분석 방법으로 다중 바이오마커의 조합을 사용한 다변량 지수 분석(Multivariate index assay)이 개발되었다. Jacobs 및 그룹은 CA125를 초음파 및 폐경기와 결합하여, “Risk of Malignancy Index” (RMI) 알고리즘을 제안한 바 있다(Jacobs et al., 1990). RMI는 골반 종괴가 있는 여성으로부터 난소암 환자를 구별하기 위한 방법이다. 또한, Ova1은 FDA 승인된 다변량 지수 분석으로, 5개의 혈장 단백질 마커 패널로 구성된다(CA125-II, transferrin, beta-2 microglobulin, apolipoprotein A-1, 및 transthyretin). Ova1 은 35%의 낮은 특이도 및 96%의 민감도를 갖는다(Ueland et al., 2011; Miller et al., 2011). 또 다른 다변량 지수 분석 방법으로 골반 종괴를 갖는 여성의 상피암을 예측하기 위한 방법으로 Moore 그룹의 ROMA(Risk of Ovarian Malignancy Algorithm)이 있다. 2011년 FDA 승인된 ROMA score는 HE4, CA125및 폐경기의 조합으로 약 75%의 특이도를 가진다. HE4, CA125 및 연령의 조합을 사용하는 코펜하겐 지수 (CPH-I)라는 또 다른 바이오 마커 기반 지수는 Karlsen 등이 개발하였으며, ROMA 및 RMI와 유사하지만 초음파 및 폐경기 상태를 고려하지 않는다. 상기한 현재 임상에서 사용되는 다중 바이오마커 기반의 분석법은 낮은 특이도와 민감도를 가지며, 혈장 마커이외에도, 초음파를 통한 골반종괴의 확인, 폐경기 여부, 나이 등이 마커로 포함되어, 전체적인 여성을 대상으로 하는 난소암의 진단법으로 사용될 수 없고, 따라서, 상기한 방법들은 이상적인 진단 방법이 아닌 환자의 1차 분류 및 참고용 시험법으로 사용되는 실정이다. 따라서, 난소암의 확진을 위해서는 기존의 조직 검사등이 함께 수반되어야 하므로, 환자에게 부담되는 고통 및 부담이 여전히 수반된다.

결과적으로, 현재 높은 특이성과 민감도로 난소암의 진단, 특히 I기 및 II기에서의 조기 진단이 가능한 바이오마커는 높은 필요성에도 불구하고, 거의 전무한 상황이다. 또한, 바이오마커의 조합은 항상 민감도와 특이도의 향상을 수반하지 않으며, 민감도 및 특이도 중 어느 하나가 향상되더라도, 다른 하나를 감소시키는 경우가 빈번하다. 따라서, 높은 민감도와 특이도로 난소암의 조기진단이 가능한 바이오마커의 발굴 및 이들의 최적의 조합을 통한 진단방법의 개발이 요구된다(Heliyon 5 (2019) e02826).

이러한 배경기술 하에서 본 발명자들은 높은 특이도와 민감도로 난소암의 진단, 특히 조기진단이 가능한 바이오마커를 발굴하고자 예의 노력한 결과, MBL2, APOL1 및 SERPINA5를 포함하는 새로운 난소암 조기진단용 단백질 바이오마커를 도출하였으며, 이들을 조합하는 경우에 수 내지 수십 μL의 극소량의 시료에서도 기존에 보고된 바이오마커 또는 이의 조합을 사용한 난소암의 진단방법보다 현저히 높은 특이도와 민감도로 난소암을 진단할 수 있으며, 특히 1기 및 2기의 난소암의 조기진단이 가능함을 확인하고 본 발명을 완성하였다.

본 배경기술 부분에 기재된 상기 정보는 오직 본 발명의 배경에 대한 이해를 향상시키기 위한 것이며, 이에 본 발명이 속하는 기술분야에서 통상의 지식을 가지는 자에게 있어 이미 알려진 선행기술을 형성하는 정보를 포함하지 않을 수 있다.

[발명의 내용]

[해결하고자 하는 과제]

본 발명의 목적은 높은 특이도와 민감도로 난소암의 진단이 가능한 바이오마커 및 이의 조합을 제공하는 데 있다.

본 발명의 또 다른 목적은 상기 바이오마커 및 이의 조합의 난소암의 진단 용도를 제공하는 데 있다.

본 발명의 다른 목적은 높은 특이도와 민감도로 난소암의 진단이 가능한 난소암의 진단용 조성물을 제공하는 데 있다.

본 발명의 또 다른 목적은 높은 특이도와 민감도로 난소암의 진단이 가능한 난소암의 진단용 키트를 제공하는 데 있다.

본 발명의 또 다른 목적은 높은 특이도와 민감도로 난소암의 진단이 가능한 난소암의 진단방법 또는 진단을 위한 정보제공방법을 제공하는 데 있다.

[과제의 해결수단]

상기 목적을 달성하기 위하여, 본 발명은 MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 둘 이상의 단백질을 포함하는 난소암의 진단용 바이오마커 또는 이의 조합을 제공한다:

본 발명은 또한, MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 둘 이상의 단백질 또는 이를 코딩하는 유전자 수준을 측정할 수 있는 제제를 포함하는 난소암의 진단용 조성물을 제공한다.

본 발명은 또한, MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 둘 이상의 단백질 또는 이를 코딩하는 유전자 수준을 측정할 수 있는 제제를 포함하는 난소암의 진단용 키트를 제공한다.

본 발명은 또한, 다음 단계를 포함하는 난소암의 진단방법 또는 진단을 위한 정보제공방법을 제공한다:

(a) 대상으로부터 분리된 시료로부터, MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 둘 이상의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정하는 단계;

(b) 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 대조군과 비교하는 단계.

본 발명은 또한, 다음 단계를 포함하는 난소암의 예방 또는 치료용 약물을 스크리닝하는 방법을 제공한다:

(a) 대상으로부터 분리한 시료 또는 암 질환 동물 모델에 후보 약제를 처리하는 단계; 및

(b) 상기 후보 약제가 처리된 시료 또는 암 질환 동물 모델에서 MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 둘 이상의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정하는 단계.

도 1은 중간값 기반으로 정규화(Median centering normalization)된 혈장 단백질의 양과 피크 범위(peak area)를 분석한 결과이다.

도 2는 3개의 그룹(정상, 1-2기, 3-4기)의 전체 혈장 단백질체에서 분석된 차등 발현 단백질(Differential expressed proteins)의 수를 나타낸 것이다. 밴다이어그램에서, 초록색은 정상 및 1-2기 난소암 환자, 파란색은 정상 및 3-4기 난소암 환자, 분홍색은 1-2기 및 3-4기 난소암 환자간의 차등 발현 단백질을 나타낸 것이다.

도 3은 초기 난소암환자(1-2기, 3a) 또는 전체 난소암 환자(3b)의 진단을 위한 최적의 마커 단백질 후보 선별을 위해 수행한 기능 선택 프로세스(Feature selection process) 결과를 나타낸 것이다. Probavility가 0.50 미만의 마커는 조합에서 제외하였다.

도 4는 정상 대조군과 1-2기 난소암 환자에서 7개 혈장 단백질 수준을 비교한 박스 플롯이다.

도 5는 정상 대조군과 전체 난소암 환자에서 7개 혈장 단백질 수준을 비교한 박스 플롯이다.

도 6은 3개의 단백질 마커에 대해 난소암 환자군 (병기 1-2기)의 진단 검증을 위한 랜덤 포레스트 모델의 훈련 정보를 개략적으로 나타낸 것이다.

도 7은 3개의 단백질 마커에 대해 난소암 환자군 (병기 1-2기)의 진단 검증을 위한 서포트 벡터 머신 모델의 훈련 정보를 개략적으로 나타낸 것이다.

도 8은 초기 난소암 예측 모델의 3개의 단백질 패널을 포함하는 랜덤 포레스트 분석 모델을 이용하여 정상군과 난소암 환자(1, 2기)의 훈련세트와 검증세트에서의 ROC 분석 결과이다.

도 9는 초기 난소암 예측 모델의 3개의 단백질 패널을 포함하는 서프트 벡터 머신(SVM) 분석 모델을 이용하여 정상군과 난소암 환자(1, 2기)의 훈련세트와 검증세트에서의 ROC 분석 결과이다.

도 10은 초기 난소암 예측 모델의 3개의 단백질(a: APOL1, b: SERPINA5, C: MBL2)을 각각 독립적으로 사용하여 난소암을 진단하는 경우의 ROC 분석 결과이다.

도 11은 7개의 단백질 마커에 대해 난소암 환자군(전체 병기)의 진단 검증을 위한 랜덤 포레스트 모델의 훈련 정보를 개략적으로 나타낸 것이다.

도 12는 3개의 단백질 마커에 대해 난소암 환자군(전체 병기)의 진단 검증을 위한 서포트 벡터 머신 모델의 훈련 정보를 개략적으로 나타낸 것이다.

도 13은 난소암 예측 모델의 7개의 단백질 패널을 포함하는 랜덤 포레스트 분석 모델을 이용하여 정상군과 난소암 환자(1, 2, 3, 4기)의 훈련세트와 검증세트에서의 ROC analysis 분석 결과이다.

도 14는 난소암 예측 모델의 7개의 단백질 패널을 포함하는 서포트 벡터 머신 분석 모델을 이용하여 정상군과 난소암 환자(1, 2, 3, 4기)의 훈련세트와 검증세트에서의 ROC 분석 결과이다.

도 15는 난소암 예측 모델의 7개의 단백질(a: APOL1, b: SERPINA5, c: MBL2, d: ECM1, e: SERPINA7, f: CPN2, g: ADIPOQ)을 각각 독립적으로 사용하여 난소암을 진단하는 경우의 ROC 분석 결과이다.

[발명을 실시하기 위한 구체적인 내용]

다른 식으로 정의되지 않는 한, 본 명세서에서 사용된 모든 기술적 및 과학적 용어들은 본 발명이 속하는 기술분야에서 숙련된 전문가에 의해서 통상적으로 이해되는 것과 동일한 의미를 갖는다. 일반적으로 본 명세서에서 사용된 명명법은 본 기술분야에서 잘 알려져 있고 통상적으로 사용되는 것이다.

본 명세서에 기재된 농도 범위에 있어서, “내지”는 양 임계 범위를 포함(이상 및 이하)하는 의미로 사용되었으며, 양 임계 범위를 포함하지 않는 경우 “초과” 및 “미만”으로 농도 범위를 기재하였다. 본 명세서에서 수치에 사용된 “약”은 통상의 기술자에 의해 기재된 수치와 실질적으로 동등한 효과를 나타낼 수 있을 것으로 기대되는 범위를 포함하는 의미로 사용되며, 예를 들어, 기재된 수치 값의 ±20%, ±10%, ±5% 등일 수 있으나, 이에 제한되는 것은 아니다.

난소암은 약 1~2%의 여성에게 발병하는 것과 대비하여, 암으로 사망하는 여성환자의 47%가 난소암으로 다른 여성암보다 현저하게 높은 치사율을 나타내고, 난소암으로 확진된 난소암 환자의 5년 생존률 또한 50% 미만으로 매우 낮다. 낮은 치사율의 원인은 난소암의 경우 증상의 발현시 대부분 전이단계에 있는 경우가 많으며, 진단되는 시기 이미 상당히 진행되어 있기 때문이다.

따라서, 난소암의 생존률 및 치료 가능성을 높이는 가장 유효한 전략은 난소암의 조기진단에 있으나, 현재 임상적으로 사용되는 난소암의 진단은 초음파 또는 촉지를 통한 물리적 검사방법을 통해 종양을 확인한 뒤, 조직검사 또는 혈액검사(CA-125 등)를 통해 악성 여부를 판단하며, 현재로서는 가장 일찍 난소암을 발견할 수 있는 방법이다. 혈액 검사를 통한 난소암의 진단은 조직검사 등에 비해 비침습적이고 환자의 부담을 줄이는 특성이 있다. 그러나, RMI법(RMI I, II, III), ROMA, CPH-1, Ova1 등의 현재 승인된 혈액 검사법은 독립적인 진단방법이 아닌 종괴가 발견된 환자로부터, 악성여부를 선별하기 위한 것이 대부분이며, 그 민감도 및 특이도가 낮고, 나이 또는 폐경기와 같은 혈액 바이오마커 외의 다른 요소를 포함하여, 특정 조건의 환자에게만 적용이 가능하다는 단점이 있다.

본 발명의 일 실시예에서는, 혈장 샘플을 대상으로 QTOF LC-MS 기반의 정량적 혈장 단백질체 분석기법인 SWATH(Sequential Window Acquisition of all Theoretical Mass Spectra)을 사용하여, 정상대조군과 난소암 환자의 혈장 단백질을 정량적으로 분석하였다. 정상대조군과 난소암 환자에서 유의미한 수준 차이를 확인 하였으며, 약 133개의 후보 단백질 중 난소암 환자의 진단을 위한 바이오마커 후보군(MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ)을 도출하였다.

본 발명의 다른 실시예에서는, 도출된 바이오마커 후보군의 조합을 사용하여 랜덤 포레스트 모델 및 서포트 벡터 머신 등의 다양한 예측 통계 모델로 정량된 바이오마커를 평가하는 경우에, 기존에 보고된 난소암 환자의 진단방법과 비교하여 현저히 높은 민감도와 특이도로 난소암 환자를 진단할 수 있음을 확인 하였으며, 특히, MBL2, APOL1, 및 SERPINA5 중 둘 이상의 조합이 1기 및 2기의 초기 난소암 환자를 매우 높은 민감도와 특이도로 진단할 수 있음을 확인하였다.

따라서, 본 발명은 일 관점에서, MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ 중 둘 이상의 단백질을 포함하는 난소암의 진단용 바이오마커 조합에 관한 것이다.

본 발명에 있어서, 바람직하게는 MBL2, APOL1 및 SERPINA5 중 둘 이상의 단백질을 포함하는 것을 특징으로 할 수 있으며, 더욱 바람직하게는 MBL2, APOL1 및 SERPINA5 단백질을 포함하는 것을 특징으로 할 수 있다.

본 발명에 있어서, MBL2, APOL1 및 SERPINA5 단백질과 함께, SERPINA7, ECM1, CPN2 및 ADIPOQ 중 어느 하나 이상의 단백질을 추가로 포함하는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 개시된 MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ 중 둘 이상의 단백질외에도 종래 난소암 마커로 공지된 다양한 혈장 바이오마커와 조합하여 구성되는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 난소암은 1기 및 2기의 난소암인 것을 특징으로 할 수 있으나, 이에 제한되는 것은 아니다.

본 발명은 다른 관점에서, MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ 중 둘 이상의 단백질의 조합의 난소암의 진단용도에 관한 것이다.

본 발명은 다른 관점에서, MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 둘 이상의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제를 포함하는 난소암의 진단용 조성물에 관한 것이다.

본 발명에 있어서, 상기 난소암의 진단용 조성물은 MBL2, APOL1 및 SERPINA5의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제를 포함하는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 난소암의 진단용 조성물은 바람직하게는 MBL2 및 APOL1, MBL2 및 SERPINA5, 또는 APOL1 및 SERPINA5, 가장 바람직하게는 MBL2, APOL1 및 SERPINA5의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제를 포함할 수 있으며, 이 때, 상기 난소암의 진단은 1기 및/또는 2기 난소암의 진단인 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 난소암의 진단용 조성물은 MBL2, APOL1 및 SERPINA5의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제와 함께, SERPINA7, ECM1, CPN2 및 ADIPOQ 중 어느 하나 이상의 단백질수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제를 포함하는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 난소암의 진단용 조성물은, MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제를 포함하는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 난소암의 진단용 조성물은 상기 개시된 본 발명의 난소암 진단용 바이오마커 단백질 외에도, 종래 난소암 마커로 공지된 다양한 혈장 바이오마커 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제를 추가로 포함하는 것을 특징으로 할 수 있다.

본 발명의 용어. “MBL2(mannose binding lectin 2)”는 Mannose binding protein C(MBP-C)등 으로도 명칭된다. MBL2는 혈장에 존재할 수 있으며, 박테리아, 효모, 바이러스를 포함하는 만흔 미생물에서 만노스 및 N-아세틸 글루코사민을 인식하고 결합하여 보체 경로를 활성화한다. 본 발명에 있어서, 대표적인 인간 MBL2의 서열은 서열번호 1(UniProtKB - P11226)과 같으나, 이에 제한되는 것은 아니며, 서열번호 1과 실질적으로 상동성이 있는 것으로 판단되는 펩티드 서열을 포함하는 단백질 또는 이의 돌연변이를 포함한다. 예를 들어, 서열번호 1과 약 80% 이상의 상동성, 바람직하게는 85% 이상의 상동성, 더욱 바람직하게는 90% 이상의 상동성, 더욱 바람직하게는 95% 이상의 상동성, 더욱 바람직하게는 97% 이상의 상동성, 가장 바람직하게는 99% 이상의 상동성을 갖는 서열을 포함할 수 있으나, 이에 제한되는 것은 아니다.

본 발명의 용어. “APOL1(Apolipoprotein L1)”은 일반적으로 HDL에 포함된 아포지단백 성분으로 혈액을 통해 순환하며 염증반응에 관여하고, 특히, APOL1은 리소좀 팽윤 및 용해를 유도하여 autophagy를 유도하는 것으로 보고된다. APOL1은 수면병, 신장 질환, FSGS와 같은 질환과 연관된 것으로 알려져 있다. 본 발명에 있어서, 대표적인 인간 APOL1의 서열은 서열번호 2(UniProtKB - O14791)과 같으나, 이에 제한되는 것은 아니며, 서열번호 2와 실질적으로 상동성이 있는 것으로 판단되는 펩티드 서열을 포함하는 단백질 또는 이의 돌연변이를 포함한다. 예를 들어, 서열번호 1과 약 80% 이상의 상동성, 바람직하게는 85% 이상의 상동성, 더욱 바람직하게는 90% 이상의 상동성, 더욱 바람직하게는 95% 이상의 상동성, 더욱 바람직하게는 97% 이상의 상동성, 가장 바람직하게는 99% 이상의 상동성을 갖는 서열을 포함할 수 있으나, 이에 제한되는 것은 아니다.

본 발명의 용어, “SERPINA 5(Serpin Family A Member 5)”는 혈장 세린 프로테아제 억제제(plasma serine protease inhibitor) 또는 단백질 C 억제제(Protein C inhibitor, PCI)으로도 명칭된다. SERPINA5는 단백질 C의 활성을 억제하며, 특히 남성 종양인 전립선 암의 혈장 바이오마커로 알려진 단백질이다. 대표적인 인간 SERPINA5의 서열은 서열번호 3(UniProtKB: P05154)과 같으나, 이에 제한되는 것은 아니며, 서열번호 3과 실질적으로 상동성이 있는 것으로 판단되는 펩티드 서열을 포함하는 단백질 또는 이의 돌연변이를 포함한다. 예를 들어, 서열번호 3과 약 80% 이상의 상동성, 바람직하게는 85% 이상의 상동성, 더욱 바람직하게는 90% 이상의 상동성, 더욱 바람직하게는 95% 이상의 상동성, 더욱 바람직하게는 97% 이상의 상동성, 가장 바람직하게는 99% 이상의 상동성을 갖는 서열을 포함할 수 있으나, 이에 제한되는 것은 아니다.

본 발명의 용어, “SERPINA7(Serpin Family A Member 7)”는 티록신 결합 글로불린(Thyroxine binding globulin, TBG)으로도 명칭된다. SERPINA7는 갑상선 호르몬과 결합가능한 혈장 수송 단백질로 보고된다. 대표적인 인간 SERPINA7의 서열은 서열번호 4(UniProtKB: P05543)과 같으나, 이에 제한되는 것은 아니며, 서열번호 4와 실질적으로 상동성이 있는 것으로 판단되는 펩티드 서열을 포함하는 단백질 또는 이의 돌연변이를 포함한다. 예를 들어, 서열번호 4와 약 80% 이상의 상동성, 바람직하게는 85% 이상의 상동성, 더욱 바람직하게는 90% 이상의 상동성, 더욱 바람직하게는 95% 이상의 상동성, 더욱 바람직하게는 97% 이상의 상동성, 가장 바람직하게는 99% 이상의 상동성을 갖는 서열을 포함할 수 있으나, 이에 제한되는 것은 아니다.

본 발명의 용어, “ECM1(Extracellular matrix protein 1)”은 세포 증식, 혈관 신생 및 분화 기능을 갖는 것으로 알려진 분비성 당단백질이며, 유방암, 갑상선암, 간세포암 등의 암종에서 종양의 발달 촉진과 관련이 있는 것으로 알려져 있다(Atlas of Genetics and Cytogenetics in Oncology and Haematology). 대표적인 인간 ECM1의 서열은 서열번호 5(UniProtKB: Q16610)와 같으나, 이에 제한되는 것은 아니며, 서열번호 5와 실질적으로 상동성이 있는 것으로 판단되는 펩티드 서열을 포함하는 단백질 또는 이의 돌연변이를 포함한다. 예를 들어, 서열번호 5와 약 80% 이상의 상동성, 바람직하게는 85% 이상의 상동성, 더욱 바람직하게는 90% 이상의 상동성, 더욱 바람직하게는 95% 이상의 상동성, 더욱 바람직하게는 97% 이상의 상동성, 가장 바람직하게는 99% 이상의 상동성을 갖는 서열을 포함할 수 있으나, 이에 제한되는 것은 아니다.

본 발명의 용어, “CPN2(Carboxypeptidase N Subunit 2)”는 인간 혈장 단백질로 촉매 서브유닛에 결합 및 안정화하는 것으로 알려져 있다. CPN2는 또한, 간암 조직에서 발현이 향상되는 것으로 보고된다(The Human protein atlas). 대표적인 인간 CPN2의 서열은 서열번호 6(UniProtKB: P22792)과 같으나, 이에 제한되는 것은 아니며, 서열번호 6과 실질적으로 상동성이 있는 것으로 판단되는 펩티드 서열을 포함하는 단백질 또는 이의 돌연변이를 포함한다. 예를 들어, 서열번호 6과 약 80% 이상의 상동성, 바람직하게는 85% 이상의 상동성, 더욱 바람직하게는 90% 이상의 상동성, 더욱 바람직하게는 95% 이상의 상동성, 더욱 바람직하게는 97% 이상의 상동성, 가장 바람직하게는 99% 이상의 상동성을 갖는 서열을 포함할 수 있으나, 이에 제한되는 것은 아니다.

본 발명의 용어, “ADIPOQ(adiponectin)”는 GBP-28, apM1, 및 Acrp30 등으로도 명칭된다. ADIPOQ는 포도당 조절 및 지방산 산화 등의 대사과정을 조절하는 단백질 호르몬으로, 혈장에 매우 풍부하게 존재한다. ADIPOQ의 변이는 유방암과 연관되는 것으로 보고된다(Cancers 2021, 13(10), 2261). 대표적인 인간 ADIPOQ의 서열은 서열번호 7(UniProtKB: Q15848)과 같으나, 이에 제한되는 것은 아니며, 서열번호 7과 실질적으로 상동성이 있는 것으로 판단되는 펩티드 서열을 포함하는 단백질 또는 이의 돌연변이를 포함한다. 예를 들어, 서열번호 7과 약 80% 이상의 상동성, 바람직하게는 85% 이상의 상동성, 더욱 바람직하게는 90% 이상의 상동성, 더욱 바람직하게는 95% 이상의 상동성, 더욱 바람직하게는 97% 이상의 상동성, 가장 바람직하게는 99% 이상의 상동성을 갖는 서열을 포함할 수 있으나, 이에 제한되는 것은 아니다.

본 발명에 있어서, 상기 “진단”은 특정 질병 또는 질환에 대한 대상(subject)의 상태를 정확하게 파악하는 것을 의미한다. 예를 들어, 특정 질병 또는 질환에 대한 대상의 상태는 특정 질병 또는 질환에 대한 감수성(susceptibility), 현재 대상이 앓고 있는 질환의 판정뿐만 아니라, 대상의 예후(prognosis), 암 상태의 동정, 암의 단계 결정 또는 치료에 대한 암의 감수성 및 반응성에 대한 예측과 같은 질환의 특성에 대한 확인, 특정 약물의 치료 효을 확인하기 위해 대상의 상태를 확인하는 것과 같이 환자의 질병 및 상태에 따른 적절한 처치의 근거를 얻는 것, 나아가 특정 질병 또는 질환으로부터 완치된 대상에서의 재발여부의 예측 및 확인을 포함하는 광의의 의미로 사용된다. 본 발명에 있어서, 바람직하게는, 상기 진단은 질환의 발병 여부 또는 발병 가능성을 확인하는 것이다.

본 발명에 있어서, 용어 "예후"는 의학적 귀추(예컨대, 장기 생존 가능성, 무병생존율 등)에 대한 예상을 의미하며, 양성적 예후(긍정적 예후) 또는 음성적 예후(부정적 예후)를 포함하며, 상기 음성적 예후는 재발, 종양 성장, 전이, 약 저항성 등의 병의 진행 또는 치명성(mortality)을 포함하고, 양성적 예후는 질병이 없는 상태 등의 질병의 차도, 종양 퇴행 등의 질병의 개선 또는 안정화(stabilization)를 포함한다.

본 발명에 있어서, 용어 "예측"은 의학적 귀추에 대하여 미리 헤아려 짐작하는 것을 의미하며, 본 발명의 목적상 난소암으로 진단받은 환자의 병의 경과(병의 진행, 개선, 위암의 재발, 종양 성장, 약 저항성)를 미리 짐작하는 것을 의미한다.

본 발명에 있어서, 상기 진단의 대상 질병 또는 질환은 난소암인 것을 특징으로 할 수 있다. 상기 난소암은 난소 또는 난소의 주변기관에서 발생하는 악성종양, 즉 암을 의미한다. 구체적인 예로, 상기 난소암은 난소에서의 상피세포암, 배세포종양, 및 성삭 기질 종양을 포함하며, 더욱 구체적인 예로, 장액성 난소암(Serous carcinoma), 점액성 난소암(Mucinous carcinoma), 자궁내막양 난소암(Endometroid carcinoma), 투명세포암(Clear cell carcinoma), 브레너 종양(Malignant brenner tumor), 미분화세포암(Undifferentiated carcinoma), 미분류 난소암(Unclassified Carcinoma)을 포함하나, 이에 제한되는 것은 아니다.

본 발명에 있어서, 상기 난소암은 병기에 따라 구분될 수 있으며, 구체적으로는 1기 내지 4기의 난소암으로 구분될 수 있으며, 1기 및 2기를 초기(early stage)로, 3기 및 4기를 진행된 병기(advanced stage)로 분류한다(FIGO 분류 기준).

본 발명의 용어, 난소암의 병기는 아래의 기준에 따라 분류될 수 있다(TNM 및 FIGO 분류 기준, 2019, 비뇨생식기영상진단 부인과영상, 비뇨생식기영상의학회):

본 발명의 난소암 진단용 조성물은 1기 내지 4기의 전체 난소암을 진단하는데 사용되는 것을 특징으로 할 수 있으며, 바람직하게는 1기 내지 2기의 초기 난소암을 진단하는데 사용될 수 있으나, 이에 제한되는 것은 아니다.

본 발명에 있어서, 상기 단백질 수준을 측정할 수 있는 제제는 예를 들어, 본 발명의 각 난소암 진단용 바이오마커 단백질에 특이적으로 결합하는 항체, 올리고펩타이드, 리간드, PNA(peptide nucleic acid) 및 앱타머(aptamer) 중 어느 하나 이상일 수 있으나, 이에 제한되는 것은 아니다.

본 발명에 있어서, 상기 항체는 다클론 항체, 단클론 항체 및 재조합 항체 등의 "항체"를 모두 포함하며 항체란 항원성 부위에 대해서 지시되는 특이적인 단백질 분자를 의미한다. 다클론 항체는 본 발명의 난소용 진단용 바이오마커 단백질을 항원으로 동물에 주사하고 동물로부터 채혈하여 항체를 포함하는 혈청을 수득하는 당업계에 널리 공지된 방법에 의해 생산할 수 있다. 이러한 다클론 항체는 염소, 토끼, 양, 원숭이, 말, 돼지, 쥐, 랫트(rat), 소, 개 등의 임의의 동물 종 숙주로부터 제조 가능하다. 단클론 항체는 당업계에 널리 공지된 하이브리도마 방법(Kohler 및 Milstein (1976) European Jounral of Immunology 6:511-519 참조), 또는 파지 항체 라이브러리(Clackson et al, Nature, 352:624-628, 1991; Marks et al, J. Mol. Biol., 222:58, 1-597, 1991) 기술을 이용하여 제조될 수 있다. 상기 방법으로 제조된 항체는 겔 전기영동, 투석, 염 침전, 이온교환 크로마토그래피, 친화성 크로마토그래피 등의 방법을 이용하여 분리, 정제할 수 있다. 또한 본 발명의 항체는 2개의 전체 길이의 경쇄 및 2개의 전체 길이의 중쇄를 가지는 완전한 형태뿐만 아니라, 항체 분자의 기능적인 단편을 포함한다. 항체 분자의 기능적인 단편이란 적어도 항원 결합 기능을 보유하고 있는 단편을 뜻하며, Fab, F(ab'), F(ab') 2 및 Fv 등이 있다.

이러한 항체에는 일반적으로 알칼라인 포스파타제(alkaline phosphatase, AP) 또는 홀스래디쉬 퍼록시다제 (horseradish peroxidase, HRP) 등의 효소가 컨쥬게이션된 2차 항체 및 이들의 기질을 사용하여 발색반응시킴으로써 정량분석하거나, 직접 상기 단백질 모노클로날 항체에 AP 또는 HRP 효소 등이 컨쥬게이션된 것을 사용하여 정량분석할 수도 있다.

본 발명에 있어서, 상기 “PNA(Peptide Nucleic Acid)”는 인공 합성된 DNA 또는 RNA와 유사한 중합체로, 펩타이드 결합에 의해 연결된 N-(2-aminoethyl)-glycine 골격을 갖는다. PNA는 DNA 또는 RNA에 대한 결합력과 안정성이 향상되어, 진단 분석에 사용된다.

본 발명에 있어서, 상기 “앱타머(aptamer)”는 올리고 핵산 또는 펩타이드 분자로, 표적에 특이적으로 결합하는 것을 특징으로 할 수 있다. 본 발명에 있어서, 상기 압타머는 본 발명의 난소암 진단용 바이오마커 단백질 중 어느 하나 이상에 특이적으로 결합하는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 유전자의 발현 수준을 측정할 수 있는 제제는 각 단백질을 코딩하는 유전자에 특이적으로 결합하는 프라이머, 프로브 및 안티센스 뉴클레오티드로 구성된 군에서 선택되는 것을 특징으로 할 수 있으나, 이에 제한되는 것은 아니다.

본 발명에서 용어, "프라이머"는 짧은 자유 3 말단 수산화기(free 3` hydroxyl group)을 가지는 핵산 서열로 상보적인 주형(template)와 염기쌍(base pair)을 형성할 수 있고 주형의 복사를 위한 시작지점으로는 기능을 하는 짧은 핵산 서열을 의미한다. 본 발명에서는 본 발명 마커 폴리뉴클레오티드의 센스 및 안티센스 프라이머를 이용하여 PCR 증폭을 실시하여 원하는 생성물의 생성 여부를 통해 위암의 예후를 예측할 수 있다. PCR 조건, 센스 및 안티센스 프라이머의 길이는 당업계에 공지된 것을 기초로 변형할 수 있다.

본 발명의 "프로브"란 mRNA와 특이적 결합을 이룰 수 있는 짧게는 수 염기 내지 길게는 수백 염기에 해당하는 RNA 또는 DNA 등의 핵산 단편을 의미하며, 라벨링되어 있어서 특정 mRNA의 존재 유무를 확인할 수 있다. 프로브는 올리고뉴클레오티드 프로브, 단쇄 DNA(single straned DNA) 프로브, 이중쇄 DNA (double stranded DNA) 프로브, RNA 프로브 등의 형태로 제작될 수 있다.

본 발명에 있어서, 상기 단백질 수준의 측정은 본 발명의 질환을 진단하기 위하여 생물학적 시료에서 본 발명의 난소암 진단용 마커인 MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 단백질의 존재 여부와 발현 정도를 확인하는 것을 의미한다.

본 발명에 있어서, 단백질의 수준 측정 또는 비교 분석 방법으로는 웨스턴 블랏(western blotting), ELISA(enzyme linked immunosorbent assay), 방사선면역분석법(Radioimmunoassay), 방사면역확산법(Radioimmunodiffusion), 오우크레로니 (Ouchterlony) 면역 확산법, 로케트(Rocket) 면역전기영동, 조직면역 염색, 면역침전분석법(immunoprecipitation assay), 보체 고정 분석법(complete fixation assay), FACS, 단백질 칩(protein chip), 및 질량 분석법(mass spectrometry) 등이 있으나, 이에 제한되는 것은 아니다.

본 발명에 있어서, 상기 질량 분석법(Mass spectrometry)은 이온화 방법에 따라, 예를 들어 FAB, CI, APCI, ESI, DESI, MALDI, SELDI, ICP, DESI, SESI, LAESI, FD, FAB, DIOS, DART, SIMS, TIMS 등으로, 질량 선택방법에 따라, 4극 질량 필터(qaudrupole mass filter), 이온 포집(ion trap), 전자증배관(electron multiplier) 등으로, 분리 기술과의 조합에 따라, 기체 크로마토그래피(Gas chromatography, GS), 액체 크로마토그래피(liquid chromatography, LC) 등으로 구분될 수 있으며, 질량 분석법으로 도출된 데이터는 SIM, TIC, SRM 과 같은 방법으로 표시될 수 있고, 각 분류는 조합되어 명명된다. 구체적인 예를 들어, MALDI-TOF(Matrix Assisted Laser Desorption/Ionization Time of Flight Mass Spectrometry) 분석, SELDITOF(Sulface Enhanced Laser Desorption/Ionization Time of Flight Mass Spectrometry) 분석, 액상 크로마토그래피-질량분석(liquid chromatography-Mass Spectrometry, LC-MS), LCMS/MS(liquid chromatography-Mass Spectrometry/ Mass Spectrometry) 등이 있으나, 이에 제한되는 것은 아니다.

본 발명은 또 다른 관점에서, MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 둘 이상의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제를 포함하는 난소암의 진단용 키트에 관한 것이다.

본 발명에 있어서, 상기 난소암의 진단용 키트는 MBL2, APOL1 및 SERPINA5의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제를 포함하는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 난소암의 진단용 키트는 바람직하게는 MBL2 및 APOL1, MBL2 및 SERPINA5, 또는 APOL1 및 SERPINA5, 가장 바람직하게는 MBL2, APOL1 및 SERPINA5의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제를 포함할 수 있으며, 이 때, 상기 난소암의 진단은 1기 및/또는 2기 난소암의 진단인 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 난소암의 진단용 키트는 MBL2, APOL1 및 SERPINA5의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제와 함께, SERPINA7, ECM1, CPN2 및 ADIPOQ 중 어느 하나 이상의 단백질수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제를 포함하는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 난소암의 진단용 키트는 MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제를 포함하는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 난소암의 진단용 키트는 상기 개시된 본 발명의 난소암 진단용 바이오마커 단백질 외에도, 종래 난소암 마커로 공지된 다양한 혈장 바이오마커 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제를 추가로 포함하는 것을 특징으로 할 수 있다.

본 발명의 관점에서, 설명되지 않은 용어의 정의 및 구현예들은 별도로 기재되지 않는 한 상기 난소암의 진단용 조성물의 관점에 기재된 것과 동일한 특징을 공유할 수 있다.

본 발명에 있어서, 상기 난소암 진단용 키트는 본 발명의 난소암 진단용 조성물을 포함하는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 난소암 진단용 키트는 분석 방법에 적합한 한 종류 또는 그 이상의 다른 구성 성분 조성물, 용액 또는 장치를 포함할 수 있다. 예를 들어, RT-PCR 키트, DNA 칩 키트, 단백질 칩 키트, 래피드(rapid) 키트, 또는 SRM(selected reaction monitoring)/MRM(Multiple reaction monitoring) 키트일 수 있다.

상기 RT-PCR 키트는 마커 유전자에 대한 특이적인 각각의 프라이머 쌍 외에도 테스트 튜브 또는 다른 적절한 컨테이너, 반응 완충액, 데옥시뉴클레오타이드(dNTPs), Taq-폴리머라아제 및 역전사 효소와 같은 효소, DNase, RNase 억제제, DEPC-수, 멸균수 등을 포함할 수 있다. 또한, 정량 대조구로 사용되는 유전자에 특이적인 프라이머 쌍을 포함할 수 있다. DNA 칩 키트는 유전자 또는 그의 단편에 해당하는 cDNA가 프로브로 부착되어 있는 기판을 포함하고, 기판은 정량구조 유전자 또는 그의 단편에 해당하는 cDNA를 포함할 수 있다.

또한, 본 발명에 따른 키트는 상기 단백질 수준을 측정하는 제재를 포함하는 진단 키트일 수 있으며, 이때 상기 단백질 수준을 측정하는 제제는 바람직하게는 상기 단백질에 특이적인 항체일 수 있다. 따라서, 상기 단백질 수준을 측정하는 제제를 포함하는 진단 키트는, 예컨대, ELISA를 수행하기 위해 필요한 필수요소를 포함하는 진단 마커 검출용 키트일 수 있으며, 이러한 키트는 "항원-항체 복합체"를 형성한 항체를 검출할 수 있는 시약, 예컨대, 표지된 2차 항체, 발색단 (chromophores), 효소(예: 항체와 접합) 및 그의 기질 등을 포함할 수도 있다. 또한, 정량 대조군 단백질에 특이적인 항체를 포함할 수 있다.

아울러, 상기 항원-항체 복합체의 형성량은 검출 라벨(detection label)의 시그널의 크기를 통해서 정량적으로 측정할 수 있다. 이러한 검출 라벨은 효소, 형광물, 리간드, 발광물, 미소입자(microparticle), 레독스 분자 및 방사선 동위원소로 이루어진 그룹 중에서 선택할 수 있으며, 반드시 이로 제한되는 것은 아니다.

상기 SRM(selected reaction monitoring)은 MRM(Multiple reaction monitoring)으로도 명명되며, 탠덤 질량 분광법(Tandem mass spectrometry)에 사용되는 방법으로, 표적 정량 단백질체 분석에 사용된다. 표적 정량 단백질체 분석에 사용되는 SRM은 Nature Methods. 9 (6): 555-566에 상세히 기재되어 있다.

본 발명은 또 다른 관점에서, (a) 대상으로부터 분리된 시료로부터, MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 둘 이상의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정하는 단계;

(b) 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 대조군과 비교하는 단계를 포함하는 난소암의 진단방법 및/또는 진단을 위한 정보제공 방법에 관한 것이다.

본 발명에 있어서, 상기 대상은 인간을 포함하는 동물인 것을 특징으로 할 수 있으며, 바람직하게는 포유동물, 더욱 바람직하게는 인간인 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 시료는 난소암을 진단하고자 하는 대상으로부터 분리된 고형 또는 비고형 시료일 수 있으며, 예를 들어, 대상으로부터 분리된 기관, 조직, 세포 또는 대상으로부터 수득한 전혈(whole blood), 백혈구(leukocytes), 말초혈액 단핵 세포(peripheral blood mononuclear cells), 백혈구 연층(buffy coat), 혈장(plasma), 혈청(serum), 객담(sputum), 눈물 (tears), 점액(mucus), 세비액(nasal washes), 비강 흡인물(nasal aspirate), 호흡(breath), 소변(urine), 정액(semen), 침(saliva), 복강 세척액(peritoneal washings), 복수(ascites), 낭종액(cystic fluid), 뇌척수막액(meningeal fluid), 양수(amniotic fluid), 선액(glandular fluid), 췌장액(pancreatic fluid), 림프액 (lymph fluid), 흉수(pleural fluid), 유두 흡인물(nipple aspirate), 기관지 흡인물(bronchial aspirate), 활액(synovial fluid), 관절 흡인물(joint aspirate), 기관 분비물(organ secretions), 세포(cell), 세포 추출물(cell extract) 또는 뇌척수액(cerebrospinal fluid)일 수 있으나 이에 제한되는 것은 아니다.

본 발명의 일 실시예에서는, 혈장 단백질 수준을 기반으로 높은 민감도와 특이도를 갖는 난소암 진단용 바이오마커 및 이의 조합을 개발하였으며, 따라서 본 발명에 있어서, 상기 시료는 가장 바람직하게는 대상으로부터 수득한 전혈, 혈장 또는 혈청일 수 있다.

본 발명의 바이오마커는 혈장에 매우 낮은 농도로 존재하는 단백질이기 때문에, 민감도와 정확도를 높이기 위해 환자로부터 수득한 시료를 전처리하였다.

따라서, 본 발명에 있어서, 상기 (a) 단계 전에 대상으로부터 분리된 시료를 전처리하는 단계를 추가로 포함하는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 대상으로부터 분리된 시료를 전처리하는 단계는 시료에 풍부하게 존재하는 단백질을 제거하는 단계를 포함하는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 시료에 풍부하게 존재하는 단백질은 시료에

본 발명에 있어서, 상기 대상으로부터 분리된 시료가, 전혈, 혈장, 또는 혈청과 같은 혈액 기반의 시료인 경우, 상기 시료에 풍부하게 존재하는 단백질은 예를 들어, albumin, IgA, IgG, IgM, α1-antitrypsin, α1-acid glycoprotein, apolipoprotein A1, apolipoprotein A2, complement C3, transferrin, α2-macroglobulin, transthyretin, haptoglobin 및 fibrinogen 등이 있으나, 이에 제한되는 것은 아니다.

본 발명에 있어서, 상기 전처리 단계는 시료로부터 albumin, IgA, IgG, IgM, α1-antitrypsin, α1-acid glycoprotein, apolipoprotein A1, apolipoprotein A2, complement C3, transferrin, α2-macroglobulin, transthyretin, haptoglobin 및 fibrinogen으로 구성된 군에서 선택되는 어느 하나 이상을 제거하는 단계를 포함하는 것을 특징으로 할 수 있다.

바람직한 예로서, 본 발명의 일 실시예에서는 상기 단백질을 제거하기 위해 고성능 액체 크로마토 그래피에 연결된 고농도 혈장 단백질 제거 컬럼 MARS14을 사용하였으나, 이에 제한되는 것은 아니다.

본 발명에 있어서, 상기 대상으로부터 분리된 시료를 전처리하는 단계는 시료에 포함된 단백질을 짧은 펩타이드로 절단하는 단계를 포함하는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 시료에 포함된 단백질을 짧은 펩타이드로 절단하는 단계는 당업계에 공지된 다양한 방법을 통해 수행될 수 있다. 본 발명의 일 실시예에서는 트립신/라이스씨 혼합물 사용한 suspension trap 방법으로 대상으로부터 분리된 시료를 전처리하여 짧은 펩타이드로 절단하였으나, 이에 제한되는 것은 아니다.

본 발명에 있어서, 상기 (a) 단계는 단백질 수준을 측정하는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 단백질 수준의 측정은 본 발명의 질환을 진단하기 위하여 생물학적 시료에서 본 발명의 난소암 진단용 마커인 MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 단백질의 존재 여부와 발현 정도를 확인하는 것일 수 있다.

본 발명에 있어서, 상기 (a) 단계의 단백질의 수준 측정방법은 웨스턴 블랏(western blotting), ELISA(enzyme linked immunosorbent assay), 방사선면역분석법(Radioimmunoassay), 방사면역확산법(Radioimmunodiffusion), 오우크레로니 (Ouchterlony) 면역 확산법, 로케트(Rocket) 면역전기영동, 조직면역 염색, 면역침전분석법(immunoprecipitation assay), 보체 고정 분석법(complete fixation assay), FACS, 단백질 칩(protein chip), 및 질량 분석법(mass spectrometry) 등이 있으나, 이에 제한되는 것은 아니며, 단백질의 수준, 바람직하게는 혈장 단백질 수준을 측정할 수 있는 공지된 방법이라면 모두 사용될 수 있다.

본 발명에 있어서, 상기 (a) 단계의 단백질 수준 또는 유전자의 발현 수준은 당업계에 공지된 절대적 정량 방법 또는 상대적 정량 방법에 의해 수행되는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 (a) 단계는 바람직하게는 질량 분석법에 의해 수행되는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 질량 분석법(Mass spectrometry)은 이온화 방법에 따라, 예를 들어 FAB, CI, APCI, ESI, DESI, MALDI, SELDI, ICP, DESI, SESI, LAESI, FD, FAB, DIOS, DART, SIMS, TIMS 등으로, 질량 선택방법에 따라, 4극 질량 필터(qaudrupole mass filter), 이온 포집(ion trap), 전자증배관(electron multiplier) 등으로, 분리 기술과의 조합에 따라, 기체 크로마토그래피(Gas chromatography, GS), 액체 크로마토그래피(liquid chromatography, LC) 등으로 구분될 수 있으며, 질량 분석법으로 도출된 데이터는 SIM, TIC, SRM 과 같은 방법으로 표시될 수 있고, 각 분류는 조합되어 명명될 수 있다. 구체적인 예를 들어, 상기 질량 분석법은 MALDI-TOF(Matrix Assisted Laser Desorption/Ionization Time of Flight Mass Spectrometry) 분석, SELDITOF(Sulface Enhanced Laser Desorption/Ionization Time of Flight Mass Spectrometry) 분석, 액상 크로마토그래피-질량분석(liquid chromatography-Mass Spectrometry, LC-MS), 또는 LCMS/MS(liquid chromatography-Mass Spectrometry/ Mass Spectrometry) 등 일 수 있으나, 이에 제한되는 것은 아니다.

본 발명에 있어서, 상기 질량 분석법에 의해 단백질 수준을 측정하는 경우, 바이오마커에 특이적으로 결합하는 항체, 압타머 등을 개발하거나, 고가의 항체/압타머를 구매하지 않아도 수준의 측정이 가능하다.

특히, 본 발명의 일 실시예에서와 같이, 본 발명의 난소암 진단을 위한 바이오마커를 사용하는 경우 질량 분석법에 기반하여 단백질 수준을 측정하더라도 높은 민감도와 정확도로 난소암, 바람직하게는 초기 난소암을 진단할 수 있는 것을 특징으로 한다.

본 발명에 있어서, 질량 분석법을 기반으로 단백질 수준을 측정하는 방법의 예로서, 표지를 사용한 정량 분석법 또는 비표지 정량 분석법을 제한 없이 사용할 수 있다.

본 발명에 있어서, 상기 표지를 사용한 정량 분석법은 단백질에 검출 신호를 나타내는 물질(예, 형광체 또는 방사선동위원소)등을 사용하여 수행되는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 비표지 정량 분석법은 예를 들어, 본 발명의 실시예에서 수행된 SWATH MS 분석이 있으나, 이에 제한되는 것은 아니다.본 발명에 있어서, 상기 (a) 단계는 바람직하게는 Sequential Window Acquisition of all Theoretical (SWATH) 질량 분석을 통해 수행되는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 (a) 단계는 MBL2, APOL1 및 SERPINA5 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정하는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 (a) 단계는 바람직하게는 MBL2 및 APOL1, MBL2 및 SERPINA5, 또는 APOL1 및 SERPINA5, 가장 바람직하게는 MBL2, APOL1 및 SERPINA5의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정하는 것을 특징으로 할 수 있으며, 이 때, 상기 난소암의 진단은 1기 및/또는 2기 난소암의 진단인 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 (a) 단계는 MBL2, APOL1 및 SERPINA5와 함께, SERPINA7, ECM1, CPN2 및 ADIPOQ 중 어느 하나 이상의 단백질수준 또는 이를 코딩하는 유전자의 발현 수준을 추가로 측정하는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 (a) 단계는 MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정하는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 난소암의 진단용 조성물은 상기 개시된 본 발명의 난소암 진단용 바이오마커 단백질 외에도, 종래 난소암 마커로 공지된 다양한 혈장 바이오마커 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정하는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 (a) 단계는 단백질수준 또는 이를 코딩하는 유전자의 발현수준을 절대적 정량법에 의해 측정하는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 (a) 단계는 단백질수준 또는 이를 코딩하는 유전자의 발현수준을 대조군과 대비하여, 상대적 정량법에 의해 측정하는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 (b) 단계의 대조군은 난소암을 앓지 않는 대상으로부터 분리된 시료의 MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준인 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 (b) 단계의 대조군은 직접적인 측정에 의해 제공될 수 있으며, 또는 기존에 측정되어 제공된 기준값인 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 (a) 단계의 단백질수준 또는 이를 코딩하는 유전자의 발현수준의 측정이 상대적 정량법에 의해 수행되는 경우, 상기 (b) 단계가 상대적 정량 결과에 의해 자동적으로 수행되는 것을 특징으로 할 수 있다.

본 발명의 일 실시예에서, 각 단계(stage)의 2 그룹의 난소암 환자(group 1: 1-2기, group 2: 3-4기) 및 정상 비교군을 각각 비교한 정량적 혈장 단백질체 분석에서, 유의미한 수준의 차이를 나타내는 총 31개의 DEP(differential expressed protein)를 확인하였다. 3 그룹 공통적인 DEP는 Alpolipoprotein L1이었으며 10개의 단백질은 대조군과 난소암 1-2기군, 대조군과 난소암 3-4기군의 공통된 DEP로 타났다. 또한 7개의 단백질들은 대조군과 난소암 1-2기군, 난소암 1-2기군과 난소암 3-4기군간의 공통된 DEP로 나타났다. 특히, 본 발명의 난소암 진단용 바이오마커 중 APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ는 전체 난소암 환자에서 감소하고, MBL2는 증가하는 것으로 나타났다. 특히 1-2기 난소암 환자의 경우, 정상 대조군은 물론, 3-4기 난소암 환자와 비교하는 경우에도 APOL1 및 SERPINA5는 현저한 감소가 나타났으며, MBL2는 현저히 증가하는 것으로 확인되었다.

따라서, 본 발명에 있어서, (C) 다음 중 어느 하나 이상의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준 변화가 검출되는 경우, 대상이 난소암을 앓을 가능성이 있는 것으로 확인하는 단계를 추가로 포함하는 것을 특징으로 할 수 있다.

i) MBL2 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 증가;

ii) APOL1 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소;

iii) SERPINA5 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소;

iv) SERPINA7 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소;

v) ECM1 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소;

vi) CPN2 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소; 및

vii) ADIPOQ 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소.

본 발명에 있어서, 상기 i) MBL2 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 증가는 예를 들어, 대조군 대비 약 1.1배 이상, 바람직하게는 약 1.2배 이상, 더욱 바람직하게는 약 1.3배 이상, 더욱 바람직하게는 약 1.4배 이상, 더욱 바람직하게는 약 1.5배 이상, 가장 바람직하게는 약 1.53배 이상 증가되는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 ii) APOL1 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소는 예를 들어, 대조군 대비 약 0.01배 내지 약 0.9배, 더욱 바람직하게는 약 0.1배 내지 약 0.85배, 더욱 바람직하게는 약 0.4배 내지 약 0.8배, 가장 바람직하게는 약 0.7 내지 약 0.8배 감소되는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 iii) SERPINA5 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소는 예를 들어, 대조군 대비 약 0.01배 내지 약 0.9배, 더욱 바람직하게는 약 0.1배 내지 약 0.85배, 더욱 바람직하게는 약 0.4배 내지 약 0.8배, 가장 바람직하게는 약 0.7 내지 약 0.8배 감소되는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 iv) SERPINA7 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소는 예를 들어, 대조군 대비 약 0.01배 내지 약 0.95배, 더욱 바람직하게는 약 0.1배 내지 약 0.9배, 더욱 바람직하게는 약 0.5배 내지 약 0.9배, 가장 바람직하게는 0.8배 내지 0.9배 감소되는 것을 특징으로 할 수 있다.

본 발명에 있어서, v) ECM1 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소는 예를 들어, 대조군 대비 약 0.01배 내지 약 0.95배, 더욱 바람직하게는 약 0.1배 내지 약 0.9배, 더욱 바람직하게는 약 0.5배 내지 약 0.9배, 가장 바람직하게는 0.7배 내지 0.9배 감소되는 것을 특징으로 할 수 있다.

본 발명에 있어서, vi) CPN2 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소는 예를 들어, 대조군 대비 약 0.01배 내지 약 0.95배, 더욱 바람직하게는 약 0.1배 내지 약 0.9배, 더욱 바람직하게는 약 0.5배 내지 약 0.9배, 가장 바람직하게는 0.8배 내지 0.9배 감소되는 것을 특징으로 할 수 있다.

본 발명에 있어서, vii) ADIPOQ 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소는 예를 들어, 대조군 대비 약 0.01배 내지 약 0.95배, 더욱 바람직하게는 약 0.1배 내지 약 0.9배, 더욱 바람직하게는 약 0.5배 내지 약 0.9배, 가장 바람직하게는 0.8배 내지 0.9배 감소되는 것을 특징으로 할 수 있다.

본 발명에 있어서, (C) 다음의 단백질 또는 이를 코딩하는 유전자의 수준 변화가 검출되는 경우, 대상이 제1기 또는 제2기 난소암을 앓을 가능성이 있는 것으로 확인하는 단계를 추가로 포함하는 것을 특징으로 할 수 있다.

i) MBL2 단백질 또는 이를 코딩하는 유전자의 수준 증가;

ii) APOL1 단백질 또는 이를 코딩하는 유전자의 수준 감소; 및

iii) SERPINA5 단백질 또는 이를 코딩하는 유전자의 수준 감소.

본 발명에 있어서, 상기 i) MBL2 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 증가는 예를 들어, 대조군 대비 약 1.1배 이상, 바람직하게는 약 1.2배 이상, 더욱 바람직하게는 약 1.4배 이상, 더욱 바람직하게는 약 1.5배 이상, 더욱 바람직하게는 약 1.6배 이상, 가장 바람직하게는 약 1.7배 이상 증가되는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 ii) APOL1 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소는 예를 들어, 대조군 대비 약 0.01배 내지 약 0.9배, 더욱 바람직하게는 약 0.1배 내지 약 0.85배, 더욱 바람직하게는 약 0.4배 내지 약 0.8배, 가장 바람직하게는 약 0.6 내지 약 0.7배 감소되는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 iii) SERPINA5 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소는 예를 들어, 대조군 대비 약 0.01배 내지 약 0.9배, 더욱 바람직하게는 약 0.1배 내지 약 0.85배, 더욱 바람직하게는 약 0.4배 내지 약 0.8배, 가장 바람직하게는 약 0.6 내지 약 0.7배 감소되는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기한 각 단백질 수준 및/또는 이를 코딩하는 유전자의 발현수준의 증가 또는 감소의 예는 본 발명의 실시예에서 113명의 인간 대상에서 확인하고 검증된 값을 기반으로 도출된 것이며, 개별 대상마다 수준의 감소 또는 증가는 상이할 수 있음은 통상의 기술자에게 자명하게 이해될 수 있다.

따라서, 본 발명에 있어서 난소암의 정확한 진단 또는 진단을 위한 정보의 제공을 위해, 상기 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준의 변화(증가 또는 감소)를 해석하는 단계를 추가로 포함할 수 있다.

본 발명에 있어서, 상기 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준의 변화(증가 또는 감소)를 해석하는 단계는 각 바이오마커의 중요도 등에 기초하여 스코어링 알고리즘에 의해 해석하는 것을 특징으로 할 수 있다.

본 발명에 있어서, 상기 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준의 변화를 해석하는 단계는 예측 또는 분류 모형에 의해 해석되는 것을 특징으로 할 수 있다. 본 발명에 있어서, 상기 예측 또는 분류 모형은 공지된 데이터 분석방법으로 학습된 것을 특징으로 할 수 있다. 예를 들어, 상기 예측 또는 분류 모형은 선형 회귀(Linear Regression), 로지스틱 회귀(Logistic Regression), 능선 회귀(Ridge Regression), 라쏘 회귀(Lasso Regression), 잭나이프 회귀(Jackknife Regression), 의사결정 트리(Decision Tree), 랜덤 포레스트(Random Forest), K-평균 클러스터링(K-means Clustering), 교차검증(Cross-Validation), 인공신경망(Artificial neural network), 앙상블 러닝(Ensemble Learning), 나이브 베이즈 분류(Naive Bayesian Classifier), 협업 필터링(Collaborative filtering), 주성분 분석(Principal Component Analysis; PCA) 및 서포트 벡터 머신(Support Vector Machine; SVM) 등의 방법으로 학습된 것, 바람직하게는 랜덤 포레스트 또는 서포트 벡터 머신으로 학습된 것일 수 있으나, 이에 제한되는 것은 아니다. 본 발명에 있어서, 상기 예측 또는 분류 모형은 공지된 모형 이외에도 통상의 기술자가 본 발명의 실시예를 기반으로 난소암의 진단을 위해 새롭게 설계한 지도 또는 비지도 알고리즘에 의해 학습된 것일 수 있다.

본 발명의 일 실시예에서는, 본 발명의 바이오마커의 수준 변화를 랜덤 포레스트 또는 서포트 벡터 머신 방법 기반의 예측 또는 분류 모델을 사용하였으며, 두 방법으로 훈련된 예측 또는 분류 모델 모두에서 현저히 높은 민감도와 특이도로 전체 난소암 및 1-2기 난소암 환자를 진단할 수 있음을 입증하였다.

본 발명의 난소암 진단용 바이오마커 단백질은 대상이 난소암을 앓고 있는지 여부를 진단하는 데 사용될 수 있으며, 이를 기반으로, 이미 난소암으로 확진된 환자에게서 난소암의 개선 또는 치료 여부에도 사용할 수 있음은 통상의 기술자에게 자명하다.

따라서, 본 발명은 또 다른 관점에서, (a) 대상으로부터 분리한 시료 또는 암 질환 동물 모델에 후보 약제를 처리하는 단계; 및

(b) 상기 후보 약제가 처리된 시료 또는 암 질환 동물 모델에서 MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 둘 이상의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정하는 단계를 포함하는, 난소암의 예방 또는 치료용 약물을 스크리닝하는 방법에 관한 것이다.

본 발명의 난소암의 예방 또는 치료용 약물을 스크리닝하는 방법은 상기한 난소암의 진단 및/또는 진단을 위한 정보제공방법에서 기재된 것과 동일한 특징을 갖는 것을 특징으로 할 수 있다.

실시예

이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 예시하기 위한 것으로서, 본 발명의 범위가 이들 실시예에 의해 제한되는 것으로 해석되지 않는 것은 당업계에서 통상의 지식을 가진 자에 있어서 자명할 것이다.

실시예 1: 혈액시료의 준비

난소암 진단마커 바이오마커의 개발을 위해, 정상군 및 난소암 환자를 모집하여 혈장 시료를 채집하였다. 실험에 참여한 대상자는 총 113명으로 각 그룹별 대상군의 수, 평균 나이 및 병기는 하기 표 1과 같다. 정상군 및 난소암 환자의 혈장 샘플은 연세대학교 강남세브란스병원에서 제공받았다.

실시예 2: 정략적 혈장 단백질체 분석

혈장 샘플로부터 난소암 및 초기 진단 마커를 선별하기 위해, 혈장 단백질을 정량적으로 분석하였다. 총 113명의 혈장 샘플로부터 혈장 단백질을 정량적으로 분석하기 위해서 사중극자 비행시간 (Quadrupole Time of Flight) 질량분석기 (Mass spectrometry) 기반의 정량적 혈장 단백체 분석기법인 SWATH (Sequential Window Acquisition of all Theoretical Mass Spectra)를 이용하였다. 혼합된 시료를 이용하여 DPHL: A pan-human protein mass spectrometry library (참조 논문: https://pubmed.ncbi.nlm.nih.gov/32795611/)(스펙트럼 라이브러리)이용하여, 40μL의 적은 양의 혈액 시료를 절단된 펩티드로 전처리하여 LC/MS SWATH 분석을 통해 혈장 단백질을 정량분석 하였다.

113개의 혈장 샘플들을 SWATH 분석에 적용하기 전에 재현성있는 분석을 위해 고성능 액체 크로마토그래피 (High-performance liquid chromatography, HPLC)에 연결한 고농도 혈장 단백질 제거 컬럼 MARS14 컬럼 (100 x 4.6 mm; Agilent Technology, Palo Alto, CA, USA)을 이용하여 저농도 단백질을 분리하고 이를 자동화된 액체 분주 시스템 (Bravo Automated Liquid Handling Platform - Agilent사)를 이용하여 펩티드를 제조하는 전처리 과정을 수행하였다. 펩티드 제조 후 NanoDrop으로 정량 한 값을 기반으로 서로 다른 113개의 시료를 동일양으로 SWATH-MS 분석하였다.

보다 구체적으로, 40 μL의 혈장을 MARS14 컬럼에 주입하여 상위 14 개의 풍부한 단백질 (albumin, IgA, IgG, IgM, α1-antitrypsin, α1-acid glycoprotein, apolipoprotein A1, apolipoprotein A2, complement C3, transferrin, α2-macroglobulin, transthyretin, haptoglobin and fibrinogen)을 제거하였다. 이를 위해 혼합물을 Agilent사의 buffer A (부품번호: 5185-5987)로 4 배 희석하고 Shimadzu HPLC LC20AT 시스템의 MARS14 컬럼에 로드하였다. 결합되지 않은 저농도 혈장 단백질의 분획을 동결건조한 후에 재흡수하여 Suspension trap 방법으로 펩티드로 제조하였다. 자세히 설명하면, 5%SDS (50mM TEAB) 버퍼로 재흡수하여10 mM이 되도록 1,4-디티오트레이톨 (1,4-Dithiothreitol)을 첨가하고 95℃에서 10분 동안 반응시켜 이황화결합을 환원시켰다. 그 후, 알킬화를 위해 20 mM이 되도록 아이오도아세트아미드 (iodoacetamide)를 첨가하여 암조건하에 실온에서 30분 동안 반응시키고, 6μg의 트립신/라이스씨 혼합물로 37도에서 18시간동안 분해시켰다. 펩티드를 융출하여 콜드 트랩 (CentriVap Cold Traps, LABCONCO)으로 동결 건조하고 사용할 때까지 영하 80도에서 보관하였다. 액체 크로마토 그래피-탠덤 질량 분석법 (LC-MS/MS) 분석 전에 건조된 펩티드 샘플을 버퍼 A (0.1 % formic acid in HPLC water)으로 녹이고 총 펩티드 농도를 UV/Vis 분광 광도계 (NanoDrop One, Thermo Fisher Scientific)로 흡광도를 측정하였다. 파장 280 nm, 샘플 유형 옵션이 "1 Abs = 1 mg/mL"로 설정되었다. 그런 다음 iRT-Kit (Biognosys AG, Schlieren, Switzerland)에서 제공하는 iRT 표준을 1/10 부피로 샘플에 추가하여 공급 업체 지침 (참고논문: https://pubmed.ncbi.nlm.nih.gov/22577012/)에 따라 머무름 시간을 보정하였다. 각 샘플의 총량은 40μg이며 40μL에 용해하였다. 주입된 4 μL의 샘플은 다음 LC-MS/MS 설정과 함께 SCIEX TripleTOF 5600+ 시스템 질량 분석기를 사용하여 분석되하였다. LC 분리를 위해 nanoLC 425 (Eksigent, Dublin, CA, USA)를 Eksigent 마이크로 트랩 C18컬럼 (ChromXP C18CL, 5 μm, 120 Å)과 분석 컬럼으로서 Eksigent 컬럼 (C18-CL, 0.3 x 150 mm, 입자 크기 3 μm, 기공 크기 120 Å)을 함께 컬럼 온도가 40℃로 유지되도록 하였다. 샘플을 버퍼 A를 사용하여 10μL/min의 유속으로 트랩 컬럼에 로드하였다. 10분 후, 펩티드 혼합물은 버퍼 A와 버퍼 B (0.1 % formic acid in HPLC acetonitrile)을 사용하여 57 분에 의해 5μL/분으로 유속으로 농도구배를 통한 분리를 수행하였다. 버퍼 B를 38분 동안 3-25% 변경하고, 5분 동안 25-32% 변경하고, 2분 동안 32-80% 변경하고, 3분 동안, 80%로 유지하고, 3분 동안 80-3% 변경하고, 8분 동안 3%로 유지하였다. 개별 샘플의 경우 모든 질량 분석 실행은 SCIEX 기술 노트에 따라 100개의 가변 창을 사용하여 모든 이론적 질량 스펙트럼 (SWATH) 모드의 순차 창 수집에서 작동되었다. SWATH 매개 변수는 다음과 같이 설정되었다: Lower m/z limit 400; m/z 상한선 1250; 윈도우 오버랩 (Da) 1.0; CES는 작은 창에 대해 5, 큰 창에 대해 8, 가장 큰 창에 대해 10. MS2 스펙트럼은 고감도 모드에서 2.5ms 동안 100-1500m/z 범위에서 수집되었으며 총 사이클 시간은 2.8초였다. 다른 MS 파라미터는 다음과 같이 설정되었다: 이온 소스 가스 1 (GS1) 15 psi; 이온 소스 가스 2 (GS2) 20 psi; 커튼 가스 (CUR) 30 psi; 온도 (TEM) 250 ℃; 이온 스프레이 전압 부동 (ISVF) 5500V.

펩티드로 제조된 혈장 단백질 시료 113개를 LC-MS로 분석함에 있어서 분석 간 Batch별 bias를 최소화하기 위해 무작위로 혼합하여 순차적으로 SWATH LC-MS 분석을 5일간에 걸쳐 수행하였다. 113개의 시료에 대해 SWATH LC-MS 분석을 수행하여 113개의 스펙트럼(spectrum) 결과를 획득하였다. 해당 결과 스펙트럼(spectrum)들을 DIA-NN software와 Pan-human proteome library를 이용하여 정성적으로 단백체 분석을 수행하였으며 113개 시료로부터 총 831개의 단백질들을 정성/정량 분석할 수 있었다. 도 1에 나타난 바와 같이, 정상군과 난소암 환자군에서의 총 113개의 시료별로 중간값 기반의 정규화된 단백질들의 양 정보를 로그 스케일(Log scale)로 분석한 결과 재현성을 보이는 것을 확인하였다. 또한, 2개 그룹의 113개의 혈장 시료 들에서 80% 이상 검출되면서 MARS-14 high abundant protein depletion에 관련되지 않은 단백질 총 133개 단백질들의 정량 정보를 이용하여 통계분석을 수행하였다.

각 병기(stage)의 2 그룹의 난소암 환자(group 1: 1-2기, group 2: 3-4기) 및 정상 비교군을 각각 비교한 정량적 혈장 단백질체 분석결과, 유의미한 수준의 차이를 나타내는 총 31개의 DEP(differential expressed protein)를 확인하였다. 3 그룹 공통적인 DEP는 Alpolipoprotein L1이었으며 10개의 단백질은 대조군과 난소암 1-2기군, 대조군과 난소암 3-4기군의 공통된 DEP로 타났다. 또한 7개의 단백질들은 대조군과 난소암 1-2기군, 난소암 1-2기군과 난소암 3-4기군간의 공통된 DEP로 나타났다. 특히, 본 발명의 난소암 진단용 바이오마커 중 APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ는 전체 난소암 환자에서 감소하고, MBL2는 증가하는 것으로 나타났다. 특히 1-2기 난소암 환자의 경우, 정상 대조군은 물론, 3-4기 난소암 환자와 비교하는 경우에도 APOL1 및 SERPINA5는 현저한 감소가 나타났으며, MBL2는 현저히 증가하는 것으로 확인되었다(도 2).

그룹의 난소암 환자(group 1: 1-2기, group 2: 3-4기) 및 정상 비교군에서 검출된 전체 혈장 단백질체를 기반으로 기능 선택 프로세스(Feature selection process)를 수행하여, 각 병기의 난소암환자를 도출하기 위한 최적의 마커 단백질 후보를 선별하였다. 1-2기 그룹의 경우 4개의 단백질(도 3a), 전체 병기의 경우 10개의 단백질이 후보로 도출되었으나(도 3b), 검출의 민감도와 정확도를 향상시키기 위해 Probability가 0.5 미만인 바이오마커 후보를 제외하여 1-2기 난소암 환자의 진단을 위한 3종 바이오마커 및 전체 난소암 환자의 진단을 위한 상기 3종 바이오마커를 포함하는 7종의 혈장 바이오마커를 선별하였다.

이하 설명될 본 발명의 난소암 진단용 바이오마커 7종의 정상군 대비 발현 수준의 변화는 아래 표 2 및 도 4, 도 5와 같다. 표 2 및 도 4-5에서 도시된 것과 같이 선별된 7종의 바이오마커는 정상 대조군과 대비하여, 1-2기 난소암 환자 또는 전체 난소암 환자에서 현저한 수준의 차이를 나타낸다.

실시예 3: 혈장 단백질 데이터를 이용한 모델 구축 및 검증

실시예 2에서 수집된 정상군 및 난소암 환자의 혈장 단백체의 정량 정보를 이용하여 초기 난소암 질병 예측 및 난소암 질병 예측을 할 수 있는 모델을 구축하였다. 첫째 세트로 초기 난소암 질병 예측에는 30명의 정상군 포함 난소암 83명의 환자 중에 병기가 1-2기인 환자 39명을 대상으로 질병예측 모델을 생성하였다. 두번째 세트로 난소암 질병 모델 예측에는 30명의 정상군과 83명의 난소암 전체 환자를 대상으로 포함하였다. 133개의 단백질 중에 바이오마커로 사용될 변수선택 (Feature selection)을 위해서 두 개의 세트에 동일하게 의사 결정 나무 구조 (Determination tree structure)를 이용하여 단백질 정량정보를 변수로 하고 특징적인 변수를 선택하는 단계에서 모델 자체에 변수 선택이 포함된 임베디드 방법 (Embedded method)을 적용하였다. 무작위 숲 알고리즘 (Random forest algorythme, RF)을 이용하여 10,000개의 의사결정 나무 형성하여 각 나무의 AUC결과 값을 기준으로 예측력이 높은 변수를 1차로 선정하였다. 이를 10-fold 교차검증을 3번 반복하여 선정된 변수의 확률 값이 50%이상인 변수를 최종 선정하였다 (표 3). 위의 과정을 통해서 초기 난소암 예측 세트에서의 결과 선정된 3개의 단백질 패널을 이용하여 전체 시료를 그룹별로 3 등분을 하고 이중 2/3의 정보를 이용하여 모델을 구성하는 훈련 세트 (training set)로 사용하고 나머지 1/3의 정보는 모델의 완성도를 검증하는 검증 세트 (test set)로 구성하였다 (표 4). 예측 통계 모델은 무작위 숲 알고리즘과 서포트 벡터 머신(Support vector machine, SVM)을 2가지를 사용하였다. 난소암 예측 세트에는 7개의 단백질 패널을 (표 5) 이용하여 위의 3배 교차검증으로 시료를 구성하여 SVM, RF모델을 생성 및 검증하였다 (표 6).

초기 난소암 진단 예측은 상기 3개의 단백질 (APOL1, SERPINA5, MBL2) 패널로 구성된 모델을 이용하여 정상군과 난소암 환자군 (병기 1-2기)을 구분할 수 있는지를 검증하였다. 검증은 랜덤 포레스트 모델(Random Forest model, RF model) 및 서포트 벡터 머신 모델(Support Vector Machine model, SVM model)을 이용하였다. 3개의 단백질 마커를 사용한 난소암 환자군 (병기 1-2기)의 진단 검증을 위한 각 모델의 훈련은 각각 도 6 및 도 7과 같다.

랜덤 포레스트 모델을 응용한 훈련세트와 검증세트의 임상적 유용성을 나타내는 수신동작특성(ROC, receiver operating characteristics)의 곡면하면적 (Area under curve, AUC)은 1.0 (훈련 세트), 0.886 (검증 세트)로 매우 우수하게 나타났다. 검증 세트를 기준으로 임상절단 값을 유덴지수 (Youden index)인 0.5284로 설정하면, 특이도는 83.33%이고 민감도가 90.90%인 것으로 나타났다(도 8). 한편, 서포트 벡터 머신 모델을 응용한 결과는 수신동작특성의 곡면하면적은 0.857 (훈련 세트), 0.939 (검증 세트)이며, 검증 세트를 기준으로 임상절단 값을 유덴지수 (Youden index)인 0.6852로 설정하면, 특이도는 100%이고 민감도가 90.90%인 것으로 나타났다 (도 9). 이는 각각의 바이오마커를 독립적으로 이용하여 초기 난소암을 진단하는 경우의 곡면하면적(AUC) 값보다 현저히 뛰어나, 본 발명의 초기 난소암 진단 방법이 현저히 우수한 진단 정확도를 나타냄을 의미한다(도 10).

7개의 단백질 마커를 사용한 난소암 환자군(전체 병기)의 진단 검증을 위한 각 모델의 훈련은 각각 도 11 및 도 12와 같다.

난소암 진단 예측은 상기 7개의 단백질 (MBL2, APOL1, SERPINA7, ECM1, SERPINA5, CPN2, ADIPOQ) 패널로 구성된 모델을 이용하여 정상군과 전체 난소암 환자군 (병기 1-4기)을 구분할 수 있는지를 검증하였다. 랜덤 포레스트 모델을 응용한 훈련세트와 검증세트의 임상적 유용성을 나타내는 수신동작특성(ROC, receiver operating characteristics)의 곡면하면적 (Area under curve, AUC)은 1.0 (훈련 세트), 0.881 (검증 세트)로 매우 우수하게 나타났다. 검증 세트를 기준으로 임상절단 값을 유덴지수 (Youden index)인 0.6289로 설정하면, 특이도는 90.0%이고 민감도가 77.77%인 것으로 나타났다 (도 13). 한편, 서포트 벡터 머신 모델을 응용한 결과는 수신동작특성의 곡면하면적은 0.858 (훈련 세트), 0.800 (검증 세트)이며, 검증 세트를 기준으로 임상절단 값을 유덴지수 (Youden index)인 0.666로 설정하면, 특이도는 80.0%이고 민감도가 74.07%인 것으로 나타났다 (도 14). 전체 난소암의 진단을 위한 7종 바이오마커 또한 각각의 바이오마커를 독립적으로 이용하여 초기 난소암을 진단하는 경우의 곡면하면적(AUC) 값보다 현저히 뛰어나, 본 발명의 초기 난소암 진단 방법이 현저히 우수한 진단 정확도를 나타냄을 확인하였다(도 15a 내지 15g).

본 발명의 바이오마커 및 이의 조합은 종래 보고된 난소암 바이오마커 보다 현저히 뛰어난 민감도와 특이도로 난소암을 진단할 수 있으며, 특히, 1기 및/또는 2기 난소암의 검출이 가능하여 난소암의 조기 진단이 가능하다. 나아가, 본 발명의 바이오마커는 혈장 단백질 수준을 기반으로 진단이 가능하며, 극소량의 혈액에서도 민감도와 특이도가 뛰어나, 조직 검사를 수반하는 다른 난소암 진단방법에 비해 그 절차가 간단하며, 환자의 고통과 부담을 현저하게 줄일 수 있다. 본 발명의 난소암 바이오마커는 종래 보고된 난소암 바이오마커와 상이하여 기존의 바이오마커와 함께 또는 이를 대체하여 사용할 수 있다는 장점이 있으며, 약물 투여 후 치료효과에 대한 마커로도 사용할 수 있어, 환자에 대한 난소암의 임상적 치료제 스크리닝에 있어서도 매우 유용하게 사용될 수 있다.

이상으로 본 발명 내용의 특정한 부분을 상세히 기술하였는바, 당업계의 통상의 지식을 가진 자에게 있어서 이러한 구체적 기술은 단지 바람직한 실시 양태일 뿐이며, 이에 의해 본 발명의 범위가 제한되는 것이 아닌 점은 명백할 것이다. 따라서, 본 발명의 실질적인 범위는 첨부된 청구항들과 그것들의 등가물에 의하여 정의된다고 할 것이다.

Claims

MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 둘 이상의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제를 포함하는 난소암의 진단용 조성물.
제1항에 있어서, MBL2, APOL1 및 SERPINA5 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제를 포함하는 난소암의 진단용 조성물.
제2항에 있어서, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 어느 하나 이상의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제를 추가로 포함하는 난소암의 진단용 조성물.
제1항에 있어서, 상기 단백질 수준을 측정할 수 있는 제제는 각 단백질에 특이적으로 결합하는 항체, 올리고펩타이드, 리간드, PNA(peptide nucleic acid) 및 앱타머(aptamer)로 구성된 군에서 선택되는 것을 특징으로 하는 난소암의 진단용 조성물.
제1항에 있어서, 상기 유전자의 발현 수준을 측정할 수 있는 제제는 각 단백질을 코딩하는 유전자에 특이적으로 결합하는 프라이머, 프로브 및 안티센스 뉴클레오티드로 구성된 군에서 선택되는 것을 특징으로 하는 난소암의 진단용 조성물.
MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 둘 이상의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제를 포함하는 난소암의 진단용 키트.
제6항에 있어서, MBL2, APOL1 및 SERPINA5 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정할 수 있는 제제를 포함하는 난소암의 진단용 키트.
제7항에 있어서, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 어느 하나 이상의 단백질 수준 또는 이를 코딩하는 유전자 발현 수준을 측정할 수 있는 제제를 추가로 포함하는 난소암의 진단용 키트.
제6항에 있어서, 상기 단백질 수준을 측정할 수 있는 제제는 각 단백질에 특이적으로 결합하는 항체, 올리고펩타이드, 리간드, PNA(peptide nucleic acid) 및 앱타머(aptamer)로 구성된 군에서 선택되는 것을 특징으로 하는 난소암의 진단용 키트.
제6항에 있어서, 상기 유전자의 발현 수준을 측정할 수 있는 제제는 각 단백질을 코딩하는 유전자에 특이적으로 결합하는 프라이머, 프로브 및 안티센스 뉴클레오티드로 구성된 군에서 선택되는 것을 특징으로 하는 난소암의 진단용 키트.
(a) 대상으로부터 분리된 시료로부터, MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 둘 이상의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정하는 단계;

(b) 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 대조군과 비교하는 단계를 포함하는 난소암의 진단방법.
제11항에 있어서, 상기 (a) 단계 이전에, 다음의 단계를 통해 대상으로 분리된 시료를 전처리하는 단계를 추가로 포함하는 것을 특징으로 하는 난소암의 진단 방법:

i) 시료로부터 albumin, IgA, IgG, IgM, α1-antitrypsin, α1-acid glycoprotein, apolipoprotein A1, apolipoprotein A2, complement C3, transferrin, α2-macroglobulin, transthyretin, haptoglobin 및 fibrinogen으로 구성된 군에서 선택되는 어느 하나 이상을 제거하는 단계; 및

ii) 시료에 포함된 단백질을 짧은 펩타이드로 절단하는 단계.
제11항에 있어서, 상기 (a) 단계의 시료는 혈액, 혈청 또는 혈장인 것을 특징으로 하는 난소암의 진단방법.
제11항에 있어서, 상기 (a) 단계는 질량 분석법(mass spectrometry)을 통해 단백질 수준을 측정하는 것을 특징으로 하는 난소암의 진단방법.
제14항에 있어서, 상기 질량 분석법(mass spectrometry)은 Sequential Window Acquisition of all Theoretical (SWATH) 질량 분석인 것을 특징으로 하는 난소암의 진단방법.
제11항에 있어서, 상기 (a) 단계는 MBL2, APOL1 및 SERPINA5 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정하는 것을 특징으로 하는 난소암의 진단 방법.
제11항에 있어서, 상기 (a) 단계는 SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 어느 하나 이상의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 추가로 측정하는 것을 특징으로 하는 난소암의 진단방법.
제11항에 있어서, 상기 난소암은 1기 또는 2기 난소암인 것을 특징으로 하는 난소암의 진단방법.
제11항에 있어서,

(C) 다음 중 어느 하나 이상의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준 변화가 검출되는 경우, 난소암의 발병 가능성이 있는 것으로 확인하는 단계를 추가로 포함하는 난소암의 진단방법:

i) MBL2 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 증가;

ii) APOL1 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소;

iii) SERPINA5 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소;

iv) SERPINA7 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소;

v) ECM1 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소;

vi) CPN2 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소; 및

vii) ADIPOQ 단백질 수준 및/또는 이를 코딩하는 유전자의 발현 수준 감소.
제11항에 있어서,

(C) 다음의 단백질 또는 이를 코딩하는 유전자의 수준 변화가 검출되는 경우, 제1기 또는 제2기 난소암의 발병 가능성이 있는 것으로 확인하는 단계를 포함하는 난소암의 진단방법:

i) MBL2 단백질 또는 이를 코딩하는 유전자의 수준 증가;

ii) APOL1 단백질 또는 이를 코딩하는 유전자의 수준 감소; 및

iii) SERPINA5 단백질 또는 이를 코딩하는 유전자의 수준 감소.
(a) 대상으로부터 분리한 시료 또는 암 질환 동물 모델에 후보 약제를 처리하는 단계; 및

(b) 상기 후보 약제가 처리된 시료 또는 암 질환 동물 모델에서 MBL2, APOL1, SERPINA5, SERPINA7, ECM1, CPN2 및 ADIPOQ로 구성된 군에서 선택되는 둘 이상의 단백질 수준 또는 이를 코딩하는 유전자의 발현 수준을 측정하는 단계를 포함하는, 난소암의 예방 또는 치료용 약물을 스크리닝하는 방법.