KR102422610B1 - 초기 유방암 환자의 예후 예측 방법 - Google Patents

초기 유방암 환자의 예후 예측 방법 Download PDF

Info

Publication number
KR102422610B1
KR102422610B1 KR1020200056699A KR20200056699A KR102422610B1 KR 102422610 B1 KR102422610 B1 KR 102422610B1 KR 1020200056699 A KR1020200056699 A KR 1020200056699A KR 20200056699 A KR20200056699 A KR 20200056699A KR 102422610 B1 KR102422610 B1 KR 102422610B1
Authority
KR
South Korea
Prior art keywords
breast cancer
risk
prognosis
gene
il21r
Prior art date
Application number
KR1020200056699A
Other languages
English (en)
Other versions
KR20210138405A (ko
Inventor
신영기
이한나
Original Assignee
서울대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서울대학교 산학협력단 filed Critical 서울대학교 산학협력단
Priority to KR1020200056699A priority Critical patent/KR102422610B1/ko
Priority to US17/924,832 priority patent/US20230323464A1/en
Priority to PCT/KR2021/005971 priority patent/WO2021230663A1/ko
Publication of KR20210138405A publication Critical patent/KR20210138405A/ko
Application granted granted Critical
Publication of KR102422610B1 publication Critical patent/KR102422610B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6851Quantitative amplification
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57415Specifically defined cancers of breast
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57484Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/52Predicting or monitoring the response to treatment, e.g. for selection of therapy based on assay results in personalised medicine; Prognosis

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Pathology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Biomedical Technology (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Cell Biology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 유방암 환자의 예후 예측 방법에 관한 것으로, 보다 상세하게는 면역관련 유전자를 조합하여 유방암의 예후를 예측하는 방법에 대한 것이다. 본 발명은 유방암 분자 아형에 관계없이 모든 유방암 환자에 적용 가능할 뿐만 아니라, 본 발명에서 제공하는 바에 따라 면역관련 유전자 조합을 유방암 예후 예측에 이용하면 증식 유전자에 대한 정보 없이도 유방암 환자의 예후 예측이 가능하다.

Description

초기 유방암 환자의 예후 예측 방법{Methods for predicting prognosis in early breast cancer patients}
본 발명은 유방암 환자의 예후 예측 방법에 관한 것으로, 보다 상세하게는 면역관련 유전자를 조합하여 유방암의 예후를 예측하는 방법에 대한 것이다.
유방암은 여성에 있어 가장 흔한 암이며, 두 번째로 사망률이 높은 암이다. 유방암 발병에 대한 위험 인자는 인종, 나이 및 암 억제 유전자 BRCA-1 및 BRCA-2 및 p53에서의 돌연변이 등을 포함한다. 알코올 섭취, 고지방 식이, 운동 부족, 외인성 폐경 후 호르몬 및 이온화 방사선 또한 유방암의 발병 위험을 증가시킨다. 유방암은 호르몬 수용체(에스트로겐 수용체 또는 프로게스테론 수용체)와 HER2(human epidermal growth factor receptor 2)의 발현 상태에 따라 루미날 A형, 루미날 B형, HER2형 및 삼중음성 유방암(TNBC)의 네 종류의 아형으로 구분이 되고 있다. 각각의 유방암 아형들은 구분되는 분자적 특징을 지니고 있다.
현재의 유방암에 대한 치료 방법으로서, 종양 제거 수술 이후, 항암 화학치료, 항호르몬 치료, 표적 치료 혹은 방사선 치료 등 향후 재발을 줄이기 위한 추가 보조적인 치료가 필요한 경우들이 있다. 초기 유방암 환자 중 70 ~ 80%는 타장기 전이위험이 매우 적어 항암화학요법이 불필요함에도 불구하고, 기존 유방암 치료 가이드라인으로는 정확한 판별이 어려워 대다수의 환자가 수술 후에 행해지는 항암화학요법과 방사선 치료를 처방 받고 있는 실정이다. 그러나, 화학치료의 효과가 크지 않을 환자에게 지속적으로 항암제를 투여하는 것은 부작용만을 증가시켜 환자에게 원치 않는 고통을 줄 수 있다. 따라서, 초기 유방암 환자에서 향후 암의 예후를 명확하게 예측하여, 현 시점에서 가장 적절한 치료방법을 현명하게 선택하고, 전이성 재발 등 나쁜 예후에 대비하는 것이 필요하다.
한편, 기존에는 유방암의 예후적 지표로서 증식 및 세포주기 신호들에 주로 중점을 두어 왔고, 이에 증식/세포 주기 조절 유전자들을 마커로 하여 예후 예측을 위한 유전자 발현 기반 분석법에 적용하여왔다. 대표적으로 Oncotype DX, MammaPrint, PAM50, Endopredict와 같은 제품들이, 동결된 또는 포르말린 고정된 파라핀 포매(FFPE)샘플에서 증식 유전자 대상 복합 유전자 발현 프로파일링 기법에 기반을 둔 상업적인 어세이들이다. 그러나 이러한 상용의 키트들은 각각이 타겟으로하는 유방암 아형이 제한되어있어, 유방암 분자 아형들에 두루 사용되기는 어려운 한계점이 있다. 상기 Oncotype DX, MammaPrint, PAM50, Endopredict 키트들은 ER+ 유형의 유방암을 주요 타겟으로 한다. 이들 상업적 키트들에서 보는 바와 같이, 이들은 오직 호르몬 수용체 양성인 유방암 아형에 대해서만 예후 예측이 가능하며, 호르몬 수용체 음성인 유방암 아형에 대한 상업적 키트는 아직 존재하지 않는다. 뿐만아니라 Alvarado MD et al.(비특허문헌 1)의 최근 보고에 따르면 위험 분류 환자에서 PAM50 발현 분석과 Oncotype DX에서의 결과가 불일치한다고 보고되기도 하였다.
현재 상황을 감안할 때, 환자의 생존 결과 및 보조 화학 요법에 대한 반응을 보다 정확하게 예측하기 위해서는 유방암 예후 예측에 사용되는 기존의 분석법을 개선이 요구되고 있을 뿐만아니라, 다양한 유방암 유형들에 두루 적용가능한 예후 분석 방법이 필요한 실정이다.
Alvarado MD, Prasad C, Rothney M, Cherbavaz DB, Sing AP, Baehner FL, et al. A Prospective Comparison of the 21-Gene Recurrence Score and the PAM50-Based Prosigna in Estrogen Receptor-Positive Early-Stage Breast Cancer. Adv Ther 2015;32:1237-47. doi:10.1007/s12325-015-0269-2.
이에 본 발명자들은 암 예후 예측에 있어서 증식관련 유전자 분석 중심으로 수행되고 있는 기존 방식을 탈피하면서도 모든 유방암 분자 아형(subtype)에 대하여 유의적으로 예후를 예측할 수 방법 및 유전자 지표들을 찾고자 예의 노력한 결과, 본 발명에서 제공하는 바와 같이 면역관련 유전자 조합을 이용하는 경우 증식 유전자에 대한 정보 없이도 모든 유방암 분자 아형에 대해 높은 정확도로 예후 예측이 가능함을 확인하여 본 발명을 완성하였다.
따라서 본 발명의 목적은, 유방암 환자의 예후 예측에 필요한 정보를 제공하기 위하여, 하기 단계를 포함하는 유방암 예후 예측 방법을 제공하는 것이다:
(a) 유방암 환자로부터 수득한 생물학적 시료로부터 면역 관련 유전자들의 발현수준을 측정하는 단계;
(b) 상기 (a) 단계에서 측정된 발현 수준을 표준화하는 단계; 및
(c) 상기 (b) 단계에서 표준화된 면역 관련 유전자들의 발현 수준을 조합하여 유방암 예후를 예측하는 단계로서, 조합된 면역 관련 유전자들의 과발현은 좋은 예후인 것으로 유방암 예후를 예측하는 단계.
본 발명의 다른 목적은, 유방암 환자의 예후 예측에 필요한 정보를 제공하기 위하여, 하기 단계를 포함하는 유방암 예후 예측 방법을 제공하는 것이다:
(a) 유방암 환자로부터 수득한 생물학적 시료로부터 TRAT1, IL21R, IGHM, CTLA4 및 IL2RB로 이루어지는 군 또는 TRAT1, IL21R, 및 CTLA4로 이루어진 군의 면역 관련 유전자들의 발현수준을 측정하는 단계;
(b) 상기 (a) 단계에서 측정된 발현 수준을 표준화하는 단계; 및
(c) 상기 (b) 단계에서 표준화된 면역 관련 유전자들의 발현 수준을 조합하여 유방암 예후를 예측하는 단계로서, 조합된 면역 관련 유전자들의 과발현은 좋은 예후인 것으로 유방암 예후를 예측하는 단계.
본 발명의 또 다른 목적은, 유방암 환자의 예후 예측에 필요한 정보를 제공하기 위하여, 하기 단계를 포함하는 유방암 예후 위험 지수를 산출하는 방법을 제공하는 것이다:
(i) 유방암 환자로부터 수득한 생물학적 시료로부터 TRAT1, IL21R, IGHM, CTLA4 및 IL2RB 유전자로 이루어진 군 또는 TRAT1, IL21R 및 CTLA4 유전자로 이루어진 군의 mRNA 발현수준과 유방암 환자의 LN-여부 값을 측정하는 단계;
(ii) 상기 유전자의 mRNA 발현 수준을 표준화하는 단계; 및
(iii) 상기 (ii) 단계의 표준화값 및 상기 (i) 단계의 LN-여부 값을 하기 공식 2-1에 대입하여 유방암 예후 위험 지수(risk score)를 계산하는 단계:
[공식 2-1]
risk score = {(βTRAT1TRAT1) + (βIL21RIL21R) + (βIGHMIGHM) + (βCTLA4CTLA4) + (βIL2RBIL2RB)}+ F*2*LN
[공식 2-2]
risk score = {(βTRAT1TRAT1) + (βIL21RIL21R) + (βCTLA4CTLA4) + F*LN
본 발명의 또 다른 목적은, ⅰ) TRAT1, IL21R, IGHM, CTLA4 및 IL2RB 유전자; 또는 ⅱ) TRAT1, IL21R 및 CTLA4 유전자의 발현량을 측정하는 제제를 포함하는 유방암 환자의 예후 예측용 조성물, 및 상기 조성물을 포함하는 키트를 제공하는 것이다.
상기와 같은 목적을 달성하기 위하여, 본 발명은 유방암 환자의 예후 예측에 필요한 정보를 제공하기 위하여, 하기 단계를 포함하는 유방암 예후 예측 방법을 제공한다:
(a) 유방암 환자로부터 수득한 생물학적 시료로부터 면역 관련 유전자들의 발현수준을 측정하는 단계;
(b) 상기 (a) 단계에서 측정된 발현 수준을 표준화하는 단계; 및
(c) 상기 (b) 단계에서 표준화된 면역 관련 유전자들의 발현 수준을 조합하여 유방암 예후를 예측하는 단계로서, 조합된 면역 관련 유전자들의 과발현은 좋은 예후인 것으로 유방암 예후를 예측하는 단계.
본 발명의 다른 목적을 달성하기 위하여 본 발명은, 유방암 환자의 예후 예측에 필요한 정보를 제공하기 위하여, 하기 단계를 포함하는 유방암 예후 예측 방법을 제공한다:
(a) 유방암 환자로부터 수득한 생물학적 시료로부터 TRAT1, IL21R, IGHM, CTLA4 및 IL2RB로 이루어지는 군 또는 TRAT1, IL21R, 및 CTLA4로 이루어진 군의 면역 관련 유전자들의 발현수준을 측정하는 단계;
(b) 상기 (a) 단계에서 측정된 발현 수준을 표준화하는 단계; 및
(c) 상기 (b) 단계에서 표준화된 면역 관련 유전자들의 발현 수준을 조합하여 유방암 예후를 예측하는 단계로서, 조합된 면역 관련 유전자들의 과발현은 좋은 예후인 것으로 유방암 예후를 예측하는 단계.
본 발명의 또 다른 목적을 달성하기 위하여, 본 발명은, 유방암 환자의 예후 예측에 필요한 정보를 제공하기 위하여, 하기 단계를 포함하는 유방암 예후 위험 지수를 산출하는 방법을 제공한다:
(i) 유방암 환자로부터 수득한 생물학적 시료로부터 TRAT1, IL21R, IGHM, CTLA4 및 IL2RB 유전자로 이루어진 군 또는 TRAT1, IL21R 및 CTLA4 유전자로 이루어진 군의 mRNA 발현수준과 유방암 환자의 LN-여부 값을 측정하는 단계;
(ii) 상기 유전자의 mRNA 발현 수준을 표준화하는 단계; 및
(iii) 상기 (ii) 단계의 표준화값 및 상기 (i) 단계의 LN-여부 값을 하기 공식 2-1에 대입하여 유방암 예후 위험 지수(risk score)를 계산하는 단계:
[공식 2-1]
risk score = {(βTRAT1TRAT1) + (βIL21RIL21R) + (βIGHMIGHM) + (βCTLA4CTLA4) + (βIL2RBIL2RB)}+ F*2*LN
[공식 2-2]
risk score = {(βTRAT1TRAT1) + (βIL21RIL21R) + (βCTLA4CTLA4) + F*LN
본 발명의 또 다른 목적을 달성하기 위하여 본 발명은, ⅰ) TRAT1, IL21R, IGHM, CTLA4 및 IL2RB 유전자; 또는 ⅱ) TRAT1, IL21R 및 CTLA4 유전자의 발현량을 측정하는 제제를 포함하는 유방암 환자의 예후 예측용 조성물, 및 상기 조성물을 포함하는 키트를 제공한다.
이하 본 발명을 상세히 설명한다.
본 발명에서 “예후”란 유방암 치료 중 또는 치료 후 병의 진행경과를 의미하는 것으로, 바람직하게는 치료 후 병의 진행경과를 의미할 수 있으나 이에 제한되는 것은 아니다. 또한, 상기 “병의 진행경과”란 암의 완치, 재발, 전이 또는 전이성 재발을 포함하는 개념이며, 가장 바람직하게는 전이성 재발을 의미하나 이에 제한되는 것은 아니다. 이 중에서 전이성 재발 예후의 예측(또는 예후의 진단)은 특히 초기 유방암 환자에서 해당 종양이 향후 전이성 유방암으로 발전될 수 있는지 여부를 미리 판단할 수 있기 때문에 유방암 치료의 방향에 대한 단서를 제시할 수 있다는 점에서 매우 의미가 있는 작업이라 할 수 있다.
본 발명에서의 상기 “전이성 재발”은 치료 후, 최소한 하나의 유방 종양에서 유래된 변형된, 즉 암세포가 그 종양에서 분리되어 종양과 떨어진 위치(이하 "원격 부위"라 한다)에서 암으로 계속 성장하는 것을 말한다. 상기 원격 부위는 예를 들면 하나 이상의 림프절 내일 수 있으며, 이들은 이동성이거나 고정되어 있을 수 있고, 상기 종양에 대해 동측이거나 반대 측일 수 있으며, 쇄골위이거나 겨드랑이 등에 있는 것일 수 있다.
구체적으로 상기 전이성 재발은, 이에 제한되지 않으나 치료 전 유방암의 발생 부위 및/또는 동측 유방 및/또는 반대 측 유방내의 부위에 전이된 국소 전이성 재발과 폐, 간, 뼈, 림프절, 피부, 뇌와 같은 원격 부위에 전이되어 발생하는 원격 전이성 재발을 포함하는 개념이다.
유방암 병기는 주로 American Cancer Society의 TNM 시스템에 따라 분류되며, TNM 시스템은 종양의 크기(T), 종양의 림프절로의 침윤 정도(N) 및 다른 기관으로의 원격 전이(distant metastasis)(M)의 3개 요소를 평가한다. 각각의 병기에 있어서 병리학적 특성을 요약하면 하기 표 1과 같다.
TNM 병기에 따른 유방암의 병리학적 구분
분류 세부적 구분
T 병기 T0: 종양의 증거가 없는 경우
Tis: 상피내암의 경우
T1: 종양의 최대 직경이 2센티미터 이하인 경우
T2: 종양의 최대 직경이 2센티미터보다 크지만 5센티미터 이하인 경우
T3: 종양의 최대 직경이 5센티미터보다 큰 경우
N 병기 N0: 림프절 전이가 없는 경우
N1: 전이된 림프절의 개수가 1개 이상 3개 이하인 경우
N2: 전이된 림프절의 개수가 4개 이상 9개 이하인 경우
N3: 전이된 림프절의 개수가 10개 이상인 경우
M 병기 M0: 원격 전이가 없는 경우
M1: 원격 전이가 있는 경우
TNM 시스템에 따라 동일하게 분류된 환자들 간에도 예후는 다르게 나타날 수 있으며, 이는 유방암 분자 아형에 영향을 받는다. 즉, 동일한 병기의 유방암이라 할지라도 호르몬 수용체(에스트로겐 수용체 또는 프로게스테론 수용체) 및 HER2의 발현 상태에 따라 병태 및 예후가 현저히 달라지는 것으로 알려져 있다. 유방암 분자 아형별 수용체 특성은 하기 표 2에 기재된 바와 같으며, 유방암 아형에 따라 치료결과 및 예후가 다른 것으로 보고되고 있으며, 이에 수술적 방법이나 항암화학용법 선택에 있어 하나의 지표로 사용되고 있다.
유방암의 분자생물학적 아형(subtype) 분류
Subtype 특성 발생빈도(%)
루미날 A형
(HR+/HER2-)
* ER 양성 및/또는 PR 양성
* HER2 음성
* 낮은 Ki67 발현
30~70
루미날 B형
(HR+/HER2+)
* ER 양성 및/또는 PR 양성
* HER2 양성 (또는 높은 Ki67 발현을 나타내면서 HER2 음성)
10~20
TNBC형
(Triple negative,
HR-/HER2-)
* ER 음성
* PR 음성
* HER2 음성
15~20
HER2형
(HR-/HER2+)
* ER 음성
* PR 음성
* HER2 양성
5~15
* HR: hormone receptor
* ER: estrogen receptor
* PR: progesteron receptor
* HR+: ER+/PR- , ER-/PR+ 및 ER+/PR+를 포함
증식/세포주기 조절 유전자들의 암의 진행에 대한 강력한 연관성과 이에 따른 환자 생존에 대한 영향이 보고됨에 따라, Oncotype DX, MammaPrint, PAM50, Endopredict 등의 기존 상용의 키트들이 유방암 예후 예측을 위해 사용되고 있으나, 이들은 실질적으로 ER+인 유방암 유형만을 타겟으로 하고 있는 실정이다.
이에 반하여, 본 발명자들은 증식/세포주기 조절 유전자를 이용하지 않고도 면역 관련 유전자들의 발현 정보만으로도 유방암 예후 예측이 가능함을 최초로 규명하였다. 특히 본 발명에 의하면 모든 유방암 분자 아형(HR+/HER2-, HR+/HER2+, HR-/HER2+ 및 TNBC)에 적용가능 가능하다는 점에서 기술적 의의가 크다.
이에 본 발명은, 유방암 환자의 예후 예측에 필요한 정보를 제공하기 위하여, 하기 단계를 포함하는 유방암 예후 예측 방법을 제공한다:
(a) 유방암 환자로부터 수득한 생물학적 시료로부터 면역 관련 유전자들의 발현수준을 측정하는 단계;
(b) 상기 (a) 단계에서 측정된 발현 수준을 표준화하는 단계;
(c) 상기 (b) 단계에서 표준화된 면역 관련 유전자들의 발현 수준을 조합하여 유방암 예후를 예측하는 단계로서, 조합된 면역 관련 유전자들의 과발현은 좋은 예후인 것으로 유방암 예후를 예측하는 단계.
본 발명에서 상기 (a) 단계에서 생물학적 시료는, 이에 제한되지 않으나, 바람직하게 유방암 환자의 유방암 조직일 수 있다. 상기 유방암 조직에는 일부 정상 세포도 포함되어 있을 수 있으며, 바람직하게는 환자의 암세포를 포함하는 유방암 조직의 포르말린 고정 파라핀 포매(formalin-fixed paraffin-embedded, FFPE) 시료, 신선한 조직(fresh tissue) 및 동결 조직으로 이루어진 군에서 선택되는 것일 수 있으나, 이에 제한되는 것은 아니다.
상기 (b) 단계에서 측정 대상이 되는 면역 관련 유전자들은 이에 제한되지 않으나, 바람직하게 TRBV20-1, CCL19, CD52, SRGN, CD3D, IGJ, HLA-DRA, LOC91316, IGF1, CYBRD1, TMC5, ALDH1A1, OGN, PDCD4, FRZB, CX3CR1, IGFBP6, GLA, LOC96610, IGLL3, ITPR1, SERPINA1, EPHX2, MFAP4, RNASET2, CCNG1, FBLN5, SORBS2, CCBL2, BTN3A2, TFAP2B, LTF, ITM2A, HLA-DPB1, HLA-DMA, RPL3, LOC100130100, FAM129A, ELOVL5, GBP2, RARRES3, GOLM1, RTN1, ICAM3, LAMA2, CXCL13, ZCCHC24, CD37, VTCN1, PYCARD, CORO1A, SH3BGRL, TPSAB1, TNFSF10, ACSF2, TGFBR2, DUSP4, ARHGDIB, TMPRSS3, DCN, LRIG1, FMOD, ZNF423, SQRDL, TPST2, CD44, MREG, GIMAP6, GJA1, IFITM3, BTG2, PIP, RPS9, HLA-DPA1, IMPDH2, TNFRSF17, C14orf139, SPRY2, XBP1, THYN1, APOD, C10orf116, VAV3, FAS, MYBPC1, CFB, TRIM22, ARID5B, PTGDS, TGFBR3, TNFAIP8, SEMA3C, TMEM135, ARHGEF3, PTGER4, ABCA8, ICAM2, HLA-DQB1, HSPA2, CD27, ARMCX1, POU2AF1, IGBP1, PDE4B, ADH1B, WLS, SUCLG2, PGR, STARD13, SORL1, ATP1B1, IFT46, SIK3, LIPT1, OMD, HBB, C3, FGL2, PECI, RAC2, PDZRN3, CXCL12, DPYD, TXNDC15, STOM, EMCN, SCGB2A2, FAM176B, HIGD1A, ACSL5, RPS24, RGS10, RAI2, CNN3, FBXW4, SEPP1, SLC44A4, MGP, ABCD3, SETBP1, APOBEC3G, LCP2, HLA-DRB1, SCUBE2, DEPDC6, RPL15, SH3BP4, MSX2, CLU, DPT, ZNF238, HBP1, GSTK1, ZBTB16, CCDC69, ALDH2, SLC1A1, ARMCX2, HMGCS2, TSPAN3, FTO, PON2, C16orf62, QDPR, LRP2, PSMB8, HCLS1, FXYD1, OAT, SLC38A1, MAOA, LPL, C10orf57, SPARCL1, ERAP2, PDGFRL, RBP4, LRRC17, LHFP, BLNK, HBA2, CST7, TRAT1, IL21R, IGHM, CTLA4, IL2RB, TNFRSF9, CTSW, CCR10, GPR18, CR2, DOCK10, GZMB, ITK, LTB, IGLJ3, IGLV1-44, AIM2, CXCL9, KIAA0125, IL2RG,CD69, CD55, TRAF3IP3, EVI2B, STAP1, KLRB1, PRKCB, GPR171, PPP1R16B, SH2D1A, TNFRSF1B, CD48, BANK1, LY9, VNN2, TCL1A, CYTIP, PTPRC, PDCD1LG2, LTA, IGHG1 및 CD19로 이루어지는 군에서 선택된 2개 이상의 것일 수 있다. 각 유전자 서열 및 이로부터의 mRNA, 단백질에 대한 서열은 GenBank에서 등을 통해 당업계에 잘 알려져 있다. 바람직하게는 면역 관련 유전자는 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개 또는 20개의 유전자가 조합된 것일 수 있으며, TRAT1, IL21R, IGHM, CTLA4, IL2RB의 조합 또는 TRAT1, IL21R, CTLA4의 조합일 수 있다.
상기 (a) 단계에서 측정 대상이 되는 면역반응 관련 유전자들은 라쏘 회귀 분석(Lasso regression analysis)을 통해 그 종류가 선택되는 것일 수 있다. 더욱 바람직한 실시 양태(embodiment)에서, 상기 (a) 단계에서 측정 대상이 되는 면역반응 관련 유전자들은, 라쏘 회귀 분석 이외에 추가적으로 콕스 비례 위험 단변량분석 또는 콕스비례위험 다변량 분석 결과를 종합적으로 고려하여 선택되는 것일 수 있다.
본 발명에서 용어 ‘유전자 발현수준 측정’은 대상(목적) 유전자의 발현량의 검출, 더욱 바람직하게는 대상(목적) 유전자 발현량의 정량적인 검출로서 수치화된 발현수준 또는 발현량을 수득하는 것을 의미한다. 대상 유전자의 발현수준 측정은, 이에 제한되지 않으나, 바람직하게 대상(목적) 유전자의 mRNA 발현 수준 측정; 또는 상기 유전자가 코딩하는 단백질 발현수준을 측정에 의해 수행될 수 있다.
상기 유전자의 mRNA 발현수준을 측정하는 방법은 상기 유전자에 특이적으로 결합하는 프라이머쌍 또는 프로브를 이용하는 방법일 수 있으며, 이러한 방법들은 당업계에 공지되어있다. 일례로 상기 유전자의 mRNA 발현수준을 측정하기 위한 방법은, 일례로 마이크로어레이, PCR(polymerase chain reaction), RT-PCR, 정량적 RT-PCR(qRT-PCR), 실시간 중합효소 연쇄반응(real-time PCR), 노던 블롯(northern blot), DNA 칩 및 RNA 칩으로 이루어진 군에서 선택된 어느 하나의 방법일 수 있으며, 이에 제한되지 않는다.
상기 단백질의 발현수준을 측정하는 방법은 해당 단백질에 특이적인 항체를 이용하는 것인 방법일 수 있고, 이러한 방법들은 당업계에 공지되어있다. 일례로 단백질 발현수준 측정을 위한 분석 방법으로는 ELISA(enzyme linked immunosorbent assay), FACS, 단백질 칩(protein chip) 등이 있으나, 이에 제한되는 것은 아니다.
바람직한 하나의 실시 양태에서, 상기 유전자 발현수준의 측정은 해당 유전자의 mRNA 발현 수준을 측정하는 것일 수 있다. 상기 유전자의 mRNA 발현수준을 측정하기 위한 방법은, 정량적 측정 방법으로서 당업계에 공지된 것이라면 그 종류가 특별히 제한되지 않으며, 전술한 종류를 참조로 한다.
mRNA 발현수준의 측정(발현량의 검출)을 위해서는 시료 조직 내에서의 mRNA 분리 및 mRNA로부터 cDNA 합성과정이 필요할 수 있다. mRNA의 분리를 위해서, 시료에 따라 당업계에 공지된 적합한 RNA 분리 방법이 이용될 수 있다. 바람직한 일례에서 본 발명에서 취급하는 시료는 FFPE 시료일 수 있으며, 이에 따라 FFPE 샘플에 적합한 mRNA의 분리방법이 본 발명에 사용될 수 있다. cDNA 합성과정은 mRNA를 주형으로 하여 이루어지는 당업계에 공지된 cDNA 합성 방법이 이용될 수 있다.
하나의 실시 양태에서, 바람직하게 본 발명의 유방암 예후 예측 마커(선택된 면역 관련 유전자)의 발현 수준 측정은, FFPE 시료에서의 mRNA 발현의 정량적 검출을 목적으로 수행되는 것일 수 있으며, 이에 따라 FFPE 시료에 대한 mRNA 분리방법 및 실시간 RT-qPCR (real time reverse transcription quantitative polymerase chain reaction) 방법에 의한 측정이 수행될 수 있다.
또한, 본 발명에서 대상 유전자의 발현 수준의 측정은 당 업계에 공지된 방법에 따라 수행될 수 있으나, 리포터 형광 염료 및/또는 ??쳐 (quencher) 형광 염료로 표지된 프로브를 사용한 광학적 정량 분석 시스템에 의해서 측정될 수 있다. 상기 측정은 상업적으로 판매되는 장비, 예를 들어, ABIPRISM 7700™ Sequence Detection System™, Roche Molecular Biochemicals Lightcycler 및 이에 부속되는 소프트웨어 등의 시스템에 의해서 이루어질 수 있다. 이와 같은 측정 데이터는 측정값 또는 역치 사이클 (Ct 또는 Cp)로서 표현될 수 있다. 측정된 형광값이 처음으로 통계학적으로 유의한 것으로 기록될 때의 지점이 역치 사이클이며, 이는 검출 대상이 PCR 반응의 주형으로써 존재하는 초기값에 반비례하여 나타나므로 역치 사이클 값이 작은 경우 정량적으로 더 많은 검출 대상이 존재하는 것을 나타낸다.
대상 환자 또는 시료에 따라 전체적인 유전자 발현량 또는 발현 수준에 차이가 있을 수 있으므로, 상기 (a) 단계에서 측정된 유전자들의 발현 수준은 표준화가 필요하다. 상기 표준화는, 기본 발현량 또는 기본 발현수준을 나타낼 수 있는 유전자(즉, 표준 유전자)의 발현량 또는 발현 수준에 대한 대상 유전자의 상대적 발현값을 산출하는 것을 통해 이루어진다. 유전자 발현 수준의 표준화 기술에 대해서는 당업계에 잘 알려져 있다.
하나의 실시 양태에서, 상기 표준화는 예를 들어, 당업계에 공지된 표준 발현 유전자 (또는 하우스키핑 유전자)의 발현량에 대한 상대적인 발현값으로 산출되거나, 데이터 세트에 대한 표준화를 위한 알고리즘, 예를 들어 ComBat 알고리즘에 의해 산출될 수 있다. 일 례로, 표준화는 CTBP1 (C-terminal-binding protein 1), CUL1 (cullin 1) 및 UBQLN1(Ubiquilin-1)로 이루어진 군에서 선택된 하나 내지 세 개 유전자의 발현량(또는 복수의 유전자가 선별된 경우 이들 발현량의 평균)을 측정한 후, 이에 대한 대상 유전자(본 발명에서 목적으로 하는 면역 관련 유전자)의 상대적인 발현값을 산출하는 것이다.
상기 (c) 단계는 상기 (b) 단계에서 표준화된 면역 관련 유전자들의 발현 수준을 조합하여 유방암 예후를 예측하는 단계로서, 조합된 면역 관련 유전자들의 과발현은 좋은 예후인 것으로 유방암 예후를 예측한다.
본 발명에서 상기 “나쁜 예후‘란 치료 후 암의 전이, 재발 또는 전이성 재발의 확률이 큰 고위험군을 의미하는 것이며, “좋은 예후”란 전이, 재발 또는 전이성 재발의 확률이 낮은 저위험군을 의미한다.
바람직한 실시 양태에서, 상기 ‘나쁜 예후’란 10년 이내에 암의 전이, 재발 또는 전이성 재발의 확률이 큰 고위험군을 의미하며, ‘좋은 예후’란 10년 이내에 전이, 재발 또는 전이성 재발의 확률이 낮은 저위험군을 의미한다. 상기 ‘10년’이란 원발성 유방암 (primary breast cancer) 환자가 수술로 암을 제거한 시점 (즉, 수술일 기점)으로부터 10년을 의미한다.
더욱 바람직한 실시양태에서, 상기 ‘나쁜 예후’란 5년 이내에 암의 전이, 재발 또는 전이성 재발의 확률이 큰 고위험군을 의미하며, ‘좋은 예후’란 5년 이내에 전이, 재발 또는 전이성 재발의 확률이 낮은 저위험군을 의미한다. 상기 ‘5년’이란 원발성 유방암 (primary breast cancer) 환자가 수술로 암을 제거한 시점 (즉, 수술일 기점)으로부터 5년을 의미한다.
본 발명의 예후 예측 방법은, 상기 (c) 단계에서 유전자들의 조합 시, 증식 관련 유전자는 제외되는 것을 특징으로 한다. 이는 기존에 공지된 많은 암 예후 예측 방법들이 증식 유전자와 암의 발병/진행에 관한 강력한 연관성에 기반하는 것과는 현격한 차이가 있다. 본 발명에서, 상기 (a) 단계에서 선택된 면역 관련 유전자들을 조합함으로써 유방암의 예후를 보다 정확하게 예측 가능하며, 조합된 면역 관련 유전자들의 과발현은 유방암의 좋은 예후와 밀접한 상관성이 있다.
면역 관련 유전자를 이용하는 본 발명의 유방암 예후 예측 방법은, 유방암 수술 후 재발이나 원격 전이 위험을 예측하는데 이용되며, 이러한 예측 정보는 또한 보조 화학 요법(chemotherapy)에 대한 환자 반응을 예상하는데 이용될 수 있다. 즉, 본 발명은 원발성 유방암(primary breast cancer) 수술 후 추가적인 화학치료가 필요 없는 환자를 선별하는데 이용될 수 있다. 이에, 상기 (a) 단계에서 시료 수득의 대상이 되는 유방암 환자는 수술 전과 후에도 어떠한 화학치료(화학요법)를 받지 않은 환자인 것이 바람직하다. 어떠한 화학치료도 받지 않은 환자에 있어서, 본 발명에 따라 ‘좋은 예후’를 가질 것으로 예측된 환자군은 10년 내 전이, 재발 또는 전이성 재발의 발생 확률이 낮기에 수술 후 추가적으로 화학치료가 필요하지 않지만, ‘나쁜 예후’를 가진 집단은 수술 후 10년 내 전이, 재발 또는 전이성 재발의 발생 확률이 높아 수술 후 추가적인 화학치료가 권장될 수 있다.
또한 본 발명의 예후 예측 방법은 TNM 시스템에 따른 LN-여부를 평가하는 단계를 추가적으로 포함할 수 있으며, 상기 (c) 단계에서 LN은 림프절에 암이 전이가 된 경우 예후가 좋지 않은 것으로 예측하는 것을 특징으로 한다. 즉, 면역 관련 유전자들과 림프절 전이 상태(LN)을 조합함으로써 유방암 예후를 보다 정확하게 예측할 수 있으며, 이러한 조합을 통해 유방암 예후를 예측하는 방법은 종래에 보고된 바가 없다. 즉, 상기 방법에 따르면 (a) 단계에서 측정한 유전자들의 발현수준과 함께 LN-여부를 유방암 예후 예측인자로서 판단함으로써, 보다 정확하게 유방암 예후를 예측할 수 있다.
본 발명에서 상기 LN은 유방암의 단계를 구분하는 방법 중 병리학적 구분방법(pathological classification)에 의해 림프절로의 전이 여부로 판단하는 방법을 의미한다. 병리학적 구분방법은 수술 후 병리조직학적 구분방법(postsurgical histopathological classification)이라고도 불리며, 유방암 환자에서 치료를 시작하기 전에 얻었던 정보들과 함께 수술 또는 병리학적 검사들로부터 얻은 정보들을 취합하여 병리 단계를 구분하는 방법이다. LN은 병리학적 구분방법 중 림프절로의 전이정도를 기준으로 판단하는 구분방법으로 겨드랑이 림프절을 절제하여 종양의 전이 여부를 판단한다. 림프절로의 전이가 일어났을 경우와 일어나지 않은 경우로 구분해 림프절로의 전이가 일어나지 않은 경우 상기 표 1에서 표시된 pN-0 단계로 이뤄져있다. pN-1에서 pN-3까지는 모두 림프절로의 전이가 일어난 상태이다.
이에 제한되지 않으나, 바람직한 하나의 실시양태에서 상기 (c) 단계의 ‘유전자들의 조합’은 수학적 조합을 의미하는 것일 수 있다. 즉, 상기 (c) 단계는, 상기 (b) 단계에서 표준화된 면역 관련 유전자들의 발현값을 수학적으로 조합하여, 합계점수를 산출하고, 합계 점수는 유방암 환자의 예후를 나타내는 것일 수 있다. 본 발명에서 상기 용어 ‘합계점수’는 유방암 환자의 예후에 대한 정보를 담고 있기 때문에, 유방암 예후 예측 점수, 또는 유방암 예후 위험지수(risk score)로도 지칭된다. 특히 본 발명에서 이러한 유방암 예후 위험지수(risk score)는 면역유전자에 대한 정보를 담고 있기 때문에 면역지표(immune index)로도 지칭된다.
본 발명에서 용어 ‘수학적 조합’은 ‘수학적으로 발현 값을 합산하는 것 (mathematically combining expression leve l)을 의미하는 것으로, 상기 표준화된 면역관련 유전자들의 발현값을 수학적 알고리즘에 적용하여 합계수치(즉, 합계점수)를 얻는 것으로 이해된다.
하나의 실시 양태에서, 상기 수학적 알고리즘은 바람직하게 선형 회귀 알고리즘(linear regression algorithm)일 수 있다. 구체적인 양태의 일례로서, 상기 수학적으로 조합은, 면역 관련 유전자들에 대한 각각의 발현값과 콕스 회귀 추정값을 선형결합(linear combination)하는 것일 수 있다. 이러한 경우, 수학적 조합은 면역 관련 유전자가 n개일 때 하기 공식 1에 의하는 것일 수 있다:
[공식 1]
합계점수 = (β11) + (β22) + ... + (βnn)
상기 식에서 xn는 n번째 유전자의 발현 값이며,
βn는 n번째 유전자의 콕스회귀 추정값(Cox Regression estimate)임.
본 명세서에서 특정 공식에 사용된 ‘*’기호는 곱하기를 의미한다.
또 다른 하나의 실시양태에서, 표준화된 면역 관련 유전자들의 발현값을 수학적으로 조합할시, 추가적으로 TNM 시스템에 따른 LN-여부 값을 포함하여 수학적으로 조합하는 것일 수 있다. 이러한 실시양태의 일례로서, 상기 수학적으로 조합은 면역반응 관련 유전자가 n개일 때 하기 공식 2에 의하는 것일 수 있다:
[공식 2]
합계점수 = {(β11) + (β22) + ... + (βnn)}+ F*LN
상기 식에서 xn는 n번째 유전자의 발현 값이며,
βn는 n번째 유전자에 대한 콕스 회귀 추정값(Cox Regression estimate)이고,
LN은 림프절 전이 여부를 나타내는 정수를 의미하며(LN은 림프절 전이의 병리학적 판단에 따라 판정되는 값, 0(림프절로 전이가 일어나지 않음) 또는 1(림프절로 전이가 일어남)),
F는 LN-여부에 대한 콕스 회귀 추정값임.
상기와 같이 수학적 조합 방법이 사용되는 경우, 상기 합계점수에 대해 임계값을 결정하고, 임계값과 상기 합계점수를 비교하여 합계점수가 임계값보다 크면 예후가 나쁜 것으로 예후를 예측할 수 있다. 상기 임계값은, 본 발명에서 판단의 기준이 되는 것으로 본 명세서에서 ‘기준값’으로도 지칭되며, 하나 또는 두 개 이상으로 설정될 수 있다.
하나의 실시 양태에서, 상기 합계점수에 대해 하나 또는 두개의 임계값이 결정되고, 임계값에 대하여 상기 합계 점수를 비교함으로써,
고 위험군 및 저 위험군; 또는
고 위험군, 중간 위험군 및 저 위험군으로 구별될 수 있다.
바람직한 구체예로서, 상기 임계값은, 다수의 유방암 환자로부터 수득된 합계점수들에 대하여 정규화(normalization)하여 분포로 나타내었을 때 97.5 분위수(percentile)에 대한 컷-오프 값(cut-off)일 수 있다. 이러한 경우, 임의의 유방암 환자에 대해 계산된 합계점수가 상기 97.5 분위수(percentile)에 대한 컷-오프 값(cut-off) 이상이면 유방암 예후가 나쁠 것으로 예측할 수 있다.
또 다른 구체예로서, 상기 임계값은, 다수의 유방암 환자로부터 수득된 합계점수들에 대하여 정규화(normalization)하여 분포로 나타내었을 때, 2.5 분위수(percentile)에 대한 컷-오프 값(cut-off) 및 97.5 분위수에 대한 컷-오프 값일 수 있다. 이러한 경우, 유방암 예후 예측이 하기와 같이 수행된다:
1) 유방암 환자에 대해 계산된 합계점수가 상기 2.5 분위수(percentile)에 대한 컷-오프 값(cut-off) 이하이면, 유방암 재발 저위험 그룹으로 예측;
2) 유방암 환자에 대해 계산된 합계점수가 상기 97.5 분위수(percentile)에 대한 컷-오프 값(cut-off) 이상이면, 유방암 재발 고위험 그룹으로 예측;
3) 유방암 환자에 대해 계산된 합계점수가 상기 2.5 분위수(percentile)에 대한 컷-오프 값(cut-off)과 97.5 분위수에 대한 컷-오프 값 사이에 있으면 유방암 재발 중간-위험 그룹으로 예측.
상기 정규화는, 당업계에 알려진 통계적 처리 방법에 의한 것이라면 그 기법이 특별히 제한되지 않으나, 일례로 바람직하게 부트스트래핑(bootstrapping) 방법으로 수행되는 것일 수 있다.
바람직한 실시양태의 일례로서, 본 발명은, 상기 (a) 단계 및 (c) 단계에서 TRAT1, IL21R, IGHM, CTLA4 및 IL2RB로 이루어지는 면역 관련 유전자들을 유방암 예후 예측 마커로서 이용하는 방법을 제공한다. 이에 본 발명은 유방암 환자의 예후 예측에 필요한 정보를 제공하기 위하여, 하기 단계를 포함하는 유방암 예후 예측 방법을 제공한다:
(a) 유방암 환자로부터 수득한 생물학적 시료로부터 TRAT1(T Cell Receptor Associated Transmembrane Adaptor 1), IL21R(Interleukin 21 Receptor), IGHM(Immunoglobulin Heavy Constant Mu), CTLA4(Cytotoxic T-Lymphocyte Associated Protein 4) 및 IL2RB(Interleukin 2 Receptor Subunit Beta)로 이루어지는 면역 관련 유전자들의 발현수준을 측정하는 단계;
(b) 상기 (a) 단계에서 측정된 발현 수준을 표준화하는 단계;
(c) 상기 (b) 단계에서 표준화된 면역 관련 유전자들의 발현수준을 조합하여 유방암 예후를 예측하는 단계로서, 상기 면역 관련 유전자들의 과발현은 좋은 예후인 것으로 유방암 예후를 예측하는 단계.
또한 본 발명은 상기 (a) 단계 및 (c) 단계에서 TRAT1, IL21R 및 CTLA4로 이루어지는 면역 관련 유전자들을 유방암 예후 예측 마커로서 이용하는 방법을 제공한다. 이에 본 발명은 유방암 환자의 예후 예측에 필요한 정보를 제공하기 위하여, 하기 단계를 포함하는 유방암 예후 예측 방법을 제공한다:
(a) 유방암 환자로부터 수득한 생물학적 시료로부터 TRAT1(T Cell Receptor Associated Transmembrane Adaptor 1), IL21R(Interleukin 21 Receptor) 및 CTLA4(Cytotoxic T-Lymphocyte Associated Protein 4)로 이루어지는 면역 관련 유전자들의 발현수준을 측정하는 단계;
(b) 상기 (a) 단계에서 측정된 발현 수준을 표준화하는 단계;
(c) 상기 (b) 단계에서 표준화된 면역 관련 유전자들의 발현수준을 조합하여 유방암 예후를 예측하는 단계로서, 상기 면역 관련 유전자들의 과발현은 좋은 예후인 것으로 유방암 예후를 예측하는 단계.
상기 TRAT1, IL21R, IGHM, CTLA4 및 IL2RB으로 이루어지는 군 또는 TRAT1, IL21R 및 CTLA4로 이루어지는 군을 마커로서 조합하는 경우에는, 특히 초기 유방암의 예후 예측에 효과적일 수 있다. 따라서 바람직한 하나의 실시양태서, 상기 유방암 환자는 암전이분류(Tumor Node Metastasis:TNM) 시스템에 따라 LN- 림프절로의 전이가 이뤄지지 않은 경우 pN-0으로 분류되는 초기 유방암 환자 일 수 있다.
상기 TRAT1, IL21R, IGHM, CTLA4 및 IL2RB를 마커로서 조합하는 실시양태에서, 상기 (a) 단계 내지 (c) 단계는 바람직하게 하기 i) 또는 ii)의 유전자 조합에 의해 수행되는 것일 수 있다:
i) TRAT1, IL21R, IGHM, CTLA4 및 IL2RB; 또는
ii) TRAT1, IL21R 및 CTLA4.
본 명세서 실시예에서는 상기 i) 또는 ii)의 유전자 조합을 유방암 예후 예측의 변수들로 이용하는 경우에, 모든 유방암 분자 아형(HR+/HER2-, HR+/HER2+, HR-/HER2+ 및 TNBC)에 대하여 유의성 있게 재발에 대한 고위험군과 저위험군을 분류 가능함을 확인한 바 있다.
상기 i) 또는 ii)와 같은 면역관련 유전자 조합에 있어서, IL21R 과 CTLA4각각은 기존에 이의 높은 발현이 유방암 생존 결과에 부정적인 영향을 주는 것으로 알려졌던 것과는 달리, 본 발명에서 제공하는 바에 따라 다른 면역유전자들과 조합됨에 따라서 이들의 과발현이 좋은 예후 예측 결과를 산출한다는 점에서, 본원 발명의 유방암 예후 예측 방법은 기술적인 특이성이 있다.
인간에서 상기 각 유전자의 서열 및 이로부터의 mRNA 염기서열, 단백질에 대한 아미노산 서열은 일례로 NCBI GenBank 등을 통해 당업계에 잘 알려져 있다. NCBI GenBank 등에 개재된 TRAT1(Gene ID: 50852), IL21R(Gene ID: 50615), IGHM(Gene ID: 3507), CTLA4(Gene ID: 1493) 및 IL2RB(Gene ID: 3560)의 정보를 참조로 할 수 있다.
상기 TRAT1, IL21R, IGHM, CTLA4 및 IL2RB를 마커로서 조합하는 실시양태에서, TNM 시스템에 따른LN-여부를 평가하는 단계를 추가적으로 포함할 수 있으며, 상기 (c) 단계에서 LN 여부- 림프절로 암의 전이가 된 경우 예후가 좋지 않은 것으로 예측하는 것을 특징으로 한다. 또한 이러한 실시 양태에서, 더욱 바람직하게 상기 (c) 단계의 ‘유전자들의 조합’은 수학적 조합일 수 있으며, 이에 대한 구체적 설명은 전술한 바를 참조로 한다.
상기 수학적 조합에 의한 본 발명의 더욱 바람직한 실시 양태로서, 본 발명은 유방암 환자의 예후 예측에 필요한 정보를 제공하기 위하여, 하기 단계를 포함하는 유방암 예후 위험 지수를 산출하는 방법을 제공한다:
(i) 유방암 환자로부터 수득한 생물학적 시료로부터 TRAT1, IL21R, IGHM, CTLA4 및 IL2RB 유전자의 mRNA 발현수준과 유방암 환자의 LN-여부 값을 측정하는 단계;
(ii) 상기 유전자의 mRNA 발현 수준을 표준화하는 단계; 및
(iii) 상기 (ii) 단계의 표준화값 및 상기 (i) 단계의 LN-여부 값을 하기 공식 2-1에 대입하여 유방암 예후 위험 지수(risk score)를 계산하는 단계:
[공식 2-1]
risk score = {(βTRAT1TRAT1) + (βIL21RIL21R) + (βIGHMIGHM) + (βCTLA4CTLA4) + (βIL2RBIL2RB)}+ F*2*LN
(상기 공식 2-1에서 χ는 아래첨자(subscript)로 표시된 유전자의 발현 수준의 표준화 값이며,
βTRAT1는 -0.567144 내지 -0.1952896, βIL21R -0.9759746 내지 -0.3412672, βIGHM -0.5428339 내지 -0.1855019, βCTLA4 -0.7454524 내지 -0.2010003, βIL2RB -1.146983 내지 -0.266771이고,
LN은 LN-여부를 나타내는 정수를 의미하며,
F는 0.3910642 내지 1.013551임).
또한, 본 발명은 유방암 환자의 예후 예측에 필요한 정보를 제공하기 위하여, 하기 단계를 포함하는 유방암 예후 위험 지수를 산출하는 방법을 제공한다:
(i) 유방암 환자로부터 수득한 생물학적 시료로부터 TRAT1, IL21R 및CTLA4 유전자의 mRNA 발현수준과 유방암 환자의 LN-여부를 측정하는 단계;
(ii) 상기 유전자의 mRNA 발현 수준을 표준화하는 단계; 및
(iii) 상기 (ii) 단계의 표준화값 및 상기 (i) LN-여부를 하기 공식 2-2에 대입하여 유방암 예후 위험 지수(risk score)를 계산하는 단계:
[공식 2-2]
risk score = {(βTRAT1TRAT1) + (βIL21RIL21R) + (βCTLA4CTLA4) + F*LN
(상기 공식 2-2에서 χ는 아래첨자(subscript)로 표시된 유전자의 발현 수준의 표준화 값이며,
βTRAT1는 -1.06659 내지 -0.2163024, βIL21R -0.5429339 내지 -0.01642154, βCTLA4 -0.5934638 내지 -0.1644545이고,
LN은 LN 여부를 나타내는 정수를 의미하며,
F는 0.311146 내지 0.9303696임).
상기 공식 2-1 및 공식 2-2는 전술한 i) 또는 ii)의 유전자 조합을 각각 반영한 것으로, 각각의 대상 유전자 및 LN-여부에 대한 값(유전자는 발현값, LN-여부를 나타내는 정수)과 계수로서 콕스 회귀 추정값을 선형결합(linear combination)하여 합계점수를 도출한다. 이러한 합계점수는 독립적으로 유방암 예후 정보를 가지기 때문에, 본 명세서에서 이러한 합계점수는 유방암 예후 위험지수(risk score)로도 지칭되며 구체적 설명은 전술한 바와 같다.
예후 예측 인자(유전자, 임상정보)가 생존율에 영향을 미치는 정도는 Cox 비례 위험 분석(Cox proportional hazard analysis)를 통해 정량적인 값으로 나타낼 수 있다. Cox 비례 위험 모형은 예후 인자가 없는 경우의 위험도와 위험인자가 있는 경우의 위험도의 비례값인 비례위험비(relative hazard ratio, HR)값을 통해 예후 인자가 생존율에 미치는 영향 정도를 표현한다. 비례위험비(HR)의 값이 1보다 크면 예후 인자가 있는 경우에 없는 경우보다 위험도가 올라가며, 1보다 작을 경우 예후 인자가 있을 경우 위험도가 더 감소한다. 각 예후 인자에 대한 비례위험비를 log scale로 전환한 값을 각 인자에 대한 계수(coefficient)라 하며, 이 값을 본 발명에서 유방암 예후 예측 위험지수 산출 공식의 계수로 사용한다(Cox, David R. "Regression models and life-tables." Journal of the Royal Statistical Society. Series B (Methodological) (1972): 187-220.). 유전자의 계수는 교차검증(cross validation)을 통해 산출식의 결과의 타당성을 검증 판단하였다.
상기 콕스 회귀 추정값은 ‘회귀 계수’로도 칭해지며, 본 명세서에서 ‘β유전자 ’의 형태로 기재된다. 즉, βTRAT1, βIL21R, βIGHM, βCTLA4 및 βIL2RB는 각각 TRAT1, IL21R, IGHM, CTLA4 및 IL2RB에 대한 콕스 회귀추정값을 의미한다. 본발명의 상기 공식에서 각 계수는 콕스 회귀를 이용한 생존분석 결과 계산된 계수값(점추정값)의 95% 신뢰구간 범위 내에에서 적용되며, 바람직하게는 점추정값이 사용되는 것일 수 있다. 각 유전자 및 LN-여부에 대한 회귀 계수의 95% 신뢰구간 값과 점추정값은 표 10에 기술되어있다.
상기 공식에서‘χ유전자’에는 아래첨자로 표시된 각 유전자의 발현수준(발현량)을 표준화한 발현값이 대입된다. 즉, 상기 χTRAT1, χIL21R, χIGHM, χCTLA4, 및 χIL2RB는 각각 TRAT1, IL21R, IGHM, CTLA4 및 IL2RB에 대한 표준화된 발현값을 의미한다. 발현수준(발형량)의 표준화 방법에 대해서는 전술한 바를 참조로 한다.
하나의 실시 양태에서, 유방암 예후 위험 지수를 임계값 비교하여, 임계값보다 위험지수가 크면 예후가 나쁜 것으로 예후를 예측하는 것일 수 있다. 이러한 임계값에 대한 설명은 전술한 바를 참조로 한다.
이러한 실시 양태에 대한 하나의 구체예로서, 상기 임계값은 다수의 유방암 환자로부터 수득된 유방암 예후 위험지수들에 대하여 정규화(normalization)하여 분포로 나타내었을 때 97.5 분위수(percentile)에 대한 컷-오프 값(cut-off)인 것일 수 있으며, 바람직하게 상기 97.5 분위수(percentile)에 대한 컷-오프 값(cut-off)은 -7.1일 수 있다.
본 명세서 실시예(example)에서는, 실제 구해진 97.5 분위수(percentile)에 대한 컷-오프 값(cut-off)을 소수점 둘째자리에서 반올림한 값인 -7.1을 임계값(기준값)으로 하여, -7.1 이상의 위험지수가 산출된 유방암 환자를 재발-고위험 그룹으로, -7.1 미만의 위험지수가 산출된 유방암 환자를 재발-저위험 그룹으로 예측할 수 있음을 확인하였다(실시예 5 참조).
다른 구체예로서, 상기 임계값은 다수의 유방암 환자로부터 수득된 유방암 예후 위험지수들에 대하여 정규화(normalization)하여 분포로 나타내었을 때, 2.5 분위수(percentile)에 대한 컷-오프 값(cut-off) 및 97.5 분위수에 대한 컷-오프 값인 것일 수 있으며, 바람직하게 상기 2.5 분위수(percentile)에 대한 컷-오프 값(cut-off)은 - 9.4 이며, 97.5 분위수(percentile)에 대한 컷-오프 값(cut-off)은 -7.1인 것일 수 있다.
본 명세서 실시예(example)에서는, 실제 구해진 97.5 분위수(percentile)에 대한 컷-오프 값(cut-off)을 소수점 둘째자리에서 반올림한 값인 -7.1과, 실제 구해진 2.5 분위수(percentile)에 대한 컷-오프 값(cut-off)을 소수점 둘째자리에서 반올리한 값인 -9.4를 임계값(기준값)으로 하여,
-9.4 이하의 위험지수가 산출된 유방암 환자를 재발-저위험 그룹으로, -7.1 이상의 위험지수가 산출된 유방암 환자를 재발-고위헙 그룹으로, -9.4 내지 -7.1 사이의 위험지수가 산출된 유방암 환자를 재발 중간-위험 그룹으로 예측할 수 있음을 확인하였다(실시예 4 및 실시예 5 참조).
상기 본 발명에 의하면, 예후 예측의 민감도(sensitivity) 와 특이도(specificity)가 높은 수준으로 달성 가능하다. 상기 “민감도(sensitivity)”란 10년 내 재발(전이) 환자 중 본 발명에 의한 검사(예후 예측) 결과에서 고위험 그룹으로 판정된 사례의 비율을 의미하며, 상기 “특이도(specificity)”는 10년간 비-재발(무-전이) 환자 중 본 발명에 의한 검사(예후 예측) 결과에서도 저위험 그룹으로 판정된 사례의 비율을 의미한다.
본 발명의 유방암 예후 예측 방법은, 원발성 유방암(primary breast cancer) 수술 후 추가적인 화학치료가 필요 없는 환자를 선별하는데 이용될 수 있다. 본 발명의 상기 본 알고리즘의 대상 환자군은 바람직하게는 수술 전과 후에도 어떠한 화학치료를 받지 않은 환자군으로 ‘좋은 예후 (good prognosis)’를 가진 환자군은 10년 내 전이, 재발 또는 전이성 재발의 발생 확률이 낮기에 수술 후 추가적으로 화학치료가 필요하지 않지만, ‘나쁜 예후(poor prognosis)’를 가진 집단은 수술 후 10년 내 전이, 재발 또는 전이성 재발의 발생 확률이 높아 수술 후 추가적인 화학치료가 권장될 수 있다.
특히 상기 공식 2-1 또는 공식 2-2로 표시되는 유방암 예후 예측 알고리즘은 광범위한 임상시료를 대상으로 면역관련 유전자 및 임상정보(LN 여부)를 분석하여 산출된 것으로 그 예후 예측력이 종래 임상정보 기반 예후 평가기법 보다 다 더 높은 유방암 예후 예측력을 나타낸다는 점에서 매우 우수하다. 이는 본 명세서 실시예 6에 잘 나타나 있다. 실시예 6에서 보는 바와 같이 본 발명의 위험지수 모델과 다른 임상정보 기반 예후 예측 기법에 대한 c-index를 비교한 결과, 본 발명의 위험지수 모델이 현저히 높은 유방암 예후 예측력을 나타냄을 확인한 바 있다.
또한 본 발명은
ⅰ) TRAT1, IL21R, IGHM, CTLA4 및 IL2RB 유전자; 또는
ⅱ) TRAT1, IL21R 및 CTLA4 유전자
의 발현량을 측정하는 제제를 포함하는 유방암 환자의 예후 예측용 조성물 및 상기 조성물을 포함하는 키트를 제공한다.
상기 조성물 및 키트는, 유전자 발현량(발현 수준)의 표준화에 사용되는 것으로 당업계에 공지된 표준 발현 유전자의 발현량을 측정하는 제제를 추가적으로 포함할 수 있다.
하나의 실시 양태에서, 상기 유전자의 발현량을 측정하는 제제는, 유전자의 mRNA 발현수준을 측정하는 제제; 또는 유전자가 코딩하는 단백질 발현수준을 측정하는 제제일 수 있으며, 이에 제한되지 않는다.
바람직한 실시 양태에서 상기 유전자의 mRNA 발현수준을 측정하는 제제는, 각 유전자에 특이적으로 결합하는 프라이머쌍 또는/ 및 프로브일 수 있다.
본 명세서에서 사용되는 용어 “프라이머”는 올리고뉴클레오타이드를 의미하는 것으로, 핵산쇄(주형)에 상보적인 프라이머 연장 산물의 합성이 유도되는 조건, 즉, 뉴클레오타이드와 DNA 중합효소와 같은 중합제의 존재, 그리고 적합한 온도와 pH의 조건에서 합성의 개시점으로 작용할 수 있다. 바람직하게는, 프라이머는 디옥시리보뉴클레오타이드이며 단일쇄이다. 본 발명에서 이용되는 프라이머는 자연(naturally occurring) dNMP(즉, dAMP,dGMP, dCMP 및 dTMP), 변형 뉴클레오타이드 또는 비-자연 뉴클레오타이드를 포함할 수 있다. 또한, 프라이머는 리보뉴클레오타이드도 포함할 수 있다.
본 발명의 프라이머는 타겟 핵산에 어닐링 되어 주형-의존성 핵산 중합효소에 의해 타겟 핵산에 상보적인 서열을 형성하는 연장 프라이머(extension primer)일 수 있으며, 이는 고정화 프로브가 어닐링 되어 있는 위치까지 연장되어 프로브가 어닐링 되어 있는 부위를 차지한다.
본 발명에서 이용되는 연장 프라이머는 타겟 핵산의 제1위치에 상보적인 혼성화 뉴클레오타이드 서열을 포함한다. 용어 “상보적”은 소정의 어닐링 또는 혼성화 조건하에서 프라이머 또는 프로브가 타겟 핵산 서열에 선택적으로 혼성화할 정도로 충분히 상보적인 것을 의미하며, 실질적으로 상보적(substantially complementary) 및 완전히 상보적(perfectly complementary)인 것을 모두 포괄하는 의미를 가지며, 바람직하게는 완전히 상보적인 것을 의미한다. 본 명세서에서, 프라이머 서열과 관련하여 사용되는 용어, “실질적으로 상보적인 서열”은 완전히 일치되는 서열뿐만 아니라, 특정 서열에 어닐링하여 프라이머 역할을 할 수 있는 범위 내에서, 비교 대상의 서열과 부분적으로 불일치되는 서열도 포함되는 의미이다.
프라이머는, 중합제의 존재 하에서 연장 산물의 합성을 프라이밍시킬 수 있을 정도로 충분히 길어야 한다. 프라이머의 적합한 길이는 다수의 요소, 예컨대, 온도, 응용분야 및 프라이머의 소스(source)에 따라 결정되지만 전형적으로 15-30 뉴클레오타이드이다. 짧은 프라이머 분자는 주형과 충분히 안정된 혼성 복합체를 형성하기 위하여 일반적으로 보다 낮은 온도를 요구한다. 용어 “어닐링”또는 “프라이밍”은 주형 핵산에 올리고디옥시뉴클레오타이드 또는 핵산이 병치(apposition)되는 것을 의미하며, 상기 병치는 중합효소가 뉴클레오타이드를 중합시켜 주형 핵산 또는 그의 일부분에 상보적인 핵산 분자를 형성하게 한다.
프라이머의 서열은 주형의 일부 서열과 완전하게 상보적인 서열을 가질 필요는 없으며, 주형과 혼성화되어 프라이머 고유의 작용을 할 수 있는 범위 내에서의 충분한 상보성을 가지면 충분하다. 따라서 본 발명에서의 프라이머는 주형인 상술한 뉴클레오티드 서열에 완벽하게 상보적인 서열을 가질 필요는 없으며, 이 유전자서열에 혼성화되어 프라이머 작용을 할 수 있는 범위 내에서 충분한 상보성을 가지면 충분하다. 이러한 프라이머의 디자인은 상술한 뉴클레오티드 서열을 참조하여 당업자에 의해 용이하게 실시할 수 있으며, 예컨대, 프라이머 디자인용 프로그램(예: PRIMER 3 프로그램)을 이용하여 할 수 있다.
본 발명에서 상기 키트는, 대상 유전자들의 발현량 측정을 위한 제제 이외에 기타 측정에 사용되는 도구 및 보조 시약들을 포함할 수 있다. 상기 키트는 측정 제제 및 측정 방법에 따라 구체적 시약 및 도구들의 구성품들이 함께 구성되며, 측정 방법에 대해서는 전술한 바를 참조로 한다. 바람직한 일례로 키트는 RT-PCR 키트, 실시간 RT-PCR 키트, 실시간 QRT-PCR 키트, 마이크로어레이 칩 키트 또는 단백질 칩 키트일 수 있다.
하나의 실시 양태에서, 상기 키트는 각 유전자에 대하여 PCR 증폭이 가능한 프라이머쌍 이외에, PCR 반응, 시료에서 RNA의 분리 및 cDNA의 합성에 사용되는 당업계에 공지된 도구, 장치 및/또는 시약을 추가로 포함할 수 있다. 본 발명의 키트는 필요에 따라 각 성분들을 혼합하는데 사용될 튜브, 웰 플레이트 및 사용방법을 기재한 지시자료 등을 추가로 포함할 수 있다.
본 발명은 유방암 분자 아형에 관계없이 모든 유방암 환자에 적용가능할 뿐만아니라, 본 발명에서 제공하는 바에 따라 면역관련 유전자 조합을 유방암 예후 예측에 이용하면 증식 유전자에 대한 정보 없이도 유방암 환자의 예후 예측이 가능하다.
도 1은 본 발명에서 면역유전자를 이용한 새로운 유방암 예후 예측 기술의 개발을 위한 전반적인 작업흐름(workflow)을 나타낸다.
도 2는 discovery set 및 validation set에 사용된 코호트들에 대한 정보를 요약하여 나타낸 것으로, GEO 번호, 데이터 세트의 환자 샘플 총 수, 생존 유형(DFS, DMFS, 또는 OS) 및 치료 유형 등을 나타나낸다.
도 3은 유방암의 각 분자 야형별로, 환자들을 임상적 위험 평가 기준(Adjuvant! Online에 기반) 및 증식 유전자-위험 계층화 기준 따라 분류한 결과를 보여준다. 도 3에서 보는 바와 같이 환자들은 먼저 임상적 위험 평가 기준(Adjuvant! Online에 기반) 및 증식 유전자-위험 계층화 기준 따라 4가지 그룹으로 나뉘어진 뒤, 회귀 분석 결과와 생존율이 유사한 그룹은 다시 통합되었다. 이에 따라 각 아형별로 1개 내지 3개의 세부그룹(AH, AI, AL)이 발생하였다.
도 4는 HR+/HER2- 아형 내 AH, AI 및 AL의 세부 그룹별로 DFS/DMFS에 대한 Kaplan-Meier plot을 보여준다.
도 5는 HR+/HER2+ 아형 내 AH 및 AL의 세부 그룹별로 DFS/DMFS에 대한 Kaplan-Meier plot을 보여준다.
도 6은 HR-/HER+ 아형 집단의 DFS/DMFS에 대한 Kaplan-Meier plot을 보여주는 것으로, HR-/HER+ 아형 집단은 모두 AH 그룹 분류되었다.
도 7은 TNBC(HR-/HER-) 아형 내 AH 및 AL의 세부 그룹별로 DFS/DMFS에 대한 Kaplan-Meier plot을 보여준다.
도 8은 면역유전자를 이용한 본 발명의 예후 위험지수 모델에 있어서, 예후 예측의 기준이 되는 2개의 최적 컷-오프 포인트(cutoff-1 및 cutoff-2)를 나타낸다.
도 9는 본 발명에 따른 위험지수를 이용하여 cutoff-1 기준에 따라 분류된 고-위험그룹 및 저-위험 그룹에 있어서 이들의 DFS/DMFS에 대한 Kaplan-Meier curve을 보여준다.
도 10은 본 발명에 따른 위험지수를 이용하여 cutoff-2 기준에 따라 분류된 고-위험그룹 및 저-위험 그룹에 있어서 이들의 DFS/DMFS에 대한 Kaplan-Meier curve를 보여준다.
도 11은 본 발명에 따른 위험지수를 이용하여 cutoff-1 및 cutoff-2를 함께 기준으로 사용함에 따라 분류된 면역 고-위험 그룹, 면역 중간-위험 그룹, 면역 저-위험그룹에서, DFS/DMFS에 대한 Kaplan-Meier curve를 보여준다.
도 12는 도 11에 AL 및 AI 그룹(임상적 위험 평가 기준 및 증식 유전자-위험 계층화 기준에 따라 분류되었던 세부그룹)에서의 DFS/DMFS에 대한 Kaplan-Meier curve를 추가하여 보여준다.
도 13은 HR+/HER2- 아형에 대하여 본 발명의 위험지수 모델을 이용해 분류된 면역 고-위험 그룹, 면역 중간-위험 그룹, 면역 저-위험그룹에서, DFS/DMFS에 대한 Kaplan-Meier curve를 보여준다. 비교를 위하여, HR+/HER2- 아형 내 AL 및 AI 그룹(임상적 위험 평가 기준 및 증식 유전자-위험 계층화 기준에 따라 분류되었던 세부그룹)의 DFS/DMFS에 대한 Kaplan-Meier curve도 추가적으로 나타내었다.
도 14는 HR+/HER2+ 아형에 대하여 본 발명의 위험지수 모델을 이용해 분류된 면역 고-위험 그룹, 면역 중간-위험 그룹, 면역 저-위험그룹에서, DFS/DMFS에 대한 Kaplan-Meier curve를 보여준다. 비교를 위하여, HR+/HER2+ 아형 내 AL 및 AI 그룹(임상적 위험 평가 기준 및 증식 유전자-위험 계층화 기준에 따라 분류되었던 세부그룹)의 DFS/DMFS에 대한 Kaplan-Meier curve도 추가적으로 나타내었다.
도 15는 HR-/HER2+ 아형에 대하여 본 발명의 위험지수 모델을 이용해 분류된 면역 고-위험 그룹, 면역 중간-위험 그룹, 면역 저-위험그룹에서, DFS/DMFS에 대한 Kaplan-Meier curve를 보여준다(전술한 바와 같이, HR-/HER2+아형 집단은 임상적 위험 평가 기준 및 증식 유전자-위험 계층화 기준에 따라 모두 AH 그룹으로 분류된 바 있음을 참조로 한다)
도 16은 TNBC(HR-/HER2-) 아형에 대하여 본 발명의 위험지수 모델을 이용해 분류된 면역 고-위험 그룹, 면역 중간-위험 그룹, 면역 저-위험그룹에서, DFS/DMFS에 대한 Kaplan-Meier curve를 보여준다. 비교를 위하여, TNBC(HR-/HER2-) 아형 내 AL 및 AI 그룹(임상적 위험 평가 기준 및 증식 유전자-위험 계층화 기준에 따라 분류되었던 세부그룹)의 DFS/DMFS에 대한 Kaplan-Meier curve도 추가적으로 나타내었다.
도 17은 Affymetrix microarray platform GPL96에 대하여 본 발명의 위험지수 모델을 이용해 분류된 면역 고-위험 그룹 및 면역 저-위험그룹에서, OS(overall survival)에 대한 Kaplan-Meier curve를 보여준다.
도 18은 Affymetrix microarray platform GPL570에 대하여 본 발명의 위험지수 모델을 이용해 분류된 면역 고-위험 그룹 및 면역 저-위험그룹에서, OS(overall survival)에 대한 Kaplan-Meier curve를 보여준다.
도 19는 METABRIC(Molecular Taxonomy of Breast Cancer International Consortium) 코호트에 대하여 본 발명의 위험지수 모델을 이용해 분류된 면역 고-위험 그룹 및 면역 저-위험그룹에서, DFS에 대한 Kaplan-Meier curve를 보여준다.
도 20은 HR+/HER2- 아형에 대하여 본 발명의 위험지수 모델을 이용해 분류된 면역 고-위험 그룹, 면역 저-위험그룹에서, OS에 대한 Kaplan-Meier curve를 보여준다.
도 21은 HR+/HER2+ 아형에 대하여 본 발명의 위험지수 모델을 이용해 분류된 면역 고-위험 그룹, 면역 저-위험그룹에서, OS에 대한 Kaplan-Meier curve를 보여준다.
도 22는 HR-/HER2+ 아형에 대하여 본 발명의 위험지수 모델을 이용해 분류된 면역 고-위험 그룹, 면역 저-위험그룹에서, OS에 대한 Kaplan-Meier curve를 보여준다.
도 23은 TNBC(HR-/HER2-) 아형에 대하여 본 발명의 위험지수 모델을 이용해 분류된 면역 고-위험 그룹, 면역 저-위험그룹에서, OS에 대한 Kaplan-Meier curve를 보여준다.
도 24는 c-index를 산출하여, 유방암 예후(특히, DFS / DMFS 예측)에 있어서 본 발명 위험지수 모델(면역지표로도 칭함, 도면에 immune index로 표기)의 예후 예측 성능을, 다른 기존 방법들(기존에 임상적 특징만으로 예후를 예측하였던 방법)과 비교한 결과를 나타낸다.
이하 본 발명을 상세히 설명한다.
단, 하기 실시예는 본 발명을 예시하는 것일 뿐, 본 발명의 내용이 하기 실시예에 한정되는 것은 아니다.
실시예 1: 유방암 환자 데이터 수집
A. discovery set : 공공의 데이터베이스인 National Center for Biotechnology Information Gene Expression Omnibus (GEO, http://www.ncbi.nlm.nih.gov/geo)를 면밀히 조사하여, 분석을 위한 5개의 다른 유방암 데이터 세트들을 수집하였다. 본 연구에서 사용된 데이터 세트는 다음 기준에 따라 엄격하게 선택되었다: 1) 임상 데이터에서 ER(estrogen receptor) 상태 또는 유방암 분자 아형(molecular subtype)이 확인될 것, 2). 환자는 화학 요법(chemotherapy)을 받지 않았을 것, 3) 데이터 세트는 Affymetrix platform([HG-U133_Plus_2] Affymetrix Human Genome U133 Plus 2.0 Array 또는 [HG-U133A] Affymetrix Human Genome U133A Array)으로 조사되었을 것, 4) 데이터 세트에는 생존정보가 포함되어 있어야하며, DFS/DMFS(disease free survival/distant-metastasis free survival) 또는 보다 바람직한 endpoint로서 OS(overall survival)의 정보가 포함되어있을 것, 5) 데이터 세트는 림프절 상태, 종양 크기, 환자 나이 및 조직학적 등급에 대한 임상 정보를 포함할 것.
최종적으로 GSE6532, GSE7390, GSE11121, GSE31519 및 GSE4922 코호트(cohorts)로부터 본 연구에 사용할 마이크로어레이 데이터 세트를 선택하였으며(이를 discovery set로 칭함), 이들은 모두 동일한 플랫폼인 Affymetrix GPL96으로 조사되었다. 총 967 명의 환자 샘플이 분석되었다.
하기 표 3은 모든 환자에 대하여, 전통적인 임상병리학적 특징(conventional clinicopathological characteristics)을 요약적으로 보여주며, 이들은 분자 아형 및 코호트 별로 정리되었다.
Figure 112020047964512-pat00001
B. validation set: 검증을 위한 데이터 세트로서, GSE21653, GSE42568, GSE3494 코호트(cohorts)로부터 마이크로어레이 데이터 세트를 선택하였다. 또한 다른 플랫폼을 이용한 추가의 검증을 위해, 마이크로어레이 데이터 세트에 적용된 동일한 기준으로 METABRIC 유전자 발현 프로파일을 분석 하였다. 데이터는 cBioportal website (http://www.cbioportal.org/index.do)를 통해 다운로드되었으며, 분석 전에 log2 정규화(log2 normalize)되었다.
상기 discovery set 및 validation set에 사용된 데이터 세트들 및 플랫폼들에 대해 도 2에 요약하여 나타내었다. 본 연구에 사용된 환자 데이터들은 암전이분류 TNM(Tumor Node Metastasis) 시스템에 따라 유방암 LN- 여부가 0 (림프절로의 전이가 일어나지 않음) 또는 1 (림프절로의 전이가 일어남)으로 분류되는 것들을 이용하였다.
실시예 2: 증식/세포주기 관련 유전자를 이용하는 기존 방식에 따른 환자 유방암 예후 위험도 계층화(risk stratification)
2-1. 데이터 마이닝(Data Mining)
유방암 분자 아형을 확인할 수 있는 정보들에 기반하여, 각 환자들을 유방암의 4가지 아형인 HR+/HER2-(ER+ or PR+/HER2-), HR+/HER2+(ER+ or PR+/HER2+), HR-/HER2+(ER-/PR-/HER2+), 또는 TNBC(ER-/PR-/HER2-)로 분류 하였다.
상기 실시예 1에서 다운로드된 데이터들은 분석 전에 log2 정규화(log2 normalize)되었다. 다음으로, discovery set에서, 편향(bias)을 줄이기 위해 사분범위(interquartile range)의 임계값을 초과하는 유전자들을 선택적으로 선별했다. 또한, 선택된 데이터 세트에 존재하는 비-생물학적 편차(variation)를 줄이기 위해, ComBat 알고리즘을 사용하여 discovery set 및 validation set에 대해 배치효과보정(batch effect correction)을 수행하고, 주성분 분석(principal component analysis)으로 검증했다. 상기 보정 및 정규화가 수행된 후, 각 분자 아형(molecular subtype)의 데이터들은 임상 데이터 및 유전자 위험 분류 체계(gene risk classification scheme)에 의해 4가지 위험 범주로 계층화되었다(하기 실시예 2-4 참조).
2-2. 생존분석(Survival analysis)
생존 분석을 수행할 시에 이용되는 가장 바람직한 endpoint는 OS(overall survival, 전체 생존)이지만, 시간적 한계로 인해서 항상 OS 정보가 이용가능 하지는 않다. 따라서 시간적 한계가 있는 경우, OS 대신에 DFS(disease free survival) 또는 DMFS(distant-metastasis free survival)를 endpoint서 사용되게 된다. 본 연구에서도 OS(overall survival) 및 DFS/DMFS가 함께 임상 종료점(endpoint)으로 사용되었다. Cox 비례 위험 회귀(Cox proportional hazard regression) 분석을 사용하여, 임상적 변수 및 유전적 변수에 대한 단변량 분석과 다변량 분석을 수행하였다. 다변량 분석을 통해 예측 변수의 독립적 기여를 확인했다. 또한, Kaplan-Meier 방법과 log-rank 검정을 사용하여 생존 결과를 그래프로 나타냈으며, 이를 통해 각 그룹 간의 생존 차이가 확인되었다. Log lank p-value <0.05 일 때 통계적으로 유의한 것으로 추정되었다. 상기 방법들은, 후술되는 실시예들(실시예 3 내지 실시예 5)에서도 동일한 방식으로 이용되었다.
2-3. 유전자 온톨로지(ontology) 및 경로 분석(pathway analysis)
유방암 아형(subtype)에 따라 유전자 주석(Gene annotation) 및 경로 분석(pathway analysis)을 수행하였다. 유전자 경로의 주석은 두 부분으로 구성된다. 먼저, DAVID로부터 p-value가 0.01 이하인 가장 유의적인 유전자들에 주석이 달렸다. 추가 분석을 위해 R version 3.4.3. 내의 gene annotation package topGO를 사용하여, 회귀 분석에서 가장 유의한 유전자들의 경로에 주석을 달았다. topGO는 가장 중요한 경로를 찾기 위해 유전자 점수를 계산하기 위하여, Fisher’s exact test 및 Kolmogorov-Smirnov test의 두가지 유형의 통계를 적용한다. 또한 classic method 및 elim method의 두 가지 유형의 알고리즘을 각 통계에 적용 할 수 있다.
본 연구에서는 Kolmogorov-Smirnov test에 상기 두 가지 알고리즘이 적용되었으며, 또한 가장 중요한 주석을 찾기 위해 classic Fisher가 사용되었다. 경로 분석 전에, 통상적으로 4가지 아형으로 분류되는 유방암 유형을, 총 HR-, HR+/HER+, HR+/HER-의 세집단으로 그룹화하였다. 이는, HR-/HER+ 및 HR-/HER- 아형 간에 생존 결과가 통계적으로 차이가 없었기 때문에(데이터 미도시) 이들을 HR-로 통합하였기 때문이다.
유전자 주석 및 경로 분석 결과를 하기 표 4에 나타내었다. HR+ 유형들에서 생존에 유의적으로 기여하는 대부분의 유전자가 세포 증식 및 세포주기 조절과 관련이 있었으며, 반면 HR- 유형에서는 생존에 유의하게 관련된 유전자가 운동(locomotion) 및 면역 반응과 관련이 있음을 보여주었다(표 4).
Figure 112020047964512-pat00002
2-4. 증식/세포주기 관련 유전자를 이용한 위험 계층화(risk stratification)
경로 분석을 바탕으로, 증식과 관련되고 HR+ 그룹에서 생존 결과에 유의적으로 기여하는 총 37 개의 증식 유전자들을 다음과 같은 기준으로 선택 하였다 : 1). 고-분산(High variance), 2). 유전자 온톨로지 분석에서 유의한 결과를 나타냄,
상기 37개의 증식 유전자들을 Cox proportional hazard regression 분석하여, DFS/DMFS(disease free survival/distant-metastasis free survival)에 유의적인 관련성이 있는 유전자 예측 인자를 찾고자 하였다. Cox 비례 위험 회귀(Cox proportional hazard regression)를 모든 유방암 아형에 적용하여, 세포의 증식과 관련된 가장 강력한(가장 유의적인) 유전자를 찾고자 하였다.
다변량 Cox 회귀 분석 후 총 10개의 유전자(BUB1B, UBE2S, RRM2, KIFC1, PTTG1, MELK, CDK1, FOXMI, TRIP13, RACGAP1)가 예후적 능력 및 독립성을 보유한 것으로 판별되었고, 이들은 이하에서 유전자 위험 분류를 위한 증식/세포주기 조절 유전자로 선택되었다.
모든 환자 샘플에 대해, 각각의 증식/세포주기 조절 유전자의 발현 수준이 유전자의 평균 발현에 따라 "높음" 또는 "낮음"의 2개 범주로 분류되었다. 선정된 10개 유전자 중 5개 이상의 발현 수준이 "낮음"으로 분류되면, 해당 환자는 증식 저-위험군으로 분류하고, 그렇지 않으면 증식 위험이 높은 군으로 분류되었다.
유전자-위험 계층화(gene-risk stratification)에 따라 각각의 샘플을 분류하는 것 외에도,‘Adjuvant! Online’을 적용하여 환자를 임상적으로 고-위험군 또는 저-위험군으로 분류하였으며, 이를 표 5에서 보여준다. 표 5는 유방암의 4가지 분자 아형 각각에 대한 임상적 위험 평가(clinical risk assessment)를 보여주며, 각 그룹은 조직학적 등급, 림프절 상태 및 종양 크기에 따라 분류된다.
Figure 112020047964512-pat00003
증식/세포주기 관련 유전자를 기반으로한 유전자-위험 계층화는, Adjuvant! Online에 기반한 임상적 위험 평가 결과와 결합되었으며, 이를 바탕으로 각 아형에서의 환자들을 하기 4개 위험 하위범주로 그룹화하였다: 1) 임상적으로 고위험/증식 고위험 2) 임상적으로 고위험/증식 저위험, 3) 임상적으로 저위험/증식 고위험 및 4) 임상적으로 저위험/증식 저위험.
그러나 각각의 유방암 아형을 상기 4가지 위험 범주로 나누면 각 위험 범주에서 샘플 수가 불충분하게 생성되었으므로, 이를 해결하기 위해 유방암 아형 내의 각 위험 범주는 샘플 크기 및 콕스 회귀 결과에 따라 결합되었다(도 3 참조).
구체적으로, HR+/HER2- 아형 집단은 3개의 위험그룹으로 나뉘어졌으며, 임상적으로 고위험/증식 고위험인 군은 최종적으로 고위험군(All high-risk group, AH로 표기)으로, 임상적으로 고위험/증식 저위험 및 임상적으로 저위험/증식 고위험의 결과를 나타내는 환자들은 최종적으로 중간-위험 그룹(All intermediate-group hereon, AI으로 표기)으로, 임상적으로 저위험/증식 저위험은 최종적으로 저-위험 그룹(All low-risk group hereon, AL로 표기)으로 분류되었다.
HR+/HER2+ 아형 집단은 총 2개의 위험 그룹으로 나뉘어졌으며, 임상적으로 고위험/증식 고위험을 나타내는 샘플을 AH 그룹으로, 이외의 나머지를 AL 그룹으로 분류하였다.
HR-/HER2+ 아형 집단에서는 3개의 샘플을 제외하고, 첨음부터 모두 AH 그룹으로 분류되어, 더 이상 재그룹화가 필요하지 않았다. 즉, HR-/HER2+ 아형 집단은 자체를 AH 그룹으로 간주하였다.
마지막으로, TNBC 아형 집단은 총 2개의 위험 그룹으로 나뉘어졌으며, 임상적으로 고위험/증식 고위험, 임상적으로 고위험/증식 저위험 및 임상적으로 저위험/증식 고위험인 것을 AH 그룹으로 분류하고, 임상적으로 저위험/증식 저위험인 것을 AL 그룹으로 분류하였다.
임상정보가 누락된 환자 샘플은 본 연구에서 제외하였다. 본 연구의 전반적인 개략도(schematics)가 도 1에 표시되어 있다. 또한 validation set의 정보들도, 상기 discovery set에서 수행한 것처럼 유전자-위험 계층화 및 임상적 위험 평가에 따라 분류되었다.
도 3에서와 같이 세부 위험그룹으로 분류된 각각의 유방암 아형에 대하여, Kaplan-Meier 방법과 log-rank 검정을 사용하여 생존 결과를 그래프로 나타내었으며, 이를 도 4 내지 도 7에서 보여준다.
HR+/HER2- 아형(도 4) 및 HR+/HER2+ 아형(도 5) 내에서 상기 유전자-위험 계층화 및 임상적 위험 평가에 따라 분류된 위험 그룹들의 Log-rank p-value는 각각 p <0.0001였으며, TNBC 아형(도 7)에서 p=0.0018이었다. HR-/HER2+ 아형(도 6)은 오직 AH 그룹으로만 구성되어, 생존 곡선(survival curve)이 추정될 수 없었다. 각 위험 그룹에 대한 Cox regression analysis 결과는, HR+/HER2- 아형 내에서 AH 그룹과 비교하여 AI 그룹 및 AL 그룹의 hazard ratio가 각각 0.613(p=0.003, 95% CI:0.444-0.847) 및 0.217(p<0.0001, 95% CI: 0.145-0.327)임을 보여주었다. HR+/HER2+ 및 TNBC 아형에서도 이와 유사한 관찰 결과를 보였으며, AH 그룹 대비 AL 그룹에서 hazard ratio가 각각 0.255 (p < 0.0001, 95% CI: 0.134-0.483) 및 0.377 (p = 0.0182, 95% CI: 0.162-0.873-0.0.8426) 로 나타났다.
실시예 3: 면역유전자만을 이용한 새로운 유방암 예후 예측 기술의 개발
3-1. 유방암 예후 예측 관련 면역 유전자 1차 선별
각 유방암 아형 내의 서브그룹(subgroup, 즉 위험그룹) 각각에서 하기 표 6에 기재된 것과 같은 면역 반응 유전자들의 예후적 가치를 전술한 것과 유사한 방법으로 분석하였다.
유전자 기호 유전자 명칭
TRBV20-1 T cell receptor beta variable 20-1
CCL19 chemokine (C-C motif) ligand 19
CD52 CD52 molecule
SRGN serglycin
CD3D CD3d molecule, delta (CD3-TCR complex)
IGJ immunoglobulin J polypeptide, linker protein for immunoglobulin alpha and mu polypeptides
HLA-DRA major histocompatibility complex, class II, DR alpha
LOC91316 glucuronidase, beta/immunoglobulin lambda-like polypeptide 1 pseudogene
IGF1 insulin-like growth factor 1 (somatomedin C)
CYBRD1 cytochrome b reductase 1
TMC5 transmembrane channel-like 5
ALDH1A1 aldehyde dehydrogenase 1 family, member A1
OGN osteoglycin
PDCD4 programmed cell death 4 (neoplastic transformation inhibitor)
FRZB frizzled-related protein
CX3CR1 chemokine (C-X3-C motif) receptor 1
IGFBP6 insulin-like growth factor binding protein 6
GLA galactosidase, alpha
LOC96610 BMS1 homolog, ribosome assembly protein (yeast) pseudogene
IGLL3 immunoglobulin lambda-like polypeptide 3
ITPR1 inositol 1,4,5-triphosphate receptor, type 1
SERPINA1 serpin peptidase inhibitor, clade A (alpha-1 antiproteinase, antitrypsin), member 1
EPHX2 epoxide hydrolase 2, cytoplasmic
MFAP4 microfibrillar-associated protein 4
RNASET2 ribonuclease T2
CCNG1 cyclin G1
FBLN5 fibulin 5
SORBS2 sorbin and SH3 domain containing 2
CCBL2 cysteine conjugate-beta lyase 2
BTN3A2 butyrophilin, subfamily 3, member A2
TFAP2B transcription factor AP-2 beta (activating enhancer binding protein 2 beta)
LTF lactotransferrin
ITM2A integral membrane protein 2A
HLA-DPB1 major histocompatibility complex, class II, DP beta 1
HLA-DMA HLA-DMA major histocompatibility complex, class II, DM alpha
RPL3 ribosomal protein L3
LOC100130100 similar to hCG26659
FAM129A family with sequence similarity 129, member A
ELOVL5 ELOVL family member 5, elongation of long chain fatty acids (FEN1/Elo2, SUR4/Elo3-like, yeast)
GBP2 guanylate binding protein 2, interferon-inducible
RARRES3 retinoic acid receptor responder (tazarotene induced) 3
GOLM1 golgi membrane protein 1
RTN1 reticulon 1
ICAM3 intercellular adhesion molecule 3
LAMA2 laminin, alpha 2
CXCL13 chemokine (C-X-C motif) ligand 13
ZCCHC24 zinc finger, CCHC domain containing 24
CD37 Cluster of Differentiation 37
VTCN1 V-set domain containing T cell activation inhibitor 1
PYCARD PYD and CARD domain containing
CORO1A coronin, actin binding protein, 1A
SH3BGRL SH3 domain binding glutamic acid-rich protein like
TPSAB1 tryptase alpha/beta 1
TNFSF10 tumor necrosis factor (ligand) superfamily, member 10
ACSF2 acyl-CoA synthetase family member 2
TGFBR2 transforming growth factor, beta receptor II (70/80kDa)
DUSP4 dual specificity phosphatase 4
ARHGDIB Rho GDP dissociation inhibitor (GDI) beta
TMPRSS3 transmembrane protease, serine 3
DCN decorin
LRIG1 leucine-rich repeats and immunoglobulin-like domains 1
FMOD fibromodulin
ZNF423 zinc finger protein 423
SQRDL sulfide quinone reductase-like (yeast)
TPST2 tyrosylprotein sulfotransferase 2
CD44 CD44 molecule (Indian blood group)
MREG melanoregulin
GIMAP6 GTPase, IMAP family member 6
GJA1 gap junction protein, alpha 1, 43kDa
IFITM3 interferon induced transmembrane protein 3 (1-8U)
BTG2 BTG family, member 2
PIP prolactin-induced protein
RPS9 ribosomal protein S9
HLA-DPA1 major histocompatibility complex, class II, DP alpha 1
IMPDH2 IMP (inosine 5'-monophosphate) dehydrogenase 2
TNFRSF17 tumor necrosis factor receptor superfamily, member 17
C14orf139 chromosome 14 open reading frame 139
SPRY2 sprouty homolog 2 (Drosophila)
XBP1 X-box binding protein 1
THYN1 thymocyte nuclear protein 1
APOD apolipoprotein D
C10orf116 chromosome 10 open reading frame 116
VAV3 vav 3 guanine nucleotide exchange factor
FAS Fas (TNF receptor superfamily, member 6)
MYBPC1 myosin binding protein C, slow type
CFB complement factor B
TRIM22 tripartite motif-containing 22
ARID5B AT rich interactive domain 5B (MRF1-like)
PTGDS prostaglandin D2 synthase 21kDa (brain)
TGFBR3 transforming growth factor, beta receptor III
TNFAIP8 tumor necrosis factor, alpha-induced protein 8
SEMA3C sema domain, immunoglobulin domain (Ig), short basic domain, secreted, (semaphorin) 3C
TMEM135 transmembrane protein 135
ARHGEF3 Rho guanine nucleotide exchange factor (GEF) 3
PTGER4 prostaglandin E receptor 4 (subtype EP4)
ABCA8 ATP-binding cassette, sub-family A (ABC1), member 8
ICAM2 intercellular adhesion molecule 2
HLA-DQB1 major histocompatibility complex, class II, DQ beta 1
HSPA2 heat shock 70kDa protein 2
CD27 CD27 molecule
ARMCX1 armadillo repeat containing, X-linked 1
POU2AF1 POU class 2 associating factor 1
IGBP1 immunoglobulin (CD79A) binding protein 1
PDE4B phosphodiesterase 4B, cAMP-specific
ADH1B alcohol dehydrogenase 1B (class I), beta polypeptide
WLS wntless homolog (Drosophila)
SUCLG2 succinate-CoA ligase, GDP-forming, beta subunit
PGR progesterone receptor
STARD13 StAR-related lipid transfer (START) domain containing 13
SORL1 sortilin-related receptor, L(DLR class) A repeats-containing
ATP1B1 ATPase, Na+/K+ transporting, beta 1 polypeptide
IFT46 intraflagellar transport 46 homolog (Chlamydomonas)
SIK3 SIK family kinase 3
LIPT1 lipoyltransferase 1
OMD osteomodulin
HBB hemoglobin, beta
C3 complement component 3
FGL2 fibrinogen-like 2
PECI peroxisomal D3,D2-enoyl-CoA isomerase
RAC2 ras-related C3 botulinum toxin substrate 2 (rho family, small GTP binding protein Rac2)
PDZRN3 PDZ domain containing ring finger 3
CXCL12 chemokine (C-X-C motif) ligand 12
DPYD dihydropyrimidine dehydrogenase
TXNDC15 thioredoxin domain containing 15
STOM stomatin
EMCN endomucin
SCGB2A2 secretoglobin, family 2A, member 2
FAM176B family with sequence similarity 176, member B
HIGD1A HIG1 hypoxia inducible domain family, member 1A
ACSL5 acyl-CoA synthetase long-chain family member 5
RPS24 ribosomal protein S24
RGS10 regulator of G-protein signaling 10
RAI2 retinoic acid induced 2
CNN3 calponin 3, acidic
FBXW4 F-box and WD repeat domain containing 4
SEPP1 selenoprotein P, plasma, 1
SLC44A4 solute carrier family 44, member 4
MGP matrix Gla protein
ABCD3 ATP-binding cassette, sub-family D (ALD), member 3
SETBP1 SET binding protein 1
APOBEC3G apolipoprotein B mRNA editing enzyme, catalytic polypeptide-like 3G
LCP2 lymphocyte cytosolic protein 2 (SH2 domain containing leukocyte protein of 76kDa)
HLA-DRB1 major histocompatibility complex, class II, DR beta 1
SCUBE2 signal peptide, CUB domain, EGF-like 2
DEPDC6 DEP domain containing 6
RPL15 ribosomal protein L15
SH3BP4 SH3-domain binding protein 4
MSX2 msh homeobox 2
CLU clusterin
DPT dermatopontin
ZNF238 zinc finger protein 238
HBP1 HMG-box transcription factor 1
GSTK1 glutathione S-transferase kappa 1
ZBTB16 zinc finger and BTB domain containing 16
CCDC69 coiled-coil domain containing 69
ALDH2 aldehyde dehydrogenase 2 family (mitochondrial)
SLC1A1 solute carrier family 1 (neuronal/epithelial high affinity glutamate transporter, system Xag), member 1
ARMCX2 armadillo repeat containing, X-linked 2
HMGCS2 3-hydroxy-3-methylglutaryl-CoA synthase 2 (mitochondrial)
TSPAN3 tetraspanin 3
FTO fat mass and obesity associated
PON2 paraoxonase 2
C16orf62 chromosome 16 open reading frame 62
QDPR quinoid dihydropteridine reductase
LRP2 low density lipoprotein receptor-related protein 2
PSMB8 proteasome (prosome, macropain) subunit, beta type, 8 (large multifunctional peptidase 7)
HCLS1 hematopoietic cell-specific Lyn substrate 1
FXYD1 FXYD domain containing ion transport regulator 1
OAT ornithine aminotransferase
SLC38A1 solute carrier family 38, member 1
MAOA monoamine oxidase A
LPL lipoprotein lipase
C10orf57 chromosome 10 open reading frame 57
SPARCL1 SPARC-like 1 (hevin)
ERAP2 endoplasmic reticulum aminopeptidase 2
PDGFRL platelet-derived growth factor receptor-like
RBP4 retinol binding protein 4, plasma
LRRC17 leucine rich repeat containing 17
LHFP lipoma HMGIC fusion partner
BLNK B-cell linker
HBA2 hemoglobin, alpha 2
CST7 cystatin F (leukocystatin)
TRAT1 T-cell receptor-associated transmembrane adapter 1
IL21R Interleukin-21 receptor
IGHM Immunoglobulin heavy constant mu
CTLA4 Cytotoxic T-lymphocyte protein 4
IL2RB Interleukin-2 receptor subunit beta
TNFRSF9 Tumor necrosis factor receptor superfamily member 9
CTSW Cathepsin W
CCR10 C-C chemokine receptor type 10
GPR18 G Protein-Coupled Receptor 18
CR2 Complement receptor type 2
DOCK10 Dedicator Of Cytokinesis 10
GZMB Granzyme B
ITK IL2 Inducible T Cell Kinase
LTB Lymphotoxin Beta
IGLJ3 Immunoglobulin lambda joining 3
IGLV1-44 Immunoglobulin lambda variable 1-44
AIM2 Absent In Melanoma 2
CXCL9 C-X-C motif chemokine 9
KIAA0125 long non-conding RNA
IL2RG Interleukin 2 Receptor Subunit Gamma
CD69 Cluster of Differentiation 69
CD55 Cluster of Differentiation 55
TRAF3IP3 TRAF3 Interacting Protein 3
EVI2B Ecotropic Viral Integration Site 2B
STAP1 Signal-transducing adaptor protein 1
KLRB1 Killer cell lectin-like receptor subfamily B member 1
PRKCB Protein kinase C beta type
GPR171 G Protein-Coupled Receptor 171
PPP1R16B Protein phosphatase 1 regulatory inhibitor subunit 16B
SH2D1A SH2 domain-containing protein 1A
TNFRSF1B Tumor necrosis factor receptor superfamily member 1B
CD48 Cluster of Differentiation 48
BANK1 B-cell scaffold protein with ankyrin repeats 1
LY9 T-lymphocyte surface antigen Ly-9
VNN2 Vascular non-inflammatory molecule 2
TCL1A T-cell leukemia/lymphoma protein 1A
CYTIP Cytohesin-interacting protein
PTPRC Protein tyrosine phosphatase, receptor type, C
PDCD1LG2 programmed cell death 1 ligand 2
LTA Lymphotoxin-alpha
IGHG1 Immunoglobulin Heavy Constant Gamma 1
CD19 Cluster of Differentiation 19
MHC-1,MHC-2, T-세포, 및 B-세포와의 관련성과 면역반응과의 관련성을 고려하여, 1차적으로 총 110개의 면역 유전자가 선택되었다. 상기 110개 면역 반응 관련 유전자에 대해 Cox 회귀 단변량 분석(univariate analysis)을 수행하고, 각 유방암 분자 아형에 있어서 이들의 유의성을 관찰하였다. Cox 회귀 분석 방법은 상기 실시예 2-2에서와 동일한 방식으로 수행되었다. 표 7은 각 유방암 아형별로 가장 유의성이 있게 나타난 면역유전자 10개를 대표적으로 도시한다.
각 유방암 아형에서, 모든 AH 그룹은 긍정적인 예후 결과와 유의하게 관련된 면역 반응 유전자의 발현이 증가되었다. 단변량 분석 결과, HR+/HER2- 아형 그룹은 55개의 면역 반응 유전자가 유의한 p-value(p <0.05)를 나타내었고 모두 음의 계수 값(negative coefficient value)을 가짐으로써 장기 생존과(prolonged survival)의 긍정적 상관 관계를 나타냈다. 비슷한 방식으로, HR+/HER2+, HR-/HER2+ 및 TNBC 아형 내의 모든 고위험 그룹은, 유의한 p-value(p<0.05)를 나타내는 각각 96개, 30개 및 8개의 면역 반응 유전자들을 보유하였으며, 이들은 모두 음의 계수를 가졌다.
AH 그룹에서 관찰된 결과와 대조적으로, AI 그룹 및 AL 그룹에서 면역 유전자의 영향은 덜 두드러졌다. HR+/HER2-아형의 AI 그룹은 생존과 관련된 유의한 면역 반응 유전자가 하나도 없었으며, 모든 유전자 중 가장 낮은 p-value 가 0.09 이상이었다. AL 그룹은 몇몇 유의한 유전자를 가지고 있었으나, 이들의 hazard ratio는 긍정적인 DFS/DMFS 결과와 관련되어있지 않았다.
Cox 회귀 분석 결과를 바탕으로, 예후 예측 능력을 가진 유전자를 더 조사하기 위해, AH 그룹에 초점을 맞추었다.
Figure 112020047964512-pat00004
3-2. 주요 면역 유전자 선별 및 선택
Lasso regression 분석을 이용하여, 각 유방암 아형에서 환자 생존과 관련하여 유의적인 면역 유전자들을 더욱 선별하고자 하였다. 먼저 DFS/DMFS와 관련하여 가장 유의적인 면역유전자들을 선택하기 위해 Lasso feature selection 방법을 사용하였으며, 여기에는 10,000배 교차 검증에 의해 최적의 람다(lambda) 값을 찾기 위한 R version 3.4.3.의‘coxnet’가 적용되었다. 그 후 상기 Lasso 방법으로 활성 공변량(active covariate)을 찾았다. 상기한 바와 같이 Lasso 회귀 분석을 수행하고 난 후, 가장 유의적인 유전자들을 선택하였으며, 이러한 결과는 Cox proportional hazard univariate analysis를 통해 검증되었다.
구체적으로, 먼저 각 유방암 아형에서의 모든 AH 그룹 데이터를 통합했다. 임상 정보가 누락되거나 모호한 환자 데이터는 본 분석에서는 제외되었고, 이후에 예후 예측 모델 개발과정에서 분석되었다. Lasso 회귀 분석에 의해 위험(hazard)에 부정적 영향을 주는 9개의 활성 유전자(CTLA4, CTSW, DOCK10, GPR18, IGHM, IL21R, IL2RB, TNFRSF9, and TRAT1)를 선택하였으며, 이를 하기 표 8에 나타내었다. 또한 Cox 회귀 분석에 의해 위험(hazard)에 유의한 영향(p < 0.0001) 을 미치는 5개의 유전자(TRAT1, IGHM, IL21R, GZMB, GPR18)를 발굴하였으며, 이들 유전자의 분석 결과는 하기 표 9에 비교적으로 나타내었다. 최종적으로 Lasso 회귀 분석 결과로부터, 음의 계수 값이 -0.05 미만인 5개 유전자(TRAT1, IL21R, IGHM, CTLA4, IL2RB)를 선택했다(표 8 참조).
Figure 112020047964512-pat00005
Figure 112020047964512-pat00006
3-3. 초기 유방암 예후 예측 위험지수(risk score) 산정 모델의 제작
상기 실시예 3-2에서 선별된 5개 면역유전자를 조합하여 유방암 예후 예측 모델을 제작하였다. 본 발명자는, 상기 선별된 5개 면역유전자 각각의 발현 값과 콕스 회귀 추정값(계수로 이용)을 선형결합(linear combination)하여 유방암 예후 위험 지수(risk score)를 산출가능함을 확인하였다. 각 유전자의 콕스 회귀추정값은 하기 표 10과 같다.
구분 Cox Regression 추정값
95% 신뢰구간
Cox Regression
점 추정치
TRAT1 -0.567144, -0.1952896 -0.3812
IL21R -0.9759746, -0.3412672 -0.6586
CTLA4 -0.7454524, -0.2010003 -0.4732
IGHM -0.5428339, -0.1855019 -0.3642
IL2RB -1.146983, -0.266771 -0.7069
Lymph node infiltration status 0.3910642, 1.013551 0.7023 * 2
특히, 더 정확한 예측을 위해서, 임상 변수들에 대한 정보를 포함시키고자, 임상변수들에 대해 cox 단변량 및 다변량 분석을 수행하였고, 그 결과 임상 변수들 중에서는 림프절에 유방암 침윤 상태(본 명세서에서, ‘림프절 상태’로 약칭)가 독립적인 예후 인자로서 생존에 가장 유의한 영향을 미치는 것으로 확인되었다(데이터 미도시). 이에 림프절 상태에 대한 콕스 회귀추정값을 이용하여, 하기와 같이 유방암 예후 예측을 위한 위험지수(risk score) 산출 공식을 제작하였다. 하기와 같이 본원 발명에 의해 산출되는 위험지수(risk score)는 유전적인 정보로서 면역유전자에 관한 사항만을 포함하기 때문에 본 명세서에서 ‘면역 지표(immune index)’로도 명명한다.
공식 3
risk score = {(-0.3812*χTRAT1) + (-0.6586*χIL21R) + (-0.3642*χIGHM) + (-0.4732*χCTLA4) + (-0.7069*χIL2RB)}+ (0.7023*2*LN)
상기 공식 3에서 χ는 아래첨자(subscript)로 표시된 유전자의 발현 값이며, LN은 LN-여부를 나타내는 정수를 의미함.
실시예 4: 면역유전자를 이용한 본 발명 유방암 예후 예측 모델의 예후 예측 성능 확인
상기 실시예 3-3에서 제작한 위험 지수 산출 공식에 따라 discovery set 내 각 환자의 위험지수를 계산했다. 위험지수(면역지표)에 기초하여, AH 그룹 내의 환자 샘플들을 구체적인 위험 그룹들로 더욱 계층화했다. 본 발명 위험지수(risk score)의 성능은 두 부분으로 테스트 되었다: 1). 연속 변수로서의 위험지수, 2). 부트스트래핑 방법에 의해 R version 3.4.3.‘survminer’ package의 최대한으로 선택된 순위 통계(rank statistics)를 사용하여 도출된 최적의 컷오프 포인트(cutoff point)에 기초한 위험지수.
우리는 보다 낮은(더 음의) 위험지수가 장기 생존(prolonged survival) 뿐만아니라, 재발 가능성 감소와 관련이 있다고 가정했다.
하기 표 11은 각각 본 발명 위험지수와 관련하여 수행된 단변량 분석 및 다변량 분석 결과를 나타낸다. 단변량 분석에 기초한 연속적 위험지수는 재발 결과와 유의하고 높은 연관이 있었다(p <0.0001, 표 11). 위험지수 및 임상 인자의 다변량 분석에서도 통계적 유의성이 확인되었고, 위험지수가 증가함에 따라 상기 위험지수는 재발과 관련된 가장 현저한 변수였으며, 1.46 (p <0.0001, 95 % CI : 1.30-1.65)의 hazard ratio가 나타났다(표 11). 이 결과는 낮은 위험 점수가 장기생존 뿐만아니라 감소된 재발 가능성과 연관된다는 것을 의미한다.
Figure 112020047964512-pat00007
최대로 선택된 순위 통계(rank statistics)의 부트스트래핑을 통해 두 개의 최적 포인트가 선택되었다. 본 발명 모델에 따른 위험지수의 최적 컷오프 포인트(cutoff point)는‘survminer’ package(R version 3.4.3.)에서 최대로 선택된 통계를 부트스트래핑(bootstrapping)함으로써 얻었다. 도 8은 부트스트래핑 방법에 의해 확인된 두 개의 컷오프 포인트를 보여준다. 환자들의 위험지수에 대하여 부트스트래핑 방법으로 정규화하여 분포로 나타내었을 때, 신뢰도 85%를 기준으로하여, 2.5 분위수(percentile)에 대한 컷-오프 값(cut-off)을 cutoff-1로 하였고, 97.5 분위수에 대한 컷-오프 값을 cutoff-2로 하였다. 그 결과, 부트스트래핑 방법으로 산출된 두 가지의 컷오프 값은 -9.4, -7.1이었으며, -9.4 보다 작으면 low-risk 로 분류, -9.4~ -7.1 사이에 있으면 intermediate-risk로 분류, 그리고 -7.1보다 크면 high-risk로 분류하였다.
cutoff-2(-9.401574213, 반올림하여 -9.4로 취급)은 면역 저위험 그룹과 면역 고위험 그룹을 계층화 하였으며, 면역 저위험 그룹은 0.35 (p=0.0001,95% CI: 0.25-0.50)의 hazard ratio를 나타냈다(도 9). cutoff-1(-7.061178192, 반올림하여 -7.1로 취급)에 의해서 계층화된 그룹은 유의한 재발률의 차이를 드러냈으며, 0.35(p < 0.0001, CI: 0.22-0.56)의 hazard ratio를 나타냈다(도 10).
두개의 최적 컷오프 포인트(즉, cutoff-1 및 cutoff-2)를 함께 이용하였으며, 두 개의 컷오프 포인트에 따라서 고위험 또는 저위험으로 다르게 분류되는 것들은 중간(intermediate) 그룹으로 분류하였다(표 11 및 도 8 참조). 이를 본 발명 위험점수에 적용하여, 위험지수에 기반하는 면역-고(high)위험, 면역-중간(intermediate)위험 및 면역-저(low)위험의 3가지 위험 그룹이 생겼다(표 11 및 도 11). 도 11은 3가지 위험 그룹으로 계층화된 discovery set의 생존 곡선을 보여준다. 세 위험 그룹 모두 통계적으로 유의한 차이를 보였으며, 고위험 그룹과 비교하여 중간 위험 그룹은 hazard ratio가 0.42(p<0.0001, CI: 0.29-0.56)였고, 저위험 그룹은 hazard ratio가 0.17 (p<0.0001, CI:0.10-0.29)였다.
5년 생존율은, 면역 저위험 그룹에서 90.9% 였고, 면역 중간-위험 그룹은 56.4%, 면역 고위험 그룹은 32.5%였다. 또한 10년 생존율은, 면역 저위험 그룹에서 73.4 %, 면역 중간 위험 그룹에서 51.3 %로 감소했으며, 면역 저위험 그룹에서 14.1 %로 급감했다. 도 12는 도 11과 기본적으로 같은데, 본 발명의 예후 예측 모델(공식) 개발시에는 배제되었던 AL 그룹 및 AI 그룹에 대한 생존 곡선을 함께 표시한 것이다. 도 12에서 보는 바와 같이, 본 발명의 위험지수를 이용한 판정에 따라 분류된 면역-저위험 그룹과 AL&AI 그룹 사이에 통계적인 차이가 존재하지 않는 반면, 면역 중간 위험 그룹과 면역 저위험 그룹을 비교하면 통계적으로 유의한 차이가 나타남을 보여준다.
발명에 의한 위험지수가 유방암 재발 예측에 대한 독립성이 있는지 알아보기 위해 다변량 분석을 통해 위험지수를 검증했으며, 이를 상기 표 11에 도시하였다. 전통적인 임상병리학적 매개변수(conventional clinicopathological parameters)들로 조정된 경우, 다변량 분석에 의해 위험지수(면역지표)는 통계적 유의성을 나타 냈다.
또한, 유방암의 각 분자 아형(HR+/HER2-, HR+/HER2+, HR-/HER2+, TNBC)에 대하여 본 발명의 위험지수 모델을 적용하여 테스트했으며, 각 유방암 아형별로 분류된 면역-고위험 그룹, 면역-중간 위험 그룹, 면역-저위험 그룹의 생존곡선을 도 13 내지 도 16에 나타내었다. 도 15를 제외(HR-/HER2+ 아형 집단 모두가 AH로 분류되었으므로, 상기 실시예 2-4 참조)하고, 도 13(HR+/HER2-), 도 14(HR+/HER2+) 및 도 16(TNBC)에는 AL & AI 그룹에 대한 생존 곡선도 함께 표시되었으며, AL & AI 그룹의 생존 곡선은 본 발명 위험지수에 의한 면역-저위험 그룹의 생존곡선과 유사한 경향성을 나타내었다. 도 13 내지 도 16에서 보는 바와 같이, 본 발명의 위험지수(면역지표)는 유방암의 4가지 분자 아형에서 모두 통계적으로 유의미했다(p <0.05).
실시예 5: 면역유전자를 이용한 본 발명 유방암 예후 예측 모델의 예후 예측 성능 검증
전술한 실시예들에서 discovery set를 사용하였던 것과는 달리, 본 발명 유방암 예후 예측 모델(위험지수 산정 모델)의 적용 범위를 확대하기 위해, 다양한 다른 플랫폼들에서의 코호트들(cohorts)을 이용하여 본 발명을 검증하였다. 본 발명의 유방암 예후 위험지수 모델은 총 세가지의 다른 테스트 세트(즉, validation set)에 의해 시험되었다: 두 개의 서로 다른 마이크로어레이 플랫폼 세트 및 METABRIC 데이터를 이용한 다른 검증 세트. 마이크로어레이 플랫폼 세트로서 첫번째 validation set로 선택된 GSE3494는 discovery set의 코호트와 동일한 플랫폼이었다(Affymetrix GPL96). 두번째 validation set는 GSE21653 및 GSE42568 (Affymetrix GPL570)의 두 코호트로 구성된다.
본 발명의 위험지수를 적용하여, AH 그룹 내에서 환자들을 면역 저위험 그룹 및 면역 고위험 그룹으로 계층화하기 위하여, validation set에 최적 컷오프 값 -7.1(cutoff-1, 상기 실시예 4 참조)이 적용되었다. 검증세트에서는 -9.4 만큼(cutoff-2, 상기 실시예 4 참조) 낮은 위험지수를 나타내는 샘플이 없었는데, 이것은 descovery set와 validation set간에 환자들의 화학 요법(chemotherapy) 수행 여부가 차이나기 때문인 것으로 생각되었다.
도 17, 도 18 및 도 19는 각각 Affymetrix GPL96, Affymetrix GPL570 및 METABRIC 의 세가지 validation set에서의 생존곡선을 나타낸 것으로, 면역 저위험 그룹과 면역 고위험 그룹 간에 재발 및 생존에 유의적인 차이가 있음을 보여준다. 도 17은 GSE3494 코호트에서 본 발명 위험지수(면역지표)에 의해 정의된 면역-고위험 그룹 및 면역 저위험 그룹 간에 OS(overall survival) 차이를 보여주며, 이때 면역 저위험 그룹에서 hazard ratio가 0.36(p=0.0339, CI: 0.14-0.92)였다. 도 18은 GSE21653 및 GSE42568로 구성되는 validation set에서 본 발명 위험지수에 의해 정의된 면역-고위험 그룹 및 면역 저위험 그룹 간에 재발 가능성을 보여주며, 이때 면역 저위험군에서 hazard ratio가 0.24(p=0.0137, CI:0.07-0.74)였다. 상기 두 validation set 모두에서, 위험지수(면역지표)는 면역-저위험 그룹과 면역 고위험 그룹을 성공적으로 분류하였으며, 생존 결과에 통계적 차이를 나타내었다.
또한 첫번째 validation set(GSE3494)에서 면역 저위험 그룹 및 고위험 그룹의 5년-전체 생존율(overall survival rate)은 각각 90.0%와 60.9%였으며, 두 번째 validation set(GSE42683 및 GSE21653)에서 면역 저위험 그룹 및 고위험 그룹의 5년-DFS는 각각 89.7% 및 50.0%였다. 첫 번째 validation set에서 면역 저위험 그룹 및 고위험 그룹의 10년 전체 생존율은 각각 75.0% 및 50.8%였으며, 두 번째 validation set에서 면역 저위험 그룹 및 고위험 그룹의 재발율은 각각 79.8% 및 33.7% 였다. 또한 각각의 validation set에 단변량 분석 및 다변량 분석을 수행한 결과, 본 발명의 위험지수는 조정 후 예후 예측에서 가장 큰 변수인 것으로 나타났다(표 12 및 표 13). 종합하여, 상기 마이크로어레이 validation set들에서의 결과를 토대로, 본 발명의 유방암 예후 예측 위험 모델은 전체 생존(OS) 및 재발을 예측하는데 강인성(robustness 또는 강건성)이 있음을 입증했다(p <0.05).
Figure 112020047964512-pat00008
표에서의 분류는 유방암에서 통상적으로 많이 쓰이는 임상적 변수들의 분류를 기준 (AGE:50 or greater = A otherwise B (50 <= A 50 > B; Size: B > 2cm otherwise A; Histological grade : 1:low, 2: intermediate, 3: high)으로 하였다.
Figure 112020047964512-pat00009
마지막으로, 전체 생존(overall survival)을 주요 엔드 포인트(primary endpoint)로 이용하여, 본 발명의 위험지수가 METABRIC 코호트에 의해 검증되었다. 보조 화학요법을 비롯한 풍부한 임상 정보로 인해, discovery set에서했던 것처럼 보조 화학 요법을 받지 않은 환자들만 선택할 수 있었다. METABRIC 코호트에서 총 370 명의 환자가 본 발명의 위험지수 모델에 의해 분석되었다. 그러나 본 발명의 위험지수 모델을 구성하는 5개의 유전자 중 오직 3개(TRAT1, IL21R 및 CTLA4)만이 METABRIC 데이터 세트에서 발견되었으므로, 결과적으로 2개의 유전자(IGHM 및 IL2RB)를 제외하고, METABRIC dataset에서 상기 3가지 유전자에 대한 계수를 수득하고 이를 이용하여 Cox coefficient 값을 변경하여 적용하였다. 변경된 결과에서는 cox regression 값을 새로 구하여 적용을 하였으며, βTRAT1는 -0.6414, βIL21R는 -0.2797, βCTLA4는 -0.3790로 산출되고, F는 0.6208로 산출되었다.
구분 Cox Regression 추정값
95% 신뢰구간
Cox Regression
점 추정치
TRAT1 -1.06659, -0.2163024 -0.6414
IL21R -0.5429339, -0.01642154 -0.2797
CTLA4 -0.5934638, -0.1644545 -0.3790
Lymph node status 0.311146, 0.9303696 0.6208
METABRIC 코호트에서 수행 된 생존 분석 결과, 최적 컷오프 포인트에 의해 분류되는 본 발명의 위험지수 모델은 통계적 유의성을 보존했다(표 14). 도 19에서 보는 바와 같이 METABRIC validation set 에서 수행된 Cox 회귀 분석은, 본 발명 위험지수 모델에 기반하여 최적 컷오프 값에 따라 분류된 면역-저위험 그룹 및 고위험 그룹에서 현저히 통계적 유의성이 있음을 확인시켜주었다(도 19).
Figure 112020047964512-pat00010
또한 METABRIC 데이터 세트에서, 본 발명의 위험지수는 OS(overall survival)에 대하여 유의성을 나타내었으며, 다른 변수들로 조정 한 후에도 가장 강력한 예후 성능을 보였다(표 15 참조). 5년 생존률은 면역 저위험 그룹에서 97.0%, 면역 고위험 그룹에서 72.1%였다. 10년 생존률은 면역 저위험 그룹에서 83.3% 였고, 면역 고위험 그룹에서 51.2% 였다.
마지막으로, 본 발명의 위험지수 모델을 METABRIC 데이터 세트 내의 모든 유방암 아형 HR+/HER2-, HR+/HER2+, HR-/HER2+, TNBC에 적용하였으며, 그 결과를 도 20, 도 21, 도 22 및 도 23에서 보여준다. 도 11 내지 도 23에서 보는 바와 같이, 본 발명의 위험지수 모델을 적용할시 모든 유방암 아형에서 유의성이 나타났다.
실시예 6: C-index를 이용한 유방암 예후 예측 모델의 성능 비교 평가
Harrell 's Concordance Index(C-index)를 사용하여, 다른 임상 변수에 기반한 기존 예후 예측 방법과 본 발명의 유방암 예후 예측 위험지수 모델의 성과를 비교하였다(도 24). R version 3.4.3.의 ‘survcomp’ package 로부터 concordance index(C-index)가 계산되었다. concordance index(C-index)는 생존 분석에서 예측 모델의 성과를 평가하는 표준 측정법이다.
도 24에서 C-index 측정 결과를 도시한 막대 그래프에서 볼 수 있듯이, 림프절 상태(C-index : 0.57), 종양 크기 (C-index : 0.56), 조직학적 등급 (C-index : 0.52), 나이 (C-index : 0.50)와 같은 전통적인 임상병리학적 변수들과 비교하여, 본 발명에의한 위험지수(immune index로도 칭함)는 0.64의 가장 높은 C-index를 나타내었다. 이러한 결과는 유방암 재발 및 전이의 예측적 예후 지표로서 본 발명에 의한 위험지수의 독립성을 검증하는 것으로, 본 발명의 위험지수 모델은 기존 임상 병리학적 변수보다 우수한 예후 예측 성능을 가진다.
이상 살펴본 바와 같이, 본 발명은 유방암 환자의 예후 예측 방법에 관한 것으로, 보다 상세하게는 면역관련 유전자를 조합하여 유방암의 예후를 예측하는 방법에 대한 것이다. 본 발명은 유방암 분자 아형에 관계없이 모든 유방암 환자에 적용가능할 뿐만아니라, 본 발명에서 제공하는 바에 따라 면역관련 유전자 조합을 유방암 예후 예측에 이용하면 증식 유전자에 대한 정보 없이도 유방암 환자의 예후 예측이 가능하므로, 산업상 이용 가능성이 크다.

Claims (22)

  1. 삭제
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 삭제
  7. 삭제
  8. 삭제
  9. 삭제
  10. 삭제
  11. 삭제
  12. 삭제
  13. 삭제
  14. 삭제
  15. 삭제
  16. 유방암 환자의 예후 예측에 필요한 정보를 제공하기 위하여, 하기 단계를 포함하는 유방암 예후 위험 지수를 산출하는 방법:
    (i) 유방암 환자로부터 수득한 생물학적 시료로부터 TRAT1, IL21R, IGHM, CTLA4 및 IL2RB 유전자의 mRNA 발현수준과 유방암 환자의 LN-여부 값을 측정하는 단계;
    (ii) 상기 유전자의 mRNA 발현 수준을 표준화하는 단계; 및
    (iii) 상기 (ii) 단계의 표준화값 및 상기 (i) 단계의 LN-여부 값을 하기 공식 2-1에 대입하여 유방암 예후 위험 지수(risk score)를 계산하는 단계:
    [공식 2-1]
    risk score = {(βTRAT1TRAT1) + (βIL21RIL21R) + (βIGHMIGHM) + (βCTLA4CTLA4) + (βIL2RBIL2RB)}+ F*2*LN
    (상기 공식 2-1에서 χ는 아래첨자(subscript)로 표시된 유전자의 발현 수준의 표준화 값이며,
    βTRAT1는 -0.567144 내지 -0.1952896, βIL21R -0.9759746 내지 -0.3412672, βIGHM -0.5428339 내지 -0.1855019, βCTLA4 -0.7454524 내지 -0.2010003, βIL2RB -1.146983 내지 -0.266771이고,
    LN은 LN-여부를나타내는 정수를 의미하며,
    F는 0.3910642 내지 1.013551임).
  17. 유방암 환자의 예후 예측에 필요한 정보를 제공하기 위하여, 하기 단계를 포함하는 유방암 예후 위험 지수를 산출하는 방법:
    (i) 유방암 환자로부터 수득한 생물학적 시료로부터 TRAT1, IL21R 및CTLA4 유전자의 mRNA 발현수준과 유방암 환자의 LN-여부 값을 측정하는 단계;
    (ii) 상기 유전자의 mRNA 발현 수준을 표준화하는 단계; 및
    (iii) 상기 (ii) 단계의 표준화값 및 상기 (i) 단계의 LN-여부 값을 하기 공식 2-2에 대입하여 유방암 예후 위험 지수(risk score)를 계산하는 단계:
    [공식 2-2]
    risk score = {(βTRAT1TRAT1) + (βIL21RIL21R) + (βCTLA4CTLA4) + F*LN
    (상기 공식 2-2에서 χ는 아래첨자(subscript)로 표시된 유전자의 발현 수준의 표준화 값이며,
    βTRAT1는 -1.06659 내지 -0.2163024, βIL21R -0.5429339 내지 -0.01642154, βCTLA4 -0.5934638 내지 -0.1644545이고,
    LN은 LN-여부를 나타내는 정수를 의미하며,
    F는 0.311146 내지 0.9303696임).
  18. 제16항에 있어서, 상기 유전자의 mRNA 발현수준을 측정하기 위한 방법은 마이크로어레이, PCR(polymerase chain reaction), RT-PCR, 정량적 RT-PCR(qRT-PCR), 실시간 중합효소 연쇄반응(real-time PCR), 노던 블롯(northern blot), DNA 칩 및 RNA 칩으로 이루어진 군에서 선택된 어느 하나의 방법인 것을 특징으로 하는 방법.
  19. 제17항에 있어서, 상기 유전자의 mRNA 발현수준을 측정하기 위한 방법은 마이크로어레이, PCR(polymerase chain reaction), RT-PCR, 정량적 RT-PCR(qRT-PCR), 실시간 중합효소 연쇄반응(real-time PCR), 노던 블롯(northern blot), DNA 칩 및 RNA 칩으로 이루어진 군에서 선택된 어느 하나의 방법인 것을 특징으로 하는 방법.
  20. 삭제
  21. 삭제
  22. 삭제
KR1020200056699A 2020-05-12 2020-05-12 초기 유방암 환자의 예후 예측 방법 KR102422610B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020200056699A KR102422610B1 (ko) 2020-05-12 2020-05-12 초기 유방암 환자의 예후 예측 방법
US17/924,832 US20230323464A1 (en) 2020-05-12 2021-05-12 Method for predicting prognosis of patients having early breast cancer
PCT/KR2021/005971 WO2021230663A1 (ko) 2020-05-12 2021-05-12 초기 유방암 환자의 예후 예측 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200056699A KR102422610B1 (ko) 2020-05-12 2020-05-12 초기 유방암 환자의 예후 예측 방법

Publications (2)

Publication Number Publication Date
KR20210138405A KR20210138405A (ko) 2021-11-19
KR102422610B1 true KR102422610B1 (ko) 2022-07-18

Family

ID=78524616

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200056699A KR102422610B1 (ko) 2020-05-12 2020-05-12 초기 유방암 환자의 예후 예측 방법

Country Status (3)

Country Link
US (1) US20230323464A1 (ko)
KR (1) KR102422610B1 (ko)
WO (1) WO2021230663A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116386714A (zh) * 2023-02-22 2023-07-04 中国人民解放军总医院第五医学中心 一种非小细胞肺癌数据的处理方法
CN116959554A (zh) * 2023-07-10 2023-10-27 中山大学孙逸仙纪念医院 一种基于CAFs相关基因的前列腺癌生化复发预测模型及其应用

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008037700A2 (en) * 2006-09-27 2008-04-03 Siemens Healthcare Diagnostics Gmbh Methods for breast cancer prognosis
KR101748867B1 (ko) * 2013-04-19 2017-06-20 주식회사 젠큐릭스 조기 유방암 예후 예측 진단용 자동화 시스템
KR101950717B1 (ko) * 2016-11-23 2019-02-21 주식회사 젠큐릭스 유방암 환자의 화학치료 유용성 예측 방법
KR101896545B1 (ko) * 2016-11-25 2018-09-07 주식회사 젠큐릭스 유방암 환자의 예후 예측 방법

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
국내공개특허공보 10-2018-0059192 (2018.06.04.)*

Also Published As

Publication number Publication date
US20230323464A1 (en) 2023-10-12
KR20210138405A (ko) 2021-11-19
WO2021230663A1 (ko) 2021-11-18

Similar Documents

Publication Publication Date Title
US10428386B2 (en) Gene for predicting the prognosis for early-stage breast cancer, and a method for predicting the prognosis for early-stage breast cancer by using the same
US20210062275A1 (en) Methods to predict clinical outcome of cancer
US20080108509A1 (en) Process for Recognizing Signatures in Complex Gene Expression Profiles
US20120245235A1 (en) Classification of cancers
US20120277999A1 (en) Methods, kits and arrays for screening for, predicting and identifying donors for hematopoietic cell transplantation, and predicting risk of hematopoietic cell transplant (hct) to induce graft vs. host disease (gvhd)
WO2008045133A2 (en) Molecular assay to predict recurrence of dukes&#39; b colon cancer
US20090118132A1 (en) Classification of Acute Myeloid Leukemia
US20230323464A1 (en) Method for predicting prognosis of patients having early breast cancer
US10106855B2 (en) Genetic assay to determine prognosis in Polycythemia Vera patients
WO2015179777A2 (en) Gene expression profiles associated with sub-clinical kidney transplant rejection
CN114672556A (zh) 结直肠癌分子分型及生存风险基因群及诊断产品和应用
CA2814110A1 (en) Methods, kits and arrays for screening for, predicting and identifying donors for hematopoietic cell transplantation, and predicting risk of hematopoietic cell transplant (hct) toinduce graft vs. host disease (gvhd)
US20100152053A1 (en) Method for in vitro monitoring of postoperative changes following liver transplantation
US20070134690A1 (en) Diagnosis of systemic onset juvenile idiopathic arthritis through blood leukocyte microarray analysis
KR101725985B1 (ko) 초기유방암의 예후 예측용 유전자 및 이를 이용한 초기유방암의 예후예측 방법
KR101601943B1 (ko) 난소암 환자의 항암제 치료 반응성 예측을 위한 마커 uchl1
US20110281750A1 (en) Identifying High Risk Clinically Isolated Syndrome Patients
EP1541698B1 (en) Method of classifying gene expression strength in lung cancer tissues.
KR101583673B1 (ko) 난소암 환자의 항암제 치료 반응성 예측을 위한 마커 dlx5
KR101601941B1 (ko) 난소암 환자의 항암제 치료 반응성 예측을 위한 마커 mta3
KR101601942B1 (ko) 난소암 환자의 항암제 치료 반응성 예측을 위한 마커 tet1
Class et al. Patent application title: Genetic Assay to Determine Prognosis in Polycythemia Vera Patients Inventors: Jerry L. Spivak (Baltimore, MD, US) Michael Ochs (Oreland, PA, US) Michael Considine (Belair, MD, US) Donna Rowley (Beltsville, MD, US) Alison R. Moliterno (Baltimore, MD, US)

Legal Events

Date Code Title Description
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant