KR20080064725A - 유전자-베이스 알고리즘적 암 예후 - Google Patents

유전자-베이스 알고리즘적 암 예후 Download PDF

Info

Publication number
KR20080064725A
KR20080064725A KR1020077029062A KR20077029062A KR20080064725A KR 20080064725 A KR20080064725 A KR 20080064725A KR 1020077029062 A KR1020077029062 A KR 1020077029062A KR 20077029062 A KR20077029062 A KR 20077029062A KR 20080064725 A KR20080064725 A KR 20080064725A
Authority
KR
South Korea
Prior art keywords
cancer
genes
gene
ggi
sample
Prior art date
Application number
KR1020077029062A
Other languages
English (en)
Inventor
크리스토스 소티리오우
마우로 데로렌지
마티네 피카르트
Original Assignee
유니베르시테 리브레 드 브룩크젤즈
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 유니베르시테 리브레 드 브룩크젤즈 filed Critical 유니베르시테 리브레 드 브룩크젤즈
Publication of KR20080064725A publication Critical patent/KR20080064725A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Microbiology (AREA)
  • Urology & Nephrology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • Hematology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Cell Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 종양 샘플에 있어서 유전자 발현을 측정하는 단계 및 유전자-발현 등급 지수(GGI) 또는 재발점수(RS)를 적용하여 수치 위험점수를 수득하는 단계에 의해 종양 샘플의 예후 측정을 위한 방법 및 시스템에 관한 것이다.

Description

유전자-베이스 알고리즘적 암 예후{GENE-BASED ALGORITHMIC CANCER PROGNOSIS}
본 발명은 암 예후를 개선시키기 위한 방법 및 수단에 관한 것이다.
마이크로어레이 프로파일링(microarrary profiling) 또는 수많은 유전자의 mRNA 발현 수준의 평가는 암이 특정 유전자의 발현수준에 의해 별개의 분자 서브그룹으로 세분화될 수 있다는 것을 보여주고 있다. 상기 서브그룹들은 별개의 임상결과들을 가지며, 암 치료에 사용되는 다른 치료제들에 대하여 다르게 반응할 수도 있다. 그러나, 기초 생물학의 현 이해는 특정 암환자의 치료의 '개별화(individualization)'를 허용하고 있지 않다. 유방암으로 인하여, 오늘날 많은 여성들이 초기 진단후 유방암 재발의 위험을 감소시키기 위한 시도에 화학요법 또는 호르몬요법과 같은 전신치료를 받고 있다. 불행하게도, 상기 전신치료는 재발될 소수의 여성들에게 유익할 뿐이며, 많은 여성들이 불필요하고 잠재적으로 유해한 치료에 노출되어 있다. 마이크로어레이 기술을 사용하여 개발된 새로운 예후수단들은 유방암 환자들의 맞춤형 치료를 용이하게 하도록 한다(Paik 등, New England Journal of Medicine 351:27(2004); Van de Vijver 등, New England Journal of Medicine 347:199(2002); Wang 등, Lancet 365:671(2005)). 상기 게놈 수단들은 현 재 사용되고 있는 임상방법들을 많이 개선시켰다.
유방암종의 조직학적 등급은 중요한 임상 예후정보(1)을 제공하기 위해 오랫동안 인지되어 왔다. 그러나, 유방암에 있어서 예후적 인자로서 종양 등급을 사용하는 것에 대한 미국 병리학과(2)에 의한 추천에도 불구하고, 미국 연합 암학회(American Joint Committee on Cancer(AJCC))에서 제공하는 최근의 유방 태스크 포스(Task Force)는 기관들 사이의 극복하기 어려운 모순점들 및 데이터의 결여(3)를 인용하는 그들의 등급기준에 상기를 포함시키지 않았다. 이는 관찰자간 변이 및 사용된 여러 등급접근법들에 부분적으로 관련되어 있으며, 그 결과 기관을 통한 재현성이 불량해졌다. Elston 및 Ellis(1)에 의해 개발된 방법들과 같은 표준화 방법들의 출현들로 인해, 기관들간의 화합이 개선되었다. 그럼에도 불구하고, 등급 1(저위험) 및 3(고위험)이 다른 예후들과 명백하게 연관되어 있지만, 중간등급으로서 분류된 종양들은 그들의 생존율 프로파일이 전체(비-등급) 군집의 생존율과 다르지 않고, 그들의 비율이 크기(40%~50%)때문에 치료를 위한 임상결정에 어려움을 보여준다. 보다 정확한 등급 시스템은 추가의 유방암 치료를 위한 여성들의 예측 및 선택을 더 개선시켰다.
오늘날 진단되는 유방암 중 대부분은 호르몬 반응성이다. 타목시펜(Tamoxifen)은 상기 환자들의 보조치료법에 오늘날 가장 통상적으로 처방되는 항에스트로겐제이다. 타목시펜이 처방될 경우 상기 환자들의 40% 이하가 여전히 재발될 것이다. 현재, 보조적인 처방에서 타목시펜 대신에, 또는 타목시펜과 함께 또는 차례로 아로마테이즈(aromatase) 억제인자의 사용을 평가하는 여러 대형 시험들의 긍정적인 결과들로 인해, 호르몬 의존성 유방암을 앓는 폐경기후 여성들에게 유용한 많은 옵션들이 있다. 그리고, 아로마테이즈 억제인자 사용의 장기간 건강 비용이 알려지지 않다는 점에서 상기 치료법 옵션이 최상의 옵션인지는 불명확하다. 타목시펜이 제공될 경우 재발위험이 높은 그룹을 확인할 수 있는 능력은 타목시펜이 아마도 최상의 선택이 아닌 환자들을 확인하는데 도움이 될 수 있다. 그후, 상기 환자들은 대체 치료전략들을 위한 특별한 대상이 될 수 있다.
보조 타목시펜으로 치료받은 여성들에 대해 재발을 예측하는 문제에 관하여, 특히, 임상결과를 예측할 수 있는 유전자 세트를 청구하는 2개의 공보들이 보고되어 있다(Ma et al, Cancer Cell 5:607(2004), Jansen et al. Journal of Clinical Oncology 23:732(2005)). 상기 연구들은 소수의 환자들을 포함하고 있으므로, 임상적으로 널리 사용되기에는 완전히 유효하지는 않다.
따라서, 정확하게 예후를 평가할 수 있고, 종양학자들이 개별적인 암환자를 위한 치료결정을 내리는데 도움을 줄 수 있는 방법 및 시스템이 존재할 필요가 있다. 특히, 유방암 환자들을 위한 방법 및 시스템이 존재할 필요가 있다.
발명의 목적
본 발명은 당 기술분야의 방법들의 단점들을 나타내지 않는 암 예후의 진단을 위한 방법 및 수단들을 제공하는 것을 목적으로 한다.
발명의 요약
본 발명의 제1 구체예는 하기 단계들 (a) 및 (b)를 포함하는 방법을 제공한다:
(a) 포유동물 대상, 바람직하게는 사람 환자로부터 분석을 위해 수집된 종양 샘플 및 수득된 종양 샘플내 유전자 발현을 측정하는 단계, 및
(b) 하기 식을 사용하여 종양 샘플의 유전자-발현 등급지수(또는 게놈 등급)(GGI)을 계산하는 단계:
Figure 112007089345640-PCT00001
(식 중, x는 mRNA의 유전자 발현 수준이며, G1 및 G3은 각각 조직학적 등급 1(HG1) 및 조직학적 등급 3(HG3)에서 상향조절된(up-regulated) 유전자 세트이며, j는 프로브 또는 프로브 세트를 나타낸다)
종양 샘플은 유방암, 결장암, 폐암, 전립선암, 간세포암, 위암, 췌장암, 자궁경부암, 난소암, 간암, 방광암, 요도암, 갑상선암, 신암, 암종, 흑색종 또는 뇌암으로 구성된 군으로부터 선택되는 암에 의해 감염된 조직의 샘플이다. 바람직하게는, 종양 샘플은 조직학적 등급 HG2의 유방암 샘플이다.
본 구체예는 종양 샘플을 유전자 발현 등급지수(GGI)에 기초한 저위험(GG1) 또는 고위험(GG3)으로 표시하는 단계를 추가로 포함할 수 있다. 본 구체예는 분석될 유방암 샘플의 저위험 또는 고위험 표시와 일치하는 환자를 위한 유방암 치료요법을 제공하는 단계를 추가로 포함할 수 있다.
유전자 발현 등급지수 GGI는 HG1 경우의 평균 GGI가 약 -1이고, HG3 경우의 평균 GGI가 약 +1이 되도록 선택되는 컷오프(cutoff)값 및 규모(scale)값을 포함할 수 있다. 컷오프값은 상이한 규모값을 적용한 다른 플랫폼들로부터 수득된 데이터 의 보정을 위해 요구된다:
Figure 112007089345640-PCT00002
G1 유전자 세트는 표 3에서 "등급 1 종양에서 상향조절됨"으로 표시되는 유전자들로부터 선택되는 1개 이상의 유전자를 포함한다. 바람직하게는, G1 유전자 세트는 상기 유전자들 중 4개 이상을 포함하며, 전체 세트를 포함할 수 있다. G3 유전자세트는 표 3에서 "등급 3 종양에서 상향조절됨"으로 표시되는 유전자들로부터 선택되는 1개 이상의 유전자를 포함한다. 바람직하게는, G3 유전자 세트는 상기 유전자들 중 4개 이상을 포함하며, 전체 세트를 포함할 수 있다.
본 발명의 다른 측면에서, 본 발명에 따른 방법은 하기 단계 (a) 및 (b)를 포함한다:
(a)종양 샘플내 유전자 발현을 측정하는 단계;
(b)하기 식을 사용하여 종양 샘플에 대한 재발점수(relapse score, RS)를 계산하는 단계:
Figure 112007089345640-PCT00003
(식 중, G는 암의 원격 재발율(distant recurrence)과 관련된 유전자 세트이며, Pi는 프로브 또는 프로브 세트이고, i는 유전자들의 특정 클러스터 또는 그룹을 나타내며, wi는 클러스터(i)의 중량이며, j는 특정 프로브 세트값이며, xij는 클러 스터(i)내 프로브 세트(j)의 농도(intensity)이며, 및 ni는 클러스터(i)내 프로브 세트의 수이다.)
본 구체예는 상기 종양 샘플을 재발점수에 기초하여 암 재발에 대한 저위험 또는 고위험으로 분류하는 단계를 추가로 포함할 수 있다. 저위험과 고위험을 구분하기 위한 컷오프는 -100 내지 +100의 재발점수(RS) 또는 -10 내지 +10의 재발점수(RS)이다. 재발은 타목시펜에 의한 치료 또는 다른 화학요법, 내분비요법(endocrine therapy), 항체요법 또는 당 기술분야에 통상의 지식을 가진 자에 의해 사용되는 다른 치료법 이후의 재발이다. 바람직하게는, 재발은 타목시펜에 의한 치료 이후의 재발이다.
종양 샘플은 유방암, 결장암, 폐암, 전립선암, 간세포암, 위암, 췌장암, 자궁경부암, 난소암, 간암, 방광암, 요도암, 갑상선암, 신암, 암종, 흑색종 또는 뇌암으로 구성된 군으로부터 선택되는 암에 의해 감염된 조직의 샘플이다. 바람직하게는, 종양 샘플은 유방암 샘플이다.
환자의 치료요법은 종양 샘플의 암 재발 위험상태에 기초하여 조절될 수 있다. 예를 들어, (a) 환자가 저위험으로 분류되는 경우, 타목시펜 및 순차적인 아로마테이즈 억제인자(AIs)에 의해 순차적으로 저위험 환자를 치료하거나, 또는 (b) 환자가 고위험으로 분류되는 경우, 타목시펜 이외의 대체 내분비 치료법에 의해 고위험 환자를 치료한다. 고위험으로 분류되는 환자에 대하여, 환자의 치료 요법은 화학요법 또는 특이 분자적으로 표적된 항암요법으로 조절될 수 있다.
유전자 세트는 에스트로겐 수용체(또는 암조직 샘플의 다른 마커 특정체) 양성군에서 발생될 수 있다. 유전자 세트는 여러 방법들에 의해 발생될 수 있으며, 성분 유전자들은 환자군 및 특정 질병에 따라 다양할 수 있다.
본 발명의 다른 구체예는 하기 (a) 및 (b)를 포함하는 전산 시스템 또는 진단장치(또는 킷트)를 제공한다: (a) 유전자 세트에 기초한 종양 샘플에 대하여 유전자 발현을 검출하기 위해 구성된 생물평가법 모듈(bioassay module), 바람직하게는 바이오어레이(bioarray); 및 (b) 유전자 발현에 기초한 종양 샘플의 GGI 또는 RS를 계산하고, 유방암 샘플에 대한 위험평가를 산출하기 위해 구성된 프로세서 모듈(processor module). 생물평가법 모듈은 유전자 세트를 포함하는 1개 이상의 유전자칩(마이크로어레이)을 포함한다. 유전자 세트는 표 3에 "등급 1 종양에서 상향-조절됨"으로 표시된 유전자들로부터 선택되는, 1개 이상의 유전자, 바람직하게는 4개 이상의 유전자들을 포함하거나, 전체 세트를 포함한다. 유전자는 표 3에 "등급 3 종양에서 상향-조절됨"으로 표시된 유전자들로부터 선택되는 4개 이상의 유전자들을 포함하거나, 또는 전체 세트를 포함한다.
도 1은 분석용 세트(training set)(패널 a) 및 평가용 세트(validation set)(패널 b)의 유전자 발현 패턴을 보여주는 히트맵(heatmap)을 나타낸다. 가로축은 첫번째로 HG에 의해 분류된후, 제2 기준으로서 GGI에 의해 분류된 종양들에 해당한다. 세로축은 유전자들에 해당한다. 각 종양의 GGI 값 및 비재발 생존율은 아래에 표시되어 있다. 2개의 유전자 그룹들이 발견된다: 등급 1로 높게 발현된 그 룹(16개의 프로브 세트; 적색으로 강조됨) 및, 등급 3으로 높게 발현된 그룹(112개의 프로브 세트). HG1 및 HG3의 값 범위, 및 높은 GGI에 해당하는 HG2 종양에 대한 GGI 값들은 보다 일찍 재발하는 경향이 있다(적색 점들).
도 2는 평가용 데이터세트 2-5로부터 얻은 데이터들(표 11)에 대한 HG(패널 a) 및 GG(패널 b)에 기초한 카플란-메이어(Kaplan-Meier) RFS 분석을 나타낸다. HG1, HG2 및 HG3은 GG에 의해 저위험 서브세트 및 고위험 서브세트로 추가로 나뉠 수 있으며, GG는 HG에 대한 개선이다(각각, 패널 c, d 및 e). ER 상태는 나쁜 예후를 갖는 환자들(패널 f)의 일부를 확인하지만, 전부는 아니다.
도 3은 NPI(a) 및 NPI-GG(b) 분류에 기초한 카플란-메이어 RFS 분석을 나타낸다. NPI-GG는 저위험(패널 c) 및 고위험(패널 d) NPI 서브세트 모두에서 예후 판별을 개선시키지만, 반대로는 아니다(패널 e 및 f). Sorlie 등의 데이터 세트는 불완전한 종양크기 정보때문에 본 분석에서 배제되었다.
도 4는 HG2 환자들을 GG1 및 GG3으로 분류하기 위한 위험율에 대한 포레스트 플롯(Forest plot)을 나타내며, 이는 다른 데이터세트에서 일정한 결과들을 보여준다. 위험율은 콕스(Cox) 비례위험 회귀(proportional hazard regression)에 의해 평가되며, 가로선은 위험율에 대하여 95% 신뢰구간이다. P값은 로그순위검정(log rank test)에 의해 측정되었다.
도 5는 Van de Vijver 등의 평가시험(validation study)으로부터 얻어진 데이터에 대해, 70-유전자 발현 징후(왼쪽열, 패널 a, c 및 e) 및 GGI(오른쪽열, 패널 b, d 및 f)에 기초한 원격 무전이 생존율(distant metastasis free survival, DMFS)을 나타낸다. a) 및 b)는 모든 환자들이며, c) 및 d)는 결절-음성 환자들이며, e) 및 f)는 결절-양성 환자들이다. 결절-음성 서브세트는 70-유전자 징후를 유도하기 위해 이용된 환자들을 포함한다는 것을 주목한다.
도 6은 종래에 보고된 분자 서브타입에 적용된 게놈 등급을 나타낸다.
도 7은 GGI(고위험 대 저위험)에 대한 원격 무전이 생존율에 대한 카플란 메이어 생존율 곡선을 나타낸다.
정의들
대부분의 과학용어, 의학용어 및 기술용어들은 당 기술분야에 통상의 지식을 가진 자가 통상적으로 이해하고 있는 용어들이다.
용어 "마이크로어레이"는 기재(불용성 고형 지지체)상에 혼성화가능한 배열 요소들, 바람직하게는 폴리뉴클레오타이드 프로브들의 정연한 배열을 의미한다.
용어 "차별적으로 발현된 유전자", "차별적인 유전자 발현" 및 이들의 유의어들은 서로 바꾸어 사용가능하며, 정상적인 대상 또는 대조군 대상의 유전자 발현에 대하여, 질병, 특히 암, 예컨대 유방암을 앓고 있는 대상에서 발현이 고수준 또는 저수준으로 활성화되는 유전자를 의미한다. 상기 용어들은 또한 같은 질병의 다른 단계에서 발현이 고수준 또는 저수준으로 활성화되는 유전자들을 포함한다. 또한, 차별적으로 발현된 유전자는 핵산 수준 또는 단백질 수준에서 활성화 또는 억제되거나, 또는 선택적인 스플라이싱(splicing)되어 다른 폴리펩타이드 생성물이 생성될 수 있다. 상기 차이점들은 예를 들어 mRNA 수준, 표면 발현, 폴리펩타이드의 분비 또는 다른 분할에 의해 입증될 수 있다. 차별적인 유전자 발현은 2개 이상의 유전자들 또는 이들의 유전자 생성물들 사이의 발현 비교, 또는 2개 이상의 유전자들 또는 이들의 유전자 생성물들 사이의 발현율 비교, 또는 동일한 유전자의 2개의 차별적으로 처리된 생성물들의 비교를 포함하며, 정상적인 대상과 질병, 특히 암을 앓고 있는 대상 사이, 또는 같은 질병의 여러 단계들 사이에서, 상이하다. 차별적인 발현은 정상 세포 및 질병을 앓는 세포들중, 또는 다른 질병 이벤트 또는 질병 단계들을 겪고 있는 세포들중 유전자 또는 그의 발현 생성물에서 임시발현패턴 또는 세포발현패턴에 있어서 양적으로 뿐만 아니라 질적으로 상이함을 포함한다. 본 발명의 목적을 위해, "차별적인 유전자 발현"은 정상적인 대상 및 질병앓는 대상에서, 또는 질병앓는 대상의 질병 전개의 여러 단계들에서, 주어진 유전자의 발현 사이에 적어도 약 2배, 바람직하게는 적어도 약 4배, 보다 바람직하게는 적어도 약 6배, 가장 바람직하게는 적어도 약 10배의 차이가 있는 경우 존재하는 것으로 간주된다.
유전자 발현 프로파일링은 생물학적 샘플의 mRNA 및/또는 단백질 수준의 모든 정량화 방법을 포함한다.
본 명세서에서 사용된 용어 "예후"는 종양성 질환, 예를 들면 유방암의 재발, 전이성 확산, 및 약물 내성을 포함하는, 암-기인성 사망 또는 진행의 가능성을 예측하는 것을 의미한다.
본 명세서에서 사용된 용어 "예측"은 암 재발없이 특정 기간동안 수술제거 또는 1차 종양 및/또는 화학요법후, 환자가 약물 또는 약물 세트에 호의적으로 또는 비호의적으로 반응할 가능성, 및 상기 반응 정도, 또는 환자가 생존할 가능성을 의미한다. 본 발명의 예측 방법은 환자가 치료요법, 가령 주어진 약물 또는 약물 배합에 의한 화학요법 및/또는 방사선 요법에 호의적으로 반응할 것 같은지의 여부 또는 수술 및/또는 화학요법 종결 또는 다른 치료양식후, 환자의 장기간 생존이 가능한지의 여부를 예측하는데 유용한 수단이다.
용어 "고위험"은 환자가 5년 미만, 바람직하게는 3년 미만내에 원격 재발될 것으로 기대되는 것을 의미한다.
용어 "저위험"은 환자가 5년후, 바람직하게는 3년 미만내에 원격 재발될 것으로 기대되는 것을 의미한다.
본 명세서에서 사용된 용어 "종양"은 악성 또는 양성의 모든 종양성 신생세포 성장 및 증식, 및 모든 전암 및 암 세포 및 조직들을 의미한다.
용어 "암" 및 "암성(cancerous)"은 세포성장이 조절되지 않는 것을 특징으로 하는 포유동물내 생리적 상태를 의미 또는 설명한다. 암의 예로는 유방암, 결장암, 폐암, 전립선암, 간세포암, 위암, 췌장암, 자궁경부암, 난소암, 간암, 방광암, 요도암, 갑상선암, 신암, 암종, 흑색종 및 뇌암이 있으며, 이에 제한되지는 않는다.
원래의 "GGI"(유전자 발현 등급 지수)는 HG3이 높은 모든 유전자들의 지수 발현의 합(또는 지수비율) - HG1이 높은 모든 유전자들의 지수 발현의 합(또는 지수비율)이며, 하기와 같이 표시될 수 있다:
Figure 112007089345640-PCT00004
(식 중, x는 mRNA의 유전자 발현 수준이다.)
G1 및 G3은 각각 HG1 및 HG3에서 상향-조절된 유전자 세트이며, j는 프로브 또는 프로브 세트를 의미한다.
GGI는 HG1 경우의 평균 GGI가 약 -1이고, HG3 경우의 평균 GGI가 약 +1이 되도록 선택된 컷오프 및 규모값을 포함한다:
Figure 112007089345640-PCT00005
GGI에서 컷오프는 0이며, 평균의 평균에 해당한다.
GGI는 -4 내지 +4 범위의 값이다.
실시예 1
등급 지수(GGI)를 전개하기 위한 재료 및 방법
환자수 통계
6개의 1차 유방암 데이터세트를 사용했으며, 그중 4개가 대중적으로 사용가능했다(표 11)(4, 5, 10, 11). 보조 화학요법을 받은 환자는 없었으며, 일부는 보조 타목시펜 치료를 받았다. 조직학적 등급(HG)은 엘스톤-엘리스(Elston-Ellis) 등급 시스템에 기초하였다. 각 임상윤리위원회(Institutional ethics board)는 조직재료의 사용을 허가했다.
본 연구에 사용된 마이크로어레이 데이터세트
확인자 연구소 N 마이크로어레이 플랫폼 전신치료 참고문헌
1.분석용 세트 (KJX64) 캐롤린스카 존 래디클리프 24 40 아피메트릭스 U133A 예 (타목시펜만) 본 명세서
2.평가용 세트 (KJ129) 캐롤린스카 존 래디클리프 68 61 아피메트릭스 U133A 아니오 본 명세서
3.Sotiriou 등 (NCI) 존 래디클리프 99 cDNA (NCI) 10
4.Sorlie 등 (STNO) 스탠포드 80 cDNA (스탠포드) 11
5.van't Veer 등 (NKI) 네덜란드 암 연구소 97 애질런트 아니오 4
6.Van de Vijver 등 (NKI2) 네덜란드 암 연구소 295 [5에서 또한 61] 애질런트 아니오 5
총계 703
옥스포드의 샘플은 벨기에의 브뤼셀 소재 줄스 보데 연구소(Jules Bordet Institute)에서 처리하고, 스웨덴의 샘플은 싱가포르의 싱가포르 소재 게놈 연구소에서 처리했다. 표준 아피메트릭스(Affymetrix) 프로토콜에 따라, RNA 추출, 증폭, 혼성화 및 스캐닝(scanning)을 실시했다. 아피메트릭스 U133A 유전자칩(아피메트릭스, 산타클라라, CA). CEL 파일에서 유전자 발현값을 RMA(12)를 사용하여 정규화시켰다.
(바탕 보정(background correction) 및 분위수 정규화(quantile normalization)를 갖는) 기본 옵션을 사용했다. 출력은 로그 눈금으로 실시했다.
정규화는 다른 연구소들의 .CEL 파일들 및 측정 배치에 대해 별도로 실시하였다. 이후의 분석에서, 발현데이터 매트릭스들은 별도의 연구들의 "블록(block)"인 것처럼 처리했다. 분석용 세트 KJX64는 (2개의 다른 연구소들에 해당하는) 2개의 블록들로 구성되었으며, 따라서 평가용 세트 KJ129를 실시했다.
STNO 스탠포드/노르웨이 데이터세트(Sorlie 등, 2001)는 http://genome-www.stanford.edu/breast.cancer/mopo.clinical/data.shtml로부터 다운로드했다.
이는 여러개의 다른 칩 디자인을 갖는 85개의 어레이로 구성되어 있다. 전체에 대해 공통인 프로브들만 사용했다. 사용된 유전자 발현 값들은 어레이 데이터 파일들의 컬럼 LOG RAT2N MEAN으로부터의 값들이다. GGI를 전산화하기 이전에 추가의 변환은 적용하지 않는다. 프로브에 1개 이상의 스폿이 대응하는 경우, 그들의 평균을 사용했다.
85명의 환자 모두 히트맵에 사용했지만, 사후 시간에 손실없고, 0없는 환자들만 생존율 분석에 사용했다. 상기 정보가 유용하지 않았으므로(TNM 카테고리만 제공되었지만, 종양크기로의 전환은, 특히 NPI 식에 적당한 것과 연관된 경우, 간단하지 않음), 본 데이터세트를 종양크기를 포함하는 분석에서 배제시켰다.
NKI/NKI2 데이터세트 NKI(van't Veer 등, 2002) 및 NKI2(van de Vijver 등, 2002)를 로제타(Rosetta) 웹사이트 www.rii.com으로부터 다운로드했다. 추가의 변환없이 로그비율을 사용했다. NKI2에 대해, 감쇠되는 발현값은 손실로 간주했다. 연령, 종양 크기 및 조직학적 등급은 NKI2에 대하여 유용하지 않았다.
임상 데이터 표에서 필드 '컨서브플래그(conservFlag)'는 데이터세트를 2개의 그룹으로 계층화하기 위해 사용했다. 각 그룹은 Van de Vijver 등(2002)의 원래 결과들에 대해 실시한 것과 같이, '양호' 대 '불량' 예후를 결정하기 위한 임계값을 가졌다.
NCI Sotiriou 등 (2003)의 본 데이터세트는 PNAS 웹사이트 http://www.pnas.org/cgi/content/full/1732912100/DC1으로부터 다운로드했다. 발현값은 변화하지 않았다.
통계학적 분석
유전자 선택은 KJX64 데이터세트 상에서만 실시했으며, 이들 모두 에스트로겐 수용체(ER)-양성이며, HG1 또는 HG3이다. 데이터세트 KJ129(43 ER-음성, 모두 노드-음성, 전신치료없음)는 다른 이전에 공개된 데이터에 따라 평가용 세트로서 사용했다(표 11 참조). ER-양성 종양은, ER-상태 및 등급이 극히 드문 ER-음성인 HG1 종양과 의존성이기 때문에, 분석용 세트로서 사용했다. ER 상태와 무관하게 모든 HG1 및 HG3 종양을 사용하여, 허위 연관성(spurious association)이 얻어졌다.
Hedges 및 Olkin의 표준 평균차(13)는 HG1 또는 HG3과 관련된 유전자들의 차별적 발현에 기초한 유전자들을 평가(rank)하는데 사용하였다. 본 메타-분석 점수는 t-통계 점수와 유사하지만, 2개의 다른 중심으로부터 기원한 어레이 데이터로 구성된 본 출원인의 분석용 세트에 더 적합하다.
다중검정(multiple testing)을 조절하기 위해, Korn 등에 의해 제안된 범위(extension)(15)를 갖는 Westfall 및 Young의 maxT 알고리즘(14)을 오류 발견 횟수(false discovery count, FDC)를 계산하는데 적용했다. 모두 22,283개의 프로브 세트가 검토되었다. FDC>2를 갖고 0.05 이하의 계통적인 오류발견율(family-wise error rate) p-값을 갖는 프로브 세트를 확인하였다. 플랫폼들 사이의 프로브들의 맵핑(mapping)은 Praz 등의 방법(16)에 따라 유니진(Unigene)(제조 #180)을 통해 실시되었다.
유전자-발현 등급 지수(GGI)는 하기 식으로 정의된다:
Figure 112007089345640-PCT00006
(식 중, x는 로그 유전자 발현 측정값이며, G1 및 G3은 각각 HG3 및 HG1에서 상향-조절된 유전자 세트이다.)
상기 세트들은 플랫폼들 전체에 걸쳐 상이했다. 편의를 위해, 컷오프 및 규모는 HG1 케이스의 평균 GGI가 -1이고, HG3 케이스의 평균 GGI가 +1이 되도록 선택했다. 상기 재규모화(rescaling)는 각 데이터 소스에 대하여 별도로 실시했다.
노팅험 예후 지수(Nottingham Prognostic Index, NPI)는 Todd 등(17)에 따라 계산했다:
Figure 112007089345640-PCT00007
NPI/GG로 칭하는 지수를 정의했으며, HG는 GG로 대체했다. NPI 및 NPI/GG 모두에 대해 고위험인 NPI≥3.4인 케이스가 검토되었다. 생존율 데이터는 카플란-메이어 플롯을 사용하여 도시하였다. 위험율(HR)은 데이터 소스에 의해 계층화된 Cox 회귀를 사용하여 평가하였다. 무소비(Assumption-free) 대조는 계층화된 로그순위검정(log rank test)을 사용하여 실시했다.
히트맵
도시화를 위해, 각 프로브에 대한 히트맵에 사용된 값들을 환자 전체에 평균중심(meancentered)시켰다. 모든 프로브들의 상대 신호세기(relative signal intensity)에 대한 정보를 저장하기 위해, 유전자특이적 스케일링(표준화)를 실시하지 않았다. 채도가 높은 적색 및 녹색이 전체 매트릭스의 발현값들의 표준편차의 3배의 값에 도달하도록 색상 톤을 보정했다. 스케일링된 GGI값들은 유전자특이적 센터링(centering)에 의해 영향을 받지 않았다는 것을 주목한다.
생존율 분석
Terry Therneu의, R에 대한 생존율 패키지를 사용했으며, 카플란메이어 플롯을 위한 종래의 프로그램을 사용하여, 생존율 패키지의 결과에 대하여 정확함을 체크하였다.
마이크로어레이 플랫폼에 대한 맵핑
Praz 등의 문헌(2004)에 기재된, 클리넥스(CleanEx) 데이터베이스의 접근법(http://www.cleanex.isbsib.ch)을 사용했다. 먼저, 프로브 고유번호를 서열 등록번호에 맵핑했다. 그후, 플랫폼들 사이의 대응을 맵핑하는데 유니진(unigene)(제조 180)을 사용했다. 아피메트릭스 칩을 위해, 1개 이상의 유니진 id로 모호하게 맵핑된 올리고(oligo)들을 함유하는 프로브세트들은 배제시켰다.
결과들
고급 및 저급 서브세트들 사이에서 차별적으로 발현된 유전자
0.008의 저오류 발견율에 대응하는, 0.05의 계통적인 오류발견율 p-값에서 FDC>2를 갖는 183개의 독립유전자(unique gene)에 대응하는 242개의 프로브 세트들을 확인하였다(표 3). 상기 중에서, 다른 것들에 의해 표시된 징후들을 갖는 일반적인 유전자들을 체크하기 위해 183개의 유전자 리스트를 사용한 것 외에는, 보다 신중한 기준(0.05의 p-값에서 FDC>0)에 기초한 128개의 프로브 세트들(97개의 유전자)의 리스트를 이후의 모든 분석에 사용했다.
도 1a는 HG1 및 HG3과 명확하게 연관된 2개의 강하고 상호적인 발현패턴을 나타낸다. HG3에서 상향 조절된 많은 유전자들은 세포주기진행 및 증식과 대부분 연관되어 있었다(표 3). HG2 종양을 HG1 및 HG3 종양들을 배합한 풀과 대조하기 위한 동일유전자 선택 알고리즘을 적용했다. 이는 차별적으로 발현된 유전자들을 생성하지 않았다. 따라서, 전체적으로 HG2군은 HG1 및 HG3과 독립적으로 구별된 고유의 특성들을 가지지 않는다.
그후, 128개의 프로브 세트들의 리스트를 치료받지 않은 유방암 환자들에게 적용했다(데이터세트 KJ129). 도 1b에 도시된 바와 같이, 외관검사는 분석용 세트에서 발견된 패턴과 유사한, HG1 및 HG3에 대한 발현패턴을 보여줬다(도 1a). 등급 2군의 GEP는 등급 1과 등급 3 사이의 중간보다는, 등급 1과 등급 3의 혼합물처럼 보였다. 상기 관찰을 보다 객관적으로 하기 위해, (발현수준을 균분함으로써 리포팅 유전자의 GEP에 있어서의 차이를 필수적으로 요약하는)GGI를 규정했다. 도 1의 히트맵하에 보여지는 바와 같이, HG2의 GGI 분포는, 외관 인상을 입증하는 HG1과 HG3의 GGI값의 범위를 포함한다. 임상 개체군과 마이크로어레이 플랫폼에서의 차이에도 불구하고, 이전에 공개된 3개의 데이터세트상에서 유사하게 관찰되었다(도 6a, 6b 및 6c 참조).
조직학적 등급, 유전자-발현 등급(GG) 및 예후
상기 결과들은 중간의 조직학적 등급이 유전자 발현에 기초한 저급 및 고급으로 대체될 수 있음을 보여준다. GGI 점수에 기초한 유전자-발현 등급(GG)을 규정했다. GGI 값이 음성인 환자들은 GG1(저급)으로 분류되었으며, 그렇지 않으면 GG3(고급)으로 분류되었다. GGI 점수가 0인 것은 HG1과 HG3의 평균 GGI 값들 사이의 중간점에 대응함을 주목한다(방법 참조). 상기 선택은 임상적으로 최적은 아니며, 치료비용 및 위험사이의 균형에 기초하여 개선될 수 있지만, GGI의 예후 값을 평가하기에는 충분하다.
상기 목적을 위해, 평가군(KJ129)과 추가의 데이터세트 STNO, NCI 및 NKI(표 11)의 풀로부터 유도된 유방암 샘플들을 사용했다. 도 2a에서, 조직학적 등급과 비재발 생존율(RFS) 사이의 연관성을 조사했다. 예상한 바와 같이, HG3 종양은 HG1보다 매우 열악한 RFS를 가진 반면, HG2 종양은 중간정도의 위험성을 가졌으며, 개체군의 38%를 구성했다. 도 2b에서, GG1 및 GG3 서브그룹은 각각 HG1 및 HG3 종양의 RFS와 유사한, 명확한 RFS를 나타냈다. GG와 HG 사이의 불일치가 예후와 어떻게 연관되는지 조사하기 위해, GG를 조직학적 카테고리 각각에 대해 분류했다(도 2c, 2d 및 2e). 가장 인상적인 결과는, RFS가 각각 HG1 및 HG3의 RFS와 유사한 2개의 그룹, 즉 HG2/GG1 및 HG2/GG3으로 GG가 HG2를 분리시킨다는 점이었다(도 2d). 로그순위검정은 HG1과 HG2/GG1 사이 뿐만 아니라 HG3과 HG2/GG3 사이에 있어서 생존율의 큰 차이를 보여주는데 실패했다(도 7 참조). 비교를 위해, ER 상태는 HG2 종양에 있어서 예후력을 가졌지만(도 2f), 위험율은 GG의 위험율보다 낮았다(도 2d). 특히, ER-양성군은 전체 군과 유사한 RFS를 나타냈다.
HG1 군에서 나쁜 예후를 갖는 일부 환자들을 분류함으로써 GG가 HG보다 양호한 반면(도 2c), HG3 군에서는 반대로 보였다: 이것은 일부 환자들을 나쁜 예후에도 불구하고 저위험으로 분류시켰다(도 2d). 따라서, 저급 및 고급 카테고리를 포함하는 불일치의 경우에, GG도 HG도 다른 것보다 일관되게 양호하지 않았다. 이는 고급으로 분류되기로 결정되는지의 여부에 관계없이, 예후적으로 보다 정확한 경향이 있는 것으로 보인다. 이는, HG 및 GG 둘다에 대해, 고급 표시를 정확하게 검출하는 것이 부재함을 정확하게 표시하는 것보다 용이함을 제시한다. 장래 연구를 통해 상기 의견이 확인되는 경우, 예를 들어, GG에 의해 HG1 및 HG2는 대체하지만, HG3은 대체하지 않는 방식을 사용하여 임상실험에서 보정(correction)이 실시되어야 한다. 그러나, 본 명세서에서 사용된 데이터에서 상기 불일치 타입의 빈도는 비교적 낮았으며, 상기 변형예들은 GG를 순수하게 그 자체로 특징화하는 것을 목적으로 하는 본 발명의 연구에 사용하지 않았다.
Figure 112007089345640-PCT00008
다변량 모델에서 GG의 예후값
거의 모든 임상병리적 변수들은 단변량 분석에서의 임상결과와 크게 연관되었었다(표 12). GG 및 HG 상태는 가장 강한 효과를 가졌다. 그러나, 다변량 분석에서는, GG, 노드 상태 및 종양 크기만 중요했으며, GG는 가장 큰 위험율을 가졌다. 도 2에 따르면, GG와 HG 모두 고려될 경우 GG는 HG를 대체하였으며, GG는 ER의 예후충격을 크게 감소시켰다.
GG 및 노팅험 예후 지수
질병 결과를 설명하는데 있어서 GG, 노드 상태 및 종양 크기의 의존도는 HG, 노드 상태 및 크기를 조합한 노팅험(Nottingham) 예후 지수(NPI)를 반영했다. 상기 잘 특징화된 위험점수를 개선시키기 위해 GG가 사용될 수 있는지의 여부를 시험하기 위해, 본 발명자들은 HG를 GG로 대체한 것 외에는 NPI와 유사하고, 2개의 가능한 값들(1 또는 3)만 갖는 NPI/GG로 칭하는 점수를 제안한다. 도 3a 및 3b에 도시된 바와 같이, NPI/GG는 종래의 NPI보다 매우 많이 구별되었다. 그리고, NPI/GG는 NPI 저위험군 및 고위험군들을 모두 크게 다른 임상결과를 갖는 서브그룹들로 분할시킬수 있었던 반면, 그 반대는 일어나지 않았다(도 3e, 3f).
실시예 2
다른 개체군들과 마이크로어레이 플랫폼에서 GG의 일정한 예후값
상기 통합분석의 결과는 도 4에서 위험율의 포레스트 플롯(forest plot)으로 도시된 바와 같이, 개별적인 데이터세트에 일관되게 존재했다. 보다 완전한 결과들은 도 8에 도시되어 있다. 도 4는 각 독립적인 평가용 데이터세트에서, GG가 등급 2군을 통계적으로 매우 다른 임상결과를 갖는 2개의 구별되는 그룹들로 나눈 것을 보여준다. 다양한 환자군들을 포함하는 다른 데이트세트가 여러 병리학자들에 의해 등급이 매겨지고, 다른 마이크로어레이 플랫폼들을 사용하였어도, 위험율 사이에는 큰 이질성이 없었다.
70-유전자 기호와의 관계
그들의 첨단작업에서, van't Veer 등은 노드 음성 유방암 환자에서 원격 전이와 서로 크게 관련된 70-유전자 발현 기호를 확인하였다(5). 본 발명의 97개의 유전자들의 리스트(128개의 프로브 세트)는 애질런트(Agilent) 어레이에서 93개의 유전자들(113개의 프로브)로 맵핑될 수 있었다. 네덜란드 암 연구소(Netherlands Cancer Institute, NKI) 분류로서 치료위험 및 비용사이의 동일한 교환조건(trade-off)하에 대조하기 위해, 저위험군 및 고위험군에 동일한 환자수를 제공하는 GGI를 위한 컷오프를 선택하였다(방법 참조). 도 5는 전체 개체군(도 5a, 5b) 뿐만 아니라 노드 음성 서브그룹(도 5c, 5d) 및 노드 양성 서브그룹(도 5e, 5f)에 대한 원격-무전이 생존율에 있어서, NKI 예후 신호 및 GGI 사이의 비교를 보여준다. 본 발명의 프로브가 임상 결과의 사용없이 선택되고, 플랫폼을 통해 맵핑되었다는 사실에도 불구하고, 결과들은 두드러지게 밀집해있었다. 전체 생존율을 고려할 경우 유사한 결과들이 발견되었다(도 9 참조). 데이터는 비재발 생존율을 비교하기 위해서는 사용할 수 없었다.
저급 및 고급 유방암은 많은 차별적으로 발현되는 유전자들과 예상외로 연관되었으며, 대부분은 세포주기 및 분열증식을 포함했다. 상기 유전자들에 대하여, HG2 종양은 HG1 및 HG3 종양의 변화 범위를 포함하는 이종의 전사 프로파일을 가졌다. 적어도 1개의 종래 보고서(18)에 유사한 관찰이 있었다. 본 명세서에서, 상기 결과의 임상적 의의 및 등급 관련된 GEP가 질병결과와 서로 관련되어 있음을 발견한 것을 조사한다.
도 4에 의해 입증되는 바와 같이, 상기 연구들 사이에서 등급 품질이 크게 다른 경우가 아닌 상이한 데이터세트를 통해 일관되게 GG가 개선되었다. 이와 유사하게, 도 2a는 HG1과 HG3 사이에서 양호한 예후 분리를 보여줬으며, 이는 조직학적 등급이 고품질을 가졌음을 나타낸다. 그리고, 중앙 병리학자 검토(central pathologist review)에 의해, HG2로 분류되는 상당 부분의 종양들이 수득되었다. 최종적으로, 중앙 병리학자에 의한 등급은 실제로 거의 수행되지 않기 때문에, 상기 결과들은 임상적 현실을 보다 많이 반영했다.
예후와 연관된 GEP를 확인하는데 있어서 접근법은 다른 연구원들에 의해 사용되는 접근법과 매우 다르다. 생존율과의 상호연관성을 통해 예후 유전자들을 직접 선택하는 대신에, 세포 생물학에 기원을 둔 안정된 예후 인자를 조직학적 등급을 통해 간접적으로 확인할 수 있다. 이는 독립적이고 다양한 평가용 세트 및 다른 마이크로어레이 플랫폼을 통한 GGI의 견고성(robustness) 및 재생성을 설명할 수 있다. 그리고, GGI는 "분자 등급"으로서 해석될 수 있으므로, NPI와 같은 조직학적 등급을 사용하는 기존의 예후 시스템으로 쉽게 통합될 수 있다.
상기 유전자 선택 방법은 예후 "징후"로서 사용되는 특정 유전자 세트를 정의하는 것을 의미하지 않는다. 본 발명은 상이한 징후 세트가 선택될 수 있었던 포괄적인 "카달로그(catalogue)"를 생성하는 것을 목적으로 한다. 이는 카달로그의 크로스-플랫폼 적용가능성에 의해 설명되었다. 갯수 및 유전자 조성이 다른 여러 플랫폼에 실제의 프로브 세트가 사용되어도, 결과들은 여전히 재현가능했다. 64명의 환자들의 분석용 세트상에서 등급과의 연관성에 기초한, 유전자의 중량이 간단하게 +1 또는 -1인 선형분류자에 의해 매우 다른 데이터세트에서 양호한 예후 판별이 얻어지는 것은 주목할만 하다. 따라서, 유전자가 서로 크게 연관되어 있고, GGI가 단일 예후 인자로서 유효하게 행동하기 때문에, 확인된 "등급 시그널"은 특정 유전자 세트에 결합되지도, 그들의 발현수준의 특정 조합에 결합되지도 않았다. 소음에 대한 잉여(redundancy)를 제공하기 위한 것 뿐이라면 많은 유전자들을 사용하는 것이 여전히 유리하다. 실제 진단시스템의 개발결과는 사용된 본 발명의 "등급 유전자 카달로그"의 임의의 서브세트가 기술적인 고려에 의해서만 강요되었다는 것이다.
Jenssen 및 Hovig(19)는 최근에 예후를 위한 유전자-발현 징후들을 사용하는 것과 관련하여 2개의 이슈들을 논의했다. 2개의 이슈들은 1)다른 징후들에 포함된 유전자들 사이의 일치 결여, 및 2)징후와 생존율 사이의 상호관계의 생물학적 기초를 이해하는데 있어서의 어려움이었다. 본 유전자 카달로그는 세포주기 진행 및 증식에 있어서 적당한 역할을 하는 유전자들이 풍부하다. 유방암에 대한 기존의 프로파일에 기초한 위험 예측 방법의 가장 중요한 성분이 아니라면, 본 유전자 종류가 중요한 한 성분이다. Paik 등(7)에서, 본 발명의 183-유전자 카달로그(표 3)에 5개의 유전자가 모두 있는 "증식 세트"는 광범위한 분석용 세트 및 평가용 세트에서 가장 큰 위험율을 갖고, "재발점수" 공식에서 최고의 중량을 가진 것이다. 도 5에서 NKI 데이터에 대한 적용은 등급-관련된 유전자가 NKI 70-유전자 징후의 예후력의 상당부분을 구성할 수 있다는 견해를 지지한다. 본 발명의 183-유전자 카달로그에 대하여 비교할 때, 다른 예후 징후들을 갖는 일반적인 하기 개수의 유전자들을 발견하였다: 11/70 및 30/231 유전자들(van't Veer 등), 5/15(Paik 등) 및 7/76(Wang 등)(4, 7, 8).
요컨대, 유전자-발현에 기초를 둔 등급은 암, 특히 유방암의 예후 평가를 위한 종래의 등급시스템을 크게 개선시킬 수 있었다.
다중독립적 데이터세트들 및 다른 플랫폼들을 통해 상기 결과들을 재현하는 것은 본 발명의 결론들이 확고함을 제시하고 있다. GGI 점수는 특정 유전자 세트를 필요로 하지 않으며, 특정 검출 플랫폼에 결합되지도 않는다. GGI에 기초를 둔 등급은 HG를 GG로 대체시킴으로써, 기존의 예후 시스템으로 통합될 수 있다. 유전자 발현 측정에 기초를 둔 엄밀한 등급은 미래에 유방암치료를 위한 중요한 임상용도를 가질 수 있다.
실시예 3
에스트로겐 수용체 양성 유방암종내 임상적으로 구별되는 서브타입의 정의
재료 및 방법
종양 샘플
335개의 초기단계 유방암종 샘플은 본 발명의 데이터세트를 포함했다. 상기 샘플들 중 86개는 다른 연구에 미리 사용되었으며, 원래의 데이터는 접속코드 GSE2990을 갖는 유전자 발현 옴니버스 저장소 데이터베이스(http://www.ncbi.nlm.nih.gov/geo)에서 사용가능하다. 상기 샘플들은 보조의 전신치료는 받지 않았다. 이전에 공개되지 않은 249개의 샘플들은 보조의 타목시펜만 받았다(타목시펜-처리된 데이터세트). 모든 샘플들은 단백질 리간드 결합 측정법에 의해 ER-양성이 될 것을 요구받았다.
마이크로어레이 분석은 아피메트릭스 U113A 진칩(Genechips, 상품명)(아피메트릭스, 산타 클라라, CA)으로 수행했다. 상기 데이터세트는 영국의 옥스포드 소재 존 래드클리프(John Radcliffe) 병원, 영국의 런던 소재 가이(Guy) 병원 및 스웨덴의 웁살라 소재 웁살라(Uppsala) 대학 병원의 샘플을 포함했다. 옥스포드와 런던의 샘플들은 벨기에의 브뤼셀 소재 줄스 보데 연구소에서 처리했다. 웁살라의 샘플에 대하여 카롤린스카 연구소(Karolinska Institute)에서 RNA를 추출하고, 싱가포르의 싱가포르 소재 게놈 연구소에서 혼성화했다. 각 종양 샘플에서 수득된 RNA의 품질은 애질런트(Agilent) 생분석기에 의해 발생된 RNA 프로파일을 통해 평가했다. 표준 아피메트릭스 프로토콜에 따라, RNA 추출, 증폭, 혼성화 및 스캐닝을 실시했다. CEL에서의 유전자 발현값을 RMA12를 사용하여 정규화시켰다. 각 개체군은 별도로 정규화되었다. 각 병원의 임상윤리위원회(Institutional ethics board)는 조직재료의 사용을 허가했으며, 서면동의서를 받았다. 타목시펜-처리된 데이터세트에 대한 원래의 데이터는 접속코드 GSE XXX를 갖는 유전자 발현 옴니버스(Gene Expression Omnibus) 저장소 데이터베이스(http://www.ncbi.nlm.nih.gov/geo/)에서 사용가능하다.
본 발명자들은 또한, 최근의 공보들: Van de vijver5(n=295), Wang8(n=286), Sotiriou10(n=99), Sorlie11(n=78)에 기술되어 있는 4개의 다른 공개적으로 사용가능한 데이터세트들을 분석에 사용하였다. 생존율 분석을 위해, 본 발명자들은 ER-양성으로만 분류된 종양들을 사용했다(Van de vijver5(n=122), Wang8(n=209)). 전신 보조치료를 받지 않은 환자들을 포함하는 생존율 분석에서는, Van de vijver 등5, Wang 등8 및 이전에 공개된 데이터세트로부터의 환자들(n=417 ER-양성 환자들, 이하에 "처리되지 않은" 데이터세트라고 함)이 조합되었다. 모든 임상데이터는 보충 정보(Supplementary Information)의 표 S1에 개시되어 있다.
데이터 분석
에스트로겐(ER) 및 프로게스테론 수용체(PgR) 수준
환자들은 단백질 리간드-결합 측정법에 의해 측정된 양성 ER 상태에 따라 연구소에서 최초 선택되었다. 그후 본 발명자들은 마이크로어레이 데이터를 사용하여 양성 ER 수준을 확인하였다. ER 수준은 사람 아피메트릭스(상표명) 진칩(상품명) U133 A&B 마이크로어레이상에서 프로브 세트(30-mer 올리고뉴클레오타이드)에 의해 측정하였다. 본 발명자들은 ER에 대해 프로브 세트 "205225_at"를 사용했다. PgR은 프로브 세트 "208305_at"에 의해 나타내었다. ER의 면역조직화학적 측정은 ER의 mRNA 수준과 서로 연관되어 있는 것으로 알려져 있다4. ER 및 PgR의 양성 발현수준을 갖는 종양들이 관찰되었다.
조직학적 등급
조직학적 등급은 엘스톤-엘리스 등급 시스템에 기초되어 있다. 주요 병리학자는 스웨덴의 웁살라, 영국 런던의 가이스 병원 및 Van de vijver 등의 데이터세트5로부터의 모든 샘플들에 대하여 조직학적 등급 및 ER 상태를 검토하였다.
게놈 등급을 정량화하기 위한 증식-관련 유전자의 발현에 기초한 지수: 유전자 발현 등급 지수(GGI)
"유전자 발현 등급 지수"(GGI)는 조직학적 등급 1과 3사이에서 차별적으로 발현된 것으로 발견된 128개의 프로브세트(97개의 유전자들)의 선형 발현조합이다(용의 정의 참조). 지수는 종양발현 프로파일과 종양 등급사이의 유사도를 유효하게 정량화한 것이다. 고(高) 유전자-발현 등급지수는 높은 등급에 대응하며, 반대도 마찬가지이다. 본 지수는 각 데이터세트를 고급 및 저급 서브그룹으로 세분화하는데 사용되었다.
마이크로어레이와 플랫폼 사이의 프로브들을 맵핑하는 것은 Praz 등16의 방법에 따라 유니진(Unigene)(제조 #180)을 통해 실시되었다.
계층적 클러스터링(clustering)
유사도 측정법으로서 비중심 피어슨(Pearson) 상호작용을 사용하여 각 유전자의 중간 센터링(median centering) 후에 평균결합 계층적 클러스터 분석28을 수행하기 위해 "클러스터" 프로그램을 사용했다. 클러스터 결과들은 "트리뷰(TreeView)"를 사용하여 검토하였다. 발현 데이터를 다운로드하고, Sorlie 등11 및 Sotiriou 등10의 데이터세트로부터 추출했다. 원래의 공보들10, 11에 개시된 서브타입에 따라 샘플들을 배열하여, GGI내 유전자 발현과 서브타입 사이의 관계를 조사하였다.
통계학적 분석
생존율과 일부 연속변수 사이의 관계를 평가하기 위해, 개개에 대한 예상 생존율을 계산하기 위해 도입된 방법의 변수는: "원격 재발율" 플롯29(참조: Terry M. Therneau and Patricia M. grambsch, 2000, "Modeling Survival Data: Extending the Cox Model", chapter 10)"이 사용되었다. GGI, ER 및 PgR에 관해 예상되는 원격 전이율은 연구하의 변수에 의해서만 일치되는 콕스 모델을 사용하여 플롯팅하였다.
생존율 곡선은 카플란-메이어 플롯을 사용하여 가시화되었으며, 로그-순위 검정을 사용하여 비교하였다. 단변량 및 다변량 위험율(HR)은 콕스 회귀분석을 사용하여 평가하였다. 모든 통계적 시험들은 양면이 있었다. 통계적 분석은 버전 11.5의 SPSS 통계적 소프트웨어 패키지를 사용하여 수행하였다.
결과
종래에 보고된 분자 서브타입에 게놈 등급을 적용
서브타입과 연관되어 있는 유전자 발현 등급 지수(GGI)의 발현을 조사하기 위해, 각각 원래의 공보 및 보강 공보인 Sorlie 및 Sotiriou 등의 데이터 세트로부터 발현데이터를 추출하였다11,13. 평균-결합 클러스터링을 사용하여 유전자들을 클러스터링하고, 공개된 원고11,13에 개시된 바와 같이, 서브타입에 따라 샘플들을 정열시켰다. 이전에 보고된 분자 서브타입에 게놈 등급을 적용하였다(6a: Sorlie 등; 6b: Sotiriou 등). 서브타입은 원래의 공보들에서와 같이 정열시킨다. GGI 유전자의 히트맵은 계통수 아래에 놓았다. GGI 점수의 박스플롯(중간 및 범위)을 각 서브타입아래에 놓았다. 고급은 1을 초과하는 GGI 점수에 의해 표시되며, 반대로도 마찬가지이다.
도 6은 본 분석의 결과들을 보여준다. 일반적으로, ER-음성 서브타입, 베이스 및 erbB2 서브타입은 높은 GGI 발현을 가지거나, 또는 높은 등급을 가졌다. 그러나, ER-양성 서브타입은 다양한 범위의 GGI 수준, 특히 상기 증식-연관된 유전자를 크게 발현시키는 루미날 C 또는 3개의 서브타입을 나타냈으며, 반면, 루미날 A 또는 1개의 서브타입, 및 표준형은 GGI의 발현에 대하여 대부분 부정적이거나, 낮은 등급을 나타냈다. 이는 ER-양성 종양의 생물학적 형성에 세포주기 유전자들이 기여하는 기여도가 변화하는 반면, ER-음성 종양들은 상기 유전자들의 과잉발현을 일관되게 갖는 것처럼 보인다는 가설을 확인시켜주었다. 고급 ER-양성 서브타입과 ER-음성 서브타입사이의 GGI 유전자들의 발현 프로파일에 있어서의 유사성을 주목하는 것은 흥미롭다.
게놈 등급으로서 정의된 ER-양성 루미날 서브타입의 임상적 관련성
게놈 등급은 ER-양성 종양들 중에서 서브타입들을 임상적으로 구분할 수 있으며, 상기 게놈등급의 서브타입들의 예후값은 에스트로겐 및 프로게스테론 수용체 수준의 정량적인 수준에 기초한 것과 같은 통상의 종래 방법을 개선시켰다. 카플란-메이어 생존율 분석은 유방암 특정 생존율에 대한 대행자로서 종종 사용된, 원격 전이에 대한 시간(TDM)에 관해, 에스트로겐 및 프로게스테론 수용체의 발현수준(풍부한 발현 대 낮은 발현) 및 GGI 점수에 따른 ER-양성 종양의 종류들(고급 대 저급)을 비교하는 것을 수행하였다(도 7-KM 및 Cox). 카플란-메이어 생존율 곡선은 GGI에 대한 원격 무전이 생존율(높음 대 낮음), ER 발현 수준 및 PgR 발현 수준(풍부 대 낮음)에 대한 곡선이다. 도 7a는 비처리 데이터세트(n=417)에 대한 결과를 나타낸다. 도 7b는 타목시펜-처리된 데이터세트(n=249)에 대한 결과를 나타낸다. 비처리 데이터세트에 있어서, 보여준 결과들은 2개의 상업용으로 사용가능한 올리고뉴클레오타이드 마이크로어레이 플랫폼-아피메트릭스(상표명) 및 애질런트(상표명)를 사용하여 혼성화된 417개의 ER-양성 샘플들을 포함하는 다중 데이터세트들로부터 조합되었다(방법 참조). 비처리군 및 타목시펜-처리군에 있어서 알 수 있는 바와 같이, ER의 발현수준은 어느 것도 예후값을 가지지 않았다(각각, p=0.74 및 0.51). 반대로, PgR의 GGI 및 발현수준은 모두 예후값을 가졌다(비처리: GGI 및 PgR에 대하여 p<0.0001; 타목시펜-처리군: GGI p<0.0001, PgR p=0.0058). 루미날 저급 서브타입은 루미날 고급 서브타입에 비해 TDM의 훨씬 양호한 10-년 평가를 가졌다.
표 13은 연령, 등급, 종양크기 뿐만 아니라 게놈등급의 다른 표준 예후 공변량에 의한 단변량 및 다변량 분석을 나타낸다. 다변량 Cox 회귀 분석에서, 오직 GGI만 상당한 예후값을 보유했으며(비처리군: HR 2.3(95%CI: 1.2-4.3; p=0.008; 타목시펜-처리군: HR 2.14(95%CI: 1.04-4.02; p=0.0038), 프로게스테론 수용체 발현 수준(p=0.3)을 포함하는, 단변량 수준에서 큰 상기 요소들을 포함한다. 비처리군에 있어서, 종양크기도 또한 다변량 모델에서 상당함을 보유했다(HR 2.2(95% CI:1.2-3.8, p=0.0068). 이는 GGI로 측정되는 게놈등급이 에스트로겐 수용체의 양성수준을 표현하는 그룹들 내에서 임상적으로 구분되는 환자군들을 구별할 수 있음을 보여준다. 그리고, GGI는 매우 큰 예후값을 가졌으며, 이는 상기 통상적인 요소들에 대하여 임상 결과를 구별할 수 있는 더 나은 능력을 보여준다. 타목시펜-처리된 데이터세트에서 ER-양성 고급 서브그룹의 최악의 질병결과는 양성 ER 상태를 가짐에도 불구하고 보조 타목시펜이 상기 서브타입의 원래 병력을 변경시키지는 않는다는 사실을 보여준다. 이는 생물학적 및 치료적 관점 모두에서 추가로 조사할 가지가 있는 종양군을 잠재적으로 신호할 수 있었다.
ER-양성 종양에서 GGI의 예후값의 추가의 입증으로서, 본 발명자들은 GGI의 연속함수로서 원격 재발율을 나타내는 도면들을 개시하였으며, 비처리군 및 타목시펜-처리군 모두에 대해 ER 및 PgR의 연속 수준과 비교하였다.
2개의 종양 서브타입들은 유방암이 적어도 일정 수준의 에스트로겐 수용체를 발현하는 환자들내에서 구별될 수 있다. 높은 게놈등급에 상응하는 GGI를 포함하는 유전자들을, 고수준으로 발현하는 종양을 갖는 환자에 있어서, 이들의 질병결과는 낮은 게놈등급을 갖는 종양들과 비교하여, 높은 재발율과 함께 확실히 상이했다. 그리고, 이들의 최악의 질병결과는 보조 타목시펜이 주어질 경우에도 불변했으며, 이는 상기 그룹의 여성들이 이들의 양성 에스트로겐 수용체 값에도 불구하고 보조 타목시펜으로부터 이익을 얻은 것으로 보이지 않는다는 것을 보여준다. 본 연구에서 어느 환자도 보조 화학요법을 받지 않았으므로, 화학요법이 상기 그룹의 원래 병력을 변경시킬 수 있는지는 불명확하다는 것을 주목한다. 상기 발견의 잠재임상적 중요성은 고급 ER-양성군과 고급 ER-음성 종양(기준 및 erbB2)사이의 유사도에 의해 강조되며, 이는 높은 게놈등급과 연관된 유전자의 높은 발현수준이 나쁜 예후와 연관되어 있음을 추가로 제시한다. GGI는 666개의 ER-양성 샘플들을 포함하는, 여러 마이크로어레이 플랫폼들을 사용하여 혼성화된 다중 데이터세트들을 통해 상기 2개의 그룹들을 일관되게 확인할 수 있으며, 이는 본 발명의 결과들이 계층적 클러스터 분석에 의해 이전에 생성된 것보다 강하고 매우 재생가능하다는 것을 보여준다1.3.
GGI로 존재하는 유전자들은 세포주기 진행 및 증식과 연관되어 있다: 상위 20개의 과잉발현된 유전자들은 UBE2C, KPNA2, TPX2, FOXM1, STK6, CCNA2, BIRC5 및 MYBL2였으며, 보충 표 14를 참조한다. ER-양성 종양들에 대하여, 게놈 등급은 다른 비재발 생존율과 연관되어 있지만, ER-음성 종양들에 대하여, 거의 모든 것이 높은 게놈등급과 연관되어 있으므로, GGI는 예후값을 가지지 않았다. 그러므로, 세포 주기연관된 유전자들은 ER의 양성 발현을 갖는 유방암 환자들에서만 예후값을 가지는 것으로 보인다. 상기 그룹내에서, 원격 전이의 발생율은 상기 증식세트 및 등급-유도된 유전자들에 의해 우선적으로 유도되는 것으로 보인다. 그러나, ER-음성 종양들에 있어서, 세포주기 연관된 유전자들외에 전이의 기초 생물학을 유도하는 추가의 요인들이 있을 수 있다. 환자의 서브세트에서 "세포 증식 신호"의 예후능력은 비교적 높은 에스트로겐 수용체 발현율을 나타내는 여성에 있어서 그들 연령에 대하여 이전에 보고되었다5. ER-양성 서브그룹의 분석은 게놈등급에 의해 이미 설명된 루미날 서브그룹들로 나누어졌으며, 이러한 개념은 650명의 환자들에서 유효했다. 그리고, 게놈등급은 임상적 예후요소들을 고려한 단변량 및 다변량 분석(표 4)에서 가장 강하게 가변적이다.
통상적으로, 유방암 환자들의 예후를 예측할 수 있는 마이크로어레이 기술에서 유도된 여러 분자 신호들이 있다8, 4, 7, 24. 보고되어 있는 상기 유전자 징후들 중 일부는 보조 타목시펜으로 처리된 ER-양성 종양들의 임상 결과를 예측할 수 있다7, 24, 30. Paik 등7에 의해 개발된 재발점수에서, 5개의 유전자들의 증식세트는 이들의 큰 분석용 세트 및 평가용 세트에서 가장 큰 위험율을 가졌으며, 가장 높은 "중량" 또는 재발 점수 공식의 계수는 보조 타목시펜으로 처리된 초기단계 유방암을 앓는 여성들에 대한 예후 분류를 유도하는데 있어서 크게 중요함을 보여준다. 증식-관련 유전자들은 유전자-발현 프로파일에 기초하고 있는 유방암에 대한 많은 기존의 예후 유전자 징후들의 중요한 성분(가장 중요한 성분은 아닌 경우)인 것으로 나타난다. 55세 이하의 초기단계 유방암을 앓는 여성들에 대한 GGI 및 70-유전자 예후 유전자 분류자 사이에서 통상적으로 11개의 유전자를 사용함으로써4, 평가 공보와 유사한 생존율 곡선들5이 얻어졌으며, 이는 등급-관련 유전자들이 상기 징후의 상당량의 예후력을 구성함을 보여준다. 상기 예후 징후에 의해 수득된 서브그룹들과 게놈등급에 의한 ER-양성 종양들의 분류에 의해 수득된 서브그룹들은 전이 및 재발을 유도하는 세포-주기 유전자들에 대한 강한 의존도때문에 많이 겹쳐진다. 본 접근법의 잇점은 다양한 분자기능 및 생물학적 공정들을 나타내는 유전자 세트보다는, 나쁜 결과에 대하여 반응하는 생물학적 기작이 분명하다는 점이다8, 4. 타목시펜과 같은 항에스트로겐은 유방암 세포들에 대하여 세포주기-특이적 작용을 갖고, 여러 세포주기-조절 분자들의 발현 및 활성에 영향을 주기 때문에, 비정상적인 세포주기 조절기작의 발생이 항에스트로겐에 대한 내성을 생성시킬 수 있는 세포들에 의한 확실한 기작이다. ER의 양성 발현이 임상 세팅에서 타목시펜 반응의 가장 훌륭한 예측자들인 경우, ER-양성 유방암들의 30-40% 이하가 타목시펜에 대한 내성을 발생시키는 이유가 불완전하게 이해되고 있다31. 세포주기의 중요한 조절자인, 사이클린 D1의 과잉 발현은 타목시펜 내성과 연관되어 있으며, 에스트로겐 수용체-양성 유방암 세포들에 있어서 항에스트로겐들의 성장-억제 효과를 역전시킬 수 있다32. 세포주기 방법을 이끄는 암유발 경로에 대한 추가의 조사는 고급 서브그룹을 치료하는 새로운 제제를 개발하는데 이로울 것이다.
ER-양성 유방암 중 임상적으로 관련있는 종양 서브클래스의 정의는 오늘날 치료하는 종양학 전문의에 대한 큰 중요성을 지니고 있다. 보조 항-에스트로겐 요법33-37의 새로운 전략 뿐만 아니라 새로운 화학요법제 및 생물학 제제의 응급성은 초기단계 유방암을 앓는 여성들에 대하여 이루어지는 치료결정을 때때로 어려운 작업이 되게 한다. 이전에, 타목시펜은 항-에스트로겐 요법의 중추였으며, 초기 단계의 ER-양성 유방암을 앓는 여성들에 대하여 위험 또는 재발, 사망 및 반대측 유방암을 크게 감소시켰다38. 그러나, 폐경기후 여성에 있어서 타목시펜보다 더 유효한 아로마테이즈 억제인자 및 이들을 발견하는 여러 실험보고가 이루어졌기 때문에, 미국 임상 종양학 협회(American Society of Clinical Oncology)는 초기단계 호르몬 반응성 유방암을 앓는 폐경기후 여성의 치료법에 아로마테이즈 억제인자를 포함시키는 것을 권장하고 있다39. 그러나, 아로마테이즈 억제인자와 타목시펜의 최상의 조합 및 순서, 및 ER-양성 종양을 앓는 모든 여성들이 상기 제제로부터 동일하거나 다른 잇점을 이끌어내는지에 대한 여부는 여전히 불명확하다. 임상적으로 관련되고, 생물학적으로 구분되는 호르몬반응성 유방암 표현형의 설명은 다른 치료전략들을 필요로 하는 상기 요법의 최적화를 용이하게 하는데 도움이 될 수 있다.
결론적으로, 게놈 등급을 사용하면, 다중 데이터세트 및 마이크로어레이 플랫폼을 통한 재현가능한 방법으로 ER-양성 유방암으로 2개의 서브타입으로 구분할 수 있다. 이는 650개 이상의 ER-양성 유방암 샘플들에서 효율적이다. 상기 서브그룹은 전신치료받지 않은 군 및 타목시펜으로만 처리된 군 모두에 있어서, 통계적으로 구별되는 임상결과를 가진다. 임상시험에서 서브타입에 의한 등급화(stratification)는 내분비요법, 화학요법 및 생물학적 제제가 상기 서브그룹들에 미치는 잠재적으로 다양한 효과에 대한 중요한 정보를 제공할 수 있다. 상기 구별되는 표현형에 대한 집중적 생물학적 조사로 인해, 별도의 다른 치료표적을 확인할 수 있다.
본 발명에서 확인된 유전자들은 샘플내 확인된 유전자의 발현에 기초한 알려지지 않은 유방 세포 샘플의 유방암 등급을 예측할 수 있는 모델을 생성하는데 사용될 수 있다. 상기 모델은 본 명세서에 기재되어 있거나, 또는 당 기술분야에 공지된 알고리즘들 중 어느 하나 뿐만 아니라 알려지지 않거나 또는 의심스러운 유방암 샘플이 정상적인지 또는 한단계 및/또는 한등급 이상의 유방암인지의 여부를 확인하기 위해 본 명세서에 개시된 유전자(들) (및 이들의 서브세트들)을 사용하여 당 기술분야에서 균등물로서 인지되는 것들에 의해 발생될 수 있다. 상기 모델은 모델을 생성하기 위해 사용된 참조 데이터의 프로파일에 대하여, 샘플로부터의 서브세트의 유전자(들)의 발현 프로파일을 대조하기 위한 수단을 제공한다. 상기 모델은 참조 프로파일 각각에 대하여, 또는 참조 프로파일에 기초한 설계를 정의하는 모델에 대하여, 샘플 프로파일을 대조할 수 있다. 그리고, 샘플 프로파일로부터의 상대값들은 모델 또는 참조 프로파일과 비교하여 사용될 수 있다.
본 발명의 바람직한 구체예에서, 동일한 대상으로부터 정상 및 비정상 및/또는 부정형으로 확인된 유방 세포 샘플들은 모델을 생성시키기 위해 사용된 유전자들의 발현 프로파일에 대하여 분석될 수 있다. 이는 정상 샘플의 발현 프로파일과의 상대적 차이점에 기초한 비정상 샘플의 단계를 확인하는 유익한 수단들을 제공한다. 그후 상기 차이점들은 모델을 생성하는데 사용되는 정상 참조데이터와 개인의 비정상 참조데이터 사이의 차이점과 비교하여 사용될 수 있다. 유전자 발현을 평가할 수 있는 단일 마이크로어레이를 사용함으로써 샘플로부터의 유전자 발현을 검출할 수 있다. 상기 데이터를 분석하는 한가지 방법은 편의성과 정확성을 위해 본 명세서에 개시된 모든 쌍대비교들(pairwise comparisons)이다.
본 발명의 다른 용도로는 추가의 조사 또는 연구를 위해 특정 단계 및/또는 등급의 암의 용도로서 유방암 세포 샘플을 확인할 수 있는 능력을 제공하는 것을 포함한다. 이는 세포학적 관찰보다는 객관적 유전적 또는 분자 표준에 기초한 유방암 단계 및/또는 등급의 확인을 필요로 하는 많은 명세서에서 특정 잇점을 제공한다. 추가의 연구, 조사 또는 특징화를 위해 다른 등급의 특정 유방암 단계를 구별하는 것이 특히 유용하다.
본 발명의 방법에 사용하기 위한 물질들은 잘 알려진 공정에 따라 제조된 킷트를 제조하기에 이상적으로 적합하다. 따라서, 본 발명은 유방암 단계를 확인하기 위해 개시된 유전자들의 발현을 검출하기 위한 제제를 포함하는 킷트를 제공한다. 본 발명의 방법에 사용하는 것과 관련된 설명 또는 표지 또는 소개를 확인하는 제제를 선택적으로 포함하는 상기 킷트를 제공한다. 상기 킷트는 용기들을 포함하며, 각 용기는 본 방법들에 사용된(통상적으로 농축된 형태의) 여러 반응제제들 중 하나 이상을 가지며, 상기 방법들로는 예를 들어 사전-제조된 마이크로어레이, 버퍼, 적당한 뉴클레오타이드 트리포스페이트(예를 들면, dATP, dCTP, dGTP 및 dTTP; 또는 rATP, rCTP, rGTP 및 UTP), 역전사 효소, DNA 중합효소, RNA 중합효소 및 본 발명의 1개 이상의 프라이머 착체들(예를 들면, RNA 중합효소와 반응성인 프로모터에 결합되는 적당한 길이의 폴리(T) 또는 랜덤 프라이머)이 있다. 교시 세트도 또한 통상적으로 포함될 것이다.
본 발명에 의해 제공된 방법들은 또한 전체적으로 또는 부분적으로 자동화될 수 있다. 본 발명의 모든 관점들은 세포함유 샘플에서 유방암 단계를 확인하는 것과 무관한 물질을 배제시키기 위한 개시 유전자들의 서브세트를 필수구성요소로 포함하도록 실시될 수도 있다.
본 발명의 전체 시스템 또는 일부를 구현하기 위한 예시 시스템은 컴퓨터 형태의 일반적인 목적의 전산 장치를 포함하며, 처리 유닛, 시스템 메모리, 및 처리 유닛에 시스템 메모리를 포함하는 여러 시스템 소자들을 결합시키는 시스템 버스를 포함한다. 시스템 메모리는 읽기전용 메모리(ROM) 및 랜덤 액세스 메모리(RAM)를 포함한다. 컴퓨터는 또한 자기 하드디스크로부터 읽거나 또는 자기 하드디스크에 기록하기 위한 자기 하드디스크 드라이브, 제거가능한 자기 디스크로부터 읽거나 또는 제거가능한 자기 디스크에 기록하기 위한 자기 디스크 드라이브, 및 CD 롬 또는 다른 광학매체와 같은 제거가능한 광학 디스크로부터 읽거나 또는 제거가능한 광학 디스크에 기록하기 위한 광학 디스크 드라이브를 포함할 수 있다. 드라이브들 및 이들의 관련 기계-해독가능한 매체는 기계실행가능 명령들의 불휘발성 저장, 데이터 구조들, 프로그램 모듈 및 컴퓨터를 위한 다른 데이터를 제공한다.
본 발명의 구체예는 프로세서를 구비한 1개 이상의 원격 컴퓨터에 대한 논리적 연결들을 사용한 네트워크 환경에서 실시될 수 있다. 논리적 연결들은 본 명세서에서 실시예로 개시된 근거리 네트워크(LAN) 및 광역 네트워크(WAN)를 포함하며, 이에 제한되지는 않는다. 상기 네트워킹 환경들은 사무실-규모 또는 기업-규모의 컴퓨터 네트워크, 인트라넷 및 인터넷에서 일반적이며, 매우 다양한 다른 통신 프로토콜들을 사용할 수 있다. 당 기술분야에 통상의 지식을 가진 자들은 상기 전산 환경들이 개인 컴퓨터, 휴대형 단말기, 멀티프로세서 시스템, 마이크로 프로세서기반 또는 프로그램가능 소비자 전자장치, 네트워크 PCs, 미니컴퓨터, 메인프레임 컴퓨터 등을 포함하는 많은 종류의 컴퓨터 시스템 구성을 포함할 것이라는 사실을 알 것이다. 본 발명의 구체예는 통신 네트워크를 통해 연결(하드와이어 연결, 무선 연결 또는 하드와이어 연결 또는 무선 연결의 조합에 의한 연결)되는 로컬 및 원격 프로세싱 장치에 의해 임무가 수행되는 분산 컴퓨팅 환경하에 실시될 수도 있다. 분산 컴퓨팅 환경에서, 프로그램 모듈들은 로컬 및 원격 메모리 저장장치에 위치될 수 있다.
본 발명의 다른 구체예들은 본 발명에 따라 기술된다. 본 발명의 범주 및 범위로부터 벗어나지 않으면서 본 명세서에 기술 및 설명된 기술들 및 구조들에 많은 변형 및 변화가 주어질 수 있다. 따라서, 본 명세서에 기술된 장치들은 설명만을 위한 것이며, 본 발명의 범주를 제한하지 않는다고 이해되어야 한다.
Figure 112007089345640-PCT00009
Figure 112007089345640-PCT00010
Figure 112007089345640-PCT00011
Figure 112007089345640-PCT00012
Figure 112007089345640-PCT00013
Figure 112007089345640-PCT00014
Figure 112007089345640-PCT00015
Figure 112007089345640-PCT00016
Figure 112007089345640-PCT00017
Figure 112007089345640-PCT00018
Figure 112007089345640-PCT00019
Figure 112007089345640-PCT00020
Figure 112007089345640-PCT00021
Figure 112007089345640-PCT00022
Figure 112007089345640-PCT00023
Figure 112007089345640-PCT00024
Figure 112007089345640-PCT00025
Figure 112007089345640-PCT00026
Figure 112007089345640-PCT00027

Claims (34)

  1. 하기 단계 (a) 및 (b)를 포함하는 방법:
    (a) 종양 샘플내 유전자 발현을 측정하는 단계, 및
    (b) 하기 식을 사용하여 종양 샘플의 유전자-발현 등급지수(GGI)을 계산하는 단계:
    Figure 112007089345640-PCT00028
    (식 중, x는 mRNA의 유전자 발현 수준이며,
    G1 및 G3은 각각 HG1 및 HG3에서 상향조절된 유전자 세트이며,
    j는 프로브 또는 프로브 세트를 나타낸다.)
  2. 제 1항에 있어서, 종양 샘플은 유방암, 결장암, 폐암, 전립선암, 간세포암, 위암, 췌장암, 자궁경부암, 난소암, 간암, 방광암, 요도암, 갑상선암, 신암, 암종, 흑색종 또는 뇌암에 의해 감염된 조직인 것을 특징으로 하는 방법.
  3. 제 2항에 있어서, 종양 샘플은 유방암 샘플인 것을 특징으로 하는 방법.
  4. 제 3항에 있어서, 유방암 샘플은 조직학적 등급 HG2인 것을 특징으로 하는 방법.
  5. 제 3항에 있어서, 유방암 샘플을 GGI 지수에 기초한 저위험(GG1) 또는 고위험(GG3)으로 표시하는 단계를 추가로 포함하는 것을 특징으로 하는 방법.
  6. 제 1항 내지 제 5항 중 어느 한 항에 있어서, 유방암 샘플의 저위험 또는 고위험 표시와 일치하는 환자에 대한 유방암 치료법을 제공하는 단계를 추가로 포함하는 것을 특징으로 하는 방법.
  7. 제 1항 내지 제 6항 중 어느 한 항에 있어서, GGI는 HG1 케이스의 평균 GGI가 약 -1이고, HG3 케이스의 평균 GGI가 약 +1이 되도록 선택되는 컷오프 및 규모값을 포함하는 것을 특징으로 하는 방법:
    Figure 112007089345640-PCT00029
  8. 제 1항 내지 제 7항 중 어느 한 항에 있어서, G1 유전자 세트는 표 3에서 "등급 1 종양에서 상향-조절된"으로 표시된 유전자들로부터 선택되는 적어도 1개의 유전자를 포함하는 것을 특징으로 하는 방법.
  9. 제 1항 내지 제 8항 중 어느 한 항에 있어서, G3 유전자 세트는 표 3에서 "등급 3 종양에서 상향-조절된"으로 표시된 유전자들로부터 선택되는 적어도 1개의 유전자를 포함하는 것을 특징으로 하는 방법.
  10. 제 1항 내지 제 9항 중 어느 한 항에 있어서, G1 및 G3 유전자 세트는 에스트로겐 수용체 양성군으로부터 생성되는 것을 특징으로 하는 방법.
  11. 제 1항 내지 제 10항 중 어느 한 항에 있어서, 유방암 샘플을 ER-양성 종양내 다른 서브타입으로 표시하는 단계를 추가로 포함하는 것을 특징으로 하는 방법.
  12. 제 1항 내지 제 11항 중 어느 한 항에 있어서, 종양 샘플을 다른 서브타입과 다르게 치료되는 서브타입으로 표시하는 단계를 추가로 포함하는 것을 특징으로 하는 방법.
  13. 하기 단계 (a) 및 (b)를 포함하는 방법:
    (a)종양 샘플내 유전자 발현을 측정하는 단계;
    (b)하기 식을 사용하여 종양 샘플에 대한 재발점수(RS)를 계산하는 단계:
    Figure 112007089345640-PCT00030
    (식 중, G는 암의 원격 재발율과 관련된 유전자 세트이며,
    Pi는 프로브 또는 프로브 세트이고,
    i는 유전자들의 특정 클러스터 또는 그룹을 나타내며,
    wi는 클러스터(i)의 중량이며,
    j는 특정 프로브 세트값이며,
    xij는 클러스터(i)에서 프로브 세트(j)의 농도이며, 및
    ni는 클러스터(i)내 프로브 세트의 수이다.)
  14. 제 13항에 있어서, 컷오프 값에 의해 암 재발에 대한 저위험 또는 고위험으로서 종양 샘플을 재발점수에 기초하여 분류하는 단계를 추가로 포함하는 것을 특징으로 하는 방법.
  15. 제 14항에 있어서, 저위험과 고위험을 구별하기 위한 컷오프 값은 -100 내지 +100의 RS인 것을 특징으로 하는 방법.
  16. 제 14항 또는 제 15항에 있어서, 저위험과 고위험을 구별하기 위한 컷오프 값은 -10 내지 +10의 RS인 것을 특징으로 하는 방법.
  17. 제 13항 내지 제 16항 중 어느 한 항에 있어서, 재발은 타목시펜 및/또는 아로마테이즈 억제인자 투여, 내분비요법, 화학요법 또는 항체요법으로 구성된 군으로부터 선택되는 치료법에 의한 치료 이후의 재발인 것을 특징으로 하는 방법.
  18. 제 17항에 있어서, 재발은 타목시펜에 의한 치료 이후의 재발인 것을 특징으로 하는 방법.
  19. 제 13항 내지 제 18항 중 어느 한 항에 있어서, 종양 샘플은 유방암, 결장암, 폐암, 전립선암, 간세포암, 위암, 췌장암, 자궁경부암, 난소암, 간암, 방광암, 요도암, 갑상선암, 신암, 암종, 흑색종 또는 뇌암으로 구성된 군으로부터 선택되는 것을 특징으로 하는 방법.
  20. 제 19항에 있어서, 종양 샘플은 유방암 샘플인 것을 특징으로 하는 방법.
  21. 제 13항 내지 제 20항 중 어느 한 항에 있어서, 종양 샘플의 암재발 위험상태에 기초하여 환자의 치료법을 조정하는 단계를 추가로 포함하는 것을 특징으로 하는 방법.
  22. 제 21항에 있어서, 환자의 치료법을 조정하는 단계는 하기 (a) 또는 (b)를 포함하는 것을 특징으로 하는 방법:
    (a) 환자가 저위험으로 분류되는 경우, 저위험 환자를 타목시펜 및 차별적 아로마테이즈 억제인자(AIs)로 치료하는 단계, 또는
    (b) 환자가 고위험으로 분류되는 경우, 고위험 환자를 타목시펜과는 다른 대 체 내분비 치료법으로 치료하는 단계.
  23. 제 22항에 있어서, 환자는 고위험으로 분류되고, 환자의 치료법은 화학요법 또는 특이적 분자표시된 항암요법으로 조정되는 것을 특징으로 하는 방법.
  24. 제 13항 내지 제 23항 중 어느 한 항에 있어서, 유전자 세트는 에스트로겐 수용체 양성군으로부터 생성되는 것을 특징으로 하는 방법.
  25. 제 13항 내지 제 24항 중 어느 한 항에 있어서, 유전자 세트는 표 1, 2 및 4의 4개 이상의 유전자들을 포함하는 것을 특징으로 하는 방법.
  26. 제 25항에 있어서, 유전자 세트는 유전자 PGR, HER2, ESR 및 MKI-67을 포함하는 것을 특징으로 하는 방법.
  27. 하기 (a) 및 (b)를 포함하는 전산시스템(바람직하게는, 장치 또는 킷트):
    (a) 어레이로서 고형 지지체 표면에 결합된 서열들로 이루어진, 유전자 세트에 기초한 종양 샘플에 대하여 유전자 발현을 검출하기 위해 구성된, 실시간 PCR 분석을 포함하는 생물평가법 모듈(bioassay module), 바람직하게는 마이크로어레이 킷트 또는 장치; 및
    (b) 유전자 발현에 기초한 GGI 또는 RS를 계산하고, 유방암 샘플에 대한 위 험평가를 산출하기 위해 구성된 프로세서 모듈(processor module).
  28. 제 27항에 있어서, 종양 샘플은 유방암, 결장암, 폐암, 전립선암, 간세포암, 위암, 췌장암, 자궁경부암, 난소암, 간암, 방광암, 요도암, 갑상선암, 신암, 암종, 흑색종 또는 뇌암에 의해 감염된 조직인 것을 특징으로 하는 전산시스템.
  29. 제 27항 또는 제 28항에 있어서, 종양 샘플은 유방암 샘플인 것을 특징으로 하는 전산시스템.
  30. 제 27항 내지 제 29항 중 어느 한 항에 있어서, 생물평가법 모듈은 유전자 세트를 포함하는 1개 이상의 유전자 칩(마이크로어레이)을 포함하는 것을 특징으로 하는 전산시스템.
  31. 제 30항에 있어서, 유전자 세트는 표 3에서 "등급 1 종양에서 상향조절됨"으로 표시된 유전자로부터 선택되는 1개 이상의 유전자를 포함하는 것을 특징으로 하는 전산시스템.
  32. 제 30항에 있어서, 유전자 세트는 표 3에서 "등급 3 종양에서 상향조절됨"으로 표시된 유전자로부터 선택되는 1개 이상의 유전자를 포함하는 것을 특징으로 하는 전산시스템.
  33. 제 30항에 있어서, 유전자 세트는 표 1, 2 및 4의 유전자들 중 적어도 하나를 포함하는 것을 특징으로 하는 전산시스템.
  34. 제 1항 내지 제 12항 중 어느 한 항에 있어서, 에스트로겐 수용체 및/또는 프로게스테론 수용체 유전자 발현 검출을 위해 조합되는 것을 특징으로 하는 방법.
KR1020077029062A 2005-05-13 2006-05-15 유전자-베이스 알고리즘적 암 예후 KR20080064725A (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US68054305P 2005-05-13 2005-05-13
US60/680,543 2005-05-13
EP05447274.1 2005-12-07
EP05447274 2005-12-07

Publications (1)

Publication Number Publication Date
KR20080064725A true KR20080064725A (ko) 2008-07-09

Family

ID=36613462

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020077029062A KR20080064725A (ko) 2005-05-13 2006-05-15 유전자-베이스 알고리즘적 암 예후

Country Status (3)

Country Link
KR (1) KR20080064725A (ko)
IL (1) IL187241A0 (ko)
NO (1) NO20076444L (ko)

Also Published As

Publication number Publication date
NO20076444L (no) 2008-02-12
IL187241A0 (en) 2008-02-09

Similar Documents

Publication Publication Date Title
US20080275652A1 (en) Gene-based algorithmic cancer prognosis
JP7042717B2 (ja) 癌の臨床転帰を予測する方法
JP2008539737A (ja) 遺伝子に基づくアルゴリズム的ガン予後
US7803552B2 (en) Biomarkers for predicting prostate cancer progression
JP6067686B2 (ja) 癌の分子的診断検査
US9447470B2 (en) Tumor grading and cancer prognosis
JP2007049991A (ja) 乳癌の骨への再発の予測
JP2008521412A (ja) 肺癌予後判定手段
Schneider et al. Identification and meta‐analysis of a small gene expression signature for the diagnosis of estrogen receptor status in invasive ductal breast cancer
JP2007508812A (ja) 乳癌分類に関する材料および方法
EP3964589A1 (en) Assessing colorectal cancer molecular subtype and uses thereof
Perez et al. Improving patient care through molecular diagnostics
EP2406729B1 (en) A method, system and computer program product for the systematic evaluation of the prognostic properties of gene pairs for medical conditions.
US10253369B2 (en) Predicting likelihood of response to combination therapy
EP3063689A1 (en) Methods of incorporation of transcript chromosomal locus information for identification of biomarkers of disease recurrence risk
Stadler et al. Review of gene-expression profiling and its clinical use in breast cancer
JP2007508008A (ja) 乳癌診断に関する物質および方法
KR20080064725A (ko) 유전자-베이스 알고리즘적 암 예후
WO2021061623A1 (en) Methods for predicting aml outcome
CN118222713A (zh) 生物标志物在检测脑胶质瘤相关tls中的应用
CN112088221A (zh) 通过借助于建立多样性指数评定肿瘤变异多样性来进行癌症预后的方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application