KR20140105836A - 다유전자 바이오마커의 확인 - Google Patents

다유전자 바이오마커의 확인 Download PDF

Info

Publication number
KR20140105836A
KR20140105836A KR1020147020032A KR20147020032A KR20140105836A KR 20140105836 A KR20140105836 A KR 20140105836A KR 1020147020032 A KR1020147020032 A KR 1020147020032A KR 20147020032 A KR20147020032 A KR 20147020032A KR 20140105836 A KR20140105836 A KR 20140105836A
Authority
KR
South Korea
Prior art keywords
genes
pgs
expression
population
gene
Prior art date
Application number
KR1020147020032A
Other languages
English (en)
Inventor
뮤레이 로빈슨
빈 펭
리차드 니콜레티
조슈아 피. 프레데릭
레즐라 필리포비치
Original Assignee
아베오 파마슈티컬즈, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 아베오 파마슈티컬즈, 인크. filed Critical 아베오 파마슈티컬즈, 인크.
Publication of KR20140105836A publication Critical patent/KR20140105836A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Abstract

관심 항암 약물에 대한 감수성 또는 내성을 예측하기 위해 다유전자 바이오마커를 확인하는 방법, 또는 다유전자 암 예후 바이오마커가 개시되어 있다. 이와 같이 개시된 방법은 포유동물 게놈을 51개 전사 클러스터, 즉 군내 전사체 수준이 고도로 상관이 있는 비-중복성 기능상 관련 유전자 군으로 분류하는 것에 기초한다. 또한, 티보자닙 또는 라파마이신에 대한 감수성 또는 내성을 예측하기 위한 특이적 다유전자 바이오마커, 및 유방암 예후를 결정하기 위한 특이적 다유전자 바이오마커가 개시되며, 이들 모두는 본원에 개시된 방법을 사용하여 확인되었다.

Description

다유전자 바이오마커의 확인 {IDENTIFICATION OF MULTIGENE BIOMARKERS}
관련 출원에 대한 상호 참조
본 출원은 2011년 12월 22일에 출원된 미국 가출원 일련 번호 61/579,530을 우선권 주장하며, 이 가출원은 그 전문이 본원에 참조로 포함된다.
발명의 분야
본 발명의 분야는 분자 생물학, 유전학, 종양학, 생물정보학 및 진단 시험이다.
대부분의 암 약물은 일부 환자에게는 유효하지만, 다른 환자들에게는 그렇지 못하다. 이는 종양들 간의 유전적 변이로부터 비롯된 것이며, 심지어는 동일한 환자 내의 종양들 간에도 관찰될 수 있다. 가변적인 환자 반응은 표적화 치료법에 대해서 특히 두드러진다. 따라서, 어떤 환자가 어느 약물로부터 이득을 얻을 것인지를 결정하는 데 적합한 시험 없이는 표적화 요법의 잠재력을 최대한 실현시킬 수 없다. 미국 국립 보건원 (NIH)에 따르면, 용어 "바이오마커(biomarker)"는 "정상적인 생물학적 또는 발병 과정, 또는 치료적 개입에 대한 약리학적 반응의 지표로서 객관적으로 측정되고 평가되는 특징"으로서 정의된다.
바이오마커의 발견에 근거하여 개선된 진단법을 개발하는 것은, 소정의 약물에 대한 임상 반응을 가장 잘 나타낼 것으로 예상되는 환자를 사전에 확인함으로써 새로운 약물 개발을 가속화시킬 수 있는 잠재력을 지니고 있다. 이는 임상 시험의 규모, 기간 및 비용을 상당히 감소시킬 것이다. 현재에는, 유전체학, 단백질체학 및 분자 영상화와 같은 기술로 인해 특이적 유전자 돌연변이, 특별한 유전자의 발현 수준 및 기타 분자 바이오마커를 신속하고 민감하면서도 신뢰할 만한 수준으로 검출할 수 있게 된다. 종양의 분자 특성화를 위한 각종 기술을 이용할 수 있음에도 불구하고, 암 바이오마커를 임상적으로 활용하는 것은 여전히 대체로 실현되지 못하고 있는데, 이는 발견된 암 바이오마커가 거의 없기 때문이다. 예를 들어, 최근의 평론 기사는 다음과 같이 언급하고 있다:
"바이오마커를 신속히 개발하고, 이들을 암 진단 및 치료의 개선에 사용하고자 하는 대단히 중요한 필요성이 있다 (문헌 [Cho, 2007, Molecular Cancer 6:25] 참조)".
암 바이오마커에 관한 또 다른 최근 평론 기사는 다음과 같이 언급하고 있다:
"도전과제는 바로 암 바이오마커를 발견하는 것이다. 분자상 표적화제를 이용하여 분자상 규정된 몇 가지 종양 유형, 예컨대 만성 골수성 백혈병, 위장 기질 종양, 폐암 및 다형성 교모세포종의 하위세트(subset)를 표적화하는 데 있어서 임상적인 성공도 있긴 하였지만, 이러한 성공을 보다 광범위한 상황에 적용할 수 있는 능력은 환자에서 표적화제를 평가할 수 있는 효율적인 전략 부재로 인해 극도로 제한된다. 그 문제점은 주로, 이들 흥미진진한 신규 약물을 평가하기 위한 임상 시험용으로 분자상 규정된 암이 있는 환자를 선별할 수 없다는 데 있다. 그 해결을 위해서는, 특별한 제제로부터 가장 많은 이득을 얻을 것으로 예상되는 환자를 신뢰할 만한 수준으로 확인해주는 바이오마커가 필요하다 (문헌 [Sawyers, 2008, Nature 452:548-552, at 548] 참조)". 이와 같은 기사 내용은 특히 종양학 분야에서 임상적으로 유용한 예측 바이오마커를 발견해야 하는 필요성에 대한 인식을 예시하고 있다.
어떤 환자가 소정의 약물 또는 요법을 이용한 치료에 적합한 후보인지를 확인하기 위해 다유전자 바이오마커를 확인하는 방법에 대한 필요성은 널리 인식되어 있다. 이는 표적화 암 치료법에 대해서 특히 그러하다.
개요
유전자 발현 프로파일링 기술, 독점적 생물정보학 도구 및 응용 통계학을 이용하여, 본 발명자들은 포유동물 게놈이, 그의 군내 전사체 수준이 각종 마이크로어레이 데이터세트 전반에 걸쳐 협조적으로 조절되는, 즉 강하게 상관이 있거나 또는 "일관성이 있는" 51개 비-중복의 기능상 관련 유전자 군으로써 유용하게 나타낼 수 있다는 사실을 발견하였다. 본 발명자들은 이들 유전자 군을 전사 클러스터 1-51 (TC1-TC51)로 표기하였다. 이러한 발견을 근거로 하여, 본 발명자들은 (a) 관심 항암 약물에 대한 감수성 또는 내성을 알아보기 위한 다유전자 예측 바이오마커; 또는 (b) 다유전자 암 예후 바이오마커를 신속하게 확인해 주는, 광범위하게 적용 가능한 방법을 발견하였다. 본 발명자들은 이러한 다유전자 바이오마커를 예측 유전자 세트, 또는 PGS라고 부른다.
PGS는 하나의 전사 클러스터 또는 다수의 전사 클러스터에 근거할 수 있다. 일부 실시양태에서, PGS는 하나 이상의 전사 클러스터 전체에 근거한다. 기타 실시양태에서, PGS는 단일 전사 클러스터 내의 유전자의 하위세트, 또는 다수의 전사 클러스터의 하위세트에 근거한다. 어떠한 소정의 전사 클러스터로부터의 유전자의 하위세트도 그것을 취한 전체 전사 클로스터를 대표하는데, 이는 그러한 전사 클러스터 내에서의 유전자의 발현이 일관성이 있기 때문이다. 따라서, 특정 전사 클러스터 내의 유전자 하위세트를 사용하는 경우, 이러한 하위세트는 상기 전사 클러스터로부터의 유전자의 대표적 하위세트이다.
본원에는 암성 조직을 특정 항암 약물 또는 약물 부류에 대해 감수성인 것인지 아니면 내성인 것인지로 분류하기 위해 예측 유전자 세트 ("PGS")를 확인하는 방법이 제공된다. 이 방법은 (a) (i) 항암 약물에 대해 감수성인 것으로 확인된 암성 조직 집단으로부터의 조직 샘플 세트, 및 (ii) 항암 약물에 대해 내성인 것으로 확인된 암성 조직 집단으로부터의 조직 샘플 세트 중에서, 표 1의 전사 클러스터로부터의 유전자의 대표적 수 (예컨대 10개, 15개, 20개 또는 그 초과 유전자)의 발현 수준을 측정하는 단계; 및 (b) 감수성 집단으로부터의 조직 샘플 세트 내의 유전자의 대표적 수의 발현 수준과 내성 집단으로부터의 조직 샘플 세트 내의 유전자의 대표적 수의 발현 수준 간에 통계학상 유의차가 있는지를 결정하는 단계를 포함한다. 감수성 집단 내에서의 유전자 발현 수준이 내성 집단 내에서의 유전자 발현 수준과 유의하게 차이가 있는 유전자의 대표적 수가, 샘플을 항암 약물에 대해 감수성인 것인지 아니면 내성인 것인지로 분류하기 위한 PGS이다. 감수성 집단으로부터의 조직 샘플 세트 내의 유전자의 대표적 수의 발현 수준과 내성 집단으로부터의 조직 샘플 세트 내의 유전자의 대표적 수의 발현 수준 간에 통계학상 유의차가 있는지를 결정하기 위해 스튜던트 t-검정(Student's t-test) 또는 유전자 세트 농축 분석 (GSEA)을 사용할 수 있다. 일부 실시양태에서, 단계 (a) 및 (b)는 본원에 개시된 51개 전사 클러스터 각각에 대해 수행한다. 조직 샘플은 종양 샘플 또는 혈액 샘플일 수 있다.
본원에는 암성 조직을 특정 항암 약물 또는 약물 부류에 대해 감수성인 것인지 아니면 내성인 것인지로 분류하기 위해 PGS를 확인하는 또 다른 방법이 제공된다. 이 방법은 (a) (i) 항암 약물에 대해 감수성인 것으로 확인된 암성 조직 집단으로부터의 조직 샘플 세트, 및 (ii) 항암 약물에 대해 내성인 것으로 확인된 암성 조직 집단으로부터의 조직 샘플 세트 중에서, 51개 전사 클러스터 각각을 나타내는 도 6의 10개 유전자의 발현 수준을 측정하는 단계; 및 (b) 51개 전사 클러스터 각각을 대상으로 하여, 감수성 집단으로부터의 조직 샘플 세트 내의 상기 클러스터를 나타내는 도 6의 10개 유전자의 발현 수준과 내성 집단으로부터의 조직 샘플 세트 내의 상기 클러스터를 나타내는 도 6의 10개 유전자의 발현 수준 간에 통계학상 유의차가 있는지를 결정하는 단계를 포함한다. 일부 실시양태에서, 도 6의 상기 클러스터로부터의 10개 유전자에 의해 나타낸 바와 같고, 내성 집단 내에서의 유전자 발현 수준과 유의하게 차이가 있는 감수성 집단 내에서의 유전자 발현 수준을 나타내는 전사 클러스터가, 샘플을 항암 약물에 대해 감수성인 것인지 아니면 내성인 것인지로 분류하기 위한 PGS이다. 기타 실시양태에서, PGS는 다수의 전사 클러스터에 근거한다. 조직 샘플은 종양 샘플 또는 혈액 샘플일 수 있다.
본원에는 암 환자를 예후가 양호한지 아니면 예후가 불량한지로 분류하기 위해 PGS를 확인하는 방법이 제공된다. 이 방법은 (a) (i) 예후가 양호한 것으로 확인된 암 환자 집단으로부터의 조직 샘플 세트, 및 (ii) 예후가 불량한 것으로 확인된 암 환자 집단으로부터의 조직 샘플 세트 중에서, 표 1의 전사 클러스터로부터의 유전자의 대표적 수 (예컨대 10개, 15개, 20개 또는 그 초과 유전자)의 발현 수준을 측정하는 단계; 및 (b) 예후가 양호한 집단으로부터의 조직 샘플 세트 내의 유전자의 대표적 수의 발현 수준과 예후가 불량한 집단으로부터의 조직 샘플 세트 내의 유전자의 대표적 수의 발현 수준 간에 통계학상 유의차가 있는지를 결정하는 단계를 포함한다. 예후가 양호한 집단 내에서의 유전자 발현 수준이 예후가 불량한 집단 내에서의 유전자 발현 수준과 유의하게 차이가 있는 유전자의 대표적 수가, 환자를 예후가 양호한지 아니면 예후가 불량한지로 분류하기 위한 PGS이다. 예후가 양호한 집단으로부터의 조직 샘플 세트 내의 유전자의 대표적 수의 발현 수준과 예후가 불량한 집단으로부터의 조직 샘플 세트 내의 유전자의 대표적 수의 발현 수준 간에 통계학상 유의차가 있는지를 결정하기 위해 스튜던트 t-검정 또는 유전자 세트 농축 분석 (GSEA)을 사용할 수 있다. 일부 실시양태에서, 단계 (a) 및 (b)는 본원에 개시된 51개 전사 클러스터 각각에 대해 수행한다. 조직 샘플은 종양 샘플 또는 혈액 샘플일 수 있다.
본원에는 암 환자를 예후가 양호한지 아니면 예후가 불량한지로 분류하기 위해 PGS를 확인하는 또 다른 방법이 제공된다. 이 방법은 (a) (i) 예후가 양호한 것으로 확인된 암 환자 집단으로부터의 조직 샘플 세트, 및 (ii) 예후가 불량한 것으로 확인된 암 환자 집단으로부터의 조직 샘플 세트 중에서, 51개 전사 클러스터 각각을 나타내는 도 6의 10개 유전자의 발현 수준을 측정하는 단계; 및 (b) 51개 전사 클러스터 각각을 대상으로 하여, 예후가 양호한 집단으로부터의 조직 샘플 세트 내의 상기 클러스터를 나타내는 도 6의 10개 유전자의 발현 수준과 예후가 불량한 집단으로부터의 조직 샘플 세트 내의 상기 클러스터를 나타내는 도 6의 10개 유전자의 발현 수준 간에 통계학상 유의차가 있는지를 결정하는 단계를 포함한다. 일부 실시양태에서, 도 6의 상기 클러스터로부터의 10개 유전자에 의해 나타낸 바와 같고, 예후가 양호한 집단 내에서의 유전자 발현 수준이 예후가 불량한 집단 내에서의 유전자 발현 수준과 유의하게 차이가 있는 전사 클러스터가, 환자를 예후가 양호한지 아니면 예후가 불량한지로 분류하기 위한 PGS이다. 기타 실시양태에서, PGS는 다수의 전사 클러스터에 근거한다. 조직 샘플은 종양 샘플 또는 혈액 샘플일 수 있다.
본원에는 인간 종양이 항암 약물 티보자닙(tivozanib)을 이용한 치료에 대해 감수성일 것으로 예상되는지 아니면 내성일 것으로 예상되는지 확인하는 방법이 제공된다. 이 방법은 (a) 상기 종양으로부터의 샘플 중에서, TC50으로부터의 유전자 10개 이상을 포함하는 PGS 중의 각 유전자의 상대적 발현 수준을 측정하는 단계; 및 (b) 하기 알고리즘에 따라서 PGS 점수를 계산하는 단계를 포함한다:
Figure pct00001
여기서, E1, E2, ... En은 PGS 중의 n개 유전자의 발현 값이고, n은 PGS 중의 유전자 수이며, 규정된 역치 아래의 PGS 점수는 종양이 티보자닙에 대해 감수성일 것으로 예상된다는 것을 표시하고, 규정된 역치 위의 PGS 점수는 종양이 티보자닙에 대해 내성일 것으로 예상된다는 것을 표시한다. 한 실시양태에서, PGS는 TC50의 10개-유전자 하위세트를 포함한다. TC50으로부터의 예시적 10개-유전자 하위세트는 MRC1, ALOX5AP, TM6SF1, CTSB, FCGR2B, TBXAS1, MS4A4A, MSR1, NCKAP1L, 및 FLI1이다. TC50으로부터의 또 다른 예시적 10개-유전자 하위세트는 LAPTM5, FCER1G, CD48, BIN2, C1QB, NCF2, CD14, TLR2, CCL5, 및 CD163이다.
일부 실시양태에서, 인간 종양이 티보자닙을 이용한 치료에 대해 감수성일 것으로 예상되는지 아니면 내성일 것으로 예상되는지 확인하는 방법은 역치 결정 분석을 수행함으로써 규정된 역치를 생성시키는 것을 포함한다. 역치 결정 분석은 수신자 작동자 특성 곡선 분석을 포함할 수 있다. PGS 중의 각 유전자에 대한 상대적 유전자 발현 수준은 DNA 마이크로어레이 분석, qRT-PCR 분석, qNPA 분석, 분자 바코드-기반 검정, 또는 다중 비드-기반 검정에 의해 결정 (예를 들어, 측정)할 수 있다.
본원에는 인간 종양이 라파마이신(rapamycin)을 이용한 치료에 대해 감수성일 것으로 예상되는지 아니면 내성일 것으로 예상되는지 확인하는 방법이 제공된다. 이 방법은 (a) 상기 종양으로부터의 샘플 중에서, (i) TC33으로부터의 10개 이상의 유전자; 및 (ii) TC26으로부터의 10개 이상의 유전자를 포함하는 PGS 중의 각 유전자의 상대적 발현 수준을 측정하는 단계; 및 (b) 하기 알고리즘에 따라서 PGS 점수를 계산하는 단계를 포함한다:
Figure pct00002
여기서, E1, E2, ... Em은 감수성 종양에서 상향 조절되는, TC33으로부터의 m개 유전자의 발현 값이고 (예를 들어, m은 10개 이상의 유전자이다); F1, F2, ...Fn은 내성 종양에서 상향 조절되는, TC26으로부터의 n개 유전자의 발현 값이다 (예를 들어, n은 10개 이상의 유전자이다). 규정된 역치 위의 PGS 점수는 종양이 라파마이신에 대해 감수성일 것으로 예상된다는 것을 표시하고, 규정된 역치 아래의 PGS 점수는 종양이 라파마이신에 대해 내성일 것으로 예상된다는 것을 표시한다. 예시적 PGS는 하기 유전자를 포함한다: FRY, HLF, HMBS, RCAN2, HMGA1, ITPR1, ENPP2, SLC16A4, ANK2, PIK3R1, DTL, CTPS, GINS2, GMNN, MCM5, PRIM1, SNRPA, TK1, UCK2, 및 PCNA.
일부 실시양태에서, 인간 종양이 라파마이신을 이용한 치료에 대해 감수성일 것으로 예상되는지 아니면 내성일 것으로 예상되는지 확인하는 방법은 역치 결정 분석을 수행함으로써 규정된 역치를 생성시키는 것을 포함한다. 역치 결정 분석은 수신자 작동자 특성 곡선 분석을 포함할 수 있다. PGS 중의 각 유전자에 대한 상대적 유전자 발현 수준은 DNA 마이크로어레이 분석, qRT-PCR 분석, qNPA 분석, 분자 바코드-기반 검정, 또는 다중 비드-기반 검정에 의해 결정 (예를 들어, 측정)할 수 있다.
본원에는 인간 유방암 환자를 예후가 양호한지 아니면 예후가 불량한지로 분류하는 방법이 제공된다. 이 방법은 (a) 상기 환자로부터 수득된 종양으로부터의 샘플 중에서, (i) TC35로부터의 10개 이상의 유전자; 및 (ii) TC26으로부터의 10개 이상의 유전자를 포함하는 PGS 중의 각 유전자의 상대적 발현 수준을 측정하는 단계; 및 (b) 하기 알고리즘에 따라서 PGS 점수를 계산하는 단계를 포함한다:
Figure pct00003
여기서, E1, E2, ... Em은 예후가 양호한 환자에서 상향 조절되는, TC35로부터의 m개 유전자의 발현 값이고 (예를 들어, m은 10개 이상의 유전자이다); F1, F2, ...Fn은 예후가 불량한 환자에서 상향 조절되는, TC26으로부터의 n개 유전자의 발현 값이다 (예를 들어, n은 10개 이상의 유전자이다). 규정된 역치 위의 PGS 점수는 상기 환자의 예후가 양호하다는 것을 표시하고, 규정된 역치 아래의 PGS 점수는 상기 환자의 예후가 불량할 것으로 예상된다는 것을 표시한다. 예시적 PGS는 하기 유전자를 포함한다: RPL29, RPL36A, RPS8, RPS9, EEF1B2, RPS10P5, RPL13A, RPL36, RPL18, RPL14, DTL, CTPS, GINS2, GMNN, MCM5, PRIM1, SNRPA, TK1, UCK2, 및 PCNA.
일부 실시양태에서, 인간 유방암 환자를 예후가 양호한지 아니면 예후가 불량한지로 분류하는 방법은 역치 결정 분석을 수행함으로써 규정된 역치를 생성시키는 것을 포함한다. 역치 결정 분석은 수신자 작동자 특성 곡선 분석을 포함할 수 있다. PGS 중의 각 유전자에 대한 상대적 유전자 발현 수준은 DNA 마이크로어레이 분석, qRT-PCR 분석, qNPA 분석, 분자 바코드-기반 검정, 또는 다중 비드-기반 검정에 의해 결정 (예를 들어, 측정)할 수 있다.
본원에는 표 1의 각 전사 클러스터로부터의 10개 이상의 유전자에 대한 프로브를 포함하는 프로브 세트가 제공되는데, 단 이러한 프로브 세트는 전체-게놈 마이크로어레이 칩이 아니다. 적합한 프로브 세트의 예는 마이크로어레이 프로브 세트, PCR 프라이머 세트, qNPA 프로브 세트, 분자 바코드를 포함하는 프로브 세트 (예를 들어, 나노스트링® 테크놀로지[NanoString® Technology]), 또는 프로브가 비드에 부착되어 있는 프로브 세트 (예를 들어, 퀀티젠® 플렉스[QuantiGene® Plex] 검정 시스템)를 포함한다. 한 실시양태에서, 프로브 세트는 도 6에 열거된 510개 유전자 각각에 대한 프로브를 포함한다. 또 다른 실시양태에서, 프로브 세트는 도 6에 열거된 510개 유전자 각각에 대한 프로브, 및 대조군 프로브로 이루어진다. 또 다른 실시양태에서, 프로브 세트는 표 1에서의 각 전사 클러스터로부터의 10개 유전자에 대한 프로브를 포함하며, 이러한 프로브 세트는 도 6에 제시된 바와 같은 각 전사 클러스터로부터의 5개 이상의 유전자에 대한 프로브, 및 표 1에서의 각 전사 클러스터로부터 무작위로 선택된 각각의 상응하는 전사 클러스터로부터의 5개 이하의 유전자에 대한 프로브, 및 임의로 대조군 프로브를 포함한다. 특정 실시양태에서, 프로브 세트는 약 510 내지 1,020개 프로브, 510 내지 1,530개 프로브, 510 내지 2,040개 프로브, 510 내지 2,550개 프로브, 또는 510 내지 5,100개 프로브를 포함한다.
본 발명의 이들 및 기타 측면 및 이점은 다음 도면, 상세한 설명 및 특허청구범위를 고려할 때 명백해질 것이다.
도 1은 실시예 2에서 확인된 티보자닙 PGS의 예측력을 명확하게 보여주는 실험인, 실시예 3으로부터의 데이터를 요약한 워터폴 플롯(waterfall plot)이다. 각 막대는 25개 종양 집단 내의 하나의 종양을 나타낸다. 종양은 PGS 점수로써 배열된다 (낮은 점수에서 높은 점수로). 각 종양의 PGS 점수는 막대의 높이로써 나타낸다. 실제 반응자 (티보자닙 감수성)는 흑색 막대로써 표시되고; 실제 비-반응자 (티보자닙 내성)는 회색 막대로써 확인된다. 예측 반응자는 PGS 점수 최적 역치값 아래인 것인데, 이는 1.62인 것으로 계산되었다 (수평 점선으로써 나타냄). 예측 비-반응자는 역치값 위인 것이다.
도 2는 도 1에서의 데이터를 근거로 한 수신자 작동자 특성 (ROC) 곡선이다. 일반적으로, ROC 곡선을 사용하여 최적 역치를 결정한다. 도 2 내의 ROC 곡선은 이러한 실험에서의 최적 역치 PGS 점수가 1.62이라는 것을 표시하였다. 이러한 역치가 적용되는 경우, 시험은 25개 종양 중에서 22개 종양을 정확하게 분류하였는데, 가(false)양성률은 25%이고, 가음성률은 0%이다.
도 3은 실시예 4에서 확인된 라파마이신 PGS의 예측력을 명확하게 보여주는 실험인, 실시예 5로부터의 데이터를 요약한 워터폴 플롯이다. 각 막대는 66개 종양 집단 내의 하나의 종양을 나타낸다. 종양은 PGS 점수로써 배열된다 (낮은 점수에서 높은 점수로). 각 종양의 PGS 점수는 막대의 높이로써 나타낸다. 실제 반응자는 흑색 막대로써 표시되고; 실제 비-반응자는 회색 막대로써 확인된다. 예측 반응자는 PGS 점수 최적 역치값 아래인 것인데, 이는 0.011인 것으로 계산되었다 (수평 점선으로써 나타냄). 예측 비-반응자는 역치값 위인 것이다.
도 4는 도 3에서의 데이터를 근거로 한 수신자 작동자 특성 (ROC) 곡선이다. 도 4 내의 ROC 곡선은 이러한 실험에서의 최적 역치 PGS 점수가 -0.011이라는 것을 표시하였다. 이러한 역치가 적용되는 경우, 시험은 66개 종양 중에서 45개 종양을 정확하게 분류하였는데, 가양성률은 16%이고, 가음성률은 41%이다.
도 5는 실시예 7에 기재된 바와 같이, 왕(Wang) 유방암 데이터세트에서 나타낸 286명의 유방암 환자 집단을 분류하기 위해 실시예 6에서의 PGS를 사용함으로써 생성된 카플란-마이어(Kaplan-Meier) 생존자 곡선을 비교한 것이다. 이 플롯은 시간이 지남에 따라 (수 개월) 생존하는 환자 비율(%)을 나타낸다. 상부 곡선은 PGS 점수가 높은 (역치 위의 점수) 환자를 나타내는데, 이들 환자는 실제 생존 기간이 비교적 더 길었다. 하부 곡선은 PGS 점수가 낮은 (역치 아래 점수) 환자를 나타내는데, 이들 환자는 실제 생존 기간이 비교적 더 짧았다. 콕스(Cox) 비례 위험 퇴행 모델 분석은 TC35 및 TC26으로부터 생성된 PGS가 유효한 예후 바이오마커라는 것을 보여주었는데, 이때 p-값은 4.5e-4이고, 위험 비는 0.505이다. 해쉬마크(Hashmark)는 검열을 마친 환자를 의미한다.
도 6은 510개 인간 유전자를 열거하는 표인데, 표 1에서의 51개 전사 클러스터 각각은 10개 유전자 하위세트로써 나타낸다.
상세한 설명
정의
본원에 사용된 바와 같은, "일관성"은 유전자 세트에 적용되는 경우, 이러한 세트 구성원의 발현 수준이 소정 유형의 조직, 예를 들어 종양 조직 내에서 일제히 증가되거나 감소되는 통계학상 유의적 경향을 나타낸다는 것을 의미한다. 특정 이론에 얽매이는 것은 아니지만, 본 발명자들은 일관성이란 일관성 있는 유전자가 하나 이상의 생물학적 기능에 있어서의 공통 관여를 공유한다는 것을 시사할 것으로 인지하고 있다.
본원에 사용된 바와 같은, "최적 역치 PGS 점수"는 분류자가 가음성 호출의 비용과 가양성 호출의 비용 간의 가장 바람직한 균형을 제공하는 역치 PGS 점수를 의미한다.
본원에 사용된 바와 같은, "예측 유전자 세트" 또는 "PGS"는 소정의 표현형, 예를 들어 특별한 암 약물에 대한 감수성 또는 내성에 대하여, 소정 유형의 조직 샘플에서의 그의 PGS 점수가 이러한 소정 유형의 조직에서 소정의 표현형과 유의하게 상관이 있는 10개 이상의 유전자 세트를 의미한다.
본원에 사용된 바와 같은, "양호한 예후"는 환자가 최초 암 진단받은지 5년 이내에 종양의 원격 전이가 없는 것으로 예상된다는 것을 의미한다.
본원에 사용된 바와 같은, "불량한 예후"는 환자가 최초 암 진단받은지 5년 이내에 종양의 원격 전이가 있는 것으로 예상된다는 것을 의미한다.
본원에 사용된 바와 같은, "프로브"는 특별한 유전자의 발현을 측정하기 위해 사용될 수 있는 분자를 의미한다. 예시적 프로브는 PCR 프라이머 뿐만 아니라 유전자-특이적 DNA 올리고뉴클레오티드 프로브, 예컨대 마이크로어레이 기질에 부착된 마이크로어레이 프로브, 정량적 뉴클레아제 보호 검정 프로브, 분자 바코드에 연결된 프로브, 및 비드에 부착된 프로브를 포함한다.
본원에 사용된 바와 같은, "수신자 작동 특성" (ROC) 곡선은 이원성 분류자 시스템에 대한 가양성률 (감수성) 대 진양성률 (특이성)의 그래픽 플롯을 의미한다. ROC 곡선을 구축하는 데 있어서, 다음 정의가 적용된다:
가음성률: FNR = 1 - TPR
진양성률: TPR = 진양성 / (진양성 + 가음성)
가양성률: FPR = 가양성 / (가양성 + 진음성).
본원에 사용된 바와 같은, 치료에 대한 "반응" 또는 "반응하는"은 치료된 종양에 대하여, 이러한 종양이 (a) 성장이 느려지거나, (b) 성장이 정지되거나, 또는 (c) 퇴행을 나타내는 것을 의미한다. 요법에 반응하는 종양은 "반응자"이고, 치료에 대해 "감수성이다". 요법에 반응하지 않는 종양은 "비-반응자"이고, 치료에 대해 "내성이 있다".
본원에 사용된 바와 같은, "역치 결정 분석"은 소정의 특별한 종양 유형에 대한 역치 PGS 점수, 예를 들어 최적 역치 PGS 점수를 결정하기 위하여, 이러한 소정의 종양 유형, 예를 들어 인간 신세포 암종을 나타내는 데이터세트를 분석하는 것을 의미한다. 역치 결정 분석의 맥락에서, 소정의 종양 유형을 나타내는 데이터세트는 (a) 실제 반응 데이터 (반응 또는 비-반응), 및 (b) 종양-보유 마우스 또는 인간 군으로부터의 각 종양에 대한 PGS 점수를 포함한다.
전사 클러스터
현재 많은 생물학자들 간의 의견은 유기체의 발생과 기능을 수행하기 위해서는 포유동물에서 발현된 대략 25,000개 유전자가 복합적 조절을 받는다는 것이다. 유전자 군은 DNA 복제, 단백질 합성, 신경 발달 등과 같은 협조적 시스템에서 함께 기능한다. 현재에는, 전체 게놈 전반에 걸쳐 유전자의 협조적 발현을 전사 수준에서 연구하고 명확히 규명하기 위한 포괄적 방법론이 없다.
본 발명자들은 발현 마이크로어레이 데이터에 근거하여, 유전자를 상이한 기능적 군 또는 경로로 모으거나 "버리기" 시작하였다. 본 발명자들은 협조적으로 조절된 유전자 세트를 확인하기 위한 단계별 통계적 방법론을 개발하였다. 첫 번째 단계는 8개 인간 데이터세트 각각에 있어서, 다른 모든 유전자에 대해서 모든 유전자의 발현 수준에 대한 상관 계수를 계산하는 것이었다. 이로써, 상업적 마이크로어레이 칩 (아피메트릭스[Affymetrix] U133A)으로부터의 데이터에 근거하여 13,000 x 13,000 매트릭스의 상관 점수가 생성되었다. 그 다음, 13,000 x 13,000 매트릭스의 상관 점수 전체에 걸쳐 K-평균 클러스터링을 수행하였다. 마이크로어레이 칩 상의 13,000개 유전자는 전체 인간 게놈 전반에 걸쳐 산포되어 있고, 이들 13,000개 유전자는 일반적으로 가장 중요한 인간 유전자를 포함하는 것으로 간주되기 때문에, 이러한 13,000개-유전자 칩이 "전체 게놈" 마이크로어레이로 간주된다.
역사적으로, 많은 연구가들은 특정 유전자의 발현 수준과 관심 표현형 또는 생물학적 조건 간의 상관 관계를 밝혀내었다. 그러나, 이러한 상관 관계는 극히 제한된 유용성 만을 지니고 있었다. 이는 상기 상관 관계가 전형적으로, 데이터세트, 예를 들어 인간 유방 종양 대 마우스 유방 종양; 인간 유방 종양 대 인간 폐 종양; 또는 하나의 유전자 발현 기술 플랫폼 (아피메트릭스) 대 또 다른 유전자 발현 기술 플랫폼 (애질런트[Agilent]) 전반에 걸쳐 제시되지 못하기 때문이다.
본 발명자들은 복합적이고 다양한 데이터세트 전반에 걸쳐 관찰되는 유전자 발현 상관 관계를 확인함으로써 상기와 같은 위험을 피하였다. 다수의 독립적 데이터세트 전반에 걸쳐, 모든 13,000개 인간 유전자에 대한 측정된 RNA 발현 값에 K-평균 클러스터 분석 (문헌 [Lloyd et al., 1982, IEEE Transactions on Information Theory 28: 129-137] 참조)을 적용함으로써, 본 발명자들은 전사된 인간 유전자, 즉 "트랜스크립톰(transcriptome)"의 모집단(universe)을, 전사 플럭스 면에서 그의 발현 수준이 함께 이동하는 (증가하거나 감소한다) 100개의 독특한 비-중복 유전자 세트로 정렬하였다. 다수의 데이터 세트 전반에 걸쳐 관찰된 유전자 전사 수준에 있어서의 협조적 변이는 본 발명자들이 "일관성"이라 부르는 실험적 현상이다.
K-평균 클러스터 분석을 통하여 100개 비-중복 유전자 군을 확인한 후, 본 발명자들은 다음 단계를 포함한 최적화 공정을 수행하였다: (a) 각각의 100개 군 내에서 가외치(outlier) (개별 유전자)를 제거한 일관성 역치를 적용하는 단계; (b) 아피메트릭스 시스템 대 애질런트 시스템에서 시험하는 경우, 그의 발현 값이 과도하게 변동되는 개별 유전자를 확인하고 제거하는 단계; 및 (c) 단계 (a) 및 (b) 후에, 어느 클러스터 내에서의 최소 수의 유전자에 대한 역치를 적용하는 단계. 이러한 최적화 공정의 최종 결과는 본 발명자들이 "전사 클러스터"라 부르는, 51개의 규정되고, 고도로 일관성 있는 비-중복 유전자 세트 목록이었다. 수만 개의 유전자를 함유하는 복잡한 생물학적 시스템을, 군당 겨우 10개 정도의 유전자로써 나타낼 수 있는 51개 유전자 군으로 수학적으로 감소시킴으로써, 이러한 51개 전사 클러스터 세트는 유전자 발현 데이터를 해석하고 활용하는 데 있어 강력한 도구인 것으로 입증되었다. 각 전사 클러스터 내의 유전자가 표 1 (하기)에 열거되었고, 이는 인간 게놈 기구 (HUGO) 기호와 엔트레즈(Entrez) 식별자 둘 다에 의해 확인되었다.
Figure pct00004
Figure pct00005
Figure pct00006
Figure pct00007
Figure pct00008
Figure pct00009
Figure pct00010
Figure pct00011
Figure pct00012
Figure pct00013
Figure pct00014
Figure pct00015
Figure pct00016
Figure pct00017
Figure pct00018
Figure pct00019
Figure pct00020
Figure pct00021
Figure pct00022
Figure pct00023
Figure pct00024
Figure pct00025
Figure pct00026
Figure pct00027
Figure pct00028
Figure pct00029
Figure pct00030
Figure pct00031
Figure pct00032
Figure pct00033
Figure pct00034
Figure pct00035
전사 클러스터가 수학적 분석에 의해 확인되긴 하였지만, 본 발명자들은 전사 클러스터가 생물학적 유의성을 지니고 있다는 것을 명확하게 보여주었다. 본 발명자들은 전사 클러스터가 광범위한 기본 생물학적 구조 또는 기능을 위해 고도로 농축되었다는 사실을 발견하였다. 전사 클러스터와 기본 생물학적 구조 또는 기능 간의 연관성의 예가 다음 표 2에 열거되어 있다.
Figure pct00036
일부 전사 클러스터의 경우, 연관된 생물학 (구조 및/또는 기능)이 존재하는 것으로 추정되지만, 아직까지 확인된 바는 없다. 그러나, 본원에 개시된 방법을 실시하는 것, 예를 들어 암성 조직을 항암 약물에 대해 감수성인 것인지 아니면 내성인 것인지로 분류하기 위해 PGS를 확인하는 것은, 어느 전사 클러스터와 연관된 어떠한 생물학적 구조 또는 기능에 관한 지식도 요구하지 않는다는 사실을 인지하는 것이 중요하다. 본원에 기재된 방법을 활용하는 것은 단지 2가지 유형의 상관 관계에 의존한다: (1) 각 전사 클러스터 내의 전사체 수준들 간의 상관 관계; 및 (2) 전사 클러스터에 대한 평균 발현 점수와 표현형, 예를 들어 약물 감수성 대 약물 내성, 또는 양호한 예후 대 불량한 예후 간의 상관 관계. 상이한 많은 기본 생물학적 구조 및 기능이 상기 개시된 전사 클러스터와 연관되거나 이러한 전사 클러스터로써 나타낸다는 본 발명자들의 발견은, 수많은 각종 표현형 특질을 과도한 실험 없이도 당업자에 의해 하나 이상의 전사 클러스터와 용이하게 상관지을 수 있다는 명백한 증거이다.
일단 특정 전사 클러스터가 관심 표현형 (예컨대 특별한 약물에 대한 종양 감수성 또는 내성)과 연관이 있다면, 이러한 전사 클러스터 (또는 전사 클러스터의 하위세트)는 상기 표현형에 대한 다유전자 바이오마커로서 사용될 수 있다. 달리 언급하면, 특정 전사 클러스터 또는 그의 하위세트는 이러한 전사 클러스터와 연관된 표현형(들)에 대한 PGS이다. 소정의 어떠한 전사 클러스터도 하나 보다 많은 표현형과 연관될 수 있다.
특정 표현형은 하나 보다 많은 전사 클러스터와 연관될 수 있다. 하나 보다 많은 전사 클러스터, 또는 그의 하위세트는 이들 전사 클러스터와 연관된 표현형(들)에 대한 PGS일 수 있다.
특정 실시양태에서, 표 1로부터의 하나 이상의 전사 클러스터가 본 분석으로부터 임의로 제외될 수 있다. 예를 들어, TC1, TC2, TC3, TC4, TC5, TC6, TC7, TC8, TC9, TC10, TC11, TC12, TC13, TC14, TC15, TC16, TC17, TC18, TC19, TC20, TC21, TC22, TC23, TC24, TC25, TC26, TC27, TC28, TC29, TC30, TC31, TC32, TC33, TC34, TC35, TC36, TC37, TC38, TC39, TC40, TC41, TC42, TC43, TC44, TC45, TC46, TC47, TC48, TC49, TC50, 또는 TC51을 본 분석으로부터 제외할 수 있다.
본원에 개시된 방법을 실시하기 위해서, 당업자는 (a) 관심 표현형에 대해 양성인 것으로 나타난 집단, 및 (b) 관심 표현형에 대해 음성인 것으로 나타난 집단으로부터의 유전자 발현 데이터 (집합적으로, "반응 데이터"), 예를 들어 통상적인 마이크로어레이 데이터 또는 정량적 PCR 데이터가 필요하다. 반응 데이터를 생성시키기 위해 사용될 수 있는 집단의 예는 인간 환자 또는 동물 모델, 예를 들어 마우스 암 모델의 집단을 나타내는 조직 샘플 (종양 샘플 또는 혈액 샘플) 집단을 포함한다. 필요한 반응 데이터는 조직 샘플 중에서 유전자 발현 또는 전사체 존재량을 측정하기 위한 것에 지나지 않는 통상적인 방법, 물질 및 계측장비를 사용하여 당업자에 의해 용이하게 수득할 수 있다. 적합한 방법, 물질 및 계측장비는 널리 공지되어 있고 시판중이다. 일단 반응 데이터가 수중에 있으면, 상기 표 1에 제시된 전사 클러스터 내의 유전자 목록, 및 본원에 기재되는 수학적 계산을 이용함으로써 본원에 기재된 방법을 수행할 수 있다.
하기 실시예 2에 보다 상세히 기재되는 바와 같이, 본 발명자들은 티보자닙에 대해 감수성인 것으로 나타난 종양 샘플 집단; 및 티보자닙에 대해 내성인 것으로 나타난 종양 샘플 집단으로부터의 조직 샘플 중의 모든 51개 전사 클러스터로부터의 유전자 하위세트의 전사체 수준을 측정하였다. 그 다음, 본 발명자들은 각 집단 내의 각 개체에게서 각 클러스터에 대한 클러스터 점수를 계산하였다. 이어서, 각 전사 클러스터에 대해서, 본 발명자들은 티보자닙-감수성 집단의 클러스터 점수가 티보자닙-내성 집단의 클러스터 점수와 유의하게 차이가 있었는지를 계산하기 위해 스튜던트 t-검정을 사용하였다. 본 발명자들은 TC50에 관해서, 티보자닙-감수성 집단의 클러스터 점수와 티보자닙-내성 집단의 클러스터 점수 간에 통계학상 유의차가 존재하였다는 사실을 밝혀내었다.
본원에 개시된 전사 클러스터는 게놈 규모 분석으로부터 비롯되었고, 이러한 전사 클러스터는 암 생물학에 독특하지 않은 광범위하게 각기 상이한 생물학적 구조 및 기능을 나타낸다. 티보자닙에 대한 반응을 예측하는 데 유용한 전사 클러스터 TC50은 특정 종양을 침윤시키는 특별한 부류의 조혈 세포에 의해 발현된 유전자가 고도로 농축된다. 조혈 세포는 많은 생물학적 과정에 매우 중요하다. 원칙상, 이러한 부류의 조혈 세포에 의해 매개된 어떠한 표현형도 TC50의 발현을 알아보기 위한 시험에 의해 확인될 수 있다.
표현형별로 규정된 집단
집단. 본원에 개시된 방법은 (a) 관심 표현형 특질, 예를 들어 특별한 약물에 대한 반응 또는 암 예후에 대해 양성인 것으로 나타난 인간 환자, 동물 모델 또는 종양 집단으로부터의 유전자 발현 데이터 (전사체 존재량 데이터)를 (b) 관심 표현형 특질, 예컨대 특별한 암 약물에 대한 감수성, 및/또는 암 치료에 있어서의 전반적인 예후에 대해서 상이한 것으로 나타난 집단으로부터의 상대적 유전자 발현 데이터 또는 상대적 전사체 존재량 데이터와 함께 근거로 하여 사용할 수 있다. 바람직하게, 관심 표현형 특질이 상이한 것으로 분류된 집단은 그렇지 않으면 일반적으로 거의 동등한 수준이다. 예를 들어, 약물 감수성 집단이 마우스의 특별한 균주 군인 경우, 내성 집단은 마우스의 동일한 균주 군이어야 한다. 또 다른 예에서, 감수성 집단이 인간 신장 종양 생검 샘플 세트인 경우, 내성 집단은 인간 신장 종양 생검 샘플 세트여야 한다.
표현형 규정. 표현형 분류에 대한 적합한 기준은 관심 표현형에 좌우될 것이다. 예를 들어, 관심 표현형이 특별한 항종양제로의 치료에 대한 종양의 감수성 및 내성인 경우, 종양은 하나 이상의 파라미터, 예컨대 단일 종말점에서 평가된 종양 성장 억제 (TGI), 성장 곡선 면에서 시간 경과에 따라 평가된 TGI, 또는 종양 조직학을 기준으로 하여 분류할 수 있다. 소정의 파라미터의 경우에는, 양성 표현형을 음성 표현형과 구별하기 위해 역치 또는 컷-오프(cut-off) 값을 설정할 수 있다. 특별한 % TGI가 종종 역치 또는 컷-오프로서 사용된다. 예를 들어, 이는 인간 임상 시험에서 TGI를 측정하기 위해 임상적으로 규정된 RECIST 기준 (고형 종양에서의 반응 평가 기준)일 수 있었다. 또 다른 예에서는, 종양 성장 곡선 내에서의 변곡점 타이밍을 사용한다. 또 다른 예에서는, 조직학적 평가에 있어서 소정의 점수를 사용한다. 표현형 규정에 적합한 역치 및 적합한 파라미터를 선택하는 데에는 상당한 여지가 있다. 항종양 약물 반응 분류의 경우, 적합한 표현형 규정은 종양 유형 및 관여한 특별한 약물을 포함한 요인에 좌우될 것이다. 표현형 규정에 적합한 역치 및 적합한 파라미터의 선택은 당업계의 기술 수준 내에 있다.
유전자 발현 데이터
조직 샘플. 인간 환자의 종양 또는 마우스 모델의 종양으로부터의 조직 샘플을 RNA 공급원으로서 사용할 수 있기 때문에, 각 전사 클러스터에 대한 개별 평균 발현 점수, 및 각 전사 클러스터에 대한 집단 평균 발현 점수를 결정할 수 있다. 종양의 예는 암종, 육종, 신경교종 및 림프종이다. 조직 샘플은 통상적인 종양 생검 기구 및 과정을 이용함으로써 수득할 수 있다. 내시경 생검, 절제 생검, 절개 생검, 미세 바늘 생검, 펀치 생검, 면도 생검 및 피부 생검이, 본 발명을 실시하는 데 사용하기 위한 종양 샘플을 수득하기 위해 당업자에 의해 사용될 수 있는 것으로 인식된 의료 조치의 예들이다. 종양 조직 샘플은 개별 유전자 발현 수준을 측정하기에 충분한 RNA를 제공하기에 충분히 커야 한다.
종양 조직 샘플은 유전자 발현 또는 전사체 존재량을 정량적으로 분석하게 해주는 어떠한 형태일 수도 있다. 일부 실시양태에서, RNA는 정량적 분석에 앞서 조직 샘플로부터 단리된다. 그러나, RNA 분석의 일부 방법, 예를 들어 하이 드로우풋 게노믹스, 인크. (High Throughput Genomics, Inc.; 미국 애리조나주 투손)로부터 시판중인 qNPA™ 기술은 RNA 추출을 요구하지 않는다. 따라서, 조직 샘플은 신선하거나, 적합한 극저온 기술을 통하여 보존되거나, 또는 비-극저온 기술을 통하여 보존될 수 있다. 본 발명에 사용된 조직 샘플은 임상 생검 표본일 수 있는데, 이는 종종 포르말린에 고정된 다음 파라핀에 포매된다. 이러한 형태의 샘플은 포르말린-고정되고 파라핀-포매된 (FFPE) 조직으로서 통상 공지된다. 본 발명에 사용하기 적합한 조직 제조 및 조직 보존 기술은 당업자에게 널리 공지되어 있다.
소정의 전사 클러스터로부터의 유전자의 대표적 수에 대한 발현 수준은 소정의 조직 샘플 중의, 상기 전사 클러스터에 대한 개별 평균 발현 점수를 계산하기 위해 사용된 입력값이다. 각 조직 샘플은 특정 집단, 예를 들어 감수성 집단 또는 내성 집단의 한 구성원이다. 이어서, 소정의 집단 내의 개체 모두에 대한 개별 평균 발현 점수를 사용하여, 소정의 집단 내에서 소정의 전사 클러스터에 대한 집단 평균 발현 점수를 계산한다. 따라서 각 조직 샘플에 대해서, 전사 클러스터 내의 개별 유전자의 발현 수준을 결정하는 것, 즉 측정하는 것이 필요하다. 유전자 발현 수준 (전사체 존재량)은 적합한 어떠한 방법에 의해서도 결정할 수 있다. 개별 유전자 발현 수준을 측정하는 예시적 방법은 DNA 마이크로어레이 분석, qRT-PCR, qNPA™, 나노스트링® 기술, 및 퀀티젠® 플렉스 검정 시스템을 포함하며, 이들 각각은 다음에 논의된다.
RNA 단리. DNA 마이크로어레이 분석 및 qRT-PCR은 일반적으로, 조직 샘플로부터의 RNA 단리를 포함한다. 조직 샘플로부터 진핵 mRNA, 즉 폴리(a) RNA를 신속하고도 효율적으로 추출하는 방법은 널리 확립되었고, 당업자에게 공지되어 있다 (예를 들어, 문헌 [Ausubel et al., 1997, Current Protocols of Molecular Biology, John Wiley & Sons] 참조). 조직 샘플은 신선하거나, 동결되거나 또는 고정된 파라핀-포매된 (FFPE) 임상 연구 종양 표본일 수 있다. 일반적으로, 신선하거나 동결된 조직 샘플로부터 단리된 RNA는 FFPE 샘플로부터의 RNA 보다 덜 단편화되는 경향이 있다. 그러나, 종양 물질의 FFPE 샘플은 보다 용이하게 입수가능하고, FFPE 샘플은 본 발명의 방법에 사용하기 적합한 RNA 공급원이다. RT-PCR에 의해 유전자 발현 프로파일링하기 위한 RNA 공급원으로서의 FFPE 샘플에 관한 논의는, 예를 들어 문헌 [Clark-Langone et al., 2007, BMC Genomics 8:279]을 참조할 수 있다. 또한, 문헌 [De Andres et al., 1995, Biotechniques 18:42044]; 및 [Baker et al., U.S. Patent Application Publication No. 2005/0095634]을 참조할 수 있다. RNA 추출 및 제조에 관한 판매인의 지시사항을 수반한 시판용 키트의 사용은 광범위하고 통상적이다. 각종 RNA 단리 생성물 및 완전 키트의 상업적 판매인은 퀴아젠 (Qiagen; 미국 캘리포니아주 발렌시아), 인비트로젠 (Invitrogen; 미국 캘리포니아주 칼즈배드), 앰비온 (Ambion; 미국 텍사스주 오스틴) 및 엑시콘 (Exiqon; 미국 매사추세츠주 우번)을 포함한다.
일반적으로, RNA 단리는 조직/세포 붕괴로 시작한다. 조직/세포 붕괴 동안, RNase에 의한 RNA 분해를 최소화하는 것이 바람직하다. RNA 단리 공정 동안 RNase 활성을 제한하기 위한 한 가지 접근법은 세포가 붕괴되자 마자 변성제를 세포성 내용물과 반드시 접촉시키게 하는 것이다. 또 다른 통상의 실시는 RNA 단리 공정에 하나 이상의 프로테아제를 포함시키는 것이다. 임의로, 신선한 조직 샘플은 이들이 수집되자 마자 이를 실온 하에 RNA 안정화 용액에 담근다. 이러한 안정화 용액은 신속하게 세포 내로 침투되어, 후속 단리를 위해 4℃ 하에 저장하는 동안 RNA를 안정화시켜 준다. 이러한 안정화 용액 중 한 가지가 RNAlater® (앰비온; 미국 텍사스주 오스틴)로서 시판되고 있다.
일부 프로토콜에서는, 염화세슘 밀도 구배 원심분리에 의해 붕괴된 종양 물질로부터 총 RNA를 단리한다. 일반적으로, mRNA는 총 세포성 RNA의 대략 1% 내지 5%를 차지한다. 고정화된 올리고(dT), 예를 들어 올리고(dT) 셀룰로스를 통상적으로 사용하여, 리보솜 RNA 및 전이 RNA로부터 mRNA를 분리시킨다. 단리 후 저장하는 경우, RNA는 RNase가 없는 조건 하에 저장해야만 한다. 단리된 RNA를 안정적으로 저장하는 방법은 당업계에 공지되어 있다. RNA를 안정적으로 저장하기 위한 각종 시판 제품이 입수가능하다.
마이크로어레이 분석. 다유전자에 대한 mRNA 발현 수준은 통상적인 DNA 마이크로어레이 발현 프로파일링 기술을 사용하여 측정할 수 있다. DNA 마이크로어레이는 어레이 내에 공지된 위치를 점유하고 있는 각각의 특이적 DNA 절편을 수반하는, 고체 표면 또는 기판, 예컨대 유리, 플라스틱 또는 실리콘에 부착된 특이적 DNA 절편 또는 프로브의 수집품이다. 통상 엄격한 혼성화 조건 하에, 표지된 RNA 샘플과 혼성화시키면 어레이 내의 각각의 프로브에 상응하는 RNA 분자를 검출 및 정량화할 수 있게 된다. 비-특이적으로 결합된 샘플 물질을 제거하기 위해 엄격하게 세척한 후, 공초점 레이저 현미경 또는 기타 적합한 검출 방법에 의해 마이크로어레이를 스캐닝한다. 종종 DNA 칩으로서 공지된 현대 상업용 DNA 마이크로어레이는 전형적으로, 수만 개의 프로브를 함유하므로, 수만 개의 유전자의 발현을 동시에 측정할 수 있다. 이러한 마이크로어레이가 본원에 개시된 방법을 실시하는 데 사용할 수 있다. 또 다른 한편, 전사 클러스터의 유전자의 발현을 측정하기 위해 필요한 정도의 프로브 만을 함유하는 주문용 칩에 목적하는 어떠한 조정장치 또는 규격도 부가한다.
데이터 정규화를 촉진시키기 위해, 2-색상 마이크로어레이 판독기를 사용할 수 있다. 2-색상 (2-채널) 시스템에서는, 샘플을 제1 파장에서 방출되는 제1 형광단으로 표지시키는 반면, RNA 또는 cDNA 표준은 상이한 파장에서 방출되는 제2 형광단으로 표지시킨다. 예를 들어, Cy3 (570 nm) 및 Cy5 (670 nm)는 종종, 2-색상 마이크로어레이 시스템에서 함께 이용된다.
DNA 마이크로어레이 기술은 널리 개발되었고, 시판중이며, 광범위하게 이용되고 있다. 따라서, 본원에 개시된 방법을 수행하는 데 있어서, 당업자는 과도한 실험 없이 전사 클러스터 내의 유전자의 발현 수준을 측정하기 위해 마이크로어레이 기술을 사용할 수 있다. DNA 마이크로어레이 칩, 시약 (예컨대 RNA 또는 cDNA 제조, RNA 또는 cDNA 표지화, 혼성화 및 세척 용액용 시약), 기구 (예컨대 마이크로어레이 판독기) 및 프로토콜은 당업계에 널리 공지되어 있고, 각종 상업적 공급원으로부터 입수가능하다. 마이크로어레이 시스템의 상업적 판매인은 애질런트 테크놀로지스 (Agilent Technologies; 미국 캘리포니아주 산타 클라라) 및 아피메트릭스 (미국 캘리포니아주 산타 클라라)를 포함하지만, 다른 마이크로어레이 시스템을 사용할 수 있다.
정량적 RT - PCR. 전사 클러스터 내의 개별 유전자를 나타내는 mRNA의 수준은 통상적인 정량적 역전사효소 폴리머라제 연쇄 반응 (qRT-PCR) 기술을 이용하여 측정할 수 있다. qRT-PCR의 이점은 감수성, 유연성, 정량적 정확도, 및 밀접하게 관련된 mRNA 간을 구별할 수 있는 능력을 포함한다. 정량적 PCR을 위한 조직 샘플의 프로세싱에 관한 지침은 각종 공급원으로부터 입수가능하고, 이러한 공급원은 qRT-PCR에 대한 시판품의 제조업자 및 판매인 (예를 들어, 퀴아젠 (미국 캘리포니아주 발렌시아) 및 앰비온 (미국 텍사스주 오스틴))을 포함한다. qRT-PCR의 자동화 성능을 위한 기기 시스템은 시판중이고, 많은 실험실에서 통상적으로 사용되고 있다. 널리 공지된 상업적 시스템의 예는 어플라이드 바이오시스템즈(Applied Biosystems) 7900HT 신속 실시간 PCR 시스템 (어플라이드 바이오시스템즈; 미국 캘리포니아주 포스터 시티)이다.
일단 단리된 mRNA가 수중에 있으면, RT-PCR에 의한 유전자 발현 프로파일링에 있어서의 첫 번째 단계는 mRNA 주형을 cDNA로 역전사시킨 다음, 이를 PCR 반응으로 기하급수적으로 증폭시키는 것이다. 통상적으로 사용되고 있는 2가지 역전사효소는 조류 골수모세포증 바이러스 역전사효소 (AMV-RT) 및 몰로니(Moloney) 뮤린 백혈병 바이러스 역전사효소 (MMLV-RT)이다. 역전사 반응은 전형적으로, 특이적 프라이머, 무작위 헥사머, 또는 올리고(dT) 프라이머로 프라이밍된다. 적합한 프라이머는 시판중인데, 예를 들어 젠앰프(GeneAmp)® RNA PCR 키트 (퍼킨 엘머 [Perkin Elmer; 미국 매사추세츠주 월섬])이다. 이로써 생성되는 cDNA 생성물을 후속 폴리머라제 연쇄 반응에서 주형으로서 사용할 수 있다.
PCR 단계는 열안정성 DNA-의존성 DNA 폴리머라제를 사용하여 수행한다. PCR 시스템에서 가장 통상적으로 사용되고 있는 폴리머라제는 테르무스 아쿠아티쿠스(Thermus aquaticus) (Taq) 폴리머라제이다. PCR의 감수성은 증폭을 위해 표적화된 DNA 영역, 즉 전사 클러스터의 유전자로부터 역전사된 cDNA의 영역에 상보적인 프라이머를 사용함으로써 비롯된다. 따라서, qRT-PCR을 본 발명에 이용하는 경우, 소정의 전사 클러스터 내의 각 유전자에 대해 특이적인 프라이머는 이러한 유전자의 cDNA 서열에 기초한 것이다. 상업적 기술, 예컨대 SYBR® 그린 또는 TaqMan® (어플라이드 바이오시스템즈; 미국 캘리포니아주 포스터 시티)을 판매인의 지시사항에 따라서 사용할 수 있다. 베타-액틴 또는 GAPDH와 같은 하우스키핑 유전자의 수준을 비교함으로써 샘플들 간에 부하 상의 차이를 알아보기 위해 메신저 RNA 수준을 정규화시킬 수 있다. mRNA 발현 수준은 어느 단일 대조군 샘플, 예컨대 정상, 비-종양 조직 또는 세포로부터의 mRNA와 비교해서 표현될 수 있다. 또 다른 한편, 이는 종양 샘플 또는 종양 세포주의 풀로부터의 mRNA, 또는 대조군 mRNA의 시판용 세트로부터의 mRNA와 비교해서 표현될 수 있다.
전사 클러스터 내의 유전자의 발현 수준을 PCR 분석하는 데 적합한 프라이머 세트는 과도한 실험 없이도 당업자에 의해 설계되고 합성될 수 있다. 또 다른 한편, 본원에 개시된 방법을 실시하는 데 완전한 PCR 프라이머 세트는 표 1에 열거된 바와 같이, 전사 클러스터 내의 유전자의 실체를 기준으로 하여 상업적 공급원, 예를 들어 어플라이드 바이오시스템즈로부터 구입할 수 있다. PCR 프라이머는 바람직하게, 길이가 약 17 내지 25개 뉴클레오티드이다. 프라이머는 융점 (Tm) 추정을 위한 통상적인 알고리즘을 사용하여, 특별한 Tm을 갖도록 설계할 수 있다. 프라이머 설계 및 Tm 추정을 위한 소프트웨어는 시판중이고 (예를 들어, 프라이머 익스프레스[Primer Express™] [어플라이드 바이오시스템즈]), 또한 인터넷 상에서 이용 가능하다 (예를 들어, 프라이머3 (매사추세츠 인스티튜트 오브 테크놀로지 [Massachusetts Institute of Technology])). PCR 프라이머 설계의 확립된 원칙들을 적용함으로써, 다수의 상이한 프라이머를 사용하여 소정의 어떠한 유전자의 발현 수준도 측정할 수 있다. 따라서, 본원에 개시된 방법은 특별한 프라이머가 전사 클러스터 내의 소정의 어느 유전자에 대해 사용되는 것과 관련해서 제한되지 않는다.
정량적 뉴클레아제 보호 검정. RNA 추출 단계를 수행하지 않고서도 전사 클러스터 내의 유전자의 발현 수준을 결정하는 데 적합한 방법의 한 예는 정량적 뉴클레아제 보호 검정 (qNPA™)인데, 이는 하이 드로우풋 게노믹스, 인크. ("HTG"로서 공지되기도 함; 미국 애리조나주 투손)로부터 시판중이다. qNPA 방법에서는, 총 RNA를 용액 내로 방출시켜 주는 독점적 용해 완충제 (HTG)로 샘플을 96-웰 플레이트에서 처리한다. 유전자-특이적 DNA 올리고뉴클레오티드, 즉 소정의 전사 클러스터 내의 각각의 유전자에 대해 특이적인 DNA 올리고뉴클레오티드를 상기 용해 완충제 용액에 직접 가하면, 이들은 용해 완충제 용액에 존재하는 RNA와 혼성화된다. 상기 DNA 올리고뉴클레오티드를 과량으로 가하여, DNA 올리고뉴클레오티드에 상보적인 모든 RNA 분자가 반드시 혼성화되게 한다. 혼성화 단계 후, S1 뉴클레아제를 상기 혼합물에 가한다. S1 뉴클레아제는 표적 RNA의 비-혼성화된 부분, 비-표적 RNA의 전부, 및 과량의 DNA 올리고뉴클레오티드를 분해한다. 그 다음, S1 뉴클레아제 효소는 불활성화된다. RNA::DNA 이종이중체를 처리하여 이러한 이중체의 RNA 부분을 제거하면, 앞서 보호된 올리고뉴클레오티드 프로브 만이 남게 된다. 살아남은 DNA 올리고뉴클레오티드는 본래의 RNA 샘플의 화학량론상 대표적인 라이브러리이다. qNPA 올리고뉴클레오티드 라이브러리는 어레이플레이트(ArrayPlate) 검출 시스템 (HTG)을 사용하여 정량화할 수 있다.
나노스트링® 엔카운터 ® 분석. 전사 클러스터 내의 유전자의 발현 수준을 결정하는 데 적합한 기술의 또 다른 예는 분자 "바코드"를 수반한 프로브를 기준으로 한 시판용 검정 시스템인, 나노스트링® 엔카운터™ 분석 시스템 (나노스트링® 테크놀로지스; 미국 워싱톤주 시애틀)이다. 이러한 시스템은 단일 반응으로 수백 개의 독특한 전사체를 검출하고 계수하도록 설계된다. 각각의 색상-코드화 바코드를, 관심 유전자, 예를 들어 전사 클러스터 내의 유전자에 상응하는 단일 표적-특이적 프로브에 부착시킨다. 대조군과 함께 혼합하는 경우, 프로브는 다중화 "코드세트"를 형성한다. 나노스트링® 기술은 용액 중에서 혼성화되는, mRNA당 대략 50개 염기의 2개 프로브를 이용한다. "리포터 프로브"는 신호를 수반하고, "포획 프로브"는 데이터 수집을 위해 복합체를 고정화시키게 해준다. 혼성화 후, 과량의 프로브를 제거하고, 프로브/표적 복합체를 엔카운터® 카트리지에 정렬 및 고정화시키는데, 이러한 카트리지는 디지털 분석기 내에 놓여져 있다. 엔카운터® 분석 시스템은 자동화 샘플 프렙 스테이션(prep station), 디지털 분석기, 코드세트 (분자 바코드), 및 분석을 수행하는 데 필요한 모든 시약 및 소모품을 포함하는 통합 시스템이다.
퀀티젠 ® 플렉스 검정. 전사 클러스터 내의 유전자의 발현 수준을 결정하는 데 적합한 기술의 또 다른 예는 퀀티젠® 플렉스 검정 (파노믹스[Panomics; 미국 캘리포니아주 프리몬트])으로서 공지된 시판용 검정 시스템이다. 이 기술은 분지된 DNA 신호 증폭을 xMAP (다중-분석물 프로파일링) 비드에 결합시켜, 신선하거나, 동결되거나 또는 FFPE 조직 샘플, 또는 정제된 RNA 제제로부터 직접 다중 RNA 표적을 동시에 정량화할 수 있게 해준다. 이러한 기술에 관한 추가 기재에 대해서는, 예를 들어 문헌 [Flagella et al., 2006, Anal . Biochem. 352:50-60]을 참조할 수 있다.
본원에 개시된 방법의 실시는 유전자 발현 데이터를 생성하기 위한 어떠한 특별한 기술의 사용으로만 제한되지 않는다. 상기 논의된 바와 같이, 프로토콜, 시약 및 계측장비를 포함한 각종의 정교하고도 신뢰할 만한 시스템이 시판되고 있다. 본원에 기재된 방법에 사용하기 위한 유전자 발현 데이터를 생성하는 데 적합한 시스템의 선택 및 사용은 설계 선택의 문제이고, 이는 과도한 실험없이 당업자에 의해 수행될 수 있다.
클러스터 점수 및 집단 간의 통계학적 차이
각 조직 샘플 중의 소정의 어떠한 전사 클러스터에 대한 클러스터 점수도 하기 알고리즘에 따라서 계산할 수 있다:
Figure pct00037
여기서, E1, E2, ... En은 각각의 전사 클러스터를 나타내는 n개 유전자 각각에 대해 수득된 상대적 발현 값이다.
클러스터 점수는 약물 감수성 집단 내의 각 조직 샘플 및 약물 내성 집단 내의 각 구성원 조직 샘플 중의 51개 전사 클러스터 각각에 대해 계산할 수 있다.
통계학적 유의성은 당업계에 널리 공지된 각종 방식, 예를 들어 t-검정 또는 콜모고로프-스미르노프(Kolmogorov-Smirnov) 검정으로 계산할 수 있다. 예를 들어, 스튜던트 t-검정은 각 개별의 클러스터 점수를 사용한 다음, 약물 감수성 집단과 약물 내성 집단 간의 2개 샘플 t-검정을 이용하여 p-값을 계산함으로써 수행할 수 있다 (하기 실시예 2 참조). 또 다른 적합한 방법은 문헌 ([Subramanian, Tamayo et al., 2005, Proc . Nat'l Acad . Sci USA 102: 15545-15550] 참조)에 기재된 GSEA 알고리즘에서와 같이 콜모고로프-스미르노프 검정을 수행하는 것이다. 통계학적 유의성은 또한, 피셔(Fisher)의 정확 검정 (문헌 [Fisher, 1922, J. Royal Statistical Soc. 85:87-94]; [Agresti, 1992, Statistical Science 7:131-153] 참조)을 적용하여 약물 감수성 집단과 약물 내성 집단 간의 p-값을 계산함으로써 계산할 수 있다.
통계학상 유의차는 당업계에 널리 공지되어 통상적으로 사용되고 있는 통계학적 컷오프를 기준으로 할 수 있다. 예를 들어, 통계학상 유의차는 0.05, 0.01, 0.005, 0.001 보다 적거나 이와 등가의 p-값일 수 있다. 이러한 p-값은 스튜던트 t-검정, 콜모고로프-스미르노프 검정 또는 피셔의 정확 검정과 같은 알고리즘을 사용하여 계산할 수 있다. 본원에서는, 적합한 알고리즘을 이용하여 통계학상 유의차를 결정하는 것은 당업계의 기술 수준 내에 있고, 당업자는 시험되고 있는 약물 및 집단 (예를 들어, 종양 샘플 또는 환자 집단)을 기준으로 하여 유의성을 결정하는 데 적당한 통계학적 컷오프를 선택할 수 있는 것으로 고려된다.
전사 클러스터의 하위세트
일부 실시양태에서, 전사 클러스터의 발현과 관심 표현형, 예를 들어 약물 내성 간의 상관 관계는 전사 클러스터 내의 모든 유전자에 대한 발현 측정을 이용함으로써 확립된다. 그러나, 전사 클러스터 내의 모든 유전자에 대한 발현 측정을 이용하는 것은 선택 사항이다. 일부 실시양태에서, 전사 클러스터의 발현과 표현형 간의 상관 관계는 이러한 전사 클러스터로부터의 특정 하위세트, 즉 대표적 수의 유전자에 대한 발현 측정을 이용함으로써 확립된다. 전사 클러스터의 하위세트는 전체 전사 클러스터를 나타내기 위해 신뢰할 수 있을 정도로 사용될 수 있는데, 이는 각 전사 클러스터 내에서는 유전자가 일관되게 발현되기 때문이다. 당연하게도, 소정의 전사 클러스터 내에서의 유전자 발현 수준 (전사 존재량으로써 나타낸 바와 같음)은 서로 상관이 있다. 일반적으로, 보다 큰 하위세트는 일반적으로, 보다 정확한 클러스터 점수를 산출시키는데, 부가 유전자당 정확도 상의 한계 증가는 감소하게 되는데, 이는 상기 하위세트의 크기가 증가하기 때문이다. 보다 작은 하위세트는 편의성과 경제성을 제공해준다. 예를 들어, 각각의 전사 클러스터가 10개 유전자로 나타낸 경우, 51개 전사 클러스터의 전체 세트는 단지 510개 프로브로써 효과적으로 나타낼 수 있는데, 이는 상업적 판매인으로부터 현재 입수가능한 기술을 이용하여 단일 마이크로어레이 칩, 단일 PCR 키트, 단일 엔카운터 분석™ 검정 (나노스트링® 테크놀로지스), 또는 단일 퀀티젠® 플렉스 검정 (파노믹스; 미국 캘리포니아주 프리몬트) 내로 혼입할 수 있다. 도 6은 510개 인간 유전자를 열거하는데, 여기서 51개 전사 클러스터 각각은 단지 10개 유전자의 하위세트로써만 나타낸다.
이러한 프로브 수에 있어서의 감소는 바이오마커 발견 프로젝트, 즉 종양학에 있어서의 임상 표현형 (약물 내성 또는 예후)을 생물학상 관련 유전자의 특이적 세트 (바이오마커)와 연관짓는 데 유리할 수 있고, 임상 검정에 유리할 수 있다. 종종, 임상 실시에서는 샘플 중의 RNA의 완전성 보존에 상관없이 소량의 조직을 수집한다. 결과적으로, RNA의 양 및 질은 다수의 유전자의 발현을 정확히 측정하는 데 불충분할 수 있다. 검정하고자 하는 유전자의 수를 크게 줄임으로써, 예를 들어 100배 줄임으로써, 전사 클러스터의 하위세트의 사용은 낮은 질의 RNA를 산출시키는 소량의 조직으로부터도 강력한 전사 클러스터 분석을 가능하게 해준다.
각 전사 클러스터를 나타내기 위해 이용된 유전자의 최적 수는 검정 강건성(robustness)과 편의성 간의 균형으로서 볼 수 있다. 전사 클러스터의 하위세트를 사용하는 경우, 이러한 하위세트는 바람직하게, 10개 이상의 유전자를 함유하고 있다. 대표적 수로 적합한 수의 선택은 과도한 실험 없이 당업자에 의해 수행될 수 있다.
본 발명자들은 수학적 정밀을 이용하여, 전사 클러스터 1-51 중 어느 하나로부터의 10개 이상의 유전자의 본질적으로 어떠한 하위세트도, 이것을 취한 전체 전사 클러스터에 대한 고도로 유효한 대용물이라는 것을 명확하게 보여주고자 하였다. 달리 언급하면, 본 발명자들은 무작위로 선택된 어떠한 10개-유전자 하위세트도 모든 수의 각각의 전사 클러스터에 대한 발현 점수로부터 계산된 개별 평균 발현 점수와 고도로 상관이 있는 개별 평균 발현 점수를 산출할 것인지를 결정하고자 하였다. 이를 수행하기 위해, 본 발명자들은 각 전사 클러스터로부터 무작위로 선택된 10개-유전자 하위세트 10,000개를 생성시켰다. 이어서, 본 발명자들은 10,000개 각각의 개별 평균 발현 점수와 전사 클러스터의 모든 유전자에 대한 개별 평균 발현 점수 간의 상관 관계를 계산하였다.
표 3은 모든 전사 클러스터에 대한 10,000개 피어슨(Pearson) 상관성 비교의 최악의 상관성 p-값을 나타낸다. 51개 전사 클러스터 각각에 대해, 무작위로 선택된 10개-유전자 하위세트 10,000개 모두는 완전한 전사 클러스터로부터 계산된 개별 평균 발현 점수와 유의하게 상관이 있는 개별 평균 발현 점수를 산출시킨다. 이는 51개 전사 클러스터 중 어느 것으로부터의 본질적으로 어떠한 10개-유전자 하위세트도 전체 전사 클러스터를 충분히 대표하므로, 이것이 전체 전사 클러스터에 대한 고도로 유효한 대용물로서 이용됨으로써, 전사 클러스터와 관심 표현형 간의 연관성을 확립시키는 데 필요한 유전자 발현 측정 수 (및 이에 따른 프로브의 수)를 크게 감소시킬 수 있다는 사실을 철저하게 보여주는 수학적 증명이다.
Figure pct00038
Figure pct00039
하위세트에 의거한 실시양태의 추가 예에서, 본 발명자들은 수학적 엄밀성을 이용하여, 전사 클러스터 중 어느 것에 대해서도, 도 6에서의 그 클러스터를 나타내는 하위세트로부터의 최소한 5개의 유전자 및 해당 전사 클러스터로부터 무작위로 선택된 최대한 5개의 상이한 유전자를 포함하는 어떠한 10개-유전자 하위세트도 모든 수의 그 전사 클러스터에 대한 발현 점수로부터 계산된 개별 평균 발현 점수와 유의하게 상관이 있는 개별 평균 발현 점수를 산출시킨다는 사실을 증명하였다. 달리 언급하면, 도 6에 나타낸 51개 전사 클러스터 각각에 대해, 10개-유전자 하위세트 중의 5개 이하의 유전자를 표 1에서의 동일한 전사 클러스터로부터 선택된 상이한 유전자로 치환시킬 수 있다.
이러한 증명에서, 51개 전사 클러스터 각각에 대해 본 발명자들은 신규 10개-유전자 하위세트 10,000개를 생성시켰는데, 여기서 최소한 5개의 유전자는 도 6에서 그 클러스터를 나타내는 10개-유전자 하위세트로부터 취하였고, 최대한 5개의 부가 유전자는 상기 클러스터로부터 무작위로 선택하였다. 그 다음, 본 발명자들은 10,000개 각각의 개별 평균 발현 점수와 전사 클러스터의 모든 유전자에 대한 개별 평균 발현 점수 간의 상관 관계를 계산하였다. TC1-25, TC27-36 및 TC38-51에 대한 10,000개의 피어슨 상관성 비교의 최악의 상관성 p-값은 5.40E-267 미만이었다. TC26에 대한 10,000개의 피어슨 상관성 비교의 최악의 상관성 p-값은 3.7E-126이었고, TC37에 대해서는 2.3E-128이었다. 51개 전사 클러스터 각각에 대해, 신규한 10개-유전자 하위세트 10,000개 모두는 완전한 전사 클러스터로부터 계산된 개별 평균 발현 점수와 유의하게 상관이 있는 개별 평균 발현 점수를 산출시킨다. 이는 도 6에서의 10개-유전자 예로로부터의 최소한 5개의 유전자 및 동일한 전사 클러스터로부터 무작위로 선택된 5개 이하의 유전자를 함유하는 본질적으로 어떠한 10개-유전자 하위세트도 전체 전사 클러스터를 충분히 대표하기 때문에, 이것이 전체 전사 클러스터에 대한 고도로 유효한 대용물로서 이용될 수 있다는 사실을 철저하게 보여주는 수학적 증명이다. 이는 이것이 전사 클러스터와 관심 표현형 간의 연관성을 확립시키는 데 필요한 유전자 발현 측정 수 (및 이에 따른 프로브의 수)를 크기 감소시키기 때문에 유리하다. 당업자는 이것이 표 1에서의 어느 전사 클러스터로부터의 본질적으로 어떠한 10개-유전자 하위세트도 전체 전사 클러스터에 대한 대용물로서 사용될 수 있다는, 보다 광범위한 상기 (표 3 및 이와 관련된 논의) 증명 내의 특정 예라는 사실을 인식할 것이다.
예측 유전자 세트 ( PGS )
예측 유전자 세트 (PGS)는 특별한 표현형에 대해서 특정 유형의 조직, 예를 들어 포유동물 종양을 분류하는 데 유용한 다유전자 바이오마커이다. 특별한 표현형의 예는 (a) 특별한 암 약물에 대한 감수성; (b) 특별한 암 약물에 대한 내성; (c) 치료시 양호한 결과를 나타낼 것으로 예상됨 (양호한 예후); 및 (d) 치료시 불량한 결과를 나타낼 것으로 예상됨 (불량한 예후)이다.
본원에는 본원에 제시된 51개 전사 클러스터 중 하나 이상을 사용함으로써 신규한 예측 유전자 세트를 확인하는 일반적 방법이 개시된다. 전사 클러스터가 관심 표현형과 유의하게 상관이 있는 클러스터 점수를 산출하는 것으로 나타난 경우, PGS는 그러한 전사 클러스터를 기준으로 하거나 그 전사 클러스터에서 비롯된다. 일부 실시양태에서, PGS는 전사 클러스터 내의 모든 유전자를 포함한다. 다른 실시양태에서, PGS는 전체 전사 클러스터 보다는 오히려, 전사 클러스터로부터의 유전자의 하위세트 만을 포함한다. 바람직하게, 본원에 기재된 방법을 사용하여 확인된 PGS는 전사 클러스터로부터의 10개 이상의 유전자, 예를 들어 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 42, 44, 46, 48 또는 50개의 유전자를 포함할 것이다.
일부 실시양태에서, 하나 보다 많은 전사 클러스터가 관심 표현형과 연관이 있다. 이러한 상황 하에서, PGS는 연관된 전사 클러스터 중의 어느 하나, 또는 다수의 연관된 전사 클러스터에 기초할 수 있다.
PGS 점수
PGS의 예측 값은 이러한 PGS 중의 10개 이상의 유전자 각각의 발현 수준을 측정하고 (조직 샘플에 대해서), 하기 알고리즘에 따라서 조직 샘플에 대한 PGS 점수를 계산함으로써 성취한다:
Figure pct00040
여기서, E1, E2, ... En은 PGS 중의 n개 유전자의 발현 값이다.
임의로, PGS 이외에도, 부가 유전자, 예를 들어 내부 표준으로서 사용될 하우스키핑 유전자의 발현 수준을 측정할 수 있다.
클러스터 점수와 PGS 점수를 계산하기 위한 알고리즘이 본질적으로 동일한 것이고, 양 계산이 유전자 발현 값을 포함하긴 하지만, 클러스터 점수가 PGS 점수와 동일하지 않다는 것을 인지해야 한다. 그 차이는 상황 정보 내에 있다. 클러스터 점수는 공지된 표현형의 샘플과 연관이 있는데, 이러한 샘플은 PGS를 확인하는 방법에 사용되고 있다. 이와는 달리, PGS 점수는 공지되지 않은 표현형의 샘플과 연관이 있는데, 이러한 샘플은 예상되는 표현형에 관해 시험되고 분류된다.
PGS 점수 해석
PGS 점수는 역치 PGS 점수에 대해서 해석된다. 역치 PGS 점수 보다 높은 PGS 점수는 제1 표현형을 지닐 것으로 예상되는 것으로서 분류된 조직 샘플, 예를 들어 특별한 약물로의 치료에 대해 감수성일 것으로 예상되는 종양을 표시하는 것으로 해석될 것이다. 역치 PGS 점수 보다 낮은 PGS 점수는 제2 표현형을 지닐 것으로 예상되는 것으로서 분류된 조직 샘플, 예를 들어 상기 약물로의 치료에 대해 내성일 것으로 예상되는 종양을 표시하는 것으로 해석될 것이다. 종양에 대해서는, 소정의 역치 PGS 점수가 종양 유형에 따라서 다양할 수 있다. 본원에 개시된 방법의 맥락에서, 용어 "종양 유형"은 (a) 종 (마우스 또는 인간); 및 (b) 본래 기관 또는 조직을 고려한다. 임의로, 종양 유형은 유전자 발현 특징에 의거한 종양 범주화, 예를 들어 HER2-양성 유방 종양, 또는 특별한 EGFR 돌연변이를 발현하는 비-소세포 폐 종양을 추가로 고려한다.
소정의 어떠한 종양 유형에 대해서도, 최적 역치 PGS 점수는 역치 결정 분석을 수행함으로써 실험적으로 결정할 수 있다 (또는 적어도 근사치를 계산할 수 있다). 바람직하게, 역치 결정 분석은 수신자 작동자 특성 (ROC) 곡선 분석을 포함한다.
ROC 곡선 분석은 널리 공지된 통계학적 기술이고, 이의 적용은 당업계의 통상적인 기술 수준 내이다. ROC 곡선 분석의 논의에 대해서는, 일반적으로 다음 문헌을 참조할 수 있다 ([Zweig et al., 1993, "Receiver operating characteristic (ROC) plots: a fundamental evaluation tool in clinical medicine," Clin . Chem. 39:561-577]; 및 [Pepe, 2003, The statistical evaluation of medical tests for classification and prediction, Oxford Press, New York]).
PGS 점수 및 최적 역치 PGS 점수는 종양 유형마다 다양할 수 있다. 따라서, 역치 결정 분석은 바람직하게, 본원에 개시된 방법을 사용하여 시험될 소정의 어떠한 종양 유형도 나타내는 하나 이상의 데이터세트 상에서 수행한다. 역치 결정 분석에 사용된 데이터세트는 (a) 실제 반응 데이터 (반응 또는 비-반응), 및 (b) 인간 종양 또는 마우스 종양 군으로부터의 각 종양 샘플에 대한 PGS 점수를 포함한다. 일단 소정의 종양 유형에 대하여 PGS 점수 역치가 결정되면, 이러한 역치를 적용하여 그 종양 유형의 종양으로부터 PGS 점수를 해석할 수 있다.
ROC 곡선 분석은 본질적으로 다음과 같이 수행한다. 역치 보다 큰 PGS 점수를 나타내는 어떠한 샘플도 비-반응자로서 확인된다. 역치 보다 낮거나 등가의 PGS 점수를 나타내는 어떠한 샘플도 반응자로서 확인된다. 시험된 샘플 세트로부터의 모든 PGS 점수의 경우에는, 역치로서 그 PGS 점수를 이용하여 "반응자" 및 "비-반응자" (가상적 호출)를 분류한다. 이러한 공정으로, 데이터 세트에 대한 실제 반응 데이터에 대항한 가상적 호출의 비교를 통하여, 각 잠재적 역치에 대한 TPR (y 벡터 ) 및 FPR (x 벡터)을 계산할 수 있게 된다. 이어서, TPR 벡터 및 FPR 벡터를 이용하여 도트 플롯(dot plot)을 만듦으로써 ROC 곡선을 구축한다. ROC 곡선이 (0,0) 지점에서부터 (1.0,1.0) 지점까지의 사선 위에 있는 경우, PGS 시험 결과는 무작위 보다 우수한 시험이라는 것을 보여준다 (예를 들어, 도 2 및 4 참조).
ROC 곡선을 이용하여 가장 잘 작동하는 지점을 확인할 수 있다. 가장 잘 작동하는 지점은 가음성 비용과 비교 검토된 가양성 비용 간의 가장 우수한 균형을 가져다주는 것이다. 이들 비용이 같을 필요는 없다. ROC 공간 내에서 지점 x,y에서 예상되는 평균 분류 비용은 다음 표현으로써 나타낸다:
C = (1-p) 알파*x + p*베타(1-y)
여기서,
알파 = 가양성 비용,
베타 = 누락된 양성 (가음성) 비용, 및
p = 양성 경우의 분율.
가양성 및 가음성은 알파 및 베타에 상이한 값을 할당함으로써 상이하게 검토할 수 있다. 예를 들어, 관심 표현형 특질이 약물 내성이고, 비-반응자인 환자를 더 많이 치료하는 비용에서 반응자 군 내의 더 많은 환자를 포함하도록 결정된 경우에는, 알파 상에 더 많은 가중치를 줄 수 있다. 이러한 경우, 가양성 비용과 가음성 비용은 동일한 것으로 추정된다 (알파는 베타와 등가이다). 따라서, ROC 공간 내의 지점 x,y에서 예측 평균 분류 비용은 다음과 같다:
C' = (1-p)*x + p*(1-y).
가장 작은 C'는 가양성과 가음성의 모든 쌍 (x,y)을 사용한 후에 계산할 수 있다. 최적의 PGS 점수 역치는 C'에서 (x,y)의 PGS 점수로서 계산된다. 예를 들어, 실시예 2에 제시된 바와 같이, 이러한 접근법을 이용하여 결정된 바와 같이, 최적의 PGS 점수 역치는 1.62인 것으로 밝혀졌다.
종양이 특별한 약물, 예를 들어 티보자닙을 이용한 치료에 대해 감수성일 것인지 아니면 내성일 것인지를 예측하는 것 이외에도, PGS 점수는 이러한 PGS 점수의 크기에 따라서 특정 종양이 감수성인지 아니면 내성인지를 어떻게 예상하는 지에 관한, 대략적이긴 하지만 유용한 표시를 제공한다.
실시예
본 발명은 다음 실시예로써 추가로 예시된다. 본 실시예는 예시적 목적으로만 제공되고, 어떠한 방식으로든 본 발명의 범위 또는 내용을 제한하는 것으로서 간주되지 않아야 한다.
실시예 1: 뮤린 종양 - BH 아카이브( Archive )
유전적으로 다양한 100개 초과의 뮤린 유방 종양 집단 (BH 아카이브)을 사용하여 관심 약물에 대해 감수성인 종양 (반응자)과 동일한 관심 약물에 대해 내성인 종양 (비-반응자)을 확인하였다. BH 아카이브는 HER2-의존성, 유도성 자발적 유방 종양을 발생시키는 공학처리시킨 키메라 마우스로부터 유래된 100개 초과의 자발적 뮤린 유방 종양으로부터의 원발성 종양 물질을 생체내 증식시키고 냉동보존시킴으로써 확립하였다.
마우스는 본질적으로 다음과 같이 생성되었다. Ink4a 동형접합성 기능없는 뮤린 ES 세포를 별개의 단편으로서 다음 4가지 구조물로 공동-형질감염시켰다: MMTV-rtTA, TetO-HER2 V659Eneu , TetO-루시페라제 및 PGK-퓨로마이신. 이들 구조물을 수반하는 ES 세포를 3일생 C57BL/6 배반포 내로 주사하고, 이를 키메라 마우스 탄생을 초래하는 임신을 위해 가임신 암컷 마우스 내로 이식하였다. 마우스 유방 종양 바이러스 장 말단 반복서열 (MMTV)을 사용하여 역 테트라시클린 전사활성화 인자 (rtTA)의 유방-특이적 발현을 구동시켰다. 독시시클린을 음용수에 넣어 마우스에 공급한 경우, rtTA는 HER2 활성화 종양유전자의 유방-특이적 발현을 제공하였다. 독시시클린에 의해 테트라시클린-반응성 프로모터를 유도시킨 후, 마우스에게 잠복기가 약 2 내지 6개월인 침습성 유방 암종이 발생하였다.
100개 초과 종양의 BH 아카이브는 본질적으로 다음과 같이 생성하였다. 세포 스트레이너(strainer)를 이용하여 종양을 물리적으로 붕괴시킴으로써 키메라 동물로부터 원발성 종양 세포를 단리하였다. 전형적으로, 1x105개 세포를 매트리겔(Matrigel)과 혼합하고 (50:50 부피비), 이를 암컷 NCr nu/nu 마우스 내로 피하 주사하였다. 이들 종양이 대략 500 mm3으로 성장하면 (이를 위해서는 전형적으로 2 내지 4주가 소요된다), 생체내 증식의 추가 1회전 동안 상기 종양을 수집한 후, 종양 물질을 액체 질소에 냉동보존하였다. 증식되고 보관된 종양을 명확히 규명하기 위해, 각각의 개별 종양주로부터의 1x105개 세포를 해동하고, BALB/c 누드 마우스에 피하 주사하였다. 종양 크기가 평균 500 내지 800 mm3에 도달하면, 동물을 희생시키고 추가 분석을 위해 종양을 외과적으로 제거하였다.
BH 종양 아카이브를 조직, 세포 및 분자 수준에서 명확히 규명하였다. 분석은 일반 조직병리학 (구조, 세포학, 결합조직증식증, 괴사 정도, 혈관계 형태학), IHC (예를 들어, 종양 혈관계를 알아보기 위한 CD31, 종양 세포 증식을 알아보기 위한 Ki67, 경로 활성화를 알아보기 위한 신호전달 단백질), 및 포괄적인 분자 프로파일링 (RNA 발현을 알아보기 위한 마이크로어레이, DNA 카피 수를 알아보기 위한 어레이 CGH) 뿐만 아니라 특이적 유전자에 대한 RNA 및 단백질 발현 수준 (qRT-PCR, 면역검정)을 포함하였다. 이러한 분석 결과, 주요 표현형 파라미터, 예컨대 종양 성장률, 미소혈관계, 및 상이한 암 약물에 대한 가변 감수성에 있어서 징조가 나타난 현저한 정도의 분자 변이가 드러났다.
예를 들어, 대략 100개의 BH 뮤린 종양을 조직병리학적으로 분석한 결과, 이들 중에서 간질 세포 연루 수준, 세포각질 염색 및 세포성 구조를 포함한 특이한 형태학적 특색을 각각 수반한 아형(subtype)이 있는 것으로 밝혀졌다. 하나의 아형은 보다 느린 증식률과 함께, 콜라겐-양성의 섬유모세포-유사 간질 세포에 의해 둘러싸여진, 내포된 세포각질-양성 상피 세포를 나타낸 반면, 제2의 아형은 간질이 거의 연루되지 않은 고형 시트의 상피양 주변 세포, 및 보다 신속한 증식률을 나타내었다. 이들 및 기타 아형은 또한, 그들의 유전자 발현 프로파일에 의해 구별 가능하다.
실시예 2: 티보자닙 PGS 의 확인
BH 뮤린 종양 아카이브 내의 종양을 대상으로 하여, 티보자닙을 이용한 치료에 대한 감수성에 관하여 시험하였다. 이러한 약물 치료에 대한 종양 반응의 평가는 본질적으로 다음과 같이 수행하였다. 물리적으로 붕괴시킨 종양 세포 (매트리겔과 혼합됨)를 6주생 암컷 BALB/c 누드 마우스에 주사함으로써, 피하 이식된 종양을 확립하였다. 종양 크기가 대략 100 내지 200 mm3에 도달하면, 종양을 보유하고 있는 마우스 20마리를 무작위로 2개 군으로 나누었다. 군 1에게는 비히클을 투여하였다. 군 2에게는 티보자닙을 매일 5 mg/kg씩 경구 위관영양시켰다. 종양을 매주 2회 캘리퍼로 측정하였고, 종양 부피를 계산하였다.
이들 연구 결과, 티보자닙에 대해 반응하여 성장 억제에 있어서 상당한 종양-대-종양 변이가 드러났다. 이러한 반응에 있어서의 변이는 예상된 것이었는데, 이는 마우스 모델 종양이 자발적으로 발생하는 종양으로부터 증식되어 왔으므로, 종양형성에 기여한 상이한 2차 신생 돌연변이 세트를 함유하는 것으로 예상되었기 때문이다. 약물 반응에 있어서의 변이는 유용하고 바람직한데, 이는 이것이 천연 발생적 인간 종양에 의해 표시된 종양-대-종양 변이 약물 반응을 모델로 했기 때문이다. 티보자닙-감수성 종양 및 티보자닙-내성 종양은 종양 성장 억제, 조직병리학 및 IHC (CD31)를 기초로 하여 확인 (분류)하였다. 전형적으로, 티보자닙-감수성 종양은 종양 진행을 전혀 나타내지 않았고 (캘리퍼 측정에 의함), 종양을 보유하고 있는 마우스를 5 mg/kg 티보자닙으로 처치한 경우에, 말단 부위를 제외하고는 거의 완전한 종양 사멸이 나타났다.
BH 아카이브 내의 각 종양으로부터의 메신저 RNA (대략 6 ㎍)를, 맞춤형 애질런트 마이크로어레이 (애질런트 마우스 40K 칩)를 사용하여 증폭 및 혼성화시켰다. 통상적인 마이크로어레이 기술을 사용하여 66개 종양 각각으로부터의 조직 샘플 중의 대략 40,000개 유전자의 발현을 측정하였다. 마우스 종양 샘플의 유전자 발현 프로파일을 대조군 샘플 (스트라타젠[Stratagene], cat. #740100-41로부터의 범용 마우스 참조 RNA)과 비교하였고, 특색 추출 및 데이터 정규화를 위해 시판용 특색 추출 소프트웨어 (애질런트 테크놀로지스; 미국 캘리포니아주 산타 클라라)를 사용하였다.
상이한 전사 클러스터 내의 유전자의 평균 (합계) 발현 면에서 티보자닙-감수성 종양과 티보자닙-내성 종양 간의 차이를, 스튜던트 t-검정을 이용하여 평가하였다. 이러한 t-검정은 본질적으로 다음과 같이 수행하였다. 상기 언급된 마이크로어레이 분석으로부터의 유전자 발현 값을 사용하여 각 종양 내의 각 전사 클러스터에 대한 클러스터 점수를 계산하였다. 이어서, 티보자닙-감수성 종양과 티보자닙-내성 종양을 비교하는 2-샘플 t-검정을 적용함으로써 각 전사 클러스터에 대한 p-값을 계산하였다. 가발견율 (FDR)을 또한 계산하였다. 10개의 가장 높은-점수화 전사 클러스터에 대한 p-값 및 가발견율이 표 4에 제시된다.
Figure pct00041
0.005 보다 큰 가발견율을 나타내는 전사 클러스터는 추가 고려로부터 배제시켰다. 2개의 전사 클러스터, 즉 TC50 및 TC48이 0.005 보다 낮은 가발견율을 나타내는 것으로 확인되었다. TC50은 가장 낮은 가발견율, 즉 0.003을 나타내는 것으로 확인되었다. TC50의 고 발현은 티보자닙 내성과 상관이 있다.
본 실시예는 본원에 개시된 방법의 능력을 명확하게 보여준다. 본 실시예에서, 통상적인 마이크로어레이 발현 프로파일링의 수학적 분석은 TC50으로 이어졌는데, 이는 비-VEGF-의존성 혈관형성을 매개할 수 있는 골수 세포의 특정 하위세트와 연관이 있으며, 이로써 티보자닙 내성의 기전을 제공하였다.
실시예 3: 티보자닙에 대한 뮤린 반응을 예측함
실시예 2에서 확인된 티보자닙 PGS (TC50)의 예측 능력을, 실시예 1 및 2에 기재된 바와 같이, 티보자닙을 이용한 실제 약물 반응 시험을 기준으로 하여 티보자닙-감수성 또는 티보자닙-내성으로서 앞서 분류된 25개 종양 집단을 포함한 실험에서 평가하였다. 이들 25개 종양은 구동 종양유전자가 HER2인 원발성 마우스 종양의 독점적 아카이브로부터 유래되었다. 본 실시예에서, 이용된 PGS는 TC50으로부터의 다음 10개-유전자 하위세트였다:
MRC1
ALOX5AP
TM6SF1
CTSB
FCGR2B
TBXAS1
MS4A4A
MSR1
NCKAP1L
FLI1.
통상적인 마이크로어레이 분석에 의해 수득된 유전자 발현 데이터로부터 각각의 종양에 대한 PGS 점수를 계산하였다. 본 발명자들은 하기 알고리즘에 따라서 티보자닙 PGS 점수를 계산하였다:
Figure pct00042
여기서, E1, E2, ... En은 PGS 중의 n개 유전자의 발현 값이다.
이러한 실험으로부터의 데이터는 도 1에 도시된 워터폴 플롯으로서 요약된다. 최적 역치 PGS 점수는 ROC 곡선 분석을 이용하여 역치 결정 분석에서 1.62인 것으로 실험적으로 결정되었다. ROC 곡선 분석으로부터의 결과가 도 2에 요약되어 있다.
이러한 역치를 적용한 경우, 상기 시험은 25개 종양 중에서 22개 종양에 대해 티보자닙-감수성 (반응)인지 아니면 티보자닙-내성 (비-반응)인지를 정확하게 예측해주었다 (도 1). 티보자닙 내성을 예측하는 데 있어서, 가양성률은 25%였고, 가음성률은 0%였다. 이러한 결과의 통계학적 유의성은 피셔의 정확 검정 (문헌 [Fisher, 1922, J. Royal Statistical Soc. 85:87-94]; [Agresti, 1992, Statistical Science 7:131-153] 참조)을 적용하여 반응자에 대한 농축의 p-값을 추정함으로써 평가하였다. 이러한 경우에 피셔의 정확 검정에 대한 분할표(contingency table)가 표 5 (하기)에 제시된다.
Figure pct00043
본 실시예에서, 피셔의 정확 검정 p-값은 0.00722였는데, 이는 단지 우연에 의해 상기 시험 결과를 관찰할 확률이다. 이러한 p-값은 통계학적 유의성, 즉 p = 0.05에 대한 통상적인 컷-오프 보다 6.9배 더 우수하다.
실시예 4: 라파마이신 PGS의 확인
BH 뮤린 종양 아카이브로부터의 종양을 대상으로 하여, 라파마이신 (시롤리무스 또는 RAPAMUNE®로서 공지되기도 함)을 이용한 치료에 대한 감수성에 관하여 시험하였다. 라파마이신 치료에 대한 종양 반응의 평가는 본질적으로 다음과 같이 수행하였다. 매트리겔과 혼합된, 물리적으로 붕괴시킨 종양 세포 (원발성 종양 물질)를 6주생 암컷 BALB/c 누드 마우스에 주사함으로써, 피하 이식된 종양을 확립하였다. 종양 크기가 대략 100 내지 200 mm3에 도달하면, 종양을 보유하고 있는 마우스 20마리를 무작위로 2개 군으로 나누었다. 군 1에게는 비히클을 투여하였다. 군 2에게는 라파마이신을 매일 0.1 mg/kg씩 복강내 주사하였다. 종양을 매주 2회 캘리퍼로 측정하였고, 종양 부피를 계산하였다. 이들 연구 결과, 라파마이신에 대해 반응하여 성장 억제에 있어서 상당한 종양-대-종양 변이가 나타났다. 라파마이신-내성 종양은 50% 이하의 종양 성장 억제를 나타내는 것으로서 규정되었다. 라파마이신-감수성 종양은 50% 초과의 종양 성장 억제를 나타내는 것으로서 규정되었다. 시험된 66개 종양 중에서, 41개가 라파마이신-감수성인 것으로 밝혀졌고, 25개가 라파마이신-내성인 것으로 밝혀졌다.
종양으로부터의 mRNA의 제조, 및 마이크로어레이 분석은 상기 실시예 2에 기재된 바와 같다. 51개 전사 클러스터의 발현 농축 면에서 라파마이신-감수성 종양과 라파마이신-내성 종양 간의 차이를 확인하기 위하여, 본 발명자들은 41개 라파마이신-감수성 종양 및 25개 라파마이신-내성 종양으로부터의 RNA 발현 데이터에 유전자 세트 농축 분석 (GSEA)을 적용하였다. (GSEA에 관한 논의는 문헌 [Subramanian et al., 2005, "Gene set enrichment analysis: A knowledge-based approach for interpreting genome-wide expression profiles," Proc. Natl. Acad. Sci. USA 102: 15545-15550]을 참조할 수 있다).
GSEA를 RNA 발현 데이터에 적용한 결과, 51개 전사 클러스터의 발현 면에서 라파마이신-감수성 군과 라파마이신-내성 군 간에 유의차가 있는 것으로 밝혀졌다. 표 6 (하기)은 감수성 종양 군에 대한 GSEA 결과를 나타낸다. 가발견율 q-값으로써 등급을 매긴 경우, 고 발현을 위해 가장 농축된 전사 클러스터는 TC33인 것으로 밝혀졌다.
Figure pct00044
표 7 (하기)은 내성 종양 군에 대한 GSEA 결과를 나타낸다. 가발견율 q-값으로써 등급을 매긴 경우, 고 발현을 위해 가장 농축된 전사 클러스터는 TC26인 것으로 밝혀졌다.
Figure pct00045
라파마이신-감수성 종양에 대한 최고로 농축된 전사 클러스터 (TC33), 및 라파마이신-내성 종양에 대한 최고로 농축된 전사 클러스터 (TC26)를 사용하여 20개-유전자 라파마이신 PGS (이는 TC33으로부터의 10개 유전자 및 TC26으로부터의 10개 유전자로 이루어진다)를 생성시켰다. 이러한 특별한 라파마이신 PGS는 다음 20개 유전자를 함유하고 있다:
Figure pct00046
상기 PGS는 감수성 종양에서 상향 조절되는 10개 유전자, 및 내성 종양에서 상향 조절되는 10개 유전자를 함유하기 때문에, 하기 알고리즘을 사용하여 라파마이신 PGS 점수를 계산하였다:
Figure pct00047
여기서, E1, E2, ... Em은 감수성 종양에서 상향 조절된 m개-유전자 시그너처(signature)의 발현 값이고 (TC33); F1, F2, ...Fn은 내성 종양에서 상향 조절된 n개-유전자 시그너처의 발현 값이다 (TC26). 상기 실시예에서, m은 10이고, n은 10이다.
실시예 5: 라파마이신에 대한 뮤린 반응을 예측함
실시예 4에서 확인된 라파마이신 PGS의 예측 능력을, 실시예 4에 기재된 바와 같이, 라파마이신을 이용한 실제 약물 반응 시험을 기준으로 하여 라파마이신-감수성 또는 라파마이신-내성으로서 앞서 분류된 66개 종양 집단을 포함한 실험에서 평가하였다. 이들 66개 종양은 구동 종양유전자가 HER2인 원발성 마우스 종양의 독점적 아카이브로부터 유래되었다. 통상적인 마이크로어레이 분석에 의해 수득된 유전자 발현 데이터로부터 각각의 종양에 대한 라파마이신 PGS 점수를 계산하였다. 이러한 실험으로부터의 데이터는 도 3에 도시된 워터폴 플롯으로서 요약된다. 최적 역치 PGS 점수는 ROC 곡선 분석을 이용하여 역치 결정 분석에서 0.011인 것으로 실험적으로 결정되었다. ROC 곡선 분석으로부터의 결과가 도 4에 요약되어 있다.
이러한 역치를 적용한 경우, 상기 시험은 66개 종양 중에서 45개 종양에 대해 라파마이신-감수성 (반응)인지 아니면 라파마이신-내성 (비-반응)인지를 정확하게 예측해주었다 (도 3) (즉, 68.2%). 라파마이신 내성을 예측하는 데 있어서, 가양성률은 16%였고, 가음성률은 41%였다. 이러한 결과의 통계학적 유의성은 피셔의 정확 검정 (문헌 [Fisher, 상기 참조; Agresti, 상기 참조])을 적용하여 반응자에 대한 농축의 p-값을 추정함으로써 평가하였다. 이러한 경우에 피셔의 정확 검정에 대한 분할표가 표 8에 제시된다.
Figure pct00048
본 실시예에서, 피셔의 정확 검정 p-값은 0.000815였다. 이는 단지 우연에 의해 상기 시험을 관찰할 확률이 0.000815였다는 것을 의미하는데, 이는 단지 우연에 인해 상기 시험 결과를 관찰할 확률이다. 이러한 p-값은 통계학적 유의성, 즉 p = 0.05에 대한 통상적인 컷-오프 보다 61.4배 더 우수하다.
실시예 6: 유방암 예후 PGS의 확인
295개 유방 종양 집단 (NKI 유방암 데이터세트)을 사용하여, 원격 전이까지의 간격이 긴 종양 (양호한 예후, 5년 이내에 전이가 없음)으로부터 원격 전이까지의 간격이 짧은 종양 (불량한 예후, 5년 이내에 전이됨)을 분리시켰다. 295개 NKI 유방 종양 중에서, 196개 샘플은 예후가 좋았고, 78개 샘플은 예후가 나빴다.
NKI 유방 데이터세트로부터의 196개의 양호한 예후 종양을 NKI 유방 데이터세트로부터의 78개의 불량한 예후 종양과 비교한 경우에, 생물학적 경로를 나타내는 시차적으로 발현된 유전자 세트를 확인하였다. 양호한 예후 종양과 불량한 예후 종양 간의 경로 유전자 목록 농축 상의 차이는, 51개 전사 클러스터에 대하여 유전자 세트 농축 분석 (GSEA)을 이용함으로써 평가하였다. 양호한 예후 종양과 불량한 예후 종양을 비교하는 데 있어서의 본 발명자들의 분석 결과, 그의 구성원 유전자가 발현에 있어 유의차를 나타내는 전사 클러스터 중에서, TC35 (리보솜과 연관됨)가 양호한 예후 군 중에서 최고로 과발현된 전사 클러스터라는 사실이 증명되었다 (표 9).
Figure pct00049
표 10에 제시된 GSEA 결과로 나타낸 바와 같이, TC26 (증식과 연관됨)이 불량한 예후 군 중에서 최고로 과발현된 클러스터이다.
Figure pct00050
양호한 예후 종양에 대한 최고로 농축된 전사 클러스터 (TC35), 및 불량한 예후 종양에 대한 최고로 농축된 전사 클러스터 (TC26)를 사용하여 20개-유전자 유방암 예후 PGS (이는 TC35로부터의 10개 유전자 및 TC26으로부터의 10개 유전자로 이루어진다)를 생성시켰다. 이러한 특별한 유방암 PGS는 다음 20개 유전자를 함유하고 있다:
Figure pct00051
유방암 예후 PGS는 양호한 예후 종양에서 상향 조절되는 10개 유전자, 및 불량한 예후 종양에서 상향 조절되는 10개 유전자를 함유하기 때문에, 하기 알고리즘을 사용하여 유방암 예후 PGS 점수를 계산하였다:
Figure pct00052
여기서, E1, E2, ... Em은 양호한 예후 종양에서 상향 조절된 m개-유전자 시그너처의 발현 값이고 (TC35); F1, F2, ...Fn은 불량한 예후 종양에서 상향 조절된 n개-유전자 시그너처의 발현 값이다 (TC26). 상기 실시예에서, m은 10이고, n은 10이다.
실시예 7: 유방암 예후 PGS 의 검증
실시예 6 (상기)에서 확인된 예후 PGS를 독립적인 유방암 데이터세트, 즉 왕 유방암 데이터세트 (문헌 [Wang et al., 2005, Lancet 365:671-679] 참조)에서 검증하였다. 왕 유방암 데이터세트로부터의 286개 유방 종양 집단을 독립적인 검증 데이터세트로서 사용하였다. 왕 데이터세트 내의 샘플은 전체 생존 시간 및 사건 (죽었는지 안 죽었는지)을 포함한 임상 주석을 갖고 있었다. 실시예 6에서 확인된 20개-유전자 유방암 예후 PGS는 환자 성과에 대한 유효한 예측변수였다. 이는 카플란-마이어 생존자 곡선을 비교한 도 5에 도시되어 있다. 이러한 카플란-마이어 플롯은 시간 경과 (수 개월)에 따라 생존하는 환자의 비율(%)을 도시한다. 상부 곡선은 고 PGS 점수 (역치 위의 점수)를 갖는 환자를 나타내는데, 이러한 환자는 실제 생존 기간이 비교적 더 길었다. 하부 곡선은 저 PGS 점수 (역치 아래 점수)를 갖는 환자를 나타내는데, 이러한 환자는 실제 생존 기간이 비교적 더 짧았다. 콕스 비례 위험 퇴행 모델 분석은 TC35 및 TC26으로부터 생성된 PGS가 유효한 예후 바이오마커 (p 값은 4.5e-4이고 위험률은 0.505이다)라는 것을 보여주었다.
실시예 8: 인간 반응을 예측함
다음 예언적 실시예는 당업자가 TaqMan® 데이터를 이용하여 티보자닙에 대한 인간 반응을 예측하기 위해 본원에 개시된 방법을 어떻게 사용할 수 있었는지를 상세히 예시하고 있다.
소정의 종양 유형 (예를 들어, 신세포 암종)에 관해서는, 종양 샘플 (아카이브의 FFPE 블록, 신선한 샘플 또는 냉동 샘플)을, 티보자닙으로 환자를 치료하기에 앞서 인간 환자로부터 수득한다 (병원 또는 임상 실험실을 통하여 간접적으로 수득한다). 신선하거나 냉동된 종양 샘플을 표준 조직학 과정에 따라서, 10% 중성 완충된 프로말린에 5 내지 10시간 동안 놓아둔 다음, 알콜 탈수시키고 파라핀에 포매시킨다.
RNA를 10 ㎛ FFPE 박편으로부터 추출하였다. 파라핀을 크실렌 추출한 다음 에탄올 세척함으로써 제거하였다. 상업적 RNA 제조 키트를 이용하여 RNA를 단리하였다. 적합한 상업적 키트, 예를 들어 리보그린(RiboGreen)® 형광 방법 (몰레큘라 프로브스[Molecular Probes; 미국 오리건주 유진])을 사용하여 RNA를 정량화하였다. 통상적인 방법에 의해 RNA 크기를 분석하였다.
qRT-PCR용 슈퍼스크립트(Superscript)™ 제1-가닥 합성 키트 (인비트로젠)를 이용하여 역전사를 수행하였다. 총 RNA 및 풀링된 유전자-특이적 프라이머는 각각 10 내지 50 ng/㎕ 및 100 nM (각)으로 존재하였다.
PGS 중의 각 유전자에 대해, 상업적 소프트웨어, 예를 들어 프라이머 익스프레스® 소프트웨어 (어플라이드 바이오시스템즈; 미국 캘리포니아주 포스터 시티)를 이용하여 qRT-PCR 프라이머를 설계하였다. 기기 제조업자 또는 판매인에 의해 권장된 바와 같이, 상업적 합성기 기기 및 적당한 시약을 사용하여 올리고뉴클레오티드 프라이머를 합성하였다. 적합한 상업적 표지화 키트를 이용하여 프로브를 표지시켰다.
TaqMan® 반응을 제조업자의 지시에 따라서 어플라이드 바이오시스템즈 7900HT 기기를 이용하여 384-웰 플레이트에서 수행하였다. PGS 중의 각 유전자의 발현은 반응 웰당 총 RNA 1 ng으로부터 합성된 DNA를 이용하여 5 ㎕ 반응물에서 두 번 되풀이하여 측정하였다. 최종 프라이머 및 프로브 농도는 각각 0.9 μM (각 프라이머) 및 0.2 μM였다. PCR 사이클링을 표준 작동 과정에 따라서 수행하였다. qRT-PCR 신호가 오염성 DNA 보다는 오히려 RNA에 기인한다는 것을 입증하기 위하여, 시험된 각 유전자에 대해, 어떠한 RT 대조군도 동시에 수행하지 않았다. qRT-PCR 동안 소정의 증폭 곡선에 대한 역치 주기는, 프로브 절단으로부터의 형광성 신호가 명시된 형광 역치 환경을 벗어나서 커지는 지점에서 발생한다. 보다 큰 초기 주형을 지닌 시험 샘플은 보다 초기 증폭 주기에서의 역치 값을 초과한다.
모든 샘플 전반에 걸쳐 유전자 발현 수준을 비교하기 위해, 5개 참조 유전자 (그의 발현 수준이 평가된 종양 유형의 모든 샘플 전반에 걸쳐 유사한 하우스키핑 유전자)에 의거한 정규화를 이용하여, 각 검정 웰에서 RNA 질 및 RNA의 전체 질에 있어서의 변이로부터 야기되는 차이를 교정하였다. 각 샘플에 대한 참조 CT (역치 주기)는 참조 유전자의 평균 측정 CT로서 정의된다. 시험 유전자의 정규화된 mRNA 수준은 ΔCT로서 정의되는데, 여기서 ΔCT는 참조 유전자 CT - 시험 유전자 CT이다.
각 종양 샘플에 대한 PGS 점수를 상기 제시된 알고리즘에 따라서 유전자 발현 수준으로부터 계산하였다. 시험된 종양 샘플과 연관된 실제 반응 데이터는 종양 샘플을 공급하는 병원 또는 임상 실험실로부터 수득하였다. 임상 반응은 전형적으로, 적합한 영상화 기술, 예를 들어 CT 스캔으로써 결정되는 바와 같이 종양 수축율, 예를 들어 30% 수축율 면에서 정의된다. 일부 경우에, 인간 임상 반응은 시간, 예를 들어 질병 진행이 없는 생존 시간 면에서 정의된다. 소정의 종양 유형에 대한 최적 역치 PGS 점수는 상기 언급된 바와 같이 계산하였다. 연속해서, 이러한 최적 역치 PGS 점수를 사용하여 새로이 시험된 동일한 종양 유형의 인간 종양이 티보자닙을 이용한 치료에 대해 반응성일 것인지 아니면 비-반응성일 것인지를 예측한다.
참조로 포함
본원에 인용된 각각의 특허 문헌 및 과학 기사의 전체 개시내용은 모든 목적을 위해 참조로 포함된다.
등가표현
본 발명은 그의 본질적 특징으로부터 벗어난 기타 특이적 형태로 구체화될 수 있다. 따라서, 전술된 실시양태들은 본원에 기재된 본 발명을 제한하는 것이 아니라 예시적인 것으로 간주되어야 한다. 본 발명의 범위는 전술된 설명에 의해서라기 보다는 첨부된 특허청구범위로써 표시되고, 본 특허청구범위와 등가의 의미 및 범위 내에 있는 모든 변화가 본원에 포괄될 것이다.

Claims (30)

  1. (a) (i) 특정 항암 약물에 대해 감수성인 것으로 확인된 암성 조직 집단으로부터의 조직 샘플 세트, 및 (ii) 항암 약물에 대해 내성인 것으로 확인된 암성 조직 집단으로부터의 조직 샘플 세트 중에서, 표 1의 전사 클러스터로부터의 유전자의 대표적 수의 발현 수준을 측정하는 단계; 및
    (b) 감수성 집단으로부터의 조직 샘플 세트 내의 유전자의 대표적 수의 발현 수준과 내성 집단으로부터의 조직 샘플 세트 내의 유전자의 대표적 수의 발현 수준 간에 통계학상 유의차가 있는지를 결정하는 단계
    를 포함하며, 감수성 집단 내에서의 유전자 발현 수준이 내성 집단 내에서의 유전자 발현 수준과 유의하게 차이가 있는 유전자의 대표적 수가, 샘플을 항암 약물에 대해 감수성인 것인지 아니면 내성인 것인지로 분류하기 위한 예측 유전자 세트 ("PGS")인,
    암성 조직을 특정 항암 약물 또는 약물 부류에 대해 감수성인 것인지 아니면 내성인 것인지로 분류하기 위해 PGS를 확인하는 방법.
  2. 제1항에 있어서, 감수성 집단의 평균 클러스터 점수와 내성 집단의 평균 클러스터 점수를 비교하는 스튜던트 t-검정(Student's t-test)이, 감수성 집단으로부터의 조직 샘플 세트 내의 유전자의 대표적 수의 발현 수준과 내성 집단으로부터의 조직 샘플 세트 내의 유전자의 대표적 수의 발현 수준 간에 통계학상 유의차가 있는지를 결정하기 위해 사용되는 것인 방법.
  3. 제1항에 있어서, 유전자 세트 농축 분석 (GSEA)이, 감수성 집단으로부터의 조직 샘플 세트 내의 유전자의 대표적 수의 발현 수준과 내성 집단으로부터의 조직 샘플 세트 내의 유전자의 대표적 수의 발현 수준 간에 통계학상 유의차가 있는지를 결정하기 위해 사용되는 것인 방법.
  4. 제1항에 있어서, 유전자의 대표적 수가 10개 이상인 방법.
  5. 제4항에 있어서, 유전자의 대표적 수가 15개 이상인 방법.
  6. 제5항에 있어서, 유전자의 대표적 수가 20개 이상인 방법.
  7. 제1항에 있어서, 조직 샘플이 종양 샘플 및 혈액 샘플로 이루어진 군으로부터 선택되는 것인 방법.
  8. 제1항에 있어서, 단계 (a) 및 (b)가 51개 전사 클러스터 각각에 대해 수행되는 것인 방법.
  9. 제1항에 있어서, 단계 (a)가 (i) 항암 약물에 대해 감수성인 것으로 확인된 암성 조직 집단으로부터의 조직 샘플 세트, 및 (ii) 항암 약물에 대해 내성인 것으로 확인된 암성 조직 집단으로부터의 조직 샘플 세트 중에서, 51개 전사 클러스터 각각을 나타내는 도 6의 10개 유전자의 발현 수준을 측정하는 것을 포함하고,
    단계 (b)가 51개 전사 클러스터 각각을 대상으로 하여, 감수성 집단으로부터의 조직 샘플 세트 내의 상기 클러스터를 나타내는 도 6의 10개 유전자의 발현 수준과 내성 집단으로부터의 조직 샘플 세트 내의 상기 클러스터를 나타내는 도 6의 10개 유전자의 발현 수준 간에 통계학상 유의차가 있는지를 결정하는 것을 포함하며,
    도 6의 상기 클러스터로부터의 10개 유전자에 의해 나타낸 바와 같이, 감수성 집단 내에서의 유전자 발현 수준이 내성 집단 내에서의 유전자 발현 수준과 유의하게 차이가 있는 전사 클러스터가, 샘플을 항암 약물에 대해 감수성인 것인지 아니면 내성인 것인지로 분류하기 위한 PGS인 방법.
  10. 제9항에 있어서, PGS가 다수의 전사 클러스터에 근거하는 것인 방법.
  11. (a) (i) 예후가 양호한 것으로 확인된 암 환자 집단으로부터의 조직 샘플 세트, 및 (ii) 예후가 불량한 것으로 확인된 암 환자 집단으로부터의 조직 샘플 세트 중에서, 표 1의 전사 클러스터로부터의 유전자의 대표적 수의 발현 수준을 측정하는 단계; 및
    (b) 예후가 양호한 집단으로부터의 조직 샘플 세트 내의 유전자의 대표적 수의 발현 수준과 예후가 불량한 집단으로부터의 조직 샘플 세트 내의 유전자의 대표적 수의 발현 수준 간에 통계학상 유의차가 있는지를 결정하는 단계
    를 포함하며, 예후가 양호한 집단 내에서의 유전자 발현 수준이 예후가 불량한 집단 내에서의 유전자 발현 수준과 유의하게 차이가 있는 유전자의 대표적 수가, 환자를 예후가 양호한지 아니면 예후가 불량한지로 분류하기 위한 예측 유전자 세트 ("PGS")인,
    암 환자를 예후가 양호한지 아니면 예후가 불량한지로 분류하기 위해 PGS를 확인하는 방법.
  12. 제11항에 있어서, 예후가 양호한 집단의 평균 클러스터 점수와 예후가 불량한 집단의 평균 클러스터 점수를 비교하는 스튜던트 t-검정이, 예후가 양호한 집단으로부터의 조직 샘플 세트 내의 유전자의 대표적 수의 발현 수준과 예후가 불량한 집단으로부터의 조직 샘플 세트 내의 유전자의 대표적 수의 발현 수준 간에 통계학상 유의차가 있는지를 결정하기 위해 사용되는 것인 방법.
  13. 제11항에 있어서, GSEA가, 예후가 양호한 집단으로부터의 조직 샘플 세트 내의 유전자의 대표적 수의 발현 수준과 예후가 불량한 집단으로부터의 조직 샘플 세트 내의 유전자의 대표적 수의 발현 수준 간에 통계학상 유의차가 있는지를 결정하기 위해 사용되는 것인 방법.
  14. 제11항에 있어서, 유전자의 대표적 수가 10개 이상인 방법.
  15. 제14항에 있어서, 유전자의 대표적 수가 15개 이상인 방법.
  16. 제15항에 있어서, 유전자의 대표적 수가 20개 이상인 방법.
  17. 제11항에 있어서, 조직 샘플이 종양 샘플 및 혈액 샘플로 이루어진 군으로부터 선택되는 것인 방법.
  18. 제11항에 있어서, 단계 (a) 및 (b)가 51개 전사 클러스터 각각에 대해 수행되는 것인 방법.
  19. 제11항에 있어서, 단계 (a)가 (i) 예후가 양호한 것으로 확인된 암 환자 집단으로부터의 조직 샘플 세트, 및 (ii) 예후가 불량한 것으로 확인된 암 환자 집단으로부터의 조직 샘플 세트 중에서, 51개 전사 클러스터 각각을 나타내는 도 6의 10개 유전자의 발현 수준을 측정하는 것을 포함하고,
    단계 (b)가 51개 전사 클러스터 각각을 대상으로 하여, 예후가 양호한 집단으로부터의 조직 샘플 세트 내의 상기 클러스터를 나타내는 도 6의 10개 유전자의 발현 수준과 예후가 불량한 집단으로부터의 조직 샘플 세트 내의 상기 클러스터를 나타내는 도 6의 10개 유전자의 발현 수준 간에 통계학상 유의차가 있는지를 결정하는 것을 포함하며,
    도 6의 상기 클러스터로부터의 10개 유전자에 의해 나타낸 바와 같이, 예후가 양호한 집단 내에서의 유전자 발현 수준이 예후가 불량한 집단 내에서의 유전자 발현 수준과 유의하게 차이가 있는 전사 클러스터가, 환자를 예후가 양호한지 아니면 예후가 불량한지로 분류하기 위한 PGS인 방법.
  20. 제19항에 있어서, PGS가 다수의 전사 클러스터에 근거하는 것인 방법.
  21. 표 1의 각 전사 클러스터로부터의 10개 이상의 유전자에 대한 프로브를 포함하며, 단 전체-게놈 마이크로어레이 칩이 아닌 프로브 세트.
  22. 제21항에 있어서, (a) 마이크로어레이 프로브 세트; (b) PCR 프라이머 세트; (c) qNPA 프로브 세트; (d) 분자 바코드를 포함하는 프로브 세트; 및 (e) 프로브가 비드에 부착되어 있는 프로브 세트로 이루어진 군으로부터 선택되는 프로브 세트.
  23. 제21항에 있어서, 도 6에 열거된 510개 유전자 각각에 대한 프로브를 포함하는 프로브 세트.
  24. 제23항에 있어서, 도 6에 열거된 510개 유전자 각각에 대한 프로브, 및 대조군 프로브로 이루어진 프로브 세트.
  25. (a) (i) 인간 종양으로부터의 샘플 중에서, TC50으로부터의 유전자 10개 이상을 포함하는 예측 유전자 세트 (PGS) 중의 각 유전자의 상대적 발현 수준을 측정하는 단계; 및
    (ii) 하기 알고리즘
    Figure pct00053

    (여기서, E1, E2, ... En은 PGS 중의 n개 유전자의 발현 값임)에 따라서 PGS 점수를 계산하는 단계
    를 포함하며, 규정된 역치 아래의 PGS 점수는 종양이 티보자닙(tivozanib)에 대해 감수성일 것으로 예상된다는 것을 표시하고, 규정된 역치 위의 PGS 점수는 종양이 티보자닙에 대해 내성일 것으로 예상된다는 것을 표시하는 것인,
    인간 종양이 티보자닙을 이용한 치료에 대해 감수성일 것으로 예상되는지 아니면 내성일 것으로 예상되는지 확인하는 방법;
    (b) (i) 인간 종양으로부터의 샘플 중에서, (A) TC33으로부터의 10개 이상의 유전자; 및 (B) TC26으로부터의 10개 이상의 유전자를 포함하는 예측 유전자 세트 (PGS) 중의 각 유전자의 상대적 발현 수준을 측정하는 단계; 및
    (ii) 하기 알고리즘
    Figure pct00054

    (여기서, E1, E2, ... Em은 감수성 종양에서 상향 조절되는, TC33으로부터의 10개 이상의 유전자의 발현 값이고; F1, F2, ...Fn은 내성 종양에서 상향 조절되는, TC26으로부터의 10개 이상의 유전자의 발현 값임)에 따라서 PGS 점수를 계산하는 단계
    를 포함하며, 규정된 역치 위의 PGS 점수는 종양이 라파마이신(rapamycin)에 대해 감수성일 것으로 예상된다는 것을 표시하고, 규정된 역치 아래의 PGS 점수는 종양이 라파마이신에 대해 내성일 것으로 예상된다는 것을 표시하는 것인,
    인간 종양이 라파마이신을 이용한 치료에 대해 감수성일 것으로 예상되는지 아니면 내성일 것으로 예상되는지 확인하는 방법; 및
    (c) (i) 인간 유방암 환자로부터 수득된 종양으로부터의 샘플 중에서, (A) TC35로부터의 10개 이상의 유전자; 및 (B) TC26으로부터의 10개 이상의 유전자를 포함하는 예측 유전자 세트 (PGS) 중의 각 유전자의 상대적 발현 수준을 측정하는 단계; 및
    (ii) 하기 알고리즘
    Figure pct00055

    (여기서, E1, E2, ... Em은 예후가 양호한 환자에서 상향 조절되는, TC35로부터의 10개 이상의 유전자의 발현 값이고; F1, F2, ...Fn은 예후가 불량한 환자에서 상향 조절되는, TC26으로부터의 10개 이상의 유전자의 발현 값임)에 따라서 PGS 점수를 계산하는 단계
    를 포함하며, 규정된 역치 위의 PGS 점수는 상기 환자의 예후가 양호하다는 것을 표시하고, 규정된 역치 아래의 PGS 점수는 상기 환자의 예후가 불량할 것으로 예상된다는 것을 표시하는 것인,
    인간 유방암 환자를 예후가 양호한지 아니면 예후가 불량한지로 분류하는 방법
    으로 이루어진 군으로부터 선택되는, 인간 종양이 티보자닙 또는 라파마이신을 이용한 치료에 대해 감수성일 것으로 예상되는지 아니면 내성일 것으로 예상되는지 확인하거나, 또는 인간 유방암 환자를 예후가 양호한지 아니면 예후가 불량한지로 분류하는 방법.
  26. 제25항에 있어서, (a)에서의 PGS가
    (a) MRC1, ALOX5AP, TM6SF1, CTSB, FCGR2B, TBXAS1, MS4A4A, MSR1, NCKAP1L, 및 FLI1; 및
    (b) LAPTM5, FCER1G, CD48, BIN2, C1QB, NCF2, CD14, TLR2, CCL5, 및 CD163
    으로 이루어진 군으로부터 선택된 TC50의 10개-유전자 하위세트를 포함하는 것인 방법.
  27. 제25항에 있어서, (b)에서의 PGS가 하기 유전자: FRY, HLF, HMBS, RCAN2, HMGA1, ITPR1, ENPP2, SLC16A4, ANK2, PIK3R1, DTL, CTPS, GINS2, GMNN, MCM5, PRIM1, SNRPA, TK1, UCK2, 및 PCNA를 포함하는 것인 방법.
  28. 제25항에 있어서, (c)에서의 PGS가 하기 유전자: RPL29, RPL36A, RPS8, RPS9, EEF1B2, RPS10P5, RPL13A, RPL36, RPL18, RPL14, DTL, CTPS, GINS2, GMNN, MCM5, PRIM1, SNRPA, TK1, UCK2, 및 PCNA를 포함하는 것인 방법.
  29. 제25항에 있어서, 역치 결정 분석을 수행함으로써 규정된 역치를 생성시키는 단계를 추가로 포함하며, 역치 결정 분석이 수신자 작동자 특성 곡선 분석을 포함하는 것인 방법.
  30. 제25항에 있어서, PGS 중의 각 유전자의 상대적 발현 수준이 (a) DNA 마이크로어레이 분석, (b) qRT-PCR 분석, (c) qNPA 분석, (d) 분자 바코드-기반 검정, 및 (e) 다중 비드-기반 검정으로 이루어진 군으로부터 선택된 방법에 의해 측정되는 것인 방법.
KR1020147020032A 2011-12-22 2012-11-05 다유전자 바이오마커의 확인 KR20140105836A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161579530P 2011-12-22 2011-12-22
US61/579,530 2011-12-22
PCT/US2012/063579 WO2013095793A1 (en) 2011-12-22 2012-11-05 Identification of multigene biomarkers

Publications (1)

Publication Number Publication Date
KR20140105836A true KR20140105836A (ko) 2014-09-02

Family

ID=47297430

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020147020032A KR20140105836A (ko) 2011-12-22 2012-11-05 다유전자 바이오마커의 확인

Country Status (8)

Country Link
US (2) US20130165337A1 (ko)
EP (1) EP2794911A1 (ko)
JP (1) JP2015503330A (ko)
KR (1) KR20140105836A (ko)
CN (1) CN104093859A (ko)
AU (1) AU2012355898A1 (ko)
CA (1) CA2859663A1 (ko)
WO (1) WO2013095793A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018169251A1 (ko) * 2017-03-16 2018-09-20 서울대학교산학협력단 삼중음성 유방암의 항암제에 대한 반응 및 예후 측정용 바이오마커

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2868522A1 (en) 2012-03-26 2013-10-03 Pronutria, Inc. Charged nutritive proteins and methods
AU2013240271A1 (en) 2012-03-26 2014-10-02 Axcella Health Inc. Nutritive fragments, proteins and methods
EP3715365A1 (en) * 2012-03-26 2020-09-30 Axcella Health Inc. Nutritive fragments, proteins and methods
WO2014089055A1 (en) * 2012-12-03 2014-06-12 Aveo Pharmaceuticals, Inc. Tivozanib response prediction
EP3033625B1 (en) 2013-08-13 2020-01-22 The Scripps Research Institute Cysteine-reactive ligand discovery in proteomes
CA2925521A1 (en) 2013-09-25 2015-04-02 Pronutria Biosciences, Inc. Compositions and formulations for prevention and treatment of diabetes and obesity, and methods of production and use thereof in glucose and caloric control
WO2015082880A1 (en) * 2013-12-02 2015-06-11 Astrazeneca Ab Methods of selecting treatment regimens
KR101514762B1 (ko) * 2014-05-15 2015-05-20 연세대학교 산학협력단 mRNA 발현 값의 발현 차이를 이용하여 유전자 집합을 검출하기 위한 장치 및 그 방법
WO2015185656A1 (en) 2014-06-05 2015-12-10 Medizinische Universität Wien Methods of diagnosing chronic obstructive pulmonary disease (copd) using novel molecular biomarkers
US10604806B2 (en) 2014-06-05 2020-03-31 Transgenion—International Institute for Regenerative Translational Medicine GmbH Methods of diagnosing chronic obstructive pulmonary disease (COPD) using novel molecular biomarkers
EP3152328A2 (en) * 2014-06-05 2017-04-12 Transgenion-International Institute For Regenerative Translational Medicine Gmbh Methods of diagnosing chronic obstructive pulmonary disease (copd) using novel molecular biomarkers
US10288619B2 (en) * 2014-06-24 2019-05-14 Case Western Reserve University Biomarkers for human monocyte myeloid-derived suppresor cells
WO2016160544A1 (en) * 2015-03-27 2016-10-06 The Scripps Research Institute Lipid probes and uses thereof
EP3387430A4 (en) * 2015-12-11 2019-08-14 Expression Pathology, Inc. SRM / MRM DOSINGS
US10934590B2 (en) * 2016-05-24 2021-03-02 Wisconsin Alumni Research Foundation Biomarkers for breast cancer and methods of use thereof
US20190194760A1 (en) * 2016-05-25 2019-06-27 Curevac Ag Novel biomarkers
WO2018128544A1 (en) * 2017-01-06 2018-07-12 Agendia N.V. Biomarkers for selecting patient groups, and uses thereof.
CA3050260A1 (en) 2017-01-18 2018-07-26 The Scripps Research Institute Photoreactive ligands and uses thereof
JP7034183B2 (ja) 2017-06-13 2022-03-11 ボストンジーン コーポレイション 免疫チェックポイント遮断療法に対するレスポンダー及び非レスポンダーを特定するためのシステム及び方法
CN113683700B (zh) * 2017-06-22 2023-05-02 北海康成(北京)医药科技有限公司 预测食管癌对抗erbb3抗体治疗的应答的方法和试剂盒
CN107760683A (zh) * 2017-10-24 2018-03-06 徐州蓝湖信息科技有限公司 抑制HMGA1基因表达的siRNA及其应用
CN108441559B (zh) * 2018-02-27 2021-01-05 海门善准生物科技有限公司 一种免疫相关基因群作为标志物在制备评估高增殖性乳腺癌远处转移风险的产品中的应用
CN110295230A (zh) * 2018-03-23 2019-10-01 中山大学 分子标志物inhba和spp1及其应用
CN110554195B (zh) * 2018-05-30 2023-09-08 中国科学院分子细胞科学卓越创新中心 来源于人外周血cd8+t细胞的生物标志物在胰腺癌预后中的应用
WO2021211057A1 (en) * 2020-04-14 2021-10-21 National University Of Singapore Method of predicting the responsiveness to a cancer therapy
CN112578116A (zh) * 2020-11-05 2021-03-30 南京师范大学 Clu和prkd3及其下调或抑制剂在三阴性乳腺癌检测分型和治疗及疗效评估中的应用
CN113025716A (zh) * 2021-03-02 2021-06-25 北京大学第一医院 一种用于人肿瘤分级的基因组合及其用途
CN113755596B (zh) * 2021-10-13 2023-04-07 复旦大学附属眼耳鼻喉科医院 一种检测喉鳞癌放疗敏感性相关基因atm和atr基因突变的试剂盒及其应用
CN113862398A (zh) * 2021-10-26 2021-12-31 中国科学院过程工程研究所 一种用于扩增SARS-CoV-2的CAMP引物组及试剂盒
CN114480643A (zh) * 2022-01-07 2022-05-13 佳木斯大学 检测fam153a表达水平的试剂的应用和试剂盒
CN115678994A (zh) * 2022-01-27 2023-02-03 上海爱谱蒂康生物科技有限公司 一种生物标志物组合、含其的试剂及其应用
CN114574596B (zh) * 2022-03-11 2023-06-23 浙江省农业科学院 SNPs分子标记g.43851G>A及其在湖羊分子标记辅助育种中的应用
CN114807371A (zh) * 2022-05-07 2022-07-29 深圳市人民医院 检测样本中htr6的试剂在制备低级别胶质瘤的预后产品中的应用
CN115261482B (zh) * 2022-10-08 2022-12-09 暨南大学 miR-4256在胃癌治疗、诊断以及预后评估中的应用
CN116312802B (zh) * 2023-02-01 2023-11-28 中国医学科学院肿瘤医院 一种特征基因trim22用于制备调控乳腺癌相关基因表达的试剂的应用
CN116500268B (zh) * 2023-04-23 2024-04-09 武汉大学人民医院(湖北省人民医院) 与骨肉瘤相关的hox基因的用途
CN116814700B (zh) * 2023-08-03 2024-01-30 昆明医科大学第一附属医院 Acsm5-p425t在构建治疗宣威肺癌药物检测模型中的应用

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2542656A1 (en) 2003-10-16 2005-05-06 Genomic Health, Inc. Qrt-pcr assay system for gene expression profiling
WO2006135886A2 (en) * 2005-06-13 2006-12-21 The Regents Of The University Of Michigan Compositions and methods for treating and diagnosing cancer
WO2008073878A2 (en) * 2006-12-11 2008-06-19 Board Of Regents, The University Of Texas System Gene expression profiling of esophageal carcinomas
US20110178154A1 (en) * 2007-02-06 2011-07-21 Birrer Michael J gene expression profile that predicts ovarian cancer subject response to chemotherapy
WO2009102957A2 (en) * 2008-02-14 2009-08-20 The Johns Hopkins University Methods to connect gene set expression profiles to drug sensitivity
US7615353B1 (en) * 2009-07-06 2009-11-10 Aveo Pharmaceuticals, Inc. Tivozanib response prediction
WO2011039734A2 (en) * 2009-10-02 2011-04-07 Enzo Medico Use of genes involved in anchorage independence for the optimization of diagnosis and treatment of human cancer

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018169251A1 (ko) * 2017-03-16 2018-09-20 서울대학교산학협력단 삼중음성 유방암의 항암제에 대한 반응 및 예후 측정용 바이오마커
US11339446B2 (en) 2017-03-16 2022-05-24 Seoul National University R&Db Foundation Biomarker for measurement of response and prognosis of triple-negative breast cancer to anticancer agent

Also Published As

Publication number Publication date
CN104093859A (zh) 2014-10-08
CA2859663A1 (en) 2013-06-27
EP2794911A1 (en) 2014-10-29
WO2013095793A1 (en) 2013-06-27
JP2015503330A (ja) 2015-02-02
US20130165343A1 (en) 2013-06-27
US20130165337A1 (en) 2013-06-27
AU2012355898A1 (en) 2014-07-10

Similar Documents

Publication Publication Date Title
KR20140105836A (ko) 다유전자 바이오마커의 확인
JP6246845B2 (ja) 遺伝子発現を用いた前立腺癌の予後を定量化する方法
EP2553118B1 (en) Method for breast cancer recurrence prediction under endocrine treatment
JP6219824B2 (ja) びまん性大細胞型b細胞性リンパ腫(dlbcl)患者における抗−cd20療法に対する応答の予測
US20110123990A1 (en) Methods To Predict Clinical Outcome Of Cancer
EP3532642B1 (en) Digital analysis of blood samples to determine efficacy of cancer therapies for specific cancers
EP2121988B1 (en) Prostate cancer survival and recurrence
JP2014509189A (ja) 結腸ガン遺伝子発現シグネチャーおよび使用方法
US9410205B2 (en) Methods for predicting survival in metastatic melanoma patients
US20120040848A2 (en) Molecular signature of liver tumor grade and use to evaluate prognosis and therapeutic regimen
US7615353B1 (en) Tivozanib response prediction
WO2014089055A1 (en) Tivozanib response prediction
US20180051342A1 (en) Prostate cancer survival and recurrence
US20210079479A1 (en) Compostions and methods for diagnosing lung cancers using gene expression profiles
US20210371937A1 (en) Method for identifying high-risk aml patients
US20150329911A1 (en) Nucleic acid biomarkers for prostate cancer
EP2633068A1 (en) Metagene expression signature for prognosis of breast cancer patients
US20150072878A1 (en) Stratification of Left-Side and Right-Side Colon Cancer

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid