KR102297935B1 - 유전자형 및 표현형 바이오마커를 사용하는 무증상 혈뇨를 갖는 환자의 분류 - Google Patents

유전자형 및 표현형 바이오마커를 사용하는 무증상 혈뇨를 갖는 환자의 분류 Download PDF

Info

Publication number
KR102297935B1
KR102297935B1 KR1020167016582A KR20167016582A KR102297935B1 KR 102297935 B1 KR102297935 B1 KR 102297935B1 KR 1020167016582 A KR1020167016582 A KR 1020167016582A KR 20167016582 A KR20167016582 A KR 20167016582A KR 102297935 B1 KR102297935 B1 KR 102297935B1
Authority
KR
South Korea
Prior art keywords
patients
index
il8rb
hematuria
patient
Prior art date
Application number
KR1020167016582A
Other languages
English (en)
Other versions
KR20160126972A (ko
Inventor
마크 댈핀
데이비드 달링
제임스 밀러 수티
레이모니스 캐벌리에리스
폴 오설리번
새티쉬 쿠마르
Original Assignee
퍼시픽 에지 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 퍼시픽 에지 리미티드 filed Critical 퍼시픽 에지 리미티드
Publication of KR20160126972A publication Critical patent/KR20160126972A/ko
Application granted granted Critical
Publication of KR102297935B1 publication Critical patent/KR102297935B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57484Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/60Complex ways of combining multiple protein biomarkers for diagnosis

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Cell Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Food Science & Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

요로상피 암(UC)의 저 위험인 혈뇨를 갖는 환자를 식별하는 신규한 방법은 선별된 표현형적 변수를 유전자형적 발현 수준과 신규한 측정법(metric), "G+P 지수"로 함께 조합하는 것을 포함한다. G+P 지수는 연령, 성, 흡연력, 혈뇨의 존재, 및 혈뇨의 빈도를 유전자 마커 MDK, CDC2, HOXA13, IGFBP5 및 임의로 IL8Rb의 유전자형 발현과 조합하는 단계, 그 후 환자에 대하여 얻어진 상기 G+P 지수 값이 3 가지 그룹 (1) UC 고위험인, (2) UC 위험인 또는 (3) UC 저위험인 것 중 하나임을 결정하는 단계를 포함한다.

Description

유전자형 및 표현형 바이오마커를 사용하는 무증상 혈뇨를 갖는 환자의 분류 {TRIAGING OF PATIENTS HAVING ASYMPTOMATIC HEMATURIA USING GENOTYPIC AND PHENOTYPIC BIOMARKERS}
우선권 주장
본 출원은 2013년 11월 21일 출원된 미국 가출원 제61/907,013호; 발명자 데이비드 달링, 새티쉬 쿠마르, 마크 달팡, 및 폴 오설리반에 대한 우선권을 주장한다. 이 가출원은 본 발명에 참조로서 전체가 포함된다.
발명의 분야
본 발명은 질병을 갖지 않는 환자의 검출에 관한 것이다. 구체적으로, 이 발명은 암 없이 혈뇨를 나타내는 환자들을 분류(triaging)하기 위한 유전자형 마커 및 표현형 마커의 이용에 관한 것이다. 특히, 이 발명은 거시적 또는 미시적 혈뇨 환자를 분류하는데 있어서 유전자형 마커 및 표현형 마커의 분석에 관한 것이다. 더욱 특히, 이 발명은 무증상의 거시적 또는 미시적 혈뇨 환자를 분류하고, 환자의 상태가 추가적인 임상적 과정을 청하는지를 예측하기 위한 유전자형 및 표현형 마커의 조합 이용에 관한 것이다.
암 환자의 생존율은 암이 조기에 치료되는 경우 크게 향상된다. 방광암의 경우, 1차 부위에 국한되는 질병인 것으로 진단받은 환자의 5년 생존율은 73%로서, 전이성 질병으로 진단된 환자들에 대한 6%와 비교된다(Altekruse et al). 그러므로, 방광암의 조기 및 정확한 진단으로 이어지는 조사는 화자의 예후 향상을 이끌어낼 수 있다. 조기 암 검출을 돕기 위하여 다수의 암 특이적 마커들이 동정되었다. 그러나, 이들 마커의 이용은 방광암이 아니라, 염증성 방광 질병을 앓고 있는 환자들에게 있어 거짓 양성 결과를 낳을 수 있다.
무증상 혈뇨(Asymptomatic hematuria, AH)는 집단에 따라 2% 내지 30%의 발생률을 갖는, 가장 빈번한 비뇨기과 결과 중 하나이다(Schwartz G: Proper evaluation of asymptomatic microscopic hematuria in the era of evidence-based medicine-progress is being made. Mayo Clin Proc. 2013, 88(2); 123-125, McDonald M, Swagerty D, Wetzel L: Assessment of Microscopic hematuria in adults. AFP 2006 73:10, Grossfield G, Wolf J, Litwan M, Hricak H, Shuler C, Agerter D, et al. Asymptomatic microscopic hematuria in adults: summary of AUA best practice policy recommendations. AFP 2001:63:1145-54). 그러나, AH는 AH 집단 중 1.9-7%에 이르는 요로 악성 종양에 대한 광범위한 병리의 표지이다. 모든 AH 환자에 대한 전(全)진단 작업은 많은 헬스케어 시스템에 상당한 부담을 준다. 고위험 및 저위험 환자를 분리하기 위한 표현형 지표 이용이 Loo et al.의 최근 연구에서 연구되었다(Loo R, Lieberman S, Slezak J, Landa H, Mariani A, Nicolaisen G, Aspera A and Jaconsen S: Stratifying risk of urinary tract malignant tumors in patients with asymptomatic microscopic hematuria. Mayo Clin Proc. 2013, 88(2); 129-138).
확인된 AH를 나타내는 4414명의 환자에 대한 전술한 연구는 환자 중 73%가 어떠한 확인된 원인이 없었으나, 환자 중 26%는 원인을 확인할 어떤 형태의 비뇨기적 작업을 청하였음을 보여주었다. AH를 나타내는 환자들 중 대략 2.5%가 다른 진단을 구성하는 요로 감염(UTI)(2.3%), 신장 결석(16.2%), 전립선 출혈(4%) 및 오염(0.4%)과 같은 기타 질환과 함께, 요로상피 악성 종양으로 진단되었다(Loo et al., Id.).
본 발명의 발명자들은, 이름하여 방광암을 앓고 있지 않거나 그 위험이 낮은 혈뇨를 나타내는 환자들을 어떻게 확인할 것인가하는 이 분야의 새로운 과제를 확인하였다. 이는 방광암이 아닌 많은 혈뇨 환자들이, 그러한 진단이 필요하지 않은 경우에 값비싸고 침습적인 추가적인 진단을 경험할 수 있다는 문제를 해결한다. 따라서, 본 발명은, 유전자형 정보 및 표현형 정보의 조합이 방광암을 앓고 있지 않거나 그 위험이 낮은 환자에 대한 식별을 제공하는 경우, 개체들을 방광암에 대한 온전한 진단과 관련된 위험 및 비용으로부터 제외시키고, 암성의 상태, 예컨대 요로상피 암종, 이행 세포 암종(TCC) 및 비암성의 상태, 예컨대 염증성 질환을 앓고 있는 환자들로부터 암이 아닌 환자들을 효과적으로 분류하는데 유용하다. 본 발명은, 이것이 암을 진단하는 것이 아니라 오히려 비(非)-암을 진단하는데 예측치 않게 유용하다는 점에서, 새로운 과제에 대한 새로운 접근을 제시한다. 유전자형 및 표현형 기준을 조합하여 이용하는 것은 유전자형 또는 표현형 변수들 중 하나를 단독으로 이용하는 것보다 예측치 못하게도 더 나은 구별을 제공한다. 데이터는 CLIA 표준하에서 검증되고, 내부 검증을 위하여 부트스트랩 절차를 이용하는 CURT + North Shore 제품 시험으로부터 541 개 관찰로부터 얻었다. 표현형 변수들은 (1) 흡연력, (2) 혈뇨, (3) 성별, (4) 연령의 제시를 포함하였다. 유전자형 변수는 IGF, HOXA13, MDK, CDC, 및 IL8R의 발현 분석을 포함하였다. 유전자형 + 표현형 모델("G+P")는 유전자형 또는 표현형 중 하나의 변수 단독보다 예기치 않게 더 우수한 성능이었다.
육안 혈뇨, 또는 소변 내 시각적으로 확인되는 혈이 발견되는 것은 방광암 환자에서 흔한 결과이다. 이들 환자에게, 방광암을 진단하기 위한 추가적인 진단 과정을 시행하는 것은 종종 표준적 실시이다. 그러나, 미세 혈뇨 환자를 쉽게 식별하고 요로상피 암종의 미세 혈뇨의 의미를 이해하는 것이 과제로 남아 있었다.
본 발명의 발명자들은 본 발명에서 육안 혈뇨 또는 미세 혈뇨 중 어느 하나를 나타내는 환자가, 그러한 환자가 방광암을 가질 확률이 충분히 낮아서 추가적인 절차를 수행하지 않을 것을 청한다면, 방광암을 포함하는 요로상피 암종(urothelial carcinoma, UC)를 검출하는 추가적인 침습적이고 값비싼 임상적 절차를 회피할 수 있는지 여부를 결정하는 개선된 방법을 제공한다.
요로상피 암종(UC)의 확률을 높이는 원인이 되는 인자들이 알려져 있다. 인구학적 인자, 예컨대 성별, 인종 및 연령 뿐 아니라, 환경적 인자, 예컨대 흡연력 및 방향족 아민에의 직업적 노출 등이 UC 발병 위험에 크게 기여한다. 이러한 인자들에 기초한 헬스케어 평가에서 환자를 특징짓는 것은 통상 애드-호크(ad-hoc) 기준으로 사용된다. 예컨대, 혈뇨를 나타내는 흡연력의 60 세 남성은, 동일한 증상을 나타내는 비흡연 35세 여성에 비해 UC에 양성일 확률이 더 높지만, 이들 차이는 정량되어 UC인 환자의 총 확률에 기여하지는 않았다. 다양한 유전자형 및 표현형 인자에 특이적인 가중치를 귀속시키고 이들을 진단 시험 결과와 결부시키는 것은 비침습적 시험의 진단력의 정확도에 크게 추가될 수 있고 임상의들이 임상 및 바이오마커 시험 결과에 의하여 정의되는바 UC를 가질 그들의 확률에 기초하여 환자들을 분리하는데 더 큰 확실성을 제공할 수 있다.
방광암의 존재를 검출하는데 이용 가능한 방법들이 있으나, 환자가 방광암을 갖지 않거나, 그 위험이 낮은지 여부를 결정하기 위한 믿을만하고 정확한 방법은 없다. 이러한 요구를 해결하기 위하여, 본 발명의 발명자들은 혈뇨, 육안 혈뇨 또는 미세 혈뇨 중 어느 하나를 나타내는 환자들에서 암성의 상태를 비암성인 상태와 구별하기 위한 신규한 분석 방법을 계발하였다. 본 발명의 몇 가지 측면에 있어서, 본 발명의 발명자들은 UC의 확률이 높은 AH 환자들로부터 UC를 가질 확률이 낮은 AH 환자들을 효과적으로 분류해 내기 위하여, 정량화된 표현형 변수들과 정량화된 유전자형 마커들의 발현을 조합하여 배합된 분리 지수("G+P 지수")를 형성한다. 이러한 분리는 온전한 진단을 필요로 하는 환자들로부터 온전한 비뇨기과 진단을 필요로 하지 않는 환자들을 정의함으로써 UC 확률이 낮은 환자들에게 불필요한 진단을 피하도록 한다.
표현형적 분석
G+P 지수에서 평가되는 표현형적 변수들은 혈뇨의 빈도(HFREQ), 연령, 성별, 흡연력 및 적혈구수(RBC)를 포함한다. 이들 용어는 아래에 정의된다. 표현형적 변수들은 본 발명에서 임상적 결과 및 관찰을 포함하는 것으로 정의된다.
유전자형적 분석
일반적으로, Pacific Edge Ltd.에 의하여 계발된 양호한 유전자형적 분석은 유전자형 마커인 CDC2, HOXA13, MDK 및 IGFBP5의 발현 정량을 포함한다("4-마커 분석"). 또 다른 양호한 분석에 있어서, 상기 4 개의 마커와 제5의 마커, IL8R이 정량된다("5-마커" 또는 Cxbladder® 분석; Pacific Edge Ltd.의 상표, Dunedin, New Zealand)(Holyoake A, O'Sullivan P, Pollock R et al: Development of a multiplex RNA urine test for the detection and stratification of transitional cell carcinoma of the bladder. Clin Cancer Res 2008;14: 742, and O’Sullivan P, Sharples K, Dalphin M et al: A Multigene Urine Test for the Detection and Stratification of Bladder Cancer in Patients Presenting with Hematuria. J Urol 2012, Vol. 188 No 3; 746), 및 국제특허출원 No. PCT/NZ2011/000238, 제목 "Novel Markers for Detection of Bladder Cancer" 이들 문헌들 및 특허 출원 각각은 마치 독립적으로 포함되는 것과 같이 본 발명에 참조로서 전체가 포함된다.
양호한 구현예에 있어서, 4-마커 분석은 PCR을 이용하여 미분획된 소변에 대하여 수행되어 4 가지 mRNA 마커(CDC2, HOXA13, MDK 및 IGFBP5에 대한)를 정량할 수 있는데, 이들은 요로상피 암종에서 과발현되는 것이다. IL8R은 호중구에서 매우 과발현되고, 결과적으로 비-악성 염증성 상태에서 상승된다. 이러한 제5의 mRNA 마커의 포함은 이행 세포 암종(TCC)의 거짓 양성 검출 위험을 현저히 감소시킨다. 환자의 관점에서, 상기 시험은 비침습적이고 매우 간단하다. 종종 중간뇨이지만 배타적이지는 않은 하나의 소변 시료가 취해지고, 이는 종종 내원없이 가정에서 이루어질 수 있다.
Cxbladder® 분석은 육안 혈뇨를 나타내는 환자들에서 세포학보다 매우 더 민감한 것으로 나타났다. 가장 괄목하게는, Cxbladder® 분석은 Ta 이상의 단계인 모든 요로상피 암종에 대하여 100% 민감도를 달성하고(기정된 특이도 85%로), 모든 고등 등급 종양에 대하여 97%를 달성하였다. Cxbladder® 분석은 화자 소변에서 나타나는 5 개 유전자들의 정량적 유전자 발현을 조합한 하나의 수치 점수에 근거한다. 상기 점수는 그 환자가 요로상피 암종을 가질 확률에 근거하여 환자들을 3 가지 부류로 분리한다.
혈뇨(육안 혈뇨 또는 미세 혈뇨 중 어느 하나)를 나타내는 환자들에게, 본 발명은 동일한 시간 기간에 걸쳐 환자로부터 수집된 표현형적 변수들을 더함으로써 이들 유전자형 수단(4-마커 분석 또는 Cxbladder® 분석)을 강화하고, 이들을 신규한 수단, 환자의 요로상피 암종("UC")을 가질 확률에 관하여 환자들을 3 가지 정의된 위험 부류로 분리하는데 사용될 수 있는 지수로 조합하는 것으로 나타났다.
측면
본 발명의 측면들이 다음에 설명된다. 이들이 본 발명의 유일한 측면들이나 구현예들이 아님을 이해할 수 있다. 당업자는 하나 이상의 측면을 조합하여 추가적인 측면들 또는 구현예들을 생성할 수 있다.
한 가지 측면은 혈뇨를 나타내는 환자에서 요로상피 암을 가질 위험 수준을 결정하는 방법을 포함하는데, 이 방법은:
상기 환자로부터 소변 시료를 제공하는 단계;
상기 시료에서 인간 MDK, CDC2, HOXA13, 및 IGFBP5의 발현 수준을 정량하는 것을 포함하는, MI 값을 정량하는 단계;
상기 환자의 표현형적 변수 HFREQ, AgeGT, 성, SMK, 및 RBC를 평가하는 단계;
식 (i), G+P 지수 = (1*HFREQ+3*Gender+4*SMK) + (5*M1+2*IL-8), 또는
식 (ii), G+P 지수 = (w1*HFREQ+w2*AgeGT50+w3*Gender+w4*SMK+w5*RBC) + (w6*M1+w7*IL-8), 또는
G+P 지수 = -8.46 + 0.79 IGF -1.60 HOXA + 2.10 MDK + 0.95 CDC - 0.38 IL8R + 0.98 SNS + 0.56 Hfreq + 1.11 Gender + 0.64 Age
중 하나에 따라 G+P 지수를 계산하는 단계; 및
상기 G+P 지수가, 상기 환자가 요로상피 암을 가지는 위험 수준을 표시하는 문턱값보다 큰지 여부를 결정하는 단계
를 포함한다.
추가적인 측면은 상기 문턱값이 0 내지 5, 6 내지 10 또는 11-15인 G+P 지수 값의 군으로부터 선택되는 다른 측면의 방법을 포함하는데, 여기서 상기 0 내지 5의 값은 낮은 위험, 6 내지 10은 중간 위험 및 11-15는 높은 위험을 표시한다.
또 다른 측면은 상기 문턱값이 G+P 지수 값 6-10이라면 상기 환자는 추가적인 임상적 또는 실험실 시험을 겪는, 임의의 다른 측면의 방법을 포함한다.
또 다른 측면은 상기 문턱값이 G+P 지수 11-15라면 상기 환자는 추가적인 임상적 또는 실험실 시험을 겪는, 임의의 선행 측면의 방법을 포함한다.
또 다른 측면은 상기 문턱값이 G+P 지수 0-5라면 상기 환자는 추가적인 임상적 또는 실험실 시험을 위한 관찰 리스트에 올려지는, 임의의 다른 측면의 방법을 포함한다.
추가적인 측면은 상기 문턱값이 통계학적 방법을 이용하여 설정되는, 임의의 다른 측면의 방법을 포함한다.
또 다른 측면은 상기 통계학적 방법은 선형 판별 분석(Linear Discriminant Analysis, LDA), 로지스틱 회귀(Logistic Regression, LogReg), 서포트 벡터 머신(Support Vector Machine, SVM), K-최근접 5 이웃(K-nearest 5 neighbors, KN5N), 및 파티션 트리 분류기(Partition Tree Classifier, TREE) 중 임의의 하나인 것인, 임의의 다른 측면의 방법을 포함한다.
추가적인 측면은 도 6 또는 도 7로부터 선택되는 하나의 추가적인 유전자형 마커의 발현을 정량하는 단계를 더 포함하는, 임의의 다른 측면의 방법을 포함한다.
다른 측면은 상기 유전자 발현을 정량하는 단계가 mRNA의 수준을 검출함으로써 수행되는, 임의의 전술한 측면의 방법을 포함한다.
또 다른 측면은 상기 유전자 발현을 정량하는 단계가 cDNA의 수준을 검출함으로써 수행되는, 임의의 다른 측면의 방법을 포함한다.
또 다른 측면은 상기 유전자 발현을 정량하는 단계가 상기 cDNA의 적어도 일부에 상보적인 올리고뉴클레오티드를 이용하여 수행되는, 임의의 다른 측면의 임의의 방법을 포함한다.
추가적은 측면은 상기 유전자 발현을 정량하는 단계가 정방향 프라이머(forward primer) 및 역방향 프라이머(reverse primer)를 이용하는 qRT-PCR을 이용하여 수행되는, 임의의 다른 측면의 방법을 포함한다.
또 다른 추가적인 측면은 상기 유전자 발현을 정량하는 단계가 단백질의 수준을 검출함으로써 수행되는, 임의의 다른 측면의 방법을 포함한다.
또 다른 측면은 상기 유전자 발현을 정량하는 단계가 펩타이드의 수준을 검출함으로써 수행되는, 임의의 다른 측면의 방법을 포함한다.
추가적인 측면은 상기 유전자 발현을 정량하는 단계가 상기 마커에 대향하는(directed against) 항체를 이용하여 수행되는, 임의의 다른 측면의 임의의 방법을 포함한다.
또 다른 추가적인 측면은 상기 유전자 발현을 정량하는 단계가 샌드위치-유형 면역분석 방법을 이용하거나, 또는 항체 칩을 이용하여 수행되는, 제1항 내지 제8항, 또는 제13항 내지 제15항 중 어느 하나의 항의 방법을 포함한다.
또 다른 측면은 상기 유전자 발현을 정량하는 단계가 모노클로날 항체를 이용하여 수행되는, 임의의 다른 측면의 방법을 포함한다.
다른 측면은 상기 유전자 발현을 정량하는 단계가 폴리클로날 항혈청을 이용하여 수행되는, 임의의 다른 측면의 임의의 방법을 포함한다.
G+P 지수
전술한 표현형 및 유전자형 변수들은 다음의 관계에 따라 G+P 지수로 조합된다:
G+P 지수 = (w1*HFREQ+w2*AgeGT50+w3*Gender+w4*SMK+w5*RBC) + (w6*M1+w7*IL-8),
여기서 HFREQ는 6 개월 기간에 고전력장당(per high power field) 3개 이상의 적혈구 세포가 발견되는 빈도를 의미하는데; 빈도가 낮으면 HFREQ = 0이고, 고전력장당 3개 적혈구 세포보다 크면, 1이다. AgeGT50은 대상체의 연령을 말하는데, 50 세를 넘으면 AgeGT50 = 1이고, 50 세 미만이면 0이다. Gender는 남성에 대하여는 1의 값이 부여되고 여성에 대하여는 0이다. SMK는 대상체가 현재 또는 과거 흡연자인지를 의미하는데; 비흡연자이면 SMK = 0이고, 흡연자라면 1이다. RBC는 적혈구 세포 수를 의미하는데, RBC가 25 개 이상이면 1로 정해지고, 25 미만이면 0이다. MI는 유전자 마커 MDK, CDC, IGFBP5, 및 HOXA13의 발현 조합인데; M1 > 4.5이면 1로 정해지고, 4.5 미만이면 0이다. IL-8은 IL-8에 대한 RNA의 발현 수준을 말하는데; IL-8 > 2.5이면 IL-8은 1로 정해지고, 2.5 미만이면 0이다. 심볼 "*"는 곱하기 연산자를 의미하고, 가중 인자 w1-w7은 각각 G+P 지수에서 상기 나열된 각각의 변수들에 할당된 가중치이다.
다른 양호한 구현예에 있어서,(AgeGT50 및 RBC)가 상기 모델에서 다음에 보여지는 바와 같이 제외될 수 있다:
G+P 지수 = (1*HFREQ+3*Gender+4*SMK)+(5*M1+2*IL-8)
G+P 지수는 0 내지 15의 값을 생성한다. G+P 지수 값 11 내지 15인 환자는 방광암에 대하여 "고 위험"인 것으로 여겨지고, 방광암에 대한 추가적인 작업 요구를 나타낸다. G+P 지수 값 6 내지 10인 환자는 방광암 발병에 대하여 "중간 위험"인 것으로 여겨지고, 추가적인 작업이 표시된다. G+P 지수 값 0 내지 5인 환자는 방광암 발병에 대하여 "저 위험"인 것으로 여겨진다. "저 위험" 그룹의 환자는 관망 대기 리스트에 올려지고, 추가적인 증상들이 나타나거나, 미세 혈뇨의 사건 재발이 발생하면, 그들은 가능한 추가 작업에 대하여 재평가된다.
실시예 3에서 더욱 자세히 설명되듯이(도 18 및 19), 정량화된 표현형 변수들만에 대한 ROC 곡선은 중간 수준의 진단능을 생성한다는 것을 발견하였다. 정량화된 유전자형 마커들만에 대한 ROC 곡선은 유의한 수준의 진단능을 생성하였다. 본 발명의 발명자들은 유전자형 및 표현형 변수들 양자 모두를 G+P 지수로 조합하였을 때 예기치 않게 더 우수한 진단능이 있다는 것을 발견하였다.
유전자 발현의 정량
세포로부터 분비되거나 분해되어 나온, 또는 세포자멸사적 메커니즘에 의하여 손실된 단백질 또는 핵산은, 그들 단독 또는 상호 조합하여, 질병, 예컨대 방광의 염증성 질환 및/또는 방광암의 진단에 대한 혈청 또는 체액 마커로서 또는 확인된 질병의 진행을 모니터링하기 위한 마커로서 유용성을 갖는다. 단백질 및 세포 마커의 검출은 이 기술 분야에 공지된 방법들을 이용하여 수행될 수 있고, RT-PCT, qRT-PCR, 모노클로날 항체, 폴리클로날 항혈청 등등의 이용을 포함한다.
구체적으로, 본 발명은 혈뇨,(육안 혈뇨 또는 미세 혈뇨 중 하나),를 나타내는 환자를 분류하는 방법을 제공하는데, 그 방법은: (i) 생물학적 시료를 제공하는 단계; (ii) 상기 시료 중의 하나 이상의 방광 종양 마커(BTMs)를 검출하는 단계를 포함한다. 특히 관심 대상인 방광 종양 마커는 MDK, CDC2, HOXA13, 및 IGFBP5를 포함한다("4-마커 분석"). 임으로, 시료 중에서 인간 호중구 마커 인터류킨 8 수용체 B(IL8Rb)의 수준을 검출할 수도 있다(Cxbladder® 분석). 암의 존재는 하나 이상의 BTMs 수준을 일반 환자, 초기 방광암 환자, 및/또는 염증성 질병을 앓는 환자의 수준과 비교함으로써 확인될 수 있다. 예컨대, 암의 존재는 발현 문턱값에 대응하여 발현된 BTMs 발현을 비교함으로써 확인될 수 있다. 문턱값은 암을 갖지 않는 환자 그룹의 발현 수준의 적어도 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10, 100, 1000, 또는 최대 10,000 배인 발현 순일 수 있다. 다른 측면에 있어서, 방광 종양 마커의 발현 변경 없는 IL8Rb 고발현은 암보다는 염증성 질병의 표시일 수 있다.
본 발명의 방법은 방광암 검출을 위한 임의의 적절한 마커와 함께 사용될 수 있다. 본 발명에서 사용하기 위한 적절한 마커의 예시가 도 6 또는 7에 개요되어 있다. 본 발명은 도 6 또는 7에 개요된 임의의 하나 이상의 마커의 사용을 포함한다.
임의로, 다른 양호한 구현예에 있어서, 본 발명은 IL8Rb와, 하나 이상의 마커 MDK, CDC2, HOXA13, 및 IGFBP5의 임의의 조합을 포함할 수 있는데, 이는 또한 방광암을 검출하기 위하여 적절한 하나 이상의 다른 마커, 예컨대 도 6 또는 7에 개요된 임의의 하나 이상의 마커들과 조합될 수 있다. 보다 구체적으로, 본 발명은, 마커들: IL8Rb / MDK, IL8Rb / CDC2, IL8Rb / HOXA13, IL8Rb / IGFBP5, IL8Rb / MDK / CDC2, IL8Rb / MDK / HOXA13, IL8Rb / MDK / IGFBP5, IL8Rb / CDC2 / HOXA13, IL8Rb / CDC2 / IGFBP5, IL8Rb / HOXA13 / IGFBP5, IL8Rb / MDK / CDC2 / HOXA13, IL8Rb / MDK / CDC2 / IGFBP5, IL8Rb / CDC2 / HOXA13 / IGFBP5, and IL8Rb / MDK / CDC2 / HOXA13 / IGFBP5의 임의의 하나 이상의 조합의 발현 정량을 포함한다. 이들 조합은 임의로, 방광암을 검출하기 위하여 적절한 하나 이상의 추가적인 마커들을 포함할 수 있는데, 예컨대 도 6 또는 7에 개요된 임의의 하나 이상의 마커이다.
본 발명은 또한 방광의 염증 상태를 검출하는 방법을 제공하는데, 이 방법은: (i) 환자로부터 생물학적 시료를 제공하는 단계; 및 (ii) 상기 시료에서 인간 호중구 마커 인터류킨 8 수용체 B(IL8Rb) 수준을 검출하는 단계를 포함한다. 방광의 염증성 상태의 존재는 IL8Rb 수준을 일반 환자, 혈뇨를 갖는 환자, 및 방광의 염증성 상태를 갖는 환자의 수준과 비교함으로써 확인될 수 있다. 예컨대, 방광의 염증성 상태의 존재는 문턱값에 대응된 마커 IL8Rb의 발현을 비교함으로써 확인될 수 있다. 문턱값은 다른 그룹의 환자의 발현 수준의 적어도 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 3, 4, 5, 6, 7, 8, 9, 10, 100, 1000, 또는 최대 10,000 배인 발현 순일 수 있다.
본 발명의 양호한 유전자형 방법은 유전자 발현의 임의의 적절한 마커를 검출함으로써 수행될 수 있는데, 예컨대 임의의 적절한 방법을 이용하여 mRNA, cDNA, 단백질 또는 펩타이드의 수준을 측정함으로써 이루어질 수 있다.
진단 확인은 분류기 시스템을 이용함으로써 이루어질 수 있는데, 예컨대 선형 판별 분석(Linear Discriminant Analysis, LDA), 로지스틱 회귀(Logistic Regression, LogReg), 서포트 벡터 머신(Support Vector Machine, SVM), K-최근접 5 이웃(K-nearest 5 neighbors, KN5N), 및 파티션 트리 분류기(Partition Tree Classifier, TREE)이다.
도면의 간단한 설명
본 발명을 그 구체적인 구현예들 및 하기 도를 참조하여 설명한다.
도 1은 IL8Rb(CXCR2로도 알려짐)의 단백질 및 mRNA 서열을 보여준다.
도 2는 비악성 질환(전립선 질환, 방광염, 요로 감염 및 요로 결석증)으로부터 TCC를 분리하는데 있어서 IL8Rb 의 효과를 보여주는 산포도 그래프를 보여준다. 도 2c 및 도 2f에서 IL8Rb는 다른 방광암 RNA 마커로 치환되었다. (a). MDK/IGFBP5; (b). MDK/HOXA13; (c) MDK/IL8Rb; (d) CDC2/IGFBP5; (e). CDC2/HOXA13; (f). CDC2/IL8Rb.
도 3은 선형 판별 분석(LD) 및 선형 회귀(LR)를 이용하여 유도된 진단 알고리즘에서 IL8Rb를 포함한 효과를 보여주는 ROC 곡선 분석(민감도 대 특이도)을 보여준다. 상기 ROC 곡선은 TCC 및 상부 요로암을 갖는 환자들(n=61), 및 비악성 질환 방광염, 요로 감염 및 요로 결석증 환자들(n=61)로부터 유도되었다. (a). LD1(실선) 및 LD2(점선). (b) LR1(실선) 및 LR2(점선). IL8Rb는 LD2 및 LR2에 포함된다.
도 4는 선형 판별 분석(LD) 및 선형 회귀(LR)를 이용하여 유도된 진단 알고리즘에서 IL8Rb를 포함한 효과를 보여주는 ROC 곡선 분석을 보여준다. 상기 ROC 곡선은 TCC 를 갖는 환자들(n=56)로부터 유도되었고, 도 3과 달리 코호트 내 임의의 비악성 질환 환자들(n=386)로부터 유도되었다. (a). LD1(실선) 및 LD2(점선). (b) LR1(점선) 및 LR2(실선). IL8Rb는 LD2 및 LR2에 포함된다
도 5는 비악성 비뇨기과 질환을 갖는 환자들의 소변에서 IL8Rb mRNA의 축적을 보여주는 박스 플롯이다. RNA는 델타-Ct 방법(Holyoake et al, 2008)을 이용한 qRT-PCR로 정량되었다. 이 방법에서, 낮은 Ct는 높은 RNA 수준을 반영한다. BPH: 양성 전립선 비대증; UTI: 요로 감염; NS 전립선: 비특이적 전립선 질환; Vasc. 전립선: 혈관 전립선; 와파린: 와파린 사용에 2차 혈뇨. 방광염/UTI인 환자의 관찰은 보여진 다른 비악성 경우와 매우 상이하다(p=0.001).
도 6은 방광암에서 과발현되는 것으로 알려진 마커들이고, 본 발명에 사용하기에 적합하다.
도 7은 방광암에서 발현이 저하되는 것으로 알려진 마커들이고, 본 발명에 사용하기에 적합하다.
도 8은 환자 모집 과정에 대한 흐름도 및 실시예 2의 숫자를 보여준다.
도 9는 3 개월에 질병 상태에 의한 기저 임상적 및 인구학적 특성을 보여준다.
도 10은 소변 시험의 총 민감도 및 특이도를 보여준다.
도 11은 다양한 ROC 곡선을 보여준다; 도 11a는 NMP22 ELISA 및 uRNA-D(4개의 마커 MDK+CDC2+IGFBP5+HOXA13를 포함하는 시험)에 대한 ROC 곡선을 보여주고; 도 11b는 5개의 마커 MDK, CDC2, HOXA13, IGFBP5 및 IL8Rb에 대한 ROC 곡선을 보여준다.
도 12는 종양 단계, 등급, 위치, 종양의 다발성, 혈뇨 상태, 소변 시료의 크레아티닌 및 성에 의한 소변 시험의 민감도를 보여준다. 표는 TCC를 갖는 환자들 중 양성 소변 시험 결과인 수 및 백분율을 보여준다.
도 13은 진단, 육안 혈뇨 또는 크레아티닌 및 성에 의한 소변 시험의 특이도를 보여준다. 표는 TCC를 갖지 않는 환자들 중 음성 소변 시험 결과인 수 및 백분율을 보여준다.
도 14는 마커 조합에 대한 ROC 곡선을 보여준다: (a) MDK, (b) CDC, (c) IGFBP5, (d) HOXA13, (e) MDK+CDC2, (f) MDK+IGFBP5, (g) MDK+HOXA13, (h) CDC2+IGFBP5, (i) CDC+HOXA13, (j) IGF+HOXA13, (k) MDK+CDC2+IGFBP5, (l) MDK+CDC2+HOXA13, (m) MDK+IGFBP5+HOXA13, (n) CDC2+IGFBP5+HOXA13, (o) MDK+CDC2+IGFBP5+HOXA13, (i) 선형 판별 분석(LDA), (ii) 로지스틱 회귀(LogReg), (iii) 서포트 벡터 머신(SVM), (iv) K-최근접 5 이웃(KN5N), 및 (v) 파티션 트리 분류기(TREE)의 5 가지 상이한 분류기 모델을 이용하여 IL8Rb를 더하거나 뺀 것.
도 15는 민감도 특이도 연구 결과를 보여준다. 도 15a는 도 14로부터의 ROC 곡선의 20% 거짓 양성 비율(80% 특이도) 이하에 대한 "곡선하면적"(AUC)를 보여주고, 도 15b는 IL8Rb를 포함한 결과 AUC의 차이를 보여준다.
도 16은 여러 가지 특이도 세트; (a) 80%, (b) 85%, (c) 90%, (d) 95%, (e) 98%에서, 5 가지 상이한 분류기 모델 (i) 선형 판별 분석 (LDA), (ii) 로지스틱 회귀(LogReg), (iii) 서포트 벡터 머신(SVM), (iv) K-최근접 5 이웃(KN5N), 및 (v) 파티션 트리 분류기(TREE)을 이용하여 IL8Rb를 더하거나 뺀 4 가지 마커 MDK, CDC2, IGFBP5, 및 HOXA13의 조합의 민감도 그래프를 보여준다.
도 17은 여러 가지 특이도 세트 (a) 80%, (b) 85%, (c) 90%, (d) 95%, (e) 98%에서 IL8Rb 첨가의 민감도에의 이득을 보여주고, 여러 가지 특이도 세트 (a) 80%, (b) 85%, (c) 90%, (d) 95%, (e) 98%에서 IL8Rb 첨가의 결과적인 특이도에의 이득을 보여준다.
도 18은 유전자 시험 단독, 표현형 평가 단독, 및/또는 유전자 시험 및 표현형적 평가 양자 모두 중 하나를 이용하여 연구된, 혈뇨를 갖는 환자 시험에 대한 ROC 곡선을 보여준다.
도 19는 본 발명의 변수들 성별, 흡연력 및 HFREQNEW에 대한 승산비(수평축)의 그래프를 보여준다.
도 20a 및 20b는 진단 정확도를 보고하는 표준에 대한 흐름도를 보여준다. 도 20a는 이 연구에서 모든 3 개의 코호트에 걸쳐 육안 혈뇨를 갖는 환자들에 대한 흐름도를 보여준다.
도 20b는 이 연구에 포함된 미세 혈뇨를 갖는 환자들의 진단 정확도를 보고하기 위한 흐름도를 보여준다.
도 21은 3 가지 분류 모델을 나타내는 ROC 곡선을 보여준다. P 지수(도트 라인) ,G 지수(점선 라인) 및 G+P 지수(실선 라인).
도 22는 NPV 대 각 모델에 따른 음성 시험 혈뇨 환자 비율을 보여준다. P 지수(도트 라인) ,G 지수(점선 라인) 및 G+P 지수(실선 라인).
도 23은 검출 결과(수평축) 대 분류 결과(수직축) 간의 관계 그래프를 보여준다.
도 24는 G2 지수(수평축) 대 G1+P 지수(수직축)의 그래프를 보여준다.
상세한 설명
정의
본 발명의 구현예를 상세히 설명하기에 앞서, 본원에 사용되는 용어의 정의를 제공하는 것이 유용할 것이다.
용어 "마커"는, 생물학적 현상의 존재와 정량적으로 또는 정성적으로 관련된 분자를 의미한다. "마커"의 예에는, 상기 현상의 기본이 되는 메커니즘에 직접적으로 또는 간접적으로 관련이 있는 코딩 또는 비(非)코딩 DNA 또는 DNA 단편인 유전자 또는 유전자 단편, 코딩 또는 비코딩 RNA 또는 RNA 단편과 같은 폴리뉴클레오티드; 또는 펩타이드, 올리고펩타이드, 단백질 또는 단백질 단편과 같은 폴리펩타이드를 포함하는 유전자 산물; 또는 상기 산물에 의한, 관련된 대사산물, 또는 항체 또는 항체 단편과 같은 기타의 동정 분자가 있다. 본 발명의 마커에는 본원에 기술된 뉴클레오티드 서열(예를 들면, GenBank 서열), 특히 전장 서열, 임의의 코딩 서열, 임의의 단편, 임의의 가능한 프로브(예컨대, 엑손-엑손 경계에 걸쳐 생성된 것), 예컨대 포획 모티프, 헤어핀 또는 형광체 등 또는 이의 상보체, 및 상기 정의된 바와 같은 그의 임의의 측정가능한 마커가 포함된다.
본 발명에 사용된 "항체" 등의 용어는 면역글로불린 분자 및 면역글로불린(Ig) 분자의 면역적으로 활성인 부분, 즉 항원과(면역반응을 통해서) 특이적으로 결합하는 항원 결합 부위를 함유하는 분자를 말한다. 여기에는 폴리클로날 항체, 모노클로날 항체, 키메라 항체, 단쇄 항체, Fc, Fab, Fab', 및 Fab2 단편, 및 Fab 발현 라이브러리가 포함되나, 이에 국한되는 것은 아니다. 항체 분자는 IgG, IgM, IgA, IgE, 및 IgD류 중 어느 하나와 관련이 있고, 이들은 분자 내에 존재하는 중쇄의 특성에 따라 다른 것과 구분된다. 여기에는, 이의 하위류도 포함이 되는데, 그러한 것들로는, IgGl, IgG2 등이 있다. 경쇄는 카파 체인이거나 람다 체인일 수 있다. 항체로서 본원에 언급되는 것에는 언급된 모든 클래스, 하위 클래스, 및 유형이 모두 포함된다. 또한 포함되는 것은 키메라 항체인데, 예를 들면 하나 이상의 출처, 예를 들면 마우스 또는 인간 서열에 특이적인 모노클로날 항체 또는 이의 단편이다. 또한 포함되는 것은 낙타과(camelid) 항체, 상 어(shark) 항체 또는 나노바디(nanobodies)이다.
용어 "암" 및 "암성의(cancerous)"는 전형적으로는 비정상적인 또는 통제되지 않는 세포 성장이 특징인 포유류 내의 생리학적인 증상을 말하거나 설명하는 것이다. 암 및 암 병리학은 예를 들면, 전이, 주변 세포의 정상 기능을 방해하는 것, 비정상적인 수준으로 사이토카인 또는 다른 분비 산물을 방출, 염증 또는 면역 반응의 억제 또는 악화, 종양형성(neoplasia), 전암(premalignancy), 악성종양(malignancy), 주위 조직 또는 원거리 조직 또는 기관, 예컨대 림프절로의 침투 등과 관련되어 있을 수 있다.
용어 "종양"은 악성이든 양성이든 모든 종양 형성 세포 성장 및 증식, 및 모든 전-암성 및 암성 세포 및 조직을 말한다.
용어 "방광암"은 방광에서 유래하는 종양을 말한다. 이들 종양은 임의의 기관으로 전이할 수 있다.
용어 "BTM" 또는 "방광 종양 마커" 또는 "BTM 패밀리원"은 요로상피 암, 방광암, 방광의 이행 세포 암종(TCC), 편평 세포 암종, 및 방광의 선암종과 관련된 종양 마커(TM)를 의미한다. 용어 BTM은 또한, 그 조합이 방광암 검출의 민감도 및 특이도를 증가시키는, 개별적인 마커들의 조합을 포함한다. 용어 BTM은 그 마커가 오로지 방광암에 특이적인 것을 요구하지 않는 것으로 이해되어야 한다. 오히려, BTM의 발현은 다른 유형의 세포, 질병에 걸린 세포, 종양, 예컨대 악성 종양에서 달라질 수 있다.
용어 "저하 발현 BTM"은 비악성 방광 조직에서보다 방광 종양에서 더 낮은 발현을 보이는 마커를 의미한다.
용어 "과다 발현 BTM"은 비악성 조직에서보다 방광 종양에서 더 높은 발현을 보이는 마커를 의미한다.
용어 "차등적으로 발현된", "차등 발현" 등은 해당 유전자 마커의 발현이 증상, 구체적으로는 흑색종과 같은 암을 가진 개체(예를 들면, 시험 시료)에서, 대조군 개체(예를 들면 기준 시료) 내의 발현에 비해, 더욱 높은 또는 더욱 낮은 수준으로 활성화되는 유전자 마커를 말한다. 상기 용어는 또한, 우수한 또는 열악한 예후를 갖는 질병에서; 또는 더 많이 또는 더 적게 증식된 세포에서; 동일한 증상이지만 상이한 단계에서 더 높게 또는 더 낮게 발현이 활성화되는 마커도 포함한다. 차등적으로 발현되는 마커는 폴리뉴클레오티드 수준 또는 폴리펩타이드 수준에서 활성화되거나 억제될 수 있고, 얼터너티브 스플라이싱되어, 상이한 폴리펩타이드 산물을 만들어낼 수 있다. 이러한 차이는 mRNA 수준, 표면 발현, 분비, 또는 그 외에 폴리펩타이드가 참여하는 단계에서의 변화에 의해 증명될 수 있다.
차등적 발현은 2 개 이상의 마커(예를 들면, 유전자 또는 이들의 유전자 산물) 간의 발현의 수준의 비교; 또는 2 개 이상의 마커(예를 들면, 유전자 또는 이들의 유전자 산물) 간의 발현 수준의 비율의 비교; 또는 동일한 마커의 2개의 상이하게 프로세싱된 산물(예를 들면, 전사체 또는 폴리펩타이드) 간의 비교로서, 정상적인 개체와 병든 개체에서 상이한 것; 또는 동일한 질병의 여러 단계 간의 비교; 또는 우수하거나 열악한 예후를 갖는 질병들 간의 비교; 또는 증식이 더 많이 또는 더욱 적게 된 세포 간의 비교; 또는 정상 조직과 병든 조직, 특히, 암, 또는 흑색종 간의 비교를 포함할 수 있다. 차등적인 발현은, 예를 들면, 정상 및 병든 세포 중의, 또는 상이한 질병 사건 또는 질병 단계를 겪은 세포 중의, 또는 상이한 증식 수준을 갖는 세포 중의, 유전자 또는 이의 발현 산물의 일시적인 또는 세포적인 발현의 패턴의 정량적 차이를 비롯하여, 정성적 차이도 포함한다.
용어 "발현"은 폴리뉴클레오티드 및 폴리펩타이드의 생산, 특히, 유전자 또는 유전자 일부로부터의 RNA(예를 들면, mRNA)의 생산을 포함하고, RNA 또는 유전자 또는 유전자 일부에 의해 인코딩된 폴리펩타이드의 생산, 및 발현과 관련된 검출 가능한 물질의 출현을 포함한다. 예를 들면, 복합체, 가령 폴리펩타이드-폴리펩타이드 상호 작용, 폴리펩타이드-뉴클레오티드 상호작용 등의 복합체 형성은, 상기 용어 "발현"의 범위 내에 포함된다. 또 다른 예로서, 결합 리간드, 예컨대 혼성화 프로브 또는 항체를, 유전자 또는 기타 폴리뉴클레오티드 또는 올리고뉴클레오티드, 폴리펩타이드 또는 단백질 단편에 결합시킨 후, 결합 리간드를 가시화(visualization)하는 것이 포함된다. 그러므로, 마이크로어레이, 노던 블롯과 같은 혼성화 블롯, 또는 웨스턴 블롯과 같은 면역블롯, 또는 비드 어레이 상의 스팟(spot)의 강도, 또는 PCR 분석에 의한 스팟 강도는 생물학적 분자의 "발현"이라는 용어의 범위 내에 포함된다.
용어 "유전자 발현 문턱값" 및 "정의된 발현 문턱값"은 호환되어 사용되며 폴리뉴클레오티드 또는 폴리펩타이드의 발현 수준이 환자의 상태에 대한 예측 마커로서 기여하는 해당 마커의 수준을 말한다. 예컨대, 특정 문턱값을 넘는 IL8Rb의 발현은 그 환자가 염증성 상태를 가짐을 진단한다. 문턱값은 또한, 방광암 마커를 이용하여 의심되는 방광암에 대하여 환자를 시험할 때 사용될 수 있다. 문턱값을 넘는 발현 수준은 그 환자가 암에 대한 거짓 양성 시험을 야기할 것 같은 염증성 방광 상태를 갖는다는 것이지만, 문턱값 아래의 IL8Rb 발현 수준은 그 환자가 염증성 방광 상태를 갖지 않는다는 것을 예측한다. IL8Rb 측정을 포함함으로써, 방광 종양 마커들의 발현으로부터의 임의의 결과는 그 IL8Rb의 수준이 문턱값 아래라면 믿을만 할 수 있다(즉, 양성 결과는 실제로 염증으로부터의 점막의 비악성 세포의 박리 결과 방광 종양 마커의 증가된 수준보다 암을 갖는 환자들에게 양성일 것이다).
용어 "진단적 문턱값"은 환자가 주어진 상태, 예컨대 방광암을 갖거나 갖지 않는 것 둘 중 하나로 진단되었다고 말할 수 있는 문턱값을 말한다. 진단적 문턱값은 일반적으로 집단, 유병률 및 가능한 임상적 결과와 같은 인자들에 따른, 원하는 민감도 및 특이도를 달성하기 위하여 설정된다. 일반적으로 진단적 문턱값은 알고리즘, 및/또는 컴퓨터화된 데이터 분석을 이용하여 계산 및/또는 구축될 수 있다.
정확한 문턱값은 상기 집단 및 또한 질병을 예측하기 위하여 사용된 임의의 모델(예측 모델)에 따를 것이다. 문턱값은 하기의 실시예에서 기술되는 바와 같은 임상 연구로부터 실험적으로 유래된, 수립된 예측 모델에 따라 좌우된다. 사용된 예측 모델에 따라서, 발현 문턱값은 최대의 민감도, 또는 최대의 특이도, 또는 최소한의 오류(최대한의 분류 비율)를 달성하도록 설정된다. 예를 들면, 문턱값이 더 높을 수록, 최소한의 오류를 달성하도록 조정될 수 있지만, 이는 민감도를 더 낮출 수 있게 된다. 그러므로, 소정의 예측 모델에 대해서, 가장 높은 민감도를 일반적으로 달성하면서 최소한의 오류율을 가지는 발현 문턱값을 조정하기 위하여 임상 연구가 사용될 것이다. 일반적으로 문턱값은 정상 발현 수준의 적어도 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 3, 4, 5, 6, 7, 8, 9, 10, 100, 1000, 또는 최대 10,000 배인 발현 순일 것이다.
용어 "민감도"는(그 모델에 의하여) 양성 판정된 그 질병을 갖는 개체의 분율을 의미한다. 따라서, 민감도 증가는 거짓 음성 판정 결과가 더 적음을 의미한다.
용어 "특이도"는(그 모델에 의하여) 음성 판정된 그 질병을 갖지 않는 개체의 분율을 의미한다. 따라서, 특이도 증가는 거짓 양성 판정 결과가 더 적음을 의미한다.
용어 "수신자 조작 특성"("ROC 곡선")은 특정 마커 또는 시험에 대한 여러 가지 컷 오프 포인트에 대하여 거짓 양성 비율(특이도)에 대한 참 양성 비율(민감도)의 플롯을 의미한다. ROC 곡선 상의 각각의 위치는 주어진 문턱값에 대응할 특정 민감도/특이도 지점을 나타낸다. ROC 곡선은 원하는 결과를 얻기 위하여 문턱값을 구축하는데 중요할 수 있다. ROC 곡선 아래의 면적(곡선하면적(AUC) 분석이라고 표현)은 주어진 마커 또는 다수의 마커들로 이루어지는 시험이 얼마나 잘 2 이상의 진단 결과들을 구별할 수 있는가의 척도일 수 있다. ROC 곡선은 또한 2개의 상이한 시험의 정확도를 비교하기 위하여 사용될 수 있다.
용어 "올리고뉴클레오티드"는 폴리뉴클레오티드, 전형적으로는 프로브 또는 프라이머를 가리키고, 단일 가닥 데옥시리보뉴클레오티드, 단일 또는 이중 가닥 리보뉴클레오티드, RNA:DNA 하이브리드, 및 이중 가닥 DNA를 포함하나, 이에 국한되는 것은 아니다. 단일 가닥 DNA 프로브 올리고뉴클레오티드와 같은 올리고뉴클레오티드는 종종, 시판되는 자동화된 올리고뉴클레오티드 합성기를 사용하여 화학적 방법에 의해, 또는 시험관 내(in vitro) 발현 시스템, 재조합 기술, 및 세포 및 생물에서의 발현을 포함하는 기타의 다양한 방법과 같은 방법에 의해 합성된다.
용어 "과발현" 또는 "과발현된"은 정상 조직에서 보여지는 것 이상인, 환자의 유전자 또는 마커의 발현 수준을 말한다. 발현은, 그것이 정상 조직 또는 다른 그룹의 환자들로부터의 조직에서의 발현의 적어도 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 3, 4, 5, 6, 7, 8, 9, 10, 100, 1000, 또는 최대 10,000 배이면 과발현된 것으로 여겨질 수 있다.
단수로, 또는 복수로 사용될 때 용어 "폴리뉴클레오티드"는 일반적으로 임의의 폴리리보뉴클레오티드 또는 폴리데옥시리보뉴클레오티드를 가리키는 것으로, 이는 변형되지 않은 RNA 또는 DNA, 또는 변형된 RNA 또는 DNA일 수 있다. 이 용어는 단일 또는 이중 가닥 DNA, 단일 및 이중 가닥 영역을 포함하는 DNA, 단일 및 이중 가닥 RNA, 및 단일 및 이중 가닥 영역을 포함하는 RNA, 단일 가닥이거나, 더욱 전형적으로는 이중 가닥일 수 있고, 또는 단일 및 이중 가닥 영역을 포함하는 DNA 및 RNA를 포함하는 하이브리드 분자를 포함하나, 이에 국한되는 것은 아니다. 또한 이 용어에는 RNA 또는 DNA 또는 이러한 두 RNA 및 DNA를 모두 포함하는 삼중 가닥 영역도 포함된다. 특히, mRNA, cDNA, 및 유전체 DNA, 및 상기의 임의의 단편도 포함된다. 이 용어에는 삼중(tritiated) 염기, 또는 비통상적인(unusual) 염기, 예컨대 이노신(inosine)과 같은 하나 이상의 변형된 염기를 함유하는 DNA 및 RNA가 포함된다. 본 발명의 폴리뉴클레오티드는 코딩 또는 비코딩 서열, 또는 센스 또는 안티센스 서열을 포함할 수 있다. 본원에서 "폴리뉴클레오티드"와 같은 용어를 언급할 때는, 전장 서열 뿐만 아니라 이의 임의의 단편, 유도체 또는 변이체도 포함하는 것으로 이해된다.
용어 "표현형(적)"은 임상적 세팅, 또는 임상적 인터뷰, 또는 환자력에서 관찰될 수 있는 형질을 의미한다. G+P 지수를 계산하기 위한 식에서 사용되는 경우, "표현형적" 또는 "P"는 환자의 연령, 성, 혈뇨 발생, 및 흡연력을 의미한다.
본 발명에 사용된 "폴리펩타이드"는 올리고펩타이드, 펩타이드, 또는 단백질 서열, 또는 이의 단편을 말하는 것이고, 천연 발생한, 재조합의, 합성의, 또는 반합성의 분자를 말하는 것이다. "폴리펩타이드"가 본 발명에서 언급되는 경우, 천연 발생한 단백질 분자의 아미노산 서열을 말하는 것이고, "폴리펩타이드" 등의 용어는 아미노산 서열을, 전장 분자에 대한 완전한, 변성되지 않은(native) 아미노산 서열로 국한하는 것을 의미하지는 않는다. 본 발명에서 "폴리펩타이드" 등과 같은 용어에 대해 언급할 때에는 전장 서열 뿐 아니라, 이의 임의의 단편, 유도체, 또는 변이체를 포함하는 것으로 이해된다.
용어 "qPCR" 또는 "QPCR"은 예를 들면, 문헌 [PCR Technique: Quantitative PCR, J. W. Larrick, ed., Eaton Publishing, 1997, and A-Z of Quantitative PCR, S. Bustin, ed., IUL Press, 2004]에 기술된 바와 같은, 정량적 중합효소 연쇄반응을 말하는 것이다.
용어 "역전사"는 올리고뉴클레오티드, 예컨대 메신저 RNA("mRNA")가 효소("역전사 중합효소")를 이용하여 상보성 올리고데옥시리보뉴클레오티드("cDNA")의 생화학적 합성의 주형으로서 사용되는 과정을 의미하는데, 상기 효소는 주형 RNA에 결합하여 데옥시리보뉴클레오티드 염기를 연속적으로 부착하는 일련의 첨가 반응을 촉매하여 상기 RNA 주형에 상보적인 올리고데옥시리보뉴클레오티드 가닥을 형성한다.
용어 "혈뇨"는 소변 중 혈액의 존재로서 정의된다. 이는 소변 내에서 거시적 혈뇨(시각적 양의 혈구 세포) 또는 미시적 혈뇨(미시량의 혈액)로서 제시될 것이다. 미세 혈뇨의 확인 표지는 최소 3개의 적정 수집된 소변 시료에 대하여 현미경의 고전력장(HPF)당 3개 이상의 적혈구 세포로서 정의된다. 미세 혈뇨는 또한 임상에서 소변 딥스틱(비색 비교 추정)에 의하여 검출될 수 있다. 혈뇨(거시적이거나 미시적이거나 둘 중 하나)는 무증상(혈뇨와 관련된 어떠한 추가적인 증상이 없음)이거나 증상이 있는 것일 수 있다. 추가적인 증상은 배뇨 곤란(고통 배뇨), 방광 불완전 비움 느낌 또는 배뇨 빈도의 증가를 포함한다.
혼성화 반응의 "엄격성"은 당업자라면 용이하게 결정할 수 있고, 일반적으로는 프로브 길이, 세척 온도 및 염 농도에 따라 경험적으로 계산한다. 일반적으로 프로브 길이가 길어지면, 적당한 어닐링을 위해서는 더 높은 온도가 요구되는 반면에, 프로브 길이가 짧아지면 더욱 낮은 온도를 요구한다. 혼성화는 일반적으로 상보적인 가닥이 그들의 용융(melting) 온도보다 더 낮은 온도의 환경에 존재하는 경우에, 변성된 DNA가 리어닐링(reanneal)되는 능력에 따라 좌우된다. 프로브와 혼성화 가능한 서열 간의 소기의 상동성의 정도가 더 높을수록, 사용될 수 있는 상대 온도가 더 높아진다. 결과적으로, 상대 온도가 더 높을수록, 반응 조건은 더욱 엄격하게 만드는 경향이 있는 반면에, 더욱 낮은 온도는 덜 그렇게 만드는 결과로 귀결된다. 혼성화 반응의 엄격성에 대한 더욱 자세한 사항 및 설명에 대해서는 하기의 문헌에서 찾아볼 수 있다: 예를 들어, 문헌 [Ausubel et al., Current Protocols in Molecular Biology, Wiley Interscience Publishers, (1995)].
본원에서 정의된 "엄격한 조건" 또는 "고엄격성 조건"은 전형적으로는 (1) 세척을 위해서 낮은 이온 강도 및 높은 온도를 사용하는데, 예를 들면 50℃에서 0.015 M 염화나트륨/0.0015 M 구연산나트륨/0.1% 나트륨 도데실 술페이트의 조건을 사용하고, (2) 혼성화 동안에 변성제를, 예컨대 포름아미드를 pH 6.5의 0.1% 소혈청 알부민/0.1% Ficoll/0.1% 폴리비닐피롤리돈/50 mM 인산나트륨 완충액과 함께, 42℃에서 750 mM 염화나트륨, 75 mM 구연산나트륨과 함께, 가령 50%(v/v)로 사용하며, (3) 42℃에서 50% 포름아미드, 5x SSC(0.75 M NaCl, 0.075 M 나트륨 시트레이트), 50 mM 나트륨 포스페이트(pH 6.8), 0.1% 나트륨 피로포스페이트, 5X Denhardt's 용액, 초음파분해된 연어 정자 DNA(50 μg/ml), 0.1% SDS, 및 10% 덱스트란 술페이트를 사용하고, 42℃에서 0.2X SSC(염화나트륨/구연산나트륨)로 세척한 후, 55℃에서 50% 포름아미드로 세척한 다음에, 55℃에서 EDTA를 함유하는 0.1X SSC를 포함하는 고엄격성 세척을 수행하는 것을 포함한다.
"중간 엄격성 조건"은 하기의 문헌: Sambrook et al., Molecular Cloning: A Laboratory Manual, New York: Cold Spring Harbor Press, 1989에 기술되어 있는 바와 같이 확인할 수 있고, 세척 용액의 사용과, 상기에 기술된 것보다는 덜 엄격한 혼성화 조건(예를 들면, 온도, 이온 강도 및 SDS%)의 사용을 포함한다. 중간 엄격성 조건의 예로, 20% 포름아미드, 5X SSC(150 mM NaCl, 15 mM 구연산 삼나트륨), 50 mM 인산나트륨(pH 7.6), 5X Denhardt's 용액, 10% 덱스트란 설페이트, 및 20 mg/ml 변성된 분쇄한 연어 정자 DNA를 포함하는 용액에서 37℃에서 밤새 인큐베이션한 후, 약 37-50℃에서 1XSSC로, 필터를 세척하는 것이 있다. 당업자는 온도, 이온 강도 등을 프로브 길이 등과 같은 인자에 맞추어 필요에 따라 어떻게 조정해야 하는지 잘 알 것이다.
용어 "IL8Rb"는 호중구 마커 인터류킨 8 수용체 B(케모카인(C-X-C 모티프) 수용체 2 [CXCR2]로도 알려짐)(도 1; SEQ ID NOs. 1 및 2)를 의미하고, 마커 IL8Rb를 포함한다. 상기 용어는 폴리뉴클레오티드, 예컨대 유전자 또는 유전자 단편, RNA 또는 RNA 단편; 또는 유전자 산물, 예컨대 폴리펩타이드, 예컨대 펩타이드, 올리고펩타이드, 단백질 또는 단백질 단편; 또는 임의의 관련 대사물, 부산물 또는 임의의 다른 식별 분자, 예컨대 항체 또는 항체 단편을 포함한다.
용어 "신뢰성(reliability)"은 거짓 양성 및/또는 거짓 음성 발생이 적음을 포함한다. 따라서, 마커의 신뢰성이 높을수록, 그 마커를 이용한 진단과 관련된 더 적은 거짓 양성 및/또는 거짓 음성이 발생한다.
"정확도"는,
Figure 112016059878817-pct00001
에 따라,
그 집단의 총 경우의 수로 나눈 참인 결과(참 양성 더하기 참 음성)의 분율이다.
용어 "분류"는 방광암을 가질 확률이 낮은 혈뇨 환자들을, 방광암을 갖고 추가적인 임상적 작업, 예컨대 방광경 검사 또는 기타 임상적 과정을 필요로 할 합리적 확률인 혈뇨 환자들로부터 구별해 내는 것을 의미한다.
구현예들
그러므로, 양호한 특정 구현예에 있어서, 방광암을 가질 확률이 낮은 환자들을, 추가적인 임상적 작업, 가능하게는 방광경 검사 또는 기타 과정 등을 청하는 방광암을 가질 충분한 위험을 갖는 환자들로부터 구분해내도록 하는 유전자형 마커 및 표현형 마커의 조합이 제공된다. 다른 구현예에 있어서, 약 70% 이상의 신뢰성을 갖는; 다른 구현예에 있어서, 약 73% 이상의 신뢰성을 갖는, 또 다른 구현예에 있어서, 약 80% 이상의 신뢰성을 갖는, 또 다른 구현예에 있어서, 약 90% 이상의 신뢰성을 갖는, 또 다른 구현예에 있어서, 약 95% 이상의 신뢰성을 갖는, 또 다른 구현예에 있어서, 약 98% 이상의 신뢰성을 갖는, 특정 구현예에 있어서 약 100%의 신뢰성을 갖는 마커들이 제공된다.
본 발명의 실시는, 별달리 언급하지 않은 한, 통상의 분자 생물학 기술(재조합 기술 포함), 미생물학, 세포학, 및 생화학 기술을 사용하고, 이러한 것들은 당업자의 지식 범위 내에 있다. 이러한 기술은 예를 들어, 하기의 문헌에 자세히 기술되어 있다: Molecular Cloning: A Laboratory Manual, 2nd edition, Sambrook et al., 1989; Oligonucleotide Synthesis, MJ Gait, ed., 1984; Animal Cell Culture, R. I. Freshney, ed., 1987; Methods in Enzymology, Academic Press, Inc.; Handbook of Experimental Immunology, 4th edition, D .M. Weir & CC. Blackwell, eds., Blackwell Science Inc., 1987; Gene Transfer Vectors for Mammalian Cells, J.M. Miller & M.P. Calos, eds., 1987; Current Protocols in Molecular Biology, F.M. Ausubel et al.,eds., 1987; 및 PCR: The Polymerase Chain Reaction, Mullis et al., eds., 1994.
상기 용어들은 단백질, DNA 서열 및/또는 RNA 서열을 말할 수 있다고 이해되어야 한다. 또한, 상기 용어들은 본 발명에서 설명된 것과 상동 서열을 갖는 비인간 단백질, DNA 및/또는 RNA을 말하는 것으로도 이해되어야 한다.
본 발명의 구현예
종종 비뇨기 전문의를 부르는 혈뇨 환자들은 혈뇨 전용 클리닉에서 볼 수 있도록 예약된다. 종종 거시적 혈뇨 환자가 미시적 혈뇨 환자보다 우선한다. 1차 의료 제공자로부터 언급되는 시점에서 제공되는 정보는 매우 변수적인 것일 수 있고, 요로상피 암을 가질 확률에 의한 정확한 환자의 계층화를 어렵게 할 수 있다. 종종 소변 세포진이 그 환자를 보기 전에 통상적으로 요청되고, 양성이면, 그 환자에게 전체 임상 작업을 받을 우선 순위를 증가시키는데 사용되지만, 소변 세포진은 매우 특이적인 반면 매우 낮은 민감도를 갖고 따라서 거짓-음성 비율이 높은 실용적 가치가 낮은 것이다(6).
방광암을 갖지 않는 혈뇨 환자의 표현형 및 유전자형 분석
G+P 지수
전술한 표현형적 및 유전자형적 변수들은 다음의 관계에 따라 G+P 지수로 조합된다:
G+P 지수 = (w1*HFREQ+w2*AgeGT50+w3*Gender+w4*SMK+w5*RBC) + (w6*M1+w7*IL-8),
여기서, HFREQ는 6 개월 기간에 고전력장당(per high power field) 3개 이상의 적혈구 세포가 발견되는 빈도를 의미하는데; 빈도가 낮으면 HFREQ = 0이고, 고전력장당 3개 적혈구 세포보다 크면, 1이다. AgeGT50은 대상체의 연령을 말하는데, 50 세를 넘으면 AgeGT50 = 1이고, 50 세 미만이면 0이다. Gender는 남성에 대하여는 1의 값이 부여되고 여성에 대하여는 0이다. SMK는 대상체가 현재 또는 과거 흡연자인지를 의미하는데; 비흡연자이면 SMK = 0이고, 흡연자라면 1이다. RBC는 적혈구 세포 수를 의미하는데, RBC가 25 개 이상이면 1로 정해지고, 25 미만이면 0이다. MI는 유전자 마커 MDK, CDC, IGFBP5, 및 HOXA13의 발현 조합인데; M1 > 4.5이면 1로 정해지고, 4.5 미만이면 0이다. IL-8은 IL-8에 대한 RNA의 발현 수준을 말하는데; IL-8 > 2.5이면 IL-8은 1로 정해지고, 2.5 미만이면 0이다. 심볼 "*"는 곱하기 연산자를 의미하고, 가중 인자 w1-w7은 각각 G+P 지수에서 상기 나열된 각각의 변수들에 할당된 가중치이다.
다른 양호한 구현예에 있어서,(AgeGT50 및 RBC)가 상기 모델에서 다음에 보여지는 바와 같이 제외될 수 있다:
G+P 지수 = (1*HFREQ+3*Gender+4*SMK)+(5*M1+2*IL-8)
G+P 지수는 0 내지 15의 값을 생성한다. G+P 지수 값 11 내지 15인 환자는 방광암에 대하여 "고 위험"인 것으로 여겨지고, 방광암에 대한 추가적인 작업 요구를 나타낸다. G+P 지수 값 6 내지 10인 환자는 방광암 발병에 대하여 "중간 위험"인 것으로 여겨지고, 추가적인 작업이 표시된다. G+P 지수 값 0 내지 5인 환자는 방광암 발병에 대하여 "저 위험"인 것으로 여겨진다. "저 위험" 그룹의 환자는 관망 대기 리스트에 올려지고, 추가적인 증상들이 나타나거나, 미세 혈뇨의 사건 재발이 발생하면, 그들은 가능한 추가 작업에 대하여 재평가된다.
방광암을 갖지 않거나 갖는 환자들을 구별하기 위하여 유용한 유전자형 변수들은 MDK, CDC, IGFBP5(IGBP5), 및 HOXA13의 조합은 RNA 마커들 "M1"의 발현을 포함한다. 또 다른 유전자형 변수는 IL8R의 RNA 발현이다. 이들 유전자형 변수들에 대한 계수가 다음의 표 7에 나타나 있다. M1 및 IL8R에 대하여 문턱값 4.5와 2.5가 사용되었고, 각각 계수 5와 2가 할당되었다.
G+P 지수는 0 내지 15의 값을 생성한다. G+P 지수 값 11 내지 15는 방광암에 대하여 "고 위험"으로 여겨지고, 방광암에 대한 추가적인 작업 요구를 나타낸다. G+P 지수 값 6 내지 10은 방광암 발병에 대하여 "중간 위험"으로 여겨지고, 추가적인 작업이 표시된다. G+P 지수 값 0 내지 5는 방광암 발병에 대하여 "저 위험"으로 여겨지고 이들 환자들은 대기 리스트에 올려지고, 추가적인 증상들이 나타나거나, 미세 혈뇨의 사건 재발이 발생하면, 가능한 전체 작업에 대하여 재평가된다.
실시예 3에서 더욱 자세히 설명되듯이(도 18 및 19), 표현형 데이터만에 대한 ROC 곡선은 중간 수준의 진단능을 생성한다는 것을 발견하였다. 유전자형 데이터만에 대한 ROC 곡선은 유의한 수준의 진단능을 생성하였다. 본 발명의 발명자들은 유전자형 및 표현형 데이터 양자 모두를 G+P 지수로 조합하였을 때 예기치 않게 더 우수한 진단능이 있다는 것을 발견하였다.
방광암을 갖지 않는 환자들의 유전자 분석
몇 가지 양호한 구현예에 있어서, 본 발명은 4-마커 분석 또는 Cxbladder® 분석(유전자형 변수들), 및 5개의 핵심 위험 인자들(표현형 변수들) 중 하나 이상의 사용을 조합하여, 미시적 또는 거시적 혈뇨 환자들을 거들이 요로상피 암을 가질 잠재적 위험의 관점에서 분류하는데 사용할 수 있는 선별 지수를 생성한다. 유연한 방광경 검사의 필요성을 배제하지는 않으나, 표현형적 변수들 및 유전자형 변수들에 기초하여 요로상피 암 고위험으로 보이는 환자들은 조기에 발견될 수 있고, 잠재적으로 전체적인 환자 결과를 개선시킬 수 있다.
유전자형 마커들은 암이 없는 환자들을 검출하거나, 질병을 가질 위험이 낮은, 중간인 또는 높은 환자 그룹을 선별하는 수단으로서 사용될 수 있다. 예컨대, 상기 마커들은 질병 조직과, 대응하는 비질병 조직 간에 차등적으로 발현될 수 있다. 이러한 상황에서, 차등적 발현의 검출은 상기 질병의 존재와 관련된다. 또는, 상기 마커는 상기 질병 조직에서 발생하는 변화, 또는 상기 질병으로부터 결과하는 변화와 직접적으로 관련될 수 있다. 염증성 질병은 호중구 상승과 관련된다. 호중구 마커 인터류킨 8 수용체 B(IL8Rb; 도 1; SEQ ID NOs 1 및 2)가 시료 중 호중구 존재에 대한 훌륭한 마커를 제공할 수 있고, 따라서 시료 내에서 염증성 질병의 검출, 특히 방광의 염증성 질병의 검출에 대한 진단적 마커로서 사용될 수 있다는 것이 알려졌다.
도 5에서 보여지는바, 소변에서의 IL8Rb의 축적은 방광의 염증성 질환 존재의 표시이다. 구체적으로, 도 5는 질환; 양성 전립선 비대증, 요로 감염, 비특이적 전립선 질환, 혈관 전립선, 2차 와파린 사용을 앓고 있는 환자들의 소변에서 IL8Rb의 축적을 보여준다. 그러나, IL8Rb의 이용이 이들 질병들을 검출하는 것에 국한되는 것이 아니라, 이들 예시들이 IL8Rb가 방광의 염증 질환을 앓고 있는 환자들의 시료에서 실제로 IL8Rb가 증가한다는 것을 보여준다는 것을 이해할 것이다. 즉, IL8Rb는 방광 질병과 관련된 염증의 마커로서 사용될 수 있고 따라서 염증과 관련된 임의의 상태를 검출하는데 사용하기 적합하다. 그러므로, IL8Rb의 양을 검출하는 것은 방광의 염증 질환에 대한 마커로서 사용될 수 있다. 더욱 특히, IL8Rb는 호중구 축적과 관련된 방광의 염증 질환을 검출하기 위하여 사용될 수 있다.
TCC에 대한 소변 시험은 박리된 종양 세포로부터 유래하는 소변 중의 마커 존재에 크게 의존한다. 이들 세포에 대한 검출능은 혈액 및 염증 세포와 같은 다수의 오염 세포의 존재로 인하여 가리워질 수 있다. 게다가, 방광 내벽의 염증은 점막으로부터 비악성 세포들의 박리를 증가시키는 결과를 일으킬 수 있다. 그 결과로, 방광 이행 세포로부터 유래하는 마커를 사용하는 소변 시험은 방광염, 요로 감염 또는 기타 요로의 염증이나 이행 세포 박리를 결과하는 상태, 예컨대 요로 결석증인 환자들로부터 취해진 소변 시료로부터 거짓 양성 결과를 줄 가능성이 높다(Sanchez-Carbayo et al).
이러한 거짓 양성 결과를 시험하고 회피할 한가지 방법은 혈액 또는 염증 세포에서 낮은 상대적 발현을 보이는 마커를 선택하는 것이었다. 이러한 마커의 사용은 비악성, 염증성 상태를 나타내는 TCC 환자들에게서 더 적은 거짓 양성을 이끌어낸다. 그러나, 혈액학적으로 유도되는 세포들 중 마커의 낮은 발현은 비악성 이행 세포의 박리 증대율을 보상하는데 실패한다.
염증 진행된 조직으로부터 박리된 이행 세포의 방광암 소변 시험의 정확성에 대한 부정적인 영향이 요로에 염증 상태를 갖는 환자들에 대한 식별을 향상시킴으로써 최소화될 수 있다는 것이 밝혀졌다. 본 발명에서, 마커 IL8Rb를 하나 이상의 방광 종양 마커(BTM's)와 조합하여 사용되면 놀랍게도 보다 정확한 방광암 검출을 제공한다는 것이 밝혀졌다. 특히, 마커 IL8Rb를 포함하는 방광암용 마커 기반 시험은 결과적으로 염증성 비(非)암 상태를 앓는 환자들인 거짓 양성 결과를 보다 덜 내게 된다.
일반적으로, 염증성 상태의 존재 또는 부존재는 그보다 큰 IL8Rb의 발현이 염증성 상태의 표시가 되는, 유전자 발현의 문턱값을 취함으로써 확인된다. 예컨대, 특정 문턱값을 넘는 IL8Rb의 발현은 그 환자가 염증성 상태에 있다는 것을 진단한다(전술된 문턱값 참조).
IL8Rb를 하나 이상의 방광암 존재에 대한 예측 마커들과 함께 사용하는 경우, 상기 방광 종양 마커(들)의 상승 발현 존재, 및 IL8Rb의 특정 문턱값을 넘는 발현은 염증성 상태이면서 암은 아닌 환자를 예측하게 한다. 또한, 상기 시험이 환자의 소변에 대하여 수행된다면, 이러한 결과는 염증성 방광 질환을 갖는 환자를 예측하게 한다. 방광 종양 마커의 높은 수준은 염증의 결과로서 점막으로부터 나오는 비악성 세포의 결과일 가능성이 매우 높다. 즉, 그 환자는, 방광 종양 마커의 높은 수준에도 불구하고 실제로는 방광암이 아니다 - 거짓 양성.
또는, 환자가 하나 이상의 방광 종양 마커에 대하여 비정상적으로 높은 수준이거나 진단적 수준이지만 IL8Rb의 수준이 문턱값 아래라면, 그 환자는 암을 가능성이 있다. 특히 방광 또는 요로상피 암일 가능성이 있다. 이것은 그 시험이 상기 환자의 소변에서 수행된다면 특히 그러하다. 이러한 결과는 건강 관리자들에게 중요한 이점인 것인데, 왜냐하면 환자가 암인지, 그리고 즉시 치료를 시작할 수 있는지 확신할 수 있고, 그 결과가 실제로 거짓 양성 결과를 나타내는 염증성 상태에서 야기된 것인지 염려하지 않기 때문이다.
놀랍게도, 호중구 마커 인터류킨 8 수용체 B(IL8Rb)를 인코딩하는 유전자의 RNA 정량은 공지의 TCC 또는 BTM 마커들을 이용하여, TCC 환자를 검출하는 전체적인 성능을 향상시킨다는 것이 밝혀졌다. IL8Rb에 대한 참고 서열이 도 1 및 SEQ ID NOs 1 및 2에 보여진다. TCC 검출에서의 그 역할 외에도, IL8Rb가 염증성 질환의 진단에 도움이 될 소변 마커로서 사용될 수 있는지 여부가 연구되었다(도 5).
IL8Rb 마커의 사용은 유전자 발현 수준을 검출하는 공지의 방법들을 이용하여 방광의 염증 상태를 검출하기 위하여 별개로 사용될 수 있다. 유전자 발현 검출 방법의 예시는 아래에 개요된다.
또는, IL8Rb는 하나 이상의 방광 암 겁출을 위한 BTM과 조합될 수 있다. 방광암용 시험의 일부로서 염증성 질환 마커 IL8Rb를 이용함으로써, 거짓 양성 결과를 생성하는데 있어서 염증 진행된 조직의 영향이 최소화된다는 것이 밝혀졌다. 마커 IL8Rb는 임의의 방광암 마커들과 결합하여 사용되거나, 혹은 특징의 일부로서 방광암 검출을 위하여 2 이상의 마커들과 함께 사용될 수 있다.
거짓 양성 결과의 수를 감소시킨다는 것은 방광암을 갖지 않는 환자들이 잠재적으로 불필요한 과정들, 예컨대 그 고유의 위함을 수반하는 방광경 검사 등에 처해지는 경우가 더 적어진다는 것을 의미한다. 거짓 음성 결과의 수를 감소시킨다는 것은 방광암인 환자가 검출되어, 그러므로 암에 대하여 추가 평가될 수 있는 가능성이 높다는 것을 의미한다.
방광암 검출을 향상시키는 IL8Rb의 작용은 비악성 상태를 방광암을 갖는 환자와 분리하는 능력으로부터 결과하는 것이다. 이는 IL8Rb의 증가가 시료 중의 호중구 존재 증가를 표시하는 것이기 때문에 달성된다. 그러므로, IL8Rb의 능력은 사용된 방광 종양 마커에 의존하지 않는다.도 2 및 12 내지 15로부터 보여지듯이, 다양한 방광 종양 마커들 및 방광 종양 마커들의 조합과 조합된 경우, IL8Rb는 대상체들에서 암을 검출하는 마커(들)의 능력 특이도를 증가시키는 일반적인 효과를 가졌다.
본 발명에 따른 특징 중 하나의 예시는 MDK, CDC2, IGFBP5 및 HOXA13과 조합하여 IL8Rb를 사용하는 것인데, 이는 또한 방광암을 검출하기에 적합한 하나 이상의 다른 마커와 함께 조합될 수 있는 것으로, 예컨대 도 6 또는 7에 개요된 마커들 중 임의의 하나 이상이다. 도 14 및 15에 보여지는바, IL8Rb는 마커들의 임의의 조합으로 사용될 수 있는데, 구체적으로 조합 IL8Rb / MDK, IL8Rb / CDC2, IL8Rb / HOXA13, IL8Rb / IGFBP5, IL8Rb / MDK / CDC2, IL8Rb / MDK / HOXA13, IL8Rb / MDK / IGFBP5, IL8Rb / CDC2 / HOXA13, IL8Rb / CDC2 / IGFBP5, IL8Rb / HOXA13 / IGFBP5, IL8Rb / MDK / CDC2 / HOXA13, IL8Rb / MDK / CDC2 / IGFBP5, IL8Rb / CDC2 / HOXA13 / IGFBP5, 및 IL8Rb / MDK / CDC2 / HOXA13 / IGFBP5이다. 도 14 및 15에 보여지는바, IL8Rb의 포함은 대상체에서 방광암을 정확하게 진단하는 마커, 또는 마커들의 조합의 능력을 증가시킨다. 본 발명은 이들 특정 조합에 국한되는 것은 아니고 필요에 따라 하나 이상의 추가적인 방광암 검출에 적합한 마커들을 포함할 수 있는데, 예컨대 도 6 또는 7에 개요된 하나 이상의 임의의 마커들이다. 하기 표 1은 특정 마커 MDK, CDC2, IGFBP5 및 HOXA13 및 IL8Rb에 대한 식별자를 보여준다.
표 1: 방광 종양 마커에 대한 식별자
Figure 112016059878817-pct00002
도 2 내지 4 및 12 내지 17은 4 가지 알려진, 대표적인 방광암 마커; MDK, CDC2, IGFBP5 및 HOXA13와 조합하여 IL8Rb를 사용한 효과를 보여준다. 결과는 IL8Rb가 개별적으로 각각의 마커와 함께 사용되어 포함됨으로써(도 2, 14 및 15 내지 17) 뿐 아니라 4개의 BTM 마커들과 모든 가능한 조합으로 함께 사용되는 경우 TCC 환자들의 시료와 비악성 상태 시료를 구별하는 능력에 있어 개선이 있음을 보여준다.
도 10 내지 13에 보여지는바, IL8Rb을 4개 마커 MDK, CDC2, IGFBP5 및 HOXA13(uRNA-D)와 함께 포함하는 것은 상기 4개 마커들 단독과 비교한 전체적인 시험 성능을 증가시켰을 뿐 아니라, 다른 공지의 시험 NMP22® "미국 매사추세츠 Matritech, Inc.의 등록 상표" Elisa, NMP22 BladderChek®(미국 매사추세츠 Matritech, Inc.의 등록 상표) 및 세포진과 비교하여 극히 우수하였다. 도 14 내지 17은 또한 4개 마커 MDK, CDC2, IGFBP5 및 HOXA13과 다양하게 조합된 IL8Rb의 효과를 보여준다.
도 14는 5 가지 상이한 분류기 모델 (i) 선형 판별 분석(LDA), (ii) 로지스틱 회귀(LogReg), (iii) 서포트 벡터 머신(SVM), (iv) K-최근접 5 이웃(KN5N), 및 (v) 파티션 트리 분류기(TREE)을 이용하여 계산된, IL8Rb를 포함하거나 포함하지 않고, 4개의 마커 MDK, CDC2, IGFBP5 및 HOXA13의 모든 조합에 대한 ROC 곡선을 보여준다. 도 15는 IL8Rb를 포함하거나 포함하지 않은, 4개의 바이오마커의 모든 5 가지 분류기 및 모든 15개 조합에 대한 곡선하면적(AUC)를 도표화한 것이다. 이 AUC 계산은 거짓 양성 비율 0 내지 거짓 양성 비율 20%까지의 영역은 제한되고, 특이도(80-100%)의 유용한 범위를 커버한다. 상기 AUC는 도 14의 ROC 곡선상의 육안 차이를 정량화한다. 도 16은 특이도 (a) 80%, (b) 85%, (c) 90%, (d) 95%, 및 (e) 98%에서 IL8Rb를 포함하거나 포함하지 않고 측정된 4개 마커의 모든 조합에 대한 민감도를 보여준다. 도 17은 각각 고정된 특이도 (a, f) 80%, (b, g) 85%, (c, h) 90%, (d, I) 95%, 및 (e, j) 98%에서 민감도(ROC 곡선상 수직 방향; 더 우수한 것이 "위") 또는 특이도(ROC 곡선상 수평 방향; 더 우수한 것이 좌측) 중 어느 하나의 변화를 도표화한 것이다.
이들 결과는 IL8Rb가 일반적으로 바이오마커들(MDK, CDC2, IGFBP5 및 HOXA13)의 정상 시료로부터 종양을 분류화하기 한 능력을, 독자적으로 또는 조합하여 향상시킴을 보여준다.
이들 결과는 일반적으로 그 시험이 방광암 또는 요로상피 암을 검출할 수 있는 정확도를 증가시킬 수 있었다는 것을 보여준다. IL8Rb를 포함하지 않고는 그리 잘 수행되지 않았던 마커들 또는 그리 잘 수행되지 않았던 분류기들에서 가장 큰 성과가 있었다. IL8Rb를 첨가하기 전에 잘 수행되었고 따라서 개선의 여지가 적었던 마커들 및/또는 분류기들에서 작은 성과가 있었다. 상기 결과가 집단 기반 분석 및 IL8Rb를 포함하는 이점이 각각의 환자들의 진단시, 특히 BTM 마커들의 발현에 대한 진단이 불명확할 수 있는 환자들의 진단시 더 클 수 있다는 것을 보여준다는 점을 아는 것이 중요하다.
이들 결과는 IL8Rb가 방광의 염증성 질환을 검출하기 위하여 사용될 수 있을 뿐 아니라, 방광암에 대한 마커들과 조합하여 사용될 때 "거짓 양성" 결과의 감소로부터 나타나는, 방광암의 검출 향상이라는 결과를 낳는다는 것을 보여준다.
또한, 이들 결과는 IL8Rb가 다양한 마커 조합의 총 성능에 영향을 미치고, IL8Rb가 하나 이상의 방광암 마커들의 환자에서 암을 정확히 검출하는 능력을 향상시킨다는 점에서 IL8Rb의 이용성을 보여준다. 또한, 도 14 및 15는 일 범주의 분류기 모델을 이용하여 동일한 결과들이 달성될 수 있음을 보여주고, 그 결과가 하나의 분류기 모델이나 알고리즘에 의존적이 것이 아닌 사용된 마커들의 조합에 의한 것임을 보여준다. 이들 결과는 임의의 적절한 분류기 모델 또는 알고리즘이 본 발명에서 사용될 수 있다는 것을 확인하여 준다. 특히, 도 14 및 15는 IL8Rb이 더 높은 특이도로, 특히 가장 임상적으로 이용 가능한 범위에서 더 큰 효과를 갖는다는 것을 보여준다.
그러므로, 본 발명의 G+P 지수를 사용하여, 본 발명의 발명자들은 표현형 및 유전자형 변수들에 기초하여 혈뇨를 갖는 환자들을 요로상피 암을 가질 "고 위험"에 있고 즉각적인 추가 작업을 청하는 그룹, "위험"에 있고 즉각적인 작업을 청하는 그룹 및 추후 평가를 위한 관망 리스트에 올려질 수 있는 "저 위험"에 있는 그룹으로 정확히 분류할 수 있다.
체시료 중 유전자 마커의 검출
몇 가지 양호한 구현예에 있어서, 암 분석은 혈액, 혈장, 혈청, 예컨대 복막 세척을 이용하여 얻은 복강액, 또는 기타 체액, 예컨대 소변, 림프, 뇌척수액, 위액로 부터 얻은 시료 또는 대변 시료에 대하여 바람직하게 수행될 수 있다. 방광의 염증성 상태 또는 방광암의 검출을 위하여 시험은 이상적으로는 소변 시료에 대하여 수행된다.
구체적으로, 염증성 방광 질환 또는 방광암을 검출하는 본 발명의 방법은 소변의 표지가 될 임의의 적절한 체시료에 대하여 수행될 수 있으나, 이상적으로 IL8Rb의 수준, 및 임의의 추가적인 암 마커의 수준은 소변 시료로부터 직접적으로 확인된다.
시험은 소변 시료에서 직접적으로 수행될 수 있거나, 또는 시료는 이 기술 분야에서 시료 중의 RNA 및/또는 단백질의 분해를 막고 안정화시키는 것으로 아려진 임의의 적절한 화합물 또는 완충액의 첨가로 안정화될 수 있는데, 이로써 시료는 후일에 분석될 수 있거나 심지어 분석 중 RNA 및/또는 단백질이 안정화될 것을 보장할 수 있다.
대상체의 소변에서 단백질 및/또는 RNA 수준 중 어느 하나를 측정하는 것은 소변에서 직접적으로 수행될 수 있거나, 또는 소변은 처리되어 RNA 및/또는 단백질을 추가 정제 및/또는 농축할 수 있다. 단백질 및/또는 RNA를 추출 및/또는 농축하는 많은 방법들이 이 기술 분야에 잘 알려져 있고, 본 발명에서 사용될 수 있다.
특정 유전자의 발현 수준을, RNA 및/또는 단백질 수준에서 확인하기 위한 많은 방법들이 이 기술 분야에 잘 알려져 있고, 임의의 적절한 방법이 본 발명에서 사용될 수 있다는 것이 이해될 수 있다. 일부 통상적인 방법들이 아래에 개요되지만, 본 발명은 이들 방법에 제한되지 않으며, 단백질 및/또는 RNA 수준을 정량하는 임의의 방법이 본 발명에서 사용되기에 적합하다.
유전자형 마커를 이용한 질병 및 암 검출에의 일반적 접근
발현 수준을 측정하는 임의의 방법이 적절할 것이라는 것이 이해되지만, 발현 수준을 측정하는 일반적인 방법론이 아래에 개요된다.
정량적 PCR(qPCR)
정량적 PCR(qPCR)은 특정 프라이머 및 프로브를 이용하여 종양 시료에 대하여, 혈청 및 혈장에 대하여 수행될 수 있다. 제어된 반응에서, PCR 반응(Sambrook, J., E Fritsch, E. and T Maniatis, Molecular Cloning: A Laboratory Manual 3rd. Cold Spring Harbor Laboratory Press: Cold Spring Harbor (2001))에서 형성된 산물의 양은 출발 주형의 양과 관련이 있다. PCR 산물의 정량은 PCR 반응이 시약들이 모자라게 되기 전 로그 단계에 있을 때 그 반응을 중지함으로써 이루어질 수 있다. 그 후, PCR 산물은 아가로오스나 폴리아크릴아마이드 겔에서 전기영동되어, 에티듐 브로마이드 또는 비슷한 DNA 염색제로 염색되어, 염색 강도를 농도계로 측정한다. 또는, PCR 반응의 진행은 Applied Biosystems' Prism 7000TM(미국, 코네티컷, Applera Corporation의 상표) 또는 Roche LightCyclerTM(미국, 캘리포니아 Roche Molecular Systems, Inc.의 상표)와 같은 PCR 기기를 이용하여 측정될 수 있는데, 이는 실시간으로 산물의 축적을 측정한다. 실시간 PCR은 Sybr Green과 같은 DNA 인터컬레이팅 염료의 합성된 PCR 산물 내에서의 형광, 또는 종결 분자로부터 분해시 리포터 분자에 의하여 방출되는 형광 중 하나를 측정하는데; 리포터 및 종결 분자들은 프라이머 올리고뉴클레오티드로부터 DNA 가닥 연장 후 표적 DNA 분자에 혼성화되는 올리고뉴클레오티드 프로브 내로 혼입되는 것이다. 상기 올리고뉴클레오티드 프로브는 다음 PCR 사이클에서 Taq 폴리머라아제의 효소 작용에 의하여 제거되어 분해되면서, 종결 분자로부터 리포터를 방출한다. Scorpion이라고 알려진 한 가지 변형에 있어서, 상기 프로브는 프라이머에 공유적으로 연결된다.
역전사 PCR(RT-PCR)
RT-PCR은 발현 패턴을 특징화하기 위해서, 매우 관련 있는 RNA를 서로 구분하기 위해서, 그리고 RNA 구조를 분석하기 위해서, 약물 처리를 하거나 하지 않은 정상 조직 및 암 조직 내의 상이한 시료 집단에서의 RNA 수준을 비교하기 위해 사용될 수 있는 방법이다.
RT-PCR을 위한 제1 단계는 RNA를 대상 시료로부터 분리하는 것이다. 출발 물질은 전형적으로는 인간 암 또는 암 세포주, 및 해당하는 정상 조직 또는 세포주로부터 분리된 전체 RNA이다. RNA는 다양한 시료로부터 분리될 수 있는데, 예컨대 유방, 폐, 장(예를 들면, 대장 또는 소장), 대장결장, 위, 식도, 항문, 직장, 전립선, 뇌, 간, 신장, 췌장, 비장, 흉선, 정소, 난소, 자궁, 방광 등의 조직으로부터, 1차 암, 또는 암 세포주, 및 건강한 수여자로부터의 모아진 시료로부터 분리될 수 있다. RNA 출처가 암인 경우에, RNA는 예를 들면, 동결되거나 보관된, 파라
핀에 담지되어 고정된(예를 들면, 포르말린에 고정된) 조직 시료로부터 추출될 수 있다.
RT-PCR에 의한 유전자 발현 특징 분석의 제1 단계는, RNA 주형을 cDNA로 역전사시킨 다음에, PCR 반응으로 지수적으로(exponential) 증폭시키는 것을 포함한다. 가장 흔히 사용되는 두 개의 역전사 효소는 조류 미엘로블라스토시스 바이러스 역전사효소(AMV-RT) 및 Moloney 쥣과 백혈병 바이러스 역전사효소(murine leukaemia virus reverse transcriptase, MMLV-RT)이다. 역전사 단계는 발현 특징 분석의 환경 및 목표에 따라, 특이적인 프라이머, 랜덤 헥사머, 또는 올리고-dT 프라이머를 사용하여 프라이밍된다. 예를 들어, 추출된 RNA는 제조업자의 지시에 따라, GeneAmp® RNA PCR 키트(Perkin Elmer, CA, USA)를 사용하여 역전사될 수 있다. 만들어진 cDNA는 추후의 PCR 반응에 주형으로서 사용될 수 있다.
PCR 단계에서는, 다양한 열에 안정한 DNA-의존적 DNA 폴리머라아제를 사용할 수 있지만, 보통은 Taq DNA 폴리머라아제를 사용하고, 이 효소는 5'-3' 뉴클레아제 활성을 가지지만, 3'-5' 프루프리딩(proofreading) 엔도뉴클레아제 활성을 가지지는 않는다. 그러므로, TaqMan® qPCR(미국, 캘리포니아 Roche Molecular Systems, Inc.의 등록 상표)은 전형적으로는 표적 앰플리콘(amplicon)에 결합된 혼성화 프로브를 가수분해 하기 위해서, Taq 또는 Tth 폴리머라아제의 5' 뉴클레아제 활성을 활용하지만, 동등한 5' 뉴클레아제 활성을 가지는 임의의 효소를 사용할 수도 있다.
PCR 반응의 전형적인 앰플리콘을 발생시키기 위해서는 두 개의 올리고뉴클레오티드 프라이머를 사용할 수 있다. 제3의 올리고뉴클레오티드, 또는 프로브는 두 개의 PCR 프라이머 간에 위치한 뉴클레오티드 서열을 검출하도록 디자인된다. 프로브는 Taq DNA 폴리머라아제 효소에 의해 연장될 수 없고, 리포터인 형광 염료 및 퀸처
(quencher) 형광 염료로 표지된다. 리포터 염료로부터의 임의의 레이저 유도 방출은, 두 개의 염료가 근접하게 위치하게 되면 이들이 프로브 위에 있을 때 퀸칭 염료에 의해 퀸칭된다. 증폭 반응 중에는, Taq DNA 폴리머라제 효소는 주형 의존적인 방식으로 프로브를 절단한다. 생성된 프로브 단편은 용액에서 해리되고, 방출된 리포터 염료로부터의 신호에는 제2 형광물질(fluorophore)의 퀸칭 효과가 발생하지 않게 된다. 하나의 리포터 염료 분자는 각각의 신규 합성된 분자에 대해 자유롭게 되고, 퀸칭되지 않은 리포터 염료의 검출은 데이터의 정량적 해석에 대한 기초를 제공한다.
TaqMan® RT-PCR(미국, 캘리포니아 Roche Molecular Systems, Inc.의 등록 상표)은 시판되는 장치를 사용하여 수행될 수 있으며, 예를 들면 ABI PRISM 7700TM Sequence Detection System(미국, 코네티컷, Applera Corporation의 상표)
(Perkin-Elmer- Applied Biosystems, Foster City, CA, USA), 또는 LightcyclerTM(미국, 캘리포니아 Roche Molecular Systems, Inc.의 등록 상표)(Roche Molecular
Biochemicals, Mannheim, Germany)가 있다. 바람직한 구체예에서, 5' 뉴클레아제 절차는 ABI PRISM 7700TM Sequence Detection System과 같은 실시간 정량 PCR 장치 상에서 실행된다. 시스템은 써모사이클러(thermocycler), 레이저, 전하결합소자(charge-coupled device, CCD), 카메라, 및 컴퓨터로 구성된다. 시스템은 써모사이클러 상의 96-웰 포맷에서 시료를 증폭시킨다. 증폭 도중에, 레이저 유도된 형광 시그널은 모든 96 웰에 대한 광섬유 케이블을 통해 실시간으로 수집되고, CCD로 검출된다. 시스템은 장치 실행용 및 데이터 분석용 소프트웨어를 포함한다.
5' 뉴클레아제 분석 데이터는 처음에 Cp, 또는 문턱값 사이클(threshold cycle)로 표현된다. 상기에 언급하였듯이, 형광 값은 매 사이클마다 기록되고, 이값은 증폭 반응에서 그 시점까지 증폭된 산물의 양을 나타낸다. 형광 신호가 최초로 통계학적으로 유의하게 기록된 시점을 문턱값 사이클(threshold cycle), Cp라고 한다.
실시간 정량 PCR(qPCR)
RT-PCR 기술에 대한 최근의 변화는 실시간 정량 PCR인데, 이는 이중으로 표지된 형광발생 프로브(즉, TaqMan® 프로브)을 통해 PCR 산물 축적량을 측정하는 것을 말한다. 실시간 PCR은 정량적 경쟁적(competitive) PCR 및 정량적 비교(comparative) PCR 모두와 함께 사용할 수 있다. 경쟁적 PCR은 정규화를 위해 각 표적(target) 서열에 대한 내부적 경쟁자를 사용하는 반면에, 정량적 PCR은 시료 내에 함유된 정규화 유전자를 사용하거나, RT-PCR에 대한 하우스키핑 유전자를 사용한다. 더 자세한 사항은 예를 들면, 하기의 문헌에 제공되어 있다: Held et al., Genome Research 6: 986-994 (1996).
발현 수준은 고정된, 파라핀에 담지된 조직을 RNA 출처로서 사용하여 측정할 수 있다. 본 발명의 하나의 측면에 따르면, PCR 프라이머는 증폭될 유전자에 존재하는 인트론(intron) 서열 측면으로 디자인된다. 하나의 구현예에서, 프라이머/프로브 디자인의 제1 단계는 유전자 내의 인트론 서열을 서술(delineation) 하는 것이다.
이것은 무료로 제공되는 소프트웨어, 예컨대 Kent, W. J., Genome Res. 12 (4): 656-64 (2002)에 의해 개발된 DNA BLAT 소프트웨어, 또는 이의 변형을 포함하는 BLAST 소프트웨어에 의해 수행될 수 있다. 추후의 단계는 잘 정립되어 있는 PCR 프라이머 및 프로브 디자인 방법을 따른다.
비특이적인 시그널을 회피하기 위하여, 프라이머 및 프로브를 디자인할 때 인트론내의 반복 서열을 마스킹(mask)하는 것이 유용하다. 이는 Baylor College of Medicine을 통해 온라인으로 입수가능한 Repeat Masker program을 사용하여 용이하게 달성할 수 있는데, 즉 반복 요소(repetitive element)의 라이브러리에 대한 DNA 서열을 스크린하고, 반복 요소가 마스킹된 미지 서열(query sequence)을 되돌린다(return). 이어서 마스킹된 서열은 시판되거나 그러지 않으면 무료로 구할 수 있는 프라이머/프로브 디자인 패키지, 예컨대 Primer Express(Applied Biosystems); MGB assay-by- design(Applied Biosystems); Primer3(Steve Rozen and Helen J. Skaletsky(2000) Primer3 on the VIMNV for general users and for biologist programmers in: Krawetz S, Misener S(eds) Bioinformatics Methods and Protocols: Methods in Molecular Biology. Humana Press, Totowa, NJ, pp 365-386)를 이용하여 프라이머 및 프로브 서열을 디자인하는데 사용될 수 있다.
PCR 프라이머 디자인에서 고려되어야 할 가장 중요한 인자는 프라이머 길이, 용융 온도(Tm), 및 G/C 함량, 특이성, 상보적인 프라이머 서열, 및 3' 말단 서열이다. 일반적으로, 최적의 PCR 프라이머는 보통 17-30 염기 길이이고, 약 20-80%, 예컨대 약 50-60% G+C 염기를 함유한다. 50 내지 80℃ 사이의 용융 온도, 예를 들면 50 내지 70℃ 사이의 용융 온도가 보통 바람직하다. PCR 프라이머 및 프로브 디자인에 대한 추가의 가이드라인은 예를 들면, Dieffenbach, C. W. et al., General Concepts for PCR Primer Design in: PCR Primer, A Laboratory Manual, Cold Spring Harbor Laboratory Press, New York, 1995, pp. 133-155; Innis and Gelfand, Optimization of PCRs in: PCR Protocols, A Guide to Methods and Applications, CRC Press, London, 1994, pp. 5-11; and Plasterer, T. N. Primerselect: Primer and probe design. Methods MoI. Biol. 70: 520-527 (1997)를 참조하면 되고, 상기 문헌의 내용은 본원에 참조로서 인용된다.
마이크로어레이 분석
차등적인 발현은 마이크로어레이 기술을 사용하여 동정, 또는 확인할 수 있다. 그러므로, 질병 특이적 마커의 발현 프로파일은 마이크로어레이 기술을 사용하여 신선한 암 조직이나 파라핀에 담지된 암 조직에서 측정될 수 있다. 이 방법에서, 해당 폴리뉴클레오티드 서열(cDNA 및 올리고뉴클레오티드 포함)은 마이크로칩 기질 상에 플레이팅 또는 배치된다. 배치된 서열(즉, 포획 프로브)은 이어서 해당 세포 또는 조직으로부터의 특이적인 폴리뉴클레오티드(즉, 표적)와 함께 혼성화된다. RT-PCR 방법에서와 같이, RNA의 출처는 보통 인간 암 또는 암 세포주, 및 해당 정상 조직 또는 세포주에서 분리된 전체 RNA이다. 즉, RNA는 다양한 1차 암 또는 암 세포주로부터 분리될 수 있다. RNA 출처가 1차 암인 경우, RNA는 예를 들면, 냉동된 또는 보관된 포르말린으로 고정된 파라핀에 담지된(FFPE) 조직 시료 및 고정된(예를 들어, 포르말린 고정된) 조직 시료로부터 추출될 수 있고, 이들은 매일 임상적인 실시에서 통상적으로 제조되고 보관된 것들을 말한다.
마이크로어레이 기술의 특정한 구체예에서, PCR로 증폭된 cDNA 클론의 삽입물은 기질에 적용된다. 기질은 최대 1, 2, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 또는 75 뉴클레오티드 서열을 포함할 수 있다. 다른 측면에서, 기질은 적어도 10,000 뉴클레오티드 서열을 포함할 수 있다. 마이크로칩에 고정된 마이크로어레이 서열은 엄격한 조건 하에서 혼성화되기에 적합하다. 다른 구체예로서, 마이크로어레이에 대한 표적은 적어도 50, 100, 200, 400, 500, 1000, 또는 2000 염기 길이일 수 있거나, 50-100, 100-200, 100- 500, 100-1000, 100-2000, 또는 500-5000 염기 길이일 수 있다. 또다른 구체예로서, 마이크로어레이에 대한 포획 프로브는 적어도 10, 15, 20, 25, 50, 75, 80, 또는 100 염기 길이일 수 있거나, 10-15, 10-20, 10-25, 10-50, 10-75, 10-80, 또는 20-80 염기 길이일 수 있다.
형광으로 표지된 cDNA 프로브는 해당 조직으로부터 추출된 RNA의 역전사에 의해 형광 뉴클레오티드의 혼입을 통해서 발생될 수 있다. 칩에 적용되는 표지된 cDNA 프로브는 어레이 상의 DNA의 각 스팟에 특이성을 가지고 혼성화된다. 비특이적으로 결합된 프로브를 제거하기 위해서 엄격한 조건의 세척을 한 후에, 칩을 공초점 레이저 현미경 또는 다른 검출 방법, 예컨대 CCD 카메라로 스캐닝한다. 각각의 배치된 요소가 혼성화된 것을 정량하면, 해당하는 mRNA의 양이 측정된다. 이중(dual) 색상 형광 레이블을 사용하여, 두 개의 RNA 출처로부터 발생된, 따로 표지된 cDNA 프로브는 어레이에 쌍을 이루면서 혼성화된다. 각각의 특정된 유전자에 해당하는 두 개의 출처로부터의 전사체의 상대적인 양은 이런 방식으로 동시에 측정된다.
혼성화를 소형화하면, 다수의 유전자에 대한 발현 패턴을 편리하고 신속하게 평가할 수 있도록 해준다. 이러한 방법은 희귀한 전사체를 검출하기 위해 요구되는 민감도를 가지게 해 주는 것으로 보이는데, 이들은 세포당 소수의 카피로 발현되고, 발현 수준에서 적어도 대략 2-배 차이를 재현가능하게(reproducibly) 검출할 수 있다(Schena et al., Proc. Natl. Acad. Sci. USA 93 (2): 106-149 (1996)). 마이크로어레이 분석은 제조업자의 프로토콜에 따라, 예컨대 Affymetrix GenChip® 기술, Illumina 마이크로어레이 기술 또는 Incyte 마이크로어레이 기술을 사용함으로써, 시판되는 장치로 수행될 수 있다. 유전자 발현의 대규모 분석을 위한 마이크로어레이 방법의 개발은, 암 분류의 분자적 마커, 및 다양한 암 유형의 결과 예측을 체계적으로 연구할 수 있도록 해준다.
RNA 분리, 정제, 및 증폭
mRNA 추출을 위한 일반적인 방법은 당업계에 익히 공지되어 있고, 표준 분자생물학 교과서, 즉 Ausubel et al., Current Protocols of Molecular Biology, John Wiley and Sons (1997) 등에 개시되어 있다. 파라핀에 담지된 조직으로부터 RNA를 추출하기 위한 방법은 예를 들면, Rupp and Locker, Lab Invest. 56: A67 (1987), 및 De Sandres et al., BioTechniques 18: 42044 (1995)에 개시되어 있다. 특히, RNA 분리는 Qiagen과 같은 제조업자로부터의 정제 키트, 완충액 세트, 및 프로테아제를 사용하여, 제조업자의 지시에 따라 수행될 수 있다. 예를 들면, 배양액 중의 세포로부터의 전체 RNA는 Qiagen RNeasy® "독일, 힐덴, Qiagen GmbH의 등록 상표" mini-columns를 사용하여 분리할 수 있다. 기타의 시판되는 RNA 분리용 키트는 MasterPureTM Complete DNA and RNA Purification Kit(EPICENTRE(D, Madison, WI), 및 Paraffin Block RNA Isolation Kit(Ambion, Inc.)가 있다. 조직 시료로부터의 전체 RNA는 RNA Stat-60(Tel-Test)를 사용하여 분리할 수 있다. 암으로부터 제조된 RNA는 예를 들면, 세슘 클로라이드 밀도 구배 원심 분리에 의해 분리될 수 있다.
RNA 출처로서, 고정된, 파라핀에 담지된 조직을 사용하고, mRNA 분리, 정제, 프라이머 연장 및 증폭을 포함하는, 유전자 발현을 특징분석하기 위한 대표적인 프로토콜의 단계는, 각종 공개된 논문에 제시되어 있다(예를 들면: T. E. Godfrey et al. J. Molec. Diagnostics 2: 84-91 (2000); K. Specht et al., Am. J. Pathol. 158: 419-29 (2001)). 간단히 말해서, 대표적인 과정은 파라핀에 담지된 암 조직 시료를 약 10 미크론 두께의 절편으로 절단하는 것으로부터 시작한다. 그 다음에 RNA를 추출하고, 단백질 및 DNA를 제거한다. RNA 농도 분석이 끝난 후에는, RNA 수선 및/또는 증폭 단계가 필요한 경우 포함될 수 있으며, RNA를 유전자 특이적인 프로모터를 사용하여 역전사시키고, RT-PCR을 수행한다. 마지막으로, 시험된 암 시료에서 동정된 특징적인 유전자 발현 패턴을 근거로 하여 환자에게 적용할 수 있는 최상의 치료 옵션을 확인하기 위하여 데이터를 분석한다.
면역조직화학 및 프로테오믹스(proteomics)
면역조직화학 방법도 본 발명의 증식 마커의 발현 수준을 검출하기 위해 적당하다. 그러므로, 항체 또는 항혈청, 바람직하게는 폴리클로날 항혈청, 및 가장 바람직하게는 각 마커에 대해 특이적인 모노클로날 항체를, 발현을 검출하는 데 사용한다. 항체는 항체 그 자체의 직접적인 표지에 의해 검출될 수 있는데, 예를 들면, 방사선 레이블, 형광 레이블, 바이오틴과 같은 햅텐(hapten) 레이블, 또는 호스 래디쉬 퍼옥시다아제(horse radish peroxidase) 또는 알칼리 포스파타제(alkaline phsphatase)와 같은 효소로 표지된다. 또는 달리, 표지되지 않은 1차 항체는 표지된 2차 항체와 컨쥬게이팅되어 사용되는데, 2차 항체에는 1차 항체에 대해 특이적인 항혈청, 폴리클로날 항혈청 또는 모노클로날 항체가 포함된다. 면역조직화학 프로토콜 및 키트는 당업자에게 익히 공지되어 있고, 시판되고 있다.
프로테오믹스는 특정 시점에, 시료(예를 들어, 조직, 생물 또는 세포 배양액)에 존재하는 폴리펩타이드를 분석하기 위해 사용될 수 있다. 특히, 프로테오믹스 기술은 시료 중의 폴리펩타이드 발현의 전체적인(global) 변화를 측정하는데 사용될 수 있다(이는 또한 발현 프로테오믹스라고 불린다). 프로테오믹스 분석은 전형적으로는 하기를 포함한다: (1) 2-D 폴리아크릴아마이드 겔 전기영동(2-D PAGE)에 의한, 시료 중의 각각의 폴리펩타이드의 분리; (2) 예를 들어, 질량분석기 또는 N-말단 서열분석에 의한, 겔로부터 회수된 각각의 폴리펩타이드의 동정, 및 (3) 바이오인포매틱스(bioinformatics)를 이용한 데이터의 분석. 프로테오믹스 방법은 다른 유전자 발현 특징분석 방법에 대한 유용한 보완책이고, 단독으로 또는 다른 방법과 함께, 본 발명의 증식 마커의 산물을 검출하는데 사용될 수 있다.
마커에 대하여 선택적인 핵산 프로브를 이용하는 혼성화 방법
이들 방법은 기판으로의 핵산 프로브의 결합 및 시험 시료로부터 유래된 RNA 또는 cDNA와 적정 조건하에서 혼성화하는 것을 포함한다(Sambrook, J., E Fritsch, E. and T Maniatis, Molecular Cloning: A Laboratory Manual 3rd. Cold Spring Harbor Laboratory Press: Cold Spring Harbor (2001)). 이들 방법은 종양 조직 또는 액체 시료로부터 유래하는 마커에 적용될 수 있다. RNA 또는 cDNA의 준비는 통상 형광 또는 방사성 분자로 표지되어 검출 및 정량이 가능토록 한다. 몇몇 적용에 있어서, 혼성화 DNA는 분지화된, 형광 표지된 구조체로 태그되어 신호 세기를 증강시킨다(Nolte, F.S., Branched DNA signal amplification for direct quantitation of nucleic acid sequences in clinical specimens. Adv. Clin. Chem. 33, 201-35 (1998)). 비혼성화된 레이블은 겔 이미지의 형광 검출 또는 농도 측정에 의하여 혼성화된 양을 정량하기 전에 0.1x SSC, 0.5% SDS와 같은 저염 용액으로 강하게 수세함으로써 제거된다. 기판은 고체, 예컨대 나일론이나 니트로셀룰로오스 멤브레인이거나, 또는 액체 현탁액 내에서인 경우 혼성화되는 마이크로스피어 또는 비드로 이루어질 수 있다. 수세 및 정제를 가능케 하기 위하여 비드는 자성이거나(Haukanes, B-1 and Kvam, C., Application of magnetic beads in bioassays. Bio/Technology 11, 60-63 (1993)) 유세포 분석을 가능케 하기 위한 형광 표지된 것일 수 있다(예컨대 Spiro, A., Lowe, M. and Brown, D., A Bead-Based Method for Multiplexed Identification and Quantitation of DNA Sequences Using Flow Cytometry. Appl. Env. Micro. 66, 4258-4265 (2000) 참조).
혼성화 기법의 한 가지 변형은 형광 비드 기판을 분지화된 DNA 신호 증폭과 조합한 QuantiGene Plex® 분석(미국, 캘리포니아 Panomics의 등록 상표)(Genospectra, Fremont)이다. 혼성화 기법의 또 다른 변형은 Quantikine® mRNA 분석(미네아폴리스, R&D Systems)이다. 방법론은 제조자의 설명에서 기재되는 바와 같다. 간단히, 상기 분석은 디곡시게닌에 컨쥬게이션되는 올리고뉴클레오티드 혼성화 프로브를 이용한다. 혼성화는 비색 분석에서 알칼라인 포스파타아제에 커플링된 항-디곡시게닌 항체를 이용하여 검출된다.
다른 방법들이 이 기술 분야에 잘 알려져 있고 본 발명에서 더 설명하는 것은 불필요하다.
효소-결합 면역학적 분석(ELISA)
간단히, 샌드위치 ELISA 분석에서, 마커에 대응한는 폴리클로날 또는 모노클로날 항체는 고체 기판(Crowther, J.R. The ELISA guidebook. Humana Press: New Jersey (2000); Harlow, E. and Lane, D., Using antibodies: a laboratory manual. Cold Spring Harbor Laboratory Press: Cold Spring Harbor (1999)) 또는 현탁액 비드에 결합된다. 다른 방법들이 이 기술 분야에 알려져 있고, 본 발명에서 더 설명할 필요는 없다. 모노클로날 항체는 하이브리도마-유래된 것이거나 파지 항체 라이브러리로부터 선택된 것일 수 있다(Hust M. and Dubel S., Phage display vectors for the in vitro generation of human antibody fragments. Methods Mol Biol. 295:71-96 (2005)). 비특이적 결합 부위는 비-표적 단백질 제조 및 변성제로 블로킹된다. 그 후, 포획 항체가 항원을 함유하는, 환자로부터의 준비된 시료 또는 조직과 반응하게 된다. 항체/항원 복합체가 표적 마커를 검출하는 제2 항체와 반응되기 전에 혼합물은 수세된다. 상기 제2 항체는 통상, 효소적 반응으로 검출되거나 리포터에 컨쥬게이션되는 제3의 항체를 이용하여 검출될 수 있는 형광 분자 또는 기타 리포터 분자와 컨쥬게이션되어 있다 (Crowther, Id.). 또는, 직접 ELISA에서는, 마커를 함유하는 제조물이 기판 또는 비드에 결합될 수 있고, 표적 항원이 항체-리포터 컨쥬게이트를 이용하여 직접 검출될 수 있다(Crowther, Id.).
모노클로날 항체 및 폴리클로날 항혈청의 제조 방법은 이 기술 분야에 잘 알려져 있고 본 발명에서 추가로 설명할 필요가 없다.
면역검출
또한, 종양을 제거하기 위한 수술 전 및 후에 취해진 방광암 환자로부터의 혈청 또는 혈장에서의 마커 패밀리원의 면역 검출, 다른 암, 예컨대 결장암, 췌장암, 난소암, 흑색종, 간암, 식도암, 위암, 자궁내막암 및 뇌암 등을 포함하지만 이에 한정되지는 않는 다른 암을 앓는 환자들에서의 마커 패밀리원의 면역 검출 및 방광암 환자로부터의 소변 및 대변에서 마커 패밀리원의 면역 검출을 위한 방법들이 사용될 수 있다.
질병 마커는 또한, 면역블롯팅 또는 면역침전과 같은 다른 표준적 면역검출 기법들을 이용하여 조직 또는 시료에서 검출될 수 있다(Harlow, E. and Lane, D., Using antibodies: a laboratory manual. Cold Spring Harbor Laboratory Press: Cold Spring Harbor (1999)). 면역블롯팅에서, 마커를 함유하는 조직 또는 액으로부터의 단백질 조제물은 변성 조건 또는 비변성 조건하에서 폴리아크릴아마이드 겔을 통하여 전기영동된다. 그 후, 단백질을 나일론과 같은 멤브레인 기판으로 옮긴다. 그 후, 마커는 면역조직화학에서 설명하는대로 모노클로날 또는 폴리클로날 항체를 이용하여 직접 또는 간접적으로 반응하게 된다. 또는, 몇 가지 제조물에서는, 상기 단백질들이 사전 전기영동 분리없이 멤브레인 상에 직접 스폿팅될 수 있다. 신호는 농도계로 정량될 수 있다.
면역침전법에서, 마커를 함유하는 용해성 제조물은 마커에 대응하는 모노클로날 항체 또는 폴리클로날 항체와 반응한다. 그 후, 반응물을 공유적으로 부착된 단백질 A 또는 단백질 G를 함유하는 아가로오스 또는 폴리아크릴아마이드로 만들어진 불활성 비드와 반응시킨다. 단백질 A 또는 G 비드는 특이적으로 항체와 상호작용하여 상기 비드에 결합되는 항체-마커-항원 고정 복합체를 형성한다. 수세 후, 결합된 마커는 면역블롯팅 또는 ELISA에 의하여 검출되고 정량될 수 있다.
유전자형 분석에 기반한 진단 구축
일단 IL8Rb, 및 필요에 따라 하나 이상의 추가적인 암 마커들의 발현 수준이 얻어졌다면, 그 후 그 대상체에 대한 진단이 확립될 수 있다. 상기 IL8Rb의 발현이 염증성 방광 질환을 갖지 않는 대상체에서 발견되는 발현보다 크고, 및/또는 염증성 방광 질환을 갖는 것으로 알려진 대상체들의 발현 수준과 일치한다면, 그 대상체는 염증성 방광 질환을 갖는 것으로 진단될 것이다. 또는, 그 발현이 염증성 방광 질환을 갖지 않는 대상체들에서 나타나는 발현보다 크지 않고, 및/또는 염증성 방광 질환을 갖는 것으로 알려진 대상체들의 발현 수준 아래이면, 그 대상체는 염증성 방광 질환이 아닌 것으로 진단될 것이다.
IL8Rb가 하나 이상의 방광암에 대한 마커들과 함께 사용되는 경우에는, 그렇다면 IL8Rb의 발현 수준은 염증성 방광 질환이 없는 대상체들 및/또는 염증성 방광 질환을 갖는 것으로 알려진 대상체들의 발현 수준과 비교될 것이다. 하나 이상의 암 마커들은 방광암이 없는 대상체들 및/또는 방광암을 갖는 것으로 알려진 대상체들에서의 발현 수준과 비교된다. IL8Rb의 발현 수준이 염증성 방광 질환을 갖지 않는 대상체와 일치하고(염증성 방광 질환을 갖는 대상체 미만) 하나 이상의 방광암 마커의 발현 수준이 방광암을 갖는 대상체와 일치한다면(방광암을 갖지 않는 대상체와 구별), 그렇다면 그 대상체는 방광암을 갖는 것으로 진단된다. IL8Rb의 발현 수준이 염증성 방광 질환을 갖지 않는 대상체보다 크고(염증성 방광 질환을 갖는 대상체와 일치) 하나 이상의 방광암 마커의 발현 수준이 방광암을 갖는 대상체와 일치한다면(방광암을 갖지 않는 대상체와 구별), 그렇다면 그 대상체는 염증성 방광 질환을 갖는 것으로 진단된다. IL8Rb의 발현 수준이 염증성 방광 질환을 갖지 않는 대상체와 일치하고(염증성 방광 질환을 갖는 대상체 미만) 하나 이상의 방광암 마커들의 발현 수준이 방광암을 갖지 않는 대상체와 일치한다면(방광암을 갖는 대상체와 구별), 그렇다면 그 대상체는 방광암 또는 염증성 방광 질환 그 어느 것도 갖지 않는 것으로 진단된다.
진단 마커의 정상 및 질병 발현 간 발현 수준에 종종 중복이 있기 때문에, 대상체에 대한 진단을 확립하기 위하여 분류 문턱값을 세우는 것이 일반적이다. 분류 문턱값은 대상체들을 질병 또는 비질병 카테고리로 구별하는 값 또는 문턱값이다. 문턱값은 흔히 수신자 작동 특성(ROC) 곡선을 이용하여 평가되는데, 이는 모든 가능한 문턱값에 대하여 민감도 대 특이도를 플롯팅한다.
진단 문턱값의 결정
질병 마커를 이용하는 시험을 위하여, 시료로 하여금 그 질병, 예컨대 방광암에 대한 양성 또는 음성 중 하나로 불리도록 하는 진단 문턱값이 유도될 수 있다. 이들 진단 문턱값은 방광암 또는 염증성 방광 질환의 존재에 대하여 조사되는 환자 코호트 분석에 의하여 결정된다. 진단 문턱값은 여러 시험 적용에 대하여 달라질 수 있는데; 예컨대, 지단 스크리닝 시험 용도의 진단 문턱값은 대부분 비뇨기과적 증상이 없는 환자들의 코호트를 이용하여 결정되고 이들 진단 뭍넉값은 방광암 재발에 대한 감시하에 있는 환자들에 대한 시험에서 사용되는 것과는 다를 것이다. 진단 문턱값은 요구되는 임상적 세팅에서 실시적 수준의 시험 특이도를 제공하도록 선택될 수 있는데; 즉, 거짓 양성 결과를 받는 환자들의 수가 과다하지 않은 합리적 민감도를 가능게 하는 특이도가 그러하다. 이러한 특이도는 80-100% 범위 내일 수 있다.
진단 문턱값은 예상 임상 시험으로부터의 각각의 시료에 각각의 마커의 유전자형 발현 수준을 조합하는 알고리즘을 적용하여 결정된다.
사용되는 시료는 방광암 및 다양한 비악성 비뇨기 질환을 갖는 환자들로부터 유래한다. 진단 문턱값은 원하는 특이도를 결과하게 하는 알고리즘 점수를 결정함으로써 선택된다. 예컨대, 어떤 적용에 있어서는, 특이도 85%가 바람직하다. 그 후, 진단 문턱값은 방광암을 갖지 않는 환자의 85%가 암에 대하여 음성으로 올바르게 분류화되는 결과를 낳는 알고리즘 점수를 선택함으로써 설정된다. 다른 적용에 있어서(예컨대 집단 스크리닝), 예컨대 90%와 같은 더 높은 특이도가 선호된다. 이러한 적용을 위하여 문턱값을 설정하기 위하여는, 방광암을 갖지 않는 환자의 90%가 암에 대하여 음성인 것으로 정확하게 분류되는 결과를 낳는 알고리즘 점수가 선택된다. 알고리즘의 사용 예시는 실시예에 개요된다.
유일한 문턱값에 대한 대안으로서, 상기 시험은 질환 존재의 가능성에 대한 상이한 정도를 제공하고, 그와 관련하여 상이한 임상적 결과를 갖는 시험 구간을 이용할 수 있다. 예컨대, 시험은 3개의 구간을 가질 수 있는데; 방광암의 존재에 대한 고 위험(예컨대, 90%)과 관련된 것, 방광암의 낮은 위험과 관련된 제2의 것 및 질환 의심인 것으로 간주되는 제3의 것이다. "의심" 구간은 정의된 시간 기간에 반복적 시험 추천과 연관될 수 있다.
데이터 분석
일단 RNA 및/또는 단백질 양을 시험하는 방법이 완료되면, 그 후 데이터는 종양 및 비종양 시료와 관련된 바이오마커 수치 분포를 결정하기 위하여 부넉되어야 한다. 이는 통상적으로 표준과 비교하여 원형 데이터를 정규화하는 단계, 즉 "잡음" 등 배경을 제거하고 임의의 2회차(그 이상)를 평균내는 단계 및 시료를 2개의 부류로 최적으로 분리하기 위한 컷-오프 또는 문턱값을 구축하는 단계를 수반한다. 이를 위한 많은 방법들이 알려져 있고, 정확한 방법은 사용되는 RNA 및/또는 단백질 양을 측정하는 구체적인 방법에 따를 것이다.
아래에, qRT-PCR을 이용하는 경우 어떻게 데이터 분석이 수행될 수 있는지의 예시가 있다. 그러나, 일반적인 과정은 RNA 및/또는 단백질 함량을 확인하는 다른 방법들을 위하여 사용되도록 조정될 수 있거나, 동일한 결과를 달성하기 위하여 이 기술 분야의 숙련자에 의하여 다른 방법들이 구축될 수 있다는 것이 이해될 것이다.
데이터
형광 측정은 PCR 각 사이클에서 파장 ωi i=1,2로 이루어진다. 따라서, 각 웰에 대하여, f t i )로 나타내는 한 쌍의 형광 곡선을 관찰하는데, 여기서 t=1,...,k 는 사이클 수를 나타내고 i = 1,2는 파장을 가르킨다.
형광 곡선은 수평 기준선 근처에서 시작하고 상부 점근선까지 완만하게 증가하는 S자형을 갖는다. 형광 곡선이 선형 기준선으로부터 출발하는 Cp 포인트 지점이 표적 유전자의 농도를 특징화하는데 사용될 것이다. Cp의 정확한 정의는 후술한다.
다음은 이들 데이터를 처리하는 방식의 예시이다.
- 주파수 대역 간 중복되는 형광에 대한 보정
- Cp 추정을 위하여 각 형광 곡선에 대한 원만한 모델을 추정
- 복제된 웰로부터의 데이터 조합
- 표준 곡선 추정
- 표준에 대한 상대적 농도 계산.
각각의 생물학적 시료는 5개 유전자의 상대 농도를 산출해 내는데, 이는 판별 함수로의 입력값이다.
색 보정
염료 j, 사이클 t 및 주파수 ω의 형광 수준을 W tj (ω)로 나타낸다. 멀티 플렉스 분석에서, 임의의 주파수 ω에서 측정된 응답은 그 주파수에서 모든 염료들의 기여에 대한 합이고, 각 사이클에 대하여 그러하다.
Figure 112016059878817-pct00003
색 보정의 목적은 관찰된 혼합물 f t i )로부터 개별적인 기여분 W tj (ω)를 추출하기 위한 것이다.
이상적인 상황에서, 주파수 ω에서 염료 j로 인하여 형광 W tj 0 ) W tj 0 )의 수준에 무관하게 기준 주파수 ω0에서 그 형광 W tj 0 )에 비례한다. 이는 결정될 비례 상수 A12 및 A21에 대한 선형 관계를 제시한다.
Figure 112016059878817-pct00004
현실에서, 추가적인 효과가 있고, 이는 이러한 계에 선형 조건을 도입함으로써 효과적으로 모델링되는 것으로 하기와 같다.
Figure 112016059878817-pct00005
"색 보정" 파라미터 A12 및 A21을 추산한 후, 선형 기준선에 의한 왜곡에도 불구하고 행렬 곱셈:
Figure 112016059878817-pct00006
에 의하여 W t1 1 ) W t2 2 )를 회복할 수 있다.
Wt11) Wt22)는 "색 보정" 데이터로 불린다. 이 식의 마지막 항의 선형 왜곡 a* i + b* it는 2 미만의 색 보정된 데이터용 모델을 추산할 때 기준선 추산에 수용될 것이다. 이는 Cp의 추산에 아무런 영향을 미치지 않는다.
색 보정 계수의 추산은 하나의(2개와는 반대로) 프로브를 사용하는 별개의 분석을 필요로 한다. 그러면 Wt22)=0으로서:
Figure 112016059878817-pct00007
이다.
따라서,
Figure 112016059878817-pct00008
이다.
계수 A21f t 1 )에 대한 f t 2 )의 통상의 선형 회귀 및 t=1,...,k인 PCR 사이클 t에 의하여 추산될 수 있다.
모델 추산
이 섹션에서는, yt t=1,...,k가 색 보정된 형광 곡선을 의미한다.
증폭
모델은 사소하지 않은 증폭을 보이는 형광 곡선에 대하여만 추산된다. 본 발명의 발명자들은 "증폭"이라는 용어를 색 보정된 형광 곡선의 선형 기준선으로부터 사소하지 않은 출발로서 정의한다. 증폭을 정량하기 위하여 신호 대 잡음비(SNR)을 사용한다. 여기서, SNR은 잡음 분산에 대한 신호 분산의 비로 정의된다. 잡음 분산은 분석 과정의 보정 일부로서 설정되고 변하지 않고 남아있다: 이러한 목적을 위하여 증폭이 있을 수 없는 웰, 즉 RNA가 없는 웰로부터의 기준선을 위한 선형 모델의 잔여 분산을 사용한다. 각각의 형광 곡선에 대하여, 최선의 피팅 직선("최선"은 최소 자승 양식을 의미)으로부터의 잔여 분산으로서 신호 분산을 추산한다.
- SNR이 특정된 문턱값 미만이면, 형광 곡선은 선형에 가깝고 증폭은 존재치 않는다. 그러면 기준선으로부터 출발하는 아무 지점이 없고 시료의 농도는 0으로 선언될 수 있다.
- SNR이 상기 문턱값을 넘으면, 증폭이 존재하고 농도가 추산될 수 있다.
(무차원의) SNR에 대한 문턱값은 "증폭된" 곡선과 "비증폭된" 곡선 간의 명확한 구별을 주기 위하여 선택된다. 예컨대, 다음 범위의 문턱값들이 마커를 위하여 효과적이다.
Figure 112016059878817-pct00009
모델
각각의 형광 곡선에 대하여 S자형 모델을 추산한다. 임의의 적절한 파라미터 형식의 모델이 사용될 수 있으나, 다음의 특징들을 모델링할 수 있어야 한다:
- 0이 아닌 기울기를 가질 수 있는 기준선
- 중간 지점에 대한 비대칭
- 저점 수준 및 상점 수준에서 점근선
- 기준선으로부터 상점 점금선까지 완만한 증가
이러한 요건을 달성하는 모델의 예시는
Figure 112016059878817-pct00010
이다.
본 발명의 발명자들은 이를 "6PL 모델"이라고 부른다. gt(θ)가 t의 증가 함수이고 형광 곡선의 실증적 특성을 갖도록 하기 위하여 파라미터 벡터 θ= [A, As, D, B, E, F]에 대하여 다음의 제약이 주어집니다.
Figure 112016059878817-pct00011
다른 두 파라미터는 기준선 A+Ast를 결정하고, 이들 파라미터는 A가 항상 양이고 기울기 파라미터 As는 항상 작다 하더라도 명확한 제약을 가질 필요가 없다. 파라미터 D는 기준선 위의 증폭 수준을 결정한다. 남은 파라미터 B, E, F는 그 자체로 어떠한 고유한 해석을 갖지는 않지만 곡선의 형태를 제어한다. 이들 파라미터들은 또한 Cp의 추산에 영향을 미치는 유일한 파라미터들이다. As=0인 경우, 이는 5-파라미터 로지스틱 함수(5PL)이고, 더하여 F=1이면, 이 모델은 4-파라미터 로지스틱 모델(4PL)이다 [Gottschalk and Dunn (2005), Spiess et al. (2008)].
개시
비선형 추산에 대한 초기 수치는 다음과 같이 설정된다.
- As=0, F=1
- A=평균(y,..., y5)
- D=범위(y1,...,yk)
- B=반높이에 대응하는 사이클
- E는 남아있는 파라미터들의 값을 상기 정의된 그들의 초기 값으로 설정한 선형 형태로 gt(θ)를 변환함으로써 개시된다. 선형화로
Figure 112016059878817-pct00012
를 얻는다.
이제 선택된 t에 대하여
Figure 112016059878817-pct00013
에 대한
Figure 112016059878817-pct00014
의 회귀에 의하여 E를 추산하여
Figure 112016059878817-pct00015
이다.
거의 동일한 분석(그 고유의 개시로)으로 이어지는 이 모델의 대안 형태는:
Figure 112016059878817-pct00016
.
As=0인 경우, 이는 때때로 Richards 방정식으로 알려진다 [Richards (1959)].
추산 기준
벌점된 제곱 합 기준을 최소화하기 위한 파라미터를 추산한다:
Figure 112016059878817-pct00017
여기서 λ(θ)는 θ의 일부(또는 모든) 파라미터들의 큰 값에 페널티를 주는 비-음성 함수이다. 이 방법은 정규화 또는 리지 회귀로 알려져 있고(Hoerl, 1962), 파라미터 벡터 θ에 대한 적절한 사전 분포를 설정함으로써 Bayesian 관점에서 이끌어내 질 수 있다. 벌점에 대한 만족스러운 선택은:
Figure 112016059878817-pct00018
이다.
λ의 큰 값은 상기 파라미터 추산을 0으로 기울게 하고 파아미터 추산의 분산을 감소시킨다. 역으로, 작은(또는 0인) λ는 불안정한 파라미터 추산 및 최소화 알고리즘의 수렴 어려움으로 이어진다. λ의 선택은 편향과, 분산 또는 안정성 사이의 타협이다. 실험적 증거는 λ가 다음의 범위로 선택된다면 편향과 분산 간의 만족스런 타협이 달성될 수 있을 것이라고 보여준다:
Figure 112016059878817-pct00019
또한, 이러한 선택은 최적 알고리즘의 수렴을 보장한다.
알고리즘 선택
상기한 범위에서 임의로 선택된 λ에 대하여, 이전의 단락의 설명은 파라미터 추산을 완전히 정의한다.
고전적인 Gauss-Newton 방법에 기초한 비선형 최소 자승 방법(예컨대, [More, 1978]에서 구현된 바 Levenberg-Marquardt 알고리즘)이 성공적으로 이용되었고, 적절한 접근법이다. 범용 최적 알고리즘, 예컨대 [Nelder and Mead, 1965], 또는 [Byrd, et al., 1995]에 의하여 구현된 바 Broyden-Fletcher 알고리즘 역시 본 발명의 문맥상 성공적으로 시험되었다.
Cp 추산
Cp는 gt(θ)의 2차 도함수를 최대화하는 시간 t의 지점이다. 각각의 형광 곡선은 표적 유전자의 농도를 특징짓는 Cp를 산출한다. 각 세트의 기술적 반복체들에 대하여 추산된 Cps의 평균은 계산되어 이후 분석에서 사용된다.
표준 곡선
동일한 PCR 플레이트에서 표준 곡선과의 비교로부터 절대 농도 또는 상대 농도가 유도된다. 선형 모델을 이용하여 희석 시리즈를 모델링하면:
Figure 112016059878817-pct00020
로,
여기서, Conc는 표준의 절대 농도 또는 상대 농도이다. 절편 및 기울기 파라미터들은 플레이트 특이적이다. 집단 모델들을 세팅함으로써 절편 및 기울기 파라미터에서 플레이트간 변동성을 모델링하면
Figure 112016059878817-pct00021
로,
여기서, 파라미터
Figure 112016059878817-pct00022
는 하기 설명될 사전 데이터를 기초로 설정된다. 그 후, 주어진 플레이트에 대하여, R 및 S는 이들 집단으로부터의 관찰로서 해석될 수 있다.
농도 Conc j 에서 표준의 반복체 i에 대하여, 다음의 모델이 사용될 수 있다:
Figure 112016059878817-pct00023
여기서,
Figure 112016059878817-pct00024
잔여의 분산이 Cp에 의존한다는 것이 중요하다.
Figure 112016059878817-pct00025
의 실험적 추산이 표 2에 주어진다. 가능성 함수를 최대화함으로써 파라미터 R 및 S를 추산한다. 식:
Figure 112016059878817-pct00026
을 통하여, PCR 과정의 효율(efficiency)의 관점에서 기울기 파라미터를 해석한다.
이러한 모델은 Bayesian 해석을 갖는다: 파라미터
Figure 112020001167292-pct00027
에 막연한(비정보성) 사전 분포를 제공한다. 그 후, R 및 S 및 Cp(i,j)에 대한 집단 모델이 상기 사전 데이터에 대한 확률 모델을 완전히 결정한다. 마르코프 체인 몬테 카를로(MCMC) 알고리즘(Lunn et al., 2009)이
Figure 112020001167292-pct00028
에 대한 추산을 가능하게 한다. 상기 사전 분포가 생략되면, 기존의 빈도 확률론자 해석이 결과한다. 이러한 추산 과정 후에, 표 3의 유전자-의존 집단 파라미터 추산을 얻는 것이 가능하다.
표 2: 잔류 분산
Figure 112016059878817-pct00029
표 3: 표준 곡선의 기울기 및 절편에 대한 집단 파라미터
Figure 112016059878817-pct00030
표준 곡선의 절편 및 기울기에 대한 추산값을
Figure 112016059878817-pct00031
Figure 112016059878817-pct00032
로 나타낸다.
상대 농도 Δ C p
식:
Figure 112016059878817-pct00033
로부터 농도 Conc REF 에서 C p ( REF ) 를 계산하기 위하여 표준 곡선을 사용한다. 시료의 상대 농도는 식:
Figure 112016059878817-pct00034
에 의하여 주어진다.
또는,
Figure 112016059878817-pct00035
는 PCR 효율 2에 해당하는 고정 수준으로 대략적으로 추정될 수 있다. 그러면,
Figure 112016059878817-pct00036
이다. 다른 선택에 대하여 동일한 표기법 ΔCp를 사용한다. 각각의 유전자에 대하여 하나인 결과하는 ΔCp 추산값은, 다음 단계에서 판별 함수로의 입력값이다.
판별 함수
ΔCp 값은 플레이트 대 플레이트 변동성이 제거된 상대적 바이오마커에 해당한다. 서로 비교된 5개의 ΔCp 값의 추산은(예컨대, 도 2 참조) 종양 시료들이 어떻게 통상 비종양 시료들에 비하여 상이한 바이오마커 값을 갖는지를 보여준다. 또한, 종양 및 정상 사이에 중복이 있지만, 다수의 시료들은 효과적으로 잘 분리된다. 이러한 상황에서, 많은 다양한 통계학적 분류기들이 종양 시료들로부터 정상 시료들을 분리하기 위하여 사용될 수 있다. 본 발명의 발명자들은 몇몇 분류기의 시료가이들 시료들을 분리하는데 실제로 작용하는 것을 보여준다. 본 발명의 발명자들은 5 가지 상이한 분류 방법을 사용하였는데: 1) 선형 판별 분석(LDA); 2) 로지스틱 회귀(LogReg); 3) 서포트 벡터 머신(SVM); 4) 5 이웃(KN5N)에 기초한 K-최근접 이웃(KNN); 및 5) 회귀적 파티셔닝 트리(TREE)이다(인용: Venables & Ripley and Dalgaard).
분류기 생성은 그 분류기로 시험될 궁극적인 집단을 대표할 다수 시료에 대한 바이오마커 값을 포함하는 데이터세트를 필요로 한다. 예컨대, 분류기가 위험에 처한 집단(예컨대, 50세 이상, 흡연자)을 스크리닝하기 위하여 사용될 것이면, 그 분류기 생성에 필요한 데이터 세트("트레이닝 세트"라고 함)는 그 집단을 반영해야 하고, 흡연을 하는 50세 이상의 사람들로부터 얻은 시료만을 포함해야 한다. 통상적으로 민감도 및 특이도와 같은 파라미터들에 대하여 10%보다 낮은 오류의 측정 정확도를 얻기 위하여는, 트레이닝 세트는 300개 시료보다 클 필요가 있다.
분류기의 효능에 대한 평가는 교차 검증을 이용하여 이루어질 수 있다. 교차 검증(Wikipedia: Cross-validation)에서, 데이터세트는 작은 수의 동일한 크기의 파티션으로 나뉜다(통상적으로 3 내지 10개). 하나의 섹션이 남겨지고, 남은 섹션들을 사용하여 분류기를 구축한 후; 상기 남겨진 섹션이 상기 신규한 분류기에 의하여 시험되고 그 예측을 알아본다. 이것은 차례로 각각의 섹션에 대하여 수행되고, 그 분류기의 특성: 민감도, 특이도 등을 계산하기 위하여 모든 예측들이 조합되고 분석된다. 상기 교차 검증이 데이터를 10개 부분으로 나누어 수행된다면, 이것은 10-묶음 교차 검증이라고 불리고; 유사하게, 3개 부분이라면 3-묶음 교차 검증일 것이다. 그 데이터가 시료가 있는 한 많은 부류로 나뉜다면, 이는 "단일 잔류 교차 검증(leave one out cross-validation)"이라고 불린다. 분류기를 구축하는데 사용되지 않은 데이터에 대하여 시험함으로써, 이 방법은 추가적인 시료의 부재하에 분류기 성능의 추산을 제공한다.
본 발명의 발명자들은 본 발명에 기재된(실시예 1) 임상 시험 데이터세트를 이용하여, 4개 바이오마커들, MDK, CDC2, IGFBP5 및 HOXA13의 모든 15개 조합, 모두 IL8Rb 바이오마커를 포함하거나 포함하지 않는 조합을 이용하여 분류기를 구축하였고, 이들 30개 분류기를 10-묶음 교차 검증을 이용하여 시험하였다. 이는 상기 열거된 5개 분류기 유형 각각에 대하여 수행되었고 ROC 곡선이 계산되었다. 모든 작업은 R Statistical Programming Environment(CITE)를 이용하여 수행되었다. 이들 결과(도 14)는 대부분의 경우에 IL8Rb를 포함하는 분류기가, 진단적으로 유용한 특이도 값에 대하여 더 민감하다(거짓 양성 비율 0 내지 20%; 특이도 100 내지 80%)는 것을 보여준다. 특이도의 진단적 유용성을 갖는 영역에 대한 곡선하면적(AUC)은 더 우수한 분류기 성능을 나타내는 큰 수치를 갖는 분류기들이 얼마나 잘 기능하는지 정량하기 위하여 사용되었다. 도 15a는 각각의 분류기 및 바이오마커 조합에 대한 AUC를 도표화한 것이고, 도 15b는 IL8Rb가 첨가될 때 각각 조건에 대한 AUC에서의 증가량을 보여준다. 대부분의 경우, IL8Rb의 첨가는 정확한 진단을 하는 능력을 증가시킨다. 도 16에 모든 분류기에 대한 진단적으로 유용한 특이도 값들에 대한 특정 민감도 값들이 도표화되어 있다. 또한, 도 17은 IL8Rb의 첨가가 제공하는 민감도 또는 특이도에의 성과량을 도표화하고 있다.
생성되고 시험된, 분류기의 유용성은 그가 새로운 시료를 시험하는데 사용되는 경우 생긴다. 결과의 해석을 간이하게 하기 위하여, 컷-오프 점수 또는 문턱값이 세워지고; 상기 컷-오프 기준 한쪽의 시료는 종양에 대하여 양성이고, 다른 쪽은 음성인 것으로 간주된다. 추가적인 컷-오프가, 예컨대 결과의 확실성 수준 증가를 나타내기 위하여 세워질 수 있다. 이 경우, 본 발명의 발명자들은 트레이닝 세터에서 거짓 양성 비율이 15%인 컷-오프를 세웠다. 우리의 교차-검증된 ROC 곡선을 이용하면, 본 발명의 민감도를 추산할 수 있다. 통상, 본 발명의 발명자들은 또한 양성 예측값이 75%로 컷-오프를 세웠다. 이들 컷-오프를 사용하기 위하여, 본 발명의 발명자들은 85% 특이도로 세워진 컷-오프보다 낮은 점수에 대하여 "음성" 결과를 설정한다. 75% PPV보다 큰 점수는 "양성"으로 불리고, 둘 사이의 점수는 "중간" 또는 "의심"으로 부른다.
IL8Rb 에 대한 항체
추가적인 측면에 있어서, 본 발명은 IL8Rb에 대응한 항체의 제조를 포함한다. 마커 IL8Rb는 면역학적 반응을 이끌어내기 위하여 적절한 충분량으로 생성될 수 있다. 어떤 경우에, 전장 IL8Rb가 사용될 수 있고, 다른 경우에, IL8Rb의 펩타이드 단편이 면역원으로서 충분할 수 있다. 면역원은 적절한 숙주(예컨대, 마우스, 래빗 등)에 주입되고, 필요하다면, 아쥬반트, 예컨대 Freund's 완전 아쥬반트 또는 Freund's 불완전 아쥬반트가 면역 반응을 증가시키기 위하여 주입될 수 있다. 항체를 만드는 것은 면역학적 분야에서 통상적인 것이고 본 발명에서 추가로 설명할 필요가 없다는 것이 이해될 수 있다. 그 결과, IL8Rb에 대응한 항체, 예컨대 모노클로날 항체 또는 파지-디스플레이 항체(phage-display antibody)를 생산할 수 있다.
또 다른 구현예에 있어서, 항체는 상기 본 발명에서 식별되는 종양 마커들 단백질 또는 그의 단백질 코어에 대하여, 또는 IL8Rb에 고유한 올리고뉴클레오티드 서열에 대하여 만들어질 수 있다. 어떤 단백질들은 글리코실화되지만, 어떤 상황에서는 글리코실화 패턴의 변동성이 보통의 글리코실화 패턴을 결여한 IL8Rb의 형태들에 대한 잘못된 검출을 야기한다. 따라서, 본 발명의 특정 측면에 있어서, IL8Rb 면역원은 비(非)글리콜실화된 IL8Rb 또는 비글리코실화된 IL8Rb 단편을 포함할 수 있다. 비글리코실화는 이 기술 분야에 알려진 하나 이상의 글리코시다아제들을 이용하여 이루어질 수 있다. 또는, IL8Rb cDNA가 글리코실화-결핍 세포주에서 발현될 수 있는데, 예컨대 원핵 세포주, 예컨대 E.coli 등등이다.
그 안에 IL8Rb-인코딩 올리고뉴클레오티드를 갖는 발현 벡터들이 제조될 수 있다. 많은 이러한 벡터들은 이 기술 분야에 알려진 표준 벡터들에 기초할 수 있다. 벡터들은 IL8Rb-생성 세포주를 만들기 위하여 다양한 세포주들을 트랜스펙션하는데 사용될 수 있으며, 상기 IL8Rb-생성 세포주는 IL8Rb 검출을 위한 특정 항체 또는 기타 시약들의 개발을 위하여 또는 IL8Rb용으로 개발된 분석을 표준화하기 위하여 IL8Rb를 원하는 양으로 생산하는데 사용될 수 있다.
키트
본 발명의 발견에 기초하여, 몇 가지 유형의 시험 키트가 구현되고 제조될 수 있다. 우선, 검출 분자(또는 "포획 시약")으로 미리 로드된 검출 장치를 갖는 키드가 제조될 수 있다. IL8Rb mRNA를 검출하기 위한 구현예에 있어서, 이러한 장치는 그 위에 포획 시약으로서 검출될 mRNA와 혼성화되는 올리고뉴클레오티드가 결합된 기판(예컨대, 유리, 실리콘, 석영, 금속 등)을 포함할 수 있다. 몇 가지 구현예에 있어서, mRNA(cy3, cy5, 방사성레이블 또는 기타 레이블로 표지된)를 상기 기판 상의 올리고뉴클레오티드에 혼성화함으로써 mRNA에 대한 직접 검출이 달성될 수 있다. 다른 구현예에 있어서, 원하는 mRNA에 대한 상보적 DNA(cDNA)를 먼저 만듦으로써 mRNA의 검출이 이루어질 수 있다. 그 후, 표지된 cDNA는 기판 상의 올리고뉴클레오티드에 혼성화되어 검출될 수 있다.
항체는 또한, 키트에서 포획 시약으로서 사용될 수 있다. 몇 가지 구현예에 있어서, 기판(예컨대, 다수-웰 플레이트)는 그에 부착된 특정 IL8Rb 및 BTM 포획 시약들을 가질 수 있다. 몇몇 구현예에 있어서, 키트는 포함된 블로킹 시약을 가질수 있다. 블로킹 시약은 비특이적 결합을 감소시키기 위하여 사용될 수 있다. 예컨대, 비특이적 올리고뉴클레오티드 결합은 IL8Rb 및 BTM 올리고뉴클레오티드를 함유하지 않는 임의의 편리한 제공원으로부터의 과량의 DNA를 이용하여, 예컨대 연어 정자 DNA를 이용하여 감소시킬 수 있다. 비특이적 항체 결합은 혈청 알부민과 같은 블로킹 단백질을 과량 사용하여 감소시킬 수 있다. 올리고뉴클레오티드 및 단백질을 검출하기 위한 다수의 방법이 이 기술 분야에 알려져 있으며, 마커 관련 분자들을 특이적으로 검출할 수 있는 임의의 전략이 사용될 수 있고 본 발명의 범위 내로 고려된다는 것을 이해할 수 있을 것이다.
항체는 또한, 예컨대 항체 칩을 이용하는, 고체 기판에 결합시 이용될 수 있는데, 이는 하나의 칩으로 다수의 마커들을 검출하는 것을 가능케할 것이다.
기판에 더하여, 시험 키트는 포획 시약(예컨대, 프로브), 수세 용액(예컨대, SSC, 기타 염, 완충액, 변성제 등등) 뿐 아니라 검출 모이어티(예컨대, cy, cy5, 방사선레이블 등등)을 포함할 수 있다. 또한, 키트는 사용 설명서 및 패키지를 포함할 수 있다.
시료 중 IL8Rb 및 BTM의 검출은 임의의 적절한 기법, 예컨대 올리고뉴클레오티드 프로브, qPCR 또는 암 마커에 대하여 상승하는 항체 등을 이용하여 수행될 수 있으나 이에 국한되는 것은 아니다.
시험될 시료가 염증성 질환 또는 종양인 것으로 의심되는 조직의 시료에 제한되는 것은 아니라는 것이 이해될 것이다. 마커는 혈청 또는 기타 체액 내로 분비될 수 있다. 그러므로, 시료는 임의의 체시료를 포함할 수 있고, 생검, 혈액, 혈청, 복강 세척액, 뇌척수액, 소변 및 대변 시료를 포함한다.
또한, 본 발명이 인간의 암을 검출하는데 제한되는 것이 아니라 임의의 동물, 예컨대 개, 고양이, 말, 소, 양, 사슴, 돼지 및 암에 걸리는 것으로 알려진 임의의 다른 동물에서 암을 검출하는데 적절하다는 것이 이해될 것이다.
체액에서의 염증성 질환 또는 암 마커에 대한 범용 시험
일반적으로, 이들 액에서 올리고뉴클레오티드, 단백질 및 펩타이드를 분석하는 방법은 이 기술 분야에 알려져 있다. 올리고뉴클레오티드의 검출은 혼성화 방법, 예컨대 노던 블롯, 서던 블롯 또는 마이크로어레이 또는 qPCR을 이용하여 수행될 수 있다. 단백질을 검출하는 방법은 효소 결합 면역흡착 분석(ELISA), 항체 포함 단백질 칩, 현탁액 비드 방사선면역분석(RIA), 웨스턴 블롯팅 및 렉틱 결합 등을 포함한다. 그러나, 설명의 목적으로, 질환 마커의 유액 수준은 샌드위치 유형 효소-결합 면역흡착 분석(ELISA)를 이용하여 정량될 수 있다. 혈장 분석을 위하여, 적당히 희석된 시료 또는 순차적으로 희석된 표준 마커 5 uL 앨리쿼트 및 75 uL의 퍼옥시다아제 컨쥬게이션된 항-인간 마커 항체를 마이크로타이터 플레이트의 웰에 첨가한다. 30℃에서 30 분 간의 반응 시간 후, 웰을 인산 완충된 염용액(PBS) 중의 0.05% Tween 20으로 수세하여 미결합 항체를 제거한다. 마커와 항-마커 항체의 결합 복합체는 그 후, 30℃에서 15 분간 H202 를 함유하는 o-페닐렌디아민으로 반응시킨다. 1 M H2SO4를 첨가하여 반응을 종결시키고 마이크로타이터 플레이트 리더로 492 nm에서 흡광도를 측정한다.
항-IL8Rb 항체가 모노클로날 항체 또는 폴리클로날 항혈청일 수 있다는 것을 이해할 수 있을 것이다. 또한, 임의의 다른 체액이 적절히 연구될 수 있다는 것 역시 이해될 수 있을 것이다.
마커가 분비되는 것, 생리학적 관점에서 유용한 것일 필요는 없다. 오히려, 그로 인하여 마커 단백질 또는 유전자가 혈청으로 들어가는 임의의 메커니즘이 검출 가능한, 정량 가능한 수준의 마커를 생산하는데 효과적일 수 있다. 따라서, 세포로부터 용해성 단백질의 통상적인 분비, 세포막으로부터 막 단백질의 탈리, 얼터너티브 스플라이싱된 형태의 mRNA 또는 그로부터 발현된 단백질의 분비, 세포 사멸(또한 세포 자멸)이 유용한 마커를 충분한 수준으로 생성할 수 있다.
다양한 암 유형에 대한 요법의 효능을 평가 및/또는 진단하기 위한 수단으로서 혈청 마커의 사용에 대해 지지가 증가하고 있다.
실시예
본원의 실시예는 본 발명의 구현예를 설명할 목적으로 제공되는 것이다. 다른 구현예, 방법, 및 분석 유형도 분자적 진단 업계의 당업자라면 본 발명의 범위 내로 인식할 것이고, 본원에 자세히 기술할 필요는 없을 것으로 생각된다. 본 발명의 범위 내의 다른 구현예도 본 발명의 일부인 것으로 해석된다.
실시예 1: 방광암의 유전자형 분석
방법
환자: 2008년 4월과 2009년 9월 사이에, 거시적인 혈뇨를 나타내지만 이전에 요로 악성종양력은 없는 485명의 환자가 뉴질랜드와 호주의 11개 비뇨기 클리닉에 모집되었다. 각각의 환자는 방광경 검사 및 임의의 추가적인 진단 과정 직전에 소변 시료를 제공하였다. 진단은 연구 등록 후 3개월까지 이루어졌다. 이들 485명 환자 중에, 442명의 환자들에 대하여, 모든 5개 연구 유전자들에 대한 유전자 발현 데이터가 다음에 설명되는 방법들을 이용하여 성공적으로 얻어졌다. 이들 환자들의 특성이 표 4에 나타나 있다.
표 4: 연구 집단 I의 특징
Figure 112016059878817-pct00037
표 4는 환자가 최초로 심한 혈뇨를 보인 후 3개월에 각각의 주요 진단 카테고리에서의 환자의 수를 보여준다.
소변 분석: 소변 시료를 센트럴 리뷰 세포진으로 분석하였다(Southern Community Laboratories, Dunedin, New Zealand). 진단 시험 NMP22 BladderChek®(Matritech) 및 NMP22 ELISA(Matritech)가 제조자의 지침에 따라 임상 지역(BladderChek®) 또는 Southern Community Laboratories(NMP22 ELISA)에서 수행되었다. .
RNA 정량: 각각의 환자의 소변 2ml를 5.64M 구아니딘 티오시아네이트, 0.5% 사코실 및 50mM NaoAc pH6.5를 함유하는 RNA 추출 완충액과 혼합하였다. 그 후, 전술한 바와 같이 총 RNA를 Trizol 추출(Invitrogen), RNeasy 방법(Qiagen)으로 추출하였다. RNA를 35ul 물에 컬럼으로부터 용리하여 3ul를 각각 후속하는 모노플렉스 또는 듀플렉스 정량적 역전사 중합효소 반응(qRT-PCR) 분석에 사용하였다. 각각 16ul의 qRT-PCR 반응물은 0.3U RNAse-OUT(Invitrogen), 0.225uM 각각의 Taqman 프로브, 1.25U Superscript III(Invitrogen), 0.275uM 각각의 프라이머, 1.5U Fast Start Taq polymerase(Roche), 10mM DTT, 0.375mM dNTPs, 4.5mM MgSO4, 1.6ul 10x Fast Start PCR 완충액(Roche) 및 2.6ul GC Rich 용액(Roche)을 함유하였다. 5개 연구 유전자들:MDK, CDC2, IGFBP5, HOXA13 및 IL8Rb에 대하여 Integrated DNA Technologies(Coralville USA)로부터 프라이머와 형광 이중-표지된 프로브를 얻었다. 프라이머/프로브 서열들이 표 2에 나타나 있다. 반응물을 96 웰 플레이트에 장치하고, Roche Light Cycler® 480에 따라 사이클을 진행하였다: 50℃, 15 mins; 95℃ 8 mins; 95℃ 15 sec, 60℃ 2 mins로 10 사이클, 및 95℃ 15 secs, 60℃ 1 min로 30 사이클. 레퍼런스 RNA(세포주 RNA 풀로부터 유래)의 1/16 순차적 희석의 표준 곡선이 각 플레이트에 대하여 포함되어 0.3 pg/μl 내지 20 ng/μl를 생성하였다. 마지막 30 써모 사이클의 신장 단계에서 데이터가 수집되었고 원형 텍스트파일이 나왔다. 다음의 표 5는 5개의 RNA 마커의 qRT-PCR 정량에 사용된 프라이머 및 프로브 서열을 보여준다.
표 5
Figure 112016059878817-pct00038
qRT - PCR 데이터 분석
플레이트상 모든 웰에 대한 사이클수 대 2개 채널의 형광 데이터를 함유하는 탭으로 구분된 파일로서 원형의 형광 데이터가 Roche LightCycler® 480으로부터 내보내졌다. 하나의 형광 채널로부터 다른 채널로의 출혈을 보정하기 위하여 데이터에 색 보정([Bernard1999])을 적용한 R 프로그램을 이용하여 데이터를 처리하였다. 그 후, 2차 도함수 최대값을 이용하여([Spiess2008]) 5-지점 로지스틱 모델을 피팅하여 CP를 추산하였다.
모든 시료들과 대조군들은 PCR 플레이트에 중복으로 적용되었다. 중복 웰로부터의 CP 값은 사용 전에 평균내어 졌다. 두 CP 값 간의 차이가 3 유닛을 넘으면, 그 시료는 반복 처리되었다. PCR 플레이트 전체에 표준화를 제공하기 위하여, CP는 20 ng/μl의 레퍼런스 RNA(세포주 RNA 풀로부터 유래)에 대한 상대적인 ΔCP로 표현되었다:
Figure 112016059878817-pct00039
통계학적 분석
선형 판별 분석 또는 로지스틱 회귀([Venables2002])에 기초하여, TCC를 포함하지 않는 시료들로부터 TCC를 포함하는 시료들을 구분하기 위하여, MDK, CDC2, HOXA13, IGFBP5 및 IL8Rb로부터의 qRT-PCR ΔCP 값을 이용하여 분류기를 생성하였다. 양 경우에 있어서, 유전자들간 상호 작용은 분류기 모델에서 허용되었다. LDA의 생성은, 전술한대로, 예컨대 문헌 ["Modern Applied Statistics with S, 4th edition" by W.N. Venables and B.D. Ripley (2002), Springer]에 따랐다. 연구의 데이터세트는 임의의 불완전 데이터를 제거한 후, R Statistical Environment(R Development Core Team (2009) 및 패키지 MASS로부터의 함수 "lda"(Venables and Ripley (2002))를 사용하여 생성하였고, 임상적 시험 데이터에 대하여 선형 판별 시험하였다.
로지스틱 회귀 분류기의 생성은 LDA의 생성과 유사한 방식으로 수행되었다. 다시금, 연구 데이터로부터 불완전 데이터를 제거하였다. 로지스틱 회귀 분류기는 R을 이용하여 생성되었고: 어떠한 추가적인 패키지도 필요하지 않았다. 로지스틱 회귀는 Dalgaard (2008)에 기술된대로 수행되었다. 분류기들간 비교는 ROC 곡선을 이용하여, R 패키지, ROCR을 이용하여 이루어졌다(Sing et al. 2009). ROC 곡선에 대한 신뢰 구간은 Macskassy et al([Macskassy2005])의 방법을 이용하여 생성되었다. 하기 알고리즘이 생성되었다:
선형 판별 분류기
첫번째 분류기, 선형 판별,(LDA-3으로 불림)은 유전자들 간 다중 상호 작용을 가능하게 하는 5개 유전자 값(레퍼런스 값을 뺌으로써 레퍼런스 값으로 정규화됨)에 기초한다. 이 분류기는 "MASS"로 불리는 패키지로부터 'lda()' 함수를 이용하여 R로 구축되었다 (R version 2.9.1; MASS version 7.2-49). 이 분류기를 하기 방정식을 이용하여 구축하였다:
Figure 112016059878817-pct00040
여기서, lda3은 생성된 모델이고; TCC.YN은 방광경 검사로 결정되는바 "소변 내 TCC 존재"에 대한 참 값(예 또는 아니오)이고; MDK, IGF, CDC, HOXA 및 IL8R은 정규화된 유전자 Cp 값이고; uRNA 시험은 5개 유전자 각각에 대한 Cp 값 및 임상 시험으로부터 TCC.YN(예 또는 아니오)를 포함하는 데이터 파일이다. 식에서 별표 '*'의 사용은 곱셈을 나타낸다. 분류기 점수의 평가는 상기 5개 유전자 값을 포함하는 새로운 데이터 프레임 뿐 아니라 상기 분류기, lda3을 입력값으로서 취하여 분류기 점수를 출력한다:
Figure 112016059878817-pct00041
여기서, "점수"는 TCCs의 존재를 예측하기 위하여 상기 분류기로부터 사용된 출력값이고;"lda3"은 상기 생성된 분류기이고 "신규.데이터"는 분류기 생성에서 사용되었던바 동일한 이름으로 불리는 5개 유전자의 측정된 값을 포함하는 데이터 파일이다. 구문 '$x' 및 "c(...)"는 예측 함수에 의하여 되돌려진 많은 양의 정보로부터 구체적으로 점수를 추출하기 위하여 존재한다. 점수 컷 오프를 0.112 및 그 이상으로 설정하는 것은 소변 시료에서 TCC의 존재에 대하여 우리의 특이도를 85%로 맞춘다. LDA-3에 대한 계수가 표 6에 나타나 있다:
표 6
Figure 112016059878817-pct00042
로지스틱 회귀 분류기
로지스틱 회귀에 기초한 두번째 분류기는 LDA-3과 같이 동일하게 불완전 데이터 제거된 데이터세트로부터 유도되었다. lda() 함수를 사용하는 대신, 아래와 같은 패키지 스탯(기본 인스톨 R 포함)으로부터 glm() 함수를 사용하였다:
Figure 112016059878817-pct00043
여기서, "lr1"은 생성된 분류기이고 다른 파라미터들은 선형 판별에 대해 설명된 바와 같다. 다시 한번, 전체적인 상호 작용은 '*' 연산자를 이용하여 특정된다. 분류는 LDA-3의 그것과 매우 유사한 방식으로 수행된다:
Figure 112016059878817-pct00044
여기서, "점수"는 상기한바 "신규.데이터"에서 5개 유전자의 측정치에 기초하여 소변 시료를 분류하는데 사용되는 수치이다. lr1에 대한 컷 오프는 85%의 특이도를 달성하기 위하여 0.102로 맞춰지고; 컷 오프 근처의 수치는 TCC 양성인 것으로 여겨진다. 분류기의 계수들은 다음과 같다:
Figure 112016059878817-pct00045
결과
소변 시료의 qRT - PCR 분석
TCC 검출에 대한 IL8Rb의 효과 개관을 얻기 위하여, TCC(n=56) 또는 비악성 상태 요로결석증(n=25), 요로 감염(n=18) 또는 방광염(n=18) 중 하나인 환자들의 소변으로부터 얻어진 qRT-PCR 데이터를 이용하여 2차원 스캐터 플롯을 구축하였다. 이 스캐터 플롯은 4개의 특징 유전자(MDK, CDC2, IGFBP5 및 HOXA13)로부터의 유전자 쌍을 이용하여 구축되었다. 그 후, 각 쌍 중 하나의 유전자를 IL8Rb로 치환하여 데이터를 재구성하였다. 이들 플롯을 도 2a-f에 나타내었다. 플롯에서 IGFBP5 및 HOXA13을 IL8Rb로 치환하고, MDK와 조합한 것이(도 2a-c) TCC 환자와 비악성 상태를 갖는 환자들의 시료간 개선된 분리를 보여주었다. IL8Rb가 IGFBP5 및 HOXA13 대신 치환된, CDC2와 조합된 플롯에서 동일한 경향이 관찰되었다(도 2d-f).
심한 혈뇨를 나타내는 환자들의 정확한 TCC 진단에의 IL8Rb 기여를, 그 후 ROC 곡선 분석으로 정량하였다. 특징이 되는 각각의 유전자(MDK, CDC2, IGFBP5 및 HOXA13) 및 IL8Rb에 대한 qRT-PCR 데이터를 사용하여 TCC를 갖는 환자와 그렇지 않은 환자들 간의 차이를 극대화하는 선형 판별 알고리즘을 개발하였다. 442개 시료로 이루어진 전체 코호트를 이용하여 2개의 선형 판별 알고리즘을 개발하였다: LD1는, MDK, CDC2, HOXA13 및 IGFBP5부터의 qRP-PCR 데이터를 사용하였고, LD2는, MDK, CDC2, HOXA13, IGFBP5 및 IL8Rb을 사용하였다. 그 후, LD1 및 LD2를 사용하여 확인된 TCC(n=56) 또는 비악성 상태 요로결석증(n=25), 요로 감염(n=18) 또는 방광염(n=18) 환자 그룹에서 TCC를 검출의 민감도 및 특이도를 보여주는 ROC 곳선을 생성하였다. 도 3a는 LD1 및 LD2에 대한 ROC 곡선을 보여준다. LD1의 ROC 곡선하면적은 LD2의 84%에 비하여 78%였다.
선형 판별 분석에 대한 대안으로서, 로지스틱 회귀가 TCC를 갖는 환자와 비악성 질환을 갖는 환자들 간 구별을 위한 알고리즘을 개발하는 독립적인 방법으로서 사용되었다. 선형 판별 분석에서와 같이, 로지스틱 회귀 알고리즘도 442개 시료로 이루어지는 전체 코호트를 이용하여 개발되었다. 로지스틱 회귀를 이용하여 얻어지는 ROC 곡선 및 전술한 56개 TCC 시료 및 61개 비악성 시료가 도 3b에 나타나 있다. LR1에 대한 ROC 곡선하면적(MDK, CDC2, HoxA13 및 IGFBP5로부터의 qRT-PCR 데이터를 이용하여 얻음)은, LR2(MDK, CDC2, HOXA13, IGFBP5 및 IL8Rb로부터의 qRT-PCR 데이터로부터 얻음)의 86%에 대하여 80%였다. 이러한 데이터는 소변 시료를 이용하는 TCC 검출 방법에서 IL8Rb를 포함하는 것이 TCC를 갖는 환자와 비악성 질환, 예컨대 방광염, 요로 감염 및 요로결석증 환자들 간의 개선된 구별을 이끌어 낼 수 있다는 것을 분명하게 설명해 준다.
TCC 환자와 요로결석증 환자간의 구별에 IL8Rb가 개선된 정확성을 제공한다는 것을 확인하기 위하여, 요로 감염 또는 방광염을 다수의 다양한 비악성 환자들을 포함하는 비선택 환자 코호트에 남겨두고, 표 1에 설명된 442개 시료로 이루어진 전체 코호트를 이용하여 ROC 곡선 분석을 반복하였다. 이 분석에서, LD1 및 LD2에 대한 곡선하면적은 각각 86 및 89%였다(도 4a). 유사하게, LR1에 대한 곡선하면적은 87%이고 LR2에 대하여는 91%였다(도 4b). 이러한 결과는 소변 시료를 이용하여 TCC를 검출함에 있어 IL8Rb가 개선된 정확도를 이끌어 낸다는 것을 확인하여 준다.
IL8Rb의 포함에서 기인하는 이러한 암 검출에서의 향상이 442개 환자 코호트에 LD1/LD2 및 LR1/LR2를 적용한 후 단계 Ta TCC만을 검출하는 민감도를 결정하므로써 더 설명되었다. 단계 Ta 종양은 고등 단계 종양에 비하여 통상적으로 더욱 검출이 어려운, 더 작고, 더 분화된 종양이다. LD1은 85%의 특이도로 Ta 종양 18/31(58%)를 검출하였고, 비교하자면 LD2에 대하여는 19/31(61%)였다. LR1은, LR2에 대하여 24/31(77%)인 것과 비교하여 21/31(68%)을 검출하였다(특이도 85%). 이러한 데이터는 LD 및 LR 알고리즘으로 IL8Rb가 포함되는 것이 단계 Ta 종양 검출의 민감도를 최대 9%까지 증가시켰다는 것을 보여준다. 이러한 RNA 시험과 비교하여, 본 연구에서의 다른 3가지 방광암 시험은 Ta 종양 검출에 대해 크게 낮은 정확도를 보여주었다: 소변 세포진(39% 민감도, 94% 특이도), NMP22 ELISA(35% 민감도, 88% 특이도) 및 NMP22(BladderChek® "미국, 매사추세츠 Matritech, Inc.의 등록 상표")(39% 민감도, 96% 특이도).
요로의 감염에 대한 진단의 원조자로서 IL8Rb
방광염 또는 요로 감염과 같은 원인에 의하여 요로에 염증이 있는 환자들을 진단하는데 사용될 IL8Rb의 능력을 결정하기 위하여, 양성 전립성 비대증, 비특이적 전립선 질환, 혈관 전립선, 와파린 사용에 대한 2차 혈뇨 및 방광염/요로 감염으로 진단된 혈뇨 환자들의 소변 IL8Rb mRNA 수준을 qRT-PCR로 측정하였다. 이들 상태들 각각에 대한 평균 IL8Rb ΔCt 수준은 각각 -3.12, -3.10, -2.84, -1.98 및 -5.27였다. 방광염/요로 감염을 갖는 환자 및 다른 조합된 비악성 상태들의 IL8Rb 수준의 평균간 차이를 Wilcoxon 랭크 섬 시험을 이용하여 유의하게(p=0.001) 결정하였다. 이러한 데이터를 설명하는 박스 플롯이 도 5에 보여진다. 이 데이터는 시험된 다른 비악성 상태들과 비교하여 방광염이나 요로 감염 중 어느 하나로 진단된 대다수의 환자들에서 IL8Rb 수준 증가를 보여준다. 플롯들간의 중복은 3가지 요인의 조합으로 설명될 수 있을 것 같다: (i) 각각의 상태를 정확히 진단하는 표준 임상 실시의 불능성, (ii) 동반질환(comorbidity)(예컨대, 감염 및 양성 전립선 비대증) 및 (iii) 양성 전립선 비대증, 비특이적 전립선 질환, 혈관 전립선 또는 와파린 사용에 대해 2차 혈뇨인 환자 서브세트에서 높은 수의 소변 호중구수의 정상 연관성. 그럼에도 불구하고, 염증과 호중구수간의 엄격한 연관성으로 미루어, 소변에서의 IL8Rb의 정량은 요로의 염증, 그것이 감염의 결과이든 다른 비악성 상태와 과련된 것이든 그 염증을 검출하는 정확한 방법을 제공한다.
실시예 2
방법
연구 집단
이전에 TCC 병력이 없는 일련의 연속적 환자들을 뉴질랜드의 9개 비뇨기 클리닉과 호주의 2개 클리닉에서 2008년 4월 28일과 2009년 8월 11일 사이에 예상 모집되었다. 환자 세트는 실시예 1에서 이용된 환자들을 포함하였으나, 그들의 데이터는 첫번째 분석에 사용되지 않았던 추가적인 46명 환자들을 포함하였다. 추가적인 연구는 또한 얻어진 결과들에 대한 추가적인 분석을 포함한다. 시료들을 모으고, 실시예 1에 개시된대로 RNA를 수집 및 시험하였다.
RNA 시험 개발
uRNA®는 4개 mRNA 마커들, CDC2, HOXA13, MDKIGFBP5로 구성된다. 이들 마커들은 혈액 및 염증 세포에서 그들의 낮은 발현 및 TCC에서의 과발현에 기초하여 선택되었다.2 이 코호트 연구에서, 본 발명의 발명자들은 4개의 마커들을 하나의 점수에 조합한 선형 판별 알고리즘(uRNA-D)을 예상 특정하였다. uRNA-D는 독립적이었고, 이전의 데이터세트에 대하여 개발되었다. 그러나, 이는 그 시험에 대하여 의도된 표적 집단을 대표하는 엄격히 특징화된 환자 그룹을 이용하여 유래된 것은 아니었다. 그 결과, 연구 프로토콜은 또한 현재 코호트 연구에 모집된 환자들로부터 얻어진 데이터를 이용하여 5개 마커 CDC2, HOXA13, MDK, IGFBP5 IL8Rb를 이용하기 위한 신규한 알고리즘(분류기-D, Classifier-D)의 개발을 설계하였다.
분류기-D 외에, 두번째 알고리즘(분류기-S, Classifier-S)이 진행 단계(advancing stage)(≥단계 1) 또는 고등 단계(WHO/ISUP 1998 분류)에 있는 종양의 식별을 가능케 하기 위하여 코호트 연구 데이터를 이용하여 유도되었다. 알고리즘-S는 단계 Ta 종양들 및 ≥단계 1 종양들간에 차등적으로 발현되는 것으로 이미 알려졌던 CDC2HOXA13를 포함하여 모든 5개의 마커들을 포함하였다.
분류기 개발
본 명세서에서 개요된 방법에 따라, 5개의 마커 CDC2, HOXA13, MDK, IGFBP5 IL8Rb 를 이용하기 위한 2개의 분류기(Classifier-D Classifier-S) 개발은 이 연구에서 얻어진 데이터에 기초하였다. 간단히, 로지스틱 회귀 모델은 통계학적 프로그래밍 환경, R(R Development Core Team (2011). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http:// www.R-project.org/)을 이용하여 만들어졌다. 각각의 5개 마커들에 대한 ΔCp 값 및 그들의 2 방향 상호 작용(예컨대, MDK x CDC2, MDK x IGFBP5, 등)을 이용하여 만들어진 모델은 그들의 분류 능력에 대하여 평가되었는데; 가장 낮은 AIC 값을 갖는 것들이 그 특이도는 85%로 설정하였을 때 그들의 민감도에 대하여 단일 잔류 교차 검증으로 평가되었다. 가장 적은 수의 파라미터들이 선택된 모델과 함께, 몇몇 모델들이 분류기-D 분류기-S 각각에 대한 비견할 만한 성능을 입증하였다.
통계학적 방법
진단 시험이 프로토콜로 구체화된 경우, 비율 및 95% 신괴 구간이 민감도 및 특이도에 대하여 계산되었다. 수신자 조작 특성(ROC) 곡선은 Stata roctab 및 roccomp 명령어(Statacorp and Delong)를 이용하여 플롯팅되고 비교되었다. 분류기-D에 대하여, 신뢰 구간은 적절하지 않지만, TCC나 환자 특성과 참 양성 또는 거짓 양성 결과 확률간의 연관성에 관한 시험을 위하여 Fishers 추출 또는 Chi 제곱 시험(시료 크기가 허용한다면)을 이용하였다. 로지스틱 회귀 도델은 거짓 양성 및 거짓 음성 결과와 관련되는 인자를 찾기 위하여 사용되었다. 모든 분석은 Stata version 11.2로 수행되었다.
결과
총 517명의 환자가 최초에 연구에 모집되었고; 환자의 4%는 그들이 부적합한 것으로 확인되거나(n=10), 방광경 검사를 받지 않았거나(n=9), TCC 상태가 언급되지 않았거나(n=2) 또는 그들이 허용 가능한 소변 시료를 제공하지 않았기 때문에(n=2) 제외되었다(도 8). 추가 10명은, 그들이 소변 시험 중 하나 이상에 대한 결과를 갖지 않았기 때문에 분석으로부터 제외되었다. 남은 485명의 환자들의 기준 인구통계적 특성 및 임상적 특성이 도 9에 나타나 있다.
코호트에서 TCC의 유병률은 13.6%였다. 둘은 리뷰 단계를 놓쳤고(둘 다 지역 리뷰에 의하여 Ta) 둘은 리뷰 등급을 받지 못했다(지역 병리학자에 의하면 하나는 단계 1이고, 다른 하나는 낮았다). 66명 종양 중, 55명은 상피였고(단계 Ta, T1 또는 Tis) 11명은 근육 침윤이었다(T2). 어떤 환자도 검출될 만한 전이나 국소 림프절까지 포함되지는 않았다. 1973 등급 시스템을 사용하면, 24명은 단계 3으로, 38명은 단계 2로, 3명은 단계 1로 1명은 미지로 분류되었다. WHO98 시스템으로, 29명은 고등급, 4명은 혼합, 32명은 저등급 및 1명은 미지로 분류되었다. TCC 뿐 아니라, 두 환자는 유두종으로 진단되었고, 7명은 다른 종양인 것으로 진단되었다(이들 중 다섯은 비뇨기).
uRNA-D 시험에 대한 컷오프가, 85%로 설정된 특이도로 상기 연구 코호트에 대하여 결정되었다. 이 컷오프를 이용하여, uRNA-D는 66명 TCC 사건 중 41건을 검출하였고(민감도 62%), 이는 NMP22TM ELISA(50%), Bladderchek®(38%) 및 세포진(56%)과 비교되었다. 코호트 데이터 분류기-D에.대하여 개발된 RNA 시험은 TCC 사건 중 54건을(82%) 85% 특이도로 검출하고, 48건을(73%) 90% 특이도로 검출하였다. uRNA-D 및 NMP22TM ELISA 값은 양 시험이 연구 이전에 완전히 구체화되었기 때문에 직접적으로 비교되었다. 도 21은 ROC 곡선을 보여주는데, 곡선하면적(AUC)는 각각 0.81 및 0.73였다(p=0.03). 분류기-D에 대한 ROC 곡선은 0.87였고(도 21) uRNA-D에 대한 성능 증가는 대부분 임상적으로 유의한 특이도(80% 이상)의 범위에 있는 것으로 보인다.
종합하면, 분류기-D는 uRNA-D(83%), 세포진(83%), NMP22 ELISA(69%) 및 Bladderchek®(38%)과 비교하여 고/등급 3 종양 중 97%를 검출하였다. 또한, 분류기-D는 낮은 등급 종양의 검출에 더욱 민감하였는데(69%), 다른 시험들은 28-41% 범위였다(도 12). 분류기-D는 단계 ≥1인 TCC 사건 더하기 두 가지 Tis 모두에 대하여 양성이었으나, 단계 Ta에 대하여는 민감도 68%였다(p=0.016, 도 12). 이는 여전히 실질적으로 다른 시험들보다 높은 것이었고, 다음으로 uRNA-D가 41%로 높았다. 비록 적어도 일부는 육안 혈뇨나 미세 혈뇨를 갖는 환자들 중 높은 단계 및 등급 TCC의 비율이 높은 결과이겠지만, 그들의 소변 시료에 명확한 육안 혈뇨나 미세 혈뇨를 갖는 TCC 환자들은 육안 혈뇨나 미세 혈뇨가 없는 환자들보다 IL8Rb를 포함함으로써 검출되는 TCC 가능성이 더 높았다(p<0.0005). 회귀 분석에서 이를 더 연구하기에는 수가 충분치 않았다.
분류기-D에 의하여 놓친 12건 중, 모두는 단계 Ta였고, 하나를 제외한 모두는 낮은 등급이었다(WHO ISUP 1998). 12건 중 오직 2건(두 경우 모두 낮은 등급, 단계 Ta TCC)을 다른 시험에서 골라내었다(하나는 NMP22TM ELISA 및 BladderChek®에 의하여, 하나는 uRNA-D에 의함). 세포진은 분류기-D가 놓친 어떠한 TCC를 고르지 못했다.
환자 A: 고등급 신장 골반 T2 종양, 동시 Tis 없음, 크기 주어지지 않음.
환자 B: 고등급 방광 T3a 동시 Tis 없음, 2x 3cm
환자 C : 심한 기질 및 고유근 침윤의 4.8 x 5.6 cm로 측정되는 고등급 종양, 전이 증거 없이 방광주변 지방까지 퍼짐.
다른 진단을 한 것들 중에서 그리고 소변 시료 특성에 따른 것들 중에서 소변 시험의 특이도가 도 13에 나타나 있다. 육안 혈뇨 또는 미세 혈뇨를 갖는 대조군 환자들이 육안 혈뇨 또는 미세 혈뇨를 갖지 않는 환자들보다 거짓 양성을 가질 확률이 높았고(p=0.002), 비록 진단에 의한 특이도 차이가 전체적으로 통계학적으로 유의하지는 않았으나(p=0.12) 결석을 갖는 환자들 역시 그러한 경향이 있었다. 다른 비뇨기 암을 갖는 5명의 환자가 있었는데; 이들 중 오직 1명이 양성 분류기-D 시험 결과를 나타냈다. 로지스틱 회귀 모델을 적용한 결과도 유사하였다. 진단 및 육안 혈뇨 또는 미세 혈뇨를 포함하는 로지스틱 회귀 모델에서, 육안 혈뇨 또는 미세 혈뇨 상태와의 연관성은 유의하게 남아 있었고(p=0.006), 결석을 갖는 경우의 진단 없음과 직접적으로 비교하였을 때, 2.7배 증가된 거짓 양성 시험 공산을 가졌다(95% CI(1.1 내지 6.4), p=0.03). 연령은 시험의 특이도에 영향을 미치지 않았다.
소변 시료 중 검출되는 육안 혈뇨 또는 미세 혈뇨는 시험 민감도와 명백하게 관련되는 유일한 인자였다. 이 코호트에서 양성 시험의 예측치는 육안 혈뇨 또는 미세 혈뇨를 갖는 환자들에 대하여는 63% 였고, 그렇지 않은 환자들에 대하여는 24%였는데, 육안 혈뇨 또는 미세 혈뇨를 갖는 환자들에서 더 큰 TCC 유병률을 크게 반영하였다(39% vs 6%).
분류기-D 시험이 양성이었던 사람들 중 TCC인 환자 54명이 있었다. 이들 환자는 분류기-S를 이용하여 중증 TCC 및 덜 중증인 TCC로 분류되었다. 중증 TCC는단계 ≥1 또는 어느 단계에서든 등급 3으로 정의되었다. 90% 특이도로, 분류기-S는 중증 TCC 사건들 중 32/35(91%)를 정확히 분류하였다.
실시예 3: 혈뇨 I을 갖는 환자들의 유전자형 및 표현형 조합 분석
이 연구는 가능한 요로상피 암(UC)의 조사에 과한여 완전한 임상 작업을 경험하고 있는 확인된 무증상 미시적 혈뇨(AH)를 나타내는 환자들에 초점을 맞춘다. 대략 500명의 환자가 이 연구에 모집되어 참여한다. 본 발명에서 사용되는바, 용어들은 추가 실시예에서 하기 정의한다.
목적
목적은 다음을 결정하는 것이다: (1) 비뇨기적 임상의 전(全) 작업이 예정된 미세 혈뇨를 나타내는 환자들에의 유전자형 및 표현형 알고리즘의 효능 (2) 확인된 미시적 혈뇨를 나타내는 환자들에서 1차 UC 검출을 위한 유전자형 및 표현형 알고리즘 G+P 지수의 성능 특성(민감도, 특이도, ROC 곡선하면적, 양성 및 음성 예측치) 및 (3) 유전자형 및 표현형적 수단인 G+P 지수에 의하여 UC 음성으로 정확하게 진단되어, 그러므로 조사적인 방광경 검사를 요하지 않는 환자들의 수.
연구 집단
연구 집단은, 연구 요건을 만족하는, 확인된 미세 혈뇨를 나타내는 환자들로 구성된다. 환자들은 환자들을 비뇨기과 클리닉에 조회하는 일반적인 관행으로 모집되었다.
동의 안내
조사적 방광경 검사 예정인 환자들과 접촉하여 가능한 참여를 논의한다. 환자들은 연구의 성질을 안내받고 동의를 얻는다. 환자들은 인구 통계학적, 직업, 흡연력 정보를 제공하고 소변 시료를 제공하기 전에 그들이 환자 정보 및 동의 양식을 충분히 이해함을 확인한다. 연구 코디네이터는 유전자형 및 표현형 지수에 대한 관련 입력값을 상술하는 CRF 페이지를 작성하여 분석을 위하여 그 데이터를 전달한다.
포함 기준
2 또는 3회의 적절히 수집된 소변 표본에 대하여, 미시적 혈뇨(고전력장당 최소 3개 RBC)로 확인된 임상적 결과 후, 요로상피 암종에 대하여 방광경 검사 조사를 받는 환자(3).
환자는 연구 요건을 준수하고자 할 것이다.
환자는 18세 이상이다.
제외 기준
요로상피 암종(UC)의 이전 이력
현재 거시적 혈뇨 제시
이전 이력(과거 12 개월의 확인된 진단(악성 또는 다른 것)과 함께 거시적 혈뇨 에피소드)
G+P 지수
본 발명의 발명자들은 신규한 지수 "G+P 지수"를 개발하였는데, 이는 유전자형 및 표현형 데이터 양자 모두의 조합을 포함한다. 유전자형("G") 요소는 AH 환자에서 UC 위험을 결정하기 위하여 동일한 시간 창(표현형 데이터 "P")에서 환자로부터 수집된 5개 임상적 인자들과 함께 RNA 바이오마커 발현 정보를 이용한다.
모든 환자는 참인 임상적 결과를 결정하기 위하여 표준 임상적 작업을 받고, 이 연구로부터의 결과는 수집된 임상적 데이터 및 환자의 소변 시료들로부터 수집된 유전자형 데이터를 기초로 한 결과와 시뮬레이션된다. 이렇게, 환자에 대한 케어는 연구 결과로서 변경되지 않는다. 환자는 소변 시료를 제공하는데, 이를 유전자 분석을 위하여 보낸다.
환자 분류
이 연구에 참여하는 환자들에게 전체적인 표준 케어에 변화는 없다. 비뇨기과 전(全) 작업이 예정된 모든 환자들은 현재 표준 케어에 따라 적절한 조사를 받는다.
연구 데이터
인구통계학적 및 위험 인자 정보가 유전자형 및 표현형 지수에 대한 입력값이다. 최종 질병 상태(유연한 방광경 검사 및 후속 작업으로 결정)는(φ) 결과 및 인구통계학적 정보와 대조되고 통계학적 분석을 한다.
G+P 지수의 결정
대략 500명의 환자로부터, 뉴질랜드 및 호주의 다수 지역에서 수집된 시료로부터 얻어진 데이터세트를 이용하여, 'TCC=예'의 가능성을 예측하는 트레이닝 모델을 개발하였다.
트레이닝 및 검증 집단에서 사용되는 변수들에 대하여 수집된 데이터
표현형적 변수
임상적 발견은: 성별(Gender), 연령(Age), 흡연력 (Smoking history), 및 HFREQNEW(<=1 낮음을 의미; >1 높음을 의미).
유전자형적 변수
유전자형적 변수는 RNA 마커의 발현을 포함한다: M1(= MDK + CDC + IGBP5 - HOXA13) 및 IL8R. 하기 표 7은 검증 G+P 지수에서의 각 인자들의 계수 추산을 보여준다:
표 7
Figure 112016059878817-pct00046
도 18은 G+P 지수에 대한 ROC 곡선을 보여준다. 도 18은 본 발명의 구현예에 따른 결과에 대한 민감도(수직축) 대 1-특이도(수평축)의 그래프이다. 비교를 위하여 대각선이 모델에 그려진다. 오로지 표현형적 정보에만 기초한 결과는 점쇄선으로 보여지고, 오로지 유전자형적 정보에만 기초한 결과는 점선으로 보여지며, G+P 지수에 기초한 결과는 실선으로 보여진다. 이들 결과는 유전자형적 및 표현형적 정보의 조합이 결과 예측에 있어서, 비예측적인, 실질적 개선을 제공한다는 것을 보여준다.
예비적 모델은 7개의 표현형적 변수를 고려하였지만, AgeGT50는 RBC에 대한데이터가 불충분한 동안에는 미미한 효과를 나타내었고, 그러므로 이들 두 변수는 최종 모델에서는 탈락하였다. 나머지 5개 표현형적 변수들 및 2개의 RNA 마커들의 유의한 수준에 기초하여, 지수가 생성되었다. 트레이닝 데이터세트에서 M1, IL8R 및 TCC(=예) 사이의 관계를 이용하여, 각각 M1 및 IL8R에 대한 문턱값 4.5 및 2.5가 사용되었다. M1, 흡연자(Smokers), 남성(Male), IL8R, 및 HFREQ에 대하여 점수 5, 4, 3, 2 및 1이 할당되었고 - 이는 지수 점수 0 내지 15라는 결과를 낳았다. 계수에 기초하여 통합된 알고리즘이 조합된 G+P 지수로서 하기에 주어진다:
G+P 지수 = (1*HFREQ+3*Gender+4*SMK)+(5*M1+2*IL-8)
최종 모델에서 유지된 서로 다른 임상적 인자들에 대한 교차비(odd ratio)가 도 19에 나타나 있다. 교차비는 그것이 1로부터 얼마나 떨어져 있는지에 따라(예컨대, 효과 없음) 대상에 미치는 유해한 또는 방어적 효과를 갖는 것으로 해석될 수 있다. 그 신뢰 한계가 1을 제외하는 교차비는 통계학적으로 유의하다. 일반적으로, 더 높은 교차비를 갖는 인자(예컨대, SMK, Gender)는 더 작은 교차비를 갖는 인자(예컨대, HFREQ)에 비하여 더 큰 가중치를 할당받는다.
전체 모델에 대한 분류 표가 하기 표 8에 제시된다.
표 8
Figure 112016059878817-pct00047
G+P 지수의 1차 검증 연구
G+P 지수의 사용을 추가 시험하기 위하여, 다른 연구를 수행하였다. 다양한 임상적 및 RNA 마커들의 통계학적 유의성에 기초하여, 지수를 생성하였다. 그 TCC 상태(예 또는 아니오) 뿐 아니라 G+P 지수 변수들이 이용 가능한, 98명의 대상체가 있었다.
M1(유전자 시험), 흡연자(Smokers), 남성(Male), IL8R, 및 HFREQ에 대하여 점수 5, 4, 3, 2 및 1이 할당되어 - 지수 점수 0 내지 15라는 결과를 낳았다. 참 양성 및 참 음성의 수는 각각 6과 84였다. 유사하게, 거짓 양성 및 거짓 음성의 수는 각각 5 및 3이었다. 따라서, 제안된 지수의 전체적인 정확도는 0.92였다.
G+P 지수에 기초한 의미 및 추적
G+P 지수 결과가 점수 11-15 또는 그 이상으로 정의되는 UC "고 위험"을 나타내면, 그 환자는 임상적으로 표시되는바 유연 방광경 검사 및 복부 초음파에 대하여 우선 순위가 된다.
G+P 지수 결과가 점수 6-10으로 정의되는 UC "중간 위험"을 나타내면, 그 환자는 검토되어 임상적 관행에 따라 추적된다. 세포진, 요관내시경 및/또는 CT 스캔 이용이 고려될 수 있다.
G+P 지수가 점수 0-5로 정의되는 UC "저 위험"을 나타내면, 그 환자는 일반적인 표준 케어를 받고 적절한 대기 리스트에 올라갈 것이다.
참고
하기 참고 문헌들이 상기 설명과 관련된다.
Figure 112016059878817-pct00048
Figure 112016059878817-pct00049
Figure 112016059878817-pct00050
Figure 112016059878817-pct00051
실시예 4: G+P II 지수를 이용한, 혈뇨를 나타내는 환자들의 분류
G+P 지수는, 그것이 11 내지 15 범위의 수치인 경우 양성을 나타낸다.
정의
본 발명에서 사용되는바, 하기 정의가 본 발명 및 다음의 실시예에서 사용된다.
"AMH"는 무증상 미세 혈뇨를 의미한다;
"AUA"는 미국 비뇨기과 협회를 의미한다;
"AUC"는 곡선하면적을 의미한다;
"CI"는 신뢰 구간을 의미한다;
"CT"는 컴퓨터 단층 촬영을 의미한다;
"ELISA"는 효소-결합 면역흡착 분석법을 의미한다;
"FISH"는 형광 인 시투(in situ) 혼성화를 의미한다;
"HPF"는 고전력장을 의미한다;
"logOR"는 로그 교차비를 의미한다;
"Hfreq"는 가장 최근 혈뇨 에피소드 중 평균 일일 혈뇨 빈도를 의미한다;
"ISUP"는 비뇨기과 병리학 국제 소사이어티를 의미한다;
"MRI"는 자기 공명 이미징을 의미한다;
"NPV"는 음성 예측값을 의미한다;
"OR"은 교차비를 의미한다;
"QC"는 품질 관리를 의미한다;
"QoL"는 삶의 질을 의미한다;
"표현형"은 임상적 예후 특성을 정의하고 이들을 "유전자형" 변수들이라고 광범위하게 정의된 유전자 발현계 바이오마커들과 구별하기 위하여 사용된다.
"RBC"는 적혈구를 의미한다;
"ROC"는 수신자 작동 곡선을 의미한다;
"RT-qPCR"은 정량적 역전사 중합효소 연쇄 반응을 의미한다;
"STARD"는 진단 정확도의 보고 기준을 의미한다;
"UC"는 요로상피 암종을 의미한다;
"WHO"는 세계보건기구를 의미한다.
도입
양성 전립선 비대, 감염 또는 소변 결석과 같은 원인과 가장 자주 관련이 되어 있으나, 또한 요로상피 암종(UC)의 증상이기도 한 혈뇨는 일반 인구 환자 중 1 내지 22%에서 발생하는 것으로 추정된다 [1,2]. 거시적(육안) 혈뇨는 환자의 소변 중에서 눈에 보이는 색 변화로 특징지워지는 반면, 미시적(미세) 혈뇨는 3개의 동시에 수집된 소변 시료에서 고전력장당 ≥3 적혈구수(RBCs/HPF)의 존재로서 보다 정밀하게 정의된다 [2]. 미세 혈뇨 환자들의 총 UC 유병률은 대략 4%인 것으로 보고된 반면, 몇몇 연구들은 육안 혈뇨 환자들에서 UC의 유병률은 훨씬 높아서 대략 12-23% 범위라는 것을 공통적으로 보여주었으나 [2-6], 미세 혈뇨 대 육안 혈뇨로 볼 때 비뇨기과 평가시 아직 4배까지 많은 환자들이 육안 혈뇨에서 존재한다 [7]. 주목하기로, 미국 비뇨기과 협회(AUA) 가이드라인에의 최근 변화로 보면 [2] 무증상 미세 혈뇨(AMH)에 대한 문턱값은 하나의 시료에서 ≥3 RBCs/HPF으로 낮춰졌고, 심지어 더 낮은 문턱값(≥1 RBC/HPF)이 제시되었으며 [8], 잠재적인 UC를 조사하기 위한 비뇨기과 작업을 겪을 환자의 수는 결과적으로 증가하고 그에 대응한 환자들의 헬스케어 시스템에 대한 전체적인 임상적 및 재정적 부담이 예상된다.
이러한 혈뇨 관련 환자의 전달은 비뇨기학자들에게 큰 임상적 부담이 되고, 또한 환자들은 종종 미결의 진단을 제공하는 전(全) 작업을 겪어야 하는 부담이 있다. 또한, 현존하는 진단 시험들은 - 이들 중 많은 수는 침습적이거나 높은 방사선 부담을 지우는 것인데 - 환자의 삶의 질(QoL)에 해로운 효과를 미칠 수 있고, 특히 현재 가이드라인에서 강요되고 있는 반복적인 방광경 검사를 환자가 받는 경우 특히 그러하다 [2]. 예방적 항생제없이 수행된 방광경 검사의 경우, 30일 내에 22%의 환자가 무증상 세균뇨를 가졌고, 1.9%의 환자는 열성 요로 감염(UTI)이 발병하였다 [9]. 또한, 다른 연구들은 방광경 검사 후 남성들에게서 육안 혈뇨, 배뇨시 통증 및 일시적 발기 부전의 유병률이 높아짐을 보고하였다 [10,11].
또한, 헬스케어 시스템은 혈뇨 환자들이 비뇨기과적 전 작업을 겪는 결과 큰 재정적 부담을 발생시키고 [12,13] 소변 세포진은 어떠한 유의한 진단적 이익을 제공하지 못하고 비용을 증가시킨다고 결론지어지고 있다 [14-16]. 결과적으로, 혈뇨를 나타내는 환자들의 1차 임상 작업에 정확하고, 비침습적인 시험을 포함시키는 것은 의사들이 혈뇨 환자를 효과적으로 분류할 수 있게 하고, 따라서 비뇨기과적 전 작업 및 UC에 대한 조사적 방광경 검사를 겪을 환자의 수를 감소시키며, 환자 및 헬스케어 시스템 양자 모두에게 큰 이익을 제공한다 [15-19].
몇몇 임상적 예후 특성, 예컨대 연령, 성별, 흡연력 및 혈뇨 정도는 혈뇨 환자들의 UC에 대한 위험 인자로서 잘 확인되어 있다 [3,20-22]. 최근 몇몇 그룹들이 혈뇨를 갖는 환자들의 UC 위험을 예측하기 위하여 임상적 예후 특성들에 기초한 모델들을 개발하려 하였으나 [20-22], 가장 중요하게, 이들 모델들은 제한적인 정확도를 제공하였고 질환을 갖지 않는 환자들을 배제하기 보다는 UC를 갖는 환자들을 검출하는데 크게 초점을 맞추어왔다. 그러므로, 이러한 검출에 초점을 둔 모델들은 소변 세포진과 조합하여 사용된다고 하더라도, 1차 평가 중 질환 환자들을 신뢰성있게 식별하기에는 불충분하였다 [20-22].
육안 혈뇨를 나타내는 환자들의 UC 발생 빈도가 훨씬 더 높음에도 불구하고, 다수의 연구는 육안 혈뇨를 나타내는 환자들과 비교하여 미세 혈뇨를 나타내는 환자들의 등급 및 단계에 의하여 UC 분포에 있어 어떠한 유의한 차이가 없다는 것을 보여준다 [5,23-25]. 그러므로, AUA는 혈뇨의 정도는 UC의 존재에 대하여 충분히 예측적이지 않기 때문에 육안 혈뇨 또는 AMH를 갖는 모든 환자를 비뇨기과적 전 작업을 위하여 비뇨기과의에게 보낼 것을 권고하고 있다 [2]. 그러나, 혈뇨 환자는 1차 평가에서 제한된 소변분석, 세포진 및 몇몇 경우 이미징 연구, 예컨대 초음파로 이루어지는 제한된 분석만을 겪을 것이므로, 비뇨기과적 전 작업은 종종 UC를 결과론적으로 검출하거나 배제하기 위하여 필요하다. 소변 세포진은 현재 가이드라인에서 특정되고 있고 UC 의심 환자에게 통상적으로 사용되고 있지만, 세포진 결과는 종종 비정형적이거나 의심스런 결과에 대하여는 미결론적이고 또한 UC-관련 혈뇨 환자에 대한 거짓 음성 결과에 대한 상대적으로 큰 위험으로부터 야기되는 낮은 진단률로 어려운 것이다 [2,26,27]. 결과적으로, 육안 혈뇨이든 AMH이든, 1차 평가 중에 혈뇨의 양성 원인을 배제하는 것은 어려울 것이다. 특히 UC-관련 혈뇨가 간헐적이고 양성 원인에 대한 후속하는 치료를 해결하기 위한 것으로 보인다면 더욱 그러하다 [12].
다수의 유전자 기반 연구들이 UC 환자에서 소변 바이오마커를 프로파일링하기 위하여 설명되었고, 이들 바이오마커들은 질병을 검출하기 위한 그들의 고유의 범위에서 유용할 것이다 [28,29]. 또한, 환자들을 그들의 임상적 특성과 유전자 발현 프로파일에 기초하여 분류해 내기 위한 기회도 존재한다. NMP22 효소-결합 면역흡착 분석(ELISA) 시험 또는 유전자 마커 패널을 임상적 특성들과 조합한 것은 임상적 특성 단독적인 것과 비교하여 진단 정확도를 높이는 것으로 알려졌으나, 이들 조합 모델은 전체적인 진단 정확도, 특히 저-위험 환자들을 식별하는 경우 진단 정확도에서 유의한 진전을 가져오지 못했다 [30,31]. 그럼에도 불구하고, 임상적 인자들과 특정 유전자 발현을 조합 알고리즘에 포함시키는 것은 혈뇨나 UC를 갖는 환자들을 진단하고 관리하기 위한 최선의 가이드를 제공할 수 있을 것이라고 여겨진다 [32].
CxbladderTM Detect(Pacific Edge Ltd., Dunedin, New Zealand), 미분획 소변에 대하여 수행되는 다중 유전자 시험은 이전에 소변 세포진 및 육안 혈뇨 환자에서 UC를 검출하기 위한 NMP22보다 더욱 민감하다는 것 [33] 및 비교 분석에서 소변 세포진, NMP22 및 형광 인 시투 혼성화(FISH)보다 정확하다는 것을 보였다(Kasabov, Darling, Breen, et al., unpublished observations). Cxbladder Detect는 5개의 mRNA 마커, UC에서 과발현되는 4개의 마커와 함께 비악성 염증성 질환에서 상승하는 제5의 마커를 정량하기 위하여 정량적 역전사 중합효소 연쇄 반응(RT-qPCR) 기술을 이용하고, 혈뇨를 나타내는 환자들에서 UC를 검출하기 위하여 사용시 높은 수준의 특이도 및 민감도를 제공한다 [33]. 동일한 환자로부터 수집된 고성능 유전자형 바이오마커를 그 표현형 변수들과 조합한 통합 모델이 높은 민감도(즉, 거짓 음성 결과를 받는 UC 환자의 확률이 낮음), 높은 음성 예측치(즉, 모든 음성 결과가 참인 비율이 높음) 및 UC의 확률이 낮은 환자들을 정확하게 구분해 낼 수 있게 하는 높은 시험-음성 비율을 이용하여, 우수한 임상적 해법을 제공할 것이라는 가설이 세워졌다. 이들 유전자형 및 표현형 변수들은, 신규한 분리 모델에 조합되었을 때, UC의 확률이 낮은 혈뇨 환자들로 하여금 비뇨기과적 전 작업을 거치는 것과 반대로, 그들이 식별되고 분류될 수 있도록 하게 된다.
방법
환자 선택
695명의 환자들의 예상 시료가 분석되었는데, 여기서 참인 임상적 결론은 관행적인 임상적 평가를 이용하여 결정되었다. 혈뇨 환자로 이루어진 초기 코호트로 이루어진 연구 시료는 전술한 바와 같이 동의를 얻어서 시료 채취되었고 [33], 여기서 최근 육안 혈뇨력이 있는, ≥45세 연령의 이전에 UC 이력이 없는 일련의 연속적 517명 환자가 호주와 뉴질랜드의 9개 비뇨기과 클리닉으로부터 예상 모집되었다. 소변 시료의 다중 유전자 분석 후 UC 상태 또는 다른 진단을 결정하기 위하여 이들 환자들을 3개월 동안 추적하였고, 양성 UC 진단은 방광경 검사 외관 및 조직 병리학적 검사에 근거하여 이루어졌다. 질병의 단계는 병리학 및 진단 이미징 조사에 의하여 결정된 TNM 단계 기준에 따라 분류되었고, 종양 등급은 1998 세계 보건 기구(WHO)/비뇨기과 병리학 국제 소사이어티(ISUP) 합의 분류를 이용하여, 지역 병리학 관행에 따라 분류되었다 [34].
육안 혈뇨 사건 후 비뇨기과적 조사를 겪은 94명 및 84명으로 이루어진 추가 코호트가 2012년 3월 내지 2013년 4월 사이에 뉴질랜드의 2개 센터에서 후속하여 모집되었고 모델의 개발에 포함되었다. 참여 센터들은 초기 연구에 참여한 이전 경험과 각각의 클리닉 세팅 내에서 Cxbladder Detect 산물을 평가할 의지에 기초하여 선택되었다.
미세 혈뇨를 나타내는 45명의 환자들로 이루어진 추가 대표 시험 세트가 예상 모집되었고 다음에 설명될바 G+P 지수의 추가 검증을 위하여 사용되었다.
자격 기준은 [33]의 것과 유사하였는데, ≥18세 연령인 환자들 및 이전에 음성으로 판정된 UC를 조사하기 위하여 방광경 검사를 겪었던 환자들이 모집에 적합하였다는 것을 제외하고는 유사하였다. 또한, [33]에서와 같이, UTI, 또는 방광이나 신장 결석의 표지인 증상을 나타내는 환자들은 제외되었다.
이 연구에 대한 윤리 승인은 모든 참여 센터들에게 부여되었고 시료를 제공한 모든 환자들로부터 동의를 안내하고 얻었다.
소변 시료 수집 및 평가
유전자 발현 데이터를 제공하기 위하여, Pacific Edge의 Urine Sampling System을 이용하여 참여자들로부터 하나의 중간뇨 시료를 수집하였다. 시판 Cxbladder Detect 다중 유전자 시험에서 사용되듯이, 모든 연구의 시료에 대한 다중 유전자 분석은 표준 운영 방법에 따라서 수행되었다. 초기 코호트로부터의 모든 소변 시료(4.5 mL)는 방광경 검사 이전에 클리닉에서 수집되어 진공 구동 흡입을 통하여 안정화 액제에 전달되어 48 시간 이내에 Pacific Edge로 보내졌다. 그 후, 시료들을 뱃치 분석이 요구될 때까지 -80℃에서 저장하였다. 후속 코호트로부터의 시료를 동일한 방식으로 수집하였지만, 실온에서 Pacific Edge로 보내졌고 개정된 품질 관리(QC) 제한에 따라 시료 수집 7일 이내에 처리되었으며, Pacific Edge 진단 실험실에서 내성 시험이 수행되었다.
통계학적 분석
단변량 로지스틱 회귀를 이용하여 UC와 관련된 4개의 2항 표현형 변수들에 대한 미조정(원형) 로그 교차비(logOR) 계수를 추산하였다: 연령, 성별, 흡연력 및 환자의 가장 최근의 혈뇨 에피소드 동안 혈뇨의 평균 일일 빈도(Hfreq; 표 9 참조).
표 9: UC와 관련된 2항 표현형 변수들의 정의 및 그 대응 점수
Figure 112016059878817-pct00052
모든 4개 표현형 변수들에 대한 다변량 로지스틱 회귀를 사용하여 표현형 모델에서 조정된 logOR 계수를 생성하였다(P 지수).
소변 시료에서 5개의 Cxbladder®Detect 유전자(IGFBP5, HOXA13, MDK, CDK1CXCR2)에 대한 mRNA 농도와 UC간의 관계를 결정하기 위하여 G 지수를 로지스틱 회귀를 이용하여 개발하였다. 다변량 유전자형-표현형 모델(G+P 지수)을, G 지수 및 P 지수로부터의 9개 변수들의 조합을 이용하여 생성하였다. 이들 선형 모델들은 그로부터 UC를 갖는 환자의 확률이 도출되는 logOR을 결정하였다.
각 모델의 상대적 성능을, 각 모델에 대하여 결정된바, UC에 대한 시험시 거짓 양성 비율 대 참 양성 비율을 플롯팅하는 수신자 조작 곡선(ROC)으로 설명하였다. 1로 접근하는 곡선하면적(AUC)이 최적인 것으로, 각 모델의 상대적 효과를 비교하기 위하여 곡선하면적을 이용하였다.
모델 추산 및 예측이 동일한 데이터 세트에 대하여 수행될 때 잠재적인 편향을 줄이기 위하여, 부트스트랩 리샘플링을 이용하여 3개 로지스틱 회귀 모델 각각에 대하여 편향-보정된 AUC가 계산되었다 [35]. 본래의 시료로부터의 명목상의 AUC와 부트스트랩 시료들로부터의 평균 AUC 사이의 차이는 시료 편향의 추산이고, 명목상의 AUC를 그에 따라 조정하였다. 편향-보정된 신뢰 구간(CIs)의 부트스트랩 추산 또한 얻어졌다 [36].
또한, 각 모델의 성능 특성은 문턱값 NPV 0.97을 넘어야 하고, 가능한 높은 민감도를 갖고 추가적인 요구로서 높은 시험-음성 비율을 가질 것이 이 임상적 시험의 설계 기준이었다. 시험 음성 비율은 UC를 가질 확률이 낮은 혈뇨를 나타내는 환자들을 분류할 때 높은 임상적 분별을 제공하도록 선택된다. G 지수, P 지수 및 G+P 지수들 간 비교가 이루어졌고, 각 모델의 성능이 민감도 및 UC 확률이 낮은 혈뇨 환자를 분류해 내기 위한 효과적 수단을 제공하기 위하여 충분히 높은 시험-음성 비율을 갖는 NPV의 관점에서 결정되었다.
결과
시료 인구통계학
3개 코호트에 전체에 등록된 육안 혈뇨를 갖는 695 환자들 중, 23명이 부적격인 것으로 보였고, 충분한 데이터의 부재 또는 QC 표준을 만족시키지 못한 시료로 인하여 다른 85명의 환자들로부터의 시료가 모집 후 제외되었다(도 20a 참고). 합하여, 72명의 UC-양성 및 515명의 UC-음성 시료를 포함하는 587명의 환자들로부터의 시료가 모델링에 이용되었다.
제공된 미세 혈뇨 환자로부터의 45개 시료 중에서, 40개가 분석에 적합하였고, 5명의 환자는 부적합한 것으로 보여 분석으로부터 제외되었다(도 20b 참고). 모든 45명의 환자들은 비뇨기과 전 평가를 받았고 임상적 진실은 UC-음성으로 확인되었다. 양자의 시료 집단으로부터의 전체적인 인구통계학적 데이터가 표 10에 제시된다.
표 10: 전체 데이터를 포함한, 육안 및 미세 혈뇨 환자들에 대한 시료 집단 인구통계
Figure 112016059878817-pct00053
표현형 변수들 및 육안 혈뇨 환자의 UC 위험 간의 관계
4개의 2항 표현형 변수들 각각에 대한 미조정된 단변량 로지스틱 회귀 분석은 ≥60세, 남성, 흡연력 및 육안 혈뇨 고빈도 모두가 UC 위험 증가와 관련되어 있음을 보여주었다(표 11).
표 11: 혈뇨 환자에 대한 표현형 및 유전자형 인자들에 의한 미조정된 OR 및 조정된 OR
Figure 112016059878817-pct00054
조정된 P 지수, G 지수 및 G+P 지수 변수 OR은 각각 P 지수, G 지수 및 G+P 지수에서 지수함수화된(exponentiated) 계수이다.
조정된 logOR 계수는 다변량 로지스틱 회귀 모델에서 계산되었다.
P 지수= -3.78 + 0.81 X Age + 0.46 X Gender + 0.78 X 흡연력 + 0.59 X Hfreq
여기서 각각의 표현형적 변수는표9에서 정해진대로 2항 점수 0 또는 1을 부여받고, 계수에 대한 신뢰 구간은 표 11에 제시되어 있다. P 지수에 대한 AUC의 편향 보정된 추산은 0.66(95% CI: 0.55-0.67; 도 21)이다.
육안 혈뇨를 갖는 환자의 UC 위험과 유전자형 변수 간의 상관관계
G 지수는 UC 발생을 예측할 소변 시료에서 IGFBP5, HOXA13, MDK, CDK1CXCR2 5개 유전자의 log mRNA 농도를 이용하여 로지스틱 회귀에 의하여 추산되었다.
G 지수 = -6.22 + 0.77 X IGFBP5 - 1.11 X HOXA13 +1.56 X MDK + 1.24 X CDK1 - 0.43 X CXCR2
G 지수는 편향-보정된 AUC 0.83을 보인다(95% CI: 0.74-0.89; 도 21).
육안 혈뇨 환자의 UC 위험과 유전자형 및 표현형 변수들 간의 상관관계
다변량 로지스틱 회귀를 이용하여, 5개의 연속적 유전자형 변수들을, 그 후 4개의 2항 표현형 변수들과 조합하여 G+P 지수를 추산하였다.
G+P 지수 = -8.46 + (0.79 X IGF - 1.60 X HOXA + 2.10 X MDK + 0.95 X CDC - 0.38 X IL8R) + (0.64 X Age + 1.11 X Gender + 0.98 X 흡연력 + 0.56 X Hfreq)
삭제
G+P 지수는 편향-보정된 AUC 0.86을 나타낸다(95% CI: 0.80-0.91).
G 지수 및 G+P 지수 간의 비교
G 지수 및 G+P 지수에 대한 신뢰 구간간의 중복이 있으므로, 쌍을 이룬 시험의 부트스트랩 버전이 각 부트스트랩 시료에 대한 G 지수 및 G+P 지수의 AUC의 차이를 결정함으로써 만들어졌다. 분석에 이용 가능한 본래의 587개 시료를 시료 크기 n=587로부터 교체 무작위 샘플링하여 1만개 부트스트랩 시료를 생성하였다. 모델들간 차이에 대하여 결과하는 95% CI는 0.01-0.08이었다. 따라서, 두 AUC 간 참 차이는 0.01 미만인 것인 확률은 <0.025이고, 이는 G 지수에 대한 AUC보다 훨씬 큰 G+P 지수에 대한 AUC가 높은 가능성이 있다는 것을 나타낸다.
모델의 NPV 및 민감도
G+P 지수는 0.2 내지 0.7 범위의 시험-음성 비율에 걸쳐 NPV >0.97을 생성하였고, 거의 항상 G 지수 모델에 대한 NPV보다 높았다(도 22). 상기 G+P 지수는 시험-음성 비율이 0.4일 때, 성능 특성으로 민감도 0.95 및 NPV 0.98을 제공하였다(표 12; 도 22). 반대로, G 지수는 시험-음성 비율 0.4일 때 오직 민감도 0.86 및 NPV 0.96을 달성하였다(표 12).
표 12: 변화하는 시험 음성 비율에 대하여 문턱값을 설정하는 경우 각각의 모델의 성능 특성
Figure 112016059878817-pct00055
미세 혈뇨 환자에서 G+P 지수의 적용
G+P 지수가 육안 혈뇨 환자들로부터의 데이터를 이용하여 개발되었지만, 그 강인성(robustness)를 미세 혈뇨 환자들로부터의 40개 추가 시료에서 시험하였다(Hfreq=0). 이 집단에서 UC의 발생이 더 낮았기 때문에 더 높은 시험-음성 비율이 미세 혈뇨 집단에서 기대되었고, 시험 음성 비율 0.4를 이용하면 32명(80%) 환자들이 음성으로 판정되었고 정확히 분류된 것이며 따라서 UC 결정을 위하여 비뇨기과적 전 작업을 필요로 하지 않았다.
논의
본 연구는 임상의들과 의사들에게 혈뇨를 나타내는 환자들을 UC 검출을 위한 비뇨기과적 전 작업을 해야할 필요로부터 효과적으로 분류해 내는 능력을 제공하는 임상적 수단을 정의한다. 본 연구는 유전자형 또는 표현형 데이터 만으로부터 배타적으로 도출되는 모델들에 의하여 제공되지 않는, 내적으로 검증된 유전자형-표현형 모델, G+P 지수를 제공하는데, 이는 부트스트랩 기반 CI 추산된 것이며, 높은 민감도 및 높은 NPV(즉, 거짓-음성 결과를 제공하는 각각의 UC 환자의 확률이 낮고, 모든 음성 결과가 참일 비율이 높다)의 조합을 제공한다. 이는, 특히 비뇨기과적 전 작업을 필요로 하지 않는 UC를 가질 위험이 낮은 환자들을 식별함으로써 미세 및 육안 혈뇨를 갖는 환자들을 분류해 낼 고유한 기회를 임상의들과 의사들에게 제공한다.
UC 확률이 낮은 환자들을 임상적 전 작업으로부터 멀어지게 하려는 목적인 효과적인 분류 시험에 있어서, 높은 민감도의 맥락에서 높은 시험-음성 비율은 중요한 고려사항이다 [37]. 따라서, 0.4의 시험-음성 비율에서, 본 발명에서 제시되는 G+P 지수의 민감도는 민감도 및 NPV 양자 모두를 최대화한다 (각각 0.95 및 0.98). 이는 [33]으로 간행된 유전자형 모델로부터 선택된 최선의 결과(민감도=0.82; NPV=0.97)와 비교될 수 있고, 또한 방광경 검사(민감도=0.89-0.98; NPV=0.99) 및 컴퓨터화된 토모그래피(CT)를 이용한 시각적 방광경 검사 스캔이나 자기 공명 영상(MRI)(각각 민감도=0.94 및 0.91) 양자 모두와도 비견할 만한 것이다 [38-40].
본 발명에서 G 지수, P 지수 및 G+P 지수를 유도하기 위하여 사용된 시료 집단이 육안 혈뇨 환자들로 이루어졌다는 것이 인정된다. 그러나, 육안 혈뇨 환자들에서 시험 음성 비율 0.4에서의 이 시험의 높은 민감도는 상기 G+P 지수로 하여금 육안 및 미세 혈뇨 집단 양자 모두를 통틀어 적용될 수 있도록 한다. UC를 갖거나 갖지 않는 환자들이 미세 및 육안 혈뇨 환자들 집단 중에 유사하게 분포하지만 미세 혈뇨 집단에서 UC 유병률이 4%로 예상된다고 가정하면, 높은 NPV가 또한 미세 혈뇨 환자 집단에서 예상될 수 있다.
G+P 지수를 UC를 갖지 않는 미세 혈뇨 환자들의 시료 집단에 적용함으로써, 상기 환자들 중 80%가 상기 결과를 기초로 분류되었음이 보여졌다. 단지 20%만이 비뇨기과적 전 작업으로 보내졌다. 이는 양성 원인에 기인할 수 없는 미세 혈뇨를 갖는 모든 환자들(100%)을 비뇨기과적 전 작업을 겪도록 보고, 현저한 불필요한 비용을 발생시키고 환자의 삶의 질에 부정적인 영향을 미치는 종래의 가이드라인과 비교된다.
혈뇨의 중증도는 UC를 가질 환자의 확률과 연관되어 있지 임의의 종양의 단계 또는 등급과 관련되어 있지 않고, 비교기과의에게 전해진 미세 혈뇨 및 육안 혈뇨 환자 각각 중 추정 96% 및 77-88%는 UC를 갖지 않을 것이다 [2-6]. 그러므로, 혈뇨를 갖는 환자들에게 잠재적으로 불필요한 비뇨기과적 작업들을 피하도록 하는 것은 몇 가지 장점이 있다. 방광경 검사는 배뇨 통증, 출혈, UTIs, 남성 성기능 장애 및 미결 또는 미확인된 UC 진단을 동반할 걱정과 같은 부작용과 관계될 수 있다 [9-11]. 가장 주목할만하게는, 이 새로운 접근은 UC-음성 환자들에 대한 비뇨기과적 전 작업과 관련된 자원 및 재정적 비용에 대한 부담을 감소시키는 잠재력을 갖는다. 예컨대, 영국에서, 초기 음성 세포진 및/또는 종양 바이오마커 시험으로 혈뇨 환자의 방광경 검사를 회피시키는 것은 평가되는 환자당 대략 US$770(환자당 483 파운드)를 절약할 것으로 추산되었다 [13]. 상기 본 발명에서 기재되는 G+P 지수는 1차 평가 세팅에 사용할 때 소변 세포진의 사용에 대한 효과적인 대안을 제공한다. 이는 특히 1차 평가가 1차 케어 의사에 의하여 수행되는 경우 세팅에 있어서 의미가 있다.
이러한 기초에서, 각각의 비뇨기과적 전 작업에 임의의 '명목상 비용' US$4,500를 할당한다면, 미세 혈뇨 환자 1000명을 작업하기 위한 통비용은 US$4.5 백만에 육박할 것이다. 반대로, 미미세 혈뇨 환자 중 80%가 임의의 명목상 비용 US$2,500에 G+P 지수를 이용하여 분류된다면, 나머지 20%의 환자들을 시험하고 그에 대한 비뇨기과적 전 작업의 총직접 비용은 총 US$3.4 백만일 것이다. 이는 미세 혈뇨를 갖는 1000명의 환자당 대략 US$1.1 백만의 직접 비용에 대한 개념상 알짜 절감을 제공한다. O'Sullivan et al. [33]에 의하여 개발된 유전자형 알고리즘이 본 발명에서 제시되는 G+P 지수와 동일한 유전자형 구성을 포함하지만, 그 민감도 및 특이도 간의 균형은 비뇨기과적 전 작업을 겪고 있던 증상 환자(즉, 혈뇨를 나타내는)에서 UC를 최적 1차 검출하기 위하여 보정되었다. 반면, 본 연구의 G+P 지수는 또한 표현형 변수들을 포함하였고 높은 민감도 및 높은 NPV에 대하여 최적화 되었는데, 이는 의심되는 UC에 대하여 비뇨기과적 전 작업을 필요로 하지 않는 혈뇨 환자들을 분리해 내기 위한 것이다. UC를 갖는 환자를 정의하거나 선별하려는 어떠한 시도는 없다. 대신에, 목적은 UC를 갖지 않는 환자들을 확실하게 제외하는 것이고, 이렇게 분류되지 않는 모든 환자는 비뇨기과적 전 작업에 대하여 계속 진행될 것이다.
몇몇 연구가 혈뇨를 나타내는 환자들에서 UC의 위험을 평가할 때 표현형을 고려하는 예측 모델을 이전에 개발하고자 하였으나, 표현형에만 의존하는 모델의 정확도는 제한적인 것으로 나타난다. 예컨대, Loo et al. [21]은 표현형적 파라미터들이 비뇨기과적 면담 및 전 작업을 필요로 하지 않을 미세 혈뇨 환자를 식별하는데 사용될 수 있을지를 예상 조사하였고, 연령, 남성 및 최근 육안 혈뇨가 UC의 유의한 예측자라는 결론을 내렸다. 흡연력 및 최근 소변 분석에서 >25 RBCs/HPF인 것은 따로는 UC의 통계학적으로 유의한 예측자가 아니었으나, 예측 정확도를 증가시키기 위한 그들의 '혈뇨 위험 지수'에 포함되는 경우에도, 이 지수는 AUC 0.809라는 결과를 빚었다 [21]. 흥미롭게도, 본 연구의 표현형적 OR과 Loo et al.에 의하여 확인된 것과는 비교할만 한데, 흡연력과 성별에 대한 중복되는 95% CI를 갖고, 연령, 성별 및 흡연력은 각 모델에서 유사한 가중치를 가졌으나, 본 발명에서 제시되는 G+P 지수의 유전자형적 요소의 영향이 더 높은 AUC를 설명하는 것으로 보인다 [21].
유사하게, Cha et al. [20]은 성별을 제외한, 연령, 흡연력 및 혈뇨의 정도가 무증상 혈뇨 환자에서 UC의 존재와 크게 관련되어 있다고 보고하였고, 다변량 모델을 사용하여 UC를 예측하기 위한 표현형 및 소변 세포진 데이터로 이루어진 노모그램을 개발하였다. Loo et al. [21]과 같이, 보고된 표현형 OR은 본 발명에서 보고되는 것과 비교할만 하였지만, 노모그램에 소변 세포진을 포함시킨 후에도, [20]에서 보고되는 AUC 0.831은 상기 G+P 지수의 그것보다 낮았다.
다른 연구에서, Tan et al. [22]은 연령, 성별, 흡연력 및 혈뇨 정도로부터 도출된 노모그램을 이용하여 전문가 비뇨기 클리닉에 면담되었던 혈뇨 환자들을 고-위험 및 저-위험으로 소급적으로 계층화하였다. 이 연구와 비교는 데이터의 부재로 인하여(405명 환자 중 80명) 제외된 환자들의 높은 비율에 주의하여 이루어져야 하지만, AUC 0.804, 민감도 0.900 및 NPV 0.953로 모두 본 발명에서 개시되는 G+P 지수보다 낮았다.
표현형 모델들의 정확도를 증가시키기 위한 몇몇 시도가, 그들을 소변 바이오마커 시험의 결과로 보충함으로써도 이루어졌다. 핵 기질 단백질 NMP22 케어 포인트 프로테오믹 분석이 UC를 검출하기 위하여 독자적으로 사용되는 경우, 이는 민감도 0.557 및 NPV 0.968을 가졌다 [17]. Lotan et al. [41]은 표현형적 인자들, NMP22 및 소변 세포진을 포함하는 UC를 예측하기 위한 AUC 0.826를 갖는 다변량 알고리즘을 간행하였고, 상기 AUC는 그 후 AUC 0.802로 예상 검증되었다 [31]. 그러나, 이 모델은 낮은 UC 확률을 갖는 환자들을 분류해 내기 위하여 민감도 및 NPV를 최대화하는 것과는 반대로, UC를 갖거나 갖지 않는 고-위험 환자들을 구별하려고 시도하였다는 것에 주목하는 것이 중요하다.
유전자형 및 표현형 데이터를 모두 포함하는 알고리즘으로 얻어지는 증가된 정확도는 유방암에서, 특히 [42-45]에서 이전에 입증되었다. 유사하게, Mitra et al. [30]은 UC를 갖는 환자들의 생존 예측에서 통상의 임상병리학적 파라미터들보다 우수한 다변량 모델을 계산하기 위하여 분자 마커들 및 흡연 강도의 조합을 사용하였다. 그러나, 본 연구는 생존 예측보다는 비뇨기과적 추적 및 임상적 케어의 차등적 수준을 필요로 하는 카테고리로 혈뇨 환자를 분리하기 위한 모델의 정확도를 증가시키기 위하여 표현형적 위험 인자가 유전자형 데이터와 조합될 수 있다는 것을 처음으로 증명한 것이다.
표현형적 데이터가 모델에서 유전자형적 데이터와 조합되었을 때, 데이터의 분리도는 모델의 정확도에 큰 영향을 미칠 가능성이 있다. 예컨대, 흡연은 UC에 대하여 잘 알려진 위험 인자이고 UC를 검출하는 대부분의 표현형 모델에 포함된다. Cha et al. [20], Tan et al. [22], Lotan et al. [31,41] 및 최근의 연구는 2항 판별자인 한번도 흡연하지 않음 및 현재/과거 흡연자를 사용하였으며, Mitra et al. [30]은 흡연 햇수 및 매일 흡연하는 담배 개피수에 기초하여 흡연 강도를 계산하였고, Loo et al. [21]은 흡연자들을 한번도 흡연하지 않음, 수동적 흡연자, 끊은 흡연자 및 현재 흡연자로 범주화하였다. UC의 위험이 흡연에 노출됨에 의하여 실질적으로 증가한다는 것이 알려져 있지만 [46], 임의적으로 표현형 변수들을 정의하는 것은 표현형 모델의 전체적인 정확도 및 이용을 제한할 수 있다. 반대로, 환자의 유전자형 및 표현형 변수들의 상호 작용은 비예상이 아닐 것이다. 그러나, 표현형 인자 및 유전자형 변수들의 영향을 하나의 수단 내에 조합하는 것은 본 연구에서 기술하는 모델의 정확도를 증가시켰다. 또한, 유사한 원리가 혈뇨 표현형을 설명하는 것에 적용된다. 미세 또는 육안 혈뇨를 나타내는 환자들은 기본적으로 생물학적 연속체상에 있는 것이고, UC를 가질 가능성이 서로 다르다 [2-6,21]. 따라서, 본 발명에서 모든 환자들이 Hfreq 점수 0인 미세 혈뇨를 갖는다 하더라도 그들의 혈뇨의 중증도를 다른 표현형적 인자들과 조합하여 G+P 지수의 유전자형 요소에서 간접적으로 고려할 수 있다.
참고
바로 아래에 서술되는 문헌들은 실시예 4를 참조하고, 참조로서 그 전부가 본 발명에 포함된다.
Figure 112016059878817-pct00056
Figure 112016059878817-pct00057
Figure 112016059878817-pct00058
Figure 112016059878817-pct00059
Figure 112016059878817-pct00060
결론
결론적으로, 본 발명에서 보고되는 G+P 지수는 임상적 이용을 변화시킬 유의한 기회를 보여준다. G+P 지수는, 그들의 임상의나 의사들에게 혈뇨를 제시하는 환자, 이들은 UC 확률이 낮은 환자들인데 이들을 높은 시험-음성 비율, 높은 수준의 민감도 및 높은 NPV로 정확하게 분류해 낼 수 있다. 이 모델은 비뇨기과적 전 작업을 필요로 하지 않는 환자들을 분류해 내기 위하여 혈뇨 환자들을 1차 평가하는 도중에 사용하기 적합하며, 따라서 UC를 평가하는 비뇨기과 전문의들에 대한 면담을 요구할 혈뇨 환자들의 수를 감소시키고, 환자의 삶의 질을 유지하는데 도움이 되며 진단 관련 비용을 절감하는데 도움이 된다.
실시예 5: G+P 지수 III("G2")를 이용한 혈뇨 환자의 분류
G+P 지수의 추가적인 용도는 환자들을 UC의 위험에 따라 범주화하는 것이다. 위험 범주는 그 후, 환자들을 추후 조사하기 위한 우선순위를 부여하는데 사용된다.
이 실시예는 지수, 여기서 명하기로는 "G2+P 지수"를 사용하여 환자들을 분류하는 대안의 방법을 제공한다. 이는 실시예 4에서 설명한 G+P 지수와 유사하다.
G2의 정의
이 분류기는 다음의 식을 계산한다:
Figure 112016059878817-pct00061
그 후,
Figure 112016059878817-pct00062
이고 하기 점수를 얻는다:
점수 = eR/(1+ eR), 여기서 [IGF], [HOXA], [MDK], [CDC] 및 [IL8R]은 각각 유전자 IGF, HOXA, MDK, CDC 및 IL8R에 대한 시료 농도의 알고리즘이고; '*'는 통상의 곱셈이고, e = 2.718282...는 자연(Napierian) 로그이다.
높은 점수는 UC 존재의 가능성이 높다는 것을 나타낸다. 예로서, 본 발명의 발명자들은 문턱값 0.12를 설정하고 점수 >= 0.12를 UC를 가질 가능성이 높은 것으로 선언할 수 있고, 0.12 미만의 점수를 UC를 가질 가능성이 낮은 것으로 할 수 있다.
실시예 6: 요로상피 암종의 확률이 낮은 혈뇨를 나타내는 환자들을 분류하는 [G1=P]-지수 및 G2의 동시 사용
A. 미세 혈뇨 환자
환자 데이터-세트
- 45명 환자의 시료가 분석되었다.
- 흡연 상태를 결여하고 있는 5명의 환자들은 이 분석에서 제외되었다.
- 모든 환자들이 비뇨기과적 전 작업을 받았고 아무도 요로상피 암종을 갖지 않는다.
- 표현형 변수: 성별, 연령, 흡연 상태
- 환자 인구통계학은 아래 표 13에 보여진다.
표 13
Figure 112016059878817-pct00063
관찰된 시험 음성 비율:
문턱값으로 시험 음성 비율 40%를 사용하여 데이터를 아래 표 14에 나타내었다.
표 14
Figure 112016059878817-pct00064
문턱값으로 음성 시험 비율 50%를 사용하여 데이터를 아래 표 15에 나타내었다.
표 15
Figure 112016059878817-pct00065
음성 시험 비율 60%를 문턱값으로 사용하여 동일한 결과를 얻는다/
가장 고 위험의 그룹(남성, 현재 또는 과거 흡연자, 연령 >= 60)은 모두 이 분류 부류에서 양성이었다.
요약 및 결론
1. 임상적 가이드라인 문서에 의하여, 모든 41명의 환자들은 통상적으로 비뇨기과적 전 작업을 받을 것이다.
2. 모든 41명은 전 작업을 받았고 모든 41명은 요로상피 암종을 갖지 않는 것으로 결정되었다.
3. 시험 음성 비율(TNR 50%)에서 85%의 미세-혈뇨 환자들이 스크리닝 되고 그러므로 결과적으로 비뇨기과적 전 작업을 받지 않을 것이다.
4. Cxbladder-분류가 TNR 50%으로 사용된다면(분류 지수 -3.33) 85.4%의 환자들이 분류되어질 것이고 결과적으로, 정확히 비뇨기과적 전 작업을 받지 않을 것이다.
5. Cxbladder-분류가 TNR 40%으로 사용된다면(분류 지수 -3.0) 80.4%의 환자들이 분류되어질 것이고 결과적으로, 정확히 비뇨기과적 전 작업을 받지 않을 것이다.
B. 육안 혈뇨를 갖는 환자
환자 데이터 세트
임상 시험 데이터 및 North Shore 및 CURT 산물 시험으로부터의 587개 시료를 사용하였다. 이 데이터 세트는 연령, 성별, 흡연 상태 및 혈뇨 빈도, 및 IGF, HOXA, MDK, CDC, IL8R에 대한 유전자 농도를 포함하는 완전한 데이터로 이루어진 서브세트였다
아래의 Cxbladder-분류 모델을 개발하는데 사용되었던 동일한 데이터를 사용하였다;
G+P 지수 = -8.46 + 0.79 IGF -1.60 HOXA + 2.10 MDK + 0.95 CDC - 0.38 IL8R + 0.98 SNS + 0.56 Hfreq +1.11 Gender + 0.64 Age
삭제
도 24에 G2 진단 점수에 대응한 분류 점수를 플롯팅하였다. 분류 문턱값 -3.33, -2.99 및 -2.71은 각각 시험 음성 비율 40%, 50% 및 60%에 대응하였다. 수직값은 Cxbladder 문턱값 0.12 및 0.23이다. 채워진 원은 종양에 해당하고; 녹색은 Ta, 적색은 모든 다른 단계 종양이다. 표 16은 임상적 결과를 보여준다.
표 16
Figure 112016059878817-pct00066
도 24의 4사분면의 수를 고려하였고 분류 지수 및 G2에 대한 다양한 컷오프에 의하여 결정하였다.
Cxbladder-분류(분류 지수)에 대한 문턱값 -3은 시험 음성 비율 50%에 해당한다. 표 17이 이들 결과를 보여준다.
표 17
Figure 112016059878817-pct00067
동일한 G2 문턱값 0.12와 함께 Cxbladder-분류 문턱값 -3.33(시험 음성 비율 40%)을 사용하여 표 18에 나타낸 데이터를 관찰하였다.
표 18
Figure 112016059878817-pct00068
요약 및 결론
1. 동일한 환자들에 대한 동일한 시간 구간에서 Cxbladder 분류(G+P) 및 Cxbladder 검출(G2)의 순차적 조합을 사용하는 것은 환자들을 4개의 핵심 임상적 그룹으로 통합적 분리하는 것을 제공하였다.
2. 미세 및 육안 혈뇨를 나타내는 환자들의 조합된 집단에 대하여 그리고 시험 음성 비율 40%를 이용하여, 환자들 중 587명의 환자들 중에서 총 235명(40.0%)이 분류되었다. 이들 환자들은 UC에 대한 전 작업을 필요로 하지 않을 것이라고 결론낸다.
3. 동일한 집단에서, 해당하는 잔류 그룹의 352명(60%) 환자들은 비뇨기과적 전 작업을 받을 것이다.
4. 이 잔류 그룹은 모두 높은 등급 및 후기 단계 종양을 포함하였다. 이들 환자들은 분류되지 않았고 그러므로 결과적으로 정확히 비뇨기과적 전 작업을 받을 것이다.
5. 총 4건의 낮은-등급 Ta(총종양 수의 5.6%)가 분류될 것이고 전 작업을 받지 않을 것이다.
6. 분류 법칙이 40% 시험 음성 비율 아래이면서 G2 점수 < 0.12인 모든 환자들을 분류할 수 있게 한다면, 전 작업을 받지 않을 총 13건의 낮은 등급 Ta가 분류되었고, 모든 높은 등급 후기 단계 종양이 걸려져서 비뇨기과적 전 작업을 받을 것이다.
7. 이러한 변형된 분류 법칙은 또한 총 587명 중 총 440명 환자를 분리해 내는 결과를 낳았다(75%).
장점 및 일반적 결론
결론적으로 본 발명에서 보고되는 G+P 지수는 임상적 이용을 변화시키는 큰 기회를 보여준다. G+P 지수는 그들의 임상의 또는 의사들에게 혈뇨를 제시하는 UC 확률이 낮은 환자들을 높은 총 시험-음성 비율, 높은 수준의 민감도 및 높은 NPV로 정확히 분류할 수 있다. 이 모델은 비뇨기과적 전 작업을 필요로 하지 않는 환자들을 1차 케어 의사들이 분류해 내는 용도로 적합하고, 그로써 UC의 비뇨기과적 평가를 위한 전문의와의 면담을 필요로 하는 혈뇨 환자의 수를 감소시키고, 환자의 삶의 질을 유지하도록 도움을 주며, 진단 관련 비용을 절감해준다. 여기에 개시된 방법은 혈뇨를 갖는 환자들에게 후속 조사를 요구하지 않는 예측치 못한 정확한 평가를 제공하였다. 이들은 본 발명에 포함된 내용을 사용하지 않고는 달성될 수 없었던 우수한 효과를 제공한다.
참조 포함
모든 특허, 특허 출원 및 비특허 문헌에 대한 인용은 개별적으로 포함된 것과 같이 본 발명에 그 전체가 참조로서 포함된다.
산업상 이용 가능성
본 발명의 구현예들은 헬스케어 및 의약 분야에서 유용하다.
기술 분야
본 발명의 구현예들은 어떤 환자들이 실질적인 단기 과정 또는 후속 과정을 필요로 하지 않는지를 결정하는 높은 정확도의, 민감하고 특이적인 컴퓨터 구현 환자 분류 방법을 제공한다. 본 방법은 헬스 케어의 질을 향상시키고 비용을 절감하기 위하여 혈뇨 환자로부터의 특이적인 유전자형 및 표현형 정보 분석에 기초하여 실재하는 유용한 구체적인 결과를 산출하는 신규하고 비자명한 컴퓨터 작동을 제공함으로써 컴퓨터 작동을 개선시킨다.
SEQUENCE LISTING <110> Pacific Edge Limited <120> Triaging of Patients Having Asymptomatic Hematuria Using Genotypic and Phenotypic Biomarkers <130> PEBL 1028 WO1 <160> 17 <170> Patent In version 3.5 <210> 1 <211> 360 <212> PRT <213> Human <400> 1 Met Glu Asp Phe Asn Met Glu Ser Asp Ser Phe Glu Asp Phe Trp Lys 1 5 10 15 Gly Glu Asp Leu Ser Asn Tyr Ser Tyr Ser Ser Thr Leu Pro Pro Phe 20 25 30 Leu Leu Asp Ala Ala Pro Cys Glu Pro Glu Ser Leu Glu Ile Asn Lys 35 40 45 Tyr Phe Val Val Ile Ile Tyr Ala Leu Val Phe Leu Leu Ser Leu Leu 50 55 60 Gly Asn Ser Leu Val Met Leu Val Ile Leu Tyr Ser Arg Val Gly Arg 65 70 75 80 Ser Val Thr Asp Val Tyr Leu Leu Asn Leu Ala Leu Ala Asp Leu Leu 85 90 95 Phe Ala Leu Thr Leu Pro Ile Trp Ala Ala Ser Lys Val Asn Gly Trp 100 105 110 Ile Phe Gly Thr Phe Leu Cys Lys Val Val Ser Leu Leu Lys Glu Val 115 120 125 Asn Phe Tyr Ser Gly Ile Leu Leu Leu Ala Cys Ile Ser Val Asp Arg 130 135 140 Tyr Leu Ala Ile Val His Ala Thr Arg Thr Leu Thr Gln Lys Arg Tyr 145 150 155 160 Leu Val Lys Phe Ile Cys Leu Ser Ile Trp Gly Leu Ser Leu Leu Leu 165 170 175 Ala Leu Pro Val Leu Leu Phe Arg Arg Thr Val Tyr Ser Ser Asn Val 180 185 190 Ser Pro Ala Cys Tyr Glu Asp Met Gly Asn Asn Thr Ala Asn Trp Arg 195 200 205 Met Leu Leu Arg Ile Leu Pro Gln Ser Phe Gly Phe Ile Val Pro Leu 210 215 220 Leu Ile Met Leu Phe Cys Tyr Gly Phe Thr Leu Arg Thr Leu Phe Lys 225 230 235 240 Ala His Met Gly Gln Lys His Arg Ala Met Arg Val Ile Phe Ala Val 245 250 255 Val Leu Ile Phe Leu Leu Cys Trp Leu Pro Tyr Asn Leu Val Leu Leu 260 265 270 Ala Asp Thr Leu Met Arg Thr Gln Val Ile Gln Glu Thr Cys Glu Arg 275 280 285 Arg Asn His Ile Asp Arg Ala Leu Asp Ala Thr Glu Ile Leu Gly Ile 290 295 300 Leu His Ser Cys Leu Asn Pro Leu Ile Tyr Ala Phe Ile Gly Gln Lys 305 310 315 320 Phe Arg His Gly Leu Leu Lys Ile Leu Ala Ile His Gly Leu Ile Ser 325 330 335 Lys Asp Ser Leu Pro Lys Asp Ser Arg Pro Ser Phe Val Gly Ser Ser 340 345 350 Ser Gly His Thr Ser Thr Thr Leu 355 360 <210> 2 <211> 2880 <212> DNA <213> Human <400> 2 aggttcaaaa cattcagaga cagaaggtgg atagacaaat ctccaccttc agactggtag 60 gctcctccag aagccatcag acaggaagat gtgaaaatcc ccagcactca tcccagaatc 120 actaagtggc acctgtcctg ggccaaagtc ccaggacaga cctcattgtt cctctgtggg 180 aatacctccc caggagggca tcctggattt cccccttgca acccaggtca gaagtttcat 240 cgtcaaggtt gtttcatctt ttttttcctg tctaacagct ctgactacca cccaaccttg 300 aggcacagtg aagacatcgg tggccactcc aataacagca ggtcacagct gctcttctgg 360 aggtgtccta caggtgaaaa gcccagcgac ccagtcagga tttaagttta cctcaaaaat 420 ggaagatttt aacatggaga gtgacagctt tgaagatttc tggaaaggtg aagatcttag 480 taattacagt tacagctcta ccctgccccc ttttctacta gatgccgccc catgtgaacc 540 agaatccctg gaaatcaaca agtattttgt ggtcattatc tatgccctgg tattcctgct 600 gagcctgctg ggaaactccc tcgtgatgct ggtcatctta tacagcaggg tcggccgctc 660 cgtcactgat gtctacctgc tgaacctagc cttggccgac ctactctttg ccctgacctt 720 gcccatctgg gccgcctcca aggtgaatgg ctggattttt ggcacattcc tgtgcaaggt 780 ggtctcactc ctgaaggaag tcaacttcta tagtggcatc ctgctactgg cctgcatcag 840 tgtggaccgt tacctggcca ttgtccatgc cacacgcaca ctgacccaga agcgctactt 900 ggtcaaattc atatgtctca gcatctgggg tctgtccttg ctcctggccc tgcctgtctt 960 acttttccga aggaccgtct actcatccaa tgttagccca gcctgctatg aggacatggg 1020 caacaataca gcaaactggc ggatgctgtt acggatcctg ccccagtcct ttggcttcat 1080 cgtgccactg ctgatcatgc tgttctgcta cggattcacc ctgcgtacgc tgtttaaggc 1140 ccacatgggg cagaagcacc gggccatgcg ggtcatcttt gctgtcgtcc tcatcttcct 1200 gctctgctgg ctgccctaca acctggtcct gctggcagac accctcatga ggacccaggt 1260 gatccaggag acctgtgagc gccgcaatca catcgaccgg gctctggatg ccaccgagat 1320 tctgggcatc cttcacagct gcctcaaccc cctcatctac gccttcattg gccagaagtt 1380 tcgccatgga ctcctcaaga ttctagctat acatggcttg atcagcaagg actccctgcc 1440 caaagacagc aggccttcct ttgttggctc ttcttcaggg cacacttcca ctactctcta 1500 agacctcctg cctaagtgca gccccgtggg gttcctccct tctcttcaca gtcacattcc 1560 aagcctcatg tccactggtt cttcttggtc tcagtgtcaa tgcagccccc attgtggtca 1620 caggaagtag aggaggccac gttcttacta gtttcccttg catggtttag aaagcttgcc 1680 ctggtgcctc accccttgcc ataattacta tgtcatttgc tggagctctg cccatcctgc 1740 ccctgagccc atggcactct atgttctaag aagtgaaaat ctacactcca gtgagacagc 1800 tctgcatact cattaggatg gctagtatca aaagaaagaa aatcaggctg gccaacgggg 1860 tgaaaccctg tctctactaa aaatacaaaa aaaaaaaaaa attagccggg cgtggtggtg 1920 agtgcctgta atcacagcta cttgggaggc tgagatggga gaatcacttg aacccgggag 1980 gcagaggttg cagtgagccg agattgtgcc cctgcactcc agcctgagcg acagtgagac 2040 tctgtctcag tccatgaaga tgtagaggag aaactggaac tctcgagcgt tgctgggggg 2100 gattgtaaaa tggtgtgacc actgcagaag acagtatggc agctttcctc aaaacttcag 2160 acatagaatt aacacatgat cctgcaattc cacttatagg aattgaccca caagaaatga 2220 aagcagggac ttgaacccat atttgtacac caatattcat agcagcttat tcacaagacc 2280 caaaaggcag aagcaaccca aatgttcatc aatgaatgaa tgaatggcta agcaaaatgt 2340 gatatgtacc taacgaagta tccttcagcc tgaaagagga atgaagtact catacatgtt 2400 acaacacgga cgaaccttga aaactttatg ctaagtgaaa taagccagac atcaacagat 2460 aaatagttta tgattccacc tacatgaggt actgagagtg aacaaattta cagagacaga 2520 aagcagaaca gtgattacca gggactgagg ggaggggagc atgggaagtg acggtttaat 2580 gggcacaggg tttatgttta ggatgttgaa aaagttctgc agataaacag tagtgatagt 2640 tgtaccgcaa tgtgacttaa tgccactaaa ttgacactta aaaatggttt aaatggtcaa 2700 ttttgttatg tatattttat atcaatttaa aaaaaaacct gagccccaaa aggtatttta 2760 atcaccaagg ctgattaaac caaggctaga accacctgcc tatatttttt gttaaatgat 2820 ttcattcaat atcttttttt taataaacca tttttacttg ggtgtttata aaaaaaaaaa 2880 <210> 3 <211> 18 <212> DNA <213> Synthetic <400> 3 tgcaccccca agaccaaa 18 <210> 4 <211> 26 <212> DNA <213> Synthetic <400> 4 tgattaaagc taacgagcag acagaa 26 <210> 5 <211> 26 <212> DNA <213> Synthetic <400> 5 ccttcccttt cttggctttg gccttt 26 <210> 6 <211> 22 <212> DNA <213> Synthetic <400> 6 cgttgtacct gcccaattgt ga 22 <210> 7 <211> 20 <212> DNA <213> Synthetic <400> 7 gggacgcatc actcaacgtt 20 <210> 8 <211> 27 <212> DNA <213> Synthetic <400> 8 aagagaaagc agtgcaaacc ttcccgt 27 <210> 9 <211> 16 <212> DNA <213> Synthetic <400> 9 gccgccgcgg aataat 16 <210> 10 <211> 28 <212> DNA <213> Synthetic <400> 10 tgtctaccct tatacacaac tccatagg 28 <210> 11 <211> 31 <212> DNA <213> Synthetic <400> 11 agccgggatc taccataccc attgactaac t 31 <210> 12 <211> 20 <212> DNA <213> Synthetic <400> 12 tggaacggcc aaatgtactg 20 <210> 13 <211> 20 <212> DNA <213> Synthetic <400> 13 tggcgtattc ccgttcaagt 20 <210> 14 <211> 23 <212> DNA <213> Synthetic <400> 14 actctgcccg acgtggtctc cca 23 <210> 15 <211> 23 <212> DNA <213> Synthetic <400> 15 ccttgaggca cagtgaagac atc 23 <210> 16 <211> 23 <212> DNA <213> Synthetic <400> 16 cctgtaggac acctccagaa gag 23 <210> 17 <211> 27 <212> DNA <213> Synthetic <400> 17 tggccactcc aataacagca ggtcaca 27

Claims (18)

  1. 혈뇨를 나타내는 환자에서 요로상피 암을 가질 위험 수준을 결정하는 방법으로서, 이 방법은:
    a. 상기 환자로부터 소변 시료를 제공하는 단계;
    b. 상기 시료에서 인간 MDK, CDC2, HOXA13, 및 IGFBP5의 발현 수준을 정량하는 것을 포함하는, M1 값을 정량하고, IL-8Rb의 발현 수준을 정량하는 단계;
    c. 상기 환자의 표현형적 변수: 혈뇨의 빈도 (HFREQ), 연령 (AgeGT50), 성별 (Gender), 흡연력 (SMK), 및 적혈구수 (RBC)를 평가하는 단계;
    d. 식 (i), G+P 지수 = (1*HFREQ+3*Gender+4*SMK) + (5*M1+2*IL-8Rb), 또는
    식 (ii), G+P 지수 = (w1*HFREQ+w2*AgeGT50+w3*Gender+w4*SMK+w5*RBC) + (w6*M1+w7*IL-8Rb), 또는
    식 (iii), G+P 지수 = -8.46 + 0.79 IGFBP5 -1.60 HOXA13 + 2.10 MDK + 0.95 CDC2 - 0.38 IL-8Rb + 0.98 SMK + 0.56 HFREQ + 1.11 Gender + 0.64 AgeGT50
    중 하나에 따라 G+P 지수를 계산하는 단계로,
    여기서,
    HFREQ는 6 개월 기간에 고전력장당(per high power field) 3개 이상의 적혈구 세포가 발견되는 빈도를 의미하는데, 빈도가 낮으면 HFREQ = 0이고, 고전력장당 3개 적혈구 세포보다 크면 1이고;
    AgeGT50은 대상체의 연령을 말하는데, 50 세를 넘으면 AgeGT50 = 1이고, 50 세 미만이면 0이며,
    Gender는 남성에 대하여는 1의 값이 부여되고 여성에 대하여는 0이고,
    SMK는 대상체가 현재 또는 과거 흡연자인지를 의미하는데, 비흡연자이면 SMK = 0이고, 흡연자라면 1이고;
    RBC는 적혈구 세포 수를 의미하는데, RBC가 25 개 이상이면 1로 정해지고, 25 미만이면 0이고,
    M1은 식 (MDK + CDC2 + IGFBP5 - HOXA13)에 의하여 계산되는 유전자 마커 MDK, CDC, IGFBP5, 및 HOXA13의 발현 수준의 조합값인데; M1 > 4.5이면 1로 정해지고, 4.5 미만이면 0이고,
    IL-8Rb는 IL-8Rb에 대한 RNA의 발현 수준을 말하는데, IL-8Rb > 2.5이면 IL-8Rb은 1로 정해지고, 2.5 미만이면 0이고,
    용어 w1-w7은 각각 위에서 나열된 각각의 변수들에 할당된 가중치인 단계; 및
    e. 상기 G+P 지수가, 상기 환자가 요로상피 암을 가지는 위험 수준을 표시하는 문턱값보다 큰지 여부를 결정하는 단계
    를 포함하는 방법.
  2. 제1항에 있어서, 상기 문턱값은 G+P 지수 값이 0 내지 5, 6 내지 10 또는 11 내지 15인 군으로부터 선택되는 것이고, 상기 0 내지 5의 값은 낮은 위험을 나타내고, 6 내지 10의 값은 중간 위험을 나타내고, 11 내지 15의 값은 높은 위험을 나타내는 것인 방법.
  3. 제2항에 있어서, 상기 문턱값이 G+P 지수 값 6-10이면, 상기 환자는 추가적인 임상적 또는 실험실 시험을 겪는 것인 방법.
  4. 제2항에 있어서, 상기 문턱값이 G+P 지수 값 11-15이면, 상기 환자는 추가적인 임상적 또는 실험실 시험을 겪는 것인 방법.
  5. 제2항에 있어서, 상기 문턱값이 G+P 지수 값 0-5이면, 상기 환자는 추가적인 임상적 또는 실험실 시험에 대한 관망 리스트에 오르는 것인 방법.
  6. 제1항에 있어서, 상기 문턱값은 통계학적 방법을 이용하여 구축되는 것인 방법.
  7. 제6항에 있어서, 상기 통계학적 방법은 선형 판별 분석(Linear Discriminant Analysis, LDA), 로지스틱 회귀(Logistic Regression, LogReg), 서포트 벡터 머신(Support Vector Machine, SVM), K-최근접 5 이웃(K-nearest 5 neighbors, KN5N), 및 파티션 트리 분류기(Partition Tree Classifier, TREE) 중 임의의 하나인 것인 방법.
  8. 제1항에 있어서, 도 6 또는 도7로부터 선택되는 하나의 추가적인 유전자형 마커의 발현을 정량하는 단계를 더 포함하는 것인 방법.
  9. 제1항 내지 제8항 중 어느 하나의 항에 있어서, 상기 단계 b는 mRNA의 수준을 검출함으로써 수행되는 것인 방법.
  10. 제1항 내지 제8항 중 어느 하나의 항에 있어서, 상기 단계 b는 cDNA의 수준을 검출함으로써 수행되는 것인 방법.
  11. 제1항 내지 제8항 중 어느 하나의 항에 있어서, 상기 단계 b는 cDNA의 적어도 일부와 상보적인 올리고뉴클레오티드를 이용하여 수행되는 것인 방법.
  12. 제1항 내지 제8항 중 어느 하나의 항에 있어서, 상기 단계 b는 정방향 프라이머 및 역방향 프라이머를 이용하여 qRT-PCR을 이용하여 수행되는 것인 방법.
  13. 제1항 내지 제8항 중 어느 하나의 항에 있어서, 상기 단계 b는 단백질의 수준을 검출함으로써 수행되는 것인 방법.
  14. 제1항 내지 제8항 중 어느 하나의 항에 있어서, 상기 단계 b는 펩타이드의 수준을 검출함으로써 수행되는 것인 방법.
  15. 제1항 내지 제8항 중 어느 하나의 항에 있어서, 상기 단계 b는 각각의 마커에 대응하여 지시되는 항체를 이용하여 수행되는 것인 방법.
  16. 제1항 내지 제8항 중 어느 하나의 항에 있어서, 상기 단계 b는 샌드위치-유형 면역분석 방법을 이용하여 또는 항체 칩을 이용하여 수행되는 것인 방법.
  17. 제1항 내지 제8항 중 어느 하나의 항에 있어서, 상기 단계 b는 모노클로날 항체를 이용하여 수행되는 것인 방법.
  18. 제1항 내지 제8항 중 어느 하나의 항에 있어서, 상기 단계 b는 폴리클로날 항혈청을 이용하여 수행되는 것인 방법.
KR1020167016582A 2013-11-21 2014-11-20 유전자형 및 표현형 바이오마커를 사용하는 무증상 혈뇨를 갖는 환자의 분류 KR102297935B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361907013P 2013-11-21 2013-11-21
US61/907,013 2013-11-21
PCT/US2014/066678 WO2015077485A1 (en) 2013-11-21 2014-11-20 Triaging of patients having asymptomatic hematuria using genotypic and phenotypic biomarkers

Publications (2)

Publication Number Publication Date
KR20160126972A KR20160126972A (ko) 2016-11-02
KR102297935B1 true KR102297935B1 (ko) 2021-09-06

Family

ID=53180146

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020167016582A KR102297935B1 (ko) 2013-11-21 2014-11-20 유전자형 및 표현형 바이오마커를 사용하는 무증상 혈뇨를 갖는 환자의 분류

Country Status (14)

Country Link
US (2) US10131955B2 (ko)
EP (1) EP3071973B1 (ko)
JP (1) JP6554646B2 (ko)
KR (1) KR102297935B1 (ko)
CN (1) CN106461663B (ko)
AU (1) AU2014352956B2 (ko)
BR (1) BR112016011721B1 (ko)
CA (1) CA2931297C (ko)
DK (1) DK3071973T3 (ko)
ES (1) ES2844202T3 (ko)
NZ (1) NZ720626A (ko)
PT (1) PT3071973T (ko)
SG (1) SG10201804276UA (ko)
WO (1) WO2015077485A1 (ko)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NZ589251A (en) * 2010-11-12 2014-07-25 Pacific Edge Ltd Novel marker for detection of bladder cancer
CA2931297C (en) * 2013-11-21 2022-10-04 Pacific Edge Limited Triaging of patients having asymptomatic hematuria using genotypic and phenotypic biomarkers
EP3740760B1 (en) * 2018-01-19 2023-05-31 Mars, Incorporated Biomarkers and classification algorithms for chronic kidney disease in cats
CN108504555B (zh) * 2018-04-16 2021-08-03 图灵人工智能研究院(南京)有限公司 鉴别及评价肿瘤进展的装置和方法
JP7431760B2 (ja) * 2018-06-30 2024-02-15 20/20 ジェネシステムズ,インク 癌分類子モデル、機械学習システム、および使用方法
JPWO2020071489A1 (ja) * 2018-10-04 2021-09-24 国立大学法人大阪大学 尿路上皮がんを検査する方法
CN111540469A (zh) * 2020-05-29 2020-08-14 杭州广科安德生物科技有限公司 构建体外检测胃癌的数学模型的方法及其应用
CN111489829A (zh) * 2020-05-29 2020-08-04 杭州广科安德生物科技有限公司 构建体外检测胰腺癌的数学模型的方法及其应用
CN111755076A (zh) * 2020-07-01 2020-10-09 北京小白世纪网络科技有限公司 基于空间可分离性的利用基因检测的疾病预测方法及系统
US11932080B2 (en) 2020-08-20 2024-03-19 Denso International America, Inc. Diagnostic and recirculation control systems and methods
US11828210B2 (en) 2020-08-20 2023-11-28 Denso International America, Inc. Diagnostic systems and methods of vehicles using olfaction
US11881093B2 (en) 2020-08-20 2024-01-23 Denso International America, Inc. Systems and methods for identifying smoking in vehicles
US11760169B2 (en) 2020-08-20 2023-09-19 Denso International America, Inc. Particulate control systems and methods for olfaction sensors
US11760170B2 (en) 2020-08-20 2023-09-19 Denso International America, Inc. Olfaction sensor preservation systems and methods
US11813926B2 (en) 2020-08-20 2023-11-14 Denso International America, Inc. Binding agent and olfaction sensor
US11636870B2 (en) 2020-08-20 2023-04-25 Denso International America, Inc. Smoking cessation systems and methods
CN112216395A (zh) * 2020-09-11 2021-01-12 中山大学孙逸仙纪念医院 一种乳腺癌患者腋窝淋巴结转移预测模型及其构建方法
CN114685587B (zh) * 2022-03-28 2023-10-27 中南大学 环状RNAcircMDK及其应用和肝癌治疗制剂
CN115512833B (zh) * 2022-11-22 2023-03-24 四川省医学科学院·四川省人民医院 基于深度学习Markov框架建立肺癌患者远期成本效用预测系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NZ595684A (en) * 2004-07-23 2013-06-28 Pacific Edge Biotechnology Ltd Urine markers for detection of bladder cancer
NZ589251A (en) * 2010-11-12 2014-07-25 Pacific Edge Ltd Novel marker for detection of bladder cancer
CA2931297C (en) * 2013-11-21 2022-10-04 Pacific Edge Limited Triaging of patients having asymptomatic hematuria using genotypic and phenotypic biomarkers

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Cancer Res,18(5):1323-1333 (2012.03.01)

Also Published As

Publication number Publication date
US20170275697A1 (en) 2017-09-28
US20190203300A1 (en) 2019-07-04
JP6554646B2 (ja) 2019-08-07
NZ720626A (en) 2021-12-24
CN106461663A (zh) 2017-02-22
JP2016538884A (ja) 2016-12-15
ES2844202T3 (es) 2021-07-21
EP3071973B1 (en) 2020-11-04
BR112016011721A2 (pt) 2017-09-26
PT3071973T (pt) 2021-01-13
EP3071973A4 (en) 2017-05-31
AU2014352956A1 (en) 2016-06-16
US10131955B2 (en) 2018-11-20
EP3071973A1 (en) 2016-09-28
CN106461663B (zh) 2021-05-28
CA2931297C (en) 2022-10-04
BR112016011721B1 (pt) 2024-01-02
DK3071973T3 (da) 2021-01-11
CA2931297A1 (en) 2015-05-28
WO2015077485A1 (en) 2015-05-28
AU2014352956B2 (en) 2021-01-28
KR20160126972A (ko) 2016-11-02
SG10201804276UA (en) 2018-06-28

Similar Documents

Publication Publication Date Title
KR102297935B1 (ko) 유전자형 및 표현형 바이오마커를 사용하는 무증상 혈뇨를 갖는 환자의 분류
US11208698B2 (en) Methods for detection of markers bladder cancer and inflammatory conditions of the bladder and treatment thereof
US8642270B2 (en) Prognostic biomarkers to predict overall survival and metastatic disease in patients with triple negative breast cancer
JP2020150949A (ja) メラノーマ癌の予後予測
US9702009B2 (en) Urine gene expression ratios for detection of cancer

Legal Events

Date Code Title Description
N231 Notification of change of applicant
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant