KR20150100698A - 갑상선 종양을 진단하기 위한 조성물 및 방법 - Google Patents

갑상선 종양을 진단하기 위한 조성물 및 방법 Download PDF

Info

Publication number
KR20150100698A
KR20150100698A KR1020157017018A KR20157017018A KR20150100698A KR 20150100698 A KR20150100698 A KR 20150100698A KR 1020157017018 A KR1020157017018 A KR 1020157017018A KR 20157017018 A KR20157017018 A KR 20157017018A KR 20150100698 A KR20150100698 A KR 20150100698A
Authority
KR
South Korea
Prior art keywords
gene
leu
thyroid
expression
tissue sample
Prior art date
Application number
KR1020157017018A
Other languages
English (en)
Other versions
KR102174578B1 (ko
Inventor
에르난 에우제니오 곤잘레스 디아즈
세르지오 바르가스 살라스
호세 로드리고 발데마르 마르티네즈 솔리스
Original Assignee
폰티피씨아 유니베르시다드 까똘리까 데 칠레
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 폰티피씨아 유니베르시다드 까똘리까 데 칠레 filed Critical 폰티피씨아 유니베르시다드 까똘리까 데 칠레
Publication of KR20150100698A publication Critical patent/KR20150100698A/ko
Application granted granted Critical
Publication of KR102174578B1 publication Critical patent/KR102174578B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61NELECTROTHERAPY; MAGNETOTHERAPY; RADIATION THERAPY; ULTRASOUND THERAPY
    • A61N5/00Radiation therapy
    • A61N5/10X-ray therapy; Gamma-ray therapy; Particle-irradiation therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57484Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/04Endocrine or metabolic disorders
    • G01N2800/046Thyroid disorders

Abstract

본 발명은 가는 바늘 흡인을 포함하는, 생물학적 시료에서 갑상선암을 동정하기 위한 진단 어세이 뿐만 아니라 본 발명의 방법을 실행하는데 유용한 관련 조성물 및 키트를 제공한다.

Description

갑상선 종양을 진단하기 위한 조성물 및 방법{COMPOSITIONS AND METHODS FOR DIAGNOSING THYROID TUMORS}
[관련 출원에 대한 교차-참조]
본 출원은 2012년 11월 27일자로 출원된 미국 가출원 제61/730,391호 및 2013년 3월 8일자로 출원된 미국 가출원 제61/775,419호에 대해 우선권을 주장한다. 이들 출원은 그 전문이 본원에 참고로 포함된다.
[서열목록]
본 출원과 관련된 서열목록은 서류 사본 대신에 텍스트 형태로 제공되며, 명세서에 참고로 포함된다. 서열목록을 포함하는 텍스트 파일의 명칭은 BMRC_001_02WO_ST25.txt이다. 상기 텍스트 파일은 약 57 KB이고, 2013년 11월 26일자로 작성되었으며, EFS-Web을 통해 전자문서로 제출된다.
본 발명은 갑상선암을 진단하고 갑상선 결절이 양성 또는 암성인지를 결정하도록 이들을 평가하기 위한 조성물 및 방법에 관한 것이다.
갑상선 결절의 대략 350,000개의 가는 바늘 흡인 (fine needle aspirate, FNA) 생검을 매년 미국에서 수행하고 있는데, 이의 20%는 상기 결절이 암성인지 여부와 관련하여 확실하지 않은 것으로 보고되고 있다. 대부분의 사례에서, 이들 환자는, 단지 15 내지 30% 사이의 범위인, 암의 위험성을 고려하여 수술을 받는다. 이는 대부분의 환자가 갑상선의 외과적 제거를 요구하지 않음을 의미한다. 환자 및 보건 시스템의 비용뿐만 아니라, 갑상선 수술과 관련된 급성 및 장기간 위험성을 고려하면, 갑상선 FNA 생검의 진단 정확도를 개선시킬 수단에 대한 긴급한 요구가 존재한다.
최근에는, 불확정한 갑상선 결절의 진단을, 다양한 정도로, 개선하는 새로운 검사들이 미국시장에 진출하였다. 이들은 아피르마 (Afirma®) 갑상선 FNA 분석 검사 (Veracyte, South San Francisco, CA)를 포함하는데, 이는 167개 유전자를 기준으로 하는 유전자 발현 분류기 어세이이다. 그러나, 아피르마 검사는 약 50%의 사례에서만 정상으로 외과적 행동을 변경할 수 있었다. 다른 2종의 검사는 Quest Diagnostics사 및 Asuragen사에 의해 개발된 검사들을 포함하는데, 이들은 미국 갑상선 협회 (American Thyroid Association)에 의해 승인된 공지의 바이오마커의 돌연변이 분석을 기반으로 한다. 그러나, 적절한 임상 시험의 검증이 결여되어 있다. 불행히도, 아피르마® 검사는 수많은 바이오마커들의 분석을 요구하고, 모든 검사는 중앙연구소에서 수행되어야만 하며, 시로를 분석을 위해 배송할 필요가 있다. 또한, 이들 어세이를 수행하기 위해 적절한 시료를 얻기 위해서는 2차 FNA가 수행되어야만 한다.
명백히, 갑상선 결절을 평가하고 갑상선암을 진단하기 위한 개선된 방법 및 조성물에 대한 요구가 당해 분야에 존재한다. 본 발명은 세침흡인 (FNA) 생검에 의해 불확정인 것으로 보고되었던 갑상선 결절을 평가하기 위한 신규하고 간략화된 진단적 접근법을 제공함으로써 이러한 필요성을 충족하고, 부가적인 이점을 제공한다.
본 발명은 시료, 예를 들어, 갑상선 조직 또는 갑상선 결절 시료에서 악성 또는 양성 조직의 존재 또는 부재를 결정하기 위한 조성물, 방법 및 키트를 제공한다.
특정 실시양태에서, 본 발명은 개체에서 갑상선암을 진단하는 방법로서, 개체로부터 입수한 갑상선 조직 시료의 3개 이상의 유전자 산물의 발현 수준을 측정하는 단계이며, 여기서 상기 3개 이상의 유전자 산물이 표 1에 열거된 하나 이상의 유전자에 의해 발현되고 상기 유전자 산물의 적어도 하나가 CXCR3, CCR3, CXCL10, CAR, XB130, HO-1 또는 CCR7 유전자에 의해 발현되는 것인 단계; 및 측정된 발현 수준과 갑상선 조직 시료 내 갑상선암의 존재 또는 부재를 상관시킴으로써 상기 갑상선 조직 시료를 암성 또는 양성으로 동정하는 단계를 포함하는, 방법을 제공한다. 다양한 실시양태에서, 상기 방법은 조직 시료가 암성 또는 양성인지 여부를 결정하기 위해, 예를 들면, 개체가 갑상선암과 같은 암을 갖는지 여부를 결정하기 위해 사용된다.
본 발명에 따른 방법의 특정 실시양태에서, 상기 상관시키는 단계는 3개 이상의 유전자 산물의 발현 수준을 각각의 유전자 산물에 대한 정상 대조군 발현 수준과 비교함으로써 수행되는데, 갑상선 조직 시료와 정상 대조군 발현 수준 사이에서 3개 이상의 유전자 산물의 발현 수준에 차이가 있는 경우 상기 갑상선 조직 시료는 암성으로 동정된다. 관련 실시양태에서, 갑상선 조직 시료와 정상 대조군 발현 수준 사이에 4개 이상의 유전자 산물의 발현 수준에 차이가 있는 경우 상기 갑상선 조직 시료는 암성으로 동정된다. 특정의 실시양태에서, 상기 정상 대조군 발현 수준은 정상 갑상선 조직 시료 내 발현 수준인 반면, 특정의 실시양태에서, 상기 정상 대조군 발현 수준은 복수 개의 정상 갑상선 조직 시료에서의 발현 수준을 토대로 미리 결정된 값이다. 본 발명에 따른 방법의 특정한 실시양태에서, CXCR3, CXCL11, SPAG-9, CAR, 넥틴-1, XB-130 및/또는 CXCL4 유전자의 임의의 하나 이상의 발현 수준이 감소하거나/하고; CXCR3A, CXCR3B, CXCR4, CCR3, CXCL9, CXCL10, CK-19, TIMP-1, CLDN-1, 및/또는 CCR7 유전자의 임의의 하나 이상의 발현 수준이 정상 대조군 발현 수준에 비해 갑상선 조직 시료에서 증가하고, 증가 또는 감소한 발현을 나타내는 유전자의 총 개수가 적어도 3개인 경우, 상기 갑상선 조직 시료는 암성으로 동정된다.
본 발명에 따른 방법의 특정 실시양태에서, 상기 상관시키는 단계는 3개 이상의 유전자 산물의 발현수준을 각각의 유전자 산물에 대한 암 대조군 발현 수준과 비교함으로써 수행되는데, 갑상선 조직 시료와 암 대조군 발현 수준 사이에 3개 이상의 유전자 산물의 발현수준에서 실질적으로 차이가 없는 경우 상기 갑상선 조직 시료를 암성으로 동정한다. 구체적인 실시양태에서, 갑상선 조직 시료와 암 대조군 발현 수준 사이에 4개 이상의 유전자 산물의 발현 수준에서 실질적으로 차이가 없는 경우, 상기 갑상선 조직 시료를 암성으로 동정한다. 특정의 실시양태에서, 상기 암 대조군 발현 수준은 암성 갑상선 조직 시료에서의 발현 수준이다. 구체적인 실시양태에서, 상기 암 대조군 발현 수준은 복수 개의 암성 갑상선 조직 시료에서의 발현 수준을 토대로 미리 결정된 값이다.
본 발명에 따른 방법의 특정한 실시양태에서, 상기 상관시키는 단계는 하기 2개 세트의 생물학적 시료, 즉 (i)복수 개의 정상 갑상선 조직 시료; 및 (ii) 복수 개의 암성 갑상선 조직 시료에서 3개 이상의 유전자 산물에 대해 측정된 유전자 발현 데이터에 대해 발현 수준을 비교하는 것을 포함하며, 여기서 갑상선 조직 시료와 (i)의 유전자 발현 데이터 사이에서 3개 이상의 유전자 산물의 발현 수준에 차이가 있는 경우에, 또는 갑상선 조직 시료와 (ii)의 유전자 발현 데이터 사이에서 하나 이상의 유전자 산물의 발현 수준에 실질적으로 차이가 없는 경우에, 상기 갑상선 조직 시료를 암성으로 동정한다.
본 발명에 따른 방법의 구체적인 실시양태에서, 상기 상관시키는 단계는 비정형의 CT값 및/또는 비-비정형 CT값을 동정하는 분류자(classifier)를 사용하여 수행된다. 특정의 실시양태에서, 상기 분류자는 복수개의 정상 갑상선 조직시료 및/또는 암성 갑상선 조직시료로부터의 3개 이상의 유전자 산물에 대해 측정된 유전자 발현 데이터를 사용하여 생성되었다.
본 발명에 따른 방법의 구체적인 실시양태에서, 상기 갑상선 조직시료는 침 흡인, 세침 흡인, 코어 침 생검, 진공 보조 생검, 대형 코어 생검, 절개 생검, 절제 생검, 또는 펀치 생검에 의해 얻어졌다.
본 발명에 따른 방법의 다양한 실시양태에서, 상기 유전자 산물은 RNA, 예컨대 mRNA, rRNA, tRNA, 또는 miRNA이다. 특정의 실시양태에서, 상기 RNA 발현 수준은 마이크로어레이, SAGE, 블롯팅, RT-PCR, 정량적 PCR 또는 qNPA를 이용하여 측정된다. 본 발명의 다양한 실시양태에서, 상기 유전자 산물은 단백질이다. 특정의 실시양태에서, 상기 단백질 유전자 발현은 ELISA, 질량 분광광도법, 블롯팅, 단백질체학 기술, 또는 면역조직화학을 이용하여 측정된다.
본 발명에 따른 방법, 조성물 및 키트의 다양한 실시양태에서, 상기 3개 이상의 유전자 산물은: CXCR3, CCR3, CXCL10, CK19, TIMP-1, CLDN-1, CAR, XB130, HO-1 및 CCR7 유전자의 3개 이상의 유전자 산물; CXCR3, CCR3, CXCL10, CK19, TIMP-1, CLDN-1, CAR, HO-1 및 CCR7 유전자의 유전자 산물; CCR3, TIMP-1, CAR 및 XB130 유전자의 유전자 산물; CXCL10, TIMP-1, CAR 및 CCR7유전자의 유전자 산물; TIMP-1, CAR 및 CCR7 유전자의 유전자 산물; 또는 CXCL10, TIMP-1, CLDN-1, 및 CCR7 유전자의 유전자 산물을 포함하거나 이들로 이루어진다. 이들 유전자 세트의 어느 하나와 관련된 방법, 조성물 및 키트의 구체적인 실시양태에서, CXCR3, CXCL11, SPAG-9, CAR, 넥틴-1, XB-130 및/또는 CXCL4 유전자의 발현 수준은 감소하고/하거나; CXCR3A, CXCR3B, CXCR4, CCR3, CXCL9, CXCL10, CK-19, TIMP-1, CLDN-1, HO-1 및/또는 CCR7 유전자의 발현 수준은 증가한다. 따라서, 특정의 실시양태에서, 상기 3개 이상의 유전자 산물은 CXCR3, CCR3, CXCL10, CK19, TIMP-1, CLDN-1, CAR, XB130, HO-1 및 CCR7 유전자의 유전자 산물을 포함하거나 이들로 이루어지는데, 여기서 CXCR3, CAR, 및 XB130 유전자의 하나 이상, 2개 이상, 또는 이들 모두의 발현 수준이 감소하고/하거나, CCR3, CXCL10, CK19, TIMP-1, CLDN-1, HO-1, 및 CCR7 유전자의 하나 이상, 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상 또는 이들 모두의 발현 수준이 증가한다. 다른 특정의 실시양태에서, 상기 3개 이상의 유전자 산물은 CXCR3, CCR3, CXCL10, CK19, TIMP-1, CLDN-1, CAR, HO-1 및 CCR7 유전자의 유전자 산물을 포함하거나 이들로 이루어지는데, 여기서 CXCR3 및 CAR 유전자의 하나 또는 이들 모두의 발현 수준이 감소하고/하거나, CCR3, CXCL10, CK19, TIMP-1, CLDN-1, HO-1, 및 CCR7 유전자의 하나 이상, 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상 또는 이들 모두의 발현 수준이 증가한다. 다른 특정의 실시양태에서, 상기 3개 이상의 유전자 산물은 CCR3, TIMP-1, CAR 및 XB130 유전자의 유전자 산물을 포함하거나 이들로 이루어지는데, 여기서 CAR 및 XB130 유전자의 하나 이상 또는 이들 모두의 발현 수준이 감소하고/하거나, CCR3 및 TIMP-1 유전자의 하나 이상 또는 이들 모두의 발현 수준이 증가한다. 다른 특정의 실시양태에서, 상기 3개 이상의 유전자 산물은 CXCL10, TIMP-1, CAR 및 CCR7 유전자의 유전자 산물을 포함하거나 이들로 이루어지는데, 여기서 CAR 유전자의 발현 수준이 감소하고/하거나, CXCL10, TIMP-1, 및 CCR7 유전자의 하나 이상, 2개 이상 또는 이들 모두의 발현 수준이 증가한다. 다른 특정의 실시양태에서, 상기 3개 이상의 유전자 산물은 TIMP-1, CAR 및 CCR7 유전자의 유전자 산물을 포함하거나 이들로 이루어지는데, 여기서 CAR 유전자의 발현 수준이 감소하고/하거나, TIMP-1 및 CCR7 유전자의 하나 이상 또는 이들 모두의 발현 수준이 증가한다. 다른 특정의 실시양태에서, 상기 3개 이상의 유전자 산물은 CXCL10, TIMP-1, CLDN-1 및 CCR7 유전자의 유전자 산물을 포함하거나 이들로 이루어지는데, 여기서 CXCL10, TIMP-1, CLDN-1 및 CCR7 유전자의 하나 이상, 2개 이상, 3개 이상 또는 이들 모두의 발현 수준이 증가한다.
특정의 실시양태에서, 본 발명의 방법은 예비적 진단을 얻기 위하여 개체로부터 얻어진 갑상선 조직 시료에 대해 세포학적 분석을 수행하는 단계를 추가로 포함한다. 특정의 실시양태에서, 중간체 또는 불확정 예비적 진단을 갖는 시료는 본 발명의 방법에 따라서 유전자 산물의 발현 수준을 측정하고 이들을 양성 또는 악성 시료와 상관시킴으로써 추가로 분석된다. 특정의 실시양태에서, 세포학적으로 분석된 조직시료와 유전자 산물의 발현수준을 측정하는데 사용된 조직시료는 동일한 조직 시료이다. 본 발명에 따른 방법의 특정 실시양태에서, 상기 조직 시료는 세침 흡인에 의해 얻어졌다.
본 발명에 따른 방법, 조성물, 또는 키트의 특정의 실시양태에서, 갑상선 조직 시료는 92% 또는 그 이상 또는 97% 또는 그 이상의 민감도를 갖는 암성 또는 양성으로 진단되고, 갑상선 조직시료는 60% 또는 그 이상 또는 90% 또는 그이상의 특이성을 갖는 암성 또는 양성으로 진단되며, 갑상선 조직 시료는 50% 또는 그 이상 또는 90% 또는 그 이상의 양성 예측치로 암성 또는 양성으로 진단되고, 갑상선 조직 시료는 92% 또는 그 이상 또는 94% 또는 그 이상의 음성 예측치로 암성 또는 양성으로 진단되며, 갑상선 조직 시료는 2 또는 그 이상 또는 10 또는 그 이상의 양성 우도비 (likelihood ratio)로 암성 또는 양성으로 진단되고, 갑상선 조직 시료는 50% 또는 그 이상 또는 80% 또는 그 이상의 양성 검사 후 (post-test) 확률로 암성 또는 양성으로 진단되며, 갑상선 조직 시료는 0.14 또는 그 미만 또는 0.08 또는 그 미만의 음성 우도비로 암성 또는 양성으로 진단되고/되거나, 갑상선 조직 시료는 7.0% 또는 그 미만 또는 3.0% 또는 그 미만의 음성 검사 후 확률로 암성 또는 양성으로 진단된다.
본 발명에 따른 방법의 구체적인 실시양태는 개체로부터 갑상선 조직 시료를 얻는 것을 추가로 포함한다.
본 발명에 따른 방법의 구체적인 실시양태는 상기 갑상선 조직 시료가 암성으로 진단된 경우, 개체의 갑상선 또는 이의 일부를 외과적으로 제거하는 단계를 추가로 포함한다.
관련하는 실시양태에서, 본 발명은 갑상선암을 진단하기 위한 키트를 포하하며, 상기 키트는 유전자 산물을 검출하기 위한 3개 이상의 시약을 포함하며, 상기 3개 이상의 시약은 각각 상이한 유전자 산물을 검출하고, 여기서 상기 유전자 산물이 표 1에 열거된 하나 이상의 유전자에 의해 발현되며, 상기 유전자 산물의 적어도 하나가 CXCR3, CCR3, CXCL10, CAR, XB130, HO-1 또는 CCR7 유전자에 의해 발현된다. 특정의 실시양태에서, 상기 시약은 항체이고, 각각의 항체는 폴리펩티드 유전자 산물에 특이적으로 결합한다. 특정의 실시양태에서, 상기 시약은 올리고뉴클레오티드 또는 올리고뉴클레오티드의 세트이고, 각각의 올리고뉴클레오티드는 핵산 유전자 산물에 특이적으로 결합한다. 특정의 실시양태에서, 상기 시약은 각각 기질에 부착된다. 특정의 실시양태에서, 상기 시약은 기질에 공유적으로 부착된다. 특정의 실시양태에서, 상기 시약은 고체 기질의 별개의 영역에 각각 부착된다. 특정의 실시양태에서, 상기 시약은 고체 기질에 공유적으로 결합한 올리고뉴클레오티드 또는 올리고뉴클레오티드의 세트이고, 상기 고체 기질은 선택적으로 어레이이며, 상기 어레이는 선택적으로 마이크로어레이이다. 특정의 실시양태에서, 상기 시약은 올리고뉴클레오티드의 세트이고, 상기 올리고뉴클레오티드의 세트는 DNA를 포함한다. 특정의 실시양태에서, 상기 시약은 올리고뉴클레오티드의 세트이고, 상기 올리고뉴클레오티드의 각각의 세트는 하나의 유전자 산물에 특이적으로 혼성화한다. 일 실시양태에서, 상기 올리고뉴클레오티드의 각각의 세트는 하나의 유전자 산물을 PCR 증폭할 수 있는 증폭 프라이머를 포함한다. 본 발명에 따른 다양한 키트의 특정 실시양태에서, 상기 유전자 산물은: CXCR3, CCR3, CXCL10, CK19, TIMP-1, CLDN-1, CAR, XB130, HO-1 및 CCR7 유전자의 3개 이상의 유전자 산물; CXCR3, CCR3, CXCL10, CK19, TIMP-1, CLDN-1, CAR, HO-1 및 CCR7 유전자의 유전자 산물; CCR3, TIMP-1, CAR 및 XB130 유전자의 유전자 산물; CXCL10, TIMP-1, CAR 및 CCR7 유전자의 유전자 산물; TIMP-1, CAR 및 CCR7 유전자의 유전자 산물; 또는 CXCL10, TIMP-1, CLDN-1, 및 CCR7 유전자의 유전자 산물을 포함하거나 이들로 이루어진다.
본 발명에 따른 방법, 조성물, 및 키트의 특정 실시양태에서, 상기 시약은 표지되어 있다. 특정의 실시양태에서, 본 발명의 키트는 상기 시약을 유전자 산물에 결합시키기에 적합한 하나 이상의 용액을 추가로 포함한다. 본 발명에 따른 키트의 특정 실시양태에서, 상기 시약은 올리고뉴클레오티드의 세트이고, 상기 키트는 PCR 어세이를 수행하기 위한 하나 이상의 부가적인 시약을 추가로 포함한다. 특정의 실시양태에서, 상기 하나 이상의 부가적인 시약은 열안정성 중합효소, 데옥시뉴클레오티드의 혼합물, 및 검출가능하게 표지된 프로브로부터 선택된다. 특정 실시양태에서, 상기 검출가능하게 표지된 프로브는 형광단 및 소광 모이어티를 포함한다. 특정의 실시양태에서, 상기 검출가능하게 표지된 프로브는 상기 프로브가 온전한 상태가 아닌 절단될 경우에 검출가능한 신호를 방출한다.
본 발명에 따른 키트의 다양한 실시양태에서, 상기 키트는 갑상선 조직 시료를 처리하기 위한 하나 이상의 시료를 추가로 포함한다. 특정의 실시양태에서, 상기 갑상선 조직 시료의 처리는 갑상선 조직 시료로부터 유전자 산물을 추출하는 것을 포함하고, 특정 실시양태에서 상기 유전자 산물은 단백질 또는 핵산이다.
다양한 실시양태에서, 본 발명의 키트는 하나 이상의 대조군 유전자 산물을 추가로 포함한다.
본 발명에 따른 키트의 구체적인 실시양태에서, 하기의 하나 이상은 (키트 내에 존재하는 경우) 별개의 용기에 존재한다: 유전자 산물을 검출하기 위한 시약, 용액, 부가적인 시약, 및 대조군 유전자 산물.
다른 관련 실시양태에서, 본 발명은 갑상선암을 치료하는 방법으로서: 개체로부터 얻어진 갑상선 조직 시료를 본 발명의 방법에 따라서 또는 본 발명의 키트를 사용하여 암성으로 동정하는 단계; 및 개체의 갑상선 또는 그의 일부를 외과적으로 제거하거나, 개체에 방사선 요법, 화학요법, 또는 호르몬 요법을 수행하는 단계를 포함하는, 방법을 제공한다.
본 발명은, 부분적으로, 갑상선 시료의 악성 또는 양성으로의 정확한 분류를 가능케 하는, 적은 패널의 유전자들 및 이들의 다양한 하위조합의 동정에 근거한 다. 본 발명에 따라 사용된 유전자들의 조합은 개별 유전자들 또는 이전에 기술된 유전자 조합의 사용에 비해 갑상선 결절을 분류하는 능력에 있어 놀라운 개선을 나타낸다. 또한, 상기 유전자 패널은 이전에 이용가능한 유전자 세트 및 관련 방법에 비해 더 우수한 진단 및 분류 결과를 제공한다. 예를 들어, 본 발명에 따른 상기 유전자 세트 및 방법은 아피르마® 유전자 분류자에 비해 더 우수한 예측가능성 및 신뢰도를 나타낸다. 이상성 단계적 (biphasic stepwise) 알고리즘과 함께 본 발명에 따른 유전자 세트의 사용은 과적합 (overfitting)을 방지하고, 집단의 유전자 프로파일 발현 변화를 고려하여, 이상치 유전자 프로파일을 갖는 환자를 적절히 분류할 수 있다. 나아가, 본 발명의 적은 유전자 패널은 병리학 실험실에 기여할 수 있는 키트를 허용하여, 비용을 절감할 뿐만 아니라 진단 과정을 간소화하고 촉진한다. 상기 적은 유전자 패널의 다른 이점은 감소된 양의 조직 시료를 요구하고, 잠재적으로 최초 FNA 시료로부터 충분한 mRNA가 추출되게 하며, 그로써 환자가 2차 FNA에 적용될 필요를 방지한다.
하기의 기재에서, 임의의 특정한 설명이 본 발명의 다양한 실시양태의 완전한 이해를 제공하기 위해 개시된다. 그러나, 통상의 기술자는 발명이 이러한 상세한 기술 없이도 실행될 수 있음을 이해할 것이다.
정의
달리 정의되지 않는 한, 본원에 사용된 모든 기술적 및 과학적 용어는 발명이 속하는 분야의 통상의 기술자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 본 발명의 목적을 위하여, 하기 용어들이 이하에 정의된다.
단어 "하나 (a, an)"는 특별히 지시되지 않는 하나 또는 복수를 지칭한다.
"약"은 기준(reference)량, 수준, 값, 개수, 빈도, 퍼센트, 치수, 크기, 양, 중량 또는 길이에 대해 30, 25, 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1% 만큼 달라지는 수량, 수준, 값, 개수, 빈도, 퍼센트, 치수, 크기, 양, 중량 또는 길이를 의미한다. 용어 "약"과 함께 사용된 수치 값과 관련하여 논의된 임의의 실시양태에서, 상기 용어 약은 생략될 수 있는 것으로 특별히 고려된다.
"코딩 서열"은 유전자의 폴리펩티드 산물에 대한 코드에 기여하는 임의의 폴리뉴클레오티드 서열을 의미한다. 반면, 용어 "비-코딩 서열"은 유전자의 폴리펩티드 산물에 대한 코드에 기여하지 않는 임의의 폴리뉴클레오티드 서열을 지칭한다.
상기 문맥이 달리 요구하지 않는 한, 본 출원 명세서 및 청구범위 전체에서, 용어 "포함하다 (comprise)" 및 이의 변형어, 예를 들면 "포함하다 (comprises)" 및 "포함하는"는 개방형, 포괄적 개념, 즉 "포함하지만, 이로 제한되지 않는"으로 해석되어야 할 것이다.
문구 "~으로 이루어진"은 문구 "~로 이루어진"에 수반하는 것들을 포함하고 이로 제한되는 것을 의미한다. 따라서, 문구 "~로 이루어진"은 열거된 요소들이 요구되거나 필수적이고, 어떠한 다른 요소도 존재하지 않을 수 있음을 나타낸다.
문구 "~로 필수적으로 이루어진"은 상기 문구 이후에 열거된 임의의 요소들을 포함하고 열거된 요소들에 대해 발명의 개시에 명시된 활성 또는 작용을 방해하지 않거나 이에 기여하지 않는 다른 요소들로 제한되는 것을 의미한다. 따라서, 문구 "~로 필수적으로 이루어진"은 열거된 요소들이 요구되거나 필수적이지만, 다른 요소들은 선택적이고 이들이 열거된 요소들의 활성 또는 작용에 영향을 미치는지 여부에 따라 존재하거나 존재하지 않을 수 있음을 나타낸다.
"감소된" 또는 "줄어든" 또는 "더 적은"은 전형적으로 "통계적으로 유의미한" 양이고, 본원에 기술된 양 또는 수준의 약 1.1, 1.2, 1.3, 1.4, 1.5, 1.6 1.7, 1.8, 1.9, 2, 2.5, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 또는 50배 이상 (예컨대, 100, 500, 1000배) (이의 중간 및 1 초과하는 모든 정수 및 소수점, 예컨대 1.5, 1.6, 1.7. 1.8 등을 포함함)인 감소를 포함할 수 있다.
본 명세서 전체에서 "실시양태" 또는 "일 실시양태"란 언급은 실시양태와 관련하여 기술된 특별한 특성, 구조 또는 특징이 본 발명의 적어도 하나의 실시양태에 포함되는 것을 의미한다. 따라서, 이 명세서 전체의 다양한 군데에서 문구 "일 실시양태에서" 또는 "실시양태에서"의 출현은 반드시 모두 동일한 실시양태를 지칭하는 것은 아니다. 또한 특정의 특징, 구조 또는 특성은 하나 이상의 실시양태에서 임의의 적합한 방식으로 조합될 수 있다.
"유전자"는 염색체상의 특정 유전자좌를 점유하고 전사 및/또는 번역 조절 서열 및/또는 코딩 영역 및/또는 비-번역 서열 (즉, 인트론, 5' 및 3' 비번역 서열)로 이루어진 유전 단위를 의미한다.
"증가한" 또는 "증대된" 양은 전형적으로 "통계적으로 유의미한" 양이고, 본원에 기술된 양 또는 수준의 약 1.1, 1.2, 1.3, 1.4, 1.5, 1.6 1.7, 1.8, 1.9, 2, 2.5, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 또는 50배 이상 (예컨대, 100, 500, 1000배) (이의 중간 및 1 초과하는 모든 정수 및 소수점, 예컨대 2.1, 2.2, 2.3, 2.4 등을 포함함)인 증가를 포함할 수 있다.
"단리된"은 통상 그의 천연 상태에서 그것에 수반하는 성분들을 실질적으로 또는 본질적으로 포함하지 않는 물질을 의미한다. 예를 들어, 본원에서 사용되는 "단리된 폴리뉴클레오티드"는 그의 자연 발생적인 상태에서 그의 측면에 위치하는 서열들로부터 정제된 폴리뉴클레오티드, 예컨대 통상적으로는 그 단편에 인접한 서열들로부터 제거된 DNA 단편을 포함한다. 대안적으로, "단리된 펩티드" 또는 "단리된 폴리펩티드" 등은, 본원에 사용된 바와 같이, 그의 자연적 세포 환경으로부터, 그리고 세포의 다른 성분들과의 연합으로부터 폴리펩티드 분자의 시험관 내 분리 및/또는 정제를 포함하고, 즉 이는 생체 내 성분들과 유의미하게 연관되지 않는다.
용어 "mRNA" 또는 종종 "mRNA 전사체"에는, 본원에 사용된 바와 같이, 이로 제한되는 것은 아니지만, pre-mRNA 전사체(들), 전사체 처리 중간산물, 유전자 또는 유전자들의 번역 및 전사가 준비된 성숙 mRNA(들), 또는 mRNA 전사체(들)로부터 유래된 핵산이 포함된다. 전사체 처리는 스플라이싱, 편집 및 분해를 포함할 수 있다. 본원에 사용된 바와 같이, mRNA 전사체로부터 유래된 핵산은 그의 합성을 위해 mRNA 전사체 또는 그의 후속물이 궁극적으로 주형으로 제공되었던 핵산을 지칭한다. mRNA로부터 역전사된 cDNA, 그 cDNA로부터 전사된 RNA, 그 cDNA로부터 증폭된 DNA, 증폭된 DNA로부터 전사된 RNA 등은 모두 mRNA 전사체로부터 유래하고 이러한 유래된 산물의 검출은 시료 내 원래 전사체의 존재 및/또는 풍부함 (abundance)을 나타내는 것이다. 따라서, 시료로부터 유래된 mRNA에는, 이로 제한되는 것은 아니지만, 유전자 또는 유전자들의 mRNA 전사체, 상기 mRNA로부터 역전사된 cDNA, 상기 cDNA로부터 전사된 cRNA, 상기 유전자로부터 증폭된 DNA, 상기 증폭된 DNA로부터 전사된 RNA 등이 포함된다.
"~로부터 얻어진"은, 예를 들어 조직, 폴리뉴클레오티드 또는 폴리펩티드와 같은 시료가 바람직한 유기체 (예컨대, 개체) 또는 바람직한 유기체 내의 특정 조직과 같은 특별한 공급원으로부터 분리되거나 그로부터 유래되는 것을 의미한다. 예를 들어, 조직 시료는 개체로부터 얻어질 수 있거나, 폴리뉴클레오티드 또는 폴리펩티드는 개체로부터 직접적으로 분리된 조직 또는 생물학적 유액으로부터 분리될 수 있다. "~로부터 유래된" 또는 "~로부터 수득된"은 또한 조직 또는 폴리펩티드 또는 폴리뉴클레오티드 서열의 공급원을 언급할 수 있다.
인용 "폴리뉴클레오티드" 또는 "핵산"은, 본원에 사용된 바와 같이, mRNA, RNA, cRNA, rRNA, cDNA 또는 DNA를 가르킨다. 상기 용어는 전형적으로 적어도 10개 염기 길이의 뉴클레오티드의 중합체 형태, 리보뉴클레오티드 또는 데옥시리보뉴클레오티드의 어느 하나 또는 두 유형의 뉴클레오티드의 변형된 형태를 지칭한다. 상기 용어는 DNA 및 RNA의 단일 및 이중 가닥 형태를 포함한다. 통상의 기술자에 의해 이해되는 바와 같이, 본 발명의 폴리뉴클레오티드 서열은 단백질, 폴리펩티드, 펩티드 등을 발현하거나 발현하도록 변경될 수 있는 게놈 서열, 게놈-외 서열 및 플라스미드-인코딩된 서열 및 더 작은 조작된 유전자 분절을 포함할 수 있다. 이러한 분절은 자연적으로 분리되거나, 인간의 조작에 의해 합성적으로 변경될 수 있다. 본 발명의 폴리뉴클레오티드는, 코딩 서열 자체의 길이와 상관 없이, 이들의 전반적인 길이가 상당히 달라질 수 있도록 프로모터, 폴리아데닐화 신호, 부가적인 제한효소 부위, 다중 클로닝 부위, 기타 코딩 분절 등과 같은 기타 DNA 서열과 조합될 수 있다. 따라서 바람직하게는 의도된 재조합 DNA 프로토콜에서 제조 및 사용의 용이함에 의해 제한되는 총 길이로, 거의 임의의 길이의 폴리뉴클레오티드 단편이 사용될 수 있음이 고려된다.
용어 "폴리뉴클레오티드 변이체"는 참고 폴리뉴클레오티드 서열과 실질적인 서열 동일성을 나타내는 폴리뉴클레오티드 또는 이후에 정의되는 엄격한 조건 하에서 참고 서열과 혼성화하는 폴리뉴클레오티드를 지칭한다. 이 용어는 또한 적어도 하나의 뉴클레오티드의 부가, 결실 또는 치환에 의해 참고 폴리뉴클레오티드와 구별되는 폴리뉴클레오티드를 포함한다. 따라서, 용어 "폴리뉴클레오티드 변이체"는 하나 이상의 뉴클레오티드가 부가되고, 결실되거나 상이한 뉴클레오티드로 대체된 폴리뉴클레오티드를 포함한다. 이와 관련하여, 돌연변이, 부가, 결실 및 치환을 포함하는 특정 변경이 참고 폴리뉴클레오티드에 대해 이루어질 수 있고, 그로 인해 변경된 폴리뉴클레오티드가 참조 폴리뉴클레오티드의 생물학적 기능 또는 활성을 보유하고, 또는 참조 폴리뉴클레오티드에 비해 증가된 활성을 가짐 (즉, 최적화됨)을 잘 이해할 것이다. 폴리뉴클레오티드 변이체는, 예를 들어, 본원에 기술된 참고 폴리뉴클레오티드 서열과 적어도 50% (및 적어도 51% 내지 적어도 99% 및 이들 중간의 모든 정수 퍼센트, 예컨대 90%, 95%, 또는 98%) 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 용어 "폴리뉴클레오티드 변이체" 및 "변이체"는 또한 이들 효소를 인코딩하는 자연적으로 발생하는 대립유전자 (allelic) 변이체 및 이종상동유전자 (orthologs)를 포함한다.
예를 들어, "와 50% 동일한 서열"을 포함하는, 인용 "서열 동일성"은, 본원에 사용된 바와 같이, 서열들이 비교 창 (window of comparison)에 걸쳐서 뉴클레오티드-대-뉴클레오티드 기준 또는 아미노산-대-아미노산 기준에서 동일한 정도를 지칭한다. 따라서, "서열 동일성의 퍼센트"는 비교 창에 걸쳐서 2개의 선택적으로 정렬된 서열들을 비교하고, 양 서열에서 동일한 핵산 염기 (예컨대, A, T, C, G, I) 또는 동일한 아미노산 잔기 (예컨대, Ala, Pro, Ser, Thr, Gly, Val, Leu, Ile, Phe, Tyr, Trp, Lys, Arg, His, Asp, Glu, Asn, Gln, Cys 및 Met)가 야기된 위치의 개수를 결정하여 일치된 위치의 개수를 산출하고, 비교 창에서 일치된 위치의 개수를 위치의 총 개수 (즉, 창 크기)로 나누고, 그 결과에 100을 곱해 서열 동일성의 퍼센트를 산출함으로써 계산될 수 있다.
2개 이상의 폴리뉴클레오티드 또는 폴리펩티드 사이의 서열 관계를 기술하기 위해 사용된 용어는 "참조 서열", "비교 창", "서열 동일성", "서열 동일성의 퍼센트" 및 "실질적 동일성"을 포함한다. "참조 서열"은 뉴클레오티드 및 아미노산 잔기를 포함하여, 길이가 적어도 12개이지만 종종 15개 내지 18개이고, 종종 적어도 25개 단량체 단위이다. 2개의 폴리뉴클레오티드는 각각 (1) 2개의 폴리뉴클레오티들 사이에서 유사한 서열 (즉, 완전한 폴리뉴클레오티드 서열의 단지 일부분), 및 (2) 2개 폴리뉴클레오티드 사이에서 분기하는 서열을 포함할 수 있기 때문에, 2개 (또는 그 이상의) 폴리뉴클레오티드 사이의 서열 비교는 서열 유사성의 국소적 영역을 동정하고 비교하기 위해 전형적으로 "비교 창"에 걸쳐서 2개의 폴리뉴클레오티드의 서열을 비교함으로써 수행된다. "비교 창"은 2개의 서열이 최적으로 정렬된 후 서열이 동일한 개수의 연속된 위치의 참고 서열에 비교되는, 적어도 6개 연속 위치, 일반적으로 약 50 내지 약 100개, 더 일반적으로 약 100 내지 약 150개의 개념적 분절을 지칭한다. 비교 창은 2개 서열의 최적의 정렬에 대해 참고 서열 (부가 또는 결실을 포함하지 않음)에 비해 약 20% 이하의 부가 또는 결실 (즉, 갭)을 포함할 수 있다. 비교 창을 정렬하기 위한 서열의 최적의 정렬은 알고리즘 (GAP, BESTFIT, FASTA, 및 TFASTA, Wisconsin Genetics Software Package Release 7.0, Genetics Computer Group, 575 Science Drive Madison, WI, USA)의 컴퓨터화된 실행에 의해 또는 검사 및 선택된 다양한 임의의 방법에 의해 형성된 최선의 정렬 (즉, 비교 창에 걸쳐 가장 높은 퍼센트 상동을 나타냄)에 의해 수행될 수 있다. 예를 들어 문헌 [Altschul et al ., 1997, Nucl . Acids Res . 25: 3389]에 의해 기술된 BLAST 패밀리 프로그램이 또한 언급될 수 있다. 서열 분석의 상세한 논의는 문헌 [Unit 19.3 of Ausubel et al ., "Current Protocols in Molecular Biology", John Wiley & Sons Inc, 1994-1998, Chapter 15]에서 확인할 수 있다.
용어 "폴리펩티드" 및 "단백질"은 본원에서 아미노산 잔기의 중합체 및 변이체와 이의 합성 및 자연적으로 발생한 유사체를 지칭하기 위해 상호교환적으로 사용된다. 따라서, 이들 용어는 자연 발생적인 아미노산 중합체 및 이의 자연 발생적인 화학적 유도체뿐만 아니라, 상응하는 자연 발생적인 아미노산의 화학적 유사체와 같은 하나 이상의 아미노산 잔기가 합성의 비-자연 발생적인 아미노산인 아미노산 중합체에 적용된다.
"개체"는, 본원에 사용된 바와 같이, 본 발명에 따라 치료되거나 진단될 수 있는, 증상을 나타내거나 증상을 나타낼 위험이 있는 임의의 동물을 포함한다. 진단 또는 기타 목적을 위해 본 발명의 유전자 산물의 수준을 프로파일링 하기에 적당한 개체가 또한 포함된다. 적합한 개체 (환자)에는 실험 동물 (예컨대, 마우스, 래트, 토끼, 또는 기니아 피그), 농장 동물, 및 가축 또는 애완동물 (예컨대, 고양이 또는 개)이 포함된다. 비-인간 영장류 및 인간을 포함하는 포유동물이 포함된다.
"치료" 또는 "치료하는"은, 본원에 사용된 바와 같이, 질환 또는 증상, 예컨대 갑상선암의 증상 또는 병리에 대한 임의의 바람직한 효과를 포함하고, 치료되는 질환 또는 상태의 하나 이상의 측정가능한 마커의 최소한의 변화 또는 개선을 포함할 수 있다. "치료" 또는 "치료하는"이 반드시 질환 또는 상태, 또는 이의 연관된 증상의 완벽한 근절 또는 치유를 나타내는 것은 아니다. 이 치료를 받은 개체는 이를 필요로 하는 임의의 개체이다. 임상적 개선의 예시적 마커는 통상의 기술자에게 자명할 것이다.
본원에 사용된 바와 같이, 용어 "야생형"은 미생물 (예컨대, 세균 종 또는 균주), 그 미생물 (예컨대, 세균 종 또는 균주)의 특성을 갖는 유전자 또는 유전자 산물, 자연 발생적인 공급원으로부터 분리된 경우의 유전자 또는 유전자 산물을 지칭한다. 야생형 유전자 또는 유전자 산물 (예컨대, 폴리펩티드)은 집단에서 가장 빈번하게 관찰되고 그로써 상기 유전자의 "정상" 또는 "야생형" 형태가 선택적으로 지정된 것이다.
본 발명의 실행은, 특별히 반대로 지시되지 않는 한, 당해 분야의 주지기술 내에서 분자생물학 및 재조합 DNA 기술의 통상적인 방법을 이용할 것이며, 이들 대다수는 예시를 목적으로 하기에 기술된다. 이러한 기술은 문헌에 상세히 설명된다. 예컨대 문헌 [Sambrook, et al., Molecular Cloning: A Laboratory Manual (3rd Edition, 2000); DNA Cloning: A Practical Approach, vol. I & II (D. Glover, ed); Oligonucleotide Synthesis (N. Gait, ed., 1984); Oligonucleotide Synthesis: Methods and Applications (P. Herdewijn, ed., 2004); Nucleic Acid Hybridization (B. Hames & S. Higgins, eds., 1985); Nucleic Acid Hybridization: Modern Applications (Buzdin and Lukyanov, eds., 2009); Transcription and Translation (B. Hames & S. Higgins, eds., 1984); Animal Cell Culture (R. Freshney, ed., 1986); Freshney, R.I. (2005) Culture of Animal Cells, a Manual of Basic Technique, 5th Ed. Hoboken NJ, John Wiley & Sons; B. Perbal, A Practical Guide to Molecular Cloning (3rd Edition 2010); Farrell, R., RNA Methodologies: A Laboratory Guide for Isolation and Characterization (3rd Edition 2005), Methods of Enzymology: DNA Structure Part A: Synthesis and Physical Analysis of DNA Methods in Enzymology, Academic Press; Using Antibodies: A Laboratory Manual: Portable Protocol NO. I by Edward Harlow, David Lane, Ed Harlow (1999, Cold Spring Harbor Laboratory Press, ISBN 0-87969-544-7); Antibodies: A Laboratory Manual by Ed Harlow (Editor), David Lane (Editor) (1988, Cold Spring Harbor Laboratory Press, ISBN 0-87969-3, 4-2), 1855. Handbook of Drug Screening, edited by Ramakrishna Seethala, Prabhavathi B. Fernandes (2001, New York, N.Y., Marcel Dekker, ISBN 0-8247-0562-9); and Lab Ref: A Handbook of Recipes, Reagents, and Other Reference Tools for Use at the Bench, Edited Jane Roskams and Linda Rodgers, (2002, Cold Spring Harbor Laboratory, ISBN 0-87969-630-3)을 참고한다.
특정 실시양태는 본 발명의 진단 목적을 위해 통상적인 생물학 방법, 소프트웨어 및 시스템을 이용할 수 있다. 본 발명의 컴퓨터 소프트웨어 제품은 전형적으로 본 발명에 따른 방법의 논리적 단계를 수행하기 위해 컴퓨터-실행가능한 지침을 포함하는 컴퓨터 판독가능한 매체를 포함한다. 적합한 컴퓨터 판독가능한 매체에는 플로피 디스크, CD-ROM/DVD/DVD-ROM, 하드-디스크 드라이브, 플래시 메모리, ROM/RAM, 자기 테이프 등이 포함된다. 컴퓨터-실행가능한 지침은 적합한 컴퓨터 언어 또는 여러 언어의 조합으로 작성될 수 있다. 기본적인 컴퓨터 생물학 방법이, 예를 들어 문헌 [Setubal and Meidanis et al ., Introduction to Computational Biology Methods, PWS Publishing Company, Boston, 1997); Salzberg, Searles, Kasif, (Ed), Computational Methods in Molecular Biology, (Elsevier, Amsterdam, 1998); Rashidi and Buehler, Bioinformatics Basics: Application in Biological Science and Medicine (CRC Press, London, 2000) and Ouelette and Bzevanis Bioinformatics: A Practical Guide for Analysis of Gene and Proteins (Wiley & Sons, Inc., 2nd ed., 2001)]에 기재되어 있다. 미국특허 제6,420,108호를 참고한다.
특정 실시양태는 프로브 고안, 데이터 관리, 분석, 및 기구 조작과 같은 다양한 목적을 위해 다양한 컴퓨터 프로그램 제품 및 소프트웨어를 이용할 수 있다. 미국특허 제5,593,839호, 제5,795,716호, 제5,733,729호, 제5,974,164호, 제6,066,454호, 제6,090,555호, 제6,185,561호, 제6,188,783호, 제6,223,127호, 제6,229,911호 및 제6,308,170호를 참고한다.
진단 어세이
본 발명은, 부분적으로, 갑상선 종양 또는 결절의 양성 또는 암성, 즉 악성으로의 분류를 가능케 하는 갑상선암의 신규한 바이오마커에 근거한다. 따라서, 본 발명은 개체가 갑상선암을 갖는지 여부를 결정하기 위하여, 개체로부터 수득된 생물학적 시료를 분석하기 위한 진단 어세이 및 관련 키트를 제공한다. 다양한 실시양태에서, 본 발명의 방법 및 키트는, 예를 들어 개체로부터 수득한 생물학적 시료에서 갑상선암의 존재 또는 부재를 결정함으로써 개체에서 갑상선암의 존재 또는 부재를 진단하거나 검출하는데 사용된다. 구체적인 실시양태에서, 본 발명의 방법 및 키트는, 예를 들어 세포학적 분석에 의해 이전에 불확정으로 진단된 개체에서 갑상선암의 존재 또는 부재를 진단하는데 사용된다.
갑상선의 비정상적 성장은 결절의 형성을 초래할 수 있고, 이는 양성 또는 암성 (즉, 악성)일 수 있다. 갑상선암은 갑상샘의 적어도 4종의 상이한 악성 종양 (유두, 여포, 골수 및 역형성)을 포함하고; 악성 아형에는 예컨대 여포 암종 (FC), 유두 갑상선 암종 (PTC), 유두 암종 (FVPTC)의 여포 변형, 골수 갑상선 암종 (MTC), 휘르틀레 (Hurthle) 세포 암종 (HC), 및 역형성 갑상선 암종 (ATC)이 포함된다. 양성 (비-암성) 갑상선 종양 또는 결절의 예시에는, 예컨대 여포 선종 (FA), 결절과다형성 (NHP), 림프구 갑상샘염 (LCT), 및 휘르틀러 세포 선종 (HA)이 포함된다. 본 발명의 측면에서, 상기 갑상선암은 침습성 암이거나 전이 가능성을 갖는데, 예컨대 침습성 골수 또는 여포 갑상선암 또는 전이 가능성을 갖는 골수 또는 여포 갑상선암이다. 본 발명의 구체적인 실시양태에서, 갑상선암은 역형성 갑상선 암종 (ATC)이다. 전이가능성 (metastatic potential)은 체내에서 초기 위치 (즉, 갑상선)에서 다른 위치로의 암세포 이동의 능력 또는 가능성을 지칭한다. 통상의 기술자는 본 발명의 방법이 적합한 패널의 참조 대조군 시료를 이용하여 갑상선의 이들 암성 종양 또는 비-암성 상태의 어느 하나의 존재 또는 부재를 진단 또는 검출하기 위해 용이하게 사용될 수 있음을 이해할 것이다.
용어 "진단하다" 또는 "진단적" 또는 "진단된"에는 갑상선암과 같은 병리학적 상태의 존재 또는 특성을 동정하고, 이러한 상태가 발생할 위험성을 규명하고/하거나 요법에 대한 반응으로 병리학적 상태의 변화 (또는 무 변화)를 측정하는 것이 포함된다. 진단 방법은 이들의 민감도 및 특이성에서 달라질 수 있다. 특정 실시양태에서, 진단 어세이의 "민감도"는 양성으로 검사된 감소된 세포, 조직 또는 개체의 비율 ("진양성"의 비율)을 지칭한다. 상기 어세이에 의해 검출되지 않은 감소된 세포, 조직 또는 개체는 전형적으로 "위음성 (false negative)"으로 지칭된다. 병에 걸리지 않고 상기 어세이에서 음성으로 검사된 세포, 조직 또는 개체는 "진음성 (true negatives)"으로 지칭될 수 있다. 특정 실시양태에서, 진단 어세이의 "특이성"은 일 (1) 빼기 위양성 비율로 정의될 수 있는데, 여기서 "위양성" 비율은 질병이 없고 양성으로 검사된 그러한 시료 또는 개체의 비율로 정의된다. 특별한 진단 방법이 상태의 결정적 진단을 제공하지 않는다고 하더라도, 상기 방법이 진단에 도움이 되는 양성 징후를 제공한다면 이는 충분하다.
본 발명에 따른 방법 및 키트의 구체적인 실시양태에서, 갑상선 조직 또는 결절 시료는 90% 또는 그 이상, 91% 또는 그 이상, 92% 또는 그 이상, 93% 또는 그 이상, 94% 또는 그 이상, 95% 또는 그 이상, 96% 또는 그 이상, 97% 또는 그 이상, 98% 또는 그 이상, 또는 또는 그 99% 이상의 민감도로 암성 또는 양성으로 진단된다.
본 발명에 따른 방법 및 키트의 구체적인 실시양태에서, 갑상선 조직 또는 결절 시료는 50% 또는 그 이상, 60% 또는 그 이상, 70% 또는 그 이상, 80% 또는 그 이상, 90% 또는 그 이상, 또는 95% 또는 그 이상의 특이성으로 암성 또는 양성으로 진단된다.
본 발명에 따른 방법 및 키트의 구체적인 실시양태에서, 갑상선 조직 또는 결절 시료는 50% 또는 그 이상, 60% 또는 그 이상, 70% 또는 그 이상, 80% 또는 그 이상, 90% 또는 그 이상, 또는 95% 또는 그 이상의 양성 예측치로 암성 또는 양성으로 진단된다.
본 발명에 따른 방법 및 키트의 구체적인 실시양태에서, 갑상선 조직 또는 결절 시료는 또는 90% 또는 그 이상, 91% 또는 그 이상, 92% 또는 그 이상, 93% 또는 그 이상, 94% 또는 그 이상, 95% 또는 그 이상, 96% 또는 그 이상, 97% 또는 그 이상, 98% 또는 그 이상, 또는 99% 또는 그 이상의 음성 예측치로 암성 또는 양성으로 진단된다.
본 발명에 따른 방법 및 키트의 구체적인 실시양태에서, 갑상선 조직 또는 결절 시료는 2 또는 그 이상, 3 또는 그 이상, 4 또는 그 이상, 5 또는 그 이상, 6 또는 그 이상, 7 또는 그 이상, 8 또는 그 이상, 10 또는 그 이상, 15 또는 그 이상, 20 또는 그 이상, 또는 25 또는 그 이상의 양성 우도비 (likelihood ratio)로 암성 또는 양성으로 진단된다.
본 발명에 따른 방법 및 키트의 구체적인 실시양태에서, 갑상선 조직 또는 결절 시료는 50% 또는 그 이상, 60% 또는 그 이상, 70% 또는 그 이상, 80% 또는 그 이상, 90% 또는 그 이상, 또는 95% 또는 그 이상의 양성 검사후 확률로 암성 또는 양성으로 진단된다.
본 발명에 따른 방법 및 키트의 구체적인 실시양태에서, 갑상선 조직 또는 결절 시료는 0.20 또는 그 미만, 0.18 또는 그 미만, 0.16 또는 그 미만, 0.14 또는 그 미만, 0.12 또는 그 미만, 0.10 또는 그 미만, 0.08 또는 그 미만, 또는 0.06 또는 그 미만의 음성 우도비로 암성 또는 양성으로 진단된다.
본 발명에 따른 방법 및 키트의 구체적인 실시양태에서, 갑상선 조직 또는 결절 시료는 10.0% 또는 그 미만, 9.0% 또는 그 미만, 8.0% 또는 그 미만, 7.0% 또는 그 미만, 6.0% 또는 그 미만, 5.0% 또는 그 미만, 4.0% 또는 그 미만 또는 3.0% 또는 그 미만의 음성 검사후 확률로 암성 또는 양성으로 진단된다.
본 발명에 따른 방법 및 키트의 구체적인 실시양태에서, 갑상선 조직 또는 결절 시료는 92% 또는 그 이상 또는 97% 또는 그 이상의 민감도 및 60% 또는 그 이상 또는 90% 또는 그 이상의 특이성으로 암성 또는 양성으로 진단된다. 구체적인 실시양태에서, AUC는 각각 92% 및 60% 또는 그 이상의 민감도 및 특이성 모두를 가지며, 0.97 초과이다. 구체적인 실시양태에서, AUC는 각각 92% 및 90% 또는 그 이상의 민감도 및 특이성 모두를 가지며, 0.97 초과이다. 구체적인 실시양태에서, AUC는 각각 97% 및 90% 또는 그 이상의 민감도 및 특이성 모두를 가지며, 0.97 초과이다.
일부 실시양태에서, 본 발명은 갑상선암과 같은 암을 진단하고, 동정하고, 또는 분류하는 방법을 제공하는데, 상기 방법은: 생물학적 시료, 예컨대 갑상선 조직 시료의 하나 이상의 유전자 산물에 대한 발현 수준을 얻는 단계; 및 유전자 산물 발현 수준(들)이 상기 생물학적 시료에서 암의 결여를 나타내는 양성으로서 생물학적 시료를 동정하는 단계를 포함한다. 다른 실시양태에서, 본 발명은 갑상선암과 같은 암을 진단하고, 동정하고, 또는 분류하는 방법을 제공하는데, 상기 방법은: 생물학적 시료의 하나 이상의 유전자 산물에 대한 발현 수준을 수득하는 단계; 및 유전자 산물 발현 수준(들)이 상기 생물학적 시료 내 암을 지시하는 악성 또는 의심 (suspicious)으로서 생물학적 시료를 동정하는 단계를 포함한다. 예를 들어, 생물학적 시료 내 갑상선암의 존재를 확인 (또는 배제)하기 위하여, 이 방법은 대조군 시료 또는 참조 시료 내 동일한 유전자 산물의 발현 수준과 생물학적 시료 내 유전자 산물의 발현 수준을 상관시킴으로써 수행된다.
구체적인 실시양태에서, 본 발명은 개체에서 갑상선암과 같은 암을 진단하고, 동정하고, 또는 분류하는 방법을 제공하는데, 상기 방법은: 생물학적 시료, 예컨대 갑상선 조직 시료의 하나 이상의 유전자 산물에 대한 발현 수준을 측정하기 위해 어세이를 수행하는 단계; 및 유전자 산물 발현 수준(들)이 상기 생물학적 시료 내 암의 결여를 나타내는 양성으로서 생물학적 시료를 동정하거나 유전자 산물 발현 수준(들)이 상기 생물학적 시료 내 암을 지시하는 악성 또는 의심으로서 생물학적 시료를 동정하는 단계를 포함한다. 구체적인 실시양태에서, 상기 방법은 갑상선 조직 시료 내 2개 이상 또는 3개 이상의 유전자 산물의 발현 수준을 측정하는 단계를 포함하는데, 상기 2개 이상 또는 3개 이상의 유전자 산물은 표 1에 열거된 하나 이상의 유전자에 의해 발현되고 유전자 산물의 적어도 하나는 CXCR3, CCR3, CXCL10, CAR, XB130, HO-1 또는 CCR7 유전자에 의해 발현된다. 특정 실시양태에서, 상기 방법은 생물학적 시료가 암성 또는 악성으로 결정되는 경우 개체에 수술, 예컨대 갑상샘절제술을 수행하는 단계를 추가로 포함한다. 구체적인 실시양태에서, 상기 유전자 산물은 RNA이고, 상기 어세이에는 PCR, RT-PCR 또는 정량적 PCR, 또는 본원에 기술된 임의의 어세이를 비롯한, RNA 양 또는 발현 수준을 측정하기 위한 임의의 다른 어세이가 포함된다. 구체적인 실시양태에서, 상기 유전자 산물은 폴리펩티드이고, 상기 어세이에는 면역조직화학적 어세이, 또는 본원에 기술된 임의의 것들을 비롯한, 폴리펩티드 양 또는 발현 수준을 측정하기 위한 임의의 어세이가 포함된다.
구체적인 실시양태에서, 본 발명은 개체에서 암, 예컨대 갑상선암을 진단하고, 동정하고, 또는 분류하는 방법을 제공하는데, 상기 방법은: 개체로부터 생물학적 시료, 예컨대 갑상선 조직 시료를 입수하는 단계; 상기 생물학적 시료 내 하나 이상의 유전자 산물에 대한 발현 수준을 측정하기 위해 어세이를 수행하는 단계; 및 유전자 산물 발현 수준(들)이 상기 생물학적 시료 내 암의 결여를 나타내는 경우 생물학적 시료를 양성으로 동정하거나 유전자 산물 발현 수준(들)이 상기 생물학적 시료 내 암을 나타내는 경우 생물학적 시료를 악성 또는 의심으로 동정하는 단계를 포함한다. 구체적인 실시양태에서, 상기 방법은 갑상선 조직 시료에서 2개 이상, 또는 3개 이상의 유전자 산물의 발현 수준을 측정하는 단계를 포함하고, 여기서 2개 이상 또는 3개 이상의 유전자 산물은 표 1에 열겨된 하나 이상의 유전자에 의해 발현되고 상기 유전자 산물의 적어도 하나는 CXCR3, CCR3, CXCL10, CAR, XB130, HO-1 또는 CCR7 유전자에 의해 발현된다. 특정 실시양태에서, 상기 방법은 생물학적 시료가 암성 또는 악성으로 결정되는 경우 개체에 수술, 예컨대 갑상샘절제술을 수행하는 것을 추가로 포함한다. 구체적인 실시양태에서, 상기 유전자 산물은 RNA이고, 상기 어세이에는 PCR, RT-PCR 또는 정량적 PCR, 또는 본원에 기술된 임의의 어세이를 비롯한, RNA 양 또는 발현 수준을 측정하기 위한 임의의 다른 어세이가 포함된다. 구체적인 실시양태에서, 상기 유전자 산물은 폴리펩티드이고, 상기 어세이에는 면역조직화학적 어세이, 또는 본원에 기술된 임의의 것들을 비롯한, 폴리펩티드 양 또는 발현 수준을 측정하기 위한 임의의 어세이가 포함된다.
본원에 상세히 기재된 바와 같이, 구체적인 실시양태에서, 상기 생물학적 시료는 개체, 예컨대 암에 걸렸거나 암에 걸릴 위험성이 있는 개체로부터 입수되었다. 그에 대해 발현이 측정된 유전자 산물에는 본원에 기술된 것들이 포함되고, 2개 이상의 유전자 산물을 포함할 수 있으며, 이는 또한 "유전자 산물의 세트"로 언급될 수 있다. 암, 예컨대 갑상선암의 존재 또는 부재를 결정하는데 사용될 수 있는 본원에 기술된 유전자 산물은 "바이오마커"로 언급될 수 있다.
구체적인 실시양태에서, 본 발명은 개체에서 갑상선암의 존재 또는 부재를 검출 또는 진단하는 방법을 제공하는데, 상기 방법은 개체로부터 수득된 갑상선 조직 시료에서 2개 이상, 또는 3개 이상의 유전자 산물의 발현 수준을 측정하는 단계로서, 상기 2개 이상 또는 3개 이상의 유전자 산물은 표 1에 열거된 하나 이상의 유전자에 의해 발현되고 상기 유전자 산물의 적어도 하나는 CXCR3, CCR3, CXCL10, CAR, XB130, HO-1 또는 CCR7 유전자에 의해 발현되는 것인 단계; 및 개체로부터의 생물학적 시료에 대해 측정된 발현 수준을 갑상선암의 존재 또는 부재와 상관시킴으로써 상기 갑상선 조직 시료를 암성 또는 양성으로 동정하는 단계를 포함한다.
본 발명은 이를 필요로 하는 개체를 치료하는 방법을 제공하는데, 개체가 갑상선암에 걸린 것으로 결정되었다면 상기 개체에 수술, 예컨대 개체의 갑상선 또는 이의 일부의 외과적 제거 (예컨대, 갑상샘절제술)를 수행하는 단계를 포함하고, 여기서 상기 결정은 본 발명에 따른 임의의 진단적 방법에 의해 이루어졌다. 구체적인 실시양태에서, 이를 필요로 하는 개체를 치료하는 방법은, 상기 개체가 하기 단계를 포함하는 방법에 의해 갑상선암에 걸린 것으로 결정되었다면 개체에 수술, 예컨대 갑상샘절제술을 수행하는 것을 포함하고, 여기서 상기 방법은 생물학적 시료, 예컨대 갑상선 조직 시료의 하나 이상의 유전자 산물에 대한 발현 수준을 측정하기 위해 어세이를 수행하는 단계; 및 유전자 산물 발현 수준(들)이 생물학적 시료 내 암의 결여를 나타내는 경우 상기 생물학적 시료를 양성으로 동정하거나 유전자 산물 발현 수준(들)이 생물학적 시료 내 암을 지시하는 경우 상기 생물학적 시료를 악성 또는 의심으로 동정하는 단계를 포함한다. 구체적인 실시양태에서, 상기 방법은 갑상선 조직 시료에서 2개 이상, 또는 3개 이상의 유전자 산물의 발현 수준을 측정하는 단계를 포함하였고, 상기 2개 이상 또는 3개 이상의 유전자 산물은 표 1에 열거된 하나 이상의 유전자에 의해 발현되고 상기 유전자 산물의 적어도 하나는 CXCR3, CCR3, CXCL10, CAR, XB130, HO-1 또는 CCR7 유전자에 의해 발현된다. 구체적인 실시양태에서, 상기 방법은 예컨대 바늘 생검 또는 가는 바늘 흡인에 의해 개체로부터 수득한 생물학적 시료의 세포학적 또는 병리화학적 분석을 수행함으로써 개체가 갑상선암이거나 이에 걸릴 위험에 처한 것으로 동정하는 단계를 추가로 포함한다.
관련 실시양태에서, 본 발명은 이를 필요로 하는 개체를 치료하는 방법을 포함하고, 상기 방법은: 본 발명에 따른 임의의 진단 방법에 의해 개체가 암, 예컨대 갑상선암에 걸렸는지 여부를 결정하는 단계; 및 개체가 암, 예컨대 갑상선암에 걸린 것으로 결정된 경우 개체의 종양 또는 이의 일부를 수술, 예컨대 외과적 제거 (예컨대, 갑상샘절제술)를 실시하는 단계를 포함한다. 구체적인 실시양태에서, 이를 필요로 하는 개체를 치료하는 방법은: (i) 생물학적 시료, 예컨대 갑상선 조직 시료의 하나 이상의 유전자 산물에 대한 발현 수준을 측정하기 위한 어세이를 수행하는 단계; 및 유전자 산물 발현 수준(들)이 생물학적 시료 내 암의 결여를 나타내는 경우 상기 생물학적 시료를 양성으로 동정하거나 유전자 산물 발현 수준(들)이 생물학적 시료 내 암을 지시하는 경우 상기 생물학적 시료를 악성 또는 의심으로 동정하는 단계를 포함하는 방법에 의해 개체가 갑상선암에 걸렸는지 여부를 결정하는 단계; 및 (ii) 단계 (i)의 결과가 개체가 암, 예컨대 갑상선암에 걸렸거나 걸리기 쉬운 것으로 나타나는 경우 개체에 수술, 예컨대 갑상샘절제술을 실시하는 단계를 포함한다. 구체적인 실시양태에서, 상기 방법은 갑상선 조직 시료에서 2개 이상, 또는 3개 이상의 유전자 산물의 발현 수준을 측정하는 단계를 포함하고, 상기 2개 이상 또는 3개 이상의 유전자 산물은 표 1에 열거된 하나 이상의 유전자에 의해 발현되고 상기 유전자 산물의 적어도 하나는 CXCR3, CCR3, CXCL10, CAR, XB130, HO-1 또는 CCR7 유전자에 의해 발현된다. 구체적인 실시양태에서, 상기 방법은, 예컨대 바늘 생검 또는 가는 바늘 흡인에 의해 개체로부터 수득한 생물학적 시료의 세포학적 또는 병리화학적 분석을 수행함으로써 개체가 갑상선암이거나 이에 걸릴 위험에 처한 것으로 동정하는 단계를 추가로 포함한다.
특정 실시양태에서, 본 발명은 이를 필요로 하는 개체를 치료하는 방법을 포함하는데, 상기 방법은: (i) 개체로부터 수득된 생물학적 시료, 예컨대 갑상선 시료에 대해 수행되었던 본원에 기술된 진단 어세이를 의뢰하거나 그 결과를 입수하는 단계; 및 (ii) 만약 진단 어세이의 결과가 개체가 암, 예컨대 갑상선암에 걸린 것으로 나타나는 경우 수술, 예컨대 개체의 종양 또는 이의 일부의 외과적 제거 (예컨대, 갑상샘절제술)를 수행하는 단계를 포함한다. 구체적인 실시양태에서, 상기 진단 어세이는: 생물학적 시료, 예컨대 갑상선 조직 시료의 하나 이상의 유전자 산물에 대해 발현 수준을 측정하기 위해 어세이를 실시하는 단계; 및 유전자 산물 발현 수준(들)이 생물학적 시료 내 암의 결여를 나타내는 경우 상기 생물학적 시료를 양성으로 동정하거나 유전자 산물 발현 수준(들)이 생물학적 시료 내 암을 지시하는 경우 상기 생물학적 시료를 악성 또는 의심으로 동정하는 단계를 포함한다. 구체적인 실시양태에서, 상기 방법은 갑상선 조직 시료에서 2개 이상, 또는 3개 이상의 유전자 산물의 발현 수준을 측정하는 단계를 포함하고, 상기 2개 이상 또는 3개 이상의 유전자 산물은 표 1에 열거된 하나 이상의 유전자에 의해 발현되고 상기 유전자 산물의 적어도 하나는 CXCR3, CCR3, CXCL10, CAR, XB130, HO-1 또는 CCR7 유전자에 의해 발현된다. 구체적인 실시양태에서, 상기 방법은 예컨대 바늘 생검 또는 가는 바늘 흡인에 의해 개체로부터 수득한 생물학적 시료의 세포학적 또는 병리화학적 분석을 수행함으로써 개체가 갑상선암이거나 이에 걸릴 위험에 처한 것으로 동정하는 단계를 추가로 포함한다.
특정 실시양태에서, 본 발명은 개체가 암, 예컨대 갑상선암에 걸렸는지 여부를 결정하는 방법을 포함하는데, 여기서 개체로부터 수득된 생물학적 시료에 수행되었던 초기 검사, 예컨대 갑상선 조직의 FNA는 불확정이었고, 상기 방법은 개체로부터 수득된 생물학적 시료, 예컨대 갑상선 시료에 대해 본원에 기술된 진단 어세이의 실시, 의뢰 또는 그 결과의 입수를 포함한다. 구체적인 실시양태에서, 상기 진단 어세이는: 생물학적 시료, 예컨대 갑상선 조직 시료의 하나 이상의 유전자 산물에 대한 발현 수준을 측정하기 위해 어세이를 실시하는 단계; 및 유전자 산물 발현 수준(들)이 생물학적 시료 내 암의 결여를 나타내는 경우 상기 생물학적 시료를 양성으로 동정하거나 유전자 산물 발현 수준(들)이 생물학적 시료 내 암을 지시하는 경우 상기 생물학적 시료를 악성 또는 의심으로 동정하는 단계를 포함한다. 구체적인 실시양태에서, 상기 방법은 갑상선 조직 시료에서 2개 이상, 또는 3개 이상의 유전자 산물의 발현 수준을 측정하는 단계를 포함하고, 상기 2개 이상 또는 3개 이상의 유전자 산물은 표 1에 열거된 하나 이상의 유전자에 의해 발현되고 상기 유전자 산물의 적어도 하나는 CXCR3, CCR3, CXCL10, CAR, XB130, HO-1 또는 CCR7 유전자에 의해 발현된다.
본 발명에 따른 임의의 방법의 구체적인 실시양태에서, 상기 상관은 개체로부터의 시료 내 유전자 산물의 발현 수준(들)을 검사된 각 유전자 산물에 대한 대조군 또는 참고 발현 수준과 비교함으로써 수행된다. 갑상선 조직 시료와 대조군 또는 참고 발현 수준 사이에 유의미한 차이가 있는 경우, 상기 갑상선 조직 시료는 암성으로 동정된다. 특정 실시양태에서, 갑상선 조직 시료와 대조군 또는 참고 발현 수준 사이에서 2개 이상, 3개 이상, 또는 4개 이상의 유전자 산물의 발현 수준에 유의미한 차이가 있는 경우 상기 갑상선 조직 시료는 암성으로 동정된다. 유사하게, 갑상선 조직 시료와 대조군 또는 참조 발현 수준 사이에서 유전자 발현 수준에 어떠한 유의미한 차이도 없는 경우 (즉, 실질적으로 유사함) 상기 갑상선 조직 시료는 양성으로 동정된다. 특정의 실시양태에서, 갑상선 조직 시료와 대조군 또는 참고 발현 수준 사이에서 2개 이상, 3개 이상, 또는 4개 이상의 유전자 산물의 발현 수준에서 어떠한 유의미한 차이도 없는 경우 상기 갑상선 조직 시료는 양성으로 동정된다.
본원에 기술된 임의의 방법의 특정 실시양태에서, 정상 대조군 발현 수준에 비해 갑상선 조직 시료에서 유전자 1, 8, 9, 13, 14, 15 및/또는 18의 임의의 하나 이상의 발현 수준이 감소하는 경우; 및/또는 유전자 2, 3, 4, 5, 6, 7, 10, 11, 12, 16 및/또는 17의 임의의 하나 이상의 발현 수준이 증가하는 경우, 상기 갑상선 조직 시료는 암성으로 동정되는데, 이때 증가 또는 감소된 발현을 갖는 유전자의 총 개수는 적어도 3개이다. 각 유전자의 신원은 다음과 같다: CXCR3 (유전자 1), CXCR3A (유전자 2), CXCR3B (유전자 3), CXCR4 (유전자 4), CCR3 (유전자 5), CXCL9 (유전자 6), CXCL10 (유전자 7), CXCL11 (유전자 8), SPAG-9 (유전자 9), CK-19 (유전자 10), TIMP-1 (유전자 11), CLDN-1 (유전자 12), CAR (유전자 13), 넥틴-1 (유전자 14), XB-130 (유전자 15), HO-1 (유전자 16), CCR7 (유전자 17), 및 CXCL4 (유전자 18). 본원에 기술된 임의의 방법에 따른 다른 실시양태에서, 본원에 기술된 유전자의 임의의 아집단의 하나 이상, 2개 이상, 3개 이상, 또는 4개 이상의 유전자 산물의 발현 수준이 상기에 기술된 바와 같이 변경되는 경우 갑상선 조직 시료는 암성으로 동정된다. 구체적인 실시양태에서, 상기 유전자 세트는 CXCR3, CCR3, CXCL10, CAR, XB130, HO-1 또는 CCR7의 하나 이상을 포함한다.
구체적인 실시양태에서, 상기 상관은 알고리즘을 이용하여 개체로부터 수득된 시료 내 유전자 산물의 발현 수준을 참고 수준과 비교함으로써 수행된다. 상기 참고 수준은 복수 개의 암성 및/또는 비-암성 생물학적 시료로부터 사전에 측정된 각각의 유전자 산물에 대한 발현 수준을 포함할 수 있다.
특정 실시양태에서, 상기 상관은 상기 발현 수준을 하기 2 세트의 생물학적 시료, 즉
복수 개의 정상 갑상선 조직 시료; 및
복수 개의 암성 갑상선 조직 시료에 대한 유전자 산물에 대해 측정된 유전자 발현 수준과 비교하는 것을 포함하는데, 여기서 갑상선 조직 시료와 복수 개의 정상 갑상선 조직 시료에 대한 유전자 발현 수준 사이에 유전자 산물의 발현 수준에 있어서 유의미한 차이가 존재하는 경우, 또는 갑상선 조직 시료와 복수 개의 암성 갑상선 조직 시료에 대한 유전자 발현 수준 사이에 유전자 산물의 발현 수준에 있어서 실질적으로 차이가 없는 경우 상기 갑상선 조직 시료는 암성으로 동정된다.
본 발명에 따른 임의의 방법 및 키트의 구체적인 실시양태에서 있어서, 발현 수준이 측정된 2개 이상 또는 3개 이상의 유전자 산물은 하기를 포함하거나 이들로 이루어진다:
CXCR3, CCR3, CXCL10, CK19, TIMP-1, CLDN-1, CAR, XB130, HO-1 및 CCR7 유전자의 2개 이상 또는 3개 이상의 유전자 산물;
CXCR3, CCR3, CXCL10, CK19, TIMP-1, CLDN-1, CAR, HO-1 및 CCR7 유전자의 유전자 산물;
CCR3, TIMP-1, CAR 및 XB130 유전자의 유전자 산물;
CXCL10, TIMP-1, CAR 및 CCR7 유전자의 유전자 산물;
TIMP-1, CAR 및 CCR7 유전자의 유전자 산물; 또는
CXCL10, TIMP-1, CLDN-1, 및 CCR7 유전자의 유전자 산물.
상기 유전자 산물 세트의 임의의 구체적인 실시양태에서, 2개 이상 또는 3개 이상의 유전자 산물에는 CXCR3, CCR3, CXCL10, CAR, XB130, HO-1 또는 CCR7의 하나 이상이 포함된다. 구체적인 실시양태에서, 상기 유전자 산물에는 표 1에 열거된 유전자들의 하나 이상, 2개 이상, 또는 3개 이상이 포함되고, 상기 유전자 산물의 적어도 하나는 CXCR3 유전자에 의해 발현된다. 구체적인 실시양태에서, 상기 유전자 산물에는 표 1에 열거된 유전자들의 하나 이상, 2개 이상, 또는 3개 이상이 포함되고, 상기 유전자 산물의 적어도 하나는 CCR3 유전자에 의해 발현된다. 구체적인 실시양태에서, 상기 유전자 산물에는 표 1에 열거된 유전자들의 하나 이상, 2개 이상, 또는 3개 이상이 포함되고, 상기 유전자 산물의 적어도 하나는 CXCL10 유전자에 의해 발현된다. 구체적인 실시양태에서, 상기 유전자 산물에는 표 1에 열거된 유전자들의 하나 이상, 2개 이상, 또는 3개 이상이 포함되고, 상기 유전자 산물의 적어도 하나는 CAR 유전자에 의해 발현된다. 구체적인 실시양태에서, 상기 유전자 산물에는 표 1에 열거된 유전자들의 하나 이상, 2개 이상, 또는 3개 이상이 포함되고, 상기 유전자 산물의 적어도 하나는 XB130 유전자에 의해 발현된다. 구체적인 실시양태에서, 상기 유전자 산물에는 표 1에 열거된 유전자들의 하나 이상, 2개 이상, 또는 3개 이상이 포함되고, 상기 유전자 산물의 적어도 하나는 HO-1 유전자에 의해 발현된다. 구체적인 실시양태에서, 상기 유전자 산물에는 표 1에 열거된 유전자들의 하나 이상, 2개 이상, 또는 3개 이상이 포함되고, 상기 유전자 산물의 적어도 하나는 CCR7 유전자에 의해 발현된다.
다양한 실시양태에서, 본 발명의 방법은 또한, 예컨대 예비 진단을 얻기 위해 개체로부터 수득된 생물학적 시료, 예컨대 갑상선 조직 시료에 세포학적 또는 병리학적 분석을 수행하는 단계를 포함한다. 세포학적 또는 병리학적 분석은 본원에 기술된 바와 같은, 유전자 산물의 발현에 근거한 분석을 수행하기 전에, 그와 동시에 또는 그 이후에 수행될 수 있다. 특정 실시양태에서, 중간 또는 불확정 예비 진단을 갖는 시료는 본 발명의 방법에 의해 추가로 분석된다.
본 발명에 따른 방법의 구체적인 실시양태에서, 상기 방법은 개체로부터 생물학적 시료를 수득하는 단계를 추가로 포함한다.
본 발명에 따른 방법의 특정 실시양태에서, 상기 방법은 환자가 갑상선암을 갖는 것으로 진단되는 경우 갑상선암에 대해서 개체를 치료하는 것을 추가로 포함한다. 특정 실시양태에서, 상기 치료는 개체의 갑상선 또는 이의 일부의 외과적 제거를 포함한다.
본 발명은 또한 갑상선암을 특정하는데 유용한 방법 및 키트를 포함한다. 본원에 사용된 바와 같이, 용어 개체에서 "갑상선암을 특정하는" 것은 개체에서 암 시료의 하나 이상의 특성, 예컨대 갑상선암의 특정 유형을 동정하는 것을 지칭하고, 개체의 예후 또는 생존률을 측정하는 것을 포함할 수 있다. 암은 본원에 기술된 유전자 산물을 포함하지만 이들로 제한되지 않는 하나 이상의 바이오마커의 발현을 동정함으로써 특정될 수 있다. 본원에 기술된 일반적인 방법이 갑상선암의 유형을 결정하는데, 예컨대 상기 유전자 산물의 발현 수준을 갑상선암의 다양한 유형에 대해 결정된 것들과 비교함으로써 용이하게 변경될 수 있음을 통상의 기술자는 이해할 것이다. 갑상선암의 유형의 결정에 근거하여, 예후, 생존율, 및/또는 전이 확률이 예컨대 병리학적 데이터 또는 결과에 근거하여 측정 또는 예측될 수 있다.
생물학적 시료
특정 실시양태에서, 본 발명의 방법은 개체로부터 수득된 생물학적 시료를 사용하고, 특정 방법은 개체로부터 생물학적 시료를 수득하는 것을 포함한다. 생물학적 시료는 검사되는 개체의 조직, 세포, 핵산, 유전자, 유전자 단편, 발현 산물, 유전자 산물 (예컨대, mRNA 또는 단백질), 또는 유전자 산물 단편을 포함하는 임의의 재료일 수 있다. 시료 적합성 및/또는 타당성을 결정하는 방법이 제공된다. 시료에는, 이로 제한되는 것은 아니지만, 조직, 세포, 또는 개인의 세포 또는 세포로부터 유래하는 생물학적 물질이 포함될 수 있다. 상기 시료는 세포 또는 조직의 이종 또는 동종 집단일 수 있다. 특정 실시양태에서, 상기 생물학적 시료는 조직 시료, 예컨대 개체의 갑상선 또는 갑상선 결절로부터 수득된 시료이다. 갑상선 결절은 갑상샘의 성장이다. 구체적인 실시양태에서, 생물학적 시료에는 유전자 산물, 예컨대 mRNA와 같은 핵산, 및/또는 단백질이 포함된다.
다양한 실시양태에서, 개체는 이로 제한되는 것은 아니지만, 인간, 비-인간 영장류, 설치류, 개, 고양이, 돼지, 어류 등을 비롯한 동물 (예컨대, 포유동물)이다. 구체적인 실시양태에서, 본 발명의 방법 및 조성물은 인간으로부터의 생물학적 시료에 적용된다. 일부 실시양태에서, 인간은 어린이, 청소년, 또는 성인이다. 구체적인 실시양태에서, 개체는 갑상선 종양을 가질 위험이 있다고 결정되었거나 그를 가질 것으로 의심된다.
용어 갑상선암을 "가질 것으로 의심되는 개체"는 갑상선암을 지시하는 하나 이상의 증상 (예컨대, 뚜렷한 종괴 또는 덩이)을 보이거나 (예컨대, 정기 신체검사 동안) 암에 대해 스크리닝된 개체를 지칭한다. 예를 들어, 개체는 비대 갑상선 및/또는 하나 이상의 갑상선 결절을 갖는 것으로 결정되었을 수 있다. 갑상선 암종을 가질 것으로 의심되는 개체는 또한 하나 이상의 위험 인자를 가질 수 있다. 갑상선암이 의심되는 개체에는 초기 진단을 받았지만 암의 시기가 알려지지 않은 개체가 포함된다. 상기 용어는 한때 암에 걸렸던 사람 (예컨대, 차도가 있는 개인)을 추가로 포함한다. 또한, 특정 개체는 갑상선 종양에 대해 이전에 검사되었지만 그 결과가 미정이거나 불확정이었다.
본원에 사용된 바와 같이, 용어 "갑상선암에 걸릴 위험이 있는 개체"는 갑상선암, 특별하게는 침습성 또는 전이성 갑상선암, 더욱 특별하게는 ATC가 발병할 하나 이상의 위험 인자를 갖는 개체를 지칭한다. 위험 인자에는, 이들로 제한되는 것은 아니지만, 성별, 연령, 유전적 소인, 환경적 노출, 암의 이전 사건, 선재의 비-암 질병, 및 생활양식이 포함된다.
생물학적 시료는 본원에 기술된 분석 방법에 적합한 시료를 제공할 수 있는 당해 분야에 공지된 임의의 방법을 이용하여 수득될 수 있다. 개체로부터 생물학적 시료를 수득하는 방법에는, 이로 제한되는 것은 아니지만, 가는 바늘 흡인 (FNA), 바늘 흡인, 중심부 바늘 생검, 진공 보조 생검, 절개 생검, 절제 생검, 또는 펀치 생검을 비롯한 생검 방법이 포함된다. 구체적인 실시양태에서, 본 발명의 방법 및 키트는 FNA에 의해 수득된 생물학적 시료를 사용한다. 갑상선의 적합한 시료를 수득하는 방법은 당해 분야에 공지되어 있고, 그 전체가 참고로서 본원에 포함되는, 갑상선 결절 관리를 위한 ATA 가이드라인에 상세히 기술되어 있다 (Cooper et al. Tyroid Vol. 16 No. 2 2006). 생물학적 시료를 수득하기 위한 일반적인 방법이 또한 당해 분야에 알려져 있으며, 예를 들어, 그 전체가 참고로서 본원에 포함되는, 문헌 (Ramzy, Ibrahim Clinical Cytopathology and Aspiration Biopsy 2001)에 상세히 기술되어 있다. 일 실시양태에서, 상기 시료는 갑상샘, 갑상선 결절 또는 의심되는 갑상선 종양의 가는 바늘 흡인이다. 일부 사례에서, 상기 가는 바늘 흡인 샘플링 과정은 초음파, X-선, 또는 기타 영상 장치의 사용에 의해 안내될 수 있다.
일부 사례에서, 다수의 갑상선 시료와 같은 다수의 생물학적 시료가 본 발명의 방법에 의한 진단을 위해, 예컨대 동시에 또는 다른 시점에서 수득될 수 있다. 일부 사례에서, 동시에 또는 다른 시점에서 수득된 시료, 또는 시료들은 보관되고/되거나 다양한 방법에 의해 분석된다. 예를 들어, 시료는 세포학적 분석 (통상적인 염색)에 의해 수득되고 분석될 수 있다. 일부 사례에서, 추가의 시료가 예컨대 세포학적 분석 결과를 토대로 동시에 또는 그 후에 개체로부터 수득될 수 있다. 상기 추가의 시료는, 예컨대 세포학적 분석이 암의 존재 또는 부재에 대하여 불확정이었을 때 본 발명의 방법에 사용될 수 있다. 본 발명에 따른 방법의 다른 실시양태에서, 단일 시료가 수득될 수 있고 상기 시료의 일부는 세포학적 분석에 의해 분석되고 상기 시료의 다른 부분은 본 발명의 방법에 의해 분석된다.
특정 실시양태에서, 생물학적 시료는 의료 전문기관, 예컨대 병원, 의사 사무실, 검사 시설 또는 실험실에 의해 개체로부터 수득된다. 특정 실시양태에서, 생물학적 시료는 키트를 사용하여 수득될 수 있는데, 이는 본원에 기술된 바와 같은 시료를 수득하기 위한 수단, 상기 시료를 보관하기 위한 수단, 및 상기 키트를 사용하기 위한 지침서를 포함할 수 있다. 일부 사례에서, 상기 키트는 분자적 프로파일링 서비스에 의해 제공되는데, 이 역시 생물학적 시료에 대한 진단 어세이를 수행할 수 있다.
구체적인 실시양태에서, 생물학적 시료는 상기 시료가 얻어진 후 및 상기 시료가 본 발명의 하나 이상의 방법에 의해 분석되기 전에 수초, 수분, 수시간, 수주, 수일, 수개월, 수년 또는 그 이상과 같은 기간 동안 보관된다. 일부 사례에서, 개체로부터 얻어진 시료는, 상기 시료의 다양한 부분이 이로 제한되는 것은 아니지만, 보관, 세포학적 분석, 타당성 검사, 핵산 추출, 단백질 추출, 분자적 프로파일링 또는 이들의 조합을 비롯한 다양한 후속 방법 또는 공정에 적용되도록, 보관 또는 추가의 분석 단계 전에 세분된다. 일부 사례에서, 상기 시료의 일부는 보관되는 반면 상기 시료의 또 다른 일부는 추가로 조작된다. 이러한 조작에는, 이로 제한되는 것은 아니지만: 분자적 프로파일링; 세포학적 염색; 핵산 (예컨대, mRNA) 추출, 검출, 또는 정량; 단백질 추출, 검출 또는 정량; 고정 (예컨대, 포르말린 고정 파라핀 포매 시료); 및/또는 시험을 포함할 수 있다. 상기 시료는, 예컨대 글루타르알데히드, 포름알데히드, 또는 메탄올을 사용하여 당해 분야에 공지된 임의의 방법에 의해 보관 전 또는 보관 동안에 고정될 수 있다. 다른 사례에서, 상기 시료의 다양한 부분이, 이로 제한되는 것은 아니지만, 보관, 세포학적 분석, 타당성 검사, 핵산 추출, 폴리펩티드 추출, 분자적 프로파일링, 하나 이상의 유전자 산물의 발현 결정, 또는 이들의 조합을 비롯한 다양한 후속 방법 또는 공정에 적용되도록, 상기 시료는 얻어지고 보관되고 추가의 분석을 위해 보관 단계 후에 세분된다. 일부 사례에서, 시료는 얻어져서 예컨대 세포학적 분석에 의해 분석되고, 그 결과 시료 물질은 예컨대 분자적 프로파일링에 의해, 본원에 기술된 유전자 산물의 발현 수준을 결정하는 것을 포함하는, 본 발명의 하나 이상의 방법에 의해 추가로 분석된다. 이러한 사례에서, 상기 시료는 세포학적 분석 단계와 예컨대 분자적 프로파일링에 의해 유전자 산물 발현 수준을 측정하는 단계 사이에 보관될 수 있다. 특정 실시양태에서, 시료는 냉동 (예컨대, 0℃, -1℃, -2℃, -3℃, -4℃, -5℃, -6℃, -7℃, -8℃, -9℃, -10℃, -12℃, -14℃, -15℃, -16℃, -20℃, -22℃, -25℃, -28℃, -30℃, -35℃, -40℃, -45℃, -50℃, -60℃, -70℃, -80℃, -100℃, -120℃, -140℃, -180℃, -190℃, 또는 약 -200℃의 임의의 온도에서) 또는 감소된 온도 (예컨대, 약 20℃ 및 약 0℃ 사이)에서 적절한 배지, 부형제, 또는 용액, 예컨대, 이로 제한되지는 않지만, Cytyc ThinPrep, SurePath, 또는 Monoprep과 같은 후속 세포학적 분석을 위한 세포 보관에 적합한 상업적 제조물 내에 보관될 수 있다.
시료를 보관하는 단계 이전 또는 이후를 비롯하여, 시료 수득 동안 또는 그 후에, 상기 생물학적 시료는 본 발명의 방법 및 조성물에의 사용을 위한 그의 적합성이 평가될 수 있다. 상기 시료는 이로 제한되는 것은 아니지만: 부족한 세포, 부족한 유전 물질, 부족한 단백질, DNA, 또는 RNA, 지시된 검사에 부적당한 세포, 또는 지시된 검사에 부적당한 물질, 시료의 수명, 상기 시료가 수득되었던 방식, 또는 상기 시료가 보관 또는 이송되었던 방식을 비롯한 다양한 인자들로 인해 추가의 분석에 적당한지 부적당한지에 대해 결정될 수 있다. 타당성은 세포 염색 과정, 세포의 개수 또는 조직의 양의 측정, 총 단백질의 측정, 핵산의 측정, 육안 시험, 현미경 시험, 또는 온도 또는 pH 결정과 같은 당해 분야에 공지된 다양한 방법을 이용하여 결정될 수 있다. 일 실시양태에서, 시료 타당성은 유전자 산물 수준 분석 실험을 수행한 결과로부터 결정된다.
특정 유형의 세포의 적합한 개수가 존재하는지를 결정하기 위한 방법의 예시에는 PCR, 정량적 PCR, RT-PCR, 면역-병리화학적 분석, 세포학적 분석, 현미경적, 및 또는 육안 분석이 포함된다.
시료는 예컨대, 이로 제한되는 것은 아니지만, 분광광도계를 사용한 260 나노미터에서의 흡광도를 비롯한 자외선 흡광도와 같이 당해 분야에 공지된 다양한 방법을 이용하여 생물학적 시료로부터의 추출 후 핵산 함량을 결정함으로써 분석될 수 있다. 특정 실시양태에서, 주어진 시료로부터의 RNA 양 또는 수율은 나노- 내지 마이크로그램 범위로 NanoDrop 분광광도계를 사용하여 측정된다. 일부 실시양태에서, RNA 양은 Agilent 2100 Bioanalyzer 기구를 사용하여 측정되고, 계산된 RNA 완전성 수 (RNA integrity number) (RIN, 1-10)로 특정된다. RNA 완전성 수 (RIN)는 RNA 측정에 대한 완전성 값을 평가하기 위한 알고리즘이다. RIN 알고리즘은 전기영동적 RNA 측정에 적용되고 더욱 확고한 범용적 측정치를 제공하기 위해 RNA 완전성에 대한 정보에 기여하는 상이한 특성의 조합을 토대로 한다. 상기 알고리즘은 1 내지 10 RIN 점수를 부여하는데, 수준 10 RNA가 최고 품질이다. 일 측면에서, 본 발명은 6.0 이하, 5 이하, 또는 4 이하의 RNA RIN 값을 갖는 시료로부터 유전자 발현을 분석하는 방법을 제공한다. 일부 실시양태에서, 약 1.0, 2.0, 3.0, 4.0, 5.0 또는 6.0의 어느 하나의 RIN 수를 갖는 RNA를 함유하는 시료가 본 발명의 방법 및 알고리즘을 이용하여 분석된다.
일부 실시양태에서, 생물학적 시료 내 단백질 함량은, 이로 제한되는 것은 아니지만: 280 나노미터에서 자외선 흡광도, 세포 염색, 또는 단백질 염색, 예를 들어 코마시 블루 또는 바이치콘산 (bichichonic acid)을 비롯한, 당해 분야에 공지된 임의의 다양한 방법을 이용하여 측정된다. 일부 사례에서, 단백질은 상기 시료의 측정 전에 생물학적 시료로부터 추출된다.
구체적인 실시양태에서, 시료는 예컨대 생물학적 시료로부터 유전자 산물을 분리하기 위하여 당해 분야에 공지되고 이용가능한 임의의 방법에 의해 가공된다. 특정 실시양태에서, 상기 유전자 산물은 핵산 (예컨대, mRNA를 비롯한 RNA) 및 단백질로부터 선택된다.
세포학적 분석
생물학적 시료의 세포학적 분석은, 예컨대 상기 생물학적 시료내 세포의 현미경적 시험과 조합된 세포염색에 의해 수행될 수 있다. 세포염색, 또는 세포학적 시험은, 이로 제한되는 것은 아니지만: EA 염료, 헤마톡실린 염료, 사이토스테인 (cytostain), 파파니콜로 (Papanicolaou) 염료, 에오신, 니슬 (nissl) 염료, 톨루이딘 블루, 실버 염료, 아조카르민 (azocarmine) 염료, 네츄럴 레드, 또는 야누스 그린을 비롯한 당해 분야에 공지된 적합한 시약 및 다수의 방법에 의해 수행될 수 있다. 일부 사례에서, 상기 세포는 염색 과정 전에 또는 그 도중에, 예컨대 메탄올, 에탄올, 글루타르알데히드 또는 포름알데히드를 사용하여 고정되고/되거나 투과되지만, 다른 사례에서는 그렇지 않다. 핵산 함량은 예컨대, 에티디움 브로마이드, 헤마톡실린, 니슬 염료 또는 당해 분야에 공지된 임의의 핵산 염료를 이용한 염색 과정을 이용하여 수행되거나 수행되지 않을 수 있다.
일부 실시양태에서, 세포는 세포학적 시험을 위해 당해 분야에 공지된 표준 방법에 의해 슬라이드 상에 도말될 수 있다. 다른 사례에서, 액상 세포도말 검사 (liquid based cytology, LBC) 방법이 이용될 수 있다. LBC 방법에서, 생물학적 시료는 개체로부터 예를 들어 Cytyc ThinPrep, SurePath, 또는 Monoprep 또는 당해 분야에 공지된 임의의 기타 액상 기반 세포도말 검사 조직표본 용액과 같은 액상 세포도말 검사 조직표본 용액을 함유하는 용기 또는 바이알로 옮겨진다. 추가적으로, 상기 시료는 이의 실질적인 정량적 운반을 보장하기 위해 수집 장치로부터 액상 세포도말 검사 조직표본 용액을 이용해 상기 용기 또는 바이알 내로 세정된다. 상기 액상 세포도말 검사 조직표본 용액 내 생물학적 시료를 함유하는 용액은 그 후에 보관되고/되거나 유리 슬라이드 상에 세포의 층을 형성하기 위해 기계 또는 통상의 기술자에 의해 처리된다. 상기 시료는 추가로 염색되고 통상적인 세포학적 조직표본과 동일한 방식으로 현미경 하에서 조사된다.
일부 실시양태에서, 시료는 면역-조직화학적 염색에 의해 분석될 수 있다. 면역-조직화학적 염색은 생물학적 시료 (예컨대, 세포 또는 조직) 내 특정 분자 또는 항체의 사용에 의한 항원의 존재, 위치, 및 분포의 분석을 제공한다. 항원은 항체에 의해 특이적으로 인식될 수 있는 작은 분자, 단백질, 펩티드, 핵산, 또는 임의의 다른 분자일 수 있다. 시료는 고정 및/또는 투과 단계와 함께 또는 이들 단계 없이 면역-조직화학적 방법에 의해 분석될 수 있다. 일부 사례에서, 관심 항원은 상기 시료를 그 항원에 특이적인 항체와 접촉시킴으로써 검출될 수 있고, 그 후에 비-특이적 결합을 1회 이상의 세척에 의해 제거할 수 있다. 이어서 특이적으로 결합한 항체는, 예를 들어 표지된 2차 항체, 또는 표지된 아비딘/스트렙타비딘과 같은 항체 검출 시약에 의해 검출될 수 있다. 일부 사례에서, 항원 특이적 항체는 그 대신 직접적으로 표지될 수 있다. 면역-조직화학에 적합한 표지에는, 이로 제한되는 것은 아니지만, 플루오르세인 및 로다민과 같은 형광단, 알칼라인 포스파타제 및 호스 래디쉬 퍼옥시다제와 같은 효소, 및 32P 및 125I와 같은 방사성핵종이 포함된다. 면역-조직화학적 염색에 의해 검출될 수 있는 유전자 산물 마커의 예시에는, 이로 제한되는 것은 아니지만, Her2/Neu, Ras, Rho, EGFR, VEGFR, UbcHIO, RET/PTC1, 사이토케라틴 20, 칼시토닌, GAL-3, 티로이드 퍼옥시다제, 및 티로글로불린이 포함된다.
상용 세포학적 시험 결과는 생물학적 시료를 음성 (암 부재), 모호 또는 의심 (암의 존재의 시사), 진단 (암에 대한 양성 진단), 또는 비-진단 또는 불확정 (암의 존재 또는 부재와 관련하여 부족한 정보의 제공)인 것으로 나타낼 수 있다. 상기 진단 결과는 악성 또는 양성으로 분류될 수 있다. 일부 사례에서, 상기 진단 결과는 본원에 기술된 임의의 질환 또는 상태와 같은, 암 또는 상태의 특별한 유형을 지시할 수 있다.
유전자 및 유전자 산물
다양한 실시양태에서, 본 발명의 방법은, 예컨대 본원에 기술된 임의의 유전자 또는 유전자 세트에 의해 발현된 유전자 산물의 발현 수준을 측정함으로써, 생물학적 시료의 분자적 프로파일링을 포함한다. 유전자 산물에는, 이로 제한되는 것은 아니지만, mRNA 및 상기 유전자로부터 발현된 단백질이 포함된다. 본 발명의 방법에 따라 그에 대해 발현 수준이 결정되고, 측정되고 또는 분석되는 유전자 산물 (또한 "유전자 발현 산물"로 언급됨)은 표 1에 열거된 하나 이상, 2개 이상, 3개 이상, 또는 4개 이상의 유전자 세트에 의해 발현된 유전자 산물뿐만 아니라 이의 변이체 또는 동족체 (즉, 다른 종 유래의 상응 유전자)를 포함하거나 이들로 이루어진다. 그에 대해 발현이 측정되는 유전자 산물은 오로지 표 1의 유전자 (또는 이의 변이체 또는 동족체)에 의해 발현될 수 있고, 또는 이들은 이전에 갑상선암과 연관된 것과, 예컨대 PCT 특허 출원 WO2011/032296, WO2011/143361, 또는 WO2010/056374에 기술된 것들을 포함하는 하나 이상의 추가적인 유전자 산물을 포함할 수 있다. 표 1은 인간 유전자에 대한 예시적 서열의 명칭 또는 등재 번호를 제공한다. 다른 종으로부터의 상응하는 유전자는 쉽게 이용가능하다.
유전자
유전자 전체 명칭 다른 명칭 등재번호 참조 서열
  폴리뉴클레오티드 폴리펩티드
CXCR3
(유전자 1)
케모카인 (C-X-C 모티프) 수용체 3 G 단백질-결합 수용체 9 (GPR9) 및 CD183 NM_001504.1
(서열번호: 1)
NP_001495.1
(서열번호: 2)
CCR3
(유전자 5)
케모카인 (C-C 모티프) 수용체 3 CD193 (분화 193의 클러스터) NM_001837.3
(서열번호: 3)
NP_001828.1
(서열번호: 4)
CXCL10
(유전자 7)
케모카인 (C-X-C 모티프) 리간드 10 인터페론 감마-유도된 단백질 10 (IP-10) 또는 작은-유도성 사이토카인 B10 NM_001565
(서열번호: 5)
NP_001556.2
(서열번호: 6)
CK19
(유전자 10)
시토케라틴 (citokeratin) 19 케라틴, 타입 I 세포골격 19 또는 케라틴-19 (K19) NM_002276.4
(서열번호: 7)
NP_002267.2
(서열번호: 8)
TIMP-1
(유전자 11)
금속단백분해효소-1의 조직 억제제 TIMP 금속단백분해효소 억제제 1 NM_003254
(서열번호: 9)
NP_003245.1
(서열번호: 10)
CLDN-1
(유전자 12)
클라우딘 (claudin) 1 NM_021101.4
(서열번호: 11)
NP_066924.1
서열번호: 12)
CAR
(유전자 13)
콕사키바이러스 및 아데노바이러스 수용체 CXADR NM_001207066.1
(서열번호: 13)
NP_001193995.1
서열번호: 14)
XB-130
(유전자 15)
액틴 필라멘트 관련 단백질 1-유사 2 AFAP1L2 NM_001001936.1
(서열번호: 15)
NP_001001936.1
(서열번호: 16)
HO-1
(유전자 16)
헴 옥시게나제 (디사이클링) 1 HMOX1 (헴 옥시게나제 (디사이클링) 1) NM_002133.2
(서열번호: 17)
NP_002124.1
서열번호: 18)
CCR7
(유전자 17)
케모카인 (C-C 모티프) 수용체 7 C-C 케모카인 수용체 타입 7 또는 CD197 NM_001838.3
(서열번호: 19)
NP_001829.1
(서열번호: 20)
특정의 실시양태에서, 본 발명의 방법은 생물학적 시료, 예컨대 갑상선 조직 시료에서 표 1에 나타난 유전자의 2개 이상, 3개 이상, 4개 이상, 또는 5개 이상의 유전자 산물의 발현 수준을 측정하는 것을 포함한다. 특정 실시양태에서, 상기 방법은 CXCR3, CCR3, CXCL10, CAR, XB130, HO-1 및 CCR7 유전자로부터 선택되는 적어도 하나, 적어도 2개, 또는 적어도 3개 유전자의 유전자 산물의 발현 수준을 측정하는 것을 포함한다. 일 실시양태에서, 발현 수준은 CXCR3, CCR3, CXCL10, CK19, TIMP-1, CLDN-1, CAR, HO-1 및 CCR7 유전자의 유전자 산물을 포함하거나 이들로 이루어진 유전자 산물에 대해 측정된다. 다른 실시양태에서, 발현 수준은: CCR3, TIMP-1, CAR 및 XB130 유전자의 유전자 산물; CXCL10, TIMP-1, CAR 및 CCR7 유전자의 유전자 산물; TIMP-1, CAR 및 CCR7 유전자의 유전자 산물; 또는 CXCL10, TIMP-1, CLDN-1, 및 CCR7 유전자의 유전자 산물을 포함하거나 이들로 이루어진 유전자 산물에 대해 측정된다. 그에 대해 발현이 측정되는 유전자 산물의 특별한 세트는 유전자 산물의 "세트"로 언급될 수 있으며, 그에 대해 발현이 측정되는 상기 특별한 유전자는 "유전자 세트"로 언급될 수 있다. 특정 실시양태에서, 동일한 유형의 유전자 산물, 예컨대 mRNA 또는 단백질의 발현 수준이 본 발명의 방법에 따라 각 유전자 세트에 대해 측정된다. 따라서, 구체적인 실시양태에서, 단 하나의 유형의 유전자 산물, 예컨대 mRNA 또는 단백질의 발현 수준은 특별한 조직 시료에 대해 본 발명의 방법을 실시함에 있어 측정된다. 그럼에도, 2개 이상의 다른 유형의 유전자 산물, 예컨대 mRNA 및 단백질 모두의 발현 수준이 사용되는 유전자 세트의 각 유전자에 대해 결정되는 본 발명의 방법이 시될 수 있는 것으로 고려된다.
유전자 산물의 수준 측정
유전자 산물의 발현 수준은 당해 분야에 이용가능한 임의의 적합한 수단에 의해 측정될 수 있고, 측정되는 유전자 산물의 유형에 따라 본질적으로 달라질 것이다. 예를 들어, 유전자 산물을 검출하기 위한 시약은 RNA 발현, 단백질 발현, 또는 본원에 기술된 유전자에 의해 인코딩되는 단백질의 단백질 활성 또는 하류의 생물학적 기능을 측정할 수 있다. 따라서, 본 발명은 이러한 유전자 또는 핵산, DNA 프로브, 또는 인코딩된 단백질에 결합하는 항체 등을 포함하는, 이의 유전자 산물을 검출하기 위한 시약을 포함한다.
단백질 발현 수준은, 예컨대 단백질 유전자 산물에 특이적으로 결합하는 항체를 이용한 면역조직화학에 의해 측정될 수 있다. 특정 실시양태에서, 단백질 발현 수준은 폴리펩티드 어레이 또는 항체 어레이를 사용하여 측정된다. 특정 실시양태는 표준 방법 및 검출기, 예컨대 영상 장치를 사용하는, 웨스턴 블롯팅 및 면역침전, 효소-연계 면역흡착 어세이 (ELISA), 유세포분석, 및 면역형광 어세이 (IFA)를 이용할 수 있다. 이들 공지의 방법은 전형적으로 하나 이상의 단클론 또는 다클론 항체, 이의 단편을 사용하는데, 이들은 본 발명의 선택된 표적 폴리펩티드 유전자 산물, 또는 상기 폴리펩티드의 특정 영역에 특이적으로 결합하고, 일반적으로 다른 폴리펩티드에는 유의미하게 결합하지 않는다. 항체 또는 이의 항원-결합 단편이 검출가능한 수준으로 (예를 들어, ELISA 어세이에서) 폴리펩티드와 반응하고 유사한 조건 하에서 관련이 없는 폴리펩티드와는 통계학적으로 유의미한 방식으로 검출가능하게 반응하지 않는다면, 상기 항체 또는 이의 항원-결합 단편은 폴리펩티드에 "특이적으로 결합"하고 "면역학적으로 결합"하고/하거나 "면역학적으로 반응"하는 것으로 언급된다.
특정의 실시양태는 "마이크로어레이"와 같은 "어레이"를 사용할 수 있다. 특정 실시양태에서, "마이크로어레이"는 또한 복수 개의 결합된 폴리펩티드 각각의 결합이 개별적으로 검출될 수 있는, 기질-결합 컬렉션 또는 복수 개의 폴리펩티드를 갖는 "펩티드 마이크로어레이" 또는 "단백질 마이크로어레이"로 언급될 수 있다. 대안적으로, 상기 펩티드 마이크로어레이는, 이로 제한되는 것은 아니지만, 단클론 항체, 다클론 항체, 파아지 디스플레이 바인더, 효모 2 하이브리드 바인더, 및 앱타머를 비롯한 복수 개의 바이더를 포함할 수 있고, 이들은 본원에 기술된 폴리펩티드 유전자 산물의 결합을 특이적으로 검출할 수 있다. 상기 어레이는, 예를 들어 문헌 [Robinson et al ., Nature Medicine 8(3):295-301 (2002)]에 기술된 바와 같이, 폴리펩티드의 자기항체 (autoantibody)를 토대로 할 수 있다. 펩티드 어레이는 예를 들면 국제공개 WO 02/31463, WO 02/25288, WO 01/94946, WO 01/88162, WO 01/68671, WO 01/57259, WO 00/61806, WO 00/54046, WO 00/47774, WO 99/40434, WO 99/39210, 및 WO 97/42507과 미국 특허 제6,268,210호, 제5,766,960호, 및 제5,143,854호에서 확인할 수 있으며, 이들 각각은 여기에서 참고로 포함된다.
특정의 실시양태는 질량 분광법 (MS) 또는 폴리펩티드 유전자 산물을 진단적으로 검출하기 위한 기타 분자량-기반 방법을 이용할 수 있다. MS는 일반적으로 시료 또는 분자의 구성요소적 조성을 결정하기 위한 분석 기술을 지칭한다. MS는 또한 펩티드 및 기타 화학적 화합물과 같은 분자의 화학적 구조를 결정하는데 사용될 수 있다. 예시적인 MS 기구는 3개의 모듈을 갖는다: 가스상 시료 분자를 이온으로 전환시키는 (또는, 전자분무 이온화의 경우, 용액 내에 존재하는 이온을 가스상으로 이동시키는), 이온 소스; 전자기장을 적용하여 상기 이온을 이들의 질량에 따라 분류하는, 질량 분석기; 및 유량의 값을 측정하고 그로써 존재하는 각각의 이온의 존재량을 계산하기 위한 데이터를 제공하는, 검출기. 상기 MS 기술은 정성적 및 시료 내 폴리펩티드 유전자 산물의 양을 정량하는 것을 포함하는 정량적 용도를 갖는다. 가스 크로마토그래피-질량 분광법 (GC/MS 또는 GC-MS), 액체 크로마토그래피 질량 분광법 (LC/MS 또는 LC-MS), 및 이온 이동성 분광법/질량 분광법 (IMS/MS 또는 IMMS)이 포함된다. 따라서, MS 기술은 시료 내 폴리펩티드 유전자 산물의 수준을 측정하고, 선택적으로, 대조군 또는 미리 측정된 값과 이들 수준을 비교하기 위해 본원에 제공된 임의의 방법에 따라 사용될 수 있다.
특정 실시양태는 시료 내 유전자 산물의 존재 또는 수준을 검출 또는 정량하기 위하여 세포-분류 또는 세포 시각화 또는 영상화 장치/기슬을 이용할 수 있다. 유세포분석기 또는 FACS, 면역형광 분석 (IFA), 및 인시츄 (in situ) 혼성화 기술, 예컨대 형광 인시츄 혼성화 (FISH)가 예시에 포함된다.
특정 실시양태에서, 본 발명의 방법은 폴리펩티드 유전자 산물을 검출하거나 폴리펩티드 유전자 산물의 양을 결정 또는 측정하는 단계를 포함하는데, 이는 생물학적 시료를 폴리펩티드 유전자 산물에 결합하는 하나 이상의 프로브 (예컨대, 폴리펩티드 또는 항체)와 이러한 결합이 일어나기에 충분한 조건 하 및 시간 동안에 접촉시킨 후 상기 프로브(들)에 결합한 폴리펩티드 유전자 산물의 양, 예컨대 프로브와 폴리펩티드 유전자 산물의 복합체의 양을 검출하는 것을 포함한다. 상기 검출은 당해 분야에 공지된 임의의 다양한 방법에 의해 수행될 수 있고 검출가능한 표지, 예컨대 면역형광 모이어티의 사용을 이용할 수 있다. 특정 실시양태에서, 상기 프로브는 검출가능하게 표지된다. 특정 실시양태에서, 상기 결합된 폴리펩티드 유전자 산물은 용액 중에서 또는 고체 지지체 상에서 검출된다.
본 발명의 방법은, 예컨대 시료 내 특별한 유전자 산물의 양을 측정하기 전에 또는 그동안에 생물학적 시료로부터 하나 이상의 유전자 산물을 분리하는 단계를 포함할 수 있다. 특정 실시양태에서, 검출되는 유전자 산물은 폴리펩티드이고, 폴리펩티드는 생물학적 시료로부터 정제되거나 부분적으로 정제된다. 특정 실시양태에서, 검출되는 유전자 산물은 mRNA이고, 폴리뉴클레오티드 또는 mRNA는 생물학적 시료로부터 정제되거나 부분적으로 정제된다. 생물학적 시료로부터 폴리펩티드 또는 폴리뉴클레오티드를 정제하거나 부분적으로 정제하는 방법은 당해 분야에 공지되어 있다.
핵산 발현 수준은, 이로 제한되는 것은 아니지만, 증폭 어세이 및 혼성화 어세이를 포함하는 다양한 기타 어세이를 이용하여 측정될 수 있다. 본 발명에 유용한 증폭 어세이에는, 이로 제한되는 것은 아니지만, 역전사-PCR (RT-PCR) 및 실시간 PCR을 비롯한 중합효소 연쇄 반응 (PCR) 어세이, 및 등온 증폭 반응이 포함된다. 혼성화 어세이에는, 이로 제한되는 것은 아니지만, 노던 블롯, 정량적 또는 정성적 중합효소 연쇄 반응 (PCR), 정량적 또는 정성적 역전사 PCR (RT-PCR), 마이크로어레이, 닷 또는 슬랏 블롯 (dot 또는 slot blot), 및 형광 인시츄 혼성화 (FISH)와 같은 인시츄 혼성화가 포함된다.
특정 실시양태는 mRNA와 같은 폴리뉴클레오티드 유전자 산물의 발현을 측정하기 위한 혼성화 방법을 이용할 수 있다. 폴리뉴클레오티드 혼성화 어세이를 수행하기 위한 방법은 당해 분야에 잘 개발되어 있다. 혼성화 어세이 과정 및 조건은 적용에 따라 달라질 것이고 문헌 [Maniatis et al . Molecular Cloning: A Laboratory Manual (2nd Ed. Cold Spring Harbor, N.Y., 1989); Berger and Kimmel Methods in Enzymology, Vol. 152, Guide to Molecular Cloning Techniques (Academic Press, Inc., San Diego, Calif., 1987); Young and Davis, PNAS. 80: 1194 (1983)]에 언급된 것들을 비롯해 공지된 일반적인 결합 방법에 따라 선택된다. 반복 및 제어된 혼성화 반응을 실시하기 위한 방법 및 장치는, 각각이 본원에 참고로서 포함되는, 미국특허 제5,871,928호, 제5,874,219호, 제6,045,996호 및 제6,386,749호, 제6,391,623호에 기술되어 있다.
특정 실시양태는 브랜드명 엔카운터 진 익스프레션 어세이 (nCounter Gene Expression Assay)으로 나노스트링 테크놀러지 인크사 (NanoString Technologies Inc, Seattle, WA, USA)로부터 상업적으로 입수가능한 바와 같은, 분자적 바-코딩 기술을 이용할 수 있다. 이 기술은 전사체 증폭을 요구하지 않으면서 표적 발현 수준이 조직 용해물과 같은 복합체로서 시료로부터 직접적으로 분석되는 것을 가능케 한다. 이 방법에서, 바오틴화 포획 프로브 및 바-코딩된 리포터 프로브 (색깔 코딩됨)는 특이적으로 관심 표적 유전자에 직접 혼성화한다. 과량의 비결합 프로브를 제거한 후, 프로브/표적 복합체는 엔카운터 카트리지 상에 고정화되고 정렬되며, 이어서 디지털 영상이 획득되고 정량되는데, 각각의 바-코드 계수는 상응하는 표적 유전자의 전사 카피수를 나타낸다. 중요하게도, 이 바-코딩 방법의 사용은 매우 높은 재현성으로 단일 시료 반응에서 500개 이상의 유전자의 다중 검출을 가능케 한다.
특정의 실시양태는 전사체 분석 및 친화력 포획 (TRAC) 방법을 이용하여 RNA 발현을 측정할 수 있는데, 발현된 RNA 종의 다중 검출이 임의의 역전사 또는 증폭을 요구하지 않으면서, 세포 용해물 또는 정제된 총 RNA 시료 상에서 직접적으로 수행될 수 있다. 이 신규한 과정에서, 바이오틴화 올리고-dT 및 이중-형광-표지된 유전자-특이적 프로브 (각각의 프로브는 뚜렷하게 다른 크기임)는 주어진 시료 내에서 mRNA에 혼성화된다. 상기 혼성화된 물질은 자기성 스트렙타비딘 비드에 결합되고, 세척되고 방출되고, 이어서 모세관 전기영동을 통해 분석된다. 따라서 표적의 동정 및 정량이 프로브/표적 크기 및 형광 프로파일을 분석함으로써 동시에 달성된다.
특정의 실시양태는 하이 쓰르풋 게노믹스 몰리큘라 다이어그노스틱스 인크사 (High Throughput Genomics Molecular Diagnostics Inc, Tucson, AZ, USA)로부터 상업적으로 이용한 것들과 같은, 정량적 뉴클리아제 보호 어세이 (qNPA) 또는 qNPA 마이크로어레이를 이용할 수 있는데, 발현된 RNA에 대한 유전자 특이적 프로브의 혼성화는 전사체/프로브 복합체를 단일-가닥 특이적 S1 리보뉴클리아제에 의한 분해로부터 보호한다. S1 처리 및 염기-매개 프로브/표적 복합체 분리 후에, 잔여 프로브는 이들의 상응하는 서열에 대해 1:1 화학량론으로 존재하고, 따라서 마이크로어레이 표면 상에의 포획을 통한 프로브의 정량은 상응하는 표적 서열 발현 수준의 추론을 가능케 한다.
특정 실시양태는 유전자 산물을 검출하기 위한 핵산 증폭 방법을 이용할 수 있다. 용어 "증폭" 또는 "핵산 증폭"은 표적 핵산 서열의 적어도 일부의 다수의 카피 생산을 지칭한다. 상기 다수의 카피는 앰플리콘 또는 증폭 산물로서 언급될 수 있다. 본원에 사용된 바와 같이, "선택적 증폭" 또는 "특이적 증폭"은 본 발명에 따른 표적 핵산 서열의 증폭을 지칭하는데, 표적 서열의 검출가능한 증폭은 실질적으로 검사되는 관심 핵산 시료에 의해 기여되는 표적 서열의 증폭으로 제한되고, 일부 다른 시료 공급원, 예컨대 증폭 반응 동안에 사용된 시약 내 또는 증폭 반응이 수행되는 환경 내 존재하는 오염원에 의해 기여된 표적 핵산 서열에 의해서는 기여되지 않는다.
용어 "증폭 조건"은 본 발명에 따른 핵산 증폭을 가능케 하는 조건을 지칭한다. 본 발명의 증폭 반응에 사용된 올리고뉴클레오티드는 증폭 조건 하에서 이들의 의도된 표적에 혼성화한다. 본 발명에 따른 핵산 증폭을 수행하기에 허용가능한 조건은 사용된 특별한 증폭 방법에 따라서 당해 분야의 통상의 기술자에 의해 용이하게 확인될 수 있다.
핵산 증폭의 수많은 공지의 방법은 교대로 이중-가닥 핵산을 변성시키고 프라이머를 혼성화하는 열순환 (thermocycling)을 요구하지만; 핵산 증폭의 기타 공지의 방법은 등온성이다. 통상적으로 PCR로 지칭되는 중합효소 연쇄 반응 (미국특허 제4,683,195호; 제4,683,202호; 제4,800,159호; 제4,965,188호)은 변성, 마주하는 가닥에의 프라이머 쌍의 어닐링, 및 표적 서열의 카피수를 지수적으로 증가시키기 위한 프라이머 신장의 다중 사이클을 이용한다. RT-PCR로 불리는 변형에서, 역전사 (RT)는 mRNA로부터 상보성 DNA (cDNA)를 만들기 위해 사용되고, 상기 cDNA가 그 후에 DNA의 다수의 카피를 생산하기 위해 PCR에 의해 증폭된다.
상기에 언급된 바와 같이, 용어 "PCR"은 표적 핵산 종을 선택적으로 증폭하는 다중 증폭 사이클을 지칭한다. 정량적 PCR (qPCR), 실시간 PCR, 역전사 PCR (RT-PCR) 및 정량적 역전사 PCR (qRT-PCR)이 이에 포함되고 당해 분야에 공지되어 있다. 용어 "qPCR"은 정량적 중합효소 연쇄 반응을 지칭하고, 용어 "qRT-PCR"은 정량적 역전사 중합효소 연쇄 반응을 지칭한다. qPCR 및 qRT-PCR은 표적 cDNA 분자를 증폭하고 동시에 정량하기 위해 사용될 수 있다. 이는 cDNA 풀 내에서 특정 서열의 검출 및 증폭을 모두 가능케 한다. 증폭 산물은 그 후에 다양한 수단에 의해, 예컨대 직접적으로 염색에 의한 겔에서 가시화될 수 있고, 상기 산물은 검출가능한 프로브를 사용한 혼성화에 의해 및/또는 차세대 서열분석을 이용하여 검출될 수 있다.
"실시간 PCR"은 PCR 반응 혼합물 내에서 이중-가닥 (ds) DNA에 결합하는 DNA-결합 염료를 사용하여 상기 염료의 형광을 유발할 수 있다. 따라서 PCR 동안 DNA 산물의 증가는 형광 강도의 증가를 초래하고 각 사이클에서 측정되며, 그로써 DNA 농도가 정량되게 한다. SYBR Green과 같은 dsDNA 염료는 모든 dsDNA PCR 산물에 결합할 것이다. 특정 실시양태는 Taqman 프로브를 사용할 수 있는데, 이는 5' 말단에 형광단이, 3' 말단에 소광제가 표지되고 바람직한 앰플리콘의 정방향 및 역방향 프라이머 결합 부위 사이에 어닐링되도록 고안된다. 상기 소광제가 형광단과 매우 근접한 상태를 유지하는 한 형광은 발산되지 않는다. 그러나, PCR 사이클 동안에 중합효소가 프라이머를 확장하기 때문에, 결합된 프로브의 상기 형광단과 소광제는 중합효소의 5'-3'엑소뉴클리아제 활성에 의해 절단되어 떨어지고, 형광이 발산된다. 따라서 시료 내에 존재하는 전사체의 양은 검출된 형광의 양에 직접적으로 비례하고, 후속 PCR 사이클에서 전사체 수의 증가는 발산되는 형광의 상응하는 증가를 초래한다. 형광은 실시간 PCR 열순환기 내에서 검출되고 측정되며, 상기 산물의 지수적 증가에 상응하는 그의 기하학적 증가는 각 반응에서 문턱값 주기 (threshold cycle, "Ct")를 결정하는데 사용된다.
용어 "Ct 점수"는 문턱값 주기 수를 지칭하는데, 이는 그 주기에서 PCR 증폭이 문턱값 수준을 능가하는 주기이다. 시료 내 특정 유전자에 대해 더 많은 양의 mRNA가 존재한다면, 증폭하는데 더 많은 출발 RNA가 존재하는 것이기 때문에 이는 더 낮게 발현된 유전자에 비해 더 빨리 문턱 값을 교차할 것이다. 따라서, 낮은 Ct 점수는 시료 내 높은 유전자 발현을 나타내고 높은 Ct 점수는 낮은 유전자 발현을 지시한다. 비정형 CT 값은 주어진 유전자에 대한 평균 CT 값의 2 표준 편차보다 더 큰 값이다.
특정 실시양태에서, 상기 증폭 방법은 단일 반응에서 2개 이상의 표적 서열을 검출하는 방법으로 본원에 기술된, PCR-기반 다중화 (multiplexing)를 이용할 수 있다. 상기 증폭 방법의 기타 실시양태는 열순환 방법을 제어하거나 첨가된 시약의 양 또는 시기를 정확히 제어하기 위해서, 또는 다른 실시양태에서는 개인 맞춤형 진단 대신에 상기 방법의 임상적 응용에 적합한 휴대용 키트에 상기 증폭 방법의 적용을 가능케 하기 위해 미세유동기 (microfluidics)를 사용할 수 있다.
특정 실시양태는 브랜드명 RT2 프로파일러 PCR 어레이로 퀴아젠사 (Qiagen, Hilden, Germany)에 의해, 또는 브랜드명 StellARray로 론자사 (Lonza, Basel, Switzerland)에 의해, 브랜드명 OpenArray로 라이프 테크놀러지사 (Life Technologies, Carlsbad, CA, USA)에 의해 상업적으로 제공되는 것들과 같은, 어레이 형태로 증폭-기반 검출 방법을 이용할 수 있다. 이들 접근법에서, 독립적인 qPCR 반응은 고밀도 96-웰 플레이트, 384-웰 플레이트, 100-웰 디스크, 또는 48 웰 칩에서 동시에 수행되어, qPCR의 모든 이익과 고성능의 부가된 이점을 가지고 표준 또는 맞춤 유전자의 정량을 가능케 할 수 있다.
특정 실시양태는 통상적으로 LCR로 언급되는, 연결효소 연쇄 반응 (ligase chain reaction, Weiss, Science . 254: 1292, 1991)을 이용할 수 있는데, 이는 표적 핵산의 인접 영역에 혼성화하는 2 세트의 상보성 DNA 올리고뉴클레오티드를 사용한다. 상기 DNA 올리고뉴클레오티드는 검출가능한 이중-가닥 연결된 올리고뉴클레오티드 산물을 생산하기 위해 열적 변성, 혼성화 및 연결의 반복 순환에서 DNA 연결효소에 의해 공유적으로 연결된다.
또 다른 방법은 통상적으로 SDA로 언급되는, 표준 변위 증폭 (strand displacement amplification, Walker, G. et al ., 1992, Proc . Natl . Acad . Sci . USA 89:392-396; 미국특허 제5,270,184호 및 제5,455,166호)이고, 이는 표적 서열의 마주하는 가닥에 대한 프라이머 서열의 어닐링, 이중 헤미포스포로티오에이트화 (hemiphosphorothioated) 프라이머 신장 산물을 생산하기 위해 dNTPαS의 존재 하에서 프라이머 신장, 반-변형된 제한 엔도뉴클리아제 인식 부위의 엔도뉴클리아제-매개 틈내기 (nicking), 및 기존 가닥을 변위하여 프라이머 어닐링, 틈내기 및 가닥 변위의 다음 회차를 위한 가닥을 생성하기 위해 상기 틈의 3' 말단으로부터 중합효소-매개 프라이머 신장의 순환을 이용하여, 산물의 기하학적 증폭을 초래한다. 호열성 SDA (tSDA)는 본질적으로 동일한 방법에서 고온에서 호열성 엔도뉴클리아제 및 중합효소를 사용한다 (유럽특허 제0 684 315호).
기타 증폭 방법에는, 예를 들어: 통상적으로 NASBA로 언급되는 핵산 서열 기반 증폭 (미국특허 제5,130,238호); 통상적으로 Qβ 복제효소로 언급되는 프로브 분자 자체를 증폭하기 위해 RNA 복제효소를 사용하는 방법 (Lizardi, P. et al ., 1988, BioTechnol . 6: 1197-1202); 전사 기반 증폭 방법 (Kwoh, D. et al ., 1989, Proc. Natl . Acad . Sci . USA 86:1173-1177); 자가-지속 (self-sustained) 서열 복제 (Guatelli, J. et al ., 1990, Proc . Natl . Acad . Sci . USA 87: 1874-1878); 및 통상적으로 TMA로 언급되는 전사 매개 증폭 (미국특허 제 5,480,784 and 5,399,491)이 포함된다. 공지의 증폭 방법의 추가의 논의를 위해 문헌 [Persing, David H., 1993, "In Vitro Nucleic Acid Amplification Techniques" in Diagnostic Medical Microbiology: Principles and Applications (Persing et al ., Eds), pp. 51-87 (American Society for Microbiology, Washington, DC)]을 참고한다.
본 발명에 따라 사용될 수 있는 예시적인 전사-기반 증폭 시스템에는 표적 영역의 다중 RNA 전사체를 생산하기 위해 RNA 중합효소를 사용하는 전사 매개 증폭 (TMA) (미국특허 제5,480,784호 및 제5,399,491호)이 포함된다. TMA는 그로부터 RNA 중합효소가 RNA 전사체를 생산하는 이중-가닥 프로모터를 형성하기 위해 역전사효소 및 RNA 중합효소의 존재 하에서 표적 핵산에 혼성화하는 "프로모터-프라이머"를 사용한다. 이들 전사체는 상기 RNA 전사체에 혼성화할 수 있는 제2 프라이머의 존재 하에서 TMA의 추가 회차를 위한 주형이 될 수 있다. 열 변성을 요구하는 PCR, LCR 또는 기타 방법과는 달리, TMA는 RNA:DNA 혼성화물의 RNA 가닥을 분해하여 프라이머 또는 프로모터-프라이머를 이용한 혼성화에 이용가능한 DNA 가닥을 제조하기 위해 리보누클레아제 H 활성을 사용한다. 일반적으로, 증폭을 위해 제공된 역전사효소와 관련된 리보누클레아제 H 활성이 사용된다.
특정의 실시양태에서, 마이크로어레이 분석 (Han, M., et al ., Nat Biotechnol, 19: 631-635, 2001;  Bao, P., et al ., Anal Chem, 74: 1792-1797, 2002; Schena et al ., Proc . Natl . Acad . Sci . USA 93:10614-19, 1996; 및 Heller et al ., Proc . Natl . Acad . Sci . USA 94:2150-55, 1997) 및 SAGE (유전자 발현의 연속 분석)을 비롯한 기타 기술들이 폴리뉴클레오티드 유전자 산물의 발현을 측정하기 위해 사용될 수 있다.  MPSS와 유사하게, SAGE는 디지털 방식이고, MPSS와 같은 기술로부터 이용가능한 것보다 더 적다고 하더라도, 다량의 서명 서열 (signature sequences)을 형성할 수 있다 (예컨대, 문헌 [Velculescu, V. E., et al., Trends Genet, 16: 423-425., 2000; Tuteja R. and Tuteja N. Bioessays. 2004 Aug; 26(8): 916-22] 참조).
특정의 실시양태에서, 용어 "마이크로어레이"에는 기질-결합된 복수 개의 핵산을 포함하고 복수 개의 결합된 핵산 각각에 대한 혼성화가 개별적으로 검출가능한 "핵산 마이크로어레이"가 포함된다. 상기 기질은 고체 또는 다공성, 평면 또는 비-평면, 단일 또는 분산될 수 있다. 핵산 마이크로어레이에는 소위 문헌 [Schena (ed), DNA Microarrays: A Practical Approach (Practical Approach Series), Oxford University Press (1999); Nature Genet. 21(1) (suppl): 1-60 (1999); Schena (ed), Microarray Biochip: Tools and Technology, Eaton Publishing Company/BioTechniques Books Division (2000)]에 언급된 모든 장치가 포함된다. 핵산 마이크로어레이는, 예를 들어, 문헌 [Brenner et al ., Proc . Natl . Acad . Sci. USA 97(4): 1665-1670 (2000)]에 기술된 바와 같이, 복수 개의 핵산이 단일의 평면 기질이 아닌, 복수 개의 비드 상에 배치된 기질-결합된 복수 개의 핵산을 포함할 수 있다. 핵산 마이크로어레이의 예는 미국특허 제6,391,623호, 제6,383,754호, 제6,383,749호, 제6,380,377호, 제6,379,897호, 제6,376,191호, 제6,372,431호, 제6,351,712호, 제6,344,316호, 제6,316,193호, 제6,312,906호, 제6,309,828호, 제6,309,824호, 제6,306,643호, 제6,300,063호, 제6,287,850호, 제6,284,497호, 제6,284,465호, 제6,280,954호, 제6,262,216호, 제6,251,601호, 제6,245,518호, 제6,263,287호, 제6,251,601호, 제6,238,866호, 제6,228,575호, 제6,214,587호, 제6,203,989호, 제6,171,797호, 제6,103,474호, 제6,083,726호, 제6,054,274호, 제6,040,138호, 제6,083,726호, 제6,004,755호, 제6,001,309호, 제5,958,342호, 제5,952,180호, 제5,936,731호, 제5,843,655호, 제5,814,454호, 제5,837,196호, 제5,436,327호, 제5,412,087호, 및 제5,405,783호에서 확인할 수 있으며, 이들 각각은 본 명세서에서 참고로 포함된다.
추가적인 예시에는 브랜드명 GENECHIP™으로 어피메트릭스사 (Affymetrix, Santa Clara, Calif) 또는 일루미나사 (Illumina, San Diego, CA)로부터 상업적으로 이용가능한 핵산 어레이가 포함된다. 에러이를 제작하고 사용하는 추가적인 예시적인 방법은, 예를 들어 미국특허 제7,028,629호; 제7,011,949호; 제7,011,945호; 제6,936,419호; 제6,927,032호; 제6,924,103호; 제6,921,642호; 및 제6,818,394호에 제공된다.
어레이 및 마이크로어레이와 관련된 바와 같은 본 발명은 또한 고체 기질에 부착된 중합체에 대한 다양한 사용을 고려한다. 예시적인 유전자 발현 모니터링 및 프로파일링 방법과 유전자 발현 모니터링 및 프로파일링에 유용한 방법이 미국특허 제5,800,992호, 제6,013,449호, 제6,020,135호, 제6,033,860호, 제6,040,138호, 제6,177,248호 및 제6,309,822호에 기술된다. 유전형분석 (Genotyping) 및 이의 용도가 미국출원 제10/442,021호, 제10/013,598호 (미국출원 제2003/0036069호), 및 미국특허 제5,925,525호, 제6,268,141호, 제5,856,092호, 제6,267,152호, 제6,300,063호, 제6,525,185호, 제6,632,611호, 제5,858,659호, 제6,284,460호, 제6,361,947호, 제6,368,799호, 제6,673,579호 및 제6,333,179호에 나타나 있다. 본원에 기술된 방법과 함께 사용될 수 있는 핵산 증폭, 라벨링 및 분석의 기타 방법이 미국특허 제5,871,928호, 제5,902,723호, 제6,045,996호, 제5,541,061호, 및 제6,197,506호에 구체화되어 있다.
특정의 실시양태는 통상적으로 RNA-Seq로 언급되는, RNA 발현의 분석을 위한, 총 전사체 숏건 서열분석 (Whole Transcriptome Shotgun Sequencing, WTSS)을 이용할 수 있는데, 단일 nt-해상도로 발현 프로파일의 전사체 지도 (transcriptome map)가 정밀한 서열분석 기술을 통해 조립될 수 있다. 일 실시양태에서, RNA 시료, 예컨대 mRNA는 단편화된 cDNA로 전환된 후 서열분석 어댑터에 연결된다. 고성능 서열분석은 de novo 조립되거나, 공지의 게놈 또는 참고 서열에 대해 정렬될 수 있는 수많은 짧은 서열 판독의 생성을 가능케 한다. 이어서 기록된 판독의 총 개수에 대한 개별적 서열 판독의 비율이 발현 프로파일을 형성하기 위해 사용될 수 있다.
특정의 실시양태에서, 본 발명의 방법은, 생물학적 시료와 폴리뉴클레오티드 유전자 산물에 결합하는 하나 이상의 프로브 (예컨대, 프라이머 또는 폴리뉴클레오티드)를 이러한 결합이 일어나기에 충분한 조건 하 및 시간 동안에 접촉시키는 것을 포함하는, 폴리뉴클레오티드 유전자 산물 (예컨대, mRNA)을 검출하거나 폴리뉴클레오티드 유전자 산물의 양을 결정 또는 측정하는 단계, 및 그 후에 상기 프로브(들)에 결합된 폴리뉴클레오티드 유전자 산물의 양을 검출하는 단계를 포함한다. 상기 검출은 당해 분야에 공지된 임의의 다양한 방법에 의해 수행될 수 있고 검출가능한 표지, 면역형광 모이어티의 사용을 이용할 수 있다. 특정의 실시양태에서, 상기 프로브는 검출가능하게 표지된다. 특정의 실시양태에서, 상기 결합된 폴리뉴클레오티드 유전자 산물은 용액 중에서 또는 고체 지지체 상에서 검출된다.
유전자 산물 검출용 시약
통상의 기술자에게 자명한 바와 같이, 특정의 실시양태는 유전자 산물을 검출하기 위한 시약, 예컨대 본원에 기술된 바와 같은, 항체와, 프라이머 또는 프로브를 비롯한 올리고뉴클레오티드를 사용할 수 있다. 구체적인 실시양태에서, 유전자 산물을 검출하기 위한 시약은 비관련 유전자 산물, 예컨대 상이한, 비관련 유전자로부터 발현된 유전자 산물이 아닌, 표적 유전자 산물에 특이적으로 결합하거나 특이적으로 혼성화한다. 표적 폴리펩티드 또는 핵산 서열에 특이적으로 결합하거나 특이적으로 혼성화하는 항체 및 올리고뉴클레오티드와 같은 시약을 제조하는 방법은 당해 분야에 공지되어 있다. 예를 들어, 항체는 통상의 기술자에게 공지된 임의의 다양한 기술에 의해 제조될 수 있다. 예컨대, 문헌 [Harlow and Lane, Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory, 1988]을 참고한다. 관심 폴리펩티드에 특이적인 단클론 항체는, 예를 들어 문헌 [Kohler and Milstein, Eur . J. Immunol . 6: 511-519, 1976]의 기술 및 이에 대한 개선책을 이용하여 제조될 수 있다.
단일 가닥 핵산, 특별히 올리고뉴클레오티드와 관련하여, 용어 "특이적으로 혼성화하다"는 당해 분야에서 일반적으로 사용되는 미리 결정된 조건 하에서 이러한 혼성화를 허용하기에 충분한 상보성 서열 (종종 "실질적으로 상보성"인 것으로 언급됨)의 2개 단일-가닥 뉴클레오티드 분자들 사이의 연합을 지칭한다. 특별히, 일 실시양태에서 상기 용어는 단일 가닥 DNA 또는 RNA 분자 내에 포함된 실질적으로 상보적인 서열과 올리고뉴클레오티드의 혼성화, 비-상보성 서열의 단일-가닥 핵산과 상기 올리고뉴클레오티드의 혼성화의 실질적인 배제를 지칭한다. 예를 들어, 특이적 혼성화는 당해 분야에 공지된 다양한 상동성을 갖는 단일 가닥 핵산 분자의 특이적 혼성화를 가능케 하는 적합한 조건 하에서 유전자 산물에 혼성화하는 서열을 지칭할 수 있다.
일 실시양태에서, 생물학적 시료 내 유전자 산물의 발현 수준은, 예컨대 상응하는 cDNA의 생산에 의해 RNA 전사의 상대적 비율을 측정하고, 이어서 예컨대 표 1에 동정된 바와 같은 유전자 서열로부터 발생하는 것들과 같은 프로브를 사용하여 그 결과 DNA를 분석함으로써 결정된다. 따라서, 생물학적 시료의 RNA와 역전사 효소의 사용에 의해 생산된 cDNA의 수준은 cDN의 상응하는 양을 생산하고, 그 후에 중합효소 연쇄 반응, 또는 기타 임의의 수단을 이용하여 증폭되어, 결과 cDNA의 상대적 수준 및 그로 인해 유전자 발현의 상대적 수준을 결정할 수 있다.
핵산 유전자 산물을 검출하기 위한 예시적인 시약에는 핵산이 포함되고, 구체적으로 올리고뉴클레오티드가 포함된다. 핵산은 DNA 또는 RNA일 수 있고, 단일 또는 이중 가닥일 수 있다. 일 실시양태에서, 올리고뉴클레오티드는 DNA 프로브, 또는 표적 유전자로부터 생산된 핵산을 증폭하기 위한 프라이머이다. 일 실시양태에서, 본 발명의 올리고뉴클레오티드는 (예컨대, 온화한 또는 엄격한 혼성화 조건 하에서) 본원에 기술된 유전자 산물에 특이적으로 혼성화할 수 있다. 올리고뉴클레오티드는 자연 발생적이거나 합성된 것일 수 있지만, 전형적으로는 합성적 수단에 의해 제조된다. 본원에 기술된 바와 같은 올리고뉴클레오티드는 DNA의 분절 또는 이들의 상보적 서열을 포함할 수 있다. 올리고뉴클레오티드의 정확한 크기는 다양한 요인 및 상기 올리고뉴클레오티드의 특별한 적용 및 사용에 따라 달라질 것이다. 프로브 및 프라이머를 포함하는, 올리고뉴클레오티드는 (표 1에 제공된 유전자로부터 발현되는 것들과 같은) 표적 유전자 산물의 3개 뉴클레오티드 내지 전장의 임의의 길이일 수 있고, 표적 유전자 산물의 3개 내지 전장의 연속된 핵산의 모든 가능한 개수를 명시적으로 포함한다. 따라서, 올리고뉴클레오티드는 5와 100 사이의 연속된 염기일 수 있고, 종종 5, 10, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25개 뉴클레오티드 내지 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 또는 100개 뉴클레오티드 범위이다. 5-10, 5-20, 10-20, 12-30, 15-30, 10-50, 20-50 또는 20-100개 염기 사이의 길이인 올리고뉴클레오티드가 일반적이다.
본 발명의 올리고뉴클레오티드는 RNA, DNA, 또는 이들의 어느 하나의 유도체일 수 있다. 이러한 올리고뉴클레오티드의 최소 크기는 올리고뉴클레오티드와 본 발명에 따른 핵산 분자 (예컨대, 발현된 유전자 산물 또는 증폭으로부터 얻어진 cDNA 또는 이의 카피) 상의 상보성 서열 사이에서 적당한 혼성화물의 형성에 요구되는 크기이다. 본 발명은 예를 들어 핵산 분자를 동정하기 위한 프로브 (예컨대, DNA 프로브) 또는 핵산 분자를 증폭하기 위한 프라이머로 사용될 수 있는 올리고뉴클레오티드를 포함한다.
일 실시양태에서, 올리고뉴클레오티드는, 정제된 제한효소 분해에서와 같이 자연 발생적이든 또는 합성적으로 생산된 것이든, 예컨대 올리고뉴클레오티드, 폴리뉴클레오티드 또는 핵산, RNA 또는 DNA의 어느 하나를 지칭하고, 상기 프로브에 상보적인 서열을 갖는 핵산에 어닐링 또는 특이적으로 혼성화할 수 있는 프로브일 수 있다. 프로브는 단일-가닥 또는 이중-가닥일 수 있다. 상기 프로브의 정확한 길이는 온도, 프로브의 공급원 및 방법의 사용을 비롯한 다양한 요인들에 따라 달라질 것이다. 예를 들어, 진단적 적용의 경우, 표적 서열의 복잡성에 따라서, 올리고뉴클레오티드 프로브가 더 적은 뉴클레오티드를 포함할 수 있다고 하더라도, 전형적으로 15-25개 이상의 뉴클레오티드를 포함한다. 특정 실시양태에서, 프로브는 5개와 100개 사이의 연속된 염기일 수 있고, 일반적으로 약 5, 10, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25개 뉴클레오티드 길이이거나, 약 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 또는 100개 뉴클레오티드 길이일 수 있다. 본원의 프로브는 특별한 표적 핵산 서열의 상이한 가닥에 상보적인 것으로 선택된다. 이는 상기 프로브가 미리 결정된 일련의 조건 하에서 그들 각자의 표적 가닥에 특이적으로 혼성화 또는 어닐링될 수 있도록 충분히 상보적이어야 함을 의미한다. 그러므로, 상기 프로브 서열이 표적의 정확한 상보성 서열을 반영할 필요는 없다. 예를 들어, 비-상보성 뉴클레오티드 단편이 프로브의 5' 또는 3' 말단에 부착될 수 있고, 상기 프로브 서열의 나머지는 표적 가닥에 상보적이다. 대안적으로, 프로브 서열이 그에 특이적으로 어닐링되는 표적 핵산 서열과 충분한 상보적을 갖는다면, 비-상보성 염기 또는 더 긴 서열이 상기 프로브 내로 점재 (intersperse)될 수 있다.
일 실시양태에서, 올리고뉴클레오티드는 RNA 또는 DNA, 단일-가닥 또는 이중-가닥, 생물계로부터 유래하거나, 제한효소 분해에 의해 생성되거나, 또는 합성적으로 생산되고, 적합한 환경에 놓일 때, 주형-의존 핵산 합성의 개시제로서 기능적으로 작용할 수 있는, 올리고뉴클레오티드를 지칭하는, 프라이머일 수 있다. 적당한 핵산 주형, 핵산의 적합한 뉴클레오시드 트리포스페이트 전구체, 중합효소, 적합한 보조인자 및 적합한 온도 및 Ph와 같은 조건과 함께 존재하는 경우, 상기 프라이머는 프라이머 신장 산물을 양산하기 위하여 중합효소의 작용에 의한 뉴클레오티드의 첨가 또는 유사한 활성에 의해 그의 3' 말단에서 신장될 수 있다. 상기 프라이머의 길이는 적용의 특별한 조건 및 요건에 따라서 달라질 수 있다. 예를 들어, 특정 적용에 있어서, 올리고뉴클레오티드 프라이머는 약 15-25개 또는 그 이상의 뉴클레오티드 길이이지만, 특정 실시양태에서는 5와 100개 사이의 연속적인 염기일 수 있고, 종종 약 5, 10, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25개 뉴클레오티드 길이이거나, 특정 실시양태에서는, 약 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 또는 100개 뉴클레오티드 길이일 수 있다. 상기 프라이머는 바람직한 신장 산물의 합성을 프라이밍하기 위해, 즉 중합효소 또는 유사한 효소에 의한 합성의 개시에 사용하기 위해 적합한 근접위치에서 프라이머의 3' 하이드록실 모이어티를 제공하기에 충분한 방식으로 바람직한 주형 가닥에 어닐링할 수 있도록, 바람직한 주형에 충분히 상보적이어야만 한다. 상기 프라이머 서열이 바람직한 주형의 정확한 상보적 서열을 나타낼 필요는 없다. 예를 들어, 비-상보성 뉴클레오티드 서열은 다른 상보성 프라이머의 5' 말단에 부착될 수 있다. 대안적으로, 상기 신장 산물의 합성을 위한 주형-프라이머 복합체를 기능적으로 제공하기 위해 상기 프라이머 서열이 바람직한 주형 가닥의 서열에 충분한 상보성을 갖는다면, 비-상보성 염기는 올리고뉴클레오티드 프라이머 서열 내에 점재될 수 있다.
특정의 실시양태에서, 유전자 산물의 발현을 측정하기 위한 시약은 2개, 3개 이상의 올리고뉴클레오티드의 세트를 포함하는데, 상기 세트의 각각의 올리고뉴클레오티드는 본원에 기술된 유전자 산물 또는 상기 유전자 산물의 상보성 가닥에 혼성화한다. 따라서, 예컨대 각각의 올리고뉴클레오티드는 mRNA 유전자 산물 및/또는 상기 mRNA로부터 생산된 cDNA의 하나 이상의 가닥에 혼성화할 수 있다. 일 실시양태에서, 한 세트의 올리고뉴클레오티드는 DNA 프로브를 포함한다. 특정 실시양태에서, 한 세트의 올리고뉴클레오티드는 적어도 2개의 증폭 프라이머 또는 PCR 프라이머를 포함하는데, 이들은 함께 표적 핵산 서열, 예컨대 mRNA 유전자 산물 또는 그 결과 cDNA의 적어도 일부를 증폭할 수 있다. 다른 실시양태에서, 상기 세트의 올리고뉴클레오티드 또는 DNA 프로브는 고체상 어레이, 염색체/DNA 마이크로어레이, 또는 마이크로-비드 어레이와 같은 어레이 상에 제공될 수 있다. 어레이 기술은 당해 분야에 잘 알려져 있고 본원에 기술된다.
정의된 서열 및 화학적 구조의 올리고뉴클레오티드는 화학적 또는 생화학적 합성에 의해서와 같이 통상의 기술자에게 공지된 기술에 의해서, 그리고 세균 또는 바이러스 벡터와 같은 재조합 핵산 분자로부터 시험관 내 또는 생체 내 발현에 의해 생산될 수 있다. 특정 실시양태에서, 올리고뉴클레오티드는 야생형 염색체 DNA 또는 이의 생체 내 전사 산물만으로 이루어지지 않는다.
특정 실시양태에서, 본 발명은 본원에 기술된 유전자 또는 폴리뉴클레오티드 유전자 산물, 예컨대 mRNA와 동일하거나 상보적인 서열의 연속적 서열의 다양한 길이를 포함하는 프라이머 또는 프로브와 같은 단리된 폴리뉴클레오티드를 제공한다.
올리고뉴클레오티드, 프로브 또는 프라이머는, 주어진 변형이 주어진 올리고뉴클레오티드의 바람직한 기능과 호환되는 한, 임의의 방식으로 변형될 수 있다. 통상의 기술자는 주어진 변형이 본 발명에 따른 임의의 주어진 올리고뉴클레오티드에 대해 적합하거나 바람직한지 여부를 용이하게 결정할 수 있다.
올리고뉴클레오티드의 설계 및 서열은, 본원에 기술된 바와 같은 이들의 기능에 좌우된다고 하더라도, 여러 변수가 일반적으로 고려된다. 이들 중에서 길이, 융점 (Tm), 특이성, 시스템 내에서 다른 올리고뉴클레오티드와의 상보성, G/C 함량, 폴리피리미딘 (T, C) 또는 폴리퓨린 (A, G) 신장, 및 3-말단 서열이 가장 관련이 있다. 이들 및 다른 변수의 제어는 올리고뉴클레오티드 설계의 측면에서 표준이고 잘 알려져 있으며, 다양한 컴퓨터 프로그램이 최적의 하나를 위해 수많은 가능한 올리고뉴클레오티드를 스크리닝하는데 용이하게 이용 가능하다.
통상의 기술자에게 인식될 것과 같이, 폴리뉴클레오티드는 단일-가닥 (코딩 또는 안티센스) 또는 이중-가닥일 수 있고, DNA (게놈, cDNA 또는 합성) 또는 RNA 분자일 수 있다. 부가적인 코딩 또는 비-코딩 서열이, 필요하진 않지만, 본 발명의 폴리뉴클레오티드 내에 존재할 수 있고, 폴리뉴클레오티드가, 필요하진 않지만, 다른 분자 및/또는 지지 물질에 연결될 수 있다.
본 발명은, 이로 제한되는 것은 아니지만, PCR, RT-PCR 및 실시간 PCT을 포함하는, 본원에 기술된 임의의 어세이를 수행하기에 적합한 조건 하에서 표적 유전자 산물에 특이적으로 결합하는 올리고뉴클레오티드의 사용을 포함한다. 적한합 조건은 당해 분야에 잘 알려져 있고 PCR 기계 및 시약의 소매업자에 의해 제공되는 지시에 따라서 수행되는 표준 반응에 사용되는 것들을 포함한다. 특정 실시양태에서, 본 발명은 하기에 기술된 엄격한 조건 하에서, 참고 뉴클레오티드 서열 (예컨대, 표적 유전자 산물) 또는 이들의 상보적 서열에 혼성화하는, 올리고뉴클레오티드를 비롯한 폴리뉴클레오티드를 고려한다. 본원에 사용된 바와 같이, 용어 "낮은 엄격, 중간 엄격, 높은 엄격, 또는 매우 높은 엄격한 조건 하의 혼성화"는 혼성화 및 세척을 위한 조건을 기술한다. 혼성화 반응을 수행하기 위한 가이드라인은 문헌 [Ausubel et al ., 1998, 상동, 섹션 6.3.1-6.3.6]에서 확인할 수 있다. 수성 및 비-수성 방법이 상기 참고에 기술되며 이들 중 하나가 사용될 수 있다.
본원에서 낮은 엄격한 조건에 대한 참고가 포함되고 42℃에서의 혼성화를 위한 적어도 약 1% v/v 내지 적어도 약 15% v/v의 포름아마이드 및 적어도 약 1 M 내지 적어도 약 2 M의 염과, 42℃에서의 세척을 위한 적어도 약 1 M 내지 적어도 약 2 M의 염을 포함한다. 낮은 엄격한 조건은 또한 65℃에서의 혼성화를 위한 1% 소 혈청 알부민 (BSA), 1 mM EDTA, 0.5 M NaHPO4 (pH 7.2), 7% SDS, 및 실온에서의 세척을 위한 (i) 2×SSC, 0.1% SDS; 또는 (ii) 0.5% BSA, 1 mM EDTA, 40 mM NaHPO4 (pH 7.2), 5% SDS를 포함할 수 있다. 낮은 엄격한 조건의 일 실시양태는 약 45℃에서 6×염화나트륨/구연산나트륨 (SSC) 중의 혼성화에 이어서, 적어도 50℃에서 0.2×SSC, 0.1% SDS 중의 2회 세척을 포함한다 (세척 온도는 낮은 엄격한 조건의 경우 55℃로 증가될 수 있다).
중간 엄격한 조건은 42℃에서의 혼성화를 위한 적어도 약 16% v/v 내지 적어도 약 30% v/v의 포름아마이드 및 적어도 약 0.5 M 내지 적어도 약 0.9 M의 염과, 55℃에서의 세척을 위한 적어도 약 0.1 M 내지 적어도 약 0.2 M의 염을 포함한다. 중간의 엄격한 조건은 또한 65℃에서의 혼성화를 위한 1% 소 혈청 알부민 (BSA), 1 mM EDTA, 0.5 M NaHPO4 (pH 7.2), 7% SDS와, 60-65℃에서의 세척을 위한 (i) 2×SSC, 0.1% SDS; 또는 (ii) 0.5% BSA, 1 mM EDTA, 40 mM NaHPO4 (pH 7.2), 5% SDS를 포함할 수 있다. 중간 엄격한 조건의 일 실시양태는 약 45℃에서 6×SSC 중의 혼성화에 이어서, 60℃에서 0.2×SSC, 0.1% SDS 중의 1회 이상의 세척을 포함한다. 높은 엄격한 조건은 42℃에서의 혼성화를 위한 적어도 약 31% v/v 내지 적어도 약 50% v/v의 포름아마이드 및 약 0.01 M 내지 약 0.15 M의 염과, 55℃에서의 세척을 위한 약 0.01 M 내지 약 0.02 M의 염을 포함한다.
높은 엄격한 조건은 또한 65℃에서의 혼성화를 위한 1% BSA, 1 mM EDTA, 0.5 M NaHPO4 (pH 7.2), 7% SDS와, 65℃를 초과하는 온도에서의 세척을 위한 (i) 0.2×SSC, 0.1% SDS; 또는 (ii) 0.5% BSA, 1 mM EDTA, 40 mM NaHPO4 (pH 7.2), 1% SDS를 포함할 수 있다. 높은 엄격한 조건의 일 실시양태는 약 45℃에서 6×SSC 중의 혼성화에 이어서 65℃에서 0.2×SSC, 0.1% SDS 중의 1회 이상의 세척을 포함한다. 매우 높은 엄격한 조건의 일 실시양태는 65℃에서 0.5 M 인산나트륨, 7% SDS 중의 혼성화에 이어서, 65℃에서 0.2×SSC, 1% SDS 중의 1회 이상의 세척을 포함한다.
기타 엄격한 조건은 당해 분야에 잘 알려져 있으며 통상의 기술자는 혼성화의 특이성을 최적화하기 위해 다양한 요인들이 조작될 수 있음을 인식할 것이다. 최종 세척의 엄격성의 최적화는 높은 수준의 혼성화를 보장하기 위해 제공될 수 있다. 구체적인 예시를 위하여, 문헌 [Ausubel et al., 상동, 2.10.1 내지 2.10.16 페이지 및 Sambrook et al. (1989, 상동) 섹션 1.101 내지 1.104]을 참고한다.
엄격한 세척이 약 42℃ 내지 68℃의 온도에서 전형적으로 수행된다고 하더라도, 통상의 기술자는 기타 온도가 엄격한 조건에 적합할 수 있음을 인식할 것이다. 최대 혼성화 비율은 전형적으로 DNA-DNA 혼성화물의 형성을 위한 Tm 이하의 약 20℃ 내지 25℃에서 일어난다. Tm이 융점, 또는 2개의 상보성 폴리뉴클레오티드 서열이 해리되는 온도임은 당해 분야에 잘 알려져 있다. Tm을 평가하는 방법은 당해 분야에 잘 알려져 있다 (문헌 [Ausubel et al., 상동, 2.10.8 페이지]을 참고한다).
일반적으로, DNA의 완벽하게 짝지워진 이중체는 하기 식에 의해 근사치로서 예측될 수 있다:
Tm = 81.5 + 16.6 (log10 M) + 0.41 (%G+C) - 0.63 (% 포름아마이드) - (600/길이)
상기에서: M은 바람직하게는 0.01 몰 내지 0.4 몰 범위의 Na+의 농도이고; %G+C는 30% 및 75% G+C 사이의 범위 내에서 염기의 총 개수의 비율로서 구아노신과 시토신 염기의 합이고; % 포름아아미드는 부피 기준 포름아마이드 농도 퍼센트이고; 길이는 DNA 이중체 내 염기 쌍의 개수이다. 이중체 DNA의 Tm은 무작위적으로 잘못 짝지워진 염기 쌍이 1% 증가할 때마다 대략 1℃씩 감소한다. 세척은 일반적으로 높은 엄격성의 경우 Tm-15℃에서, 또는 중간 엄격성의 경우 Tm-30℃에서 수행된다.
본 발명의 올리고뉴클레오티드, 프라이머 및 프로브는 표적 유전자 또는 mRNA 서열의 폴리뉴클레오티드 변이체, 또는 이들의 상보적 서열인 영역을 포함하거나 이들로 이루어질 수 있다. 구체적인 실시양태에서, 올리고뉴클레오티드는 표적 유전자 또는 mRNA 서열의 영역 또는 이들의 상보적 서열에 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 서열을 포함하거나 이들로 이루어질 수 있다.
프라이머 또는 프로브로 사용하기 위한 올리고뉴클레오티드는 당해 분야에 공지된 소프트웨어를 이용하여 선택될 수 있다. 예를 들어, OLIGO 4.06 소프트웨어는 최대 100개 뉴클레오티드 각각의 PCR 프라이머 쌍의 선택, 및 최대 32 kb의 입력 폴리뉴클레오티드 서열로부터 최대 5,000개 뉴클레오티드의 올리고뉴클레오티드 및 더 큰 폴리뉴클레오티드의 분석에 유용하다. 유사한 프라이머 선택 프로그램은 확장된 능력에 대해 도입된 부가적인 특징을 갖는다. 예를 들어, PrimOU 프라이머 선택 프로그램 (텍사스 달라스 소재의 University of Texas South West Medical Center의 Genome Center로부터 공중에 이용가능함)은 메가염기 서열로부터 특이적 프라이머를 선택할 수 있고 그로써 전장 유전체 (genome-wide) 상에서 프라이머를 고안하는데 유용하다. Primer3 프라이머 선택 프로그램 (메사추세츠주 캠브리지 소재의 Whitehead Institute/MIT Center for Genome Research로부터 공중에 이용가능함)은 사용자가, 프라이머 결합 부위로 회피하기 위한 서열을 사용자 지정되는, "미스프라이밍 라이브러리 (mispriming library)"를 입력하는 것을 가능케 한다. Primer3은 특히 마이크로어레이용 올리고뉴클레오티드의 선택에 유용하다. (후자의 2개 프라이머 선택 프로그램의 소스 코드는 또한 각각의 개별적 공급원으로부터 입수되어 사용자의 특정 요구를 충족하도록 변형될 수 있다) PrimeGen 프로그램 (영국 캠브리지 소재의 UK Human Genome Mapping Project Resource Centre로부터 공중에 이용가능함)은 다중 서열 정렬을 근거로 프라이머를 고안하고, 그로 인해 정렬된 핵산 서열의 가장 보존되거나 적어도 보존된 영역에 혼성화하는 프라이머의 선택을 가능케 한다. 따라서, 이 프로그램은 특유하고 보존적인 올리고뉴클레오티드 및 폴리뉴클레오티드 단편 모두의 동정에 유용하다. 올리고뉴클레오티드 선택 방법은 본원에 기술된 것들로 제한되지 않는다.
특정 실시양태에서, 올리고뉴클레오티드는 상기에 언급되고, 하기에 혼합물 또는 비하전되고 양이온 골격 연결을 갖는 올리고뉴클레오티드의 합성과 관련하여 언급된 참고에 상세히 기술된 방법을 이용하는, 단계적 고체상 합성에 의해 제조될 수 있다. 일부 사례에서, 예컨대 약물동력학을 증가시키거나 화합물의 포획 또는 검출을 용이하게 하기 위해서, 올리고뉴클레오티드에 대한 부가적인 화학적 모이어티를 첨가하는 것이 바람직할 수 있다. 이러한 모이어티는 표준 합성 방법에 따라서, 전형적으로 올리고머의 말단에 공유적으로 부착될 수 있다. 예를 들어, 폴리에틸렌글리콜 모이어티 또는 기타 친수성 중합체, 예컨대 10-100개 단량체 서브유닛을 갖는 중합체의 부가는 용해도를 증강시키는데 유용할 수 있다. 하나 이상의 하전된 기, 예컨대 유기산과 같은 음이온으로 하전된 기는 세포 흡수를 증강시킬 수 있다.
방사성 동위원소, 형광단, 염료, 효소, 나노입자, 화학발광 마커, 바이오틴, 또는 직접적으로 (예컨대, 광 방출에 의해) 또는 간접적으로 (예컨대, 형광-표지된 항체의 결합에 의해) 검출될 수 있는 당해 분야에 공지된 기타 단량체와 같은, 다양한 검출가능한 분자가 올리고뉴클레오티드, 또는 단백질을 검출가능하게 만드는데 (즉, 검출가능하게 표지됨) 사용될 수 있다.
방사성 동위원소는 본 발명의 특정 측면에서 사용될 수 있는 검출가능한 분자의 예시를 제공한다. 예를 들어, 32P, 33P, 35S, 3H, 및 125I를 포함하는 여러 방사성 동위원소가 뉴클레오티드 또는 단백질을 표지하기 위한 검출가능한 분자로 사용될 수 있다. 이들 방사성 동위원소는 상이한 반감기, 소멸 유형, 및 구체적인 프로토콜의 요구를 충족시키도록 적응될 수 있는 에너지 수준을 갖는다. 예를 들어, 3H은 낮은 배경 수준을 초래하는 낮은 에너지 방사체이지만, 이러한 낮은 에너지는 또한 자가방사선술을 위한 긴 기간을 초래한다. 방사능 표지된 리보뉴클레오티드, 데옥시리보뉴클레오티드 및 아미노산이 화학적으로 이용가능하다. 제1, 또는 α, 인산기에, 또는 제3, 또는 γ, 인산기에 방사능 표지된 뉴클레오티드가 이용가능하다. 예를 들어, [α-32P] dATP 및 [γ-32P] dATP 모두가 상업적으로 이용가능하다. 또한, 방사능 표지된 뉴클레오티드에 대한 상이한 특이적 활성이 또한 상업적으로 이용가능하고 상이한 프로토콜을 위해 적응될 수 있다.
올리고뉴클레오티드를 검출하는데 사용될 수 있는 검출가능한 분자의 기타 예시에는 형광단이 포함된다. 예를 들어, 플루오르세인, 테트라메틸로다민, 텍사스 레드, 및 다수의 기타 (예컨대, 문헌 [Haugland, Handbook of Fluorescent Probes - 9th Ed., 2002, Molec. Probes, Inc., Eugene OR; Haugland, The Handbook: A Guide to Fluorescent Probes and Labeling Technologies-10th Ed., 2005, Invitrogen, Carlsbad, CA])를 포함하는, 여러 형광단이 뉴클레오티드를 표지하기 위해 사용될 수 있다.
일례로서, 뉴클레오티드 합성 동안 아민 또는 티올의 도입이 형광단의 부가를 허용하기 때문에 올리고뉴클레오티드는 화학적 합성 동안에 형광적으로 표지될 수 있다. 형광 표지된 뉴클레오티드는 상업적으로 이용가능하다. 예를 들어, 스펙트럼을 포함하는 10개의 상이한 형광단에 접합된 유리딘 및 데옥시유리딘 트리포스페이트가 이용가능하다. 직접적으로 뉴클레오티드에 결합하는 형광염료가 또한 검출가능한 분자로서 이용될 수 있다. 예를 들어, FAM, JOE, TAMRA, 및 ROX는 뉴클레오티드에 부착되어 있고 자동화 DNA 서열분석에 사용되는 아민 반응성 형광 염료이다. 이들 형광 표지된 뉴클레오티드, 예를 들어, ROX-ddATP, ROX-ddCTP, ROX-ddGTP 및 ROX-ddUTP는 상업적으로 이용가능하다.
비-방사능 및 비-형광 검출가능한 분자가 또한 이용가능하다. 상기에 언급된 바와 같이, 바이오틴은 뉴클레오티드에 직접적으로 부착될 수 있고 효소 촉매 비색계 반응 (예컨대, 포스파타제, 루시퍼라제, 또는 퍼옥시다제)에 화학적으로 결합되어 있는 아비딘 또는 스트렙타비딘에의 특이적 및 고 친화성 결합에 의해 검출된다. 디옥시게닌 표지된 뉴클레오티드가 또한 유사하게 핵산의 비-동위원소 검출에 사용될 수 있다. 바이오틴화되고 딕옥시게닌-표지된 뉴클레오티드가 상업적으로 이용가능하다.
나노입자로 명명된, 매우 작은 입자가 또한 올리고뉴클레오티드 프로브를 표지하기 위해 사용될 수 있다. 이들 입자는 1-1000 nm 크기의 범위이고 금 및 은 입자 및 양자점과 같은 다양한 화학적 구조를 포함한다. 각을 이루며 입사하는 백색광으로 조사될 때, 40-120 nm 범위의 은 또는 금 나노입자는 고강도로 단색 광 (monochromatic light)을 산란시킬 것이다. 분산된 광의 파장은 상기 입자의 크기에 좌우된다. 근접한 상태에서 4 내지 5개의 상이한 입자들은 서로 단색광을 산란시킬 것이고, 중첩될 때 특이적인, 고유의 색깔을 제공할 것이다. 상기 입자는 게니콘 사이언스사 (Genicon Sciences, Carlsbad, CA)와 같은 회사들에 의해 제작되고 있다. 유도체화된 은 또는 금 입자는 단백질, 항체, 소분자, 수용체 리간드, 및 핵산을 포함하는, 광범위한 분야의 분자에 부착될 수 있다. 예를 들어, 상기 입자의 표면은 뉴클레오티드에 대한 부착을 허용하도록 화학적으로 유도체화될 수 있다.
검출가능한 분자의 검출에 사용될 수 있는 나노입자의 기타 유형에 양자점이 포함된다. 양자점은 넓은 범위의 파장에 걸쳐서 빛에 의해 여기될 수 있는 1-5 nm 직경의 형광 결정이다. 적합한 파장을 갖는 빛에 의한 여기 시, 이들 결정은 이들의 화학적 조성 및 크기에 의존적인 파장을 갖는, 단색광과 같은 빛을 발산한다. CdSe, ZnSe, InP, 또는 InAs와 같은 양자점은 고유의 광학 특성을 보유하는데; 이들 및 유사한 양자점은 다수의 상업적 공급원으로부터 이용가능하다 (예컨대, NN-Labs, Fayetteville, AR; Ocean Nanotech, Fayetteville, AR; Nanoco Technologies, Manchester, UK; Sigma-Aldrich, St. Louis, MO).
특정의 실시양태에서, 올리고뉴클레오티드 프라이머 또는 프로브는 하나 이상의 광-방출 또는 다른 검출가능한 염료로 표지될 수 있다. 상기 염료에 의해 방출된 빛은 가시광선 또는 비가시광선, 예컨대 자외선 또는 적외선일 수 있다. 예시적 실시양태에서, 상기 염료는 형광 공명 에너지 전이 (FRET) 염료; 플루오르세인 및 로다민과 같은 크산텐 염료; 알파 또는 베타 위치에서 아미노기를 갖는 염료 (예컨대, 나프틸아민 염료, 1-다이메틸아미노나프틸-5-설포네이트, 1-아닐리노-8-나프탈렌데 설포네이트 및 2-p-토우이디닐-6-나프탈렌 설포네이트); 3-페닐-7-이소시아나토쿠마린을 갖는 염료; 9-이소티오시아나토아크리딘 및 아크리딘 오렌지와 같은 아크리딘; 피렌, 벤속사디아졸 및 스틸벤; 3-(ε-카르복시펜틸)-3'-에틸-5,5'-다이메틸옥사카르보시아닌 (CYA)을 갖는 염료; 6-카르복시 플루오르세인 (FAM); 5&6-카르복시로다민-110 (R110); 6-카르복시로다민-6G (R6G); N,N,N',N'-테트라메틸-6-카르복시로다민 (TAMRA); 6-카르복시-X-로다민 (ROX); 6-카르복시-4',5'-다이클로로-2',7'-다이메톡시플로오르세인 (JOE); 알렉사 플루오르 (ALEXA FLUOR™); Cy2; 텍사스 레드 및 로다민 레드; 6-카르복시-2',4,7,7'-테트라클로로플루오르세인 (TET); 6-카르복시-2',4,4',5',7,7'-렉사클로로플루오르세인 (HEX); 5-카르복시-2',4',5',7'-테트라클로로플루오르세인 (ZOE); NAN; NED; Cy3; Cy3.5; Cy5; Cy5.5; Cy7; 및 Cy7.5; IR800CW, ICG, 알렉사 플루오르 350; 알렉사 플루오르 488; 알렉사 플루오르 532; 알렉사 플루오르 546; 알렉사 플루오르 568; 알렉사 플루오르 594; 알렉사 플루오르 647; 알렉사 플루오르 680, 또는 알렉사 플루오르 750일 수 있다.
따라서, 특정 실시양태는 a) 상기 시료를 시료 내 표적 폴리뉴클레오티드 유전자 산물에 상보적인 서열을 포함하는 프로브와 상기 프로브와 상기 표적 폴리뉴클레오티드 유전자 산물 또는 그의 단편 사이에 혼성화 복합체가 형성되는 조건 하에서 혼성화하는 단계, 및 b) 상기 혼성화 복합체의 존재 또는 부재를 검출하고, 만약 존재한다면, 그의 양을 검출하는 단계를 포함하는, 시료 내 표적 폴리뉴클레오티드 유전자 산물을 검출하는 방법을 포함한다. a) 표적 폴리뉴클레오티드 유전자 산물 또는 이의 단편을 증폭하는 단계, 및 b) 상기 증폭된 표적 폴리뉴클레오티드 유전자 산물 또는 이의 단편의 존재 또는 부재를 검출하고, 만약 존재한다면, 이의 양을 검출하는 단계를 포함하는, 시료 내 표적 폴리뉴클레오티드 유전자 산물을 검출하는 방법이 또한 포함된다.
유전자 산물 발현 수준의 분석
특정 실시양태에 따르면, 본 발명의 방법 및 키트는, 이로 제한되는 것은 아니지만, 본원에 기술된 유전자 산물의 임의의 특정 조합을 포함하는, 표 1에 나타난 2개 이상의 유전자에 의해 발현된 유전자 산물의 발현 수준을 토대로 개체가 갑상선암에 걸렸는지 또는 갑상선 종양 또는 결절이 양성인지 여부를 결정하는데 사용될 수 있다. 일반적으로, 발현 양상이 정상 또는 비-암성 갑상선 조직으로부터 수득된 생물학적 시료에서 관찰된 발현 양상보다 암성 갑상선 조직으로부터 수득된 생물학적 시료에서 관찰된 발현 양상과 더 밀접하게 상관이 있는 것으로 결정되는 경우 갑상선암으로 결정된다. 유사하게, 발현 양상이 암성 갑상선 조직으로부터 수득된 생물학적 시료에서 관찰된 발현 양상보다 정상 또는 비-암성 갑상선 조직으로부터 수득된 생물학적 시료에서 관찰된 발현 양상과 더 밀접하게 상관이 있는 것으로 결정되는 경우 일반적으로 갑상선 조직 시료는 양성으로 결정된다.
특정 사례에서, 갑상선암의 존재는 본원에 기술된 하나 이상의 유전자 산물의 발현 수준을 적합한 대조군과 비교함으로써 진단된다. "적합한 대조군" 또는 "적절한 대조군"에는 참고 값, 예를 들어, 정상 소질, 예컨대 갑상선암과 같은 상태의 부재를 나타내는, 대조군 또는 정상 세포, 조직 또는 유기체와 같은, 세포 또는 조직 또는 유기체의 기타 생물학적 시료에 대해 결정된 발현 수준, 특징, 특질, 또는 특성을 포함한다. 특정 실시양태에서, "적합한 대조군" 또는 "적절한 대조군"은 미리 정의된 값, 수준, 특징, 특질, 또는 특성이다.
특정 실시양태에서, 생물학적 시료에서 하나 이상의 유전자 산물의 발현은 상기 유전자 산물의 참고 발현 수준과 비교되고, 이는 특정 실시양태에서 미리 결정되거나 미리 정의된 값일 수 있다. 참고 발현 수준은 하나 이상의 적합한 대조군 시료에서 유전자 산물의 발현 수준을 토대로 결정될 수 있고, 이는 정상 조직 시료 또는 종양, 예컨대 갑상선 종양 조직 시료 중 어느 하나일 수 있다. 예를 들어, 특정 실시양태에서, 정상 조직과 관련된 참고 발현 수준은 정상, 비-암성 조직, 예컨대 정상 갑상선 조직으로부터 수득된 1, 2, 3, 5, 10, 20, 50개 또는 그 이상의 생물학적 시료에서 유전자 산물의 발현 수준을 토대로 결정된다. 다른 실시양태에서, 갑상선암과 같은 암 조직과 관련된 참고 발현 수준은 갑상선암 조직과 같은 암 조직으로부터 수득된 1, 2, 3, 5, 10, 20, 50개, 또는 그 이상의 생물학적 시료에서 유전자 산물의 발현 수준을 토대로 결정된다. 특정 실시양태에서, 정상 및 암 조직 중 어느 하나 또는 이들 모두에서의 참고 발현 수준은 표 1의 유전자, 또는 CXCR3, CCR3, CXCL10, CAR, XB130, HO-1 및 CCR7 유전자로부터 선택된 적어도 하나, 적어도 2개, 또는 적어도 3개의 유전자에 의해 발현된 하나 이상의, 2개 이상의, 또는 3개 이상의 유전자 산물에 대해 측정된다. 관련 실시양태에서, 정상 및 암 조직 중 어느 하나 또는 이들 모두에서의 참고 발현 수준은 본원에 기술된 유전자 산물의 임의의 세트, 예컨대: CCR3, TIMP-1, CAR 및 XB130 유전자의 유전자 산물; CXCL10, TIMP-1, CAR 및 CCR7 유전자의 유전자 산물; TIMP-1, CAR 및 CCR7 유전자의 유전자 산물; 또는 CXCL10, TIMP-1, CLDN-1, 및 CCR7 유전자의 유전자 산물을 포함하거나 이들로 이루어진 유전자 세트에 대해 측정된다.
구체적인 실시양태에서, 정상 (비-암성) 대조군 시료 또는 대조군 참고에서의 발현에 비해 생물학적 시료에서 유전자 산물의 하나 이상의, 2개 이상의, 또는 3개 이상의 차등 발현은 암을 지시한다. 반대로, 정상 (비-암성) 대조군 시료 또는 대조군 참고에서의 발현에 비해 생물학적 시료에서 유전자 산물의 하나 이상의, 2개 이상의, 또는 3개 이상의 실질적으로 유사한 발현은 양성 조직을 지시하는 반면, 암 대조군 시료 또는 암 대조군 참고에서의 발현에 비해 생물학적 시료에서 유전자 산물의 하나, 2개 이상의 실질적으로 유사한 발현은 암을 지시한다.
차등 발현은 적절한 대조군에서 동일한 유전자 산물의 발현 수준에 비해 유전자 산물의 하나 이상의 발현 수준에서 통계적으로 유의미한 차이를 포함한다. 통계적으로 유의미한 차이는 RNA 수준, 단백질 수준, 단백질 기능, 또는 본원에 기술된 것들과 같은 유전자 발현의 임의의 기타 관련 측정에 의해 측정되는 바와 같은 발현 수준에 있어서의 증가 또는 감소의 어느 하나와 관련될 수 있다. 만약 우연히 야기되었을 것 같지 않다면, 결과는 전형적으로 통계적으로 유의미한 것으로 언급된다. 검사 또는 결과의 유의미한 수준은 전통적으로 빈도주의적 통계학적 검증 개념 (frequentist statistical hypothesis testing concept)과 관련이 있다. 단순한 경우에, 통계적 유의성은 귀무가설 (null hypothesis)이 실제로 진실일 때 그 귀무가설을 거부하는 결정을 내리는 확률로 정의될 수 있다 (타입 I 오류, 또는 "위양성 결정"으로 알려진 결정). 이 결정은 종종 p-값을 사용하여 이루어지는데: 만약 p-값이 유의미한 수준 미만이라면, 상기 귀무가설은 거부된다. p-값이 더 작을수록, 그 결과는 더 유의미하다. 베이즈 요인 (Bayes factors)이 또한 통계적 유의성을 결정하기 위해 이용될 수 있다 (예컨대 문헌 [Goodman S., Ann Intern Med 130:1005-13, 1999] 참조). 특정 사례에서, 검사 또는 결과의 유의미한 수준은, 귀무가설이 실제로 참인 경우 그 귀무가설을 거부하는 결정을 내리는 확률이 언급된 확률 이하인 분석을 반영할 수 있다. 이러한 유형의 분석은 거부를 결정할 확률이 귀무가설 내에 포함된 가정의 일부 세트에 대한 유의미한 수준보다 훨씬 더 적을 수 있는 그러한 적용에 대해 가능하다.
특정 예시적인 실시양태에서, 통계적으로 유의미한 차등 발현은 적절한 대조군에 비해 생물학적 시료에서 주어진 유전자 산물의 발현 수준이 발현에 있어, 모든 정수 및 사이의 소수점을 포함하는 (예컨대, 1.24X, 1.25X, 2.1X, 2.5X, 60.0X, 75.0X, 등), 적어도 약 1.2X, 1.3X, 1.4X, 1.5X, 1.6X, 1.7X, 1.8X, 1.9X, 2.0X, 2.2X, 2.4X, 2.6X, 2,8X, 3.0X, 4.0X, 5.0X, 6.0X, 7.0X, 8.0X, 9.0X, 10.0X, 15.0X, 20.0X, 50.0X, 100.0X, 또는 그 이상의 차이인 상황을 포함할 수 있다 (즉, 더 높거나 더 낮은 발현일 수 있는 차등 발현). 특정 실시양태에서, 통계적으로 유의미한 차등 발현은, 주어진 유전자 산물의 발현 수준이 적절한 대조군에 비해 생물학적 시료에서, 모든 정수 및 사이의 소수점을 포함하는, 적어도 약 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 퍼센트 (%) 또는 그 이상의 차이인 상황을 포함할 수 있다.
부가적인 예시로서, 차등 발현은 또한 당해 분야에 알려진 바와 같이, Z-검사, 즉 절대 Z 점수를 계산함으로써 측정될 수 있다. Z-검사는 전형적으로 시료 평균 및 집단 평균 사이의 유의미한 차이를 동정하기 위해 이용된다. 예를 들어, 표준 정상 테이블 (예컨대, 대조군 조직)에 비해, 95% 신뢰 구간에서 (즉, 5% 유의미한 수준에서), 1.96 초과의 절대값을 갖는 Z-점수는 비-무작위성 (non-randomness)을 나타낸다. 99% 신뢰 구간의 경우, 절대 Z가 2.58을 초과한다면, 이는 p<.01을 의미하고, 차이는 더욱 더 유의미하며 - 귀무가설은 더 큰 신뢰를 가지고 거부될 수 있다. 이들 및 관련 실시양태에서, 모든 정수 및 사이의 소수점 (예컨대, 10.1, 10.6, 11.2, 등)을 포함하는, 1.96, 2, 2.58, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 또는 그 이상의 절대 Z-점수는 통계적 유의성의 강력한 측정을 제공할 수 있다. 특정 실시양태에서, 6 초과의 절대 Z-점수는 예외적으로 높은 통계적 유의성을 제공할 수 있다.
실질적으로 유사한 것은 일반적으로 생물학적 시료와 참고 대조군 사이의 발현 수준에 있어서 통계적으로 유의미한 차이의 결여와 관련된다. 실질적으로 유사한 발현 수준의 예시는 주어진 유전자 산물의 발현 수준이, 모든 정수 및 사이의 소수점 (예컨대, 0.15X, 0.25X, 0.35X, 등)을 포함하는, 참고 시료에 비해 생물학적 시료에서의 발현에 있어 약 0.05X, 0.1X, 0.2X, 0.3X, 0.4X, 0.5X, 0.6X, 0.7X, 0.8X, 0.9X, 1.0X, 1.1X, 1.2X, 1.3X, 또는 1.4X 미만의 차이를 제공하는 상황 (즉, 더 높거나 더 낮은 발현일 수 있는 차등 발현)을 포함할 수 있다. 특정 실시양태에서, 차등 발현은 주어진 유전자 산물의 발현 수준이, 모든 정수 및 사이의 소수점을 포함하는, 참고 시료에 비해 생물학적 시료에서의 발현에 있어 약 0.25. 0.5, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50 퍼센트 (%) 미만의 차이를 제공하는 상황 (즉, 더 높거나 더 낮은 발현일 수 있는 차등 발현)을 포함할 수 있다.
차등 발현은 대조군 시료 또는 값에 비해 주어진 유전자 산물의 발현에 있어서의 증가 또는 감소를 지칭할 수 있다. 본원에 기술된 방법의 구체적인 실시양태에서, 정상 대조군 시료 또는 값에서 발현 수준에 비해 생물학적 시료에서 CCR3, CXCL10, CK19, TIMP1, CLDN1, CCR7 및 HO-1 유전자의 하나 이상, 2개 이상, 3개 이상, 또는 4개 이상 유전자 산물의 발현에 있어서의 증가 및/또는 CXCR3, CAR 및 XB130 유전자의 하나 이상의, 2개 이상의, 3개 이상의 유전자 산물의 발현에 있어서의 감소, 또는 본원에 기술된 유전자 산물의 임의의 다양한 서브세트에서의 상응하는 변화는 종양 또는 암의 존재를 지시한다. 상기 증가 또는 감소는, 예컨대 약 10, 20, 50, 100, 200, 500, 또는 1000%의 증가 또는 약 10, 20, 50, 또는 90%의 감소와 같은 상기에 언급된 발현에 있어서의 임의의 차이에 상응할 수 있다.
상기에 언급된 바와 같이, 구체적인 실시양태에서 생물학적 시료가 암 조직을 포함하는지 아닌지의 결정은 하나 이상의 유전자 산물의 발현 수준을 암의 존재 또는 부재와 상관시키는 것을 포함한다. 이는 생물학적 시료에서 유전자 산물의 발현 수준을, 암에 걸린 것으로 알려지거나 암에 걸리지 않은 것으로 알려진 개체로부터 수득된 시료와 같은 하나 이상의 대조군 시료에서의 발현 수준과 비교함으로써 달성될 수 있다. 특정 실시양태에서, 상기 상관 또는 비교는, 미리 정의되거나 미리 결정된 참고 값과 같이, 초기 시점에 대조군 시료로부터 수득된 유전자 발현 테이터를 사용하여 수행될 수 있다.
본원에 기술된 바와 같이, 본 발명의 방법은 당해 분야에 공지된 임의의 수많은 방법을 이용하여, 하나 이상의 유전자 산물의 발현 수준을 정성적으로 또는 정량적으로 측정하는데 사용될 수 있다. 일부 사례에서, 검출가능한 프로브의 혼성화의 정도는 생물학적 시료 내 유전자 산물의 양과 직접적으로 관련이 있다. 소프트웨어가 프로브로부터 신호를 추출하고, 정상화하고, 요약하고, 분석하는데 이용될 수 있다. 일부 실시양태에서, 생물학적 시료에 대해 결정된 주어진 프로브의 신호 강도는, 차등 발현이 시료 내에서 일어나는지 여부를 결정하기 위해 참고 세트에 대해 비교될 수 있다. 예를 들어, 마이크로어레이 상황에서, 발현된 유전자 산물에 상응하는 어레이 상의 위치에서 상대적 강도의 증가 또는 감소는 생물학적 시료에서 상응하는 유전자 발현 각각의 증가 또는 감소일 수 있다.
유전자 발현 분석 및 암 또는 양성 표현형과의 상관관계는 분류자 또는 알고리즘, 예컨대 데이터의 신뢰성을 표준화하고 개선하도록 고안된 알고리즘을 이용하여 수행될 수 있다. 사용될 수 있는 알고리즘에는 본원에 기술된 임의의 것들, 예컨대 실시예 2 및 3에 기술된 분류자 또는 알고리즘이 포함된다. 특정 실시양태에서, 유전자 산물은 mRNA이고, 이는 예컨대 실시예 1에 기술된 바와 같이, 실시간 PCR을 이용하여 측정될 수 있다. 특정 실시양태에서, 다양한 유전자의 분류 가능성은, 실시예 1에 예시된 바와 같이, 악성 및 양성 갑상선 결절로부터 수득된 갑상선 조직 시료에서 다양한 유전자의 발현을 토대로 ROC 곡선을 작성하기 위해 각 유전자의 CT 값을 사용하여 결정될 수 있다. 각 유전자의 민감도 및 특이성이 또한 결정될 수 있다.
구체적인 실시양태에서, 알고리즘은 다중-유전자 분류 검사이다. 이러한 분류자는 2단계 접근법을 이용하여 개발될 수 있는데, 제1 단계는 비정형 CT 값을 갖는 일군의 생물학적 시료를 동정하고 분류하며, 제2 단계는 예컨대 실시예 2에 기술된 바와 같이, 제1 단계 후에 분류되지 않고 남아있는 생물학적 시료를 분류하기 위한 알고리즘을 생성한다. 두 단계로부터 병합된 데이터는 ROC 곡선에 통합되고 플롯팅될 수 있다.
특정의 실시양태에서, 제1 단계는 하기 2개의 상(phase)을 포함한다. 제1 상은 주어진 세트의 유전자에 대해 비정형 CT 값을 갖는 생물학적 시료를 동정한다. 비정형 CT를 정의하기 위한 기준은 평균 CT 값 +/- 2 표준 편차로서 정의될 수 있고, 그로써 임의의 주어진 유전자에 대해 단 5%의 CT 값을 나타낸다. 각 유전자에 대해, 암 그룹에 속하지만 실제로는 양성 그룹에 속하는 비정형 CT의 오류 확률 (EP)이 계산될 수 있다. 더 낮은 EP가 더 큰 분류능을 반영한다고 가정하면, 점수는 EP를 토대로 각 유전자에 대해 계산될 수 있다. 제2상에서, 최고 점수를 갖는 유전자들로부터 수득된 복합 점수는 시료를 암 또는 양성으로 분류하는데 사용될 수 있다.
제2 단계의 특정 실시양태에서, 제1 단계에서 분류되지 않은 시료는, 도 3에 도식화된 바와 같이, 하류 알고리즘을 형성하고 모든 데이터의 분류를 완료하기 위한 잔여 트레이닝(training) 세트로서 사용될 수 있다. 예를 들어, 이는 선형 판별 분석(Linear discriminant analysis, LDA) 및 비-선형 판별 분석 (Non-linear discriminant analysis, NLDA)의 2가지 방법을 이용하여 수행될 수 있다. LDA 분석의 경우, 변수 및 시료가 LDA에 요구되는 조건을 충족하는지가 미상일 수 있기 때문에, 단계적 LDA 접근법이 사용될 수 있다. 가장 우수한 분류 확신을 제공하고 LDA를 위한 조건을 충족하는 변수의 조합을 동시에 동정할 수 있어, 상기 단계적 접근법이 선택될 수 있다. NLDA의 경우, 한 세트의 수학적 함수를 전개하여 2개 이상의 특징의 선형 또는 비선형 조합을 초래하기 위한, 유전적 알고리즘-기반 방법이 사용될 수 있다 (Melo et al, Protein Science, 2007). 이 방법은 단일 복합 점수를 생산하기 위해 최대 4개 유전자 조합의 비-선형 변형을 생성한다.
두 단계 모두를 통합하기 위해, 도 3에 도식화된 바와 같이, 제2 단계 또는 시기에서 수득된 값들에 유사한 산출 동일성을 제공하기 위하여 수치값이 제1 단계에서 수득된 데이터에 할당될 수 있다.
특정 실시양태에서, 분류자 또는 알고리즘 (또는 그것이 토대로 하는 유전자)은 90% 초과의 양성 예측 값 (PPV) 및 음성 예측 값 (NPV) 모두에 도달하는, 민감도/특이성 관계를 최대화하고/하거나 AUC > 90을 달성하도록 선택된다.
구체적인 실시양태에서, 개체로부터 수득된 생물학적 시료가 암성 또는 양성인지 여부의 상관관계 및/또는 결정은 분류자 또는 알고리즘, 예컨대 하기 세트의 유전자 산물의 어느 하나에 의해 발현된 유전자 산물을 포함하는, 본원에 기술된 하나 이상, 2개 이상, 또는 3개 이상 유전자 산물의 발현을 토대로 하는, 2단계 분류자를 사용하여 결정된다:
CXCR3, CCR3, CXCL10, CK19, TIMP-1, CLDN-1, CAR, XB130, HO-1 및 CCR7 유전자의 2개 이상의 또는 3개 이상의 유전자 산물;
CXCR3, CCR3, CXCL10, CK19, TIMP-1, CLDN-1, CAR, HO-1 및 CCR7 유전자의 유전자 산물;
CCR3, TIMP-1, CAR 및 XB130 유전자의 유전자 산물;
CXCL10, TIMP-1, CAR 및 CCR7 유전자의 유전자 산물;
TIMP-1, CAR 및 CCR7 유전자의 유전자 산물; 또는
CXCL10, TIMP-1, CLDN-1, 및 CCR7 유전자의 유전자 산물.
특정 실시양태에서, 본 발명의 방법은 컴퓨터-기반 예측 방법론을 지칭하고, 유전자 발현 프로파일의 특징을 분석하기 위해 사용될 수 있는, "분류자"로서 통상의 기술자에게 또한 알려져 있는, "기계 학습 알고리즘"을 이용하여 수행될 수 있다. 예컨대 마이크로어레이-기반 혼성화 어세이에 의해 수득되는, 특정 발현 수준에 상응하는 신호는 전형적으로 발현 프로파일을 분류하기 위해 알고리즘에 적용된다. 지도 학습은 일반적으로 암 대 양성 갑상선 조직과 같은 부류 중에서 구별을 인식하기 위해 분류자를 "트레이닝하고", 이어서 독립적 검사 세트에 대해 분류자의 정확성을 "검사하는" 것을 포함한다. 신규한, 미상의 시료의 경우, 상기 분류자는 상기 시료가 속하는 부류를 결정하기 위해 사용될 수 있다. 구체적인 실시양태에서, 상기 상관은 본원에 기술된 유전자 산물의 임의의 세트의 발현 수준을 토대로 하는 것을 포함하는, 알고리즘을 이용하여 수행된다.
시료를 분류하는데 적합한 알고리즘의 유형의 예시에는, 이로 제한되는 것은 아니지만, k-최근접 이웃 알고리즘, 지지 벡터 알고리즘, 나이브 베이지안 (naive Bayesian) 알고리즘, 신경계 알고리즘, 은닉 마르코프 모델 (hidden Markov model) 알고리즘, 유전적 알고리즘, 또는 이들의 임의의 조합이 포함된다. 본 발명의 일부 실시양태에서, 사선 선형 판별 분석, k-최근접 이웃 알고리즘, 서포트 벡터 머신 (SVM) 알고리즘, 선형 서포트 벡터 머신, 랜덤 포레스트 (random forest) 알고리즘, 또는 확률 모델-기반 방법 또는 이들의 조합이 마이크로어레이 데이터의 분류를 위해 제공된다. 일부 실시양태에서, 시료 (예컨대, 양성 vs. 악성, 정상 vs. 악성)를 구분하거나 아형 (예컨대, PTC vs. FVPTC)을 구분하는 동정된 마커는 관심 부류사이에서 발현 수준의 차이의 통계적 유의성을 토대로 선택된다. 일부 사례에서, 통계적 유의성은 위 발견 비율 (false discovery rate, FDR)을 위한 벤자미니 호치버그 (Benjamini Hochberg) 또는 또 다른 교정을 적용함으로써 조정된다.
특정의 실시양태에서, 본 발명의 알고리즘은 계산의 하나 이상의 부가적인 분석적 특성을 포함할 수 있다. 예를 들어, 유전자 산물 발현 수준을 분석하는 방법은 특징 선택 알고리즘의 사용을 포함할 수 있는데, 이는 LIMMA 소프트웨어 패키지 (Smyth, G. K. (2005). Limma: linear models for microarray data. In: Bioinformatics and Computational Biology Solutions using R and Bioconductor, R. Gentleman, V. Carey, S. Dudoit, R. Irizarry, W. Huber (eds), Springer, New York, pages 397-420)의 사용에 의해 제공될 수 있다. 유전자 산물 발현 수준을 분석하는 방법은 사전-분류자 알고리즘의 사용을 포함할 수 있다. 예를 들어, 알고리즘은 이들의 조성에 따라 시료를 사전-분류하고 그 후에 교정/표준화 요인을 적용하기 위해 세포-특이적 분자 지문을 사용할 수 있다. 이 데이터/정보는 이어서 최종 진단을 보조하기 위해 그 정보를 도입하려고 할 최종 분류 알고리즘으로 공급될 수 있다.
선택된 특징은 분류자 알고리즘을 이용하여 분류될 수 있다. 예시적인 알고리즘에는, 이로 제한되는 것은 아니지만, 주성분 분석 알고리즘, 부분적 최소 제곱법, 및 독립 성분 분석 알고리즘과 같이 다수의 변수를 감소시키는 방법이 포함된다. 예시적 알고리즘에는, 이로 제한되는 것은 아니지만, 통계적 방법 및 기계 학습 기술에 근거한 방법과 같이 직접적으로 다수의 변수를 취급하는 방법이 추가로 포함된다. 통계적 방법에는 벌점부과 로지스틱 회귀 (penalized logistic regression), 마이크로어레이의 예측 분석 (PAM), 감소된 무게중심 (shrunken centroids) 기반 방법, 서포트 벡터 머신 (support vector machine) 분석, 및 조정된 (regularized) 선형 판별 분석이 포함될 수 있다. 기계 학습 기술에는 배깅 (bagging) 과정, 부스팅 (boosting) 과정, 랜덤 포레스트 알고리즘, 및 이들의 조합이 포함된다. 문헌 [Cancer Inform. 2008; 6: 77-97]은 마이크로어레이 강도 데이터의 분석을 위해 상기에 제공된 분류 기술의 개요를 제공한다.
일부 경우에, 본 발명에 따른 알고리즘은 문헌 [Fishel and Kaufman et al. 2007 Bioinformatics 23(13): 1599-606]에 기술된 것과 같은, 메타-분석 접근법으로 보완될 수 있다. 일부 경우에, 분류자 알고리즘은 반복도 (repeatability) 분석과 같은 메타-분석 접근법으로 보완될 수 있다. 일부 경우에, 반복도 분석은 적어도 하나의 예측 발현 산물 마커 세트에서 나타나는 마커를 선택한다.
특정의 실시양태에서, 시료에서 측정된, 각각의 유전자 산물에 대한 그 결과 강도와 같은, 유전자 산물 발현 수준은 이로 제한되는 것은 아니지만, 데이터의 내재적 특성을 조사하여 특징의 관련도를 평가하는 필터 방법, 특징 서브세트 검색 내로 모델 가설을 매립하는 래퍼(wrapper) 방법, 및 최적 세트의 특징을 위한 검색이 분류자 알고리즘 내로 구축되는 매립 기술과 같은, 특징의 선택 기술을 이용하여 분석될 수 있다.
본 발명의 방법에 유용한 필터 기술의 예시는 하기를 포함한다: (1) 2 시료 t-검정, ANOVA 분석, 베이지안 프레임워크 (Bayesian frameworks), 및 감마 분포 모델의 사용과 같은 모수적 (parametric) 방법; (2) 윌콕슨 순위합 검정 (Wilcoxon rank sum tests), 사이-이내 제곱합 (between-within class sum of suqres) 검정, 순위 산물 방법 (rank products methods), 무작위 순열 방법 (random permutation methods), 또는 TnoM의 사용과 같은 모델 부재 방법 (model free methods), 이들은 2개의 데이터 세트 사이에서 발현의 배수-변화 차이에 대해 역치점 (threshold point)을 설정한 후 오분류의 개수를 최소화하는 각 유전자 내 역치점을 검출하는 것을 포함함; 및 (3) 다변량 (multivariate) 방법, 예컨대 이변량 방법, 상관관계 기반 특징 선택 분석 (CFS), 최소 중복 최대 관련 방법 (minimum redundancy maximum relavance methods, MRMR), 마르코프 블랭킷 필터 방법 (Markov blanket filter methods), 및 비상관 감소된 무게중심 방법. 본 발명의 방법에 유용한 래퍼 방법에는 순차 탐색 (sequential search) 방법, 유전적 알고리즘, 및 분포 알고리즘의 평가가 포함된다. 본 발명의 방법에 유용한 매립 방법에는 랜덤 포레스트 알고리즘, 서포트 벡터 머신 알고리즘의 가중치 벡터, 및 로지스틱 회귀 알고리즘의 가중치가 포함된다. 문헌 [Bioinformatics. 2007 Oct 1; 23(19): 2507-17]이 강도 데이터의 분석을 위해 상기에 제공된 필터 기술의 상대적 이점의 개요를 제공한다.
특정 실시양태에서, 시료 내 유전자 산물의 발현 수준은 2개 이상의 상이한 세트의 바이오마커에 대한 유전자 발현과 비교될 수 있는데, 각 세트의 바이오마커에 대한 유전자 발현 데이터는 하나 이상의 조직 유형, 예컨대 갑상선 종양 조직의 존재와 연관된 하나 이상의 참고 유전자 발현 수준을 포함하고, 상기 발현 수준은 순차적인 방식으로 2개 이상의 바이오마커에 대한 유전자 발현 수준과 비교된다. 바이오마커 세트에 대한 유전자 발현 데이터와 발현 수준의 비교는, 상기 유전자 발현 데이터에 본원에 기술된 것들을 비롯한, 분류자의 적용 또는 상이한 분류자의 순차적 적용을 포함할 수 있다. 순차적 분석은 암 조직 시료의 유전자 발현 분석으로부터 얻어진 분류자를 적용하고, 이어서 시료의 일부는 암 조직을 포함하고 다른 것은 양성 조직을 포함하는, 상이한 생물학적 시료의 혼합물의 분석으로부터 수득된 분류자를 적용하는 것을 포함할 수 있다.
특정의 실시양태에서, 순차적 분석에서 초기에 사용되는 분류자는 시료를 양성 또는 의심으로서 포함시키거나 배제하는데 사용될 수 있다. 일부 실시양태에서, 이러한 순차적 분석은 선행 분류자에 의해 배제되지 않았던 시료들로부터의 데이터에 "주요" 분류자의 적용으로 종결되는데, 주요 분류자는 다중 유형의 조직에서 유전자 발현 수준의 데이터 분석으로부터 얻어지고 주요 분류자는 시료를 양성 또는 의심 (또는 악성)으로 지정할 수 있다.
예를 들어, 특정의 실시양태에서, 유전자 또는 바이오마커의 세트를 사용하는 프로파일링은 갑상선 조직을 양성, 의심, 및/또는 악성으로 특정하는데 사용될 수 있다. 세트는 여포 선종 (FA), 결절 과다형성 (NHP), 림프구 갑상샘염 (LCT), 및 휘르틀레 세포 선종 (HA)을 비롯한 양성 (비-암성) 갑상선 아형; 여포 암종 (FC), 유두 갑상선 암종 (PTC), 유두 암종 (FVPTC)의 여포 변형, 골수 갑상선 암종 (MTC), 휘르틀레 세포 암종 (HC), 역형성 갑상선 암종 (ATC)을 비롯한 악성 아형을 포함하는 코호트의 유전자 발현 수준의 분석으로부터 유래할 수 있다. 이러한 패널은 또한 콩팥 암종 (RCC), 유방암종 (BCA), 흑색종 (MMN), B 세포 림프종 (BCL), 및 부갑상샘 (PTA)을 비롯한 비-갑상선 아형으로부터 유래할 수 있다. 정상 갑상선 조직 (NML)과 관련된 바이오마커 세트는 또한 본원에 제공된 방법 및 조성물에서 사용될 수 있다. 예시적인 바이오마커는 표 1에 제공되며, 특정 세트의 바이오마커가 본원에 기술된다.
상기에 논의된 바와 같이, 본 발명의 방법 및 키트는 생물학적 시료의 동정, 분류, 진단, 또는 다르게는 특성화를 목적으로, 특별한 세트의 유전자 산물, 예컨대 "바이오마커 세트"의 사용에 관한 것일 수 있다. 본 발명은 또한 "분류 세트"로 본원에 기술된, 바이오마커 세트의 그룹을 사용할 수 있다. 종종 세트 내에서 바이오마커의 유전자 발현 수준의 패턴 (서명으로도 알려짐)이 결정된 후, 생물학적 시료에서 동일한 세트의 바이오마커의 서열을, 예컨대 시료 서명과 참조 서명간의 유사성 측정에 의해 평가하는데 사용된다. 일부 실시양태에서, 상기 방법은 바이오마커 세트 내 및/또는 분류 세트 내에서 2개 이상의 유전자 산물의 수준을 측정 (또는 수득)하는 것을 포함한다. 예를 들어, 일부 실시양태에서, 바이오마커 세트 또는 분류 세트는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 33, 35, 38, 40, 43, 45, 48, 50, 53, 58, 63, 65, 68, 100, 120, 140, 142, 145, 147, 150, 152, 157, 160, 162, 167, 175, 180, 185, 190, 195, 200, 또는 300개 바이오마커를 포함할 수 있다. 일부 실시양태에서, 바이오마커 세트 또는 분류 세트는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 33, 35, 38, 40, 43, 45, 48, 50, 53, 58, 63, 65, 68, 100, 120, 140, 142, 145, 147, 150, 152, 157, 160, 162, 167, 175, 180, 185, 190, 195, 200, 또는 300개 이하의 바이오마커를 포함한다. 일부 실시양태에서, 분류 세트는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 또는 25개 상이한 바이오마커 세트를 포함한다. 다른 실시양태에서, 분류 패널은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25개 이하의 상이한 바이오마커 세트를 포함한다.
바이오마커 세트는 비-양성 또는 의심 발현 프로파일로부터 양성의 적당한 분리를 수용하도록 선택될 수 있다. 분류자, 즉 알고리즘의 트레이닝은 적어도 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1500, 2000, 2500, 3000, 3500, 또는 4000개의 생물학적 시료 (예컨대, 갑상선 시료)와 같은 다수의 생물학적 시료에 대해 실시될 수 있다. 총 시료 집단은 FNAs로부터 얻어진 시료로 이루어질 수 있고, 또는 상기 시료 집단은 FNAs 및 기타 방법에 의해 얻어진 시료의 혼합물, 예컨대 수술 후 조직일 수 있다. 일부 실시양태에서, 다양한 트레이닝/검정 세트가 예비 알고리즘을 개발하기 위해 사용될 수 있다. 전반적인 알고리즘 오류율은 양성 대 비-양성 시료에 대한 유전자 개수의 함수로 표시될 수 있다. 일부 실시양태에서, 아형 또는 양성 대 악성 (B 대 M)의 어느 하나에 대한 유전자 개수의 함수인 성능 척도 (performance metric)와 같은 기타 성능 척도가 사용될 수 있다. 이러한 성능 척도는 CV, 또는 당해 분야에 공지된 기타 방법을 이용하여 수득될 수 있다. 모든 결과는 시료에 대해 교차-검증 방식으로 트레이닝되고 검사된 서포트 벡터 머신 모델을 이용하여 수득될 수 있다.
분자 프로파일링 결과의 통계적 평가는 하기의 하나 이상을 나타내는 정량적 값 또는 값들을 제공할 수 있다: 진단 정확도의 우도 (likelihood); 암의 우도; 또는 특정 암 아형의 우도. 상기 데이터는 환자 진료를 안내하기 위해 가장 유용한 형태로 의사에게 직접 제시될 수 있다.
분자 프로파일링 결과는, 이로 제한되는 것은 아니지만, 하기를 포함하는 당해 분야에 공지된 수많은 방법을 이용하여 통계적으로 평가될 수 있다: 스튜던츠 T 검정, 양측 (two sided) T 검정, 피어슨 순위합 분석 (pearson rank sum analysis), 은닉 마르코프 모델 분석, q-q 플롯의 분석, 주성분 분석, 일원 분산 ANOVA, 이원 분산 ANOVA, LIMMA 등.
본 발명의 일부 실시양태에서, 본 발명의 방법은, 단독 또는 세포학적 분석과 병용하여, 약 85%와 약 99% 사이로 정확하거나 약 100% 정확한, 예컨대 암 또는 양성의 분류, 동정 또는 진단을 제공할 수 있다.
본원에 기술된 바이오마커 또는 분류 세트의 각각을 토대로 하는 알고리즘은 주어진 시료를 "양성", "의심"으로 또는 하나 이상의 조직 유형 (예컨대, NML, FA, NHP, LCT, HA, FC, PTC, FVPTC, MTC, HC, ATC, RCC, BCA, MMN, BCL, 및 PTA)을 포함하거나 포함하지 않는 것으로 포함시키거나 배제시키기 위한 알고리즘 트레이닝 동안 결정된 유전자 산물 발현 수준에 대한 정보를 사용할 수 있다. 각각의 바이오마커 또는 분류 세트 알고리즘은 결정 규칙이 충족되는 경우 임의의 표시가 붙은 (flaged) 시료를 후속 평가로부터 효과적으로 제거하는, 유입되는 시료를 여과하기 위한 단순 결정 규칙을 이용할 수 있다 (예컨대, 시료는 그에 포함된 하나 이상의 조직 유형의 동일성 또는 상태를 고려하여 특정됨). 본원에 제공된 바이오마커 세트 및 분류 세트는 갑상선암 또는 기타 갑상선 상태를 분류하고, 특정하고, 동정하고/하거나 진단 (갑상선을 정상 또는 양성으로 진단하는 것 포함)하는데 유용하다.
유전자 발현 수준의 분석은 본원에 기술된 상이한 분류자 또는 알고리즘을 유전자 발현 데이터에 순차적으로 적용하는 것을 포함할 수 있다. 특정 실시양태에서, 이러한 순차적 분석은 암성 갑상선 조직의 복수 개의 시료의 유전자 발현 분석으로부터 수득된 분류자를 적용하고, 이어서 시료의 일부는 암성 갑상선 조직을 포함하고 다른 일부는 양성 갑상선 조직을 포함하는, 갑상선 조직의 상이한 시료의 혼합물의 분석으로부터 얻어진 분류자를 적용하는 것을 포함할 수 있다. 일부 실시양태에서, 분류자는 양성 조직, 정상 조직, 및/또는 비-갑상선 조직 (예컨대, 부갑상샘 조직)에서 유전자 발현 양상의 분석으로부터 얻어진다. 일부 실시양태에서, 병에 걸린 조직은 HA 및/또는 HC 조직이다.
일부 실시양태에서, 각각의 분류 패널이 생물학적 시료로부터 입력 바이오마커 발현 수준 (예컨대, 요약된 마이크로어레이 강도 값, qPCR, 또는 서열분석 데이터)을 받으면 분류 과정은 시작된다. 그 후에 분류 패널에서 특정된 바이오마커 및 발현 수준이 평가된다. 만약 주어진 시료로부터의 데이터가 분류 패널 내에 특정된 규칙을 충족한다면 (또는 다르게는 분류 패널의 서명과 상관관계가 있다면), 그렇다면 그의 데이터 출력은 그 시료에 표시를 붙이고 (flag) 이를 이후의 평가 및 주요 (하류) 분류자에 의한 점수 매기기로부터 배제한다. 분류 패널이 시료에 표시를 붙이는 경우, 시스템은 자동적으로 그 시료에 대해 "의심" 신호를 반송한다. 분류 패널이 시료에 표지를 붙이지 않는 경우, 평가는 하류의 다음 분류 패널로 계속되고 이는 표지가 붙거나 붙지 않을 수 있다. 일부 상황에서, 분류 패널은 특정 순서로 적용되고, 다른 사례에서, 적용 순서는 임의의 순서일 수 있다.
특정 실시양태에서, 분류 과정은 개체로부터의 시료 (예컨대, 갑상선 조직 시료)로부터의 하나 이상의 유전자 산물에 대한 발현 수준(들)을, 예컨대 유전자 발현 분석에 의해서, 결정하면서 시작된다. 별개로, 하나 이상의 세트의 참고 또는 트레이닝 시료는 적어도 2개의 상이한 세트의 바이오마커에 대한 유전자 발현 데이터를 결정하기 위해 분석될 수 있고, 각각의 바이오마커 세트에 대한 유전자 발현 데이터는 하나 이상의 조직 유형의 존재와 상관관계가 있는 하나 이상의 유전자 발현 수준을 포함한다. 제1 세트의 바이오마커에 대한 유전자 발현 데이터는 제1 분류자를 트레이닝하는데 사용될 수 있고; 제2 세트에 대한 유전자 발현 데이터는 제2 분류자를 트레이닝하는데 사용될 수 있으며; 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16개, 또는 그 이상의 세트의 바이오마커 및 임의의 상응하는 분류자에 적용된다. 바이오마커 세트 각각의 분석에 사용된 참고 또는 트레이닝 시료의 세트는 중복되거나 중복되지 않을 수 있다. 일부 실시양태에서, 참고 또는 트레이닝 시료는 HA 및/또는 HC 조직을 포함한다. 예시적 분류 과정의 다음 단계에서, 제1 비교는 상기 시료 및 제1 세트의 바이오마커 또는 제1 분류자의 유전자 발현 수준(들) 사이에서 이루어진다. 제1 비교 결과가 일치하는 경우, 분류 과정은 그 시료를 의심, 암성, 또는 특별한 조직 유형 (예컨대, HA 또는 HC)을 포함하는 것으로 지정하는 것과 같은 결과로 종결된다. 만약 비교 결과가 일치하지 않는다면, 상기 시료의 유전자 발현 수준(들)은 제2 세트의 바이오마커 또는 제2 분류자에 대해 제2 회차의 비교에서 비교된다. 제2 비교 결과가 일치하는 경우, 분류 과정은 그 시료를 의심, 암성, 또는 특별한 조직 유형 (예컨대, HA 또는 HC)을 포함하는 것으로 지정하는 것과 같은 결과로 종결된다. 만약 비교 결과가 일치하지 않는다면, 상기 과정은 일치가 확인될 때까지, 또는 분류 과정에 포함된 모든 세트의 바이오마커 또는 분류자가 비교의 기준으로 사용될 때까지 비교의 유사한 단계적 과정으로 지속된다. 만약 분류 과정에 사용된 시료와 임의의 세트의 바이오마커 또는 분류자의 유전자 발현 수준(들) 사이에서 일치가 발견되지 않는다면, 그 시료는 "양성"으로 지정될 수 있다. 일부 실시양태에서, 분류 과정에서 최종 비교는 본원에 기술된 바와 같은, 시료 및 주요 분류자의 유전자 발현 수준(들) 사이에서 이루어진다.
본 발명의 일부 실시양태에서, 데이터 분석 또는 상관관계는 처리되는 수많은 개별적 데이터 시점으로 인해 본원에 기술된 다양한 알고리즘의 적용을 위해 컴퓨터 또는 기타 장치, 기계 또는 기구를 요구한다.
키트
구체적인 실시양태에서, 본 발명은 개체에서 갑상선암과 같은 암을 진단하거나 예측하기 위한 키트 또는 진단 키트를 제공한다. 본원에 기술된 진단 검사는 시험관 내 진단 검사일 수 있다. 진단 검사는, 이로 제한되는 것은 아니지만, 생물학적 시료를 시험하고 갑상선암과 같은 암의 존재 또는 부재를 검출 또는 나타내기 위해 사용될 수 있는, FDA 승인된, 또는 허가된 (cleared), 시험관 내 진단 (In Vitro Diagnostic, IVD), 실험실 개발 검사 (Laboratory Developed Test, LDT), 또는 소비자 직접 (Direct-to-Consumer, DTC) 검정이 포함된다. 일 실시양태에서, 진단 검사 또는 키트는 실험실 또는 기타 의료 종사자 환경에서 사용될 수 있다. 다른 실시양태에서, 진단 검사 또는 키트는 가정에서 소비자에 의해 사용될 수 있다.
진단 검사 및 키트는 본원에 기술된 유전자 산물을 검출하기 위한 하나 이상의 시약을 포함하고, 질병 또는 그의 후유증을 치유하고, 완화하고, 치료하고, 또는 예방하기 위해, 기타 시약, 기구, 및 갑상선암과 같은 암의 시험관 내 진단에 사용하는 것으로 의도된 시스템을 포함할 수 있다. 일 실시양태에서, 본원에 기술된 상기 키트 및 진단 검사는 신체로부터 취해진 표본의 수집, 제조, 및 검사에 사용하는 것으로 의도될 수 있다. 특정 실시양태에서, 키트, 진단 검사 및 산물은 1회 이상의 실험실 검사를 포함할 수 있다. 본원에 사용된 바와 같이, 용어 "실험실 검사"는 개체로부터 수득된 생물학적 시료를 검사하는 것을 포함하는 1회 이상의 의학적 또는 실험실 과정을 의미한다.
본 발명의 키트 및 진단 검사는 표 1에 열거된 유전자에 의해 발현된 것들과 같은, 본원에 기술된 유전자 산물을 검출하기 위한 하나 이상의 시약을 포함한다. 이와 관련하여, 검출용 시약은, 이로 제한되는 것은 아니지만, 항체 및 올리고뉴클레오티드를 비롯한 유전자 산물을 검출하기 위해 통상의 기술자에 공지된 임의의 시약을 포함할 수 있다. 특정의 실시양태에서, 키트 또는 진단 어세이는 상기 키트를 사용하여 유전자 산물의 발현 수준을 측정하기 위해 본원에 기술된 어세이로서 어떻게 수행할지에 대한 문서 지시를 추가로 포함할 수 있다.
특정의 실시양태에서, 본 발명의 키트 또는 진단 어세이는 본원에 기술된 유전자 산물을 검출하기 위한 프로브와 같은 2개 이상, 3개 이상, 또는 4개 이상의 시약을 포함한다. 구체적인 실시양태에서, 유전자 산물은 단백질 또는 핵산, 예컨대 mRNA이다. 특정의 실시양태에서, 시약은 본원에 기술된 임의의 것들을 포함하는, 항체 또는 올리고뉴클레오티드이다. 특정의 실시양태에서, 각각의 시약은, 예컨대 각 세트가 PCR에 의해 함께 표적 폴리뉴클레오티드 유전자 산물을 증폭할 수 있는 2개의 올리고뉴클레오티드를 포함하거나 이들로 이루어지는, 한 세트의 올리고뉴클레오티드이다. 특정의 실시양태에서, 상기 시약은 검출가능하게 표지된다. 일 실시양태에서, 키트 또는 진단 어세이는 유전자 산물을 검출하기 위한 2개 이상, 3개 이상, 또는 4개 이상의 시약을 포함하는데, 키트 또는 진단 어세이는 2개 이상, 3개 이상, 또는 4개 이상 세트의 프라이머를 포함하고, 각각의 세트는 표적 유전자 산물의 적어도 일부를 증폭할 수 있다. 특정의 실시양태에서, 상기 키트 또는 진단 어세이는 2개 이상의, 3개 이상의, 또는 4개 이상의 검출가능하게 표지된 프로브를 추가로 포함하고, 각각의 프로브는 표적 유전자 산물의 하나 또는 그의 상보적 서열에 특이적으로 결합한다. 따라서, 특정의 실시양태에서, 프라이머의 각 세트는 표적 유전자 산물을 증폭하기 위해 사용되고, 그 후에 각각의 프로브는 증폭 산물을 검출하고 그로써 각각의 유전자 산물의 발현 수준을 측정하기 위해 사용된다. 구체적인 실시양태에서, 각 세트의 프라이머와 같은 각각의 시약은 상이한 유전자 산물을 검출한다. 그러나, 특정 실시양태가 동일한 유전자 산물을 증폭하는 2개 이상의 시약을 포함할 수 있는 것으로 이해된다. 예를 들어, 키트 또는 진단 어세이는, 각각이 동일한 유전자 산물에 특이적으로 결합하고/하거나 검출하는, 하나는 한 세트의 증폭 프라이머이고 다른 하나는 프로브인, 2개의 시약을 포함할 수 있다. 또한, 키트 또는 진단 어세이는 각각이 동일한 유전자 산물에 특이적으로 결합하거나 검출하는 2개 이상의 시약의 다중 조합을 포함할 수 있는데, 예컨대 각각의 조합은 상이한 유전자 산물에 특이적으로 결합하거나 검출하고, 그로써 다중 유전자 산물의 증폭 및 검출을 예컨대 동시에 가능케 한다.
구체적인 실시양태에서, 상기 키트 또는 진단 어세이의 시약에 의해 검출된 유전자 산물은 표 1에 열거된 하나 이상의 유전자에 의해 발현되는데, 유전자 산물의 적어도 하나는 CXCR3, CCR3, CXCL10, CAR, XB130, HO-1 또는 CCR7 유전자에 의해 발현된다. 특정의 실시양태에서, 상기 유전자 산물은: CXCR3, CCR3, CXCL10, CK19, TIMP-1, CLDN-1, CAR, XB130, HO-1 및 CCR7 유전자의 3개 이상의 유전자 산물; CXCR3, CCR3, CXCL10, CK19, TIMP-1, CLDN-1, CAR, HO-1 및 CCR7 유전자의 유전자 산물; CCR3, TIMP-1, CAR 및 XB130 유전자의 유전자 산물; CXCL10, TIMP-1, CAR 및 CCR7 유전자의 유전자 산물; TIMP-1, CAR 및 CCR7 유전자의 유전자 산물; 또는 CXCL10, TIMP-1, CLDN-1, 및 CCR7 유전자의 유전자 산물을 포함하거나 이들로 이루어진다.
특정의 실시양태에서, 상기 키트 또는 진단 어세이는 각각의 시약을 별개의 용기에 포함한다. 다른 실시양태에서, 각각의 시약은 동일한 용기에 제공된다. 구체적인 실시양태에서, 상기 시약은 각각 기질, 에컨대 어레이에 부착된다. 구체적인 실시양태에서, 상기 시약은 고체 기질의 분리된 영역에 각각 부착된다. 따라서, 일 실시양태에서, 상기 시약은 고체 기질에 공유적으로 결합된 올리고뉴클레오티드 또는 올리고뉴클레오티드의 세트이고, 상기 고체 기질은 선택적으로 어레이이고, 상기 어레이는 선택적으로 마이크로어레이이다. 특정의 실시양태에서, 상기 시약은 올리고뉴클레오티드, 예컨대 프라이머의 세트이고, 상기 올리고뉴클레오티드의 세트는 DNA를 포함한다.
본 발명의 키트 또는 진단 어세이는 상기 유전자 산물에 상기 시약을 결합하는데 적합한 하나 이상의 용액, 및/또는 유전자 산물의 발현 수준을 결정하기 위해 본 발명의 방법을 실시하는데 사용되는 하나 이상의 용액 또는 시약을 추가로 포함할 수 있다. 예를 들어, 구체적인 실시양태에서, PCR 프라이머의 세트를 포함하는 키트 또는 진단 어세이는, 예컨대 열안정성 중합효소, 데옥시뉴클레오티드의 혼합물, 및/또는 검출가능하게 표지된 프로브와 같은, PCR 어세이를 수행하기 위한 하나 이상의 추가적인 시약을 추가로 포함할 수 있다. 구체적인 실시양태에서, 검출가능하게 표지된 프로브는 형광단 및 소광 모이어티를 포함하고, 상기 프로브는 프로브가 온전한 상태가 아닌 절단될 때 검출가능한 신호를 방출할 수 있다.
본 발명의 키트 또는 진단 어세이는 생물학적 시료를 가공하고/하거나 보관하기 위한 하나 이상의 시약을 추가로 포함할 수 있는데, 예컨대 갑상선 조직 시료의 처리는 생물학적 시료로부터 유전자 산물을 추출하는 것을 포함한다.
본 발명의 키트 또는 진단 어세이는, 수행된 방법이 유전자 산물의 발현 및/또는 존재를 특이적으로 동정하고/하거나 측정하는데 성공적이었음을 확인하기 위해, 예컨대 유전자 산물의 시료를 포함하는 양성 대조군 및/또는 포함하지 않는 음성 대조군과 같은, 하나 이상의 대조군 유전자 산물을 추가로 포함할 수 있다.
특정 실시양태에서, 키트 또는 진단 어세이는, 예컨대 양성 및/또는 음성 대조군 시료에서 유전자 산물의 유전자 발현 수준 또는 갑상선암과 같은 암의 존재 또는 부재를 나타내는 유전자 발현의 미리 결정된 컷-오프 수준에 상응하는, 데이터 또는 정보를 포함한다. 관련된 실시양태에서, 키트 또는 진단 어세이는 생물학적 시료에서 유전자의 발현 수준을 갑상선암과 같은 암의 존재 또는 부재와 상관시키는데 사용하기 위한 알고리즘을 포함한다. 구체적인 실시양태에서, 키트 또는 진단 어세이는 데이터 및/또는 알고리즘을 포함하거나, 상기 데이터 또는 알고리즘에 대한 코드를 포함하는 컴퓨터 판독가능한 매체를 포함한다.
구체적인 실시양태에서, 유전자 산물을 검출하기 위한 시약, 용액, 추가적 시약, 및 대조군 유전자 산물의 하나 이상은 별개의 용기에 담겨진다.
도 1은 정량적 실시간 PCR에 의해 측정되고 Pfafl에 의해 제안된 상대적 정량화 모델에 따라 분석된 18개 유전자의 암 시료 (100) 및 양성 결절 (56) 사이의 차등 발현을 나타내는 그래프를 제공한다. 값 0 (제로)은 양성 결절의 유전자 발현에 상응하고, 막대는 암 시료에서 유전자 발현의 변화 (상대 배수 변화)에 상응한다. 상기 18개 유전자는 실시예 1에서 동정된다.
도 2는 실시예 1에서 동정된 18개 개별 유전자 각각의 수신 작동 특성 (receiving operating characteristic, RPC) 곡선 데이터를 제공한다. AUC: 곡선하면적, FP: 위양성, TP: 진양성.
도 3은 새로운 분류자의 개발을 위해 상이한 알고리즘을 생성하고 (도 3a) 이를 이용하기 (도 3b) 위해 사용된 방법의 도식적 모식도를 제공한다. 2개의 상이한 알고리즘이 트레이닝되었다; 하나는 비정형 (이상치 (outlier)) CT 값을 동정하고 분류하기 위한 것이고, 하나는 비-비정형 CT 값 (선형 및 비-선형 판별 분석)을 분류하기 위한 것임 (도 3a). 새로운 분류자를 개발하기 위해 출력 데이터의 통합이 이어서 두 단계로 순차적으로 상기 알고리즘을 사용하여 새로운 분류자를 개발한다 (도 3b).
도 4는 선형 판별 분석 (LDA) 또는 비-선형 판별 분석 (NLDA)에 이어서 비정형 CT 값의 동정 및 분류에 의해 개발된 새로운 분류자의 ROC 곡선 그래프를 제공한다. AUC: 곡선하면적, FP: 위양성, TP: 진양성.
도 5는 도 3에 기술된 방법에 따른 새로운 분류자 (SV)와 최선의 개별 유전자 분류자와의 비교 및 이들 (유전자 10, 11, 12)의 조합을 제공한다. *는 SV 분류자가 개별 유전자 또는 이들의 조합보다 현저히 우수함을 나타내는 p 값 < 0.05에 상응한다.
도 6은 최선의 개별 분류 유전자의 스피어만 상관 분석 (Spearman correlation analysis)을 제공하는 것으로, 이들이 밀접하게 관련이 있음을 보이며, 이들의 조합이 왜 유전자 분류자로서 이들의 성능을 개선하지 않는지를 설명한다.
도 7은 트레이닝 세트를 이용해 개발된 3개의 새로운 분류자 (SV, FM72, FM208), 최선의 개별 유전자 (유전자 10, 유전자 11, 유전자 12), 상기 최선의 유전자의 조합 (유전자 (10, 11, 12)) 및 베라사이트 (Veracyte, Affirma)에 의한 아피르마 분류자의 분류 성능을 비교한 표를 제공한다.
도 8은 독립적인 트레이닝 세트와 SV 분류자를 이용한 트레이닝 세트의 성능을 비교한 ROC 곡선 그래프와 표를 제공한다.
도 9는 외과적 및 FNA 시료에 대해 SV 알고리즘을 이용하여 얻어진 민감도, 특이성, PPV 및 NPV를 나타내는 비교표를 제공한다.
실시예
실시예 1
진단 어세이를 위한 유전자의 선택
갑상선암에 대한 이들의 관계를 토대로 미리-선택된 18개의 유전자를 불확정 갑상선 결절을 양성 또는 암으로 정확히 분류하는 개선된 진단 어세이를 개발하기 위해 사용하였다. 이들 유전자에는 CXCR3 (유전자 1), CXCR3A (유전자 2), CXCR3B (유전자 3), CXCR4 (유전자 4), CCR3 (유전자 5), CXCL9 (유전자 6), CXCL10 (유전자 7), CXCL11 (유전자 8), SPAG-9 (유전자 9), CK-19 (유전자 10), TIMP-1 (유전자 11), CLDN-1 (유전자 12), CAR (유전자 13), 넥틴-1 (유전자 14), XB-130 (유전자 15), HO-1 (유전자 16), CCR7 (유전자 17), 및 CXCL4 (유전자 18)가 포함되었다.
트레이닝 세트로서, 100개의 갑상선 암종 및 56개의 양성 갑상선 결절을 포함하는, 악성 및 양성 갑상선 결절 모두로부터의 신선한 즉석 냉동된 갑상선 조직 시료를 수술실에서 예비적으로 수집하였다 (n=156). 갑상선암의 아형에는 유두 갑상선 암종 (PTC) 일반 유형 (56), 여포 변형 (22), 확산 경화 (8) 및 여포 암종 (FC) (14)이 포함되었다. 양성 결절에는 여포 과형성 (26), 갑상샘염 (14) 및 여포 선종 (16)이 포함되었다. 모든 외과적 표본에 대한 최종 생검 보고서는 2명의 독자적인 전문 병리학자에 의해 검토되고 확인되었다. 상기 시료를 즉시 4℃에서 RNA 보존 용액 (RNAlater, Ambion)에 놓아둔 후 RNAeasy 플러스 미니 키트 (RNAeasy Plus Mini kit, Qiagen)를 사용하여 균질화하고 -80℃에 보관하였다. RNA 농도를 피코드롭 100 분광광도계 (Picodrop 100 spectophotometer)를 사용하여 측정하였다. RNA 강도를 아가로스-포름알데히드 전기영동을 이용하여 확인하였다.
유전자 차등 발현을 실시간 PCR로 분석하여 각 유전자의 분류 가능성을, 개별적 및 상이한 조합 모두로, 결정하였다. 상보성 DNA (cDNA)의 합성을 ImProm-II 역전사 시스템 (Promega)을 이용하여 수행하였다. 실시간 PCR을 중복 시료에서 퀴아젠사의 Rotor Gene Q 사이클러로 제조사의 지침에 따라서 Brilliant II SYBR Green 마스터 믹스 (Agilent) 키트를 사용하여 수행하였다. 표준 곡선을 RotorGene 소프트웨어 적용을 이용하여 분석하여 각 유전자에 대한 최적 증폭 조건을 결정하였다. 능률 값 (efficiency value)이 95% 내지 109% 범위로 수득되었다. 수득된 선형 회귀 계수 값 (Rsq)은 0.990 내지 0.999의 범위 내였다. 초기 비교를 위해, 유전자 발현을 18s 및 β-액틴으로 표준화하였고, 파플 (Pfaffl)에 의해 제안된 상대적 정량 모델에 의해 분석하였다. 결과를 양성 갑상선 결절 대비 암에서의 상대적-배수 변화로서 도 1에 나타내었다.
각 유전자의 CT 값을 이용하여, 갑상선 시료를 분류하기 위한 각 개별적 유전자의 능력을 비교하기 위해 수신 작동 특성 (ROC) 곡선을 작성하였다. 곡선하면적 (AUC)과, 최적 민감도 및 특이성을 측정하였고 도 2에 나타내었다. 개별적으로, 최고의 AUC 및 민감도/특이성 값을 갖는 유전자는 유전자 11 (AUC: 0.87 및 민감도/특이성: 96%/78%), 유전자 12 (AUC: 0.85 및 민감도/특이성: 85%/73%) 및 유전자 10 (AUC: 0.84 및 민감도/특이성: 81%/79%)이었다. 유전자 17 및 5는 각각 0.74 및 0.70의 AUC를 나타내었다. 도 2에 나타난 바와 같이, 모든 다른 유전자는 불량한 분류 성능을 나타내었다.
실시예 2
진단 어세이의 개발
민감도/특이성 관계를 최대화하여, 양성 예측 값 (PPV) 및 음성 예측 값 (NPV) 모두 90%보다 큰 값에 이르는, 다중-유전자 분류 검사 (유전자 서명)가 사용되었다. 분류자로 사용하기 위한 유전자의 최적의 세트를 선택하는 기준은: 민감도 및 특이성 값 모두 개별적으로 92% 및 90%보다 크면서 0.97보다 큰 AUC이었고; 상기 유전자 분류자는 확고해야 하고 과적합 (overfitting) 없이 비정형 유전자 프로파일 변형을 견뎌야 한다. 또한, 상기 서명은 작은 세트의 유전자를 사용해야 하고, 그로써 단순한 키트가 병리학 실험실과 같은 진료 진단 환경의 측면에서 사용되는 것을 가능케 한다. 이러한 기준을 충족하기 위하여, 개별적인 알고리즘을 트레이닝하였는데; 제1 알고리즘은 비정형(outlier) CT 값을 갖는 시료를 동정하고 분류하였으며, 제2 알고리즘은 비-비정형 CT 값을 갖는 시료를 분류하였다 (도 3a). 두 알고리즘으로부터의 출력 데이터를 통합하기 위해서, 제1 알고리즘으로부터 얻어진 데이터를 제2 알고리즘으로부터 수득된 데이터에 유사한 출력 동일성을 제공하기 위해 수학적으로 변환하였다 (도 3a).
분류자를 개발하기 위하여, 상기 알고리즘을 2단계 과정으로 순차적으로 사용하였다. 분류자의 제1 단계는 2 시기를 포함하는데; 제1 시기는 각 유전자에 대한 평균 CT 값으로부터의 2 표준 편차보다 큰 값으로 정의되는 비정형 CT 값 (outliers)을 갖는 시료를 동정하였다 (도 3a 및 3b). 만약 시료가 각 유전자에 대한 비정형 CT의 기준을 충족하였다면, 이는 제2 시기로 이어지고, 여기서 암 그룹에 속하지만 실제로는 양성 그룹에 속하는 비정형 CT 값의 오차 확률 (error probability, EP)을 계산하였다. 선택된 유전자에 대해 계산된 EP는 개별 점수로 표현되었고, 이는 시료를 암 또는 양성으로 분류하는 복합 점수를 형성하는데 사용되었다 (도 3a 및 3b). 제1 단계는 56개 양성 시료의 21개 및 100개 암 시료의 36개를 비정형으로 동정하였고 이들을 100% 정확도로 분류하였다.
제1 시기의 비정형 CT 값 기준을 만족하지 않거나 제2 시기에서 분류되지 않은 시료는 제2 단계를 통해 분류 과정에 이어졌다 (도 3b). 제2 단계는 2개의 방법, 즉 선형 판별 분석 (LDA) 및 비-선형 판별 분석 (NLDA)으로 트레이닝된 알고리즘을 사용하였다 (도 3b). 변수 및 시료가 LDA에 요구되는 조건을 충족하는지 여부가 알려져 있지 않기 때문에, LDA 분석을 단계적 접근법으로 SPSS 15.0 소프트웨어를 이용하여 수행하였다. 가장 높은 분류 확실성을 제공하고 LDA에 요구되는 조건을 충족하는 변수들의 조합을 동시에 동정하였기 때문에, 단계적 접근법이 선택되었다. NLDA의 경우, 한 세트의 수학적 함수를 전개하여 2개 이상의 특징의 선형 또는 비선형 조합을 초래하는 유전적 알고리즘-기반 방법을 사용하였다 (Melo 등, Protein Science, 2007). 이 방법은 단일 복합 점수를 양산하는 최대 4개 유전자 조합의 비-선형 변형을 생성하였다.
실시예 3
진단 유전자 세트의 선택
실시예 2에 기술된 바와 같은 LDA 및 NLDA 전략으로부터 형성된 신규한 유전자 분류자를 곡선하면적 (AUC), 민감도, 및 특이성을 포함하는 ROC 곡선 매개변수를 토대로 선택하였다. LDA (SV) 및 NLDA (FM72 및 FM208)에 의해 얻어진 대표적 알고리즘의 결과를 도 4에 나타내었다. 모든 분류자는 0.98보다 큰 AUC, 94 내지 97.8% 사이 범위의 민감도, 92 내지 99% 사이의 특이성을 갖는 우수한 성능을 나타내었다. 가장 중요하게는, 최고의 성능을 갖는 알고리즘 (SV; 도 4)은 개별적으로 95.8% 및 96.1%의 양성 예측 값 및 음성 예측 값을 나타내었다 (도 7).
최고의 개별적 성능을 나타내는 3개의 유전자 (CK19, TIMP-1, CLDN1)가 갑상선암의 강력한 바이오마커일 것으로 이전에 나타났다고 하더라도, 이들의 조합 단독은 이들 신규한 알고리즘의 성능을 설명하지 못하였다. 이를 입증하기 위하여, 이들 유전자를, 개별적으로 및 이들을 통합하기 위해 실시예 2에 기재된 동일한 2단계 알고리즘 전략을 이용하여 함께 조합하여, SV 유전자 조합을 포함하는, 본원에서 동정된 신규한 유전자 조합과 비교하였다. 현저하게, 상기 3개 유전자의 조합은 도 5에 나타난 바와 같이, 개별적으로 상기 유전자에 비해 이들의 성능을 변형하지 않았다. 더욱이, 스피어만 상관관계 (Spearman correlation) 분석은 이들이 밀접하게 연관되어 있음을 나타내었고 (p<0.001) (도 6), 이는 이들 유전자의 조합이 왜 이들의 개별적 성능을 개선하지 않는지를 설명하였다. 또한, SV 유전자 조합을 비롯한, 본원에서 동정된 특정 유전자 조합의 성능은 개별적 및 조합 모두에서, CK19, TIMP-1 및 CLDN1에 통계적으로 우수하였다 (도 5). 이론에 의해 구속되지 않지만, 본원에 기재된 유전자 조합의 우수성은 최대 분류 능력을 달성하기 위해 "양호한 바이오마커"와 "불량한 바이오마커"의 조합에 기초한 것으로 생각된다. 이는 아마도 본원에 기술된 특정 조합에서, 대부분의 유전자는 상관되지 않는다는 사실에 기인하는 것이고, 따라서 분류자의 개선된 성능은 각 유전자가 상이한 세트의 시료를 동정하고 정확하게 분류한다는 사실에 의해 달성되는 것이다. 특별히, CK19, TIMP-1 및 CLDN1은 암 시료의 80%를 정확하게 분류한 반면, 본 발명의 진단 유전자 조합 내 다른 유전자는 양성 시료의 대부분을 분류하였다.
단독 또는 조합으로, 유전자 10, 유전자 11 및 유전자 12에 비해 본원에 기술된 바와 같이 개발된 분류자에 사용된 3개의 유전자 세트 (SV, FM72, 및 FM208)의 성능을 비교한 요약을 도 7에 나타내었다. SV는 하기 유전자를 포함한다: CXCR3, CCR3, CXCL10, CK19, TIMP-1, CLDN-1, CAR, HO-1 및 CCR7. FM72는 하기 유전자를 포함한다: CCR3, TIMP-1, CAR 및 XB130. FM208은 하기 유전자를 포함한다: CXCL10, TIMP-1, CLDN-1 및 CCR7. 본원에 기술된 다양한 유전자 세트 및 분류자와 Afirma®갑상선 FNA 분석 검정 (Veracyte, South San Francisco, CA)의 비교를 도 7에 나타내었다.
실시예 4
독립적 검정 세트를 이용한 유전자 분류자의 검정
암 또는 양성 조직을 검출하는데 있어 선택된 진단 유전자 마커의 정확도를 독립적 세트의 데이터에 대해 결정하였다. 20개 암 (PTC 통상적 유형 (15), PTC 여포 변형 (4), 및 여포 암종 (1)) 및 39개 양성 (여포 과증식 (28), 갑상샘염 (7) 및, 여포 선종 (4)) 조직 시료를 포함하는 신규한 세트의 시료를 사용하였다. 이 경우에, 불확정 갑상선 결절에서 가는 바늘 흡인 생검에서 보이는 암의 유사한 유병률을 나타내기 위해 더 적은 개수의 암 시료가 포함되었다.
SV 분류자를 사용하는 이 독립적 세트의 분석은 0.95의 AUC, 95%의 민감도, 90%의 특이성, 83%의 PPV 및 98%의 NPV로 훌륭한 성능을 나타내었다 (도 8). PPV가 암의 유병률에 의존적이라고 감안하면 양성 예측 값에서 83%로의 감소가 예측되었다. 유사하게, 증가된 음성 예측 값은 양성 상태의 유병률에 좌우되고 따라서 트레이닝 세트에 비해 이 검정 세트에서 98%까지 증가하였다 (도 8). 이러한 결과는 본원에 기술된 분류자에 사용된 마커가 과적합되지 않으며 신뢰할 수 있는 새로운 진단 어세이를 제공함을 확인하였다.
실시예 5
세침 시료로부터 수득된 제2 독립적 검정 세트를 이용한 유전자 분류자의 검정
암 또는 양성 갑상선 결절을 검출하는데 있어 선택된 진단 유전자 마커의 정확도를 세침 흡인 (FNA)으로부터 얻어진 독립적 세트의 시료에 대해 결정하였다. 이들은 어세이가 수행되는 실제 임상적 환경에 상응한다. FNA는 매우 적은 시료에 상응하기 때문에, 감소된 세포충실성(cellularity)이 어세이의 성능을 감소시킬 수 있는 가능성이 있다. 따라서, FNA 시료에서 갑상선 결절의 성질을 예측하기 위한 본 발명의 마커 세트의 능력을 검사하였다. 새로운 세트의 시료는 26개의 유두 갑상선암과 74개 양성 갑상선 결절을 포함하였다. 불확정 갑상선 결절에서 세침 흡인 생검에서 보이는 암의 유사한 유병률을 나타내기 위해 더 적은 개수의 암 시료가 포함되었다. 상기 어세이의 분자적 분류 결과를 비교하기 위하여 FNA 시료의 조직병리학적 진단을 금 표준으로 사용하였다.
SV 분류자를 사용한 이 독립적 세트의 분석은 96%의 민감도, 89%의 특이성, 75%의 PPV 및 98%의 NPV로, 훌륭한 성능을 나타내었다 (도 9). 이들 결과는 본원에 기재된 분류자에 사용된 마커가 과적합되지 않은 정확한 결과를 양산하는 것을 확인하였고, 본 발명의 어세이가 임상적 환경에서 통상적으로 사용되는 FNA 시료에서 훌륭한 성능을 갖는다는 신뢰할만한 확인을 제공한다.
본 명세서에 언급된 모든 미국특허, 미국특허 출원공개, 미국특허출원, 외국특허, 외국특허출원 및 비-특허 공보는 본 출원 명세서와 상반되지 않는 수준으로 그 전문이 본 명세서에서 참고로서 포함된다.
전술한 바로부터, 본 발명의 특정 실시양태가 예시를 목적으로 본원에 기술되었다고 하더라도, 발명의 요지 및 범주를 벗어나지 않으면서 다양한 변형이 이루어질 수 있는 것으로 이해될 것이다. 따라서, 발명은 첨부된 청구범위에 의한 것을 제외하고는 제한되지 않는다.
<110> Pontificia Universidad Catolica de Chile <120> COMPOSITIONS AND METHODS FOR DIAGNOSING THYROID TUMORS <130> IPA150595-US <150> US 61/730,391 <151> 2012-11-27 <150> US 61/775,419 <151> 2013-03-08 <160> 20 <170> KopatentIn 2.0 <210> 1 <211> 1670 <212> DNA <213> Homo sapiens <400> 1 ccaaccacaa gcaccaaagc agaggggcag gcagcacacc acccagcagc cagagcacca 60 gcccagccat ggtccttgag gtgagtgacc accaagtgct aaatgacgcc gaggttgccg 120 ccctcctgga gaacttcagc tcttcctatg actatggaga aaacgagagt gactcgtgct 180 gtacctcccc gccctgccca caggacttca gcctgaactt cgaccgggcc ttcctgccag 240 ccctctacag cctcctcttt ctgctggggc tgctgggcaa cggcgcggtg gcagccgtgc 300 tgctgagccg gcggacagcc ctgagcagca ccgacacctt cctgctccac ctagctgtag 360 cagacacgct gctggtgctg acactgccgc tctgggcagt ggacgctgcc gtccagtggg 420 tctttggctc tggcctctgc aaagtggcag gtgccctctt caacatcaac ttctacgcag 480 gagccctcct gctggcctgc atcagctttg accgctacct gaacatagtt catgccaccc 540 agctctaccg ccgggggccc ccggcccgcg tgaccctcac ctgcctggct gtctgggggc 600 tctgcctgct tttcgccctc ccagacttca tcttcctgtc ggcccaccac gacgagcgcc 660 tcaacgccac ccactgccaa tacaacttcc cacaggtggg ccgcacggct ctgcgggtgc 720 tgcagctggt ggctggcttt ctgctgcccc tgctggtcat ggcctactgc tatgcccaca 780 tcctggccgt gctgctggtt tccaggggcc agcggcgcct gcgggccatg cggctggtgg 840 tggtggtcgt ggtggccttt gccctctgct ggacccccta tcacctggtg gtgctggtgg 900 acatcctcat ggacctgggc gctttggccc gcaactgtgg ccgagaaagc agggtagacg 960 tggccaagtc ggtcacctca ggcctgggct acatgcactg ctgcctcaac ccgctgctct 1020 atgcctttgt aggggtcaag ttccgggagc ggatgtggat gctgctcttg cgcctgggct 1080 gccccaacca gagagggctc cagaggcagc catcgtcttc ccgccgggat tcatcctggt 1140 ctgagacctc agaggcctcc tactcgggct tgtgaggccg gaatccgggc tcccctttcg 1200 cccacagtct gacttccccg cattccaggc tcctccctcc ctctgccggc tctggctctc 1260 cccaatatcc tcgctcccgg gactcactgg cagccccagc accaccaggt ctcccgggaa 1320 gccaccctcc cagctctgag gactgcacca ttgctgctcc ttagctgcca agccccatcc 1380 tgccgcccga ggtggctgcc tggagcccca ctgcccttct catttggaaa ctaaaacttc 1440 atcttcccca agtgcgggga gtacaaggca tggcgtagag ggtgctgccc catgaagcca 1500 cagcccaggc ctccagctca gcagtgactg tggccatggt ccccaagacc tctatatttg 1560 ctcttttatt tttatgtcta aaatcctgct taaaactttt caataaacaa gatcgtcagg 1620 accaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1670 <210> 2 <211> 368 <212> PRT <213> Homo sapiens <400> 2 Met Val Leu Glu Val Ser Asp His Gln Val Leu Asn Asp Ala Glu Val 1 5 10 15 Ala Ala Leu Leu Glu Asn Phe Ser Ser Ser Tyr Asp Tyr Gly Glu Asn 20 25 30 Glu Ser Asp Ser Cys Cys Thr Ser Pro Pro Cys Pro Gln Asp Phe Ser 35 40 45 Leu Asn Phe Asp Arg Ala Phe Leu Pro Ala Leu Tyr Ser Leu Leu Phe 50 55 60 Leu Leu Gly Leu Leu Gly Asn Gly Ala Val Ala Ala Val Leu Leu Ser 65 70 75 80 Arg Arg Thr Ala Leu Ser Ser Thr Asp Thr Phe Leu Leu His Leu Ala 85 90 95 Val Ala Asp Thr Leu Leu Val Leu Thr Leu Pro Leu Trp Ala Val Asp 100 105 110 Ala Ala Val Gln Trp Val Phe Gly Ser Gly Leu Cys Lys Val Ala Gly 115 120 125 Ala Leu Phe Asn Ile Asn Phe Tyr Ala Gly Ala Leu Leu Leu Ala Cys 130 135 140 Ile Ser Phe Asp Arg Tyr Leu Asn Ile Val His Ala Thr Gln Leu Tyr 145 150 155 160 Arg Arg Gly Pro Pro Ala Arg Val Thr Leu Thr Cys Leu Ala Val Trp 165 170 175 Gly Leu Cys Leu Leu Phe Ala Leu Pro Asp Phe Ile Phe Leu Ser Ala 180 185 190 His His Asp Glu Arg Leu Asn Ala Thr His Cys Gln Tyr Asn Phe Pro 195 200 205 Gln Val Gly Arg Thr Ala Leu Arg Val Leu Gln Leu Val Ala Gly Phe 210 215 220 Leu Leu Pro Leu Leu Val Met Ala Tyr Cys Tyr Ala His Ile Leu Ala 225 230 235 240 Val Leu Leu Val Ser Arg Gly Gln Arg Arg Leu Arg Ala Met Arg Leu 245 250 255 Val Val Val Val Val Val Ala Phe Ala Leu Cys Trp Thr Pro Tyr His 260 265 270 Leu Val Val Leu Val Asp Ile Leu Met Asp Leu Gly Ala Leu Ala Arg 275 280 285 Asn Cys Gly Arg Glu Ser Arg Val Asp Val Ala Lys Ser Val Thr Ser 290 295 300 Gly Leu Gly Tyr Met His Cys Cys Leu Asn Pro Leu Leu Tyr Ala Phe 305 310 315 320 Val Gly Val Lys Phe Arg Glu Arg Met Trp Met Leu Leu Leu Arg Leu 325 330 335 Gly Cys Pro Asn Gln Arg Gly Leu Gln Arg Gln Pro Ser Ser Ser Arg 340 345 350 Arg Asp Ser Ser Trp Ser Glu Thr Ser Glu Ala Ser Tyr Ser Gly Leu 355 360 365 <210> 3 <211> 1796 <212> DNA <213> Homo sapiens <400> 3 ctgatggtat ctctgtttca ggagtggtga cgcctaagct atcactggac atatcaagga 60 cttcactaaa ttagcaggta ccactggtct tcttgtgctt atccgggcaa gaacttatcg 120 aaatacaata gaagttttta cttagaagag attttcagca gatgagaagc tggtaacaga 180 gaccaaaata gtttggagac taaagaatca ttgcacattt cactgctgag ttgtattgga 240 gaagtgaaat gacaacctca ctagatacag ttgagacctt tggtaccaca tcctactatg 300 atgacgtggg cctgctctgt gaaaaagctg ataccagagc actgatggcc cagtttgtgc 360 ccccgctgta ctccctggtg ttcactgtgg gcctcttggg caatgtggtg gtggtgatga 420 tcctcataaa atacaggagg ctccgaatta tgaccaacat ctacctgctc aacctggcca 480 tttcggacct gctcttcctc gtcacccttc cattctggat ccactatgtc agggggcata 540 actgggtttt tggccatggc atgtgtaagc tcctctcagg gttttatcac acaggcttgt 600 acagcgagat ctttttcata atcctgctga caatcgacag gtacctggcc attgtccatg 660 ctgtgtttgc ccttcgagcc cggactgtca cttttggtgt catcaccagc atcgtcacct 720 ggggcctggc agtgctagca gctcttcctg aatttatctt ctatgagact gaagagttgt 780 ttgaagagac tctttgcagt gctctttacc cagaggatac agtatatagc tggaggcatt 840 tccacactct gagaatgacc atcttctgtc tcgttctccc tctgctcgtt atggccatct 900 gctacacagg aatcatcaaa acgctgctga ggtgccccag taaaaaaaag tacaaggcca 960 tccggctcat ttttgtcatc atggcggtgt ttttcatttt ctggacaccc tacaatgtgg 1020 ctatccttct ctcttcctat caatccatct tatttggaaa tgactgtgag cggagcaagc 1080 atctggacct ggtcatgctg gtgacagagg tgatcgccta ctcccactgc tgcatgaacc 1140 cggtgatcta cgcctttgtt ggagagaggt tccggaagta cctgcgccac ttcttccaca 1200 ggcacttgct catgcacctg ggcagataca tcccattcct tcctagtgag aagctggaaa 1260 gaaccagctc tgtctctcca tccacagcag agccggaact ctctattgtg ttttaggtca 1320 gatgcagaaa attgcctaaa gaggaaggac caaggagatg aagcaaacac attaagcctt 1380 ccacactcac ctctaaaaca gtccttcaaa cttccagtgc aacactgaag ctcttgaaga 1440 cactgaaata tacacacagc agtagcagta gatgcatgta ccctaaggtc attaccacag 1500 gccaggggct gggcagcgta ctcatcatca accctaaaaa gcagagcttt gcttctctct 1560 ctaaaatgag ttacctacat tttaatgcac ctgaatgtta gatagttact atatgccgct 1620 acaaaaaggt aaaacttttt atattttata cattaacttc agccagctat tgatataaat 1680 aaaacatttt cacacaatac aataagttaa ctattttatt ttctaatgtg cctagttctt 1740 tccctgctta atgaaaagct tgttttttca gtgtgaataa ataatcgtaa gcaaca 1796 <210> 4 <211> 355 <212> PRT <213> Homo sapiens <400> 4 Met Thr Thr Ser Leu Asp Thr Val Glu Thr Phe Gly Thr Thr Ser Tyr 1 5 10 15 Tyr Asp Asp Val Gly Leu Leu Cys Glu Lys Ala Asp Thr Arg Ala Leu 20 25 30 Met Ala Gln Phe Val Pro Pro Leu Tyr Ser Leu Val Phe Thr Val Gly 35 40 45 Leu Leu Gly Asn Val Val Val Val Met Ile Leu Ile Lys Tyr Arg Arg 50 55 60 Leu Arg Ile Met Thr Asn Ile Tyr Leu Leu Asn Leu Ala Ile Ser Asp 65 70 75 80 Leu Leu Phe Leu Val Thr Leu Pro Phe Trp Ile His Tyr Val Arg Gly 85 90 95 His Asn Trp Val Phe Gly His Gly Met Cys Lys Leu Leu Ser Gly Phe 100 105 110 Tyr His Thr Gly Leu Tyr Ser Glu Ile Phe Phe Ile Ile Leu Leu Thr 115 120 125 Ile Asp Arg Tyr Leu Ala Ile Val His Ala Val Phe Ala Leu Arg Ala 130 135 140 Arg Thr Val Thr Phe Gly Val Ile Thr Ser Ile Val Thr Trp Gly Leu 145 150 155 160 Ala Val Leu Ala Ala Leu Pro Glu Phe Ile Phe Tyr Glu Thr Glu Glu 165 170 175 Leu Phe Glu Glu Thr Leu Cys Ser Ala Leu Tyr Pro Glu Asp Thr Val 180 185 190 Tyr Ser Trp Arg His Phe His Thr Leu Arg Met Thr Ile Phe Cys Leu 195 200 205 Val Leu Pro Leu Leu Val Met Ala Ile Cys Tyr Thr Gly Ile Ile Lys 210 215 220 Thr Leu Leu Arg Cys Pro Ser Lys Lys Lys Tyr Lys Ala Ile Arg Leu 225 230 235 240 Ile Phe Val Ile Met Ala Val Phe Phe Ile Phe Trp Thr Pro Tyr Asn 245 250 255 Val Ala Ile Leu Leu Ser Ser Tyr Gln Ser Ile Leu Phe Gly Asn Asp 260 265 270 Cys Glu Arg Ser Lys His Leu Asp Leu Val Met Leu Val Thr Glu Val 275 280 285 Ile Ala Tyr Ser His Cys Cys Met Asn Pro Val Ile Tyr Ala Phe Val 290 295 300 Gly Glu Arg Phe Arg Lys Tyr Leu Arg His Phe Phe His Arg His Leu 305 310 315 320 Leu Met His Leu Gly Arg Tyr Ile Pro Phe Leu Pro Ser Glu Lys Leu 325 330 335 Glu Arg Thr Ser Ser Val Ser Pro Ser Thr Ala Glu Pro Glu Leu Ser 340 345 350 Ile Val Phe 355 <210> 5 <211> 1227 <212> DNA <213> Homo sapiens <400> 5 ctttgcagat aaatatggca cactagcccc acgttttctg agacattcct caattgctta 60 gacatattct gagcctacag cagaggaacc tccagtctca gcaccatgaa tcaaactgcc 120 attctgattt gctgccttat ctttctgact ctaagtggca ttcaaggagt acctctctct 180 agaactgtac gctgtacctg catcagcatt agtaatcaac ctgttaatcc aaggtcttta 240 gaaaaacttg aaattattcc tgcaagccaa ttttgtccac gtgttgagat cattgctaca 300 atgaaaaaga agggtgagaa gagatgtctg aatccagaat cgaaggccat caagaattta 360 ctgaaagcag ttagcaagga aaggtctaaa agatctcctt aaaaccagag gggagcaaaa 420 tcgatgcagt gcttccaagg atggaccaca cagaggctgc ctctcccatc acttccctac 480 atggagtata tgtcaagcca taattgttct tagtttgcag ttacactaaa aggtgaccaa 540 tgatggtcac caaatcagct gctactactc ctgtaggaag gttaatgttc atcatcctaa 600 gctattcagt aataactcta ccctggcact ataatgtaag ctctactgag gtgctatgtt 660 cttagtggat gttctgaccc tgcttcaaat atttccctca cctttcccat cttccaaggg 720 tactaaggaa tctttctgct ttggggttta tcagaattct cagaatctca aataactaaa 780 aggtatgcaa tcaaatctgc tttttaaaga atgctcttta cttcatggac ttccactgcc 840 atcctcccaa ggggcccaaa ttctttcagt ggctacctac atacaattcc aaacacatac 900 aggaaggtag aaatatctga aaatgtatgt gtaagtattc ttatttaatg aaagactgta 960 caaagtagaa gtcttagatg tatatatttc ctatattgtt ttcagtgtac atggaataac 1020 atgtaattaa gtactatgta tcaatgagta acaggaaaat tttaaaaata cagatagata 1080 tatgctctgc atgttacata agataaatgt gctgaatggt tttcaaaata aaaatgaggt 1140 actctcctgg aaatattaag aaagactatc taaatgttga aagatcaaaa ggttaataaa 1200 gtaattataa ctaagaaaaa aaaaaaa 1227 <210> 6 <211> 98 <212> PRT <213> Homo sapiens <400> 6 Met Asn Gln Thr Ala Ile Leu Ile Cys Cys Leu Ile Phe Leu Thr Leu 1 5 10 15 Ser Gly Ile Gln Gly Val Pro Leu Ser Arg Thr Val Arg Cys Thr Cys 20 25 30 Ile Ser Ile Ser Asn Gln Pro Val Asn Pro Arg Ser Leu Glu Lys Leu 35 40 45 Glu Ile Ile Pro Ala Ser Gln Phe Cys Pro Arg Val Glu Ile Ile Ala 50 55 60 Thr Met Lys Lys Lys Gly Glu Lys Arg Cys Leu Asn Pro Glu Ser Lys 65 70 75 80 Ala Ile Lys Asn Leu Leu Lys Ala Val Ser Lys Glu Arg Ser Lys Arg 85 90 95 Ser Pro <210> 7 <211> 1490 <212> DNA <213> Homo sapiens <400> 7 agatatccgc ccctgacacc attcctccct tcccccctcc accggccgcg ggcataaaag 60 gcgccaggtg agggcctcgc cgctcctccc gcgaatcgca gcttctgaga ccagggttgc 120 tccgtccgtg ctccgcctcg ccatgacttc ctacagctat cgccagtcgt cggccacgtc 180 gtccttcgga ggcctgggcg gcggctccgt gcgttttggg ccgggggtcg cctttcgcgc 240 gcccagcatt cacgggggct ccggcggccg cggcgtatcc gtgtcctccg cccgctttgt 300 gtcctcgtcc tcctcggggg cctacggcgg cggctacggc ggcgtcctga ccgcgtccga 360 cgggctgctg gcgggcaacg agaagctaac catgcagaac ctcaacgacc gcctggcctc 420 ctacctggac aaggtgcgcg ccctggaggc ggccaacggc gagctagagg tgaagatccg 480 cgactggtac cagaagcagg ggcctgggcc ctcccgcgac tacagccact actacacgac 540 catccaggac ctgcgggaca agattcttgg tgccaccatt gagaactcca ggattgtcct 600 gcagatcgac aatgcccgtc tggctgcaga tgacttccga accaagtttg agacggaaca 660 ggctctgcgc atgagcgtgg aggccgacat caacggcctg cgcagggtgc tggatgagct 720 gaccctggcc aggaccgacc tggagatgca gatcgaaggc ctgaaggaag agctggccta 780 cctgaagaag aaccatgagg aggaaatcag tacgctgagg ggccaagtgg gaggccaggt 840 cagtgtggag gtggattccg ctccgggcac cgatctcgcc aagatcctga gtgacatgcg 900 aagccaatat gaggtcatgg ccgagcagaa ccggaaggat gctgaagcct ggttcaccag 960 ccggactgaa gaattgaacc gggaggtcgc tggccacacg gagcagctcc agatgagcag 1020 gtccgaggtt actgacctgc ggcgcaccct tcagggtctt gagattgagc tgcagtcaca 1080 gctgagcatg aaagctgcct tggaagacac actggcagaa acggaggcgc gctttggagc 1140 ccagctggcg catatccagg cgctgatcag cggtattgaa gcccagctgg gcgatgtgcg 1200 agctgatagt gagcggcaga atcaggagta ccagcggctc atggacatca agtcgcggct 1260 ggagcaggag attgccacct accgcagcct gctcgaggga caggaagatc actacaacaa 1320 tttgtctgcc tccaaggtcc tctgaggcag caggctctgg ggcttctgct gtcctttgga 1380 gggtgtcttc tgggtagagg gatgggaagg aagggaccct tacccccggc tcttctcctg 1440 acctgccaat aaaaatttat ggtccaaggg aaaaaaaaaa aaaaaaaaaa 1490 <210> 8 <211> 400 <212> PRT <213> Homo sapiens <400> 8 Met Thr Ser Tyr Ser Tyr Arg Gln Ser Ser Ala Thr Ser Ser Phe Gly 1 5 10 15 Gly Leu Gly Gly Gly Ser Val Arg Phe Gly Pro Gly Val Ala Phe Arg 20 25 30 Ala Pro Ser Ile His Gly Gly Ser Gly Gly Arg Gly Val Ser Val Ser 35 40 45 Ser Ala Arg Phe Val Ser Ser Ser Ser Ser Gly Ala Tyr Gly Gly Gly 50 55 60 Tyr Gly Gly Val Leu Thr Ala Ser Asp Gly Leu Leu Ala Gly Asn Glu 65 70 75 80 Lys Leu Thr Met Gln Asn Leu Asn Asp Arg Leu Ala Ser Tyr Leu Asp 85 90 95 Lys Val Arg Ala Leu Glu Ala Ala Asn Gly Glu Leu Glu Val Lys Ile 100 105 110 Arg Asp Trp Tyr Gln Lys Gln Gly Pro Gly Pro Ser Arg Asp Tyr Ser 115 120 125 His Tyr Tyr Thr Thr Ile Gln Asp Leu Arg Asp Lys Ile Leu Gly Ala 130 135 140 Thr Ile Glu Asn Ser Arg Ile Val Leu Gln Ile Asp Asn Ala Arg Leu 145 150 155 160 Ala Ala Asp Asp Phe Arg Thr Lys Phe Glu Thr Glu Gln Ala Leu Arg 165 170 175 Met Ser Val Glu Ala Asp Ile Asn Gly Leu Arg Arg Val Leu Asp Glu 180 185 190 Leu Thr Leu Ala Arg Thr Asp Leu Glu Met Gln Ile Glu Gly Leu Lys 195 200 205 Glu Glu Leu Ala Tyr Leu Lys Lys Asn His Glu Glu Glu Ile Ser Thr 210 215 220 Leu Arg Gly Gln Val Gly Gly Gln Val Ser Val Glu Val Asp Ser Ala 225 230 235 240 Pro Gly Thr Asp Leu Ala Lys Ile Leu Ser Asp Met Arg Ser Gln Tyr 245 250 255 Glu Val Met Ala Glu Gln Asn Arg Lys Asp Ala Glu Ala Trp Phe Thr 260 265 270 Ser Arg Thr Glu Glu Leu Asn Arg Glu Val Ala Gly His Thr Glu Gln 275 280 285 Leu Gln Met Ser Arg Ser Glu Val Thr Asp Leu Arg Arg Thr Leu Gln 290 295 300 Gly Leu Glu Ile Glu Leu Gln Ser Gln Leu Ser Met Lys Ala Ala Leu 305 310 315 320 Glu Asp Thr Leu Ala Glu Thr Glu Ala Arg Phe Gly Ala Gln Leu Ala 325 330 335 His Ile Gln Ala Leu Ile Ser Gly Ile Glu Ala Gln Leu Gly Asp Val 340 345 350 Arg Ala Asp Ser Glu Arg Gln Asn Gln Glu Tyr Gln Arg Leu Met Asp 355 360 365 Ile Lys Ser Arg Leu Glu Gln Glu Ile Ala Thr Tyr Arg Ser Leu Leu 370 375 380 Glu Gly Gln Glu Asp His Tyr Asn Asn Leu Ser Ala Ser Lys Val Leu 385 390 395 400 <210> 9 <211> 931 <212> DNA <213> Homo sapiens <400> 9 tttcgtcggc ccgccccttg gcttctgcac tgatggtggg tggatgagta atgcatccag 60 gaagcctgga ggcctgtggt ttccgcaccc gctgccaccc ccgcccctag cgtggacatt 120 tatcctctag cgctcaggcc ctgccgccat cgccgcagat ccagcgccca gagagacacc 180 agagaaccca ccatggcccc ctttgagccc ctggcttctg gcatcctgtt gttgctgtgg 240 ctgatagccc ccagcagggc ctgcacctgt gtcccacccc acccacagac ggccttctgc 300 aattccgacc tcgtcatcag ggccaagttc gtggggacac cagaagtcaa ccagaccacc 360 ttataccagc gttatgagat caagatgacc aagatgtata aagggttcca agccttaggg 420 gatgccgctg acatccggtt cgtctacacc cccgccatgg agagtgtctg cggatacttc 480 cacaggtccc acaaccgcag cgaggagttt ctcattgctg gaaaactgca ggatggactc 540 ttgcacatca ctacctgcag ttttgtggct ccctggaaca gcctgagctt agctcagcgc 600 cggggcttca ccaagaccta cactgttggc tgtgaggaat gcacagtgtt tccctgttta 660 tccatcccct gcaaactgca gagtggcact cattgcttgt ggacggacca gctcctccaa 720 ggctctgaaa agggcttcca gtcccgtcac cttgcctgcc tgcctcggga gccagggctg 780 tgcacctggc agtccctgcg gtcccagata gcctgaatcc tgcccggagt ggaagctgaa 840 gcctgcacag tgtccaccct gttcccactc ccatctttct tccggacaat gaaataaaga 900 gttaccaccc agcagaaaaa aaaaaaaaaa a 931 <210> 10 <211> 207 <212> PRT <213> Homo sapiens <400> 10 Met Ala Pro Phe Glu Pro Leu Ala Ser Gly Ile Leu Leu Leu Leu Trp 1 5 10 15 Leu Ile Ala Pro Ser Arg Ala Cys Thr Cys Val Pro Pro His Pro Gln 20 25 30 Thr Ala Phe Cys Asn Ser Asp Leu Val Ile Arg Ala Lys Phe Val Gly 35 40 45 Thr Pro Glu Val Asn Gln Thr Thr Leu Tyr Gln Arg Tyr Glu Ile Lys 50 55 60 Met Thr Lys Met Tyr Lys Gly Phe Gln Ala Leu Gly Asp Ala Ala Asp 65 70 75 80 Ile Arg Phe Val Tyr Thr Pro Ala Met Glu Ser Val Cys Gly Tyr Phe 85 90 95 His Arg Ser His Asn Arg Ser Glu Glu Phe Leu Ile Ala Gly Lys Leu 100 105 110 Gln Asp Gly Leu Leu His Ile Thr Thr Cys Ser Phe Val Ala Pro Trp 115 120 125 Asn Ser Leu Ser Leu Ala Gln Arg Arg Gly Phe Thr Lys Thr Tyr Thr 130 135 140 Val Gly Cys Glu Glu Cys Thr Val Phe Pro Cys Leu Ser Ile Pro Cys 145 150 155 160 Lys Leu Gln Ser Gly Thr His Cys Leu Trp Thr Asp Gln Leu Leu Gln 165 170 175 Gly Ser Glu Lys Gly Phe Gln Ser Arg His Leu Ala Cys Leu Pro Arg 180 185 190 Glu Pro Gly Leu Cys Thr Trp Gln Ser Leu Arg Ser Gln Ile Ala 195 200 205 <210> 11 <211> 3452 <212> DNA <213> Homo sapiens <400> 11 gtctcagttc ccgagcctgg gagcaaccgc agcttctagt atccagactc cagcgccgcc 60 ccgggcgcgg accccaaccc cgacccagag cttctccagc ggcggcgcag cgagcagggc 120 tccccgcctt aacttcctcc gcggggccca gccaccttcg ggagtccggg ttgcccacct 180 gcaaactctc cgccttctgc acctgccacc cctgagccag cgcgggcgcc cgagcgagtc 240 atggccaacg cggggctgca gctgttgggc ttcattctcg ccttcctggg atggatcggc 300 gccatcgtca gcactgccct gccccagtgg aggatttact cctatgccgg cgacaacatc 360 gtgaccgccc aggccatgta cgaggggctg tggatgtcct gcgtgtcgca gagcaccggg 420 cagatccagt gcaaagtctt tgactccttg ctgaatctga gcagcacatt gcaagcaacc 480 cgtgccttga tggtggttgg catcctcctg ggagtgatag caatctttgt ggccaccgtt 540 ggcatgaagt gtatgaagtg cttggaagac gatgaggtgc agaagatgag gatggctgtc 600 attgggggtg cgatatttct tcttgcaggt ctggctattt tagttgccac agcatggtat 660 ggcaatagaa tcgttcaaga attctatgac cctatgaccc cagtcaatgc caggtacgaa 720 tttggtcagg ctctcttcac tggctgggct gctgcttctc tctgccttct gggaggtgcc 780 ctactttgct gttcctgtcc ccgaaaaaca acctcttacc caacaccaag gccctatcca 840 aaacctgcac cttccagcgg gaaagactac gtgtgacaca gaggcaaaag gagaaaatca 900 tgttgaaaca aaccgaaaat ggacattgag atactatcat taacattagg accttagaat 960 tttgggtatt gtaatctgaa gtatggtatt acaaaacaaa caaacaaaca aaaaacccat 1020 gtgttaaaat actcagtgct aaacatggct taatcttatt ttatcttctt tcctcaatat 1080 aggagggaag atttttccat ttgtattact gcttcccatt gagtaatcat actcaactgg 1140 gggaaggggt gctccttaaa tatatataga tatgtatata tacatgtttt tctattaaaa 1200 atagacagta aaatactatt ctcattatgt tgatactagc atacttaaaa tatctctaaa 1260 ataggtaaat gtatttaatt ccatattgat gaagatgttt attggtatat tttctttttc 1320 gtctatatat acatatgtaa cagtcaaata tcatttactc ttcttcatta gctttgggtg 1380 cctttgccac aagacctagc ctaatttacc aaggatgaat tctttcaatt cttcatgcgt 1440 gcccttttca tatacttatt ttatttttta ccataatctt atagcacttg catcgttatt 1500 aagcccttat ttgttttgtg tttcattggt ctctatctcc tgaatctaac acatttcata 1560 gcctacattt tagtttctaa agccaagaag aatttattac aaatcagaac tttggaggca 1620 aatctttctg catgaccaaa gtgataaatt cctgttgacc ttcccacaca atccctgtac 1680 tctgacccat agcactcttg tttgctttga aaatatttgt ccaattgagt agctgcatgc 1740 tgttccccca ggtgttgtaa cacaacttta ttgattgaat ttttaagcta cttattcata 1800 gttttatatc cccctaaact acctttttgt tccccattcc ttaattgtat tgttttccca 1860 agtgtaatta tcatgcgttt tatatcttcc taataaggtg tggtctgttt gtctgaacaa 1920 agtgctagac tttctggagt gataatctgg tgacaaatat tctctctgta gctgtaagca 1980 agtcacttaa tctttctacc tcttttttct atctgccaaa ttgagataat gatacttaac 2040 cagttagaag aggtagtgtg aatattaatt agtttatatt actctcattc tttgaacatg 2100 aactatgcct atgtagtgtc tttatttgct cagctggctg agacactgaa gaagtcactg 2160 aacaaaacct acacacgtac cttcatgtga ttcactgcct tcctctctct accagtctat 2220 ttccactgaa caaaacctac acacatacct tcatgtggtt cagtgccttc ctctctctac 2280 cagtctattt ccactgaaca aaacctacgc acataccttc atgtggctca gtgccttcct 2340 ctctctacca gtctatttcc attctttcag ctgtgtctga catgtttgtg ctctgttcca 2400 ttttaacaac tgctcttact tttccagtct gtacagaatg ctatttcact tgagcaagat 2460 gatgtaatgg aaagggtgtt ggcattggtg tctggagacc tggatttgag tcttggtgct 2520 atcaatcacc gtctgtgttt gagcaaggca tttggctgct gtaagcttat tgcttcatct 2580 gtaagcggtg gtttgtaatt cctgatcttc ccacctcaca gtgatgttgt ggggatccag 2640 tgagatagaa tacatgtaag tgtggttttg taatttaaaa agtgctatac taagggaaag 2700 aattgaggaa ttaactgcat acgttttggt gttgcttttc aaatgtttga aaacaaaaaa 2760 aatgttaaga aatgggtttc ttgccttaac cagtctctca agtgatgaga cagtgaagta 2820 aaattgagtg cactaaacaa ataagattct gaggaagtct tatcttctgc agtgagtatg 2880 gcccgatgct ttctgtggct aaacagatgt aatgggaaga aataaaagcc tacgtgttgg 2940 taaatccaac agcaagggag atttttgaat cataataact cataaggtgc tatctgttca 3000 gtgatgccct cagagctctt gctgttagct ggcagctgac gctgctagga tagttagttt 3060 ggaaatggta cttcataata aactacacaa ggaaagtcag ccactgtgtc ttatgaggaa 3120 ttggacctaa taaattttag tgtgccttcc aaacctgaga atatatgctt ttggaagtta 3180 aaatttaaat ggcttttgcc acatacatag atcttcatga tgtgtgagtg taattccatg 3240 tggatatcag ttaccaaaca ttacaaaaaa attttatggc ccaaaatgac caacgaaatt 3300 gttacaatag aatttatcca attttgatct ttttatattc ttctaccaca cctggaaaca 3360 gaccaataga cattttgggg ttttataata ggaatttgta taaagcatta ctctttttca 3420 ataaattgtt ttttaattta aaaaaaggat ta 3452 <210> 12 <211> 211 <212> PRT <213> Homo sapiens <400> 12 Met Ala Asn Ala Gly Leu Gln Leu Leu Gly Phe Ile Leu Ala Phe Leu 1 5 10 15 Gly Trp Ile Gly Ala Ile Val Ser Thr Ala Leu Pro Gln Trp Arg Ile 20 25 30 Tyr Ser Tyr Ala Gly Asp Asn Ile Val Thr Ala Gln Ala Met Tyr Glu 35 40 45 Gly Leu Trp Met Ser Cys Val Ser Gln Ser Thr Gly Gln Ile Gln Cys 50 55 60 Lys Val Phe Asp Ser Leu Leu Asn Leu Ser Ser Thr Leu Gln Ala Thr 65 70 75 80 Arg Ala Leu Met Val Val Gly Ile Leu Leu Gly Val Ile Ala Ile Phe 85 90 95 Val Ala Thr Val Gly Met Lys Cys Met Lys Cys Leu Glu Asp Asp Glu 100 105 110 Val Gln Lys Met Arg Met Ala Val Ile Gly Gly Ala Ile Phe Leu Leu 115 120 125 Ala Gly Leu Ala Ile Leu Val Ala Thr Ala Trp Tyr Gly Asn Arg Ile 130 135 140 Val Gln Glu Phe Tyr Asp Pro Met Thr Pro Val Asn Ala Arg Tyr Glu 145 150 155 160 Phe Gly Gln Ala Leu Phe Thr Gly Trp Ala Ala Ala Ser Leu Cys Leu 165 170 175 Leu Gly Gly Ala Leu Leu Cys Cys Ser Cys Pro Arg Lys Thr Thr Ser 180 185 190 Tyr Pro Thr Pro Arg Pro Tyr Pro Lys Pro Ala Pro Ser Ser Gly Lys 195 200 205 Asp Tyr Val 210 <210> 13 <211> 1669 <212> DNA <213> Homo sapiens <400> 13 ggcaacccca cgcggctgga gaagccggcg ctcgcagccc ggcccgggcc gctgccggaa 60 gtgacgcgag ttcacctgcc gagcgggggc tgggaggagg ggcggagggt gcagaggtgc 120 cgccgccgcc gcgagccagt cgggagcgcg cgaggcgcgg ggagcctggg accaggagcg 180 agagccgcct acctgcagcc gccgcccacg gcacggcagc caccatggcg ctcctgctgt 240 gcttcgtgct cctgtgcgga gtagtggatt tcgccagaag tttgagtatc actactcctg 300 aagagatgat tgaaaaagcc aaaggggaaa ctgcctatct gccatgcaaa tttacgctta 360 gtcccgaaga ccagggaccg ctggacatcg agtggctgat atcaccagct gataatcaga 420 aggtggatca agtgattatt ttatattctg gagacaaaat ttatgatgac tactatccag 480 atctgaaagg ccgagtacat tttacgagta atgatctcaa atctggtgat gcatcaataa 540 atgtaacgaa tttacaactg tcagatattg gcacatatca gtgcaaagtg aaaaaagctc 600 ctggtgttgc aaataagaag attcatctgg tagttcttgt taagccttca ggtgcgagat 660 gttacgttga tggatctgaa gaaattggaa gtgactttaa gataaaatgt gaaccaaaag 720 aaggttcact tccattacag tatgagtggc aaaaattgtc tgactcacag aaaatgccca 780 cttcatggtt agcagaaatg acttcatctg ttatatctgt aaaaaatgcc tcttctgagt 840 actctgggac atacagctgt acagtcagaa acagagtggg ctctgatcag tgcctgttgc 900 gtctaaacgt tgtccctcct tcaaataaag ctggactaat tgcaggagcc attataggaa 960 ctttgcttgc tctagcgctc attggtctta tcatcttttg ctgtcgtaaa aagcgcagag 1020 aagaaaaata tgaaaaggaa gttcatcacg atatcaggga agatgtgcca cctccaaaga 1080 gccgtacgtc cactgccaga agctacatcg gcagtaatca ttcatccctg gggtccatgt 1140 ctccttccaa catggaagga tattccaaga ctcagtataa ccaagtacca agtgaagact 1200 ttgaacgcac tcctcagagt ccgactctcc cacctgctaa gttcaagtac ccttacaaga 1260 ctgatggaat tacagttgta taaatatgga ctactgaaga atctgaagta ttgtattatt 1320 tgactttatt ttaggcctct agtaaagact taaatgtttt ttaaaaaaag cacaaggcac 1380 agagattaga gcagctgtaa gaacacatct actttatgca atggcattag acatgtaagt 1440 cagatgtcat gtcaaaatta gtacgagcca aattctttgt taaaaaaccc tatgtatagt 1500 gacactgata gttaaaagat gttttattat attttcaata actaccacta acaaattttt 1560 aacttttcat atgcatattc tgatatgtgg tcttttagga aaagtatggt taatagttga 1620 tttttcaaag gaaattttaa aattcttacg ttctgtttaa tgtttttgc 1669 <210> 14 <211> 352 <212> PRT <213> Homo sapiens <400> 14 Met Ala Leu Leu Leu Cys Phe Val Leu Leu Cys Gly Val Val Asp Phe 1 5 10 15 Ala Arg Ser Leu Ser Ile Thr Thr Pro Glu Glu Met Ile Glu Lys Ala 20 25 30 Lys Gly Glu Thr Ala Tyr Leu Pro Cys Lys Phe Thr Leu Ser Pro Glu 35 40 45 Asp Gln Gly Pro Leu Asp Ile Glu Trp Leu Ile Ser Pro Ala Asp Asn 50 55 60 Gln Lys Val Asp Gln Val Ile Ile Leu Tyr Ser Gly Asp Lys Ile Tyr 65 70 75 80 Asp Asp Tyr Tyr Pro Asp Leu Lys Gly Arg Val His Phe Thr Ser Asn 85 90 95 Asp Leu Lys Ser Gly Asp Ala Ser Ile Asn Val Thr Asn Leu Gln Leu 100 105 110 Ser Asp Ile Gly Thr Tyr Gln Cys Lys Val Lys Lys Ala Pro Gly Val 115 120 125 Ala Asn Lys Lys Ile His Leu Val Val Leu Val Lys Pro Ser Gly Ala 130 135 140 Arg Cys Tyr Val Asp Gly Ser Glu Glu Ile Gly Ser Asp Phe Lys Ile 145 150 155 160 Lys Cys Glu Pro Lys Glu Gly Ser Leu Pro Leu Gln Tyr Glu Trp Gln 165 170 175 Lys Leu Ser Asp Ser Gln Lys Met Pro Thr Ser Trp Leu Ala Glu Met 180 185 190 Thr Ser Ser Val Ile Ser Val Lys Asn Ala Ser Ser Glu Tyr Ser Gly 195 200 205 Thr Tyr Ser Cys Thr Val Arg Asn Arg Val Gly Ser Asp Gln Cys Leu 210 215 220 Leu Arg Leu Asn Val Val Pro Pro Ser Asn Lys Ala Gly Leu Ile Ala 225 230 235 240 Gly Ala Ile Ile Gly Thr Leu Leu Ala Leu Ala Leu Ile Gly Leu Ile 245 250 255 Ile Phe Cys Cys Arg Lys Lys Arg Arg Glu Glu Lys Tyr Glu Lys Glu 260 265 270 Val His His Asp Ile Arg Glu Asp Val Pro Pro Pro Lys Ser Arg Thr 275 280 285 Ser Thr Ala Arg Ser Tyr Ile Gly Ser Asn His Ser Ser Leu Gly Ser 290 295 300 Met Ser Pro Ser Asn Met Glu Gly Tyr Ser Lys Thr Gln Tyr Asn Gln 305 310 315 320 Val Pro Ser Glu Asp Phe Glu Arg Thr Pro Gln Ser Pro Thr Leu Pro 325 330 335 Pro Ala Lys Phe Lys Tyr Pro Tyr Lys Thr Asp Gly Ile Thr Val Val 340 345 350 <210> 15 <211> 3997 <212> DNA <213> Homo sapiens <400> 15 gtgccaaggc ggctgggggc ggcgagcggg gccgcgggcg cgcaccgact caagagccga 60 ctgtcagcct cggcgggccg gagttctccg gcgctgggac aggggcgctg ggacaggggc 120 gctgggggcg agccctggcg ggggccaggt ccgaggaccc tgggcgcggc ggccccgcca 180 ggaggtccgg ccgcgagcgt gacctcacgg ggaggggcca gcgcggcggc ctgggcgctg 240 agccgagcgc cgggagagca gcgcagaagc cgagccgcga ggagcgcact ccgtggcccc 300 gatggagcgg tacaaagccc tggaacagct gctgacagag ttggatgact tcctcaagat 360 tcttgaccag gagaacctga gcagcacagc actggtgaag aagagctgcc tggcggagct 420 cctccggctt tacaccaaaa gcagcagctc tgatgaggag tacatttata tgaacaaagt 480 gaccatcaac aagcaacaga atgcagagtc tcaaggcaaa gcgcctgagg agcagggcct 540 gctacccaat ggggagccca gccagcactc ctcggcccct cagaagagcc ttccagacct 600 cccgccaccc aagatgattc cagaacggaa acagcttgcc atcccaaaga cggagtctcc 660 agagggctac tatgaagagg ctgagccata tgacacatcc ctcaatgagg acggagaggc 720 tgtgagcagc tcctacgagt cctacgatga agaggacggc agcaagggca agtcggcccc 780 ttaccagtgg ccctcgccgg aggccggcat cgagctgatg cgtgacgccc gcatctgcgc 840 cttcctgtgg cgcaagaagt ggctgggaca gtgggccaag cagctctgtg tcatcaagga 900 caacaggctt ctgtgctaca aatcctccaa ggaccacagc cctcagctgg acgtgaacct 960 actgggcagc agcgtcattc acaaggagaa gcaagtgcgg aagaaggagc acaagctgaa 1020 gatcacaccg atgaatgccg atgtgattgt gctgggcctg cagagcaagg accaggctga 1080 gcagtggctc agggtcatcc aggaagtgag cggcctgcct tccgaaggag catctgaagg 1140 aaaccagtac accccggatg cccagcgctt taactgccag aaaccagata tagctgagaa 1200 gtacctgtcg gcttcagagt atgggagctc cgtggatggc caccctgagg tcccagaaac 1260 caaagacgtc aagaagaaat gttctgctgg cctcaaactg agcaacctaa tgaatctggg 1320 caggaagaaa tccacctcac tggagcctgt ggagaggtcc ctcgagacat ccagttacct 1380 gaacgtgctg gtgaacagcc agtggaagtc tcgctggtgc tctgtcaggg acaatcacct 1440 gcacttctac caggaccgga accggagcaa ggtggcccag caacccctca gcctggtggg 1500 ctgcgaggtg gtcccagacc ccagccccga ccacctctac tccttccgca tcctccacaa 1560 gggcgaggag ctggccaagc ttgaggccaa gtcttccgag gaaatgggcc actggctggg 1620 tctcctgctc tctgagtcag gctccaagac agacccagaa gagttcacct acgactatgt 1680 ggatgccgat agggtctcct gtattgtgag tgcggccaaa aactctctct tactgatgca 1740 gagaaagttc tcagagccca acacttacat cgatggcctg cctagccagg accgccagga 1800 ggagctgtat gacgacgtgg acctgtcaga gctcacagct gcggtggagc ctaccgagga 1860 agccacccct gttgcagatg acccaaatga gagagaatct gaccgagtgt acctggacct 1920 cacacctgtc aagtcctttc tgcatggccc cagcagtgca caggcccagg cctcctcccc 1980 gacgttgtcc tgcctggaca atgcaactga ggccctcccg gcagactcag gcccaggtcc 2040 caccccagat gagccctgca taaagtgtcc agagaacctg ggagaacagc agctggagag 2100 tttggagcca gaggatcctt ccctgagaat caccaccgtc aaaatccaga cggaacagca 2160 gagaatctcc ttcccaccga gctgcccgga tgccgtggtg gccaccccac ctggtgccag 2220 cccacctgtg aaggacaggt tgcgcgtgac cagtgcagag atcaagcttg gcaagaatcg 2280 gacagaagct gaggtgaagc ggtacacaga ggagaaggag aggcttgaaa agaagaagga 2340 agaaatccgg gggcacctgg ctcagctccg gaaagagaaa cgggagctaa aggaaaccct 2400 actgaaatgc acagacaagg aagtcctggc gagcctggag cagaagctga aggaaattga 2460 cgaggagtgc cggggcgagg agagcaggcg cgtggacctg gagctcagca tcatggaggt 2520 gaaggacaac ctgaagaagg ctgaggcagg gcctgtgacg ttaggcacca ccgtggacac 2580 cacccacctg gagaatgtga gcccccgccc caaagctgtc acacctgcct ctgccccaga 2640 ctgtacccca gtcaactctg caaccacact caagaacagg cctctctcgg tcgtggtcac 2700 aggcaaaggc actgtactcc agaaagccaa ggaatgggag aagaaaggag caagttagaa 2760 aacaagcttc atctaaagac tctcatgtca atgtggacct tggtgacaat cctgctttgt 2820 taaagcaaaa actatgcgaa agggtgagtc tgtttagaag aaaaagcaaa gactgaggta 2880 ctgtgaatgg agagcttcag ctaagaggag gctctgtccc ttttcagagc caaaggaaat 2940 aatacaacaa aaaggaggct tctttggaga cctaagtcta ttggatgtaa acaagacgtt 3000 gtatttaggg atgttctgtg tttctttctt ttttgaagtt gtcatcaatt gctttactaa 3060 gatttttaaa tagtgaaaac ctcctgttta gactttggtg gaagatgaat caaggaagca 3120 gggccctgtc ttatgggtca cgtgtctttg gtgagtgaga agacctaaac tcctggccat 3180 catctcttat ccaatactta gcagttgggg attaaaccat ccttgccttc agttctctcc 3240 aatattacca ggcccaactc agtcttcagt gattttaaac agcattgaca tcatctgtaa 3300 aaccatcatc tgtaaaacca tctatgacat gagttttgag aaacaataat ggggaaaata 3360 tttgggacca agctgaagca ctaatcccac taagttaaag acttctttcc agtccaaggc 3420 aggcctgaat caactgtctt taaataaaat tttaagtgat gctgtattat atataggaaa 3480 aaatgcttaa aatcctgtca tttagaacag tgaaaagtat cttttgagat taaagtgact 3540 ctttactgta ggaaaaatat tactctgtgt ttacagattc attgctgtgg tcaggccatt 3600 tttaagggaa gagttattta atataaatag tctctgattt taagttctgt ttaatgttca 3660 ttctccttcc aagaacaaag tggtgatttt tggttagggt gatcgccctc ttaaaattgg 3720 cagtgctgtt ccttgtgctg cccctgtctt ttcctctgat ggcatttttt tttttttttt 3780 tttaacacag gttgaaacat ttcatctatt atctctgcct catttctgga gggttgtgta 3840 tcagttctct aacacttgtt cctgagaact aaatgtcttt tttattctta tttcctctct 3900 cataaacatt tggtgacctt ttaccaagtg gtgagttagt taggtttttt aaaataaaat 3960 gttcattgta tttgaaaaaa aaaaaaaaaa aaaaaaa 3997 <210> 16 <211> 818 <212> PRT <213> Homo sapiens <400> 16 Met Glu Arg Tyr Lys Ala Leu Glu Gln Leu Leu Thr Glu Leu Asp Asp 1 5 10 15 Phe Leu Lys Ile Leu Asp Gln Glu Asn Leu Ser Ser Thr Ala Leu Val 20 25 30 Lys Lys Ser Cys Leu Ala Glu Leu Leu Arg Leu Tyr Thr Lys Ser Ser 35 40 45 Ser Ser Asp Glu Glu Tyr Ile Tyr Met Asn Lys Val Thr Ile Asn Lys 50 55 60 Gln Gln Asn Ala Glu Ser Gln Gly Lys Ala Pro Glu Glu Gln Gly Leu 65 70 75 80 Leu Pro Asn Gly Glu Pro Ser Gln His Ser Ser Ala Pro Gln Lys Ser 85 90 95 Leu Pro Asp Leu Pro Pro Pro Lys Met Ile Pro Glu Arg Lys Gln Leu 100 105 110 Ala Ile Pro Lys Thr Glu Ser Pro Glu Gly Tyr Tyr Glu Glu Ala Glu 115 120 125 Pro Tyr Asp Thr Ser Leu Asn Glu Asp Gly Glu Ala Val Ser Ser Ser 130 135 140 Tyr Glu Ser Tyr Asp Glu Glu Asp Gly Ser Lys Gly Lys Ser Ala Pro 145 150 155 160 Tyr Gln Trp Pro Ser Pro Glu Ala Gly Ile Glu Leu Met Arg Asp Ala 165 170 175 Arg Ile Cys Ala Phe Leu Trp Arg Lys Lys Trp Leu Gly Gln Trp Ala 180 185 190 Lys Gln Leu Cys Val Ile Lys Asp Asn Arg Leu Leu Cys Tyr Lys Ser 195 200 205 Ser Lys Asp His Ser Pro Gln Leu Asp Val Asn Leu Leu Gly Ser Ser 210 215 220 Val Ile His Lys Glu Lys Gln Val Arg Lys Lys Glu His Lys Leu Lys 225 230 235 240 Ile Thr Pro Met Asn Ala Asp Val Ile Val Leu Gly Leu Gln Ser Lys 245 250 255 Asp Gln Ala Glu Gln Trp Leu Arg Val Ile Gln Glu Val Ser Gly Leu 260 265 270 Pro Ser Glu Gly Ala Ser Glu Gly Asn Gln Tyr Thr Pro Asp Ala Gln 275 280 285 Arg Phe Asn Cys Gln Lys Pro Asp Ile Ala Glu Lys Tyr Leu Ser Ala 290 295 300 Ser Glu Tyr Gly Ser Ser Val Asp Gly His Pro Glu Val Pro Glu Thr 305 310 315 320 Lys Asp Val Lys Lys Lys Cys Ser Ala Gly Leu Lys Leu Ser Asn Leu 325 330 335 Met Asn Leu Gly Arg Lys Lys Ser Thr Ser Leu Glu Pro Val Glu Arg 340 345 350 Ser Leu Glu Thr Ser Ser Tyr Leu Asn Val Leu Val Asn Ser Gln Trp 355 360 365 Lys Ser Arg Trp Cys Ser Val Arg Asp Asn His Leu His Phe Tyr Gln 370 375 380 Asp Arg Asn Arg Ser Lys Val Ala Gln Gln Pro Leu Ser Leu Val Gly 385 390 395 400 Cys Glu Val Val Pro Asp Pro Ser Pro Asp His Leu Tyr Ser Phe Arg 405 410 415 Ile Leu His Lys Gly Glu Glu Leu Ala Lys Leu Glu Ala Lys Ser Ser 420 425 430 Glu Glu Met Gly His Trp Leu Gly Leu Leu Leu Ser Glu Ser Gly Ser 435 440 445 Lys Thr Asp Pro Glu Glu Phe Thr Tyr Asp Tyr Val Asp Ala Asp Arg 450 455 460 Val Ser Cys Ile Val Ser Ala Ala Lys Asn Ser Leu Leu Leu Met Gln 465 470 475 480 Arg Lys Phe Ser Glu Pro Asn Thr Tyr Ile Asp Gly Leu Pro Ser Gln 485 490 495 Asp Arg Gln Glu Glu Leu Tyr Asp Asp Val Asp Leu Ser Glu Leu Thr 500 505 510 Ala Ala Val Glu Pro Thr Glu Glu Ala Thr Pro Val Ala Asp Asp Pro 515 520 525 Asn Glu Arg Glu Ser Asp Arg Val Tyr Leu Asp Leu Thr Pro Val Lys 530 535 540 Ser Phe Leu His Gly Pro Ser Ser Ala Gln Ala Gln Ala Ser Ser Pro 545 550 555 560 Thr Leu Ser Cys Leu Asp Asn Ala Thr Glu Ala Leu Pro Ala Asp Ser 565 570 575 Gly Pro Gly Pro Thr Pro Asp Glu Pro Cys Ile Lys Cys Pro Glu Asn 580 585 590 Leu Gly Glu Gln Gln Leu Glu Ser Leu Glu Pro Glu Asp Pro Ser Leu 595 600 605 Arg Ile Thr Thr Val Lys Ile Gln Thr Glu Gln Gln Arg Ile Ser Phe 610 615 620 Pro Pro Ser Cys Pro Asp Ala Val Val Ala Thr Pro Pro Gly Ala Ser 625 630 635 640 Pro Pro Val Lys Asp Arg Leu Arg Val Thr Ser Ala Glu Ile Lys Leu 645 650 655 Gly Lys Asn Arg Thr Glu Ala Glu Val Lys Arg Tyr Thr Glu Glu Lys 660 665 670 Glu Arg Leu Glu Lys Lys Lys Glu Glu Ile Arg Gly His Leu Ala Gln 675 680 685 Leu Arg Lys Glu Lys Arg Glu Leu Lys Glu Thr Leu Leu Lys Cys Thr 690 695 700 Asp Lys Glu Val Leu Ala Ser Leu Glu Gln Lys Leu Lys Glu Ile Asp 705 710 715 720 Glu Glu Cys Arg Gly Glu Glu Ser Arg Arg Val Asp Leu Glu Leu Ser 725 730 735 Ile Met Glu Val Lys Asp Asn Leu Lys Lys Ala Glu Ala Gly Pro Val 740 745 750 Thr Leu Gly Thr Thr Val Asp Thr Thr His Leu Glu Asn Val Ser Pro 755 760 765 Arg Pro Lys Ala Val Thr Pro Ala Ser Ala Pro Asp Cys Thr Pro Val 770 775 780 Asn Ser Ala Thr Thr Leu Lys Asn Arg Pro Leu Ser Val Val Val Thr 785 790 795 800 Gly Lys Gly Thr Val Leu Gln Lys Ala Lys Glu Trp Glu Lys Lys Gly 805 810 815 Ala Ser <210> 17 <211> 1606 <212> DNA <213> Homo sapiens <400> 17 aaatgtgacc ggccgcggct ccggcagtca acgcctgcct cctctcgagc gtcctcagcg 60 cagccgccgc ccgcggagcc agcacgaacg agcccagcac cggccggatg gagcgtccgc 120 aacccgacag catgccccag gatttgtcag aggccctgaa ggaggccacc aaggaggtgc 180 acacccaggc agagaatgct gagttcatga ggaactttca gaagggccag gtgacccgag 240 acggcttcaa gctggtgatg gcctccctgt accacatcta tgtggccctg gaggaggaga 300 ttgagcgcaa caaggagagc ccagtcttcg cccctgtcta cttcccagaa gagctgcacc 360 gcaaggctgc cctggagcag gacctggcct tctggtacgg gccccgctgg caggaggtca 420 tcccctacac accagccatg cagcgctatg tgaagcggct ccacgaggtg gggcgcacag 480 agcccgagct gctggtggcc cacgcctaca cccgctacct gggtgacctg tctgggggcc 540 aggtgctcaa aaagattgcc cagaaagccc tggacctgcc cagctctggc gagggcctgg 600 ccttcttcac cttccccaac attgccagtg ccaccaagtt caagcagctc taccgctccc 660 gcatgaactc cctggagatg actcccgcag tcaggcagag ggtgatagaa gaggccaaga 720 ctgcgttcct gctcaacatc cagctctttg aggagttgca ggagctgctg acccatgaca 780 ccaaggacca gagcccctca cgggcaccag ggcttcgcca gcgggccagc aacaaagtgc 840 aagattctgc ccccgtggag actcccagag ggaagccccc actcaacacc cgctcccagg 900 ctccgcttct ccgatgggtc cttacactca gctttctggt ggcgacagtt gctgtagggc 960 tttatgccat gtgaatgcag gcatgctggc tcccagggcc atgaactttg tccggtggaa 1020 ggccttcttt ctagagaggg aattctcttg gctggcttcc ttaccgtggg cactgaaggc 1080 tttcagggcc tccagccctc tcactgtgtc cctctctctg gaaaggagga aggagcctat 1140 ggcatcttcc ccaacgaaaa gcacatccag gcaatggcct aaacttcaga gggggcgaag 1200 ggatcagccc tgcccttcag catcctcagt tcctgcagca gagcctggaa gacaccctaa 1260 tgtggcagct gtctcaaacc tccaaaagcc ctgagtttca agtatccttg ttgacacggc 1320 catgaccact ttccccgtgg gccatggcaa tttttacaca aacctgaaaa gatgttgtgt 1380 cttgtgtttt tgtcttattt ttgttggagc cactctgttc ctggctcagc ctcaaatgca 1440 gtatttttgt tgtgttctgt tgtttttata gcagggttgg ggtggttttt gagccatgcg 1500 tgggtgggga gggaggtgtt taacggcact gtggccttgg tctaactttt gtgtgaaata 1560 ataaacaaca ttgtctgata gtagcttgaa aaaaaaaaaa aaaaaa 1606 <210> 18 <211> 288 <212> PRT <213> Homo sapiens <400> 18 Met Glu Arg Pro Gln Pro Asp Ser Met Pro Gln Asp Leu Ser Glu Ala 1 5 10 15 Leu Lys Glu Ala Thr Lys Glu Val His Thr Gln Ala Glu Asn Ala Glu 20 25 30 Phe Met Arg Asn Phe Gln Lys Gly Gln Val Thr Arg Asp Gly Phe Lys 35 40 45 Leu Val Met Ala Ser Leu Tyr His Ile Tyr Val Ala Leu Glu Glu Glu 50 55 60 Ile Glu Arg Asn Lys Glu Ser Pro Val Phe Ala Pro Val Tyr Phe Pro 65 70 75 80 Glu Glu Leu His Arg Lys Ala Ala Leu Glu Gln Asp Leu Ala Phe Trp 85 90 95 Tyr Gly Pro Arg Trp Gln Glu Val Ile Pro Tyr Thr Pro Ala Met Gln 100 105 110 Arg Tyr Val Lys Arg Leu His Glu Val Gly Arg Thr Glu Pro Glu Leu 115 120 125 Leu Val Ala His Ala Tyr Thr Arg Tyr Leu Gly Asp Leu Ser Gly Gly 130 135 140 Gln Val Leu Lys Lys Ile Ala Gln Lys Ala Leu Asp Leu Pro Ser Ser 145 150 155 160 Gly Glu Gly Leu Ala Phe Phe Thr Phe Pro Asn Ile Ala Ser Ala Thr 165 170 175 Lys Phe Lys Gln Leu Tyr Arg Ser Arg Met Asn Ser Leu Glu Met Thr 180 185 190 Pro Ala Val Arg Gln Arg Val Ile Glu Glu Ala Lys Thr Ala Phe Leu 195 200 205 Leu Asn Ile Gln Leu Phe Glu Glu Leu Gln Glu Leu Leu Thr His Asp 210 215 220 Thr Lys Asp Gln Ser Pro Ser Arg Ala Pro Gly Leu Arg Gln Arg Ala 225 230 235 240 Ser Asn Lys Val Gln Asp Ser Ala Pro Val Glu Thr Pro Arg Gly Lys 245 250 255 Pro Pro Leu Asn Thr Arg Ser Gln Ala Pro Leu Leu Arg Trp Val Leu 260 265 270 Thr Leu Ser Phe Leu Val Ala Thr Val Ala Val Gly Leu Tyr Ala Met 275 280 285 <210> 19 <211> 2207 <212> DNA <213> Homo sapiens <400> 19 cacttcctcc ccagacaggg gtagtgcgag gccgggcaca gccttcctgt gtggttttac 60 cgcccagaga gcgtcatgga cctggggaaa ccaatgaaaa gcgtgctggt ggtggctctc 120 cttgtcattt tccaggtatg cctgtgtcaa gatgaggtca cggacgatta catcggagac 180 aacaccacag tggactacac tttgttcgag tctttgtgct ccaagaagga cgtgcggaac 240 tttaaagcct ggttcctccc tatcatgtac tccatcattt gtttcgtggg cctactgggc 300 aatgggctgg tcgtgttgac ctatatctat ttcaagaggc tcaagaccat gaccgatacc 360 tacctgctca acctggcggt ggcagacatc ctcttcctcc tgacccttcc cttctgggcc 420 tacagcgcgg ccaagtcctg ggtcttcggt gtccactttt gcaagctcat ctttgccatc 480 tacaagatga gcttcttcag tggcatgctc ctacttcttt gcatcagcat tgaccgctac 540 gtggccatcg tccaggctgt ctcagctcac cgccaccgtg cccgcgtcct tctcatcagc 600 aagctgtcct gtgtgggcat ctggatacta gccacagtgc tctccatccc agagctcctg 660 tacagtgacc tccagaggag cagcagtgag caagcgatgc gatgctctct catcacagag 720 catgtggagg cctttatcac catccaggtg gcccagatgg tgatcggctt tctggtcccc 780 ctgctggcca tgagcttctg ttaccttgtc atcatccgca ccctgctcca ggcacgcaac 840 tttgagcgca acaaggccat caaggtgatc atcgctgtgg tcgtggtctt catagtcttc 900 cagctgccct acaatggggt ggtcctggcc cagacggtgg ccaacttcaa catcaccagt 960 agcacctgtg agctcagtaa gcaactcaac atcgcctacg acgtcaccta cagcctggcc 1020 tgcgtccgct gctgcgtcaa ccctttcttg tacgccttca tcggcgtcaa gttccgcaac 1080 gatctcttca agctcttcaa ggacctgggc tgcctcagcc aggagcagct ccggcagtgg 1140 tcttcctgtc ggcacatccg gcgctcctcc atgagtgtgg aggccgagac caccaccacc 1200 ttctccccat aggcgactct tctgcctgga ctagagggac ctctcccagg gtccctgggg 1260 tggggatagg gagcagatgc aatgactcag gacatccccc cgccaaaagc tgctcaggga 1320 aaagcagctc tcccctcaga gtgcaagccc ctgctccaga agatagcttc accccaatcc 1380 cagctacctc aaccaatgcc aaaaaaagac agggctgata agctaacacc agacagacaa 1440 cactgggaaa cagaggctat tgtcccctaa accaaaaact gaaagtgaaa gtccagaaac 1500 tgttcccacc tgctggagtg aaggggccaa ggagggtgag tgcaaggggc gtgggagtgg 1560 cctgaagagt cctctgaatg aaccttctgg cctcccacag actcaaatgc tcagaccagc 1620 tcttccgaaa accaggcctt atctccaaga ccagagatag tggggagact tcttggcttg 1680 gtgaggaaaa gcggacatca gctggtcaaa caaactctct gaacccctcc ctccatcgtt 1740 ttcttcactg tcctccaagc cagcgggaat ggcagctgcc acgccgccct aaaagcacac 1800 tcatcccctc acttgccgcg tcgccctccc aggctctcaa caggggagag tgtggtgttt 1860 cctgcaggcc aggccagctg cctccgcgtg atcaaagcca cactctgggc tccagagtgg 1920 ggatgacatg cactcagctc ttggctccac tgggatggga ggagaggaca agggaaatgt 1980 caggggcggg gagggtgaca gtggccgccc aaggcccacg agcttgttct ttgttctttg 2040 tcacagggac tgaaaacctc tcctcatgtt ctgctttcga ttcgttaaga gagcaacatt 2100 ttacccacac acagataaag ttttcccttg aggaaacaac agctttaaaa gaaaaagaaa 2160 aaaaaagtct ttggtaaatg gcaaaaaaaa aaaaaaaaaa aaaaaaa 2207 <210> 20 <211> 378 <212> PRT <213> Homo sapiens <400> 20 Met Asp Leu Gly Lys Pro Met Lys Ser Val Leu Val Val Ala Leu Leu 1 5 10 15 Val Ile Phe Gln Val Cys Leu Cys Gln Asp Glu Val Thr Asp Asp Tyr 20 25 30 Ile Gly Asp Asn Thr Thr Val Asp Tyr Thr Leu Phe Glu Ser Leu Cys 35 40 45 Ser Lys Lys Asp Val Arg Asn Phe Lys Ala Trp Phe Leu Pro Ile Met 50 55 60 Tyr Ser Ile Ile Cys Phe Val Gly Leu Leu Gly Asn Gly Leu Val Val 65 70 75 80 Leu Thr Tyr Ile Tyr Phe Lys Arg Leu Lys Thr Met Thr Asp Thr Tyr 85 90 95 Leu Leu Asn Leu Ala Val Ala Asp Ile Leu Phe Leu Leu Thr Leu Pro 100 105 110 Phe Trp Ala Tyr Ser Ala Ala Lys Ser Trp Val Phe Gly Val His Phe 115 120 125 Cys Lys Leu Ile Phe Ala Ile Tyr Lys Met Ser Phe Phe Ser Gly Met 130 135 140 Leu Leu Leu Leu Cys Ile Ser Ile Asp Arg Tyr Val Ala Ile Val Gln 145 150 155 160 Ala Val Ser Ala His Arg His Arg Ala Arg Val Leu Leu Ile Ser Lys 165 170 175 Leu Ser Cys Val Gly Ile Trp Ile Leu Ala Thr Val Leu Ser Ile Pro 180 185 190 Glu Leu Leu Tyr Ser Asp Leu Gln Arg Ser Ser Ser Glu Gln Ala Met 195 200 205 Arg Cys Ser Leu Ile Thr Glu His Val Glu Ala Phe Ile Thr Ile Gln 210 215 220 Val Ala Gln Met Val Ile Gly Phe Leu Val Pro Leu Leu Ala Met Ser 225 230 235 240 Phe Cys Tyr Leu Val Ile Ile Arg Thr Leu Leu Gln Ala Arg Asn Phe 245 250 255 Glu Arg Asn Lys Ala Ile Lys Val Ile Ile Ala Val Val Val Val Phe 260 265 270 Ile Val Phe Gln Leu Pro Tyr Asn Gly Val Val Leu Ala Gln Thr Val 275 280 285 Ala Asn Phe Asn Ile Thr Ser Ser Thr Cys Glu Leu Ser Lys Gln Leu 290 295 300 Asn Ile Ala Tyr Asp Val Thr Tyr Ser Leu Ala Cys Val Arg Cys Cys 305 310 315 320 Val Asn Pro Phe Leu Tyr Ala Phe Ile Gly Val Lys Phe Arg Asn Asp 325 330 335 Leu Phe Lys Leu Phe Lys Asp Leu Gly Cys Leu Ser Gln Glu Gln Leu 340 345 350 Arg Gln Trp Ser Ser Cys Arg His Ile Arg Arg Ser Ser Met Ser Val 355 360 365 Glu Ala Glu Thr Thr Thr Thr Phe Ser Pro 370 375

Claims (57)

  1. 개체에서 갑상선암을 진단하는 방법으로서,
    (a) 개체로부터 얻어진 갑상선 조직 시료의 3개 이상의 유전자 산물의 발현 수준을 측정하는 단계로, 여기서 상기 3개 이상의 유전자 산물이 표 1에 열거된 하나 이상의 유전자에 의해 발현되고 상기 유전자 산물의 적어도 하나가 CXCR3, CCR3, CXCL10, CAR, XB130, HO-1 또는 CCR7 유전자에 의해 발현되는 것인 단계; 및
    (b) 단계 (a)에서 측정된 발현 수준과 갑상선 조직 시료 내 갑상선암의 존재 또는 부재를 상관시킴으로써 상기 갑상선 조직 시료를 암성 또는 양성으로 동정하는 단계를 포함하는, 방법.
  2. 제1항에 있어서, 단계 (b)에서 상관시키는 것이 3개 이상의 유전자 산물의 발현 수준을 각각의 유전자 산물에 대한 정상 대조군 발현 수준과 비교함으로써 수행되고, 여기서 갑상선 조직 시료와 정상 대조군 발현 수준 사이에 3개 이상의 유전자 산물의 발현 수준에 차이가 있는 경우에 상기 갑상선 조직 시료가 암성으로 동정되는 것인, 방법.
  3. 제2항에 있어서, 갑상선 조직 시료와 정상 대조군 발현 수준 사이에 4개 이상의 유전자 산물의 발현 수준에 차이가 있는 경우에 상기 갑상선 조직 시료가 암성으로 동정되는 것인, 방법.
  4. 제2항 또는 제3항에 있어서, 상기 정상 대조군 발현 수준이 정상 갑상선 조직 시료 내 발현 수준인 것인, 방법.
  5. 제2항 또는 제3항에 있어서, 상기 정상 대조군 발현 수준이 복수 개의 정상 갑상선 조직 시료에서의 발현 수준을 기준으로 하는 미리 결정된 값인 것인, 방법.
  6. 제2항 내지 제5항 중 어느 한 항에 있어서, 정상 대조군 발현 수준에 비해 갑상선 조직 시료에서 CXCR3, CXCL11, SPAG-9, CAR, 넥틴-1, XB-130 및/또는 CXCL4 유전자의 임의의 하나 이상의 발현 수준이 감소하거나/하고; CXCR3A, CXCR3B, CXCR4, CCR3, CXCL9, CXCL10, CK-19, TIMP-1, CLDN-1, 및/또는 CCR7 유전자의 임의의 하나 이상의 발현 수준이 증가하고, 증가 또는 감소한 발현을 나타내는 유전자의 총 개수가 적어도 3개인 경우에, 상기 갑상선 조직 시료가 암성으로 동정되는 것인, 방법.
  7. 제1항에 있어서, 단계 (b)에서 상관시키는 것이 3개 이상의 유전자 산물의 발현 수준을 각각의 유전자 산물에 대한 암 대조군 발현 수준과 비교함으로써 수행되고, 여기서 갑상선 조직 시료와 암 대조군 발현 수준 사이에 3개 이상의 유전자 산물의 발현 수준에서 실질적으로 차이가 없는 경우에 상기 갑상선 조직 시료가 암성으로 동정되는 것인, 방법.
  8. 제7항에 있어서, 갑상선 조직 시료와 암 대조군 발현 수준 사이에 4개 이상의 유전자 산물의 발현 수준에서 실질적으로 차이가 없는 경우에, 상기 갑상선 조직 시료가 암성으로 동정되는 것인, 방법.
  9. 제7항 또는 제8항에 있어서, 상기 암 대조군 발현 수준이 암성 갑상선 조직 시료에서의 발현 수준인 것인, 방법.
  10. 제7항 또는 제8항에 있어서, 상기 암 대조군 발현 수준이 복수 개의 암성 갑상선 조직 시료에서의 발현 수준을 토대로 미리 결정된 값인 것인, 방법.
  11. 제1항에 있어서, 단계 (b)에서 상관시키는 것이 하기 2개 세트의 생물학적 시료, 즉 (i)복수 개의 정상 갑상선 조직 시료; 및 (ii) 복수 개의 암성 갑상선 조직 시료에서 3개 이상의 유전자 산물에 대해 측정된 유전자 발현 데이터에 대해 발현 수준을 비교하는 것을 포함하고, 여기서 갑상선 조직 시료와 (i)의 유전자 발현 데이터 사이에서 3개 이상의 유전자 산물의 발현 수준에 차이가 있는 경우에, 또는 갑상선 조직 시료와 (ii)의 유전자 발현 데이터 사이에서 1개 이상의 유전자 산물의 유전자 발현 수준에 실질적으로 차이가 없는 경우에, 상기 갑상선 조직 시료가 암성으로 동정되는 것인, 방법.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 단계 (b)에서 상관시키는 것이 비정형 CT 값 및/또는 비-비정형 CT 값을 동정하는 분류자(classifier)를 사용하여 수행되는 것인, 방법.
  13. 제12항에 있어서, 상기 분류자가 복수 개의 정상 갑상선 조직 시료 및/또는 암성 갑상선 조직 시료로부터의 3개 이상의 유전자 산물에 대해 측정된 유전자 발현 데이터를 사용하여 생성되었던 것인, 방법.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, 상기 갑상선 조직 시료가 침 흡인, 세침 흡인, 코어 침 생검, 진공 보조 생검, 대형 코어 생검, 절개 생검, 절제 생검, 또는 펀치 생검에 의해 얻어진 것인, 방법.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서, 상기 유전자 산물이 RNA인 것인, 방법.
  16. 제15항에 있어서, 상기 RNA가 mRNA, rRNA, tRNA, 또는 miRNA인 것인, 방법.
  17. 제15항 또는 제16항에 있어서, 상기 RNA 발현 수준이 마이크로어레이, SAGE, 블롯팅, RT-PCR, 정량적 PCR, 분자적 바-코딩 기술, TRAC, PCR 어레이, 멀티플렉스 qPCR 또는 qNPA에 의해 측정되는 것인, 방법.
  18. 제1항 내지 제14항 중 어느 한 항에 있어서, 상기 유전자 산물이 단백질인 것인, 방법.
  19. 제18항에 있어서, 상기 단백질 유전자 발현이 ELISA, 질량 분광광도법, 블롯팅, 단백질체학 기술, 또는 면역조직화학을 이용하여 측정되는 것인, 방법.
  20. 제1항 내지 제19항 중 어느 한 항에 있어서, 상기 3개 이상의 유전자 산물이:
    (i) CXCR3, CCR3, CXCL10, CK19, TIMP-1, CLDN-1, CAR, XB130, HO-1 및 CCR7 유전자의 3개 이상의 유전자 산물;
    (ii) CXCR3, CCR3, CXCL10, CK19, TIMP-1, CLDN-1, CAR, HO-1 및 CCR7 유전자의 유전자 산물;
    (iii) CCR3, TIMP-1, CAR 및 XB130 유전자의 유전자 산물;
    (iv) CXCL10, TIMP-1, CAR 및 CCR7유전자의 유전자 산물;
    (v) TIMP-1, CAR 및 CCR7 유전자의 유전자 산물; 또는
    (vi) CXCL10, TIMP-1, CLDN-1, 및 CCR7 유전자의 유전자 산물을 포함하거나 이들로 이루어진 것인, 방법.
  21. 제1항 내지 제20항 중 어느 한 항에 있어서, 예비적 진단을 얻기 위하여 단계 (a) 전에 개체로부터 얻어진 갑상선 조직시료에 대해 세포학적 분석을 수행하는 단계를 추가로 포함하는 방법.
  22. 제21항에 있어서, 중간 또는 불확정 예비적 진단을 갖는 시료가 단계 (a) 및 단계 (b)의 방법에 의해 추가로 분석되는 것인 방법.
  23. 제21항 또는 제22항에 있어서, 상기 세포학적으로 분석된 조직 시료 및 단계 (a)에서 사용된 조직 시료가 동일한 조직 시료인 것인 방법.
  24. 제23항에 있어서, 상기 조직 시료가 세침 흡인에 의해 얻어진 것인, 방법.
  25. 제1항 내지 제24항 중 어느 한 항에 있어서, 상기 갑상선 조직 시료가 92% 또는 그 이상 또는 97% 또는 그 이상의 민감도로 암성 또는 양성으로 진단되는 것인, 방법.
  26. 제1항 내지 제24항 중 어느 한 항에 있어서, 상기 갑상선 조직 시료가 60% 이상 또는 90% 이상의 특이성으로 암성 또는 양성으로 진단되는 것인, 방법.
  27. 제1항 내지 제24항 중 어느 한 항에 있어서, 상기 갑상선 조직 시료가 50% 또는 그 이상 또는 90% 또는 그 이상의 양성 예측치로 암성 또는 양성으로 진단되는 것인, 방법.
  28. 제1항 내지 제24항 중 어느 한 항에 있어서, 상기 갑상선 조직 시료가 92% 또는 그 이상 또는 94% 또는 그 이상의 음성 예측치로 암성 또는 양성으로 진단되는 것인, 방법.
  29. 제1항 내지 제24항 중 어느 한 항에 있어서, 상기 갑상선 조직 시료가 2 또는 그 이상 또는 10 또는 그 이상의 양성 우도비 (likelihood ratio)로 암성 또는 양성으로 진단되는 것인, 방법.
  30. 제1항 내지 제24항 중 어느 한 항에 있어서, 상기 갑상선 조직 시료가 50% 또는 그 이상 또는 80% 또는 그 이상의 양성 검사 후 (post-test) 확률로 암성 또는 양성으로 진단되는 것인, 방법.
  31. 제1항 내지 제24항 중 어느 한 항에 있어서, 상기 갑상선 조직 시료가 0.14 또는 그 미만 또는 0.08 또는 그 미만의 음성 우도비로 암성 또는 양성으로 진단되는 것인, 방법.
  32. 제1항 내지 제24항 중 어느 한 항에 있어서, 상기 갑상선 조직 시료가 7.0% 또는 그 미만 또는 3.0% 또는 그 미만의 음성 검사 후 확률로 암성 또는 양성으로 진단되는 것인, 방법.
  33. 제1항 내지 제32항 중 어느 한 항에 있어서, 개체로부터 갑상선 조직 시료를 얻는 단계를 추가로 포함하는 방법.
  34. 제1항 내지 제33항 중 어느 한 항에 있어서, 상기 갑상선 조직 시료가 암성으로 진단된 경우, 개체의 갑상선 또는 이의 일부를 외과적으로 제거하는 단계를 추가로 포함하는 방법.
  35. 유전자 산물을 검출하기 위한 3개 이상의 시약을 포함하는 갑상선암을 진단하기 위한 키트로서, 여기서 상기 3개 이상의 시약이 각각 상이한 유전자 산물을 검출하고, 상기 유전자 산물이 표 1에 열거된 하나 이상의 유전자에 의해 발현되고, 상기 유전자 산물의 적어도 하나가 CXCR3, CCR3, CXCL10, CAR, XB130, HO-1 또는 CCR7 유전자에 의해 발현되는 것인, 키트.
  36. 제35항에 있어서, 상기 시약이 항체이고, 각각의 항체가 폴리펩티드 유전자 산물에 특이적으로 결합하는 것인, 키트.
  37. 제35항에 있어서, 상기 시약이 올리고뉴클레오티드 또는 올리고뉴클레오티드의 세트이고, 각각의 올리고뉴클레오티드가 핵산 유전자 산물에 특이적으로 결합하는 것인, 키트.
  38. 제35항 내지 제37항 중 어느 한 항에 있어서, 상기 시약이 각각 기질에 부착되는 것인, 키트.
  39. 제38항에 있어서, 상기 시약이 상기 기질에 공유적으로 부착되는 것인, 키트.
  40. 제38항 또는 제39항에 있어서, 상기 시약이 고체 기질의 별개의 영역에 각각 부착되는 것인, 키트.
  41. 제35항 및 제37항 내지 제40항 중 어느 한 항에 있어서, 상기 시약이 고체 기질에 공유적으로 결합한 올리고뉴클레오티드 또는 올리고뉴클레오티드의 세트이고, 상기 고체 기질이 선택적으로 어레이이고, 상기 어레이가 선택적으로 마이크로어레이인 것인, 키트.
  42. 제35항 또는 제37항에 있어서, 상기 시약이 올리고뉴클레오티드의 세트이고, 상기 올리고뉴클레오티드의 세트가 DNA를 포함하는 것인, 키트.
  43. 제35항 또는 제37항에 있어서, 상기 시약이 올리고뉴클레오티드의 세트이고, 상기 올리고뉴클레오티드의 각각의 세트가 유전자 산물의 하나에 특이적으로 혼성화하는 것인, 키트.
  44. 제43항에 있어서, 상기 올리고뉴클레오티드의 각각의 세트가 유전자 산물의 하나를 PCR 증폭할 수 있는 증폭 프라이머를 포함하는 것인, 키트.
  45. 제35항 내지 제44항 중 어느 한 항에 있어서, 상기 유전자 산물이:
    (i) CXCR3, CCR3, CXCL10, CK19, TIMP-1, CLDN-1, CAR, XB130, HO-1 및 CCR7 유전자의 3개 이상의 유전자 산물;
    (ii) CXCR3, CCR3, CXCL10, CK19, TIMP-1, CLDN-1, CAR, HO-1 및 CCR7 유전자의 유전자 산물;
    (iii) CCR3, TIMP-1, CAR 및 XB130 유전자의 유전자 산물;
    (iv) CXCL10, TIMP-1, CAR 및 CCR7 유전자의 유전자 산물;
    (v) TIMP-1, CAR 및 CCR7 유전자의 유전자 산물; 또는
    (vi) CXCL10, TIMP-1, CLDN-1, 및 CCR7 유전자의 유전자 산물을 포함하거나 이들로 이루어지는 것인, 키트.
  46. 제35항 내지 제45항 중 어느 한 항에 있어서, 상기 시약이 표지되는 것인, 키트.
  47. 제43항 내지 제47항 중 어느 한 항에 있어서, 상기 키트가 상기 시약을 상기 유전자 산물에 결합시키기에 적합한 하나 이상의 용액을 추가로 포함하는 것인, 키트.
  48. 제46항 또는 제47항에 있어서, 상기 시약이 올리고뉴클레오티드의 세트이고, 상기 키트가 PCR 어세이를 수행하기 위한 하나 이상의 부가적인 시약을 추가로 포함하는 것인, 키트.
  49. 제48항에 있어서, 상기 하나 이상의 부가적인 시약이 열안정성 폴리머라제, 데옥시뉴클레오티드의 혼합물, 및 검출가능하게 표지된 프로브로부터 선택되는 것인, 키트.
  50. 제49항에 있어서, 상기 검출가능하게 표지된 프로브가 형광단 및 소광 모이어티를 포함하는 것인, 키트.
  51. 제49항 또는 제50항에 있어서, 상기 검출가능하게 표지된 프로브가 상기 프로브가 온전한 상태가 아닌 절단되는 경우에 검출가능한 신호를 방출하는 것인, 키트.
  52. 제35항 내지 제51항 중 어느 한 항에 있어서, 상기 키트가 갑상선 조직 시료를 처리하기 위한 하나 이상의 시료를 추가로 포함하는 것인, 키트.
  53. 제52항에 있어서, 상기 갑상선 조직 시료의 처리가 갑상선 조직 시료로부터 유전자 산물을 추출하는 것을 포함하는 것인, 키트.
  54. 제53항에 있어서, 상기 유전자 산물이 단백질 또는 핵산인 것인, 키트.
  55. 제35항 내지 제54항 중 어느 한 항에 있어서, 하나 이상의 대조군 유전자 산물을 추가로 포함하는 키트.
  56. 제35항 내지 제55항 중 어느 한 항에 있어서, 유전자 산물을 검출하기 위한 시약, 용액, 부가적인 시약, 및 대조군 유전자 산물의 하나 이상이 별개의 용기에 담겨 있는 것인, 키트.
  57. 갑상선암을 치료하는 방법으로서:
    (a) 개체로부터 얻어진 갑상선 조직시료를 제1항 내지 제34항 중 어느 한 항의 방법에 따라서 또는 제35항 내지 제56항 중 어느 한 항의 키트를 사용하여 암성으로 동정하는 단계; 및
    (b) 개체의 갑상선 또는 그의 일부를 수술로 제거하거나, 개체에 방사선 요법, 화학요법, 또는 호르몬 요법을 수행하는 단계를 포함하는, 방법.
KR1020157017018A 2012-11-27 2013-11-26 갑상선 종양을 진단하기 위한 조성물 및 방법 KR102174578B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201261730391P 2012-11-27 2012-11-27
US61/730,391 2012-11-27
US201361775419P 2013-03-08 2013-03-08
US61/775,419 2013-03-08
PCT/US2013/071970 WO2014085434A1 (en) 2012-11-27 2013-11-26 Compositions and methods for diagnosing thyroid tumors

Publications (2)

Publication Number Publication Date
KR20150100698A true KR20150100698A (ko) 2015-09-02
KR102174578B1 KR102174578B1 (ko) 2020-11-06

Family

ID=49880965

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020157017018A KR102174578B1 (ko) 2012-11-27 2013-11-26 갑상선 종양을 진단하기 위한 조성물 및 방법

Country Status (13)

Country Link
US (2) US10260103B2 (ko)
EP (1) EP2925886B1 (ko)
JP (1) JP6309019B2 (ko)
KR (1) KR102174578B1 (ko)
CN (1) CN104937111B (ko)
AU (1) AU2013352339B2 (ko)
BR (1) BR112015012239B1 (ko)
CA (1) CA2892822C (ko)
HK (1) HK1213947A1 (ko)
MX (1) MX367366B (ko)
NZ (1) NZ709167A (ko)
WO (1) WO2014085434A1 (ko)
ZA (1) ZA201504663B (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220021805A (ko) * 2020-08-14 2022-02-22 연세대학교 산학협력단 조직 검사 방법 및 조직 검사 장치

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8338109B2 (en) 2006-11-02 2012-12-25 Mayo Foundation For Medical Education And Research Predicting cancer outcome
WO2009143603A1 (en) 2008-05-28 2009-12-03 Genomedx Biosciences, Inc. Systems and methods for expression-based discrimination of distinct clinical disease states in prostate cancer
US10407731B2 (en) 2008-05-30 2019-09-10 Mayo Foundation For Medical Education And Research Biomarker panels for predicting prostate cancer outcomes
US9495515B1 (en) 2009-12-09 2016-11-15 Veracyte, Inc. Algorithms for disease diagnostics
US10236078B2 (en) 2008-11-17 2019-03-19 Veracyte, Inc. Methods for processing or analyzing a sample of thyroid tissue
US9074258B2 (en) 2009-03-04 2015-07-07 Genomedx Biosciences Inc. Compositions and methods for classifying thyroid nodule disease
WO2010129934A2 (en) 2009-05-07 2010-11-11 Veracyte, Inc. Methods and compositions for diagnosis of thyroid conditions
US10446272B2 (en) 2009-12-09 2019-10-15 Veracyte, Inc. Methods and compositions for classification of samples
AU2012352153B2 (en) 2011-12-13 2018-07-26 Veracyte, Inc. Cancer diagnostics using non-coding transcripts
EP2885640B1 (en) 2012-08-16 2018-07-18 Genomedx Biosciences, Inc. Prostate cancer prognostics using biomarkers
JP6309019B2 (ja) 2012-11-27 2018-04-11 ポンティフィシア・ウニベルシダッド・カトリカ・デ・チレPontificia Universidad Catolica de Chile 甲状腺腫瘍を診断するための組成物および方法
WO2014186036A1 (en) 2013-03-14 2014-11-20 Allegro Diagnostics Corp. Methods for evaluating copd status
CN114606309A (zh) 2014-11-05 2022-06-10 威拉赛特公司 使用机器学习和高维转录数据的诊断系统和方法
JP6144314B2 (ja) * 2015-10-30 2017-06-07 株式会社Ubic データ分類システム,方法,プログラムおよびその記録媒体
WO2017117523A1 (en) * 2015-12-31 2017-07-06 Quest Diagnostics Investments Llc Compositions and methods for screening mutations in thyroid cancer
US11486873B2 (en) 2016-03-31 2022-11-01 Ontera Inc. Multipore determination of fractional abundance of polynucleotide sequences in a sample
EP3504348B1 (en) 2016-08-24 2022-12-14 Decipher Biosciences, Inc. Use of genomic signatures to predict responsiveness of patients with prostate cancer to post-operative radiation therapy
KR102543773B1 (ko) 2016-09-02 2023-06-16 더 보드 오브 리젠츠 오브 더 유니버시티 오브 텍사스 시스템 수집 프로브 및 이들의 사용 방법
RU2018142223A (ru) 2016-10-24 2020-05-29 Онтера Инк. Фракционная распространенность полинуклеотидных последовательностей в образце
CA3050984A1 (en) 2017-01-20 2018-07-26 Decipher Biosciences, Inc. Molecular subtyping, prognosis, and treatment of bladder cancer
EP3593140A4 (en) 2017-03-09 2021-01-06 Decipher Biosciences, Inc. SUBTYPING PROSTATE CANCER TO PREDICT RESPONSE TO HORMONE THERAPY
WO2018205035A1 (en) 2017-05-12 2018-11-15 Genomedx Biosciences, Inc Genetic signatures to predict prostate cancer metastasis and identify tumor agressiveness
US11217329B1 (en) 2017-06-23 2022-01-04 Veracyte, Inc. Methods and systems for determining biological sample integrity
CN111566481A (zh) 2017-11-27 2020-08-21 得克萨斯州大学系统董事会 微创收集探头及其使用方法
WO2019165351A1 (en) * 2018-02-23 2019-08-29 Board Of Regents, The University Of Texas System Tissue analysis by mass spectrometry
CN109457032B (zh) * 2018-12-20 2022-04-12 北京优迅医学检验实验室有限公司 甲状腺癌分子诊断试剂盒
CN109847072A (zh) * 2019-02-27 2019-06-07 四川大学华西医院 一种甲状旁腺血供检测试剂盒
RU2712080C1 (ru) * 2019-05-14 2020-01-24 Федеральное государственное автономное образовательное учреждение высшего образования "Дальневосточный федеральный университет" (ДВФУ) Способ проведения цитологического исследования при дифференциальной диагностике узловых образований щитовидной железы
EP3973080A4 (en) * 2019-05-22 2023-05-31 Grail, LLC SYSTEMS AND METHODS FOR DETERMINING IF AN INDIVIDUAL HAS DISEASE OF CANCER USING TRANSFER LEARNING
WO2021138661A1 (en) * 2020-01-03 2021-07-08 The University Of Toledo Stratifying risk of malignancy in indeterminate thyroid nodules and immuno-genomic markers for early detection of thyroid cancer
EP4269613A1 (en) 2020-12-24 2023-11-01 Pontificia Universidad Católica De Chile In-vitro method for diagnosing and predicting the aggressiveness of thyroid cancer, and the precision surgery options and type to be used to remove a tumour from a patient; kit; reagents forming the kit; and use of the reagents and use of molecular markers as part of the method
EP4023770A1 (en) 2021-01-05 2022-07-06 Narodowy Instytut Onkologii im. Marii Sklodowskiej-Curie Panstwowy Instytut Oddzial w Gliwicach A method of examining genes for the diagnosis of thyroid tumors, a set for the diagnosis of thyroid tumors and application
WO2022210783A1 (ja) * 2021-03-30 2022-10-06 学校法人日本医科大学 甲状腺濾胞癌特異的マーカー

Family Cites Families (122)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
US4800159A (en) 1986-02-07 1989-01-24 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences
US5766960A (en) 1987-07-27 1998-06-16 Australian Membrane And Biotechnology Research Institute Receptor membranes
US5130238A (en) 1988-06-24 1992-07-14 Cangene Corporation Enhanced nucleic acid amplification process
GB8822228D0 (en) 1988-09-21 1988-10-26 Southern E M Support-bound oligonucleotides
US5856092A (en) 1989-02-13 1999-01-05 Geneco Pty Ltd Detection of a nucleic acid sequence or a change therein
US6040138A (en) 1995-09-15 2000-03-21 Affymetrix, Inc. Expression monitoring by hybridization to high density oligonucleotide arrays
US5800992A (en) 1989-06-07 1998-09-01 Fodor; Stephen P.A. Method of detecting nucleic acids
US5871928A (en) 1989-06-07 1999-02-16 Fodor; Stephen P. A. Methods for nucleic acid analysis
US6309822B1 (en) 1989-06-07 2001-10-30 Affymetrix, Inc. Method for comparing copy number of nucleic acid sequences
US5547839A (en) 1989-06-07 1996-08-20 Affymax Technologies N.V. Sequencing of surface immobilized polymers utilizing microflourescence detection
US5925525A (en) 1989-06-07 1999-07-20 Affymetrix, Inc. Method of identifying nucleotide differences
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
AU650622B2 (en) 1989-07-11 1994-06-30 Gen-Probe Incorporated Nucleic acid sequence amplification methods utilizing a transcription complex
CA2020958C (en) 1989-07-11 2005-01-11 Daniel L. Kacian Nucleic acid sequence amplification methods
US5455166A (en) 1991-01-31 1995-10-03 Becton, Dickinson And Company Strand displacement amplification
US5936731A (en) 1991-02-22 1999-08-10 Applied Spectral Imaging Ltd. Method for simultaneous detection of multiple fluorophores for in situ hybridization and chromosome painting
US5270184A (en) 1991-11-19 1993-12-14 Becton, Dickinson And Company Nucleic acid target generation
US5412087A (en) 1992-04-24 1995-05-02 Affymax Technologies N.V. Spatially-addressable immobilization of oligonucleotides and other biological polymers on surfaces
US5541061A (en) 1992-04-29 1996-07-30 Affymax Technologies N.V. Methods for screening factorial chemical libraries
EP0705271B1 (en) 1993-06-25 2002-11-13 Affymetrix, Inc. (a Delaware Corporation) Hybridization and sequencing of nucleic acids
US5858659A (en) 1995-11-29 1999-01-12 Affymetrix, Inc. Polymorphism detection
US6045996A (en) 1993-10-26 2000-04-04 Affymetrix, Inc. Hybridization assays on oligonucleotide arrays
US6090555A (en) 1997-12-11 2000-07-18 Affymetrix, Inc. Scanned image alignment systems and methods
CA2185239C (en) 1994-03-16 2002-12-17 Nanibhushan Dattagupta Isothermal strand displacement nucleic acid amplification
US5648211A (en) 1994-04-18 1997-07-15 Becton, Dickinson And Company Strand displacement amplification using thermophilic enzymes
US5571639A (en) 1994-05-24 1996-11-05 Affymax Technologies N.V. Computer-aided engineering system for design of sequence arrays and lithographic masks
US6287850B1 (en) 1995-06-07 2001-09-11 Affymetrix, Inc. Bioarray chip reaction apparatus and its manufacture
US6379897B1 (en) 2000-11-09 2002-04-30 Nanogen, Inc. Methods for gene expression monitoring on electronic microarrays
US5795716A (en) 1994-10-21 1998-08-18 Chee; Mark S. Computer-aided visualization and analysis system for sequence evaluation
US5545531A (en) 1995-06-07 1996-08-13 Affymax Technologies N.V. Methods for making a device for concurrently processing multiple biological chip assays
US5733729A (en) 1995-09-14 1998-03-31 Affymetrix, Inc. Computer-aided probability base calling for arrays of nucleic acid probes on chips
US5843655A (en) 1995-09-18 1998-12-01 Affymetrix, Inc. Methods for testing oligonucleotide arrays
US6300063B1 (en) 1995-11-29 2001-10-09 Affymetrix, Inc. Polymorphism detection
EP0880598A4 (en) 1996-01-23 2005-02-23 Affymetrix Inc RAPID EVALUATION OF NUCLEIC ACID ABUNDANCE DIFFERENCE, WITH A HIGH-DENSITY OLIGONUCLEOTIDE SYSTEM
US5837196A (en) 1996-01-26 1998-11-17 The Regents Of The University Of California High density array fabrication and readout method for a fiber optic biosensor
WO1997029212A1 (en) 1996-02-08 1997-08-14 Affymetrix, Inc. Chip-based speciation and phenotypic characterization of microorganisms
US6114122A (en) 1996-03-26 2000-09-05 Affymetrix, Inc. Fluidics station with a mounting system and method of using
US6238866B1 (en) 1996-04-16 2001-05-29 The United States Of America As Represented By The Secretary Of The Army Detector for nucleic acid typing and methods of using the same
GB9609262D0 (en) 1996-05-02 1996-07-03 Isis Innovation Peptide library and method
US5958342A (en) 1996-05-17 1999-09-28 Incyte Pharmaceuticals, Inc. Jet droplet device
US5853993A (en) 1996-10-21 1998-12-29 Hewlett-Packard Company Signal enhancement method and kit
DE69727489T2 (de) 1996-11-06 2004-11-25 Sequenom, Inc., San Diego Verfahren zur massenspektrometrie
US5804386A (en) 1997-01-15 1998-09-08 Incyte Pharmaceuticals, Inc. Sets of labeled energy transfer fluorescent primers and their use in multi component analysis
US6309824B1 (en) 1997-01-16 2001-10-30 Hyseq, Inc. Methods for analyzing a target nucleic acid using immobilized heterogeneous mixtures of oligonucleotide probes
DE69833758T2 (de) 1997-06-13 2006-08-31 Affymetrix, Inc. (n.d.Ges.d.Staates Delaware), Santa Clara Verfahren zur erkennung von genpolymorphismen und allelexpression unter verwendung von sondenchips
US6333179B1 (en) 1997-06-20 2001-12-25 Affymetrix, Inc. Methods and compositions for multiplex amplification of nucleic acids
DE69823206T2 (de) 1997-07-25 2004-08-19 Affymetrix, Inc. (a Delaware Corp.), Santa Clara Verfahren zur herstellung einer bio-informatik-datenbank
US6420108B2 (en) 1998-02-09 2002-07-16 Affymetrix, Inc. Computer-aided display for comparative gene expression
AU9198298A (en) 1997-08-15 1999-03-08 Affymetrix, Inc. Polymorphism detection utilizing clustering analysis
US6511803B1 (en) 1997-10-10 2003-01-28 President And Fellows Of Harvard College Replica amplification of nucleic acid arrays
US6033860A (en) 1997-10-31 2000-03-07 Affymetrix, Inc. Expression profiles in adult and fetal organs
US6054274A (en) 1997-11-12 2000-04-25 Hewlett-Packard Company Method of amplifying the signal of target nucleic acid sequence analyte
US6013449A (en) 1997-11-26 2000-01-11 The United States Of America As Represented By The Department Of Health And Human Services Probe-based analysis of heterozygous mutations using two-color labelling
JP2002502038A (ja) 1998-01-29 2002-01-22 ミラー,サミュエル プロテオーム分析のための高密度アレイ及びその方法及び組成物
US6280954B1 (en) 1998-02-02 2001-08-28 Amersham Pharmacia Biotech Ab Arrayed primer extension technique for nucleic acid analysis
US6083726A (en) 1998-02-03 2000-07-04 Lucent Technologies, Inc. Methods for polynucleotide synthesis and articles for polynucleotide hybridization
WO1999040434A1 (en) 1998-02-04 1999-08-12 Invitrogen Corporation Microarrays and uses therefor
US6020135A (en) 1998-03-27 2000-02-01 Affymetrix, Inc. P53-regulated genes
US6004755A (en) 1998-04-07 1999-12-21 Incyte Pharmaceuticals, Inc. Quantitative microarray hybridizaton assays
US6284497B1 (en) 1998-04-09 2001-09-04 Trustees Of Boston University Nucleic acid arrays and methods of synthesis
US6525185B1 (en) 1998-05-07 2003-02-25 Affymetrix, Inc. Polymorphisms associated with hypertension
US6268210B1 (en) 1998-05-27 2001-07-31 Hyseq, Inc. Sandwich arrays of biological compounds
US6306643B1 (en) 1998-08-24 2001-10-23 Affymetrix, Inc. Methods of using an array of pooled probes in genetic analysis
US6185561B1 (en) 1998-09-17 2001-02-06 Affymetrix, Inc. Method and apparatus for providing and expression data mining database
US6203989B1 (en) 1998-09-30 2001-03-20 Affymetrix, Inc. Methods and compositions for amplifying detectable signals in specific binding assays
US6316193B1 (en) 1998-10-06 2001-11-13 Origene Technologies, Inc. Rapid-screen cDNA library panels
US6262216B1 (en) 1998-10-13 2001-07-17 Affymetrix, Inc. Functionalized silicon compounds and methods for their synthesis and use
AU2144000A (en) 1998-10-27 2000-05-15 Affymetrix, Inc. Complexity management and analysis of genomic dna
US6263287B1 (en) 1998-11-12 2001-07-17 Scios Inc. Systems for the analysis of gene expression data
US6309828B1 (en) 1998-11-18 2001-10-30 Agilent Technologies, Inc. Method and apparatus for fabricating replicate arrays of nucleic acid molecules
US6245518B1 (en) 1998-12-11 2001-06-12 Hyseq, Inc. Polynucleotide arrays and methods of making and using the same
US6351712B1 (en) 1998-12-28 2002-02-26 Rosetta Inpharmatics, Inc. Statistical combining of cell expression profiles
AU2965500A (en) 1999-01-15 2000-08-01 Gene Logic, Inc. Immobilized nucleic acid hybridization reagent and method
US6251601B1 (en) 1999-02-02 2001-06-26 Vysis, Inc. Simultaneous measurement of gene expression and genomic abnormalities using nucleic acid microarrays
US6329145B1 (en) 1999-02-09 2001-12-11 Gilead Science, Inc. Determining non-nucleic acid molecule binding to target by competition with nucleic acid ligand
US6177248B1 (en) 1999-02-24 2001-01-23 Affymetrix, Inc. Downstream genes of tumor suppressor WT1
AU773291B2 (en) 1999-03-10 2004-05-20 Government of The United States of America, as represented by The Secretary Department of Health & Human Services, The National Institutes of Health, The UPA, a universal protein array system
AU4058100A (en) 1999-04-09 2000-11-14 Arcturus Engineering, Inc. Generic cdna or protein array for customized assays
US6284465B1 (en) 1999-04-15 2001-09-04 Agilent Technologies, Inc. Apparatus, systems and method for locating nucleic acids bound to surfaces
US6268141B1 (en) 1999-05-12 2001-07-31 Beckman Coulter, Inc. Immobilization of unmodified biopolymers to acyl fluoride activated substrates
EP1206577B1 (en) 1999-08-13 2006-03-01 Yale University Binary encoded sequence tags
US6171797B1 (en) 1999-10-20 2001-01-09 Agilent Technologies Inc. Methods of making polymeric arrays
US6372431B1 (en) 1999-11-19 2002-04-16 Incyte Genomics, Inc. Mammalian toxicological response markers
DE19957827C2 (de) 1999-11-25 2003-06-12 Epigenomics Ag Verwendung eines Oligomer-Arrays mit PNA- und/oder DNA-Oligomeren auf einer Oberfläche
US6383749B2 (en) 1999-12-02 2002-05-07 Clontech Laboratories, Inc. Methods of labeling nucleic acids for use in array based hybridization assays
US20010046674A1 (en) 2000-02-03 2001-11-29 Andrew Ellington Signaling aptamers that transduce molecular recognition to a differential signal
US6267152B1 (en) 2000-02-18 2001-07-31 Wisconsin Label Corporation Hang tag and method of applying hang tag to an elongated object
US6376191B1 (en) 2000-03-22 2002-04-23 Mergen, Ltd. Microarray-based analysis of polynucleotide sequence variations
WO2001088162A2 (en) 2000-05-16 2001-11-22 Genway Biotech, Inc. Methods and vectors for generating antibodies in avian species and uses therefor
ATE360207T1 (de) 2000-06-05 2007-05-15 Novartis Vaccines & Diagnostic Mikroarrays für durchführen von proteomanalyse
US6531283B1 (en) 2000-06-20 2003-03-11 Molecular Staging, Inc. Protein expression profiling
US6386749B1 (en) 2000-06-26 2002-05-14 Affymetrix, Inc. Systems and methods for heating and mixing fluids
US6380377B1 (en) 2000-07-14 2002-04-30 Applied Gene Technologies, Inc. Nucleic acid hairpin probes and uses thereof
WO2002031463A2 (en) 2000-08-31 2002-04-18 Motorola, Inc. High density column and row addressable electrode arrays
JP2002071687A (ja) 2000-08-31 2002-03-12 Canon Inc 変異遺伝子のスクリーニング方法
US7354721B2 (en) 2000-09-22 2008-04-08 Clontech Laboratories, Inc. Highly sensitive proteomic analysis methods, and kits and systems for practicing the same
US6632611B2 (en) 2001-07-20 2003-10-14 Affymetrix, Inc. Method of target enrichment and amplification
US6872529B2 (en) 2001-07-25 2005-03-29 Affymetrix, Inc. Complexity management of genomic DNA
US7011945B2 (en) 2001-12-21 2006-03-14 Eastman Kodak Company Random array of micro-spheres for the analysis of nucleic acids
US7011949B2 (en) 2002-09-30 2006-03-14 Agilent Technologies, Inc. Methods and compositions for producing labeled probe nucleic acids for use in array based comparative genomic hybridization applications
US7028629B2 (en) 2003-02-03 2006-04-18 Richard Walcome Self-sealing port light assembly
US20070037186A1 (en) 2005-05-20 2007-02-15 Yuqiu Jiang Thyroid fine needle aspiration molecular assay
US7598052B2 (en) 2005-10-11 2009-10-06 The Regents Of The University Of Michigan Expression profile of thyroid cancer
EP1777523A1 (en) * 2005-10-19 2007-04-25 INSERM (Institut National de la Santé et de la Recherche Médicale) An in vitro method for the prognosis of progression of a cancer and of the outcome in a patient and means for performing said method
WO2008054598A2 (en) * 2006-09-29 2008-05-08 Schering Corporation Panel of biomarkers for prediction of fti efficacy
WO2009111881A1 (en) 2008-03-13 2009-09-17 British Columbia Cancer Agency Branch Biomarkers for diagnosis of differentiated thyroid cancer
CN101608227A (zh) * 2008-06-20 2009-12-23 上海主健生物工程有限公司 甲状腺癌遗传检测试剂盒
JP2010022236A (ja) 2008-07-16 2010-02-04 Fujifilm Corp 甲状腺癌の検出方法
CN102177252B (zh) * 2008-08-12 2014-12-24 解码遗传学私营有限责任公司 用于甲状腺癌症的风险评估的遗传变型
EP3029158A1 (en) 2008-11-17 2016-06-08 Veracyte, Inc. Methods and compositions of molecular profiling for disease diagnostics
WO2010124372A1 (en) 2009-04-29 2010-11-04 Genomedx Biosciences, Inc. Systems and methods for expression-based classification of thyroid tissue
WO2010129934A2 (en) * 2009-05-07 2010-11-11 Veracyte, Inc. Methods and compositions for diagnosis of thyroid conditions
CA2773907A1 (en) 2009-09-21 2011-03-24 Mount Sinai Hospital Methods and compositions for the diagnosis and treatment of thyroid cancer
EP2366800A1 (en) 2010-03-01 2011-09-21 Centrum Onkologii-Instytut im M. Sklodowskiej-Curie Oddzial w Gliwicach Kit, method and use for the diagnosis of papillary thyroid cancer using a gene expression profile
MD4038C1 (ro) 2010-03-03 2011-01-31 Univ Nicolae Testemitanu Procedeu de prognozare a riscului de dezvoltare a cancerului glandei tiroide
WO2011137519A1 (en) 2010-05-07 2011-11-10 Paul Walfish Methods and compositions for the diagnosis and treatment of thyroid cancer
US20110312520A1 (en) 2010-05-11 2011-12-22 Veracyte, Inc. Methods and compositions for diagnosing conditions
CN103468789A (zh) * 2012-06-09 2013-12-25 解码(上海)生物医药科技有限公司 甲状腺癌易感基因无创检测试剂盒
JP6309019B2 (ja) 2012-11-27 2018-04-11 ポンティフィシア・ウニベルシダッド・カトリカ・デ・チレPontificia Universidad Catolica de Chile 甲状腺腫瘍を診断するための組成物および方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
BMC Cancer. 2008; 8: 274 *
Mod Pathol 25, 46-55 (2012) *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220021805A (ko) * 2020-08-14 2022-02-22 연세대학교 산학협력단 조직 검사 방법 및 조직 검사 장치

Also Published As

Publication number Publication date
ZA201504663B (en) 2021-09-29
JP2016505247A (ja) 2016-02-25
US10260103B2 (en) 2019-04-16
CN104937111A (zh) 2015-09-23
CN104937111B (zh) 2018-05-11
EP2925886B1 (en) 2019-04-24
KR102174578B1 (ko) 2020-11-06
WO2014085434A1 (en) 2014-06-05
US20190241969A1 (en) 2019-08-08
HK1213947A1 (zh) 2016-07-15
EP2925886A1 (en) 2015-10-07
AU2013352339A1 (en) 2015-07-02
JP6309019B2 (ja) 2018-04-11
BR112015012239B1 (pt) 2022-07-19
MX2015006680A (es) 2015-10-15
MX367366B (es) 2019-08-16
NZ709167A (en) 2020-03-27
AU2013352339B2 (en) 2019-07-04
CA2892822C (en) 2023-08-08
BR112015012239A2 (ko) 2017-08-15
CA2892822A1 (en) 2014-06-05
US20150299808A1 (en) 2015-10-22

Similar Documents

Publication Publication Date Title
KR102174578B1 (ko) 갑상선 종양을 진단하기 위한 조성물 및 방법
US20230287511A1 (en) Neuroendocrine tumors
EP2640854B1 (en) PCAT1 ncRNA AND USES THEREOF
KR101566368B1 (ko) 암 검출을 위한 소변 유전자 발현 비율
WO2010003771A1 (en) Molecular markers for cancer prognosis
JP2010527604A (ja) メラノーマ癌の予後予測
US20200109457A1 (en) Chromosomal assessment to diagnose urogenital malignancy in dogs
CN109633156B (zh) 生物标志物在评估口腔鳞癌危险程度中的应用
US20150111758A1 (en) Gene signatures associated with efficacy of postmastectomy radiotherapy in breast cancer
JP6949315B2 (ja) 肺扁平上皮癌と肺腺癌の鑑別評価方法
WO2018098241A1 (en) Methods of assessing risk of recurrent prostate cancer
US20210324476A1 (en) Compositions and methods for identifying cancer
JPWO2015105191A1 (ja) リンパ節腫脹病変の評価方法
WO2022133621A1 (es) Método in vitro para el diagnóstico y predicción de la agresividad de cáncer de tiroides, las posibilidades y tipo de cirugía de precisión para la remoción del tumor en un sujeto; kit; reactivos para conformar dicho kit; uso de los reactivos y uso de marcadores moleculares parte del método
JPWO2015115545A1 (ja) 乳がんの転移又は再発リスクの評価方法

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right