KR102461014B1 - 폐암 상태를 평가하는 방법 - Google Patents

폐암 상태를 평가하는 방법 Download PDF

Info

Publication number
KR102461014B1
KR102461014B1 KR1020177004127A KR20177004127A KR102461014B1 KR 102461014 B1 KR102461014 B1 KR 102461014B1 KR 1020177004127 A KR1020177004127 A KR 1020177004127A KR 20177004127 A KR20177004127 A KR 20177004127A KR 102461014 B1 KR102461014 B1 KR 102461014B1
Authority
KR
South Korea
Prior art keywords
delete delete
lung cancer
subject
genes
gene
Prior art date
Application number
KR1020177004127A
Other languages
English (en)
Other versions
KR20170053617A (ko
Inventor
던컨 에이치 휘트니
마이클 엘라쇼프
Original Assignee
베라사이트 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 베라사이트 인코포레이티드 filed Critical 베라사이트 인코포레이티드
Publication of KR20170053617A publication Critical patent/KR20170053617A/ko
Application granted granted Critical
Publication of KR102461014B1 publication Critical patent/KR102461014B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/30Microarray design
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57423Specifically defined cancers of lung
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Immunology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Microbiology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biochemistry (AREA)
  • Oncology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Hematology (AREA)
  • Biomedical Technology (AREA)
  • Urology & Nephrology (AREA)

Abstract

일부 양태에서 본 발명은 정보 유전자의 발현에 기초하여 환자가 폐암에 걸릴 가능성을 측정하는 방법을 제공한다. 다른 양태에서, 본 발명은 정보 유전자의 발현에 기초하여 환자에 대한 적절한 진단 중재 계획을 결정하는 방법을 제공한다. 관련된 조성물 및 키트는 본 발명의 다른 양태에서 제공된다.

Description

폐암 상태를 평가하는 방법{Methods for Evaluating Lung Cancer Status}
본 발명은 일반적으로 유전자 발현 정보를 사용하여 암을 평가하는 방법 및 조성물에 관한 것이다.
가장 효과적으로 치료할 수 있는 특히 초기 단계에서 폐암을 진단하는데 어려움은 질병을 진단하기 위해 세포에 접근하는 것이다. 초기 단계 폐암은 특히 기관지 내시경과 같은 표준 기술로 접근하기 어려운 폐 기도의 주변 부위에도 나타날 수 있는 작은 병변과 통상적으로 관련이 있다.
본 발명은 상기한 문제를 해결하는 것을 목적으로 한다.
대상에 대한 적절한 진단 중재 계획 및/또는 치료 계획을 수립하고 적절한 진단 중재 계획 및/또는 치료 계획을 수립하는데 의료 제공자를 돕는 방법이 본 발명에 제공된다. 일부 실시태양에서, 상기 방법은 상해 개념의 기도 분야에 기초한다. 일부 실시태양에서, 상기 방법은 환자가 암에 걸릴 가능성을 평가하는데 유용한 정보 유전자의 발현 수준에 기초하여 폐암 위험 점수를 설정하는 단계를 필요로 한다. 일부 실시태양에서, 본 발명에 제공된 방법은 일상적인 세포 또는 조직 샘플링 절차 동안 대상으로부터 얻은 생물학적 샘플에서 정보 유전자의 발현 수준에 기초하여 평가하는 단계를 필요로 한다. 일부 실시태양에서, 생물학적 샘플은 조직학적으로 정상적인 세포를 포함한다. 일부 실시태양에서, 본 발명의 양태는 제 1 기도 위치로부터 얻은 명백하게 조직학적으로 정상인 세포에서 특정 정보 유전자의 발현 수준이 기도의 제 2 위치(예를 들어, 조직학적으로 정상적인 세포를 샘플링한 위치로부터 멀리 떨어진 기도에서 위치)에서 암의 가능성을 평가하는데 사용될 수 있다는 결정에 적어도 부분적으로 기초한다. 일부 실시태양에서, 조직학적으로 정상적인 세포(예를 들어, 기관지 세포)의 샘플링은 이러한 세포를 함유하는 조직이 일반적으로 쉽게 입수할 수 있고, 따라서 훨씬 덜 재현가능하게 샘플링될 수 있는 의심스러운 병변의 조직을 얻는 것을 필요로 하는 절차와 비교하여 유용한 샘플을 재현 가능하게 얻을 수 있기 때문에 유리하다. 일부 실시태양에서, 상기 방법은 대상의 기관지로부터 수집된 세포학상으로 정상적으로 보이는 세포에서 정보 유전자의 발현 수준에 기초하여 폐암 평가를 하는 단계를 필요로 한다. 일부 실시태양에서, 폐암의 가능성을 예측하는데 유용한 정보 유전자가 표 1, 11 및 26에 제공된다.
본 발명의 일부 양태에 따라, 대상으로부터 얻은 생물학적 샘플을 유전자 발현 분석하는 단계를 필요로 하는 대상이 폐암에 걸릴 가능성을 측정하는 방법이 제공되며, 여기서 유전자 발현 분석은 폐암 상태와 관련된 하나 이상의 정보 유전자(예를 들어, 표 11에서 선택된 정보 유전자)의 생물학적 샘플에서 mRNA 발현 수준을 측정하는 단계를 포함한다. 일부 실시태양에서, 상기 방법은 대상의 하나 이상의 자가 보고(self-reportable) 특성과 관련된 하나 이상의 게놈 상관 유전자의 생물학적 샘플에서 mRNA 발현 수준을 측정하는 단계를 포함한다. 일부 실시태양에서, 상기 방법은 상기 결정된 발현 수준을 대상이 폐암에 걸릴 가능성을 나타내는 폐암 위험 점수로 변형시키는 단계를 추가로 포함한다. 일부 실시태양에서, 대상의 하나 이상의 자가 보고 특성은 흡연 갑년(pack year), 흡연 상태, 연령 및 성별로부터 선택된다. 일부 실시태양에서, 폐암-위험 점수는 미래의 사용 인구에서 폐암을 배제하기 위해 90% 초과의 음성 예측치(NPV)를 갖는 모델에 따라 측정된다. 일부 실시태양에서, 폐암-위험 점수는 COPD로 진단된 대상에 대해 85% 초과의 음성 예측치(NPV)를 갖는 모델에 따라 측정된다.
일부 실시태양에서, 적절한 진단 중재 계획은 폐암 위험 점수에 적어도 부분적으로 기초하여 수립된다. 일부 실시태양에서, 상기 방법은 의료 제공자가 조기에 정확한 진단을 하도록 돕는다. 일부 실시태양에서, 상기 방법은 의료 제공자가 환자의 임상평가에서 조기에 적절한 치료 중재를 수립하는 것을 돕는다. 일부 실시태양에서, 상기 방법은 기관지 내시경 동안 얻은 생물학적 샘플을 평가하는 단계를 필요로 한다. 일부 실시태양에서, 상기 방법은 의료 제공자가 다른 상황에서는 불유익한 기관지 내시경으로부터 환자 진단 및/또는 치료에 관한 유익한 결정을 내리는 것을 가능하게 하기 때문에 유익하다. 일부 실시태양에서, 위험 또는 가능성 평가는 저 위험 병변을 모니터링하기 위한 적절한 감시로 이어진다. 일부 실시태양에서, 위험 또는 가능성 평가는 특정 암에 대해 더 빠른 진단 및 더 빠른 치료를 유도한다.
본 발명에 기술된 특정 방법은, 단독으로 또는 다른 방법과 조합하여, 의료 제공자가 환자에게 진단 및 치료 결정을 내리는 것을 돕도록 유용한 정보를 제공한다. 본 발명에 개시된 특정 방법은 다른 방법이 환자의 폐암 상태에 관한 유용한 정보를 제공하지 못하는 경우에 사용된다. 본 발명에 개시된 특정 방법은 일상적 기관지 내시경 동안 얻은 세포 또는 조직 샘플을 평가하거나 진단하기 위한 대안적 또는 보완적인 방법을 제공하고, 절차가 환자의 간호를 관리하기 위한 유용한 정보를 가져올 가능성을 증가시킨다. 본 발명에 개시된 방법은 매우 민감하며, 악성 폐 조직으로부터 떨어진 위치로부터 얻을 수 있는 세포 또는 조직 샘플 (예를 들어, 조직학적으로 정상적인 조직)으로부터 대상이 폐암에 걸릴 가능성에 관한 정보를 생성한다. 본 발명에 기술된 특정 방법은 일상적인 세포 또는 조직 샘플링 절차(예를 들어, 사이토브러쉬(cytobrush)에 의한 브러싱; 생검; 세척; 바늘 흡입과 같은 보조 기관지 내시경적 절차) 동안 얻은 조직학적으로 정상적인 세포 또는 조직을 평가함으로써 대상이 폐암에 걸릴 가능성을 평가하는 데 사용될 수 있다. 그러나, 임의의 적합한 조직 또는 세포 샘플이 사용될 수 있다는 것을 이해해야 한다. 종종 상기 방법에 의해 평가된 세포 또는 조직은 조직학적으로 정상인 것으로 나타난다. 일부 실시태양에서, 대상은 기관지 내시경의 후보로서 및/또는 호흡관에서 의심스러운 병변을 갖는 것으로 확인되었다.
일부 실시태양에서, 본 발명에 개시된 방법은 폐암에 걸린 대상의 위험을 대상에서 폐암의 존재 또는 부존재를 확인하는 것을 목표로 한 특정 침습 진단 절차와 관련된 위험과 비교 평가함으로써 의료 제공자가 적절한 진단 중재 및/또는 치료 계획을 결정할 수 있기 때문에 유용하다. 일부 실시태양에서, 목적은 암을 배제할 수 없지만 위험도가 낮은 중재에 의해 대상을 질환의 낮은 확률로 정렬시키는 것이다.
본 발명의 일부 양태에 따라, 다음 단계 중 하나 이상을 필요로 하는 유전자 발현 정보를 사용하여 대상의 폐암 상태를 평가하는 방법이 제공된다: (a) 대상의 호흡관으로부터 생물학적 샘플을 얻는 단계, 여기서 대상은 기관지 내시경을 받았다(예를 들어, 호흡관에서 의심스러운 병변을 갖는 것으로 확인되어 병변을 평가하기 위해 기관지 내시경을 받았다), (b) 생물학적 샘플을 유전자 발현 분석하는 단계, 여기서 유전자 발현 분석은 생물학적 샘플에서 복수의 정보 유전자의 발현 수준을 측정하는 단계를 포함한다, (c) 복수의 정보 유전자의 발현 수준에 기초하여 폐암 위험 점수를 계산하는 단계, (d) 폐암 위험 점수의 수준이 제 1 임계값을 넘는 초과하는 경우(예를 들어, 위), 대상이 폐암 상태를 평가하기 위한 제 1 진단 중재가 필요한지를 측정하는 단계, 및 (e) 폐암 위험 점수의 수준이 두 번째 경계 수준을 초과하는 경우(예를 들어, 아래), 대상이 폐암 상태를 평가하는 제 2 진단 중재가 필요한지를 측정하는 단계. 일부 실시태양에서, 상기 방법은 (f) 폐암 위험 점수의 레벨이 상기 제 1 임계값과 상기 제 2 임계값 사이에 있는 경우, 대상이 폐암 상태를 평가하기 위한 제 3 진단 중재를 필요한지를 측정하는 단계를 더 포함한다.
특정 실시태양에서, 본 발명의 방법은 대상이 기관지 내시경을 받을 때 및 기관지 내시경 절차가 불확실한 또는 비 진단적 정보를 생성하였을 때 사용될 수 있다. 따라서, 이런 대상에게 낮은 위험을 부여하기 위한 방법이 본 발명에 개시되며, (a) 대상의 호흡관으로부터 생물학적 샘플을 얻는 단계, 여기서 대상은 비 진단적 기관지 내시경 절차를 받았다, (b) 생물학적 샘플을 유전자 발현 분석하는 단계, 여기서 유전자 발현 분석은 생물학적 샘플에서 복수의 정보 유전자의 발현 수준을 측정하는 단계를 포함한다, (c) 복수의 정보 유전자의 발현 수준에 기초하여 폐암 위험 점수를 계산하는 단계, (d) 폐암 위험 점수의 수준이 제 1 임계값을 넘는 초과하는 경우(예를 들어, 아래), 대상이 폐암의 위험이 낮다는 것을 측정하는 단계 및 선택적으로 (e) 낮은 위험의 대상에게 하나 이상의 비침습 후속 절차: 예를 들어, CT 감시를 부여하는 단계 중 하나 이상을 포함한다. 이런 방법은 대상의 집단이 후속 침습 절차를 피하게 한다. 임계 수준보다 아래이지 않은 대상의 경우, 비 진단적 기관지 내시경 검사 이후의 전통적인 방법이 이어질 수 있다.
일부 실시태양에서, 제 1 진단 중재는 경흉부 세침 흡인, 종격동경검사 또는 개흉술을 수행하는 단계를 포함한다. 일부 실시태양에서, 제 2 진단 중재는 추적 관찰(예를 들어, 주기적 모니터링)에 참여하는 단계를 포함한다. 일부 실시태양에서, 추적 관찰은 의심스러운 병변을 평가하기 위해 주기적으로 호흡관을 영상화하는 단계를 포함한다. 일부 실시태양에서, 추적 관찰은 1년, 2년, 4년, 5년 또는 그 이상 동안 의심스러운 병변을 평가하기 위해 호흡관을 주기적으로 영상화하는 단계를 포함한다. 일부 실시태양에서, 추적 관찰은 1년에 적어도 1회 의심스러운 병변을 평가하기 위해 호흡관을 영상화하는 단계를 포함한다. 일부 실시태양에서, 추적 관찰은 적어도 1년에 적어도 2회 의심되는 병변을 평가하기 위해 호흡관을 영상화하는 단계를 포함한다. 일부 실시태양에서, 추적 관찰은 대상이 암이 없는 것으로 진단되지 않는 경우 및 대상이 암이 없는 것으로 진단될 때까지 대상의 주기적 모니터링을 포함한다. 일부 실시태양에서, 추적 관찰은 대상이 암에 걸리지 않는 경우 및 대상이 암에 걸린 것으로 진단될 때까지 대상의 주기적 모니터링을 포함한다. 일부 실시태양에서, 추적 관찰은 이전 단락에서 언급된 단계 (a) 내지 (f) 중 하나 이상을 주기적으로 반복하는 것을 포함한다. 일부 실시태양에서, 제 3 진단 중재는 기관지 내시경을 수행하는 단계를 포함한다. 일부 실시태양에서, 제 3 진단 중재는 전 단락에서 언급된 단계 (a) 내지 (e)를 반복하는 것을 포함한다. 특정 실시태양에서, 제 3 진단 중재는 폐암 위험 점수가 제 1 임계값과 제 2 임계값 사이에 있다는 것을 측정하는 단계 (a) 내지 (e)를 6개월 이내에 반복하는 단계를 포함한다. 특정 실시태양에서, 제 3 진단 중재는 폐암 위험 점수가 제 1 임계값과 제 2 임계값 사이에 있다는 것을 측정하는 단계 (a) 내지 (e)를 3개월 이내에 반복하는 단계를 포함한다. 일부 실시태양에서, 폐암 위험 점수가 제 1 임계값과 제 2 임계값 사이에 있다는 것을 측정하는 단계 (a) 내지 (e)를 1개월 이내에 반복하는 단계를 포함한다.
일부 실시태양에서, 복수의 정보 유전자는 표 11의 유전자 그룹으로부터 선택된다. 일부 실시태양에서, 이들 유전자의 서브세트의 발현 수준이 평가되고 참조 발현 수준과 비교된다(예를 들어, 암이 없는 정상 환자의 경우). 일부 실시태양에서, 서브세트는 a) 발현의 증가가 폐암 또는 폐암에 대한 위험 증가와 관련된 유전자, b) 발현 감소가 폐암 또는 폐암 위험 증가와 관련된 유전자, 또는 둘 다를 포함한다. 일부 실시태양에서, 서브세트에서 유전자의 적어도 5%, 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40% 또는 적어도 50%가 폐암에 대해 증가된 위험과 관련하여 증가된 발현 수준을 갖는다. 일부 실시태양에서, 서브세트에서 유전자의 적어도 5%, 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40% 또는 적어도 50%가 폐암에 대해 증가된 위험과 관련하여 감소된 발현 수준을 갖는다. 일부 실시태양에서, 발현 수준은 표 11의 유전자로부터 선택된 10-80개 이상의 유전자(예를 들어, 5-10, 10-20, 20-30, 30-40, 40-50, 50-60, 60-70, 70-80, 약 10, 약 15, 약 17, 약 25, 약 35, 약 45, 약 55, 약 65, 약 75 이상의 유전자)의 각각에 대해 평가된다(예를 들어, 분석되거나 질문된다). 일부 실시태양에서, 하나 이상의 대조군 유전자에 대한 발현 수준도 평가된다(예를 들어, 1, 2, 3, 4 또는 5개 대조군 유전자). 분석은 또한 다른 유전자, 예를 들어 기준 유전자 또는 다른 유전자(이들이 얼마나 유익한지에 관계없이)를 포함할 수 있음을 이해해야 한다. 그러나, 본 발명에 기술된 유익한 유전자 서브세트에 대한 발현 프로파일이 폐암에 대한 위험 증가를 나타내는 경우, 적절한 치료 또는 진단 권고는 본 발명에 기술된 바와 같이 이루어질 수 있다.
일부 실시태양에서, 표 11의 유전자의 하나 이상의 서브세트의 발현 수준의 변화의 확인은 임의의 적합한 포맷으로 의사 또는 다른 의료 전문가에게 제공될 수 있다. 일부 실시태양에서, 본 발명에 단독으로 개시된 예측 모델의 이러한 유전자 발현 프로파일 및/또는 결과는 진단을 하거나, 예후를 제공하거나, 또는 추가 진단 또는 특정 치료를 권고하기에 충분할 수 있다. 그러나, 일부 실시태양에서, 본 발명에 개시된 예측 모델의 유전자 발현 프로파일 및/또는 결과는 다른 정보(예를 들어, 다른 발현 정보, 및/또는 가족력을 포함하는 대상에 대한 다른 물리적 또는 화학적 정보)와 함께 대상의 진단, 예후 및/또는 치료를 도울 수 있다.
일부 실시태양에서, 대상은 호흡관을 영상화함으로써 호흡관에서 수상한 병변을 갖는 것으로 확인된다. 특정 실시태양에서, 호흡관을 영상화하는 단계는 컴퓨터 보조 단층촬영, 자기 공명 영상화, 초음파 또는 흉부 엑스레이를 수행하는 단계를 포함한다.
일부 실시태양에서, 환자로부터 생물학적 샘플을 얻기 위한 방법이 제공된다. 이러한 생물학적 샘플에서 정보 유전자의 발현 수준은 환자가 폐암을 앓을 가능성을 평가하기 위한 기초를 제공한다. 생물학적 샘플을 처리하기 위한 방법이 제공된다. 일부 실시태양에서, 처리 방법은 정보 유전자의 하류 분석을 가능하게 하고 얻은 결과의 품질을 보장하기 위해 RNA 품질 및 무결성을 보장한다. 따라서, 다양한 품질 제어 단계(예를 들어, RNA 크기 분석)가 이들 방법에 사용될 수 있다. 생물학적 샘플을 포장하고 저장하기 위한 방법이 제공된다. 예를 들어, 생물학적 샘플이 처리될 수 있고 및/또는 유전자 발현 분석이 수행될 수 있는 분석 실험실로 생물학적 샘플을 선적 또는 운송하기 위한 방법이 제공된다. 샘플에서 정보 유전자의 발현 수준을 측정하기 위해 생물학적 샘플에 대한 유전자 발현 분석을 수행하는 방법이 제공된다. 정보 유전자의 유전자 발현 분석 결과를 분석하고 해석하기 위한 방법이 제공된다. 유전자 발현 분석의 결과를 요약하는 보고서를 생성하고, 분석 결과 및/또는 분석 해석을 의료 제공자(예를 들어, 의사)에게 전송 또는 송부하기 위한 방법이 제공된다. 또한, 추가 치료 또는 침습 진단 절차에 대한 권고를 포함하는, 유전자 발현 분석 결과에 기초하여 치료 결정을 내리기 위한 방법이 제공된다.
일부 실시태양에서, 본 발명의 양태는 대상으로부터 얻은 생물학적 샘플을 유전자 발현 분석함으로써 대상이 폐암에 걸릴 가능성을 측정하는 것에 관한 것이며, 유전자 발현 분석은 생물학적 샘플에서 적어도 하나의 유익한 유전자(예를 들어, 표 11로부터 선택된 적어도 두 개의 유전자)의 발현 수준을 측정하는 단계 및 이 발현 수준을 사용하여 대상자가 폐암에 걸릴 가능성을 측정하는 데 도움을 주는 단계를 포함한다.
일부 실시태양에서, 측정 단계는 발현 수준을 대상이 폐암에 걸릴 가능성을 나타내는 폐암 위험 점수로 변형시키는 단계를 포함한다. 일부 실시태양에서, 폐암 위험 점수는 가중 발현 수준의 조합이다. 일부 실시태양에서, 폐암 위험 점수는 가중 발현 수준의 합이다. 일부 실시태양에서, 발현 수준은 폐암에 걸릴 가능성의 증가를 예측하는데 대한 이들의 상대적 기여에 의해 가중된다.
일부 실시태양에서, 본 발명의 양태는 대상으로부터 얻은 생물학적 샘플을 유전자 발현 분석함으로써, 대상에 대한 치료 과정을 결정하는 것에 관한 것이며, 여기서 유전자 발현 분석은 생물학적 샘플에서 적어도 2개의 정보 유전자(예를 들어, 표 11에서 선택된 적어도 2개의 mRNA)의 발현 수준을 측정하는 단계 및 발현 수준에 기초하여 대상에 대한 치료 과정을 결정하는 단계를 포함한다. 일부 실시태양에서, 치료 과정은 발현 수준으로부터 유도된 폐암 위험 점수에 기초하여 결정된다. 일부 실시태양에서, 대상은 대상이 폐암에 걸릴 비교적 높은 가능성을 갖는 것을 나타내는 폐암 위험 점수에 기초하여 폐암 치료에 대한 후보로 확인된다. 일부 실시태양에서, 대상은 대상이 폐암에 걸릴 비교적 높은 가능성을 갖는 것을 나타내는 폐암 위험 점수에 기초하여 침습적 폐 절차에 대한 후보로서 확인된다. 일부 실시태양에서, 침습적 폐 절차는 경흉부 세침 흡인, 종격동경검사 또는 개흉술이다. 일부 실시태양에서, 대상은 대상이 폐암에 걸릴 비교적 낮은 가능성을 갖는 다는 것을 나타내는 폐암 위험 점수에 기초하여 폐암 치료 또는 침습적 폐 절차에 대한 후보가 아닌 것으로 확인된다. 일부 실시태양에서, 유전자 발현 분석의 결과를 요약하는 보고서가 생성된다. 일부 실시태양에서, 보고서는 폐암 위험 점수를 나타낸다.
일부 실시태양에서, 본원의 양태는 대상으로부터 얻은 생물학적 샘플을 유전자 발현 분석함으로써 대상이 폐암에 걸릴 가능성을 측정하는 것에 관한 것이며, 여기서 유전자 발현 분석은 생물학적 샘플에서 적어도 하나의 정보 유전자(예를 들어, 표 11에서 선택된 적어도 하나의 정보 mRNA)의 발현 수준을 측정하는 단계 및 발현 수준에 적어도 부분적으로 기초하여 환자가 폐암에 걸릴 가능성을 측정하는 단계를 포함한다.
일부 실시태양에서, 본 발명의 양태는 대상의 호흡 상피로부터 얻은 생물학적 샘플을 유전자 발현 분석함으로써 대상이 폐암에 걸릴 가능성을 측정하는 것에 관한 것이며, 상기 유전자 발현 분석은 생물학적 샘플에서 적어도 하나의 정보 유전자(예를 들어, 표 11에서 선택된 적어도 하나의 정보 mRNA)의 발현 수준을 측정하는 단계 및 발현 수준에 적어도 부분적으로 기초하여 대상이 폐암에 걸릴 가능성을 측정하는 단계를 포함하며, 생물학적 샘플은 조직학적으로 정상적인 조직을 포함한다.
일부 실시태양에서, 본 발명의 양태는 적어도 2개의 정보 유전자(예를 들어, 표 11로부터의 적어도 2개의 정보 mRNA)의 생물학적 샘플에서 발현 수준을 나타내는 데이터를 얻고(생물학적 샘플은 환자로부터 얻었다), 발현 수준을 사용하여 대상이 폐암에 걸릴 가능성을 측정하는데 도움으로써 게놈 정보를 처리하는 컴퓨터 구현 방법에 관한 것이다. 컴퓨터 구현 방법은 사용자 인터페이스를 통해 데이터를 입력하고, 프로세서를 사용하여 계산하고(예를 들어, 계산하고, 비교하고 또는 분석하고) 및/또는 디스플레이 또는 다른 사용자 인터페이스를 통해 결과를 출력하는 단계를 포함할 수 있다.
일부 실시태양에서, 측정하는 단계는 대상이 폐암에 걸릴 가능성을 나타내는 위험 점수를 계산하는 단계를 포함한다. 일부 실시태양에서, 위험 점수를 계산하는 단계는 가중 발현 수준(예를 들어, 단독 또는 더 많은 게놈 상관 유전자 중 하나와 함께 하나 이상의 정보 유전자의 발현 수준)의 조합을 측정하는 단계를 필요로 하며, 발현 수준은 폐암에 걸릴 가능성의 증가를 예측하는데 대한 이들의 상대적 기여에 의해 가중된다. 일부 실시태양에서, 게놈 상관 유전자는 특정 임상적 변수 (예를 들어, 자가 보고 변수)와 관련되거나 상관관계가 있는 유전자이다. 일부 실시태양에서, 이러한 임상적 변수는 암, 예를 들어 폐암과 상호관련된다. 일부 실시태양에서, 유전자의 발현 수준을 사용하는 것보다, 대상 집단 내에 공선적으로 변하는(예를 들어, 서로 상관됨) 관련 유전자의 그룹은 단일 값(예를 들어, 관련 유전자 그룹의 평균값)으로 결합되거나 붕괴될 수 있다. 일부 실시태양에서, 컴퓨터 구현 방법은 위험 점수를 나타내는 보고서를 생성하는 단계를 포함한다. 일부 실시태양에서, 보고서는 대상의 의료 제공자에게 전송된다.
일부 실시태양에서, 컴퓨터 구현 방법은 표 11의 클러스터 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 11에서 확인된 유전자 세트로부터 선택된 적어도 2, 3, 4, 5, 6, 7, 8, 9 또는 10 유전자의 생물학적 샘플에서 발현 수준을 나타내는 데이터를 얻는 단계를 포함한다. 일부 실시태양에서, 유전자는 MYOT를 포함한다.
본 발명에 기술된 임의의 실시태양 또는 양태에서, 생물학적 샘플은 대상의 호흡 상피로부터 얻을 수 있음을 이해해야 한다. 호흡 상피는 입, 코, 인두, 기관, 기관지, 세기관지 또는 폐포일 수 있다. 그러나 호흡기 상피의 다른 소스도 사용할 수 있다. 생물학적 샘플은 조직학적으로 정상적인 조직을 포함할 수 있다. 생물학적 샘플은 사이토브러쉬(cytobrush) 또는 히스토브러쉬(histobrush)와 같은 기관지 브러싱; 기관지 폐포 세척; 기관지 생검; 구강 세척; 터치 프렙(touch preps); 미세 바늘 흡인; 또는 가래 수집을 사용하여 얻을 수 있다. 대상은 하나 이상의 폐암 증상을 나타낼 수 있고 및/또는 컴퓨터 보조 단층 촬영 또는 흉부 X 선에 의해 관찰될 수 있는 병변을 가질 수 있다. 일부 경우에, 대상은 본 발명에 개시된 방법에 의해 평가되기 전에 원발성 폐암으로 진단되지 않았다.
본 발명에 기술된 임의의 실시태양 또는 양태에서, 발현 수준은 정량 역전사 중합효소 연쇄 반응, 비드-기반 핵산 탐지 분석 또는 올리고뉴클레오티드 어레이 분석(예를 들어, 마이크로어레이 분석) 또는 다른 기술을 사용하여 측정될 수 있다.
본 발명에 기재된 임의의 실시태양 또는 양태에서, 폐암은 선암종, 편평 세포 암종, 소 세포암 또는 비-소 세포암일 수 있다.
일부 실시태양에서, 본 발명의 양태는 필수적으로 적어도 하나의 핵산 프로브로 이루어진 조성물에 관한 것이며, 상기 적어도 하나의 핵산 프로브의 각각은 정보 유전자(예를 들어, 표 11로부터 선택된 적어도 하나의 정보 mRNA)와 특이적으로 혼성화된다.
일부 실시태양에서, 본 발명의 양태는 5개까지의, 10개까지의, 25개까지의, 50개까지의, 100개까지의 또는 200개까지의 핵산 프로브를 포함하는 조성물에 관한 것이며, 핵산 프로브의 각각은 정보 유전자(예를 들어, 표 1 또는 11로부터 선택한 적어도 하나의 정보 mRNA)와 특이적으로 혼성화된다.
일부 실시태양에서, 조성물은 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 핵산 프로브를 포함한다. 일부 실시태양에서, 핵산 프로브의 적어도 2, 3, 4, 5, 6, 7, 8, 9 또는 10개는 표 11의 클러스터 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 11로부터 선택된 다른 유전자로부터 발현된 mRNA와 혼성화된다.
일부 실시태양에서, 핵산 프로브는 비드에 직접 또는 간접적으로 접합된다. 일부 실시태양에서, 비드는 자기 비드이다. 일부 실시태양에서, 핵산 프로브는 고체 지지체에 고정된다. 일부 실시태양에서, 고체 지지체는 유리, 플라스틱 또는 실리콘 칩이다.
일부 실시태양에서, 본 발명의 양태는 본 발명에 기재된 임의의 핵산 프로브 조성물을 수용하는 적어도 하나의 용기 또는 패키지를 포함하는 키트에 관한 것이다.
일부 실시태양에서, 발현 수준은 정량 역전사 중합효소 연쇄 반응을 사용하여 측정된다.
일부 실시태양에서, 본 발명의 양태는 대상(예를 들어, 사람 대상)이 폐암에 걸릴 가능성을 측정하기 위해 발현 수준을 사용할 수 있는 유전자에 관한 것이다. 일부 실시태양에서, 본 발명에 기술된 하나 이상의 유전자의 발현 수준(예를 들어, mRNA 수준)은 기도 샘플(예를 들어, 상피 세포 또는 기관지 내시경 동안 또는 적절한 기관지 세척 샘플에서 얻은 다른 샘플)에서 측정될 수 있다. 일부 실시태양에서, 본 발명에 기술된 정보 유전자(예를 들어, 1-5, 5-10, 10-15, 15-20, 20-25, 25-50, 50-80 또는 그 이상의 유전자)의 하나 이상의 서브세트에 대한 증가된 및/또는 감소된 mRNA 발현 수준의 패턴은 측정되어 진단, 예후 및/또는 치료 목적으로 사용될 수 있다. 본 발명에 기술된 하나 이상의 발현 패턴이 단독으로 사용될 수 있거나, 또는 하나 이상의 추가 환자-특정 표시 또는 증상과 함께 도움이 될 수 있어서, 환자에 대해 개인화된 진단, 예후 및/또는 치료적 예측 또는 권고를 제공할 수 있다는 것을 이해해야 한다. 일부 실시태양에서, 폐암에 걸린 및 걸리지 않은 흡연자(현재 또는 과거)를 식별하는 정보 유전자 세트가 제공되며, 이는 폐암의 위험을 높은 정확성로 예측하는데 유용하다. 일부 실시태양에서, 정보 유전자는 표 1 또는 표 11로부터 선택된다.
일부 실시태양에서, 대상이 폐암에 걸릴 가능성을 측정하기 위해 본 발명에 제공된 방법은 대상으로부터 얻은 생물학적 샘플을 폐암 상태와 관련된 하나 이상의 정보 유전자(예를 들어, 표 1 또는 표 11로부터 선택된 정보 유전자)의 생물학적 샘플에서 mRNA 발현 수준을 결정하는 단계를 포함하는 유전자 발현 분석하는 단계를 필요로 한다. 일부 실시태양에서, 상기 방법은 대상의 하나 이상의 자가 보고 특성과 관련된 하나 이상의 게놈 상관 유전자의 생물학적 샘플에서 mRNA 발현 수준을 측정하는 단계를 포함한다. 일부 실시태양에서, 상기 방법은 위에서 측정된 발현 수준을 대상이 폐암에 걸릴 가능성을 나타내는 폐암 위험 점수로 변형시키는 단계를 추가로 포함한다. 일부 실시태양에서, 대상의 하나 이상의 자가 보고 특성은 흡연 갑년, 흡연 상태, 연령 및 성별로부터 선택된다. 일부 실시태양에서, 폐암 위험 점수는 하기 방정식에 따라 결정된다:
점수 =
Figure 112017015320306-pct00001
여기서:
X점수 1 = W 0 + W 1 x GG + W 2 x GS + W 3 x GPY + W 4 x GA + W 5 x C1A + W 6 x C1B + W 7 x C2 + W 8 x C3 + W 9 x C4A + W 10 x C4B
x점수 2= W 0 + W 1 x GG + W 2 x GS + W 3 x GPY + W 4 x 보고된 연령 + W 5 x C1A + W 6 x C1B + W 7 x C2 + W 8 x C3 + W 9 x C4A + W 10 x C4B,
여기서 GG , GS , GPY , GA, C1A , C1B , C2, C3, C4AC4B는 본 발명에 개시된 방정식에 따라 결정된다.
일부 실시태양에서, 정보 유전자는 표 1 또는 표 11로부터 선택된다. 일부 실시태양에서, 대상 집단 내에서 공선적으로 변화하는(예를 들어, 서로 상호 관련된) 관련 유전자의 그룹은 단일 값(예를 들어, 관련 유전자 집단의 평균값)으로 결합하거나 붕괴될 수 있다. 일부 실시태양에서, 관련 유전자의 그룹은 동일한 세포 및/또는 분자 경로와 관련되기 때문에 상관관계가 있다. 일부 실시태양에서, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개 이상의 관련 유전자(예를 들어, 상관 유전자, 공통 클러스터 내의 유전자)는 단일 값으로 함께 결합된다. 일부 실시태양에서, 관련 유전자의 그룹은 다수의 대상(예를 들어, 2 내지 100, 2 내지 500, 2 내지 1000 또는 그 이상의 대상)으로부터 얻은 발현 수준의 클러스터 분석을 수행함으로써 확인된다. 예를 들어, 중심 기반 클러스터링(예를 들어, k-평균 클러스터링), 연결성 기반 클러스터링 (예를 들어, 계층적 클러스터링) 및 다른 적절한 접근을 포함하는 임의의 적절한 클러스터 분석은 이러한 관련 유전자를 식별하는데 사용될 수 있다. 이러한 클러스터의 비 제한적인 예는 각 유전자가 존재하여 관련 유전자(예를 들어, 상관 유전자) 동일한 클러스터 내에 있는 클러스터를 특정하는 2열의 값으로 표 11에서 확인된다. 일부 실시태양에서, 관련 유전자의 세트의 발현 상태를 반영하는 값은 관련 유전자의 세트의 평균 발현 수준이다. 예를 들어, 하나 이상의 값이 사용될 수 있다: 대상이 암에 걸릴 가능성을 예측하기 위한 모델에서 CIA, C1B, C2, C3, C4A 및 C4B, 여기서
CIA = (BST1, CD177.1, CD177.2)의 평균,
C1B = (ATP12A, TSPAN2)의 평균,
C2 = (GABBRI, MCAM, NOVA1, SDC2)의 평균,
C3 = (CDR1, CGREF1, CLND22, NKX3-1)의 평균,
C4A = (EPHX3, LYPD2)의 평균, 및
C4B = (MIA, RNF150)의 평균.
일부 실시태양에서, 클러스터 내의 유전자는 서로 치환될 수 있다. 따라서, 일부 실시태양에서, 클러스터 내의 모든 유전자는 예측 모델에서 평가되거나 사용될 필요가 있다. 일부 실시태양에서, 클러스터 내의 단지 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 유전자는 본 발명에서 기술된 바와 같이 분석을 위해 독립적으로 선택된다. 일부 실시태양에서, 표 11의 클러스터 내의 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 유전자가 확인된다.
일부 실시태양에서, 하나 이상의 정보 유전자는 표 11에서 클러스터 1로 확인된 유전자의 세트로부터 선택된다. 일부 실시태양에서, 하나 이상의 정보 유전자는 하나 이상의 정보 유전자는 표 11에서 클러스터 2로 확인된 유전자의 세트로부터 선택된다. 일부 실시태양에서, 하나 이상의 정보 유전자는 표 11에서 클러스터 3으로 확인된 유전자의 세트로부터 선택된다. 일부 실시태양에서, 하나 이상의 정보 유전자는 표 11에서 클러스터 4로 확인된 유전자의 세트로부터 선택된다. 일부 실시태양에서, 하나 이상의 정보 유전자는 표 11에서 클러스터 5로 확인된 유전자의 세트로부터 선택된다. 일부 실시태양에서, 하나 이상의 정보 유전자는 표 11에서 클러스터 6으로 확인된 유전자의 세트로부터 선택된다. 일부 실시태양에서, 하나 이상의 정보 유전자는 표 11에서 클러스터 7로 확인된 유전자의 세트로부터 선택된다. 일부 실시태양에서, 하나 이상의 정보 유전자는 표 11에서 클러스터 8로 확인된 유전자의 세트로부터 선택된다. 일부 실시태양에서, 하나 이상의 정보 유전자는 표 11에서 클러스터 9로 확인된 유전자의 세트로부터 선택된다. 일부 실시태양에서, 하나 이상의 정보 유전자는 표 11에서 클러스터 10으로 확인된 유전자의 세트로부터 선택된다. 일부 실시태양에서, 하나 이상의 정보 유전자는 표 11에서 클러스터 11로 확인된 유전자의 세트로부터 선택된다. 일부 실시태양에서, 정보 유전자는 MYOT이다. 일부 실시태양에서, 클러스터로부터 선택된 유전자는, 예를 들어, 선택된 유전자의 발현 수준의 평균, 중앙값, 모드 또는 다른 요약 통계와 같은 단일 값으로 감소된다.
일부 실시태양에서, 적절한 진단 중재 계획 및/또는 치료 계획을 수립하고 적절한 진단 중재 계획 및/또는 치료 계획을 수립할 때 의료 제공자를 돕는 방법이 본 발명에 제공된다. 일부 실시태양에서, 통상적인 세포 또는 조직 샘플링 절차 동안 대상으로부터 얻은 생물학적 샘플에서 정보 유전자의 발현 수준에 기초하여 위험 평가를 하는 단계를 필요로 하는 방법이 제공한다. 일부 실시태양에서, 정보 유전자의 발현 수준에 기초하여 폐암 위험 점수를 설정하는 단계를 포함하는 방법이 제공된다. 일부 실시태양에서, 적절한 진단 중재 계획은 폐암 위험 점수에 적어도 부분적으로 기초하여 수립된다. 일부 실시태양에서, 본 발명에 제공된 방법은 의료 제공자가 조기에 정확한 진단을 하도록 돕는다. 일부 실시태양에서, 본 발명에 제공된 방법은 의료 제공자가 환자의 임상 평가에서 조기에 적절한 치료 중재를 수립하는 것을 돕는다. 일부 실시태양에서, 본원에서 제공된 방법은 기관지 내시경 시술 동안 얻어진 생물학적 샘플을 평가하는 단계를 포함한다. 일부 실시태양에서, 상기 방법은 의료 제공자가 다른 상황에서는 불유익한 기관지 내시경으로부터 환자 진단 및/또는 치료에 관한 유익한 결정을 내리는 것을 가능하게 하기 때문에 유익하다. 일부 실시태양에서, 위험 평가는 저 위험 병변을 모니터링하기 위한 적절한 감시로 이어진다. 일부 실시태양에서, 위험 평가는 특정 암에 대해 더 빠른 진단 및 더 빠른 치료를 유도한다.
대상이 선암종, 편평 세포 암종, 소세포암 또는 비소세포 암과 같은 폐암에 걸릴 가능성을 측정하는 방법이 본 발명에 제공된다. 이 방법은 단독으로 또는 다른 방법과 함께 의료 제공자가 환자에게 진단 및 치료 결정을 내리는 것을 돕는 유용한 정보를 제공한다. 본 발명에 개시된 방법은 다른 방법이 대상의 폐암 상태에 관한 유용한 정보를 제공하지 못하는 경우에 종종 사용된다. 예를 들어, 기관지 내시경 절차의 약 50%는 불확실하거나 비 진단적인 정보를 초래한다. 불확실한 결과의 여러 출처가 존재하며, 다른 의료 센터에서 제공되는 교육 및 절차에 따라 달라질 수 있다. 그러나, 특정 실시태양에서, 기관지 내시경과 병행된 분자 방법은 암 검출 정확성을 향상시키는 것으로 예상된다.
일부 실시태양에서, 대상이 폐암에 걸릴 가능성을 측정하는 방법이 본 발명에 제공된다. 일부 실시태양에서, 대상으로부터 얻은 생물학적 샘플을 유전자 발현 분석하는 단계를 포함하는 방법이 제공되며, 유전자 발현 분석은 폐암 상태와 관련된 하나 이상의 정보 유전자의 cDNA 수준을 측정하는 단계 및 대상의 하나 이상의자가 보고 특성과 관련이 있는 하나 이상의 게놈 상관 유전자의 cDNA 수준을 측정하는 단계; 및 (a) 및 (b)에서 측정된 cDNA 수준에 기초하여 대상이 폐암에 걸릴 가능성을 나타내는 폐암 위험 점수를 측정하는 단계를 포함하며; cDNA는 생물학적 샘플로부터의 mRNA로부터 제조된다.
일부 실시태양에서, 본 발명의 방법은 mRNA의 cDNA로의 전환을 포함한다. 추가 실시태양에서, cDNA는 증폭된다.
이런 및 다른 양태는 본 발명에 더욱 상세하게 기술되며 비 제한적인 도면과 실시예에 의해 예시된다.
본 발명의 내용 중에 포함되어 있다.
도 1은 모든 자격을 갖춘 AEGIS I 샘플의 모든 유전자 발현 데이터의 쌍 상관관계로부터의 상관 계수의 도포의 비 제한적 예이며; 상관 계수 < 0.955를 가진 샘플은 특이점으로 식별되어 추후 분석에서 제외되며; 총 597개의 샘플이 보유되었다.
도 2는 트레이닝 샘플 세트에 기초한 예측 모델에 대한 ROC 곡선의 비 제한적 예이다.
도 3은 기관지 내시경 음성 트레이닝 샘플 세트에 기초한 예측 모델에 대한 ROC 곡선의 비 제한적 예이다.
도 4는 다음과 같은 색 지정을 묘사한다: 연구의 포함 기준을 충족시킨 환자(파란색); 제외된 환자(황색); 최종 분석에 포함된 환자(녹색).
도 5는 총 환자(밝은 회색)에 대한 ROC 곡선을 나타내고 AEGIS 1(좌측) 및 AEGIS 2(우측) 그룹에서 비 진단 기관지 내시경을 한 환자(흑색)의 서브 세트가 도시된다. AEGIS 1에서 두 그룹, 각각에 대해 AUC = 0.78(95% CI, 0.73-0.83) 및 AUC = 0.76(95% CI, 0.68-0.83)(p = 0.31). AEGIS 2에서 두 그룹에서 AUC = 0.74(95% CI, 0.68-0.80) 및 AUC = 0.75(95% CI, 0.68-0.82)(p = 0.85). AUC는 AEGIS 1과 AEGIS 2를 비교하는 비 진단 기관지 내시경을 한 환자에 대해 현저하게 유의하게 다르지 않았다(p = 0.61).
도 6a 및 도 6b. 도 6a는 기관지 내시경 검사와 병행하여 분류기에 대해 계산된 음성 분류기 호출(실선; 음의 가능성 비를 사용하여 조정) 및 양성 분류기 호출(점선; 양의 가능성 비를 사용하여 조정)에 기초한 사전 테스트 POM과 관련된 사후 테스트 POM을 나타낸다. 음성 분류기 호출 곡선은 <66%의 사전 테스트 POM을 가진 환자의 경우, 기관지 내시경이 음성이고 분류기가 음성일 때 사후 테스트 POM이 <10%인 것을 도시한다. 음성 기관지 내시경과 양성 분류기 점수가 있는 환자의 경우, 사전 테스트 가능성이 5% 이상일 때 암의 사후 테스트 가능성은 >10%이다. 도 6b는 사전 테스트 확률 및 분류기 및 기관지 내시경의 음의 가능성 비에 기초하여 암의 사후 테스트 확률을 나타낸다. 폐암의 사후 테스트 확률은 비 진단 기관지 내시경 검사와 음의 분류기 점수(음의 가능성 비를 사용하여 조정)에 기초한 사전 테스트 확률과 관련하여 도시된다. 이 곡선은 66% 미만(짧은 수직선)의 암의 사전 테스트 확률을 가진 환자의 경우, 사후 테스트 확률은 기관지 내시경 소견이 음성이고 분류자 점수가 음인 경우 사후 테스트 확률이 10% 미만(파선)임을 도시한다.
도 7은 암 관련 유전자 발현과 유전자의 쌍 상관관계를 나타낸다. 암 관련 유전자 발현(n = 232)을 가진 가능한 모든 유전자 쌍 사이의 상관관계를 평가하여 유전자 발현의 유사한 패턴을 공유하는 유전자 그룹을 확인하였다. 감독되지 않은 계층적 클러스터링을 사용하여 연관된 유전자를 11개의 클러스터로 그룹화하고, 클러스터를 설정하는 덴드로그램(dendrogram) 임계값 레벨은 y축(녹색 선)에 표시되었다. 유전자는 선형 회귀분석을 사용하여 폐암 상태를 예측하기 위해 간결한 방식으로 클러스터로부터 선택되었다. 분류기 유전자는 각 클러스터로부터 2-4개의 유전자를 사용하여 특정 클러스터(파란색으로 표시)로부터 유래되었다. 클러스터 4와 7은 폐암에서 상향 조절된 유전자를 함유하며 클러스터 1, 2, 9 및 10은 폐암에서 하향 조절되었다.
도 8은 시험 세트에서 비 진단 기관지 내시경을 한 환자의 ROC 곡선을 나타낸다. 기관지 내시경가 폐암의 진단을 초래하지 않은 되지 않은 123명의 환자에 대한 AUC = 0.81(폐암의 유병율 = 31%).
도 9는 트레이닝 세트의 모든 환자(검정 라인)에 해당하는 유전자 발현 데이터를 나타내고, 비 진단 기관지 내시경을 한 환자(회색 라인)의 서브세트는 고정된 분류기를 사용하여 분석되었다. AUC는 두 그룹에 대해 각각 0.78(95% CI, 0.73-0.82) 및 0.78(95% CI, 0.71-0.85)로 계산되었다.
도 10a 및 도 10b는 유전자 분류기 CD177로 대표되는 핵산 서열에 혼성화하는데 사용되는 핵산 프로브를 나타낸다. 도 10a는 CD177.1에서 19개의 핵산 프로브 (위에서부터 아래의 순서로 SEQ ID NOs: 24-42)를 나타내고, 도 10b는 CD177.2에서 4개의 핵산 프로브(위에서부터 아래로 SEQ ID NOs: 43-46)를 개시한다.
본 발명에 개시된 방법은 기관지 내시경 절차(또는 호흡 조직 평가를 위한 다른 절차)에 의해 얻은 세포 또는 조직 샘플을 평가하기 위한 대안적 또는 보완적인 접근법을 제공하고, 절차가 환자의 치료를 관리하기 위한 유용한 정보를 가져올 가능성을 증가시킨다. 본 발명에 개시된 방법은 매우 민감하며, 종종 악성 폐 조직으로부터 멀리 떨어진 기도에서 영역으로부터 얻어지는 세포 또는 조직 샘플(예를 들어, 기도 상피 세포의 기관지 브러싱)로부터 폐암에 걸릴 가능성에 관한 정보를 생성한다. 일반적으로, 본 발명에 개시된 방법은 대상으로부터 얻은 생물학적 샘플을 유전자 발현 분석하여 유전자 발현 수준을 평가하는 단계를 포함한다. 그러나, 일부 실시태양에서, 대상이 폐암에 걸릴 가능성은 추가로 생물학적 시료의 조직학적 검사의 결과에 부분적으로 기초하여 또는 단백질 수준, mRNA 수준, 영상 진단 결과, 흉부 X선 검사 결과 등과 같은 다른 진단 지표를 고려하여 측정된다.
본 발명에 사용된 용어 "대상"은 일반적으로 포유동물을 의미한다. 통상적으로 대상은 사람이다. 그러나, 이 용어는 돼지, 생쥐(mice), 쥐(rats), 개, 고양이 또는 다른 영장류와 같은 다른 종을 포함한다. 특정 실시태양에서, 대상은 생쥐 또는 쥐와 같은 실험 대상이다.
대상은 남성 또는 여성 일 수 있다. 대상은 유아, 유아, 어린이, 젊은 성인, 성인 또는 노인일 수 있다. 대상은 흡연자, 이전의 흡연자 또는 비 흡연자일 수 있다. 대상은 암의 개인력 또는 가족력을 가질 수 있다. 대상은 암이 없는 개인력 또는 가족력을 가질 수 있다. 대상은 폐암 또는 다른 폐 질환(예컨대, 폐기종, COPD)의 하나 이상의 증상을 나타낼 수 있다. 예를 들어, 대상은 새로운 또는 지속적인 기침, 현존 만성 기침의 악화, 혈담, 지속적인 기관지염 또는 반복적인 호흡기 감염, 흉부 통증, 설명할 수 없는 체중 감소 및/또는 피로, 또는 호흡 짧음 또는 천명과 같은 호흡 곤란을 가질 수 있다. 대상은 컴퓨터 단층 촬영이나 흉부 X선에 의해 관찰할 수 있는 병변을 가질 수 있다. 대상은 기관지 내시경을 받거나 기관지 내시경의 후보자로 확인된 사람(예를 들어, 검출 가능한 병변 또는 의심스런 영상 결과의 존재 때문)일 수 있다. 일부 실시태양에서, 대상은 만성 폐쇄성 폐 질환 (COPD)에 걸리거나 진단되었다. 일부 실시태양에서, 대상은 COPD에 걸리지 않거나 COPD로 진단되지 않았다. 의사 또는 다른 의료 제공자의 간호를 받는 피험자는 "환자"라고 부를 수 있다.
본 발명에 사용된 용어 "약"은 "대략" 변경되는 대상의 ± 10퍼센트를 의미한다. 따라서, "약 10, 20 또는 30"이라는 문구는 각각 8-11, 18-22, 27-33을 포함한다.
정보 유전자
본 발명의 유전자의 발현 수준은 대상의 폐암 상태에 관한 유용한 정보를 제공하는 것으로 확인되었다. 이들 유전자는 본 발명에서 "정보 유전자"라고 불린다. 정보 유전자는 단백질 암호화 유전자와 비 단백질 암호화 유전자를 포함한다. 정보 유전자의 발현 수준은 적절한 유전자 생성물(예를 들어, mRNA, miRNA, 단백질 등)의 수준을 평가함으로써 측정될 수 있음을 당업자는 인식할 것이다. 따라서, 특정 mRNA의 발현 수준은 대상의 폐암 상태에 관한 유용한 정보를 제공하는 것으로 확인되었다. 이들 mRNA는 본 발명에서 "정보 mRNA"로 불린다.
표 11은 암에서 상이하게 발현되는 정보 유전자의 목록을 제공한다. 일부 실시태양에서, 폐암에서 상이하게 발현되는 정보 유전자는 BST1, CD177.1, CD177.2, ATP12A, TSPAN2, GABBR1, MCAM, NOVA1, SDC2, CDR1, CGREF1, CLND22, NKX3-1, EPHX3, LYPD2, MIA, RNF150으로부터 선택된다. 일부 실시태양에서, 폐암에서 상이하게 발현되는 정보 유전자는 TMEM51, CR1L, PDZKlIP1, MICAL2, VWA5A, ACAD8, SAA4, GLYATL2, ETV6, CD177, CEACAM7, QPCT, CASP10, PI3, BST1, MTNR1A, STARD4, CFB, SLC26A8, VNN2, HDAC9, SLC26A4, 및 LCN2로부터 선택된다. 일부 실시태양에서, 폐암에서 상이하게 발현되는 정보 유전자는 CCDC18, FAM72D, NUF2, FBXO28, GPR137B, STIL, DEPDC1, TSPAN2, ASPM, KIF14, KIF20B, RAD51AP1, GAS2L3, SPIC, SMAGP, ATP12A, BRCA2, BORA, SKA3, DLGAP5, CASC5, LRRC28, PYCARD, TXNL4B, EFCAB5, SPAG5, ABCAl2, AURKA, SGOL1, BANK1, CENPE, CASP6, MAD2L1, CCNA2, CCNB1, KIF20A, CENPK, ERAP1, FAM54A, PHTF2, CLDN12, BPGM, PCMTD1, MELK, 및 MST4로부터 선택된다. 일부 실시태양에서, 폐암에서 상이하게 발현되는 정보 유전자는 CR1, GOS2, CSF3R, S100Al2, SELL, NCF2, LIPN, ZNF438, NAMPT, CBL, CASP5, CARD16, CARD17, CLEC4A, LRRK2, HMGN2P46, AQP9, BCL2A1, ITGAX, GPR97, CCL4, PSTPIP2, IFI30, FFAR2, EMR3, FPR1, LILRA5, PLEK, MXD1, TNFAIP6, CXCR2, IL1B, CXCR1, SIRPB1, NCF4, IRAK2, PROK2, TLR2, TREM1, SOD2, CREB5, TNFRSF10C, CSGALNACT1, 및 ASAP 1로부터 선택된다. 일부 실시태양에서, 폐암에서 상이하게 발현되는 정보 유전자는 PLA2G2A, NFYC, RASSF10, GLB1L3, TRIM3, MCAM, MSRB3, SLITRK5, GAS6, NOVA1, GABRG3, ABCA3, LPO, FSCN2, RASD1, HILS1, SDK2, NTN5, KCNA7, ATOH8, KCNIP3, INHBB, VSTM2L, ZNRF3, PLEKHG4B, GNMT, GABBR1, ARHGEF10, SDC2, CRB2, GAS1, PNPLA7, 및 RAI2로부터 선택된다.
본 발명에 개시된 특정 방법은 적어도 하나의 정보 유전자의 생물학적 샘플에서 발현 수준을 측정하는 단계를 포함한다. 그러나, 일부 실시태양에서, 발현 분석은 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 20, 적어도 30, 적어도 40, 적어도 50, 적어도 60, 적어도 70 또는 적어도 80개 정보 유전자의 생물학적 샘플에서 발현 수준을 측정하는 단계를 필요로 한다. 일부 실시태양에서, 발현 분석은 표 11에 있는 것과 같이, 생물학적 샘플에서 1 내지 5, 1 내지 10, 5 내지 10, 5 내지 15, 10 내지 15, 10 내지 20, 15 내지 20, 15 내지 25, 20 내지 30, 25 내지 50, 25 내지 75, 50 내지 100, 50 내지 200 또는 그 이상의 정보 유전자의 생물학적 샘플에서의 발현 수준을 측정하는 단계를 필요로 한다. 일부 실시태양에서, 발현 분석은 표 11에 있는 것과 같이, 적어도 1 내지 5, 1 내지 10, 2 내지 10, 5 내지 10, 5 내지 15, 10 내지 15, 10 내지 20, 15 내지 20, 15 내지 25, 20 내지 30, 25 내지 50, 25 내지 75, 50 내지 100, 50 내지 200 또는 그 이상의 정보 유전자의 생물학적 샘플에서의 발현 수준을 측정하는 단계를 필요로 한다.
일부 실시태양에서, 발현 분석을 위한 정보 유전자의 수는 임상적으로 유용한 예측 결과에 신뢰 수준을 제공하기에 충분하다. 이러한 신뢰 수준(예를 들어, 예측 모델의 강도)은 정확성, 민감성, 특이성 및 수신자 작동 특성(ROC) 곡선의 면적(AUC)을 포함하나 이에 제한되지 않는 다양한 성능 매개 변수에 의해 평가될 수 있다. 이들 파라미터는 정보 유전자의 최적 숫자 및 세트를 결정하기 위해 다양한 숫자의 특징(예를 들어, 유전자의 숫자, mRNA)으로 평가될 수 있다. 단독으로 사용하거나 다른 정보와 함께 사용할 때 적어도 60%, 70%, 80%, 90%의 정확성, 민감성 또는 특이성이 유용할 수 있다.
정보 유전자의 발현 수준을 결정하기 위해 임의의 적절한 시스템 또는 방법이 사용될 수 있다. 유전자 발현 수준은 혼성화-기초 분석의 사용을 통해 측정될 수 있다. 본 발명에서 사용된 용어 "혼성화-기초 분석"은 핵산 혼성화를 필요로 하는 임의의 분석을 의미한다. 혼성화-기초 분석은 핵산의 증폭을 필요로 하거나 않을 수 있다. 혼성화-기초 분석은 당업계에 주지되어 있고 어레이-기초 분석(예를 들어, 올리고뉴클레오타이드 어레이, 마이크로어레이), 올리고뉴클레오티드 접합 된 비드 분석(예를 들어, Multiplex Bead-based Luminex® Assays), 분자 역위 프로브 분석 및 정량적 RT-PCR 분석을 포함하나 이에 제한되지 않는다. 올리고뉴클레오타이드 어레이 또는 비드-기초 핵산 분석 시스템과 같은 다중 시스템이 복수의 유전자의 수준을 동시에 평가하는데 특히 유용하다. 핵산의 수준을 측정하기 위한 다른 적절한 방법은 당업자에게 명백할 것이다.
본 발명에 사용된 "수준"은 물질, 예를 들어 mRNA의 양 또는 발생을 나타내는 값을 의미한다. 수준은 예를 들어 샘플 내의 mRNA의 양과 같은 절대값, 또는 참조 샘플(대조군 샘플)에서의 mRNA의 양에 대한 샘플에서의 mRNA의 양과 같은 상대값일 수 있다. 수준은 또한 물질의 존재 또는 부재를 나타내는 이진값일 수 있다. 예를 들어, 물질은 샘플에서 물질의 양의 측정치, 예를 들어 PCR 반응 또는 마이크로 어레이로부터의 형광 측정치가 백그라운드 값을 초과할 때 샘플에 존재하는 것으로 확인될 수 있다. 유사하게, 물질은 샘플에서 분자량의 측정치가 백그라운드 값 이하일 때 샘플에 존재하지 않는 것으로(또는 샘플에서 검출 불가능한 것으로) 확인 될 수 있다. 물질의 수준은 직접적으로 또는 간접적으로 측정될 수 있음을 이해해야 한다.
정보 mRNA의 추가 비 제한적인 예는, 예를 들어, 다음 특허 출원에 개시되며, 이의 내용은 온전히 전문이 참조로 본 발명에 포함된다: ISOLATION OF NUCLEIC ACID FROM MOUTH EPITHELIAL CELLS 이란 제목으로 2006년 5월12일 출원된 미국 특허출원 공개공보 No. US2007/148650; ISOLATION OF NUCLEIC ACID FROM MOUTH EPITHELIAL CELLS 이란 제목으로 2009년 1월9일 출원된 미국 특허출원 공개공보 No. US2009/311692; ISOLATION OF NUCLEIC ACID FROM MOUTH EPITHELIAL CELLS 이란 제목으로 2010년 9월17일 출원된 미국출원 No. 12/884,714, ; DETECTION METHODS FOR DISORDER OF THE LUNG 이란 제목으로 2005년 12월6일 출원된 미국 특허출원 공개공보 No. US2006/154278; DIAGNOSTIC FOR LUNG DISORDERS USING CLASS PREDICTION 이란 제목으로 2008년 2월8일 출원된 미국 특허출원 공개공보 No. US2010/035244; DIAGNOSTIC FOR LUNG DISORDERS USING CLASS PREDICTION 이란 제목으로 2010년 8월26일 출원된 미국 특허출원 공개공보 No. 12/869,525; BIOMARKERS FOR SMOKE EXPOSURE 이란 제목으로 2008년 9월19일 출원된 미국 특허출원 공개공보 No. 12/234,368; BIOMARKERS FOR SMOKE EXPOSURE 이란 제목으로 2010년 10월15일 출원된 미국 특허출원 공개공보 No. 12/905,897; IDENTIFICATION OF NOVEL PATHWAYS FOR DRUG DEVELOPMENT FOR LUNG DISEASE 이란 제목으로 2008년 9월19일에 출원된 미국 특허출원 공개공보 No. US2009/186951; DIAGNOSTIC AND PROGNOSTIC METHODS FOR LUNG DISORDERS USING GENE EXPRESSION PROFILES 이란 제목으로 2008년 9월 9일 출원된 미국 특허출원 공개공보 No. US2009/061454; DIAGNOSTIC AND PROGNOSTIC METHODS FOR LUNG DISORDERS USING GENE EXPRESSION PROFILES 이란 제목으로 2010년 11월5일 출원된 미국 특허출원 공개공보 No. 12/940,840; MULTIFACTORIAL METHODS FOR DETECTING LUNG DISORDERS 이란 제목으로 2009년 3월30일에 출원된 미국 특허출원 공개공보 No. US2010/055689; 및 METHODS FOR EVALUATING LUNG CANCER STATUS 이란 제목으로 2013년 4월26일 출원된 국제 특허출원 No. PCT/US13/38449.
cDNA
cDNA 분자는 당업자에 의해 mRNA 분자로부터 합성되는 비 자연 발생 폴리뉴클레오티드 서열이다. 일부 실시태양에서, 본 발명의 cDNA 분자가 얻어지거나 획득된다. 역전사 효소를 사용하는 RNA의 cDNA로의 전환은 인트론이 없는 자연 발생 분자인 cDNA를 생성한다. 예를 들어, cDNA 분자의 단백질 발현 또는 cDNA 분자의 혼성화인 cDNA에 의존하는 방법은 필수적으로 자연적으로 발생하지 않는 인공 분자에 의존한다.
특정 양태에서, 생물학적 샘플에서 mRNA는 적어도 하나의 프라이머를 사용하여 mRNA의 역전사에 의해 샘플로부터 cDNA를 생성하고; 센스 및 안티센스 프라이머로서 폴리뉴클레오티드를 사용하여 cDNA를 증폭시키고; 증폭된 cDNA의 존재를 탐지하는데 사용된다. 추가의 양태에서, 증폭된 cDNA의 서열은 임의의 적합한 방법에 의해 측정될 수 있다.
한 실시태양에서, 일단 mRNA가 샘플로부터 얻어지면, 상보적인 DNA(cDNA)로 전환된다. cDNA는 생체 내에 존재하지 않으므로 비 천연 분자이다. 추가 실시태양에서, cDNA는, 예를 들어, 중합효소 연쇄 반응(PCR) 또는 당업자에게 공지된 다른 증폭 방법에 의해 증폭된다. 이 증폭 반응의 생성물, 즉 증폭된 cDNA는 필수적으로 비 천연 생성물이다. 위에서 언급했듯이, cDNA는 비 천연 분자이다. 둘째, PCR의 경우, 증폭 과정은 출발 재료의 모든 개별 cDNA 분자에 대해 수억 개의 cDNA 복제물을 생성하는 역할을 한다. 생성된 복제물의 숫자는 생체 내에서 존재하는 mRNA의 복제물의 숫자로부터 제거된다.
한 실시태양에서, cDNA는 (어댑터 특이적 프라이머를 사용하여) 단편 상에 추가의 DNA 서열(어댑터 서열)을 도입하는 프라이머로 증폭된다. 따라서 증폭은 기존 비 천연 cDNA 상에 바코드, 어댑터 및/또는 리포터 서열을 도입함으로써 비 천연 단일 가닥 cDNA로부터 비 천연 이중 가닥 분자를 생성하는 역할을 한다. 한 실시태양에서, 어댑터-특이적 프라이머에 의한 증폭 동안, 검출 가능한 표지, 예를 들어, 형광단이 단일 가닥 cDNA 분자에 첨가된다. 따라서 증폭은 적어도 (i) cDNA가 생체 내에서 존재하지 않고, (i) 어댑터 서열이 cDNA 분자의 말단에 가해져서 생체 내에 존재하지 않는 DNA 서열을 만들며, (ii) 증폭과 관련된 실수율이 생체 내에 존재하지 않는 DNA 서열을 더 생성하며, (iii) 자연에서 존재하는 것과 비교하여 cDNA 분자의 상이한 구조 및 (iv) cDNA 분자에 대한 검출 가능한 표지의 화학적 첨가 때문에 자연에서 발생하지 않는 DNA 복합체를 생성하는 역할을 한다.
한 실시태양에서, 합성된 cDNA(예를 들어, 증폭된 cDNA)는 프로브와의 혼성화를 통해, 예를 들어 마이크로어레이를 통해 고체 표면상에 고정화된다. 다른 실시태양에서, cDNA 생성물은 cDNA 생성물과 혼성화하는 형광 프로브의 도입을 통해 실시간 중합효소 연쇄 반응(PCR)을 통해 검출된다. 예를 들어, 한 실시태양에서, 바이오마커 검출은 정량적 형광 발현 RT-PCR(예를 들어, TaqMan® 프로브로)에 의해 평가된다. PCR 분석의 경우, 공지된 방법이 분석에 사용하기 위한 프라이머 서열의 측정을 위해 당업계에 이용 가능하다.
한 실시태양에서, cDNA를 합성 및 증폭하기 위해, 5' Ampli FINDER RACE 키트(Clontech 제조) 및 PCR을 사용하는 5'-RACE 방법(Frohman, MA et al., Proc. Natl. Acad. Sci. USA (1988) 85:8998-9002; Belyaysky, A. et al., Nucleic Acids Research (1989) 17:2919-2932)이 사용될 수 있다. 이러한 cDNA 합성 과정에서, 제한 효소 부위가 cDNA의 양 말단 속에 도입될 수 있다.
게놈 상관관계
본 발명에 개시된 바와 같이, 특정 유전자의 발현 수준은 대상의 특정 자가 보고 특징과 관련이 있는(상관관계가 있는) 것으로 확인되었다. 이런 유전자는 본 발명에서 "게놈 상관 유전자(genomic correlate genes)" 또는 "게놈 상관관계 (genomic correlates)"로 불리며, 이들은 정확하지 않게 및/또는 부정확하게 보고될 수 있는 대상의 특성에 대한 대리 마커를 제공하기 때문에 유용하다. 예를 들어, 일부 실시태양에서, 대상은 (예를 들어, 이런 정보의 과소평가를 제공함으로써) 갑년, 흡연 상태 또는 연령과 같은 정보를 잘못 추정할 수 있다. 이런 실시태양에서, 게놈 상관 유전자에 기초한 예측 모델의 사용은 부정확한 보고와 관련된 가변성을 감소시키거나 제거할 수 있는데, 이는 어떤 정보를 보고할지에 대한 대상의 결정 및/또는 대상의 상황 회상보다는 게놈 상관 유전자의 발현에 기초하기 때문이다. 이런 게놈 상관 유전자의 발현 수준은 적절한 유전자 생성물(예를 들어, mRNA, miRNA, 단백질 등)의 수준을 평가함으로써 결정될 수 있음을 당업자는 인식할 것이다. 게놈 상관 유전자의 발현 수준은 폐암 상태의 정보 유전자(예를 들어, 표 11로부터 선택된 정보 유전자)와 비교하여 또는 이런 유전자와 독립적으로 측정될 수 있다.
일부 실시태양에서, 게놈 상관관계는 환경 위험(예를 들어, 담배 흡연)에 대한 개인의 반응을 반영한다. 일부 실시태양에서, 게놈 상관관계는 위험에 대한 노출을 반영한다.
일부 실시태양에서, 대상의 성별은 하나 이상의 게놈 상관 유전자에 기초하여 측정된다. 일부 실시태양에서, 성별에 관련된 게놈 상관 유전자는 RPS4Y1이다. 일부 실시태양에서, RPS4Y1의 발현이 임계치보다 낮으면 대상은 수컷으로 확인되고, RPS4Y1의 발현이 임계치를 초과하면 대상은 암컷으로 확인된다. 일부 실시태양에서, 임계치는 관심 유전자(들)에 대해 남성 및 여성을 정확하게 구별하는 상대적인 발현 수준이다.
일부 실시태양에서, 대상의 흡연 상태(예를 들어, 현재 또는 과거)는 하나 이상의 게놈 상관 유전자에 기초하여 측정된다. 일부 실시태양에서, 흡연 상태와 관련된 게놈 상관 유전자는 SLC7A11, CLND10 또는 TKT이다. 일부 실시태양에서, 대상의 흡연 상태는 다음 모델: 흡연 상태(또한, 게놈 흡연(GS)으로 불림)= exp(x)/(1 + exp(x))에 따라 측정되며, 여기서 x=β
Figure 112017015320306-pct00002
*SLC7A11 +
Figure 112017015320306-pct00003
*CLND10 +
Figure 112017015320306-pct00004
*TKT, 여기서
Figure 112017015320306-pct00005
는 회귀 모델에 대한 회귀 가중치이고 유전자 기호는 각 개별 유전자의 상대적인 발현 강도를 나타낸다. 일부 실시태양에서, 흡연자는 일생에 적어도 100개의 담배를 피웠던 대상이다. 일부 실시태양에서, 과거 흡연자는 금연하거나 기관지 내시경 이전 1개월 내에 흡연하지 않는 대상이다.
일부 실시태양에서, 대상의 흡연력은 하나 이상의 게놈 상관 유전자에 기초하여 측정된다. 일부 실시태양에서, 흡연력과 관련된 게놈 상관 유전자는 AKR1C2 또는 RUNX1T1이다. 일부 실시태양에서, 대상의 흡연력은 다음 모델: 흡연력(또한, 게놈 갑년(GPY)으로 불림)= exp(x)/(l+exp(x))에 따라 측정되며, 여기서 x=
Figure 112017015320306-pct00006
+
Figure 112017015320306-pct00007
*RUNX1T1 +
Figure 112017015320306-pct00008
*AKR1C2, 여기서
Figure 112017015320306-pct00009
는 모델에 대한 회귀 가중치이고 유전자 기호는 각 개별 유전자의 상대적인 발현 강도를 나타낸다.
일부 실시태양에서, 대상의 연령은 하나 이상의 게놈 상관 유전자에 기초하여 측정된다. 일부 실시태양에서, 연령과 관련된 게놈 상관 유전자는 CD52, SYT8, TNNT3, ALX1, KLRK1, RASA3, CERS3, ASPA, GRP, APOC1, EPHX3, REEP1, FAM198B, PCDHB4, PCDHB16, FOXD1, SPARC, NKAPL 또는 GPR110이다. 일부 실시태양에서, 대상의 연령은 다음 모델: 연령(또한 게놈 연령(GA)으로 불림)= β
Figure 112017015320306-pct00010
Figure 112017015320306-pct00011
*CD52 + β
Figure 112017015320306-pct00012
*SYT8 +β
Figure 112017015320306-pct00013
*TNNT3 + β
Figure 112017015320306-pct00014
*ALX1 + β
Figure 112017015320306-pct00015
*KLRK1 + β
Figure 112017015320306-pct00016
*RASA3 +β
Figure 112017015320306-pct00017
*CERS3 + β
Figure 112017015320306-pct00018
*ASPA + β
Figure 112017015320306-pct00019
*GRP + β
Figure 112017015320306-pct00020
*APOC1 + β
Figure 112017015320306-pct00021
*EPHX3 + β
Figure 112017015320306-pct00022
*REEP1 + β
Figure 112017015320306-pct00023
*FAM198B + β
Figure 112017015320306-pct00024
*PCDHB4 + β
Figure 112017015320306-pct00025
*PCDHB16 + β
Figure 112017015320306-pct00026
*FOXD1 + β
Figure 112017015320306-pct00027
*SPARC +β
Figure 112017015320306-pct00028
*NKAPL + β
Figure 112017015320306-pct00029
*GPR110에 따라 측정되며, 여기서 β
Figure 112017015320306-pct00030
는 모델에 대한 회귀 가중치이고 유전자 기호는 각 개별 유전자의 상대적인 발현 강도를 나타낸다.
생물학적 샘플
상기 방법은 일반적으로 대상으로부터 생물학적 샘플을 얻는 단계를 포함한다. 본 발명에 사용된 바와 같이, "생물학적 샘플을 얻는"이라는 문구는 대상으로부터 생물학적 샘플을 직접 또는 간접적으로 획득하기 위한 임의의 과정을 의미한다. 예를 들어, 생물학적 샘플은 대상으로부터 조직 또는 유체 샘플을 획득함으로써(예를 들어, 환자접점지역(point-of-care) 시설, 의사의 사무실, 병원에서) 얻을 수 있다. 대안적으로, 생물학적 샘플은 환자로부터 샘플을 직접 획득한 1명 이상의 사람으로부터 (예를 들어, 실험실 시설에서) 샘플을 받아서 얻을 수있다.
용어 "생물학적 샘플"은 대상, 예를 들어 환자로부터 유래된 샘플을 의미한다. 생물학적 샘플은 전형적으로 조직, 세포 및 / 또는 생체분자를 포함한다. 일부 실시태양에서, 생물학적 샘플은, 내시경, 예를 들어, 기관지 내시경에 의해 측정되는 것과 같이 조직학적으로 정상이라는 사실에 기초하여 얻어진다. 일부 실시태양에서, 생물학적 샘플은 암세포를 함유하는 것으로 의심되는 않는 지역, 예를 들어, 기관지 또는 다른 영역 또는 지역으로부터 얻어진다. 일부 실시태양에서, 조직학적 또는 세포학적 검사가 수행된다. 그러나, 조직학적 또는 세포학적 검사는 선택적 일 수 있음을 이해해야 한다. 일부 실시태양에서, 생물학적 샘플은 호흡 상피의 샘플이다. 호흡 상피는 피검자의 입, 코, 인두, 기관, 기관지, 세기관지 또는 폐포일 수 있다. 생물학적 샘플은 기관지의 상피를 포함할 수 있다. 일부 실시태양에서, 생물학적 샘플은, 예를 들어 표준 조직학적 또는 세포학적 방법에 의해 측정된 것과 같이 검출 가능한 암세포가 없다. 일부 실시태양에서, 조직학적으로 정상인 샘플을 평가를 위해 얻는다. 흔히 생물학적 샘플은 스크래핑(scraping) 또는 브러싱(brushing), 예를 들어, 기관지 브러싱(bronchial brushings)에 의해 얻어진다. 그러나, 예를 들어, 브러싱, 스크래핑, 기관지 폐포 세척, 기관지 생검 또는 경기관지 바늘 흡인을 포함하는 다른 절차가 사용될 수 있다는 것을 이해해야 한다.
생물학적 샘플은 발현 수준 결정을 용이하게 하기 위한 임의의 적절한 방식으로 처리될 수 있음을 이해해야 한다. 예를 들어, 생화학적, 기계적 및 / 또는 열처리 방법이 관심 생체 분자, 예를 들어 RNA를 생물학적 샘플로부터 분리하는데 적절하게 사용될 수 있다. 따라서, RNA 또는 다른 분자는 당업계에 공지된 방법을 사용하여 샘플을 처리함으로써 생물학적 샘플로부터 분리될 수 있다.
폐암 평가
본 발명에 개시된 방법은 정보 유전자의 발현 수준을 하나 이상의 적절한 기준과 비교하는 단계를 포함할 수 있다. "적절한 기준"은 알려진 폐암 상태를 나타내는 특정 정보 유전자의 발현 수준 (또는 발현 수준 범위)이다. 적절한 기준은 방법의 실무자에 의해 실험적으로 측정되거나 기존 값 또는 값의 범위 일 수 있다. 적절한 기준은 폐암을 나타내는 발현 수준 (또는 발현 수준의 범위)을 나타낸다. 예를 들어, 적절한 기준은 폐암에 걸린 것으로 알려진 대상으로부터 얻은 기준(대조군) 생물학적 샘플에서 정보 유전자의 발현 수준을 나타낼 수 있다. 적절한 기준이 폐암을 나타낼 때, 폐암의 특성화 또는 진단을 필요로 하는 대상으로부터 측정된 발현 수준과 적절한 기준 사이의 탐지가능한 차이의 결여(예를 들어, 통계적으로 유의한 차이의 결여)는 대상에서 폐암을 나타낼 수 있다. 적절한 참조가 폐암을 나타낼 때, 폐암의 특성화 또는 진단을 필요로 하는 대상으로부터 측정된 발현 수준과 적절한 기준 사이의 탐지가능한 차이는 대상이 없다는 것을 나타낼 수 있다.
선택적으로, 적절한 기준은 대상이 폐암이 없는 것을 나타내는 유전자의 발현 수준(또는 발현 수준의 범위) 일 수 있다. 예를 들어, 적절한 기준은 폐암이 없는 것으로 알려진 대상으로부터 얻은 기준(대조군) 생물학적 샘플에서 정보 유전자의 발현 수준을 나타낼 수 있다. 적절한 기준이 대상이 폐암이 없다는 것을 나타낼 때, 폐암의 진단을 필요로 하는 대상으로부터 측정된 발현 수준과 적절한 기준 사이의 탐지가능한 차이는 대상에서 폐암을 나타낼 수 있다. 선택적으로, 적절한 기준이 대상이 폐암이 없다는 것을 나타낼 때, 폐암의 진단을 필요로 하는 대상으로부터 측정된 발현 수준과 적절한 기준 사이의 탐지가능한 차이의 결여(예를 들어, 통계적으로 유의한 차이의 결여)는 대상이 폐암이 없다는 것을 나타낼 수 있다.
일부 실시태양에서, 기준 표준은 임계 변화 수준을 제공하여 샘플에서 유전자의 발현 수준이 임계 변화 수준(특정 마커에 따라 증가 또는 감소) 내에 있는 경우, 대상은 폐암이 없는 것으로 확인되지만, 그 수준이 임계값을 초과하면 그 대상은 폐암에 걸릴 위험이 있는 것으로 확인된다.
일부 실시태양에서, 상기 방법은 유방암에 걸리지 않는 것으로 확인된 대조군 대상에서 정보 유전자의 발현 수준을 나타내는 기준 표준과 정보 유전자의 발현 수준을 비교하는 단계를 포함한다. 이 기준 표준은, 예를 들어, 폐암에 걸리지 않은 것으로 확인된 대조군 대상의 개체군에서 정보 유전자의 평균 발현 수준일 수 있다.
발현 수준과 통계적으로 유의한 적절한 기준 사이의 차이의 크기는 변할 수 있다. 예를 들어, 생물학적 샘플에서 유익한 유전자의 발현 수준이 그 유전자의 적절한 기준보다 적어도 1%, 적어도 5%, 적어도 10%, 적어도 25%, 적어도 50%, 적어도 100%, 적어도 250%, 적어도 500%, 또는 적어도 1000% 높거나 낮을 때 폐암을 나타내는 유의한 차이가 탐지될 수 있다. 유사하게, 생물학적 샘플에서 정보 유전자의 발현 수준이 그 유전자의 적절한 기준보다 적어도 1.1배, 1.2배, 1.5배, 2배, 3배, 4배, 적어도 5배, 적어도 6배, 적어도 7배, 적어도 8배, 적어도 9배, 적어도 10배, 적어도 20배, 적어도 30배, 적어도 40배, 50배 이상, 100배 이상이거나 이하일 때 탐지될 수 있다. 일부 실시태양에서, 유익한 유전자와 적절한 기준 사이의 발현에서 적어도 20% 내지 50% 차이는 유의하다. 유의한 차이는 적절한 통계 테스트를 사용하여 확인될 수 있다. 통계적 유의성에 대한 테스트는 당 업계에 공지되어 있으며, Applied Statistics for Engineers and Scientists by Petruccelli, Chen and Nandram 1999 Reprint Ed에 예시되어 있다.
대상의 폐암 상태를 평가하기 위해, 복수의 발현 수준이 복수의 적절한 기준 수준과, 예를 들어, 유전자 대 유전자를 기준으로 비교될 수 있음을 이해해야 한다. 비교는 벡터 차이로 이루어질 수 있다. 이런 경우에, 다변수 테스트, 예를 들어, 호텔링의 T2 테스트가 관찰된 차이의 중요성을 평가하는데 사용될 수 있다. 이런 다변수 테스트는 당업계에 주지되어 있으며, Applied Multivariate Statistical Analysis by Richard Arnold Johnson and Dean W. Wichern Prentice Hall; 6th edition (April 2, 2007)에 예시되어 있다.
분류 방법
상기 방법은 또한 대상으로부터 얻은 생물학적 샘플에서 정보 유전자의 발현 수준 세트(발현 패턴 또는 프로파일으로 불림)를 기준 수준의 복수 세트(기준 패턴으로 불림, 각각의 기준 패턴은 공지된 폐암 상태와 관련된다)와 비교하는 단계, 발현 패턴과 가장 유사한 기준 패턴을 확인하는 단계 및 기준 패턴의 공지된 폐암 상태를 발현 패턴과 연관시킴으로써, 대상의 폐암 상태를 분류(특성화)하는 단계를 포함한다.
상기 방법은 또한 대상의 질병 상태를 분류하는데 사용될 수 있는 분류기 또는 예측기로 불릴 수 있는 예측 모델을 구축 또는 구성하는 단계를 필요로 할 수 있다. 본 발명에서 사용된 "폐암 분류기"는 대상으로부터 얻은 생물학적 샘플에서 측정된 발현 수준에 기초하여 대상의 폐암 상태를 특성화하는 예측 모델이다. 통상적으로 모델은 분류(폐암 상태)가 이미 확인된 표본을 사용하여 구축된다. 일단 모델(분류기)이 구축되면, 폐암 상태가 알려지지 않은 피험자의 생물학적 샘플로부터 얻은 발현 수준에 적용되어 대상의 폐암 상태를 예측할 수 있다. 따라서, 상기 방법은 폐암 분류기를 발현 수준에 적용하여, 폐암 분류기가 발현 수준에 기초하여 대상의 폐암 상태를 특성화하는 단계를 필요로 할 수 있다. 예를 들어, 대상은, 예측된 폐암 상태에 기초하여, 의료 제공자에 의해 추가로 치료되거나 평가될 수 있다.
분류 방법은 발현 수준을 대상이 폐암에 걸릴 가능성을 나타내는 폐암 위험 점수로 변환하는 단계를 필요로 할 수 있다. 일부 실시태양에서, 예를 들어 선형 판별 분류기가 사용되는 경우, 폐암 위험 점수는 발현 수준이 폐암에 걸릴 증가된 가능성을 예측하는데 이의 상대적 기여도에 의해 가중되는 가중 발현 수준의 조합(예를 들어, 합, 곱 또는 다른 조합)으로 얻어질 수 있다.
당업계에 공지된 다양한 예측 모델이 폐암 분류기로서 사용될 수 있다는 것을 이해해야 한다. 예를 들어, 폐암 분류기는 로지스틱 회귀 분석, 부분 최소 자승 분석, 선형 판별 분석, 2차 판별 분석, 신경망, 나이브 베이즈, C4.5 결정 트리, k-최근접 이웃, 랜덤 포레스트, 지원 벡터 기계, 또는 다른 적절한 방법으로부터 선택된 알고리즘을 포함할 수 있다.
폐암 분류기는 폐암에 걸린 것으로 확인된 다수의 대상으로부터 얻은 생물학적 샘플에서 복수의 정보 유전자의 발현 수준을 포함하는 데이터 세트에 대해 트레이닝될 수 있다. 예를 들어, 폐암 분류기는 조직학적 소견을 기초로 폐암에 걸린 것으로 확인된 다수의 대상으로부터 얻은 생물학적 샘플에서 복수의 정보 유전자의 발현 수준을 포함하는 데이터 세트에 대해 트레이닝될 수 있다. 트레이닝 세트는 또한 통상적으로 폐암이 없는 것으로 확인된 대조군 대상을 포함할 것이다. 당업자가 인식할 수 있는 바와 같이, 트레이닝 데이터 세트의 대상 개체군은 의도적으로 다양한 특징을 가질 수 있는데, 예를 들어, 개체군의 특징은 분류기를 사용하는 진단 방법이 유용할 수 있는 대상의 특징에 의존될 수 있다. 예를 들어, 개체군은 모든 수컷, 모든 암컷 또는 수컷과 암컷으로 구성될 수 있다. 개체군은 암 이력이 있는 대상, 암 이력이 없는 대상 또는 두 카테고리의 대상으로 구성될 수 있다. 개체군은 흡연자, 이전 흡연자 및/또는 비 흡연자인 대상을 포함할 수 있다.
분류 예측 강도는 또한 모델이 생물학적 샘플을 분류하는 신뢰도를 결정하기 위해 측정될 수 있다. 이 신뢰도는 대상이 모델에 의해 예측된 특정 분류인 가능성의 추정치로서 역할을 할 수 있다.
따라서, 예측 강도는 샘플의 분류의 신뢰도를 전달하고 샘플이 분류될 수 없는 경우를 평가한다. 샘플이 테스트되었지만, 특정 분류에 속하지 않거나 신뢰할 수 있게 선정될 수 없는 경우가 있을 수 있다. 이것은, 예를 들어, 임계값 또는 범위를 사용함으로써 달성될 수 있으며, 여기서, 측정된 임계값의 위 또는 아래 또는 특정 범위 내에서 점수를 갖는 샘플은 분류될 수 있는 샘플이 아니다(예를 들어, "노 콜(no call)" ).
일단 모델이 구축되면, 당업계에 공지된 방법을 사용하여 모델의 유효성이 테스트될 수 있다. 모델의 유효성을 테스트하는 한 방법은 데이터세트의 교차 유효성 검사이다. 교차 유효성 검사를 수행하기 위해 샘플 중 하나 또는 서브세트는 제거되고, 상기한 대로, 제거된 샘플 없이, 모델을 구축하여, "교차 유효성 검사 모델"을 형성한다. 그런 후에 제거된 샘플은 상기한 대로 모델에 따라 분류된다. 이 프로세스는 초기 데이터세트의 모든 샘플 또는 서브세트로 완료되며 오류율이 측정된다. 모델의 정확성이 평가된다. 이런 모델은 공지된 또는 이전에 확인된 분류에 대해 높은 정확성로 테스트될 샘플을 분류한다. 모델을 검증하는 또 다른 방식은 알려지지 않은 폐암 상태를 가진 새로운 생물학적 샘플과 같은 독립적인 데이터세트에 모델을 적용하는 것이다.
당업자가 인식할 수 있는 바와 같이, 모델의 강도는 정확성, 민감성 및 특이성을 포함하나 이에 제한되지 않는 다양한 파라미터에 의해 평가될 수 있다. 정확성, 민감성 및 특이성을 계산하기 위한 방법은 당업계에 공지되어 있으며 본 발명에 기술되어 있다(예를 들어, 실시예 참조). 폐암 분류기는 적어도 60% 이상, 적어도 65% 이상, 적어도 70% 이상, 적어도 75% 이상, 적어도 80% 이상, 적어도 85% 이상, 적어도 90% 이상, 적어도 95% 이상, 적어도 99% 이상 이상의 정확성을 가질 수 있다. 폐암 분류기는 약 60% 내지 70%, 70% 내지 80%, 80% 내지 90% 또는 90% 내지 100% 범위의 정확성을 가질 수 있다. 폐암 분류기는 적어도 60% 이상, 적어도 65% 이상, 적어도 70% 이상, 적어도 75% 이상, 적어도 80% 이상, 적어도 85% 이상, 적어도 90% 이상, 적어도 95% 이상, 적어도 99% 이상 이상의 민감성을 가질 수 있다. 폐암 분류기는 약 60% 내지 70%, 70% 내지 80%, 80% 내지 90% 또는 90% 내지 100% 범위의 민감성을 가질 수 있다. 폐암 분류기는 적어도 60% 이상, 적어도 65% 이상, 적어도 70% 이상, 적어도 75% 이상, 적어도 80% 이상, 적어도 85% 이상, 적어도 90% 이상, 적어도 95% 이상, 적어도 99% 이상 이상의 특이성을 가질 수 있다. 폐암 분류기는 약 60% 내지 70%, 70% 내지 80%, 80% 내지 90% 또는 90% 내지 100% 범위의 특이성을 가질 수 있다.
네거티브 예측치(NPV)는 의도된 사용 개체군에서 폐암을 배제하기 위해 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%보다 클 수 있다.
의도된 사용 개체군은 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 또는 약 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 암 유병율을 가질 수 있다.
임상 치료/관리
특정 양태에서, 대상에 대한 치료 과정을 결정하기 위한 방법이 제공된다. 상기 방법은 통상적으로 하나 이상의 유익한 유전자의 대상으로부터 얻은 생물학적 샘플에서 발현 수준을 측정하는 단계 및 발현 수준에 기초하여 대상에 대한 치료 과정을 결정하는 단계를 포함한다. 종종 치료 과정은 발현 수준으로부터 유래된 폐암 위험 점수에 따라 측정된다. 대상은 대상이 폐암에 걸릴 비교적 높은 가능성을 갖는 것을 나타내는 폐암 위험 점수에 기초하여 침습적 폐 절차에 대한 후보로서 확인될 수 있다. 대상은 폐암에 걸릴 비교적 높은 가능성(예를 들어, 60% 초과, 70% 초과, 80% 초과, 90% 초과)을 갖는 것을 나타내는 폐암 위험 점수를 기초로 침습성 폐 절차(예를 들어, 경흉부 세침 흡인, 종격동경검사 또는 개흉술)의 후보로 확인될 수 있다. 대상은 대상이 폐암에 걸릴 비교적 낮은 가능성(예를 들어, 50% 미만, 40% 미만, 또는 30% 미만, 20% 미만)을 갖는 것을 나타내는 폐암 위험 점수에 기초하여 한 폐암 치료 또는 침습적 폐 절차의 후보자가 아닌 것으로 확인될 수 있다. 일부 경우에, 중간 위험 점수가 획득되고 대상은 고 위험 또는 저 위험 카테고리에 속하는 것으로 표시되지 않는다. 일부 실시태양에서, 의료 제공자는 "추적관찰"에 관여하고 하나 이상의 추후 시점에서 취해진 생물학적 샘플에 대한 분석을 반복하거나 폐암을 배제하거나, 위험 결정이 내려진 직후, 암이 존재한다는 결정을 내리는 추가 진단 절차를 수행할 수 있다. 특정 예에서, 대상은 비 진단 기관지 내시경 검사로 인해 중간 위험으로 확인되고, 본 발명의 방법을 사용하여 환자가 암의 저 위험 상태에 있다는 결정에 따라 (CT 감시와 같은) 비 침습적 모니터링에 재선정된다. 다른 특정 예에서, 본 발명에 기술된 바와 같이 분석된 샘플이 사용될 수 있다. 상기 방법은 또한 유전자 발현 분석 결과를 요약하는 리포트를 생성하는 단계를 필요로 할 수 있다. 통상적으로 보고서는 폐암 위험 점수 표시를 포함할 수 있다.
컴퓨터 구현 방법
본 발명에 개시된 방법들은 다양한 방법들 중 임의의 방법으로 구현될 수 있다. 예를 들어, 특정 실시태양은 하드웨어, 소프트웨어 또는 이들의 조합을 사용하여 구현될 수 있다. 소프트웨어로 구현될 때, 소프트웨어 코드는 단일 컴퓨터에서 제공되든 또는 여러 컴퓨터 사이에 배분되든, 임의의 적절한 프로세서 또는 프로세서의 집합에서 실행될 수 있다. 이러한 프로세서는 집적 회로 구성 요소에 하나 이상의 프로세서를 갖는 집적 회로로서 구현될 수 있다. 그러나, 프로세서는 임의의 적합한 포맷의 회로를 사용하여 구현될 수 있다.
또한, 컴퓨터는 랙-장착 컴퓨터, 데스크톱 컴퓨터, 랩톱 컴퓨터 또는 태블릿 컴퓨터와 같은 다수의 형태 중 임의의 형태로 구현될 수 있음을 이해해야 한다. 또한, 컴퓨터는 PDA(Personal Digital Assistant), 스마트폰 또는 기타 휴대용 또는 고정 전자 장치를 포함하는 일반적으로 컴퓨터로 간주되지 않지만 적절한 처리 능력을 갖춘 장치에 삽입될 수 있다.
또한, 컴퓨터는 하나 이상의 입력 및 출력 장치를 가질 수 있다. 이러한 장치는 무엇보다도 사용자 인터페이스를 제공하는데 사용될 수 있다. 사용자 인터페이스를 제공하는 데 사용될 수 있는 출력 장치의 예는 출력의 시각적 표현을 위한 프린터 또는 디스플레이 스크린 및 출력의 청각적 표현을 위한 스피커 또는 다른 소리 발생 장치를 포함한다. 사용자 인터페이스에 사용될 수 있는 입력 장치의 예는 키보드, 마우스, 터치 패드 및 디지털 태블릿과 같은 포인팅 장치를 포함한다. 다른 예로서, 컴퓨터는 음성 인식 또는 다른 청취 가능한 포맷을 통해 입력 정보를 수신할 수 있다.
이러한 컴퓨터는 로컬 네트워크 또는 엔터프라이즈 네트워크 또는 인터넷과 같은 광역 네트워크를 포함하는 임의의 적합한 형태의 하나 이상의 네트워크에 의해 상호접속될 수 있다. 이러한 네트워크는 임의의 적합한 기술에 기초할 수 있으며, 임의의 적합한 프로토콜에 따라 작동할 수 있고 무선 네트워크, 유선 네트워크 또는 광섬유 네트워크를 포함 할 수 있다.
또한, 본 발명에 설명된 다양한 방법 또는 프로세스는 다양한 운영 시스템 또는 플랫폼 중 임의의 하나를 채용하는 하나 이상의 프로세서에서 실행 가능한 소프트웨어로서 코딩될 수 있다. 또한, 이런 소프트웨어는 다수의 적절한 프로그래밍 언어 및/또는 프로그래밍 또는 스크립팅 툴 중 임의의 것을 사용하여 기록될 수 있고, 또한 프레임워크 또는 가상 머신에서 실행되는 실행 가능한 기계 언어 코드 또는 중간 코드로서 컴파일될 수 있다.
이 관점에서, 본 발명의 양태는 하나 이상의 컴퓨터 또는 다른 컴퓨터에서 실행될 때 상기 본 발명의 다양한 실시태양을 구현하는 방법을 실행하는 하나 이상의 프로그램으로 인코딩된 컴퓨터 판독가능 매체(또는 다수의 컴퓨터 판독가능 매체)(예를 들어, 컴퓨터 메모리, 하나 이상의 플로피 디스크, 컴팩트 디스크(CD), 광학 디스크, 디지털 비디오 디스크(DVD), 자기 테이프, 플래시 메모리, 필드 프로그래머블 게이트 어레이의 회로 구성 또는 다른 반도체 장치 또는 다른 비 일시적, 유형의 컴퓨터 저장 매체)로서 구현될 수 있다. 컴퓨터 판독 가능 매체 또는 미디어는 운반 가능하여, 이에 저장된 프로그램 또는 프로그램이 상기와 같이 본 발명의 다양한 양태를 구현하기 위해 하나 이상의 상이한 컴퓨터 또는 다른 프로세서에 로딩 될 수 있다. 본 발명에 사용된 바와 같이, "비 일시적 컴퓨터 판독 가능 저장 매체"라는 용어는 제작품(즉, 제작 물품) 또는 기계로 고려될 수 있는 컴퓨터 판독 가능 매체만을 포함한다.
"프로그램" 또는 "소프트웨어"라는 용어는 본 발명에서 일반적인 의미로 컴퓨터 또는 다른 프로세서를 프로그램하여 상기한 바와 같이 본 발명의 다양한 양태를 구현하기 위해 사용될 수 있는 컴퓨터 실행 가능 지시의 컴퓨터 코드 또는 세트의 임의의 형태를 의미한다. 또한, 본 실시태양의 한 양태에 따르면, 실행될 때 본 발명의 방법을 수행하는 하나 이상의 컴퓨터 프로그램은 단일 컴퓨터 또는 프로세서에 존재할 필요는 없지만, 본 발명의 다양한 양태를 구현하기 위한 여러 상이한 컴퓨터 또는 프로세서 중에서 모듈 방식으로 분포될 수 있다는 것을 이해해야 한다
본 발명에 사용된 바와 같이, 용어 "데이터베이스"는 일반적으로 탐색 및 검색의 용이성 및 속도를 위해 배열된 데이터의 집합을 의미한다. 또한, 데이터베이스는 통상적으로 논리적 및 물리적 데이터 구조를 포함한다. 당업자는 본 발명에 기술된 방법이 관계형 데이터베이스, 객체 관계형 데이터베이스 및 XML이 "eXtensible-Markup Language"를 나타내는 XML 기반 데이터베이스를 포함하는 임의의 유형의 데이터베이스와 함께 사용될 수 있다는 것을 인식할 것이다. 예를 들어, 유전자 발현 정보는 데이터베이스에 저장되고 데이터베이스로부터 검색될 수 있다. 유전자 발현 정보는 유전자 발현 정보를 다양한 다른 관련 정보(예를 들어, 치료 프로토콜을 수립하고/하거나 진단을 내리는데 도움을 주는 보고서 또는 문서를 생성하는데 관련된 정보 또는 환자 샘플을 추적하는데 도움이 되는 정보)와 관련된 방식으로 저장되거나 색인될 수 있다. 이런 관련 정보는, 예를 들어, 환자 식별 정보, 담당 의사 식별 정보, 당당 의사에 관한 정보(예를 들어, 주소, 전화번호), 생물학적 샘플의 기원에 관한 정보(예를 들어, 조직 유형, 샘플링 날짜), 생물학적 샘플 처리 정보, 표본 품질 관리 정보, 생물학적 샘플 보관 정보, 유전자 주석 정보, 폐암 위험 분류기 정보, 폐암 위험 요인 정보, 지불 정보, 주문 날짜 정보 등을 포함할 수 있다.
컴퓨터 실행가능 명령어는 하나 이상의 컴퓨터 또는 다른 장치에 의해 실행되는 프로그램 모듈과 같은 많은 형태 일 수 있다. 일반적으로, 프로그램 모듈은 특정 작업을 수행하거나 특정 추상 데이터 유형을 구현하는 루틴, 프로그램, 객체, 구성요소, 데이터 구조 등을 포함한다. 통상적으로, 프로그램 모듈의 기능은 다양한 실시태양에서 요구되는 바와 같이 결합되거나 분산될 수 있다.
본 발명의 일부 양태에서, 게놈 정보를 처리하기 위한 컴퓨터 구현 방법이 제공된다. 이 방법은 일반적으로 하나 이상의 유익한 유전자의 생물학적 샘플에서 발현 수준을 나타내는 데이터를 얻는 단계 및 발현 수준에 적어도 부분적으로 기초하여 대상이 폐암에 걸릴 가능성을 측정하는 단계를 필요로 한다. 본 발명에 개시된 임의의 통계 또는 분류 방법은 컴퓨터 구현 방법에 통합될 수 있다. 일부 실시태양에서, 상기 방법은 대상이 폐암에 걸릴 가능성을 나타내는 위험 점수를 계산하는 단계를 필요로 한다. 위험 점수를 계산하는 단계는 발현 수준이 이의 상대적 기여도에 의해 가중되는 가중 발현 수준의 조합(예를 들어, 합, 곱 또는 다른 조합)의 측정을 필요로 할 수 있다. 컴퓨터 구현 방법은 또한 위험 점수를 지정함으로써 유전자 발현 분석의 결과를 요약하는 보고서를 생성하는 단계를 필요로 할 수 있다. 이런 방법은 또한 대상의 의료 제공자에게 보고서를 전송하는 단계를 필요로 할 수 있다.
어피메트릭스 어레이
일부 양태에서, 어피메트릭스 인간 유전자 1.0 ST 어레이(Affymetrix Cat. # 901087)가 생물학적 샘플에서 mRNA 또는 cDNA를 동정하는데 사용된다. 어피메트릭스 인간 유전자 1.0 ST 어레이는 www.affymetrix.com/site/include/byproduct.affx?product=hugene-1_0-st-v1에 개시된 여러 프로브를 사용한다. 유전자 당 하나의 프로브의 1:1 비율이 아니라는 것을 의미하는 특정 유전자의 단편에 해당하는 다수의 프로브가 존재하며, 오히려 단일 유전자의 다중 단편에 해당하는 다수의 프로브가 존재한다. 한 예에서, LYPD2 유전자는 어피메트릭스 인간 유전자 1.0 ST 어레이(HuGene-1_0-st-v1 프로브세트 주석)에 개시된 바와 같이 인간 유전자 1.0 ST 어레이(릴리즈 32)에 3개의 프로브 세트, 프로브세트 ID 8153343, 8153344, 및 8153345로 나타내어진다. 어레이의 예시적인 적절한 빌드는 릴리즈 32(09/30/2011), 릴리즈 33(03/27/2013), 릴리즈 34 (04/07/2014), 릴리즈 35 (04/15/2015), 및 릴리즈 36을 포함한다. 프로브세트 및 핵산 서열과 관련이 있는 정보는 www.affymetrix.com/site/include/byproduct.affx?product=hugene-1_0-st-v1을 포함하는 Affymetrix.com에서 발견될 수 있다. 또한, 데이터세트는 본 발명의 방법을 실시하는데 사용될 수 있는 프로브 및 유전자를 열거하는 플랫폼 GPL6244 하의 NCBI 유전자 발현 옴니버스 웹사이트 www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL6244에서 이용할 수 있다. 프로브세트 및 유전자 기호와 관련이 있는 문서를 포함하는 이런 문서는 본 발명에 참조로 포함된다.
조성물 및 키트
일부 양태에서, 정보 유전자의 발현 수준을 측정하는데 유용한 조성물 및 관련 방법이 제공된다. 예를 들어, 정보 유전자 또는 정보 유전자에 상보적인 서열을 갖는 핵산과 특이적으로 혼성화하는 핵산 프로브로 본질적으로 이루어진 조성물이 제공된다. 이런 조성물은 또한 대조군 유전자 또는 이에 상보적인 핵산과 특이적으로 혼성화하는 프로브를 포함할 수 있다. 이런 조성물은 또한 적절한 완충액, 염 또는 검출 시약을 포함할 수 있다. 핵산 프로브는 고체 지지체(예를 들어, 유리, 플라스틱 또는 실리콘 칩) 또는 비드(예를 들어, 자기 비드)에 직접 또는 간접적으로 고정될 수 있다. 핵산 프로브는 비드 기반 핵산 검출 분석에 사용하기 위해 맞춤화될 수 있다.
일부 실시태양에서, 5개까지, 10개까지, 25개까지, 50개까지, 100개까지 또는 200개까지의 핵산 프로브를 포함하는 조성물이 제공된다. 일부 경우에, 각각의 핵산 프로브는 표 11로부터 선택된 mRNA 또는 mRNA에 상보적인 서열을 갖는 핵산과 특이적으로 혼성화된다. 일부 실시태양에서, 정보 mRNA를 탐지하는 프로브가 또한 포함된다. 일부 경우에, 핵산 프로브의 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개 또는 적어도 20개의 각각은 표 11로부터 선택된 mRNA 또는 mRNA에 상보적인 서열을 갖는 핵산과 특이적으로 혼성화한다. 일부 실시태양에서, 조성물은 생화학적으로 분리된 반응에서 상이한 유전자를 탐지하거나 동일한 생화학 반응에서 다중 유전자를 탐지하기 위해 제조된다. 일부 실시태양에서, 조성물은 다중 반응을 수행하기 위해 제조된다.
다중 정보 유전자의 수준을 동시에 측정하는 방법에 유용한 올리고뉴클레오티드(핵산) 어레이가 또한 본 발명에 제공된다. 이런 어레이는 상업적 출처로부터 얻어지거나 생산될 수 있다. 핵산 어레이를 생산하는 방법은 또한 당업계에 주지되어 있다. 예를 들어, 핵산 어레이는 다수의 올리고뉴클레오티드, 폴리뉴클레오티드 또는 유전자에 해당하는 핵산 또는 그의 일부에 혼성화될 수 있는 cDNA를 고체 지지체에 고정함으로써 제조될 수 있다. 당업자는 핵산 어레이 구축 및 관심 핵산 탐지에 사용되는 방법의 비 제한적인 예를 제공하는 Chapter 22 "Nucleic Acid Arrays" of Current Protocols In Molecular Biology (Eds. Ausubel et al. John Wiley and #38; Sons NY, 2000) or Liu CG, et al., An oligonucleotide microchip for genome-wide microRNA profiling in human and mouse tissues. Proc Nall Acad Sci USA. 2004 Jun 29;101(26):9740-4를 참조한다. 일부 실시태양에서, 어레이는 적어도 2, 적어도 5, 적어도 10, 적어도 20, 적어도 50, 적어도 60, 적어도 70개 이상의 정보 유전자에 대한 결합 프로브를 포함하거나 이들로 필수적으로 이루어진다. 일부 실시태양에서, 어레이는 2개까지, 5개까지, 10개까지, 20개까지, 50개까지, 60개까지, 70개까지 이상의 정보 유전자에 대한 결합 프로브를 포함하거나 이들로 필수적으로 이루어진다. 일부 실시태양에서, 어레이는 표 11로부터 선택된 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 mRNA를 포함하거나 이들로 이루어진다. 일부 실시태양에서, 어레이는 표 11로부터 선택된 4, 5 또는 6개의 mRNA를 포함하거나 이들로 이루어진다. 올리고뉴클레오티드 어레이를 포함하는 키트가 또한 제공된다. 키트는 핵산 표지 시약 및 어레이를 사용하여 발현 수준을 측정하기 위한 지침을 포함할 수 있다.
본 발명에 기술된 조성물은 정보 유전자의 발현 수준을 측정하고 평가하기 위한 키트로서 제공될 수 있다. 상기 조성물은 진단 또는 연구 분야에서의 사용을 용이하게 하도록 진단 키트 또는 연구 키트로 조립될 수 있다. 키트는 본 발명의 구성 요소를 수용하는 하나 이상의 용기 및 사용 설명서를 포함할 수 있다. 구체적으로, 이러한 키트는 본 발명에 기재된 하나 이상의 조성물 및 이 조성물의 의도된 응용분야 및 적절한 사용을 기술하는 지시를 포함할 수 있다. 키트는 다양한 실험을 하기 위해 적절한 농도 또는 양으로 성분을 함유할 수 있다.
키트는 연구자, 의료 제공자, 진단 실험실 또는 다른 개체에 의해 본 발명에 기술된 방법의 사용을 용이하게 하도록 설계될 수 있으며, 많은 형태를 취할 수 있다. 적용 가능한 경우 키트의 각 조성물은 액체 형태(예를 들어, 용액) 또는 고체 형태(예를 들어, 건조 분말)로 제공 될 수 있다. 특정 경우에, 조성물의 일부는, 예를 들어, 키트와 함께 제공되거나 제공되지 않을 수 있는 적합한 용매 또는 다른 물질의 첨가에 의해 구성 가능하거나 다른 방법으로 가공될 수 있다. 본 발명에 사용된 바와 같이, "지시"는 지시 및/또는 촉진의 구성요소를 정의할 수 있으며, 통상적으로는 본 발명의 포장에 관한 또는 이에 관련된 서면 지시를 포함한다. 지시는 또한 임의의 방식으로 임의의 구두 또는 전자 지시를 포함할 수 있어서 사용자는 지시가 키트, 예를 들어, 시청각(예를 들어, 비디오테이프, DVD 등), 인터넷 및/또는 웹 기반 통신과 결합될 것을 명확하게 인식할 것이다. 서면 지시는 진단 또는 생물학적 생성물의 제조, 사용 또는 판매를 규제하는 정부 기관이 정한 양식으로 작성될 수 있으며, 이 지시는 또한 해당 기관에 의한 승인을 반영할 수 있다.
키트는 하나 이상의 용기에 본 발명에 기술된 임의의 하나 이상의 성분을 함유할 수 있다. 예로서, 한 실시태양에서, 키트는 키트의 하나 이상의 성분을 혼합하고 및/또는 샘플을 분리 및 혼합하고 대상에 적용하기 위한 지시를 포함할 수 있다. 키트는 본 발명에 기술된 제제를 수용하는 용기를 포함할 수 있다. 성분은 액체, 겔 또는 고체(예를 들어, 분말)의 형태 일 수 있다. 성분은 무균적으로 제조되고 냉장 수송될 수 있다. 선택적으로 성분은 저장용 바이알 또는 다른 용기에 수용될 수 있다. 제 2 용기는 무균적으로 제조된 다른 성분을 가질 수 있다.
본 발명에 사용된 바와 같이, 숫자와 관련하여 용어 "대략" 또는 "약"은 달리 명시되지 않거나 문맥에서 명백한 경우가 아니라면 숫자의 방향(초과 또는 미만)(이 숫자가 0% 미만이거나 가능한 값의 100%를 초과하는 경우는 제외)에서 일반적으로 1%, 5%, 10%, 15% 또는 20%의 범위 내에 해당하는 숫자를 포함하도록 해석된다.
본 발명에 기술된 모든 참조문헌은 본 발명에 기술된 목적을 위해 참조로 포함된다.
본 발명의 예시적인 실시태양은 하기 실시예에 의해 더욱 상세히 기술될 것이다. 이러한 실시태양은 본 발명의 예시이며, 당업자는 예시적인 실시태양에 한정되지 않는다는 것을 인식할 것이다.
실시예
실시예 1: 마이크로어레이 기반 예측 모델의 개발
개요
이 실시예는 예측 알고리즘을 개발하는 방법을 설명한다. 모델에 사용된 유전자의 조합을 포함하는 최종 최적화 모델이 기술된다. 이 방법은 임상적 인자 게놈 상관관계(CFGC)를 사용하여 암 특이적 신호의 선택을 돕는다.
상기 목적은 게놈 상관관계를 유도함으로써 임상적 인자에 더 구체적으로 기여하는 유전자 발현 신호를 계산한 후 폐암 상태를 효과적으로 예측하는 새로운 암 예측 모델을 개발하고 특성화하는 것이었다. 게놈 상관관계는 본 발명에서 대상의 성별, 흡연 상태 및 흡연력과 같은 특정 임상 특징을 예측하기 위한 유전자 발현 알고리즘으로 정의된다.
목적은 다음의 특정 성능 기준을 만족하는 예측 알고리즘을 개발하는 것이었다:
의도된 사용 개체군에서 폐암을 배제하기 위한 90% 초과의 네거티브 예측치(NPV), 및
COPD로 진단된 대상에 대한 85% 초과의 NPV.
재료 및 방법
샘플 처리 및 분석
폐암의 의심에 대해 기관지 내시경을 받기로 예정된 환자로부터 임상 표본을 수집하였다. 기관지 상피 세포(BECs)를 예정된 기관지 내시경 동안 표준 기관지 브러쉬를 사용하여 주 기관지에서 수집하였다.
유전자 1.0 ST 마이크로어레이(Affymetrix)를 사용하여 유전자 발현 마이크로어레이상에서 샘플을 분석하였다. 어레이 데이터의 쌍 상관 분석(pairwise correlation analysis)을 수행하여 특이점(본 발명에 기술)을 확인하였다. 총 597개의 샘플을 최종 데이터 세트로 유지하였다. 그런 후에, 데이터 세트를 동일한 크기의 트레이닝 및 유효성 검사 세트로 무작위로 분할했다.
마이크로어레이 CEL 파일을 예측 알고리즘의 개발에 사용하였다. 대상을 처음에 독립적인 트레이닝 및 유효성 검사 세트로 지정하고, 예측 모델의 유전자 선택 및 최적화를 트레이닝 모델 내에서 수행하였다. 유효성 검사 세트 샘플의 암 상태를 예측하기 전에 모델을 최적화하고 잠갔다.
정규화/배치 조절(Batch Adjustment)
RMA를 유전자 1.0 ST(Affymetrix) CEL 파일로부터 유전자 발현 값을 계산하는데 사용하였다. ComBat 배치 조절을 배치 효과를 수정하는 데 사용하였다. 모든 샘플을 5개의 개별 마이크로 어레이 실험(즉, 배치) 내에서 분석하였다. 트레이닝 및 테스트 샘플을 RMA 및 ComBat 전처리 과정에서 결합하였다. 후속 개발은 상기한 대로 트레이닝 세트로 제한하였다. .955 미만의 평균 쌍 상관을 가진 샘플과 같이, 4 미만의 RIN 점수를 가진 샘플에 해당하는 CEL 파일은 배제하였다(도 1 참조).
게놈 상관관계
게놈 상관관계를 상응하는 임상적 특성을 정확하게 예측하는 유전자 발현 시그니처로서 확립하였다. 게놈 상관관계는, 암 상태를 예측하기 위한 개별 유전자와 함께, 예측 알고리즘에 조합된다. 다음의 임상적 특징에 대한 상관관계를 개발하고 평가하였다:
성별
흡연 상태(현재 vs 과거)
흡연력(갑년; PY)
연령
게놈 상관관계는 관심 임상 특징을 차별화하는 최상위 등급의 유전자를 선택하고 이런 유전자를 로지스틱 회귀(logistic regression)를 사용하여 모델에 맞춤으로써 개발하였다. 임상 특징의 채점은 이런 선택된 유전자의 유전자 발현에 기초 하였다.
2개 모델을 유효성 검사 세트에서 동시에 테스트되도록 동시 개발하였다. 첫 번째 모델(점수 1)은 본 발명에 기술된 방법을 기반으로 하고 보고된 연령을 예측 알고리즘 및 게놈 신호로 분해한다. 두 번째 모델(점수 2)은 연령에 대한 게놈 상관관계를 사용하여 개발하였고, 그런 후에 예측 알고리즘에 통합하였다.
최초 유전자 선택
연령, 성별, 흡연 상태 및 갑년에 대한 암 상태(0/1)의 로지스틱 회귀를 사용하여 임상 인자 모델을 개발하였다. 임상 인자 모델의 오차를 각 유전자와 오차와의 연관성을 테스트하기 위해 경험적 베이즈 선형 모델을 사용하여 유전자를 선택하는데 사용하였다. 상위 232개 유전자를 이 모델의 p 값과 배수 변화에 기초하여 선택하였다. 상위 232개 유전자는 표 11에 나열된다.
클러스터링/최종 유전자 선택
유전자 선택 및 모델 피팅을 선택 과정 동안 편향을 최소화하고 견고한 최종 선택을 제공하기 위해 자동화된 교차 유효성 검사 접근법에서 수행하였다. 유전자 선택은 다음 단계로 이루어졌다. 계층적 클러스터링을 사용하여 유전자를 11개의 클러스터로 나눴다. 각 유전자의 클러스터 멤버쉽은 표 11의 2열에서 확인된다. 각 클러스터에 대해, 클러스터 평균을 각 클러스터 내의 모든 유전자를 사용하여 계산하였다. 암 상태와 독립적인 예측 연관성을 갖도록 지속적으로 선택되는 6개의 클러스터를 확인하기 위해 데이터의 반복되는 무작위 서브세트에 LASSO와 후진 선택의 조합을 사용했다. 그런 후에 교차 유효성 검사를 사용하여 클러스터 수단의 예측 강도를 유지할 각 클러스터 내 유전자의 대략적인 수를 측정하였다.
최종 모델 내에서 선택된 클러스터로부터 증가된 수의 유전자에 대한 모델의 민감성을 결정하기 위해 유전자 적정 분석을 수행하였다. 이것은 상보적인 유전자가 모델에 추가적인 임상 민감성을 부가할 수 있는지를 결정하기 위한 최적화의 일부로 포함되었다.
소프트웨어
패키지 rms, limma, 유효성 검사 및 sva를 포함하는 분석을 위해 R(버전 3.01)을 사용하였다.
결과
게놈 상관관계의 유래
유전자는 전체 트레이닝 세트를 사용하여 임상 특징을 나타내기 위해 선택하였다. 이런 "게놈 상관관계 유전자"는 가능한 한 정확하게 임상 인자를 나타내기 위한 최소한의 유전자 세트를 기초로 했다. 게놈 성별(GG)은 단일 유전자를 사용하여 100% 정확성로 정의하였다. 값은 다음과 같이 설정한다: RPS4Y1 <임계값이면 GG = 1(수), 그렇지 않으면 GG = 0 (암).
게놈 흡연 상태의 경우, 경험적 베이즈 t-테스트에 기초하여 유전자를 스크리닝하였다. p 값에 의한 상위 유전자를 흡연 상태가 종속 변수인 로지스틱 회귀 모델에 포함하였다. 최종 예측 게놈 흡연(GS) 값은 (상대적 발현 상도를 나타내는 유전자 기호를 사용하는) 이 모델로부터 유래되었고, 여기서
x=β
Figure 112017015320306-pct00031
*SLC7A11 +
Figure 112017015320306-pct00032
*CLND10 +
Figure 112017015320306-pct00033
*TKT, 여기서
Figure 112017015320306-pct00034
는 회귀 모델에 대한 회귀 가중치이며, GS = exp(x)/(1 + exp(x)).
게놈 갑년의 경우, 경험적 베이즈 t-테스트에 기초하여 유전자를 스크리닝하였다. P 값에 의한 최상위 유전자를 갑년 <10이 종속 변수인 로지스틱 회귀 모델에 포함하였다. 최종 예측 게놈 갑년(GPY) 값은 이 모델로부터 유도되었고, 여기서
x=
Figure 112017015320306-pct00035
+
Figure 112017015320306-pct00036
*RUNX1T1 +
Figure 112017015320306-pct00037
*AKR1C2, 여기서
Figure 112017015320306-pct00038
는 게놈 갑년 회귀 모델에 대한 회귀 가중치이며, GPY = exp(x)/(1 + exp(x)).
게놈 연령의 경우, 경험적 베이즈 선형 모델에 기초하여 유전자를 스크리닝하였다. P 값에 의한 상위 유전자를 연령(년)이 종속 변수인 벌점 선형 회귀 모델 (LASSO)에 포함하였다. 최종 예측 게놈 연령(GA) 값은 이 모델로부터 유도되었고, 여기서
GA= β
Figure 112017015320306-pct00039
Figure 112017015320306-pct00040
*CD52 + β
Figure 112017015320306-pct00041
*SYT8 +β
Figure 112017015320306-pct00042
*TNNT3 + β
Figure 112017015320306-pct00043
*ALX1 + β
Figure 112017015320306-pct00044
*KLRK1 + β
Figure 112017015320306-pct00045
*RASA3 +β
Figure 112017015320306-pct00046
*CERS3 + β
Figure 112017015320306-pct00047
*ASPA + β
Figure 112017015320306-pct00048
*GRP + β
Figure 112017015320306-pct00049
*APOC1 + β
Figure 112017015320306-pct00050
*EPHX3 + β
Figure 112017015320306-pct00051
*REEP1 + β
Figure 112017015320306-pct00052
*FAM198B + β
Figure 112017015320306-pct00053
*PCDHB4 + β
Figure 112017015320306-pct00054
*PCDHB16 + β
Figure 112017015320306-pct00055
*FOXD1 + β
Figure 112017015320306-pct00056
*SPARC +β
Figure 112017015320306-pct00057
*NKAPL + β
Figure 112017015320306-pct00058
*GPR110에 따라 측정되며, 여기서 β
Figure 112017015320306-pct00059
는 게놈 연령 회귀 모델에 대한 회귀 가중치이다.
암 유전자의 유래
먼저, 상부 232개 유전자를 선택하고, 방법 섹션에 기술된 클러스터링 분석을 사용하여 유전자의 하향 선택을 수행하였다
그런 후에 교차 유효성 검사를 사용하여 클러스터 수단의 예측 강도를 보유 할 각 클러스터 내 유전자의 대략적인 수를 측정하였다. 이 숫자는 클러스터 당 2 내지 4개의 유전자로 밝혀졌다. 각 클러스터 내의 최종 유전자 선택은 p 값, 배수 변화 및 문헌으로부터의 암 연관성에 대한 증거의 강도에 기반하였다. 클러스터 수단은 다음과 같이 각 클러스터 내에서 감소된 유전자 세트를 사용하여 재계산되었다:
CIA = (BST1, CD177.1, CD177.2)의 평균,
C1B = (ATP12A, TSPAN2)의 평균,
C2 = (GABBRI, MCAM, NOVA1, SDC2)의 평균,
C3 = (CDR1, CGREF1, CLND22, NKX3-1)의 평균,
C4A = (EPHX3, LYPD2)의 평균, 및
C4B = (MIA, RNF150)의 평균.
최종 모델의 설명
최종 모델 계수를 평가하기 위해, 연령(년), 게놈 성별(GG), 게놈 흡연 상태 (GS), 게놈 갑년(GPY), 및 독립 예측자로서 6개의 감소된 유전자 클러스터 수단(CIA, C1B, C2, C3, C4A, C4B로 표지) 및 종속 변수로서 암 상태(0/1)를 가진 벌점 로지스틱 회귀 모델을 사용하였다. 벌점 인자(lambda)는 임상/게놈 상관관계에 대해 0이었고 유전자 발현 클러스터 각각에 대해 10이었다. 두 번째 모델은 동일한 접근법을 사용하였으나, 위에서 정의한 대로 연령을 게놈 연령(GA)으로 대체하여 만들었다. 모델 계수는 재추정하였다.
최종 분류 알고리즘은 다음 형태이었다,
X점수 1 = W 0 + W 1 x GG + W 2 x GS + W 3 x GPY + W 4 x GA + W 5 x C1A + W 6 x C1B + W 7 x C2 + W 8 x C3 + W 9 x C4A + W 10 x C4B
x점수 2= W 0 + W 1 x GG + W 2 x GS + W 3 x GPY + W 4 x 보고된 연령 + W 5 x C1A + W 6 x C1B + W 7 x C2 + W 8 x C3 + W 9 x C4A + W 10 x C4B .
그런 후에 로지스틱 회귀 점수를 다음 방정식을 사용하여, 0 내지 1의 예측 점수로 전환하였다.
예측 점수 =
Figure 112017015320306-pct00060
예측 모델의 평가
트레이닝 세트 샘플을 각각 트레이닝 및 테스트 그룹으로 무작위로 분할하는 (90:10) 교차 유효성 검사 접근법을 사용하였다. 임상적 정확성을 기록하고 그 과정을 100회 반복하였다. 트레이닝 세트의 점수는 각 샘플의 총 반복 수의 평균으로 보고하였다. 결과는 50% 특이성을 산출하고 임상 민감성을 극대화하기 위해 점수 임계값을 정의한 후 ROC 곡선, AUC, 민감성 및 특이성으로서 보고하였다.
모든 트레이닝 세트 샘플에 대한 점수가 생성되고 기록된 임상 상태와 비교된다. 점수 1 및 점수 2에 대한 ROC 곡선은 도 2에서 모든 샘플에 대해 도시되고, 도 3에서 기관지 내시경 음성 샘플에 대해서만 도시된다. AUC는 모든 샘플에 대하여 점수 1 = 0.803, 점수 2 = 0.785, 기관지 내시경 음성 세트에 대해 점수 1 = 0.808, 점수 2 = 0.778로 계산되었다. 표 1은 예측 점수 모델에 사용된 정보 유전자 목록을 제공한다. 표 1.1은 이런 유전자의 발현을 탐지하기 위한 프로브 서열의 비 제한적 목록을 제공한다.
유전자 목록 및 기능
유전자 기호 기능
RPS4Y1 GG
SLC7A11 GS
CLDN10 GS
TKT GS
RUNX1T1 GPY
AKR1C2 GPY
CD52 GA
SYT8 GA
TNNT3 GA
ALX1 GA
KLRK1 GA
RASA3 GA
CERS3 GA
ASPA GA
GRP GA
APOC1 GA
EPHX3 GA, CA
REEP1 GA
FAM198B GA
PCDHB4 GA
PCDHB16 GA
FOXD1 GA
SPARC GA
NKAPL GA
GPR110 GA
유전자 기호 기능
TSPAN2 CA
MCAM CA
ATP12A CA
NOVA1 CA
MIA CA
DC177.1 CA
EPHX3 CA
CD177.2 CA
CGREP1 CA
BST1 CA
RNF150 CA
CLND22 CA
GABBR1 CA
SDC2 CA
NKX3-1 CA
LYPD2 CA
CDR1 CA







[표 1.1]
정보 유전자를 탐지하기 위한 프로브 서열의 비 제한적인 예
Figure 112017015320306-pct00061
아래의 표 2는 트레이닝 세트에서 기관지 내시경 음성 대상에 대한 2개의 모델에 대한 성능 특성의 요약을 제공한다. 기관지 내시경 음성 대상(N)의 수는 CA + 민감성에 대한 대상과 CA - 특이성에 대한 대상에 해당한다.
N 점수 1 점수 2
민감성 68 91.2% 82.4%
특이성 76 56.6% 48.7%
AUC 80.8% 77.8%
NPV* 95.5% 90.0%
*NPV는 기관지 내시경 및 예측 모델의 관찰된 민감성 및 특이성과 결합된 암의 50% 유병률을 가정하여 계산된다.
모델 성능
CA + 및 CA - 샘플의 예측을 구별하기 위해, 특정 점수 임계값을 사용하여 예측 모델(점수 1 및 점수 2에 기초)의 민감도 및 특이성을 계산하였다. 트레이닝 세트(모델 점수 = 0.65)에서 두 모델에 대해 선택된 동일한 임계값을 유효성 검사 세트에 사용하였다. 예측 정확도는 두 모델에 대한 기관지 내시경 음성 샘플(의도 된 용도의 경우)에서 처음 측정하였고 다음에서 요약된다.
예측 모델의 민감성은 또한 유효성 검사 세트 내의 몇몇 서브 그룹 카테고리에 대해 계산하였다. 두 모델에 대한 결과는 표 3-9에 도시된다. 하위 카테고리는 신뢰 구간에 영향을 미치는 상이한 수의 샘플을 포함한다.
관찰된 병변의 덩어리 크기의 함수로서 예측 모델의 민감성 - 점수 1
덩어리 크기 N Sens Sens. Sens, PM+BR Sens.
<1 13 100.00% 83.30% 100.00%
1 내지 2 35 87.50% 50.00% 100.00%
2 내지 3 41 90.60% 53,10% 96.90%
>3 155 85.10% 79.40% 95.00%
침윤 32 100.00% 100.00% 100.00%
알려지지 않음 21 100.00% 80.00% 100.00%
PM = 예측 모델; BR = 기관지 내시경
관찰된 병변의 덩어리 크기의 함수로서 예측 모델의 민감성 - 점수 2
덩어리 크기 N PMs. Senens.
BR Sens. PM+BR S
<1 13 66.70% 83.30% 100.00%
1 내지 2 35 87.50% 50.00% 93.80%
2 내지 3 41 81.30% 53.10% 93.80%
>3 155 83.00% 79.40% 95.70%
침윤 32 90.00% 100.00% 100.00%
알려지지 않음 21 100.00% 80.00% 100.00%
폐에서 관찰된 병변의 위치의 함수로서 예측 모델의 민감성(점수 1)
덩어리 크기 N PM Sens BR Sens PM+BR Sens
중앙 97 84.40% 79.20% 93.50%
측면 86 90.70% 61.10% 96.30%
모두 90 90.50% 78.40% 100.00%
알려지지 않음 25 86.70% 80.00% 93.30%
폐에서 관찰된 병변의 위치의 함수로서 예측 모델의 민감성(점수 2)
덩어리 크기 N PM Sens BR Sens PM+BR Sens
중앙 97 79.20% 79.20% 93.50%
측면 86 81.50% 61.10% 96.30%
모두 90 89.20% 78.40% 98.60%
알려지지 않음 25 93.30% 80.00% 93.30%
병리학에서 측정된 암 서브-형태의 함수로서 예측 모델의 민감성(점수 1)
암 형태 N P M Sens. BR Sens. PM+BR Sens.
AC 67 83.60% 70.10% 94.00%
SCC 72 94.40% 75.00% 95.80%
LC 7 71.40% 85.70% 100.00%
NSCLC 26 92.30% 73.10% 76.90%
SCLC 37 89.20% 86.50% 97.30%
NSCLC/SCLC 2 50.00% 100.00% 100,00%
알려지지 않음 86 75.00% 37.50% 100.00%
병리학에서 측정된 암 서브-형태의 함수로서 예측 모델의 민감성(점수 2)
암 형태 N PM Sens. BR Sens. P M+BR Sens.
AC 67 80,60% 70.10% 94,00%
SCC 72 87.50% 75.00% 97.20%
LC 7 85.70% 85.70% 100.00%
NSCLC 26 69.20% 73.10% 80.80%
SCLC 37 89.20% 86.50% 97.30%
NSCLC/SCLC 2 0.00% 100.00% 100.00%
알려지지 않음 86 62.50% 37.50% 87.50%
PM = 예측 모델; BR = 기관지 내시경
암 단계의 함수로서 예측 모델의 민감성
점수 1
단계 N PM Sens. BR Sens. PM+BR
I 13 92.3% 38.5% 100.0%
Ila 2 100.0% 0.0% 100.0%
IIb 13 92.3% 76.9% 100.0%
초기 28 92.9% 53.6% 100.0%
Ina 27 92.6% 74.1% 96.3%
Illb 19 89.5% 89.5% 100.0%
IV 47 87.2% 89.4% 100.0%
광범위 15 73.3% 73.3% 93.3%
점수 2
단계 N PM Sens, BR Sens. PM+BR Sens.
I 13 84.6% 38.5% 92.3%
IIa 2 100.0% 0.0% 100.0%
Jib 13 92.3% 76.9% 100.0%
초기 28 89.3% 53.6% 96.4%
Ina 27 92.6% 74.1% 100.0%
Illb 19 78.9% 89.5% 94.7%
IV 47 80.9% 89.4% 100.0%
광범위 15 80.0% 73.3% 93.3%
트레이닝 및 유효성 검사 세트에서 성능의 비교
트레이닝 및 유효성 검사 세트에서 예측 모델의 전체 예측 정확성을 비교하여 독립 그룹에서 모델의 재현성을 평가하였다. 결과는 표 10에 제공된다.
트레이닝 및 유효성 검사에서 두 모델에 대한 민감성, 특이성 및 AUC의 비교
점수 1 점수 2
트레이닝 유효성 검사 트레이닝 유효성 검사
모든
샘플
BR-음성
샘플
모든
샘플
BR-음성
샘플
모든
샘플
BR-음성
샘플
모든
샘플
BR-음성
샘플
민감성
특이성
AUC
90.6% 56.6% 0.803 91.2% 56.6% 0.808 88.2% 47.4% 0.793 85.7% 47.4% 0.764 85.7% 48.7% 0.785 82.4% 48.7% 0.778 84.1% 47.4% 0.751 83.9% 47.4% 0.739
민감성 또는 특이성의 유의한 차이(p> 0.05)는 각 모델에 대한 트레이닝 및 유효성 검사 세트 사이에서 관찰되지 않았다. 마찬가지로, 두 그룹 사이의 각 모델에 대한 AUC에서 작은 차이는 통계적으로 유의하지 않았다(p> 0.05 기준). 민감성과 특이성은 모든 샘플(기관지 내시경-음성과 기관지 내시경-양성 합침)에 비해 기관지 내시경-음성 샘플에 대해 유사하다. 점수 1과 점수 2 사이의 전체 성능에 상대적으로 작은 하락이 있었고, 점수 2는 점수 1에 비해 AUC에서 2 - 4% 포인트 하락을 보였다.
232개 유전자와 클러스터 멤버쉽을 상이하게 발현하였다
기호 클러스터 Tstat p.값
TMEM51 1 -3.73334 0.000227
CR1L 1 -2.84036 0.00482
PDZKlIP 1 1 -3.65419 0.000305
MICAL2 1 -3.08175 0.002252
VWA5A 1 -3.01006 0.002838
ACAD8 1 -3.25793 0.001253
SAA4 1 -2.84375 0.00477
GLYATL2 1 -3.0263 8 0.002693
ETV6 1 -4.46414 1.15E-05
CD177 1 -3.68455 0.000273
CEACAM7 1 -5.40343 1.35E-07
CD177 1 -3.85704 0.000141
QPCT 1 -3.16572 0.001709
CASP10 1 -3.07674 0.002289
PI3 1 -5.27363 2.59E-07
BST1 1 -4.29031 2.42E-05
MTNRIA 1 -4.47628 1.09E-05
STARD4 1 -2.94146 0.003525
CFB 1 -2.87447 0.004341
SLC26A8 1 -3.09768 0.002138
VNN2 1 -2.88831 0.00416
HDAC9 1 -3.27926 0.001165
SLC26A4 1 -3.93362 0.000104
LCN2 1 -3.64257 0.000319
CFB 1 -2.86774 0.004432
CCDC18 2 -2.89401 0.004087
FAM72D 2 -3.41712 0.000722
NUF2 2 -3.35293 0.000904
FAM72D 2 -3.65638 0.000303
FBXO28 2 -2.93189 0.003633
GPR137B 2 -3.29637 0.001099
STIL 2 -3.05607 0.002448
DEPDCI 2 -3.10412 0.002094
TSPAN2 2 -3.92967 0.000106
FAM72D 2 -3.18098 0.001624
ASPM 2 -3.21677 0.001441
KIF14 2 -3.09106 0.002185
KIF20B 2 -2.95904 0.003336
RAD51AP1 2 -3.38028 0.000822
GAS2L3 2 -3.22465 0.001403
SPIC 2 -3.00214 0.00291
SMAGP 2 -3.38429 0.00081
ATP12A 2 -3.49107 0.000555
BRCA2 2 -2.9535 0.003395
BORA 2 -2.81443 0.005215
SKA3 2 -2.94422 0.003495
DLGAP5 2 -2.8962 0.00406
CASC5 2 -2.98473 0.003076
LRRC28 2 -3.78219 0.000188
PYCARD 2 -3.0296 0.002666
TXNL4B 2 -3.75986 0.000205
EFCAB5 2 -4.15228 4.31E-05
SPAG5 2 -3.28148 0.001157
FAM72D 2 -3.66614 0.000292
ABCAl2 2 -3.25495 0.001266
AURKA 2 -3.06413 0.002385
SGOL1 2 -2.87447 0.004341
BANK1 2 -3.22839 0.001385
CENPE 2 -2.90302 0.003975
CASP6 2 -2.96202 0.003305
MAD2L1 2 -3.2685 0.001209
CCNA2 2 -3.12554 0.001952
CCNB1 2 -3.43884 0.000668
KIF20A 2 -3.16017 0.001741
CENPK 2 -3.38809 0.000799
ERAP1 2 -3.0003 0.002927
FAM54A 2 -3.5307 0.000481
PHTF2 2 -2.82226 0.005093
CLDN12 2 -3.10361 0.002097
BPGM 2 -2.89166 0.004117
PCMTD1 2 -2.92723 0.003686
MELK 2 -2.90007 0.004011
MST4 2 -3.46215 0.000615
CR1 3 -3.1375 0.001876
GOS2 3 -3.08943 0.002197
CSF3R 3 -3.326 0.000992
S100Al2 3 -2.93619 0.003584
SELL 3 -2.81834 0.005154
NCF2 3 -2.8535 0.00463
LIPN 3 -3.16551 0.00171
ZNF438 3 -3.31249 0.00104
NAMPT 3 -2.85014 0.004678
CBL 3 -3.77272 0.000195
CASP5 3 -2.96813 0.003242
CARD16 3 -3.32829 0.000985
CARD17 3 -2.96301 0.003295
CLEC4A 3 -2.9666 0.003257
LRRK2 3 -3.38419 0.00081
HMGN2P46 3 -3.56798 0.00042
AQP9 3 -3.18953 0.001578
BCL2A1 3 -2.88499 0.004203
ITGAX 3 -2.92718 0.003687
GPR97 3 -3.39828 0.000771
CCL4 3 -2.86648 0.004449
PSTPIP2 3 -2.88175 0.004245
IFI30 3 -2.81741 0.005168
FFAR2 3 -3.20036 0.001522
EMR3 3 -3.09579 0.002151
FPR1 3 -3.03905 0.002586
LILRA5 3 -2.87193 0.004375
PLEK 3 -3.08569 0.002223
MXD1 3 -2.9859 0.003064
TNFAIP6 3 -3.05049 0.002492
CXCR2 3 -3.51316 0.000512
IL1B 3 -3.27702 0.001174
CXCR1 3 -3.38462 0.000809
SIRPB1 3 -3.65291 0.000307
NCF4 3 -3.14344 0.00184
IRAK2 3 -3.27512 0.001182
PROK2 3 -3.43542 0.000677
TLR2 3 -2.82581 0.005038
TREM1 3 -2.96731 0.00325
SOD2 3 -3.16918 0.001689
CREB 5 3 -3.32746 0.000987
NAMPT 3 -2.80465 0.005372
TNFRSF10C 3 -2.80794 0.005318
CSGALNACT1 3 -3.54557 0.000455
ASAP1 3 -2.80888 0.005303
PLA2G2A 4 3.087887 0.002208
NFYC 4 3.20083 0.00152
RASSF10 4 3.105541 0.002084
GLB1L3 4 2.800517 0.005439
TRIM3 4 3.207674 0.001485
MCAM 4 2.70666 0.007192
MSRB3 4 3.432075 0.000685
SLITRK5 4 3.963535 9.27E-05
GAS6 4 2.820157 0.005125
NOVA1 4 2.729315 0.006728
GABRG3 4 2.904108 0.003961
ABCA3 4 3.321624 0.001008
LPO 4 3.513723 0.000511
FSCN2 4 2.781525 0.005759
RASD1 4 3.198556 0.001531
HILS1 4 3.002738 0.002905
SDK2 4 3.45176 0.000638
NTN5 4 3.159291 0.001746
KCNA7 4 3.631462 0.000332
ATOH8 4 3.062376 0.002398
KCNIP3 4 2.994468 0.002982
INHBB 4 3.056753 0.002442
VSTM2L 4 3.520433 0.000499
ZNRF3 4 3.592073 0.000384
PLEKHG4B 4 2.830968 0.00496
GNMT 4 3.274623 0.001184
GABBR1 4 2.881256 0.004252
ARHGEF10 4 3.270419 0.001201
SDC2 4 2.847433 0.004717
CRB2 4 3.452184 0.000637
GAS1 4 3.470173 0.000598
PNPLA7 4 2.715581 0.007006
RAI2 4 3.25911 0.001248
PLA2G2A 4 2.899771 0.004015
ID3 5 3.213565 0.001456
PGLYRP4 5 -3.64634 0.000314
SFTPA1 5 3.189676 0.001578
SFTPA1 5 3.189676 0.001578
LIPK 5 -2.99802 0.002949
SFTPA2 5 3.858853 0.00014
SFTPA2 5 3.858853 0.00014
ASCL3 5 2.764568 0.006059
RPPH1 5 2.832278 0.00494
CD209 5 3.331793 0.000973
GPR32 5 -2.98245 0.003098
UGT2A3 5 -2.84993 0.004681
CD58 6 -3.35673 0.000892
LBR 6 -3.62457 0.000341
ARHGDIB 6 -3.22018 0.001424
SLC12A6 6 -4.12377 4.85E-05
LPCAT2 6 -3.5142 0.00051
PLEKHB2 6 -3.02046 0.002745
KYNU 6 -4.13269 4.68E-05
ANKRD36B 6 -3.84654 0.000147
ANKRD36B 6 -3.49272 0.000551
ANKRD36B 6 -3.55319 0.000443
SRD5A3 6 -4.25485 2.81E-05
NEIL3 6 -3.23716 0.001345
TLR1 6 -2.90118 0.003997
BCAP29 6 -3.44601 0.000652
MGAM 6 -3.11565 0.002016
TPK1 6 -3.21156 0.001466
ATP6V1B2 6 -3.57198 0.000414
LYN 6 -3.1938 0.001556
SDCBP 6 -2.80868 0.005307
GK 6 -2.91501 0.003829
GLA 6 -3.30241 0.001077
ADRA2A 7 3.550905 0.000447
PRKCDBP 7 2.741146 0.006496
PRR4 7 3.898998 0.00012
PRB4 7 2.988547 0.003039
PRB3 7 3.690625 0.000266
PRB1 7 2.976402 0.003158
PRB2 7 3.201779 0.001515
BMP4 7 2.886357 0.004185
PRKCA 7 3.80558 0.000172
CYP1B1-AS1 7 2.720927 0.006897
CGREF1 7 3.275505 0.00118
RPRM 7 2.944897 0.003488
SDPR 7 2.84669 0.004728
BPIFB2 7 3.949534 9.80E-05
BPIFB 6 7 2.98498 0.003073
SNCA 7 2.777053 0.005837
CLDN22 7 3.502336 0.000533
COBL 7 3.1512 0.001793
NKX3-1 7 2.92659 0.003693
CDR1 7 4.307308 2.25E-05
CH25H 8 3.168911 0.001691
FXCl 8 3.17821 0.001639
DLG2 8 2.948964 0.003443
NRXN3 8 2.863338 0.004493
CES1P1 8 3.630652 0.000333
CES1 8 3.122943 0.001968
KCNJ16 8 3.53821 0.000468
APCDD1 8 3.103106 0.002101
TMEM178 8 2.7868 0.005668
MYRIP 8 2.958247 0.003344
FLNB 8 2.911823 0.003867
ENPP5 8 2.788207 0.005644
SEMA3E 8 2.940987 0.003531
SLC7A2 8 3.321666 0.001007
ARHGAP6 8 3.220932 0.001421
ANO3 9 -2.98289 0.003094
SLC22A10 9 -3.04806 0.002512
UFM1 9 -3.15354 0.001779
EPHX3 9 -3.73504 0.000225
KLF7 9 -2.84977 0.004683
LGSN 9 -3.5566 0.000438
LYPD2 9 -2.93177 0.003634
CES3 10 -3.3613 0.000878
MIA 10 -3.23844 0.001339
RNF150 10 -4.32839 2.06E-05
SLC9A3 10 -2.88577 0.004193
MYOT 11 -3.40228 0.000761
실시예 2: 진단 기관지 내시경을 받는 폐암 환자에 대한 기관지 게놈 분류기의 유효성 검사
개요
기관지 내시경은 종종 폐암으로 의심되는 폐 병변을 갖는 환자에서 진단에 유용하지 않다. 여러 병변이 양성이긴 하지만, 이것은 종종 추가적인 침습 테스트를 초래한다. 본 발명자는 기관지 내시경의 진단 성능을 향상시킬 수 있는 기관지 유전자 발현 분류기를 검증하고자 했다.
폐암으로 의심하는 병변은 가슴 영상에서 종종 확인된다. 조직 표본 샘플링을 필요로 하는 감시 영상 또는 침습 평가를 수행할지의 결정은 복잡하며 악성 가능성, 생검 능력, 수술 위험 및 환자 선호도의 평가가 필요하다[1]. 생검이 필요할 때, 접근법은 기관지 내시경, 경흉부 세침 생검(transthoracic needle biopsy, TTNB) 또는 수술적 폐 생검(surgical lung biopsy, SLB)을 포함할 수 있다. 이러한 양상들 사이의 선택은 일반적으로 병변의 크기와 위치, 선종의 유무, 절차의 위험 및 현지 전문 지식과 같은 고려 사항에 의해 결정된다. 기관지 내시경 검사는 안전한 방법이며, 기흉에 의해 1% 미만의 합병증이 발생한다[2]. 미국에서 1년에 약 500,000건의 기관지 내시경이 시행되며[3], 그 중 대략 절반이 폐암의 진단을 위한 것이다. 그러나 기관지 내시경은 병변의 위치와 크기에 따라 34-88% 범위의 민감성으로 제한된다[4]. 더 새로운 기관지 내시경 모범 기술을 사용하더라도, 말초 병변에 대한 민감성은 단지 ~70%이다 [5].
비 진단 기관지 내시경을 받은 환자는 종종 최종 진단을 확립하기 위해 추가 침습 검사를 받는다. SLB는 대략 5%의 합병증 비율과 ~1%의 30일 사망률을 나타내는 본질적 위험을 감안할 때 초기 선호 접근법이 아니다[6]. 중요하게는, SLB의 20-25%가 양성 병변으로 진단된 환자에서 수행된다[7,8]. 또한, TTNB는 15% 기흉 비율을 포함하는 현저한 이환율과 관련이 있으며, 이중 6%는 흉관 배액을 필요로 한다[10,11]. 침습적 절차의 함정을 고려할 때, 이미징 감시에 적합한 악성 종양의 가능성이 더 낮은 환자를 확인하기 위한 대안적인 접근이 필요하다.
임상 표본의 유전자 발현 측정을 사용하여, 암을 포함하는 생물학적 질병 상태의 분류가 잘 확립되어있다[12]. 폐암의 상태에서, 흡연자의 근위기도로부터 수집된 세포학적으로 정상 상피 세포에서 뚜렷한 암 관련 유전자 발현 패턴이 존재한다[13]. 최근, 본 발명자는 현재 및 과거 흡연자들 중에서 폐암에 걸린 환자와 걸리지 않은 환자를 구별하는 기관지 내시경을 통해 주 기관지로부터 수집한 기관지 상피 세포(BEC)에서 유전자 발현 분류기를 개발하였다(원고 제출). 본 발명자는 의심되는 폐암에 대해 기관지 내시경을 받는 환자의 두 가지 전향적인 다기관 임상 시험에서 이 분류기의 유효성을 검사하고 이 분류기가 기관지 내시경의 진단 성능을 어떻게 바꾸는지 평가하기 위해 본 연구에 착수했다.
재료 및 방법
연구 설계, 개체군 및 프로토콜
폐암의 의심을 위한 기관지 내시경을 받는 현재 및 과거 흡연자를 AEGIS 1 및 AEGIS 2, 두 개의 독립적인 전향적 다기관 관찰 연구(NCT01309087 및 NCT00746759)에 등록하였다. 환자를 미국, 캐나다 및 아일랜드의 28개 장소에 등록하였다. 세포학 브러쉬를 사용하여 주 기관지로부터 정상적으로 보이고 RNA 방부제에 잠긴 BEC를 수집하였다. 분류기의 결과는 의사 또는 환자에게 보고되지 않았다. 환자들이 연구 프로토콜의 요구 사항을 충족시키는지를 측정하기 위해 기관지 내시경 전에 환자를 스크리닝하였다. 배제 기준은 대상 <21세, 비 흡연자(일생 동안 흡연 <100 담배로 정의됨), 동시 암 또는 폐암의 이력이 있는 환자를 포함하였다. 기관지 내시경 직전 > 24시간 기계 인공호흡기를 사용했거나 연구에 동의하거나 응하지 않은 환자는 배제하였다. 최종 진단이 확립될 때까지 또는 기관지 내시경 후 12개월까지 환자를 추적관찰했다. 폐암의 진단은 지표 기관지 내시경 시 또는 TTNB, SLB, 제 2 기관지 내시경 또는 기타 침습적 절차를 사용하는 후속 생검으로 확립되었다. 사용된 특정 기관지 내시경 방법 및 비 진단 기관지 내시경 후 수행된 후속적인 감시 영상 또는 절차는 치료 의사의 재량이었다. 암이 없는 것으로 진단된 환자는 12개월의 추적 관찰에서 특정 양성 진단 또는 방사선 안정성/소산을 나타냈다. 12개월의 추적 관찰에서 암의 확실한 진단, 특정 양성 진단 또는 안정성/소산이 없는 환자는 추가 분석에서 배제하였다. 치료 의사는 5단계 척도(<10%, 10-39%, 40-60%, 61-85% 및> 85%)를 사용하여 기관지 내시경 전에 각 환자의 사전 테스트 악성도(POM)를 평가하였다. 연구 프로토콜은 각 참여 센터의 기관 검토위원회에 의해 승인받았고, 모든 환자는 등록 전에 사전 동의서를 제공하였다.
AEGIS 1에서 855명 및 AEGIS 2에서 502명의 전체 환자가 적격이었고 미국, 캐나다 및 아일랜드의 28개 의료 센터에 2009년 1월 내지 2012년 8월(도 4)에 등록하였다(표 12). 이 장소들은 3차/학술 의료 센터(n = 20), 지역사회 기반 병원(n = 6) 및 재향군인 병원(n = 2)의 혼합이었다.
추가 환자를 하기 기준에 기초한 등록 후 연구로부터 배제하였다(도 4 참조). 첫째, AEGIS 1에서 111명과 AEGIS 2에서 71명의 전체 환자는 다음과 같은 프로토콜 편차로 인해 부적격 판정을 받았다: AEGIS 1에서, 환자 24명이 검토시 연구 등록 기준을 충족하지 못했고, 승인시 승인 기준을 충족하지 못하는 수집된 표본을 가졌거나 등록되었으나 수집된 표본을 갖지 않았다. 추가 87개 샘플은 RIN 점수 <4 또는 RNA 수율 <1μg로 인해, RNA 분리 후 최소 QC 기준을 충족하지 못했다. AEGIS 2에서, 승인시 승인 기준을 충족하지 않는 표본 수집으로 인해 부적합한 환자가 3명 있었고, RNA의 최소 QC 기준을 충족하지 못하는 68개의 샘플이 있었다. 둘째, AEGIS 1에서 환자 40명과 AEGIS 2에서 환자 10명을 포함하여 비 원발성 폐암으로 진단된 환자는 배제하였다. 또한, 12개월에 검토시, AEGIS 1에서 환자 91명과 AEGIS 2에서 환자 71명을 포함하는 최종 진단이 없는 환자는 연구에서 배제하였다. AEGIS 1과 2의 이런 환자 162명(n = 106)의 대략 2/3은 기관지 내시경 후 추적관찰에서 배제되었고, 나머지 1/3(n=56)은 기관지 내시경 후 12개월에 최종 진단을 받지 못했다. 마지막으로, 본 발명자는 AEGIS 1에서 환자 1명과 AEGIS 2에서 환자 9명을 분석 QC 기준(마이크로어레이 처리 방법에서 기술됨)을 충족하지 못한 유전자 발현 데이터에 의해 배제하였다.
AEGIS 1 그룹은 이전에 무작위 방식으로 동일한 트레이닝 및 테스트 세트로 분할하였다. 트레이닝 세트(n = 환자 299명)는 23개 유전자와 연령으로 구성된 유전자 발현 분류기를 유도하는데 사용되었고 다른 곳에 기술되었다(원고 제출). 트레이닝 세트에서, 분류기는 기관지 내시경 검사가 폐암의 진단으로 이어지지 않는 환자(n = 134)에서 0.78(95% CI, 0.71-0.85)의 AUC, 93%의 민감성과 57%의 특이성을 갖는 것으로 밝혀졌다. 현재 연구는 두 개의 독립적인 유효성 검사 세트에서 잠금 분류기의 유효성 검사에 집중한다.
최종 AEGIS 1 및 AEGIS 2 유효성 검사 세트의 기준 인구통계학적 및 임상적 특성이 표 1에서 비교된다. 각 그룹 내에서 암 및 양성 질환으로 진단된 환자의 개별 비교는 표 12에 제공된다.
AEGIS 1 및 AEGIS 2 테스트 세트에서 환자의 특성화
  AEGIS 1 테스트 세트 AEGIS 2 테스트 세트
  Ca+ Ca- P Ca+ Ca- P
N 220 78 267 74
성별   0.506   0.091
여성 95 30 77 29
남성 125 48   190 45  
연령(IQR) a 64 (15) 57 (14) <0.001 65 (13) 60 (18) <0.001
인종 b   0.878   0.426
백인 166 60 206 61
흑인 42 13 55 11
기타/알려지지 않음 12 5 6 2
흡연 상태   0.065   0.026
현재 115 31 141 28
과거 105 47   126 46  
흡연력(PY) (IQR) a 45 (30) 30 (36) <0.001 50 (35) 20 (30) <0.001
a) 중앙값(및 사분위 범위; IQR)으로 보고하였다. P-값은 맨-휘트니 테스트를 사용하여 계산하였다.
b) P-값은 백인 vs. 비 백인에 대해 계산하였다.
임상 및 인구통계학적 데이터를 각 환자에 대해 수집하고 연구 임상 보고서 양식(CRF)에 기록하였다. 추가 병리학 및 방사선학 보고서는 각 환자의 의료 기록에서 유지되었으며 검토를 위해 사용할 수 있었다. 모든 출처 문서는 관찰되고 연구 책임자가 관리하는 데이터베이스에 입력되었다. 폐 병변의 크기와 위치는 CT 스캔 결과에서 얻었다. 대상을 기관지 내시경 후 12개월까지 추적관찰하여 임상 진단을 위한 데이터를 수집하였다. 폐암의 진단은 병리학의 결과에 기초했고 병리학 보고서 사본은 의료 센터에서 수집하였다. 암의 임상 진단으로 이끄는 표본은 기관지 내시경 중 또는 기관지 내시경이 비 진단인 후속 침습 검사에서 얻었다. 비 진단 기관지 내시경 후 수행된 모든 임상 절차에 대한 데이터는 연구 중에 수집하였다. 비 진단 기관지 내시경을 받은 환자의 후속 평가는 각 연구 센터의 치료 의사의 재량이었다. 일부 경우에, 성공적으로 진단을 내리기 위해 기관지 내시경 이후에 1회 이상의 절차가 필요했으나, 모든 경우 폐암 진단에 이르는 절차를 수집하였다. 침습적 후속 절차는 종격동경검사, 흉강경검사, 개흉술 또는 비디오 흉강경 수술(VATS)을 포함할 수 있는 제 2 기관지 내시경, TTNB 또는 수술적 폐 생검(SLB)으로 정의되었다.
암으로 진단되지 않은 환자의 기록은 대상이 암이 없는 것으로 선언하기 위해 판결 과정을 거쳤다. 이 과정은 5명의 폐병학자 패널이 각 환자에 대해 사용할 수 있는 의료 기록의 검토로 구성되었다. 이 패널의 2명의 폐병학자가 각각의 환자를 독립적으로 검토하고 남성/여성이 다음 기준 중 하나를 충족하면 환자는 암이 없는 것으로 결정하였다: 환자는 초기의 의심스러운 이상을 설명하는 대체 진단으로 진단되었고, 이상은 안정한 것으로 결정되거나 이상이 해소되었다. 12개월 추적관찰 기간의 종료시 이런 기준을 충족하지 못했던 환자는 최종 진단이 없으며 연구에서 추가 분석으로부터 배제되었다.
원발성 폐암으로 진단된 환자에 대한 조직학(표 13) 및 암 단계(표 14) 데이터를 분석하였다. 연구 CRF에서 데이터를 추출하여 완전한 의학 기록의 검토에 의해 확인하였다. 전체 암 중에서, AEGIS 1에서 80%(175/220; 95% CI, 74-84%)와 AEGIS 2에서 83%(222/267, 95% CI, 78-87%)가 NSCLC(비소세포 폐암)이었다. 각각 17%(38/220, 95% CI, 13-23%) 및 16%(42/267, 95% CI, 12-21%) SCLC 암이 존재하였다. 공지된 암 단계 데이터를 가진 NSCLC에 걸린 환자 중에서, 초기 단계(단계 1 또는 2)는 AEGIS 1에서 40%(53/139, 95% CI, 32-48 %), AEGIS 1에서 37%(67/199, 95% CI, 30-44 %)로 존재하였다.
연구 참가자의 요약 인구통계학적 및 임상적 특성: AEGIS 1 대 AEGIS 2 환자의 비교를 모든 임상적 특성에 걸쳐 수행하였다. 유의한 차이는 *p<.05, **p<.001로 표시된다. 인종에 대한 p 값은 백인 대 비 백인 및 NSCLC 대 SCLC를 사용하는 폐암 조직학에 대해 계산하였다.
  AEGIS 1 AEGIS 2
N 298 341
성별 *
여성 125 106
남성 173 235
연령 * , 중앙값( IQR ) 62 (16) 64 (15)
인종
백인 226 267
흑인 55 66
기타 15 4
알려지지 않음 2 4
흡연 상태
현재 146 169
과거 152 172
담배 갑년, 중앙값 , ( IQR ) 40 (36) 45 (38)
병변 크기 **
< 2 cm 48 83
2 내지 3 cm 41 39
> 3 cm 155 188
침윤 32 28
알려지지 않음 22 3
병변 위치 **
중앙 98 127
주변 86 108
중앙 & 주변 90 102
알려지지 않음 24 4
폐암 조직학 220 267
소세포 폐암 38 42
비소세포 폐암 175 222
선암 69 100
편평 상피암 72 81
큰 세포 8 8
달리 특정되지 않으면, NSCLC 26 33
알려지지 않음 7 3
양성 진단 78 74
감염 18 14
사코이도증 16 15
해소 또는 안정 27 24
기타 17 21
원발성 폐암으로 진단된 환자의 단계 데이터
조직학 단계 AEGIS 1 AEGIS 2
SCLC 38 42
제한적 16 14
광범위 19 23
    알려지지
않음
3 5
NSCLC 175 222
1 37 49
2 16 18
3 44 65
4 42 67
    알려지지 않음 36 23
알려지지
않음
  7 3
전체 220 267
양성 질환의 각각에 관한 데이터를 의학 기록으로부터 추출하고 표 15에 요약하였다. 두 연구에서 암이 없는 대상의 대략 2/3가 대체 진단을 받았고, 특정 대체 진단은 각각의 연구에 대해 표 S4에 열거되었다. 해소되었거나 안정된 것으로 판단된 이상을 가진 환자의 진단은 기관지 내시경 12개월 후, 후속 이미징을 포함한 의료 기록의 검토에 기반하였고, 암이 없는 환자의 대략 1/3이 두 연구에서 이런 카테고리에 있었다.
양성 질환을 가진 환자의 대체 진단
카테고리 AEGIS 1 AEGIS 2
해소 또는 안정 * 27 24
대체 진단 51 50
사코이도증 16 15
염증 4 4
양성 성장 5 6
섬유증 4 5
기타 4 6
감염 18 14
곰팡이 8 3
마이코박테리아 5 4
박테리아 5 7
전체 78 74
임상적으로 필요한 기관지 내시경 동안, 연구 참여자는 표준, 일회용 세포학 브러시를 사용하여 기관지 벽에 문질러서 우측 또는 좌측 주 기관지의 점막 브러싱을 수집하였다. 각 대상에게서 2개의 브러싱을 얻었다; 의사들은 정상적으로 보이는 상피 조직의 브러싱을 얻고 종양 조직 또는 이형성 세포를 샘플링하는 것을 피하도록 훈련받았다. 모든 시료를 RNA 방부제(RNAprotect, Qiagen)에 저장하고 승인 및 처리를 위해 중앙 CLIA-인증 연구소로 운송하였다. 센터는 최대 14일 동안 4℃에서 샘플을 저장하고, 스폰서가 제공한 2일 운송 및 절연 운송 용기(NanoCool)를 사용하여 주변 온도 이하(4-20℃)로 운송하도록 요청받았다.
실험실 방법
모든 BEC 표본을 처리하여 RNA를 분리하고 유전자 발현 분석 전에 품질 및 수율에 대해 RNA를 분석하였다; 적어도 1μg의 RNA 수율과 >4의 RIN 점수를 가진 표본을 Gene-ST 1.0 마이크로어레이에서 실행하였다. 모든 마이크로어레이 데이터를 GEO에 GSE66499로 기탁하였다.
샘플을 용해하고 컬럼-기초 방법(miRNeasy Kit, Qiagen) 및 제조사의 권장 프로토콜을 사용하여 RNA를 분리하였다. 큰 RNA 분획을 분광 광도계(Nanodrop; ThermoFisher) 상에서 분석하여 농도, 순도 및 수율을 측정하였다. 샘플을 RIN 점수로 보고된, RNA 무결성(Bioanalyzer)에 대해 분석하였다. <1μg의 수율 및 RIN 점수 <4를 가진 샘플을 연구에서 배제하였다. AEGIS 1에서 표본의 약 10%와 AEGIS 2에서 표본의 약 13%를 불충분한 RNA의 품질 또는 양 때문에 배제하였다. 그런 후에 RNA를 추후 처리 때까지 냉동 보관하였다(-80℃).
200ng의 전체 RNA를 Ambion WT 발현 키트(Life technologies Cat. # 4440536)를 사용하여 센스 가닥 cDNA로 전환시킨 후, Affymetrix GeneChip WT 말단 표지화 키트(Affymetrix Cat. # 900671)로 표지하였다. 혼성화를 위해, 혼성화 칵테일을 준비하고 인간 유전자 1.0 ST 어레이(Affymetrix Cat. # 901087)에 적용된 혼성화, 세척 및 염색 키트(Affymetrix Cat. # 900720)를 사용하여 표지된 cDNA 표적에 첨가하고 45℃에서 16시간 동안 배양하였다. 혼성화 이후, 어레이를 세척하고 Affymetrix GeneChip 스캐너에서 스캐닝하기 전에 표준 어피메트릭스 절차를 사용하여 염색하였다. 발현 콘솔 소프트웨어(어피메트릭스)를 사용하여 데이터를 추출하였다.
어피메트릭스 인간 유전자 1.0 ST 어레이(Affymetrix Cat. # 901087)는 www.affymetrix.com/site/include/byproduct.affx?product=hugene-1_0-st-v1에 개시된 여러 프로브를 사용한다. 유전자 당 하나의 프로브의 1:1 비율이 아니라는 것을 의미하는 특정 유전자의 단편에 해당하는 다수의 프로브가 존재하며, 오히려 단일 유전자의 다중 단편에 해당하는 다수의 프로브가 존재한다. 한 예에서, LYPD2 유전자는 어피메트릭스 인간 유전자 1.0 ST 어레이(HuGene-1_0-st-v1 프로브세트 주석, 09/30/2011에 릴리즈 32, 03/27/2013에 릴리즈 33, 04/07/2014에 릴리즈 34)에 개시된 바와 같이 인간 유전자 1.0 ST 어레이(릴리즈 32)에 3개의 프로브 세트, 프로브세트 ID 8153343, 8153344, 및 8153345로 나타내어진다. 프로브세트 및 핵산 서열과 관련이 있는 정보는 www.affymetrix.com/site/include/byproduct.affx?product=hugene-1_0-st-v1을 포함하는 Affymetrix.com에서 발견될 수 있다. 또한, 데이터세트는 본 발명의 방법을 실시하는데 사용될 수 있는 프로브 및 유전자를 열거하는 플랫폼 GPL6244 하의 NCBI 유전자 발현 옴니버스 웹사이트 www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL6244에서 이용할 수 있다. 프로브세트 및 유전자 기호와 관련이 있는 문서를 포함하는 이런 문서는 본 발명에 참조로 포함된다.
각 그룹의 최종 데이터 세트에서 샘플에 해당하는 마이크로어레이 데이터(CEL 파일)는 RMA를 사용하여 정규화되었다[22]. AEGIS 1 샘플은 총 5개 배치로 실행되었고 ComBat[23]는 배치 효과를 수정하는데 사용하였다. AEGIS 2 샘플은 모두 단일 마이크로어레이 배치로 실행되었다. 정규화 이후, 특이점은 글로벌 유전자 발현에서 0.955 미만의 게놈-와이드 쌍 상관관계를 갖는 것으로 확인되었다. 모든 마이크로어레이 데이터를 GEO에 수탁 번호# GSE66499로 기탁하였다.
마이크로어레이 데이터의 정규화 및 전처리는 보충 부록에 기술된다. AEGIS 1에 등록된 대상은 이전에 무작위로 독립적인 트레이닝 및 유효성 검사 세트로 할당되었고(도 4) 분류기 알고리즘은 이미 기술한 바와 같이, AEGIS 1 트레이닝 세트 내에서 엄격하게 유도되고 잠겼다. AEGIS 1 유효성 검사 세트에서 각 샘플 및 모든 AEGIS 2 샘플에 대한 점수는 23개 유전자의 발현 및 환자 연령에 기초한 이 사전-지정 분류기를 사용하여 생성되었다. 이 점수는 사전-지정 임계값을 사용하여 테스트-양성 및 테스트-음성으로 이분화되었다.
분류기의 성능은 수용기 작동자 특성(ROC) 곡선, 곡선 아래 면적 계산(AUC) [14], 및 민감성, 특이성, 음성 예측치(NPV), 양성 예측치(PPV) 및 (1-민감성)/ 특이성으로 정의된 음성 가능성 비율(NLR)을 사용하여 평가하였다. 맨-휘트니 비 매개변수 테스트는 연속 변수 분석에 사용되었고 피셔의 정확도 테스트(Fisher 's exact test)는 카테고리 변수에 사용되었다. 모든 신뢰 구간은 양면 이항 95% 신뢰 구간(95% CI)으로 보고된다. 통계 분석은 R 소프트웨어(버전 3.01)를 사용하여 수행되었다.
의사는 <10%, 10-39%, 40-60%, 40-60%, 61-85%, 및 >85%의 카테고리 중 하나를 사용하여, 기관지 내시경에 전에 전문 견해 및 이용가능한 의료 기록에 기초하여 등록된 모든 대상에 대해 사전 테스트 POM을 평가하도록 요청받았다. 결과는 <10%, 10-60% 및> 60%의 카테고리로 축소되었다. 본 발명자는 계층화된 POM 수준에서 암의 실제 유병률을 비교하기 위해 각 POM 카테고리에서 암의 실제 유병률을 계산하였다(표 16). 또한, 본 발명자는 폐암 후 비 기관지 내시경 검사의 유병률이 <10%, 10-60% 및 >60% POM 그룹에서 각각 3%, 29% 및 80%임을 발견하였다.
의사 평가 POM 및 암의 유병률의 상관관계
사전 테스트 POM a CA+ 환자 전체 환자 유병률 b
<10% 3 62 5%
10-60% 41 101 41%
>60% 404 425 95%
알려지지 않음 39 51 77%
a) POM = 악성 가능성; 기관지 내시경 전에 치료 의사가 평가.
b) 유병률은 각 POM 카테고리 내에서 폐암으로 진단된 비율로서 계산하였다.
병변 크기에 의해 계층화된 기관지 게놈 분류기의 예측 정확도가 표 2에 요약되며 사전 테스트 POM에 의해 계층화된 기관지 게놈 분류기의 예측 정확도가 표 3에 요약된다. 분류기의 민감성은 표 S5 및 S6에 단계와 조직학으로 계층화된 폐암으로 진단된 환자에 대해 보고된다. 기관지 내시경과 병합된 분류기는 모든 카테고리에서 민감성 >90% 유도한다.
방사선학적 영상화 특성에 따른 분류기의 민감성, 기관지 내시경 및 병합 접근법. 기관지 내시경의 민감성은 각 카테고리의 폐암 환자를 대상에 대해 측정하였다. 분류기의 민감성은 기관지 내시경 동안 진단되지 않은 폐암 환자에 대해 측정하였다. 기관지 내시경과 병합된 분류기의 민감성은 각 카테고리의 모든 폐암 환자에 대해 계산하였다.
크기(mm) N전체 N 기관지 내시경
(95% CI)
분류기
(95% CI)
분류기 & 기관지 내시경 병합(95% CI)
모든 환자 639 487 75% (71-79) 89% (82-94) 97% (95-98)
크기(mm)
<2 cm 131 73 55% (43-66) 91% (76-98) 96% (88-99)
2-3 cm 80 60 58% (46-70) 92% (74-99) 97% (88-100)
>3 cm 343 313 82% (78-86) 85% (74-93) 97% (95-99)
침윤 60 25 84% (65-94) 100% (45-100) 100% (84-100)
알려지지 않음 25 16 80% (54-94) 100% (38-100) 100% (76-100)
위치
중앙 225 174 84% (78-89) 81% (63-92) 97% (93-99)
주변 194 133 55% (46-63) 90% (80-96) 95% (90-98)
둘다 192 164 82% (75-87) 97% (82-100) 99% (96-100)
알려지지 않음 28 16 81% (56-94) 67% (20-94) 94% (70-100)
결과
연구 참가자의 특성
AEGIS 1의 환자 298명을 제 1 유효성 검사 세트로 사용하고 AEGIS 2 회의 연구 기준의 모든 환자 341명을 제 2 유효성 검사 세트로 사용하였다 (도 4 및 표 13). 폐암의 유병률은 AEGIS 1과 AEGIS 2 그룹에 대해 각각 74%와 78%이었다. 폐암 환자는 암이 없는 환자보다 나이가 많았고(p <0.001), 누적 담배 노출이 더 컸고 (p <0.001) 현재 흡연자일 가능성이 더 높았다(AEGIS 1에서 p = 0.07, AEGIS 2에서 p = 0.03; 표 12). 암 단계의 요약과 양성 진단의 카테고리가 각각 표 15와 16에 도시된다.
기관지 내시경의 성능
총 639명의 환자가 의심되는 폐암에 대해 기관지 내시경을 받았다. 이들 중, 272명(43%, 95% CI, 39 내지 46)이 진단되지 않았고, 487명의 환자 중 120명(25%, 95% CI, 21 내지 29)이 최종 폐암으로 진단되었다. 폐암에 대한 기관지 내시경의 민감성은 AEGIS 1과 AEGIS 2에서 각각 74%(95% CI, 68 내지 79)와 76%(95% CI, 71 내지 81)이었다. 비 진단 기관지 내시경을 받은 환자 중 98%(272명 중 267명)에 대해 추적 관찰 절차 자료를 이용할 수 있었다. 양성 병변이 있는 147명 중 52명(35%; 95%CI, 24 내지 38) 및 120명의 암 환자 중 118명(98%; 95%CI, 94 내지 99)을 포함하는 267명 환자 중 170명(64%, 95% CI, 58 내지 69)에 비 진단 기관지 내시경 이후 침습적 절차를 시행하였다. SLB를 76명 환자에서 시행하였고, 이중 27명(36%, 95% CI, 26-47)이 양성 병변이 있었다.
유전자 발현 분류기의 성능
분류기 단독은 AUC = 0.78(95% CI, 0.73 내지 0.83)이었고 AEGIS 1에서 암 환자 220명 중 194명(88% 민감성, 95% CI, 83 내지 92) 및 암이 없는 78명 중 37명(47% 특이성, 95% CI, 37 내지 58)을 정확하게 확인하였다(도 5). AEGIS 2에서, 분류기는 AUC = 0.74(95% CI, 0.68 내지 0.80)이었고 암 환자 267명 중 237명(89% 민감성, 95% CI, 84 내지 92) 및 암이 없는 74명 중 35명(47% 특이성, 95% CI, 36 내지 58)을 정확하게 확인하였다. 분류기와 기관지 내시경의 병합은 기관지 내시경 단독에 대한 74% 및 76%(p <0.001)과 비교하여, AEGIS 1과 2에서 각각 96%(95% CI, 93 내지 98) 및 98%(95% CI, 96 내지 99)로 민감성을 증가시켰다.
비 진단 기관지 내시경을 받은 환자에서, 분류기는 AEGIS 1에서 57명의 환자 중 49명(86% 민감성; 95% CI, 74 내지 94) 및 AEGIS 2에서 67명의 환자 중 62명 (92% 민감성; 95% CI, 82 내지 97)에서 암을 정확하게 확인하였다. 모든 환자(p = 0.32) 또는 비 진단 기관지 내시경을 받은 환자(p = 0.61)에 대한 분류기 AUC에 관한 두 그룹의 환자 사이에 유의한 차이가 없었기 때문에(도 5), 본 발명자는 하위 그룹의 후속 분석을 위해 두 그룹을 병합하였다. 기관지 내시경 단독의 민감성은 <3cm인 병변(p <0.001) 또는 주변부에 위치한 병변(p <0.001)에서 더 낮았다(표 17). 반대로, 분류기 단독 및 기관지 내시경과 병합된 분류기의 민감성은 지속적으로 높았으며 병변의 크기 또는 위치(표 17), 암 단계(표 18) 또는 조직학적 하위 유형(표 19)과 현저한 관련이 없었다.
암 단계에 따른 분류기와 기관지 내시경의 민감성
조직학 단계 N 기관지 내시경 분류기 병합

NSCLC

1 86 41% 88% 93%
2 34 68% 82% 94%
3 109 83% 94% 99%
4 109 86% 93% 99%
알려지지 않음 59 80% 92% 98%
전체 NSCLC 397 73% 89% 97%
SCLC 제한됨 30 80% 83% 97%
광범위 42 93% 100% 100%
알려지지 않음 8 88% n/a 88%
전체 SCLC 80 88% 80% 98%
알려지지
않음
10 70% 100% 100%
전체 암 487 74% 86% 97%
조직학에 따른 분류기와 기관지 내시경의 민감성
조직학 N 기관지 내시경 분류기 병합
선암 169 65% 86% 95%
편평 상피암 153 80% 90% 98%
큰 세포 16 75% 100% 100%
NSCLC-NOS 59 78% 100% 100%
SCLC 80 88% 80% 98%
알려지지 않음 10 70% 100% 100%
암의 중간 확률을 가진 환자에서 분류기의 정확성
본 발명자들은 낮은(<10%), 중간 (10-60 %) 및 높은(>60%)의 POM(표 3)로 나뉜 카테고리의 의사가 평가한 악성 종양 확률(POM)을 병합하여 폐암 위험 평가를 위한 안내 권고와 맞췄다[1]. 기관지 내시경은, 41%의 암 유병률에도 불구하고, 중간 사전 테스트 POM(n = 101)을 가진 환자의 83%에서 암에 대한 비 진단적이었다. 이 그룹의 환자에서, 분류기는 비 진단 기관지 내시경을 받고 40%의 PPV(95% CI, 28 내지 54)을 가진 환자 중에서 91%의 NPV(95% CI, 75 내지 98)를 얻었다(표 20).
기관지 내시경 및 분류기 계층화된 사전 테스트 POM의 성능. (a) 도시된 POM 카테고리에서 총 639명의 환자가 있었다. (b) 기관지 내시경은 폐암 진단을 받은 487명의 환자 중 120명(25%, 95% CI, 21 내지 29)을 포함하는 639명의 환자 중 272명(43%, 95% CI, 39 내지 46)에 대해 비 진단적이었다. (c) 분류기는 총 120명의 전체 암 환자 중 107명(89%, 95% CI, 82 내지 94)을 정확하게 예측하였다. 민감성은 비 진단 기관지 내시경 절차를 받은 환자에 대해 각 POM 카테고리로 보고된다. (d) 분류기는 암이 없는 152명의 환자 중 72명(47%, 95% CI, 40 내지 55)을 정확히 예측하였다. 민감성은 비 진단 기관지 내시경 절차를 받은 환자에 대해 각 POM 카테고리로 보고된다. (e) NPV 및 (f) PPV는 비 진단 기관지 내시경을 받은 환자에 대해 보고된다.
사전 테스트 POM 카테고리
N <10% 10-60% >60% 알려지지 않음
환자 개체군
전체 환자a 639 62 101 425 51
폐암 487 3(5%) 41(41%) 404(95%) 39(76%)
양성 152 59(95%) 60(59%) 21(5%) 12(24%)
기관지 내시경 성능
기관지 내시경
민감성(95% CI) 33%(6-80) 41%(28-57) 79%(74-82) 79%(64-89)
비진단적 272
기관지 내시경을
받은 환자b 61(98%) 84(83%) 107(25%) 20(39%)
분류기 성능
분류기 민감성(95% CI)c 100%(29-100) 88%(68-96) 90%(82-95) 88%(51-100)
분류기 특이성(95% CI)d 56%(43-68) 48%(36-61) 29%(14-50) 33%(14-61)
분류기 NPV(95% CI)e 100%(88-100) 91%(75-98) 40%(20-64) 80%(36-98)
분류기 PPV(95% CI)f 7%(1-24) 40%(28-54) 84%(75-90) 47%(25-70)
병합 분류기 & 기관지 100%(38-100) 93%(80-98) 98%(96-99) 97%(86-100)
내시경 민감성
분류기는 비 진단 기관지 내시경을 받은 환자에서 높은 NPV를 가졌지만, 폐암에 걸리고 음성 분류기 점수를 가진 비 진단 기관지 내시경을 받은 13명의 환자가 있었다(즉, 거짓 네거티브). 대다수(13명 중 10명)는 높은 (>60%) POM을 가졌고 단지 3명의 환자가 사전 테스트 POM 그룹에서 10-60%이었다.
기관지 내시경과 병합된 분류기의 NLR을 계산하여 사후 테스트 확률이 <10%일 사전 테스트 POM의 범위를 측정하였다. 기관 내시경의 NLR(0.244; 95% CI, 0.21 내지 0.29)은 분류기와 병합될 때 0.056(95% CI, 0.03 내지 0.10)으로 향상된다. 그 결과, 기관지 내시경과 분류기가 모두 음성일 때, 사전 테스트 POM이 66%인 환자에 대한 사후 테스트 POM이 <10%로 감소된다 (도 6).
결과의 평가
본 연구는 두 개의 독립된 기대되는 그룹에서 기관지 내시경을 받는 환자 중 폐암이 없는 환자를 확인하는 기관지 게놈 분류기의 유효성 검사를 설명한다. 본 발명자는 유전자 발현 분류기가 결합된 그룹에서 폐암의 상이한 크기, 위치, 단계 및 세포 유형에 대해 높은 민감성을 갖는다는 것을 발견하였다. 분류기와 기관지 내시경의 병합은 AEGIS-1 및 AEGIS-2 유효성 검사 그룹에서 각각 96% 및 98%의 만감성을 가진다. 본 발명자는 또한 이러한 유형의 분류기에 대한 임상적 필요성을 뒷받침하는 몇 가지 추가적인 발견을 보고한다. 첫째, 우리의 연구는 비 진단 기관지 내시경이 일반적이며(특히 중급 사전 테스트 POM 환자의 경우) 최종적으로 폐암을 갖지 않은 것으로 발견된 환자에서 SLB를 포함하는 추가 침습적 테스팅을 유도하는 이전의 보고 사실을 확인한다. 둘째, 분류기의 높은 민감성과 달리, 본 발명자는 기관지 내시경은 작고, 말초 또는 초기 암에서 잘 수행되지 않았다는 것을 발견한다. 셋째, 분류기는 중간 POM을 가지며 비 진단 기관지 내시경을 받은 환자에서 높은 NPV를 가진다. 이러한 결과는 이 분류기가 폐암의 유병률이 41%인 중간 POM을 가진 환자에서 임상 의사 결정을 지원하는 가능성을 가지나 기관지 내시경의 민감성은 단지 41%이라는 것을 암시한다. 높은 NPV 때문에, 비 기관지 내시경을 받고 중간 POM을 가진 환자에서 음성 분류기 점수는 이미징을 통한 능동적인 감시로 더욱 보수적인 진단 전략을 보장한다.
분류기의 높은 NPV가 분류기 음성인 중간 POM을 가진 환자에서 불필요한 침습적인 절차를 피하는 것을 도울 수 있지만, 폐암에 걸린 이 그룹에 소수의 환자가 있었으며; 음성 유전자-발현 분류기 결과는 이런 환자에서 추가 침습적인 테스팅을 지연시킬 수 있다. 그러나, 이 그룹의 환자는 이미징을 통해 능동적인 감시를 받게 될 것인데, 이는 즉각적인 침습적인 전략이 사용되지 않을 때 표준 사례이다 [1,15]. 이것은 병변 성장의 동정을 가능하게 하여, 최종 진단을 확립하기 위한 추가적인 침습적 테스팅을 유발한다. 중간 POM을 가진 환자에서 관찰된 높은 NPV와 반대로, 이 분류기는 이 설정에서 40%의 적절한 PPV를 가진다. 따라서, 분류기에 의한 양성 결과는 진단 전략에 변경을 보증하지 않으며; 추가 테스팅은 침습적인 이미징 감시 전략 대 이미징 감시 전략 중 하나를 선택하는데 사용되는 전통적인 인자에 기반할 것을 필요로 한다.
이 유전자 발현 분류기는 근위 BEC에서 측정되고 폐 병변 내의 세포로부터는 측정되지 않는다. 폐 실질 세포 내에서 폐암의 존재를 검출하기 위한 세포학적으로 정상적인 근위기도에서 유전자 발현 변화의 능력은 "손상 영역" 패러다임에서 직접 유래한다[13]. 스피라 등은 폐암에 걸린 현재 및 과거 흡연자 중에서 세포학적으로 정상적인 기관지 상피 세포에서 유전자 발현 변형의 뚜렷한 패턴이 존재한다는 것을 이미 밝혀냈다[13,16]. 추가로 종양 신호 전달 경로는 폐암에 걸린 흡연자와 전염성 병변이 있는 흡연자의 근위기도 상피에서 활성화된다[17]. 보다 최근에, 카다라 등[18]은 비소 세포 폐암 그 자체와 인접한 작은 기도 상피에서 발현이 변화하는 유전자가 근위기도 상피에서 변형된 유전자들 사이에서 풍부해지는 것을 입증하였고, 이는 근위기도 내에서 유전자 발현 변화가 부분적으로 폐 종양에서 관찰된 변이된 전사체를 반영하는 것을 암시한다.
기관지 내시경은 이 절차가 폐암 진단을 한 경우에만 "진단"으로 간주되었다. 상대적으로 특정 양성 병인을 잠재적으로 진단한 상대적으로 적은 수의 기관지 내시경이 존재하였지만, 폐암으로 궁극적으로 진단된 환자를 포함하는 대부분의 환자는 추가 침습적인 테스팅을 받았으며, 이는 기관지 내시경에 의한 초기 양성 소견에도 불구하고 폐암에 대한 우려는 증가된 상태로 존재했다는 것을 암시한다. 마지막으로, 본 발명자는 임상 변수와 함께 분류기를 통합한 모델의 정확성을 평가하지 않았다. 고형 폐결절에 대한 임상적 위험 예측 모델이 개발되었지만[1,20,21], 큰 병변(즉 > 3cm), 침윤 또는 림프절병증과 같은 다른 특징을 포함하는 광범위한 소견을 가진 환자를 포함하는, 진단 기관지 내시경을 시행하도록 선택된 환자에 대한 검증된 모델이 없다. 따라서, 대부분의 환자는 폐암 확률에 대한 의사의 정성적 평가를 기반으로 기관지 내시경에 대해 선택된다. 중요하게는, 본 발명자는 우리의 분류기가 의사 평가, 즉 이용 가능한 임상 위험 인자를 통합하는 과정에 의해 중급 POM을 가진 환자에서 잘 실행되는 것을 입증한다.
이 연구의 잠재적 영향은 연구 설계에서 다수의 주요 강점에 의해 보강된다. 첫째, 이들은 테스트가 임상적으로(즉, 진단 전에) 사용되는 설정에서 분류기가 측정되는 2개의 독립된 기대되는 유효성 검사 연구이었다. 이것은 발견 연구에서 궁극적인 임상 적용으로 분자 바이오 마커를 이동시키는 중요한 단계이다. 둘째, 대규모 다기관 설계는 다른 실시 환경 및 지리적 위치에서 기관지 내시경을 받는 환자를 포함할 수 있었다. 셋째, 우리의 데이터는 비 진단 기관지 내시경을 받고 중간 사전 테스트 POM를 가진 환자 중에서 폐암의 높은 유병률이 나타내며 암 상태 대한 가장 큰 불확실성이 있는 상황에서 이 분류기가 91%의 NPV를 갖는 것을 보여준다. 이 상황에서, 폐암에 대한 높은 민감성을 가진 분류기를 사용할 기회는 능동적인 감시가 뒤따를 수 있는 폐암이 없는 환자의 확실한 확인을 가능하게 하여, 잠재적으로 유해한 침습 후속 테스팅을 피하게 한다.
실시예 3: 진단 기관지 내시경을 시행중인 환자에서 폐암 환자에 대한 기관지 게놈 분류기 유도
개요
폐암은 미국에서 암 사망의 주요 원인으로 남아 있으며, 추정된 224,000건의 새로운 진단 및 2014년에 160,000건의 사망이 있으며, 그 중 90%가 흡연에 기인한다[24]. 최근, 국가 폐암 선별 검사(National Lung Cancer Screening Trial)는 저선량 컴퓨터 단층 촬영(CT) 검사는 고위험군에서 20% 상대적 사망률 감소를 가져왔다[25]. 그러나, 사망률 감소는 높은 비율(~96%)의 위양성 CT 소견을 동반하며, 이는 침습적인 진단 절차의 과다 사용에 대한 우려를 발생시켰다[26].
폐암이 의심되는 환자는 종종 병리학적 분석을 위해 의심스러운 폐 병변을 채취하는 것이 주된 목적인 기관지 내시경을 받는다. 미국에서는 1년에 50만 건의 기관지 내시경이 실행되는 것으로 추정되며[27], 이 중 약 절반이 폐암 진단을 위한 것이다. 기관지 내시경은 경흉부 세침 생검(TTNB) 또는 수술 기법과 같은 다른 침습적인 샘플링 방법보다 안전하다. 그러나 기관지 내시경의 진단 민감성은 34% (<2cm의 말초 결절의 경우) 내지 88%(중심부의 큰 병변의 경우)로 준최적이다. 안내 기술의 채택은 기관지 내시경의 응용가능성을 의심스러운 병변(즉, 주로 폐의 주변부인 고립 폐결절)으로 확대시켰으나, 폐암에 대한 기관지 내시경의 전반적인 임상 민감성은 실질적으로 향상되지 못했다[29,30]. 기관지 내시경이 비 진단적일 때, 종종 추가적인 합병증[31,32]을 동반하는 추가 침습적인 진단 절차를 추구할지 또는 이미징 감시를 선택할지에 대한 모호함이 의사들에게 남겨진다. 이러한 침습적인 시술이 시행되는 현재 실시에서, 환자의 대략 1/3이 양성 질환으로 판명되며 [33], 이러한 절차는 피할 수 있음을 암시한다. 기관지 내시경의 진단 수율을 실질적으로 개선함으로써 이러한 모호함을 줄이는 방법은 환자 치료를 향상시킬 수 있다.
담배 연기는 전체 호흡 기관을 정렬시키는 기도 상피 세포에서 분자 장을 생성한다는 것이 이전에 증명되었다[34]. 기관지 기도 전사체에 대한 담배 연기의 가역적 및 비가역적 영향이 밝혀졌으며, 기관지 상피의 일련의 유전자 발현 변화가 폐암에 걸린 현재 및 과거 흡연자에서 확인되었다[35]. 이러한 암 관련 유전자 발현 프로파일은 기관지 내시경이 비 진단 일 때 폐암을 탐지하기 위한 민감한 분류기를 생성하는 것으로 이미 입증되었다. 기관지 내시경 중에 쉽게 접근할 수 있는 생체표본에서 측정된 이 분류기의 높은 민감성은 테스트 결과가 음성일 때 폐암의 확률이 매우 낮으며 의사가 능동적 감시를 확신있게 추구하고 폐암이 없는 대상에서 위험한 침습적 절차를 줄일 수 있음을 암시한다.
재료 및 방법
트레이닝 세트 환자 개체군
환자 진단 작업의 일부로서 기관지 내시경을 받은 폐암의 의심이 있는 현재 및 과거 흡연자에 대한 기대되는, 관찰적, 그룹 연구(NCT01309087 및 NCT00746759로 등록)로 설계된 AEGIS 시험(Airway Epithelium Gene Expression In the DiagnosiS of Lung Cancer)에 환자를 등록시켰다. 그룹 중 하나의 환자 세트("AEGIS 1")는 유전자 발현 분류기를 훈련시키는 배타적 목적으로 선택되었다. 이 연구는 각 참여 의료기관에서 IRB에 의해 승인되었고, 모든 환자는 등록하기 전에 사전 동의서에 서명하였다. 등록된 모든 환자는 최종 진단이 이루어지기 전 또는 12개월 동안 기관지 내시경을 받았다. 환자는 기관지 내시경에서 또는 후속 폐 생검(기관지 내시경이 폐암의 진단을 유도하지 않을 때 TTNB 또는 수술적 폐 생검(SLB))에서 얻은 세포병리학에 근거하여 원발성 폐암으로 진단받았다. 환자는 기관지 내시경 검사 12개월 후 의료 기록 검토 및 추적 관찰에 근거하여 양성 질환으로 진단되었다(추가 파일 1에서보다 자세하게 기술됨). 기관지 내시경 절차 시 수집된 임상 샘플이 세포학이나 병리학을 통해 확인된 폐암 진단을 야기했을 때 기관지 내시경은 "진단"으로 간주되었다.
NIH 등록 AEGIS 연구(NCT01309087 및 NCT00746759)에 등록된 환자는 적어도 21세이며 생애에서 적어도 담배 100개피를 피운 폐암의 의심을 위한 임상적으로 필요한 기관지 내시경을 받는 환자다. 연구 배제는 이전에 원발성 폐암으로 진단받았고, 기관지 내시경 직전 연속 ≥24시간 동안 기계식 인공호흡기를 사용중이거나 연구에 동의하지 않거나 이를 준수할 수 없었던 환자를 포함하였다. 원발성 폐암 이외의 악성 종양 환자를 배제하기 위해 분류기를 훈련하기 전에 추가 환자를 배제하였다. 배제는 등록 후 임의의 악성 종양의 이력, 확인된 폐 전이암을 갖거나 활동성의 비 폐 원발성 암이 있는 것으로 발견된 환자의 배제를 포함하였다. 또한, 최종 정확한 진단이 없는 환자도 배제되었다. 마지막으로, 표본 처리 후, RNA의 불충분한 수율(<1μg) 또는 품질(RIN <4)을 가진 환자를 추가 분석에서 배제하였다.
기관지 내시경 후 12개월까지 환자를 추적관찰하고 기록을 검토하여 최종 임상 진단을 확인하거나 결정하였다. 암의 진단은 기관지 내시경 중 또는 기관지 내시경이 비 진단인 경우 후속 절차에서 수집된 세포/조직의 세포 병리학에 기반하였다. 진단으로 이어지는 후속 절차는 제 2 기관지 내시경, 흉부 천자 흡인술(TTNA), 수술적 폐 생검(SLB) 또는 여러 가지 절차로 이루어졌다. 암으로 진단되지 않고 12개월 동안 추적관찰된 환자의 기록은 5명의 폐병학자 패널에 의해 판결 과정을 거쳤다. 이 과정은 이용가능한 의료 기록의 검토로 구성되었고, 환자가 다음과 같은 기준 중 하나를 충족하는 경우 암이 없는 것으로 결정되었다: 초기의 의심스러운 이상을 설명하는 대체 진단으로 진단되었고, 이상은 안정한 것으로 결정되거나 이상이 해소되었다. 12개월 추적관찰 기간의 종료시 이런 기준을 충족하지 못했던 환자는 진단 "진실"의 결여 때문에 "불확실한" 것으로 분류하고 훈련에서 배제하였다.
샘플 수집
25개 참여 의료 센터 각각의 의사들은 표준 기관지 내시경 브러쉬를 사용하여 우측 주 기관지(임의의 이상이 우측에서 관찰된 경우 좌측)으로부터 정상으로 보이는 기관지 상피 세포(BEC)를 수집하도록 지시받았다. 수집 후, 세포학 브러쉬를 잘라내어 수집 직후 RNA 방부제(Qiagen RNAProtect, Cat. 76526)에 넣고 4℃에서 저장하였다. 그런 후에 표본을 추가 처리를 위해 중앙 실험실로 4-20℃에서 수송하였다.
48시간 내에 4-20℃에서 표본의 수송을 가능하게 하는 모든 장소에 선적 컨테이너가 제공되었다. 장소는 2일 배송 서비스를 사용하여 표본을 보내달라고 요청받았다. 중앙 실험실에서 수령하면, 표본을 검사하고 실험실 정보 시스템에 등록시켰다. 수용된 표본은 RNA 분리 전 4℃에서 보관하였고, RNA 분리는 통상적으로 수령 후 7일 이내에 실행하였다. 모든 저장 기록과 운송 시간을 유지하였고 표본 수집과 RNA 분리 사이의 누적 시간은 30일 미만이었다(RNA 방부제에 대한 제조업체의 권장 사항과 일치).
RNA 분리
BEC를 볼텍스(vortex) 믹서를 사용하여 세포학 브러쉬로부터 분리하고 펠렛 화하고 QIAzol 용해 시약(Qiagen)을 사용하여 처리하였다. RNA를 페놀/클로로포름 추출로 분리하고 제조사의 권고에 따라 실리카 막 스핀-컬럼(Qiagen miRNeasy 키트, Cat.#217004)으로 정제하였다. RNA를 NanoDrop ND-1000 분광 광도계(Thermo Scientific)에서 분석하여 농도 및 순도를 측정하였고, RNA 무결성 (RIN)을 2100 Bioanalyzer(Agilent Technologies)에서 측정하였다. 그런 후에 각 샘플을 마이크로어레이에서 추가 처리할 때까지 -80℃에서 저장하였다.
cDNA 제조
전체 RNA를 어피메트릭스 마이크로어레이와 함께 사용하기 위해 설계된 Ambion WT 발현 키트(Life Technologies Cat. # 4440536)를 사용하여 증폭한 센스 가닥 cDNA로 전환시켰다. 200ng의 전체 RNA로부터 시작하여, T7 프로모터 프라이머 프로토콜을 사용하여 역전사를 통해 단일 가닥 cDNA를 제조하였다. 단일 가닥 cDNA를 DNA 중합효소를 사용하여 이중 가닥 cDNA로 전환시켰다.
마이크로어레이 처리
전체 RNA로부터 얻은 cDNA를 Affymetrix GeneChip WT 말단 표지화 키트 (Affymetrix Cat. # 900671)로 표지하였다. 표지된 cDNA를 유전자 1.0 ST 마이크로어레이(Affymetrix Cat. # 901085)에 혼성화시키고 Affymetrix GeneChip 스캐너로 분석하였다. 환자 샘플 각각에 대한 개별 CEL 파일을 표준 어피메트릭스 유전자 1.0 ST CDF 및 RMA를 사용하여 정규화하였다[38].
전체 RNA를 어피메트릭스마이크로 어레이와 함께 사용하기 위해 설계된 Ambion WT 발현 키트(Life Technologies Cat. # 4440536)를 사용하여 증폭한 센스 가닥 cDNA로 전환시켰다. 200ng의 전체 RNA로부터 시작하여, T7 프로모터 프라이머 프로토콜을 사용하여 역전사를 통해 단일 가닥 cDNA를 제조하였다. 단일 가닥 cDNA를 DNA 중합효소를 사용하여 이중 가닥 cDNA로 전환시켰다. 이중 가닥 cDNA는 효소, 염, 무기 인산염 및 비 결합 뉴클레오티드를 제거하기 위해 정제된 cRNA의 생체외 전사를 위한 주형으로서 작용한다. cRNA의 수율은 UV 흡착을 사용하여 측정하였고, 표지된 센스 가닥 cDNA는 무작위 프라이머 및 dUTP/dNTP 혼합액에 의한 역전사에 의해 정제된 cRNA 10 μg을 사용하여 생성하고, 단편화하고 GeneChip WT 말단 표지화 키트(Affymetrix, Cat. # 900671)를 사용하여 표지하였다. 표지된 cDNA를 혼성화, 세척 및 염색 키트(Affymetrix Cat. # 900720)를 사용하여 유전자 1.0 ST 마이크로 어레이(Affymetrix Cat. # 901085)에 혼성화시키고, 45℃에서 16시간 동안 배양하였다. 혼성화 후, 어레이를 세척하고 Affymetrix GeneChip 스캐너에서 스캔하기 전에 표준 어피메트릭스 절차를 사용하여 염색하고 발현 콘솔 소프트웨어 (Affymetrix)를 사용하여 데이터를 추출하였다. 따라서, 본 발명에 기술된 마이크로어레이는 천연 분자의 발현을 측정하지 않고, 마이크로어레이는 자연적으로 발생하지 않는 cDNA 분자의 발현을 측정한다.
분류기 개발
유전자 발현 분류기는 다단계 공정에서 유래되었다. 초기 모델링은 이러한 임상 변수의 유전자 발현 상관관계를 확인하기 위해 세 가지 임상 공변수(성별, 담배 사용 및 흡연력)와 관련된 유전자("유전자 발현 상관관계")를 선택하도록 트레이닝 데이터를 사용하는 것으로 구성되었다. 그런 후에 폐암 관련 유전자를 선택하고, 마지막으로 암 유전자, 유전자 발현 상관관계 및 환자 연령의 조합을 기반으로 폐암의 가능성을 예측하는 분류기를 결정하였다. 이 분류기 개발 절차의 모든 양태는 교차 유효성 검사를 사용하고 트레이닝 세트 샘플의 데이터만을 사용하여 결정하였다.
임상 인자 유전자 발현 상관관계( CFGC )
성별(남성/여성), 흡연 상태(현재/과거) 및 갑년(<10/>10)를 포함하는이 연구 개체군에서 폐암의 공변량을 모델링하여 임상 인자에 대한 유전자 발현 상관관계를 확인하였다. 경험적 베이즈 t-테스트를 발현이 각 임상 인자와 현저하게 관련된 유전자를 확인하였다. 다음으로, 각 임상 인자의 가치를 예측하는데 사용될 수 있는 드문 방식으로 유전자를 선택하였다[36]. 마지막으로, 성별(GG), 흡연 상태(GS) 및 갑년(GPY)에 대한 유전자 발현 상관관계로부터 예측된 값을 각 환자에 대해 계산하고 폐암 관련 유전자 발현을 가진 유전자를 선택하는데 사용하고 하기 폐암 분류기에 사용하였다.
폐암 유전자의 선택
종속 변수로서의 폐암 상태(1 = 암 양성 및 0 = 암 음성)를 갖는 로지스틱 회귀 모델은 트레이닝 데이터, CFGC 및 환자 연령을 예측자로 사용하여 적합하였다. 다음으로, 경험적 베이즈 선형 모델은 유전자 발현 값을 독립 변수로 사용하고 로지스틱 회귀 모형 잔차를 종속 변수로 사용하여 적합하였다. 이것은 질병 상태와 가장 직접적으로 상관관계가 있고 임상적 공변량과 무관한 유전자를 선택하는데 사용되었다. 이 분석에서 상위 폐암 관련 유전자는 계층적 클러스터링을 사용하여 그룹화하였다. 예측 정확성을 추정하기 위해 교차 유효성 검사를 사용하여 AUC를 최대화하도록 반복적 방식으로 유전자를 선택했다. 목표는 누적적으로 최상의 분류기 성능을 제공하는 클러스터와 각 클러스터를 가장 잘 나타내는 특정 유전자를 선택하는 것이었다. 유전자 적정 분석을 실행하여 최적의 성능을 제공하는 클러스터 당 유전자 수를 결정하였다. 선택된 클러스터의 경우, 상위 유전자를 평균하여, 각 환자/클러스터 조합에 대한 클러스터 평균 추정치를 산출하였다. DAVID [37]를 사용하여 각 암 클러스터 내에서 유전자의 기능 분석을 실행하여 분류기에서 암 관련 유전자를 기술하는 생물학적 용어를 확인하였다.
폐암 분류기
폐암 분류기는 결과 변수 및 암 유전자 발현 추정으로서의 폐암 상태, 환자 연령 및 성별(GG)에 대한 CFGC, 흡연 상태(GS), 갑년(GPY)를 예측 인자로서 사용하여 개발하였다. 모델은 벌점 로지스틱 회귀 모델을 사용하여 적합하였고; 벌점 인자(람다)는 임상/유전자 발현 상관관계에 대해 0이고, 유전자 발현 클러스터 추정에 대해 10이었다. 결과 점수는 0 내지 1 크기이다. 폐암 상태를 예측하기 위한 점수 임계값은 비 진단 기관지 내시경을 받은 환자에서 대략 90%의 민감성을 얻도록 설정하였다. 임상 인자 단독과 비교된 폐암을 예측하는 유전자 발현 분류기의 이점의 평가는 폐암 상태를 예측하는 로지스틱 회귀 모델에서 연령, 성별, 흡연 상태 및 갑년(임상적으로 결정됨)을 포함하는 "임상 모델"을 생성함으로써 실행되었다. 폐암 상태를 예측하는 완전한 유전자 발현 분류기와 임상 인자 분류기 사이의 성능 차이는 트레이닝 세트의 각 모델의 AUC를 비교함으로써 평가되었다.
독립 테스트 세트의 분석
이전 연구[35]의 데이터는 본 연구에서 유도된 고정된 분류기의 성능을 평가하기 위한 독립적인 테스트 세트로서 사용되었다. 이 연구에서 BEC는 폐암의 의심을 위해 기관지 내시경을 받은 환자로부터 기관지 내시경에서 수집되었고, RNA는 마이크로어레이(Affymetrix HG-U133A)에서 분석되었다. 본 연구(n = 163)의 CEL 파일을 재정규화하여 바이오컨덕터 R 패키지(버전 1.28.1)에서 강한 멀티어레이 평균(RMA)[38]을 사용하여 유전자 수준의 발현 값을 생산하였다. 이 프로세싱은 교차-플랫폼 분석을 용이하게 하도록 어피메트릭스가 제공한 표준 U133A CDF 대신에 엔트레즈 유전자-특이적 프로브세트(Entrez Gene-specific probeset) 칩 정의 파일(CDF)[39]을 사용하였다. 분석은 통계 계산을 위한 R 환경(버전 2.9.2)을 사용하여 실행되었다.
분류기는 마이크로어레이 플랫폼의 차이를 설명하기 위한 2가지 변형을 갖는 테스트 세트의 환자에게 적용되었다. 첫째, HG-U133A RMA 발현 값은 테스트 세트에서 각 유전자 발현 수준의 평균을 트레이닝 세트에서 관찰된 평균으로 이동시킨 유전자-관련 상수에 의해 조정되었다. 둘째, 대응하는 HG-U133A 프로브세트가 이용 가능하지 않은 분류기 유전자(LYPD2 및 RNF150)에 대해, 트레이닝 세트의 유전자의 평균 발현 값을 모든 테스트 세트 샘플에 사용하였다.
통계 방법
분류기 정확성은 예측 정확성의 표준 측정치: 곡선 하 면적(AUC), 민감성, 특이성, NPV 및 PPV를 사용하여 평가하였다. 10% 샘플 홀드 아웃(hold-out) 세트를 사용하는 교차 유효성 검사는 이러한 접근법을 사용하여 생성된 예측 분류기의 성능을 평가하기 위해 트레이닝 세트에서 사용되었다[40]. 이러한 성능 추정은 분류 기 발견 절차의 개발을 안내하기 위해 사용되었다. 최종 모델은 테스트 세트의 1회성 분석을 실행하기 전에 설정되었다. 피셔의 정확한 테스트는 모든 카테고리 변수의 통계적 유의성을 계산하는데 사용되었고 t-테스트는 연속 변수에 사용되었다.
결과
연구 개체군
폐암으로 진단된 223명의 환자 및 양성 질환으로 진단된 76명의 환자(표 1)로 구성된 AEGIS 1의 299명의 환자 세트가 우리의 유전자 발현 분류기를 유도하는데 사용되었다. 독립적인 테스트 세트의 특성은 이전에 설명되었고 본 발명에 요약된다. 연구 설계는 본 발명에 설명된 것과 유사하지만, 연구 개체군에 일부 차이가 있었다. (폐암으로 진단된 환자에 대해 나이(p = 0.959)에 유의한 차이는 없었음에도) 환자는 시험 세트와 비교하여 훈련 세트에서 평균적으로 나이가 많았다(p <0.001). 트레이닝 세트는 또한 현재 흡연자(p = 0.050)와 <3cm 병변을 가진 더 낮은 비율의 환자(p <0.001)로 구성되었다. 또한, 폐암의 유병율은 트레이닝 세트에서 더 높았다(75% vs 48%, p <0.001).
분류기를 트레이닝하는데 사용된 환자의 임상적 및 인구통계적 특성
카테고리 서브-카테고리 폐암 양성
질환
p
N   223 76  
성별 여성 97 26 0.178
  남성 126 50  
연령 (중앙 연수)   65 56 <0.0001
인종 백인 168 59 0.757
흑인 47 13
기타 5 3
  알려지지 않음 3 1  
흡연 상태 현재 101 26 0.107
  과거 122 50  
흡연력(중앙 PY)   43 30 <0.0001
덩어리 크기 < 2 cm 46 23
>2 내지 <3 cm 30 12
≥3 cm 122 19
불명확한 침윤 10 13
  알려지지 않음 15 9  
덩어리 위치 중앙 86 16
주변 60 30
중앙 & 주변 60 18
  알려지지 않음 17 12  
조직학 서브-타입    
SCLC 40
NSCLC 180
선암 83
편평 상피암 73
큰 세포 6
혼합/미정의 18
알려지지 않음   3
조직학 단계
SCLC 제한 16
광범위 18
알려지지 않음 6
NSCLC 1 28
2 16
3 42
4 62
알려지지 않음 32
양성 질환 서브-카테고리      
대체 진단 54
감염 23
사코이드증 14
염증 7
섬유증 4
기타 4
양성 성장 2
해소/안정성     22  
분류기의 유도 및 성능 평가
유전자 발현은 어레이 상의 많은 비율의 유전자(p <0.001를 가진 6477개 유전자, 표 22에 보고된 상위 10개 유전자)에 대한 현재 흡연 상태와 관련이 있었다. 상위 순위 유전자 3개(SLC7A11, TKT, CLND10)는 교차 유효성 검사에 기반한 로지스틱 회귀-기반 흡연 상태 분류기로 이용하도록 선정되었다. 이 흡연 상태 분류기는 트레이닝 세트 내에서 0.93의 AUC를 가졌다. 추가 CFGC는 흡연 상태와 무관하게 흡연 상태에 대해 유도되었고 갑년에서 측정된 누적 연기 노출을 기반으로 하였다. 흡연력 (<10 PY vs > 10 PY)은 531개 유전자(p <0.001; 표 23에 보고된 상위 10개 유전자)의 발현과 현저하게 연관되었다. 상위 유전자 중 2개는 트레이닝 세트 내에서 0.78의 AUC를 갖는 로지스틱 회귀 분석-기반 흡연력 분류기(RUNX1T1, AKR1C2)로 이용하도록 선택되었다. 성별은 339개 유전자(p <0.001, 표 24에 보고된 상위 10개 유전자)와 현저하게 연관되었다. 상위 유전자(RPS4Y1)는 트레이닝 세트 내에서 성별의 완벽한 분류기(AUC = 1)이었다.
흡연 상태와 연관된 상위 상이하게 발현된 유전자
ID 기호 logFC AveExpr T P.Value GS term
8102800 SLC7A11 -2.31513 7.80246 -19.0302 1.44E-53 YES
8088106 TKT -0.70341 9.137779 -18.3095 7.46E-51 YES
8084630 NA -1.39188 6.897858 -18.2898 8.86E-51
8136336 AKR1B10 -2.27454 6.839364 -18.2346 1.43E-50
7969640 CLDN10 -0.94118 9.579322 -18.1835 2.23E-50 YES
8171435 PIR -0.80298 8.924225 -18.0114 9.97E-50
7937465 TALDO1 -0.62614 10.07378 -17.8271 4.95E-49
8051583 CYP1B1 -2.8955 8.179293 -17.7765 7.69E-49
8020653 CABYR -1.19744 8.009791 -17.6885 1.65E-48
7979658 GPX2 -1.10719 10.62466 -17.524 6.93E-48
흡연력과 연관된 상위 상이하게 발현된 유전자
ID 기호 logFC AveExpr T P.Value GPY term
8151768 RUNX1T1 0.435653 5.905711 8.547091 6.44E-16 Yes
8077989 TPRXL -0.36913 8.733733 -6.22283 1.63E-09
7994058 SCNN1G 0.685624 8.450023 5.90033 9.75E-09
8069764 NA -0.32511 7.23309 -5.82162 1.49E-08
8145470 DPYSL2 0.260084 7.62917 5.749689 2.19E-08
7931832 AKR1C2 -0.81612 10.93402 -5.72526 2.50E-08 Yes
8039674 ZNF154 0.372911 7.366637 5.724589 2.51E-08
8150978 CA8 0.415392 6.182963 5.638727 3.95E-08
8129497 EPB41L2 0.4248 6.895569 5.589681 5.10E-08
8039672 NA 0.437196 4.729487 5.515997 7.48E-08
성별과 연관된 상위 상이하게 발현된 유전자
ID 기호 logFC AveExpr T P.Value GS term
8176375 RPS4Y1 -3.16276 7.851579 -84.6047 6.46E-212 YES
8176624 DDX3Y -4.05255 7.702569 -84.0882 3.79E-211
8177232 KDM5D -2.23316 7.443775 -80.4804 1.17E-205
8176578 USP9Y -3.35997 7.485794 -79.3437 7.01E-204
8177137 UTY -3.38728 7.655898 -78.9665 2.76E-203
8176698 TXLNG2P -2.82024 6.904035 -70.7168 1.36E-189
8176709 CYorf15B -2.63878 7.07696 -68.9368 1.87E-186
8176719 EIF1AY -3.02926 7.079489 -66.6741 2.34E-182
8176384 ZFY -1.6795 6.679083 -59.2385 5.47E-168
8176460 PRKY -1.33643 7.761388 -52.0418 1.48E-152
상기 방법에서 기술된 바와 같이, 본 발명자는 발현이 폐암에 대한 CFGC 모델로부터의 잔류물과 현저하게 연관된 유전자를 확인하였다. 총 232개 암 연관 유전자(표 25)는 유의 기준(T 점수> 2.7)을 충족시켰다. 계층적 클러스터링에 이어 232개 유전자의 쌍 상관관계를 조사하여 유전자를 확인하고 유전자를 11개 클러스터로 나누었다 (도 7). 유전자는 각 클러스터 내에서 서로 연관되어 있기 때문에, 각 클러스터 내에서 작은 유전자 세트의 평균이 드문 방식으로 클러스터를 나타내는데 사용될 수 있다고 가정하였다. AUC를 추정하기 위해 교차 유효성 검사를 사용하여 분류기를 최적화하였다. 본 발명자는 발현이 폐암과 가장 밀접하게 연관되어있는 유전자 클러스터를 나타내는 유전자를 선택하고 클러스터 1, 2, 4, 7, 9 및 10의 포함이 최상의 AUC를 제공하였다는 것을 결정하였다. 본 발명자는 또한 클러스터 당 2-4개 이상의 유전자가 시험의 성능을 향상시키지 못했다는 것을 결정하였다. 교차 유효성 검사에서, 트레이닝 세트의 모든 환자(n = 299)에 대해 AUC = 0.80(95% CI 0.75 - 0.84); 비 진단 기관지 내시경을 받은 환자(n = 134)의 서브세트에 대해 성능은 비슷하였다(AUC = 0.81; 95% CI 0.74 - 0.87).
분류기에 포함되는 암과 연관된 유전자
ID 기호 T p.value FC 클러스터 최종
모델
8094228 BST1 -4.29031 2.41E-05 0.89208 1 Yes
8037298 CD177 -3.85704 0.00014 0.715357 1 Yes
8029280 CD177 -3.68455 0.000272 0.840725 1 Yes
7918857 TSPAN2 -3.92967 0.000106 0.845904 2 Yes
7968062 ATP12A -3.49107 0.000553 0.794623 2 Yes
8124654 GABBR1 2.881256 0.004247 1.071879 4 Yes
8147461 SDC2 2.847433 0.004712 1.089453 4 Yes
7978391 NOVA1 2.729315 0.006721 1.094912 4 Yes
7952205 MCAM 2.70666 0.007186 1.06072 4 Yes
8175531 CDR1 4.307308 2.24E-05 1.468199 7 Yes
8103877 CLDN22 3.502336 0.000531 1.329189 7 Yes
8051001 CGREF1 3.275505 0.001178 1.056672 7 Yes
8149811 NKX3-1 2.92659 0.003689 1.175825 7 Yes
8034974 EPHX3 -3.73504 0.000225 0.898923 9 Yes
8153342 LYPD2 -2.93177 0.00363 0.887468 9 Yes
8102938 RNF150 -4.32839 2.05E-05 0.880745 10 Yes
8028924 MIA -3.23844 0.001337 0.906368 10 Yes
최종 폐암 분류기는 전체 트레이닝 세트에 대한 최종 분류기 발견 절차를 사용하여 결정되었다. 분류기는 예측자로서 6개 암 유전자 클러스터(총 17개 유전자로 표시됨), 환자 연령 및 유전자 발현 상관관계(GG, GS, GPY)(표 26)의 조합으로 구성되었다. 이분법 분류는 0.65의 점수 임계값을 사용하여 실행되었다(점수 >/=0.65를 가진 환자는 암 양성으로, <0.65, 암 음성으로 예측되었다). 분류기는 트레이닝 세트에서 93%의 민감성과 57%의 특이성을 가졌고 기관지 내시경이 폐암으로 진단하지 않은 환자의 서브 세트(AUC = 0.78, 95% 0.71-0.85)와 비교하여, 전체 훈련 세트(0.78, 95% CI, 0.73-0.82)에 대한 분류기의 AUC에 차이가 없었다 (도 9 참조).
유전자 발현 분류기의 설명a
특징 b, (xi) 계수, (bi) 특징 내의 정보 유전자
연령 0.0623
GG 0.5450 RPS4Y1
GS 0.1661 SLC7A11 CLDN10 TKT
GPY 3.0205 RUNX1T1 AKR1C2
CA (1) -0.4406 BST1 CD177.1 CD177.2
CA (2) -0.3402 ATP12A TSPAN2
CA (4) 0.1725 GABBR1 MCAM NOVA1 SDC2
CA (7) 0.5670 CDR1 CGREF1 CLDN22 NKX3-1
CA (9) -0.3160 EPHX3 LYPD2
CA (10) -0.3791 MIA RNF150
절편 (b0) 3.3173
a) 게놈 성별은 RPS4Y1 <7.5이면 GG = 1(암컷)로, 그렇지 않으면 0(수컷)으로 정의되었다. 예측된 게놈 흡연(GS) 값이 유도되었고, 여기서 x = 40.8579-0.4462*SLC7A11-2.1298 * CLND10-1.8256*TKT 및 게놈 흡연 GS = e x /(1+ e x ). 예측된 게놈 갑년(GPY) 값은 유도되었고, 여기서 x = -5.1429 + 2.1891*RUNX1T1 -0.9506*AKR1C2, 게놈 갑년 GPY = exp(x)/(1 + exp(x)). 예측 분류기에 대한 일반화된 방정식은 다음과 같았다: 점수 = e y /(1+ e y ), 여기서 y = b 0 + Σ(b i * x i ) 여기서 b 0 는 절편이고 b i 는 계수이며 x i 는 특징이다(도시됨).
b) 특징은 환자 연령(보고됨), 상기 방법에서 기술된 GG, GS, GPY 및 CA(i), 폐암 유전자 클러스터(도 7에 도시됨)를 포함한다.
유전자 발현 분류기는 트레이닝 세트(p < 0.001)에서 임상 인자 단독(AUC = 0.72; 95% CI, 0.67-0.77)을 사용하는 모델보다 현저하게 좋게 실행되었다(AUC = 0.78; 95% CI, 0.73-0.82). 17개 암 유전자의 기능 분석은 별도로 요약된다(표 27). 유전자 중 9개는 암과 연관에서 하향 조절되고 8개는 상향 조절된다.
분류기 유전자의 생물학적 특성
클러스터 암의 방향 바이오마커 유전자 생물학적 주제
1 아래 BST1, CD177.1, CD177.2 선천적 면역 반응
2 아래 ATP12A, TSPAN2 유사분열 세포주기
4 GABBR1, MCAM, NOVA1, SDC2 레티노산에 대한 반응, 세포주기
7 CGREF1, CDR1, CLDN22, NKX3-1 점막하선 마커
9 아래 EPHX3, LYPD2 생체이물질 해독
10 아래 MIA, RNF150 연골 마커
독립 테스트 세트에서 유효성 검사
독립 테스트 세트의 비 진단 기관지 내시경을 받은 환자(n = 123)에서, 분류기의 AUC는 0.81(95% CI, 0.73-0.88)이었고(도 8), 이는 트레이닝 세트에서 비 진단 기관지 내시경을 받은 환자에서의 성능과 유사하였다(AUC = 0.78; 95% 0.71-0.85; p = 0.495). 민감성은 92%이었고 특이성은 55%이었고, NPV는 94 %(95% CI, 83-99%)이었다(표 28 참조). 흥미롭게도, 본 발명자는 암에 대한 분류기의 민감성에 대해 암 조직학 또는 단계(표 29, 또는 병변 크기(표 30)의 임의의 영향을 관찰하지 않았다. 또한, 테스트 세트에서 분류기는 현재 흡연자에서 0.79의 AUC 및 과거 흡연자에서 0.82의 AUC를 가졌고, 이는 흡연 상태는 분류기 성능에 대해 매우 효과적인 영향을 미치지 않는다는 것을 암시한다(p = 0.710). 기관지 내시경 단독과 비교할 때, 기관지 내시경과 유전자 발현 분류기의 병합은 51%에서 95%로 민감성을 향상시켰다(p <0.001) .
테스트 세트에서 기관지 내시경, 분류기 및 병합 절차의 성능
카테고리 a 기관지 내시경 분류기 b 분류기 & 기관지 내시경 병합
N, 전체 163 123 163
N, 폐암 78 38 78
N, 양성 질환 85 85 85
민감성 (95% CI) 51% (40-62%) 92% (78-98%) 96% (89-99%)
특이성 (95% CI) 100% (95-100%) 53% (42-63%) 53% (42-63%)
NPV (95% CI) 69% (60-77%) 94% (83-98%) 94% (83-98%)
PPV (95% CI) 100% (90-100%) 47% (36-58%) 65% (56-73%)
a) 암으로 진단된 환자 = CA + 및 양성 질환 = CA -
b) 분류기의 성능은 기관지 내시경이 암의 발견을 초래하지 못한 환자에서 평가되었다(n=123).
테스트 세트에서 폐암에 걸린 환자에 대한 기관지 내시경, 분류기 및 병합 절차의 민감성
조직학 서브 타입 N 기관지 내시경
민감성
분류기
민감성
병합
민감성
모든 암 78 51% a 92% b 96% c
SCLC 14 64% 100% 100%
NSCLC 64 48% 91% 95%
선암 18 33% 83% 89%
편평 상피암 27 56% 92% 96%
큰 세포 4 25% 100% 100%
  미정의 15 60% 83% 93%
조직학 단계  
SCLC
제한 9 78% 100% 100%
광범위 5 40% 100% 100%
NSCLC
1 14 36% 100% 100%
2 2 50% 100% 100%
3 25 52% 92% 96%
  4 22 55% 80% 91%
알려지지 않음 1 0% 100% 100%
폐암 의심 진단을 위해 기관지 내시경을 받은 163명의 환자 중, 78명이 암 진단을 받았다. 기관지 내시경에서 (a) 40명(51%, 95% CI, 40-62 %)에 폐암 진단이 내려졌고, 나머지 폐암 환자는 기관지 내시경 검사에서 진단이 없었고, 분류기는 이 중 34명(b)(89%, 95% CI, 75-96%)을 정확하게 예측하였다. 기관지 내시경과 병합된 분류기는 폐암 환자 78명 중 74명을 탐지하였다(95%, 95% CI, 87-98%). 기관지 내시경, 분류기 및 병합 절차의 민감성은 서브 타입 및 단계에 따라 폐암에 대해 도시된다.
의심 병변의 크기에 의해 계층화된 테스트 세트에서 기관지 내시경, 분류기 및 병합 절차의 민감성
덩어리 크기a N 기관지 내시경
민감성
분류기
민감성
병합
민감성
<3cm 99 44% 87% 93%
>3cm 48 58% 94% 98%
불명확한 침윤 16 38% 100% 100%
폐암으로 진단된 환자 및 양성 질환을 가진 환자를 포함한다.
표 26은 관심 있는 다수의 유전자 발현 분류기를 열거한다. 아래 표 31은 NCBI에서 이용할 수 있는 유전자 ID를 제공하여, 유전자 발현 분류기에 대한 서술 적 지원을 제공한다. 유전자 분류기 CD177은 표 31에 두 명칭, CD177.1 및 CD177.2로 나타내었다. .1 및 .2 명칭은 두 개의 상이한 프로브 세트가 유전자 분류기에 의해 표시된 유전자의 상이한 발현을 탐지하는 어레이에서 사용되는 것을 확인한다. 도 10a는 CD177.1을 설명하는, CD177에 혼성화하는데 이용된 19개의 프로브를 개시한다. 도 10b는 CD177.2를 설명하는, CD177에 혼성화하는데 이용된 4개의 프로브를 개시한다.
유전자 발현 분류기에 해당하는 NCBI 유전자 ID 번호
유전자 분류기 유전자 ID 번호 유전자 분류기 유전자 ID 번호
RPS4Y1 6192 MCAM 4162
SLC7A11 23657 NOVA1 4857
CLDN10 9071 SDC1 6382
TKT 7086 CDR1 1038
AKR1C2 1646 CGREF1 10669
BST1 683 CLDN22 53842
CD177.1 57126 (도 10a 참조) NKX3-1 4824
CD177.2 57126 (도 10b 참조) EPHX3 79852
ATP12A 479 LYPD2 137797
TSPAN2 10100 MIA 8190
GABBR1 2550 RNF150 57484
RUNX1T1 862
결과의 평가
연구는 담배 연기 노출 및 현재 및 과거 흡연자에서 폐암의 존재와 연관된 기관지 기도로부터의 정상 상피 세포에서 지속적인 유전자 발현 변형이 존재한다는 것을 입증하였다[32,41,42,43]. 이러한 암-연관 차이는 기관지 내시경 동안 얻은 상대적으로 비침습적으로 수집된 생물표본에서 폐암을 정확하게 탐지할 수 있는 분류기를 유도하는데 사용될 수 있다. 현재의 관행에서, 기관지 내시경이 악성 종양을 발견하지 못할 때 폐암을 배제하는 것이 어렵고 위음성 비율은 20-70%일 수 있다[28]. 현재의 가이드라인은 질환의 위험이 높은 환자는 증가된 합병증의 위험을 수반하는[31], 더욱 침습적인 후속 진단 절차[28]로 추적되어야 한다고 제안한다. 그러나 불확실성으로 인해, 이러한 절차는 종종 양성 질환을 갖는 것으로 발견된 환자에서 수행되었다[33]. 따라서 본 발명자의 목표는 전체 민감성을 높이고, 기관지 내시경이 비 진단적일 때 모호성을 최소화하며, 불필요한 침습적 절차의 필요성을 줄이기 위해 기관지 내시경 중 근위기도로부터 유전자 발현 분류기를 유도하는 것이었다.
이 연구에서, 본 발명자는 폐암에 대한 유전자 발현 분류기를 유도하기 위해 더 큰 다기관 연구로부터 의심된 폐암에 대해 기관지 내시경을 받는 현재 및 과거 흡연자의 그룹을 활용하였다. 분류기는 높은 민감성과 높은 NPV를 갖는 다변수 로지스틱 회귀 모델이다. 중요한 것은, 본 발명자는 의심된 폐암에 대해 기관지 내시경을 받는 흡연자로부터 수집된 기도 샘플의 이전에 발표된 연구 결과로부터의 데이터를 사용하여, 독립 그룹에서 분류기의 성능을 검증하였다. 기관지 내시경이 55%의 특이성을 가진 테스트 세트에서 비 진단인 환자에서 민감성은 92%이다. NPV는 기관지 내시경 단독에 대해 69%의 NPV와 비교하여 테스트 세트에서 94%이며 이는 분류기가 비 진단 기관지 내시경 후 폐암을 갖지 않을 가능성이 있는 환자를 의사가 확실하게 확인하도록 도울 수 있다는 것을 암시한다.
폐암에 걸린 현재 및 과거 흡연자에서 정상적으로 보이는 기도 상피에서 상이하게 발현된 유전자의 기능은 손상 분야의 기초가 되는 생물학에 대한 통찰력을 제공한다. 억압된 유전자들 중에, CD177 및 BST1을 포함하는 면역 반응에 관여하는 여러 유전자가 존재하며, 이는 폐암에 걸린 흡연자의 기도에서 손상된 면역 반응을 암시한다. 발현이 p53 낙다운(knockdown)에 의해 억제되고 폐 선암에서 나쁜 예후와 연관되는 유전자 TSPAN2는 또한 암 환자에서 더 낮은 수준으로 발현되었다. 또한 이종 생물 대사, 담배 연기에서의 발암 물질 처리, 및 다른 상피암에서의 발암 현상에 관여하는 유전자 EPHX3는 하향 조절된다[45]. 폐암에서 상향 조절되는 분류기 유전자 중에서, NOVA1과 CDR1은 뉴런에서 우세하게 발현되지만, 종양에서도 발현되며 소 세포 폐암을 포함하는 여러 악성 종양에서 부종양성 항체와 연관된다[46,47, 48,49,50]. 또한, 폐암에서 상향 조절되는 MCAM은 기저 기관지 상피 세포에서 발현된다[51]. MCAM은 또한 회복 동안 기관 상피에서 강하고 일시적으로 상향 조절되고[52], 기관 상피 재생에 필요하며[53], COPD 환자[54]와 천식 환자[55]의 기관지 상피에서 상향 조절된다. SDC2, NKX3-1 및 세포주기 정지 매개체인 CGREF1을 포함하는, 세포 성장 및 증식을 조절하는 다수의 분류기 유전자는 폐암 환자에서 상향 조절된다. 마지막으로 분류기에서 흡연 상태(SLC7A11, CLDN10, TKT)와 흡연력(RUNX1T1, AKR1C2)을 예측하기 위해 선택된 CFGC 유전자는 담배 연기 노출에 의해 변형된 것으로 이미 보고되었고, 기도 상피 생물학에 대한 강력한 흡연 효과를 확인하였다[11,18,33].
본 발명자들의 발견 접근법은 폐암 연관 발현을 갖는 특징의 선택 전에 예측 모델의 구성요소로서 주로 임상 공변수의 명시적인 모델링에서 유전자 발현 기반 폐암 진단[35]에 대한 초기 연구를 확장시킨다. 환경 공격 및 기타 임상적 요인에 대한 반응은 개인들 사이에 크게 다를 수 있음이 알려져 있다. 따라서 우리의 접근법은 환경 공격(예를 들어, 누적 연기 노출)에 대한 환자 수준의 생리적 반응을 포착하기 위해 유전자 발현을 사용하는 것이었는데, 이는 이런 반응은 실제 보고된 값보다 질병 위험을 더 잘 반영 할 수 있기 때문이다[57]. 우리의 접근법의 또 다른 구성요소는 모델화된 임상 인자를 설명한 후 발현이 암과 연관이 있는 유전자를 선택하는 것이었다. 우리는 이 접근법이 암 연관 유전자 발현을 가진 유전자에 의해 포착된 암의 가능성에 대한 정보가 모델링된 임상 인자에 의해 포착된 암에 대한 정보와 독립적이라는 것을 보장하는데 도움이 될 것을 가정하였다. 우리의 분류기 발견 접근법의 또 다른 중요한 양태는 클러스터링을 통해 독립적인 암 연관 유전자 발현 패턴을 확인한 다음 각 암 연관 유전자 발현 모듈의 부가 효과로 암을 모델링하는 방법론이었다. 이것은 단일 암 연관 분자 과정을 반영하는 전체 유전자 패널을 잠재적으로 선택하게 할 수 있는 암과 이들의 연관성에 따라 세계적으로 상위 순위에 있는 유전자만을 선택하는 것과는 대조적이다. 정상으로 보이는 기도 상피 세포에서 폐암의 위험을 예측하기 위한 유전자 발현 분류기를 유도하는 이전의 연구는 기관지 내시경이 비 진단적일 때 높은 민감성 및 NPV와 유사한 결과를 기술하였다[35]. 본 발명에 기술된 것과 비교된 분류기에 공통적인 유전자가 없는 반면, 본 발명자는 우리의 새로운 분류기가 독립 테스트 세트에서 강력한 성능을 고려하여 유사한 작용 메커니즘을 나타낸다고 믿는다. 그러나, 선택된 특정 유전자의 차이는 특징 선택 과정의 차이로 인한 것일 수 있다.
본 발명자들은 의심되는 폐암에 대해 기관지 내시경과 함께 사용될 수 있는 근위기도로부터의 세포를 사용하여 폐암에 대한 유전자 발현 분류기를 유도하였다. 우리는 독립 테스트 세트에서 이 분류기의 성능을 검증하였다. 이 분류기는 기관지 내시경에 상당한 민감성을 추가하여 높은 NPV를 생성한다. 이 분류기는 기관지 내시경이 비 진단일 때 폐암에 걸릴 위험이 낮은 환자를 확인함으로써 의사 결정을 돕는데 사용될 수 있다.
따라서, 본 발명의 적어도 하나의 실시태양의 몇몇 양태를 기술하였으므로, 당업자는 다양한 변형, 수정 및 개선이 용이하게 일어날 수 있음을 이해할 것이다. 이러한 변형, 수정 및 개선은 본 발명의 일부로서 의도되며 본 발명의 취지 및 범위 내에 있는 것으로 의도된다. 따라서, 상기 설명 및 도면은 단지 예시적이며, 본 발명은 이하의 청구항에 의해 상세히 설명된다.
특허 청구항 요소를 변경하기 위해 청구항에서 "제 1", "제 2", "제 3" 등과 같은 서술 용어의 사용은 방법의 행위가 실행되는 다른 또는 시간적 순서에 비해 그 자체로 하나의 청구항 요소의 임의의 우선순위, 선행 또는 순서를 암시하지 않으며, 청구항 요소를 구별하기 위해 특정 명칭을 갖는 하나의 청구항 요소를 동일한 명칭을 갖는(그러나 서수 용어를 사용하는) 다른 요소와 구별하기 위한 표지로서 단지 사용된다.
본 발명에 인용된 모든 참고 문헌, 논문, 출판물, 특허, 특허 공보 및 특허 출원은 모든 목적을 위해 그 전체가 참조로 포함된다.
참조문헌
1. Gould, M. K., Donington, J., Lynch, W. R., et al. Evaluation of individuals with pulmonary nodules: When is it lung cancer?: Diagnosis and management of lung cancer: American College of Chest Physicians evidence-based clinical practice guidelines. CHEST Journal 2013; 143(5_suppl): e93S-e120S.
2. Tukey, M. H., & Wiener, R. S. .Population-based estimates of transbronchial lung biopsy utilization and complications. Respiratory medicine 2012; 106(11): 1559-1565.
3. Ernst A, Silvestri G, Johnstone D. Interventional Pulmonary Procedures: Guidelines from the American College of Chest Physicians. Chest 2003;123;1693-1717
4. Rivera MP, Mehta AC, Wahidi MM. Establishing the Diagnosis of Lung Cancer: Diagnosis and Management of Lung Cancer, 3rd ed: American College of Chest Physicians Evidence-Based Clinical Practice Guidelines. Chest 2013;143: e142S-65S.
5. Memoli, J. S. W., Nietert, P. J., & Silvestri, G. A. Meta-analysis of guided bronchoscopy for the evaluation of the pulmonary nodule. CHEST Journal 2012; 142(2): 385-393.
6. Ost, D., Fein, A. M., & Feinsilver, S. H. (2003). The solitary pulmonary nodule. New England Journal of Medicine, 348(25), 2535-2542.
7. Grogan, E. L., Weinstein, J. J., Deppen, S. A., et al. Thoracic operations for pulmonary nodules are frequently not futile in patients with benign disease. Journal of thoracic oncology: official publication of the International Association for the Study of Lung Cancer 2011, 6(10): 1720.
8. Detterbeck, F. C., Mazzone, P. J., Naidich, D. P., & Bach, P. B. Screening for lung cancer: diagnosis and management of lung cancer: American College of Chest Physicians evidence-based clinical practice guidelines. CHEST Journal 2013; 143(5_suppl): e78S-e92S.
9. Wiener, R. S., Wiener, D. C., & Gould, M. K. Risks of Transthoracic Needle Biopsy: How High? Clinical pulmonary medicine 2013; 20(1): 29.
10. Covey, A. M., Gandhi, R., Brody, L. A., Getrajdman, G., Thaler, H. T., & Brown, K. T. Factors associated with pneumothorax and pneumothorax requiring treatment after percutaneous lung biopsy in 443 consecutive patients. Journal of vascular and interventional radiology 2004; 15(5): 479-483.
11. Geraghty, P. R., Kee, S. T., McFarlane, G., Razavi, M. K., Sze, D. Y., & Dake, M. D. CT-guided Transthoracic Needle Aspiration Biopsy of Pulmonary Nodules: Needle Size and Pneumothorax Rate 1. Radiology 2003; 229(2): 475-481.
12. Golub, T. R., Slonim, D. K., Tamayo, P., et al. Molecular classification of cancer: class discovery and class prediction by gene expression monitoring. Science 1999; 286(5439): 531-537.
13. Spira A, Beane JE, Shah V, et al. Airway epithelial gene expression in the diagnostic evaluation of smokers with suspect lung cancer. Nature medicine 2007;13:361-6.
14. Hanley JA, McNeil BJ. The meaning and use of the area under a receiver operating characteristic (ROC) curve. Radiology 1982;143:29-36.
15. MacMahon, H., Austin, J. H., Gamsu, G., et al. Guidelines for management of small pulmonary nodules detected on CT scans: a statement from the Fleischner Society 1. Radiology 2005, 237(2): 395-400..
16. Beane, J., Sebastiani, P., Whitfield, T. H., et al. A prediction model for lung cancer diagnosis that integrates genomic and clinical features. Cancer Prevention Research 2008; 1(1): 56-64.
17. Gustafson, A. M., Soldi, R., Anderlind, C., et al. Airway PI3K pathway activation is an early and reversible event in lung cancer development. Science translational medicine 2010; 2(26): 26ra25-26ra25.
18. Kadara, H., Fujimoto, J., Yoo, S. Y., Maki, et al. Transcriptomic architecture of the adjacent airway field cancerization in non-small cell lung cancer. Journal of the National Cancer Institute 2014; 106(3): dju004.
19. Alexander, E. K., Kennedy, G. C., Baloch, et al. Preoperative diagnosis of benign thyroid nodules with indeterminate cytology. New England Journal of Medicine 2012, 367(8): 705-715.
20. McWilliams A, Tammemagi MC, Mayo JR, et al. Probability of cancer in pulmonary nodules detected on first screening CT. N Engl J Med 2013;369:910-9.
21. Ost DE, Gould MK. Decision making in patients with pulmonary nodules. American journal of respiratory and critical care medicine 2012;185:363-72.
22. Irizarry, R. A., Bolstad, B. M., Collin, F., Cope, L. M., Hobbs, B., & Speed, T. P. (2003). Summaries of Affymetrix GeneChip probe level data. Nucleic acids research, 31(4), e15-e15.
23. Johnson WE, Li C, Rabinovic A. Adjusting batch effects in microarray expression data using empirical Bayes methods. Biostatistics 2007; 8: 118-127.
24. Howlader N, Noone AM, Krapcho M, et al. SEER stat fact sheets: lung and bronchus. Available online: http://seer.cancer.gov/statfacts/html/lungb.html.
25. The National Lung Screening Trial Research Team. Reduced Lung-Cancer Mortality with Low-Dose Computed Tomographic Screening. N Engl J Med 2011; 365:395-409
26. Tanoue LT, Tanner NT, Gould MK, Silvestri GA. Lung Cancer Screening. Am J Respir Crit Care Med. published online 04 Nov 2014
27. Ernst A, Silvestri G, Johnstone D. Interventional Pulmonary Procedures: Guidelines from the American College of Chest Physicians. Chest 2003;123;1693-1717
28. Rivera, M. P., Mehta, A. C., & Wahidi, M. M. (2013). Establishing the Diagnosis of Lung Cancer Diagnosis and Management of Lung Cancer, 3rd ed: American College of Chest Physicians Evidence-Based Clinical Practice Guidelines. CHEST Supplement. Chest, 143, e143S.
29. Silvestri, G. A., Feller-Kopman, D., Chen, A., Wahidi, M., Yasufuku, K., & Ernst, A. (2012). Latest Advances in Advanced Diagnostic and Therapeutic Pulmonary Procedures Update on Pulmonary Procedures. CHEST Journal, 142(6), 1636-1644.
30. Gildea, T. R., Mazzone, P. J., Karnak, D., Meziane, M., & Mehta, A. C. (2006). Electromagnetic navigation diagnostic bronchoscopy: a prospective study. American journal of respiratory and critical care medicine, 174(9), 982-989.
31. Wiener, R. S., Schwartz, L. M., Woloshin, S., & Welch, H. G. (2011). Population-based risk for complications after transthoracic needle lung biopsy of a pulmonary nodule: an analysis of discharge records. Annals of internal medicine, 155(3), 137-144.
32. Fontaine-Delaruelle, C., Ferretti, G., Gamondes, D., Pradat, E., Souquet, P. J., & Couraud, S. (2014). Is transthoracic core needle biopsy under CT scan a good deal for benign diseases' diagnosis?. European Respiratory Journal, 44(Suppl 58), P679.
33. Smith MA, Battafarano RJ, Meyers BF, Zoole JB, Cooper JD, Patterson GA. Prevalence of benign disease in patients undergoing resection for suspected lung cancer. The Annals of thoracic surgery 2006;81:1824-1828; discussion 1828-1829
34. Beane, J., Sebastiani, P., Liu, G., Brody, J. S., Lenburg, M. E., & Spira, A. (2007). Reversible and permanent effects of tobacco smoke exposure on airway epithelial gene expression. Genome Biol, 8(9), R201.
35. Spira A, Beane JE, Shah V, Steiling K, Liu G, Schembri F, Gilman S, Dumas YM, Calner P, Sebastiani P, Sridhar S, Beamis J, Lamb C, Anderson T, Gerry N, Keane J, Lenburg ME, Brody J. Airway epithelial gene expression in the diagnostic evaluation of smokers with suspect lung cancer. Nature Medicine 2007; 13(3):361-6
36. Tibshirani, R. (1996). Regression shrinkage and selection via the lasso. Journal of the Royal Statistical Society. Series B (Methodological), 267-288.
37. Da Wei Huang, B. T. S., & Lempicki, R. A. (2008). Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nature protocols, 4(1), 44-57.
38. Irizarry, R. A., Hobbs, B., Collin, F., Beazer-Barclay, Y. D., Antonellis, K. J., Scherf, U., & Speed, T. P. (2003). Exploration, normalization, and summaries of high density oligonucleotide array probe level data. Biostatistics, 4(2), 249-264.
3 9. Dai, M., Wang, P., Boyd, A. D., Kostov, G., Athey, B., Jones, E. G., et al., (2005). Evolving gene/transcript definitions significantly alter the interpretation of GeneChip data. Nucleic acids research, 33(20), e175-e175.
4 0. Golub, T. R., Slonim, D. K., Tamayo, P., Huard, C., Gaasenbeek, M., Mesirov, J. P., et al., (1999). Molecular classification of cancer: class discovery and class prediction by gene expression monitoring. Science, 286(5439), 531-537.
4 1. Kadara, H., Fujimoto, J., Yoo, S. Y., Maki, Y., Gower, A. C., Kabbout, M., et al., (2014). Transcriptomic Architecture of the Adjacent Airway Field Cancerization in Non-Small cell lung cancer. Journal of the National Cancer Institute, 106(3)
4 2. Steiling, K., Ryan, J., Brody, J. S., & Spira, A. (2008). The field of tissue injury in the lung and airway. Cancer prevention research, 1(6), 396-403.
4 3. Bosse, Y., Postma, D. S., Sin, D. D., Lamontagne, M., Couture, C., Gaudreault, N., et al., (2012). Molecular signature of smoking in human lung tissues. Cancer research, 72(15), 3753-3763.
4 4. Otsubo, C., Otomo, R., Miyazaki, M., Matsushima-Hibiya, Y., Kohno, T., Iwakawa, R., et al., (2014). TSPAN2 Is Involved in Cell Invasion and Motility during Lung Cancer Progression. Cell reports, 7(2), 527-538.
4 5. Oster, B., Thorsen, K., Lamy, P., Wojdacz, T. K., Hansen, L. L., Birkenkamp-Demtroder, K., et al., (2011). Identification and validation of highly frequent CpG island hypermethylation in colorectal adenomas and carcinomas. International journal of cancer, 129(12), 2855-2866.
4 6. Knudsen, A., Monstad, S. E., Dorum, A., Lonning, P. E., Salvesen, H. B., Drivsholm, L., et al., (2006). Ri antibodies in patients with breast, ovarian or small cell lung cancer determined by a sensitive immunoprecipitation technique. Cancer Immunology, Immunotherapy, 55(10), 1280-1284.
4 7. Buckanovich, R. J., Posner, J. B., & Darnell, R. B. (1993). Nova, the paraneoplastic Ri antigen, is homologous to an RNA-binding protein and is specifically expressed in the developing motor system. Neuron, 11(4), 657-672.
4 8. Salemi, M., Fraggetta, F., Galia, A., Pepe, P., Cimino, L., Condorelli, R. A., & Calogero, A. E. (2013). Cerebellar degeneration-related autoantigen 1 (CDR1) gene expression in prostate cancer cell lines. The International journal of biological markers, 30;29(3):e288-90
4 9. Tanaka, M., Tanaka, K., Onodera, O., & Tsuji, S. (1995). Trial to establish an animal model of paraneoplastic cerebellar degeneration with anti-Yo antibody: 1. Mouse strains bearing different MHC molecules produce antibodies on immunization with recombinant Yo protein, but do not cause Purkinje cell loss. Clinical neurology and neurosurgery, 97(1), 95-100.
50. Furneaux, H. M., Rosenblum, M. K., Dalmau, J., Wong, E., Woodruff, P., Graus, F., & Posner, J. B. (1990). Selective expression of Purkinje-cell antigens in tumor tissue from patients with paraneoplastic cerebellar degeneration. New England Journal of Medicine, 322(26), 1844-1851.
51. Shih, I. M., Nesbit, M., Herlyn, M., & Kurman, R. J. (1998). A new Mel-CAM (CD146)-specific monoclonal antibody, MN-4, on paraffin-embedded tissue. Modern pathology: an official journal of the United States and Canadian Academy of Pathology, Inc, 11(11), 1098-1106.
52. Tsukamoto, Y., Taira, E., Miki, N., & Sasaki, F. (2001). The role of gicerin, a novel cell adhesion molecule, in development, regeneration and neoplasia. Histol Histopathol. 2001; 16(2):563-71.
53. Tsukamoto, Y., Taira, E., Kotani, T., Yamate, J., Wada, S., Takaha, N., et al., (1996). Involvement of gicerin, a cell adhesion molecule, in tracheal development and regeneration. Cell Growth Differ. 7(12), 1761-1767.
54. Schulz, C., Petrig, V., Wolf, K., Kratzel, K., Kohler, M., Becker, B., & Pfeifer, M. (2003). Upregulation of MCAM in primary bronchial epithelial cells from patients with COPD. Eur Respir J. 2003; 22(3):450-6.
55. Simon, G. C., Martin, R. J., Smith, S., Thaikoottathil, J., Bowler, R. P., Barenkamp, S. J., & Chu, H. W. (2011). Up-regulation of MUC18 in airway epithelial cells by IL-13: implications in bacterial adherence. Am J Resp Cell Mol Biol, 44(5), 606-613.
56. Penning, T. M., & Lerman, C. (2008). Genomics of smoking exposure and cessation: lessons for cancer prevention and treatment. Cancer Prevention Research, 1(2), 80-83.
57. Lampe, J. W., Stepaniants, S. B., Mao, M., Radich, J. P., Dai, H., Linsley, P. S., et al., (2004). Signatures of environmental exposures using peripheral leukocyte gene expression: tobacco smoke. Cancer Epidemiology Biomarkers & Prevention, 13(3), 445-453.
SEQUENCE LISTING <110> Whitney, Duncan H Elashoff, Michael <120> METHODS FOR EVALUATING LUNG CANCER STATUS <130> VRCT-008/02US <150> US 62/024,456 <151> 2014-07-14 <150> US 62/160,403 <151> 2015-05-12 <160> 46 <170> PatentIn version 3.5 <210> 1 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> TSPAN2 Probe Sequence <400> 1 tcaacattaa gaagtcttaa ttcag 25 <210> 2 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> MCAM Probe Sequence <400> 2 gctttaatcc ccatgaagga cagtg 25 <210> 3 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> ATP12A Probe Sequence <400> 3 gcggtggaga taccggcggc ggcgc 25 <210> 4 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> NOVA1 Probe Sequence <400> 4 gacgaaattc agacatggag catca 25 <210> 5 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> MIA Probe Sequence <400> 5 atgacaccaa ggcacaccag ggacc 25 <210> 6 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> CD177.1 Probe Sequence <400> 6 gacccgtctg tggctggtaa tctct 25 <210> 7 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> EPHX3 Probe Sequence <400> 7 gctccactgg aagagaggta taccc 25 <210> 8 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> CD177.2 Probe Sequence <400> 8 ttcctgtgtc ccattgagca ggttg 25 <210> 9 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> CGREF1 <400> 9 tagggtacag cacttaacgc aatct 25 <210> 10 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> BST1 Probe Sequence <400> 10 tgtttgccgt ttcccgttcc agaca 25 <210> 11 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> RNF150 Probe Sequence <400> 11 tggttaatcc aagccgcagc ctggt 25 <210> 12 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> CLDN22 Probe Sequence <400> 12 ggtgtttctc gtctccagtt cttga 25 <210> 13 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> GABBR1 Probe Sequence <400> 13 tacggagcca ttacctgggc agtgc 25 <210> 14 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> SDC2 Probe Sequence <400> 14 tgagcctgct tctccgggct cccct 25 <210> 15 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> NKX3-1 Probe Sequence <400> 15 tttgtgctgg ctagtactcc ggtcg 25 <210> 16 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> LYPD2 Probe Sequence <400> 16 ttcttcaagg cattcggggc tgggc 25 <210> 17 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> CDR1 <400> 17 aacaactccg ggtcttccag cgact 25 <210> 18 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> RPS4Y1 Probe Sequence <400> 18 taaaccgcag gaagtcagat gagtg 25 <210> 19 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> SLC7A11 <400> 19 ggttgaagca actagaagcg tgaca 25 <210> 20 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> CLDN10 Probe Sequence <400> 20 gacagcgttt catgctcgga tggcc 25 <210> 21 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> TKT Probe Sequence <400> 21 ggtttattct ctccagacgg tcagg 25 <210> 22 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> RUNX1T1 Probe Sequence <400> 22 taacagggag gaggtcaaat ctatc 25 <210> 23 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> AKR1C2 Probe Sequence <400> 23 tagctgtagc ttactgaagt cgcca 25 <210> 24 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> CD177.1 Probe Sequence <400> 24 gacgtgaacc agaccaatga agggc 25 <210> 25 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> CD177.1 Probe Sequence <400> 25 tcccataggg caagtccgga tgctc 25 <210> 26 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> CD177.1 Probe Sequence <400> 26 agcaggaagg gcaaaccact cccca 25 <210> 27 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> CD177.1 Probe Sequence <400> 27 ccaagtgaga gactccaggc cctca 25 <210> 28 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> CD177.1 Probe Sequence <400> 28 aggaggctgc acatcacgct tctca 25 <210> 29 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> CD177.1 Probe Sequence <400> 29 ggaggctgca catcacgctt ctcac 25 <210> 30 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> CD177.1 Probe Sequence <400> 30 acaagaagct ggaaggttgg gccac 25 <210> 31 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> CD177.1 Probe Sequence <400> 31 aatgctcatt ttggtggaca gccca 25 <210> 32 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> CD177.1 Probe Sequence <400> 32 ctacatctag gagcagcagc gtctc 25 <210> 33 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> CD177.1 Probe Sequence <400> 33 agcagcgtct cctgacacac ctgcc 25 <210> 34 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> CD177.1 Probe Sequence <400> 34 tcttgagcca agtttccgtg tgtca 25 <210> 35 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> CD177.1 Probe Sequence <400> 35 tccgtgtgtc ataatggtgg tcccc 25 <210> 36 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> CD177.1 Probe Sequence <400> 36 gttaacgagg ttgttgcaga agtcc 25 <210> 37 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> CD177.1 Probe Sequence <400> 37 ttggagagca ccaggctcac ttggg 25 <210> 38 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> CD177.1 Probe Sequence <400> 38 tctcaatgag catcaacgtg tcctg 25 <210> 39 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> CD177.1 Probe Sequence <400> 39 gcaggtcgga caccttccac acatg 25 <210> 40 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> CD177.1 Probe Sequence <400> 40 agggccagca gtaataccgc gctca 25 <210> 41 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> CD177.1 Probe Sequence <400> 41 gggccagcag taataccgcg ctcat 25 <210> 42 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> CD177.1 Probe Sequence <400> 42 gacccgtctg tggctggtaa tctct 25 <210> 43 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> CD177.2 Probe Sequence <400> 43 ttcctgtgtc ccattgagca ggttg 25 <210> 44 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> CD177.2 Probe Sequence <400> 44 tcccattgag caggttgcaa actgg 25 <210> 45 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> CD177.2 Probe Sequence <400> 45 cctgaggagg ccatcataac agtgt 25 <210> 46 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> CD177.2 Probe Sequence <400> 46 aggccatcat aacagtgtgt ggtcc 25

Claims (138)

  1. 폐암을 가진 대상의 위험을 측정하는 방법으로서,
    대상으로부터 얻은 생물학적 샘플을 유전자 발현 분석하는 단계로서, 상기 유전자 발현 분석은 생물학적 샘플에서 유전자 발현 수준을 분석하는 단계를 포함하고, 상기 유전자 발현 분석은:
    (a) 폐암 상태와 관련된 하나 이상의 정보 유전자(informative gene)의 생물학적 샘플에서 하나 이상의 mRNA 발현 수준을 측정하는 단계, 및
    (b) 대상의 하나 이상의 자가 보고 특성과 관련된 하나 이상의 게놈 상관 유전자(genomic correlate gene)의 생물학적 샘플에서 하나 이상의 mRNA 발현 수준을 측정하는 단계로, 여기서 대상의 하나 이상의 자가 보고 특성은 흡연 갑년(smoking pack years), 흡연 상태, 연령 또는 성별을 포함하고, 상기 하나 이상의 게놈 상관 유전자는 SLC7A11, CLND10, TKT, AKR1C2, RUNX1T1, CD52, SYT8, TNNT3, ALX1, KLRK1, RASA3, CERS3, ASPA, GRP, APOC1, EPHX3, REEP1, FAM198B, PCDHB4, PCDHB16, FOXD1, SPARC, NKAPL, GPR110, 및 RPS4Y1로 이루어지는 그룹으로부터 선택되는 것인 단계
    를 포함하는 것인 단계, 및
    (a) 및 (b)에서 측정된 발현 수준에 기초하여, 대상이 폐암을 가질 가능성의 지표인 폐암 위험 점수를 측정하는 단계
    를 포함하는 방법.
  2. 제 1 항에 있어서,
    폐암 위험 점수는 유전자 발현 수준을 차별적으로 가중하는 알고리즘을 적용함으로써 측정되는 방법.
  3. 제 1 항에 있어서,
    폐암 위험 점수는 폐암을 배제하기 위해 90% 초과의 음성 예측치(NPV)를 갖는 모델에 따라 측정되는 방법.
  4. 제 1 항에 있어서,
    폐암 위험 점수는 COPD로 진단된 대상에 대해 85% 초과의 음성 예측치(NPV)를 갖는 모델에 따라 측정되는 방법.
  5. 제 1 항에 있어서,
    대상의 하나 이상의 자가 보고 특성은 흡연 갑년(smoking pack years)을 포함하는 방법.
  6. 제 1 항에 있어서,
    대상의 하나 이상의 자가 보고 특성은 흡연 상태를 포함하는 방법.
  7. 제 1 항에 있어서,
    대상의 하나 이상의 자가 보고 특성은 연령을 포함하는 방법.
  8. 제 1 항에 있어서,
    대상의 하나 이상의 자가 보고 특성은 성별을 포함하는 방법.
  9. 제 1 항에 있어서,
    생물학적 샘플은 호흡 상피의 샘플인 방법.
  10. 제 1 항에 있어서,
    생물학적 샘플은 대상의 입, 코, 인두, 기관, 기관지, 세기관지 또는 폐포로부터 수득되는 것인 방법.
  11. 제 1 항에 있어서,
    생물학적 샘플은 대상의 코로부터 수득되는 것인 방법.
  12. 제 1 항에 있어서,
    분석하는 단계는 생물학적 샘플에서 메신저 리보핵산 분자와 특이적으로 혼성화하는 적어도 하나의 핵산 프로브의 사용을 포함하는 것인 방법.
  13. 제 12 항에 있어서,
    적어도 하나의 핵산 프로브는 고체 지지체 상에 고정되는 것인 방법.
  14. 제 1 항에 있어서,
    폐암은 선암종, 편평 세포 암종, 소세포 폐암 또는 비-소세포 폐암인 방법.
  15. 삭제
  16. 삭제
  17. 삭제
  18. 삭제
  19. 삭제
  20. 삭제
  21. 삭제
  22. 삭제
  23. 삭제
  24. 삭제
  25. 삭제
  26. 삭제
  27. 삭제
  28. 삭제
  29. 삭제
  30. 삭제
  31. 삭제
  32. 삭제
  33. 삭제
  34. 삭제
  35. 삭제
  36. 삭제
  37. 삭제
  38. 삭제
  39. 삭제
  40. 삭제
  41. 삭제
  42. 삭제
  43. 삭제
  44. 삭제
  45. 삭제
  46. 삭제
  47. 삭제
  48. 삭제
  49. 삭제
  50. 삭제
  51. 삭제
  52. 삭제
  53. 삭제
  54. 삭제
  55. 삭제
  56. 삭제
  57. 삭제
  58. 삭제
  59. 삭제
  60. 삭제
  61. 삭제
  62. 삭제
  63. 삭제
  64. 삭제
  65. 삭제
  66. 삭제
  67. 삭제
  68. 삭제
  69. 삭제
  70. 삭제
  71. 삭제
  72. 삭제
  73. 삭제
  74. 삭제
  75. 삭제
  76. 삭제
  77. 삭제
  78. 삭제
  79. 삭제
  80. 삭제
  81. 삭제
  82. 삭제
  83. 삭제
  84. 삭제
  85. 삭제
  86. 삭제
  87. 삭제
  88. 삭제
  89. 삭제
  90. 삭제
  91. 삭제
  92. 삭제
  93. 삭제
  94. 삭제
  95. 삭제
  96. 삭제
  97. 삭제
  98. 삭제
  99. 삭제
  100. 삭제
  101. 삭제
  102. 삭제
  103. 삭제
  104. 삭제
  105. 삭제
  106. 삭제
  107. 삭제
  108. 삭제
  109. 삭제
  110. 삭제
  111. 삭제
  112. 삭제
  113. 삭제
  114. 삭제
  115. 삭제
  116. 삭제
  117. 삭제
  118. 삭제
  119. 삭제
  120. 삭제
  121. 삭제
  122. 삭제
  123. 삭제
  124. 삭제
  125. 삭제
  126. 삭제
  127. 삭제
  128. 삭제
  129. 삭제
  130. 삭제
  131. 삭제
  132. 삭제
  133. 삭제
  134. 삭제
  135. 삭제
  136. 삭제
  137. 삭제
  138. 삭제
KR1020177004127A 2014-07-14 2015-07-14 폐암 상태를 평가하는 방법 KR102461014B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201462024456P 2014-07-14 2014-07-14
US62/024,456 2014-07-14
US201562160403P 2015-05-12 2015-05-12
US62/160,403 2015-05-12
PCT/US2015/040437 WO2016011068A1 (en) 2014-07-14 2015-07-14 Methods for evaluating lung cancer status

Publications (2)

Publication Number Publication Date
KR20170053617A KR20170053617A (ko) 2017-05-16
KR102461014B1 true KR102461014B1 (ko) 2022-10-31

Family

ID=55078998

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020177004127A KR102461014B1 (ko) 2014-07-14 2015-07-14 폐암 상태를 평가하는 방법

Country Status (8)

Country Link
US (2) US20160130656A1 (ko)
EP (2) EP3169814B1 (ko)
JP (2) JP6775499B2 (ko)
KR (1) KR102461014B1 (ko)
CN (2) CN106795565B (ko)
AU (2) AU2015289758B2 (ko)
CA (1) CA2954169A1 (ko)
WO (1) WO2016011068A1 (ko)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100035244A1 (en) 2005-04-14 2010-02-11 The Trustees Of Boston University Diagnostic for lung disorders using class prediction
WO2007103541A2 (en) 2006-03-09 2007-09-13 The Trustees Of Boston University Diagnostic and prognostic methods for lung disorders using gene expression profiles from nose epithelial cells
JP2010538680A (ja) 2007-09-19 2010-12-16 ザ トラスティーズ オブ ボストン ユニバーシティー 肺疾患に対する薬剤開発のための新規経路の同定
US9495515B1 (en) 2009-12-09 2016-11-15 Veracyte, Inc. Algorithms for disease diagnostics
WO2010129934A2 (en) 2009-05-07 2010-11-11 Veracyte, Inc. Methods and compositions for diagnosis of thyroid conditions
EP3626308A1 (en) 2013-03-14 2020-03-25 Veracyte, Inc. Methods for evaluating copd status
US11976329B2 (en) 2013-03-15 2024-05-07 Veracyte, Inc. Methods and systems for detecting usual interstitial pneumonia
EP3770274A1 (en) 2014-11-05 2021-01-27 Veracyte, Inc. Systems and methods of diagnosing idiopathic pulmonary fibrosis on transbronchial biopsies using machine learning and high dimensional transcriptional data
AU2017281099A1 (en) * 2016-06-21 2019-01-03 The Wistar Institute Of Anatomy And Biology Compositions and methods for diagnosing lung cancers using gene expression profiles
US10927417B2 (en) 2016-07-08 2021-02-23 Trustees Of Boston University Gene expression-based biomarker for the detection and monitoring of bronchial premalignant lesions
CN109643584A (zh) * 2016-09-14 2019-04-16 菲利普莫里斯生产公司 用于预测个体生物状态的系统、方法和基因标签
US11244764B2 (en) 2016-12-21 2022-02-08 Cerner Innovation, Inc. Monitoring predictive models
EP3630293A4 (en) * 2017-05-22 2021-06-02 The National Institute for Biotechnology in the Negev Ltd. LUNG CANCER DIAGNOSIS BIOMARKERS
CN110958853B (zh) * 2017-06-02 2023-08-25 威拉赛特公司 用于鉴定或监测肺病的方法和系统
WO2020008339A1 (en) * 2018-07-02 2020-01-09 3M Innovative Properties Company Sensing system and method for monitoring time-dependent processes
KR102274564B1 (ko) * 2018-07-03 2021-07-07 (주) 프로큐라티오 빅데이터분석기반 암진단장치
CN108998531B (zh) * 2018-08-31 2021-10-01 昆明医科大学第一附属医院 肺癌下调长链非编码rna标志物及其应用
CN109615075B (zh) * 2018-12-14 2022-08-19 大连海事大学 一种基于多层聚类模型的居民日常行为识别方法
US20210287795A1 (en) * 2020-03-12 2021-09-16 Optellum Limited Cad device and method for assisting an estimation of lung disease from medical images
CN114277137B (zh) * 2020-03-30 2022-09-02 中国医学科学院肿瘤医院 外泌体arpc5、hmgn1等在肺癌诊断中的应用
CN114410794B (zh) * 2020-03-30 2023-06-23 中国医学科学院肿瘤医院 外泌体miR-106b-3P、ARPC5在肺癌诊断中的应用
CN111863130A (zh) * 2020-04-07 2020-10-30 至本医疗科技(上海)有限公司 肿瘤免疫治疗预后标志物的筛选方法及应用
CN112034185A (zh) * 2020-09-11 2020-12-04 上海市胸科医院 Gpr110、vegfr、cd34在鉴别肺腺癌亚型中的用途
CA3215402A1 (en) * 2021-03-29 2022-10-06 Veracyte, Inc. Methods and systems to identify a lung disorder
US12094107B2 (en) * 2021-04-07 2024-09-17 Optellum Limited CAD device and method for analyzing medical images
CN113444796B (zh) * 2021-06-29 2023-02-07 浙江医院 与肺癌相关的生物标志物及其在诊断癌症中的应用
KR102417602B1 (ko) * 2021-11-30 2022-07-07 (주)플라스바이오 인공 지능 모델 기반 종양 관리 장치 및 방법
CN114854755B (zh) * 2022-05-30 2023-05-23 陕西师范大学 一种抑制vstm2l表达的慢病毒载体及其应用

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005000098A2 (en) * 2003-06-10 2005-01-06 The Trustees Of Boston University Detection methods for disorders of the lung

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003234623A1 (en) 2002-05-16 2003-12-02 Euro-Celtique, S.A. Use of gastrin releasing peptide (grp) and its receptor in cancer screening
CA2552686A1 (en) 2003-11-12 2005-05-26 Trustees Of Boston University Isolation of nucleic acid from mouth epithelial cells
US20100035244A1 (en) 2005-04-14 2010-02-11 The Trustees Of Boston University Diagnostic for lung disorders using class prediction
US9347945B2 (en) 2005-12-22 2016-05-24 Abbott Molecular Inc. Methods and marker combinations for screening for predisposition to lung cancer
WO2007103541A2 (en) 2006-03-09 2007-09-13 The Trustees Of Boston University Diagnostic and prognostic methods for lung disorders using gene expression profiles from nose epithelial cells
KR101443214B1 (ko) * 2007-01-09 2014-09-24 삼성전자주식회사 폐암 환자 또는 폐암 치료를 받은 폐암 환자의 폐암 재발 위험을 진단하기 위한 조성물, 키트 및 마이크로어레이
JP2010528261A (ja) 2007-05-08 2010-08-19 ピコベラ・リミテッド・ライアビリティ・カンパニー 前立腺癌および肺癌の診断および治療方法
JP2010538680A (ja) 2007-09-19 2010-12-16 ザ トラスティーズ オブ ボストン ユニバーシティー 肺疾患に対する薬剤開発のための新規経路の同定
WO2009121070A1 (en) 2008-03-28 2009-10-01 The Trustees Of Boston University Multifactorial methods for detecting lung disorders
GB0811413D0 (en) * 2008-06-20 2008-07-30 Kanton Basel Stadt Gene expression signatures for lung cancers
MX355020B (es) * 2010-07-09 2018-04-02 Somalogic Inc Biomarcadores de cancer de pulmon y usos de los mismos.
KR20130017525A (ko) 2011-08-11 2013-02-20 주식회사 젠닥스 대장암, 유방암, 신장암 또는 갑상선암의 조기 진단을 위한 바이오 마커 및 이의 용도
CN103890193A (zh) * 2011-08-29 2014-06-25 心脏Dx公司 用于确定吸烟状态的方法和组合物
CA2799163A1 (en) 2011-12-18 2013-06-18 20/20 Genesystems, Inc. Methods and algorithms for aiding in the detection of cancer
WO2013163568A2 (en) * 2012-04-26 2013-10-31 Allegro Diagnostics Corp. Methods for evaluating lung cancer status
US20140220006A1 (en) * 2013-02-01 2014-08-07 Meso Scale Technologies, Llc Lung cancer biomarkers

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005000098A2 (en) * 2003-06-10 2005-01-06 The Trustees Of Boston University Detection methods for disorders of the lung

Also Published As

Publication number Publication date
AU2015289758A1 (en) 2017-02-02
EP3169814A4 (en) 2018-03-07
KR20170053617A (ko) 2017-05-16
WO2016011068A1 (en) 2016-01-21
JP6775499B2 (ja) 2020-10-28
JP2020182489A (ja) 2020-11-12
EP3169814B1 (en) 2022-05-04
AU2015289758B2 (en) 2021-09-09
US20210040562A1 (en) 2021-02-11
US20160130656A1 (en) 2016-05-12
CA2954169A1 (en) 2016-01-21
CN114807368A (zh) 2022-07-29
CN106795565B (zh) 2022-05-10
CN106795565A (zh) 2017-05-31
EP3169814A1 (en) 2017-05-24
AU2021218178A1 (en) 2021-09-09
JP2017527304A (ja) 2017-09-21
EP3916110A1 (en) 2021-12-01

Similar Documents

Publication Publication Date Title
KR102461014B1 (ko) 폐암 상태를 평가하는 방법
EP3103046B1 (en) Biomarker signature method, and apparatus and kits therefor
JP5405110B2 (ja) 原発不明がんの原発巣を同定するための方法および材料
US20150080243A1 (en) Methods and compositions for detecting cancer based on mirna expression profiles
DK2158332T3 (en) PROGRAM FORECAST FOR MELANANCANCES
US20210262040A1 (en) Algorithms for Disease Diagnostics
JP2009528825A (ja) デュークスb大腸がんの再発を予測するための分子的解析
EP2841603A2 (en) Methods for evaluating lung cancer status
JP2018524972A (ja) 肺癌の診断または検出のための方法及び組成物
WO2013049152A2 (en) Methods for evaluating lung cancer status
US20230073731A1 (en) Gene expression analysis techniques using gene ranking and statistical models for identifying biological sample characteristics
US20210079479A1 (en) Compostions and methods for diagnosing lung cancers using gene expression profiles
Hong et al. Cell-free DNA methylation biomarker for the diagnosis of papillary thyroid carcinoma
CN117751195A (zh) 脓毒症内型和/或严重程度的诊断
US20240071622A1 (en) Clinical classifiers and genomic classifiers and uses thereof
EP4314323A1 (en) Methods and systems to identify a lung disorder

Legal Events

Date Code Title Description
A201 Request for examination
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant