KR20180009762A - 폐암을 진단하거나 검출하기 위한 방법 및 조성물 - Google Patents

폐암을 진단하거나 검출하기 위한 방법 및 조성물 Download PDF

Info

Publication number
KR20180009762A
KR20180009762A KR1020177035675A KR20177035675A KR20180009762A KR 20180009762 A KR20180009762 A KR 20180009762A KR 1020177035675 A KR1020177035675 A KR 1020177035675A KR 20177035675 A KR20177035675 A KR 20177035675A KR 20180009762 A KR20180009762 A KR 20180009762A
Authority
KR
South Korea
Prior art keywords
mirna
mrna
dna
homo sapiens
lung cancer
Prior art date
Application number
KR1020177035675A
Other languages
English (en)
Inventor
루이즈 씨. 쇼위
마이클 케이. 쇼위
안드레이 브이. 코센코프
Original Assignee
더 위스타 인스티튜트 오브 아나토미 앤드 바이올로지
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 더 위스타 인스티튜트 오브 아나토미 앤드 바이올로지 filed Critical 더 위스타 인스티튜트 오브 아나토미 앤드 바이올로지
Publication of KR20180009762A publication Critical patent/KR20180009762A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/178Oligonucleotides characterized by their use miRNA, siRNA or ncRNA

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Medical Informatics (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Pathology (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Immunology (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Oncology (AREA)
  • Microbiology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Primary Health Care (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

폐암 또는 폐 질환의 진단을 위한 다중분석물질 조성물은 포유류 혈액 샘플로부터의 mRNA 유전자 전사체와 특이적으로 복합체 형성하거나, 이에 혼성화되거나, 이를 확인할 수 있는 핵산 서열, 폴리뉴클레오타이드 또는 올리고뉴클레오타이드로부터 선택된 리간드, 및 포유류 혈액 샘플로부터의 유전자의 miRNA와 특이적으로 복합체 형성하거나, 이에 혼성화되거나, 이를 확인할 수 있는 핵산 서열, 폴리뉴클레오타이드 또는 올리고뉴클레오타이드로부터 선택된 추가적인 리간드를 포함한다. 각각의 리간드 및 추가적인 리간드는 상이한 유전자 전사체 또는 miRNA에 결합하고, 확인된 유전자 전사체 및 miRNA는 폐암 또는 폐 질환의 병기의 특징적인 프로파일을 형성한다. 진단 및 평가를 위해 이러한 조성물을 사용하는 방법 및 이러한 조성물을 개발하기 위한 방법이 기재되어 있다.

Description

폐암을 진단하거나 검출하기 위한 방법 및 조성물
전자 형태로 제출된 자료의 참고에 의한 포함
출원인은 본 명세서와 함께 전자 형태로 제출된 서열 목록을 본 명세서에서 참고로 포함한다. 이 파일은 "WST155PCT_ST25.txt"라 표기되고, 이것은 2016년 5월 19일자로 생성되었고 43KB이다.
정부 이익의 성명
본 발명은 국립 보건원이 부여한 허가 P30 CA010815호 하에 정부 지원으로 이루어졌다. 정부는 본 발명에 소정의 권한을 가진다.
폐암은, 매년 약 220,000건의 새로 진단된 사례 또는 모든 암 진단의 약 13%를 차지하는, 암 사망률의 가장 흔한 세계적인 원인이다. 모든 암 사망의 27% 초과가 매년 약 150,000건의 사망인 폐암으로 인한다. 현재의 진단 비율은 후기 단계이고, 즉 진단의 70% 초과는 III 병기이고, 이러한 폐암의 불과 15% 및 이것 초과가 초기의 치료 가능한 병기, 즉 I 또는 IIA 병기에 진단된다. 폐암에 대한 생존율은 전체적으로 질환의 초기 단계에서의 진단에 대한 50% 초과의 5년 생존율과 비교하여 약 18%의 5년 생존율이다.
비소세포 폐암(non-small cell lung cancer: NSCLC)은 조기 검출, 이어서 수술에 의해 오직 가능한 치유로 매우 치사인 질환이다. 불행하게도, 진단의 시기에 폐암을 가지는 환자의 불과 15%가 국재화된 질환을 가진다. 폐 상피가 담배 연기에 대한 노출 후 돌연변이되는 구역 암화는 조기 폐암을 가지는 흡연자로부터 흡연자를 구별하는 유전적 변화를 확인하는 것이 어렵게 한다. 폐암 생존을 개선하는 데 있어서 가장 중요한 장기간 목표 중 하나는, 초기 단계에서 모든 폐암 사례의 대부분을 나타내지만, 이들이 여전히 수술적으로 절제 가능한, 주로 흡연자 및 이전의 흡연자인 환자에서의 악성 종양의 검출을 달성하는 것이다. 현재, 악성 결절로부터 양성을 구별하는 유일한 방식은 비침습적 생검, 수술 또는 반복된 스캐닝에 의한 연장된 관찰이다. 초기 진단에 대한 접근법은 CT 스캔, 기관지 찰과법, 및 질환의 바이오마커에 대한 가래, 혈장 및 혈액의 분석과 같은 과정을 수반한다.
유전적 진단의 목표를 달성하기 위한 확립되고 검증된 일 방법은 종양 조직으로부터의 마이크로어레이 서명의 사용이다. 말초 혈액 단핵 세포(peripheral blood mononuclear cell: PBMC) 프로파일은 암을 포함하는 전신 질환을 진단하고 분류하고, 치료학적 반응을 모니터링하도록 사용될 수 있다. 암을 가지는 환자에서 PBMC 유전자 발현 프로파일을 사용하는 것의 타당성은 정상 대조군과 비교하여 후기 단계 신장 세포 암종을 가지는 환자로부터의 PBMC를 비교하기 위해 마이크로어레이의 사용에서 이전에 보고되었다. 82%의 정확성으로 말초 혈액 샘플로부터 조기 유방암을 검출하기 위해 37개의 유전자 분류자가 개발되었다. 또 다른 연구는 치료에 반응하여 상관되는 대장직장암 환자의 PBMC에서 유전자 발현 프로파일을 확인하였다. 본 발명자들은 또한 환자 PBMC에서 질환에 대한 29개의 유전자 분류자를 결정하였다(예를 들어, 미국 특허 제8,476,420호(본 명세서에 참고로 포함됨) 참조).
마이크로RNA(miRNA)는 곤충, 미생물, 인간, 동물 및 식물로부터 단리되고 확인된 비코딩 리보핵산 서열의 큰 군이고, 이것은 웰컴 트러스트 생어 연구소(The Wellcome Trust Sanger Institute)의 것을 포함하는 데이타베이스에 보고되어 있다(http://miRNA.sanger.ac.uk/sequences/). 이 miRNA는 약 22개 길이의 뉴클레오타이드이고 더 긴 전구체로부터 생기고, 이 전구체는 비단백질 코딩 유전자로부터 전사된다. 전구체는 자가 상보성 영역에서 혼자서 뒤로 폴딩하는 구조를 형성한다. miRNA의 기능적 역할에 대해서는 비교적 적게 알려졌고, 이의 표적에 대해서는 심지어 거의 덜 알려졌다. miRNA 분자가 이의 표적과의 정확한 또는 부정확한 염기 쌍 지음을 통해 유전자 번역을 방해하거나 억제한다고 생각된다(US 공개 특허 출원 제2004/0175732호). 생물정보학 분석은 임의의 소정의 miRNA가 700개까지의 상이한 유전자에 결합하고 이의 발현을 변경할 수 있고; 단일 유전자가 몇몇 miRNA에 의해 조절될 수 있다는 것을 제안한다. miRNA 및 표적 유전자 중에 복잡하게 된 상호 조절 네트워크가 어떤 유전자가 소정의 miRNA에 반응하여 실제로 부적절하게 조절될 수 있는지를 정확히 예측하는 것이 어렵게 한다는 것이 주목된다. 소정의 miRNA의 발현 수준은 다양한 암과 연관된다(Esquela-Kerscher and Slack, 2006 Nat. Rev. Cancer, 6(4):259-269; McManus 2003 Seminars in Cancer Biology, 13:253-258; Karube Y et al 2005 Cancer Sci, 96(2):111-5; Yanaihara N. et al 2006 Cancer Cell, 9(3):189-98).
본 발명자들은 이전에, 2009년 11월 6일에 출원된 국제 특허 출원 공보 제WO2010/054233호에서, 특이적으로 miRNA와 복합체 형성하거나, 이에 혼성화되거나, 이를 확인할 수 있는 리간드를 포함하는 진단학적 시약 또는 키트 및 특히 hsa-miR-148a, hsa-miR-142-5p, hsa-miR-221, hsa-miR-let-7d, hsa-miR-let-7a, hsa-miR-328, hsa-miR-let-7c, hsa-miR-34a, hsa-miR-202, hsa-miR-769-5p, hsa-miR-642의 다양한 조합을 포함하는 miRNA 프로파일을 개시하였다. 이 시약 및 키트는 대상체의 전혈 또는 말초 혈액 단핵 세포에서 miRNA 발현 수준 또는 이 miRNA의 프로파일을 확인함으로써 포유류 대상체에서 폐암을 진단하거나 검출하는 방법에서 유용하다.
다양한 폐암 및 다른 폐 질환의 조기 진단을 수월하게 하기 위한 새롭고 효과적인 도구에 대한 수요가 당해 분야에 존재한다.
일 양태에서, 다중분석물질 조성물(multi-analyte composition)은 폐암 또는 폐 질환을 가지는 것으로 의심되는 포유류 대상체의 진단 또는 평가를 위해 제공된다. 이 조성물은 시약 또는 키트이고, 포유류 생물학적 샘플에서 소정의 mRNA(유전자 전사체) 및 비코딩 miRNA의 발현의 변화의 확인을 허용하는 리간드를 포함한다. 이 선택된 코딩 서열 및 비코딩 서열의 조합된 변화는 폐암 또는 폐 질환의 존재, 병기 또는 진행에 반응하여 변하는 서열의 프로파일 또는 분류의 확인을 허용한다.
일 실시형태에서, 리간드는 하기 표 1에 제공된 소정의 mRNA 및 miRNA에 결합하는 프로브이다.
또 다른 양태에서, 폐암 또는 폐 질환의 존재, 병기 또는 진행을 진단하기 위해 다중분석물질 조성물을 사용하는 방법이 제공된다.
더욱 추가의 양태에서, 폐암, 폐 질환, 또는 이의 병기 또는 하위유형의 진단을 허용하는, 특징적인 폐암 분류 또는 조합된 mRNA 및 miRNA 프로파일을 개발하기 위한 방법이 제공된다.
또 다른 양태에서, 폐암을 가지는 대상체와 양성 결절을 가지는 대상체를 구별하기 위한 검정의 민감도 및 특이성을 증가시키는 방법이 제공된다.
또 다른 양태에서, 시약 또는 키트이고, 포유류 생물학적 샘플에서 소정의 mRNA 표적(유전자 전사체)의 발현의 변화의 확인을 허용하는 리간드를 포함하는, 폐암 또는 폐 질환을 가지는 것으로 의심되는 포유류 대상체의 진단 또는 평가를 위한 다중분석물질 조성물이 제공된다. mRNA 표적은 본 명세서에서 표 1, 2 및 3으로부터 선택된 다수의 표적이다.
이 조성물 및 방법의 다른 양태 및 이점은 이의 바람직한 실시형태의 하기 상세한 설명에서 추가로 기재되어 있다.
도 1은 증가하는 크기의 훈련 세트를 위한 오차율의 평가치를 보여주는 그래프이다. 멱함수 곡선은 전체 데이터로부터의 상이한 훈련 세트 크기를 선택함으로써 작도된다. MAD: 50개의 재샘플링에 걸친 중앙치 절대 편차. 멱함수 곡선은 방법에 기재된 샘플의 본 발명자들의 예비 연구에 대해 개발되었다. 전체 데이터로부터의 상이한 훈련 세트 크기를 선택하고, 그 데이터에 대한 분류의 상응하는 오차율에 대해 이것을 작도함으로써 멱함수를 작도하였다. 훈련에 사용된 샘플의 수와 오차율 사이의 관계식은, 훈련 세트 크기를 증가시킴으로써, 본 발명자들이 결절을 가지는 대조군 및 갖지 않는 대조군에 대한 NSCLC의 분류에서 더 높은 정확성을 달성할 수 있다는 것을 보여준다. 90% 분류 정확성은 대략 550개의 샘플을 함유하는 훈련 세트를 사용하여 달성될 수 있다. 예에서 훈련에 사용된 242개의 샘플에 대한 결과는 곡선에서 녹색으로 표시되고; 이 분석의 오차율은 0.17이고, 본 발명자들의 조기의 예측으로 표적에서 오른쪽에 있다. MAD: 50개의 재샘플링에 걸친 중앙치 절대 편차.
도 2는 실시예 3의 조합된 분류자를 위한 ROC AUC를 보여주는 그래프이다. 이 데이터는 242개의 훈련 샘플 및 103개의 시험 샘플, 예를 들어 암 대 대조군을 사용하여 얻어졌다. 정확성 비교는 오직 79%에서의 mRNA, 오직 71%에서의 miRNA, 그러나 83%에서의 mRNA 및 miRNA의 조합을 보여준다. 검정의 민감도은 76%이었다. 검정의 특이성은 88%이고, ROC AUC는 0.88이었다. 암 대상체(n=54); 대조군(n=49).
도 3은 분류자에 의해 배정된 독립적인 시험 세트로부터의 각각의 샘플에 대한 개별 점수를 보여주는 서포트 벡터 머신(Support Vector Machine: SVM)이다. 각각의 샘플은 SVM 분류자에 의해 배정된 점수를 받았다. 양의 점수는 암으로서 및 음의 점수는 대조군으로서 분류를 나타낸다. 각각의 열은 환자를 나타내고, 열의 높이는 분류의 강도 또는 신뢰도의 측정치로서 해석될 수 있다. 도시된 분류는 분류를 위한 전통적인 0점 컷오프를 사용한다. 민감도는 73.5%에서의 특이성으로 92.6%에서 최대화한다. SVM 분석은 각각이 얼마나 잘 분류되는지의 측정치인 점수를 각각의 샘플에 배정한다.
도 4는 폐 질환의 진단을 위한 mRNA 및 miRNA 표적을 포함하는 분류자를 개발하는 데 사용되는 생물학적 샘플의 수 및 평가를 입증하는 흐름도이다.
본 발명자들은 전진 변수 선택(forward feature selection)을 가지는 SVM인 분류를 위한 알고리즘을 개발하였다. 독립적인 분류자를 개발하고, 진단을 하기 위해 오로지 mRNA 또는 오로지 miRNA를 사용하는 것을 능가하는 정확성의 상승작용 수준을 입증하도록 별도로 mRNA 및 miRNA를 분석하였다. 개선된 정확성을 가지는 진단을 허용하는, 코딩 변수 및 비코딩 변수를 조합함으로써 조합된 분류자를 개발하였다.
조합된 mRNA 및/또는 miRNA 발현(조합된 분류자)은 오직 miRNA 결과를 사용하는 예비 PBMC와 비교하여 더 정확하다. 다중분석물질 분류자는 더 튼튼하다. 분류에 더 많은 변수가 필요하고, 이 변수 숫자는 더 큰 훈련 세트에 의해 감소할 수 있지만, 숫자는 잠재적인 개발 플랫폼, 예컨대 나노스트링(Nanostring)(Nanostring Technologies, Inc.(워싱턴주 시애틀)) 및 PCR 어레이와 필적한다.
본 명세서에 기재된 방법 및 조성물은, 병태, 예컨대 폐 질환의 치료에 대한 반응의 검출, 진단 및 모니터링을 위한 생물학적 유체의 스크리닝에 대해, 선택된 유전자 전사체(mRNA)의 조합된 검출 및 선택된 miRNA(비코딩) 발현 기술의 검출을 적용한다. 소정의 실시형태에서, 폐 질환은 NSCLC 또는 COPD이다. 다른 실시형태에서, 질환은 양성 결절의 존재이다. 더욱 다른 폐 질환은 본 명세서에 기재된 조성물을 사용하여 진단된다. 본 명세서에 기재된 조성물 및 방법은 생물학적 샘플로부터 유래한 조합된 특징적인 유전자 전사체(mRNA) 및 특징적인 miRNA 또는 miRNA 발현 프로파일(비코딩)의 변화를 결정함으로써 일반적으로 병태 또는 질환 또는 이의 병기, 및 특히 폐암 및 COPD의 진단 또는 검출을 허용한다. 샘플은 다양한 실시형태에서 포유류, 바람직하게는 인간, 대상체의 전혈, 혈청 또는 혈장을 포함한다. mRNA 표적 및 miRNA 표적 둘 다의 발현의 조합된 변화는, 유용한 진단을 제공하기 위해 동일한 종류의 다수의 대상체(예를 들어, 폐암 또는 COPD의 소정의 유형 및 병기, 또는 유형 및 병기의 혼합을 가지는 환자)의 프로파일을 이들 개체가 구별되어야 하는 종류의 다수의 대상체와 비교함으로써, 확립된다.
폐 질환 스크리닝의 이 방법은, 전립선 특이적 항원이 전립선암의 진행을 진단하고 따르는 것을 돕도록 사용되는 것과 더욱 동일한 방식으로, 추가의 연구, 예컨대 흉부 방사선 또는 CT 스캔을 얻기 위해, 환자 및 의사에게 경보하는 조합된 mRNA 및 miRNA 발현 프로파일링을 사용하여, 단순하고 비용 효과적이고 비침습적인 혈액 시험을 수행하기에 적합한 조성물을 사용한다. 본 명세서에 기재된 mRNA 및 miRNA 발현 수준 및 프로파일은 이 진단학적 문제와 관련된 다양한 분류에 대한 기초를 제공한다. 이 필적한 수준 및 프로파일의 적용은 악성 대 비악성 질환에 대한 초기 시험에 의해 시작하여 폐 질환의 유형의 중첩하고 확증적인 진단을 제공한다.
조성물의 성분 및 방법
"환자" 또는 "대상체"는, 본 명세서에 사용된 바대로, 인간, 수의 또는 농장 동물, 가축 동물 또는 애완동물, 및 임상 조사에 보통 사용되는 동물을 포함하는 포유류 동물을 의미한다. 더 구체적으로, 이 방법 및 조성물의 대상체는 인간이다.
"리간드"는, 본 명세서에 사용된 바대로, 표적 mRNA 또는 miRNA의 검출 및 정량화를 허용하도록, 표적 mRNA 또는 miRNA에 혼성화되거나 결합하거나 그렇지 않으면 이것과 회합하는, 표지되거나 비표지된, 임의의 뉴클레오타이드 서열, 아미노산 서열, 항체, 프로브, 프라이머, 이의 단편 또는 임의의 전체(소분자 또는 화학 분자 또는 재조합 분자)를 의미한다.
"기준" 수준, 표준 또는 프로파일은, 본 명세서에 사용된 바대로, 기준 mRNA 및 miRNA의 소스를 의미한다. 일 실시형태에서, 기준 mRNA 및 miRNA 표준은 비소세포 폐암(NSCLC)을 가지는 기준 인간 대상체 또는 집단으로부터 선택된 생물학적 샘플로부터 얻어진다. 예를 들어, 일 실시형태에서, 사용된 기준 표준은 편평 세포 암종을 가지는 기준 인간 대상체 또는 인간 대상체의 집단 또는 편평 세포 암종을 가지는 다수의 대상체의 평균의 생물학적 샘플로부터 유도된 표준 또는 프로파일이다. 소정의 실시형태에서, 사용된 기준 표준은 초기 단계 편평 세포 암종을 가지는 기준 인간 대상체, 또는 다수의 대상체의 평균으로부터 유도된 표준 또는 프로파일이다. 또 다른 실시형태에서, 기준 표준은 선암을 가지는 기준 인간 대상체, 또는 다수의 대상체의 평균으로부터 유도된 표준 또는 프로파일이다. 또 다른 실시형태에서, 기준 표준은 초기 단계 선암을 가지는 기준 인간 대상체, 또는 다수의 대상체의 평균의 생물학적 샘플로부터 유도된 표준 또는 프로파일이다.
또 다른 실시형태에서, 기준 mRNA 및 miRNA 표준은 COPD 또는 몇몇 다른 폐 질환을 가지는 기준 인간 대상체 또는 집단으로부터 선택된 생물학적 샘플로부터 얻어진다. 예를 들어, 기준 표준은 COPD를 가지는 기준 인간 대상체, 또는 다수의 대상체의 평균의 생물학적 샘플로부터 유도된 표준 또는 프로파일이다. 일 실시형태에서, 기준 mRNA 및 miRNA 표준은 건강하고 결코 흡연하지 않는 기준 인간 대상체 또는 집단으로부터 선택된 생물학적 샘플로부터 얻어진다. 예를 들어, 기준 표준은 건강하고 결코 흡연하지 않는 기준 인간 대상체, 또는 다수의 대상체의 평균의 생물학적 샘플로부터 유도된 표준 또는 프로파일이다. 일 실시형태에서, 기준 mRNA 및 miRNA 표준은 질환이 없는 이전의 흡연자 또는 현재의 흡연자인 기준 인간 대상체 또는 집단으로부터 선택된 생물학적 샘플로부터 얻어진다. 예를 들어, 기준 표준은 질환이 없는 이전의 흡연자 또는 현재의 흡연자인 기준 인간 대상체, 또는 다수의 대상체의 평균으로부터 유도된 표준 또는 프로파일이다.
일 실시형태에서, 기준 mRNA 및 miRNA 표준은 양성 폐 결절을 가지는 기준 인간 대상체 또는 집단으로부터 선택된 생물학적 샘플로부터 얻어진다. 예를 들어, 기준 표준은 양성 폐 결절을 가지는 기준 인간 대상체, 또는 다수의 대상체의 평균의 생물학적 샘플로부터 유도된 표준 또는 프로파일이다. 일 실시형태에서, 기준 mRNA 및 miRNA 표준은 NSCLC 종양의 수술적 제거 후의 기준 인간 대상체 또는 집단으로부터 선택된 생물학적 샘플로부터 얻어진다. 일 실시형태에서, 기준 mRNA 및 miRNA 표준은 NSCLC 종양의 수술적 제거 전의 기준 인간 대상체 또는 집단으로부터 선택된 생물학적 샘플로부터 얻어진다. 일 실시형태에서, 기준 mRNA 및 miRNA 표준은 일시적으로 조기의 생물학적 샘플을 제공한 동일한 대상체로부터 선택된 생물학적 샘플로부터 얻어진다. 또 다른 실시형태에서, 기준 표준은 상기 기준 표준의 2개 이상의 조합이다.
기준 표준은, 다양한 실시형태에서, 기준 대상체 또는 기준 집단으로부터 유도된 평균, 평균값, 산술 평균 또는 산술 평균의 범위, 숫자 패턴, 그래프 패턴 또는 miRNA 또는 mRNA 또는 유전자 발현 프로파일이다. 기준 표준, 기준 집단, mRNA 수준 또는 프로파일 또는 miRNA 수준 또는 프로파일의 특정한 종류의 선택은 의사가 진단학적/모니터링 방법 및 조성물을 취하는 사용에 따라 달라진다.
"샘플" 또는 "생물학적 샘플"은, 본 명세서에 사용된 바대로, 면역 세포 및/또는 암 세포를 함유하는 임의의 생물학적 유체 또는 조직을 의미한다. 일 실시형태에서, 적합한 샘플은 전혈이다. 또 다른 실시형태에서, 샘플은 정맥 혈액일 수 있다. 또 다른 실시형태에서, 샘플은 동맥 혈액일 수 있다. 또 다른 실시형태에서, 본 명세서에 기재된 방법에서 사용하기에 적합한 샘플은 말초 혈액, 더 구체적으로 말초 혈액 단핵 세포를 포함한다. 다른 유용한 생물학적 샘플은, 제한 없이, 전혈, 혈장 또는 혈청을 포함한다. 더욱 다른 실시형태에서, 샘플은 폐 질환을 가지는 것으로 의심되는 대상체로부터의 타액, 뇨, 활액, 골수, 뇌척수액, 질액, 자궁경부 점액, 코 분비물, 가래, 정액, 양수, 기관지 폐포 세척액 및 다른 세포 삼출액이다. 이러한 샘플은 식염수, 완충제 또는 생리학적으로 허용 가능한 희석제에 의해 추가로 희석될 수 있다. 대안적으로, 이러한 샘플은 종래의 수단에 의해 농축된다. 본 명세서에 걸쳐 임의의 하나의 생물학적 샘플에 대한 사용 또는 언급은 오직 예시적인 것으로 이해되어야 한다. 예를 들어, 본 명세서에서 샘플이 전혈로 언급될 때, 다른 샘플, 예를 들어 혈청, 혈장 등이 동일한 방식으로 또한 사용될 수 있는 것으로 이해된다.
일 실시형태에서, 생물학적 샘플은 전혈이고, 상기 방법은 PaxGene Blood RNA Workflow 시스템(Qiagen)을 사용한다. 이 시스템은 혈액 수집(예를 들어, 단일 채혈) 및 RNA 안정화, 이어서 수송 및 저장, 이어서 전체 RNA의 정제 및 분자 RNA 시험을 수반한다. 이 시스템은 즉각적인 RNA 안정화 및 일정한 채혈 용적을 제공한다. 혈액은 의사 사무실 또는 클리닉에서 채혈되고, 시편은 동일한 관에서 운반되고 저장될 수 있다. 단기간 RNA 안정성은 18-25℃에서 3일 또는 2-8℃에서 5일이다. 장기간 RNA 안정성은 -20 내지 -70℃에서 4년이다. 이 샘플 수집 시스템은 사용자가 전혈에서 유전자 발현 및 miRNA 발현에 대한 데이터를 신뢰하게 얻도록 허용한다. 일 실시형태에서, 생물학적 샘플은 전혈이다. PAXgene 시스템이 생물학적 샘플 소스로서 PBMC의 사용보다 더 많은 노이즈를 가지지만, PAXgene 샘플 수집의 이익은 문제보다 더 크다. 노이즈는 생물정보학적으로 공제될 수 있다.
"면역 세포"는, 본 명세서에 사용된 바대로, B 림프구, T 림프구, NK 세포, 대식세포, 비만 세포, 단핵구 및 수지상 세포를 의미한다.
본 명세서에 사용된 바대로, 용어 "병태"는 질환, 예컨대 폐 질환, 폐암의 부재(건강한 상태) 또는 존재, 폐에서의 양성 결절 또는 양성 종양 성장, 만성 폐쇄성 폐 질환(연관 암을 갖거나 갖지 않음)의 존재, 수술 전의 암성 폐 종양의 존재, 암성 폐 종양의 제거 후의 수술 후 상태를 의미한다. 기재된 경우, 임의의 이러한 병태는 흡연 또는 비흡연과 연관될 수 있다.
본 명세서에 사용된 바대로, 용어 "폐 질환"은 흡연 또는 심지어 폐 조직에서의 일부 다른 불리한 사건으로 인한 폐암 또는 만성 폐쇄성 폐 질환, 또는 폐 결절 또는 폐 병변의 존재를 의미한다.
본 명세서에 사용된 바대로, 용어 "암"은 조절되지 않는 세포 성장을 통상적으로 특징으로 하는 포유류에서의 생리학적 병태를 의미하거나 기술한다. 더 구체적으로, 본 명세서에 사용된 바대로, 용어 "암"은 임의의 폐암을 의미한다. 일 실시형태에서, 폐암은 비소세포 폐암(NSCLC)이다. 더 구체적인 실시형태에서, 폐암 유형은 폐 선암(AC)이다. 또 다른 실시형태에서, 폐암 유형은 폐 편평 세포 암종(SCC)이다. 또 다른 실시형태에서, 폐암은 "초기 단계"(I 또는 II) NSCLC이다. 훨씬 또 다른 실시형태에서, 폐암은 "후기 단계"(III 또는 IV) NSCLC이다. 훨씬 또 다른 실시형태에서, 폐암은 NSCLC의 초기 및 후기 단계 및 유형의 혼합이다.
용어 "종양"은, 본 명세서에 사용된 바대로, 악성 또는 양성이든, 모든 신생물 세포 성장 및 증식, 및 모든 전암성 및 암성 세포 및 조직을 의미한다.
"진단" 또는 "평가"에 의해 폐암의 진단, 폐암의 병기의 진단, 폐암의 유형 또는 분류의 진단, 폐암의 재발의 진단 또는 검출, 폐암의 퇴행의 진단 또는 검출, 폐암의 예후, 수술적 또는 비수술적 치료에 대한 폐암의 반응의 평가, 또는 양성 폐 결절의 진단을 의미한다.
"발현의 변화"에 의해 기준 또는 대조군과 비교하여 1개 이상의 선택된 유전자 전사체(RNA) 또는 miRNA의 상향조절; 기준 또는 대조군과 비교하여 1개 이상의 선택된 유전자 또는 miRNA의 하향조절; 또는 소정의 상향조절된 유전자 또는 miRNA 및 하향조절된 유전자 또는 miRNA의 조합을 의미한다.
"치료학적 시약" 또는 "섭생"에 의해 고형 종양을 가지거나 가지지 않는 암의 치료에 사용된 임의의 유형의 치료, 예컨대, 제한 없이, 화학치료학적 의약품, 생물학적 반응 변형제, 방사선, 식이, 비타민 치료, 호르몬 치료, 유전자 치료, 수술적 절제 등을 의미한다.
"선택된 또는 기재된" mRNA 또는 "선택된 또는 기재된" miRNA에 의해, 본 명세서에 사용된 바대로, 조합된 발현이 특징적으로 병태, 예컨대 폐 질환 또는 폐암의 존재 하에 (상향조절 또는 하향조절 방식으로) 변하는 mRNA 및 miRNA 서열을 의미한다. 일 실시형태에서, 선택된 mRNA 및 miRNA는 표 1-3에 보고된 것이다. 통계적으로 유의적인 수의 이러한 유익한 mRNA 및 miRNA는 상기 방법 및 조성물에서 사용하기 위한 적합한 조합된 mRNA 및 miRNA 발현 프로파일을 형성한다. 통계적으로 유의적인 수는 시험된 기준 집단의 2개 이상 사이를 구별하도록 이의 능력에 기초하여 결정된다.
용어 "통계적으로 유의적인 수의 mRNA 및 miRNA"는 본 발명의 맥락에서 관찰된 조합된 mRNA 및 miRNA 발현의 변화의 정도에 따라 다르다. mRNA 및 miRNA 발현의 변화의 정도는 폐 질환 또는 암의 유형 및 암 또는 고형 종양의 크기 또는 분산과 같은 조건에 따라 변한다. 변화의 정도는 또한 개인의 면역 반응에 따라 변하고, 각각의 개인에 따른 변동에 놓인다. 기재된 mRNA 및 miRNA의 발현의 변화의 정도는 진단된 질환, 예를 들어 COPD 또는 NSCLC의 유형, 및 암 또는 고형 종양의 크기 또는 분산에 따라 변한다. 변화의 정도는 또한 개인의 면역 반응에 따라 변하고, 각각의 개인에 따른 변동에 놓인다. 예를 들어, 본 발명의 일 실시형태에서, 조합된 mRNA miRNA 또는 2개 초과의 이러한 mRNA 및 miRNA, 또는 심지어 3개 내지 약 119개 또는 145개 또는 200개 이상의 특징적인 조합된 mRNA 및 miRNA의 발현의 1.2배 이상의 증가 또는 감소의 변화는 통계적으로 유의미하다. 또 다른 실시형태에서, 조합된 mRNA 및 miRNA 또는 2개 초과의 이러한 mRNA 또는 miRNA, 또는 심지어 3개 내지 약 119개 이상의 특징적인 조합된 mRNA 및 miRNA의 발현의 예를 들어 1.5배 이상, 1.7배 초과 또는 2.0배 초과와 같은 증가 또는 감소의 더 큰 변화는 통계적으로 유의미하다. 이것은 고형 종양이 없는 암에 대해 특히 사실이다. 훨씬 대안적으로, mRNA 및 miRNA의 단일 조합이 mRNA 또는 miRNA를 보통 발현하지 않는 세포에서 상당히 상향조절되거나 발현되는 것으로 프로파일링되는 경우, 단일 mRNA 및/또는 miRNA의 이러한 상향조절은 단독으로 통계적으로 유의미할 수 있다. 반대로, mRNA 및 miRNA의 단일 조합이 mRNA 및 miRNA의 조합을 보통 발현하지 않는 세포에서 상당히 하향조절되거나 발현되지 않는 것으로 프로파일링되는 경우, 단일의 조합된 세트의 이러한 하향조절은 단독으로 통계적으로 유의미할 수 있다.
따라서, 본 명세서에 기재된 방법 및 조성물은 단일 프로파일에서 1개 내지 약 200개의 조합된 mRNA 및 miRNA의 발현 수준 또는 프로파일의 조사를 고려한다(표 1 및 표 2 참조). 또 다른 실시형태에서, 본 명세서에 기재된 방법 및 조성물은 단일 프로파일에서 (표 1에서 순위로) 1개 내지 약 119개의 조합된 mRNA 및 miRNA의 발현 수준 또는 프로파일의 조사를 고려한다. 또 다른 실시형태에서, 본 명세서에 기재된 방법 및 조성물은 단일 프로파일에서 (표 1에서 순위로) 1개 내지 약 145개의 조합된 mRNA 및 miRNA의 발현 수준 또는 프로파일의 조사를 고려한다. 또 다른 실시형태에서, 본 명세서에 기재된 방법 및 조성물은 단일 프로파일에서 (표 2에서 순위로) 1개 내지 약 147개의 조합된 mRNA 및 miRNA의 발현 수준 또는 프로파일의 조사를 고려한다. 또 다른 실시형태에서, 본 명세서에 기재된 방법 및 조성물은, 표 3에서 확인된 mRNA 및 miRNA를 가지는, 단일 프로파일에서 1개 내지 약 200개의 조합된 mRNA 및 miRNA의 발현 수준 또는 프로파일의 조사를 고려한다. 훨씬 또 다른 실시형태에서, 오직 표 1-3으로부터의 몇몇 mRNA 또는 표 1-3으로부터의 몇몇 miRNA의 조합은 폐암 또는 폐 질환을 가지는 환자를 진단하는 데 사용하기 위한 프로파일로서 유용하다.
일 실시형태에서, mRNA 및/또는 miRNA의 확인된 조합 중 하나의 발현 수준의 상당한 변화는 폐 질환과 같은 병태를 진단할 수 있다. 또 다른 실시형태에서, 확인된 mRNA 및/또는 miRNA의 2개의 발현 수준의 상당한 변화는 폐 질환과 같은 병태를 나타낼 수 있다. 또 다른 실시형태에서, 확인된 mRNA 및/또는 miRNA의 3개의 조합의 발현 수준의 상당한 변화는 폐 질환을 진단하거나 또 다른 병태를 나타낼 수 있다. mRNA 및/또는 miRNA의 조합은 발현 프로파일에서의 수와 동일할 필요는 없다. 예를 들어, 표 1의 처음에 순위화된 119개의 성분의 세트에서처럼, mRNA는 조합에서 miRNA를 수적으로 우세할 수 있다. 또 다른 실시형태에서, 확인된 mRNA 및/또는 miRNA의 4개 이상의 발현 수준의 상당한 변화는 폐 질환을 진단하거나 또 다른 병태를 나타낼 수 있다. 또 다른 실시형태에서, 표 1의 mRNA 및 miRNA의 확인된 조합의 적어도 10개, 적어도 50개, 적어도 100개, 적어도 약 119개 또는 적어도 약 145개(또는 임의의 이들 종점 사이의 임의의 정수)의 발현 수준의 상당한 변화는 폐 질환을 진단하거나 또 다른 병태를 나타낸다.
또 다른 실시형태에서, 확인된 mRNA 및/또는 miRNA의 4개 이상의 발현 수준의 상당한 변화는 폐 질환을 진단하거나 또 다른 병태를 나타낼 수 있다. 또 다른 실시형태에서, 표 2의 mRNA 및 miRNA의 확인된 조합의 적어도 10개, 적어도 50개, 적어도 100개, 적어도 약 120개 또는 적어도 약 147개(또는 임의의 이들 종점 사이의 임의의 정수)의 발현 수준의 상당한 변화는 폐 질환을 진단하거나 또 다른 병태를 나타낸다.
또 다른 실시형태에서, 표 3의 mRNA 및 miRNA의 확인된 조합의 적어도 10개, 적어도 15개, 적어도 20개(또는 임의의 이들 종점 사이의 임의의 정수)의 발현 수준의 상당한 변화는 폐 질환을 진단하거나 또 다른 병태를 나타낸다.
또 다른 실시형태에서, mRNA 및 miRNA의 선택된 조합의 약 15개의 발현 수준의 상당한 변화는 폐 질환을 진단하거나 또 다른 병태를 나타낼 수 있다. 또 다른 실시형태에서, mRNA 및 miRNA의 선택된 조합의 약 20개 내지 40개의 발현 수준의 상당한 변화는 폐 질환을 진단하거나 또 다른 병태를 나타낼 수 있다. miRNA 변화와 조합된 mRNA의 더욱 다른 수는 폐 질환의 진단에서 사용되거나 본 명세서에 교시된 바와 같은 또 다른 폐 병태를 나타낼 수 있다. 훨씬 추가의 실시형태에서, 폐 질환 또는 또 다른 병태를 진단하는 mRNA의 프로파일은 하기 표 1에서 2, 5, 7, 10, 12, 15, 17, 24, 26, 27, 31, 36, 40, 41, 46, 51, 57, 58, 63, 69, 78, 80, 85, 94, 101, 105, 107, 117, 118, 125 127, 128, 134 및 139로 순위화된 mRNA 중 5개 이상을 포함한다. mRNA 및/또는 miRNA의 더욱 다른 군은 표 1, 표 2 또는 표 3 내에 선택될 수 있다.
용어 "마이크로어레이"는 혼성화 가능한 어레이 요소의 순서화된 배열을 의미한다. 일 실시형태에서, 마이크로어레이는, 기질 상의, mRNA 및 miRNA의 기재된 조합에 혼성화되는 폴리뉴클레오타이드 프로브를 포함한다. 또 다른 실시형태에서, 마이크로어레이는, 임의로 기질 상에 부동화된, 다수의 프라이머 또는 항체를 포함한다.
본 명세서에 기재된 방법에 의해 진단 또는 검출에 필요한 mRNA 및/또는 miRNA의 조합의 발현의 변화는, 기준 대상체 또는 기준 표준에서의 이의 발현에 비해 병태를 가지거나 질환, 구체적으로 폐암 또는 NSCLC를 겪는 대상체에서 발현이 더 높거나 더 낮은 수준으로 활성화된 mRNA 또는 miRNA를 의미한다. mRNA 및 miRNA는 또한 동일한 질환 또는 병태의 상이한 병기에서 더 높거나 더 낮은 수준으로 발현될 수 있다. mRNA 및 miRNA의 구체적인 조합의 발현은 결코 흡연하지 않거나 현재의 또는 이전의 흡연자인 정상 대상체, 및 질환, 구체적으로 COPD, 양성 폐 결절, 또는 암을 겪는 대상체 사이에, 또는 동일한 질환의 다양한 병기 사이에 다르다. 특이적인 mRNA 및 miRNA의 발현은 폐암을 가지는 수술전 환자와 수술후 환자 사이에 다르다. miRNA 발현의 이러한 차이는 예를 들어, 정상 세포 및 이환 세포 중에서, 또는 상이한 질환 사건 또는 질환 병기를 겪은 세포 중에서 일시적 또는 세포 발현 패턴에서의 정량적 차이, 및 정성적 차이 둘 다를 포함한다. 본 발명의 목적을 위해, 기준 표준과 비교할 때 조합된 mRNA 및 miRNA 발현의 상당한 변화는, 대상체와 기준 표준 또는 프로파일 사이에 조합된 mRNA 및 miRNA 발현의 통계적으로 유의미한(p<0.05) 차이가 있을 때 존재하는 것으로 고려된다.
따라서, 일 실시형태에서, 폐암을 가지는 대상체와 양성 결절을 가지는 대상체 사이를 구별하기 위한 검정의 민감도 및 특이성을 증가시키는 방법이 제공된다. 상기 방법은 대상체로부터의 생물학적 유체 또는 조직 샘플을 얻는 단계; 포유류 생물학적 샘플로부터의 표 1, 표 2 또는 표 3 중의 1개 이상의 mRNA 유전자 전사체 표적과 특이적으로 복합체 형성하거나 이에 혼성화되거나, 이를 확인할 수 있는 핵산 서열, 폴리뉴클레오타이드 또는 올리고뉴클레오타이드로부터 선택된 적어도 1개의 리간드와 샘플을 접촉시킴으로써 1개 이상의 mRNA 표적(예를 들어, 하기 표 1, 표 2 또는 표 3의 mRNA 표적)이 샘플에 존재하는지를 검출하는 단계를 포함한다. 상기 방법의 또 다른 단계는 동일한 포유류 생물학적 샘플로부터의 표 1, 표 2 또는 표 3 중의 1개 이상의 miRNA 표적과 특이적으로 복합체 형성하거나 이에 혼성화되거나, 이를 확인할 수 있는 핵산 서열, 폴리뉴클레오타이드 또는 올리고뉴클레오타이드로부터 선택된 적어도 1개의 리간드와 샘플을 접촉시킴으로써 1개 이상의 miRNA 표적(예를 들어, 표 1, 표 2 또는 표 3의 miRNA 표적)이 샘플에 존재하는지를 검출하는 단계를 포함한다. 상기 방법에 사용된 각각의 리간드는 상이한 mRNA 표적 또는 miRNA 표적에 결합한다. 소정의 실시형태에서, miRNA 표적과의 mRNA 표적 둘 다의 검출의 조합은 진단의 더 큰 민감도 또는 특이성 또는 둘 다를 허용한다. 일 실시형태에서, 상기 방법은 대상체가 폐암 또는 양성 결절을 가지는지를 확인하는 것의 정확성의 증가를 허용한다. 또 다른 실시형태에서, 상기 방법은 폐암을 가지는 대상체와 결절이 없는 흡연자인 대상체 사이를 구별하는 것의 정확성을 증가시킨다. 흡연자는 비암 장애에 특징적인 다른 증상을 가질 수 있다. 하기 예를 참조한다.
표 1은 기준 표준, 특히 건강한 대상체 또는 건강하지 않은 대상체, 예컨대 폐 질환을 가지는 대상체로부터 폐암 또는 폐 질환을 가지는 환자를 진단하는 데 사용하기 위한 조합된 mRNA 및/또는 miRNA 프로파일을 형성하는 데 유용한 145개의 mRNA 및 miRNA의 목록을 확인시켜준다. 145개의 혼합된 서열의 이 세트는 하기 예에서 표 5에 참조된 결절을 가지는 환자(NOD) 및 결절을 가지지 않는 흡연자(SC)에 대해 폐암의 비교에서 참조된다. 표 1은 대조군 SVM 분류자 훈련에 대해 암에서의 FFS 절차에 의해 선택된 순위화된 변수(mRNA 및 miRNA)의 목록이다. miRNA는 별표로 표시된다. mRNA는 NCBI 수탁 번호에 의해 확인되고; miRNA는 ABI OpenArray 식별자 번호(OA#)에 의해 확인된다. 이 서열은 공중에게 이용 가능하다. 표적 서열에 대한 서열 번호는 순위 번호와 상응하고, 각각 서열 번호 1 내지 145이다. 표 1의 열(순위 및 서열 번호)에 기재된 바대로, 순위 및 서열 번호는 동일한 방식이다. mRNA로부터의 다른 표적 서열은 유사하게 사용될 수 있다고 이해되어야 한다.
Figure pct00001
Figure pct00002
Figure pct00003
Figure pct00004
Figure pct00005
Figure pct00006
Figure pct00007
Figure pct00008
Figure pct00009
Figure pct00010
Figure pct00011
표 2는 기준 표준, 특히 건강한 대상체 또는 건강하지 않은 대상체, 예컨대 폐 질환을 가지는 대상체로부터 폐암 또는 폐 질환을 가지는 환자를 진단하는 데 사용하기 위한 조합된 mRNA 및/또는 miRNA 프로파일을 형성하는 데 유용한 약 147개의 mRNA 및 miRNA의 목록을 확인시켜준다. 147개의 혼합된 서열의 이 세트는 하기 예에서 표 5에 참조된 결절을 가지는 환자(NOD)에 대해 폐암의 비교에서 참조된다. 표 2는 대조군 SVM 분류자 훈련에 대해 암에서의 FFS 절차에 의해 선택된 순위화된 변수(mRNA 및 miRNA)의 목록이다. mRNA는 NCBI 수탁 번호에 의해 확인되고; miRNA는 ABI OpenArray 식별자 번호(OA#)에 의해 확인된다. 하기 예에 사용된 표적 서열은 하기 표에 제공된다. 그러나, 수탁 번호에 의해 확인된 서열의 다른 부분은 유사한 방식으로 또한 사용될 수 있다. 이 서열은 공중에게 이용 가능하다. 표 2에서 표적 서열 1 내지 147에 대한 서열 번호는 각각 서열 번호 146 내지 292이고, 열 순위/서열 번호에서 확인된다. 이 서열은 공중에게 이용 가능하다.
Figure pct00012
Figure pct00013
Figure pct00014
Figure pct00015
Figure pct00016
Figure pct00017
Figure pct00018
Figure pct00019
Figure pct00020
Figure pct00021
Figure pct00022
표 3은 표 1 및 표 2의 mRNA 및 miRNA 세트 사이에 중첩하는 18개의 유전자 및 5개의 miRNA를 확인시켜준다.
Figure pct00023
표 1-3에서 확인된 유전자 및 miRNA는 공중에게 이용 가능하다. 당업자는 이 조성물 또는 mRNA 및 miRNA의 서열의 사용에 의해 여기에 혼성화되는 프로브 및 프라이머 서열을 용이하게 재현할 수 있다. 모든 이러한 서열은 종래의 소스, 예컨대 일루미나(Illumina), ABI 오픈어레이, 진뱅크(GenBank) 또는 NCBI 데이타베이스로부터 공중에게 이용 가능하다. www.mirbase.org로서 확인된 웹사이트는 또한 이러한 서열에 대한 또 다른 공중 소스이다.
본 명세서에 기재된 조성물 및 방법의 맥락에서, 임의의 특정한 조합된 세트에 수록된 조합된 mRNA 및 miRNA의 "적어도 2개", "적어도 5개" 등의 언급은 확인된 mRNA 및 miRNA의 임의의 및 모든 조합을 의미한다. 질환 프로파일에 대한 특이적인 mRNA 및 miRNA는 표 1 및 표 2에서처럼 순위 순서로 있을 필요는 없고, 본 명세서에서, 및/또는 표 3에서 확인된 mRNA 및 miRNA의 임의의 조합일 수 있다.
용어 "폴리뉴클레오타이드"는, 단수 또는 복수 형태로 사용될 때, 일반적으로 비변형된 RNA 또는 DNA 또는 변형된 RNA 또는 DNA일 수 있는 임의의 폴리리보뉴클레오타이드 또는 폴리데옥시리보뉴클레오타이드를 의미한다. 따라서, 예를 들면, 본 명세서에 정의된 바와 같은 폴리뉴클레오타이드는, 제한 없이, 단일 및 이중 가닥 DNA, 단일 및 이중 가닥 영역을 포함하는 DNA, 단일 및 이중 가닥 RNA, 및 단일 및 이중 가닥 영역을 포함하는 RNA, 단일 가닥 또는, 더 통상적으로, 이중 가닥일 수 있거나 단일 및 이중 가닥 영역을 포함하는 DNA 및 RNA를 포함하는 하이브리드 분자를 포함한다. 게다가, 용어 "폴리뉴클레오타이드"는, 본 명세서에 사용된 바대로, RNA 또는 DNA 또는 RNA 및 DNA 둘 다를 포함하는 삼중 가닥 영역을 의미한다. 이러한 영역에서의 가닥은 동일한 분자 또는 상이한 분자 유래일 수 있다. 영역은 하나 이상의 분자의 모두를 포함할 수 있지만, 더 통상적으로 오직 분자 중 몇몇의 영역을 포함한다. 삼중 나선 영역의 분자 중 하나는 대개 올리고뉴클레오타이드이다. 용어 "폴리뉴클레오타이드"는 구체적으로 cDNA를 포함한다. 상기 용어는 하나 이상의 변형된 염기를 함유하는 DNA(cDNA 포함) 및 RNA를 포함한다. 따라서, 안정성에 대해 또는 다른 이유로 변형된 골격을 가지는 DNA 또는 RNA는 상기 용어가 본 명세서에서 의도되는 것처럼 "폴리뉴클레오타이드"이다. 게다가, 드문 염기, 예컨대 이노신, 또는 변형된 염기, 예컨대 삼중수소의 염기를 포함하는, DNA 또는 RNA는 본 명세서에 정의된 바와 같은 용어 "폴리뉴클레오타이드" 내에 포함된다. 일반적으로, 용어 "폴리뉴클레오타이드"는 비변형된 폴리뉴클레오타이드의 모든 화학적으로, 효소로 및/또는 대사로 변형된 형태, 및 바이러스 및 세포, 예컨대 단순한 및 복잡한 세포에 특징적인 DNA 및 RNA의 화학 형태를 포함한다.
용어 "올리고뉴클레오타이드"는 비교적 짧은 폴리뉴클레오타이드, 예컨대, 제한 없이, 단일 가닥 데옥시리보뉴클레오타이드, 단일 또는 이중 가닥 리보뉴클레오타이드, RNA:DNA 하이브리드 및 이중 가닥 DNA를 의미한다. 올리고뉴클레오타이드, 예컨대 단일 가닥 DNA 프로브 올리고뉴클레오타이드는 예를 들어 상업적으로 구입 가능한 자동화 올리고뉴클레오타이드 합성장치를 사용하여 화학 방법에 의해 대개 합성된다. 그러나, 올리고뉴클레오타이드는 다양한 다른 방법, 예컨대 시험관내 재조합 DNA 매개된 기법에 의해 및 세포 및 유기체에서의 DNA의 발현에 의해 제조될 수 있다.
본 명세서에 사용된 바대로, 용어 "항체"는 2개의 경쇄 및 2개의 중쇄를 가지는 온전한 면역글로불린 또는 임의의 이들의 단편을 의미한다. 따라서, 단일의 단리된 항체 또는 단편은 다중클론 항체, 고친화도 다중클론 항체, 단일클론 항체, 합성 항체, 재조합 항체, 키메라 항체, 인간화된 항체 또는 인간 항체일 수 있다. 용어 "항체 단편"은 결코 온전하지 않은 항체 구조, 예컨대 제한 없이, 단리된 단일 항체 사슬, 단쇄 Fv 작제물, Fab 작제물, 경쇄 가변 또는 상보성 결정 영역(complementarity determining region: CDR) 서열 등을 의미한다.
상호 교환되어 사용되는, 용어 "차등적으로 발현된 유전자 전사체 또는 mRNA" 또는 "차등적으로 발현된 miRNA", "차등 발현" 및 이의 동의어는, 대조군 대상체에서의 이의 발현에 비해, 질환, 구체적으로 암, 예컨대 폐암을 겪는 대상체에서 발현이 더 높거나 더 낮은 수준으로 활성화된 유전자 또는 miRNA 서열을 의미한다. 상기 용어는 또한 동일한 질환의 상이한 병기에서 발현이 더 높거나 더 낮은 수준으로 활성화된 유전자 또는 miRNA를 포함한다. 차등적으로 발현된 유전자 또는 miRNA는 핵산 수준 또는 단백질 수준에서 활성화되거나 저해될 수 있거나, 상이한 폴리펩타이드 생성물을 발생시키도록 대안적인 스플라이싱에 놓일 수 있는 것으로 또한 이해된다. 이러한 차이는 예를 들어 mRNA 수준, 표면 발현, 폴리펩타이드의 분비 또는 다른 분할의 변화에 의해 입증될 수 있다. 차등 유전자 발현은 2개 이상의 유전자 또는 이의 유전자 생성물 사이의 발현의 비교, 또는 2개 이상의 유전자 또는 이의 유전자 생성물 사이의 발현의 비율의 비교, 또는 심지어 정상 대상체, 건강하지 않은 대조군과 질환, 구체적으로 암을 겪는 대상체 사이에, 또는 동일한 질환의 다양한 병기 사이에 다른 동일한 유전자의 2개의 상이하게 처리된 생성물의 비교를 포함할 수 있다. 차등 발현은 예를 들어, 정상 세포 및 이환 세포 중에서, 또는 상이한 질환 사건 또는 질환 병기를 겪은 세포 중에서 유전자 또는 이의 발현 생성물에서의 일시적 또는 세포 발현 패턴에서의 정량적 차이, 및 정성적 차이 둘 다를 포함한다. 본 발명의 목적을 위해, "차등 유전자 발현"은 대상체와 대조군 샘플 사이에 유전자 발현의 통계적으로 유의미한(p<0.05) 차이가 있을 때 존재하는 것으로 고려된다.
RNA 전사체와 관련하여 용어 "과발현"은, 시편에서의 모든 측정된 전사체일 수 있는, 기준 mRNA 또는 mRNA의 특정한 기준 세트의 수준으로 정규화에 의해 결정된 전사체의 수준을 의미하도록 사용된다.
구절 "증폭"은 유전자 또는 유전자 단편 또는 miRNA의 다수의 카피가 특정한 세포 또는 세포주에서 형성되는 과정을 의미한다. 이중으로 된 영역(증폭된 DNA의 스트레치)은 대개 "앰플리콘"이라 칭해진다. 보통, 생성된 메신저 RNA(mRNA)의 양, 즉 유전자 발현의 수준은 또한 발현되는 특정한 유전자로 이루어진 카피의 수의 비율이 증가한다.
용어 "예후"는 암이 원인일 수 있는 사망 또는 신생물 질환, 예컨대 폐암의 재발, 전이성 전파 및 약물 내성을 포함하는 진행의 가능성의 예측을 의미하도록 본 명세서에서 사용된다. 용어 "예측"은 환자가 약물 또는 일련의 약물에 양호하게 또는 불량하게 반응할 가능성, 및 또한 이 반응의 정도, 또는 1차 종양의 수술적 제거 및/또는 암 재발이 없는 소정의 기간 동안의 화학치료 후 환자가 생존할 것이라는 것을 의미하도록 본 명세서에서 사용된다. 본 발명의 예측 방법은 임의의 특정한 환자에 대한 가장 적절한 치료 양상을 선택함으로써 치료 결정을 만들도록 임상적으로 사용될 수 있다. 본 명세서에 기재된 예측 방법은 환자가 치료 섭생, 예컨대 수술적 중재, 소정의 약물 또는 약물 조합에 의한 화학치료, 및/또는 방사선 치료에 양호하게 반응할 것이라는 것, 또는 수술 및/또는 화학치료 또는 다른 치료 양상의 종료 후 환자의 장기간 생존이 있을지를 예측하는 데 있어서 귀중한 도구이다.
용어 "장기간" 생존은 수술 또는 다른 치료 후 적어도 1년, 더 바람직하게는 적어도 3년, 가장 바람직하게는 적어도 7년 동안 생존을 의미하도록 본 명세서에서 사용된다.
혼성화 반응의 "엄격성"은 당해 분야의 당업자에 의해 용이하게 결정 가능하고, 일반적으로 프로브 길이, 세척 온도 및 염 농도에 따른 경험상 계산이다. 일반적으로, 더 긴 프로브는 적절한 어닐링에 더 높은 온도를 요하는 반면, 더 짧은 프로브는 더 낮은 온도를 요한다. 혼성화는 일반적으로 상보성 가닥이 이의 용융 온도보다 낮은 환경에 존재할 때 변성된 DNA가 재어닐링하는 능력에 따라 달라진다. 프로브와 혼성화 가능한 서열 사이의 원하는 상동성의 정도가 더 높을수록, 사용될 수 있는 상대 온도가 더 높다. 그 결과, 더 높은 상대 온도가 반응 조건이 더 엄격하게 만드는 경향이 있는 반면, 더 낮은 온도는 덜 그렇다는 것이 뒤따른다. 다양한 공개된 교재는 혼성화 반응의 엄격성의 추가적인 세부사항 및 설명을 제공한다.
본 명세서에 기재된 조성물 및 방법의 맥락에서, 임의의 특정한 유전자 세트(예를 들어, 표 1, 표 2 또는 표 3)에 수록된 mRNA 및 miRNA의 "3개 이상", "적어도 5개" 등의 언급은 수록된 mRNA 및 miRNA의 임의의 하나 또는 임의의 및 모든 조합을 의미한다. 예를 들어, 적합한 조합된 mRNA 및 miRNA 발현 프로파일은 표 1, 표 2 및/또는 표 3으로부터의 적어도 3개 내지 145개의 mRNA 및 miRNA 사이의 임의의 수를 함유하는 프로파일을 포함한다. 일 실시형태에서, 표로부터 선택된 mRNA 및 miRNA에 의해 형성된 발현 프로파일은 바람직하게는 순위 순서로 사용되고, 예를 들어 목록의 상부에 순위화된 유전자는 시험에서 더 상당한 차별적인 결과를 입증하고, 따라서 더 낮게 순위화된 유전자보다 프로파일에서 더 상당할 수 있다. 그러나, 다른 실시형태에서, 유용한 유전자 프로파일을 형성하는 유전자는 순위 순서로 있을 필요가 없고, 각각의 표로부터의 임의의 유전자일 수 있다.
본 명세서에서의 다양한 실시형태가 "포함하는" 언어를 사용하여 제시되지만, 다양한 상황 하에, 관련 실시형태는 "이루어진" 또는 "본질적으로 이루어진" 언어를 사용하여 또한 기재된다고 이해되어야 한다. 용어 "일" 또는 "하나"가 하나 이상을 의미한다는 것에 주목되어야 하고, 예를 들어 "miRNA"는 1개 이상의 miRNA를 나타낸다고 이해된다. 그러므로, 용어 "일"(또는 "하나"), "하나 이상" 및 "적어도 하나"는 본 명세서에서 상호교환되어 사용된다.
본 명세서에서 달리 정의되지 않은 한, 본 명세서에 사용된 기술 용어 및 과학 용어는, 본원에 사용된 많은 용어에 대한 일반 가이드를 당해 분야의 당업자에게 제공하는 공개 문헌을 참고로, 본 발명이 속하는 당해 분야의 당업자가 흔히 이해하는 것과 동일한 의미를 가진다.
본 명세서에서 및 표 1, 표 2 및/또는 표 3의 유전자 수집의 사용을 통해 확인된 mRNA 및 miRNA 폐암 및 폐 질환 서명 또는 유전자 및 miRNA 발현 프로파일은 유전자 및 miRNA의 수를 감소시키거나 증가시키도록 추가로 최적화될 수 있고, 이에 따라 진단의 정확성을 증가시킨다.
유전자(mRNA) 발현 프로파일링 방법
본 명세서에 기재된 조성물 및 방법에서 유용한 프로파일을 생성하는 데 또는 본 명세서에 기재된 조성물을 사용하여 진단학적 단계를 수행하는 데 사용된 유전자(mRNA) 발현 프로파일링의 방법은 미국 특허 제7,081,340호 및 국제 특허 출원 공보 제WO2010/054233호(본 명세서에 참고로 포함됨)에 공지되어 있고 잘 요약되어 있다. 유전자 발현 프로파일링의 이러한 방법은 폴리뉴클레오타이드의 혼성화 분석에 기초한 방법, 폴리뉴클레오타이드의 서열분석에 기초한 방법 및 프로테오믹 기반 방법을 포함한다. 샘플에서의 mRNA 발현의 정량화를 위해 당해 분야에 공지된 가장 흔히 사용되는 방법은 노던 블로팅(northern blotting) 및 인시츄 혼성화; RNAe 보호 검정; 및 PCR 기반 방법, 예컨대 RT-PCR을 포함한다. 대안적으로, 특이적인 듀플렉스, 예컨대 DNA 듀플렉스, RNA 듀플렉스, 및 DNA-RNA 하이브리드 듀플렉스 또는 DNA-단백질 듀플렉스를 인식할 수 있는 항체를 사용할 수 있다. 서열분석 기반 유전자 발현 분석을 위한 대표적인 방법은 유전자 발현의 연속 분석(Serial Analysis of Gene Expression: SAGE) 및 대량 병렬 서명 서열분석(massively parallel signature sequencing: MPSS)에 의한 유전자 발현 분석을 포함한다.
간단히 기재하면, 가장 민감하고 가장 가요성인 정량적 방법은 RT-PCR이고, 이것은 유전자 발현의 패턴을 규명하기 위해, 가깝게 관련된 mRNA 사이를 구별하기 위해, 그리고 RNA 구조를 분석하기 위해 약물 치료에 의해 또는 이것 없이 상이한 샘플 집단에서 정상 조직 및 종양 조직에서의 mRNA 수준을 비교하도록 사용될 수 있다. 제1 단계는 표적 샘플로부터의 mRNA의 단리(예를 들어, 이 경우에 통상적으로 인간 PBMC로부터 단리된 전체 RNA)이다. mRNA는 예를 들어 냉동된 또는 보관된 파라핀 포매되고 고정된(예를 들어, 포르말린 고정된) 조직 샘플로부터 추출될 수 있다. RNA 단리는 제조사의 지시에 따라 상업용 제조사로부터 정제 키트, 완충제 세트 및 프로테아제를 사용하여 수행될 수 있다. 예시적인 상업용 제품은 TRI-REAGENT, Qiagen RNeasy 미니-칼럼, MasterPure Complete DNA 및 RNA 정제 키트(EPICENTRE(등록상표)(위스콘신주 매디슨)), 파라핀 블록 RNA 단리 키트(Ambion, Inc.) 및 RNA Stat-60(Tel-Test)을 포함한다. 종래의 기법, 예컨대 염화세슘 밀도 구배 원심분리를 또한 사용할 수 있다.
RT-PCR에 의한 유전자 발현 프로파일링에서의 제1 단계는 cDNA로의 RNA 주형의 역전사, 이어서 PCR 반응에서의 이의 기하급수적 증폭이다. 역전사 단계는 상황 및 발현 프로파일링의 목표에 따라 특이적인 프라이머, 랜덤 육합체, 또는 올리고-dT 프라이머를 사용하여 통상적으로 프라이밍된다. 예를 들어, 제품 GeneAmp RNA PCR 키트(Perkin Elmer(미국 캘리포니아주))에 동반된 제조사의 지시를 참조한다. 이후, 후속하는 RT-PCR 반응에서 유래한 cDNA를 주형으로서 사용할 수 있다.
PCR 단계는 일반적으로 열 안정한 DNA 의존적 DNA 중합효소, 예컨대 5'-3' 뉴클레아제 활성을 가지지만 3'-5' 교정 엔도뉴클레아제(proofreading endonuclease) 활성이 결여된 Taq DNA 중합효소, 예를 들어 TAQMAN(등록상표) PCR을 사용한다. 선택된 중합효소는 이의 표적 앰플리콘에 결합된 혼성화 프로브를 가수분해하고, 2개의 올리고뉴클레오타이드 프라이머는 앰플리콘을 생성한다. 바람직하게 표지된, 제3 올리고뉴클레오타이드 또는 프로브는 2개의 PCR 프라이머 사이에 위치한 뉴클레오타이드 서열을 검출하도록 설계된다. TaqMan(등록상표) RT-PCR은 상업적으로 구입 가능한 설비를 사용하여 수행될 수 있다.
실시간 PCR은 정량적인 경쟁적 PCR(여기서, 각각의 표적 서열에 대한 내부 경쟁자는 정상화에 사용됨), 및 샘플 내에 함유된 정상화 유전자, 또는 RT-PCR을 위한 하우스키핑 유전자를 사용한 정량적인 필적하는 PCR 둘 다에 알맞다. 또 다른 PCR 방법은 MassARRAY 기반 유전자 발현 프로파일링 방법(Sequenom, Inc.(캘리포니아주 샌 디에고))이다. 당해 분야에 공지되어 있고 유전자 발현 프로파일링에 사용될 수 있는 PCR 기반 기법의 더욱 다른 실시형태는 유전자 발현을 위한 신속한 검정에서 상업적으로 구입 가능한 Luminex100 LabMAP 시스템 및 다수의 색상 코딩된 마이크로구(Luminex Corp.(텍사스주 오스틴))를 사용한 예를 들어 차등 디스플레이, 증폭된 단편 길이 다형(iAFLP), 및 비드어레이(상표명) 기술(일루미나(캘리포니아주 샌 디에고)); 및 고 커버리지 발현 프로파일링(HiCEP) 분석을 포함한다.
RNA 발현 프로파일은 적혈구 및 과립구를 제거하기 위한 CPT 관, 피콜 구배 또는 동등한 밀도 분리를 이용한 원심분리 및 높은 통합성의 RNA를 얻기 위해 TRIZOL 트리-시약, RNALATER 시약 또는 유사한 시약을 사용한 후속하는 RNA의 추출에 의해 대상체의 혈액으로부터 얻어진다. 개별 메신저 RNA 종의 양은 마이크로어레이 및/또는 정량적 중합효소 사슬 반응을 이용하여 결정된다.
프로파일에 대한 RNA 발현 수준을 얻는 데 사용되는 다른 절차 중에, 계수가 유입 RNA 유전자 발현 값에 작용하는 수학 함수를 얻고 값이 개체의 종류 및 예측 신뢰도를 결정하는 "점수"를 출력하기 위해, 기계 학습 알고리즘, 예컨대 중복 변수 제거(Recursive Feature Elimination)(SVM-RFE)를 가지는 SVM 또는 다른 분류 알고리즘, 예컨대 벌점 판별 분석(Penalized Discriminant Analysis: PDA)(2004년 12월 9일에 공개된 국제 특허 출원 공보 제WO 2004/105573호 참조)의 분석 사용에 의한 RT-PCR이 있다. 구성원이 후속하여 구별되는 종류인 것으로 공지된 다수의 대상체의 분석에 의해 이 함수를 결정하면, 이것은 이의 질환 상태에 대해 대상체를 분류하도록 사용된다.
차등 유전자 발현은 국제 특허 출원 공보 제WO2010/054233호에 자세히 또한 기재된 마이크로어레이 기법을 이용하여 또한 확인되거나 확정될 수 있다. 따라서, 마이크로어레이 기술을 이용하여 새로운 또는 파라핀 포매된 조직에서 폐암/폐 질환 연관 유전자의 발현 프로파일을 측정할 수 있다. 이 방법에서, 관심 있는 폴리뉴클레오타이드 서열(cDNA 및 올리고뉴클레오타이드 포함)을 마이크로칩 또는 유기 기질에서 플레이팅하거나 정렬하였다. 이후, 정렬된 서열을 관심 있는 세포 또는 조직으로부터의 특이적인 DNA 프로브에 의해 혼성화된다. 마이크로칩에 부동화된 마이크로정렬된 유전자는 엄격한 조건 하에 혼성화에 적합하다. 칩에 적용된 표지된 cDNA 프로브는 어레이 상의 DNA의 각각의 스팟에 특이적으로 혼성화된다. 비특이적으로 결합한 않은 프로브를 제거하기 위한 엄격한 세척 후, 칩은 공초점 레이저 현미경에 의해 또는 또 다른 검출 방법, 예컨대 CCD 카메라에 의해 스캐닝된다. 각각의 정렬된 요소의 혼성화의 정량화는 상응하는 mRNA 풍부도의 평가를 허용한다. 마이크로어레이 분석은 제조사의 프로토콜에 따라 상업적으로 구입 가능한 설비에 의해 수행될 수 있다.
미국 특허 제7,081,340호에 요약되고, 본 명세서에 참고로 포함된 다른 유용한 방법은 유전자 발현의 연속 분석(SAGE) 및 대량 병렬 서명 서열분석(MPSS)을 포함한다.
면역조직화학 방법 및 프로테오믹 방법은 본 명세서에서 방법 및 조성물에서 사용하기 위해 기재된 유전자의 유전자 발현 생성물의 발현 수준을 검출하기에 또한 적합하고, 유전자 발현 프로파일링의 다른 방법에 대한 귀중한 보충물이고, 본 명세서에 기재된 조합된 유전자 및 miRNA 프로파일의 유전자 발현 생성물을 검출하기 위해 단독으로 또는 다른 방법과 조합되어 사용될 수 있다. 각각의 마커에 특이적인 항체 또는 항혈청, 바람직하게는 다중클론 항혈청, 가장 바람직하게는 단일클론 항체, 또는 다른 단백질-결합 리간드는 발현을 검출하기 위해 사용된다. 항체는 예를 들어 방사성 표지, 형광성 표지, 합텐 표지, 예컨대 바이오틴, 또는 효소, 예컨대 겨자무 과산화효소 또는 알칼리 포스파타제에 의한 항체 자체의 직접 표지화에 의해 검출될 수 있다. 대안적으로, 표지되지 않은 1차 항체는 1차 항체에 특이적인 표지된 2차 항체, 예컨대 항혈청, 다중클론 항혈청 또는 단일클론 항체와 함께 사용된다. 면역조직화학 분석을 위한 프로토콜 및 키트는 당해 분야에 널리 공지되어 있고, 상업적으로 구입 가능하다.
본 발명의 검정 및 방법을 수행하는 데 있어서, 이 정보에 기초하여 선택된 적절한 기준 프로파일, 및 진단 또는 치료 추천과 비교하여 조합된 mRNA 및 miRNA 프로파일, 및 환자의 프로파일에 대한 mRNA 발현 수준 성분을 얻기 위해 이 동일한 기법이 사용될 수 있다.
miRNA를 검출/정량화하기 위한 방법
miRNA 발현을 얻고 검출하고 정량화하기 위해 사용될 수 있는 방법은 공지되어 있고, 본 발명의 진단학적 목표를 달성하도록 사용될 수 있다. 예를 들어, 하기 실시예, 및 무엇보다도 예를 들어 국제 특허 출원 공보 제WO2008/073923호; 미국 공개 특허 출원 제2006/0134639호, 미국 특허 제6,040,138호 및 제8,476,420호에 기재된 기법을 참조한다.
예를 들어, 생물학적 샘플은 독점적 PaxGene Blood RNA 시스템(PreAnalytiX, Qiagen, BD company)을 사용하여 수집될 수 있다. PAXgene Blood 시스템은 PAXgene Blood RNA 관 및 PAXgene Blood RNA 키트의 2개의 통합 성분을 포함한다. 혈액 샘플은 표준 사혈 기법을 통해 PAXgene Blood RNA 관으로 직접적으로 채혈된다. 이 관은 세포내 RNA를 즉시 안정화시켜서, RNA 전사체의 생체외 분해 또는 상향조절을 최소화하는 독점적 시약을 함유한다. 뱃치 샘플을 냉동시키는 것을 제거하고, 수집 후 샘플을 처리하는 응급도를 최소화하는 능력은 실험실 효율을 크게 증대시키고 비용을 감소시킨다.
이후, miRNA는 다양한 검정을 이용하여 검출되고/되거나 측정된다. 가장 민감하고 가장 가요성인 정량적 방법은 실시간 중합효소 사슬 반응(RT-PCR)이고, 이것은 miRNA 발현의 패턴을 규명하기 위해, 가깝게 관련된 miRNA 사이를 구별하기 위해, 그리고 RNA 구조를 분석하기 위해 약물 치료에 의해 또는 이것 없이 상이한 샘플 집단에서 정상 조직 및 종양 조직에서의 miRNA 수준을 비교하도록 사용될 수 있다. 이 방법은 제조사의 지시에 따라 종래의 RT-PCR 검정 키트, 예컨대 TaqMan(등록상표) RT-PCR(Applied Biosystems)을 사용함으로써 사용될 수 있다.
제1 단계는 표적 샘플로부터의 RNA의 단리(예를 들어, 이 경우에 통상적으로 인간 전혈로부터 단리된 전체 RNA)이다. mRNA 추출에 대한 일반 방법은 당해 분야에, 예를 들어 분자 생물학의 표준 교재에 널리 공지되어 있다. RNA 단리는 제조사의 지시에 따라 상업용 제조사로부터의 정제 키트, 완충제 세트 및 프로테아제를 사용하여 수행될 수 있다. 예시적인 상업용 제품은 TRI-REAGENT, Siegen RNeasy 미니-칼럼, MASTERPURE Complete DNA 및 RNA 정제 키트(EPICENTRE(등록상표)(위스콘신주 매디슨)) 및 기타를 포함한다. 종래의 기법, 예컨대 염화세슘 밀도 구배 원심분리를 또한 사용할 수 있다.
역전사 단계에서, cDNA는 검출되는 miRNA에 특이적인 프라이머를 사용하여 mRNA 샘플로부터 역전사된다. 역전사를 위한 방법은 당해 분야에, 예를 들어 분자 생물학의 표준 교재에 널리 공지되어 있다. 간단히, RNA는 70℃에서 프라이머와 처음에 항온처리되어 RNA 2차 구조를 변성시키고, 이후 얼음에서 빨리 차갑게 되어서 프라이머가 RNA에 어닐링하게 한다. dNTP, RNase 저해제, 역전사효소 및 역전사 완충제를 포함하여 다른 성분은 반응에 첨가된다. 역전사 반응은 42℃에서 1시간 동안 연장된다. 이후, 반응은 70℃에서 가열되어 효소를 불활화한다.
RT-PCR 단계에서, PCR 생성물은 cDNA 샘플로부터 증폭된다. PCR 생성물 축적은 이중 표지된 형광성 프로브(즉, TAQMAN(등록상표) 프로브)를 통해 측정된다. 실시간 PCR은 정량적인 경쟁적 PCR(여기서, 각각의 표적 서열에 대한 내부 경쟁자는 정상화에 사용됨), 및 샘플 내에 함유된 정상화 miRNA, 또는 RT-PCR을 위한 하우스키핑 miRNA를 사용한 정량적인 필적하는 PCR 둘 다에 알맞다. 추가의 상세내용을 위해, 예를 들어 문헌[Held et al., Genome Research 6:986 994(1996)]을 참조한다. TaqMan(등록상표) RT-PCR은 상업적으로 구입 가능한 설비를 사용하여 수행될 수 있다. 샘플-대-샘플 변동의 오류 및 효과를 최소화하기 위해, RT-PCR은 내부 표준을 사용하여 보통 수행된다. 이상적인 내부 표준은 상이한 조직 중에 일정한 수준으로 발현되고, 실험적 처리에 의해 영향을 받지 않는다. miRNA 발현의 패턴을 정상화하기 위해 가장 흔히 사용되는 RNA는 하우스키핑 miRNA 글라이세르알데하이드-3-포스페이트-탈수소효소(GAPDH) 및 β-액틴에 대한 mRNA이다.
mRNA 단리, 정제, 프라이머 연장 및 증폭을 포함하는 RNA 소스로서 고정된, 파라핀 포매된 조직을 사용하여 miRNA 발현을 프로파일링하는 것으로부터 대표적인 프로토콜의 단계는 당해 분야의 당업자에게 공지되어 있다. 간단히, 대표적인 공정은 파라핀 포매된 종양 조직 샘플의 약 10㎛ 두께의 절편을 절단함으로써 시작한다. 이후, RNA는 추출되고, 단백질 및 DNA가 제거된다. RNA 농도의 분석 후, RNA 보수 및/또는 증폭 단계가 필요한 경우 포함될 수 있고, RNA는 miRNA 특이적 프로모터를 사용하여 역전사되고 이후 RT-PCR이 된다.
하기 실시예에서 확인된 구체적인 기법은 최신 기술을 입증한다. 그러나, miRNA 단리, 검출 및 정량화의 다른 종래의 방법이 이 방법에서 사용될 수 있다. miRNA를 검출하고/하거나 측정하는 더욱 다른 방법은 항체 또는 이의 단편을 사용하여 이용될 수 있다. miRNA에 결합하는 서열을 보유하는 재조합 분자가 이 방법에서 또한 사용될 수 있다. 본 명세서에 정의된 바와 같은 기재된 miRNA에 결합하는 임의의 항체, 항체 단편, 또는 이의 혼합물이, 항체 또는 항체 혼합물이 어떻게 생성되는지와 무관하게, 조합된 mRNA 및 miRNA 프로파일에 대한 miRNA 발현 수준을 얻기 위해 상기 방법에서 사용될 수 있다고 이해되어야 한다.
유사하게, miRNA 서열을 확인하기 위해 게놈 또는 다른 혼성화 프로브를 사용하는 방법이 본 명세서에서 유용하다. 또 다른 실시형태에서, 적합한 검정 검출 검정은 면역조직화학 검정, 혼성화 검정, 카운터 면역전기천공, 방사선면역검정, 방사선면역침전 검정, 도트 블롯 검정, 경쟁 검정의 저해 또는 샌드위치 검정이다.
상기 또는 본 명세서에서 달리 기재된 임의의 방법은 병태의 진단 또는 검출 또는 2개의 병태 사이의 구별에서 유용한 숫자 또는 그래프 데이터를 생성하는 컴퓨터 프로세서 또는 컴퓨터 프로그래밍된 기계에 의해 수행될 수 있다.
조성물
한정된 조합된 유전자(mRNA) 및 miRNA 발현 프로파일을 이용한 폐암 및 폐 질환을 진단하는 방법은 폐암, 예를 들어 NSCLC를 진단하거나, 폐암의 특이적인 병기(초기, I 병기, II 병기 또는 후기)를 진단하거나, 폐암의 특이적인 유형(예를 들어, AC 대 LSCC)을 진단하거나, 폐 질환의 유형, 예를 들어 COPD 또는 양성 폐 결절을 진단하거나, 암 또는 질환의 재발의 가능성의 추가의 치료 또는 평가의 결정을 위한 치료학적 또는 수술적 중재의 효과를 모니터링하기 위한, 단순화된 진단학적 도구의 개발을 허용한다.
따라서, 본 명세서에 기재된 바대로 포유류 대상체에서 이러한 진단 또는 평가를 위한 조성물은 키트 또는 시약일 수 있다. 예를 들어, 조성물의 일 실시형태는 mRNA 및 miRNA를 검출하고 정량화하기 위해 사용된 리간드가 고정화된 기질을 포함한다. 시약은, 일 실시형태에서, mRNA 또는 miRNA의 핵산 서열을 증폭시키고 검출하는 증폭 핵산 프라이머(예컨대 RNA 프라이머) 또는 프라이머 쌍이다. 또 다른 실시형태에서, 시약은 표적 서열에 혼성화되는 폴리뉴클레오타이드 프로브이다. 또 다른 실시형태에서, 시약은 항체 또는 항체의 단편이다. 시약은, 표 1, 표 2 또는 표 3의 적어도 1개의 mRNA 및 miRNA에 각각 특이적인, 다수의 상기 프라이머, 프로브 또는 항체를 포함할 수 있다. 임의로, 시약은 종래의 검출 가능한 표지와 회합될 수 있다. 본 명세서에 사용된 바대로, "표지" 또는 "리포터 분자"는 핵산(단일 뉴클레오타이드 포함), 폴리뉴클레오타이드, 올리고뉴클레오타이드, 또는 단백질 리간드, 예를 들어 아미노산 또는 항체를 표지하기에 유용한 화학 또는 생화학 모이어티이다. "표지" 및 "리포터 분자"는 형광성 물질, 화학발광성 물질, 색소생산성 물질, 켄칭제, 방사선핵종, 효소, 기질, 보인자, 저해제, 자기 입자, 및 당해 분야에 공지된 다른 모이어티를 포함한다. "표지" 또는 "리포터 분자"는 측정 가능한 신호를 생성할 수 있고, 올리고뉴클레오타이드 또는 뉴클레오타이드(예를 들어, 비천연 뉴클레오타이드) 또는 리간드에 공유로 또는 비공유로 연결될 수 있다.
또 다른 실시형태에서, 상기 조성물은 관련한 다수의 폴리뉴클레오타이드 또는 올리고뉴클레오타이드 프로브 또는 리간드, 이들에 대한 임의의 검출 가능한 표지, 부동화 기질, 효소 표지에 대한 임의의 기질, 및 다른 실험실 물품을 포함하는 키트이다. 훨씬 또 다른 실시형태에서, 적어도 하나의 폴리뉴클레오타이드 또는 올리고뉴클레오타이드 또는 리간드는 검출 가능한 표지와 회합된다. 소정의 실시형태에서, 시약은 기질에 부동화된다. 예시적인 기질은 마이크로어레이, 칩, 미세유체기술 카드 또는 챔버를 포함한다.
이러한 조성물은 일 실시형태에서 하나 초과의 폴리뉴클레오타이드 또는 올리고뉴클레오타이드를 함유하고, 각각의 폴리뉴클레오타이드 또는 올리고뉴클레오타이드는 포유류 생물학적 샘플, 예를 들어 혈액, 혈청, 또는 혈장으로부터의 상이한 유전자 또는 상이한 miRNA에 혼성화된다. mRNA 및 miRNA는, 일 실시형태에서, 표 1, 표 2 및/또는 표 3에 기재된 것으로부터 선택된다. 표 1은 폐암의 존재를 나타내는 프로파일 또는 서명의 대표로서 본 발명자들에 의해 확인된 대략 상위 145개의 유전자 및 miRNA의 일 실시형태를 함유한다. 유전자 및 miRNA의 이 수집은 기준 대조군의 생물학적 샘플에서 동일한 mRNA 및 miRNA 발현에 대해 mRNA 및 miRNA 발현이 변경(즉, 증가 또는 감소)된 것이다. 표 2는 폐암의 존재를 나타내는 또 다른 프로파일 또는 서명의 대표로서 본 발명자들에 의해 확인된 대략 상위 147개의 유전자 및 miRNA의 일 실시형태를 함유한다. 유전자 및 miRNA의 이 수집은 기준 대조군의 생물학적 샘플에서 동일한 mRNA 및 miRNA 발현에 대해 mRNA 및 miRNA 발현이 변경(즉, 증가 또는 감소)된 것이다. 표 3은 표 1과 표 2 사이에 중첩하는 mRNA 및 miRNA를 함유한다.
일 실시형태에서, 표적화된 mRNA 및 miRNA는 표 1의 1 내지 119의 순위의 것으로부터 선택된다. 또 다른 실시형태에서, 표 1에서 순위화된 이 표적 이외의 mRNA 및 miRNA에 대한 리간드는 본 발명의 조성물에 포함된다. 일 실시형태에서, 상기 조성물은 표 1의 단일 mRNA를 표적화하는 리간드 및 표 1의 단일 miRNA를 표적화하는 리간드를 함유한다. 또 다른 실시형태에서, 상기 조성물은 동일한 mRNA 또는 동일한 miRNA를 표적화하는 하나 초과의 리간드를 함유한다.
일 실시형태에서, 표적화된 mRNA 및 miRNA는 표 1에서 확인된 모든 표적으로부터 선택된다. 또 다른 실시형태에서, 표적화된 mRNA 및 miRNA는 표 2에서 확인된 일부 또는 모든 표적으로부터 선택된다. 또 다른 실시형태에서, 표 1 및 표 2에서 순위화된 이 표적 이외의 mRNA 및 miRNA에 대한 리간드는 본 발명의 조성물에 포함된다. 일 실시형태에서, 상기 조성물은 표 1 또는 표 2의 단일 mRNA를 표적화하는 리간드 및 표 1 또는 표 2의 단일 miRNA를 표적화하는 리간드를 함유한다. 또 다른 실시형태에서, 상기 조성물은 동일한 mRNA 또는 동일한 miRNA를 표적화하는 하나 초과의 리간드, 즉 이 표의 적어도 5개, 10개, 20개, 50개, 75개, 100개, 130개, 140개 이상의 조합을 함유한다.
또 다른 실시형태에서, 포유류 대상체에서 폐암을 진단하기 위한 조성물은 3개 이상의 PCR 프라이머-프로브 세트를 포함한다. 각각의 프라이머-프로브 세트는, 대상체의 생물학적 샘플에서 발견된 1개 이상의 miRNA로부터의 상이한 폴리뉴클레오타이드 서열을 증폭하는, 프라이머 또는 프로브 또는 세트와 커플링된, 대상체의 생물학적 샘플에서 발견된 2개 이상의 mRNA로부터의 상이한 폴리뉴클레오타이드 서열을 증폭시킨다. 또 다른 실시형태에서, 포유류 대상체에서 폐암을 진단하기 위한 조성물은 3개 이상의 PCR 프라이머-프로브 세트를 포함한다. 각각의 프라이머-프로브 세트는, 대상체의 생물학적 샘플에서 발견된 2개 이상의 miRNA로부터의 상이한 폴리뉴클레오타이드 서열을 증폭하는, 프라이머 또는 프로브 또는 세트와 커플링된, 대상체의 생물학적 샘플에서 발견된 1개 이상의 mRNA로부터의 상이한 폴리뉴클레오타이드 서열을 증폭시킨다.
더욱 다른 실시형태는 표 1의 1-119개의 또는 모든 mRNA 및 miRNA 표적, 표 2의 119개의 또는 모든 mRNA 및 miRNA 표적, 및/또는 표 3의 모든 mRNA 및 miRNA 표적의 모든 순위화된 mRNA 및 miRNA를 증폭하기에 충분한 PCR 프라이머, 프로브 또는 세트를 포함한다. 따라서, 또 다른 실시형태에서, 리간드는 조성물에서 사용하기 위한 표 1, 표 2 또는 표 3으로부터의 적어도 mRNA 및 miRNA로 생성된다. 훨씬 또 다른 실시형태에서, PCR 프라이머 및 프로브는 조성물에서 사용하기 위한 표 1, 표 2 및/또는 표 3으로부터의 적어도 25개의 mRNA 및 miRNA로 생성된다. 훨씬 또 다른 실시형태에서, PCR 프라이머 및 프로브는 조성물에서 사용하기 위한 표 1, 표 2 및/또는 표 3으로부터의 적어도 50개의 mRNA 및 miRNA로 생성된다. 훨씬 또 다른 실시형태에서, PCR 프라이머 및 프로브는 조성물에서 사용하기 위한 표 1, 표 2 및/또는 표 3으로부터의 적어도 75개의 mRNA 및 miRNA로 생성된다. 훨씬 또 다른 실시형태에서, PCR 프라이머 및 프로브는 조성물에서 사용하기 위한 표 1 또는 표 2로부터의 적어도 100개의 mRNA 및 miRNA로 생성된다. 훨씬 또 다른 실시형태에서, PCR 프라이머 및 프로브는 조성물에서 사용하기 위한 표 1 또는 표 2로부터의 적어도 125개의 mRNA 및 miRNA로 생성된다. 당업자는 상기 기재된 숫자 사이에 생긴 모든 정수가, 심지어 본 명세서에 구체적으로 기재되지 않는 경우에, 본 개시내용에 포함된다는 것을 인식할 것이다. 표 1, 표 2 또는 표 3으로부터의 선택된 유전자 및 miRNA는 순위 순서일 필요는 없고, 오히려 이환된 환자에 대한 기준 대조군 사이의 발현의 차이를 명확히 보여주는 임의의 조합이 이러한 조성물에서 유용하다.
더욱 다른 실시형태는 표 1의 순위화된 mRNA 및 miRNA 표적의 더 적은 하위집단을 증폭시키기에 충분한 PCR 프라이머, 프로브 또는 세트를 포함한다. 더욱 다른 실시형태는, 폐 질환 또는 암에서 특이적으로 변화하는 것으로 밝혀진 다른 mRNA 및 miRNA 표적을 증폭시키기에 충분한 PCR 프라이머, 프로브 또는 세트와 함께, 표 1의 순위화된 mRNA 및 miRNA 표적의 더 적은 하위집단을 증폭시키기에 충분한 PCR 프라이머, 프로브 또는 세트를 포함한다.
이 선택된 유전자 및 miRNA는 폐암 또는 또 다른 폐 질환을 가지는 대상체와 선택된 기준 대조군 사이에 구별 가능한 조합된 유전자/miRNA 발현 프로파일 또는 서명을 형성한다. 일 실시형태에서, 기준의 것으로부터의 환자의 생물학적 샘플, 예를 들어 혈액에서의 조합된 mRNA 및 miRNA 발현의 상당한 변화는 폐암, 예를 들어 비소세포 폐암(NSCLC)의 진단과 상관된다. 일 실시형태에서, 기준의 것으로부터의 환자의 생물학적 샘플, 예를 들어 혈액에서의 조합된 mRNA 및 miRNA 발현의 상당한 변화는 이러한 암의 병기의 진단과 상관된다. 일 실시형태에서, 기준의 것으로부터의 환자의 생물학적 샘플, 예를 들어 혈액에서의 조합된 mRNA 및 miRNA 발현의 상당한 변화는 폐암의 유형의 진단과 상관된다. 일 실시형태에서, 기준의 것으로부터의 환자의 생물학적 샘플, 예를 들어 혈액에서의 조합된 mRNA 및 miRNA 발현의 상당한 변화는 비암성 병태, 예컨대 COPD, 양성 폐 병변 또는 결절의 진단과 상관된다. 일 실시형태에서, 기준의 것으로부터의 환자의 생물학적 샘플, 예를 들어 혈액에서의 조합된 mRNA 및 miRNA 발현의 상당한 변화는 또 다른 질환의 진단과 상관된다. 추가로 이 조성물은 미지의 병인학의 폐 결절을 가지는 대상체에서의 보충적 또는 원래의 진단을 제공하는 데 유용하다.
상기 기재된 조성물의 일 실시형태에서, 기준 대조군은 건강하지 않은 대조군(NHC)이다. 다른 실시형태에서, 기준 대조군은 상기 기재된 바와 같은 임의의 종류의 대조군일 수 있다. 선택된 조합된 유전자 및 miRNA 발현 프로파일의 구성원에 혼성화되는 폴리뉴클레오타이드 또는 올리고뉴클레오타이드를 함유하는 조성물은 진단을 위해서뿐만 아니라, 절제/화학치료의 긍정적인 효과가 초기 치료 후 긴 기간 동안 유지되는지를 결정하기 위해 수술적 또는 비수술적 치료학적 치료의 효과를 모니터링하기 위해 바람직하다. 이 프로파일은 또한, 결과가 수술전/화학치료전 프로파일로의 회귀를 입증하는 경우, 폐암, 예를 들어 NSCLC의 재발 또는 재발의 가능성의 결정을 허용한다. 추가로, 이 조성물은 폐암에 대한 비수술적 치료의 효율을 모니터링하는 데 사용하기 위해 또한 사용될 수 있을 것이다.
임의로 검출 가능한 표지와 연관된, 표 1, 표 2 및/또는 표 3으로부터 선택된 유전자 및 miRNA에 기초한 조성물은 상기 기재된 PCR, RT-PCR 또는 Q PCR 기법과 함께 사용하도록 채택된 미세유체공학 카드, 칩 또는 챔버, 또는 키트의 포맷으로 제시될 수 있다. 일 양태에서, 이러한 포맷은 TaqMan(등록상표) 정량적 PCR 저밀도 어레이를 사용한 진단학적 검정이다. 예비 결과는 필요한 유전자 및 miRNA의 수가 이 플랫폼에 알맞다는 것을 제안한다. 선택된 대상체로부터의 생물학적 샘플이 조성물에서의 프라이머 및 프로브와 접촉할 때, 대상체로부터의 발현 프로파일에서의 표적화된 유익한 유전자 및 miRNA의 PCR 증폭은 기준 유전자 발현 프로파일의 것으로부터 유전자 및 miRNA에서의 발현의 변화의 검출을 허용한다. 기준 프로파일의 것으로부터의 환자의 샘플에서의 선택된 mRNA 및 miRNA의 조합된 발현의 상당한 변화는 폐암의 진단과 상관될 수 있다. 유사하게, 수술 후 특허 대상체로부터의 생물학적 샘플이 조성물에서의 프라이머 및 프로브와 접촉할 때, 프로파일에서의 표 1, 표 2 및/또는 표 3의 것으로부터 선택된 표적화된 유익한 유전자 및 miRNA의 PCR 증폭은 수술 전에 환자(또는 유사한 환자)의 것과 비교될 수 있다. 기준 발현 프로파일의 것으로부터 환자의 샘플에서 선택된 mRNA 및 miRNA의 발현의 상당한 변화는 수술의 긍정적인 효과 및/또는 긍정적인 효과의 유지와 상관된다.
특정한 mRNA 및 miRNA 표적이 선택되면, 프라이머 및 프로브 서열의 설계는 당해 분야의 기술 내에 있다. 프라이머 및 프로브 설계 및 특정한 프라이머 및 프로브 서열에 선택된 특정한 방법은 이 조성물의 특징을 제한하지 않는다. 당해 분야의 당업자에게 이용 가능한 프라이머 및 프로브 설계 기법의 준비된 설명은, 공중에게 이용 가능한 도구, 예컨대 일반 사용자 및 생물학자 프로그래머에 대해, DNA BLAST 소프트웨어, Repeat Masker 프로그램(Baylor College of Medicine), Primer Express(Applied Biosystems); MGB 검정-by-설계(Applied Biosystems); Primer3(Steve Rozen and Helen J. Skaletsky (2000)) WWW에서 Primer3을 참조하여 미국 특허 제7,081,340호 및 다른 공보에 요약되어 있다. 일반적으로, 본 명세서에 기재된 조성물에서 사용되는 최적 PCR 프라이머 및 프로브는 일반적으로 12개 내지 30개, 예를 들어 17개 내지 22개의 염기 길이이고, 약 20-80%, 예컨대, 예를 들어 약 50-60%의 G+C 염기를 함유한다. 50 내지 80℃, 예를 들어 약 50 내지 70℃의 융점이 통상적으로 바람직하다.
미세유체공학 카드, 마이크로어레이, 칩 또는 챔버의 포맷에서 제시될 수 있는 조성물은 본 명세서에 기재된 폴리뉴클레오타이드 혼성화 기법을 사용한다. 선택된 특허 대상체로부터의 생물학적 샘플이 조성물에서 혼성화 프로브와 접촉할 때, 환자로부터의 발현 프로파일에서의 표적화된 유익한 유전자 및 miRNA의 PCR 증폭은 기준 조합된 발현 프로파일, 예를 들어 건강한 대조군 또는 폐 질환을 가지지만, 암이 없는 대조군 등의 것으로부터 발현 프로파일에서의 유전자 및 miRNA의 발현의 변화의 검출 및 정량화를 허용한다.
이 조성물은 폐암, 예컨대 I 병기 또는 II 병기 NSCLC를 진단하기 위해 사용될 수 있다. 추가로 이 조성물은 미지의 병인학의 폐 결절을 가지는 대상체에서 보충적 또는 원래의 진단을 제공하기에 유용하다. 표 1, 표 2 및/또는 표 3으로부터의 선택된 표적 또는 이의 하위집단에 의해 형성된 조합된 mRNA 및 miRNA 발현 프로파일은 염증성 유전자 발현 프로파일로부터 구별 가능하다.
기준 대상체의 종류는 악성 질환을 가지는 흡연자, 비악성 질환을 가지는 흡연자, 비악성 질환을 가지는 이전의 흡연자, 질환을 가지지 않는 건강한 비흡연자, 만성 폐쇄성 폐 질환(COPD)을 가지는 비흡연자, COPD를 가지는 이전의 흡연자, 종양의 제거를 위한 수술 전의 고형 폐 종양을 가지는 대상체; 종양의 수술적 제거 후의 고형 폐 종양을 가지는 대상체; 종양의 치료 전의 고형 폐 종양을 가지는 대상체; 및 종양의 치료 동안의 또는 후의 고형 폐 종양을 가지는 대상체를 포함한다. 적절한 종류의 선택은 조성물의 사용에 따라, 즉 원래의 진단에 대해, 치료 또는 수술 후의 예후에 대해 또는 질환 유형, 예를 들어 AC 대 LSCC의 구체적인 진단에 대해 달라진다.
진단학적 방법
모든 상기 기재된 조성물은 대상체에서의 질환 상태의 혈액 기반, 비침습적 평가를 허용하는 다양한 진단학적 도구를 제공한다. 다른 스크리닝 시험, 예컨대 흉부 x선 또는 CT 스캔과 커플링될 수 있는, 진단학적 시험에서의 이 조성물의 사용은 진단학적 정확성을 증가시키고/시기커나 추가적인 시험을 지시한다. 다른 양태에서, 본 명세서에 기재된 진단학적 조성물 및 도구는 질환의 예후, 구체적인 치료에 대한 반응의 모니터링 및 재발의 위험의 정기적인 평가를 허용한다. 본 명세서에 기재된 조성물의 방법 및 사용은 또한 치료전, 수술전 및/또는 치료 동안의 다양한 기간에 및 치료 후 샘플에서 진단학적 조합된 mRNA 및 miRNA 수준 또는 프로파일의 변화의 평가를 허용하고, 재발의 확률을 평가하기 위해 사용될 수 있는 조합된 발현 프로파일 또는 서명을 확인한다.
일 실시형태에서, 포유류 대상체에서 병태를 진단하거나 검출하거나 평가하는 방법은 대상체의 생물학적 샘플에서, 또는 샘플로부터 생성된 조합된 mRNA 및 miRNA 발현 프로파일로부터, 표 1, 표 2 및/또는 표 3에서 확인된 표적 mRNA 및 miRNA 핵산 서열의 발현 수준을 검출하는 단계; 및 기준 표준에 대해 대상체의 샘플에서의 조합된 mRNA 및 miRNA 발현 수준 또는 프로파일을 비교하는 단계를 포함한다. 기준 표준의 것으로부터의 대상체의 샘플 프로파일의 발현의 변화는 기준 표준의 선택에 따라 상기 언급된 병태의 진단 또는 예후에 따라 달라진다. 소정의 실시형태에서, 병태는 폐암, 만성 폐쇄성 폐 질환(COPD) 또는 양성 폐 결절이다. 이 방법은 상기 기재된 생물학적 샘플을 사용하여 사용될 수 있다. 소정의 실시형태에서, 생물학적 샘플은 전혈, 말초 혈액 단핵 세포, 혈장 및 혈청이다.
상기 기재된 바대로, 이 방법은, 소정의 실시형태에서, 대상체의 샘플에서의 하나 이상의 기재된 mRNA 및 하나 이상의 기재된 miRNA의 조합의 발현 수준을 측정하는 단계를 수반한다. 다른 실시형태에서, 상기 방법의 검출, 측정 또는 비교 단계는 수회 반복된다. 예를 들어, 소정의 실시형태에서, mRNA 및 miRNA 수준은 상이한 시기에 취해진 상기 대상체의 일련의 샘플에서 검출되거나 측정된다. 이것은 선택된 기준 표준으로부터 상기 조합된 mRNA 및 miRNA의 변경된 발현의 패턴의 확인을 허용한다.
더욱 다른 실시형태에서, 검출 또는 측정 단계는 대상체로부터의 생물학적 샘플을 진단학적 시약, 예컨대 샘플에서 표적 mRNA 및 miRNA 발현 수준을 확인하거나 측정하는 상기 기재된 것과 접촉시키는 단계를 수반한다. 소정의 실시형태에서, 접촉 단계는 샘플에서의 상기 mRNA 또는 miRNA 및 mRNA 또는 miRNA에 대한 진단학적 시약 사이에 상기 생물학적 샘플에서 직접 또는 간접 복합체를 형성하는 것을 수반하거나 포함한다. 이후, 상기 방법은 본 명세서에 기재된 바대로 적합한 검정에서 복합체의 수준을 측정한다.
이 방법의 소정의 실시형태에서, 조합된 프로파일을 형성하는 mRNA 및 miRNA 표적은 흡연의 병력이 없는 폐 질환 무, 흡연의 병력을 가지는 폐 질환 무, 폐암, 만성 폐쇄성 폐 질환(COPD), 양성 폐 결절, 종양 절제 이전의 폐암 및 종양 절제 후의 폐암으로부터 선택된 병태 중 2개 이상에서 차등적으로 발현된다. 상기 방법에 의해 측정된 병태에 따라, 기준 표준은 기준 대상체 또는 기준 집단, 예컨대 (a) 비소세포 폐암(NSCLC)을 가지는 기준 인간 대상체 또는 집단; (b) COPD를 가지는 기준 인간 대상체 또는 집단, (c) 건강하고 결코 흡연하지 않은 기준 인간 대상체 또는 집단, (d) 질환을 가지지 않는 이전의 흡연자 또는 현재의 흡연자인 기준 인간 대상체 또는 집단; (e) 양성 폐 결절을 가지는 기준 인간 대상체 또는 집단; (f) NSCLC 종양의 수술적 제거 후의 기준 인간 대상체 또는 집단; (g) NSCLC 종양의 수술적 제거 전의 기준 인간 대상체 또는 집단; 및 (h) 일시적으로 조기의 생물학적 샘플을 제공한 동일한 대상체로부터 얻어진다.
본 명세서에 기재된 진단학적 조성물 및 방법은 현재의 진단학적 방법에 비해 다양한 이점을 제공한다. 이러한 이점 중에 하기가 있다. 본 명세서에 예시된 바대로, 폐암의 2개의 가장 흔한 유형인, 폐의 선암 또는 편평 세포 암종을 가지는 대상체는 만성 폐쇄성 폐 질환(COPD) 또는 육아종 또는 다른 양성 종양을 포함하는 비악성 폐 질환을 가지는 대상체로부터 구별된다. 이 방법 및 조성물은 작은 결절을 가지는 폐 임상에서 제시하는 환자가 악성 질환을 가지는지의 실제적 진단학적 문제에 대한 해결책을 제공한다. 중간 위험 결절을 가지는 환자는 질환 위험의 매우 낮은 가능성 또는 매우 높은 가능성 카테고리로 환자를 이동시키는 비침습적 시험으로부터 명확히 이익을 얻을 것이다. 게놈 프로파일에 기초한 악성종양의 정확한 추정치(즉, 환자가 암을 가질 불과 5% 기회를 예상하는 것에 대해 소정의 환자가 암을 가질 90% 확률을 가지는 것을 예상)는 양성 질환에 대한 더 적은 수술, 치유 가능한 병기에서 제거된 더 초기 단계의 종양, 더 적은 추적관찰 CT 스캔, 및 결절에 대해 걱정하는 상당한 심리적 비용의 감소를 발생시킬 것이다. 예컨대, 폐암에 대한 CT 스크리닝과 연관된 추가적인 건강 관리의 현재의 예상된 비용, 즉 획득된 품질 조정된 수명마다 116,000달러를 감소시키는 것과 같은 경제적 영향은 또한 상당할 것이다. 충분한 민감도 및 특이성을 가지는 비침습적 시험은 악성종양의 시험후 확률 및 이에 따라 후속하는 임상 관리를 상당히 변경시킬 것이다.
기존의 방법에 대한 이 방법의 바람직한 이점은 이것이 최소로 침습적인 절차, 즉 혈액 샘플의 채취로부터 질환 상태를 규명할 수 있다는 것이다. 반대로, 유전자 발현 프로파일로부터의 암 종양의 분류를 위한 현재의 실행은 조직 샘플, 보통 종양으로부터의 샘플에 따라 달라진다. 매우 작은 종양 생검이 문제가 되는 경우에 그리고 확실히 종양이 알려지거나 보이지 않는 경우, 이로부터의 샘플은 불가능하다. 종양 샘플이 분석될 때의 경우처럼 종양의 정제가 필요하지 않다. 현재 공개된 방법은 기관지 내시경 동안 폐로부터의 브러싱 상피 세포에 따라 달라지고, 이 방법은 또한 혈액 샘플의 채취보다 상당히 더 침습적이고, 오직 폐암에 적용 가능하지만, 본 명세서에 기재된 방법은 임의의 암에 일반화 가능하다. 혈액 샘플은, mRNA 또는 miRNA가 분석되는 때에 중요한 재료가 쉽게 제조되고 차후의 분석을 위해 안정화된다는 것인 추가적인 이점을 가진다.
실시형태
일 실시형태에서, 폐암의 진단을 위한 다중분석물질 조성물은 (a) 포유류 생물학적 샘플로부터의 mRNA 유전자 전사체와 특이적으로 복합체 형성하거나, 이에 혼성화되거나, 이를 확인할 수 있는 핵산 서열, 폴리뉴클레오타이드 또는 올리고뉴클레오타이드로부터 선택된 리간드; 및 (b) 포유류 생물학적 샘플과 특이적으로 복합체 형성하거나, 이에 혼성화되거나, 이를 확인할 수 있는 핵산 서열, 폴리뉴클레오타이드 또는 올리고뉴클레오타이드로부터 선택된 추가적인 리간드를 포함한다. 각각의 리간드 및 추가적인 리간드는 상이한 유전자 전사체 또는 miRNA에 결합하고, 확인된 유전자 전사체 및 miRNA의 조합된 발현 수준은 폐암 또는 폐암의 병기의 특징적인 프로파일을 형성한다.
또 다른 실시형태에서, 상기 조성물의 유전자 전사체 및 miRNA는 표 1로부터 선택된다. 또 다른 실시형태에서, 조성물의 유전자 전사체 및 miRNA는 표 1의 순위 1 내지 119로부터 선택된다. 또 다른 실시형태에서, 상기 조성물의 유전자 전사체 및 miRNA는 표 1의 모든 표적으로부터 선택된다. 또 다른 실시형태에서, 상기 조성물의 유전자 전사체 및 miRNA는 표 2의 일부 또는 모든 표적으로부터 선택된다. 또 다른 실시형태에서, 조성물의 유전자 전사체 및 miRNA는 표 3의 일부 또는 모든 표적으로부터 선택된다.
훨씬 또 다른 실시형태에서, 조성물의 각각의 상기 리간드는 상기 유전자 전사체 또는 miRNA의 핵산 서열을 증폭시키고 검출하는 증폭 핵산 프라이머 또는 프라이머 쌍이다. 또 다른 실시형태에서, 리간드는 유전자의 mRNA 또는 miRNA 핵산 서열에 혼성화되는 폴리뉴클레오타이드 프로브이다. 또 다른 실시형태에서, 조성물은 항체 또는 항체의 단편을 함유하고, 각각의 리간드는 표 1, 표 2 또는 표 3의 적어도 1개의 mRNA 또는 1개의 miRNA에 특이적이다.
또 다른 실시형태에서, 상기 조성물은 상기 리간드가 고정화된 기질을 추가로 포함한다. 또 다른 실시형태에서, 상기 조성물은 마이크로어레이, 미세유체공학 카드, 칩, 챔버 또는 다수의 프로브의 복합체를 포함한다. 또 다른 실시형태에서, 상기 조성물은 다수의 프로브 서열을 포함하는 키트를 포함하고, 각각의 상기 프로브 서열은 표 1의 1 내지 119로 순위화된 1개의 mRNA 및 mRNA 및 miRNA의 1개의 miRNA, 또는 표 1의 모든 표적, 또는 표 2의 일부 또는 모든 표적 및/또는 표 3의 일부 또는 모든 표적에 혼성화될 수 있다. 또 다른 실시형태에서, 키트는 동일한 mRNA 또는 miRNA에 혼성화될 수 있는 추가적인 리간드를 포함한다. 훨씬 또 다른 실시형태에서, 키트는 다수의 상기 리간드를 포함하고, 이들은 각각 폴리뉴클레오타이드 또는 올리고뉴클레오타이드 프라이머-프로브 세트를 포함한다. 또 다른 실시형태에서, 키트는 프라이머 및 프로브 둘 다를 포함하고, 여기서 각각의 상기 프라이머-프로브 세트는 상이한 유전자 전사체 또는 miRNA를 증폭시킨다.
또 다른 실시형태에서, 상기 조성물은 검출 가능한 표지와 연관된 하나 이상의 폴리뉴클레오타이드 또는 올리고뉴클레오타이드 또는 리간드를 함유한다.
또 다른 실시형태에서, 상기 조성물은 기준 또는 대조군의 것으로부터 대상체의 전혈에서의 동일한 선택된 유전자 및 miRNA의 발현, 발현 수준 또는 활성의 변화의 검출을 허용하고, 상기 변화는 폐암의 초기 진단, 폐암의 병기, 폐암의 유형 또는 분류, 폐암의 재발, 폐암의 퇴행, 폐암의 예후, 또는 수술적 또는 비수술적 치료에 대한 폐암의 반응과 상관된다. 또 다른 실시형태에서, 폐암은 비소세포 폐암이다.
또 다른 실시형태에서, 상기 조성물은 기준 또는 대조군의 것으로부터 대상체의 혈액에서의 동일한 선택된 유전자에서의 발현의 변화의 검출을 허용하고, 상기 변화는 폐암의 진단 또는 평가와 상관된다.
또 다른 실시형태에서, 진단 또는 평가는 폐암의 진단, 폐암의 병기의 진단, 폐암의 유형 또는 분류의 진단, 폐암의 재발의 진단 또는 검출, 폐암의 퇴행의 진단 또는 검출, 폐암의 예후, 또는 수술적 또는 비수술적 치료에 대한 폐암의 반응의 평가 중 하나 이상을 포함한다. 상기 조성물의 일 실시형태에서, 리간드는 RNA 프라이머이다.
또 다른 실시형태에서, 상기 조성물은 적어도 2개의 리간드를 포함하는 키트 또는 마이크로어레이이고, 적어도 1개의 리간드는 대상체가 폐암을 가질 때 발현의 변형을 가지는 선택된 유전자의 mRNA 전사체를 확인하고, 적어도 제2 리간드는 대상체가 폐암을 가질 때 발현 수준의 변화를 가지는 miRNA를 확인한다.
본 발명의 훨씬 또 다른 실시형태는 포유류 대상체의 생물학적 유체에서 표 1의 1 내지 119의 순위로부터 선택된 유전자 전사체 및 miRNA, 표 1의 모든 표적, 표 2의 일부 또는 모든 표적, 및/또는 표 3의 일부 또는 모든 표적의 발현의 변화를 확인하는 단계, 및 상기 대상체의 mRNA 및 miRNA 발현 수준을 동일한 생물학적 샘플에서 기준 또는 대조군로부터의 동일한 mRNA 및 miRNA의 수준과 비교하는 단계를 포함하는 포유류 대상체에서 폐암의 존재를 진단하거나 평가하는 방법이고, 기준의 것으로부터의 대상체의 mRNA 및 miRNA 유전자의 발현의 변화는 폐 질환 또는 암의 진단 또는 평가와 상관된다.
일 실시형태에서, 상기 방법은 본 명세서에 기재된 다중분석물질 조성물을 사용한다. 또 다른 실시형태에서, 상기 방법은 폐암, 양성 폐 결절의 진단, 폐암의 병기의 진단, 폐암의 유형 또는 분류의 진단, 폐암의 재발의 진단 또는 검출, 폐암의 퇴행의 진단 또는 검출, 폐암의 예후, 또는 수술적 또는 비수술적 치료에 대한 폐암의 반응의 평가 중 하나 이상을 포함하도록 진단 또는 평가를 허용한다.
또 다른 실시형태에서, 상기 방법의 진단 또는 평가는 폐암의 초기 단계의 진단을 포함한다.
또 다른 실시형태에서, 상기 방법은 상기 기준 또는 대조군과 비교하여 1개 이상의 선택된 유전자 전사체의 상향조절 또는 하향조절 및 상기 기준 또는 대조군과 비교하여 1개 이상의 선택된 miRNA의 상향조절 또는 하향조절의 조합을 포함하는 변화의 검출을 허용한다. 또 다른 실시형태에서, 상기 방법에서 사용된 유전자 전사체 및 miRNA는 표 1, 표 2 및/또는 표 3에 수록된 것으로부터 선택된다. 또 다른 실시형태에서, 폐암은 I 또는 II 병기 비소세포 폐암이다.
훨씬 추가의 실시형태에서, 대상체는 고형 종양 절제를 위한 수술 또는 화학치료를 겪고; 상기 기준 또는 대조군은 수술전 또는 치료전 동일한 대상체로부터의 동일한 선택된 유전자 전사체 및 miRNA를 포함하고; 상기 선택된 유전자 전사체 및 miRNA의 발현의 변화는 암 재발 또는 퇴행과 상관된다. 더욱 다른 실시형태에서, 기준 또는 대조군은 적어도 하나의 기준 대상체를 포함하고, 상기 기준 대상체는 (a) 악성 질환을 가지는 흡연자, (b) 비악성 질환을 가지는 흡연자, (c) 비악성 질환을 가지는 이전의 흡연자, (d) 질환을 가지지 않는 건강한 비흡연자, (e) 만성 폐쇄성 폐 질환(COPD)을 가지는 비흡연자, (f) COPD를 가지는 이전의 흡연자, (g) 고형 폐 종양의 제거를 위한 수술 전의 상기 종양을 가지는 대상체; (h) 고형 폐 종양의 수술적 제거 후의 상기 종양을 가지는 대상체; (i) 고형 폐 종양에 대한 치료 전의 상기 종양을 가지는 대상체; 및 (j) 고형 폐 종양에 대한 치료 동안의 또는 후의 상기 종양을 가지는 대상체로 이루어진 군으로부터 선택되고; 상기 기준 또는 대조군 대상체 (a)-(j)는 일시적으로 더 이른 시점에서의 동일한 시험 대상체이다. 다른 실시형태에서, 기준 mRNA 또는 miRNA 표준은 기준 대상체 또는 기준 집단으로부터 유도된 평균, 평균값, 산술 평균 또는 산술 평균의 범위, 숫자 패턴, 그래프 패턴 또는 조합된 mRNA 및 miRNA 발현 프로파일이다.
다른 실시형태에서, 상기 방법에서 사용된 생물학적 샘플은 전혈, 혈청 또는 혈장이다.
훨씬 추가의 실시형태에서, 상기 방법은 대상체로부터의 생물학적 샘플을 샘플에서의 선택된 mRNA 발현 수준과 복합시키고 이를 측정하는 진단학적 시약과 접촉시키는 단계 및 대상체로부터의 생물학적 샘플을 샘플에서의 miRNA 발현 수준과 복합시키고 이를 측정하는 진단학적 시약과 접촉시키는 단계를 포함하고, 발현 수준의 조합된 변화는 암 또는 이의 병기를 진단한다.
훨씬 또 다른 실시형태에서, 선택된 miRNA 및 mRNA는 흡연의 병력이 없는 폐 질환 무, 흡연의 병력을 가지는 폐 질환 무, 폐암, 만성 폐쇄성 폐 질환(COPD), 양성 폐 결절, 종양 절제 전의 폐암 및 종양 절제 후의 폐암으로부터 선택된 병태 중 2개 이상에서 차등적으로 발현된다.
또 다른 실시형태에서, 진단학적 시약을 생성하는 방법은 포유류 대상체의 생물학적 유체의 샘플에서 질환에 특징적인 선택된 mRNA 및 miRNA 서열의 발현의 조합된 변화를 검출하는 것을 포함하는 질환 분류 프로파일을 형성하는 단계를 포함한다.
하기 실시예는 오직 예시 목적을 위해 제공되고, 본 발명은 어떤 방식으로든 이 실시예에 제한되는 것으로 해석되지 않고, 오히려 본 명세서에 제공된 교시내용의 결과로서 명백한 임의의 및 모든 변형을 포함하는 것으로 해석되어야 한다.
실시예 1: 샘플 크기 계산
이 계산은 도 1에 기재된 PAXgene 데이터에 기초한다. 본 발명자들은 시험 세트에서 원하는 90% 정확성에 도달할 필요가 있는 샘플 크기를 계획하기 위해 23명의 암 환자 및 25명의 대조군의 현재의 PAXgene 데이터세트로부터의 데이터를 사용하였다. 본 발명자들은 모든 샘플의 50 내지 90%에 상응하는 24개 내지 44개의 샘플 사이에 변하는 상이한 크기의 훈련 세트를 무작위로 선택하였다. 샘플 크기는 각각의 단계에서 1개의 암 및 1개의 대조군 샘플의 첨가를 허용하도록 2의 증분 만큼 계속해서 증가하였다. 모든 소정의 샘플 크기에 대해, 50개의 재샘플링을 수행하였다.
이후, t-시험을 각각의 훈련 세트에서 수행하여 p-값에 의해 순위화된 상위 100개의 유전자를 확인하였다. 유전자 목록은 임의의 낮은 발현인자(암 및 비암 군에서 모든 샘플에 대한 평균 배경 수준의 2배를 초과하지 않는 발현)를 감소함으로써 추가로 감소되었다.
이후, 시험 목적을 위해 초기에 유지된 것을 포함하는 모든 샘플을 클러스팅하도록 남은 58개의 유전자를 사용하였다. 본 발명자들은 표준화된 유클리드(Euclidean) 거리를 사용하고, 계층적 클러스터링을 위한 메트릭으로서 완전한 연결을 사용하였다. 2개의 클러스터(36)(1개는 대부분의 암이고, 다른 1개는 대부분의 비암임)를 확인하기 위해 나무를 통한 단일 수평 절단을 생성함으로써 나무는 2개의 클러스터로 분배되었다. 유지 샘플을 2개의 클러스터 중 하나에 배정하고, 여기서 암 클러스터는 대부분의 암 샘플을 함유하는 클러스터로서 정의된다.
잘못 분류된 유지 시험 샘플의 수를 사용하여 오차율을 계산하였다(e = 잘못 분류된 수/전체). 이후, 본 발명자들은 각각의 구체적인 훈련 세트 크기에서 50회 반복에 대해 중앙치 오차율 및 중앙치 절대 편차를 계산하였다. 이전에 기재된 프로세스와 유사하게, 멱함수 함수는 중앙치 오차율로부터 데이터로 작도되고, 본 발명자들은 도 1에 도시된 바와 같은 유지 시험 샘플에 대한 원하는 90% 정확성을 달성하도록 훈련에 필요한 샘플의 필요한 수를 예상하기 위해 직선 방정식을 얻었다. 본 발명자들의 계산은 새로운 시험 세트에 대한 90% 분류 정확성이 환자와 대조군 사이의 대략 500개의 샘플 분할을 함유하는 훈련 세트를 사용함으로써 달성될 수 있다는 것을 나타낸다.
실시예 2 - RNA 정제 및 품질 평가
Genomics Core에 의한 정기적 서비스로서 표준화 절차를 이용하여 유전자 및 miRNA 어레이 프로세싱에 대한 RNA 정제를 수행하였다. mRNA 및 miRNA의 동시 정제를 허용하는 Qiagen(상표명)으로부터의 표준 상업적으로 구입 가능한 키트를 사용하여 PAXgene RNA를 준비하였다. mRNA 또는 miRNA 프로파일링에 대해 생성된 RNA를 사용하였다.
Bioanalyzer를 사용하여 RNA 품질을 결정하였다. RNA 통합 번호가 7.5 초과인 샘플만을 사용하였다. 일루미나 허가된 RNA 증폭 키트(Epicenter)를 사용하여 일정한 양(100ng)의 전체 RNA를 증폭시켰다(aRNA). 이 절차는 유전자 및 miRNA 발현의 다수의 반복에 대해 충분한 증폭된 재료를 제공한다. 대안적인 수집 시스템에 의해 더 적은 샘플이 후일에 얻어지는 경우에 10ng만큼 낮은 RNA 양을 사용할 수 있다.
실시예 3 - 데이터 예비처리, 어레이 품질 제어, 프로브 여과
어레이 데이터는 일루미나의 Bead Studio에 의해 처리되고, 신호 및 대조군 프로브의 발현 수준은 분석을 위해 내보내기된다. 실험적 노이즈를 감소시키기 위해, 비유익한 프로브(모든 샘플의 95% 초과에서 검출되지 않는 프로브) 및 임의의 2개의 샘플 사이에 적어도 1.2배 변하지 않는 프로브를 제거함으로써 데이터를 여과한다. 이후, 발현 수준을 4분위수 정규화한다. 이 절차는 비유익한 프로브 데이터가 제거되면서 4분위수 정규화된 데이터를 생성시킨다.
각각의 혼성화 뱃치 후, 본 발명자들은 모든 신호 프로브(40,000개 초과)의 발현 수준을 사용하여 모든 마이크로어레이에 걸쳐 중앙치 스피어만(Spearman) 상관관계로서 유전자 방식 전반적 상관관계를 컴퓨팅하고, 전반적 상관관계의 중앙치 절대 편차를 계산하였다. 각각의 마이크로어레이에 대해 중앙치 스피어만 상관관계는 모든 다른 어레이에 대해 컴퓨팅되고, 8 초과의 절대 편차만큼 중앙치 상관관계가 전반적 상관관계와 다른 어레이는 이상점으로서 표시되고 통상적으로 PAXgene 샘플의 1% 미만에 대해 추가의 분석에 대해 사용되지 않았다. 이상점의 추가의 확인은 다변량 통계, 예컨대 일반적 또는 튼튼한 주성분(principal component: PCA) 선도 및 다치수 스케일링을 통해 수행된다.
miRNA 발현을 위해, 본 발명자들은 본 연구를 위해 ABI(Life Sciences)로부터의 오픈어레이 플랫폼을 선택하였다. 오픈어레이 나노유체 PCR 플랫폼은 과학자가 3,072개 이하의 독립 PCR 분석을 동시에 수행하게 허용하고, 임상 적용에 이미 사용되고, 변산도를 제거하는 로봇 스테이션을 사용한다. 이 프로세스에 고려되는 추가적인 플랫폼은 Nanostring Technologies, Inc.(워싱턴주 시애틀)로부터의 nCounter 시스템이다. 간단히, 이 시스템은 디지털 색상 코딩된 바코드 기술을 이용한다. 색상 코딩된 분자 "바코드"는 표적 유전자에 대한 단일 표적-특이적 프로브에 부착된다. 바코드는 표적 분자에 직접적으로 혼성화하고, 증폭의 필요 없이 개별적으로 계수될 수 있다. 이러한 바코드 표시된 프로브의 세트 및 대조군에 의해 영상화하는 단일 분자는 단일 반응에서 많은 독특한 전사체의 검출 및 계수를 허용한다. 예를 들어, 웹사이트, www.nanostringtechnology.com.com.에 함유된 나노스트링 기술의 설명을 참조한다. miRNA 데이터 예비 프로세싱 및 오픈어레이 품질 제어를 위해, 전체 RNA는 ABI로부터 구입된 오픈어레이 시약을 사용하여 ABI 프로토콜에 따라 프로세싱된다. 오픈어레이로부터의 데이터는 하기와 같이 MATLAB를 사용하여 예비 프로세싱된다: 소형 핵 RNA의 평균 사이클 쓰레스홀드(Ct), RNU44 및 RNU48(RNUavg)은 샘플의 발현 수준을 정규화하고 각각의 miRNA에 대한 상대 양(ΔCt)을 컴퓨팅하기 위한 내인성 대조군(하우스키핑 유전자)으로서 사용된다. Ct 값은 제조사(및 본 발명자들의 설비)에 의해 제안된 바대로 24로 제한되고, 및 최대 ΔCt 값은 ΔCt24(여기서, ΔCt24 = 24 - RNUavg)일 것이다. ΔCt24를 초과하는 ΔCt 값은 신뢰 불가로 생각되고, 비교 분석에 대한 ΔCt24 값으로 깔려진다. 이후, ΔCt 값은 2ΔCt24 - ΔCt를 계산함으로써 절대 발현 수준으로 전환될 것이다. 모든 반응은 3회 수행된다. 모든 검정은 매우 표준화된 조건을 이용하여 수행된다. 통계학적 고려를 위해, 샘플은 폐 결절을 가지거나 가지지 않는 비암 환자 및 폐암을 가지는 환자로부터 수집된다. 본 발명자들의 이전의 PBMC 연구에 기초하여, 본 발명자들은 600개의 PAXgene 샘플(폐 결절을 가지거나 가지지 않는 환자를 조합)로부터 모든 비암으로부터 암을 구별하기 위해 더 우수한 유전자 패널이 확인될 것이라고 추정한다. 샘플 크기 및 검증력 예상은 이 추정에 기초한다.
임상 실행에서, 진정한 비악성 결절을 가지는 환자로부터 암을 구별하는 것이 더 즉시 중요할 것이다. 본 발명자들의 이전의 경험에 기초하여, 암 및 비악성 결절을 분류하기 위한 잠재적인 유전자 패널은 암 및 모든 비암을 분류하기 위해 확인된 것과 어느 정도로 다를 것이다. 분류에 대한 유전자 패널을 결정하기 위한 몇몇 방식이 존재한다. 하나의 전통적인 방식은, p<.05로 Benjamini 및 Hochberg[J. Royal Statis Soc., Series B, Vol. 57(1):289-300 (1995)] 조정된 p-값 및 계층적 클러스터링에 대해 선택된 가장 낮은 p 값을 가지는 50-100개의 유전자를 사용하여 예비 PAXgene 연구에 대해 기재된 바대로 t-시험에 의해, 본 발명자들의 예비 PAXgene 연구에 본 발명자들이 사용한 절차이지만, 이것은 큰 데이터세트에 효과적이지 않고, 여기서 본 발명자들은 대신에 SVM-RFE를 성공적으로 사용하였다.
실시예 4 - 유전자 선별에 대한 지도된 분류
본 발명자들은 많은 혼재하는 유사성(흡연 병력, 폐 질환, 연령, 인종 등)을 공유하는 임상적으로 정의된 종류(예를 들어, 암/비암/양성 결절)를 구별하는 유전자 발현 분류자를 개발하기 위해 가장 성공적으로 적용되는 중복 변수 제거와 함께 서포트 벡터 머신(SVM-RFE)(WO2010/054233 참조)을 발견하였다. 많은 다른 지도된 방법과 달리, 유전자가 종류 분리에 대한 이의 기여에 의해 순위화되어서 분리에 가장 유용한 유전자가 확인될 수 있으므로, SVM은 바이오마커 선택에 대한 이점을 가진다. 기여하는 유전자는 가장 정확한 종류 구분을 제공하는 유전자의 최소 수를 발견하기 위해 RFE의 반복 프로세스에 의해 축소된다. 게다가, 각각의 샘플은 양수의 또는 음수의 점수가 제공되고, 이것은 이것을 하나의 종류 또는 또 다른 종류로 배정하고, 도 1에 도시된 바대로 그 샘플이 특정한 종류에 의해 얼마나 잘 확인되는지의 측정치이다. 본 발명자들의 연구에서, 양수는 암으로 정의되고, 음수는 비암이다. 양수가 더 높거나 음수가 더 낮은 점수는 얼마나 잘 각각의 샘플이 특정한 종류로 배정되는지는 정의한다. 프로세스는 하기 더 자세히 기재되어 있다.
샘플 분류는, 랜덤 10배 재샘플링 및 10회 반복된 교차 검증(100개의 유전자 순위를 생성)과 함께 SVM-RFE를 이용하여 수행된다. 각각의 교차 검증 반복은 t-시험에 의해 가장 유의미한 1,000개의 유전자에 의해 시작하고, 유전자의 수는 각각의 변수 제거 단계에서 10% 축소된다. 유전자의 최종 순위는 보다 계산법(Borda count) 절차를 이용하여 수행된다. 각각의 시험된 샘플에 대한 분류 점수는 각각의 교차 검증 및 단일 유전자에 이르는 유전자-축소 단계에서 기록된다. 최고의 정확성을 생성하는 유전자의 수를 결정하고, 최대 정확성의 점과 연관된 모든 유전자는 초기 식별자를 구성한다. 이후, 이 식별자는 최종 식별자에 도달하도록 가능한 정확성의 소실 없이 축소된다. SVM-RFE에 의해, 교차 검증 단계는 과적합을 피하는 데 중요하다.
검증 절차를 위해, 분류자의 보편성을 추가로 보장하기 위해, 본 발명자들은 분석으로부터 모든 환자의 25-30%를 보류하고 따라서 독립 검증 세트를 형성한다. 독립 검증 샘플은 훈련 세트에서 샘플의 70-75%의 분석으로부터 유도된 후보 유전자를 사용하여 분류된다. 각각의 단계에서, 식별자 검증력 계산의 민감도 및 특이성은 필요한 종점을 한정하도록 재평가된다.
본 발명자들의 분류 전략의 주요 장점 및 혁신은 식별력을 최적화하고, 유전자 조절의 이 명확한 수준 사이의 상승작용을 달성하도록 mRNA 및 miRNA를 포함하는 다수의 데이터 유형을 도입하는 것이다. 이러한 다봉형 분석은 암 진단에 대한 큰 가능성을 제공한다. 따라서, mRNA 및 miRNA는, 데이터의 오직 일 유형을 사용하거나, 모든 이용 가능한 정보를 병합하는 것으로부터 이익을 생성하는, 최고의 식별자를 확인하기 위해, 독립적으로 및 병합된 데이터세트로서 둘 다로 사용된다. 각각의 플랫폼으로부터의 데이터는 별개로 정량화되고, 정규화되고, 본 발명자들이 mRNA에 이전에 적용한 비지도된 분류 기법에 의해 분석된다.
각각의 이들 기법으로부터의 데이터는, t-시험에 의해 분석된, 정량적인 차등적으로 발현된 변수이고, 데이터의 각각의 유형에 대한 유의미한 변수는 SVM-RFE에 의해 별개로 및 조합된 데이터세트로 둘 다로 추가로 분석된다. 본 발명자들은 가장 작은 변수 세트가 데이터의 유형 둘 다 중 일부를 함유한다고 기대한다. 특히, 단일의 유익한 miRNA는 이것이 조절하는 다수의 mRNA 종만큼 유용하고, 따라서 이것을 대체할 것이다. 식별자에 포함되는, SVM-RFE에 의해 결정된 유전자 또는 miRNA의 세트는, 비교되는 샘플의 임의의 소정의 2개의 군을 구별하고 새로운 치료학적 표적을 확인할 가능성을 가지는 공통 기능 또는 경로를 확인하기 위해 추가로 분석될 수 있다.
진단학적 알고리즘의 개발 및 실행:
본 발명자들의 이전에 공개된 유전자 서명에 기초하여, 본 발명자들은 30개 초과의 유전자 프로브 및/또는 20개 미만의 miRNA 프로브의 서명을 확인하였다. mRNA 및 miRNA의 분류 정확성은 정규화되고 별도로 처리되는 각각의 데이터 유형에 따라 별도로 평가된다. 오픈어레이 시스템은 본 발명자들이 고출력 플랫폼에서 후보 유전자를 시험할 수 있는 커스텀화 어레이를 개발하도록 허용한다. 게다가, 나노스트링 플랫폼은 상업용 시험을 추가로 시험하고 실행하기 위한 쉽고 튼튼한 시스템을 제공한다. mRNA 및 miRNA 플랫폼은 둘 다 전체 중 얼마나 많이 샘플에 존재하는지의 측정치인 수를 궁극적으로 발생시킨다. 이것은 분류에 대한 최종 데이터가 하나의 매트릭스로 조합되고 단일 분류자로서 사용될 수 있다는 것을 의미한다. 샘플 종류, 분석 전략 및 샘플 및 이의 하위유형의 수는 표 4에 요약되어 있다.
Figure pct00024
분석에서 415개의 전체 샘플 중에서, 345개의 샘플은 분명하게 배정된 암(LC) 또는 대조군(NOD 또는 SC) 표지(세트 A)을 가졌고, 훈련 및 시험 목적에 사용되었다. 남은 70개의 샘플은 폐 절제 후 샘플 및 차후에 LC를 발생시킨 결절 환자로부터의 샘플의 불분명한 표현형을 가지는 샘플(세트 B)를 포함하였고, 345개의 분명하게 배정된 샘플(사례 또는 대조군으로서 임상적으로 확인되었지만 절제 후 샘플을 포함하지 않음)에 대해 개발된 분류자에 의한 추가의 분류에 사용되었다. 세트 둘 다로부터의 샘플은 훈련 세트에 대한 70%(세트 A에 대해 242개의 샘플) 및 시험 세트에 대한 파기 30%(세트 A에 대해 103개의 샘플)로 무작위로 분할되었다.
훈련 세트는, 각각의 단계에서 전체 훈련 정확성을 개선하는 하나의 최고의 변수(유전자 또는 miRNA)를 선별하는 동경 기초 함수(Radial Basis Function: RBF) 커널 및 전진 변수 선택(FFS)을 이용하여 10배 교차 검증 루틴에 의해 SVM에 의한 최고의 분류자를 확인하도록 사용되었다. 대안적으로, 본 발명자들은, 본 발명자들이 과거 8번에 성공적으로 사용한, 선형 커널 및 중복 변수 제거(RFE)를 사용하도록 시도하였지만, RBF 커널과 함께 전진 변수 선택은 예비 훈련 세트에 대한 더 우수한 정확성을 제공하였다. 이후, 최고의 훈련 정확성을 제공한 변수의 수에 대해 지어진 분류자는 최종 분류자로서 선택되고, 불편 정확성을 예상하도록 독립적인 파기 시험 세트에 적용되었다.
기재된 분류자 개발 프로세스를 이용하여, 본 발명자들은 비교를 위한 3개의 상이한 분류자를 생성하도록 이 데이터세트를 사용하였다: (1) 오직 mRNA 데이터를 사용; (2) 오직 miRNA 발현 데이터를 사용, 및 (3) 조합된 mRNA 및 miRNA 데이터를 분석. 각각의 데이터세트/분류 분석은 시험 세트 성능에 기초한 보고서를 발생시켰고, 정확성, 감수성, 특이성 및 ROC 곡선 하 면적(AUC)을 포함하였다. 결과는 표 5에 기재되어 있다.
Figure pct00025
표에 따르면, 최고의 정확성은, 동일한 분류에서 플랫폼 둘 다를 사용하는 것의 이점을 나타내는, 동일한 시간에 mRNA 및 miRNA 데이터 둘 다(145개의 전체 변수)를 사용한, 모든 대조군 분류자(83% 정확성)에 대한 일반 암에 의해 달성된다. 조합된 분류자에 대한 ROC AUC는 도 2에 도시되어 있다.
분류자에 의해 배정된 독립적인 시험 세트로부터의 각각의 샘플에 대한 개별 점수는 도 3에서 SVM 선도에 도시되어 있고, 여기서 각각의 샘플은 SVM 분류자에 의해 배정된 점수를 받았다. 양의 점수는 암으로서 및 음의 점수는 대조군으로서 분류를 나타낸다. 각각의 열은 환자를 나타내고, 열의 높이는 분류의 강도 또는 신뢰도의 측정치로서 해석될 수 있다. 도시된 분류는 분류를 위한 전통적인 0점 컷오프를 사용한다. 그래프는 73.5%에서의 특이성으로 92.6%에서의 민감도를 최대화하는 컷오프를 보여준다.
도 4는 이 방법론의 예비 결과를 보여준다: 일루미나 HT12v4 mRNA 어레이 및 ABI 오픈어레이 PCR 플랫폼에서의 miRNA를 사용하여 345개의 샘플을 처리하고 분석하였다. 독립적인 시험 세트를 완전히 보장하기 위해, 242개(70%)는 훈련 세트이고, 103개(30%)는 시험 샘플이었다.
본 개시내용에 걸쳐 인용된 각각의 및 모든 특허, 특허 출원, 예컨대 2015년 5월 19일에 출원된 미국 가특허 출원 제62/163,766호, 및 공보, 예컨대 웹사이트는 본 명세서에서 그 전문이 참고로 명확히 포함된다. 본 발명이 구체적인 실시형태를 참조하여 개시되어 있지만, 본 발명의 다른 실시형태 및 변형이 본 발명의 정신 및 범위로부터 벗어나지 않으면서 당해 분야의 당업자에 의해 고안된다는 것이 명확하다. 첨부된 청구항은 이러한 실시형태 및 균등한 변형을 포함한다.
SEQUENCE LISTING <110> THE WISTAR INSTITUTE OF ANATOMY AND BIOLOGY <120> METHODS AND COMPOSITIONS FOR DIAGNOSING OR DETECTING LUNG CANCERS <130> WO2016/187404 <140> PCT/US2016/033232 <141> 2016-05-19 <150> US 62/163,766 <151> 2015-05-19 <160> 292 <170> PatentIn version 3.5 <210> 1 <211> 22 <212> RNA <213> Homo sapiens <400> 1 caaagaauuc uccuuuuggg cu 22 <210> 2 <211> 50 <212> DNA <213> Homo sapiens <400> 2 gattgcaggg tccgccttct caaaccccac ttcctggacc acatcatcca 50 <210> 3 <211> 21 <212> RNA <213> Homo sapiens <400> 3 uaaagugcug acagugcaga u 21 <210> 4 <211> 22 <212> RNA <213> Homo sapiens <400> 4 cagugcaaug uuaaaagggc au 22 <210> 5 <211> 50 <212> DNA <213> Homo sapiens <400> 5 gtcccaaaga gtttgatgag gccctccaca cctgcggccc aatccaaggt 50 <210> 6 <211> 21 <212> RNA <213> Homo sapiens <400> 6 uaccacaggg uagaaccacg g 21 <210> 7 <211> 50 <212> DNA <213> Homo sapiens <400> 7 tcaacgccag gaatcatgaa gagacttctg cttttcaacc cccaccctcc 50 <210> 8 <211> 50 <212> DNA <213> Homo sapiens <400> 8 tctggaggct gggaagtcca agatcaaggc gtcagaagat tcattgtctg 50 <210> 9 <211> 22 <212> RNA <213> Homo sapiens <400> 9 uagcuuauca gacugauguu ga 22 <210> 10 <211> 50 <212> DNA <213> Homo sapiens <400> 10 gcctgaggtg acagacaggg caggtggtaa caaaaccgtt gaacctccca 50 <210> 11 <211> 50 <212> DNA <213> Homo sapiens <400> 11 aagctgttga aggtgagggt ggtgtacgaa gtgccactgt tcctgtaagc 50 <210> 12 <211> 50 <212> DNA <213> Homo sapiens <400> 12 agaaggaggg tttctggctg tggttctaaa tggagcccca ggaagctgcc 50 <210> 13 <211> 50 <212> DNA <213> Homo sapiens <400> 13 cactgtcgtc cttcctcaga gggcctcacg ccaaacaaac ggccttttcg 50 <210> 14 <211> 50 <212> DNA <213> Homo sapiens <400> 14 gctaacatcc attccctttc ataccaccat tttcaccctg tttcttcccc 50 <210> 15 <211> 50 <212> DNA <213> Homo sapiens <400> 15 ggtccaggtg aatctcgtca taagtgatct caggctctca caggatccgg 50 <210> 16 <211> 50 <212> DNA <213> Homo sapiens <400> 16 aaactcaagg actgcgtgac cgacacaatg acccccgagg agacagaggc 50 <210> 17 <211> 50 <212> DNA <213> Homo sapiens <400> 17 ccttgctgcc tacccttttc tctcctctgg ttctcaacct caacgagttc 50 <210> 18 <211> 50 <212> DNA <213> Homo sapiens <400> 18 ccaaacactc tccctaccca ttcctgccag ctctgcctcc ttttcaactc 50 <210> 19 <211> 50 <212> DNA <213> Homo sapiens <400> 19 caggttgcaa tatgaggact tctctgtctc ctctgaagcc tgggacactg 50 <210> 20 <211> 50 <212> DNA <213> Homo sapiens <400> 20 gaaagaaatg agcagctttg gataatgacg acagcaaccc gaagacaggg 50 <210> 21 <211> 50 <212> DNA <213> Homo sapiens <400> 21 gctcgtgtgc tacaatggca gagttgagca gtggtgacaa accatgcgac 50 <210> 22 <211> 50 <212> DNA <213> Homo sapiens <400> 22 gccaagtgcc atttggggtc agcatcctcg tttcaacaca gtgtgctctc 50 <210> 23 <211> 50 <212> DNA <213> Homo sapiens <400> 23 gtcagtccaa ggaggtatgt tcttccacaa cagccttctc agcctctgct 50 <210> 24 <211> 50 <212> DNA <213> Homo sapiens <400> 24 cagaagaggg agacctggag accgttacga cggcatggtt ggtttcagtg 50 <210> 25 <211> 50 <212> DNA <213> Homo sapiens <400> 25 gcttgctgct ttctggctaa tgaaagccaa ggactatcca gcacacacag 50 <210> 26 <211> 50 <212> DNA <213> Homo sapiens <400> 26 gcaggtcatg cacacagttt tgataaaggg cagtaacaag tattggggcc 50 <210> 27 <211> 50 <212> DNA <213> Homo sapiens <400> 27 gactggcaag gtttcctaga gctctactta cagaacagcc ctgaggcctg 50 <210> 28 <211> 50 <212> DNA <213> Homo sapiens <400> 28 gcctgccgga tgatgaatgg catgaagctg agtggccgag agattgacgt 50 <210> 29 <211> 23 <212> RNA <213> Homo sapiens <400> 29 agcuacauug ucugcugggu uuc 23 <210> 30 <211> 50 <212> DNA <213> Homo sapiens <400> 30 tgtctgtcat tgtggcccgt ttcacactgt ctctatatct gtttcccctg 50 <210> 31 <211> 50 <212> DNA <213> Homo sapiens <400> 31 agtcttcatc tgtccgacaa gttcactcgc ctcggttgcg gacctaggac 50 <210> 32 <211> 50 <212> DNA <213> Homo sapiens <400> 32 gccgcctcgc aagctcttgt tttctaaccc caccttctgg gagccgtgtt 50 <210> 33 <211> 50 <212> DNA <213> Homo sapiens <400> 33 gtcatgatct gctcggaatc ctcctgctaa agaaggctct gggcgtgagc 50 <210> 34 <211> 21 <212> RNA <213> Homo sapiens <400> 34 aauggcgcca cuaggguugu g 21 <210> 35 <211> 50 <212> DNA <213> Homo sapiens <400> 35 ggagtatggg agagagggac tgccacacag aagctgaaga caacacctgc 50 <210> 36 <211> 50 <212> DNA <213> Homo sapiens <400> 36 ccaccccatt cggttcttct gcctgacctt caaatgccca tgttggcctt 50 <210> 37 <211> 21 <212> RNA <213> Homo sapiens <400> 37 uccgguucuc agggcuccac c 21 <210> 38 <211> 23 <212> RNA <213> Homo sapiens <400> 38 aaaagugcuu acagugcagg uag 23 <210> 39 <211> 50 <212> DNA <213> Homo sapiens <400> 39 agactcctcc agaccaggaa ccccagaagg agacagagcc tgccacatcc 50 <210> 40 <211> 50 <212> DNA <213> Homo sapiens <400> 40 ccggaaagtc taccaagctg tgcggcacaa taaagccacg gaaaacaagg 50 <210> 41 <211> 50 <212> DNA <213> Homo sapiens <400> 41 cacctgtggg cagtgggcag tgtcttggtg aaagggagcg gatactactt 50 <210> 42 <211> 50 <212> DNA <213> Homo sapiens <400> 42 gaggccaggc tgaaatgtca tatctgaagg aagaaagcag cagctggaca 50 <210> 43 <211> 50 <212> DNA <213> Homo sapiens <400> 43 cagcgttaat cctgtatggc caggaaactg agtagactcc tgtgtaaccc 50 <210> 44 <211> 50 <212> DNA <213> Homo sapiens <400> 44 ctgatctcag tgtctggttt gctgggtacc cttctgctca tcatcctgac 50 <210> 45 <211> 17 <212> RNA <213> Homo sapiens <400> 45 ucucgcuggg gccucca 17 <210> 46 <211> 50 <212> DNA <213> Homo sapiens <400> 46 atcgggagga cctgtatgcc tgaccgtttc cctgcctcct gcttcagcct 50 <210> 47 <211> 50 <212> DNA <213> Homo sapiens <400> 47 ggtgaccagc agagtggtta tgggaaggta tccaggcgag gtggtcatca 50 <210> 48 <211> 50 <212> DNA <213> Homo sapiens <400> 48 taagattgct agggaaaagg gccctatgtg tcaggcctct gagcccaagc 50 <210> 49 <211> 50 <212> DNA <213> Homo sapiens <400> 49 agctgccctc attccgactt cagaaaatcg aagcagctgg cgcctcccct 50 <210> 50 <211> 22 <212> RNA <213> Homo sapiens <400> 50 ggauaucauc auauacugua ag 22 <210> 51 <211> 50 <212> DNA <213> Homo sapiens <400> 51 cctctcgcct ggaggatctg tgccatcttg gattgagaat tgcagatgtg 50 <210> 52 <211> 50 <212> DNA <213> Homo sapiens <400> 52 ttcaccatcg tcttcaatgc ccatgagcct ttccgccggg gtacaggtgt 50 <210> 53 <211> 50 <212> DNA <213> Homo sapiens <400> 53 gaatccgatg gtcctcgaaa catggaaagt ctgctgtcac gctgcacgcc 50 <210> 54 <211> 50 <212> DNA <213> Homo sapiens <400> 54 tgccggaagt cactaccaag gatcgataca catttaggaa agccagcact 50 <210> 55 <211> 23 <212> RNA <213> Homo sapiens <400> 55 caaagugcuc auagugcagg uag 23 <210> 56 <211> 50 <212> DNA <213> Homo sapiens <400> 56 ggagagggtg acctggctgc tggtttacca ctgtaccaac atctctggag 50 <210> 57 <211> 50 <212> DNA <213> Homo sapiens <400> 57 gggcttttac tttggagcac tctgtgtgaa gctgtttggt ggaacccatg 50 <210> 58 <211> 50 <212> DNA <213> Homo sapiens <400> 58 gggcttttac tttggagcac tctgtgtgaa gctgtttggt ggaacccatg 50 <210> 59 <211> 50 <212> DNA <213> Homo sapiens <400> 59 cctgaactga tgggtttctc cagagggaat tgcagagtac tggctgatgg 50 <210> 60 <211> 22 <212> RNA <213> Homo sapiens <400> 60 gcugacuccu aguccagggc uc 22 <210> 61 <211> 50 <212> DNA <213> Homo sapiens <400> 61 gcttcttacc tgtgcgggag cgaaaaagct gggcttcaac atggcaggtc 50 <210> 62 <211> 22 <212> RNA <213> Homo sapiens <400> 62 ugagguagga gguuguauag uu 22 <210> 63 <211> 50 <212> DNA <213> Homo sapiens <400> 63 cactctatgg gaaactcttc agcacctacc tgcgcccccc acacacctct 50 <210> 64 <211> 50 <212> DNA <213> Homo sapiens <400> 64 cccagcccta gatgtatcca agccctccta ccctcaccag ttatttctgg 50 <210> 65 <211> 50 <212> DNA <213> Homo sapiens <400> 65 ctccaaatgt caaaggcaag ctgggcatca tgatctggca taaagaaccc 50 <210> 66 <211> 50 <212> DNA <213> Homo sapiens <400> 66 gcccagggcc gccctagcaa cttcctgtac atatgactgt aaaatggtaa 50 <210> 67 <211> 23 <212> RNA <213> Homo sapiens <400> 67 uaaagugcuu auagugcagg uag 23 <210> 68 <211> 50 <212> DNA <213> Homo sapiens <400> 68 ccccgagttt tgcccatatc aggacagtgg ctccttctca ctcccctttc 50 <210> 69 <211> 50 <212> DNA <213> Homo sapiens <400> 69 gcggcacagt cccacttccc catctcccca agtaggtggt gttagaaaac 50 <210> 70 <211> 50 <212> DNA <213> Homo sapiens <400> 70 gaaagcggcc tcatgaaggg gaagccaagg gtgccgagac cacaaagcgc 50 <210> 71 <211> 50 <212> DNA <213> Homo sapiens <400> 71 agtcgtcctt ccctggtgcg cagcccaggc ctgtgggtcc agcctcaccc 50 <210> 72 <211> 50 <212> DNA <213> Homo sapiens <400> 72 atggccatga cccagaagta tgaggagcat gtgcgggagc agcaggctca 50 <210> 73 <211> 50 <212> DNA <213> Homo sapiens <400> 73 gcctgaggga ccgcagactc gtcgggctgc tttctgatga gaggattaac 50 <210> 74 <211> 50 <212> DNA <213> Homo sapiens <400> 74 ggaaagtgaa gatgcagagt tactgtggcg tttggcacgg gcatcacgtg 50 <210> 75 <211> 50 <212> DNA <213> Homo sapiens <400> 75 accgatcttt ctctgtctca ccaacctgac aaaaaaggtg tgccaaggga 50 <210> 76 <211> 50 <212> DNA <213> Homo sapiens <400> 76 acgatgccag actcatgttt ggagatggaa ctcagctggt ggtgaagccc 50 <210> 77 <211> 50 <212> DNA <213> Homo sapiens <400> 77 cctcaaggag atgcctctgg tccaggcttt gtaaacttgg gccttccagc 50 <210> 78 <211> 50 <212> DNA <213> Homo sapiens <400> 78 gtagcactgt tctggttctg tttgcacgcc agtggggaga gaataaagag 50 <210> 79 <211> 50 <212> DNA <213> Homo sapiens <400> 79 gggcagtaca gggccagatc cacggcaggc acagggcaaa gccaggccca 50 <210> 80 <211> 50 <212> DNA <213> Homo sapiens <400> 80 ccaaggaatg cactaagcct tcagtctttt tagactgaca gtactggcag 50 <210> 81 <211> 50 <212> DNA <213> Homo sapiens <400> 81 ctatacccat tcccaggcct aagccagcct ctccctcctg acagtgccca 50 <210> 82 <211> 50 <212> DNA <213> Homo sapiens <400> 82 gaggcatggg ccaggtaaaa attgggccta gagtgaagac tgtgctgtcg 50 <210> 83 <211> 50 <212> DNA <213> Homo sapiens <400> 83 ggctggggtg agggctggtg gttggtgaaa gccattctta gttgtgtctc 50 <210> 84 <211> 22 <212> RNA <213> Homo sapiens <400> 84 aauugcacgg uauccaucug ua 22 <210> 85 <211> 50 <212> DNA <213> Homo sapiens <400> 85 gtcagatctc ccctccacca gccaggatcc tccttctagc tcatctgtag 50 <210> 86 <211> 50 <212> DNA <213> Homo sapiens <400> 86 gtgagccaaa atggcgctac tgcactccag accggggaca gagtgagact 50 <210> 87 <211> 18 <212> RNA <213> Homo sapiens <400> 87 gucccuguuc aggcgcca 18 <210> 88 <211> 50 <212> DNA <213> Homo sapiens <400> 88 aggagagagg tttgagttct gggtatcctc cctttctgta acagcctcaa 50 <210> 89 <211> 21 <212> RNA <213> Homo sapiens <400> 89 cauuauuacu uuugguacgc g 21 <210> 90 <211> 50 <212> DNA <213> Homo sapiens <400> 90 ctttggtccg gcaacttcaa caacagctct ctaataccca gccacagccc 50 <210> 91 <211> 50 <212> DNA <213> Homo sapiens <400> 91 ccagccatcc cattactggg taggtaccca aatcatgctg ctataaagac 50 <210> 92 <211> 50 <212> DNA <213> Homo sapiens <400> 92 cccagggcat tcagggctgg ttcagacacc attattgtga gcagcaaagc 50 <210> 93 <211> 50 <212> DNA <213> Homo sapiens <400> 93 ccgccggtgc catatgattt agaggaagat gcaggctggt cactgctccc 50 <210> 94 <211> 50 <212> DNA <213> Homo sapiens <400> 94 tcaagtcaac cctgagcagt atggggatga gtgatgcctt cagccaaagc 50 <210> 95 <211> 50 <212> DNA <213> Homo sapiens <400> 95 cataccaccc tttggtggga ggaaactaaa aatatagcaa atgcagaacc 50 <210> 96 <211> 22 <212> RNA <213> Homo sapiens <400> 96 ccuguucucc auuacuuggc uc 22 <210> 97 <211> 50 <212> DNA <213> Homo sapiens <400> 97 ctagacgctg gcactatggt catggcggag gggacggcag tgctgaggcg 50 <210> 98 <211> 50 <212> DNA <213> Homo sapiens <400> 98 cttttcgcag atgctgggaa cgcagctctg ctgccggcgg ggtggacaga 50 <210> 99 <211> 50 <212> DNA <213> Homo sapiens <400> 99 tcgtccgcat ggtgctgaat ggctgaggac cttcccagtc tccccagagt 50 <210> 100 <211> 50 <212> DNA <213> Homo sapiens <400> 100 ggatccacat ggtcttgagg gttggcatga ggagggggaa gcttttttga 50 <210> 101 <211> 50 <212> DNA <213> Homo sapiens <400> 101 aatgctgcag ttcctgatga gatcccccct ctcgagggcg atgaggatgc 50 <210> 102 <211> 50 <212> DNA <213> Homo sapiens <400> 102 gtggtagatc acttgaggtc aagagttgtg acaccagcct ggccaacctg 50 <210> 103 <211> 50 <212> DNA <213> Homo sapiens <400> 103 caaatatcat ggaggtccct ggattgaaaa aagagcctct cccactcctc 50 <210> 104 <211> 50 <212> DNA <213> Homo sapiens <400> 104 ccctgccccc aaactggcta agacagcttt cagttcctga ctccccaact 50 <210> 105 <211> 50 <212> DNA <213> Homo sapiens <400> 105 ctgagacggg caagtggttg ctccaggatt actccctcct ccaaaaaagg 50 <210> 106 <211> 50 <212> DNA <213> Homo sapiens <400> 106 ctctggcctc tgggtcccac cacccagccc cccgtgtcag aacaatcttt 50 <210> 107 <211> 50 <212> DNA <213> Homo sapiens <400> 107 tcctcgctaa ctgacattag cccattcagg tcttcacagc gctcatactg 50 <210> 108 <211> 50 <212> DNA <213> Homo sapiens <400> 108 ccccaacttc gccctgccca cttgacttca ccaaatccct tcctggagac 50 <210> 109 <211> 50 <212> DNA <213> Homo sapiens <400> 109 tgggggattt ttcagtggaa cccttgcccc caaatgtcga ccagccccca 50 <210> 110 <211> 50 <212> DNA <213> Homo sapiens <400> 110 gtaaccggtc tgcttttgcg taagccaaac acctacccaa aaatgattcc 50 <210> 111 <211> 50 <212> DNA <213> Homo sapiens <400> 111 ggccagtttt atgaagcttt ggaaggcact atggacagaa gctggtggac 50 <210> 112 <211> 50 <212> DNA <213> Homo sapiens <400> 112 ctatggagag cagccgacac cccctcttac agccgtggat gtttcctgga 50 <210> 113 <211> 50 <212> DNA <213> Homo sapiens <400> 113 ggccacggtg ctggtgtcgc tggtggagaa cggccaggcc ccaaagacgt 50 <210> 114 <211> 50 <212> DNA <213> Homo sapiens <400> 114 agtgtaccta tttacagaaa gattaaactg ccacctgcgg gcacattccc 50 <210> 115 <211> 50 <212> DNA <213> Homo sapiens <400> 115 tactgaagtc cctttgtgcc agtggatcct ggagggcctg gggctgggca 50 <210> 116 <211> 50 <212> DNA <213> Homo sapiens <400> 116 cgccgatatc tctgccgggt gactagctgc ttcctttctc tctcgcgcgc 50 <210> 117 <211> 50 <212> DNA <213> Homo sapiens <400> 117 cgactgccag ggccttagac tccacatgtc catttttgtt caggtatagc 50 <210> 118 <211> 50 <212> DNA <213> Homo sapiens <400> 118 ctcgggcatc cttcccaggg ttgggtctta cacaaataga aggctcttgc 50 <210> 119 <211> 22 <212> RNA <213> Homo sapiens <400> 119 uuauaaagca augagacuga uu 22 <210> 120 <211> 50 <212> DNA <213> Homo sapiens <400> 120 ccacagcctg tttctccctt ggattccaag ttccccatag accattccct 50 <210> 121 <211> 50 <212> DNA <213> Homo sapiens <400> 121 ccctcaactg cctttccacc acctatgatg ttggggtttc agaaaaggtg 50 <210> 122 <211> 50 <212> DNA <213> Homo sapiens <400> 122 ccacagacac cctaccgata gaacagtggc tcagatctta cttgctcctg 50 <210> 123 <211> 50 <212> DNA <213> Homo sapiens <400> 123 tacgagaccc tccctgctga gatgcgcaaa ttcactcccc agtacaaagg 50 <210> 124 <211> 50 <212> DNA <213> Homo sapiens <400> 124 gtgctgttcc actcttggct ccagcagacc cactgtccca gaaaagcctg 50 <210> 125 <211> 50 <212> DNA <213> Homo sapiens <400> 125 cccagctgaa cccgaggcta aagaagatga ggcaagagaa aatgtacccc 50 <210> 126 <211> 50 <212> DNA <213> Homo sapiens <400> 126 cagcagatca gtgggatgag ggagactgtt cacctgctgt gtactcctgt 50 <210> 127 <211> 50 <212> DNA <213> Homo sapiens <400> 127 cgtgggatct gcacacgtct ttgtcagttg tggtcatgat cttagtcacc 50 <210> 128 <211> 50 <212> DNA <213> Homo sapiens <400> 128 ggagtgtggc agacgttgtg cggttcatca gatccactga ctgtgctcca 50 <210> 129 <211> 50 <212> DNA <213> Homo sapiens <400> 129 tctgctggac tgatgtcttc tgcaggttgc agatcctgac catgggctgc 50 <210> 130 <211> 50 <212> DNA <213> Homo sapiens <400> 130 cgtcagtgcc ttcggactgt ctatttgacc tgcagtccag cctatggcct 50 <210> 131 <211> 50 <212> DNA <213> Homo sapiens <400> 131 acttgtccac ggtcctctcg gtgaccctgt tgggcagggc caagggacaa 50 <210> 132 <211> 50 <212> DNA <213> Homo sapiens <400> 132 cgcctaccga catgatcaga aaggctcatg ctttatccag accctggtgg 50 <210> 133 <211> 50 <212> DNA <213> Homo sapiens <400> 133 acatcgcccc ttctgcttca gtgtgaaagg ccacgtgaag atgctgcggc 50 <210> 134 <211> 50 <212> DNA <213> Homo sapiens <400> 134 cctgagccag aagtggggtg cttatactcc caaaccttga gtgtccagcc 50 <210> 135 <211> 50 <212> DNA <213> Homo sapiens <400> 135 aaattgaaca caaatgtggt ggagacggga cagggcaggt ggaaattcac 50 <210> 136 <211> 50 <212> DNA <213> Homo sapiens <400> 136 ggcagagaag gaggccaaga agccaaccat caagaagccc ctcaatgcct 50 <210> 137 <211> 50 <212> DNA <213> Homo sapiens <400> 137 cccaggctgg tcttacagcc tcaggcaatc ctctggtctt gacgtcccaa 50 <210> 138 <211> 50 <212> DNA <213> Homo sapiens <400> 138 aggccgagtg gtttgaggac gatgtcatac agcgcaagag ggagctgtgg 50 <210> 139 <211> 50 <212> DNA <213> Homo sapiens <400> 139 taacttccag gagttcctca ttctggtgat aaagatgggc gtggcagccc 50 <210> 140 <211> 50 <212> DNA <213> Homo sapiens <400> 140 cttcctgatt gacaacagtg ttagacaagg tgcaaagcga aactggttgc 50 <210> 141 <211> 50 <212> DNA <213> Homo sapiens <400> 141 agtgctcctg ttgcaggact gctgggaaaa caggtggtgt gggacttaag 50 <210> 142 <211> 50 <212> DNA <213> Homo sapiens <400> 142 cagccagtgc caacttcgct gccaactttg gtgccattgg tttcttctgg 50 <210> 143 <211> 50 <212> DNA <213> Homo sapiens <400> 143 gaagttgtca cctccctaca gctccccaca ggagtttgcc caggatgtgg 50 <210> 144 <211> 50 <212> DNA <213> Homo sapiens <400> 144 acagctttgc tactgcgaaa tcttggcttc actgccatcc ccctccatgg 50 <210> 145 <211> 50 <212> DNA <213> Homo sapiens <400> 145 ccccaccccc gcgttccgac cgctgaagct ccaaattcag gccttaaata 50 <210> 146 <211> 22 <212> RNA <213> Homo sapiens <400> 146 agagguagua gguugcauag uu 22 <210> 147 <211> 22 <212> RNA <213> Homo sapiens <400> 147 caaagaauuc uccuuuuggg cu 22 <210> 148 <211> 50 <212> DNA <213> Homo sapiens <400> 148 catttctgta aggcaatctt ggcacacgtg gggcttacca gtggcccagg 50 <210> 149 <211> 50 <212> DNA <213> Homo sapiens <400> 149 cctgtgcctt gccagtggga ttccttgtgt gtctcatgtc tgggtccatg 50 <210> 150 <211> 50 <212> DNA <213> Homo sapiens <400> 150 gaagcatacc cagggaagaa gctgttgccg gatgacccct atgagaaagc 50 <210> 151 <211> 21 <212> RNA <213> Homo sapiens <400> 151 uaaagugcug acagugcaga u 21 <210> 152 <211> 50 <212> DNA <213> Homo sapiens <400> 152 cgacactgac tactgaccgt gcgggtgctc tcaccctccc ttctctccct 50 <210> 153 <211> 50 <212> DNA <213> Homo sapiens <400> 153 tctgtgccct ttatccgcac ttcccagctc acagcactga caaccggtga 50 <210> 154 <211> 50 <212> DNA <213> Homo sapiens <400> 154 gcacccagcg gaatgtgctt agtatttggt caccagccgt catcctgggc 50 <210> 155 <211> 50 <212> DNA <213> Homo sapiens <400> 155 cagaagaggg agacctggag accgttacga cggcatggtt ggtttcagtg 50 <210> 156 <211> 50 <212> DNA <213> Homo sapiens <400> 156 gcatctccag tgcctggaca gattccaatt cacagagcac aggtgccacc 50 <210> 157 <211> 50 <212> DNA <213> Homo sapiens <400> 157 gactggcaag gtttcctaga gctctactta cagaacagcc ctgaggcctg 50 <210> 158 <211> 23 <212> RNA <213> Homo sapiens <400> 158 uaaggugcau cuagugcaga uag 23 <210> 159 <211> 50 <212> DNA <213> Homo sapiens <400> 159 tcaacgccag gaatcatgaa gagacttctg cttttcaacc cccaccctcc 50 <210> 160 <211> 50 <212> DNA <213> Homo sapiens <400> 160 gctcaaggct ggcaaaatcc caaaaccagg gccaaggagt ggacgcttct 50 <210> 161 <211> 50 <212> DNA <213> Homo sapiens <400> 161 ggctggagct gggagaggtg ctgagctaac agtgccaaca agtgctcctt 50 <210> 162 <211> 50 <212> DNA <213> Homo sapiens <400> 162 ccttgctgcc tacccttttc tctcctctgg ttctcaacct caacgagttc 50 <210> 163 <211> 50 <212> DNA <213> Homo sapiens <400> 163 ggcagtacag ggcaccatca ctgaccttcc cgaccactta ctctcctatg 50 <210> 164 <211> 50 <212> DNA <213> Homo sapiens <400> 164 ggatggcctg gaacccatgt cagtctctca ccacctccag cttcgatgat 50 <210> 165 <211> 50 <212> DNA <213> Homo sapiens <400> 165 ttgcttgtgt gcatgtgttg ggtgcatgct tccgggtctc agctgcccca 50 <210> 166 <211> 23 <212> RNA <213> Homo sapiens <400> 166 ugagcgccuc gacgacagag ccg 23 <210> 167 <211> 50 <212> DNA <213> Homo sapiens <400> 167 gggccttatt tccactttgt aattccagcg agtcgacttc ccatcctgag 50 <210> 168 <211> 50 <212> DNA <213> Homo sapiens <400> 168 acttaaaaaa tacttcgttt atcacatctc aggaactaaa ctgggttaag 50 <210> 169 <211> 50 <212> DNA <213> Homo sapiens <400> 169 tgcaagggac agggggcctg actacccagt ctttgacttg tatcctctcc 50 <210> 170 <211> 50 <212> DNA <213> Homo sapiens <400> 170 tcacttggga gggacgcata gaaggagctc taggaacaca gtgccagtgc 50 <210> 171 <211> 50 <212> DNA <213> Homo sapiens <400> 171 gtgcctcagg ttaatggtga aaatacagag agacatgctc agccaccacc 50 <210> 172 <211> 50 <212> DNA <213> Homo sapiens <400> 172 gacctgactc cactcttaaa cctgggtctt ctccttggcg gtgctgtcag 50 <210> 173 <211> 50 <212> DNA <213> Homo sapiens <400> 173 tctgatcttc ctgcggctga accgcccggc tgagccgaca ttgccggcgt 50 <210> 174 <211> 50 <212> DNA <213> Homo sapiens <400> 174 tgaggctctg gtgctcaggg ggatggcttg ggccttttct ctcaaccttg 50 <210> 175 <211> 50 <212> DNA <213> Homo sapiens <400> 175 atccagagca tggagcccga ccccagccag cgccttccac tccatcattt 50 <210> 176 <211> 50 <212> DNA <213> Homo sapiens <400> 176 gagggactgt cgctgtgatc agagtgggtt aagctgacca ggaacaccca 50 <210> 177 <211> 50 <212> DNA <213> Homo sapiens <400> 177 ccgagggacg gggtcgtttt tctctgcgtt cagtggattt ccgtcttttg 50 <210> 178 <211> 50 <212> DNA <213> Homo sapiens <400> 178 aggatggcct ggaacccatg tcagtctctc accacctcca gcttcgatga 50 <210> 179 <211> 22 <212> RNA <213> Homo sapiens <400> 179 ugagguagua gguuguauag uu 22 <210> 180 <211> 50 <212> DNA <213> Homo sapiens <400> 180 gctaaggctg gtgtcccttt accaccaaac ctaaagcctg cacctccacc 50 <210> 181 <211> 50 <212> DNA <213> Homo sapiens <400> 181 ctctcctgct gggacaccgc ttgggctttg gtattgactg agtggctgac 50 <210> 182 <211> 50 <212> DNA <213> Homo sapiens <400> 182 gtgctctgta ccagtgctca tcatcccttc ttcataccaa cggtccctag 50 <210> 183 <211> 50 <212> DNA <213> Homo sapiens <400> 183 cttggcccga gcccctccgt gaggaacaca atctcaatcg ttgctgaatc 50 <210> 184 <211> 50 <212> DNA <213> Homo sapiens <400> 184 cctgctccac tggcccaaat cagtacccca atgttcttgc cttctgccca 50 <210> 185 <211> 50 <212> DNA <213> Homo sapiens <400> 185 taaggccctg cactgaaaat gcaagctcag gcgccggtgg tcgttgtgac 50 <210> 186 <211> 50 <212> DNA <213> Homo sapiens <400> 186 ccagtgtcac tatgatgtca gtgaggtctg gggatgagga cagtgtgtcc 50 <210> 187 <211> 50 <212> DNA <213> Homo sapiens <400> 187 cactgatttg acatagtctg gctgtaccca ggaatggagc ctgcacggtg 50 <210> 188 <211> 50 <212> DNA <213> Homo sapiens <400> 188 gtcagatctc ccctccacca gccaggatcc tccttctagc tcatctgtag 50 <210> 189 <211> 50 <212> DNA <213> Homo sapiens <400> 189 atcgagtcct acaatgctac cctctccgtc catcagttgg tagagaacac 50 <210> 190 <211> 50 <212> DNA <213> Homo sapiens <400> 190 gctggaacct gaagtctaaa caccattcct gctctccagc ttcctttccc 50 <210> 191 <211> 50 <212> DNA <213> Homo sapiens <400> 191 ctgcagctgg gagcctgctt tctgccagtc ttgaggttct gaagatcagc 50 <210> 192 <211> 50 <212> DNA <213> Homo sapiens <400> 192 ctgtacagtc atgtgccacg taacagcgtc tgggtcagtg acggacactt 50 <210> 193 <211> 50 <212> DNA <213> Homo sapiens <400> 193 tccctggaac tcaataactc atttcactgg ctctttatcg agagtactag 50 <210> 194 <211> 50 <212> DNA <213> Homo sapiens <400> 194 gtctggaggg aaatctggcg aaaccttcgt ttgagggact gatgtgagtg 50 <210> 195 <211> 50 <212> DNA <213> Homo sapiens <400> 195 cacctgtggg cagtgggcag tgtcttggtg aaagggagcg gatactactt 50 <210> 196 <211> 50 <212> DNA <213> Homo sapiens <400> 196 cggacgctgt tctaaaaaag gtctcctgca gatctgtctg ggctgtgatg 50 <210> 197 <211> 50 <212> DNA <213> Homo sapiens <400> 197 attgcctctg acgtctggtc ttttggagtc actctgcatg agctgctgac 50 <210> 198 <211> 50 <212> DNA <213> Homo sapiens <400> 198 gctgaggggt aagaggttgt tgtagttgtc ctggtgcctc catcagactc 50 <210> 199 <211> 50 <212> DNA <213> Homo sapiens <400> 199 ggaagccagg tgcctttaat ccactgtaac ctcacaactc caagtccaca 50 <210> 200 <211> 50 <212> DNA <213> Homo sapiens <400> 200 ctaggactgg gcccgagggt ggtttacctg caccgttgac tcagtatagt 50 <210> 201 <211> 50 <212> DNA <213> Homo sapiens <400> 201 ttccgtccaa caactctgta gagctctctg cacccttacc cctttccacc 50 <210> 202 <211> 50 <212> DNA <213> Homo sapiens <400> 202 cataccggct ggccacggga agcgatgata actgcgcggc attctttgag 50 <210> 203 <211> 50 <212> DNA <213> Homo sapiens <400> 203 gctcctgctg caaccgctgt gaatgctgct gagaacctcc ctctatgggg 50 <210> 204 <211> 50 <212> DNA <213> Homo sapiens <400> 204 cccctggagt ccgagaagga aaatggaatt ctggttcata ctgtggtccc 50 <210> 205 <211> 50 <212> DNA <213> Homo sapiens <400> 205 ccgccggtgc catatgattt agaggaagat gcaggctggt cactgctccc 50 <210> 206 <211> 50 <212> DNA <213> Homo sapiens <400> 206 ccaccccatt cggttcttct gcctgacctt caaatgccca tgttggcctt 50 <210> 207 <211> 50 <212> DNA <213> Homo sapiens <400> 207 ccggggcttc cacctgactt cctggactct gaggtcaact tattcctggt 50 <210> 208 <211> 50 <212> DNA <213> Homo sapiens <400> 208 agaaagggtt tttatggacc aatgccccag ttgtcagtca gagccgttgg 50 <210> 209 <211> 50 <212> DNA <213> Homo sapiens <400> 209 tcctcacagg acagaagcag agtgggtggt ggttatgttt gacagaaggc 50 <210> 210 <211> 22 <212> RNA <213> Homo sapiens <400> 210 uagcuuauca gacugauguu ga 22 <210> 211 <211> 50 <212> DNA <213> Homo sapiens <400> 211 ctttggtccg gcaacttcaa caacagctct ctaataccca gccacagccc 50 <210> 212 <211> 50 <212> DNA <213> Homo sapiens <400> 212 catatacgtg tgccgggtcc aggagggcaa cgagtcatac cagcagtcct 50 <210> 213 <211> 50 <212> DNA <213> Homo sapiens <400> 213 gctctgattt ccggggcagc ctttcagatg cggcagacat acaacacctg 50 <210> 214 <211> 50 <212> DNA <213> Homo sapiens <400> 214 ccctgccccc aaactggcta agacagcttt cagttcctga ctccccaact 50 <210> 215 <211> 50 <212> DNA <213> Homo sapiens <400> 215 cactgccgtc ccccaaggtc cagaatgtca gctcgcctca caagtcagaa 50 <210> 216 <211> 22 <212> RNA <213> Homo sapiens <400> 216 cacuagauug ugagcuccug ga 22 <210> 217 <211> 50 <212> DNA <213> Homo sapiens <400> 217 gcatcctcct gtgtatggaa gagacaggtg accgctccag gttgggtgct 50 <210> 218 <211> 50 <212> DNA <213> Homo sapiens <400> 218 gagccggggc accttgctgt tcgctgctgt gtcgtcttct aatgtgagct 50 <210> 219 <211> 50 <212> DNA <213> Homo sapiens <400> 219 agataggcca gagcgtggac gaggtggaga agctcatcaa gcgccacgag 50 <210> 220 <211> 50 <212> DNA <213> Homo sapiens <400> 220 tcacactggc gctaagccct acaagtgtca ggactgtgga aaagccttcc 50 <210> 221 <211> 50 <212> DNA <213> Homo sapiens <400> 221 cccctgtggg ggccaaagtt tttatgtggg cagatgctgt ggtcaggaac 50 <210> 222 <211> 50 <212> DNA <213> Homo sapiens <400> 222 caatggcgtg tacccatgta ttgcacaagg agtgtatcaa attctgggcc 50 <210> 223 <211> 50 <212> DNA <213> Homo sapiens <400> 223 gcaagtacag aaggaatcta ttctcagcag ggcatagggc acgcactggc 50 <210> 224 <211> 50 <212> DNA <213> Homo sapiens <400> 224 tcgggttcct gcgctgacac ctggtctgtg cacctgtgtt gctcacagtt 50 <210> 225 <211> 50 <212> DNA <213> Homo sapiens <400> 225 atgctgtctg tgtggaacaa gcgtcgcaat gaggactctc tacaggaccc 50 <210> 226 <211> 50 <212> DNA <213> Homo sapiens <400> 226 gagctctgaa gctttgaatc attcagtggt ggagatggcc ttctggtaac 50 <210> 227 <211> 50 <212> DNA <213> Homo sapiens <400> 227 tggctcccaa ctcctcccta tcctaaaggc ccactggcat taaagtgctg 50 <210> 228 <211> 51 <212> DNA <213> Homo sapiens <400> 228 ctgctccgac agcagcccca ggaaatacgg gaatggttca gggaccaagt v 51 <210> 229 <211> 50 <212> DNA <213> Homo sapiens <400> 229 ctcctggaaa taaacaagct aattcctcta tgccaccagc tccagacagt 50 <210> 230 <211> 50 <212> DNA <213> Homo sapiens <400> 230 ggtgaccagc agagtggtta tgggaaggta tccaggcgag gtggtcatca 50 <210> 231 <211> 50 <212> DNA <213> Homo sapiens <400> 231 tgggcggggc aggcctcctt tgttctccac aatctactgt ctccgagtgt 50 <210> 232 <211> 50 <212> DNA <213> Homo sapiens <400> 232 gagctctaac ctctccccga cccctgcagt atctcccttt gttcagtctt 50 <210> 233 <211> 50 <212> DNA <213> Homo sapiens <400> 233 aggctttagc cctggaccca gcaggtgagg ctcggcttgg attattctgc 50 <210> 234 <211> 50 <212> DNA <213> Homo sapiens <400> 234 gatgacacct ttgaggccct gtgcatcgag ccgttttcca gcccgccaga 50 <210> 235 <211> 50 <212> DNA <213> Homo sapiens <400> 235 tgtactgtaa cctcacaact ccaagtccac agaatatttc aaactgcagg 50 <210> 236 <211> 50 <212> DNA <213> Homo sapiens <400> 236 gggagggcaa gctggattta caggtcacgg ctggactgaa tgggcctttt 50 <210> 237 <211> 50 <212> DNA <213> Homo sapiens <400> 237 tgaggtcagc agtttgtatg agacatagct tcctccattg cccccactcc 50 <210> 238 <211> 50 <212> DNA <213> Homo sapiens <400> 238 aacatcctcc tggcctctgt tgggtcagtg ttgggggcct gcttggggaa 50 <210> 239 <211> 50 <212> DNA <213> Homo sapiens <400> 239 ggcaccctgc ttcctttgct tgcatcccac agactatttc cctcatccta 50 <210> 240 <211> 50 <212> DNA <213> Homo sapiens <400> 240 gtcccaaaga gtttgatgag gccctccaca cctgcggccc aatccaaggt 50 <210> 241 <211> 50 <212> DNA <213> Homo sapiens <400> 241 cccctggatt gccccagtcc tgtgaccatg ttgccctgaa gaagaccatc 50 <210> 242 <211> 50 <212> DNA <213> Homo sapiens <400> 242 gctcctgcct ctctcccaac atgtttccag caagtagatg cccctgtgtg 50 <210> 243 <211> 50 <212> DNA <213> Homo sapiens <400> 243 tggcccagga gactgaccca aagtgaagga cattgccggg agaggcctgc 50 <210> 244 <211> 50 <212> DNA <213> Homo sapiens <400> 244 cttttgcttc aggctaagag ctgcctcgct ctttgtcccc ccattaggat 50 <210> 245 <211> 50 <212> DNA <213> Homo sapiens <400> 245 aggaggcgaa gcccgcagag caaaggtgga aacacgtgcc tacgctgtaa 50 <210> 246 <211> 23 <212> RNA <213> Homo sapiens <400> 246 agcagcauug uacagggcua uga 23 <210> 247 <211> 50 <212> DNA <213> Homo sapiens <400> 247 agaaggaggg tttctggctg tggttctaaa tggagcccca ggaagctgcc 50 <210> 248 <211> 50 <212> DNA <213> Homo sapiens <400> 248 gcagtggtgt cgttcaccgt gagagtctgc atagaactca gcagtgtgcc 50 <210> 249 <211> 50 <212> DNA <213> Homo sapiens <400> 249 ccccattcgg tgtggtgcag tgtgaaaagt ccttgattgt tcgggtgtgc 50 <210> 250 <211> 50 <212> DNA <213> Homo sapiens <400> 250 tgcctctgcc cagctcccca ttcacacaca ccggcacttt cataccctga 50 <210> 251 <211> 50 <212> DNA <213> Homo sapiens <400> 251 cggctacagc ttcaccacca cggccgagcg ggaaatcgtg cgtgacatta 50 <210> 252 <211> 50 <212> DNA <213> Homo sapiens <400> 252 gccaagcctt tccctcccta cctgatcact gcttaacggc atgtataatg 50 <210> 253 <211> 22 <212> RNA <213> Homo sapiens <400> 253 aauugcacgg uauccaucug ua 22 <210> 254 <211> 21 <212> RNA <213> Homo sapiens <400> 254 uaccacaggg uagaaccacg g 21 <210> 255 <211> 50 <212> DNA <213> Homo sapiens <400> 255 gtgctgggcc ggggagtccc tgtctctcac agcatctagc agtattatta 50 <210> 256 <211> 22 <212> RNA <213> Homo sapiens <400> 256 gggagccagg aaguauugau gu 22 <210> 257 <211> 50 <212> DNA <213> Homo sapiens <400> 257 catgatggga tatccctgcc tagatctttc agtgagtctc tacctcagct 50 <210> 258 <211> 50 <212> DNA <213> Homo sapiens <400> 258 gagagaggac agttaggagg gacagacagc tcttcctttc ggagcctggc 50 <210> 259 <211> 50 <212> DNA <213> Homo sapiens <400> 259 cagtgtctca gtcttttttg ccgagaaagc acagtagtct gggactgggc 50 <210> 260 <211> 50 <212> DNA <213> Homo sapiens <400> 260 cagctcggag gaaggtctcc tatacacaca aagcctggca tgcaccttcg 50 <210> 261 <211> 50 <212> DNA <213> Homo sapiens <400> 261 gtaaccggtc tgcttttgcg taagccaaac acctacccaa aaatgattcc 50 <210> 262 <211> 50 <212> DNA <213> Homo sapiens <400> 262 tgactggtct cctaaccaag gtgcactgag aagcaatcaa cgggtcggtc 50 <210> 263 <211> 50 <212> DNA <213> Homo sapiens <400> 263 gctggttgaa aagtaccact cccactctga acatctggcc gtccctgcaa 50 <210> 264 <211> 50 <212> DNA <213> Homo sapiens <400> 264 gccctgacct tcatggtgtc tttgaagccc aaccactcgg tttccttcgg 50 <210> 265 <211> 50 <212> DNA <213> Homo sapiens <400> 265 aggagagagg tttgagttct gggtatcctc cctttctgta acagcctcaa 50 <210> 266 <211> 50 <212> DNA <213> Homo sapiens <400> 266 cccagctgaa cccgaggcta aagaagatga ggcaagagaa aatgtacccc 50 <210> 267 <211> 50 <212> DNA <213> Homo sapiens <400> 267 caccttggtg cccaccctag ctgttgctgt ctcctatgcc ttcatcctct 50 <210> 268 <211> 50 <212> DNA <213> Homo sapiens <400> 268 ctatactcct ttggcccata gctaaggtca tccttcccca caggggtggc 50 <210> 269 <211> 50 <212> DNA <213> Homo sapiens <400> 269 gagaacagaa atagtggcat tgcatgccca gcaagatcgg gcccttaccc 50 <210> 270 <211> 50 <212> DNA <213> Homo sapiens <400> 270 gctaacatcc attccctttc ataccaccat tttcaccctg tttcttcccc 50 <210> 271 <211> 50 <212> DNA <213> Homo sapiens <400> 271 catctggacc cctccccctc tatccctaac cctgtctaaa ctaatggcgc 50 <210> 272 <211> 50 <212> DNA <213> Homo sapiens <400> 272 tccgcccatg atgctgccca acggctacgt ctacggctac aattctctgc 50 <210> 273 <211> 50 <212> DNA <213> Homo sapiens <400> 273 ctcttatccc agctgcaagg acagtcgaag gatatgccac ctcggttttc 50 <210> 274 <211> 50 <212> DNA <213> Homo sapiens <400> 274 tggaagggac tgcagagaga acagtcgagc agtgaggaca ctgatgctgc 50 <210> 275 <211> 50 <212> DNA <213> Homo sapiens <400> 275 gcctgttctc tgccattccc tagtcatcct gtgcctcacc acagcttgct 50 <210> 276 <211> 50 <212> DNA <213> Homo sapiens <400> 276 ctgccctgct ggctggaaac ctggtagtga aacaataatc ccagatccag 50 <210> 277 <211> 50 <212> DNA <213> Homo sapiens <400> 277 gaccacgtcc agtgaagaca tttgaggcag cacatctcag gacccaggca 50 <210> 278 <211> 50 <212> DNA <213> Homo sapiens <400> 278 gcatctccac gctctgaagc tgtctttcaa aatgtgtgca ctgaccccct 50 <210> 279 <211> 50 <212> DNA <213> Homo sapiens <400> 279 agtcttcatc tgtccgacaa gttcactcgc ctcggttgcg gacctaggac 50 <210> 280 <211> 50 <212> DNA <213> Homo sapiens <400> 280 gatccatcac aaagcgaagt catgggagag ccacacttga tggtggaata 50 <210> 281 <211> 50 <212> DNA <213> Homo sapiens <400> 281 acaaagttgt tgagccttgc ttcttccgtt ttgccctttg tctcgctcct 50 <210> 282 <211> 50 <212> DNA <213> Homo sapiens <400> 282 ctgccccagc tacagagacg gccgaaatgc tttcactcct tagctttgcc 50 <210> 283 <211> 50 <212> DNA <213> Homo sapiens <400> 283 ggagaaagag ctctctatac actttgttcc cgggagctgt cggctggtgg 50 <210> 284 <211> 50 <212> DNA <213> Homo sapiens <400> 284 agctctgttc tgattcacca ggggtccgtc agtagtcatt gccacccgcg 50 <210> 285 <211> 50 <212> DNA <213> Homo sapiens <400> 285 gccagaggag accagaggct tgggttttga tgaaatccgg caacagcagc 50 <210> 286 <211> 50 <212> DNA <213> Homo sapiens <400> 286 tggcctttcc tacagggagc tcagtaacct ggacggctct aaggctggaa 50 <210> 287 <211> 50 <212> DNA <213> Homo sapiens <400> 287 gatgctgggc ccctcctcat ctccctcaag gatggctacg tacccccaaa 50 <210> 288 <211> 50 <212> DNA <213> Homo sapiens <400> 288 cctgggcatg gaatcctgtg gcatccacaa aactaccttc aactccatag 50 <210> 289 <211> 50 <212> DNA <213> Homo sapiens <400> 289 aagaagccga aggagccaca gccggaacag ccacagccaa gtacaagtgc 50 <210> 290 <211> 50 <212> DNA <213> Homo sapiens <400> 290 ccaccatcac cttgaccttc atcgacaaga acggagagac tgagctgtgc 50 <210> 291 <211> 50 <212> DNA <213> Homo sapiens <400> 291 ccataactgg agaaagaagc tccattgacc gaagccacag ggcagcatgg 50 <210> 292 <211> 50 <212> DNA <213> Homo sapiens <400> 292 acctgaggcc cttaaccttt ctctcagtgc tcgccttccc ccagaatccc 50

Claims (20)

  1. 폐암의 진단을 위한 다중분석물질 조성물(multi-analyte composition)로서,
    (a) 포유류 생물학적 샘플로부터의 mRNA 유전자 전사체와 특이적으로 복합체 형성하거나, 이에 혼성화되거나, 이를 확인할 수 있는 핵산 서열, 폴리뉴클레오타이드 또는 올리고뉴클레오타이드로부터 선택된 리간드; 및
    (b) 포유류 생물학적 샘플로부터의 miRNA와 특이적으로 복합체 형성하거나, 이에 혼성화되거나, 이를 확인할 수 있는 핵산 서열, 폴리뉴클레오타이드 또는 올리고뉴클레오타이드로부터 선택된 추가적인 리간드를 포함하되;
    각각의 리간드 및 추가적인 리간드는 상이한 유전자 전사체 또는 miRNA에 결합하고, 확인된 상기 유전자 전사체와 상기 miRNA의 조합된 발현 수준은 폐암 또는 폐암의 병기의 특징적인 프로파일을 형성하는, 다중분석물질 조성물.
  2. 제1항에 있어서, 상기 유전자 전사체 및 상기 miRNA는 표 1 또는 표 2 또는 표 3으로부터 선택된, 다중분석물질 조성물.
  3. 제2항에 있어서, 상기 유전자 전사체 및 상기 miRNA는 표 1의 순위 1 내지 119로부터 선택된, 다중분석물질 조성물.
  4. 제1항에 있어서, 각각의 상기 리간드는 상기 유전자 전사체 또는 상기 miRNA의 핵산 서열을 증폭하고 검출하는 증폭 핵산 프라이머 또는 프라이머 쌍, 상기 유전자의 mRNA 또는 miRNA 핵산 서열에 혼성화되는 폴리뉴클레오타이드 프로브, 또는 항체 또는 항체의 단편이고, 각각의 리간드는 표 1 또는 표 2 또는 표 3 중의 적어도 1개의 mRNA 또는 1개의 miRNA에 특이적인, 다중분석물질 조성물.
  5. 제1항에 있어서, 상기 리간드가 고정화된 기질, 마이크로어레이, 미세유체공학 카드, 칩, 챔버 또는 다수의 프로브의 복합체 또는 다수의 프로브 서열을 포함하는 키트(적어도 1개의 상기 프로브 서열은 1개의 mRNA에 혼성화될 수 있고, 적어도 1개의 프로브는 표 1, 표 2 또는 표 3 중의 mRNA 및 miRNA 표적의 1개의 miRNA에 혼성화될 수 있음), 또는 동일한 mRNA 또는 miRNA에 혼성화될 수 있는 추가적인 리간드를 추가로 포함하는 키트; 또는 다수의 상기 리간드를 포함하는 키트를 더 포함하고, 각각은 폴리뉴클레오타이드 또는 올리고뉴클레오타이드 프라이머-프로브 세트를 포함하고, 상기 키트는 프라이머 및 프로브 둘 다를 포함하고, 각각의 상기 프라이머-프로브 세트는 상이한 유전자 전사체 또는 miRNA를 증폭시키는, 다중분석물질 조성물.
  6. 제1항에 있어서, 하나 이상의 폴리뉴클레오타이드 또는 올리고뉴클레오타이드 또는 리간드는 검출 가능한 표지와 연관된, 다중분석물질 조성물.
  7. 제1항에 있어서, 상기 조성물은 기준 또는 대조군의 것으로부터의 대상체의 전혈에서 동일한 선택된 유전자 및 miRNA의 발현, 발현 수준 또는 활성의 변화의 검출을 허용하고, 상기 변화는 폐암의 초기 진단, 폐암의 병기, 폐암의 유형 또는 분류, 폐암의 재발, 폐암의 퇴행, 폐암의 예후 또는 수술적 또는 비수술적 치료에 대한 폐암의 반응과 상관되는, 다중분석물질 조성물.
  8. 제1항에 있어서, 상기 조성물은 기준 또는 대조군의 것으로부터의 대상체의 혈액에서 동일한 선택된 유전자에서의 발현의 변화의 검출을 허용하고, 상기 변화는 폐암의 진단 또는 평가와 상관되는, 다중분석물질 조성물.
  9. 제1항에 있어서, 상기 리간드는 RNA 프라이머인, 다중분석물질 조성물.
  10. 제1항에 있어서, 적어도 2개의 리간드를 포함하는 키트 또는 마이크로어레이이고, 적어도 1개의 리간드는 상기 대상체가 폐암을 가질 때 발현의 변형을 가지는 선택된 유전자의 mRNA 전사체를 확인하고, 적어도 제2 리간드는 상기 대상체가 폐암을 가질 때 발현 수준의 변화를 가지는 miRNA를 확인하는, 다중분석물질 조성물.
  11. 포유류 대상체에서 검정의 민감도 및 특이성을 증가시키는 방법으로서, 포유류 대상체의 생물학적 유체에서 기준 또는 대조군으로부터의 동일한 생물학적 샘플에서의 mRNA 및 miRNA 표적의 동일한 조합에 의해 발현 수준으로부터의 적어도 1개의 mRNA 표적 및 적어도 1개의 miRNA 표적의 조합의 발현의 변화를 확인하는 단계를 포함하는, 방법.
  12. 제11항에 있어서, 제1항의 다중분석물질 조성물을 사용하는 단계를 포함하는, 방법.
  13. 제11항에 있어서, 상기 진단 또는 평가는 폐암, 양성 폐 결절의 진단, 폐암의 병기의 진단, 폐암의 유형 또는 분류의 진단, 폐암의 재발의 진단 또는 검출, 폐암의 퇴행의 진단 또는 검출, 폐암의 예후, 또는 수술적 또는 비수술적 치료에 대한 폐암의 반응의 평가 또는 폐암의 초기 단계의 진단 또는 I 또는 II 병기 비소세포 폐암인 폐암의 진단 중 하나 이상을 포함하거나; 상기 선택된 miRNA 및 mRNA는 흡연의 병력이 없는 폐 질환 무, 흡연의 병력을 가지는 폐 질환 무, 폐암, 만성 폐쇄성 폐 질환(chronic obstructive pulmonary disease: COPD), 양성 폐 결절, 종양 절제 전의 폐암 및 종양 절제 후의 폐암으로부터 선택된 병태 중 2개 이상에서 차등적으로 발현되는, 방법.
  14. 제11항에 있어서, 상기 변화는 상기 기준 또는 대조군과 비교하여 1개 이상의 선택된 유전자 전사체의 상향조절 또는 하향조절과 상기 기준 또는 대조군과 비교하여 1개 이상의 선택된 miRNA의 상향조절 또는 하향조절의 조합을 포함하는, 방법.
  15. 제11항에 있어서, 상기 유전자 전사체 및 상기 miRNA는 표 1 또는 표 2 또는 표 3에 기재된 것 중에서 선택된, 방법.
  16. 제11항에 있어서, 상기 대상체는 고형 종양 절제를 위한 수술 또는 화학치료를 받았고; 상기 기준 또는 대조군은 수술전 또는 치료전 동일한 대상체로부터의 동일한 선택된 유전자 전사체 및 miRNA를 포함하며; 상기 선택된 유전자 전사체 및 miRNA의 발현의 변화는 암 재발 또는 퇴행과 상관되는, 방법.
  17. 제11항에 있어서, 상기 기준 또는 대조군은 적어도 하나의 기준 대상체를 포함하고, 상기 기준 대상체는 (a) 악성 질환을 가지는 흡연자, (b) 비악성 질환을 가지는 흡연자, (c) 비악성 질환을 가지는 이전의 흡연자, (d) 질환을 가지지 않는 건강한 비흡연자, (e) 만성 폐쇄성 폐 질환(COPD)을 가지는 비흡연자, (f) COPD를 가지는 이전의 흡연자, (g) 고형 폐 종양의 제거를 위한 수술 전의 상기 종양을 가지는 대상체; (h) 고형 폐 종양의 수술적 제거 후의 상기 종양을 가지는 대상체; (i) 고형 폐 종양에 대한 치료 전의 상기 종양을 가지는 대상체; 및 (j) 고형 폐 종양에 대한 치료 동안의 또는 후의 상기 종양을 가지는 대상체로 이루어진 군으로부터 선택되고; 상기 기준 또는 대조군 대상체 (a) 내지 (j)는 일시적으로 더 이른 시점에서의 동일한 시험 대상체이거나; 상기 기준 mRNA 또는 miRNA 표준은 기준 대상체 또는 기준 집단으로부터 유도된 평균, 평균값, 산술 평균 또는 산술 평균의 범위, 숫자 패턴, 그래프 패턴 또는 조합된 mRNA 및 miRNA 발현 프로파일인, 방법.
  18. 제11항에 있어서, 상기 대상체로부터의 생물학적 샘플을, 상기 샘플에서의 선택된 mRNA 발현 수준과 복합시키고 이를 측정하는 진단학적 시약과 접촉시키는 단계 및 상기 대상체로부터의 생물학적 샘플을 상기 샘플에서의 miRNA 발현 수준과 복합시키고 이를 측정하는 진단학적 시약과 접촉시키는 단계를 추가로 포함하고, 상기 발현 수준의 조합된 변화는 암 또는 이의 병기를 진단하는, 방법.
  19. 진단학적 시약을 생성하는 방법으로서, 포유류 대상체의 생물학적 유체의 샘플에서 질환에 특징적인 선택된 mRNA 및 miRNA 서열의 발현의 조합된 변화를 검출하는 것을 포함하는,질환 분류 프로파일을 형성하는 단계를 포함하는, 방법.
  20. 폐암을 가지는 대상체와 양성 결절을 가지는 대상체 사이를 구별하기 위한 검정의 민감도 및 특이성을 증가시키는 방법으로서,
    대상체로부터 생물학적 유체 또는 조직 샘플을 얻는 단계;
    상기 샘플을 포유류 생물학적 샘플로부터의 표 1, 표 2 또는 표 3 중의 1개 이상의 mRNA 유전자 전사체 표적과 특이적으로 복합체 형성하거나, 이에 혼성화되거나, 이를 확인할 수 있는 핵산 서열, 폴리뉴클레오타이드 또는 올리고뉴클레오타이드로부터 선택된 적어도 1개의 리간드와 접촉시킴으로써 표 1, 표 2 또는 표 3 중의 1개 이상의 mRNA 표적이 상기 샘플에 존재하는지를 검출하는 단계; 및
    상기 샘플을 포유류 생물학적 샘플로부터의 표 1, 표 2 또는 표 3 중의 1개 이상의 miRNA 표적과 특이적으로 복합체 형성하거나, 이에 혼성화되거나, 이를 확인할 수 있는 핵산 서열, 폴리뉴클레오타이드 또는 올리고뉴클레오타이드로부터 선택된 적어도 1개의 리간드와 접촉시킴으로써 표 1, 표 2 또는 표 3 중의 1개 이상의 miRNA 표적이 상기 샘플에 존재하는지를 검출하는 단계를 포함하되;
    각각의 리간드는 상이한 mRNA 표적 또는 miRNA 표적에 결합하는, 방법.
KR1020177035675A 2015-05-19 2016-05-19 폐암을 진단하거나 검출하기 위한 방법 및 조성물 KR20180009762A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562163766P 2015-05-19 2015-05-19
US62/163,766 2015-05-19
PCT/US2016/033232 WO2016187404A1 (en) 2015-05-19 2016-05-19 Methods and compositions for diagnosing or detecting lung cancers

Publications (1)

Publication Number Publication Date
KR20180009762A true KR20180009762A (ko) 2018-01-29

Family

ID=57320853

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020177035675A KR20180009762A (ko) 2015-05-19 2016-05-19 폐암을 진단하거나 검출하기 위한 방법 및 조성물

Country Status (13)

Country Link
US (2) US20180142303A1 (ko)
EP (1) EP3298182A4 (ko)
JP (1) JP2018524972A (ko)
KR (1) KR20180009762A (ko)
CN (1) CN107709636A (ko)
AU (1) AU2016263590A1 (ko)
BR (1) BR112017024688A2 (ko)
CA (1) CA2985683A1 (ko)
IL (1) IL255659A (ko)
MX (1) MX2017014859A (ko)
RU (1) RU2017143008A (ko)
SG (1) SG10201910412QA (ko)
WO (1) WO2016187404A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200031935A (ko) 2018-09-17 2020-03-25 차의과학대학교 산학협력단 신규한 miRNA smR-167 및 폐암 예방 또는 치료를 위한 이의 용도

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11535895B2 (en) 2017-04-06 2022-12-27 University Of Maryland, Baltimore Methods of detecting lung cancer
US10846367B2 (en) * 2017-09-15 2020-11-24 Case Western Reserve University University Predicting recurrence in early stage non-small cell lung cancer (NSCLC) with integrated radiomic and pathomic features
CN109712717A (zh) * 2018-12-27 2019-05-03 湖南大学 一种基于miRNA-基因调控模块的癌症相关MicroRNA识别方法
EP3938536A4 (en) * 2019-03-12 2023-03-08 Crown Bioscience (Suzhou) Inc. METHODS AND COMPOSITIONS FOR IDENTIFICATION OF TUMOR MODELS
CN110669104B (zh) * 2019-10-30 2021-11-05 上海交通大学 一组来源于人外周血单核细胞的标志物及其应用
CN111118164A (zh) * 2020-03-02 2020-05-08 遵义市第一人民医院 一种用于肿瘤早期筛查和诊断的标志物、试剂盒及检测方法
CN112415199B (zh) * 2020-11-20 2023-09-08 四川大学华西医院 Cetp检测试剂在制备肺癌筛查试剂盒中的用途
WO2022127717A1 (zh) * 2020-12-17 2022-06-23 广州市基准医疗有限责任公司 用于检测肺结节良恶性的甲基化分子标记物或其组合和应用
CN112635063B (zh) * 2020-12-30 2022-05-24 华南理工大学 一种肺癌预后综合预测模型、构建方法及装置
CN115527614B (zh) * 2022-04-12 2023-12-26 陈恩国 一种肺动脉高压的基因表达分类器
CN116823818B (zh) * 2023-08-28 2023-11-07 四川省肿瘤医院 基于三维影像组学特征的肺结节识别系统和方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101111768A (zh) * 2004-11-30 2008-01-23 维里德克斯有限责任公司 肺癌预后
EP2502630B1 (en) * 2006-01-05 2015-03-11 The Ohio State University Research Foundation MicroRNA-based methods and compositions for the diagnosis, prognosis and treatment of lung cancer
US8476420B2 (en) * 2007-12-05 2013-07-02 The Wistar Institute Of Anatomy And Biology Method for diagnosing lung cancers using gene expression profiles in peripheral blood mononuclear cells
US20100055689A1 (en) * 2008-03-28 2010-03-04 Avrum Spira Multifactorial methods for detecting lung disorders
WO2010054233A1 (en) * 2008-11-08 2010-05-14 The Wistar Institute Of Anatomy And Biology Biomarkers in peripheral blood mononuclear cells for diagnosing or detecting lung cancers
US20110251086A1 (en) * 2008-12-10 2011-10-13 Joke Vandesompele Neuroblastoma prognostic multigene expression signature
EP2239675A1 (en) * 2009-04-07 2010-10-13 BIOCRATES Life Sciences AG Method for in vitro diagnosing a complex disease
JP5808349B2 (ja) * 2010-03-01 2015-11-10 カリス ライフ サイエンシズ スウィッツァーランド ホールディングスゲーエムベーハー セラノーシスのためのバイオマーカー
EP2505663A1 (en) * 2011-03-30 2012-10-03 IFOM Fondazione Istituto Firc di Oncologia Molecolare A method to identify asymptomatic high-risk individuals with early stage lung cancer by means of detecting miRNAs in biologic fluids
CN103492590A (zh) * 2011-02-22 2014-01-01 卡里斯生命科学卢森堡控股有限责任公司 循环生物标志物
EP2885425B1 (en) * 2012-08-20 2017-07-26 The United States Of America, As Represented By The Secretary, Department Of Health & Human Services Expression of protein-coding and noncoding genes as prognostic classifiers in early stage lung cancer
CA2895133A1 (en) * 2012-12-13 2014-06-19 Baylor Research Institute Blood transcriptional signatures of active pulmonary tuberculosis and sarcoidosis
US20150072890A1 (en) * 2013-09-11 2015-03-12 20/20 Gene Systems, Inc. Methods and compositions for aiding in the detection of lung cancer

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200031935A (ko) 2018-09-17 2020-03-25 차의과학대학교 산학협력단 신규한 miRNA smR-167 및 폐암 예방 또는 치료를 위한 이의 용도

Also Published As

Publication number Publication date
WO2016187404A1 (en) 2016-11-24
IL255659A (en) 2018-01-31
RU2017143008A3 (ko) 2020-01-29
EP3298182A4 (en) 2019-01-02
US20200131586A1 (en) 2020-04-30
CA2985683A1 (en) 2016-11-24
AU2016263590A1 (en) 2017-11-30
EP3298182A1 (en) 2018-03-28
US20180142303A1 (en) 2018-05-24
SG10201910412QA (en) 2020-01-30
BR112017024688A2 (pt) 2019-02-12
RU2017143008A (ru) 2019-06-20
MX2017014859A (es) 2018-07-06
CN107709636A (zh) 2018-02-16
JP2018524972A (ja) 2018-09-06

Similar Documents

Publication Publication Date Title
US20200370127A1 (en) Biomarkers in Peripheral Blood Mononuclear Cells for Diagnosing or Detecting Lung Cancers
US20200131586A1 (en) Methods and compositions for diagnosing or detecting lung cancers
JP6190434B2 (ja) 化学療法剤に対する応答を予測するための遺伝子発現マーカー
US8476420B2 (en) Method for diagnosing lung cancers using gene expression profiles in peripheral blood mononuclear cells
US10196691B2 (en) Colon cancer gene expression signatures and methods of use
US20230366034A1 (en) Compositions and methods for diagnosing lung cancers using gene expression profiles
US10113201B2 (en) Methods and compositions for diagnosis of glioblastoma or a subtype thereof
EP2121988B1 (en) Prostate cancer survival and recurrence
JP2007521005A (ja) 癌再発の可能性の予測
JP2011509689A (ja) Ii及びiii期結腸癌の分子病期分類並びに予後診断
US20180051342A1 (en) Prostate cancer survival and recurrence
US20210079479A1 (en) Compostions and methods for diagnosing lung cancers using gene expression profiles
CN117500941A (zh) 癌症检测方法,试剂盒和系统
CN111315897A (zh) 用于黑素瘤检测的方法