KR20120107979A - 활성 대 잠복성 마이코박테리움 투베르쿨로시스 감염의 혈액 전사적 시그너쳐 - Google Patents

활성 대 잠복성 마이코박테리움 투베르쿨로시스 감염의 혈액 전사적 시그너쳐 Download PDF

Info

Publication number
KR20120107979A
KR20120107979A KR1020127017108A KR20127017108A KR20120107979A KR 20120107979 A KR20120107979 A KR 20120107979A KR 1020127017108 A KR1020127017108 A KR 1020127017108A KR 20127017108 A KR20127017108 A KR 20127017108A KR 20120107979 A KR20120107979 A KR 20120107979A
Authority
KR
South Korea
Prior art keywords
patient
gene expression
module
active
mycobacterium tuberculosis
Prior art date
Application number
KR1020127017108A
Other languages
English (en)
Inventor
에프. 반슈로 자크
다미엥 쇼사벨
앤 오가라
매튜 베리
온 민 콘
Original Assignee
베일러 리서치 인스티튜트
임페리얼 컬리지 헬스케어 엔에이치에스 트러스트
메디칼 리서취 카운실
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 베일러 리서치 인스티튜트, 임페리얼 컬리지 헬스케어 엔에이치에스 트러스트, 메디칼 리서취 카운실 filed Critical 베일러 리서치 인스티튜트
Publication of KR20120107979A publication Critical patent/KR20120107979A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

본 발명은 마이코박테리움 투베르쿨로시스로 감염된 것으로 의심되는 환자에서 활성 마이코박테리움 투베르쿨로시스 감염과 잠복성 마이코박테리움 투베르쿨로시스 감염을 구별하기 위한 방법, 시스템 및 키트를 포함하며, 당해 방법은 마이코박테리움 투베르쿨로시스로 감염된 것으로 의심되는 환자로부터의 환자 유전자 발현 데이터 세트를 얻는 단계; 환자 유전자 발현 데이터세트를 마이코박테리움 투베르쿨로시스 감염과 관련된 하나 이상의 유전자 모듈로 분류하는 단계; 및 하나 이상의 유전자 모듈 각각에 대한 환자 유전자 발현 데이터세트를 비-환자로부터의 유전자 발현 데이터세트와 비교하는 단계를 포함하고; 여기서 하나 이상의 유전자 모듈에 대한 환자 유전자 발현 데이터세트에서 유전자 발현의 전체에 있어서의 증가 또는 감소는 활성 마이코박테리움 투베르쿨로시스 감염의 지표이다.

Description

활성 대 잠복성 마이코박테리움 투베르쿨로시스 감염의 혈액 전사적 시그너쳐{BLOOD TRANSCRIPTIONAL SIGNATURE OF ACTIVE VERSUS LATENT MYCOBACTERIUM TUBERCULOSIS INFECTION}
본 발명은 일반적으로 마이코박테리움 투베르쿨로시스(Mycobacterium tuberculosis) 감염 분야, 및 보다 구체적으로는 잠복성 또는 무증상으로 보이는, 치료 전, 치료 동안 및 치료 후의 활성 마이코박테리움 투베르쿨로시스 감염 및 질환 진행의 진단, 예측 및 모니터링을 위한 방법, 키트(kit) 및 시스템에 관한 것이다.
본 발명의 영역을 제한하지 않고, 이의 배경은 마이코박테리움 투베르쿨로시스 감염의 확인 및 치료와 관련하여 기술된다.
폐결핵(PTB)은 마이코박테리움 투베르쿨로시스[엠. 투베르쿨로시스(M. tuberculosis)]에 의해 유발된 전세계적으로 이환률(morbidity) 및 사망률의 주된 증가하는 원인이다. 그러나, 엠. 투베르쿨로시스로 감염된 개인의 대부분은 무증상으로 남으며, 잠복성 형태로 감염을 유지하는데, 이러한 잠복성 상태는 활성 면역 반응에 의해 유지되는 것으로 생각되고 있다(참조: WHO; Kaufmann, SH & McMichael, AJ., Nat Med, 2005). 이는 크론병 또는 류마티스 관절염을 가진 환자의 항-TNF 항체를 사용한 치료가 자가면역 증상들을 개선시켰지만, 다른 한편으로는 엠. 투베르쿨로시스(Keane)와 이미 접촉한 환자에서 TB의 재활성화가 유발된다는 것을 나타내는 보고에 의해 지지된다. 엠. 투베르쿨로시스에 대한 면역 반응은 다인성이며 유전적으로 측정된 숙주 인자, 예를 들면, TNF, 및 Th1 축의 IFN-γ 및 IL-12를 포함한다(참조: Reviewed in Casanova, Ann Rev; Newport). 그러나, 성인 폐 TB 환자로부터의 면역 세포는 IFN-γ, IL-12 및 TNF를 생산할 수 있고, IFN-γ 치료요법은 질환을 완화시키는데 도움을 주지 못하며(참조: Reljic, 2007, J Interferon & Cyt Res., 27, 353-63), 이는, 광범위한 수의 숙주 면역 인자가 엠. 투베르쿨로시스에 대한 보호 및 잠복성 유지에 관여함을 제안한다. 따라서, 잠복성 대 활성 TB에 서 유도된 숙주 인자의 지식은 엠. 투베르쿨로시스에 의한 감염을 제어할 수 있는 면역 반응과 관련된 정보를 제공할 수 있다.
PTB의 진단은 다수의 이유로 인하여 어렵고 문제점이 있을 수 있다. 첫째로, 현미경 검사(도말 양성)에 의해 가래에서 전형적인 엠. 투베르쿨로시스 바실러스의 존재를 입증하는 것은 단지 50 내지 70%의 민감성을 가지며, 양성 진단은 배양에 의한 엠. 투베르쿨로시스의 분리를 필요로 하는데, 이는 8주까지 소요될 수 있다. 또한, 일부 환자는 가래에서 도말 음성이거나 가래를 생산할 수 없으므로, 추가의 시료채취가 침입 과정인 기관지경술을 필요로 한다. PTB의 진단에 있어서 이러한 제한으로 인하여, 도말 음성 환자는 때때로 투베르쿨린(PPD) 피부 반응성(Mantoux)에 대해 시험된다. 그러나, 투베르쿨린(PPD) 피부 반응성은 BCG 예방접종과, 잠복성 또는 활성 TB를 구별할 수 없다. 이러한 문제점에 대한 반응으로, BCG에서 부재인, 특이적인 엠. 투베르쿨로시스 항원에 대한 면역반응성을 입증하는 검정이 개발되어 왔다. 그러나, 인터페론 감마 방출 검정(IGRA)에서 혈액 세포에 의한 IFN-γ의 생산으로 측정한 바와 같은, 이러한 엠. 투베르쿨로시스 항원에 대한 반응성은 활성 질환으로부터 잠복성을 구별하지 않는다. 잠복성 TB는, 임상 증상 또는 징후의 부재 하에 환자에게 PPD를 피내 시도하는 경우, IGRA 양성 결과와 함께 지연된 유형의 고민감성 반응에 의해, 또는 활성 질환을 연상시키는 방사선학에 의해 임상적으로 정의된다. 잠복성/잠재 상태 투베르쿨로시스(TB)의 재활성화는 다른 개인에의 전염 위험성과 함께 주요한 건강 위험(health hazard)을 나타내므로, 잠복성 및 활성 TB 환자에 있어서의 차이를 반영하는 바이오마커(biomarker)는, 특히 항-마이코박테리아 약물 치료가 힘이 들고 심각한 부작용을 초래할 수 있으므로, 질환 관리에 사용할 수 있다.
엠. 투베르쿨로시스로 감염된 개인의 대부분은 무증상이며, 세계 인구의 1/3이 잠재적으로 세균에 감염되는 것으로 추정되므로, 질환의 확산을 위한 거대한 병원소(reservoir)를 제공한다. 잠재적으로 감염된 것으로 기술되는 사람들 중, 5 내지 15%는 이들의 생애에서 활성 TB 질환으로 진행될 것이다7,8. 따라서, 잠재적 TB 환자들은 이들의 생애 전체에서 무증상으로 남을 대부분으로부터 질환 재활성화로 진행될 사람들의 범위인 임상적으로 이종인 분류를 나타낸다9. 잠복성 TB의 진단은 전통적으로 엠. 투베르쿨로시스 항원에 대한 피부 반응에 의해 면역 감작화의 증거를 단지 기초로 하며, 당해 시험의 특이성은 백신 BCG를 포함하는 비-병원성 마이코박테리움에 대한 양성 반응에 의해 절충된다. 혈액 세포에 의한 특이적인 엠. 투베르쿨로시스 항원(IGRA)에 대한 IFN-γ의 분비를 측정하는 보다 최근의 검정은 이러한 문제를 거의 가지지 않지만, 피부 시험과 유사하게, 활성 질환으로부터 잠재기를 구별할 수 없거나 활성 질환으로 진행될 수 있는 이들 환자를 명확하게 확인할 수 없다10. 재활성화의 위험이 있는 이들의 최대 확인은, 항-마이코박테리아 약물 치료가 길어지고 심각한 부작용을 초래할 수 있으므로, 중요한 표적화된 예방적 치료요법으로 도움을 줄 수 있다. 따라서, 진단, 치료 및 예방접종을 위한 새로운 도구가 긴급하게 요구되지만, 이들을 개발하기 위한 노력들은 TB의 복잡한 근본적인 병원성의 불완전한 이해로 인해 제한되어 왔다.
본 발명은 건강한 대조군과 비교하여, 잠복성 대 활성 투베르쿨로시스(TB) 환자의 확인을 위한 방법 및 키트를 포함한다. 하나의 실시형태에서, 명백하고 상호관계를 나타내는 면역 시그너쳐의 혈액의 마이크로어레이 분석을 사용하여 잠복성 대 활성 투베르쿨로시스(TB) 환자를 측정하고, 진단하며, 추적하고 치료한다. 본 발명은 최초로, 잠복성 TB를 갖는 어느 개인에게 활성이며 잠복성/무증상이 아닌 TB 감염에 기인하는 항-마이코박테리아 화학치료요법을 제공하여야 하는지를 측정하는데 사용될 수 있는 TB 감염의 이질성을 구별하기 위한 능력을 제공한다.
하나의 실시형태에서, 본 발명은 마이코박테리움 투베르쿨로시스로 감염된 것으로 의심되는 환자로부터 환자 유전자 발현 데이터세트를 얻는 단계; 환자 유전자 발현 데이터세트를 마이코박테리움 투베르쿨로시스 감염과 관련된 하나 이상의 유전자 모듈로 분류하는 단계; 및 동일한 유전자 모듈로 또한 분류된 비-환자로부터의 유전자 발현 데이터세트에 대해 하나 이상의 유전자 모듈 각각에 대해 환자 유전자 발현 데이터세트를 비교하는 단계를 포함하는, 잠복성/무증상인 것으로 보이는 활성 마이코박테리움 투베르쿨로시스 감염을 예측하는 방법을 포함하며, 여기서 하나 이상의 유전자 모듈에 대한 환자 유전자 발현 데이터세트에 있어서 유전자 발현의 전체에서의 증가 또는 감소가 잠복성/무증상 마이코박테리움 투베르쿨로시스 감염보다는 오히려 활성 마이코박테리움 투베르쿨로시스 감염의 지표이다. 하나의 양상에서, 당해 방법은 측정된 비교 유전자 생성물 정보를 사용하여 적어도 하나의 진단, 예측 또는 치료 계획을 공식화하는 단계를 추가로 포함한다. 다른 양상에서, 당해 방법은 또한 활성 TB 환자로부터 잠복성 TB 환자를 구별하는 단계를 포함할 수 있다. 하나의 양상에서, 환자 유전자 발현 데이터세트는 전혈, 말초 혈액 단핵 세포 또는 가래 중 적어도 하나에서의 세포로부터 기원한다. 다른 양상에서, 환자 유전자 발현 데이터세트는 표 2에서의 유전자들로부터 선택된 적어도 10, 20, 40, 50, 70, 80, 90, 100, 125, 150, 200, 250, 300, 350 또는 393개 유전자와 비교된다. 다른 양상에서, 환자 유전자 발현 데이터세트는 적어도 10, 20, 40, 50, 70, 80, 90, 100, 125, 150, 200, 모듈 M1.3, M2.8, M1.5, M2.6, M2.2 및 3.1과 비교된다. 다른 양상에서, 마이코박테리움 투베르쿨로시스 감염과 관련된 유전자 모듈은 모듈 M1.3, 모듈 M2.8, 모듈 M1.5, 모듈 M2.6, 모듈 M2.2 및 모듈 3.1로 이루어진 그룹 중에서 선택된다. 다른 양상에서, 마이코박테리움 투베르쿨로시스 감염과 관련된 유전자 모듈은 B 세포-관련 유전자에 있어서의 감소, T 세포-관련된 유전자에 있어서의 감소, 골수 관련 유전자에 있어서의 증가, 호중구 관련 전사체 및 인터페론 유도성(IFN) 유전자에 있어서의 증가에 있어서의 변화에 의해 선택된다. 다른 양상에서, 환자의 질환 상태는 또한 환자의 폐의 방사선학적 분석으로 측정된다. 다른 양상에서, 당해 방법은 또한 환자를 치료한 후 치료된 환자 유전자 발현 데이터세트를 측정하는 단계 및 치료된 환자 유전자 발현 데이터세트가 정상 유전자 발현 데이터세트로 되도록 회복되었는지를 측정함으로써 환자가 치료되었는지를 측정하는 단계를 포함한다.
다른 실시형태에서, 본 발명은 마이코박테리움 투베르쿨로시스로 감염된 것으로 의심되는 환자에서 활성 및 잠복성 마이코박테리움 투베르쿨로시스 감염을 구별하는 방법이며, 당해 방법은 활성 마이코박테리움 투베르쿨로시스 감염을 지닌 제1의 임상 그룹으로부터 얻은 제1의 유전자 발현 데이터세트, 잠복성 마이코박테리움 투베르쿨로시스 감염 환자가 있는 제2의 임상 그룹으로부터 얻은 제2의 유전자 발현 데이터세트 및 감염되지 않은 개인의 임상 그룹으로부터 얻은 제3의 유전자 발현 데이터세트를 얻는 단계; 제1, 제2 및 제3의 데이터세트 중 어느 2개 사이의 유전자의 차등적인 발현을 포함하는 유전자 무리 데이터세트를 생성시키는 단계; 및 잠복성 감염, 활성 감염 또는 건강함의 지표인 발현/표시의 독특한 패턴을 측정하는 단계를 포함하며, 여기서 환자 유전자 발현 데이터세트는 모듈 M1.3, M2.8, M1.5, M2.6, M2.2 및 3.1 중 적어도 하나에서의 유전자로부터 얻은 적어도 6, 10, 20, 40, 50, 70, 80, 90, 100, 125, 150, 또는 200개 유전자를 포함한다.
여전히 다른 실시형태에서, 본 발명은 마이코박테리움 투베르쿨로시스에 감염된 것으로 의심되는 환자에서 감염을 진단하기 위한 키트에 관한 것이며, 당해 키트는 환자로부터 환자 유전자 발현 데이터세트를 얻기 위한 유전자 발현 검출기(여기서, 발현된 유전자는 환자의 전혈로부터 얻어진다); 및 프로세서로서, 상기 유전자 발현 데이터세트를 마이코박테리움 투베르쿨로시스 감염과 관련된 예정된 유전자 모듈 데이터세트와 비교할 수 있고 감염된 환자와 감염되지 않은 환자를 구별하는 프로세서를 포함하며, 여기서 전혈은 상대가 되는 감염되지 않은 환자와 비교하여 하나 이상의 전사 유전자 발현 모듈에서의 폴리뉴클레오타이드의 수준에 있어서의 전체적 변화를 나타냄에 의해 활성 및 잠복성 마이코박테리움 투베르쿨로시스 감염을 구별한다. 하나의 양상에서, 환자 유전자 발현 데이터세트는 말초 혈액 단핵 세포로부터 입수된다. 다른 양상에서, 환자 유전자 발현 데이터세트는 표 2에서의 유전자들로부터 선택된 적어도 10, 20, 40, 50, 70, 80, 90, 100, 125, 150, 200, 250, 300, 350 또는 393개 유전자와 비교된다. 다른 양상에서, 환자 유전자 발현 데이터세트는 적어도 10, 20, 40, 50, 70, 80, 90, 100, 125, 150, 200, 모듈 M1.3, M2.8, M1.5, M2.6, M2.2 및 3.1과 비교된다. 다른 양상에서, 마이코박테리움 투베르쿨로시스 감염과 관련된 유전자 모듈은 모듈 M1.3, 모듈 M2.8, 모듈 M1.5, 모듈 M2.6, 모듈 M2.2 및 모듈 3.1로 이루어진 그룹 중에서 선택된다. 다른 양상에서, 마이코박테리움 투베르쿨로시스 감염과 관련된 유전자 모듈은 B 세포-관련된 유전자에 있어서의 감소, T 세포-관련된 유전자에 있어서의 감소, 골수종 관련 유전자에 있어서의 증가, 호중구 관련 전사체 및 인터페론 유도성(IFN) 유전자에 있어서의 증가에서의 변화에 의해 선택된다. 다른 양상에서, 유전자는 PDL-1, CASP5, CR1, CASP5, TLR5, MAPK14, STX11, BCL6 및 C5 중에서 선택된다.
본 발명의 다른 실시형태는, 환자로부터 환자 유전자 발현 데이터세트를 얻기 위한 유전자 발현 검출기(여기서, 발현된 유전자는 환자의 전혈로부터 얻어진다); 및 프로세서로서, 유전자 발현 데이터세트를 마이코박테리움 투베르쿨로시스 감염과 관련된 예정된 유전자 모듈 데이터세트와 비교할 수 있고 감염된 환자와 감염되지 않은 환자를 구별하는 프로세서를 포함하는, 활성 및 잠복성 마이코박테리움 투베르쿨로시스에 감염된 것으로 진단되는 환자의 검출 시스템에 관한 것이며, 여기서 전혈은 상대가 되는 감염되지 않은 환자와 비교하여 하나 이상의 전사 유전자 발현 모듈에서의 폴리뉴클레오타이드의 수준에 있어서의 전체적 변화를 나타냄에 의해 활성 및 잠복성 마이코박테리움 투베르쿨로시스 감염을 구별하고, 여기서 유전 모듈 데이터세트는 모듈 M1.3, M2.8, M1.5, M2.6, M2.2 및 3.1 중 적어도 하나를 포함한다. 하나의 양상에서, 환자 유전자 발현 데이터세트는 표 2에서의 유전자들로부터 선택된 적어도 10, 20, 40, 50, 70, 80, 90, 100, 125, 150, 200, 250, 300, 350 또는 393개 유전자와 비교된다. 다른 양상에서, 환자 유전자 발현 데이터세트는 적어도 10, 20, 40, 50, 70, 80, 90, 100, 125, 150, 200, 모듈 M1.3, M2.8, M1.5, M2.6, M2.2 및 3.1과 비교된다. 다른 양상에서, 마이코박테리움 투베르쿨로시스 감염과 관련된 유전자 모듈은 모듈 M1.3, 모듈 M2.8, 모듈 M1.5, 모듈 M2.6, 모듈 M2.2 및 모듈 3.1로 이루어진 그룹 중에서 선택된다. 다른 양상에서, 마이코박테리움 투베르쿨로시스 감염과 관련된 유전자 모듈은 B 세포-관련된 유전자에 있어서의 감소, T 세포-관련된 유전자에 있어서의 감소, 골수종 관련 유전자에 있어서의 증가, 호중구 관련 전사체 및 인터페론 유도성(IFN) 유전자에 있어서의 증가에서의 변화에 의해 선택된다. 다른 양상에서, 유전자는 PDL-1, CASP5, CR1, CASP5, TLR5, MAPK14, STX11, BCL6 및 C5 중에서 선택된다.
본 발명의 특징 및 장점을 보다 완전히 이해하기 위하여, 하기에 첨부된 도면과 함께 본 발명의 상세한 설명에 대해 참조하며 여기서:
도 1a 내지 1c. 활성 TB의 명백한 전혈 전사 시그너쳐. 히트맵(heatmap)의 각각의 열은 개개 유전자를 나타내고 각각의 컬럼은 개개의 참여자를 나타낸다. 종이 전체를 통한 전사체의 상대적인 풍부성은 도면의 바탕에서 색 규모로 나타낸다(적색, 고; 황색, 중간; 청색, 저). (1a) 계층형 무리로 구성된 트레이닝 세트에서 393개의 가장 유의적으로 차등하게 발현된 유전자, (1b) 동일한 유전자 트리(gene tree)에서 정리된 동일한 393개의 전사체 목록을 사용하여 독립적인 시험 세트로부터, 조건 트리[열지도(heatmap)의 상부 수평 모서리를 따라)를 생성하는 평균 계통 및 각각의 프로파일의 바탕에서 착색된 블록으로 나타낸 연구 그룹화(즉, 임상 표현형)을 사용한 스피어만 상관계수(Spearman correlation)에 의한 계층적 무리로 분석하였다. (1c) 남아프리카에서 모집한 독립적인 확인 세트를 위에서와 같이 분석하였다.
도 2a 내지 2c: 활성 TB의 전사 시그너쳐 질환의 방사선사진 정도와 관련된다. 트레이닝 및 독립적인 시험 세트에서 각각의 환자에 대한 심장 방사선 사진을 다른 데이터에 대해 차단된(blind) 3명의 독립적인 임상의(도 9a)가 평가하였다. (2a) 393 명의 전사체 프로파일은 독립적인 시험 세트에서 활성 TB를 가진 각각의 환자에 대해 나타낸다. 진전된 질환, 중간 질환, 최소 질환 및 질환 없음의 대표적인 방사선사진 예를 나열한다(2b, 2c). 프로파일은 질환의 방사선사진 정도에 따라 그룹화하였으며 각각의 그룹에 대한 평균 "건강에 대한 분자 거리(Molecular Distance to Health)(추가의 방법)은 크루스칼-발리스 아노바(Kruskal-Wallis ANOVA)를 사용하여 둔스 다중 비교 포스트 혹 시험(Dunn's multiple comparison post hoc testing)과 비교함으로써 그룹들 사이에서 비교하였다(*** = p <0.0001).
도 3a 내지 3d. 활성 TB의 전사 시그너쳐는 성공적인 치료동안 감소된다. (3a) 활성 TB(활성)를 지닌 7명의 환자를 항-마이코박테리움 치료 개시후 2 및 12개월째에 재-시료채취하여 독립적인 시험 세트로부터의 건강한 대조군(대조군, n = 12)과 비교하였다. (3b) 진단시 및 항-마이코박테이움 치료의 개시 후 2 및 12개월째에 심장 방사선사진을 7명의 환자 중 2명에 대해("4" 또는 "7"로 표지됨) 나타낸다. 위에 나타낸 이들 개인에 대한 프로파일은 동일한 수 지표로 표지하였다. (3c) 각각의 환자에 대한 "건강에 대한 분자 거리"를 각각의 시점에서 계산하고 스피어만 상관계수를 사용하여 치료의 개시 후 시간과 비교하였다. (3d) 각각의 시점에 대한 평균 "건강에 대한 분자 거리"는 프리드만 시험(Friedman's test)을 사용하여 둔스 다중 비교 포스트-혹 시험과 비교함으로써 시점들 사이에서 비교하였다. 수평 바아(bar)는 중간값, 5번째 및 95번째 백분위수를 나타낸다.
도 4a 내지 4e. 활성 TB의 전혈 전사 시그너쳐는 세포 조성물내 명백한 변화 및 유전자 발현의 절대적인 수준에 있어서의 변화 둘다를 반영한다. (4a) 건강한 대조군과 비교한 활성 TB의 유전자 발현을 예정된 모듈 체계내에서 맵핑(mapping)한다. 점의 강도는 각각의 모듈에 대한 유의적으로 차등하게 발현된 전사체의 비율을 나타낸다(적색 = 증가, 청색 = 감소, 전사체 풍부성). 공평한 문헌 수집에 의해 미리 측정된 기능적 해석은 하기 색 코드화된 격자로 나타낸다. (4b) 시험 세트 건강한 대조군(대조군) 및 활성 TB 환자(활성)로부터의 전혈을 CD3+CD4+ 및 CD3+CD8+ T 세포 및 CD19+CD20+ B 세포에 대해 유동 세포분석기로 분석하였다. 오차 바아 = 중간값. (4c) 시험 세트 건강한 대조군(대조군) 및 활성 TB 환자(활성)로부터의 전혈을 CD14+ 단핵세포, CD14+CD16+ 염증성 단핵세포 및 CD16+ 호중구에 대한 유동 세포분석기로 분석하였다. 오차 바아 = 중간값. (4d) 인터페론 시그날링에 대한 독창성 경로 분석 표준 경로(Ingenuity Pathways analysis canonical pathway)는 여기에서 이의 기능에 상응하는 기호로 확인된 각각의 유전자 생성물과 함께 나타내고(우측의 범례) 트레이닝 세트 활성 TB 환자에서 과-표시된 전사체는 어두운 적색이다. (4e) 건강한 대조군(대조군) 및 활성 폐 TB를 지닌 환자(활성)로부터의 CXCL10(IP10)의 혈청 수준. 통계적 비교를 2-테일된 만-휘트니 시험(two-tailed Mann-Whitney test)을 사용하여 수행하였다. 수평 바아는 각각의 그룹에 대한 평균을 나타내며, 위스커스(whiskers)는 95% 신뢰 구간을 나타낸다.
도 4f 및 4g. 활성 TB의 명백한 전혈 86개-유전자 전사 시그너쳐는 다른 질환과 명백히 구분된다. (4f) TB 및 다른 질환을 지닌 환자에서 86개-유전자 시그너쳐의 비교를 이들 자체의 대조군: TB(트레이닝, n=13; 대조군, n=12), TB (SA, n=20; 대조군 = 12), 그룹 A 스트렙토코쿠스(Streptococcus)(Strep; n=23; 대조군=12), 스타필로코쿠스(Staphylococcus)(Staph; n=40; 대조군=12), 스틸스병(Still's disease) (Still's; n=31; 대조군=22), 성인(SLE; n=29; 대조군=16) 및 소아 SLE(pSLE; n=49; 대조군=11) 환자에 대해 표준화하였다. (4g) TB 환자에서 치료 2 및 12개월 후 86개 유전자 시그너쳐의 발현 수준.
도 4h. TB(시험 세트) 및 상이한 질환의 유전자 발현(질환 대 건강한 대조군)을 예정된 모듈 체계내에서 맵핑하였다. 점 강도(적색, 증가; 청색, 감소)는 전사체 풍부성을 나타낸다.
도 5a 및 5b. 활성 TB에서 인터페론-유도성 유전자 발현. 활성 TB(트레이닝, 시험 및 확인 세트)로부터의 전혈 시료에 있어 인터페론-유도성 유전자(5a) 전사체 풍부성; 및 (5b) 시험 세트 혈액으로부터 분리된 혈액 백혈구 집단에서 발현. 유전자 풍부성/발현은 건강한 대조군의 중간값과 비교하여 나타낸다(도 1에서와 같이 표지됨). 시험 세트 및 분리된 집단에 나타낸 수는 개개 환자에 상응한다.
도 6a 내지 6d. PDL1(CD274)는 주로 호중구에 의한 이의 과발현으로 인해 활성 TB를 지닌 환자의 전혈에서 지나치게 풍부하다. (6a) 활성 TB 환자(활성) 및 건강한 대조군(대조군)(또는 잠재성 남아프리카)의 전혈에서 PDL1의 풍부성(모든 시료의 중간값에 대해 표준화됨). 또한 대표적인 환자 및 대조군으로부터의 전혈 백혈구에서 PDL1의 기하 평균 형광성 강도(MFI)를 나타낸다. MFI 수준은 PDL1에 대한 발현 프로파일과 화살표로 연결되어 있다. 그래프는 11명의 활성 TB 환자 및 11명의 건강한 대조군으로부터의 혼주된(pooled) MFI 데이터를 나타낸다(오차 바아 = 평균 ± 95% CI). (6b) 상이한 세포 소-집단(청색)에 대한 PDL1의 MFI를 총 백혈구(적색) 및 전체 세포의 동형 대조군(녹색)에 대한 PDL1과 비교하였다. 대조군 및 환자를 나타낸다. 그래프는 활성 TB 환자 및 건강한 대조군의 동일한 수로부터의 혼주된 MFI 데이터를 나타낸다(오차 바아 = 평균 ± 95% CI). (6c) 모든 시료의 중간값에 대해 표준화된, PDL1에 대한 발현은 4명의 대조군 및 7명의 활성 TB 환자에 대해 풍부한 세포 소-집단에 대해 나타낸다. (6d) 활성 TB를 지닌 7명의 환자(활성)의 전혈에서 PDL1의 풍부성은 항-마이코박테리움 치료 후 0, 2 및 12개월째에 시험 세트로부터의 12명의 건강한 대조군(대조군)과 비교하여 나타낸다.
7a 내지 7c. 트레이닝, 시험 및 확인 세트의 형성. 각각의 집단(cohort)은 단지 독립적으로 보충될 뿐 아니라 RNA 프로세싱 및 마이크로어레이 분석의 모든 단계 또한 완전히 독립적으로 수행되었다. (7a) 영국 런던에서 트레이닝 세트 집단의 보충; (7b) 영국 런던에서 독립적인 시험 세트 집단의 보충. (7c) 남아프리카 케이프 타운에서 독립적인 확인 세트 집단의 보충.
도 8a 내지 8d. 환자 프로파일의 계층적 무리. (8a) 트레이닝 세트에 대한 1836개 전사체 발현 프로파일을 스피어만 상관계수에 의해 평균 연결로 감독하지 않은 계층적 무리에 적용시켜 조건 트리(열지도의 상부 모서리를 따라)를 생성하였다. 이들 환자 무리를 이후에 열지도의 하부 모서리를 따라 각각의 프로파일 하부에 블록으로 나타내었다. 핵심사항은 도의 하부에 제공한다. 무리를 거리에 따라 균일하게 나누었다. (8b) 시험 세트에 대한 393명의 전사체 발현 프로파일을 평균 연결을 사용하여 피어슨 상관계수로 무리화하였다. (8c) 확인 세트에 대한 393개 전사체 발현 프로파일을 평균 연결로 피어슨 상관계수에 의해 무리화하였다. (8d 및 8e) 확인 세트에서 단지 22세 내지 34세의 환자에 대한 393개의 전사체 환자 발현 프로파일.
도 9a 내지 9c. 질환의 방사선사진 정도를 사용한 활성 TB의 전사 시그너쳐의 비교. (9a) 질환의 정도에 따라 심장 방사선사진을 등급화하는데 사용된 분류 개략도. (9b) 분류 개략도에 따라서 X-선 등급에 따라 둘다 그룹화한, 트레이닝 세트에서 모두 13명의 TB 환자에 대한 393개 전사 발현 프로파일과, 진단시 촬영한 이들의 상응하는 심장 방사선사진. 제공된 환자의 발현 프로파일 및 방사선사진은 동일한 수치 지표로 제공한다. (9c) 시험 세트에서 21명의 활성 TB 환자에 대한 393개 전사체 발현 프로파일 및 심장 방사선사진.
도 10a 내지 10d. 활성 TB의 전혈 전사체 시그너쳐는 세포 조성에 있어서 명백한 변화 및 유전자 발현의 절대적 수준에 있어서 변화 둘다를 반영한다. 건강한 대조군과 비교한 활성 TB의 유전자 발현을 예정된 모듈러 체계내에서 맵핑한다. 점의 강도는 각각의 모듈에 대한 유의적으로 차등적인 발현된 전사체의 비율을 나타낸다(적색 = 증가, 청색 = 감소, 전사체 풍부성). 공평한 문헌 자료수집에 의해 미리 측정된 기능적 해석은 주로 도 4에서 색 코드화된 격자로 나타낸다. 당해 도에서는 (10a) 트레이닝 세트; (10b) 시험 세트; (10c) 확인 세트(SA)에서 과-(적색) 또는 저-발현된(청색) 각각의 모듈에서 유전자의 퍼센트를 입증한다. (10d) 건강한 사람에 대한 칭량된 분자 거리를 기본 예비-치료(0개월), 및 항-마이코박테리움 치료요법의 개시 후 2 및 12개월째에 각각의 환자에 대해 계산하였다. 개개의 환자 번호는 도 3a 내지 3d에 나타낸 것들에 상응한다.
도 11a 내지 11c. 활성 TB 환자 및 대조군의 혈액에서의 림프구의 분석. (11a) 시험 세트 건강한 대조군 및 활성 TB 환자로부터의 전혈을 T 세포 및 B 세포에 대해 분석하기 위해 사용된 유동 세포분석 게이팅 전략(flow cytometric gating strategy)을 나타낸다. 패널의 상부 열은 후속적인 게이팅에 사용된 림프구 FSC/SSC 게이트를 측정하기 위해 사용된 백게이팅 전략(backgating strategy)을 나타낸다. 큰 FSC/SSC 게이트는 초기 세트(좌측 패널)이며 이후 CD45 대 CD3에 대해 분석하였다. CD45CD3 세포를 게이팅(중간 패널)하고 이들의 FSC/SSC 프로파일을 측정하였다(우측 패널). 이후에, 당해 프로파일을 사용하여 적절한 림프구 FSC/SSC 게이트를 측정하였다(참조: 제2 열, 좌측 패널). 당해 백게이팅 과정은 또한 CD45+CD19+(B 세포) 상에서 게이팅을 수행함으로써 이들 세포가 림프구 게이트에 포함되는 것을 확보하였다(나타내지 않음). 패널의 제2 열은 T 세포 집단을 확인하는데 사용된 게이팅 전략을 나타낸다. 림프구 FSC/SSC 게이트를 셋팅하고 이들 세포를 CD45 대 CD3(좌측으로부터 2번째 패널)에 대해 평가하였다. 이후에, CD45+ 세포를 게이팅하고 CD3 대 CD8에 대해 평가하였다. CD3+ T 세포를 게이팅하고 CD4 및 CD8 발현에 대해 평가하였다. 이후에, CD4+ 및 CD8+ 소세트를 게이팅하였다. 열 3 내지 6은 T 세포 기억 소세트를 정의하기 위해 사용된 게이팅 전략을 나타낸다. 열 2에서와 같이 게이팅된 CD4 및 CD8 T 세포는 CD45RA 대 CCR7 발현 및 동형 대조군(열 5 및 6)을 기초로 사분면 세트에 대해 평가함으로써 나이브(naive)(CD45RA+CCR7+), 중심 기억(CD45RA-CCR7+), 효과기 기억(CD45RA-CCR7-) 및CD8+ T 세포의 경우에, 말단 분화된 효과기(CD45RA+CCR7-) T 세포를 정의하였다. 이들 소세트를 또한 CD62L 발현에 대해 평가하였다. 패널의 하부 열은 B 세포를 게이팅하기 위해 사용된 전략을 나타낸다. 림프구 FSC/SSC 게이트를 셋팅하고 세포를 CD45 대 CD19에 대해 평가하였다. CD45+ 세포를 게이팅하고 CD19 및 CD20에 대해 평가하였다. B 세포는 CD19+CD20+로 정의하였다. (11b) 11개의 시험 세트 건강한 대조군으로부터의 전혈(대조군) 및 9개의 시험 세트 활성 TB 환자(활성)를 T 세포 기억 집단에 대해 다중-매개변수 유동 세포분석기로 분석하였다. 완전한 유동 세포분석 게이팅 전략은 도 11a에 나타낸다. 그래프는 나이브, 중심 기억(TCM), 효과기 기억(TEM) 및 말단 차등화된 효과기(TD, CD8+ T 세포만) 세포 소세트(상부 열, 각각의 그룹)의 퍼센트에 대한 모든 개인의 혼주된 데이터 및 각각의 세포 소세트(하부 열, 각각의 그룹)에 대한 세포수(x106/ml)를 나타낸다. 각각의 기호는 개개 환자를 나타낸다. 수평 선은 중간값을 나타낸다. (11c) 유전자 (i) 활성 TB(트레이닝, 시험 및 확인 세트)로부터의 전혈 시료에서 T 세포 전사체 풍부성; 및 (ii) 시험 세트 혈액으로부터의 분리된 혈액 림프구 집단에서 발현. 유전자 풍부성/발현은 건강한 대조군(도 1에서와 같이 표지됨)의 중간값과 비교하여 나타낸다. 시험 세트 및 독립적인 집단에서 나타낸 수는 개개 환자에 상응한다.
도 12a 내지 12c. 활성 TB 환자 및 대조군의 혈액에서 골수종 세포의 분석. (12a) 시험 세트 건강한 대조군 및 활성 TB 환자로부터의 전혈을 단핵구 및 호중구에 대해 분석하기 위해 사용된 유동 세포분석 게이팅 전략을 나타낸다. 큰 FSC/SSC 게이트를 셋팅(상부 열, 좌측 패널)한 후 CD45 대 CD14에 대해 분석하였다. CD45+ 세포를 게이팅하고(중간 패널) CD14 대 CD16에 대해 평가하였다. 단핵구는 CD14+로, 염증성 단핵구는 CD14+CD16+로 및 호중구는 CD16+로 정의하였다. 또한 당해 도에는 CD16+ 호중구와 CD16을 발현하는 NK 세포 사이의 가능한 오버랩을 평가하기 위해 사용된 게이팅 전략을 나타낸다. 큰 FSC/SSC 게이트를 셋팅하여 호중구 및 NK 세포 둘다를 포함시켰다. (12b) 이후에, CD45+ 세포를 CD16 대 CD56 (NK 세포 마커)에 대해 평가하였다. CD16+ 호중구는 고 수준의 CD16을 발현하나 CD56은 발현하지 않았다(동형 대조군 플롯으로 나타낸 바와 같음, 하부 패널). CD56+ NK 세포는 중간 수준의 CD16을 발현하였으나 CD16hi 세포와 오버랩되지 않았다. CD56+CD16int 세포 및 CD16hi 세포는 상이한 FSC/SSC 특성을 가졌다. (12c) 골수종 유전자 (i) 활성 TB(트레이닝, 시험 및 확인 세트)로부터의 전혈 시료에 있어서 전사체 풍부성; 및 (ii) 시험 세트 혈액으로부터 분리된 혈액 백혈구 집단에서의 발현. 유전자 풍부성/발현은 건강한 대조군(도 1에서와 같이 표지됨)의 중간값과 비교하여 나타낸다. 시험 세트 및 분리된 집단에 나타낸 숫자는 개개 환자에 상응한다.
도 13a 및 13b. 393개-전사체 시그너쳐의 독창성 경로 분석. (13a) 각각의 표준 생물학적 경로가 유의적으로 과-표시된 가능성[피셔 정확도 시험(Fischer's Exact test)에 의해 벤자미니-호크베르그 다중 시험 교정(Benjamini-Hochberg multiple testing correction)으로 계산된 p-값의 -log로서]은 오렌지색 사각형으로 나타낸다. 균일한 색상(solid coloured)의 바아는 분석된 유전자 목록에 나타낸 경로(각각의 바의 우측 모서리에서 굵게 나타냄)를 포함하는 유전자의 총 수의 퍼센트를 나타낸다. 바아의 색상은 트레이닝 세트에서 건강한 대조군과 비교한 활성 TB를 가진 환자의 전혈에서 전사체의 풍부성을 나타낸다. (13b) 인터페론-알파 2a(IFN-α 2a), 및 인터페론-감마((IFN-γ)의 혈청 수준은 당해 도에서 트레이닝 세트 마이크로어레이 분석을 위해 사용된 12명의 건강한 대조군 및 활성 TB를 가진 13명의 환자에 대해 나타낸다. 2개-테일된 만-휘트니 시험을 이용한 사이토킨에 대해 그룹들 사이에서 유의적인 차이는 관찰되지 않았다. 수평선은 각각의 그룹에 대한 평균을 나타내고 위스커(whisker)는 95% 신뢰 구간을 나타낸다.
도 14a 및 14b. 개개의 건강한 대조군 및 활성 TB를 가진 환자로부터의 전혈 및 세포 소-집단에 있어서 PDL1(CD274) 발현. (14a) 11명의 시험 세트 건강한 대조군(대조군) 및 11명의 시험 세트 활성 TB 환자(활성)으로부터의 전혈을 PDL1의 발현에 대해 유동 세포분석기로 분석하였다. 큰 FSC/SSC 게이트를 설정하여 총 백혈구 세포를 포함시키고 동형 대조군(녹색)과 비교하여 PDL1(적색)의 기하 평균 형광성 강도((MFI)를 평가하였다. 각각의 활성 TB 환자를 상이한 날에 분석하고, 건강한 대조군은 소 그룹(좌측으로부터, 시료 1 및 2, 3 및 4, 6 내지 8 및 9 내지 11을 함께 수행하고, 5는 단독 수행하였다)으로 분석하고 각각의 그룹내 시료는 동형 대조군을 공유한다. (14b) 동일한 11개의 시험 세트 건강한 대조군(대조군) 및 11개의 시험 세트 활성 TB 환자(활성)의 혈액으로부터의 세포 소-집단을 a 부분으로서 또한 PDL1의 발현에 대해 유동 세포분석기로 분석하였다. 세포 소-집단은 도 6b에서와 같이 정의하였으며 동형 대조군(녹색)과 비교한 것으로서 PDL1의 MFI(적색)를 플롯팅하였다.
도 15a 내지 f. 유전자 기호와 함께 확대하여 나타낸 연구 그룹에 따라 체계화한 트레이닝 세트 393개-전사체 프로파일은 도의 우측에 나열한다. 주요 전사체는 보다 큰 내용으로 강조한다. 각각의 도의 좌측에서 전체 유전자 트리 및 열지도를 흑색 삼각형으로 표시한 확장된 영역과 함께 나타낸다. 전사체의 상대적인 풍부성은 도의 배경에서 색상 규모로 나타낸다(도 1에서와 같음).
도 16a 내지 16은 열지도의 우측면에 나열한 바와 같이, 각종 유전자에 대한 대조군, 잠복성 및 활성을 비교한 열지도이다.
도 17a 내지 17c는 표에 나열한 각종 트레이닝 세트, 시험 세트 및 확인 세트, 즉 각종 분석을 갖는 성별, 기원국 및 민족에 대한 통계를 갖는 표이다.
도 18a 내지 18c는 표에 시험 결과를 나열한 각종 트레이닝 세트, 시험 세트 및 확인 세트에 대한 통계, 즉, TST, BCG 예방접종 및 도말 상태에 대한 시험 결과를 갖는 표이다.
도 19는 시료에 대한 각종 공급원들 사이의 트레이닝 세트, 시험 세트 및 확인 세트의 특이성 및 민감성에 대한 결과를 요약한 표이다.
본 발명의 각종 실시형태의 제조 및 사용이 하기에 상세히 논의되어 있지만, 본 발명이 광범위한 특수 내용에서 실현될 수 있는 많은 적용가능한 발명 개념을 제공함을 이해하여야 한다. 본원에 논의된 구체적인 실시형태는 단지 본 발명을 제조하고 사용하기 위한 특수 방법의 예이며 본 발명의 영역을 한정하지 않는다.
본 발명의 이해를 촉진시키기 위해, 다수의 용어들이 하기 정의된다. 본원에 정의된 용어들은 본 발명과 관련된 당해 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 의미를 갖는다. 단수("a", "an" 및 "the")와 같은 용어는 단수 실체만을 말하는 것이 아니라 설명을 위해 사용될 수 있는 특수 예의 일반적인 부류를 포함한다. 본원의 전문용어는 본 발명의 구체적인 실시형태를 설명하기 위해 사용되지만, 이들의 용도는 특허청구범위에 요약된 것을 제외하고는, 본 발명을 제한하지 않는다. 달리 정의하지 않는 한, 본원에 사용된 모든 기술적 및 과학적 용어들은 본 발명이 속하는 당해 분야의 숙련가에 의해 일반적으로 이해되는 의미를 갖는다. 다음 참조문헌은 본 발명에서 사용된 많은 용어들의 일반적인 정의를 숙련가들에게 제공한다: Singleton et al., Dictionary of Microbiology and Molecular Biology (2d ed. 1994); The Cambridge Dictionary of Science and Technology (Walker ed., 1988); The Glossary of genetics, 5TH ED., R. Rieger et al. (eds.), Springer Verlag (1991); and Hale & Marham, The Harper Collins Dictionary of Biology (1991).
각종 생화학적 및 분자 생물학적 방법이 당해 분야에 잘 공지되어 있다. 예를 들면, 핵산의 분리 및 정제 방법은 보충물을 포함하여 문헌[참조: WO 97/10365; WO 97/27317; Chapter 3 of Laboratory Techniques in Biochemistry and Molecular Biology: Hybridization with Nucleic Acid Probes, Part I. Theory and Nucleic Acid Preparation, (P. Tijssen, ed.) Elsevier, N.Y. (1993); Sambrook, et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, N.Y., (1989); 및 Current Protocols in Molecular Biology, (Ausubel, F. M. et al., eds.) John Wiley & Sons, Inc., New York (1987-1999)]에 상세히 기술되어 있다.
생물정보학적 정의
본원에 사용된 바와 같은, "대상체"는 목적한 특정 항목 또는 정보(일반적으로 명사, 동사, 형용사, 부사, 구, 문장, 기호, 수치적 특성 등을 포함하는 본문)을 말한다. 따라서, 대상체는 공급원으로부터 얻고/얻거나, 확인되고/되거나 조사될 수 있는 임의의 것 및 관계를 형성할 수 있는 임의의 것이다. "대상체"는 유전자, 단백질, 질환, 표현형, 메커니즘, 약물 등과 같은 목적한 실체를 포함하나, 이에 한정되지 않는다. 일부 양상에서, 대상체는 하기 추가로 기술된 바와 같은 데이터일 수 있다.
본원에 사용된 바와 같은, "관계"는 동일한 단위(예를 들면, 구, 문장, 본문 중 2개 이상의 라인, 단락, 웹페이지의 단락, 페이지, 잡지, 논문, 책 등)내에서 대상체의 동시-출현을 말한다. 이는 본문, 기호, 숫자 및 이들의 조합일 수 있다.
본원에 사용된 것으로서, "메타 데이터 내용"은 데이터 공급원에서 본문의 구조화에 관한 정보를 말한다. 메타 데이터는 두블린 코어 메타데이터(Dublin Core metadata)와 같은 표준 메타데이터를 포함할 수 있거나 수집-특이적일 수 있다. 메타데이터 양식의 예는 라이브러리 카탈로그, 자원 기술 양식(Resource Description Format: RDF) 및 연장가능한 마크업 언어(Extensible Markup Language: XML)에 사용된 기계 판독가능한 카탈로그(Machine Readable Catalog: MARC)를 포함하나, 이들에 한정되지 않는다. 메타 대상체는 수동으로 또는 자동화된 정보 추출 알고리즘을 통해 생성될 수 있다.
본원에 사용된 바와 같은, "엔진"은 다른 프로그램에 대한 중심(core) 또는 필수적 기능을 수행하는 프로그램을 말한다. 예를 들면, 엔진은 다른 프로그램의 전체 작동과 상대가 되는 작동 시스템 또는 적용 프로그램에서 중심 프로그램일 수 있다. 용어 "엔진"은 또한 변할 수 있는 알고리즘을 함유하는 프로그램을 나타낼 수 있다. 예를 들면, 지식 발견 엔진을 설계하여 관계를 확인하는 이의 시도를 변경시켜 관계를 확인하고 등급을 매기는 새로운 법칙을 반영할 수 있다.
본원에 사용된 바와 같은, "의미 분석"은 유사한 개념, 예를 들면, 접미사 제거 또는 스테밍(stemming)에 의해 또는 유의어사전을 사용함으로써 나타내는 단어들 사이의 관계의 확인을 말한다. "통계적 분석"은 각각의 용어(단어, 어원, 어간, n-그람, 구 등)의 출현 수의 계산을 기초로 하는 기술을 말한다. 대상체에 대한 무제한된 수집에서, 상이한 내용에서 사용된 동일한 어구는 상이한 개념을 나타낼 수 있다. 어구 동시-출현의 통계적 분석은 단어 의미 모호성을 해결하는데 도움이 될 수 있다. "구문론적 분석"은 품사 분석에 의해 모호성을 추가로 감소시키기 위해 사용될 수 있다. 본원에 사용된 것으로서, 하나 이상의 이러한 분석은 보다 일반적으로 "어휘 분석(lexical analysis)"으로 언급된다. '인공 지능(AI)"은, 컴퓨터와 같은 비-사람 장치에 의해, 사람이 가치있거나 "지적인" 것으로 여기는 업무를 수행하는 방법을 말한다. 예는 사진을 확인하고, 대화체 또는 본문을 이해하며, 문제를 해결함을 포함한다.
이러한 '데이터", "데이터세트" 및 "정보"와 같은 용어들은 "정보" 및 "지식"과 같이 상호교환적으로 흔히 사용된다. 본원에 사용된 것으로서, "데이터"는 실증적 측정 또는 측정 세트인 가장 근본적인 단위이다. 데이터는 정보에 기여하도록 편집되지만, 이는 근본적으로 이와 독립적이며 데이터의 세트인 데이터세트로 결합될 수 있다. 대조적으로, 정보는 흥미로부터 기원하는데, 예를 들어, 데이터(단위)는 심혈관병의 위험과 관련된 변수를 찾을 목적을 위한 민족성, 성별, 신장, 체중 및 식이에 있어 수집될 수 있다. 그러나, 동일한 데이터를 사용하여 포뮬레이션을 개발하거나 식이 선호성, 즉, 시장에서 특정 제품이 보다 높은 판매 경향성을 갖는 경향에 대한 "정보"를 생성할 수 있다.
본원에 사용된 것으로서, 용어 "데이터베이스"는, 각종 정보 측면이 데이터 장내에서 발견될 수 있는 경우에서조차 순수한 데이터 또는 편집된 데이터에 대한 레퍼토리를 말한다. 데이터베이스는 하나 이상의 데이터세트를 포함할 수 있다. 데이터베이스는 전형적으로 조직화되어 이의 내용은 접근되고, 관리되며 업데이트될 수 있다(예를 들어, 데이터베이스는 역동적이다). 용어 "데이터베이스" 및 "공급원"은 또한 본 발명에서 상호교환적으로 사용되는데, 이는 데이터 및 정보의 주요 공급원이 데이터베이스이기 때문이다. 그러나, "데이터베이스 공급원" 또는 "데이터 공급원"은 일반적으로 데이터, 예를 들면, 대상체를 확인하고 관계를 측정하기 위해 시스템내로 도입된 구조화되지 않은 내용 및/또는 구조화된 데이터를 말한다. 데이터베이스 공급원은 관련 데이터베이스일 수 있거나 아닐 수 있다. 그러나, 시스템 데이터베이스는 대개 대상체들 사이의 관계와 관련된 값을 저장하는 관계 데이터베이스 또는 일부 동일한 유형의 데이터베이스를 포함한다.
본원에 사용된 것으로서, "시스템 데이터베이스" 및 "관계 데이터베이스"는 상호교환적으로 사용되며 예정된 범주로 맞춰진 데이터를 함유하는 표의 세트로서 구조화된 데이터의 하나 이상의 수집물을 말한다. 예를 들면, 데이터베이스 표는 컬럼에 의해 정의된 하나 이상의 범주(예를 들면, 속성)를 포함할 수 있는 반면, 데이터베이스의 열은 컬럼에 의해 정의된 범주에 대한 유일한 대상체를 함유할 수 있다. 따라서, 유전자의 확인과 같은 대상체는 이의 존재, 부재 및/또는 유전자의 발현 수준에 대한 컬럼을 가질 수 있다. 관계 데이터베이스의 열은 또한 "세트"로 언급될 수 있으며 일반적으로 이의 컬럼의 값으로 정의된다. 관계 데이터베이스의 내용에서 "도메인"은 컬럼이 포함할 수 있는 것과 같이 장(field)의 유효 값의 범위이다.
본원에 사용된 것으로서, "지식의 도메인"은, 시스템이 작동적인 연구의 영역, 예를 들면, 모든 생물의학 데이터를 말한다. 수개의 도메인으로부터의 데이터, 예를 들면, 생물의학적 데이터 및 가공 데이터를 결합하는 것이 유리하다는 것을 지적하여야 하며, 이는, 이러한 다양한 데이터가 때때로 하나의 영역 또는 조사/연구(하나의 도메인)과 단지 친숙한 정상 사람에 대한 것과 합해질 수 없는 것들을 결합시킬 수 있기 때문이다. "분산된 데이터베이스"는 네트워크에서 상이한 지점들 중에서 분산되거나 반복될 수 있는 데이터베이스를 말한다.
본원에 사용된 것으로서, "정보"는 숫자, 문자, 숫자의 세트, 문자의 세트, 또는 데이터의 세트로부터 생성되거나 이로부터 기원한 결론을 말한다. 이후에, "데이터"는 정보의 측정 또는 통계적 및 기본 단위이다. "정보"는 또한 단어, 기호, 내용, 예를 들면, 구조화되지 않은 자유 내용, 코드 등과 같은 다른 유형의 데이터를 포함할 수 있다. "지식"은 시스템을 충분히 이해하여 원인 및 결과를 모델화하는 정보의 세트로 막연히 정의된다. 앞서의 예를 확장하기 위해, 인구통계, 성별 및 선행 구매에 있어서의 정보를 사용하여 식품 판매를 위한 지역적 시판 전략을 개발할 수 있는 반면, 국적에 대한 정보는 구매업자에 의해 제품의 중요성에 대한 안내서로 사용될 수 있다. 데이터, 정보 및 지식 사이에 엄격한 경계는 존재하지 않으며; 여기서 3개 용어는 가끔 동일한 것으로 고려됨을 주목하는 것이 중요하다. 일반적으로, 데이터는 실험으로부터 얻어지며, 정보는 관련성으로부터 얻어지고, 지식은 모델화로부터 얻어진다.
본원에 사용된 것으로서, "프로그램" 또는 "컴퓨터 프로그램"은 일반적으로 특수한 프로그래밍 언어의 법칙에 일치하며 특정의 기능, 업무 또는 문제를 해결하거나 실행하는데 필요한 "코드 분절"로 나누어질 수 있는 선언 및 기술 또는 지시로 구성된 구문 단위를 말한다. 프로그래밍 언어는 일반적으로 프로그램을 표시하기 위한 인공 언어이다.
본원에 사용된 것으로서, "시스템" 또는 "컴퓨터 시스템"은 일반적으로 하나 이상의 컴퓨터, 단말 장치, 및 데이터 프로세싱을 수행하는 소프트웨어를 말한다. 일반적으로 "사용자" 또는 "시스템 작업자"는 데이터 프로세싱 또는 정보 교환 목적으로 "사용자 장치"(예를 들면, 컴퓨터, 무선 장치 등)를 통해 접근된 컴퓨터 네트워크를 사용하는 사람을 포함한다. "컴퓨터"는 일반적으로 사람의 개입없이 다수의 산술 연산 및 논리 연산을 포함하는 실질적인 컴퓨터화를 수행할 수 있는 기능 단위이다.
본원에 사용된 것으로서, "애플리케이션 소프트웨어" 또는 "애플리케이션 프로그램"은 일반적으로 애플리케이션 문제의 해결에 대해 특이적인 소프트웨어 또는 프로그램을 말한다. "애플리케이션 문제"는 일반적으로 최종 사용자에 의해 제출되고 이의 해결을 위해 정보 프로세싱을 필요로 하는 문제이다.
본원에 사용된 것으로서, "자연 언어"는, 이의 규칙이 구체적으로 기술되지 않고 현재 사용을 기초로 하는 언어, 예를 들면, 영어, 스페인어 또는 중국어를 말한다. 본원에 사용된 것으로서, "인공 언어"는, 이의 규칙이 이의 사용전에 명확하게 확립된 언어, 예를 들면, 컴퓨터-프로그래밍 언어, 예를 들면, C, C++, 자바(Java), 베이직(BASIC), 포트란(FORTRAN), 또는 코볼(COBOL)을 말한다.
본원에 사용된 것으로서, "통계적 관련성"은 하나 이상의 순위매김 계획(O/E 비, 강도 등)을 사용하는 것을 말하며, 여기서 관계는, 이것이 무작위적 기회에 의해 예측될 수 있는 것보다 유의적으로 더 자주 발생하는지에 대해 통계적으로 관련성이 있는지를 측정한다.
본원에 사용된 것으로서, 용어 "대등하게 조절된 유전자" 또는 "전사 모듈"은 특정 유전자의 그룹화된, 유전자 발현 프로파일(예를 들면, 특이적인 유전자 서열과 관련된 시그날 값)을 나타내기 위해 상호교환적으로 사용된다. 각각의 전사 모듈은 데이터의 2개의 주요(key) 조각, 문헌 조사 부분, 및 유전자 마이크로어레이로부터 얻은 실제 실험적 유전자 발현 값 데이터와 상호관련된다. 전사 모듈로 선택된 유전자의 세트는 유전자 발현 데이터(위에서 기술한 모듈 추출 알고리즘)의 분석을 기초로 한다. 추가의 단계는 문헌 편집에 의한 Chaussabel, D. 및 Sher, A.의 Mining microarray expression data에 교시되어 있다. 본원에 참조로 혼입된 문헌, Genome Biol 3, RESEARCH0055 (2002), (http://genomebiology.com/2002/3/10/research/0055) 관련 부분 및 목적한 질환 또는 상태, 예를 들면, 전신 홍반 루프스(Systemic Lupus erythematosus), 관절염, 림프종, 암종, 흑색종, 급성 감염, 자가면역 장애, 자가염증성 장애 등으로부터 얻은 발현 데이터.
하기 표는 전사 모듈에 대한 기여 또는 문헌 조사 부분을 개발하기 위해 사용된 키워드의 예를 나열한다. 숙련가들은, 다른 용어들도 다른 상태, 예를 들면, 특이적인 암, 특이적인 감염성 질환, 이식 등을 위해 용이하게 선택될 수 있음을 인식할 것이다. 예를 들면, T 세포 활성화와 관련된 이들 유전자에 대한 시그날 및 유전자는 하기에 모듈 확인번호 "M 2.8"로 기술되어 있으며, 여기서 특정 키워드(예를 들면, 림프종, T 세포, CD4, CD8, TCR, 흉선, 림프구, IL2)를 사용하여 주요 T-세포 관련 유전자, 예를 들면, T-세포 표면 마커(CD5, CD6, CD7, CD26, CD28, CD96); 림프구 계통 세포에 의해 발현된 분자(림프독소 베타, IL2-유도성 T-세포 키나제, TCF7; 및 T-세포 분화 단백질 mal, GATA3, STAT5B)를 확인하였다. 다음에, 완전한 모듈을, 이들 유전자에 대한 환자 집단으로부터의 데이터(플랫폼, 존재/부재 및/또는 상향조절 또는 하향조절에 상관없이)를 상호관련시켜 전사 모듈을 생성함으로써 개발한다. 일부 경우에, 유전자 프로파일은 이들 질환 상태 및 데이터에 대한 임의의 특정 유전자의 무리와 일치(이 시기에)하지 않지만, 특정의 생리학적 경로[예를 들면, cAMP 시그날링, 아연-핑거 단백질(zinc-finger protein), 세포 표면 마커 등]가 "측정되지 않은" 모듈에서 발견된다. 실제로, 유전자 발현 데이터 세트를 사용하여 키워드 조사와 일치시키기 전에 조화된 발현을 갖는 유전자를 추출할 수 있는데, 즉, 어느 한 데이터 세트는 제2의 데이터 세트와 교차-참조하기 전에 관련시킬 수 있다.
Figure pct00001
Figure pct00002
Figure pct00003

생물학적 정의
본원에 사용된 것으로서, 용어 "어레이"는 지지체에 부착된 하나 이상의 펩타이드 또는 핵산 프로브(probe)를 지닌 고체 지지체 또는 기판을 말한다. 어레이는 전형적으로 상이한, 공지된 위치에서 기질의 표면에 커플링된 하나 이상의 상이한 핵산 또는 펩타이드 프로브를 갖는다. "마이크로어레이" 또는 "유전자-칩"으로 또한 기술된 이들 어레이는 또한 공지된 게놈, 예를 들면, 사람 게놈을 기초로 하여 10,000; 20,000, 30,000; 또는 40,000개의 상이한 확인가능한 유전자를 가질 수 있다. 이들 팬-어레이(pan-array)은 시료내에서 발현되거나 발견되는 유전자의 전사 혼주물 또는 전체 "트랜스크립톰(transcriptome)", 예를 들면, RT 및/또는 RT-PCR에 적용시켜 DNA 레플리콘(replicon)의 상보성 세트를 제조할 수 있는 RNA, mRNA 등으로 발현된 핵산을 검출하기 위해 사용된다. 어레이는 비-리소그래피 및/또는 포토리소그래피 방법 및 고체 상 합성 방법의 조합을 도입하는 기계적 합성 방법, 광 지시된 합성 방법 등을 사용하여 생산할 수 있다.
이들 핵산 어레이의 합성을 위한 각종 기술은 사실상 특정 유형의 표면 또는 심지어 다수의 표면 상에 기술되거나, 예를 들면, 제작되어 있다. 어레이는 비드(bead), 겔, 중합체 표면, 섬유, 예를 들면, 광 섬유, 유리 또는 특정의 다른 적절한 기판 상의 펩타이드 또는 핵산일 수 있다. 어레이는 모든 포괄 장치의 진단 또는 다른 조작을 허용하는 방식으로 패키징될 수 있다(참조: 예를 들면, 본원에 참조로 인용된 미국 특허 제6,955,788호, 관련 부분).
본원에 사용된 것으로서, 용어 "질환"은 세포의 어떠한 비정상적인 생물학적 상태를 지닌 유기체의 생리학적 상태를 말한다. 질환은 내재되거나, 유전될 수 있고, 감염에 의해 유발될 수 있으며, 비정상적인 세포 기능, 비정상적인 세포 분열 등에 의해 유발될 수 있는 세포, 조직, 신체 기능, 시스템 또는 기관의 차단, 중지 또는 장애를 포함하나, 이들에 한정되지 않는다. "질환 상태"를 초래하는 질환은 일반적으로 생물학적 시스템, 즉, 질환의 숙주에 치명적이다. 본 발명과 관련하여, 질환 또는 장애와 관련된 임의의 생물학적 상태의 감염(예를 들면, 바이러스, 세균, 진균, 기생충 등), 염증, 자가염증, 자가면역성, 과민증, 알레르기, 조기악성종양, 악성종양, 수술, 이식, 생리 등은 질환 상태인 것으로 고려된다. 병리학적 상태는 일반적으로 질환 상태와 동등하다.
질환 상태는 또한 질환 상태의 상이한 수준으로 분류될 수 있다. 본원에 사용된 것으로서, 질환 또는 질환 상태의 수준은 질환 또는 질환 상태의 진행 및 치료시, 치료 동안 및 치료 후 생리학적 반응을 반영하는 임의 척도이다. 일반적으로, 질환 또는 질환 상태는 수준 또는 단계를 통해 진행될 것이며, 여기서, 질환의 영향은 점점 더 심각해질 것이다. 질환 상태의 수준은 시료내에서 세포의 생리학적 상태에 의해 영향받을 수 있다.
본원에 사용된 것으로서, 용어 "치료요법" 또는 "치료학적 요법"은 질환 상태, 예를 들면 약리학적, 외과적, 식이적 및/또는 다른 기술을 사용하여 질환의 영향 또는 증상을 감소시키거나 제거하도록 의도된 치료의 과정을 완화시키거나 변경시키기 위해 취해진 의학적 단계를 말한다. 치료학적 요법(regimen)은 처방된 용량의 하나 이상의 약물 또는 수술을 포함할 수 있다. 치료요법은 가장 흔히 유리할 것이며 질환 상태를 즉시 감소시킬 것이지만, 많은 예에서 치료요법의 효과는 바람직하지 않거나 부작용을 가질 것이다. 치료요법의 효과는 또한 숙주의 생리학적 상태, 예를 들면, 연령, 성별, 유전, 체중, 기타 질환 상태 등에 의해 영향받을 것이다.
본원에 사용된 것으로서, 용어 "약리학적 상태" 또는 "약리학적 현상"은 시료내에서 하나 이상의 핵산의 약리학적 상태에 영향을 미칠 수 있는, 예를 들면, 약리학적 개입의 결과로서 새로이 전사되고/되거나, 안정화되고/되거나, 탈안정화될 수 있는 하나 이상의 약물, 수술 등일 수 있고/있거나 치료된 시료를 말한다. 시료의 약리학적 상태는 약물 치료 전, 동안 및/또는 후에 생물학적 상태에 있어서의 변화에 관한 것이며 본원에 교시된 바와 같이 진단 또는 예측 기능을 제공할 수 있다. 약물 치료 또는 수술 이후 일부 변화는 질환 상태와 관련될 수 있고/있거나 치료요법과 관련되지 않은 부작용일 수 있다. 약리학적 상태에 있어서의 변화는 치료요법의 지속기간, 처방된 약물의 유형 및 용량, 제공된 치료요법의 과정과의 순응도 및/또는 섭취한 처방되지 않은 약물의 결과일 수 있다.
본원에 사용된 것으로서, 용어 "생물학적 상태"는 발현에 있어서 변화의 분석을 위해 분리하고 정제된 세포 시료의 트랜스크립톰(즉, RNA 전사체의 전체 수집물)의 상태를 말한다. 생물학적 상태는 형태학적 표현형 또는 전사체의 검출을 위한 방법들의 조합에 따라 특징화된, 세포 성분의 풍부성 및/또는 활성을 측정함으로써 시료내에서 세포의 생리학적 상태를 반영한다.
본원에 사용된 것으로서, 용어 "발현 프로파일"은 RNA, DNA 또는 단백질 풍부성 또는 활성 수준의 상대적 풍부성을 말한다. 발현 프로파일은 예를 들면 임의의 수의 방법에 의해 및 임의의 수의 유전자-칩, 유전자 어레이, 비드, 멀티플렉스 PCR, 정량적 PCR, 런-온 검정(run-on assays), 노던 블롯 분석(Northern blot analysis), 웨스턴 블롯 분석(Western blot analysis), 단백질 발현, 형광성 활성화된 세포 분류(FACS), 효소 결합된 면역흡착성 검정(ELISA), 화학발광성 검정, 효소 검정, 증식 연구 또는 용이하게 상업적으로 이용가능한 유전자 발현의 측정 및/또는 분석을 위한 임의의 다른 방법, 장치 및 시스템을 사용한 전사 상태 또는 해독 상태의 예에 대한 측정일 수 있다.
본원에 사용된 것으로서, 용어 시료의 "전사 상태"는 시료 속에 존재하는 RNA 종, 특히 mRNA의 동일성(identity) 및 상대적 풍부성을 포함한다. RNA의 동일성 및 풍부성의 조합인, 시료의 전체 전사 상태는 또한 본원에서 트랜스크립톰으로 언급된다. 일반적으로, 시료 중에서 RNA 종의 전체 세트의 모든 상대적 성분의 실제 분획이 측정된다.
본원에 사용된 것으로서, 용어 "모듈러 전사 벡터"는 "차등적으로 발현된 유전자의 비율"을 반영하는 전사 발현 데이터를 말한다. 예를 들면, 각각의 모듈의 경우 전사체의 비는 적어도 2개의 그룹(예를 들면, 건강한 대상체 대 환자) 사이에서 차등적으로 발현된다. 당해 벡터는 2개의 시료 그룹의 비교로부터 기원한다. 제1의 분석 단계는 각각의 모듈내 전사체의 질환-특이적인 세트의 선택을 위해 사용된다. 다음에, "발현 수준"이 존재한다. 제공된 질환에 대한 그룹 비교는 각각의 모듈에 대한 차등적으로 발현된 전사체의 목록을 제공한다. 상이한 질환은 모듈러 전사체의 상이한 소세트를 생성함이 밝혀졌다. 당해 발현 수준을 사용하여 이후 차등적으로 발현되는 것으로 확인된 유전자의 질환-특이적인 소세트의 발현 값을 평균냄으로써 단일 시료에 대한 각각의 모듈(들)에 대한 벡터를 계산하는 것이 가능하다. 이러한 시도는 단일 시료에 대한 모듈러 발현 벡터의 맵의 생성, 예를 들면, 본원에 기술된 모듈 맵에 기술된 것들을 허용한다. 이들 벡터 모듈 맵은 각각의 시료에 대해 기원할 수 있는 각각의 모듈(차등적으로 발현된 유전자의 비율 대신)에 대한 평균 발현 수준을 나타낸다.
본 발명을 사용하여, 모듈-수준뿐만 아니라 유전자 수준에서도 질환을 확인하고 구별하는 것이 가능하고, 즉, 2개의 질환은 동일한 벡터(차등적으로 발현된 전사체의 동일한 비, 동일한 "양극성")를 가질 수 있지만, 벡터의 유전자 조성은 여전히 질환-특이적이다. 유전자-수준 발현은 분석의 해상도를 크게 증가시키는 명백한 장점을 제공한다. 또한, 본 발명은 복합체 전사 마커의 장점을 취한다. 본원에 사용된 것으로서, 용어 "복합체 전사 마커"는 마커로서 개개 유전자를 사용하는 것과 비교한 것으로서 다수의 유전자(모듈의 소세트)의 평균 발현 값을 말한다(이들 마커의 조성은 질환 특이적일 수 있다). 복합체 전사 마커 시도는, 사용자가 예를 들면, SLE를 가진 환자에서 질환 중증도를 평가하거나 본원에 기재된 발현 벡터를 유도하기 위한 다변량 마이크로어레이 점수를 개발할 수 있기 때문에 독특한 것이다. 가장 중요하게는, 본 발명의 복합체 모듈 전사 마커를 사용하여 본원에서 발견된 결과를 마이크로어레이 플랫폼에 걸쳐 재생산함으로써 조절 승인에 대한 보다 큰 신뢰도를 제공한다.
본 발명과 함께 사용하기 위한 유전자 발현 모니터링 시스템은 하나 이상의 표적 질환에 대해 특이적이고/이거나 커스터마이징된(customized) 유전자의 제한된 및/또는 기본적인 수를 갖는 커스터마이징된 유전자 어레이를 포함할 수 있다. 통상적으로 사용되는 일반적인, 팬-게놈 어레이(pan-genome array)와는 달리, 본 발명은 소급적용되는 유전자에 대한 이들 일반적인 팬-어레이 및 특이적인 플래폼을 사용할 필요가 없는 게놈 분석을 사용할 뿐 아니라, 보다 중요하게는, 이는 수천개의 다른, 비-관련 유전자에 대한 요구없이 분석을 위한 최적 유전자 세트를 제공하는 커스터마이징된 어레이의 개발을 제공한다. 기존 기술을 능가하는 본 발명의 최적화된 어레이 및 모듈의 한가지 명백한 장점은 금융 비용(예를 들면, 검정, 물질, 장비, 시간, 개인, 훈련당 비용 등)에 있어서의 감소 및 보다 중요하게는, 방대한 대부분의 데이터가 관련성이 없는 팬-어레이를 제작하는 환경적 비용에 있어서의 감소이다. 본 발명의 모듈은 최초로 최소한의 수의 프로브를 사용하여 최적의 데이터를 제공하는 단순하고, 통상적인 어레이의 설계를 허용하면서 노이즈에 대한 시그날 비를 최대화시킨다. 분석용 유전자의 총 수를 제거함에 의해, 예를 들면, 거대한 양의 관련없는 데이터를 제공하는 팬-유전자 칩의 제작 동안 수천개의 포토리소그래피용의 고가의 백금 차폐물을 제작할 필요성을 제거할 수 있다. 본 발명을 사용하여, 본 발명의 제한된 프로브 세트(들)이 예를 들면, 디지털 광학 화학 어레이, 볼 비드 어레이, 비드(예를 들면, 루미넥스), 멀티플렉스 PCR, 정량적 PCR, 런-온 검정, 노던 블롯 분석, 또는 심지어 단백질 분석, 예를 들면, 웨스턴 블롯 분석, 2-D 및 3-D 겔 단백질 발현, MALDI, MALDI-TOF, 형광성 활성화된 세포 분류(FACS)(세포 표면 또는 세포내), 효소 결합된 면역흡착 검정(ELISA), 화학발광성 연구, 효소 검정, 증식 연구, 또는 상업적으로 용이하게 입수가능한 유전자 발현의 측정 및/또는 분석을 위한 다른 임의의 방법, 장치 및 시스템과 함께 사용되는 경우 마이크로어레이에 대한 필요성을 완전히 피할 수 있다.
본 발명의 "분자 핑거프린팅 시스템"을 사용하여 상이한 세포 또는 조직, 동일한 세포 또는 조직의 상이한 소집단, 동일한 세포 또는 조직의 상이한 생리학적 상태, 동일한 세포 또는 조직의 상이한 발달 단계, 또는 다른 질환 및/또는 정상 세포 대조군에 대한 동일한 조직의 상이한 세포 집단에 있어서 발현의 비교 분석을 촉진하거나 수행할 수 있다. 일부 경우에, 정상 또는 야생형 발현 데이터는 동시에 또는 대략 동시에 분석된 시료로부터 기원할 수 있거나 이는 존재하는 유전자 어레이 발현 데이터베이스, 예를 들면, NCBI 유전자 발현 옴니버스 데이터베이스(NCBI Gene Expression Omnibus database)와 같은 공공 데이터베이스로부터 얻어지거나 도태된 발현 데이터일 수 있다.
본원에 사용된 것으로서, 용어 "차등적으로 발현된"은 2개 이상의 시료, 예를 들면, 질환 시료와 정상 시료 사이에서 변하는 세포 성분(예를 들면, 핵산, 단백질, 효소 활성 등)의 측정을 말한다. 세포 성분은 온(on) 또는 오프(off)(존재하거나 부재)할 수 있거나, 참조와 관련하여 상향조절되거나 참조와 관련하여 하향조절될 수 있다. 유전자-칩 또는 유전자-어레이를 사용하기 위해, 핵산, 예를 들면, mRNA 또는 다른 RNA(miRNA, siRNA, hnRNA, rRNA, tRNA 등)의 차등적 유전자 발현을 사용하여 세포 유형들 또는 핵산들을 구별할 수 있다. 가장 일반적으로, 세포의 전사 상태의 측정은 정량적인 역 트랜스크립타제(RT) 및/또는 정량적 역 트랜스크립타제-폴리머라제 연쇄 반응(RT-PCR), 게놈 발현 분석, 해독후 분석, 게놈 DNA에 대한 변형, 전좌, 동소(in situ) 하이브리드화 등에 의해 달성된다.
일부 질환 상태의 경우, 특히 질환 상태의 조기 수준에서 세포 또는 형태학적 차이를 확인하는 것이 가능하다. 본 발명은 세포 자체의 유전자 또는 보다 중요하게는 이들의 정규적인 생리학적 맥락내에서, 즉, 면역 활성화, 면역 내성 또는 심지어 면역 에너지 동안 작용하는 면역 효과기 세포로부터의 유전자의 세포 RNA 발현의 모듈을 관찰함으로써 특이적인 돌연변이 또는 하나 이상의 유전자를 확인할 필요성을 제거한다. 유전적 돌연변이는 유전자의 그룹의 발현 수준에 있어서 현저한 변화를 초래할 수 있지만, 생물학적 시스템은 종종 다른 유전자의 발현을 변경시킴으로써 변화에 대해 보상한다. 이러한 내부 보상 반응의 결과로서, 많은 작은변화는 시스템의 관측가능한 표현형에 있어 최소 효과를 가질 수 있지만 세포 성분의 조성에 엄청난 효과를 가질 수 있다. 마찬가지로, 유전자 전사체의 실제 카피는 증가하거나 감소할 수 있지만, 전사체의 수명 또는 반감기는 선두적으로 영향받아서 단백질 생산을 크게 증가시킬 수 있다. 본 발명은 하나의 실시형태에서 단일 메세지 및/또는 돌연변이보다는 효과기 세포(예를 들면, 백혈구, 림프구 및/또는 이의 소-집단)을 관찰함으로써 실제 메세지를 검출할 필요성을 제거한다.
당해 분야의 숙련가는, 시료가 예를 들면, 단일 세포, 세포의 집합물, 조직, 세포 배양물 등을 포함하는 각종 공급원으로부터 얻어질 수 있음을 용이하게 인식할 것이다. 특정 경우에, 이는 심지어 예를 들면, 뇨, 혈액, 타액, 조직 또는 생검 시료 등에서 발견된 세포로부터 충분한 RNA를 분리하는 것이 가능할 수 있다. 특정 환경에서, 충분한 세포 및/또는 RNA가 점액 분비, 대변, 눈물, 혈액 혈장, 복수액, 사이질 유액, 경막내 유액, 뇌척수액, 땀 또는 기타 체액으로부터 얻어질 수 있다. 예를 들면, 조직 또는 세포 공급원으로부터의 핵산 공급원은 조직 생검 시료, 하나 이상의 분류된 세포 집단, 세포 배양물, 세포 클론, 형질전환된 세포, 생검 또는 단일 세포를 포함할 수 있다. 조직 공급원은 예를 들면, 뇌, 간, 심장, 신장, 폐, 비장, 망막, 골, 신경, 림프절, 내분비선, 생식 기관, 혈액, 신경, 혈관 조직 및 후각 상피를 포함할 수 있다.
본 발명은 단독 또는 조합, 즉, 하나 이상의 데이터 마이닝 알고리즘; 하나 이상의 모듈-수준 분석 공정; 혈액 백혈구 전사 모듈의 확인; 사람 질환의 분자 진단/예측을 위한 다변량 분석에 있어서 응집된 모듈러 데이터의 사용; 및/또는 모듈-수준 데이터 및 결과의 가시화와 함께 사용될 수 있는 다음 기본 성분들을 포함한다. 본 발명을 사용하여 단일 다변량 점수로 추가로 합계낼 수 있는 복합체 전사 마커를 개발하고 분석하는 것이 가능하다.
데이터 획득 속도에 있어서 폭발적인 증가는 마이크로어레이 데이터 및 생물의학적 지식의 이용을 위한 마이닝 기구(mining tool) 및 알고리즘의 개발을 차단하여 왔다. 모듈러 구조화 및 전사 시스템의 기능을 알아내는 것을 목표로하는 시도는 질환의 강건한 분자 시그너쳐를 확인하기 위한 촉망되는 방법을 구성한다. 실제로, 이러한 분석은 개개 유전자 수준 또는 유전자의 목록의 수준 이전의 마이크로어레이 데이터의 개념화를 취함으로써 거대 규모 전사 연구의 개념을 전환시킬 수 있다.
본 발명자들은, 현재의 마이크로어레이-계 조사가 악명높은 "노이지(noisy)"인 데이터, 즉, 실험실 및 플랫폼에 걸쳐 잘 비교되지 않고 해석하기 어려운 데이터의 분석을 사용하는 유의적인 챌린지에 직면해 있음을 인식하고 있다. 마이크로어레이 데이터의 분석을 위한 광범위하게 허용된 시도는 연구 그룹들 사이에서 차등적으로 발현된 유전자의 소세트의 확인으로 시작한다. 다음에, 사용자는 패턴 발견 알고리즘 및 존재하는 과학적 지식을 사용하여 얻어지는 유전자 목록을 "의미가 통하도록(make sense)"하기 위해 후속적으로 노력한다.
플랫폼을 따라 큰 가변성을 다루기보다는, 본 발명자들은 분석의 조기 단계에서 생물학적으로 관련된 유전자의 선택을 강조하는 전략을 개발하여 왔다. 요약하면, 당해 방법은, 개선된 데이터 마이닝 알고리즘을 개발하여 데이터의 거대 수집으로부터 대등하게 발현된 유전자의 그룹, 또는 전사 모듈을 분석하고 추출하는 제공된 생물학적 시스템을 특징으로 하는 전사 성분의 확인을 포함한다.
폐결핵(PTB)은 마이코박테리움 투베르쿨로시스(엠. 투베르쿨로시스)에 의해 유발된 전세계적으로 이환률 및 사망률의 주된 증가하는 원인이다. 그러나, 엠. 투베르쿨로시스에 감염된 개인의 대부분은 무증상으로 남아서, 잠복성 형태로 감염을 유지하며 이러한 잠복성 상태는 활성 면역 반응에 의해 유지되는 것으로 고려된다. 혈액은 면역계의 파이프라인이며, 자체로 개인의 건강 및 면역 상태가 확립될 수 있는 이상적인 생물학적 물질이다. 본원에서, 혈액 세포내 전체 게놈의 활성을 평가하기 위한 마이크로어레이 기술을 사용하여, 본 발명자들은 활성 폐결핵 및 잠복성 결핵을 지닌 환자에서 명백한 상호 혈액 전사 바이오마커 시그너쳐를 확인하였다. 이러한 시그너쳐는 또한 대조군 개인에서의 것들과 구별되어 있다. 전혈 중에서 면역 세포독성 유전자 발현의 과-표시를 나타내는 잠복성 결핵의 시그너쳐는 엠. 투베르쿨로시스 감염에 대한 보호성 면역 인자를 측정하는데 도움이 될 수 있는데, 이는, 이들 환자들이 감염되지만 대부분 과잉 질환으로 진전되지 않기 때문이다. 활성 및 잠복성 TB 환자로부터의 명백한 전사 바이오마커 시그너쳐를 또한 사용하여 감염을 진단하고 항-마이코박테리아 약물을 사용한 치료에 대한 반응을 모니터링할 수 있다. 또한, 활성 결핵 환자에서의 시그너쳐는 면역병인론에 관여된 인자들을 측정하고 가능하게는 면역 치료학적 개입을 위한 전략을 이끄는데 도움이 될 것이다. 본 발명은 감염의 진단을 위한 혈액 전사 바이오마커의 사용을 청구하는 선출원에 관한 것이다. 그러나, 당해 선출원은 활성 및 잠복성 결핵에 대한 바이오마커의 존재를 기재하지 않았으며 오히려 다른 급성 감염을 갖는 어린이에 집중되었다(참조: Ramillo, Blood, 2007).
잠복성 대 활성 TB 환자로부터의 혈액에서 전사 시그너쳐의 본 확인을 사용하여 마이코박테리움 투베르쿨로시스 감염으로 추측되는 환자 및 건강 스크리닝/질환의 조기 검출에 대해 시험할 수 있다. 본 발명은 또한 항-마이코박테리움 약물을 사용한 치료에 대한 반응의 평가를 허용한다. 이와 관련하여, 당해 시험은 또한 약물 시도와 관련하여, 및 특히 다중-약물 내성 환자에서 약물 치료를 평가하는데 특히 가치가 있을 수 있다. 또한, 본 발명을 사용하여 잠복성 결핵의 면역 시그너쳐로부터 즉시, 중간 및 장기간 데이터를 얻음으로써 예방접종 시도 동안 보호성 면역 반응을 보다 잘 정의할 수 있다. 또한, 활성 결핵 환자에서 시그너쳐는 면역병인에 관여한 인자들을 측정하고 가능하게는 면역 치료학적 개입을 위한 전략을 이끄는데 도움이 될 것이다.
엠. 투베르쿨로시스에 대한 면역 반응은 복잡하며 다인성이다. 비록 T 세포 및 사이토킨, 예를 들면, TNF, IFN-γ 및 IL-12가 엠. 투베르쿨로시스의 면역 제어에 중요하다는 것이 알려져 있지만14 -17, 보호 또는 발병기전을 측정하는 숙주 인자를 완전히 이해하지 못하고 있다16. 혈액 전사 프로파일링은 염증성 질환에 성공적으로 적용되어 질환 발병기전의 진단 및 이해를 개선시켜 왔다18 ,19. 그러나, 생성된 데이터의 크기 및 복잡성은 해석하기 어렵고, 흔히 과학자들이 진단용의 특수 바이오마커로서 충분하지 않을 수 있으며 질환 발병기전과 관련하여 거의 정보를 제공하지 않는, 추가의 연구를 위한 몇 안되는 후보물 유전자에 집중하도록 한다20. 독립적이고 상호보완적인 생물정보학 기술을 사용하여, 본 발명자들은 활성 TB 환자에 대한 전사 시그너쳐를 정의하였으며, 이는 추가의 면역학적 분석을 구동시켜 왔다. 본 발명자들의 포괄적인 공평한 조사는 이러한 복잡한 질환의 면역병인으로의 중요한 통찰력, TB 제어에 있어 발전을 도울 개선된 이해를 제공한다.
활성 결핵의 명백한 전혈 전사 시그너쳐
엠. 투베르쿨로시스 감염에 대한 숙주 반응의 공평한 포괄적인 조사를 얻기 위하여, 활성 TB 환자, 잠복성 TB 환자 및 건강한 대조군의 혈액으로부터의 게놈-전체의 전사 프로파일을 일루미나(Illumina) HT12 비드어레이(beadarray)을 사용하여 생성시켰다. 모든 환자를 치료 전에 시료채취하였다. 활성 TB의 진단은 엠. 투베르쿨로시스에 대한 양성 배양물로 확인하였다. 잠복성 TB 환자는 활성 TB 환자의 무증상 가정 접촉자 또는 양성 투베르쿨린-피부 시험(TST)(런던) 및 양성 IGRA(런던 및 남아프리카)에 의해 정의된, 고유 국가로부터의 신규 자원자였다. 건강한 대조군은 런던에서 보충하였으며 상기 기준 모두에 대해 음성이었다. 3개의 집단을 독립적으로 보충하여 시료채취하였다: 트레이닝 세트(런던에서 보충, 2007년 1월에서 9월; 활성 폐 TB를 지닌 13명의 환자; 잠복성 TB를 지닌 17명의 환자; 및 12명의 건강 대조군); 시험 세트(런던에서 보충; 2007년 10월에서 2009년 2월; 21명의 활성 TB 환자; 21명의 잠복성 TB 환자; 12명의 건강한 대조군); 및 확인 세트(고 발생의, 고유의 지역에서 보충, 남아프리카(SA)의 케이프 타운 근처 카옐리트샤 타운쉽, 2008년 5월에서 2009년 2월까지; 20명의 활성 TB 환자; 31명의 잠복성 TB 환자)(도 16 및 17; 도 7). 유사하게, 3개의 집단으로부터의 시료의 모든 공정 및 분석은 독립적으로 수행하였다. 트레이닝 세트는 지식 발견 및 시료 크기 적절성의 평가에 사용하였다. RNA를 전혈 시료로부터 추출하고 방법에 기술된 바와 같이 프로세싱하였다. 얻어지는 데이터를 필터링하여 검출되지 않고(α=0.01) 데이터세트를 구성하는 시료의 10% 이상에서 모든 시료의 중간으로부터의 표준화된 발현에서 2배 미만의 편차를 갖는 전사체를 제거하였다. 이러한 자율적인 필터링은 1836개 전사체의 목록을 생성하였으며, 이는 활성 TB 그룹내 명백한 시그너쳐를 나타내었다(도 8a). 당해 1836개 전사체 목록을 이후에 사용하여 그룹들 중에서 유의적으로 차등 발현된 시그너쳐 유전자를 확인하였다[크루스칼-왈리스(Kruskal-Wallis) ANOVA, 벤자미니-호크베르그(Benjamini-Hochberg) 다중 시험 교정을 사용하여 0.01과 동일한 거짓 발견율 사용]. 이는 393개 전사체의 목록을 생성하였으며, 당해 목록은 2개의 무리 사이에 거리의 척도로서 평균 연결과의 피어슨 상관계수에 의한 계층 무리화에 적용시켜 유사한 상대적 풍부성을 갖는 전사체의 유전자 트리를 생성시켰다. 이는 열지도의 좌측에 계통수로 나타내며, 각각의 개인으로부터의 데이터를 유일한 전사 프로파일내로 구조화하여, 임상 진단을 기초로 그룹화하여 나타낸다(도 1a). 이는 잠복성 TB 환자 또는 건강한 대조군으로부터의 시료 대부분에서 부재하는, 활성 TB에 대한 명백한 시그너쳐를 나타내었다.
활성 TB에 대한 추정의 전사 시그너쳐를 확인하고, 독립적인 환자 집단에서 이러한 발견을 확인하는 것이 중요하였다. 마이크로어레이 분석은 방법론적, 기술적 및 통계적 가변성에 취약하다21-23. 또한, TB는 대부분 민족성, 지리학적 지역, 동시감염, 연령 및 사회경제적 상태에 의해 가장 크게 영향받는, 엠. 투베르쿨로시스 감염에 대한 다양한 범위의 면역 반응을 나타낸다11,13. 따라서, 본 발명자들의 발견이 광범위하게 적용될 수 있는지를 보증하기 위하여, 본 발명자들은 나중에 보충된 2개의 추가의 독립적인 집단에서 이들을 확인하였다. 이들 2개의 독립적인 집단으로부터의 시료, 시험 세트(런던) 및 확인 세트(남아프리카)를 가공하고 데이터를 트레이닝 세트에 대해서와 같이 표준화하였다. 이들 추가의 확인의 목표는 트레이닝 세트에서 정의된 시그너쳐를 별도로 확인하기 위한 것이므로, 전사체의 필터링 또는 선택은 수행하지 않았다. 오히려, 트레이닝 세트 데이터의 분석으로 정의된 예비-선택된 393개 전사체 목록 및 유전자 트리를 독립적인 시험 세트 및 확인 세트(SA)로부터 얻은 데이터에 적용시켰다. 계층적 무리화 알고리즘을 시험 세트 및 확인 세트(SA) 393-전사체 프로파일에, "조건 트리(condition tree)"를 생성하는, 이들의 유사성에 따른 개개의 유전자 발현 프로파일과 함께 그룹화하기 위한, 무리들 사이의 거리의 척도로서 스피어만 교정 및 평균 연결을 사용하여 적용시켜, 열지도의 상부 모서리를 따라 나타내었다(도 1b 및 1c). 시험 세트 및 확인 세트(SA) 환자 전사 프로파일 둘다의 이러한 자율적인 계층적 무리화는, 활성 TB 환자가 잠복성 TB 및 건강한 대조군(도 1b, 런던)과는 독립적으로 또는 잠복성 TB(도 1c; 남아프리카)와 독립적으로 무리화되며, 무리와 연구 그룹 사이에 유의적인 관련성이 있지만[피어슨 키-스퀘어드 시험(Pearson Chi-Squared Test) p<0.0005](도 1b 및 1c), 민족성, 연령 및 성별과는 관련이 없음(도 8b, 8c 및 8d)을 나타낸다. 그러나, 소수의 잠복성 TB 환자[대략 10% - 21개의 시험 세트 중 2개, 런던; 31개의 확인 세트(SA) 중 3개]의 전사 프로파일은 활성 TB 환자의 것과 함께 무리화되었다(시험 세트에서 ♣ 및 ▲로 표시, 도 1b; 및 남아프리카 확인 세트에서 ∑, Ω, ∂로 표시, 도 1c). 이후에, 본 발명자들은 시험 세트 및 확인 세트 시료를 활성 TB인지 또는 아닌지(건강한 또는 잠복성)로 정확하게 분류하기 위해 임상 진단의 지식없이, K-최근점 이웃 부류 예측 방법(K-nearest neighbours class prediction method)을 기초로 부류 예측 도구를 사용하여 393개 전사체 목록의 능력을 시험하였다. 예측 모델은 44개의 정확한 예측, 9개의 부정확한 예측을 이루어내었으며 시험 세트에서 1개 시료에 대해서는 예측하지 않았다. 이는 61.67%의 민감성, 93.75%의 특이성, 및 1.9%의 부정확률과 같다. 시험 세트에서 부정확한 예측은 상기 무리화 분석에서 나타낸 활성 TB로 분류된 5명의 잠복성 TB 환자; 및 활성 TB가 아닌 것으로 예측된 4명의 활성 TB 환자를 포함하였다. 남아프리카 확인 세트에서는, 45개가 정확히 예측되고, 2개가 부정확하게 예측되며(1개 활성, 1개 잠복성) 및 4개 시료가 예측되지 않았다. 이는 94.12%의 민감성 및 96.67%의 특이성을 제공하지만, 7.8%의 부정확률을 제공하였다(도 19).
Figure pct00004
Figure pct00005
Figure pct00006
Figure pct00007
Figure pct00008
Figure pct00009
Figure pct00010
Figure pct00011
Figure pct00012
Figure pct00013
Figure pct00014
Figure pct00015
Figure pct00016
Figure pct00017
Figure pct00018
Figure pct00019
Figure pct00020
Figure pct00021
Figure pct00022
Figure pct00023
Figure pct00024

중간 발생(런던) 지역 및 고 발생(남아프리카) 지역 둘다로부터의 활성 TB 환자의 혈액에서 전사 시그너쳐를 확인하였으며, 이는 계층적 무리화 및 차단된 부류 예측에 의해 나타낸 바와 같이 잠복성 TB 환자 및 건강한 대조군의 시그너쳐로부터 명백하다. 잠복성 TB의 시그너쳐는 분자 이질성을 나타내었다. 2개의 독립적인 환자 집단에서 활성 TB의 전사 시그너쳐와 유사한 전사 시그너쳐를 나타내는 잠복성 환자의 수는 활성 질환으로 진행될 수 있는 그룹에서 환자의 예측된 빈도와 일치한다10. 다음에, 잠복성 TB의 이러한 프로파일은 소-임상 활성 질환을 가지거나 고 부담의 잠복성 감염이 측정된 환자를 나타내므로, 활성 질환으로의 진행의 고 위험군이다11,24.
활성 TB의 전사 시그너쳐는 질환의 방사선사진 정도와 상호관련된다.
본 발명자들의 연구 결과(도 1a 내지 1c)로부터, 활성 TB 환자의 전사 시그너쳐와 관련하여 분자 이질성이 존재함이 명백하였다. 비록 환자의 대부분이 동일한 393개 유전자 발현 프로파일을 입증하였다고 해도, 소수의 예외자가 존재하였으며, 이들은 명백하거나 더 약한 전사 프로파일을 나타내었다. 예를 들면, 활성 TB 그룹의 시험 세트에서 21명의 환자 중 4명은 다른 활성 TB 환자와 무리짓지 않았고 건강한 대조군 또는 잠복성 TB 환자의 프로파일로 더 유지되는 프로파일을 가졌다(도 1b에서 ●, #, ■, ◆로 표지됨). 이들은 위에서 논의된 바와 같이 K-최근점 이웃 알고리즘에 의해 잘못분류된 4명의 활성 환자들이었다.
활성 TB 그룹에서 분자 예외자는 다수의 이유로 발생할 수 있었다. 첫째로, 앞서 보고된 바와 같이 실험실 교차-오염으로부터 유발된 거짓 양성 무리를 갖는 오진 가능성이 있다25. 또한, 분자/전사 이질성은 질환의 정도에 있어 이질성을 반영할 수 있었다. 이러한 논쟁에 촛점을 맞추기 위해, 트레이닝 및 시험 세트에서 환자들 각각에 대한 진단 시기에 취한 심장 방사선사진을 얻었고, 2명의 심장 전문의 및 방사선전문의가 등급을 매겨 질환의 방사선사진 정도를 평가하였다. 당해 평가는 방사선사진 질환은 질환 없음, 최소, 중간으로 진전, 및 고도 진전된 질환으로 분류하는 미국 결핵 및 호흡기 질환 협회 제도(U.S. National Tuberculosis and Respiratory Disease Association Scheme)의 변형된 버젼을 사용하여 임상 진단 또는 전사 프로파일의 지식이 없이 수행하였다(참조: Falk A, 1969; 및 도 9a). 트레이닝 세트에서 모든 13명의 활성 TB 환자(도 9b) 및 시험 세트에서 모든 21명의 활성 TB 환자(도 9c)에 대한 393개 전사체 프로파일을 질환의 방사선사진 정도의 이들의 등급(트레이닝 세트, 도 9b; 시험 세트, 도 9c)에 따라 열지도에서 순서를 정하였다. 이의 예를 도 2a에 나타낸, 전사 프로파일 및 방사선사진 등급의 당해 비교는, 전사 프로파일이 질환의 정도와 상호 관련될 수 있음을 제안하였다. 공식적으로 이에 촛점을 맞추기 위하여, 본 발명자들은 각각의 TB 환자에 대한 전사 시그너쳐, "건강에 대한 분자 거리(Molecular Distance to Health)"에 의해 반영된 분자 변화의 정량적 점수를 계산하였다. 이는 건강한 대조군 기본선과는 유의적으로 상이한 프로파일에 있어서의 전사체의 수 및 이러한 차이의 정도 둘다의 합성이다26. 당해 점수는 각각의 TB 환자의 393개-전사 프로파일에 대하여 계산한 후 트레이닝 및 시험 세트에서 각각의 잠복성((n=38) 및 활성(n=30) TB 환자에 대한 방사선사진 등급과 비교하였다. 당해 경우에서 질환의 방사선사진 정도를 평가하기 위한 개략도를 변형시킴으로써 질환 등급의 방사선사진 정도가 방사선사진 수치 점수로 전환되도록 한다. 질환의 방사선사진 정도에 따라 그룹화된 프로파일은, 평균 "건강에 대한 분자 거리"가 질환의 정도의 방사선사진 정도가 증가하면서 증가하였음을 입증하였다(그룹들을 비교하기 위한 둔스 다중 비교 포스트 혹 시험과 함께, 쿠르스칼-왈리스 ANOVA를 사용하여 p<0.001)(도 2b). 이들 결과는, 혈액내 분자 시그너쳐가 활성 TB 환자에서 질환의 정도의 정량적 척도를 제공할 수 있음을 최로로 나타내며 혈액 전사 프로파일이 질환의 부위에서 변화를 반영할 수 있음을 입증한다. 따라서, 시스템 생물학 시도를 사용하여, 본 발명자들은 질환의 방사선 정도와 관련된 중간 및 고 부담 셋팅 둘다에서 활성 폐 TB에 대한 강건한 혈액 전사 시그너쳐를 확인한다. 당해 방법을 사용하여 질환의 정도를 모니터링하고 치료 요법을 안내하는데 가능한 도움을 줄 수 있다.
성공적인 치료는 활성 TB의 전사 시그너쳐를 약화시킨다.
이들 발견은, 활성 TB의 전사 시그너쳐가 질환의 방사선사진 정도와 관련되며 전사 시그너쳐가 TB 치료동안 약화될 수 있고 치료 효능을 반영하는지를 측정하는 것은 관심사였다. 이는 또한, 당해 시그너쳐가 TB 질환을 실제로 반영하는지를 확인할 수 있었다. 이를 시험하기 위해, 활성 TB 환자 7명을 항-마이코박테리움 치료의 개시 후 2 및 12개월째에 재-시료채취하고, 이들의 혈액을 다시 앞서 기술된 바와 같은 마이크로어레이 분석에 이들의 기본선 예비치료 시료 및 독립적인 시험 세트(n=12)로부터의 건강한 대조군 시료와 함께 재-시료채취하였다. 활성 TB 환자에서 393개-전사체 시그너쳐를 건강한 대조군의 것으로부터 구별되는지 관찰하였다(도 3a). 당해 전사 시그너쳐는 치료 2개월 후 가장 활성인 TB 환자에서 약화되었으며 치료 12개월 후 완전히 소멸되었으므로, 활성 TB 환자의 시그너쳐는 건강한 대조군의 것과 보다 더 밀접하게 닮기 시작했다. 치료 2개월 후 전사 프로파일에 있어서 이러한 변화는 전사체의 증가된 풍부성 측면에서 더 현저하였으며, 이는 TB 환자의 약 50%에서 약화되었다. 이는 치료 2개월 후에도 여전히 존재하는, 풍부성이 감소된 전사체와는 대조적이었으나, 치료 12개월 후 기본선 발현으로 되돌아왔다. 활성 TB 환자의 치료 동안 혈액 전사 시그너쳐의 소멸은 방사선사진 개선을 반영하는 것으로 여겨졌다(도 3b). 이후에, 본 발명자들은 치료 동안 각각의 시점 사이에 건강 점수에 대한 분자 거리에 있어서의 차이를 분석하였다. 치료후 12개월 째에 활성 TB 환자의 "건강에 대한 분자 거리" 점수는 기본선 예비치료에서보다 유의적으로 더 낮다[p<0.001, 프리드만 반복 측정 시험(Friedman Repeated Measures Test)](도 3c 및 d). 이들 데이터는, 활성 TB 환자의 혈액에서 전사 시그너쳐를 사용하여 치료 효능을 모니터링할 수 있음을 제안한다. 또한, 이는, 393개-전사체 시그너쳐가 엠. 투베르쿨로시스 감염에 대한 숙주 반응을 실제로 반영한다는 증거를 제공한다. 따라서, 활성 TB의 전사 시그너쳐는 성공적인 치료 동안 약화됨으로써 새로운 치료제에 대한 임상 시험을 포함하는 항-마이코박테리아 치료요법에 대한 반응을 정량적으로 모니터링하는 방법을 제공한다.
남아프리카 및 런던에서 TB 환자는 동일한 모듈러 시그너쳐를 나타낸다.
전사 시그너쳐의 분석을 신속히 처리하고 집중하며 활성 TB 질환 동안 숙주 반응을 특성화하기 위해, 본 발명자들은 모듈러 데이터 마이닝 전략을 사용하였다18. 당해 전략은, 유전자의 무리가 상이한 염증병 및 감염성 질환의 범위내에서 대등하게 발현된다는 관찰에 기초한다. 이러한 유전자의 별개의 무리는 구체적인 모듈로 정의될 수 있으며, 이는 공평한 문헌 자료수집이 흔히 일관된 기능성 관계를 가진 것으로 밝혀질 수 있다18. 모듈러 분석은 건강한 대조군과 비교한 것으로서 활성 TB 환자의 혈액에서 기능적 관련성의 전사체 풍부성에 있어서의 변화의 평가 및 확인을 촉진하였다[전체 마이크로어레이 데이터세트에서 수행하고 적어도 2명의 개인에서 검출되지 않는 전사체만을 필터링 제거함(α=0.01)](도 4a). 활성 TB 환자의 혈액에서 관찰된 모듈러 시그너쳐(모듈)은 런던 트레이닝 세트 및 시험 세트의 경우 및 독립적인 남아프리카 확인 세트의 경우 건강한 대조군과 비교하여 가시적으로 매우 유사하였으며(도 4a), 독립되고 균등한 분석을 통해, 전사체 시그너쳐의 재생산성이 전통적인 무리화 분석을 사용하여 관측됨을 입증한다(도 1). 활성 TB 환자의 모듈러 시그너쳐는 B 세포 관련된 전사체(모듈, M1.3) 및 T 세포 관련된 전사체(모듈, M2.8)의 감소된 풍부성, 및 골수종 관련된 전사체(모듈, M1.5 및 모듈, M2.6)의 증가된 풍부성을 나타내었으며, 보다 적은 정도로 호중구 관련 전사체(모듈, M2.2)의 풍부성을 증가시켰음을 나타내었다. 대조군과 비교한 것으로서 활성 TB 환자의 혈액에서 전사체 변화의 최대 비율은 인터페론 유도성(IFN) 모듈(모듈 3.1; 전사체의 75 내지 82%)내의 것들이었다(도 4a; 및 도 10a 내지 10c).
혈액은 이질성 조직이므로, 본 발명자들이 활성 TB 환자에서 정의한 전사 시그너쳐는 별개의 세포 집단에서 이주, 세포자멸사 또는 세포 증식, 또는 유전자 발현에 있어서의 변화를 통한 세포 조성물에 있어서의 변화를 나타낼 수 있었다. 활성 TB 환자의 혈액에서 총 백혈구 세포/백혈구 수는 건강한 대조군의 것과 유의적으로 상이하지 않았다(스튜던츠 t-시험 p=0.085). B 및 T 세포 전사체에 있어서 명백한 감소가 혈액내 세포수에 있어서의 변화, 및/또는 별개의 세포내 유전자 발현에 있어서의 변화에 의해 초래되는지에 집중하기 위해, 시험 세트 활성 TB 환자 및 건강한 대조군으로부터의 전혈을 다중-매개변수 유동 세포분석기로 분석하였다(도 4b, 도 11a 및 도 11b). CD4+ T 세포의 퍼센트 및 수와 CD8+ T 세포 및 B 세포의 퍼센트 둘다는 건강한 대조군과 비교하여 활성 TB 환자의 혈액에서 유의적으로 감소하였다(도 4b). CD4+ T 세포의 수에 있어서의 감소는 중심 기억 세포의 수에 있어서 유의적인 감소에 크게 기여할 수 있었으며 효과기 기억 및 나이브 CD4+ T 세포에서 더 작지만 유의적이지 않은 효과를 가졌다(도 11b). 그러나, CD8+ T 세포 수에 있어서의 감소는 나이브 T 세포 구획에서 주로 관찰되었다. T 세포 관련된 유전자의 감소된 전사적 풍부성이 이들 유전자의 감소된 발현보다는 세포 수에 있어서의 감소로부터 초래되었음을 확인하기 위하여, 본 발명자들은 전혈과 비교하여, 정제된 CD4+ 및 CD8+ T 세포에 있어서 대표적인 T 세포 관련된 유전자의 수에 대해 유전자 발현 프로파일을 평가하였다(도 11c). 이들 T 세포 전사체는 건강한 대조군과 비교하여 활성 TB 환자의 전혈에서 거의 풍부하지 않은 것으로 밝혀졌다(도 11c(i)). 그러나, 건강한 대조군으로부터의 것들과 비교한 것으로서 활성 TB 환자의 혈액으로부터 정제된 CD4+ 및 CD8+ T 세포에 있어서 이들 T 세포-특이적인 유전자의 발현에 있어 차이는 없었다(도 11c (ii)). 이와 함께, 이들 데이터는, 활성 TB 환자의 혈액에서 T 세포 유전자의 보다 낮은 전사 풍부성이 세포 수의 감소로부터 유일하게 생성됨을 제안한다. 본 발명자들의 발견에 따라, 다수의 연구들은, 비록 CD8+ T 세포 및 B 세포에 있어서의 효과가 더 가변적이었다고 해도, 활성 TB 환자의 혈액에서 CD4+ T 세포의 퍼센트 및/또는 수에 있어서 감소를 보고하였다27,28. 그러나, 본 발명자들의 연구에서 TB 환자와 대조군 사이의 이러한 차이점의 정도는, 당해 현상이 유일하게 엠. 투베르쿨로시스 항원-특이적인 T 세포의 이주를 초과하여 연장되며, 전체 순환하는 T 세포 집단의 실제 비율에 영향을 미침을 제안한다.
모듈러 수준에서 골수종 세포-관련 전사체에 있어서의 실질적인 증가는 활성 (모듈 M1.5 및 M2.6)에 대한 TB 환자 대 건강한 대조군에서 관찰되었다. 이것이 세포수에 있어서의 변화 및/또는 유전자 발현에 있어서의 변화로부터 생성되었는지에 집중하기 위해, 전혈을 우선 골수종 유형 세포에서의 변화에 대해 유동 세포분석기로 분석하였다(도 12a). 건강한 대조군과 비교하여 시험 세트 활성 TB 환자의 혈액에서 단핵구(CD14+, CD16-) 또는 호중구(CD16+, CD14-) 퍼센트 또는 세포수에서 변화는 없었다(도 4c). 흥미롭게도, 염증성 단핵구(CD14+, CD16+)의 퍼센트 및 세포수에 있어서 작지만 유의적인 증가가 건강한 대조군과 비교하여 활성 TB 환자의 혈액에서 관찰되었다. 대표적인 골수종 세포 관련 전사체는 건강한 대조군에 대해 활성 TB 환자의 혈액에서 과도하게 풍부함이 입증되었다(도 12b(i)). 이러한 증가는, 비록 이들 골수종-관련 전사체의 증가된 발현이, 이들의 증가된 발현이 소 단핵구 집단, 예를 들면, CD14+, CD16+ 염증성 소세트로 제한된 경우 희석될 수 있다고 해도, 정제된 단핵구(CD14+)에서 훨씬 적게 나타났다(도 12b(ii)). 염증성 단핵구는 염증성 및 감염성 질환에서 증가되는 것으로 이미 제안되어 왔다29. 따라서, 골수종 모듈에서 변화는 유전자 발현에 있어서의 변화에 의해 어느 정도 설명될 수 있지만, 활성 TB 환자 대 대조군의 혈액에서 염증성 단핵구의 수에 있어서의 변화로부터 생성될 수 있다.
호중구에서 인터페론-유도성 유전자 발현은 TB 시그너쳐에서 우세하다.
모듈러 분석에 의해 나타난 활성 TB 환자에서 IFN-유도성 유전자의 과-표시를 확인하기 위하여(도 4a), 393개의 전사체 시그너쳐를 구성하는 전사체를 독창성 경로 분석 소프트웨어를 사용하여 분석하였다. IFN 시그날링은 문헌으로부터 생성된 다른 치유된 생물학적 경로와 비교한 것으로서 벤자미니-호크베르그 다중 시험 교정(p<0.0000001)을 사용한 피셔 정확도 시험을 사용하여 393개 전사체에서 가장 유의적인 과-표시된 기능성 경로로서 확인하였다(도 13). 흥미롭게도, IFN-γ 및 제I형 IFN α/β 수용체 시그날링 둘다의 하부 유전자는 활성 TB 환자의 혈액에서 유의적으로 과-표시되었다(도 4d에서 적색으로 표시됨). 비록 IFN-α2a 또는 IFN-γ 단백질이 활성 TB 환자의 혈청에서 검출가능하지 았았다고 해도(도 13b 및 13c), IFN-유도성 케모킨 CXCL10(IP10)의 상승된 수준이 활성 TB 환자 대 대조군의 혈액에서 검출되었다(도 4e).
비록 IFN-γ가 마이코박테리아를 포함하는 세포내 병원체에 대한 면역 반응동안에 보호성인 것으로 밝혀졌다고 해도14 -16,30, 제I형 IFN의 역할은 명확하지 않다. 제I형 IFNR(IFN-αβR)을 통한 시그날링은 바이러스 감염에 대한 방어에 중요하지만31, IFN-αβ는 세포내 세균 감염 동안 유해한 것으로 밝혀져 왔다32 -34. 그러나, TB 감염에 있어서 IFN-αβ의 역할은 명확하지 않으며; 많은 논문들은, 비록 다른 것들이 그렇지 않다고 해도38 ,39; 유해한 역할을 제안하고 있다35 -37. C형 간염 감염 및 엠. 투베르쿨로시스 감염에 대한 IFN-γ 치료 사이에 관련성을 제안하는 몇개의 경우의 보고가 존재한다40,41.
본 발명자들은 다른 세균 및 염증성 질환을 가진 환자와 비교하여, 유의성 분석5 2을 통한 TB 특이적인 86개-유전자 전혈 시그너쳐를 확인하였다. 이후에, 이러한 86개-유전자 시그너쳐를 분류 예측(k-최근점 이웃)에 의한 7개의 독립적인 데이터 세트로부터의 이들 자체의 대조군에 대해 표준화된 환자에 대해 시험하였다(도 4f). TB 트레이닝 및 확인 세트에서 민감성은 각각 92% 및 90%이었으며, 이는 83%의 불량한 특이성을 갖는 다른 질환으로부터 활성 TB를 구별한다. 393개-유전자 시그너쳐를 사용함으로써 당해 86개-유전자 시그너쳐를 치료에 대한 반응시 약화되었으며(도 4g) 환자로부터의 동일한 시료에서 동일한 이질성을 반영하였다.
활성 TB 동안 전사 숙주 반응의 기능성 성분을 확인하기 위해, 본 발명자들은 상이한 질환에서 대등하게 발현되고 특수 모듈로 정의된 유전자의 세트를 사용하여 모듈러 데이터-마이닝 전략을 사용하였으며, 종종 공평한 문헌 자료 수집을 통한 일관된 기능적 관계를 입증한다18. 건강한 대조군과 비교한 활성 TB를 지닌 환자의 혈액 모듈러 시그너쳐(검출되지 않은 전사체만을 필터링 제거함, α=0.01, 적어도 2명의 개인에서)은 모든 3개의 TB 데이터 세트에서 유사하였으며(도 4h), 이는 전사 시그너쳐의 재생능을 입증한다.
모듈러 TB 시그너쳐는 B-세포(모듈, M1.3) 및 T-세포(M2.8) 전사체의 감소된 풍부성 및 골수종-관련 전사체의 증가된 풍부성(M1.5 및 M2.6)을 나타내었다. TB에 있어서 제공된 모듈에서 변하는 전사체의 최대 비는 IFN-유도성 모듈내에 있었다((M3.1; 75-82%의 IFN-모듈 전사체)(도 4h). 질환 발병기전과 연결된, 제I형 IFN-유도성 시그너쳐가 SLE를 가진 환자로부터의 말초 혈액 단핵 세포에서 입증되었으므로5 3 ,54, 본 발명자들은 다른 질환을 가진 환자로부터 전혈 모듈러 시그너쳐를 비교하였다. SLE를 가진 환자는 IFN-유도성 모듈(M3.1(도 4h))의 과-표시를 입증하였으나 TB에서 부재한 혈청-세포-관련 모듈을 나타내었다(M1.1(도 4h)). 그룹 A 스트렙토코쿠스 또는 스타필로코쿠스 감염 또는 스틸 병 환자로부터의 혈액 모듈러 시그너쳐는 IFN-유도성 모듈(M3.1)에서 최소 변화 내지 변화가 없었지만 호중구-관련 모듈(M2.2)의 과-표시를 나타내었으며, TB로부터 이들 질환을 구별하였다(도 4h). 따라서, IFN-유도성 시그너쳐는 모든 염증 반응에 대해 일반적이지 않으나, 일부 질환동안 우선적으로 유도되며, 잠재적으로 보호 또는 발병기전을 반영한다. 비록 SLE 및 TB가 일반적인 염증 성분, 예를 들면, IFN-유도성 반응을 공유한다고 해도, 전사 교란(transcriptional perturbation)(도 4h) 및 이들의 진폭의 전체 양식은 하나의 질환을 다른 것으로부터 구별한다.
활성 TB 환자의 혈액에서 IFN-유도성 유전자의 높은 전사 풍부성이 특수 세포 유형에 기여하였는지를 측정하기 위하여, 본 발명자들은 전혈과 비교하여, 정제된 호중구, 단핵구 및 CD4+ 및 CD8+ T 세포에서 IFN-γ 및 제I형 IFN α/β 수용체 시그날링 경로 둘다에 대한 유전자의 발현을 평가하였다(도 5). IFN-유도성 전사체의 대표적인 세트는 건강한 대조군과 비교하여 활성 TB 환자의 전혈에서 보다 풍부한 것으로 밝혀졌다(도 5a). 놀랍게도, IFN-유도성 전사체는 호중구에서 실질적으로 과-발현되며 건강한 대조군으로부터의 동일한 세포와 비교하여 활성 TB 환자의 혈액으로부터 정제된 단핵구에 보다 적은 정도로 발현됨이 밝혀졌다(도 5b). 대조적으로, 활성 TB 환자의 혈액으로부터 정제된 CD4+ 및 CD8+ T 세포는 건강한 대조군 개인으로부터 정제된 것들과 비교하여 이들 IFN-유도성 유전자의 발현에 있어서 차이가 없었다(도 5b).
호중구는 TB 환자에서 신속하게 복제하는 엠. 투베르쿨로시스로 감염된 우세한 세포 유형인 것으로 입증된 전문적인 식세포이다42. 내성 마우스와 비교한 것으로서 유전적으로 민감한 마우스에서 호중구의 우세성 및 반응은, TB 염증에서 호중구가 숙주의 보호보다는 발병기전에 기여한다는 이론을 이끈다43. 본 발명자들의 연구는 TB의 발병기전에서 호중구에 대한 역할을 지지한다. 이는 IFN-γ 및 제I형 IFN 둘다에 의한 이들의 과-활성화로부터 생성될 수 있으며, 이는 본 발명자가 본 발명에 의해 호중구에서 주로 발현된, 활성 TB 환자의 혈액에서 우세한 전사 시그너쳐임을 입증한다(도 5).
PDL-1은 활성 TB를 가진 환자에서 호중구에 의해 과-발현된다.
IFN-유도성 전사체와 무리화된 활성 TB 환자의 혈액내 풍부성이 증가된 하나의 유전자는 다양한 세포에서 발현된 면역조절성 리간드인(도 6), 프로그램된 사멸 리간드(Programmed Death Ligand) 1(PDL-1, 또한 CD274 및 B7-H1으로 나타냄)였다. PDL-1은 만성 바이러스 감염에서 프로그램된 사멸-1 수용체(PD-1)에 대한 결합을 통해 T 세포 증식 및 효과기 기능을 억제하는 것으로 보고되었다44,45. PDL-1을 과발현할 수 있는 세포가 무엇인지를 측정하기 위해, 활성 TB 환자 및 건강한 대조군으로부터의 전혈 집단을 유동 세포분석기로 분석하였으며, PDL-1은 확인(SA) 세트에서 대조군/잠복성과 비교하여 활성 TB를 지닌 환자의 전체 백혈구에서 상향조절됨이 밝혀졌다(도 6a 및 도 14). 증가된 PDL-1 발현은 단핵구에서 보다 적은 정도에 비해 호중구에서 가장 분명하였고 활성 TB 환자로부터의 림프구에서는 분명하지 않았다(도 6b 및 도 14). 유동 세포분석기에 의한 이러한 발견을 유지하는데 있어서, 활성 TB 환자로부터의 정제된 호중구는 건강한 대조군으로부터의 호중구에서보다 더 높은 수준의 PDL-1 전사체를 발현하였다. 대조적으로, PDL-1은 7명의 활성 TB 환자중 2명으로부터의 단핵구에서만 발현되었으며, T 세포에서 검출가능한 발현은 없었다(도 6c). 비록 환자의 대부분에서 치료 후 2개월째까지 여전히 존재하였지만, 활성 TB 환자의 혈액에서 PDL-1 전사체의 증가된 풍부성은 성공적인 치료요법 후에 사라졌다(도 6d).
이러한 발견은, 활성 TB 환자의 혈액내 PDL-1의 존재가 만성 바이러스 감염에서의 보고와 일치하여, 대조군 질환에 대한 발병기전 및 실패와 관련될 수 있음을 입증한다44,45. 또한, PD-1 발현은 초음파처리된 H37Rv 엠. 투베르쿨로시스로 자극시킨, TB 환자로부터의 사람 T 세포에서 증가되는 것으로 밝혀졌으며, PDL-1/PD-1에 대한 차단 항체는 항원-특이적인 IFN-γ 및 세포독성 CD8+ T 반응을 향상시킬 수 있었다46. 본 발명자들의 발견과 관련하여, 단핵구 및 CCR5+ T 세포에서 HIV 유도된 PDL-1 발현은 IFN-α에 의존적이나 IFN-γ에는 의존적이지 않음이 밝혀졌다47. 따라서, 본 발명자들이 본 발명에서 입증한 바와 같이, 호중구에서 제I형 인터페론에 대한 반응시 PDL-1의 증가된 발현은, 인터페론의 과-발현이 숙주 반응에 유해할 수 있는 하나의 방법일 수 있었다. PDL-1/PD-1 시그날링의 차단이 향상된 보호성 반응을 이끌 수 있는지의 여부는 감염/예방접종의 유형 및 단계에 의존할 수 있으며48 ,49, 특수 세포 및 부위에 대한 차단을 표적화하여 향상된 보호를 달성하는 한편 면역병리학을 피함을 필요로 할 수 있다44. 따라서, 세균 감염 동안 면역 반응에서 PDL-1의 효과는 처음의 사고보다 더 복잡할 수 있으며, 이는, PDL-1이 활성 TB 환자의 혈액내 호중구에서 고도로 발현되나 T 세포 또는 단핵구에서 그렇지 않다는 본 발명자들의 발견에 의해 뒷받침된다.
TB에 있어서 숙주 반응의 개선된 이해는 개선된 진단, 예방접종 및 치료요법에 필수적이다(참조: Young et al., 2008, JCI). 이러한 복합병으로의 통찰력은, 임상적으로 정의된 잠복성 TB가 소임상 질환에 대한 생 마이코박테리움의 제거로부터 수행되는 스펙트럼을 실제로 나타낸다는 사실을 포함하는, 다수의 이유로 인해 악화된다(참조: Young et al., 2009, Trends Micro). 본 출원에서, 본 발명자들은 잠복성 TB 환자 및 건강한 대조군의 대부분에서 부재한 런던 및 남아프리카로부터의 환자의 혈액에서 활성 TB의 393개-유전자 전사 시그너쳐(도 1, 14 및 15)를 정의하여 왔다. 또한, 당해 시도, 및 필요한 수의 TB 환자 및 건강한 대조군의 유의성을 달성하기 위한 분석을 사용하여, 본 발명자들은 질환의 이질성을 입증할 수 있다. 예를 들면, 활성 TB의 시그너쳐는 또한 잠복성 TB 환자의 10%의 혈액에서 또한 관찰되었으며 가능하게는 미래에 활성 질환으로 진전될 수 있는 개인들을 나타낸다. 이는 TB의 이질성을 입증하는 최초의 분자적 증거이며, 당해 분자적 시도가, 항-마이코박테리움 화학치료요법에 제공되어야 하는 잠복성 TB를 갖는 개인을 측정하는데 유용할 수 있음을 제안한다. 미래의 종적 연구는, 이러한 시그너쳐가 실제로 잠복성 환자에서 미래의 TB 질환의 지표임을 입증하는데 필요하다.
생성된 마이크로어레이 데이터의 크기 및 복잡성은 해석을 어렵게 하여, 종종 과학자들이 추가의 연구를 위한 소수의 후보물 유전자에 집중하도록 하며50,51, 이는 진단을 위한 특수한 바이오마커로서 충분하지 않을 수 있으며 질환 발병기전과 관련하여 정보를 거의 제공하지 않는다. TB의 발병기전에 놓인 숙주 인자에 대한 본 발명자들의 이해를 개선시키기 위하여, 본 발명자들은 3개의 명백한 여전히 상보성인 분석 시도, 모듈러, 경로 및 유전 수준 분석을 사용하여, 전사 시그너쳐에 의해 나타난 생물학적 경로로의 통찰력을 얻었다. 각각의 시도는 엠. 투베르쿨로시스에 대한 숙주 전사 반응에 관여한 일반적인 생물학적 경로를 확인하였으며 IFN-유도성 유전자가 활성 폐 TB에서 면역 시그너쳐의 주요 부분을 형성하는 것으로 확인하였다. 본 발명자들은 우선 모듈러 분석을 사용하였는데, 이는, 이것이 가장 자율적인 시도이므로 적어도 편향되는 경향이 있기 때문이다. 모듈은 다수의 독립적인 데이터세트로부터 유도하였으며 문헌 자료수집에 의해 주석을 달았고, 축적된 문헌으로부터의 지식 및 실험 데이터 둘다를 강력하게 통합하였다18. 당해 모듈러 분석은 활성 TB 질환의 우세한 IFN-유도성 시그너쳐를 나타내었다. 이는 발표된 문헌으로부터 전체적으로 기원되는, 독창성 경로 분석을 사용한 독립적인 시도에 의해 입증되었으며 IFN-유도성 시그너쳐의 우세성에 의해 확인되었고 또한 이것이 IFN-γ 및 제I형 IFN-유도성 유전자로 이루어짐을 나타내었다. 2개의 시도는 전사체의 상이한 목록을 분석하므로, 양쪽 방법에 의한 일반적인 생물학적 공정의 확인은 본 발명자의 발견의 강건함을 입증한다. 추가의 수준의 입증으로서, 개개 유전자 수준 분석은 제공하였지만 또한 다른 분석 방법으로부터의 발견시 확장하였다. 이들 시도 및 추가의 면역학적 분석을 사용하여 본 발명자들은 성공적인 치료에 의해 제거되는, 호중구-기원한 IFN-유도성 시그너쳐로서 엠. 투베르쿨로시스에 대한 숙주 혈액 전사 반응의 주요 성분을 나타내었다. 당해 연구는 TB의 근본적인 생물학에 대한 본 발명자들의 이해를 개선시키고 진단 및 치료에 대한 추가의 안내를 제공할 수 있다.
혈액은 감염 동안 조직내 감염성 제제에 노출되는 호중구, 수지 세포 및 단핵구, 또는 B 또는 T 림프구 각각을 포함하는 선천적인 및 적응된 면역계의 세포에 대한 저장소 및 이주 구획을 나타낸다. 이러한 이유로 감염된 개인으로부터의 전혈은 임상적으로 관련된 물질의 접근가능한 공급원을 제공하며, 여기서 공평한 분자 표현형은 조직내 암(참조: Alizadeh AA., 2000; Golub, TR., 1999; Bittner, 2000), 및 자가면역성(참조: Bennet, 2003; Baechler, EC, 2003; Burczynski, ME, 2005; Chaussabel, D., 2005; Cobb, JP., 2005; Kaizer, EC., 2007; Allantaz, 2005; Allantaz, 2007), 및 혈액 또는 조직(참조: Bleharski, JR et al., 2003)에서 염증(참조: Thach, DC., 2005) 및 감염성 질환(참조: Ramillo, Blood, 2007)의 연구를 위해 이미 기술된 유전자 발현 마이크로어레이를 사용하여 얻을 수 있다. 혈액 림프구에서 유전자 발현의 마이크로어레이 분석은 진단 및 예측 유전자 발현 시그너쳐를 확인하였으며, 이는 질환 발병 및 치료에 대한 반응의 대사작용의 보다 우수한 이해를 유도한다(참조: Bennet, L 2003; Rubins, KH., 2004; Baechler, EC, 2003; Pascual, V., 2005; Allantaz, F., 2007; Allantaz, F., 2007). 이러한 마이크로어레이 시도는 활성 및 잠복성 TB의 연구를 위해 시도되었지만 여전히 적은 수의 차등적으로 발현된 유전자만을 생성하였고(참조: Jacobsen, M., Kaufmann, SH., 2006; Mistry, R, Lukey, PT, 2007), 비교적 소수의 환자(참조: Mistry, R., 2007)에서, 이는 다른 염증 질환과 감염성 질환을 구별하기에 충분히 강건하지 않을 수 있다.
추가의 방법
참여자 보충 및 환자 특성화. 영국 런던 소재의 세인트 매리 병원(St. Mary's Hospital London)에서 지역 연구 윤리 위원회(REC 06/Q0403/128) 및 남아프리카 공화국의 케이프 타운에 소재하는 케이프 타운 대학(REC 012/2007)이 당해 연구를 승인하였다. 모든 참여자는 18세 이상이었고 서면 동의서를 제공받았다. 참여자들은 영국 런던 소재의 세인트 매리 병원 및 햄머스미쓰 병원(Hammersmith Hospital), 임페리얼 칼리지 헬쓰케어 NHS 트러스트(Imperial College Healthcare NHS Trust), 영국 욱스브릿지 소재의 힐링돈 병원 NHS 트러스트 및 남아프리카 케이프 타운 카옐리트샤(Khayelitsha) 소재의 우분투(Ubuntu) TB/HIV 클리닉으로부터 보충되었다. 환자는, 어떠한 항-마이코박테리움 치료도 개시하기 전에 예상하여 보충되고 시료채취되었지만, 이들이 이들의 관련 연구 그룹에 대한 완전한 임상 기준을 충족하는 경우 최종 분석시에 포함시켰다. 런던에서 보충된 제1 집단으로 보충된 활성 TB 환자의 소세트는 또한 치료요법 개시 후 2 및 12개월째에 시료채취되었다. 임신중이거나, 면역억제되거나 당뇨병 또는 자가면역병이 있는 환자들은 부적격하므로 본 연구에서 제외시켰다. 남아프리카에서 모든 참여자는 Abbott Determine® HIV1/2 신속한 항체 검정 시험 키트[제조원: 애보트 래보러토리즈(Abbott Laboratories), 미국 일리노이주 애보트 파크 소재]를 사용한 정규의 HIV 시험을 하였다. 활성 TB 환자는 영국 런던의 로얄 브롬프톤 병원 마이코박테리움 참조 실험실(Royal Brompton Hospital Mycobacterial Reference Laboratory) 또는 케이프타운의 그루테 슈어 병원(Groote Schuur Hospital)의 국립 보건 실험실 서비스의 참조 랩(The Reference Lab of the National Health Laboratory Service)에 의해 수행된 민감성 시험으로 호흡기 표본(가래 또는 기관지 폐포 세척액)의 마이코박테리움 배양시 엠. 투베르쿨로시스의 실험실 분리로 확인하였다. 영국에서, 잠복성 TB 환자는 IGRA를 사용한 양성 결과와 함께, 양성 TST를 갖는 TB 클리닉으로 언급된 것들로부터 모집하였다. 남아프리카에서 잠복성 TB 참여자들은 우분투(Ubuntu) TB/HIV 클리닉에서 자발적인 시험 클리닉으로 자가-참조하는 개인으로부터 모집하였으며, IGRA 양성만을 TST 결과(비록 이것이 여전히 수행되었다고 해도)와 상관없이 진단을 확인하는데 사용하였다. 건강한 대조군 참여자는 영국 런던 밀 힐(Mill Hill)에 소재하는 의학 연구를 위한 국립 의학 연구소(National Institute for Medical Research: NIMR)에서의 자원자로부터 모집하였다. 연구 포함을 위한 최종 기준을 충족시키기 위해, 건강한 자원자는 TST 및 IGRA 둘다에 의해 음성이어야 했다.
투베르쿨린 피부 시험. 이는 영국 안내서에 따라 0.1ml(2TU) 투베르쿨린 PPD[RT23, 제조원: 세럼 스타텐스 인스티튜트(Serum Statens Institute), 덴마크 코펜하겐 소재]를 사용하여 수행하였다. 영국 국립 안내서에 따라2, BCG가 예방접종되지 않은 경우 양성 TST는 ≥6mm로 명명하였고, BCG가 예방접종된 경우 ≥15mm 로 명명하였다.
인터페론 감마 방출 검정 시험. QuantiFERON® 골드 인-튜브 검정(Gold In-Tube assay)[제조원: 셀레스티스(Cellestis), 오스트레일리아 카르네기 소재]을 제조업자의 지시에 따라 수행하였다.
전체적인 및 차등적인 백혈구 수. 2ml의 전혈을 테루모 베노세이프(Terumo Venosafe) 5ml K2-EDTA 튜브[제조원: 테루모 유럽(Terumo Europe), 벨기에 루벤 소재]내로 수집하였다. 이후에, 시료를 니혼 코흐덴(Nihon Kohden) MEK-6400 자동화된 혈액학 분석기(Automated Hematology Analyzer)[제조원: 니혼 코흐덴 코포레이션(Nihon Kohden Corporation), 일본 도쿄 소재]를 사용하여 4시간내에 분석하였다.
질환의 방사선사진 정도의 평가. 분명한 심장 방사선사진을 런던에서 모집한 모든 환자에 대해 디지털 영상으로 수집하고 전사 프로파일 및 임상 데이터에 대해 차단된 3명의 독립적인 임상의에 의해 미국 국립 결핵 및 호흡병 협회3의 분류 시스템의 변형된 버젼을 사용하여 등급을 매겼다. 당해 시스템은 병변의 밀도 및 정도 및 캐비테이션(cavitation)의 부재의 존재를 기초로 한 기준에 따라 질환의 방사선사진 정도를 "최소", "중간으로 진전된" 또는 "상당히 진전된" 단계로 특성화한다. 본 발명자들은 본 연구에 사용하기 위해 당해 시스템을 변경하여 이것이 "질환 없음"의 분류를 포함하도록 하고 흉막 질환 또는 림프절병의 존재에 대해 간주하도록 하였다. 이후에, 당해 시스템을 결정 트리(decision tree)로 전환하여 분류에 도움이 되도록 하였다(도 9a).
마이크로어레이 분석을 위한 RNA 시료채취, 추출 및 프로세싱. 3ml의 전혈을 템푸스 튜브(Tempus tube)[제조원: 어플라이드 바이오시스템스(Applied Biosystems), 미국 캘리포니아주 포스터 시티 소재]내로 수집하고, 수집 직후 격렬히 혼합하여 -20℃ 내지 -80℃에서 RNA 추출 전에 저장하였다. RNA를 트레이닝 세트 시료로부터 1.5ml의 전혈 및 퍼펙트퓨어(PerfectPure) RNA 혈액 키트[제조원: 5 프라임 인크(5 PRIME Inc), 미국 메릴랜드주 가이터스부르그 소재]를 사용하여 트레이닝 세트 시료로부터 분리하였다. 시험 및 확인(SA) 세트 시료를 1ml의 전혈로부터 MagMAXTM-96 혈액 RNA 분리 키트[제조원: 어플라이드 바이오시스템스(Applied Biosystems)/암비온(Ambion), 미국 텍사스주 오스틴 소재]를 사용하여 제조업자의 지시에 따라 추출하였다. 이후에, 2.5mg의 분리된 총 RNA를 GLOBINclearTM 96-웰 포맷 키트(제조원: 어플라이드 바이오시스템스/암비온, 미국 텍사스주 오스틴 소재)를 사용하여 제조업자의 지시에 따라 글로빈 감소시켰다. 전체 및 글로빈-감소된 RNA 온전성을 7 내지 9.5의 RIN의 품질을 나타내는 아질런트 2100 생분석기(Agilent 2100 Bioanalyzer)[제조원: 아질런트 테크놀로지스(Agilent Technologies), 미국 캘리포니아주 산타 클라라 소재]를 사용하여 평가하였다. RNA 수율은 나노드롭 1000 분광광도계[제조원: 나노드롭 프로덕츠(NanoDrop Products), 더 알엠오 피셔 사이언티픽 인크(The rmo Fisher Scientific Inc), 미국 델라웨어주 윌밍톤 소재]를 사용하여 평가하였다. 이후에, 바이오티닐화되고, 증폭된 안티센스 상보성 RNA 표적(cRNA)을 200 내지 250ng의 글로빈-감소된 RNA로부터 일루미나 커스텀프렙(Illumina CustomPrep) RNA 증폭 키트(제조원: 어플라이드 바이오시스템스/암비온, 미국 텍사스주 오스틴 소재)를 사용하여 제조하였다. 750ng의 표지된 cRNA를 일루미나 사람(Illumina Human) HT-12 비드칩 어레이(BeadChip arrays)[제조원: 일루미나 인크(Illumina Inc), 미국 캘리포니아주 샌 디에고 소재]에 대해 밤새 하이브리드화하였으며, 이는 48,000개 이상의 프로브를 함유한다. 이후에, 어레이를 일루미나 비드스테이션(Illumina BeadStation) 500 상에서 제조업자의 프로토콜에 따라 세척하고 차단하며, 염색하고 스캐닝하였다. 일루미나 비드스튜디오(Illumina BeadStudio) v2 소프트웨어(제조원: 일루미나 인크, 미국 캘리포니아주 샌 디에고 소재)를 사용하여 스캔으로부터 시그날 강도 값을 생성하였다.
별개의 세포 분리 및 RNA 추출. 전혈을 EDTA에서 수집하였다. 호중구(CD15+), 단핵구(CD14+), CD4+ T 세포 및 CD8+ T 세포를 제조업자의 지시에 따라서 다이나비드(Dynabead)를 사용하여 순차적으로 분리하였다. RNA를 전혈(5' 프라임 퍼펙트 퓨어 키트(Prime Perfect Pure kit))로부터 추출하거나 세포 집단[퀴아겐 RNEase 미니 키트(Qiagen RNEasy Mini Kit)]을 분리하고 사용할 때까지 -80℃에 저장하였다.
마이크로어레이 데이터 분석
표준화. 일루미나 비드스튜디오 v2 소프트웨어를 사용하여 배경을 감하고 모든 시료에 대한 전체 평균 시그날 강도에 대해 각각의 시료에 대한 평균 시그날 강도를 조정하였다. 유전자 발현 분석 소프트웨어 프로그램인, 진스프링(GeneSpring) GX, 버젼 7.1.3[제조원: 아질런트 테크놀로지스(Agilent Technologies), 미국 캘리포니아주 산타 클라라 소재; 이후에, 진스프링으로 언급됨]을 사용하여 추가의 표준화를 수행하였다. 10 미만의 모든 시그날 강도 값을 10과 같도록 설정하였다. 다음에, 유전자당 표준화를 모든 시료를 가로질러 프로빙하기 위해 배지 강도로 각각의 시료내 각각의 프로브의 시그날 강도를 나누어 적용하였다. 이들 표준화된 데이터를 하기에 설명한 건강에 대한 분자 거리의 평가를 제외한 모든 하부 분석(downstream analyse)에 사용하였다.
부류 예측. 본 발명자들은 진스프링내에서 이용가능한 부류 예측 도구들 중의 하나를 이용하였다. 예측 모델은 10개 이웃(neighbour)과 0.5의 p 값 비 컷오프(cut off)를 갖는 K-최근점 이웃 알고리즘을 사용하였다. 393개 전사체 목록으로부터의 모든 유전자를 예측에 사용하였다. 예측 모델은 트레이닝 세트에서 교차-확인으로 정제하였며, 1개의 활성 분리물(outlier)은 배제시켰다. 이후에, 당해 모델을 사용하여 별개의 시험 및 확인 세트에서 시료의 분류를 예측하였다. 예측이 이루어지지 않는 경우, 이를 미측정 결과로 기록하였다. 민감성, 특이성 및 95% 신뢰도 구간(95% CI)을 윈도우용 그래프패드 프리즘(GraphPad Prism) 버젼 5.02를 사용하여 측정하였다. P-값을 2-면 피셔 정확도 시험(two-sided Fisher's Exact test)을 사용하여 측정하였다.
감독된 분석: (i) 전사 변화량 또는 "건강에 대한 분자 거리". 당해 기술은 앞서 기술한 바와 같이 수행하였다4. 이는 전사체 풍부성 값을 건강한 기본선과 비교하여 제공된 시료의 전사 교란의 정도를 나타내는 대표적인 점수로 전환하는 것을 목표로 한다. 이는, 제공된 시료의 발현 값이 건강한 대조군의 평균으로부터 2개의 표준 편차의 내부 또는 외부에 있는지를 측정함으로써 수행한다.
감독된 분석: (ii) 경로 분석. 차등적으로 발현된 유전자의 추가의 기능적 분석은 독창성 경로 분석[제조원: Ingenuity® 시스템스 인크.(Systems, Inc.), 미국 캘리포니아주 레드우드 소재, www.ingenuity.com]을 사용하여 수행하였다. 표준 경로 분석(Canonical pathways analysis)은 데이터세트내에서 가장 유의적으로 표시된 독창성 경로 분석으로부터의 경로를 확인하였다. 데이터세트와 표준 경로 사이의 관련성 유의성은 피셔 정확도 시험을 사용하여 측정함으로써 데이터세트에서의 전사체와 표준 경로 사이의 관련성이 기회(chance)만으로 설명될 가능성을 나타내는 p-값을 적용된 다중 시험에 대한 벤자미니-호크베르그 교정을 사용하여 계산하였다. 당해 프로그램을 또한 사용하여 표준 네트워크를 맵핑하고 이를 데이터세트로부터의 발현 데이터를 사용하여 오버레이(overlay)할 수 있다.
감독된 분석: (iii) 전사 모듈러 분석. 당해 분석은 앞서 기술한 바와 같이 수행하였다4,5. 본 발명의 연구와 관련하여, 모듈러 구조는 아피메트릭스(Affymetrix) HG U133A&B 유전자칩(GeneChip)을 사용하여 유도하였으므로, 모듈을 포함하는 프로브를 일루미나 플래폼에서 이들의 등량체로 해독하는 것이 필수적이었다. 참조서열 번호(RefSeq ID)를 사용하여 아피메트릭스 HG U133과 일루미나 WG-6 V2 플래폼 사이의 프로브를 일치시켰다. 명확한 일치가 5,348개 아피메트릭스 프로브 세트중 2,109개에서 발견되었으며, 이들을 본 모듈러 분석에 사용하였다. 일치하는 프로브들은 이들의 원래의 모듈에서 보존되었다. 전체로서 질환 그룹 대 전체 건강한 대조군 그룹에 대한 전체적인 전사 변화를 그래프로 나타내기 위하여, 점들을 격자상에서 정렬하여, 각각의 위치가 이들의 원래의 정의를 기준으로 한 상이한 모듈에 상응하도록 하였다. 점 강도는 이러한 모듈에 대해 검출된 전사체의 총 수로부터, 나타난 방향에서 변화하는 차등적으로 발현된 전사체의 퍼센트를 나타내는 반면, 점 색상은 변화의 극성을 나타낸다(적색 = 과-표시됨, 청색 = 저-표시됨(under-represented)).
멀티플렉스 혈청 단백질 측정. 1 내지 4ml의 혈액을 혈전 활성인자 튜브[그라이너 바이오원(Greiner BioOne) 1ml 바큐트 튜브(vacuette tube), 참조 번호 454098, 제조원: 그라이너 바이오원(Greiner BioOne), 오스트리아 그렘스뮌슈트 소재; 또는 BD 4ml 바큐테이너 튜브(vacutainer tube), 참조 번호 368975; 제조원: 벡톤 디킨슨(Becton Dickinson)]내로 수집하였다. 튜브를 2000g에서 5분 동안 실온에서 원심분리하고 혈청 부위를 추출하여 -80℃ 미결 분석(pending analysis)에서 동결시켰다. 분석은 멀티플렉싱된 사이토킨 비드-계 면역검정에 의해 밀리포어(Millipore) UK[제조원: 밀리포어 유케이 리미티드(Millipore UK Ltd), 영국 둔디 소재]에 의해 Milliplex® 다중-분석물 프로파일링 시스템(Multi-Analyte Profiling system)[제조원: 밀리포어(Millipore), 미국 매사츄세츠주 빌레리카 소재]를 사용하여 수행하였다. 63개의 사이토킨, 케모킨, 가용성 수용체, 성장 인자, 부착 분자 및 급성 상 단백질의 혈청 수준을 각각의 시료에서 이러한 방식으로 측정하였다. 시료를 MMP-9, C-반응성 단백질, 혈청 아밀로이드 A, EGF, 에오탁신, FGF-2, Flt-3 리간드, 프랙탈킨, G-CSF, GM-CSF, GRO, IFN-α2, IFN-γ, IL-10, IL-12p40, IL-12p70, IL-13, IL-15, IL-17, IL-1α, IL-1β, IL-1Rγ, IL-2, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, CXCL10 (IP10), MCP-1, MCP-3, MIP-1α, MIP-1β, PDGF-AA, PDGF-AB/BB, RANTES, 가용성 CD40 리간드, 가용성 IL-2RA, TGF-α, TNF-α, VEGF, MIF, 가용성 Fas, 가용성 Fas 리간드, tPAI-1, 가용성 ICAM-1, 가용성 VCAM-1, 가용성 CD30, 가용성 gp130, 가용성 IL-1RII, 가용성 IL-6R, 가용성 RAGE, 가용성 TNF-RI, 가용성 TNF-RII, IL-16, TGFβ1, TGF-β2 및 TGFβ-3의 수준에 대해 분석하였다.
유동 세포분석기. 염색 패널당 200μl의 전혈(나트륨-헤파린 튜브 속에 수집함)을 적절한 항체와 함께 20분 동안 실온으로 암실 속에서 항온처리하였다. 이후에, 적혈구 세포를 BD FACS 분해 용액[제조원: 비디 바이오사이언시즈(BD Biosciences)]을 사용하여 분해하면서, 10분 동안 실온으로 암실 속에서 항온처리하였다. 세포를 회전 침강시키고 2ml의 FACS 완충액(PBS/BSA/아지드)으로 세척한 후 1% 파라포름알데하이드 속에 고정시켰다. 이후에, 시료를 벡만 코울터 시안(Beckman Coulter Cyan)에서 서밋 소프트웨어(Summit Software) 버젼 3.02를 사용하여 수행하였다. 분석은 매킨토시용 플로우조(FlowJo) 버젼 8.7.3[제조원: 트리 스타, 인크(Tree Star, Inc.)]을 사용하여 수행하였다. 사용된 게이팅 전략은 도 11 및 도 12에 나타낸다. 적절하게 혼주된 유동 세포분석기 데이터를 만-휘트니 랭크 합 U-시험(Mann-Whitney Rank Sum U-test)을 사용하여 유의성에 대해 시험하였다. 모든 항체는 비디 파밍겐(BD Pharmingen) 또는 칼택 래보러토리즈(Caltag Laboratories)[인비트로겐(Invitrogen)]으로부터 구입하였으며, 단, CD45RA의 경우에는 벡만 코울터(Beckman Coulter)로부터 구입하였다.
통계적 분석. 건강에 대한 분자 거리 및 모듈러 구조 분석 계산을 마이크로소프트 엑셀 2003[제조원: 마이크로소프트 코포레이션(Microsoft Corporation), 미국 워싱톤주 레드몬드 소재]을 사용하여 수행하였다. 연속 변수의 통계적 분석 및 상관 분석을 윈도우용 그래프패드 프리즘 버젼 5.02[제조원: 그래프패드 소프트웨어(GraphPad Software), 미국 캘리포니아주 샌 디에고 소재, www.graphpad.com]을 사용하여 수행하였다. 단정적인 변수의 분석은 윈도우용 SPSS 버젼 14(미국 일리노이주, 시카고 소재)를 사용하여 수행하였다.
도 10a 내지 10d. 활성 TB의 전혈 전사 시그너쳐는 세포 조성에 있어서의 명백한 변화 및 유전자 발현의 절대적인 수준에 있어서의 변화 둘다를 반영한다. 건강한 대조군과 비교한 활성 TB의 유전자 발현을 예정된 모듈러 구조내에서 맵핑한다. 점의 강도는 각각의 모듈에 대해 유의적으로 차등 발현된 전사체의 비율을 나타낸다(적색 = 증가됨, 청색 = 감소됨, 전사체 풍부성). 공평한 문헌 자료수집에 의해 미리 결정된 기능적 해석을 주요 도 4에서 색상 코드화된 격자로 나타낸다. 여기서 (10a) 트레이닝 세트; (10b) 시험 세트; (10c) 확인 세트(SA)에서 과- (적색) 또는 저-표시된(청색) 각각의 모듈에서 유전자의 퍼센트가 입증된다. (10d) 건강에 대한 칭량된 분자 거리는 각각의 환자에 대해 기본선 예비 치료(0 개월), 및 항-마이코박테리움 치료요법의 개시 후 2 및 12개월 째에 계산하였다. 개개 환자의 수는 도 3a 내지 3d에 나타낸 것들에 상응한다.
도 11a 내지 11c. 활성 TB 환자 및 대조군의 혈액에서 림프구의 분석. 나타낸 (11a)는 시험 세트 건강한 대조군 및 활성 TB 환자로부터의 전혈을 T 세포 및 B 세포에 대해 분석하기 위해 사용된 유동 세포분석 게이팅 전략이다. 패널의 상부 열은 후속적인 게이팅에 사용된 림프구 FSC/SSC 게이트를 측정하기 위해 사용된 백게이팅 전략을 나타낸다. 큰 FSC/SSC 게이트를 초기에 설정(좌측 패널)한 후 CD45 대 CD3에 대해 분석하였다. CD45CD3 세포를 게이팅(중간 패널)하고 이들의 FSC/SSC 프로파일을 측정하였다(우측 패널). 이후에, 당해 프로파일을 사용하여 적절한 림프구 FSC/SSC 게이트를 측정하였다(참조: 제2열, 좌측 패널). 당해 백게이팅 가정은 또한 CD45+CD19+ (B 세포) 상에서 게이팅을 수행함으로써 이들 세포가 림프구 게이트에 포함되도록 보장하였다(나타내지 않음). 패널의 제2 열은 T 세포 집단을 확인하는데 사용된 게이팅 전략을 나타낸다. 림프구 FSC/SSC 게이트를 설정하고 이들 세포를 CD45 대 CD3(좌측으로부터 2번째 패널)에 대해 평가하였다. 이후에, CD45+ 세포를 게이팅하고 CD3 대 CD8에 대해 평가하였다. CD3+ T 세포를 게이팅하고 CD4 및 CD8 발현에 대해 평가하였다. 이후에, CD4+ 및 CD8+ 소세트를 게이팅하였다. 열 3 내지 6은 T 세포 기억 소세트를 정의하는데 사용된 게이팅 전략을 나타낸다. 열 2에서와 같이 게이팅된 CD4 및 CD8 T 세포를 CD45RA 대 CCR7 발현 및 사분면 세트에 대해 동형 대조군(열 5 및 6)을 기초로 평가하여 나이브(CD45RA+CCR7+), 중심 기억(CD45RA-CCR7+), 효과기 기억(CD45RA-CCR7-) 및 CD8+ T 세포의 경우에, 말단 차등화된 효과기(CD45RA+CCR7-) T 세포를 정의하였다. 이들 소세트를 또한 CD62L 발현에 대해 평가하였다. 패널의 하부 열은 B 세포를 게이팅하는데 사용된 전략을 나타낸다. 림프구 FSC/SSC 게이트를 설정하고 세포를 CD45 대 CD19에 대해 평가하였다. CD45+ 세포를 게이팅하고 CD19 및 CD20에 대해 평가하였다. B 세포는 CD19+CD20+로 정의하였다. (11b) 11개의 시험 세트 건강한 대조군(대조군) 및 9개의 시험 세트 활성 TB 환자(활성)으로부터의 전혈을 다중-매개변수 유동 세포분석기에 의해 T 세포 기억 집단에 대해 분석하였다. 완전한 유동 세포분석기 게이팅 전략은 도 11a에 나타낸다. 그래프는 나이브, 중심 기억(TCM), 효과기 기억(TEM) 및 말단 차등화된 효과기(TD, CD8+ T 세포만) 세포 소세트(상부 열, 각각의 그룹)의 퍼센트에 대한 모든 개인의 혼주된 데이터, 및 각각의 세포 소세트에 대한 세포 수(x106/ml)(하부 열, 각각의 그룹)를 나타낸다. 각각의 기호는 개개 환자를 나타낸다. 수평선은 중간값을 나타낸다. (11c) 유전자 (i) 활성 TB(트레이닝, 시험 및 확인 세트)로부터의 전혈 시료내 T 세포 전사체 풍부성; 및 (ii) 시험 세트 혈액으로부터 분리된 혈액 백혈구 집단에서 발현. 유전자 풍부성/발현은 건강한 대조군의 중간값(도 1에서 표지함)과 비교하여 나타낸다. 시험 세트 및 분리된 집단에서 나타낸 수는 개개 환자에 상응한다.
도 12a 내지 12c. 활성 TB 환자 및 대조군의 혈액에서 골수종 세포의 분석. (12a) 시험 세트 건강한 대조군 및 활성 TB 환자로부터의 전혈을 단핵구 및 호중구에 대해 분석하기 위해 사용된 유동 세포분석 게이팅 전략을 나타낸다. 큰 FSC/SSC 게이트를 설정(상부 열, 좌측 패널)한 후 CD45 대 CD14에 대해 분석하였다. CD45+ 세포를 게이팅(중간 패널)하고 CD14 대 CD16에 대해 평가하였다. 단핵구는 CD14+로 정의하고, 염증성 단핵구는 CD14+CD16+로서 정의하며 호중구는 CD16+로서 정의하였다. 또한 당해 도에서 나타낸 것은 CD16+ 호중구와, CD16를 발현하는 NK 세포 사이의 가능한 오버랩을 평가하기 위해 사용된 게이팅 전략이다. 큰 FSC/SSC 게이트를 설정하여 호중구 및 NK 세포 둘다를 포함시켰다. (12b) 이후에 CD45+ 세포를 CD16 대 CD56(NK 세포 마커)에 대해 평가하였다. CD16+ 호중구는 고 수준의 CD16을 발현하였으나 CD56은 발현하지 않았다(동형 대조군 플롯으로 나타낸 것으로서, 하부 패널). CD56+ NK 세포는 중간 수준의 CD16을 발현하였으며 CD16hi 세포와 오버랩되지 않았다. CD56+CD16int 세포 및 CD16hi 세포는 상이한 FSC/SSC 특성을 가졌다. (12c) 골수종 유전자 (i) 활성 TB(트레이닝, 시험 및 확인 세트)로부터 전혈 시료에서 전사체 풍부성; 및 (ii) 시험 세트 혈액으로부터 분리된 혈액 백혈구 집단내 발현. 유전자 풍부성/발현은 건강한 대조군(도 1에서와 같이 표지됨)의 중간값과 비교하여 나타낸다. 시험 세트에 나타낸 수 및 분리된 집단은 개개 환자에 상응한다.
도 13a 및 13b. 393개-전사체 시그너쳐의 독창성 경로 분석. (13a) 각각의 표준 생물학적 경로가 유의적으로 과-표시될 가능성(피셔 정확도 시험에 의해 벤자미니-호크베르그 다중 시험 교정으로 계산된 p-값의 -log로서)은 오렌지색 사각형으로 나타낸다. 균일한 색상 바아는 분석된 유전자 목록에서 나타낸 경로(각각의 바아의 우측 모서리에서 굵게 제공됨)를 포함하는 유전자의 총 수의 퍼센트를 나타낸다. 바아의 색상은 트레이닝 세트에서 건강한 대조군과 비교하여 활성 TB를 지닌 환자의 전혈에서 전사체의 풍부성을 나타낸다. (13b) 인터페론-알파 2a(IFN-α 2a), 및 인터페론-감마(IFN-γ)의 혈청 수준을 여기서 트레이닝 세트 마이크로어레이 분석을 위해 사용된 12명의 건강한 대조군 및 활성 TB를 가진 13명의 환자에 대해 나타낸다. 2-테일드 일직선 직립검사를 사용하여 사이토킨에 대한 그룹들 사이에 유의적인 차이는 관찰되지 않았다. 수평선은 각각의 그룹에 대한 평균을 나타내며 위스커(whisker)는 95% 신뢰도 구간을 나타낸다.
도 14a 및 14b. 개개의 건강한 대조군, 및 활성 TB를 가진 환자로부터의 전혈 및 세포 소-집단에서 PDL1(CD274) 발현. (14a) 11명의 시험 세트 건강한 대조군(대조군) 및 11명의 시험 세트 활성 TB 환자(활성)로부터의 전혈을 PDL1의 발현에 대한 유동 세포분석기로 분석하였다. 큰 FSC/ SSC 게이트를 설정하여 평가된 동형 대조군(녹색)과 비교한 것으로서 PDL1의 기하 평균 형광성 강도(MFI)(적색)를 포함시켰다. 각각의 활성 TB 환자를 상이한 날에 분석하고, 건강한 대조군은 소 그룹(좌측으로부터, 시료 1 & 2, 3 & 4, 6 내지 8 및 9 내지 11은 함께 수행하였으며, 5는 단독 수행하였다)에서 분석하였으며 각각의 그룹내 시료는 동형 대조군을 공유한다. (14b) 동일한 11개의 시험 세트 건강한 대조군(대조군) 및 11개의 시험 세트 활성 TB 환자(활성)의 혈액으로부터의 세포 소-집단을 a 부분에서와 같이 PDL1의 발현에 대한 유동 세포분석기로 또한 분석하였다. 세포 소-집단을 도 6b에서와 같이 정의하고, 동형 대조군(녹색)과 비교한 것으로서 PDL1의 MFI(적색)을 플롯팅하였다.
도 15a 내지 15f. 연구 그룹에 따라 순서를 매긴 트레이닝 세트 393-전사체 프로파일을 도의 우측에 나열한 유전자 기호와 함께 확대하여 나타낸다. 주요 전사체는 큰 글씨로 강조한다. 각각의 도의 좌측에서 전체 유전자 트리 및 열지도를 나타내고, 확장된 부위는 흑색 직사각형으로 표시하였다. 전사체의 상대적 풍부성은 도의 배경에서 색상 스케일로 나타낸다(도 1에서와 같이).
도 16a 내지 16은 열 맵의 우측 면에 나열한 바와 같은, 각종 유전자에 대한 대조군, 잠복성 및 활성과 비교한 열맵이다.
도 17a 내지 17c는 표에 나열한 바와 같은, 각종 트레이닝 세트, 시험 세트 및 확인 세트에 대한 통계, 즉, 성별, 기원국 및 민족성과 각종 실패를 포함한 표이다.
도 18a 내지 18c는 표에서 나열한 바와 같은, 각종 트레이닝 세트, 시험 세트 및 확인 세트에 대한 통계, 즉 TST, BCG 예방접종 및 도말 상태에 대한 시험 결과를 포함한 표이다.
도 19는 시료에 대한 각종 공급원들 사이에서 트레이닝 세트, 시험 세트 및 확인 세트의 특이성 및 민감성에 대한 결과를 요약한 표이다.
방법에 대한 참조 문헌
Figure pct00025

Figure pct00026
Figure pct00027

Figure pct00028
Figure pct00029
Figure pct00030
Figure pct00031
Figure pct00032
Figure pct00033
Figure pct00034
Figure pct00035
Figure pct00036
Figure pct00037
Figure pct00038
Figure pct00039
Figure pct00040

본 명세서에서 논의된 특정 실시형태는 본 발명의 어떠한 방법, 키트, 시약 또는 조성물과 관련하여 시행될 수 있으며, 이의 역으로도 가능함이 고려된다. 또한, 본 발명의 조성물은 본 발명의 방법을 달성하기 위해 사용될 수 있다.
본원에 기술된 특수 실시형태들은 실례의 방식으로 나타낸 것이며 본 발명을 제한하는 것이 아님을 이해하여야 한다. 본 발명의 기본 특징은 본 발명의 영역으로부터 벗어남이 없이 각종 실시형태에서 사용될 수 있다. 당해 분야의 숙련가는 본원에 기술된 통상의 실험, 특수 과정에 대한 다수의 등량체를 사용하여 인식하거나 확인할 수 있을 것이다. 이러한 등량체는 본 발명의 영역내에 있는 것으로 고려되며 특허청구범위에 의해 포함된다.
본 명세서에서 언급된 모든 공보 및 특허원은 본 발명이 속한 당해 분야의 숙련가의 기술 수준의 지표이다. 모든 공보 및 특허원은, 각각의 개개 공보 또는 특허원이 참조로 혼입되는 것으로 구체적으로 및 개별적으로 나타낸 경우와 동일한 정도로 참조에 의해 본원에 혼입된다.
특허청구범위 및/또는 명세서에서 용어 "포함하는"과 함께 사용되는 경우 단수 단어 "a" 또는 "an"의 사용은 "하나"를 의미할 수 있지만, 이는 또한 "하나 이상", "적어도 하나" 및 "하나 또는 하나 이상"의 의미와 일치한다. 특허청구범위에서 용어 "또는"의 사용은 대안만을 언급하도록 표현하여 나타내거나 대안이 상호 배타적이지 않는 한, 비록 기재내용이 단지 대안 및 "및/또는" 만을 언급하는 정의를 뒷받침한다고 해도, "및/또는"을 의미하기 위해 사용된다. 당해 출원 전체에서, 용어 "약"은, 하나의 값이 장치에 대한 오차의 고유 변화, 값을 측정하기 위해 사용되는 방법, 또는 연구 대상체들 중에 존재하는 변화를 포함함을 나타내기 위해 사용된다.
본 명세서 및 특허청구범위에서 사용된 것으로서, 단어 "포함하는"(및 "포함하다(comprise/comprises)"와 같은 '포함하는'의 어떠한 형태), "갖는"(및 "갖다(have/has)"와 같은 '갖는'의 어떠한 형태), "포괄하는"(및 "포괄하다(includes/include)"와 같은 '포괄하는'의 어떠한 형태) 또는 "함유하는"(및 "함유하다(contain/contain)"과 같은 '함유하는'의 어떠한 형태)는 포괄적이거나 제약을 두지않는(open-ended) 것이며 추가의 인용되지 않은 성분 또는 방법 단계들을 배제하지 않는다.
본원에 사용된 것으로서 용어 "또는 이의 조합"은 당해 용어를 앞서에 나열된 항목들의 조합 및 모든 순열을 말한다. 예를 들면, "A, B, C, 또는 이의 조합"은: A, B, C, AB, AC, BC, 또는 ABC 중 적어도 하나를 포함하는 것으로 의도되며, 순서가 특수 내용에서 중요한 경우, 또한 BA, CA, CB, CBA, BCA, ACB, BAC, 또는 CAB를 포함한다. 당해 실시예에 연속하여, BB, AAA, MB, BBC, AAABCCCC, CBBAAA, CABABB 등과 같은 하나 이상의 항목 또는 용어의 반복체를 함유하는 조합도 표현하여 포함된다. 당해 분야의 숙련가는, 통상적으로 내용으로부터 또한 명백하지 않는 한, 항목들 또는 용어들의 수에 있어서 어떠한 조합으로의 제한이 없음을 이해할 것이다.
본원에 기재되고 특허청구된 조성물 및/또는 방법의 모두는 본 기재내용의 측면에서 과도한 실험없이 이루어지고 실행될 수 있다. 본 발명의 조성물 및 방법이 바라직한 실시형태의 측면에서 기술되었지만, 당해 분야의 숙련가에게는, 변화가 조성물 및/또는 방법 및 본원에 기술된 방법의 단계 또는 단계들의 순서에서 본 발명의 개념, 취지 및 영역으로부터 벗어남이 없이 적용될 수 있음을 이해할 것이다. 당해 분야의 숙련가에게 명백한 모든 이러한 유사한 대체물 및 변형은 첨부된 특허청구범위에 의해 정의된 바와 같은 본 발명의 취지, 영역 및 개념내에 있는 것으로 고려된다.
참조 문헌
Figure pct00041
Figure pct00042
Figure pct00043
Figure pct00044

Claims (25)

  1. 잠복성/무증상인 것으로 보이는 활성 마이코박테리움 투베르쿨로시스(Mycobacterium tuberculosis) 감염의 검출 방법으로서,
    잠복성/무증상 마이코박테리움 투베르쿨로시스 감염으로 의심되는 환자로부터 환자 유전자 발현 데이터세트를 얻는 단계;
    상기 환자 유전자 발현 데이터세트를 마이코박테리움 투베르쿨로시스 감염과 관련된 하나 이상의 유전자 모듈로 분류하는 단계; 및
    상기 하나 이상의 유전자 모듈 각각에 대한 상기 환자 유전자 발현 데이터세트를, 동일한 유전자 모듈로 역시 분류된 비-환자로부터의 유전자 발현 데이터세트와 비교하는 단계를 포함하고, 여기서 상기 하나 이상의 유전자 모듈에 대한 상기 환자 유전자 발현 데이터세트에서의 유전자 발현의 전체에서의 증가 또는 감소가 잠복성/무증상 마이코박테리움 투베르쿨로시스 감염보다는 오히려 활성 마이코박테리움 투베르쿨로시스 감염의 지표인, 방법.
  2. 제1항에 있어서, 상기 측정된 비교 유전자 생성물 정보를 사용하여 진단, 예측 또는 치료 계획 중의 하나 이상을 공식화(Formulation)하는 단계를 추가로 포함하는, 방법.
  3. 제1항에 있어서, 활성 TB 환자로부터 잠복성 TB 환자를 구별하는 단계를 추가로 포함하는, 방법.
  4. 제1항에 있어서, 상기 환자 유전자 발현 데이터세트가 전혈, 말초 혈액 단핵 세포 또는 가래 중의 하나 이상으로부터 얻은 세포로부터 얻어지는, 방법.
  5. 제1항에 있어서, 상기 환자 유전자 발현 데이터세트가 표 2에서의 유전자들로부터 선택된 적어도 10, 20, 40, 50, 70, 80, 90, 100, 125, 150, 200, 250, 300, 350 또는 393개의 유전자와 비교되는, 방법.
  6. 제1항에 있어서, 상기 환자 유전자 발현 데이터세트가 적어도 10, 20, 40, 50, 70, 80, 90, 100, 125, 150, 200, 모듈 M1.3, M2.8, M1.5, M2.6, M2.2 및 3.1과 비교되는, 방법.
  7. 제1항에 있어서, 상기 마이코박테리움 투베르쿨로시스 감염과 관련된 유전자 모듈이 모듈 M1.3, 모듈 M2.8, 모듈 M1.5, 모듈 M2.6, 모듈 M2.2 및 모듈 3.1로 이루어진 그룹 중에서 선택되는, 방법.
  8. 제1항에 있어서, 상기 마이코박테리움 투베르쿨로시스 감염과 관련된 유전자 모듈이 B 세포-관련 유전자에 있어서의 감소, T 세포-관련된 유전자에 있어서의 감소, 골수 관련 유전자에 있어서의 증가, 호중구 관련 전사체 및 인터페론 유도성(IFN) 유전자에 있어서의 증가에 있어서의 변화에 의해 선택되는, 방법.
  9. 제1항에 있어서, 상기 환자의 질환 상태가 환자의 폐의 방사선 분석에 의해 추가로 측정되는, 방법.
  10. 제1항에 있어서, 환자를 치료한 후 치료된 환자 유전자 발현 데이터세트를 측정하는 단계, 및 상기 치료된 환자 유전자 발현 데이터세트가 정상 유전자 발현 데이터세트로 회복되었는지를 측정함으로써 환자가 치료되었는지를 측정하는 단계를 추가로 포함하는, 방법.
  11. 잠복성/무증상인 것으로 보이는 마이코박테리움 투베르쿨로시스 감염이 활성 마이코박테리움 투베르쿨로시스 감염으로 될 것인지를 예측하는 방법으로서,
    활성 마이코박테리움 투베르쿨로시스 감염을 지닌 제1의 임상 그룹으로부터 얻은 제1의 유전자 발현 데이터세트, 잠복성 마이코박테리움 투베르쿨로시스 감염 환자가 있는 제2의 임상 그룹으로부터 얻은 제2의 유전자 발현 데이터세트, 및 감염되지 않은 개인들의 임상 그룹으로부터 얻은 제3의 유전자 발현 데이터세트를 얻는 단계;
    상기 제1, 제2 및 제3의 데이터세트 중 어느 2개 사이의 유전자의 차등된 발현(differential expression)을 포함하는 유전자 집단 데이터세트(gene cluster dataset)를 생성시키는 단계; 및
    잠복성 감염, 활성 감염 또는 건강함의 지표인 발현/표시의 독특한 패턴을 측정하는 단계를 포함하고, 여기서 환자 유전자 발현 데이터세트는 모듈 M1.3, M2.8, M1.5, M2.6, M2.2 및 3.1 중 적어도 하나의 유전자로부터 얻은 적어도 6, 10, 20, 40, 50, 70, 80, 90, 100, 125, 150, 또는 200개 유전자를 포함하고, 여기서, 상기 하나 이상의 유전자 모듈에 대한 상기 환자 유전자 발현 데이터세트에서의 유전자 발현의 전체에 있어서의 증가 또는 감소가 잠복성/무증상 감염보다는 오히려 활성 마이코박테리움 투베르쿨로시스 감염의 지표인,
    잠복성/무증상인 것으로 보이는 마이코박테리움 투베르쿨로시스 감염이 활성 마이코박테리움 투베르쿨로시스 감염으로 될 것인지를 예측하는 방법.
  12. 마이코박테리움 투베르쿨로시스에 감염된 것으로 의심되는 환자에서 감염을 진단하기 위한 키트로서,
    환자로부터 환자 유전자 발현 데이터세트를 얻기 위한 유전자 발현 검출기(여기서, 발현된 유전자는 환자의 전혈로부터 얻어진다); 및
    프로세서로서, 상기 유전자 발현 데이터세트를 마이코박테리움 투베르쿨로시스 감염과 관련된 예정된 유전자 모듈 데이터세트와 비교할 수 있고 감염된 환자와 감염되지 않은 환자를 구별하는 프로세서를 포함하고, 여기서 전혈은 상대가 되는 감염되지 않은 환자와 비교하여 하나 이상의 전사 유전자 발현 모듈에서의 폴리뉴클레오타이드의 수준에 있어서의 전체적 변화를 나타냄에 의해 잠복성/무증상 마이코박테리움 투베르쿨로시스 감염과 활성이 될 감염을 구별하는, 키트.
  13. 제12항에 있어서, 상기 환자 유전자 발현 데이터세트가 말초 혈액 단핵 세포로부터 얻어지는, 키트.
  14. 제12항에 있어서, 상기 환자 유전자 발현 데이터세트가 표 2에서의 유전자들로부터 선택된 적어도 10, 20, 40, 50, 70, 80, 90, 100, 125, 150, 200, 250, 300, 350 또는 393개의 유전자와 비교되는, 키트.
  15. 제12항에 있어서, 상기 환자 유전자 발현 데이터세트가 적어도 10, 20, 40, 50, 70, 80, 90, 100, 125, 150, 200, 모듈 M1.3, M2.8, M1.5, M2.6, M2.2 및 3.1과 비교되는, 키트.
  16. 제12항에 있어서, 상기 마이코박테리움 투베르쿨로시스 감염과 관련된 유전자 모듈이 모듈 M1.3, 모듈 M2.8, 모듈 M1.5, 모듈 M2.6, 모듈 M2.2 및 모듈 3.1로 이루어진 그룹 중에서 선택되는, 키트.
  17. 제12항에 있어서, 상기 마이코박테리움 투베르쿨로시스 감염과 관련된 유전자 모듈이 B 세포-관련된 유전자에 있어서의 감소, T 세포-관련된 유전자에 있어서의 감소, 골수 관련 유전자에 있어서의 증가, 호중구 관련 전사체 및 인터페론 유도성(IFN) 유전자에 있어서의 증가에서의 변화에 의해 선택되는, 키트.
  18. 제12항에 있어서, 상기 유전자가 PDL-1, CASP5, CR1, CASP5, TLR5, MAPK14, STX11, BCL6 및 C5 중에서 선택되는, 키트.
  19. 잠복성/무증상으로 보이는 활성 마이코박테리움 투베르쿨로시스 감염의 검출 시스템으로서,
    환자로부터 환자 유전자 발현 데이터세트를 얻기 위한 유전자 발현 검출기(여기서, 발현된 유전자는 환자의 전혈로부터 얻어진다); 및
    프로세서로서, 상기 유전자 발현 데이터세트를 마이코박테리움 투베르쿨로시스 감염과 관련된 예정된 유전자 모듈 데이터세트와 비교할 수 있고 활성 질환으로의 진행 위험이 있는 잠복성 마이코박테리움 투베르쿨로시스 감염된 환자를 구별하는 프로세서를 포함하고, 여기서 전혈은 상대가 되는 감염되지 않는 환자와 비교하여 하나 이상의 전사 유전자 발현 모듈에서의 폴리뉴클레오타이드의 수준에 있어서의 전체적 변화를 나타냄에 의해 활성 질환으로의 진행 위험이 있는 잠복성 마이코박테리움 투베르쿨로시스 감염된 환자를 구별하고, 여기서 상기 유전자 모듈 데이터세트는 모듈 M1.3, M2.8, M1.5, M2.6, M2.2 및 3.1 중의 적어도 하나를 포함하는, 시스템.
  20. 제19항에 있어서, 상기 환자 유전자 발현 데이터세트가 표 2에서의 유전자들로부터 선택된 적어도 10, 20, 40, 50, 70, 80, 90, 100, 125, 150, 200, 250, 300, 350 또는 393개 유전자와 비교되는, 시스템.
  21. 제19항에 있어서, 상기 환자 유전자 발현 데이터세트가 적어도 10, 20, 40, 50, 70, 80, 90, 100, 125, 150, 200, 모듈 M1.3, M2.8, M1.5, M2.6, M2.2 및 3.1과 비교되는, 시스템.
  22. 제19항에 있어서, 상기 마이코박테리움 투베르쿨로시스 감염과 관련된 유전자 모듈이 모듈 M1.3, 모듈 M2.8, 모듈 M1.5, 모듈 M2.6, 모듈 M2.2 및 모듈 3.1로 이루어진 그룹 중에서 선택되는, 시스템.
  23. 제19항에 있어서, 상기 마이코박테리움 투베르쿨로시스 감염과 관련된 유전자 모듈이 B 세포-관련된 유전자에 있어서의 감소, T 세포-관련된 유전자에 있어서의 감소, 골수 관련 유전자에 있어서의 증가, 호중구 관련 전사체 및 인터페론 유도성(IFN) 유전자에 있어서의 증가에서의 변화에 의해 선택되는, 시스템.
  24. 제19항에 있어서, 상기 유전자가 PDL-1, CASP5, CR1, CASP5, TLR5, MAPK14, STX11, BCL6 및 C5 중에서 선택되는, 시스템.
  25. 치료제의 시도에 있어서 효능을 모니터링하는 방법으로서,
    마이코박테리움 투베르쿨로시스로 감염된 것으로 의심되는 환자로부터 환자 유전자 발현 데이터세트를 얻는 단계;
    상기 환자 유전자 발현 데이터세트를 마이코박테리움 투베르쿨로시스 감염과 관련된 하나 이상의 유전자 모듈로 분류하는 단계; 및
    상기 하나 이상의 유전자 모듈 각각에 대한 상기 환자 유전자 발현 데이터세트를 비-환자로부터의 유전자 발현 데이터세트와 비교하는 단계;
    환자를 치료제로 치료하는 단계; 및
    상기 치료제가 환자 유전자 발현 프로파일을 비-환자로부터의 유전자 발현 데이터세트로 되도록 변화시켰는지를 측정하는 단계를 포함하고; 여기서 상기 하나 이상의 유전자 모듈에 대한 상기 환자 유전자 발현 데이터세트에서 유전자 발현의 전체에 있어서의 증가 또는 감소가 활성 마이코박테리움 투베르쿨로시스 감염의 지표인, 방법.
KR1020127017108A 2009-11-30 2010-08-19 활성 대 잠복성 마이코박테리움 투베르쿨로시스 감염의 혈액 전사적 시그너쳐 KR20120107979A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12/628,148 2009-11-30
US12/628,148 US20110129817A1 (en) 2009-11-30 2009-11-30 Blood transcriptional signature of active versus latent mycobacterium tuberculosis infection

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020147014569A Division KR20140078768A (ko) 2009-11-30 2010-08-19 활성 대 잠복성 마이코박테리움 투베르쿨로시스 감염의 혈액 전사적 시그너쳐

Publications (1)

Publication Number Publication Date
KR20120107979A true KR20120107979A (ko) 2012-10-04

Family

ID=44067161

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020147014569A KR20140078768A (ko) 2009-11-30 2010-08-19 활성 대 잠복성 마이코박테리움 투베르쿨로시스 감염의 혈액 전사적 시그너쳐
KR1020127017108A KR20120107979A (ko) 2009-11-30 2010-08-19 활성 대 잠복성 마이코박테리움 투베르쿨로시스 감염의 혈액 전사적 시그너쳐

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020147014569A KR20140078768A (ko) 2009-11-30 2010-08-19 활성 대 잠복성 마이코박테리움 투베르쿨로시스 감염의 혈액 전사적 시그너쳐

Country Status (19)

Country Link
US (2) US20110129817A1 (ko)
EP (1) EP2519652A4 (ko)
JP (1) JP2013511981A (ko)
KR (2) KR20140078768A (ko)
CN (1) CN102844444A (ko)
AP (1) AP2012006346A0 (ko)
AR (1) AR080570A1 (ko)
AU (1) AU2010325179B2 (ko)
BR (1) BR112012013029A2 (ko)
CA (1) CA2782211A1 (ko)
CL (1) CL2012001400A1 (ko)
EA (1) EA201270650A1 (ko)
IL (1) IL220016A0 (ko)
MX (1) MX2012006031A (ko)
PE (1) PE20121690A1 (ko)
SG (1) SG10201407855WA (ko)
TW (1) TW201131032A (ko)
WO (1) WO2011066008A2 (ko)
ZA (1) ZA201204806B (ko)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2524966A1 (en) * 2011-05-18 2012-11-21 Rheinische Friedrich-Wilhelms-Universität Bonn Molecular analysis of tuberculosis
TWI458978B (zh) * 2011-12-27 2014-11-01 Chengchung Chou 判別開放性或潛伏性結核菌感染之方法
EP2825671A4 (en) * 2012-03-13 2015-08-26 Baylor Res Inst EARLY IDENTIFICATION OF A TUBERCULOSE TREATMENT RESPONSE
CA2867481A1 (en) * 2012-04-13 2013-10-17 Somalogic, Inc. Tuberculosis biomarkers and uses thereof
GB201211158D0 (en) * 2012-06-22 2012-08-08 Univ Nottingham Trent Biomarkers and uses thereof
WO2014067943A1 (en) * 2012-10-30 2014-05-08 Imperial Innovations Limited Method of detecting active tuberculosis in children in the presence of a|co-morbidity
US20150315643A1 (en) * 2012-12-13 2015-11-05 Baylor Research Institute Blood transcriptional signatures of active pulmonary tuberculosis and sarcoidosis
DK2962100T3 (da) 2013-02-28 2021-11-01 Caprion Proteomics Inc Tuberkulosebiomarkører og anvendelser deraf
GB201315748D0 (en) 2013-09-04 2013-10-16 Imp Innovations Ltd Biological methods and materials for use therein
WO2015048098A1 (en) 2013-09-24 2015-04-02 Washington University Diagnostic methods for infectious disease using endogenous gene expression
AP2016009538A0 (en) * 2014-04-15 2016-11-30 Univ Stellenbosch A method for diagnosing tuberculous meningitis
CN103954755B (zh) * 2014-04-30 2017-04-05 广东省结核病控制中心 一种结核分枝杆菌潜伏感染的诊断试剂盒
US10041945B2 (en) 2014-05-05 2018-08-07 Emory University Methods of diagnosing and treating tuberculosis
US10920275B2 (en) * 2015-10-14 2021-02-16 The Board Of Trustees Of The Leland Stanford Junior University Methods for diagnosis of tuberculosis
GB201519872D0 (en) * 2015-11-11 2015-12-23 Univ Cape Town And Ct For Infectious Disease Res Biomarkers for prospective determination of risk for development of active tuberculosis
GB2547034A (en) * 2016-02-05 2017-08-09 Imp Innovations Ltd Biological methods and materials for use therein
KR101888101B1 (ko) * 2016-09-19 2018-08-14 충남대학교산학협력단 Scotin 단백질의 과발현에 의하여 결핵균 생존 및 증식을 억제하는 방법
JP6306124B2 (ja) * 2016-11-01 2018-04-04 国立大学法人高知大学 結核検査用バイオマーカー
CN107653313B (zh) * 2017-09-12 2021-07-09 首都医科大学附属北京胸科医院 Retn和klk1在作为结核病检测标志物中的应用
US11443433B2 (en) * 2018-02-10 2022-09-13 The Trustees Of The University Of Pennsylvania Quantification and staging of body-wide tissue composition and of abnormal states on medical images via automatic anatomy recognition
GB201804019D0 (en) 2018-03-13 2018-04-25 Univ Cape Town Method for predicting progression to active tuberculosis disease
US11036779B2 (en) * 2018-04-23 2021-06-15 Verso Biosciences, Inc. Data analytics systems and methods
CN108828235A (zh) * 2018-08-23 2018-11-16 中国人民解放军第三〇九医院 Pglyrp1蛋白作为标志物在诊断活动性结核病中的应用
CN109061191B (zh) * 2018-08-23 2021-08-24 中国人民解放军第三〇九医院 S100p蛋白作为标志物在诊断活动性结核病中的应用
CN110286231A (zh) * 2019-06-19 2019-09-27 中国人民解放军总医院第八医学中心 用于检测cd160蛋白的物质在制备用于诊断活动性结核病的产品中的应用
CN111304313A (zh) * 2019-12-13 2020-06-19 南方医科大学 一种检测fpr1基因表达水平的试剂的应用
EP3868894A1 (en) * 2020-02-21 2021-08-25 Forschungszentrum Borstel, Leibniz Lungenzentrum Method for diagnosis and treatment monitoring and individual therapy end decision in tuberculosis infection
CN116994646A (zh) * 2023-08-01 2023-11-03 东莞市滨海湾中心医院(东莞市太平人民医院、东莞市第五人民医院) 一种菌阳活动性肺结核风险评估模型的构建方法与应用

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6627198B2 (en) * 1997-03-13 2003-09-30 Corixa Corporation Fusion proteins of Mycobacterium tuberculosis antigens and their uses
US6713257B2 (en) * 2000-08-25 2004-03-30 Rosetta Inpharmatics Llc Gene discovery using microarrays
AU2002241520A1 (en) * 2000-11-28 2003-03-03 University Of Cincinnati Blood assessment of injury
EP2196473A1 (en) * 2001-07-04 2010-06-16 Health Protection Agency Mycobacterial antigens expressed during latency
WO2004001070A1 (en) * 2002-06-20 2003-12-31 Glaxo Group Limited Surrogate markers for the determination of the disease status of an individual infected by mycobacterium tuberculosis
EP2300823A4 (en) * 2008-06-25 2012-03-14 Baylor Res Inst TRANSCRIPTIONAL SIGNATURE OF BLOOD DURING INFECTION WITH MYCOBACTERIUM TUBERCULOSIS

Also Published As

Publication number Publication date
US20140080732A1 (en) 2014-03-20
AP2012006346A0 (en) 2012-06-30
KR20140078768A (ko) 2014-06-25
PE20121690A1 (es) 2012-12-16
JP2013511981A (ja) 2013-04-11
EP2519652A4 (en) 2013-05-01
AU2010325179A1 (en) 2012-07-05
WO2011066008A2 (en) 2011-06-03
EA201270650A1 (ru) 2013-06-28
MX2012006031A (es) 2012-10-03
WO2011066008A3 (en) 2011-07-21
CA2782211A1 (en) 2011-06-03
IL220016A0 (en) 2012-07-31
TW201131032A (en) 2011-09-16
US20110129817A1 (en) 2011-06-02
ZA201204806B (en) 2013-02-27
AR080570A1 (es) 2012-04-18
AU2010325179B2 (en) 2015-03-12
BR112012013029A2 (pt) 2016-10-04
SG10201407855WA (en) 2015-01-29
CN102844444A (zh) 2012-12-26
EP2519652A2 (en) 2012-11-07
CL2012001400A1 (es) 2014-05-09

Similar Documents

Publication Publication Date Title
KR20120107979A (ko) 활성 대 잠복성 마이코박테리움 투베르쿨로시스 감염의 혈액 전사적 시그너쳐
Schafflick et al. Integrated single cell analysis of blood and cerebrospinal fluid leukocytes in multiple sclerosis
Hu et al. Transcriptional signature of human pro-inflammatory TH17 cells identifies reduced IL10 gene expression in multiple sclerosis
Berry et al. An interferon-inducible neutrophil-driven blood transcriptional signature in human tuberculosis
McKinney et al. T-cell exhaustion, co-stimulation and clinical outcome in autoimmunity and infection
McKinney et al. A CD8+ T cell transcription signature predicts prognosis in autoimmune disease
Jacobsen et al. Candidate biomarkers for discrimination between infection and disease caused by Mycobacterium tuberculosis
Corvol et al. Abrogation of T cell quiescence characterizes patients at high risk for multiple sclerosis after the initial neurological event
Figgett et al. Machine learning applied to whole‐blood RNA‐sequencing data uncovers distinct subsets of patients with systemic lupus erythematosus
JP2011526152A (ja) マイコバクテリウム・ツベルクローシス感染症の血液転写サイン
Wang et al. T helper type 17 cells expand in patients with myasthenia‐associated thymoma
US20070238094A1 (en) Diagnosis, prognosis and monitoring of disease progression of systemic lupus erythematosus through blood leukocyte microarray analysis
CN101541976A (zh) 利用血液白细胞中的基因表达标记物的急性感染的鉴别诊断
Wu et al. Serum IL-18 as biomarker in predicting long-term renal outcome among pediatric-onset systemic lupus erythematosus patients
Thuong et al. Pretreatment cerebrospinal fluid bacterial load correlates with inflammatory response and predicts neurological events during tuberculous meningitis treatment
Shenoi et al. Comparison of biomarkers for systemic juvenile idiopathic arthritis
Carlsson et al. Juvenile idiopathic arthritis associated uveitis
Satti et al. Current approaches toward identifying a correlate of immune protection from tuberculosis
Galbraith et al. Peripheral blood gene expression in postinfective fatigue syndrome following from three different triggering infections
Elsink et al. Implementation of early next-generation sequencing for inborn errors of immunity: a prospective observational cohort study of diagnostic yield and clinical implications in Dutch genome diagnostic centers
Zhao et al. Clinical relevance of RORγ positive and negative subsets of CD161+ CD4+ T cells in primary Sjögren’s syndrome
Van Unen et al. Identification of a disease-associated network of intestinal immune cells in treatment-naive inflammatory bowel disease
Khanolkar et al. CD4 T cell–restricted IL-2 signaling defect in a patient with a novel IFNGR1 deficiency
Fawaz et al. Neuroproteomics and microRNAs studies in multiple sclerosis: transforming research and clinical knowledge in biomarker research
Awasthi et al. Monocyte HLADR and immune dysregulation index as biomarkers for COVID-19 severity and mortality

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application
A107 Divisional application of patent