KR20080006617A - 패혈증의 진단 - Google Patents

패혈증의 진단 Download PDF

Info

Publication number
KR20080006617A
KR20080006617A KR1020077026526A KR20077026526A KR20080006617A KR 20080006617 A KR20080006617 A KR 20080006617A KR 1020077026526 A KR1020077026526 A KR 1020077026526A KR 20077026526 A KR20077026526 A KR 20077026526A KR 20080006617 A KR20080006617 A KR 20080006617A
Authority
KR
South Korea
Prior art keywords
biomarkers
biomarker
sepsis
subject
biomarker profile
Prior art date
Application number
KR1020077026526A
Other languages
English (en)
Inventor
제임스 에이. 가레트
샤-샤 왕
케이트 토른톤
리차드 리 무어
윌리엄 에이. 키팅
윌리엄 에이. 누스바우머
크레이그 씨. 휘테포드
Original Assignee
백톤 디킨슨 앤드 컴퍼니
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 백톤 디킨슨 앤드 컴퍼니 filed Critical 백톤 디킨슨 앤드 컴퍼니
Publication of KR20080006617A publication Critical patent/KR20080006617A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/569Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
    • G01N33/56911Bacteria
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6893Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids related to diseases not provided for elsewhere
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/52Assays involving cytokines
    • G01N2333/54Interleukins [IL]
    • G01N2333/5412IL-6
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/52Assays involving cytokines
    • G01N2333/54Interleukins [IL]
    • G01N2333/5421IL-8
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/26Infectious diseases, e.g. generalised sepsis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/50Determining the risk of developing a disease
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Urology & Nephrology (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Pathology (AREA)
  • Genetics & Genomics (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

본 발명은 패혈증의 발병 위험이 있는 대상에서 패혈증의 발병을 예측하는 방법을 제공한다. 한 가지 방법에서, 대상의 바이오마커 프로필에서의 특성을 평가한다. 이들 특성이 특정 수치 세트를 만족시키는 경우에 대상은 패혈증을 발병할 수 있다. 또한, 패혈증 단계를 발병할 위험이 있는 대상에서 패혈증 단계의 발병을 예측하는 방법이 제공된다. 한 가지 방법에서, 대상의 바이오마커 프로필에서의 다수의 특성을 평가한다. 이들 특성 수치가 특정 수치 세트를 만족시키는 경우에 대상은 패혈증 단계가 발병할 수 있다. 추가로, 대상에서 패혈증을 진단하는 방법이 제공된다. 이러한 방법의 하나에서, 대상의 바이오마커 프로필에서의 다수의 특성을 평가한다. 다수의 특성이 특정 수치 세트를 만족시키는 경우에 대상은 패혈증을 발병할 수 있다.
패혈증, 바이오마커, 수치 세트.

Description

패혈증의 진단 {DIAGNOSIS OF SEPSIS}
관련 출원에 대한 상호 참조
본원은 전문이 본원에 참고로 포함되는 2005년 4월 15일자로 출원한 미국 특허 가출원 제60/671,620호를 35 U.S.C. § 119(e)하에 우선권으로 주장한다. 본원은 또한 전문이 본원에 참고로 포함되는 2005년 4월 22일자로 출원한 미국 특허 가출원 제60/674,046호를 35 U.S.C. § 119(e)하에 우선권으로 주장한다.
1. 기술분야
본 발명은 대상에서 패혈증 및/또는 그의 진행 병기를 진단 또는 예측하기 위한 방법 및 조성물에 관한 것이다. 본 발명은 또한 대상에서 전신성 염증 반응 증후군을 진단하기 위한 방법 및 조성물에 관한 것이다.
2. 배경기술
질환 상태의 조기 발견은 전형적으로 보다 효과적인 치료를 가능하게 하여 상응하게 보다 바람직한 임상적 결과를 가져온다. 그러나, 많은 경우에서 질환 증상의 조기 발견이 질환의 복합성으로 인해 어렵기 때문에, 질환은 진단이 가능하기 전에 비교적 진행될 수 있다. 전신성 염증 상태는 그러한 부류의 질환 중 하나를 나타낸다. 이들 상태, 특히 패혈증은 항상 그렇지는 않지만 전형적으로, 숙주에서 과도하고 이상조절된 염증 반응을 일으키는 병원성 미생물과 숙주의 방어 시스템 간의 상호작용으로 인해 야기된다. 전신성 염증 반응 동안 숙주의 반응의 복합성은 질환 병인 파악을 어렵게 한다 (문헌 [Healy, 2002, Annul. Pharmacother. 36:648-54] 참조). 또한, 질환 병인의 불완전한 파악은 유용한 진단용 바이오마커를 찾는 것을 어렵게 한다. 그러나, 패혈증은 매우 신속하게 진행하여 생명을 위협받는 상태에 놓이게 되므로, 신뢰할만한 조기 진단이 필수적이다.
대상에서 패혈증의 발병에는 전신성 염증 반응 증후군("SIRS")-음성에서 SIRS-양성으로, 이어서 패혈증으로 진행하는 잘 설명된 과정이 뒤따르며, 이는 이어서 중증 패혈증, 패혈성 쇼크, 다기관 기능부전 ("MOD")으로 발달하여, 결국 사망할 수 있다. 패혈증은 또한 대상에서 SIRS이 후속적으로 발병한 경우에 감염된 대상에서 발생할 수 있다. "패혈증"은 통상적으로 SIRS 감염과 문서화된 감염에 대한 전신성 숙주 반응으로 정의된다. "중증 패혈증"은 MOD, 저혈압, 파종성 혈관내 응고 ("DIC"), 또는 락트산 산증, 핍뇨증 및 정신 상태의 변화를 비롯한 관류저하 이상과 관련된다. "패혈성 쇼크"는 통상적으로 관류저하 이상의 부가적 존재로 수액 소생에 내성인 패혈증-유도 저혈압으로 정의된다.
패혈증에 대해 임상적으로 유의한 병원성 미생물 존재를 문서화하는 것은 어렵다고 입증되었다. 원인 미생물은 전형적으로 대상의 혈액, 타액, 소변, 상처 분비물, 내재 선 카테터 표면 등을 배양함으로써 검출한다. 그러나, 원인 미생물은 특정 신체 미소서식환경에만 서식하여 배양된 특정 물질이 오염 미생물을 함유하지 않을 수 있다. 또한 감염 부위에 미생물 수가 적어서 검출이 어려울 수 있다. 혈액 중 적은 수의 병원균은 혈액을 배양함으로써 패혈증을 진단하는 것에 대한 특정 문제점을 나타낸다. 예를 들어, 한 연구에서 패혈증의 임상 소견을 나타낸 대상의 오직 17%에서만 양성 배양 결과가 얻어졌다 (문헌 [Rangel-Frausto et al., 1995, JAMA 273:117-123]). 또한 비-병원성 미생물에 의한 샘플의 오염으로 인해 진단이 어려울 수 있다. 예를 들어, 패혈증에 걸린 대상 707명에 대한 연구에서, 검출된 미생물의 오직 12.4% 만이 임상적으로 유의하였다 (문헌 [Weinstein et al., 1997, Clinical Infectious Diseases 24:584-602]).
패혈증의 조기 진단의 어려움은 질환과 관련된 높은 이환률 및 사망률에 의해 반영된다. 패혈증은 현재 미국에서 사망 원인 10위이며, 특히 비-관상동맥질환 집중 치료실 (intensive care unit; ICU)에 입원한 환자 중에서 우세하고, 여기에서 가장 흔한 사망 원인이다. 총 사망률은 35%나 되고, 미국에서만 매년 750,000명의 환자가 발생하는 것으로 측정된다. 미국에서만 패혈증을 치료하기 위한 연간 비용은 수십억 달러에 달한다.
따라서, 효과적 개입 및 예방이 가능하도록 충분히 조기에 발견할 수 있는, 만족스러운 특이도 및 민감도 수행을 갖는 기술을 이용한 패혈증 진단 방법에 대한 요구가 존재한다.
3. 발명의 개요
본 발명은 시험 대상에서의 패혈증의 발병을 비롯한 패혈증의 진단을 위한 방법 및 조성물에 관한 것이다. 본 발명은 또한 시험 대상에서의 패혈증의 예측을 위한 방법 및 조성물에 관한 것이다.
본 발명은 추가로 시험 대상에서의 패혈증 진행 병기의 진단 또는 예측을 위한 방법 및 조성물에 관한 것이다. 본 발명은 또한 시험 대상에서의 전신성 염증 반응 증후군 (SIRS)의 진단을 위한 방법 및 조성물에 관한 것이다.
한 측면에서, 본 발명은 패혈증 발병 위험이 있는 시험 대상에서 패혈증의 발병을 예측하는 방법을 제공한다. 상기 방법은 시험 대상의 바이오마커 프로필에서의 다수의 특성이 수치 세트를 만족하는지 평가하는 것을 포함하며, 여기서 수치 세트를 만족하는 것은 시험 대상에서 다수의 특성이 수치 세트를 만족하는지 평가하기 위해 적용되는 의사결정 규칙의 정확도에 의해 결정되는 확률로 패혈증을 발병할 수 있음을 의미한다. 특정 실시양태에서, 의사결정 규칙의 정확도는 60% 이상이다. 따라서, 이와 상응하게, 다수의 특성이 수치 세트를 만족하는 경우에 시험 대상이 패혈증을 발병할 확률은 60% 이상이다.
본 발명의 또 다른 측면은 시험 대상에서의 패혈증의 진단 방법을 포함한다. 이들 방법은 시험 대상의 바이오마커 프로필에서의 다수의 특성이 수치 세트를 만족하는지 평가하는 것을 포함하며, 여기서 수치 세트를 만족하는 것은 시험 대상이 패혈증에 걸릴 수 있음을 예측하는 것으로, 이는 다수의 특성이 수치 세트를 만족하는지 결정하기 위해 이들이 적용되는 의사결정 규칙의 정확도에 의해 결정된다. 특정 실시양태에서, 의사결정 규칙의 정확도는 60% 이상이다. 따라서, 이와 상응하게, 다수의 특성이 수치 세트를 만족하는 경우에 시험 대상이 패혈증에 걸릴 확률은 60% 이상이다.
특정 실시양태에서, 바이오마커 프로필은 2개 이상의 특성을 포함하며, 각각의 특성은 표 30의 칼럼 4 또는 5에 열거된 상응하는 바이오마커의 특성을 나타낸다. 한 실시양태에서, 바이오마커 프로필은 표 30의 칼럼 4 또는 5에 열거된 2개 이상의 상이한 바이오마커를 포함한다. 이와 같은 한 실시양태에서, 바이오마커 프로필은 2개 이상의 바이오마커에 대해 각각 상응하는 특성을 포함할 수 있다. 일반적으로, 2개 이상의 바이오마커는 2개 이상의 상이한 유전자로부터 유래한다. 2개 이상의 상이한 바이오마커 중 하나의 바이오마커가 표 30의 칼럼 4에 열거된 경우, 바이오마커는, 예를 들어 열거된 유전자에 의해 만들어진 전사체, 그의 상보체, 또는 구별가능한 단편 또는 그의 상보체, 또는 그의 cDNA, 또는 상기 cDNA와 구별가능한 단편, 또는 상기 전사체 또는 그의 상보체의 전부 또는 일부에 상응하는 구별가능한 증폭된 핵산 분자, 또는 상기 유전자에 의해 코딩된 단백질, 상기 단백질의 구별가능한 단편, 또는 상기 중 임의의 것의 지시일 수 있다. 또한, 바이오마커는, 예를 들어 표 30의 칼럼 5에 열거된 단백질, 또는 상기 단백질의 구별가능한 단편, 또는 상기 중 임의의 것의 지시일 수 있다. 여기서, 구별가능한 분자 또는 단편은 검출되는 경우, 상기 확인된 전사체, cDNA, 증폭된 핵산 또는 단백질의 존재 또는 풍부도를 나타내는 분자 또는 단편이다. 이 실시양태에 따라, 본 발명의 바이오마커 프로필은 바이오마커를 검출하기 위한 당업자에게 공지된 임의의 표준 검정법을 이용하거나 본원에 기재된 검정법으로 얻어질 수 있다. 그러한 검정법은, 예를 들어 특정 유전자 또는 관심있는 유전자의 대립유전자 (예를 들어, 표 30에 개시된 유전자)의 발현 생성물 (예를 들어, 핵산 및/또는 단백질)의 검출 을 가능하게 한다. 한 실시양태에서, 그러한 검정법은 핵산 미세배열을 이용한다. 특정 실시양태에서, 바이오마커 프로필은 표 32의 칼럼 4 또는 5로부터의 2개 이상의 상이한 바이오마커를 포함한다. 특정 실시양태에서, 바이오마커 프로필은 표 30으로부터의 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 또는 50개 이상의 상이한 바이오마커를 포함한다.
특정 실시양태에서, 바이오마커 프로필은 표 30의 칼럼 2에 열거된 프로브세트 중 하나를 각각 함유하는 2개 이상의 상이한 바이오마커, 표 30의 프로브세트 중 하나의 상보체를 함유하는 바이오마커, 또는 표 30의 프로브세트 중 하나 또는 표 30의 프로브세트 중 하나의 상보체를 함유하는 유전자에 의해 코딩된 아미노산 서열을 함유하는 바이오마커를 포함한다. 그러한 바이오마커는, 예를 들어 mRNA 전사체, cDNA 또는 다른 특정 핵산, 예를 들어 증폭된 핵산, 또는 단백질일 수 있다. 바이오마커 프로필은 2개 이상의 바이오마커에 대해 각각 상응하는 특성을 추가로 포함한다. 일반적으로, 2개 이상의 바이오마커는 2개 이상의 상이한 유전자로부터 유래한다. 바이오마커가 표 30에 열거된 프로브세트의 서열을 포함하는 유전자에 기초하는 경우, 바이오마커는, 예를 들어 상기 유전자에 의해 제조된 전사체, 그의 상보체, 또는 구별가능한 단편 또는 그의 상보체, 또는 그의 cDNA, 또는 상기 cDNA의 구별가능한 단편, 또는 상기 전사체 또는 그의 상보체의 전부 또는 일부에 상응하는 구별가능한 증폭된 핵산 분자, 또는 상기 유전자에 의해 코딩된 단백질, 또는 상기 단백질의 구별가능한 단편, 또는 상기 중 임의의 것의 지시일 수 있다. 또한, 바이오마커는, 예를 들어 표 30에 기재된 프로브세트 서열을 포함하는 유전자에 의해 코딩된 단백질, 또는 상기 단백질의 구별가능한 단편, 또는 상기 중 임의의 것의 지시일 수 있다. 여기서, 구별가능한 분자 또는 단편은 검출되는 경우, 상기 확인된 전사체, cDNA, 증폭된 핵산, 또는 단백질의 존재 또는 풍부도를 나타내는 분자 또는 단편이다. 특정 실시양태에서, 바이오마커 프로필은 표 31, 32, 33, 34 또는 36 중 임의의 하나로부터의 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 이상의 상이한 바이오마커를 포함한다.
특정 실시양태에서, 바이오마커 프로필은 표 31의 칼럼 3에 열거된 2개 이상의 상이한 바이오마커를 포함한다. 바이오마커 프로필은 2개 이상의 바이오마커에 대해 각각 상응하는 특성을 추가로 포함한다. 일반적으로, 2개 이상의 바이오마커는 2개 이상의 상이한 유전자로부터 유래한다. 바이오마커는, 예를 들어 표 31에 열거된 유전자에 의해 제조된 전사체, 그의 상보체, 또는 구별가능한 단편 또는 그의 상보체, 또는 그의 cDNA, 또는 상기 cDNA의 구별가능한 단편, 또는 상기 전사체 또는 그의 상보체의 전부 또는 일부에 상응하는 구별가능한 증폭된 핵산 분자, 또는 상기 유전자에 의해 코딩된 단백질, 또는 상기 단백질의 구별가능한 단편, 또는 상기 중 임의의 것의 지시일 수 있다. 또한, 바이오마커는, 예를 들어 표 31의 칼럼 3에 열거된 유전자에 의해 코딩된 단백질, 또는 상기 단백질의 구별가능한 단편, 또는 상기 중 임의의 것의 지시일 수 있다. 여기서, 구별가능한 분자 또는 단편은 검출되는 경우, 상기 확인된 전사체, cDNA, 증폭된 핵산, 또는 단백질의 존재 또는 풍부도를 나타내는 분자 또는 단편이다. 이 실시양태에 따라, 본 발명의 바 이오마커 프로필은 바이오마커를 검출하기 위한 당업자에게 공지된 임의의 표준 검정법을 이용하거나 본원에 기재된 검정법으로 얻어질 수 있다. 그러한 검정법은, 예를 들어 특정 유전자 또는 관심있는 유전자의 대립유전자 (예를 들어, 표 31에 개시된 유전자)의 발현 생성물 (예를 들어, 핵산 및/또는 단백질)의 검출을 가능하게 한다. 한 실시양태에서, 그러한 검정법은 핵산 미세배열을 이용한다.
특정 실시양태에서, 바이오마커 프로필은 표 31의 칼럼 2에 열거된 프로브세트 중 하나를 각각 함유하는 2개 이상의 상이한 바이오마커, 표 31의 프로브세트 중 하나의 상보체를 함유하는 바이오마커, 또는 표 31의 프로브세트 중 하나 또는 표 31의 프로브세트 중 하나의 상보체를 함유하는 유전자에 의해 코딩된 아미노산 서열을 함유하는 바이오마커를 포함한다. 그러한 바이오마커는, 예를 들어 mRNA 전사체, cDNA 또는 다른 특정 핵산, 예를 들어 증폭된 핵산, 또는 단백질일 수 있다. 바이오마커 프로필은 2개 이상의 바이오마커에 대해 각각 상응하는 특성을 추가로 포함한다. 일반적으로, 2개 이상의 바이오마커는 2개 이상의 상이한 유전자로부터 유래한다. 바이오마커가 표 31에 열거된 프로브세트의 서열을 포함하는 유전자에 기초하는 경우, 바이오마커는, 예를 들어 상기 유전자에 의해 제조된 전사체, 그의 상보체, 또는 구별가능한 단편 또는 그의 상보체, 또는 그의 cDNA, 또는 상기 cDNA의 구별가능한 단편, 또는 상기 전사체 또는 그의 상보체의 전부 또는 일부에 상응하는 구별가능한 증폭된 핵산 분자, 또는 상기 유전자에 의해 코딩된 단백질, 또는 상기 단백질의 구별가능한 단편, 또는 상기 중 임의의 것의 지시일 수 있다. 또한, 바이오마커는, 예를 들어 표 31에 기재된 프로브세트 서열을 포함하 는 유전자에 의해 코딩된 단백질, 또는 상기 단백질의 구별가능한 단편, 또는 상기 중 임의의 것의 지시일 수 있다. 여기서, 구별가능한 분자 또는 단편은 검출되는 경우, 상기 확인된 전사체, cDNA, 증폭된 핵산, 또는 단백질의 존재 또는 풍부도를 나타내는 분자 또는 단편이다. 특정 실시양태에서, 바이오마커 프로필은 표 31로부터의 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45 또는 50개의 이상의 상이한 바이오마커를 포함한다.
특정 실시양태에서, 바이오마커 프로필은 표 I의 칼럼 3 또는 4에 열거된 상응하는 바이오마커의 특성을 각각 나타내는 3개 이상의 특성을 포함한다. 한 실시양태에서, 바이오마커 프로필은 표 I의 칼럼 3 또는 4에 열거된 3개 이상의 상이한 바이오마커를 포함한다. 그러한 한 실시양태에서, 바이오마커 프로필은 3개 이상의 바이오마커에 대해 각각 상응하는 특성을 포함할 수 있다. 일반적으로, 3개 이상의 바이오마커는 표 I에 열거된 3개 이상의 상이한 유전자로부터 유래한다. 3개 이상의 상이한 바이오마커 중 1개의 바이오마커가 표 I의 칼럼 3에 열거된 경우, 바이오마커는, 예를 들어 열거된 유전자에 의해 제조된 전사체, 그의 상보체, 그의 스플라이스 변이체, 그의 스플라이스 변이체의 상보체, 또는 상기 중 임의의 것의 구별가능한 단편 또는 상보체, 상기 중 임의의 것의 cDNA, 상기 cDNA의 구별가능한 단편, 또는 상기 전사체 또는 그의 상보체의 전부 또는 일부에 상응하는 구별가능한 증폭된 핵산 분자, 또는 상기 유전자에 의해 코딩된 단백질, 또는 상기 단백질의 구별가능한 단편, 또는 상기 중 임의의 것의 지시일 수 있다. 또한, 바이오마 커는, 예를 들어 표 I의 칼럼 4에 열거된 단백질, 또는 상기 단백질의 구별가능한 단편, 또는 상기 중 임의의 것의 지시일 수 있다. 여기서, 구별가능한 분자 또는 단편은 검출되는 경우, 상기 확인된 전사체, cDNA, 증폭된 핵산, 그의 스플라이스 변이체 또는 단백질의 존재 또는 풍부도를 나타내는 분자 또는 단편이다. 이 실시양태에 따라, 본 발명의 바이오마커 프로필은 바이오마커를 검출하기 위한 당업자에게 공지된 임의의 표준 검정법을 이용하거나 본원에 기재된 검정법으로 얻어질 수 있다. 그러한 검정법은, 예를 들어 특정 유전자 또는 관심있는 유전자의 대립유전자 (예를 들어, 표 I에 개시된 유전자)의 발현 생성물 (예를 들어, 핵산 및/또는 단백질)의 검출을 가능하게 한다. 한 실시양태에서, 그러한 검정법은 핵산 미세배열을 이용한다. 특정 실시양태에서, 바이오마커 프로필은 표 I로부터의 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45 또는 50개 이상의 상이한 바이오마커를 포함한다.
특정 실시양태에서, 바이오마커 프로필은 표 J의 칼럼 3 또는 4에 열거된 상응하는 바이오마커의 특성을 각각 나타내는 3개 이상의 특성을 포함한다. 한 실시양태에서, 바이오마커 프로필은 표 J의 칼럼 3 또는 4에 열거된 3개 이상의 상이한 바이오마커를 포함한다. 그러한 한 실시양태에서, 바이오마커 프로필은 3개 이상의 바이오마커에 대해 각각 상응하는 특성을 포함할 수 있다. 일반적으로, 3개 이상의 바이오마커는 3개 이상의 상이한 유전자로부터 유래한다. 3개 이상의 상이한 바이오마커 중 1개의 바이오마커가 표 J의 칼럼 3에 열거된 경우, 바이오마커는, 예를 들어 열거된 유전자에 의해 제조된 전사체, 그의 상보체, 그의 스플라이스 변 이체, 그의 스플라이스 변이체의 상보체, 또는 상기 중 임의의 것의 구별가능한 단편 또는 상보체, 상기 중 임의의 것의 cDNA, 상기 cDNA의 구별가능한 단편, 또는 상기 전사체 또는 그의 상보체의 전부 또는 일부에 상응하는 구별가능한 증폭된 핵산 분자, 또는 상기 유전자에 의해 코딩된 단백질, 또는 상기 단백질의 구별가능한 단편, 또는 상기 중 임의의 것의 지시일 수 있다. 또한, 바이오마커는, 예를 들어 표 J의 칼럼 4에 열거된 단백질, 또는 상기 단백질의 구별가능한 단편, 또는 상기 중 임의의 것의 지시일 수 있다. 여기서, 구별가능한 분자 또는 단편은 검출되는 경우, 상기 확인된 전사체, cDNA, 증폭된 핵산, 그의 스플라이스 변이체 또는 단백질의 존재 또는 풍부도를 나타내는 분자 또는 단편이다. 이 실시양태에 따라, 본 발명의 바이오마커 프로필은 바이오마커를 검출하기 위한 당업자에게 공지된 임의의 표준 검정법을 이용하거나 본원에 기재된 검정법으로 얻어질 수 있다. 그러한 검정법은, 예를 들어 특정 유전자 또는 관심있는 유전자의 대립유전자 (예를 들어, 표 J에 개시된 유전자)의 발현 생성물 (예를 들어, 핵산 및/또는 단백질)의 검출을 가능하게 한다. 한 실시양태에서, 그러한 검정법은 핵산 미세배열을 이용한다. 특정 실시양태에서, 바이오마커 프로필은 표 J로부터의 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40개 이상의 상이한 바이오마커를 포함한다.
특정 실시양태에서, 바이오마커 프로필은 표 K의 칼럼 3 또는 4에 열거된 상응하는 바이오마커의 특성을 각각 나타내는 3개 이상의 특성을 포함한다. 한 실시양태에서, 바이오마커 프로필은 표 K의 칼럼 3 또는 4에 열거된 3개 이상의 상이한 바이오마커를 포함한다. 그러한 한 실시양태에서, 바이오마커 프로필은 3개 이상의 바이오마커에 대해 각각 상응하는 특성을 포함할 수 있다. 일반적으로, 2개 또는 3개 이상의 바이오마커는 2개 또는 3개 이상의 상이한 유전자로부터 각각 유래한다. 2개 또는 3개 이상의 상이한 바이오마커 중 1개의 바이오마커가 표 K의 칼럼 3에 열거되는 경우, 바이오마커는, 예를 들어 열거된 유전자에 의해 제조된 전사체, 그의 상보체, 그의 스플라이스 변이체, 그의 스플라이스 변이체의 상보체, 또는 상기 중 임의의 것의 구별가능한 단편 또는 상보체, 상기 중 임의의 것의 cDNA, 상기 cDNA의 구별가능한 단편, 또는 상기 전사체 또는 그의 상보체의 전부 또는 일부에 상응하는 구별가능한 증폭된 핵산 분자, 또는 상기 유전자에 의해 코딩된 단백질, 또는 상기 단백질의 구별가능한 단편, 또는 상기 중 임의의 것의 지시일 수 있다. 또한, 바이오마커는, 예를 들어 표 K의 칼럼 4에 열거된 단백질, 또는 상기 단백질의 구별가능한 단편, 또는 상기 중 임의의 것의 지시일 수 있다. 여기서, 구별가능한 분자 또는 단편은 검출되는 경우, 상기 확인된 전사체, cDNA, 증폭된 핵산, 그의 스플라이스 변이체 또는 단백질의 존재 또는 풍부도를 나타내는 분자 또는 단편이다. 이 실시양태에 따라, 본 발명의 바이오마커 프로필은 바이오마커를 검출하기 위한 당업자에게 공지된 임의의 표준 검정법을 이용하거나 본원에 기재된 검정법으로 얻어질 수 있다. 그러한 검정법은, 예를 들어 특정 유전자 또는 관심있는 유전자의 대립유전자 (예를 들어, 표 K에 개시된 유전자)의 발현 생성물 (예를 들어, 핵산 및/또는 단백질)의 검출을 가능하게 한다. 한 실시양태에서, 그러한 검정법은 핵산 미세배열을 이용한다. 특정 실시양태에서, 바이오마커 프로 필은 표 K로부터의 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 상이한 바이오마커를 포함한다.
본 발명의 방법은 SIRS 대상에서 패혈증 발병의 검출 또는 예측에 특히 유용하지만, 당업자는 본 방법이 비제한적으로, SIRS를 앓을 수 있거나 패혈증의 임의의 병기에 있는 대상을 비롯한 임의의 대상에 대해 이용될 수 있음을 이해할 것이다. 예를 들어, 생물학적 샘플은 대상으로부터 얻고, 샘플에서의 바이오마커의 프로필은 수가지 상이한 유형의 훈련 집단으로부터 얻은 바이오마커 프로필의 견지에서 평가될 수 있다. 대표적인 훈련 집단은, 예를 들어 SIRS-음성인 대상을 포함하는 집단, SIRS-양성인 대상을 포함하는 집단, 및/또는 패혈증의 특정 병기에 있는 대상을 포함하는 집단을 다양하게 포함한다. 이들 상이한 훈련 집단의 각각의 견지에서 바이오마커 프로필의 평가는 시험 대상이 SIRS-음성인지, SIRS-양성인지, 패혈증에 걸릴 것 같은지, 또는 패혈증의 특정 병기를 갖는지 결정하기 위해 이용될 수 있다. 본 발명의 방법에 의한 진단에 기초하여, 적절한 치료 처방을 개시할 수 있다.
특정 실시양태에서, 본 발명은 또한 대상에서 패혈증 또는 SIRS 발병을 진단 또는 예측하는 데 유용한 키트를 제공한다 (하기 섹션 5.3 참조). 본 발명의 키트는 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 96, 100, 105, 110, 115, 120, 125, 130, 135, 140, 145, 150, 155, 160, 165, 170, 175, 180, 185, 190, 195 또는 200개 이상의 바이오마커 및/또는 그러한 바이오마커의 존재 또는 풍부도를 검출하기 위해 사용되는 시약을 포함한다. 특정 실시양태에서, 각각의 이들 바이오마커는 표 30에 나와있다. 특정 실시양태에서, 각각의 이들 바이오마커는 표 31에 나와있다. 특정 실시양태에서, 각각의 이들 바이오마커는 표 32에 나와있다. 특정 실시양태에서, 각각의 이들 바이오마커는 표 33에 나와있다. 특정 실시양태에서, 각각의 이들 바이오마커는 표 36에 나와있다. 특정 실시양태에서, 각각의 이들 바이오마커는 도 39, 도 43, 도 52, 도 53, 또는 도 56에 나와있다. 다른 실시양태에서, 본 발명의 키트는 2개 이상, 또는 수백개 이상만큼 많은 바이오마커 및/또는 그러한 바이오마커의 존재 또는 풍부도를 검출하기 위해 사용되는 시약을 포함한다.
특정 실시양태에서, 본 발명의 키트는 본 발명의 바이오마커와 특이적으로 결합하는 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 96, 100, 105, 110, 115, 120, 125, 130, 135, 140, 145, 150, 155, 160, 165, 170, 175, 180, 185, 190, 195 또는 200개 이상의 시약을 포함한다. 예를 들어, 그러한 키트는 본 발명의 바이오마커와 특이적으로 결합하는 핵산 분자 및/또는 항체 분자를 포함할 수 있다.
본 발명에 유용한 특정 예시적 바이오마커는 섹션 5.6, 섹션 5.11, 뿐만 아니라 섹션 6의 표 30, 31, 32, 34 및 36에 기재되어 있다. 상기 키트의 바이오마커는 본 발명에 따른 바이오마커 프로필을 생성하기 위해 사용될 수 있다. 그러한 키트 내의 바이오마커 및/또는 시약 유형의 예에는 비제한적으로, 단백질 및 그의 단편, 펩티드, 폴리펩티드, 항체, 프로테오글리칸, 당단백질, 지단백질, 탄수화물, 지질, 핵산 (mRNA, DNA, cDNA), 유기 및 무기 화학물질, 및 천연 및 합성 중합체 또는 그의 구별가능한 분자 또는 단편이 포함된다.
특정 실시양태에서, 본 발명은 또한 대상에서 패혈증 또는 SIRS의 발병을 진단 또는 예측하는 데 유용한 다른 키트를 제공한다 (하기 섹션 5.3 참조). 본 발명의 키트는 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50개 이상의 바이오마커를 포함한다. 특정 실시양태에서, 각각의 이들 바이오마커는 표 I에 나와있다. 특정 실시양태에서, 각각의 이들 바이오마커는 표 J에 나와있다. 특정 실시양태에서, 각각의 이들 바이오마커는 표 K에 나와있다. 특정 실시양태에서, 각각의 이들 바이오마커는 표 I 또는 표 30에서 찾을 수 있다. 특정 실시양태에서, 각각의 이들 바이오마커는 표 I 또는 표 31에서 찾을 수 있다. 특정 실시양태에서, 각각의 이들 바이오마커는 도 39, 도 43, 도 52, 도 53 또는 도 56에 나와있다. 다른 실시양태에서, 본 발명의 키트는 2개 이상, 또는 50개 이상만큼 많은 바이오마커를 포함한다. 특정 실시양태에서, 본 발명의 키트는 본 발명의 바이오마커와 특이적으로 결합하는 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 96, 100, 105, 110, 115, 120, 125, 130, 135, 140, 145, 150, 155, 160, 165, 170, 175, 180, 185, 190, 195 또는 200개 이상의 시약을 포함한다. 본 발명에서 유용한 특정 바이오마커는 섹션 5.6, 섹션 5.11, 뿐만 아니라 표 I, J, K, L, M, N 및 O에 기재되어 있다. 상기 키트의 바이오마커 는 본 발명에 따른 바이오마커 프로필을 생성하기 위해 사용될 수 있다. 상기 키트의 화합물 부류의 예에는 비제한적으로, 단백질 및 그의 단편, 펩티드, 폴리펩티드, 프로테오글리칸, 당단백질, 지단백질, 탄수화물, 지질, 핵산 (mRNA, DNA, cDNA), 유기 및 무기 화학물질, 및 천연 및 합성 중합체 또는 그의 구별가능한 분자 또는 단편이 포함된다.
본 발명의 또 다른 측면은 시험 대상에서 패혈증 또는 SIRS이 발병할지의 여부를 평가하기 위한 컴퓨터 및 컴퓨터 판독 매체를 포함한다. 예를 들어, 본 발명의 한 실시양태는 컴퓨터 시스템과 함께 사용하기 위한 컴퓨터 프로그램 제품을 제공한다. 컴퓨터 프로그램 제품은 컴퓨터 판독 저장 매체 및 이에 매입된 컴퓨터 프로그램 메카니즘을 포함한다. 컴퓨터 프로그램 메카니즘은 패혈증을 발병할 위험이 있는 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제1 수치 세트를 만족하는지 평가하기 위한 지침을 포함한다. 제1 수치 세트의 만족은 시험 대상이 패혈증을 발병할 수 있음을 예측한다. 상기 특성은 표 I에 열거된 3개 이상의 바이오마커를 포함하는 다수의 바이오마커의 측정가능한 측면이다. 특정 실시양태에서, 컴퓨터 프로그램 제품은 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제2 수치 세트를 만족하는지 평가하기 위한 지침을 추가로 포함한다. 제2 수치 세트의 만족은 시험 대상이 패혈증을 발병하지 않을 수 있음을 예측한다. 특정 실시양태에서, 바이오마커 프로필은 표 I에 열거된 3개 내지 50개의 바이오마커, 표 I에 열거된 3개 내지 40개의 바이오마커, 표 I에 열거된 4개 이상의 바이오마커, 또는 표 I에 열거된 6개 이상의 바이오마커를 갖는다.
본 발명의 다른 컴퓨터 실시양태는 중앙 처리 장치, 및 중앙 처리 장치에 연결된 메모리를 포함한다. 상기 메모리는 패혈증을 발병할 위험이 있는 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제1 수치 세트를 만족하는지 평가하기 위한 지침을 저장한다. 제1 수치 세트의 만족은 시험 대상이 패혈증을 발병할 수 있음을 예측한다. 상기 특성은 다수의 바이오마커의 측정가능한 측면이다. 이러한 다수의 바이오마커는 표 I로부터의 3개 이상의 바이오마커를 포함한다. 특정 실시양태에서, 상기 메모리는 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제2 수치 세트를 만족하는지 평가하기 위한 지침을 추가로 저장하며, 여기서 제2 수치 세트를 만족하는 것은 시험 대상이 패혈증을 발병하지 않을 수 있음을 예측한다. 특정 실시양태에서, 바이오마커 프로필은 표 I에 열거된 3개 내지 50개의 바이오마커, 표 I에 열거된 3개 내지 40개의 바이오마커, 표 I에 열거된 4개 이상의 바이오마커, 또는 표 I에 열거된 8개 이상의 바이오마커로 구성된다.
본 발명에 따른 다른 컴퓨터 실시양태는 대상이 패혈증을 발병할 수 있는지 결정하기 위한 컴퓨터 시스템을 포함한다. 상기 컴퓨터 시스템은 중앙 처리 장치, 및 중앙 처리 장치에 연결된 메모리를 포함한다. 상기 메모리는 시험 대상의 바이오마커 프로필을 얻기 위한 지침을 저장한다. 바이오마커 프로필은 다수의 특성을 포함한다. 다수의 바이오마커는 표 I에 열거된 3개 이상의 바이오마커를 포함한다. 상기 메모리는 바이오마커 프로필을 리모트 컴퓨터로 전송하기 위한 지침을 추가로 포함한다. 상기 리모트 컴퓨터는 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제1 수치 세트를 만족하는지 평가하기 위한 지침을 포함한다. 제1 수 치 세트의 만족은 시험 대상이 패혈증을 발병할 수 있음을 예측한다. 상기 메모리는 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제1 수치 세트를 만족하는지에 대한 결정을 리모트 컴퓨터로부터 수신하기 위한 지침을 추가로 포함한다. 상기 메모리는 또한 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제1 수치 세트를 만족하는지 보고하기 위한 지침을 포함한다. 특정 실시양태에서, 상기 리모트 컴퓨터는 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제2 수치 세트를 만족하는지 평가하기 위한 지침을 추가로 포함한다. 제2 수치 세트의 만족은 시험 대상이 패혈증을 발병하지 않을 수 있음을 예측한다. 그러한 실시양태에서, 상기 메모리는 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제2 수치를 만족하는지에 대한 결정을 리모트 컴퓨터로부터 수신하기 위한 지침뿐만 아니라, 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제2 수치 세트를 만족하는지 보고하기 위한 지침을 추가로 포함한다. 특정 실시양태에서, 다수의 바이오마커는 표 I에 열거된 4개 이상의 바이오마커를 포함한다. 특정 실시양태에서, 다수의 바이오마커는 표 I에 열거된 6개 이상의 바이오마커를 포함한다.
본 발명의 또 다른 실시양태는 바이오마커 프로필에서의 각각의 다수의 특성에 대한 각각의 수치를 포함한 반송파에서 구현된 디지털 신호를 포함한다. 상기 특성은 다수의 바이오마커의 측정가능한 측면이다. 다수의 바이오마커는 표 I에 열거된 3개 이상의 바이오마커를 포함한다. 특정 실시양태에서, 다수의 바이오마커는 표 I에 열거된 4개 이상의 바이오마커를 포함한다. 특정 실시양태에서, 다수의 바이오마커는 표 I에 열거된 8개 이상의 바이오마커를 포함한다.
본 발명의 또 다른 측면은 시험 대상의 바이오마커 프로필에서의 다수의 특성이 수치 세트를 만족하는지에 대한 결정을 포함하는 반송파에서 구현된 디지털 신호를 제공한다. 상기 특성은 다수의 바이오마커의 측정가능한 측면이다. 이러한 다수의 바이오마커는 표 I에 열거된 3개 이상의 바이오마커를 포함한다. 수치 세트를 만족하는 것은 시험 대상이 패혈증을 발병할 수 있음을 예측한다. 특정 실시양태에서, 다수의 바이오마커는 표 I에 열거된 4개 이상의 바이오마커를 포함한다. 특정 실시양태에서, 다수의 바이오마커는 표 I에 열거된 8개 이상의 바이오마커를 포함한다.
또 다른 실시양태는 시험 대상의 바이오마커 프로필에서의 다수의 특성이 수치 세트를 만족하는지에 대한 결정을 포함하는 반송파에서 구현된 디지털 신호를 제공한다. 상기 특성은 다수의 바이오마커의 측정 가능한 측면이다. 다수의 바이오마커는 표 I에 열거된 3개 이상의 바이오마커를 포함한다. 수치 세트의 만족은 시험 대상이 패혈증을 발병하지 않을 수 있음을 예측한다. 특정 실시양태에서, 다수의 바이오마커는 표 I에 열거된 4개 이상의 바이오마커를 포함한다. 특정 실시양태에서, 다수의 바이오마커는 표 I에 열거된 8개 이상의 바이오마커를 포함한다.
본 발명의 또 다른 실시양태는 대상이 패혈증을 발병할 수 있는지 결정하기 위한 그래픽 사용자 인터페이스를 제공한다. 상기 그래픽 사용자 인터페이스는 리모트 컴퓨터로부터 수신된 반송파에서 구현된 디지털 신호로 코딩된 결과를 보여주기 위한 디스플레이 필드를 포함한다. 상기 특성은 다수의 바이오마커의 측정가능한 측면이다. 다수의 바이오마커는 표 I에 열거된 3개 이상의 바이오마커를 포함 한다. 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제1 수치 세트를 만족하는 경우에 상기 결과는 제1 수치를 갖는다. 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제2 수치 세트를 만족하는 경우에 상기 결과는 제2 수치를 갖는다. 특정 실시양태에서, 다수의 바이오마커는 표 I에 열거된 4개 이상의 바이오마커를 포함한다. 특정 실시양태에서, 다수의 바이오마커는 표 I에 열거된 8개 이상의 바이오마커를 포함한다.
본 발명의 또 다른 측면은 대상이 패혈증을 발병할지의 여부를 결정하기 위한 컴퓨터 시스템을 제공한다. 상기 컴퓨터 시스템은 중앙 처리 장치, 및 중앙 처리 장치에 연결된 메모리를 포함한다. 상기 메모리는 시험 대상의 바이오마커 프로필을 얻기 위한 지침을 저장한다. 바이오마커 프로필은 다수의 특성을 포함한다. 상기 특성은 다수의 바이오마커의 측정가능한 측면이다. 다수의 바이오마커는 표 I에 열거된 3개 이상의 바이오마커를 포함한다. 상기 메모리는 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제1 수치 세트를 만족하는지 평가하기 위한 지침을 추가로 저장한다. 제1 수치 세트를 만족하는 것은 시험 대상이 패혈증을 발병할 수 있음을 예측한다. 상기 메모리는 또한 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제1 수치 세트를 만족하는지 보고하기 위한 지침을 저장한다. 특정 실시양태에서, 다수의 바이오마커는 표 I에 열거된 4개 이상의 바이오마커를 포함한다. 특정 실시양태에서, 다수의 바이오마커는 표 I에 열거된 8개 이상의 바이오마커를 포함한다.
4. 도면의 간단한 설명
도 1은 본 발명의 실시양태에 따라 훈련 집단으로부터 얻은 T-36 정적 데이터 (static data)를 이용하여 패혈증의 발병을 특성으로 하는 SIRS 표현형 상태와 패혈증의 부재를 특성으로 하는 SIRS 표현형 상태를 구별하기 위한 분류 및 회귀계통도를 도시한다.
도 2는 본 발명의 실시양태에 따라 훈련 집단으로부터 얻은 T-36 정적 데이터를 통해 도 1의 의사결정계통도에서 사용한 5개의 바이오마커에 대한 특성 수치의 분포를 나타낸다. 상기 바이오마커는 표 30에 제시된 그의 상응하는 아피메트릭스 (Affymetrix) U133 플러스 2.0 프로브세트 명칭으로 언급된다.
도 3은 본 발명의 실시양태에 따라 훈련 집단으로부터 얻은 T-36 정적 데이터에 기초한 랜덤 포레스트 (Random Forest) 방법을 이용하여 의사결정계통도를 훈련하는 데 사용한 500개의 계통도의 총체적 정확도, 민감도, 및 특이도를 도시한다.
도 4는 도 3의 계통도를 이용하여 훈련된 의사결정 규칙에서의 바이오마커 중요도를 도시한다.
도 5는 훈련 집단으로부터 얻은 T-36 정적 데이터를 통해 본 발명의 바이오마커를 이용한 미세배열의 예측적 분석 (PAM)으로 전개한 의사결정 규칙의 95% 신뢰 구간 막대를 갖는 총체적 정확도, 특이도, 및 민감도를 도시한다.
도 6은 훈련 집단으로부터 얻은 T-36 정적 데이터를 이용한 PAM으로 확인된 각각의 판별력 정도에 따라 순서대로 정렬한 바이오마커의 목록이다. 상기 바이오마커는 표 30에 제시된 이들의 상응하는 아피메트릭스 U133 플러스 2.0 프로브세트 명칭으로 언급된다.
도 7은 훈련 집단으로부터 얻은 T-36 정적 데이터에 대한 95% 신뢰 구간을 갖는 CART, PAM, 및 랜덤 포레스트 분류 알고리즘 수행 데이터를 도시한다.
도 8은 훈련 집단으로부터 얻은 T-36 정적 데이터에 대해 (i) CART, (ii) PAM, (iii) 랜덤 포레스트, 및 (iv) 윌콕슨 (Wilcoxon) (조정된) 시험을 이용하여 개발한 의사결정 규칙을 통해 공통의 바이오마커가 중요하다고 밝혀진 횟수를 도시한다.
도 9는 훈련 집단으로부터 얻은 T-36 정적 데이터에 대한 바이오마커의 총체적 순위를 도시한다. 상기 바이오마커는 표 30에 제시된 이들의 상응하는 아피메트릭스 U133 플러스 2.0 프로브세트 명칭으로 언급된다.
도 10은 본 발명의 실시양태에 따라 훈련 집단으로부터 얻은 T-12 정적 데이터를 이용한 데이터를 이용하여 패혈증의 발병을 특성으로 하는 SIRS 표현형 상태와 패혈증의 부재를 특성으로 하는 SIRS 표현형 상태를 구별하기 위한 분류 및 회귀계통도를 도시한다.
도 11은 본 발명의 실시양태에 따라 훈련 집단으로부터 얻은 T-12 정적 데이터를 이용하여, 도 10의 의사결정계통도에서 사용한 4개의 바이오마커에 대한 특성 수치의 분포를 제시한다. 상기 바이오마커는 표 30에 제시된 이들의 상응하는 아피메트릭스 U133 플러스 2.0 프로브세트 명칭으로 언급된다.
도 12는 본 발명의 실시양태에 따라 훈련 집단으로부터 얻은 T-12 정적 데이터를 기초로 랜덤 포레스트 방법을 이용하여 의사결정계통도를 훈련하기 위해 사용된 500개의 계통도의 총체적 정확도, 민감도, 및 특이도를 도시한다.
도 13은 도 12의 계통도를 이용하여 훈련된 의사결정 규칙에서의 바이오마커 중요도를 도시한다. 상기 바이오마커는 표 30에 제시된 이들의 상응하는 아피메트릭스 U133 플러스 2.0 프로브세트 명칭으로 언급된다.
도 14는 훈련 집단으로부터 얻은 T-12 정적 데이터를 이용한 다중 부가 회귀계통도 (MART) 접근법에 의해 결정된, 합이 100%인 바이오마커 중요도의 계산을 도시한다. 상기 바이오마커는 표 30에 제시된 이들의 상응하는 아피메트릭스 U133 플러스 2.0 프로브세트 명칭으로 언급된다.
도 15는 훈련 집단으로부터 얻은 T-12 정적 데이터를 이용하여 패혈증 및 SIRS 군 사이에서 도 14에서 도시된 MART 접근법에 의해 선택된 바이오마커의 특성 수치의 분포를 도시한다. 상기 바이오마커는 표 30에 제시된 이들의 상응하는 아피메트릭스 U133 플러스 2.0 프로브세트 명칭으로 언급된다.
도 16은 훈련 집단으로부터 얻은 T-12 정적 데이터를 이용하여 본 발명의 바이오마커를 사용한 미세배열의 예측적 분석 (PAM)으로 개발한 의사결정 규칙의 95% 신뢰 구간 막대를 갖는 총체적 정확도, 특이도, 및 민감도를 도시한다.
도 17은 훈련 집단으로부터 얻은 T-12 정적 데이터를 이용하여 PAM에 의해 확인된 이들의 각각의 판별력 정도에 따라 순서대로 정렬한 바이오마커의 목록이다. 상기 바이오마커는 표 30에 제시된 이들의 상응하는 아피메트릭스 U133 플러스 2.0 프로브세트 명칭으로 언급된다.
도 18은 훈련 집단으로부터 얻은 T-12 정적 데이터를 이용하여 95% 신뢰 구간을 갖는 개략적인 CART, MART, PAM, 및 랜덤 포레스트 (RF) 분류 알고리즘 (의사결정 규칙) 수행도를 제공한다.
도 19는 훈련 집단으로부터 얻은 T-12 정적 데이터를 이용한 (i) CART, (ii) MART, (iii) PAM, (iv) 랜덤 포레스트, 및 (v) 윌콕슨 (조정된) 시험을 이용하여 개발한 의사결정 규칙을 통해 공통의 바이오마커가 중요하다고 밝혀진 횟수를 도시한다. 상기 바이오마커는 표 30에 제시된 이들의 상응하는 아피메트릭스 U133 플러스 2.0 프로브세트 명칭으로 언급된다.
도 20은 훈련 집단으로부터 얻은 T-12 정적 데이터를 이용하여 바이오마커의 총체적 순위를 도시한다.
도 21은 본 발명의 실시양태에 따라 훈련 집단으로부터 얻은 T-12 기저선 데이터를 이용하여 패혈증의 발병을 특성으로 하는 SIRS 표현형 상태와 패혈증의 부재를 특성으로 하는 SIRS 표현형 상태를 구별하기 위한 분류 및 회귀계통도를 도시한다.
도 22는 본 발명의 실시양태에 따라 훈련 집단으로부터 얻은 T-12 기저선 데이터를 이용하여 도 21의 의사결정계통도에서 사용한 5개의 바이오마커의 특성 수치의 분포를 제시한다. 상기 바이오마커는 표 30에 제시된 이들의 상응하는 아피메트릭스 U133 플러스 2.0 프로브세트 명칭으로 언급된다.
도 23은 본 발명의 실시양태에 따라 훈련 집단으로부터 얻은 T-12 기저선 데이터를 이용한 랜덤 포레스트 방법을 이용하여 의사결정계통도를 훈련하는 데 사용한 500개의 계통도의 총체적 정확도, 민감도, 및 특이도를 도시한다.
도 24는 도 23의 계통도를 이용하여 훈련된 의사결정 규칙에서의 바이오마커 중요도를 도시한다. 상기 바이오마커는 표 30에 제시된 이들의 상응하는 아피메트릭스 U133 플러스 2.0 프로브세트 명칭으로 언급된다.
도 25는 본 발명의 선택된 바이오마커 및 훈련 집단으로부터 얻은 T-12 기저선 데이터를 이용한 미세배열의 예측적 분석 (PAM)으로 개발한 의사결정 규칙의 95% 신뢰 구간 막대를 갖는 총체적 정확도, 특이도, 및 민감도를 도시한다.
도 26은 훈련 집단으로부터 얻은 T-12 기저선 데이터를 이용한 PAM에 의해 확인된 이들의 각각의 판별력 정도에 따라 순서대로 정렬한 바이오마커의 목록이다. 상기 바이오마커는 표 30에 제시된 이들의 상응하는 아피메트릭스 U133 플러스 2.0 프로브세트 명칭으로 언급된다.
도 27은 본 발명의 실시양태에 따라 훈련 집단으로부터 얻은 T-12 기저선 데 이터를 이용하여, 95% 신뢰 구간을 갖는 CART, PAM, 및 랜덤 포레스트 분류 알고리즘 (의사결정 규칙) 수행 데이터를 도시한다.
도 28은 훈련 집단으로부터 얻은 T-12 기저선 데이터를 이용한 (i) CART, (ii) PAM, (iii) 랜덤 포레스트, 및 (iv) 윌콕슨 (조정된) 시험을 이용하여 개발한 의사결정 규칙을 통해 공통의 바이오마커가 중요하다고 밝혀진 횟수를 도시한다.
도 29는 훈련 집단으로부터 얻은 T-12 기저선 데이터를 이용해서 얻은 데이터에 대한 바이오마커의 총체적 순위를 도시한다. 상기 바이오마커는 표 30에 제시된 이들의 상응하는 아피메트릭스 U133 플러스 2.0 프로브세트 명칭으로 언급된다.
도 30은 본 발명의 실시양태에 따라 훈련 집단으로부터 얻은 데이터를 이용하여 한정된 기간 동안 패혈증에 걸릴 대상과 한정된 기간 동안 패혈증에 걸리지 않을 대상을 구별하는 바이오마커를 확인하기 위해 적용하는 필터를 도시한다. 바이오마커의 다른 조합은, 예를 들어 섹션 5.3 및 섹션 6을 비롯한 본원에 개시되어 있다.
도 31은 훈련 집단을 통해 RT-PCR에 의해 결정된 바와 같은 IL18R1 발현, 및 아피메트릭스 U133 플러스 2.0 미세배열 측정을 이용하여 결정된 바와 같은 X206618_at 프로브세트의 강도 간의 관계를 제시한다.
도 32는 훈련 집단을 통해 RT-PCR에 의해 결정된 바와 같은 FCGR1A 발현, 및 아피메트릭스 U133 플러스 2.0 미세배열 측정을 이용하여 결정된 바와 같은X214511_x_at, X216950_s_at 및 X216951_at 프로브세트의 강도 간의 관계를 제시한 다.
도 33은 훈련 집단을 통해 RT-PCR에 의해 결정된 바와 같은 MMP9 발현, 및 아피메트릭스 U133 플러스 2.0 미세배열 측정을 이용하여 결정된 바와 같은 X203936_s_at 프로브세트의 강도 간의 관계를 제시한다.
도 34는 훈련 집단을 통해 RT-PCR에 의해 결정된 바와 같은 CD86 발현, 및 아피메트릭스 U133 플러스 2.0 미세배열 측정을 이용하여 결정된 바와 같은 X205685_at, X205686_s_at, 및 X210895_s_at 프로브세트의 강도 간의 관계를 제시한다.
도 35는 본 발명에 따른 컴퓨터 시스템을 제시한다.
도 36은 본 발명의 실시양태에 따라 RT-PCR 발견 훈련 집단으로부터 얻은 T-12 정적 데이터를 이용하여 패혈증의 발병을 특성으로 하는 SIRS 표현형 상태와 패혈증의 부재를 특성으로 하는 SIRS 표현형 상태를 구별하기 위한 분류 및 회귀계통도를 도시한다.
도 37은 본 발명의 실시양태에 따라 RT-PCR 발견 훈련 집단으로부터 얻은 T-12 정적 데이터를 통해 도 36의 의사결정계통도에서 사용한 7개의 바이오마커에 대한 특성 수치의 분포를 제시한다.
도 38은 본 발명의 실시양태에 따라 RT-PCR 발견 훈련 집단으로부터 얻은 T-12 정적 데이터를 기초로 한 랜덤 포레스트 방법을 이용하여 의사결정계통도를 훈련 하기 위해 사용한 462개의 계통도의 총체적 정확도, 민감도, 및 특이도를 도시한다.
도 39는 도 38의 계통도를 이용하여 훈련된 의사결정 규칙에서의 바이오마커 중요도를 도시한다.
도 40은 RT-PCR 발견 훈련 집단으로부터 얻은 T-12 정적 데이터를 이용한 다중 부가 회귀계통도 (MART) 접근법에 의해 결정된, 합이 100%인 바이오마커 중요도의 계산을 도시한다.
도 41은 RT-PCR 발견 훈련 집단으로부터 얻은 T-12 정적 데이터를 이용하여 패혈증 및 SIRS 군 사이에서 도 40에 도시된 MART 접근법에 의해 선택된 바이오마커의 특성 수치의 분포를 도시한다.
도 42는 RT-PCR 발견 훈련 집단으로부터 얻은 T-12 정적 데이터를 이용하여 본 발명의 바이오마커를 사용한 미세배열의 예측적 분석 (PAM)으로 발달한 의사결정 규칙의 95% 신뢰 구간 막대를 갖는 총체적 정확도, 특이도, 및 민감도를 도시한다.
도 43은 RT-PCR 발견 훈련 집단으로부터 얻은 T-12 정적 데이터를 이용하여 PAM에 의해 확인된 이들의 각각 판별력 정도에 따라 순서대로 정렬한 바이오마커의 목록이다.
도 44는 RT-PCR 발견 훈련 집단으로부터 얻은 T-12 정적 데이터를 이용한 95 % 신뢰 구간을 갖는 개략적 CART, MART, PAM, 및 랜덤 포레스트 (RF) 분류 알고리즘 (의사결정 규칙) 수행도를 제공한다.
도 45는 도 44에 약술된 의사결정 규칙 수행에 기초하여 선택된 50개의 선택적 바이오마커를 확인하였다.
도 46은 아피메트릭스 유전자 칩 발견 훈련 집단으로부터 얻은 T-12 정적 데이터를 이용하여 95% 신뢰 구간을 갖는 개략적 CART, MART, PAM, 및 랜덤 포레스트 (RF) 분류 알고리즘 (의사결정 규칙) 수행도를 제공한다.
도 47은 RT-PCR 확인 훈련 집단으로부터 얻은 T-12 정적 데이터를 이용한 95% 신뢰 구간을 갖는 개략적 CART, MART, PAM, 및 랜덤 포레스트 (RF) 분류 알고리즘 (의사결정 규칙) 수행도를 제공한다.
도 48은 아피메트릭스 유전자 칩 확인 훈련 집단 및 RT-PCR 확인 훈련 집단의 조합된 풀로부터 얻은 T-12 정적 데이터를 이용한 95% 신뢰 구간을 갖는 개략적 CART, MART, PAM, 및 랜덤 포레스트 (RF) 분류 알고리즘 (의사결정 규칙) 수행도를 제공한다.
도 49는 본 발명의 실시양태에 따라 비드-기재 단백질 발견 훈련 집단으로부터 얻은 T-12 정적 데이터를 이용하여 패혈증의 발병을 특성으로 하는 SIRS 표현형 상태와 패혈증의 부재를 특성으로 하는 SIRS 표현형 상태를 판별하기 위한 분류 및 회귀계통도를 도시한다.
도 50은 본 발명의 실시양태에 따라 비드-기재 단백질 발견 훈련 집단으로부 터 얻은 T-12 정적 데이터를 통해 도 49의 의사결정계통도에서 사용한 10개의 바이오마커에 대한 특성 수치의 분포를 제시한다.
도 51은 본 발명의 실시양태에 따른 비드-기재 단백질 발견 훈련 집단으로부터 얻은 T-12 정적 데이터를 기초로 한 랜덤 포레스트 방법을 이용하여 의사결정계통도를 훈련하기 위해 사용한 64개의 계통도의 총체적 정확도, 민감도, 및 특이도를 도시한다.
도 52는 도 51의 계통도를 이용하여 훈련된 의사결정 규칙에서의 바이오마커 중요도를 도시한다.
도 53은 본 발명의 실시양태에 따른 비드-기재 단백질 발견 훈련 집단으로부터 얻은 T-12 정적 데이터를 이용한 다중 부가 회귀계통도 (MART) 접근법에 의해 결정된, 합이 100%인 바이오마커 중요도의 계산을 도시한다.
도 54는 본 발명의 실시양태에 따라 비드-기재 단백질 발견 훈련 집단으로부터 얻은 T-12 정적 데이터를 이용하여 패혈증 및 SIRS 군 사이에서 도 53에 도시된 MART 접근법에 의해 선택된 바이오마커의 특성 수치의 분포를 도시한다.
도 55는 본 발명의 실시양태에 따라 비드-기재 단백질 발견 훈련 집단으로부터 얻은 T-12 정적 데이터를 이용하여 본 발명의 바이오마커를 사용한 미세배열의 예측적 분석 (PAM)으로 개발한 의사결정 규칙의 95% 신뢰 구간 막대를 갖는 총체적 정확도, 특이도, 및 민감도를 도시한다.
도 56은 본 발명의 실시양태에 따라 비드-기재 단백질 발견 훈련 집단으로부터 얻은 T-12 정적 데이터를 이용하여 PAM에 의해 확인된 이들의 각각의 판별력 정도에 따라 순서대로 정렬한 바이오마커의 목록이다 .
도 57은 본 발명의 실시양태에 따라 비드-기재 단백질 발견 훈련 집단으로부터 얻은 T-12 정적 데이터를 이용하여 95% 신뢰 구간을 갖는 개략적 CART, MART, PAM, 및 랜덤 포레스트 (RF) 분류 알고리즘 (의사결정 규칙) 수행도를 제공한다.
도 58은 본 발명의 실시양태에 따라 비드-기재 단백질 발견 훈련 집단으로부터 얻은 T-12 정적 데이터를 이용한 (i) CART, (ii) MART, (iii) PAM, (iv) 랜덤 포레스트, 및 (v) 윌콕슨 (조정된) 시험을 이용하여 개발한 의사결정 규칙을 통해 공통의 바이오마커가 중요하다고 밝혀진 횟수를 도시한다.
도 59는 본 발명의 실시양태에 따라 비드-기재 단백질 확인 훈련 집단으로부터 얻은 T-12 정적 데이터를 이용하여 95% 신뢰 구간을 갖는 개략적 CART, MART, PAM, 및 랜덤 포레스트 (RF) 분류 알고리즘 (의사결정 규칙) 수행도를 제공한다.
도 60은 본 발명의 실시양태에 따라 T-12 핵산 데이터를 이용하여 표 J로부터의 24개 하위조합물 군 각각의 패혈증 예측 정확도를 막대 그래프 방식으로 플롯팅한다.
도 61은 본 발명의 실시양태에 따라 T-12 핵산 데이터를 이용하여 표 J로부터의 총 4800개 하위조합물에 대해 24개 하위조합물 군에서 각각의 개별적 하위조합 물의 패혈증 예측 수행 (정확도)을 플롯팅한다.
도 62는 본 발명의 실시양태에 따라 T-12 단백질 데이터를 이용하여 표 K로부터의 8개 하위조합물 군 각각의 패혈증 예측 정확도를 막대 그래프 방식으로 플롯팅한다.
도 63은 본 발명의 실시양태에 따라 T-12 단백질 데이터를 이용하여 표 K로부터의 총 1600개 하위조합물에 대해 8개 하위조합물 군에서 각각의 개별적 하위조합물의 패혈증 예측 수행 (정확도)을 플롯팅한다.
도 64는 본 발명의 실시양태에 따라 T-36 단백질 데이터를 이용하여 표 K로부터의 8개 하위조합물 군 각각의 패혈증 예측 정확도를 막대 그래프 방식으로 플롯팅한다.
도 65는 본 발명의 실시양태에 따라 T-36 단백질 데이터를 이용하여 표 K로부터의 총 1600개 하위조합물에 대해 8개 하위조합물 군에서 각각의 개별적 하위조합물의 패혈증 예측 수행 (정확도)을 플롯팅한다.
도 66은 본 발명의 실시양태에 따라 T-36 핵산 데이터를 이용하여 표 J로부터의 23개 하위조합물 군 각각의 패혈증 예측 정확도를 막대 그래프 방식으로 플롯팅한다.
도 67은 본 발명의 실시양태에 따라 T-36 핵산 데이터를 이용하여 표 J로부터의 총 4600개 하위조합물에 대해 23개 하위조합물 군에서 각각의 개별적 하위조합 물의 패혈증 예측 수행 (정확도)을 플롯팅한다.
도 68은 본 발명의 실시양태에 따라 T-12 조합된 단백질 및 핵산 데이터를 이용하여 표 I로부터의 23개 하위조합물 군 각각의 패혈증 예측 정확도를 막대 그래프 방식으로 플롯팅한다.
도 69는 본 발명의 실시양태에 따라 T-12 조합된 단백질 및 핵산 데이터를 이용하여 표 I로부터의 총 4600개 하위조합물에 대해 23개 하위조합물 군에서 각각의 개별적 하위조합물의 패혈증 예측 수행 (정확도)을 플롯팅한다.
도 70은 본 발명의 실시양태에 따라 T-36 조합된 단백질 및 핵산 데이터를 이용하여 표 I로부터의 23개 하위조합물 군 각각의 패혈증 예측 정확도를 막대 그래프 방식으로 플롯팅한다.
도 71은 본 발명의 실시양태에 따라 T-36 조합된 단백질 및 핵산 데이터를 이용하여 표 I로부터의 총 4600개 하위조합물에 대해 23개 하위조합물 군에서 각각의 개별적 하위조합물의 패혈증 예측 수행 (정확도)을 플롯팅한다.
5. 바람직한 실시양태의 상세한 설명
본 발명은 바이오마커 프로필에서의 바이오마커 특성을 평가함으로써 패혈증의 신속하고 정확한 진단 또는 예측을 가능하게 한다. 이들 바이오마커 프로필은 대상이 패혈증을 발병할 위험이 있는 기간 동안 단일 시점 ("스냅샷"), 또는 그러한 다중 시점에서 대상의 하나 이상의 생물학적 샘플로부터 구성될 수 있다. 이롭게는, 패혈증은 전형적인 임상 패혈증 증상의 발병 이전에 진단 또는 예측될 수 있으며, 그럼으로써 치료적 개입을 보다 효과적으로 할 수 있다.
5.1 정의
"전신성 염증 반응 증후군" 또는 "SIRS"는 다양한 중증 임상적 손상에 대한 임상 반응을 나타내며, 이는 24시간 내에 두 가지 이상의 하기 상태에 의해 명백해진다:
ㆍ 체온 38℃ (100.4℉) 초과 또는 36℃ (96.8℉) 미만;
ㆍ 심박수 (HR) 90회 박동/분 초과;
ㆍ 호흡수 (RR) 20회 호흡/분 초과, 또는 PCO2 32 mmHg 미만, 또는 기계적 환기 필요; 및
ㆍ 백혈구 수 (WBC) 12.0 x 109/L 초과 또는 4.0 x 109/L 미만.
SIRS의 이들 증상은 추후에 다른 정의에 의해 변경되거나 대체될 수 있는 SIRS의 합의된 정의를 나타낸다. 본 정의는 현재 임상 실무를 명확히 하기 위해 사용되며, 본 발명의 중요한 측면을 나타내는 것은 아니다 (예를 들어, 전문이 본원에 참고로 포함되는 문헌 [American College of Chest Physicians/Society of Critical Care Medicine Consensus Conference: Definitions for Sepsis and Organ Failure and Guidelines for the Use of Innovative Therapies in Sepsis, 1992, Crit. Care. Med. 20, 864-874] 참조).
SIRS에 걸린 대상은 상기 정의된 바와 같은 SIRS로 분류되나, 임상적으로 패혈증으로 판단되지는 않는 임상적 발현을 나타낸다. 대상이 패혈증 발병 위험이 있는지의 검출 방법은 당업자에게 익히 공지되어 있다. 그러한 대상에는, 예를 들어 ICU에 있는 자, 및 다르게는 생리적 외상, 예컨대 화상, 수술 또는 기타 손상으로 고통받는 자들이 포함된다. SIRS의 특질은 빈맥, 빈호흡 또는 호흡과도, 저혈압, 관류저하, 핍뇨증, 백혈구증가증 또는 백혈구감소증, 발열 또는 저체온증을 특성으로 하고, 부피 주입이 필요한 전염증성 상태의 유발이다. SIRS는 특성적으로 감염 (예를 들어, 균혈증)의 문서화된 공급원을 포함하지 않는다.
"패혈증"은 SIRS 감염과 문서화된 감염에 대한 전신성 숙주 반응을 나타낸다 (예를 들어, 임상적으로 중요한 감염의 후속적인 실험적 확인, 예컨대 유기체에 대해 양성 배양). 따라서, 패혈증은 문서화된 감염에 대한 전신성 염증 반응을 나타낸다 (예를 들어, 전문이 본원에 참고로 포함되는 문헌 [American College of Chest Physicians Society of Critical Care Medicine, Chest, 1997, 101:1644-1655] 참조). 본원에 사용된 "패혈증"에는 비제한적으로, 패혈증의 발병, 중증 패혈증, 패혈성 쇼크 및 패혈증 말기와 관련된 다기관 기능부전 ("MOD")을 비롯한 패혈증의 모든 병기가 포함된다.
"패혈증의 발병"은 패혈증의 초기 병기, 예를 들어 관습적 임상 소견이 패혈증의 임상 의심을 지지하기에 충분한 병기 이전을 나타낸다. 본 발명의 방법은 종래의 기술을 이용하여 패혈증이 의심되는 시기 전에 패혈증을 검출하기 위해 사용하기 때문에, 패혈증의 소견이 임상적으로 보다 명확한 경우에 패혈증 초기의 대상의 질환 상태는 오직 소급적으로만 확인할 수 있다. 대상이 패혈증에 걸리게 되는 정확한 메카니즘은 본 발명의 중요한 측면이 아니다. 본 발명의 방법은 감염 과정의 기원에 상관없이 패혈증의 발병을 검출할 수 있다.
"중증 패혈증"은 장기 기능부전, 관류저하 이상, 또는 패혈증-유도 저혈압과 관련된 패혈증을 나타낸다. 관류저하 이상에는, 비제한적으로 락트산 산증, 핍뇨증, 또는 정신 상태의 급성 변화가 포함된다.
"패혈성 쇼크"는 적합한 정맥내액 챌린지에 대해 반응하지 않으며, 말초 관류저하의 소견이 있는 패혈증-유발 저혈압을 나타낸다.
"전환자" 또는 "전환자 대상"은 대상을 모니터링하는 동안, 전형적으로 ICU 체류 동안 패혈증의 임상적 의심으로 진행하는 SIRS-양성 대상을 나타낸다.
"비-전환자" 또는 "비-전환자 대상"은 대상을 모니터링하는 동안, 전형적으로 ICU 체류 동안 패혈증의 임상적 의심으로 진행하지 않는 SIRS-양성 대상을 나타낸다.
"바이오마커"는 생물학적 샘플에 존재하거나 그로부터 유래한 실질적으로 검출가능한 임의의 화합물, 예컨대 단백질, 펩티드, 프로테오글리칸, 당단백질, 지단백질, 탄수화물, 지질, 핵산 (예를 들어, DNA, 예컨대 cDNA 또는 증폭된 DNA, 또는 RNA, 예컨대 mRNA), 유기 또는 무기 화학물질, 천연 또는 합성 중합체, 소분자 (예를 들어, 대사산물), 또는 상기 중 임의의 것의 구별가능한 분자 또는 구별가능한 단편이다. 본원에서 사용된 "로부터 유래한"은 화합물이 검출되는 경우에 생물학적 샘플에서 존재하는 특정 분자를 나타내는 화합물을 말한다. 예를 들어, 특정 cDNA의 검출은 생물학적 샘플에서 특정 RNA 전사체의 존재를 나타낼 수 있다. 다른 예에서와 같이, 특정 항체의 검출 또는 이와의 결합은 생물학적 샘플에서 특정 항원 (예를 들어, 단백질)의 존재를 나타낼 수 있다. 여기서, 구별가능한 분자 또는 단편은 검출되는 경우에, 상기 확인된 화합물의 존재 또는 풍부도를 나타내는 분자 또는 단편이다.
바이오마커는, 예를 들어 생물학적 샘플로부터 단리되거나, 생물학적 샘플에서 직접 측정되거나, 생물학적 샘플에서 검출되거나, 또는 샘플에 존재하는지 결정될 수 있다. 바이오마커는, 예를 들어 기능성, 부분 기능성, 또는 비-기능성일 수 있다. 본 발명의 한 실시양태에서, 바이오마커를 단리하고 이용하여, 예를 들어 다양한 진단 검정법에서 바이오마커 검출을 촉진할 수 있는 특이적으로 결합하는 항체를 배양할 수 있다. 임의의 면역검정법은 바이오마커 분자와 결합할 수 있는 임의의 항체, 항체 단편 또는 그의 유도체 (예를 들어, Fab, F(ab')2, Fv, 또는 scFv 단편)를 이용할 수 있다. 그러한 면역검정법은 당업계에 익히 공지되어 있다. 또한, 바이오마커가 단백질 또는 그의 단편인 경우에 이는 서열분석할 수 있으며, 그의 코딩된 유전자는 이미 확립된 기술을 이용하여 클로닝할 수 있다.
본원에 사용된 용어 "바이오마커의 종"은 본원에 기재된 바이오마커의 임의의 구별가능한 부분 또는 구별가능한 단편, 예컨대 본원에 기재된 특정 유전자 (예를 들어, 하기 표 30, 또는 표 I, 또는 표 J, 또는 표 K에 열거된 유전자)의 스플라이스 변이체를 나타낸다. 여기서, 구별가능한 부분 또는 구별가능한 단편은 검출되는 경우에 상기 확인된 전사체, cDNA, 증폭된 핵산, 또는 단백질의 존재 또는 풍부도를 나타내는 분자의 부분 또는 단편이다.
본원에 사용된 용어 "단백질", "펩티드", 및 "폴리펩티드"는 다르게 지시하지 않는 한, 상호교환가능하다.
"바이오마커 프로필"은 다수의 1개 이상의 바이오마커 (예를 들어, mRNA 분자, cDNA 분자, 단백질 및/또는 탄수화물 등), 또는 그의 지시를 바이오마커의 측정가능한 측면 (예를 들어, 풍부도)과 같은 특성과 함께 포함한다. 바이오마커 프로필은 2개 이상의 그러한 바이오마커 또는 그의 지시를 포함하며, 여기서 바이오마커는 동일하거나 상이한 부류, 예컨대 핵산 및 탄수화물일 수 있다. 바이오마커 프로필은 또한 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 또는 100개 이상의 바이오마커 또는 그의 지시를 포함할 수 있다. 한 실시양태에서, 바이오마커 프로필은 바이오마커 또는 그의 지시를 수백 또는 수천개도 포함할 수 있다. 바이오마커 프로필은 하나 이상의 대조군 또는 국제 표준을 추가로 포함할 수 있다. 한 실시양태에서, 바이오마커 프로필은 국제 표준인 하나 이상의 바이오마커, 또는 그의 지시를 포함한다. 다른 실시양태에서, 바이오마커 프로필은 1개 이상의 바이오마커의 지시를 포함한다. 본원의 이러한 문맥에서 사용된 용어 "지시"는 단지 바이오마커 프로필이 바이오마커에 대한 기호, 데이터, 약어 또는 기타 유사한 표지를 함유하는 상황을 나타내는 것이지, 바이오마커 분자 물질 그 자체를 나타내는 것이 아니다. 예를 들어, 본 발명의 예시적 바이오마커 프로필은 아피메트릭스 (Santa Clara, California) U133 플러스 2.0 205013_s_at 및 209369_at 프로브세트를 포함하는 것으로 간주한다. 본 발명의 다른 예시적 바이오마커 프로필은 아피메트릭스 (Santa Clara, California) U133 플러스 2.0 205013_s_at 및 209369_at 프로브세트를 얻기 위해 사용된 유전자의 명칭을 포함한다. 본 발명의 또 다른 예시적 바이오마커 프로필에서, 바이오마커 프로필은 205013_s_at 프로브세트가 유래한 유전자의 전사체의 물리적 양, 및 209369_at 프로브세트가 유래한 유전자의 전사체의 물리적 양을 포함한다. 다른 실시양태에서, 바이오마커 프로필은 205013_s_at 프로브세트가 유래한 유전자의 전사체 양의 공칭 지시 및 209369_at 프로브세트가 유래한 유전자의 전사체 양의 공칭 지시를 포함한다. 본 발명의 또 다른 예시적 바이오마커 프로필은 205013_s_at 프로브세트가 유래한 유전자 전사체의 물리적 양이 미세배열에서 제1 프로브 스폿에서 결합하고, 209369_at 프로브세트가 유래한 유전자 전사체의 풍부도가 미세배열에서의 제2 프로브 스폿에 결합한 미세배열을 포함한다. 이러한 마지막 예시적 바이오마커 프로필에서, 프로브 스폿의 20% 이상, 40%, 또는 40% 이상은 표 30에 제시된 프로브세트에서의 서열에 기초한다. 다른 예시적 바이오마커 프로필에서, 프로브 스폿의 20% 이상, 40%, 또는 40% 이상은 표 31에 제시된 프로브세트에서의 서열에 기초한다.
바이오마커 프로필에서 각각의 바이오마커는 상응하는 "특성"을 포함한다. 본원에 사용된 "특성"은 바이오마커의 측정가능한 측면을 나타낸다. 특성은, 예를 들어 예시적 바이오마커 프로필 1에 예시된 바와 같이 대상으로부터의 생물학적 샘플에서 바이오마커의 존재 또는 부재를 포함할 수 있다:
예시적 바이오마커 프로필 1.
바이오마커 특성 샘플에서의 존재 유무
유전자 A의 전사체 존재
유전자 B의 전사체 부재
예시적 바이오마커 프로필 1에서, 유전자 A의 전사체에 대한 특성 수치는 "존재"이고, 유전자 B의 전사체에 대한 특성 수치는 "부재"이다.
특성은, 예를 들어 예시적 바이오마커 프로필 2에 예시된 바와 같이 대상으로부터의 생물학적 샘플에서 바이오마커의 풍부도를 포함할 수 있다:
예시적 바이오마커 프로필 2.
바이오마커 특성 상대적 단위의 샘플에서의 풍부도
유전자 A의 전사체 300
유전자 B의 전사체 400
예시적 바이오마커 프로필 2에서, 유전자 A의 전사체에 대한 특성 수치는 300 단위이고, 유전자 B의 전사체에 대한 특성 수치는 400 단위이다.
특성은 또한 예시적 바이오마커 프로필 3에 예시된 바와 같은 바이오마커의 둘 이상의 측정가능한 측면의 비율일 수 있다:
예시적 바이오마커 프로필 3.
바이오마커 특성 유전자 B의 전사체/유전자 B의 전사체의 풍부도 비율
유전자 A의 전사체 300/400
유전자 B의 전사체
예시적 바이오마커 프로필 3에서, 유전자 A의 전사체에 대한 특성 수치 및 유전자 B의 전사체에 대한 특성 수치는 0.75 (300/400)이다.
특성은 또한 2개의 샘플을 상이한 시점에서 대상으로부터 수집한 경우에 2개의 샘플로부터 얻은 상응하는 바이오마커의 측정가능한 측면 간에 상이할 수 있다. 예를 들어, 바이오마커가 유전자 A의 전사체인 경우에 "측정가능한 측면"은, 예를 들어 RT-PCR 또는 미세배열 분석에 의해 결정된 바와 같이 시험 대상으로부터 얻은 샘플에서 전사체의 풍부도로 고려된다. 이러한 예에서, 유전자 A의 전사체의 풍부도는 제1 샘플 뿐만 아니라 제2 샘플에서도 측정된다. 제1 샘플은 제2 샘플 이전의 다수의 시간에서 시험 대상으로부터 얻는다. 유전자 A에 대한 특성을 컴퓨터로 처리하기 위해, 한 샘플에서 유전자 A의 전사체의 풍부도는 제2 샘플에서의 유전자 A의 전사체의 풍부도에서 뺀다. 특성은 또한 바이오마커의 풍부도가 대상으로부터 얻은 생물학적 샘플에서 시간에 따라 증가하는지에 대한 지시 및/또는 바이오마커의 풍부도가 대상으로부터 얻은 생물학적 샘플에서 시간에 따라 감소하는지에 대한 지시일 수 있다.
특정 실시양태에서, 상기 예시적 바이오마커 프로필 1에 도시된 바와 같이 바이오마커 프로필에서의 특성 및 바이오마커 간에는 일대일 대응이 있다. 특정 실시양태에서, 본 발명의 바이오마커 프로필에서의 특성 및 바이오마커 간의 관계는 상기 예시적 바이오마커 프로필 3에 도시된 바와 같이 보다 복잡하다.
당업자는 특성의 컴퓨터 처리를 위한 다른 방법이 고안될 수 있으며, 그러한 모든 방법이 본 발명의 범주 내에 있음을 인지할 것이다. 예를 들어, 특성은 둘 이상의 시점에서 대상으로부터 수집한 생물학적 샘플을 통한 바이오마커의 풍부도의 평균을 나타낼 수 있다. 또한, 특성은 단일 시점에서 대상으로부터 얻은 생물학적 샘플로부터의 2개 이상의 바이오마커의 풍부도의 차이 또는 비율일 수 있다. 바이오마커 프로필은 또한 3, 4, 5, 10, 20, 30개 이상의 특성을 포함할 수 있다. 한 실시양태에서, 바이오마커 프로필은 수백, 또는 수천 종의 특성을 포함한다.
특정 실시양태에서, 바이오마커의 특성은 미세배열을 이용하여 측정한다. 풍부도 데이터를 얻기 위한 미세배열의 구성 및 미세배열을 처리하기 위해 이용된 기술은 익히 공지되어 있으며, 예를 들어 각각의 전문이 참고로 본원에 포함되는 문헌 [Draghici, 2003, Data Analysis Tools for DNA Microarrays, Chapman & Hall/CRC], 및 국제 공개 번호 제WO 03/061564호에 기재되어 있다. 미세배열은 다수의 프로브를 포함한다. 특정 예에서, 각각의 프로브는, 예를 들어 상이한 바이오마커와 결합하여 인식된다. 특정 예에서, 미세배열 상의 2개 이상의 상이한 프로브는, 예를 들어 동일한 바이오마커와 결합하여 인식된다. 따라서, 전형적으로 미세배열 상의 프로브 스폿 및 대상 바이오마커 간의 관계는 이대일 대응, 삼대일 대응, 또는 다른 특정 형태의 대응이다. 그러나, 미세배열 상의 프로브 및 바이오마커 간에 독특한 일대일 대응이 있는 경우도 있을 수 있다.
"표현형 변화"는 대상의 제시된 상태와 관련된 파라미터에서의 검출가능한 변화이다. 예를 들어, 표현형 변화는 체액에서 바이오마커의 증가 또는 감소를 포함할 수 있으며, 여기서 변화는 SIRS, 패혈증, 패혈증의 발병 또는 패혈증 진행에서의 특정 병기와 관련된다. 표현형 변화는 바이오마커의 측정가능한 측면에서의 변화가 아닌 대상의 제시된 상태의 측정가능한 측면에서의 변화를 추가로 포함할 수 있다. 예를 들어, 표현형의 변화는 체온, 호흡수, 맥박, 혈압 또는 다른 생리적 파라미터에서 검출가능한 변화를 포함할 수 있다. 그러한 변화는 임상적 관찰 및 당업자에게 익히 공지된 종래의 기술을 이용한 측정을 통해 결정될 수 있다.
본원의 핵산 서열 (예를 들어, 본원에 기재된 유전자를 코딩하는 뉴클레오티드 서열)의 문맥에서 사용된 용어 "상보성"은 이들의 수소 결합 특성의 결과로서 특정 질소함유 염기 사이의 화학적 친화도를 나타낸다. 예를 들어, 구아닌 (G)은 시토신 (C)하고만 수소 결합을 형성하는 한편, 아데닌은 DNA의 경우에 오직 티아민 (T)하고만, RNA의 경우에 오직 우라실 (U)하고만 수소 결합을 형성한다. 이들 반응은 염기 쌍으로 기재되고, 쌍대 염기 (G와 C, 또는 A와 T/U)는 상보성으로 언급된다. 따라서, 2개의 핵산 서열은 이들의 질소함유 염기가 수소 결합을 형성할 수 있는 경우에 상보성일 수 있다. 그러한 서열은 서로의 "상보체"로 언급된다. 그러한 상보체 서열은 자연적으로 발생할 수 있거나, 예를 들어, DNA 분자 또는 RNA 분자의 센스 가닥 (예를 들어, mRNA 전사체)에 상보적인 안티센스 핵산 분자의 경우에 당업자에게 공지된 임의의 방법에 의해 화학적으로 합성될 수 있다 (예를 들어, 참고로 본원에 포함되는 문헌 [Lewin, 2002, Genes VII. Oxford University Press Inc., New York, NY] 참조).
본원의 패혈증 또는 SIRS의 진단 또는 예측의 문맥에서 사용된 "종래의 기술"은 본 발명에 따른 바이오마커 프로필을 얻지 않고 표현형 변화에 기초하여 대상을 분류하는 기술이다.
"결정 규칙"은 바이오마커 프로필을 평가하기 위해 사용된 방법이다. 그러한 의사결정 규칙은 전문이 본원에 참고로 포함되는 문헌 [Hastie et al., 2001, The Elements of Statistical Learning, Springer-Verlag, New York]에 예시된 바와 같이, 당업계에 공지된 하나 이상의 형태로 수용될 수 있다. 의사결정 규칙은, 특히 패혈증의 발병의 예측, 패혈증 진행의 결정, 또는 패혈증의 진단을 위해 특성의 데이터 세트에 작용하기 위해 사용될 수 있다. 본 발명의 특정 실시양태에서 사용될 수 있는 예시적 의사결정 규칙은 하기 섹션 5.5에 추가로 상세히 기재되어 있다.
"패혈증의 발병 예측"은 대상이 패혈증을 발병할 수 있는지에 대한 결정이다. 임의의 그러한 예측은 이러한 결정을 하기 위해 사용된 수단의 정확도에 의해 한정된다. 본 발명은, 예를 들어 이러한 결정이 정확도가 60% 이상이 되도록 하기 위한 의사결정 규칙(들)을 이용하는 방법을 제공한다. 본원에 사용된 용어 "패혈증 발병의 예측" 및 "패혈증의 예측"은 상호교환가능하다. 특정 실시양태에서, 패혈증 발병의 예측 (패혈증의 예측)의 작용은 패혈증 발병을 나타내는 의사결정 규칙을 이용하여 대상으로부터의 하나 이상의 바이오마커 프로필을 평가하고, 이 평가의 결과로서 대상이 패혈증에 걸릴 것을 나타내는 의사결정 규칙로부터의 결과를 얻음으로써 수행된다. 시험 대상으로부터의 하나 이상의 바이오마커 프로필의 의사결정 규칙을 이용한 그러한 평가는 하나 이상의 바이오마커 프로필의 일부 또는 전체 특성을 이용하여 상기 결과를 얻는다.
본원에 사용된 용어 "얻다" 및 "얻은"은 각각 "소유하게 되다" 또는 "소유하게 되는"을 의미한다. 이는, 예를 들어 컴퓨터 시스템 내 데이터 저장소로부터 데이터를 회복함으로써 수행될 수 있다. 이는 또한, 예를 들어 직접 측정함으로써 수행될 수 있다.
본원의 항체와 관련된 문맥에서 사용된 용어 "특이적으로" 및 그와 유사한 용어는 항원 또는 단편에 특이적으로 결합하고, 다른 항원 또는 다른 단편에는 특이적으로 결합하지 않는 펩티드, 폴리펩티드, 및 항체 또는 그의 단편을 나타낸다. 항원에 특이적으로 결합하는 펩티드 또는 폴리펩티드는 표준 실험 기술, 예를 들어 당업자에게 익히 공지된 임의의 면역검정법에 의해 결정된 바와 같이 낮은 친화도로 다른 펩티드 또는 폴리펩티드에 결합할 수 있다. 그러한 면역검정법에는, 비제한적으로 방사성면역검정법 (RIA) 및 효소-결합 면역흡착 검정법 (ELISA)이 포함된다. 항원에 특이적으로 결합하는 항체 또는 단편은 관련 항원과 상호-반응성일 수 있다. 바람직하게는, 항원에 특이적으로 결합하는 항체 또는 그의 단편은 다른 항원과 상호-반응성이 아니다 (예를 들어, 본원에 참고로 포함되며, 항원-항체 상호작용, 특이도 및 상호-반응성, 및 상기한 모든 것을 결정하기 위한 방법에 대해 논의한 문헌 [Paul, ed., 2003, Fundamental Immunology, 5th ed., Raven Press, New York at pages 69-105] 참조).
본원에 사용된 "대상"은 동물, 바람직하게는 포유동물, 더욱 바람직하게는 인간 이외의 영장류, 가장 바람직하게는 인간이다. 용어 "대상", "개체" 및 "환자"는 본원에서 상호교환가능하게 사용된다.
본원에 사용된 "시험 대상"은 전형적으로, 의사결정 규칙을 구성하기 위해 이용된 훈련 집단에 속하지 않는 임의의 대상이다. 시험 대상은 패혈증에 걸렸는지, 또는 패혈증 발병 위험이 있는지 임의로 의심될 수 있다.
본원에 사용된 "조직 유형"은 조직의 유형이다. 조직은 공통의 발생학적 기원 또는 경로 및 유사한 구조 및 기능을 갖는 다세포 유기체의 세포의 연합이다. 종종, 조직의 세포는 세포막에 접하고 있지만, 경우에 따라 조직은 유동적일 수 있다 (예를 들어, 혈액). 조직의 세포는 모두 한 가지 유형이거나 (단일 조직, 예를 들어 편평 상피, 식물 유조직) 또는 하나 이상의 유형 (혼합 조직, 예를 들어 결합 조직)일 수 있다.
본원에 사용된 "훈련 집단"은 패혈증이 발병할 위험이 있는 대상의 바이오마커 프로필을 평가하기 위해, 데이터 분석 알고리즘을 이용하여 의사결정 규칙을 구성하기 위해 이용된 대상 집단으로부터의 한 세트의 샘플이다. 바람직한 실시양태에서, 훈련 집단은 전환자인 대상 및 비-전환자인 대상으로부터의 샘플을 포함한다.
본원에 사용된 "데이터 분석 알고리즘"은 훈련 집단에서 대상의 바이오마커 프로필을 이용하여 의사결정 규칙을 구성하기 위해 사용된 알고리즘이다. 대표적인 데이터 분석 알고리즘은 섹션 5.5에 기재되어 있다. "결정 규칙"은 데이터 분석 알고리즘의 최종 생성물이고, 하나 이상의 수치 세트를 특성으로 하며, 여기서 각각의 이들 수치 세트는 SIRS, 패혈증의 발병, 패혈증, 또는 대상이 패혈증에 걸릴지에 대한 예측의 한 측면을 나타낸다. 한 특정 실시예에서, 수치 세트는 대상이 패혈증을 발병할 수 있음의 예측을 나타낸다. 다른 실시예에서, 수치 세트는 대상이 패혈증을 발병하지 않을 수 있음의 예측을 나타낸다.
본원에 사용된 "검증(validation) 집단"은 의사결정 규칙의 정확도를 결정하기 위해 이용된 대상 집단으로부터의 한 세트의 샘플이다. 바람직한 실시양태에서, 검증 집단은 전환자인 대상 및 비-전환자인 대상으로부터의 샘플을 포함한다. 바람직한 실시양태에서, 검증 집단은 정확도 측정을 위한 의사결정 규칙을 훈련하기 위해 이용된 훈련 집단의 부분인 대상을 포함하지 않는다.
본원에 사용된 "수치 세트"는 바이오마커 프로필에서의 특성에 대한 수치의 조합, 또는 수치의 범위이다. 이러한 수치 세트 및 그 안의 수치의 본질은 바이오마커 프로필에 존재하는 특성의 유형, 및 수치 세트를 나타내는 의사결정 규칙을 구성하기 위해 사용된 데이터 분석 알고리즘에 따라 달라진다. 예시를 위해, 예시적 바이오마커 프로필 2를 고려한다:
예시적 바이오마커 프로필 2.
바이오마커 특성 상대적 단위의 샘플에서의 풍부도
유전자 A의 전사체 300
유전자 B의 전사체 400
이 실시예에서, 훈련 집단의 각각의 구성원의 바이오마커 프로필을 얻었다. 각각의 그러한 바이오마커 프로필은 유전자 A의 전사체에 대해 측정된 특성, 여기서는 풍부도 및 유전자 B의 전사체에 대해 측정된 특성, 여기서는 풍부도를 포함한다. 이들 특성 수치, 여기서는 풍부도 수치는 의사결정 규칙을 구성하기 위한 데이터 분석 알고리즘에 의해 이용된다. 이 실시예에서, 데이터 분석 알고리즘은 섹션 5.5.1에 기재된 의사결정계통도이며, 데이터 분석 알고리즘의 최종 생성물인 의사결정 규칙은 의사결정계통도이다. 예시적 의사결정계통도는 도 1에 도시되어 있다. 의사결정 규칙은 수치 세트를 한정한다. 하나의 그러한 수치 세트는 패혈증의 발병을 예측한다. 바이오마커 특성 수치가 이 수치 세트를 만족하는 대상은 패혈증에 걸릴 것이다. 이러한 부류의 예시적 수치 세트는 예시적 수치 세트 1이다:
예시적 수치 세트 1.
바이오마커 수치 세트 성분 (상대적 단위의 샘플에서의 풍부도)
유전자 A의 전사체 < 400
유전자 B의 전사체 < 600
다른 그러한 수치 세트는 패혈증 증상이 없는 상태를 예측한다. 바이오마커 특성 수치가 이러한 수치 세트를 만족하는 대상은 패혈증에 걸리지 않을 것이다. 이러한 부류의 예시적 수치 세트는 예시적 수치 세트 2이다:
예시적 수치 세트 2.
바이오마커 수치 세트 성분 (상대적 단위의 샘플에서의 풍부도)
유전자 A의 전사체 < 400
유전자 B의 전사체 < 600
데이터 분석 알고리즘이 신경 네트워크 분석이고 이 신경 네트워크 분석의 최종 생성물이 적합한 가중 신경 네트워크인 경우에, 하나의 수치 세트는 패혈증이 발병할 수 있음을 나타내는 가중 신경 네트워크를 초래할 바이오마커 프로필 특성 수치의 범위이다. 다른 수치 세트는 패혈증이 발병하지 않을 수 있음을 나타내는 가중 신경 네트워크를 초래할 바이오마커 프로필 특성 수치의 범위이다.
본원의 미세배열의 문맥에서 사용된 용어 "프로브 스폿"은 샘플에서 특정 핵산의 풍부도를 결정하기 위해 사용되는 "프로브"로 본원에 언급되는 단일 가닥 DNA 분자 (예를 들어, 단일 가닥 cDNA 분자 또는 합성 DNA 올리고머)를 나타낸다. 예를 들어, 프로브 스폿은 시험 대상으로부터의 생물학적 샘플 (예를 들어, 세포 수집)에서 mRNA 수준을 결정하기 위해 사용될 수 있다. 특정 실시양태에서, 전형적인 미세배열은 그리드 상의 알려진 위치에 있는 유리 슬라이드 (또는 다른 기질)에 위치한 다중 프로브 스폿을 포함한다. 각각의 프로브 스폿에 대한 핵산은 유전자 또는 관심있는 유전자 (예를 들어, 10-mer, 11-mer, 12-mer, 13-mer, 14-mer, 15-mer, 16-mer, 17-mer, 18-mer, 19-mer, 20-mer, 21-mer, 22-mer, 23-mer, 24-mer, 25-mer 또는 그 이상)의 서열의 단일 가닥 인접 부분이고, 특정 유전자 또는 관심있는 유전자에 의해 코딩된 mRNA에 대한 프로브이다. 각각의 프로브 스폿은 단일 핵산 서열을 특성으로 하고, 그의 상보성 DNA 가닥 또는 mRNA 분자에만 혼성화하도록 하는 상태 하에 혼성화된다. 이와 같이, 기질 상에 다수의 프로브 스폿이 존재할 수 있고, 각각은 독특한 유전자 또는 관심있는 서열을 나타낼 수 있다. 또한, 둘 이상의 프로브 스폿은 동일한 유전자 서열을 나타낼 수 있다. 특정 실시양태에서, 표지된 핵산 샘플은 프로브 스폿에 혼성화되고, 프로브 스폿에 특이적으로 혼성화된 표지된 핵산의 양은 특정 생물학적 샘플에서 특정 핵산 (예를 들어, 특정 유전자의 mRNA 전사체)의 수준을 결정하기 위해 정량화될 수 있다. 프로브, 프로브 스폿, 및 미세배열은 일반적으로, 전문이 참고로 본원에 포함되는 문헌 [Draghici, 2003, Data Analysis Tools for DNA Microarrays, Chapman & Hall/CRC, Chapter, 2]에 기재되어 있다.
본원에 사용된 용어 "애노테이션 (annotation) 데이터"는 바이오마커의 특성을 설명하는 임의의 유형의 데이터를 나타낸다. 애노테이션 데이터에는 비제한적으로, 생물학적 경로 구성원, 효소 부류 (예를 들어, 포스포디에스테라제, 키나제, 메탈로프로테나제 등), 단백질 도메인 정보, 효소 기질 정보, 효소 반응 정보, 단백질 상호작용 데이터, 질환 연관성, 세포 위치결정, 조직 유형 위치결정, 및 세포 유형 위치결정이 포함된다.
본원에 사용된 용어 "T-12"는 대상이 패혈증으로 임상적으로 진단되기 전에 대상으로부터 혈액을 얻은 최종 시간을 나타낸다. 본 발명에서, 혈액은 대상으로부터 각각 24시간 동안 수집하기 때문에, T-12는 환자 풀에 대해 패혈증의 발병 이전의 평균 시간을 나타내는데, 특정 환자는 12시간 표시 전에 패혈증으로 되고, 특정 환자는 12시간 표시 후에 패혈증으로 된다. 그러나, 대상 풀을 통해, 이 마지막 혈액 샘플의 평균 시간은 12시간으로 표시되므로, 명칭이 "T-12"이다.
5.2 대상의 스크리닝 방법
본 발명은 시험 대상으로부터의 각각의 하나 이상의 생물학적 샘플에서 패혈증이 의심되거나, 패혈증 발병의 위험이 있는 시험 개체의 바이오마커 프로필의 2개 이상의 특성의 검출을 통해 정확하고 신속한 패혈증의 예측 및/또는 진단이 가능하게 한다. 한 실시양태에서, 시험 대상으로부터 단일 시점에서 얻은 단일 생물학적 샘플만이 패혈증의 이러한 예측 또는 진단을 위해 사용되는 바이오마커 프로필을 구성하기 위해서 필요하다. 다른 실시양태에서, 시험 대상으로부터 상이한 시점에서 얻은 다중 생물학적 샘플이 패혈증의 이러한 예측 또는 진단을 위해 사용되는 바이오마커 프로필을 구성하기 위해 사용된다.
본 발명의 특정 실시양태에서, 패혈증 또는 SIRS이 발병할 위험이 있는 대상은 본 발명의 방법을 이용하여 스크리닝한다. 이들 실시양태에 따라, 본 발명의 방법은, 예를 들어 ICU에 입원한 대상 및/또는 특정 종류의 외상 (예컨대, 수술, 자동차 사고, 총상 등)을 경험한 대상을 스크리닝하기 위해 이용될 수 있다.
특정 실시양태에서, 생물학적 샘플 예컨대, 혈액은 입원하자마자 얻는다. 특정 실시양태에서, 생물학적 샘플은 혈액, 혈장, 혈청, 타액, 객담, 소변, 뇌척수액, 세포, 세포 추출액, 조직 표본, 조직 생검, 또는 대변 표본이다. 특정 실시양태에서 생물학적 샘플은 전혈이고, 이 전혈을 사용하여 바이오마커 프로필에 대한 측정치를 얻는다. 특정 실시양태에서, 생물학적 샘플은 전혈의 특정 성분이다. 예를 들어, 특정 실시양태에서 단백질, 핵산, 및/또는 세포 분획 내의 다른 분자 (예를 들어, 대사산물) 또는 혈액 내의 액체 (예를 들어, 혈장 또는 혈청 분획)의 혼합물의 일부분이 바이오마커 프로필로 분석된다. 이는 바이오마커 프로필에서 바이오마커의 특성을 측정함으로써 달성될 수 있다. 특정 실시양태에서, 생물학적 샘플은 전혈이나, 바이오마커 프로필은 전혈로부터 단리된 특정 세포 유형인 바이오마커로부터 분석된다. 특정 실시양태에서, 생물학적 샘플은 전혈이나, 바이오마커 프로필은 전혈로부터 단리된 단핵구에서 발현되거나 다르게는 발견된 바이오마커로부터 분석된다. 특정 실시양태에서, 생물학적 샘플은 전혈이나, 바이오마커 프로필은 전혈로부터 단리된 적혈구에서 발현되거나 다르게는 발견된 바이오마커로부터 분석된다. 특정 실시양태에서, 생물학적 샘플은 전혈이나, 바이오마커 프로필은 전혈로부터 단리된 혈소판에서 발현되거나 다르게는 발견된 바이오마커로부터 분석된다. 특정 실시양태에서, 생물학적 샘플은 전혈이나, 바이오마커 프로필은 전혈로부터 단리된 호중구에서 발현되거나 다르게는 발견된 바이오마커로부터 분석된다. 특정 실시양태에서, 생물학적 샘플은 전혈이나, 바이오마커 프로필은 전혈로부터 단리된 호산구에서 발현되거나 다르게는 발견된 바이오마커로부터 분석된다. 특정 실시양태에서, 생물학적 샘플은 전혈이나, 바이오마커 프로필은 전혈로부터 단리된 호염구에서 발현되거나 다르게는 발견된 바이오마커로부터 분석된다. 특정 실시양태에서, 생물학적 샘플은 전혈이나, 바이오마커 프로필은 전혈로부터 단리된 림프구에서 발현되거나 다르게는 이에서 발견된 바이오마커로부터 분석된다. 특정 실시양태에서, 생물학적 샘플은 전혈이나, 바이오마커 프로필은 전혈로부터 단리된 단핵구에서 발현되거나 다르게는 이에서 발견되는 바이오마커로부터 분석된다. 특정 실시양태에서, 생물학적 샘플은 전혈이나, 바이오마커 프로필은 적혈구, 혈소판, 호중구, 호산구, 호염구, 림프구 및 단핵구로 이루어진 세포 유형 집단으로부터의 1, 2, 3, 4, 5, 6 또는 7가지 세포 형태로부터 분석된다.
바이오마커 프로필은 다수의 1개 이상의 바이오마커 (예를 들어, mRNA 분자, cDNA 분자, 단백질 및/또는 탄수화물 등), 또는 그의 지시를 바이오마커의 특성, 예컨대 측정가능한 측면 (예를 들어, 풍부도)과 함께 포함한다. 바이오마커 프로필은 2개 이상의 그러한 바이오마커 또는 그의 지시를 포함할 수 있으며, 여기서 바이오마커는 동일한 또는 상이한 부류, 예컨대 핵산 및 탄수화물일 수 있다. 특정 실시양태에서, 바이오마커 프로필은 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 96, 100, 105, 110, 115, 120, 125, 130, 135, 140, 145, 150, 155, 160, 165, 170, 175, 180, 185, 190, 195 또는 200개 이상의 바이오마커 또는 그의 지시를 포함한다. 한 실시양태에서, 바이오마커 프로필은 수백 또는 수천 개의 바이오마커 또는 그의 지시를 포함한다. 특정 실시양태에서, 바이오마커 프로필은 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50개 이상의 바이오마커 또는 그의 지시를 포함한다. 한 실시예에서, 특정 실시양태에서, 바이오마커 프로필은 섹션 5.11의 표 I로부터 선택된 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50개 이상의 바이오마커 또는 그의 지시를 포함한다. 다른 실시예에서, 특정 실시양태에서, 바이오마커 프로필은 섹션 5.11의 표 J로부터 선택된 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40개 이상의 바이오마커 또는 그의 지시를 포함한다. 다른 실시예에서, 특정 실시양태에서, 바이오마커 프로필은 섹션 5.11의 표 K에서 임의의 2, 3, 4, 5, 6, 7, 8, 9개 이상, 또는 10개 전부의 바이오마커 또는 그의 지시를 포함한다.
전형적인 실시양태에서, 바이오마커 프로필에서의 각각의 바이오마커는 특성에 의해 나타난다. 달리 말하면, 바이오마커 및 특성 간에는 대응이 있다. 특정 실시양태에서, 바이오마커 및 특성 간의 대응은 1:1이고, 이는 각각의 바이오마커에 대해 특성이 존재함을 의미한다. 특정 실시양태에서, 각각의 바이오마커에 대해 하나 이상의 특성이 존재한다. 특정 실시양태에서, 바이오마커 프로필에서 하나의 바이오마커에 상응하는 특성의 수는 바이오마커 프로필에서의 다른 바이오마커에 상응하는 특성의 수와 상이하다. 이와 같이, 특정 실시양태에서, 바이오마커 프로필은 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 96, 100, 105, 110, 115, 120, 125, 130, 135, 140, 145, 150, 155, 160, 165, 170, 175, 180, 185, 190, 195 또는 200개 이상의 특성을 포함할 수 있으나, 단, 바이오마커 프로필에서 바이오마커는 2, 3, 4, 5, 6, 또는 7개 이상이다. 특정 실시양태에서, 바이오마커 프로필은 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50개 이상의 특성을 포함할 수 있다. 실시양태와 상관없이, 이들 특성은 임의의 재생가능 측정 기술 또는 측정 기술의 조합의 사용을 통해 결정될 수 있다. 그러한 기술에는 본원에 기재된 임의의 기술, 또는 예를 들어, 하기 섹션 5.4에 개시된 임의의 기술을 비롯한 당업계에 익히 공지된 것들이 포함된다. 전형적으로, 그러한 기술은 단일 시점에서 대상으로부터 얻은 생물학적 샘플 또는 다중 시점에서 얻은 다중 샘플을 이용하여 특성 수치를 측정하기 위해 사용된다. 한 실시양태에서, 대상으로부터 얻은 샘플에서 바이오마커 프로필을 얻기 위한 예시적 기술은 cDNA 미세배열 (예를 들어, 하기 섹션 5.4.1.2 및 섹션 6 참조)이다. 다른 실시양태에서, 대상으로부터 얻은 샘플에서 바이오마커 프로필을 얻기 위한 예시적 기술은 단백질-기재 검정법 또는 문헌 [BD Cytometric Bead Array (CBA) Human Inflammation Kit Instruction Manual (BD Biosciences)]에 기재된 것과 같은 다른 형태의 단백질-기재 기술, 또는 미국 특허 제5,981,180호에 기재된 비드 검정법이며, 상기 문헌은 이들의 전문이 참고로 본원에 각각 포함되고, 특히 여기에는 생물학적 샘플에서 단백질 농도를 검정하는 다양한 방법이 교시되어 있다. 또 다른 실시양태에서, 바이오마커 프로필은 혼합되는데, 이는 핵산인 특정 바이오마커 또는 그의 지시, 및 단백질인 특정 바이오마커 또는 그의 지시를 포함하는 것을 의미한다. 그러한 실시양태에서, 단백질 기재 기술 및 핵산 기재 기술은 둘 다 대상으로부터 얻은 하나 이상의 샘플에서 바이오마커 프로필을 얻기 위해 사용된다. 달리 말하면, 핵산인 바이오마커 프로필에서의 바이오마커와 관련된 특성에 대한 특성 수치는 핵산 기재 측정 기술 (예를 들어, 핵산 미세배열)에 의해 얻고, 단백질인 바이오마커 프로필에서 바이오마커와 관련된 특성에 대한 특성 수치는 단백질 기재 측정 기술에 의해 얻는다. 특정 실시양태에서, 바이오마커 프로필은 키트, 예컨대 하기 섹션 5.3에 기재된 키트를 사용하여 얻을 수 있다.
특정 실시양태에서, 대상은 필요한 만큼 빈번하게 (예를 들어, ICU에 체류하는 동안) 본 발명의 방법 및 조성물을 이용하여 스크리닝하여 대상에서 패혈증 또는 SIRS를 진단 또는 예측한다. 바람직한 실시양태에서, 대상은 ICU에 도착한 후에 바로 스크리닝한다. 특정 실시양태에서, 대상은 ICU에 도착한 후에 매일 스크리닝한다. 특정 실시양태에서, 대상은 ICU에 도착한 후에 1 내지 4시간 마다, 1 내지 8시간 마다, 8 내지 12시간 마다, 12 내지 16시간 마다, 또는 16 내지 24시간 마다 스크리닝한다.
5.3 키트
본 발명은 또한 대상에서 패혈증 발병의 진단 또는 예측, 또는 SIRS 진단에 유용한 키트를 제공한다. 특정 실시양태에서, 본 발명의 키트는 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 96, 100, 105, 110, 115, 120, 125, 130, 135, 140, 145, 150, 155, 160, 165, 170, 175, 180, 185, 190, 195 또는 200개 이상의 바이오마커 및/또는 그러한 바이오마커의 존재 또는 풍부도를 검출하기 위한 시약을 포함한다. 다른 실시양태에서, 본 발명의 키트는 2개 이상, 수백개 이상의 바이오마커를 포함한다. 특정 실시양태에서, 본 발명의 키트는 섹션 5.11의 표 I로부터 선택된 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50개 이상의 바이오마커를 포함한다. 특정 실시양태에서, 본 발명의 키트는의 키트는 섹션 5.11의 표 J로부터 선택된 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40개 이상의 바이오마커를 포함한다. 특정 실시양태에서, 본 발명의 키트는 섹션 5.11의 표 K에서의 바이오마커 중 2, 3, 4, 5, 6, 7, 8, 9개 이상, 또는 10개 모두를 포함한다. 섹션 5.1에 제시된 바이오마커의 검출에 따라, 특정 예에서, 바이오마커는, 예를 들어 유전자, mRNA, 또는 단백질 그 자체보다는 유전자, mRNA, 또는 단백질의 사실상 구별가능한 분자이다. 따라서, 바이오마커는 실제 유전자 또는 단백질 그 자체보다는 섹션 5.11의 표 I, J, 또는 K 중 임의의 하나에서 확인된 특정 유전자 또는 단백질, 또는 그의 단편의 존재 또는 풍부도를 나타내는 분자일 수 있다. 그러한 구별가능한 분자는 때때로 당업계에서 "시약"으로 언급된다. 특정 실시양태에서, 본 발명의 키트는 2개 이상, 또는 수백개 이상의 바이오마커를 포함한다.
본 발명의 키트의 바이오마커는 본 발명에 따른 바이오마커 프로필을 생성하기 위해 사용될 수 있다. 키트의 화합물의 분류의 예에는, 비제한적으로, 단백질 및 그의 단편, 펩티드, 프로테오글리칸, 당단백질, 지단백질, 탄수화물, 지질, 핵산 (예를 들어, DNA, 예컨대 cDNA 또는 증폭된 DNA, 또는 RNA, 예컨대 mRNA), 유기 또는 무기 화학물질, 천연 또는 합성 중합체, 소분자 (예를 들어, 대사산물), 또는 구별가능한 분자 또는 상기 중 임의의 구별가능한 단편이 포함된다. 특정 실시양태에서, 바이오마커는 특정 크기 (예를 들어, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 105, 110, 115, 120, 125, 130, 135, 140, 145, 150, 155, 160, 165, 170, 175, 180, 185, 190, 195, 200, 1000, 2000, 3000, 5000, 10k, 20k, 100k 달톤 이상)이다. 바이오마커(들)은 배열의 일부일 수 있거나, 또는 바이오마커(들)은 분리적으로 및/또는 개별적으로 포장될 수 있다. 상기 키트는 또한 본 발명의 바이오마커 프로필을 생성하는 데 사용되는 하나 이상의 국제 표준을 포함할 수 있다. 이와 같이, 국제 표준 또는 표준들은 상기 기재된 화합물의 임의의 부류일 수 있다. 한 실시양태에서, 본 발명은, 예를 들어 미세배열에서 발견되는 기질 상의 접근할 수 있는 위치에서 고정되거나 고정되지 않을 수 있는 프로브 및/또는 프라이머를 포함하는 키트를 제공한다. 특정 실시양태에서, 본 발명은 그러한 미세배열을 제공한다.
특정 실시양태에서, 본 발명은 표 30, 31, 32, 33, 34, 36, I, J, 또는 K 중 임의의 하나에 열거된 단백질-기재 바이오마커와 특이적으로 결합하는 다수의 항체를 포함하는, 시험 대상에서 패혈증의 발병 예측을 위한 키트를 제공한다. 그러한 실시양태에서, 상기 항체 그 자체는 본 발명의 범주에 속하는 바이오마커이다. 이 실시양태에 따라, 상기 키트는 표 30, 31, 32, 33, 34, 36, I, J, 또는 K 중 임의의 하나에 상기 기재된 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 105, 110, 115, 120, 125, 130, 135, 140, 145, 150, 155, 160, 165, 170, 175, 180, 185, 190, 195 또는 200개 이상의 단백질-기재 바이오마커 세트와 특이적으로 결합하는 한 세트의 항체 또는 그의 기능성 단편 또는 유도체 (예를 들어, Fab, F(ab')2, Fv, 또는 scFv 단편)를 포함할 수 있다. 이 실시양태에 따라, 상기 키트는 본 발명의 바이오마커에 대해 특이적인 항체, 그이 단편 또는 유도체 (예를 들어, Fab, F(ab')2, Fv, 또는 scFv 단편)를 포함할 수 있다. 한 실시양태에서, 상기 항체는 검출가능하게 표지화될 수 있다.
특정 실시양태에서, 본 발명은 섹션 5.11의 표 I에 열거된 다수의 단백질-기재 바이오마커와 특이적으로 결합하는 다수의 항체를 포함하는, 시험 대상에서 패혈증의 발병 예측을 위한 키트를 제공한다. 이 실시양태에 따라, 상기 키트는 표 I에서 상기된 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50개 이상의 바이오마커 세트와 특이적으로 결합하는 한 세트의 항체 또는 그의 기능성 단편 또는 유도체 (예를 들어, Fab, F(ab')2, Fv, 또는 scFv 단편)를 포함할 수 있다. 이 실시양태에 따라, 상기 키트는 본 발명의 바이오마커에 대해 특이적인 항체, 그의 단편 또는 유도체 (예를 들어, Fab, F(ab')2, Fv, 또는 scFv 단편)를 포함할 수 있다. 한 실시양태에서, 상기 항체는 검출가능하게 표지화될 수 있다.
본 발명의 다른 실시양태에서, 키트는 특이적 바이오마커 결합 성분, 예컨대 앱타머 (aptamer)를 포함할 수 있다. 바이오마커가 핵산을 포함하는 경우, 키트는 바이오마커 또는 바이오마커의 상보성 가닥과 이중가닥을 형성할 수 있는 올리고뉴클레오티드 프로브를 제공할 수 있다. 올리고뉴클레오티드 프로브는 검출가능하게 표지될 수 있다. 그러한 실시양태에서, 상기 프로브는 그들 자체로 본 발명의 범주 내에 포함되는 바이오마커이다.
본 발명의 키트는 또한 바이오마커 프로필의 구성에서 사용될 수 있는 부가적 성분, 예컨대 완충제를 포함할 수 있다. 미생물 작용의 예방은 다양한 항균제 및 항진균제, 예를 들어 파라벤, 클로로부탄올, 페놀 소르브산 등을 포함함으로써 확보할 수 있다. 이는 또한 등장화제, 예컨대 당, 염화나트륨 등을 포함하는 것이 바람직할 수 있다.
본 발명의 특정 키트는 미세배열을 포함한다. 한 실시양태에서 이러한 미세배열은 다수의 프로브 스폿을 포함하며, 여기서 다수의 프로브 스폿에서 프로브 스폿의 20% 이상은 표 30, 31, 32, 33, 34, 36, I, J, 또는 K 중 임의의 하나에서의 바이오마커에 상응한다. 특정 실시양태에서, 다수의 프로브 스폿에서 프로브 스폿의 25% 이상, 30% 이상, 35% 이상, 40% 이상 또는 60% 이상, 또는 80% 이상은 표 30, 31, 32, 33, 34, 36, I, J, 또는 K 중 임의의 하나에서의 바이오마커에 상응한다. 그러한 프로브 스폿은 본 발명의 범주 내의 바이오마커이다. 특정 실시양태에서, 미세배열은 기질 상에 3개 내지 백개의 프로브 스폿으로 구성된다. 특정 실시양태에서, 미세배열은 기질 상에 3개 내지 백개의 프로브 스폿으로 구성된다. 이 문맥에서 사용된 용어 "약"은 언급된 수치의 5% 이내, 언급된 수치의 10% 이내, 또는 언급된 수치의 25% 이내를 의미한다. 특정 실시양태에서, 그러한 미세배열은 내부 미세배열 보정, 또는 다른 미세배열, 예컨대 당업자에게 공지된 기술을 이용한 참고 미세배열과의 보정을 위한 하나 이상의 프로브 스폿을 함유한다. 특정 실시양태에서, 그러한 미세배열은 핵산 미세배열이다. 특정 실시양태에서, 그러한 미세배열은 단백질 미세배열이다.
본 발명의 특정 키트는 컴퓨터 시스템과 함께 사용하기 위한 컴퓨터 프로그램 제품을 추가로 포함할 수 있으며, 여기서 컴퓨터 프로그램 제품은 컴퓨터 판독 저장 매체 및 거기에 임베딩된 컴퓨터 프로그램 메카니즘을 포함한다. 그러한 키트에서, 컴퓨터 프로그램 메카니즘은 패혈증의 발병 위험이 있는 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제1 수치 세트를 만족하는지 평가하기 위한 지침을 포함한다. 제1 수치 세트를 만족하는 것은 시험 대상이 패혈증을 발병할 수 있음을 예측한다. 한 실시양태에서, 다수의 특성은 표 30, 31, 32, 33, 34, 36, I, J, 또는 K 중 임의의 하나에 열거된 바이오마커에 사용한다. 특정 키트에서, 컴퓨터 프로그램 제품은 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제2 수치 세트를 만족하는지 평가하기 위한 지침을 추가로 포함한다. 제2 수치 세트를 만족하는 것은 시험 대상이 패혈증을 발병하지 않을 수 있음을 예측한다.
본 발명의 특정 키트는 중앙 처리 장치, 및 중앙 처리 장치에 연결된 메모리를 갖는 컴퓨터를 포함한다. 상기 메모리는 패혈증 발병 위험이 있는 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제1 수치 세트를 만족하는지 평가하기 위한 지침을 저장한다. 제1 수치 세트를 만족하는 것은 시험 대상이 패혈증을 발병할 수 있음을 예측한다. 한 실시양태에서, 다수의 특성은 표 30, 31, 32, 33, 34, 36, I, J, 또는 K 중 임의의 하나에 열거된 바이오마커에 상응한다.
도 35는 상기 기재된 기능을 지지하는 예시적 시스템을 상세히 나타낸다. 상기 시스템은 바람직하게는 하기를 갖는 컴퓨터 시스템 (10)이다:
ㆍ 중앙 처리 장치 (22);
ㆍ 메인 비휘발성 저장 장치 (14), 예를 들어, 소프트웨어 및 데이터를 저장하기 위한 하드 디스크 드라이브 (저장 장치 (14)는 저장 제어기 (12)에 의해 제어됨);
ㆍ 시스템 제어 프로그램, 데이터 및 적용 프로그램을 저장하기 위한, 비휘발성 저장 장치 (14)로부터 로딩된 프로그램 및 데이터를 포함하는 시스템 메모리 (36), 바람직하게는 고속 랜덤-액세스 메모리 (RAM) (시스템 메모리 (36)은 또한 읽기-전용 메모리 (ROM)를 포함할 수 있음);
ㆍ 하나 이상의 입력 장치 (예를 들어, 키보드 (28)) 및 디스플레이 (26) 또는 다른 출력 장치를 포함하는 사용자 인터페이스 (32);
ㆍ 임의의 유선 또는 무선 통신망 (34) (예를 들어, 광역 통신망, 예컨대 인터넷)에 접속하기 위한 네트워크 인터페이스 카드 (20);
ㆍ 시스템의 상기 언급한 요소를 상호접속하기 위한 내부 버스 (30); 및
ㆍ 상기 언급한 요소에 동력을 공급하기 위한 전원 (24).
컴퓨터 (10)의 조작은 중앙 처리 장치 (22)에 의해 실행되는 조작 시스템 (40)에 의해 주로 제어된다. 조작 시스템 (40)은 시스템 메모리 (36)에 저장될 수 있다. 조작 시스템 (40)에 더하여, 전형적인 수행에서, 시스템 메모리 (36)은 하기를 포함한다:
ㆍ 본 발명에 의해 사용된 다양한 파일 및 데이터 구조에 대한 접근을 제어하기 위한 파일 시스템 (42);
ㆍ 본 발명에 따른 하나 이상의 의사결정 규칙을 구성하는 데 사용하기 위한 훈련 데이터 세트 (44);
ㆍ 훈련 데이터를 처리하고 의사결정 규칙을 구성하기 위한 데이터 분석 알고리즘 모듈 (54);
ㆍ 하나 이상의 의사결정 규칙 (56);
ㆍ시험 대상의 바이오마커 프로필에서의 다수의 특성이 제1 수치 세트 또는 제2 수치 세트를 만족하는지 결정하기 위한 바이오마커 프로필 평가 모듈 (60);
ㆍ 바이오마커 (64), 및 각각의 그러한 바이오마커에 대한 특성 (66)을 포함하는 시험 대상 바이오마커 프로필 (62); 및
ㆍ 본 발명의 선택 바이오마커 (예를 들어, 표 30 및/또는 표 I 및/또는 표 J 및/또는 표 K, 및/또는 표 L 및/또는 표 M 및/또는 표 N 및/또는 표 O 등) 및/또는 각각의 이들 선택 바이오마커에 대한 하나 이상의 특성의 데이터베이스 (68).
훈련 데이터 세트 (46)은 다수의 대상 (46)에 대한 데이터를 포함한다. 각각의 대상 (46)에 대해, 대상 식별자 (48) 및 다수의 바이오마커 (50)이 존재한다. 각각의 바이오마커 (50)에 대해, 하나 이상의 특성 (52)가 존재한다. 도 35에 제시되지는 않았지만, 각각의 특성 (52)에 대해, 특성 수치가 존재한다. 데이터 분석 알고리즘을 이용하여 구성된 각각의 의사결정 규칙 (56)에 대해, 하나 이상의 의사결정 규칙 수치 세트 (58)이 존재한다.
도 35에 도시된 바와 같이, 컴퓨터 (10)은 소프트웨어 프로그램 모듈 및 데이터 구조를 포함한다. 컴퓨터 (10)에 저장된 데이터 구조는 훈련 데이터 세트 (44), 의사결정 규칙 (56), 시험 대상 바이오마커 프로필 (62), 및 바이오마커 데이터베이스 (68)을 포함한다. 각각의 이들 데이터 구조는 비제한적으로, 플랫 ASCII 또는 이진 파일, 엑셀 스프레드시트, 관계형 데이터베이스 (SQL), 또는 온라인 분석 처리 (OLAP) 데이터베이스 (MDX 및/또는 그의 변형)를 비롯한 임의의 형태의 데이터 저장 시스템을 포함할 수 있다. 몇몇 특정 실시양태에서, 그러한 데이터 구조는 각각 계층적 구조 (예를 들어, 스타 스키마)를 포함하는 1개 이상의 데이터베이스 형태이다. 특정 실시양태에서, 그러한 데이터 구조는 각각 명백한 계층을 갖지 않는 데이터베이스의 형태이다 (예를 들어, 계층적으로 배열되지 않은 차원 표 (dimension table)).
특정 실시양태에서, 시스템 10에 저장되거나 접근가능한 각각의 데이터 구조는 단일 데이터 구조이다. 다른 실시양태에서, 그러한 데이터 구조는 실제로 동일한 컴퓨터 10에 의해 모두 호스팅될 수 있거나 없는 다수의 데이터 구조 (예를 들어, 데이터베이스, 파일, 아카이브)를 포함한다. 예를 들어, 특정 실시양태에서, 훈련 데이터 세트 44는 컴퓨터 10, 및/또는 광역 통신망 34를 통해 컴퓨터 10에 의해 접근할 수 있는 컴퓨터 상에 저장된 다수의 엑셀 스프레드시트를 포함한다. 다른 실시예에서, 훈련 데이터 세트 44는 컴퓨터 10에 저장되거나, 또는 광역 통신망 34를 통해 컴퓨터 10에 의해 접근할 수 있는 하나 이상의 컴퓨터를 통해 분산된 데이터베이스를 포함한다.
도 35에 도시된 다수의 모듈 및 데이터 구조가 하나 이상의 리모트 컴퓨터에 위치할 수 있음이 인지될 것이다. 예를 들어, 본원의 특정 실시양태는 웹 서비스형 도구이다. 그러한 실시양태에서, 바이오마커 프로필 평가 모듈 60 및/또는 기타 모듈은 네트워크 34를 통해 컴퓨터 10과 통신하는 고객 컴퓨터에 존재할 수 있다. 특정 실시양태에서, 예를 들어 바이오마커 프로필 평가 모듈 60은 쌍방향 웹 페이지일 수 있다.
특정 실시양태에서, 도 35에 도시된 훈련 데이터 세트 44, 의사결정 규칙 56, 및/또는 바이오마커 데이터베이스 68은 단일 컴퓨터 (컴퓨터 10)에 있으며, 다른 실시양태에서 하나 이상의 그러한 데이터 구조 및 모듈은 하나 이상의 리모트 컴퓨터 (제시되지 않음)에 의해 호스팅된다. 이들 데이터 구조 및 소프트웨어 모듈이 네트워크 34를 통하거나, 다른 전자 수단에 의해 서로 접근할 수 있는 한, 하나 이상의 컴퓨터 상의 도 35에 도시된 데이터 구조 및 소프트웨어 모듈의 임의의 정렬은 본 발명의 범주 내에 있다. 따라서, 본 발명은 컴퓨터 시스템의 넓은 배열을 완전히 포함한다.
본 발명의 또 다른 키트는 시험 대상에서 패혈증 또는 SIRS가 발병할 수 있는지 평가하기 위한 컴퓨터 및 컴퓨터 판독 매체를 포함한다. 예를 들어, 본 발명의 한 실시양태는 컴퓨터 시스템과 함께 사용하기 위한 컴퓨터 프로그램 제품을 제공한다. 상기 컴퓨터 프로그램 제품은 컴퓨터 판독 저장 매체 및 거기에서 임베딩된 컴퓨터 프로그램 메카니즘을 포함한다. 상기 컴퓨터 프로그램 메카니즘은 패혈증 발병 위험이 있는 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제1 수치 세트를 만족하는지 평가하기 위한 지침을 포함한다. 제1 수치 세트의 만족은 시험 대상이 패혈증을 발병할 수 있음을 예측한다. 다수의 특성은 다수의 바이오마커의 측정가능한 측면이며, 상기 다수의 바이오마커는 표 I에 열거된 3개 이상의 바이오마커를 포함한다. 특정 실시양태에서, 다수의 바이오마커는 표 I에 열거된 6개 이상의 바이오마커를 포함하며, 여기서 다수의 바이오마커는 IL-6 및 IL-8 둘 다를 포함한다. 특정 실시양태에서, 상기 컴퓨터 프로그램 제품은 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제2 수치 세트를 만족하는지 평가하기 위한 지침을 추가로 포함한다. 제2 수치 세트의 만족은 시험 대상이 패혈증을 발병하지 않을 수 있음을 예측한다. 특정 실시양태에서, 바이오마커 프로필은 표 I에 열거된 3개 내지 50개의 바이오마커, 표 I에 열거된 3개 내지 40개의 바이오마커, 표 I에 열거된 4개 이상의 바이오마커, 또는 표 I에 열거된 8개 이상의 바이오마커를 갖는다.
본 발명의 다른 키트는 중앙 처리 장치, 및 중앙 처리 장치에 연결된 메모리를 포함한다. 상기 메모리는 패혈증을 발병할 위험이 있는 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제1 수치 세트를 만족하는지 평가하기 위한 지침을 저장한다. 제1 수치 세트의 만족은 시험 대상이 패혈증을 발병할 수 있음을 예측한다. 다수의 특성은 다수의 바이오마커의 측정가능한 측면이다. 이러한 다수의 바이오마커는 표 I로부터의 3개 이상의 바이오마커를 포함한다. 특정 실시양태에서, 다수의 바이오마커는 표 I에 열거된 6개 이상의 바이오마커를 포함하며, 여기서 다수의 바이오마커는 IL-6 및 IL-8 둘 다를 포함한다. 특정 실시양태에서, 상기 메모리는 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제2 수치 세트를 만족하는지 평가하기 위한 지침을 추가로 저장하며, 여기서 제2 수치 세트를 만족하는 것은 시험 대상이 패혈증을 발병하지 않을 수 있음을 예측한다. 특정 실시양태에서, 바이오마커 프로필은 표 I에 열거된 3개 내지 50개의 바이오마커, 표 I에 열거된 3개 내지 40개의 바이오마커, 표 I에 열거된 4개 이상의 바이오마커, 또는 표 I에 열거된 8개 이상의 바이오마커로 구성된다.
본 발명에 따른 다른 키트는 대상이 패혈증을 발병할 수 있는지 결정하기 위한 컴퓨터 시스템을 포함한다. 컴퓨터 시스템은 중앙 처리 장치, 및 중앙 처리 장치에 연결된 메모리를 포함한다. 상기 메모리는 시험 대상의 바이오마커 프로필을 얻기 위한 지침을 저장한다. 바이오마커 프로필은 다수의 특성을 포함한다. 다수의 특성 중 각각의 특성은 다수의 바이오마커에서 상응하는 바이오마커의 측정가능한 측면이다. 다수의 바이오마커는 표 I에 열거된 3개 이상의 바이오마커를 포함한다. 상기 메모리는 바이오마커 프로필을 리모트 컴퓨터로 전송하기 위한 지침을 추가로 포함한다. 리모트 컴퓨터는 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제1 수치 세트를 만족하는지 평가하기 위한 지침을 포함한다. 제1 수치 세트의 만족은 시험 대상이 패혈증을 발병할 수 있음을 예측한다. 상기 메모리는 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제1 수치 세트를 만족하는지에 대한 결정을 리모트 컴퓨터로부터 수신하기 위한 지침을 추가로 포함한다. 상기 메모리는 또한 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제1 수치 세트를 만족하는지 보고하기 위한 지침을 포함한다. 특정 실시양태에서, 다수의 바이오마커는 표 I에 열거된 6개 이상의 바이오마커를 포함하며, 여기서 다수의 바이오마커는 IL-6 및 IL-8 둘 다를 포함한다. 특정 실시양태에서, 리모트 컴퓨터는 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제2 수치 세트를 만족하는지 평가하기 위한 지침을 추가로 포함한다. 제2 수치 세트의 만족은 시험 대상이 패혈증을 발병하지 않을 수 있음을 예측한다. 그러한 실시양태에서, 상기 메모리는 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제2 세트를 만족하는지에 대한 결정을 리모트 컴퓨터로부터 수신하기 위한 지침 뿐만 아니라, 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제2 수치 세트를 만족하는지 보고하기 위한 지침을 추가로 포함한다. 특정 실시양태에서, 다수의 바이오마커는 표 I에 열거된 4개 이상의 바이오마커를 포함한다. 특정 실시양태에서, 다수의 바이오마커는 표 I에 열거된 6개 이상의 바이오마커를 포함한다.
본 발명의 또 다른 측면은 바이오마커 프로필에서의 각각의 다수의 특성에 대한 각각의 수치를 포함하는 반송파에서 구현된 디지털 신호를 포함한다. 다수의 특성은 다수의 바이오마커의 측정가능한 측면이다. 다수의 바이오마커는 표 I에 열거된 3개 이상의 바이오마커를 포함한다. 특정 실시양태에서, 다수의 바이오마커는 표 I에 열거된 6개 이상의 바이오마커를 포함하며, 여기서 다수의 바이오마커는 IL-6 및 IL-8 둘 다를 포함한다. 특정 실시양태에서, 다수의 바이오마커는 표 I에 열거된 4개 이상의 바이오마커를 포함한다. 특정 실시양태에서, 다수의 바이오마커는 표 I에 열거된 8개 이상의 바이오마커를 포함한다.
본 발명의 또 다른 측면은 시험 대상의 바이오마커 프로필의 다수의 특성이 수치 세트를 만족하는지에 대한 결정을 포함하는 반송파에서 구현된 디지털 신호를 제공한다. 다수의 특성은 다수의 바이오마커의 측정가능한 측면이다. 다수의 바이오마커는 표 I에 열거된 3개 이상의 바이오마커를 포함한다. 수치 세트의 만족은 시험 대상이 패혈증을 발병할 수 있음을 예측한다. 특정 실시양태에서, 다수의 바이오마커는 표 I에 열거된 6개 이상의 바이오마커를 포함하며, 여기서 다수의 바이오마커는 IL-6 및 IL-8 둘 다를 포함한다. 특정 실시양태에서, 다수의 바이오마커는 표 I에 열거된 4개 이상의 바이오마커를 포함한다. 특정 실시양태에서, 다수의 바이오마커는 표 I에 열거된 8개 이상의 바이오마커를 포함한다.
또 다른 실시양태는 시험 대상의 바이오마커 프로필에서의 다수의 특성이 수치 세트를 만족하는지에 대한 결정을 포함하는 반송파에서 구현된 디지털 신호를 제공한다. 다수의 특성은 다수의 바이오마커의 측정가능한 측면이다. 다수의 바이오마커는 표 I에 열거된 3개 이상의 바이오마커를 포함한다. 수치 세트의 만족은 시험 대상이 패혈증을 발병하지 않을 수 있음을 예측한다. 특정 실시양태에서, 다수의 바이오마커는 표 I에 열거된 6개 이상의 바이오마커를 포함하며, 여기서 다수의 바이오마커는 IL-6 및 IL-8 둘 다를 포함한다. 특정 실시양태에서, 다수의 바이오마커는 표 I에 열거된 4개 이상의 바이오마커를 포함한다. 특정 실시양태에서, 다수의 바이오마커는 표 I에 열거된 8개 이상의 바이오마커를 포함한다.
또 다른 본 발명의 실시양태는 대상이 패혈증을 발병할 수 있는지 결정하기 위한 그래픽 사용자 인터페이스를 제공한다. 그래픽 사용자 인터페이스는 리모트 컴퓨터으로부터 수신된 반송파에서 구현된 디지털 신호에서 코딩된 결과를 제시하기 위한 디스플레이 필드를 포함한다. 다수의 특성은 다수의 바이오마커의 측정가능한 측면이다. 다수의 바이오마커는 표 I에 열거된 3개 이상의 바이오마커를 포함한다. 시험 대상의 바이오마커 프로필의 다수의 특성이 제1 수치 세트를 만족하는 경우에 결과는 제1 수치를 갖는다. 시험 대상의 바이오마커 프로필의 다수의 특성이 제2 수치 세트를 만족하는 경우에 결과는 제2 수치를 갖는다. 특정 실시양태에서, 다수의 바이오마커는 표 I에 열거된 6개 이상의 바이오마커를 포함하며, 여기서 다수의 바이오마커는 IL-6 및 IL-8을 포함한다. 특정 실시양태에서, 다수의 바이오마커는 표 I에 열거된 4개 이상의 바이오마커를 포함한다. 특정 실시양태에서, 다수의 바이오마커는 표 I에 열거된 8개 이상의 바이오마커를 포함한다.
본 발명의 또 다른 키트는 대상이 패혈증을 발병할 수 있는지 결정하기 위한 컴퓨터 시스템을 제공한다. 컴퓨터 시스템은 중앙 처리 장치, 및 중앙 처리 장치에 연결된 메모리를 포함한다. 상기 메모리는 시험 대상의 바이오마커 프로필을 얻기 위한 지침을 저장한다. 바이오마커 프로필은 다수의 특성을 포함한다. 다수의 특성은 다수의 바이오마커의 측정가능한 측면이다. 다수의 바이오마커는 표 I에 열거된 3개 이상의 바이오마커를 포함한다. 상기 메모리는 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제1 수치 세트를 만족하는지에 대한 평가를 위한 지침을 추가로 저장한다. 제1 수치 세트의 만족은 시험 대상이 패혈증을 발병할 수 있음을 예측한다. 상기 메모리는 또한 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제1 수치 세트를 만족하는지 보고하기 위한 지침을 저장한다. 특정 실시양태에서, 다수의 바이오마커는 표 I에 열거된 6개 이상의 바이오마커를 포함하며, 여기서 다수의 바이오마커는 IL-6 및 IL-8 둘 다를 포함한다. 특정 실시양태에서, 다수의 바이오마커는 표 I에 열거된 4개 이상의 바이오마커를 포함한다. 특정 실시양태에서, 다수의 바이오마커는 표 I에 열거된 8개 이상의 바이오마커를 포함한다.
5.4 바이오마커 프로필의 생성
한 실시양태에 따라, 본 발명의 방법은 대상으로부터 얻은 생물학적 샘플로부터의 바이오마커 프로필의 생성을 포함한다. 생물학적 샘플은, 예를 들어 전혈, 혈장, 혈청, 적혈구, 혈소판, 호중구, 호산구, 호염구, 림프구, 단핵구, 타액, 객담, 소변, 뇌척수액, 세포, 세포 추출물, 조직 샘플, 조직 생검, 대변 샘플 또는 당업자에게 익히 공지된 기술을 이용하여 대상으로부터 얻을 수 있는 임의의 샘플일 수 있다. 특정 실시양태에서, 바이오마커 프로필은 하나 이상의 개별 시점에서 대상으로부터 수집한 샘플을 사용하여 결정된다. 다른 특정 실시양태에서, 바이오마커 프로필은 개별 시점에서 대상으로부터 얻은 샘플을 사용하여 생성된다. 한 실시양태에서, 이들 샘플은 대상으로부터 한번 또는, 별볍으로는 하루 단위로, 또는 예를 들어, 4, 6, 8 또는 12시간 마다 보다 빈번하게 얻는다. 특정 실시양태에서, 바이오마커 프로필은 단일 조직 유형으로부터 수집된 샘플을 사용하여 결정된다. 다른 특정 실시양태에서, 바이오마커 프로필은 2개 이상의 상이한 조직 유형으로부터 수집한 샘플을 사용하여 결정된다.
5.4.1 핵산 바이오마커의 검출 방법
본 발명의 특정 실시양태에서, 바이오마커 프로필에서의 바이오마커는 핵산이다. 그러한 바이오마커 및 바이오마커 프로필의 상응하는 특성은, 예를 들어 본원에 기재된 하나 이상의 유전자 (예를 들어, 표 30, 표 I, 표 J, 또는 표 K에 열거된 유전자)의 발현 생성물 (예를 들어, 폴리뉴클레오티드 또는 폴리펩티드)을 검출함으로써 생성될 수 있다. 특정 실시양태에서, 바이오마커 및 바이오마커 프로필에서 상응하는 특성은 본원에 개시된 유전자 (예를 들어, 표 30, 표 I, 표 J, 또는 표 K에 열거된 유전자)로부터 발현된 하나 이상의 핵산을, 여기에 제한되지는 않지만, 혼성화, 미세배열 분석, RT-PCR, 뉴클레아제 보호 검정법 및 노던 블롯팅 분석을 비롯한 당업자에게 익히 공지된 임의의 방법을 이용하여 검출 및/또는 분석함으로써 얻어진다.
특정 실시양태에서, 본 발명의 방법 및 조성물에 의해 검출 및/또는 분석된 핵산에는 RNA 분자, 예컨대 메신저 RNA (mRNA) 분자, mRNA 스플라이싱 변이체 뿐만 아니라 rRNA, cRNA 분자 (예를 들어, 시험관내에서 전사된 cDNA 분자로부터 제조된 RNA 분자) 및 그의 구별가능한 단편을 포함하는 발현된 RNA 분자가 포함된다. 본 발명의 방법 및 조성물에 의해 검출 및/또는 분석된 핵산에는 또한, 예를 들어 DNA 분자 예컨대 게놈 DNA 분자, cDNA 분자, 및 그의 구별가능한 단편 (예를 들어, 올리고뉴클레오티드, EST, STS 등)이 포함된다.
본 발명의 방법 및 조성물에 의해 검출 및/또는 분석된 핵산 분자는 자연적으로 발생한 핵산 분자, 예컨대 샘플로부터 단리된 게놈 또는 엑스트라게놈 DNA 분자, 또는 생물학적 샘플에 존재하거나 그로부터 단리 또는 유도된 RNA 분자, 예컨대 mRNA 분자일 수 있다. 본 발명의 방법 및 조성물에 의해 검출 및/또는 분석된 핵산의 샘플은, 예를 들어 DNA, RNA, 또는 DNA 및 RNA의 공중합체의 분자를 포함한다. 일반적으로, 이들 핵산은 특정 유전자 또는 유전자의 대립유전자, 또는 특정 유전자 전사체 (예를 들어, 특정 세포 유형에서 발현된 특정 mRNA 서열 또는 그러한 mRNA 서열로부터 유도된 특정 cDNA 서열)에 상응한다. 본 발명의 방법 및 조성물에 의해 검출 및/또는 분석된 핵산은 동일한 유전자의 상이한 엑손에 상응할 수 있으며, 예를 들어 유전자의 상이한 스플라이스 변이체가 검출되고/되거나 분석될 수 있다.
특정 실시양태에서, 핵산은 생물학적 샘플에 존재하거나, 그로부터 단리되거나, 부분적으로 단리된 핵산으로부터 시험관내에서 제조된다. 예를 들어, 한 실시양태에서, RNA는 샘플로부터 추출되며 (예를 들어, 전체 세포 RNA, 폴리(A)+ 메신저 RNA, 그의 단편), 메신저 RNA는 전체 추출된 RNA로부터 정제된다. 전체 및 폴리(A)+ RNA의 제조 방법은 당업계에 익히 공지되어 있으며, 예를 들어 전문이 본원에 참고로 포함되는 문헌 [Sambrook et al., 2001, Molecular Cloning: A Laboratory Manual. 3rd ed. Cold Spring Harbor Laboratory Press (Cold Spring Harbor, New York)]에 상세히 기재되어 있다. 한 실시양태에서, RNA는 구아니디늄 티오시아네이트 용해에 이어 CsCl 원심분리 및 올리고 dT 정제를 이용하여 샘플로부터 추출한다 (문헌 [Chirgwin et al, 1979, Biochemistry 18:5294-5299]). 다른 실시양태에서, RNA는 구아니디늄 티오시아네이트 용해에 이어 RNeasy 칼럼 (퀴아겐 (Qiagen; Valencia, California))에서 정제하여 샘플로부터 추출한다. 이어서 cDNA는, 예를 들어 올리고-dT 또는 랜덤 프라이머를 사용하여 정제된 mRNA로부터 합성한다. 특정 실시양태에서, 표적 핵산은 샘플로부터 추출한 정제된 메신저 RNA로부터 제조한 cRNA이다. 본원에 사용된 cRNA는 공급원 RNA에 대한 RNA 상보체로 정의된다. 추출한 RNA는 이중가닥 cDNA가 안티센스 RNA의 직접 전사가 가능한 방향으로 RNA 폴리머라제 프로모터에 연결된 프라이머를 사용하여 RNA로부터 합성된 방법을 이용하여 증폭된다. 이어서, 안티센스 RNA 또는 cRNA는 RNA 폴리머라제를 사용하여 이중가닥 cDNA의 제2 가닥으로부터 전사된다 (예를 들어, 본원에 참고로 포함되는 미국 특허 제5,891,636호, 동 제5,716,785호; 동 제5,545,522호 및 동 제6,132,997호 참조). 올리고-dT 프라이머 (본원에 참고로 포함되는 미국 특허 제5,545,522호 및 동 제6,132,997호) 또는 RNA 폴리머라제 프로모터 또는 그의 상보체를 함유하는 랜덤 프라이머가 둘 다 사용될 수 있다. 특정 실시양태에서 표적 핵산은 샘플의 대표적인 원래 핵산 집단인 짧은 가닥 및/또는 단편 핵산 분자이다.
한 실시양태에서, 본 발명의 핵산은 검출가능하게 표지될 수 있다. 예를 들어, cDNA는, 예를 들어 뉴클레오티드 유사체로 직접 표지화되거나, 또는 예를 들어, 주형으로 제1 가닥을 이용하여 표지화된 제2 cDNA 가닥을 만듦으로써 간접적으로 표지화될 수 있다. 별법으로, 이중가닥 cDNA는 cRNA로 전사되고, 표지화될 수 있다.
특정 실시양태에서 검출가능한 표지는, 예를 들어 뉴클레오티드 유사체의 포함으로 인한 형광 표지이다. 본 발명에서 사용하기에 적합한 다른 표지는 비제한적으로, 비오틴, 이미노비오틴, 항원, 공동인자, 디니트로페놀, 리포산, 올레핀 화합물, 검출가능한 폴리펩티드, 전자 풍부 분자, 기질 상의 작용에 의해 검출가능한 신호를 생성할 수 있는 효소, 및 방사성 동위원소를 포함한다. 적합한 방사성 동위원소에는 32P, 35S, 14C, 15N 및 125I가 포함된다. 본 발명에 적합한 형광 분자에는 비제한적으로, 플루오레세인 및 그의 유도체, 로다민 및 그의 유도체, 텍사스 (Texas) 레드, 5'카르복시-플루오레세인 ("FMA"), 6-카르복시-4',5'-디클로로-2',7'-디메톡시플루오레세인, 숙신이미딜 에스테르 ("JOE"), 6-카르복시테트라메틸로다민 ("TAMRA"), 6N 카르복시-X-로다민 ("ROX"), HEX, TET, IRD40, 및 IRD41이 포함된다. 본 발명에 적합한 형광 분자에는 또한 비제한적으로: Cy3, Cy3.5 및 Cy5 등을 비롯한 시아민 염료; BODIPY-FL, BODIPY-TR, BODIPY-TMR, BODIPY-630/650, BODIPY-650/670 등을 비롯한 BODIPY 염료; 및 ALEXA-488, ALEXA-532, ALEXA-546, ALEXA-568, 및 ALEXA-594 등을 비롯한 ALEXA 염료; 뿐만 아니라 당업자에게 공지된 다른 형광 염료가 포함된다. 본 발명에 적합한 전자-풍부 지시자 분자에는 비제한적으로, 페리틴, 헤모시아닌, 및 콜로이드 금이 포함된다. 달리, 특정 실시양태에서 표적 핵산은 제1 군을 핵산으로 특이적으로 착체화시킴으로써 표지화될 수 있다. 지시자 분자에 공유적으로 연결되고, 제1 군에 대해 친화도를 갖는 제2 군은 표적 핵산을 간접적으로 검출하기 위해 사용될 수 있다. 그러한 실시양태에서, 제1 군으로 사용하기에 적합한 화합물에는 비제한적으로, 비오틴 및 이미노비오틴이 포함된다. 제2 군으로 사용하기에 적합한 화합물에는 비제한적으로, 아비딘 및 스트렙타비딘이 포함된다.
5.4.1.1 핵산 배열
본 발명의 특정 실시양태에서, 핵산 배열은 임의의 하나 이상의 본원에 기재된 유전자 (예를 들어, 표 30, 표 I, 표 J 또는 표 K에 열거된 유전자)의 발현을 검출함으로써 바이오마커 프로필에서의 바이오마커의 특성을 생성하기 위해 이용한다. 본 발명의 한 실시양태에서, 미세배열, 예컨대 cDNA 미세배열은 바이오마커 프로필에서의 바이오마커의 특성 수치를 결정하기 위해 사용된다. 진단용 cDNA 배열은 당업계에 익히 공지되어 있다 (예를 들어, 각각의 전문이 참고로 본원에 포함되는 문헌 [Zou et. al., 2002, Oncogene 21:4855-4862]; 및 [Draghici, 2003, Data Analysis Tools for DNA Microarrays, Chapman & Hall/CRC] 참조). cDNA 미세배열 분석을 위한 예시적 방법은 하기 및 하기 섹션 6의 실시예에 기재되어 있다.
특정 실시양태에서, 바이오마커 프로필에서 바이오마커에 대한 특성 수치는 생물학적 샘플에 존재하는 mRNA 전사체에서의 핵산 서열 (예를 들어, 샘플로부터 합성된 형광 표지된 cDNA)을 나타내거나 이에 상응하는 검출가능하게 표지화된 핵산 배열을 하나 이상의 프로브 스폿을 포함하는 미세배열에 혼성화함으로써 얻는다.
핵산 배열, 예를 들어, 미세배열은 본원에 하기 기재된 다수의 방식으로 구성될 수 있다. 바람직하게는, 상기 배열은 재생가능하여, 제시된 배열의 다중 사본이 생산되고 상기 미세배열을 서로 비교할 수 있게 한다. 바람직하게는, 상기 배열은 결합 (예를 들어, 핵산 혼성화) 상태 하에 안정한 물질로부터 제조된다. 당업자는 시험 프로브를 배열 상의 프로브 스폿에 혼성화하기에 적합한 지지체, 기질 또는 담체를 알고 있거나, 통상적 실험을 이용하여 상기를 확인할 것이다.
사용된 배열, 예를 들어 미세배열은 하나 이상의 시험 프로브를 포함할 수 있다. 특정 실시양태에서 각각의 그러한 시험 프로브는 검출될 RNA 또는 DNA의 하위 서열에 상보성인 핵산 서열을 포함한다. 각각의 프로브는 전형적으로 상이한 핵산 서열을 가지며, 배열의 고체 표면 상의 각각의 프로브의 위치는 일반적으로 공지되어 있거나, 결정될 수 있다. 본 발명에 따라 유용한 배열은, 예를 들어 올리고뉴클레오티드 미세배열, cDNA 기재 배열, SNP 배열, 스플라이스 변이체 배열, 및 본원에 기재된 유전자 (예를 들어, 표 30, 표 I, 표 J 또는 표 K에 열거된 유전자)의 발현의 정성적, 정량적 또는 반-정량적 측정을 제공할 수 있는 임의의 다른 배열을 포함할 수 있다. 특정 유형의 미세배열은 배열에 접근할 수 있다. 보다 특히, 특정 미세배열은 배열에 위치적으로 접근할 수 있다. 특정 실시양태에서, 배열의 각각의 프로브는 고체 지지체 상의 공지되고 예정된 자리에 위치하므로, 배열 상의 그의 위치 (예를 들어, 지지체 또는 표면 상)로부터 각각의 프로브의 정체성 (예를 들어, 서열)을 결정할 수 있다. 특정 실시양태에서, 상기 배열은 정렬된 배열이다. 미세배열은 전문이 본원에 참고로 포함되는 문헌 [Draghici, 2003, Data Analysis Tools for DNA Microarrays, Chapman & Hall/CRC]에 일반적으로 기재되어 있다.
본 발명의 특정 실시양태에서, 발현된 전사체 (예를 들어, 본원에 기재된 유전자의 전사체)는 핵산 배열에서 나타난다. 그러한 실시양태에서, 결합 부위 세트는 발현된 전사체의 상이한 서열 조각에 상보성인 상이한 핵산과 함께 프로브를 포함할 수 있다. 이 부류 내에 있는 예시적 핵산은 15개 내지 200개의 염기, 20개 내지 100개의 염기, 25개 내지 50개의 염기, 40개 내지 60개의 염기 또는 다른 특정 범위의 염기의 길이일 수 있다. 각각의 프로브 서열은 또한 하나 이상의 링커 서열에 더하여 그의 표적 서열에 상보성인 서열을 포함할 수 있다. 본원에 사용된, 링커 서열은 그의 표적 서열에 상보성인 서열 및 지지체의 표면 사이의 서열이다. 예를 들어, 본 발명의 핵산 배열은 각각의 표적 유전자 또는 엑손에 특이적인 하나의 프로브를 포함할 수 있다. 그러나, 경우에 따라, 상기 핵산 배열은 특정 발현된 전사체 (예를 들어, 본원, 예를 들어 표 30, 표 I, 표 J, 또는 표 K에 기재된 유전자의 전사체)에 특이적인 2, 5, 10, 100, 또는 1000개 이상의 프로브를 함유할 수 있다. 예를 들어, 배열은 유전자의 가장 긴 mRNA 이소형태의 서열을 통해 타일화된 프로브를 함유할 수 있다.
세포, 예를 들어 생물학적 샘플에서의 세포의 RNA에 대한 cDNA 상보성은 적합한 혼성화 상태 하에 미세배열에 혼성화되거나 제조되고, 본원에 기재된 유전자 (예를 들어, 표 30, 표 I, 표 J, 또는 표 K에 열거된 유전자)에 상응하는 배열에서 부위에 대한 혼성화 수준은 상기 유전자로부터 전사된 mRNA 또는 mRNA들의 세포에서의 우세함을 반영할 것임이 인지될 것이다. 별법으로, 특정 유전자에 의해 생산된 다중 이소형태 또는 대체적 스플라이스 변이체를 구별해야 하는 경우, 전체 세포 mRNA에 상보성인 검출가능하게 표지화된 (예를 들어, 형광단으로) cDNA는 미세배열과 혼성화될 수 있고, RNA 스플라이싱 동안 전사되지 않거나 제거된 유전자의 엑손에 상응하는 배열 상의 부위는 거의 없거나 신호 (예를 들어, 형광 신호)가 없을 것이고, 엑손을 발현시키는 코딩된 mRNA가 우세한 유전자의 엑손에 상응하는 부위는 상대적으로 강한 신호를 가질 것이다. 동일한 유전자로부터 대체적 스플라이싱에 의해 생성된 상이한 mRNA의 상대적 풍부도는 이때, 유전자를 모니터링한 엑손의 전체 세트를 통해 강한 패턴의 신호에 의해 결정된다.
한 실시양태에서, 상이한 혼성화 시기에서의 혼성화 수준은 상이한, 동일한 미세배열에서 개별적으로 측정된다. 각각의 그러한 측정을 위해, 혼성화 수준이 측정되는 혼성화 시기에, 바람직하게는 실온에서 염 농도가 높거나 중간인 (예를 들어, 0.5 내지 3 M 염 농도) 수용액 중에서 모든 결합하지 않은 핵산은 제거하는 한편 모든 결합하거나 혼성화된 핵산을 보유한 상태 하에 미세배열을 단시간 세척한다. 각각의 프로브 상의 나머지 혼성화된 핵산 분자 상의 검출가능한 표지는 이때, 사용된 특정 표지화 방법에 적합한 방법에 의해 측정된다. 이때, 생성된 혼성화 수준은 혼성화 그래프를 형성하기 위해 조합된다. 다른 실시양태에서, 혼성화 수준은 단일 미세배열을 이용한 실제 시간에 측정된다. 이 실시양태에서, 상기 미세배열은 방해 없이 샘플에 혼성화되도록 하고, 미세배열은 비-침습적 방식으로 각각의 혼성화 시기에서 정보를 얻는다. 또 다른 실시양태에서, 하나의 배열을 사용하여, 단시간 동안 혼성화하고, 세척하고, 혼성화 수준을 측정하고, 동일한 샘플을 다시 놓고, 추가 시간 동안 혼성화하고, 세척하고, 혼성화 시간 그래프를 다시 얻기 위해 측정할 수 있다.
특정 실시양태에서, 핵산 혼성화 및 세척 상태를 선택하여, 분석할 핵산 바이오마커가 배열의 상보성 핵산 서열이 전형적으로 그의 상보성 DNA가 위치한 특정 배열 부위에 특이적으로 결합하거나 혼성화되게 한다.
그 위에 놓인 이중가닥 프로브 DNA를 함유한 배열은 변성 상태에서 표적 핵산 분자와 접촉하기 전에 DNA가 단일가닥이 되도록 한다. 단일가닥 프로브 DNA (예를 들어, 합성 올리고데옥시리보핵산) 함유 배열은 표적 핵산 분자와 접촉시키기 전에 변성되어, 예를 들어 자가 상보성 서열로 인해 형성된 헤어핀 또는 이량체를 제거할 수 있다.
최적 혼성화 상태는 프로브 및 표적 핵산의 길이 (예를 들어, 올리고머 대 200개 염기보다 긴 폴리뉴클레오티드) 및 유형 (예를 들어, RNA, 또는 DNA)에 따라 달라진다. 핵산의 특정 (즉, 엄격한) 혼성화 상태에 대한 일반적인 파라미터는 문헌 [Sambrook et al, (supra), and in Ausubel et al, 1988, Current Protocols in Molecular Biology, Greene Publishing and Wiley-Interscience, New York]에 기재되어 있다. 세나 (Shena) 등의 cDNA 미세배열이 이용되는 경우, 전형적인 혼성화 상태는 5 X SSC 플러스 0.2% SDS에서 65℃에서 4시간 동안 혼성화하고, 이어서 25℃에서 조금 엄격한 세척 완충액 (1 X SSC 플러스 0.2% SDS)으로 세척한 후, 10분 동안 25℃에서 매우 엄격한 세척 완충액 (0.1 X SSC 플러스 0.2% SDS)으로 세척한다 (문헌 [Shena et al, 1996, Proc. Natl. Acad. Sci. U.S.A. 93:10614]). 유용한 혼성화 상태는 또한, 예를 들어 이들의 전문이 본원에 참고로 포함되는 문헌 [Tijessen, 1993, Hybridization With Nucleic acid Probe, Elsevier Science Publishers B.V.]; [Kricka,1992, Nonisotopic DNA Probe Techniques, Academic Press, San Diego, CA]; 및 [Zou et. al., 2002, Oncogene 21:4855-4862]; 및 [Draghici, Data Analysis Tools for DNA MicroAnalysis, 2003, CRC Press LLC, Boca Raton, Florida, pp. 342-343]에서 제공된다.
특정 실시양태에서, 미세배열은, 예를 들어 하기 섹션 5.4.1.2에 기재된 방법에 의해 생성된 RT-PCR 생성물을 분류하기 위해 이용될 수 있다.
5.4.1.2 RT-PCR
특정 실시양태에서, 본 발명의 바이오마커 프로필에서의 바이오마커에 대한 특성 수치를 결정하기 위해, 본원에 기재된 하나 이상의 유전자 (예를 들어, 표 30, 표 I, 표 J, 또는 표 K에 열거된 유전자)의 발현 수준을 역전사 (RT)와 폴리머라제 연쇄 반응 (PCR)을 이용하여 샘플로부터 RNA를 증폭시킴으로써 측정한다. 이 실시양태에 따라, 역전사는 정량적 또는 반-정량적일 수 있다. 본원에 교시된 RT-PCR 방법이 상기, 예를 들어 섹션 5.4.1.1에 기재된 미세배열 방법과 함께 이용될 수 있다. 예를 들어, 벌크 PCR 반응이 수행될 수 있으며, 상기 PCR 생성물은 분석되어 미세배열 상의 프로브 스폿으로 사용될 수 있다 (또한, 하기 섹션 6.10 참조).
샘플로부터의 총 RNA, 또는 mRNA가 주형으로 사용되고, 유전자(들)의 전사된 일부에 특이적인 프라이머가 역전사를 시작하기 위해 사용된다. RNA를 cDNA로 역전사하는 방법은 익히 공지되어 있고, 샘브룩 (Sambrook) 등의 2001년도 상기 문헌에 기재되어 있다. 프라이머 고안은 임의의 공개적으로 입수가능한 서열 데이터베이스, 예컨대 진뱅크 (GenBank)로부터 공개되거나 입수가능한 공지된 뉴클레오티드 서열에 기초하여 달성될 수 있다. 예를 들어, 프라이머는 본원 (예를 들어, 표 30, 표 I, 표 J, 또는 표 K)에 기재된 임의의 유전자에 대해 고안될 수 있다. 추가로, 프라이머 고안은 상업적으로 입수가능한 소프트웨어 (예를 들어, 프라이머 디자이너 1.0, 사이언티픽 소프트웨어 등)를 이용함으로써 달성될 수 있다. 역전사의 생성물은 후속적으로 PCR에 대한 주형으로 사용된다.
PCR은 관심있는 표적 서열을 증폭시키기 위해 열안정성 DNA-의존 DNA 폴리머라제에 의해 촉매된 DNA 복제의 다중 주기를 이용하여 특정 핵산 서열을 신속하게 증폭시키는 방법을 제공한다. PCR은 증폭시킬 핵산, 증폭시킬 서열을 플랭킹하는 2개의 단일가닥 올리고뉴클레오티드 프라이머, DNA 폴리머라제, 데옥시리보뉴클레오시드 트리포스페이트, 완충액 및 염의 존재가 필요하다. PCR 방법은 당업계에 익히 공지되어 있다. PCR은, 예를 들어 전문이 본원에 참고로 포함되는 문헌 [Mullis and Faloona, 1987, Method Enzymol. 155:335]에 기재된 바와 같이 수행된다.
PCR은 주형 DNA 또는 cDNA (1 fg 이상; 보다 유용하게는, 1 내지 1000 ng) 및 25 pmol 이상의 올리고뉴클레오티드 프라이머를 사용하여 수행될 수 있다. 전형적인 반응 혼합물은: 2 μl의 DNA, 25 pmol의 올리고뉴클레오티드 프라이머, 2.5 μl의 10 M PCR 완충액 1 (퍼킨-엘머 (Perkin-Elmer, Foster City, CA)), 0.4 μl의 1.25 M dNTP, 0.15 μl (또는 2.5 단위)의 Taq DNA 폴리머라제 (퍼킨 엘머)를 포함하며, 탈이온수를 첨가하여 총 부피 25 μl가 된다. 무기 오일을 바르고, PCR을 프로그래밍가능한 써멀 싸이클러를 이용하여 수행한다.
PCR 주기의 각각의 단계의 기간 및 온도 뿐만 아니라, 주기의 수는 사실상 엄격도 요건에 따라 조정된다. 어닐링 온도 및 타이밍은 둘 다 프라이머가 주형에 어닐링되기 위해 추정되는 효율 및 용인될 미스맷치 정도에 의해 결정된다. 프라이머 어닐링 상태의 엄격도를 최적화시키는 능력은 당업자의 지식 범위 내에 있다. 30℃ 내지 72℃의 어닐링 온도가 사용된다. 주형 분자의 초기 변성은 보통 92℃ 내지 99℃에서 4분 동안 일어나고, 이어서 변성 (94 내지 99℃에서 15초 내지 1분 동안), 어닐링 (상기 논의된 바와 같이 결정된 온도; 1 내지 2분), 및 신장 (72℃에서 1분 동안)으로 이루어진 주기가 20 내지 40회 반복된다. 최종 신장 단계는 일반적으로 4분 동안 72℃에서 수행되며, 4℃에서 불확정 (0 내지 24시간) 단계가 있을 수 있다.
실제로 정량적인 정량적 RT-PCR ("QRT-PCR")이 또한 수행되어 유전자 발현 수준의 정량적 측정을 제공할 수 있다. QRT-PCR에서 역전사 및 PCR은 두 단계로 수행될 수 있거나, 또는 PCR과 조합된 역전사가 동시에 수행될 수 있다. 택맨 (Taqman) (퍼킨 엘머)과 같은 상업적으로 입수가능한 키트 또는 어플라이드 바이오시스템즈 (Applied Biosystems; Foster City, California)에 의해 제공된 바와 같은 이러한 기술 중 하나가 전사체-특이적 안티센스 프로브로 수행된다. 이 프로브는 PCR 생성물 (예를 들어, 유전자로부터 유래한 핵산 단편)에 대해 특이적이며, 올리고뉴클레오티드의 5' 말단에 착체화된 소광제 (quencher) 및 형광 리포터 프로브로 제조된다. 상이한 형광 마커를 상이한 리포터에 부착하면, 한 반응에서 두 생성물의 측정을 가능하게 한다. Taq DNA 폴리머라제가 활성화되면, 그의 5'에서 3' 엑소뉴클레아제 활성으로 주형에 결합된 프로브의 형광 리포터를 절단한다. 소광제의 부재 하에, 리포터는 이제 발광한다. 리포터에서의 색 변화는 각각의 특정 생성물의 양에 비례하여, 이를 플루오로미터로 측정함으로써, 각각의 색깔 양을 측정하고 PCR 생성물을 정량화한다. PCR 반응은 96-웰 플레이트에서 수행되어 다수의 개체로부터 유도된 샘플을 처리하고, 동시에 측정한다. 택맨 시스템은 겔 전기영동을 필요로 하지 않는 추가 이점을 가지며, 표준 그래프로 사용하는 경우에 정량화를 가능하게 한다.
PCR 생성물을 정량적으로 검출하기에 유용한 2차 기술은 삽입 염료, 예컨대 상업적으로 입수가능한 퀀티텍트 (QuantiTect) SYBR 그린 PCR (퀴아겐)을 이용하는 것이다. RT-PCR은 PCR 병기 동안 PCR 생성물에 포함되며 PCR 생성물의 양에 비래하여 형광을 생성하는 형광 표지로서 SYBR 그린을 사용하여 수행한다.
택맨 및 퀀티텍트 SYBR 시스템은 모두 후속적으로 RNA의 역전사를 위해 이용될 수 있다. 역전사는 PCR 단계와 같이 동일한 반응 혼합물에서 (1 단계 프로토콜) 수행되거나, 또는 역전사는 먼저 증폭 이전에 PCR을 이용하여 (2 단계 프로토콜) 수행될 수 있다.
또한, mRNA 발현 생성물의 정량적 측정을 위한 다른 시스템은 형광 분자 및 소광제 분자를 갖는 프로브를 사용하여 몰레큘라 비콘스 (Molecular Beacons; 등록상표)를 비롯하여 공지되어 있으며, 상기 프로브는 헤어핀 구조를 형성할 수 있으며, 헤어핀 형태인 경우에 형광 분자는 소광되고, 형광 물질과 혼성화된 경우에 주어진 유전자 발현의 정량적 측정은 증가한다.
RNA 발현의 정량적 측정에 대한 부가적 기술에는 비제한적으로, 폴리머라제 연쇄 반응, 리가제 연쇄 반응, Q베타 레플리카제 (예를 들어, 참고로 본원에 포함되는 국제 출원 제PCT/US87/00880호 참조), 등온 증폭 방법 (예를 들어, 참고로 본원에 포함되는 문헌 [Walker et al.,1992, PNAS 89:382-396] 참조), 가닥 교체 증폭 (SDA), 수선 연쇄 반응, 비대칭 정량적 PCR (예를 들어, 참고로 본원에 포함되는 미국 공개번호 제US 2003/30134307A1호 참조) 및 참고로 본원에 포함되는 문헌 [Fuja et al., 2004, Journal of Biotechnology 108:193-205]에 기재된 다중 마이크로스피어 비드 검정법이 포함된다.
본원에 기재된 하나 이상의 유전자 (예를 들어, 표 30, 표 I, 표 J, 또는 표 K에 열거된 유전자)의 발현 수준은, 예를 들어 샘플로부터 증폭 (NASBA)을 이용하여 RNA를 증폭시켜 측정될 수 있다 (예를 들어, 참고로 본원에 각각 포함되는 문헌 [Kwoh et al., 1989, PNAS USA 86:1173; International Publication No. WO 88/10315]; 및 미국 특허 제6,329,179호 참조). NASBA에서, 핵산은, 예를 들어 페놀/클로로포름 추출, 열 변성, 용해 완충액으로 처리, 및 DNA 및 RNA 단리 또는 RNA의 구아니디늄 클로라이드 추출을 위한 미니스핀 칼럼을 비롯한 기존 방법을 이용하여 증폭시켜 제조할 수 있다. 이들 증폭 기술은 특정 서열을 표적화하는 프라이머를 어닐링하는 것을 포함한다. 중합에 이어, DNA/RNA 혼성물은 RNase H로 분해되는 한편, 이중가닥 DNA 분자는 다시 열 변성된다. 각각의 경우에 단일가닥 DNA는, 제2 표적 특정 프라이머의 첨가에 이어 중합으로 전체 이중가닥을 완전히 형성한다. 이어서, 이중가닥 DNA 분자는 폴리머라제, 예컨대 T7 또는 SP6에 의해 배가 전사된다. 등온 시클릭 반응에서, RNA는 이중가닥 DNA로 역전사되고, 폴리머라제, 예컨대 T7 또는 SP6으로 한번 전사된다. 말단 절단되든지 완전하든지 간에, 생성된 생성물은 표적 특이적 서열을 나타낸다.
수가지 기술이 증폭 생성물을 분리하기 위해 이용될 수 있다. 예를 들어, 증폭 생성물은 기존의 방법을 이용하여 아가로스, 아가로스-아크릴아미드 또는 폴리아크릴아미드 겔 전기영동에 의해 분리될 수 있다 (문헌 [Sambrook et al., 2001] 참조). PCR 생성물을 전기영동 없이 정량적으로 검출하는 수가지 기술이 또한 본 발명에 따라 이용될 수 있다 (예를 들어, 참고로 본원에 포함되는 문헌 [PCR Protocols, Guide to Methods and Applications, Innis et al., 1990, Academic Press, Inc. N. Y.] 참조). 예를 들어, 크로마토그래피 기술은 효과적으로 분리하기 위해 사용될 수 있다. 본 발명에서 사용될 수 있는 많은 종류의 크로마토그래피가 존재한다: 흡착, 분배, 이온-교환 및 분자 체, HPLC, 및 칼럼, 페이퍼, 박층 및 기체 크로마토그래피를 비롯하여 이들을 이용하기 위한 다수의 특화된 기술 (참고로 본원에 포함되는 문헌 [Freifelder, Physical Biochemistry Applications to Biochemistry and Molecular Biology, 2nd ed., Wm. Freeman and Co., New York, N. Y., 1982]).
분리 방법의 다른 예는 PCR 반응에서 사용된 올리고뉴클레오티드 프라이머를 다양한 유형의 소분자 리간드로 공유적으로 표지하는 것이다. 그러한 한 분리에서, 상이한 리간드가 각각의 올리고뉴클레오티드 상에 존재한다. 리간드 중 하나에 특이적으로 결합하는 항체 또는 리간드가 비오틴인 경우에 아비딘일 것인 분자가 플레이트, 예컨대 96 웰 ELISA 플레이트의 표면을 코팅하기 위해 사용된다. 상기와 같이 제조된 플레이트에 PCR 반응을 적용함에 있어서, PCR 생성물은 상기 표면에 특이도를 가지고 결합한다. 결합하지 않은 시약을 제거하기 위해 플레이트를 세척한 후에, 제1 리간드에 결합하는 제2 분자를 함유하는 용액을 첨가한다. 이 제2 분자는 특정 종류의 리포터 시스템에 연결된다. 올리고뉴클레오티드 프라이머 둘 다가 최종 PCR 생성물로 혼입되어 PCR 생성물이 생성된 경우에 제2 분자만이 플레이트에 결합한다. 이어서, PCR 생성물의 양은 ELISA 반응이 검출되고 정량화되는 만큼 상업적 플레이트 리더에서 검출하고, 정량화한다. ELISA-유사 시스템, 예컨대 본원에 기재된 것은 라기오 이탈젠 (Raggio Italgene; C-Track (상표명))에 의해 개발되었다.
증폭 생성물은 관심있는 핵산 서열, 즉, 본원에 기재된 하나 이상의 유전자 (예를 들어, 표 30, 표 I, 표 J, 또는 표 K에 열거된 유전자)의 핵산 서열의 증폭을 확인하기 위해 가시화되어야 한다. 한 전형적인 가시화 방법은 에티듐 브로마이드로 겔을 염색하고, UV 광 하에서 가시화하는 것을 포함한다. 별법으로, 증폭 생성물이 방사성- 또는 형광-표지화된 뉴클레오티드로 완전히 표지화된 경우, 이때 증폭 생성물은 x-선 필름에 노출되거나, 적합한 자극 스펙트럼 하에서 가시화되고, 분리될 수 있다.
한 실시양태에서, 가시화가 간접적으로 달성된다. 증폭 생성물의 분리에 이어, 표지된 핵산 프로브는 관심있는 증폭된 핵산 서열, 즉, 본원에 기재된 하나 이상의 유전자 (예를 들어, 표 30, 표 I, 표 J, 또는 표 K에 열거된 유전자)의 핵산 서열과 접촉하게 된다. 상기 프로브는, 바람직하게는 발색단에 접합하지만, 방사성표지될 수 있다. 다른 실시양태에서, 상기 프로브는 결합 상대, 예컨대 항체 또는 비오틴과 접합되고, 여기서 결합 쌍의 다른 구성원은 검출가능한 잔기를 갖는다.
다른 실시양태에서, 써던 블롯팅 및 표지된 프로브로의 혼성화에 의해 검출된다. 써던 블롯팅을 비롯한 기술은 당업자에게 익히 공지되어 있으며, 분자 프로토콜에 관한 다수의 표준 책에서 찾을 수 있다 (문헌 [Sambrook et al., 2001] 참조). 간략히 말해, 증폭 생성물은 겔 전기영동에 의해 분리된다. 이때, 겔은 막, 예컨대 핵산의 수송 및 비공유 결합을 가능하게 하는 니트로셀룰로스와 접촉된다. 후속적으로, 막은 표적 증폭 생성물과 혼성화될 수 있는 발색단-접합 프로브를 넣고 인큐베이션시킨다. 막을 x-선 필름 또는 이온-방사 검출 장치에 노출시켜 검출한다. 상기 방법 중 한 예는 본원에 참고로 포함되는 미국 특허 제5,279,721호에 기재되어 있으며, 상기 문헌은 자동화된 전기영동 및 핵산의 수송을 위한 장치 및 방법을 개시하고 있다. 상기 장치는 겔의 외부 조작 없이 전기영동 및 블롯팅을 가능하게 하고, 본 발명에 따른 방법을 수행하기에 이상적으로 적합하다.
5.4.1.3 뉴클레아제 보호 검정법
특정 실시양태에서, 바이오마커 프로필에서의 바이오마커에 대한 특성 수치는 뉴클레아제 보호 검정법 (리보뉴클레아제 보호 검정법 및 S1 뉴클레아제 검정법을 둘 다 포함함)을 수행하여 특정 mRNA (예를 들어, 표 30, 표 I, 표 J, 또는 표 K에 기재된 유전자의 mRNA)를 검출 또는 정량화함으로써 얻을 수 있다. 그러한 검정법은, 예를 들어 샘브룩 등의 2001년 상기 문헌에 기재되어 있다. 뉴클레아제 보호 검정법에서, 안티센스 프로브 (예를 들어, 방사성표지화되거나 비동위원소로 표지화된)는 용액에서 RNA 샘플과 혼성화된다. 혼성화에 이어, 단일가닥의 혼성화되지 않은 프로브 및 RNA를 뉴클레아제에 의해 분해시킨다. 남은 보호된 단편을 분리하기 위해 아크릴아미드 겔이 사용된다. 전형적으로, 용액 혼성화는 막-기재 혼성화보다 효율적이며, 이는 블롯팅 혼성화의 최대 20-30 μg과 비교하여 샘플 RNA가 100 μg까지 공급될 수 있다.
뉴클레아제 보호 검정법의 가장 통상적인 유형인 리보뉴클레아제 보호 검정법은 RNA 프로브의 사용이 요구된다. 올리고뉴클레오티드 및 다른 단일가닥 DNA 프로브는 S1 뉴클레아제 함유 검정법에서만 사용될 수 있다. 프로브:표적 하이브리드의 뉴클레아제에 의한 절단을 예방하기 위해 단일가닥, 안티센스 프로브는 전형적으로 RNA와 완전히 유사해야 한다.
5.4.1.4 노던 블롯팅 검정법
당업자에게 공지된 임의의 혼성화 기술은 바이오마커 프로필에서의 바이오마커에 대한 특성 수치를 생성하기 위해 사용될 수 있다. 다른 특정 실시양태에서, 바이오마커 프로필에서의 바이오마커에 대한 특성 수치는 특정 RNA 분자 (예를 들어, 표 30, 표 I, 표 J, 또는 표 K에 기재된 유전자의 RNA)를 검출 및 정량화하기 위한 노던 블롯팅 분석에 의해 얻을 수 있다. 표준 노던 블롯팅 검정법은 당업자에게 공지된 종래의 노던 혼성화 기술에 따라, RNA 전사체 크기를 규명하고, 대체적으로 스플라이싱된 RNA 전사체, 및 샘플에서 본원에 기재된 하나 이상의 유전자 (특히, mRNA)의 상대적 양을 확인하기 위해 사용될 수 있다. 노던 블롯팅에서, RNA 샘플은 우선 변성화 상태 하에 아가로스 겔에서 전기영동을 통해 크기에 따라 분리한다. 이때, RNA는 막으로 수송되며, 표지화된 프로브와 가교되고 혼성화된다. 비동위원소 또는 높은 특이적 활성 방사성표지된 프로브는 랜덤-프라이머, 닉-번역, 또는 PCR-생성된 DNA 프로브, 시험관내 전사된 RNA 프로브, 및 올리고뉴클레오티드를 비롯하여 사용될 수 있다. 또한, 일부만 유사한 서열 (예를 들어, 상이한 종으로부터의 cDNA 또는 엑손을 함유할 수 있는 게놈 DNA 단편)이 프로브로 사용될 수 있다. 전장 단일 가닥 DNA 또는 DNA 서열의 단편을 함유한 표지화된 프로브, 예를 들어 방사성표지화된 cDNA는 20개 이상, 30개 이상, 50개 이상, 또는 100개 이상의 연속 뉴클레오티드 길이일 수 있다. 상기 프로브는 당업자에게 공지된 다수의 임의의 상이한 방법에 의해 표지화될 수 있다. 이들 연구에서 가장 흔하게 사용되는 표지는 방사성 원소, 효소, 자외선에 노출되면 형광발광하는 화학물질, 및 기타이다. 다수의 형광 물질이 공지되어 있고, 표지로 이용될 수 있다. 여기에는 비제한적으로, 플루오레세인, 로다민, 아우라민, 텍사스 레드, AMCA 블루 및 루시퍼 옐로우 (Lucifer Yellow)가 포함된다. 방사성 표지는 현재 입수가능한 계수 절차에 의해 검출될 수 있다. 동위원소의 비제한적 예에는 3H, 14C, 32P, 35S, 36Cl, 51Cr, 57Co, 58Co, 59Fe, 90Y, 125I, 131I, 및 186Re가 포함된다. 효소 표지도 마찬가지로 유용하며, 현재 이용되는 비색분석, 분광분석, 형광분광분석, 전류분석 또는 기체부피분석 기술 중 임의의 것에 의해 검출될 수 있다. 효소는 카르보디이미드, 디이소시아네이트, 글루타르알데히드 등과 같은 가교 분자와 반응함으로써 선택된 입자에 접합된다. 당업자에게 공지된 임의의 효소가 이용될 수 있다. 그러한 효소의 예에는 비제한적으로, 퍼옥시다제, 베타-D-갈락토시다제, 우레아제, 글루코스 옥시다제 플러스 퍼옥시다제 및 알칼린 포스파타제가 포함된다. 미국 특허 제3,654,090호, 동 제3,850,752호, 및 동 제4,016,043호가 예시적으로 대체적 표지화 물질 및 방법을 개시하고 있다.
5.4.2 단백질의 검출 방법
본 발명의 특정 실시양태에서, 바이오마커 프로필에서의 바이오마커에 대한 특성 수치는 단백질, 예를 들어 본원에 기재된 하나 이상의 유전자 (예를 들어, 표 30, 표 I, 표 J, 또는 표 K에 열거된 유전자)의 발현 생성물 (예를 들어, 핵산 또는 단백질) 또는 그러한 단백질의 번역-후 변형, 또는 다르게 변형되거나, 또는 가공된 형태를 검출함으로써 얻을 수 있다. 특정 실시양태에서, 바이오마커 프로필은 비제한적으로, 단백질 미세배열 분석, 면역조직화학 및 질량 분석법을 비롯한 단백질 검출을 위해 당업자에게 공지된 임의의 방법을 이용하여, 본원에 개시된 유전자 (예를 들어, 표 30, 표 I, 표 J, 또는 표 K에 열거된 유전자)로부터 발현된 하나 이상의 단백질 및/또는 그의 구별가능한 단편을 검출 및/또는 분석함으로써 생성된다. .
표준 기술이 샘플에 존재하는 단백질 또는 관심있는 단백질 (예를 들어, 표 30, 표 I, 표 J, 또는 표 K에 열거된 유전자로부터 발현된 단백질)의 양을 결정하기 위해 이용될 수 있다. 예를 들어, 샘플에 존재하는 단백질 또는 관심있는 단백질의 양을 결정하기 위한 표준 기술을, 예를 들어 면역검정법, 예컨대 웨스턴 블롯팅, 면역침강에 이은 나트륨 도데실 술페이트 폴리아크릴아미드 겔 전기영동, (SDS-PAGE), 면역세포화학 등을 이용하여 사용할 수 있다. 관심있는 단백질의 검출을 위한 한 예시적 작용제는, 바람직하게는 직접 또는 간접적으로 검출가능하게 표지화된 항체와 특이적으로 결합할 수 있는 항체이다.
그러한 검출 방법을 위해, 경우에 따라 분석할 샘플로부터의 단백질은 당업자에게 익히 공지된 기술을 이용하여 용이하게 단리될 수 있다. 단백질 단리 방법은, 예를 들어, 그의 전문이 본원에 참고로 포함되는 문헌 [Harlow and Lane, 1988, Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory Press (Cold Spring Harbor, New York)]에 기재된 것일 수 있다.
특정 실시양태에서, 상기 단백질 또는 관심있는 단백질의 검출 방법은 단백질-특이적 항체와의 상호작용을 통한 이들의 검출을 포함한다. 예를 들어, 항체는 관심있는 단백질 (예를 들어, 본원에 기재된 유전자로부터 발현된 단백질, 예를 들어 표 30, 표 I, 표 J, 또는 표 K에 열거된 단백질)에 대해 지시된다. 항체는 당업자에게 익히 공지된 표준 기술을 이용하여 생성될 수 있다. 특정 실시양태에서, 항체는 폴리클로날, 또는 더욱 바람직하게는 모노클로날일 수 있다. 예를 들어, 온전한 항체 또는 항체 단편 (예를 들어, scFv, Fab 또는 F(ab')2)이 사용될 수 있다.
예를 들어, 관심있는 단백질에 특이적인 항체, 또는 항체의 단편이 단백질의 존재를 정량적 또는 정성적으로 검출하기 위해 사용될 수 있다. 이는, 예를 들어 면역형광 기술에 의해 달성될 수 있다. 항체 (또는 그의 단편)는 추가로 관심있는 단백질의 동일계 검출을 위해 면역형광법 또는 면역전자 현미경에서와 같이 조직학적으로 이용될 수 있다. 동일계 검출은 환자로부터 생물학적 샘플 (예를 들어, 생검 표본)을 제거하고, 관심있는 단백질 (예를 들어, 표 30, 표 I, 표 J, 또는 표 K에서의 유전자로부터 발현된 단백질)에 대해 지시되는 표지화된 항체를 거기에 적용시킴으로써 달성될 수 있다. 항체 (또는 단편)는 바람직하게는 항체 (또는 단편)를 생물학적 샘플에 중첩시킴으로써 적용된다. 그러한 절차의 이용을 통해, 특정 샘플에서 관심있는 단백질의 존재 뿐만 아니라, 그의 분포 또한 결정하는 것이 가능하다. 광범위한 익히 공지된 조직학적 방법 (예컨대, 염색 절차)이 그러한 동일계 검출을 달성하기 위해 이용될 수 있다.
관심있는 단백질에 대한 면역검정법은 전형적으로 관심있는 단백질을 확인할 수 있는 검출가능하게 표지화된 항체의 생물학적 샘플을 인큐베이션시키고, 당업계에 익히 공지된 임의의 다수의 기술에 의해 결합된 항체를 검출하는 것을 포함한다. 보다 상세히 논의된 바와 같이, 하기 용어 "표지화된"은, 예를 들어 검출가능한 물질을 항체에 커플링 (즉, 물리적 연결)으로 인한 항체의 직접 표지화를 나타낼 수 있고, 또한 직접 표지화된 다른 시약과의 반응으로 인한 항체의 간접 표지화를 나타낼 수 있다. 간접 표지화의 예에는 형광 표지화된 2차 항체를 이용한 1차 항체의 검출이 포함된다.
생물학적 샘플은 고체상 지지체 또는 담체, 예컨대 니트로셀룰로스, 또는 세포, 세포 입자 또는 가용성 단백질을 고정화시킬 수 있는 다른 고체 지지체와 접촉시키거나, 그 위에 고정화시킬 수 있다. 이어서, 지지체는 적합한 완충액으로 세척한 후, 검출가능하게 표지화된 핑거프린트 유전자-특이적 항체로 처리할 수 있다. 이어서, 고체상 지지체를 완충액으로 2회 세척하여 결합하지 않은 항체를 제거할 수 있다. 이어서, 고체 지지체 상에 결합된 표지의 양은 종래의 방법에 의해 검출할 수 있다.
"고체상 지지체 또는 담체"는 항원 또는 항체와 결합할 수 있는 임의의 지지체를 의미한다. 익히 공지된 지지체 또는 담체에는 유리, 폴리스티렌, 폴리필렌, 폴리에틸렌, 덱스트란, 나일론, 아밀라제, 천연 및 변형된 셀룰로스, 폴리아크릴아미드 및 마그네타이트가 포함된다. 담체의 성질은 어느 정도 가용성이거나, 본 발명의 목적에 적합하게 불용성일 수 있다. 커플링 분자가 항원 또는 항체에 결합할 수 있는 한, 지지 물질은 실질적으로 임의의 가능한 구조적 배치를 가질 수 있다. 따라서, 지지체의 배치는 비드와 같은 구형이거나, 또는 시험 튜브의 내부 표면 또는 막대의 외부 표면과 같이 원통형이다. 달리, 지지체는 시트, 시험 스트립과 같이 편평할 수 있다. 바람직한 지지체는 폴리스티렌 비드를 포함한다. 당업자는 항체 또는 항원과 결합하기 위한 다수의 다른 적합한 담체를 알 수 있거나, 통상적 실험을 이용하여 상기를 확인할 수 있을 것이다.
관심있는 단백질에 특이적 항체를 검출가능하게 표지화할 수 있는 방식 중 하나는 상기를 효소에 연결시키고, 효소 면역검정 (EIA)을 이용하는 것이다 (각각의 전문이 참고로 본원에 포함되는 문헌 [Voller, 1978, "The Enzyme Linked Immunosorbent Assay (ELISA)", Diagnostic Horizons 2:1-7, Microbiological Associates Quarterly Publication, Walkersville, MD]; [Voller et al, 1978, J. Clin. Pathol. 31:507-520]; [Butler, J.E., 1981, Meth. Enzymol. 73:482-523; Maggio (ed.), 1980, Enzyme Immunoassay, CRC Press, Boca Raton, FL]; [Ishikawa et al., (eds.), 1981, Enzyme Immunoassay, Kgaku Shoin, Tokyo] 참조). 항체에 결합된 효소는 적합한 기질, 바람직하게는 발색성 기질과, 예를 들어 분광분석, 형광분석에 의해, 또는 가시적 수단에 의해 검출될 수 있는 화학 잔기를 생성하기 위한 방식으로 반응할 것이다. 항체를 검출가능하게 표지화하기 위해 사용될 수 있는 효소에는 비제한적으로, 말레이트 데히드로게나제, 스타필로코커스 뉴클레아제, 델타-5-스테로이드 이소머라제, 이스트 알코올 데히드로게나제, 알파-글리세로포스페이트, 데히드로게나제, 트리오스 포스페이트 이소머라제, 홀스래디쉬 퍼옥시다제, 알칼린 포스파타제, 아스파라기나제, 글루코스 옥시다제, 베타-갈락토시다제, 리보뉴클레아제, 우레아제, 카탈라제, 글루코스-6-포스페이트 데히드로게나제, 글루코아밀라제 및 아세틸콜린에스테라제가 포함된다. 상기 검출은 효소에 대한 발색성 기질을 사용하는 비색분석 방법에 의해 달성될 수 있다. 검출은 또한 유사하게 제조된 표준물과 비교하여 기질의 효소 반응의 범위에 대한 가시적 비교에 의해 달성될 수 있다.
검출은 또한 다양한 임의의 다른 면역검정법을 이용하여 달성될 수 있다. 예를 들어, 항체 또는 항체 단편의 방사성 표지화에 의해, 방사성면역검정법 (RIA)을 이용하여 관심있는 단백질을 검출하는 것이 가능하다 (예를 들어, 참고로 본원에 포함되는 문헌 [Weintraub, 1986, Principles of Radioimmunoassays, Seventh Training Course on Radioligand Assay Techniques, The Endocrine Society] 참조). 방사성 동위원소 (예를 들어, 125I, 131I, 35S 또는 3H)는 감마 계수기 또는 신틸레이션 계수기의 이용과 같은 수단, 또는 방사성사진촬영술에 의해 검출될 수 있다.
또한, 항체를 형광 화합물로 표지하는 것이 가능하다. 형광 표지화된 항체가 적정 파장의 빛에 노출되는 경우에, 이때 그의 존재는 형광으로 인해 검출될 수 있다. 가장 흔하게 사용되는 형광 표지화 화합물 중에는 플루오레세인 이소티오시아네이트, 로다민, 피코에리트린, 피코시아닌, 알로피코시아닌, o-프탈데히드 및 플루오레스카민이 있다.
항체는 또한 형광 발광 금속, 예컨대 152Eu, 또는 다른 란탄족을 사용하여 검출가능하게 표지화될 수 있다. 이들 금속은 금속 킬레이팅 군으로 디에틸렌트리아민펜트아세트산 (DTPA) 또는 에틸렌디아민테트라아세트산 (EDTA)을 사용하여 항체에 부착될 수 있다.
항체는 또한 화학발광 화합물과 커플링시킴으로써 검출가능하게 표지화될 수 있다. 화학발광-태깅된 항체의 존재는 이때 반응의 과정 동안 발생한 발광의 존재를 검출함으로써 결정된다. 특히 유용한 화학발광 표지화 화합물의 예는 루미놀, 이소루미놀, 써로마틱 아크리디늄 에스테르, 이미다졸, 아크리디늄 염 및 옥살레이트 에스테르이다.
게다가, 생물발광 화합물이 본 발명의 항체를 표지화하기 위해 사용될 수 있다. 생물발광은 촉매 단백질이 화학발광 반응의 효율을 증가시키는 생물학적 시스템에서 발견되는 화학발광의 한 유형이다. 생물발광 단백질의 존재는 발광의 존재 검출에 의해 결정된다. 표지화의 목적을 위한 중요한 생물발광 화합물은 루시페린, 루시페라제 및 에쿼린이다.
다른 실시양태에서, 항체 이외의 특이적 결합 분자, 예컨대 앱타머가 바이오마커와 결합하기 위해 사용될 수 있다. 또 다른 실시양태에서, 바이오마커 프로필은 감염체 (예를 들어, 리포폴리사카라이드 또는 바이러스 단백질) 또는 그의 성분의 측정가능한 측면을 포함할 수 있다.
특정 실시양태에서, 단백질 칩 검정법 (예를 들어, 프로테인 칩 (등록상표) 바이오마커 시스템; Ciphergen, Fremont, California)이 바이오마커 프로필에서의 바이오마커에 대한 특성 수치를 측정하기 위해 사용된다. 또한, 예를 들어 각각의 전문이 본원에 참고로 포함되는 문헌 [Lin, 2004, Modern Pathology, 1-9]; [Li, 2004, Journal of Urology 171, 1782-1787]; [Wadsworth, 2004, Clinical Cancer Research, 10, 1625-1632]; [Prieto, 2003, Journal of Liquid Chromatography & Related Technologies 26, 2315-2328]; [Coombes, 2003, Clinical Chemistry 49, 1615-1623]; [Mian, 2003, Proteomics 3, 1725-1737]; [Lehre et al., 2003, BJU International 92, 223-225]; 및 [Diamond, 2003, Journal of the American Society for Mass Spectrometry 14, 760-765]를 참조한다.
특정 실시양태에서, 비드 검정법은 바이오마커 프로필에서의 바이오마커에 대한 특성 수치를 측정하기 위해 사용된다. 그러한 비드 검정법 중 하나는 벡톤 딕킨슨 사이토메트릭 비드 어레이 (Becton Dickinson Cytometric Bead Array; CBA)이다. CBA는 불연속적 형광 강도를 갖는 일련의 입자를 이용하여 다중 가용성 분석물을 동시에 검출한다. CBA는 유세포분석법과 조합되어 다중 검정법을 생성한다. 예를 들어 벡톤 딕킨슨 인간 염증 키트에서 구현된 벡톤 딕킨슨 CBA 시스템은 입자-기재 면역검정법에서 가용성 분석물을 측정하기 위해 유세포분석법에 의해 증폭된 형광 검출의 민감도를 이용한다. CBA에서의 각각의 비드는 특정 단백질에 대한 캡쳐 표면을 제공하고, ELISA 플레이트에서 개별적으로 코팅된 웰과 유사하다. BD CBA 캡쳐 비드 혼합물은 현탁물로 존재하여 작은 부피 샘플에서 다중 분석물의 검출을 가능하게 한다.
특정 실시양태에서, 다중 분석 방법은 전문이 참고로 본원에 포함되는 미국 특허 제5,981,180호 ("'180 특허")에 기재되어 있으며, 바이오마커 프로필에서의 바이오마커에 대한 특성 수치를 측정하기 위해 사용된 일반적 방법, 비드 기술, 시스템 하드웨어 및 항체 검출에 대해 상세히 교시하고 있다. 이 분석을 위해, 극미립자의 매트릭스를 합성하고, 여기서 매트릭스는 극미립자의 상이한 세트로 구성된다. 극미립자의 각각의 세트는 극미립자 표면에 고정화된 뚜렷한 항체 캡쳐 시약의 수천개 분자를 가질 수 있고, 다양한 양의 두 형광 염료와 혼입됨으로써 색으로 코딩될 수 있다. 두 형광 염료의 비율은 극미립자의 각각의 세트에 대한 뚜렷한 방출 스펙트럼을 제공하여, 극미립자를 확인하여, 다양한 세트의 극미립자를 풀링할 수 있게 한다. 미국 특허 제6,268,222호 및 동 제6,599,331호는 또한 전문이 참고로 본원에 포함되며, 다중 분석을 위한 극미립자의 표지화에 대한 다양한 방법이 상세히 교시되어 있다.
5.4.3 다른 검출 방법의 이용
특정 실시양태에서, 분리 방법은 바이오마커 프로필에서의 바이오마커에 대한 특성 수치의 결정에 이용될 수 있으며, 이로써 샘플 내의 바이오마커의 하위세트만 분석된다. 예를 들어, 샘플에서 분석된 바이오마커는 샘플 내의 핵산 바이오마커만을 얻기 위해 분별된 세포 추출물로부터의 mRNA 종일 수 있거나, 또는 바이오마커는 크로마토그래피 기술에 의해 분류된 샘플 내의 단백질의 전체 상보체의 단편으로부터 얻을 수 있다.
바이오마커 프로필에서의 바이오마커에 대한 특성 수치는 또한, 예를 들어 하기 기재된 하나 이상의 다음 방법을 이용함으로써 생성될 수 있다. 예를 들어, 방법은 핵 자기 공명 (NMR) 분광법, 질량 분석법, 예컨대 전기분무 이온화 질량 분석법 (ESI-MS), ESI-MS/MS, ESI-MS/(MS)n (n은 0보다 큰 정수), 매트릭스-지원 레이저 탈착 이온화 비행시간 질량 분석법 (MALDI-TOF-MS), 표면-강화 레이저 탈착/이온화 비행시간 질량 분석법 (SELDI-TOF-MS), 규소 상의 탈착/이온화 (DIOS), 이차 이온 질량 분석법 (SIMS), 4극자 비행시간 (Q-TOF), 대기압 화학 이온화 질량 분석법 (APCI-MS), APCI-MS/MS, APCI-(MS)n, 대기압 광이온화 질량 분석법 (APPI-MS), APPI-MS/MS, 및 APPI-(MS)n을 포함할 수 있다. 다른 질량 분석법은 특히, 4극자, 푸리에 (Fourier) 변환 질량 분석법 (FTMS) 및 이온 트랩을 포함할 수 있다. 다른 적합한 방법은 화학 추출 분배, 칼럼 크로마토그래피, 이온 교환 크로마토그래피, 소수성 (역상) 액체 크로마토그래피, 등전 집속, 일차원 폴리아크릴아미드 겔 전기영동 (PAGE), 이차원 폴리아크릴아미드 겔 전기영동 (2D-P AGE) 또는 다른 크로마토그래피, 예컨대 박층, 기체 또는 액체 크로마토그래피, 또는 그의 임의의 조합을 포함할 수 있다. 한 실시양태에서, 생물학적 샘플은 분리 방법의 적용 이전에 분획화될 수 있다.
한 실시양태에서, 레이저 탈착/이온화 비행시간형 질량 분석법 (Laser desoption/ionization time-of-flight mass spectroscopy)이 바이오마커 프로필에서의 특성 수치를 결정하기 위해 사용되며, 여기서 바이오마커는 입사 레이저 방사선에 의해 고정화의 지지체를 이온화 및 기화시키는 단백질 또는 단백질 단편이며, 특성 수치는 질량 스펙트럼 프로필에서 이들 단편을 나타내는 피크의 존재 또는 부재이다. 다양한 레이저 탈착/이온화 기술이 당업계에 공지되어 있다 (예를 들어, 전문이 각각 본원에 참고로 포함되는 문헌 [Guttman et al., 2001, Anal. Chem. 73:1252-62] 및 [Wei et al., 1999, Nature 399:243-246] 참조).
레이저 탈착/이온화 비행시간형 질량 분석법은 비교적 짧은 시간 내에 많은 양의 정보를 생성할 수 있게 한다. 생물학적 샘플을 샘플에서의 모든 바이오마커, 또는 그의 하위세트에 결합하는 지지체의 다수 변종 중 하나에 적용한다. 정제 또는 분별을 선행하거나 하지 않은 세포 용해물 또는 샘플을 0.5 μL의 소량으로 이들 표면에 직접 적용한다. 용해물 또는 샘플은 지지체 표면에 적용하기 전에 농축 또는 희석할 수 있다. 다음으로, 레이저 이탈/이온화를 이용하여 3시간만큼 짧은 시간 내에 샘플, 또는 샘플들의 질량 스펙트럼을 생성한다.
5.5 데이타 분석 알고리즘
전환자와 비-전환자 사이를 판별할 수 있는 상응하는 특성 수치를 나타내는 바이오마커가 본 발명에서 확인된다. 이들 바이오마커의 정체성 및 이들의 상응하는 특성 (예를 들어 발현 수준)은 전환자와 비-전환자 사이를 판별하는 의사결정 규칙 또는 다수의 의사결정 규칙들을 생성하는데 이용될 수 있다. 하기 단락 6은 데이타 분석 알고리즘이 이러한 수많은 의사결정 규칙을 구축하는데 어떻게 사용될 수 있는 지를 예시한다. 단락 6에 기재된 데이타 분석 알고리즘 각각은, 전환자 및 비-전환자를 포함하는 훈련 집단에서 본 발명에 따라 확인된 바이오마커 서브세트의 특성 (예를 들어 발현 수치)을 이용한다. 전형적으로, SIRS 대상은 규정된 시기 (예를 들어 관찰 기간) 이내에 상기 대상이 패혈증을 발병하지 않을 경우에 비-전환자로 간주된다. 이러한 규정된 시기는 예를 들어 12시간, 24시간, 48시간, 1일, 1주, 1개월 이상일 수 있다. 규정된 기간 동안에 패혈을 발병하는 대상과 패혈증을 발병하지 않는 대상 사이를 판별하는 의사결정 규칙 또는 다수의 의사결정 규칙들을 수립하기 위한 구체적인 데이타 분석 알고리즘이 하기 하위단락에서 설명될 것이다. 이들 예시적 데이타 분석 알고리즘 또는 당업계에 공지된 다른 기술을 이용하여 의사결정 규칙이 일단 수립되면, 상기 의사결정 규칙은 시험 대상을 2가지 이상의 표현형 클래스 중 하나 (예를 들어 전환자 또는 비-전환자)로 분류하는데 이용될 수 있다. 이것은 의사결정 규칙을 상기 시험 대상으로부터 얻은 바이오마커 프로필에 적용하여 달성된다. 따라서, 이러한 의사결정 규칙에는 진단 지표인 수치가 많다.
한 측면에서, 본 발명은 훈련 집단으로부터 얻은 바이오마커 프로필에 대한, 시험 대상으로부터의 바이오마커 프로필의 평가를 제공한다. 일부 실시양태에서, 훈련 집단의 대상 뿐만이 아니라 시험 대상으로부터 얻은 각각의 바이오마커 프로필은 다수의 상이한 바이오마커 각각에 대한 특성을 포함한다. 일부 실시양태에서, 이러한 비교는 (i) 훈련 집단으로부터의 바이오마커 프로필을 이용하여 의사결정 규칙을 생성하고, (ii) 상기 의사결정 규칙을 시험 대상으로부터의 바이오마커 프로필에 적용하여 달성된다. 따라서, 본 발명의 일부 실시양태에서 적용되는 의사결정 규칙은 SIRS의 시험 대상이 패혈증에 걸리기 쉬운지 또는 그렇지 않은지의 여부를 결정하는데 이용된다.
본 발명의 일부 실시양태에서, 의사결정 규칙을 적용한 결과가 해당 대상이 패혈증에 걸리기 쉽다고 지시하는 경우, 그 대상은 "패혈증" 대상으로 진단된다. 의사결정 규칙을 적용한 결과가 해당 대상이 패혈증에 걸리지 않을 것이라고 지시하는 경우, 그 대상은 "SIRS" 대상으로 진단된다. 따라서, 일부 실시양태에서, 상기한 2원적 의사결정 상황에서의 결과는 다음과 같은 4가지의 결론이 가능하다:
(i) 진정 패혈성: 이때의 의사결정 규칙은 해당 대상이 패혈증에 걸릴 것이고, 그 대상은 사실상 명확한 시기 동안에 패혈증에 걸릴 것임을 지시함 (진정 양성, TP),
(ii) 허위(falsely) 패혈성: 이때의 의사결정 규칙은 해당 대상이 패혈증에 걸릴 것이고, 그 대상은 사실상 명확한 시기 동안에 패혈증에 걸리지 않을 것임을 지시함 (가양성, FP),
(iii) 진정 SIRS: 이때의 의사결정 규칙은 해당 대상이 패혈증에 걸리지 않을 것이고, 그 대상은 사실상 명확한 시기 동안에 패혈증에 걸리지 않을 것임을 지시함 (진정 음성, TN), 또는
(iv) 허위 SIRS: 이때의 의사결정 규칙은 해당 대상이 패혈증에 걸리지 않을 것이고, 그 대상은 사실상 명확한 시기 동안에 패혈증에 걸릴 것임을 지시함 (가음성, FN).
TP, FP, TN, FN에 대하여 다른 정의가 있을 수 있음이 인지될 것이다. 예를 들어 TP는 의사결정 규칙이 해당 대상이 패혈증에 걸리지 않을 것이고, 그 대상은 사실상 명확한 시기 동안에 패혈증에 걸리지 않을 것임을 지시하는 경우로 정의될 수도 있다. 이러한 모든 또다른 정의가 본 발명의 범위에 속하며, 본 발명을 이해하기 쉽기 위해서 본원에서 달리 언급하지 않는 한은 TP, FP, TN, 및 FN에 대한 정의로서 상기한 (i) 내지 (iv)의 정의를 이용할 것이다.
당업자가 인지하는 바와 같이, 수많은 정량적 기준이 시험 바이오마커 프로필과 참조 바이오마커 프로필 사이에서 행해진 비교의 수행을 소통하는데 이용될 수 있다 (예를 들어 의사결정 규칙을 시험 대상으로부터의 바이오마커 프로필에 적용함). 이것들로는, 양성 예측 수치 (PPV), 음성 예측 수치 (NPV), 특이도, 민감도, 정확도 및 확실도 등이 있다. 또한, ROC (Receiver Operator Curves) 등과 같은 다른 구축물도 의사결정 규칙 수행 평가에 이용될 수 있다. 본원에서 사용된 바와 같이, 다음과 같이 정의된다:
Figure 112007081780858-PCT00001
여기서, N은 비교되는 샘플의 수 (예를 들어 패혈증인지 SIRS인지의 결정이 요구되는 시험 샘플의 수)이다. 예를 들어 SIRS/패혈증 분류가 요구되는 대상이 10명 있는 경우를 고려할 수 있다. 이 경우, 10명의 시험 대상 각각에 대한 바이오마커 프로필을 구축한다. 이어서, 훈련 집단으로부터 얻은 바이오마커 프로필을 기초로 생성된 의사결정 규칙을 적용하여 각각의 바이오마커 프로필을 평가한다. 이 예에서, 상기 식에서의 N은 10이다. 전형적으로, N은 샘플의 수이고, 이때의 각 샘플은 집단의 여러 구성원으로부터 수집된 것이다. 이러한 집단은 사실상 2가지 상이한 유형일 수 있다. 한 유형에서, 집단은 샘플 및 표현형 데이타 (예를 들어 바이오마커의 특성 수치 및 해당 대상이 패혈증에 걸렸는지의 여부에 대한 지표)가 의사결정 규칙을 구축하거나 정립하는데 사용되었던 대상을 포함한다. 이러한 집단은 본원에서 훈련 집단이라 지칭된다. 다른 유형에서, 집단은 의사결정 규칙 구축에 이용되지 않은 대상을 포함한다. 이러한 집단은 본원에서 검증 집단이라 지칭된다. 달리 언급하지 않는다면, N으로 대표되는 집단은 상기 2가지 유형의 집단을 혼합한 것이 아니라, 오직 훈련 집단만이든지, 또는 오직 검증 집단만이다. 정확도 등의 스코어가 검증 집단이 아닌 훈련 집단을 기초로 하는 경우에는 상기 스코어가 더 높을 것 (1(unity)에 더 근접함)임이 인지될 것이다. 그럼에도 불구하고, 본원에서 명백하게 언급하지 않는 한은, 확실도 (정확도) 등을 비롯하여 의사결정 규칙의 수행 평가 (또는 시험 대상으로부터의 바이오마커 프로필에 대한 다른 형태의 평가)에 이용된 모든 기준은, 해당 기준에 상응하는 의사결정 규칙을 훈련 집단 또는 검증 집단에 적용하여 결정된 기준을 지칭한다. 추가로, 상기 정의된 PPV, NPV, 특이도, 민감도 및 정확도에 대한 정의는 문헌 [Draghici, Data Analysis Tools for DNA Microanalysis, 2003, CRC Press LLC, Boca Raton, Florida, pp. 342-343]에서도 찾을 수 있고, 상기 문헌은 본원에 참고로 포함된다.
일부 실시양태에서, 훈련 집단은 비-전환자 및 전환자를 포함한다. 일부 실시양태에서, 바이오마커 프로필은 상기 집단의 전환자에 의한 패혈증 발병 이전의 어떤 시기에 훈련 집단으로부터 수집된 생물학적 샘플을 이용하여 상기 집단으로부터 구축된다. 따라서, 훈련 집단의 전환자의 경우에, 생물학적 샘플은 상기 전환자가 패혈성이 되기 2주 전, 1주 전, 4일 전, 3일 전, 1일 전, 또는 임의의 다른 시기에 수집될 수 있다. 실제로, 이러한 수집물은 SIRS 진단으로 병원에 입원한 후 규칙적인 시간 간격으로 생물학적 샘플을 수집하여 수득된다. 예를 들어 한 접근법에서, SIRS로 진단되어 병원에 입원한 대상은 훈련 집단으로 이용된다. 일단 SIRS로 병원에 입원하면, 생물학적 샘플은 선택된 시간 (예를 들어 매 시간마다, 매 8시간마다, 매 12시간마다, 매일 등)에 대상으로부터 수집된다. 상기 대상의 일부는 패혈증에 걸리고, 대상의 일부는 패혈증에 걸리지 않는다. 패혈증에 걸린 대상의 경우, 패혈증 발병 직전에 그 대상으로부터 취한 생물학적 샘플을 T-12 생물학적 샘플이라 부른다. 상기 대상으로부터의 모든 다른 생물학적 샘플은 이들 생물학적 샘플에 대하여 소급하여 표시된다. 예를 들어, 생물학적 샘플이 대상으로부터 1일 마다 채취된 경우, T-12 샘플 1일 전에 채취된 생물학적 샘플은 T-36 생물학적 샘플이라 불린다. 훈련 집단 중 비-전환자에 대한 생물학적 샘플의 채취 시점은 비-전환자 대상을 전환자 대상으로 "시간-대응(time-matching)"하여 식별된다. 예시로, 훈련 집단 중의 대상이 참여(enrollment) 제6일에 패혈성이라고 임상적으로 정의된 경우를 고려할 수 있다. 이 경우에는, 예를 들어 상기 대상의 경우에 T-36은 상기 연구 제4일이고, T-36 생물학적 샘플은 상기 연구 제4일에 수득된 생물학적 샘플이다. 마찬가지로, 대응된 비-전환자 대상에 대한 T-36은 이러한 짝을 이룬 비-전환자 대상에 대한 연구 제4일로 간주된다.
일부 실시양태에서, N은 대상 1명 초과, 5명 초과, 10명 초과, 20명 초과, 10명 내지 100명, 100명 초과, 또는 1000명 미만이다. 일부 실시양태에서, 의사결정 규칙 (또는 다른 형태의 비교)은 훈련 집단 또는 검증 집단에 대하여 약 99% 이상 또는 훨씬 더 높은 확실도를 가질 수 있다. 다른 실시양태에서, 훈련 집단 또는 검증 집단 (또한, 따라서 임상적 환자와 같이 훈련 집단의 일부가 아닌 단독 대상)에 대한 확실도는 약 97% 이상, 약 95% 이상, 약 90% 이상, 약 85% 이상, 약 80% 이상, 약 75% 이상, 약 70% 이상, 약 65% 이상, 또는 약 60% 이상이다. 확실도의 유용성은 본 발명의 특정 방법에 따라 달라질 수 있다. 본원에서 사용된 바와 같이, "확실도"는 "정확도"를 의미한다. 한 실시양태에서, 훈련 집단 또는 검증 집단에 대한 민감도 및/또는 특이도는 약 97% 이상, 약 95% 이상, 약 90% 이상, 약 85% 이상, 약 80% 이상, 약 75% 이상 또는 약 70% 이상이다. 일부 실시양태에서, 이러한 의사결정 규칙을 이용하여 상기 언급된 정확도로 패혈증의 발병을 예측한다. 일부 실시양태에서, 이러한 의사결정 규칙을 이용하여 상기 언급된 정확도로 패혈증을 진단한다. 일부 실시양태에서, 이러한 의사결정 규칙을 이용하여 상기 언급된 정확도로 패혈증의 단계를 결정한다.
시험 대상을 적절한 확실도로 분류하기 위해서 의사결정 규칙에 의해 이용될 수 있는 특성의 수는 3 이상이다. 일부 실시양태에서, 이것은 3 이상, 4 이상, 10 이상, 또는 10 내지 200이다. 그러나, 의사결정 규칙에 이용되는 특성의 수는 모든 경우에서 2 이상이지만, 요구되는 확실도 정도에 따라서는 그보다 많을 수도 있고 적을 수도 있다. 한 실시양태에서, 시험 대상을 분류하기 위해서 의사결정 규칙에 의해 이용될 수 있는 특성의 수는 시험 대상이 높은 확실도로 분류될 수 있도록 최적화된다.
하기 단락 6의 일부 예에서, 각 대상에서 다수의 바이오마커에 대해 미세배열 데이타 풍부도 데이타를 수집하였다. 즉, 바이오마커 프로필 중의 각 바이오마커에 대하여, 상기 바이오마커에 대한 미세배열 풍부도 데이타로서의 특성을 결정하였다. 관찰된 유전자 발현 패턴을 기초로 하여 샘플 표현형을 예측하기 위한 데이타 분석 알고리즘을 이용하여, 훈련 집단으로부터의 이러한 바이오마커 프로필로부터 의사결정 규칙이 생성된다. 신규하면서도 미세배열 특이적 분류 도구가 꾸준히 개발되고 있지만, 현재 사용되는 패턴 인식 및 예측 알고리즘은 의사결정 규칙 구축에 효과적인 데이타 분석 알고리즘을 제공한다. 예를 들어 문헌 [National Research Council; Panel on Discriminant Analysis Classification and Clustering, Discriminant Analysis and Clustering, Washington, D.C.: National Academy Press]을 참고하며, 상기 문헌은 본원에 참고로 포함된다. 추가로, 문헌 [Dudoit et al., 2002, "Comparison of discrimination methods for the classification of tumors using gene expression data." JASA 97:77-87]은 그 전문이 본원에 참고로 포함되며, 상기 문헌에 기재된 기술을 이용하여 이러한 의사결정 규칙을 생성할 수 있다.
의사결정 규칙을 생성하기 위한 관련 데이타 분석 알고리즘으로는 선형, 로지스틱, 및 보다 융통성 있는 판별 기술 등을 비롯한 판별 분석 (예를 들어 문헌 [Gnanadesikan, 1977, Methods for Statistical Data Analysis of Multivariate Observations, New York: Wiley 1977] 참조. 상기 문헌은 그 전문이 본원에 참고로 포함됨); 계통도-기재의 알고리즘, 예를 들어 분류 및 회귀 계통도 (CART) 및 그의 변형법 (예를 들어 문헌 [Breiman, 1984, Classification and Regression trees, Belmont, California: Wadsworth International Group] 참조. 상기 문헌은 그 전문이 본원에 참고로 포함됨. 또한, 하기 단락 5.1.3 참조); 일반화 가법 모델 (예를 들어 문헌 [Tibshirani, 1990, Generalized Additive Models, London: Chapman and Hall] 참조. 상기 문헌은 그 전문이 본원에 참고로 포함됨); 및 신경 네트워크 (예를 들어 문헌 [Neal, 1996, Bayesian Learning for Neural Networks, New York: Springer-Verlag] 및 [Insua, 1998, Feedforward neural networks for nonparametric regression In: Practical Nonparametric and Semiparametric Bayesian Statistics, pp. 181-194, New York: Springer] 참조. 상기 문헌은 그 전문이 본원에 참고로 포함됨. 또한, 하기 단락 5.5.6 참조) 등이 있으나 이에 제한되지 않는다.
한 실시양태에서, 시험 대상의 바이오마커 프로필과 훈련 집단으로부터 얻은 바이오마커 프로필의 비교가 수행되며, 의사결정 규칙을 적용하는 것을 포함한다. 의사결정 규칙은 데이타 분석 알고리즘, 예를 들어 컴퓨터 패턴 인식 알고리즘을 이용하여 구축된다. 의사결정 규칙을 구축하는데 적합한 다른 데이타 분석 알고리즘으로는 로지스틱 회귀 (하기 단락 5.5.10 참조) 또는 특성 수치들의 분포에 있어서의 차이를 검출하는 비모수적(nonparametric) 알고리즘 (예를 들어 윌콕슨 부호 순위 시험 (비조정 및 조정)) 등이 있으나 이에 제한되지 않는다. 의사결정 규칙은 1종, 2종, 3종, 4종, 5종, 10종, 20개 이상의 바이오마커로부터 측정된 관찰값에 상응하는, 2종, 3종, 4종, 5종, 10종, 20개 이상의 특성을 기초로 할 수 있다. 한 실시양태에서, 의사결정 규칙은 수백개 이상의 특성을 기초로 한다. 의사결정 규칙은 또한 분류 계통도 알고리즘을 이용하여 수립될 수도 있다. 예를 들어 훈련 집단으로부터의 각 바이오마커 프로필은 3개 이상의 특성을 포함할 수 있으며, 여기서의 상기 특성은 분류 계통도 알고리즘에서 예측된다 (하기 단락 5.5.1 참조). 의사결정 규칙은 집단 (또는 클래스) 내의 소속을 적어도 약 70% 이상, 약 75% 이상, 약 80% 이상, 약 85% 이상, 약 90% 이상, 약 95% 이상, 약 97% 이상, 약 98% 이상, 약 99% 이상, 또는 약 100%의 정확도로 예측한다.
적합한 데이타 분석 알고리즘은 당업계에 공지되어 있으며, 이것들 중 일부는 문헌 [Hastie et al., 상기 문헌]에서 검토되어 있다. 구체적인 실시양태에서, 본 발명의 데이타 분석 알고리즘은 분류 및 회귀 계통도 (CART; 하기 단락 5.5.1 참조), 다중 가법 회귀 계통도 (MART; 하기 단락 5.5.4 참조), 미세배열에 대한 예측 분석 (PAM; 하기 단락 5.5.2 참조) 또는 랜덤 포레스트 분석 (하기 단락 5.5.1 참조)을 포함한다. 이러한 알고리즘은 혈액 샘플 등과 같은 생물학적 물질로부터의 복잡한 스펙트럼을 분류하여, 대상을 정상으로 구별하거나, 또는 특정 질환 상태에 특성적인 바이오마커 발현 수준을 보유하는 것으로 구별한다. 다른 실시양태에서, 본 발명의 데이타 분석 알고리즘은 ANOVA 및 비모수적 방법, 선형 판별 분석 (하기 단락 5.5.10 참조), 로지스틱 회귀 분석 (하기 단락 5.5.10 참조), 최근접 분류자 분석 (하기 단락 5.5.9 참조), 신경 네트워크 (하기 단락 5.5.6 참조), 주요 성분 분석 (하기 단락 5.5.8 참조), 2차 판별 분석 (하기 단락 5.5.11 참조), 회귀 분류자 (하기 단락 5.5.5 참조) 및 지원 벡터 머신 (하기 단락 5.5.12 참조)을 포함한다. 의사결정 규칙을 구축하고/하거나 의사결정 규칙의 적용 속도 및 효율을 증가시키고 조사자 선입견을 피하는데 이러한 알고리즘이 이용될 수 있지만, 당업자는 본 발명의 방법 수행에 컴퓨터-기재의 알고리즘은 필요하지 않다는 것을 이해할 것이다.
의사결정 규칙은, 바이오마커 프로필 생성에 이용된 방법과 무관하게 바이오마커 프로필을 평가하는데 이용될 수 있다. 예를 들어, 적합한 의사결정 규칙은 문헌 [Harper, "Pyrolysis and GC in Polymer Analysis," Dekker, New York (1985)]에서 논의된 바와 같이 기체 크로마토그래피를 사용하여 생성된 바이오마커 프로필을 평가하는데 이용될 수 있다. 추가로, 문헌 [Wagner et al., 2002, Anal. Chem. 74:1824-1835]은 정적 비행 시간 2차 이온 질량 분광법 (TOF-SIMS)으로 수득된 스펙트럼을 기초로 하여 대상을 분류하는 능력을 개선시킨 의사결정 규칙을 개시한다. 추가로, 문헌 [Bright et al., 2002, J Microbiol. Methods 48:127-38]은 그 전문이 본원에 참고로 포함되며, 상기 문헌은 MALDI-TOF-MS 스펙트럼 분석으로 박테리아 균주들 사이를 높은 확실도 (79% 내지 89% 정확한 분류도)로 구별하는 방법을 개시한다. 문헌 [Dalluge, 2000, Fresenius J. Anal. Chem. 366:701-711]은 그 전문이 본원에 참고로 포함되며, 상기 문헌은 복잡한 생물학적 샘플 중 바이오마커의 프로필을 분류하는데 MALDI-TOF-MS 및 액체 크로마토그래피-전기분무 이온화 질량 분광법 (LC/ESI-MS)을 이용하는 것에 관해 논의한다.
5.5.1 의사결정 계통도
본 발명에서 확인된 바이오마커의 특성 수치를 이용하여 구축될 수 있는 의사결정 규칙의 한가지 유형은 의사결정 계통도이다. 여기서, "데이타 분석 알고리즘"은 의사결정 계통도를 수립할 수 있는 임의의 기술이지만, 최종적인 "의사결정 계통도"는 의사결정 규칙이다. 의사결정 계통도는 훈련 집단 및 특정 데이타 분석 알고리즘을 이용하여 구축된다. 의사결정 계통도는 일반적으로 문헌 [Duda, 2001, Pattern Classification, John Wiley & Sons, Inc., New York. pp. 395-396]에 기재되어 있으며, 상기 문헌은 본원에 참고로 포함된다. 계통도-기재의 방법은 특성 공간을 직사각형 세트로 나눈 후에 각 경우에서의 모델을 (상수처럼) 핏팅(fitting)한다.
훈련 집단 데이타는 훈련 세트 집단에서 본 발명의 바이오마커에 대한 특성 (예를 들어 발현 수치, 또는 몇몇 다른 관찰값)을 포함한다. 의사결정 계통도 구축에 이용될 수 있는 한 특정 알고리즘은 분류 및 회귀 계통도 (CART)이다. 다른 특정 의사결정 계통도 알고리즘으로는 ID3, C4.5, MART, 및 랜덤 포레스트 등이 있으나 이에 제한되지 않는다. CART, ID3, 및 C4.5는 문헌 [Duda, 2001, Pattern Classification, John Wiley & Sons, Inc., New York. pp. 396-408, 및 pp. 411-412]에 기재되어 있고, 상기 문헌은 본원에 참고로 포함된다. CART, MART, 및 C4.5는 문헌 [Hastie et al., 2001, The Elements of Statistical Learning, Springer-Verlag, New York, Chapter 9]에 기재되어 있고, 상기 문헌은 그 전문이 본원에 참고로 포함된다. 랜덤 포레스트는 문헌 [Breiman, 1999, "Random Forests-Random Features," Technical Report 567, Statistics Department, U.C.Berkeley, September 1999]에 기재되어 있고, 상기 문헌은 그 전문이 본원에 참고로 포함된다.
본 발명의 일부 실시양태에서, 의사결정 계통도는 본 발명의 바이오마커의 조합에 대한 특성을 이용하여 대상을 분류하는데 이용된다. 의사결정 계통도 알고리즘은 지도 학습 알고리즘의 클래스에 속한다. 의사결정 계통도의 목적은 실제 예시(real-world example) 데이타로부터 분류자 (계통도)를 유도하는 것이다. 상기 계통도는 의사결정 계통도 유도에 사용되지 않았던 미관찰 예를 분류하는데 사용될 수 있다. 이와 같이, 의사결정 계통도는 훈련 데이타로부터 유도된다. 예시적 훈련 데이타는 다수의 대상 (훈련 집단)에 대한 데이타를 함유한다. 각 대상마다, 각 대상의 클래스 (예를 들어 패혈증/SIRS)를 구별하는 다수의 특성이 있다. 본 발명의 한 실시양태에서, 훈련 데이타는 훈련 집단에서의 바이오마커 조합에 대한 발현 데이타이다.
하기하는 알고리즘은 예시적 의사결정 계통도 유도를 기재한다:
계통도 (예, 클래스, 특성)
루트 노드(root node) 생성
모든 예가 동일한 클래스 수치를 갖는다면, 상기 루트에 이 표지를 부여함
그외의 특성이 없으면, 상기 루트를 가장 공통의인 수치에 따라 표지함
그외에는, 하기를 시작함:
- 각 특성에 대한 정보 획득량을 산출하고,
- 가장 높은 정보 획득량을 갖는 특성 A를 선택하고, 이것을 루트 특성으로 하고,
- 이 특성의 각 가능한 수치 (v)마다,
상기 루트 아래에 A = v에 상응하는 새로운 분지를 추가하고,
예 (v)가 A = v인 예가 되도록 하고,
예 (v)가 없으면, 새로운 분지를 예들 사이에서 가장 공통의인 수치로 표지한 리프 노드(leaf node)로 하고,
그외, 새로운 분지가 계통도 (예 (v), 클래스, 특성 - {A}) 로 생성된 계통도가 되도록 함.
종료.
정보 획득량 산출에 대한 보다 상세한 설명은 하기에 기재한다. 상기 예의 가능한 클래스 vi가 확률 P(vi)를 갖는다면, 실제 응답의 정보량 I는 하기 식으로 주어진다:
Figure 112007081780858-PCT00002
I-수치는 사용된 특정 데이타세트에 대한 분류 결과를 도출하기 위해서 필요로 하는 정보의 양을 보여준다. 상기 데이타세트가 p개의 양성 (예를 들어 패혈증을 발병함) 및 n개의 음성 (예를 들어 패혈증을 발병하지 않음) 예 (예를 들어 대상)를 갖는다고 가정한다면, 올바른 응답에 함유된 정보는 다음과 같다:
Figure 112007081780858-PCT00003
상기 식에서, log2는 2를 밑으로 하는 로그이다. 단일 특성을 시험함으로써, 올바른 분류에서의 필요 정보량을 감소시킬 수 있다. 특정 특성 A (예를 들어 특정 바이오마커를 대표하는 특성)에 대한 나머지는 감소될 수 있는 필요 정보량을 보여준다.
Figure 112007081780858-PCT00004
"v"는 특정 데이타세트 중 특성 A에 대한 독특한 속성 수치의 수이고,
"i"는 특정 속성 수치이고,
"pi"는 분류가 양성 (예를 들어 패혈증을 발병함)인 경우에 있어서 특성 A에 대한 예의 수이며,
"ni"은 분류가 음성 (예를 들어 패혈증을 발병하지 않음)인 경우에 있어서 특성 A에 대한 예의 수이다.
특정 특성 A의 정보 획득량은 클래스에 대한 정보량과 특성 A의 나머지 사이의 차이로 산출된다:
Figure 112007081780858-PCT00005
정보 획득량은 상이한 특성이 분류에 얼마나 중요한지 (이것들이 상기 예를 얼마나 잘 분류하는지) 및 가장 높은 정보를 갖는 특성을 평가하는데 사용된다.
일반적으로 수많은 상이한 의사결정 계통도 알고리즘이 있고, 이것들 중 많은 것들이 문헌 [Duda, Pattern Classification, Second Edition, 2001, John Wiley & Sons, Inc.]에 기재되어 있다. 의사결정 계통도 알고리즘은 종종 특성 프로세싱, 불순도 측정, 정지 기준, 및 프루닝(pruning)의 고려를 요구한다. 구체적인 의사결정 계통도 알고리즘으로는 분류 및 회귀 계통도 (CART), 다변량 의사결정 계통도, ID3 및 C4.5 등이 있으나 이에 제한되지 않는다.
한 접근법에서, 의사결정 계통도가 이용되는 경우, 훈련 집단에서 본 발명에 기재된 유전자들의 선택 조합에 대한 유전자 발현 데이타를 평균 0 및 단위 분산을 갖도록 표준화한다. 훈련 집단의 구성원을 훈련 세트 및 시험 세트로 무작위로 나눈다. 예를 들어 한 실시양태에서, 훈련 집단 구성원 중 2/3를 훈련 세트에 배치하고, 훈련 집단 구성원 중 1/3을 시험 세트에 배치한다. 본 발명에 기재된 바이오마커들의 선택 조합에 대한 발현 수치를 사용하여 의사결정 계통도를 구축한다. 이어서, 시험 세트 중의 구성원을 올바르게 분류하는 의사결정 계통도의 능력을 결정한다. 일부 실시양태에서, 이러한 계산은 바이오마커의 주어진 조합에 대하여 여러 회 수행된다. 각 반복 계산에서, 훈련 집단의 구성원들을 훈련 세트 및 시험 세트로 무작위로 배당한다. 이어서, 바이오마커 조합의 품질을 의사결정 계통도 계산의 이러한 각 반복의 평균치로서 정한다.
본 발명의 바이오마커 세트 중에서 또는 이러한 바이오마커 2종의 상대적 특성 수치 중에서 각각의 분류가 상응하는 바이오마커에 대한 특성 수치를 기초로 하는 단변량 의사결정 계통도 뿐만이 아니라, 다변량 의사결정 계통도를 의사결정 규칙으로서 제공할 수도 있다. 이러한 다변량 의사결정 계통도에서는, 의사결정의 일부 또는 모두가 실제로 본 발명의 다수의 바이오마커에 대한 특성 수치의 선형 조합을 포함한다. 이러한 선형 조합은 공지의 기술, 예를 들어 분류 경사강하법 또는 오차 제곱 합 기준을 이용하여 훈련될 수 있다. 이러한 의사결정 계통도에 대한 예시로서, 하기 식을 고려할 수 있다:
Figure 112007081780858-PCT00006
여기서, x1 및 x2는 본 발명의 바이오마커 중 2종의 상이한 바이오마커에 대한 2가지 상이한 특성을 지칭한다. 의사결정 규칙을 도출하기 위해서, 특성 x1 및 x2의 수치는 미분류 대상으로부터 얻은 측정치에서 얻는다. 이어서, 이들 수치를 상기 식에 대입한다. 수치가 500 미만으로 계산되면, 의사결정 계통도의 제1 분지를 만든다. 또는, 의사결정 계통도의 제2 분지를 만든다. 다변량 의사결정 계통도는 문헌 [Duda, 2001, Pattern Classification, John Wiley & Sons, Inc., New York, pp. 408-409]에 기재되어 있으며, 상기 문헌은 본원에 참고로 포함된다.
본 발명에서 사용될 수 있는 또다른 접근법은 다변량 순응 회귀 스플라인 (MARS)이다. MARS는 순응성 회귀 절차이고, 본 발명에 의해 해결되는 고차원적 문제에 매우 적합하다. MARS는 회귀 세트 작성시의 CART 수행 개선을 위해 단계별 선형 회귀 또는 CART 방법의 변형법을 일반화시킨 것으로 볼 수 있다. MARS는 문헌 [Hastie et al., 2001, The Elements of Statistical Learning, Springer-Verlag, New York, pp. 283-295]에 기재되어 있으며, 상기 문헌은 그 전문이 본원에 참고로 포함된다.
5.5.2 미세배열의 예측 분석 (PAM)
본 발명에 따른 바이오마커의 특성 수치를 이용하여 의사결정 규칙을 생성하기 위한 한가지 접근법은 최근접 중심 분류자이다. 각 클래스 (패혈증 및 SIRS)에 대한 이러한 기술의 계산에서는, 중심값이 클래스 중 바이오마커의 평균 특성 수준으로 주어지고, 새로운 샘플을 중심이 최근접인 클래스에 배당한다. 상기 접근법은 k-평균 군집화와 유사하지만, 군집들이 공지된 클래스로 대체된다는 점은 제외한다. 상기 알고리즘은 다수의 바이오마커가 사용되는 경우에 잡음(noise)에 민감할 수 있다. 상기 기술에 대한 한가지 개선법에서는, 각 바이오마커에 있어서 클래스 중심들 사이의 차이가 우연으로 인한 것이기 쉬운 경우에는 이것을 0으로 설정하는 축소법(shrinkage)을 이용한다. 이러한 접근법은 미세배열의 예측 분석 또는 PAM으로 실행된다. 예를 들어 문헌 [Tibshirani et al., 2002, Proceedings of the National Academy of Science USA 99; 6567-6572]을 참조하며, 상기 문헌은 그 전문이 본원에 참고로 포함된다. 축소는, 차이를 잡음으로 간주하는 역치 미만으로 제어된다. 잡음 수준보다 높은 차이를 보이지 않는 바이오마커는 제거된다. 역치는 교차 검증으로 선택될 수 있다. 역치가 감소함에 따라, 더 많은 바이오마커가 포함되고, 추정되는 분류 오차는 최소치에 도달할 때까지 감소하고 잡음 바이오마커의 결과로서 다시 증가하기 시작한다 (과대적합(overfit)이라 공지된 현상).
5.5.3 배깅(bagging), 부스팅, 및 무작위 부분공간 방법
배깅, 부스팅, 무작위 부분공간 방법, 및 가법 계통도는 약한 의사결정 규칙을 개선시키는데 사용될 수 있는 조합 기술로서 공지된 데이타 분석 알고리즘이다. 이들 기술은 의사결정 계통도, 예를 들어 상기 단락 5.5.1에 기재한 의사결정 계통도를 위해 고안되었고, 또한 그러한 의사결정 계통도에 일반적으로 적용된다. 또한, 이러한 기술은 선형 판별 분석 등과 같은 다른 유형의 데이타 분석 알고리즘을 이용하여 생성된 의사결정 규칙에도 유용할 수 있다.
배깅에서는, 훈련 세트를 샘플링하여 무작위 독립적 부트스트랩(bootstrap) 반복표본(replicates)을 생성하고, 이들 각각에 대한 의사결정 규칙을 구축하고, 최종 의사결정 규칙에 대한 단순한 다수 의결을 통해 이것들을 규합한다. 예를 들어 문헌 ([Breiman, 1996, Machine Learning 24, 123-140] 및 [Efron & Tibshirani, An Introduction to Boostrap, Chapman & Hall, New York, 1993])을 참고하며, 상기 문헌은 그 전문이 본원에 참고로 포함된다.
부스팅에서, 의사결정 규칙은 가중 버전의 훈련 세트에 대해 구축되며, 이것은 이전의 분류 결과에 따라 달라진다. 먼저, 고려되는 모든 특성은 동등한 가중치를 가지며, 제1 의사결정 규칙은 상기 데이타 세트에 대해 구축된다. 이어서, 가중치는 의사결정 규칙의 수행에 따라 변화된다. 허위로 분류된 특성은 가중치가 더 커져서, 그 다음 의사결정 규칙이 재가중된 훈련 세트에 부스팅된다. 이러한 방식으로, 훈련 세트 및 의사결정 규칙의 수열이 얻어지고, 이후에는 최종 의사결정 규칙에 대한 단순한 다수 의결 또는 가중된 다수 의결로 조합된다. 예를 들어 문헌 [Freund & Schapire, "Experiments with a new boosting algorithm," Proceedings 13th International Conference on Machine Learning, 1996, 148-156]을 참조하며, 상기 문헌은 그 전문이 본원에 참고로 포함된다.
부스팅의 예로서, 연구되는 집단에 따른 2가지 표현형인 표현형 1 (예를 들어 규정된 시기 동안에 패혈증에 걸림) 및 표현형 2 (예를 들어 오직 SIRS - 대상이 규정된 시기 내에는 패혈증에 걸리지 않음을 의미함)가 존재하는 경우를 고려해 볼 수 있다. 훈련 세트 데이타로부터의 예측자 바이오마커의 벡터 (예를 들어 이러한 바이오마커를 대표하는 특성의 벡터)에 있어서, 의사결정 규칙 G(X)는 2가지 수치 세트 (표현형 1, 표현형 2) 중 유형 수치의 하나를 갖는 예측치를 산출한다. 훈련 샘플에 대한 오차율은 다음과 같다:
Figure 112007081780858-PCT00007
상기 식에서, N은 훈련 세트 중 대상의 수 (표현형 1 또는 표현형 2를 갖는 대상의 총합)이다. 예를 들어 패혈증에 걸린 49개의 유기체 및 SIRS 상태로 남아있는 72개 유기체가 존재한다면, N은 121이다. 약한 의사결정 규칙은 무작위 추측보다 약간만 더 좋은 오차율을 갖는 것이다. 부스팅 알고리즘에서, 약한 의사결정 규칙은 변형된 버전의 데이타에 반복적으로 적용되어, 약한 의사결정 규칙 수열 Gm(x), m, = 1, 2, ..., M을 산출한다. 이어서, 상기 수열 중 모든 의사결정 규칙으로부터의 예측치를 가중된 다수 의결을 통해 합하여 최종 의사결정 규칙을 산출한다:
Figure 112007081780858-PCT00008
여기서, α1, α2, ..., αM은 부스팅 알고리즘으로 계산되며, 이것의 목적은 각 의사결정 규칙 Gm(x)의 기여도를 가중하는 것이다. 이들의 효과는 상기 수열 중 보다 정확한 의사결정 규칙에 더 높은 영향을 주는 것이다.
각 부스팅 단계에서의 데이타 변형은 가중치 w1, w2, ..., wn을 훈련 관찰치 (xi, yi), i = 1, 2, ..., N 각각에 적용하는 것으로 이루어진다. 먼저, 모든 가중치는 wi = 1/N로 설정되어, 상기 제1 단계가 데이타에 대한 의사결정 규칙을 통상의 방식으로 단순히 훈련하게 된다. 각 연속 반복 m = 2, 3, ..., M에 대하여, 관찰 가중치는 개별적으로 변형되고, 의사결정 규칙은 가중된 관찰치에 다시 적용된다. 단계 m에서, 이전의 단계에서 유도된 의사결정 규칙 Gm-1(x)으로 미분류된 관찰치는 가중치가 증가되지만, 올바르게 분류된 경우에는 가중치가 감소된다. 따라서, 반복될 수록, 올바르게 분류하기 어려운 관찰은 계속 증가하는 영향을 수용한다. 이로 인해, 각각의 연속적인 의사결정 규칙은 상기 수열에서의 이전의 값에 의해 손실된 이러한 훈련 관찰치로 집결된다.
예시적 부스팅 알고리즘은 하기와 같이 요약된다:
1. 관찰 가중치 wi = 1/N, i = 1, 2, ..., N을 초기화함.
2. m = 1 내지 M인 경우,
(a) 가중치 wi를 사용하여 의사결정 규칙 Gm(x)를 훈련 세트에 핏팅함.
(b) 하기 식을 계산함:
Figure 112007081780858-PCT00009
(c) 하기 식을 계산함:
Figure 112007081780858-PCT00010
(d) 하기 값을 설정함:
Figure 112007081780858-PCT00011
3. 하기 값을 산출함:
Figure 112007081780858-PCT00012
이러한 알고리즘에 따른 한 실시양태에서, 각 객체는 사실상 인자이다. 추가로, 상기 알고리즘에에서 현재의 의사결정 규칙 Gm(x)는 2a항의 가중된 관찰치에 대해 유도된다. 생성되는 가중된 오차율은 2b항에서 계산된다. 2c항은 최종 분류자 G(x) (3항) 생성시에 Gm(x)에 주어지는 가중치 αm을 산출한다. 각 관찰치 개개의 가중치는 2d항에서 다음 반복을 위해 업데이트된다. Gm(x)에 의해 미분류된 관찰치는, 상기 수열에서의 그 다음 분류자 Gm+1(x) 유도에 대한 이들의 상대적 영향을 증가시키면서 인자 exp(αm)로 스케일링된 가중치를 갖는다. 일부 실시양태에서, 문헌 [Freund and Schapire, 1997, Journal of Computer and System Sciences 55, pp. 119-139]의 변형법인 부스팅 방법이 이용된다. 예를 들어 문헌 [Hasti et al., The Elements of Statistical Learning, 2001, Springer, New York, Chapter 10]을 참고하며, 상기 문헌은 그 전문이 본원에 참고로 포함된다. 예를 들어 일부 실시양태에서, 특성 예비선택은 문헌 [Park et al., 2002, Pac. Symp. Biocomput. 6, 52-63]의 비모수적 스코어링 방법과 같은 기술을 이용하여 수행되며, 상기 문헌은 그 전문이 본원에 참고로 포함된다. 특성 예비선택은 분류 사이를 판별하는 유전자에서의 차수 감소 형태이며, 분류자에서 사용할 최상의 것이 선택된다. 이후, 상기 문헌 [Freund and Schapire]의 부스팅 절차가 아니라 문헌 [Friedman et al., 2000, Ann Stat 28, 337-407]에 의해 도입된 로짓부스트(LogitBoost) 절차를 사용한다. 일부 실시양태에서, 문헌 [Ben-Dor et al., 2000, Journal of Computational Biology 7, 559-583]의 부스팅 및 다른 분류 방법이 본 발명에서 사용되며, 상기 문헌은 본원에 그 전문이 참고로 포함된다. 일부 실시양태에서, 문헌 [Freund and Schapire, 1997, Journal of Computer and System Sciences 55, 119-139]의 부스팅 및 다른 분류 방법이 사용되며, 상기 문헌은 본원에 그 전문이 참고로 포함된다.
무작위 부분공간 방법에서는, 의사결정 규칙이 데이타 특성 공간의 무작위 부분공간에서 구축된다. 이들 의사결정 규칙은 일반적으로 최종 의사결정 규칙에서의 단순한 다수 의결로 조합된다. 예를 들어 문헌 [Ho, "The Random subspace method for constructing decision forests," IEEE Trans Pattern Analysis and Machine Intelligence, 1998; 20(8):832-844]를 참조하며, 상기 문헌은 그 전문이 본원에 참고로 포함된다.
5.5.4 다중 가법 회귀 계통도
다중 가법 회귀 계통도 (MART)는 본 발명에서 사용될 수 있는 의사결정 규칙을 구축하는 또다른 방법을 대표한다. MART를 위한 일반적 알고리즘은 다음과 같다:
1.
Figure 112007081780858-PCT00013
을 초기화함.
2. m = 1 내지 M인 경우,
(a) I = 1,2, ..., N인 경우에는 하기 식을 계산함:
Figure 112007081780858-PCT00014
(b) 회귀 계통도를 표적에 핏팅하여, 말단 영역 Rjm (j = 1,2, ..., Jm)을 생성함.
(c) j = 1, 2, ..., Jm인 경우에는 하기 식을 계산함:
Figure 112007081780858-PCT00015
(d)
Figure 112007081780858-PCT00016
를 업데이트함.
3. 하기 값을 산출함:
Figure 112007081780858-PCT00017
상이한 손실 기준 L(y,f(x))를 대입하여 구체적인 알고리즘이 수득된다. 상기 알고리즘의 첫번째 항은 최적의 일정 모델로 초기화하고, 이것은 단지 단일 말단 노드 계통도이다. 2(a)항에서 계산된 음의 경사 성분은 일반화 유사 잔차, r이라고 지칭된다. 통상적으로 사용되는 손실 함수의 경사는 문헌 [Hastie et al., 2001, The Elements of Statistical Learning, Springer-Verlag, New York, p. 321]의 표 10.2에 요약되어 있으며, 상기 문헌은 본원에 참고로 포함된다. 분류 알고리즘은 유사하고, 문헌 [Hastie et al., Chapter 10]에 기재되어 있으며, 상기 문헌은 그 전문이 본원에 참고로 포함된다. MART 절차와 관련된 조정 파라미터는 반복값 M의 수 및 각각의 구성요소 계통도 Jm, m = 1, 2, ..., M의 크기이다.
5.5.5 회귀법으로 유도되는 의사결정 규칙
일부 실시양태에서, 대상 분류에 이용되는 의사결정 규칙은 회귀법을 이용하여 수립된다. 이러한 실시양태에서, 의사결정 규칙은 회귀 분류자, 바람직하게는 로지스틱 회귀 분류자를 특성으로 할 수 있다. 이러한 회귀 분류자는 상기 분류자 구축에 사용된 각각의 바이오마커에 대한 계수 (예를 들어 이러한 바이오마커 각각에 대한 특성)를 포함한다. 이러한 실시양태에서, 회귀 분류자를 위한 계수는 예를 들어 최대 가능도 접근법을 이용하여 계산된다. 이러한 계산법에서는 바이오마커에 대한 특성 (예를 들어 RT-PCR, 미세배열 데이타)이 이용된다. 특정 실시양태에서, 오직 2개만의 형질 하위군(trait subgroup)으로부터의 분자 마커 데이타가 이용되고 (예를 들어 형질 하위군 a는 규정된 시기 내에 패혈증에 걸릴 것이고, 형질 하위군 b는 규정된 시기 내에 패혈증에 걸리지 않을 것임), 종속 변수는 바이오마커 데이타가 이용가능한 대상 중 특정 형질의 부재 또는 존재이다.
또다른 구체적인 실시양태에서, 훈련 집단은 다수의 형질 하위군 (예를 들어 3개 이상의 형질 하위군, 4개 이상의 형질 하위군 등)을 포함한다. 이들 다중 형질 하위군은 훈련 집단에서 건강한 상태로부터 SIRS, 패혈증, 패혈증의 보다 진행된 단계로의 표현형적 진행에서의 개개의 단계에 상응할 수 있다. 이러한 구체적인 실시양태에서, 다중카테고리 응답을 다루는 로지스틱 회귀 모델의 일반화는 훈련 집단에서 발견되는 각종 형질 하위군 사이를 판별하는 의사결정 생성에 이용될 수 있다. 예를 들어 선택된 분자 마커에 대하여 측정된 데이타는 문헌 [Agresti, An Introduction to Categorical Data Analysis, 1996, John Wiley & Sons, Inc., New York, Chapter 8] (상기 문헌은 본원에 그 전문이 참고로 포함됨)에 기재된 임의의 다중카테고리 로짓(logit) 모델에 적용되어, 훈련 집단에서 대표되는 다수의 형질 하위군 중 임의의 것들 사이를 판별할 수 있는 분류자를 생성할 수 있다.
5.5.6 신경 네트워크
일부 실시양태에서, 본 발명의 선택된 바이오마커를 위해 결정된 특성 데이타 (예를 들어 RT-PCR 데이타, 질량 분광법 데이타, 미세배열 데이타)를 사용하여 신경 네트워크를 훈련할 수 있다. 신경 네트워크는 2-단계 회귀 또는 분류 의사결정 규칙이다. 신경 네트워크는 가중치 층에 의해 출력 단위 층에 연결된 입력 단위 (및 편향(bias)) 층을 포함하는 층상 구조를 갖는다. 회귀의 경우, 출력 단위 층은 전형적으로 단지 1개의 출력 단위를 포함한다. 그러나, 신경 네트워크는 연속(seamless) 방식으로 다중 정량적 응답을 다룰 수 있다.
다층 신경 네트워크에는, 입력 단위 (입력 층), 은닉 단위 (은닉 층), 및 출력 단위 (출력 층)가 있다. 추가로, 입력 단위 이외의 각 단위에 연결된 단일 편향 단위도 있다. 신경 네트워크는 문헌 ([Duda et al., 2001, Pattern Classification, Second Edition, John Wiley & Sons, Inc., New York] 및 [Hastie et al., 2001, The Elements of Statistical Learning, Springer-Verlag, New York])에 기재되어 있고, 상기 문헌 각각은 본원에 그 전문이 참고로 포함된다. 신경 네트워크는 또한 문헌 ([Draghici, 2003, Data Analysis Tools for DNA Microarrays, Chapman & Hall/CRC] 및 [Mount, 2001, Bioinformatics: sequence and genome analysis, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York)에도 기재되어 있고, 상기 문헌 각각은 본원에 그 전문이 참고로 포함된다. 하기에는 신경 네트워크의 일부 예시적 형태를 기재한다.
신경 네트워크를 이용하는 기본적인 접근법은 훈련되지않은 네트워크로 출발하여 입력 층에 훈련 패턴을 제공하고 네트에 신호를 패스시켜 출력 층에서 출력값을 결정하는 것이다. 이후, 이들 출력값을 표적 수치와 비교하며, 임의의 차이는 오차에 상응한다. 이러한 오차 또는 기준 함수는 가중치의 일부 스칼라 함수이고, 네트워크 출력이 원하는 출력과 대응될 때 최소화된다. 따라서, 이러한 오차 측정치가 축소되도록 가중치를 조정한다. 회귀의 경우, 이러한 오차는 오차 제곱 합일 수 있다. 분류의 경우, 이러한 오차는 오차 제곱 또는 교차-엔트로피 (편차)일 수 있다. 예를 들어 문헌 [Hastie et al., 2001, The Elements of Statistical Learning, Springer-Verlag, New York]을 참조하며, 상기 문헌은 그 전문이 본원에 참고로 포함된다.
통상 이용되는 3가지 훈련 프로토콜은 확률(stochastic), 배치(batch) 및 온라인이다. 확률 훈련에서, 패턴이 훈련 세트에서 무작위로 선택되고, 네트워크 가중치는 각 패턴 제시값에 대해 업데이트된다. 확률 역-전파와 같은 경사 강하 방법에 의해 훈련된 다층 비-선형 네트워크는 네트워크 위상으로 규정된 분류자 중 가중치 수치의 최대-가능도 추정을 수행한다. 배치 훈련에서는, 모든 패턴이 학습 수행 이전에 네트워크로 제시된다. 전형적으로, 배치 훈련에서는 훈련 데이타를 통해 여러회의 패스가 이루어진다. 온라인 훈련에서는, 각 패턴이 1회 및 오직 1회만 네트로 제시된다.
일부 실시양태에서, 가중치에 대한 출발 수치가 고려된다. 가중치가 0에 가까운 경우, 신경 네트워크의 은닉 층에 통상 사용되는 시그모이드의 연산부 (예를 들어 문헌 [Hastie et al., 2001, The Elements of Statistical Learning, Springer-Verlag, New York]을 참조하며, 상기 문헌은 본원에 참고로 포함됨)는 거의 선형이며, 따라서 신경 네트워크는 대략 선형인 분류자로 붕괴된다. 일부 실시양태에서, 가중치에 대한 출발 수치는 0에 가까운 무작위 수치이도록 선택된다. 따라서, 분류자는 거의 선형으로 출발하여 가중치 증가에 따라 비-선형이 된다. 개개의 단위는 방향성을 갖고 국소화하여 필요한 곳에 비-선형성을 도입한다. 정확한 0 가중치의 사용은 0 미분계수 및 완벽한 대칭을 유도하고, 상기 알고리즘은 전혀 이동하지 않는다. 별법으로, 큰 가중치로 출발하면 종종 불량한 해법(solution)이 얻어진다.
입력의 스케일링이 바닥 층 중 가중치의 효과적인 스케일링을 결정하기 때문에, 최종 해법의 품질에 큰 영향을 줄 수 있다. 따라서, 일부 실시양태에서, 모든 시초 발현 수치가 평균 0 및 표준 편차 1이도록 표준화된다. 이는, 모든 입력이 정규화 과정에서 동등하게 처리되도록 하고, 무작위 출발 가중치에 대한 의미있는 범위를 선택할 수 있게 한다. 표준화 입력을 이용할 때, 범위 [-0.7, +0.7]에 걸쳐 무작위 균등 가중치를 취하는 것이 전형적이다.
3층 네트워크 사용시 되풀이되는 문제는 네트워크에서 사용되는 은닉 단위의 최적 수이다. 3층 네트워크의 입력 및 출력 수는 해결될 문제에 따라 결정된다. 본 발명에 있어서, 주어진 신경 네트워크에서의 입력 수는 훈련 집단으로부터 선택된 바이오마커의 수와 동일할 것이다. 네트워크에서의 출력 수는 전형적으로 단지 1일 것이다. 그러나, 일부 실시양태에서는 네트워크에 의해 1개 초과의 출력이 이용되어 단지 2개 초과의 상태가 규정될 수 있다. 예를 들어 다중-출력 신경 네트워크는 건강한 표현형들, SIRS의 여러 단계, 및/또는 패혈증의 여러 단계 사이를 판별하는데 이용될 수 있다. 만일 지나치게 많은 은닉 단위가 신경 네트워크에서 사용되는 경우, 상기 네트워크는 지나치게 많은 자유도를 갖게 될 것이고 지나치게 오래 훈련되며, 네트워크가 데이타를 과대적합하게 할 위험이 있다. 지나치게 적은 은닉 단위가 있는 경우, 상기 훈련 세트는 학습될 수 없다. 그러나, 일반적으로는 지나치게 많은 은닉 단위를 갖는 것이 지나치게 적은 경우보다 낫다. 은닉 단위가 지나치게 적으면, 분류자가 해당 일에 비-선형성을 포획할 만큼 충분한 융통성을 지닐 수 없다. 은닉 단위가 지나치게 많으면, 하기하는 바와 같이 적절한 정규화 또는 프루닝이 사용되는 경우에는 여분의 가중치가 0쪽으로 축소될 수 있다. 전형적인 실시양태에서, 은닉 단위의 수는 5 내지 100의 범위 내에 있고, 그 수는 입력 수 및 훈련 사건의 수와 함께 증가한다.
사용할 은닉 단위의 수를 결정하는 한가지 일반적인 접근법은 정규화 접근법을 적용하는 것이다. 정규화 접근법에서는, 전통적인 훈련 오차 뿐만이 아니라 분류자 복잡성에 따라서도 달라지는 새로운 기준 함수가 구축된다. 구체적으로, 상기한 새로운 기준 함수는 고도로 복잡한 분류자에게 패널티를 부여한다. 이 기준에서 최소를 위한 검색은 훈련 세트에서의 오차를 훈련 세트 및 정규화 항에서의 오차와 균형을 맞추기 위한 것으로, 이는 해법의 제약 또는 바람직한 성질을 표현한다:
Figure 112007081780858-PCT00018
파라미터 λ는 정규화가 보다 더 또는 덜 강력하게 되도록 조정된다. 즉, λ 수치가 클수록 가중치가 0쪽으로 축소되는 경향이 있다. 전형적으로, 검증 세트를 사용한 교차 검증을 이용하여 λ를 추정한다. 이러한 검증 세트는 훈련 집단의 무작위 서브세트를 제외하여 수득될 수 있다. 다른 형태의 패널티, 예를 들어 가중치 제거 패널티가 제안된 바 있다 (예를 들어 문헌 [Hastie et al., 2001, The Elements of Statistical Learning, Springer-Verlag, New York]을 참조하며, 상기 문헌은 본원에 참고로 포함됨).
사용할 은닉 단위의 수를 결정하는 또다른 접근법은, 최소로 필요로 하는 가중치를 제거하는 (프루닝) 것이다. 한 접근법에서, 최소 규모의 가중치가 제거된다 (0으로 설정). 이러한 규모-기재의 프루닝은 작동할 수 있지만 최적은 아니고, 때로는 작은 규모의 가중치가 학습 및 훈련 데이타에 중요하다. 일부 실시양태에서는 규모-기재 프루닝 접근법이 이용되는 것이 아니라 왈드(Wald) 통계량이 계산된다. 왈드 통계에서의 기본 개념은 분류자 중 은닉 단위 (가중치)의 중요성을 추정하는데 이용될 수 있다는 것이다. 이후, 최소의 중요성을 갖는 은닉 단위를 제거한다 (이들의 입력 및 출력 가중치를 0으로 설정함). 이와 관련한 2가지 알고리즘이 가중치에 대한 훈련 오차의 의존도를 예측하고 훈련 오차에 있어서의 최소 증가를 유도하는 가중치를 제거하기 위한 2차 근사법을 사용하는 OBD (Optimal Brain Damage) 및 OBS (Optimal Brain Surgeon) 알고리즘이다.
OBD 및 OBS은 네트워크를 가중치 w에서 국소 최소 오차로 훈련한 후에 훈련 오차에서의 최소 증가를 유도하는 가중치를 프루닝하는, 동일한 기본적 접근법을 공유한다. 완전 가중치 벡터 δw에서의 변화에 대한 오차에서 예측되는 함수 증가는 다음과 같다:
Figure 112007081780858-PCT00019
여기서,
Figure 112007081780858-PCT00020
는 헤시안 행렬이다. 첫번째 항은 국소 최소 오차에서 사라지고, 세번째 및 그 이상 차수의 항은 무시된다. 이 함수를 1 가중치를 제거하는 제약으로 최소화하는 일반적인 해법은 다음과 같다:
Figure 112007081780858-PCT00021
여기서, uq는 가중치 공간에서 q번째 방향의 단위 벡터이고, Lq는 가중치 q의 중대성(saliency)으로의 근사법 (가중치 q가 프루닝되고 다른 가중치가 δw로 업데이트되는 경우, 훈련 오차에서의 증가)이다. 이들 식에는 H의 역이 요구된다. 이러한 역행렬을 산출하는 한가지 방법은 작은 수치, H0 -1 = α-1I (여기서, α는 작은 파라미터 -효과적으로는 가중치 상수)로 시작하는 것이다. 그 다음에는 상기 행렬을 하기 식에 따른 각 패턴으로 업데이트한다:
<식 1>
Figure 112007081780858-PCT00022
여기서, 아래첨자는 제시된 패턴에 상응하고, am은 m에 따라 감소한다. 전체 훈련 세트가 제시된 후, 역 헤시안 행렬은 H-1 = Hn -1로 주어진다. 알고리즘 형태에서, OBS 방법은 다음과 같다:
nH, W, θ의 초기화를 시작함.
대형 네트워크를 합리적으로 훈련하여 오차를 최소화함.
식 1로 H-1을 계산함.
Figure 112007081780858-PCT00023
(J(w) > θ까지)
w를 리턴함.
종료.
3항에서의 헤시안 역행렬 산출이 대각 행렬에 비해 특히 단순하기 때문에, OBD 방법은 계산상 더 단순하다. 상기 알고리즘은 오차가 θ이도록 초기화된 기준치보다 더 클때 종료된다. 또다른 접근법은 가중치 제거로 인한 J(w)의 변화가 일부 기준 수치보다 더 큰 경우에 6항을 변화시켜 종료시키는 것이다. 일부 실시양태에서, 역-전파 신경 네트워크가 이용된다. 예를 들어 문헌 [Abdi, 1994, "A neural network primer," J. Biol System. 2, 247-283]을 참조하며, 상기 문헌은 본원에 그 전문이 참고로 포함된다.
5.5.7 군집화
일부 실시양태에서, 본 발명의 선택된 바이오마커에 대한 특성을 이용하여 훈련 세트를 군집화한다. 예를 들어, 본 발명에 기재된 10가지 특성 (10종의 바이오마커에 상응함)이 이용되는 경우를 고려할 수 있다. 이 경우, 훈련 집단의 각 구성원 m은 상기한 10종의 바이오마커 각각에 대하여 특성 수치 (예를 들어 발현 수치)를 갖는다. 훈련 집단의 구성원 m으로부터의 이러한 수치가 하기 벡터를 규정한다:
Figure 112007081780858-PCT00024
여기서, Xim은 유기체 m 중 i번째 바이오마커의 발현 수준이다. 훈련 세트에 m개의 유기체가 존재하는 경우, i 바이오마커의 선택이 m 벡터를 규정할 것이다. 본 발명의 방법에서는 벡터에 사용되는 모든 단일 바이오마커의 발현 수치 각각이 모든 단일 벡터 m에서 대표될 필요가 없음이 주목된다. 즉, i번째 바이오마커 중 하나가 발견되지 않은 대상으로부터의 데이타가 여전히 군집화에 사용될 수 있다. 이러한 예에서, 발현 수치가 없는 것에는 "0"을 배당하거나 또는 일부 다른 정규화 수치를 배당한다. 일부 실시양태에서는 군집화 이전에 특성 수치를 정규화하여, 평균 수치 0 및 단위 분산을 갖게 한다.
훈련 군에서 유사한 발현 패턴을 나타내는 훈련 집단의 구성원은 함께 군집화되는 경향이 있을 것이다. 본 발명의 유전자들의 특정 조합은, 벡터가 훈련 집단에 존재하는 형질군으로 군집화되는 경우에 본 발명의 이러한 측면에서 양호한 분류자로 간주된다. 예를 들어 훈련 집단이 패혈증을 발병하지 않는 대상인 클래스 a 및 패혈증을 발병하는 대상인 클래스 b를 포함한다면, 이상적인 군집화 분류자는 상기 집단을 클래스 a를 단독으로 대표하는 한 군집군 및 클래스 b를 단독으로 대표하는 다른 군집군의 2개 군으로 군집화될 것이다.
군집화는 문헌 [Duda and Hart, Pattern Classification and Scene Analysis, 1973, John Wiley & Sons, Inc., New York] (이하, "상기 문헌 [Duda 1973]")의 211 내지 256 페이지에 기재되어 있고, 상기 문헌은 본원에 그 전문이 참고로 포함된다. 상기 문헌 [Duda 1973]의 단락 6.7에 기재되어 있는 바와 같이, 군집화 문제는 데이타세트 중에서의 자연적 군별 분류 확인법 중 하나로서 기재되어 있다. 자연적 군별 분류를 확인하기 위해서는, 2가지 사안이 해결되어야 한다. 첫째, 2개 샘플 사이의 유사성 (또는 비유사성) 측정 방법이 결정되어야 한다. 이러한 계측 (유사성 측정)은 한 군집 내의 샘플이 다른 군집 내의 샘플보다 서로 더 유사하도록 하는데 이용된다. 둘째, 상기 유사성 측정을 이용하여 데이타를 군집으로 분할하는 메카니즘이 결정되어야 한다.
유사성 측정은 상기 문헌 [Duda 1973]의 단락 6.7에서 논의되고 있는데, 여기서는 군집화 조사를 시작하는 한 방법이 거리 함수를 정의하고 데이타세트 내 모든 쌍의 샘플 사이의 거리 행렬을 계산하는 것이라고 언급되어 있다. 거리가 유사성의 양호한 척도라면, 동일 군집 내 샘플들 사이의 거리는 상이한 군집 내 샘플들 사이의 거리보다 유의하게 더 가까울 것이다. 그러나, 상기 문헌 [Duda 1973]의 215 페이지에서 언급된 바와 같이, 군집화에는 거리 계측을 이용할 필요가 없다. 예를 들어 비계측형 유사성 함수 s (x, x')가 2개의 벡터 x 및 x'를 비교하는데 이용될 수 있다. 통상적으로, s (x, x')는 x 및 x'가 대충 "유사한" 경우에 수치가 큰 대칭 함수이다. 비계측형 유사성 함수 s (x, x')의 예는 상기 문헌 [Duda 1973]의 216 페이지에 기재되어 있다.
일단, 데이타세트 내 지점 간의 "유사성" 또는 "비유사성" 측정 방법이 선택되면, 군집화에는 임의의 데이타 분할의 군집화 품질을 결정하는 기준 함수가 필요하다. 기준 함수를 극단으로 하는 데이타 세트의 분할이 데이타 군집화에 이용된다. 상기 문헌 [Duda 1973]의 217 페이지를 참조한다. 기준 함수는 상기 문헌 [Duda 1973]의 단락 6.8에서 논의되고 있다.
더욱 최근에, 문헌 [Duda et al., Pattern Classification, 2nd edition, John Wiley & Sons, Inc. New York]이 간행되었다. 537 내지 563 페이지는 군집화를 상세하게 기재한다. 군집화 기술에 관한 더 많은 정보는 문헌 ([Kaufman and Rousseeuw, 1990, Finding Groups in Data: An Introduction to Cluster Analysis, Wiley, New York, NY; Everitt, 1993], [Cluster analysis (3d ed.), Wiley, New York, NY] 및 [Backer, 1995, Computer-Assisted Reasoning in Cluster Analysis, Prentice Hall, Upper Saddle River, New Jersey])에서 찾을 수 있다. 본 발명에서 이용될 수 있는 특별한 예시적 군집화 기술로는 계층적 군집화 (최근접 알고리즘을 이용한 병합 군집화, 최원접 알고리즘, 평균 연결 알고리즘, 중심 알고리즘, 또는 제곱합 알고리즘), k-평균 군집화, 퍼지 k-평균 군집화 알고리즘, 및 자비스-패트릭(Jarvis-Patrick) 군집화 등이 있으나 이에 제한되지 않는다.
5.5.8 주요 성분 분석
유전자 발현 데이타 분석을 위해 주요 성분 분석 (PCA)이 제안된 바 있다. 더욱 일반적으로, PCA는 본 발명의 바이오마커의 특성 수치 데이타를 분석하여 전환자와 비-전환자를 판별하는 의사결정 규칙을 구축하는데 이용될 수 있다. 주요 성분 분석은, 데이타를 데이타 특성을 요약하는 새로운 세트의 변수 (주요 성분)으로 전환시켜서 데이타 세트의 차수를 감소시키는 전통적인 기술이다. 예를 들어 문헌 [Jolliffe, 1986, Principal Component Analysis, Springer, New York]을 참조하며, 상기 문헌은 본원에 참고로 포함된다. 주요 성분 분석은 또한 문헌 [Draghici, 2003, Data Analysis Tools for DNA Microarrays, Chapman & Hall/CRC]]에도 기재되어 있으며, 상기 문헌은 본원에 참고로 포함된다. 하기에는 주요 성분 분석의 비-제한적인 예를 기재한다.
주요 성분 (PC)은 상관관계가 없으며 k번째 PC가 PC들 사이에서 k번째 최대 분산을 갖도록 배열된다. k번째 PC는 데이타 지점의 사영 변동을 최대화하여 첫번째 k-1 PC에 직교하도록 하는 방향으로 풀이될 수 있다. 처음 몇개의 PC는 데이타 세트의 대부분의 변동을 포획한다. 반대로, 마지막 몇개의 PC는 종종 데이타 중 잔차 '잡음'만을 포획한다고 추측된다.
PCA는 또한 본 발명에 따른 분류자 생성에도 이용될 수 있다. 이러한 접근법에서, 본 발명의 선택된 바이오마커를 위한 벡터는 앞서 군집화에 관해 기재한 것과 동일한 방식으로 구축될 수 있다. 사실상, 각각의 벡터가 훈련 집단의 특정 구성원으로부터의 선택된 유전자에 대한 특성 수치 (예를 들어 풍부도 수치)를 대표하는 벡터 세트는 행렬로 나타낼 수 있다. 일부 실시양태에서, 이 행렬은 단량체의 정성적인 2원적 기재에 관한 프리-윌슨(Free-Wilson) 방법에서 대표되고 [Kubinyi, 1990, 3D QSAR in drug design theory methods and applications, Pergamon Press, Oxford, pp 589-638], PCA를 사용한 최대 압축 공간에 분포되어 행렬 내의 모든 분산 정보가 고려될 때까지 첫번째 주요 성분 (PC)이 가능한 최대량의 분산 정보를 포획하고, 두번째 주요 성분 (PC)이 두번째 최대량의 모든 분산 정보를 포획하는 식이다.
이후, 각각의 벡터 (여기서, 각 벡터는 훈련 집단의 구성원을 대표함)를 플롯팅한다. 플롯의 많은 상이한 유형이 가능하다. 일부 실시양태에서, 1-차원 플롯이 제작된다. 이러한 1-차원 플롯에서는, 훈련 집단의 각 구성원으로부터의 첫번째 주요 성분에 대한 수치가 플롯팅된다. 이러한 형태의 플롯에서, 첫번째 하위군 (예를 들어 정해진 시기 내에 패혈증을 발병하지 않는 대상으로 이루어진 하위군)의 구성원이 소정 범위의 첫번째 주요 성분 수치 내에 군집화되고, 두번째 하위군 (예를 들어 정해진 시기 내에 패혈증을 발병하는 대상으로 이루어진 하위군)의 구성원이 첫번째 주요 성분 수치의 두번째 범위에서 군집화된다고 기대된다.
이상적인 한 예에서, 훈련 집단은 "패혈증" 및 "SIRS"의 2개 하위군을 포함한다. 첫번째 주요 성분은 전체 훈련 집단 데이타 세트에 대하여 본 발명의 선택된 바이오마커에 대한 분자 마커 발현 수치를 이용하여 계산된다. 이후, 훈련 세트의 각 구성원을 첫번째 주요 성분에 대한 수치의 함수로서 플롯팅한다. 이러한 이상적인 예에서, 첫번째 주요 성분이 양성인 훈련 집단의 구성원은 "응답자"이고, 첫번째 주요 성분이 음성인 훈련 집단의 구성원은 "패혈증에 걸린 대상"이다.
일부 실시양태에서, 훈련 집단의 구성원을 1종 초과의 주요 성분에 대하여 플롯팅한다. 예를 들어 일부 실시양태에서, 훈련 집단의 구성원을 첫번째 차원이 첫번째 주요 성분이고 두번째 차원이 두번째 주요 성분인 2-차원 플롯으로 플롯팅한다. 이러한 2-차원 플롯에서는, 훈련 집단에서 대표되는 각 하위군의 구성원이 별개의 군으로 군집화할 것으로 기대된다. 예를 들어 2-차원 플롯 구성원의 첫번째 군집은 주어진 시기 내에 패혈증을 발병하는 대상을 대표할 것이고, 2-차원 플롯 구성원의 두번째 군집은 주어진 시기 내에 패혈증을 발병하지 않는 대상을 대표할 것이다.
5.5.9 최근접 분석
최근접 분류자는 기억을 기초로 하고, 핏팅될 분류자가 필요하지 않다. 의문 지점 x0가 주어진다면, x0에 거리상 가장 가까운 k 훈련 지점 x(r), r, ..., k가 확인되고, 이때 지점 x0가 k 최근접을 이용하여 분류된다. 타이(tie)는 무작위로 파괴될 수 있다. 일부 실시양태에서, 특성 공간에서의 유클리드 거리는 다음과 같이 거리를 결정하는데 이용된다:
Figure 112007081780858-PCT00025
전형적으로, 최근접 알고리즘이 이용되는 경우에, 선형 판별 계산에 이용되는 발현 데이타는 평균 0 및 분산 1을 갖도록 표준화된다. 본 발명에서, 훈련 집단의 구성원은 훈련 세트 및 시험 세트로 무작위로 나뉜다. 예를 들어 한 실시양태에서, 훈련 집단 구성원 중 2/3를 훈련 세트에 배치하고, 훈련 집단 구성원 중 1/3을 시험 세트에 배치한다. 본 발명의 바이오마커들의 선택 조합은 시험 세트의 구성원이 플롯팅되는 특성 공간을 대표한다. 그 다음, 시험 세트의 구성원을 올바르게 특성규명하는 훈련 세트의 능력을 계산한다. 일부 실시양태에서, 본 발명의 바이오마커들에 대하여 주어진 조합에 대하여 최근접 계산이 여러회 수행된다. 각 반복 계산시에, 훈련 집단의 구성원은 훈련 세트 및 시험 세트에 무작위로 배당된다. 이후, 바이오마커들의 조합의 품질을 최근접 계산의 이러한 각 반복의 평균으로 잡는다.
최근접 규칙은 불균등 클래스 등급, 차별적인 오분류 비용, 및 특성 선택의 사안을 처리하도록 정립될 수 있다. 이러한 정립의 많은 것들은 이웃값을 위한 몇가지 형태의 가중 투표를 포함한다. 최근접 분석에 관한 보다 많은 정보를 위해서는, 문헌 ([Duda, Pattern Classification, Second Edition, 2001, John Wiley & Sons, Inc] 및 [Hastie, 2001, The Elements of Statistical Learning, Springer, New York])을 참조하며, 상기 문헌 각각은 본원에 그 전문이 참고로 포함된다.
5.5.10 선형 판별 분석
선형 판별 분석 (LDA)은 특정 객체 성질을 기초로 하여 2개 카테고리 중 하나로의 대상 분류를 시도한다. 즉, LDA는 실험에서 측정된 객체 속성이 해당 객체의 카테고리화를 예측하는지 여부를 시험한다. 전형적으로, LDA에는 연속적인 독립 변수 및 이분성 카테고리 종속 변수가 요구된다. 본 발명에서, 훈련 집단의 서브세트에 있어서 본 발명의 바이오마커의 선택 조합에 대한 특성 수치는 연속적인 독립 변수 요건으로 작용한다. 훈련 집단의 각 구성원의 형질 하위군 분류는 이분성 카테고리 종속 변수로서 작용한다.
LDA는 군별 분류 정보를 이용하여 군 사이의 분산비 및 군 내의 분산비를 최대화하는 변수들의 선형 조합을 찾는다. 절대적으로, LDA에 의해 사용되는 선형 가중치는 훈련 세트에서의 분자 마커 특성 수치가 2개의 군 (예를 들어 규정된 시기 동안 패혈증을 발병하는 군 a 및 규정된 시기 동안 패혈증을 발병하지 않는 군 b)으로 어떻게 분리되는가 및 이들 특성 수치가 다른 바이오마커의 특성 수치와 얼마나 관련이 있는가에 따라 달라진다. 일부 실시양태에서, LDA는 본 발명에 기재된 바이오마커의 조합에서 K 바이오마커에 의한 훈련 샘플 중 N 구성원의 데이타 행렬에 적용된다. 이후, 훈련 집단의 각 구성원의 선형 판별을 플롯팅한다. 이상적으로는, 첫번째 하위군 (예를 들어 규정된 시기 내에 패혈증을 발병하는 대상으로 이루어진 하위군)을 대표하는 훈련 집단 구성원은 소정 범위의 선형 판별 수치 (예를 들어 음성) 내로 군집화되고, 두번째 하위군 (예를 들어 규정된 시기 내에 패혈증을 발병하지 않는 대상으로 이루어진 하위군)을 대표하는 훈련 집단 구성원은 선형 판별 수치의 두번째 범위 (예를 들어 양성)로 군집화될 것이다. LDA는 판별 수치의 군집 사이의 분리가 클 수록 더욱 성공적이라고 여겨진다. 선형 판별 분석에 관한 보다 많은 정보를 위해서는, 문헌 ([Duda, Pattern Classification, Second Edition, 2001, John Wiley & Sons, Inc] 및 [Hastie, 2001, The Elements of Statistical Learning, Springer, New York] 및 [Venables & Ripley, 1997, Modern Applied Statistics with s-plus, Springer, New York])을 참고하며, 상기 문헌 각각은 본원에 그 전문이 참고로 포함된다.
5.5.11 2차 판별 분석
2차 판별 분석 (QDA)은 LDA와 동일한 입력 파라미터를 이용하고 동일한 결과를 산출한다. QDA는 선형 방정식이 아닌 2차 방정식을 이용하여 결과를 산출한다. LDA 및 QDA는 서로 바꿔 사용될 수 있으며, 어느 것을 사용하는지는 선호도 및/또는 분석을 지원하는 소프트웨어의 이용가능성의 문제이다. 로지스틱 회귀는 LDA 및 QDA와 동일한 입력 파라미터를 이용하고 동일한 결과를 산출한다.
5.5.12 지원 벡터 머신
본 발명의 일부 실시양태에서, 지원 벡터 머신 (SVM)이 본 발명에 기재된 유전자의 특성 수치를 이용하여 대상을 분류하는데 이용된다. SVM은 상대적으로 새로운 유형의 학습 알고리즘이다. 예를 들어 문헌 ([Cristianini and Shawe-Taylor, 2000, An Introduction to Support Vector Machines, Cambridge University Press, Cambridge], [Boser et al., 1992, "A training algorithm for optimal margin classifiers," in Proceedings of the 5th Annual ACM Workshop on Computational Learning Theory, ACM Press, Pittsburgh, PA, pp. 142-152], [Vapnik, 1998, Statistical Learning Theory, Wiley, New York; Mount, 2001, Bioinformatics: sequence and genome analysis, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York, Duda, Pattern Classification, Second Edition, 2001, John Wiley & Sons, Inc.] 및 [Hastie, 2001, The Elements of Statistical Learning, Springer, New York], 및 [Furey et al., 2000, Bioinformatics 16, 906-914])를 참조하며, 상기 문헌 각각은 본원에 그 전문이 참고로 포함된다. 분류에 이용될 경우, SVM은 주어진 세트의 2원적 표지된 데이타 훈련 데이타를 그와 최대 거리를 두고 떨어져 있는 초평면으로 분리한다. 선형 분리가 가능하지 않은 경우, SVM은 특성 공간으로의 비-선형 맵핑을 자동적으로 실현하는 '커널(kernels)' 기술과 함께 작동할 수 있다. 특성 공간에서 SVM에 의해 발견된 초평면은 입력 공간에서의 비-선형 의사결정 경계에 상응한다.
한 접근법에서, SVM가 사용되는 경우에는 특성 데이타를 평균 0 및 단위 분산으로 표준화하고 훈련 집단의 구성원을 훈련 세트 및 시험 세트로 무작위로 나눈다. 예를 들어 한 실시양태에서, 훈련 집단 구성원 중 2/3를 훈련 세트에 배치하고, 훈련 집단 구성원 중 1/3을 시험 세트에 배치한다. 본 발명에 기재된 유전자들 조합에 대한 발현 수치를 이용하여 SVM을 훈련한다. 그 다음, 훈련된 SVM이 시험 세트의 구성원을 올바르게 분류하는 능력을 결정한다. 일부 실시양태에서, 분자 마커의 주어진 조합에 대하여 이러한 계산을 여러회 수행한다. 각 반복 계산시에, 훈련 집단의 구성원은 훈련 세트 및 시험 세트에 무작위로 배당된다. 이후, 바이오마커들의 조합의 품질을 SVM 계산의 이러한 각 반복의 평균으로 잡는다.
5.5.13 진화적 방법
생물학적 진화 과정으로 시사되는 바와 같이, 의사결정 규칙 디자인의 진화적 방법은 의사결정 규칙에 대한 확률 탐색을 이용한다. 대략적으로 검토하면, 이러한 방법은 본 발명에 기재된 바이오마커들의 조합으로부터 여러가지 의사결정 규칙 - 집단 -을 생성한다. 각각의 의사결정 규칙은 서로와 약간 다르다. 그 다음, 의사결정 규칙을 훈련 집단에서의 특성 데이타에 대하여 스코어링한다. 생물학적 진화와 유사하게, 생성되는 (스칼라) 스코어는 때로는 적응도(fitness)라고 불린다. 의사결정 규칙은 스코어에 따라 등급이 결정되고, 최상의 의사결정 규칙이 남게 된다 (의사결정 규칙 전체 집단의 일부). 다시, 생물학적 용어와 마찬가지로, 이것은 적자생존이라 불린다. 의사결정 규칙은 확률적으로 다음 세대 - 어린이 또는 자손(offspring) -에서 변경된다. 일부의 자손 의사결정 규칙은 이전 세대에서의 모체(parent)보다 더 높은 스코어를 가질 것이고, 일부는 더 낮은 스코어를 가질 것이다. 그 다음에는, 차후 세대를 위해 전반적인 과정을 반복한다: 의사결정 규칙을 스코어링하고, 최상의 것이 남게 되고 무작위로 변경되어 또다른 세대가 생겨나는 식이다. 부분적으로는 등급 결정 때문에 각 세대는 평균적으로 이전 세대보다 약간 더 높은 스코어를 갖는다. 상기 과정은 세대 내 단일 최상 의사결정 규칙이 원하는 기준 수치를 넘는 스코어를 갖게 될 때 중단된다. 진화적 방법에 대한 더 많은 정보는 예를 들어 문헌 [Duda, Pattern Classification, Second Edition, 2001, John Wiley & Sons, Inc.]에서 찾을 수 있다.
5.5.14 기타 데이타 분석 알고리즘
상기한 데이타 분석 알고리즘은 전환자와 비-전환자를 판별하기 위한 의사결정 규칙을 구축하는데 이용될 수 있는 방법의 유형에 대한 예에 불과하다. 추가로, 상기한 기술의 조합이 이용될 수 있다. 일부 조합, 예를 들어 의사결정 계통도와 부스팅의 조합을 이용하는 것이 기재된 바 있다. 그러나, 많은 다른 조합도 가능하다. 또한, 사영 추적 및 가중 투표와 같이 당업계의 다른 기술이 의사결정 규칙을 구축하는데 이용될 수도 있다.
5.6 바이오마커
구체적인 실시양태에서, 본 발명은 대상에서 패혈증 및/또는 그의 진행 단계를 진단 또는 예측하는데 유용한 바이오마커를 제공한다. 본 발명의 방법이 예측성 바이오마커를 동정하는데 비편향 접근법을 이용할 수 있지만, 당업자에게는 생리적인 응답 또는 각종 신호전달 경로와 관련이 있는 특정 군의 바이오마커가 특별히 주목되는 대상일 수 있음이 명백할 것이다. 이는, 생물학적 샘플로부터의 바이오마커가 바이오마커와의 직접적이고 특이적인 상호작용을 통해 각종 바이오마커의 양을 결정하는데 이용될 수 있는 배열 (예를 들어 항체 배열 또는 핵산 배열)과 접촉되는 경우에 특히 그러하다. 이러한 경우, 상기 배열 성분의 선택은 특정 경로가 대상에서 패혈증 또는 SIRS의 상태 결정과 관련이 있는지에 대해 암시하는 것을 기초로 할 수 있다. 특정 바이오마커가 패혈증 또는 SIRS의 예측 또는 진단 특성을 갖는다는 표시는, 협동적인 방식으로 생리적 조절되는 다른 바이오마커가 마찬가지로 예측 또는 진단 특성을 제공할 수 있다는 기대를 줄 수 있다. 그러나, 당업자는 이러한 기대가 생물학적 시스템의 복잡성으로 인해 실현될 수 없다는 것을 인지할 것이다. 예를 들어, 소정량의 특정 mRNA 바이오마커가 예측 특성을 갖는 경우, 또다른 바이오마커의 mRNA 발현이 번역후 수준에서 조절된다면 상기한 다른 바이오마커의 mRNA 발현에 있어서의 협동적인 변화는 측정가능하지 않을 수 있다. 추가로, 바이오마커의 mRNA 발현 수준은 패혈증에 대한 생리적 응답에 관여할 수도 있고 관여하지 않을 수도 있는 여러 전환 경로에 의해 영향을 받을 수도 있다.
바이오마커는 임의의 생물학적 샘플로부터 얻을 수 있고, 상기 샘플은 예를 들어 전혈, 혈장, 타액, 혈청, 적혈구, 혈소판, 호중구, 호산구, 호염기구, 림프구, 단핵구, 소변, 뇌척수액, 객담, 대변, 세포 및 세포 추출물, 또는 기타 생물학적 유체 샘플, 숙주 또는 대상의 조직 샘플 또는 조직 생검일 수 있으나, 이에 제한되지 않는다. 대상에서 취해진 정확한 생물학적 샘플은 달라질 수 잇으나, 샘플링은 최소한으로 침윤성이고 통상의 기술로 쉽게 수행되는 것이 바람직하다.
표현형 변화의 측정은 임의의 통상적 기술로 수행될 수 있다. 임상적 관찰 및 측정에 의해, 체온, 호흡수, 맥박, 혈압, 또는 기타 생리적인 파라미터가 측정될 수 있다. 바이오마커 분자의 측정은, 예를 들어 존재, 농도, 발현 수준, 또는 바이오마커 분자와 관련된 임의의 기타 수치를 지시하는 측정을 포함할 수 있다. 전형적으로, 바이오마커 분자의 검출 형태는 생물학적 샘플로부터의 이들 바이오마커 프로필을 형성하는데 이용되는 방법에 따라 달라진다. 상기 단락 5.4 및 하기 표 30, 표 I, 표 J, 표 K, 표 L 및 표 M을 참조한다.
특정 실시양태에서, 바이오마커 프로필은 표 30의 컬럼 4 또는 컬럼 5에 나열된 바이오마커 중 2개 이상의 상이한 것을 포함한다. 바이오마커 프로필은 2개 이상의 바이오마커 각각의 상응하는 특성을 추가로 포함한다. 이러한 바이오마커는 예를 들어 mRNA 전사체, cDNA 또는 일부 다른 핵산, 예를 들어 증폭된 핵산 또는 단백질일 수 있다. 일반적으로, 2개 이상의 바이오마커는 2개 이상의 상이한 유전자로부터 유래된다. 2개 이상의 상이한 바이오마커 중의 바이오마커가 표 30의 컬럼 4에 나열된 경우, 상기 바이오마커는 예를 들어 상기 나열된 유전자에 의해 생성된 전사체, 그의 상보체, 또는 판별 단편 또는 그의 상보체, 또는 그의 cDNA 또는 상기 cDNA의 판별 단편, 또는 상기 전사체 또는 그의 상보체의 전체 또는 일부에 상응하는 증폭된 판별 핵산 분자, 또는 상기 유전자에 의해 코딩되는 단백질, 또는 상기 단백질의 판별 단편, 또는 상기 중 임의의 것의 징후일 수 있다. 추가로, 상기 바이오마커는 예를 들어 표 30의 컬럼 5에 나열된 단백질, 또는 상기 단백질의 판별 단편, 또는 상기 중 임의의 것의 징후일 수 있다. 여기서, 판별 분자 또는 단편은 검출시에 상기한 전사체, cDNA, 증폭된 핵산, 또는 단백질의 존재 또는 풍부도를 지시하는 분자 또는 단편이다. 이러한 실시양태에 따라, 본 발명의 바이오마커 프로필은 당업자에게 공지된 임의의 표준 검정을 이용하거나 또는 본원에서 바이오마커를 검출하기 위해 기재한 검정법을 통해 수득될 수 있다. 이러한 검정은 예를 들어 특정 유전자 또는 관심 유전자 (예를 들어 표 30에 개시된 유전자)의 대립유전자의 발현 생성물 (예를 들어 핵산 및/또는 단백질)을 검출할 수 있다. 한 실시양태에서, 이러한 검정은 핵산 미세배열을 이용한다.
특정 실시양태에서, 바이오마커 프로필은 표 30의 컬럼 2에 나열된 프로브세트 중 하나를 함유하는 바이오마커, 표 30의 프로브세트 중 하나의 상보체를 함유하는 바이오마커, 또는 표 30의 프로브세트 중 하나 또는 표 30의 프로브세트 중 하나의 상보체를 함유하는 유전자에 의해 코딩되는 아미노산 서열을 함유하는 바이오마커 중 2개 이상의 상이한 것을 포함한다. 이러한 바이오마커는 예를 들어 mRNA 전사체, cDNA 또는 일부 다른 핵산, 예를 들어 증폭된 핵산, 또는 단백질일 수 있다. 바이오마커 프로필은 2개 이상의 바이오마커 각각의 상응하는 특성을 추가로 포함한다. 일반적으로, 2개 이상의 바이오마커는 2개 이상의 상이한 유전자로부터 유래된다. 바이오마커가 표 30에 나열된 프로브세트의 서열을 포함하는 유전자를 기초로 하는 경우, 상기 바이오마커는 예를 들어 상기 유전자에 의해 생성된 전사체, 그의 상보체, 또는 판별 단편 또는 그의 상보체, 또는 그의 cDNA 또는 상기 cDNA의 판별 단편, 또는 상기 전사체 또는 그의 상보체의 전체 또는 일부에 상응하는 증폭된 판별 핵산 분자, 또는 상기 유전자에 의해 코딩되는 단백질, 또는 상기 단백질의 판별 단편, 또는 상기 중 임의의 것의 징후일 수 있다. 추가로, 상기 바이오마커는 예를 들어 표 30에 기재된 프로브세트 서열을 포함하는 유전자에 의해 코딩되는 단백질, 또는 상기 단백질의 판별 단편, 또는 상기 중 임의의 것의 징후일 수 있다. 여기서, 판별 분자 또는 단편은 검출시에 상기한 전사체, cDNA, 증폭된 핵산, 또는 단백질의 존재 또는 풍부도를 지시하는 분자 또는 단편이다.
일부 실시양태에서, 바이오마커 프로필은 표 30에 나열된 바이오마커 중 2종 내지 626종을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 30에 나열된 바이오마커 중 3종 내지 50종을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 30에 나열된 바이오마커 중 4종 내지 25종을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 30에 나열된 바이오마커 중 3개 이상을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 30에 나열된 바이오마커 중 4개 이상을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 30에 나열된 바이오마커 중 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 10개 이상, 11개 이상, 12개 이상, 13개 이상, 14개 이상, 15개 이상, 16개 이상, 17개 이상, 18개 이상, 19개 이상, 20개 이상, 25개 이상, 30개 이상, 35개 이상, 40개 이상, 45개 이상, 50개 이상, 55개 이상, 60개 이상, 65개 이상, 70개 이상, 75개 이상, 80개 이상, 85개 이상, 90개 이상, 95개 이상, 96개 이상, 또는 100개 이상을 갖는다. 일부 실시양태에서, 이러한 바이오마커 각각은 핵산이다. 일부 실시양태에서, 이러한 바이오마커 각각은 단백질이다.
일부 실시양태에서, 바이오마커 프로필 중의 바이오마커 일부는 핵산이고, 바이오마커 프로필 중의 바이오마커 일부는 단백질이다. 일부 실시양태에서, 바이오마커 프로필은 표 31에 나열된 바이오마커 중 2종 내지 130종을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 31에 나열된 바이오마커 중 3종 내지 50종을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 31에 나열된 바이오마커 중 4종 내지 25종을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 31에 나열된 바이오마커 중 3개 이상을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 31에 나열된 바이오마커 중 4개 이상을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 31에 나열된 바이오마커 중 6개 이상, 10개 이상, 15개 이상, 20개 이상, 25개 이상, 30개 이상, 35개 이상, 40개 이상, 45개 이상, 50개 이상, 55개 이상, 60개 이상, 65개 이상, 70개 이상, 75개 이상, 80개 이상, 85개 이상, 90개 이상, 95개 이상, 96개 이상, 또는 100개 이상을 갖는다.
일부 실시양태에서, 바이오마커 프로필은 표 32에 나열된 바이오마커 중 2종 내지 10종을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 32에 나열된 바이오마커 중 3종 내지 10종을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 32에 나열된 바이오마커 중 4종 내지 10종을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 32에 나열된 바이오마커 중 3개 이상을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 32에 나열된 바이오마커 중 4개 이상을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 32에 나열된 바이오마커 중 6개 이상, 7개 이상, 8개 이상, 9개 이상, 또는 10개 이상을 갖는다. 일부 실시양태에서, 이러한 바이오마커 각각은 핵산이다. 일부 실시양태에서, 이러한 바이오마커 각각은 단백질이다. 일부 실시양태에서, 바이오마커 프로필 중의 바이오마커 일부는 핵산이고, 바이오마커 프로필 중의 바이오마커 일부는 단백질이다.
일부 실시양태에서, 바이오마커 프로필은 표 33에 나열된 바이오마커 중 2종 내지 10종을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 32에 나열된 바이오마커 중 3종 내지 10종을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 33에 나열된 바이오마커 중 4종 내지 10종을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 33에 나열된 바이오마커 중 3개 이상을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 33에 나열된 바이오마커 중 4개 이상을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 33에 나열된 바이오마커 중 6개 이상, 7개 이상, 8개 이상, 9개 이상, 또는 10개 이상을 갖는다. 일부 실시양태에서, 이러한 바이오마커 각각은 핵산이다. 일부 실시양태에서, 이러한 바이오마커 각각은 단백질이다. 일부 실시양태에서, 바이오마커 프로필 중의 바이오마커 일부는 핵산이고, 바이오마커 프로필 중의 바이오마커 일부는 단백질이다.
일부 실시양태에서, 바이오마커 프로필은 표 34에 나열된 바이오마커 중 2종 내지 130종을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 34에 나열된 바이오마커 중 3종 내지 40종을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 34에 나열된 바이오마커 중 4종 내지 25종을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 34에 나열된 바이오마커 중 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 10개 이상, 11개 이상, 12개 이상, 13개 이상, 14개 이상, 15개 이상, 16개 이상, 17개 이상, 18개 이상, 19개 이상, 20개 이상, 25개 이상, 30개 이상, 35개 이상, 또는 40개 이상을 갖는다. 일부 실시양태에서, 이러한 바이오마커 각각은 핵산이다. 일부 실시양태에서, 이러한 바이오마커 각각은 단백질이다. 일부 실시양태에서, 바이오마커 프로필 중의 바이오마커 일부는 핵산이고, 바이오마커 프로필 중의 바이오마커 일부는 단백질이다.
일부 실시양태에서, 바이오마커 프로필은 표 36에 나열된 바이오마커 중 2종 내지 7종을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 36에 나열된 바이오마커 중 3종 내지 6종을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 36에 나열된 바이오마커 중 4종 내지 7종을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 36에 나열된 바이오마커 중 3개 이상을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 36에 나열된 바이오마커 중 4개 이상을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 36에 나열된 바이오마커 중 6개 이상, 7개 이상, 8개 이상, 9개 이상, 또는 10개 이상을 갖는다. 일부 실시양태에서, 이러한 바이오마커 각각은 핵산이다. 일부 실시양태에서, 이러한 바이오마커 각각은 단백질이다. 일부 실시양태에서, 바이오마커 프로필 중의 바이오마커 일부는 핵산이고, 바이오마커 프로필 중의 바이오마커 일부는 단백질이다.
일부 실시양태에서, 바이오마커 프로필은 표 I에 나열된 바이오마커 중 2종 내지 53종을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 I에 나열된 바이오마커 중 3종 내지 50종을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 I에 나열된 바이오마커 중 4종 내지 25종을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 I에 나열된 바이오마커 중 3개 이상을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 I에 나열된 바이오마커 중 4개 이상을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 I에 나열된 바이오마커 중 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 10개 이상, 11개 이상, 12개 이상, 13개 이상, 14개 이상, 15개 이상, 16개 이상, 17개 이상, 18개 이상, 19개 이상, 20개 이상, 21개 이상, 22개 이상, 23개 이상, 24개 이상, 25개 이상, 26개 이상, 27개 이상, 28개 이상, 29개 이상, 30개 이상, 31개 이상, 32개 이상, 33개 이상, 34개 이상, 35개 이상, 36개 이상, 37개 이상, 38개 이상, 39개 이상, 40개 이상, 41개 이상, 42개 이상, 43개 이상, 44개 이상, 45개 이상, 46개 이상, 47개 이상, 48개 이상, 49개 이상, 50개 이상, 51개 이상, 52개 이상, 또는 53개 이상을 갖는다. 일부 실시양태에서, 바이오마커 프로필의 각 바이오마커는 표 I의 핵산이다. 일부 실시양태에서, 바이오마커 프로필의 각 바이오마커는 표 I의 단백질이다. 일부 실시양태에서, 바이오마커 프로필의 바이오마커 일부는 표 I의 단백질이고, 동일 바이오마커 프로필의 바이오마커 일부는 표 I의 핵산이다.
일부 실시양태에서, 바이오마커 프로필은 표 J에 나열된 바이오마커 중 2종 내지 44종을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 J에 나열된 바이오마커 중 3종 내지 44종을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 J에 나열된 바이오마커 중 4종 내지 25종을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 J에 나열된 바이오마커 중 3개 이상을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 J에 나열된 바이오마커 중 4개 이상을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 J에 나열된 바이오마커 중 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 10개 이상, 11개 이상, 12개 이상, 13개 이상, 14개 이상, 15개 이상, 16개 이상, 17개 이상, 18개 이상, 19개 이상, 20개 이상, 21개 이상, 22개 이상, 23개 이상, 24개 이상, 25개 이상, 26개 이상, 27개 이상, 28개 이상, 29개 이상, 30개 이상, 31개 이상, 32개 이상, 33개 이상, 34개 이상, 35개 이상, 36개 이상, 37개 이상, 38개 이상, 39개 이상, 40개 이상, 41개 이상, 42개 이상, 또는 43개 이상을 갖는다. 일부 실시양태에서, 바이오마커 프로필의 각 바이오마커는 표 J의 핵산이다. 일부 실시양태에서, 바이오마커 프로필의 각 바이오마커는 표 J의 단백질이다. 일부 실시양태에서, 바이오마커 프로필의 바이오마커 일부는 표 J의 단백질이고, 동일 바이오마커 프로필의 바이오마커 일부는 표 J의 핵산이다.
일부 실시양태에서, 바이오마커 프로필은 표 K에 나열된 바이오마커 중 2종 내지 10종을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 K에 나열된 바이오마커 중 3종 내지 10종을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 K에 나열된 바이오마커 중 4종 내지 10종을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 K에 나열된 바이오마커 중 3개 이상을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 K에 나열된 바이오마커 중 4개 이상을 갖는다. 일부 실시양태에서, 바이오마커 프로필은 표 K에 나열된 바이오마커 중 5개 이상, 6개 이상, 7개 이상, 8개 이상, 또는 9개 이상을 갖는다. 일부 실시양태에서, 바이오마커 프로필의 각 바이오마커는 표 K의 핵산이다. 일부 실시양태에서, 바이오마커 프로필의 각 바이오마커는 표 K의 단백질이다. 일부 실시양태에서, 바이오마커 프로필의 바이오마커 일부는 표 K의 단백질이고, 동일 바이오마커 프로필의 바이오마커 일부는 표 K의 핵산이다.
5.6.1 유용한 바이오마커의 단리
본 발명의 바이오마커는, 예를 들어 바이오마커가 단백질인 경우에는 상기 바이오마커에 결합하는 항체를 생성하는데 사용될 수 있거나 (상기 단락 5.4.2 기재의 방법 또는 당업자에게 공지된 임의의 방법을 사용함), 또는 바이오마커가 핵산인 경우에는 예를 들어 상기 단락 5.4.1 기재의 방법 또는 당업자에게 공지된 임의의 방법을 이용하여 특이적 올리고뉴클레오티드 프로브를 생성하는데 사용될 수 있다. 당업자는 유용한 특성을 추가로 특성규명하여 바이오마커의 분자 구조를 결정할 수 있음을 쉽게 인지할 것이다. 바이오마커를 이러한 방식으로 특성규명하는 방법은 당업계에 공지되어 있으며, X-선 결정학, 고해상도 질량 분광법, 적외선 분광학, 자외선 분광학 및 핵 자기 공명 등을 포함한다. 핵산 바이오마커의 뉴클레오티드 서열, 폴리펩티드 바이오마커의 아미노산 서열, 및 탄수화물 바이오마커의 조성 및 서열을 결정하는 방법 또한 당업계에 공지되어 있다.
5.7 SIRS 대상에의 본 발명의 적용
한 실시양태에서, 본원에 기재된 방법은 패혈증의 발병 위험이 있는 SIRS 대상을 스크리닝하는데 이용된다. SIRS-양성 대상으로부터 생물학적 샘플을 취하고, 이것을 이용하여 바이오마커 프로필을 구축한다. 이후, 바이오마커 프로필을 평가하여 바이오마커 프로필의 특성 수치가 특정 의사결정 규칙과 관련된 제1 수치 세트를 충족시키는지 여부를 결정한다. 이러한 평가는 대상을 전환자 또는 비-전환자로 분류한다. 이후, 대상이 전환자로 분류되면 치료 요법을 개시하여 패혈증의 진행을 막거나 예방할 수 있다.
5.8 패혈증 단계로의 본 발명의 적용
한 실시양태에서, 본원에 기재된 방법은 특히 패혈증의 특정 단계가 발병될 위험이 있는 대상을 스크리닝하는데 이용된다. 대상으로부터 생물학적 샘플을 취하고, 이것을 이용하여 바이오마커 프로필을 구축한다. 이후, 바이오마커 프로필을 평가하여, 바이오마커 프로필의 특성 수치가 특정 의사결정 규칙과 관련된 제1 수치 세트를 충족시키는지 여부를 결정한다. 이러한 평가는 패혈증의 특정 단계에 있거나 그러한 단계에 있지 않은 대상을 분류한다. 이후, 치료 요법을 개시하여 패혈증의 특정 단계를 치료할 수 있다. 일부 실시양태에서, 패혈증의 단계는 예를 들어 패혈증 발병 초기, 중증 패혈증, 패혈성 쇼크, 또는 다중 장기 기능부전 등이다.
5.9 예시적 실시양태
본 발명의 일부 실시양태에서, 시험 대상, 특히 패혈증 발병의 위험이 있거나, 패혈증이 있거나, 또는 패혈증이 있다고 의심되는 대상으로부터의 생물학적 샘플을 이용하여 바이오마커 프로필을 얻는다. 이러한 실시양태에서는 바이오마커 프로필이 평가된다. 이러한 평가는 예를 들어 의사결정 규칙을 시험 대상에 적용하여 이루어질 수 있다. 의사결정 규칙은 예를 들어 훈련 집단 중의 대상으로부터 얻은 바이오마커 프로필을 기초로 하여 구축되거나 이것을 기초로 구축된 것일 수 있다. 한 실시양태에서, 훈련 집단은 (a) SIRS가 있고 관찰 시기 동안에 패혈성으로 진단된 대상, 및 또한 (b) SIRS가 있고 관찰 시기 동안에 패혈성으로 진단되지 않은 대상을 포함한다. 시험 대상으로부터의 바이오마커 프로필이 적절하게 특성적인 특성을 갖는 경우, 그 시험 대상은 패혈성에 걸리기가 더 쉽다고 진단되거나, 패혈증으로 고통받고 있다고 진단되거나, 또는 패혈증 진행에 있어서의 특정 단계에 있다고 진단된다. SIRS로 고통받고 있는 대상 (예를 들어 SIRS-양성 대상) 또는 감염으로 고통받고 있지만 SIRS로 고통받고 있지는 않은 대상 (예를 들어 SIRS-음성 대상) 등을 비롯한 여러 집단의 대상이 훈련 집단으로 작용할 수 있다. 따라서, 본 발명은 임상의가 특히 SIRS가 아닌 대상, SIRS가지만 주어진 시간 동안에는 패혈증이 발병되기 쉽지 않은 대상, SIRS가 실제로 패혈성이 될 위험이 있는 대상, 및 패혈증 진행에 있어서의 특정 단계로 고통받고 있는 대상을 구별할 수 있도록 한다. 적합한 훈련 집단 및 이러한 집단으로부터 수집된 적합한 데이타에 관한 보다 상세한 사항은 상기 단락 5.5를 참조한다.
5.10 판별 바이오마커를 확인하기 위한 애노테이션 데이타의 용도
일부 실시양태에서, 데이타 분석 알고리즘은 전환자와 비-전환자 사이를 판별하는 특성을 갖는 바이오마커의 대형 세트를 확인한다. 예를 들어 일부 실시양태에서, 데이타 분석 알고리즘을 훈련 집단에 적용하면 500종 초과의 바이오마커, 1000종 초과의 바이오마커, 또는 10,000종 초과의 바이오마커가 선택된다. 일부 실시양태에서, 판별될 것으로 여겨지는 바이오마커의 수에 있어서의 추가 감소가 바람직하다. 따라서, 일부 실시양태에서, 데이타 분석 알고리즘 (예를 들어 단락 5.5의 데이타 분석 알고리즘)에 상보적인 필터링 규칙을 이용하여, 데이타 분석 알고리즘으로 확인된 판별 바이오마커의 목록을 추가로 감소시킨다. 구체적으로, 1개 이상의 데이타 분석 알고리즘을 훈련 집단에서 결정된 바이오마커 프로필 데이타에 적용하여 확인된 바이오마커의 목록은, 목록에 애노테이션 데이타-기재의 필터링 규칙을 적용하여 추가로 정립된다. 이러한 실시양태에서, 1개 이상의 적용된 애노테이션 데이타-기재의 필터링 규칙을 충족시키는 1개 이상의 데이타 분석 알고리즘으로 확인된 바이오마커 세트 중의 바이오마커는 판별 바이오마커 세트에 보유된다. 몇몇 예에서, 1개 이상의 적용된 애노테이션 데이타-기재의 필터링 규칙을 충족시키지 않는 1개 이상의 데이타 분석 알고리즘으로 확인된 바이오마커 세트 중의 바이오마커는 상기 세트에서 제거된다. 다른 예에서, 1개 이상의 적용된 애노테이션 데이타-기재의 필터링 규칙을 충족시키지 않는 1개 이상의 데이타 분석 알고리즘으로 확인된 바이오마커 세트 중의 바이오마커는 상기 세트에 남고, 1개 이상의 적용된 애노테이션 데이타-기재의 필터링 규칙을 충족시키는 것은 상기 세트에서 제거된다. 이러한 방식으로, 애노테이션 데이타는 데이타 분석 알고리즘으로 확인된 판별 바이오마커 세트 중의 바이오마커의 수를 감소시키는데 이용될 수 있다.
애노테이션 데이타-기재의 필터링 규칙은 애노테이션 데이타를 기초로 하는 규칙이다. 애노테이션 데이타는, 바이오마커의 성질을 기재하는 임의의 유형의 데이타를 지칭한다. 애노테이션 데이타의 예는, 주어진 바이오마커가 속한 생물학적 경로의 확인이다. 애노테이션 데이타의 또다른 예는, 효소 클래스 (예를 들어 포스포디에스테라제, 키나제, 메탈로프로테이나제 등)이다. 애노테이션 데이타의 다른 예로는 단백질 도메인 정보, 효소 기질 정보, 효소 반응 정보, 및 단백질 상호작용 데이타 등이 있으나 이에 제한되지 않는다. 애노테이션 데이타의 또다른 예는 질환 관계, 즉, 주어진 바이오마커가 어떠한 질환 과정과 관련이 있는지 또는 다른 작용을 하는지이다. 또다른 형태의 애노테이션 데이타는 바이오마커 발현, 다른 형태의 바이오마커 풍부도, 및/또는 바이오마커 활성을 세포내 국소화, 조직 유형 국소화, 및/또는 세포 유형 국소화와 연관시키는 임의의 유형의 데이타이다.
명칭이 암시하는 바와 같이, 애노테이션 데이타는 애노테이션 데이타-기재의 필터링 규칙을 구축하는데 이용된다. 애노테이션 데이타-기재의 필터링 규칙의 예는 다음과 같다:
애노테이션 규칙 1: 훈련 세트로부터 모든 전사 인자의 제거.
상기 필터링 규칙을 바이오마커 세트에 적용하면 상기 세트로부터 모든 전사 인자가 제거될 것이다.
또다른 유형의 애노테이션 데이타-기재의 필터링 규칙은 다음과 같다:
애노테이션 규칙 2: 바이오마커 목록에서 애노테이션 X가 풍부한 모든 바이오마커의 보유.
상기 필터링 규칙을 적용하면 주어진 목록에서 애노테이션 X가 풍부한 (과다제시) 바이오마커만이 상기 목록에 남게 된다. 상기 필터링 규칙을 보다 완전히 인지하기 위해서는, 데이타 분석 알고리즘 (단락 5.5)을 단락 5.4에 개시한 기술에 따라 측정된 훈련 집단 데이타를 이용하여 결정된 바이오마커 프로필에 적용하여 확인된 예시적 바이오마커 세트를 고려할 수 있다. 상기한 예시적 바이오마커 세트는 500종의 바이오마커를 갖는다. 이러한 예시에서, 인간에서 바이오마커의 전체 세트가 25,000종의 바이오마커로 이루어진 경우를 가정할 수 있다. 여기서, 상기 25,000종의 바이오마커는 집단이고, 상기 500종의 바이오마커는 샘플이다. 본원에서 사용된 바와 같이, 용어 "집단"은 관찰이 가능한 모든 바이오마커로 이루어진다. 용어 "샘플"은 실제로 고려되는 데이타이다. 이제, 상기 예에서, X = 키나제로 한다. 800종의 공지된 인간 키나제가 있다고 가정하고, 500종 바이오마커 세트가 키나제와 관련하여 무작위로 선택되었다고 가정할 수 있다. 이러한 상황하에서, 데이타 분석 알고리즘으로 확인된 500종 바이오마커의 목록은 약 (500/25,000) × 800 = 16종 키나제를 선택해야 한다. 사실상, 샘플 중에는 50종의 키나제가 있기 때문에, 키나제가 상기 샘플에서 집단에 비해 실제로 풍부하다는 결론에 이를 수 있다.
더욱 통상적으로, 상기 예에서, 관찰된 샘플 및 집단을 기재하는 2-원 우발성 표의 분석을 통해 상기 집단에 대하여 키나제가 데이타 분석 알고리즘으로 확인된 바이오마커 세트 (샘플)에 풍부한 지 여부를 결정할 수 있다:
키나제 전체
아니오
집단 800 24,200 25,000
샘플 50 450 500
문헌 [Agresti, 1996, An Introduction to Categorical Data Analysis, John Wiley & Sons, New York] (상기 문헌은 그 전문이 본원에 참고로 포함됨)에 따라, 이러한 2-원 우발성 표는 각 열을 독립적인 이항 변수로서 처리하여 분석될 수 있다. 이러한 예에서, π1 - π2로 일컬어지는 비율 상의 실제 차이는 상기 2개 열에서의 확률을 비교한다. 이러한 차이는 -1과 +1 사이이다. π1 = π2인 경우, 이것은 0이다. 즉, 집단으로부터의 샘플 중 키나제의 선택은 키나제 애노테이션에 독립적이다. 집단에서 N1 = 25,000종 바이오마커 중 800종이 키나제이면, p1의 비율 = 800/25,000 = 0.032이다. 데이타 분석 알고리즘을 이용하여 확인된 샘플에서 N2 = 500종 바이오마커 중 50종이 키나제이면, p2의 비율 = 50/500 = 0.10이다. 비율의 샘플 차이는 0.032 - 0.10 = -0.068이다. 아그레스티(Agresti)의 상기 문헌에 따라, 2개 열에서의 계수가 독립적인 이항 샘플인 경우에 p1 - p2의 추정되는 표준 오차는 다음과 같다:
Figure 112007081780858-PCT00026
여기서, N1 및 N2는 각각 상기 집단에서의 샘플 크기 및 데이타 분석 알고리즘으로 선택된 샘플이다. 표준 오차가 감소하기 때문에, π1 - π2의 추정값은 샘플 크기 증가에 따라 개선된다. π1 - π2에 대한 대형-샘플 (100(1-α))% 신뢰 구간은 다음과 같다:
Figure 112007081780858-PCT00027
따라서, 상기 예에서 추정되는 오차는
Figure 112007081780858-PCT00028
이고, 실제 차이 π1 - π2에 대한 95% 신뢰 구간은 -0.068 ± 1.96 (0.013), 또는 -0.068 ± 0.025이다. 95% 신뢰 구간이 오직 음성 수치만을 함유하므로, 상기 샘플 (데이타 분석 알고리즘으로 생성된 바이오마커 세트)에는 25,000종의 바이오마커 집단에 비해 키나제가 풍부하다는 결론에 이를 수 있다.
상기 예에서의 2원 우발성 표는 상기 개시된 방법이 아닌 당업계 공지의 방법을 이용하여 분석될 수 있다. 예를 들어, 독립성에 대한 카이-제곱 시험 및/또는 피셔의 정확도 시험을 이용하여, 상기 2원 우발성 표의 열 및 컬럼의 분류 변수가 독립적이라는 귀무 가설(null hypothesis)을 시험할 수 있다.
애노테이션 규칙 2에서의 용어 "X"는 임의의 형태의 애노테이션 데이타일 수 있다. 한 실시양태에서, "X"는 임의의 생물학적 경로이다. 이 경우, 애노테이션 데이타-기재의 필터링 규칙은 다음과 같은 형태이다:
애노테이션 규칙 3: 바이오마커 목록에서 풍부한 임의의 생물학적 경로 중의 모든 바이오마커의 선택.
특정 생물학적 경로가 풍부한지의 여부를 결정하기 위해서는, 샘플에서 특정 생물학적 경로 중의 바이오마커의 수를 예를 들어 상기한 2원 우발성 표 분석 또는 당업계 공지의 다른 기술을 이용하여 상기 집단에서 특정 생물학적 경로에 존재하는 바이오마커의 수와 비교한다. 생물학적 경로가 샘플 중에 풍부하다면, 상기 생물학적 경로 중에도 존재하는 샘플 중의 모든 바이오마커가 애노테이션 데이타-기재의 필터링 규칙에 따라 추가의 분석을 위해 보유된다.
전체 95% 신뢰 구간에 걸쳐 샘플 중 키나제의 비율이 집단 중의 키나제 비율보다 더 높은 것으로 나타난 풍부도의 예를 제시하였다. 한 실시양태에서, 2원 우발성 표 분석에 따라 결정할 때 전체 95% 크기의 신뢰 구간에 걸쳐 샘플 중 애노테이션을 갖는 바이오마커의 비율이 집단 중에 애노테이션을 갖는 바이오마커의 비율보다 더 높은 경우, 주어진 애노테이션을 갖는 바이오마커는 집단에 비해 샘플 중에 풍부한 것으로 간주된다. 또다른 실시양태에서, 피셔 정확도 시험, 카이-제곱 시험, 또는 상대적 알고리즘으로 결정한 p 값이 0.05 또는 그 미만, 0.005 또는 그 미만, 또는 0.0005 또는 그 미만이라면, 주어진 애노테이션을 갖는 바이오마커는 집단에 비해 샘플 중에 풍부한 것으로 간주된다.
또다른 형태의 애노테이션 데이타-기재의 필터링 규칙은 하기 형태를 갖는다:
애노테이션 규칙 4: 생물학적 경로 X 중의 모든 바이오마커의 선택.
한 실시양태에서, 바이오마커 세트는 데이타 분석 알고리즘을 이용하여 결정된다. 예시적 데이타 분석 알고리즘은 단락 5.5에 개시되어 있다. 또한, 단락 6은 데이타 분석 알고리즘으로 기능할 수도 있는 특정 시험을 기재한다. 이들 시험으로는 통계적으로 유의한 p 값 (예를 들어 0.05 또는 그 미만, 0.04 또는 그 미만 등)을 갖는 윌콕슨 시험 등, 및/또는 바이오마커가 훈련 집단에서 전환자로부터 얻은 생물학적 샘플과 비-전환자로부터 얻은 생물학적 샘플 사이에 평균적인 차별적 풍부도를 나타내는 요건 등이 있으나 이에 제한되지 않는다. 데이타 분석 알고리즘의 적용시, 전환자와 비-전환자 사이를 판별하는 바이오마커 세트가 결정된다. 다음으로, 바이오마커 세트를 추가로 감소시키기 위해 애노테이션 규칙, 예를 들어 애노테이션 규칙 4가 판별 바이오마커 세트에 적용된다. 당업자는 이들 규칙이 적용되는 순서는 일반적으로 중요하지 않다는 것을 인지할 것이다. 예를 들어 애노테이션 규칙 4가 먼저 적용된 후에 특정 데이타 분석 알고리즘이 적용될 수도 있고, 또는 그 반대일 수도 있다. 일부 실시양태에서, 궁극적으로 전환자와 비-전환자 사이를 판별한다고 여겨지는 바이오마커는 하기 기준 각각을 충족시킨다: (i) 정적 (단일 시점) 데이타를 이용한 윌콕슨 조정 시험으로 결정할 때, p 값이 0.05 또는 그 미만 (p < 0.05)임, (ii) 정적 (단일 시점) 데이타를 이용하여 훈련 세트에서 전환자와 비-전환자 사이에 결정된 평균 배수 변화가 1.2 이상임, 및 (iii) 특정 생물학적 경로 중의 존재. 또한, 상세한 예를 위해서는 상기 단락 6.7을 참조한다. 본 예에서는, 경로의 구성원이 데이타 분석 알고리즘으로 확인된 바이오마커 세트에 풍부하다는 요건이 없다. 추가로, 기준 (i) 및 (ii)는 데이타 분석 알고리즘의 형태이고, 기준 (iii)은 애노테이션 데이타-기재의 필터링 규칙임이 주목된다.
또다른 실시양태에서, 일단 판별 바이오마커 목록이 확인되면, 바이오마커는 판별 바이오마커가 연관되어 있는 특정 생물학적 경로의 정체성을 결정하는데 이용될 수 있다. 특정 실시양태에서, 애노테이션 데이타-기재의 필터링 규칙은 본 발명의 방법 (예를 들어 단락 5.4, 단락 5.5 및 단락 6에 기재된 방법)으로 확인된 판별 바이오마커의 목록에 적용된다. 이러한 애노테이션 데이타-기재의 필터링 규칙은 데이타 분석 알고리즘으로 확인된 바이오마커 판별 목록 중에 풍부한 특정 생물학적 경로(들)을 확인한다. 본 발명의 예시적 실시양태에서, apps1.niaid.nih.gov/david/에서 이용가능한 DAVID 2.0 소프트웨어를 이용하여 이러한 애노테이션 데이타-기재의 필터링 규칙을 확인하고 데이타 분석 알고리즘으로 확인된 바이오마커 세트에 적용하여, 상기 세트 중에 풍부한 경로를 확인한다. 일부 실시양태에서, 풍부한 생물학적 경로 중의 바이오마커를 선택하여, 본 발명의 키트에서의 판별 바이오마커로서 사용한다.
본 발명의 일부 실시양태에서, 데이타 분석 알고리즘을 전환자 및 비-전환자를 포함하는 훈련 집단에 적용하여 결정된, 바이오마커 세트 중에 풍부한 생물학적 경로 중의 바이오마커가 필터링 단계에 이용되어 상기 세트 중의 바이오마커의 수를 감소시킬 수 있다. 이러한 한 접근법에서, 훈련 집단 중 대상으로부터의 생물학적 샘플은 예를 들어 상기 단락 5.4, 및 하기 단락 6에 기재된 1개 이상의 임의의 방법을 이용하여 수득된다. 이러한 실시양태에 따라서, 핵산 배열, 예를 들어 cDNA 미세배열은 선택된 생물학적 경로 중에 포함된 것으로 공지되거나 또는 선택된 생물학적 경로 중에 포함될 것으로 의심되는 임의의 1개 이상의 유전자의 발현을 검출하여, 바이오마커 프로필 중 바이오마커의 특성을 생성하는데 이용될 수 있다. 이후, cDNA 미세배열 분석으로부터 유래된 데이타를 상기 단락 5.5에 기재된 임의의 1개 이상의 분석 알고리즘을 이용하여 분석하여, 전환자와 비-전환자 사이를 판별하는 특성을 갖는 바이오마커를 확인할 수 있다. 따라서, 예를 들어 전환자 (즉, 차후에 패혈증이 발병될 SIRS 환자)와 비-전환자 (즉, 차후에 패혈증을 발병하지 않을 SIRS 환자)를 판별할 수 있는 상응하는 특성 수치를 갖는 바이오마커가 판별 바이오마커로서 확인 및 분류될 수 있다. 풍부한 생물학적 경로 중의 바이오마커는 상기한 애노테이션 규칙 3을 적용하여 이 세트로부터 선택될 수 있다. 발견될 수 있는 대표적인 생물학적 경로로는, 예를 들어 Th1/Th2 세포 분화 경로에 관여하는 유전자 등이 있다. 한 실시양태에서, 궁극적으로 전환자와 비-전환자 사이를 판별하는 것으로 여겨지는 바이오마커는 하기 기준 각각을 충족시킨다: (i) 윌콕슨 조정 시험으로 결정할 때, p 값이 0.05 또는 그 미만 (p < 0.05)임, (ii) 훈련 세트에서 전환자와 비-전환자 사이에 결정된 평균 배수 변화가 1.2 이상임, 및 (iii) 기준 (i) 및 (ii)를 적용하여 유도된 바이오마커 세트 중에 풍부한 생물학적 경로 중의 존재.
본 발명의 일부 실시양태에서, 애노테이션 데이타-기재의 필터링 규칙은 주어진 바이오마커 세트에 풍부한 생물학적 경로를 확인하는데 이용된다. 이러한 바이오마커 세트는 예를 들어 데이타 분석 알고리즘을 전환자 및 비-전환자를 포함하는 훈련 데이타에 적용하여 확인된 바이오마커 세트일 수 있다. 이후, 이들 풍부한 생물학적 경로 중의 바이오마커를 본원에 개시된 임의의 데이타 분석 알고리즘을 이용하여 분석하여, 전환자와 비-전환자 사이를 판별하는 바이오마커를 확인한다. 일부 예에서, 풍부한 생물학적 경로에서 분석된 바이오마커 중 일부는 원래 주어진 바이오마커 세트 중의 바이오마커에 속하지 않는다. 일부 예에서, 풍부한 생물학적 경로 중의 바이오마커 일부는 원래 주어진 바이오마커 세트 중의 바이오마커에 속한다. 일부 실시양태에서, 2차 검정을 이용하여 풍부한 경로 중의 바이오마커에 대한 특성 데이타를 수집하고, 이것은 풍부한 생물학적 경로 중의 바이오마커가 전환자와 비-전환자 사이를 판별하는지 여부를 결정하는데 이용되는 데이타이다.
일부 실시양태에서, 관심 생물학적 경로 중의 바이오마커가 확인된다. 한 예에서, Th1/Th2 세포 분화 경로에 관여하는 유전자가 확인된다. 이후, 본원에 개시된 데이타 분석 알고리즘을 이용하여 이들 바이오마커를 평가하여, 이것들이 전환자와 비-전환자 사이를 판별할 수 있는지 여부를 결정한다.
5.11 본 발명에 따른 대표적인 실시양태
단락 6.11 내지 단락 6.13은 본 발명에 따른 한 실시양태에서 관심이 있는 수많은 바이오마커를 확인한다. 구체적으로, 본 발명의 한 실시양태는 하기 단락 6.11.1의 표 48에서 확인된 10종의 바이오마커, 하기 단락 6.11.2의 표 59에 나열된 34종의 바이오마커, 및 하기 단락 6.13.1의 표 93에 나열된 10종의 바이오마커를 포함한다. 표 48 및 표 93은 각각 MMP9를 판별 바이오마커로서 확인한다. 따라서, 표 I 중 바이오마커의 총 수는 표 48, 표 59, 및 표 93에서 확인된 바이오마커의 합보다 1개가 적다 (34 + 10 + 10 - 1, 또는 53). 이들 바이오마커는 하기 표 I에서 다시 기재한다. 단락 5.11.1은 개개의 각 바이오마커에 대한 상세한 설명을 제공한다. 하기 단락 5.11.2는 표 I, 표 J 및 표 K에서 나열된 바이오마커들의 선택 조합에 관한 보다 상세한 설명을 제공한다. 표 I에 나열된 각 바이오마커는 단락 6.11 내지 단락 6.13에서 요약된 실험 결과를 기초로 선택되었다. 일부 실험에서, 확인된 바이오마커는 단백질 또는 그의 단편이다. 패혈증과 SIRS를 판별하는 이러한 단백질 바이오마커는 표 I의 컬럼 5에서 "P" 표시로 나열되어 있다. 일부 실험에서, 확인된 바이오마커는 핵산 또는 그의 단편이다. 패혈증과 SIRS를 판별하는 이러한 핵산 바이오마커는 표 I의 컬럼 5에서 "N" 표시로 나열되어 있다. 상기 지시한 바와 같이, 1종의 바이오마커 MMP9는 단백질 바이오마커 및 핵산 바이오마커 둘다로서 확인되었다. 하기 표 J는 바이오마커를 단락 6에 기재된 핵산-기재의 검정, 예를 들어 RT-PCR을 이용하여 발견하는 본 발명의 한 실시양태에 따른 바이오마커를 나열한다. 하기 표 K는 바이오마커를 단락 6에 기재된 단백질-기재의 검정, 예를 들어 비드 검정을 이용하여 발견하는 본 발명의 한 실시양태에 따른 바이오마커를 나열한다. 본 발명의 한 실시양태는 표 48, 표 59 또는 표 93 중 임의의 것으로부터의 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 또는 10개 이상의 바이오마커를 포함한다.
하기 특정 실시양태에서 지시하지 않는다면, 표 I, 표 J 및 표 K의 바이오마커는 단락 6.11 내지 단락 6.13에서 요약한 실험에서 이것들의 물리적 형태로 제한되지 않는다. 예를 들어 바이오마커 판별 특성이 RT-PCR 등의 핵산 검정에서 핵산 형태의 바이오마커 풍부도로 발견된 것이어서 이를 기초로 표 I의 컬럼 5에서 "N" 표시하에 나열된 것일 수 있지만, 본 발명의 방법, 키트 및 바이오마커 프로필에서 바이오마커의 물리적 형태가 핵산으로 제한되는 것은 아니다. 오히려, 단락 5.1에서 용어 "바이오마커"에 대하여 정의된 바와 같은 임의의 물리적 형태의 바이오마커가 본 발명에 포함된다. 표 I의 컬럼 6은 하기 단락 6에 요약된 데이타를 기초로 패혈증으로 전환될 대상 (전환자)에서 패혈증으로 전환되지 않을 대상 (SIRS 대상)에 비해 바이오마커가 상향 조절되는지 또는 하향 조절되는지 여부를 지시한다. 따라서, 바이오마커가 컬럼 6에서 상향으로 표시된 경우, 이는 컬럼 5에 지시된 형태의 바이오마커가 패혈증으로 전환될 대상 (패혈증 대상)에서 패혈증으로 전환되지 않을 대상 (SIRS 대상)에 비해 평균적으로 더 풍부하다는 것을 의미한다. 추가로, 컬럼 6에서 하향으로 표시된 경우, 이는 컬럼 5에 지시된 형태의 바이오마커가 패혈증으로 전환될 대상 (패혈증 대상)에서 패혈증으로 전환되지 않을 대상 (SIRS 대상)에 비해 평균적으로 덜 풍부하다는 것을 의미한다.
Figure 112007081780858-PCT00030
Figure 112007081780858-PCT00031
Figure 112007081780858-PCT00032
표 I에서 확인되는 각각의 서열, 유전자, 단백질, 및 프로브세트는 본원에 참고로 포함된다.
Figure 112007081780858-PCT00033
Figure 112007081780858-PCT00034
Figure 112007081780858-PCT00035
Figure 112007081780858-PCT00036
5.11.1 바이오마커 기재
본 단락에서 바이오마커에 대한 언급은 단지 본 명세서에 기재된 바이오마커에 대한 예시적 서열만을 제공한다.
AFP의 뉴클레오티드 서열 (관리 번호 NM_001134로 식별됨)은 예를 들어 문헌 ([Beattie et al., 1982, "Structure and evolution of human alpha-fetoprotein deduced from partial sequence of cloned cDNA" Gene 20(3):415-422], [Harper, M.E. et al., 1983, "Linkage of the evolutionarily-related serum albumin and alpha-fetoprotein genes within q11-22 of human chromosome 4," Am. J. Hum. Genet. 35(4):565-572], [Morinaga, T. et al., 1983, "Primary structures of human alpha-fetoprotein and its mRNA," Proc. Natl. Acad. Sci. U.S.A. 80(15):4604-4608])에 개시되어 있고, AFP의 아미노산 서열 (관리 번호 CAA79592로 식별됨)은 예를 들어 문헌 ([McVey, 1993, Direct Submission, Clinical Research Centre, Haemostasis Research Group, Watford Road, Harrow, UK, HA1 3UJ], [McVey et al., 1993, "A G→A substitution in an HNF I binding site in the human alpha-fetoprotein gene is associated with hereditary persistence of alpha-fetoprotein (HPAFP)," Hum. Mol. Genet. 2(4):379-384])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
ANKRD22의 뉴클레오티드 서열 (관리 번호 NM_144590으로 식별됨)은 예를 들어 [Strausberg, 2002, "Homo sapiens ankyrin repeat domain 22, mRNA (cDNA clone MGC: 22805 IMAGE:3682099)"] (미간행)에 개시되어 있고, ANKRD22의 아미노산 서열 (관리 번호 NP_653191로 식별됨)은 예를 들어 [Strausberg, 2002, "Homo sapiens ankyrin repeat domain 22, mRNA (cDNA clone MGC:22805 IMAGE:3682099)"] (미간행)에 개시되어 있으며, 이들 각각은 그 전문이 본원에 참고로 포함된다.
ANXA3의 뉴클레오티드 서열 (관리 번호 NM_005139로 식별됨)은 예를 들어 문헌 ([Pepinsky, R.B. et al., 1988, "Five distinct calcium and phospholipid binding proteins share homology with lipocortin I," J. Biol. Chem. 263(22):10799-10811], [Tait, J.F. et al., 1988, "Placental anticoagulant proteins: isolation and comparative characterization four members of the lipocortin family", [Biochemistry 27(17):6268-6276], [Ross, T.S. et al., 1990, "Identity of inositol 1,2-cyclic phosphate 2-phosphohydrolase with lipocortin III," Science 248(4955):605-607])에 개시되어 있고, ANXA3의 아미노산 서열 (관리 번호 NP_005130으로 식별됨)은 예를 들어 문헌 ([Pepinsky, R.B et al., 1988, "Five distinct calcium and phospholipid binding proteins share homology with lipocortin I," J. Biol. Chem. 263(22):10799-10811], [Tait, J.F. et al., 1988, "Placental anticoagulant proteins: isolation and comparative characterization four members of the lipocortin family," Biochemistry 27(17):6268-6276], [Ross, T.S. et al., 1990, "Identity of inositol 1,2-cyclic phosphate 2-phosphohydrolase with lipocortin III," Science 248(4955):605-607])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
아포지단백질 CIII (APOC3)의 뉴클레오티드 서열 (관리 번호 NM_000040으로 식별됨)은 예를 들어 문헌 ([Ruiz-Narvaez. et al., 2005 "APOC3/A5 haplotypes, lipid levels, and risk of myocardial infarction in the Central Valley of Costa Rica," J. Lipid Res. 46(12), 2605-2613], [Garenc et al., 2005, "Effect of the APOC3 Sst I SNP on fasting triglyceride levels in men heterozygous for the LPL P207L deficiency," Eur. J. Hum. Genet. 13, 1159-1165], [Baum. et al., 2005, "Effect of hepatic lipase-514C→T polymorphism and its interactions with apolipoprotein C3-482C→T and apolipoprotein E exon 4 polymorphisms on the risk of nephropathy in Chinese type 2 diabetic patients," Diabetes Care 28, 1704-1709])에 개시되어 있고, APOC3의 아미노산 서열 (관리 번호 CAA25648로 식별됨)은 예를 들어 문헌 [Protter et al., 1984, "Isolation and sequence analysis of the human apolipoprotein CIII gene and the intergenic region between the apo AI and apo CIII," DNA 3, 449-456]에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
ARG2의 뉴클레오티드 서열 (관리 번호 NM_001172로 식별됨)은 예를 들어 문헌 ([Gotoh et al., 1996 "Molecular cloning of cDNA for nonhepatic mitochondrial arginase (arginase II) and comparison of its induction with nitric oxide synthase in a murine macrophage-like cell line," FEBS Lett. 395(2-3):119-122], [Vockley et al., 1996, "Cloning and characterization of the human type II arginase gene," Genomics 38(2):118-123], [Gotoh et al., 1997, "Chromosomal localization of the human arginase II gene and tissue distribution of its mRNA," Biochem. Biophys. Res. Commun. 233(2):487-491])에 개시되어 있고, ARG2의 아미노산 서열 (관리 번호 CAG38787로 식별됨)은 예를 들어 문헌 [Halleck et al., 2004, Direct Submission, RZPD Deutsches Ressourcenzentrum fuer Genomforschung GmbH, Im Neuenheimer Feld 580, D-69120 Heidelberg, Germany] 및 [Halleck et al., (미간행), "Cloning of human full open reading frames in Gateway(TM) system entry vector (pDONR201)"]에 개시되어 있으며, 이들 각각은 그 전문이 본원에 참고로 포함된다.
B2M의 뉴클레오티드 서열 (관리 번호 NM_004048로 식별됨)은 예를 들어 문헌 ([Krangel, M.S. et al., 1979, "Assembly and maturation of HLA-A and HLA-B antigens in vivo," Cell 18(4):979-991], [Suggs, S.V. et al., 1981, "Use of synthetic oligonucleotides as hybridization probes: isolation of cloned cDNA sequences for human beta 2-microglobulin," Proc. Natl. Acad. Sci. U.S.A. 78(11):6613-6617], [Rosa, F. et al., 1983, "The beta2-microglobulin mRNA in human Daudi cells has a mutated initiation codon but is still inducible by interferon," EMBO J. 2(2):239-243])에 개시되어 있고, B2M의 아미노산 서열 (관리 번호 AAA51811로 식별됨)은 예를 들어 문헌 [Gussow, D. et al., 1987, "The human beta 2-microglobulin gene. Primary structure and definition of the transcriptional unit," J. Immunol. 139(9):3132-3138]에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
BCL2A1의 뉴클레오티드 서열 (관리 번호 NM_004049로 식별됨)은 예를 들어 문헌 ([Lin, E. Y. et αl., 1993, "Characterization of A1, a novel hemopoietic-specific early-response gene with sequence similarity to bcl-2," J. Immunol. 151(4):1979-1988], [Savitsky, K. et al., "The complete sequence of the coding region of the ATM gene reveals similarity to cell cycle regulators in different species," Hum. Mol. Genet. 4(11):2025-2032], [Choi, S.S. et al., 1995, "A novel Bcl-2 related gene, Bfl-1, is overexpressed in stomach cancer and preferentially expressed in bone marrow," Oncogene 11(9):1693-1698])에 개시되어 있고, BCL2A1의 아미노산 서열 (관리 번호 NP_004040으로 식별됨)은 예를 들어 문헌 ([Lin, E. Y. et al., 1993, "Characterization of A1, a novel hemopoietic-specific early-response gene with sequence similarity to bcl-2," J. Immunol. 151(4):1979-1988], [Savitsky, K. et al., "The complete sequence of the coding region of the ATM gene reveals similarity to cell cycle regulators in different species," Hum. Mol. Genet. 4(11):2025-2032], [Choi, S.S. et al., 1995, "A novel Bcl-2 related gene, Bfl-1, is overexpressed in stomach cancer and preferentially expressed in bone marrow," Oncogene 11(9):1693-1698])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
CCL5의 뉴클레오티드 서열 (관리 번호 NM_002985로 식별됨)은 예를 들어 문헌 ([Schall, T.J. et al., 1988, "A human T cell-specific molecule is a member of a new gene family," J. Immunol. 141(3):1018-1025], [Donlon, T. A. et al., 1990, "Localization of a human T-cell-specific gene, RANTES (D17S136E), to chromosome 17q11.2-q12," Genomics 6(3):548-553], [Kameyoshi, Y. et al., 1992, "Cytokine RANTES released by thrombin-stimulated platelets is a potent attractant for human eosinophils," J. Exp. Med. 176(2):587-592])에 개시되어 있고, CCL5의 아미노산 서열 (관리 번호 NP_002976으로 식별됨)은 예를 들어 문헌 ([Schall, T.J. et al., 1988, "A human T cell-specific molecule is a member of a new gene family," J. Immunol. 141(3):1018-1025], [Donlon, T.A. et al., 1990, "Localization of a human T-cell-specific gene, RANTES (D17S136E), to chromosome 17q11.2-q12," Genomics 6(3):548-553], [Kameyoshi, Y. et al., 1992, "Cytokine RANTES released by thrombin-stimulated platelets is a potent attractant for human eosinophils," J. Exp. Med. 176(2):587-592])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
CD86의 뉴클레오티드 서열 (관리 번호 NM_006889, NM_175862로 식별됨)은 예를 들어 문헌 ([Azuma, M. et al., 1993, "B70 antigen is a second ligand for CTLA-4 and CD28," Nature 366(6450):76-79], [Freeman, G.J. et al., 1993, "Cloning of B7-2: a CTLA-4 counter-receptor that costimulates human T cell proliferation," Science 262(5135):909-911], [Chen, C. et al., 1994, "Molecular cloning and expression of early T cell costimulatory molecule-1 and its characterization as B7-2 molecule," J. Immunol. 152(10):4929-4936])에 개시되어 있고, CD86의 아미노산 서열 (관리 번호 NP_008820, NP_787058로 식별됨)은 예를 들어 문헌 ([Azuma, M. et al., 1993, "B70 antigen is a second ligand for CTLA-4 and CD28," Nature 366(6450):76-79], [Azuma, M. et al., 1993, "B70 antigen is a second ligand for CTLA-4 and CD28," Nature 366(6450):76-79], [Freeman, G.J. et al., 1993, "Cloning of B7-2: a CTLA-4 counter-receptor that costimulates human T cell proliferation," Science 262(5135):909-911], [Chen, C. et al., 1994, "Molecular cloning and expression of early T cell costimulatory molecule-1 and its characterization as B7-2 molecule," J. Immunol. 152(10):4929-4936])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
CEACAM1의 뉴클레오티드 서열 (관리 번호 NM_001712로 식별됨)은 예를 들어 문헌 ([Svenberg, T. et al., 1979, "Immunofluorescence studies on the occurrence and localization of the CEA-related biliary glycoprotein I (BGP I) in normal human gastrointestinal tissues," Clin. Exp. Immunol. 36(3):436-441], [Hinoda, Y. et al., 1988, "Molecular cloning of a cDNA coding biliary glycoprotein I: primary structure of a glycoprotein immunologically crossreactive with carcinoembryonic antigen," Proc. Natl. Acad. Sci. U.S.A. 85(18):6959-6963], [Barnett, T.R. et al., 1989, "Carcinoembryonic antigens: alternative splicing accounts for the multiple mRNAs that code for novel members of the carcinoembryonic antigen family," J. Cell Biol. 108(2):267-276])에 개시되어 있고, CEACAM1의 아미노산 서열 (관리 번호 NP_001703으로 식별됨)은 예를 들어 문헌 ([Svenberg, T. et al., 1979, "Immunofluorescence studies on the occurrence and localization of the CEA-related biliary glycoprotein I (BGP I) in normal human gastrointestinal tissues," Clin. Exp. Immunol. 36(3):436-441], [Hinoda, Y. et al., 1988, "Molecular cloning of a cDNA coding biliary glycoprotein I: primary structure of a glycoprotein immunologically crossreactive with carcinoembryonic antigen," Proc. Natl. Acad. Sci. U.S.A. 85(18):6959-6963], [Barnett, T.R. et al., 1989, "Carcinoembryonic antigens: alternative splicing accounts for the multiple mRNAs that code for novel members of the carcinoembryonic antigen family," J. Cell Biol. 108(2):267-276])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
C 반응성 단백질 (CRP)의 뉴클레오티드 서열 (관리 번호 NM_000567로 식별됨)은 예를 들어 문헌 ([Song et al., 2006, "C-reactive protein contributes to the hypercoagulable state in coronary artery disease," J. Thromb. Haemost. 4(1), 98-106], [Wakugawa et al., 2006, "C-reactive protein and risk of first-ever ischemic and hemorrhagic stroke in a general Japanese population: the Hisayama Study," Stroke 37, 27-32], [Tong et al., 2005, "Association of testosterone, insulin-like growth factor-I, and C-reactive protein with metabolic syndrome in Chinese middle-aged men with a family history of type 2 diabetes," J. Clin. Endocrinol. Metab. 90, 6418-6423])에 개시되어 있고, CRP의 아미노산 서열 (관리 번호 CAA39671로 식별됨)은 문헌 [a direct submission by Tenchini et al., 1990, Tenchini M.L., Dipartimento di Biologia e Genetica per le Scienze mediche, via Viotti 3, 20133 Milano, Italy]에 기재되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
CRTAP의 뉴클레오티드 서열 (관리 번호 NM_006371로 식별됨)은 예를 들어 문헌 ([Castagnola, P. et al., 1997, "Cartilage associated protein (CASP) is a novel developmentally regulated chick embryo protein," J. Cell. Sci. 110 (PT 12):1351-1359], [Tonachini, L. et al., 1999, "cDNA cloning, characterization and chromosome mapping of the gene encoding human cartilage associated protein (CRTAP)," Cytogenet. Cell Genet. 87:(3-4)], [Morello, R. et al., 1999, "cDNA cloning, characterization and chromosome mapping of Crtap encoding the mouse cartilage associated protein," Matrix Biol. 18(3):319-324])에 개시되어 있고, CRTAP의 아미노산 서열 (관리 번호 NP_006362로 식별됨)은 예를 들어 문헌 ([Castagnola, P. et al., 1997, "Cartilage associated protein (CASP) is a novel developmentally regulated chick embryo protein," J. Cell. Sci. 110 (PT 12):1351-1359], [Tonachini, L. et al., 1999, "cDNA cloning, characterization and chromosome mapping of the gene encoding human cartilage associated protein (CRTAP)," Cytogenet. Cell Genet. 87:(3-4)], [Morello, R. et al., 1999, "cDNA cloning, characterization and chromosome mapping of Crtap encoding the mouse cartilage associated protein," Matrix Biol. 18(3):319-324])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
CSF1R의 뉴클레오티드 서열 (관리 번호 NM_005211로 식별됨)은 예를 들어 문헌 ([Verbeek, J.S. et al., 1985, "Human c-fms proto-oncogene: comparative analysis with an abnormal allele," Mol. Cell. Biol. 5(2):422-426], [Xu, D.Q. et al., 1985, "Restriction fragment length polymorphism of the human c-fms gene," Proc. Natl. Acad. Sci. U.S.A. 82(9):2862-2865], [Sherr, C.J. et al., 1985, "The c-fms proto-oncogene product is related to the receptor for the mononuclear phagocyte growth factor, CSF-1," Cell 41(3):665-676])에 개시되어 있고, CSF1R의 아미노산 서열 (관리 번호 NP_005202로 식별됨)은 예를 들어 문헌 ([Verbeek, J.S. et al., 1985, "Human c-fms proto-oncogene: comparative analysis with an abnormal allele," Mol. Cell. Biol. 5(2):422-426], [Xu, D.Q. et al., 1985, "Restriction fragment length polymorphism of the human c-fms gene," Proc. Natl. Acad. Sci. U.S.A. 82(9):2862-2865], [Sherr, C.J. et al., 1985, "The c-fms proto-oncogene product is related to the receptor for the mononuclear phagocyte growth factor, CSF-1," Cell 41(3):665-676])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
FAD104의 뉴클레오티드 서열 (관리 번호 NM_022763으로 식별됨)은 예를 들어 문헌 ([Clark, H.F. et al., 2003, "The secreted protein discovery initiative (SPDI), a large-scale effort to identify novel human secreted and transmembrane proteins: a bioinformatics assessment," Genome Res. 13(10):2265-2270], [Tominaga, K. et al., 2004, "The novel gene FAD104, containing a fibronectin type III domain, has a significant role in adipogenesis," FEBS Lett. 577(1-2):49-54])])에 개시되어 있고, FAD104의 아미노산 서열 (관리 번호 NP_073600으로 식별됨)은 예를 들어 문헌 ([Clark, H.F. et al., 2003, "The secreted protein discovery initiative (SPDI), a large-scale effort to identify novel human secreted and transmembrane proteins: a bioinformatics assessment," Genome Res. 13(10):2265-2270], [Tominaga, K. et al., 2004, "The novel gene FAD104, containing a fibronectin type III domain, has a significant role in adipogenesis," FEBS Lett. 577(1-2):49-54])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
FCGR1A의 뉴클레오티드 서열 (관리 번호 NM_000566으로 식별됨)은 예를 들어 문헌 ([Eizuru, Y. et al., 1988, "Induction of Fc (IgG) receptor(s) by simian cytomegaloviruses in human embryonic lung fibroblasts," Intervirology 29(6):339-345], [Allen, J.M. et al., 1988, "Nucleotide sequence of three cDNAs for the human high affinity Fc receptor (FcRI)," Nucleic Acids Res. 16(24):11824], [van de Winkel, J.G. et al., 1991, "Gene organization of the human high affinity receptor for IgG, Fc gamma RI (CD64). Characterization and evidence for a second gene," J. Biol. Chem. 266(20):13449-1345])에 개시되어 있고, FCGR1A의 아미노산 서열 (관리 번호 NP_000557로 식별됨)은 예를 들어 문헌 ([Eizuru, Y. et al., 1988, "Induction of Fc (IgG) receptor(s) by simian cytomegaloviruses in human embryonic lung fibroblasts," Intervirology 29(6):339-345], [Allen, J.M. et al., 1988, "Nucleotide sequence of three cDNAs for the human high affinity Fc receptor (FcRI)," Nucleic Acids Res. 16(24):11824], [van de Winkel, J.G. et al., 1991, "Gene organization of the human high affinity receptor for IgG, Fc gamma RI (CD64). Characterization and evidence for a second gene," J. Biol. Chem. 266(20):13449-1345])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
GADD45A의 뉴클레오티드 서열 (관리 번호 NM_001924로 식별됨)은 예를 들어 문헌 ([Papathanasiou, M.A. et al., 1991, "Induction by ionizing radiation of the gadd45 gene in cultured human cells: lack of mediation by protein kinase C," Mol. Cell. Biol. 11(2):1009-1016], [Hollander, M.C. et al., 1993, "Analysis of the mammalian gadd45 gene and its response to DNA damage," J. Biol. Chem. 268(32):24385-24393], [Smith, M.L. et al., 1994, "Interaction of the p53-regulated protein Gadd45 with proliferating cell nuclear antigen," Science 266(5189):1376-1380])에 개시되어 있고, GADD45A의 아미노산 서열 (관리 번호 NP_001915로 식별됨)은 예를 들어 문헌 ([Papathanasiou, M.A. et al., 1991, "Induction by ionizing radiation of the gadd45 gene in cultured human cells: lack of mediation by protein kinase C," Mol. Cell. Biol. 11(2):1009-1016], [Hollander, M.C. et al., 1993, "Analysis of the mammalian gadd45 gene and its response to DNA damage," J. Biol. Chem. 268(32):24385-24393], [Smith, M.L. et al., 1994, "Interaction of the p53-regulated protein Gadd45 with proliferating cell nuclear antigen," Science 266(5189):1376-1380])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
GADD45B의 뉴클레오티드 서열 (관리 번호 NM_015675로 식별됨)은 예를 들어 문헌 ([Abdollahi, A. et al., 1991, "Sequence and expression of a cDNA encoding MyD118: a novel myeloid differentiation primary response gene induced by multiple cytokines," Oncogene 6(1):165-167], [Vairapandi, M. et al., 1996, "The differentiation primary response gene MyD118, related to GADD45, encodes for a nuclear protein which interacts with PCNA and p21WAF1/CIP1," Oncogene 12(12):2579-2594], [Koonin, E. V., 1997, "Cell cycle and apoptosis: possible roles of Gadd45 and MyD118 proteins inferred from their homology to ribosomal proteins," J. Mol. Med. 75(4):236-238])에 개시되어 있고, GADD45B의 아미노산 서열 (관리 번호 NP_056490으로 식별됨)은 예를 들어 문헌 ([Abdollahi, A. et al., 1991, "Sequence and expression of a cDNA encoding MyD118: a novel myeloid differentiation primary response gene induced by multiple cytokines," Oncogene 6(1):165-167], [Vairapandi, M. et al., 1996, "The differentiation primary response gene MyD118, related to GADD45, encodes for a nuclear protein which interacts with PCNA and p21WAF1 /CIP1," Oncogene 12(12):2579-2594], [Koonin, E.V., 1997, "Cell cycle and apoptosis: possible roles of Gadd45 and MyD118 proteins inferred from their homology to ribosomal proteins," J. Mol. Med. 75(4):236-238])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
HLA-DRA의 뉴클레오티드 서열 (관리 번호 NM_002123으로 식별됨)은 예를 들어 문헌 ([Larhammar, D. et al., 1981, Evolutionary relationship between HLA-DR antigen beta-chains, HLA-A, B, C antigen subunits and immunoglobulin chains," Scand. J. Immunol. 14(6):617-622], [Wiman, K. et al., 1982, "Isolation and identification of a cDNA clone corresponding to an HLA-DR antigen beta chain," Proc. Natl. Acad. Sci. U.S.A. 79(6):1703-1707], [Larhammar, D. et al., 1982, "Complete amino acid sequence of an HLA-DR antigen-like beta chain as predicted from the nucleotide sequence: similarities with immunoglobulins and HLA-A, -B, and -C antigens," Proc. Natl. Acad. Sci. U.S.A. 79(12):3687-3691])에 개시되어 있고, HLA-DRA의 아미노산 서열 (관리 번호 NP_002114로 식별됨)은 예를 들어 문헌 ([Larhammar, D. et al., 1981, Evolutionary relationship between HLA-DR antigen beta-chains, HLA-A, B, C antigen subunits and immunoglobulin chains," Scand. J. Immunol. 14(6):617-622], [Wiman, K. et al., 1982, "Isolation and identification of a cDNA clone corresponding to an HLA-DR antigen beta chain," Proc. Natl. Acad. Sci. U.S.A. 79(6):1703-1707], [Larhammar, D. et al., 1982, "Complete amino acid sequence of an HLA-DR antigen-like beta chain as predicted from the nucleotide sequence: similarities with immunoglobulins and HLA-A, -B, and -C antigens," Proc. Natl. Acad. Sci. U.S.A. 79(12):3687-3691])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
IFNGR1의 뉴클레오티드 서열 (관리 번호 NM_000416으로 식별됨)은 예를 들어 문헌 ([Novick, D. et al., 1987, "The human interferon-gamma receptor. Purification, characterization, and preparation of antibodies," J. Biol. Chem. 262(18):8483-8487], [Aguet, M. et al., 1988, "Molecular cloning and expression of the human interferon-gamma receptor," Cell 55(2):273-280], [Le Coniat, M. et al., 1989, "Human interferon gamma receptor 1 (IFNGR1) gene maps to chromosome region 6q23-6q24," Hum. Genet. 84(1):92-94])에 개시되어 있고, IFNGR1의 아미노산 서열 (관리 번호 NP_000407로 식별됨)은 예를 들어 문헌 ([Novick, D. et al., 1987, "The human interferon-gamma receptor. Purification, characterization, and preparation of antibodies," J. Biol. Chem. 262(18):8483-8487], [Aguet, M. et al., 1988, "Molecular cloning and expression of the human interferon-gamma receptor," Cell 55(2):273-280], [Le Coniat, M. et al., 1989, "Human interferon gamma receptor 1 (IFNGR1) gene maps to chromosome region 6q23-6q24," Hum. Genet. 84(1):92-94])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
IL1RN의 뉴클레오티드 서열 (관리 번호 NM_000577, NM_173841, NM_173842, NM_73843으로 식별됨)은 예를 들어 문헌 ([Eisenberg, S.P. et al., 1990, "Primary structure and functional expression from complementary DNA of a human interleukin-1 receptor antagonist," Nature 343(6256):341-346], [Carter, D.B. et al., 1990, "Purification, cloning, expression and biological characterization of an interleukin-1 receptor antagonist protein," Nature 344(6267):633-638], [Seckinger, P. et al., 1990, "Natural and recombinant human IL-1 receptor antagonists block the effects of IL-1 on bone resorption and prostaglandin production," J. Immunol. 145(12):4181-4184])에 개시되어 있고, IL1RN의 아미노산 서열 (관리 번호 AAN87150으로 식별됨)은 예를 들어 문헌 [Rieder, M.J. et al., 2002, Direct Submission, Genome Sciences, University of Washington, 1705 NE Pacific, Seattle, WA 98195, USA]에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
IL-6의 뉴클레오티드 서열 (관리 번호 NM_000600으로 식별됨)은 예를 들어 문헌 ([Haegeman, G. et al., 1986, "Structural analysis of the sequence coding for an inducible 26-kDa protein in human fibroblasts," Eur. J. Biochem. 159(3):625-632], [Zilberstein, A. et al., 1986, "Structure and expression of cDNA and genes for human interferon-beta-2, a distinct species inducible by growth-stimulatory cytokines," EMBO J. 5(10):2529-2537], [Hirano, T. et al., 1986, "Complementary DNA for a novel human interleukin (BSF-2) that induces B lymphocytes to produce immunoglobulin," Nature 324(6092):73-76])에 개시되어 있고, IL-6의 아미노산 서열 (관리 번호 NP_000591로 식별됨)은 예를 들어 문헌 ([Haegeman, G. et al., 1986, "Structural analysis of the sequence coding for an inducible 26-kDa protein in human fibroblasts," Eur. J. Biochem. 159(3):625-632], [Zilberstein, A. et al., 1986, "Structure and expression of cDNA and genes for human interferon-beta-2, a distinct species inducible by growth-stimulatory cytokines," EMBO J. 5(10):2529-2537], [Hirano, T. et al., 1986, "Complementary DNA for a novel human interleukin (BSF-2) that induces B lymphocytes to produce immunoglobulin," Nature 324(6092):73-76])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
IL-8의 뉴클레오티드 서열 (관리 번호 M28130으로 식별됨) 및 IL-8의 아미노산 서열 (관리 번호 AAA59158로 식별됨)은 각각 예를 들어 문헌 ([Mukaida et al., 1989, "Genomic structure of the human monocyte-derived neutrophil chemotactic factor IL-8," J. Immunol. 143, 1366-1371]에 개시되어 있으며, 상기 문헌은 그 전문이 본원에 참고로 포함된다.
IL-10의 뉴클레오티드 서열 (관리 번호 NM_000572로 식별됨)은 예를 들어 문헌 ([Ghosh, S. et al., 1975, "Anaerobic acidogenesis of wastewater sludge," Breast Cancer Res. Treat. 47(1):30-45], [Hsu, D.H. et al., 1990, "Expression of interleukin-10 activity by Epstein-Barr virus protein BCRF1," Science 250(4982):830-832], [Vieira, P. et al., 1991, "Isolation and expression of human cytokine synthesis inhibitory factor cDNA clones: homology to Epstein-Barr virus open reading frame BCRFI," Proc. Natl. Acad. Sci. U.S.A. 88(4):1172-1176])에 개시되어 있고, IL-10의 아미노산 서열 (관리 번호 CAH73907로 식별됨)은 예를 들어 문헌 [Tracey, A., 2005, Direct Submission, Wellcome Trust Sanger Institute, Hinxton, Cambridgeshire, CB10 1SA]에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
IL10RA의 뉴클레오티드 서열 (관리 번호 NM_001558로 식별됨)은 예를 들어 문헌 ([Tan, J.C. et al., 1993, "Characterization of interleukin-10 receptors on human and mouse cells," J. Biol. Chem. 268(28):21053-21059], [Ho, A.S. et al., 1993, "A receptor for interleukin 10 is related to interferon receptors," Proc. Natl. Acad. Sci. U.S.A. 90(23):11267-11271], [Liu, Y. et al., 1994, "Expression cloning and characterization of a human IL-10 receptor," J. Immunol. 152(4):1821-1829])에 개시되어 있고, IL10RA의 아미노산 서열 (관리 번호 NP_001549로 식별됨)은 예를 들어 문헌 ([Tan, J.C. et al., 1993, "Characterization of interleukin-10 receptors on human and mouse cells," J. Biol. Chem. 268(28):21053-21059], [Ho, A.S. et al., 1993, "A receptor for interleukin 10 is related to interferon receptors," Proc. Natl. Acad. Sci. U.S.A. 90(23):11267-11271], [Liu, Y. et al., 1994, "Expression cloning and characterization of a human IL-10 receptor," J. Immunol. 152(4):1821-1829])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
IL18R1의 뉴클레오티드 서열 (관리 번호 NM_003855로 식별됨)은 예를 들어 문헌 ([Parnet, P. et al., 1996, "IL-1Rrp is a novel receptor-like molecule similar to the type I interleukin-1 receptor and its homologues T1/ST2 and IL-1R AcP," J. Biol. Chem. 271(8):3967-3970], [Lovenberg, T.W. et al., 1996, "Cloning of a cDNA encoding a novel interleukin-1 receptor related protein (IL1R-rp2)," J. Neuroimmunol. 70(2):113-122], [Torigoe, K. et al., 1997, "Purification and characterization of the human interleukin-18 receptor," J. Biol. Chem. 272(41):25737-25742])에 개시되어 있고, IL18R1의 아미노산 서열 (관리 번호 NP_003846으로 식별됨)은 예를 들어 문헌 ([Parnet, P. et al., 1996, "IL-1Rrp is a novel receptor-like molecule similar to the type I interleukin-1 receptor and its homologues T1/ST2 and IL-1R AcP," J. Biol. Chem. 271(8):3967-3970], [Lovenberg, T.W. et al., 1996, "Cloning of a cDNA encoding a novel interleukin-1 receptor related protein (IL-1R-rp2)," J. Neuroimmunol. 70(2):113-122], [Torigoe, K. et al., 1997, "Purification and characterization of the human interleukin-18 receptor," J. Biol. Chem. 272(41):25737-25742])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
INSL3의 뉴클레오티드 서열 (관리 번호 NM_005543으로 식별됨)은 예를 들어 문헌 ([Adham, I.M. et al., 1993, "Cloning of a cDNA for a novel insulin-like peptide of the testicular Leydig cells," J. Biol. Chem. 268(35):26668-26672], [Burkhardt, E. et al., 1994, "Structural organization of the porcine and human genes coding for a Leydig cell-specific insulin-like peptide (LEY I-L) and chromosomal localization of the human gene (INSL3)," Genomics 20(1):13-19], [Burkhardt, E. et al., 1994, "A human cDNA coding for the Leydig insulin-like peptide (Ley I-L)," Hum. Genet. 94(1):91-94])에 개시되어 있고, INSL3의 아미노산 서열 (관리 번호 NP_005534로 식별됨)은 예를 들어 문헌 ([Adham, I.M. et al., 1993, "Cloning of a cDNA for a novel insulin-like peptide of the testicular Leydig cells," J. Biol. Chem. 268(35):26668-26672], [Burkhardt, E. et al., 1994, "Structural organization of the porcine and human genes coding for a Leydig cell-specific insulin-like peptide (LEY I-L) and chromosomal localization of the human gene (INSL3)," Genomics 20(1):13-19], [Burkhardt, E. et al., 1994, "A human cDNA coding for the Leydig insulin-like peptide (Ley I-L)," Hum. Genet. 94(1):91-94])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
IRAK2의 뉴클레오티드 서열 (관리 번호 NM_001570으로 식별됨)은 예를 들어 문헌 ([Muzio, M. et al., 1997, "IRAK (Pelle) family member IRAK-2 and MyD88 as proximal mediators of IL-1 signaling," Science 278(5343):1612-1615], [Auron, P.E., 1998, "The interleukin 1 receptor: ligand interactions and signal transduction," Cytokine Growth Factor Rev. 9(3-4):221-237], [Maschera, B. et al., 1999, "Overexpression of an enzymically inactive interleukin-1-receptor-associated kinase activates nuclear factor-kappaB," Biochem. J. 339 (PT 2):227-231])에 개시되어 있고, IRAK2의 아미노산 서열 (관리 번호 NP_001561로 식별됨)은 예를 들어 문헌 ([Muzio, M. et al., 1997, "IRAK (Pelle) family member IRAK-2 and MyD88 as proximal mediators of IL-1 signaling," Science 278(5343):1612-1615], [Auron, P.E., 1998, "The interleukin 1 receptor: ligand interactions and signal transduction," Cytokine Growth Factor Rev. 9(3-4):221-237], [Maschera, B. et al., 1999, "Overexpression of an enzymically inactive interleukin-1-receptor-associated kinase activates nuclear factor-kappaB," Biochem. J. 339 (PT 2):227-231])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
IRAK4의 뉴클레오티드 서열 (관리 번호 NM_016123으로 식별됨)은 예를 들어 문헌 ([Siu, G. et al., 1986, "Analysis of a human V beta gene subfamily," J. Exp. Med. 164(5):1600-1614], [Scanlan, M.J. et al., 1999, "Antigens recognized by autologous antibody in patients with renal-cell carcinoma," Int. J. Cancer 83(4):456-464], [Li, S. et al., 2002, "IRAK-4: a novel member of the IRAK family with the properties of an IRAK-kinase," Proc. Natl. Acad. Sci. U.S.A. 99(8):5567-5572])에 개시되어 있고, IRAK4의 아미노산 서열 (관리 번호 NP_057207로 식별됨)은 예를 들어 문헌 ([Siu, G. et al., 1986, "Analysis of a human V beta gene subfamily," J. Exp. Med. 164(5):1600-1614], [Scanlan, M.J. et al., 1999, "Antigens recognized by autologous antibody in patients with renal-cell carcinoma," Int. J. Cancer 83(4):456-464], [Li, S. et al., 2002, "IRAK-4: a novel member of the IRAK family with the properties of an IRAK-kinase," Proc. Natl. Acad. Sci. U.S.A. 99(8):5567-5572])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
ITGAM의 뉴클레오티드 서열 (관리 번호 NM_000632로 식별됨)은 예를 들어 문헌 ([Micklem, K.J. et al., 1985, "Isolation of complement-fragment-iC3b-binding proteins by affinity chromatography. The identification of p150, 95 as an iC3b-binding protein," Biochem. J. 231(1):233-236], [Pierce, M.W. et al., 1986, "N-terminal sequence of human leukocyte glycoprotein Mo1: conservation across species and homology to platelet IIb/IIIa," Biochim. Biophys. Acta 874(3):368-371], [Arnaout, M.A. et al., 1988," Molecular cloning of the alpha subunit of human and guinea pig leukocyte adhesion glycoprotein Mo1:chromosomal localization and homology to the alpha subunits of integrins," Proc. Natl. Acad. Sci. U.S.A. 85(8):2776-2780])에 개시되어 있고, ITGAM의 아미노산 서열 (관리 번호 NP_000623으로 식별됨)은 예를 들어 문헌 ([Micklem, K.J. et al., 1985, "Isolation of complement-fragment-iC3b-binding proteins by affinity chromatography. The identification of p150, 95 as an iC3b-binding protein," Biochem. J. 231(1):233-236], [Pierce, M.W. et al., 1986, "N-terminal sequence of human leukocyte glycoprotein Mo1: conservation across species and homology to platelet IIb/IIIa," Biochim. Biophys. Acta 874(3):368-371], [Arnaout, M.A. et al., 1988, "Molecular cloning of the alpha subunit of human and guinea pig leukocyte adhesion glycoprotein Mo1: chromosomal localization and homology to the alpha subunits of integrins," Proc. Natl. Acad. Sci. U.S.A. 85(8):2776-2780])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
JAK2의 뉴클레오티드 서열 (관리 번호 NM_004972로 식별됨)은 예를 들어 문헌 ([Wilks, A.F. et al., 1991, "Two novel protein-tyrosine kinases, each with a second phosphotransferase-related catalytic domain, define a new class of protein kinase," Mol. Cell. Biol. 11(4):2057-2065], [Pritchard, M.A. et al., 1992, "Two members of the JAK family of protein tyrosine kinases map to chromosomes 1p31.3 and 9p24," Mamm. Genome 3(1):36-38], [Witthuhn, B.A. et al., 1993, "JAK2 associates with the erythropoietin receptor and is tyrosine phosphorylated and activated following stimulation with erythropoietin," Cell 74(2):227-236])에 개시되어 있고, JAK2의 아미노산 서열 (관리 번호 NP_004963으로 식별됨)은 예를 들어 문헌 ([Wilks, A.F. et al., 1991, "Two novel protein-tyrosine kinases, each with a second phosphotransferase-related catalytic domain, define a new class of protein kinase," Mol. Cell. Biol. 11(4):2057-2065], [Pritchard, M.A. et al., 1992, "Two members of the JAK family of protein tyrosine kinases map to chromosomes 1p31.3 and 9p24," Mamm. Genome 3(1):36-38], [Witthuhn, B.A. et al., 1993, "JAK2 associates with the erythropoietin receptor and is tyrosine phosphorylated and activated following stimulation with erythropoietin," Cell 74(2):227-236])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
LDLR의 뉴클레오티드 서열 (관리 번호 NM_000527로 식별됨)은 예를 들어 문헌 ([Brown, M.S. et al., 1979, "Receptor-mediated endocytosis: insights from the lipoprotein receptor system," Proc. Natl. Acad. Sci. U.S.A. 76(7):3330-3337], [Goldstein, J.L. et al., 1982, "Receptor-mediated endocytosis and the cellular uptake of low density lipoprotein," Ciba Found. Symp. 92, 77-95], [Tolleshaug H. et al., 1983, "The LDL receptor locus in familial hypercholesterolemia: multiple mutations disrupt transport and processing of a membrane receptor," Cell 32(3):941-951])에 개시되어 있고, LDLR의 아미노산 서열 (관리 번호 NP_000518로 식별됨)은 예를 들어 문헌 ([Brown, M.S. et al., 1979, "Receptor-mediated endocytosis: insights from the lipoprotein receptor system," Proc. Natl. Acad. Sci. U.S.A. 76(7):3330-3337], [Goldstein, J.L. et al., 1982, "Receptor-mediated endocytosis and the cellular uptake of low density lipoprotein," Ciba Found. Symp. 92, 77-95], [Tolleshaug, H. et al., 1983, "The LDL receptor locus in familial hypercholesterolemia: multiple mutations disrupt transport and processing of a membrane receptor," Cell 32(3):941-951])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
LY96의 뉴클레오티드 서열 (관리 번호 NM_015364로 식별됨)은 예를 들어 문헌 ([Shimazu, R. et al., 1999, "MD-2, a molecule that confers lipopolysaccharide responsiveness on Toll-like receptor 4," J. Exp. Med. 189(11):1777-1782], [Kato, K. et al., 2000, "ESOP-1, a secreted protein expressed in the hematopoietic, nervous, and reproductive systems of embryonic and adult mice," Blood 96(1):362-364], [Dziarski, R. et al., 2001, "MD-2 enables Toll-like receptor 2 (TLR2)-mediated responses to lipopolysaccharide and enhances TLR2-mediated responses to Gram-positive and Gram-negative bacteria and their cell wall components," J. Immunol. 166(3):1938-1944])에 개시되어 있고, LY96의 아미노산 서열 (관리 번호 NP_056179로 식별됨)은 예를 들어 문헌 ([Shimazu, R. et al., 1999, "MD-2, a molecule that confers lipopolysaccharide responsiveness on Toll-like receptor 4," J. Exp. Med. 189(11):1777-1782], [Kato, K. et al., 2000, "ESOP-1, a secreted protein expressed in the hematopoietic, nervous, and reproductive systems of embryonic and adult mice," Blood 96(1):362-364], [Dziarski, R. et al., 2001, "MD-2 enables Toll-like receptor 2 (TLR2)-mediated responses to lipopolysaccharide and enhances TLR2-mediated responses to Gram-positive and Gram-negative bacteria and their cell wall components," J. Immunol. 166(3):1938-1944])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
MAP2K6의 뉴클레오티드 서열 (관리 번호 NM_002758, NM_031988로 식별됨)은 예를 들어 문헌 ([Han, J. et al., 1996, "Characterization of the structure and function of a novel MAP kinase kinase (MKK6), J. Biol. Chem. 271(6):2886-2891], [Raingeaud, J. et al., 1996, "MKK3- and MKK6-regulated gene expression is mediated by the p38 mitogen-activated protein kinase signal transduction pathway," Mol. Cell. Biol. 16(3), 1247-1255], [Stein, B. et al., 1996, "Cloning and characterization of MEK6, a novel member of the mitogen-activated protein kinase kinase cascade," J. Biol. Chem. 271(19):11427-11433])에 개시되어 있고, MAP2K6의 아미노산 서열 (관리 번호 NP_002749, NP_114365로 식별됨)은 예를 들어 문헌 ([Han, J. et al., 1996, "Characterization of the structure and function of a novel MAP kinase kinase (MKK6), J. Biol. Chem. 271(6):2886-2891], [Raingeaud, J. et al., 1996, "MKK3- and MKK6-regulated gene expression is mediated by the p38 mitogen-activated protein kinase signal transduction pathway," Mol. Cell. Biol. 16(3), 1247-1255], [Stein, B. et al., 1996, "Cloning and characterization of MEK6, a novel member of the mitogen-activated protein kinase kinase cascade," J. Biol. Chem. 271(19):11427-11433])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
MAPK14의 뉴클레오티드 서열 (관리 번호 NM_001315, NM_139012, NM_139013, NM_139014로 식별됨)은 예를 들어 문헌 ([Zhukov-Verezhnikov, N.N. et al., 1976, "Study of the heterogenetic antigens in vaccinal preparations of V. cholerae," Biochem. Biophys. Res. Commun. 82(8):961-962], [Schultz, S.J. et al., 1993, Identification of 21 novel human protein kinases, including 3 members of a family related to the cell cycle regulator nimA of Aspergillus nidulans," Cell Growth Differ. 4(10):821-830], [Lee, J.C. et al., 1994, "A protein kinase involved in the regulation of inflammatory cytokine biosynthesis," Nature 372(6508):739-746])에 개시되어 있고, MAPK14의 아미노산 서열 (관리 번호 NP_001306, NP_620581, NP_620582, NP_620583으로 식별됨)은 예를 들어 문헌 ([Zhukov-Verezhnikov, N.N. et al., 1976, "Study of the heterogenetic antigens in vaccinal preparations of V. cholerae," Biochem. Biophys. Res. Commun. 82(8):961-962], [Schultz, S.J. et al., 1993, Identification of 21 novel human protein kinases, including 3 members of a family related to the cell cycle regulator nimA of Aspergillus nidulans," Cell Growth Differ. 4(10):821-830], [Lee, J.C. et al., 1994, "A protein kinase involved in the regulation of inflammatory cytokine biosynthesis," Nature 372(6508):739-746])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
단핵구 화학주성인자 단백질 1 (MCP1)의 뉴클레오티드 서열 (관리 번호 AF493698 및 AF493697로 식별됨)은 예를 들어 문헌 [Shanmugasundaram et al., 2002, Virology II, National Institute of Immunology, Aruna Asag Ali Marg, J.N.U. Campus, New Delhi 110 067, India]에 개시되어 있고, MCP1의 아미노산 서열 (관리 번호 AAQ75526으로 식별됨)은 예를 들어 문헌 [Nyquist et al., 2003, direct submission, Medicine, Inova Fairfax, 3300 Gallows Road, Falls Church, Virginia 22402-3300]에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
MKNK1의 뉴클레오티드 서열 (관리 번호 NM_003684, NM_198973으로 식별됨)은 예를 들어 문헌 ([Fukunaga et al., 1997, "MNK1, a new MAP kinase-activated protein kinase, isolated by a novel expression screening method for identifying protein kinase substrates, EMBO J. 16:1921-1933], [Pyronnet et al., 1999, "Human eukaryotic translation initiation factor 4G (eIF4G) recruits mnk1 to phosphorylate eIF4E," EMBO J. 18:270-279], [Cuesta et al., 2000, "Chaperone hsp27 inhibits translation during heat shock by binding eIF4G and facilitating dissociation of cap-initiation complexes," Genes Dev. 14:1460-1470])에 개시되어 있고, MKNK1의 아미노산 서열 (관리 번호 NP_003675, NP_945324로 식별됨)은 예를 들어 문헌 ([Fukunaga et al., 1997, "MNK1, a new MAP kinase-activated protein kinase, isolated by a novel expression screening method for identifying protein kinase substrates," EMBO J. 16:1921-1933], [Pyronnet et al., 1999, "Human eukaryotic translation initiation factor 4G (eIF4G) recruits mnk1 to phosphorylate eIF4E," EMBO J. 18:270-279], [Cuesta et al., 2000, "Chaperone hsp27 inhibits translation during heat shock by binding eIF4G and facilitating dissociation of cap-initiation complexes," Genes Dev. 14:1460-1470])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
MMP9의 뉴클레오티드 서열 (관리 번호 NM_004994로 식별됨)은 예를 들어 문헌 ([Wilhelm et al., 1989, "SV40-transformed human lung fibroblasts secrete a 92-kDa type IV collagenase which is identical to that secreted by normal human macrophages," J. Biol. Chem. 264:17213-17221], [Huhtala et al., 1990, "Completion of the primary structure of the human type IV collagenase preproenzyme and assignment of the gene (CLG4) to the q21 region of chromosome 16," Genomics 6:554-559], [Collier et al., 1991, "On the structure and chromosome location of the 72- and 92-kDa human type IV collagenase genes," Genomics 9:429-434])에 개시되어 있고, MMP9의 아미노산 서열 (관리 번호 NP_004985로 식별됨)은 예를 들어 문헌 ([Wilhelm et al., 1989, "SV40-transformed human lung fibroblasts secrete a 92-kDa type IV collagenase which is identical to that secreted by normal human macrophages," J. Biol. Chem. 264:17213-17221], [Huhtala et al., 1990, "Completion of the primary structure of the human type IV collagenase preproenzyme and assignment of the gene (CLG4) to the q21 region of chromosome 16," Genomics 6:554-559], [Collier et al., 1991, "On the structure and chromosome location of the 72- and 92-kDa human type IV collagenase genes," Genomics 9:429-434])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
NCR1의 뉴클레오티드 서열 (관리 번호 NM_004829로 식별됨)은 예를 들어 문헌 ([Sivori et al., 1997, "p46, a novel natural killer cell-specific surface molecule that mediates cell activation," J. Exp. Med. 186:1129-1136], [Vitale, M. et al., NKp44, 1998, "NKp44, a novel triggering surface molecule specifically expressed by activated natural killer cells, is involved in non-major histocompatibility complex-restricted tumor cell lysis," J. Exp. Med. 187:2065-2072], [Pessino et al., 1998, "Molecular cloning of NKp46: a novel member of the immunoglobulin superfamily involved in triggering of natural cytotoxicity," J. Exp. Med. 188:953-960])에 개시되어 있고, NCR1의 아미노산 서열 (관리 번호 NP_004820으로 식별됨)은 예를 들어 문헌 ([Sivori et al., 1997, "p46, a novel natural killer cell-specific surface molecule that mediates cell activation," J. Exp. Med. 186:1129-1136], [Vitale et al., NKp44, 1998, "NKp44, a novel triggering surface molecule specifically expressed by activated natural killer cells, is involved in non-major histocompatibility complex-restricted tumor cell lysis," J. Exp. Med. 187:2065-2072], [Pessino et al., 1998, "Molecular cloning of NKp46: a novel member of the immunoglobulin superfamily involved in triggering of natural cytotoxicity," J. Exp. Med. 188:953-96])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
OSM의 뉴클레오티드 서열 (관리 번호 NM_020530으로 식별됨)은 예를 들어 문헌 ([Zarling et al., 1986, "Oncostatin M: a growth regulator produced by differentiated histiocytic lymphoma cells," Proc. Natl. Acad. Sci. U.S.A. 83(24):9739-9743], [Malik et al., 1989, "Molecular cloning, sequence analysis, and functional expression of a novel growth regulator, oncostatin M," Mol. Cell. Biol. 9(7):2847-2853], [Linsley, P.S. et al., 1990, "Cleavage of a hydrophilic C-terminal domain increases growth-inhibitory activity of oncostatin M," Mol. Cell. Biol. 10(5):1882-1890])에 개시되어 있고, OSM의 아미노산 서열 (관리 번호 NP_065391로 식별됨)은 예를 들어 문헌 ([Zarling, J.M. et al., 1986, "Oncostatin M: a growth regulator produced by differentiated histiocytic lymphoma cells," Proc. Natl. Acad. Sci. U.S.A. 83(24):9739-9743], [Malik, N. et al., 1989, "Molecular cloning, sequence analysis, and functional expression of a novel growth regulator, oncostatin M," Mol. Cell. Biol. 9(7):2847-2853, Linsley, P.S. et al., 1990, "Cleavage of a hydrophilic C-terminal domain increases growth-inhibitory activity of oncostatin M," Mol. Cell. Biol. 10(5):1882-1890])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
PFKFB3의 뉴클레오티드 서열 (관리 번호 NM_004566으로 식별됨)은 예를 들어 문헌 ([Sakai, A. et al., 1996, "Cloning of cDNA encoding for a novel isozyme of fructose 6-phosphate, 2-kinase/fructose 2,6-bisphosphatase from human placenta," J. Biochem. 119(3):506-511], [Hamilton, J.A. et al., 1997, "Identification of PRG1, a novel progestin-responsive gene with sequence homology to 6-phosphofructo-2-kinase/fructose-2,6-bisphosphatase," Mol. Endocrinol. 11(4):490-502], [Nicholl, J. et al., "The third human isoform of 6-phosphofracto-2-kinase/fructose-2,6-bisphosphatase (PFKFB3) map position 10p14-p15, Chromosome Res. 5(2):150])에 개시되어 있고, PFKFB3의 아미노산 서열 (관리 번호 NP_004557로 식별됨)은 예를 들어 문헌 ([Sakai, A. et al., 1996, "Cloning of cDNA encoding for a novel isozyme of fructose 6-phosphate, 2-kinase/fructose 2,6-bisphosphatase from human placenta," J. Biochem. 119(3):506-511], [Hamilton, J.A. et al., 1997, "Identification of PRG1, a novel progestin-responsive gene with sequence homology to 6-phosphofructo-2-kinase/fructose-2,6-bisphosphatase," Mol. Endocrinol. 11(4):490-502], [Nicholl, J. et al., "The third human isoform of 6-phosphofructo-2-kinase/fructose-2,6-bisphosphatase (PFKFB3) map position 10p14-p15, Chromosome Res. 5(2):150])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
PRV1의 뉴클레오티드 서열 (관리 번호 NM_020406으로 식별됨)은 예를 들어 문헌 ([Lalezari, P. et al., 1971, "NB1, a new neutrophil-specific antigen involved in the pathogenesis of neonatal neutropenia," J. Clin. Invest. 50(5):1108-1115], [Goldschmeding, R. et al., 1992, "Further characterization of the NB1 antigen as a variably expressed 56-62 kD GPI-linked glycoprotein of plasma membranes and specific granules of neutrophils," Br. J. Haematol. 81(3):336-345], [Stroncek, D.F. et al., "Neutrophil-specific antigen NB1 inhibits neutrophil-endothelial cell interactions," J. Lab. Clin. Med. 123(2):247-255])에 개시되어 있고, PRV1의 아미노산 서열 (관리 번호 NP_065139로 식별됨)은 예를 들어 문헌 ([Lalezari, P. et al., 1971, "NB1, a new neutrophil-specific antigen involved in the pathogenesis of neonatal neutropenia," J. Clin. Invest. 50(5):1108-1115], [Goldschmeding, R. et al., 1992, "Further characterization of the NB1 antigen as a variably expressed 56-62 kD GPI-linked glycoprotein of plasma membranes and specific granules of neutrophils," Br. J. Haematol. 81(3):336-345], [Stroncek, D.F. et al., "Neutrophil-specific antigen NB1 inhibits neutrophil-endothelial cell interactions," J. Lab. Clin. Med. 123(2):247-255])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
PSTPIP2의 뉴클레오티드 서열 (관리 번호 NM_024430으로 식별됨)은 예를 들어 문헌 ([Hillier, L.D. et al., 1996, "Generation and analysis of 280,000 human expressed sequence tags," Genome Res. 6(9):807-828], [Wu, Y. et al., 1998, "PSTPIP 2, a second tyrosine phosphorylated, cytoskeletal-associated protein that binds a PEST-type protein-tyrosine phosphatase," J. Biol. Chem. 273(46):30487-30496], [Yeung, Y.G. et al., 1998, "A novel macrophage actin-associated protein (MAYP) is tyrosine-phosphorylated following colony stimulating factor-1 stimulation," J. Biol. Chem. 273(46):30638-30642])에 개시되어 있고, PSTPIP2의 아미노산 서열 (관리 번호 NP_077748로 식별됨)은 예를 들어 문헌 ([Hillier, L.D. et al., 1996, "Generation and analysis of 280,000 human expressed sequence tags," Genome Res. 6(9):807-828], [Wu, Y. et al., 1998, "PSTPIP 2, a second tyrosine phosphorylated, cytoskeletal-associated protein that binds a PEST-type protein-tyrosine phosphatase," J. Biol. Chem. 273(46):30487-30496], [Yeung, Y.G. et al., 1998, "A novel macrophage actin-associated protein (MAYP) is tyrosine-phosphorylated following colony stimulating factor-1 stimulation," J. Biol. Chem. 273(46):30638-30642])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
SOCS3의 뉴클레오티드 서열 (관리 번호 NM_003955로 식별됨)은 예를 들어 문헌 ([Minamoto, S. et al., 1997, "Cloning and functional analysis of new members of STAT induced STAT inhibitor (SSI) family: SSI-2 and SSI-3," Biochem. Biophys. Res. Commun. 237(1):79-83], [Masuhara, M. et al., 1997, "Cloning and characterization of novel CIS family genes," Biochem. Biophys. Res. Commun. 239(2):439-446], [Zhang, J.G. et al., 1999, "The conserved SOCS box motif in suppressors of cytokine signaling binds to elongins B and C and may couple bound proteins to proteasomal degradation," Proc. Natl. Acad. Sci. U.S.A. 96(5):2071-2076])에 개시되어 있고, SOCS3의 아미노산 서열 (관리 번호 NP_003946으로 식별됨)은 예를 들어 문헌 ([Minamoto, S. et al., 1997, "Cloning and functional analysis of new members of STAT induced STAT inhibitor (SSI) family: SSI-2 and SSI-3," Biochem. Biophys. Res. Commun. 237(1):79-83], [Masuhara, M. et al., 1997, "Cloning and characterization of novel CIS family genes," Biochem. Biophys. Res. Commun. 239(2):439-446], [Zhang, J.G. et al., 1999, "The conserved SOCS box motif in suppressors of cytokine signaling binds to elongins B and C and may couple bound proteins to proteasomal degradation," Proc. Natl. Acad. Sci. U.S.A. 96(5):2071-2076])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
SOD2의 뉴클레오티드 서열 (관리 번호 NM_000636으로 식별됨)은 예를 들어 문헌 ([Smith, M. et al., 1978, "Regional localization of HLA, MES, and SODM on chromosome 6," Cytogenet. Cell Genet. 22(1-6):428-433], [Beck, Y. et al., 1987, "Human Mn superoxide dismutase cDNA sequence," Nucleic Acids Res. 15(21):9076], [Ho, Y.S. et al., 1988, "Isolation and characterization of complementary DNAs encoding human manganese-containing superoxide dismutase," FEBS Lett. 229(2):256-260])에 개시되어 있고, SOD2의 아미노산 서열 (관리 번호 NP_000627로 식별됨)은 예를 들어 문헌 ([Smith, M. et al., 1978, "Regional localization of HLA, MES, and SODM on chromosome 6," Cytogenet. Cell Genet. 22(1-6):428-433], [Beck, Y. et al., 1987, "Human Mn superoxide dismutase cDNA sequence," Nucleic Acids Res. 15(21):9076], [Ho, Y.S. et al., 1988, "Isolation and characterization of complementary DNAs encoding human manganese-containing superoxide dismutase," FEBS Lett. 229(2):256-260])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
TDRD9의 뉴클레오티드 서열 (관리 번호 NM_153046으로 식별됨)은 예를 들어 [Isogai et al., 2003, "Homo sapiens cDNA FLJ43990 fis, clone TESTI4019566, weakly similar to Dosage compensation regulator"] (미간행)에 개시되어 있고, TDRD9의 아미노산 서열 (관리 번호 NP_694591로 식별됨)은 예를 들어 [Isogai et al., 2003, "Homo sapiens cDNA FLJ43990 fis, clone TESTI4019566, weakly similar to Dosage compensation regulator,"] (미간행)에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
TGFBI의 뉴클레오티드 서열 (관리 번호 NM_000358로 식별됨)은 예를 들어 문헌 ([Skonier et al., 1992, "cDNA cloning and sequence analysis of beta ig-h3, a novel gene induced in a human adenocarcinoma cell line after treatment with transforming growth factor-beta," DNA Cell Biol. 11(7):511-522], [Stone et al., 1994, "Three autosomal dominant corneal dystrophies map to chromosome 5q," Nat. Genet. 6(1):47-51], [Skonier et al., 1994, "beta ig-h3: a transforming growth factor-beta-responsive gene encoding a secreted protein that inhibits cell attachment in vitro and suppresses the growth of CHO cells in nude mice," DNA Cell Biol. 13(6):571-584])에 개시되어 있고, TGFBI의 아미노산 서열 (관리 번호 NP_000349로 식별됨)은 예를 들어 문헌 ([Skonier et al., 1992, "cDNA cloning and sequence analysis of beta ig-h3, a novel gene induced in a human adenocarcinoma cell line after treatment with transforming growth factor-beta," DNA Cell Biol. 11(7):511-522], [Stone et al., 1994, "Three autosomal dominant corneal dystrophies map to chromosome 5q," Nat. Genet. 6(1):47-51], [Skonier et al., 1994, "beta ig-h3: a transforming growth factor-beta-responsive gene encoding a secreted protein that inhibits cell attachment in vitro and suppresses the growth of CHO cells in nude mice," DNA Cell Biol. 13:571-584])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
TIFA의 뉴클레오티드 서열 (관리 번호 NM_052864로 식별됨)은 예를 들어 문헌 ([Kanamori, M. et al., 2002, "T2BP, a novel TRAF2 binding protein, can activate NF-kappaB and AP-1 without TNF stimulation," Biochem. Biophys. Res. Commun. 290(3):1108-1113], [Takatsuna, H. et al., 2003, "Identification of TIFA as an adapter protein that links tumor necrosis factor receptor-associated factor 6 (TRAF6) to interleukin-1 (IL-1) receptor-associated kinase-1 (IRAK-1) in IL-1 receptor signaling," J. Biol. Chem. 278(14):12144-12150], [Matsuda et al., 2003, "Large-scale identification and characterization of human genes that activate NF-kappaB and MAPK signaling pathways," Oncogene 22(21):3307-3318])에 개시되어 있고, TIFA의 아미노산 서열 (관리 번호 NP_443096으로 식별됨)은 예를 들어 문헌 ([Kanamori et al., 2002, "T2BP, a novel TRAF2 binding protein, can activate NF-kappaB and AP-1 without TNF stimulation," Biochem. Biophys. Res. Commun. 290:1108-1113], [Takatsuna et al., 2003, "Identification of TIFA as an adapter protein that links tumor necrosis factor receptor-associated factor 6 (TRAF6) to interleukin-1 (IL-1) receptor-associated kinase-1 (IRAK-1) in IL-1 receptor signaling," J. Biol. Chem. 278(14):12144-12150], [Matsuda et al., 2003, "Large-scale identification and characterization of human genes that activate NF-kappaB and MAPK signaling pathways," Oncogene 22(21):3307-3318])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
메탈로프로테이나제 1의 조직 억제제 (TIMP1)의 뉴클레오티드 서열 (관리 번호 NM_003254로 식별됨)은 예를 들어 문헌 ([Domeij et al., 2005, "ell expression of MMP-1 and TIMP-1 in co-cultures of human gingival fibroblasts and monocytes: the involvement of ICAM-1," Biochem. Biophys. Res. Commun. 338, 1825-1833], [Zureik et al., "Serum tissue inhibitors of metalloproteinases 1 (TIMP-1) and carotid atherosclerosis and aortic arterial stiffness", J. Hypertens. 23, 2263-2268], [Crombez, 2005, "High level production of secreted proteins: example of the human tissue inhibitor of metalloproteinases 1", Biochem. Biophys. Res. Commun. 337, 908-915])에 개시되어 있고, TIMP1의 아미노산 서열 (관리 번호 AAA75558로 식별됨)은 예를 들어 문헌 [Hardcastle et al., 1997, "Genomic organization of the human TIMP-1 gene. Investigation of a causative role in the pathogenesis of X-linked retinitis pigmentosa," Invest. Ophthalmol. Vis. Sci. 38, 1893-1896]에 개시되어 있으며, 상기 문헌은 그 전문이 본원에 참고로 포함된다.
TLR4의 뉴클레오티드 서열 (관리 번호 AH009665로 식별됨)은 예를 들어 문헌 [Arbour, N.C. et al., 1999, Direct Submission, Medicine, University of Iowa, 2182 Med Labs, Iowa City, IA 52242, USA] 및 [Arbour, N.C. et al., (미간행), "A Genetic Basis for a Blunted Response to Endotoxin in Humans"]에 개시되어 있고, TLR4의 아미노산 서열 (관리 번호 AAF05316으로 식별됨)은 예를 들어 문헌 ([Beutler, 1999, Direct Submission, Department of Internal Medicine, University of Texas Southwestern Medical Center and the Howard Hughes Medical Institute, 5323 Harry Hines Boulevard, Dallas, TX 75235-9050, USA], [Smirnova, I. et al., 2000, "Phylogenetic variation and polymorphism at the toll-like receptor 4 locus (TLR4)," Genome Biol. 1, res. 002.1-002.10])에 개시되어 있으며, 이들 각각은 그 전문이 본원에 참고로 포함된다.
TNFRSF6의 뉴클레오티드 서열 (관리 번호 NM_152877로 식별됨)은 예를 들어 문헌 ([Oehm, A. et al., 1992, "Purification and molecular cloning of the APO-1 cell surface antigen, a member of the tumor necrosis factor/nerve growth factor receptor superfamily. Sequence identity with the Fas antigen," J. Biol. Chem. 267(15):10709-10715], [Inazawa, J. et al., 1992, "Assignment of the human Fas antigen gene (Fas) to 10q24.1," Genomics 14(3):821-822], [Cheng, J. et al., 1994, "Protection from Fas-mediated apoptosis by a soluble form of the Fas molecule," Science 263(5154):1759-1762])에 개시되어 있고, TNFRSF6의 아미노산 서열 (관리 번호 NP_000034로 식별됨)은 예를 들어 문헌 ([Oehm, A. et al., 1992, "Purification and molecular cloning of the APO-1 cell surface antigen, a member of the tumor necrosis factor/nerve growth factor receptor superfamily. Sequence identity with the Fas antigen," J. Biol. Chem. 267(15):10709-10715], [Inazawa, J. et al., 1992, "Assignment of the human Fas antigen gene (Fas) to 10q24.1," Genomics 14(3):821-822], [Cheng, J. et al., 1994, "Protection from Fas-mediated apoptosis by a soluble form of the Fas molecule," Science 263(5154):1759-1762])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
TNFSF10의 뉴클레오티드 서열 (관리 번호 NM_003810으로 식별됨)은 예를 들어 문헌 ([Wiley, S.R. et al., 1995, "Identification and characterization of a new member of the TNF family that induces apoptosis," Immunity 3(6):673-682], [Pitti, R.M. et al., 1996, "Induction of apoptosis by Apo-2 ligand, a new member of the tumor necrosis factor cytokine family," J. Biol. Chem. 271(22):12687-12690], [Pan, G. et al., 1997, "The receptor for the cytotoxic ligand TRAIL," Science 276(5309):111-113])에 개시되어 있고, TNFSF10의 아미노산 서열 (관리 번호 NP_003801로 식별됨)은 예를 들어 문헌 ([Wiley, S.R. et al., 1995, "Identification and characterization of a new member of the TNF family that induces apoptosis," Immunity 3(6):673-682], [Pitti, R.M. et al., 1996, "Induction of apoptosis by Apo-2 ligand, a new member of the tumor necrosis factor cytokine family," J. Biol. Chem. 271(22):12687-12690], [Pan, G. et al., 1997, "The receptor for the cytotoxic ligand TRAIL," Science 276(5309):111-113])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
TNFSF13B의 뉴클레오티드 서열 (관리 번호 NM_006573으로 식별됨)은 예를 들어 문헌 ([Shu, H.B. et al., 1999, "TALL-1 is a novel member of the TNF family that is down-regulated by mitogens," J. Leukoc. Biol. 65(5):680-683], [Mukhopadhyay, A. et al., 1999, "Identification and characterization of a novel cytokine, THANK, a TNF homologue that activates apoptosis, nuclear factor-kappaB, and c-Jun NH2-terminal kinase," J. Biol. Chem. 274(23):15978-15981], [Schneider, P. et al., 1999, "BAFF, a novel ligand of the tumor necrosis factor family, stimulates B cell growth," J. Exp. Med. 189(11):1747-1756])에 개시되어 있고, TNFSF13B의 아미노산 서열 (관리 번호 NP_006564로 식별됨)은 예를 들어 문헌 ([Shu, H.B. et al., 1999, "TALL-1 is a novel member of the TNF family that is down-regulated by mitogens," J. Leukoc. Biol. 65(5):680-683], [Mukhopadhyay, A. et al., 1999, "Identification and characterization of a novel cytokine, THANK, a TNF homologue that activates apoptosis, nuclear factor-kappaB, and c-Jun NH2-terminal kinase," J. Biol. Chem. 274(23):15978-15981], [Schneider, P. et al., 1999, "BAFF, a novel ligand of the tumor necrosis factor family, stimulates B cell growth," J. Exp. Med. 189(11):1747-1756])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
VNN1의 뉴클레오티드 서열 (관리 번호 NM_004666으로 식별됨)은 예를 들어 문헌 ([Aurrand-Lions, M. et al., 1996, "Vanin-1, a novel GPI-linked perivascular molecule involved in thymus homing," Immunity 5(5):391-405], [Galland, F. et al., 1998, "Two human genes related to murine vanin-1 are located on the long arm of human chromosome 6," Genomics 53(2):203-213], [Maras, B. et al., 1999, "Is pantetheinase the actual identity of mouse and human vanin-1 proteins?," FEBS Lett. 461(3):149-152])에 개시되어 있고, VNN1의 아미노산 서열 (관리 번호 NP_004657로 식별됨)은 예를 들어 문헌 ([Aurrand-Lions, M. et al., 1996, "Vanin-1, a novel GPI-linked perivascular molecule involved in thymus homing," Immunity 5(5):391-405], [Galland, F. et al., 1998, "Two human genes related to murine vanin-1 are located on the long arm of human chromosome 6," Genomics 53(2):203-213], [Maras, B. et al., 1999, "Is pantetheinase the actual identity of mouse and human vanin-1 proteins?," FEBS Lett. 461(3):149-152])에 개시되어 있으며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함된다.
5.11.2 본 발명의 실시양태에 따른 바이오마커의 예시적 조합
일부 실시양태에서, 단락 5.2 및 단락 5.3에서 각각 기재되거나 언급된 방법 또는 키트는 표 I에서 선택된 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 10개 이상, 11개 이상, 12개 이상, 13개 이상, 14개 이상, 15개 이상, 16개 이상, 17개 이상, 18개 이상, 19개 이상, 20개 이상, 21개 이상, 22개 이상, 23개 이상, 24개 이상, 25개 이상, 30개 이상, 35개 이상, 40개 이상, 45개 이상, 50개 이상, 또는 그보다 많은 바이오마커를 사용하며, 이들 각 바이오마커가 표 I에서 "N" 표시가 되어 있는지 또는 "P" 표시가 되어 있는지 여부와는 무관하다. 일부 비-제한적인 예시적 실시양태에서, 2종 내지 53종, 3종 내지 40종, 4종 내지 30종, 또는 5종 내지 20종의 이러한 바이오마커가 사용된다.
핵산-기재의 키트 및 방법. 일부 실시양태에서, 단락 5.2 및 단락 5.3에서 각각 기재되거나 언급된 방법 또는 키트는 표 J에서 선택된 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 10개 이상, 11개 이상, 12개 이상, 13개 이상, 14개 이상, 15개 이상, 16개 이상, 17개 이상, 18개 이상, 19개 이상, 20개 이상, 21개 이상, 22개 이상, 23개 이상, 24개 이상, 25개 이상, 30개 이상, 35개 이상, 40개 이상, 또는 그보다 많은 바이오마커를 사용한다. 전형적으로, 이러한 실시양태에서의 각 바이오마커는 핵산 (예를 들어 DNA, 예컨대 cDNA 또는 증폭된 DNA, 또는 RNA, 예컨대 mRNA), 또는 핵산의 판별 분자 또는 판별 단편이다. 일부 비-제한적인 예시적 실시양태에서, 2종 내지 44종, 3종 내지 35종, 4종 내지 25종, 또는 5종 내지 20종의 이러한 바이오마커가 사용된다.
단백질 또는 펩티드-기재의 키트 및 방법. 일부 실시양태에서, 단락 5.2 및 단락 5.3에서 각각 기재되거나 언급된 방법 또는 키트는 표 K로부터 선택된 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 또는 10개 이상의 바이오마커를 사용한다. 전형적으로, 이러한 바이오마커는 펩티드-기재 (예를 들어 펩티드, 전장 단백질 등), 또는 이의 판별 분자 또는 판별 단편이다. 일부 실시양태에서, 키트 중의 바이오마커는 표 K에 나열된 2개 이상의 바이오마커에 특이적인 항체이다. 일부 비-제한적인 예시적 실시양태에서, 2종 내지 10종, 3종 내지 10종, 4종 내지 10종, 또는 5종 내지 10종의 이러한 바이오마커가 사용된다.
동종 키트 및 방법. 일부 실시양태에서, 단락 5.2 및 단락 5.3에서 각각 기재되거나 언급된 방법 또는 키트의 각 바이오마커는 표 I로부터 선택된 2개 이상의 바이오마커를 사용하며, 이러한 방법 또는 키트에 사용되는 각 바이오마커는 동일한 물리적 형태를 갖는다. 이러한 실시양태에 따른 한 예에서, 단락 5.2 및 단락 5.3 각각에 따른 방법 또는 키트의 각 바이오마커는 표 I로부터 선택된 바이오마커이고, 상기 방법 또는 키트에서 핵산 또는 핵산의 판별 분자이다. 이러한 실시양태에 따른 또다른 예에서, 단락 5.2 및 단락 5.3 각각에 따른 방법 또는 키트의 각 바이오마커는 표 I로부터 선택된 바이오마커이고, 펩티드-기재 (예를 들어 펩티드, 전장 단백질 등) 또는 이의 판별 분자이다. 이러한 실시양태에서의 바이오마커는 표 I에서 "P" 표시가 되어 있는지 또는 "N" 표시가 되어 있는지 여부와는 관계 없이 선택된다. 따라서, 이들 실시양태에 따른 키트는 바이오마커가 표 I에서 "P"로 표시된 경우라고 하더라도 핵산 형태의 상기 바이오마커를 포함할 수 있다. 상응하게, 이러한 실시양태에 따른 키트는 바이오마커가 표 I에서 "N"으로 표시된 경우라고 하더라도 펩티드 형태의 상기 바이오마커를 포함할 수 있다.
이종 키트 및 방법. 일부 실시양태에서, 단락 5.2 및 단락 5.3에서 각각 기재되거나 언급된 방법 또는 키트의 각 바이오마커는 표 I로부터 선택된 2개 이상의 바이오마커를 사용하며, 이러한 바이오마커 각각은 하기 단락 6.11 내지 단락 6.13에서 확인된 바이오마커와 동일한 물리적 형태이다. 즉, 바이오마커가 표 I에서 "N"으로 표시되어 있다면, 본 발명의 이러한 실시양태에 따라 바이오마커의 핵산 형태가 단락 5.2 및 단락 5.3에서 각각 기재되거나 언급된 방법 및 키트에서 사용된다. 바이오마커가 표 I에서 "P"로 표시되어 있다면, 본 발명의 이러한 실시양태에 따라 바이오마커의 펩티드 형태가 단락 5.2 및 단락 5.3에서 각각 기재되거나 언급된 방법 및 키트에서 사용된다. 추가로, 표 I에서 "N"으로 표시되고 이러한 방법 또는 키트에 사용되는 1개 이상의 바이오마커 및 "P"로 표시된 1개 이상의 바이오마커가 있다. 이러한 실시양태에서, 표 I에서 N으로 표시된 바이오마커는 핵산이고, 표 I에서 P로 표시된 바이오마커는 펩티드-기재 또는 단백질-기재이다.
이러한 혼합 실시양태에 따른 비-제한적인 예시적 키트는 표 J에 나열된 바이오마커로부터의 2종의 바이오마커를 핵산 형태로 사용하고, 표 K에 나열된 바이오마커로부터의 3종의 바이오마커를 펩티드-기재 형태로 사용한다. 일부 실시양태에서, 단락 5.2 및 단락 5.3에서 각각 기재되거나 언급된 비-제한적인 방법 및 키트는 표 J로부터의 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 10개 이상, 11개 이상, 12개 이상, 13개 이상, 14개 이상, 15개 이상, 16개 이상, 17개 이상, 18개 이상, 19개 이상, 20개 이상, 21개 이상, 22개 이상, 23개 이상, 24개 이상, 25개 이상, 30개 이상, 35개 이상, 40개 이상, 또는 그보다 많은 바이오마커를 핵산 형태로 사용하고, 표 K로부터의 1개 이상, 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 또는 10개 이상의 바이오마커를 펩티드-기재 또는 단백질-기재 형태로 사용한다.
추가의 키트 및 방법. 일부 실시양태에서, 단락 5.2 및 단락 5.3에서 각각 기재되거나 언급된 방법 또는 키트의 각 바이오마커는 표 I로부터 선택된 1개 이상의 바이오마커 및 표 31로부터의 1개 이상의 상이한 바이오마커를 사용한다. 일부 실시양태에서, 단락 5.2 및 단락 5.3에서 각각 기재되거나 언급된 방법 또는 키트의 각 바이오마커는 표 I로부터 선택된 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 또는 10개 이상의 바이오마커 및 표 31로부터의 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 또는 10개 이상의 상이한 바이오마커를 사용한다.
일부 실시양태에서, 단락 5.2 및 단락 5.3에서 각각 기재되거나 언급된 방법 또는 키트의 각 바이오마커는 표 J에서 선택된 1개 이상의 바이오마커를 핵산 형태로 사용하고, 표 31로부터의 1개 이상의 상이한 바이오마커를 사용한다. 일부 실시양태에서, 단락 5.2 및 단락 5.3에서 각각 기재되거나 언급된 방법 또는 키트의 각 바이오마커는 표 I로부터 선택된 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 또는 10개 이상의 바이오마커를 각각 핵산 형태로 사용하고, 표 31로부터의 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 또는 10개 이상의 상이한 바이오마커를 사용한다.
일부 실시양태에서, 단락 5.2 및 단락 5.3에서 각각 기재되거나 언급된 방법 또는 키트의 각 바이오마커는 표 K로부터 선택된 1개 이상의 바이오마커를 단백질 형태로 사용하고, 표 31로부터의 1개 이상의 상이한 바이오마커를 사용한다. 일부 실시양태에서, 단락 5.2 및 단락 5.3에서 각각 기재되거나 언급된 방법 또는 키트의 각 바이오마커는 표 I로부터 선택된 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 또는 10개 이상의 바이오마커를 각각 단백질 형태로 사용하고, 표 31로부터의 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 또는 10개 이상의 상이한 바이오마커를 사용한다.
일부 실시양태에서, 단락 5.2 및 단락 5.3에서 각각 기재되거나 언급된 방법 또는 키트의 각 바이오마커는 표 J에 나열된 바이오마커로부터의 1개 이상의 바이오마커를 핵산 형태로 사용하고, 표 K에 나열된 바이오마커로부터의 1개 이상의 바이오마커를 단백질 형태로 사용한다. 일부 실시양태에서, 단락 5.2 및 단락 5.3에서 각각 기재되거나 언급된 비-제한적인 방법 및 키트는 표 J로부터의 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 10개 이상, 11개 이상, 12개 이상, 13개 이상, 14개 이상, 15개 이상, 16개 이상, 17개 이상, 18개 이상, 19개 이상, 20개 이상, 21개 이상, 22개 이상, 23개 이상, 24개 이상, 25개 이상, 30개 이상, 35개 이상, 40개 이상, 또는 그보다 많은 바이오마커를 핵산 형태로 사용하고, 표 K로부터의 1개 이상, 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 또는 10개 이상의 바이오마커를 단백질 형태로 사용한다.
일부 실시양태에서, 상기한 임의의 바이오마커 조합은, IL-6, IL-8, MMP9, B2M, HLA-DRA, 및 MCP1 바이오마커가 단락 5.2 및 단락 5.3에 따른 방법 또는 키트에 사용되지 않는다는 점을 제외하고는 이러한 방법 또는 키트에 사용된다. 예를 들어 특정 단핵구가 전혈로부터 단리되어 시험되는 실시양태에서, 이러한 바이오마커는 특히 이러한 바이오마커가 핵산인 경우에는 이용되지 않는다. 일부 실시양태에서, 상기한 임의의 바이오마커 조합은, IL-6, IL-8, IL-10, 및 CRP 단백질 바이오마커가 단락 5.2 및 단락 5.3에 따른 방법 또는 키트에 사용되지 않는다는 점을 제외하고는 이러한 방법 또는 키트에 사용된다. 일부 실시양태에서, 상기한 임의의 바이오마커 조합은, IL-6, IL-8, IL-10, 및 CRP 핵산 바이오마커가 단락 5.2 및 단락 5.3에 따른 방법 또는 키트에 사용되지 않는다는 점을 제외하고는 이러한 방법 또는 키트에 사용된다. 일부 실시양태에서, 상기한 임의의 바이오마커 조합은, IL-6 및 MAPK 바이오마커가 단락 5.2 및 단락 5.3에 따른 방법 또는 키트에 사용되지 않는다는 점을 제외하고는 이러한 방법 또는 키트에 사용된다. 일부 실시양태에서, 상기한 임의의 바이오마커 조합은, IL-6, IL-8, 및 IL-10 바이오마커가 단락 5.2 및 단락 5.3에 따른 방법 또는 키트에 사용되지 않는다는 점을 제외하고는 이러한 방법 또는 키트에 사용된다. 일부 실시양태에서, 상기한 임의의 바이오마커 조합은, CD86, IL-6, IL-8, IL-10, 및 CRP 바이오마커가 단락 5.2 및 단락 5.3에 따른 방법 또는 키트에 사용되지 않는다는 점을 제외하고는 이러한 방법 또는 키트에 사용된다. 일부 실시양태에서, 상기한 임의의 바이오마커 조합은, IL-6 및 IL-10 바이오마커가 단락 5.2 및 단락 5.3에 따른 방법 또는 키트에 사용되지 않는다는 점을 제외하고는 이러한 방법 또는 키트에 사용된다. 일부 실시양태에서, 상기한 임의의 바이오마커 조합은, IL-6 및 CRP 바이오마커가 단락 5.2 및 단락 5.3에 따른 방법 또는 키트에 사용되지 않는다는 점을 제외하고는 이러한 방법 또는 키트에 사용된다. 일부 실시양태에서, 상기한 임의의 바이오마커 조합은, CRP 바이오마커가 단락 5.2 및 단락 5.3에 따른 방법 또는 키트에 사용되지 않는다는 점을 제외하고는 이러한 방법 또는 키트에 사용된다. 일부 실시양태에서, 상기한 임의의 바이오마커 조합은, IL-8 바이오마커가 단락 5.2 및 단락 5.3에 따른 방법 또는 키트에 사용되지 않는다는 점을 제외하고는 이러한 방법 또는 키트에 사용된다. 일부 실시양태에서, 상기한 임의의 바이오마커 조합은, B2M 바이오마커가 단락 5.2 및 단락 5.3에 따른 방법 또는 키트에 사용되지 않는다는 점을 제외하고는 이러한 방법 또는 키트에 사용된다.
5.11.3 본 발명의 실시양태에 따른 바이오마커의 예시적 하위조합
일부 실시양태에서, 단락 5.2 및 단락 5.3에서 각각 기재되거나 언급된 방법 또는 키트는 표 L에 나열된 임의의 한 바이오마커 세트를 사용한다. 표 L에 나열된 바이오마커 세트는 표 J에 나열된 4600개의 무작위 바이오마커 하위조합을 시험한 하기 단락 6.14.1에 기재된 계산적 실험에서 확인되었다. 하기 표 L은 단락 6.14.1에 기재된 검증 집단에 대해 높은 정확도 스코어를 제공하는 바이오마커 세트의 일부를 나열한다. 표 L의 각 열은 단락 5.2 및 5.3에 각각 언급된 방법 및 키트에 사용될 수 있는 단일 바이오마커 세트를 나열한다. 즉, 표 L의 각 열은 (예를 들어 대상이 패혈증에 걸리기 쉬운지를 결정하기 위하여) 패혈증과 SIRS 대상 사이를 판별하기 위해 사용될 수 있는 바이오마커 세트를 기재하고 있다. 일부 실시양태에서, 표 L에서의 바이오마커 세트에 나열된 바이오마커의 핵산 형태는 단락 5.2 및 5.3에 각각 언급된 방법 및 키트에 사용된다. 일부 실시양태에서, 표 L에서의 바이오마커 세트에 나열된 바이오마커의 단백질 형태는 단락 5.2 및 5.3에 각각 언급된 방법 및 키트에 사용된다. 일부 하이브리드 실시양태에서, 표 L에 나열된 바이오마커 세트에서의 바이오마커 일부는 단백질 형태이고, 표 L로부터의 동일한 바이오마커 세트에서의 바이오마커 일부는 단락 5.2 및 5.3에 각각 언급된 방법 및 키트에서의 핵산 형태이다.
일부 실시양태에서, 표 L에 나열된 주어진 바이오마커 세트는 표 L로부터의 상기 주어진 바이오마커 세트에 속하지 않는 표 I에 나열된 1종, 2종, 3종, 4종, 5종, 6종, 7종, 8종 또는 9종 또는 그 이상의 추가의 바이오마커의 첨가와 함께 사용된다. 일부 실시양태에서, 표 L에 나열된 주어진 바이오마커 세트는 표 L로부터의 상기 주어진 바이오마커 세트에 속하지 않는 표 I, 30, 31, 32, 33, 34, 또는 36 중 임의의 하나로부터의 1종, 2종, 3종, 4종, 5종, 6종, 7종, 8종 또는 9종 또는 그 이상의 추가의 바이오마커의 첨가와 함께 사용된다. 표 L에서, 정확도, 특이도, 및 민감도는 하기 단락 6.14.1에 기재된 T-12 시점 데이타와 관련하여 기재한다.
Figure 112007081780858-PCT00037
Figure 112007081780858-PCT00038
Figure 112007081780858-PCT00039
Figure 112007081780858-PCT00040
Figure 112007081780858-PCT00041
Figure 112007081780858-PCT00042
Figure 112007081780858-PCT00043
Figure 112007081780858-PCT00044
Figure 112007081780858-PCT00045
Figure 112007081780858-PCT00046
Figure 112007081780858-PCT00047
Figure 112007081780858-PCT00048
Figure 112007081780858-PCT00049
Figure 112007081780858-PCT00050
Figure 112007081780858-PCT00051
Figure 112007081780858-PCT00052
Figure 112007081780858-PCT00053
Figure 112007081780858-PCT00054
Figure 112007081780858-PCT00055
Figure 112007081780858-PCT00056
Figure 112007081780858-PCT00057
Figure 112007081780858-PCT00058
Figure 112007081780858-PCT00059
Figure 112007081780858-PCT00060
Figure 112007081780858-PCT00061
Figure 112007081780858-PCT00062
Figure 112007081780858-PCT00063
Figure 112007081780858-PCT00064
Figure 112007081780858-PCT00065
Figure 112007081780858-PCT00066
Figure 112007081780858-PCT00067
Figure 112007081780858-PCT00068
Figure 112007081780858-PCT00069
Figure 112007081780858-PCT00070
Figure 112007081780858-PCT00071
Figure 112007081780858-PCT00072
Figure 112007081780858-PCT00073
일부 실시양태에서, 단락 5.2 및 단락 5.3에서 각각 기재되거나 언급된 방법 또는 키트는 표 M에 나열된 바이오마커 세트 중 임의의 하나를 사용한다. 표 M에 나열된 바이오마커 세트는 표 K에 나열된 1600개의 무작위 바이오마커 하위조합을 시험한 하기 단락 6.14.2에 기재된 계산적 실험에서 확인되었다. 표 M은 단락 6.14.2에 기재된 검증 집단에 대해 높은 정확도 스코어를 제공하는 바이오마커 세트의 일부를 나열한다. 표 M의 각 열은 단락 5.2 및 5.3에 각각 언급된 방법 및 키트에 사용될 수 있는 단일 바이오마커 세트를 나열한다. 즉, 표 M의 각 열은 (예를 들어 대상이 패혈증에 걸리기 쉬운지를 결정하기 위하여) 패혈증과 SIRS 대상 사이를 판별하기 위해 사용될 수 있는 바이오마커 세트를 기재하고 있다. 일부 실시양태에서, 표 M에 나열된 바이오마커의 핵산 형태는 단락 5.2 및 5.3에 각각 언급된 방법 및 키트에 사용된다. 일부 실시양태에서, 표 M에 나열된 바이오마커의 단백질 형태를 사용한다. 일부 하이브리드 실시양태에서, 표 M으로부터의 바이오마커 세트에서의 바이오마커 일부는 단백질 형태이고, 표 M으로부터의 동일한 바이오마커 세트에서의 바이오마커 일부는 단락 5.2 및 5.3에 각각 언급된 방법 및 키트에서의 핵산 형태이다.
일부 실시양태에서, 표 M에 나열된 주어진 바이오마커 세트는 표 M으로부터의 상기 주어진 바이오마커 세트에 속하지 않는 표 I에 나열된 1종, 2종, 3종, 4종, 5종, 6종, 7종, 8종 또는 9종 또는 그 이상의 추가의 바이오마커의 첨가와 함께 사용된다. 일부 실시양태에서, 표 M에 나열된 주어진 바이오마커 세트는 표 M으로부터의 상기 주어진 바이오마커 세트에 속하지 않는 표 I, 30, 31, 32, 33, 34, 또는 36 중 임의의 하나로부터의 1종, 2종, 3종, 4종, 5종, 6종, 7종, 8종 또는 9종 또는 그 이상의 추가의 바이오마커의 첨가와 함께 사용된다. 표 M에서, 정확도, 특이도, 및 민감도는 하기 단락 6.14.2에 기재된 T-12 시점 데이타와 관련하여 기재한다.
Figure 112007081780858-PCT00074
Figure 112007081780858-PCT00075
Figure 112007081780858-PCT00076
Figure 112007081780858-PCT00077
Figure 112007081780858-PCT00078
Figure 112007081780858-PCT00079
일부 실시양태에서, 단락 5.2 및 단락 5.3에서 각각 기재되거나 언급된 방법 또는 키트는 표 N에 나열된 바이오마커의 임의의 한 서브세트를 사용한다. 표 N에 나열된 바이오마커의 서브세트는 표 I에 나열된 4600개의 무작위 바이오마커 하위조합을 시험한 하기 단락 6.14.5에 기재된 계산적 실험에서 확인되었다. 표 N은 단락 6.14.5에 기재된 검증 집단에 대해 높은 정확도 스코어를 제공하는 바이오마커 세트의 일부를 나열한다. 표 N의 각 열은 단락 5.2 및 5.3에 각각 언급된 방법 및 키트에 사용될 수 있는 단일 바이오마커 세트를 나열한다. 즉, 표 N의 각 열은 패혈증과 SIRS 대상 사이를 판별하기 위해 사용될 수 있는 바이오마커 세트를 기재하고 있다. 일부 실시양태에서, 표 N에 나열된 바이오마커의 핵산 형태는 단락 5.2 및 5.3에 각각 언급된 방법 및 키트에 사용된다. 일부 실시양태에서, 표 N에 나열된 바이오마커의 단백질 형태를 사용한다. 일부 실시양태에서, 표 N으로부터의 바이오마커 세트에서의 바이오마커 일부는 단백질 형태이고, 표 N으로부터의 동일한 바이오마커 세트에서의 바이오마커 일부는 단락 5.2 및 5.3에 각각 언급된 방법 및 키트에서의 핵산 형태이다.
일부 실시양태에서, 표 N으로부터의 주어진 바이오마커 세트는 표 N으로부터의 상기 주어진 바이오마커 세트에 속하지 않는 표 30, 31, 32, 33, 34, 또는 36 중 임의의 하나로부터의 1종, 2종, 3종, 4종, 5종, 6종, 7종, 8종 또는 9종 또는 그 이상의 추가의 바이오마커의 첨가와 함께 사용된다. 표 N에서, 정확도, 특이도, 및 민감도는 하기 단락 6.14.5에 기재된 T-12 시점 데이타와 관련하여 기재한다.
Figure 112007081780858-PCT00080
Figure 112007081780858-PCT00081
Figure 112007081780858-PCT00082
Figure 112007081780858-PCT00083
Figure 112007081780858-PCT00084
Figure 112007081780858-PCT00085
Figure 112007081780858-PCT00086
Figure 112007081780858-PCT00087
Figure 112007081780858-PCT00088
Figure 112007081780858-PCT00089
Figure 112007081780858-PCT00090
Figure 112007081780858-PCT00091
Figure 112007081780858-PCT00092
Figure 112007081780858-PCT00093
Figure 112007081780858-PCT00094
Figure 112007081780858-PCT00095
Figure 112007081780858-PCT00096
Figure 112007081780858-PCT00097
Figure 112007081780858-PCT00098
Figure 112007081780858-PCT00099
Figure 112007081780858-PCT00100
Figure 112007081780858-PCT00101
Figure 112007081780858-PCT00102
Figure 112007081780858-PCT00103
일부 실시양태에서, 단락 5.2 및 단락 5.3에서 각각 기재되거나 언급된 방법 또는 키트는 표 O에 나열된 바이오마커의 임의의 한 서브세트를 사용한다. 표 O에 나열된 바이오마커의 서브세트는 표 I에 나열된 4600개의 무작위 바이오마커 하위조합을 시험한 하기 단락 6.14.5에 기재된 계산적 실험에서 확인되었다. 표 O는 단락 6.14.5에 기재된 검증 집단에 대해 높은 정확도 스코어를 제공하는 바이오마커 세트의 일부를 나열한다. 표 O의 각 열은 단락 5.2 및 5.3에 각각 언급된 방법 및 키트에 사용될 수 있는 단일 바이오마커 세트를 나열한다. 즉, 표 O의 각 열은 패혈증과 SIRS 대상 사이를 판별하기 위해 사용될 수 있는 바이오마커 세트를 기재하고 있다. 일부 실시양태에서, 표 O에 나열된 바이오마커의 핵산 형태는 단락 5.2 및 5.3에 각각 언급된 방법 및 키트에 사용된다. 일부 실시양태에서, 표 O에 나열된 바이오마커의 단백질 형태를 사용한다. 일부 실시양태에서, 표 O로부터의 바이오마커 세트에서의 바이오마커 일부는 단백질 형태이고, 표 O로부터의 동일한 바이오마커 세트에서의 바이오마커 일부는 단락 5.2 및 5.3에 각각 언급된 방법 및 키트에서의 핵산 형태이다.
일부 실시양태에서, 표 O로부터의 주어진 바이오마커 세트는 표 O로부터의 상기 주어진 바이오마커 세트에 속하지 않는 표 30, 31, 32, 33, 34, 또는 36 중 임의의 하나로부터의 1종, 2종, 3종, 4종, 5종, 6종, 7종, 8종 또는 9종 또는 그 이상의 추가의 바이오마커의 첨가와 함께 사용된다. 표 O에서, 정확도, 특이도, 및 민감도는 하기 단락 6.14.6에 기재된 T-12 시점 데이타와 관련하여 기재한다.
Figure 112007081780858-PCT00104
Figure 112007081780858-PCT00105
Figure 112007081780858-PCT00106
Figure 112007081780858-PCT00107
Figure 112007081780858-PCT00108
일부 실시양태에서, 단락 5.2 및 단락 5.3에서 각각 기재되거나 언급된 방법 또는 키트는 도 6, 14, 17, 또는 26 중 임의의 하나에 나열된 프로브세트를 각각 함유하는 2종 이상의 상이한 바이오마커를 사용한다. 한 특정 실시양태에서, 바이오마커 프로필은 도 6, 14, 17, 또는 26 중 임의의 하나에 나열된 프로브세트 중 하나를 각각 함유하는 2종 이상의 상이한 바이오마커, 도 6, 14, 17, 또는 26 중 임의의 하나의 프로브세트 중 하나의 상보체를 각각 함유하는 바이오마커, 또는 도 6, 14, 17, 또는 26 중 임의의 하나의 프로브세트 중 하나, 또는 도 6, 14, 17, 또는 26 중 임의의 하나의 프로브세트 중 하나의 상보체를 함유하는 유전자로 코딩된 아미노산 서열을 각각 함유하는 바이오마커를 포함한다. 이러한 바이오마커는 예를 들어 mRNA 전사체, cDNA 또는 일부의 다른 핵산, 예를 들어 증폭된 핵산, 또는 단백질일 수 있다. 상기 바이오마커 프로필은 추가로 2종 이상의 바이오마커에 대해 각각 상응하는 특성을 포함한다. 일반적으로, 2종 이상의 바이오마커는 2종 이상의 상이한 유전자로부터 유도된다. 바이오마커가 도 6, 14, 17, 또는 26 중 임의의 하나에 나열된 프로브세트의 서열을 포함하는 유전자를 바탕으로 하는 경우, 바이오마커는 예를 들어 상기 유전자에 의해 만들어진 전사체, 그의 상보체, 또는 판별 단편 또는 그의 상보체, 또는 그의 cDNA, 또는 cDNA의 판별 단편, 또는 상기 전사체 또는 그의 상보체의 전부 또는 일부에 상응하는 판별 증폭된 핵산 분자, 또는 상기 유전자에 의해 코딩된 단백질, 또는 상기 단백질의 판별 단편, 또는 상기 임의의 것의 표시물일 수 있다. 추가로, 바이오마커는 예를 들어 도 6, 14, 17, 또는 26 중 임의의 하나에 기재된 프로브세트 서열을 포함하는 유전자에 의해 코딩된 단백질, 또는 상기 단백질의 판별 단편, 또는 상기 임의의 것의 표시물일 수 있다. 여기서, 판별 분자 또는 단편은 검출시에 상기 확인된 전사체, cDNA, 증폭된 핵산, 또는 단백질의 존재 또는 풍부를 지시하는 분자 또는 단편이다. 일부 실시양태에서, 바이오마커 프로필은 각각 도 6, 14, 17, 또는 26 중 임의의 하나에 나열된 프로브세트를 함유하는 2종 이상, 3종 이상, 4종 이상, 5종 이상, 6종 이상, 7종 이상, 8종 이상, 9종 이상, 또는 10종 이상의 상이한 바이오마커를 포함한다.
일부 실시양태에서, 단락 5.2 및 단락 5.3에서 각각 기재되거나 언급된 방법 또는 키트는 도 39, 43, 52, 53, 또는 56 중 임의의 하나에 나열된 2종 이상의 상이한 바이오마커를 사용한다. 한 특정 실시양태에서, 바이오마커 프로필은 도 39, 43, 52, 53, 또는 56 중 임의의 하나에 나열된 2종 이상의 상이한 바이오마커를 포함한다. 상기 바이오마커 프로필은 2종 이상의 바이오마커에 대한 각각의 상응하는 특성을 추가로 포함한다. 일반적으로, 2종 이상의 바이오마커는 2종 이상의 상이한 유전자로부터 유도된다. 2종 이상의 상이한 바이오마커에서의 바이오마커가 도 39, 43, 52, 53, 또는 56 중 임의의 하나에 나열된 것인 경우, 상기 바이오마커는 예를 들어 나열된 유전자에 의해 만들어진 전사체, 그의 상보체, 또는 판별 단편 또는 그의 상보체, 또는 그의 cDNA, 또는 cDNA의 판별 단편, 또는 상기 전사체 또는 그의 상보체의 전부 또는 일부에 상응하는 판별 증폭된 핵산 분자, 또는 상기 유전자에 의해 코딩된 단백질, 또는 상기 단백질의 판별 단편, 또는 상기 임의의 것의 표시물일 수 있다. 추가로, 바이오마커는 예를 들어 도 39, 43, 52, 53, 또는 56 중 임의의 하나에 나열된 유전자에 의해 코딩된 단백질, 또는 상기 단백질의 판별 단편, 또는 상기 임의의 것의 표시물일 수 있다. 여기서, 판별 분자 또는 단편은 검출시에 상기 확인된 전사체, cDNA, 증폭된 핵산, 또는 단백질의 존재 또는 풍부를 지시하는 분자 또는 단편이다. 상기 실시양태에 따르면, 당업자에게 공지된 임의의 표준 검정 또는 본원에 기재된 검정을 이용하여 본 발명의 바이오마커 프로필을 수득하여 바이오마커를 검출할 수 있다. 이러한 검정은 예를 들어 특정 유전자의 발현 생성물 (예를 들어 핵산 및/또는 단백질) 또는 관심 유전자 (예를 들어 표 30에 개시된 유전자)의 대립유전자를 검출할 수 있다. 한 실시양태에서, 이러한 검정은 핵산 미세배열을 이용한다. 일부 실시양태에서, 바이오마커 프로필은 도 39, 43, 52, 53, 또는 56 중 임의의 하나로부터의 2종 이상의 상이한 바이오마커를 포함한다. 일부 실시양태에서, 바이오마커 프로필은 도 39, 43, 52, 53, 또는 56 중 임의의 하나로부터의 2종 이상, 3종 이상, 4종 이상, 5종 이상, 6종 이상, 7종 이상, 8종 이상, 9종 이상, 10종 이상, 11종 이상, 12종 이상, 13종 이상, 14종 이상, 15종 이상, 16종 이상, 17종 이상, 18종 이상, 19종 이상, 또는 20종 이상의 상이한 바이오마커를 포함한다.
일부 실시양태에서, 단락 5.2 및 단락 5.3에서 각각 기재되거나 언급된 방법 또는 키트는 표 P에 나열된 프로브세트 콜렉션 중 임의의 하나로부터의 프로브를 함유하는 특정 바이오마커를 사용한다. 특정 실시양태에서, 바이오마커 프로필은 표 P의 프로브세트 콜렉션 중 임의의 하나에 나열된 프로브세트 중 하나를 각각 함유하는 2종 이상의 상이한 바이오마커, 표 P의 프로브세트 콜렉션 중 임의의 하나로부터의 프로브세트 중 하나의 상보체를 각각 함유하는 바이오마커, 또는 표 P의 프로브세트 콜렉션 중 임의의 하나로부터의 프로브세트 중 하나 또는 표 P의 프로브세트 콜렉션 중 임의의 하나의 프로브세트 중 하나의 상보체를 함유하는 유전자로 코딩된 아미노산 서열을 각각 함유하는 바이오마커를 포함한다. 이러한 바이오마커는 예를 들어 mRNA 전사체, cDNA 또는 일부의 다른 핵산, 예를 들어 증폭된 핵산, 또는 단백질일 수 있다. 상기 바이오마커 프로필은 추가로 2종 이상의 바이오마커에 대해 각각 상응하는 특성을 포함한다. 일반적으로, 2종 이상의 바이오마커는 2종 이상의 상이한 유전자로부터 유도된다. 바이오마커가 표 P의 프로브세트 콜렉션 중 임의의 하나에 나열된 프로브세트의 서열을 포함하는 유전자를 바탕으로 하는 경우, 바이오마커는 예를 들어 상기 유전자에 의해 만들어진 전사체, 그의 상보체, 또는 판별 단편 또는 그의 상보체, 또는 그의 cDNA, 또는 cDNA의 판별 단편, 또는 상기 전사체 또는 그의 상보체의 전부 또는 일부에 상응하는 판별 증폭된 핵산 분자, 또는 상기 유전자에 의해 코딩된 단백질, 또는 상기 단백질의 판별 단편, 또는 상기 임의의 것의 표시물일 수 있다. 추가로, 바이오마커는 예를 들어 표 P에 나열된 프로브세트 콜렉션 중 임의의 하나로부터의 프로브세트 서열을 포함하는 유전자에 의해 코딩된 단백질, 또는 상기 단백질의 판별 단편, 또는 상기 임의의 것의 표시물일 수 있다. 여기서, 판별 분자 또는 단편은 검출시에 상기 확인된 전사체, cDNA, 증폭된 핵산, 또는 단백질의 존재 또는 풍부를 지시하는 분자 또는 단편이다. 일부 실시양태에서, 바이오마커 프로필은 각각 표 P에 나열된 프로브세트 콜렉션 중 임의의 하나로부터의 프로브세트를 함유하는 2종 이상, 3종 이상, 4종 이상, 5종 이상, 6종 이상, 7종 이상, 8종 이상, 9종 이상, 또는 10종 이상의 상이한 바이오마커를 포함한다.
Figure 112007081780858-PCT00109
일부 실시양태에서, 단락 5.2 및 단락 5.3에서 각각 기재되거나 언급된 방법 또는 키트는 표 Q에 나열된 바이오마커 세트 중 임의의 하나에 나열된 2종 이상의 상이한 바이오마커를 사용한다. 특정 실시양태에서, 바이오마커 프로필은 표 Q에서의 바이오마커 세트 중 임의의 하나에 나열된 2종 이상의 상이한 바이오마커를 포함한다. 상기 바이오마커 프로필은 표 Q에서의 임의의 바이오마커 세트에 나열된 2종 이상의 상이한 바이오마커에 대한 각각의 상응하는 특성을 추가로 포함한다. 일반적으로, 2종 이상의 바이오마커는 2종 이상의 상이한 유전자로부터 유도된다. 2종 이상의 상이한 바이오마커에서의 바이오마커가 표 Q의 바이오마커 세트 중 임의의 하나에 나열된 것인 경우, 상기 바이오마커는 예를 들어 나열된 유전자에 의해 만들어진 전사체, 그의 상보체, 또는 판별 단편 또는 그의 상보체, 또는 그의 cDNA, 또는 cDNA의 판별 단편, 또는 상기 전사체 또는 그의 상보체의 전부 또는 일부에 상응하는 판별 증폭된 핵산 분자, 또는 상기 유전자에 의해 코딩된 단백질, 또는 상기 단백질의 판별 단편, 또는 상기 임의의 것의 표시물일 수 있다. 추가로, 바이오마커는 예를 들어 표 Q에서의 바이오마커 세트 중 임의의 하나에 나열된 유전자에 의해 코딩된 단백질, 또는 상기 단백질의 판별 단편, 또는 상기 임의의 것의 표시물일 수 있다. 여기서, 판별 분자 또는 단편은 검출시에 상기 확인된 전사체, cDNA, 증폭된 핵산, 또는 단백질의 존재 또는 풍부를 지시하는 분자 또는 단편이다. 상기 실시양태에 따르면, 당업자에게 공지된 임의의 표준 검정 또는 본원에 기재된 검정을 이용하여 본 발명의 바이오마커 프로필을 수득하여 바이오마커를 검출할 수 있다. 이러한 검정은 예를 들어 특정 유전자의 발현 생성물 (예를 들어 핵산 및/또는 단백질) 또는 관심 유전자 (예를 들어 표 Q의 바이오마커 세트 중 임의의 하나에 개시된 유전자)의 대립유전자를 검출할 수 있다. 한 실시양태에서, 이러한 검정은 핵산 미세배열을 이용한다. 일부 실시양태에서, 바이오마커 프로필은 표 Q의 바이오마커 세트 중 임의의 하나로부터의 2종 이상 또는 3종 이상의 상이한 바이오마커를 포함한다.
Figure 112007081780858-PCT00110
6. 실시예
하기 실시예는 본 발명에 포함되는 실시양태를 대표하는 것이며, 본 발명에 포함되는 대상을 제한하려는 것이 아니다. 하기 실시예에서, 데이타는 대상 집단에서의 각 대상으로부터 24시간 간격으로 수집하였다. 집단에는 2가지 대상 유형이 포함되었다. 첫번째 대상 유형은 초기에 SIRS를 가지고, 분석의 마지막 시점에 패혈증이 발병한 유형이다. 두번째 대상 유형은 초기에 SIRS를 가지고, 분석의 마지막 시점에 패혈증이 발병하지 않은 유형이다. SIRS를 가지고 패혈증이 발병된 대상의 경우, T-12 시점은 임상적으로 진단된 패혈증의 발병 직전의 시간의 틀로서 규정하였다. 실무적으로, 각각의 패혈증 대상에 대한 T-12 시점은 패혈증으로 진단되기 전 각각의 대상으로부터 마지막 혈액 샘플이 수집된 날이었다.
각 시점에 대해, 두가지 유형의 분석, 즉 정적 및 기저 분석을 수행하였다. 정적 분석에서는, 단일 시점으로부터의 데이타만을 고려하였다. 특히, 단변량 및/또는 다변량 기술을 사용하여, U133 플러스 2.0 (아피메트릭스, 미국 캘리포니아주 산타 클라라 소재)상에서의 상응하는 미세배열 프로브세트에서의 풍부가 연구 중에 패혈증이 발병된 대상과 패혈증이 발병되지 않은 대상 사이를 판별하는 바이오마커를 확인하였다. 예시를 위해, 집단에서의 두 대상, 즉 시기 T-12 바로 후에 패혈증이 발병된 대상 A 및 관찰된 시점 어디에서도 패혈증이 발병되지 않은 대상 B가 존재하는 경우를 고려하였다. 정적 분석에서, U133 플러스 2.0 미세배열 실험에 의해 결정되는 바와 같이, 두 대상에서 상이한 풍부 수준을 갖는 바이오마커를 확인하기 위해, 특정 단일 시점에서 수집된 두 대상으로부터 얻은 미세배열 바이오마커 풍부 데이타를 평가하였다. 사실상, 본 실시예에서, 유형 A 및 유형 B 대상의 전체 집단을 평가하고 모수적 및/또는 비모수적 통계 기술을 사용하여, 풍부 수준이 관찰 기간 중 일부 시점에서 패혈증이 발병된 대상과 관찰 기간 중 패혈증이 발병되지 않은 대상 사이를 판별해 내는 바이오마커를 확인하였다. 여기서, 관찰 기간은 대개 시간, 일, 또는 주로 표시되는 시기를 의미한다.
정적 분석 이외에, 하기 실시예에서 기저 분석을 수행하였다. 기저 분석에서는, 단일 시점에서의 상응하는 특성 (예를 들어 풍부 수치)이 패혈증 대상 (관찰 시기 중 일부 시점에서 패혈증이 발병된 대상) 및 관찰된 시간의 틀 중 패혈증이 발병되지 않은 대상 사이를 판별해 내는 바이오마커를 확인하는 것이 아니라, 둘 이상의 시점에 따른 풍부 수치에서의 변화가 두 집단 유형을 판별해 내는 바이오마커를 확인하였다. 예를 들어 시기 T-12 바로 후에 패혈증이 발병된 대상 A, 및 관찰된 시점 중 어디에서도 패혈증이 발병되지 않은 대상 B를 다시 고려하였다. 기저 분석에서 필요한 것은 두개의 상이한 시점 (예를 들어 시점 1 및 시점 2)으로부터의 각 대상에 대한 바이오마커 풍부 수치이다. 고려되는 각각의 바이오마커의 경우, 두개의 상이한 시점에서의 바이오마커 풍부의 차이를 계산하였다. 그 후, 각각의 대상으로부터의 이들 풍부 차이를 이용하여, 두개의 상이한 시점에서 차별적으로 발현된 어떠한 상응하는 바이오마커가 관찰 기간 중 패혈증이 발병된 대상과 관찰 기간 중 패혈증이 발병되지 않은 대상 사이를 판별하는지를 결정하였다.
6.1 데이타 수집
ICU에 수용된 SIRS 양성 대상을 연구를 위해 모집하였다. 대상은 18세 이상이었고, 연구 프로토콜에 순응하기로 동의하도록 통지받았다. 대상 중 (i) 임신중인 자, (ii) 의심되는 감염을 치료하기 위해 항생제를 복용중인 자, (iii) 코르티코스테로이드 (연구 진입 전 48시간 내에 총 투여량 100 mg 초과의 히드로코르티손 또는 등가물)를 전신 투여받은 자, (iv) 고용량 코르티코스테로이드 요법이 요구되는 척수 손상 또는 다른 질병을 갖고 있는 자, (v) 약리학적으로 (예를 들어 아자티오프린, 메토트렉세이트, 시클로스포린, 타크롤리무스, 시클로포스파미드, 에타네르셉트, 아나킨라, 인플릭시마브, 류플론아미드, 미코페놀산, OKT3, 펜톡시필린 등) 면역저하된 자, (vi) 기관 이식 수용자, (vii) 활성 또는 전이 암에 걸린 자, (viii) 참여 전 8주 이내에 화학요법 또는 방사선 요법을 받은 자, 및/또는 (ix) 참여 전 30일 이내에 조사에 사용되는 약물을 복용한 자는 연구에서 제외하였다.
상기 연구에서, SIRS 기준을 매일 평가하였다. ICU 승인에 따라 APACHE II 및 SOFA 스코어링을 수행하였다. APACHE II는 의료적 질병의 중증도를 평가하는 시스템이다. APACHE는 "급성 생리학 및 만성 건강 평가"를 나타내며, 집중 관리 유닛 내의 환자에 대한 병원내 사망을 예측하기 위해 가장 빈번하게 사용된다. 예를 들어 본원에 온전히 참고로 포함되는 문헌 [Gupta et al., 2004, Indian Journal of Medical Research 119, 273-282]를 참조한다. SOFA는 패혈증의 중증도를 측정하기 위한 시험이다. 예를 들어 본원에 온전히 참고로 포함되는 문헌 [Vincent et al., 1996, Intensive Care Med. 22, 707-710]을 참조한다. 환자를 2주 이하 동안 매일, 하기 징후 및 증후 중 임의의 것을 포함하나 이에 제한되지 않는 임상적 패혈증 의심사항에 대해 모니터링하였다:
·폐렴: 온도 > 38.3℃ 또는 < 36℃ + 백혈구 개수 (WBC) > 12,000/mm3 또는 < 4,000/mm3 + 화농성 객담의 신규 개시 + 단순 흉부촬영상에서의 신규한 또는 진행된 침윤물 (4개의 조사결과 중 3개);
·상처 감염: 온도 > 38.3℃ 또는 < 36℃ + 통증 + 홍반 + 화농성 분비물 (4개의 조사결과 중 3개);
·요로 감염: 온도 > 38.3℃ 또는 WBC > 12,000/mm3 또는 <4,000/mm3 + 세균뇨 및 고름뇨 (>10 WBC/hpf 또는 양성 백혈구 에스테라제) (모든 조사결과);
·회로(line) 패혈증: 온도 > 38.3℃ 또는 < 36℃ + 카테터 출구 부위에서의 홍반/통증/화농 (발열을 포함하여 4개의 조사결과 중 3개);
·복강내 농양: 온도 > 38.3℃ 또는 < 36℃ + WBC >12,000/mm3 또는 <4,000/mm3 + 유체 수집의 방사선 증거 (3개의 기준 중 2개);
·CNS 감염: 온도 > 38.3℃ 또는 < 36℃ + WBC > 12,000/mm3 또는 <4,000/mm3 + LP 또는 뇌실 배액을 통한 CSF 뇌척수액증가증.
연구 진입 후 24시간 이내에 시작하여 최소한 연속 4일 동안 매일 혈액을 배출시켰다. 감염의 임상적 의심이 발생하지 않는다면 환자를 진행시키고 최소한 연속 14일 동안 매일 혈액 샘플을 배출시켰다. 임의의 한 대상으로부터 배출된 최대 혈액 부피는 최대 14일 연구의 기간에 걸쳐 210 mL를 초과하지 않았다. 혈액 손실이 의사의 판단에 따라 환자에게 위험을 가져온다면 연구를 위한 혈액 배출을 중단시켰다. 각 환자는 각각의 날에 배출된 2개의 팍스젠(Paxgene) (RNA) 튜브를 가졌다. 한 튜브는 단락 6.2에 기재된 미세배열 분석에 사용하였다. 다른 튜브는 단락 6.10에 기재된 RT-PCR 분석에 사용하였다.
6.2 미세배열 분석
RNA를 단락 6.1에 기재된 각 혈액 샘플로부터 추출하고, 표지하고, 역전사시켜 표지된 cDNA를 생성하고, 표지된 cDNA를 54,675개의 프로브세트를 함유하는 아피메트릭스 (미국 캘리포니아주 산타 클라라 소재) U133 플러스 2.0 인간 게놈 칩 에 혼성화하였다. 미세배열의 검출 민감도를 향상시키기 위하여, 예를 들어 2004년 8월 9일자로 출원된 미국 특허 공보 20050221310 및 2004년 9월 24일자로 출원된 10/948,635 (둘의 제목은 모두 "유전자 발현 분석의 향상 방법"이며, 상기 문헌 각각은 그 전문이 본원에 참고로 포함됨)에 기재된 방법을 이용하여 글로빈 mRNA 분자를 혈액 샘플로부터 추출된 총 RNA에서 제거하였다. U133 플러스 2.0은 보충 첨가된 전사체를 측정하는 것과 같이 특정 기능에 대해 고안된 62개 프로브세트를 가졌다. 이는 54,613개의 프로브세트가 인간 유전자의 검출을 위해 특이적으로 고안되도록 하였다. 2개의 미세배열로 이루어진 아피메트릭스 인간 게놈 U133 (HG-U133) 세트는 대략 33,000개의 인간 유전자로부터 유도된 39,000개보다 많은 전사체를 대표하는 거의 45,000개의 프로브세트를 함유한다. 이 세트 고안은 GenBank, dbEST, 및 RefSeq로부터 선택된 서열을 사용한다. 본원에서 사용된 바와 같이, 이들 프로브세트에 결합된 각각의 바이오마커에 대해 측정된 풍부 수치는 특성이라고 언급된다. 하기 실시예에서는 U133 플러스 2.0 인간 게놈 칩에서 특정 프로브세트에 결합된 바이오마커의 풍부 수치가 논의된다.
6.3 정적 T -36 데이타 분석
한 실험에서, T-36 정적 분석을 수행하였다. T-36 정적 분석에서, 바이오마커 특성은 훈련 집단의 각 대상으로부터 얻은 T-36 혈액 샘플을 나타내는 특이적 혈액 샘플을 이용하여 결정하였다. 훈련 집단의 각 대상으로부터 얻은 상기 특이적 혈액 샘플의 정체성은 대상이 SIRS 대상 (관찰 기간 중 패혈증이 발병하지 않음)인지 패혈증 대상 (관찰 기간 중 패혈증이 발병함)인지에 따라 달라졌다. 패혈증 대상의 경우, T-36 샘플은 대상이 패혈증을 얻기 전에 대상으로부터 취한 마지막 혈액 샘플에서 두번째로 정의하였다. SIRS 대상이 패혈증이 되는 유의한 사건이 없었기 때문에, 훈련 집단 중 SIRS 대상에서의 T-36 샘플의 확인은 패혈증인 상대 대상에서보다 더욱 자유재량적이었다. 이 때문에, 훈련 집단 중 패혈증 대상에 대한 T-36 샘플의 정체성을 이용하여 훈련 집단 중 SIRS 대상에서의 T-36 샘플을 확인하였다. 구체적으로, 훈련 집단에서 SIRS 대상에 대한 T-36 시점 (혈액 샘플)은 패혈증 대상 및 SIRS 대상을 "시간에 따라 매칭"함으로써 확인하였다. 예를 들어 연구에 참여된 대상이 참여 제6일에 패혈증이라고 임상적으로 규정된 경우를 고려하였다. 이 대상의 경우, T-36은 연구의 넷째날이고, T-36 혈액 샘플은 연구의 제4일에 얻은 혈액 샘플이다. 마찬가지로, 상기 패혈증 대상에 매칭되는 SIRS 대상에 대한 T-36은 상기 짝지어진 SIRS 대상에서의 연구의 넷째날이 된다고 여겨진다.
SIRS 대상이 패혈증 발병으로 진행되지 않았더라도, 이들은 시간에 따라 이들의 발현된 유전자 (및 단백질 등)에서 변화를 가졌다. 따라서, SIRS 대상으로부터의 T-36 혈액 샘플의 관련 세트를 얻기 위한 패혈증과 SIRS 대상의 일대일 시간 매칭은 상기 기재된 방식으로 추구하였다. 패혈증으로 진행된 대상이 다양한 속도로 그렇게 된 것과 같이, 상기 시간 매칭은 SIRS 대상에서의 특성 변화성을 모방하도록 행해졌다. 일부의 경우에서, 자의적인 쌍의 SIRS와 패혈증 대상 사이의 시간 매칭을 행하여 훈련 집단에서의 가능한 한 많은 SIRS 대상에 대해 T-36 혈액 샘플을 확인할지라도, SIRS 대상으로부터의 T-36 샘플은 샘플 유용성을 기준으로 하는 시점에서 선택되어야만 했다.
T-36 정적 분석의 경우, 84개의 상이한 대상으로부터 얻은 총 84개의 상응하는 미세배열 실험에 대한 84개의 샘플에서 측정된 54,613개의 바이오마커가 존재하였다. 84개 대상의 집단에서의 상이한 대상으로부터 각 샘플을 수집하였다. 각 미세배열 실험에서 측정된 54,613개의 프로브세트 중에서, 30,464개가 로그 변환에 의해 변환되었다. 로그 변환은 문헌 [Draghici, 2003, Data Analysis Tools for DNA Microarrays, Chapman & Hall/CRC, Boca Raton, pp. 309-311]에 기재되어 있으며, 상기 문헌은 전문이 본원에 참고로 포함된다. 추가로, 각 미세배열 실험에서의 54,613개의 프로브세트 중에서, 2317개가 제곱근 변환에 의해 변환되었다. 제곱근 변환은 문헌 [Ranidas, 2001, Genome Biology 2, 47.1-47.7]에 기재되어 있으며, 상기 문헌은 그 전문이 본원에 참고로 포함된다. 각 미세배열 실험에서 남아 있는 21,832개 프로브세트는 변환되지 않았다.
84개의 구성원 집단을 초기에 훈련 세트 (n = 64) 및 검증 세트 (n = 20)로 분류하였다. 훈련된 알고리즘을 검증 세트에 적용하여 독립적으로 성능을 평가하는 동안, 상기 훈련 세트를 이용하여 적절한 분류 알고리즘 파라미터를 추정하였다. 64개 훈련 샘플 중, 35개가 패혈증이었고, 이는 상기 대상이 관찰 시기 동안의 몇몇 시점에서 패혈증이 발병되었음을 의미하며, 29개가 SIRS이었고, 이는 이들 이 관찰 시기 동안 패혈증이 발병되지 않았음을 의미한다. 표 1은 이들 샘플의 인종, 성별 및 연령의 분포를 제공한다.
Figure 112007081780858-PCT00111
20개 검증 샘플의 경우, 9개가 패혈증이었고 11개가 SIRS이었다. 표 2는 이들 샘플의 인종, 성별 및 연령의 분포를 제공한다.
Figure 112007081780858-PCT00112
훈련 데이타에서의 각 샘플을 교차 검증에 사용되는 10개 군 중 하나에 무작위로 배정하였다. 이들 군에서의 훈련 샘플의 수는 6 내지 7의 범위였다. 샘플을 패혈증 및 SIRS 샘플의 수를 배수로 맞추려는 방식으로 배정하였다. 하기에 보다 상세히 기재하는 바와 같이, 몇가지 상이한 방법을 사용하여, 미세배열에서의 특정 프로브세트에 결합하는 선별 바이오마커가 패혈증 군과 SIRS 군 사이를 판별하는지의 여부를 판단하였다.
윌콕슨 및 Q값 시험. 판별 바이오마커를 확인하기 위해 사용된 첫번째 방법은 윌콕슨 시험 (비수정)이었다. 윌콕슨 시험은 극한 수치에 대해 저항성인 분포-부재 시험이다. 윌콕슨 시험은 문헌 [Agresti, 1996, An Introduction to categorical Data Analysis, John Wiley & Sons, Inc, New York, Chapter 2]에 기재되어 있으며, 상기 문헌은 그 전문이 본원에 참고로 포함된다. 윌콕슨 시험은 p값을 생성한다. 훈련 데이타의 모든 샘플로부터의 주어진 바이오마커에 대한 풍부 수치를 윌콕슨 시험에 적용시켰다. 윌콕슨 시험은 주어진 바이오마커에 대한 p값을 계산하기 위하여 군 분류 (패혈증 대 SIRS) 및 풍부 수치 둘 다를 고려하였다. p값은 훈련 세트에서 수집된 샘플 전반에서의 주어진 바이오마커에 대한 풍부 수치가 패혈증 및 SIRS 상태를 얼마나 잘 판별하는지를 나타내 준다. p값이 특정 신뢰도 수준, 예를 들어 0.05 미만인 경우, 바이오마커는 패혈증과 SIRS 사이를 판별한다는 결론이 얻어졌다. 상기 방법을 이용하여 9520개의 유의한 바이오마커가 존재하였다 (표 3 참조).
판별 바이오마커를 확인하기 위해 사용되는 두번째 방법은 윌콕슨 시험 (수정)이었다. 54613개라는 큰 수의 바이오마커 및 84라는 상대적으로 작은 수의 샘플 때문에, 유의한 바이오마커를 허위로 찾을 위험이 높았다. 수정된 p-값을 사용하여 상기 위험을 계수하였다. 특히, 전문이 본원에 참고로 포함되는 문헌 [Benjamini and Hochberg, 1995, J.R. Statist. Soc. B 57, pp 289-300]의 방법을 사용하여 허위 발견 비율을 제어하였다. 여기서, 허위 발견 비율은 진실로 유의한 바이오마커의 수를 유의하다고 선언된 바이오마커의 수로 나눈 것으로 정의된다. 예를 들어 수정 p-값이 0.05 미만인 경우, 바이오마커가 허위로 발견될 확률은 5%이다. 상기 시험을 이용한 결과를 표 3에 보고한다. 상기 방법을 이용하여 1618개의 유의한 바이오마커가 존재하였다 (표 3 참조). 본원에 사용된 바이오마커는 바이오마커에 상응하는 특성 수치가 윌콕슨 시험 (수정)으로 결정했을 때 0.05 미만의 p-값을 갖는 경우 유의하다고 여겨진다.
판별 바이오마커를 확인하기 위해 사용되는 세번째 방법은 Q값을 사용하는 것이다. Q값은 문헌 [Storey, 2002, J.R. Statist. Soc. B 64, Part 3, pp. 479-498]에 기재되어 있고, 상기 문헌은 그 전문이 본원에 참고로 포함된다. 바이오마커는 그의 Q값 순으로 배열되며, 바이오마커가 X의 Q값을 갖는다면, 상기 바이오마커 및 보다 유의한 모든 다른 것은 X라는 복합 허위 발견 비율을 갖는다. 그러나, 어떤 한 바이오마커에 대한 허위 발견 비율은 훨씬 커질 수 있다. 상기 방법을 이용하여 2431개의 유의한 마커가 존재하였다 (표 3 참조).
Figure 112007081780858-PCT00113
CART. 훈련 세트에서 패혈증과 SIRS 하위집단 사이를 판별하는 바이오마커를 확인하기 위하여 윌콕슨 시험 및 Q값 시험을 사용하는 미세배열 데이타를 분석하는 것 이외에, 분류 및 회귀계통도 (CART) 분석을 사용하였다. CART는 상기 단락 5.5.1에 기재되어 있다. 구체적으로, 상기 요약된 데이타를 사용하여 데이타의 최상의 단일-가변성 (훈련 세트 전반에서의 바이오마커의 특성) 분리를 바탕으로 데이타를 반복적으로 분배함으로써 질환 상태를 예측하였다. 즉, 계통도 수립 과정의 각 단계에서, 훈련 집단 전반에서의 풍부 수치가 패혈증과 SIRS 집단 사이를 가장 잘 판별하는 바이오마커를 의사결정 분기점으로서 실시하였다. 10회 반복의 각각에서 독립적으로 추정되는 최적수의 분리로 교차 검증을 수행하였다. 최종 계통도를 도 1에 도시하였다. 도 1에서, 의사결정 102는 X204319_s_at에 결합하는 바이오마커의 풍부를 바탕으로 의사결정을 하게 한다. X204319_s_at에 결합하는 바이오마커가 진단될 대상으로부터의 생물학적 샘플 (시험 생물학적 샘플)에서 2.331 단위 초과의 풍부를 갖는다면, 대조군은 의사결정 104로 넘어간다. 반면에, 시험 생물학적 샘플에서 프로브세트 X204319_s_at에 결합된 바이오마커가 2.331 단위 미만의 풍부를 갖는다면, 의사결정 대조군은 의사결정 106으로 넘어간다. 의사결정계통도의 마지막 잎에 도달할 때까지 이러한 방식으로 의사결정을 수행하였고, 마지막 잎에 도달시 패혈증 또는 SIRS를 진단하였다. 도 1의 의사결정계통도는 하기 5개의 프로브세트: X204319_s_at, X1562290_at, X1552501_a_at, X1552283_s_at, 및 Xl 17_at에 결합된 바이오마커를 사용하였다.
도 2는 훈련 데이타 세트에서 패혈증과 SIRS 군 사이의 의사결정계통도에 사용된 5개의 프로브세트에 결합된 바이오마커의 분포를 나타낸다. 도 2에서, 각 박스의 최상부는 훈련 세트 전반에서의 데이타의 75번째 백분위수를 나타내고, 각 박스의 최하부는 25번째 백분위수를 나타내고, 훈련 세트 전반에서의 각 바이오마커에 대한 중앙 수치는 각 박스 내의 선으로 표현하였다. 교차 검증된 모델로부터 예측된 분류를 행한 훈련 데이타에서의 혼동 행렬을 표 4에 제시하였다. 상기 혼동 행렬로부터, 전체적인 정확도는 57.6% 내지 81.1%의 95% 신뢰 구간에서 70.3%인 것으로 추정되었다. 추정된 민감도는 60%이었고, 추정된 특이도는 82.8%이었다.
Figure 112007081780858-PCT00114
훈련 데이타 세트로부터 수집한 20개의 검증 샘플의 경우, 전체적인 정확도은 45.7% 내지 88.1%의 95% 신뢰 구간에서 70%인 것으로 추정되었고, 민감도 88.9% 및 특이도 54.5%로 추정되었다. 표 5는 검증 샘플에 대한 혼동 행렬을 나타낸다.
Figure 112007081780858-PCT00115
랜덤 포레스트. 본 발명의 바이오마커를 이용하여 개발될 수 있는 또다른 의사결정 규칙은 랜덤 포레스트 의사결정계통도이다. 랜덤 포레스트는 교차 검증 대신에 부트스트랩을 이용하는 방법을 바탕으로 하는 계통도이다. 각 반복에서, 무작위 샘플 (치환 있음)을 뽑고, 가능한 가장 큰 계통도를 성장시켜다. 각 계통도는 최종 클래스 예측에서 표를 받았다. 랜덤 포레스트를 적합하게 하기 위하여, 계통도의 수 (예를 들어 부트스트랩 반복)를 특정하였다. 본 실시예에서는 500 이하를 사용하였으나 번-인(burn-in) 기간에는 50 이상이 요구된다. 훈련 데이타의 정확도를 기준으로 계통도의 수를 선택하였다. 상기 데이타의 경우, 500개의 계통도를 사용하여 알고리즘을 훈련하였다 (도 3 참조). 도 3에서, 곡선 302는 계통도 수의 함수로서 전체적인 정확도의 완만한 추정치이다. 곡선 304는 계통도 수의 함수로서 계통도 민감도의 완만한 곡선이다. 곡선 306은 계통도 수의 함수로서 계통도 특이도의 완만한 곡선이다. 상기 알고리즘을 이용하여, 901개의 바이오마커가 비-영점 중요도를 가졌고, 모델에 사용되었다. 랜덤 포레스트 알고리즘은 훈련 정확도에서의 평균 환산에 의해 바이오마커 중요도를 측정하였다. 바이오마커는 상기 방법에 의해 순위매겨지며, 도 4에 나타나 있다. 도 4에서, 바이오마커는 이들이 결합하는 U133 플러스 2.0 프로브세트의 이름으로 표지되었다. 상기 도 4는 단지 랜덤 포레스트 분석을 이용하여 밝혀진 50개의 가장 중요한 바이오마커를 반영할 뿐이다. 그러나, 실제로 901개의 바이오마커가 판별 유의성을 갖는다고 밝혀졌다. 랜덤 포레스트 방법은 수많은 상이한 의사결정계통도를 갖는다. 바이오마커가 유의한 랜덤 포레스트 분석으로부터의 의사결정계통도의 의사결정 분기점으로서 작용한다면, 상기 바이오마커는 판별 유의성을 갖는 것으로 여겨진다. 본원에서 사용된 바와 같이, 유의한 랜덤 포레스트 분석은 훈련 데이타 세트에서의 교차 검증에 의한 정확도에서 하위 95% 신뢰 구간이 50%를 초과하고, 검증 세트에서의 정확도에 대한 점 추정이 65%를 초과하는 것이다.
랜덤 포레스트 방법을 이용하여 개발된 의사결정계통도를 이용한 훈련 데이타세트에 대한 예측된 혼동 행렬을 표 6에 제시한다. 상기 혼동 행렬로부터, 전체적인 정확도는 68.8%인 것으로 추정되었다 (부트스트랩 정확도 추정을 이용했을 때 신뢰 구간은 계산할 수 없었음). 추정된 민감도는 74.3%이었고, 추정된 특이도는 62.1%이었다.
Figure 112007081780858-PCT00116
훈련으로부터 수집한 20개의 검증 샘플의 경우, 전체적인 정확도는 40.8% 내지 84.6%의 95% 신뢰 구간에서 65%인 것으로 추정되었고, 민감도 66.7% 및 특이도 63.6%로 추정되었다. 표 7은 검증 샘플에 대한 혼동 행렬을 나타낸다.
Figure 112007081780858-PCT00117
PAM. 본 발명의 바이오마커를 사용하여 개발된 또다른 의사결정 규칙은 미세배열의 예측 분석 (PAM)이며, 이는 상기 단락 5.5.2에 기재되어 있다. 상기 방법에서는, 샘플을 분류하기 위해 사용된 바이오마커의 수를 결정하는 수축 파라미터를 특정하였다. 상기 파라미터를 교차 검증을 통해 선택하였다. 소실된 바이오마커는 존재하지 않았다. 교차 검증을 바탕으로 할 때, 최적의 역치 수치는 258개의 바이오마커에 상응하는 2.07이었다. 도 5는 상이한 역치 전반에서의 정확도를 나타낸다. 도 5에서, 곡선 502는 전체적인 정확도이다 (95% 신뢰 구간 막대를 가짐). 곡선 504는 역치 수치의 함수로서 의사결정 규칙 민감도를 나타낸다. 곡선 506은 역치 수치의 함수로서 의사결정 규칙 특이도를 나타낸다. 2.07의 역치를 이용하여, 훈련 샘플에 대한 전체적인 정확도는 61.4% 내지 82.8%의 95% 신뢰 구간에서 73.4%인 것으로 추정되었다. 추정된 민감도는 79.3%이었고, 추정된 특이도는 68.6%이었다.
Figure 112007081780858-PCT00118
훈련으로부터 수집한 20개의 검증 샘플의 경우, 전체적인 정확도는 45.7% 내지 88.1%의 95% 신뢰 구간에서 70%인 것으로 추정되었고, 민감도 66.7% 및 특이도 63.6%로 추정되었다. 표 9는 검증 샘플에 대한 혼동 행렬을 나타낸다.
Figure 112007081780858-PCT00119
도 6은 바이오마커의 상대적인 판별력에 의해 순위매겨진 선택된 바이오마커 및 모델에서의 그의 상대적인 중요도를 나타낸다. 도 6은 단지 PAM 분석을 이용하여 발견된 50개의 가장 중요한 바이오마커만을 나타낸다. 그러나, 258개의 중요한 바이오마커가 발견되었다. 도 6에서의 바이오마커는 이들이 결합된 U133 플러스 2.0 프로브세트를 바탕으로 표지하였다.
도 7은 CART, PAM, 및 랜덤 포레스트 분류 알고리즘 (의사결정 규칙) 성능 및 연합된 95% 신뢰 구간의 요약을 제공한다. 도 7에 예시된 모든 알고리즘으로부터 50개의 별개의 바이오마커를 선택하였다. 도 8은 공통적인 바이오마커가 윌콕슨 (수정), CART, PAM, 및 RF의 기술에 결쳐 선택된 횟수를 예시한다. 도 9는 T-36 데이타 세트에 대한 바이오마커의 전체적인 순위를 예시한다. 선택된 바이오마커의 경우, x-축은 선택된 횟수의 백분율을 도시한다. 바이오마커가 선택된 횟수의 백분율 내에서, 바이오마커를 순위매겼다. 도 7에서의 바이오마커는 이들이 결합된 프로브세트 (올리고뉴클레오티드 정체성)를 바탕으로 표지하였다.
6.4 정적 T -I2 데이타 분석
또다른 실험에서, T-12 정적 분석을 수행하였다. T-12 정적 분석에서, 바이오마커 특성은 훈련 집단의 각 대상으로부터 얻은 T-12 혈액 샘플을 나타내는 특이적 혈액 샘플을 이용하여 측정하였다. 훈련 집단의 주어진 대상으로부터 얻은 상기 특이적 혈액 샘플의 정체성은 대상이 SIRS 대상 (관찰 기간 중 패혈증이 발병하지 않음)인지 패혈증 대상 (관찰 기간 중 패혈증이 발병함)인지에 따라 달라졌다. 패혈증 대상의 경우, T-12 샘플은 대상이 패혈증을 얻기 전에 대상으로부터 취한 마지막 혈액 샘플로 정의하였다. SIRS 대상이 패혈증이 되는 유의한 사건이 없었기 때문에, 훈련 집단 중 SIRS 대상에서의 T-36 샘플의 확인은 패혈증인 상대 대상에서보다 더욱 자유재량적이었다. 이 때문에, 훈련 집단 중 패혈증 대상에 대한 T-12 샘플의 정체성을 이용하여 훈련 집단 중 SIRS 대상에서의 T-12 샘플을 확인하였다. 구체적으로, 훈련 집단에서 SIRS 대상에 대한 T-12 시점 (혈액 샘플)은 패혈증 대상 및 SIRS 대상을 "시간에 따라 매칭"함으로써 확인하였다. 예를 들어 연구에 참여된 대상이 참여 제6일에 패혈증이라고 임상적으로 규정된 경우를 고려하였다. 이 대상의 경우, T-12는 연구의 다섯째날 (패혈증 이전의 1-24시간)이고, T-12 혈액 샘플은 연구의 제5일에 얻은 혈액 샘플이다. 마찬가지로, 상기 패혈증 대상에 매칭되는 SIRS 대상에 대한 T-12는 상기 짝지어진 SIRS 대상에서의 연구의 다섯째날이 된다고 여겨진다. 일부의 경우에서, 자의적인 쌍의 SIRS와 패혈증 대상 사이의 시간 매칭을 행하여 훈련 집단에서의 가능한 한 많은 SIRS 대상에 대해 T-12 혈액 샘플을 확인할지라도, SIRS 대상으로부터의 T-12 샘플은 샘플 유용성을 기준으로 하는 시점에서 선택되어야만 했다.
T-12 정적 분석의 경우, 90개의 상이한 대상으로부터 얻은 총 90개의 상응하는 미세배열 실험에 대한 90개의 샘플에서 측정된 54,613개의 바이오마커가 존재하였다. 집단의 상이한 구성원으로부터 각 샘플을 수집하였다. 각 미세배열 실험에서 측정된 54,613개의 프로브세트 중에서, 31,047개가 로그 변환에 의해 변환되었다. 추가로, 각 미세배열 실험에서의 54,613개의 프로브세트 중에서, 2518개가 제곱근 변환에 의해 변환되었다. 각 미세배열 실험에서 남아 있는 21,048개 프로브세트는 변환되지 않았다.
90개의 구성원 집단을 초기에 훈련 세트 (n = 69) 및 검증 세트 (n = 21)로 분류하였다. 훈련된 알고리즘을 검증 세트에 적용하여 독립적으로 성능을 평가하는 동안, 상기 훈련 세트를 이용하여 적절한 분류 알고리즘 파라미터를 추정하였다. 69개 훈련 샘플 중, 34개가 패혈증으로 표지되었고, 이는 상기 대상이 관찰 시기 동안의 몇몇 시점에서 패혈증이 발병되었음을 의미하며, 35개가 SIRS이었고, 이는 이들이 관찰 시기 동안 패혈증이 발병되지 않았음을 의미한다. 표 10은 이들 샘플의 인종, 성별 및 연령의 분포를 제공한다.
Figure 112007081780858-PCT00120
21개의 검증 샘플에 대해, 11개가 패혈증으로 표지되었고, 10개가 SIRS로 표지되었다. 표 11은 이들 샘플의 인종, 성별 및 연령의 분포를 제공한다.
Figure 112007081780858-PCT00121
훈련 데이타에서의 각 샘플을 교차 검증에 사용되는 10개 군 중 하나에 무작위로 배정하였다. 이들 군에서의 훈련 샘플의 수는 6 내지 8의 범위였다. 샘플을 패혈증 및 SIRS 샘플의 수를 배수로 맞추려는 방식으로 배정하였다. 하기에 보다 상세히 기재하는 바와 같이, 몇가지 상이한 방법을 사용하여, 선별 바이오마커가 패혈증 군과 SIRS 군 사이를 판별하는지의 여부를 판단하였다.
윌콕슨 및 Q-값 시험. 판별 바이오마커를 확인하기 위해 사용된 첫번째 방법은 윌콕슨 시험 (비수정)이었다. 훈련 데이타의 모든 샘플로부터의 주어진 바이오마커에 대한 풍부 수치를 윌콕슨 시험에 적용시켰다. 윌콕슨 시험은 주어진 바이오마커에 대한 p값을 계산하기 위하여 군 분류 (패혈증 대 SIRS) 및 풍부 수치 둘 다를 고려하였다. p값은 훈련 세트에서 수집된 샘플 전반에서의 주어진 바이오마커에 대한 풍부 수치가 패혈증 및 SIRS 상태를 얼마나 잘 판별하는지를 나타내 준다. p값이 낮을수록, 판별이 더욱 양호한 것이다. p값이 특정 신뢰도 수준, 예를 들어 0.05 미만인 경우, 바이오마커는 패혈증과 SIRS 사이를 판별한다는 결론이 얻어졌다. 상기 방법을 이용하여 19,791개의 유의한 바이오마커가 존재하였다 (표 12 참조).
판별 바이오마커를 확인하기 위해 사용되는 두번째 방법은 윌콕슨 시험 (수정)이었다. 54613개라는 큰 수의 바이오마커 및 90이라는 상대적으로 작은 수의 샘플 때문에, 유의한 바이오마커를 허위로 찾을 위험이 높았다. 수정된 p-값을 사용하여 상기 위험을 계수하였다. 특히, 전문이 본원에 참고로 포함되는 문헌 [Benjamini and Hochberg, 1995, J.R. Statist. Soc. B 57, pp 289-300]의 방법을 사용하여 허위 발견 비율을 제어하였다. 여기서, 허위 발견 비율은 진실로 유의한 바이오마커의 수를 유의하다고 선언된 바이오마커의 수로 나눈 것으로 정의된다. 예를 들어 수정 p-값이 0.05 미만인 경우, 바이오마커가 허위로 발견될 확률은 5%이다. 상기 시험을 이용한 결과를 표 12에 보고한다. 상기 방법을 이용하여 11851개의 유의한 바이오마커가 존재하였다 (표 12 참조). 본원에 사용된 바이오마커는 바이오마커에 상응하는 특성 수치가 윌콕슨 시험 (수정)으로 결정했을 때 0.05 미만의 p-값을 갖는 경우 유의하다고 여겨진다.
판별 바이오마커를 확인하기 위해 사용되는 세번째 방법은 Q값을 사용하는 것이다. 상기 접근법에서, 바이오마커는 그의 Q값 순으로 배열되며, 각각의 바이오마커가 X의 Q값을 갖는다면, 상기 각각의 바이오마커 및 보다 유의한 모든 다른 것은 X라는 복합 허위 발견 비율을 갖는다. 그러나, 어떤 한 바이오마커에 대한 허위 발견 비율은 훨씬 커질 수 있다. 상기 방법을 이용하여 11851개의 유의한 마커가 존재하였다 (표 12 참조).
Figure 112007081780858-PCT00122
CART. 훈련 세트에서 패혈증과 SIRS 하위집단 사이를 판별하는 바이오마커를 확인하기 위하여 윌콕슨 시험 및 Q값 시험을 사용하는 미세배열 데이타를 분석하는 것 이외에, 분류 및 회귀계통도 (CART) 분석을 사용하였다. CART는 상기 단락 5.5.1에 기재되어 있다. 구체적으로, 상기 요약된 데이타를 사용하여 데이타의 최상의 단일-가변성 분리를 바탕으로 데이타를 반복적으로 분배함으로써 질환 상태를 예측하였다. 즉, 계통도 수립 과정의 각 단계에서, 훈련 집단 전반에서의 풍부 수치가 패혈증과 SIRS 집단 사이를 가장 잘 판별하는 바이오마커를 의사결정 분기점으로서 실시하였다. 10회 반복의 각각에서 독립적으로 추정되는 최적수의 분리로 교차 검증을 수행하였다. 최종 계통도를 도 10에 도시하였다. 도 10에서, 의사결정 1002는 X214681_at에 결합하는 바이오마커의 풍부를 바탕으로 의사결정을 하게 한다. 바이오마커 X214681_at가 진단될 대상으로부터의 생물학적 샘플 (시험 생물학적 샘플)에서 7.862 단위 초과의 풍부를 갖는다면, 대조군은 의사결정 1004로 넘어간다. 반면에, 프로브세트 X214681_at에 결합된 바이오마커가 시험 생물학적 샘플에서 7.862 단위 미만의 풍부를 갖는다면, 의사결정 대조군은 의사결정 1006으로 넘어간다. 의사결정계통도의 마지막 잎에 도달할 때까지 이러한 방식으로 의사결정을 수행하였고, 마지막 잎에 도달시 패혈증 또는 SIRS를 진단하였다. 도 10의 의사결정계통도는 하기 4개의 프로브세트: X214681_at, X1560432_at, X230281_at, 및 X1007_s_at에 결합된 바이오마커를 사용하였다.
도 11은 훈련 데이타 세트에서 패혈증과 SIRS 군 사이의 의사결정계통도에 사용된 4개의 프로브세트에 결합된 바이오마커의 분포를 나타낸다. 도 11에서, 각 박스의 최상부는 훈련 세트 전반에서의 데이타의 75번째 백분위수를 나타내고, 각 박스의 최하부는 25번째 백분위수를 나타내고, 훈련 세트 전반에서의 각 바이오마커에 대한 중앙 수치는 각 박스 내의 선으로 표현하였다. 바이오마커는 이들이 결합된 U133 플러스 2.0 프로브의 정체성을 바탕으로 도 11에 표지되었다. 교차 검증된 모델로부터 예측된 분류를 행한 훈련 데이타에서의 혼동 행렬을 표 13에 제시하였다. 상기 혼동 행렬로부터, 전체적인 정확도는 52.8% 내지 76.3%의 95% 신뢰 구간에서 65.2%인 것으로 추정되었다. 추정된 민감도는 61.8%이었고, 추정된 특이도는 68.6%이었다.
Figure 112007081780858-PCT00123
훈련으로부터 수집한 21개의 검증 샘플의 경우, 전체적인 정확도는 47.8% 내지 88.7%의 95% 신뢰 구간에서 71.4%인 것으로 추정되었고, 민감도 90.9% 및 특이도 50%로 추정되었다. 표 14는 검증 샘플에 대한 혼동 행렬을 나타낸다.
Figure 112007081780858-PCT00124
랜덤 포레스트. 본 발명의 바이오마커를 이용하여 개발될 수 있는 또다른 의사결정 규칙은 랜덤 포레스트 의사결정계통도이다. 랜덤 포레스트는 교차 검증 대신에 부트스트랩을 이용하는 방법을 바탕으로 하는 계통도이다. 각 반복에서, 무작위 샘플 (치환 있음)을 뽑고, 가능한 가장 큰 계통도를 성장시켜다. 각 계통도는 최종 클래스 예측에서 표를 받았다. 랜덤 포레스트를 적합하게 하기 위하여, 계통도의 수 (예를 들어 부트스트랩 반복)를 특정하였다. 본 실시예에서는 500 이하를 사용하였으나 번-인 기간에는 50 이상이 요구된다. 훈련 데이타의 정확도를 기준으로 계통도의 수를 선택하였다. 상기 데이타의 경우, 439개의 계통도를 사용하여 알고리즘을 훈련하였다 (도 12 참조). 도 12에서, 곡선 1202는 계통도 수의 함수로서 전체적인 정확도의 완만한 추정치이다. 곡선 1204는 계통도 수의 함수로서 계통도 민감도의 완만한 곡선이다. 곡선 1206은 계통도 수의 함수로서 계통도 특이도의 완만한 곡선이다. 상기 알고리즘을 이용하여, 845개의 바이오마커가 비-영점 중요도를 가졌고, 모델에 사용되었다. 랜덤 포레스트 알고리즘은 훈련 정확도에서의 평균 환산에 의해 바이오마커 중요도를 측정하였다. 바이오마커는 상기 방법에 의해 순위매겨지며, 도 13에 나타나 있다. 상기 도 13은 단지 랜덤 포레스트 분석을 이용하여 밝혀진 50개의 가장 중요한 바이오마커를 반영할 뿐이다. 그러나, 실제로 845개의 바이오마커가 판별 유의성을 갖는다고 밝혀졌다. 랜덤 포레스트 방법은 수많은 상이한 의사결정계통도를 사용한다. 바이오마커가 유의한 랜덤 포레스트 분석으로부터의 의사결정계통도의 의사결정 분기점으로서 작용한다면, 상기 바이오마커는 판별 유의성을 갖는 것으로 여겨진다. 본원에서 사용된 바와 같이, 유의한 랜덤 포레스트 분석은 훈련 데이타 세트에서의 교차 검증에 의한 정확도에서 하위 95% 신뢰 구간이 50%를 초과하고, 검증 세트에서의 정확도에 대한 점 추정이 65%를 초과하는 것이다.
랜덤 포레스트 방법을 이용하여 개발된 의사결정계통도를 이용한 훈련 데이타세트에 대한 예측된 혼동 행렬을 표 15에 제시한다. 상기 혼동 행렬로부터, 전체적인 정확도는 75.4%인 것으로 추정되었다 (부트스트랩 정확도 추정을 이용했을 때 신뢰 구간은 계산할 수 없었음). 추정된 민감도는 73.5%이었고, 추정된 특이도는 77.1%이었다.
Figure 112007081780858-PCT00125
훈련으로부터 수집한 21개의 검증 샘플의 경우, 전체적인 정확도는 76.2% 내지 99.9%의 95% 신뢰 구간에서 95.2%인 것으로 추정되었고, 민감도 100% 및 특이도 90%로 추정되었다. 표 16은 검증 샘플에 대한 혼동 행렬을 나타낸다.
Figure 112007081780858-PCT00126
MART. "구배 부스팅 기계"로도 알려진 다중 가법 회귀계통도 (MART)를 사용하여 동시적으로 바이오마커의 중요도를 평가하고 대상 샘플을 분류하였다. 상기 접근법에서는 (i) 계통도의 수, (ii) 단계 크기 (통상적으로는 "수축"으로 언급됨), 및 (iii) 상호작용의 정도 (각 계통도에 대한 분리의 수와 연관됨)를 비롯한 몇몇 맞춤 파라미터를 특정하였다. MART에 대한 더 많은 정보는 상기 단락 5.5.4에 기재되어 있다. 상호작용의 정도는 1로 설정하여 가법 모델을 실시하였다 (예를 들어 각 계통도는 하나의 분리를 갖고, 단지 하나의 바이오마커만을 사용함).
상호작용을 추정하는 것은 보다 양호한 기능을 위하여 더 많은 데이타를 요구할 수 있다. 모델 복잡성이 계통도의 수로 구술되도록 단계 크기를 0.05로 설정하였다. 각 맞춤 반복에서 경우들의 무작위 서브세트를 제외한 후, 상기 서브세트에서의 예측의 질을 평가함으로써 최적의 수의 계통도를 추정하였다. 더 많은 계통도의 맞춤을 보증한 후에, 예측된 성능이 개선을 중지시킨 점을 최적점으로 추정하였다.
추정된 모델은 모든 계통도에 걸쳐 28개 계통도 및 17개 바이오마커를 사용하였다. MART 알고리즘은 또한 바이오마커 중요도 (합계 100%)의 산출을 제공하며, 이를 도 14에 제시하였다. 중요도가 영인 바이오마커를 배제하였다. 도 14에서, 바이오마커를 이들이 결합된 U133 플러스 2.0 올리고뉴클레오티드로 표지하였다. 도 15는 패혈증과 SIRS 군 사이의 선택된 바이오마커의 분포를 나타낸다. 도 15에서, 바이오마커를 이들이 결합된 U133 플러스 2.0 올리고뉴클레오티드로 표지하였다.
10회 반복 각각에서 독립적으로 추정된 계통도의 최적의 수를 이용하여 교차 검증을 수행하였다. 교차 검증 모델로부터 예측된 분류를 수행한 훈련 데이타에 대한 혼동 행렬을 표 17에 제시하였다. 전체적인 정확도는 65.1% 내지 86.1%의 95% 신뢰 구간에서 76.8%인 것으로 추정되었다. 추정된 민감도는 76.5%이었고, 추정된 특이도는 77.1%이었다.
Figure 112007081780858-PCT00127
훈련으로부터 수집한 21개의 검증 샘플의 경우, 전체적인 정확도는 63.7% 내지 97%의 95% 신뢰 구간에서 85.7%인 것으로 추정되었고, 민감도 80% 및 특이도 90.9%로 추정되었다. 표 18은 검증 샘플에 대한 혼동 행렬을 나타낸다.
Figure 112007081780858-PCT00128
PAM. 본 발명의 바이오마커를 사용하여 개발된 또다른 의사결정 규칙은 미세배열의 예측 분석 (PAM)이며, 이는 상기 단락 5.5.2에 기재되어 있다. 상기 방법에서는, 샘플을 분류하기 위해 사용된 바이오마커의 수를 결정하는 수축 파라미터를 특정하였다. 상기 파라미터를 교차 검증을 통해 선택하였다. 소실된 바이오마커는 존재하지 않았다. 교차 검증을 바탕으로 할 때, 최적의 역치 수치는 820개의 바이오마커에 상응하는 2.1이었다. 도 16은 상이한 역치 전반에서의 정확도를 나타낸다. 도 16에서, 곡선 1602는 전체적인 정확도이다 (95% 신뢰 구간 막대를 가짐). 곡선 1604는 역치 수치의 함수로서 의사결정 규칙 민감도를 나타낸다. 곡선 1606은 역치 수치의 함수로서 의사결정 규칙 특이도를 나타낸다. 2.1의 역치를 이용하여, 훈련 샘플에 대한 전체적인 정확도는 73.4% 내지 86.7%의 95% 신뢰 구간에서 80.9%인 것으로 추정되었다. 추정된 민감도는 85.7%이었고, 추정된 특이도는 76.5%이었다. 표 19는 예측된 분류가 교차 검증 모델로부터 얻어지는 훈련 데이타에 대한 혼동 행렬을 나타낸다.
Figure 112007081780858-PCT00129
훈련으로부터 수집한 21개의 검증 샘플의 경우, 전체적인 정확도는 76.2% 내지 99.9%의 95% 신뢰 구간에서 95.2%인 것으로 추정되었고, 민감도 100% 및 특이도 90%로 추정되었다. 표 20은 검증 샘플에 대한 혼동 행렬을 나타낸다.
Figure 112007081780858-PCT00130
도 17은 바이오마커의 상대적인 판별력에 의해 순위매겨진 선택된 바이오마커 및 모델에서의 그의 상대적인 중요도를 나타낸다. 도 17은 단지 PAM 분석을 이용하여 발견된 50개의 가장 중요한 바이오마커만을 나타낸다. 그러나, 820개의 중요한 바이오마커가 발견되었다. 도 17에서의 바이오마커는 이들이 결합된 U133 플러스 2.0 올리고뉴클레오티드에 의해 표지하였다.
도 18은 CART, MART, PAM, 및 랜덤 포레스트 (RF) 분류 알고리즘 (의사결정 규칙) 성능 및 연합된 95% 신뢰 구간의 요약을 제공한다. 도 18에 예시된 모든 알고리즘으로부터 50개의 별개의 바이오마커를 선택하였다. 이들 50개 선택된 특성의 정체성을 도 20에 나타내었다. 도 19는 공통적인 바이오마커가 CART, MART, PAM, RF, 및 윌콕슨 (수정)의 기술에 결쳐 선택된 횟수를 예시한다. 도 20은 T-12 데이타 세트에 대한 바이오마커의 전체적인 순위를 예시한다. 선택된 바이오마커의 경우, x-축은 선택된 횟수의 백분율을 도시한다. 바이오마커가 선택된 횟수의 백분율 내에서, 바이오마커를 순위매겼다. 도 20에서, 바이오마커는 이들이 결합된 U133 플러스 2.0 올리고뉴클레오티드에 의해 표지하였다.
6.5 기저 T -12 데이타 분석
또다른 실시예에서, 기저 T-12 분석을 수행하였다. 본 실시예에서의 바이오마커에 대한 특성 수치를 두 시점에서의 차이로서 계산하였다. 훈련 집단에서 각각의 대상에 대한 두 시점은 (i) T-12 시점 및 (ii) 각각의 대상에서 취한 최초 측정, T최초이었다. T최초는 훈련 집단에 따라 상이할 수 있음을 인지할 것이다. 예를 들어, 몇몇 대상에서 T최초는 T-12의 2일 전이었고, 몇몇 대상에서 T최초는 T-12의 3일 전이었던 것 등이다. T-12 기저 분석에 따른 특성 수치의 계산을 예시하기 위하여, 바이오마커 A를 평가한 경우를 고려하였다. 기저 T-12 분석의 목적상 바이오마커 A에 대한 특성 수치를 계산하기 위하여, 훈련 집단에서의 각각의 대상에 대한 T-12 혈액 샘플에서의 바이오마커 A의 풍부도 [A]T-12를 수득하였다. 추가로, 각각의 대상에 대해 얻은 첫번째 혈액 샘플로부터의 바이오마커 A의 풍부도 [A]최초를 수득하였다. 이어서, 상기 각각의 대상에서 A에 대한 특성 수치를 ΔA = [A]T-12 - [A]최초로서 계산하였다. 훈련 집단내의 각각의 대상 및 각각의 바이오마커를 고려하여 상기 산출을 반복하였다.
기저 T-12 분석의 경우, 89개의 상이한 대상으로부터 얻은 총 89개의 상응하는 미세배열 실험에 대한 89개의 샘플에서 측정된 54,613개의 프로브세트가 존재하였다. 집단의 상이한 구성원으로부터 각 샘플을 수집하였다. 각 미세배열 실험에서 측정된 54,613개의 프로브세트 중에서, 31,047개가 로그 변환에 의해 변환되었다. 추가로, 각 미세배열 실험에서의 54,613개의 프로브세트 중에서, 2518개가 제곱근 변환에 의해 변환되었다. 각 미세배열 실험에서 남아 있는 21,048개 프로브세트는 변환되지 않았다.
89개의 구성원 집단을 초기에 훈련 세트 (n = 68) 및 검증 세트 (n = 21)로 분류하였다. 훈련된 알고리즘을 검증 세트에 적용하여 독립적으로 성능을 평가하는 동안, 상기 훈련 세트를 이용하여 적절한 분류 알고리즘 파라미터를 추정하였다. 68개 훈련 샘플 중, 33개가 패혈증으로 표지되었고, 이는 상기 대상이 관찰 시기 동안의 몇몇 시점에서 패혈증이 발병되었음을 의미하며, 35개가 SIRS이었고, 이는 이들이 관찰 시기 동안 패혈증이 발병되지 않았음을 의미한다. 표 21은 이들 샘플의 인종, 성별 및 연령의 분포를 제공한다.
Figure 112007081780858-PCT00131
21개의 검증 샘플의 경우, 11개가 패혈증이었고, 10개가 SIRS이었다. 표 22는 이들 샘플의 인종, 성별 및 연령의 분포를 제공한다.
Figure 112007081780858-PCT00132
훈련 데이타에서의 각 샘플을 교차 검증에 사용되는 10개 군 중 하나에 무작위로 배정하였다. 이들 군에서의 훈련 샘플의 수는 6 내지 8의 범위였다. 샘플을 패혈증 및 SIRS 샘플의 수를 배수로 맞추려는 방식으로 배정하였다. 하기에 보다 상세히 기재하는 바와 같이, 몇가지 상이한 방법을 사용하여, 선별 바이오마커가 패혈증 군과 SIRS 군 사이를 판별하는지의 여부를 판단하였다.
윌콕슨 및 Q-값 시험. 판별 바이오마커를 확인하기 위해 사용된 첫번째 방법은 윌콕슨 시험 (비수정)이었다. 훈련 데이타의 모든 샘플로부터의 주어진 바이오마커에 대한 풍부 수치를 윌콕슨 시험에 적용시켰다. 윌콕슨 시험은 주어진 바이오마커에 대한 p값을 계산하기 위하여 군 분류 (패혈증 대 SIRS) 및 풍부 수치 둘 다를 고려하였다. p값은 훈련 세트에서 수집된 샘플 전반에서의 주어진 바이오마커에 대한 풍부 수치가 패혈증 및 SIRS 상태를 얼마나 잘 판별하는지를 나타내 준다. p값이 낮을수록, 판별이 더욱 양호한 것이다. p값이 특정 신뢰도 수준, 예를 들어 0.05 미만인 경우, 바이오마커는 패혈증과 SIRS 사이를 판별한다는 결론이 얻어졌다. 상기 방법을 이용하여 6427개의 유의한 바이오마커가 존재하였다 (표 23 참조).
판별 바이오마커를 확인하기 위해 사용되는 두번째 방법은 윌콕슨 시험 (수정)이었다. 54613개라는 큰 수의 바이오마커 및 89이라는 상대적으로 작은 수의 샘플 때문에, 유의한 바이오마커를 허위로 찾을 위험이 높았다. 수정된 p-값을 사용하여 상기 위험을 계수하였다. 특히, 전문이 본원에 참고로 포함되는 문헌 [Benjamini and Hochberg, 1995, J.R. Statist. Soc. B 57, pp 289-300]의 방법을 사용하여 허위 발견 비율을 제어하였다. 여기서, 허위 발견 비율은 진실로 유의한 바이오마커의 수를 유의하다고 선언된 바이오마커의 수로 나눈 것으로 정의된다. 예를 들어 수정 p-값이 0.05 미만인 경우, 바이오마커가 허위로 발견될 확률은 5%이다. 상기 시험을 이용한 결과를 표 12에 보고한다. 상기 방법을 이용하여 482개의 유의한 바이오마커가 존재하였다 (표 23 참조). 본원에 사용된 바이오마커는 바이오마커에 상응하는 특성 수치가 윌콕슨 시험 (수정)으로 결정했을 때 0.05 미만의 p-값을 갖는 경우 유의하다고 여겨진다.
판별 바이오마커를 확인하기 위해 사용되는 세번째 방법은 Q값을 사용하는 것이다. 바이오마커는 그의 Q값 순으로 배열되며, 바이오마커가 X의 Q값을 갖는다면, 상기 바이오마커 및 보다 유의한 모든 다른 것은 X라는 복합 허위 발견 비율을 갖는다. 그러나, 어떤 한 바이오마커에 대한 허위 발견 비율은 훨씬 커질 수 있다. 상기 방법을 이용하여 482개의 유의한 마커가 존재하였다 (표 23 참조).
Figure 112007081780858-PCT00133
CART. 훈련 세트에서 패혈증과 SIRS 하위집단 사이를 판별하는 바이오마커를 확인하기 위하여 윌콕슨 시험 및 Q값 시험을 사용하는 미세배열 데이타를 분석하는 것 이외에, 분류 및 회귀계통도 (CART) 분석을 사용하였다. CART는 상기 단락 5.5.1에 기재되어 있다. 구체적으로, 상기 요약된 데이타를 사용하여 데이타의 최상의 단일-가변성 (바이오마커) 분리를 바탕으로 데이타를 반복적으로 분배함으로써 질환 상태를 예측하였다. 즉, 계통도 수립 과정의 각 단계에서, 훈련 집단 전반에서의 풍부 수치가 패혈증과 SIRS 집단 사이를 가장 잘 판별하는 바이오마커를 의사결정 분기점으로서 실시하였다. 10회 반복의 각각에서 독립적으로 추정되는 최적수의 분리로 교차 검증을 수행하였다. 최종 계통도를 도 21에 도시하였다. 도 21에서, 의사결정 2102는 U133 플러스 2.0 프로브 X210119_at에 결합하는 바이오마커의 풍부를 바탕으로 의사결정을 하게 한다. X210119_at에 결합하는 상기 바이오마커가 진단될 대상으로부터의 생물학적 샘플 (시험 생물학적 샘플)에서 -0.03669 단위 미만의 풍부를 갖는다면, 대조군은 의사결정 2104로 넘어간다. 반면에, 프로브세트 X210119_at에 결합된 바이오마커가 시험 생물학적 샘플에서 -0.03669 단위 초과의 풍부를 갖는다면, 의사결정 대조군은 의사결정 2106으로 넘어간다. 의사결정계통도의 마지막 잎에 도달할 때까지 이러한 방식으로 의사결정을 수행하였고, 마지막 잎에 도달시 패혈증 또는 SIRS를 진단하였다. 도 21의 의사결정계통도는 하기 5개의 U133 플러스 2.0 올리고뉴클레오티드: X210119_at, X1552554_a_at, X1554390_s_at, X1552301_a_at, 및 X1555868_at에 결합된 바이오마커를 사용하였다.
도 22는 훈련 데이타 세트에서 패혈증과 SIRS 군 사이의 의사결정계통도에 사용된 5개의 프로브세트에 결합된 바이오마커의 분포를 나타낸다. 도 22에서, 각 박스의 최상부는 훈련 세트 전반에서의 데이타의 75번째 백분위수를 나타내고, 각 박스의 최하부는 25번째 백분위수를 나타내고, 훈련 세트 전반에서의 각 바이오마커에 대한 중앙 수치는 각 박스 내의 선으로 표현하였다. 도 22에서, 바이오마커는 이들이 결합된 U133 플러스 2.0 올리고뉴클레오티드에 의해 표지하였다. 교차 검증된 모델로부터 예측된 분류를 행한 훈련 데이타에서의 혼동 행렬을 표 24에 제시하였다. 상기 혼동 행렬로부터, 전체적인 정확도는 69.5% 내지 89.4%의 95% 신뢰 구간에서 80.9%인 것으로 추정되었다. 추정된 민감도는 93.9%이었고, 추정된 특이도는 68.6%이었다.
Figure 112007081780858-PCT00134
훈련으로부터 수집한 21개의 검증 샘플의 경우, 전체적인 정확도는 47.8% 내지 88.7% 신뢰 구간에서 71.4%인 것으로 추정되었고, 민감도 72.7% 및 특이도 70%로 추정되었다. 표 25는 검증 샘플에 대한 혼동 행렬을 나타낸다.
Figure 112007081780858-PCT00135
랜덤 포레스트. 본 발명의 바이오마커를 이용하여 개발될 수 있는 또다른 의사결정 규칙은 랜덤 포레스트 의사결정계통도이다. 랜덤 포레스트를 적합하게 하기 위하여, 계통도의 수 (예를 들어 부트스트랩 반복)를 특정하였다. 본 실시예에서는 500 이하를 사용하였으나 번-인 기간에는 50 이상이 요구된다. 훈련 데이타의 정확도를 기준으로 계통도의 수를 선택하였다. 상기 데이타의 경우, 482개의 계통도를 사용하여 알고리즘을 훈련하였다 (도 23 참조). 도 23에서, 곡선 2302는 계통도 수의 함수로서 전체적인 정확도의 완만한 추정치이다. 곡선 2304는 계통도 수의 함수로서 계통도 민감도의 완만한 곡선이다. 곡선 2306은 계통도 수의 함수로서 계통도 특이도의 완만한 곡선이다. 상기 알고리즘을 이용하여, 482개의 바이오마커가 비-영점 중요도를 가졌고, 모델에 사용되었다. 랜덤 포레스트 알고리즘은 훈련 정확도에서의 평균 환산에 의해 바이오마커 중요도를 측정하였다. 바이오마커는 상기 방법에 의해 순위매겨지며, 도 24에 나타나 있다. 상기 도 24는 단지 랜덤 포레스트 분석을 이용하여 밝혀진 50개의 가장 중요한 바이오마커를 반영할 뿐이다. 그러나, 실제로 893개의 바이오마커가 판별 유의성을 갖는다고 밝혀졌다. 랜덤 포레스트 방법은 수많은 상이한 의사결정계통도를 갖는다. 바이오마커가 유의한 랜덤 포레스트 분석으로부터의 의사결정계통도의 의사결정 분기점으로서 작용한다면, 상기 바이오마커는 판별 유의성을 갖는 것으로 여겨진다. 본원에서 사용된 바와 같이, 유의한 랜덤 포레스트 분석은 훈련 데이타 세트에서의 교차 검증에 의한 정확도에서 하위 95% 신뢰 구간이 50%를 초과하고, 검증 세트에서의 정확도에 대한 점 추정이 65%를 초과하는 것이다.
랜덤 포레스트 방법을 이용하여 개발된 의사결정계통도를 이용한 훈련 데이타세트에 대한 예측된 혼동 행렬을 표 26에 제시한다. 상기 혼동 행렬로부터, 전체적인 정확도는 61.8%인 것으로 추정되었다 (부트스트랩 정확도 추정을 이용했을 때 신뢰 구간은 계산할 수 없었음). 추정된 민감도는 57.6%이었고, 추정된 특이도는 65.7%이었다.
Figure 112007081780858-PCT00136
훈련으로부터 수집한 21개의 검증 샘플의 경우, 전체적인 정확도는 52.8% 내지 91.8% 신뢰 구간에서 72.6%인 것으로 추정되었고, 민감도 63.9% 및 특이도 90%로 추정되었다. 표 27은 검증 샘플에 대한 혼동 행렬을 나타낸다.
Figure 112007081780858-PCT00137
PAM. 본 발명의 바이오마커를 사용하여 개발된 또다른 의사결정 규칙은 미세배열의 예측 분석 (PAM)이며, 이는 상기 단락 5.5.2에 기재되어 있다. 상기 방법에서는, 샘플을 분류하기 위해 사용된 바이오마커의 수를 결정하는 수축 파라미터를 특정하였다. 상기 파라미터를 교차 검증을 통해 선택하였다. 소실된 바이오마커는 존재하지 않았다. 교차 검증을 바탕으로 할 때, 최적의 역치 수치는 269개의 바이오마커에 상응하는 1.62이었다. 도 25는 상이한 역치 전반에서의 정확도를 나타낸다. 도 25에서, 곡선 2502는 전체적인 정확도이다 (95% 신뢰 구간 막대를 가짐). 곡선 2504는 역치 수치의 함수로서 의사결정 규칙 민감도를 나타낸다. 곡선 2506은 역치 수치의 함수로서 의사결정 규칙 특이도를 나타낸다. 1.62의 역치를 이용하여, 훈련 샘플에 대한 전체적인 정확도는 55.9% 내지 77.6%의 95% 신뢰 구간에서 67.7%인 것으로 추정되었다. 추정된 민감도는 68.6%이었고, 추정된 특이도는 66.7%이었다. 표 28은 예측된 분류가 교차 검증 모델로부터 얻어지는 훈련 데이타에 대한 혼동 행렬을 나타낸다.
Figure 112007081780858-PCT00138
훈련으로부터 수집한 21개의 검증 샘플의 경우, 전체적인 정확도는 58.1% 내지 94.6% 신뢰 구간에서 81%인 것으로 추정되었고, 민감도 72.7% 및 특이도 100%로 추정되었다. 표 29는 검증 샘플에 대한 혼동 행렬을 나타낸다.
Figure 112007081780858-PCT00139
도 26은 바이오마커의 상대적인 판별력에 의해 순위매겨진 선택된 바이오마커 및 모델에서의 그의 상대적인 중요도를 나타낸다. 도 26은 PAM 분석을 이용하여 발견된 50개의 가장 중요한 바이오마커만을 나타낸다. 그러나, 269개의 바이오마커가 발견되었다. 도 26에서, 바이오마커는 이들이 결합된 U133 플러스 2.0 올리고뉴클레오티드에 의해 표지되었다.
도 27은 CART, PAM, 및 랜덤 포레스트 분류 알고리즘 (의사결정 규칙) 성능 및 연합된 95% 신뢰 구간의 요약을 제공한다. 도 27에 예시된 모든 알고리즘으로부터 50개의 별개의 바이오마커를 선택하였다. 도 28은 공통적인 바이오마커가 CART, PAM, RF, 및 윌콕슨 (수정)의 기술에 걸쳐 선택된 횟수를 예시한다. 도 28에서, 바이오마커는 이들이 결합된 U133 플러스 2.0 올리고뉴클레오티드에 의해 표지되었다. 도 29는 T0 기저 데이타 세트에 대한 바이오마커의 전체적인 순위를 예시한다. 도 29에서, 바이오마커는 이들이 결합된 U133 플러스 2.0 올리고뉴클레오티드에 의해 표지되었다. 선택된 바이오마커의 경우, x-축은 선택된 횟수의 백분율을 도시한다. 바이오마커가 선택된 횟수의 백분율 내에서, 바이오마커를 순위매겼다.
6.6 선별 바이오마커
단락 6.3 내지 6.5는 SIRS 양성 대상으로부터의 혈액 샘플을 54,613개 프로브세트를 함유하는 아피메트릭스 U133 플러스 2.0 인간 게놈 칩을 이용하여 시험한 실험을 기재한다. 상기 단락은 규정된 시기에 패혈증이 발병하기 쉬운 대상 (패혈증 대상)과 규정된 시기에 패혈증이 발병하기 쉽지 않은 대상 (SIRS 대상) 사이를 판별하는 바이오마커의 리스트를 확인하기 위하여 단락 6.3 내지 6.5에 기재된 데이타에 적용되는 기준을 기재한다. 도 30은 상기 바이오마커의 리스트를 확인하기 위하여 적용된 필터를 예시한다.
부과된 첫번째 기준은, 측정된 임의의 시점에서 다중 비교에 대한 수정 후에 윌콕슨 시험으로 결정했을 때 바이오마커가 0.05 이하의 p값을 가지고 SIRS과 패혈증 사이를 판별하거나, 바이오마커가 측정된 임의의 시점에서 훈련 데이타 세트에서의 정확도에 대한 하위 95번째 백분위수가 50%보다 크고 검증 세트에 대한 정확도 점 추정치가 65%보다 큰 것으로 정의되는 유의한 분류 성능을 가지고 다변량 분석에 사용되어야 한다는 요건이었다. T-36 (단락 6.3)에서, 1,618개의 바이오마커가 상기 기준을 만족시켰다. T-12 (단락 6.4)에서, 12,728개의 바이오마커가 상기 기준을 만족시켰다. 몇몇 바이오마커는 T-12 및 T-36 시점 모두에서 상기 기준을 만족시켰다. 총체적으로, 패혈증과 SIRS 상태 사이를 판별하는 14,346개의 바이오마커 (T-12 및 T-36 시점으로부터의 중복을 포함함)가 존재하였다. 따라서, 첫번째 필터 기준은 적합한 바이오마커의 수를 54,613에서 14,346으로 감소시켰다.
부과된 두번째 기준은, 고려된 각각의 바이오마커가 T-36 또는 T-12 시점 기간에서 규정된 시기 동안 패혈증을 얻은 대상 (패혈증 대상) 중 각각의 바이오마커에 대한 중앙 수치와 규정된 시기 동안 패혈증을 얻지 않은 대상 (SIRS 대상) 중 각각의 바이오마커에 대한 중앙 수치 사이에 적어도 1.2배의 변화를 나타내어야 한다는 요건이었다. 추가로, 상기 두번째 기준을 만족시키기 위하여, 바이오마커는 측정된 임의의 시점에서 훈련 데이타 세트에서의 정확도에 대한 하위 95번째 백분위수가 50%보다 크고 검증 세트에 대한 정확도 점 추정치가 65%보다 큰 것으로 정의되는 유의한 분류 성능을 가지고 하나 이상의 다변량 분석에 사용되어야만 하였다. 도 30에 언급한 바와 같이, 세번째 필터 기준의 적용은 적합한 바이오마커의 수를 14,346에서 626으로 감소시켰다.
표 30의 컬럼 1에서, 각 바이오마커는 유전자 명칭, 예를 들어 런던 대학교 생물 분과 유전자 명명 위원회에서 기재한 인간 유전자 명명법 데이타베이스 (HUGO) 기호에 의해 나열하였다. 당업계에 공지된 바와 같이, 몇몇 인간 게놈 유전자는 U133 플러스 2.0 어레이에서의 하나 이상의 프로브세트로 대표된다. 추가로, U133 플러스 2.0 어레이에서의 올리고뉴클레오티드 일부는 공지된 유전자에 상응하지 않는 발현된 서열 태그 (EST)를 대표한다 (표 30의 컬럼 2 참조). 공지되어 있는 경우, 여러가지 인간 유전자의 명칭을 표 30의 컬럼 3에 나열하였다.
바이오마커가 표 30에 나열된 프로브세트의 서열 또는 그의 상보체를 함유하는 유전자를 바탕으로 하는 경우, 상기 바이오마커는 예를 들어 상기 유전자로 제조된 전사체, 그의 상보체, 또는 판별 단편 또는 그의 상보체, 또는 그의 cDNA, 또는 상기 cDNA의 판별 단편, 또는 상기 전사체 또는 그의 상보체의 전부 또는 일부에 상응하는 판별 증폭된 핵산 분자, 또는 상기 유전자로 코딩된 단백질, 또는 상기 단백질의 판별 단편 또는 상기 임의의 것의 표시물일 수 있다. 추가로, 바이오마커는 예를 들어 표 30에 기재된 프로브세트 서열을 포함하는 유전자로 코딩된 단백질 또는 상기 단백질의 판별 단편, 또는 상기의 표시물일 수 있다. 여기서, 판별 분자 또는 단편은 검출시 상기 확인된 전사체, cDNA, 증폭된 핵산, 또는 단백질의 존재 또는 풍부를 지시하는 분자 또는 단편이다. 한 실시양태에서, 본 발명의 바이오마커 프로필은 표 30의 프로브세트의 서열 또는 그의 상보체 5개 이상, 10개 이상, 15개 이상, 20개 이상, 30개 이상, 2 내지 5개, 3 내지 7개, 15개 미만을 함유하는 다수개의 바이오마커, 또는 상기 서열 또는 그의 상보체 5개 이상 중 하나를 포함하는 유전자, 또는 그의 판별 단편, 또는 상기 핵산 서열 중 임의의 것으로 코딩된 아미노산 서열, 또는 이러한 아미노산 서열의 임의의 판별 단편을 포함한다. 이러한 바이오마커는 mRNA 전사체, cDNA 또는 증폭된 핵산 또는 단백질의 몇몇 다른 형태일 수 있다. 일부 실시양태에서 바이오마커는 표 30에 제시된 아피메트릭스 프로브세트에서의 서열을 포함하는 임의의 유전자, 또는 표 30에 제시된 아피메트릭스 프로브세트에서의 서열의 상보체를 포함하는 임의의 유전자, 또는 임의의 mRNA, cDNA 또는 상기 증폭된 핵산의 다른 형태, 또는 상기 임의의 판별 단편, 또는 상기로 코딩된 임의의 아미노산 서열, 또는 이러한 단백질의 임의의 판별 단편이다.
Figure 112007081780858-PCT00140
Figure 112007081780858-PCT00141
Figure 112007081780858-PCT00142
Figure 112007081780858-PCT00143
Figure 112007081780858-PCT00144
Figure 112007081780858-PCT00145
Figure 112007081780858-PCT00146
Figure 112007081780858-PCT00147
Figure 112007081780858-PCT00148
Figure 112007081780858-PCT00149
Figure 112007081780858-PCT00150
Figure 112007081780858-PCT00151
Figure 112007081780858-PCT00152
Figure 112007081780858-PCT00153
Figure 112007081780858-PCT00154
Figure 112007081780858-PCT00155
Figure 112007081780858-PCT00156
Figure 112007081780858-PCT00157
Figure 112007081780858-PCT00158
Figure 112007081780858-PCT00159
Figure 112007081780858-PCT00160
Figure 112007081780858-PCT00161
Figure 112007081780858-PCT00162
Figure 112007081780858-PCT00163
Figure 112007081780858-PCT00164
Figure 112007081780858-PCT00165
Figure 112007081780858-PCT00166
Figure 112007081780858-PCT00167
Figure 112007081780858-PCT00168
Figure 112007081780858-PCT00169
Figure 112007081780858-PCT00170
Figure 112007081780858-PCT00171
Figure 112007081780858-PCT00172
Figure 112007081780858-PCT00173
Figure 112007081780858-PCT00174
Figure 112007081780858-PCT00175
Figure 112007081780858-PCT00176
Figure 112007081780858-PCT00177
Figure 112007081780858-PCT00178
Figure 112007081780858-PCT00179
표 30에서 확인된 각각의 서열, 유전자, 단백질, 및 프로브세트는 본원에 참고로 포함된다.
6.7 예시적 바이오마커 조합
본 발명의 한 실시양태에서, 추가 기준을 단락 6.6에서 확인된 바이오마커의 세트에 적용하였다. 구체적으로, 부가된 추가 기준은 고려된 각각의 바이오마커가 T-36 시점 기간 또는 T-12 시점 기간에서 규정된 시기 동안 패혈증을 얻은 대상 (패혈증 대상) 중 각각의 바이오마커에 대한 중앙 수치와 규정된 시기 동안 패혈증을 얻지 않은 대상 (SIRS 대상) 중 각각의 바이오마커에 대한 중앙 수치 사이에 적어도 1.2배의 변화를 나타내어야 한다는 요건이었다. 추가로, 상기 세번째 기준을 만족시키기 위하여, 바이오마커는 측정된 임의의 시점에서 훈련 데이타 세트에서의 정확도에 대한 하위 95번째 백분위수가 50%보다 크고 검증 세트에 대한 정확도 점 추정치가 65%보다 큰 것으로 정의되는 유의한 분류 성능을 가지고 하나 이상의 다변량 분석에 사용되어야만 하였다. 도 30에 언급한 바와 같이, 세번째 필터 기준의 적용은 적합한 바이오마커의 수를 626에서 130으로 감소시켰다. 이들 바이오마커는 표 31의 컬럼 2에 나열하였다. 표 31의 컬럼 2에서, 바이오마커는 이들이 결합하는 U133 플러스 2.0 프로브세트에 의해 지시되었다. 그러나, 일부 실시양태에서, 이러한 각각의 바이오마커는 사실상 표 31의 컬럼 2에 나열된 확인된 U133 플러스 2.0 올리고뉴클레오티드 프로브에 상응하는 mRNA, cDNA, 또는 다른 상기 핵산 분자이었다.
표 31의 컬럼 1에서, 각 바이오마커는 유전자 명칭, 예를 들어 런던 대학교 생물 분과 유전자 명명 위원회에서 기재한 인간 유전자 명명법 데이타베이스 (HUGO) 기호에 의해 나열하였다. 당업계에 공지된 바와 같이, 몇몇 인간 게놈 유전자는 U133 플러스 2.0 어레이에서의 하나 이상의 프로브세트로 대표된다. 추가로, U133 플러스 2.0 어레이에서의 올리고뉴클레오티드 일부는 공지된 유전자에 상응하지 않는 발현된 서열 태그 (EST)를 대표한다. 그 결과, 표 31에 나열된 130개의 바이오마커는 사실상 95개의 상이한 공지된 유전자를 대표한다 (도 30 참조). 공지되어 있는 경우, 95개의 인간 유전자의 명칭을 표 31의 컬럼 3에 나열하였다.
표 31의 컬럼 4에는, 패혈증이 발병된 훈련 집단에서의 대상 (패혈증 대상)의 T-12 샘플로부터 측정된 바이오마커의 평균 수치 대 패혈증이 발병되지 않은 훈련 집단에서의 대상 (SIRS 대상)의 T-12 샘플로부터 측정된 바이오마커의 평균 수치 사이의 중앙 배수 변화를 제시하였다. 표 31의 컬럼 5에는, 배수 변화의 방향을 제시하였으며, 여기서 "+"는 패혈증 대상에서의 평균 수치가 SIRS 대상에서보다 높음을 나타낸다.
표 31의 컬럼 6에는, 패혈증이 발병된 훈련 집단에서의 대상 (패혈증 대상)의 T-36 샘플로부터 측정된 바이오마커의 평균 수치 대 패혈증이 발병되지 않은 훈련 집단에서의 대상 (SIRS 대상)의 T-36 샘플로부터 측정된 바이오마커의 평균 수치 사이의 중앙 배수 변화를 제시하였다. 표 31의 컬럼 7에는, 배수 변화의 방향을 제시하였으며, 여기서 "+"는 패혈증 대상에서의 평균 수치가 SIRS 대상에서보다 높음을 나타낸다.
특정 실시양태에서, 바이오마커 프로필은 각각 표 32의 프로브세트 중 하나를 함유하는 2종 이상의 상이한 바이오마커, 표 32의 프로브세트 중 하나의 상보체를 함유하는 바이오마커, 또는 표 32의 프로브세트 중 하나를 함유하는 유전자로 코딩된 아미노산 서열을 함유하는 바이오마커를 포함한다. 이러한 바이오마커는 예를 들어 mRNA 전사체, cDNA 또는 몇몇 다른 핵산, 예를 들어 증폭된 핵산, 또는 단백질일 수 있다. 상기 바이오마커 프로필은 추가로 2종 이상의 바이오마커에 대한 각각의 상응하는 특성을 포함한다. 일반적으로, 2종 이상의 바이오마커는 2종 이상의 상이한 유전자로부터 유도된다. 바이오마커가 표 32에 나열된 프로브세트의 서열 또는 그의 상보체를 함유하는 유전자를 바탕으로 하는 경우, 상기 바이오마커는 예를 들어 상기 유전자로 제조된 전사체, 그의 상보체, 또는 판별 단편 또는 그의 상보체, 또는 그의 cDNA, 또는 상기 cDNA의 판별 단편, 또는 상기 전사체 또는 그의 상보체의 전부 또는 일부에 상응하는 판별 증폭된 핵산 분자, 또는 상기 유전자로 코딩된 단백질, 또는 상기 단백질의 판별 단편 또는 상기 임의의 것의 표시물일 수 있다. 추가로, 바이오마커는 예를 들어 표 32에 기재된 프로브세트 서열을 포함하는 유전자로 코딩된 단백질 또는 상기 단백질의 판별 단편, 또는 상기의 표시물일 수 있다. 여기서, 판별 분자 또는 단편은 검출시 상기 확인된 전사체, cDNA, 증폭된 핵산, 또는 단백질의 존재 또는 풍부를 지시하는 분자 또는 단편이다. 한 실시양태에서, 본 발명의 바이오마커 프로필은 표 32의 프로브세트의 서열 또는 그의 상보체 5개 이상, 10개 이상, 15개 이상, 20개 이상, 30개 이상, 2 내지 5개, 3 내지 7개, 15개 미만을 함유하는 다수개의 바이오마커, 또는 상기 서열 또는 그의 상보체 5개 이상 중 하나를 포함하는 유전자, 또는 그의 판별 단편, 또는 상기 핵산 서열 중 임의의 것으로 코딩된 아미노산 서열, 또는 이러한 아미노산 서열의 임의의 판별 단편을 포함한다. 이러한 바이오마커는 mRNA 전사체, cDNA 또는 증폭된 핵산 또는 단백질의 몇몇 다른 형태일 수 있다. 일부 실시양태에서 바이오마커는 표 31에 제시된 아피메트릭스 프로브세트에서의 서열을 포함하는 임의의 유전자, 또는 표 32에 제시된 아피메트릭스 프로브세트에서의 서열의 상보체를 포함하는 임의의 유전자, 또는 임의의 mRNA, cDNA 또는 상기 증폭된 핵산의 다른 형태, 또는 상기 임의의 판별 단편, 또는 상기로 코딩된 임의의 아미노산 서열, 또는 이러한 단백질의 임의의 판별 단편이다.
Figure 112007081780858-PCT00180
Figure 112007081780858-PCT00181
Figure 112007081780858-PCT00182
Figure 112007081780858-PCT00183
Figure 112007081780858-PCT00184
Figure 112007081780858-PCT00185
Figure 112007081780858-PCT00186
Figure 112007081780858-PCT00187
Figure 112007081780858-PCT00188
Figure 112007081780858-PCT00189
표 31에서 확인된 각각의 서열, 유전자, 단백질, 및 프로브세트는 본원에 참고로 포함된다.
상기 표 31은 본 발명의 선별 바이오마커의 리스트를 제공한다. 공지되어 있는 경우, 유전자 명칭을 제시하였다. 하기 표 31의 컬럼 2는 공지되어 있는 경우 표 31에 나열된 바이오마커의 인간 뉴클레오티드 서열에 대한 진뱅크 (등록상표) 데이타베이스 관리 번호를 제공한다. 추가로 표 32의 컬럼 3은 공지되어 있는 경우 표 31의 바이오마커의 상응하는 아미노산 서열에 대한 진뱅크 (등록상표) 데이타베이스 관리 번호를 제공한다. 본 발명의 바이오마커에는 표 32의 관리 번호로 확인되는 유전자 및 단백질, 그의 스플라이싱 변이체, mRNA, cDNA 또는 다른 핵산의 판별 단편 및/또는 상기 유전자 및 단백질의 전부 또는 판별 일부에 상응하는 펩티드 등이 있으나 이에 제한되지 않는다.
이들 유전자 및 단백질 관리 번호는 본 발명의 바이오마커의 일부를 확인하기 위하여 제공된다. 진뱅크 (등록상표)는 국립보건원 (NIH)의 공공으로 이용가능한 유전자 서열 데이타베이스이며, 모든 공공으로 이용가능한 DNA 서열의 애노테이션 수집이다 (예를 들어 그 전문이 본원에 참고로 포함되는 문헌 [Nucleic Acids Research 2004 Jan 1;32(1):23-26] 참조). 진뱅크 (등록상표)는 일본 DNA 데이타뱅크 (DDBJ), 유럽 분자 생물학 실험실 (EMBL), 및 생명공학 정보에 대한 국립 센터 (NCBI)에서의 진뱅크를 포함하는 국제 뉴클레오티드 서열 데이타베이스 공저의 일부이다.
Figure 112007081780858-PCT00190
Figure 112007081780858-PCT00191
Figure 112007081780858-PCT00192
Figure 112007081780858-PCT00193
Figure 112007081780858-PCT00194
Figure 112007081780858-PCT00195
Figure 112007081780858-PCT00196
표 32에서 확인된 각각의 서열, 유전자, 단백질, 및 프로브세트는 본원에 참고로 포함된다.
6.8 추가의 필터링 기준을 바탕으로 하는 바이오마커 조합
단락 6.6은 전환자와 비-전환자 사이를 판별하는 예시적 바이오마커를 기재한다. 단락 6.7은 단락 6.6의 바이오마커의 한 예시적 조합을 기재한다. 단락 6.7의 바이오마커는 단락 6.6의 바이오마커에 추가의 필터링 기준을 적용하여 확인하였다. 상기 단락은 단락 6.7에서 확인된 바이오마커의 추가의 조합을 기재한다. 상기 단락에서 확인된 하위단락은 전환자와 비-전환자 사이를 판별한다.
표 33은 한 예시적 조합에서의 바이오마커를 나열한다. 표 33에 설명된 조합은 표 31에서의 바이오마커의 리스트를 취하고 추가의 필터링 기준을 부과함으로써 확인하였다. 이들 추가 기준은 고려된 각각의 바이오마커가 단락 6.5에 기재된 T-12 기저 데이타에서 규정된 시기 동안 패혈증을 얻은 대상 (패혈증 대상) 중 각각의 바이오마커에 대한 중앙 특성 수치와 규정된 시기 동안 패혈증을 얻지 않은 대상 (SIRS 대상) 중 각각의 바이오마커에 대한 중앙 수치 사이에 적어도 1.2배의 변화를 나타내어야 한다는 요건을 포함하였다. 추가로, T-12 기저 데이타 시기에서 바이오마커에 대한 PAM 스코어, CART 스코어, 및 RF 스코어의 합은 1을 초과해야 했다. 이들 추가의 필터링 기준의 적용은 표 31에 밝힌 130개 바이오마커를 10개 바이오마커로 감소시켰다.
Figure 112007081780858-PCT00197
표 32에서 확인된 각각의 서열, 유전자, 단백질, 및 프로브세트는 본원에 참고로 포함된다.
표 34는 바이오마커의 또다른 예시적 조합에서의 바이오마커를 나열한다. 표 34에 설명된 조합은 표 31에서의 바이오마커의 리스트를 취하고, 각 바이오마커가 상응하는 공지된 유전자와 애노테이션되고 상기 유전자가 공지된 생물학적 기능을 가져야 한다는 추가의 요건을 부과함으로써 확인하였다. 상기 후자의 문제를 제기하기 위한 방법, 표, 소프트웨어 및 다른 공급원은 유전자 온톨로지 컨소시움 (www.geneontology.org)으로부터 이용가능하며, 이는 그 전문이 본원에 참고로 포함된다. 이들 추가의 필터링 기준의 적용은 바이오마커를 표 31의 세트에서 발견된 130개에서 42개 독특한 유전자 서열을 대표하는 52개 바이오마커로 감소시켰다 (도 30 참조).
전환자와 비-전환자 사이를 판별하는 바이오마커의 예시적 조합
유전자 기호 상응하는 유전자 명칭
(BCL6 na) (B-세포 CLL/림프구 6 (징크 핑거 단백질 51) LOC389185)
(HLA-DRB 1,3,4,5) (주조직적합성복합체 클래스 II DR 베타 1 3,4,5)
(RABGEFl na) (LOC401368 LOC402538 RAB 구아닌 뉴클레오티드 교환 인자 (GEF) 1)
3HEXO 3 엑소리보뉴클레아제
AD0RA2A 아데노신 A2a 수용체
ANKRD22 안키린 반복 도메인 22
ANXA3 안넥신 A3
ATP11B ATPase 클래스 VI 유형 11B
ATP6V1C1 ATPase H+ 수송 리소좀 42kDa Vl 서브유닛 C 이소형 1
BASP1 뇌 풍부 막 부착된 신호 단백질 1
BAZ1A 징크 핑거 도메인에 인접한 브로모도메인 1A
C16orf7 염색체 16 오픈 리딩 프레임 7
CD4 CD4 항원 (p55)
CEACAM1 암성배아 항원-관련 세포 부착 분자 1 (담즙 당단백질)
CECR1 묘안 증후군 염색체 구역 후보자 1
CKLF 케모카인-유사 인자
CPD 카르복시펩티다제 D
EIF4G3 진행생물 번역 개시 인자 4 감마 3
FCGR1A (CD64)에 대한 IgG 고 친화도 Ia 수용체의 Fc 단편
G0S2 추정적 림프구 G0/G1 스위치 유전자
GADD45B 성장 정지 및 DNA-손상-유도성 베타
HLA-DMB 주조직적합성복합체 클래스 II DM 베타
HLA-DPA1 주조직적합성복합체 클래스 II DP 알파 1
HLA-DQB1 주조직적합성복합체 클래스 II DQ 베타 1
HLA-DRA 주조직적합성복합체 클래스 II DR 알파
HPGD 히드록시프로스타글란딘 데히드로게나제 15-(NAD)
IL18R1 인터루킨 18 수용체 1
KCNE1 칼륨 전압-관문 채널 Isk-관련 패밀리 멤버 1
LDLR 저밀도 지단백질 수용체 (집안력 고콜레스테롤혈증)
PDCDlLG1 프로그램 세포 사망 1 리간드 1
PHTF1 추정 호메오도메인 전사 인자 1
PRV1 진성 적혈구증가증 1
PTDSR 포스파티딜세린 수용체
RARA 레티노산 수용체 알파
RNASEL 리보뉴클레아제 L (25-올리고이소아데닐레이트 신타제-의존적)
SEC15L1 SEC15-유사 1 (에스. 세레비시애)
SLC26A8 용질 캐리어 패밀리 26 멤버 8
SLC2A3 용질 캐리어 패밀리 2 (촉진된 글루코스 수송자) 멤버 3
STK3 세린/트레오닌 키나제 3 (STE20 동족체 효모)
TGFBI 형질전환 성장 인자 베타-유도성 68kDa
XRN1 5-3 엑소리보뉴클레아제 1
ZFP36L2 징크 핑거 단백질 36 C3H 유형-유사 2
표 34에서 확인된 각각의 서열, 유전자, 단백질 및 프로브세트는 본원에 참고로 포함된다.
한 실시양태에서, 바이오마커 프로필은 표 32의 프로브세트의 서열 또는 그의 상보체 5개 이상, 10개 이상, 15개 이상, 20개 이상, 30개 이상, 2 내지 5개, 3 내지 7개, 15개 미만을 집합적으로 함유하는 다수개의 바이오마커, 또는 상기 서열 또는 그의 상보체 5개 이상 중 하나를 포함하는 유전자, 또는 그의 판별 단편, 또는 상기 핵산 서열 중 임의의 것으로 코딩된 아미노산 서열, 또는 이러한 아미노산 서열의 임의의 판별 단편을 포함한다. 이러한 바이오마커는 mRNA 전사체, cDNA 또는 증폭된 핵산 또는 단백질의 몇몇 다른 형태일 수 있다.
한 실시양태에서, 바이오마커 프로필은 표 33의 프로브세트의 서열 또는 그의 상보체 5개 이상, 10개 이상, 15개 이상, 20개 이상, 30개 이상, 2 내지 5개, 3 내지 7개, 15개 미만을 집합적으로 함유하는 다수개의 바이오마커, 또는 상기 서열 또는 그의 상보체 5개 이상 중 하나를 포함하는 유전자, 또는 그의 판별 단편, 또는 상기 핵산 서열 중 임의의 것으로 코딩된 아미노산 서열, 또는 이러한 아미노산 서열의 임의의 판별 단편을 포함한다. 이러한 바이오마커는 예를 들어 mRNA 전사체, cDNA 또는 몇몇 다른 핵산, 예를 들어 증폭된 핵산, 또는 단백질일 수 있다.
한 실시양태에서, 바이오마커 프로필은 표 34의 프로브세트의 서열 또는 그의 상보체 5개 이상, 10개 이상, 15개 이상, 20개 이상, 30개 이상, 2 내지 5개, 3 내지 7개, 15개 미만을 집합적으로 함유하는 다수개의 바이오마커, 또는 상기 서열 또는 그의 상보체 5개 이상 중 하나를 포함하는 유전자, 또는 그의 판별 단편, 또는 상기 핵산 서열 중 임의의 것으로 코딩된 아미노산 서열, 또는 이러한 아미노산 서열의 임의의 판별 단편을 포함한다. 이러한 바이오마커는 예를 들어 mRNA 전사체, cDNA 또는 몇몇 다른 핵산, 예를 들어 증폭된 핵산, 또는 단백질일 수 있다.
한 실시양태에서, 바이오마커 프로필은 표 33 또는 표 34의 프로브세트의 서열 또는 그의 상보체 5개 이상, 10개 이상, 15개 이상, 20개 이상, 30개 이상, 2 내지 5개, 3 내지 7개, 15개 미만을 집합적으로 함유하는 다수개의 바이오마커, 또는 상기 서열 또는 그의 상보체 5개 이상 중 하나를 포함하는 유전자, 또는 그의 판별 단편, 또는 상기 핵산 서열 중 임의의 것으로 코딩된 아미노산 서열, 또는 이러한 아미노산 서열의 임의의 판별 단편을 포함한다. 이러한 바이오마커는 예를 들어 mRNA 전사체, cDNA 또는 몇몇 다른 핵산, 예를 들어 증폭된 핵산, 또는 단백질일 수 있다.
한 실시양태에서, 바이오마커 프로필은 U133 플러스 2.0 프로브세트 SLC2A3의 서열 또는 그의 상보체를 갖는 바이오마커, 또는 프로브세트 SLC2A3의 서열 또는 그의 상보체를 포함하는 유전자, 또는 그의 판별 단편, 또는 상기 핵산 서열 중 임의의 것으로 코딩된 아미노산 서열 또는 이러한 아미노산 서열의 임의의 판별 단편을 포함한다. 이러한 바이오마커는 예를 들어 mRNA 전사체, cDNA 또는 몇몇 다른 핵산, 예를 들어 증폭된 핵산, 또는 단백질일 수 있다.
바이오마커가 표 30, 31, 32, 33, 또는 34에 나열된 프로브세트의 서열 또는 그의 상보체를 함유하는 유전자를 바탕으로 하는 경우, 상기 바이오마커는 예를 들어 상기 유전자로 제조된 전사체, 그의 상보체, 또는 판별 단편 또는 그의 상보체, 또는 그의 cDNA, 또는 상기 cDNA의 판별 단편, 또는 상기 전사체 또는 그의 상보체의 전부 또는 일부에 상응하는 판별 증폭된 핵산 분자, 또는 상기 유전자로 코딩된 단백질, 또는 상기 단백질의 판별 단편 또는 상기 임의의 것의 표시물일 수 있다. 추가로, 바이오마커는 예를 들어 표 30, 31, 32, 33 또는 34에 기재된 프로브세트 서열을 포함하는 유전자로 코딩된 단백질 또는 상기 단백질의 판별 단편, 또는 상기의 표시물일 수 있다. 여기서, 판별 분자 또는 단편은 검출시 상기 확인된 전사체, cDNA, 증폭된 핵산, 또는 단백질의 존재 또는 풍부를 지시하는 분자 또는 단편이다.
6.9 SIRS 및 패혈증 환자에서 TH1/TH2 경로에서의 상이한 유전자 발현
상기 단락은 예를 들어 상기 단락 5.10에 기재된 방법을 이용하여 전환자와 비-전환자 사이를 판별하는 바이오마커 세트를 확인하기 위해 사용되는 방법을 기재한다. 요컨대, 97명의 SIRS 대상을 주요 대학 외상 센터의 중요한 간호 단위에 적용시키고 단락 6.1에 기재된 방법을 이용하여 평가하였다. 각각 단락 6.3 및 6.4에 기재된 T-36 및 T-12 정적 데이타를 이용하여 비교하였다. 대상을 두 클래스: 전환자 (47) 및 비-전환자 (50)로 분할하였다. 전환자로부터 배출시킨 혈액 샘플을 비-전환자로부터의 샘플과 시간 매치하여 각각 단락 6.3 및 6.4에 기재된 바와 같이 비교를 수행하였다. 혈액 샘플을 수집하고, 단락 6.2에 기재된 바와 같이 분석하였다.
(i) 윌콕슨 (수정) p값이 0.05 이하이고 (ii) T-36 또는 T-12 정적 시험에서 1.2 이상인 전환자와 비-전환자 사이의 평균 배수 차별적 발현 수치를 나타내는 전환자와 비-전환자 사이를 판별하는 바이오마커를 판별 바이오마커의 세트로서 선별하였다. 이어서, 상기 판별 바이오마커의 세트를 국립보건원으로부터 이용가능한 DAVID 2.0에 의해 부과되는 애노테이션 데이타 기준의 필터링 규칙을 이용하여 필터링하였다 (http://appsl.niaid.nih.gov/david/ 참조, 상기 내용은 온전히 본원에 참고로 포함됨). 구체적으로, David 2.0에 의해 부과되는 애노테이션 데이타 기준의 필터링 규칙은 하기 재현되는 단락 5.10에서의 애노테이션 규칙 4의 형태를 가졌다.
애노테이션 규칙 4.
생물학적 경로 X에 존재하는 모든 바이오마커를 선별하라.
본 실시예에서 상기 애노테이션 데이타 기준의 필터링 규칙의 구체적 형태는
Th1/Th2 생물학적 경로 (세포 분화 경로)에 존재하는 모든 바이오마커를 선별하라
는 것이었다.
하기 표 35는 상기 Th1/Th2 세포 분화 경로에 연관된다고 공지된 유전자에 존재하는 아피메트릭스 U133 플러스 2.0 프로브세트를 나열한다.
Figure 112007081780858-PCT00198
Figure 112007081780858-PCT00199
하기 표 36은 애노테이션 데이타 기준의 필터링 규칙의 적용시 판별 바이오마커의 세트에 남아 있는 프로브세트를 함유하는 유전자를 확인한다.
Figure 112007081780858-PCT00200
표 36의 유전자는 전환자와 전환자 사이를 판별하는 바이오마커를 대표한다. 추가로, 이들 유전자는 Th1/Th2 세포 분화 경로에 존재한다. 상기 표에서의 결과는, 이들이 비록 임상적으로 유사할지라도, 패혈증이 후속적으로 발병된 SIRS 환자는 감염되지 않은 SIRS 환자와 상이하게 Th1/Th2 세포와 관련된 유전자를 발현시켰음을 나타낸다. 이들 차이는 임상적 패혈증의 개시 이전에 발생하였다. Th1/Th2 세포 분화 경로 유전자 및 관련 유전자의 논의를 위해서, 예를 들어 각각 본원에 그 전문이 참고로 포함되는 문헌 [Abbas et al, 1996, Functional diversity of helper T lymphocytes, Nature 383:787-793]; [Fearon and Locksley, 1996, Science 272:50-53]; 및 [Mossman and Sad, 1996, Immunol. Today 17:138-146]을 참조한다.
6.10 RT-PCR
단락 6.1에서, 2개의 팍스젠 (RNA) 튜브는 연구의 각 날짜에서의 연구시에 각 대상으로부터 배출되었음을 주지하였다. 한 튜브는 단락 6.2에 기재된 바와 같은 미세배열 분석에 사용하였다. 다른 튜브는 RT-PCR 분석을 위해 사용하였다. 상기 단락에서, RT-PCR로부터 수득한 유전자 발현 수치와 미세배열에 의해 수득한 유전자 발현 수치 사이의 상관성은 표 30에 나열된 유전자 3개, 즉 IL18R1, FCGR1A, 및 MMP9에서 나타났다. 상기 비교에서, 대상에서 측정된 모든 시점에 대한 두 검정 모두 (RT-PCR 및 미세배열)로부터의 정적 발현 데이타는 상관적이어서 상관 계수를 수득하였다. 공공 도메인 통계 계산 언어 (http://www.r-project.org/, 상기 문헌은 본원에 참고로 포함됨)인 'R' 내에서 상관성을 하기 코드를 이용하여 계산하였다:
corCalc <- 함수(x,y){
n <- 길이(x)
## 데이타에 소실된 수치가 있는 경우
if(any(is.na(x)) ∥ any(is.na(y))){
## 소실된 수치가 발생한 지표
rm.idx <-which(is.na(x))
rm.idx <-c(rm.idx,which(is.na(y)))
## 소실된 수치 제거
x <-x[-rm.idx]
y <-y[-rm.idx]
## 업데이트 길이
n <- 길이(x)
}
R <-(n*sum(x*y)-sum(x)*sum(y))/(sqrt((n*sum(x^2)-
(sum(x))^2)*(n*sum(y^2)-(sum(y)^2)))
return(R)
}
도 31은 훈련 집단 전반에서의 모든 이용가능한 시점을 이용하여 RT-PCR로 결정한 바와 같은 IL18R1 발현과 단락 6.2에 기재된 기술을 이용하여 결정한 바와 같은 X206618_at 프로브세트의 강도 사이의 상관성을 나타낸다. 도 31에서의 각 점은 RT-PCR 데이타 및 미세배열 데이타로부터 얻은 훈련 집단에서의 주어진 대상에 대한 유전자 발현 수치이다. RT-PCR과 미세배열 데이타 사이의 실질적 상관성을 발견하였다. 특히, RT-PCR로 결정한 바와 같은 IL18R1 발현과 X206618_at에 대한 미세배열 데이타 사이의 전체적인 상관성은 0.85이었다.
도 32는 훈련 집단에서 모든 이용가능한 시점을 이용하여 RT-PCR로 결정한 바와 같은 FCGR1A 발현과 단락 6.2에 기재된 기술을 이용하여 결정한 바와 같은 X214511_x_at, X216950_s_at 및 X216951_at 프로브세트의 강도 사이의 상관성을 나타낸다. 도 32에서의 각 점은 RT-PCR 데이타 및 미세배열 데이타로부터 얻은 훈련 집단에서의 주어진 대상에 대한 유전자 발현 수치이다. 도 32에서 명백한 바와 같이, FCGR1A의 발현과 표 30에서 발견된 2개의 FCGR1A 프로브세트 X214511_x_at 및 X216950_s_at 각각 사이의 전체적인 상관성은 유의하였다. 특히, FCGR1A와 X214511_x_at 사이의 상관 계수는 0.88이었다. 마찬가지로, FCGR1A와 X216950_s_at 사이의 상관 계수는 0.88이었다. FCGR1A의 발현과 표 30에서 발견되지 않은 FCGR1A 프로브세트인 X216951_at 사이의 전체적인 상관성은 0.53이었고, 이는 다른 2개의 프로브세트처럼 유의하지는 않았다.
도 33은 훈련 집단에서 모든 이용가능한 시점을 이용하여 RT-PCR로 결정한 바와 같은 MMP9 발현과 단락 6.2에 기재된 기술을 이용하여 결정한 바와 같은 X203936_s_at 프로브세트의 강도 사이의 상관성을 나타낸다. 도 32에서의 각 점은 RT-PCR 데이타 및 미세배열 데이타로부터의 연구에서 주어진 대상에 대한 유전자 발현 수치이다. RT-PCR과 미세배열 데이타 사이의 실질적 상관성을 발견하였다. 특히, RT-PCR로 결정한 바와 같은 MMP9 발현과 X203936_s_at에 대한 미세배열 데이타 사이의 전체적인 상관성은 0.87이었다.
도 34는 훈련 집단에서 모든 이용가능한 시점을 이용하여 RT-PCR로 결정한 바와 같은 CD86 발현과 단락 6.2에 기재된 기술을 이용하여 결정한 바와 같은 X205685_at, X205686_s_at, 및 X210895_s_at 프로브세트의 강도 사이의 상관성을 나타낸다. 도 34에서의 각 점은 RT-PCR 데이타 및 미세배열 데이타로부터 얻은 훈련 집단에서의 주어진 대상에 대한 유전자 발현 수치이다. 도 34에서 명백한 바와 같이, CD86의 발현과 표 30에서 발견된 CD86 프로브세트 210895_s_at 사이의 전체적인 상관성은 유의하였다 (상관 계수 0.71). CD86 발현과 표 30에서 발견되지 않은 CD86 프로브세트인 X205685_at, X205686_s_at 사이의 전체적인 상관성은 유의하지 않았다 (각각 상관 계수 0.66 및 0.56).
한 실시양태에서, 본 발명의 바이오마커 프로필은 하기 세트에서의 프로브세트의 1개 이상의 서열 또는 그의 상보체, 또는 상기 서열 또는 그의 서열의 상보체를 포함하는 유전자, 또는 그의 판별 단편, 또는 상기 핵산 서열 중 임의의 것으로 코딩된 아미노산 서열, 또는 상기 아미노산 서열의 임의의 판별 단편을 포함하여, 표 30로부터 선택된 다수개의 바이오마커를 포함한다.
{X206618_at, X214511_x_at, X216950_s_at, X203936_s_at, 및 210895_s_at}
이러한 바이오마커는 예를 들어 mRNA 전사체, cDNA 또는 몇몇 다른 핵산, 예를 들어 증폭된 핵산 또는 단백질일 수 있다. 한 실시양태에서, 본 발명의 바이오마커 프로필은 TGFB1, IL18R1, 또는 FCGR1A에 대해 코딩하는 핵산, TGFB1, IL18R1, 또는 FCGR1A의 판별 부분, 상기 핵산의 상보체, 상기 핵산으로 코딩된 단백질, 또는 상기 임의의 것에 선택적으로 결합된 항체를 포함한다.
6.11 선별 핵산 바이오마커의 발견
상기 기재된 실험을 이용하여 패혈증과 SIRS 사이를 판별하는 수많은 바이오마커를 확인하였다. 본 실시예에서는, 어떤 바이오마커가 패혈증이 후속적으로 발병한 환자 ("패혈증 환자")와 그렇지 않은 ("SIRS 환자") 사이를 구별하는지 확인하기 위하여 발견 과정을 수행하였다. 발견 과정에서는, (i) 진입일, (ii) T-60, (iii) T-36, 및 (iv) T-12 데이타 시점에서 얻은 SIRS 환자 및 패혈증 환자로부터의 샘플을 단락 6.11.1에 기재된 바와 같이 RT-PCR로 및 단락 6.11.2에 기재된 바와 같이 아피메트릭스 유전자 칩 분석으로 조사하였다.
6.11.1 RT-PCR 분석
다중 샘플에서의 바이오마커를 다중 시점에서 RT-PCR로 측정하고, 몇가지 상이한 방법으로 분석하였다: 정적 진입 시간, 정적 T-60, 정적 T-36, 기저 T-60, 기저 T-36, 및 기저 T-12 데이타 시점. RT-PCR은 상기 단락 5.4.1.2, 및 6.10에 기재되어 있다. 이들 분석의 대표적인 예는 하기 상세하게 기재하는 정적 T-12 데이타 분석이다. T-12 정적 분석에서, 바이오마커 특성은 상기 단락 6.4에 정의된 바와 같이 T-12 혈액 샘플을 나타내는 특이적 혈액 샘플을 이용하여 측정하였다.
T-12 정적 분석의 경우, 96개 샘플에서 측정된 72개의 바이오마커가 존재하였다. 집단의 상이한 구성원으로부터 각 샘플을 수집하였다. 이들 특성 중에서, 15개가 로그 변환에 의해 변환되고, 5개가 제곱근 변환에 의해 변환되고, 남아 있는 52개는 변환되지 않았다.
96개의 구성원 집단을 초기에 훈련 세트 (n = 73) 및 검증 세트 (n = 23)로 분류하였다. 훈련된 알고리즘을 검증 세트에 적용하여 독립적으로 성능을 평가하는 동안, 상기 훈련 세트를 이용하여 적절한 분류 알고리즘 파라미터를 추정하였다. 73개 훈련 샘플 중, 36개가 패혈증으로 표지되었고, 이는 상기 대상이 관찰 시기 동안의 몇몇 시점에서 패혈증이 발병되었음을 의미하며, 37개가 SIRS이었고, 이는 이들이 관찰 시기 동안 패혈증이 발병되지 않았음을 의미한다. 표 37은 이들 샘플의 인종, 성별 및 연령의 분포를 제공한다.
Figure 112007081780858-PCT00201
23개의 검증 샘플의 경우, 12개가 패혈증으로 표지되었고, 11개가 SIRS로 표지되었다. 표 38은 이들 샘플의 인종, 성별 및 연령의 분포를 제공한다.
Figure 112007081780858-PCT00202
훈련 데이타에서의 각 샘플을 교차 검증에 사용되는 10개 군 중 하나에 무작위로 배정하였다. 이들 군에서의 훈련 샘플의 수는 6 내지 8의 범위였다. 샘플을 패혈증 및 SIRS 샘플의 수를 배수로 맞추려는 방식으로 배정하였다. 하기에 보다 상세히 기재하는 바와 같이, 몇가지 상이한 방법을 사용하여, 선별 바이오마커가 패혈증 군과 SIRS 군 사이를 판별하는지의 여부를 판단하였다.
윌콕슨 및 Q-값 시험. 판별 바이오마커를 확인하기 위해 사용된 첫번째 방법은 윌콕슨 시험 (비수정)이었다. 훈련 데이타의 모든 샘플로부터의 주어진 바이오마커에 대한 풍부 수치를 윌콕슨 시험에 적용시켰다. 윌콕슨 시험은 주어진 바이오마커에 대한 p값을 계산하기 위하여 군 분류 (패혈증 대 SIRS) 및 풍부 수치 둘 다를 고려하였다. p값은 훈련 세트에서 수집된 샘플 전반에서의 주어진 바이오마커에 대한 풍부 수치가 패혈증 및 SIRS 상태를 얼마나 잘 판별하는지를 나타내 준다. p값이 낮을수록, 판별이 더욱 양호한 것이다. p값이 특정 신뢰도 수준, 예를 들어 0.05 미만인 경우, 바이오마커는 패혈증과 SIRS 사이를 판별한다는 결론이 얻어졌다. 상기 방법을 이용하여 33개의 유의한 바이오마커가 존재하였다 (표 39 참조).
판별 바이오마커를 확인하기 위해 사용되는 두번째 방법은 윌콕슨 시험 (수정)이었다. 72개라는 큰 수의 바이오마커 및 96이라는 상대적으로 작은 수의 샘플 때문에, 유의한 바이오마커를 허위로 찾을 위험이 높았다. 수정된 p-값을 사용하여 상기 위험을 계수하였다. 특히, 전문이 본원에 참고로 포함되는 문헌 [Benjamini and Hochberg, 1995, J.R. Statist. Soc. B 57, pp 289-300]의 방법을 사용하여 허위 발견 비율을 제어하였다. 여기서, 허위 발견 비율은 진실로 유의한 바이오마커의 수를 유의하다고 선언된 바이오마커의 수로 나눈 것으로 정의된다. 예를 들어 수정 p-값이 0.05 미만인 경우, 바이오마커가 허위로 발견될 확률은 5%이다. 상기 시험을 이용한 결과를 표 39에 보고한다. 상기 방법을 이용하여 11851개의 유의한 바이오마커가 존재하였다 (표 39 참조). 본원에 사용된 바이오마커는 바이오마커에 상응하는 특성 수치가 윌콕슨 시험 (수정)으로 결정했을 때 0.05 미만의 p-값을 갖는 경우 유의하다고 여겨진다.
판별 바이오마커를 확인하기 위해 사용되는 세번째 방법은 Q값을 사용하는 것이다. 바이오마커는 그의 Q값 순으로 배열되며, 각각의 바이오마커가 X의 Q값을 갖는다면, 상기 각각의 바이오마커 및 보다 유의한 모든 다른 것은 X라는 복합 허위 발견 비율을 갖는다. 그러나, 어떤 한 바이오마커에 대한 허위 발견 비율은 훨씬 커질 수 있다. 상기 방법을 이용하여 27개의 유의한 마커가 존재하였다 (표 39 참조).
Figure 112007081780858-PCT00203
CART. 훈련 세트에서 패혈증과 SIRS 하위집단 사이를 판별하는 바이오마커를 확인하기 위하여 윌콕슨 시험 및 Q값 시험을 사용하는 미세배열 데이타를 분석하는 것 이외에, 분류 및 회귀계통도 (CART) 분석을 사용하였다. CART는 상기 단락 5.5.1에 기재되어 있다. 구체적으로, 상기 요약된 데이타를 사용하여 데이타의 최상의 단일-가변성 분리를 바탕으로 데이타를 반복적으로 분배함으로써 질환 상태를 예측하였다. 즉, 계통도 수립 과정의 각 단계에서, 훈련 집단 전반에서의 풍부 수치가 패혈증과 SIRS 집단 사이를 가장 잘 판별하는 바이오마커를 의사결정 분기점으로서 실시하였다. 10회 반복의 각각에서 독립적으로 추정되는 최적수의 분리로 교차 검증을 수행하였다. 최종 계통도는 도 36에 도시하였고, 7개의 바이오마커: TNFSF13B, FCGR1A, HMOX1, MMP9, APAF1, APAF1.1, 및 CCL3을 사용하였다.
도 37은 훈련 데이타 세트에서 패혈증과 SIRS 군 사이의 의사결정계통도에 사용된 7개의 프로브세트에 결합된 바이오마커의 분포를 나타낸다. 도 37에서, 각 박스의 최상부는 훈련 세트 전반에서의 데이타의 75번째 백분위수를 나타내고, 각 박스의 최하부는 25번째 백분위수를 나타내고, 훈련 세트 전반에서의 각 바이오마커에 대한 중앙 수치는 각 박스 내의 선으로 표현하였다. 교차 검증된 모델로부터 예측된 분류를 행한 훈련 데이타에서의 혼동 행렬을 표 40에 제시하였다. 상기 혼동 행렬로부터, 전체적인 정확도는 56.6% 내지 78.9%의 95% 신뢰 구간에서 68.5%인 것으로 추정되었다. 추정된 감수성은 72.2%이었고, 추정된 특이도는 64.9%이었다.
Figure 112007081780858-PCT00204
훈련으로부터 수집한 23개의 검증 샘플의 경우, 전체적인 정확도는 56.3% 내지 92.5% 신뢰 구간에서 78.3%인 것으로 추정되었고, 민감도 66.7% 및 특이도 90.9%로 추정되었다. 표 41은 검증 샘플에 대한 혼동 행렬을 나타낸다.
Figure 112007081780858-PCT00205
랜덤 포레스트. 본 발명의 바이오마커를 이용하여 개발될 수 있는 또다른 의사결정 규칙은 랜덤 포레스트 의사결정계통도이다. 랜덤 포레스트는 교차 검증 대신에 부트스트랩을 이용하는 계통도 바탕의 방법이다. 각각의 반복에서, 무작위 샘플 (대체 있음)을 뽑고, 가능한 가장 큰 계통도를 성장시켰다. 각 계통도는 최종 클래스 예측에서 투표를 받았다. 랜덤 포레스트를 적합하게 하기 위하여, 계통도의 수 (예를 들어 부트스트랩 반복)를 특정하였다. 본 실시예에서는 500 이하를 사용하였으나 번-인 기간에는 50 이상이 요구된다. 훈련 데이타의 정확도를 기준으로 계통도의 수를 선택하였다. 상기 데이타의 경우, 462개의 계통도를 사용하여 알고리즘을 훈련하였다 (도 38 참조). 도 38에서, 곡선 3202는 계통도 수의 함수로서 전체적인 정확도의 완만한 추정치이다. 곡선 3804는 계통도 수의 함수로서 계통도 감수성의 완만한 곡선이다. 곡선 3806은 계통도 수의 함수로서 계통도 특이도의 완만한 곡선이다. 상기 알고리즘을 이용하여, 49개의 바이오마커가 비-영점 중요도를 가졌고, 모델에 사용되었다. 랜덤 포레스트 알고리즘은 훈련 정확도에서의 평균 환산에 의해 바이오마커 중요도를 측정하였다. 바이오마커는 상기 방법에 의해 순위매겨지며, 도 39에 나타나 있다. 랜덤 포레스트 방법은 수많은 상이한 의사결정계통도를 이용한다. 바이오마커가 유의한 랜덤 포레스트 분석으로부터의 의사결정계통도의 의사결정 분기점으로서 작용한다면, 상기 바이오마커는 판별 유의성을 갖는 것으로 여겨진다. 본원에서 사용된 바와 같이, 유의한 랜덤 포레스트 분석은 훈련 데이타 세트에서의 교차 검증에 의한 정확도에서 하위 95% 신뢰 구간이 50%를 초과하고, 검증 세트에서의 정확도에 대한 점 추정이 65%를 초과하는 것이다.
랜덤 포레스트 방법을 이용하여 개발된 의사결정계통도를 이용한 훈련 데이타세트에 대한 예측된 혼동 행렬을 표 42에 제시한다. 상기 혼동 행렬로부터, 전체적인 정확도는 76.7%인 것으로 추정되었다 (부트스트랩 정확도 추정을 이용했을 때 신뢰 구간은 계산할 수 없었음). 추정된 감수성은 77.8%이었고, 추정된 특이도는 75.7%이었다.
Figure 112007081780858-PCT00206
훈련으로부터 수집한 23개의 검증 샘플의 경우, 전체적인 정확도는 56.3% 내지 92.5% 신뢰 구간에서 78.3%인 것으로 추정되었고, 민감도 75% 및 특이도 81.8%로 추정되었다. 표 43은 검증 샘플에 대한 혼동 행렬을 나타낸다.
Figure 112007081780858-PCT00207
MART. "구배 부스팅 기계"로도 알려진 다중 가법 회귀계통도 (MART)를 사용하여 동시적으로 바이오마커의 중요도를 평가하고 대상 샘플을 분류하였다. 상기 접근법에서는 (i) 계통도의 수, (ii) 단계 크기 (통상적으로는 "수축"으로 언급됨), 및 (iii) 상호작용의 정도 (각 계통도에 대한 분리의 수와 연관됨)를 비롯한 몇몇 맞춤 파라미터를 특정하였다. MART에 대한 더 많은 정보는 상기 단락 5.5.4에 기재되어 있다. 상호작용의 정도는 1로 설정하여 가법 모델을 실시하였다 (예를 들어 각 계통도는 하나의 분리를 갖고, 단지 하나의 바이오마커만을 사용함).
상호작용을 추정하는 것은 보다 양호한 기능을 위하여 더 많은 데이타를 요구할 수 있다. 모델 복잡성이 계통도의 수로 구술되도록 단계 크기를 0.05로 설정하였다. 각 맞춤 반복에서 경우들의 무작위 서브세트를 제외한 후, 상기 서브세트에서의 예측의 질을 평가함으로써 최적의 수의 계통도를 추정하였다. 더 많은 계통도의 맞춤을 보증한 후에, 예측된 성능이 개선을 중지시킨 점을 최적점으로 추정하였다.
추정된 모델은 모든 계통도에 걸쳐 15개 계통도 및 6개 바이오마커를 사용하였다. MART 알고리즘은 또한 바이오마커 중요도 (합계 100%)의 산출을 제공하며, 이를 도 40에 제시하였다. 중요도가 영인 바이오마커를 배제하였다. 도 41은 패혈증과 SIRS 군 사이의 선택된 바이오마커의 분포를 나타낸다.
10회 반복 각각에서 독립적으로 추정된 계통도의 최적의 수를 이용하여 교차 검증을 수행하였다. 교차 검증 모델로부터 예측된 분류를 수행한 훈련 데이타에 대한 혼동 행렬을 표 44에 제시하였다. 전체적인 정확도는 63.9% 내지 84.7%의 95% 신뢰 구간에서 75.3%인 것으로 추정되었다. 추정된 감수성은 72.2%이었고, 추정된 특이도는 78.4%이었다.
Figure 112007081780858-PCT00208
훈련으로부터 수집한 23개의 검증 샘플의 경우, 전체적인 정확도는 56.3% 내지 92.5% 신뢰 구간에서 78.3%인 것으로 추정되었고, 민감도 81.8% 및 특이도 75%로 추정되었다. 표 45는 검증 샘플에 대한 혼동 행렬을 나타낸다.
Figure 112007081780858-PCT00209
PAM. 본 발명의 바이오마커를 사용하여 개발된 또다른 의사결정 규칙은 미세배열의 예측 분석 (PAM)이며, 이는 상기 단락 5.5.2에 기재되어 있다. 상기 방법에서는, 샘플을 분류하기 위해 사용된 바이오마커의 수를 결정하는 수축 파라미터를 특정하였다. 상기 파라미터를 교차 검증을 통해 선택하였다. 소실된 바이오마커는 존재하지 않았다. 교차 검증을 바탕으로 할 때, 최적의 역치 수치는 5개의 바이오마커에 상응하는 2.12이었다. 도 42는 상이한 역치 전반에서의 정확도를 나타낸다. 도 42에서, 곡선 4202는 전체적인 정확도이다 (95% 신뢰 구간 막대를 가짐). 곡선 4204는 역치 수치의 함수로서 의사결정 규칙 감수성을 나타낸다. 곡선 4206은 역치 수치의 함수로서 의사결정 규칙 특이도를 나타낸다. 2.12의 역치를 이용하여, 훈련 샘플에 대한 전체적인 정확도는 70.9% 내지 87.9%의 95% 신뢰 구간에서 80.8%인 것으로 추정되었다. 추정된 감수성은 89.2%이었고, 추정된 특이도는 72.2%이었다. 표 46은 예측된 분류가 교차 검증 모델로부터 얻어지는 훈련 데이타에 대한 혼동 행렬을 나타낸다.
Figure 112007081780858-PCT00210
훈련으로부터 수집한 23개의 검증 샘플의 경우, 전체적인 정확도는 61.2% 내지 95% 신뢰 구간에서 82.6%인 것으로 추정되었고, 민감도 91.7% 및 특이도 72.7%로 추정되었다. 표 47은 검증 샘플에 대한 혼동 행렬을 나타낸다.
Figure 112007081780858-PCT00211
도 43은 바이오마커의 상대적인 판별력에 의해 순위매겨진 선택된 바이오마커 및 모델에서의 그의 상대적인 중요도를 나타낸다
도 44는 CART, MART, PAM, 및 랜덤 포레스트 (RF) 분류 알고리즘 (의사결정 규칙) 성능 및 연합된 95% 신뢰 구간의 요약을 제공한다. 도 44에 예시된 모든 알고리즘으로부터 50개의 별개의 바이오마커를 선택하였다. 이들 50개 선택된 특성의 정체성을 도 45에 나타내었으며, T-12 데이타 세트에 대한 바이오마커의 전체적인 순위를 추가로 예시하였다. 선택된 바이오마커의 경우, x-축은 선택된 횟수의 백분율을 도시한다. 바이오마커가 선택된 횟수의 백분율 내에서, 바이오마커를 순위매겼다.
T-12 데이타 세트 및 다른 데이타 세트의 분석으로부터, 바이오마커가 얼마나 자주 CART, MART, PAM, 랜덤 포레스트에 포함되는지에 따라 바이오마커를 순위매겼다. 상기 순위의 결과를 하기 표 48에 요약하였다:
Figure 112007081780858-PCT00212
표 48에 나타난 바와 같이, 일반적으로, T-12에서의 중요한 바이오마커는 보다 이른 시점에서도 중요한 바이오마커였다. 표 48에 이탤릭체로 쓰여진 10개의 바이오마커를 하기 단락 6.12.1에 기재된 바와 같이 확인하기 위해 진행시켰다. CD4는 진입일에 상이한 것으로 밝혀졌기 때문에 상기 실시양태에서 배제되었다.
6.11.2 발견 아피메트릭스 유전자 칩 분석
환자를 또한 아피메트릭스 유전자 칩 분석을 이용하여 분석하였다. 상기 분석은 단락 6.2에 기재되어 있다. 다중 샘플 중의 바이오마커를 다중 시점에서 아피메트릭스 유전자 칩 분석으로 측정하고, 몇가지 상이한 방법으로 분석하였다: 정적 진입 시간, 정적 T-60, 정적 T-36, 기저 T-60, 기저 T-36, 및 기저 T-12 데이타 시점. 아피메트릭스 유전자 칩 검정은 상기 단락 6.2에 기재되어 있다. 이들 분석의 대표적인 예는 하기 상세하게 기재하는 정적 T-12 데이타 분석이다. T-12 정적 분석에서, 바이오마커 특성은 상기 단락 6.4에 정의된 바와 같이 T-12 혈액 샘플을 나타내는 특이적 혈액 샘플을 이용하여 측정하였다.
T-12 정적 분석의 경우, 90개 샘플에서 측정된 54,613개의 바이오마커가 존재하였다. 집단의 상이한 구성원으로부터 각 샘플을 수집하였다. 이들 특성 중에서, 31,047개가 로그 변환에 의해 변환되고, 2518개가 제곱근 변환에 의해 변환되고, 남아 있는 21,048개는 변환되지 않았다.
90개의 구성원 집단을 초기에 훈련 세트 (n = 69) 및 검증 세트 (n = 21)로 분류하였다. 훈련된 알고리즘을 검증 세트에 적용하여 독립적으로 성능을 평가하는 동안, 상기 훈련 세트를 이용하여 적절한 분류 알고리즘 파라미터를 추정하였다. 69개 훈련 샘플 중, 34개가 패혈증으로 표지되었고, 이는 상기 대상이 관찰 시기 동안의 몇몇 시점에서 패혈증이 발병되었음을 의미하며, 35개가 SIRS이었고, 이는 이들이 관찰 시기 동안 패혈증이 발병되지 않았음을 의미한다. 표 49는 이들 샘플의 인종, 성별 및 연령의 분포를 제공한다.
Figure 112007081780858-PCT00213
21개의 검증 샘플의 경우, 11개가 패혈증으로 표지되었고, 10개가 SIRS로 표지되었다. 표 50은 이들 샘플의 인종, 성별 및 연령의 분포를 제공한다.
Figure 112007081780858-PCT00214
훈련 데이타에서의 각 샘플을 교차 검증에 사용되는 10개 군 중 하나에 무작위로 배정하였다. 이들 군에서의 훈련 샘플의 수는 6 내지 8의 범위였다. 샘플을 패혈증 및 SIRS 샘플의 수를 배수로 맞추려는 방식으로 배정하였다. 하기에 보다 상세히 기재하는 바와 같이, 몇가지 상이한 방법을 사용하여, 선별 바이오마커가 패혈증 군과 SIRS 군 사이를 판별하는지의 여부를 판단하였다.
윌콕슨 및 Q-값 시험. 판별 바이오마커를 확인하기 위해 사용된 첫번째 방법은 윌콕슨 시험 (비수정)이었다. 훈련 데이타의 모든 샘플로부터의 주어진 바이오마커에 대한 풍부 수치를 윌콕슨 시험에 적용시켰다. 윌콕슨 시험은 주어진 바이오마커에 대한 p값을 계산하기 위하여 군 분류 (패혈증 대 SIRS) 및 풍부 수치 둘 다를 고려하였다. p값은 훈련 세트에서 수집된 샘플 전반에서의 주어진 바이오마커에 대한 풍부 수치가 패혈증 및 SIRS 상태를 얼마나 잘 판별하는지를 나타내 준다. p값이 낮을수록, 판별이 더욱 양호한 것이다. p값이 특정 신뢰도 수준, 예를 들어 0.05 미만인 경우, 바이오마커는 패혈증과 SIRS 사이를 판별한다는 결론이 얻어졌다. 상기 방법을 이용하여 19791개의 유의한 바이오마커가 존재하였다 (표 51 참조).
판별 바이오마커를 확인하기 위해 사용되는 두번째 방법은 윌콕슨 시험 (수정)이었다. 54613개라는 큰 수의 바이오마커 및 90이라는 상대적으로 작은 수의 샘플 때문에, 유의한 바이오마커를 허위로 찾을 위험이 높았다. 수정된 p-값을 사용하여 상기 위험을 계수하였다. 특히, 전문이 본원에 참고로 포함되는 문헌 [Benjamini and Hochberg, 1995, J.R. Statist. Soc. B 57, pp 289-300]의 방법을 사용하여 허위 발견 비율을 제어하였다. 여기서, 허위 발견 비율은 진실로 유의한 바이오마커의 수를 유의하다고 선언된 바이오마커의 수로 나눈 것으로 정의된다. 예를 들어 수정 p-값이 0.05 미만인 경우, 바이오마커가 허위로 발견될 확률은 5%이다. 상기 시험을 이용한 결과를 표 51에 보고한다. 상기 방법을 이용하여 11851개의 유의한 바이오마커가 존재하였다 (표 51 참조). 본원에 사용된 바이오마커는 바이오마커에 상응하는 특성 수치가 윌콕슨 시험 (수정)으로 결정했을 때 0.05 미만의 p-값을 갖는 경우 유의하다고 여겨진다.
판별 바이오마커를 확인하기 위해 사용되는 세번째 방법은 Q값을 사용하는 것이다. 바이오마커는 그의 Q값 순으로 배열되며, 각각의 바이오마커가 X의 Q값을 갖는다면, 상기 각각의 바이오마커 및 보다 유의한 모든 다른 것은 X라는 복합 허위 발견 비율을 갖는다. 그러나, 어떤 한 바이오마커에 대한 허위 발견 비율은 훨씬 커질 수 있다. 상기 방법을 이용하여 27개의 유의한 마커가 존재하였다 (표 51 참조).
Figure 112007081780858-PCT00215
CART. 훈련 세트에서 패혈증과 SIRS 하위집단 사이를 판별하는 바이오마커를 확인하기 위하여 윌콕슨 시험 및 Q값 시험을 사용하는 미세배열 데이타를 분석하는 것 이외에, 분류 및 회귀계통도 (CART) 분석을 사용하였다. CART는 상기 단락 5.5.1에 기재되어 있다. 구체적으로, 상기 요약된 데이타를 사용하여 데이타의 최상의 단일-가변성 분리를 바탕으로 데이타를 반복적으로 분배함으로써 질환 상태를 예측하였다. 즉, 계통도 수립 과정의 각 단계에서, 훈련 집단 전반에서의 풍부 수치가 패혈증과 SIRS 집단 사이를 가장 잘 판별하는 바이오마커를 의사결정 분기점으로서 실시하였다. 10회 반복의 각각에서 독립적으로 추정되는 최적수의 분리로 교차 검증을 수행하였다. 최종 계통도는 4개의 프로브세트: X214681__at, X230281_at, X1007_s_at, 및 X1560432_at을 사용하였고, 여기서 각각의 주어진 프로브세트는 U133 플러스 2.0 아피메트릭스 프로브 세트 명칭이었다. 교차 검증 CART 알고리즘으로부터의 최종 계통도를 바탕으로 하는 훈련 데이타에 대한 혼동 행렬을 표 52에 제시한다. 상기 혼동 행렬로부터, 전체적인 정확도는 52.8% 내지 76.3%의 95% 신뢰 구간에서 65.2%인 것으로 추정되었다. 추정된 감수성은 61.8%이었고, 추정된 특이도는 68.6%이었다.
Figure 112007081780858-PCT00216
훈련으로부터 수집한 21개의 검증 샘플의 경우, 전체적인 정확도는 47.8% 내지 88.7% 신뢰 구간에서 71.4%인 것으로 추정되었고, 민감도 90.9% 및 특이도 50%로 추정되었다. 검증 샘플에 대한 혼동 행렬은 예측된 패혈증/사실적 패혈증 10, 예측된 SIRS/사실적 패혈증 1, 예측된 패혈증/사실적 SIRS 5, 예측된 SIRS/사실적 SIRS 5이었다.
랜덤 포레스트. 본 발명의 바이오마커를 이용하여 개발될 수 있는 또다른 의사결정 규칙은 랜덤 포레스트 의사결정계통도이다. 랜덤 포레스트는 교차 검증 대신에 부트스트랩을 이용하는 계통도 바탕의 방법이다. 각각의 반복에서, 무작위 샘플 (대체 있음)을 뽑고, 가능한 가장 큰 계통도를 성장시켰다. 각 계통도는 최종 클래스 예측에서 투표를 받았다. 랜덤 포레스트를 적합하게 하기 위하여, 계통도의 수 (예를 들어 부트스트랩 반복)를 특정하였다. 본 실시예에서는 500 이하를 사용하였으나 번-인 기간에는 50 이상이 요구된다. 훈련 데이타의 정확도를 기준으로 계통도의 수를 선택하였다. 상기 데이타의 경우, 439개의 계통도를 사용하여 알고리즘을 훈련하였다. 상기 알고리즘을 이용하여, 845개의 바이오마커가 비-영점 중요도를 가졌고, 모델에 사용되었다. 랜덤 포레스트 알고리즘은 훈련 정확도에서의 평균 환산에 의해 바이오마커 중요도를 측정하였다.
랜덤 포레스트 방법은 수많은 상이한 의사결정계통도를 이용한다. 바이오마커가 유의한 랜덤 포레스트 분석으로부터의 의사결정계통도의 의사결정 분기점으로서 작용한다면, 상기 바이오마커는 판별 유의성을 갖는 것으로 여겨진다. 본원에서 사용된 바와 같이, 유의한 랜덤 포레스트 분석은 훈련 데이타 세트에서의 교차 검증에 의한 정확도에서 하위 95% 신뢰 구간이 50%를 초과하고, 검증 세트에서의 정확도에 대한 점 추정이 65%를 초과하는 것이다.
랜덤 포레스트 방법을 이용하여 개발된 의사결정계통도를 이용한 훈련 데이타세트에 대한 예측된 혼동 행렬을 표 53에 제시한다. 상기 혼동 행렬로부터, 전체적인 정확도는 75.4%인 것으로 추정되었다 (부트스트랩 정확도 추정을 이용했을 때 신뢰 구간은 계산할 수 없었음). 추정된 감수성은 73.5%이었고, 추정된 특이도는 77.1%이었다.
Figure 112007081780858-PCT00217
훈련으로부터 수집한 21개의 검증 샘플의 경우, 전체적인 정확도는 76.2% 내지 99.9% 신뢰 구간에서 76.2%인 것으로 추정되었고, 민감도 100% 및 특이도 90%로 추정되었다. 표 54는 검증 샘플에 대한 혼동 행렬을 나타낸다.
Figure 112007081780858-PCT00218
MART. "구배 부스팅 기계"로도 알려진 다중 가법 회귀계통도 (MART)를 사용하여 동시적으로 바이오마커의 중요도를 평가하고 대상 샘플을 분류하였다. 상기 접근법에서는 (i) 계통도의 수, (ii) 단계 크기 (통상적으로는 "수축"으로 언급됨), 및 (iii) 상호작용의 정도 (각 계통도에 대한 분리의 수와 연관됨)를 비롯한 몇몇 맞춤 파라미터를 특정하였다. MART에 대한 더 많은 정보는 상기 단락 5.5.4에 기재되어 있다. 상호작용의 정도는 1로 설정하여 가법 모델을 실시하였다 (예를 들어 각 계통도는 하나의 분리를 갖고, 단지 하나의 바이오마커만을 사용함).
상호작용을 추정하는 것은 보다 양호한 기능을 위하여 더 많은 데이타를 요구할 수 있다. 모델 복잡성이 계통도의 수로 구술되도록 단계 크기를 0.05로 설정하였다. 각 맞춤 반복에서 경우들의 무작위 서브세트를 제외한 후, 상기 서브세트에서의 예측의 질을 평가함으로써 최적의 수의 계통도를 추정하였다. 더 많은 계통도의 맞춤을 보증한 후에, 예측된 성능이 개선을 중지시킨 점을 최적점으로 추정하였다.
추정된 모델은 모든 계통도에 걸쳐 28개 계통도 및 17개 바이오마커를 사용하였다. MART 알고리즘은 또한 바이오마커 중요도 (합계 100%)의 산출을 제공하였다. 바이오마커를 모델에 대한 중요도의 내림순으로 가장 중요한 바이오마커를 첫번째에 기재하는 식으로 순위매겼다: X206513_at, X214681_at, X235359_at, X221850_x_at, X213524_s_at, X225656_a, X200881_s_at, X229743_at, X215178_x_at, X215178_x_at, X216841_s_at, X216841_at, X244158_at, X238858_at, X205287_s_at, X233651_s_at, X229572_at, X214765_s_at.
10회 반복 각각에서 독립적으로 추정된 계통도의 최적의 수를 이용하여 교차 검증을 수행하였다. 교차 검증 모델로부터 예측된 분류를 수행한 훈련 데이타에 대한 혼동 행렬을 표 55에 제시하였다. 전체적인 정확도는 65.1% 내지 86.1%의 95% 신뢰 구간에서 76.8%인 것으로 추정되었다. 추정된 감수성은 76.5%이었고, 추정된 특이도는 77.1%이었다.
Figure 112007081780858-PCT00219
훈련으로부터 수집한 21개의 검증 샘플의 경우, 전체적인 정확도는 63.7% 내지 97% 신뢰 구간에서 85.7%인 것으로 추정되었고, 민감도 80% 및 특이도 90.9%로 추정되었다. 표 56은 검증 샘플에 대한 혼동 행렬을 나타낸다.
Figure 112007081780858-PCT00220
PAM. 본 발명의 바이오마커를 사용하여 개발된 또다른 의사결정 규칙은 미세배열의 예측 분석 (PAM)이며, 이는 상기 단락 5.5.2에 기재되어 있다. 상기 방법에서는, 샘플을 분류하기 위해 사용된 바이오마커의 수를 결정하는 수축 파라미터를 특정하였다. 상기 파라미터를 교차 검증을 통해 선택하였다. 소실된 바이오마커는 존재하지 않았다. 교차 검증을 바탕으로 할 때, 최적의 역치 수치는 820개의 바이오마커에 상응하는 2.1이었다.
2.1의 역치를 이용하여, 훈련 샘플에 대한 전체적인 정확도는 73.4% 내지 86.7%의 95% 신뢰 구간에서 80.9%인 것으로 추정되었다. 추정된 감수성은 85.7%이었고, 추정된 특이도는 76.5%이었다. 표 57은 예측된 분류가 교차 검증 모델로부터 얻어지는 훈련 데이타에 대한 혼동 행렬을 나타낸다.
Figure 112007081780858-PCT00221
훈련으로부터 수집한 21개의 검증 샘플의 경우, 전체적인 정확도는 76.2% 내지 99.9% 신뢰 구간에서 95.2%인 것으로 추정되었고, 민감도 100% 및 특이도 90%로 추정되었다. 표 58은 검증 샘플에 대한 혼동 행렬을 나타낸다.
Figure 112007081780858-PCT00222
가장 중요한 순서에서 가장 덜 중요한 순서로 매겼을 때, PAM으로 확인된 최상위 10개의 바이오마커는 X206513_at, X213524_s_at, X200881_s_at, X218992_at, X238858_at, X221123_x_at, X228402_at, X230585_at, X209304_x_at, X214681_at이었다.
도 46은 아피메트릭스 유전자 칩 발견 훈련 집단으로부터 얻은 T-12 정적 데이타를 이용한 CART, MART, PAM, 및 랜덤 포레스트 (RF) 분류 알고리즘 (의사결정 규칙) 성능 및 연합된 95% 신뢰 구간의 요약을 제공한다. 도 46에 예시된 모든 알고리즘으로부터 50개의 별개의 바이오마커를 선택하였다. 가장 중요한 순서에서 가잘 덜 중요한 순서로 매겼을 때, PAM으로 확인된 최상위 50개의 바이오마커의 정체성은 X204102_s_at, X236013_at, X213668_s_at, X1556639_at, X218220_at, X207860_at, X232422_at, X218578_at, X205875_s_at, X226043_at, X225879_at, X224618_at, X216316_x_at, X243159_x_at, X202200_s_at, X201936_s_at, X242492_at, X216609_at, X214328_s_at, X228648_at, X223797_at, X225622_at, X205988_at, X201978_s_at, X200874_s_at, X210105_s_at, X203913_s_at, X204225_at, X227587_at, X220865_s_at, X206682_at, X222664_at, X212264_s_at, X219669_at, X221971_x_at, X1554464_a_at, X242590_at, X227925_at, X221926_s_at, X202101_s_at, X211078_s_at, X44563_at, X206513_at, X215178_x_at, X235359_at, X225656_at, X244158_at, X214765_s_at, X229743_at, X214681이었다.
T-12 데이타 세트 및 다른 데이타 세트의 분석으로부터, 하기 표 59에 나타낸 34개의 바이오마커를 선별하여 확인하였다. 표 59에 나타난 바와 같이, 바이오마커는 아피메트릭스 유전자 칩 분석에서 세가지 기준, 즉 생물학적 관련성 (BR), 고 배수 변화 (HF), 또는 통계 중요도 (SI) 중 하나에 대한 아피메트릭스 유전자 칩 분석을 바탕으로 선별하였다.
Figure 112007081780858-PCT00223
Figure 112007081780858-PCT00224
6.12 선택 핵산 바이오마커 확인
이 실시예에서, 패혈증이 발병한 환자 ("패혈증 환자")와 패혈증이 발병하지 않은 환자 ("SIRS 환자") 사이에서 바이오마커가 차이가 있는지를 확인하기 위해 확인 과정을 수행하였다.
6.12.1 RT - PCR 에 의해 식별된 바이오마커의 확인 분석
섹션 6.11.1의 표 48에서 이탤릭체로 기재된 바이오마커, 즉 FCGR1A, MMP9, IL18R1, ARG2, IL1RN, TNFSF13B, ITGAM, TGFBI, CD86, 및 TLR4를, 다수의 시점에서 RT-PCR을 사용해서 분석하였으며, 여러 상이한 방식 (정적 진입 시점, 정적 T-60, 정적 T-36, 기저선 T-60, 기저선 T-36, 및 기저선 T-12 데이타 지점)으로 분석하였다. RT-PCR은 상기 섹션 5.4.1.2에 기재되어 있다. 하기 상세히 기재된 정적 T-12 데이타 분석은 상기 분석들을 대표한다. T-12 정적 분석에서, 바이오마커 특성은 상기 섹션 6.4에 정의된 바와 같은 T-12 혈액 샘플로 명명된 특정 혈액 샘플을 사용해서 측정하였다.
T-12 정적 분석의 경우, 바이오마커 FCGR1A, MMP9, IL18R1, ARG2, IL1RN, TNFSF13B, ITGAM, TGFBI, CD86, 및 TLR4는 50개의 샘플로부터 측정하였다. 각 샘플은 상이한 집단 구성원으로부터 수집하였다. 이들 바이오마커 중에서, 7개는 로그(log) 변환에 의해 변환시켰으며, 3개는 제곱근 변환에 의해 변환시켰다.
먼저, 50개 구성원의 집단을 훈련 세트 (n = 39) 및 검증 세트 (n = 11)로 분리하였다. 훈련 세트를 사용해서 적절한 분류 알고리즘 파라미터를 평가하였으며, 훈련된 알고리즘을 검증 세트에 적용하여 수행을 독립적으로 평가하였다. 50개의 훈련 샘플들 중에서, 23개는 패혈증으로 표지되었는데, 이는 대상들이 관찰 기간 동안 어떤 시점에서 패혈증이 발병했음을 의미하고, 16개는 SIRS로 표지되었는데, 이는 대상들이 관찰 기간 동안 패혈증이 발병하지 않았음을 의미한다. 표 60은 이들 샘플의 인종, 성별 및 연령의 분포를 제공한다.
훈련 데이타에 대한 인종, 성별 및 연령의 분포
성별 흑인 백인 기타
패혈증 남성 3 13 0
여성 0 7 0
SIRS 남성 5 7 1
여성 0 2 0
최소 평균 중위 최대
패혈증 20 52.3 56 80
SIRS 20 39.9 32.5 79
11개의 검증 샘플의 경우, 5개는 패혈증으로 표지되었으며, 6개는 SIRS로 표지되었다. 표 61은 이들 샘플에 대한 인종, 성별 및 연령의 분포를 제공한다.
검증 데이타에 대한 인종, 성별 및 연령의 분포
성별 흑인 백인 기타
패혈증 남성 2 1 0
여성 0 3 0
SIRS 남성 0 3 0
여성 0 2 0
최소 평균 중위 최대
패혈증 18 51.7 59.5 76
SIRS 24 47.2 43 76
훈련 데이타의 각 샘플은 교차-검증에 사용된 10개 군 중 하나로 무작위로 지정되었다. 이들 군에서 훈련 샘플의 수는 3개 내지 5개의 범위이다. 샘플들은 이들 중 패혈증 샘플수 및 SIRS 샘플수의 균형을 맞추기 위해 시도된 방식으로 지정되었다. 이하에 보다 상세히 기재된 바와 같이, 여러 상이한 방법을 이용해서 선택 바이오마커가 패혈증 군과 SIR 군의 차이를 판별하는지를 판단하였다.
윌콕슨 및 Q-수치 시험. 판별 바이오마커를 확인하기 위해 사용된 첫 번째 방법은 윌콕슨 시험이었다 (비조정). 훈련 데이타에 있어서 샘플들 사이에서 주어진 바이오마커에 대한 풍부도 수치를 윌콕슨 시험으로 처리하였다. 윌콕슨 시험은 군 분류 (패혈증 대 SIRS) 및 풍부도 수치를 둘 다 고려해서 주어진 바이오마커에 대한 p 값을 계산하였다. p 값은 훈련 세트에서 수집된 샘플들간의 주어진 바이오마커에 대한 풍부도 수치가 패혈증 상태와 SIRS 상태를 얼마나 잘 판별해내는지를 표시한다. p 값이 더 낮을수록, 판별은 우수하다. p 값이 특정 신뢰 수준, 예를 들면 0.05 미만이면, 바이오마커가 패혈증 표현형과 SIR 표현형을 판별한 것으로 추론한다. 이 방법을 이용하는 9개의 유의한 바이오마커가 존재하였다 (표 62 참조).
판별 바이오마커를 확인하기 위해 사용된 두 번째 방법은 윌콕슨 시험 (조정)이었다. 다수, 즉 10개의 바이오마커와 상대적으로 소수, 즉 50개의 샘플로 인해, 유의한 바이오마커를 허위로 발견할 위험이 높았다. 조정된 p 값을 사용해서 이 위험을 저지하였다. 특히, 전체 개시내용이 본원에 참고로 포함되는 문헌 [Benjamini and Hochberg, 1995, J.R. Statist. Soc. B 57, pp 289-300]의 방법을 이용해서 허위 발견 비율을 조절하였다. 여기서, 허위 발견 비율이란 진정으로 유의한 바이오마커의 수를 유의한 것으로 표시한 바이오마커의 수로 나눈 값으로 정의된다. 예를 들어, 조정된 p 값이 0.05 미만이면, 바이오마커가 허위로 발견되었을 확률이 5%이다. 이 시험을 이용한 결과는 표 62에 보고되어 있다. 이 방법을 이용하는 9개의 유의한 바이오마커가 존재하였다 (표 62 참조). 여기서 사용된 바와 같이, 바이오마커는 윌콕슨 시험 (조정)에 의해 결정된 바로는 0.05 미만의 p 값을 갖는 경우에 유의한 것으로 고려된다.
판별 바이오마커를 확인하기 위해 사용된 세 번째 방법은 Q 값을 사용하는 것이었다. 이 방법에서, 바이오마커는 이들의 Q 값에 의해 배열되며, 각 바이오마커가 X의 Q 값을 갖는 경우, 각 바이오마커 및 보다 유의한 모든 다른 것들은 X의 허위 발견 비율을 겸비한다. 그러나, 임의의 한가지 바이오마커에 대한 허위 발견 비율은 훨씬 더 클 수 있다. 이 방법을 이용하는 9개의 유의한 바이오마커가 존재하였다 (표 62 참조).
세 가지 방법에 대한 유의한 부름의 축적수: 모든 샘플 (훈련 및 검증)을 사용해서 패혈증 군과 SIRS 군을 비교했음을 주지한다. 분석에서는 소실된 바이오마커 특성 수치들은 포함되지 않았다.
≤1e-04 ≤0.001 ≤0.01 ≤0.025 ≤0.05 ≤0.1 ≤1
p-값 (비조정) 0 7 9 9 9 9 10
p-값 (조정) 0 7 9 9 9 9 10
q-값 0 0 0 0 0 0 10
CART. 훈련 세트에서 패혈증 하위집단과 SIRS 하위집단을 판별하는 바이오마커를 확인하기 위해 윌콕슨 및 Q-수치 시험을 이용해서 미세배열 데이타를 분석하는 것 이외에도, 분류 및 회귀계통도 (CART) 분석을 이용하였다. CART는 상기 섹션 5.5.1에 기재되어 있다. 구체적으로, 상기 요약된 데이타를 사용해서 데이타의 최적 단일-변수 분리(single-variable split)를 기초로 데이타를 반복적으로 분배함으로써 질환 상태를 예측하였다. 달리 말하면, 계통도 작성 과정의 각 단계에서, 훈련 집단 사이에서 패혈증 집단과 SIRS 집단을 최적으로 판별하는 발현 수치를 나타내는 바이오마커는 결정 분지로서 요구되었다. 교차-검증을 수행하였으며, 각각의 10회 반복에서 최적의 분리 수를 독립적으로 평가하였다. 최종 계통도는 중요도 순서로 IL18R1, ARG2, 및 FCGR1A로 나열된 3개의 바이오마커를 사용하며, 이중에서 IL18R1이 가장 중요했다. 교차-검증된 CART 알고리즘으로부터의 최종 계통도를 기초로 하는 훈련 데이타의 혼동 행렬은 표 63에 제시되어 있다. 이 혼동 행렬로부터, 전체 정확도는 66.5% 내지 92.5%의 95% 신뢰 구간에서 82.1%인 것으로 평가되었다. 민감도는 82.6%이었으며, 특이도는 81.2%이었다.
교차-검증된 CART 알고리즘을 이용한, 훈련 샘플에 대한 혼동 행렬
사실적 진단
예측 패혈증 SIRS
패혈증 19 3
SIRS 4 13
훈련 데이타 세트로부터 도로 보유된 11개의 검증 샘플의 경우, 전체 정확도는 71.5% 내지 100%의 95% 신뢰 구간에서 100%이고, 민감도는 100%이며, 특이도는 100%인 것으로 평가되었다. 표 64는 검증 샘플에 대한 혼동 행렬을 나타낸다.
교차-검증된 CART 알고리즘을 이용한, 검증 샘플에 대한 혼동 행렬
사실적 진단
예측 패혈증 SIRS
패혈증 5 0
SIRS 0 6
랜덤 포레스트. 본 발명의 바이오마커를 이용해서 개발될 수 있는 다른 의사결정 규칙은 랜덤 포레스트 의사결정계통도이다. 랜덤 포레스트는 교차-검증 대신 부트스트랩핑을 이용하는 계통도 기초의 방법이다. 각 반복에서, 무작위 샘플 (대체물을 가짐)을 도시하고, 가능한 가장 큰 계통도를 성장시킨다. 각 계통도는 최종 분류 예측에서 의사표시(vote)를 수용한다. 랜덤 포레스트를 피팅하기 위해, 계통도의 수 (예, 부트스트랩 반복)를 지정한다. 이 데이타의 경우, 1000개의 계통도를 사용해서 알고리즘을 훈련시킨다. 이 알고리즘을 이용하는 경우, 10개의 바이오마커 중 9개는 0이 아닌 중요도를 가졌으며, 모델에서 사용되었다. 바이오마커 중요도는 가장 큰 것부터 가장 작은 것 순으로 TGFB1, MMP9, TLR4, IL1RN, TNFSF, ARG2, FCGR1A, 및 IL18R1이었다.
랜덤 포레스트 방법은 다수의 상이한 의사결정계통도를 이용한다. 바이오마커는 유의한 랜덤 포레스트 분석으로부터의 의사결정계통도의 결정 분지로서 작용하는 경우에 판별 유의성을 갖는 것으로 고려된다. 본원에 사용된 바와 같이, 유의한 랜덤 포레스트 분석은, 훈련 데이타 세트에 대한 교차 검증에 의한 정확도에 대하여 하위 95% 신뢰 구간이 50%를 초과하며 검증 세트에 대한 정확도의 경우에 지점 평가는 65%를 초과하는 분석이다.
랜덤 포레스트 방법을 이용해서 개발된 의사결정계통도를 이용하는 훈련 데이타 세트에 대한 예측된 혼동 행렬은 표 65에 제시되어 있다. 이 혼동 행렬로부터, 전체 정확도는 63.5% 내지 90.7%의 95% 신뢰 구간에서 79.5%인 것으로 평가되었다. 민감도는 87%이었으며, 특이도는 68.8%이었다.
랜덤 포레스트 방법을 이용해서 발생시킨 의사결정계통도에 대하여, 훈련 샘플에 대한 혼동 행렬
사실적 진단
예측 패혈증 SIRS
패혈증 20 5
SIRS 3 11
훈련으로부터 도로 보유된 11개의 검증 샘플의 경우, 전체 정확도는 48.2% 내지 97.7%의 95% 신뢰 구간에서 81.8%이고, 민감도는 60%이고, 특이도는 100%인 것으로 평가되었다. 표 66은 검증 샘플에 대한 혼동 행렬을 나타낸다.
랜덤 포레스트 방법을 이용해서 발생시킨 의사결정계통도에 대하여, 11개의 검증 샘플에 대한 혼동 행렬
사실적 진단
예측 패혈증 SIRS
패혈증 6 0
SIRS 2 3
MART. "그라디언트 부스팅 머신(gradient boosting machine)"이라고도 알려진 다중 가법 회귀계통도 (MART)를 이용해서 바이오마커의 중요도를 평가함과 동시에 대상 샘플을 분류한다. 이 접근법에서는 (i) 계통도 수, (ii) 단계 크기 (통상적으로 "축소"라고 지칭함), 및 (iii) 상호작용 정도 (각 계통도에 대한 분리 수와 관련됨)를 비롯한 여러 피팅 파라미터가 지정된다. MART에 대한 더 많은 정보는 상기 섹션 5.5.4에 기재되어 있다. 상호작용 정도를 1로 설정하여 가법 모델을 시행하였다 (예를 들어, 각 계통도가 하나의 분리를 가지며 하나의 바이오마커만을 사용함).
평가 상호작용은 잘 기능하기 위해 더 많은 데이타를 필요로 할 수 있다. 모델 복잡성이 계통도 수에 의해 결정되도록 단계 크기를 0.05로 설정하였다. 최적의 계통도 수는 각각의 피팅 반복에서 무작위 하위세트의 경우를 생략한 다음, 이 하위세트 상에서 예측 품질을 사정함으로써 평가되었다. 보장된 것보다 더 많은 계통도를 피팅한 다음, 예측 수행이 개선을 중단시킨 지점을 최적의 지점으로 평가하였다.
평가된 모델은 30개의 계통도와, 모든 계통도에 걸쳐 7개의 바이오마커를 사용하였다. MART 알고리즘은 또한 바이오마커 중요도 (총 합은 100%임)의 계산을 제공한다. 모델에 대해 첫 번째의 가장 중요한 바이오마커로부터 시작해서 중요도가 감소하는 순서로 등급화된 바이오마커는 ITGAM, TGFB1, TLR4, TNFSF, FCGR1A, IL18R1, 및 ARG2이었다.
교차-검증을 수행하였으며, 최적의 계통도 수를 10회 반복의 각각에서 독립적으로 평가하였다. 예측된 분류가 교차-검증된 모델로부터 만들어진 훈련 데이타에 대한 혼동 행렬은 표 67에 제시되어 있다. 이 혼동 행렬로부터, 전체 정확도는 57.9% 내지 87%의 95% 신뢰 구간에서 74.4%인 것으로 평가되었다. 민감도는 73.8%이었고, 특이도는 68.8%이었다.
교차-검증된 MART 알고리즘을 이용한, 훈련 샘플에 대한 혼동 행렬
사실적 진단
예측 패혈증 SIRS
패혈증 18 5
SIRS 5 11
훈련으로부터 도로 보유된 11개의 검증 샘플의 경우, 전체 정확도는 57.9% 내지 87%의 95% 신뢰 구간에서 74.4%이고, 민감도는 78.3%이며, 특이도는 68.8%인 것으로 평가되었다. 표 68은 검증 샘플에 대한 혼동 행렬을 나타낸다.
MART 알고리즘을 이용한, 검증 샘플에 대한 혼동 행렬
사실적 진단
예측 패혈증 SIRS
패혈증 6 2
SIRS 0 3
PAM. 본 발명의 바이오마커를 이용해서 개발한 또 다른 의사결정 규칙은 상기 섹션 5.5.2에 기재된 미세배열의 분석 (PAM)을 예측한다. 이 방법에서, 샘플을 분류하는 데 사용된 바이오마커 수를 결정하는 축소 파라미터를 지정한다. 이 파라미터는 교차-검증을 통해 선택되었다. 수치 소실이 있는 바이오마커는 존재하지 않았다. 교차-검증을 기초로, 최적의 역치 수치는 9개의 바이오마커에 상응하는 0.55이었다.
0.55의 역치를 사용해서, 훈련 샘플에 대한 전체 정확도는 68.8% 내지 90.7%의 95% 신뢰 구간에서 82.3%인 것으로 평가되었다. 민감도는 68.8%이었으며, 특이도는 91.3%이었다. 표 69는 예측된 분류가 교차-검증된 모델로부터 만들어진 것인 훈련 데이타에 대한 혼동 행렬을 나타낸다.
교차-검증된 PAM을 이용한, 훈련 샘플에 대한 혼동 행렬
사실적 진단
예측 패혈증 SIRS
패혈증 11 2
SIRS 5 21
훈련으로부터 도로 보유된 11개의 검증 샘플의 경우, 전체 정확도는 39% 내지 94%의 95% 신뢰 구간에서 72.67%이고, 민감도는 40%이고, 특이도는 100%인 것으로 평가되었다. 표 70은 검증 샘플에 대한 혼동 행렬을 나타낸다.
교차-검증된 PAM을 이용한, 검증 샘플에 대한 혼동 행렬
사실적 진단
예측 패혈증 SIRS
패혈증 2 0
SIRS 3 6
PAM에 의해 확인된 상부의 9개의 바이오마커는 가장 중요한 것으로부터 가장 덜 중요한 것 순서로 ARG2, TGFB1, MMP9, TLR4, ITGAM, IL18R1, TNFSF, IL1RN, 및 FCGR1A로 등급화되었다. 도 47은 아피메트릭스 유전자 칩 확인 훈련 집단으로부터 얻어진 T-12 정적 데이타를 사용하는 95% 신뢰 구간과 관련하여 CART, MART, PAM, 및 랜덤 포레스트 (RF) 분류 알고리즘 (의사결정 규칙) 수행의 요약을 제공한다. 도 47에 요약된 RT-PCR 분석 결과를 기초로 다른 시점에서, 이 확인 과정에서 연구중인 모든 10개의 바이오마커는 유의하였다. 일부 바이오마커는 T-60과 같이 초기에 판별되었다.
6.12.2 아피메트릭스 유전자 칩 분석에 의해 식별된 바이오마커의 확인 분석
섹션 6.11.2의 표 59에 기재된 바이오마커 및 섹션 6.11.1의 표 48에 기재된 10개의 바이오마커 (FCGR1A, MMP9, IL18R1, ARG2, IL1RN, TNFSF13B, ITGAM, TGFBI, CD86, 및 TLR4)의 총 44개의 바이오마커를, 여러 시점에서 RT-PCR을 이용해서 분석하였으며, 여러 상이한 방식 (정적 진입 시간, 정적 T-60, 정적 T-36, 기저선 T-60, 기저선 T-36, 및 기저선 T-12 데이타 지점)으로 분석하였다. RT-PCR은 상기 섹션 5.4.1.2에 기재되어 있다. 이들 분석의 대표적인 것으로는 하기에 상세히 기재된 정적 T-12 데이타 분석이 있다. T-12 정적 분석에서, 상기 섹션 6.4에 정의된 바와 같이, T-12 혈액 샘플로 표시된 특정 혈액 샘플을 사용해서 바이오마커 특성을 측정하였다.
T-12 정적 분석의 경우, 37개의 샘플로부터 44개의 바이오마커를 측정하였다. 각 샘플은 상이한 구성원 집단으로부터 수집하였다. 이들 바이오마커 중에서, 23개는 로그 변환에 의해 변화시켰고, 21개는 제곱근 변환에 의해 변환시켰다.
먼저, 37개 구성원의 집단을 훈련 세트 (n = 28) 및 검증 세트 (n = 9)로 분리하였다. 훈련 세트를 사용해서 적절한 분류 알고리즘 파라미터를 평가하였으며, 훈련된 알고리즘을 검증 세트에 적용하여 수행을 독립적으로 평가하였다. 28개의 훈련 샘플들 중에서, 14개는 패혈증으로 표지되었는데, 이는 대상들이 관찰 기간 동안 어떤 시점에서 패혈증이 발병했음을 의미하고, 14개는 SIRS로 표지되었는데, 이는 대상들이 관찰 기간 동안 패혈증이 발병하지 않았음을 의미한다. 표 71은 이들 샘플의 인종, 성별 및 연령의 분포를 제공한다.
훈련 데이타에 대한 인종, 성별 및 연령의 분포
성별 흑인 백인 기타
패혈증 남성 1 7 0
여성 0 6 0
SIRS 남성 4 6 1
여성 0 2 0
최소 평균 중위 최대
패혈증 28 58 56 76
SIRS 20 42.5 39.5 79
9개의 검증 샘플의 경우, 5개는 패혈증으로 표지되었으며, 4개는 SIRS로 표지되었다. 표 72는 이들 샘플에 대한 인종, 성별 및 연령의 분포를 제공한다.
검증 데이타에 대한 인종, 성별 및 연령의 분포
성별 흑인 백인 기타
패혈증 남성 2 0 0
여성 0 3 0
SIRS 남성 0 3 0
여성 0 2 0
최소 평균 중위 최대
패혈증 18 49.8 58 76
SIRS 24 45.8 41.5 76
훈련 데이타의 각 샘플은 교차-검증에 사용된 10개 군 중 하나로 무작위로 지정되었다. 이들 군에서 훈련 샘플의 수는 2개 내지 4개의 범위이다. 샘플들은 이들 중 패혈증 샘플수 및 SIRS 샘플수의 균형을 맞추기 위해 시도된 방식으로 지정되었다. 이하에 보다 상세히 기재된 바와 같이, 여러 상이한 방법을 이용해서 선택 바이오마커가 패혈증 군과 SIR 군의 차이를 판별하는지를 판단하였다.
윌콕슨 및 Q-수치 시험. 판별 바이오마커를 확인하기 위해 사용된 첫 번째 방법은 윌콕슨 시험이었다 (비조정). 훈련 데이타에 있어서 샘플들 사이에서 주어진 바이오마커에 대한 풍부도 수치를 윌콕슨 시험으로 처리하였다. 윌콕슨 시험은 군 분류 (패혈증 대 SIRS) 및 풍부도 수치를 둘 다 고려해서 주어진 바이오마커에 대한 p 값을 계산하였다. p 값은 훈련 세트에서 수집된 샘플들간의 주어진 바이오마커에 대한 풍부도 수치가 패혈증 상태와 SIRS 상태를 얼마나 잘 판별해내는지를 표시한다. p 값이 더 낮을수록, 판별은 우수하다. p 값이 특정 신뢰 수준, 예를 들면 0.05 미만이면, 바이오마커가 패혈증 표현형과 SIR 표현형을 판별한 것으로 추론한다. 이 방법을 이용하는 38개의 유의한 바이오마커가 존재하였다 (표 73 참조).
판별 바이오마커를 확인하기 위해 사용된 두 번째 방법은 윌콕슨 시험 (조정)이었다. 다수, 즉 44개의 바이오마커와 상대적으로 소수, 즉 37개의 샘플로 인해, 유의한 바이오마커를 허위로 발견할 위험이 높았다. 조정된 p 값을 사용해서 이 위험을 저지하였다. 특히, 전체 개시내용이 본원에 참고로 포함되는 문헌 [Benjamini and Hochberg, 1995, J.R. Statist. Soc. B 57, pp 289-300]의 방법을 이용해서 허위 발견 비율을 조절하였다. 여기서, 허위 발견 비율이란 진정으로 유의한 바이오마커의 수를 유의한 것으로 표시한 바이오마커의 수로 나눈 값으로 정의된다. 예를 들어, 조정된 p 값이 0.05 미만이면, 바이오마커가 허위로 발견되었을 확률이 5%이다. 이 시험을 이용한 결과는 표 73에 보고되어 있다. 이 방법을 이용하는 38개의 유의한 바이오마커가 존재하였다 (표 73 참조). 여기서 사용된 바와 같이, 바이오마커는 윌콕슨 시험 (조정)에 의해 결정된 바로는 0.05 미만의 p 값을 갖는 경우에 유의한 것으로 고려된다.
판별 바이오마커를 확인하기 위해 사용된 세 번째 방법은 Q 값을 사용하는 것이었다. 이러한 세 번째 방법에서, 바이오마커는 이들의 Q 값에 의해 배열되었으며, 각 바이오마커가 X의 Q 값을 갖는 경우, 각 바이오마커 및 보다 유의한 모든 다른 것들은 X의 허위 발견 비율을 겸비하였다. 그러나, 임의의 한가지 바이오마커에 대한 허위 발견 비율은 훨씬 더 클 수 있다. 이 방법을 이용하는 38개의 유의한 바이오마커가 존재하였다 (표 73 참조).
세 가지 방법에 대한 유의한 부름의 축적수: 모든 샘플 (훈련 및 검증)을 사용해서 패혈증 군과 SIRS 군을 비교했음을 주지한다. 분석에서는 소실된 바이오마커 특성 수치들은 포함되지 않았다.
≤1e-04 ≤0.001 ≤0.01 ≤0.025 ≤0.05 ≤0.1 ≤1
p-값 (비조정) 0 27 38 38 38 38 44
p-값 (조정) 0 23 38 38 38 38 44
q-값 0 36 38 39 39 39 44
CART. 훈련 세트에서 패혈증 하위집단과 SIRS 하위집단을 판별하는 바이오마커를 확인하기 위해 윌콕슨 및 Q-수치 시험을 이용해서 미세배열 데이타를 분석하는 것 이외에도, 분류 및 회귀계통도 (CART) 분석을 이용하였다. CART는 상기 섹션 5.5.1에 기재되어 있다. 구체적으로, 상기 요약된 데이타를 사용해서 데이타의 최적 단일-변수 분리를 기초로 데이타를 반복적으로 분배함으로써 질환 상태를 예측하였다. 달리 말하면, 계통도 작성 과정의 각 단계에서, 훈련 집단 사이에서 패혈증 집단과 SIRS 집단을 최적으로 판별하는 발현 수치를 나타내는 바이오마커는 결정 분지로서 요구된다. 교차-검증을 수행하였으며, 각각의 10회 반복에서 최적의 분리 수를 독립적으로 평가하였다. 최종 계통도는 중요도 순서로 OSM, HLA-DRA, 및 IL-18로 나열된 3개의 바이오마커를 사용하며, 이중에서 OSM이 가장 중요했다. 교차-검증된 CART 알고리즘으로부터의 최종 계통도를 기초로 하는 훈련 데이타의 혼동 행렬은 표 74에 제시되어 있다. 이 혼동 행렬로부터, 전체 정확도는 47.6% 내지 84.1%의 95% 신뢰 구간에서 67.9%인 것으로 평가되었다. 민감도는 64.3%이었으며, 특이도는 71.4%이었다.
교차-검증된 CART 알고리즘을 이용한, 훈련 샘플에 대한 혼동 행렬
사실적 진단
예측 패혈증 SIRS
패혈증 9 4
SIRS 5 10
훈련 데이타 세트로부터 도로 보유된 9개의 검증 샘플의 경우, 전체 정확도는 51.8% 내지 99.7%의 95% 신뢰 구간에서 88.9%이고, 민감도는 75%이며, 특이도는 100%인 것으로 평가되었다. 표 75는 검증 샘플에 대한 혼동 행렬을 나타낸다.
교차-검증된 CART 알고리즘을 이용한, 검증 샘플에 대한 혼동 행렬
사실적 진단
예측 패혈증 SIRS
패혈증 3 0
SIRS 1 5
랜덤 포레스트. 본 발명의 바이오마커를 이용해서 개발될 수 있는 다른 의사결정 규칙은 랜덤 포레스트 의사결정계통도이다. 랜덤 포레스트는 교차-검증 대신 부트스트랩핑을 이용하는 계통도 기초의 방법이다. 각 반복에서, 무작위 샘플 (대체물을 가짐)을 도시하고, 가능한 가장 큰 계통도를 성장시킨다. 각 계통도는 최종 분류 예측에서 의사표시를 수용한다. 랜덤 포레스트를 피팅하기 위해, 계통도의 수 (예, 부트스트랩 반복)를 지정한다. 이 데이타의 경우, 1000개의 계통도를 사용해서 알고리즘을 훈련시킨다. 이 알고리즘을 이용하는 경우, 44개의 바이오마커 중 35개는 0이 아닌 중요도를 가졌으며, 모델에서 사용되었다. 바이오마커 중요도는 가장 큰 것부터 가장 작은 것 순으로 OSM, GADD45B, ARG2, JL18R1, TDRD9, PFKFB3, MAPK14, PRV1, MAP2K6, TNFRSF6, FCGR1A, INSL3, LY96, PSTPIP2, ANKRD22, TNFSF1O, HLA-DRA, FNDC3B, TIFA, GADD45A, VNN1, ITGAM, BCL2A1, TLR4, TNFSF13B, SOCS3, IL1RN, CEACAM1, 및 SOD2이었다.
랜덤 포레스트 방법은 다수의 상이한 의사결정계통도를 이용한다. 바이오마커는 유의한 랜덤 포레스트 분석으로부터의 의사결정계통도의 결정 분지로서 작용하는 경우에 판별 유의성을 갖는 것으로 고려된다. 본원에 사용된 바와 같이, 유의한 랜덤 포레스트 분석은, 훈련 데이타 세트에 대한 교차 검증에 의한 정확도에 대하여 하위 95% 신뢰 구간이 50%를 초과하며 검증 세트에 대한 정확도의 경우에 지점 평가는 65%를 초과하는 분석이다.
랜덤 포레스트 방법을 이용해서 개발된 의사결정계통도를 이용하는 훈련 데이타 세트에 대한 예측된 혼동 행렬은 표 76에 제시되어 있다. 이 혼동 행렬로부터, 전체 정확도는 78.6%인 것으로 평가되었다. 민감도는 78.6%이었으며, 특이도는 78.6%이었다.
랜덤 포레스트 방법을 이용해서 발생시킨 의사결정계통도에 대하여, 훈련 샘플에 대한 혼동 행렬
사실적 진단
예측 패혈증 SIRS
패혈증 11 3
SIRS 3 11
훈련으로부터 도로 보유된 9개의 검증 샘플의 경우, 전체 정확도는 40.0% 내지 97.2%의 95% 신뢰 구간에서 77.8%이고, 민감도는 50%이고, 특이도는 100%인 것으로 평가되었다. 표 77은 검증 샘플에 대한 혼동 행렬을 나타낸다.
랜덤 포레스트 방법을 이용해서 발생시킨 의사결정계통도에 대하여, 검증 샘플에 대한 혼동 행렬
사실적 진단
예측 패혈증 SIRS
패혈증 5 0
SIRS 2 2
MART. "농도구배 부스팅 기계"라고도 알려진 다중 가법 회귀계통도 (MART)를 이용해서 바이오마커의 중요도를 평가함과 동시에 대상 샘플을 분류한다. 이 접근법에서는 (i) 계통도 수, (ii) 단계 크기 (통상적으로 "축소"라고 지칭함), 및 (iii) 상호작용 정도 (각 계통도에 대한 분리 수와 관련됨)를 비롯한 여러 피팅 파라미터가 지정된다. MART에 대한 더 많은 정보는 상기 섹션 5.5.4에 기재되어 있다. 상호작용 정도를 1로 설정하여 가법 모델을 시행하였다 (예를 들어, 각 계통도가 하나의 분리를 가지며 하나의 바이오마커만을 사용함).
평가 상호작용은 잘 기능하기 위해 더 많은 데이타를 필요로 할 수 있다. 모델 복잡성이 계통도 수에 의해 결정되도록 단계 크기를 0.05로 설정하였다. 최적의 계통도 수는 각각의 피팅 반복에서 무작위 하위세트의 경우를 생략한 다음, 이 하위세트 상에서 예측 품질을 사정함으로써 평가되었다. 보장된 것보다 더 많은 계통도를 피팅한 다음, 예측 수행이 개선을 중단시킨 지점을 최적의 지점으로 평가하였다.
평가된 모델은 21개의 계통도와, 모든 계통도에 걸쳐 9개의 바이오마커를 사용하였다. MART 알고리즘은 또한 바이오마커 중요도 (총 합은 100%임)의 계산을 제공한다. 모델에 대해 첫 번째의 가장 중요한 바이오마커로부터 시작해서 중요도가 감소하는 순서로 등급화된 바이오마커는 ARG2, GADD45B, OSM5 LY96, INSL3, ANKRD22, MAP2K6, PSTPIP2, 및 TGFB1이었다.
교차-검증을 수행하였으며, 최적의 계통도 수를 10회 반복의 각각에서 독립적으로 평가하였다. 예측된 분류가 교차-검증된 모델로부터 만들어진 훈련 데이타에 대한 혼동 행렬은 표 78에 제시되어 있다. 이 혼동 행렬로부터, 전체 정확도는 55.1% 내지 89.3%의 95% 신뢰 구간에서 75%인 것으로 평가되었다. 민감도는 71.4%이었고, 특이도는 78.6%이었다.
교차-검증된 MART 알고리즘을 이용한, 훈련 샘플에 대한 혼동 행렬
사실적 진단
예측 패혈증 SIRS
패혈증 10 3
SIRS 4 11
훈련으로부터 도로 보유된 9개의 검증 샘플의 경우, 전체 정확도는 51.8% 내지 99.7%의 95% 신뢰 구간에서 88.9%이고, 민감도는 100%이며, 특이도는 75%인 것으로 평가되었다. 표 79는 검증 샘플에 대한 혼동 행렬을 나타낸다.
MART 알고리즘을 이용한, 검증 샘플에 대한 혼동 행렬
사실적 진단
예측 패혈증 SIRS
패혈증 5 1
SIRS 0 3
PAM. 본 발명의 바이오마커를 이용해서 개발한 또 다른 의사결정 규칙은 상기 섹션 5.5.2에 기재된 미세배열의 분석 (PAM)을 예측한다. 이 방법에서, 샘플을 분류하는 데 사용된 바이오마커 수를 결정하는 축소 파라미터를 지정한다. 이 파라미터는 교차-검증을 통해 선택되었다. 수치 소실이 있는 바이오마커는 존재하지 않았다. 교차-검증을 기초로, 최적의 역치 수치는 6개의 바이오마커에 상응하는 2.05이었다.
2.05의 역치를 사용해서, 훈련 샘플에 대한 전체 정확도는 68.7% 내지 91%의 95% 신뢰 구간에서 82.5%인 것으로 평가되었다. 민감도는 78.6%이었으며, 특이도는 85.7%이었다. 표 80은 예측된 분류가 교차-검증된 모델로부터 만들어진 것인 훈련 데이타에 대한 혼동 행렬을 나타낸다.
교차-검증된 PAM 알고리즘을 이용한, 훈련 샘플에 대한 혼동 행렬
사실적 진단
예측 패혈증 SIRS
패혈증 11 2
SIRS 3 12
훈련으로부터 도로 보유된 9개의 검증 샘플의 경우, 전체 정확도는 40% 내지 97.2%의 95% 신뢰 구간에서 77.8%이고, 민감도는 50%이고, 특이도는 100%인 것으로 평가되었다. 표 81은 검증 샘플에 대한 혼동 행렬을 나타낸다.
교차-검증된 PAM 알고리즘을 이용한, 검증 샘플에 대한 혼동 행렬
사실적 진단
예측 패혈증 SIRS
패혈증 2 0
SIRS 2 5
PAM에 의해 확인된 상부의 6개의 바이오마커는 가장 중요한 것으로부터 가장 덜 중요한 것 순서로 GADD45B, TDRD9, MAP2K6, OSM, TNFSF1O, 및 ANKRD22로 등급화되었다. 도 48은 이 섹션에서 분석된 44개의 바이오마커에 대한 T-12 정적 데이타를 이용하는 95% 신뢰 구간과 관련하여 CART, MART, PAM, 및 랜덤 포레스트 (RF) 분류 알고리즘 (의사결정 규칙) 수행의 요약을 제공한다. 도 48에 요약된 RT-PCR 분석 결과를 기초로 다른 시점에서, 이 확인 과정에서 연구중인 모든 44개의 바이오마커는 유의하였다. 일부 바이오마커는 T-60과 같이 초기에 판별되었다.
6.13 선택 단백질 바이오마커
이 실시예에서, 추후에 패혈증이 발병한 환자 ("패혈증 환자")와 패혈증이 발병하지 않은 환자 ("SIRS 환자") 사이에서 단백질 기재의 바이오마커가 차이가 있는지를 확인하기 위한 실험을 수행하였다. 발견 과정에서, 섹션 6.13.1에 기재된 바와 같이 비드 기재의 단백질 면역검정에 의해 샘플을 분석하였다.
6.13.1 비드 기재의 단백질 면역검정을 이용한 단백질 바이오마커의 발견
다중 분석. 전체 개시내용이 본원에 참고로 포함되는 미국 특허 제5,981,180호 (" '180 특허")에 기재된 다중 분석 방법, 및 특히 일반적인 방법에 대한 교시의 경우 비드 기술, 시스템 하드웨어 및 항체 검출을 이용하여 바이오마커 세트를 실시간으로 동시에 분석하였다. 이 분석에서, 미세입자의 매트릭스를 합성하였는데, 매트릭스는 상이한 미세입자 세트들로 구성되었다. 각 미세입자 세트는 미세입자 표면 상에 고정된 수천개의 별개의 항체 포획 시약 분자를 가졌으며, 다양한 양의 두 가지 형광 염료를 혼입시킴으로써 색상을 구분하였다. 두 가지 형광 염료의 비율은 각 미세입자 세트에 대하여 상이한 방출 스펙트럼을 제공하였으며, 이로써 다양한 미세입자 세트의 푸울링(pooling) 후에 세트 내에서 미세입자를 확인할 수 있었다. 미국 특허 제6,268,222호 및 동 제6,599,331호는 또한 전체 개시내용, 특히 다중 분석에서 미세입자를 표지하는 다양한 방법에 대한 교시내용이 본원에 참고로 포함된다.
표지된 비드 세트를 푸울링하고, 개체로부터의 혈장 샘플과 조합하였다. 표지된 비드는, 형광단 표지를 여기시킨 레이저 빔을 사용해서 각 미세입자의 정보를 얻는 유동 장치를 통해 일렬 종대로 통과시킴으로써 확인하였다. 이어서, 광학 검출기로 각 비드의 방출 스펙트럼을 측정하여 비드를 적절한 세트로 분류하였다. 각 항체의 포획 시약은 각 미세입자 세트에 대하여 동일한 것으로 공지되어 있기 때문에, 각 항체의 특이도는 유동 장치를 통과한 개별 미세입자에 대등하였다. 미국 특허 제6,592,822호는 또한 전체 개시내용, 특히 이러한 유형의 다중 분석에서 사용될 수 있는 다중-분석물 진단 시스템에 대한 교시내용이 본원에 참고로 포함된다.
주어진 미세입자 세트와 결합한 분석물의 양을 결정하기 위해, 리포터 분자를 첨가하여 이 분자가 각 분석물에 결합된 항체와 복합체를 형성하도록 하였다. 이 예에서, 리포터 분자는 형광단-표지된 2차 항체이었다. 리포터 상의 형광단은 상이한 여기 파장을 갖는 제2 레이저에 의해 여기되었으며, 그 결과 제2 항체 상의 형광단 표지를 미세입자를 표지하는데 사용된 형광단과 구별할 수 있었다. 제2 광학 검출기는 제2 항체 상의 형광단 표지로부터의 방출을 측정하여 포획 항체에 의해 결합된 분석물과 복합체를 이룬 제2 항체의 양을 결정하였다. 이러한 방식으로, 비드에 포획된 여러 분석물의 양을 단일 반응으로 측정할 수 있었다.
데이타 분석 및 결과. 각 샘플의 경우, 여러 상이한 항체와 결합한 분석물의 농도를 측정하였다. 각 분석물은 바이오마커이며, 샘플 중 각 분석물의 농도는 이 바이오마커의 특성일 수 있다. 전체 개시내용이 본원에 참고로 포함되는 미국 특허 출원 제2004/0096917 A1호의 표 14에 기재된 선택 항체 시약을 사용해서 바이오마컬르 분석하였다. 이들 항체 시약은 룰스 베이스드 메디신(Rules Based Medicine; Austin, Texas)에서 시판된다. 항체 시약은 (1) 혈액의 순환성 단백질 바이오마커 성분, (2) 다양한 병원체와 연관된 분자와 통상적으로 결합하는 순환성 항체 (각 바이오마커가 연관되는 표시된 병원체에 의해 확인됨), 또는 (3) 다양한 질환 상태와 연관되는 자가항체 바이오마커와 특이적으로 결합하는 것으로 분류된다. 개체를 SIRS 또는 패혈증 군으로 분류하는 의사결정 규칙에 제공될 수 있는 특성을 확인하기 위해 다양한 접근법을 이용할 수 있다. 선택된 방법은 CART, MART, PAM 및 랜덤 포레스트이었다.
여러 샘플 중의 바이오마커는 상기 기재된 검정을 이용해서 여러 시점에서 측정하였으며, 여러 상이한 방식 (정적 진입 시간, 정적 T-60, 정적 T-36, 기저선 T-60, 기저선 T-36, 및 기저선 T-12 데이타 지점)으로 분석하였다. 이들 분석의 대표적인 것으로는 하기에 상세히 기재된 정적 T-12 데이타 분석이 있다. T-12 정적 분석에서, 상기 섹션 6.4에 정의된 바와 같이, T-12 혈액 샘플로 표시된 특정 혈액 샘플을 사용해서 바이오마커 특성을 측정하였다.
T-12 정적 분석의 경우, 97개의 샘플에 대하여 측정된 60개의 바이오마커가 존재하였다. 각 샘플은 상이한 구성원 집단으로부터 수집하였다. 이들 바이오마커 중에서, 53개는 로그 변환에 의해 변화시켰고, 11개는 제곱근 변환에 의해 변환시켰으며, 나머지는 변환시키지 않았다.
먼저, 97개 구성원의 집단을 훈련 세트 (n = 74) 및 검증 세트 (n = 23)로 분리하였다. 훈련 세트를 사용해서 적절한 분류 알고리즘 파라미터를 평가하였으며, 훈련된 알고리즘을 검증 세트에 적용하여 수행을 독립적으로 평가하였다. 74개의 훈련 샘플들 중에서, 36개는 패혈증으로 표지되었는데, 이는 대상들이 관찰 기간 동안 어떤 시점에서 패혈증이 발병했음을 의미하고, 38개는 SIRS로 표지되었는데, 이는 대상들이 관찰 기간 동안 패혈증이 발병하지 않았음을 의미한다. 표 82는 이들 샘플의 인종, 성별 및 연령의 분포를 제공한다.
훈련 데이타에 대한 인종, 성별 및 연령의 분포
성별 흑인 백인 기타
패혈증 남성 10 14 1
여성 0 10 1
SIRS 남성 5 24 0
여성 0 9 0
최소 평균 중위 최대
패혈증 18 43.2 40 80
SIRS 18 44.9 40 90
23개의 검증 샘플의 경우, 12개는 패혈증으로 표지되었으며, 11개는 SIRS로 표지되었다. 표 83은 이들 샘플에 대한 인종, 성별 및 연령의 분포를 제공한다.
검증 데이타에 대한 인종, 성별 및 연령의 분포
성별 흑인 백인 기타
패혈증 남성 0 7 0
여성 0 4 0
SIRS 남성 2 6 0
여성 0 4 0
최소 평균 중위 최대
패혈증 18 43.4 43 81
SIRS 19 51.9 51.5 85
훈련 데이타의 각 샘플은 교차-검증에 사용된 10개 군 중 하나로 무작위로 지정되었다. 이들 군에서 훈련 샘플의 수는 6개 내지 8개의 범위이다. 샘플들은 이들 중 패혈증 샘플수 및 SIRS 샘플수의 균형을 맞추기 위해 시도된 방식으로 지정되었다. 이하에 보다 상세히 기재된 바와 같이, 여러 상이한 방법을 이용해서 선택 바이오마커가 패혈증 군과 SIR 군의 차이를 판별하는지를 판단하였다.
윌콕슨 및 Q-수치 시험. 판별 바이오마커를 확인하기 위해 사용된 첫 번째 방법은 윌콕슨 시험이었다 (비조정). 훈련 데이타에 있어서 샘플들 사이에서 주어진 바이오마커에 대한 풍부도 수치를 윌콕슨 시험으로 처리하였다. 윌콕슨 시험은 군 분류 (패혈증 대 SIRS) 및 풍부도 수치를 둘 다 고려해서 주어진 바이오마커에 대한 p 값을 계산하였다. p 값은 훈련 세트에서 수집된 샘플들간의 주어진 바이오마커에 대한 풍부도 수치가 패혈증 상태와 SIRS 상태를 얼마나 잘 판별해내는지를 표시한다. p 값이 더 낮을수록, 판별은 우수하다. p 값이 특정 신뢰 수준, 예를 들면 0.05 미만이면, 바이오마커가 패혈증 표현형과 SIR 표현형을 판별한 것으로 추론한다. 이 방법을 이용하는 24개의 유의한 바이오마커가 존재하였다 (표 84 참조).
판별 바이오마커를 확인하기 위해 사용된 두 번째 방법은 윌콕슨 시험 (조정)이었다. 다수, 즉 60개의 바이오마커와 상대적으로 소수, 즉 97개의 샘플로 인해, 유의한 바이오마커를 허위로 발견할 위험이 높았다. 조정된 p 값을 사용해서 이 위험을 저지하였다. 특히, 전체 개시내용이 본원에 참고로 포함되는 문헌 [Benjamini and Hochberg, 1995, J.R. Statist. Soc. B 57, pp 289-300]의 방법을 이용해서 허위 발견 비율을 조절하였다. 여기서, 허위 발견 비율이란 진정으로 유의한 바이오마커의 수를 유의한 것으로 표시한 바이오마커의 수로 나눈 값으로 정의된다. 예를 들어, 조정된 p 값이 0.05 미만이면, 바이오마커가 허위로 발견되었을 확률이 5%이다. 이 시험을 이용한 결과는 표 84에 보고되어 있다. 이 방법을 이용하는 16개의 유의한 바이오마커가 존재하였다 (표 84 참조). 여기서 사용된 바와 같이, 바이오마커는 윌콕슨 시험 (조정)에 의해 결정된 바로는 0.05 미만의 p 값을 갖는 경우에 유의한 것으로 고려된다.
판별 바이오마커를 확인하기 위해 사용된 세 번째 방법은 Q 값을 사용하는 것이었다. 이 방법에서, 바이오마커는 이들의 q 값에 의해 배열되었으며, 각 바이오마커가 X의 q 값을 갖는 경우, 각 바이오마커 및 보다 유의한 모든 다른 것들은 X의 허위 발견 비율을 겸비하였다. 그러나, 임의의 한가지 바이오마커에 대한 허위 발견 비율은 훨씬 더 클 수 있다. 이 방법을 이용하는 16개의 유의한 바이오마커가 존재하였다 (표 84 참조).
세 가지 방법에 대한 유의한 부름의 축적수: 모든 샘플 (훈련 및 검증)을 사용해서 패혈증 군과 SIRS 군을 비교했음을 주지한다. 분석에서는 소실된 바이오마커 특성 수치들은 포함되지 않았다.
≤1e-04 ≤0.001 ≤0.01 ≤0.025 ≤0.05 ≤0.1 ≤1
p-값 (비조정) 0 6 14 20 24 25 60
p-값 (조정) 0 0 6 13 16 24 60
q-값 0 0 13 20 25 31 60
CART. 훈련 세트에서 패혈증 하위집단과 SIRS 하위집단을 판별하는 바이오마커를 확인하기 위해 윌콕슨 및 Q-수치 시험을 이용해서 미세배열 데이타를 분석하는 것 이외에도, 분류 및 회귀계통도 (CART) 분석을 이용하였다. CART는 상기 섹션 5.5.1에 기재되어 있다. 구체적으로, 상기 요약된 데이타를 사용해서 데이타의 최적 단일-변수 분리를 기초로 데이타를 반복적으로 분배함으로써 질환 상태를 예측하였다. 달리 말하면, 계통도 작성 과정의 각 단계에서, 훈련 집단 사이에서 패혈증 집단과 SIRS 집단을 최적으로 판별하는 발현 수치를 나타내는 바이오마커는 결정 분지로서 요구된다. 교차-검증을 수행하였으며, 각각의 10회 반복에서 최적의 분리 수를 독립적으로 평가하였다. 최종 계통도는 도 49에 도시되어 있으며, 10 가지 바이오마커, 즉 M1P1베타, 트롬보포이에틴, C 반응성 단백질, IL-IO, IL-16, 베타-2 마이크로글로불린, 알파페토단백질, IL-6, 아디포넥틴, 및 ICAM1을 이용한다.
도 50은 훈련 데이타 세트에서 패혈증 및 SIRS 군 사이의 의사결정계통도에서 사용된 10가지 바이오마커의 분포를 나타낸다. 도 50에서, 각 박스의 상단은 훈련 세트에 따른 데이타의 75번째 백분위수(percentile)를 나타내고, 각 박스의 하단은 25번째 백분위수를 나타내며, 훈련 세트에 따른 각 바이오마커에 대한 중위값은 각 박스 내에서 선으로 표시한다. 교차-검증된 모델로부터 예측된 분류가 작성된 훈련 데이타에 대한 혼동 행렬은 표 85에 제시되어 있다. 이 혼동 행렬로부터, 전체 정확도는 51.5% 내지 74.4%의 95% 신뢰 구간에서 63.5%인 것으로 평가되었다. 민감도는 66.7%이고, 특이도는 60.5%이었다.
교차-검증된 CART를 이용한, 훈련 샘플에 대한 혼동 행렬
사실적 진단
예측 패혈증 SIRS
패혈증 24 15
SIRS 12 23
훈련 데이타 세트로부터 도로 보유된 23개의 검증 샘플의 경우, 전체 정확도는 42.7% 내지 83.6%의 95% 신뢰 구간에서 65.2%이고, 민감도는 66.7%이며, 특이도는 63.6%인 것으로 평가되었다. 표 86은 검증 샘플에 대한 혼동 행렬을 나타낸다.
교차-검증된 CART를 이용한, 검증 샘플에 대한 혼동 행렬
사실적 진단
예측 패혈증 SIRS
패혈증 8 1
SIRS 4 10
랜덤 포레스트. 본 발명의 바이오마커를 이용해서 개발될 수 있는 다른 의사결정 규칙은 랜덤 포레스트 의사결정계통도이다. 랜덤 포레스트는 교차-검증 대신 부트스트랩핑을 이용하는 계통도 기초의 방법이다. 각 반복에서, 무작위 샘플 (대체물을 가짐)을 도시하고, 가능한 가장 큰 계통도를 성장시킨다. 각 계통도는 최종 분류 예측에서 의사표시를 수용한다. 랜덤 포레스트를 피팅하기 위해, 계통도의 수 (예, 부트스트랩 반복)를 지정한다. 이 예에서는, 500개 이하가 사용되었지만, 번-인(burn-in) 기간에는 50개 이상이 필요하다. 계통도 수는 훈련 데이타의 정확도를 기초로 선택되었다. 이 데이타의 경우, 64개의 계통도를 사용해서 알고리즘을 훈련시켰다 (도 51 참조). 도 51에서, 그래프 4802는 계통도 수의 함수로서 전체 정확도의 간략한 평가이다. 그래프 4804는 계통도 수의 함수로서 계통도 민감도의 간략한 그래프이다. 그래프 4806은 계통도 수의 함수로서 계통도 특이도의 간략한 그래프이다. 이 알고리즘을 사용해서, 34개의 바이오마커는 0이 아닌 중요도를 가졌으며, 모델에서 사용되었다. 랜덤 포레스트 알고리즘은 훈련 정확도에서의 평균 감소에 의해 바이오마커 중요도를 측정한다. 바이오마커는 이 방법에 의해 등급화되었으며, 도 52에 나타나 있다. 랜덤 포레스트 방법은 다수의 상이한 의사결정계통도를 이용한다. 바이오마커는 유의한 랜덤 포레스트 분석으로부터의 의사결정계통도의 결정 분지로서 작용하는 경우에 판별 유의성을 갖는 것으로 고려된다. 본원에 사용된 바와 같이, 유의한 랜덤 포레스트 분석은 훈련 데이타 세트에 대한 교차 검증에 의한 하위 95% 신뢰 구간이 50% 초과이며 검증 세트에 대한 정확도의 지점 평가가 65% 초과인 분석이다.
랜덤 포레스트 방법을 이용해서 개발된 의사결정계통도를 사용한 훈련 데이타세트에 대한 예측된 혼동 행렬은 표 87에 제시되어 있다. 이 혼동 행렬로부터, 전체 정확도는 70.3%인 것으로 평가되었다 (부트스트랩 정확도 평가를 이용하는 경우, 신뢰 구간은 계산될 수 없음). 민감도는 69.4%이었으며, 특이도는 71.1%이었다.
랜덤 포레스트 방법을 이용해서 발생시킨 의사결정계통도에 대하여, 훈련 샘플에 대한 혼동 행렬
사실적 진단
예측 패혈증 SIRS
패혈증 27 11
SIRS 11 25
훈련 데이타 세트로부터 도로 보유된 23개의 검증 샘플의 경우, 전체 정확도는 38.5% 내지 80.3%의 95% 신뢰 구간에서 60.9%이고, 민감도는 83.3%이며, 특이도는 36.4%인 것으로 평가되었다. 표 88은 검증 샘플에 대한 혼동 행렬을 나타낸다.
랜덤 포레스트 방법을 이용해서 발생시킨 의사결정계통도에 대하여, 23개의 검증 샘플에 대한 혼동 행렬
사실적 진단
예측 패혈증 SIRS
패혈증 10 7
SIRS 2 4
MART. MART를 이용해서 바이오마커의 중요도를 평가함과 동시에 대상 샘플을 분류하였다. 이 접근법에서는 (i) 계통도 수, (ii) 단계 크기 (통상적으로 "축소"라고 지칭함), 및 (iii) 상호작용 정도 (각 계통도에 대한 분리 수와 관련됨)를 비롯한 여러 피팅 파라미터가 지정된다. MART에 대한 더 많은 정보는 상기 섹션 5.5.4에 기재되어 있다. 상호작용 정도를 1로 설정하여 가법 모델을 시행하였다 (예를 들어, 각 계통도가 하나의 분리를 가지며 하나의 바이오마커만을 사용함).
상호작용 정도를 1로 설정하여 가법 모델을 시행하였는데 (예를 들어, 각 계통도는 하나의 분리를 가지며 하나의 특성만을 이용함), 이는 흔히 약한 상호작용이 존재하는 경우에도 잘 작용하기 때문이다. 게다가, 평가 상호작용은 잘 기능하기 위해 더 많은 데이타를 필요로 할 수 있다. 모델 복잡성이 계통도 수에 의해 결정되도록 단계 크기를 0.05로 설정하였다. 최적의 계통도 수는 각각의 피팅 반복에서 무작위 하위세트의 경우를 생략한 다음, 이 하위세트 상에서 예측 품질을 사정함으로써 평가되었다. 보장된 것보다 더 많은 계통도를 피팅한 다음, 예측 수행이 개선을 중단시킨 지점을 최적의 지점으로 평가하였다.
평가된 모델은 11개의 계통도와, 모든 계통도에 걸쳐 4개의 바이오마커를 사용하였다. MART 알고리즘은 또한 도 53에 제시된 바이오마커 중요도 (총 합은 100%임)의 계산을 제공한다. 중요도가 0인 바이오마커는 배제한다. 도 54는 패혈증 군과 SIRS 군 사이에서 선택된 바이오마커의 분포를 나타낸다.
교차-검증을 수행하였으며, 최적의 계통도 수를 10회 반복의 각각에서 독립적으로 평가하였다. 예측된 분류가 교차-검증된 모델로부터 만들어진 훈련 데이타에 대한 혼동 행렬은 표 89에 제시되어 있다. 이 혼동 행렬로부터, 전체 정확도는 58.5% 내지 80.3%의 95% 신뢰 구간에서 70.3%인 것으로 평가되었다. 민감도는 63.9%이었고, 특이도는 76.3%이었다.
교차-검증된 MART 알고리즘을 이용한, 훈련 샘플에 대한 혼동 행렬
사실적 진단
예측 패혈증 SIRS
패혈증 23 9
SIRS 13 29
훈련으로부터 도로 보유된 23개의 검증 샘플의 경우, 전체 정확도는 51.6% 내지 89.8%의 95% 신뢰 구간에서 73.9%이고, 민감도는 63.6%이며, 특이도는 83.3%인 것으로 평가되었다. 표 90은 검증 샘플에 대한 혼동 행렬을 나타낸다.
MART 알고리즘을 이용한, 검증 샘플에 대한 혼동 행렬
사실적 진단
예측 패혈증 SIRS
패혈증 7 2
SIRS 4 10
PAM. 본 발명의 바이오마커를 이용해서 개발한 또 다른 의사결정 규칙은 상기 섹션 5.5.2에 기재된 미세배열의 분석 (PAM)을 예측한다. 이 방법에서, 샘플을 분류하는 데 사용된 바이오마커 수를 결정하는 축소 파라미터를 지정한다. 이 파라미터는 교차-검증을 통해 선택되었다. 수치 소실이 있는 바이오마커는 존재하지 않았다. 교차-검증을 기초로, 최적의 역치 수치는 59개의 바이오마커에 상응하는 0.08이었다. 도 55는 상이한 역치들에 따른 정확도를 나타낸다. 도 55에서, 그래프 5202는 전체 정확도이다 (95% 신뢰 구간 막대를 가짐). 그래프 5204는 역치 수치의 함수로서 의사결정 규칙 민감도를 나타낸다. 그래프 5206은 역치 수치의 함수로서 의사결정 규칙 특이도를 나타낸다. 0.08의 역치를 사용해서, 훈련 샘플에 대한 전체 정확도는 65.3% 내지 82.5%의 95% 신뢰 구간에서 74.9인 것으로 평가되었다. 민감도는 78.9%이었으며, 특이도는 69.4%이었다. 표 91은 예측된 분류가 교차-검증된 모델로부터 만들어진 훈련 데이타에 대한 혼동 행렬을 나타낸다.
교차-검증된 PAM 알고리즘을 이용한, 훈련 샘플에 대한 혼동 행렬
사실적 진단
예측 패혈증 SIRS
패혈증 30 11
SIRS 8 25
훈련으로부터 도로 보유된 23개의 검증 샘플의 경우, 전체 정확도는 42.7% 내지 83.6%의 95% 신뢰 구간에서 65.2%이고, 민감도는 91.7%이며, 특이도는 36.4%인 것으로 평가되었다. 표 92는 검증 샘플에 대한 혼동 행렬을 나타낸다.
교차-검증된 PAM 알고리즘을 이용한, 검증 샘플에 대한 혼동 행렬
사실적 진단
예측 패혈증 SIRS
패혈증 11 7
SIRS 1 4
도 56은 모델에서 상대 판별력 및 상대 중요도에 의해 등급화된, 선택된 바이오마커를 나타낸다.
도 57은 95% 신뢰 구간과 관련하여 CART, MART, PAM, 및 랜덤 포레스트s (RF) 분류 알고리즘 (의사결정 규칙) 수행의 요약을 제공한다. 50개의 상이한 바이오마커를 도 58에 예시된 모든 알고리즘으로부터 선택하였다. 이들 50개의 선택된 특성들의 확인은 도 58에 기재되어 있다. 도 58은 T-12 데이타 세트에 대한 바이오마커의 전체 등급을 예시한다. 선택된 바이오마커의 경우, x-축은 선택된 횟수의 비율(%)을 나타낸다. 바이오마커가 선택된 횟수의 비율(%) 내에서, 바이오마커를 등급화한다.
T-12 데이타 세트 및 다른 데이타 세트의 분석으로부터, 섹션 16.3.2에 기재된 방법을 이용해서 10개의 단백질 기재의 바이오마커를 선택하여 확인하였다. 이들 바이오마커는 하기 표 93에 기재되어 있다.
면역검정으로부터의 확인을 위해 선택된 단백질 기재의 바이오마커
유전자 기호 유전자 명칭 유전자 관리 번호
IL-6 인터류킨 6 NM_000600 NP_000591
IL-8 인터류킨 8 M28130 AAA59158
CRP C 반응성 단백질 CAA39671 NM_000567
IL-10 인터류킨 10 NM_000572 CAH73907
APOC3 아포리포단백질 CIII NM_000040 CAA25648
MMP9 매트릭스 메탈로프로테이나제 9 (젤라티나제 B, 92KDA 젤라티나제, 92KDA 타입 IV 콜라게나제) NM_004994 NP_004985
TIMP1 메탈로프로테이나제 1의 조직 억제제 NM_003254 AAA75558
MCP1 단핵구 화학주성 단백질 1 AF493698, AF493697 AAQ75526
AFP 알파-페토단백질 NM_001134 CAA79592
B2M 베타-2 마이크로글로불린 NM_004048 AAA51811
표 93에 기재된 각 서열, 유전자, 단백질 및 프로브세트는 본원에 참고로 포함된다.
6.13.2 비드 기재의 단백질 면역검정을 이용한 단백질 바이오마커의 확인
표 93에 기재된 바이오마커의 확인은, 여러 시점에서 섹션 6.13.1에 기재된 동일한 검정을 이용해서 수행하였으며, 여러 상이한 방식 (정적 진입 시간, 정적 T-60, 정적 T-36, 기저선 T-60, 기저선 T-36, 및 기저선 T-12 데이타 지점)으로 분석하였다. 이들 분석의 대표적인 것으로는 하기에 상세히 기재된 정적 T-12 데이타 분석이 있다. T-12 정적 분석에서, 상기 섹션 6.4에 정의된 바와 같이 T-12 혈액 샘플로 표시된 특정 혈액 샘플을 사용해서 바이오마커 특성을 측정하였다. 도 59는 CART, MART, PAM 및 랜덤 포레스트를 이용하는 정적 T-12 비드 기재의 단백질 검정의 결과를 예시하며, 여기서 정적 T-12 시점은 섹션 6.4에 기재된 바와 같다. CART에 대한 훈련 및 검증 데이타세트 둘 다에서 최적의 의사결정계통도는 6개의 바이오마커를 사용하였다. 훈련 데이타 및 검증 데이타의 둘 다에 있어서, MART에 대한 평가된 모델은 모든 계통도에 걸쳐 4개의 바이오마커를 사용하였다. PAM을 이용하는 훈련 세트 및 검증 세트 둘 다에 있어서 총 7개의 바이오마커가 유의하였다. 랜덤 포레스트를 이용해서, 연구중인 4개의 바이오마커는 실제로 훈련 및 검증 데이타 세트 둘 다에서 판별 유의성을 갖는 것으로 나타났다. 도 59에 요약된 비드 기재의 단백질 면역검정의 분석 결과를 토대로, 섹션 6.13.1에 기재된 10개의 단백질 기재의 바이오마커의 각각을 상기 실험에 의해 확인하였다.
6.13.3 BD 세포계산 비드 어레이 검정을 이용한 단백질 바이오마커의 확인
BDTM CBA 인간 염증 키트(Human Inflammation Kit)에서 구체화된 바와 같은 BDTM 세포측정 비드 어레이 (CBA) 검정을 이용해서 IL-6, IL-8, 및 IL-IO 단백질을 확인하였다. 유동세포측정은 크기 및 색상을 기초로 상이한 입자를 판별해내는 분석 수단이다. 다중검정은 단일 샘플에서 다수의 분석물을 동시에 검정한다. CBA는 상이한 형광 강도를 갖는 일련의 입자를 이용해서 여러 가용성 분석물을 동시에 검출한다. CBA를 유동세포측정과 병행해서 다중검정을 생성시킨다. BD CBA 시스템은 유동세포측정에 의한 증폭된 형광 검출의 민감도를 이용해서 입자 기재의 면역검정에서 가용성 분석물을 측정한다. CBA의 각 비드는 특정 단백질에 대한 포획 표면을 제공하며, ELISA 플레이트에서 개별적으로 코팅된 웰과 유사하다. BD CBA 포획 비드 혼합물은 현탁액 중에 존재하여 작은 부피의 샘플에서 여러 분석물들을 검출해낼 수 있다.
CBA에서는 유동 세포측정을 통한 넓은 동적 범위의 형광 검출의 이점과 현탁된 입자를 통한 분석물의 효과적인 포획의 이점을 결합시킴으로써 보다 적은 샘플 희석물을 이용할 수 있으며 (통상의 ELISA에 비해) 실질적으로 더 적은 시간 내에 비공지 물질의 수치를 얻을 수 있다. BDTM CBA 인간 염증 키트를 사용해서 단일 샘플 내의 인터류킨-8 (IL-8), 인터류킨-1β (IL-1β), 인터류킨-6 (IL-6), 인터류킨-10 (IL-IO), 종양 괴사 인자 (TNF), 및 인터류킨-12p70 (IL-12p70) 단백질 수준을 정량적으로 측정할 수 있다. 기트 수행은 조직 배양 상등액, EDTA 혈장 및 혈청 샘플에서 특정 단백질의 분석에 대하여 최적화되었다.
상이한 형광 강도를 갖는 6개의 비드 집단을, IL-8, IL-1β, IL-6, IL-10, TNF, 및 IL-12p70 단백질에 대해 특이적인 포획 항체로 코팅하였다. 6개의 비드 집단을 함께 혼합하여 BDTM CBA를 형성시키고, 유동 세포측정기, 예를 들면 BD FACScan(TM) 또는 BD FACSCalibur(TM) 유동 세포측정기의 FL3 채널에서 분리해냈다. 포획 비드, PE-접합된 검출 항체, 및 재조합 표준물 또는 시험 샘플을 함께 인큐베이션하여 샌드위치 복합물을 형성시킨다. 유동 세포측정기를 사용하여 샘플 데이타를 획득한 다음, BDTM CBA 분석 소프트웨어를 사용해서 샘플 결과를 그래프 및 표 형태로 작성한다. BDTM CBA 인간 염증 키트에 대한 보다 상세한 내용은 전체 개시내용이 본원에 참고로 포함되는, BD 바이오사이언시즈로부터 얻을 수 있는 BDTM CBA 인간 염증 키트 지침 매뉴얼 (카탈로그 번호 551811)에 기재되어 있다. BDTM CBA 인간 염증 키트를 이용해서, 바이오마커 IL-6, IL-8, 및 IL-1O은 패혈증 및 SIRS를 판별해내는 것으로 확인되었다.
6.14 표 I에 기재된 바이오마커의 하위조합물 평가
본 발명의 한 실시양태는 대상을 패혈증 또는 SIRS로서 분류하기 위한 지표로서 표 I에 기재된 53개의 바이오마커들 중 임의의 2개 이상을 포함한다. 본 발명의 한 실시양태는 대상을 패혈증 또는 SIRS로서 분류하기 위한 지표로서 표 I에 기재된 53개의 바이오마커들 중 임의의 3개 이상을 포함한다. 이와 같이, 본 발명은 대상을 패혈증 또는 SIRS로서 분류하기 위한 지표로서 표 I에 기재된 53개의 바이오마커들의 임의의 하위조합물을 추가로 포함하되, 이러한 하위조합물에는 2개 또는 3개 이상의 바이오마커가 존재한다. 이 섹션은 표 I에 기재된 53개의 바이오마커들의 예시적인 하위조합물들의 지표 능력(predictive power)을 입증하는 실험을 개시한다. 수천개의 하위조합물들을 시험하였으며, 이들 하위조합물들의 대부분은 70 퍼센트 이상의 정확도를 가졌다. 이는 표 I에 기재된 53개의 바이오마커들의 가능한 대부분의 하위조합물들이 패혈증 대상과 SIRS 대상을 판별해낼 것임을 암시한다.
6.14.1 T -12 에서 핵산 바이오마커의 하위조합물
RT-PCR 핵산 데이타가 표 J에 보고된 바와 같이 이용가능한 것으로 총 44개의 바이오마커가 존재한다. 이 바이오마커 세트의 총 4800개의 상이한 하위조합물들은 섹션 6.12에 기재된 T-12 시점 데이타를 이용해서 구성하였다. 이어서, 각각의 상이한 하위조합물을, 패혈증 대상과 SIRS 대상을 판별해내는 능력에 대하여 시험하였다. 4800개의 하위조합물은 표 J에 보고된 본 발명의 44개의 바이오마커에 대해 가능한 하위조합물들의 총 개수의 무작위 샘플링을 나타낸다. 4800개 하위조합물들의 무작위도는 하기 알고리즘을 이용해서 확인하였다:
표 J로부터의 2개 내지 25개의 바이오마커를 고려함
{
현재의 넘버를 k로 정함;
이하를 200회 수행함
{
표 J로부터 무작위로 k 바이오마커를 선택함;
현재의 바이오마커 세트를 S로 정함;
}
이하를 10회 수행함
{
바이오마커 세트 S의 경우, 환자의 10%를 검증 집단으로 지정하고, 90%를 훈련 집단으로 지정함;
T-12 시점 데이타를 갖는 랜덤 포레스트를 이용해서 모델을 훈련 집단으로 핏팅함;
검증 집단에 대한 결과를 예측함;
공지된 상태의 검증 집단과의 일치도를 계산함;
}
10개의 일치도를 평균하여 보고함;
k = k+1로 설정함;
k > 10인 경우 종료; 그렇지않으면 상단으로 리턴함;
}
종료
T-12 데이타가 상기 기재된 발견 및 확인 데이타의 조합으로부터 이용가능한 것으로 총 152명의 환자들이 존재하였다. 이들 152명의 환자들 중에서, 80명은 패혈증이었으며, 72명은 SIR이었다. 계산에서는 상기 시험의 200개의 하위조합물들을 각각 2 내지 25의 간격으로 기재하였다. 달리 말하면, 총 24개의 하위조합물 군의 경우(각 하위조합물 군은 각각 k 바이오마커 (k는 세트 2 내지 25에서의 번호임)를 갖는 200개의 바이오마커 하위조합물로 구성됨)에는 각각 표 J로부터 무작위 선택된 25개의 바이오마커로 구성된 200개의 하위조합물을 통해, 각각 표 J로부터 무작위 선택된 2개의 바이오마커로 구성된 200개의 하위조합물을 시험하였고, 각각 표 J로부터 무작위로 선택된 3개의 바이오마커로 구성된 200개의 하위조합물들을 시험하는 등의 시험을 수행하였다.
고려 대상인 모든 바이오마커에 대한 검정 결과를 갖는 데이타 세트는 특이적인 바이오마커 명칭 목록으로 메모리에 유지되었다. 특정 크기 (k = 3)의 하위세트를 평가하기 위해, R 소프트웨어 패키지가 제공된 가(pseudo)-무작위 번호 발생기를 사용해서 특이적 바이오마커 명칭 세트로부터 다수 (3개)의 바이오마커 명칭을 무작위로 선택하였다. 전체 개시내용이 본원에 참고로 포함되는 문헌 [Venables and Smith, An Introduction to R, ISBN 0-9541617-4-2]을 참조한다. 선택된 바이오마커 명칭에 대한 검정 결과의 행렬을 구성하였다. 일부 바이오마커는 하나 초과의 검정 결과를 갖기 때문에, 상기 행렬은 선택된 바이오마커 명칭의 수보다 더 많은 컬럼을 가질 수 있었다. 이어서, 모델링 기술 "랜덤 포레스트"를 이용하는 경우에 실제 예측 정확도의 평가를 상기 행렬에 대하여 구성하였다. 전체 개시내용이 본원에 참고로 포함되는 문헌 [Machine Learning 45(1), pp. 5-32]에 기재된 바와 같이 랜덤 포레스트 알고리즘을 이용하였다.
주어진 데이타 행렬의 경우, 실제 예측 정확도의 예측치는 다음과 같이 계산하였다: 환자의 10%를 균형 방식으로 무작위 선택하였으며, 즉 패혈증 환자의 10% 및 SIRS 환자의 10%를 선택하였다. 선택된 환자를 검증 집단에 대해 할당하였으며, 랜덤 포레스트 모델을 나머지 데이타 (훈련 집단)에 피팅하였다. 훈련 데이타 또는 할당 데이타에서 임의의 수치 소실이 존재하였다면, 회귀 분배 모델을 다른 검정 결과 및 패혈증/SIRS 정보에 피팅하여 검정 수치를 예측하였다. 회귀 분배 모델은 전체 개시내용이 본원에 참고로 포함되는 문헌 [Breiman et al, 1984, Classification and Regression Trees, Wadsworth]에 기재되어 있다. 이어서, 소실 수치를 그의 예측 수치로 대체하였다. 할당 데이타에서의 소실 수치는 훈련 데이타에 피팅된 회귀 분배 모델로부터의 예측치로 대체되었으며, 검증 집단에 대한 SIRS/패혈증 상태의 지식은 검증 환자를 분류하는데 있어서 어떠한 식으로든지 사용되지 않았다.
10% 할당 (검증 집단)의 실제 상태를 다른 90% (훈련 집단)에 피팅된 랜덤 포레스트 모델에 따른 예측 상태와 비교함으로써, 민감도, 특이도, 및 일치도를 계산하였다. 이 과정을 10회 반복하였으며, 주어진 마커 하위세트에 대한 최종 민감도, 특이도, 및 일치도 예측치 (정확도라고도 하고, 수행이라고도 함)는 10회 반복 수행한 것을 평균한 수치였다. 이 과정을 모든 하위세트에 대해 적용하였다. 고려된 각 크기 (k 값, 즉 바이오마커의 수)에 대해, 200개의 무작위 하위세트를 선택 및 평가하였다. 이들 200개의 수행 (정확도) 예측치는 주어진 크기의 바이오마커의 모든 하위세트의 수행의 분포 예측치를 형성한다 (k 값).
도 60은 이들 24개 하위조합물 군의 각각의 정확도를 막대 그래프로 도시한다. 도 61은 이들 24개 하위조합물 군의 각각에서 각각의 개별 하위조합물의 정확도 (수행)를 도시한다. 따라서, 도 61은 표 J에 기재된 바이오마커 세트의 총 4800개 하위조합물의 정확도 (수행)를 도시한다.
도 60 및 61은 k가 5를 초과하는 경우 분포는 백인에 관한 것임을 암시하며 (벨-형태), 이는 각각의 군 (k = 5, ..., 24)이 그러한 군에 의해 나타낸 하위조합 공간을 정확히 도시함을 암시한다. k가 5 이하인 경우, 소량의 하위세트는 낮은 정확도 (수행) 예측치를 제공한다. 그러나, k가 5 이하인 경우에 이용가능한 결과는 이러한 종류의 바이오마커 하위조합물이 패혈증과 SIRS를 충분히 판별해냄을 암시한다. 도 60 및 61에 보고된 결과는, 표 J로부터 무작위 선택된 바이오마커를 2개와 같이 적은 수로 사용하면 상기 50%의 정확도 (수행) 예측치가 사실상 항상 얻어졌음을 나타낸다. 표 94는 60% 초과 (컬럼 2), 70% 초과 (컬럼 3), 80% 초과 (컬럼 4), 90% 초과 (컬럼 5), 또는 60% 미만 (컬럼 6)의 역치 정확도로 수행된 각 군 (k = 2, 4, ..., 25)에서 하위조합물의 수를 함유한다. 도 60 및 61, 및 표 94에 요약된 데이타는 시간 T-12 데이타의 경우 표 J로부터의 2개 내지 25개의 바이오마커를 포함하는 거의 모든 바이오마커 하위조합물이 패혈증 대상과 SIR 대상을 판별해낼 것임을 입증한다.
Figure 112007081780858-PCT00225
6.14.2 T -12 에서 단백질 바이오마커의 하위조합물
단백질 풍부도 데이타가 표 K에 보고된 바와 같이 이용가능한 총 10개의 바이오마커가 존재한다. 이 바이오마커 세트의 총 1600개의 상이한 하위조합물은 섹션 6.13에 기재된 T-12 시점 데이타를 이용해서 구성하였다. 이어서, 각각의 상이한 하위조합물을, 패혈증 대상과 SIRS 대상을 판별하는 능력에 대하여 시험하였다. 1600개의 하위조합물은 표 K에 보고된 본 발명의 10개의 바이오마커에 대해 가능한 하위조합물 총수의 무작위 샘플링을 나타낸다. 1600개의 하위조합물의 무작위도는 하기 알고리즘을 사용해서 확인하였다:
표 K로부터의 3개 내지 10개의 바이오마커를 고려함
{
현재의 넘버를 k로 정함;
이하를 200회 수행함
{
표 K로부터 무작위로 k 바이오마커를 선택함;
현재의 바이오마커 세트를 S로 정함;
}
이하를 10회 수행함
{
바이오마커 세트 S의 경우, 환자의 10%를 검증 집단으로 지정하고, 90%를 훈련 집단으로 지정함;
T-12 시점 데이타를 갖는 랜덤 포레스트를 이용해서 모델을 훈련 집단으로 핏팅함;
검증 집단에 대한 결과를 예측함;
공지된 상태의 검증 집단과의 일치도를 계산함;
}
10개의 일치도를 평균하여 보고함;
k = k+1로 설정함;
k > 10인 경우 종료; 그렇지않으면 상단으로 리턴함;
}
종료
컴퓨터계산은 섹션 6.14.1에 보다 상세히 기재된 바와 같이 수행하였다. T-12 데이타가 상기 기재된 발견 및 확인 데이타의 조합으로부터 이용가능한 것으로 총 152명의 환자들이 존재하였다. 이들 152명의 환자들 중에서, 80명은 패혈증이었으며, 72명은 SIR이었다. 표 K에서의 일부 바이오마커의 경우, 여러 데이타 공급원이 존재하였다. 예를 들면, 세 군데 상이한 연구로로부터의 IL-6, IL-8, 및 IL-10 단백질 데이타가 존재한다. 따라서, 환자들 사이에서의 발생 패턴은 복잡하다. 일부 환자는 한 연구소에서 시험할 수 있으며, 다른 환자들은 나머지 두 연구소 등에서 실험할 수 있다. 이는 프로젝트가 진행하는 방식 및 이용가능한 샘플의 종류에 의해 결정되었다 (어떤 환자 샘플은 추후에 개발된 검정으로 시험할 수 있기 전에 폐기되었다). 이러한 복잡한 문제의 발생을 다루기 위해 다음과 같은 전략을 이용하였다. 임의의 주어진 반복에서, 여러 연구소에서 시험된 단백질이 선택된 경우, 단백질에 대한 모든 검정 결과를 선택하였다. 이후, 소실 수치 대체법을 이용해서 소실 수치를 기입함으로써, 모든 환자들을 모든 검정으로 시험한 것처럼 보이도록 하였다. 이어서 상기 데이타를, 동일한 기본 화합물을 측정하는 상호관련된 입력치로서 랜덤 포레스트 모델로 공급하였다. 따라서, k가 3이고, 표 K로부터의 무작위 선택된 단백질(세 군데 상이한 연구소로부터 유래됨) 중 하나가 IL-8이며, 다른 두 단백질의 각각이 한 연구소만으로부터 얻어졌다는 점에서 특이적인 경우를 고려한다. 총 다섯 가지 검정에서, 세 가지 IL-8 공급원 모두로부터의 데이타에 더하여 다른 두 가지 단백질에 대한 두 가지 다른 특이적인 검정으로부터의 데이타를 선택한다. 이후, 소실 수치 대체법을 이용해서 소실 수치를 기입함으로써, 모든 환자들이 총 9개의 검정에서 세 가지 상이한 공급원으로부터의 결과를 얻은 것처럼 보이도록 하였다.
계산에서는 상기 시험의 200개의 하위조합물들을 각각 3 내지 10의 간격으로 기재하였다. 달리 말하면, 총 8개의 하위조합물 군의 경우(각 하위조합물 군은 각각 k 바이오마커 (k는 세트 3 내지 10에서의 번호임)를 갖는 200개의 바이오마커 하위조합물로 구성됨)에는 각각 표 K로부터 무작위 선택된 10개의 바이오마커로 구성된 200개의 하위조합물을 통해, 각각 표 K로부터 무작위 선택된 3개의 바이오마커로 구성된 200개의 하위조합물을 시험하였고, 각각 표 K로부터 무작위로 선택된 4개의 바이오마커로 구성된 200개의 하위조합물들을 시험하는 등의 시험을 수행하였다. 도 62는 이들 8개 하위조합물 군의 각각의 정확도를 막대 그래프로 도시한다. 도 63은 이들 8개 하위조합물 군의 각각에서 각각의 개별 하위조합물의 정확도 (수행)를 도시한다. 따라서, 도 63은 표 K에 기재된 바이오마커 세트의 총 1600개 하위조합물의 정확도 (수행)를 도시한다.
도 62 및 63은 각 하위조합물 군의 분포가 백인에 관한 것임을 암시하며 (벨-형태), 이는 각각의 군 (k = 3, 4, ..., 10)이 그러한 군에 의해 나타낸 하위조합 공간을 정확히 도시함을 암시한다. 도 62 및 63에 보고된 결과는, 표 K로부터 무작위 선택된 바이오마커를 3개와 같이 적은 수로 사용하면 상기 50%의 정확도 (수행) 예측치가 사실상 항상 얻어졌음을 나타낸다. 표 95는 60% 초과 (컬럼 2), 70% 초과 (컬럼 3), 80% 초과 (컬럼 4), 90% 초과 (컬럼 5), 또는 60% 미만 (컬럼 6)의 역치 정확도로 수행된 각 군 (k = 3, 4, ..., 10)에서 하위조합물의 수를 함유한다. 도 62 및 63, 및 표 95에 요약된 데이타는 시간 T-12 데이타의 경우 표 K로부터의 3개 내지 10개의 바이오마커를 포함하는 거의 모든 바이오마커 하위조합물이 패혈증 대상과 SIR 대상을 판별해낼 것임을 입증한다.
Figure 112007081780858-PCT00226
6.14.3 T -36 에서 단백질 바이오마커의 하위조합물
이 바이오마커 세트의 총 1600개의 상이한 하위조합물은 섹션 6.13에 기재된 단백질 기초의 데이타를 이용하여 T-12 시점에 대하여 구성하였다. 이어서, 각각의 상이한 하위조합물을, 패혈증 대상과 SIRS 대상을 판별하는 능력에 대하여 시험하였다. T-36 데이타가 상기 기재된 발견 및 확인 데이타의 조합으로부터 이용가능한 것으로 총 142명의 환자가 존재하였다. 이들 142명의 환자들 중에서, 79명은 패혈증이었으며, 63명은 SIR이었다. 1600개의 하위조합물은 표 K에 보고된 본 발명의 10개의 바이오마커에 대해 가능한 하위조합물들의 총 개수의 무작위 샘플링을 나타낸다. 1600개의 하위조합물의 무작위도는 섹션 6.14.2에 기재된 알고리즘을 이용해서 확인하였으며, 유일한 차이는 T-12 데이타 대신 T-36 데이타가 사용된 점이었다. 컴퓨터계산은 섹션 6.14.1에 보다 상세히 기재된 바와 같이 수행하였다. 도 64는 이들 8개 하위조합물 군의 각각의 정확도를 막대 그래프로 도시한다. 도 65는 이들 8개 하위조합물 군의 각각에서 각각의 개별 하위조합물의 정확도 (수행)를 도시한다. 따라서, 도 65는 표 K에 기재된 바이오마커 세트의 총 1600개 하위조합물의 정확도 (수행)를 도시한다.
도 64 및 65에 보고된 결과는, 표 K로부터 무작위 선택된 바이오마커를 3개와 같이 적은 수로 사용하면 상기 60%의 정확도 (수행) 예측치가 사실상 항상 얻어졌음을 나타낸다. 표 95는 60% 초과 (컬럼 2), 70% 초과 (컬럼 3), 80% 초과 (컬럼 4), 90% 초과 (컬럼 5), 또는 60% 미만 (컬럼 6)의 역치 정확도로 수행된 각 군 (k = 3, 4, ..., 10)에서 하위조합물의 수를 함유한다. 도 64 및 65, 및 표 95에 요약된 데이타는 시간 T-36 데이타의 경우 표 K로부터의 3개 내지 10개의 바이오마커를 포함하는 대부분의 바이오마커 하위조합물이 패혈증 대상과 SIR 대상을 판별해낼 것임을 입증한다.
Figure 112007081780858-PCT00227
6.14.4 T -36 에서 핵산 바이오마커의 하위조합물
표 J의 바이오마커 세트의 총 4600개의 상이한 하위조합물은 섹션 6.13에 기재된 핵산 기초의 데이타를 이용하여 T-36 시점에 대하여 구성하였다. 이어서, 각각의 상이한 하위조합물을, 패혈증 대상과 SIRS 대상을 판별하는 능력에 대하여 시험하였다. T-36 데이타가 상기 기재된 발견 및 확인 데이타의 조합으로부터 이용가능한 것으로 총 142명의 환자가 존재하였다. 이들 142명의 환자들 중에서, 79명은 패혈증이었으며, 63명은 SIR이었다. 4600개의 하위조합물은 T-36 시점에서 표 J에 보고된 본 발명의 44개의 바이오마커에 대해 가능한 하위조합물들의 총 개수의 무작위 샘플링을 나타낸다. 4600개의 하위조합물의 무작위도는 섹션 6.14.1에 기재된 알고리즘을 이용해서 확인하였으며, 유일한 차이는 T-12 데이타 대신 T-36 데이타가 사용되고 k 최소값이 3이라는 점이었다. 컴퓨터계산은 섹션 6.14.1에 보다 상세히 기재된 바와 같이 수행하였다. 도 66은 이들 23개 하위조합물 군의 각각의 정확도를 막대 그래프로 도시한다. 도 67은 이들 23개 하위조합물 군의 각각에서 각각의 개별 하위조합물의 정확도 (수행)를 도시한다. 따라서, 도 67은 표 J에 기재된 바이오마커 세트의 총 4600개 하위조합물의 정확도 (수행)를 도시한다.
도 66 및 67에 보고된 결과는, 표 J로부터 무작위 선택된 바이오마커를 3개와 같이 적은 수로 사용하면 전형적으로 상기 60%의 정확도 (수행) 예측치가 사실상 항상 얻어졌음을 나타낸다. 표 97은 60% 초과 (컬럼 2), 70% 초과 (컬럼 3), 80% 초과 (컬럼 4), 90% 초과 (컬럼 5), 또는 60% 미만 (컬럼 6)의 역치 정확도로 수행된 각 군 (k = 3, 4, ..., 25)에서 하위조합물의 수를 함유한다. 도 66 및 67, 및 표 97에 요약된 데이타는 시간 T-36 데이타의 경우 표 J로부터의 3개 내지 25개의 바이오마커를 포함하는 대부분의 바이오마커 하위조합물이 패혈증 대상과 SIR 대상을 판별해낼 것임을 입증한다.
Figure 112007081780858-PCT00228
6.14.5 T -12 에서 조합된 핵산 및 단백질 바이오마커 데이타의 하위조합물
표 I에는 총 53개의 바이오마커가 기재되어 있다. 이 바이오마커 세트의 총 4600개의 상이한 하위조합물은 이용가능한 모든 T-12 시점 데이타를 이용해서 구성하였다. 표 J에 기재된 표 I의 바이오마커 하위세트의 경우, T-12 시점 데이타는 상기 기재된 RT-PCR 데이타로 구성되었다. 표 K에 기재된 바이오마커 하위세트의 경우, T-12 시점 데이타는 상기 기재된 비드 기재의 데이타로 구성되었다. 이에 대한 한가지 예외는 단백질 및 유전자-발현 데이타가 둘 다 이용가능한 "MMP9"이었다. 따라서, MMP9 유전자 및 단백질 풍부도 데이타를 별도의 바이오마커로 처리하였다. 이를 달성하기 위해, MMP9 핵산 데이타를 "MMP9.GE"로 명명하고, 비드 기재의 검정으로부터의 MMP9 단백질 풍부도 데이타를 MMP9.단백질로 명명하였다.
이어서, 각각의 상이한 하위조합물을, 패혈증 대상과 SIRS 대상을 판별해내는 능력에 대하여 시험하였다. 4600개의 하위조합물은 표 I에 보고된 본 발명의 53개의 바이오마커에 대해 가능한 하위조합물들의 총 개수의 무작위 샘플링을 나타낸다. 4600개 하위조합물들의 무작위도는 하기 알고리즘을 이용해서 확인하였다:
표 I로부터의 3개 내지 25개의 바이오마커를 고려함
{
현재의 넘버를 k로 정함;
이하를 200회 수행함
{
표 I로부터 무작위로 k 바이오마커를 선택함;
현재의 바이오마커 세트를 S로 정함;
}
이하를 10회 수행함
{
바이오마커 세트 S의 경우, 환자의 10%를 검증 집단으로 지정하고, 90%를 훈련 집단으로 지정함;
T-12 시점 데이타를 갖는 랜덤 포레스트를 이용해서 모델을 훈련 집단으로 핏팅함;
검증 집단에 대한 결과를 예측함;
공지된 상태의 검증 집단과의 일치도를 계산함;
}
10개의 일치도를 평균하여 보고함;
k = k+1로 설정함;
k > 10인 경우 종료; 그렇지않다면 상단으로 리턴함;
}
종료
T-12 데이타가 상기 기재된 발견 및 확인 데이타의 조합으로부터 이용가능한 것으로 총 152명의 환자들이 존재하였다. 이들 152명의 환자들 중에서, 80명은 패혈증이었으며, 72명은 SIR이었다. 컴퓨터계산은 섹션 6.14.1에 보다 상세히 기재된 바와 같이 수행하였다. 계산에서는 상기 시험의 200개의 하위조합물들을 각각 2 내지 25의 간격으로 기재하였다. 달리 말하면, 총 23개의 하위조합물 군의 경우(각 하위조합물 군은 각각 k 바이오마커 (k는 세트 3 내지 25에서의 번호임)를 갖는 200개의 바이오마커 하위조합물로 구성됨)에는 각각 표 K로부터 무작위 선택된 25개의 바이오마커로 구성된 200개의 하위조합물을 통해, 각각 표 I로부터 무작위 선택된 3개의 바이오마커로 구성된 200개의 하위조합물을 시험하였고, 각각 표 I로부터 무작위로 선택된 4개의 바이오마커로 구성된 200개의 하위조합물들을 시험하는 등의 시험을 수행하였다. 도 68은 이들 23개 하위조합물 군의 각각의 정확도를 막대 그래프로 도시한다. 도 69는 이들 23개 하위조합물 군의 각각에서 각각의 개별 하위조합물의 정확도 (수행)를 도시한다. 따라서, 도 69는 표 I에 기재된 바이오마커 세트의 총 4600개 하위조합물의 정확도 (수행)를 도시한다.
도 68 및 69는 k가 5를 초과하는 경우 분포가 백인에 관한 것임을 암시하며 (벨-형태), 이는 각각의 군 (k = 5, ..., 25)이 그러한 군에 의해 나타낸 하위조합 공간을 정확히 도시함을 암시한다. k가 5 이하인 경우, 소량의 하위세트는 낮은 정확도 (수행) 예측치를 제공한다. 도 68 및 69에 보고된 결과는, 표 I로부터 무작위 선택된 바이오마커를 3개와 같이 적은 수로 사용하면 상기 50%의 정확도 (수행) 예측치가 사실상 항상 얻어졌음을 나타낸다. 표 98은 60% 초과 (컬럼 2), 70% 초과 (컬럼 3), 80% 초과 (컬럼 4), 90% 초과 (컬럼 5), 또는 60% 미만 (컬럼 6)의 역치 정확도로 수행된 각 군 (k = 3, 4, ..., 25)에서 하위조합물의 수를 함유한다. 도 68 및 69, 및 표 98에 요약된 데이타는 시간 T-12 데이타의 경우 표 I로부터의 3개 내지 25개의 바이오마커를 포함하는 거의 모든 바이오마커 하위조합물이 패혈증 대상과 SIR 대상을 판별해낼 것임을 입증한다.
Figure 112007081780858-PCT00229
6.14.6 T -36 에서 조합된 핵산 및 단백질 바이오마커 데이타의 하위조합물
바이오마커 하위조합물들은 섹션 6.14.5에 기재된 바와 같이 선택되었으며, 유일한 차이는 T-12 데이타 대신 T-36 데이타를 사용한 것이었다. 표 I의 총 4600개의 상이한 하위조합물은 이용가능한 모든 T-36 시점 데이타를 이용해서 구성하였다. T-36 데이타가 상기 기재된 발견 및 확인 데이타의 조합으로부터 이용가능한 것으로 총 142명의 환자가 존재하였다. 이들 142명의 환자들 중에서, 79명은 패혈증이었으며, 63명은 SIR이었다. 컴퓨터계산은 섹션 6.14.1에 보다 상세히 기재된 바와 같이 수행하였다. 계산에서는 상기 시험의 200개의 하위조합물들을 각각 3 내지 25의 간격으로 기재하였다. 달리 말하면, 총 23개의 하위조합물 군의 경우(각 하위조합물 군은 각각 k 바이오마커 (k는 세트 3 내지 25에서의 번호임)를 갖는 200개의 바이오마커 하위조합물로 구성됨)에는 각각 표 I로부터 무작위 선택된 25개의 바이오마커로 구성된 200개의 하위조합물을 통해, 각각 표 I로부터 무작위 선택된 3개의 바이오마커로 구성된 200개의 하위조합물을 시험하였고, 각각 표 I로부터 무작위로 선택된 4개의 바이오마커로 구성된 200개의 하위조합물들을 시험하는 등의 시험을 수행하였다. 도 70은 이들 23개 하위조합물 군의 각각의 정확도를 막대 그래프로 도시한다. 도 71은 이들 23개 하위조합물 군의 각각에서 각각의 개별 하위조합물의 정확도 (수행)를 도시한다. 따라서, 도 71은 표 I에 기재된 바이오마커 세트의 총 4600개 하위조합물의 정확도 (수행)를 도시한다.
도 70 및 71은 k가 5를 초과하는 경우 분포가 백인에 관한 것임을 암시하며 (벨-형태), 이는 각각의 군 (k = 5, ..., 25)이 그러한 군에 의해 나타낸 하위조합 공간을 정확히 도시함을 암시한다. k가 5 이하인 경우, 소량의 하위세트는 낮은 정확도 (수행) 예측치를 제공한다. 도 70 및 71에 보고된 결과는, 표 I로부터 무작위 선택된 바이오마커를 3개와 같이 적은 수로 사용하면 상기 50%의 정확도 (수행) 예측치가 사실상 항상 얻어졌음을 나타낸다. 표 99는 60% 초과 (컬럼 2), 70% 초과 (컬럼 3), 80% 초과 (컬럼 4), 90% 초과 (컬럼 5), 또는 60% 미만 (컬럼 6)의 역치 정확도로 수행된 각 군 (k = 3, 4, ..., 25)에서 하위조합물의 수를 함유한다. 도 70 및 71, 및 표 99에 요약된 데이타는 시간 T-36 데이타의 경우 표 I로부터의 3개 내지 25개의 바이오마커를 포함하는 거의 모든 바이오마커 하위조합물이 패혈증 대상과 SIR 대상을 판별해낼 것임을 입증한다.
Figure 112007081780858-PCT00230
6.15 표 I에 기재된 패혈증 및 SIRS 환자에서의 바이오마커의 평균 발현 수치
표 I의 바이오마커의 평균 발현 수치를, T-12, T-36, 및 T-60 시점에서 섹션 6.11.2, 6.12.2 (아피메트릭스 데이타), 611.1, 6.12.1 (RT-PCR 데이타), 6.13.3 (비드 데이타), 및 6.13.1 및 6.13.2 (비드 데이타)에 기재된 집단에서 패혈증에 걸린 대상 (패혈증 대상) 및 패혈증에 걸리지 않은 대상 (SIRS 대상)에 대하여 결정하였다. 이 데이타는 하기 표 100에 기재되어 있다. 표 100에서, 어미가 _Affy로 끝나는 바이오마커는 섹션 6.11.2 및 6.11.2의 조합된 데이타를 나타내고, 어미가 .18S로 끝나는 바이오마커는 섹션 6.11.1 및 6.12.1의 조합된 데이타 (RT-PCR 데이타)를 나타내고, 어미가 BDB로 끝나는 바이오마커는 섹션 6.13.3의 데이타를 나타내며, 어미가 RBM으로 끝나는 바이오마커는 섹션 6.13.1 및 6.13.2의 데이타를 나타낸다.
유전자 배열 (.Affy)에 의해 확인된 표 100의 핵산 바이오마커의 경우, 표 100의 수치는 조사된 특정 프로브 서열에 대하여 얻어진 평균 상대 형광 강도 단위를 나타낸다. 이와 같이, 이들은 실제 측정 단위가 아니며, 다만 한 군의 다른 군에 대한 상대적인 양을 나타낸다. 추가로, 데이타 분석의 일부로서, 이들 수치 중 일부는 보고에 앞서 고르 변환 또는 다른 조정으로 처리할 수 있다. 표 100에 기재된 핵산 바이오마커 (.18S)에 대한 발현 수치는 상대 "주기-시간 대 역치"에 의해 정의된다. 이와 같이, 이들은 실제 측정 단위가 아니며, 다만 한 군의 다른 군에 대한 상대적인 양을 나타낸다. 더 많은 양의 핵산을 갖는 샘플은 더 적은 핵산을 갖는 샘플보다 더 빨리 양성이 될 것이며 (더 적은 주기), 이로써 생성된 신호가 양성 역치와 교차하기 전에 더 많은 주기를 필요로 할 것이다. 표 101의 단백질 바이오마커의 경우, 단위는 다음과 같았다: 알파페토단백질 (AFP) ㎍/mL (혈장 밀리리터 당 마이크로그램), 베타-2-마이크로글로불린 (B2M) ㎍/mL, 인터류킨-6 (IL-6) pg/mL (피코그램/밀리리터), 인터류킨- 8 (IL-8) pg/mL, 인터류킨-10 (IL-10) pg/mL, 단핵구 화학주성 단백질 1 (MCP) pg/mL, 매트릭스 메탈로프로테이나제 9 (MMP9) ng/mL (나노그램/밀리리터), 메탈로프로테이나제 1의 조직 억제제 (TIMP1) ng/mL (나노그램/mL), C 반응성 단백질 (CRP) ㎍/mL, 및 아포리포단백질 CIII ㎍/mL.
Figure 112007081780858-PCT00231
Figure 112007081780858-PCT00232
Figure 112007081780858-PCT00233
Figure 112007081780858-PCT00234
표 I의 바이오마커의 발현 수치 범위를, T-12 및 T-36 시점에서 섹션 6.11.2, 6.12.2 (아피메트릭스 데이타), 611.1, 6.12.1 (RT-PCR 데이타), 6.13.3 (비드 데이타), 및 6.13.1 및 6.13.2 (비드 데이타)에 기재된 집단에서 패혈증에 걸린 대상 (패혈증 대상) 및 패혈증에 걸리지 않은 대상 (SIRS 대상)에 대하여 결정하였다. 이 데이타는 하기 표 101에 기재되어 있다. 표 101에서, 어미 _Affy로 끝나는 바이오마커는 섹션 6.11.2 및 6.11.2의 조합된 데이타 (아피메트릭스 데이타)를 나타내고, 어미 .18S로 끝나는 바이오마커는 섹션 6.11.1 및 6.12.1의 조합된 데이타 (RT-PCR 데이타)를 나타내고, 어미 BDB로 끝나는 바이오마커는 섹션 6.13.3의 데이타를 나타내며, 어미 RBM으로 끝나는 바이오마커는 섹션 6.13.1 및 6.13.2의 데이타를 나타낸다. 시점은 컬럼 6에 제시되어 있으며, 여기서 T-12는 T-12 시점을 나타내고, T-36은 T-36 시점을 나타낸다. 표 101에서의 단위는 표 100에 대해 기재된 바와 같다.
Figure 112007081780858-PCT00235
Figure 112007081780858-PCT00236
Figure 112007081780858-PCT00237
Figure 112007081780858-PCT00238
Figure 112007081780858-PCT00239
Figure 112007081780858-PCT00240
Figure 112007081780858-PCT00241
7. 참고 인용
본 발명은 컴퓨터 판독 저장 매체에 매입된 컴퓨터 프로그램 메카니즘을 포함하는 컴퓨터 프로그램 제품으로서 이용될 수 있다. 예를 들어, 이러한 컴퓨터 프로그램 제품은 도 35에 나타낸 프로그램 모듈을 함유할 수 있다. 이러한 프로그램 모듈은 CD-ROM, DVD, 자기 디스크 저장 제품, 또는 임의의 다른 컴퓨터 판독 데이타 또는 프로그램 저장 제품상에 저장될 수 있다. 상기 프로그램 모듈은 영구저장매체, 예를 들면 ROM, 하나 이상의 프로그램가능한 칩, 또는 하나 이상의 특정 용도의 집적 회로 (ASIC)에 매입될 수도 있다. 이러한 영구 저장매체는 서버, 802.11 액세스 포인트(access point), 802.11 무선 브리지/스테이션(bridge/station), 리피터(repeater), 라우터(router), 이동 전화, 또는 다른 전자 장치에 배치될 수 있다. 컴퓨터 프로그램 제품 내의 소프트웨어 모듈은 인터넷을 통해 또는 다르게는 컴퓨터 데이타 신호 (여기에 소프트웨어 모듈이 매입됨)의 전달에 의해 디지탈방식으로 또는 반송파 상에 전자적으로 분포시킬 수도 있다.
이상에서는 특정의 대표적 실시양태 및 세부사항을 참고로 본 발명을 상세히 설명하였지만, 본원에 기재된 본 발명의 사상 또는 범위를 벗어남이 없이 본 발명에 변화 및 변형을 수행할 수 있다는 것은 당업자에게 자명한 사실이다. 본원에 기재된 특정 실시양태는 예로서 제공된 것일 뿐이며, 본 발명은 첨부된 특허청구범위 및 그의 등가 범위에 의해서만 제한된다.

Claims (113)

  1. 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제1 수치 세트를 만족하는지를 평가하는 단계를 포함하며, 제1 수치 세트를 만족하는 것으로 시험 대상이 패혈증을 발병할 수 있음을 예측하고, 다수의 특성은 표 I에 기재된 3개 이상의 바이오마커를 포함하는 다수의 바이오마커의 측정가능한 측면이고, 다수의 바이오마커가 IL-6 및 IL-8을 둘 다 포함하는 경우 다수의 바이오마커는 표 I에 기재된 6개 이상의 바이오마커를 포함하는 것인, 패혈증의 발병 위험이 있는 시험 대상에서 패혈증의 발병을 예측하는 방법.
  2. 제1항에 있어서, 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제2 수치 세트를 만족하는지를 평가하는 단계를 추가로 포함하며, 제2 수치 세트를 만족하는 것으로 시험 대상이 패혈증을 발병하지 않을 수 있음을 예측하는 것인 방법.
  3. 제1항에 있어서, 상기 다수의 바이오마커가 표 I에 기재된 3개 내지 54개의 바이오마커로 구성되는 것인 방법.
  4. 제1항에 있어서, 상기 다수의 바이오마커가 표 I에 기재된 3개 내지 30개의 바이오마커로 구성되는 것인 방법.
  5. 제1항에 있어서, 상기 다수의 바이오마커가 표 I에 기재된 4개 내지 25개의 바이오마커로 구성되는 것인 방법.
  6. 제1항에 있어서, 상기 다수의 바이오마커가 표 I에 기재된 3개 이상의 바이오마커를 포함하는 것인 방법.
  7. 제1항에 있어서, 상기 다수의 바이오마커가 표 I에 기재된 4개 이상의 바이오마커를 포함하는 것인 방법.
  8. 제1항에 있어서, 상기 다수의 바이오마커가 표 I에 기재된 8개 이상의 바이오마커를 포함하는 것인 방법.
  9. 제1항에 있어서, 상기 다수의 특성이 다수의 바이오마커 중 3개 내지 53개의 바이오마커에 상응하는 3개 내지 53개의 특성으로 구성되는 것인 방법.
  10. 제1항에 있어서, 상기 다수의 특성이 다수의 바이오마커 중 3개 내지 40개의 바이오마커에 상응하는 3개 내지 40개의 특성으로 구성되는 것인 방법.
  11. 제1항에 있어서, 상기 다수의 특성이 다수의 바이오마커 중 4개 내지 25개의 바이오마커에 상응하는 4개 내지 25개의 특성으로 구성되는 것인 방법.
  12. 제1항에 있어서, 상기 다수의 특성이 다수의 바이오마커 중 3개 이상의 바이오마커에 상응하는 3개 이상의 특성을 포함하는 것인 방법.
  13. 제1항에 있어서, 상기 다수의 특성이 다수의 바이오마커 중 4개 이상의 바이오마커에 상응하는 4개 이상의 특성을 포함하는 것인 방법.
  14. 제1항에 있어서, 상기 다수의 특성이 다수의 바이오마커 중 8개 이상의 바이오마커에 상응하는 8개 이상의 특성을 포함하는 것인 방법.
  15. 제1항에 있어서, 상기 다수의 바이오마커 중 각각의 바이오마커가 표 J에 기재된 바이오마커인 방법.
  16. 제15항에 있어서, 각각의 바이오마커가 핵산인 방법.
  17. 제1항에 있어서, 상기 다수의 바이오마커 중 각각의 바이오마커가 표 K에 기재된 바이오마커인 방법.
  18. 제17항에 있어서, 각각의 바이오마커가 단백질인 방법.
  19. 제1항에 있어서, 상기 다수의 바이오마커 중 각각의 바이오마커가 핵산인 방법.
  20. 제19항에 있어서, 각각의 바이오마커가 DNA, cDNA, 증폭된 DNA, RNA, 또는 mRNA인 방법.
  21. 제1항에 있어서, 상기 다수의 바이오마커 중 각각의 바이오마커가 단백질인 방법.
  22. 제1항에 있어서, 상기 다수의 바이오마커 중 제1 바이오마커가 표 J에 기재된 핵산 바이오마커이고, 상기 다수의 바이오마커 중 제2 바이오마커가 표 K에 기재된 단백질 바이오마커인 방법.
  23. 제1항에 있어서, 상기 다수의 특성 중 하나의 특성이 바이오마커의 측정가능한 측면이고, 상기 특성에 대한 특성 수치가 단일 시점에서 상기 시험 대상으로부터 취해진 생물학적 샘플을 사용해서 결정된 것인 방법.
  24. 제23항에 있어서, 상기 특성이 상기 생물학적 샘플 중 상기 바이오마커의 풍부도인 방법.
  25. 제23항에 있어서, 상기 특성이 상기 생물학적 샘플 중 상기 바이오마커의 존재 또는 부재인 방법.
  26. 제23항에 있어서, 상기 특성이 상기 생물학적 샘플 중 상기 바이오마커의 종을 확인하는 것인 방법.
  27. 제23항에 있어서, 상기 생물학적 샘플이 전혈인 방법.
  28. 제23항에 있어서, 상기 생물학적 샘플이 혈장, 혈청, 타액, 객담, 소변, 뇌척수액, 조직 표본, 조직 생검, 또는 대변 표본인 방법.
  29. 제23항에 있어서, 상기 생물학적 샘플이 단리된 호중구, 호산구, 호염기구, 림프구, 또는 단핵구인 방법.
  30. 제1항에 있어서, 상기 다수의 특성 중 하나의 특성이 상기 바이오마커 프로필 중 바이오마커의 측정가능한 측면이고, 상기 특성에 대한 특성 수치가 상이한 시점에서 상기 시험 대상으로부터 취해진 다수의 샘플을 사용해서 결정된 것인 방법.
  31. 제30항에 있어서, 하나 이상의 특성이 상기 바이오마커의 풍부도가 시간에 따라 증가 또는 감소하는지를 나타내는 것인 방법.
  32. 제30항에 있어서, 대상이 패혈증을 나타내기 전 제1일에 상기 다수의 샘플 중 제1 샘플을 취하고, 대상이 패혈증을 나타내기 전 제2일에 상기 다수의 샘플 중 제2 샘플을 취하는 것인 방법.
  33. 제1항에 있어서, 상기 바이오마커 프로필 중 바이오마커가 핵산을 나타내거나 또는 단백질을 나타내는 것인 방법.
  34. 제1항에 있어서, 상기 바이오마커 프로필 중 바이오마커가 mRNA 분자를 나타내거나 또는 cDNA 분자를 나타내는 것인 방법.
  35. 제1항에 있어서, 상기 바이오마커 프로필 중 제1 바이오마커가 핵산을 나타내고, 상기 바이오마커 프로필 중 제2 바이오마커가 단백질을 나타내는 것인 방법.
  36. 제1항에 있어서, 평가 단계에 앞서 상기 바이오마커 프로필을 구성하는 단계를 추가로 포함하는 방법.
  37. 제36항에 있어서, 상기 구성 단계가 상기 시험 대상의 샘플로부터 상기 다수 의 특성을 얻는 것을 포함하는 것인 방법.
  38. 제37항에 있어서, 상기 샘플이 전혈인 방법.
  39. 제37항에 있어서, 상기 샘플이 혈장, 혈청, 타액, 객담, 소변, 뇌척수액, 조직 표본, 조직 생검, 또는 대변 표본인 방법.
  40. 제37항에 있어서, 상기 샘플이 호중구, 호산구, 호염기구, 림프구, 또는 단핵구인 방법.
  41. 제36항에 있어서, 구성 단계가 데이타 분석 알고리즘을, 집단의 구성원으로부터 얻어진 표 I에 기재된 바이오마커에 상응하는 특성에 적용하는 것을 포함하는 것인 방법.
  42. 제41항에 있어서, 상기 집단이 이후에 패혈증을 발병하는 대상 (패혈증 대상) 및 이후에 패혈증을 발병하지 않는 대상 (SIRS 대상)을 포함하는 것인 방법.
  43. 제41항에 있어서, 집단의 구성원으로부터 얻어진 표 I에 기재된 바이오마커에 상응하는 특성이, 집단 내의 일부 대상이 패혈증을 나타내기 전의 시점에서 얻어지는 것인 방법.
  44. 제41항에 있어서, 상기 데이타 분석 알고리즘이 의사결정계통도, 미세배열의 예측 분석, 다중 가법 회귀계통도, 신경 네트워크, 군집화 알고리즘, 주요 성분 분석, 최근접 분석, 선형 판별 분석, 2차 판별 분석, 지원 벡터 머신, 계통적 방법, 사영 추적, 또는 가중 투표인 방법.
  45. 제41항에 있어서, 평가 단계에 앞서 상기 제1 수치 세트를 구성하는 단계를 추가로 포함하는 방법.
  46. 제45항에 있어서, 구성 단계가 데이타 분석 알고리즘을 집단의 구성원으로부터 얻어진 특성에 적용하는 것을 포함하는 것인 방법.
  47. 제46항에 있어서, 상기 집단이 관찰 기간 동안 패혈증을 발병하는 대상 및 관찰 기간 동안 패혈증을 발병하지 않는 대상을 포함하는 것인 방법.
  48. 제46항에 있어서, 상기 데이타 분석 알고리즘이 의사결정계통도, 미세배열의 예측 분석, 다중 가법 회귀계통도, 신경 네트워크, 군집화 알고리즘, 주요 성분 분석, 최근접 분석, 선형 판별 분석, 2차 판별 분석, 지원 벡터 머신, 계통적 방법, 사영 추적, 또는 가중 투표인 방법.
  49. 제46항에 있어서, 구성 단계가 의사결정 규칙을 생성시키며, 상기 평가 단계는 상기 의사결정 규칙을 다수의 특성에 적용함으로써 이들 특성이 제1 수치 세트를 만족하는지를 결정하는 것을 포함하는 것인 방법.
  50. 제49항에 있어서, 상기 의사결정 규칙이 상기 집단 내의 대상을 (i) 패혈증을 발병하는 대상, 및 (ii) 패혈증을 발병하지 않는 대상으로 70 퍼센트 이상의 정확도로 분류하는 것인 방법.
  51. 제49항에 있어서, 상기 의사결정 규칙이 상기 집단 내의 대상을 (i) 패혈증을 발병하는 대상, 및 (ii) 패혈증을 발병하지 않는 대상으로 90 퍼센트 이상의 정확도로 분류하는 것인 방법.
  52. 제1항에 있어서, 상기 바이오마커 프로필 중 제1 바이오마커가 패혈증을 발병할 수 있는 환자에서 상향조절되는 것인 방법.
  53. 제1항에 있어서, 상기 바이오마커 프로필 중 5개 이상의 바이오마커가 패혈증을 발병할 수 있는 환자에서 상향조절되는 것인 방법.
  54. 제1항에 있어서, 상기 바이오마커 프로필 중 제1 바이오마커가 패혈증을 발병할 수 있는 환자에서 하향조절되는 것인 방법.
  55. 제1항에 있어서, 상기 바이오마커 프로필 중 5개 이상의 바이오마커가 패혈증을 발병할 수 있는 환자에서 하향조절되는 것인 방법.
  56. 제1항에 있어서, 시험 대상이 4 내지 8 시간 내에 패혈증을 발병할 가능성을 갖는 것인 방법.
  57. 제1항에 있어서, 시험 대상이 8 내지 12 시간 내에 패혈증을 발병할 가능성을 갖는 것인 방법.
  58. 제1항에 있어서, 시험 대상이 12 내지 24 시간 내에 패혈증을 발병할 가능성을 갖는 것인 방법.
  59. 제1항에 있어서, 시험 대상이 24 내지 36 시간 내에 패혈증을 발병할 가능성을 갖는 것인 방법.
  60. 제1항에 있어서, 시험 대상이 36 내지 48 시간 내에 패혈증을 발병할 가능성을 갖는 것인 방법.
  61. 제1항에 있어서, 시험 대상이 48 내지 72 시간 내에 패혈증을 발병할 가능성 을 갖는 것인 방법.
  62. 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제1 수치 세트를 만족하는지를 평가하는 단계를 포함하며, 제1 수치 세트를 만족하는 것으로 시험 대상이 패혈증을 발병할 수 있음을 예측하고, 다수의 특성은 표 I에 기재된 3개 이상의 바이오마커를 포함하는 다수의 바이오마커에 상응하고, 다수의 바이오마커가 IL-6 및 IL-8을 둘 다 포함하는 경우 다수의 바이오마커는 표 I에 기재된 6개 이상의 바이오마커를 포함하는 것인, 시험 대상에서 패혈증을 진단하는 방법.
  63. 제62항에 있어서, 평가 단계에 앞서 상기 바이오마커 프로필을 구성하는 단계를 추가로 포함하는 방법.
  64. 제63항에 있어서, 상기 구성 단계가 상기 시험 대상의 샘플로부터 상기 다수의 특성을 얻는 것을 포함하는 것인 방법.
  65. 제64항에 있어서, 상기 샘플이 전혈인 방법.
  66. 제64항에 있어서, 상기 샘플이 혈장, 혈청, 타액, 객담, 소변, 뇌척수액, 조직 표본, 조직 생검, 또는 대변인 방법.
  67. 제64항에 있어서, 상기 샘플이 호중구, 호산구, 호염기구, 림프구, 또는 단핵구인 방법.
  68. 제64항에 있어서, 상기 샘플이 단일 조직인 방법.
  69. 제64항에 있어서, 상기 샘플이 상기 시험 대상의 하나 초과의 조직으로부터 유래하는 것인 방법.
  70. 제63항에 있어서, 상기 구성 단계가 다수의 특성에 상응하는 표 I에 기재된 바이오마커의 존재를 결정하는 것을 포함하는 것인 방법.
  71. 제70항에 있어서, 결정 단계가 데이타 분석 알고리즘을, 집단의 구성원으로부터 얻어진 표 I에 기재된 바이오마커에 상응하는 특성에 적용하는 것을 포함하는 것인 방법.
  72. 제71항에 있어서, 상기 집단이 추후의 시점에서 패혈증을 발병하는 대상 (패혈증 대상) 및 패혈증을 발병하지 않는 대상 (SIRS 대상)을 포함하는 것인 방법.
  73. 제62항에 있어서, 다수의 바이오마커가 표 I에 기재된 4개 이상의 바이오마커를 포함하는 것인 방법.
  74. 제62항에 있어서, 다수의 바이오마커가 표 I에 기재된 8개 이상의 바이오마커를 포함하는 것인 방법.
  75. 다수의 프로브 스폿(spot)을 포함하며, 다수의 프로브 스폿 중 20% 이상의 프로브 스폿이 표 I에 기재된 다수의 바이오마커에 상응하고, 다수의 바이오마커가 표 I에 기재된 6개 이상의 바이오마커를 포함하며, 다수의 바이오마커가 IL-6 및 IL-8을 둘 다 포함하는 것인, 미세배열.
  76. 제75항에 있어서, 하나 이상의 조절 스폿을 포함하는 미세배열.
  77. 제75항에 있어서, 다수의 프로브 스폿 중 40% 이상의 프로브 스폿이 표 I에 기재된 바이오마커에 상응하는 것인 미세배열.
  78. 제75항에 있어서, 기재상의 약 3개 내지 50개의 프로브 스폿으로 구성되어 있는 미세배열.
  79. 제75항에 있어서, 핵산 미세배열인 미세배열.
  80. 제75항에 있어서, 단백질 미세배열인 미세배열.
  81. 전체적으로 표 I에 기재된 3개 이상의 바이오마커와 특이적으로 결합하는 다수의 항체를 포함하는, 시험 대상에서 패혈증의 발병을 예측하기 위한 키트.
  82. 전체적으로 표 K에 기재된 3개 이상의 바이오마커와 특이적으로 결합하는 다수의 항체를 포함하는, 시험 대상에서 패혈증의 발병을 예측하기 위한 키트.
  83. 컴퓨터 판독 저장 매체 및 이에 매입된 컴퓨터 프로그램 메카니즘을 포함하며, 컴퓨터 프로그램 메카니즘은 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제1 수치 세트를 만족하는지를 평가하기 위한 지침을 포함하고, 제1 수치 세트를 만족하는 것으로 시험 대상이 패혈증을 발병할 수 있음을 예측하고, 다수의 특성은 표 I에 기재된 3개 이상의 바이오마커를 포함하는 다수의 바이오마커의 측정가능한 측면이고, 다수의 바이오마커가 IL-6 및 IL-8을 둘 다 포함하는 경우 다수의 바이오마커는 표 I에 기재된 6개 이상의 바이오마커를 포함하는 것인, 컴퓨터 프로그램 제품.
  84. 제83항에 있어서, 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제2 수치 세트를 만족하는지를 평가하기 위한 지침을 추가로 포함하며, 제2 수치 세트를 만족하는 것으로 시험 대상이 패혈증을 발병하지 않을 수 있음을 예측하는 것인, 컴퓨터 프로그램 제품.
  85. 제83항에 있어서, 상기 바이오마커 프로필이 표 I에 기재된 3개 내지 50개의 바이오마커로 구성되는 것인 컴퓨터 프로그램 제품.
  86. 제83항에 있어서, 상기 바이오마커 프로필이 표 I에 기재된 3개 내지 40개의 바이오마커로 구성되는 것인 컴퓨터 프로그램 제품.
  87. 제83항에 있어서, 다수의 바이오마커가 표 I에 기재된 4개 이상의 바이오마커를 포함하는 것인 컴퓨터 프로그램 제품.
  88. 제83항에 있어서, 다수의 바이오마커가 표 I에 기재된 8개 이상의 바이오마커를 포함하는 것인 컴퓨터 프로그램 제품.
  89. 중앙 처리 장치; 및 중앙 처리 장치에 연결된 메모리를 포함하며,
    메모리는 패혈증을 발병할 위험이 있는 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제1 수치 세트를 만족하는지를 평가하기 위한 지침을 저장하고, 제1 수치 세트를 만족하는 것으로 시험 대상이 패혈증을 발병할 수 있음을 예측하고, 다수의 특성은 표 I로부터의 3개 이상의 바이오마커를 포함하는 다수의 바이오마커의 측정가능한 측면이고, 다수의 바이오마커가 IL-6 및 IL-8을 둘 다 포함하는 경우 다수의 바이오마커는 표 I에 기재된 6개 이상의 바이오마커를 포함하는 것인 컴퓨터.
  90. 제89항에 있어서, 메모리가 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제2 수치 세트를 만족하는지를 평가하기 위한 지침을 추가로 저장하며, 제2 수치 세트를 만족하는 것으로 시험 대상이 패혈증을 발병하지 않을 수 있음을 예측하는 것인 컴퓨터
  91. 제89항에 있어서, 상기 바이오마커 프로필이 표 I에 기재된 3개 내지 50개의 바이오마커로 구성되는 것인 컴퓨터.
  92. 제89항에 있어서, 상기 바이오마커 프로필이 표 I에 기재된 3개 내지 40개의 바이오마커로 구성되는 것인 컴퓨터.
  93. 제89항에 있어서, 상기 다수의 바이오마커가 표 I에 기재된 4개 이상의 바이오마커를 포함하는 것인 컴퓨터.
  94. 제89항에 있어서, 상기 다수의 바이오마커가 표 I에 기재된 8개 이상의 바이오마커를 포함하는 것인 컴퓨터.
  95. 중앙 처리 장치; 및 중앙 처리 장치에 연결된 메모리를 포함하며, 메모리는
    표 I에 기재된 3개 이상의 바이오마커를 포함하는 다수의 바이오마커의 측정가능한 측면인 다수의 특성을 포함하는 시험 대상의 바이오마커 프로필을 얻기 위한 지침;
    바이오마커 프로필을, 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제1 수치 세트를 만족하는지를 평가하고 제1 수치 세트를 만족하는 것으로 시험 대상이 패혈증을 발병할 수 있음을 예측하기 위한 지침을 포함하는 리모트 컴퓨터로 전송하기 위한 지침; 및
    시험 대상의 바이오마커 프로필에서의 다수의 특성이 제1 수치 세트를 만족하는지에 대한 결정을 리모트 컴퓨터로부터 수신하기 위한 지침; 및
    시험 대상의 바이오마커 프로필에서의 다수의 특성이 제1 수치 세트를 만족하는지를 보고하기 위한 지침을 저장하며,
    다수의 바이오마커가 IL-6 및 IL-8을 둘 다 포함하는 경우 다수의 바이오마커는 표 I에 기재된 6개 이상의 바이오마커를 포함하는 것인, 대상이 패혈증을 발병할 수 있는지를 결정하기 위한 컴퓨터 시스템.
  96. 제95항에 있어서, 리모트 컴퓨터는 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제2 수치 세트를 만족하는지를 평가하기 위한 지침을 추가로 포함하고, 제2 수치 세트를 만족하는 것으로 시험 대상이 패혈증을 발병하지 않을 수 있음을 예측하고, 메모리는 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제2 수치 세트를 만족하는지에 대한 결정을 리모트 컴퓨터로부터 수신하기 위한 지침; 및 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제2 수치 세트를 만족하는지를 보고하기 위한 지침을 추가로 포함하는 것인, 컴퓨터 시스템.
  97. 제95항에 있어서, 다수의 바이오마커가 표 I에 기재된 4개 이상의 바이오마커를 포함하는 것인 컴퓨터 시스템.
  98. 제95항에 있어서, 다수의 바이오마커가 표 I에 기재된 8개 이상의 바이오마커를 포함하는 것인 컴퓨터 시스템.
  99. 다수의 특성은 표 I에 기재된 3개 이상의 바이오마커를 포함하는 다수의 바이오마커의 측정가능한 측면이고, 다수의 바이오마커가 IL-6 및 IL-8을 둘 다 포함하는 경우 다수의 바이오마커는 표 I에 기재된 6개 이상의 바이오마커를 포함하는 것인, 바이오마커 프로필에서의 다수의 특성 각각에 대한 각 수치를 포함하는, 반송파 상에 구현된 디지탈 신호.
  100. 제99항에 있어서, 다수의 바이오마커가 표 I에 기재된 4개 이상의 바이오마커를 포함하는 것인 디지탈 신호.
  101. 제99항에 있어서, 다수의 바이오마커가 표 I에 기재된 8개 이상의 바이오마커를 포함하는 것인 디지탈 신호.
  102. 시험 대상의 바이오마커 프로필에서의 다수의 특성이 수치 세트를 만족하는지에 대한 결정을 포함하며, 다수의 특성은 표 I에 기재된 3개 이상의 바이오마커를 포함하는 다수의 바이오마커의 측정가능한 측면이고, 수치 세트를 만족하는 것으로 시험 대상이 패혈증을 발병할 수 있음을 예측하고, 다수의 바이오마커가 IL-6 및 IL-8을 둘 다 포함하는 경우 다수의 바이오마커는 표 I에 기재된 6개 이상의 바이오마커를 포함하는 것인, 반송파 상에 구현된 디지탈 신호.
  103. 제102항에 있어서, 다수의 바이오마커가 표 I에 기재된 4개 이상의 바이오마커를 포함하는 것인 디지탈 신호.
  104. 제102항에 있어서, 다수의 바이오마커가 표 I에 기재된 8개 이상의 바이오마커를 포함하는 것인 디지탈 신호.
  105. 시험 대상의 바이오마커 프로필에서의 다수의 특성이 수치 세트를 만족하는지에 대한 결정을 포함하며, 다수의 특성은 표 I에 기재된 3개 이상의 바이오마커를 포함하는 다수의 바이오마커의 측정가능한 측면이고, 수치 세트를 만족하는 것으로 시험 대상이 패혈증을 발병하지 않을 수 있음을 예측하고, 다수의 바이오마커가 IL-6 및 IL-8을 둘 다 포함하는 경우 다수의 바이오마커는 표 I에 기재된 6개 이상의 바이오마커를 포함하는 것인, 반송파 상에 구현된 디지탈 신호.
  106. 제105항에 있어서, 다수의 바이오마커가 표 I에 기재된 4개 이상의 바이오마커를 포함하는 것인 디지탈 신호.
  107. 제105항에 있어서, 다수의 바이오마커가 표 I에 기재된 8개 이상의 바이오마커를 포함하는 것인 디지탈 신호.
  108. 리모트 컴퓨터로부터 수신된 반송파 상에 구현된 디지탈 신호로 코딩된 결과를 디스플레이하기 위한 디스플레이 필드를 포함하며, 다수의 특성은 표 I에 기재된 3개 이상의 바이오마커를 포함하는 다수의 바이오마커의 측정가능한 측면이고, 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제1 수치 세트를 만족하는 경우 상기 결과는 제1 수치를 갖고, 시험 대상의 바이오마커 프로필에서의 다수의 특성이 제2 수치 세트를 만족하는 경우 상기 결과는 제2 수치를 가지며, 다수의 바이오마커가 IL-6 및 IL-8을 둘 다 포함하는 경우 다수의 바이오마커는 표 I에 기재된 6개 이상의 바이오마커를 포함하는 것인, 대상이 패혈증을 발병할 수 있는지를 결정하기 위한 그래픽 사용자 인터페이스.
  109. 제108항에 있어서, 다수의 바이오마커가 표 I에 기재된 4개 이상의 바이오마커를 포함하는 것인 그래픽 사용자 인터페이스.
  110. 제108항에 있어서, 다수의 바이오마커가 표 I에 기재된 8개 이상의 바이오마커를 포함하는 것인 그래픽 사용자 인터페이스.
  111. 중앙 처리 장치; 및 중앙 처리 장치에 연결된 메모리를 포함하며, 메모리는
    표 I에 기재된 3개 이상의 바이오마커를 포함하는 다수의 바이오마커의 측정가능한 측면인 다수의 특성을 포함하는 시험 대상의 바이오마커 프로필을 얻기 위한 지침;
    시험 대상의 바이오마커 프로필에서의 다수의 특성이 제1 수치 세트를 만족하는지를 평가하고 제1 수치 세트를 만족하는 것으로 시험 대상이 패혈증을 발병할 수 있음을 예측하기 위한 지침; 및
    시험 대상의 바이오마커 프로필에서의 다수의 특성이 제1 수치 세트를 만족하는지를 보고하기 위한 지침을 저장하며,
    다수의 바이오마커가 IL-6 및 IL-8을 둘 다 포함하는 경우 다수의 바이오마커는 표 I에 기재된 6개 이상의 바이오마커를 포함하는 것인, 대상이 패혈증을 발병할 수 있는지를 결정하기 위한 컴퓨터 시스템.
  112. 제111항에 있어서, 다수의 바이오마커가 표 I에 기재된 4개 이상의 바이오마커를 포함하는 것인 컴퓨터 시스템.
  113. 제111항에 있어서, 다수의 바이오마커가 표 I에 기재된 8개 이상의 바이오마 커를 포함하는 것인 컴퓨터 시스템.
KR1020077026526A 2005-04-15 2006-04-14 패혈증의 진단 KR20080006617A (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US67162005P 2005-04-15 2005-04-15
US60/671,620 2005-04-15
US67404605P 2005-04-22 2005-04-22
US60/674,046 2005-04-22

Publications (1)

Publication Number Publication Date
KR20080006617A true KR20080006617A (ko) 2008-01-16

Family

ID=37115774

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020077026526A KR20080006617A (ko) 2005-04-15 2006-04-14 패혈증의 진단

Country Status (10)

Country Link
US (6) US7767395B2 (ko)
EP (1) EP1869463A4 (ko)
JP (1) JP2008538007A (ko)
KR (1) KR20080006617A (ko)
AU (1) AU2006236588A1 (ko)
BR (1) BRPI0609302A2 (ko)
CA (1) CA2605143A1 (ko)
IL (1) IL186649A0 (ko)
NO (1) NO20075906L (ko)
WO (1) WO2006113529A2 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015037769A1 (ko) * 2013-09-16 2015-03-19 엠앤디(주) 패혈증 진단용 조성물 및 그 방법 및 키트

Families Citing this family (127)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9042952B2 (en) 1997-01-27 2015-05-26 Lawrence A. Lynn System and method for automatic detection of a plurality of SPO2 time series pattern types
US8932227B2 (en) 2000-07-28 2015-01-13 Lawrence A. Lynn System and method for CO2 and oximetry integration
US20060161071A1 (en) 1997-01-27 2006-07-20 Lynn Lawrence A Time series objectification system and method
US9521971B2 (en) 1997-07-14 2016-12-20 Lawrence A. Lynn System and method for automatic detection of a plurality of SPO2 time series pattern types
US20070191697A1 (en) 2006-02-10 2007-08-16 Lynn Lawrence A System and method for SPO2 instability detection and quantification
US9053222B2 (en) 2002-05-17 2015-06-09 Lawrence A. Lynn Patient safety processor
US20060195041A1 (en) 2002-05-17 2006-08-31 Lynn Lawrence A Centralized hospital monitoring system for automatically detecting upper airway instability and for preventing and aborting adverse drug reactions
EP1573054A4 (en) * 2002-11-12 2005-12-28 Becton Dickinson Co DIAGNOSIS FOR SEPTICEMIA OR SIRS USING BIOMARKER PROFILES
EP1590469A4 (en) * 2002-11-12 2005-12-28 Becton Dickinson Co DIAGNOSIS OF SEPSIS OR SIRS USING BIOLOGICAL MARKERS PROFILES
US7191068B2 (en) * 2003-03-25 2007-03-13 Proteogenix, Inc. Proteomic analysis of biological fluids
US8068990B2 (en) * 2003-03-25 2011-11-29 Hologic, Inc. Diagnosis of intra-uterine infection by proteomic analysis of cervical-vaginal fluids
EP1619257A1 (en) * 2004-07-23 2006-01-25 One Way Liver Genomics, S.L. Method for the in vitro diagnosis of non-alcoholic steatohepatitis
JP2008538238A (ja) * 2005-03-31 2008-10-16 ザ・ボード・オブ・トラスティーズ・オブ・ザ・レランド・スタンフォード・ジュニア・ユニバーシティ 神経精神障害を診断および処置するための組成物および方法
KR20080006617A (ko) 2005-04-15 2008-01-16 백톤 디킨슨 앤드 컴퍼니 패혈증의 진단
US20100150885A1 (en) * 2005-06-01 2010-06-17 Joslin Diabetes Center, Inc. Methods and compositions for inducing brown adipogenesis
FR2888252A1 (fr) * 2005-07-07 2007-01-12 Biomerieux Sa Procede pour le diagnostic du cancer du sein
US7668579B2 (en) 2006-02-10 2010-02-23 Lynn Lawrence A System and method for the detection of physiologic response to stimulation
WO2007100913A2 (en) * 2006-02-28 2007-09-07 The Regents Of The University Of California Genes differentially expressed in bipolar disorder and/or schizophrenia
US20090220973A1 (en) * 2006-04-03 2009-09-03 Joslin Diabetes Center, Inc. Obesity and body fat distribution
CN101484806A (zh) 2006-05-17 2009-07-15 协乐民公司 一种对组织进行自动分析的方法
US9114398B2 (en) 2006-11-29 2015-08-25 Canon U.S. Life Sciences, Inc. Device and method for digital multiplex PCR assays
US20090104605A1 (en) * 2006-12-14 2009-04-23 Gary Siuzdak Diagnosis of sepsis
DE102006062398A1 (de) * 2006-12-20 2008-06-26 Edi (Experimentelle & Diagnostische Immunologie) Gmbh Verfahren zur Erkennung und/oder Charakterisierung zellulärer Aktivitätsmuster, Verwendung von Toll-like-Rezeptor-Liganden (TLR-Liganden) und ein Kit
US8050870B2 (en) * 2007-01-12 2011-11-01 Microsoft Corporation Identifying associations using graphical models
US8224670B2 (en) * 2007-01-25 2012-07-17 Cerner Innovation, Inc. Graphical user interface for visualizing person centric infection risk
US20090047694A1 (en) * 2007-08-17 2009-02-19 Shuber Anthony P Clinical Intervention Directed Diagnostic Methods
AU2008247649A1 (en) * 2007-05-01 2008-11-13 University Of Miami Transcriptomic biomarkers for individual risk assessment in new onset heart failure
US20090029372A1 (en) * 2007-05-14 2009-01-29 Kobenhavns Universitet Adam12 as a biomarker for bladder cancer
US8126690B2 (en) * 2007-05-18 2012-02-28 The Regents Of The University Of Michigan Algorithms to predict clinical response, adherence, and shunting with thiopurines
GB0711327D0 (en) * 2007-06-12 2007-07-25 Hansa Medical Ab Diagnostic method
US8431367B2 (en) 2007-09-14 2013-04-30 Predictive Biosciences Corporation Detection of nucleic acids and proteins
US20090075266A1 (en) * 2007-09-14 2009-03-19 Predictive Biosciences Corporation Multiple analyte diagnostic readout
EP2200648A1 (en) * 2007-09-10 2010-06-30 The University Of British Columbia Mitogen-activated protein kinase kinase kinase 14 (map3k14) polymorphisms as indicators of subject outcome in critically ill subjects
US20100267041A1 (en) * 2007-09-14 2010-10-21 Predictive Biosciences, Inc. Serial analysis of biomarkers for disease diagnosis
US7955822B2 (en) * 2007-09-14 2011-06-07 Predictive Biosciences Corp. Detection of nucleic acids and proteins
EP2056114A1 (en) * 2007-10-29 2009-05-06 Koninklijke Philips Electronics N.V. Automatic detection of infectious diseases
GB0722582D0 (en) * 2007-11-16 2007-12-27 Secr Defence Early detection of sepsis
JP2011505579A (ja) * 2007-12-04 2011-02-24 ユニバーシティ オブ マイアミ 眼圧を変調し、ステロイドの応答者と非応答者とを鑑別するための分子標的
DE102008000715B9 (de) 2008-03-17 2013-01-17 Sirs-Lab Gmbh Verfahren zur in vitro Erfasssung und Unterscheidung von pathophysiologischen Zuständen
US8669113B2 (en) 2008-04-03 2014-03-11 Becton, Dickinson And Company Advanced detection of sepsis
EP2283119B1 (en) * 2008-05-06 2015-01-07 Joslin Diabetes Center, Inc. Methods and compositions for inducing brown adipogenesis
JP5474937B2 (ja) 2008-05-07 2014-04-16 ローレンス エー. リン, 医療障害パターン検索エンジン
BRPI0913924B1 (pt) 2008-07-01 2020-02-04 Univ Leland Stanford Junior método para determinação da probabilidade de que um indivíduo do sexo feminino irá experimentar um evento de nascimento com vida
GB0816867D0 (en) * 2008-09-15 2008-10-22 Glaxosmithkline Biolog Sa Method
WO2010041232A2 (en) * 2008-10-09 2010-04-15 The Provost, Fellows And Scholars Of The College Of The Holy And Undivided Trinity Of Queen Elizabeth, Near Dublin A method of estimating sepsis risk in an individual with infection
WO2010090834A2 (en) * 2009-01-20 2010-08-12 The Penn State Research Foundation Netrin-1 as a biomarker of injury and disease
US20100273207A1 (en) * 2009-04-24 2010-10-28 Raymond Langley Methods for Diagnosis of Sepsis and Risk of Death
ES2799327T3 (es) * 2009-05-05 2020-12-16 Infandx Ag Método para diagnosticar asfixia
WO2010141546A1 (en) 2009-06-02 2010-12-09 University Of Miami Diagnostic transcriptomic biomakers in inflammatory cardiomyopathies
DE102009044085A1 (de) 2009-09-23 2011-11-17 Sirs-Lab Gmbh Verfahren zur in vitro Erfassung und Unterscheidung von pathophysiologischen Zuständen
EP2985352A1 (de) 2009-09-23 2016-02-17 Analytik Jena AG Verfahren zur in vitro erfassung und unterscheidung von pathophysiologischen zuständen
EP2308999A1 (en) * 2009-09-24 2011-04-13 Ludwig-Maximilians-Universität München A combination of markers for predicting the mortality risk in a polytraumatized patient
WO2011066527A1 (en) * 2009-11-30 2011-06-03 The Ohio State University Zinc status biomarker materials and related methods
US20130203044A1 (en) * 2010-04-30 2013-08-08 University of Virginia Patent Foundation, d/b/a Universiy of Virginia Licensing & Ventures Group System, method and computer program product for the organism-specific diagnosis of septicemia in infants
US20110312521A1 (en) * 2010-06-17 2011-12-22 Baylor Research Institute Genomic Transcriptional Analysis as a Tool for Identification of Pathogenic Diseases
US8904511B1 (en) 2010-08-23 2014-12-02 Amazon Technologies, Inc. Virtual firewalls for multi-tenant distributed services
GB201016161D0 (en) 2010-09-24 2010-11-10 Hansa Medical Ab Diagnostic method
WO2012068642A1 (en) * 2010-11-26 2012-05-31 Immunexpress Pty Ltd Diagnostic and/or screening agents and uses therefor
EP2656257A2 (en) * 2010-12-20 2013-10-30 Koninklijke Philips N.V. Methods and systems for identifying patients with mild cognitive impairment at risk of converting to alzheimer's
EP2668287B1 (en) * 2011-01-25 2017-09-06 TC LAND Expression Genes and genes combinations based on gene mknk1 predictive of early response or non response of subjects suffering from rheumatoid arthritis to tnf-alpha blocking monoclonal antibody
GB201102108D0 (en) 2011-02-07 2011-03-23 Hansa Medical Ab Diagnostic method
DE102011005235B4 (de) 2011-03-08 2017-05-24 Sirs-Lab Gmbh Verfahren zum Identifizieren einer Teilmenge von Polynucleotiden aus einer dem Humangenom entsprechenden Ausgangsmenge von Polynucleotiden zur in vitro Bestimmung eines Schweregrads der Wirtsantwort eines Patienten
ES2739623T3 (es) 2011-03-17 2020-02-03 Cernostics Inc Sistemas y composiciones para diagnosticar el esófago de Barrett y métodos para usarlos
EP2520662A1 (en) * 2011-05-04 2012-11-07 Stichting Sanquin Bloedvoorziening Means and methods to determine a risk of multiple organ failure
CN104126123B (zh) * 2011-12-09 2016-10-26 谢策·谢泽马 用于检测乳中的细菌的方法
WO2013107826A2 (en) * 2012-01-17 2013-07-25 Institut Pasteur Use of cellular biomarkers expression to diagnose sepsis among intensive care patients
CN104204803B (zh) 2012-02-09 2018-08-07 米密德诊断学有限公司 用于诊断感染的标记和决定因素和其使用方法
EP2648133A1 (fr) * 2012-04-04 2013-10-09 Biomerieux Identification de microorganismes par spectrometrie et classification structurée
US9275334B2 (en) * 2012-04-06 2016-03-01 Applied Materials, Inc. Increasing signal to noise ratio for creation of generalized and robust prediction models
DE102012209059B4 (de) 2012-05-30 2024-05-02 Siemens Healthineers Ag Verfahren und Vorrichtung zur Bestimmung einer zeitlichen Änderung eines Biomarkers in einem Untersuchungsgebiet
EP2854622A1 (en) 2012-06-05 2015-04-08 Cheetah Medical, Inc. Method and system for assessing likelihood of sepsis
FR2991777B1 (fr) 2012-06-07 2015-08-21 Biomerieux Sa Procede de detection et/ou de dosage de l'annexine a3 d'un mammifere dans le sang ou au moins un de ses derives
US9336302B1 (en) 2012-07-20 2016-05-10 Zuci Realty Llc Insight and algorithmic clustering for automated synthesis
US9953453B2 (en) 2012-11-14 2018-04-24 Lawrence A. Lynn System for converting biologic particle density data into dynamic images
US10354429B2 (en) 2012-11-14 2019-07-16 Lawrence A. Lynn Patient storm tracker and visualization processor
US9274971B2 (en) 2012-11-27 2016-03-01 International Business Machines Corporation Low latency data exchange
CN104021264B (zh) 2013-02-28 2017-06-20 华为技术有限公司 一种缺陷预测方法及装置
EP2961312A4 (en) 2013-02-28 2017-01-04 Lawrence A. Lynn Patient storm tracker and visualization processor
DE102013206291A1 (de) * 2013-04-10 2014-10-16 Robert Bosch Gmbh Verfahren und Vorrichtung zum Erstellen eines nicht parametrischen, datenbasierten Funktionsmodells
KR101515700B1 (ko) 2013-05-15 2015-04-27 경북대학교 산학협력단 Tgfbi를 이용한 패혈증 진단용 조성물 및 이를 이용한 패혈증 예방 또는 치료용 약학적 조성물과 이의 스크리닝 방법
CA2914193A1 (en) 2013-06-20 2014-12-24 Immunexpress Pty Ltd Biomarker identification
EP3013985A4 (en) * 2013-06-28 2017-07-19 Acumen Research Laboratories Pte. Ltd. Sepsis biomarkers and uses thereof
CN103455616B (zh) * 2013-09-10 2017-06-13 广东金鉴检测科技有限公司 一种对sims数据进行读取和分析的方法及系统
WO2015077781A1 (en) 2013-11-25 2015-05-28 Children's Hospital Medical Center Temporal pediatric sepsis biomarker risk model
GB201322034D0 (en) 2013-12-12 2014-01-29 Almac Diagnostics Ltd Prostate cancer classification
US10260111B1 (en) 2014-01-20 2019-04-16 Brett Eric Etchebarne Method of detecting sepsis-related microorganisms and detecting antibiotic-resistant sepsis-related microorganisms in a fluid sample
EP3103046B1 (en) 2014-02-06 2020-03-25 Immunexpress Pty Ltd Biomarker signature method, and apparatus and kits therefor
GB201402293D0 (en) * 2014-02-11 2014-03-26 Secr Defence Biomarker signatures for the prediction of onset of sepsis
WO2015135071A1 (en) 2014-03-14 2015-09-17 Hancock Robert E W Diagnostic for sepsis
GB201406259D0 (en) * 2014-04-07 2014-05-21 Univ Edinburgh Molecular predictors of neonatal sepsis
JP6661607B2 (ja) 2014-08-14 2020-03-11 メメド ダイアグノスティクス リミテッド 多様体および超平面を用いる生物学的データのコンピュータ分析
WO2016057945A1 (en) 2014-10-09 2016-04-14 Texas Tech University System Micro-device to detect infection
WO2016059636A1 (en) 2014-10-14 2016-04-21 Memed Diagnostics Ltd. Signatures and determinants for diagnosing infections in non-human subjects and methods of use thereof
AU2015360448A1 (en) * 2014-12-10 2017-06-29 Neogenomics Laboratories, Inc. Automated flow cytometry analysis method and system
US10592637B2 (en) 2014-12-24 2020-03-17 Luminare Incorporated System, apparatus, method, and graphical user interface for screening
WO2016145426A1 (en) 2015-03-12 2016-09-15 The Board Of Trustees Of The Leland Methods for diagnosis of sepsis
CA2986787A1 (en) * 2015-05-28 2016-12-01 Immunexpress Pty Ltd Validating biomarker measurement
CA3015046A1 (en) 2016-03-03 2017-09-08 Memed Diagnostics Ltd. Rna determinants for distinguishing between bacterial and viral infections
WO2017165693A1 (en) * 2016-03-23 2017-09-28 Peach Intellihealth, Inc. Use of clinical parameters for the prediction of sirs
EP4141448A1 (en) 2016-07-10 2023-03-01 MeMed Diagnostics Ltd. Protein signatures for distinguishing between bacterial and viral infections
WO2018011796A1 (en) 2016-07-10 2018-01-18 Memed Diagnostics Ltd. Early diagnosis of infections
WO2018060998A1 (en) 2016-09-29 2018-04-05 Memed Diagnostics Ltd. Methods of prognosis and treatment
CN110073220A (zh) 2016-09-29 2019-07-30 米密德诊断学有限公司 风险评估和疾病分类的方法
GB201616557D0 (en) * 2016-09-29 2016-11-16 Secretary Of State For Health The Assay for distinguishing between sepsis and systemic inflammatory response syndrome
US11205103B2 (en) 2016-12-09 2021-12-21 The Research Foundation for the State University Semisupervised autoencoder for sentiment analysis
WO2018140256A1 (en) * 2017-01-17 2018-08-02 Duke University Gene expression signatures useful to predict or diagnose sepsis and methods of using the same
US9820157B1 (en) * 2017-03-06 2017-11-14 Wipro Limited Method and system for localizing spatially separated wireless transmitters
US10209260B2 (en) 2017-07-05 2019-02-19 Memed Diagnostics Ltd. Signatures and determinants for diagnosing infections and methods of use thereof
MY202410A (en) 2017-09-01 2024-04-27 Venn Biosciences Corp Identification and use of glycopeptides as biomarkers for diagnosis and treatment monitoring
US11852640B2 (en) 2017-10-27 2023-12-26 Beckman Coulter, Inc. Hematology analyzers and methods of operation
CN107862319B (zh) * 2017-11-19 2021-11-16 桂林理工大学 一种基于邻域投票的异源高分光学影像匹配误差剔除方法
US11521706B2 (en) 2018-04-20 2022-12-06 Beckman Coulter, Inc. Testing and representing suspicion of sepsis
EP3782166B1 (en) * 2018-04-20 2023-08-09 Beckman Coulter, Inc. Sepsis infection determination systems and methods
US11994514B2 (en) 2018-06-15 2024-05-28 Beckman Coulter, Inc. Method of determining sepsis in the presence of blast flagging
CN110095603B (zh) * 2019-04-15 2022-05-17 中国人民解放军陆军特色医学中心 血浆或血清中vnn1在用于脓毒症早期预警的标志物中的应用
WO2021011356A1 (en) 2019-07-12 2021-01-21 Beckman Coulter, Inc. Systems and methods for evaluating immune response to infection
CN110954701B (zh) * 2019-12-18 2023-07-21 重庆医科大学 一种肝纤维化或肝硬化的诊断试剂盒
EP3882363A1 (en) * 2020-03-17 2021-09-22 Koninklijke Philips N.V. Prognostic pathways for high risk sepsis patients
EP3882922A1 (en) * 2020-03-21 2021-09-22 Tata Consultancy Services Limited Discriminating features based sepsis prediction
GB2596142B (en) * 2020-06-19 2023-11-29 Secr Defence Methods and associated uses, kits and systems for assessing sepsis
FR3112211A1 (fr) * 2020-07-06 2022-01-07 bioMérieux Procédé pour déterminer le risque de survenue d’une infection associée aux soins chez un patient
FR3112207A1 (fr) * 2020-07-06 2022-01-07 bioMérieux Procédé pour déterminer le risque de survenue d’une infection associée aux soins chez un patient
WO2022064162A1 (en) * 2020-09-22 2022-03-31 The Secretary Of State For Defence Dstl Apparatus, kits and methods for predicting the development of sepsis
EP4217508A1 (en) * 2020-09-22 2023-08-02 The Secretary Of State For Defence Apparatus, kits and methods for predicting the development of sepsis
US20230340599A1 (en) * 2020-09-22 2023-10-26 The Secretary Of State For Defence Apparatus, kits and methods for predicting the development of sepsis
JP2024514404A (ja) * 2021-03-11 2024-04-02 コーニンクレッカ フィリップス エヌ ヴェ 高リスク敗血症患者のための予後経路
EP4308918A1 (en) * 2021-03-18 2024-01-24 Complete Omics International Methods and systems for detecting and quantifying large number of molecule biomarkers from a body fluid sample

Family Cites Families (145)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE7609263L (sv) 1976-08-20 1978-02-21 Wadsworth Charlies Forfaringssett for faststellande av kvantiteten av viss i en biologisk vetska loslig komponent, samt apparat for utovande av forfarandet
US4329152A (en) 1980-10-06 1982-05-11 International Lead Zinc Research Organization, Inc. Determination of β2 -microglobulin in human urine and serum by latex immunoassay
WO1987001597A1 (fr) 1985-09-19 1987-04-26 Toray Industries, Inc. COLONNE D'EXTRACTION DE beta2-MICROGLOBULINE
US5175113A (en) 1986-01-16 1992-12-29 Novo Nordisk A/S Modified β2 -microglobulin
DK160944C (da) 1986-01-16 1991-10-21 Novo Industri As Modificerede beta2-mikroglobuliner og farmaceutiske praeparater indeholdende disse
EP0247592B1 (en) 1986-05-30 1992-03-04 Kanegafuchi Kagaku Kogyo Kabushiki Kaisha Adsorbent for beta2-microglobulin and immunoglobulin l-chain
SU1504597A1 (ru) 1986-06-25 1989-08-30 Актюбинский государственный медицинский институт Способ дифференциальной диагностики сепсиса и локализованной гнойной инфекции у новорожденных
JPH0653170B2 (ja) 1986-07-07 1994-07-20 旭光学工業株式会社 β2ミクログロブリン吸着剤
US5093271A (en) 1986-11-28 1992-03-03 Shimadzu Corporation Method for the quantitative determination of antigens and antibodies by ratio of absorbances at different wavelengths
EP0319144A1 (en) 1987-11-06 1989-06-07 Asahi Kasei Kogyo Kabushiki Kaisha Adsorbent of beta 2-microglobulin
ES2048191T3 (es) 1987-12-11 1994-03-16 Akzo Nv Membrana de dialisis biocompatible a base de celulosa con adsorcion incrementada de beta-2-microglobulina.
US5500345A (en) 1989-04-25 1996-03-19 Iatron Laboratories, Inc. Hybridomas producing monoclonal antibodies specific for C-reactive protein and methods for detection of C-reactive protein
US5272258A (en) 1989-06-29 1993-12-21 Rush-Presbyterian-St. Luke's Medical Center Monoclonal antibodies to C-reactive protein
JPH06506195A (ja) 1991-01-14 1994-07-14 ニューヨーク ユニバシテイ サイトカイン誘導タンパク質、tsg−14、そのためのdnaコード化およびその使用
EP0587777A4 (en) 1991-05-31 1995-05-10 New England Deaconess Hospital CARCINOBRYONARY ANTIGEN BINDING PROTEINS AND METHODS OF ISOLATING AND USING THE SAME.
DE4227454C1 (de) 1992-08-19 1994-02-03 Henning Berlin Gmbh Verfahren zur Früherkennung, zur Erkennung des Schweregrads sowie zur therapiebegleitenden Verlaufsbeurteilung einer Sepsis sowie Mittel zur Durchführung des Verfahrens
US5358852A (en) 1992-12-21 1994-10-25 Eastman Kodak Company Use of calcium in immunoassay for measurement of C-reactive protein
ATE242485T1 (de) 1993-05-28 2003-06-15 Baylor College Medicine Verfahren und massenspektrometer zur desorption und ionisierung von analyten
RU2072103C1 (ru) 1993-06-10 1997-01-20 Ростовский научно-исследовательский институт акушерства и педиатрии Способ диагностики бактериальных инфекций у новорожденных
US5484705A (en) 1994-01-24 1996-01-16 Xoma Corporation Method for quantifying lipopolysaccharide binding protein
US5646005A (en) 1994-04-28 1997-07-08 Kudsk; Kenneth A. Use of an IL-6 assay for predicting the development of post-trauma complications
US5882872A (en) 1994-04-28 1999-03-16 Kudsk; Kenneth A. Use of an IL-6 assay for predicting the development of post-trauma complications
US6190872B1 (en) 1994-05-06 2001-02-20 Gus J. Slotman Method for identifying and monitoring patients at risk for systemic inflammatory conditions and apparatus for use in this method
US5804370A (en) 1994-06-08 1998-09-08 Critichem Medical Products Limited Early diagnosis of sepsis utilizing antigen-antibody interactions amplified by whole blood chemiluminescence
US6306614B1 (en) 1994-06-08 2001-10-23 Sepsis, Inc. Measurement of analytes in whole blood
US5932536A (en) * 1994-06-14 1999-08-03 The Rockefeller University Compositions for neutralization of lipopolysaccharides
US7625697B2 (en) * 1994-06-17 2009-12-01 The Board Of Trustees Of The Leland Stanford Junior University Methods for constructing subarrays and subarrays made thereby
US5780237A (en) 1994-10-12 1998-07-14 Cell Therapeutics, Inc. Sepsis, adult respiratory distress syndrome, and systemic inflammatory response syndrome diagnostic
US7597886B2 (en) 1994-11-07 2009-10-06 Human Genome Sciences, Inc. Tumor necrosis factor-gamma
US5708591A (en) 1995-02-14 1998-01-13 Akzo Nobel N.V. Method and apparatus for predicting the presence of congenital and acquired imbalances and therapeutic conditions
US6429017B1 (en) 1999-02-04 2002-08-06 Biomerieux Method for predicting the presence of haemostatic dysfunction in a patient sample
JP3436444B2 (ja) 1995-07-21 2003-08-11 ヤマサ醤油株式会社 酸化hdlの測定法及びキット
US5981180A (en) 1995-10-11 1999-11-09 Luminex Corporation Multiplexed analysis of clinical specimens apparatus and methods
US5830679A (en) 1996-03-01 1998-11-03 New England Medical Center Hospitals, Inc. Diagnostic blood test to identify infants at risk for sepsis
US5780286A (en) 1996-03-14 1998-07-14 Smithkline Beecham Corporation Arginase II
US6077665A (en) 1996-05-07 2000-06-20 The Board Of Trustees Of The Leland Stanford Junior University Rapid assay for infection in neonates
AU3878697A (en) 1996-06-20 1998-02-02 Cornell Research Foundation Inc. Identification of abnormalities in the expression of t and cell antigen receptors as indicators of disease diagnosis, prognosis and therapeutic predictors
US6172220B1 (en) 1997-01-21 2001-01-09 Board Of Regents Of University Of Nebraska Isolated algal lipopolysaccharides and use of same to inhibit endotoxin-initiated sepsis
US6420526B1 (en) 1997-03-07 2002-07-16 Human Genome Sciences, Inc. 186 human secreted proteins
NZ516848A (en) 1997-06-20 2004-03-26 Ciphergen Biosystems Inc Retentate chromatography apparatus with applications in biology and medicine
US6416487B1 (en) 1997-07-30 2002-07-09 Renal Tech International Llc Method of removing beta-2 microglobulin from blood
US5904663A (en) 1997-07-30 1999-05-18 Braverman; Andrew Method of removing beta-2 microglobulin from blood
EP1023464B1 (en) 1997-10-14 2017-07-26 Luminex Corporation Precision fluorescently dyed particles and methods of making and using same
AU1070399A (en) 1997-10-17 1999-05-10 Genentech Inc. Human toll homologues
US6159683A (en) * 1997-12-16 2000-12-12 Spectral Diagnostics, Inc. Method of determining stage of sepsis
US6268222B1 (en) 1998-01-22 2001-07-31 Luminex Corporation Microparticles attached to nanoparticles labeled with flourescent dye
CA2331897C (en) 1998-05-14 2008-11-18 Luminex Corporation Multi-analyte diagnostic system and computer implemented process for same
US6682741B1 (en) 1998-06-10 2004-01-27 The United States Of America As Represented By The Department Of Health And Human Services β2 microglobulin fusion proteins and high affinity variants
US6406862B1 (en) 1998-10-06 2002-06-18 The United States Of America As Represented By The Secretary Of The Army Dip-stick assay for C-reactive protein
DE19847690A1 (de) 1998-10-15 2000-04-20 Brahms Diagnostica Gmbh Verfahren und Substanzen für die Diagnose und Therapie von Sepsis und sepsisähnlichen systemischen Infektionen
US6248553B1 (en) 1998-10-22 2001-06-19 Atairgin Technologies, Inc. Enzyme method for detecting lysophospholipids and phospholipids and for detecting and correlating conditions associated with altered levels of lysophospholipids
US6251598B1 (en) 1998-10-30 2001-06-26 Interleukin Genetics, Inc. Methods for diagnosing sepsis
US6200766B1 (en) * 1998-12-03 2001-03-13 Becton Dickinson And Company Methods and reagents for quantitation of HLA-DR expression on peripheral blood cells
US6423505B1 (en) * 1998-12-03 2002-07-23 Becton Dickinson And Company Methods and reagents for quantitation of HLA-DR and CD11b expression on peripheral blood cells
AU2965500A (en) 1999-01-15 2000-08-01 Gene Logic, Inc. Immobilized nucleic acid hybridization reagent and method
ES2231167T3 (es) 1999-02-04 2005-05-16 Biomerieux, Inc. Procedimiento y aparato para predecir la disfuncion hemostatica en una muestra de un paciente.
US6316197B1 (en) * 1999-02-05 2001-11-13 The United States Of America As Represented By The Secretary Of The Army Method of diagnosing of exposure to toxic agents by measuring distinct pattern in the levels of expression of specific genes
US6303321B1 (en) 1999-02-11 2001-10-16 North Shore-Long Island Jewish Research Institute Methods for diagnosing sepsis
WO2000052472A1 (en) 1999-03-01 2000-09-08 The Board Of Trustees Of The Leland Stanford Junior University Rapid assay for infection in small children
US20040225449A1 (en) 1999-06-28 2004-11-11 Bevilacqua Michael P. Systems and methods for characterizing a biological condition or agent using selected gene expression profiles
US6960439B2 (en) * 1999-06-28 2005-11-01 Source Precision Medicine, Inc. Identification, monitoring and treatment of disease and characterization of biological condition using gene expression profiles
US6692916B2 (en) 1999-06-28 2004-02-17 Source Precision Medicine, Inc. Systems and methods for characterizing a biological condition or agent using precision gene expression profiles
US20050060101A1 (en) 1999-06-28 2005-03-17 Bevilacqua Michael P. Systems and methods for characterizing a biological condition or agent using precision gene expression profiles
DE10027113A1 (de) 1999-12-23 2001-09-27 Andreas Hoeft Verfahren zur Bestimmung von mikrobieller DNS/RNS, Kit dafür und Verwendung des Verfahrens
US6660482B1 (en) 2000-02-28 2003-12-09 Rhode Island Hospital Inter-alpha-trypsin inhibitor as a marker for sepsis
AU5610801A (en) 2000-03-03 2001-09-12 Gerd Schmitz Method for the analysis of exogenic and endogenic cell activation based on measuring the aggregation of receptors
US6838250B2 (en) 2000-03-31 2005-01-04 Ortho-Clinical Diagnostics, Inc. Immunoassay for C-reactive protein
US7363165B2 (en) * 2000-05-04 2008-04-22 The Board Of Trustees Of The Leland Stanford Junior University Significance analysis of microarrays
AU6679501A (en) 2000-06-09 2001-12-24 Akzo Nobel Nv A method for detecting a lipoprotein-acute phase protein complex and predicting an increased risk of system failure or mortality
US7220840B2 (en) 2000-06-16 2007-05-22 Human Genome Sciences, Inc. Antibodies that immunospecifically bind to B lymphocyte stimulator protein
AU6842701A (en) 2000-06-16 2002-01-14 Human Genome Sciences Inc Antibodies that immunospecifically bind to blys
JP2002017938A (ja) 2000-07-07 2002-01-22 Toyo Kogyo Kk 脛当て
IL153856A0 (en) 2000-07-18 2003-07-31 Correlogic Systems Inc A process for discriminating between biological states based on hidden patterns from biological data
US20030091565A1 (en) 2000-08-18 2003-05-15 Beltzer James P. Binding polypeptides and methods based thereon
JP2004536276A (ja) 2000-11-16 2004-12-02 シファーゲン バイオシステムズ, インコーポレイテッド 質量スペクトルを分析する方法
CA2431177C (en) 2000-12-08 2015-04-14 Baylor College Of Medicine Trem-1 splice variant for use in modifying immune responses
US20030027176A1 (en) 2001-02-15 2003-02-06 Dailey Peter J. Innate immunity markers for rapid diagnosis of infectious diseases
US20040253637A1 (en) 2001-04-13 2004-12-16 Biosite Incorporated Markers for differential diagnosis and methods of use thereof
US20040126767A1 (en) 2002-12-27 2004-07-01 Biosite Incorporated Method and system for disease detection using marker combinations
US7713705B2 (en) 2002-12-24 2010-05-11 Biosite, Inc. Markers for differential diagnosis and methods of use thereof
US20040121350A1 (en) 2002-12-24 2004-06-24 Biosite Incorporated System and method for identifying a panel of indicators
US20020160420A1 (en) 2001-04-30 2002-10-31 George Jackowski Process for diagnosis of physiological conditions by characterization of proteomic materials
US6627607B2 (en) 2001-04-30 2003-09-30 Syn X Pharma, Inc. Biopolymer marker indicative of disease state having a molecular weight of 1845 daltons
EP1270740A1 (en) 2001-06-29 2003-01-02 SIRS-Lab GmbH Biochip and its use for determining inflammation
US6872541B2 (en) 2001-07-25 2005-03-29 Coulter International Corp. Method and compositions for analysis of pentraxin receptors as indicators of disease
US6548646B1 (en) 2001-08-23 2003-04-15 Bio-Rad Laboratories, Inc. Reference control for high-sensitivity C-reactive protein testing
WO2003021257A1 (en) * 2001-08-30 2003-03-13 The University Of Pittsburgh Of The Commonwealth System Of Higher Education Of Pennsylvania Algorithm for estimating the outcome of inflammation following injury or infection
US20030057106A1 (en) 2001-09-12 2003-03-27 Zhouxin Shen High throughput chemical analysis by improved desorption/ionization on silicon mass spectrometry
US6939716B2 (en) 2001-09-19 2005-09-06 Washington University Method for detecting conditions indicative of sepsis
DE10155600B4 (de) 2001-11-09 2009-08-27 Oligene Gmbh Nukleinsäure-Array
KR20040064275A (ko) 2001-11-09 2004-07-16 소스 프리시전 메디슨, 인코포레이티드 유전자 발현 프로파일을 이용한 질병의 동정, 모니터링,치료 및 생물학적 상태의 확인
DE50105971D1 (de) 2001-12-04 2005-05-25 Brahms Ag Verfahren zur Diagnose von Sepsis unter Bestimmung von CA 125
DE50103030D1 (de) 2001-12-04 2004-09-02 Brahms Ag Verfahren zur Diagnose von Sepsis unter Bestimmung von S100B
ATE282831T1 (de) 2001-12-04 2004-12-15 Brahms Ag Verfahren zur diagnose von sepsis unter bestimmung löslicher cytokeratinfragmente
ATE272215T1 (de) 2001-12-04 2004-08-15 Brahms Ag Verfahren zur diagnose von sepsis unter bestimmung von ca 19-9
EP1318407B1 (de) 2001-12-07 2004-09-29 B.R.A.H.M.S Aktiengesellschaft Verwendungen der Aldose-1-Epimerase (Mutarotase) für die Diagnose von Entzündungserkrankungen und Sepsis
US20040072237A1 (en) 2001-12-26 2004-04-15 Barry Schweitzer Use of cytokines secreted by dendritic cells
US20040038201A1 (en) * 2002-01-22 2004-02-26 Whitehead Institute For Biomedical Research Diagnostic and therapeutic applications for biomarkers of infection
EP1476752A4 (en) 2002-02-27 2008-02-13 Bio Merieux Inc METHOD FOR DIAGNOSING AND MONITORING HEMOSTATIC DYSFUNCTION, SEVERE INFECTION AND SYSTEMATIC INFLAMMATORY RESPONSE SYNDROME
US20030235816A1 (en) 2002-03-14 2003-12-25 Baylor College Of Medicine (By Slawin And Shariat) Method to determine outcome for patients with prostatic disease
US7465555B2 (en) 2002-04-02 2008-12-16 Becton, Dickinson And Company Early detection of sepsis
US6930085B2 (en) 2002-04-05 2005-08-16 The Regents Of The University Of California G-type peptides to ameliorate atherosclerosis
EP1355159A1 (de) 2002-04-19 2003-10-22 B.R.A.H.M.S Aktiengesellschaft Verwendungen von Fragmenten der Carbamoylphosphat Synthetase 1 (CPS 1) für die Diagnose von Entzündungserkrankungen und Sepsis
EP1355158A1 (de) 2002-04-19 2003-10-22 B.R.A.H.M.S Aktiengesellschaft Verfahren zur Diagnose von Entzündungserkrankungen und Infektionen unter Bestimmung des Phosphoproteins LASP-1 als Inflammationsmarker
US7774143B2 (en) * 2002-04-25 2010-08-10 The United States Of America As Represented By The Secretary, Department Of Health And Human Services Methods for analyzing high dimensional data for classifying, diagnosing, prognosticating, and/or predicting diseases and other biological states
EP1369693A1 (de) 2002-06-04 2003-12-10 B.R.A.H.M.S Aktiengesellschaft Verfahren zur Sepsisdiagnose und zur Kontrolle von Spenderblut durch Bestimmung von anti-Asialo-Gangliosid-Antikörpern
US7015022B2 (en) 2002-06-07 2006-03-21 University Of Medicine & Dentistry Of New Jersey Mammalian catalase-dependent oxidation processes and methods for stimulating oxidative activities
US20040009503A1 (en) 2002-07-03 2004-01-15 Molecular Staging, Inc. Immune modulatory activity of human ribonucleases
CA2491026A1 (en) 2002-07-05 2004-01-15 The University Of British Columbia Diagnosis of sepsis using mitochondrial nucleic acid assays
WO2004008138A2 (en) 2002-07-11 2004-01-22 Upfront Chromatography A/S An extracorporeal stabilised expanded bed adsorption method for the treatment of sepsis
JP5179011B2 (ja) 2002-10-09 2013-04-10 ディーエムアイ バイオサイエンシズ インコーポレイテッド 胎盤虚血および多臓器不全のモニタリング
AU2003290605A1 (en) 2002-11-05 2004-06-03 The Regents Of The University Of Michigan Compositions and methods for the diagnosis and treatment of sepsis
EP1590469A4 (en) * 2002-11-12 2005-12-28 Becton Dickinson Co DIAGNOSIS OF SEPSIS OR SIRS USING BIOLOGICAL MARKERS PROFILES
EP1573054A4 (en) 2002-11-12 2005-12-28 Becton Dickinson Co DIAGNOSIS FOR SEPTICEMIA OR SIRS USING BIOMARKER PROFILES
MXPA05005031A (es) * 2002-11-12 2005-11-17 Becton Dickinson Co Diagnostico de la sepsis o sirs usando perfiles de biomarcadores.
EP1426447A1 (en) 2002-12-06 2004-06-09 Roche Diagnostics GmbH Method for the detection of pathogenic gram positive bacteria selected from the genera Staphylococcus, Enterococcus and Streptococcus
US20060099596A1 (en) 2002-12-06 2006-05-11 Roche Molecular Systems, Inc. Multiplex assay detection of pathogenic organisms
EP1579008A1 (en) 2002-12-19 2005-09-28 Source Precision Medicine, Inc. Identification, monitoring and treatment of infectious disease and characterization of inflammatory conditions related to infectious disease using gene expression profiles
JP2006526140A (ja) 2002-12-24 2006-11-16 バイオサイト インコーポレイテッド 鑑別診断のためのマーカーおよびその使用方法
US7191068B2 (en) 2003-03-25 2007-03-13 Proteogenix, Inc. Proteomic analysis of biological fluids
WO2004086043A1 (en) 2003-03-26 2004-10-07 Johnson & Johnson Medical Limited Prediction and detection of wound infection
WO2004087949A2 (de) 2003-04-02 2004-10-14 Sirs-Lab Gmbh Verfahren zur erkennung akuter generalisierter entzündlicher zustände (sirs), sepsis, sepsisähnlichen zuständen und systemischen infektionen
FR2855832B1 (fr) * 2003-06-03 2007-09-14 Biomerieux Sa Procede de diagnostic et/ou de pronostic d'un syndrome septique
US20050009074A1 (en) 2003-07-07 2005-01-13 Medtronic Vascular, Inc. Implantable monitor of vulnerable plaque and other disease states
US20050181386A1 (en) * 2003-09-23 2005-08-18 Cornelius Diamond Diagnostic markers of cardiovascular illness and methods of use thereof
US20050069958A1 (en) 2003-09-26 2005-03-31 Mills Rhonda A. Method for simultaneous evaluation of a sample containing a cellular target and a soluble analyte
US20050148029A1 (en) 2003-09-29 2005-07-07 Biosite, Inc. Methods and compositions for determining treatment regimens in systemic inflammatory response syndromes
CA2537668A1 (en) 2003-09-29 2005-04-14 Biosite Incorporated Methods and compositions for the diagnosis of sepsis
US7807696B2 (en) 2003-10-07 2010-10-05 The Feinstein Institute For Medical Research Isoxazole and isothiazole compounds useful in the treatment of inflammation
WO2005048823A2 (en) 2003-11-17 2005-06-02 Janssen Pharmaceutica N.V. Modeling of systemic inflammatory response to infection
AU2004311541B2 (en) 2003-12-10 2011-06-30 Novimmune Sa Neutralizing antibodies and methods of use thereof
PT1882946E (pt) 2003-12-23 2010-04-21 Roche Diagnostics Gmbh Método para avaliar artrite reumatóide através da medição de anti-ccp e interleucina 6
US20050196817A1 (en) * 2004-01-20 2005-09-08 Molecular Staging Inc. Biomarkers for sepsis
DE502004000540D1 (de) 2004-02-13 2006-06-14 Brahms Ag Verfahren zur Bestimmung der Bildung von Endothelinen zu Zwecken der medizinischen Diagnostik, sowie Antikörper und Kits für die Durchführung eines solchen Verfahrens
US20060211752A1 (en) * 2004-03-16 2006-09-21 Kohn Leonard D Use of phenylmethimazoles, methimazole derivatives, and tautomeric cyclic thiones for the treatment of autoimmune/inflammatory diseases associated with toll-like receptor overexpression
EP1787128A2 (en) 2004-07-09 2007-05-23 Amaox, Inc. Immune cell biosensors and methods of using same
EP1619505B1 (en) 2004-07-22 2008-04-16 BRAHMS Aktiengesellschaft Method for the diagnosis of critically ill patients
US20060024744A1 (en) 2004-07-28 2006-02-02 Mills Rhonda A Methods for substantially simultaneous evaluation of a sample containing a cellular target and a soluble analyte
GB0426982D0 (en) 2004-12-09 2005-01-12 Secr Defence Early detection of sepsis
DK1830881T3 (da) 2004-12-10 2010-09-20 Novimmune Sa Kombinationsterapier, som er målrettet mod multiple toll-like-receptorer og anvendelse deraf
WO2006102408A2 (en) 2005-03-22 2006-09-28 Children's Hospital Medical Center Methods and compositions for the modulation of immune responses and autoimmune diseases
US20060241040A1 (en) * 2005-04-06 2006-10-26 Alberto Visintin Methods of treating disorders associated with toll-like receptor 4 (TLR4) signalling
KR20080006617A (ko) 2005-04-15 2008-01-16 백톤 디킨슨 앤드 컴퍼니 패혈증의 진단
AU2006294481B2 (en) 2005-09-28 2012-12-20 Becton, Dickinson And Company Detection of lysophosphatidylcholine for prognosis or diagnosis of a systemic inflammatory condition
US8669113B2 (en) 2008-04-03 2014-03-11 Becton, Dickinson And Company Advanced detection of sepsis

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015037769A1 (ko) * 2013-09-16 2015-03-19 엠앤디(주) 패혈증 진단용 조성물 및 그 방법 및 키트

Also Published As

Publication number Publication date
US10443099B2 (en) 2019-10-15
EP1869463A2 (en) 2007-12-26
US20060246495A1 (en) 2006-11-02
AU2006236588A1 (en) 2006-10-26
US20210087632A1 (en) 2021-03-25
BRPI0609302A2 (pt) 2011-10-11
CA2605143A1 (en) 2006-10-26
US20160168638A1 (en) 2016-06-16
EP1869463A4 (en) 2010-05-05
WO2006113529A3 (en) 2007-07-19
US11578367B2 (en) 2023-02-14
US7767395B2 (en) 2010-08-03
US20140141435A1 (en) 2014-05-22
US20110105350A1 (en) 2011-05-05
IL186649A0 (en) 2008-01-20
NO20075906L (no) 2008-01-08
US20240060132A1 (en) 2024-02-22
WO2006113529A2 (en) 2006-10-26
JP2008538007A (ja) 2008-10-02

Similar Documents

Publication Publication Date Title
US20240060132A1 (en) Diagnosis of sepsis
US11091809B2 (en) Molecular diagnostic test for cancer
EP2715348B1 (en) Molecular diagnostic test for cancer
EP2604703B1 (en) Methods for evaluating graft survival in a solid organ transplant recipient
JP2022058359A (ja) 敗血症の診断法
AU2012261820A1 (en) Molecular diagnostic test for cancer
US20110144076A1 (en) Preterm delivery diagnostic assay
MXPA05005072A (es) Diagnostico de la sepsis o sirs usando perfiles de biomarcadores.
US20100304987A1 (en) Methods and kits for diagnosis and/or prognosis of the tolerant state in liver transplantation
WO2014165753A1 (en) Methods and compositions for diagnosis of glioblastoma or a subtype thereof
Casanova Molecular Strategies to Distinguish Key Subphenotypes in Sarcoidosis
USRE46843E1 (en) Methods and compositions for evaluating graft survival in a solid organ transplant recipient
Morgun et al. UltraRapid Communication

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid