KR20090068199A - 질량 분광법에 의한 바이오마커 어세이 - Google Patents

질량 분광법에 의한 바이오마커 어세이 Download PDF

Info

Publication number
KR20090068199A
KR20090068199A KR1020097000596A KR20097000596A KR20090068199A KR 20090068199 A KR20090068199 A KR 20090068199A KR 1020097000596 A KR1020097000596 A KR 1020097000596A KR 20097000596 A KR20097000596 A KR 20097000596A KR 20090068199 A KR20090068199 A KR 20090068199A
Authority
KR
South Korea
Prior art keywords
biomarker
signal
sample
mass
msba
Prior art date
Application number
KR1020097000596A
Other languages
English (en)
Inventor
토시히데 니시무라
아츠시 오기와라
유타카 교노
기요에르지 마르코-바르가
Original Assignee
아스트라제네카 유케이 리미티드
가부시키가이샤 메디칼 프로테오스코프
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 아스트라제네카 유케이 리미티드, 가부시키가이샤 메디칼 프로테오스코프 filed Critical 아스트라제네카 유케이 리미티드
Publication of KR20090068199A publication Critical patent/KR20090068199A/ko

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6848Methods of protein analysis involving mass spectrometry
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/74Optical detectors
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • G01N30/7233Mass spectrometers interfaced to liquid or supercritical fluid chromatograph

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Food Science & Technology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biophysics (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

본 발명은 샘플중에 하나 이상의 폴리펩티드 바이오마커가 존재하는 지를 결정하는 방법을 제공하며, 이러한 방법은, (a) 샘플을 질량 분광 (MS) 분석하고, 검출된 각각의 신호에 대한 체류 시간 지수 및 상응하는 질량을 기록하는 단계; (b) 각각의 신호에 상응하는 질량을 바이오마커 질량의 참조 데이터베이스와 상호관련시켜서 각각의 신호와 참조 바이오마커 사이의 상관관계를 형성하고, 질량이 참조 바이오마커 질량과 상호관련되지 않는 신호를 폐기하는 단계; (c) 질량이 참조 바이오마커와 상호관련되는 신호를 저장하는 단계; (d) 유사성 척도를 이용하여 각각의 신호의 MS 스펙트럼을 데이터베이스내의 참조 바이오마커의 MS 스펙트럼과 매칭시킴으로써 각각의 저장된 신호와 참조 바이오마커 사이의 상관관계를 확정하여 포지티브하게 상호관련되는 일련의 신호를 한정하는 단계; (e) 각각의 포지티브하게 상호관련되는 신호의 세기를 측정하고, 판별 함수를 이용하여 이의 절대 신호 세기 또는 이의 상대 신호 세기를 점수화하는 단계; (f) 한계치를 판별 함수로부터 수득된 점수값에 적용하여 바이오마커의 존재 여부를 결정하는 단계를 포함한다.

Description

질량 분광법에 의한 바이오마커 어세이 {MASS SPECTROMETRY BIOMARKER ASSAY}
본 발명은 바이오마커에 대한 어세이에 관한 것이다. 특히, 본 발명에는 질량 분광법에 의해 샘플중의 바이오마커의 존재를 자동적으로 스크리닝할 수 있는 멀티플렉스(multiplex) 어세이가 기재되어 있다.
바이오마커로서 공지된 다양한 생물학적 마커가 확인되었고, 이러한 마커는 생화학 및 분자생물학을 의학적 및 독성학적 상태에 적용함으로써 연구되었다. 바이오마커는 조직 및 체액 둘 모두에서 발견될 수 있으며, 혈액이 바이오마커 연구에 사용되는 가장 일반적인 체액이다.
바이오마커는 예측력을 지닐 수 있고, 그 자체로 특정 질환 또는 질병의 존재, 수준, 유형 또는 시기 (특정 미생물 또는 독소의 존재 또는 수준을 포함함), 특정 질환 또는 질병에 대한 감수성 (유전적 감수성을 포함함), 또는 특정 치료 (약물 치료를 포함함)에 대한 반응을 예측하거나 검출하는 데에 사용될 수 있다. 바이오마커는 연구 개발 프로그램의 효율을 개선시킴으로써 약물 발견 및 개발의 미래에서 더욱더 중요한 역할을 할 것으로 생각된다. 바이오마커는 진단제, 질병 진행의 감시인자(monitor), 치료의 감시인자 및 임상 결과의 예측인자로서 사용될 수 있다. 예를 들어, 다양한 바이오마커 연구 프로젝트가 특정 암의 마커 및 특정 심혈관 질병과 면역학적 질병의 마커를 확인하려는 시도를 하고 있다.
무손상(intact) 단백질은 겔 기반 분리 기술 뿐만 아니라 액체상 분리 기술 둘 모두를 이용하는 다수의 방법으로 어세이될 수 있다. 2차원 겔 전기영동이 가용화된 단백질 혼합물과 관련하여 사용되며, 여기서 단백질은 전하 및 크기를 기초로 분리된다. 단백질은 이성질체 형태 뿐만 아니라 번역후 수식 둘 모두가 분석되도록 분석된다. 단백질의 정량화는 염색 기법에 의해 이루어지며, 여기서 전염색(pre staining) 및 후염색(post staining) 기법 둘 모두가 적용될 수 있다. 대사 표지는 또한 선형 범위가 105 까지 확장될 수 있게 하여, 펨토몰(femtomolar) 범위내의 감수성을 제공한다. 단백질 확인은 절제된 겔 스폿 (gel spot)으로부터 수행된다. 단백질은 화학적 분해 및 개질 후에 소화된다. 생성된 펩티드 혼합물은 단리된 겔 샘플로부터 추출되고, 후속하여 질량 분광법에 의해 확인된다.
다차원 HPLC (고성능 액체 크로마토그래피)가 단백질 또는 펩티드를 분리하기 위한 양호한 대안으로서 사용될 수 있다. 단백질 또는 펩티드 혼합물은 보다 높은 분석력을 제공하는 일련의 크로마토그래피 정지상 또는 차원을 통과한다. HPLC는 많은 실험 방법에 대해 탄력적이고, 다양한 정지상 및 이동상이 관심있는 특정 단백질 또는 펩티드 부류를 분석하는 데에 있어서의 적합성 및 서로에 대한 상용성 그리고 다운스트림 질량 분광학적 검출 및 확인 방법과의 상용성에 관해 선택될 수 있다. 고성능 액체 크로마토그래피는 현재 고도의 재현성을 지닌 자동화 작업을 또한 가능하게 하는 최상의 용질 분리 방법이다. 이러한 유형의 멀티-메커니즘(multi-mechanism) 분리 플랫폼의 온-라인 구성이 프로테오믹스(proteomics) 연구에서 일반적으로 적용된다.
질량 분광법 (MS)은 또한 프로테오믹스 분야의 필수적 요소이다. 실제로, MS는 이러한 분야에서 정제된 단백질을 연구하고 특성화하기 위해 사용되는 주요 도구이다. 수 백개 또는 수 천개의 단백질을 디스플레이하는 프로테오믹스 및 MS에서의 인터페이스 링크 (interface link)는 고분해능이 하나의 겔상에서 달성될 수 있는 겔 기술에 의해 이루어진다. 연구자들은 프로테오믹스에 최초로 기동력를 제공하였던 2차원 겔을 대체하기 위해 MS의 능력을 성공적으로 이용하고 있다.
액체상 분리 기법 및/또는 겔-기반 분리 기법을 통해 분리된 단백질 또는 펩티드를 확인하기 위한 질량 분광법 (MS)의 적용 및 개발은 단백질 및 펩티드 발현 분석에서 현저한 기술적 진보를 초래하였다. 단백질 및 펩티드의 질량 분광학적 특성화를 위한 2가지 주요 방법이 존재한다: 매트릭스-보조 레이저 탈착 이온화 (MALDI) 및 전기분무 이온화 (ESI). 다양한 방법을 이용하여, MALDI 및 ESI 이온원이 펩티드의 질량 또는 서열을 결정하기 위해 비행시간(TOF) 또는 다른 유형의 질량 분광 분석기와 결합될 수 있다.
MALDI의 경우, 펩티드는 매트릭스와 공결정화(co-crystallization)되고, 레이저로 펄싱(pulsing)된다. 이러한 처리는 펩티드를 기화시키고 이온화시킨다. 그 후, 하전된 펩티드의 분자량 (질량)이 TOF 분석기에서 결정된다. 이러한 장치에서, 전기장은 하전된 분자를 검출기쪽으로 가속시키고, 이온화된 펩티드가 검출 기에 도달하는 데 걸리는 시간 길이 (비행시간)의 차이가 펩티드의 분자량을 나타내는데, 보다 작은 펩티드가 검출기에 보다 신속히 도달한다. 이러한 방법은 펩티드 혼합물의 질량 프로파일, 즉, 혼합물 중의 펩티드의 분자량 및 양의 프로파일을 생성시킨다. 그 후, 이러한 프로파일은 단백질 서열 데이터베이스로부터 공지된 단백질을 확인하는 데에 사용될 수 있다.
액체 크로마토그래피에 대한 ESI-MS 인터페이스 (LC/MS/MS)를 구성함으로써, LC-컬럼으로부터 용리되는 펩티드가 질량 분광계의 이온원내로 도입된다. 전압이 매우 미세한 니들(needle)에 적용된다. 그 후, 니들은 소적을 질량 분광 분석기내로 분무하며, 여기서 소적이 증발하고 펩티드 이온은 단편화되는 다양한 전하 상태에 상응하여 방출되며, 이로부터 서열이 결정될 수 있다. LC/MS/MS에서, 연구자들은 펩티드를 최초로 분리하기 위해 미세모세관 LC 장치를 사용한다.
질량 분광법 (MS)은 가치있는 분석 기법인데, 그 이유는 이러한 방법이 생체-분자의 고유 특성인 이의 질량을 매우 높은 감수성을 나타내며 측정하기 때문이다. 따라서, MS는 광범위한 분자 유형 (단백질, 펩티드, 또는 임의의 다른 생체-분자) 및 광범위한 샘플 유형/생물학적 물질을 측정하기 위해 사용될 수 있다. 정확한 샘플 준비가 MS 신호 생성 및 스펙트럼 분석 및 감수성을 위해 중요한 것으로 알려져 있다. 따라서, 샘플 준비는 분석의 전반적 가능성 및 감수성을 위한 중요한 영역이다.
단백질은 정지상인 크로마토그래피 컬럼 물질의 입자들내에서의 불리한 질량 전달로 인해 액체상 크로마토그래피 분리 기법에 의해 분리하기 어려운 생체-거대 분자이다. 그러나, 단백질은 2개의 인접한 아미노산을 연결시키는 펩티드 결합을 파괴함으로써 보다 작은 단위 (펩티드 또는 폴리펩티드) 형태로 제공될 수 있다. 이는 다른 단백질과 상호작용하여 펩티드 결합을 분해할 수 있는 단백질인 프로테아제에 의한 효소적 절단에 의해 달성될 수 있다. 트립신이 가장 일반적으로 사용되는 프로테아제이며, 이는 단백질 발현 분석 연구에서 사용된다. 효소적 분해 후, 생성된 펩티드의 복합 혼합물은 모세관 크로마토그래피에 의해 분리되고 분획화된다. 샘플 중의 소화된 단백질의 합인 전체 펩티드는 이러한 단계에서 분석되지 않는다. 상응하는 단백질로부터 생성된 펩티드는 크로마토그래피 분획화 단계에서 하나의 단위로서 분리되지 않지만, 샘플 중의 다른 모든 단백질로부터 생성된 펩티드와 함께 분리된다. 모세관으로부터 용리되는 고도로 분석되고 분리된 펩티드는 가장 일반적으로 전하 및 소수성을 기초로 하여 분획화된다. 분리된 펩티드는 플랫폼의 크로마토그래피 부분으로부터 질량 분광계내로 온-라인 도입됨으로써, 오염 가능성을 방지한다. 그 후, 그러한 주어진 시간 창 (time window)에 존재하는 모든 펩티드를 획득하기 위해 펩티드가 질량 결정된다 (m/z). 그 다음, 다수의 펩티드 질량이 주어진 시간 창에서의 이들의 존재비를 기초로 하여 서열분석 (MS/MS)을 위해 선택된다. 이는 전기분무 이온화 이온 트랩 (ion trap) 질량 분광계 시스템에 의한 새로운 이온 샘플링 인터페이스에 의해 수행된다. 상기 인터페이스는 트랩의 성능을 향상시키기 위해 이온 가이드 (ion guide) 및 이온 트랩으로서 선형 사중극자를 사용한다. 선형 사중극자에서 이온을 트랩핑하는 것은 시스템의 듀티 싸이클 (duty cycle)을 개선시키는 것으로 나타난다. 선형 사중극자에서 트랩핑된 이온의 쌍극자 여기가 원하지 않는 이온을 방출시키기 위해 사용된다.
1990년에 성공적인 계기장비가 최초로 출현한 후, 전기-분무 이온화 (ESI)를 이용하는 이온 트랩 질량 분광법은 미량 분석을 위한 범용 도구가 되었다. 전기분무는 펩티드 및 단백질과 같은 중요한 분석물을 이온화시킬 수 있는 온화한 공급원이다. ESI에서 생성된 고도로 하전된 이온은 질량 분석기의 범위를 확장시킬 수 있다. 트랩 질량 분광계는 탄력적인 탠덤(tandem) MS 능력 (MS n..... )과 같은 유리한 능력을 지닌다. 이러한 이온화 프로세스에서, 전구체 이온은 형성된 단편 이온들의 일부가 트랩내에서 불안정해지게 하는 조건하에서 질량-선택적 선형 이온 트랩내로의 가속에 의해 활성화된다. 시간 지연 후, 이온 트랩의 안정성 파라미터는 이전에 불안정했던 단편이 획득될 수 있도록 변화된다. 그 결과는 변형된 내부 에너지 분포를 지닌 전구체 이온들로부터 유래되는 생성물 이온 스펙트럼이다. 선형 이온 트랩내로의 전구체 이온의 진입 후 많은 밀리초(millisecond) 동안 전구체 내부 에너지 분포의 전개를 추적하는 것이 가능하다. 시간-지연된 단편화된 생성물 이온 스펙트럼은 전형적으로 감소된 순차적 단편화 생성물을 디스플레이하며, 이는 더욱 용이하게 해석되는 스펙트럼을 초래한다. 시간-지연된 단편화에 중요한 수 가지 중요한 실험 파라미터가 확인되었고, 논의되고 있다. 이러한 기법은 작은 전구체 이온 및 다중 하전된 펩티드 둘 모두에 대해 적용된다.
탠덤 질량 분광법 (MS/MS)은 복잡한 혼합물의 대부분의 현대 질량 분광학적 조사의 중심에 있다. 단편화는 표적 가스와의 충돌을 통한 전구체 이온의 활성화를 포함하고, 하전된 단편 및 중성 단편을 생성시킬 수 있다. 단편 이온들의 성질 뿐만 아니라 이들의 세기는 종종 전구체 이온의 구조를 나타내며, 이에 따라 미지의 분석물의 확인을 위한 유용한 정보를 산출할 수 있을 뿐만 아니라 다양한 부류의 분석물에 대한 유용한 스크리닝 기법을 제공할 수 있다. 다중 충돌을 통한 활성화는 활성화 시간을 연장시키고, 또한 보다 높은 에너지가 전구체 이온내로 안착(deposited)되게 할 수 있다. 보다 높은 충돌 가스 압력은 또한 보다 높은 충돌 이완율 (collision relaxation rate)을 암시한다.
2D 겔 전기영동에 의한 단백질 분리와 질량 분광법에 의한 분석을 조합하는 것이 바이오마커 분석을 위해 유용한 것으로 확립되었지만, 수 개의 바이오마커를 분석할 수 있는 멀티플렉스 시스템이 현재 실험 단계에 있다.
많은 질병이 질병의 진단에 사용될 수 있거나 환자에 의한 약물 치료에 대한 반응을 나타낼 수 있는 바이오마커의 복잡한 패턴과 관련된 것으로 밝혀졌다. 이러한 패턴은 다수의 동시 분석을 필요로 하는 수 개의 바이오마커를 종종 포함한다. 따라서, 다수의 바이오마커를 동시에 어세이할 수 있는 시스템이 필요한 실정이다. 이상적으로, 시스템은 자동화될 수 있다.
발명의 개요
본 발명은 생물학적 샘플 중의 바이오마커에 대한 자동화되고 정확한 어세이를 제공한다. 이러한 어세이는 바이오마커를 확인하기 위해 질량 분광법에 의존하며, 본원에서는 질량 분광법에 의한 바이오마커 어세이 (MSBA)로 일컬어진다.
본 발명은 조직, 혈액 또는 다른 임상적으로 수득된 표본의 양에 함유된 천연 단백질 및 펩티드를 함유하는 체액의 부피가 전형적으로 제한되는, 바람직하게 는 인간 시험 샘플 (비-인간 시험 샘플을 포함할 수 있음) 중에서 하나 이상의 폴리펩티드 바이오마커의 존재를 결정하는 방법을 제공한다
본 발명의 방법은 바람직하게는 하기 단계를 포함한다:
(a) 샘플을 질량 분광 (MS) 분석하고, 검출된 각각의 신호에 대한 체류 시간 지수 및 상응하는 질량을 기록하는 단계;
(b) 각각의 신호에 상응하는 질량을, 공지된 질병 또는 생물학적 변경으로부터의 바이오마커 질량의 마스터 세트를 보유하는 참조 데이터베이스에 상호관련시켜서, 각각의 시험 샘플 신호 및 참조 데이터베이스내의 바이오마커의 마스터 세트로부터의 바이오마커 사이의 상관관계를 형성하고, 질량이 마스터 데이터 세트 (master data set) 중의 참조 바이오마커 질량과 상호관련되지 않는 시험 신호를 폐기하는 단계;
(c) 질량이 마스터 데이터내의 참조 바이오마커와 상호관련되는 시험 샘플 신호를 저장하는 단계;
(d) 유사성 척도를 이용하여 각각의 신호의 MS 스펙트럼을 데이터베이스내의 참조 바이오마커의 MS 스펙트럼과 매칭시킴으로써 각각의 저장된 신호와 참조 바이오마커 사이의 상관관계를 확정하여, 포지티브하게 상호관련되는 일련의 신호를 한정하는 단계;
(e) 포지티브하게 상호관련되는 각각의 저장된 시험 신호의 세기를 측정하고, 판별 함수를 이용하여 이의 절대 신호 세기 또는 이의 상대 신호 세기를 점수화하는 단계;
(f) 한계치를 판별 함수로부터 수득된 점수값에 적용하여 바이오마커의 존재 여부를 결정하는 단계.
바람직하게는, 본 발명의 방법은 시험 샘플 스크리닝 단계에서 마스터 데이터 세트를 사용한다.
유리하게는, 본 발명의 방법은 마스터 데이터 세트 중의 확인된 특정 단백질 서열과 관련된 전하, 질량, 서열 스펙트럼의 독특한 특성 각각을 기초로 하는 데이터 세트의 질량 및 서열 동일성을 필터링(filtering)하고 스크리닝한다.
따라서, 첫 번째 일면에서, 본 발명은,
(a) 샘플을 질량 분광 (MS) 분석하고, 검출된 각각의 신호에 대한 체류 시간 지수 및 상응하는 질량을 기록하는 단계;
(b) 각각의 신호에 상응하는 질량을 바이오마커 질량의 참조 데이터베이스와 상호관련시켜서 각각의 신호와 참조 바이오마커 사이의 상관관계를 형성하고, 질량이 참조 바이오마커 질량과 상호관련되지 않는 신호를 폐기하는 단계;
(c) 질량이 참조 바이오마커와 상호관련되는 신호를 저장하는 단계;
(d) 유사성 척도를 이용하여 각각의 신호의 MS 스펙트럼을 데이터베이스내의 참조 바이오마커의 MS 스펙트럼과 매칭시킴으로써 각각의 저장된 신호와 참조 바이오마커 사이의 상관관계를 확정하여 포지티브하게 상호관련되는 일련의 신호를 한정하는 단계;
(e) 각각의 포지티브하게 상호관련되는 신호의 세기를 측정하고, 판별 함수를 이용하여 이의 절대 신호 세기 또는 이의 상대 신호 세기를 점수화하는 단계;
(f) 한계치를 판별 함수로부터 수득된 점수값에 적용하여 바이오마커의 존재 여부를 결정하는 단계를 포함하여, 샘플중에 하나 이상의 폴리펩티드 바이오마커가 존재하는 지를 결정하는 방법을 제공한다.
본 발명의 방법은 사용자로 하여금 샘플 중의 수 백 또는 수 천개의 바이오마커를 동시에 분석할 수 있게 한다. 이러한 방법은 질병과 관련된 것으로 밝혀진 바이오마커의 데이터베이스에 의존하는데, 상기 데이터베이스는 각각의 바이오마커에 대한 질량 및 스펙트럼 데이터를 포함하고 상기 바이오마커가 주어진 샘플에서 MSBA 소프트웨어에 의해 정확하게 확인될 수 있게 한다. 샘플에 존재하는 펩티드를 스크리닝하고 MS 검출기에서 펩티드의 도달 시간과 상호관련되는 체류 시간 지수를 기초로 하여 요망되지 않는 서열을 제거함으로써, 30,000개 이상의 서열이 수 분내에 분석될 수 있고, 주어진 바이오마커는 높은 신뢰도를 나타내며 확인될 수 있다. 상기 방법은 자동화될 수 있고, 고효율(high-throughput)적이고, 비교적 비숙련된 기술자에 의해 수행될 수 있다.
샘플은 사전 분리 절차없이 MS 분석에 적용될 수 있다. 이러한 구체예에서, 샘플은 바람직하게는 정적 나노-전기분무 원리를 이용한 직접 주입, 플로우 인젝션 (flow injection) 분석 또는 샘플 농축을 수반하는 플로우 인젝션에 의해 분석된다.
유리하게는, 샘플이 MS 분석 전에 처리되는데, 이는 바람직하게는 샘플 성분을 MS내로 로딩시키기 전에 이들 샘플 성분을 분리하기 위한 것이다. 예를 들어, 샘플 처리는 단일상 또는 다중상 고압 액체 크로마토그래피 (HPLC)에 의한 샘플 분 리를 포함한다.
MS 시스템 그 자체는 바람직하게는 전기분무 이온화 (ESI) MS, 매트릭스-보조 레이저 탈착 이온화 - 비행시간 (MALDI-TOF) MS 또는 표면 증강 레이저 탈착 이온화 - 비행시간 (SELDI-TOF) MS 이다.
본 발명에 따른 방법은 유리하게는 자동화되고, 컴퓨터 제어하에서 수행된다. 샘플 중의 바이오마커의 확인은 상기 바이오마커에 대한 참조 데이터와의 비교에 의해 이루어지는데, 바람직하게는 다수의 바이오마커에 대한 참조 질량 및 MS 스펙트럼 데이터가 컴퓨터에 저장되어 있다.
소정의 바이오마커에 대한 참조 MS 스펙트럼은 바람직하게는 클러스터링 계산 (clustering calculation)에 의해 수득된 실제 데이터와 측정 데이터로부터 수득된 평균 스펙트럼이다.
본 발명의 방법은 두 가지 방식, 즉, 내부 표준을 사용하여 신호 세기를 정량화하기 위한 참조을 제공하는 방식과 그러한 표준을 사용하는 않는 방식으로 실행될 수 있다. 따라서, 한 가지 구체예에서, 하나 이상의 내부 표준이 MS에 의한 분석 전에 샘플에 첨가된다. 바람직하게는, 내부 표준은 표지된다.
본 발명의 이러한 실행방식에서, 각각의 바이오마커 신호에 대한 절대 신호 세기는 바이오마커 신호 세기를 측정하고 이를 하나 이상의 공지된 내부 표준의 신호 세기와 비교함으로써 점수화된다.
또 다른 실행방식에서, 샘플은 내부 표준을 첨가하지 않으며 처리된다. 이러한 구체예에서, 상대 신호 세기는 환자의 개개의 바이오마커 신호 세기와 환자군 에 대한 참조 신호 세기 간의 비를 측정함으로써 점수화된다.
바이오마커는 "정상적인 생물학적 작용, 발병 작용, 또는 치료적 개입에 대한 약리학적 반응의 지표로서 객관적으로 측정되고 평가되는 특성"으로서 설명될 수 있다. 바이오마커는 특정 질환 또는 질병과 관련된 임의의 확인가능하고 측정가능한 지표이며, 바이오마커의 존재 또는 수준과 질환 또는 질병의 일부 양상 (질환 또는 질병의 존재, 이의 수준 또는 변화 수준, 이의 유형, 이의 시기, 이에 대한 감수성, 또는 질환 또는 질병을 치료하기 위해 사용되는 약물에 대한 반응성을 포함함) 간의 상관관계가 존재한다. 상관관계는 정성적이거나, 정량적이거나, 정성적이고 정량적일 수 있다. 전형적으로, 바이오마커는 화합물, 화합물 단편 또는 화합물들의 군이다. 이러한 화합물은 단백질 (및 펩티드), 핵산 및 다른 화합물을 포함하는 생물체에서 발견되거나 이러한 생물체에 의해 생성된 임의의 화합물일 수 있다.
샘플은 관심있는 임의의 생물학적 물질일 수 있지만, 유리하게는 생물학적 조직이고, 바람직하게는 혈액 또는 혈장과 같은 생물학적 유체이다.
본 발명의 방법은 관찰된 MS 신호를 공지된 바이오마커의 참조 질량 및 MS 스펙트럼과 상호관련시키는 것에 의존한다. 참조 데이터는 바람직하게는 컴퓨터 서버에 저장되며, 이는 전체 절차가 컴퓨터 제어하에서 수행될 수 있게 한다.
신호는 예를 들어 본원에 기재된 계산 함수 (computational function)를 이용하여 비교에 의해 참조 표준과 상호관련된다. 바람직하게는, 신호는 유사성의 한계 수준이 달성되는 지의 여부에 따라 "포지티브" 또는 "네거티브"로 특성화되 며, 네거티브이고 유사성의 한계 수준을 달성하지 못하는 신호는 MSBA 프로세스에서 폐기되는 반면 포지티브한 신호는 바이오마커와 매칭되고 생물학적 샘플 중의 상기 바이오마커의 존재를 진단한다
신호 세기는 MSBA 어세이의 실행방식에 따라 생물학적 샘플에 첨가된 공지된 대조 표준을 참조로 측정되거나 환자군에 걸쳐 계산되는 참조 세기와의 비교에 의해 측정된다.
표준를 사용하는 실행방식의 경우, 바이오마커 신호의 MSBA 점수는 샘플 중에 존재하는 바이오마커의 신호와 샘플에 첨가된 내부 표준 간의 비에 의해 계산된다. 멀티플렉스 어세이에서 모든 바이오마커는 최종 MSBA 점수 인자를 생성시키는 방식과 동일한 방식으로 분석된다.
MSBA 방법에 부가되는 절대 정량화를 제공하기 위해, 내부 교정 표준을 사용하는 것이 바람직하다. 이러한 표준은 예를 들어 동위원소 표지되어, 어세이 판독(read-out)을 단백질 서열면에서 매우 정확해지게 할 뿐만 아니라 절대 정량화면에서 유리하게 한다. MSBA 스크리닝내의 내장(built in) 교정 서열은 혈액 또는 임의의 다른 임상 샘플 중의 절대 단백질 바이오마커 수준의 측정을 가능하게 한다.
멀티플렉스 판독을 나타내며 단백질 서열 바이오마커를 검출하고 정량하기 위한 다수의 연관된 단계로 구성된 신규한 방법이 제공되며, 여기서 비제한적으로 2개 내지 100개의 바이오마커의 발현 수준이 하나의 단일 MSBA 판독에서 맵핑될 수 있다. MSBA 시스템은 단일 라인 진단 맵핑을 취급할 수 있는 액체상 플랫폼상에 구축되거나 샘플의 동시 병렬 처리를 수반하는 다중 흐름 구성상에 구축됨으로써 시스템의 용량 및 처리량을 증가시킨다. MSBA 방법의 검출 모드는 질량 분광법에 의한 정확한 질량 확인과 서열 결정 및 후속 정량화이다.
이러한 방법은 액체 형태로 존재하거나 액체 형태로 변형될 수 있는 임의의 유형의 생물학적 샘플에 적용될 수 있다. MSBA 방법은 예를 들어 시간에 따른 속도론적 프로파일이 측정되는 임의의 유형의 세포 또는 생물공학 프로세스으로부터의 샘플을 또한 처리할 수 있다. 시간에 따른 이러한 분석은 시간에 따라 자동적으로 MSBA 플랫폼내로 샘플을 후속 도입시킴으로써 수행된다. MSBA 진단 프로파일링의 전체 분석 능력은 전적으로 질량 신호 평가, 서열 분석, 칭량 판별 (weighing discrimination)에 의한 멀티플렉스 정량화 및 마지막으로 MSBA SCORE 진단을 포함하는 컴퓨터 제어이다. 이러한 플랫폼상에서 실행되는 MSBA 싸이클내의 모든 중간 단계들은 임의의 주어진 생물학적 샘플로부터의 MSBA 분석의 각각의 싸이클에서 생성된 방대한 양의 데이터로부터 정확한 결정을 내리는 전용 알고리듬에 의해 평가된다.
MSBA 방법은 단백질 및 펩티드의 복잡한 혼합물내에 존재하거나 별개의 물질로서 존재하는 특정 펩티드 뿐만 아니라 이의 생화학적으로 변형된 변이체를 확인해준다. 각각의 펩티드는 이의 정확한 질량 또는 주어진 면역학적 시약에 대한 이의 독특한 면역-친화성 결합 특성에 의해 선택적으로 확인될 수 있는 아미노산의 특정 서열에 의해 규정될 수 있다.
상기 방법은 통계적으로 유의할 만한 단백질 동일성 및 이의 변형된 이형체 의 확인을 가능하게 한다. 더욱이, 내부 표준을 사용하지 않고도 샘플 중의 각각의 바이오마커의 상대량을 측정하는 것이 가능하다. 또한, 절대 정량화는 내부 표준을 사용함으로써 임의의 주어진 생물학적 샘플 중에서 별도로 각각의 바이오마커에 대해 이루어질 수 있으며, 여기서 이러한 내부 표준 (예를 들어, n=1-20)은 바이오마커의 단백질 서열이다. 그 후, 이러한 내부 표준은 콜드(cold) 아미노산 서열 또는 동위원소 표지된 아미노산 서열로서 제조될 수 있다. 이러한 표준은 선택된 바이오마커와 동일한 서열을 지니며, 표지의 예외가 가능하다.
상기 방법은 생물학적 물질 샘플에 존재하는 독특한 단백질 서열의 특정 처리, 분리, 단리 및 확인을 초래하는 수 가지 핵심 단계들을 조합한 것이다. 상기 방법은 인간 임상 샘플에 적용될 수 있다. 상기 방법은 비-인간 동물로부터 유래된 샘플에 또한 적용될 수 있다.
본 발명자들은 주어진 샘플 가운데 규모가 예를 들어 2 내지 100개일 수 있는 주어진 멀티플렉스 바이오마커 군에서 정량적 변경을 지니는 것으로 입증된 생물학적 샘플로부터 예를 들어 물질의 원자 질량 단위로 제공되는 독특한 단백질 서열의 동일성을 확인하기 위한 다단계 방법을 제공한다.
더욱이, 본 발명자들은 임의의 특정 생물학적 샘플 중의 바이오마커가 임상, 세포 또는 임의의 다른 샘플 유형에서 사전-결정된 단백질 서열의 바이오마커 세트의 멀티플렉스 정량 이동 (quantitative shift)을 지니는 지를 결정하거나 확인하기 위한 방법을 제공한다. 이러한 정량적 변경은 최종적으로 MSBA 알고리듬에 의해 계산되어 진단 판독인 MSBA SCORE를 생성시킨다.
또한, 통계적으로 유의할 만한 유사성이 검출되고, 독특한 단백질 서열 동일성 또는 다중-펩티드 동일성으로서 기록될 수 있다. 통계적으로 유의할 만한 유사성을 결정하는 것은 공개적으로 이용가능한 단백질 및 유전자 서열 데이터베이스 뿐만 아니라 특별히 MSBA 방법의 요건을 충족시키도록 개발된 알고리듬을 이용하는 것을 포함한다.
바이오마커 확인을 위한 프로세스 단계들을 통합시키는 것이 유리하다. 통합된 프로세스는 하기 원리들에 의존한다: 1) 양질의 생체의학적 임상 물질, 2) 후속 액체상 분리를 수반하는 재현가능한 고속 샘플 처리, 3) 바이오마커의 멀티플렉스 세트의 정확한 정량적 및 정성적 결정 및 4) 데이터 생성을 제어하고 멀티플렉스 단백질 서열 군 중의 바이오마커를 하나씩 계산하고 단리할 수 있게 하는 알고리듬.
도 1은 MSBA 원리를 개략적으로 도시한 도면이다.
도 2는 MSBA와 관련된 데이터 취급 절차를 보다 상세히 도시한 도면이다.
도 3은 폐 질환 환자의 혈액 샘플로부터의 질량 스펙트럼을 도시한다. 다수의 바이오마커가 샘플에서 확인된다.
도 4는 바이오마커가 MSBA 소프트웨어에 의해 인식되는 MS 스펙트럼 및 생성된 CVLFPYGGCQGNGNK 바이오마커를 나타내는 후속 MS/MS 스펙트럼에 의해 제시되는, 멀티플렉스 어세이 (multiplex assay)로부터 생성된 바이오마커 주석달기(annotation)의 예를 도시한다.
도 5는 실시예 2에 기재된 바와 같은 19명의 환자의 샘플 데이터에 대한 11개의 바이오마커 신호를 지닌 MSBA 모델의 예측력을 평가하는 예를 도시한다. 10명의 환자(case) 및 9명의 대조 환자(control)는 이들이 맹검 샘플인 것처럼 다루어졌다. 각각의 피검체에 대한 MSBA 점수는 Eq.5를 이용하여 계산되었다. 이러한 예에서, MSBA 점수가 1이거나 1 보다 큰 피검체는 환자 (적색 원)로서 진단되었다. 그렇지 않은 경우, 피검체는 대조 환자 (청색 원)로서 간주되었다. 예측 정확도는 100%였다.
도 6은 실시예 3에 기재된 바와 같은 96명의 환자의 샘플 데이터에 대한 10개의 신호를 지닌 MSBA 모델을 이용한 자동-판별 결과를 도시한다. 각각의 점은 환자를 나타내고, 세로축은 Eq.6을 이용하여 계산된 판별 점수 (z)를 나타낸다. 이러한 점수가 0 보다 큰 경우, 이는 질병 환자 (적색 원)로서 해석되었다. 그렇지 않은 경우, 피검체는 대조 환자 (청색 원)로서 간주되었다. 예측 정확도는 83.3%였다.
바이오마커
바이오마커의 FDA 정의는 "정상적인 생물학적 작용, 발병 작용, 또는 치료적 개입에 대한 약리학적 반응의 지표로서 객관적으로 측정되고 평가되는 특성"이다.
본원에 사용된 용어 "바이오마커"는 질병의 존재 또는 진행을 감시하기 위해 사용될 수 있는 폴리펩티드를 의미하며, 이는 상기 FDA 정의와 일치한다.
바이오마커는 진단제, 질병 진행의 감시인자, 치료의 감시인자 및 임상 결과의 예측인자로서 사용될 수 있다. 예를 들어, 다양한 바이오마커 연구 프로젝트는 특정 암의 마커 및 특정 심혈관 질병과 면역 질병의 마커를 확인하려는 시도를 하고 있다.
이러한 질병 관련 단백질의 일부는 신규한 약물 표적으로서 확인될 수 있고, 일부는 질병 진행의 바이오마커로서 유용할 수 있다. 이러한 바이오마커는 신약 임상 개발을 개선시키거나 특정 질병에 대한 신규 진단시약을 개발하는 데에 사용될 수 있다.
질병 관련 단백질은 당 분야에 공지되어 있고, 질병에 대한 바이오마커로서의 이들 단백질의 용도는 확립되어 있다. 이러한 바이오마커는 본 발명에 의해 감시될 수 있다. 그러나, 신규한 질병 관련 단백질이 확인될 수 있다. 질병 관련 단백질의 검출은 예를 들어 하기 방법에 의해 달성될 수 있다. 단백질 샘플을 개별 환자 또는 환자의 군으로부터 채취한다. 이러한 샘플은 단백질 및/또는 펩티드 구성성분을 추출하고 농축시키기 위해 처리되는 세포, 조직 또는 생물학적 유체일 수 있다. 전형적으로, 방법은 용액상으로 분배시키는 것을 수반하지만, 고체 매트릭스에 부착된 단백질 및/또는 펩티드 성분을 확립하는 것을 또한 포함할 수 있다. 분리 및 분석 (프로테오믹스, 펩티도노믹스(peptidonomics)) 후, 단백질 발현 핑거프린트(fingerprint)를 정성적 및 정량적 측정에 의해 질병에 걸린 피검체 및 건강한 피검체 둘 모두에 대해 생성시킨다. 이러한 핑거프린트를 개개인을 구별하고/거나 특정한 천연 또는 질병 작용을 확립하고/하거나 추적하기 위한 독특한 확인인자(identifier)로서 사용할 수 있다. 이러한 프로토타입(prototype) 핑거프린트를 각각의 개별적 샘플/피검체에 대해 확립하고, 컴퓨터 데이터베이스에 수치로서 기록한다. 그 후, 핑거프린트를, 프로토타입 핑거프린트에 존재하며 그 발현이 건강한 피검체 샘플 및 질병에 걸린 피검체 샘플로부터 유래된 샘플에 차등적으로 존재하거나 그렇지 않을 수 있는 단백질 또는 펩티드를 확인하고 선택하기 위해 생물정보학 도구(bioinformatic tool)를 사용하여 분석한다. 그 후, 이러한 단백질/펩티드를 추가로 특성화하고, 단백질 또는 펩티드의 특징적인 물리적 성질을 확인하는 상세한 프로파일을 생성시킨다. 개개의 단백질/펩티드 또는 단백질/펩티드의 군이 특정한 천연 또는 질병 작용과 현저하게 관련된 것으로 결정될 수 있다.
질량 분광법
질량 분광법은 단백질 및 펩티드의 분석을 위해 선택되는 방법이다. 현대 바이오마커 발견 연구는 2가지 주요 분광법 원리를 사용한다: 단백질이 결정질 상태에서 분석되는 MALDI-TOF (매트릭스 보조 레이저 탈착 이온화 비행시간) 질량 분광법, 및 단백질이 액체 상태에서 분석되는 ESI (전기분무 이온화) 질량 분광법. 또한, 표면-증강 레이저 탈착 이온화 (SELDI)라 명명되는 MALDI의 표면 증강 칩 적용법이 바이오마커 발견 연구에서 광범위하게 사용되어 왔다. (참조: Petricoin et al., Lancet, 16, 572-577, 2002; Alexe et al., Proteomics. 2004, 4766-4783; 및 Liotta et al., Endocr Relat Cancer. 2004 Dec;11(4):585-7).
표면-증강 레이저 탈착/이온화 (SELDI)-TOF-MS 기술은 어세이 표적 플레이트에 커플링된 크로마토그래피 표면을 사용한다. 그 후, 플레이트상의 단백질-결합 물질은 MALDI-MS에 의해 직접 분석된다. SELDI는 주로 저분자량 범위의 펩티드 및 단백질을 어세이한다. 이러한 기술은 적절한 선행(upfront) 정제 설계가 통합되지 않는 주요 빈도 (major-abundant) 내지 중간 빈도 (medium-abundant) 펩티드 및 단백질에 적용될 수 있다. SELDI 기술은 서열분석이 펩티드의 MALDI-TOF-TOF 확인을 이용하여 수행되게 할 수 있는 패턴을 주로 초래한다.
멀티-메커니즘 분리 플랫폼은 전기분무 이온화 질량 분광법을 이용하여 온-라인 구성되거나 매트릭스 보조 레이저 탈착 이온화 질량 분광법과 같은 이온화 원리를 이용하여 오프-라인 구성된 고분해능 펩티드 분리를 가능하게 한다. (참조: Aebersold,R. & Goodlett,D.R. Chem. Rev. 2001, 101, 269-295; Mann, et al., Annu. Rev. Biochem, 2001. 70, 437-473; Wolters,et al. Anal. Chem. 73, 5683-5690 (2001); 및 Washburn,et al., Nat. Biotechnol. 19, 242-247 (2001)).
질량 분광법 (MS)은 또한 프로테오믹스 분야의 필수적 요소이다. 실제로, MS는 이러한 분야에서 단백질 구조 및 서열을 연구하고 특성하기 위해 사용되는 주요 도구이다. (참조: Aebersold, R. & Mann, M. Mass spectrometry-based proteomics. Nature 422, 198-207 (2003); Steen, H. and M. Mann (2004). Nat Rev Mol Cell Biol 5(9): 699-711; 및 Olsen, J. V. and M. Mann (2004) Proc Natl Acad Sci U S A 101(37): 13417-22).
연구자들은 프로테오믹스에 최초로 기동력를 제공하였던 2차원 겔을 대체하기 위해 MS의 능력을 성공적으로 이용하고 있다. ESI 및 액체 크로마토그래피 (LC)/MS/MS를 사용하는 경우, LC-컬럼으로부터 용리되는 펩티드 서열을 생성하는 펩티드 혼합물을 함유하는 매우 미세한 니들에 전압이 적용된다. 그 후, 니들은 소적을 질량 분광 분석기내로 분무하며, 여기서 소적이 증발하고 펩티드 이온이 방출된다. LC/MS/MS에서, 연구자들은 펩티드를 최초로 분리하기 위해 미세모세관 LC 장치를 사용한다.
질량 분광법 (MS)은 가치있는 분석 기법인데, 그 이유는 이러한 방법이 생체-분자의 고유 특성인 이의 질량을 매우 높은 감수성을 나타내며 측정하기 때문이다. 따라서, MS는 광범위한 샘플 유형/생물학적 물질에서 광범위한 분자 유형 (단백질, 펩티드, 또는 임의의 다른 생체-분자)을 측정하기 위해 사용될 수 있다.
정확한 샘플 준비는 MS 신호 생성 및 스펙트럼 분석 및 감수성에 영향을 미칠 수 있다. 단일-차원 고압 액체 크로마토그래피 (LC) 및 다차원 액체 크로마토그래피 (LC/LC)와 같은 고분해능 분리 시스템은 질량 분광법과 직접적으로 인터페이싱될 수 있다. 이러한 인터페이스는 생성된 질량 스펙트럼내의 서열 정보 뿐만 아니라 정량화도 나타내는 거대한 데이터 세트의 신속하고 자동화된 획득 및 수집을 가능하게 한다. 이러한 통합된 샷건(shotgun) 프로테오믹스 기술은 MudPIT (Multidimensional Protein Identification Technology)로서 공지되어 있다. (참조: Eng et al., J Am Soc Mass Spectrom 1994, 5: 976-989; Link et al., Nat Biotechnol. 1999 Jul;17(7):676-82; Washburn et al., Nat Biotechnol. 2001 Mar;19(3):24-7; Lin et al., American Genomic/Proteomic Technology, 2001 1(1): 38-46; 및 Tabb et al., J. Proteome Res. 2002 1:21-26).
샷건 프로테오믹스 방법의 경우, 무손상 단백질이 아니라 트립신 및 다른 엔도- 및 엑소-펩티다아제/프로테이나아제와 같은 특정 단백질 소화 효소에 의해 생성된 펩티드가 분석된다. 이러한 단편화는 매우 소수성인 또는 매우 염기성인 단백질과 같은 다양한 물리적 및 화학적 특징을 지니는 매우 거대한 단백질이 분석될 수 있다는 사실로 인해 명확한 이점을 제공한다. 그렇지 않은 경우 이러한 단백질 부류는 취급하기 어려울 수 있다. 이러한 단백질은 정확한 단백질 주석달기 및 확인을 가능하게 하는 충분한 크기 및 개수의 펩티드 혼합물을 생성시킨다. 그러나, 수 개의 펩티드가 각각의 개별 단백질로부터 생성되기 때문에, 분석하려는 혼합물의 복잡성이 증가한다. 결과적으로, 상당한 계기 시간 (instrument time) 및 계산 능력이 샷건 방법을 위해 필요하다. 그러나, 풍부한 단백질 발현 정보는 광범위하고, 동시 실시간 단백질 확인이 수반되는 완전 자동화된 환경에서 생성된다.
다양한 질병 정도를 제공하는 다양한 환자 샘플을 취급할 수 있도록, 다양한 방법이 생성된 액체 크로마토그래피 크로마토그램 및 질량 스펙트럼을 조정하고 정렬하기 위해 적용될 수 있다. 이러한 정규화는 전체 실험으로부터 수득된 전체 신호 생성을 사용하고 이를 분석되는 다양한 환자 샘플의 신호 생성과 비교하는 소프트웨어 방법에 의해 수행될 수 있다. 모든 신호의 평균값 및 공통성이 차등 정량화 (differential quantitation)를 가능하게 하도록 정렬된다.
두 번째 방법에 있어서, 소정량의 펩티드 표준이 샘플에 첨가된다. 이러한 첨가는 샘플의 소화 전 및 소화 후 둘 모두, 또는 소화 전 또는 소화 후에 이루어진다. 사용되는 표준은 동위원소 표지된 서열로서 합성되거나 동위원소 표지없이 합성되고 샘플로 스파이킹된(spiked) 실제 바이오마커 서열이다.
정량적 임상 단백질 조절 연구에 대한 프로테오믹스 분야에서 표지 기술을 사용하는 것은 매우 일반적이다. 다양한 표지 기법이 개발되었고, 다양한 결합 화학을 이용하여 적용되어 왔다. 프로테오믹스 분야에서 가장 일반적으로 사용되는 표지로는 ICAT 및 ITRAQ 표지가 있다. (참조: Parker et al., Mol. Cell. Proteomics, 625-659, 3, 2004; Ross et al., Cell. Proteomics, 3, 1153-1169, 2004; 및 DeSouza et al., J. Proteome Res., 2005, 4, 377-386).
샘플 분리
단일차원 또는 다차원 HPLC (고성능 액체 크로마토그래피)가 단백질 또는 펩티드를 분리하기 위한 바람직한 대안으로서 사용된다. 단백질 또는 펩티드 혼합물은 보다 높은 분석력을 제공하는 일련의 크로마토그래피 정지상 또는 차원을 통과한다. HPLC는 많은 실험 방법에 대해 적합될 수 있고, 다양한 정지상 및 이동상이 관심있는 특정 단백질 또는 펩티드 부류를 분석하는 데에 있어서의 적합성 및 서로에 대해 그리고 다운스트림 질량 분광학적 검출 및 확인 방법과의 상용성에 대해 선택될 수 있다. HPLC는 상응하는 효소 생성물인 펩티드 혼합물이 생성되는 단백분해 효소에 의해 소화된 임상 샘플을 분리하기 위해 사용된다. 샘플 준비 절차는 혈액, 조직 또는 임의의 다른 유형의 체액과 같은 단백질 샘플에 적용된다. (참조: Schulte et al., Expert Rev. Diagn., 5(2), 2005, 145-157; Chertov et al., Expert Rev. Diagn., 5(2), 2005, 139-145; Adkins et al., Mol. Cell. Proteomics, 1 (12), 2002 947-955; Pieper et al., Proteomics. 2003 Jul;3(7):1345-64; 및 Anderson, N. L. & Anderson, N. G. Mol. Cell Proteom.2002 1, 845-867).
상응하는 펩티드 혼합물은 보다 높은 분석력을 제공하는 일련의 크로마토그래피 정지상 또는 차원을 통과한다. HPLC는 많은 실험 방법에 대해 탄력적인데, 본 발명의 환경에서는 인간 혈액 샘플에서 발현된 단백질의 고 빈도 분획을 특이적으로 제거함으로써 중간 빈도 및 저 빈도 영역의 단백질이 농축되게 하는 최적화가 이루어진다. 펩티드 및 단백질의 분리는 펩티드 서열, 펩티드 서열의 작용기 뿐만 아니라 물리적 특성을 기초로 한다.
MSBA-작동 원리
샘플을 MSBA에 노출시키기 전에, 대부분의 경우 샘플 취급 및 준비 단계가 필요하다. MSBA 방법 전에 이러한 단계를 도입하는 목적은 간섭 작용제 및 매트릭스 성분을 제거함으로써 주석달기의 증가를 일으키는 전반적 검출능력 개선 뿐만 아니라 전반적 감수성 개선을 촉진하기 위한 것이다. 그러나, 특정 구체예에서, 샘플 준비는 특히 바이오마커가 보다 높은 빈도로 존재하고 샘플의 복잡성이 낮은 경우 필요치 않을 수 있다. 당업자라면 준비 단계가 필수적인 지의 여부를 결정할 수 있을 것이다.
MSBA 플랫폼은 주로 샘플의 성질 및 이의 복잡성에 의해 결정되는 많은 다양한 방법으로 작동될 수 있다.
바이오마커 단백질 서열은 멀티플렉스 분석에 의해 환자 샘플에서 정성적으로 그리고 정량적으로 결정된다. 2가지 가능한 원리, 즉, 내부 표준 첨가 원리 및 내부 표준 불포함 원리에 따른 MSBA 어세이의 구성을 이용하여 표지된 MSBA 및 비표지된 MSBA 원리 둘 모두가 적용될 수 있다.
일반적 방법
샘플 준비 후, 샘플은 MSBA 플랫폼내로 인젝션된다.
그 다음, 하기 작업이 수행된다:
단계 1A
먼저, 바이오마커 MS-신호가 샘플내에서 확인될 필요가 있다.
각각의 바이오마커의 체류 시간 지수 및 상응하는 질량과 상호관련되는 바이오마커 목록 질량 ±1 돌턴의 소정의 목록이 체액 샘플에서 스크리닝된다. 대부분의 MSBA 어세이에서 수득된 상대 체류 시간 지수가 수 분내에 규정되고 약 ±2%의 가변성을 지니지만, 이러한 수치는 달라질 수 있다.
이러한 단계는 도 1에 도시된 바와 같이 MSBA 참조 스펙트럼 리파지토리(repository)에 대한 실시간 질량 스펙트럼 매칭에 의해 수행된다.
그 다음, MS-스펙트럼의 질량과 바이오마커 참조 목록의 질량이 약 ±1 돌턴까지 비교된다.
단계 1B
바이오마커 후보체 질량이 ±1 Da 이내에서 참조 목록내의 매칭 MS 스펙트럼을 지닌 바이오마커의 질량으로서 확인된 경우, 그 안의 정보는 MSBA-서버에 저장된다. 질량이 부정확한 경우, MSBA 스크리닝은 서버에 스펙트럼 파일을 저장하지 않는다.
이러한 작업은 파일 공유 및 프로세스간 통신 (inter-process communication) (예를 들어, 클라이언트-서버-유형 통신) 메커니즘에 의해 수행된다.
단계 2A;
MS-스펙트럼에서 질량 동일성이 확인된 경우, 질량 확인 및 서열 동일성 분석이 개시된다.
MSBA 소프트웨어내에서의 패턴 매칭 단계는 특정 유사성 척도, 예를 들어 코사인(cosine) 상관관계를 확인해준다. 유사성 척도를 이용하여, 정확한 단백질 서열이 확정된다. 이러한 확정은 스펙트럼 매칭에 의해 이루어진다. 스펙트럼 매칭은 샘플 스펙트럼과 MSBA 데이터베이스내의 참조 스펙트럼의 비교에 의해 수행된다. 이러한 단계에서 포지티브 동일성의 경우 0.8 또는 이를 초과하는 코사인 상관관계 인자가 정확한 단백질 서열을 확인하기 위해 필요하다. 대안적인 유사성 척도에 대한 등가의 한계값이 당업자에게 명백할 것이다.
참조 스펙트럼 비교 및 평가는 하기 방식으로 수행된다.
MS/MS 스펙트럼은 이중선(doublet) (m,ν)의 목록으로서 표현되며, 여기서 m은 질량 대 전하 비를 나타내고, ν는 이온 신호 세기값을 의미한다. mm b 의 간격 (m b = 빈(bin)의 실제 폭)으로 비닝(binning)함으로써, MS/MS 스펙트럼은 또한 벡터
Figure 112009001771874-PCT00001
에 의해 표현될 수 있으며, 여기서 이의 길이 (n)는 빈의 수와 같고, 각각의 엘리먼트의 값은 각각의 빈내의 모든 신호의 세기의 합이다. 이는 MS/MS 스펙트럼의 프로파일 표현이다.
2개의 상이한 MS/MS 스펙트럼
Figure 112009001771874-PCT00002
의 코사인 상관관계 (S)는 하기 eq 1에 따른 코사인 상관관계로서 계산될 수 있다:
Figure 112009001771874-PCT00003
S의 값은 0 내지 1 이다. 0의 값은 두 개의 벡터가 완전히 독립적임을 의미하며, 값이 1인 S 벡터의 경우 이는 두 개의 벡터의 방향이 동일함을 의미한다.
2개의 MS/MS 스펙트럼 벡터는 동일한 비닝을 지녀야 함이 주목되는데, 즉, 하나의 벡터의 m의 비닝이 500-501, 501-502, ... 1999-2000인 경우, 또 다른 스펙트럼은 동일한 방식으로 비닝되어야 한다. 결과적으로, 2개의 벡터의 길이는 동일해야 한다.
측정된 MS 신호가 정확한 바이오마커인 지의 여부를 판단하기 위해, 측정된 신호의 MS/MS 부분이 추출되어, 예를 들어 상기 기재된 코사인 상관관계를 이용함으로써 샘플의 MS/MS 참조 스펙트럼과 비교된다.
코사인 상관관계 값 S가 소정의 한계값, 예를 들어 0.8이거나 이 보다 큰 경우, 측정된 신호는 참조 세트내의 추정 바이오마커로부터 유래된 것으로 판단된다.
하기 섹션에는 많은 개개의 환자로부터 군 특이적 스펙트럼으로서 수득되는 참조 스펙트럼을 구성하는 방법이 기재되어 있다.
각각의 후보 바이오마커의 경우, 이러한 바이오마커가 확립된 경우, 수 개의 MS/MS 스펙트럼이 참조 MS/MS 스펙트럼 맵을 구성하도록 수집되어야 한다. 이는 실제 데이터 세트와 측정된 데이터 세트로부터의 평균 스펙트럼이며, 클러스터링 계산에 의해 수득된다.
이러한 참조 스펙트럼을 구성하는 예는 다음과 같다:
(1) 표적화된 바이오마커에 대한 다수의 MS/MS 스펙트럼의 수집. 이러한 MS/MS 스펙트럼은 MASCOT, SEQUEST 또는 주어진 신뢰 수준을 지닌 다른 프로그램에 의해 표적 바이오마커로부터 유래되는 것으로 확정되어야 한다.
(2) 상기 언급된 유사도(resemblance)를 사용한 각각의 수집된 MS/MS 스펙트럼의 유사성의 조사가 수행된다. 이는 유사성 척도를 이용하여 클러스터링 계산에 의해 수행된다. 클러스터링 계산은 유사성 척도가 소정의 한계값으로 감소하는 지점에 대해 수행된다. 이러한 클러스터링 계산 후, MS/MS 스펙트럼내의 모든 잔류 단백질 서열 이온의 요약 목록 (summary list)이 생성된다. 다음 단계는 클러스터 계산으로부터 요약 목록내의 잔류 단백질 서열 이온을 제거하는 것이다.
(3) 클러스터로부터의 확립되고 적격인 요약 MS/MS 스펙트럼을 사용하여, 스펙트럼 벡터의 각각의 요소에 대한 산술 평균을 계산하는 것이 가능하다. 상기 평균 벡터가 이제 MS/MS 참조 스펙트럼으로서 사용될 수 있다.
(4) 클러스터링 프로세스 동안, 환자 군으로부터 하나 이상의 참조를 생성시키는 결과를 찾아내는 것이 가능하다.
a) 이러한 경우, MS/MS 스펙트럼 프로파일 맵에서 차이점을 함유하는 하나 이상의 클러스터가 존재한다. 이러한 상황에 대한 기준 설정은 이들 군이 신뢰할 만한 표적 바이오마커 확인을 지녀야 할 필요가 있다는 것이다. 그 후, 하나의 표적에 대해 하나 이상의 참조 스펙트럼을 생성시키고 이를 이용하는 것이 가능하다. 이러한 상태는 군 사이에서 상이하지만 동일한 주석이 달린 단백질과 상호관련되는 MS/MS 단편 이온이 존재하는 경우 나타난다.
b) 바이오마커 프로파일 맵에서 차이점이 존재하는 클러스터 분석 데이터를 갖는 상황에 도달하는 것이 또한 가능하다. 이는 수 가지 개개의 군이 환자 코호트(cohort), 예를 들어 다양한 표현형들로부터 확립될 수 있음을 의미한다. 이러한 경우, 비교 멀티플렉스 패턴은 표현형 특이적이다. 그러나, 표현형들 간에 바이오마커 중첩 가능성이 또한 존재한다.
이러한 확정 알고리듬은 하기 예시되는 MSBA 플랫폼의 고효율 스크리닝 작업내에서 실시간으로 적용되고 사용된다.
단계 2B
질량 분광계 (예를 들어, 피니건(Finnigan) LTQ)는 포지티브 바이오마커 질량이 확인된 경우 바이오마커 이온 신호의 반복 스캐닝을 수행하기 위해 그러한 질량 표적에 머물러 있는다. 스캔 횟수는 각각의 특정 단백질 서열에 대해 생성된 점수 매치에 따르지만, 바이오마커의 포지티브 동일성에 대해 정렬된다. 스캐닝 윈도우는 MSBA 소프트웨어에 의해 자동적으로 결정된다.
포지티브 상관관계에 대한 기준은 코사인 상관관계 유사성 척도에서 0.8이거나 이 보다 커야 한다.
그 다음 이어지는 단계는 상업용 검색 엔진, 예를 들어 MASCOT 또는 SEQUEST 또는 단백질 데이터베이스를 갖춘 임의의 다른 검색 엔진을 이용하여 단백질 서열의 통계적으로 유의할 만한 동일성을 생성시킴으로써, 그것이 정확한 바이오마커 동일성인 지를 확정하는 것이다.
MSBA 시스템은 바이오마커의 질량 및 서열 영역내에 존재하는 신호 및 데이터 파일을 저장하고 기록할 뿐이다. 어세이로부터 생성된 모든 다른 데이터는 MSBA 데이터베이스로 전송되지 않는다.
단계 3
멀티플렉스 바이오마커 어세이 판독의 계산
멀티플렉스 바이오마커 어세이 판독의 계산은 진단 MSBA 점수를 계산하는 판별 함수로 구성된 MSBA 알고리듬을 적용함으로써 수행된다.
판별 함수는
Figure 112009001771874-PCT00004
의 함수로서 규정되며, 여기서 χ i i번째 바이오마커의 n 절대 또는 상대 신호 세기를 나타낸다. 판별 함수의 출력은 진단 결과에 따라 포지티브 또는 네거티브 값이어야 한다. 예를 들어, 진단이 포지티브인 경우, 판별 함수의 출력값은 포지티브이어야 하고, 그 반대도 그러하다.
예를 들어, Eq2의 경우, 사용된 판별 함수는 하기 식으로 약술된다:
Figure 112009001771874-PCT00005
상기 식에서, n은 진단을 위해 사용되는 다수의 바이오마커의 개수이고, χ i i번째 바이오마커의 절대 또는 상대 신호 세기이고, χ total 은 MS 측정치의 전체 신호 세기이다.
MSBA 소프트웨어의 알고리듬내로 포함되는 가중 인자 (weight factor)가 또한 존재한다.
벡터
Figure 112009001771874-PCT00006
는 n-차원 신호 세기 공간을 진단 포지티브 및 진단 네거티브 둘로 분할하는 분리 초평면(hyper-plane)의 법선 벡터의 방향을 결정하는 가중치 벡터이다. 가중치 벡터를 결정하기 위한 절차의 예가 이하 기재되지만, 다양한 종류의 알고리듬, 예를 들어 서포트 벡터 머신 (Support Vector Machine), 아티피셜 뉴럴 네트워크 (Artificial Neural Network) 등이 가중치 벡터를 결정하기 위해 이용될 수 있다.
판별 함수의 또 다른 예는 MSBA 알고리듬에 포함되며, 하기와 같이 규정된다:
Figure 112009001771874-PCT00007
함수 f p f n 은 진단하려는 환자에서 측정된 바이오마커 세트 및 MSBA 서버내의 참조 바이오마커 신호 세트 간의 유사성 또는 거리의 척도를 제공하는 임의 함수이다. f p 는 진단 포지티브 참조로부터의 유사성 또는 상이성 함수를 나타내고, f n 은 진단 네거티브 참조로부터의 유사성 또는 상이성 함수를 나타낸다.
α 및 β는 진단-포지티브 및 진단-네거티브 메트릭(metric)을 동등하지 않게 가중시키기 위해 사용될 수 있는 계수이다.
함수 f p f n 가 유사성 척도를 제공하는 경우, 방정식 3이 포지티브 값을 생성시킬 때에 환자 샘플은 포지티브인 것으로 진단된다. 함수가 거리 척도를 제공하는 경우, eqn3의 포지티브 값은 진단 네거티브를 의미한다.
이러한 함수의 예는 하기와 같은 유클리디안(Euclidean) 거리이며, 여기서 y i 는 진단하려는 환자의 i번째 바이오마커 신호 세기이고, x i 는 참조 세트의 i번째 바이오마커 신호 세기이다:
Figure 112009001771874-PCT00008
또 다른 예는 하기와 같은 회귀분석에서 예측값의 표준 오차이다:
Figure 112009001771874-PCT00009
상기 식에서, n은 바이오마커 신호의 개수이고, x i 는 환자 샘플의 측정된 i번째 신호 세기이고, y i 는 측정된 x i 와 참조 신호 사이에서 최소자승법에 의해 계산된 선형 회귀분석선을 사용한 각각의 x i 로부터의 예측값이다.
프로세스내의 각각의 특정 단계를 제어하는 알고리듬을 포함하는 전체 소프트웨어 설계는 도 2에 약술되어 있다.
단계 4
바이오마커 주석달기 및 정량화
MSBA 어세이 플랫폼은,
A) 분리 원리
B) 비-분리 원리로 구축되며,
비-분리 원리의 경우, 하기 분석에 의해 바이오마커 주석달기 및 정량화가 수행될 수 있다:
(a) 직접적 MS-분석
i) 정적 나노-전기분무 원리를 사용한 생물학적 샘플의 직접 주입. 1회용 나노분무 니들이 사용되며, 여기서 각각의 나노 전기분무 니들은 단지 하나의 생물학적 샘플에 노출됨으로써 샘플 오버로드(overload) 및 메모리 효과를 방지한다.
(ii) 샘플이 플러그(plug)로서 인젝션되는 플로우 인젝션 분석 모드. 플러그내에서 선택된 샘플 부피가 각각의 바이오마커 단백질 서열의 신호 세기와 직접 관련된다. 저 빈도 바이오마커가 거대한 (수 ml) 샘플 인젝션 부피를 사용함으로써 질량 분광계의 이온 신호 효율의 포화상태 (정상-상태)에 도달하는 것이 또한 가능하다.
(iii) 크로마토그래피 고체상 추출 농축 컬럼을 이용하는 MS-분석에 의한 샘플 농축을 수반하는 플로우 인젝션. 이러한 단계는 샘플내의 매트릭스 성분들의 제거 및 바이오마커의 미량 농축에 의해 동시 클린-업(clean-up)을 가능하게 한다. 이러한 방법의 이점은 복잡성이 높은 샘플 기원, 예를 들어 조직 추출물로부터 바이오마커를 분석하는 것이 가능하다는 것이다.
또한, 샘플 농축 모드 (iii)에서, 비제한적으로 2 내지 500개 범위의 신호 증폭 인자가 생성될 수 있다. 또한, 이러한 방법은 저수준으로 발현되는 바이오마커의 검출능력을 개선시킬 뿐만 아니라 단백질 서열 주서달기의 정확성을 개선시킨다.
B) 분리 분석의 경우, 액체 크로마토그래피 (LC) 통합된 바이오마커 확인은 단일 컬럼 모드 (도 x 참조)에서 작동될 수 있거나 샘플이 순차적 모드로 분석됨으로써 샘플 처리량을 개선시키는 컬럼 스위칭을 이용하는 다중-컬럼 모드에서 작동될 수 있는 LC의 높은 분석력에 의존한다.
MSBA 프로그래밍
가중치 벡터 (또는 모델)을 계산하고 서포트 벡터 머신 (Support Vector Machine) 알고리듬을 이용하여 진단을 예측하기 위한 코어 부분의 예제 코드 (example code)가 주어진다. 이러한 코드는 R-언어로 쓰여져 있다. 모델 (model)은 훈련 데이터 세트 (train)로부터 구성된 후, 주어진 시험 데이터 세트 (test)에 대한 예측 (pred)을 생성시키기 위해 이용된다. 데이터 세트 훈련 및 시험은 다수의 데이터 지점을 함유하는 데이터 프레임 (data frame)이며, 이는 진단 결과를 함유하는 객체 다이아그 (object Diag) (범주형 값: "포지티브" 또는 "네거티브". 이러한 값은 pred의 경우 비어있다) 및 각각의 바이오마커에 대한 신호 세기 및 전체 신호 세기를 함유하는 벡터로 구성된다. MSBA 프로그래밍은 바이오마커가 생성되는 2개의 환자 군에 대해 수행된 단백질 서열 스크리닝으로부터 생성된 데이터에 의존한다.
MSBA 소프트웨어내에서의 프로그래밍은 하기 방식으로 수행된다:
라이브러리(library)(e1071)
모델 <- svm( Diag~., 데이터 = train)
## 상기 방정식은 모델을 계산할 수 있지만, 이는 너무 간단해서 eqn2를 반영할 수 없다.
## 선택된 서포트 벡터는 모델$SV이다
## 및 가중치 벡터는 모델$coefs이다
pred <- 예측(모델, 시험)
하기 실시예는 인간 혈액 샘플에서 LC-MS 단백질 프로파일링에 의해 수행된 폐암 연구로부터의 예증이다. 2개의 환자 군이 분석되었는데, 이는 차등 단백질 발현 상이성이 분석되는 환자(CASE) 및 대조 환자(CONTROL) 암 군이다.
실시예 1
실험 세부사항
각각의 환자로부터, 약 6ml의 혈액을 헤파린 나트륨 염을 함유하는 샘플링 튜브내로 채취하고, 2 내지 3회 거꾸로 뒤집어 혼합하였다. 그 후, 4℃에서 10분간 2,000 x g에서 원심분리하였다. 3ml 혈장을 상층액으로부터 수득하였다. 샘플을 -80℃에서 동결 저장하였다. 그 다음, 단백질을 혈장으로부터 추출하고, 풍부한 인간 혈장 알부민 및 IgG를 고갈시킨 후에 트립신 소화시켰다. 그 후, 분획화된 혈장 샘플의 분취액을 이미 공지된 바와 같이 [WO06100446] LC-MS에 의해 분석 하고, MS/MS에 의해 서열분석하였다.
MSBA 플롯(Plot)
멀티플렉스 바이오마커 요약 플롯은 폐암 연구내에서의 환자 바이오마커의 멀티플렉스 발현 데이터를 제공한다.
MSBA 방법으로부터 생성된 10-멀티플렉스 바이오마커 진단 판독은 각각의 모든 바이오마커를 개별적으로 나타낸다 (도 3 참조). 정량적 상이성, 즉, 이미 공지되어 있고 MSBA 데이터베이스내에 저장되어 있는 배수(fold) 변화 상이성 (도 1 참조)을 정성적 상이성과 함께 사용하여 바이오마커를 어세이한다. 폐암 연구로부터 생성된 바이오마커 데이터는 이들 환자 모두를 진단 멀티플렉스 MSBA 판독으로부터 포지티브인 것으로 정확하게 확인해준다.
이러한 10명의 환자 모두의 점수는 0.80 내지 1.0의 범위인 것으로 나타났다.
도 4는 바이오마커가 MSBA 소프트웨어에 의해 인식되는 MS 스펙트럼 및 생성된 CVLFPYGGCQGNGNK 바이오마커를 나타내는 후속 MS/MS 스펙트럼 (도 4 참조)에 의해 제공되는, 멀티플렉스 어세이로부터 수득된 바이오마커 주석달기의 예를 도시한다. 코사인 상관관계를 적용하는 MSBA-데이터베이스내의 참조 바이오마커 스펙트럼을 이용하는 MSBA 매칭은 0.8이거나 이 보다 큰 코사인 상관관계 인자를 나타낸다.
표 1은 MSBA-데이터 생성의 세부사항을 나타내며, 여기서 조절된 바이오마커의 소정 질량이 분석된다.
Figure 112009001771874-PCT00010
Figure 112009001771874-PCT00011
실시예 2
다음과 같이 기재된 또 다른 실시예는 인간 혈액 샘플에서 LC-MS 단백질 프로파일링에 의해 수행된 폐 질환 환자-대조 환자(CASE-CONTROL) 연구로부터 유래된다. 2개의 환자 군이 분석되었는데, 이는 차등 단백질 발현 분석되는 환자(CASE) 및 대조(CONTROL) 폐 질환 군이다.
실험 세부사항
혈장 샘플 수집 및 준비 절차는 상기 기재된 실시예와 동일하였다.
MSBA 모델 구축 및 평가
10명의 환자 및 36명의 대조 환자로 구성된 46명의 환자 샘플 데이터를 사용하여 MSBA 모델을 구성하였다. 본 발명자들은 각각 14개, 8개, 26개, 8개 및 11개 신호를 함유하는 5개의 상이한 MSBA 모델을 구성하였다. 5개의 모델을 조합한 후, 최종 (5th) MSBA 모델이 우세한 판별 능력을 지니는 것으로 밝혀졌다. 따라서, 본 발명자들은 이어지는 단계에서 5th 모델을 이용하였다. 최종 모델의 11개 신호의 LC-MS 정보 (체류 시간 (분)/MS-값 (m/z))는 다음과 같았다: 11.6/485.2, 12.5/608.1, 18.3/547.0, 20.2/681.3, 21.1/575.1, 21.3/531.5, 25.5/561.6, 23.1/514.5, 32.5/682.2, 44.0/985.2, 48.7/945.8
모델의 예측력을 평가하기 위해, 본 발명자들은 10명의 환자 및 9명의 대조 환자를 이들이 맹검 샘플인 것처럼 이용하여 환자/대조 환자를 예측하고자 하였다. 상기 기재된 MSBA 진단 절차 (또한, 도 2에 도시되어 있음)에 따라, 11개-멀티플렉 스 바이오마커 신호를 각각의 시험 샘플에 대해 확인하였고, 각각의 피크 신호의 정량화를 수행하였다. 모든 11개-멀티플렉스 신호의 양으로부터, 각각의 피검체에 대한 MSBA 점수를 상기 기재된 식 (Eq.5)을 이용하여 계산하였다. 본 실시예에서, MSBA 점수가 1이거나 이 보다 큰 피검체는 환자인 것으로 진단되었다 (표 2, MSBA 진단). 결과적으로, 본 발명자들은 모든 샘플을 정확하게 예측할 수 있었는데, 즉, 판별 능력은 100%였다 (도 5 참조).
실시예 3
하기 실시예는 2개의 환자 군 (환자 및 대조 환자)과 관련된 인간 혈액 샘플에서 LC-MS 단백질 프로파일링에 의해 수행된 폐 질환 환자-대조 환자 연구로부터 또한 유래되었다. 본 실시예에서, 멀티플렉스 바이오마커의 또 다른 세트를 사용하여 훨씬 큰 크기의 다양한 환자 데이터세트를 지닌 MSBA 모델을 구성하였다
실험 세부사항
혈장 샘플 수집 및 준비의 절차는 상기 기재된 실시예와 동일하였다.
MSBA 모델 구축 및 평가
21명의 환자 및 75명의 대조 환자로 구성된 96명의 환자 샘플 데이터를 훈련 데이터세트로서 사용하였다. 샘플 개수가 증가함에 따라, 샘플 가변성이 또한 증가하였다. 따라서, 먼저 본 발명자들은 스미모브(Smimov) 시험을 적용하여 이상점(outlier) 신호를 제거하였다. 결과적으로, 수 많은 이상점을 함유하는 5개의 샘플을 또한 분석 세트로부터 제거하였다. t-시험의 결과를 이용하여, 본 발명자들은 100개의 후보 바이오마커 신호를 함유하는 최초의 MSBA 모델을 구성하였다. 그 후, 판별 분석을 반복 적용하여 차별 모델로부터 최소 기여 신호를 제거함으로써, 최종적으로 본 발명자들은 10개의 신호를 지닌 MSBA 모델을 수득하였다. 10개의 멀티플렉스 마커 신호의 목록에 대해서는 표 3이 참조된다.
본 실시예에서, 판별 점수 (z)를 계산하기 위해, 본 발명자들은 하기 방정식으로 제시되는 또 다른 점수화 함수를 사용하였다.
Figure 112009001771874-PCT00012
점수값이 포지티브인 경우, 환자로서 해석되고, 그렇지 않은 경우 대조 환자로서 해석된다.
모델의 예측력을 평가하기 위해, 본 발명자들은 동일한 데이터세트 (21명의 환자 + 75명의 대조 환자, 전체 96명)를 사용하여 환자/대조 환자를 예측하고자 하였다. 상기 기재된 MSBA 진단 절차 (또한 도 2에 도시되어 있음)에 따라, 10개의 멀티플렉스 바이오마커 신호를 각각의 샘플에 대해 확인하고, 각각의 피크 신호의 정량화를 수행하였다. 모든 10개-멀티플렉스 신호의 양으로부터, 각각의 피검체에 대한 MSBA 점수를 상기 기재된 식 (Eq.6)을 이용하여 계산하였다. 본 실시예에서, MSBA 점수가 0이거나 이 보다 큰 피검체는 환자인 것으로 진단되었다. 표 4 및 도 6은 자동-판별 결과를 나타낸다. 도 6의 경우, 각각의 점은 환자를 나타내고, 세로축은 판별 점수 (z)를 나타낸다. 본 실시예에서, 감수성은 85.7%였고, 특이성은 82.7%였고, 예측 정확도는 83.3%였다.
표 2
Figure 112009001771874-PCT00013
표 3
Figure 112009001771874-PCT00014
표 4
Figure 112009001771874-PCT00015
Figure 112009001771874-PCT00016
Figure 112009001771874-PCT00017

Claims (17)

  1. (a) 샘플을 질량 분광 (MS) 분석하고, 검출된 각각의 신호에 대한 체류 시간 지수 및 상응하는 질량을 기록하는 단계;
    (b) 각각의 신호에 상응하는 질량을 바이오마커 질량의 참조 데이터베이스와 상호관련시켜서 각각의 신호와 참조 바이오마커 사이의 상관관계를 형성하고, 질량이 참조 바이오마커 질량과 상호관련되지 않는 신호를 폐기하는 단계;
    (c) 질량이 참조 바이오마커와 상호관련되는 신호를 저장하는 단계;
    (d) 유사성 척도를 이용하여 각각의 신호의 MS 스펙트럼을 데이터베이스내의 참조 바이오마커의 MS 스펙트럼과 매칭시킴으로써 각각의 저장된 신호와 참조 바이오마커 사이의 상관관계를 확정하여 포지티브하게 상호관련되는 일련의 신호를 한정하는 단계;
    (e) 각각의 포지티브하게 상호관련되는 신호의 세기를 측정하고, 판별 함수를 이용하여 이의 절대 신호 세기 또는 이의 상대 신호 세기를 점수화하는 단계;
    (f) 한계치를 판별 함수로부터 수득된 점수값에 적용하여 바이오마커의 존재 여부를 결정하는 단계를 포함하여, 샘플중에 하나 이상의 폴리펩티드 바이오마커가 존재하는 지를 결정하는 방법.
  2. 제 1항에 있어서, 시험 샘플이 사전 분리 절차없이 MS 분석되는 방법.
  3. 제 2항에 있어서, 시험 샘플이 정적 나노-전기분무 원리를 이용한 직접 주입, 플로우 인젝션(flow injection) 분석 또는 샘플 농축을 수반하는 플로우 인젝션에 의해 분석되는 방법.
  4. 제 1항에 있어서, 시험 샘플이 MS 분석 전에 처리되는 방법.
  5. 제 4항에 있어서, 샘플을 처리하는 것이 단일상 또는 다중상 고압 액체 크로마토그래피 (HPLC)에 의한 샘플 분리를 포함하는 방법.
  6. 제 1항 내지 제 5항 중 어느 한 항에 있어서, MS가 전기분무 이온화 (ESI) MS, 매트릭스-보조 레이저 탈착 이온화 - 비행시간 (MALDI-TOF) MS 또는 표면 증강 레이저 탈착 이온화 - 비행시간 (SELDI-TOF) MS인 방법.
  7. 제 1항 내지 제 6항 중 어느 한 항에 있어서, 다수의 바이오마커에 대한 참조 질량 및 MS 스펙트럼 데이터가 전자 또는 서면 형태로 기록되는 방법.
  8. 제 1항 내지 제 7항 중 어느 한 항에 있어서, 소정의 바이오마커에 대한 참조 MS 스펙트럼이 클러스터링 계산(clustering calculation)에 의해 수득된 실제 데이터와 측정 데이터로부터의 평균 스펙트럼인 방법.
  9. 제 1항 내지 제 8항 중 어느 한 항에 있어서, 참조 펩티드의 하나 이상의 내부 표준이 MS에 의한 분석 전에 샘플에 첨가되는 방법.
  10. 제 9항에 있어서, 내부 표준이 분자 태그(tag)로 표지되는 방법.
  11. 제 9항에 있어서, 내부 표준이 표지되고, 마스터 데이터 세트 (master data set)에 포함되는 방법.
  12. 제 11항에 있어서, 바이오마커 신호 세기를 측정하고 이를 하나 이상의 공지된 내부 표준의 신호 세기와 비교함으로써 절대 신호 세기가 점수화는 방법.
  13. 제 1항 내지 제 9항 중 어느 한 항에 있어서, 샘플이 내부 표준의 첨가없이 처리되는 방법.
  14. 제 13항에 있어서, 환자의 개별 바이오마커 신호 세기와 환자군에 대한 참조 신호 세기 간의 비를 측정함으로써 상대 신호 세기가 점수화되는 방법.
  15. 제 13항에 있어서, 완전 자동화된 방법.
  16. 제 1항에 있어서, MS 신호 세기로부터 점수를 계산하기 위한 판별 함수가 임 의로 임의의 임상 변수, 예를 들어 임상 검사 결과 및/또는 임상 관찰결과의 표현형분석(phenotyping) 및/또는 의료 기록을 사용하는 것을 포함하는 방법.
  17. 시험 샘플의 단백질 서열 바이오마커를 참조 바이오마커와 비교하는 것을 포함하여 질병의 존재를 결정하기 위한 진단 방법으로서, 참조 바이오마커가 표 1에서 확인된 펩티드를 포함하는 진단 방법.
KR1020097000596A 2006-06-13 2007-06-13 질량 분광법에 의한 바이오마커 어세이 KR20090068199A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GBGB0611669.3A GB0611669D0 (en) 2006-06-13 2006-06-13 Mass spectrometry biomarker assay
GB0611669.3 2006-06-13

Publications (1)

Publication Number Publication Date
KR20090068199A true KR20090068199A (ko) 2009-06-25

Family

ID=36745797

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020097000596A KR20090068199A (ko) 2006-06-13 2007-06-13 질량 분광법에 의한 바이오마커 어세이

Country Status (10)

Country Link
EP (1) EP2035829A2 (ko)
JP (1) JP2009540319A (ko)
KR (1) KR20090068199A (ko)
CN (1) CN101611313A (ko)
AU (1) AU2007258970A1 (ko)
BR (1) BRPI0711967A2 (ko)
CA (1) CA2651934A1 (ko)
GB (1) GB0611669D0 (ko)
MX (1) MX2008015158A (ko)
WO (1) WO2007144606A2 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190041437A (ko) * 2016-05-24 2019-04-22 인 오보 비.브이. 난 내 가금류 성별의 비파괴적인 판단 방법 및 시스템
KR20230146752A (ko) 2022-04-13 2023-10-20 오보젠 주식회사 가금류 알(卵)의 암수 검사 및 선별장치 그리고 이를 이용한 선별방법

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2304421A4 (en) * 2008-07-23 2017-05-31 P Devices Inc. Portable plasma based diagnostic apparatus and diagnostic method
GB0906698D0 (en) 2009-04-17 2009-06-03 Queen Mary & Westfield College Method for quantifying modified peptides
KR101144237B1 (ko) * 2009-12-29 2012-05-11 한국기초과학지원연구원 고분해능 질량분석법과 약리활성검사를 이용한 천연물의 약리 활성물질 발굴 방법
GB201006360D0 (en) * 2010-04-16 2010-06-02 Immatics Biotechnologies Gmbh Method for differentially quantifying naturally processed HLA-restricted peptides for cancer, autoimmune and infectious diseases immunotherapy development
US9141756B1 (en) 2010-07-20 2015-09-22 University Of Southern California Multi-scale complex systems transdisciplinary analysis of response to therapy
CN102201039A (zh) * 2010-08-19 2011-09-28 上海聚类生物科技有限公司 一种分析ltq数据的方法
GB201204278D0 (en) 2012-03-09 2012-04-25 Queen Mary & Westfield College Method
FR3016461B1 (fr) * 2014-01-10 2017-06-23 Imabiotech Procede de traitement de donnees d'imagerie moleculaire et serveur de donnees correspondant
DE102014000646B4 (de) 2014-01-17 2023-05-11 Bruker Daltonics GmbH & Co. KG Massenspektrometrische Resistenzbestimmung durch Metabolismus-Messung
GB201509313D0 (en) * 2015-05-29 2015-07-15 Micromass Ltd Sample mass spectrum analysis
US11435354B2 (en) * 2016-02-19 2022-09-06 University Of Miyazaki Adenocarcinoma detection method
US20190113520A1 (en) * 2016-03-31 2019-04-18 Discerndx, Inc. Biomarker Database Generation and Use
US20190187048A1 (en) * 2016-08-19 2019-06-20 Monash University Spectroscopic systems and methods for the identification and quantification of pathogens
US9905405B1 (en) * 2017-02-13 2018-02-27 Thermo Finnigan Llc Method of generating an inclusion list for targeted mass spectrometric analysis
SG11201908865WA (en) * 2017-06-29 2019-10-30 Quanticision Diagnostics Inc Apparatus and method for absolute quantification of biomarkers for solid tumor diagnosis
CN111148844A (zh) 2017-09-01 2020-05-12 韦恩生物科技股份公司 鉴定和使用糖肽作为诊断和治疗监测的生物标记物
EP3679378A2 (en) * 2017-09-05 2020-07-15 DiscernDx, Inc. Automated sample workflow gating and data analysis
GB2569805B (en) * 2017-12-22 2023-03-08 Asymptote Ltd Method and system relating to cooling conditions for a biological sample
EP3794548A1 (en) * 2018-05-15 2021-03-24 Ventana Medical Systems, Inc. Quantitation of signal in stain aggregates
CN111672658B (zh) * 2020-06-08 2022-05-13 惠州市新泓威科技有限公司 电子雾化设备最佳雾化温度的检测与控制方法及其电子雾化设备
EP4047371A1 (en) * 2021-02-18 2022-08-24 Thermo Fisher Scientific (Bremen) GmbH Method and apparatus for analysing samples of biomolecules using mass spectrometry with data-independent acquisition

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8014952B2 (en) * 2002-12-18 2011-09-06 Queen Elizabeth Hospital Serum biomarkers in lung cancer
DE10324149A1 (de) * 2003-05-26 2004-12-16 Imat-Uve Gmbh Verfahren und Vorrichtung zur GC/MS- oder LC/MS-Screeninganalyse
JP2007531879A (ja) * 2004-03-30 2007-11-08 イースタン バージニア メディカル スクール 肺癌バイオマーカー
DE112005001166B4 (de) * 2004-05-20 2014-10-09 Waters Technologies Corp. (N.D.Ges.D. Staates Delaware) Verfahren und Vorrichtung zum Identifizieren von Proteinen in Gemischen

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190041437A (ko) * 2016-05-24 2019-04-22 인 오보 비.브이. 난 내 가금류 성별의 비파괴적인 판단 방법 및 시스템
KR20230146752A (ko) 2022-04-13 2023-10-20 오보젠 주식회사 가금류 알(卵)의 암수 검사 및 선별장치 그리고 이를 이용한 선별방법

Also Published As

Publication number Publication date
CA2651934A1 (en) 2007-12-21
EP2035829A2 (en) 2009-03-18
AU2007258970A1 (en) 2007-12-21
JP2009540319A (ja) 2009-11-19
WO2007144606A3 (en) 2008-04-03
BRPI0711967A2 (pt) 2012-01-24
CN101611313A (zh) 2009-12-23
GB0611669D0 (en) 2006-07-19
WO2007144606A2 (en) 2007-12-21
MX2008015158A (es) 2009-04-30

Similar Documents

Publication Publication Date Title
KR20090068199A (ko) 질량 분광법에 의한 바이오마커 어세이
US20060269944A1 (en) Mass Intensity profiling system and uses thereof
Angel et al. Mass spectrometry-based proteomics: existing capabilities and future directions
Issaq et al. Peer reviewed: SELDI-TOF MS for diagnostic proteomics
Palmblad et al. Mass spectrometry in clinical proteomics–from the present to the future
US20150160234A1 (en) Rapid and Quantitative Proteome Analysis and Related Methods
US20060269945A1 (en) Constellation mapping and uses thereof
US20100233815A1 (en) Methods for the Development of a Biomolecule Assay
Bowler et al. Proteomics in pulmonary medicine
US7070949B2 (en) Protein mixture analysis by mass spectrometry
Sokolowska et al. Applications of mass spectrometry in proteomics
US20060286602A1 (en) Method and markers for the diagnosis of renal diseases
EP1887351A1 (en) Screening method for specific protein in proteome comprehensive analysis
Tao et al. Mass Spectrometry-Based Chemical Proteomics
WO2005057208A1 (en) Methods of identifying peptides and proteins
deVera et al. Clinical proteomics: the promises and challenges of mass spectrometry-based biomarker discovery
CN112630344B (zh) 代谢标志物在脑梗死中的用途
Sharma et al. A laconic review on liquid chromatography mass spectrometry (LC-MS) based proteomics technology in drug discovery
Vaezzadeh et al. Proteomics and opportunities for clinical translation in urological disease
Henry et al. Introduction to sample preparation for proteomics and mass spectrometry
von Neuhoff et al. Mass spectrometry-based methods for biomarker detection and analysis
E Smith et al. Recent advances in metabolomics
Petrák Proteomics and its role in medicine
ÜNAL Mass Spectrometry in Clinical Diagnosis: Cancer Biomarkers
Borchers et al. CH 12 Application of Proteomics in Basic Biological Sciences and Cancer

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid