JP2008545960A - 結核の診断 - Google Patents

結核の診断 Download PDF

Info

Publication number
JP2008545960A
JP2008545960A JP2008512907A JP2008512907A JP2008545960A JP 2008545960 A JP2008545960 A JP 2008545960A JP 2008512907 A JP2008512907 A JP 2008512907A JP 2008512907 A JP2008512907 A JP 2008512907A JP 2008545960 A JP2008545960 A JP 2008545960A
Authority
JP
Japan
Prior art keywords
markers
protein
marker
patients
apo
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008512907A
Other languages
English (en)
Inventor
− レイエス、デルミーロ フェルナンデス
クリシュナ、サンジーブ
アグラノフ、ダニエル
コールトン、ギャリー、ラッセル
Original Assignee
セント ジョージズ エンタープライゼズ リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by セント ジョージズ エンタープライゼズ リミテッド filed Critical セント ジョージズ エンタープライゼズ リミテッド
Publication of JP2008545960A publication Critical patent/JP2008545960A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/569Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
    • G01N33/56911Bacteria
    • G01N33/5695Mycobacteria
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Immunology (AREA)
  • Engineering & Computer Science (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Biochemistry (AREA)
  • Cell Biology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Biotechnology (AREA)
  • Food Science & Technology (AREA)
  • Virology (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本発明は、(i)対象における2種以上のマーカーであって、前記マーカーの少なくとも2種が、トランスシレチン、ネオプテリン、C−反応性タンパク質(CRP)、血清アミロイドA(SAA)、血清アルブミン、アポリオポタンパク質−A1(Apo−A1)、アポリポタンパク質−A2(Apo−A2)、ヘモグロビンベータ、ハプトグロビンタンパク質、DEPドメインタンパク質、ロイシンリッチアルファ−2−糖タンパク質(A2GL)及び仮想タンパク質DFKZp667I032から選択されるマーカーの発現データを提供すること;並びに(ii)前記発現データを、TB以外の炎症性状態に罹患している患者を含む対照患者の群からの前記マーカーの発現データと比較し、それによって、前記試験対象がTBに罹患しているかどうかを判定することを含む、試験対象における結核(TB)を診断する方法を提供する。

Description

本発明は、結核(TB)の診断に関する。
潜在性TBは世界の人口の3分の1に存在し、多くの地域で活性TBは、人口10万人当たり700例を超えている(WHO Stop TB www.who.int/grb)。この世界的TB伝染病は、活性TBに罹患しているアフリカの親の40%〜70%に見られるHIVとの相乗作用によってさらに勢いを強めている。TBの高罹患率地域では、喀痰スミア顕微鏡検査が、提供され利用できる唯一の試験であることが多いが、得られる感度はせいぜい50%である。診断の判断基準である結核菌の培養により、感度はさらに25%増加する。ツベルクリン皮膚試験は、特にTBの高罹患率地域では、診断を補助する上で正確さが不十分であることが多い。TBに対する血清学的試験は、ミコバクテリア抗原(1種又は複数)の検出に焦点を当ててきたが、皮膚試験と同様に、非病原性のミコバクテリアとの交差反応性、又はBCGによる以前の免疫化により混同されることが多い。
結核(TB)による死亡の多くは、早期診断と早期治療によって防止することができる。早期診断はまた、罹患率及び伝染の危険性を最小化するが、一般に、結核菌の顕微鏡による同定に頼られている。しかしながら、顕微鏡検査は感度が低く、生物の培養は治療的決定を助ける上で遅すぎることが多い。最近開発されたDNA増幅及びインターフェロンガンマに基づく試験は費用がかかり、特定の専門的知識が必要とされる。
TBに対する正確で迅速な診断試験は、この疾病の制御に莫大な影響を及ぼすであろう。
本発明は、プロテオミックプロフィルに対する監視付き機械学習解析を適用して、活性TBに罹患している患者を、臨床的特徴の重複している対照患者から、識別することに成功した。本発明者は、TBに罹患している患者に対して、94%の診断的正確性を達成し、これは、民族又はHIVの状態に影響されない。特徴選択によって、プロテオミックプロフィルにおける最も報知的なピークである4種のポリペプチド、血清アミロイドAタンパク質、トランスシレチン(transthyretin)、アポリポタンパク質−A1及び血清アルブミンを同定し、免疫アッセイによって定量化した。これらのポリペプチドのうちの2種、血清アミロイドA及びトランスシレチンは、炎症状態を反映するため、本発明者は、ネオプテリン及びC反応性タンパク質もまた定量化した。さらに、プロテオミックプロフィルにおけるピークを同定するために用いた2Dゲルを分析することにより、アポリポタンパク質−A2、ヘモグロビンベータ、ハプトグロビンタンパク質、DEPドメインタンパク質、ロイシンリッチアルファ−2−糖タンパク質及び仮想タンパク質DFKZp667I032を、TBのマーカーとして同定した。サポートベクターマシン選別機をこれらのマーカーの組合せに適用することにより、TBに対して84%までの診断的正確性が与えられた。
したがって、本発明は、
−(i)試験対象における2種以上のマーカーであって、前記マーカーの少なくとも2種が、トランスシレチン、ネオプテリン、C−反応性タンパク質(CRP)、血清アミロイドA(SAA)、血清アルブミン、アポリポタンパク質−A1(Apo−A1)、アポリポタンパク質−A2(Apo−A2)、ヘモグロビンベータ、ハプトグロビンタンパク質、DEPドメインタンパク質、ロイシンリッチアルファ−2−糖タンパク質(A2GL)及び仮想タンパク質DFKZp667I032から選択されるマーカーの発現データを提供すること;及び
(ii)前記発現データを、TB以外の炎症性状態に罹患している患者を含む対照対象の群からの前記2種以上のマーカーの発現データと比較することによって前記マーカーの発現がTBを示しているかどうかを判定し、
それによって、前記試験対象がTBに罹患しているかどうかを判定すること
を含む、試験対象における結核(TB)を診断する方法;
−(i)対象における2種以上のマーカーであって、前記マーカーの少なくとも2種が、トランスシレチン、ネオプテリン、C−反応性タンパク質(CRP)、血清アミロイドA(SAA)、血清アルブミン、アポリオポタンパク質−A1(Apo−A1)、アポリポタンパク質−A2(Apo−A2)、ヘモグロビンベータ、ハプトグロビンタンパク質、DEPドメインタンパク質、ロイシンリッチアルファ−2−糖タンパク質(A2GL(LRG1))及び仮想タンパク質DFKZp667I032から選択されるマーカーの発現データを提供すること;及び
(ii)前記マーカーの発現がTBを示しているかどうかを判定すること
を含む、結核(TB)を診断する方法;
−(i)対象における2種以上のマーカーであって、前記マーカーの少なくとも2種が、トランスシレチン、ネオプテリン、C−反応性タンパク質(CRP)、血清アミロイドA(SAA)、血清アルブミン、アポリオポタンパク質−A1(Apo−A1)、アポリポタンパク質−A2(Apo−A2)、ヘモグロビンベータ、ハプトグロビンタンパク質、DEPドメインタンパク質、ロイシンリッチアルファ−2−糖タンパク質(A2GL)及び仮想タンパク質DFKZp667I032から選択されるマーカーの発現データを提供すること;及び
(ii)訓練された機械学習選別機によってプログラムされたコンピュータシステムを用いて実施される、前記マーカーの発現がTBを示しているかどうかを判定すること
を含む、結核(TB)を診断する方法;
−(i)対象における2種以上のマーカーの発現データを入力すること;及び
(ii)訓練されたサポートベクターマシン(SVM)によってプログラムされたコンピュータシステムを用いて前記マーカーの発現がTBを示しているかどうかを判定すること
を含み、それによって、前記患者がTBに罹患しているかどうかを診断する、コンピュータにより実施されるTBを診断する方法;
−(i)(a)結核(TB)患者の第1のセットの各々における2種以上のマーカーに関する訓練データ;及び
(b)対照対象の第1のセットの各々における2種以上のマーカーに関する訓練データ
を含む訓練データを提供すること;
(ii)TB患者の訓練データを、対照対象の訓練データから識別するためにサポートベクターマシン(SVM)を使用すること
を含み、そのことにより、TBを診断するためにSVMを訓練する、TBを診断するためにSVM選別機を訓練する方法;
−(i)対象のサンプル中の2種以上のマーカーの発現データを受け入れる手段;
(ii)前記データがTBを示しているかどうかを判定するモジュールであって、TB患者のデータを、対照対象のデータから識別することのできる訓練された機械学習選別機を含むモジュール;及び
(iii)前記判定の結果を表示する手段
を含む、本発明による方法を実施するように構成された装置;
− コンピュータシステムによって実行可能なコンピュータプログラムであって、コンピュータシステムによる実行の際、コンピュータシステムに、本発明による方法を実施させることのできるコンピュータプログラム;
− 本発明によるコンピュータプログラムを有するコンピュータシステムによって読取り可能な形態において保存する保存媒体;
−(i)2種以上のマーカーを検出するための手段;及び
(ii)本発明による保存媒体
を含む、TBを診断するためのキット;
−(i)2種以上のマーカーを検出するための手段;
(ii)本発明による装置に、前記マーカーの検出に関連するデータを入力するための使用説明書
を含む、TBを診断するためのキット;
−(i)トランスシレチン、ネオプテリン、C−反応性タンパク質(CRP)、血清アミロイドA(SAA)、血清アルブミン、アポリオポタンパク質−A1(Apo−A1)、アポリポタンパク質−A2(Apo−A2)、ヘモグロビンベータ、ハプトグロビンタンパク質、DEPドメインタンパク質、ロイシンリッチアルファ−2−糖タンパク質(A2GL)及び仮想タンパク質DFKZp667I032から選択される2種以上のマーカーを検出するための手段を含む、TBを診断するためのキット;
−(i)試験薬剤を、トランスシレチン、ネオプテリン、CRP、SAA、血清アルブミンApo−A1、Apo−A2、ヘモグロビンベータ、ハプトグロビン、DEPドメインタンパク質及びA2GLから選択されるTBマーカーに接触させること;及び
(ii)前記試験薬剤が、前記マーカーの活性又は発現を調節するかどうかを判定すること
を含み、それによって、前記試験薬剤がTBの治療における使用に好適であるかどうかを判定する、TBを治療するための薬剤を同定する方法;及び
−(i)エクスビボ又はインビボで、細胞を結核菌及び試験薬剤に接触させること;
(i)トランスシレチン、ネオプテリン、CRP、SAA、血清アルブミン、Apo−A1、Apo−A2、ヘモグロビンベータ、ハプトグロビン、DEPドメインタンパク質及びA2GLから選択される1種以上のTBマーカーの発現をモニターすること;及び
(ii)試験薬剤が前記1種以上の試験マーカーの発現を調節するかどうかを判定すること
を含み、それによって、前記試験薬剤がTBの治療における使用に好適であるかどうかを判定する、TBを治療するための薬剤を同定する方法
を提供する。
配列の簡単な説明
配列番号1は、ヒト血清アミロイドA1のアミノ酸配列である。
配列番号2は、ヒトC反応性タンパク質のアミノ酸配列である。
配列番号3は、ヒトトランスシレチンのアミノ酸配列である。
配列番号4は、ヒト血清アルブミン前駆体のアミノ酸配列である。
配列番号5は、ヒトアポリポタンパク質−A1のアミノ酸配列である。
配列番号6は、ヒトロイシンリッチアルファ−2−糖タンパク質のアミノ酸配列である。
配列番号7は、ヒトヘモグロビンベータのアミノ酸配列である。
配列番号8は、ヒトハプトグロビンのアミノ酸配列である。
配列番号9は、ヒトアポリポタンパク質−A2のアミノ酸配列である。
配列番号10は、ヒトDEPドメインタンパク質のアミノ酸配列である。
配列番号11は、ヒト仮想タンパク質DFKZp667I032のアミノ酸配列である。
本発明は、試験対象における結核(TB)を診断するエクスビボ方法を提供し、前記方法は本質的に、以下のステップを含む:
(i)試験対象における2種以上のマーカーであって、前記マーカーの少なくとも2種が、トランスシレチン、ネオプテリン、C−反応性タンパク質(CRP)、血清アミロイドA(SAA)、血清アルブミン、アポリオポタンパク質−A1(Apo−A1)、アポリポタンパク質−A2(Apo−A2)、ヘモグロビンベータ、ハプトグロビンタンパク質、DEPドメインタンパク質、ロイシンリッチアルファ−2−糖タンパク質(A2GL)及び仮想タンパク質DFKZp667I032から選択されるマーカーの発現データを提供すること;及び
(ii)前記発現データを、TB以外の炎症性状態に罹患している患者を含む対照患者の群からの前記マーカーの発現データと比較することによって、前記マーカーの発現がTBを示しているかどうかを判定し、
それによって、前記試験対象がTBに罹患しているかどうかを判定すること。
対照対象の群は、呼吸器感染症に罹患している患者、サルコイドーシスに罹患している患者、炎症性腸疾患に罹患している患者、マラリアに罹患している患者、ヒトアフリカトリパノソーマ症(HAT)に罹患している患者、神経系疾患に罹患している患者、自己免疫疾患に罹患している患者、骨髄腫に罹患している患者及び健康対象の1種以上から選択できる。
本発明は、結核(TB)を診断するエクスビボ方法を提供し、前記方法は本質的に、以下のステップを含む:
(i)対象における2種以上のマーカーであって、前記マーカーの少なくとも2種が、トランスシレチン、ネオプテリン、C−反応性タンパク質(CRP)、血清アミロイドA(SAA)、血清アルブミン、アポリオポタンパク質−A1(Apo−A1)、アポリポタンパク質−A2(Apo−A2)、ヘモグロビンベータ、ハプトグロビンタンパク質、DEPドメインタンパク質、ロイシンリッチアルファ−2−糖タンパク質(A2GL)及び仮想タンパク質DFKZp667I032から選択されるマーカーの発現データを提供すること;並びに
(ii)前記マーカーの発現がTBを示しているかどうかを判定し、それによって、患者が結核(TB)に罹患しているかどうかを診断すること。
マーカーは、TBに罹患していない1種以上の対照対象から採取した等価なサンプル(1つ又は複数)に比較して、TB患者から採取したサンプルにおいて差異的に発現するタンパク質又はペプチドなどの分子である。該発現データは典型的に、対象からのサンプルに存在するマーカーの量の表示を提供する。マーカーは、対照サンプルに比較してTBサンプルにおいて、増加したレベルで(陽性マーカー)又は減少したレベルで(陰性マーカー)存在する場合、TB患者から採取したサンプル及び対照対象から採取したサンプルにおいて差異的に存在する。マーカーの量の増加又は減少は、統計的に有意な差異であることが好ましい。
用語の「感受性」は、本明細書において、真の陽性の条件的確率として定義される。用語の「特異性」は、本明細書において、真の陰性の条件的確率として定義される。用語の「正確さ」は、本明細書において、正しい分類の比率として定義される。したがって、正確さは、TBの診断に関する特異的マーカー対又はマーカー集団の再現性を示し;感受性は、真の陽性診断を達成する結合可能性の程度を示し;特異性は、TB感染に関する真の陰性としてのサンプル同定において、各マーカーの結合の良好性の程度を示す。
トランスシレチン、ネオプテリン、CRP及びSAAは、TBにおける病態生理学的過程に関連していることが知られている。しかし、これらのタンパク質のいずれも、TBの診断におけるマーカーとして使用できることが以前示唆されたことはない。本発明者は、SAA、ネオプテリン、CRP、血清アルブミン、Apo−A1、A2GL及びDEPドメインタンパク質を、TBの陽性マーカーとして、並びに、トランスシレチン、Apo−A2、ヘモグロビンベータ、ハプトグロビンタンパク質、及び仮想タンパク質DFKZp667I032をTBの陰性マーカーとして同定した。種々の組合せで用いられた場合、これらのマーカー、特に、SAA、ネオプテリン、CRP及びトランスシレチンは、高程度の感受性、特異性及び正確さでTBの診断に使用できることを、本発明者は見出した。本発明の方法は典型的に、少なくとも80%、例えば、少なくとも85%、少なくとも90%又は少なくとも95%の正確さ、特異性及び/又は感受性でのTBの診断を可能にする。
したがって、本発明は、対象が結核菌に感染しているかどうかを、前記対象のサンプルにおける結核菌を培養する必要なしに、迅速に容易に判定することを可能にする。本発明の方法は、TBを、TB以外のウィルス及び細菌の感染症などの他の感染症及び炎症性疾患から識別することを可能にする。TBから識別できる感染症及び炎症性疾患の例としては、他の呼吸器感染症、サルコイドーシス、炎症性腸疾患、マラリア、ヒトアフリカトリパノソーマ症、神経系疾患、自己免疫疾患及び骨髄腫が挙げられる。
本発明の一方法において、対象からの発現データが典型的に、TB患者における同じマーカーの発現データと比較される。TB患者は、該患者からのサンプルの結核菌を培養することにより、TBに罹患しているとして診断できたことがあり得る。該発現データを、1種以上の対照対象における同じマーカーの発現データと比較することもできる。該対照対象は、TB以外の炎症性疾患に罹患している患者かも知れない。炎症性疾患は、病原性の感染、例えば、細菌、ウィルス又は真菌の感染によって引き起こされ得る。該対照対象は、本明細書に記載された、TB以外の疾患のいずれかに罹患していることがあり得る。或いは、又はそれに加えて、1種以上の対照対象は健康な個体であり得る。健康な個体は、炎症性疾患に罹患していない個体である。
2種以上のマーカーの発現データを用いることによって、診断の正確さが増強する。3種以上のマーカーなど、2種超のマーカーを組み合わせて用いることによって、診断の正確さをさらに増強できる。したがって、本発明において、2種以上のマーカー、好ましくは3種以上のマーカー、例えば、5種、6種、7種、8種、9種、10種、15種、20種又はそれ以上のマーカーなど、4種以上のマーカーの発現データが用いられる。診断の方法に用いられるこれらのマーカーのうちの1種はトランスシレチンであることが好ましい。好ましい組合せとしては、(i)トランスシレチン、SAA及びCRP、(ii)トランスシレチン及びネオプテリン及び(iii)トランスシレチン、ネオプテリン及びCRPが挙げられる。トランスシレチン、ネオプテリン、SAA及びCRP以外の血清アルブミン及び/又はApo−A1などの追加マーカーを該分析に含めることができる。さらなる追加マーカーとしては、アポリポタンパク質−A2、ヘモグロビンベータ、ハプトグロビンタンパク質、DEPドメインタンパク質、A2GL及び仮想タンパク質DFKZp667I032が挙げられる。
さらなる追加マーカーは、対照サンプルに比較して、TBサンプル中に増加又は減少したレベルで存在するタンパク質又はペプチドであり得る。さらなるマーカー(1種又は複数)は、例えば、質量分析によって判定される、見かけの分子量又は質量対電荷比(m/z値)によって特徴づけることができる。
このような追加の生体マーカーは、本発明者によって、SAA、血清アルブミン及びApo−A1がTBの陽性マーカーであり、トランスシレチンがTBの陰性マーカーであると判定するために使用される方法によって同定できる。他の陽性及び陰性関連マーカーは、表面増強レーザー脱離及びイオン化(SELDI)技法及び監視付き機械学習分類法により同定できる。
例えば、本発明者は、サポートベクターマシン選別機を用いて、TB患者のプロテオミックな識別特性を、対照対象のプロテオミックな識別特性と比較することによって10種の陽性マーカー及び10種の陰性マーカーを同定した。該陽性マーカーは、約M18394_9、約M8952_75、約M11720_0、約M11454_1、約M18591_2、約M11488_1、約M9076_68、約M8895_13、約M10856_8及び約M11541_5のm/z値を有し、負に相関したマーカーは、約M4100_03、約M3898_52、約M13972_1、約M3322_01、約M2956_45、約M5644_96、約M3939_63、約M4056_39、約M6649_74及び約M13774_3のm/z値有する。約M11541_5のm/z値を有するマーカーはSAAである。約M18394_9のm/z値を有するマーカーは血清アルブミンである。約M11454_1のm/z値を有するマーカーはApo−A1である。約M13774_3のm/z値を有するマーカーはトランスシレチンである。m/z値にはいくらか変動があり得る。例えば、m/z値の決定に用いる機械の分解能、又は該マーカーの翻訳後修飾に依存する変動があり得る。したがって、上記に挙げたマーカーは、指定されたm/z値プラス又はマイナス約10%、約5%、約1%、約0.5%又は約0.2%を有し得る。
SELDI分析によって同定された追加マーカーの同定は、トリプシン消化及びペプチド質量フィンガープリントのMatrix補助レーザー脱離/イオン化飛行時間型(MALDI−ToF)質量分析、並びにMASCOTデータベースなどのタンパク質データベースとの比較によって決定できる。SAA1はM11541_5のm/z値を有し、トランスシレチンは、M13774_3のm/z値を有するが、このような方法によって同定された。
該マーカーはまた、2次元(2D)ゲル上のm/z値に対応するタンパク質のスポットを同定し、切り出し、該スポットに存在するタンパク質を同定することによって同定できる。該2Dゲルは、約10、約20又はそれ以上などの数のTB患者、又は約10、約20又はそれ以上などの数の対照対象のプールされた血清から得ることができる。m/z値は一般に、受動的溶出(PE)質量よりもわずかに小さい。m/z値以上のPE質量の増加は、受動的溶出を行うのに用いられた時間に比例する。したがって、この方法が用いる場合、m/z値とPE質量との間の関連は近似的であることに注意することが重要である。しかし、該マーカーの同定は、元のサンプルの免疫減少及びSELDI−ToF分析の反復によって確認できる。対象となっているm/z値を有するピークサイズの減少は、正しい同定がなされたことを示している。しかし、本発明の方法にマーカーとして質量使用されるタンパク質にとって、さらなる同定は必須ではない。この方法を用いて、M18394_9及びM11454_1のm/z値を有する陽性マーカーは、血清アルブミン前駆体並びにアポリポタンパク質A1(Apo−A1)として同定された。したがって、血清アルブミン及び/又はApo−A1など、それらのm/z値によって同定されたマーカーの1種以上を、本発明の方法におけるマーカーとして用いることができる。
TBのさらなるマーカーは、TB患者及び対照対象からの血清タンパク質を含有する2Dゲルに差異的に存在するポリペプチドを同定することによって同定したものであり得る。この方法で同定されたマーカーは、アポリポタンパク質A2(Apo−A2)、ヘモグロビンベータ、ハプトグロビンタンパク質、DEPドメインタンパク質及び仮想タンパク質(DFKZp66I032)並びにロイシンリッチアルファ−2−糖タンパク質(A2GL(LRG1))である。
TB患者と対照対象からのプロテオミックな識別特性の監視機械学習分析後、TBのマーカーとしての使用に好適なタンパク質集団を、TB患者と対照対象との間を識別する能力を有するタンパク質集団の選択を可能にする任意の方法により同定できる。典型的には、相関フィルター法を用いて、独立して情報を与えるピークを検出する。例えば、ピヤソン相関係数を使用して、ピークをそれらの識別力に関して等級づけることができる。ピヤソン相関係数は、
Figure 2008545960

として定義され、式中、Xは、サンプル入力ベクトルXのk番目の成分に対応するランダムな変数であり、Yは、出力ラベルのランダムな変数である。R(k)の推定値は、
Figure 2008545960

により与えられ、式中、xは、サンプルiの質量集団kのm/z値に対応し、yは、サンプルiのクラスラベルであり、mはサンプルの数である。R(i)は、変数の有意性を評価するための検定統計値として使用でき、t検定に関連している。
Figure 2008545960

は、訓練セットにわたって各質量集団の値と対応するクラスラベルとの間で算出できる。次いで、
Figure 2008545960

を用いて、正及び負に相関した質量集団を等級づけることができる。最高の正及び/又は最高の負の相関係数を有する質量集団を選択できる。
タンパク質はしばしば、異なって検出できる分子質量によって特徴づけられる複数の異なる形態において生物学的材料に存在する。したがって、SELDIなどの方法による生物学的サンプル中の発現タンパク質の分析では、タンパク質集団として、種々の形態のタンパク質が検出される。種々の形態は、翻訳前及び/又は翻訳後修飾から生じ得る。例えば、トランスシレチンマーカーは、トランスシレチン前駆体又は成熟トランスシレチンであり得る。さらなる例として、血清アルブミン、Apo−A1及びApo−A2マーカーの各々もまた、該タンパク質の前駆体形態又は成熟形態であり得、好ましくは、前駆体形態である。対立形質変異、スプライス変異体の生成及びRNA編集は、翻訳前修飾を増加させる。翻訳後修飾としては、タンパク質分解的開裂、グリコシル化、リン酸化、脂質化、酸化、メチル化、シスチニル化、スルフォン化及びアセチル化が挙げられる。発現データは、該タンパク質の1つ又は複数の形態のいずれかに関するものであり得る。翻訳前及び/又は翻訳後修飾は、SELDI−ToFにおけるマーカーのm/z値における変動を増加させ得る。
本発明の一実施形態において、該発現データは、前記マーカーに由来する1種又は複数のペプチドに関するものであり得る。例えば、SAAの発現データは、SAAのN末端アルギニンの欠失から生じるペプチドの発現に関するものであり得る。SAA1の完全配列は、配列番号1に示されている。
一実施形態において、発現データは、該マーカーの特定の形態に関するものであり得る。例えば、陽性マーカー、Apo−A1は、約11400から約11600ダルトン(Da)の分子質量を有する形態であり得、及び/又は陽性マーカー、血清アルブミンは、約18300から約18500ダルトンの分子質量を有する形態であり得る。
発現データは任意の好適な方法によって得ることができる。一実施形態において、該発現データは、対象となっている各マーカーの存在又は不在を示す。該発現データが対象のサンプルに存在する各マーカーの量の表示を提供する、即ち、該データが定量的であることが好ましい。該発現データはさらに、各マーカーの形態、例えば、存在するタンパク質の形態を限定し得る。
典型的に発現データは、固相、又は表面上へのマーカーの捕捉、及び捕捉されたマーカーの検出によって得られる。該表面は、サンプルからのマーカータンパク質を、使用されているマーカーの一般的な性質に従って、又は種々のタンパク質マーカーの特定の性質に従って選択するようにデザインされる。該表面は典型的に、1つ又は複数の捕捉試薬が結合するビーズ、プレート、膜又はチップである。該捕捉試薬は、特定のクロマトグラフィー表面であり得る。該クロマトグラフィー表面は、化学的又は生化学的に処理され得る。化学処理された表面は、アニオン性、カチオン性、疎水性、親水性又は金属であり得る。このような化学処理された表面は、特定の化学的性質を有するタンパク質を捕捉することができる。このような化学処理された表面は、例えば、イオン交換材料、ニトリロ酢酸又はイミノ二酢酸などの金属キレート化剤、固定化金属キレート、疎水性相互作用吸着剤、親水性相互作用吸着剤、染料、ヌクレオチド、アミノ酸、単糖及び脂肪酸などの単純な生体分子、並びに、疎水性の吸引/静電斥力吸着剤などの混合様式吸着剤を含み得る。
表面が生化学処理されている一実施形態において、該捕捉試薬は典型的に、特定のマーカーに対する特異的結合試薬である。この実施形態において、該表面は典型的に、使用されている各マーカーに対する特異的結合試薬を含む。タンパク質が、それに対して特異的なマーカーに優先的に、又は高親和性で結合するが、他の物質には、結合しないか、実質的に結合しないか、又は低親和性でしか結合しない場合、該タンパク質は該マーカーに「特異的に結合」する。タンパク質の特異的結合能力は、任意の好適な方法により判定できる。競合的結合に関する種々のプロトコルが当業界によく知られている(例えば、Maddoxら、(1993)を参照)。
特異的結合剤は、該マーカーに特異的な抗体又は抗体断片であり得る。好適な抗体が当業界で入手できる。抗体及び抗体断片はまた、当業界に知られた標準的操作を用いて作出することもできる。
該抗体は、モノクローナル抗体又はポリクローナル抗体であり得る。モノクローナル抗体が好ましい。結合タンパク質はまた、親和性リガンド又は該マーカーに結合できる抗体断片であり得るか、又はそれを含み得る。このような抗体断片としては、Fv、F(ab’)及びF(ab’)断片、並びに一本鎖抗体が挙げられる。アプタマー、抗体及び相互作用する融合タンパク質もまた、特異的結合剤として使用できる。該特異的結合剤は、対象となっているマーカーの1つ又は複数の形態を認識し得る。
他の生化学処理された表面は、ポリペプチドなどの核酸分子、多糖、脂質、ステロイド又は糖タンパク質、リポタンパク質、糖脂質又は核酸などの結合分子(例えば、DNA−タンパク質結合体)によってコーティングされ得る。
抗体などの特異的結合剤を表面に結合させる方法は、当業界によく知られている。
該表面はタンパク質チップアレイであり得る。タンパク質チップアレイは、捕捉試薬の、典型的には2mmの直径の個別のスポットを含む。該アレイ上の各スポットにおける捕捉試薬は、同一でもよいし異なっていてもよい。本発明の使用に好適なタンパク質チップアレイは当業界によく知られている。例えば、好適なチップはCiphergen Biosystemsから入手でき、CM10、IMAC−3、CM16、SAX2、H4、NP20、H50、Q−10、WCX−2、IMAC−30、LSAX−30、LWCX−30、IMAC−40、PS10、PS−20及びPG−20のタンパク質チップアレイが含まれる。
これらのタンパク質バイオチップは典型的に、ストリップの形態におけるアルミニウム基質を含む。該ストリップの表面は、二酸化ケイ素でコーティングされている。NP−20バイオチップの場合、二酸化ケイ素は、親水性タンパク質を捕捉するための親水性吸着剤として機能する。H4、H50、SAX−2、Q−10、WCX−2、CM−10、IMAC−3、IMAC−30、PS−10及びPS−20バイオチップは、バイオチップの表面に物理的に結合した、又はバイオチップの表面にシランを介して共有結合したヒドロゲルの形態における機能化された架橋ポリマーをさらに含む。H4バイオチップは、親水性結合のためのイソプロピル機能性を有する。H50バイオチップは、疎水性結合のためのノニルフェノキシルポリ(エチレングリコール)メタクリレートを有する。SAX−2及びQ−10バイオチップは、アニオン交換のための四級アンモニウム機能性を有する。WCX−2及びCM−10バイオチップは、カチオン交換のためのカルボキシレート機能性を有する。IMAC−3及びIMAC−30バイオチップは、キレート化によりCu2+及びNi2+などの遷移金属イオンを吸着するニトリロ酢酸機能性を有する。これらの固定化金属イオンは、配位結合によりペプチド及びタンパク質の吸着を可能にする。PS−10バイオチップは、共有結合のたにタンパク質上の基と反応できるカルボイミジゾール官能基を有する。PS−20バイオチップは、タンパク質との共有結合のためにエポキシド官能基を有する。PS系のバイオチップは、サンプルからの検体を特異的に捕捉するために機能するチップ表面に、抗体、受容体、レクチン、ヘパリン、タンパク質A、ビオチン/ストレプトアビジンなどの生体特異的吸着剤を結合させる上で有用である。PG−20バイオチップは、タンパク質Gが結合するPS−20チップである。LSAX−30(アニオン交換)、LWCX−30(カチオン交換)及びIMAC−40(金属キレート)バイオチップは、それらの表面に機能化ラテックスビーズを有する。
該表面は、96ウェルマイクロタイタープレートなどのマイクロタイタープレートのウェルであってもよい。典型的に、このようなプレートの各ウェルは、各ウェルが異なる抗体の2つ以上の別個のスポットを含み得るように、異なる抗体などの異なる捕捉試薬を含むことになる。
該捕捉表面は、捕捉試薬によってコーティングされた複数のビーズを充填したカラムであり得る。各々が単一のマーカータンパク質を捕捉できる複数のカラムを使用できる。或いは、すべてのマーカータンパク質が同じカラムで捕捉されるように、単一のカラムが、種々のマーカータンパク質に対する特異的結合剤によってコーティングされたビーズを含有し得る。
対象のサンプルを典型的に、該表面に対するサンプル中のマーカータンパク質の結合に好適な条件下で、該表面に接触させる。サンプル中に存在する該タンパク質は任意に分画化でき、検出されるマーカーを含む該画分(1つ又は複数)を採集して、該表面に接触させることができる。非結合タンパク質及び他の物質を溶出する一方で該表面への対象となっているマーカーの結合を保持するようにデザインされた適切な溶媒又はリン酸緩衝生理食塩水(PBS)などの緩衝液を用いて、非結合物質を洗浄除去する。該対象のサンプルは典型的に、血液、血漿又は血清サンプルである。
捕捉されたマーカータンパク質は、任意の好適な方法によって検出できる。一実施形態において、結合マーカーは、免疫アッセイ、例えば、ELISAアッセイ又は蛍光ベースの免疫アッセイによって検出できる。典型的な免疫アッセイにおいて、結合マーカーは、該マーカーに結合することが予想される抗体又は抗体断片を用いて検出できる。捕捉試薬が抗体である場合、検出する抗体は典型的に、その捕捉試薬とは異なる抗体である。典型的に、該抗体は、捕捉試薬に結合する部位とは異なる部位でマーカーに結合する。該抗体は、マーカーと支持体に固定化された捕捉試薬との間に形成された複合体に特異的であり得る。
一般に該抗体は、直接的又は間接的に検出可能な標識によって標識化される。直接的に検出可能な標識としては、フルオレセインなどの蛍光標識、テキサスレッド、ローダミン又はオレゴングリーンを挙げることができる。固定化された捕捉試薬/マーカー複合体に対する蛍光標識抗体の結合は顕微鏡によって検出できる。例えば、蛍光顕微鏡、二重焦点顕微鏡又は共焦点顕微鏡を用いる。
該抗体は、間接的に検出できる標識に結合させることが好ましい。間接的に検出できる標識は、自動読取り機を用いて検出できる、沈降非蛍光基質に作用する酵素を含み得る。自動読取り機は典型的に、ビデオカメラ及び画像分析ソフトウェアに基づく。該自動読取り機は、検出された各マーカーの量の計量を提供することができる。好ましい酵素としては、アルカリホスファターゼ及びセイヨウワサビペルオキシダーゼが挙げられる。自動読取り機は当業界によく知られており、例えば、Grifols Tritorus分析装置(Grifols、ケンブリッジ、英国)が挙げられる。
検出抗体からのシグナルを増強するために、他の間接的方法が使用できる。例えば、検出抗体はビオチン化でき、アルカリホスファターゼ若しくはセイヨウワサビペルオキシダーゼなどの酵素に結合したストレプトアビジン又はFITC、又はテキサスレッドなどの蛍光プローブに結合したストレプトアビジンを用いて検出が可能になる。
すべての検出ステップにおいて、第2の、及びその後の薬剤の非特異的結合を最少化する薬剤を含めることが望ましい。例えば、例えば、ウシ血清アルブミン(BSA)又はウシ胎仔血清(FCS)を用いて非特異的結合をブロックすることができる。
一実施形態において、捕捉されたタンパク質は、該表面、例えばチップ又はビーズからのタンパク質の溶出後、質量分析、例えば、MALDI又はSELDIなどの気相イオン分光分析によって検出できる。このような検出方法によって、種々のタンパク質、及び同一タンパク質の種々の形態を、標識化を必要とすることなく識別することが可能になる。
気相イオン分光分析は、気相イオンを検出するために気相イオン分光器を必要とする。気相イオン分光器は、気相イオンを供給するイオン源を含み、質量分光器、イオン移動度分光器及び総イオン流測定装置を含む。質量分光器は、気相イオンの質量対電荷比に翻訳できるパラメーターを測定する気相イオン分光器である。質量分光器は典型的に、イオン源及び質量分析装置を含む。質量分光器の例は、飛行時間(ToF)、磁気セクター、四極子フィルター、イオントラップ、イオンサイクロトロン共鳴、静電セクター分析装置及びこれらのハイブリッドである。レーザー脱離質量分光器は、検体を脱着し、蒸発させ、イオン化するための手段としてレーザーを用いる質量分光器である。タンデム型質量分光器は、イオン混合物中のイオンなどのイオンのm/zベースの識別又は測定の2つの連続的段階を実施できる質量分光器である。
放射性核種のベータ減衰により生成した高エネルギー粒子又は二次イオンを生成する一次イオンなどの好適なイオン化エネルギー源を用いて、捕捉表面から捕捉マーカーを脱着又はイオン化できる。固相検体のイオン化エネルギーの好ましい形態はレーザーである。
本発明に用いられる好ましい質量分光法は、SELDI(表面増強レーザー脱離及びイオン化)であり、これは、タンパク質チップ、又は気相イオン分光器のプローブ界面に係合するSELDIプローブの表面にマーカータンパク質が捕捉される脱離/イオン化気相イオン分光分析の方法である。マーカータンパク質を捕捉するためにタンパク質チップアレイを用いるこの実施形態において、結合マーカーを検出するために、タンパク質チップ読取り機を使用できる。結合タンパク質の分子量を測定するために、エネルギー吸収分子(EAM)溶液の添加及びタンパク質チップ読取り機内へのタンパク質チップの挿入の前に、タンパク質チップに結合したタンパク質は典型的には乾燥させる。タンパク質チップ読取り機においてレーザーが活性化すると、サンプルは照射され、脱着/イオン化が進行して、タンパク質チップアレイから気体状イオンを遊離させる。イオンチャンバーを通る各タンパク質の速度に基づいて各タンパク質の質量対電荷比(m/z)測定するタンパク質チップ読取り機の飛行時間質量分光分析(ToF MS)領域に、これらの気体状イオンが進入する。シグナル出力の質量正確度を増加させるために、タイムラグフォーカシングが使用できる。シグナル処理は、パーソナルコンピュータに結合している、デジタルコンバータへの高速アナログによって達成される。検出されたタンパク質は、一連のピークとして表示される。ピークの幅は、サンプル中に存在する各タンパク質の量の表示である。本発明の方法における使用に好適なEAMsとしては、桂皮酸誘導体、シナピン酸及びジヒドロキシ安息香酸が挙げられる。
発現データはまた、比濁分析によっても得ることができる。比濁分析は、マーカー量の測定値を正確に迅速に得るために用いられる実験室技法である。該データは、例えば、粒子増強免疫比濁分析又は比率比濁分析によって得ることができる。BNII分析器(Dade Behring、ミルトンキーネス、英国)は、粒子増強免疫比濁分析の実施に好適である。比率比濁分析の実施には、Beckman Immage(Beckman Coniter、ハイウィコンベ、英国)が使用できる。Beckman Immageは、International Reference Preparation CRM 470に対して検量できる。マーカー発現の測定は、用いられる分析器の製造元によって提供された指示に従って実施できる。
使用できる他の検出方法としては、共焦点顕微鏡法又は蛍光顕微鏡法などの光学的技術、ボルタメトリー(voltametry)及びアンペロメトリー(amperometry)などの電気化学的技術、原子力顕微鏡法及び多極共鳴分光法などの無線周波技術が挙げられる。
対象となっているマーカーの発現パターンを調べて、該マーカーの発現がTBを有する患者を示しているかどうかを判定する。任意の好適な分析方法が使用できる。典型的には、用いられる分析法は、対象から得られた発現データを、TBに罹患していることが分かっている患者及び結核菌に感染していない対象から得られた発現データと比較することを含む。次いで、対象におけるマーカーの発現が、TBであることが分かっている患者に見られる発現パターンにより類似しているか、それとも対照対象に見られる発現パターンにより類似しているかを判定することができる。分析方法は典型的に、対象がTBに罹患している可能性を測定する。
TBに罹患している患者は典型的に、各患者由来のサンプルからの結核菌培養の結果として、TBに罹患していると診断された。対照対象は、TB以外の呼吸器感染症に罹患している患者、サルコイドーシスに罹患している患者、炎症性腸疾患に罹患している患者、マラリアに罹患している患者、ヒトアフリカトリパノソーマ症(HAT)に罹患している患者、神経系疾患に罹患している患者、自己免疫疾患に罹患している患者、骨髄腫に罹患している患者及び健康対象のうちの1種以上から選択できる。TBに罹患しておらず、上記に挙げられていない他の疾患に罹患している患者もまた、対照対象として用いることができる。典型的には、試験対象のマーカーの発現パターンを比較する対照対象の発現データは、上記対象の少なくとも2種、例えば、少なくとも3種、少なくとも4種、少なくとも5種、少なくとも6種、少なくとも7種又は少なくとも8種を含む。HIV陽性の患者は、特に疾患に罹患しやすい。TB患者及び/又は対照対象は、HIV陽性でもHIV陰性でもあり得る。
TBサンプル及び対照サンプルは、1つ超、例えば、2つ以上、3つ以上、4つ以上、5つ以上、8つ以上、10以上の地域からの患者及び/又は対象から採取できる。各々の地域は、異なる大陸、国、又はある国の内の地域であり得る。TB対象及び/又は対照対象からの種々のサンプルは、種々の時間での発現データを得るために処理できる。例えば、サンプルは、1カ月から2年、3カ月から18カ月又は6カ月から1年などの任意の好適な期間にわたって得ることができ、及び/又は処理できる。
該発現データがTBを示しているか否かを判定する方法は典型的にコンピュータを用いて実施される。該コンピュータは、発現データを生成するために用いられる読取り機から物理的に分離されていてもよいし、該読取り機に、例えば、質量分析器に結合されていてもよい。
TBに罹患している患者の発現データを、対照対象の発現データから識別するために、監視付き機械学習分類法が使用できる。TB患者からの発現データの訓練及び対照対象からの対照データの訓練を用いて、機械学習選別機をまず訓練する。
TB患者からの発現データを、TBに罹患していない対象からの発現データから識別するために、機械学習選別機を訓練する方法は、図1のフローチャートに示されている。コンピュータシステム上で実施されるコンピュータプログラムによって実行されるステップは、図1における点線によって概略的に示されている。TB患者及び対照対象からの訓練データ(データD1)は、入力変数(典型的には、m/z値、ELISA値又は比濁値)になる。ステップS1において、コンピュータはこれらの入力変数をマップ化して、カーネルを用いてスペースを特徴づけ、ステップS2において、選別機はTBデータと対照データとの間を識別することを学習し、したがって、TBデータと対照データとの間を識別するための、SVMなどの選別機訓練を生じさせる。
次いで、さらなるTB患者及びさらなる対照対象からの発現データを用いて、訓練された選別機を試験することができる。機械学習選別機の一般化を試験する方法は、図2のフローチャートに示されている。コンピュータ実行ステップは、図2における点線によって概略的に示されている。表1に示されるように、各セットに、TB患者と対照の同様な数、並びに同様な年齢と性別の表示を有する独立した訓練セットと試験セットが使用できる。TB患者及び/又は対照対象からの試験データ(データD2)は、入力変数(典型的には、m/z値、ELISA値又は比濁値)になる。ステップS3において、コンピュータはこれらの入力変数をマップ化して、カーネルを用いてスペースを特徴づけ、ステップ4では、訓練データを用いて生成させた選別機を用いて入力変数のクラスを、TBデータ又は非TBデータであるとして割り当てる。次いで、試験データが正しく分類されたか誤って分類されたかを判定することができる。
TBに罹患しているとして、又は罹患していないとして診断することが望まれる対象からの発現データが、TBに罹患している、又はTBに罹患していない患者を示しているかどうかを判定するために、訓練された機械学習選別機を使用することができる。このような診断方法で用いられる訓練された機械学習選別機は、上記のとおり試験したものであり得るが、この試験ステップは必須ではない。図3は、本発明によるコンピュータで実行する診断方法を示すフローチャートである。コンピュータ実行ステップは、図3における点線によって概略的に示されている。図3において、D3と標識された試験対象(即ち、新たな未知対象)からのデータは入力変数になる。ステップS5において、コンピュータはこれらの入力変数(典型的には、m/z値、ELISA値又は比濁値)をマップ化して、カーネルを用いてスペースを特徴づけ、ステップS6では、先に得た選別機を用いてサンプルを、TBサンプル又は非TBサンプルであるとして分類する。したがって試験対象は、TBに罹患している、又は罹患していないものとして診断される。
好適な機械学習選別機としては、単層パーセプトロン(SLP)、多層パーセプトロン(MLP)、デシジョンツリー及びサポートベクターマシンが挙げられる。好ましくは、サポートベクターマシンにおける該選別機。より好ましくは、該選別機はGaussianカーネルサポートベクターマシンである。
監視付き学習演算法は、訓練データと呼ばれる例の1セットの入力/出力対に対して正しいラベルを帰属させることのできる決定機能を見出すことが課せられている。未知のサンプル(試験データ)に対して正しいラベルを予測する決定機能の能力は、それの一般化として知られている。サポートベクターマシン(SVM)などの現行の機械学習法は、この性質を最適化することを目指している。選別機の一般化は、性能を最適化するために選択しなければならない1セットのパラメーター(モデル)に依存している。この目的のために、パラメーター値の範囲が離散化され、交差検証によって試験されるグリッド探索法を採用できる。
データセットDは、入力ベクトル、X(即ち、カテゴリーの典型)のサンプルとそれらの対応する出力ラベル、Yのサンプル、D=[X,Y]によって表される。サンプル入力ベクトルは、xによって表される。i番目のサンプルの質量スペクトルは、n次元(質量集団の数)ベクトルxと、関連クラスラベルy(TBでは+1、対照では−1)として表され、式中、i=1,...,mであり、mはサンプルの数である。スペクトルベクトル要素は、xi,kによって表され、式中、i=1,...,mであり、k=1,...,nである。サンプルクラスラベルyの選別機予測は、
Figure 2008545960

によって表される。
サポートベクターマシン(SVM)はその入力を、高い、さらには無限の次元特徴スペースへマップ化する。次いで、SVMの出力は、特徴スペースにおいてマップ化された入力の線形閾値化関数であるが、これは、元の入力空間では非線形であり得る。マッピングは、使用者選択再生カーネル関数K(x,x’)によって達成され、式中、x及びx’は入力ベクトルである。カーネル関数は、マーサー条件を満たさなければならない。カーネルのよく知られた例としては、ガウスの
Figure 2008545960

が挙げられ、式中、パラメーターσは幅を決定し;ポリノミナルK(x,x’)=(x・x’)であり、式中、dは次数を決定する。d=1の場合、線形カーネルと呼ばれ、入力データのアイデンティティーマップに対応する。訓練されたSVM選別機は、
Figure 2008545960

の形態を有し、訓練により、α及びbの値が決定する。典型的には、αの多くはゼロである。非ゼロのものは「サポートベクター」と呼ばれ、変換特徴スペースにおける分離超平面を規定するために用いられる。SVMの訓練は、多層パーセプトロンとは異なり、局所最小に供されないコンベックス(二次)最適化問題である。SVMlight(Joachims、1999年)及び、特に、データに雑音がある場合に実用可能なソフト限界SVMなどの、SVMを訓練するために入手できる多くのパッケージがある。また、この場合、該演算により、間違って分類された実施例の距離は、ソフト限界パラメーターと呼ばれるペナルティー値、Cを調節することで、限界まで最小化される。
Single Layer Perceptron(SLP)(Rosenblatt、1962年)は、入力層によって与えられる値の線形組合せを計算する1つの出力ニューロンを有する人工ニューラルネットである。識別関数は、
Figure 2008545960

によって与えられ、式中、重みwは、総分類エラー
Figure 2008545960

を減少させるためにデザインされた反復学習演算によって得られる。
Multi−Layer Perceptron(MLP)(McClelland及びRumelhart、1986年)は、隠れニューロンの中間層を有するSLPの一般化である。それは、ニューロンに、活性化レベルでのS字形関数
Figure 2008545960

によりそれらの入力を処理させることによって、非線形に分離可能なクラスの問題に取り組む。このネットワークにおいて、重みは、
Figure 2008545960

によって与えられるエラーを最小化するための勾配下降則である逆伝播演算により学習される。
デシジョンツリーは、二元ツリー構造に組織化された1セットの節点内にサンプルのデータセットD=[X,Y]の特徴を集合させることによって、それらの分類を学習する。ツリー構造を見出すために、分割基準:所与の質量ピークxi,kに関して、試験xi,k<T(式中Tは、データセットDの二元分割を生じる任意の試験)を用い、サンプルの特徴が、それらの識別力に従って試験される。C4.5(Quinlanら、1993年)選別機において、試験閾値は、情報−獲得分割基準
Figure 2008545960

によって評価され、式中、Info(D)は、サンプルが帰属するクラスのエントロピー計量であり、zは、試験Tの結果の数である。反復演算により、ツリーの根から葉までの情報獲得を増加させて節点が配置される。選別機のよりコンパクトな提示を得るために、最終のツリーを刈り込んでもよい。試験セットサンプルは、分類出力により根から葉までの通路づたいのツリーの節点における質量ピーク値に対してその質量ピーク値を試験することによって分類することができる。C5.0演算は、無関連の特徴を選別し、可変性の誤分類コストを組み入れるC4.5の拡張型である(http://www.rulequest.com/)。Alternating Decision Tree(ADTree)(Freund及びMason、1999年)は、分類通路にわたって合計される予測値に関する追加節点を有するツリーであり、最終出力はこの合計のサインである。
k倍交差妥当化、又は試験によるk倍交差妥当化などの任意の好適な交差妥当化方式を使用できる。k倍交差妥当化では、訓練セットを、等しく分散された陽性事例及び陰性事例のk群にランダムに分割する。選別機は、それらの群のk−1で訓練され、その一般化性能は残りの群で妥当化される。この処理をk回反復し、各々の回で異なる妥当化サブセットが提供されるが、その平均が全体的な一般化を表す。第2の方式、試験によるk倍交差妥当化では、データはまず、訓練セットと試験セットにランダムに分割される。k倍交差妥当化を訓練セットで行い、一般化は未知の試験セットで得られる。
選別機の一般化性能は、試験セットにおいて、正しく分類された(真の陽性、TP及び真の陰性、TN)並びに間違って分類された(偽陽性、FP及び偽陰性、FN)事例の数を考慮することによって評価できる。感受性(se)は、真の陽性の条件付き確率、se=TP/(TP+FN)として、特異性(sp)は、真の陰性の条件付き確率、sp=TN/(TN+FP)として、正確さ(ac)は、正しい分類の比率、ac=(TP+TN)/(TP+FP+TN+FN)として定義できる。選別機の真の陽性比(se)及び偽陽性比(1−sp)によって表された選別機の性能は、レシーバーオペレーター曲線(ROC)スペースにプロットできる。
選別機の一般化能力のロバスト予測は、試験付き10倍交差妥当化の実施によって提供できる。例えば、訓練:試験が80:20の100セットを、データセット全体において置換することなく、ランダムなサンプリングによって作出することができる。80:20の訓練:試験セットの各々に10倍交差妥当化を訓練セットで実施し、最良の性能を有するパラメーターを選択する。10のサブセットすべてにわたって最良のパラメーターでSVMを再訓練でき、最終的な性能を試験セットにおいて評価する。標準偏差を有する平均曲線を示すために、各ROC曲線を補整し、サンプリングし、平均化できる。
本発明はさらに、以下のステップを本質的に含む、コンピュータ実行のTB診断法を提供する:
(a)対象における2種以上のマーカーの発現データを入力するステップ;及び
(b)訓練されたサポートベクターマシン(SVM)によってプログラムされたコンピュータシステムを用いて、前記マーカーの発現がTBを示しているかどうかを判定し;
それによって、前記患者がTBに罹患しているか否かを診断するステップ。
該発現データは、TB患者と対照対象とで差異的に発現する上記のマーカーなどの任意の2種以上のマーカーに関するものであり得る。一実施形態において、該発現データは、対象のサンプル、典型的には、SELDI分析により得られた血液サンプル、血漿サンプル又は血清サンプルからのプロテオミックなプロフィルである。
サポートベクターマシンは上記のとおり訓練され、好ましくは、Gaussianカーネルサポートベクターマシンである。訓練されたサポートベクターマシンによりプログラムされたコンピュータシステムによって、対象からの発現データは、TBに罹患している対象を示しているものとして、又はTBに罹患していない対象を示しているものとして分類される。したがって、該コンピュータシステムからの結果によって、TBに罹患している、又はTBに罹患していないものとして、対象の診断が可能になる。
本発明の方法によるTBの診断に基づいて、さらなる処置が教唆され得る。本発明による診断方法はさらに、TBに罹患していると診断された患者にTBを治療するための薬剤を投与することを含むことができる。TBを治療するための薬剤は、治療的有効量で対象に投与された際、該対象の症状を軽減するか、或いは、該対象の苦痛を減少させる物質又は組成物である。該物質又は組成物は、例えば、結核菌の複製を妨げることによって、結核菌を殺すか、又は無能力化する薬剤であり得る。好適な薬剤としては、イソニアジド、リファンピン、ピラジナミド及びエタンブトールが挙げられる。正確な治療法は、個体の状態、例えば、個体が妊娠、HIV血清陽性、糖尿病であるかどうかに依存し、医師によって容易に決定され得る。
本発明はさらに、以下のステップを本質的に含む、TBを診断するためのサポートベクターマシン(SVM)選別機を訓練する方法を提供する:
(a)(i)TB患者の第1のセットの各々における2種以上のマーカーに関する訓練データ;及び
(ii)対照対象の第1のセットの各々における前記2種以上のマーカーに関する訓練データ
を含む訓練データを提供するステップ;
(b)TB患者の訓練データを、対照対象の訓練データから識別するためにSVMを使用し;
そのことにより、TBを診断するためにSVMを訓練するステップ。
該方法は任意に、以下を本質的にさらに含む:
(c)(i)TB患者の第2のセットの各々における前記2種以上のマーカーに関する試験データ;及び
(ii)対照対象の第2のセットの各々における前記2種以上のマーカーに関する試験データ
を含む試験データを提供すること;
(d)TB患者の試験データを、対照対象の試験データから正しく識別するためにSVMの能力を判定すること。
訓練データ及び試験データは、上記のものなど、任意の好適な方法によって得ることができる。
試験データは典型的に、SVM選別機の感受性、特異性及び/又は正確さを判定するために用いられる。
本発明はさらに、本発明による診断方法を実施するように構成された装置を提供し、該装置は本質的に以下を含む:
(i)対象のサンプルにおける2種以上のマーカーの発現データを受け入れるための手段;
(ii)前記データがTBを示しているかどうかを判定するためのモジュールであって、TB患者からのデータと対照対象からのデータとを識別することのできる訓練された機械学習選別機を含むモジュール;及び
(iii)前記判定の結果を表示する手段。
発現データを受け入れるための手段は、データを手動で入れることのできるキーボードであり得る。或いは、タンパク質チップ読取り機又は自動画像分析装置などの、発現データを解析しているコンピュータから、発現データを直接受け入れることができる。該発現データは、ワイヤ接続又はワイヤレス接続によって受け入れることができる。さらなる代替として、発現データは、該装置によって読取り可能な形態で保存媒体に記録することができる。該保存媒体は、該装置内に含まれる好適な読取り機内に配置できる。
TBに関して試験中の対象からの訓練データ、試験データ及び/又は発現データは、生データであってもよいし、該コンピュータシステム内に入力される前に処理されてもよい。該コンピュータシステムは、生データをさらなる解析に好適な形態へと変換する手段を含み得る。
該データがTBを示しているかどうかを判定するためのモジュールは、機械学習選別機がTB患者に特徴的な発現データを対照対象に特徴的な発現データから識別できるように本明細書に記載された方法によって訓練された、機械学習選別機を含む。
前記判定の結果を表示する手段は、ビジュアルスクリーン、オーディオ出力又はプリントアウトであり得る。これらの結果は典型的に、発現データの分類を示し、任意に、分類が正しいという確実度を示し得る。
本発明の装置は、パーソナルコンピュータであり得る。該パーソナルコンピュータは、ラップトップであり得る。或いは、該装置は手持ち型コンピュータ、例えば、野外で容易に携帯可能であるという利点を有する、特別にデザインされた手持ち型コンピュータであり得る。
本発明はさらに、コンピュータシステムによって実行可能なコンピュータプログラムであって、該コンピュータシステムによる実行の際、該コンピュータシステムに本発明による診断方法を実施させることができるコンピュータプログラムを提供する。該コンピュータプログラムは一般に、機械学習選別機、好ましくは、本明細書に記載されたとおり訓練されたサポートベクターマシンを含む。
本発明はさらに、本発明のコンピュータシステムコンピュータプログラムによって読取り可能な形態で保存する保存手段を提供する。CD−ROM又はフロッピー(登録商標)デスクなどの任意の好適な保存媒体が使用できる。
さらなる一態様において、本発明は、TBの診断に使用するためのキットを提供する。該キットは典型的に、本明細書に定義した2種以上のマーカーを検出するための手段を含む。該検出手段は典型的に、タンパク質チップ、又は抗体若しくは抗体断片などの特異的結合試薬のアレイなどの、本明細書に記載された捕捉表面を含む。該キットは、ラベル又は別個の挿入物の形態における操作に関する使用説明書を含み得る。例えば、該使用説明書は、サンプル採取の仕方、捕捉表面によるサンプルのインキュベーションの仕方及び/又はプローブの洗浄の仕方を、消費者に知らせることができる。該キットは、マーカーの発現データを本発明の装置内に入れる説明書を含み得る。該キットは本発明の保存媒体を含み得る。
該キットは、3種、4種、5種又は6種以上など、2種以上のマーカー、トランスシレチン、ネオプテリン、CRP、SAA、Apo−A1、血清アルブミン、Apo−A2、ヘモグロビンベータ、ハプトグロビンタンパク質、DEPドメインタンパク質、A2GL及び仮想タンパク質DFKZp667I032の任意の組合せを検出するために適合化されることが好ましい。好ましい一実施形態において、該キットは、3種又は4種など、2種以上のマーカー、トランスシレチン、ネオプテリン、CRP及びSAA、例えば、トランスシレチン、ネオプテリン及びCRPの任意の組合せを検出するために適合化される。該キットは、これら4種の指定されたマーカー以外の追加マーカーを検出する能力があり得る。
該キットは、下表に挙げられた陽性マーカー及び/又は陰性マーカーを検出するために適合化される。
Figure 2008545960
本実施形態において、検出手段は好ましくはタンパク質チップである。
該キットは、容器内の1種以上のマーカーの1種以上のサンプルをさらに含み得る。該キットに提供されたマーカーは、対照として、又は検量用に使用できる。
本発明はまた、TB治療のための候補薬剤を同定するための方法を提供する。トランスシレチン、ネオプテリン、CRP、SAA、血清アルブミン、Apo−A1、Apo−A2、ヘモグロビンベータ、ハプトグロビン、DEPドメインタンパク質、A2GLのうちの1種以上の活性又は発現の改変における試験薬剤の活性に関して評価することによって、候補薬剤を同定できる。トランスシレチン、ネオプテリン、CRP、SAA、血清アルブミン、Apo−A1、Apo−A2、ヘモグロビンベータ、ハプトグロビン、DEPドメインタンパク質又はA2GLの各々の生物学的活性は、当業界に知られている。したがって、当業者は、トランスシレチン、ネオプテリン、CRP、SAA、血清アルブミン、Apo−A1、Apo−A2、ヘモグロビンベータ、ハプトグロビン、DEPドメインタンパク質又はA2GLのいずれか1種の活性に及ぼす試験薬剤の効果を評価するために、容易にアッセイを実施できるであろう。
本発明の一実施形態において、結核菌に感染した細胞中の1種以上のTBマーカーの発現に及ぼす試験薬剤の効果を判定することによって、候補治療薬が同定できる。1種以上のTBマーカーは一般に、トランスシレチン、ネオプテリン、CRP、SAA、血清アルブミン、Apo−A1、Apo−A2、ヘモグロビンベータ、ハプトグロビン、DEPドメインタンパク質、A2GL及び仮想タンパク質DFKZp667I032から選択される。1種以上のマーカーの発現における増加又は減少により、該試験薬剤がTBの治療に有用であることが示される。典型的に、該マーカーがTBの陽性マーカーである場合、TBの治療に有用な試験薬剤は、該試験薬剤の不在下での感染細胞における該マーカーの発現レベルに比較して、該マーカーの発現レベルを減少させる。典型的に、該マーカーがTBの陰性マーカーである場合、TBの治療に有用な試験薬剤は、該試験薬剤の不在下での感染細胞における該マーカーの発現レベルに比較して、該マーカーの発現レベルを増加させる。
該感染細胞は、インビボ又はエクスビボであり得る。該細胞がインビボである場合、それらは典型的に、実験動物、典型的には、マウス又はラットなどの齧歯類に存在する。該感染細胞は、結核菌が感染し得る任意の細胞であり得る。一実施形態において、該細胞は、呼吸器系の細胞であるか、又はそれ由来の細胞系である。
また、本発明の方法などによって同定される候補治療薬も本発明によって提供される。好適な候補治療薬としては、トランスシレチン、ネオプテリン、CRP、SAA、血清アルブミン、Apo−A1、Apo−A2、ヘモグロビンベータ、ハプトグロビン、DEPドメインタンパク質又はA2GLのうちの1種に特異的な抗体が挙げられる。
以下の実施例は本発明を例示するものである。
(実施例1)
患者並びに対照対象の選択
TB診断の新規アプローチを開発するために、本発明者らは、少なくとも4つの民族背景からの患者を代表する複数地域(英国、アンゴラ、ガンビア及びウガンダ)からの患者(n=179)及び対照(n=170)の血清を採集した(表1)。本発明者らは、肺疾患に典型的な症状(Rathmanら、2003年)を呈するTB患者に限定した。これが、すべての地域における成人TBの最もよく見られる呈示だからである。診断は結核菌の培養によって確認された。スミア陽性及びスミア陰性双方の患者並びに対照対象(HIV状態を含む)を含む患者の詳細は、表1及び表2aに与えられている。予想どおり、咳、発熱及び体重減少を呈した大方の患者は、空洞性肺疾患に罹患していた。
対照対象には、健康な志願者、並びにTBに重なり得る臨床的特徴を有する状態にある患者を採用した(表2b)。本発明者らの対照対象は、標準的な診断基準によって確認された異種起源の炎症原因を有する。例えば、しばしば、肺TBの差異的診断に含まれるサルコイドーシスに罹患している患者及び非結核性の破壊的な肺の病状にある患者を表している他の重篤な呼吸器感染を含めた。TBに擬態し得る全身性炎症過程を考慮するため、他の全身性感染に罹患している患者、並びに炎症性腸疾患及び自己免疫疾患に罹患している患者を採用した。
(実施例2)
プロテオミックプロファイリング並びに監視付き機械学習分類
本発明者らはまず、これらの対象からの349の血清サンプルを、Surface Enhanced Laser Desorption Ionisation Time of Flight Mass Spectrometry(SELDI−ToF MS)による弱カチオン交換(CM10)タンパク質チップアレイ上でプロファイルし(Issaqら、2002年;von Eggelingら、2001年)、2,000〜100,000の範囲におけるm/zスペクトルからの219のピーク集団を同定した。次いで、現状技術の監視付き機械学習分類法を用い(表3及び図4)、訓練−試験−セットアプローチを用いて、TBに罹患している患者のプロテオミックスペクトルを、対照から識別した(表1)。試験セットにおけるデータを正しく識別する選別機の能力は、選別機の一般化性能として知られている(Vapnik、1998年;Cristianini及びShawe−Taylor、2000年)。種々の選別機の一般化性能を、Receiver Operating Characteristic(ROC)スペースにおいて異なる試験セットに対するそれらの性能をプロットすることによって比較した。
当該試験において、SLPは最適識別機能を提供することなく、独立した試験セットにおいて、86.5%の正確さを与えた(表3)。本発明者らのデータでは、MLPはSLPと同様な一般化性能を示し、分類の正確さは86.5%であった(表3)。TBのデータセット対対照のデータセット(表2)において、ADTree及びC4.5選別機は、それぞれ、92.3%と91.0%の正確さに達した(表3)が、このような一般化レベルに達するには、AdaBoost増強に依存した(Witten及びFrank、2000年)(表3)。本発明者らは、ADTree及びC4.5選別機に関して、AdaBoostを100回反復して用い、C5.0選別機の非市販型に関しては、最高10回反復して増強した。
ガウスカーネルサポートベクターマシン(Boserら、1992年;Vapnik、1998年;Cristianini及びShawe−Taylor、2000年)(SVM、表3)は、93.5%の感受性及び94.9%の特異性(全体的な正確さは94.2%)を有する、TB群と対照群との間の最良の識別装置である。試験セット中、5つのTBサンプル及び4つの対照サンプルが間違って分類された。このSVM選別機は、ROCスペースの凸閉包を規定し、最良の正確さを達成する。
スペクトルのセット全体(訓練及び試験の双方)に対して、10倍交差妥当化の実施によるSVMの一般化性能のさらなる試験を適用し、正確さに関して最適化した場合、93.1±3.8%の正確さ、94.4±4.5%の感受性及び91.8±8.8%の特異性を得た。本発明者らはまた、訓練事例:試験事例の比率を、90:10から50:50に変えることによって、SVMの一般化性能を評価した。80:20のセットでは、90%超の正確さ、感受性及び特異性の値が得られた。SVMのロバストネスをさらに、0.96の曲線下面積(AUC)を有するROC曲線に示されるように、100のランダムに作出した80:20のセットにおける平均性能によって確認した。図5は、10倍トレーン交差妥当化試験を用いた平均ROCを示している。図5aでは、カーネルパラメーターは感受性のみについて選択され、図5bでは、カーネルパラメーターは、特異性基準について選択されている。
対照群を意図的に異種起源としたが、当該選別機は、TBに罹患している患者(スミア陰性とスミア陽性の双方)と感染性及び非感染性の炎症状態の種類に罹患している患者との間を正確に識別する。これらの結果は、TBがプロテオミックな識別特性をベースにした診断アプローチで調べることができることを示している。サンプルの採集、取り扱い又はスペクトル生成に関連したアーチファクトにより、偽の分類を生じさせる可能性はある。しかし、6カ月間にわたってTB患者と対照対象のサンプル処理を分散させ、4つの異なる地域からのサンプルを使用し、HIV血清状態を変化させたことから、患者と対照対象との間の体系的な偏りの可能性はきわめて低くされている。質量スペクトルの再現性の目安として、6カ月間にわたる種々の時点で操作された28の汎発対照スペクトルが、10倍交差妥当化で得られたSVM選別機により対照対象として正しく分類された。呼吸器の症状を呈する患者におけるTBの罹患率がおよそ10%である臨床集団において、本発明者らの最良の選別機に関する陽性及び陰性の予測値は、それぞれ、67%と99%となるであろう。この診断正確性は、他の入手可能な診断オプションの診断正確性に優っている。
(実施例3)
マーカーの選択
しかしながら、SELDI法が報知的な識別特性を構成するタンパク質の同一性について先立つ仮定をしないTBに対する診断試験を提供できる一方、コスト及び複雑さによって、その広範な一般的使用が妨げられることがあり得る。したがって、本発明者らは、独立して報知的なピークを検出するために、相関フィルター法を適用することによって、さらなる評価のための報知的ピーク集団のサブセットを選択した(Guyon及びEliseeff、2003年)。最高陽性の10の質量集団、最高陰性の10の質量集団、ピヤソン相関係数を評価した。これらのマーカーのm/z値は、下表に示されている。
Figure 2008545960
選択された20の質量集団の識別力を試験するために、本発明者らはまず、各質量を1つおきに対にして(400対)、SVM選別機にTB患者を診断させる訓練をした。結果は表4に示されている。正確さによって一般化性能を評価し、選択された質量集団の20対(5%)、並びに、これらの負の相関及び正の相関の質量集団組合せのうちの17が80%超の正確さを与えることを示した。感受性及び特異性が、それぞれ、95%と85%超に達した質量集団の対はなく、良好な一般化は、2つ超の質量ピークの組合せに依存することが確認された。第2に、丁度20の相関選択された質量集団によって訓練されたSVMは、独立試験セットにおいて、89.7%の正確さを達成し、これらの集団が最も関連性のある識別情報を含むことを示した。残りのピーク集団(n=199)は、許容できる診断正確性(85.9%)ではあったが、下位を保っている。本発明者らは、種々の質量集団セットを用いて、ROCスペースにおけるSVMsの一般化性能をまとめた。ROC凸閉包は、2つの選別機によって規定される。最高の特異性は、正に相関しているすべてのピークマイナス10(即ち、合計209)で得られ、負の相関ピークにおける情報値が確認された。他の最適選別機は、質量集団の10の正の相関サブセット及び10の負の相関サブセットのみを使用した後に得られた。
(実施例4)
マーカーの同定
トリプシン消化後、高分解能質量分光器を用いて、本発明者らは、11.5kDaの「陽性」マーカー及び13.7kDaの「陰性」マーカーを、それぞれ、血清アミロイドA1(SAA1)のdes−アルギニン変異体及びトランスシレチンとして同定した。興味深いことに、ピヤソン相関分析によって選択され、プロテオミックな識別特性のSVM分類によって確認されたこれらのペプチドは、TBにおける病態生理学的過程にすでに独立して関連していた。SAAは、高密度リポタンパク質(HDL)の循環(Kiernanら、2003年)及び脂質輸送の調整並びに免疫応答に関連した急性相タンパク質である。それは、反応性アミロイドーシスにおける前駆体タンパク質であり、一部の個体において慢性TBを複雑化させ、また、結核などのいくつかの炎症状態における疾患活性のマーカーである(Salazarら、2001年)。トランスシレチンは、血清中、55kDaのホモテトラマーであり、チロキシン及びトリ−ヨードチロニン、並びにレチノール結合タンパク質との結合を介したビタミンA(レチノール又はトランスレチノイン酸)の主要なトランスポーターである(Peterson、1971年)。レチノイン酸は、単球の分化を刺激し、ヒトマクロファージにおける結核菌の増殖を阻害する(Crowleら、1989年)。トランスシレチンの減少及びC反応性タンパク質濃度の上昇とビタミンAの低濃度が相関していることが、TBに罹患している患者において報告されている(Hanekomら、1997年;Koyanagiら、2004年)。
(実施例5)
免疫アッセイ試験並びに監視付き機械学習分類
プロテオミックな識別特性から慣例的な試験様式へ翻訳するために、すべての対象において免疫アッセイにより血清SAA及びトランスシレチンを定量化した。双方のペプチドとも炎症のマーカーであるため、TBにおける疾患活性をモニターするために以前使用された(Hospら、1997年)C反応性タンパク質(CRP)及びネオプテリンもまた測定した。次いで、これら4種のマーカーに関して多名のガウスカーナルSVMsをパラメーター化した。ガウスSVMsを用いて、4つの最良の選別機を得た。トランスシレチン、CRP及びネオプテリン値によって訓練されたSVM選別機は、TB患者を対照患者から、84%の正確さで(82%の感受性、86%の特異性)識別した。他の最適化された選別機はトランスシレチンを含み、トランスシレチン及びネオプテリンを用いたSAA及びCRPによるものであった。元の識別特性に追加のマーカーを含めることにより、免疫アッセイベースの分類の正確さが改善される可能性が高い。
トランスシレチンの切断形態は、卵巣癌に対するプロテオミックなフィンガープリント試験における陰性マーカーであり(Zhangら、2004年)SAAは、重症急性呼吸器症候群(SARS)における陽性マーカーであり(Renら、2004年)、鼻咽頭癌における再発を示す(Choら、2004年)。単一のタンパク質マーカーは、TBの診断において正確さが不十分であり得るが、SVMなどの機械学習方法と合せたプロテオーム誘導分析は、現行の標準的方法より優れた正確さを達成し得る。これらの所見により、個々の診断特異性の低いマーカーが特定の組合せで使用されると診断成果が増強され得ることが示唆される。いくつかの場合、一般的な血漿タンパク質の切断化又は断片化誘導体が、いくつかの疾患のより特異的マーカーであり得、限定された疾患状態に特徴的なタンパク質分解酵素の誘導によって生じ得る(Tolsonら、2004年)。プロテオミックな識別特性から免疫アッセイに翻訳する際の高い診断正確性の保持、及び同定されたバイオマーカーの生物学的妥当性により、TB診断に対するSVM選別機の価値が確立され、血清学的試験のための強力な基礎が提供されている。パーソナルコンピュータに訓練されたSVM選別機を備えることにより、免疫アッセイ(又は、入手可能な場合は、SELDIプロテオミック分析)を用いてTBの診断を補助する機会が提供される。次いで、これらの試験を、TBの長期的試験及び喀痰陰性TB、肺外の事例及び小児科感染症などの他の診断困難な範囲に適用することができる。
(実施例6)
材料及び方法
血清の採集及び保存。血清サンプル(179)は、遡及的に確認された培養陽性TBの患者から採集した(表2)。ウガンダ及びガンビアで採集されたバンク血清は、World Health Organisation TB specimen bank(http://www.who.int/tdr/diseases/tb/specimen.htm)から入手し、他のものは、英国、ロンドンのSt.George’s Hospitalにおける入院及び外来施設でTBを呈する患者から予測的に採集した。他の炎症状態の範囲の対照患者からの血清サンプル(170)は、英国のSt.George’s Hospital、アンゴラ及びガンビアのthe Angotrip treatment centreで採集した。各々の場合に、地域の研究倫理委員会の方針に従って、十分なインフォームドコンセントを得た。臨床情報は、連結され、匿名化されたデータベースにおいて保管された。5mlの血液から、遠心分離により血清を分離し、サンプルを滅菌ガラス管中、室温で30分間、凝血させた。アリコート(100μl)を採集1時間以内に凍結させ(−80℃)、質量分析前、2回のみの凍結−解凍サイクルに供した。
質量分析のためのサンプル調製。サンプルを、以前記載されたとおり(Papadopoulosら、2004年)CM10タンパク質チップアレイ(Ciphergen、フレモント、カリフォルニア州、米国)に適用し、50%アセトニトリル、0.5%トリフルオロ酢酸中、シナピン酸の飽和溶液を、アレイ上の各スポットに2回適用し、各適用の間は風乾した。偏りを最小化するために、TB患者の血清と対照とは、同一のチップ上でアッセイした。
表面増強レーザー脱離イオン化飛行時間質量分析(SELDI−ToF MS)。200、220及び240のレーザー強度、高質量100kDa、検出器感度8及び焦点質量10kDaで、PBS−II質量分析器(Ciphergen、フリーモント、カリフォルニア州、米国)を用いて、飛行時間スペクトルを生じさせた。アレイ上の各スポットの位置20から80、デルタ4を、205、225又は245のレーザー強度で、2回のウォーミングショットで進行させ、1箇所当たり7ショットで分析した。各タンパク質チップアレイは、「汎用対照」サンプル(1個体からの1回の採集からアリコート化し、−80℃で保存)を含んだ。双方のスペクトル群(TB及び対照)とも6カ月間にわたって種々の機会に扱われたサンプルを含んだ。
ピークの同定。Ciphergenのオールインワンタンパク質及びペプチド検量体を用いて、スペクトルを毎週検量し、ベースライン減算後、2,000〜100,000にわたるm/z範囲において総イオン流に対して正規化した。各タンパク質に関して、200、220又は240のレーザー強度で生じた単一のスペクトルを選択して、以前に記載されたとおり(Papadopoulosら、2004年)全患者の平均の0.4〜0.6倍以内に総イオン流の偏差を最小化した。Biomarker Wizard型3.1を用いて、分子質量の0.6%以内の各スペクトル(「ピーク集団」)における対応するピークを同定した。シグナル対ノイズ比を、最初のパスでは10に設定し、第2のパスでは2に設定した。再現性を評価するために、25回操作した(6アッセイ)単一サンプル由来のスペクトルに関するピークサイズの変動係数は、15.6%(アッセイ内)及び24.4%(アッセイ間)であった。これらのデータは、以下のm/z値:5648、6203、6449、6647、8907、9213、9310、9370及び9419における9つの最高幅ピークに関する値を平均化することによって得られた。
タンパク質の同定。50μlの結合緩衝液(50mMのトリス−HCl pH9.0中、1:9希釈した変性緩衝液)に希釈した30μlの変性緩衝液により、血清(20μl)を氷上で(20分)インキュベートし、その後さらに30分、氷上でインキュベートした。最初はトリス(50mM、pH9)、その後結合緩衝液中で予備平衡化したQ Ceramic HyperD スピンカラム(Ciphergen、20分)に適用した。11.5kDa及び13.7kDaのバイオマーカー双方が、スピンカラムから溶出緩衝液(50mMのクエン酸Na、0.1%オクチルグルコピラノシド、pH3)中に溶出し、選択的濃縮化は、未分画血清に関する上記の条件下でCM10タンパク質チップアレイに適用した溶出物サンプルのSELDI−ToF MS分析によって確認した。
該バイオマーカーは、1D SDS−PAGE(NuPAGE、4〜12%のBis−トリス、Invitrogen)により単離し、クーマシーブルーで染色し、ゲルから切り出した。該ゲル片を重炭酸アンモニウム(50mM)とアセトニトリル(50%)の混合液中、3回洗浄し、アセトニトリル(100%)中、脱水し、乾燥した。
アセトニトリル(10%)及び重炭酸アンモニウム(25mM)中、トリプシン(20ng/μl)の添加により、タンパク質をゲル内消化(15分、室温)に供した後、重炭酸アンモニウム(25mM)中、4時間、最終インキュベーションに供した。
マトリックスとして20%α−シアノ−4−ヒドロキシ−桂皮酸(CHCA)を用いて、MALDI−ToF MSにより、該消化物のペプチド質量フィンガープリント(PMFs)を分析した。ゲル内トリプシン消化の結果を、ゲルから該タンパク質受動溶出後のトリプシン消化により実証した。
MASCOTデータベースを識別するためにPMFsを用い、ある場合には血清アミロイドA1(SAA1)由来、他の場合にはトランスシレチン由来としてペプチドを同定した。トランスシレチンとして同定されたタンパク質に関する質量スペクトル(13.7kDa)で見られた分子量は、このタンパク質の理論値(13.76kDa)に密接に相当した。しかし、SAA1に関して見られたもの(11.52kDa)は、その理論値(11.68kDa)より156Da低く、このタンパク質がSAA1変異体であることを示唆していた。
この変異体の性質を調べるために、トリプシン消化物をより詳細に分析し、SAA1の完全アミノ酸配列から予測されたトリプシンペプチドに相当しないm/z1551におけるペプチドを含むことを見出した。しかし、それは、N末端のアルギニンの欠失から生じたと考えられる2〜15のペプチド(SFFSFLGEAFDGAR)には相当した。
バイオマーカーの免疫定量化。検出に用いられた各マーカー及び抗体タイプに関する下限検出は、以下のとおりであった:粒子増強ヒツジ抗SAAでは0.7mg/lSAA、ヤギ抗CRPでは、1mg/l、ヤギ抗トランスシレチンでは、0.05g/lトランスシレチン、及びウサギ抗ネオプテリンでは、1.5nmol/lネオプテリン。ネオプテリンは、Triturus分析装置(Grifols UK社)において、キット(ELItest Neopterin、B.R.A.H.M.S、アクチーンゲゼルシャフト、ドイツ国)を用い、競合的ELISAによって測定した。C反応性タンパク質、トランスシレチンの測定(Beckmann Immage800分析装置、Beckman Coulter UK社)及び血清アミロイドAの測定(N latex SAA、BNII分析装置、Dade−Behring、マールブルグ、ドイツ国)には、比率比濁分析を用いた。SAAアッセイに用いられた抗体は、総SAAを検出する。ELISAsからの値は、SVM分類実験に使用する前に、0〜1の範囲に等級化し、可能なすべての組合せを特徴スペースとして用いた。
監視付き機械学習。データセットDは、入力ベクトル、X(即ち、カテゴリーの典型)のサンプルとそれらに対応する出力ラベル、Y,D=[X,Y]のサンプルによって表される。サンプル入力ベクトルはxによって表される。i番目のサンプルの質量スペクトルは、n次元(質量集団の数)のベクトルxと関連クラスラベルのy(TBでは+1、対照では−1)として表され、式中、i=1,...,m及びmはサンプルの数である。スペクトルのベクトル要素は、xi,kによって表され、式中、i=1,...,mであり、k=1,...,nである。サンプルクラスラベルyの選別機予測は、
Figure 2008545960

として表される。
監視付き学習演算法の課題は、訓練データと称される、実施例の入力/出力対のセットに関する正しいラベル割り当てのできる決定関数を見出すことである。未知のサンプル(試験データ)に関する正しいラベルを予測する決定関数の能力は、その一般化として知られている。現行のSVMなどの機械学習法は、この性質の最適化を目指している。選別機の一般化は、性能を最適化するために選択しなければならないパラメーターセット(モデル)に依存している。この目的のために、本発明者らは、ある範囲のパラメーター値が打ち切られ、交差妥当化を用いて試験されるグリッド探索法を採用した。
サポートベクターマシン(SVM)は、その入力を高い、又はさらに無限の次元特徴スペースにマップ化する(Vapnikら、1998年;Aronszajn、1950年)。次いで、SVMの出力は、特徴スペースにおいてマップ化された入力の線形閾値化関数であるが、これは、元の入力空間では非線形であり得る。マッピングは、使用者選択再生カーネル関数K(x,x’)によって達成され、式中、x及びx’は入力ベクトルである。カーネル関数は、マーサー条件(Joachims、1999年)を満たさなければならない。カーネルのよく知られた例としては、ガウスの
Figure 2008545960

が挙げられ、式中、パラメーターσは幅を決定し;ポリノミナルK(x,x’)=(x・x’)であり、式中、dは次数を決定する。d=1の場合、線形カーネルと呼ばれ、入力データのアイデンティティーマップに対応する。訓練されたSVM選別機は、
Figure 2008545960

の形態を有し、訓練により、α及びbの値が決定する。典型的には、αの多くはゼロである。非ゼロのものは「サポートベクター」と呼ばれ、変換特徴スペースにおける分離超平面を規定するために用いられる。SVMの訓練は、多層パーセプトロンとは異なり、局所最小に供されないコンベックス(二次)最適化問題である。SVMを訓練するために入手できる多くのパッケージがあり;SVMlight(Rosenblatt、1962年)が用いられ、特に、データに雑音がある場合に実用可能なソフト限界SVMsが訓練される。この場合、該演算により、間違って分類された実施例の距離は、ソフト限界パラメーターと呼ばれるペナルティー値、Cを調節することで、限界まで最小化される。
本発明者らは2つの交差妥当化方式を用いた。k倍交差妥当化では、訓練セットを、等しく分散された陽性事例及び陰性事例のk群に、ランダムに分割する。選別機をk−1で訓練し、その一般化性能を、残りの群で妥当化する。この処理をk回反復し、各々の回で異なる検証サブセットが提供されるが、その平均が全体的な一般化を表す。第2の方式、試験によるk倍交差妥当化では、データはまず、訓練セットと試験セットにランダムに分割される。k倍交差妥当化を訓練セットで行い、一般化は未知の試験セットで得られる。
選別機の一般化性能は、試験セットにおいて、正しく分類された(真の陽性、TP及び真の陰性、TN)並びに間違って分類された(偽陽性、FP及び偽陰性、FN)事例の数を考慮することによって評価した。感受性(se)は、真の陽性の条件付き確率、se=TP/(TP+FN)として、特異性(sp)は、真の陰性の条件付き確率、sp=TN/(TN+FP)として、正確さ(ac)は、正しい分類の比率、ac=(TP+TN)/(TP+FP+TN+FN)として定義した。選別機の真の陽性比(se)及び偽陽性比(1−sp)によって表された選別機の性能は、レシーバーオペレーター曲線(ROC)スペースにプロットできる。
各セットに、TB患者と対照の同様な数、並びに同様な年齢と性別の表示を有する独立した訓練セットと試験セットを作出した(表1)。これらのセットを用いて、単層パーセプトロン(SLP)(McClelland及びRumellhart、1986年)、多層パーセプトロン(MLP)(Quinlanら、1993年)、ツリー選別機(Freund及びMason、1999年;Freund及びSchapire、1996年及びWitten及びFrank、2000年)及びサポートベクターマシンなどのいくつかの監視付き機械学習法の一般化性能を評価した(表3)。
選別機の一般化能力のロバスト予測を提供するために、試験による10倍交差妥当化を実施した。まず、訓練セット:試験セットが80:20である100セットを、データセット全体において置換することなく、ランダムなサンプリングによって作出した。80:20の訓練セット:試験セットの各々に10倍交差妥当化を実施し、最良の性能を有するパラメーターを選択する。10のサブセットすべてにわたって最良のパラメーターでSVMを再訓練し、最終的な性能を試験セットで評価する。これらの実験では、標準偏差を有する平均曲線を示すために、各ROC曲線を補整し、サンプリングし、平均化する。
質量ピーク集団の選択。ピークをそれらの識別力に関して等級付けするために、ピヤソン相関係数を用いた。ピヤソン相関係数は、
Figure 2008545960

として定義され、式中、Xは、サンプル入力ベクトルxのk番目の成分に相当するランダムな変数であり、Yは、出力ラベルのランダムな変数である。
R(k)の予測は、
Figure 2008545960

によって与えられ、式中、xi,kはサンプルiの質量集団kのm/z値に相当し、yはサンプルiのクラスラベルであり、mはサンプルの数である。R(i)は、変数の有意性を評価するための試験統計値であり得、それはt検定に関連する。訓練セットにわたって、各質量集団の値と対応するクラスラベルとの間で
Figure 2008545960

を算出した(表1)。次いで、正及び負に相関した質量集団を等級付けするために、
Figure 2008545960

を用いた。このアプローチを用いて、最高に正の、及び最高に負の相関係数を有する10の質量集団を選択した。選別機によって見出された決定境界及び特徴スペースにおける識別質量集団対は、図2a(緑色線)に示されている。
ソフトウェア。本発明者らは、サポートベクターマシンSVMlightのチャンキング及び分解実行を用いた。デシジョンツリー演算、増強及びMLPのために、Knowledge Analysis(WEKA)に関するWaikato Environmentを用いた。実験フレームワークは、MATLAB及びJava(登録商標)においてコード化された。カスタムで再使用可能な目標指向型データベースを、ObjectDBを用いて作出し、実験フレームワークにインターフェースさせた。SVMlightに対するMATLABインターフェースは、http://www.igi.tugraz.at/aschwaig/software.html.から入手した。
(実施例7)
SELDI−ToF/MSにより同定されたマーカーの同一性の割り当て
結核に罹患している患者の血清を、正常な個体の血清から識別することのできるものとして、SELDI−Tof/MSにより同定されたタンパク質バイオマーカーに同一性を割り当てるために、TBに罹患している20人の患者からの血清のプール及び20人の健康な対照からの血清の第2のプールを作出した。これらを2Dゲル電気泳動により分離した。バイオマーカーのSELDIピーク質量を2Dゲル内のタンパク質スポット質量にマッチさせるために、各スポットが切り出された第2の2Dゲルを操作し、そこからタンパク質を受動溶出させて完全長タンパク質の溶液を生成させた。完全長タンパク質の溶液をSELDI−Tof/MSにより分析し、単一ピークを有するスペクトルを生じさせた。次いで、この質量を、元のSELDI−ToF/MSバイオマーカー質量リストと比較した。2つのSELDI−ToF/MS質量間のマッチによって、そのゲルスポットは、SELDI−Tof/MSバイオマーカーピークに相当するものとして同定される。
マッチする2Dゲルからのゲルスポットを取り出し、トリプシンでゲル内消化して、そのタンパク質診断用のペプチド混合物を生じさせる。次いで、この混合物を、LC/MS/MSにより分析して、ゲノムデータベースのBLAST探索に基づいた同一性の高確率予測を与えた。
表5に示されるように、この方法で3つのバイオマーカーが明確に同定された。18394のm/z値を有するTBマーカーは、血清アルブミン前駆体であり、11454のm/z値を有するTBマーカーは、Apo−A1であり、13774のm/z値を有するTBマーカーは、トランスシレチンである。
(実施例8)
さらなるマーカーの同定
TB患者及び対照対象からの血清タンパク質を含有する2Dゲルの分析により、SELDI−ToFによって同定されたマーカーに対応すると思われないいくつかのタンパク質は、TB血清と対照対象の血清とでは差異的に存在することが判明した。該タンパク質スポットを取り出し、トリプシンでゲル内消化し、そのタンパク質診断用のペプチド混合物を生じさせることによって、該タンパク質を同定した。次いで、この混合物を、LC/MS/MSにより分析して、ゲノムデータベースのBLAST探索に基づいた同一性の高確率予測を与えた。同定されたさらなるマーカーは、アポリポタンパク質−A2、ヘモグロビンベータ、ハプトグロビンタンパク質、DEPドメインタンパク質、ロイシンリッチアルファ−2−糖タンパク質(A2GL又はLRG1)及び仮想タンパク質DFKZp667I032であった。
この分析の結果は、表6に示されている。表6から分かるように、トランスシレチンは、対照ゲルとTBゲルの双方から同定された。しかし、トランスシレチンは、対照ゲルに比較して、TBゲルでの発現は低レベルであり、トランスシレチンはTBの陰性マーカーであることが確認された。同様に、Apo−A2の発現は、対照ゲルに比較して、TBゲルではより低いので、Apo−A2は、TBの陰性マーカーである。同様に、ハプトグロビン及びヘモグロビンベータは双方とも、対照ゲルに比較して、TBゲルでの発現はより低レベルであるので、TBの陰性マーカーである。一方、A2GL(LRG1)及びDEPドメインタンパク質は、対照ゲルに比較して、TBゲルではアップレギュレートするので、TBの陽性マーカーである。
仮想タンパク質DFKZp667I032は、対照ゲルにのみ見られたので、TBの陰性マーカーである。
(参考文献)
Figure 2008545960
Figure 2008545960
Figure 2008545960
Figure 2008545960
Figure 2008545960
Figure 2008545960
Figure 2008545960
Figure 2008545960
Figure 2008545960

太字は、該タンパク質スポットが他のゲルにおける等価なスポットよりも強かったことを表している。
イタリック文字は、該タンパク質スポットが他のゲルにおける等価なスポットよりも弱かったことを表している。
機械学習選別機を訓練する方法のフローチャートを示す図である。 訓練された機械学習選別機を試験する方法のフローチャートを示す図である。 訓練された機械学習選別機を用いて、対象がTBに罹患しているか否かを判定する方法のフローチャートを示す図である。 選別機(表3のSVM_1)のガウスカーネルシグマ値のパラメーター化を示す図であり、ガウスSVMは、すべての質量ピーク集団を用いて、最初の訓練セット(表2)によって訓練し(パラメーター選択に関しては10倍交差妥当化)、次いで、最初の試験セット(表2)で、選別機の性能を評価した図である。 10倍訓練交差妥当化試験を用いて平均化したROCを示す図であり、訓練:試験比(80:20)で、100のランダムに選択した訓練セット及び試験セットを作出し、パラメーターは、訓練セットで10倍交差妥当化を用いて選択し、性能は対応する試験セットで得た図である。a)上部の線は、カーネルパラメーターが感受性基準に基づいて選択される場合に得られた選別機の平均ROC曲線を示す。b)上部の線は、カーネルパラメーターが特異性基準に基づいて選択される場合に得られた選別機の平均ROC曲線を示す。

Claims (46)

  1. (i)対象における2種以上のマーカーであって、前記マーカーの少なくとも2種が、トランスシレチン、ネオプテリン、C−反応性タンパク質(CRP)、血清アミロイドA(SAA)、血清アルブミン、アポリオポタンパク質−A1(Apo−A1)、アポリポタンパク質−A2(Apo−A2)、ヘモグロビンベータ、ハプトグロビンタンパク質、DEPドメインタンパク質、ロイシンリッチアルファ−2−糖タンパク質(A2GL)及び仮想タンパク質DFKZp667I032から選択されるマーカーの発現データを提供すること;並びに
    (ii)前記発現データを、TB以外の炎症性状態に罹患している患者を含む対照患者の群からの前記マーカーの発現データと比較し、それによって、前記試験対象がTBに罹患しているかどうかを判定すること
    を含む、試験対象における結核(TB)を診断する方法。
  2. 前記対照対象の群が、呼吸器感染症に罹患している患者、サルコイドーシスに罹患している患者、炎症性腸疾患に罹患している患者、マラリアに罹患している患者、ヒトアフリカトリパノソーマ症(HAT)に罹患している患者、神経系疾患に罹患している患者、自己免疫疾患に罹患している患者、骨髄腫に罹患している患者及び健康対象のうちの2種以上から選択される、請求項1記載の方法。
  3. (i)対象における2種以上のマーカーであって、前記マーカーの少なくとも2種が、トランスシレチン、ネオプテリン、C−反応性タンパク質(CRP)、血清アミロイドA(SAA)、血清アルブミン、アポリオポタンパク質−A1(Apo−A1)、アポリポタンパク質−A2(Apo−A2)、ヘモグロビンベータ、ハプトグロビンタンパク質、DEPドメインタンパク質、ロイシンリッチアルファ−2−糖タンパク質(A2GL)及び仮想タンパク質DFKZp667I032から選択されるマーカーの発現データを提供すること;並びに
    (ii)前記マーカーの発現がTBを示しているかどうかを判定すること
    を含む、結核(TB)を診断する方法。
  4. 前記マーカーの1種がトランスシレチンである、請求項1〜3のいずれか一項に記載の方法。
  5. 前記マーカーが、トランスシレチン、CRP及びネオプテリンを含む、請求項1〜4のいずれか一項に記載の方法。
  6. ステップ(ii)がコンピュータシステムを用いて実施される、請求項1〜5のいずれか一項に記載の方法。
  7. 前記コンピュータシステムが、訓練された機械学習選別機によりプログラムされる、請求項6記載の方法。
  8. 前記機械学習選別機がサポートベクターマシン(SVM)である、請求項7記載の方法。
  9. ステップ(ii)が、前記対象における前記マーカーの発現を、対照対象における前記マーカーの発現と比較することを含む、請求項3記載の方法。
  10. 前記対照対象がTB以外の炎症性状態に罹患している患者である、請求項9記載の方法。
  11. 前記対照対象が、呼吸器感染症に罹患している患者、サルコイドーシスに罹患している患者、炎症性腸疾患に罹患している患者、マラリアに罹患している患者、ヒトアフリカトリパノソーマ症(HAT)に罹患している患者、神経系疾患に罹患している患者、自己免疫疾患に罹患している患者、骨髄腫に罹患している患者及び健康対象のうちの1種以上から選択される、請求項9又は10に記載の方法。
  12. ステップ(ii)が、前記対象における前記マーカーの発現を、TB患者における前記マーカーの発現と比較することを含む、請求項1〜11のいずれか一項に記載の方法。
  13. 前記TB患者が、結核菌の培養によって、TBに罹患していると診断された患者である、請求項12記載の方法。
  14. 1種以上のTB患者、及び/又は1種以上の対照対象がHIV陽性である、請求項12又は13に記載の方法。
  15. 前記マーカーが、トランスシレチン、ネオプテリン、CRP、SAA、血清アルブミン及びApo−A1の2種以上、並びにアポリポタンパク質−A2、ヘモグロビンベータ、ハプトグロビンタンパク質、DEPドメインタンパク質、A2GL及び仮想タンパク質DFKZp667I032の1種以上を含む、請求項1〜14のいずれか一項に記載の方法。
  16. 前記発現データが、表面上の前記マーカーの捕捉及び前記捕捉されたマーカーの検出によって得られる、請求項1〜15のいずれか一項に記載の方法。
  17. 前記表面が表面増強レーザー脱離及びイオン化(SELDI)プローブであり、前記検出が、SELDI−飛行時間型質量分析(SELDI−ToF MS)によるものである、請求項16記載の方法。
  18. 前記マーカーが、約M18394_9、約M8952_75、約M11720_0、約M11454_1、約M18591_2、約M11488_1、約M9076_68、約M8895_13及び約M10856_8のm/z値を有する正相関するマーカーの1種以上及び/又は約M4100_03、約M3898_52、約M13972_1、約M3322_01、約M2956_45、約M5644_96、約M3939_63、約M4056_39及び約M6649_74のm/z値を有する負相関するマーカーの1種以上を含む、請求項17記載の方法。
  19. 前記マーカーが、前記正相関するマーカーのすべて及び/又は前記負に関連するマーカーのすべてを含む、請求項18記載の方法。
  20. 前記表面が前記マーカーに対する特異的結合試薬を含み、前記検出が免疫アッセイによるものである、請求項16記載の方法。
  21. (i)対象における2種以上のマーカーの発現データを入力すること;及び
    (ii)訓練されたサポートベクターマシン(SVM)によってプログラムされたコンピュータシステムを用いて前記マーカーの発現がTBを示しているかどうかを判定すること、
    を含み、それによって、前記患者がTBに罹患しているかどうかを診断する、コンピュータにより実施されるTBを診断する方法。
  22. 結核菌の培養によりTBに罹患していると診断された患者、並びに呼吸器感染症に罹患している患者、サルコイドーシスに罹患している患者、炎症性腸疾患に罹患している患者、マラリアに罹患している患者、ヒトアフリカトリパノソーマ症(HAT)に罹患している患者、神経系疾患に罹患している患者、自己免疫疾患に罹患している患者、骨髄腫に罹患している患者及び健康対象のうちの1種以上から選択された対照対象から得られたデータを用いて前記SVMが訓練された、請求項21記載の方法。
  23. (i)(a)結核(TB)患者の第1のセットの各々における2種以上のマーカーに関する訓練データ;及び
    (b)対照対象の第1のセットの各々における2種以上のマーカーに関する訓練データ、
    を含む訓練データを提供すること;
    (ii)TB患者の訓練データを、対照対象の訓練データから識別するためにサポートベクターマシン(SVM)を使用すること、
    を含み、そのことにより、TBを診断するためにSVMを訓練する、TBを診断するためにSVM選別機を訓練する方法。
  24. (iii)(a)TB患者の第2のセットの各々における前記2種以上のマーカーに関する試験データ;及び
    (b)対照対象の第2のセットの各々における前記2種以上のマーカーに関する試験データ、
    を含む試験データを提供すること;
    (iv)TB患者の試験データを、対照対象の試験データから正しく識別するためにSVMの能力を判定すること、
    をさらに含む、請求項23記載の方法。
  25. 前記対照対象が、呼吸器感染症に罹患している患者、サルコイドーシスに罹患している患者、炎症性腸疾患に罹患している患者、マラリアに罹患している患者、ヒトアフリカトリパノソーマ症(HAT)に罹患している患者、神経系疾患に罹患している患者、自己免疫疾患に罹患している患者、骨髄腫に罹患している患者及び健康対象のうちの1種以上から選択される、請求項23又は24に記載の方法。
  26. 前記訓練データ及び前記試験データがSELDI解析によって得られる、請求項23〜25のいずれか一項に記載の方法。
  27. 前記訓練データ及び前記試験データが免疫アッセイ分析によって得られる、請求項23〜25のいずれか一項に記載の方法。
  28. 前記マーカーの少なくとも1種が、CRP、ネオプテリン、SAA、トランスシレチン、血清アルブミン及びApo−A1から選択される、請求項23〜27のいずれか一項に記載の方法。
  29. 前記マーカーが、CRP、トランスシレチン及びネオプテリンを含む、請求項28記載の方法。
  30. 前記マーカーの少なくとも1種が、Apo−A2、ヘモグロビンベータ、ハプトグロビンタンパク質、DEPドメインタンパク質、A2GL及び仮想タンパク質DFKZp667I032から選択される、請求項23〜29のいずれか一項に記載の方法。
  31. (i)対象のサンプル中の2種以上のマーカーの発現データを受け入れる手段;
    (ii)前記データがTBを示しているかどうかを判定するモジュールであって、TB患者のデータを、対照対象のデータから識別することのできる訓練された機械学習選別機を含むモジュール;及び
    (iii)前記判定の結果を表示する手段、
    を含む、請求項21〜30のいずれか一項に記載の方法を実施するように構成された装置。
  32. パーソナルコンピュータである、請求項31記載の装置。
  33. コンピュータシステムによって実行可能なコンピュータプログラムであって、前記コンピュータシステムによる実行の際、前記コンピュータシステムに、請求項21〜30のいずれか一項に記載の方法を実施させることのできるコンピュータプログラム。
  34. 請求項33記載のコンピュータプログラムを有するコンピュータシステムによって読取り可能な形態において保存する保存媒体。
  35. (i)2種以上のマーカーを検出するための手段;及び
    (ii)請求項34に記載の保存媒体、
    を含む、TBを診断するためのキット。
  36. (i)2種以上のマーカーを検出するための手段;
    (ii)請求項31又は32に記載の装置に、前記マーカーの検出に関連するデータを入力するための使用説明書、
    を含む、TBを診断するためのキット。
  37. 前記マーカーが、トランスシレチン、ネオプテリン、CRP、SAA、血清アルブミン及びApo−A1、Apo−A2、ヘモグロビンベータ、ハプトグロビンタンパク質、DEPドメインタンパク質、A2GL及び仮想タンパク質DFKZp667I032から選択される、請求項35又は36に記載のキット。
  38. (i)トランスシレチン、ネオプテリン、C−反応性タンパク質(CRP)、血清アミロイドA(SAA)、血清アルブミン、アポリオポタンパク質−A1(Apo−A1)、アポリポタンパク質−A2(Apo−A2)、ヘモグロビンベータ、ハプトグロビンタンパク質、DEPドメインタンパク質、ロイシンリッチアルファ−2−糖タンパク質(A2GL)及び仮想タンパク質DFKZp667I032から選択される2種以上のマーカーを検出するための手段
    を含む、TBを診断するためのキット。
  39. 2種以上のマーカーを検出するための前記手段が捕捉表面を含む、請求項35〜38のいずれか一項に記載のキット。
  40. 前記捕捉表面がタンパク質チップである、請求項39記載のキット。
  41. 前記捕捉表面が前記マーカーに対する特異的結合試薬を含む、請求項39又は40に記載のキット。
  42. 前記特異的結合試薬が抗体又は抗体断片である、請求項41記載のキット。
  43. 前記マーカーがトランスシレチン、ネオプテリン及びCRPである、請求項37〜42のいずれか一項に記載のキット。
  44. TBに罹患していると診断された患者に、TBの治療のための薬剤を投与することをさらに含む、請求項1〜30のいずれか一項に記載の方法。
  45. (i)試験薬剤を、トランスシレチン、ネオプテリン、CRP、SAA、血清アルブミン、Apo−A1、Apo−A2、ヘモグロビンベータ、ハプトグロビン、DEPドメインタンパク質又はA2GLに接触させること;及び
    (ii)試験薬剤が、前記トランスシレチン、ネオプテリン、CRP、SAA、血清アルブミン、Apo−A1、Apo−A2、ヘモグロビンベータ、ハプトグロビン、DEPドメインタンパク質又はA2GLの活性を調節するかどうかを判定すること、
    を含み、それによって、前記試験薬剤がTBの治療における使用に好適であるかどうかを判定する、TBを治療するための薬剤を同定する方法。
  46. (i)エクスビボ又はインビボで、細胞を結核菌及び試験薬剤に接触させること;
    (iii)トランスシレチン、ネオプテリン、CRP、SAA、血清アルブミン、Apo−A1、Apo−A2、ヘモグロビンベータ、ハプトグロビン、DEPドメインタンパク質及びA2GLから選択される1種以上のTBマーカーの発現をモニターすること;及び
    (iv)試験薬剤が前記1種以上の試験マーカーの発現を調節するかどうかを判定すること、
    を含み、それによって、前記試験薬剤がTBの治療における使用に好適であるかどうかを判定する、TBを治療するための薬剤を同定する方法。
JP2008512907A 2005-05-23 2006-05-23 結核の診断 Pending JP2008545960A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GBGB0510511.9A GB0510511D0 (en) 2005-05-23 2005-05-23 Diagnosis of tuberculosis
PCT/GB2006/001888 WO2006125973A2 (en) 2005-05-23 2006-05-23 Diagnosis of tuberculosis using gene expression marker analysis

Publications (1)

Publication Number Publication Date
JP2008545960A true JP2008545960A (ja) 2008-12-18

Family

ID=34834510

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008512907A Pending JP2008545960A (ja) 2005-05-23 2006-05-23 結核の診断

Country Status (5)

Country Link
US (1) US20090104602A1 (ja)
EP (1) EP1896848A2 (ja)
JP (1) JP2008545960A (ja)
GB (1) GB0510511D0 (ja)
WO (1) WO2006125973A2 (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011227838A (ja) * 2010-04-23 2011-11-10 Kyoto Univ 予測装置及びその学習装置並びにそれらのコンピュータプログラム
JP2013508687A (ja) * 2009-10-15 2013-03-07 クレッシェンド バイオサイエンス インコーポレイテッド 炎症性疾患活動性を測定およびモニタリングするためのバイオマーカーおよび方法
JP2013213774A (ja) * 2012-04-03 2013-10-17 National Institute Of Biomedical Innovation 結核検査用バイオマーカー
JP2015514227A (ja) * 2012-04-13 2015-05-18 ソマロジック・インコーポレーテッド 結核バイオマーカーおよびその使用
JP2015158473A (ja) * 2014-01-22 2015-09-03 国立研究開発法人医薬基盤・健康・栄養研究所 気道内炎症検査用バイオマーカー
JP2016515199A (ja) * 2013-02-28 2016-05-26 カプリオン プロテオミクス インコーポレーテッド 結核のバイオマーカー及びその使用
JP2017032588A (ja) * 2016-11-01 2017-02-09 国立研究開発法人医薬基盤・健康・栄養研究所 結核検査用バイオマーカー
US10718765B2 (en) 2014-04-02 2020-07-21 Crescendo Bioscience, Inc. Biomarkers and methods for measuring and monitoring juvenile idiopathic arthritis activity
US10983120B2 (en) 2015-09-29 2021-04-20 Crescendo Bioscience Methods for assessing response to inflammatory disease therapy withdrawal
WO2022039092A1 (ja) * 2020-08-17 2022-02-24 孝章 赤池 学習モデルの生成方法、プログラム、演算装置
US11493512B2 (en) 2014-06-10 2022-11-08 Laboratory Corporation Of America Holdings Biomarkers and methods for measuring and monitoring axial spondyloarthritis activity
US11656227B2 (en) 2015-09-29 2023-05-23 Crescendo Bioscience Biomarkers and methods for assessing psoriatic arthritis disease activity

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0701626D0 (en) * 2007-01-22 2007-03-07 Cambridge Entpr Ltd Methods and biomarkers for diagnosing and monitoring psychotic disorders
AU2008332886B2 (en) * 2007-12-05 2014-10-09 Spoton Clinical Diagnostics Limited Methods and compositions
US20110189694A1 (en) * 2008-10-22 2011-08-04 Biomarker Design Forschungs Gmbh Methods for detection and diagnosis of a bone or cartilage disorder
CA3013992A1 (en) * 2008-12-30 2010-07-08 Children's Medical Center Corporation Method of predicting acute appendicitis
US8738534B2 (en) * 2010-09-08 2014-05-27 Institut Telecom-Telecom Paristech Method for providing with a score an object, and decision-support system
US20120115244A1 (en) 2010-11-09 2012-05-10 Abbott Laboratories Materials and methods for immunoassay of pterins
WO2013112103A1 (en) * 2012-01-27 2013-08-01 Peas Institut Ab Method of detecting tuberculosis
US9702886B2 (en) 2012-05-24 2017-07-11 The Broad Institute, Inc. Methods and devices for tuberculosis diagnosis using biomarker profiles
GB201211158D0 (en) * 2012-06-22 2012-08-08 Univ Nottingham Trent Biomarkers and uses thereof
RU2016137685A (ru) * 2014-02-26 2018-03-29 Стелленбос Юниверсити Способ диагностики туберкулеза
KR101758862B1 (ko) * 2014-07-16 2017-07-19 사회복지법인 삼성생명공익재단 질량분석 기반 정량분석법을 이용한 아밀로이드 단백질의 아형 진단 방법
CN105372431A (zh) * 2014-08-15 2016-03-02 同济大学附属上海市肺科医院 一组结节病血清特异性标志蛋白及其检测试剂盒
CN104808003B (zh) * 2015-04-30 2016-05-18 李继承 肺结核疗效评价试剂盒及其应用
KR102633621B1 (ko) 2017-09-01 2024-02-05 벤 바이오사이언시스 코포레이션 진단 및 치료 모니터링용 바이오마커로서의 당펩티드의 식별 및 용도
WO2019173283A1 (en) 2018-03-05 2019-09-12 Marquette University Method and apparatus for non-invasive hemoglobin level prediction
CN113393902A (zh) * 2020-03-13 2021-09-14 珠海碳云智能科技有限公司 基于免疫表征技术对样本分类的方法、装置及存储介质
CN111366728A (zh) * 2020-03-27 2020-07-03 重庆探生科技有限公司 一种用于检测新型冠状病毒SARS-CoV-2的免疫层析试剂盒
US12094579B2 (en) * 2020-04-03 2024-09-17 Oregon State University Machine-learning method and apparatus to isolate chemical signatures
CN114778656B (zh) * 2022-03-29 2023-02-14 浙江苏可安药业有限公司 用于检测耐药性肺结核的血清代谢标志物及其试剂盒
CN115711933A (zh) * 2022-11-10 2023-02-24 广东省人民医院 检测试剂、检测试剂盒及其应用

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5270052A (en) * 1991-04-19 1993-12-14 New England Medical Center Hospitals, Inc. Methods and compositions for treatment of infection by intracellular parasites
US20030027216A1 (en) * 2001-07-02 2003-02-06 Kiernan Urban A. Analysis of proteins from biological fluids using mass spectrometric immunoassay
US7144708B2 (en) * 2001-06-25 2006-12-05 The Cleveland Clinic Foundation Markers of blood barrier disruption and methods of using same

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013508687A (ja) * 2009-10-15 2013-03-07 クレッシェンド バイオサイエンス インコーポレイテッド 炎症性疾患活動性を測定およびモニタリングするためのバイオマーカーおよび方法
US11300575B2 (en) 2009-10-15 2022-04-12 Laboratory Corporation Of America Holdings Biomarkers and methods for measuring and monitoring inflammatory disease activity
JP2011227838A (ja) * 2010-04-23 2011-11-10 Kyoto Univ 予測装置及びその学習装置並びにそれらのコンピュータプログラム
JP2013213774A (ja) * 2012-04-03 2013-10-17 National Institute Of Biomedical Innovation 結核検査用バイオマーカー
JP2015514227A (ja) * 2012-04-13 2015-05-18 ソマロジック・インコーポレーテッド 結核バイオマーカーおよびその使用
JP2016515199A (ja) * 2013-02-28 2016-05-26 カプリオン プロテオミクス インコーポレーテッド 結核のバイオマーカー及びその使用
JP2015158473A (ja) * 2014-01-22 2015-09-03 国立研究開発法人医薬基盤・健康・栄養研究所 気道内炎症検査用バイオマーカー
US10718765B2 (en) 2014-04-02 2020-07-21 Crescendo Bioscience, Inc. Biomarkers and methods for measuring and monitoring juvenile idiopathic arthritis activity
US11493512B2 (en) 2014-06-10 2022-11-08 Laboratory Corporation Of America Holdings Biomarkers and methods for measuring and monitoring axial spondyloarthritis activity
US10983120B2 (en) 2015-09-29 2021-04-20 Crescendo Bioscience Methods for assessing response to inflammatory disease therapy withdrawal
US11656227B2 (en) 2015-09-29 2023-05-23 Crescendo Bioscience Biomarkers and methods for assessing psoriatic arthritis disease activity
JP2017032588A (ja) * 2016-11-01 2017-02-09 国立研究開発法人医薬基盤・健康・栄養研究所 結核検査用バイオマーカー
WO2022039092A1 (ja) * 2020-08-17 2022-02-24 孝章 赤池 学習モデルの生成方法、プログラム、演算装置

Also Published As

Publication number Publication date
EP1896848A2 (en) 2008-03-12
WO2006125973A3 (en) 2007-01-18
US20090104602A1 (en) 2009-04-23
GB0510511D0 (en) 2005-06-29
WO2006125973A2 (en) 2006-11-30

Similar Documents

Publication Publication Date Title
JP2008545960A (ja) 結核の診断
US8389222B2 (en) Apolipoprotein fingerprinting technique and methods related thereto
De Seny et al. Discovery of new rheumatoid arthritis biomarkers using the surface‐enhanced laser desorption/ionization time‐of‐flight mass spectrometry ProteinChip approach
US20140038852A1 (en) Use of biomarkers for detecting ovarian cancer
EP2851688B1 (en) Use of glycoprotein C4BPA as marker for detecting pancreatic cancer
US20080086272A1 (en) Identification and use of biomarkers for the diagnosis and the prognosis of inflammatory diseases
CN101361001A (zh) 诊断肾病的方法和标志物
WO2017150681A1 (ja) シグナルペプチドを指標にした筋萎縮性側索硬化症の診断方法
US20220268776A1 (en) Biomarker panel for diagnosing pancreatic cancer and use thereof
US20060286602A1 (en) Method and markers for the diagnosis of renal diseases
Zhang et al. Preliminary characterizations of a serum biomarker for sarcoidosis by comparative proteomic approach with tandem-mass spectrometry in ethnic Han Chinese patients
JP2008537143A (ja) アルツハイマー病のためのバイオマーカーであるサポシンd及びfam3c
KR101384211B1 (ko) 췌장암 진단용 마커 및 이의 용도
Long et al. Pattern-based diagnosis and screening of differentially expressed serum proteins for rheumatoid arthritis by proteomic fingerprinting
Niu et al. Specific serum protein biomarkers of rheumatoid arthritis detected by MALDI-TOF-MS combined with magnetic beads
WO2017150680A1 (ja) シグナルペプチドを指標にしたアルツハイマー病の診断方法
US20060257946A1 (en) Serum biomarkers in ischaemic heart disease
Deng et al. Exploring Serological Classification Tree Model of Active Pulmonary Tuberculosis by Magnetic Beads Pretreatment and MALDI‐TOF MS Analysis
US8206986B2 (en) Methods for detecting Alzheimer's disease
US20050214760A1 (en) Biomarkers for detecting ovarian cancer
WO2009156747A2 (en) Assay
JP2024529555A (ja) Nmosd予測または再発モニタリングのためのバイオマーカーおよびその用途
Kienzl-Wagner et al. Proteomics in transplantation
WO2017157893A1 (en) Diagnosis of urogenital tract infections
CN115219727A (zh) 与库欣综合征诊断相关的代谢物