(発明の要約)
本発明は部分的に、肺がんを患っていることが疑われる被験者中の肺がんの検出において補助するための、迅速で感度のよい方法が、バイオマーカーおよびバイオマーカーとバイオメトリックパラメーターの特定の組合せに基づきうるという発見に基づく。
1つの態様において、本方法には、
a.被験者より試験試料を得る段階
b.試験試料中、パネル中の1つ以上のバイオマーカーの量を定量する段階、
c.前記バイオマーカーに対して、所定のカットオフと、パネル中の各バイオマーカーの量を比較し、前記比較に基づいた各バイオマーカーに対するスコアを割り当てる段階、
d.段階cにおいて決定された各バイオマーカーに対する割り当てられたスコアを比較して、前記被験者に関する総スコアを見つけ出す段階、
e.段階dにて決定された総スコアを、所定の総スコアと比較する段階、および
f.前記被験者が総スコアに基づく肺がんの危険性を有するかどうか決定する段階、
が含まれうる。
上記方法において、肺がんに関連するバイオマーカーのDFIは、好ましくは約0.4未満である。
場合により、上記方法はさらに、被験者より少なくとも1つのバイオメトリックパラメーターを得る段階を含み得る。得ることが可能なバイオメトリックパラメーターの例は、被験者の喫煙歴である。上記方法がさらに、被験者から少なくとも1つのバイオメトリックパラメーターを得る段階を含む場合、本方法にはさらに、少なくとも1つのバイオメトリックパラメーターを、各前記バイオメトリックパラメーターに対する所定のカットオフに対して比較する段階、および前記比較に基づいた各バイオメトリックパラメーターに対してスコアを割り当てる段階、各バイオメトリックパラメーターに対する割り当てられたスコアを、段階cにて定量した各バイオマーカーに対する割り当てられたスコアと統合して、段階dでの前記被験者に対する総スコアを見つけ出す段階、総スコアを、段階eでの所定の総スコアと比較する段階、および前記被験者が、段階f中の総スコアに基づいて、肺がんの危険性を有するかどうかを決定する段階、が含まれうる。
上記方法にて定量可能なバイオマーカーの例には、抗体、抗原および関心領域の群から選択される1つ以上のバイオマーカーがあげられる。より具体的には、定量可能なバイオマーカーには、限定はしないが、1つ以上の、抗−p53、抗−TMP21、抗−ニーマン−ピックC1−様タンパク質1、C末端ペプチド)−ドメイン(抗−NPC1L1C−ドメイン)、抗−TMOD1、抗−CAMK1、抗−RGS1、抗−PACSIN1、抗−RCV1、抗−MAPKAPK3、免疫反応性サイクリンE2に対する少なくとも1つの抗体、サイトケラチン8、サイトケラチン19、サイトケラチン18、CEA、CA125、CA15−3、SCC、CA19−9、proGRP、血清アミロイドA、α−1−抗−トリプシン、アポリポタンパク質CIII、Acn6399、Acn9459、Pub11597、Pub4789、TFA2759、TFA9133、Pub3743、Pub8606、Pub4487、Pub4861、Pub6798、Pub6453、Pub2951、Pub2433、Pub17338、TFA6453およびHIC3959が含まれる。
他の態様において、方法には、
a.被験者から少なくとも1つのバイオメトリックパラメーターを得る段階、
b.少なくとも1つのバイオメトリックパラメーターを、前記各バイオメトリックパラメーターに関して、所定のカットオフと比較し、前記比較に基づいた各バイオメトリックパラメーターに対してスコアを割り当てる段階、
c.被験者から試験試料を得る段階、
d.試験試料中、パネル内の2つ以上のバイオマーカーの量を定量し、パネルは、少なくとも1つの抗体および少なくとも1つの抗原を含む段階、
e.パネル中で定量された各バイオマーカーの量を、前記バイオマーカーに関する所定のカットオフに対して比較する段階と、前記比較に基づいて各バイオマーカーに対してスコアを割り当てる段階、
f.段階bにて決定した各バイオメトリックパラメーターに対する割り当てられたスコアを、段階eにて定量した各バイオマーカーに対する割り当てられたスコアと統合して、前記被験者の総スコアを見つけ出す段階、
g.段階fで決定された総スコアを、所定の総スコアと比較する段階、
h.前記被験者が、段階fで決定した総スコアに基づいて、肺がんの危険性を有するかどうかを決定する段階、
が含まれうる。
上記方法において、肺がんに関連するバイオマーカーのDFIは、好ましくは約0.4未満である。
上記方法において、パネルは、抗−p53、抗−TMP21、抗−NPC1L1C−ドメイン、抗−TMOD1、抗−CAMK1、抗−RGS1、抗−PACSIN1、抗−RCV1、抗−MAPKAPK3および免疫反応性サイクリンE2に対する少なくとも1つの抗体からなる群より選択される少なくとも1つの抗体、およびサイトケラチン8、サイトケラチン19、サイトケラチン18、CEA、CA125、CA15−3、SCC、CA19−9、proGRP、血清アミロイドA、α−1−抗−トリプシンおよびアポリポタンパク質CIIIからなる群から選択される少なくとも1つの抗原を含み得る。
上記方法において、被験者から得たバイオメトリックパラメーターは、被験者の喫煙歴、年齢、発がん物質への暴露および性別からなる群より選択される。好ましくは、バイオメトリックパラメーターは、経験者の喫煙のパックイヤーである。
場合により、方法には、試料試験中の少なくとも1つの関心領域を定量することが含まれうる。関心領域が、試験試料中で定量される場合、パネルにはさらに、Acn6399、Acn9459、Pub11597、Pub4789、TFA2759、TFA9133、Pub3743、Pub8606、Pub4487、Pub4861、Pub6798、Pub6453、Pub2951、Pub2433、Pub17338、TFA6453およびHIC3959からなる群から選択される、少なくとも1つの関心領域を含み得る。
場合により、上記方法はまた、患者が肺がんを発現させる危険性があるかどうかを決定するために、分割加重スコア法(Split and Weighted Scoring Method)を利用可能である。上記方法が、そのような分割加重スコア法を利用する場合、前記方法にて、段階bが、少なくとも1つのバイオメトリックパラメーターを、前記バイオメトリックパラメーターに対する所定のカットオフの数に対して比較する段階、および前記比較に基づいて、各前記バイオメトリックパラメーターに対してスコアを割り当てる段階、を含み、段階eが、パネル中の各バイオマーカーの量を、前記バイオマーカーに対する所定のカットオフの数に対して比較する段階、および前記比較に基づいて、各バイオマーカーに対してスコアを割り当てる段階を含み、段階fが、段階bでの各バイオメトリックパラメーターに対する割り当てられたスコアを、段階eで定量された各バイオマーカーに対する割り当てられたスコアと統合して、前記被験者に対する総スコアを見つけ出す段階を含み、段階gが、段階fで決定した総スコアを、所定の総スコアの数と比較する段階を含み、段階hが、前記被験者が、段階gで決定した総スコアに基づいて、肺がんを有するかどうかを決定する段階を含む。
他の態様において、方法には、
a.被験者から試験試料を得る段階、
b.パネル中の2つ以上のバイオマーカーの量を、試験試料中で定量し、パネルは、少なくとも1つの抗体と少なくとも1つの抗原を含む段階、
c.パネル中で定量された各バイオマーカーの量を、前記バイオマーカーに対して所定のカットオフと比較し、前記比較に基づいて各バイオマーカーに対してスコアを割り当てる段階、
d.段階cにおいて定量された各バイオマーカーに対して割り当てたスコアを統合して、前記被験者に対する総スコアを見つけ出す段階、
e.段階dにて決定された総スコアを、所定の総スコアと比較する段階、
f.前記被験者が、段階eにて決定された総スコアに基づいて、肺がんの危険性を有するかどうかを決定する段階、
が含まれうる。
上記方法において、肺がんに関連するバイオマーカーのDFIは、好ましくは約0.4未満である。
上記方法において、パネルには、抗−p53、抗−TMP21、抗−NPC1L1C−ドメイン、抗−TMOD1、抗−CAMK1、抗−RGS1、抗−PACSIN1、抗−RCV1、抗−MAPKAPK3および免疫反応性サイクリンE2に対する少なくとも1つの抗体からなる群より選択される少なくとも1つの抗体が含まれうる。パネルには、サイトケラチン8、サイトケラチン19、サイトケラチン18、CEA、CA125、CA15−3、SCC、CA19−9、proGRP、血清アミロイドA、α−1−抗−トリプシンおよびアポリポタンパク質CIIIからなる群から選択される少なくとも1つの抗原が含まれうる。
場合により、方法にはさらに、試験試料中、少なくとも1つの関心領域を定量化することが含まれうる。関心領域が定量化される場合、パネルにはさらに、Acn6399、Acn9459、Pub11597、Pub4789、TFA2759、TFA9133、Pub3743、Pub8606、Pub4487、Pub4861、Pub6798、Pub6453、Pub2951、Pub2433、Pub17338、TFA6453およびHIC3959からなる群より選択される、少なくとも1つの関心領域が含まれうる。
場合により、上記方法はまた、患者が肺がんを発現させる危険性があるかどうかを決定するために、分割加重スコア法(Split and Weighted Scoring Method)を利用可能である。上記方法が、そのような分割加重スコア法を利用する場合、前記方法にて、段階cが、パネル中の各バイオマーカーの量を、前記バイオマーカーに関して所定のカットオフの数と比較する段階、および前記比較に基づいて、各バイオマーカーに対してスコアを割り当てる段階、を含み、段階dが、段階cにて定量した各バイオマーカーに対して割り当てられたスコアを統合して、前記被験者に対する総スコアを見つけ出す段階を含み、段階eが、段階dで決定した総スコアを、所定の総スコアの数と比較する段階を含み、段階fが、段階eで決定した総スコアに基づいて、前記被験者が肺がんを有するかどうかを決定する段階を含む。
他の態様において、方法には、
a.被験者から試験試料を得る段階、
b.パネル中、少なくとも1つのバイオマーカーの量を、試験試料中で定量し、パネルが、免疫反応性サイクリンE2に対する少なくとも1つの抗体を含む段階、
c.パネル中で定量した各バイオマーカーの量を、前記バイオマーカーに対する所定のカットオフに対して比較する段階、および前記比較に基づいて各バイオマーカーに対してスコアを割り当てる段階、
d.段階cにて定量した各バイオマーカーに対する割り当てられたスコアを統合して、前記被験者に対する総スコアを見つけ出す段階、
e.段階dにて決定した総スコアを、所定の総スコアと比較する段階、
f.段階eで決定した総スコアに基づいて、前記被験者が肺がんを有するかどうか決定する段階、
を含み得る。
上記方法において、肺がんに関連するバイオマーカーのDFIは、好ましくは約0.4未満である。
場合により、上記方法にはさらに、試験試料中の少なくとも1つの抗原を定量する段階、試験試料中の少なくとも1つの抗体を定量する段階、または試験試料中の少なくとも1つの抗原と少なくとも1つの抗体の組合せを定量する段階、が含まれうる。その結果、少なくとも1つの抗原、少なくとも1つの抗体、または少なくとも1つの抗原と少なくとも1つの抗体の組合せが、試験試料中で定量されるべき場合、パネルにはさらに、サイトケラチン8、サイトケラチン19、サイトケラチン18、CEA、CA125、CA15−3、SCC、CA19−9、proGRP、血清アミロイドA、α−1−抗−トリプシンおよびアポリポタンパク質CIIIからなる群から選択される少なくとも1つの抗原、抗−p53、抗−TMP21、抗−NPC1L1C−ドメイン、抗−TMOD1、抗−CAMK1、抗−RGS1、抗−PACSIN1、抗−RCV1、抗−MAPKAPK3および免疫反応性サイクリンE2に対する少なくとも1つの抗体からなる群より選択される少なくとも1つの抗体、またはそれらの任意の組合せが含まれる。
場合により、方法にはさらに、試験試料中、少なくとも1つの関心領域を定量化することが含まれうる。関心領域が定量化される場合、パネルにはさらに、Acn6399、Acn9459、Pub11597、Pub4789、TFA2759、TFA9133、Pub3743、Pub8606、Pub4487、Pub4861、Pub6798、Pub6453、Pub2951、Pub2433、Pub17338、TFA6453およびHIC3959からなる群より選択される、少なくとも1つの関心領域が含まれうる。
場合により、上記方法はまた、患者が肺がんを発現させる危険性があるかどうかを決定するために、分割加重スコア法(Split and Weighted Scoring Method)を利用可能である。上記方法が、そのような分割加重スコア法を利用する場合、前記方法にて、段階cが、パネル中の各バイオマーカーの量を、前記バイオマーカーに対する所定のカットオフの数に対して比較して、前記比較に基づいて、各バイオマーカーに対してスコアを割り当てる段階を含み、段階dが、段階cにて定量した各バイオマーカーに対する割り当てられたスコアを統合して、前記被験者に対する総スコアを見つけ出す段階、を含み、段階eが、段階dで決定した総スコアを、所定の総スコアの数と比較する段階を含み、段階fが、段階eで決定された総スコアに基づいて、前記被験者が肺がんを有するかどうかを決定する段階を含む。
場合により、上記方法はさらに、被験者から少なくとも1つのバイオメトリックパラメーターを得る段階を含み得る。被験者から得られるバイオメトリックパラメーターは、被験者の喫煙歴、年齢、発がん物質への暴露および性別からなる群より選択される。好ましくは、バイオメトリックパラメーターは、被験者の喫煙のパックイヤーである。上記方法がさらに、被験者から少なくとも1つのバイオメトリックパラメーターを得る段階を含む場合、方法にはさらに、少なくとも1つのバイオメトリックパラメーターを、各前記バイオメトリックパラメーターに対して所定のカットオフに対して比較する段階、および前記比較に基づいて、各バイオメトリックパラメーターに対してスコアを割り当てる段階、各バイオメトリックパラメーターに対して割り当てられたスコアを、段階cにて定量された各バイオマーカーに対して割り当てられたスコアと統合して、前記被験者中の総スコアを見つけ出す段階と、総スコアを、段階eでの所定の総スコアと比較する段階、および段階fでの総スコアに基づいて、前記被験者が肺がんの危険性を有するかどうかを決定する段階、が含まれうる。
他の態様において、方法には、
a.被験者から試験試料を得る段階、
b.パネル中、少なくとも1つのバイオマーカーを試験試料中で定量し、パネルには、サイトケラチン8、サイトケラチン19、サイトケラチン18、CEA、CA125、CA15−3、SCC、CA19−9、proGRP、血清アミロイドA、α−1−抗−トリプシンおよびアポリポタンパク質CIIIからなる群より選択される少なくとも1つのバイオマーカーを含む段階、
c.パネル中で定量した各バイオマーカーの量を、前記バイオマーカーに対する所定のカットオフと比較する段階、および前記比較に基づいて、各バイオマーカーに対してスコアを割り当てる段階、
d.段階cにて定量した各バイオマーカーに対する割り当てたスコアを統合し、前記被験者に対する総スコアを見つけ出す段階、
e.段階dにて定量した総スコアを、所定の総スコアと比較する段階、および
f.総スコアに基づいて、前記被験者が肺がんを有するかどうか決定する段階、
が含まれうる。
上記方法において、肺がんに関連するバイオマーカーのDFIは、好ましくは約0.4未満である。
場合により、上記方法はさらに、試験試料中、少なくとも1つの抗体を定量する段階が含まれうる。その結果、パネルにはさらに、抗−p53、抗−TMP21、抗−NPC1L1C−ドメイン、抗−TMOD1、抗−CAMK1、抗−RGS1、抗−PACSIN1、抗−RCV1、抗−MAPKAPK3、および免疫反応性サイクリンE2に対する少なくとも1つの抗体、または任意のこれらの組合せからなる群より選択される少なくとも1つの抗体が含まれうる。
場合により、方法にはさらに、試験試料中、少なくとも1つの関心領域を定量する段階が含まれる。関心領域が定量される場合、パネルにはさらに、Acn6399、Acn9459、Pub11597、Pub4789、TFA2759、TFA9133、Pub3743、Pub8606、Pub4487、Pub4861、Pub6798、Pub6453、Pub2951、Pub2433、Pub17338、TFA6453およびHIC3959からなる群より選択される少なくとも1つの関心領域が含まれうる。
場合により、上記方法はまた、患者が肺がんを発現させる危険性があるかどうかを決定するために、分割加重スコア法(Split and Weighted Scoring Method)を利用可能である。上記方法が、そのような分割加重スコア法を利用する場合、前記方法にて、段階cが、パネル中の各バイオマーカーの量を、前記バイオマーカーに対する所定のカットオフの数を比較する段階、および前記比較にもとづいて、各バイオマーカーに対してスコアを割り当てる段階を含み、段階dが、段階cにて定量された各バイオマーカーに対して割り当てられたスコアを統合して、前記被験者に対する総スコアを見つけ出す段階を含み、段階eは、段階dで決定された総スコアを、所定の総スコアの数を比較する段階を含み、段階fは、段階eにて決定された総スコアに基づいて、前記被験者が肺がんを有するかどうかを決定する段階を含む。
場合により、上記方法はさらに、被験者から少なくとも1つのバイオメトリックパラメーターを得る段階を含み得る。被験者から選られうるバイオメトリックパラメーターは、被験者の喫煙歴、年齢、発がん物質への暴露および性別からなる群より選択される。好ましくは、バイオメトリックパラメーターは、喫煙のパックイヤーである。上記方法がさらに、被験者から少なくとも1つのバイオメトリックパラメーターを得る段階を含む場合、方法にはさらに、少なくとも1つのバイオメトリックパラメーターを、各前記バイオメトリックパラメーターに対して所定のカットオフに対して比較する段階、および前記比較に基づいて、各バイオメトリックパラメーターに対してスコアを割り当てる段階、各バイオメトリックパラメーターに対して割り当てられたスコアを、段階cにて定量された各バイオマーカーに対して割り当てられたスコアと統合して、前記被験者中の総スコアを見つけ打差宇個と、総スコアを、段階eでの所定の総スコアと比較する段階、および段階fでの総スコアに基づいて、前記被験者が肺がんの危険性を有するかどうかを決定する段階、が含まれうる。
他の態様において、方法には、
a.被験者から試験試料を得る段階、
b.パネル中、少なくとも1つのバイオマーカーを、試験試料中で定量し、パネルは、少なくとも1つのバイオマーカーを含み段階で、バイオマーカーは、Acn6399、Acn9459、Pub11597、Pub4789、TFA2759、TFA9133、Pub3743、Pub8606、Pub4487、Pub4861、Pub6798、Pub6453、Pub2951、Pub2433、Pub17338、TFA6453およびHIC3959からなる群より選択される、関心領域である、
c.パネル中で定量した各バイオマーカーの量を、前記バイオマーカーに対して所定のカットオフと比較する段階、および前記比較に基づいて、各バイオマーカーに対してスコアを割り当てる段階、
d.段階cで定量した各バイオマーカーに対して割り当てられたスコアを統合して、前記被験者に対する総スコアを見つけ出す段階、
e.段階dにて定量した総スコアを、所定の総スコアと比較する段階、
f.段階eにて決定した総スコアに基づいて、前記被験者が肺がんを有するかどうかを決定する段階、
が含まれうる。
上記方法において、肺がんに関連するバイオマーカーのDFIは、好ましくは約0.4未満である。
場合により、上記方法にはさらに、試験試料中の少なくとも1つの抗原を定量する段階、試験試料中の少なくとも1つの抗体を定量する段階、または試験試料中の少なくとも1つの抗原と少なくとも1つの抗体の組合せを定量する段階、が含まれうる。その結果、少なくとも1つの抗原、少なくとも1つの抗体、または少なくとも1つの抗原または抗体の組合せが、試験試料中で定量されるべき場合、パネルにはさらに、サイトケラチン8、サイトケラチン19、サイトケラチン18、CEA、CA125、CA15−3、SCC、CA19−9、proGRP、血清アミロイドA、α−1−抗−トリプシンおよびアポリポタンパク質CIIIからなる群から選択される少なくとも1つの抗原、抗−p53、抗−TMP21、抗−NPC1L1C−ドメイン、抗−TMOD1、抗−CAMK1、抗−RGS1、抗−PACSIN1、抗−RCV1、抗−MAPKAPK3および免疫反応性サイクリンE2に対する少なくとも1つの抗体からなる群より選択される少なくとも1つの抗体、またはそれらの任意の組合せが含まれる。
場合により、上記方法はまた、患者が肺がんを発現させる危険性があるかどうかを決定するために、分割加重スコア法(Split and Weighted Scoring Method)を利用可能である。上記方法が、そのような分割加重スコア法を利用する場合、前記方法にて、段階cが、パネル中の各バイオマーカーの量を、前記バイオマーカーに対する所定のカットオフの数を比較する段階、および前記比較にもとづいて、各バイオマーカーに対してスコアを割り当てる段階を含み、段階dが、段階cにて定量された各バイオマーカーに対して割り当てられたスコアを統合して、前記被験者に対する総スコアを見つけ出す段階を含み、段階eは、段階dで決定された総スコアを、所定の総スコアの数を比較する段階を含み、段階fは、段階eにて決定された総スコアに基づいて、前記被験者が肺がんを有するかどうかを決定する段階を含む。
場合により、上記方法はさらに、被験者から少なくとも1つのバイオメトリックパラメーターを得る段階を含み得る。被験者から選られうるバイオメトリックパラメーターは、被験者の喫煙歴、年齢、発がん物質への暴露および性別からなる群より選択される。好ましくは、バイオメトリックパラメーターは、喫煙のパックイヤーである。上記方法がさらに、被験者から少なくとも1つのバイオメトリックパラメーターを得る段階を含む場合、方法にはさらに、少なくとも1つのバイオメトリックパラメーターを、各前記バイオメトリックパラメーターに対して所定のカットオフに対して比較する段階、および前記比較に基づいて、各バイオメトリックパラメーターに対してスコアを割り当てる段階、各バイオメトリックパラメーターに対して割り当てられたスコアを、段階cにて定量された各バイオマーカーに対して割り当てられたスコアと統合して、前記被験者中の総スコアを見つけ出す段階と、総スコアを、段階eでの所定の総スコアと比較する段階、および段階fでの総スコアに基づいて、前記被験者が肺がんの危険性を有するかどうかを決定する段階、が含まれうる。
他の態様において、発明は、
a.被験者から試験試料を得る段階、
b.パネル中、2つ又はそれ以上のバイオマーカーの量を試験試料中で定量し、パネルは、サイトケラチン19、サイトケラチン18、CA19−9、CEA、CA15−3、CA125、SCC、proGRP、ACN9459、Pub11597、Pub4789、TFA2759、TFA9133、Pub3743、Pub8606、Pub4487、Pub4861、Pub6798、Tfa6453およびHic3959の2つ以上を含む段階、
c.パネル中の各バイオマーカーの量を、前記バイオマーカーに対する所定のカットオフに対して比較し、前記比較に基づいて、各バイオマーカーに対してスコアを割り当てる段階、
d.段階cにて決定された各バイオマーカーに対する割り当てられたスコアを統合し、前記被験者に対する総スコアを見つけ出す段階、
e.段階dで決定された総スコアを、所定の総スコアと比較する段階、および
f.段階eにて決定された総スコアに基づいて、前記被験者が肺がんを有するかどうかを決定する段階、
を含み得る。
上記方法において、肺がんに関連するバイオマーカーのDFIは、好ましくは約0.4未満である。
場合により、上記方法でのパネルは、サイトケラチン19、CEA、ACN9459、Pub11597、Pub4789およびTFA2759、サイトケラチン19、CEA、ACN9459、Pub11597、Pub4789、TFA2759およびTFA9133、サイトケラチン19、CA19−9、CEA、CA15−3、CA125、SCC、サイトケラチン18およびProGRP、Pub11597、Pub3743、Pub8606、Pub4487、Pub4861、Pub6798、Tfa6453およびHic3959またはサイトケラチン19、CEA、CA125、SCC、サイトケラチン18、ProGRP、ACN9459、Pub11597、Pub4789、TFA2759、TFA9133を含み得る。
場合により、上記方法はまた、患者が肺がんを発現させる危険性があるかどうかを決定するために、分割加重スコア法(Split and Weighted Scoring Method)を利用可能である。上記方法が、そのような分割加重スコア法を利用する場合、前記方法にて、段階cが、パネル中の各バイオマーカーの量を、前記バイオマーカーに対する所定のカットオフの数と比較する段階、および前記比較に基づいて各バイオマーカーに対してスコアを割り当てる段階、を含み、段階dが、段階cにて定量した各バイオマーカーに対する割り当てられたスコアを統合して、前記被験者に対する総スコアを見つけ出す段階を含み、段階eが、段階dにて決定した総スコアを、所定の総スコアの数と比較することを含む段階、および段階fが、段階eにて決定された総スコアに基づいて、全被験者が肺がんを有するかどうかを決定する段階を含む。
本発明は、以上で記述した方法にて使用されうる種々の異なるキットにも関する。1つの態様において、キットは、配列番号1、配列番号3、配列番号4、配列番号5またはこれらの任意の組合せからなる群より選択されるペプチドを含み得る。他の態様において、キットは、免疫反応性サイクリンE2に対する少なくとも1つの抗体、またはそれらの任意の組合せを含み得る。さらなる態様において、キットは、(a)試験試料中1つ以上の抗原を定量するための、少なくとも1つの抗体を含む試薬で、前記抗原は、サイトケラチン8、サイトケラチン19、サイトケラチン18、CEA、CA125、CA15−3、SCC、CA19−9、proGRP、血清アミロイドA、α−1−抗−トリプシンおよびアポリポタンパク質CIIIである、(b)試験試料中の少なくとも1つの抗体を定量するための、1つ以上の抗体を含む試薬で、前記抗体は、抗−p53、抗−TMP21、抗−NPC1L1C−ドメイン、抗−TMOD1、抗−CAMK1、抗−RGS1、抗−PACSIN1、抗−RCV1、抗−MAPKAPK3および免疫反応性サイクリンE2に対する少なくとも1つの抗体である、(c)ACN9459、Pub11597、Pub4789、TFA2759、TFA9133、Pub3743、Pub8606、Pub4487、Pub4861、Pub6798、Tfa6453およびHIC3959からなる群から選択される、1つ以上の関心領域を定量するための試薬、および(d)試験試料中で定量した各抗原、抗体および関心領域の量を、所定のカットオフに対して比較すること、および前記比較に基づいて、定量された各抗原、抗体および関心領域に対してスコアを割り当てること、定量した各抗原、抗体および関心領域に対する割り当てられたスコアを統合して、総スコアを得ること、総スコアを、所定の総スコアと比較すること、および前記比較を被験者が肺がんを有するかどうかを決定することにおける補助として使用することのための1つ以上のアルゴリズム、を含み得る。またさらに他の態様において、キットは、(a)試験試料中、1つ以上の抗原を定量するための、少なくとも1つの抗体を含む試薬で、前記抗原は、サイトケラチン19、サイトケラチン18、CA19−9、CEA、CA15−3、CA125、SCCおよびproGRPである、(b)Acn9459、Pub11597、Pub4789、TFA2759、TFA9133、Pub3743、Pub8606、Pub4487、Pub4861、Pub6798、Tfa6453およびHic3959からなる群から選択される、1つ以上の関心領域を定量するための試薬、および
(c)試験試料にて定量された、各抗原、抗体および関心の域の量を統合し、所定のカットオフに対して比較するため、前記比較に基づいて定量した、各抗原およびバイオマーカーに対してスコアを割り当てるため、総スコアを得るために定量した各抗原および関心領域に対して割り当てられたスコアを統合すること、総スコアを所定の総スコアと比較すること、および被験者が肺がんを有するかどうか決定することにおける補助として、前記比較を用いるための、1つ以上のアルゴリズム、を含み得る。定量可能な抗原および関心領域の例は、(a)サイトケラチン19、CEAおよびACN9459、Pub11597、Pub4789およびTfa2759、(b)サイトケラチン19およびCEAおよびACN9459、Pub11597、Pub4789、Tfa2759およびTfa9133、および(c)サイトケラチン19、CEA、CA125、SCC、サイトケラチン18、およびProGRPおよびACN9459、Pub11597、Pub4789およびTfa2759である。他の態様において、キットは、(a)試験試料中、1つ以上の抗原を定量するための、少なくとも1つの抗体を含む試薬で、前記抗原は、サイトケラチン19、サイトケラチン18、CA19−9、CEA、CA15−3、CA125、SCCおよびproGRPである、および(b)試験試料にて定量された、各抗原の量を統合し、所定のカットオフに対して比較するため、および前記比較に基づいて定量した、各抗原に対してスコアを割り当てるため、総スコアを得るために定量した各抗原に対して割り当てられたスコアを統合すること、総スコアを所定の総スコアと比較すること、および被験者が肺がんを有するかどうか決定することにおける補助として、前記比較を用いるための、1つ以上のアルゴリズム、を含み得る。キットを用いて定量可能な抗体の例は、サイトケラチン19、サイトケラチン18、CA19−9、CEA、CA15−3、CA125、SCCおよびProGRPである。他の態様において、キットは、(a)1つ以上のバイオマーカーを定量するための試薬で、前記バイオマーカーが、Acn9459、Pub11597、Pub4789、TFA2759、TFA9133、Pub3743、Pub8606、Pub4487、Pub4861、Pub6798、Tfa6453およびHic3959からなる群から選択される、関心領域である、および(b)試験試料にて定量された、各バイオマーカーの量を統合し、所定のカットオフに対して比較するため、および前記比較に基づいて定量した、各バイオマーカーに対してスコアを割り当てるため、総スコアを得るために定量した各バイオマーカーに対して割り当てられたスコアを統合すること、総スコアを所定の総スコアと比較すること、および被験者が肺がんを有するかどうか決定することにおける補助として、前記比較を用いるための、1つ以上のアルゴリズム、を含む。キットを使用して定量されうる関心領域の例は、Pub11597、Pub3743、Pub8606、Pub4487、Pub4861、Pub6798、Tfa6453およびHic3959からなる群から選択可能である。
本発明は、単離または精製ポリペプチドにも関する。本発明によって企図される単離または精製ポリペプチドは、(a)配列番号3および配列番号3のアミノ酸配列に対して60%相同性を有するポリペプチドからなる群より選択されるアミノ酸配列を有する(含む)単離または精製ポリペプチド、(b)配列番号3および配列番号3のアミノ酸配列に対して60%相同性を有するポリペプチドからなる群より選択されたアミノ酸配列から本質的になる単離または精製ポリペプチド、(c)配列番号3のアミノ酸配列からなる単離または精製ポリペプチド、(d)配列番号4および配列番号4のアミノ酸配列に対して60%相同性を有するポリペプチドからなる群より選択されるアミノ酸配列を有する単離または精製ポリペプチド、(e)配列番号4および配列番号4のアミノ酸配列に対して60%相同性を有するポリペプチドからなる群より選択されたアミノ酸配列から本質的になる単離または精製ポリペプチド、(f)配列番号4のアミノ酸配列からなる単離または精製ポリペプチド、(g)配列番号5および配列番号5のアミノ酸配列に対して60%相同性を有するポリペプチドからなる群より選択されるアミノ酸配列を有する単離または精製ポリペプチド、(h)配列番号5および配列番号5のアミノ酸配列に対して60%相同性を有するポリペプチドからなる群より選択されたアミノ酸配列から本質的になる単離または精製ポリペプチド、(i)配列番号5のアミノ酸配列からなる単離または精製ポリペプチド、である。
本発明はまた、固有の分割加重スコア法(Split and Weighted Scoring Method)に関する。本方法は、被験者から得た1つ以上のマーカーをスコア化するために使用可能である。本方法は、
a.被験者から少なくとも1つのマーカーを得る段階、
b.前記被験者からのマーカーの量を定量する段階、
c.定量した各マーカーの量を、前記マーカーに対して所定のカットオフの数に対して比較する段階、および前記比較に基づいて、各マーカーに対してスコアを割り当てる段階、および、
d.段階cにて定量した各マーカーに対する割り当てられたスコアを統合して、前記被験者に対する総スコアを見つけ出す段階、
を含み得る。
上記方法において、所定のカットオフは、ROC曲線に基づき、各マーカーに対するスコアは、マーカーの特異性に基づいて計算する。さらに、上記方法におけるマーカーは、バイオマーカー、バイオメトリックパラメーター、またはバイオマーカーとバイオメトリックパラメーターの組合せでありうる。
さらに、本発明は、分割加重スコア法(Split and Weighted Scoring Method)を用いる、病状を発現させる患者の危険性を決定するための方法を提供する。本方法には、
a.被験者から少なくとも1つのマーカーを得る段階、
b.前記被験者からのマーカーの量を定量する段階、
c.定量した各マーカーの量を、前記マーカーに対して所定のカットオフの数に対して比較する段階、および前記比較に基づいて、各マーカーに対してスコアを割り当てる段階、
d.段階cにて定量した各マーカーに対する割り当てられたスコアを統合して、前記被験者に対する総スコアを見つけ出す段階、
e.段階dにて決定された総スコアを、所定の総スコアと比較する段階、および、
f.段階eにて決定した総スコアに基づいて、病状を発現させる危険性を前記被験者が有するかどうかを決定する段階、
が含まれうる。
上記方法において、所定のカットオフは、ROC曲線に基づき、各マーカーに対するスコアは、マーカーの特異性に基づいて計算する。さらに、上記方法におけるマーカーは、バイオマーカー、バイオメトリックパラメーター、またはバイオマーカーとバイオメトリックパラメーターの組合せでありうる。
(発明の詳細な記述)
定義
本明細書で使用するように、以下の語句は以下の意味を有する。すべての他の技術的および科学的語句が、当業者に一般的に理解される意味を有する。
語句「吸着剤(adsorbent)」は、生体分子を集積(結合)可能な任意の物質を意味する。吸着剤は典型的に、生物学的に活性な表面を被覆し、それらの物理的特性に基づいて、生体分子または種々の生体分子に結合可能である、単一物質または多数の異なる物質からなる。そのような物質には、限定はしないが、アニオン交換物質、カチオン交換物質、金属キレーター、ポリヌクレオチド、オリゴヌクレオチド、ペプチド、抗体、ポリマー(合成または天然)、紙などが含まれる。
本明細書で使用するところの語句「抗体(antibody)」は、免疫グロブリン分子またはその免疫学的に活性な部分、すなわち抗原結合部分を意味する。免疫グロブリン分子の免疫学的に活性な部分の例には、ペプシンのような酵素で抗体を処理することによって産出可能な、F(ab)および)F(ab’)2断片が含まれる。抗体の例には、限定はしないが、ポリクローナル抗体、モノクローナル抗体、キメラ抗体、ヒト抗体、ヒト化抗体、組換え体抗体、一本鎖Fvs(「scFv」)、アフィニティー飽和抗体、一本鎖抗体、単一ドメイン抗体、F(ab)断片、F(ab’)断片、ジスルフィド−結合Fvs(「sdFv」)および抗イデオタイプ(「抗−Id」)抗体および以上の任意の機能的に活性なエピトープ−結合断片が含まれる。本明細書で使用するところの語句「抗体」にはまた、自己抗体(自己抗体は、被験者または患者が合成する、たとえば、限定はしないが、p53、カルレチクリン、α−エノラーゼおよびHOXB7のような、正常の自己タンパク質(または自己抗原)に対して指向する抗体である)が含まれる。広範囲の自己抗原に対する自己抗体が当業者に周知であり、特に肺がん、乳がん、前立腺がん、および膵臓がんなどを含む、多くの悪性疾患中で記述されてきている。抗体はバイオマーカーの1つの型である。
本明細書で使用するところの語句「抗原(antigen)」は、抗体によって結合されうる分子を意味し、さらに動物が、その抗原の少なくとも1つのエピトープに結合可能な抗体を産出するように誘導可能である。さらに、関心領域が、抗原であり得る(言い換えれば、最終的に抗原であると決定されうる)。抗原はバイオマーカーの1つの型である。
語句「AUC」は、ROC曲線の、曲線下面積(Area Under the Curve)を意味する。これは、所与の試料集団における試験のためのメリットの図として使用され、完全な試験に対して1から、試験が試験被験者を分類することにおける完全なランダム応答を与える0.5までの範囲の値を与える。AUCの範囲が、0.5から1.0だけであるため、AUC中の小さな変化が、0から1または0から100%の範囲である計量中の同様の変化よりもより有意である。AUCにて%変化が与えられる場合、計量の全範囲が、0.5から1.0である事実に基づいて計算される。JMP(商標)統計パッケージが、産出された各ROC曲線に対するAUCを報告する。AUC測定は、完全データ範囲にわたる分類アルゴリズムの精度を比較するための価値のある手段である。より大きなAUCを有する分類アルゴリズムは定義によって、2つの関心の群(疾患および非疾患)間で正しく未知を分類するより大きな能力を有する。分類アルゴリズムは、単一分子の測定と同様に単純であってよく、または多数の分子の測定および統合と同様に複雑であってよい。
語句「良性肺疾患(benign lung disease)」または「良性(benign)」は、任意の所与の被験者の肺系と関連した疾患状態を意味する。本発明の文脈において、良性肺疾患には、限定はしないが、慢性閉塞性肺疾患(COPD)、急性または慢性炎症、良性小結節、良性新生組織形成、異形成症、過形成、異型性、気管支拡張症、ヒストプラスマ症、サルコイドーシス、線維症、肉芽腫、血腫、肺気腫、肺拡張不全、組織球増殖症および他の非がん性疾患が含まれる。
語句「生物学的に活性な表面(biologidcally active surface)」は、物質および生体分子の特異的な生化学的特性のために、生体分子が結合、または相互作用可能な物質の任意に二次元または三次元伸展を意味する。そのような生化学的特性には、限定はしないが、イオン性特性(荷電)、疎水性または親水性が含まれる。
語句「生物学的試料(biological sample)」および「試験試料(test sample)」は、任意の所与の被験者から単離されたすべての生物学的液体および排せつ物を意味する。本発明の文脈において、そのような試料には、限定はしないが、血液、血清、血漿、乳頭吸引液、尿、精液(semen)、精液(seminal fluid)、精漿、前立腺液、排泄物、涙、唾液、汗、生検、腹水、脳脊髄液、乳、リンパ液、気管支および他の洗浄液試料、または組織抽出試料が含まれる。典型的に、血液、血清、血漿および気管支洗浄液が、本発明の文脈における使用のために好ましい試験試料である。
語句「バイオマーカー(biomarker)」は、生理的状態と相関する生体分子(または生体分子の断片)を意味する。たとえば、本発明のバイオマーカーはがん、好ましくは肺がんに相関し、肺がんの存在または不在の検出における補助として使用可能である。そのようなバイオマーカーには、限定はしないが、ヌクレオチド、アミノ酸、糖、脂肪酸、ステロイド、代謝物、ポリペプチド、(限定はしないが、抗原および抗体のような)タンパク質、糖質、脂質、ホルモン、抗体、生体分子に対する代用として役目を果たす関心領域、これらの組合せ(たとえば糖タンパク質、リボヌクレオタンパク質、リポタンパク質)、および限定はしないが、抗原と、前記抗原上の利用可能なエピトープに結合する自己抗体間で形成される複合体のような、任意のそのような生体分子を含む任意の複合体が含まれる。語句「バイオマーカー」はまた、少なくとも5個の保存アミノ酸残基、好ましくは少なくとも10個の保存アミノ酸残基、より好ましくは15個の保存アミノ酸残基を含み、親ポリペプチドの生物学的活性および/またはいくつかの機能特性、たとえば抗原性または構造ドメイン特性を維持する、ポリペプチド(親)配列の一部分も意味する。
語句「バイオメトリックパラメーター(biometric parameter)」は、よく定義された群または集団に属しているような患者を一意的に同定するために使用する、1つ以上の固有の生理学的または行動特性を意味する。本発明の文脈において、「バイオメトリックパラメーター」には、限定はしないが、患者の理学的記述子が含まれる。バイオメトリックパラメーターの例には、限定はしないが、患者の身長、患者の体重、患者の性別、喫煙歴、職業歴、発がん性物質に対する暴露、受動喫煙への暴露、肺がんの家族歴などが含まれる。喫煙歴は通常、パックイヤー(Pkyrs)において定量される。本明細書で使用するところの語句「パックイヤー(Pack Years)」は、一日あたりで喫煙したパックの平均数でわった、個人の喫煙した年数を意味する。平均で、35年間、一日あたり1パックのたばこを吸った個人は、35パックイヤーの喫煙歴を有するとされる。バイオメトリックパラメーター情報は、患者の日常質問書または健康歴質問書などの利用によって、被験者自身からのような、当技術分野で公知の日常の技術を用いて、被験者より得られる。あるいは、バイオメトリックパラメーターは、看護士、ナース・プラクティショナー、医師のアシスタントまたは医師より、被験者から得ることができる。
「保存アミノ酸置換(conservative amino acid substitution)」は、アミノ酸残基が、類似側鎖を有するアミノ酸残基で置換されるものである。類似の側鎖を有するアミノ酸残基のファミリーが、当技術分野で定義されている。これらのファミリーには、塩基性側鎖(たとえばリシン、アルギニン、ヒスチジン)、酸性側鎖(たとえばアスパラギン酸、グルタミン酸)、未荷電極性側鎖(たとえばグリシン、アスパラギン、グルタミン、セリン、スレオニン、チロシン、システイン)、非極性側鎖(たとえばアラニン、バリン、ロイシン、イソロイシン、プロリン、フェニルアラニン、メチオニン、トリプトファン)、β−分岐側鎖(たとえばスレオニン、バリン、イソロイシン)および芳香族側鎖(たとえばチロシン、フェニルアラニン、トリプトファン、ヒスチジン)が含まれる。したがって、タンパク質内の予想非必須アミノ酸残基が好ましくは、同一の側鎖ファミリーからの他のアミノ酸残基と置換される。
語句「決定木解析(Decision Tree Analysis)」は、連続した単一二股ルール(または症状)が、決定木を介して、最終分類出力または木の末端節へのガイドを提供する、古典的アプローチを意味する。その本質的に単純で、直感的な性質が、帰納的な分割を診断工程に非常に従順にする。
この方法は、2つの型の変数、因子変数(X’s)および応答変数(Y’s)を必要とする。実行されるように、X変数が連続的であり、Y変数が絶対的である(名目上)。そのような場合、JMP統計パッケージは、多数の節を最大化する、カットオフ値を産出するアルゴリズムを利用する。試料を、このカットオフ値より上および下である値に基づいて、枝または節に分割する。
絶対的応答変数に関して、この場合でのように、フィットした値が、各応答レベルに対する推定可能性となる。この場合、スプリットを、もっとも大きな尤度比カイ二乗統計(G2)によって決定される。これは、2つのスプリットの枝間の応答における差を最大化する効果を有する。本方法のより詳細な議論およびその実施が、JMP統計およびグラフィックスガイドで見ることができる。
しかしながら、木を構築することは、それに関連したその固有の懸案事項を有する。共通の懸案事項は、データを過剰フィッティングすることなしに、もっともよい予測モデルを提供する木の最適な大きさを決定することである。このことを考慮に入れて、ROC曲線を構築するために、種々の木の節にて抽出可能な情報の利用を作成するように、方法が開発された。実施されたように、本方法は、モデルされているデータ組を確実に過剰フィットされる十分な節で、参照木を構築することを含む。結果として、木が切り戻され、引き続いて、節の最小数が到達するまで(2末端節)、各段階でもっとも悪い節を除去する。これによって、複雑性が減少した(節が少ない)一連の木、または木のファミリーが作製される。
帰納的分割プログラムは、純粋な末端節を作製することを試み、すなわち1つの分類型の標本のみが含まれる。しかしながら、常に可能ではない。しばしば、末端節は、混合集団を有する。したがって、各末端節は、がんに対する異なる可能性を持ちうる。がんに対する純粋な末端節において、がん標本である可能性は100%でありえ、反対に、非がんに対する純粋な末端節に対して、がん標本である可能性は、0%でありうる。各末端節でのがんの可能性は、各節にて、(1−非がんの可能性)に対してプロットされる。
これらの値を、特定の木の代表である、ROC曲線を発生するためにプロットする。各木に対して計算したAUCは、木またはモデルの「有益な部分(goodness)」を表している。任意の診断適用と同様に、AUCが高ければ高いほど、アッセイが、またはこの場合モデルがよりよい。木の大きさ(節の数)に対するAUCのプロットが、その最大として、トレーニング組に対してもっともよいモデルを持ちうる。同様の手順を第二の、しかしより小さなデータのサブセットで実施して、結果を認証する。トレーニングおよび認証組両方での同様の実施のモデルが、さらなる解析および/または認証のために最適であり、したがって選択されると考えられる。
語句「開発データ組(developmental data set)」または「データ組(data set)」は、生体試料の組に対して回収した、完全バイオマーカーまたはバイオマーカーおよびバイオメトリックパラメーターを含む特徴を意味する。これらの試料自体が、公知の診断結果で患者から引き出される。特徴または特徴の組を統計解析にかけ、公知の患者予後に相関する、2つ以上の異なる試料群(たとえばがんおよび非がん)への試料の分類を意図する。質量スペクトルを使用する場合、組内の質量スペクトルが、それらの強度において異なりえるが、器具類の精度内の、それらの見かけ分子質量内ではない。
語句「分類子(classifier)」は、試料に関連した疾患を決定するために、試料の組に対して由来した特徴を用いる任意のアルゴリズムを意味する。分類子の1つの型が、トレーニング組からのデータで、アルゴリズムを「トレーニングすること(training)」によって作製し、その性能は、試験組データで評価する。本発明に関して使用する分類子の例は、判別分析、決定木解析、受信者動作曲線または分割スコア解析である。
語句「決定木(decision tree)」は、分類のために使用される、フローチャート様木構造を有する分類子を意味する。決定木は、サブセット内へのデータ組の繰り返しスプリットからなる。各スプリットは、1つの変数に適用した単一のルールからなり、たとえば「変数1」の値が「閾値1」よりも大きい場合、左にいき、それ以外の場合右に行く」である。したがって、所与の特徴スペースを、1つのクラスに割り当てた各長方形を有する、長方形の組に分割する。
語句「診断アッセイ(diagnostic assay)」および「診断法(diagnostic method)」は、病的状態の存在または性質の決定を意味する。診断アッセイは、これらの感度および特異性で異なる。肺がんに対して試験陽性であり、実際に疾患である患者が、「真の陽性(true positives)」と考えられる。本発明の文脈内で、診断アッセイの感度は、疾患集団内の真の陽性の割合として定義される。肺がんを患っているが、診断アッセイによって検出されていない被験者が、「偽陰性(false negatives)」と考えられる。疾患をもっておらず、診断アッセイで試験陰性である被験者は、「真の陰性(true negatives)」と考えられる。本明細書で使用するところの語句診断アッセイの特異性は、非疾患集団における真の陰性の割合として定義される。
語句「判別分析(discriminant analysis)」は、2つ以上の天然に存在する群間を最適に判別する特徴を選別するために使用する統計法の組を意味する。判別分析のデータ組への適用によって、利用者は、さらなる解析のために、もっとも判別する特徴に焦点をあてることができる。
語句「理想からの距離(Distance From Ideal)」または「DFI」は、感度および特異性両方を組み込み、[(1−感度)2+(1−特異性)2]1/2として定義される、理想からの距離である、ROC曲線からとるパラメーターを意味する。DFIは、100%感度および100%特異性の性能のアッセイに対して0であり、0%感度および0%特異性を有するアッセイに対すて1.414まで増加する。その決定に対して完全データ範囲を使用するAUCとは異なって、DFIが、ROC曲線上の特定の点における試験の性能を測定する。より低いDFI値を有する試験は、より高いDFI値を有するものより良好に機能する。DFIは、米国特許明細書番号第2006/0211019 A1号にて詳細に議論されている。
語句「アンサンブル(ensemble)」、「木アンサンブル(tree ensemble)」または「アンサンブル分類子(ensemble classifier)」が、相互互換的に使用可能であり、多くの単一の要素分類子からなる分類子を意味し、たとえば、決定木のアンサンブルは、決定木からなる分類子である。アンサンブル分類子の結果は、たとえば、すべての構成要素分類子を等しく重みを加える過半数投票によって、その構成要素分類子の結果のすべてを統合することによって得られる。過半数投票は、構成要素分類子を、これらが発生される頻度によって天然に重みを加える場合に、とりわけ道理にかなっている。
語句「エプトープ(epitope)」は、また抗体によって認識されうる抗体によって結合されうる抗原の部分を引用することを意味する。エプトープ決定因子は通常、アミノ酸または糖側鎖のような分子の化学的に活性な表面グルーピングからなり、特定の三次元構造特性ならびに特定の荷電特性を有する。
語句「特徴(feature)」および「変数(variable)」は、相互互換的に使用してよく、試料の特性の測定の値を意味する。これらの測定は、試料の物理的、化学的または生物学的特徴から由来してよい。測定の例には、限定はしないが、質量スペクトルピーク、質量スペクトルシグナル、ROIの強度の関数が含まれる。
配列間の相同性または配列同一性の計算(語句は本明細書で相互互換的に使用される)は以下のように実施する。
2つのアミノ酸配列の、または2つの核酸配列のパーセント同一性を決定するために、配列を、最適な比較目的のために並べる(たとえば、ギャップを、最適なアライメントのために、第一および第二アミノ酸または核酸配列の1つまたは両方に導入可能であり、非相同配列を比較の目的のために無視可能である)。好ましい実施形態において、比較目的のために並べた参照配列の長さは、並べる参照アミノ酸残基配列の長さの、少なくとも30%、好ましくは少なくとも40%、より好ましくは少なくとも50%、より好ましくは少なくとも60%、およびより好ましくは少なくとも70%、80%、90%、95%、99%または100%である。ついで、相当するアミノ酸位置またはヌクレオチド位置における、アミノ酸残基またはヌクレオチドを比較する。第一配列中の位置が、第二配列中の相当する位置と同一のアミノ酸残基またはヌクレオチドによって占有されている場合、分子がその位置で同一である(本明細書で使用するように、アミノ酸または核酸「同一性(identity)」は、アミノ酸または核酸「相同性(homology)」と等価である)。2つの配列間のパーセント同一性は、2つのアライメントの最適な配列のために導入される必要のある、ギャップの数、および各ギャップの長さを考慮にいれて、配列によって共有される同一の位置の数の関数である。
配列の比較および2つの配列間のパーセント同一性の決定は、数学的アルゴリズムを用いて達成可能である。好ましい実施形態において、2つのアミノ酸配列間のパーセント同一性は、Blossum 62マトリックスまたはPAM250マトリックスいずれか、および16、14、12、10、8、6、または4のギャップウェイトおよび1、2、3、4、5、または6の長さウェイトを用いて、GCGソフトウェアパッケージ中のGAPプログラム内に組み込まれた、Needleman and Wunsch(J.Mol.Biol.48:444−453(1970))アルゴリズムを用いて決定する。また他の好ましい実施形態において、2つのヌクレオチド配列間のパーセント同一性は、NWSgapdna.CMPマトリックスおよび40、50、60、70、または80のギャップウェイトと1、2、3、4、5、または6の長さウェイトを用いて、GCGソフトウェアパッケージ中のGAPプログラムを用いて決定する。パラメーターの特に好ましい組(および分子が本発明の配列同一性または相同性限界内であるかどうかを決定するために何のパラメーターを適用すべきかについて、実施者が不確かである場合に使用すべきもの)は、12のギャップオープンペナルティー、4のギャップエクステンドペナルティ、および5のフレームシフトギャップペナルティーでの、Blossum 62スコアリングマトリックスを用いることである。
2つのアミノ酸またはヌクレオチド配列間のパーセント同一性は、PAM120ウェイト残余表、12のギャップ長さペナルティおよび4のギャップペナルティを用いて、ALIGNプログラム(バージョン2.0)内に組み込まれた、E.Meyers and W.Miller(CABIOS,4:11−17(1989))のアルゴリズムを用いて決定可能である。
本明細書で記述された核酸およびタンパク質配列を、たとえば他のファミリーメンバーまたは関連配列を同定するために、公的なデータベースに対する検索を実施するために、「クエリー配列(query sequence)」として使用可能である。そのような検索は、Altschul,et al.,J.Mol.Biol.215:403−10(1990)のNBLASTおよびXBLASTプログラム(バージョン2.0)を用いて実施可能である。BLASTタンパク質検索は、本発明の免疫反応性サイクリンE2に相同性のアミノ酸配列を得るために、XBLASTプログラム、スコア=50、ワード長=3で実施可能である。比較の目的のためのギャップアライメントを得るために、Gapped BLASTを、Altschul et al.,Nucleic Acids Res.25(17):3389−3402(1997)にて記述されたように利用可能である。BLASTおよびGapped BLASTプログラムを使用する場合、それぞれのプログラム(XBLASTおよびNBLAST)のデフォルトパラメーターを利用可能である。
本明細書で使用するところの語句「免疫反応性サイクリンE2(immunoreactive サイクリンE2)」は、(1)配列番号1、配列番号3、配列番号4、または配列番号5の任意のアミノ酸を有するポリペプチド、(2)配列番号1、配列番号3、配列番号4、または配列番号5の任意の組合せ、(3)配列番号1に対して、少なくとも60%、好ましくは少なくとも70%、より好ましくは少なくとも75、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99%の相同性を有するアミノ酸配列を有するポリペプチド、配列番号3に対して、少なくとも60%、好ましくは少なくとも70%、より好ましくは少なくとも75、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99%の相同性を有するアミノ酸配列を有するポリペプチド、配列番号4に対して、少なくとも60%、好ましくは少なくとも70%、より好ましくは少なくとも75、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99%の相同性を有するアミノ酸配列を有するポリペプチド、配列番号5に対して、少なくとも60%、好ましくは少なくとも70%、より好ましくは少なくとも75、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99%の相同性を有するアミノ酸配列を有するポリペプチド、およびこれらの任意の組合せ、(4)配列番号1、配列番号3、配列番号4または配列番号5と同様の免疫反応性を示すサイクリンE2ポリペプチド、および(5)配列番号1、配列番号3、配列番号4、または配列番号5と同様の免疫反応性を示すポリペプチド、を意味する。
「単離(isolated)」または「精製(purified)」ポリペプチドまたはタンパク質は、このタンパク質が由来する細胞または細胞起源からの細胞物質または他の汚染細胞を本質的に含まず、または化学的に合成された場合、化学的前駆体または他の化学物質を本質的に含まない。タンパク質またはその生物学的活性な部分を組換え体的に産出する場合、培養培地を本質的に含まないことも好ましく、すなわち、培養培地が、タンパク質調製物の容量の、約20%未満、より好ましくは、約10%未満、もっとも好ましくは約5%未満であることを表す。
本明細書で使用するところの語句「直線区別解析(Linear Discriminate Analysis)」は、試料を正しくカテゴリー化する際にもっともよいそれらの変数または特徴を同定するためのツールを提供し、たとえばJMP(商標)統計パッケージによって実施可能である、解析の1つの型を意味する。ソフトウェアの段階的特徴を用いて、変数を、すべての試料を正しく分類するまで、モデルに加えてよい。一般的に、この様式で選別された変数の組は、データ組中の変数の本来の数よりも、本質的に小さい。特徴の数のこの減少が、任意の次の解析、たとえば、決定木、人工神経ネットワークなどを用いる、より一般的な分類エンジンの開発を単純化する。
語句「肺がん(lung cancer)」は、任意の所与の被験者の肺系に関連したがん状態を意味する。本発明の文脈において、肺がんには、限定はしないが、腺がん、扁平上皮がん、扁平上皮細胞がん、大細胞がん、小細胞がん、非小細胞がんおよび細気管支肺胞上皮がんが含まれる。本発明の文脈内で、肺がんは、異なるステージであってよく、グレードの程度は様々であってよい。肺がんのステージ、またはそのグレード程度を決定するための方法が、当業者に周知である。
語句「質量分析法(mass spectrometry)」は、表面上、試料からの気体相イオンを産出させるためのイオン源の利用、および質量分析器で気体相イオンを検出すること、を意味する。語句「レーザー脱着質量分析法(laser desorption mass spectrometry)」は、表面上、試料からの気体相イオンを産出させるために、イオン源としてレーザーを利用し、および質量分析器で気体相イオンを検出することを意味する。生体分子のための質量分析法の好ましい方法は、マトリックス補助レーザー脱着/イオン化質量分析法、またはMALDIである。MALDIにおいて、解析物を典型的に、乾燥に際して、解析物と共結晶化する、マトリックス物質と混合する。マトリックス物質は、さもなければ不安定な生体分子または解析物を断片化する、エネルギー供給源からエネルギーを吸収する。他の好ましい方法は、表面増強レーザー脱着/イオン化質量分析法またはSELDIである。SELDIにおいて、解析物を適用する表面が、解析物捕獲および/または脱着において活性な役割を果たす。本発明の文脈において、試料には、クロマトグラフィーまたは他の化学的処理を受けうる生物学的試料と、適切なマトリックス基質が含まれる。
質量分析法において、「見かけの分子量(apparent molecular mass)」は、検出されたイオンの、分子量(ダルトン)対電荷値、m/zを意味する。どのように見かけの分子量が由来するかは、使用する質量分析法の型に依存する。飛行時間質量分析法にて、見かけの分子量は、イオン化から検出までの時間の関数である。
語句「マトリックス(matorix)」は、質量分析器中、適切な光源、たとえばUV/VisまたはIRレーザーからの光子としてエネルギーを吸着し、それによって、表面からの生体分子の脱着を可能にする分子を意味する。α−シアノ桂皮酸、シナピン酸およびジヒドロ安息香酸を含む桂皮酸誘導体が、生体分子のレーザー脱着において、エネルギー吸着分子としてよく使用される。エネルギー吸着分子は、参照によって本明細書に組み込まれている、米国特許第5,719,060号にて記述されている。
語句「正規化(normalization)」およびその誘導語は、質量スペクトルに関連して使用する場合、スペクトルの全体的な強度における、おもに機器パラメーターが原因の、差を除去または最小化するために、質量スペクトルの組に適用する、数学的方法を意味する。
語句「関心領域(region of interest)」または「ROI」は、質量スペクトルのサブセットの統計学的適合を意味する。ROIは、連続したシグナルの固定化された最小長を有する。連続シグナルは、どのようにROIが選ばれるかに依存して、固定最大長のギャップを含んでよい。関心領域は、バイオマーカーに関し、バイオマーカーに対する代用として働きうる。関心領域は、後で、タンパク質、ポリペプチド、抗原、抗体、脂質、ホルモン、糖質などであると決定されてよい。
語句「受信者動作特性曲線(Receiver Operator Characteristic Curve)」または「ROC曲線(ROC curve)は、そのもっとも単純な適用において、2つの集団(たとえば、症例(すなわち、肺がんを患っている被験者)および対照(すなわち、肺がんに対して正常であるか、または良性である被験者))間を区別することにおける、特定の特徴(たとえば、バイオマーカーまたはバイオメトリックパラメーター)の性能のプロットを意味する。全集団(すなわち症例および対照)に渡る特徴データを、単一の特徴の値に基づいて、昇順で仕分ける。ついで、その特徴に対する各値に対して、各データに関して真の陽性および偽陽性率を計算する。真の陽性率は、検討中の特徴に対する値以上の症例の数を計数して、ついで、症例の総数によって割ることによって決定する。偽陽性率は、検討して、特徴に対する値以上の対照の数を計数して、対照の総数によってわることによって決定する。この定義が、対照と比較して、症例にて特徴が上昇するシナリオを記述している一方で、この定義はまた、対照と比較して、症例にて特徴が抑制されるシナリオも企図している。本シナリオにおいて、検討中の特徴の値以下の試料を計算しうる。
ROC曲線は、単一特徴に対して、ならびに他の単一出力に対して産出可能であり、たとえば、2つ以上の特徴の組合せが、数学的に一緒に(加えられる、引かれる、かけられるなどのように)統合されて、単一の合計値が提供され、この単一合計値をROC曲線中でプロット可能である。さらに、それによって組合せが単一の出力値を誘導する、多数の特徴の任意の組合せが、ROC曲線中でプロット可能である。特徴のこれらの組合せが試験を含んでよい。ROC曲線は、試験の偽陽性率(1−特異性)に対する試験の真の陽性率(感度)のプロットである。ROC曲線下面積は、所与の試料集団に対する特徴に関するメリットの図であり得、試験が、試験被験者を分類することにおいて、完全に無作為な応答を与える完全な試験に対して1から0.5の範囲の値を与える。ROC曲線は、データ組を迅速に検査するための他の手段を提供する。診断的であると見られる特徴を、大きな特徴スペースの大きさを減少させるために好ましく使用可能である。
語句「スクリーニング(screening)」は、肺がんへの患者の傾向に関する診断決定を意味する。患者は、陽性「スクリーニング試験」で高い肺がんの危険性であると決定される。結果として、患者は、所与の追加試験、たとえば撮像、唾液試験、肺機能試験、気管支鏡検査法および/または生検手順を実施して、および最終診断を下すことが可能である。
語句「シグナル(signal)」は、調査している生体分子によって産出される任意の応答を意味する。たとえば、語句シグナルは、質量分析器の検出器にぶつかる生体分子によって産出される応答を意味する。シグナル強度は、生体分子の量または濃度と比例する。シグナルは、2つの値、見かけ分子量値と、以上で記述したように産出された強度値によって定義される。質量値は、生体分子の要素特性であり、一方で強度値は、相当する見かけ分子量値を有する生体分子の特定の量または濃度に一致する。したがって「シグナル」はいつも、生体分子の特性を意味する。
語句「分割スコア法(Split and Score Method)」は、Mor et al.,PNAS,102(21):7677−7682(2005)から適合した方法を意味する。本方法において、多数の測定をすべての試料で実施する。カットオフ値を各測定に対して決定する。このカットオフ値を、関心の群間(たとえば疾患および非疾患)の正確な分類の精度を最大化するために設定してよく、または1つの群の感度または特異性を最大化するために設定してよい。各測定のために、関心の群、たとえば疾患が、カットオフ値より上、またはカットオフ値より下であるかどうかを決定する。各測定に対して、その測定の値が、カットオフ値の疾患側において発見される時はいつでも、その試料にスコアを割り当てる。すべての測定を1つの試料で実施した後、スコアを合計して、測定のパネルに対する総スコアを産出する。10の測定のパネルが、最大スコア10をもち(各測定は1または0のいずれかのスコアを有する)、最小スコア0を有するように、すべての測定に等しく重みをかけることが一般的である。しかしながら、より有意な測定のために、より高い個々のスコアで測定に不均等に重みをかけることが価値がありうる。
総スコアを決定した後、測定のパネルに基づいて、非疾患試料から疾患を分類するために、もう一度カットオフを決定する。ここで再び、最大スコア10および最小スコア0の測定のパネルに対して、カットオフを、感度(カットオフとしてスコア0)を最大化するため、または特異性(カットオフとしてスコア10)を最大化するため、または分類の精度(カットオフとして0から10の間のスコア)を最大化するために選択してよい。
本明細書で使用するところの、語句「分割加重スコア法(Split and Weighted Scoring Method)」は、試験試料中で同定および定量される1つのバイオマーカーまたはバイオメトリックパラメーター(本明細書にて、「マーカー(類)」(marker(s))と集合的によぶ)の測定を、多くの可能性あるスコアの1つに変換することを含む方法を意味する。スコアは、以下の等式を用いて得る。
スコア=AUC*因子/(1−特異性)
式中「因子(factor)」は(0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25などのような)整数であり、「特異性(specificity)」は、1以下である値の選択値である。「因子」の程度は、限定はしないが、より高いAUC値、相対的に小さな標準偏差、高い特異性または感度または低いDFIのような、改善された臨床性能を有するマーカーに対して増加する。その結果、1つのマーカーの測定を、所望の多くの、または少ないスコアに変換可能である。本方法は、関心の集団におけるマーカー/試験性能を反映する、受信者動作特性曲線に基づいている。ROC曲線は、試験の真の陽性率(感度)の、試験の偽陽性率(1−特異性)に対するプロットである。曲線上の各点は、測定している特徴/試験(マーカー)の単一の値を表している。したがって、いくつかの値が、関心の集団(すなわち、肺がんを発現させる危険性である被験者)において、低い偽陽性率を持ち、一方、特徴の他の値が、その集団で高い偽陽性率を持ちうる。本方法は、関心の被験者の集団に対して、低い偽陽性率を有する(それによって高い特異性を有する)特徴値(すなわち、バイオマーカーまたはバイオメトリックパラメーター)に対して、より高いスコアを提供する。本方法は、それよりも低いと試験の結果がスコアの増加となる、偽陽性(1−特異性)の所望のレベルを選択することを含む。言い換えると、高い特異性のマーカーが、特異性の低いマーカーより大きなスコア、またはより大きな範囲のスコアを与える。
本明細書で使用するところの語句「被験者(subject)」は、ヒトまたは非ヒトを含む、動物、好ましくは哺乳動物を意味する。語句患者および被験者は、本明細書で相互互換的に使用されてよい。
語句「DTモデルの10倍検証(Ten−fold Validation of DT Models)」は、良好な解析実施が、モデルをそれらの予測値を査定するために、2つの集団に対して検証されることを必要とする。新規の集団のかわりに、データを独立したトレーニング組と検証組に分けることができる。10のランダム亜組を、検証組としての利用のために産出する。各検証組に対して、共通して試料を含まない、相当する独立トレーニング組が存在する。10のDTモデルを、上述のように、10トレーニング組から産出し、検証組と問い合わせを行う。
語句「試験組(test set)」または「未知(unknown)」または「検証組(validation set)」は、トレーニング組中に含まれない登録からなる全利用可能データ組の亜組を意味する。試験データを、分類子性能を評価するために適用する。
語句「トレーニング組(training set)」または「公知組(known set)」または「参照組(reference set)」は、それぞれの全利用可能データ組の亜組を意味する。この亜組は典型的に、無作為に選択され、分類子構築の目的のためにのみ使用される。
語句「変換ロジスティック回帰(Transformed Logistic Regression Model)」は、JMPTM統計パッケージに組み込まれてもいる、特徴の数を統合し、ROC曲線解析を可能にする方法を提供するモデルを意味する。このアプローチは、特徴の他の1つとの関係に関して、単純かモデルを仮定するので、減少した特徴の組にもっともよく適用される。陽性結果は、より洗練された分類方法が良好であるべきであることを示唆する。残念であるが、陰性結果は、他の方法に対して必ずしも失敗を暗示しない。
サイクリンE2ポリペプチド
1つの実施形態において、本発明は、単離または精製免疫反応性サイクリンE2ポリペプチド、または本明細書で記述した方法にて使用可能である抗体を発生させる、または試験する(またはより一般的に、結合する)免疫原または抗原として使用可能な、それらの生物学的に活性な断片に関する。本発明の免疫反応性サイクリンE2ポリペプチドは、標準のタンパク質精製技術を用いて、細胞または組織起源より単離可能である。あるいは、単離または精製免疫反応性サイクリンE2ポリペプチおよびその生物学的に活性な断片は、組換えDNA技術によって産出可能であり、または化学的に合成可能である。本発明の単離または精製免疫反応性サイクリンE2ポリペプチドは、配列番号1、配列番号3、配列番号4および配列番号5にて示されたアミノ酸配列を有する。配列番号1は、ヒトサイクリンE2のcDNA発現形態のアミノ酸配列である(Genbank受入BC007015.1)。配列番号3は、BC007015.1のC−末端+1アミノ酸(システイン)を含む38アミノ酸配列であり、本明細書ではまた「E2−1」とも呼ばれる。配列番号4は、長さにして37アミノ酸であり、配列番号4がそのアミノ末端で、配列番号3の非常に初期のシステインを含まないことを除いて、配列番号3と同一である。配列番号5は、BC007015.1のC−末端を含む19アミノ酸配列であり、本明細書で「E2−2」と呼ばれる。実施例にてより詳細に記述するが、免疫反応性配列番号1を、配列番号2の免疫反応性と比較した。配列番号2は、ヒトサイクリンE2(Genbank受入BC020729.1)の他のcDNA発現形態である。配列番号1が、がん試料のいくつかのプールと強力な免疫反応性をしめすことがわかり、良性および正常(非がん)プールとは非常に低い反応性を示した。反対に、配列番号2は、がんまたは非がんプール試料とほとんど反応を示さなかった。配列番号1の免疫反応性は、配列番号2には存在しない、配列番号1のC−末端に存在する、最初の37アミノ酸の結果であると決定された。両方とも配列番号1のC−末端から由来する、配列番号3および5は、がんまたは非がんプール間で強力な免疫反応性を示すことがわかった。したがって、任意の配列番号1、配列番号3、配列番号4および配列番号5、または(配列番号1および配列番号3に対して産出された抗体、配列番号1および配列番号4に対して産出された抗体、配列番号1および配列番号5に対して産出された抗体、配列番号1、配列番号3および配列番号4に対して産出された抗体、配列番号1、配列番号3および配列番号5に対して産出された抗体、配列番号1、配列番号4および配列番号5に対して産出された抗体、配列番号1、配列番号3、配列番号4および配列番号5に対して産出された抗体、配列番号3および配列番号4に対して産出された抗体、配列番号3および配列番号5に対して産出された抗体、配列番号3、配列番号4および配列番号5に対して産出された抗体、配列番号4および配列番号5に対して産出された抗体のような)これらの配列の任意の組合せに 対して産出された抗体を、本明細書で記述した方法において利用可能である。たとえば、そのような抗体は、任意の配列番号1、配列番号3、配列番号4および配列番号5またはこれらの配列の任意の組合せに対して産出された被験者抗体であり得る。そのような抗体は、本明細書で記述された本発明の方法における利用のための、1つ以上のキット内に含まれてよい。
本発明はまた、1つ以上の保存アミノ酸置換によって、本明細書で記述されたポリペプチド(すなわち配列番号1、配列番号3、配列番号4および配列番号5)とは異なるポリペプチドも含む。さらに、本発明はまた、配列番号1、配列番号3、配列番号4および配列番号5のアミノ酸配列をもつポリペプチドと、少なくとも60%、好ましくは少なくとも70%、より好ましくは少なくとも75、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99%以上の総配列類似性(同一性)または相同性を有するポリペプチドも含む。
肺がんの存在を検出することにおける、バイオマーカーおよびバイオメトリックパラメーターの利用
他の実施形態において、本発明は、正常被験者と、がんの被験者、または病状、好ましくはがん、より好ましくは肺がんを発現させる危険性にある被験者を区別することにおいて効果的に補助する方法に関する。正常被験者は、がんのような任意の病状で診断されないもの、より好ましくは肺がんと診断されないものと考えられる。
本発明は、病状、好ましくはがん、より好ましくは肺がんの診断において補助するための、迅速で、感度がよく、利用が簡単な方法を有利に提供する。さらに、本発明は、病状を発現させる危険性にある個体を同定するため、病状の危険性にある被験者を検査するため、および病状と診断された、またはそのために治療されている患者をモニタするために利用可能である。本発明はまた、病状のために治療されている患者の治療の効果をモニタするために利用可能である。好ましくは、病状はがんであり、より好ましくは肺がんである。
一般的に、本発明の方法には、被験者より試験試料を得ることが含まれる。典型的に、試験試料は、被験者より得、当業者に公知の標準の方法を用いて処理する。血液標本および血清またはそれらから由来する血漿に関して、試料は従来より、静脈穿刺によって肘正中静脈より得ることができ、またはより少量の容量が必要である場合は、手掌での採血によって得ることができる。両方の場合で、形成された要素および固まりを遠心によって除去する。尿または排泄物は、迅速に処理されるか、処理が即時にできない場合に保存剤で安定化するという条件で、患者から直接回収できる。気管支洗浄液または胸膜液のようなより特定の試料は、気管支鏡検査法の間、または経皮またはオープン生検によって回収可能であり、微粒子物質が遠心によって除去されたならば、血清または血漿と同様に処理可能である。
処理の後、被験者から得た試験試料を、肺がんの診断と相関可能である1つ以上のバイオマーカーの存在および量に関して問い合わせをおこなう。とくに、本出願者らは、1つ以上のバイオマーカー、または(少なくとも1つのバイオマーカー、少なくとも1つのバイオマーカーおよび少なくとも1つのバイオメトリックパラメーター、少なくとも2つのバイオマーカー、少なくとも2つのバイオマーカーおよび1つのバイオメトリックパラメーター、少なくとも1つのバイオマーカーおよび少なくとも2つのバイオメトリックパラメーター、少なくとも2つのバイオマーカーおよび少なくとも2つのバイオメトリックパラメーター、少なくとも3つのバイオマーカーなどのような)バイオマーカーとバイオメトリックパラメーターの組合せの検出および定量化が、患者において肺がんを診断することにおける補助として有用であることを発見した。本明細書で記述された方法にて同定および定量された1つ以上のバイオマーカーを、1つ以上のパネル内に含めることができる。パネルを含むバイオマーカーの数は重要ではなく、限定はしないが、1つのバイオマーカー、2つのバイオマーカー、3つのバイオマーカー、4つのバイオマーカー、5つのバイオマーカー、6つのバイオマーカー、7つのバイオマーカー、8つのバイオマーカー、9つのバイオマーカー、10つのバイオマーカー、11つのバイオマーカー、12つのバイオマーカー、13つのバイオマーカー、14つのバイオマーカー、15つのバイオマーカー、16つのバイオマーカー、17つのバイオマーカー、18つのバイオマーカー、19つのバイオマーカー、20つのバイオマーカー、などでありうる。
以上で言及したように、試験試料を得た後、本発明の方法には、試験試料中の1つ以上のバイオマーカーの存在を同定し、ついで定量することが含まれる。肺がんの危険性にあると疑われる患者の診断において、有用であるか、または有用であると信じられている任意のバイオマーカーを、本明細書で記述している方法にて定量可能であり、1つ以上のパネル内に含めることができる。その結果、1つの態様において、パネルは、1つ以上のバイオマーカーを含んでよい。パネルに含めることができるバイオマーカーの例には、限定はしないが、抗−p53、抗−TMP21、抗−ニーマン−ピック C1−様タンパク質1、C末端ペプチド−ドメイン(抗−NPC1L1C−ドメイン)、抗−TMOD1、抗−CAMK1、抗−RGS1、抗−PACSIN1、抗−RCV1、抗−MAPKAPK3、(配列番号1、配列番号3、配列番号4、配列番号5、またはそれらの任意の組合せに対する抗体のような)免疫反応性サイクリンE2に対する少なくとも1つの抗体、限定はしないが、がん胎児性抗原(CEA)、がん抗原125(CA125)、がん抗原15−3(CA15−3)、プロガストリン放出ペプチド(proGRP)、扁平上皮細胞抗原(SCC)、サイトケラチン8、サイトケラチン19ペプチドまたはタンパク質(本明細書で、単に「CK−19、CYFRA21−1、Cyfra」とも呼ばれる)およびサイトケラチン18ペプチドまたはタンパク質(CK18、TPS)、シアル酸残基が追加された、Lewis A血液集団であるがん抗原19−9(CA19−9)のような糖質抗原、血清アミロイドA、α−1−抗−トリプシンおよびアポリポタンパク質CIII、および限定はしないが、Acn6399、Acn9459、Pub11597、Pub4789、TFA2759、TFA9133、Pub3743、Pub8606、Pub4487、Pub4861、Pub6798、Pub6453、Pub2951、Pub2433、Pub17338、TFA6453およびHIC3959のような関心領域のような抗原が含まれる。
他の態様において、パネルは、少なくとも1つの抗体、少なくとも1つの抗原、少なくとも1つの関心領域、少なくとも1つの抗原および少なくとも1つの抗体、少なくとも1つの抗原および少なくとも1つの関心領域、少なくとも1つの抗体および少なくとも1つの関心領域および少なくとも1つの抗原、少なくとも1つの抗体および少なくとも1つの関心領域を含んでよい。パネル中に含めることができる少なくとも1つの抗体の例には、限定はしないが、抗−p53、抗−TMP21、抗−NPC1L1C−ドメイン、抗−TMOD1、抗−CAMK1、抗−RGS1、抗−PACSIN1、抗−RCV1、抗−MAPKAPK3、免疫反応性サイクリンE2に対する少なくとも1つの抗体が含まれる。パネル中に含めることができる少なくとも1つの抗原には、限定はしないが、サイトケラチン8、サイトケラチン19、サイトケラチン18、CEA、CA125、SCC、CA19−9、proGRP、血清アミロイドA、α−1−抗−トリプシンおよびアポリポタンパク質CIIIが含まれる。パネル内に含めることができる少なくとも1つの関心領域の例には、限定はしないが、Acn6399、Acn9459、Pub11597、Pub4789、TFA2759、TFA9133、Pub3743、Pub8606、Pub4487、Pub4861、Pub6798、Pub6453、Pub2951、Pub2433、Pub17338、TFA6453およびHIC3959が含まれる。さらに、特定の関心領域が、特定の他の関心領域と非常に相関し(これらの関心領域が、相互間で高い相関係数を有することを意味する)、したがって、本発明の文脈内で、相互に置換可能である。特に、これらの非常に相関した関心領域が、特定の相関しているファミリーまたは「群」へと組み立てられる。これらの「群」内に含まれる関心領域を、本発明の方法およびキット内で相互に置換可能である。これらの相関している関心領域のファミリーまたは「群」を以下に記述している。
群A:関心領域:Pub3448およびPub3493。
群B:関心領域:Pub4487およびPub4682。
群C:関心領域:Pub8766、Pub8930、Pub9142、Pub9216、Pub9363、Pub9433、Pub9495、Pub9648およびPub9722。
群D:関心領域:Pub5036、Pub5139、Pub5264、Pub5357、Pub5483、Pub5573、Pub5593、Pub5615、Pub6702、Pub6718、Pub10759、Pub11066、Pub12193、Pub13412、Acn10679およびAcn10877。
群E:関心領域:Pub6391、Pub6533、Pub6587、Pub6798、Pub9317およびPub13571。
群F:関心領域:Pub7218、Pub7255、Pub7317、Pub7413、Pub7499、Pub7711、Pub14430およびPub15599。
群G:関心領域:Pub8496、Pub8546、Pub8606、Pub8662、Pub8734、Pub17121およびPub17338。
群H:関心領域:Pub6249、Pub12501およびPub12717。
群I:関心領域:Pub5662、Pub5777、Pub5898、Pub11597およびAcn11559。
群J:関心領域:Pub7775、Pub7944、Pub7980、Pub8002およびPub15895。
群K:関心領域:Pub17858、Pub18422、Pub18766およびPub18986。
群L:関心領域:Pub3018、Pub3640、Pub3658、Pub3682、Pub3705、Pub3839、Hic2451、Hic2646、Hic3055、Tfa3016、Tfa3635およびTfa4321。
群M:関心領域:Pub2331およびTfa2331。
群N:関心領域:Pub4557およびPub4592。
群O:関心領域:Acn4631、Acn5082、Acn5262、Acn5355、Acn5449およびAcn5455。
群P:関心領域:Acn6399、Acn6592、Acn8871、Acn9080、Acn9371およびAcn9662。
群Q:関心領域:Acn9459およびAcn9471。
群R:関心領域:Hic2506、Hic2980、Hic3176およびTfa2984。
群S:関心領域:Hic2728およびHic3276。
群T:関心領域:Hic6381、Hic6387、Hic6450、Hic6649、Hic6816およびHic6823。
群U:関心領域:Hic8791およびHic8897。
群V:関心領域:Tfa6453およびTfa6652。
群W:関心領域:Hic6005およびHic5376。
群X:関心領域:Pub4713、Pub4750およびPub4861。
本発明の方法にて使用可能な好ましいパネルには、限定はしないが、
1.少なくとも1つのバイオマーカーを含むパネルで、前記バイオマーカーが、少なくとも1つの抗体と少なくとも1つの抗原である。本パネルはまたさらに、少なくとも1つの関心領域のようなさらなるバイオマーカーを含み得る。
2.少なくとも1つのバイオマーカーを含むパネルで、前記バイオマーカーが、免疫反応性サイクリンE2に対する少なくとも1つの抗体を含む。さらに、本パネルはまた場合によりさらに、試験試料中の、少なくとも1つの抗体、少なくとも1つの抗原、少なくとも1つの抗原および少なくとも1つの抗体、少なくとも1つの関心領域、少なくとも1つの抗原および少なくとも1つの関心領域および少なくとも1つの抗体および少なくとも1つの抗原、少なくとも1つの抗体および少なくとも1つの関心領域のような、さらなるバイオマーカーを含み得る。
3.少なくとも1つのバイオマーカーを含むパネルで、バイオマーカーが、サイトケラチン8、サイトケラチン19、サイトケラチン18、CEA、CA125、SCC、proGRP、血清アミロイドA、α−1−抗−トリプシンおよびアポリポタンパク質CIIIからなる群より選択される。本パネルは場合によりさらに、試験試料中の、少なくとも1つの抗体、少なくとも1つの関心領域、少なくとも1つの関心領域と少なくとも1つの抗体のようなさらなるバイオマーカーを含み得る。
4.少なくとも1つのバイオマーカーを含むパネルで、バイオマーカーが、Acn6399、Acn9459、Pub11597、Pub4789、TFA2759、TFA9133、Pub3743、Pub8606、Pub4487、Pub4861、Pub6798、Pub6453、Pub2951、Pub2433、Pub17338、TFA6453およびHIC3959からなる群より選択される、少なくとも1つの関心領域である。パネルはまた場合によりさらに、試験試料中の、少なくとも1つの抗原、少なくとも1つの抗体および少なくとも1つの抗原と少なくとも1つの抗体のような、さらなるバイオマーカーを含み得る。
5.パネル中の少なくとも1つのバイオマーカーを含むパネルで、少なくとも1つのバイオマーカーが、サイトケラチン8、サイトケラチン19、サイトケラチン18、CEA、CA125、SCC、proGRP、血清アミロイドA、α−1−抗−トリプシンおよびアポリポタンパク質CIII、Acn6399、Acn9459、Pub11597、Pub4789、TFA2759、TFA9133、Pub3743、Pub8606、Pub4487、Pub4861、Pub6798、Pub6453、Pub2951、Pub2433、Pub17338、TFA6453およびHIC3959からなる群より選択される。パネルはまた場合によりさらに、少なくとも1つの抗体のようなさらなるバイオマーカーを含み得る。好ましいパネルは、サイトケラチン19、CEA、ACN9459、Pub11597、Pub4789およびTFA2759;サイトケラチン19、CEA、ACN9459、Pub11597、Pub4789、TFA2759およびTFA9133;サイトケラチン19、CA19−9、CEA、CA15−3、CA125、SCC、サイトケラチン18およびProGRP;Pub11597、Pub3743、Pub8606、Pub4487、Pub4861、Pub6798、Tfa6453およびHic3959;およびサイトケラチン19、CEA、CA125、SCC、サイトケラチン18、ProGRP、ACN9459、Pub11597、Pub4789、TFA2759、TFA9133を含むパネルである。
試験試料中の1つ以上のバイオマーカーの存在および量を、当業者に公知の日常の技術を用いて得ること、および定量が可能である。たとえば、試験試料中の抗原または抗体を定量するための方法が、当業者に周知である。たとえば、試験試料中の1つ以上の抗原または抗体の存在および定量化を、当技術分野で公知の1つ以上の免疫アッセイを用いて決定可能である。免疫アッセイには典型的に、(a)バイオマーカー(すなわち抗原または抗体)に特異的に結合する抗体(または抗原)を提供すること、(b)試験試料を抗体または抗原に接触させること、および(c)試験試料中の抗原に結合した抗体の複合体、または試験試料中の抗体に結合した抗原の複合体の存在を検出すること、が含まれる。
抗原に特異的に結合する抗体を調製するために、精製抗原または精製抗原の核酸配列を使用可能である。抗原の核酸およびアミノ酸配列は、これらの抗原のさらなる特性化によって得ることができる。たとえば、抗原は、多数の酵素(たとえばトリプシン、V8プロテアーゼなど)でマップしたペプチドでありうる。各抗原からの消化断片の分子量を、種々の酵素によって産出された消化断片の分子量と一致する配列に関して、SwissPortデータベースのようなデータベースを検索するために使用可能である。本方法を用いて、他の抗原の核酸およびアミノ酸配列を、これらの抗原がデータベース中の公知のタンパク質であるかどうか同定可能である。
あるいは、タンパク質を、タンパク質ラダーシークエンシングを用いて配列決定可能である。タンパク質ラダーは、たとえば分子を断片化し、断片を酵素消化にかけることによって、または断片の末端から単一アミノ酸を連続して除去する他の方法によって、産出可能である。タンパク質ラダーを調整する方法は、たとえば国際公開番号第WO93/24834号および米国特許第5,792,664号にて記述されている。ついでラダーを質量分析によって解析する。ラダー断片の質量における差違が、分子の末端から除去したアミノ酸を同定する。
抗原がデータベース中で未知である場合、核酸およびアミノ酸配列は、抗原のアミノ酸配列の一部分の知識で決定可能である。たとえば、変性プローブを、抗原のN−末端アミノ酸配列に基づいて作製可能である。これらのプローブをついで、抗原が最初に検出された試料から作製されるゲノムまたはcDNAライブラリーを検査するために使用可能である。陽性クローンを同定し、増幅し、それらの組換えDNA配列を、周知の技術を用いてサブクローン化可能である。たとえばCurrent Protocols for Molecular Biology(Ausubel et al.,Green Publishing Assoc.and Wiley−Interscience 1989)およびMolecular Cloning:A Laboratory Manual,2nd Ed.(Sambrook et al.,Cold Spring Harbor Laboratory,NY 1989)を参照のこと。
精製した抗原またはその核酸配列を用いて、抗原に特異的に結合した抗体を、当分野で公知の任意の適切な方法を用いて調製可能である(たとえば、Coligan,Current Protocols in Immunology(1991);Harlow & Lane,Antibodies:A Laboratory Manual (1988);Goding,Monoclonal Antibodies:Principles and Practice(2d ed.1986)およびKohler & Milstein,Nature 256:495−497(1975)を参照のこと)。そのような技術には、限定はしないが、ファージまたは同様のベクター中の組換え抗体のライブラリーからの抗体の選別による抗体の調製、ならびにウサギまたはマウスを免疫化することによるポリクローナルおよびモノクローナル抗体の調製が含まれる(たとえば、Huse et al.,Science 246:1275−1281(1989)、Ward et al.,Nature 341:544−546(1989)を参照のこと)。
抗体が提供された後、抗原を、任意の多数のよく認識されている免疫学的結合アッセイを用いて検出および/または定量可能である(たとえば、米国特許番号第4,366,241号、第4,376,110号、第4,517,288号、および第4,837,168号を参照のこと)。本発明の使用可能なアッセイには、たとえば、「サンドイッチアッセイ」としても公知である酵素免疫吸着アッセイ(ELISA)、酵素免疫アッセイ(EIA)、放射免疫アッセイ(RIA)、蛍光免疫アッセイ(FIA)、化学発光免疫アッツセイ(CLIA)、カウンティング免疫アッセイ(CIA)、フィルターメディア酵素免疫アッセイ(MEIA)、蛍光連結免疫吸着アッセイ(FLISA)、凝集免疫アッセイおよび(Luminex(商標) LabMPAのような)多重蛍光免疫アッセイなどが含まれる。一般的な免疫アッセイの総説として、また、Methods in Cell Biology:Antibodies in Cell Biology、37巻(Asai,ed.1993)、Basic and Clinical Immunology(Stites & Terr,eds.,7th ed.1991)を参照のこと。
一般的に、被験者から得た試験試料は、抗原に特異的に結合する抗体を接触させることができる。場合によって、抗体を、その抗体と試験試料を接触させる前に、複合体の洗浄および続く単離を促進するために、固体支持体に固定化可能である。固体支持体の例には、たとえば、マイクロタイタープレート、ガラス顕微鏡スライドまたはカバースリップ、スティック、ビーズまたはマイクロビーズの形態での、ガラスまたはプラスチックが含まれる。抗体はまた、以上のように記述されたプローブ基質またはProteinChip(商標)アレイに結合させることも可能である(たとえば、Xiao et al.,Cancer Research 62:6029−6033(2001)を参照のこと)。
抗体との試料のインキュベートしたの後、混合液を洗浄し、形成した抗体−抗原複合体を検出可能である。このことは、洗浄した混合液を、検出試薬と一緒にインキュベートすることによって達成可能である。本検出試薬は、たとえば、検出可能な標識で標識化された二次抗体であってよい。検出可能な標識に関して、当分野で公知の任意の検出可能な標識を使用可能である。たとえば、検出可能な標識は、(たとえば、3H、125I、35S、14C、32Pおよび33Pのような)放射活性標識、(たとえばホースラディッシュペルオキシダーゼ、アルカリホスファターゼ、グルコース6−リン酸デヒドロゲナーゼなどのような)酵素標識、(たとえばアクリジニウムエステル類、アクリジニウムチオエステル類、アクリジニウムスルホンアミド類、フェナンスリジニウム エステル類、ルミナール、イソルミノールなどのような)化学発光標識、(たとえばフルオレセイン(たとえば5−フルオレセイン、6−カルボキシフルオレセイン、3’6−カルボキシフルオレセイン、5(6)−カルボキシフルオレセイン、6−カルボキシフルオレセイン、6−テトラクロロフルオレセイン、フルオレセイン イソチオシアネートなど)のような蛍光標識、ローダミン、ヒコビリタンパク質、R−フィコエリスリン、量子ドット(たとえば硫化亜鉛キャップカドミウムセレナイド)、温度標識、または免疫−ポリメラーゼ連鎖反応標識であってよい。標識への導入、標識化手順および標識の検出は、モレキュラー プローブス社(Molecular Probes Inc.、Eugene,Oregon)によって発行された混合ハンドブックおよびカタログである、Polak and Van Noorden,Introduction to Immunocytochemistry,2nd ed.,Spring Verlag,N.Y.(1997)およびHaugland,Handbook of Fluorescent Probes and Research Chemicals(1996)で見つけられる。あるいは、試料中のマーカーを、間接的アッセイを用いて、たとえば二次、標識化抗体を用いて、結合したマーカー−特異的抗体を検出する、および/またはたとえば抗原の異なるエプトープに結合するモノクローナル抗体を混合液と同時にインキュベートする、競合または阻害アッセイにて検出可能である。
アッセイを通じて、インキュベーションおよび/または洗浄段階が、試薬の各混合の後に必要となりうる。インキュベーション段階は、約5病間〜数時間で変化可能であり、好ましくは、約5分間〜約24時間である。しかしながら、インキュベーション時間は、アッセイの形式、バイオマーカー(抗原)、溶液の容量、濃度などに依存しうる。10℃〜40℃のような温度の範囲で実施可能であるけれども、通常、アッセイは、室温にて実施する。
免疫アッセイ技術は当分野で周知であり、適用可能な技術の一般的総説が、上記Harlow & Laneにて見ることができる。
免疫アッセイを、被験者からの試料中の抗原の試験量を決定するために使用可能である。まず、試料中の抗原の試験量を、以上で記述した免疫アッセイ法を用いて検出可能である。抗原が試料中に存在したならば、以上で記述した適切なインキュベーション条件下、抗原に特異的に結合する抗体との抗体−抗原複合体を形成する。抗体−抗原複合体の量を、標準と比較して決定可能である。抗原に対するAUCをついで、限定はしないが、ROC解析のような、公知の技術を用いて計算可能である。あるいは、DFIを計算可能である。AUCが約0.5より大きいか、またはDFIが約0.5未満の場合、免疫アッセイを使用して、(がん、好ましくは肺がんのような)疾患の被験者を、正常(または良性)被験者から判別可能である。
多数の抗原に対する免疫アッセイキットが市販されている。たとえば、サイトケラチン19を定量化するためのキットが、H.Hoffmann−La Roche Ltd,(Basel,Switzerland)およびAkitengescellschaft、Hennigsdorf,Germanyより入手可能であり、サイトケラチン18を定量化するためのキットが、IDL Biotech AD、Bromma,Swedenより、CA125k、CEA SCCおよびCA19−9を定量化するためのキットが、それぞれAbbott Diagnostics、Abbott Park,IL、およびH.Hoffmann−La Roche Ltd.から、血清アミロイドAおよびアポリポタンパク質CIIIを定量化するためのキットが、Linco Research,Inc.St.Charles,MOから、ProGRPを定量化するためのキットが、アドバンスド ライフ サイエンス インスティテュート社(Advanced Life Science Institute,Inc.)(和光、日本)、およびIBL イムノ−バイオロジカル ラボラトリーズ(IBL Immuo−Biological Laboratories、Hamburg,Germany)から、そしてα1抗トリプシンを定量化するためのキットが、オートイムノ ダイアグノスティカ GMBH(Autoimmune Diagnostica GMBH、Strassberg,Germany)およびゲンウェイ バイオテック社(GenWay Biotech,Inc.、San Diego,CA)から入手可能である。
試験試料中の1つ以上の抗体の存在および定量化を、以上で記述したようなものと同様の免疫アッセイを用いて決定可能である。そのような免疫アッセイは、以上で記述した抗体および抗原の役割が逆であるという事実を除いて、上記免疫アッセイと同様の様式で実施する。たとえば、実施可能である免疫アッセイの1つの型は、自己抗体ビーズアッセイである。本アッセイにおいて、(バイオモル インターナショナルL.P.(BioMol International L.P.、Plymouth Landing,Pennsylvania)から購入可能な)市販されているp53のような抗原を、固体支持体、たとえばビーズ、プラスチックマイクロプレート、ガラス顕微鏡スライドまたはカバースリップ、またはタンパク質抗原に結合するニトロセルロースのような物質からなる膜に、当分野で公知の日常の技術を用いて、または本明細書実施例3で記述した技術および方法を用いて、固定化可能である。あるいは、抗原が市販されていない場合、がん細胞株(好ましくは肺がん細胞株)、または被験者の自身のがん組織(好ましくは肺がん組織)から抗原を精製してよく(S−H Hong,et al.、Cancer Research 64:5504−5510(2004)を参照のこと)、またはcDNAクローンより発現させてよい(Y−L Lee,et al.,Clin.Chem.Acta 349:87−96(2004)を参照のこと)。抗原を含むビーズをついで、試験試料と接触させる。試験試料を、結合した抗原を含むビーズとともにインキュベートした後、ビーズを洗浄し、形成した任意の抗体−抗原複合体を検出する。この検出は、以上で記述したように実施可能であり、すなわち、洗浄したビーズを検出試薬とともにインキュベートすることによって実施可能である。本検出試薬は、たとえば検出可能標識によって標識化した、(限定はしないが、抗−ヒト免疫グロブリンG(IgG)、抗−ヒト免疫グロブリンA(IgA)、抗−ヒト免疫グロブリンM(IgM)のような)二次抗体であってよい。検出の後、抗体−抗原複合体の量を、以上で記述したように、シグナルを、標準によって産出されたものと比較することによって決定可能である。あるいは、抗体−抗原複合体を、免疫グロブリンの多価特性の利点を利用することによって決定可能である。抗体−抗原複合体を、抗−ヒト抗体と反応させる代わりに、抗体−抗原複合体を、固体相に結合した抗原と同一のエピトープを含む、検出可能な標識で標識化した可溶性抗原に暴露可能である。任意の占有されていない抗体結合部位が、(検出可能な標識にて標識化された)可溶性抗原に結合する。洗浄の後、検出可能標識を、当業者に公知の日常の技術を用いて検出する。上記方法のいずれかによって、試験試料中の特異的抗体の、感度がよく、特異的な定量化が可能になる。抗体(およびしたがって、被験者の肺がんの検出のための、自己抗体のような抗体の利用)に対するAUCをついで、限定はしないがROC解析のような、当業者に公知の日常の方法を用いて計算可能である。あるいは、DFIを計算可能である。AUCが約0.5より大きいか、またはDFIが約0.5未満の場合、免疫アッセイを使用して、(がん、好ましくは肺がんのような)疾患の被験者を、正常(または良性)被験者から判別可能である。
関心領域の存在および量を、質量スペクトル技術を用いて決定可能である。質量分析を用いて、本発明者らは、試験試料中の肺がんの診断およびスクリーニングにおける補助として有用である、212の関心領域を発見した。特に、質量スペクトル技術を、試験試料中の1つ以上のバイオマーカーを検出および定量するために使用する場合、試験試料はまず質量スペクトル解析のために調製されなければならない。試料調製を、種々の方法、しかしもっとも一般的に使用される、固相に結合した1つ以上の吸着剤と試料を接触させることを含む方法で実施可能である。吸着剤は、アニオン性またはカチオン性基、疎水性基、金属リガンドありまたはなしの金属キレーティング基、ポリクローナルまたはモノクローナルいずれかの抗体、または同族抗体に結合するのに好適な抗原であってよい。固相は、金属、ガラスまたはプラスチックからなる平面表面であってよい。固相はまた、マイクロ粒子性質を有するもの、表面積を増加させるための、マイクロビーズ、非結晶質性粒子、または不溶性ポリマーのいずれか、であってよい。さらに、マイクロ粒子物質は、操作の簡便性のために磁気的でありうる。関心のバイオマーカーを、固相に吸着させ、バルク分子を洗浄によって除去する。質量解析のために、関心のバイオマーカーを、吸着剤に対するバイオマーカーの親和力を減少させる溶媒で、固相より溶出する。ついでバイオマーカーを解析のために質量分析器に導入する。好ましくは、異常スペクトルが同定され、スペクトルを評価する場合に無視する。さらに、上記のような免疫アッセイも使用可能である。免疫アッセイの完了に際して、解析物を、免疫学的表面から溶出して、解析のために質量分析器に導入可能である。
一旦試験試料が調製されたならば、質量解析器に導入する。レーザー脱着イオン化(たとえばMALDIまたはSELDI)が、固体形態で存在する試料に対する一般的な技術である。本技術において、試料を、標的プレート上で、レーザーエネルギーを吸収し、試料に伝達することにおいて効果的なマトリックスとともに共結晶化する。作製されたイオンを分離し、計数し、公知の質量と電荷のイオンに対して較正する。任意の試料に対して回収した質量データは、特定の質量/電荷(m/z)比でのイオン計数である。異なる試料調製法および異なるイオン化技術が異なるスペクトルを産出することが予想される。
質量スペクトルデータに対する認定試験は一般的に、本来のデータの最小限の前処理での外れ値解析の正確な処理を含む。外れ値の同定の工程は、生スペクトルの総イオン電流(TIC)の計算で開始される。TIC計算の前に、スムーシングまたはベースライン補正アルゴリズムは、生スペクトルに対して適用しない。TICは、検出した質量(m/z)範囲にわたる、各m/z値での強度を合計することによって計算する。これにより、器具不具合、試料スポッティング問題、および他の同様の欠陥が選別される。TICに加えて、それぞれの試料の全スペクトルにわたる平均%CV(パーセント変動係数)を計算する。それぞれの試料に対する反復測定の回数を用いて、検出された質量範囲にわたり、m/z値ごとに%CVを計算する。次いでこれらの%CVを平均して、特定の試料を代表する平均%CVを得る。平均%CVは異常値を特定するための第一の選別工程として用いてもよいし、そのように用いなくともよい。一般に、平均%CVが高い反復(30%以上またはその他の任意の許容範囲の値)は再現性が乏しい。
上記のように、それぞれのスペクトルの計算されたTICおよび平均%CVは再現性およびスペクトルの有益な部分を限定するための予測因子として用いることができる。しかし、これらの測定によって、スペクトルのバルク特性に関する良い記述子が得られる一方、それぞれのm/z値での個々の強度などのスペクトルの顕著な特性の再現性についての情報は少しも得られない。この障害は、Wan et. al.(J.Am.Soc.Mass Spectrom.2002,13,85−88)に報告されたSpectral Contrast Angle(SCA)計算の適合によって克服された。SCA計算では、全スペクトルを、個々のm/z値から成るベクターとして扱う。この解釈では、標準的な数式から2つのベクター間のシータ(θ)角が得られる。
同じようなスペクトルでは、シータは小さく、0に近くなる。
使用する際、試料複製についてかまたは特定の群(例えば、がん群)の中の全試料についての平均スペクトルを最初に計算することによって計算と比較の総数を減らす。次に、それぞれのスペクトルと計算された平均スペクトルとの間のSCAを計算する。平均スペクトルと大幅に異なるスペクトルは、もし下記の基準に合致すれば、異常値と見なす。
1つの予測因子では質量スペクトルを完全に説明するのに不十分であるので、異常値を選択するためには1つ以上の予測因子を用いることが好ましい。多変量異常値分析は多数の予測因子を用いて行なうことができる。これらの予測因子は、TIC、平均%CV、およびSCAであってよいが、これらに限定されない。JMP(商標)統計パッケージ(SAS Institute Inc.,Cary,NC)を用い、群(例えば、がん群)中のそれぞれの反復測定について、マハラノビスの距離を計算した。基準値(信頼限界ではない)は、観測値の約95%がその値を下回るように算出することができる。基準値を上回る残りの5%は異常値と見なし、さらなる分析からは除外する。
質量スペクトルデータの限定後、通常スペクトルを正規化し、TICがデータセット中の全てのスペクトルに対して同じになるように強度を見積もるか、全スペクトルにおける1つのピークに応じて強度を見積もる。
正規化した後、質量スペクトルを一連の強度特性に減少する。他の応用では、m/z値におけるスペクトル強度一覧へのこれらの限定は生体分子と関連する。別種の特性、関心領域またはROIを用いることが好ましい。
関心領域は、被験者の2つ以上のデータセット間の比較の産物である。データセットは、関心の群(例えば、罹患群、非罹患群)を表す。全試料について、各々のm/z値における強度値に対してt検定を行なう。t検定のp値が技師指定の基準値未満であるm/z値を特定する。特定されたm/z値の、連続しているものをグループ化して被験者領域として定義する。ROIおよび連続した群の任意の許容間隙を形成するために必要な連続m/z値の最小数は、使用者が規定することができる。ROIを限定する他の因子は、2つの群の平均値の比率の対数の絶対値である。この値がある基準のカットオフ値(10進法の対数を用いた場合、約0.6)を上回る場合、質量対電荷の場所はROIに含める被験者になる。ROI法を用いる利点は、2種類のスペクトル間の高強度のパターンの違いのフラグになるだけでなく、肩などのよりわずかな違いや、ピーク発見法では見逃してしまうであろう非常に低い強度も発見することができることである。
被験者領域が決定されたら、ROIの範囲内のm/z値の平均値または中央値をその領域の特定因子として用いることが多い。それぞれの領域はデータセットを識別する潜在的マーカーである。さまざまなパラメーター(例えば、総強度、最大強度、中央強度、または平均強度)は、試料データから抽出することができ、ROIと関連する。このように、それぞれの試料スペクトルは何千ものm/z、212のROIに対する強度対およびその特定因子、強度関数対から限定された。これらの記述子はデータ分析法の入力変数として用いる。
本発明の方法には、場合により、試験試料を得る前かまたは試験試料を得た後、そして試験試料中の1つ以上のバイオマーカーを同定し定量化する前または、試験試料中の1つ以上のバイオマーカーを同定して定量化した後に、被験者から少なくとも1つの生物測定パラメーターを得る段階を含むことができる。被験者から得る生物測定パラメーターの数は決定的に重要ではない。例えば、1、2、3、4、5、6、7、8、9、10などの生物測定パラメーターを被験者から得ることができる。あるいは、本発明の方法に被験者から任意の生物測定パラメーターを得る段階を含む必要はない。被験者から得る好ましい生物測定パラメーターは被験者の喫煙歴、具体的には被験者の喫煙パックイヤー(pack−years)である。被験者から得ることができる他の生物測定パラメーターとしては、年齢、発がん物質への暴露、性、家族の喫煙歴などが挙げられるが、それらに限定されない。
前記のように、本発明の方法においては、試験試料を分析してパネル中に含まれる1つ以上のバイオマーカーの存在を判定する。試験試料中にバイオマーカーが存在すると判定されたら、その検出されたバイオマーカーを定量化する(本明細書で前述した手法を用いて行なう)。試験試料中のそれぞれのバイオマーカーの量が定量化されたら、次に定量化されたそれぞれのバイオマーカーの量を特定のバイオマーカーに対する所定のカットオフ(通常は整数などの値または数字、あるいは本明細書では「分割点」(“split point”)と称する)と比較する。本発明の方法において採用される所定のカットオフは、当技術分野で公知の日常の手法(例えば、多変量解析(図1を参照されたい)、Transformedロジスティック回帰分析、分割スコア法(Split and Score Method)、またはそれらの任意の組合せなどが挙げられるが、それらに限定されない)を用いて決めることができる。例えば、分割スコア法(Split and Score Method)を用いた場合、規定のカットオフの値または数字は得られるべき所望の結果次第で決められる。得られるべき所望の結果が、関心の群のそれぞれのマーカーの正分類の正確さを最大にする、すなわち、肺がん発症の危険性がある被験者と肺がん発症の危険性がない被験者を正確に識別する目的のものであれば、そうした所望の結果に基づいたバイオマーカーに対する所定のカットオフのために、特定の値または数字が選択される。一方、所望の結果が、それぞれのマーカーの感度を最大にする目的のものであれば、所定のカットオフのための異なる値または数値が、その所望の結果に基づくバイオマーカーに対して選択される。同様に、所望の結果がそれぞれのマーカーの特異性を最大にする目的のものであれば、所定のカットオフのための異なる値または数値が、その所望の結果に基づくバイオマーカーに対して選択される。試験試料中に存在する任意のバイオマーカーの量が定量化されれば、この情報は、当業者が所望の結果次第で決まるそれぞれのバイオマーカーに対する適切な所定のカットオフを所定の手法を用いて決定するために使用するROC曲線、AUCおよびの他の情報を作成するために用いることができる。それぞれのバイオマーカーの量を所定のカットオフと比較した後、スコア(すなわち数字で、例えば0から100などの任意の整数であってよい)を、その比較に基づいてそれぞれのバイオマーカーに割り当てる。さらに、1つ以上のバイオマーカーに加え、被験者に対して1つ以上の生物測定パラメーターを得た場合、それぞれの生物測定パラメーターを、その生物測定パラメーターに対する所定のカットオフと比較する。任意の生物測定パラメーターに対する所定のカットオフは、1つ以上のバイオマーカーに対する所定のカットオフの決定に関して本明細書に記載したものと同様の手法を用いて決定することができる。バイオマーカーの比較と同様に、スコア(すなわち数字で、例えば0から100などの任意の整数であってよい)を前述の比較に基づいて生物測定パラメーターに割り当てる。
あるいは、上記のスコア法を用いる代わりに、分割加重スコア法(Split and Weighted Scoring Method)を用いることができる。分割加重スコア法(Split and Weighted Scoring Method)を用いた場合、試験試料中のそれぞれのバイオマーカーの量を定量化したら、その、試験試料中に検出されたそれぞれのバイオマーカーの量をその特定のバイオマーカーに対する多数の所定のカットオフと比較する。得られる種々のカットオフ全てから、1つのスコア(すなわち数字で、例えば0から100などの任意の整数であってよい)をそのバイオマーカーに割り当てる。この分割加重スコア法(Split and Weighted Scoring Method)はまた、1つ以上の生物測定パラメーター(biometric parameter)にも同様に使用できる。
定量化したそれぞれのバイオマーカーに対して、または場合によっては被験者から得られた任意の生物測定パラメーターに対して、スコアが割り当てられたら、それぞれのバイオマーカー、またはそれぞれのバイオマーカーおよびそれぞれの生物測定パラメーターに対するスコアを総合して被験者の総スコアを出す。次にこの総スコアを既定の総スコアと比較する。この比較に基づいて、被験者に肺がんの危険性があるか否かを決定することができる。この、被験者に肺がんを発症する危険性があるか否かの決定は、総スコアが既定の総スコアよりも高いか、または低いか、否かに基づいてよい。例えば、既定の総スコアに割り当てられた値に基づいて、規定の総スコアよりも総スコアが高い被験者は、危険性が高いと考えてよく、よってさらなる試験または追加処置へと差し向けられうる。本方法で用いる既定の総スコア(あるいは、本明細書において「基準点(threshold)」と称する)は、バイオマーカーに対する既定のスコアに関して前記したものと同様の手法を用いて決定することができる。例えば、図5は3つのROC曲線である。これらのROC曲線はそれぞれ組み合わせたマーカーからの単一の出力を示すが、しかし、ただひとつのマーカーからも同様のROC曲線ができると思われる。ROC曲線は、一方の端、低感度および低擬陽性率(1特異性)から他方の端、高感度および高偽陽性率までにわたる。これらの2端間の曲線の形状は大きく変化しうる。感度が少なくとも90%であることが求められる方法の場合、図5に示すROC曲線に基づき、選択した曲線によって偽陽性率は60〜70%になると思われる。偽陽性が多くとも10%であることが求められる方法の場合には、選択した曲線によって、感度は40〜50%になると思われる。これらの方法はどちらもマーカーの同じパネルから得られるがしかし、異なる臨床成績特性を規定するために、パネルの基準点(または既定の総スコア)を変更する。計算上、ROC曲線上のそれぞれの点の下にあるのがデータ範囲の一方の端からデータ範囲の他方の端まで動く基準点(または既定の総スコア)である。基準点(または既定の総スコア)がデータ範囲の下端にある場合、全ての試料は陽性であり、ROC曲線上に高感度かつ高偽陽性率の点が生じる。基準点(または既定の総スコア)がデータ範囲の上端にある場合、全ての試料は陰性であり、ROC曲線上に低感度かつ低擬陽性の点が生じる。方法は所望の臨床特性、例えば感度の最小値(すなわち、90%)、特異性の最小値(すなわち90%)、またはその両方などを有することを求められることが多い。マーカーの基準点(または既定の総スコア)を変えることが、所望の臨床特性を得る助けになる。
上記の工程、(a)所定のカットオフとパネル中のそれぞれのバイオマーカーの量(または、分割加重スコア法(Split and Weighted Scoring Method)を用いる場合には多数の所定のカットオフ)との比較、その比較に基づいてそれぞれのバイオマーカーにスコア(または、分割加重スコア法(Split and Weighted Scoring Method)を用いる場合には可能性のある多数のスコアの1つから得たスコア)の割り当てること、パネル中のそれぞれの生物測定パラメーターに対して割り当てられたスコアを総合して被験者の総スコアを出すこと、その総スコアを既定の総スコアと比較し、そして総スコアに基づいて被験者が肺がんの危険性を有するかどうかを決定すること、または(b)少なくとも1つの生物測定パラメーターと所定のカットオフ(または、分割加重スコア法(Split and Weighted Scoring Method)を用いる場合には多数のカトットオフ)との比較、およびその比較に基づいてそれぞれの生物測定パラメーターにスコア(または、分割加重スコア法(Split and Weighted Scoring Method)を用いる場合には可能性のある多数のスコアの1つから得たスコア)を割り当てること、パネル中のそれぞれのバイオマーカーの量と所定のカットオフとの比較、その比較に基づいてそれぞれのバイオマーカーにスコアを割り当てること、それぞれの生物測定パラメーターに割り当てられたスコアと定量化したそれぞれのバイオマーカーに割り当てられたスコアを総合して被験者の総スコアを出すこと、総スコアを既定の総スコアと比較し、そして総スコアに基づいて被験者が肺がんの危険性を有するかどうかを決定すること、は、例えばヒトによって手動で行なうことができ、またはコンピュータプログラムもしくはアルゴリズムを、入力装置、記憶装置、処理装置、表示装置、および出力装置などの必要なハードウェアを一緒に用いて完全にまたは部分的に行なうことができる。
例示のみの目的で、本発明の方法がどのように実行されるかをここで示す。この実施例においては、8つのバイオマーカーを含むパネルと分割スコア法(Split and Score Method)を用いて、患者を試験し、その患者が肺がんを有する尤度を決定する。パネル中のバイオマーカーは、サイトケラチン19、CEA、CA125、CA15−3、CA19−9、SCC、proGRP、およびサイトケラチン18である。パネルに対する既定の総スコア(または基準点(threshold))は3である。患者から試験試料を得た後、その患者の試験試料中の8つのバイオマーカー(サイトケラチン19、CEA、CA125、CA15−3、CA19−9、SCC、proGRP、およびサイトケラチン18)それぞれの量を定量化する。この実施例のために、試験試料中の8つのバイオマーカーそれぞれの量を以下の通り決定した。サイトケラチン19:1.95、CEA:2.75、CA125:15.26、CA15−3:11.92、CA19−9:9.24、SCC:1.06、proGRP:25.29、サイトケラチン18:61.13。次いでこれらのバイオマーカーそれぞれの量を対応する所定のカットオフ(または分割点)と比較する。バイオマーカーそれぞれに対する所定のカットオフは、サイトケラチン19:1.89、CEA:4.82、CA125:13.65、CA15−3;13.07、CA19−9:10.81、SCC:0.92、proGRP:14.62、そしてサイトケラチン18:57.37である。対応する所定のカットオフ(分割点)よりも量が多いバイオマーカーそれぞれに対して、スコア1を与えることができる。対応する所定のカットオフよりも量が少ないかまたは同量であるバイオマーカーにたいしてはスコア0を与えることができる。その結果、前述の比較に基づいて、それぞれのバイオマーカーには以下の通りスコアが割り当てられることになる。サイトケラチン19:1、CEA:0、CA125:1、CA15−3:0、CA19−9:0、SCC:1、proGRP:1、そしてサイトケラチン18:1。次いで8つのバイオマーカーそれぞれのスコアを数学的に(すなわち、バイオマーカーそれぞれのスコアを合計することによって)総合して患者の総スコアにたどり着く。本患者の総スコアは5(この総スコアは以下のように計算される。1+0+1+0+0+1+1+1=5)。この患者の総スコアを既定の総スコア、3と比較する。既定のスコア3よりも大きい総スコアは、その患者について陽性の結果であると示すことになる。3よりも小さい、または同じ総スコアは、その患者について陰性の結果であると示すことになる。本実施例では、患者の総スコアは3よりも大きいので、この患者は陽性の結果であると考えられ、よって肺がんの兆候または疑いに対するさらなる試験に回されることになる。一方、患者の総スコアが2であったら、その患者は陰性の結果であると考えられ、それ以上のどんな試験にも回されないことになる。
別の実施例においては、前述の8つのバイオマーカーパネルを再度用いるが、しかし本実施例では、分割加重スコア法(Split and Weighted Scoring Method)を採用する。本実施例においては、パネルに対する既定の総スコア(または基準点(threshold))は11.2であり、試験試料中の定量化されたバイオマーカーの量は前述したものと同じである。次いでそれぞれのバイオマーカーの量を、そのバイオマーカーそれぞれに対する3つの異なる所定のカットオフと比較する。例えば、それぞれのバイオマーカーに対する所定のカットオフを表Aに示す。
したがって、それぞれのバイオマーカーに対して4つの可能性のあるスコアが得られる。定量化されたそれぞれのバイオマーカーの量を上記表Aに示される所定のカットオフ(分割点)と比較する。例えばCEAについてみると、試験試料中の定量化されたCEA量は2.75であるから、表A中の50%特異性に対する所定のカットオフ値2.02と75%特異性に対する所定のカットオフ値3.3との間に収まる。故に、CEAにはスコア2.68が割り当てられる。このことを残るバイオマーカーについても繰り返し、同様に評価してそれぞれに以下のスコアを割り当てる。サイトケラチン18:2.6、proGRP:4.96、CA15−3:0、CA125:0、SCC:2.48、サイトケラチン19:8.4、CA19−9:0。次いで8つのバイオマーカーそれぞれのスコアを数学的に(すなわち、バイオマーカーそれぞれのスコアを合計することにより)総合して患者の総スコアにたどり着く。患者の総スコアは21.12(この総スコアは次のように計算される。2.68+2.6+4.96+0+0+2.48?8.4+0=21.12)。次に患者の総スコアを既定の総スコア、11.2と比較する。既定の総スコア11.2よりも大きい総スコアは、その患者については陽性の結果であると示すことになる。11.2よりも小さいかまたは等しい総スコアは、その患者については陰性の結果であると示すことになる。本実施例では、患者の総スコアは11.2よりも大きいので、この患者は陽性の結果を有すると考えられ、したがって、肺がんの兆候または疑いに対するさらなる試験に回されることになる。
さらに、本明細書に記載の分割加重スコア法(Split and Weighted Scoring Method)はまた、被験者から得られた1つ以上のマーカーにスコアをつけるためにも使用できる。好ましくは、そのようなマーカー(1つ以上のバイオマーカー、1つ以上の生物測定パラメーター、またはバイオマーカーと生物測定パラメーターとの組合せのいずれにせよ)は、被験者にがんまたは他のなんらかの疾病などの病状を発症する危険性があるかどうかを診断または評価するための補助として用いることができる。危険性を評価する為にマーカーを用いる、または用いることが可能な病状を本明細書の方法で用いることができる。そのような方法には、下記の段階が含まれる。
a.被験者から少なくとも1つのマーカーを得ること、
b.該被験者から得たマーカーの量の定量化、
c.定量化されたそれぞれのマーカーの量を該マーカーに対するいくつかの所定のカットオフと比較し、その比較に基づいてそれぞれのマーカーのスコアを割り当てること、および
d.段階Cにおいて、定量化されたそれぞれのマーカーに対して割り当てたスコアを総合して該被験者の総スコアを出すこと。
好ましくは、この方法には下記の段階が含まれる。
a.被験者から少なくとも1つのマーカーを得ること、
b.該被験者から得たマーカーの量の定量化、
c.定量化されたそれぞれのマーカーの量を該マーカーに対するいくつかの所定のカットオフと比較し、その比較に基づいてそれぞれのマーカーのスコアを割り当てること、
d.段階Cにおいて、定量化されたそれぞれのマーカーに割り当てたスコアを総合して
該被験者の総スコアを出すこと、
e.段階dにおいて決定した総スコアを既定の総スコアと比較すること、および、
f.段階eにおいて決定した総スコアに基づいて、該被験者が病状を発症する危険性を有するかどうかを決定すること。
DFI
本明細書において前述のように、出願者らは、1つ以上のバイオマーカー、またはバイオマーカーと生物測定パラメーターの組合せを検出および定量化することが、患者の肺がんを診断する補助として有効であることを見いだした。さらに発明者らは、本明細書に記載の1つ以上のバイオマーカー、および1つ以上のバイオマーカーと1つ以上の生物測定パラメーターの組合せで、肺がんに関連するDFIを有するものが約0.5未満、好ましくは約0.4未満、さらに好ましくは約0.3未満、そしてさらに好ましくは約0.2未満であることを見いだした。表25〜29は、DFIが約0.5未満、約0.4未満、約0.3未満、および約0.2未満である、さまざまなバイオマーカーまたはバイオマーカーと生物測定パラメーターの組合せを含むパネルの例を示す。
キット
本発明の方法を実行する際に使用するために、1つ以上のバイオマーカー、1つ以上の免疫反応性サイクリンE2ポリペプチド、生物測定パラメーター、およびそれらの任意の組合せをキット(パネルなどの)形成に適用できる。一態様においては、キットには配列番号1、配列番号3、配列番号4、配列番号5、またはそれらの組合せからなる群から選択されたペプチドを含めることができる。
別の態様においては、キットには免疫反応性サイクリンE2またはその任意の組合せに対する少なくとも1種の抗体を含めることができる。
また別の態様においては、キットには下記を含めることができる。
(a)試験試料中の1種以上種の抗原を定量化するための少なくとも1種の抗体を含む試薬(ただし、上記抗原としては、サイトケラチン8、サイトケラチン19、サイトケラチン18、CEA、CA125,CA15−3、SCC、CA19−9、proGRP、血清アミロイドA、α−1抗トリプシン、およびアポリポタンパク質CIII)、
(b)試験試料中の少なくとも1種の抗体を定量化するための1種以上種の抗原を含む試薬(ただし、上記抗体としては、抗p53、抗TMP21、抗NPCILICドメイン、抗TMODI、抗CAMKI、抗RGSI、抗PACSINI、抗RCVI、抗MAPKAPK3、および免疫反応性サイクリンE2に対する少なくとも1つの抗体)、
(c)ACN9459、Pub11597、Pub4789、TFA2759、Pub3743、Pub8606、Pub4487、Pub4861、Pub6798、Tfa6453、およびHic3959からなる群から選択された1つ以上の関心領域を定量化するための試薬、および
(d)試験試料中の、定量化されたそれぞれの抗原、抗体、および関心領域の量を総合して所定のカットオフ(または、多数の所定のカットオフ)に対する比較を行い、その比較に基づいて、定量化されたそれぞれの抗原、抗体、および関心領域に対するスコア(または、いくつか可能性のあるスコアの1つから得たスコア)を割り当て、定量化されたそれぞれの抗原、抗体、および関心領域に対して割り当てられたスコアを総合して総スコアを得て、その総スコアを既定の総スコアと比較し、患者が肺がんに罹患しているかどうかを決定する一補助としてその比較を用いる、という段階を行なうための1つ以上のアルゴリズムまたはコンピュータプログラム。
あるいは、1つ以上のコンピュータプログラムの代わりに、人間が上記段階を手動で行なうための1つ以上の説明書を備えることもできる。
1つ以上の関心領域を定量化するためにキットに含まれる試薬には、パネルに含まれる少なくとも1つの関心領域に結合して保持する吸着剤、その吸着剤に関連して用いる固体担体(ビーズなど)、1つ以上の検出可能な標識などを含めることができる。吸着剤は、分析化学および免疫化学において使用される多くの吸着剤のうち任意のものでよく、金属キレート、陽イオン基、陰イオン基、疎水基、抗原、および抗体が挙げられる。
さらに別の態様においては、キットには下記を含めることができる。
(a)試験試料中の1種以上種の抗原を定量化するための少なくとも1種の抗体を含む試薬(ただし、上記抗原としては、サイトケラチン19、サイトケラチン18、CA19−9、CEA、CA15−3、CA125、SCC、およびproGRP)、
(b)ACN9459、Pub11597、Pub4789、TFA2759、TFA9133、Pub3743、Pub8606、Pub4487、Pub4861、Pub6798、Tfa6453、およびHic3959からなる群から選択された1つ以上の関心領域を定量化するための試薬、および
(c)試験試料中の、定量化されたそれぞれの抗原および被験者領域の量を総合して所定のカットオフ(または、いくつかの所定のカットオフ)に対する比較を行い、その比較に基づいて、定量化されたそれぞれの抗原および被験者領域に対するスコア(または、いくつかの可能性のあるスコアの1つから得たスコア)を割り当て、定量化されたそれぞれの抗原および被験者領域に対して割り当てられたスコアを総合して総スコアを得て、その総スコアを既定の総スコアと比較し、患者が肺がんに罹患しているかどうかを決定する一補助としてその比較を用いる、という段階を行なうための1つ以上のアルゴリズムまたはコンピュータプログラム。あるいは、1つ以上のコンピュータプログラムの代わりに、人間が上記段階を手動で行なうための1つ以上の説明書を備えることもできる。1つ以上の関心領域を定量化するためにキットに含まれる試薬には、パネルに含まれる少なくとも1つの関心領域に結合して保持する吸着剤、その吸着剤に関連して用いる固体担体(ビーズなど)、1つ以上の検出可能な標識などを含めることができる。
キットには下記の抗原および関心領域を定量化するために必要な試薬が含まれることが好ましい。(a)サイトケラチン19およびCEAと、Acn9459、Pub11597、Pub4789およびTfa2759、(b)サイトケラチン19およびCAEと、Acn9459、Pub11597、Pub4789、Tfa2759、およびACN9459、および(c)サイトケラチン19、CEA、CA125、SCC、サイトケラチン18、およびproGRPと、ACN9459、Pub11597、Pub4789、およびTfa2759。
別の態様においては、キットには下記を含めることができる。(a)試験試料中の1種以上種の抗原を定量化するための少なくとも1種の抗体を含む試薬(ただし、上記抗原としては、サイトケラチン19、サイトケラチン18、CA19−9、CEA、CA15−3、CA125、SCC、およびProGRP)、(b)試験試料中の、定量化されたそれぞれの抗原の量を総合して所定のカットオフ(または、いくつかの所定のカットオフ)に対する比較を行い、その比較に基づいて、定量化されたそれぞれの抗原に対するスコア(または、いくつかの可能性のあるスコアの1つから得たスコア)を割り当て、定量化されたそれぞれの抗原に対して割り当てられたスコアを総合して総スコアを得て、その総スコアを既定の総スコアと比較し、患者が肺がんに罹患しているかどうかを決定する一補助としてその比較を用いる、という段階を行なうための1つ以上のアルゴリズムまたはコンピュータプログラム。
あるいは、1つ以上のコンピュータプログラムの代わりに、人間が上記段階を手動で行なうための1つ以上の説明書を備えることもできる。キットには1つ以上の検出可能な標識も含めることができる。キットには下記の抗原を定量化するために必要な試薬が含まれることが好ましい。サイトケラチン19、サイトケラチン18、CA19−9、CEA、CA15−3、CA125、SCC、およびProGRP。
別の態様においては、キットには下記を含めることができる。(a)1つ以上のバイオマーカーを定量化する試薬(ただし、上記バイオマーカーは、ACN9459、Pub11597、Pub4789、TFA2759、TFA9133、Pub3743、Pub8606、Pub4487、Pub4861、Pub6798、Tfa6453、およびHic3959からなる群から選択される被験者領域)、および、(b)試験試料中の、定量化されたそれぞれのバイオマーカーの量を総合して所定のカットオフ(または、いくつかの所定のカットオフ)に対する比較を行い、その比較に基づいて、定量化されたそれぞれのバイオマーカーに対するスコア(または、いくつかの可能性のあるスコアの1つから得たスコア)を割り当て、定量化されたそれぞれのバイオマーカーに対して割り当てられたスコアを総合して総スコアを得て、その総スコアを既定の総スコアと比較し、患者が肺がんに罹患しているかどうかを決定する一補助としてその比較を用いる、という段階を行なうための1つ以上のアルゴリズムまたはコンピュータプログラム。あるいは、1つ以上のコンピュータプログラムの代わりに、人間が上記工程を手動で行なうための1つ以上の説明書を備えることもできる。キット中の定量化されるべき関心領域は、Pub11597、Pub3743、Pub8606、Pub4487、Pub4861、Pub6798、Tfa6453、およびHic3959からなる群から選択されることが好ましい。1つ以上の関心領域を定量化するためにキットに含まれる試薬には、パネルに含まれる少なくとも1つの関心領域に結合して保持する吸着剤、その吸着剤と関連して用いる個体担体(ビーズなど)、1つ以上の検出可能な標識などを含めることができる。
バイオマーカーの同定
本発明のバイオマーカーは、当技術分野の技術者に周知の技術によって単離、精製、および同定することができる。その技術としては、クロマトグラフ法、電気泳動技術、および遠心分離法が挙げられる。これらの技術はCurrent Protocols in Protein Science、J.Wiley and Sons,New York,NY,Coligan et al.(Eds)(2002)およびHarris,E.L.V.,S.Angal in Protein Purification Applications: A Practical Approach,Oxford University Press,New York,NY(1990)などに記載されている。
ここで本発明の実施例を、それに限定するものではなく、一例として示す。
(実施例)
患者の血清の臨床試料を採取し(実施例1)、マーカー抗原免疫測定の分析をし(実施例2)、ビーズを用いてマーカー抗体免疫測定の分析(実施例3)またはスライドを用いてマーカー抗体免疫測定の分析をして(実施例4)、質量分析によりバイオマーカーを同定する(実施例5)。同定されたマーカーをさまざまなアルゴリズムを用いて分類し優先順位をつける(実施例6)。これらの優先順位をつけたマーカーを、スコア法を用いて総合し(実施例7)、予測モデルを同定して(実施例8)、臨床的有用性を評価する。肺がん罹患が疑われる患者における肺がん検出を補助する方法を用いた実施例を実施例9に例証している。対象領域の質量分析によって同定されたバイオマーカーは、分析しこの組成を決定して同定した(実施例10)。実施例11は、本発明に従って同定したバイオマーカーを、免疫測定法および免疫‐質量分析法を用いて検出、測定する方法が記載されている、机上実施例である。
臨床標本
患者の血清の臨床試料を、施設内倫理委員会(Institutional Review Board)で承認されたプロトコールの下で採取した。標本を提供した全ての患者は、採取され本研究に使用される標本についてインフォームド・コンセントを受けた。血清試料は、血清分離管中に入れて室温で15分間、凝固させた。この血餅を遠沈させて試料を2mLアリコートとした。24時間以内にこの試料を−80℃で凍結させ、さらに先の処理を行なうまでこの温度で維持した。受領次第、試料を解凍し、便宜上、より少ない量に再等分して再凍結させた。この試料は最終的に分析の直前に解凍した。したがって、ひとそろいの試料すべては、分析の前に2度凍結および解凍された。
全部で751標本を採取、分析した。群は、生検で肺がんが確認された250患者、生検で良性の肺疾患であると確認された274患者、および明らかに正常である227の被験者から構成される。がんおよび良性の患者は全て最終的な生検による診断で確認された。正常な被験者には、このような最終的な診断方法は行なわず、顕性悪性疾患が見られないことにより正常と判断された。最終的な診断方法の後、50歳以上の患者のみを選択した。この選択の後には、がん231、良性182、および正常155が残った。このがんの大コホート、良性肺疾患、および明らかに正常な被験者をまとめて以下「大コホート」と証する。良性肺疾患と肺がんとの区別に焦点を当てるために大コホートのサブセットを用いる。このコホートを以下「小コホート」と称し、これは肺がん138、良性106、および明らかに正常な被験者13からなる。大コホートから小コホートを除いた後には、肺がん107、良性74、および明らかに正常な被験者142が残った。このコホートは、小コホートに無関係で、発生した予測モデルを検証するために用いたもので、以下「検証コホート」と称する。記載のように調製した臨床試料は実施例2から10で用いた。
バイオマーカーの免疫測定検出
A.Abbott Laboratories(Abbott Park,IL,以下「Abbott」)Architect(商標)分析
以下の抗原、CEA、CA125、SCC、CA19−9、およびCA15−3のためにArchitect(商標)キットを入手した。分析は全てメーカーの説明書に従って行った。試料中の検体濃度は、Architect(商標)計器によって得た。これらの濃度を用いて下記表1に示すAUCデータを作成した。
B.Roche Elecsys(商標)分析
Elecsys(商標)2010 system(Roche Diagnostics GmbH,Mannheim,Germany)で、メーカーの説明書に従ってシフラ21−1(Cyfra21−1)(サイトケラチン19、CK−19)測定を行った。シフラ21−1(Cyfra21−1)の濃度はElecsys(商標)計器によって得た。このデータによってROC曲線を作成し、大コホートおよび小コホートについてのAUCを下記表2に記録した。
C.マイクロタイタープレート分析
以下のELISAキットを購入した。Advanced Life Science Institute,Inc.(Japan)のProGRP、IDL Biotech AB(Bromma,Sweden)のTPS(サイトケラチン18、CK−18)、およびIBL Immuno Biological Laboratories(Minneapolis、MN、USA)のパラインフルエンザ1/2/3 IgG ELISA。メーカーの説明書に従って分析を行った。検体の濃度は、メーカーのプロトコールで指示、規定されている計算から導いた。個々の分析で得られたAUCを下記の表3に示す。
自己抗体ビーズアレイ
A.市販のヒトタンパク質(下記の表4を参照されたい)をLumineX(商標)SeroMap(商標)ビーズ(Austin、Texas)に付着させ、個々のビーズセットを合わせて試薬を調製した。試薬の一部を、存在する任意の抗体がタンパク質に結合できる条件下でヒト血清試料にさらした。結合していない物質を洗い落とし、次いでビーズを、ヒトIgGに特異的に結合する抗体にR−フィコエリトリンを結びつけた蛍光複合体にさらした。洗浄後、ビーズを、内部の色素に従ってそれぞれのビーズを同定するLuminex(商標)100計器に通して、ビーズに結合した蛍光発光(ビーズに結合した抗体の量に対応する)を測定した。このようにして、772の試料(肺がん251、正常244、良性277)について、21のヒトタンパク質、ならびに、対照としていくつかの非ヒトタンパク質(ウシ血清アルブミン(BSA)および破傷風毒素)に対する免疫応答を評価した。
抗原MUC−1(Fujirebio Diagnostics INC,Malvern,PA)、サイトケラチン19(Biodesign,Saco,ME)、およびCA−125(Biodesign,Saco,ME)を、細胞培養物のイオン交換画分として入手した(下記の表4を参照されたい)。これらの比較的粗い調製物を、サイズ排除カラム(BioRad SEC−250,Hercules,CA)、移動相がPBS0.4mL/分のHPLCを用いた、分子量によるさらなる分別にかけた。15分から始めてそれぞれ1分ごとの画分を、それぞれの抗原に対して全部で23画分を集めた。MUC−1については250uLを注入し、サイトケラチン19およびCA−125については150uLを注入した。3つの試料全てが、15から24分に溶出する高分子量のタンパク質のさまざまな濃度を表す信号を示し、24分以降の時間においては測定できない程高信号、低分子量の物質の濃度が高いことを示した。ビーズを被覆するために、以下の画分を合わせた。MUC−1−A画分6、7;MUC−1−B画分10、11;MUC−1−C画分12、13;サイトケラチン19−A画分4、5;サイトケラチン19−B画分8、9;サイトケラチン19−C画分16、17;CA125−A画分5、6;CA125−B画分12、13
B.抗原のLuminex SeroMap(商標)ビーズへの被覆
Omega10K 限外ろ過プレート(Pall Corporation,Ann Arbor,Michigan)のウェルに水50uLを加えた。10分後にプレートを真空状態に置いた。ウェルが空になった際には、水10uLを加えて水和状態を保った。それぞれのウェルに5mMのモルホリノエタンスルホン酸(MES)(pH5.6)を50から100uL、指示されたLuminex(商標)SeroMAP(商標)ビーズ、および10から20ugに相当する適切な量の表4に指示されたそれぞれの抗原を加えた。ビーズをピペットで懸濁した。ビーズにEDAC(2.0mg/5mMのMES(pH5.6)1.0mL)10uLを加えた。プレートに蓋をして暗所の振とう機に置いた。14時間後にプレートを真空吸引し、水で洗浄し、最後にビーズを20mMのトリエタノールアミン(TEA)(pH5.6)50uL中に懸濁させた。プレートを暗所で振とう機で攪拌した。2度目のEDAC(2.0mg/5mMのMES(pH5.6)1.0mL)をそれぞれのウェルに加え、プレートを暗所の振とう機に1時間置いた。洗浄後、1%BSAおよび0.08%アジ化ナトリウム(PBN)を含有するPBS緩衝液200uLをそれぞれのウェルに加え、続いてプローブで超音波処理して、暗所に置いた。
D.ビーズで覆われた血清試料の試験
血清試料を、以下のようにマイクロプレート中に調製した。PBN中1:20希釈、各マイクロプレートあたり80試料。上記のビーズセット50uLにウサギ血清(本件で試験したものとは関係ない抗原の免疫を有するウサギ由来)5uLを加えた。ビーズセットをボルテックスして37℃下に置いた。35分後に、5%ウサギ血清および1%CHAPS(BRC)を含有するPBN1mLを加えた。ビーズセットをボルテックスし、遠沈させて、BRC1.05mL中に再懸濁させた。Supor 1.2u filter plate(Pall Corporation)のウェルをPBN100uLで洗浄した。それぞれのウェルにBRC50uL、それぞれの1:20の血清試料10uL、および再懸濁させたビーズ10uLを加えた。プレートを室温、暗所にて1時間振とうし、ろ過して、BRC100uLで10分間、3回洗浄を行った。検出複合体(RPE抗ヒトIgG20uL/BRC5.0mL)50uLを加えてピペットでビーズを再懸濁させた後、プレートを暗所で30分間振とうした。次いでBRC100uLを加え、ビーズをピペットで攪拌して、試料をLuminex(商標)100計器で分析した。
結果(各試料および抗原に対するビーズの中間値強度)を、表5で以下に示した大および小コホートに対する以下の結果で、ROC解析によって評価した。
自己抗体スライドアレイ
A.抗原調製物
インビトロジェン(Invitrogen)のUltimate ORF Collection(商標)(インビトロジェン、Grand Island,NY)から由来した、およそ5000タンパク質を、グルタチオン−S−トランスフェラーゼ(GST)配列の全長ヒトタンパク質との組換え体融合物として調製した。GSTタグによって、タンパク質の他の特徴に依存せずに、アレイに結合する各タンパク質の量の査定が可能になる。
B.スライドの抗原コーティング
ProtoArrayは、以上で言及したおよそ5000タンパク質でスポットしたニトロセルロースでコートしたガラス表面(スライド)、ならびに多数の対照特徴からなる。
C.コートスライドでの血清試料の試験
アレイをまず、PBS/1% BSA/0.1% Tween20で、4℃にて1時間ブロックした。次いで、プロファイリング緩衝液(Profiling Buffer)(本明細書で議論した「プロファイリング緩衝液」は、PBS、5mM MgCl2、0.5mMジチオスレイトール、0.05%Triton X−100、5%グリセロール、1%BSAを含む)中1:120で希釈した血清試料に、4℃にて90分間暴露した。アレイを次いで、プロファイリング緩衝液にて3回、洗浄あたり8分間洗浄した。次いでアレイを、AlexaFluor−共役抗−ヒトIgG、プロファイリング緩衝液中0.5ug/mL、44℃にて90分間暴露した。次いでアレイを、プロファイリング緩衝液中で3回、1洗浄あたり8分間洗浄した。遠心での乾燥後、Axon GenePix 4000B蛍光マイクロアレイスキャナー(モレキュラー デバイゼス(Molecular Devices)、Sunnyvale,CA)を用いてスキャンした。
D.バイオマーカー選別
がん患者からの血清の陽性シグナルの分布を、正常患者からのものと比較することによって、がん患者の自己抗体特性を削除しているタンパク質の同定を決定した。制限された数のアレイでの、がん特異的自己抗体を発見する可能性を増加させるために、以下の試料のプールを使用した。それぞれ4から5人の肺がん患者の血清を含む10プール、それぞれ4または5人の正常患者の血清を含む10プール、それぞれ良性肺疾患を有する4から5人の患者からの血清を含む10プール。これらのプールを、以上で記述したように、処理のためにインビトロジェンに送付した。各プローブに対する各タンパク質に相当する蛍光強度を、スプレッドシートにて表した。各タンパク質は2回表され、アレイ上の二重スポットに相当する。
特定のタンパク質に対する免疫応答のがん特異性の査定に対する1つのアルゴリズムにおいて、カットオフ値が、がん試料のシグナル強度を非がん試料のものから最もよく区別した、製造業者(インビトロジェン)によって供給された。本カットオフより高い強度を有する各群からの試料の数(それぞれがんカウントおよび非がんカウント)を決定し、パラメーターとしてスプレッドシートに配置した。さらに、p−値を計算し、これは、他と比較した1つの群において、シグナル増加がない可能性を表している。ついでデータを、非がん群において最も低い陽性、またがん群において最も陽性であるトップタンパク質を提供するようにソートし、さらにp−値にて低から高でソートした。本式によるソートが、以下の表7に提供された以下の情報を提供した。
第二のアルゴリズムが、非がん試料のシグナル強度の標準偏差で割った、がんに対する平均シグナルと、非がん試料に対する平均シグナル間の差として、タンパク質に対する免疫応答のがん特異性を計算した。これは、強い免疫応答が、弱いものよりも結果に影響を与えるという長所を有する。次いでデータを、最も高い値のトップタンパク質を与えるようにソートする。本ソートによって同定したトップ100リスティングを、以下表8にて示している。
表7および8のソート結果を比較し、各タンパク質に対して、がんおよび非がん試料によって産出されたシグナルを試験することによって、以下表9で示した以下の25個のタンパク質を、さらなる調査のために選別した。
E.サイクリンE2
サイクリンE2の2つの形態が、ProtoArray(商標)上で存在していることが分かった。Genebankアクセッション番号BC007015.1(配列番号1)として同定された形態が、がん試料のプールのいくつかと、強力な免疫反応性を示し、良性および正常(非がん)プールと非常に低い応答性を示した。反対に、Genbankアクセッション番号BC020729.1(配列番号2)として同定された形態は、任意のがんまたは非がんプール試料とほとんど反応性を示さなかった。以下に示したように、2つの形態の配列アライメントが、259アミノ酸にわたる同一性を示しており、N−末端およびC−末端領域両方で差がある。BC020729.1は、N−末端に110アミノ酸、C−末端に7アミノ酸を持ち、BC007015.1には存在しない。BC007015.1は、C−末端に、BC020729.1には存在しない37アミノ酸を有する。形態BC007015.1のみが免疫応答性を示しているので、この免疫応答性は、C−末端の37アミノ酸部分に起因する。
BC007015.1のC−末端からの2つのペプチドを合成し、E2−1(配列番号3)は、BC007015.1のC−末端37アミノ酸を含む。E2−2(配列番号5)は、BC007015.1のC−末端18アミノ酸を含む。両方のペプチドを、N末端にてシステインを含むように合成し、担体タンパク質または表面への特異的共有結合のための反応性の部位を提供する。
BC007015.1(配列番号1)およびBC020729.1(配列番号2)の配列アライメント
ペプチドE2−1およびE2−2は、BSAをマレイミドで活性化し、続いてペプチドの共役によって、BSAにそれぞれ連結した。活性化BSAを、以下のプロトコールに従って調製した。200uL PBS中のBSA8.0mgに、20uL DMRFおよび10uL 1M トリエタノールアミン pH8.4中のGMBS(N−(ガンマ−マレイミド−ブチリル−オキシ)スクシンイミド、ピアス(Pierce)、Rockford IL)1mgを加えた。60分後、混合液を、PBS緩衝液でSephadex G50カラムを通して、400uL画分を回収した。活性化BSA−Mal(100uL)に、ペプチドE2−1、2.5mgまたはペプチドE2−2、3.2mgを加えた。両方の場合で、混合液をボルテックスして、氷上に15分間おき、その後混合液を、25分間室温まで動かした。結合産物、BSA−Mal−E2−1(BM−E2−1)およびBSA−Mal−E2−2(BM−E2−2)を、浄化のために、Sephadex G50カラムを通した。
タンパク質およびペプチドを、2つの方法を用いて、Luminex(商標)マイクロスフィアに結合させた。第一の方法が、実施例10Cにて記述されており、「直接法(direct methods)」と呼ばれる。第二の方法は、「前活性化法(pre−activate method)」と呼ばれ、以下のプロトコールを使用する。オメガ(Omega)10k超遠心プレートのウェル中に、水100uLを加え、10分後に真空状態に置いた。ウェルが空になったら、20uL MES(100mM)pH5.6および50uL各Luminex(商標)SeroMap(商標)ビーズセットを、以下表10にて示したように加えた。カラム1列A、B、CおよびD中のウェルに、およびカラム2列A、B、C、DおよびE中のウェルに、MES中のNHS(20mg/mL)10uL、およびMES中EDAC(10mg/mL)10uLを加えた。暗所での振盪45分後に、プレートを真空状態に置き、緩衝液と未反応試薬を吸い上げた。プレートをバキュームから取り除き、20uL MESおよび50uL 水を加えた。表10にて示唆したプレートに、各タンパク質またはペプチド(2uLを加えた、DNAJB1以外)4uLを加え、ピペットで攪拌して、ビーズを分散させた。プレートを30分間、シェーカー上で攪拌し、ついでMES中10mg/mL EDAC 5uLを(直接結合のために)カラム1、列EFGHに加え、プレートをシェーカー上で30分間攪拌し、ついで真空状態に置いて、緩衝液および未反応試薬を除去した。ウェルが空になったら、50uL PBSを加え、混合液を攪拌し、プレートを真空状態に置いた。ウェルが空になったら、50uL PBSを加え、ピペットで混合液を攪拌して、ビーズを分散させ、シェーカー上で60分間インキュベートした。反応を停止するために、200uL PBNを加えて、反応液を超音波処理した。
以下の表10は、異なるビーズセット上での、サイクリンE2ペプチドおよびタンパク質の異なる提示を要約している。ペプチドE2−1およびE2−2をBSAに結合し、ついで前活性化法(ビーズID 25および26)、または直接法(ビーズID 30および31)を用いてビーズに結合させた。ペプチド、E2−1およびE2−2をまた、前活性化法(ビーズID 28および29)または直接法(ビーズID 33および34)を用いて、BSAなしにビーズに結合させた。ビーズ35、37、38、39および40を、前活性化法を用いてタンパク質でコートした。
ビーズを、以下の様式にて、患者血清で処理した。1mL PBNに、各ビーズ調製物5uLを加えた。混合液を超音波処理して遠心し、ペレットビーズを、PBS中のBSA1% 1mLで洗浄し、同一の緩衝液1mL中に再懸濁させた。1.2u Suporフィルタープレート(パル コーポレーション(Pall Corporation)、East Hills,NY)に、100uL PBS/Tween(0.2% Tween20を含むPBS中1% BSA)を加えた。10分後、プレートをろ過し、50uL PBS 0.2% Tween(0.2% Tween 20を含むPBS中1% BSA)を加えた。各ウェルに、表11で示したように、20uLビーズ混合物および20uL血清(1:50)を加えた。血清は、ヒト患者血清またはウサギ抗−GST血清のいずれかであった。プレートを暗所にてシェーカー上に配置した。1時間後、プレートをろ過し、100uL PBN/Tweenにて三回洗浄した。RPE−抗ヒト−IgG(1:400)(シグマ(Sigma)、St.Louis,MO)50uLを加えて、ヒト抗体を検出し、RPE−抗ウサギ−IgG(1:200)を加えて、ウサギ抗−GST抗体を検出した。プレートを暗所にて30分間、シェーカー上に配置して、その後ビーズをろ過し、洗浄して、Luminex(商標)上で走らせた。
6つの血清試料とウサギ抗−GSTの結果を、以下表11で示している。
BSAに連結し、それぞれビーズに(直接法を用いて)直接、または前活性化(または前活性化法)を介して結合したペプチドE2−1を含む、ビーズ25および30が、最も強力なシグナルを与えたことが、以上表11より明らかである。約半分だけがBSA担体を介したが、BSA担体なしで結合したペプチドE2−1がまた、強力なシグナルを与えた。ペプチドE2−2は、BSA担体を介して結合した場合に、非常に低いシグナルを与え、BSA担体なしではほぼ検出不能なシグナルであった。(N−末端GST融合タグを含む)全長タンパク質CCNE2は、ペプチドE2−2の任意の形態のもの以上の、しかしペプチドE2−1のものより非常に低いシグナルを示し、これは、配列の免疫応答性部分を含むが、ビーズ上より低い密度であることを示唆している。ウサギ抗−GSTでのこのシグナルは、本GST融合タンパク質が、ミクロスフィアに対して成功裏に結合したことを示している。
以下表12で示されたタンパク質を、以上で記述したような前活性化および直接法によって、および受動的コーティングによって、Luminex SeroMap(商標)上にコートした。受動的コーティングのために、供給メーカーから受け取ったままの溶液中、タンパク質5ugを、SeroMap(商標)ビーズ 200uLに加え、混合液をボルテックスし、室温にて5時間、次いで4℃にて18時間インキュベートし、次いで沈殿するまで遠心し、ペレットを洗浄して、PBN中に再懸濁させた。
234人の患者(87人がん、70人良性、および77人正常)からの血清試料を試験した。本試験からの結果を、ROC曲線によって解析した。各抗原に対する計算されたAUCを、以下表13で示している。
質量分析法
A.混合磁気ビーズ(MMB)の連続希釈による試料調製
血清試料を融解し、当量のインビトロジェンゾルB緩衝液と混合した。この混合液をボルテックスし、0.8μmフィルター(サルトリウス(Sartorius)、Goettingen,Germany)を通してろ過して、さらなる処理の前に残余物を精製し取り除いた。自動化試料調製を、Dynal(登録商標)(インビトロジェン)強アニオン交換およびアボットラボラトリーズ(Abbott Laboratories(アボット、Abbott Park,IL)弱カチオン交換磁気ビーズの混合物を用いて、96−ウェルプレートKingFisher(登録商標)(サーモ フィッシャー サイエンティフィック(Thermo Fisher Scientific Inc.)、Waltham,MA)上で実施した。典型的に、アニオン交換ビーズは、アミンに基づく炭化水素、四級アミンまたはジエチルアミン基を、官能末端基として持ち、弱カチオン交換ビーズは典型的に、スルホン酸(カルボキシル酸)に基づく官能基を有する。アボットのカチオン交換ビーズ(CXビーズ)は、濃度2.5%(質量/容量)であり、Dynal(登録商標)強アニオン交換ビーズ(AXビーズ)は、10mg/ml濃度であった。試料調製の直前に、カチオン交換ビーズを、20mM Tris.HCl、pH7.5、0.1%還元Triton X100(Tris−Triton緩衝液)で一回洗浄した。本試料調製で使用する他の試薬、20mM Tris.HCl、pH7.5(Tris緩衝液)、0.5%トリフルオロ酢酸(本明細書以下「TFA溶液(TFA solution)」および50%アセトニトリル(本明細書以下「アセトニトリル溶液(Acetonitrile solution)」は自ら調製した。試薬および試料は以下のように96−ウェルプレートで準備した。
列Aは、AXビーズ30ul、CXビーズ20ulおよびTris緩衝液50uLの混合液を含んだ。
列Bは、Tris緩衝液100ulを含んだ。
列Cは、Tris緩衝液120ulと試料30ulを含んだ。
列Dは、Tris緩衝液100ulを含んだ。
列Eは、脱イオン水100ulを含んだ。
列Fは、TFA溶液50ulを含んだ。
列Gは、アセトニトリル溶液50ulを含んだ。
列Hは空だった。
列Aのビーズおよび緩衝液を先に混合し、ビーズをCollectカウント3(何回磁気プローブが溶液内に入り、磁気ビーズを回収したかを示唆する器具パラメーター)で回収し、Tris緩衝液中、放出設定「fast」、洗浄設定−medium、20秒間の洗浄時間で、洗浄のために列B上へ移した。ビーズ洗浄段階の最後に、ビーズをCollectカウント3で回収し、列C上へ移して試料と合わせた。ビーズ放出設定はfastである。試料結合を、5分間の結合時間で、「slow」設定にて実施した。結合段階の最後に、ビーズをCollectカウント3で回収する。回収したビーズを、放出設定「fast」、洗浄設定−medium、20秒間の洗浄時間で、第一洗浄段階のために列D上に移した。第一洗浄段階の最後に、ビーズをCollectカウント3で回収する。回収したビーズを、放出設定「fast」、洗浄設定−medium、20秒間の洗浄時間で、第二洗浄段階のために、列E上に移した。第二洗浄段階の最後に、ビーズをCollectカウント3で回収した。回収したビーズを、放出設定「fast」、溶出設定−fastおよび2分間の溶出時間で、TFA溶液中での溶出のために列Fに移した。TFA溶出段階の最後に、ビーズをCollectカウント3で回収した。このTFA溶出液を回収し、質量分析によって解析した。回収したビーズを、放出設定「fast」、溶出設定−fastおよび2分間の溶出時間で、アセトニトリル溶液中での溶出のために列Gに移した。溶出後、ビーズをCollectカウント3で除去し、列Aに捨てた。アセトニトリル(AcN)溶出液を回収して、質量分析によって解析した。
すべての試料を二回ずつ、しかしシステムエラーを避けるために異なるプレート上で行った。溶出した試料を手動で吸引し、自動化MALDI標的化試料調製のために96−ウェルプレート中に配置した。したがって、各試料は、質量分析解析のために2つの溶出液を提供した。
CLINPROTロボット(ブルッカー ダルトニックス社(Bruker Daltonics Inc.)、Billerica,MA)を、MS照合の前に、MALDI標的を調製するために使用した。簡単に記すと、処理には、溶出した血清試料を含む試料プレート、およびMALDIマトリックス溶液(70%アセトニトリル中の10mg/mLシナピン酸)を含むバイアルをロボット上の設計された位置にロードすることが含まれる。ロボットを制御するコンピュータからスポッティング手順を含むファイルをロードして、開始した。この場合、スポッティング手順には、5μLのマトリックス溶液を吸引すること、およびマトリックスプレート中に分配し、続いて5μL試料を分配することが含まれる。試料およびマトリックスの前混合を、混合液5μLを吸引し、マトリックスプレート中で数回分配することによって実施した。前混合前に、混合液5μLを吸引し、0.5μLを、アンカーチップ標的(ブルッカー ダルトニックス社、Billerica,MA)上、4連続スポットに沈着させた。溶液の残り3μLをゴミ箱容器中に捨てた。必要以上の試料を吸引することで、アンカーチップ標的上への試料沈着の間に誤ったスポットを導き得るディスポーザブルチップ中の空気バブルの形成を最小化した。
B.C8磁気ビーズ水性相互作用クロマトグラフィー(C8 MB−HIC)による試料調製
血清試料を、SOLB緩衝液と混合し、実施例5Aにて記述したようなフィルターで精製した。自己試料調製を、100MB−HIC8(ブルッカー ダルトニックス社、Billerica,MA)として公知のCLINPROT Purification Kitsを用いて、96−ウェルプレートKingFisher(登録商標)上で実施した。キットには、C8磁気ビーズ、結合溶液および洗浄溶液が含まれる。すべての他の試薬は、他に言及がない限り、シグマ ケミカル社(Sigma Chem.Co.)から購入した。試薬および試料を、以下のように96−ウェルプレート中で設定した。
列Aは、ブルカーのC8磁気ビーズ20μLとDI水 80μLの混合液を含んだ。
列Bは、血清試料10μLと結合溶液40μLの混合液を含んだ。
列CからEは、洗浄溶液100μLを含んだ。
列Fは、(有機溶媒の蒸発を最小にするために溶出段階の直前に加えた)70%アセトニトリル 50μLを含んだ。
列Gは、DI水 100μLを含んだ。
列Hは空であった。
列A中のビーズを前混合して、「Collectカウント」3で回収し、列B上に移して試料に結合させた。ビーズ放出設定を、10秒間の放出時間で「fast」に設定した。試料結合を、5分間の「slow」設定で実施した。結合段階の最後に、ビーズを「Collectカウント」3で回収して、第一洗浄段階(放出設定=fast、時間=10秒間、洗浄設定=medium、時間=20秒間)のために、列C上に移した。第一洗浄段階の終わりに、ビーズを「Collectカウント」3で回収し、第一洗浄段階でと同一のパラメーターでの第二洗浄段階のために、列D上に移した。第二洗浄段階の終わりに、ビーズをもう一度回収して、先に記述したように第三および最終洗浄段階のために、列E上に移した。第三洗浄段階の終わりに、KingFisher(商標)を、列Eから列Fの移行段階の間に中断し、70%アセトニトリル 50μLを列Fに加えた。アセトニトリルの添加後、処理を再開した。列Eからの回収したビーズを、溶出段階(放出設定=fast、時間=10秒間、溶出設定=fast、時間=2分間)のために、列Fに移した。溶出段階の後、ビーズを除去し、列G中に捨てた。すべての試料を、実施例5aにて以上で記述したように、二回ずつ行った。
CLINPROTロボット(ブルッカー ダルトニックス社、Billerica,MA)を、使用したMALDIマトリックス中で多少の改変をしただけの、先の項目で記述したようなMS照合の前に、MALDI標的を調製するために使用した。この場合、SAの代わりに、HCCAを使用した(40% ACN/50% MeOH/10% 水、v/v/v中、1mg/mL HCCA)。すべての他のパラメーターは同じままであった。
C.SELDIチップを用いた試料調製
以下の試薬を使用した。
1.100mM リン酸緩衝液、pH7.0、250mL脱イオン水を、200mMリン酸二ナトリウム溶液152.5mLと、200mMリン酸一ナトリウム溶液97.5mMと混合することによって調製した。
2.10mg/mLシナピン酸溶液、等容量のアセトニトリルおよび0.4%水性トリフル酢酸(v/v)を混合して、最終濃度10mgシナピン酸/mL溶液を作製することによって調製した、十分な量の溶液中に、計量した量のシナピン酸を溶解することによって調製した。
3.脱イオン水、シナピン酸およびトリフルオロ酢酸は、フルカ ケミカルズ(Fluka Chemicals)からであった。アセトニトリルは、ブルディック(Burdick)およびジャクソン(Jackson)からであった。
8スポット配座中のQ10 ProteinChipアレイと、標準のマイクロプレートと同一のフットプリントを有する、12×8アレイ中でアレイを維持するために使用したBioprocessorsを、シフェルゲン(Ciphergen)より得た。Q10活性表面は、四級アミン強アニオン交換器である。Ciphergen ProteinChip System、Series 4000 Matrix Assisted Laser Desorption Ionization(MALDI)飛行時間質量分析器を使用して、チップ表面に結合したペプチドを解析した。すべてのCiphergen産物を、Ciphergen Biosystems,Dumbarton,Californiaより得た。
すべての液体輸送、希釈液および洗浄液を、ハミルトン社(Hamilton Company)、Reno,Nevadaからの、Hamilton Microlab STARロボットピペッターによって実施した。
血清試料を室温にて融解し、穏やかにボルテックスすることで混合した。試料を含むバイアルを、ハミルトンピペッター上の24位試料ホルダー内にロードし、合計96試料を含む4試料ホルダーをロードした。2つのBioprocessorsホールディングQ10チップ(192総スポット)を、ハミルトンピペッターのデッキ上に配置した。100mMリン酸緩衝液と脱イオン水を含む容器を、ハミルトンピペッター上にロードした。使い捨てピペットチップをまた、器具のデッキ上に配置した。
すべての試料処理は、総合的に自動化した。各試料を、ハミルトンピペッターのデッキ上のマイクロプレートの2つの別々のウェル中で、血清5マイクロリットルを、リン酸緩衝液45マイクロリットルと混合することによって、2つの別々の分液内に、1から10希釈した。Q10チップを、各スポットを、2つのリン酸緩衝液の150マイクロリットル分液に暴露することによって活性化した。緩衝液が、各添加後5分間、表面を活性化させた。第二分液を各スポットより吸引した後、希釈血清 25マイクロリットルを各スポットに加え、室温にて30分間インキュベートした。各試料を、Q10チップのスポット上に配置した各希釈からの単一分液で2回希釈した。希釈血清の吸引に続いて、各スポットを、リン酸緩衝液 150マイクロリットルで、および最後に脱イオン水 150μリットルで4回洗浄した。処理したチップを風乾し、シナピン酸で処理し、Ciphergen 4000中でのMALDI処理を可能にするようにマトリックスを使用した。シナピン酸マトリックス溶液を、それぞれシナピン酸溶液で十分満たされた、96ウェルマイクロプレートを器具のデッキ上に配置することによって、ハミルトンピペッター上にロードした。96ヘッドピペッターを使用して、シナピン酸マトリックス 1マイクロリットルを、Bioprocessor上の各スポットに同時に加えた。15分間の乾燥期間の後、第二の1マイクロリットル分液を各スポットに加えて、乾燥させた。
D.混合ビーズ試料プレップのAutoFlex MALDI−TOFデータ獲得
器具の捕獲範囲を、m/z 400から100,000に設定した。器具を、2から17kDaの範囲の質量をカバーしているブルッカーの較正標準を用いて、直線モードにて外部にて較正した。高品質スペクトルを回収するために、捕獲を、レーザーを除いて、ファジー制御にて完全に自動化した。レーザーのファジー制御を、レーザー出力が実験の間、一定のままになるようにとめた。器具は一般的に、固定レーザー出力にて較正するので、精度が、一定のレーザー出力を維持することより利益を受ける。他のファジー制御設定は、2から10kDaの質量範囲にて、ピークの分解能およびS/Nを制御した。これらの値は、各捕獲の前に最適化し、試料から試料への、またはスポットからスポットへの失敗した捕獲の数を最小化する一方で、スペクトルの品質を最大化するために選択した。偏向板をまた、低分子量イオン(<400m/z)を偏向するためにオンにし、マトリックスイオンでの検出器の飽和と、試料から発生するシグナルの最大化を防止する。さらに、レーザービームが試料表面を介してラスターしたので、各捕獲の前に、5つのワーニングショット(LP 閾値の約5から10%上)を発射して、任意の過剰なマトリックスを除去した。各分子量スペクトルに対して、600レーザーショットを、以上で設定した分解およびS/N基準を満たす場合にのみ、一緒に加えた。すべての他の粗悪な品質のスペクトルを無視し、廃棄し、ベースライン補正または平滑化アルゴリズムは、生スペクトルの捕獲の間使用しなかった。
データを保存し、共通のm/z軸に変換して、比較を促進し、種々の統計学的ソフトウェアパッケージによって解析可能なポータブルASCIIフォーマットにて出力した。共通のm/z軸への変換は、組織内で開発した補間アルゴリズムを用いることによって達成した。
E.C8 MB−HICのAutoFlex MALDI−TOFデータ捕獲
器具の捕獲範囲を、m/z1000から20,000に設定し、感度および分解能に対して最適化した。すべての他の捕獲パラメーターおよび較正法を、400レーザーショットを各質量スペクトルに対して一緒に加えたことを除いて、実施例5dにて以上で記述したように設定した。 F.Q−10チップのCiphergen 4000 SELDI−TOFデータ捕獲
Bioprocessorsを、質量範囲0から50,000Daに対する最適化パラメーターを用いて、Ciphergen 4000 MALDI飛行時間質量分析器上にロードした。データをデジタル化し、530捕獲/スポット上で平均化して、イオン電流対質量/電荷(m/z)の単一スペクトルを得た。各スペクトルをサーバーに出力して、続いて捕獲後解析のために、ASCIIファイルとして読み出した。
G.質量分析データの関心領域解析
質量分析データは、0から50,000の質量/電荷値と、これらの相当する強度値からなる。がんおよび非がんデータ組を構築した。がんデータ組は、すべてのがん試料からの質量スペクトルからなり、一方で、非がんデータ組は、正常被験者および良性肺疾患の患者を含む、各非がん試料からの質量スペクトルからなる。がんおよび非がんデータ組を、以下を実施するソフトウェアプログラム内で別々にアップロードした。
a)スチューデントt−検定を、各記録質量/電荷値にて決定し、p−値を与える。
b)がんおよび非がんスペクトルを、各群に対して1つの代表に平均化する。
c)平均がんスペクトルおよび平均非がんスペクトルの強度の対数比(Log Ratio)を決定する。
ROIsを、0.01より小さなp−値、および0.1より大きな絶対Log Ratioを10以上の連続質量値を有するように特定化し、18、36および26 ROIsが、それぞれMMB−TFA、MMB−AcNおよびMB−HICデータ組にて発見された(表14a−14c)。さらに、124 ROIs(<20kDa)が、表14dにて示したSELDIデータにて見られた。表14aから14dは、平均質量値を昇順に並べた、本発明のROIsを列記している。本表中で提供されたROIは、計算された間隔に対する平均質量値である(所与の間隔に対する開始および終了質量値の平均)。平均ROI質量は今後、単純化のためにROIと呼ぶ。各試料に対する各ROIの強度を、ROC解析にかけた。各マーカーに対するAUCをまた、以下の表14aから14d中で報告している。以下表14aから14cにおいて、計算ROIが、疾患および非疾患群のMSプロファイルの解析から得られた。個々の試料を、3つの異なる方法を用いて処理した。a)TFA(tfa)での溶出、およびb)アセトニトリル(acn)で連続溶出した、c)疎水性相互作用クロマトグラフィー(hic)を用いる混合磁気ビーズアニオン/カチオン交換クロマトグラフィー。各試料調製法を、ROIを得る目的のために独立して解析した。すべてのスペクトルを、ブルッカー AutoFlex MALDO−TOF質量分析器で回収した。以下表14dにて、計算ROIを、疾患および非疾患群のMSプロファイルの解析から得た。すべての試料を、Q−10チップを用いて処理した。すべてのスペクトルを、Ciphergen 4000 SELDI−TOF質量分析器を用いて回収した。
H.ROIsファミリーの同定:JMP(商標)統計パッケージ(SAS インスティテュート社(SAS Institute Inc.)、Cary,NC)プログラムの他変数解析機能を使用して、非常に相関したROIsを同定した。二次元相関係数マトリックスを、JMPプログラムから抽出し、マイクロソフト(Microsoft)Excelによってさらに解析した。各ROIに対して、相関係数が0.8を超えるROIsの組を同定した。これらのROIsが一緒に、相関ROIsのファミリーになる。表15は、相関ファミリー、これらの相関メンバーROIs、大コホートでの、メンバーROIsに対するAUC値、およびファミリーの他のメンバーに対する相関係数の平均を示している。したがって、3449と3494の質量を有するROIsが非常に相関しており、本発明の文脈内で、互いに対して代用可能であることが分かる。
判別解析、決定木解析および主成分分析を用いた、バイオマーカーの多変数解析
多変数解析を、免疫アッセイバイオマーカーおよび関心領域上で実施した。すべての異なる解析を、JMP統計学的パッケージを用いて実施した。目的を単純化するために、判別解析(DA)、主成分分析(PCA)および決定木(DT)を一般的に、本明細書で多変数法(MVM)と呼ぶ。PCAにおいて、データ中の総変数の90%超に相当する、たった最初の15の主成分が抽出されたということは注目に値する。因子ローディングおよび/または平等分配を使用して、各主成分に最も寄与した1つの因子のみ(バイオマーカー)を抽出した。因子ローディングの平方が、各主成分における各因子の相対的寄与を反映するので、これらの値を、各主成分に最も寄与したマーカーの選別のための基礎として使用した。したがって、最初の15主成分に最も寄与している15因子(バイオマーカー)を抽出した。DAにおいて、マーカーを選別する工程を、より多くのマーカーの添加が、分類出力に影響を与えなくなるまで実施した。一般的に、DAは5から8バイオマーカーを使用した。DTsの場合に、約5つのバイオマーカーを有する6−結節木を構築して、評価した。
バイオマーカーを、既知のブートストラッピングおよびリーブ−ワン−アウトバリデーション法(Richard O.Duda et al.In Pattern Classification,2nd Edition,pp.485,Wiley−Interscience(2000))を使用することにより評価した。10倍トレーニング工程を使用して、定期的に現れる強固なバイオマーカーを同定した。強固なバイオマーカーは、トレーニング組の少なくとも50%にて出現するマーカーとして定義した。したがって、本発明者らの10倍トレーニング工程において、5以上の頻度でのバイオマーカーを、さらなる評価のために選別した。以下表16は、各コホートでの各方法において、定期的に現れるバイオマーカーを要約している。
種々の統計方法を用いたバイオマーカー探索のためのアプローチによって、より広い候補バイオマーカーのレパートリーを提供することによる、異なった利点が提供される(図1)。DAおよびPCAのようないくつかの方法が、正常に分布したデータでよく機能する一方で、対数回帰および決定木のような他の非パラメーター法は、分離した、均一に分散していない、または著しい変動を有するデータでよりよく機能する。マーカーが、集団内で正常に分散していてよく、またはしていなくてもよいため、このようなアプローチは、異なる供給源(質量分析器、免疫アッセイ、臨床歴など)からの(バイオマーカーおよびバイオメトリックパラメーターのような)マーカーが、単一のパネルに統合されることが理想的である。
分割スコア法(Split and Score Method)(本明細書以下「SSM」)
A.改善分割スコア法(SSM)
Mor et al.(PNAS,102(21):7677(2005)を参照のこと)によって記述されたスプリットポイントスコアリング法を実行するためのインタラクティブソフトウェアが、マイクロソフト(Microsoft)(登録商標)ウィンドウズ(登録商標)下で実行すると記述された。本ソフトウェアは、試料の組に対するマーカー(バイオマーカーおよびバイオメトリックパラメーター)解析の結果を保存するための普通の媒体である、マイクロソフト(登録商標)Excelスプレッドシートを読む。データを、試料の疾患を指定するための領域を有する単一ワークシート上に保存可能であり、1つが疾患試料に対して、他が非疾患試料に対しての、2つのワークシート上に、および1対がトレーニング試料、疾患および非疾患で、他の対がトレーニング試料、疾患および非疾患に対してである、4つのワークシート上に保存可能である。最初の2つの場合、ユーザーは、入力からの無作為に選別したトレーニングおよび試験対を自動的に産出するために、本ソフトウェアを使用してよい。最後の場合、多数のExcelファイルを、一度に読み出して、単一の履行で解析してよい。
ソフトウェアは、データ上で回収したマーカーすべてのリストを表している。ユーザーは、このリストから解析にて使用すべきマーカーの組を選別する。ソフトウェアが自動的に、疾患および非疾患トレーニングデータ組からの各マーカーに対するスプリット点を計算し、疾患群が非疾患に対して上昇したか、または減少したかどうかを決定する。スプリット点は、各単一マーカーの精度を最大化するために選択する。スプリット点はまた、手動で設定し、調節してよい。
すべての解析において、選択したマーカーの組を用いて、各可能性のある閾値での精度、特異性および感度を、トレーニングおよび試験組両方に対して計算する。多数の結果を産出する解析において、これらの結果を、トレーニング組精度によって順序づける。
3つの様式の解析が利用可能である。最も単純な様式は、選択したマーカーのみを用いて標準の結果を計算する。第二の様式は、選択したリスト中の、価値が最小のマーカーを決定する。多重計算を実施して、それぞれの可能性のあるマーカーのサブセットに対するものを、単一マーカーを除去することによって形成した。最もよい精度を有するサブセットによって、サブセットを作製するために除去したマーカーが、全組中、最小の寄与を作ることが示唆されている。これらの最初の2つのモードに対する結果は、本質的に即時である。最も関与した計算は、選択したマーカーのすべての可能性のある組合せを探索する。20の最もよい出力が報告されている。この最終選択肢は、多数の候補に関与し得る。したがって、これは計算的に非常に強く、しばしば完了してよい。使用した各追加マーカーは操作時間を倍にした。
およそ20マーカーに対して、20の最もよい結果のすべてにおいて見られる、通常6から10マーカーが存在することがしばしば分かった。次いでこれらは、組からの2から4の他のマーカーと適合する。このことは、診断パネルのためにマーカーを選択することにおいて、自由度が存在し得ることを指摘している。トップ20の最もよい出力が、精度において、一般的に同様であるが、感度および特異性において、有意に異なってよい。この方法でのマーカーのすべての可能性のある組合せを見ることによって、臨床的に最も有用であり得る組合せの洞察を提供する。
B.分割加重スコア法(Split and Weighted Scoring Method)(本明細書以下「SWSM」)
本明細書で先に議論したように、本方法は、1つのマーカーの測定を、1つの多くの可能性のあるスコアに変換することに関与する、加重スコアリング法である。これらのスコアは、等式:
スコア=AUC*因子/(1−特異性)
を用いて誘導される。
マーカーサイトケラチン19を、具体例として使用可能である。サイトケラチン19レベルは、小コホート中で、0.4から89.2ng/mLの範囲である。解析ソフトウェアを用いて、ROC曲線を、がんが陽性であるように、サイトケラチン19データで産出した。擬陽性率(1−特異性)をx−軸にプロットし、真の陽性率(感度)をy−軸にプロットし、曲線上の各点に相当するサイトケラチン19値を含むスプレッドシートを作成した。カットオフ3.3ng/mLにて、特異性は90%であり、擬陽性率は10%であった。このAUCが0.7より大きく、0.8より小さかったので(表2を参照のこと)、このマーカーに対して、3つの因子が任意に与えられた。しかしながら、任意の整数を因子として使用可能である。この場合、数を増やすことで、よりよい臨床性能を示唆している、より高いAUCを有するバイオマーカーとともに使用する。したがって、3.3ng/mL以上のサイトケラチン19を有する個体に対するスコアを計算した。
スコア=AUC*因子/(1−特異性)
スコア=0.70*3/(1−0.90)
スコア=21
3.3ng/mL超のサイトケラチン19の任意の値に対して、このようにスコア21を与えた。1.9より大きいが、3.3より小さいサイトケラチン19の任意の値に対して、スコア8.4を与え、以下同様である(以下の表17aを参照のこと)。
特異性レベルが増加するにつれて、スコアの値が増加する。選択した特異性の値を、任意の1つのマーカーに対して調整可能である。任意の1つのマーカーに対して選択した特異性レベルの数を調整可能である。本方法によって、特異性はバイオマーカーのパネルへの寄与を改善することができる。
加重スコアリング法の比較を、上の実施例7Aで記述した二成分スコアリング法に対して実施した。本実施例において、パネルは、8つの免疫アッセイバイオマーカー、CEA、サイトケラチン19、サイトケラチン18、CA125、CA15−3、CA19−9、proGRPおよびSCCからなった。AUCs、因子、選択した特異性レベル、これらの特異性レベルのそれぞれにおけるスコアを、以下表17b中、各マーカーに対して表で示している。これらの個々のカットオフおよびスコアを用いて、各試料を8つのバイオマーカーに対して表で示した。各試料の総スコアを合計し、ROC曲線中にプロットした。本ROC曲線を、表18にて提供された小コホートスプリット点または大コホートスプリット点いずれかでの二成分スコアリング方を用いて産出されたROC曲線と比較した(実施例8Aを参照のこと)。加重スコアリング法、二成分スコアリング法大コホートスプリット点、および二成分スコアリング法小コホートスプリット点に対するAUC値はそれぞれ、0.78、0.76および0.73であった。AUC値によって示唆されたようなパネルの総合性能の改善は別として、加重スコアリング法は、パネルに対して、多数の可能性のあるスコア値を提供する。より多数の可能性のあるパネルスコアの1つの利点は、陽性試験に対して、カットオフを設定するために、より多くの選択肢が存在することである(図5を参照のこと)。8バイオマーカーパネルに適用した二成分スコアリング法は、増分1をともなう、0から8の範囲のパネル出力値を持ち得る(図5を参照のこと)。
スプリット&スコア法(SSM)を用いる、肺がんに対する予測法
A.免疫アッセイバイオマーカーのSSM
実施例2にて議論したように、いくつかのバイオマーカーを、免疫学的アッセイによって検出した。これらには、サイトケラチン19、CEA、CA125、SCC、proGRP、サイトケラチン18、CA19−9およびCA15−3が含まれた。これらのデータを、SSMを用いて評価した。一緒に示されたこれらのバイオマーカーが臨床利用を制限した。良性肺疾患および肺がんを表している小コホートにおいて、陽性結果として4以上の閾値を有する、8つのバイオマーカーパネルの精度が、10小コホート試験組にわたり、平均64.8%精度(AUC0.69)を達成した。正常ならびに良性肺疾患および肺がんを表している、大コホートにおいて、陽性結果として4以上の閾値を有する、8つのバイオマーカーパネルの精度は、10大コホート試験組にわたり、平均77.4%精度(AUC0.79)を達成した。
パックイヤーのバイオメトリックパラメーターを含むことが、大体5%分
のこれらのバイオマーカーの予想精度を改善した。したがって、4以上の閾値を陽性結果として有する、8つのバイオマーカーおよび1つのバイオメトリックパラメーターパネルの精度が、10小コホート試験組にわたり、平均69.6%精度(AUC0.75)を達成した。
B.ROC/AUCによって選別されたバイオマーカーおよびバイオメトリックパラメーターのSSM
推定バイオマーカーを、多変数統計学的方法を用いて同定した、実施例6とは反対に、ROC/AUC解析が関与する、単純な、非パラメトリー法をこの場合に使用して、推定バイオマーカーを同定した。本方法を適用することによって、許容可能な臨床性能を有する(AUC>0.6)個々のマーカーをさらなる解析のために選択した。トップ15のバイオマーカーとバイオメトリックパラメーター(ピークイヤー)のみが、選択され、群は、本明細書以下で、16AUC群(小および大)と意味される。
16AUC小コホートマーカーの最適化組合せ(パネル)を、10のトレーニングサブセットのそれぞれにおいて、SSMを用いて決定した。この工程は、SSMを用いて、バイオメトリックパラメーター喫煙歴(パックイヤー)のない状態(表20a)、およびある状態(表20b)両方で実施した。したがって、(バイオメトリックパラメーターパック−年を除く)15バイオマーカーまたは15バイオマーカーと1バイオメトリックパラメーター(パックイヤー)(16AUC)が、分割スコア法に対する入力変数であった。10トレーニング組のそれぞれに対数する最適パネルを、総精度に基づいて決定した。各パネルを残っている、処理していない試料に対して試験し、性能統計解析を記録した。10のパネルを次いで比較して、各バイオマーカーの頻度を記録した。処理を、バイオメトリックパックイヤーを含む、および含まない、で2回実施した。これら2つの処理の結果を、以下表20aおよび20bにて表している。今一度、5以上の頻度での強固なマーカーを、さらなる考慮のために選択した。処理を、大コホートのために繰り返し、結果を表20cにて示している。表20aおよび20bには、a)15AUCバイオマーカーのみ、およびb)15AUCバイオマーカーおよびバイオメトリックパラメーターパックイヤーに対するマーカーの頻度を示している小コホートのSSMの結果の部分リストが含まれる。第一の表(20a)において、5つのマーカーのみが、5以上の頻度であることに注意すること。表20bにおいて、7マーカーがこの基準に適合する。表20cは、大コホートのSSM結果の部分リストを含み、15AUCマーカーに対するマーカーの頻度を示している。11マーカーが、5以上の頻度を有することに注意すること。
C.MVMによって選択されたバイオマーカーのSSM
1つの多変数法の例は、決定木解析である。決定木解析のみを用いて同定されたバイオマーカーを、ひとまとめにして考え、SSMにて使用した。この群のバイオマーカーは、16AUCとして指定されたバイオマーカーの群と同様の臨床利用性を示した。例として、試験組1(10のうち)は、バイオメトリックパラメーターパックイヤーなしで、0.90、バイオメトリックパラメーターパックイヤーありで、0.91(試験)のAUC(試験)を有する。
DTバイオマーカーを、PCAおよびDAを用いて同定したバイオマーカーと組み合わせて、MVM群を産出した。14MVM群を、SSMを用いて、バイオメトリックパラメーター喫煙歴(パックピーク)あり、またはなしで評価した。もう一度、5以上の頻度を有する強固なマーカーを、さらなる考慮のために選択した(結果は示していない)。以上の表中で分かるように、パックイヤー(喫煙歴)は、強固なマーカーとして出現するバイオマーカーの数および型において効果を有する。このことは、バイオマーカーが他のバイオマーカーにおいて、相乗的または欠損効果を持ち得るので、全く予想されなかったことではない。本発明の1つの態様は、モデルの予想能力を改善することにおいて、パネルとして一緒に機能するマーカーを発見することに関与する。同様の筋にそって、両方の方法(AUCおよびMVM)において、バイオメトリックパラメーターパックイヤーと相乗的に機能すると同定されたバイオマーカーを、なんとか統合して、マーカーのよりよいパネルを同定した(実施例8Dを参照のこと)。
大コホートに対して同定した多変数マーカーを、SSMで評価した。再度、5以上の頻度を有するマーカーのみを、さらなる考慮のために選択した。以下の表21は、大コホートに対するSSM結果を要約している。
D.統合マーカーのSSM(AUC+MVM+パックイヤー)
続く段階において、(10トレーニング組中)5以上の頻度を有するすべてのマーカー(バイオマーカーおよびバイオメトリックパラメーター)を統合して、両コホートに対する、AUCおよびMVM群両方からのマーカーを含むマーカーの第二リストを産出した。SSM結果より、5以上の頻度を有する、小コホートから16の固有マーカー、大コホートから15の固有マーカーを選択した。以下の表22は、選択したマーカーを要約している。
マーカーの以上のリストを、SSMでの最終評価周期を通して得た。先に言及したように、マーカーの組合せを、10トレーニングサブセットに対して最適化し、各バイオマーカーおよびバイオメトリックパラメーターの頻度を決定した。マーカーがトレーニング組の少なくとも50%で存在するという選択基準を適用することによって、小コホートに対して16マーカーのうち13個を選択し、大コホートに対して15マーカーのうち9個を選択した。
各マーカーに対して、マーカーのレベルを最適化した時、スプリット点を、各トレーニングデータ組を、分類における最も高い精度に関して評価することによって決定した。小コホートにて使用した8つの最も頻度の高いマーカーに対するスプリット点を以下に列記している。
表23bは、これらの平均(Ave)スプリット点(それぞれ所定のカットオフ)を有する8つの最も頻度の高いマーカーのリストを示している。各スプリット点に対する標準偏差もまた含む(Stdev)。スプリット点に関する対照群の位置は、左から第二カラムにて与えられる。例として、サイトケラチン19において、正常群または対照群(非がん)は、1.89以下のスプリット点値を有する。
予測モデルの検証
小コホートに対する13バイオマーカーおよびバイオメトリックパラメーターのリストのサブセット(以上表23aを参照のこと)が、良好な臨床利用性を提供する。たとえば、分割スコア法におけるパネルとして一緒に利用する8つの最も頻度の高いバイオマーカーおよびバイオメトリックパラメーターは、試験サブセット1に対して、AUC0.90を有する(以上表23bを参照のこと)。
7−マーカーパネル(マーカー1から7、表23b)および8−マーカーパネル(マーカー1から8、表23b)を含む予測モデルを、10ランダム試験組を用いて検証した。以下表24aおよび24bは、2つのモデルの結果を要約している。すべての条件および計算パラメーターは、各モデルにおけるマーカーの数を除いて、両方の場合で同一であった。
表24aは、10タンデム試験組を含む7−マーカーパネルの臨床性能を示している。計算にて使用した7つのマーカーおよび平均スプリット点を表16bにて示した。3の閾値を、疾患群を非疾患群から分けるために使用した。本モデルに対する平均AUCは0.90であり、平均精度83.9%、およびそれぞれ79.1%および89.4%の感度および特異性に相当する。
表24bは、10ランダム試験組を含む8−マーカーパネルの臨床性能を示している。計算にて使用した8つのマーカーおよび平均スプリット点を表16bにて示した。3の閾値(所定の総スコア)を、疾患群を非疾患群から分けるために使用した。本モデルに対する平均AUCは0.91であり、平均精度84.1%、およびそれぞれ91.5%および71.5%の感度および特異性に相当する。
表24aおよび24bの比較は、両モデルが、AUCおよび精度に関して同程度であり、感度および特異性においてのみ異なる。表24aにおいて見ることができるように、7−マーカーパネルは、より高い特性を示している(89.4%対75.1%)。反対に、8−マーカーパネルは、これらの平均値(Ave)から判断できるように、よりよい感度を示している(91.5%対79.1%)。分類の精度を最大化する閾値(または所定の総スコア)を選択し、ROC曲線のAUCを最大化することに類似することに注意すべきである。したがって、3の選択した閾値(所定の総スコア)は、精度を最大化するだけでなく、モデルの感度および特異性間の最もよい比較を提供した。実際、このことが何を意味するかは、正常の個体が、前記個体が本モデルにおける7つの可能性のあるマーカーのうち3つ以下(または第二モデルに関して、8のうち3つ以下)に対して陽性であると試験される場合、肺がんを発症させる低「危険性」であると考えられる。設定閾値(または所定の総スコア)より大きなスコア(総スコア)を有する個体が、より高い危険性であると考えられ、さらなる試験または追跡手順の候補となったことに注意されたい。モデルの閾値(すなわち、所定の総スコア)を、(精度を犠牲にして)このモデルの感度または特異性を最大化するために、増加または減少いずれかが可能である。この柔軟性は、異なる診断上の質問および/または危険性のあるある集団に対処するためにモデルを適合可能である、たとえば正常個体を、症候性および/または無症状個体から差別化可能であるので、都合がよい。
種々の予測モデルを、以下表25aおよび25bにて要約している。各予測モデルに対して、10試験組を介して、これらの相当する標準偏差(角括弧中で開示された)を含む閾値(すなわち所定の総スコア)、平均AUC、精度、感度および特異性として、モデルを構成するバイオマーカーおよびバイオメトリックパラメーターを示唆する。以上で概説した8つのマーカーパネルは、混合モデル2であり、以上で概説した7つのマーカーパネルは、混合モデル3である。混合モデル1Aおよび混合モデル1Bは同一のマーカーを含む。混合モデル1Aと混合モデル1B間の唯一の差は、閾値(すなわち、所定の総スコア)中である。同様に、混合モデル10Aと混合モデル10Bは同一のマーカーを含む。混合モデル10Aと混合モデル10B間の唯一の差は、閾値(すなわち、所定の総スコア)中である。
同様に、大コホートに対して、種々の予測モデルを、総精度、感度または特異性に対して最適化可能である。4つの可能性のあるモデルを以下表26にて要約している。
同様に、サイクリンコホート(測定した抗サイクリンE2タンパク質抗体および抗サイクリンE2ペプチド抗体を有する個体のサブセット)に対する予測モデルを、以下表27aおよび27bにて要約している。
同様に、自己抗体アッセイを用いる予測モデルを、以下表28にて要約している。
これらのモデルの5つを、検証コホートに対して使用した。以下表29は、独立コホート、小コホートおよび検証コホートに対するそれぞれの予測モデルの臨床性能を様隠している。
バイオマーカー同定
A.HPLC画分化
表22中のMSバイオマーカー候補の同定を得るために、まずプールされた、および/または個々の血清試料を、標準のプロトコールを用いて、逆相HPLCによって画分化する必要があった。ゲル電気泳動のため、およびMS解析のために十分な物質を得ることは、いくつかの画分化サイクルを必要とした。個々の画分を、MALDI−TOF MSによって特性化し、関心のピークを含む画分を一緒にプールし、スピードバック内で濃縮した。すべての他のバイオマーカー候補を以上で記述したように処理した。
図2は、濃縮前後の推定バイオマーカー(pub11597)を示している。開始試料中の11kDaでのバイオマーカー候補が非常に低濃度であることに注意すること。濃縮の後、強度がより高いが、試料は解析のために十分な純度ではなく、関心のバイオマーカーを単離するために、SDS−PAGEによるさらなる分離を必要とした。
B.ゲル内消化およびLC−MS/MS解析
濃縮後、候補バイオマーカーを含む画分を、SDS−PAGEにかけて、候補バイオマーカーに相当する分子量を有する所望のタンパク質/ペプチドを単離した。ゲル電気泳動(SDS−PAGE)を、製造業者(インビトロジェン社(Invitorgen,Inc.))によって提供された標準の方法を用いて実施した。簡単に記すと、手順には、候補バイオマーカーと公知の分子量の標準タンパク質を含む試料を、図3で示したような同一のゲル中、異なるウェル内にロードすることが含まれる。標準タンパク質の遊走距離を、「未知」試料のものと比較することによって、所望の分子量を有するバンドを同定し、ゲルより切り出した。
切り出したゲルバンドを次いで、Waters MassPREP(商標)ステーションを用いて、自動化ゲル内トリプシン消化にかけた。続いて、消化した試料をゲルより抽出し、オンライン逆相ESI−LC−MS/MCにかけた。産物イオンスペクトルを次いで、データベース検索のために使用した。可能である場合、同定したタンパク質は市販されており、先に記述したように、SDS−PAGEおよびゲル内消化にかけた。2つの試料間のゲル電気泳動、MS/MS結果およびデータベース検索における良好な一致が、バイオマーカーが正しく同定されたというさらなる証拠であった。図3にて見ることができるように、11.5kDaでの画分化試料中の市販されているヒト血清アミロイドA(HSAA)と推定バイオマーカー間で良好な一致が存在する。MS/MS解析およびデータ検索によって、両方の試料が同一のタンパク質であることが確認された。図4は、候補バイオマーカーPub11597のMS/MSスペクトルを示している。bおよびyイオンから由来したアミノ酸配列を、各パネルのトップに注釈をつける。バイオマーカー候補を、ヒト血清アミロイドA(HSAA)タンパク質の断片として同定した。
消化の影響を受けにくい小候補バイオマーカーを、ESI−q−TOFおよび/またはMALDI−TOF−TOF断片化、続いてde−novoシークエンシングおよびデータベース検索(BLAST)にかけて、配列情報とタンパク質IDを得た。
C.データベース検索およびタンパク質ID
バイオマーカー候補を完全に特性化するために、そこから由来するタンパク質を同定することが必須であった。未知タンパク質の同定は、ゲル内消化と、続くトリプシン断片のタンデム質量分析が関与した。MS/MS処理の結果である産物イオンを、Swiss−Protタンパク質データベースに対して検索して、供給源タンパク質を同定した。低分子量を有するバイオマーカー候補に対して、タンデム質量分析と、続くde−novoシークエンシング、およびデータベース検索が、供給源タンパク質を同定するための選択の方法であった。検索によって、ホモサピエンス(Homo sapiens)ゲノムのみを考慮し、前駆体イオンに対して±1.2Daの質量精度、および産物イオンに対して±0.8Daの質量精度が考慮された(MS/MS)。1つの見逃された開裂のみがトリプシンに対して許可された。2つの可変改変のみが、データベース検索に対して許容され、カルバミドメチル化(C)および酸化(M)であった。Mascot検索エンジン結果および関連MSおよびMS/MSスペクトルの手動解釈を調整した後、最終タンパク質IDを帰した。結果の精度を、反復測定によって検証した。
上記表30は、これらのタンパク質IDを有する、種々の候補バイオマーカーのタンパク質源を与える。マーカーを、ゲル内消化およびLC−MS/MSおよび/またはde−novoシークエンシングによって同定した。観察された断片のアミノ酸配列のみが示されており、平均MWには、示唆した場所でPTMを含むことに注意すること。アクセッション番号を、Swiss−Protデータベースから得、参照のみとして与えた。ACN9459およびTFA9133は、後者が糖付加部分からシアル酸を欠く(−291.3Da)ことを除いて同一のタンパク質断片であることに注意することが興味深い。ACN9459およびTFA9133両方が、アポリポタンパク質CIIIのバリアントとして同定された。本発明者らの発見は、本タンパク質の発行されている公知の配列および分子量(Bondarenko et al.,J.Lipid Research、 40:543−555(1999))と一致している。Pub4789は、アルファ−1−抗トリプシンタンパク質として同定された。産物イオンスペクトルの近接実験が、表30で示唆した部位で、KからEへの置換が存在し得ることを示唆している。質量精度における不確実性が課題を不可能にした。
肺がんの検出
A.ペプチドまたはタンパク質の免疫アッセイ:上記実施例9にて記述したバイオマーカーを、免疫アッセイ技術によって検出および測定可能である。たとえば、アボット ダイアグノスティックス(Abbott Diagnostics)からのArchitect(商標)免疫アッセイ系を、本発明のバイオマーカーを含むことが予想される試料中、未知の自己アッセイのために使用する。当分野で公知のように、本システムは、抗体でコートした磁気マイクロ粒子を利用し、関心のバイオマーカーに結合可能である。器具制御下、試料の分液を、当量の抗体−コート磁気マイクロ粒子と混合し、緩衝液、塩、界面活性剤および可溶性タンパク質を含む、標本希釈液の容量の2倍と混合した。インキュベーション後、マイクロ粒子を、緩衝液、塩、界面活性剤および保存剤を含む洗浄緩衝液で洗浄した。アクリジニウム標識共役物の分液を、当量の標本希釈液にそって加え、粒子を再分散させた。混合液をインキュベートし、洗浄緩衝液で洗浄した。洗浄した粒子を、硝酸および過酸化水素を含む酸性プレトリガー中に再分散させて、アクリジニウム共役物をマイクロ粒子から分離した。NaOHの溶液をついで加えて、化学発光反応をトリガーした。光を、光電子増倍管によって測定し、未知の結果は、標準曲線を構築するために使用した公知の量のバイオマーカーペプチドを含む一連の試料によって放射される光との比較によって定量する。次いで標準曲線を使用して、同一の様式で処理した臨床試料中のバイオマーカーの濃度を推測する。結果は、それ自身によって、または以下で記述したような他のマーカーとの組合せで、使用可能である。
B.ペプチドまたはタンパク質の多重免疫アッセイ:単一試料から本発明の多重バイオマーカーを検出する必要がある場合、多重アッセイを実施することがより経済的であり、簡便である。問題になっている各解析物に対して、一組の特異的抗体が必要であり、Luminex 100(商標)解析器上での利用のために、独自に染色したマイクロ粒子が必要である。対の各捕獲抗体は個々に固有マイクロ粒子上にコートする。対の他の抗体を、rPhycoerythrinのような蛍光団に共役させる。マイクロ粒子をプールし、約0.01%w/cに相当する、約1000固有粒子/マイクロタイターの濃度まで希釈する。希釈液には、緩衝液、塩および界面活性剤が含まれる。10マーカーがパネル中である場合、総固体は、約10,000粒子/マイクロタイター、または0.1%固体w/vである。共役物をプールし、マイクロ粒子希釈液中各最終濃度約1から10nMに調整した。アッセイを実施するために、1以上の解析物が含まれることが予想される試料の分液を、インキュベーションンウェル中に配置し、続いて、プールしたマイクロ粒子の半量を配置した。懸濁液を30分間インキュベートし、プールした共役物溶液の半量を添加した。30分間のさらなるインキュベーションの後、反応液を、2容量の塩および界面活性剤を含む緩衝化溶液の添加によって希釈した。懸濁液を混合し、試料のおよそ二倍の容量をLuminex 100(商標)器具によって解析のために吸引した。場合により、マイクロ粒子を各インキュベーション後に洗浄し、次いで解析のために再懸濁させることができる。各個々の粒子の蛍光を、3波長にて測定し、2つを粒子とこの関連解析物を同定するために使用し、3つ目を、粒子に結合した解析物の量を定量するために使用した。各型の少なくとも100マイクロ粒子を測定し、各解析物に対する中央値蛍光を計算した。試料中の解析物の量を、公知の量のペプチドまたはタンパク質を含む一連の試料において同様の解析を実施し、公知の濃度に対して公知の試料の中央値蛍光をプロットすることによって産出した標準曲線に対して比較することによって計算する。未知試料を、実施例7でのように、分割スコア法(Split and Score Method)または分割加重スコア法(Spilt and Weighted Score Method)のようなモデルを用いる、公知がんまたは非がん標本に関する、解析物(上昇したかまたは弱まったか)の濃度に基づいて、がんであるかまたは非がんであるか分類する。
たとえば、患者を、表18の8免疫アッセイ(IA)パネルおよび分割スコア法を用いて、肺がんを有する患者の可能性を決定するために試験してよい。患者より試験試料を得た後、患者の試験試料(すなわち血清)中の8バイオマーカーのそれぞれの量を定量し、バイオマーカーそれぞれの量を次いで、表18にて列記されたもののような、バイオマーカーに対する相当する所定のスプリット点(所定のカットオフ)と比較する(すなわちサイトケラチン19に対して使用可能な所定のカットオフは1.89または2.9である)。この相当する所定のスピリット点(所定のカットオフ)より大きい量を有する各バイオマーカーに対して、スコア1が与えられ得る。この相当する所定のスプリット点(所定のカットオフ)以下である量を有する各バイオマーカーに対して、スコア0が与えられ得る。8バイオマーカーのそれぞれに対するスコアを次いで数学的に(すなわちバイオマーカーのスコアのそれぞれを一緒に加えることによって)統合し、患者に対する総スコアに行き着く。本総スコアがパネルスコアとなる。パネルスコアを、表25aの8IAモデルの所定の閾値(所定の総スコア)、すなわち1と比較する。1より大きなパネルスコアが患者に対する陽性結果である。1以下のパネルスコアが、患者に対して陰性結果である。先の集団研究において、本パネルは、特異性30%、擬陽性率70%、および感度90%を示した。患者に対する陽性パネル結果は、擬陽性になる可能性が70%ある。さらに、90%の肺がん患者が、陽性パネル結果を持ち得る。したがって、陽性パネル結果を有する患者を、肺がんの示唆または疑念に対するさらなる試験に対して参照し得る。
さらなる例によって、再び8IAパネルおよび分割加重スコア法を用いて、患者より試験試料を得たのち、患者の試験試料(すなわち血清)中の8つのバイオマーカーそれぞれの量を定量し、次いでバイオマーカーのそれぞれの量を、表17bにて列記したスプリット点のような、所定のスプリット点(所定のカットオフ)と比較する(すなわち、サイトケラチン19のために使用可能な所定のカットオフは、1.2、1.9および3.3である)。本例において、各バイオマーカーは、3つの所定のスプリット点(所定のカットオフ)である。したがって、4つの可能性のあるスコアが、各バイオマーカーに対して与えられ得る。次いで8つのバイオマーカーのそれぞれに対するスコアを、数学的に(すなわちバイオマーカーのスコアのそれぞれを一緒に加えることによって)合わせ、患者に対する総スコアに行き着く。次いで、総スコアがパネルスコアになる。パネルスコアを、11.2であると計算された、8IAモデルに対する所定の閾値(または所定の総スコア)と比較可能である。11.2より大きな患者パネルスコアが陽性結果である。11.2以下の患者パネルスコアが、陰性結果である。先の集団研究において、本パネルが、特異性34%、擬陽性率66%および感度90%を示した。陽性パネル結果が、擬陽性である可能性66%を有する。さらに90%の肺がん患者が陽性パネル結果を有する。したがって、陽性パネル結果を有する患者が、肺がんの示唆または疑念のためのさらなる試験のために参照され得る。
C.免疫質量分光分析:質量分析のための試料調製はまた、免疫学的方法ならびにクロマトグラフィーまたは電位測定法も使用可能である。ペプチドバイオマーカーに対して特異的な抗体でコートされた超常磁性マイクロ粒子を、塩を含む緩衝溶液中、および0.1% w/vの濃度まで調整する。患者血清試料の分液を当量の抗体コートマイクロ粒子と混合し、2倍容量の希釈液と混合する。インキュベーションの後、マイクロ粒子を、緩衝塩および場合により塩と界面活性剤を含む洗浄緩衝液で洗浄する。マイクロ粒子を次いで脱イオン水で洗浄する。免疫精製解析物を、トリフルオロ酢酸を含む、当量の水性アセトニトリルを加えることによって、マイクロ粒子から溶出する。ついで試料を当量のシナピン酸マトリックス溶液と混合し、少量(およそ1から3マイクロリットル)を、飛行時間質量解析のために、MALDI標的に適用する。所望のm/zでのイオン電流を、同一の様式で処理した公知の量のペプチドバイオマーカーを含む試料から得たイオン電流と比較する。
イオン電流が、濃度と直接関連すること、および特定のm/z値(またはROI)でのイオン電流(または強度)を望むのならば濃度に変換可能であることに注意すべきである。そのような濃度または強度を次いで、実施例7で記述した任意のモデル構築アルゴリズムへの入力として使用可能である。
D.ROIsに対する質量分析:血液試料を患者より得、凝血塊を許容して血清試料を形成する。試料をSELDI質量分光分析のために調製し、Bioprocessor中のProtein Chip上にロードし、実施例2にて提供されたように処理する。Protein Chipを、Ciphergen 4000 MALDI飛行時間質量分析上にロードし、実施例3でのように解析する。各スペクトルを、多変数解析を用いて受入に対して試験する。たとえば、(未知試料と公知の参照集団間の)総イオン電流およびスペクトルコントラスト角を計算する。次いでマハラノビスの距離を決定する。マハラノビスの距離が確立された臨界値より小さいスペクトルに対して、スペクトルを定量する。マハラノビスの距離が、確立された臨界値より大きなスペクトルに対して、スペクトルをさらなる解析から排除し、試料を再度実行するべきである。適格後、質量スペクトルを正規化する。
得られる質量スペクトルを、選択したデータ解析モデルに対して適切な関心領域内のイオン電流を測定することによって評価する。解析の結果に基づいて、患者が、肺がんを有する危険性があるか、または高い可能性を有するか判断し、さらなる診断手順を通して解釈すべきである。
分割スコア法の利用のために、表5で与えられたm/z値でのROIsにおける強度を患者に対して測定する。患者結果を、患者値が、表6で与えられた平均スプリット点値のがん側であるか、または非がん側であるかを注意することによってスコア化する。スコア1が、スプリット点のがん側であると分かった各ROI値に与えられる、スコア3およびそれ以上が、患者ががんの危険性が上昇していることを示唆しており、さらなる診断手順が参照されるべきである。
当業者は、本発明が目的を実行し、言及された、末端および有利な点ならびにここで本来そなわっているものを得るために十分適合することを簡単に理解するであろう。本明細書で記述された組成物、処方、方法、手順、処置、分子、特異的化合物が、好ましい実施形態の現在代表であり、例示であり、本発明の目的において制限である意図はない。置換および改変を、本発明の範囲および精神から逸脱することなしに、本明細書で開示された本発明に対して実施してよい。
本明細書で言及されたすべての特許および発行物が、本発明が関連する技術分野の当業者のレベルの示唆である。すべての特許および発行物が、各個々の発行物が参照により組み込まれていると特に、および個々に示唆された場合と同程度に、参照により本明細書で組み込まれる。