JP6374070B2

JP6374070B2 - 被験体の肺がん診断のための複合バイオマーカー群、これを利用する肺がん診断用キット、複合バイオマーカー群の情報を利用する方法およびこれを実行するコンピューティングシステム

Info

Publication number: JP6374070B2
Application number: JP2017163777A
Authority: JP
Inventors: 哲右金; 容大金; 龍晟愼; 恩姫延; 京男姜; 浩相申; 五蘭權
Original assignee: Bioinfra Life Science Inc
Current assignee: Bioinfra Life Science Inc
Priority date: 2016-09-02
Filing date: 2017-08-28
Publication date: 2018-08-15
Anticipated expiration: 2037-08-28
Also published as: US20180067118A1; US10663469B2; KR101853118B1; CN107796942A; RU2687578C2; RU2017129983A3; RU2017129983A; CN107796942B; JP2018036264A; KR20180026609A; WO2018044126A1

Description

本発明は、被験体の肺がん診断のための複合バイオマーカー群、これを利用する肺がん診断用キット、被験体の肺がん診断のための複合バイオマーカー群情報利用方法およびこれを実行するコンピューティングシステムに関し、本発明の複合バイオマーカー群は肺がん診断のためのものであり、個別バイオマーカーＣＥＡ、ＨＥ４、ＡｐｏＡ２、ＴＴＲ、ｓＶＣＡＭ−１およびＲＡＮＴＥＳを含む。

肺がんは肺に発生するがんであって、世界中で毎年１３０万人以上がこれによって死亡し、がんによる死亡のうち最も高い比率を占めている。肺がんの主な原因としては、喫煙、ラドンガス、石綿、遺伝などがあるが、喫煙が最も高い比重を占めると言われている。

具体的に肺がんを分類してみると、肺がんは小細胞肺がん（smallcell lung cancer）と非小細胞肺がん（non-small cell lung cancer）に分けられる。そのうち非小細胞肺がんは、肺がんの約８０％に該当する最も代表的ながんであって、腺がん（adenocarcinoma）、扁平上皮細胞がん（squamous cellcarcinoma）、大細胞肺がん（large cell carcinoma）に分けられる。肺がんの種類によって組職学的特性に差が生じるだけでなく、予後と治療方法にも相違があるので、正確な診断が重要である。非小細胞肺がんの場合、最近のがん治療法の発達にもかかわらず、１０年生存率が１０％以下と極めて低い。これは大部分の非小細胞肺がんが相当進行した時期でも、患者が肺がんに罹患していると診断することが難しいことにその原因がある。

典型的に、肺がんの初期には全く症状がなく、ある程度進行した後でも普通に風邪と類似する咳、喀痰程度の症状に止まり、通常の問診ではほぼ発見することができないなど診断が極めて難しく、同じ肺がんでもがんの発生位置によって症状が異なって現われる特徴がある。肺がんの一般的な症状としては、咳、血の混じった痰あるいは喀血、呼吸困難、胸部の痛み、声枯れ、上大静脈症侯群、骨の痛みや骨折、頭痛、悪心、嘔吐などがあるが、かかる症状が深刻に現われ始めたことを患者自らが認知する頃には、既に肺がんはかなり進行した状態にあると見做すべきである。

したがって、現在では肺がんの早期診断が患者の生存可能性を高める最も良い方法である。

肺がんを早期診断するための最も良い方法は、周期的な検診である。検診の際に、患者の血液、尿など患者の身体に由来した生物学的試料を採取し、これにより肺がんの発病有無を判定することができる。このように、生物学的試料に含まれているタンパク質、核酸、代謝物質などを利用して体内の変化を調べることができる指標をバイオマーカー（biomarker）と言う。

例えば、肺がんを早期診断するための従来のバイオマーカー技術には、特許文献１に開示のように、Ａ１ＡＴ、ＩＧＦ−１、ＲＡＮＴＥＳおよびＴＴＲを必須として含むものがあった。当該技術よりも優れた分類能力を有して肺がんを診断することができれば、すなわち、バイオマーカーによる診断に誤診がより少なければ、肺がん確診に要される時間、費用および効果の側面で有利となる。

韓国登録特許第１０−１４６３５８８号公報

本発明は、肺がんを診断するのに利用される、より改良された複合バイオマーカーを提示することを目的とする。

前記のような本発明の目的を達成し、後述する本発明の特徴的な効果を実現するための本発明の特徴的な構成は下記のとおりである。

本発明の一態様によれば、被験体の肺がん診断のための複合バイオマーカー群が提供され、その複合バイオマーカー群は、個別バイオマーカーＣＥＡ（Carcinoembryonic antigen；がん胚抗原）、ＨＥ４（HumanEpididymis Protein 4；ヒト精巣上体タンパク質４）、ＡｐｏＡ２（ApolipoproteinA-II）、ＴＴＲ（Transthyretin）、ｓＶＣＡＭ−１（soluble vascular cell adhesion molecule-1）およびＲＡＮＴＥＳ｛regulated on activation, normal T cell expressed and secreted; Chemokine(C-Cmotif)ligand 5｝を含むことを特徴とする。

本発明の他の一態様によれば、被験体の肺がん診断のために複合バイオマーカー群を利用する肺がん診断用キットが提供され、その肺がん診断用キットは個別バイオマーカーＣＥＡ、ＨＥ４、ＡｐｏＡ２、ＴＴＲ、ｓＶＣＡＭ−１およびＲＡＮＴＥＳに特異的に結合する抗体を含むことを特徴とする。

本発明のまた他の一態様によれば、被験体の肺がん診断のための複合バイオマーカー群を活用する肺がん診断用キットが提供され、その肺がん診断用キットは少なくとも６個の収容領域と、前記少なくとも６個の収容領域それぞれに収容され、予め設定された個別バイオマーカーに特異的に結合する６種以上のバイオマーカー対応抗体とを含み、前記６種類以上のバイオマーカー対応抗体は個別バイオマーカーＣＥＡ、ＨＥ４、ＡｐｏＡ２、ＴＴＲ、ｓＶＣＡＭ−１およびＲＡＮＴＥＳのそれぞれに特異的に結合するそれぞれの抗体を含むことを特徴とする。

本発明の他の一態様によれば、被験体の肺がん診断のために複合バイオマーカー群の情報を利用する方法が提供され、その方法は、（ａ）コンピューティングシステムが、（１−ｉ）肺がん患者および肺がん患者でない人々から構成された標本集団の生物学的試料から測定される、肺がん診断用複合バイオマーカー群の個別バイオマーカー別発現量データ、または（１−ｉｉ）前記標本集団から測定される前記個別バイオマーカー別発現量データおよび前記標本集団の年齢を取得し、前記標本集団の前記個別バイオマーカー別発現量データを前処理し、（２−ｉ）前記前処理されたデータである前記標本集団の測定データから、または（２−ｉｉ）前記標本集団の測定データおよび前記標本集団の年齢から肺がん判定モデルが導き出された状態で、（３−ｉ）前記被験体の生物学的試料から測定される前記肺がん診断用複合バイオマーカー群の個別バイオマーカー別発現量データ、または（３−ｉｉ）前記被験体から測定される前記個別バイオマーカー別発現量データ、および前記被験体の年齢を取得する段階と、（ｂ）前記コンピューティングシステムが、前記被験体の前記個別バイオマーカー別発現量データを前処理し、（４−ｉ）前記前処理されたデータである前記被験体の測定データ、または（４−ｉｉ）前記測定データおよび前記被験体の年齢を利用して前記肺がん判定モデルから前記被験体の肺がん発病の有無を判定する段階とを含み、ここで、前記肺がん診断用複合バイオマーカー群は、個別バイオマーカーのＣＥＡ、ＨＥ４、ＡｐｏＡ２、ＴＴＲ、ｓＶＣＡＭ−１およびＲＡＮＴＥＳを含む。

本発明のまた他の一態様によれば、被験体の肺がん診断のために複合バイオマーカー群の情報を利用するコンピューティングシステムが提供され、その複合バイオマーカー群情報利用コンピューティングシステムは、（１−ｉ）肺がん患者および肺がん患者でない人々から構成された標本集団の生物学的試料から測定される肺がん診断用複合バイオマーカー群の個別バイオマーカー別発現量データ、または（１−ｉｉ）前記標本集団から測定される前記個別バイオマーカー別発現量データ、および前記標本集団の年齢を取得し、前記標本集団の前記個別バイオマーカー別発現量データを前処理し、（２−ｉ）前記前処理されたデータである前記標本集団の測定データから、または（２−ｉｉ）前記標本集団の測定データおよび前記標本集団の年齢から肺がん判定モデルが導き出された状態で、（３−ｉ）前記被験体の生物学的試料から測定される前記肺がん診断用複合バイオマーカー群の個別バイオマーカー別発現量データ、または（３−ｉｉ）前記被験体から測定される前記個別バイオマーカー別発現量データおよび前記被験体の年齢を取得する通信部、および前記被験体の前記個別バイオマーカー別発現量データを前処理し、（４−ｉ）前記前処理されたデータである前記被験体の測定データ、または（４−ｉｉ）前記測定データおよび前記被験体の年齢を利用して前記肺がん判定モデルから前記被験体の肺がん発病の有無を判定するプロセッサを含み、ここで、前記肺がん診断用複合バイオマーカー群は、個別バイオマーカーＣＥＡ、ＨＥ４、ＡｐｏＡ２、ＴＴＲ、ｓＶＣＡＭ−１およびＲＡＮＴＥＳを含む。

本発明によれば、従来の複合バイオマーカー群に比べてさらに高い肺がん診断能力を有する複合バイオマーカーを構成することができる効果がある。

そして、本発明によれば、肺がん診断用キットおよび肺がん診断用キットを利用する肺がん診断方法の効率性をさらに高めることができる効果がある。

また、本発明によれば、効率的な診断により肺がん患者の生存率を高め、治療に対する患者の反応をモニタリングし、その結果に応じて治療方式を変更することを可能にする効果がある。

本発明の実施例の説明に利用されるために添付した図面は、単に本発明の実施例の一部に過ぎず、本発明が属する技術分野で通常の知識を有する者（以下「通常の技術者」とする）においては、発明的作業が行われることなく、当該図面に基づいて他の図面が得られることもあり得る。

本発明による肺がん診断用複合バイオマーカー群を利用して肺がん患者と正常人を分類（classify）するロジスティック回帰モデルの性能を評価するためのツールであるＲＯＣ曲線を例示する図面。本発明による肺がん診断用複合バイオマーカー群を構成する個別バイオマーカーであるＨＥ４が肺がん患者と正常人のサンプルで示された発現量と被験体の年齢が有する相関関係を示したグラフ。本発明の実験に利用された個別バイオマーカーの肺がん患者と正常人とのサンプルに対する測定データから残りのバイオマーカーと年齢の影響力を除いたデータを示した一実施例の密度グラフ（density plot）。本発明による肺がん診断用複合バイオマーカー群と本発明の実験に利用された１２個の個別バイオマーカーを含む全体バイオマーカー群に対する評価指標であるＲＯＣ曲線をトレーニングセットに対して例示的に示した図面。本発明による肺がん診断用複合バイオマーカー群と本発明の実験に利用された１２個の個別バイオマーカーを含む全体バイオマーカー群に対する評価指標であるＲＯＣ曲線を検証セットに対して例示的に示した図面。前記個別バイオマーカーを含む本発明による肺がん診断用複合バイオマーカー群に対する評価指標であるＲＯＣ曲線を例示的に示した図面。前記個別バイオマーカーを含む本発明による肺がん診断用複合バイオマーカー群に対する評価指標であるＲＯＣ曲線を例示的に示した図面。前記個別バイオマーカーを含む本発明による肺がん診断用複合バイオマーカー群に対する評価指標であるＲＯＣ曲線を例示的に示した図面。前記個別バイオマーカーを含む本発明による肺がん診断用複合バイオマーカー群に対する評価指標であるＲＯＣ曲線を例示的に示した図面。前記個別バイオマーカーを含む本発明による肺がん診断用複合バイオマーカー群に対する評価指標であるＲＯＣ曲線を例示的に示した図面。本発明による被験体の肺がん診断のために複合バイオマーカー群の情報を利用するコンピューティングシステムの構成を概略的に示した概念図。

後述する本発明に対する詳細な説明は、本発明の目的、技術的解法および長所を明らかにするために、本発明が実施され得る特定の実施例を例示として示す添付の図面を参照する。これら実施例は、通常の技術者が本発明を実施できるに足りるよう詳しく説明される。

本明細書で「生物学的試料」とは、生体から採取した試料を意味し、好ましくは血液、血漿、血清、リンパ液、脳脊髄液などを含む組織液と、生体から分泌あるいは排出されるか採取される尿、便、涙、唾液などの物質を含む。

また、本明細書において、「抗体」は抗原性部位に対して指向性を有する（indicate）する特異的なタンパク質分子を意味し、多クローン（polyclonal）抗体、単一クローン（monoclonal）抗体、組換抗体、エピトープと結合し得る断片などの抗体をすべて含む。このうち、特に単一クローン抗体を利用することが好ましい。かかる抗体は、通常の技術者が公知の技術を利用して製造したものであればすべて利用することができる。前記抗体は、例えば通常の技術者に知られている従来の方法によって免疫源であるタンパク質を外部の宿主に注射することで製造することもできる。

そして、本明細書において、「正常人」は肺がんでない他の疾患を抱える人もこれに含まれ、肺がん患者でない人を指称するように意図された用語である。

また、本発明の詳細な説明および請求項にかけて、「含む」という単語およびその変形は他の技術的特徴、付加物、構成要素または段階を除去するものとして意図されたものではない。通常の技術者に本発明の他の目的、長所および特性が一部は本説明書から、そして一部は本発明の実施から示される。下記例示および図面は実例として提供され、本発明を限定するものとして意図されたものではない。

さらに、本発明は、本明細書に示された実施例のすべての可能な組み合わせを網羅する。本発明の多様な実施例は互いに異なるが、相互排他的である必要はないことを理解しなければならない。例えば、ここに記載されている特定の形状、構造および特性は、一実施例に関して本発明の精神および範囲を超えずに他の実施例で具現されてもよい。また、それぞれの開示された実施例内の個別構成要素の位置または配置は、本発明の精神および範囲を超えずに変更され得ることを理解しなければならない。したがって、後述する詳細な説明は限定的な意味として扱われるものではなく、本発明の範囲は、適切に説明される場合、その請求項が主張することと均等なすべての範囲と、さらに添付した請求項によってのみ限定される。図面において類似する参照符号は、いくつかの側面にかけて同一あるいは類似する機能を指称する。

本明細書で異なって表示されるか、明らかに文脈と矛盾しない限り、単数で表示された項目は、その文脈で別途定義がなければ複数のものを含む。

以下、通常の技術者が本発明を容易に実施することができるように、本発明の実施態樣による例示の機構、装置、方法およびこれらに関連する結果が提示される。

＜利用された個別バイオマーカーの種類＞
本発明による複合バイオマーカー群に属する個別バイオマーカーは、ＨＥ４、ＣＥＡ、ＡｐｏＡ２、ＲＡＮＴＥＳ、ＴＴＲおよびｓＶＣＡＭ−１を含むが、本発明の複合バイオマーカー群はこれに限定されず、腫瘍学的に知られているバイオマーカーであれば、如何なるものも前記挙げられた個別バイオマーカーと共に、肺がんの診断に利用することができる。個別バイオマーカーが肺がん診断に有意か否かは個別的に判断されるべきであるが、本明細書では少なくともＨＥ４、ＣＥＡ、ＡｐｏＡ２、ＲＡＮＴＥＳ、ＴＴＲ、ｓＶＣＡＭ−１を含む複合バイオマーカー群について開示することとする。本発明者によって選択された個別バイオマーカーは次のとおりである。

ＨＥ４（Human Epididymis Protein 4；ヒト精巣上体タンパク質４）は、ＷＦＤＣ２遺伝子によってコードされたタンパク質であって、WAP four-disulfide core domain protein 2とも呼ばれる。ＨＥ４は従来、卵巣がんの腫瘍マーカーとして広く知られている。

ＣＥＡ（Carcinoembryonic antigen；がん胚抗原）は、細胞付着に関連する糖タンパク質である。ＣＥＡは通常、胎児段階に胃腸管組職で作られ、出生前にその産生が中断される。したがって、健康な大人の血液には極めて低いレベルでしか存在しない。しかし、いくつかの類型のがんで血清におけるＣＥＡレベルが増加するので、臨床で腫瘍マーカーとして利用され得る。

ＡｐｏＡ２（Apolipoprotein A-II）は、ヒトのＡＰＯＡ２遺伝子によってコードされたタンパク質である。これは高密度の脂質タンパク質粒子において二番目に豊富なタンパク質である。

ＲＡＮＴＥＳ｛regulated on activation,normal T cell expressed and secreted;Chemokine (C-C motif) ligand 5｝は、ヒトのＣＣＬ５遺伝子によってコードされたタンパク質である。

ＴＴＲ（Transthyretin；ＴＴＲ）は、血清と脳脊髄液に存在する輸送タンパク質であり、甲状腺ホルモンであるチロキシン（thyroxine）とレチノールに結合するレチノール結合タンパク質を輸送する。肝臓が血液にＴＴＲを分泌し、脈絡膜網（脈絡叢；choroid plexus）が脳脊髄液にＴＴＲを分泌する。

ｓＶＣＡＭ−１（soluble vascular celladhesion molecule-1）は、ｖｃａｍ−１が溶解された状態の細胞接着分子であって、細胞が損傷した時に起きる炎症反応に対する重要なバイオマーカーとして機能し得る。

これら選択された個別バイオマーカーの外に、本発明の実験に係る個別バイオマーカーは次のとおりである。

ＡｐｏＡ１（Apolipoprotein A-I）は、ヒトのＡＰＯＡ１遺伝子によってコードされたタンパク質である。これは脂質代謝に重要な機能を果たすものとして知られている。

Ｂ２Ｍ（Beta-2 microglobulin）は、ＭＨＣｃｌａｓｓＩ分子の構成部分（component）である。ヒトにおいてＢ２Ｍタンパク質はＢ２Ｍ遺伝子によってコードされている。

ＣＡ１２５（ＣＡ−１２５；cancer antigen125;carcinoma antigen 125;あるいは carbohydrate antigen 125）は、ｍｕｃｉｎ１６またはＭＵＣ１６としても知られており、これはヒトのＭＵＣ１６遺伝子によってコードされたタンパク質である。ＣＡ１２５は、特定類型のがんに罹患した患者の血液内で濃度が高くなるので、腫瘍マーカーとして利用し得ることが発見された。

ＣＲＰ（Ｃ−reactive protein）は、血漿で確認される環状の五量体タンパク質である。これは炎症に反応してその濃度が増加するものとして知られている。

ＬＲＧ１（Leucine-richalpha-2-glycoprotein 1）は、ヒトのＬＲＧ１遺伝子によってコードされるタンパク質である。ＬＲＧ１は急性虫垂炎がある時にその濃度が増加するものとしても知られていた。

Ｃｙｆｒａ２１−１｛cytokeratin 19 fragmentantigen 21-1;Keratin, type I cytoskeletal 19; cytokeratin-19(CK-19;あるいは keratin-19(K19)｝は、ヒトのＫＲＴ１９遺伝子によってコードされた４０ｋＤａのタンパク質である。Ｃｙｆｒａ２１−１は、タイプＩケラチン（type I keratin）であり、乳がん患者のリンパ節、末梢血液、骨髓から分泌される腫瘍細胞の検出に利用されるバイオマーカーとして知られている。

＜個別バイオマーカーの分析のために利用された抗体あるいはキット＞
本発明者らは、ＨＥ４、ＲＡＮＴＥＳ、ｓＶＣＡＭ−１、ＬＲＧ１、ＣＥＡ、Ｃｙｆｒａ２１−１、ＡｐｏＡ２、ＡｐｏＡ１、ＴＴＲ、Ｂ２Ｍ、ＣＡ１２５、ＣＡ１９−９、ＣＲＰなど１３種類のタンパク質を分析するために、いくつかの製造社から抗体またはキットを購入した。抗体、キット、標準物質（標準タンパク質）などの購入先の情報は下の表１ないし表２のとおりである。

標準タンパク質の場合、ＨＥ４の標準タンパク質はＸＥＭＡ社、ＲＡＮＴＥＳの標準タンパク質はＰｅｐｒｏＴｅｃｈ社、ｓＶＣＡＭ−１とＬＲＧ−１の標準タンパク質はＲ＆ＤＳｙｓｔｅｍｓ社から購入して利用し、主試薬および補正物質（calibrator）の場合、ＣＥＡ、Ｃｙｆｒａ２１−１、Ｂ２Ｍ、ＣＡ１２５およびＣＡ１９−９タンパク質に対するものはＲｏｃｈｅ社、ＡｐｏＡ１およびＡｐｏＡ２タンパク質に対するものはＳＥＫＩＳＵＩ社、ＴＴＲおよびＣＲＰタンパク質に対するものはＳＩＥＭＥＮＳ社から購入して利用した。

＜肺がん患者の血清試料の取得＞
峨山（アサン）病院および啓明（ゲミョン）大学・東山（ドンサン）医療院から、肺がん１期１６２人、肺がん２期４２人、肺がん３期６２人および肺がん４期８９人の合計３５５人（峨山病院から２４２人、啓明大学東山医療院から１１３人）の肺がん患者から末梢血液を取得した。彼らの病歴による詳細類型は腺がんが２３０人、扁平上皮細胞がんが１０９人、大細胞肺がんが４人、神経内分泌がんが２人、その他が１０人である。年齢と性別による区分は男性１３９人、女性２１６人、年齢による区分は平均６３．８５歳、中央値６６歳、範囲は最小２５歳〜最大８３歳である。

ここで、前記肺がん患者は既知の方法を利用して確診され、斯かる方法には、胸部単純放射線撮影（Ｘ−ｒａｙ）、胸部コンピューター断層撮影（ＣＴ）、超音波検査、磁気共鳴画像（ＭＲＩ）、陽電子断層撮影（ＰＥＴ）、肺機能検査、肺灌流スキャン、肺組織検査｛ＣＴｇｕｉｄｅｄ経皮肺生検（ＰＣＮＡ）｝、がん性胸水と胸膜組職検査、および分子生物学的検査として、ＥＧＦＲ突然変異（ＥＧＦＲ mutations）、遺伝子コピー数（gene copy number）、発現レベル（level of expression）、Ｋ−ｒａｓ突然変異（K-ras mutation）、ＥＭＬ４−ＡＬＫ融合腫瘍遺伝子（EML4-ALK fusion oncogene）に関する検査が含まれるが、これに限定されないことは通常の技術者であれば充分に理解することができる。

＜対照群の血清取得＞
ソウル大学病院家庭医学科から、肺がん患者でない人、すなわち正常人被験体５９０人の末梢血液を取得した。彼らの性別による区分は男性２７４人、女性３４３人、年齢による区分は平均５６．８７歳、中央値５６歳、範囲は最小３８歳〜最大７９歳である。

肺がん患者および対照群はすべてVacutainerSST II tube（Becton Dickinson）など、既知のツールを利用して採血した後、遠心分離して血清を分離した。

＜測定および結果データの構築＞
このように取得した血清試料をもって個別バイオマーカータンパク質の発現量を測定し、その結果データを構築したところ、これに利用された定量方法は次のとおりである。

（ＨＥ４およびＬＲＧ−１タンパク質定量）
まずＨＥ４およびＬＲＧ−１タンパク質は、ＥＬＩＳＡ（Enzyme-LinkedImmuno Sorbent Assay；酵素結合免疫吸着分析）方法で測定した。通常の技術者によく知られているとおり、ＥＬＩＳＡ法は抗体に酵素を標識し、酵素の活性を測定して抗原−抗体反応の強度とその量を定量的に測定する方法である。ここで、検出抗体（detection antibody）はビオチンにより標識した後に利用した。ＥＬＩＳＡ法試行の具体的な段階は次のとおりである。
＜検出抗体のビオチン標識＞

ＨＥ４およびＬＲＧ−１のＥＬＩＳＡ定量に利用された検出抗体（detection antibody）をビオチン化（biotinylation）させるために、EZ-Link Sulfo-NHS-LC-Biotin(sulfosuccinimidyl-6-[biotin-amido]hexanoate;ThermoFisher Scientific, Waltham, MA)試薬を利用し、製造会社が勧奨する方法によって行った。これを簡略に説明すると、抗ヒト−ＨＥ４抗体（anti-human HE4 antibody;XEMA Co.Ltd.,Moscow, Russia）または抗−ヒト−ＬＲＧ１抗体（anti-human LRG-1 antibody;R&D systems, Minneapolis, MN）４００μｇをＰＢＳ溶液４００μｌに準備し、抗体に比べてモル（mole）の比率が２０倍多く１０ｍＭのSulfo-NHS-LC-Biotin溶液を入れた後に常温で３０分間反応させた。ビオチン標識が完了すると、ＰＢＳ溶液１Ｌずつを３回透析（dialysis）した後に分注し、利用するまで−８０℃で保管した。

＜ＨＥ４およびＬＲＧ−１ＥＬＩＳＡ＞
ＨＥ４およびＬＲＧ−１はＥＬＩＳＡ法で定量し、簡略に説明すると、９６−ウェルマイクロプレート（Nalgene Nunc Inc., Rochester NY）にヒトＨＥ４に対する捕捉抗体（capture antibody; XEMA Co.Ltd., Moscow, Russia）を１μｇ／ｍｌ濃度で１００μｌ入れた後に４℃で一晩中塗布した。洗浄溶液（０．０５％Ｔｗｅｅｎ２０を含むＰＢＳ）で３回洗浄した後、５％脱脂乳（skim milk）が含まれたＰＢＳ溶液をウェルに入れて室温で２時間撹拌して非特異的結合を遮断した。洗浄溶液で３回洗浄した後に血清または標準補正物質（standard calibrator）を１００μｌずつ各ウェルに添加し、室温で１時間反応させた後に３回洗浄した。上で準備したビオチン標識された検出抗体を１μｇ／ｍｌ濃度で処理し、室温で再び１時間反応させた。３回洗浄した後に０．５μｇ／ｍｌ streptavidin-horseradish-peroxidase(Sigma-Aldrich, St. Louis, MO)を添加して室温で３０分間反応させて５回洗浄した。発色反応を誘導するために、ＴＭＢ（tetramethylbenzidine；KPL, Gaithersburg, MD）を１００μｌずつ添加し、１５分後に２Ｎ硫酸５０μｌで反応を停止させ、マイクロプレートリーダー（Ｅｍａｘ；Molecular Devices LLC., Sunnyvale, CA）を用いて４５０ｎｍで吸光度を測定した。結果はＳｏｆｔＭａｘＰｒｏソフトウェア（Molecular Device）を利用して５個の母数（５−parametric）カーブフィッティングで分析した。補正用ＨＥ４標準タンパク質はＸＥＭＡ社から、ＬＲＧ−１標準タンパク質はＲ＆Ｄ社から購入した。

（ＲＡＮＴＥＳ、ｓＶＣＡＭ−１タンパク質定量）
次に、ＲＡＮＴＥＳとｓＶＣＡＭ−１の肺がん患者と正常人の血清内濃度はｘＭＡＰ技術プラットホーム（Luminex Corp.Austin, TX）を用いた多重免疫分析法（multipleximmunoassay）で測定した。多重免疫分析法はＥＬＩＳＡウエスタンブロッティング（westernblotting）、ＰＣＲ（polymerase chain reaction；ポリメラーゼ連鎖反応法）などのような従来の分析法に比べて時間と費用が節減されるものとして、通常の技術者に知られている分析法である。ここで、捕捉抗体はＭａｇＰｌｅｘ微細球体（microspheres）にカルボジイミド（carbodiimide）法で結合させて利用し、全体の過程で微細球体が光に露出することは最小化した。

＜抗体−微細球体の結合＞
前記定量過程は、製造社が推奨するプロトコルによって実行し、まずＭａｇＰｌｅｘ（Luminex Corp.）の微細球体懸濁液をボルテックス（Vortex;vortexing）した後、音波容器（sonification bath;Sonicor Instrument Corporation, USA）で２０秒間懸濁した。１×１０^６個の微細球体をマイクロチューブに移し、磁石を利用して分離して溶液を除去した後、蒸溜水１００μｌで洗浄し、再び０．１Ｍのリン酸ナトリウム緩衝溶液（sodium phosphate buffer；ｐＨ６．２）８０μｌに再懸濁（re-suspension）した。その後、５０ｍｇ／ｍｌのＮ−ヒドロキシスルホスクシンイミド（N-hydroxy-sulfosuccinimide, Sulfo-NHS;Thermo Fisher Scientific,Waltham, MA）および１−エチル−３−（３−ジメチルアミノプロピル）−カルボジイミド塩酸塩｛1-ethyl-3-(3-dimethylaminopropyl)-carbodiimidehydrochloride; Thermo Fisher Scientific｝をそれぞれ１０μｌずつ順に入れた後、室温で２０分間１０分間隔で混ぜ、５０ｍＭのＭＥＳ、ｐＨ５．０溶液を２５０μｌで２回洗浄した後、微細球体を同一の溶液１００μｌで再懸濁した。カルボキシル基活性化された微細球体に１０μｇの抗体（抗−ｓＶＣＡＭ−１あるいは抗−ＲＡＮＴＥＳ）を入れ、５０ｍＭのＭＥＳ溶液を添加して最終的に５００μｌになるようにした後、室温で２時間混ぜた。抗体結合反応が終わった微細球体は５００μｌのＰＢＳ−ＴＢＮ｛PBS, 1% BSA, 0.02% Tween 20, 0.05% アジ化ナトリウム(sodiumazide)｝で２回洗浄し、血球計算盤（hemocytometer）で個数を測定した。このように作られた抗体結合微細球体は１×１０^６個／５００μｌのＰＢＳ−ＴＢＮ濃度で２℃〜８℃の暗室で保管した。

＜ｓＶＣＡＭ−１、ＲＡＮＴＥＳ多重免疫検査＞
前記抗体結合微細球体を利用してｓＶＣＡＭタンパク質およびＲＡＮＴＥＳタンパク質内の血清内濃度を多重検査法で同時に定量した。具体的に、９６−ウェルマイクロプレートの各ウェルにＲＡＮＴＥＳ標準タンパク質（Ｒ＆ＤＳｙｓｔｅｍｓ）とｓＶＣＡＭ−１標準タンパク質（PeproTech, Rocky Hill, NJ）、または血清２０μｌと二つのバイオマーカータンパク質であるＲＡＮＴＥＳとｓＶＣＡＭ−１に対する捕捉抗体が結合された微細球体混合液２０μｌを混ぜた後、室温で１時間反応させた。その後、ビオチンが標識された検出抗体（biotinylated detection antibody）２０μｌを入れて１時間、そして、ストレプトアビジン−フィコエリスリン（Streptavidin R-Phycoerythrin、 JacksonImmunoResearch）２０μｌを入れて３０分と、順次反応させた。反応が終わったプレートを、ＰＢＳＴ（０．０５％Ｔｗｅｅｎ２０、ＰＢＳ）溶液としてマイクロプレート洗浄剤｛microplate washer(HydroFlex（登録商標）; TECAN,Switzerland)｝を用いて２回洗浄した後、微細球体を同一の緩衝溶液１００μｌで再懸濁してＬｕｍｉｎｅｘ（登録商標）２００で蛍光強度を測定した。血清サンプルのｓＶＣＡＭ−１とＲＡＮＴＥＳタンパク質濃度はアップステート社（Upstate、 USA）のビーズビューソフトウェア（Beadview Software）を利用して５個の母数のカーブフィッティングで分析した。

（ＣＥＡ、Ｃｙｆｒａ２１−１、ＣＡ１２５、ＣＡ１９−９、ＡｐｏＡ１、ＡｐｏＡ２、Ｂ２Ｍ、ＴＴＲおよびＣＲＰタンパク質定量）
ＣＥＡ、Ｃｙｆｒａ２１−１、ＣＡ１２５およびＣＡ１９−９タンパク質はＣｏｂａｓｅ６０１（Hoffmann-La Roche AG., Switzerland）装備において電気化学発光免疫測定法で、ＡｐｏＡ１、ＡｐｏＡ２およびＢ２Ｍタンパク質はClinical Analyzer 7080(Hitachi Medical Corp., Japan)装備において免疫比濁法で、ＴＴＲおよびＣＲＰタンパク質はＢＮ２Ｓｙｓｔｅｍ(Siemens AG., Germany)装備において免疫比濁法で、製造社の説明書に従って測定した。

（バイオマーカーの有効性に関する統計的立証）
前記のような測定により取得したタンパク質定量数値である実験値は、前処理を経て下記で詳細に説明される統計分析に利用される測定データとなる。ここで前処理とは、１０を基数としたログ（ｌｏｇ_１０）変換をとってもよい。本実施例では、実験値の分布が右に偏っている傾向があるため、かかる傾向を緩和するために、すべての個別バイオマーカーの実験値に対してログ変換をとった。以下、本明細書で説明する一実施例では別途言及されない限り、このように変換された測定データが用いられる。

構築された測定データは、バイオインフォマティクス（bioinformatics）および統計的分析方法であるＲ統計パッケージ（R Development Core Team 2007.R: A language and environment forstatistical computing.R Foundation for Statistical Computing, Vienna, Austria. ISBN3-900051-07-0, URL http://www.R-project.org.）を利用して分析した。下記の分析により、入力されたデータから肺がん判定モデルが生成された。

＜肺がん判定モデルの一例示−二進ロジスティック回帰分析＞
一般的な線形回帰分析は従属変数が連続型である反面、ロジスティック回帰分析は失敗／成功、良／不良、肺がんである／ではない、などのように従属変数が２個の場合（すなわち、二進（binary）の場合）に利用される回帰分析方法である。ロジスティック回帰分析のモデルは次のとおりである。

Ｐ_ｉ＝Ｐ（ｙ_ｉ＝１）は０と１との間の値、ｙ_ｉは０または１値を有し、本明細書で０は肺がんでないことを、１は肺がんであることを示す値に設定された。またx_kのそれぞれは肺がん診断に導入された個別バイオマーカーの実験値（ｌｏｇ値）を意味する。Ｒ統計パッケージでは、例えば以下のような命令語でロジスティック回帰を実行することができ、その結果として、モデル客体が回帰モデルとして導き出される。

ｍ＜−ｇｌｍ（ｂ〜ｘ１＋ｘ２＋ｘ３＋ｘ４＋ｘ５＋ｘ６、ｆａｍｉｌｙ＝ｂｉｎｏｍｉａｌ）

当該モデル客体ｍをもって個別被験体の肺がん判定を実行することができるので、当該回帰モデルを肺がん判定モデルと言える。ここで、ｂはレベルが２つである要因であり（本明細書では、ＴＲＵＥ＝肺がん、ＦＡＬＳＥ＝正常）、ｘ１、ｘ２、ｘ３、ｘ４、ｘ５、ｘ６は予測変数である。例えば、ｘ１、ｘ２、ｘ３、ｘ４、ｘ５、ｘ６はそれぞれＣＥＡ、ＨＥ４、ＡｐｏＡ２、ＴＴＲ、ｓＶＣＡＭ−１およびＲＡＮＴＥＳの発現量のデータに対応される測定データであるものと意図したものであり得る。この場合、個別被験体から測定された測定データからその個別被験体が肺がん患者であるか否かを予測することができ、例えば、当該予測を行うＲ統計パッケージの命令語は次のとおりでもよい。

ｄｆｒｍ＜−ｄａｔａ．ｆｒａｍｅ（ｘ１＝ｖａｌｕｅ，ｘ２＝ｖａｌｕｅ，ｘ３＝ｖａｌｕｅ，ｘ４＝ｖａｌｕｅ，ｘ５＝ｖａｌｕｅ，ｘ６＝ｖａｌｕｅ）

ｐｒｅｄｉｃｔ（ｍ，ｔｙｐｅ＝“ｒｅｓｐｏｎｓｅ”，ｎｅｗｄａｔａ＝ｄｆｒｍ）

本発明者らは、下記説明する多様な複合バイオマーカー群に対して、上記で言及されたロジスティック回帰を行ってロジスティック回帰モデルを取得した。具体的には、ロジスティック回帰モデルの妥当性を検証するため、本発明者は１０分割交差検証法（１０fold cross validation）を利用した。１０分割交差検証法では、まずデータをランダムに１０個のセグメントに分割する。１個のセグメントを残して９個のセグメントをもってトレーニング、すなわち、本実施例ではロジスティック回帰モデルを生成した後、残り１個のセグメントを利用して上述の予測、すなわち検証を行う。上記の過程をすべてのセグメントに対して繰り返し行う。かかる予測の結果を統合し、その予測の性能を確認することができるが、ＲＯＣ曲線がそのための一つのツールである。

＜肺がん判定モデルの性能の尺度−ＲＯＣ曲線＞
上述の肺がん判定モデルは、一種の分類器（classifier）の役割を果たすので、分類器の性能を示すＲＯＣ曲線（Receiver Operating Characteristic Curve；受容者操作特性曲線）により、その性能を確認することができる。

図１は、ロジスティック回帰モデルの性能を評価するためのツールであるＲＯＣ曲線を例示する図面である。図１のとおり、まずＲＯＣ曲線グラフの横軸に示された数値は、１−特異度（specificity）＝偽陽性率（falsepositive rate）であって、特異度は、特異度（specificity）＝真陰性（true negative）／（偽陽性（falsepositive）＋真陰性（true negative））で定義される値である。すなわち、特異度は「間違っているもの（陰性）」を間違ったと判断する比率を意味するので、グラフでは左側に傾くほど「正しいもの（陽性）」を間違ったと判断する誤判の比率が減ると考えられる。また、ＲＯＣ曲線グラフの縦軸に示された数値は、敏感度（sensitivity）＝真陽性率（truepositive rate）であって、敏感度は、敏感度（sensitivity）＝真陽性（true positive）／（真陽性（true positive）＋偽陽性（false negative））で定義される値である。すなわち、敏感度は「正しいもの」を正しいと判断する比率を意味するので、グラフでは上に傾くほど「間違っているもの」を正しいと誤判する比率が減ると考えられる。したがって、分類器が正しく判断するほど、グラフ曲線の下の面積（ＡＵＣ；area under curve）は増加する。分類器が正しく判断する分類性能を一つも有していない時には、ＡＵＣは０．５となる。普通、ＡＵＣ数値によって非情報的（ＡＵＣ＝０．５）、やや正確（０．５＜ＡＵＣ≦０．７）、中等度の正確（０．７＜ＡＵＣ≦０．９）、極めて正確（０．９＜ＡＵＣ＜１）、そして完璧な検査（ＡＵＣ＝１）に分類することができる。

＜肺がん判定モデルの性能の検証（ＲＯＣ−ＡＵＣ）＞
本発明の肺がん判定モデルが分類性能を全く有していないことを意味するＡＵＣ＝０．５を帰無仮説、ロジスティック回帰モデルが分類性能を有していることを対立仮説として、仮説検証を行うことができる。エラーが出る確率をｐ−ｖａｌｕｅ（有意確率）とすると、所定の確率よりｐ−ｖａｌｕｅが低い時、帰無仮説を棄却して対立仮説を採択し、その所定の確率を有意レベルと言い、統計学では通常０．０５の値を有意レベルとする。肺がん判定モデルは、かかるＲＯＣのＡＵＣを考慮する方法によりその性能を検証することができる。次に、本発明の肺がん判定モデルを生成する時に考慮された事項を説明する。

＜ＨＥ４バイオマーカーと被験体の年齢との相関関係が考慮された。（別途言及がなければ、すべてのＨＥ４は補正されたＨＥ４である）＞
図２は、被験体のＨＥ４発現量と被験体の年齢との相関関係を示したグラフである。図２を参照すると、ＨＥ４発現量と被験体の年齢との間には正の相関関係があることが分かる。該例示的グラフにおいて、相関係数（ピアソン係数）の値は０．４９０であり、ｐ−ｖａｌｕｅ＜２．２ｅ−１６である。当該図面ではバイオマーカーであるＨＥ４発現量と年齢との間の相関関係が扱われた。これによってＨＥ４バイオマーカーの有効性を客観的に評価するために、ＨＥ４バイオマーカーの発現量から年齢の影響力が除去された値である「補正された」発現量を導き出すことができる。ＨＥ４の場合、回帰分析により、

（ＨＥ４）＝β_０＋β_１×(age)＋ｅいう関係式でβ_０とβ_１の推定値を導き出す。このように推定された値をそれぞれ＾β_０と＾β_１とに定義すると、ＨＥ４に対する残差値は（residual of HE4）＝(HE4)−＾β_０−＾β_１×(age)と定義されることができる。

（本発明の複合バイオマーカー群に属する個別バイオマーカーの選択過程）
本発明者らは、人体内に存在する数万個以上のタンパク質の中から、まず１２０個のタンパク質標識子（protein markers）候補群を選定し、国内外の学術論文および文献の考察と、二次元電気泳動（２ＤＧｅｌ）、ＳＥＬＤＩ−ＴＯＦＭＳ分析法などにより臨床的意義、分析の便宜性、アルゴリズムの正確度、費用および臨床条件などの諸事情を考慮して、前記１２０個のタンパク質標識子から５０個余りの標識子を選び出し、２回にわたって肺がん患者６００人余り、正常被験体９００人余りを対象にして結果数値の統計分析により有効性を検証し、本発明の複合バイオマーカー群に含ませるのに適したものと予想される最終候補群を１３個選定した。より具体的には、Breast Cancer Research 2009, 11, R22のような論文またはJournal of Thoracic, Cardiac & Vascular Surgery 2012:143;421-7のような論文に記載されたような過程により、１２０個のタンパク質標識子から５０個余りの標識子を選び出し、そこから１３個の標識子を選定する場合を想定することができるが、必ずこれに限定されるものではない。

本発明者らは、最終候補群に選定された全体１３個の個別バイオマーカーと２個の人口統計学的変数のうち本発明の統計モデルに含ませるのが好ましい最も優れた部分集合を上述の実験データ（トレーニングのための実験データ）を利用して見つけ出すことに成功した。本発明者らが行った当該研究で、１３個の個別バイオマーカーと２個の人口統計学的変数のうち６個の個別バイオマーカーと年齢（ａｇｅ）が慎重に選択された。具体的には、トレーニングデータ（training data）５１５個の正常サンプルと、２８０個のがんサンプルを利用して複合バイオマーカー群が選定された。啓明大学校東山医療院からの１１３個の非小細胞肺がんサンプル、峨山病院からの１６７個の非小細胞肺がんサンプル、ソウル大学校病院家庭医学科からの５１５個のサンプルからトレーニングデータが構成されている。複合バイオマーカー群選定検証のためには検証データ（validation data）が使用された。検証データは峨山病院の非小細胞肺がんサンプル７５人、ソウル大学校病院家庭医学科の正常サンプル７５人から構成された。ＨＥ４、ＣＥＡ、ＡｐｏＡ２、ＴＴＲ、ｓＶＣＡＭ−１、ＲＡＮＴＥＳは含まれ、ＡｐｏＡ１、Ｂ２Ｍ、ＣＡ１２５、ＣＡ１９−９、ＣＲＰ、Ｃｙｆｒａ２１−１、ＬＲＧ１は除去された。これに対する説明は後述する。

説明の便宜のために、本発明による複合バイオマーカー群を構成する当該組み合わせを「ＢＩ組み合わせ」と称し、上述の１３個の個別バイオマーカーと２個の人口統計学的変数からＣＡ１９−９および性別を除外した残りの１２個の個別バイオマーカー全部と年齢を含む組み合わせを「全体組み合わせ」と称する。

かかる「ＢＩ組み合わせ」が選択された理由は次のとおりである。まず、カイ二乗検定（chi square test）およびスチューデントのｔ検定（Student’s t-test）が前記１３個の個別バイオマーカーおよび２個の人口統計学的変数の有意性を評価するのに利用された。

＜個別バイオマーカーＣＡ１９−９および性別の除去＞
当該段階では、個別バイオマーカーＣＡ１９−９と性別は除外された。有意レベル０．０５の下では性別と肺がん患者か否かとの間の関連性は有意ではなかった（ｐ−ｖａｌｕｅ：０．３１４）。また、ＣＡ１９−９対照群の平均と実験群の平均との間の差は有意しなかった（ｐ−ｖａｌｕｅ：０．２８２９）。参考までに、下記表３には性別と肺がん患者か否かが互いに独立であるという命題を帰無仮説として置くカイ二乗検定の結果値が表されており、表４には対照群の平均値と実験群の平均値との間の差の真値は０であるという命題を帰無仮説として置くスチューデントｔ検定の結果値が表されている。

前記全体組み合わせに属するすべての個別バイオマーカーそれぞれ（以下、「Ａ」と指称する）から他の個別バイオマーカーによって説明され得る効果を除外すれば、すなわち、線形回帰を利用する時に前記他の個別バイオマーカーの実験データの線形結合によって予測される前記バイオマーカーＡの残差値を考慮すると、肺がん患者実験群と対照群を互いに区別する有意な効果が前記バイオマーカーＡにあるか否かを確認することができる。

本発明者らは、当該残差値から個別バイオマーカーの有意性を検証するために前記残差値に対するスチューデントｔ検定を実施し、ここでの帰無仮説は前記残差値の対照群における平均値（「対照群平均」）と実験群における平均値（「実験群平均」）との間に差異がないとのことで、その結果は下記表５のとおりである。

前記表５のとおり、ＢＩ組み合わせに属する個別バイオマーカーであるＨＥ４、ＣＥＡ、ＡｐｏＡ２、ＴＴＲ、ｓＶＣＡＭ−１、ＲＡＮＴＥＳに対しては、すべて有意レベル０．０５未満のｐ−ｖａｌｕｅが得られ、前記残差値の対照群平均値と実験群平均値の差異があるというその個別バイオマーカーの有意性を確認することができたが、これに比べて全体組み合わせのうちＢＩ組み合わせに属しない個別バイオマーカーであるＡｐｏＡ１、Ｂ２Ｍ、ＣＡ１２５、ＣＡ１９−９、ＣＲＰ、Ｃｙｆｒａ２１−１、ＬＲＧ１は有意レベル０．０５の下ではすべて有意ではなかった。つまり、前記ＢＩ組み合わせに属する個別バイオマーカー以外に除去された個別バイオマーカーは肺がん患者と対照群に対する分類器としての性能が有意ではなかった（すなわち、良くない）。

表５の結果を図３で視覚的に確認することができる。図３は、個別バイオマーカーの前記残差値を表示した密度グラフ（density plot）である。２個の密度グラフのうち、実線が肺がん患者群に対するグラフであり、点線が対照群（正常人）に対するグラフである。２個の垂直線のうち実線で表示されたものが肺がん患者群の平均であり、点線で表示されたものが対照群の平均である。肺がん患者群の平均と対照群の平均との間の差、すなわち平均差は本発明の複合バイオマーカー群に属する個別バイオマーカーが相対的に大きいという点が分かる。図３で本発明の複合バイオマーカー群に属する個別バイオマーカーが、そうでない個別バイオマーカーに比べて肺がん判定に相対的により良いマーカーであることが視覚的にも分かる。すなわち、本発明者によって行われた実験および分析で前記全体組み合わせを利用するよりも前記ＢＩ組み合わせを利用する方がさらに有利であることが判明した。トレーニングセットのＲＯＣ曲線は図４に示されたとおりであり、そのＲＯＣ曲線のＡＵＣは下記表６に表示されたように全体組み合わせ（ＡＵＣ＝０．９８６８２３９）を利用した時と、ＢＩ組み合わせ（ＡＵＣ＝０．９８６４００８）を利用した時が類似し、ＢＩ組み合わせが全体組み合わせの１２個の個別バイオマーカーでおよそ６個の個別バイオマーカーを除外したにもかかわらずＢＩ組み合わせの分類性能を示すＡＵＣは全体組み合わせとほぼ同じに維持されたので、同一の効果をさらに経済的に得ることができる効果を確認することができた。

それだけでなく、検証セットで予測を行ってみると、表７に表示されたように、全体組み合わせ（ＡＵＣ＝０．９８１８６６７）に比べてＢＩ組み合わせ（ＡＵＣ＝０．９８８４４４４）の性能がむしろより優れていることが分かったので、全体的にＢＩ組み合わせが全体組み合わせに比べて有利であると判断される。前記検証セットに対するＲＯＣ曲線は図５に示されたとおりである。

上の選定された複合バイオマーカー群を用いて、トレーニングデータと検証データを合わせ、１０分割交差検証法を用いて分類器性能を考察した。

このように、本発明者らによって提示された方法論によって導き出された一例示的モデルである例示的複合バイオマーカー群を利用した分類器の性能は下の表８に概略的に示されている。当該例示的複合バイオマーカー群はＨＥ４、ＣＥＡ、ＡｐｏＡ２、ＲＡＮＴＥＳ、ＴＴＲ、ｓＶＣＡＭ−１および被験体の年齢をすべて考慮した。

表８で分類器に利用されたアルゴリズムは、ＧＬＭ（GeneralizedLinear Model；一般化線形モデル）、特にロジスティック回帰モデルであり、ＡＵＣは０．９８８、ｐ−ｖａｌｕｅ０．０００で、敏感度は全体９４．６５％だが、１期患者に対しても９１．９８％の高い敏感度で肺がんか否かを判定したことが分かる。ここで、特異度は９３．９０％であり、この時、カットオフ値（threshold；cutoff；閾値）は０．３７００９２８だった。かかるカットオフ値地点はすべての肺がん進行段階（stage）で敏感度が９０％以上でありながら、特異度が充分に高い地点に選択された。かかる選択の理由を具体的に説明すると、最適正確度（best accuracy）は標本数に影響を受ける場合があるが、本明細書の実験では正常な標本数が肺がん標本数よりも多く、相対的に特異度の高い地点が最適正確度を示す地点になるからである。結論的に、帰無仮説（ＡＵＣ＝０．５）をｐ−ｖａｌｕｅ０．０００で棄却することで統計的に有意な性能を示す。

＜１０分割交差検証法で確認した前記回帰モデルの回帰係数範囲＞
前記一例示的ロジスティック回帰モデルは、全体トレーニングセットから導き出されたものなので、その回帰モデルの回帰係数が一つに決定されたものだが、全体実験群の１０分の９に対して反復的に回帰モデルを導き出す１０分割交差検証法を利用すれば個別バイオマーカーに対する回帰係数が有する範囲を求めることができ、その結果は次表９に示されたとおりである。

ここで、個別バイオマーカーに対する回帰係数の単位は、個別バイオマーカーに対する実験データ値の単位の逆（ｉｎｖｅｒｓｅ）で表現される。ロジスティック回帰モデルの結果値、すなわち従属変数は単位がない値でなければならないからである。利用されたＨＥ４の実験データの単位はｌｏｇ（ｐＭ）なので、ＨＥ４に対する回帰係数の単位は｛ｌｏｇ（ｐＭ）｝^−１となる。また、ＡｐｏＡ２およびＴＴＲの実験データの単位はｌｏｇ（ｍｇ／ｄＬ）なので、ＡｐｏＡ２およびＴＴＲそれぞれに対する回帰係数の単位は｛ｌｏｇ（ｍｇ／ｄＬ）｝^−１となりｓＶＣＡＭ−１、ＣＥＡ、ＲＡＮＴＥＳの実験データの単位はｌｏｇ（ｎｇ／ｍＬ）なので、ｓＶＣＡＭ−１、ＣＥＡ、ＲＡＮＴＥＳそれぞれに対する回帰係数の単位は｛ｌｏｇ（ｎｇ／ｍＬ）｝^−１となる。当該回帰係数範囲は例示的なものであって、本発明によるロジスティック回帰モデルがこれに限定されないことは勿論である。

＜小細胞肺がん実験群による予測性能評価＞
前記分類器は正常人と非小細胞肺がん患者のみをもって構築されたものであり、本発明者らは小細胞肺がんに対しても分類性能を示しているか否かを確認するために、前記分類器を利用して小細胞肺がん実験群に対して肺がん患者か否かを判定する予測を行った。勿論、当該実験群は肺がん患者であると判定されなければならない。予測の結果は下記表１０に提示されている。

表１０を見ると、４１人の被験体に対して１００％の敏感度で全部がんと分類された驚くべき結果を確認することができる。

＜本発明の複合バイオマーカー群と異なる複合バイオマーカー群との比較＞
次に、個別バイオマーカーを活用する他の複合バイオマーカー群に対しても上述のロジスティック回帰モデルを求めてＡＵＣを導き出し、その結果は下記表１１に表示されたとおりである。

表１１では、それぞれの行に複合バイオマーカー群に利用された個別バイオマーカーが表示されており、下段（ｂｏｔｔｏｍ）行に本発明による複合バイオマーカー群に対応されるデータが表示されているが、ここで、ＡＵＣはその個別バイオマーカーを利用して導き出されたモデルによるＡＵＣ値を表示したものであり、ＡＵＣｒａｎｋはＡＵＣが高い順位を表示したものである。このように、表１１に示されたそれぞれの複合バイオマーカー群に対するＲＯＣ曲線の一実施例がさらに具体的に図６ないし図１０に示されている。

図６では、ＨＥ４およびＣＥＡを必須個別バイオマーカーとして含む複合バイオマーカー群に個別バイオマーカーの種類を一つずつ増加させながらＲＯＣ曲線を取得した。ここで、ｃｏｍｂ３はＨＥ４およびＣＥＡを個別バイオマーカーとして含む複合バイオマーカー群に該当し、ｃｏｍｂ４はＨＥ４、ＣＥＡおよびＲＡＮＴＥＳから構成される複合バイオマーカー群に該当し、ｃｏｍｂ５はＨＥ４、ＣＥＡ、ＲＡＮＴＥＳおよびＴＴＲから構成される複合バイオマーカー群に該当し、ｃｏｍｂ６はＨＥ４、ＣＥＡ、ＲＡＮＴＥＳ、ＴＴＲおよびｓＶＣＡＭ−１から構成される複合バイオマーカー群に該当し、ｃｏｍｂ７はＨＥ４、ＣＥＡ、ＲＡＮＴＥＳ、ＴＴＲ、ｓＶＣＡＭ−１、ＡｐｏＡ２から構成される複合バイオマーカー群に該当する。図６のすべての複合バイオマーカー群に対して年齢が共に考慮された。図６のすべての複合バイオマーカー群のうちｃｏｍｂ７であるＨＥ４、ＣＥＡ、ＲＡＮＴＥＳ、ＴＴＲ、ｓＶＣＡＭ−１、ＡｐｏＡ２から構成される本発明の複合バイオマーカー群が最も高い正確性を示す。

次に、図７には重要バイオマーカー２種類から構成された複合バイオマーカー群のＲＯＣ曲線が示されている。ここで、ｃｏｍｂ１はＨＥ４およびＣＥＡから構成される複合バイオマーカー群に該当し、ｃｏｍｂ２はＣＥＡおよびＣｙｆｒａ２１−１から構成される複合バイオマーカー群に該当し、ｃｏｍｂ３はＨＥ４およびＲＡＮＴＥＳから構成される複合バイオマーカー群に該当する。このすべての複合バイオマーカー群に対して年齢が共に考慮された。

また、図８にはＨＥ４およびＣＥＡを必須個別バイオマーカーとして含み、１種類の個別バイオマーカーを追加で含む複合バイオマーカー群のＲＯＣ曲線が示されている。ここで、ｃｏｍｂ１はＨＥ４、ＣＥＡおよびＡｐｏＡ２から構成される複合バイオマーカー群に該当し、ｃｏｍｂ２はＨＥ４、ＣＥＡおよびＴＴＲから構成される複合バイオマーカー群に該当し、ｃｏｍｂ３はＨＥ４、ＣＥＡおよびｓＶＣＡＭ−１から構成される複合バイオマーカー群に該当し、ｃｏｍｂ４はＨＥ４、ＣＥＡおよびＲＡＮＴＥＳから構成される複合バイオマーカー群に該当する。このすべてのバイオマーカー群に対して年齢が共に考慮された。このすべての複合バイオマーカー群は図８と表１１に示されたように、図７に示された組み合わせに比べてさらに高い正確性を示し、特にＨＥ４、ＣＥＡおよびＲＡＮＴＥＳをすべて含む組み合わせｃｏｍｂ４が最も高い正確性を示した。

そして、図９にはＨＥ４およびＣＥＡを必須個別バイオマーカーとして含み、２種類の個別バイオマーカーを追加で含む複合バイオマーカー群のＲＯＣ曲線が示されている。ここで、ｃｏｍｂ１はＨＥ４、ＣＥＡ、ＡｐｏＡ２およびＴＴＲから構成される複合バイオマーカー群に該当し、ｃｏｍｂ２はＨＥ４、ＣＥＡ、ＡｐｏＡ２およびｓＶＣＡＭ−１から構成される複合バイオマーカー群に該当し、ｃｏｍｂ３はＨＥ４、ＣＥＡ、ＴＴＲおよびｓＶＣＡＭ−１から構成される複合バイオマーカー群に該当し、ｃｏｍｂ４はＨＥ４、ＣＥＡ、ＡｐｏＡ２およびＲＡＮＴＥＳから構成される複合バイオマーカー群に該当し、ｃｏｍｂ５はＨＥ４、ＣＥＡ、ＴＴＲおよびＲＡＮＴＥＳから構成される複合バイオマーカー群に該当し、ｃｏｍｂ６はＨＥ４、ＣＥＡ、ｓＶＣＡＭ−１およびＲＡＮＴＥＳから構成される複合バイオマーカー群に該当する。このすべてのバイオマーカー群に対して年齢が共に考慮された。このすべての複合バイオマーカー群は図９と表１１に示されたように、図８に示された組み合わせに比べてさらに高い正確性を示す。

最後に、図１０にはＨＥ４およびＣＥＡを必須個別バイオマーカーとして含み、３種類の個別バイオマーカーをさらに含む複合バイオマーカー群のＲＯＣ曲線が示されている。ここで、ｃｏｍｂ１はＨＥ４、ＣＥＡ、ＡｐｏＡ２、ＴＴＲおよびｓＶＣＡＭ−１から構成される複合バイオマーカー群に該当し、ｃｏｍｂ２はＨＥ４、ＣＥＡ、ＡｐｏＡ２、ＴＴＲおよびＲＡＮＴＥＳから構成される複合バイオマーカー群に該当し、ｃｏｍｂ３はＨＥ４、ＣＥＡ、ＡｐｏＡ２、ｓＶＣＡＭ−１およびＲＡＮＴＥＳから構成される複合バイオマーカー群に該当し、ｃｏｍｂ４はＨＥ４、ＣＥＡ、ＴＴＲ、ｓＶＣＡＭ−１およびＲＡＮＴＥＳから構成される複合バイオマーカー群に該当する。このすべてのバイオマーカー群に対して年齢が共に考慮された。このすべての複合バイオマーカー群は、図１０と表１１に示されたように、概ね上記で言及された図８の複合バイオマーカー群に比べてさらに優れた性能を示す。

本発明の上述の実験結果によって、ＨＥ４、ＣＥＡ、ＲＡＮＴＥＳ、ＴＴＲ、ｓＶＣＡＭ−１、ＡｐｏＡ２から構成される本発明の複合バイオマーカー群が肺がんの発病判定に最も優れた性能を示す複合バイオマーカー群であることが分かり、０．９８８に達するＡＵＣを得ることができる高度で正確なバイオマーカーとして機能するということが分かった。つまり、本発明による複合バイオマーカー群を利用すれば肺がんを極めて正確に判定することができる。

これによって、本発明は被験体の肺がん診断のための複合バイオマーカー群として、個別バイオマーカーＣＥＡ、ＨＥ４、ＡｐｏＡ２、ＴＴＲ、ｓＶＣＡＭ−１（soluble vascular cell adhesion molecule-1）およびＲＡＮＴＥＳを含む複合バイオマーカー群を提供する。

本発明の複合バイオマーカー群は６個の個別バイオマーカーを含むものと限定しているが、表１１で示されたとおりＣＥＡ、ＨＥ４およびＲＡＮＴＥＳを含み、ＡｐｏＡ２、ＴＴＲおよびｓＶＣＡＭ−１のうち少なくとも一つをさらに含む複合バイオマーカー群に肺がん判定に効果的な複合バイオマーカー群の範囲を確張することができる。その根拠として、表１１で分かるように、４個の個別バイオマーカーから構成された組み合わせのうちＣＥＡ、ＨＥ４およびＲＡＮＴＥＳを含み、ＡｐｏＡ２、ＴＴＲおよびｓＶＣＡＭ−１のうち一つをさらに含む組み合わせがそのＡＵＣｒａｎｋが５、６、７なので４個の個別バイオマーカーから構成された他の組み合わせのＡＵＣｒａｎｋ９、１１、１２に比べて優れている点を挙げられる。それだけでなく、５個の個別バイオマーカーから構成された組み合わせのうちでもＣＥＡ、ＨＥ４およびＲＡＮＴＥＳを含み、ＡｐｏＡ２、ＴＴＲおよびｓＶＣＡＭ−１のうち二つをさらに含む組み合わせがやはり５個の個別バイオマーカーから構成された他の組み合わせよりも優れていることも観察することができる。このように、ＣＥＡ、ＨＥ４およびＲＡＮＴＥＳを含み、ＡｐｏＡ２、ＴＴＲおよびｓＶＣＡＭ−１のうち少なくとも一つをさらに含む複合バイオマーカー群が、本発明の目的によって被験体の肺がん診断のために利用されるであろうことは、本明細書に接した通常の技術者が容易に理解することができる。

また、本発明は被験体の肺がん診断のために複合バイオマーカー群を利用する肺がん診断用キットであって、個別バイオマーカーＣＥＡ、ＨＥ４、ＡｐｏＡ２、ＴＴＲ、ｓＶＣＡＭ−１およびＲＡＮＴＥＳに特異的に結合する抗体を含む肺がん診断用キットを含む。かかる肺がん診断用キットは肺がん発病の判定だけではなく肺がんのモニタリング（ｍｏｎｉｔｏｒｉｎｇ）または肺がんのスクリーニング（ｓｃｒｅｅｎｉｎｇ）の目的で使用されることもできる。

前記肺がん診断用キットに含まれる抗体は、上述のように多クローン抗体、単一クローン抗体およびエピトープと結合することができる断片などを含んでもよい。ここで、多クローン抗体は前記個別バイオマーカーのうちいずれか一つを動物に注射し、当該動物から採血して抗体を含む血清を取得する従来の方法によって産生することができる。

かかる多クローン抗体は、本発明が属する技術分野で知られたすべての方法によっても精製することができ、ヤギ、ウサギ、ヒツジ、サル、ウマ、ブタ、ウシ、イヌなど任意の動物種宿主から作られることができる。

また単一クローン抗体は、連続細胞株の培養を介した抗体分子の生成を提供するすべての技術を用いても製造することができる。かかる技術としてはハイブリドーマ技術、ヒトＢ−細胞ハイブリドーマ技術およびＥＢＶ−ハイブリドーマ技術（Kohler G et al., Nature 256:495-497、 1975;Kozbor D et al., J Immunol Methods 81:31-42、 1985; CoteRJ et al., Proc Natl Acad Sci 80:2026-2030、 1983;および Cole SP et al., Mol Cell Biol 62:109-120、1984）が含まれるが、これに限定されるものではない。

また、前記個別バイオマーカーのうちいずれか一つに対する特異的結合部位を含む抗体断片が製造されることができる。例えば、Ｆ（ａｂ’）２断片は抗体分子をペプシンで分解させて製造することができ、Ｆａｂ断片はＦ（ａｂ’）２断片のジスルフィド架橋を還元させることで製造することができるが、これに限定されるものではない。代案として、Ｆａｂ発現ライブラリを作製して所望の特異性を有する単クローンＦａｂ断片を迅速かつ簡便に同定することもできる（Huse WD et al., Science 254:1275-1281、1989）。

前記抗体は洗浄や複合体の分離など、その後の段階を容易にするために固形基質（solid substrate）に結合されてもよい。固形基質は、例えば合成樹脂、ニトロセルロース、ガラス基板、金属基板、ガラス繊維、常磁性ビーズ（paramagnetic bead）、微細球体および微細ビーズなどがある。また、前記合成樹脂にはポリエステル、ポリ塩化ビニル、ポリスチレン、ポリプロピレン、ＰＶＤＦおよびナイロンなどがある。本発明の具体的な実施例で、タンパク質に特異的に結合する抗体を固形基質に結合させるために微細球体を懸濁した後、マイクロチューブに移して遠心分離で上層液を除去した後に再懸濁し、Ｎ−ヒドロキシ−スルホスクシンイミド（N-hydroxy-sulfosuccinimide）および１−エチル−３−３−ジメチルアミノプロピル）−カルボジイミド塩酸塩（1-ethyl-3-(3-dimethylaminopropyl)-carbodiimide hydrochloride）を順に処理した後、遠心分離で上層液を除去した後に洗浄して保管した。また、被験体から取得された試料を、固形基質に結合された本発明の個別バイオマーカーのうちいずれか一つのタンパク質に特異的に結合することができる抗体と接触させる場合に、試料は抗体と接触する前に適当な程度に希釈されてもよい。

本発明のキットは、追加的に前記バイオマーカーに特異的に結合する検出用抗体を含んでもよい。前記検出用抗体は発色酵素、蛍光物質、放射性アイソトープまたはコロイドなどの検出体で標識した接合体でもよく、好ましくは前記バイオマーカーに特異的に結合することができる１次抗体である。例えば、前記発色酵素はペルオキシダーゼ、アルカリホスファターゼまたは酸性ホスファターゼ（例えば、セイヨウワサビペルオキシダーゼ）でもよく、蛍光物質の場合に、フルオレセインカルボン酸（ＦＣＡ）、フルオレセインイソチオシアネート（ＦＩＴＣ）、フルオレセインチオウレア（ＦＴＨ）、７−アセトキシクマリン−３−イル、フルオレセイン−５−イル、フルオレセイン−６−イル、２’,７’−ジクロロフルオレセイン−５−イル、２’,７’−ジクロロフルオレセイン−６−イル、ジハイドロテトラメチルロサミン−４−イル、テトラメチルロダミン−５−イル、テトラメチルロダミン−６−イル、４,４−ジフルオロ−５,７−ジメチル−４−ボラ−３ａ,４ａ−ジアザ−ｓ−インダセン−３−エチルまたは４,４−ジフルオロ−５,７−ジフェニル−４−ボラ−３ａ、４ａ−ジアザ−ｓ−インダセン−３−エチル、Ｃｙ３、Ｃｙ５、ポリ−Ｌ−リシン−フルオレセインイソチオシアネート（ＦＩＴＣ）、ローダミン−Ｂ−イソチオシアネート（ＲＩＴＣ）、ローダミン、フィコエリスリン（ＰＥ）などを用いてもよい。

また、本発明のキットは、追加で（１）前記バイオマーカーに特異的に結合する検出用抗体、および（２）前記検出用抗体に結合する特異的に結合することができるリガンドを含んでもよい。前記リガンドにはタンパク質Ａまたは検出用抗体に特異的に結合する２次抗体などがある。また、前記リガンドは発色酵素、蛍光物質、放射性アイソトープまたはコロイドなどの検出体に標識した接合体であってもよい。前記検出用抗体は前記リガンドのために、ビオチン化（biotinylation）またはジゴキシゲニン（digoxigenin）処理した１次抗体を利用することが好ましいが、前記検出用抗体の処理方法はこれに限定されない。また、前記リガンドとしては前記検出用抗体に結合するため、ストレプトアビジン、アビジンなどが使用されることが好ましいが、これに限定されない。本発明の具体的な実施例から前記検出体で蛍光物質を付着したストレプトアビジン（streptavidin）をリガンドとして使用し、前記リガンドのためにビオチン化（biotinylation）させた検出用抗体を利用した。

本発明の肺がん診断用キットは、前記抗体およびバイオマーカー複合体に検出用抗体を処理した後、検出用抗体の量を探索することで肺がんを診断、モニタリングおよびスクリーニングすることができる。または前記抗体およびバイオマーカー複合体に検出用抗体およびリガンドを順次に処理した後、検出体用抗体の量を探索することで肺がんを診断、モニタリングおよびスクリーニングすることができる。本発明の好ましい実施例で、検出用抗体を洗浄された抗体−バイオマーカー複合体と定温配置した後、洗浄して検出用抗体を測定することで前記バイオマーカーの量を測定することができる。検出用抗体の量測定や存在検出は、蛍光、発光、化学発光（chemiluminescence）、吸光度、反射または透過により行われてもよい。

また、前記検出用抗体またはリガンドの量を探索する方法としては、超高速スクリーニング（high throughput screening；ＨＴＳ）システムを利用することが好ましく、これには検出体で蛍光物質が付着されて蛍光を検出することで実行される蛍光法または検出体で放射線アイソトープが付着されて放射線を検出することで実行される放射線法と、検出体の標識なしに表面のプラズモン共鳴変化をリアルタイムで測定するＳＰＲ（surface plasmon resonance）方法またはＳＰＲシステムを映像化して確認するＳＰＲＩ（surface plasmon resonance imaging）方法とを利用することが好ましいが、これに限定されない。

例えば、前記蛍光法は蛍光スキャナプログラムを用いて前記検出用抗体を蛍光物質でラベリングした後、スポッティングして信号を確認する方法であり、当該方法を適用して結合程度を確認することができる。前記蛍光物質はＣｙ３、Ｃｙ５、ポリ−Ｌ−リシン−フルオレセインイソチオシアネート（ＦＩＴＣ）、ローダミン−Ｂ−イソチオシアネート（ＲＩＴＣ）、ローダミン（ｒｈｏｄａｍｉｎｅ）、ＰＥ（Ｐｈｙｃｏｅｒｙｔｈｒｉｎ）からなる群から選択されたいずれか1つが好ましいが、これに限定されない。前記ＳＰＲシステムは蛍光法とは異なり、試料を蛍光物質で標識する必要がなく抗体の結合程度をリアルタイムに分析することができるが、同時多発的な試料分析ができないという短所がある。ＳＰＲＩの場合には、微細整列方法を利用して同時多発的な試料分析が可能だが、探知強度が低い短所がある。

また、本発明の肺がん診断用キットは酵素と発色反応する基質、および結合されないタンパク質などは除去し、結合されたバイオマーカーのみを保有することができる洗浄液または溶離液を追加で含んでもよい。分析のために使用される試料は血清、尿、涙、唾液など正常的な状態と区別され得る疾患特異的ポリペプチドを確認することができる生体試料を含む。好ましくは、生物学的液体試料、例えば血液、血清、血漿、さらに好ましくは血清から測定されてもよい。試料はバイオマーカーの探知感度を増加させるように準備してもよいが、例えば、患者から取得した血清試料は陰イオン交換クロマトグラフィー、アフィニティークロマトグラフィー、サイズ排除クロマトグラフィー（size exclusion chromatography）、液体クロマトグラフィー、連続抽出（sequential extraction）またはゲル電気泳動などの方法を利用して前処理されてもよいが、これに限定されない。

他の一実施例として、本発明の肺がん診断用キットは、少なくとも６個の収容領域と、前記少なくとも６個の収容領域それぞれに収容され、予め設定された個別バイオマーカーに特異的に結合する６種類以上のバイオマーカー対応抗体と、を含むことを特徴とし、この時、前記６種類以上のバイオマーカー対応抗体は、個別バイオマーカーＣＥＡ、ＨＥ４、ＡｐｏＡ２、ＴＴＲ、ｓＶＣＡＭ−１およびＲＡＮＴＥＳそれぞれに特異的に結合する抗体それぞれを含む。

同時に、本発明は前記複合バイオマーカー群に含まれたそれぞれの個別バイオマーカーに特異的に結合することができる生物分子が固形基質に集積された肺がん診断用バイオチップを提供する。本発明のバイオチップは肺がん患者と正常人で発現の差異がある前記個別バイオマーカーを測定するのに使用するために、前記個別バイオマーカーに特異的に結合することができる抗体を含んでもよく、または２種類以上の前記特異的な抗体の組み合わせを含んでもよい。

前記生物分子は低分子化合物、リガンド、アプタマー、ペプチド、ポリペプチド、特異的結合タンパク質、高分子物質および抗体などからなる群から選択され、前記タンパク質に特異的に結合することができる物質であれば、すべて使用することができ、抗体またはアプタマーを使用することが好ましいが、これに限定されるものではない。

前記抗体は多クローン抗体または単一クローン抗体を使用することが好ましく、単一クローン抗体を使用することがさらに好ましい。前記タンパク質に特異的に結合する抗体は通常の技術者に知られた公知の方法で製作してもよく、商業的に知られた抗体を購入して使用することができる。前記抗体は通常の技術者に知られた従来方法によって免疫源であるタンパク質を外部宿主に注射することで製造してもよい。外部宿主はマウス、ラット、ヒツジ、ウサギのような哺乳動物を含む。免疫源は筋内、腹腔内または皮下注射方法で注射され、一般的に抗原性を増加させるための補助剤（ａｄｊｕｖａｎｔ）と共に投与してもよい。外部宿主から定期的に血液を採取して形成された力価および抗原に対する特異性を示す血清を収集して抗体を分離してもよい。

また、本発明のバイオチップの固形基質はプラスチック、ガラス、金属およびシリコンから構成された群から選択されてもよく、好ましくはその表面に前記抗体を付着させるために化学処理されるか、リンカー分子が結合してもよいが、これに限定されるものではない。本発明のバイオチップは、試料から全体タンパク質を採取してバイオチップと反応させ、容易かつ正確に肺がんを診断、モニタリングおよびスクリーニングを実行することができる。

前記バイオチップの基板にコーティングされた活性基は前記物質を結合する役割をし、アミン基、アルデヒド基、カルボキシル基およびチオール基からなる群から選択されてもよく、通常の技術者にタンパク質分子を基板に結合することができる活性基として知られたすべての活性基が使用可能であり、これに限定されるものではない。

また、本発明によれば、被験体の肺がん診断のために複合バイオマーカー群の情報を利用する方法が提供され、その方法は、（ａ）コンピューティングシステムが、（１−ｉ）肺がん患者および肺がん患者でない人々から構成された標本集団の生物学的試料から測定される肺がん診断用複合バイオマーカー群の個別バイオマーカー別発現量データ、または（１−ｉｉ）前記標本集団から測定される前記個別バイオマーカー別発現量データ、および前記標本集団の年齢を取得し、前記標本集団の前記個別バイオマーカー別発現量データを前処理して、（２−ｉ）前記前処理されたデータである前記標本集団の測定データから、または（２−ｉｉ）前記標本集団の測定データ、および前記標本集団の年齢から肺がん判定モデルが導き出された状態で、（３−ｉ）前記被験体の生物学的試料から測定される前記肺がん診断用複合バイオマーカー群の個別バイオマーカー別発現量データ、または（３−ｉｉ）前記被験体から測定される前記個別バイオマーカー別発現量データ、および前記被験体の年齢を取得する段階、および（ｂ）前記コンピューティングシステムが、前記被験体の前記個別バイオマーカー別発現量データを前処理し、（４−ｉ）前記前処理されたデータである前記被験体の測定データ、または（４−ｉｉ）前記測定データ、および前記被験体の年齢を利用して前記肺がん判定モデルから前記被験体の肺がん発病の有無を判定する段階を含む。すなわち、前記肺がん判定モデルは前記標本集団の測定データと共に前記標本集団に属する人々の年齢を独立変数にすることを特徴としてもよい。

一実施例では、前記肺がん判定モデルは上述のようなロジスティック回帰モデルでもよい。また、一実施例によれば、前記（ｂ）段階における前記前処理は前記個別バイオマーカー別発現量データのうち少なくとも一部をログ（ｌｏｇ_１０）変換する計算を含んでもよい。

そして、本発明によれば、上述の被験体の肺がん診断のために複合バイオマーカー群の情報を利用する前記方法を実行するコンピューティングシステムも提供される。

図１１は肺がん診断のために複合バイオマーカー群の情報を利用するコンピューティングシステム１００の構成を概略的に示した概念図である。図１１のとおり、コンピューティングシステム１００と、そのハードウェア構成要素である通信部１１０およびプロセッサ１２０が示されている。

ここで、通信部１１０は（１−ｉ）肺がん患者および肺がん患者でない人々から構成された標本集団の生物学的試料から測定される肺がん診断用複合バイオマーカー群の個別バイオマーカー別発現量データ、または（１−ｉｉ）前記標本集団から測定される前記個別バイオマーカー別発現量データ、および前記標本集団の年齢を取得し、前記標本集団の前記個別バイオマーカー別発現量データを前処理して、（２−ｉ）前記前処理されたデータである前記標本集団の測定データから、または（２−ｉｉ）前記標本集団の測定データ、および前記標本集団の年齢から肺がん判定モデルが導き出された状態で、（３−ｉ）前記被験体の生物学的試料から測定される前記肺がん診断用複合バイオマーカー群の個別バイオマーカー別発現量データ、または（３−ｉｉ）前記被験体から測定される前記個別バイオマーカー別発現量データ、および前記被験体の年齢を取得する。

また、プロセッサ１２０は前記被験体の前記個別バイオマーカー別発現量データを前処理し、（４−ｉ）前記前処理されたデータである前記被験体の測定データ、または（４−ｉｉ）前記測定データ、および前記被験体の年齢を利用して前記肺がん判定モデルから前記被験体の肺がん発病の有無を判定する。

このように、本発明によるコンピューティングシステム１００は、上述のような被験体の肺がん診断のために複合バイオマーカー群の情報を利用する方法を実行する。

前記実施例の説明に基づいて、通常の技術者は、本発明が多様な実施態樣で実施されることができるという点を明確に理解することができる。一つの実施例として、本明細書では肺がんを判定する方式としてロジスティック回帰モデルを利用したが、二進従属変数を説明する統計モデルであれば、すべて活用することができる。かかる統計モデルを扱う部分は多様なコンピューター構成要素により実行することができるプログラム命令語の形態で具現されてもよい。本明細書では、そのような統計モデルを扱うためにＲ統計パッケージが利用されたが、ＳＰＳＳ、ＳＡＳ、Ｍａｔｈｅｍａｔｉｃａなどその他の統計ソフトウェア、あるいはそのような統計方法を具現することができるプログラミング言語などロジスティック回帰モデルを導き出すにあたり必要な演算を実行することができるものであれば、すべて利用される可能性があることを通常の技術者は理解することができる。

これらは多様なコンピューター構成要素により実行することができるプログラム命令語の形態で具現され、コンピューターで読み取り可能な記録媒体に記録されてもよい。前記コンピューターで読み取り可能な記録媒体はプログラム命令語、データファイル、データ構造などを単独または組み合わせて含んでもよい。前記コンピューターで読み取り可能な記録媒体に記録されるプログラム命令語は、本発明のために特別に設計されて構成されたものか、公知の使用可能なものであってもよい。コンピューターで読み取り可能な記録媒体の例には、ハードディスク、フロッピーディスクおよび磁気テープのような磁気媒体、ＣＤ−ＲＯＭ、ＤＶＤのような光記録媒体、フロプティカルディスク（floptical disk）のような磁気−光媒体（magneto-opticalmedia）、およびＲＯＭ、ＲＡＭ、フラッシュメモリなどのようなプログラム命令語を保存して実行するように特別に構成されたハードウェア装置が含まれる。プログラム命令語の例には、コンパイラーによって作られるような機械語コードだけでなく、インタプリタなどを使用してコンピューティングシステムによって実行され得る高級言語コードも含まれる。前記ハードウェア装置は、本発明による処理を実行するために、一つ以上のソフトウェアモジュールとして作動するように構成してもよく、その逆も同様である。前記ハードウェア装置は、プログラム命令語を保存するためのＲＯＭ／ＲＡＭなどのようなメモリと結合され、前記メモリに保存された命令語を実行するように構成されるＣＰＵやＧＰＵのようなプロセッサを含んでもよく、外部装置と信号とを交わすことができる通信部を含んでもよい。さらに、前記ハードウェア装置は開発者らによって作成された命令語が伝達されるためのキーボード、マウス、その他の外部入力装置を含んでもよい。

また、上述の実施例ではＨＥ４、ＣＥＡ、Ｃｙｆｒａ２１−１、ＲＡＮＴＥＳ、ＴＴＲ、ｓＶＣＡＭ−１およびＡｐｏＡ２が必須個別バイオマーカーとして利用されたが、これと共に追加される他の個別バイオマーカーがさらにあり得ることを通常の技術者であれば理解することができる。これら個別バイオマーカーと共に利用され、上述の統計モデル（ロジスティック回帰モデル）の性能を向上させることができるものであれば、これまで本発明が属する技術分野である腫瘍学で腫瘍診断と連関して広く利用されるか、腫瘍との関連性が発見されたものであれば、すべて含んでもよい。本明細書では個別バイオマーカーとしてタンパク質マーカーのみを例示的に活用したが、必須個別バイオマーカーに付加して利用され得る個別バイオマーカーはこれに限定されず、核酸マーカー（例えば、ＲＮＡ、ＤＮＡマーカー）、その他の有機物と無機物の定量など腫瘍診断に関して知られた各種バイオマーカーを含んでもよい。

以上、本発明が具体的な構成要素などのような特定事項と限定された実施例および図面によって説明したが、これは本発明のより全般的な理解を助けるために提供されたものにすぎず、本発明が前記実施例に限定されるものではなく、本発明が属する技術分野で通常的な知識を有する者であれば、かかる記載から多様な修正および変形を行うことができる。

したがって、本発明の思想は前記説明した実施例に極限して定められてはならず、後述する特許請求の範囲だけでなく、当該特許請求の範囲と均等または等価的に変形されたすべてのものは本発明の思想の範疇に属する。

Claims

被験体の肺がん診断のために複合バイオマーカー群を利用する肺がん診断用キットにおいて、
個別バイオマーカーＣＥＡ（Carcinoembryonic antigen；がん胚抗原）、ＨＥ４（Human EpididymisProtein 4；ヒト精巣上体タンパク質４）、ＡｐｏＡ２（Apolipoprotein A-II）、ＴＴＲ（Transthyretin）、ｓＶＣＡＭ−１（soluble vascular celladhesion molecule-1）およびＲＡＮＴＥＳ｛regulated on activation,normal T cell expressed and secreted；Chemokine(C-Cmotif)ligand 5｝に特異的に結合する抗体を含むことを特徴とする肺がん診断用キットであって、
肺がん患者および肺がん患者でない人々から構成された標本集団の生物学的試料から測定される（１）肺がん診断用複合バイオマーカー群の個別バイオマーカー別発現量データ、またはこれを加工したデータＢｋｉ｛ｋは個別バイオマーカーに対する添え字（ｉｎｄｅｘ）であり、ｉは標本集団の個別生物学的試料に対する添え字｝、または（２）前記個別バイオマーカー別発現量データ、またはこれを加工したデータＢｋｉ、および前記標本集団の年齢ａｇｅｉが取得され、前記取得されたデータから肺がん判定モデルＭが導き出された状態で、（３）前記被験体の前記生物学的試料から前記肺がん診断用キットによって測定される前記肺がん診断用複合バイオマーカー群の個別バイオマーカー別発現量データ、またはこれを加工したデータＢｋ、または（４）前記個別バイオマーカー別発現量データ、またはこれを加工したデータＢｋおよび前記被験体の年齢データａｇｅを前記肺がん判定モデルＭに入力することで前記被験体の肺がん発病の有無を判定するように前記肺がん診断用キットが利用されることを特徴とする肺がん診断用キット。
前記少なくとも個別バイオマーカーそれぞれを含む肺がん診断用複合バイオマーカー群は、
（ａ１）第２コンピューティングシステムが、第２標本集団に属する被験体ｓから（ｉ）第１バイオマーカー集合Ｓ１に属するｎ番目個別バイオマーカーｘｎの発現量データ、またはこれを加工したデータｘｎｓ、または前記ｘｎｓおよび前記第２標本集団の年齢データｘａｇｅ,ｓと共に（ｉｉ）肺がん患者と診断されたか否かに関連するデータｙｓを取得する段階であって、前記第１バイオマーカー集合Ｓ１は、ＣＥＡ、ＨＥ４、ＡｐｏＡ２、ＴＴＲ、ｓＶＣＡＭ−１およびＲＡＮＴＥＳ以外にも追加で個別バイオマーカーをさらに含むことを特徴とするデータ取得段階と、
（ａ２）前記第２コンピューティングシステムが、前記第１バイオマーカー集合Ｓ１に属するｎ番目個別バイオマーカーそれぞれに対して、（ｉ）前記ｙｓと前記ｘｎｓは互いに独立という命題を帰無仮説として置くカイ二乗検定（chi square test）および（ｉｉ）肺がん患者と診断された被験体のｘｎｓ平均値と前記肺がん患者と診断されていない被験体のｘｎｓ平均値との間の差の真実値は０という命題を帰無仮説として置くスチューデントのｔ検定（Student’s t-test）のうち少なくとも一つを実行することで、前記Ｓ１に属するｎ番目個別バイオマーカーそれぞれに対するｐ−ｖａｌｕｅを算出する第１統計検定段階と、
（ａ３）前記第２コンピューティングシステムが、前記（ａ２）段階で算出された前記ｐ−ｖａｌｕｅを予め定められた有意レベルと比べて前記予め定められた有意レベルよりも小さい前記ｐ−ｖａｌｕｅを有する個別バイオマーカーから構成された第２バイオマーカー集合Ｓ２を生成する第１フィルタリング段階と、
（ａ４）前記第２コンピューティングシステムが、前記第２バイオマーカー集合Ｓ２に属するｍ番目個別バイオマーカーｘ_ｍそれぞれに対して、回帰モデル式

により、ｘｍの推定値＾ｘ_ｍを求める段階であって、Ｓｍ’＝Ｓ２−｛ｘｍ｝であり、前記推定値＾ｘ_ｍは前記肺がん患者と診断された被験体および前記肺がん患者と診断されていない被験体に対してそれぞれ求められる回帰モデル推定段階と、
（ａ５）前記第２コンピューティングシステムが、前記個別バイオマーカーｘ_ｍそれぞれに対する残差値であるｘ_ｍ−＾ｘ_ｍを求める段階であって、前記残差値は前記肺がん患者と診断された被験体および前記肺がん患者と診断されていない被験体に対してそれぞれ求められる残差取得段階と、
（ａ６）前記第２コンピューティングシステムが、前記肺がん患者と診断された被験体の前記残差値の平均値と前記肺がん患者と診断されていない被験体の前記残差値の平均値との間の差の真実値が０という命題を帰無仮説として置くスチューデントのｔ検定を実行することで、前記Ｓ２に属するｍ番目個別バイオマーカーそれぞれに対するｐ−ｖａｌｕｅを算出する第２統計検定段階と、
（ａ７）前記第２コンピューティングシステムが、前記（ａ６）段階で算出されたｐ−ｖａｌｕｅを予め定められた有意レベルと比べて前記予め定められた有意レベルよりも小さい前記ｐ−ｖａｌｕｅを有する前記ｍ番目個別バイオマーカーを前記肺がん診断用複合バイオマーカー群に含ませる第２フィルタリング段階と、
を行うことにより得られることを特徴とする、請求項１に記載の肺がん診断用キット。
被験体の肺がん診断のための複合バイオマーカー群を活用する肺がん診断用キットにおいて、
前記診断用キットは、
６個の収容領域と、
前記６個の収容領域それぞれに収容され、予め設定された個別バイオマーカーに特異的に結合する６種類のバイオマーカー対応抗体と、
を含み、
前記６種類のバイオマーカー対応抗体は、個別バイオマーカーＣＥＡ、ＨＥ４、ＡｐｏＡ２、ＴＴＲ、ｓＶＣＡＭ−１およびＲＡＮＴＥＳそれぞれに特異的に結合する抗体それぞれを含み、
肺がん患者および肺がん患者でない人々から構成された標本集団の生物学的試料から測定される（１）肺がん診断用複合バイオマーカー群の個別バイオマーカー別発現量データ、またはこれを加工したデータＢｋｉ｛ｋは個別バイオマーカーに対する添え字であり、ｉは標本集団の個別生物学的試料に対する添え字｝、または（２）前記個別バイオマーカー別発現量データ、またはこれを加工したデータＢｋｉ、および前記標本集団の年齢ａｇｅｉが取得され、前記取得されたデータから肺がん判定モデルＭが導き出された状態で、（３）前記被験体の前記生物学的試料から前記肺がん診断用キットによって測定される前記肺がん診断用複合バイオマーカー群の個別バイオマーカー別発現量データ、またはこれを加工したデータＢｋ、または（４）前記個別バイオマーカー別発現量データ、またはこれを加工したデータＢｋおよび前記被験体の年齢データａｇｅを前記肺がん判定モデルＭに入力することで前記被験体の肺がん発病の有無を判定するように前記肺がん診断用キットが利用されることを特徴とする肺がん診断用キット。
前記６種類以上のバイオマーカー対応抗体それぞれに対応される個別バイオマーカーそれぞれを含む肺がん診断用複合バイオマーカー群は、
（ａ１）第２コンピューティングシステムが、第２標本集団に属する被験体ｓから（ｉ）第１バイオマーカー集合Ｓ１に属するｎ番目個別バイオマーカーｘｎの発現量データ、またはこれを加工したデータｘｎｓ、または前記ｘｎｓおよび前記第２標本集団の年齢データｘａｇｅ,ｓと共に（ｉｉ）肺がん患者と診断されたか否かに関連するデータｙｓを取得する段階であって、前記第１バイオマーカー集合Ｓ１は、ＣＥＡ、ＨＥ４、ＡｐｏＡ２、ＴＴＲ、ｓＶＣＡＭ−１およびＲＡＮＴＥＳ以外にも追加で個別バイオマーカーをさらに含むことを特徴とするデータ取得段階と、
（ａ２）前記第２コンピューティングシステムが、前記第１バイオマーカー集合Ｓ１に属するｎ番目個別バイオマーカーそれぞれに対して、（ｉ）前記ｙｓと前記ｘｎｓは互いに独立という命題を帰無仮説として置くカイ二乗検定および（ｉｉ）肺がん患者と診断された被験体のｘｎｓ平均値と前記肺がん患者と診断されない被験体のｘｎｓ平均値との間の差の真実値は０という命題を帰無仮説として置くスチューデントのｔ検定のうち少なくとも一つを実行することで、前記Ｓ１に属するｎ番目個別バイオマーカーそれぞれに対するｐ−ｖａｌｕｅを算出する第１統計検定段階と、
（ａ３）前記第２コンピューティングシステムが、前記（ａ２）段階で算出された前記ｐ−ｖａｌｕｅを予め定められた有意レベルと比べて前記予め定められた有意レベルよりも小さい前記ｐ−ｖａｌｕｅを有する個別バイオマーカーから構成された第２バイオマーカー集合Ｓ２を生成する第１フィルタリング段階と、
（ａ４）前記第２コンピューティングシステムが、前記第２バイオマーカー集合Ｓ２に属するｍ番目個別バイオマーカーｘ_ｍそれぞれに対して、回帰モデル式

により、ｘ_ｍの推定値＾ｘ_ｍを求める段階であって、Ｓｍ’＝Ｓ２−｛ｘ_ｍ｝であり、前記推定値＾ｘ_ｍは前記肺がん患者と診断された被験体および前記肺がん患者と診断されない被験体に対してそれぞれ求められる回帰モデル推定段階と、
（ａ５）前記第２コンピューティングシステムが、前記個別バイオマーカーｘ_ｍそれぞれに対する残差値であるｘ_ｍ−＾ｘ_ｍを求める段階であって、前記残差値は前記肺がん患者と診断された被験体および前記肺がん患者と診断されない被験体に対してそれぞれ求められる残差取得段階と、
（ａ６）前記第２コンピューティングシステムが、前記肺がん患者と診断された被験体の前記残差値の平均値と前記肺がん患者と診断されない被験体の前記残差値との平均値の間の差の真実値が０という命題を帰無仮説として置くスチューデントのｔ検定を実行することで、前記Ｓ２に属するｍ番目個別バイオマーカーそれぞれに対するｐ−ｖａｌｕｅを算出する第２統計検定段階と、
（ａ７）前記第２コンピューティングシステムが、前記（ａ６）段階で算出されたｐ−ｖａｌｕｅを予め定められた有意レベルと比べて前記予め定められた有意レベルよりも小さい前記ｐ−ｖａｌｕｅを有する前記ｍ番目個別バイオマーカーを前記肺がん診断用複合バイオマーカー群に含ませる第２フィルタリング段階と、
を実行することで得られることを特徴とする、請求項３に記載の肺がん診断用キット。
被験体の肺がん診断のために複合バイオマーカー群の情報を利用する方法において、
（ａ）コンピューティングシステムが、肺がん患者および肺がん患者でない人々から構成された標本集団の生物学的試料から測定される（１）肺がん診断用複合バイオマーカー群の個別バイオマーカー別発現量データ、またはこれを加工したデータＢｋｉ｛ｋは個別バイオマーカーに対する添え字（ｉｎｄｅｘ）であり、ｉは標本集団の個別生物学的試料に対する添え字｝、または（２）前記個別バイオマーカー別発現量データ、またはこれを加工したデータＢｋｉ、および前記標本集団の年齢ａｇｅｉを取得し、前記取得されたデータから肺がん判定モデルＭが導き出された状態で、（３）前記被験体の生物学的試料から測定される前記肺がん診断用複合バイオマーカー群の個別バイオマーカー別発現量データ、またはこれを加工したデータＢｋ、または（４）前記個別バイオマーカー別発現量データ、またはこれを加工したデータＢｋおよび前記被験体の年齢データａｇｅを取得する段階と、
（ｂ）前記コンピューティングシステムが、前記取得された被験体のデータを利用して前記肺がん判定モデルＭから前記被験体の肺がん発病の有無を判定する段階と、
を含み、
前記肺がん診断用複合バイオマーカー群は、
個別バイオマーカーＣＥＡ、ＨＥ４、ＡｐｏＡ２、ＴＴＲ、ｓＶＣＡＭ−１およびＲＡＮＴＥＳを含む肺がん診断用複合バイオマーカー群情報利用方法。
前記肺がん診断用複合バイオマーカー群は、
（ａ１）第２コンピューティングシステムが、第２標本集団に属する被験体ｓから（ｉ）第１バイオマーカー集合Ｓ１に属するｎ番目個別バイオマーカーｘｎの発現量データ、またはこれを加工したデータｘｎｓ、または前記ｘｎｓおよび前記第２標本集団の年齢データｘａｇｅ,ｓと共に（ｉｉ）肺がん患者と診断されたか否かに関連するデータｙｓを取得する段階であって、前記第１バイオマーカー集合Ｓ１は、ＣＥＡ、ＨＥ４、ＡｐｏＡ２、ＴＴＲ、ｓＶＣＡＭ−１およびＲＡＮＴＥＳ以外にも追加で個別バイオマーカーをさらに含むことを特徴とするデータ取得段階と、
（ａ２）前記第２コンピューティングシステムが、前記第１バイオマーカー集合Ｓ１に属するｎ番目個別バイオマーカーそれぞれに対して、（ｉ）前記ｙｓと前記ｘｎｓは互いに独立という命題を帰無仮説として置くカイ二乗検定および（ｉｉ）肺がん患者と診断された被験体のｘｎｓ平均値と前記肺がん患者と診断されない被験体のｘｎｓ平均値との間の差の真実値は０という命題を帰無仮説として置くスチューデントのｔ検定のうち少なくとも一つを実行することで、前記Ｓ１に属するｎ番目個別バイオマーカーそれぞれに対するｐ−ｖａｌｕｅを算出する第１統計検定段階と、
（ａ３）前記第２コンピューティングシステムが、前記（ａ２）段階で算出された前記ｐ−ｖａｌｕｅを予め定められた有意レベルと比べて前記予め定められた有意レベルよりも小さい前記ｐ−ｖａｌｕｅを有する個別バイオマーカーから構成された第２バイオマーカー集合Ｓ２を生成する第１フィルタリング段階と、
（ａ４）前記第２コンピューティングシステムが、前記第２バイオマーカー集合Ｓ２に属するｍ番目個別バイオマーカーｘ_ｍそれぞれに対して、回帰モデル式

により、ｘ_ｍの推定値＾ｘ_ｍを求める段階であって、Ｓｍ’＝Ｓ２−｛ｘ_ｍ｝であり、前記推定値＾ｘ_ｍは前記肺がん患者と診断された被験体および前記肺がん患者と診断されない被験体に対してそれぞれ求められる回帰モデル推定段階と、
（ａ５）前記第２コンピューティングシステムが、前記個別バイオマーカーｘ_ｍそれぞれに対する残差値であるｘ_ｍ−＾ｘ_ｍを求める段階であって、前記残差値は前記肺がん患者と診断された被験体および前記肺がん患者と診断されない被験体に対してそれぞれ求められる残差取得段階と、
（ａ６）前記第２コンピューティングシステムが、前記肺がん患者と診断された被験体の前記残差値の平均値と前記肺がん患者と診断されない被験体の前記残差値との平均値の間の差の真実値が０という命題を帰無仮説として置くスチューデントのｔ検定を実行することで、前記Ｓ２に属するｍ番目個別バイオマーカーそれぞれに対するｐ−ｖａｌｕｅを算出する第２統計検定段階と、
（ａ７）前記第２コンピューティングシステムが、前記（ａ６）段階で算出されたｐ−ｖａｌｕｅを予め定められた有意レベルと比べて前記予め定められた有意レベルよりも小さい前記ｐ−ｖａｌｕｅを有する前記ｍ番目個別バイオマーカーを前記肺がん診断用複合バイオマーカー群に含ませる第２フィルタリング段階と、
を実行することで得られたことを特徴とする、請求項５に記載の肺がん診断用複合バイオマーカー群情報利用方法。
前記肺がん判定モデルＭは、前記Ｂｋｉおよび前記ａｇｅｉを利用して導き出される２−ｃｌａｓｓ分類器(classifier)であることを特徴とする、請求項５または６に記載の肺がん診断用複合バイオマーカー群情報利用方法。
前記肺がん判定モデルＭは、モデル式
Ｐ_i＝P(ｙ_i＝１)
に基づき、
α、β１、…、β７は回帰係数を指し、
εｉは残差値を指称するロジスティック回帰モデルであることを特徴とする、請求項７に記載の肺がん診断用複合バイオマーカー群情報利用方法。
前記（ａ）段階および（ｂ）段階で、
前記加工は、前記個別バイオマーカーのうち少なくとも一部に対する測定データをログ（ｌｏｇ）変換する計算であることを特徴とする、請求項５または６に記載の肺がん診断用複合バイオマーカー群情報利用方法。
被験体の肺がん診断のために複合バイオマーカー群の情報を利用するコンピューティングシステムにおいて、
（ａ）肺がん患者および肺がん患者でない人々から構成された標本集団の生物学的試料から測定される（１）肺がん診断用複合バイオマーカー群の個別バイオマーカー別発現量データ、またはこれを加工したデータＢｋｉ｛ｋは個別バイオマーカーに対する添え字であり、ｉは標本集団の個別生物学的試料に対する添え字｝、または（２）前記個別バイオマーカー別発現量データ、またはこれを加工したデータＢｋｉ、および前記標本集団の年齢ａｇｅｉを取得し、前記取得されたデータから肺がん判定モデルＭが導き出された状態で、（３）前記被験体の生物学的試料から測定される前記肺がん診断用複合バイオマーカー群の個別バイオマーカー別発現量データ、またはこれを加工したデータＢｋ、または（４）前記個別バイオマーカー別発現量データ、またはこれを加工したデータＢｋおよび前記被験体の年齢データａｇｅを取得する通信部と、
前記取得された被験体のデータを利用して前記肺がん判定モデルＭから前記被験体の肺がん発病の有無を判定するプロセッサと、
を含み、
前記肺がん診断用複合バイオマーカー群は、
個別バイオマーカーＣＥＡ、ＨＥ４、ＡｐｏＡ２、ＴＴＲ、ｓＶＣＡＭ−１およびＲＡＮＴＥＳを含む肺がん診断用複合バイオマーカー群情報利用コンピューティングシステム。
前記肺がん診断用複合バイオマーカー群は、
（ａ１）第２コンピューティングシステムが、第２標本集団に属する被験体ｓから（ｉ）第１バイオマーカー集合Ｓ１に属するｎ番目個別バイオマーカーｘｎの発現量データ、またはこれを加工したデータｘｎｓ、または前記ｘｎｓおよび前記第２標本集団の年齢データｘａｇｅ,ｓと共に（ｉｉ）肺がん患者と診断されたか否かに関連するデータｙｓを取得する段階であって、前記第１バイオマーカー集合Ｓ１は、ＣＥＡ、ＨＥ４、ＡｐｏＡ２、ＴＴＲ、ｓＶＣＡＭ−１およびＲＡＮＴＥＳ以外にも追加で個別バイオマーカーをさらに含むことを特徴とするデータ取得段階と、
（ａ２）前記第２コンピューティングシステムが、前記第１バイオマーカー集合Ｓ１に属するｎ番目個別バイオマーカーそれぞれに対して、（ｉ）前記ｙｓと前記ｘｎｓは互いに独立という命題を帰無仮説として置くカイ二乗検定および（ｉｉ）肺がん患者と診断された被験体のｘｎｓ平均値と前記肺がん患者と診断されない被験体のｘｎｓ平均値との間の差の真実値は０という命題を帰無仮説として置くスチューデントのｔ検定のうち少なくとも一つを実行することで、前記Ｓ１に属するｎ番目個別バイオマーカーそれぞれに対するｐ−ｖａｌｕｅを算出する第１統計検定段階と、
（ａ３）前記第２コンピューティングシステムが、前記（ａ２）段階で算出された前記ｐ−ｖａｌｕｅを予め定められた有意レベルと比べて前記予め定められた有意レベルよりも小さい前記ｐ−ｖａｌｕｅを有する個別バイオマーカーから構成された第２バイオマーカー集合Ｓ２を生成する第１フィルタリング段階と、
（ａ４）前記第２コンピューティングシステムが、前記第２バイオマーカー集合Ｓ２に属するｍ番目個別バイオマーカーｘ_ｍそれぞれに対して、回帰モデル式

により、ｘ_ｍの推定値＾ｘ_ｍを求める段階であって、Ｓｍ’＝Ｓ２−｛ｘ_ｍ｝であり、前記推定値＾ｘ_ｍは前記肺がん患者と診断された被験体および前記肺がん患者と診断されない被験体に対してそれぞれ求められる回帰モデル推定段階と、
（ａ５）前記第２コンピューティングシステムが、前記個別バイオマーカーｘ_ｍそれぞれに対する残差値であるｘ_ｍ−＾ｘ_ｍを求める段階であって、前記残差値は前記肺がん患者と診断された被験体および前記肺がん患者と診断されない被験体に対してそれぞれ求められる残差取得段階と、
（ａ６）前記第２コンピューティングシステムが、前記肺がん患者と診断された被験体の前記残差値の平均値と前記肺がん患者と診断されない被験体の前記残差値の平均値との間の差の真実値が０という命題を帰無仮説として置くスチューデントのｔ検定を実行することで、前記Ｓ２に属するｍ番目個別バイオマーカーそれぞれに対するｐ−ｖａｌｕｅを算出する第２統計検定段階と、
（ａ７）前記第２コンピューティングシステムが、前記（ａ６）段階で算出されたｐ−ｖａｌｕｅを予め定められた有意レベルと比べて前記予め定められた有意レベルよりも小さい前記ｐ−ｖａｌｕｅを有する前記ｍ番目個別バイオマーカーを前記肺がん診断用複合バイオマーカー群に含ませる第２フィルタリング段階と、
を行うことにより得られたことを特徴とする、請求項１０に記載の肺がん診断用複合バイオマーカー群情報利用コンピューティングシステム。
前記肺がん判定モデルＭは、前記Ｂｋｉおよび前記ａｇｅｉを利用して導き出される２−ｃｌａｓｓ分類器であることを特徴とする、請求項１０または１１に記載の肺がん診断用複合バイオマーカー群情報利用コンピューティングシステム。
前記肺がん判定モデルＭは、モデル式

Ｐ_i＝P(ｙ_i＝１)
に基づき、
α、β１、…、β７は回帰係数を指称し、
εｉは残差値を指称するロジスティック回帰モデルであることを特徴とする、請求項１２に記載の肺がん診断用複合バイオマーカー群情報利用コンピューティングシステム。
前記加工は、前記個別バイオマーカーのうち少なくとも一部に対する測定データをログ（ｌｏｇ）変換する計算であることを特徴とする、請求項１０または１１に記載の肺がん診断用複合バイオマーカー群情報利用コンピューティングシステム。