JP6374070B2 - 被験体の肺がん診断のための複合バイオマーカー群、これを利用する肺がん診断用キット、複合バイオマーカー群の情報を利用する方法およびこれを実行するコンピューティングシステム - Google Patents

被験体の肺がん診断のための複合バイオマーカー群、これを利用する肺がん診断用キット、複合バイオマーカー群の情報を利用する方法およびこれを実行するコンピューティングシステム Download PDF

Info

Publication number
JP6374070B2
JP6374070B2 JP2017163777A JP2017163777A JP6374070B2 JP 6374070 B2 JP6374070 B2 JP 6374070B2 JP 2017163777 A JP2017163777 A JP 2017163777A JP 2017163777 A JP2017163777 A JP 2017163777A JP 6374070 B2 JP6374070 B2 JP 6374070B2
Authority
JP
Japan
Prior art keywords
lung cancer
biomarker
individual
data
subject
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017163777A
Other languages
English (en)
Other versions
JP2018036264A (ja
Inventor
哲右 金
哲右 金
容大 金
容大 金
龍晟 愼
龍晟 愼
恩姫 延
恩姫 延
京男 姜
京男 姜
浩相 申
浩相 申
五蘭 權
五蘭 權
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bioinfra Life Science Inc
Original Assignee
Bioinfra Life Science Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bioinfra Life Science Inc filed Critical Bioinfra Life Science Inc
Publication of JP2018036264A publication Critical patent/JP2018036264A/ja
Application granted granted Critical
Publication of JP6374070B2 publication Critical patent/JP6374070B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57423Specifically defined cancers of lung
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57484Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/10Numerical modelling
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Theoretical Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Analytical Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • General Physics & Mathematics (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Microbiology (AREA)
  • Oncology (AREA)
  • Biochemistry (AREA)
  • Hospice & Palliative Care (AREA)
  • Cell Biology (AREA)
  • Organic Chemistry (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)

Description

本発明は、被験体の肺がん診断のための複合バイオマーカー群、これを利用する肺がん診断用キット、被験体の肺がん診断のための複合バイオマーカー群情報利用方法およびこれを実行するコンピューティングシステムに関し、本発明の複合バイオマーカー群は肺がん診断のためのものであり、個別バイオマーカーCEA、HE4、ApoA2、TTR、sVCAM−1およびRANTESを含む。
肺がんは肺に発生するがんであって、世界中で毎年130万人以上がこれによって死亡し、がんによる死亡のうち最も高い比率を占めている。肺がんの主な原因としては、喫煙、ラドンガス、石綿、遺伝などがあるが、喫煙が最も高い比重を占めると言われている。
具体的に肺がんを分類してみると、肺がんは小細胞肺がん(smallcell lung cancer)と非小細胞肺がん(non-small cell lung cancer)に分けられる。そのうち非小細胞肺がんは、肺がんの約80%に該当する最も代表的ながんであって、腺がん(adenocarcinoma)、扁平上皮細胞がん(squamous cellcarcinoma)、大細胞肺がん(large cell carcinoma)に分けられる。肺がんの種類によって組職学的特性に差が生じるだけでなく、予後と治療方法にも相違があるので、正確な診断が重要である。非小細胞肺がんの場合、最近のがん治療法の発達にもかかわらず、10年生存率が10%以下と極めて低い。これは大部分の非小細胞肺がんが相当進行した時期でも、患者が肺がんに罹患していると診断することが難しいことにその原因がある。
典型的に、肺がんの初期には全く症状がなく、ある程度進行した後でも普通に風邪と類似する咳、喀痰程度の症状に止まり、通常の問診ではほぼ発見することができないなど診断が極めて難しく、同じ肺がんでもがんの発生位置によって症状が異なって現われる特徴がある。肺がんの一般的な症状としては、咳、血の混じった痰あるいは喀血、呼吸困難、胸部の痛み、声枯れ、上大静脈症侯群、骨の痛みや骨折、頭痛、悪心、嘔吐などがあるが、かかる症状が深刻に現われ始めたことを患者自らが認知する頃には、既に肺がんはかなり進行した状態にあると見做すべきである。
したがって、現在では肺がんの早期診断が患者の生存可能性を高める最も良い方法である。
肺がんを早期診断するための最も良い方法は、周期的な検診である。検診の際に、患者の血液、尿など患者の身体に由来した生物学的試料を採取し、これにより肺がんの発病有無を判定することができる。このように、生物学的試料に含まれているタンパク質、核酸、代謝物質などを利用して体内の変化を調べることができる指標をバイオマーカー(biomarker)と言う。
例えば、肺がんを早期診断するための従来のバイオマーカー技術には、特許文献1に開示のように、A1AT、IGF−1、RANTESおよびTTRを必須として含むものがあった。当該技術よりも優れた分類能力を有して肺がんを診断することができれば、すなわち、バイオマーカーによる診断に誤診がより少なければ、肺がん確診に要される時間、費用および効果の側面で有利となる。
韓国登録特許第10−1463588号公報
本発明は、肺がんを診断するのに利用される、より改良された複合バイオマーカーを提示することを目的とする。
前記のような本発明の目的を達成し、後述する本発明の特徴的な効果を実現するための本発明の特徴的な構成は下記のとおりである。
本発明の一態様によれば、被験体の肺がん診断のための複合バイオマーカー群が提供され、その複合バイオマーカー群は、個別バイオマーカーCEA(Carcinoembryonic antigen;がん胚抗原)、HE4(HumanEpididymis Protein 4;ヒト精巣上体タンパク質4)、ApoA2(ApolipoproteinA-II)、TTR(Transthyretin)、sVCAM−1(soluble vascular cell adhesion molecule-1)およびRANTES{regulated on activation, normal T cell expressed and secreted; Chemokine(C-Cmotif)ligand 5}を含むことを特徴とする。
本発明の他の一態様によれば、被験体の肺がん診断のために複合バイオマーカー群を利用する肺がん診断用キットが提供され、その肺がん診断用キットは個別バイオマーカーCEA、HE4、ApoA2、TTR、sVCAM−1およびRANTESに特異的に結合する抗体を含むことを特徴とする。
本発明のまた他の一態様によれば、被験体の肺がん診断のための複合バイオマーカー群を活用する肺がん診断用キットが提供され、その肺がん診断用キットは少なくとも6個の収容領域と、前記少なくとも6個の収容領域それぞれに収容され、予め設定された個別バイオマーカーに特異的に結合する6種以上のバイオマーカー対応抗体とを含み、前記6種類以上のバイオマーカー対応抗体は個別バイオマーカーCEA、HE4、ApoA2、TTR、sVCAM−1およびRANTESのそれぞれに特異的に結合するそれぞれの抗体を含むことを特徴とする。
本発明の他の一態様によれば、被験体の肺がん診断のために複合バイオマーカー群の情報を利用する方法が提供され、その方法は、(a)コンピューティングシステムが、(1−i)肺がん患者および肺がん患者でない人々から構成された標本集団の生物学的試料から測定される、肺がん診断用複合バイオマーカー群の個別バイオマーカー別発現量データ、または(1−ii)前記標本集団から測定される前記個別バイオマーカー別発現量データおよび前記標本集団の年齢を取得し、前記標本集団の前記個別バイオマーカー別発現量データを前処理し、(2−i)前記前処理されたデータである前記標本集団の測定データから、または(2−ii)前記標本集団の測定データおよび前記標本集団の年齢から肺がん判定モデルが導き出された状態で、(3−i)前記被験体の生物学的試料から測定される前記肺がん診断用複合バイオマーカー群の個別バイオマーカー別発現量データ、または(3−ii)前記被験体から測定される前記個別バイオマーカー別発現量データ、および前記被験体の年齢を取得する段階と、(b)前記コンピューティングシステムが、前記被験体の前記個別バイオマーカー別発現量データを前処理し、(4−i)前記前処理されたデータである前記被験体の測定データ、または(4−ii)前記測定データおよび前記被験体の年齢を利用して前記肺がん判定モデルから前記被験体の肺がん発病の有無を判定する段階とを含み、ここで、前記肺がん診断用複合バイオマーカー群は、個別バイオマーカーのCEA、HE4、ApoA2、TTR、sVCAM−1およびRANTESを含む。
本発明のまた他の一態様によれば、被験体の肺がん診断のために複合バイオマーカー群の情報を利用するコンピューティングシステムが提供され、その複合バイオマーカー群情報利用コンピューティングシステムは、(1−i)肺がん患者および肺がん患者でない人々から構成された標本集団の生物学的試料から測定される肺がん診断用複合バイオマーカー群の個別バイオマーカー別発現量データ、または(1−ii)前記標本集団から測定される前記個別バイオマーカー別発現量データ、および前記標本集団の年齢を取得し、前記標本集団の前記個別バイオマーカー別発現量データを前処理し、(2−i)前記前処理されたデータである前記標本集団の測定データから、または(2−ii)前記標本集団の測定データおよび前記標本集団の年齢から肺がん判定モデルが導き出された状態で、(3−i)前記被験体の生物学的試料から測定される前記肺がん診断用複合バイオマーカー群の個別バイオマーカー別発現量データ、または(3−ii)前記被験体から測定される前記個別バイオマーカー別発現量データおよび前記被験体の年齢を取得する通信部、および前記被験体の前記個別バイオマーカー別発現量データを前処理し、(4−i)前記前処理されたデータである前記被験体の測定データ、または(4−ii)前記測定データおよび前記被験体の年齢を利用して前記肺がん判定モデルから前記被験体の肺がん発病の有無を判定するプロセッサを含み、ここで、前記肺がん診断用複合バイオマーカー群は、個別バイオマーカーCEA、HE4、ApoA2、TTR、sVCAM−1およびRANTESを含む。
本発明によれば、従来の複合バイオマーカー群に比べてさらに高い肺がん診断能力を有する複合バイオマーカーを構成することができる効果がある。
そして、本発明によれば、肺がん診断用キットおよび肺がん診断用キットを利用する肺がん診断方法の効率性をさらに高めることができる効果がある。
また、本発明によれば、効率的な診断により肺がん患者の生存率を高め、治療に対する患者の反応をモニタリングし、その結果に応じて治療方式を変更することを可能にする効果がある。
本発明の実施例の説明に利用されるために添付した図面は、単に本発明の実施例の一部に過ぎず、本発明が属する技術分野で通常の知識を有する者(以下「通常の技術者」とする)においては、発明的作業が行われることなく、当該図面に基づいて他の図面が得られることもあり得る。
本発明による肺がん診断用複合バイオマーカー群を利用して肺がん患者と正常人を分類(classify)するロジスティック回帰モデルの性能を評価するためのツールであるROC曲線を例示する図面。 本発明による肺がん診断用複合バイオマーカー群を構成する個別バイオマーカーであるHE4が肺がん患者と正常人のサンプルで示された発現量と被験体の年齢が有する相関関係を示したグラフ。 本発明の実験に利用された個別バイオマーカーの肺がん患者と正常人とのサンプルに対する測定データから残りのバイオマーカーと年齢の影響力を除いたデータを示した一実施例の密度グラフ(density plot)。 本発明による肺がん診断用複合バイオマーカー群と本発明の実験に利用された12個の個別バイオマーカーを含む全体バイオマーカー群に対する評価指標であるROC曲線をトレーニングセットに対して例示的に示した図面。 本発明による肺がん診断用複合バイオマーカー群と本発明の実験に利用された12個の個別バイオマーカーを含む全体バイオマーカー群に対する評価指標であるROC曲線を検証セットに対して例示的に示した図面。 前記個別バイオマーカーを含む本発明による肺がん診断用複合バイオマーカー群に対する評価指標であるROC曲線を例示的に示した図面。 前記個別バイオマーカーを含む本発明による肺がん診断用複合バイオマーカー群に対する評価指標であるROC曲線を例示的に示した図面。 前記個別バイオマーカーを含む本発明による肺がん診断用複合バイオマーカー群に対する評価指標であるROC曲線を例示的に示した図面。 前記個別バイオマーカーを含む本発明による肺がん診断用複合バイオマーカー群に対する評価指標であるROC曲線を例示的に示した図面。 前記個別バイオマーカーを含む本発明による肺がん診断用複合バイオマーカー群に対する評価指標であるROC曲線を例示的に示した図面。 本発明による被験体の肺がん診断のために複合バイオマーカー群の情報を利用するコンピューティングシステムの構成を概略的に示した概念図。
後述する本発明に対する詳細な説明は、本発明の目的、技術的解法および長所を明らかにするために、本発明が実施され得る特定の実施例を例示として示す添付の図面を参照する。これら実施例は、通常の技術者が本発明を実施できるに足りるよう詳しく説明される。
本明細書で「生物学的試料」とは、生体から採取した試料を意味し、好ましくは血液、血漿、血清、リンパ液、脳脊髄液などを含む組織液と、生体から分泌あるいは排出されるか採取される尿、便、涙、唾液などの物質を含む。
また、本明細書において、「抗体」は抗原性部位に対して指向性を有する(indicate)する特異的なタンパク質分子を意味し、多クローン(polyclonal)抗体、単一クローン(monoclonal)抗体、組換抗体、エピトープと結合し得る断片などの抗体をすべて含む。このうち、特に単一クローン抗体を利用することが好ましい。かかる抗体は、通常の技術者が公知の技術を利用して製造したものであればすべて利用することができる。前記抗体は、例えば通常の技術者に知られている従来の方法によって免疫源であるタンパク質を外部の宿主に注射することで製造することもできる。
そして、本明細書において、「正常人」は肺がんでない他の疾患を抱える人もこれに含まれ、肺がん患者でない人を指称するように意図された用語である。
また、本発明の詳細な説明および請求項にかけて、「含む」という単語およびその変形は他の技術的特徴、付加物、構成要素または段階を除去するものとして意図されたものではない。通常の技術者に本発明の他の目的、長所および特性が一部は本説明書から、そして一部は本発明の実施から示される。下記例示および図面は実例として提供され、本発明を限定するものとして意図されたものではない。
さらに、本発明は、本明細書に示された実施例のすべての可能な組み合わせを網羅する。本発明の多様な実施例は互いに異なるが、相互排他的である必要はないことを理解しなければならない。例えば、ここに記載されている特定の形状、構造および特性は、一実施例に関して本発明の精神および範囲を超えずに他の実施例で具現されてもよい。また、それぞれの開示された実施例内の個別構成要素の位置または配置は、本発明の精神および範囲を超えずに変更され得ることを理解しなければならない。したがって、後述する詳細な説明は限定的な意味として扱われるものではなく、本発明の範囲は、適切に説明される場合、その請求項が主張することと均等なすべての範囲と、さらに添付した請求項によってのみ限定される。図面において類似する参照符号は、いくつかの側面にかけて同一あるいは類似する機能を指称する。
本明細書で異なって表示されるか、明らかに文脈と矛盾しない限り、単数で表示された項目は、その文脈で別途定義がなければ複数のものを含む。
以下、通常の技術者が本発明を容易に実施することができるように、本発明の実施態樣による例示の機構、装置、方法およびこれらに関連する結果が提示される。
<利用された個別バイオマーカーの種類>
本発明による複合バイオマーカー群に属する個別バイオマーカーは、HE4、CEA、ApoA2、RANTES、TTRおよびsVCAM−1を含むが、本発明の複合バイオマーカー群はこれに限定されず、腫瘍学的に知られているバイオマーカーであれば、如何なるものも前記挙げられた個別バイオマーカーと共に、肺がんの診断に利用することができる。個別バイオマーカーが肺がん診断に有意か否かは個別的に判断されるべきであるが、本明細書では少なくともHE4、CEA、ApoA2、RANTES、TTR、sVCAM−1を含む複合バイオマーカー群について開示することとする。本発明者によって選択された個別バイオマーカーは次のとおりである。
HE4(Human Epididymis Protein 4;ヒト精巣上体タンパク質4)は、WFDC2遺伝子によってコードされたタンパク質であって、WAP four-disulfide core domain protein 2とも呼ばれる。HE4は従来、卵巣がんの腫瘍マーカーとして広く知られている。
CEA(Carcinoembryonic antigen;がん胚抗原)は、細胞付着に関連する糖タンパク質である。CEAは通常、胎児段階に胃腸管組職で作られ、出生前にその産生が中断される。したがって、健康な大人の血液には極めて低いレベルでしか存在しない。しかし、いくつかの類型のがんで血清におけるCEAレベルが増加するので、臨床で腫瘍マーカーとして利用され得る。
ApoA2(Apolipoprotein A-II)は、ヒトのAPOA2遺伝子によってコードされたタンパク質である。これは高密度の脂質タンパク質粒子において二番目に豊富なタンパク質である。
RANTES{regulated on activation,normal T cell expressed and secreted;Chemokine (C-C motif) ligand 5}は、ヒトのCCL5遺伝子によってコードされたタンパク質である。
TTR(Transthyretin;TTR)は、血清と脳脊髄液に存在する輸送タンパク質であり、甲状腺ホルモンであるチロキシン(thyroxine)とレチノールに結合するレチノール結合タンパク質を輸送する。肝臓が血液にTTRを分泌し、脈絡膜網(脈絡叢;choroid plexus)が脳脊髄液にTTRを分泌する。
sVCAM−1(soluble vascular celladhesion molecule-1)は、vcam−1が溶解された状態の細胞接着分子であって、細胞が損傷した時に起きる炎症反応に対する重要なバイオマーカーとして機能し得る。
これら選択された個別バイオマーカーの外に、本発明の実験に係る個別バイオマーカーは次のとおりである。
ApoA1(Apolipoprotein A-I)は、ヒトのAPOA1遺伝子によってコードされたタンパク質である。これは脂質代謝に重要な機能を果たすものとして知られている。
B2M(Beta-2 microglobulin)は、MHC class I分子の構成部分(component)である。ヒトにおいてB2Mタンパク質はB2M遺伝子によってコードされている。
CA125(CA−125;cancer antigen125;carcinoma antigen 125;あるいは carbohydrate antigen 125)は、mucin16またはMUC16としても知られており、これはヒトのMUC16遺伝子によってコードされたタンパク質である。CA125は、特定類型のがんに罹患した患者の血液内で濃度が高くなるので、腫瘍マーカーとして利用し得ることが発見された。
CRP(C−reactive protein)は、血漿で確認される環状の五量体タンパク質である。これは炎症に反応してその濃度が増加するものとして知られている。
LRG1(Leucine-richalpha-2-glycoprotein 1)は、ヒトのLRG1遺伝子によってコードされるタンパク質である。LRG1は急性虫垂炎がある時にその濃度が増加するものとしても知られていた。
Cyfra21−1{cytokeratin 19 fragmentantigen 21-1;Keratin, type I cytoskeletal 19; cytokeratin-19(CK-19;あるいは keratin-19(K19)}は、ヒトのKRT19遺伝子によってコードされた40kDaのタンパク質である。Cyfra21−1は、タイプIケラチン(type I keratin)であり、乳がん患者のリンパ節、末梢血液、骨髓から分泌される腫瘍細胞の検出に利用されるバイオマーカーとして知られている。
<個別バイオマーカーの分析のために利用された抗体あるいはキット>
本発明者らは、HE4、RANTES、sVCAM−1、LRG1、CEA、Cyfra21−1、ApoA2、ApoA1、TTR、B2M、CA125、CA19−9、CRPなど13種類のタンパク質を分析するために、いくつかの製造社から抗体またはキットを購入した。抗体、キット、標準物質(標準タンパク質)などの購入先の情報は下の表1ないし表2のとおりである。
標準タンパク質の場合、HE4の標準タンパク質はXEMA社、RANTESの標準タンパク質はPeproTech社、sVCAM−1とLRG−1の標準タンパク質はR&D Systems社から購入して利用し、主試薬および補正物質(calibrator)の場合、CEA、Cyfra21−1、B2M、CA125およびCA19−9タンパク質に対するものはRoche社、ApoA1およびApoA2タンパク質に対するものはSEKISUI社、TTRおよびCRPタンパク質に対するものはSIEMENS社から購入して利用した。
<肺がん患者の血清試料の取得>
峨山(アサン)病院および啓明(ゲミョン)大学・東山(ドンサン)医療院から、肺がん1期162人、肺がん2期42人、肺がん3期62人および肺がん4期89人の合計355人(峨山病院から242人、啓明大学東山医療院から113人)の肺がん患者から末梢血液を取得した。彼らの病歴による詳細類型は腺がんが230人、扁平上皮細胞がんが109人、大細胞肺がんが4人、神経内分泌がんが2人、その他が10人である。年齢と性別による区分は男性139人、女性216人、年齢による区分は平均63.85歳、中央値66歳、範囲は最小25歳〜最大83歳である。
ここで、前記肺がん患者は既知の方法を利用して確診され、斯かる方法には、胸部単純放射線撮影(X−ray)、胸部コンピューター断層撮影(CT)、超音波検査、磁気共鳴画像(MRI)、陽電子断層撮影(PET)、肺機能検査、肺灌流スキャン、肺組織検査{CT guided 経皮肺生検(PCNA)}、がん性胸水と胸膜組職検査、および分子生物学的検査として、EGFR突然変異(EGFR mutations)、遺伝子コピー数(gene copy number)、発現レベル(level of expression)、K−ras突然変異(K-ras mutation)、EML4−ALK融合腫瘍遺伝子(EML4-ALK fusion oncogene)に関する検査が含まれるが、これに限定されないことは通常の技術者であれば充分に理解することができる。
<対照群の血清取得>
ソウル大学病院家庭医学科から、肺がん患者でない人、すなわち正常人被験体590人の末梢血液を取得した。彼らの性別による区分は男性274人、女性343人、年齢による区分は平均56.87歳、中央値56歳、範囲は最小38歳〜最大79歳である。
肺がん患者および対照群はすべてVacutainerSST II tube(Becton Dickinson)など、既知のツールを利用して採血した後、遠心分離して血清を分離した。
<測定および結果データの構築>
このように取得した血清試料をもって個別バイオマーカータンパク質の発現量を測定し、その結果データを構築したところ、これに利用された定量方法は次のとおりである。
(HE4およびLRG−1タンパク質定量)
まずHE4およびLRG−1タンパク質は、ELISA(Enzyme-LinkedImmuno Sorbent Assay;酵素結合免疫吸着分析)方法で測定した。通常の技術者によく知られているとおり、ELISA法は抗体に酵素を標識し、酵素の活性を測定して抗原−抗体反応の強度とその量を定量的に測定する方法である。ここで、検出抗体(detection antibody)はビオチンにより標識した後に利用した。ELISA法試行の具体的な段階は次のとおりである。
<検出抗体のビオチン標識>
HE4およびLRG−1のELISA定量に利用された検出抗体(detection antibody)をビオチン化(biotinylation)させるために、EZ-Link Sulfo-NHS-LC-Biotin(sulfosuccinimidyl-6-[biotin-amido]hexanoate;ThermoFisher Scientific, Waltham, MA)試薬を利用し、製造会社が勧奨する方法によって行った。これを簡略に説明すると、抗ヒト−HE4抗体(anti-human HE4 antibody;XEMA Co.Ltd.,Moscow, Russia)または抗−ヒト−LRG1抗体(anti-human LRG-1 antibody;R&D systems, Minneapolis, MN)400μgをPBS溶液400μlに準備し、抗体に比べてモル(mole)の比率が20倍多く10mMのSulfo-NHS-LC-Biotin溶液を入れた後に常温で30分間反応させた。ビオチン標識が完了すると、PBS溶液1Lずつを3回透析(dialysis)した後に分注し、利用するまで−80℃で保管した。
<HE4およびLRG−1 ELISA>
HE4およびLRG−1はELISA法で定量し、簡略に説明すると、96−ウェルマイクロプレート(Nalgene Nunc Inc., Rochester NY)にヒトHE4に対する捕捉抗体(capture antibody; XEMA Co.Ltd., Moscow, Russia)を1μg/ml濃度で100μl入れた後に4℃で一晩中塗布した。洗浄溶液(0.05% Tween 20を含むPBS)で3回洗浄した後、5%脱脂乳(skim milk)が含まれたPBS溶液をウェルに入れて室温で2時間撹拌して非特異的結合を遮断した。洗浄溶液で3回洗浄した後に血清または標準補正物質(standard calibrator)を100μlずつ各ウェルに添加し、室温で1時間反応させた後に3回洗浄した。上で準備したビオチン標識された検出抗体を1μg/ml濃度で処理し、室温で再び1時間反応させた。3回洗浄した後に0.5μg/ml streptavidin-horseradish-peroxidase(Sigma-Aldrich, St. Louis, MO)を添加して室温で30分間反応させて5回洗浄した。発色反応を誘導するために、TMB(tetramethylbenzidine;KPL, Gaithersburg, MD)を100μlずつ添加し、15分後に2N硫酸50μlで反応を停止させ、マイクロプレートリーダー(Emax;Molecular Devices LLC., Sunnyvale, CA)を用いて450nmで吸光度を測定した。結果はSoftMax Proソフトウェア(Molecular Device)を利用して5個の母数(5−parametric)カーブフィッティングで分析した。補正用HE4標準タンパク質はXEMA社から、LRG−1標準タンパク質はR&D社から購入した。
(RANTES、 sVCAM−1 タンパク質定量)
次に、RANTESとsVCAM−1の肺がん患者と正常人の血清内濃度はxMAP技術プラットホーム(Luminex Corp.Austin, TX)を用いた多重免疫分析法(multipleximmunoassay)で測定した。多重免疫分析法はELISAウエスタンブロッティング(westernblotting)、PCR(polymerase chain reaction; ポリメラーゼ連鎖反応法)などのような従来の分析法に比べて時間と費用が節減されるものとして、通常の技術者に知られている分析法である。ここで、捕捉抗体はMagPlex微細球体(microspheres)にカルボジイミド(carbodiimide)法で結合させて利用し、全体の過程で微細球体が光に露出することは最小化した。
<抗体−微細球体の結合>
前記定量過程は、製造社が推奨するプロトコルによって実行し、まずMagPlex(Luminex Corp.)の微細球体懸濁液をボルテックス(Vortex;vortexing)した後、音波容器(sonification bath;Sonicor Instrument Corporation, USA)で20秒間懸濁した。1×10個の微細球体をマイクロチューブに移し、磁石を利用して分離して溶液を除去した後、蒸溜水100μlで洗浄し、再び0.1Mのリン酸ナトリウム緩衝溶液(sodium phosphate buffer;pH6.2)80μlに再懸濁(re-suspension)した。その後、50mg/mlのN−ヒドロキシスルホスクシンイミド(N-hydroxy-sulfosuccinimide, Sulfo-NHS;Thermo Fisher Scientific,Waltham, MA)および1−エチル−3−(3−ジメチルアミノプロピル)−カルボジイミド塩酸塩{1-ethyl-3-(3-dimethylaminopropyl)-carbodiimidehydrochloride; Thermo Fisher Scientific}をそれぞれ10μlずつ順に入れた後、室温で20分間10分間隔で混ぜ、50mMのMES、pH5.0溶液を250μlで2回洗浄した後、微細球体を同一の溶液100μlで再懸濁した。カルボキシル基活性化された微細球体に10μgの抗体(抗−sVCAM−1あるいは抗−RANTES)を入れ、50mMのMES溶液を添加して最終的に500μlになるようにした後、室温で2時間混ぜた。抗体結合反応が終わった微細球体は500μlのPBS−TBN{PBS, 1% BSA, 0.02% Tween 20, 0.05% アジ化ナトリウム(sodiumazide)}で2回洗浄し、血球計算盤(hemocytometer)で個数を測定した。このように作られた抗体結合微細球体は1×10個/500μlのPBS−TBN濃度で2℃〜8℃の暗室で保管した。
<sVCAM−1、RANTES多重免疫検査>
前記抗体結合微細球体を利用してsVCAMタンパク質およびRANTESタンパク質内の血清内濃度を多重検査法で同時に定量した。具体的に、96−ウェルマイクロプレートの各ウェルにRANTES標準タンパク質(R&D Systems)とsVCAM−1標準タンパク質(PeproTech, Rocky Hill, NJ)、または血清20μlと二つのバイオマーカータンパク質であるRANTESとsVCAM−1に対する捕捉抗体が結合された微細球体混合液20μlを混ぜた後、室温で1時間反応させた。その後、ビオチンが標識された検出抗体(biotinylated detection antibody)20μlを入れて1時間、そして、ストレプトアビジン−フィコエリスリン(Streptavidin R-Phycoerythrin、 JacksonImmunoResearch)20μlを入れて30分と、順次反応させた。反応が終わったプレートを、PBST(0.05% Tween20、PBS)溶液としてマイクロプレート洗浄剤{microplate washer(HydroFlex(登録商標); TECAN,Switzerland)}を用いて2回洗浄した後、微細球体を同一の緩衝溶液100μlで再懸濁してLuminex(登録商標)200で蛍光強度を測定した。血清サンプルのsVCAM−1とRANTESタンパク質濃度はアップステート社(Upstate、 USA)のビーズビューソフトウェア(Beadview Software)を利用して5個の母数のカーブフィッティングで分析した。
(CEA、Cyfra21−1、CA125、CA19−9、ApoA1、ApoA2、B2M、TTRおよびCRPタンパク質定量)
CEA、Cyfra21−1、CA125およびCA19−9タンパク質はCobas e601(Hoffmann-La Roche AG., Switzerland)装備において電気化学発光免疫測定法で、ApoA1、ApoA2およびB2Mタンパク質はClinical Analyzer 7080(Hitachi Medical Corp., Japan)装備において免疫比濁法で、TTRおよびCRPタンパク質はBN2 System(Siemens AG., Germany)装備において免疫比濁法で、製造社の説明書に従って測定した。
(バイオマーカーの有効性に関する統計的立証)
前記のような測定により取得したタンパク質定量数値である実験値は、前処理を経て下記で詳細に説明される統計分析に利用される測定データとなる。ここで前処理とは、10を基数としたログ(log10)変換をとってもよい。本実施例では、実験値の分布が右に偏っている傾向があるため、かかる傾向を緩和するために、すべての個別バイオマーカーの実験値に対してログ変換をとった。以下、本明細書で説明する一実施例では別途言及されない限り、このように変換された測定データが用いられる。
構築された測定データは、バイオインフォマティクス(bioinformatics)および統計的分析方法であるR統計パッケージ(R Development Core Team 2007.R: A language and environment forstatistical computing.R Foundation for Statistical Computing, Vienna, Austria. ISBN3-900051-07-0, URL http://www.R-project.org.)を利用して分析した。下記の分析により、入力されたデータから肺がん判定モデルが生成された。
<肺がん判定モデルの一例示−二進ロジスティック回帰分析>
一般的な線形回帰分析は従属変数が連続型である反面、ロジスティック回帰分析は失敗/成功、良/不良、肺がんである/ではない、などのように従属変数が2個の場合(すなわち、二進(binary)の場合)に利用される回帰分析方法である。ロジスティック回帰分析のモデルは次のとおりである。

=P(y=1)は0と1との間の値、yは0または1値を有し、本明細書で0は肺がんでないことを、1は肺がんであることを示す値に設定された。またxkのそれぞれは肺がん診断に導入された個別バイオマーカーの実験値(log値)を意味する。R統計パッケージでは、例えば以下のような命令語でロジスティック回帰を実行することができ、その結果として、モデル客体が回帰モデルとして導き出される。
m<−glm(b〜x1+x2+x3+x4+x5+x6、family=binomial)
当該モデル客体mをもって個別被験体の肺がん判定を実行することができるので、当該回帰モデルを肺がん判定モデルと言える。ここで、bはレベルが2つである要因であり(本明細書では、TRUE=肺がん、FALSE=正常)、x1、x2、x3、x4、x5、x6は予測変数である。例えば、x1、x2、x3、x4、x5、x6はそれぞれCEA、HE4、ApoA2、TTR、sVCAM−1およびRANTESの発現量のデータに対応される測定データであるものと意図したものであり得る。この場合、個別被験体から測定された測定データからその個別被験体が肺がん患者であるか否かを予測することができ、例えば、当該予測を行うR統計パッケージの命令語は次のとおりでもよい。
dfrm<−data.frame(x1=value,x2=value,x3=value,x4=value,x5=value,x6=value)
predict(m,type=“response”,newdata=dfrm)
本発明者らは、下記説明する多様な複合バイオマーカー群に対して、上記で言及されたロジスティック回帰を行ってロジスティック回帰モデルを取得した。具体的には、ロジスティック回帰モデルの妥当性を検証するため、本発明者は10分割交差検証法(10fold cross validation)を利用した。10分割交差検証法では、まずデータをランダムに10個のセグメントに分割する。1個のセグメントを残して9個のセグメントをもってトレーニング、すなわち、本実施例ではロジスティック回帰モデルを生成した後、残り1個のセグメントを利用して上述の予測、すなわち検証を行う。上記の過程をすべてのセグメントに対して繰り返し行う。かかる予測の結果を統合し、その予測の性能を確認することができるが、ROC曲線がそのための一つのツールである。
<肺がん判定モデルの性能の尺度−ROC曲線>
上述の肺がん判定モデルは、一種の分類器(classifier)の役割を果たすので、分類器の性能を示すROC曲線(Receiver Operating Characteristic Curve;受容者操作特性曲線)により、その性能を確認することができる。
図1は、ロジスティック回帰モデルの性能を評価するためのツールであるROC曲線を例示する図面である。図1のとおり、まずROC曲線グラフの横軸に示された数値は、1−特異度(specificity)=偽陽性率(falsepositive rate)であって、特異度は、特異度(specificity)=真陰性(true negative)/(偽陽性(falsepositive)+真陰性(true negative))で定義される値である。すなわち、特異度は「間違っているもの(陰性)」を間違ったと判断する比率を意味するので、グラフでは左側に傾くほど「正しいもの(陽性)」を間違ったと判断する誤判の比率が減ると考えられる。また、ROC曲線グラフの縦軸に示された数値は、敏感度(sensitivity)=真陽性率(truepositive rate)であって、敏感度は、敏感度(sensitivity)=真陽性(true positive)/(真陽性(true positive)+偽陽性(false negative))で定義される値である。すなわち、敏感度は「正しいもの」を正しいと判断する比率を意味するので、グラフでは上に傾くほど「間違っているもの」を正しいと誤判する比率が減ると考えられる。したがって、分類器が正しく判断するほど、グラフ曲線の下の面積(AUC;area under curve)は増加する。分類器が正しく判断する分類性能を一つも有していない時には、AUCは0.5となる。普通、AUC数値によって非情報的(AUC=0.5)、やや正確(0.5<AUC≦0.7)、中等度の正確(0.7<AUC≦0.9)、極めて正確(0.9<AUC<1)、そして完璧な検査(AUC=1)に分類することができる。
<肺がん判定モデルの性能の検証(ROC−AUC)>
本発明の肺がん判定モデルが分類性能を全く有していないことを意味するAUC=0.5を帰無仮説、ロジスティック回帰モデルが分類性能を有していることを対立仮説として、仮説検証を行うことができる。エラーが出る確率をp−value(有意確率)とすると、所定の確率よりp−valueが低い時、帰無仮説を棄却して対立仮説を採択し、その所定の確率を有意レベルと言い、統計学では通常0.05の値を有意レベルとする。肺がん判定モデルは、かかるROCのAUCを考慮する方法によりその性能を検証することができる。次に、本発明の肺がん判定モデルを生成する時に考慮された事項を説明する。
<HE4バイオマーカーと被験体の年齢との相関関係が考慮された。(別途言及がなければ、すべてのHE4は補正されたHE4である)>
図2は、被験体のHE4発現量と被験体の年齢との相関関係を示したグラフである。図2を参照すると、HE4発現量と被験体の年齢との間には正の相関関係があることが分かる。該例示的グラフにおいて、相関係数(ピアソン係数)の値は0.490であり、p−value<2.2e−16である。当該図面ではバイオマーカーであるHE4発現量と年齢との間の相関関係が扱われた。これによってHE4バイオマーカーの有効性を客観的に評価するために、HE4バイオマーカーの発現量から年齢の影響力が除去された値である「補正された」発現量を導き出すことができる。HE4の場合、回帰分析により、
(HE4)=β+β×(age)+eいう関係式でβとβの推定値を導き出す。このように推定された値をそれぞれ^βと^βとに定義すると、HE4に対する残差値は(residual of HE4)=(HE4)−^β−^β×(age)と定義されることができる。
(本発明の複合バイオマーカー群に属する個別バイオマーカーの選択過程)
本発明者らは、人体内に存在する数万個以上のタンパク質の中から、まず120個のタンパク質標識子(protein markers)候補群を選定し、国内外の学術論文および文献の考察と、二次元電気泳動(2D Gel)、SELDI−TOF MS分析法などにより臨床的意義、分析の便宜性、アルゴリズムの正確度、費用および臨床条件などの諸事情を考慮して、前記120個のタンパク質標識子から50個余りの標識子を選び出し、2回にわたって肺がん患者600人余り、正常被験体900人余りを対象にして結果数値の統計分析により有効性を検証し、本発明の複合バイオマーカー群に含ませるのに適したものと予想される最終候補群を13個選定した。より具体的には、Breast Cancer Research 2009, 11, R22のような論文またはJournal of Thoracic, Cardiac & Vascular Surgery 2012:143;421-7のような論文に記載されたような過程により、120個のタンパク質標識子から50個余りの標識子を選び出し、そこから13個の標識子を選定する場合を想定することができるが、必ずこれに限定されるものではない。
本発明者らは、最終候補群に選定された全体13個の個別バイオマーカーと2個の人口統計学的変数のうち本発明の統計モデルに含ませるのが好ましい最も優れた部分集合を上述の実験データ(トレーニングのための実験データ)を利用して見つけ出すことに成功した。本発明者らが行った当該研究で、13個の個別バイオマーカーと2個の人口統計学的変数のうち6個の個別バイオマーカーと年齢(age)が慎重に選択された。具体的には、トレーニングデータ(training data)515個の正常サンプルと、280個のがんサンプルを利用して複合バイオマーカー群が選定された。啓明大学校東山医療院からの113個の非小細胞肺がんサンプル、峨山病院からの167個の非小細胞肺がんサンプル、ソウル大学校病院家庭医学科からの515個のサンプルからトレーニングデータが構成されている。複合バイオマーカー群選定検証のためには検証データ(validation data)が使用された。検証データは峨山病院の非小細胞肺がんサンプル75人、ソウル大学校病院家庭医学科の正常サンプル75人から構成された。HE4、CEA、ApoA2、TTR、sVCAM−1、RANTESは含まれ、ApoA1、B2M、CA125、CA19−9、CRP、Cyfra21−1、LRG1は除去された。これに対する説明は後述する。
説明の便宜のために、本発明による複合バイオマーカー群を構成する当該組み合わせを「BI組み合わせ」と称し、上述の13個の個別バイオマーカーと2個の人口統計学的変数からCA19−9および性別を除外した残りの12個の個別バイオマーカー全部と年齢を含む組み合わせを「全体組み合わせ」と称する。
かかる「BI組み合わせ」が選択された理由は次のとおりである。まず、カイ二乗検定(chi square test)およびスチューデントのt検定(Student’s t-test)が前記13個の個別バイオマーカーおよび2個の人口統計学的変数の有意性を評価するのに利用された。
<個別バイオマーカーCA19−9および性別の除去>
当該段階では、個別バイオマーカーCA19−9と性別は除外された。有意レベル0.05の下では性別と肺がん患者か否かとの間の関連性は有意ではなかった(p−value:0.314)。また、CA19−9対照群の平均と実験群の平均との間の差は有意しなかった(p−value:0.2829)。参考までに、下記表3には性別と肺がん患者か否かが互いに独立であるという命題を帰無仮説として置くカイ二乗検定の結果値が表されており、表4には対照群の平均値と実験群の平均値との間の差の真値は0であるという命題を帰無仮説として置くスチューデントt検定の結果値が表されている。
前記全体組み合わせに属するすべての個別バイオマーカーそれぞれ(以下、「A」と指称する)から他の個別バイオマーカーによって説明され得る効果を除外すれば、すなわち、線形回帰を利用する時に前記他の個別バイオマーカーの実験データの線形結合によって予測される前記バイオマーカーAの残差値を考慮すると、肺がん患者実験群と対照群を互いに区別する有意な効果が前記バイオマーカーAにあるか否かを確認することができる。

本発明者らは、当該残差値から個別バイオマーカーの有意性を検証するために前記残差値に対するスチューデントt検定を実施し、ここでの帰無仮説は前記残差値の対照群における平均値(「対照群平均」)と実験群における平均値(「実験群平均」)との間に差異がないとのことで、その結果は下記表5のとおりである。
前記表5のとおり、BI組み合わせに属する個別バイオマーカーであるHE4、CEA、ApoA2、TTR、sVCAM−1、RANTESに対しては、すべて有意レベル0.05未満のp−valueが得られ、前記残差値の対照群平均値と実験群平均値の差異があるというその個別バイオマーカーの有意性を確認することができたが、これに比べて全体組み合わせのうちBI組み合わせに属しない個別バイオマーカーであるApoA1、B2M、CA125、CA19−9、CRP、Cyfra21−1、LRG1は有意レベル0.05の下ではすべて有意ではなかった。つまり、前記BI組み合わせに属する個別バイオマーカー以外に除去された個別バイオマーカーは肺がん患者と対照群に対する分類器としての性能が有意ではなかった(すなわち、良くない)。
表5の結果を図3で視覚的に確認することができる。図3は、個別バイオマーカーの前記残差値を表示した密度グラフ(density plot)である。2個の密度グラフのうち、実線が肺がん患者群に対するグラフであり、点線が対照群(正常人)に対するグラフである。2個の垂直線のうち実線で表示されたものが肺がん患者群の平均であり、点線で表示されたものが対照群の平均である。肺がん患者群の平均と対照群の平均との間の差、すなわち平均差は本発明の複合バイオマーカー群に属する個別バイオマーカーが相対的に大きいという点が分かる。図3で本発明の複合バイオマーカー群に属する個別バイオマーカーが、そうでない個別バイオマーカーに比べて肺がん判定に相対的により良いマーカーであることが視覚的にも分かる。すなわち、本発明者によって行われた実験および分析で前記全体組み合わせを利用するよりも前記BI組み合わせを利用する方がさらに有利であることが判明した。トレーニングセットのROC曲線は図4に示されたとおりであり、そのROC曲線のAUCは下記表6に表示されたように全体組み合わせ(AUC=0.9868239)を利用した時と、BI組み合わせ(AUC=0.9864008)を利用した時が類似し、BI組み合わせが全体組み合わせの12個の個別バイオマーカーでおよそ6個の個別バイオマーカーを除外したにもかかわらずBI組み合わせの分類性能を示すAUCは全体組み合わせとほぼ同じに維持されたので、同一の効果をさらに経済的に得ることができる効果を確認することができた。
それだけでなく、検証セットで予測を行ってみると、表7に表示されたように、全体組み合わせ(AUC=0.9818667)に比べてBI組み合わせ(AUC=0.9884444)の性能がむしろより優れていることが分かったので、全体的にBI組み合わせが全体組み合わせに比べて有利であると判断される。前記検証セットに対するROC曲線は図5に示されたとおりである。
上の選定された複合バイオマーカー群を用いて、トレーニングデータと検証データを合わせ、10分割交差検証法を用いて分類器性能を考察した。
このように、本発明者らによって提示された方法論によって導き出された一例示的モデルである例示的複合バイオマーカー群を利用した分類器の性能は下の表8に概略的に示されている。当該例示的複合バイオマーカー群はHE4、CEA、ApoA2、RANTES、TTR、sVCAM−1および被験体の年齢をすべて考慮した。
表8で分類器に利用されたアルゴリズムは、GLM(GeneralizedLinear Model;一般化線形モデル)、特にロジスティック回帰モデルであり、AUCは0.988、p−value0.000で、敏感度は全体94.65%だが、1期患者に対しても91.98%の高い敏感度で肺がんか否かを判定したことが分かる。ここで、特異度は93.90%であり、この時、カットオフ値(threshold;cutoff;閾値)は0.3700928だった。かかるカットオフ値地点はすべての肺がん進行段階(stage)で敏感度が90%以上でありながら、特異度が充分に高い地点に選択された。かかる選択の理由を具体的に説明すると、最適正確度(best accuracy)は標本数に影響を受ける場合があるが、本明細書の実験では正常な標本数が肺がん標本数よりも多く、相対的に特異度の高い地点が最適正確度を示す地点になるからである。結論的に、帰無仮説(AUC=0.5)をp−value0.000で棄却することで統計的に有意な性能を示す。
<10分割交差検証法で確認した前記回帰モデルの回帰係数範囲>
前記一例示的ロジスティック回帰モデルは、全体トレーニングセットから導き出されたものなので、その回帰モデルの回帰係数が一つに決定されたものだが、全体実験群の10分の9に対して反復的に回帰モデルを導き出す10分割交差検証法を利用すれば個別バイオマーカーに対する回帰係数が有する範囲を求めることができ、その結果は次表9に示されたとおりである。
ここで、個別バイオマーカーに対する回帰係数の単位は、個別バイオマーカーに対する実験データ値の単位の逆(inverse)で表現される。ロジスティック回帰モデルの結果値、すなわち従属変数は単位がない値でなければならないからである。利用されたHE4の実験データの単位はlog(pM)なので、HE4に対する回帰係数の単位は{log(pM)}−1となる。また、ApoA2およびTTRの実験データの単位はlog(mg/dL)なので、ApoA2およびTTRそれぞれに対する回帰係数の単位は{log(mg/dL)}−1となりsVCAM−1、CEA、RANTESの実験データの単位はlog(ng/mL)なので、sVCAM−1、CEA、RANTESそれぞれに対する回帰係数の単位は{log(ng/mL)}−1となる。当該回帰係数範囲は例示的なものであって、本発明によるロジスティック回帰モデルがこれに限定されないことは勿論である。
<小細胞肺がん実験群による予測性能評価>
前記分類器は正常人と非小細胞肺がん患者のみをもって構築されたものであり、本発明者らは小細胞肺がんに対しても分類性能を示しているか否かを確認するために、前記分類器を利用して小細胞肺がん実験群に対して肺がん患者か否かを判定する予測を行った。勿論、当該実験群は肺がん患者であると判定されなければならない。予測の結果は下記表10に提示されている。
表10を見ると、41人の被験体に対して100%の敏感度で全部がんと分類された驚くべき結果を確認することができる。
<本発明の複合バイオマーカー群と異なる複合バイオマーカー群との比較>
次に、個別バイオマーカーを活用する他の複合バイオマーカー群に対しても上述のロジスティック回帰モデルを求めてAUCを導き出し、その結果は下記表11に表示されたとおりである。
表11では、それぞれの行に複合バイオマーカー群に利用された個別バイオマーカーが表示されており、下段(bottom)行に本発明による複合バイオマーカー群に対応されるデータが表示されているが、ここで、AUCはその個別バイオマーカーを利用して導き出されたモデルによるAUC値を表示したものであり、AUCrankはAUCが高い順位を表示したものである。このように、表11に示されたそれぞれの複合バイオマーカー群に対するROC曲線の一実施例がさらに具体的に図6ないし図10に示されている。
図6では、HE4およびCEAを必須個別バイオマーカーとして含む複合バイオマーカー群に個別バイオマーカーの種類を一つずつ増加させながらROC曲線を取得した。ここで、comb3はHE4およびCEAを個別バイオマーカーとして含む複合バイオマーカー群に該当し、comb4はHE4、CEAおよびRANTESから構成される複合バイオマーカー群に該当し、comb5はHE4、CEA、RANTESおよびTTRから構成される複合バイオマーカー群に該当し、comb6はHE4、CEA、RANTES、TTRおよびsVCAM−1から構成される複合バイオマーカー群に該当し、comb7はHE4、CEA、RANTES、TTR、sVCAM−1、ApoA2から構成される複合バイオマーカー群に該当する。図6のすべての複合バイオマーカー群に対して年齢が共に考慮された。図6のすべての複合バイオマーカー群のうちcomb7であるHE4、CEA、RANTES、TTR、sVCAM−1、ApoA2から構成される本発明の複合バイオマーカー群が最も高い正確性を示す。
次に、図7には重要バイオマーカー2種類から構成された複合バイオマーカー群のROC曲線が示されている。ここで、comb1はHE4およびCEAから構成される複合バイオマーカー群に該当し、comb2はCEAおよびCyfra21−1から構成される複合バイオマーカー群に該当し、comb3はHE4およびRANTESから構成される複合バイオマーカー群に該当する。このすべての複合バイオマーカー群に対して年齢が共に考慮された。
また、図8にはHE4およびCEAを必須個別バイオマーカーとして含み、1種類の個別バイオマーカーを追加で含む複合バイオマーカー群のROC曲線が示されている。ここで、comb1はHE4、CEAおよびApoA2から構成される複合バイオマーカー群に該当し、comb2はHE4、CEAおよびTTRから構成される複合バイオマーカー群に該当し、comb3はHE4、CEAおよびsVCAM−1から構成される複合バイオマーカー群に該当し、comb4はHE4、CEAおよびRANTESから構成される複合バイオマーカー群に該当する。このすべてのバイオマーカー群に対して年齢が共に考慮された。このすべての複合バイオマーカー群は図8と表11に示されたように、図7に示された組み合わせに比べてさらに高い正確性を示し、特にHE4、CEAおよびRANTESをすべて含む組み合わせcomb4が最も高い正確性を示した。
そして、図9にはHE4およびCEAを必須個別バイオマーカーとして含み、2種類の個別バイオマーカーを追加で含む複合バイオマーカー群のROC曲線が示されている。ここで、comb1はHE4、CEA、ApoA2およびTTRから構成される複合バイオマーカー群に該当し、comb2はHE4、CEA、ApoA2およびsVCAM−1から構成される複合バイオマーカー群に該当し、comb3はHE4、CEA、TTRおよびsVCAM−1から構成される複合バイオマーカー群に該当し、comb4はHE4、CEA、ApoA2およびRANTESから構成される複合バイオマーカー群に該当し、comb5はHE4、CEA、TTRおよびRANTESから構成される複合バイオマーカー群に該当し、comb6はHE4、CEA、sVCAM−1およびRANTESから構成される複合バイオマーカー群に該当する。このすべてのバイオマーカー群に対して年齢が共に考慮された。このすべての複合バイオマーカー群は図9と表11に示されたように、図8に示された組み合わせに比べてさらに高い正確性を示す。
最後に、図10にはHE4およびCEAを必須個別バイオマーカーとして含み、3種類の個別バイオマーカーをさらに含む複合バイオマーカー群のROC曲線が示されている。ここで、comb1はHE4、CEA、ApoA2、TTRおよびsVCAM−1から構成される複合バイオマーカー群に該当し、comb2はHE4、CEA、ApoA2、TTRおよびRANTESから構成される複合バイオマーカー群に該当し、comb3はHE4、CEA、ApoA2、sVCAM−1およびRANTESから構成される複合バイオマーカー群に該当し、comb4はHE4、CEA、TTR、sVCAM−1およびRANTESから構成される複合バイオマーカー群に該当する。このすべてのバイオマーカー群に対して年齢が共に考慮された。このすべての複合バイオマーカー群は、図10と表11に示されたように、概ね上記で言及された図8の複合バイオマーカー群に比べてさらに優れた性能を示す。
本発明の上述の実験結果によって、HE4、CEA、RANTES、TTR、sVCAM−1、ApoA2から構成される本発明の複合バイオマーカー群が肺がんの発病判定に最も優れた性能を示す複合バイオマーカー群であることが分かり、0.988に達するAUCを得ることができる高度で正確なバイオマーカーとして機能するということが分かった。つまり、本発明による複合バイオマーカー群を利用すれば肺がんを極めて正確に判定することができる。
これによって、本発明は被験体の肺がん診断のための複合バイオマーカー群として、個別バイオマーカーCEA、HE4、ApoA2、TTR、sVCAM−1(soluble vascular cell adhesion molecule-1)およびRANTESを含む複合バイオマーカー群を提供する。
本発明の複合バイオマーカー群は6個の個別バイオマーカーを含むものと限定しているが、表11で示されたとおりCEA、HE4およびRANTESを含み、ApoA2、TTRおよびsVCAM−1のうち少なくとも一つをさらに含む複合バイオマーカー群に肺がん判定に効果的な複合バイオマーカー群の範囲を確張することができる。その根拠として、表11で分かるように、4個の個別バイオマーカーから構成された組み合わせのうちCEA、HE4およびRANTESを含み、ApoA2、TTRおよびsVCAM−1のうち一つをさらに含む組み合わせがそのAUCrankが5、6、7なので4個の個別バイオマーカーから構成された他の組み合わせのAUCrank9、11、12に比べて優れている点を挙げられる。それだけでなく、5個の個別バイオマーカーから構成された組み合わせのうちでもCEA、HE4およびRANTESを含み、ApoA2、TTRおよびsVCAM−1のうち二つをさらに含む組み合わせがやはり5個の個別バイオマーカーから構成された他の組み合わせよりも優れていることも観察することができる。このように、CEA、HE4およびRANTESを含み、ApoA2、TTRおよびsVCAM−1のうち少なくとも一つをさらに含む複合バイオマーカー群が、本発明の目的によって被験体の肺がん診断のために利用されるであろうことは、本明細書に接した通常の技術者が容易に理解することができる。
また、本発明は被験体の肺がん診断のために複合バイオマーカー群を利用する肺がん診断用キットであって、個別バイオマーカーCEA、HE4、ApoA2、TTR、sVCAM−1およびRANTESに特異的に結合する抗体を含む肺がん診断用キットを含む。かかる肺がん診断用キットは肺がん発病の判定だけではなく肺がんのモニタリング(monitoring)または肺がんのスクリーニング(screening)の目的で使用されることもできる。
前記肺がん診断用キットに含まれる抗体は、上述のように多クローン抗体、単一クローン抗体およびエピトープと結合することができる断片などを含んでもよい。ここで、多クローン抗体は前記個別バイオマーカーのうちいずれか一つを動物に注射し、当該動物から採血して抗体を含む血清を取得する従来の方法によって産生することができる。
かかる多クローン抗体は、本発明が属する技術分野で知られたすべての方法によっても精製することができ、ヤギ、ウサギ、ヒツジ、サル、ウマ、ブタ、ウシ、イヌなど任意の動物種宿主から作られることができる。
また単一クローン抗体は、連続細胞株の培養を介した抗体分子の生成を提供するすべての技術を用いても製造することができる。かかる技術としてはハイブリドーマ技術、ヒトB−細胞ハイブリドーマ技術およびEBV−ハイブリドーマ技術(Kohler G et al., Nature 256:495-497、 1975;Kozbor D et al., J Immunol Methods 81:31-42、 1985; CoteRJ et al., Proc Natl Acad Sci 80:2026-2030、 1983;および Cole SP et al., Mol Cell Biol 62:109-120、1984)が含まれるが、これに限定されるものではない。
また、前記個別バイオマーカーのうちいずれか一つに対する特異的結合部位を含む抗体断片が製造されることができる。例えば、F(ab’)2断片は抗体分子をペプシンで分解させて製造することができ、Fab断片はF(ab’)2断片のジスルフィド架橋を還元させることで製造することができるが、これに限定されるものではない。代案として、Fab発現ライブラリを作製して所望の特異性を有する単クローンFab断片を迅速かつ簡便に同定することもできる(Huse WD et al., Science 254:1275-1281、1989)。
前記抗体は洗浄や複合体の分離など、その後の段階を容易にするために固形基質(solid substrate)に結合されてもよい。固形基質は、例えば合成樹脂、ニトロセルロース、ガラス基板、金属基板、ガラス繊維、常磁性ビーズ(paramagnetic bead)、微細球体および微細ビーズなどがある。また、前記合成樹脂にはポリエステル、ポリ塩化ビニル、ポリスチレン、ポリプロピレン、PVDFおよびナイロンなどがある。本発明の具体的な実施例で、タンパク質に特異的に結合する抗体を固形基質に結合させるために微細球体を懸濁した後、マイクロチューブに移して遠心分離で上層液を除去した後に再懸濁し、N−ヒドロキシ−スルホスクシンイミド(N-hydroxy-sulfosuccinimide)および1−エチル−3−3−ジメチルアミノプロピル)−カルボジイミド塩酸塩(1-ethyl-3-(3-dimethylaminopropyl)-carbodiimide hydrochloride)を順に処理した後、遠心分離で上層液を除去した後に洗浄して保管した。また、被験体から取得された試料を、固形基質に結合された本発明の個別バイオマーカーのうちいずれか一つのタンパク質に特異的に結合することができる抗体と接触させる場合に、試料は抗体と接触する前に適当な程度に希釈されてもよい。
本発明のキットは、追加的に前記バイオマーカーに特異的に結合する検出用抗体を含んでもよい。前記検出用抗体は発色酵素、蛍光物質、放射性アイソトープまたはコロイドなどの検出体で標識した接合体でもよく、好ましくは前記バイオマーカーに特異的に結合することができる1次抗体である。例えば、前記発色酵素はペルオキシダーゼ、アルカリホスファターゼまたは酸性ホスファターゼ(例えば、セイヨウワサビペルオキシダーゼ)でもよく、蛍光物質の場合に、フルオレセインカルボン酸(FCA)、フルオレセインイソチオシアネート(FITC)、フルオレセインチオウレア(FTH)、7−アセトキシクマリン−3−イル、フルオレセイン−5−イル、フルオレセイン−6−イル、2’,7’−ジクロロフルオレセイン−5−イル、2’,7’−ジクロロフルオレセイン−6−イル、ジハイドロテトラメチルロサミン−4−イル、テトラメチルロダミン−5−イル、テトラメチルロダミン−6−イル、4,4−ジフルオロ−5,7−ジメチル−4−ボラ−3a,4a−ジアザ−s−インダセン−3−エチルまたは4,4−ジフルオロ−5,7−ジフェニル−4−ボラ−3a、4a−ジアザ−s−インダセン−3−エチル、Cy3、Cy5、ポリ−L−リシン−フルオレセインイソチオシアネート(FITC)、ローダミン−B−イソチオシアネート(RITC)、ローダミン、フィコエリスリン(PE)などを用いてもよい。
また、本発明のキットは、追加で(1)前記バイオマーカーに特異的に結合する検出用抗体、および(2)前記検出用抗体に結合する特異的に結合することができるリガンドを含んでもよい。前記リガンドにはタンパク質Aまたは検出用抗体に特異的に結合する2次抗体などがある。また、前記リガンドは発色酵素、蛍光物質、放射性アイソトープまたはコロイドなどの検出体に標識した接合体であってもよい。前記検出用抗体は前記リガンドのために、ビオチン化(biotinylation)またはジゴキシゲニン(digoxigenin)処理した1次抗体を利用することが好ましいが、前記検出用抗体の処理方法はこれに限定されない。また、前記リガンドとしては前記検出用抗体に結合するため、ストレプトアビジン、アビジンなどが使用されることが好ましいが、これに限定されない。本発明の具体的な実施例から前記検出体で蛍光物質を付着したストレプトアビジン(streptavidin)をリガンドとして使用し、前記リガンドのためにビオチン化(biotinylation)させた検出用抗体を利用した。
本発明の肺がん診断用キットは、前記抗体およびバイオマーカー複合体に検出用抗体を処理した後、検出用抗体の量を探索することで肺がんを診断、モニタリングおよびスクリーニングすることができる。または前記抗体およびバイオマーカー複合体に検出用抗体およびリガンドを順次に処理した後、検出体用抗体の量を探索することで肺がんを診断、モニタリングおよびスクリーニングすることができる。本発明の好ましい実施例で、検出用抗体を洗浄された抗体−バイオマーカー複合体と定温配置した後、洗浄して検出用抗体を測定することで前記バイオマーカーの量を測定することができる。検出用抗体の量測定や存在検出は、蛍光、発光、化学発光(chemiluminescence)、吸光度、反射または透過により行われてもよい。
また、前記検出用抗体またはリガンドの量を探索する方法としては、超高速スクリーニング(high throughput screening;HTS)システムを利用することが好ましく、これには検出体で蛍光物質が付着されて蛍光を検出することで実行される蛍光法または検出体で放射線アイソトープが付着されて放射線を検出することで実行される放射線法と、検出体の標識なしに表面のプラズモン共鳴変化をリアルタイムで測定するSPR(surface plasmon resonance)方法またはSPRシステムを映像化して確認するSPRI(surface plasmon resonance imaging)方法とを利用することが好ましいが、これに限定されない。
例えば、前記蛍光法は蛍光スキャナプログラムを用いて前記検出用抗体を蛍光物質でラベリングした後、スポッティングして信号を確認する方法であり、当該方法を適用して結合程度を確認することができる。前記蛍光物質はCy3、Cy5、ポリ−L−リシン−フルオレセインイソチオシアネート(FITC)、ローダミン−B−イソチオシアネート(RITC)、ローダミン(rhodamine)、PE(Phycoerythrin)からなる群から選択されたいずれか1つが好ましいが、これに限定されない。前記SPRシステムは蛍光法とは異なり、試料を蛍光物質で標識する必要がなく抗体の結合程度をリアルタイムに分析することができるが、同時多発的な試料分析ができないという短所がある。SPRIの場合には、微細整列方法を利用して同時多発的な試料分析が可能だが、探知強度が低い短所がある。
また、本発明の肺がん診断用キットは酵素と発色反応する基質、および結合されないタンパク質などは除去し、結合されたバイオマーカーのみを保有することができる洗浄液または溶離液を追加で含んでもよい。分析のために使用される試料は血清、尿、涙、唾液など正常的な状態と区別され得る疾患特異的ポリペプチドを確認することができる生体試料を含む。好ましくは、生物学的液体試料、例えば血液、血清、血漿、さらに好ましくは血清から測定されてもよい。試料はバイオマーカーの探知感度を増加させるように準備してもよいが、例えば、患者から取得した血清試料は陰イオン交換クロマトグラフィー、アフィニティークロマトグラフィー、サイズ排除クロマトグラフィー(size exclusion chromatography)、液体クロマトグラフィー、連続抽出(sequential extraction)またはゲル電気泳動などの方法を利用して前処理されてもよいが、これに限定されない。
他の一実施例として、本発明の肺がん診断用キットは、少なくとも6個の収容領域と、前記少なくとも6個の収容領域それぞれに収容され、予め設定された個別バイオマーカーに特異的に結合する6種類以上のバイオマーカー対応抗体と、を含むことを特徴とし、この時、前記6種類以上のバイオマーカー対応抗体は、個別バイオマーカーCEA、HE4、ApoA2、TTR、sVCAM−1およびRANTESそれぞれに特異的に結合する抗体それぞれを含む。
同時に、本発明は前記複合バイオマーカー群に含まれたそれぞれの個別バイオマーカーに特異的に結合することができる生物分子が固形基質に集積された肺がん診断用バイオチップを提供する。本発明のバイオチップは肺がん患者と正常人で発現の差異がある前記個別バイオマーカーを測定するのに使用するために、前記個別バイオマーカーに特異的に結合することができる抗体を含んでもよく、または2種類以上の前記特異的な抗体の組み合わせを含んでもよい。
前記生物分子は低分子化合物、リガンド、アプタマー、ペプチド、ポリペプチド、特異的結合タンパク質、高分子物質および抗体などからなる群から選択され、前記タンパク質に特異的に結合することができる物質であれば、すべて使用することができ、抗体またはアプタマーを使用することが好ましいが、これに限定されるものではない。
前記抗体は多クローン抗体または単一クローン抗体を使用することが好ましく、単一クローン抗体を使用することがさらに好ましい。前記タンパク質に特異的に結合する抗体は通常の技術者に知られた公知の方法で製作してもよく、商業的に知られた抗体を購入して使用することができる。前記抗体は通常の技術者に知られた従来方法によって免疫源であるタンパク質を外部宿主に注射することで製造してもよい。外部宿主はマウス、ラット、ヒツジ、ウサギのような哺乳動物を含む。免疫源は筋内、腹腔内または皮下注射方法で注射され、一般的に抗原性を増加させるための補助剤(adjuvant)と共に投与してもよい。外部宿主から定期的に血液を採取して形成された力価および抗原に対する特異性を示す血清を収集して抗体を分離してもよい。
また、本発明のバイオチップの固形基質はプラスチック、ガラス、金属およびシリコンから構成された群から選択されてもよく、好ましくはその表面に前記抗体を付着させるために化学処理されるか、リンカー分子が結合してもよいが、これに限定されるものではない。本発明のバイオチップは、試料から全体タンパク質を採取してバイオチップと反応させ、容易かつ正確に肺がんを診断、モニタリングおよびスクリーニングを実行することができる。
前記バイオチップの基板にコーティングされた活性基は前記物質を結合する役割をし、アミン基、アルデヒド基、カルボキシル基およびチオール基からなる群から選択されてもよく、通常の技術者にタンパク質分子を基板に結合することができる活性基として知られたすべての活性基が使用可能であり、これに限定されるものではない。
また、本発明によれば、被験体の肺がん診断のために複合バイオマーカー群の情報を利用する方法が提供され、その方法は、(a)コンピューティングシステムが、(1−i)肺がん患者および肺がん患者でない人々から構成された標本集団の生物学的試料から測定される肺がん診断用複合バイオマーカー群の個別バイオマーカー別発現量データ、または(1−ii)前記標本集団から測定される前記個別バイオマーカー別発現量データ、および前記標本集団の年齢を取得し、前記標本集団の前記個別バイオマーカー別発現量データを前処理して、(2−i)前記前処理されたデータである前記標本集団の測定データから、または(2−ii)前記標本集団の測定データ、および前記標本集団の年齢から肺がん判定モデルが導き出された状態で、(3−i)前記被験体の生物学的試料から測定される前記肺がん診断用複合バイオマーカー群の個別バイオマーカー別発現量データ、または(3−ii)前記被験体から測定される前記個別バイオマーカー別発現量データ、および前記被験体の年齢を取得する段階、および(b)前記コンピューティングシステムが、前記被験体の前記個別バイオマーカー別発現量データを前処理し、(4−i)前記前処理されたデータである前記被験体の測定データ、または(4−ii)前記測定データ、および前記被験体の年齢を利用して前記肺がん判定モデルから前記被験体の肺がん発病の有無を判定する段階を含む。すなわち、前記肺がん判定モデルは前記標本集団の測定データと共に前記標本集団に属する人々の年齢を独立変数にすることを特徴としてもよい。
一実施例では、前記肺がん判定モデルは上述のようなロジスティック回帰モデルでもよい。また、一実施例によれば、前記(b)段階における前記前処理は前記個別バイオマーカー別発現量データのうち少なくとも一部をログ(log10)変換する計算を含んでもよい。
そして、本発明によれば、上述の被験体の肺がん診断のために複合バイオマーカー群の情報を利用する前記方法を実行するコンピューティングシステムも提供される。
図11は肺がん診断のために複合バイオマーカー群の情報を利用するコンピューティングシステム100の構成を概略的に示した概念図である。図11のとおり、コンピューティングシステム100と、そのハードウェア構成要素である通信部110およびプロセッサ120が示されている。
ここで、通信部110は(1−i)肺がん患者および肺がん患者でない人々から構成された標本集団の生物学的試料から測定される肺がん診断用複合バイオマーカー群の個別バイオマーカー別発現量データ、または(1−ii)前記標本集団から測定される前記個別バイオマーカー別発現量データ、および前記標本集団の年齢を取得し、前記標本集団の前記個別バイオマーカー別発現量データを前処理して、(2−i)前記前処理されたデータである前記標本集団の測定データから、または(2−ii)前記標本集団の測定データ、および前記標本集団の年齢から肺がん判定モデルが導き出された状態で、(3−i)前記被験体の生物学的試料から測定される前記肺がん診断用複合バイオマーカー群の個別バイオマーカー別発現量データ、または(3−ii)前記被験体から測定される前記個別バイオマーカー別発現量データ、および前記被験体の年齢を取得する。
また、プロセッサ120は前記被験体の前記個別バイオマーカー別発現量データを前処理し、(4−i)前記前処理されたデータである前記被験体の測定データ、または(4−ii)前記測定データ、および前記被験体の年齢を利用して前記肺がん判定モデルから前記被験体の肺がん発病の有無を判定する。
このように、本発明によるコンピューティングシステム100は、上述のような被験体の肺がん診断のために複合バイオマーカー群の情報を利用する方法を実行する。
前記実施例の説明に基づいて、通常の技術者は、本発明が多様な実施態樣で実施されることができるという点を明確に理解することができる。一つの実施例として、本明細書では肺がんを判定する方式としてロジスティック回帰モデルを利用したが、二進従属変数を説明する統計モデルであれば、すべて活用することができる。かかる統計モデルを扱う部分は多様なコンピューター構成要素により実行することができるプログラム命令語の形態で具現されてもよい。本明細書では、そのような統計モデルを扱うためにR統計パッケージが利用されたが、SPSS、SAS、Mathematicaなどその他の統計ソフトウェア、あるいはそのような統計方法を具現することができるプログラミング言語などロジスティック回帰モデルを導き出すにあたり必要な演算を実行することができるものであれば、すべて利用される可能性があることを通常の技術者は理解することができる。
これらは多様なコンピューター構成要素により実行することができるプログラム命令語の形態で具現され、コンピューターで読み取り可能な記録媒体に記録されてもよい。前記コンピューターで読み取り可能な記録媒体はプログラム命令語、データファイル、データ構造などを単独または組み合わせて含んでもよい。前記コンピューターで読み取り可能な記録媒体に記録されるプログラム命令語は、本発明のために特別に設計されて構成されたものか、公知の使用可能なものであってもよい。コンピューターで読み取り可能な記録媒体の例には、ハードディスク、フロッピーディスクおよび磁気テープのような磁気媒体、CD−ROM、DVDのような光記録媒体、フロプティカルディスク(floptical disk)のような磁気−光媒体(magneto-opticalmedia)、およびROM、RAM、フラッシュメモリなどのようなプログラム命令語を保存して実行するように特別に構成されたハードウェア装置が含まれる。プログラム命令語の例には、コンパイラーによって作られるような機械語コードだけでなく、インタプリタなどを使用してコンピューティングシステムによって実行され得る高級言語コードも含まれる。前記ハードウェア装置は、本発明による処理を実行するために、一つ以上のソフトウェアモジュールとして作動するように構成してもよく、その逆も同様である。前記ハードウェア装置は、プログラム命令語を保存するためのROM/RAMなどのようなメモリと結合され、前記メモリに保存された命令語を実行するように構成されるCPUやGPUのようなプロセッサを含んでもよく、外部装置と信号とを交わすことができる通信部を含んでもよい。さらに、前記ハードウェア装置は開発者らによって作成された命令語が伝達されるためのキーボード、マウス、その他の外部入力装置を含んでもよい。
また、上述の実施例ではHE4、CEA、Cyfra21−1、RANTES、TTR、sVCAM−1およびApoA2が必須個別バイオマーカーとして利用されたが、これと共に追加される他の個別バイオマーカーがさらにあり得ることを通常の技術者であれば理解することができる。これら個別バイオマーカーと共に利用され、上述の統計モデル(ロジスティック回帰モデル)の性能を向上させることができるものであれば、これまで本発明が属する技術分野である腫瘍学で腫瘍診断と連関して広く利用されるか、腫瘍との関連性が発見されたものであれば、すべて含んでもよい。本明細書では個別バイオマーカーとしてタンパク質マーカーのみを例示的に活用したが、必須個別バイオマーカーに付加して利用され得る個別バイオマーカーはこれに限定されず、核酸マーカー(例えば、RNA、DNAマーカー)、その他の有機物と無機物の定量など腫瘍診断に関して知られた各種バイオマーカーを含んでもよい。
以上、本発明が具体的な構成要素などのような特定事項と限定された実施例および図面によって説明したが、これは本発明のより全般的な理解を助けるために提供されたものにすぎず、本発明が前記実施例に限定されるものではなく、本発明が属する技術分野で通常的な知識を有する者であれば、かかる記載から多様な修正および変形を行うことができる。
したがって、本発明の思想は前記説明した実施例に極限して定められてはならず、後述する特許請求の範囲だけでなく、当該特許請求の範囲と均等または等価的に変形されたすべてのものは本発明の思想の範疇に属する。

Claims (14)

  1. 被験体の肺がん診断のために複合バイオマーカー群を利用する肺がん診断用キットにおいて、
    個別バイオマーカーCEA(Carcinoembryonic antigen;がん胚抗原)、HE4(Human EpididymisProtein 4;ヒト精巣上体タンパク質4)、ApoA2(Apolipoprotein A-II)、TTR(Transthyretin)、sVCAM−1(soluble vascular celladhesion molecule-1)およびRANTES{regulated on activation,normal T cell expressed and secreted;Chemokine(C-Cmotif)ligand 5}に特異的に結合する抗体を含むことを特徴とする肺がん診断用キットであって、
    肺がん患者および肺がん患者でない人々から構成された標本集団の生物学的試料から測定される(1)肺がん診断用複合バイオマーカー群の個別バイオマーカー別発現量データ、またはこれを加工したデータBki{kは個別バイオマーカーに対する添え字(index)であり、iは標本集団の個別生物学的試料に対する添え字}、または(2)前記個別バイオマーカー別発現量データ、またはこれを加工したデータBki、および前記標本集団の年齢ageiが取得され、前記取得されたデータから肺がん判定モデルMが導き出された状態で、(3)前記被験体の前記生物学的試料から前記肺がん診断用キットによって測定される前記肺がん診断用複合バイオマーカー群の個別バイオマーカー別発現量データ、またはこれを加工したデータBk、または(4)前記個別バイオマーカー別発現量データ、またはこれを加工したデータBkおよび前記被験体の年齢データageを前記肺がん判定モデルMに入力することで前記被験体の肺がん発病の有無を判定するように前記肺がん診断用キットが利用されることを特徴とする肺がん診断用キット。
  2. 前記少なくとも個別バイオマーカーそれぞれを含む肺がん診断用複合バイオマーカー群は、
    (a1)第2コンピューティングシステムが、第2標本集団に属する被験体sから(i)第1バイオマーカー集合S1に属するn番目個別バイオマーカーxnの発現量データ、またはこれを加工したデータxns、または前記xnsおよび前記第2標本集団の年齢データxage,sと共に(ii)肺がん患者と診断されたか否かに関連するデータysを取得する段階であって、前記第1バイオマーカー集合S1は、CEA、HE4、ApoA2、TTR、sVCAM−1およびRANTES以外にも追加で個別バイオマーカーをさらに含むことを特徴とするデータ取得段階と、
    (a2)前記第2コンピューティングシステムが、前記第1バイオマーカー集合S1に属するn番目個別バイオマーカーそれぞれに対して、(i)前記ysと前記xnsは互いに独立という命題を帰無仮説として置くカイ二乗検定(chi square test)および(ii)肺がん患者と診断された被験体のxns平均値と前記肺がん患者と診断されていない被験体のxns平均値との間の差の真実値は0という命題を帰無仮説として置くスチューデントのt検定(Student’s t-test)のうち少なくとも一つを実行することで、前記S1に属するn番目個別バイオマーカーそれぞれに対するp−valueを算出する第1統計検定段階と、
    (a3)前記第2コンピューティングシステムが、前記(a2)段階で算出された前記p−valueを予め定められた有意レベルと比べて前記予め定められた有意レベルよりも小さい前記p−valueを有する個別バイオマーカーから構成された第2バイオマーカー集合S2を生成する第1フィルタリング段階と、
    (a4)前記第2コンピューティングシステムが、前記第2バイオマーカー集合S2に属するm番目個別バイオマーカーxそれぞれに対して、回帰モデル式

    により、xmの推定値^xを求める段階であって、Sm’=S2−{xm}であり、前記推定値^xは前記肺がん患者と診断された被験体および前記肺がん患者と診断されていない被験体に対してそれぞれ求められる回帰モデル推定段階と、
    (a5)前記第2コンピューティングシステムが、前記個別バイオマーカーxそれぞれに対する残差値であるx−^xを求める段階であって、前記残差値は前記肺がん患者と診断された被験体および前記肺がん患者と診断されていない被験体に対してそれぞれ求められる残差取得段階と、
    (a6)前記第2コンピューティングシステムが、前記肺がん患者と診断された被験体の前記残差値の平均値と前記肺がん患者と診断されていない被験体の前記残差値の平均値との間の差の真実値が0という命題を帰無仮説として置くスチューデントのt検定を実行することで、前記S2に属するm番目個別バイオマーカーそれぞれに対するp−valueを算出する第2統計検定段階と、
    (a7)前記第2コンピューティングシステムが、前記(a6)段階で算出されたp−valueを予め定められた有意レベルと比べて前記予め定められた有意レベルよりも小さい前記p−valueを有する前記m番目個別バイオマーカーを前記肺がん診断用複合バイオマーカー群に含ませる第2フィルタリング段階と、
    を行うことにより得られることを特徴とする、請求項1に記載の肺がん診断用キット。
  3. 被験体の肺がん診断のための複合バイオマーカー群を活用する肺がん診断用キットにおいて、
    前記診断用キットは、
    6個の収容領域と、
    前記6個の収容領域それぞれに収容され、予め設定された個別バイオマーカーに特異的に結合する6種類のバイオマーカー対応抗体と、
    を含み、
    前記6種類のバイオマーカー対応抗体は、個別バイオマーカーCEA、HE4、ApoA2、TTR、sVCAM−1およびRANTESそれぞれに特異的に結合する抗体それぞれを含み、
    肺がん患者および肺がん患者でない人々から構成された標本集団の生物学的試料から測定される(1)肺がん診断用複合バイオマーカー群の個別バイオマーカー別発現量データ、またはこれを加工したデータBki{kは個別バイオマーカーに対する添え字であり、iは標本集団の個別生物学的試料に対する添え字}、または(2)前記個別バイオマーカー別発現量データ、またはこれを加工したデータBki、および前記標本集団の年齢ageiが取得され、前記取得されたデータから肺がん判定モデルMが導き出された状態で、(3)前記被験体の前記生物学的試料から前記肺がん診断用キットによって測定される前記肺がん診断用複合バイオマーカー群の個別バイオマーカー別発現量データ、またはこれを加工したデータBk、または(4)前記個別バイオマーカー別発現量データ、またはこれを加工したデータBkおよび前記被験体の年齢データageを前記肺がん判定モデルMに入力することで前記被験体の肺がん発病の有無を判定するように前記肺がん診断用キットが利用されることを特徴とする肺がん診断用キット。
  4. 前記6種類以上のバイオマーカー対応抗体それぞれに対応される個別バイオマーカーそれぞれを含む肺がん診断用複合バイオマーカー群は、
    (a1)第2コンピューティングシステムが、第2標本集団に属する被験体sから(i)第1バイオマーカー集合S1に属するn番目個別バイオマーカーxnの発現量データ、またはこれを加工したデータxns、または前記xnsおよび前記第2標本集団の年齢データxage,sと共に(ii)肺がん患者と診断されたか否かに関連するデータysを取得する段階であって、前記第1バイオマーカー集合S1は、CEA、HE4、ApoA2、TTR、sVCAM−1およびRANTES以外にも追加で個別バイオマーカーをさらに含むことを特徴とするデータ取得段階と、
    (a2)前記第2コンピューティングシステムが、前記第1バイオマーカー集合S1に属するn番目個別バイオマーカーそれぞれに対して、(i)前記ysと前記xnsは互いに独立という命題を帰無仮説として置くカイ二乗検定および(ii)肺がん患者と診断された被験体のxns平均値と前記肺がん患者と診断されない被験体のxns平均値との間の差の真実値は0という命題を帰無仮説として置くスチューデントのt検定のうち少なくとも一つを実行することで、前記S1に属するn番目個別バイオマーカーそれぞれに対するp−valueを算出する第1統計検定段階と、
    (a3)前記第2コンピューティングシステムが、前記(a2)段階で算出された前記p−valueを予め定められた有意レベルと比べて前記予め定められた有意レベルよりも小さい前記p−valueを有する個別バイオマーカーから構成された第2バイオマーカー集合S2を生成する第1フィルタリング段階と、
    (a4)前記第2コンピューティングシステムが、前記第2バイオマーカー集合S2に属するm番目個別バイオマーカーxそれぞれに対して、回帰モデル式

    により、xの推定値^xを求める段階であって、Sm’=S2−{x}であり、前記推定値^xは前記肺がん患者と診断された被験体および前記肺がん患者と診断されない被験体に対してそれぞれ求められる回帰モデル推定段階と、
    (a5)前記第2コンピューティングシステムが、前記個別バイオマーカーxそれぞれに対する残差値であるx−^xを求める段階であって、前記残差値は前記肺がん患者と診断された被験体および前記肺がん患者と診断されない被験体に対してそれぞれ求められる残差取得段階と、
    (a6)前記第2コンピューティングシステムが、前記肺がん患者と診断された被験体の前記残差値の平均値と前記肺がん患者と診断されない被験体の前記残差値との平均値の間の差の真実値が0という命題を帰無仮説として置くスチューデントのt検定を実行することで、前記S2に属するm番目個別バイオマーカーそれぞれに対するp−valueを算出する第2統計検定段階と、
    (a7)前記第2コンピューティングシステムが、前記(a6)段階で算出されたp−valueを予め定められた有意レベルと比べて前記予め定められた有意レベルよりも小さい前記p−valueを有する前記m番目個別バイオマーカーを前記肺がん診断用複合バイオマーカー群に含ませる第2フィルタリング段階と、
    を実行することで得られることを特徴とする、請求項3に記載の肺がん診断用キット。
  5. 被験体の肺がん診断のために複合バイオマーカー群の情報を利用する方法において、
    (a)コンピューティングシステムが、肺がん患者および肺がん患者でない人々から構成された標本集団の生物学的試料から測定される(1)肺がん診断用複合バイオマーカー群の個別バイオマーカー別発現量データ、またはこれを加工したデータBki{kは個別バイオマーカーに対する添え字(index)であり、iは標本集団の個別生物学的試料に対する添え字}、または(2)前記個別バイオマーカー別発現量データ、またはこれを加工したデータBki、および前記標本集団の年齢ageiを取得し、前記取得されたデータから肺がん判定モデルMが導き出された状態で、(3)前記被験体の生物学的試料から測定される前記肺がん診断用複合バイオマーカー群の個別バイオマーカー別発現量データ、またはこれを加工したデータBk、または(4)前記個別バイオマーカー別発現量データ、またはこれを加工したデータBkおよび前記被験体の年齢データageを取得する段階と、
    (b)前記コンピューティングシステムが、前記取得された被験体のデータを利用して前記肺がん判定モデルMから前記被験体の肺がん発病の有無を判定する段階と、
    を含み、
    前記肺がん診断用複合バイオマーカー群は、
    個別バイオマーカーCEA、HE4、ApoA2、TTR、sVCAM−1およびRANTESを含む肺がん診断用複合バイオマーカー群情報利用方法。
  6. 前記肺がん診断用複合バイオマーカー群は、
    (a1)第2コンピューティングシステムが、第2標本集団に属する被験体sから(i)第1バイオマーカー集合S1に属するn番目個別バイオマーカーxnの発現量データ、またはこれを加工したデータxns、または前記xnsおよび前記第2標本集団の年齢データxage,sと共に(ii)肺がん患者と診断されたか否かに関連するデータysを取得する段階であって、前記第1バイオマーカー集合S1は、CEA、HE4、ApoA2、TTR、sVCAM−1およびRANTES以外にも追加で個別バイオマーカーをさらに含むことを特徴とするデータ取得段階と、
    (a2)前記第2コンピューティングシステムが、前記第1バイオマーカー集合S1に属するn番目個別バイオマーカーそれぞれに対して、(i)前記ysと前記xnsは互いに独立という命題を帰無仮説として置くカイ二乗検定および(ii)肺がん患者と診断された被験体のxns平均値と前記肺がん患者と診断されない被験体のxns平均値との間の差の真実値は0という命題を帰無仮説として置くスチューデントのt検定のうち少なくとも一つを実行することで、前記S1に属するn番目個別バイオマーカーそれぞれに対するp−valueを算出する第1統計検定段階と、
    (a3)前記第2コンピューティングシステムが、前記(a2)段階で算出された前記p−valueを予め定められた有意レベルと比べて前記予め定められた有意レベルよりも小さい前記p−valueを有する個別バイオマーカーから構成された第2バイオマーカー集合S2を生成する第1フィルタリング段階と、
    (a4)前記第2コンピューティングシステムが、前記第2バイオマーカー集合S2に属するm番目個別バイオマーカーxそれぞれに対して、回帰モデル式

    により、xの推定値^xを求める段階であって、Sm’=S2−{x}であり、前記推定値^xは前記肺がん患者と診断された被験体および前記肺がん患者と診断されない被験体に対してそれぞれ求められる回帰モデル推定段階と、
    (a5)前記第2コンピューティングシステムが、前記個別バイオマーカーxそれぞれに対する残差値であるx−^xを求める段階であって、前記残差値は前記肺がん患者と診断された被験体および前記肺がん患者と診断されない被験体に対してそれぞれ求められる残差取得段階と、
    (a6)前記第2コンピューティングシステムが、前記肺がん患者と診断された被験体の前記残差値の平均値と前記肺がん患者と診断されない被験体の前記残差値との平均値の間の差の真実値が0という命題を帰無仮説として置くスチューデントのt検定を実行することで、前記S2に属するm番目個別バイオマーカーそれぞれに対するp−valueを算出する第2統計検定段階と、
    (a7)前記第2コンピューティングシステムが、前記(a6)段階で算出されたp−valueを予め定められた有意レベルと比べて前記予め定められた有意レベルよりも小さい前記p−valueを有する前記m番目個別バイオマーカーを前記肺がん診断用複合バイオマーカー群に含ませる第2フィルタリング段階と、
    を実行することで得られたことを特徴とする、請求項5に記載の肺がん診断用複合バイオマーカー群情報利用方法。
  7. 前記肺がん判定モデルMは、前記Bkiおよび前記ageiを利用して導き出される2−class分類器(classifier)であることを特徴とする、請求項5または6に記載の肺がん診断用複合バイオマーカー群情報利用方法。
  8. 前記肺がん判定モデルMは、モデル式
    i=P(yi=1)
    に基づき、
    α、β1、…、β7は回帰係数を指し、
    εiは残差値を指称するロジスティック回帰モデルであることを特徴とする、請求項7に記載の肺がん診断用複合バイオマーカー群情報利用方法。
  9. 前記(a)段階および(b)段階で、
    前記加工は、前記個別バイオマーカーのうち少なくとも一部に対する測定データをログ(log)変換する計算であることを特徴とする、請求項5または6に記載の肺がん診断用複合バイオマーカー群情報利用方法。
  10. 被験体の肺がん診断のために複合バイオマーカー群の情報を利用するコンピューティングシステムにおいて、
    (a)肺がん患者および肺がん患者でない人々から構成された標本集団の生物学的試料から測定される(1)肺がん診断用複合バイオマーカー群の個別バイオマーカー別発現量データ、またはこれを加工したデータBki{kは個別バイオマーカーに対する添え字であり、iは標本集団の個別生物学的試料に対する添え字}、または(2)前記個別バイオマーカー別発現量データ、またはこれを加工したデータBki、および前記標本集団の年齢ageiを取得し、前記取得されたデータから肺がん判定モデルMが導き出された状態で、(3)前記被験体の生物学的試料から測定される前記肺がん診断用複合バイオマーカー群の個別バイオマーカー別発現量データ、またはこれを加工したデータBk、または(4)前記個別バイオマーカー別発現量データ、またはこれを加工したデータBkおよび前記被験体の年齢データageを取得する通信部と、
    前記取得された被験体のデータを利用して前記肺がん判定モデルMから前記被験体の肺がん発病の有無を判定するプロセッサと、
    を含み、
    前記肺がん診断用複合バイオマーカー群は、
    個別バイオマーカーCEA、HE4、ApoA2、TTR、sVCAM−1およびRANTESを含む肺がん診断用複合バイオマーカー群情報利用コンピューティングシステム。
  11. 前記肺がん診断用複合バイオマーカー群は、
    (a1)第2コンピューティングシステムが、第2標本集団に属する被験体sから(i)第1バイオマーカー集合S1に属するn番目個別バイオマーカーxnの発現量データ、またはこれを加工したデータxns、または前記xnsおよび前記第2標本集団の年齢データxage,sと共に(ii)肺がん患者と診断されたか否かに関連するデータysを取得する段階であって、前記第1バイオマーカー集合S1は、CEA、HE4、ApoA2、TTR、sVCAM−1およびRANTES以外にも追加で個別バイオマーカーをさらに含むことを特徴とするデータ取得段階と、
    (a2)前記第2コンピューティングシステムが、前記第1バイオマーカー集合S1に属するn番目個別バイオマーカーそれぞれに対して、(i)前記ysと前記xnsは互いに独立という命題を帰無仮説として置くカイ二乗検定および(ii)肺がん患者と診断された被験体のxns平均値と前記肺がん患者と診断されない被験体のxns平均値との間の差の真実値は0という命題を帰無仮説として置くスチューデントのt検定のうち少なくとも一つを実行することで、前記S1に属するn番目個別バイオマーカーそれぞれに対するp−valueを算出する第1統計検定段階と、
    (a3)前記第2コンピューティングシステムが、前記(a2)段階で算出された前記p−valueを予め定められた有意レベルと比べて前記予め定められた有意レベルよりも小さい前記p−valueを有する個別バイオマーカーから構成された第2バイオマーカー集合S2を生成する第1フィルタリング段階と、
    (a4)前記第2コンピューティングシステムが、前記第2バイオマーカー集合S2に属するm番目個別バイオマーカーxそれぞれに対して、回帰モデル式

    により、xの推定値^xを求める段階であって、Sm’=S2−{x}であり、前記推定値^xは前記肺がん患者と診断された被験体および前記肺がん患者と診断されない被験体に対してそれぞれ求められる回帰モデル推定段階と、
    (a5)前記第2コンピューティングシステムが、前記個別バイオマーカーxそれぞれに対する残差値であるx−^xを求める段階であって、前記残差値は前記肺がん患者と診断された被験体および前記肺がん患者と診断されない被験体に対してそれぞれ求められる残差取得段階と、
    (a6)前記第2コンピューティングシステムが、前記肺がん患者と診断された被験体の前記残差値の平均値と前記肺がん患者と診断されない被験体の前記残差値の平均値との間の差の真実値が0という命題を帰無仮説として置くスチューデントのt検定を実行することで、前記S2に属するm番目個別バイオマーカーそれぞれに対するp−valueを算出する第2統計検定段階と、
    (a7)前記第2コンピューティングシステムが、前記(a6)段階で算出されたp−valueを予め定められた有意レベルと比べて前記予め定められた有意レベルよりも小さい前記p−valueを有する前記m番目個別バイオマーカーを前記肺がん診断用複合バイオマーカー群に含ませる第2フィルタリング段階と、
    を行うことにより得られたことを特徴とする、請求項10に記載の肺がん診断用複合バイオマーカー群情報利用コンピューティングシステム。
  12. 前記肺がん判定モデルMは、前記Bkiおよび前記ageiを利用して導き出される2−class分類器であることを特徴とする、請求項10または11に記載の肺がん診断用複合バイオマーカー群情報利用コンピューティングシステム。
  13. 前記肺がん判定モデルMは、モデル式

    i=P(yi=1)
    に基づき、
    α、β1、…、β7は回帰係数を指称し、
    εiは残差値を指称するロジスティック回帰モデルであることを特徴とする、請求項12に記載の肺がん診断用複合バイオマーカー群情報利用コンピューティングシステム。
  14. 前記加工は、前記個別バイオマーカーのうち少なくとも一部に対する測定データをログ(log)変換する計算であることを特徴とする、請求項10または11に記載の肺がん診断用複合バイオマーカー群情報利用コンピューティングシステム。

JP2017163777A 2016-09-02 2017-08-28 被験体の肺がん診断のための複合バイオマーカー群、これを利用する肺がん診断用キット、複合バイオマーカー群の情報を利用する方法およびこれを実行するコンピューティングシステム Active JP6374070B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020160113444A KR101853118B1 (ko) 2016-09-02 2016-09-02 피험체의 폐암 진단을 위한 복합 바이오마커군, 이를 이용하는 폐암 진단용 키트, 복합 바이오마커군의 정보를 이용하는 방법 및 이를 수행하는 컴퓨팅 시스템
KR10-2016-0113444 2016-09-02

Publications (2)

Publication Number Publication Date
JP2018036264A JP2018036264A (ja) 2018-03-08
JP6374070B2 true JP6374070B2 (ja) 2018-08-15

Family

ID=61281195

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017163777A Active JP6374070B2 (ja) 2016-09-02 2017-08-28 被験体の肺がん診断のための複合バイオマーカー群、これを利用する肺がん診断用キット、複合バイオマーカー群の情報を利用する方法およびこれを実行するコンピューティングシステム

Country Status (6)

Country Link
US (1) US10663469B2 (ja)
JP (1) JP6374070B2 (ja)
KR (1) KR101853118B1 (ja)
CN (1) CN107796942B (ja)
RU (1) RU2687578C2 (ja)
WO (1) WO2018044126A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190331686A1 (en) * 2018-04-27 2019-10-31 Laboratory Corporation Of America Holdings Methods and Systems for Determining the Risk of Developing Ovarian Cancer
KR20210073547A (ko) * 2018-10-09 2021-06-18 세키스이 메디칼 가부시키가이샤 류신 리치 α2 글리코 단백질 조성물
US10586164B1 (en) 2018-10-15 2020-03-10 AIble Inc. Interface for visualizing and improving model performance
US10936768B2 (en) * 2018-10-15 2021-03-02 Aible, Inc. Interface for visualizing and improving model performance
US11409549B2 (en) 2018-10-15 2022-08-09 AIble Inc. Interface for generating models with customizable interface configurations
JP2022523564A (ja) 2019-03-04 2022-04-25 アイオーカレンツ, インコーポレイテッド 機械学習を使用するデータ圧縮および通信
CN111444941A (zh) * 2020-02-24 2020-07-24 华北电力大学(保定) 联合血清中电解质和蛋白质组学数据用于诊断早期肺癌的方法
CN111521815A (zh) * 2020-04-20 2020-08-11 复旦大学附属中山医院 Lrg1作为诊断血栓闭塞性脉管炎的血清学标志物的应用
CN111540469A (zh) * 2020-05-29 2020-08-14 杭州广科安德生物科技有限公司 构建体外检测胃癌的数学模型的方法及其应用
CN112023271B (zh) * 2020-09-22 2023-11-28 天津工业大学 亚毫米尺寸活体植入式多通道微磁刺激器
CN113186287B (zh) * 2021-05-10 2023-03-24 深圳康华君泰生物科技有限公司 用于非小细胞肺癌分型的生物标志物及其应用
CN113960313B (zh) * 2021-12-22 2022-04-12 上海思路迪医学检验所有限公司 一种外泌体alk融合蛋白磁免疫化学发光检测试剂盒
CN115184609B (zh) * 2022-07-22 2023-09-01 上海交通大学医学院 检测非小细胞肺癌的分子标志物及其应用
CN115575636B (zh) * 2022-11-22 2023-04-04 杭州广科安德生物科技有限公司 一种用于肺癌检测的生物标志物及其系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012091506A2 (ko) * 2010-12-30 2012-07-05 (주) 바이오인프라 폐암 진단용 복합 바이오마커 및 이를 이용한 폐암 진단 방법
CN110444287B (zh) * 2011-04-29 2024-02-06 癌症预防和治疗有限公司 使用分类系统及其试剂盒识别和诊断肺部疾病的方法
WO2012170711A1 (en) * 2011-06-07 2012-12-13 Caris Life Sciences Luxembourg Holdings, S.A.R.L Circulating biomarkers for cancer
CN103890586B (zh) * 2011-10-24 2016-06-29 私募蛋白质体公司 肺癌生物标记及其用途
US20140113876A1 (en) * 2012-09-21 2014-04-24 Ultragenyx Pharmaceutical Inc. Biomarkers for assessing treatment of sialic acid deficiency diseases and conditions
KR20130004204A (ko) 2012-11-26 2013-01-09 주식회사 바이오인프라 폐암 진단용 복합 바이오마커 구성 방법
US20140220006A1 (en) * 2013-02-01 2014-08-07 Meso Scale Technologies, Llc Lung cancer biomarkers
WO2016094330A2 (en) 2014-12-08 2016-06-16 20/20 Genesystems, Inc Methods and machine learning systems for predicting the liklihood or risk of having cancer

Also Published As

Publication number Publication date
CN107796942B (zh) 2020-05-05
US10663469B2 (en) 2020-05-26
RU2017129983A3 (ja) 2019-02-25
WO2018044126A1 (ko) 2018-03-08
RU2017129983A (ru) 2019-02-25
RU2687578C2 (ru) 2019-05-15
KR20180026609A (ko) 2018-03-13
US20180067118A1 (en) 2018-03-08
KR101853118B1 (ko) 2018-04-30
CN107796942A (zh) 2018-03-13
JP2018036264A (ja) 2018-03-08

Similar Documents

Publication Publication Date Title
JP6374070B2 (ja) 被験体の肺がん診断のための複合バイオマーカー群、これを利用する肺がん診断用キット、複合バイオマーカー群の情報を利用する方法およびこれを実行するコンピューティングシステム
JP6026422B2 (ja) 肺がん試験
CN110376378B (zh) 可用于肺癌诊断的标志物联合检测模型
TWI698639B (zh) 前列腺抗原標準品及其用途
KR102064060B1 (ko) 뇌의 베타 아밀로이드 축적 감별용 혈중 바이오마커
AU2018247291A1 (en) Biomarker-based methods and biochips for aiding the diagnosis of stroke
KR101401561B1 (ko) 복합 바이오마커를 활용한 암 진단 정보 생성 방법, 및 암 진단 예측 시스템 장치
WO2015164616A1 (en) Biomarkers for detection of tuberculosis
JP2012531581A (ja) 癌の検出のための方法およびシステム
US20210140977A1 (en) A three-protein proteomic biomarker for prospective determination of risk for development of active tuberculosis
CN114441760A (zh) 一种用于肝癌诊断的生物标志物和试剂盒及检测方法
KR20120077567A (ko) 폐암 진단용 복합 바이오마커, 폐암 진단용 복합 바이오마커 정보 이용 방법, 폐암 진단용 키트
KR102018205B1 (ko) 대장암 진단용 조성물 및 상기 조성물을 이용한 대장암 진단 방법
KR20120077570A (ko) 폐암 진단 예측을 위한 복합 바이오마커, 구성 방법, 복합 바이오마커를 사용하는 폐암 진단 예측 방법 및 폐암 진단 예측 시스템
KR100980031B1 (ko) 대장암 진단 및 스크리닝용 단백질 마커 및 대장암 진단을 위한 상기 마커의 측정방법
KR100920731B1 (ko) 대장암 진단 및 스크리닝용 단백질 마커 및 대장암 진단을위한 상기 마커의 측정방법
US20150004633A1 (en) Assays and methods for the diagnosis of ovarian cancer
KR102018209B1 (ko) 위암 진단용 조성물 및 상기 조성물을 이용한 위암 진단 방법
KR20180026654A (ko) 피험체의 폐암 진단을 위한 복합 바이오마커군, 이를 이용하는 폐암 진단용 키트, 복합 바이오마커군의 정보를 이용하는 방법 및 이를 수행하는 컴퓨팅 시스템
KR20120134091A (ko) 폐암 진단용 복합 바이오마커 키트
KR101463588B1 (ko) 폐암 진단용 복합 바이오마커를 사용하는 폐암 진단용 키트
US20230305010A1 (en) Timp1 as a marker for cholangiocarcinoma
EP2963124B1 (en) Biomarker combinations for use in pancreatic cancer screening
KR101454398B1 (ko) 폐암 진단용 복합 바이오마커 구성 방법 및 폐암 진단용 복합 바이오마커
KR20130004203A (ko) 폐암 진단용 복합 바이오마커 정보 이용 방법

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180525

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180710

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180718

R150 Certificate of patent or registration of utility model

Ref document number: 6374070

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250