JP6134809B2 - 癌診断装置 - Google Patents

癌診断装置 Download PDF

Info

Publication number
JP6134809B2
JP6134809B2 JP2015549231A JP2015549231A JP6134809B2 JP 6134809 B2 JP6134809 B2 JP 6134809B2 JP 2015549231 A JP2015549231 A JP 2015549231A JP 2015549231 A JP2015549231 A JP 2015549231A JP 6134809 B2 JP6134809 B2 JP 6134809B2
Authority
JP
Japan
Prior art keywords
discrimination
mass
low
type
cancer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2015549231A
Other languages
English (en)
Other versions
JP2016511821A (ja
JP2016511821A5 (ja
Inventor
ビョン チュル ヨ
ビョン チュル ヨ
キュン ヒ キム
キュン ヒ キム
テ ヨン キム
テ ヨン キム
イン フ キム
イン フ キム
ジ ウォン パク
ジ ウォン パク
ジェ ファン オ
ジェ ファン オ
ジュン ファ リ
ジュン ファ リ
ユン ソク リ
ユン ソク リ
Original Assignee
ナショナル キャンサー センター
ナショナル キャンサー センター
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020120134830A external-priority patent/KR101439981B1/ko
Priority claimed from KR1020120134825A external-priority patent/KR101439975B1/ko
Priority claimed from KR1020120134828A external-priority patent/KR101439977B1/ko
Application filed by ナショナル キャンサー センター, ナショナル キャンサー センター filed Critical ナショナル キャンサー センター
Priority claimed from PCT/KR2012/010358 external-priority patent/WO2013103197A1/ko
Publication of JP2016511821A publication Critical patent/JP2016511821A/ja
Publication of JP2016511821A5 publication Critical patent/JP2016511821A5/ja
Application granted granted Critical
Publication of JP6134809B2 publication Critical patent/JP6134809B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/26Mass spectrometers or separator tubes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • A61B5/7267Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/62Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode
    • G01N27/622Ion mobility spectrometry
    • G01N27/623Ion mobility spectrometry combined with mass spectrometry
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6848Methods of protein analysis involving mass spectrometry

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Public Health (AREA)
  • Food Science & Technology (AREA)
  • Cell Biology (AREA)
  • Microbiology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Bioethics (AREA)
  • Oncology (AREA)
  • Surgery (AREA)
  • Mathematical Physics (AREA)

Description

本発明は、癌を診断する装置に関し、より詳細には、生物学的試料から抽出した低質量イオンについて生物統計学的分析を通じて、癌診断用低質量イオンの質量スペクトルを確認し、該低質量イオンの質量スペクトルを用いて癌を診断することができる癌診断装置に関する。
癌は、細胞が無限に増殖し、正常な細胞の機能を妨害する病気であって、肺がん、胃がん(gastric cancer、GC)、乳がん(breast cancer、BRC)、大腸がん(colorectal cancer、CRC)等が代表的であるが、実質的にはどの組織でも発生し得る。初期の癌の診断は、がん細胞の成長に伴う生体組織の外的変化に基づいたが、近年、血液、糖鎖(glycochain)、ディーエヌエー(DNA)等、生物の組織または細胞に存在する微量の生体分子を用いた診断および検出が試みられている。しかしながら、最も一般的に用いられる癌の診断方法は、生検を通じて得られた組織サンプルを用いたり、画像を用いた診断である。
その中でも生検は、患者に大きな苦痛を引き起こしており、高コストがかかるだけでなく、診断までに長い時間を要するという欠点がある。また、患者が実際、がんにかかった場合、生検の過程の中で、がんの転移が誘発されるおそれがあり、生検を通じて組織サンプルを採取することができない部位の場合、外科的な手術を通じて疑わしい組織を採取するまでは、病気の診断が不可能という欠点がある。
画像を用いた診断では、X線(X-ray)画像、病気標的物質が付着された造影剤を使用して獲得した核磁気共鳴(nuclear magnetic resonance、NMR)画像などに基づいて、癌を判定する。しかし、これらの画像診断は、臨床医または判読医の熟練度によっては誤診のおそれがあり、画像を得る機器の正確率に大きく依存するという短所がある。さらに、最も精密な機器でさえ数mm以下の腫瘍は検出が不可能であり、発症初期の段階では検出が難しいという短所がある。また、画像を得るために、患者や病気を保有する可能性のある者が、遺伝子の突然変異を誘発し得る高エネルギーの電磁波にさらされるため、別の病気を引き起こすおそれがあるばかりでなく、画像を通じた診断回数が制限されるという短所がある。
消化器系の場合、通常、内視鏡を用いた肉眼像の観察を通じて病気の有無を判断するが、その過程が患者にとって極めて苦痛であり、肉眼像の観察を通じて異常が発見された場合であっても、悪性/良性腫瘍、ポリープなどの正確な病気の判別を行うためには、生検が必須に行われなければならない。
特にCRCは、世界的に発病率が3位以内の一般的な癌であり、治療の可能性が癌の病期(stage)に大きく左右される癌である。すなわち、早期診断を通じて初期の段階で発見された場合、極めて高い治癒率を有する。したがって、何よりも正確な早期診断が重要な疾患であるが、癌の進行に伴う異常症候が微々たるもので、ほとんど出血による糞便の色の変化により、病気を認知するのが一般的であり、患者または病気を保有する可能性のある者が検査を受けた場合でも、大腸内視鏡を使用した観察が通常であり、正確な病気の判別のためには、生検が必須に行われるべきである。要約すると、CRCの場合、早期診断が重要であり、大腸内視鏡および生検は、多くの時間、コスト、不便、苦痛などを伴うため、不要な大腸内視鏡および生検の対象者の数を大幅に減らすことができる診断方法が必要である。
したがって、新しい分子的アプローチを適用し、初期の段階でCRCをスクリーニングすることができれば、患者にとって極めて有用である。ゲノム(genomics)、プロテオミクス(proteomics)と分子病理学(molecular pathology)は、臨床的に潜在的な価値を有する複数のバイオ・マーカー(biomarker)候補を提供してきた。癌の病期(stage)と患者別オーダーメイド治療にこれらを積極的に活用することにより治療効果を向上させることができるものと思われるが、臨床治療に適用するためには、今後も多くの研究が先行されなければならない。
近年のCRCスクリーニング検査は、大腸内視鏡を使用して異常(gross abnormality)かどうかを判断したり、便潜血検査(fecal occult blood test、FOBT)を通じて行われる。大腸内視鏡は、CRCスクリーニング検査において標準的な方法として活用されてきたが、侵襲的であり、受容可能な患者が限られている。したがって、最近の多くの努力が糞便検査に集中されてきたが、これは、非侵襲的であり、腸の洗浄が要求されず、標本の運搬が可能であるためである。糞便マーカー(marker)は腫瘍から漏れ出てくるもの、分泌されるもの、または腫瘍から剥離されるものに分類することができる。例えば、伝統的なFOBTにおいてヘモグロビン(hemoglobin)は、CRCを診断するための大規模なスクリーニング・プログラムにおいて漏れ出てくるある種のマーカーとして認識されてきたが、これを含めて、現在までに知られているマーカーの判別能力は満足できるものでなかった。
一方、MALDI-TOF(matrix-assisted laserdesorption/ionization-time of flight)質量分析計(massspectrometer)を用いると、血液中の質量イオン(mass ion)のスペクトル(spectrum)を抽出することができる。既存の蛋白質体の研究に用いられた質量分析は、主に800〜2500m/zの質量値の範囲を分析対象としたが、これはその範囲が、タンパク質がトリプシン(trypsin)で切断された場合、ペプチド(peptide)の質量値の領域だからである。また、MALDI-TOF質量分析計を用いると、低質量イオン(low-mass ion)の質量スペクトルも抽出することができる。しかし、約800m/z以下の低質量帯域は、分析の対象でないマトリックス(matrix)の質量イオンが混在する領域であるため、これまでこの領域に関する研究が活発ではなかった。
抽出された低質量イオンの質量スペクトルは、従来のソフトウェア(software)のいずれかであるMarkerViewTM(バージョンversion1.2は、以下、バージョン省略)により分析することができる。本発明者等はCRC患者群および正常対照群(control、CONT)の血清(serum)から抽出された低質量イオンの質量スペクトルをMarkerViewTMを用いて分析してみたが、図1を参照して、その方法を詳細に説明する。
表101のCRC患者群133名および表102の正常対照群153名で構成された集合(Set A1)から採取した血清を試料とし、MALDI-TOF質量分析計を用いて抽出したT2Dのファイル形式の低質量イオンの質量スペクトルをMarkerViewTMにインポート(import)した(A11)。
インポートの条件として表103の条件を使用した。
その後、インポートしたピーク強度(peak intensity)を正規化(normalization)した(A12)。 MarkerViewTMには、複数の正規化の方法が存在するが、「Normalization Using Total Area Sums」方法を用いて正規化を行った。この方法では、各試料別の強度の小計を求め、試料別の小計の平均を求めた後、各試料別の強度の小計がこの平均と一致するように、各ピーク強度に試料別スケール因子(scaling factor)を乗ずる。すなわち、このように正規化した後は、各試料別の強度の小計が等しくなる。
その後、正規化したピーク強度をパレート・スケーリング(Pareto scaling)した(A13)。すなわち、正規化した各ピークの強度で質量イオン別平均値を減算し、標準偏差の平方根に割り、ピーク強度をパレート・スケーリングした。
その後、パレート・スケーリングしたピーク強度に対して主成分分析ベースの線形判別分析(principal component analysis-based linear discriminant analysis、PCA-DA)を実行して、判別スコア(discriminant score、DS)を計算した(A14)。すなわち、二段階で主成分分析を実行し、各質量イオン別の重み付け係数(weighting factor)である因子負荷量(factor loading)を求め、パレート・スケーリングされた強度に該因子負荷量を乗算した後、その結果の値をすべて足して、各試料別の判別スコアを計算した。表103のインポート条件としてピークの最大数を10,000個とし、十分に多くの試料を一緒にインポートしたため、本計算において因子負荷量は10,000と計算され、したがって、10,000個の項を足して、1つの判別スコアが算出された。
次に計算された判別スコアが正であるかどうかを判断し(A15)、正の場合、陽性である(A16)、負の場合、陰性であると判定した(A17)。すなわち、CRCに適用され、正の場合はCRC患者群と、負の場合は正常対照群と判定した。
図2は、既に臨床的に判定されたCRC患者群133名と正常対照群153名で構成された集合に対して、図1の方法で計算した判別スコアの分布を示す。図2に示す判別スコアに基づく判定結果を混同行列(confusion matrix)を用いて整理すると、表104の通りである。
図2および表104を通じて知ることができるように、従来技術であるMarkerViewTMの主成分分析ベースの線形判別分析の方法を通じて感度(sensitivity)、特異度(specificity)、陽性的中率(positive predictive value、PPV)、陰性的中率(negative predictive value、NPV)のいずれも98%以上である、極めて優れた判別結果を得ることができた。
しかし、これを臨床で使用できるようにするには、まず式のロバスト性(robustness)が必ず検証されなければならない。すなわち、すでに一度測定しており、判別式を構成していた集合についてさらに数回反復測定した質量スペクトルについても、依然として良い判別結果が表されるべきであり、判別式を構成する際に考慮していなかった新しいCRC患者群および正常対照群に対しても同一の判別式で良い判別結果を得ることができなければならない。質量スペクトルを反復測定する過程には、血清を凍結・解凍する過程が含まれるか、または血清を新たにメタノール(methanol)/クロロホルム(chloroform)と混合して抽出する過程が含まれることもある。このような過程は、質量スペクトルの統計分析において外乱(disturbances)と見ることができるが、これらの外乱に鈍感な判別式を構成しなければ臨床に適用することができない。
要するに、図1、2、および表104を参照して説明した従来の主成分分析ベースの線形判別分析の方法は、特定の試料で構成された集合に個別に適用される場合には、すなわち、個別訓練集合(training set)に対する判別では、極めて優れた判別結果を表したりもするが、検証集合(validation set)での判別結果は、満足できるものでなかった(表124、126を参照)。訓練集合に対しては極めて優れた判別結果が表れたにもかかわらず、判別式がロバスト性を有さない理由は、判別式を構成している10,000個の質量のイオンのうち、相当の数の質量イオンがCRC患者群と正常対照群との判別に少なくとも不要であり、時には訓練集合の判別では、問題を引き起こさなかったが、検証集合の判別では、潜在的に判別結果を混同させ得る質量イオンを含んでいるためと推定される。したがって、このように、少なくとも不要で、または潜在的に判別結果に混乱を与え得る質量イオンを積極的に除去する過程を通し、優れかつロバストな判別結果を得るために、必要不可欠な質量イオンだけを見出す作業が必要であると考えられる。
一方、BRCは、毎年発症率と有病率において、女性癌のうち、甲状腺がんの次に高い増加率を見せている。
BRCは、高い発症率に比べて生存率もやはり甲状腺がんの次に高いが、その理由としては、効果的な薬剤の開発に加え、BRCに対する認識の変化と、何よりも早期検診の方法である乳房撮影(mammography)の寄与が大きいと言える。
BRCは、他の癌と同様に早期発見と治療で生存率を高めることができる。リンパ節転移のない小さなサイズのBRCの場合には、生存率が90%までと報告されているが、特にBRCが他の部位に転移した状態で発見された場合には、生存率が10%程度に低くなる。
BRCを早期に発見するためには、自己検診の外に、医師の診察と画像による医学的乳房検査が必須であるが、乳房撮影の感度は60-70%と低く、特に若い女性から多くみられる実質性乳房の場合には、検出率が激減するという短所がある。
このような女性等の場合、乳房超音波が勧められるが、乳房の超音波は、検査医のスキルへの依存度が高いという欠点があり、そのほかに乳房MRI(magnetic resonance imaging)が診断に使用されているが、高コストのため、検診用としては使用し難く、また、偽陽性率(false positive rate)が高いという欠点がある。
したがって、新しい分子的アプローチを適用し、初期の段階でBRCをスクリーニングすることができた場合、患者にとって極めて有用である。ゲノム(genomics)、プロテオミクス(proteomics)と分子病理学(molecular pathology)は、臨床的に潜在的な価値を有する複数のバイオ・マーカー(biomarker)候補を提供してきた、癌の病期(stage)と患者別オーダーメイド治療にこれらを積極的に活用することを通じて、治療効果を向上させることができるものと思われるが、臨床治療に適用するためには、これからも多くの研究が先行されなければならない。
一方、MALDI-TOF(matrix-assisted laser desorption/ionization-time of flight)質量分析計(mass spectrometer)を使用すると、血液中の質量イオン(mass ion)のスペクトル(spectrum)を抽出することができる。既存の蛋白質体の研究に使用された質量分析は、主に800〜2500m/zの質量値の範囲を分析の対象としたが、これはその範囲が、タンパク質がトリプシン(trypsin)で切断された場合、ペプチド(peptide)の質量値領域だからである。また、MALDI-TOF質量分析計を用いると、低質量イオン(low-mass ion)の質量スペクトルも抽出することができる。しかし、約800m/z以下の低質量帯域は、分析の対象でないマトリックス(matrix)の質量イオンが混在する領域であるため、これまでこの領域に対する研究が活発ではなかった。
抽出された低質量イオンの質量スペクトルは、従来のソフトウェア(software)のいずれかであるMarkerViewTM(バージョンversion1.2は、以下のバージョン省略)によって分析することができる。本発明者等は、BRC患者群および正常対照群(control、CONT)の血清(serum)から抽出された低質量イオンの質量スペクトルをMarkerViewTMを用いて分析してみたが、図3を参照して、その方法を詳細に説明する。
表201のBRC患者群54名と表202の正常対照群49名で構成された集合(Set C1)から採取した血清を試料とし、MALDI-TOF質量分析計を用いて、抽出されたT2Dのファイル形式の低質量イオンの質量スペクトルをMarkerViewTMにインポート(import)した(B11)。
インポートの条件として表203の条件を使用した。
次に、インポートしたピーク強度(peak intensity)を正規化(normalization)した(B12)。 MarkerViewTMには、複数の正規化の方法が存在するが、「Normalization Using Total Area Sums」方法を使用して正規化を行った。この方法では、各試料別の強度の小計を求め、試料別の小計の平均を求めた後、各試料別の強度の小計がこの平均と一致するよう、各ピーク強度に試料別スケール因子(scaling factor)を乗ずる。すなわち、このように正規化した後は、各試料別強度の小計が等しくなる。
その後、正規化したピーク強度をパレート・スケーリング(Pareto scaling)した(B13)。すなわち、正規化した各ピークの強度から質量イオン別の平均値を減算し、標準偏差の平方根で割り、ピーク強度をパレート・スケーリングした。
その後、パレート・スケーリングしたピーク強度に対して主成分分析ベースの線形判別分析(principal component analysis-based linear discriminant analysis、PCA-DA)を実行し、判別スコア(discriminant score、DS)を計算した(B14)。すなわち、二段階で主成分分析を実行し、各質量イオン別の重み付け係数(weighting factor)である因子負荷量(factor loading)を求め、パレート・スケーリングされた強度には因子負荷量を乗算した後、その結果の値をすべて足算し、各試料別、判別スコアを計算した。表203のインポート条件としてピークの最大数を10,000個とし、十分に多くの試料を一緒にインポートしたため、本計算で因子負荷量は10,000個が計算され、したがって、10,000個の項を足して、一つの判別スコアが算出された。
次に、計算された判別スコアが正であるかどうかを判断し(B15)、正の場合、陽性と(B16)、負の場合、陰性と判定した(B17)。すなわち、BRCに適用され、正の場合はBRC患者群であると、負の場合、正常対照群であると判定した。
図4は、既に臨床的に判定されたBRC患者群54名と、正常対照群49名で構成された集合に対しても、図3の方法で計算した判別スコアの分布を示す。図4に示す判別スコアに基づく判定結果を混同行列(confusion matrix)を用いて整理すると、表204の通りである。
図4および表204を通じて知ることができるように、従来技術であるMarkerViewTMの主成分分析ベースの線形判別分析の方法を通じて感度(sensitivity)、特異度(specificity)、陽性的中率(positive predicitivevalue、PPV)および陰性的中率(negativepredicitive value、NPV)がいずれも100%の完璧な判別結果を得ることができた。
しかし、これらを臨床で使用できるようにするには、まず式のロバスト性(robustness)が必ず検証されなければならない。すなわち、すでに一度測定し、判別式を構成していた集合に対して、さらに数回反復測定した質量スペクトルに対しても依然として良い判別結果を表さなければならず、判別式を構成する際に考慮していなかった新しいBRC患者群および正常対照群に対しても同様の判別式で良い判別結果を得ることができなければならない。質量スペクトルを反復測定する過程には、血清を凍結・凍解する過程が含まれるか、または血清を新たにメタノール(methanol)/クロロホルム(chloroform)と混合して抽出する過程が含まれることもできる。このような過程は、質量スペクトルの統計分析において外乱(disturbances)と見ることができるが、このような外乱に鈍感な判別式を構成しなければ臨床に適用することができない。
要するに、図3、4および表204を参照して説明した従来の主成分分析ベースの線形判別分析の方法は、特定の試料で構成され集合に個別に適用された場合には、すなわち、個別訓練集合(training set)の判別では、極めて優れた判別結果を表したりもするが、検証集合(validationset)における判別結果は満足できるものでなかった(表224、226を参照)。訓練集合に対しては、極めて優れた判別結果を表したにもかかわらず、判別式のロバスト性を有さない理由は、判別式を構成している10,000個の質量のイオンのうち、相当の数の質量イオンがBRC患者群と正常対照群との判別には、少なくとも不要で、時には訓練集合の判別では、問題を引き起こさなかったが、検証集合の判別では、潜在的に判別結果を混同し得る質量イオンを含んでいるためと推定される。したがって、このように、少なくとも不要で、または潜在的に判別結果に混同し得る質量イオンを積極的に除去する過程を通し、優れかつロバストな判別結果を得るために必要不可欠な質量イオンのみを見出す作業が必要であると考えられる。
一方、GCは韓国内で最も多く発生する癌(18.3%)であり、男性では1位、女性ではBRC、甲状腺癌に続き三番目に発生頻度の高い(主要癌種の発症率、2003年-2005年、統計庁)。一般人を対象とした内視鏡検診と一般人の認識の変化により、早期に発見される頻度が徐々に増加しているが、まだ癌関連の死亡率においては、肺がん、肝臓がんに次いで高い頻度(22%)を占めている(2006年死亡原因統計年報、統計庁)。
手術的治療が完治の根幹となる治療法であり、最近では早期GCの頻度は約50%であり、早期GCの治癒率は90%を上回っているが、転移性または再発性GCの場合は、早期GCとは異なり、予後が極めて不良で、生存期間中央値(median survivaltime)が1年を超えず、5年生存率においても、5%未満の結果を示している。
緩和化学療法(palliative chemotherapy)は、最善の支持療法(bestsupportive care)と比較した第3相研究で生存期間の延長だけでなく、生活の質の向上にも効果があるという研究結果から、転移性または再発性のGC標準治療法とすることができる。
1990年以来、5-fluorouracil(5-FU)とPlatinum製剤の治療は、現在まで最も広く使われている転移性GC治療剤であり、新薬の開発により効果を高め、副作用を最小化するための様々な組み合わせの臨床研究にirinotecan、oxaliplatin、paclitaxel、docetaxel、capecitabineなどが試みられている。 5-FUを根幹とする抗がん化学療法に比べ、はるかに優れた性能を示す研究はまだ報告されていない。 ECF(epirubicin、cisplatinand5-fluorouracil)の効果は、優れるものの高い毒性の副作用を伴う。
最近、このような限界を克服すべくいくつかの研究が、様々な方法で行われ、また、バイオ・マーカー発見のための努力は、これの根幹となる。バイオ・マーカーは、癌の早期診断に使用することができるだけでなく、転移性癌の治療において目標となるターゲットとして使用することができる。既存の抗がん剤と一緒に標的治療剤の使用は、CRC、肺がん、BRC、膵臓がんなどで効果を示しており、GCにおいても多くの開発と研究が必要であるとすることができる。
したがって、新しい分子的アプローチを適用し、初期の段階でGCをスクリーニングすることができた場合、患者にとって極めて有用である。ゲノム(genomics)、プロテオミクス(proteomics)と分子病理学(molecular pathology)は、臨床的に潜在的な価値を有する複数のバイオ・マーカー(bio marker)候補を提供してきた。癌の病期(stage)と患者別のオーダーメイド治療にこれらを積極的に活用することを通じて治療効果を向上させることができるものと思われるが、臨床治療に適用するためには、今後も多くの研究が先行されなければならない。
一方、MALDI-TOF(matrix-assisted laser desorption/ionization-time of flight)質量分析計(mass spectrometer)を使用すると、血液中の質量イオン(mass ion)のスペクトル(spectrum)を抽出することができる。既存の蛋白質体の研究に使用された質量分析は、主に800〜2500m/zの質量値の範囲を分析対象としたが、これはその範囲が、タンパク質がトリプシン(trypsin)で切断された場合、ペプチド(peptide)の質量値領域だからである。また、MALDI-TOF質量分析計を使用すると、低質量イオン(low-mass ion)の質量スペクトルも抽出することができる。しかし、約800m/z以下の低質量帯域は、分析の対象でないマトリックス(matrix)の質量イオンが混在する領域であるため、これまでこの領域の研究が活発でなかった。
抽出された低質量イオンの質量スペクトルは、従来のソフトウェア(software)のいずれかであるMarkerViewTM(バージョンversion1.2は、以下のバージョン省略)によって分析することができる。本発明者等は、GC患者群と正常対照群(control、CONT)の血清(serum)から抽出された低質量イオンの質量スペクトルをMarkerViewTMを用いて分析してみたが、図5を参照して、その方法を詳細に説明する。
表301のGC患者群49名と、表302の正常対照群84名で構成された集合(Set E1)から採取した血清を試料とし、MALDI-TOF質量分析計を用いて、抽出されたT2Dのファイル形式の低質量イオンの質量スペクトルをMarkerViewTMにインポート(import)した(C11)。
インポートの条件として表303の条件を使用した。
次に、インポートしたピーク強度(peak intensity)を正規化(nomalization)した(C12)。MarkerViewTMには、複数の正規化の方法が存在するが、「Normalization Using TotalArea Sums」方法を使用して正規化を行った。この方法では、各試料別の強度の小計を求め、試料別小計の平均を求めた後、各試料別の強度の小計がこの平均と一致するように、各ピーク強度の試料別のスケール因子(scaling factor)を乗ずる。すなわち、このように正規化した後は、各試料別の強度の小計が等しくなる。
次に、正規化したピーク強度をパレート・スケーリング(Pareto scaling)した(C13)。すなわち、正規化した各ピークの強度で質量イオン別の平均値を減算し、標準偏差の平方根で割り、ピーク強度をパレート・スケーリングした。
その次に、パレート・スケーリングしたピーク強度に対して主成分分析ベースの線形判別分析(principal component analysis-based linear discriminant analysis、PCA-DA)を実行し、判別スコア(discriminant score、DS)を計算した(C14)。すなわち、二段階で主成分分析を実行し、各質量イオン別の重み付け係数(weighting factor)である因子負荷量(factor loading)を求め、パレート・スケーリングされた強度に因子負荷量を乗算した後、さらに各試料別の判別スコアを計算した。表303のインポート条件としてピークの最大数を10,000個とし、十分に多くの試料を一緒にインポートしたため、本計算で因子負荷量は10,000個と計算され、したがって、10,000個の項を足して一つの判別スコアが算出された。
その次に、計算された判別スコアが正であるかどうかを判断し(C15)、正の場合、陽性と(C16)、負の場合、陰性と判定した(C17)。すなわち、GCに適用され、正の場合はGC患者群として、負の場合、正常対照群として判定した。
図6は、既に臨床的に判定されたGC患者群49名と、正常対照群84名で構成された集合に対して図5の方法で計算した判別スコアの分布を示す。図6に示す判別スコアに基づく判定結果を混同行列(confusion matrix)を用いて整理すると、表304の通りである。
図6および表304を通じて知ることができるように、従来技術であるMarkerViewTMの主成分分析ベースの線形判別分析の方法を通し、感度(sensitivity)、特異度(specificity)、陽性的中率(positive predictive value、PPV)および陰性的中率(negative predictive value、NPV)がいずれも97%以上である極めて優れた判別結果を得ることができる。
しかし、これを臨床で使用できるようにするには、まず式のロバスト性(robustness)が必ず検証されなければならない。すなわち、すでに一度測定し、判別式を構成していた集合に対してさらに数回反復測定した質量スペクトルに対しても依然と良い判別結果を表すべきであり、判別式を構成する際に考慮していなかった新しいGC患者群および正常対照群に対しても同様の判別式で良い判別結果を得ることができなければならない。質量スペクトルを反復測定する過程には、血清を凍結・凍解する過程が含まれる、または血清を新たにメタノール(methanol)/クロロホルム(chloroform)と混合して抽出する過程が含まれることもある。このような過程は、質量スペクトルの統計分析において外乱(disturbances)として見ることができるが、これらの外乱に鈍感な判別式を構成しなければ臨床に適用することができない。
要するに、図5、6、および表304を参照して説明した従来の主成分分析ベースの線形判別分析の方法は、特定の試料で構成され集合に個別に適用される場合には、すなわち、個別訓練集合(traning set)に対する判別では、極めて優れた判別結果を表したりもするが、検証集合(validation set)における判別結果は、満足できるものでなかった(表329、331を参照)。訓練集合には、極めて優れた判別結果が表れたにもかかわらず、判別式がロバスト性を有さない理由は、判別式を構成している10,000個の質量のイオンのうち、相当の数の質量イオンがGC患者群と正常対照群の判別のためには、少なくとも不要で、時には訓練集合の判別では、問題を引き起こさなかったが、検証集合の判別では、潜在的に判別結果を混乱し得る質量イオンを含んでいるためと推定される。したがって、このように、少なくとも不要で、または潜在的に判別結果に混乱を与え得る質量イオンを積極的に除去する過程を通じて、優れかつロバストな判別結果を得るため、必要不可欠な質量イオンだけを見出す作業が必要になると考えられる。
本発明は、生物学的試料から抽出した低質量イオンについて生物統計学的分析を通し、癌を診断するための低質量イオンの質量スペクトルを確認し、該低質量イオンの質量スペクトルを用いて癌を診断することができる癌の診断装置を提供する。
本発明は、CRC患者および非患者試料に対してロバストな判別結果を与える判別式を提案すべく、判別式を見出したCRC患者および非患者の集合にさらに数回反復測定した質量スペクトルと、新しいCRC患者および非患者集合の数回反復測定した質量スペクトルのいずれに対して85%以上の感度、特異度、陽性的中率、陰性的中率を示す判別式を提案し、これを構成する低質量イオンを確認し、CRCを診断することができる癌の診断装置を提供する。
本発明は、BRCの患者および非患者試料に対してロバストな判別結果を与える判別式を提案すべく、判別式を見出したBRC患者と非患者の集合にさらに数回反復測定した質量スペクトルと新しいBRC患者および非患者集合の数回反復測定した質量スペクトルのいずれに対して85%以上の感度、特異度、陽性的中率、陰性的中率を示す判別式を提案し、これを構成する低質量イオンを確認し、BRCを診断することができる癌の診断装置を提供する。
本発明は、GC患者および非患者試料に対してロバストな判別結果を与える判別式を提案すべく、判別式を見出したGCの患者および非患者集合にさらに数回反復測定した質量スペクトルと新しいGC患者および非患者集合の数回繰り返す測定した質量スペクトルのいずれに対して約80〜90%以上の感度、特異度、陽性的中率、陰性的中率を示す判別式を提案し、これを構成する低質量イオンを確認し、GCを診断することができる癌の診断装置を提供する。
前述した課題を解決するための本発明に係る癌診断装置は、複数の癌患者および非患者の事例の生物学的試料から低質量イオン(low-mass ion)の質量スペクトルを検出する低質量イオン検出部と、前記低質量イオンの質量スペクトル・パターンを比較分析し、癌の診断情報を判定する癌の診断部と、および前記癌診断部から判定された癌の診断情報を出力可能な形式に切り換えて表示するディスプレイ部を含む。
前記低質量イオン検出部は、前記生物学的試料から低質量イオンのピーク強度(peak intensity)を検出し、前記低質量イオンの質量スペクトルを抽出することができる。
前記低質量イオン検出部は、質量分析計を含むことができる。
前記癌の診断部と、訓練候補集合である前記癌患者および非患者の事例の低質量イオンの質量スペクトルをソートする第1の整列手段と、ソートされた前記質量スペクトルに対して生物統計学的分析を実行し、判別スコアを計算する第1の判別スコアの計算手段と、前記判別スコアに基づいて感度(sensitivity)と特異度(specificity)を計算し、これを基準に第1の訓練集合を選定し、低質量イオン別の因子負荷量(factor loading)を計算する因子負荷量を計算する手段と、候補条件を満たす候補の低質量のイオンの中、判別性能をベースにして癌診断用低質量イオンを選択する癌診断イオンの選定手段と、判別対象の生物学的試料の低質量イオンの質量スペクトルを前記第1の訓練集合にソートする第2の整列手段と、前記判別対象の低質量イオンのピーク強度と前記因子負荷量から判別スコアを計算する第2の判別スコアの計算手段と、前記判別スコアに応じて前記判別対象を癌の陽性または陰性と判定する癌判定手段を含むことができる。
前記第1の判別スコアの計算手段は、前記訓練候補集合の前記低質量イオンの質量スペクトルの前記ピーク強度を正規化(normalization)する正規化モジュールと、前記正規化したピーク強度をスケーリング(scaling)するスケーリング・モジュールと、前記スケーリングされたピーク強度に対して、前記生物統計学的分析を実行し、前記判別スコアを計算する判別スコアの計算モジュールを含むことができる。
前記スケーリング・モジュールは、パレート・スケーリング(Pareto scaling)を実行することが望ましい。
前記判別スコアの計算モジュールは、主成分分析ベースの線形判別分析(principal component analysis-based linear discriminant analysis、PCA-DA)を使用し、前記生物統計学的分析を行うことができる。
前記判別スコアの計算モジュールは、前記主成分分析ベースの線形判別分析によって得られた因子負荷量と前記スケーリングされたピークの強度を共に使用して前記判別スコアを計算することができる。
前記因子負荷量の計算手段は、前記ソートされた質量スペクトルに対して生物統計学的分析を行い、前記生物統計学的分析の結果を基に、前記癌患者および非患者の事例の中で訓練条件を満たす訓練事例を第1の訓練集合として選択する第1の訓練集合選択手段を含み、前記第1の訓練集合から因子負荷量を計算することができる。
前記第1の訓練集合選択手段は、前記生物統計学的分析の結果に応じた感度が閾値(threshold)N1以上であり、特異度が閾値N2以上の時の癌患者および非患者の事例を前記第1の訓練集合として設定することができる。前記閾値N1とN2は、1であることが望ましい。
前記第2の判別スコアの計算手段は、前記判別対象の前記低質量イオンの質量スペクトルの前記ピーク強度を正規化する正規化モジュールと、前記正規化したピーク強度をスケーリングするスケーリング・モジュールと、前記スケーリングされたピーク強度と前記因子負荷量を通じて前記判別スコアを計算する判別スコアの計算モジュールを含むことができる。
前記スケーリング・モジュールは、パレート・スケーリングを実行することが望ましい。
前記判別スコアの計算モジュールは、前記癌診断用の低質量イオンの前記スケーリングされたピーク強度と前記因子負荷量を通じて前記判別スコアを計算することができる。
前記癌の判定手段は、前記判別スコアに応じて前記判別対象を癌の陽性または陰性と判定するが、前記判別スコアが、基準値Sよりも大きい場合は、陽性であるとして前記判別対象の癌の情報を判断し、前記判別スコアが基準値Sよりも小さい場合は、陰性であるとして前記判別対象の癌の情報を判断することができる。前記基準値Sは0であることが望ましい。
前記癌の判定手段は、前記判別対象の生物学的試料を反復測定して検出した複数の前記低質量イオンの質量スペクトルについて計算された複数の前記判別スコアの平均値で前記判別対象の前記癌の情報を判断することができる。
前記癌診断用のイオン選定手段は、前記選択された前記第1の訓練集合から候補条件を満たす候補者の低質量イオンを候補イオン集合として選択する候補イオン集合の選択手段と、および前記選択された前記候補イオン集合の前記候補低質量イオンの個別または組み合わせ別の判別性能をベースにして癌診断用の低質量イオンを最終イオン集合として選択する最終イオン集合選択手段を含むことができる。
前記候補イオン集合選択手段は、前記訓練事例のそれぞれに対する前記低質量イオンの前記ピーク強度と、前記生物統計学的分析を通じて得られた前記低質量イオン別の因子負荷量の積の絶対値が閾値T1よりも大きい第1の低質量イオンを前記訓練事例別に選択する第1の低質量イオン選択モジュールを含むことができる。前記閾値T1は0.1であることが望ましい。
前記候補イオン集合選択手段は、前記第1の低質量イオンのうち、前記訓練事例の全体の閾値T2パーセント以上の事例において共通に表れる第2の低質量イオンを前記候補イオンの集合として選択する候補イオン集合の予備選択モジュールを含むことができる。前記閾値T2は50であることが望ましい。
前記候補イオン集合選択手段は、前記第2の低質量イオンを利用し、前記訓練事例別に癌の陽性または陰性を表す判別スコアを計算し、前記判別スコアに基づく感度と特異度を計算する感度と特異度の計算モジュールと、および前記感度が閾値N3よりも小さいか、または前記特異度が閾値N4よりも小さい場合、前記T1および前記T2のうち少なくとも一つを変更し、前記過程を繰り返し、前記候補イオン集合として選択する候補イオン集合最終選択モジュールをさらに含むことができる。前記閾値N3とN4は、0.9であることが望ましい。
前記最終イオン集合選択手段の前記判別性能の基準は、前記候補低質量イオンの感度と特異度の和が基準値よりも大きいイオンを選択するか、または前記候補低質量イオンで構成されている組み合わせ別の感度と特異度の和が比較対象の組み合わせの中で最大の組み合わせを選択する第1の基準を含むことができる。
前記最終イオン集合選択手段の前記判別性能の基準は、前記候補低質量イオンの組み合わせの中で、前記候補低質量イオンの数が比較対象の組み合わせの中で最も少ない組み合わせを選択する第2の基準をさらに含むことができる。
前記最終イオン集合選択手段の前記判別性能の基準は、前記候補低質量イオンの組み合わせの真陽性(true positive)事例の最小判別スコアと真陰性(ture negative)事例の最大判別スコアの差が比較対象の組み合わせの中で一番大きな組み合わせを選択する第3の基準をさらに含み、前記判別スコアは、前記候補低質量イオンの前記スケーリングされたピーク強度と前記因子負荷量を使用して計算され、癌の陽性または陰性を表すことが望ましい。
前記最終イオン集合選択手段は、前記候補イオン集合に含まれた前記候補低質量イオンを前記感度が前記特異度よりも高い高感度低質量イオンを含み、前記高感度低質量イオンを前記感度と前記特異度の和の降順でソートした高感度集合{Sns1、Sns2、Sns3 ...SnsI}と、前記特異度が前記感度よりも高い高特異度低質量イオンを含み、前記高特異度低質量イオンを前記感度と前記特異度の和の降順でソートした高特異度集合{Spc1、Spc2、Spc3 ...SpcJ}に区分するイオン区分モジュールと、前記高感度集合で上位階層のL個の前記高感度低質量のイオン{Sns1、Sns2、Sns3 ...SnsL}と、前記高特異度の集合で上位階層のL個の前記高特異度低質量イオン{Spc1、Spc2、Spc3 ...SpcL}のうち2つ以上の低質量イオンで構成される候補者組み合わせの中、前記第1の基準、前記第2の基準および前記第3の基準のうち、少なくとも一つ以上による前記判別性能の基準により選択された組み合わせをバイオ・マーカーのグループに選ばれるバイオ・マーカーのグループの予備選定モジュールと、前記バイオ・マーカーのグループと、前記高感度集合から下位の階層のM個の前記高感度低質量のイオンと、前記高特異度の集合から下位の階層のM個の前記高特異度低質量イオンのうちの少なくとも一つ以上の低質量イオンを前記バイオ・マーカーのグループに追加された候補の組み合わせのうち、前記第1の基準、前記第2の基準および前記第3の基準のうち、少なくとも一つ以上による前記判別性能の基準によって選択された組み合わせを、前記バイオ・マーカーのグループに再選定するバイオ・マーカーグループの再選定モジュールと、前記高感度集合および前記高特異度の集合に下位の階層の低質量イオンが存在しなくなるまで、前記再選択過程を繰り返し、前記バイオ・マーカーのグループを最終選定するバイオ・マーカーのグループ最終選定モジュールを含むことができる。
前記最終イオン集合選択手段は、前記候補イオン集合において、前記バイオ・マーカーのグループ最終選定モジュールから得られた前記バイオ・マーカーのグループに選定完了した組み合わせの低質量イオンを除いた残留候補イオンの集合を対象に、前記三つのバイオ・マーカーのグループの選択過程を繰り返し実行し、追加のバイオ・マーカーのグループを選定するが、前記高感度集合、または前記高特異度の集合に、前記L個未満の質量イオンが残るまで前記追加のバイオ・マーカーのグループをさらに選定するバイオ・マーカーのグループの追加選定モジュールと、前記バイオ・マーカーのグループと前記追加のバイオ・マーカーのグループのうち、真陽性および真陰性判定の正確さ(accuracy)を基準に上位階層のK個のバイオ・マーカーグループの組み合わせの低質量イオンを前記癌診断用低質量イオンで選択する癌診断用低質量イオンの最終選択モジュールをさらに含むことができる。前記Lの値は2であり、前記Mの値は1であり、前記K値は、1〜3のいずれかの自然数であることが望ましい。
前記最終イオン集合選択手段は、前記第1の訓練集合の独立した第2の訓練集合を前記第1の訓練集合に追加された訓練集合を対象に低質量イオン選択過程を進行することが望ましい。
前記複数の癌患者の事例は、大腸がん患者の事例、乳がん患者の事例および胃がん患者の事例のいずれかの癌患者の事例を含むことができる。
前記低質量イオン検出部は、複数の大腸がん患者および非患者の事例の生物学的試料から質量分析計を用い、前記低質量イオンのピーク強度を検出し、前記低質量イオンの質量スペクトルを抽出し、前記癌診断部は、訓練候補集合である前記大腸がん患者および非患者の事例の低質量イオンの質量スペクトルをソートする第1の整列手段と、ソートされた前記質量スペクトルに対して生物統計学的分析を行い、判別スコアを計算する第1の判別スコアの計算手段と、前記判別スコアに基づいて感度および特異度を計算し、これを基準に第1の訓練集合を選定して低質量イオン別の因子負荷量を計算する因子負荷量計算手段と、候補条件を満たす候補者低質量のイオンのうち、判別性能をベースにして大腸がん診断用低質量イオンを選択する大腸がん診断用イオン選定手段と、判別対象生物学的試料の低質量イオンの質量スペクトルを前記第1の訓練集合にソートする第2の整列手段と、前記判別対象の低質量イオンのピーク強度と前記因子負荷量から判別スコアを計算する第2の判別スコアの計算手段と、前記判別スコアに応じて前記判別対象を大腸がんの陽性または陰性と判定される大腸がん判定手段を含み、前記大腸がん診断用イオン選定手段は、前記複数の大腸がん患者および非患者の事例を、複数の大腸がん患者の事例と複数の健常者の事例で構成される第1種の判別事例と、前記複数の大腸がん患者事例と複数の大腸がん以外の癌患者の事例で構成される第2種の判別事例とに区分し、前記第1種の判別事例と前記第2種の判別事例に対してそれぞれ実行され、前記大腸がん診断用低質量イオンが、前記第1種の判別事例の第1種の大腸がん診断用低質量イオンと、前記第2種の判別事例に対する第2種の大腸がん診断用低質量イオンに区分されることができる。
前記第1種の大腸がん診断用低質量イオンの質量値は、18.0260、22.9797、74.0948、76.0763、102.0916、105.1078、106.0899、107.0477、118.0822、123.0395、137.0423、137.0729、147.0573、147.1058、169.0653、181.0656、190.0849、191.0848、191.3324、195.0785、212.3195、231.0667、235.0053、256.0939、266.9557、267.9501、288.2033、291.0997、295.0663、300.1297、301.1269、316.2288、317.2311、335.1862、340.2241、343.2451、345.2583、357.0666、357.2784、366.2310、368.2551、369.3302、377.0570、379.1438、379.4765、383.0529、384.1745、388.2688、401.0531、423.0313、428.1878、454.2090、465.3014、466.1923、468.1851、469.2831、477.1721、478.1678、480.1715、482.3220、483.3258、496.8683、497.7636、503.8719、508.3407、510.3265、512.3119、513.3177、518.2931、518.8555、519.2967、519.8598、525.3449、534.2739、537.2800、538.3306、540.2629、540.8144、542.8457、544.8692、548.2856、566.8375、581.1957、582.1888、583.2242、656.0270、667.3291、709.3519、710.3581、711.3617、712.3683、713.3798、991.6196、992.6209、1016.6113、1020.4817、1206.5305、1207.5571、1465.6184、1466.6096、1467.5969、2450.9701、2451.9662と2452.9546m/z(ただし、誤差範囲は±0.1m/z)からなるグループから選択された複数の質量値であることが望ましい。
前記第2種の判別事例のうち、前記複数の大腸がん以外の癌患者の事例は、乳がん患者の事例、非ホジキンリンパ腫(non-Hodgkin lymphoma、NHL)患者事例および胃がん患者の事例のうち、少なくとも一つ以上の癌患者事例を含むが、前記第2種の大腸がん診断用低質量イオンの質量値は、60.0476、138.0540、172.6653、173.1158、179.1451、191.1277、279.0855、280.0895、280.2642、281.1440、296.2574、312.3248、332.3224、333.3324、369.3406、465.3161、486.6356、488.6882、544.8908、551.3287、566.8737、707.3475および733.3569m/z(ただし、誤差範囲は±0.1m/z)からなるグループから選択された複数の質量値であることが望ましい。
前記判別スコアは、前記第1種の低質量イオンによる第1種の判別スコアと前記第2種の低質量イオンによる第2種の判別スコアを含み、前記第1種の判別スコアがCS11より大きく、前記第2種の判別スコアがCS21よりも大きい場合には、前記判別対象を大腸がん陽性と判断し、前記第1種の判別スコアがCS12よりも小さいか、または前記第2種の判別スコアがCS22よりも小さい場合には、前記判別対象を大腸がん陰性と判断することができる。前記CS11、CS12、CS21およびCS22は0であることが望ましい。
前記大腸がん診断用イオン選定手段を用いて取得した大腸がん患者と健常者とを区分する低質量イオン群には、フィブリノゲン(fibrinogen)またはフィブリノゲンアルファチェーン(fibrinogenalpha chain)が含まれることができる。
前記大腸がん患者と健常者とを区分する低質量イオン群には、トランスサイレチン(transthyretin)が含まれることができる。
前記低質量イオン検出部は、複数の乳がん患者および非患者の事例の生物学的試料から質量分析計を用いて、前記低質量イオンのピーク強度を検出し、前記低質量イオンの質量スペクトルを抽出し、前記癌診断部は、訓練候補集合である前記乳がん患者および非患者事例の低質量イオンの質量スペクトルをソートする第1の整列手段と、ソートされた前記質量スペクトルに対して生物統計学的分析を行い、判別スコアを計算する第1の判別スコアの計算手段と、前記判別スコアに基づいて感度および特異度を計算し、これを基準に第1の訓練集合を選定して低質量イオン別の因子負荷量を計算する因子負荷量計算手段と、候補条件を満たす候補低質量のイオンのうち、判別性能をベースに乳がん診断用低質量イオンを選択する乳がん診断用イオン選定手段と、判別対象生物学的試料の低質量イオンの質量スペクトルを前記第1の訓練集合にソートする第2の整列手段と、前記判別対象の低質量イオンのピーク強度と前記因子負荷量から判別スコアを計算する第2の判別スコアの計算手段と、前記判別スコアに応じて前記判別対象を乳がんの陽性または陰性と判定する乳がん判定手段を含み、前記乳がん診断用イオン選定手段は、前記複数の乳がん患者および非患者の事例を第1種の判別事例で構成する、または前記複数の乳がん患者および非患者の事例を、複数の乳がん患者の事例と複数の健常人の事例で構成される第2種の判別事例と、前記複数の乳がん患者の事例と複数の乳がん以外の癌患者の事例で構成される第3種の判別事例とに区分し、前記第1種の判別事例と、前記第2種の判別事例および前記第3種の判別事例に対してそれぞれ行われ、前記乳がん診断用低質量イオンが、前記第1種の判別事例に対する第1種の乳がん診断用低質量イオンと、前記第2種の判別事例の第2種の乳がん診断用低質量イオンおよび前記第3種の判別事例に対する第3種の乳がん診断用低質量イオンに区分されることができる。
前記第1種の判別事例のうち、前記乳がん、非患者の事例は、健常者の事例、大腸がん患者の事例、非ホジキンリンパ腫(non-Hodgkin lymphoma、NHL)患者の事例および胃がん患者の事例のうち、少なくとも一つ以上の事例を含むが、前記第1種の乳がん診断用低質量イオンの質量値は、74.0937、74.1155、76.0728、136.1067、173.4872、193.0665、208.0565、212.0949、231.0726、258.1364、279.0841、280.0847、282.2777、313.2638、331.2024、332.3181、401.0588、427.3441、432.9954、452.2269、476.6038、490.3427、498.3237、499.3265、512.3145、562.3074、583.2323、584.2415、646.3851m/z(ただし、誤差の範囲は±0.1m/z)からなるグループから選択された複数の質量値であることが望ましい。
前記第2種の乳がん診断用低質量イオンの質量値は、38.9779、46.0647、74.1164、76.0733、97.0686、122.0777、123.0821、130.1539、185.7723、191.1175、208.0530、212.0960、225.1870、229.0005、231.0675、244.0962、281.0913、284.3205、313.2618、332.3150、342.2482、368.2624、398.3034、416.0901、424.3216、426.3389、428.1885、497.3194、513.3193、532.6918、538.3428、540.3250、570.3234、580.3281、581.2310、581.3377、610.3273、616.3286、618.3352、646.3959、725.3469、757.1117m/z(ただし、誤差の範囲は±0.1m/z)からなるグループから選択された一つ以上の質量値であることが望ましい。
前記第3種の判別事例のうち、前記複数の乳がん以外のがん患者の事例は、大腸がん患者の事例、非ホジキンリンパ腫の患者の事例および胃がん患者の事例のうち、少なくとも一つ以上の癌患者の事例を含み、前記第3種の乳がん診断用低質量イオンの質量値は、38.9736、38.9892、44.0491、44.0656、74.0938、87.0991、104.1316、104.3161、105.1091、136.1021、155.1798、156.0412、172.3072、178.1330、182.0738、189.9525、192.1294、193.0660、196.0871、212.3221、217.0923、222.0231、228.0348、231.0726、234.0422、260.1013、279.0843、280.0849、282.2791、289.2960、298.3425、313.2630、316.3269、331.2036、332.3169、333.3233、337.1047、424.3272、426.3406、432.9948、433.9894、446.0196、454.3014、469.2924、478.8688、479.8724、480.3180、483.3301、487.3152、488.3287、488.6580、496.4331、496.7718、497.7764、502.8741、511.3367、518.8776、520.8826、534.2829、535.2882、542.8770、544.7878、544.8728、546.3358、559.2911、568.1146、583.2284、731.3330、733.3526、734.3563、735.3665、757.0995、757.3512、1465.5872、1466.5971m/z(ただし、誤差の範囲は±0.1m/z)からなるグループから選択された一つ以上の質量値であることが望ましい。
前記判別スコアは、前記第1種の低質量イオンによる第1種の判別スコアであり、前記判別スコアがBS11よりも大きい場合には、前記判別対象を乳がん陽性と判断し、前記判別スコアがBS12よりも小さい場合には、前記判別対象を乳がんの陰性と判断することができる。前記BS11とBS12は0であることが望ましい。
前記判別スコアは、前記第2種の低質量イオンによる第2種の判別スコアと、前記第3種の低質量イオンによる第3種の判別スコアを含み、前記第2種の判別スコアがBS21より大きく、前記第3種の判別スコアがBS31よりも大きい場合には、前記判別対象を乳がん陽性と判断し、前記第2種の判別スコアがBS22よりも小さい、または前記第3種の判別スコアがBS32よりも小さい場合には、前記判別対象を乳がん陰性と判断することができる。前記BS21、BS22、BS31とBS32は0であることが望ましい。
前記低質量イオン検出部は、複数の胃がん患者および非患者事例の生物学的試料から質量分析計を用い、前記低質量イオンのピーク強度を検出し、前記低質量イオンの質量スペクトルを抽出し、前記癌診断部は、訓練候補集合である前記胃がん患者と非患者の事例の低質量イオンの質量スペクトルを並べ替える第1の整列手段と、ソートされた前記質量スペクトルに対して生物統計学的分析を行い、判別スコアを計算する第1の判別スコアの計算手段と、前記判別スコアに応じて感度および特異度を計算し、これを基準に第1の訓練集合を選定し、低質量イオン別因子負荷量を計算する因子負荷量を計算する手段と、候補条件を満たす候補低質量イオンのうち、判別性能をベースにして、胃がん診断用低質量イオンを選択した胃がん診断用イオン選定手段と、判別対象生物学的試料の低質量イオンの質量スペクトルを前記第1の訓練集合にソートする第2の整列手段と、前記判別対象の低質量イオンのピーク強度と前記因子負荷量から判別スコアを計算する第2の判別スコアの計算手段と、および前記判別スコアに応じて前記判別対象を胃がんの陽性または陰性と判定される胃がん判定手段を含み、前記胃がん診断用イオン選定手段は、前記複数の胃がん患者および非患者の事例を、複数の胃がん患者事例と複数の健常者の事例で構成される第1種の判別事例と、前記複数の胃がん患者の事例と複数の大腸がん患者の事例で構成される第2種の判別事例と、前記複数の胃がん患者の事例と複数の乳がん患者事例で構成される第3種の判別事例と、前記複数の胃がん患者事例と複数の非ホジキンリンパ腫(non-Hodgkinlymphoma、NHL)患者事例で構成される第4種の判別事例で区分する、または前記複数の胃がん患者および非患者の事例を、前記第1種の判別事例と前記複数の胃がん患者と健常者の事例と複数の大腸がん、乳がん、および非ホジキンリンパ腫の患者の事例で構成される第5種の判別事例に区分して、前記第1種の判別事例、前記第2種の判別事例、前記第3種の判別事例、前記第4種の判別事例および前記第5種の判別事例に対して、それぞれ行われ、前記胃がん診断用低質量イオンが、前記第1種の判別事例に対する第1種の胃がん診断用低質量イオン、前記第2種の判別事例に対する第2種の胃がん診断用低質量イオン、前記第3種の判別事例の第3種の胃がん診断用低質量イオン、前記第4種の判別事例の第4種胃がん診断用低質量イオンおよび前記第5種の判別事例に対する第5種の胃がん診断用低質量イオンに区分されることができる。
前記第1種の胃がん診断用低質量イオンの質量値は、22.9851、87.0959、123.0842、314.2151、324.1365、366.2424、488.6538、490.3374、526.3426、532.3719、576.2893、606.2658、616.1397、1466.5612m/z(ただし、誤差の範囲は±0.1m/z)からなるグループから選択された一つ以上の質量値であることが望ましい。
前記第2種の胃がん診断用低質量イオンの質量値は、18.0260、22.9830、38.9752、072.0788、86.1216、122.0584、137.0721、144.1092、156.0171、172.3740、172.6583、207.0729、265.2034、356.1278、380.1643、381.0949、401.0680、431.9882、442.3197、445.0278、458.3228、489.3564、489.5293、490.2775、490.3586、525.3611、528.3633、535.2970、553.3205、557.4392、584.2675、585.2726、587.2805、710.3687、946.4028、1466.6433m/z(ただし、誤差の範囲は±0.1m/z)からなるグループから選択された一つ以上の質量値であることが望ましい。
前記第3種の胃がん診断用低質量イオンの質量値は、22.9852、74.0764、104.1387、35105.1157、106.0555、148.0788、173.4924、176.1198、184.1123、212.1032、217.9461、226.0798、228.0046、284.3291、299.1308、299.3423、314.2316、338.1143、377.0710、387.9830、426.3417、427.3321、430.3313、432.9929、456.2963、459.2425、480.3312、481.3399、482.3368、487.3295、488.3316、490.3400、496.8846、506.9148、509.3577、532.3532、534.2973、535.3013、537.3199、550.3255、560.3121、562.3203、574.3090、580.3417、583.2274、584.2345、584.3355、585.2423、600.3366、616.1446m/z(ただし、誤差の範囲は±0.1m/z)からなるグループから選択された一つ以上の質量値であることが望ましい。
前記第4種の胃がん診断用低質量イオンの質量値は、18.0264、22.9798、23.0539、38.9638、38.9937、46.0666、86.1328、112.0850、123.0738、129.0710、155.1762、164.0701、165.0955、175.1219、176.1298、178.1388、179.1466、192.1245、201.2036、204.1077、212.3577、213.0575、229.0033、232.0822、234.0749、235.0331、240.0907、251.9799、274.0827、284.3265、314.2277、326.3916、383.0532、417.0381、429.3172、430.3169、434.2556、456.3015、459.2257、460.9913、489.3314、490.3361、491.3348、532.2725、534.2841、569.3303m/z(ただし、誤差の範囲は±0.1m/z)からなるグループから選択された一つ以上の質量値であることが望ましい。
前記第5種の胃がん診断用低質量イオンの質量値は、38.9674、76.0758、123.0414、156.0432、163.1135、164.0712、184.1062、184.1375、190.1141、193.0672、215.0444、228.0389、230.0004、256.3291、257.2950、265.9579、267.9562、289.2849、295.1666、301.1386、315.2230、330.2485、342.2497、346.2809、368.2644、369.2702、370.2806、371.2848、396.0400、412.1977、428.1904、442.3155、443.2100、445.0283、498.3276、510.2755、511.3414、513.3220、530.3908、532.2863、548.3441、552.3114、553.3178、571.3341、573.2402、584.2661、666.3899、683.3451、684.3511、708.3570、711.3711、723.3455、725.3580、726.3760、741.3357m/z(ただし、誤差の範囲は±0.1m/z)からなるグループから選択された一つ以上のの質量値であることが望ましい。
前記判別スコアは、前記第1種の低質量イオンによる第1種の判別スコア、前記第2種の低質量イオンによる第2種の判別スコア、前記第3種の低質量イオンによる第3種の判別スコアおよび前記第4種の低質量イオンによる第4種の判別スコアを含み、前記第1種の判別スコアがGS11より大きく、前記第2種の判別スコアがGS21より大きく、前記第3種の判別スコアがGS31より大きく、前記第4種の判別スコアがGS41よりも大きい場合には、前記判別対象を胃がん陽性と判断し、前記第1種の判別スコアがGS12より小さい、または前記第2種の判別スコアがGS22より小さい、または前記第3種の判別スコアがGS32より小さい、または前記第4種の判別スコアがGS42よりも小さい場合には、前記判別の対象を胃がん陰性と判断することができる。前記GS11、GS12、GS21、GS22、GS31、GS32 、GS41およびGS42は、0であることが望ましい。
前記判別スコアは、前記第1種の低質量イオンによる第1種の判別スコアと前記第5種の低質量イオンによる第5種の判別スコアを含み、前記第1種の判別スコアがGS11より大きく、前記第5種の判別スコアがGS51よりも大きい場合には、前記判別対象を胃がん陽性と判断し、前記第1種の判別スコアがGS12よりも小さい、または前記第5種の判別スコアがGS52よりも小さい場合には、前記判別対象を胃がん陰性と判断することができる。前記GS11、GS12、GS51およびGS52は、0であることが望ましい。
本発明に係る癌診断装置は、CRC診断の場合、分析コストが極めて低く、分析時間が短く、大規模な分析が可能であるという長所がある。過程を簡略に説明すると、血液中の低質量イオンの質量スペクトルを測定し、そのうちのCRC診断用低質量イオンの質量値に対応するピークの強度を抽出し、簡単な計算をすれば、すぐにCRCの陽性/陰性の情報を提供することができる。
また、判別性能に優れかつロバストなため、CRCを対象とした場合、訓練集合だけでなく、検証集合の判別においても感度、特異度、陽性的中率、陰性的中率がいずれも85%以上であることを確認した。また、CRC患者および非患者の集合を外の病気の患者および非患者の集合に変更することを通し、さまざまな病気に有用に適用されることができる。
また、CRCを対象とした場合、糞便を分析試料とするFOBTと比較すると、血液を分析試料として使用することができるため、他の検査と共に分析することができ、従来の技術に比べ、便利で迅速にCRC情報を提供することができる。 CRC診断用低質量イオンを使用した場合は、既存のFOBTの判別性能と比較すると、特異度の面では匹敵する性能を表し、感度の面でははるかに優れた性能を表すことを確認した。
本発明に係る癌診断装置は、BRCの診断の場合にも、分析コストが極めて低く、分析時間が短く、大規模な分析が可能であるという長所がある。過程を簡単に説明すると、血液中の低質量イオンの質量スペクトルを測定し、そのうちのBRC診断用低質量イオンの質量値に対応するピークの強度を抽出し、簡単な計算をすれば、すぐにBRCの陽性/陰性の情報を提供することができる。
また、判別性能に優れかつロバストなため、BRCを対象とした場合、訓練集合だけでなく、検証集合の判別においても感度、特異度、陽性的中率、陰性的中率がいずれも85%以上であることを確認した。また、BRC患者および非患者の集合を外の病気の患者および非患者の集合に変更することを通し、さまざまな病気に有用に適用されることができる。
本発明に係る癌診断装置は、GC診断の場合においても、分析コストが極めて低く、分析時間が短く、大規模な分析が可能という長所がある。過程を簡略に説明すると、血液中の低質量イオンの質量スペクトルを測定し、そのうちのGC診断用低質量イオンの質量値に対応するピークの強度を抽出し、簡単な計算をすれば、すぐにGCに対する陽性/陰性の情報を提供することができる。
また、判別性能に優れかつロバストなため、GCを対象とした場合、訓練集合だけでなく、検証集合の判別においても感度、特異度、陽性的中率、陰性的中率がすべて約80〜90%以上であることを確認した。また、GC患者および非患者の集合を外の病気の患者および非患者の集合に変更することを通し、さまざまな病気に便利に適用することができる。
図1ないし図6は、従来技術を説明する図である。
図1は、従来技術に従って低質量イオンの質量スペクトルを用いて、CRCを判定する過程を説明するフローチャートである。
図2は、従来技術に従ってCRC患者133名と正常対照群153名で構成された集合を判定した結果を示すグラフである。
図3は、従来技術に従って低質量イオンの質量スペクトルを用い、BRCを判定する過程を説明するフローチャートである。
図4は、従来技術に従ってBRC患者群54名、正常対照群49名で構成された集合を判定した結果を示すグラフである。
図5は、従来技術に従って低質量イオンの質量スペクトルを用い、GCを判定する過程を説明するフローチャートである。
図6は、従来技術に従ってGC患者49名と正常対照群84名で構成された集合を判定した結果を示すグラフである。
図7ないし図13は、本発明の望ましい一実施形態に係る癌の診断装置を説明するための図である。
図7は、本発明の望ましい一実施形態に係る癌の診断装置を示すブロック図である。
図8は、図7の癌診断部をより詳細に示すブロック図である。
図9は、図8の第1の判別スコアの計算手段をさらに詳細に示すブロック図である。
図10は、図8の第2の判別スコアの計算手段をさらに詳細に示すブロック図である。
図11は、図8の癌診断用イオン選定手段をさらに詳細に示すブロック図である。
図12は、図11の候補イオン集合選択手段をさらに詳細に示すブロック図である。
図13は、図11の最終イオン集合選択手段をさらに詳細に示すブロック図である。
図14ないし図25は、本発明の望ましい一実施形態によるCRCを診断するための癌の診断装置を説明するための図である。
図14は、本発明のCRCを診断するための図7の癌診断部をより詳細に示すブロック図である。
図15は、本発明に係る感度と特異度が所定の値を有する第1の訓練集合A0を選定し、質量イオン別の重み付け係数を計算する過程を説明するフローチャートである。
図16は、判別対象試料に判別式を適用する過程を説明するフローチャートである。
図17は、第1の訓練集合A01で計算した質量イオン別の重み付け係数で集合A1を判定した結果を示すグラフである。
図18は、第1の訓練集合A02で計算した質量イオン別の重み付け係数で集合A1を判定した結果を示すグラフである。
図19は、本発明に係る予備判別式を構成する過程を説明するフローチャートである。
図20は、第1種の予備判別式で集合A1を判定した結果を示すグラフである。
図21は、第2種の予備判別式で集合A1を判定した結果を示すグラフである。
図22は、本発明に係る最終判別式を構成する過程を説明するフローチャートである。
図23は、集合Aの5回反復測定した質量スペクトルに対し、本発明の最終判別式に従って判別スコアを計算した後、平均判別スコア(mean DS)を求め、判定した結果を示すグラフである。
図24は、本発明の最終判別式に従って平均判別スコアを計算し、5回反復測定した集合Bを判定した結果を示すグラフである。
図25aは、本発明の方法により確認された第1種のCRC診断用低質量イオンの質量の値のうち、1465.6184m/zを同定した結果を示すグラフである。
図25bは、本発明の方法により確認された第1種のCRC診断用低質量イオンの質量の値のうち、2450.9701m/zを同定した結果を示すグラフである。
図26ないし図37は、本発明の望ましい一実施形態によるBRCを診断するための癌の診断装置を説明するための図である。
図26は、本発明のBRCを診断するための図7の癌診断部をより詳細に示すブロック図である。
図27は、本発明に係る感度と特異度が所定の値を有する第1の訓練集合C0を選定し質量イオン別の重み付け係数を計算する過程を説明するフローチャートである。
図28は、判別対象試料に判別式を適用する過程を説明するフローチャートである。
図29は、第1の訓練集合C01で計算した質量イオン別の重み付け係数で集合C1を判定した結果を示すグラフである。
図30は、第1の訓練集合C03で計算した質量イオン別の重み付け係数で集合C1を判定した結果を示すグラフである。
図31は、本発明に係る予備判別式を構成する過程を説明するフローチャートである。
図32は、第1種の予備判別式で集合C1を判定した結果を示すグラフである。
図33は、第2種の予備判別式で集合C1を判定した結果を示すグラフである。
図34は、第3種の予備判別式で集合C1を判定した結果を示すグラフである。
図35は、本発明に係る最終判別式を構成する過程を説明するフローチャートである。
図36は、集合Cの5回反復測定した質量スペクトルに対し、本発明の第1種の最終判別式に従って、また、第2種および第3種の最終決定式に基づいて判別スコアを計算した後、平均判別スコア(mean DS)を求め、判定した結果を示すグラフである。
図37は、本発明の第1種の最終決定式に基づいて、また、第2種および第3種の最終判別式に基づいて平均判別スコアを計算し、5回反復測定した集合Dを判定した結果を図示すグラフである。
図38ないし図54は、本発明の望ましい一実施形態に係るGCを診断するための癌診断装置を説明するための図である。
図38は、本発明のGCを診断するための図7の癌診断部をより詳細に示すブロック図である。
図39は、本発明に係る感度と特異度が所定の値を有する第1の訓練集合E0を選定し、質量イオン別の重み付け係数を計算する過程を説明するフローチャートである。
図40は、判別対象試料に判別式を適用する過程を説明するフローチャートである。
図41は、第1の訓練集合E01で計算した質量イオン別の重み付け係数に集合E1を判定した結果を示すグラフである。
図42は、第1の訓練集合E02で計算した質量イオン別の重み付け係数に集合E1を判定した結果を示すグラフである。
図43は、第1の訓練集合E03で計算した質量イオン別の重み付け係数に集合E1を判定した結果を示すグラフである。
図44は、第1の訓練集合E04で計算した質量イオン別の重み付け係数に集合E1を判定した結果を示すグラフである。
図45は、第1の訓練集合E05で計算した質量イオン別の重み付け係数に集合E1を判定した結果を示すグラフである。
図46は、本発明に係る予備判別式を構成する過程を説明するフローチャートである。
図47は、第1種の予備判別式で集合E1を判定した結果を示すグラフである。
図48は、第2種の予備判別式で集合E1を判定した結果を示すグラフである。
図49は、第3種の予備判別式で集合E1を判定した結果を示すグラフである。
図50は、第4種の予備判別式で集合E1を判定した結果を示すグラフである。
図51は、第5種の予備判別式で集合E1を判定した結果を示すグラフである。
図52は、本発明に係る最終判別式を構成する過程を説明するフローチャートである。
図53は、集合Eの5回反復測定した質量スペクトルに対し、本発明の第1種および第5種の最終決定式に基づいて判別スコアを計算した後、平均判別スコア(mean DS)を入手判定した結果を示すグラフである。
図54は、本発明の第1種および第5種の最終決定式に基づいて平均判別スコアを計算して5回反復測定した集合Fを判定した結果を示すグラフである。
1.用語の定義
本発明において「生物学的試料」は、全血(whole blood)、血清、血漿(plasma)、であり、糞便、喀痰(sputum)、唾液、組織、細胞、細胞抽出物、体外細胞培養物などのような試料を含むが、これらに限定されない。下記に記述されている実施例においては、患者または非患者の血清を生物学的試料として使用した。
本発明において「ピーク強度」は、MALDI-TOF質量分析から得られる値であり、ピークに対応する質量イオンの量の相関関係を有する。
本発明において「正規化」は、データ(data)の範囲を一致させたり、分布を類似にしてくれることをいい、平均値(mean)、中央値(median)などを用いて正規化することができるが、これに制限されず、場合によっては、様々な公知の方法が適用されることができる。本実施例においては、各試料別のピーク強度の小計を求め、試料別の小計の平均を求めた後、各試料別のピーク強度の小計がこの平均と一致するよう各ピーク強度の試料別のスケール因子を乗ずるように正規化した。すなわち、このように正規化した後は、各試料別のピーク強度の小計が等しくなる。
本発明において「パレート・スケーリング」は、正規化された各ピーク強度から質量イオン別の平均値を減算した後、標準偏差の平方根で割ることをいう。より一般的なスケーリング方法であるオートスケーリング(autoscaling)は、標準偏差で割ることにより、データのサイズの情報を完全に相殺させるのに対し、パレート・スケーリングでは、データのサイズの情報を部分的に維持することを通じてノイズ(noise)の増幅を避けることができるという長所がある。
本発明において「重み付け係数」は、重み付け係数を乗じた後のデータの数値的大きさが統計の観点からの重要性に比例するように調整する因子を言うが、下記に記述する実施例においては、主成分分析ベースの線形判別分析の結果として獲得される質量イオン別因子負荷量を重み付け係数の一例とすることができる。
本発明において「低質量イオン」は、MALDI-TOF質量分析などを用いて獲得した質量値が1500m/zよりも小さいイオンを意味する。CRC診断用低質量イオンのうち、一部は、この範囲よりも高い質量の値を有するが、ほとんどがこの範囲内に入ってくるため、この場合にも、低質量イオンという名称をそのまま使用しようとする。すなわち、1500m/zという限界は確定的な値ではなく、おおよその値の意味として使用されたものである。
本発明においてMALDI-TOF質量分析計によって測定された質量値は、「±0.05m/z」の誤差の範囲を含む。実験環境によっては質量値の測定値に多少の誤差が生じる場合があるからである。たとえば、請求の範囲に記載された1467.5969m/zの質量値は実際、1467.5469m/zないし1467.6469m/zの範囲を有するものと理解されるべきである。実験環境によって誤差の範囲は、「±0.1m/z」とすることができる。
本発明においてMALDI-TOF質量分析計によって測定された質量値は、MALDI-TOF質量分析計のポジティブモード(positive mode)で得られた質量値であることに留意する。
本発明において重み付け係数ベクトル(vector)の符号は、判別スコアが正の場合、陽性と判定され、負の場合は陰性と判定されるよう調整する。主成分分析における因子負荷量ベクトルは、数学的に固有ベクトル(eigenvector)に該当するが、該ベクトルのコードは任意に定めることができる。すなわち、計算された質量イオン別因子負荷量に全体的に-1を乗じて符号を変更するとしても、数学的には同じ固有値問題(eigenvalueproblem)と同等の解とすることができるが、判別スコアが負の場合を陽性と、正の場合を陰性と判定する。本発明では、判別スコアが正の場合、陽性と判定され、負の場合は陰性と判定されるように固有ベクトルの符号を調整したが、本発明の範囲がこれに限定されないことに留意する。
また、本発明において「判別スコア」とは、生物学的試料から抽出した質量スペクトルに対して生物統計学的分析を通じて計算された値であって、これに基づいて、特定の癌の陽性または陰性を判定することができる。判定方法は、計算された判別スコアが特定の基準値よりも大きいかどうかを判断する簡単な方法が用いられることができ、計算された判別スコアを入力し、判定結果を出力とする関数が使用されることができる。
本発明の実施例において判別スコアという用語を特定して使用したが、本発明にて定義する前記判別スコアは、判別レベル(level)、判別値(value)などと様々な形の用語で記載することができる。したがって、本発明にて定義する判別スコアという用語は、辞書の意味の判別スコアという用語に限定されず、本発明の定義にによって判別スコアを意味する前記判別レベルと判別値、またはこれと類似する様々な用語をすべて含むものと解釈されるべきである。
また、本発明において「判別性能」とは、基本的に感度、特異度、陽性的中率、陰性的中率および正確率等の指標を数値で表したものを意味する。また、この指標の関数で計算される値を意味することもある。たとえば、感度、特異度、陽性的中率、陰性的中率および正確率等のそれぞれの値が判別性能で使用することができ、または感度と特異度との和、感度と陽性的中率との和、陰性的中率と正確率との和などの2以上の和が判別性能として使用されることもできる。
以下、実施例を通じて本発明をより詳細に説明する。記述される実施例は、本発明を例示的に説明するためのものであり、本発明の権利範囲が実施例に限定されるものではないことを明らかにしておく。
図7ないし図13は、本発明の望ましい一実施形態に係る癌の診断装置を説明するための図面である。
まず、図7は、本発明の望ましい一実施形態に係る癌の診断装置を示すブロック図であって、図示するように、本発明に係る癌診断装置は、複数の癌患者および非患者事例の生物学的試料から低質量イオンの質量スペクトルを検出する低質量イオン検出部(1000)と、前記低質量イオンの質量スペクトルパターンを比較分析し、癌の診断情報を判定する癌診断部(2000)と、前記癌診断部(2000)から判定された癌の診断情報を出力可能な形式に切り換えて表示するディスプレイ部(3000)を含む。
前記低質量イオン検出部(1000)は、前記生物学的試料から低質量イオンのピーク強度を検出し、前記低質量イオンの質量スペクトルを抽出することができる。また、前記低質量イオン検出部(1000)は、質量分析計を含むことができる。
前記ディスプレイ部(3000)は、モニター画面、携帯端末の液晶画面などのデバイスに前記判定された癌の診断情報を文字、数字、図形などの様々な形に切り換えて表示することができる。
図8は、図7の癌診断部をより詳細に示すブロック図であって、図示するように、前記癌診断部(2000)は、訓練候補集合である前記癌患者および非患者事例の低質量イオンの質量スペクトルをソートする第1の整列手段(2100)と、ソートされた前記質量スペクトルに対して生物統計学的分析を行い、判別スコアを計算する第1の判別スコアの計算手段(2200)と、前記判別スコアに基づいて感度および特異度を計算し、これを基準に第1の訓練集合を選定して低質量イオン別の因子負荷量を計算する因子負荷量計算手段(2300)と、候補条件を満たす候補者低質量のイオンのうち、判別性能をベースにして癌診断用低質量イオンを選択する癌診断用イオン選定手段(2400)と、判別対象生物学的試料の低質量イオンの質量スペクトルを前記第1の訓練集合にソートする第2の整列手段(2500)と、前記判別対象の低質量イオンのピーク強度と前記因子負荷量から判別スコアを計算する第2の判別スコアの計算手段(2600)と、および前記判別スコアに応じて前記判別対象を癌の陽性または陰性と判定する癌判定手段(2700)を含むことができる。
前記因子負荷量を計算する手段(2300)は、前記ソートされた質量スペクトルに対して生物統計学的分析を行い、前記生物統計学的分析の結果をもとに、前記癌患者および非患者事例のうち、訓練条件を満たす訓練事例を第1の訓練集合として選択する第1の訓練集合選択手段(2310)を含むことができ、前記第1の訓練集合から因子負荷量を計算することができる。
前記第1の訓練集合選択手段(2310)は、前記生物統計学的分析の結果に基づく感度が閾値N1以上であり、特異度が閾値N2以上の時の癌患者と非患者事例を前記第1の訓練集合を設定することができる。ここで、前記閾値N1とN2は、1であることが望ましい。
前記癌判定手段(2700)は、前記判別スコアに応じて前記判別対象を癌の陽性または陰性と判定するが、前記判別スコアが基準値Sよりも大きい場合、陽性であると前記判別対象の癌情報を判断し、前記判別スコアが基準値Sよりも小さい場合は陰性であると前記判別対象の癌情報を判断することができる。ここで、前記基準値Sは0であることが望ましい。
前記癌判定手段(2700)は、前記判別対象の生物学的試料を反復測定して検出した複数の前記低質量イオンの質量スペクトルに対して計算された複数の前記判別スコアの平均値で前記判別対象の前記癌情報を判断することができる。
図9は図8の第1の判別スコアの計算手段をさらに詳細に示すブロック図であって、示すように、前記第1の判別スコアの計算手段(2200)は、前記訓練候補集合の前記低質量イオンの質量スペクトルの前記ピーク強度を正規化する正規化モジュール(2210)と、および前記正規化したピーク強度をスケーリングするスケーリング・モジュール(2220)と、および前記スケーリングされたピーク強度に対して、前記生物統計学的分析を行い、前記判別スコアを計算する判別スコアの計算モジュール(2230)を含むことができる。
前記スケーリング・モジュール(2220)は、パレート・スケーリングを実行することができる。前記判別スコアの計算モジュール(2230)は、主成分分析ベースの線形判別分析を用い、前記生物統計学的分析を行うことができる。前記判別スコアの計算モジュール(2230)は、前記主成分分析ベースの線形判別分析によって得られた因子負荷量と前記スケーリングされたピーク強度を一緒に使用し、前記判別スコアを計算することができる。
図10は、図8の第2の判別スコアの計算手段をさらに詳細に示すブロック図であって、図示するように、前記第2の判別スコアの計算手段(2600)は、前記判別対象の前記低質量イオンの質量スペクトルの前記ピーク強度を正規化する正規化モジュール(2610)と、前記正規化したピーク強度をスケーリングするスケーリング・モジュール(2620)と、および前記スケーリングされたピーク強度と前記因子負荷量を通じて前記判別スコアを計算する判別スコアの計算モジュール(2630)を含むことができる。
前記スケーリング・モジュール(2620)は、パレート・スケーリングを実行することができる。前記判別スコアの計算モジュール(2630)は、前記癌診断用低質量イオンの前記スケーリングされたピーク強度と前記因子負荷量を通じて前記判別スコアを計算することができる。
図11は、図8の癌診断用イオン選定手段をさらに詳細に示すブロック図であって、図示するように、前記癌診断用イオン選定手段(2400)は、前記選択された前記第1の訓練集合から候補の条件を満たす候補者低質量イオンを候補イオン集合として選択する候補イオン集合選択手段(2410)と、および前記選択された前記候補イオン集合の前記候補低質量イオンの個別または組み合わせ別判別性能をベースにして癌診断用低質量イオンを最終イオン集合として選択する最終イオン集合選択手段(2420)を含むことができる。
前記最終イオン集合選択手段(2420)の前記判別性能の基準は、前記候補低質量イオンのうち、感度と特異度との和が基準値よりも大きいイオンを選択する、または前記候補低質量イオンで構成される組み合わせ別の感度と特異度との和が比較対象の組み合わせの中、最も大きい組み合わせを選択する第1の基準を含むことができる。
前記最終イオン集合選択手段(2420)の前記判別性能の基準は、前記候補低質量イオンの組み合わせのうち、前記候補低質量イオンの数が比較対象の組み合わせの中、最も小さい組み合わせを選択する第2の基準をさらに含むことができる。
前記最終イオン集合選択手段(2420)の前記判別性能の基準は、前記候補低質量イオンの組み合わせの中、真陽性(truepositive)事例の最小判別スコアと真陰性(true negative)事例の最大判別スコアとの差が比較対象の組み合わせの中、最も大きな組み合わせを選択する第3の基準をさらに含み、前記判別スコアは、前記候補低質量イオンの前記スケーリングされたピーク強度と前記因子負荷量を使用して計算され、癌に対する陽性または陰性を示すことができる。
前記最終イオン集合選択手段(2420)は、前記第1の訓練集合に対し、独立した第2の訓練集合を前記第1の訓練集合に追加された訓練集合を対象に低質量イオン選択過程を進めることができる。
図12は、図11の候補イオン集合選択手段をさらに詳細に示すブロック図であって、図示するように、前記候補イオン集合選択手段(2410)と、前記訓練事例それぞれに対する前記低質量イオンの前記ピーク強度と、前記生物統計学的分析を通じて得られた前記低質量イオン別因子負荷量の積の絶対値が閾値T1よりも大きい第1の低質量イオンを前記訓練の事例別に選択する第1の低質量イオン選択モジュール(2411)を含むことができる。ここで、前記閾値T1は0.1であることが望ましい。
前記候補イオン集合選択手段(2410)は、前記第1の低質量のイオンの中、前記訓練事例の全体の閾値T2パーセント以上の事例において共通に表れる第2の低質量イオンを前記候補イオン集合として選択する候補イオン集合予備選択モジュール(2412)を含むことができる。ここで、前記閾値T2は50であることが望ましい。
前記候補イオン集合選択手段(2410)は、前記第2の低質量イオンを利用し、前記訓練事例別別に、癌の陽性または陰性を表す判別スコアを計算し、前記判別スコアに基づく感度と特異度を計算する感度と特異度計算モジュール(2413)と、および前記感度が閾値N3よりも小さい、または前記特異度が閾値N4よりも小さい場合、前記T1および前記T2のうち、少なくとも一つを変更し、前記過程を繰り返して前記候補イオンの集合を選択する候補イオン集合最終選択モジュール(2414)をさらに含むことができる。ここで、前記閾値N3およびN4は、0.9であることが望ましい。
図13は、図11の最終イオン集合選択手段をさらに詳細に示すブロック図であって、図示するように、前記最終イオン集合選択手段(2420)は、前記候補イオンの集合に含まれた前記候補低質量イオンを前記感度が前記特異度よりも高い高感度低質量イオンを含み、前記高感度低質量イオンを前記感度と前記特異度との和の降順で並べ替えた高感度集合{Sns1、Sns2、Sns3...SnsI}と、前記特異度が前記感度よりも高い高特異度低質量イオンを含み、前記高特異度低質量イオンを前記感度と前記特異度との和の降順で並べ替えた高特異度集合{Spc1、Spc2、Spc3...SpcJ}に区分するイオン区分モジュール(2421)と、前記感度集合で上位階層のL個の前記高感度低質量イオン{Sns1、Sns2、Sns3... SnsL}と前記高特異度の集合で上位階層のL個の前記高特異度低質量のイオン{Spc1、Spc2、Spc3...SpcL}のうち、2つ以上の低質量イオンで構成される候補の組み合わせのうち、前記第1の基準、前記第2の基準および前記第3の基準のうち少なくともひとつ以上による前記判別性能の基準によって選択された組み合わせをバイオ・マーカーグループに選定するバイオ・マーカーグループの予備選定モジュール(2422)と、前記バイオ・マーカーグループと、前記感度集合で上記下位の階層のM個の前記高感度低質量イオンと前記高特異度の集合で下位の階層のM個の前記高特異度低質量イオンのうちの少なくとも一つ以上の複数の低質量イオンを前記バイオ・マーカーグループに追加された候補の組み合わせのうち、前記第1の基準、前記第2の基準および前記第3の基準のうち、少なくとも一つ以上による前記判別性能の基準によって選択された組み合わせを、前記バイオ・マーカーグループに再選定するバイオ・マーカーグループ再選定モジュール(2423)と、および前記高感度集合および前記高特異度集合に下位の階層の低質量イオンが存在しなくなるまで、前記再選択過程を繰り返し、前記バイオ・マーカーグループを最終的に選定するバイオ・マーカーグループ最終選定モジュール(2424)を含むことができる。
前記最終イオン集合選択手段(2420)は、前記候補イオン集合で前記バイオ・マーカーグループ最終選定モジュール(2424)から得られた前記バイオ・マーカーグループに選定完了した組み合わせの低質量イオンを除いた残留候補イオン集合を対象に前記三つのバイオ・マーカーグループの選定過程を繰り返し行い、追加のバイオ・マーカーグループを選定するが、前記高感度集合または前記高特異度の集合に、前記L未満の質量イオンが残るまで、前記追加のバイオ・マーカーグループをさらに選定するバイオ・マーカーグループ追加選定モジュール(2425)と、および前記バイオ・マーカーグループと前記追加のバイオ・マーカーグループのうち、真陽性または真陰性判定の正確率(accuracy)を基準に上位階層のK個のバイオ・マーカーグループの組み合わせの低質量イオンを前記癌診断用低質量イオンと選択する癌診断用低質量イオンの最終選択モジュール(2426)をさらに含むことができる。ここで、前記Lの値は2であり、前記Mの値は1であり、前記Kの値は、1ないし3のいずれかの自然数であることが望ましい。
前記複数の癌患者の事例は、大腸がん患者の事例、乳がん患者の事例および胃がん患者の事例のいずれかの癌患者事例を含むことができる。
2.大腸がんを診断するための癌の診断装置の実施例
図14は、本発明のCRCを診断するための図7の癌診断部をより詳細に示すブロック図である。
図示するように、本発明に係る癌診断部は、訓練候補集合である前記大腸がん患者および非患者事例の低質量イオンの質量スペクトルをソートする第1の整列手段(4100)と、ソートされた前記質量スペクトルについて、生物統計学的分析を行い、判別スコアを計算する第1の判別スコアの計算手段(4200)と、前記判別スコアに応じて、感度および特異度を計算し、これを基準に第1の訓練集合を選定し、低質量イオン別の因子負荷量を計算する因子負荷量計算手段(4300)と、候補条件を満たす候補低質量イオンのうち、判別性能をベースにして大腸がん診断用低質量イオンを選択する大腸がん診断用イオン選定手段(4400)と、 判別対象生物学的試料の低質量イオンの質量スペクトルを前記第1の訓練集合に配置する第2の整列手段(4500)と、前記判別対象の低質量イオンのピーク強度と前記因子負荷量から判別スコアを計算する第2の判別スコアの計算手段(4600)と、および前記判別スコアに応じて前記判別対象を大腸がんの陽性または陰性と判定される大腸がん判定手段(4700)を含むが、前記大腸がん診断用イオン選定手段(4400)は、前記複数の大腸がん患者および非患者の事例を、複数の大腸がん患者の事例と複数の健常者の事例で構成される第1種の判別事例と、前記複数の大腸がん患者の事例と複数の大腸がん以外の癌患者の事例で構成される第2種の判別事例とに区分し、前記第1種の判別事例と前記第2種の判別事例に対して、それぞれ実行され、前記大腸がん診断用低質量イオンが前記第1種の判別事例に対する第1種の大腸がん診断用低質量イオンと前記第2種の判別事例に対する第2種の大腸がん診断用低質量イオンとに区分されるようにする。
このため、低質量イオン検出部(1000)は、複数の大腸がん患者および非患者事例の生物学的試料から質量分析計を用い、前記低質量イオンのピーク強度を検出し、前記低質量イオンの質量スペクトルを抽出する。
併せて、前記CRCを診断するための癌診断部のさらに詳しい構成要素は、前述した前記癌診断装置における図9ないし図13を通じて説明した構成要素と大同小異のため、ここでこれに対する細かく構成の図示および説明は省略するものとし、以下、本発明の一実施例について詳細に説明する。
本発明の癌診断装置は、図14に示すように、ハードウェアで構成される、またはプログラム構造によるソフトウェアで構成されることもでき、以下では、一例として、添付のフローチャートの処理を参照して、ソフトウェアで構成されたCRCを診断するための癌診断装置について詳細に説明するものとする。
(2-1)試料の準備 - 血清収集対象
前述した表101の133名のCRC患者群、前述した表102の153名の正常対照群、表105の111名のBRC患者群、表106の36名の非ホジキンリンパ腫(non-Hodgkinlymphoma、NHL)患者および表107の29名のGC患者からの血清を収集した。
また、この462名を集合A1とし、後述するようにその部分集合A0に第1の訓練集合を構成し、該第1の訓練集合に対する生物統計学的分析を通し、質量イオン別の重み付け(因子負荷量)を計算し、予備判別式を獲得した。また、該集合A1のほか、表108の144名のCRC患者群、表109の50名の正常対照群、表110の25名のBRC患者群、表111の15名のNHL患者群および表112の57名のGC患者群を集合A2(第2の訓練集合)にして訓練集合を拡張した。すなわち、予備判別式を構成する低質量イオンの予備候補群から、後述する方法応じて、CRC診断用低質量イオンを確認する時は互いに独立した集合である集合A1と集合A2との和の集合、すなわち、集合Aを訓練集合として使用した。
また、集合Aと独立した表113の143名のCRC患者群、表114の50名の正常対照群、表115の25名のBRC患者群、表116の15名のNHL患者群、表117の55名のGC患者群、表118の25名の卵巣癌(ovariancancer、OVC)患者群、表119の19名のTisまたはAdvancedAdenoma(TA)患者群を集合Bとし、検証集合を構成した。 OVC患者群とTA患者群は、質量イオン別の重み付けを求める時やCRC診断用低質量イオンを確認する時、全く反映されない患者群であって、本発明にて構成した判別式でこの患者群がどのように判別されるか察し見るため、含ませた。
(2-2)試料の準備 - 血清の準備および質量スペクトル測定
4倍の大きさのメタノール/クロロホルム(2:1、v/v)を25μlの血清と共に激しく混合した後の10分間、室温で培養した。混合物は、4℃で10分間6000×gで遠心分離した。得られた上清を1時間濃縮機(concentrator)で完全に乾燥させ、30分間攪拌機(vortexer)で30μlの50%アセトニトリル(acetonitrile)/0.1%トリフルオロ酢酸(trifluoroacetic acid、TFA)で溶解させた。
メタノール/クロロホルム抽出物を50%アセトニトリル/0.1% TFA中で α - シアノ-4-ヒドロキシケイ皮酸(α-cyano-4-hydroxycinnamic acid)溶液と混合し(1:12、v/v)、1μlの混合物をMALDI-ターゲットプレート(target plate)に位置させた。 CRC患者および非患者の血清抽出物の質量スペクトルをProteomics Analyzer(Applied Biosystems、Foster City、CA、USA)を使用して測定した。
一個の試料に対し、質量スペクトルデータは、20回反復測定されたスペクトルの平均に抽出される。すべての個々の試料の質量値の区間は、最大質量値が約2500m/zになるように調整した。実験的エラーを最小限に抑えるため、焦点質量(focusmass)、レーザー強度(laser intensity)、ターゲットプレート、データ収集時間(dataacquisitiontime)を含む様々な要素を確認した。
望ましい焦点質量およびレーザー強度として、500m/zおよび5000がそれぞれ固定して使用された。全ての試料は、固定された焦点質量およびレーザーの強さと共に、他の抽出および他のデータ収集時間の下で少なくとも5回反復測定した。質量イオン別の重み付けを計算した集合A1の場合は、さらにもう一度測定した。
したがって、低質量イオン検出手段(4000)は、MALDI-TOF質量分析計を用いて、前記ような過程を経て、血清試料から低質量イオンの質量スペクトルを抽出することができる。
(2-3)判別戦略
構成した判別式がCRC特異的な式となるためには、CRC患者群は判別式により正常対照群ばかりでなく、他の癌患者群と区分されるべきである。本実施例においては、他の癌患者群にBRC患者群、NHL患者群およびGC患者群を使用したい。一つの判別式でCRC患者群と非患者群(正常対照群、BRC患者群、NHL患者群およびGC患者群)を区分することができるかどうか、従来の主成分分析ベースの線形判別分析方法を適用した結果を表120に示した。特に、通常の対照群の特異度が69.28%と低いことを確認することができた。このことから、一つの判別式では、CRC患者群と非患者群とを区分することができないことを知ることができる。
図2および表104から確認されるように、CRC患者群と正常対照群については、優れた判別結果を得ることができたため、CRC患者群と他の癌患者群とが区分できるかどうか察しみ、その結果を表121に示した。 NHL患者群の特異度が83.33%と、他の癌患者群に比べて相対的に低いもののおおよそ優れた判別結果が見られたと判断される。
したがって、CRC患者群と非患者群とを区分するのは、CRC患者群と正常対照群とを区分する第1種の判別式と、CRC患者と他の癌患者とを区分する第2種の判別式を用い、両方の判別式によっていずれもCRCと判別された場合をCRC患者であると判定し、両方の判別式のいずれかの判別方法でCRC以外の患者であると判別された場合には、CRC非患者として判定する方法を用いて実行することができる。
(2-4)第1の訓練集合A0の選定と質量のイオン別の重み付け計算
表104および表121に示す判別結果が極めて優れているものの、感度と特異度がすべて100%ではない。本発明では、まず、感度と特異度が所定の値を有する第1の訓練集合A0を選定し、該第1の訓練集合A0について質量イオン別の重み付けを計算したが、本実施例では、その所定の値は、感度と特異度ともに100%である。
図15を参照して、感度と特異度が所定の値を有する第1の訓練集合A0を選定する方法について説明する。
第1の判別スコアの計算手段(4200)は、図示された図15のD111ないしD114のステップをを通じて、集合A1内のCRC患者群および正常対照群の低質量イオンの質量スペクトルをソートしてインポートし(D111)、インポートしたピーク強度を正規化し(D112)、正規化したピーク強度をパレート・スケーリングし(D113)、パレート・スケーリングされたピーク強度に対して生物統計学的分析を行い、判別スコアを計算した(D114)。
多様な生物統計学的分析方法のうちのいずれかを選択し、判別スコアを計算することができるが、本実施例では、主成分分析ベースの線形判別分析を行った。判別スコアを通じて感度と特異度を計算し(D115)、その結果は、前述した図2および表104の通りである。
次に、感度の閾値CN1と特異度の閾値CN2を設定し(D116)、感度や特異度がそれぞれの閾値よりも小さい場合、偽陽性(false positive)または偽陰性(false negative)の事例を除外した(D117)。
本実施例においては、感度の閾値CN1と特異度の閾値CN2をいずれも1に設定することにより、感度と特異度ともに100%である第1の訓練集合A0を見出した。すなわち、表104に示す偽陽性である2つの事例と偽陰性の2つの事例をすべて排除し、排除した集合に対して再びD111ないしD115の手順を実行した。排除した集合にについてD111ないしD115の手順を再度実行しても、すぐに感度と特異度ともに100%にはならず、D111ないしD117の手順を数回繰り返すことによって初めて感度と特異度が共に100%である第1の訓練集合A0を見出すことができた(D118)。
CRC患者群と正常対照群を区分する第1種の判別式の場合には、8つの偽陰性、9つの偽陽性の事例を排除した後、CRC患者群と他の癌患者群とを区分する第2種の判別式の場合には、5つの偽陰性、10の偽陽性の事例(BRC1個、NHL8個およびGC1個)を排除した後、感度と特異度が共に100%である判別結果に到達した。この過程によって感度と特異度が共に100%である判別結果を与える質量イオン別の因子負荷量を導出することができる(D119)。
前記ような一連の過程は、前記因子負荷量を計算する手段(4300)を通じて実行することができる。
(2-5)判別式の適用
構成した判別式を判別対象試料に適用する過程を説明すると、次の通りである。
まず、MarkerViewTMには、これと類似する目的で使用することができる機能がある。すなわち、一緒にインポートした試料データの中から、いくつかの試料のみを対象にして主成分分析ベース線形判別分析を適用することができ、このように構成された判別式で、残りの試料を判別することができる。この機能を利用すれば、第1の訓練集合と判別対象試料を一緒にインポートした後、第1の訓練集合だけを選択し、主成分分析ベースの線形判別分析を実行し、判別対象試料がどのように判定されるか知ることができる。
しかし、MarkerViewTMのインポート過程において、ピークをアライメントする機能(peak alignment)が実行されるが、第1の訓練集合に合わせて判別対象試料のピークをアライメントする機能がないため、第1の訓練集合だけをインポートしたときのピーク表(peak table、m/z列と試料別のピーク強度列からなる行列)と、第1の訓練集合判別対象試料を一緒にインポートしたときに生成されるピーク表の第1の訓練集合部分は同じではない。ピーク強度行列の部分も異なり、同じピーク強度の行に対応するm/zの値も常に同じではない。したがって、第1の訓練集合から作成された判別式を判別対象試料に適用して判別スコアを計算するためには、第1の訓練集合と判別対象試料を一緒にインポートしたときに生成されるピークの表を第1の訓練集合だけをインポートしたときのピークの表に再調整(realignment)する作業が先行されなければならない。
複数の判別対象試料を第1の訓練集合と共にインポートする場合、ソートがずれる程度が一層酷くなる。従って、本実施例においては、すべての判別対象試料に対して第1の訓練集合に1個の判別対象試料を追加してインポートした後、再調整、正規化、パレート・スケーリングを行った。
図16を参照により詳細に説明すると、次の通りである。
まず、判別対象試料の低質量イオンの質量スペクトルを第1の訓練集合にソートしてインポートする手順を実行する(D211)。
ただし、本実施例においては、MarkerViewTMには、判別対象試料を第1の訓練集合にソートしてインポートする機能がないため、前述したように、判別対象試料の低質量イオンの質量スペクトルを第1の訓練集合で共にインポートした後に、作成されるピーク表を第1の訓練集合だけをインポートしたときに作成されるピークの表に再調整するプログラムを作成し、第1の訓練集合に配置された判別対象試料の低質量イオンの質量スペクトルを抽出した。しかしながら、再調整なく最初から判別対象試料を第1の訓練集合にソートしてインポートすることがより望ましく、これもやはりプログラムを作成して具現可能である。
次に、インポートしたピーク強度を正規化し(D212)、正規化したピーク強度をパレート・スケーリングした(D213)。
次に、パレート・スケーリングした低質量イオンのピーク強度と、第1の訓練集合に対する主成分分析ベースの線形判別分析によって得られた質量イオン別の因子負荷量から判別スコアを計算した(D214)。
このように計算された判別スコアが基準値CSよりも大きいかどうかを判断し(D15)、基準値CSよりも大きい場合、陽性と判定し(D216)、基準値CSよりも小さい場合、陰性と判定した(D217)。本実施例においては、基準値CSは0であることが望ましい。
前記ような一連の過程は、前記第2の整列手段(4500)、第2の判別スコア計算手段(4600)と大腸がん判定手段(4700)を通じて行うことができる。
第1種の判別式のために集合A1にて第1の訓練集合A01を構成するときに除外された8名のCRC患者群および9名の正常対照群試料と第2種の判別式のために集合A1にて第1の訓練集合A02を構成するときに除外されていた5名のCRC患者群、1名のBRC患者群、8名のNHL患者群および1名のGC患者群の試料について、前記(2-4)項で計算された質量イオン別の因子負荷量を適用して判別スコアを計算してみた。第1の訓練集合A01とA02を構成するときに、既に除外された事例だったため、偽陽性または偽陰性の事例として判別されると予想したが、計算の結果が予想通りに偽陽性または偽陰性の事例であると判別された。前記(2-4)項で計算した質量イオン別の因子負荷量を適用し、集合A1を判別した結果を図17と図18に示したが、図17は、第1種の判別式、図18は、第2種の判別式の結果を示す。
(2-6)予備判別式の構成
前述した従来技術においては、主成分分析ベースの線形判別分析で考慮したすべての質量イオンを使用して判別スコアを計算し、その判別スコアに基づいてCRC患者かどうかを判定したが、本発明においては、ロバストな判別性能を示す判別式を導き出すために、まず、判別スコアに大きく寄与する質量イオンのみが使用する予備判別式を構成した。「予備判別式」とは、本発明に基づいて、最終的に求めようとする判別式を導出する中間段階としての判別式を指し、これを構成する低質量イオンは、最終的な判別式を構成するCRC診断用低質量イオンの「予備候補群」となる。
図19の手順を通し、10,000個の質量のイオンのうち、判別スコアに大きな影響を与える所定の質量のイオンを選定した。本実施例においては、第1種の判別式の場合、選定された所定の質量イオンの数は278個であり、第2種の判別式の場合は383個であった。
表103と共に前述したように、インポートの条件としてピークの最大数を10,000個とし、十分に多くの試料を一緒にインポートしたため、MarkerViewTMの主成分分析ベースの線形判別分析の方法を使用して構成した判別式は10,000個の項で構成されている。しかしながら、CRC患者および非患者を区分するにあたり、10,000個の項がすべて同等の重要性をわけではないため、図19の手順に従って、10,000個の質量のイオンのうち、判別スコアに大きな影響を与える質量イオンを2段階に分けて選定した。このステップは、10,000個の質量のイオンのうち、CRC患者と非患者とを区分するにあたり、不要な質量イオンを除去する過程とすることができる。
10,000個の項の値のうち、ピーク強度と質量イオン別の因子負荷量の積の絶対値が閾値CT1よりも大きい質量イオンを事例別に一次的に選択した(D121)。本実施例においては閾値CT1は、0.1であることが望ましい。
次に、事例別に一次的に選択された質量のイオンの中から第1の訓練集合全体の事例の中、境界値CT2パーセント以上の事例において共通に表れる質量イオンを二次的に選択した(D122)。本実施例においては、閾値CT2は、50であることが望ましい。すなわち、第1種の判別式の場合を例に挙げて説明すると、第1の訓練集合である269個の事例のうち、少なくとも135個以上の事例において共通に登場する質量イオンだけで予備判別式を構成した。
前記ような過程を経て、選択した質量イオンだけで再度判別スコアを計算し、それに応じて感度と特異度を計算した(D123)。再度、感度の閾値CN3と特異度の閾値CN4を設定し(D124)、感度や特異度がそれぞれの閾値よりも小さい場合、D121段階で使用された閾値CT1および/またはD122段階で使用された閾値CT2を変更して(D125)D121ないしD124のステップを繰り返した。本実施例においては、感度の閾値CN3と特異度の閾値CN4が、それぞれ0.9であることが望ましい。
このような段階を経て、選択した質量のイオンでCRC診断用低質量イオンの予備候補群を構成したが(D126)、本実施例においては、10,000個の質量のイオンの中、第1種の判別式の場合、278個、第2種の判別式の場合、383個の質量のイオンが選択された。表122および表123に、第1種の予備判別式と第2種の予備判別式に第1の訓練集合A01とA02を判別した結果を示したが、感度と特異度など判別性能が100%からわずかに低くなったが、全体の質量のイオン個数の3〜4%にもならない質量のイオンだけで計算した結果にもかかわらず、全体の質量のイオンを使用した時に比して匹敵する優れた判別結果を示すことが確認できる。
また、予備判別式において集合A1を判別した結果を図20と図21に示すが、図20は、第1種の予備判別式、図21は、第2種の予備判別式の結果を示す。計算に使用される質量イオンの数は急激に減少したことに比して判別スコアの範囲はそうではないことを知ることができるが、このことからCRC患者と非患者とを区分するにあたり、10,000個の質量イオンの全てが必要という訳ではないことが確認できる。
前記ような一連の過程は、前記候補イオン集合選択手段を含む大腸がん診断用イオン選定手段(4400)を通じて実行することができる。
(2-7)最終判別式の構成
予備判別式を構成する過程においては、インポートされた10,000個の質量のイオンのうち、判別スコアに数値的に大きな寄与をする質量イオンを抽出した。しかしながら、質量イオンの中には、第1の訓練集合A0では、問題を発生させなかったが、同一のCRC患者群および非患者群の血清について再度測定した質量スペクトルの判別または新しいCRC患者群および非患者群の判別において、潜在的に判別性能を低下させることができる質量イオンも含まれているため、これらも積極的に除去するステップが必要であるが、最終判別式の構成過程においては、この段階を経て、最終的にCRC診断用低質量イオンを決定する。
判別式のロバスト性を検証するため、まず集合A1に対し5回反復測定実験をし、これとは独立しており、また互いに独立した集合A2および集合Bに対しても5回反復測定実験を行った。質量スペクトルの反復測定過程では、前記した説明の血清を凍結・凍解させる過程および血清を新たにメタノール/クロロホルムと混合して抽出する過程が介入されていることの外に、レーザービーム(laserbeam)を用いた気化(vaporization)、脱着(desorption)、イオン化(ionization)過程なども繰り返し実験した場合、同様に進行するとは限らず、また、まだ明らかにされていない様々な原因からの外乱も介入される余地が多い。したがって、反復測定された個々の質量スペクトルの判別スコアにある程度のばらつきが発生するのは排除することができないため、本実施例においては、5回反復測定した試料について、平均判別スコアを計算して判定を実施した。
表124は、従来技術であるMarkerViewTMの主成分分析ベースの線形判別分析の結果である10,000個の項の判別式で集合AとBを判別した結果を示し、表125は、278個の項を有する第1種の予備判別式383個の項を有する第2種の予備判別式で集合AとBを判別した結果を示す。表のCRCLOME(colorectal cancer Low mass ion discriminantequation)1は、第1種の判別式、CRC LOME 2は、第2種の判別式を表し、その後ろについている数字は、判別式に含まれている低質量イオンの数を意味する。また、表126には、検証集合である集合Bのみ判別性能を示したが、括弧内の数字は、TA患者群をCRC患者群に含まれていたときの判別性能である。 TA患者群は、今後CRC患者群に発展する可能性の高い患者であって、TA患者群をCRC患者群と判別することは早期発見という検診の目的のためにはむしろ望ましい判別結果とすることができる。
10,000個の質量のイオンで構成された判別式は、第1の訓練集合A0にて完璧な判別性能が見られたにもかかわらず、集合Bにおいて、特に感度が低く表示されることを表126で確認することができる。第1種および第2種の予備判別式も第1の訓練集合A0にては極めて優れた判別性能(表122、123)が見られたにもかかわらず、集合Bにおける判別結果には満足できるものでなかった。
したがって、本発明の望ましい一実施例では、予備判別式をロバスト判別式に改善すべく図22の手順を実行した。
まず、予備候補群の質量イオンを、高感度の集合と高特異度の集合とに区分した(D131)。ここでは、高感度集合の質量イオンは、質量イオン別の感度が特異度よりも高い質量イオンであり、高特異度集合の質量イオンは、その反対である。
次に、高感度集合の質量のイオンと高特異度集合の質量イオンをそれぞれ質量イオン別の感度と特異度との和の降順で並べ替えた後{Sns1、Sns2、Sns3...SnsI}{Spc1、Spc2、Spc3... SpcJ}、それぞれの上位階層の2つの質量イオンを取り{Sns1、Sns2、Spc1、Spc2}、4つの質量イオンのうちの2つ以上の質量イオンで構成することができる組合(11件)のうち、最高の性能の組み合わせをバイオ・マーカーグループ(biomarker 87group)に選定した(D132)。
ここで、最高性能の組み合わせであるかどうかは、次の基準に従って、客観的で普遍的に選択することができる。次の基準は、重要度の順に従う。
基準1)感度と特異度との和が大きい組み合わせが、より性能が高い。
基準2)質量イオンの数が小さい組み合わせが、より性能が高い。
基準3)真陽性事例のうち、最小判別スコアと真陰性事例のうち、最大判別スコアの差が大きい組み合わせが、より性能が高い。
次に、高感度の集合と特異度集合それぞれの次の上位階層の1つの質量イオン{Sns3、Spc3}をさらにとり、前記バイオ・マーカーのグループおよび前記バイオ・マーカーのグループに前記質量のイオン{Sns3、Spc3}のいずれか一つ以上を組み合わせた4つの集合{biomarker group}、{biomarker group、Sns3}、{biomarker group、Spc3}、{biomarker group、Sns3、Spc3}のうち、最高の性能の集合を再バイオ・マーカーのグループに選定する(D133)。
これらの過程は、高感度集合、および高特異度集合のいずれにも追加する質量イオンがなくなるまで、繰り返される(D134)。
すなわち、高感度集合および高特異度集合のいずれにも追加する質量イオンがあるときは、前記ような方式(D133)を繰り返し、高感度の集合と高特異度の集合のうちのいずれか一つに追加する質量イオンが残っていない場合には、残りの質量イオンがある集合のうち、その次の上位階層の1つの質量のイオン{SnsiまたはSpcj}を追加でさらにとり、前記バイオ・マーカーのグループおよび前記バイオ・マーカーのグループに前記質量イオン{SnsiまたはSpcj}を組み合わせた2つの集合{biomarker group}、{biomarker group、SnsiまたはSpcj}のうち、最高性能の集合を再びバイオ・マーカーのグループに選定する。
このような過程は、高感度集合と高特異度集合のうち、質量イオンが残った集合の質量イオンが残らなくなるまで繰り返され、高感度の集合と特異度集合のすべての残りの質量イオンが存在しない場合のバイオ・マーカーの組み合わせがバイオ・マーカーのグループ1(CG)となる(D135)。
予備候補群からバイオ・マーカーのグループ1(CG)を除き(D136)、残りの質量のイオンに再び高感度の集合と高特異度の集合を構成し、前記手順を繰り返す。この過程は、高感度の集合と特異度の集合のいずれかの集合が二つ未満の質量イオンのみを有するまで繰り返される(D137)。
前記反復過程を通じて得られたバイオ・マーカーのグループ1、2、...のうち、正確率の順にCKのバイオ・マーカーのグループを組み合わせ、最終バイオ・マーカーのグループを形成する。ここで正確率とは、事例全体の中から真陽性および真陰性の事例の割合を意味する。本実施例においては、CKは1ないし3の間の自然数であることが望ましい(D138)。
したがって、前記最終バイオ・マーカーのグループの質量のイオンがCRC診断用低質量イオンに決定される(D139)。
集合A1において、さらに正確には、その部分の集合であるA0から質量イオンの予備候補群を選定したが、予備候補群から最終バイオ・マーカーのグループを決定するときに、過剰適合(overfitting)の問題を解決するため、集合A1に独立の集合A2も追加して訓練集合を拡張した。
前記過程をCRC患者群と正常対照群を区分するための試料を対象に実行した結果、第1種のCRC診断用低質量イオンで104個が選択され、CRC患者群と他の癌患者群とを区分するための試料を対象に実行した結果、第2種のCRC診断用低質量イオンで23個が選択された。第1種および第2種のCRC診断用低質量イオンの質量値は、表127および128に示した。このような低質量イオンを「第1種のCRC診断用低質量イオン」および「第2種のCRC診断用低質量イオン」と称し、これを用いて、最終的に求めた本発明に係る判別式を「第1種のCRC診断用最終判別式」および「第2種のCRC診断用最終判別式」と称する。
表127において、1465.6184、1466.6096、1467.5969、2450.9701、2451.9662、2452.9546m/zは、フィブリノーゲンα鎖(fibrinogen alpha chain)とトランスサイレチン(transthyretin)に同定された。
前記ような一連の過程は、前記最終イオン集合の選択手段を含む大腸がん診断用イオン選定手段(4400)を通じて実行することができる。
(2-8)最終決定式の適用および分析
集合Bに対して第1種および第2種のCRC診断用低質量イオンを用いた第1種および第2種のCRC診断用最終判別式を図16の方法に従って適用すると、その判定結果を獲得することができる。
最終判別式で判定した結果を図23、図24、および表126、表129に示した。図23、図24は、5回判別スコアの平均を判別スコアで判定した結果を示すが、図23は、集合A、図24は、集合Bの判定結果を示す。
検証集合の集合Bの場合、感度、特異度、陽性的中率、陰性的中率がすべて85%以上であることを確認することができる。また、TA患者群をCRC患者群に含まれば、判別性能はすべて90%以上になり、極めて優れた判別結果を示すことがわかる。
表130は、分析した試料中、従来のFOBT分析が実施された場合の判別性能と本発明の判別性能を比較して示している。検証集合のうち、CRC患者群96個の試料と正常対照群49個の試料のFOBT結果は、特異度は100%であったが、感度が50%しかならなかった。
本実施例では、一般的に知られているFOBTの感度である60〜85%に満たない結果を得た。一般的なFOBTの判別性能と比較しても、本発明は、特異度の面では、FOBTと匹敵するに値し、感度の観点では、差別的に優れた結果を示すことが分かるが、これは本発明の優れた判別性能を証明する。訓練集合でも類似する結果を得ることができるが、訓練集合と検証集合の両方のFOBT判別結果および本発明に係る判別結果を表131に示した。
本発明に係る判別結果の再現性を確認するため、検証集合のうち、通常の対照群13個、CRC患者群35個、BRC患者群7個、胃がん患者群14個、OVC患者群7個、TA患者群5個の試料に対しても同じ手順を繰り返したが、その結果を表132に示した。判別結果が覆される場合は、TA患者群に集中されるが、TA中、Tisは癌に分類されたり、分類されなかったりするなど、臨床的にも混乱があるが、本発明に係る判別結果からも混乱の結果を表したTA患者群を除けば、90%以上の再現率を示すことを確認することができるが、これは本発明の優れた判別性能を証明する。
図25aおよび図25bは、それぞれ第1種のCRC診断のための低質量イオンのうち1465.6184m/zと2450.9701m/zを同定した結果を示す。二つの低質量イオンの両方を構成する同位体の数に応じて、約1m/z程度の質量値の差が発生する同一物質の質量ピーク群の形態を示している。これは、質量分析計で表示されるタンパク質またはペプチド特有の質量ピーク面である。
図25aおよび図25bの左上の図は、前記二つの低質量イオンのそれぞれの質量スペクトルを示している。赤い線で表示されたスペクトルは、CRC患者群血清抽出物からのピーク強度を示し、青い線で表示されたスペクトルは、正常対照群で得られたものである。1465.6184m/zの場合、CRC患者群でより高いピーク強度を示す一方、2450.9701m/zは、逆にCRC患者でより低いピーク強度を示した。図25aおよび図25bの右上の図は、前記二つの低質量イオンのMS/MS分析スペクトルを示し、図25aおよび図25b内の表と左下の図は、1465.6184m/zと2450.9701m/zのイオン物質は、MS/MS分析を介して、それぞれフィブリノゲンアルファ鎖とトランスチレチン蛋白質に同定されたことを示す。
フィブリノゲンアルファ鎖に該当する低質量イオン1465.6184m/zのピーク強度がCRC患者群で高かった定性的な結果に相当し、定量的に測定してみたところ、CRC患者の血液中のフィブリノゲンの数値が健常者に比べて高く、病気が進むにつれ、高かった(表133を参照)。
一方、トランスチレチンに対応する低質量イオン2450.9701m/zのピーク強度がCRC患者群で低かった定性的な結果に相当し、定量的に測定してみたところ、CRC患者の血液中のトランスチレチンの数値が健常者に比べて低かった(表134を参照)。平均±標準偏差の形式で要約すると、CRC患者群160.39±62.41ng/mL、正常対照群171.19±30.86ng/mLであった。
本発明を用いて血清の低質量イオン質量スペクトルを分析し、CRC患者と非患者を高い判別性能を持って判定することができた。
3.乳がんを診断するための癌診断装置の実施例
図26は、本発明のBRC診断用の図7の癌診断部をより詳細に示したブロック図である。
図示されたように、本発明に係る癌診断部は、訓練候補集合である前記乳がん患者および非患者事例の低質量イオン質量スペクトルをソートする第1の整列手段(5100)と、ソートされた前記質量スペクトルについて、生物統計学的分析を実行し、判別スコアを計算する第1の判別スコア計算手段(5200)と、前記判別スコアに応じて、感度および特異度を計算し、これを基準に第1の訓練集合を選定して低質量イオン別の因子負荷量を計算する因子負荷量計算手段(5300)と、候補条件を満たす候補低質量のイオンの中で判別性能をベースにして乳がん診断用低質量イオンを選択する乳がん診断用イオン選定手段(5400)と、判別対象生物学的試料の低質量イオン質量スペクトルを前記第1の訓練集合に配置する第2の整列手段(5500)と、前記判別対象の低質量イオンのピーク強度と前記因子負荷量から判別スコアを計算する第2の判別スコア計算手段(5600)と、前記判別スコアに応じて前記判別対象を乳がんの陽性または陰性と判定する乳がん判定手段(5700)を含むが、前記乳がん診断用イオン選定手段(5400)は、前記複数の乳がん患者および非患者事例を第1種の判別事例で構成する、または前記複数の乳がん患者および非患者の事例を、複数の乳がん患者の事例と複数の健常者の事例で構成されている第2種の判別事例と、前記複数の乳がん患者の事例と複数の乳がん以外のがん患者の事例で構成されている第3種の判別事例に区分し、前記第1種の判別事例と、前記第2種の判別事例および前記第3種の判別事例に対してそれぞれ行われ、前記乳がん診断用低質量イオンが前記第1種の判別事例に対する第1種の乳がん診断用低質量イオンと、前記第2種の判別事例に対する第2種の乳がん診断用低質量のイオン、および前記第3種の判別事例に対する第3種の乳がん診断用低質量イオンとに区分されることを特徴とする。
このため、低質量イオン検出部(1000)は、複数の乳がん患者および非患者事例の生物学的試料から質量分析計を用いて、前記低質量イオンのピーク強度を検出して前記低質量イオンの質量スペクトルを抽出する。
さらに、前記BRC診断用の癌診断部のさらに細かい構成要素は、前述した前記癌診断装置での図9〜図13により説明した構成要素と大同小異のため、ここでこれに対する細かい構成の図示および説明は省略し、以下、本発明の一実施例について詳細に説明する。本発明の癌診断装置は、図26に示すように、ハードウェアで構成されるか、またはプログラム構造によるソフトウェアで構成され得、以下では、一例として、添付されたフローチャートの過程を参照して、ソフトウェアで構成されたBRC診断用の癌診断装置を詳細に説明する。
(3-1)試料の準備 - 血清収集対象
前述した表201の54人のBRC患者群、前述した表202の49人の正常対照群、表205の34人のCRC患者群、表206の16人のGC患者群および表207の12人非ホジキンリンパ腫(non-Hodgkin lymphoma、NHL)患者群から血清を収集した。
また、この165人を集合C1とし、後述するように、その部分集合C0に第1の訓練集合を構成し、その第1の訓練集合に対する生物統計学的分析を通し、質量イオン別の重み付け(因子負荷量)を計算し、予備判別式を得た。また、この集合C1のほか、表208の54人のBRC患者群、表209の46人の正常対照群、表210の29人のCRC患者群、表211の15人のGC患者群および表212の7人のNHL患者群を集合C2(第2の訓練集合)として訓練集合を拡張した。すなわち、予備判別式を構成する低質量イオンの予備候補群から後述する方法に応じて、BRCを診断用低質量イオンを確認する時は、互いに独立した集合である集合C1と集合C2との和の集合、すなわち集合Cを訓練集合として使用した。
また、集合Cと独立した表213の53人のBRC患者群、表214の46人の正常対照群、表215の88人のCRC患者群、表216の11人のGC患者群、表217の5人のNHL患者群、表218の25人の卵巣がん(ovariancancer、OVC)患者群を集合Dとし、検証集合を構成した。OVC患者群は、質量イオン別の重み付けを求める時やBRC診断用低質量イオンを確認する時、全く反映されない患者群であって、本発明にて構成した判別式でこの患者群がどのように判別されるか察し見るため、含ませた。
(3-2)試料の準備 - 血清の準備および質量スペクトル測定
4倍の大きさのメタノール/クロロホルム(2:1、v/v)を25μlの血清と共に激しく混合した後の10分間、室温で培養した。混合物は、4℃で10分間6000×gで遠心分離した。得られた上清液を1時間濃縮機(concentrator)で完全に乾燥させ、30分間攪拌機(vortexer)で30μlの50%アセトニトリル(acetonitrile)/0.1%トリフルオロ酢酸(trifluoroacetic acid、TFA)で溶解させた。
メタノール/クロロホルム抽出物を50%アセトニトリル/0.1% TFA内でアルファ - シアノ-4-ヒドロキシケイ皮酸(α-cyano-4-hydroxycinnamic acid)溶液と混合し(1:12、v /v)、1μlの混合物をMALDI-ターゲットプレート(target plate)に位置させた。BRC患者および非患者血清抽出物の質量スペクトルをProteomic sAnalyzer(Applied Biosystems、Foster City、CA、USA)を用いて測定した。
一つの試料について質量スペクトルデータは、20回反復測定されたスペクトルの平均に抽出される。すべての個々の試料の質量値区間は、最大質量値が約2500m/zとなるように調整した。実験的エラーを最小限に抑えるために、焦点質量(focusmass)、レーザー強度(laser intensity)、ターゲットプレート、データ収集時刻(dataacquisitiontime)を含む様々な要素を確認した。
好ましい焦点質量およびレーザー強度として500 m/zおよび5000がそれぞれ固定して使用された。全ての試料は、固定された焦点質量およびレーザーの強さと共に、他の抽出および他のデータ収集時刻の下で少なくとも5回反復測定した。質量イオン別の重み付けを計算した集合C1の場合は、さらにもう一度測定した。
したがって、低質量イオン検出手段(5000)は、MALDI-TOF質量分析計を用いて、前記ような過程を経て、血清試料から低質量イオン質量スペクトルを抽出することができる。
(3-3)判別戦略
構成した判別式がBRC特異的な式となるためには、BRC患者群は判別式により正常対照群ばかりでなく、他のがん患者と区別されるべきである。本実施例においては、他のがん患者群としてCRC患者群、GC患者群およびNHL患者群を使用したい。一つの判別式でBRC患者群と非患者群(正常対照群、CRC患者群、GC群、およびNHL患者群)を区分することができるかどうか、従来の主成分分析ベースの線形判別分析方法を適用した結果を表219に示した。表204のように完璧な判別結果ではないが、概ね80%以上の優れた判別性能を示すことを確認することができるが、これにより一つの判別式でBRC患者群と非患者群を区分することができると判断される。
図4および表204から分かるように、BRC患者群と正常対照群に対しては、完璧な判別結果を得ることができたので、BRC患者群と他のがん患者群とが区分できるかどうか察しみ、その結果を表220に示した。偽陰性の事例はなく、偽陽性事例も一つだけ表示されるなど、極めて優れた判別結果を得ることができた。
したがって、BRC患者群と非患者群を区分することは一つの判別式を使用する方法と、二つの判別式を使用する方法とを採用することができるが、実施例では二つの場合を説明する。BRC患者群と非患者群を一つの式に区分する場合、この式を第1種の判別式と称する。BRC患者群と正常対照群を区分する第2種の判別式とBRC患者群と他の癌患者群を区分する第3種の判別式を用いる場合、BRC患者群と非患者群を区分するのはこの二つの判別式によりすべてBRCと判別された場合をBRC患者と判定し、両方の判別式のいずれかの判別式でBRC非患者と判別された場合には、BRC非患者と判定する方法を通じて行われることができる。
(3-4)第1の訓練集合C0の選定および質量イオン別の重み付けの計算
表219および表220に示した判別結果が優れているものの、感度と特異度ともに100%ではない。本発明では、まず、感度と特異度が所定の値を持つ第1の訓練集合C0を選定し、この第1の訓練集合C0に対して質量イオン別の重み付けを計算したが、本実施例においては、その所定の値は、感度と特異度とも100%である。
図27を参照して、感度と特異度が所定の値を有する第1の訓練集合C0を選定する方法について説明する。
第1の判別スコア計算手段(5200)は、図示された図27のE111〜E114のステップを通じて、集合C1内のBRC患者群および非患者群の低質量イオン質量スペクトルをソートしてインポートし(E111)、インポートしたピーク強度を正規化し(E112)、正規化したピーク強度をパレート・スケーリングし(E113)、パレート・スケーリングしたピーク強度に対して生物統計学的分析を実行し、判別スコアを計算した(E114)。
多様な生物統計学的分析方法のいずれかを選択して判別スコアを計算することができるが、本実施例においては、主成分分析ベースの線形判別分析を行った。判別スコアに応じて感度および特異度を計算し(E115)、その結果は、前述した表219のとおりである。
次に、感度の閾値BN1と特異度の閾値BN2を設定して(E116)、感度又は特異度がそれぞれの閾値よりも小さい場合、偽陽性(false positive)または偽陰性(false negative)事例を除外した(E117)。
本実施例においては、感度の閾値BN1と特異度の閾値BN2をすべて1に設定することにより、感度と特異度ともに100%である第1の訓練集合C01を見出した。すなわち、表219に示された偽陽性である12個の事例をすべて排除し、排除した集合について再度E111〜E115のステップを行った。排除した集合に対してE111〜E115のステップを再度実行しても、すぐに感度と特異度ともに100%にはならず、E111〜E117のステップを数回繰り返すことによって初めて感度と特異度ともに100%である第1の訓練集合C01を見出すことができた(E118)。
BRC患者群と非患者群を区分する第1種の判別式の場合には、15個の偽陽性事例(CONT7個、CRC3個、GC2個およびNHL3個)を排除した後に、第1の訓練集合C01に到達し、BRC患者群と他のがん患者群を区分する第3種の判別式の場合には、1つの偽陽性事例(GC1つ)を排除した後に、第1の訓練集合C03に到達したが、各第1の訓練集合は、感度と特異度ともに100%である判別結果を与える。
BRC患者群と正常対照群を区分する第2種の判別式の場合は、表204に示すように、すでに感度と特異度が100%であるため、該当事例をそのまま訓練集合C02に使用した。この過程によって感度と特異度ともに100%である判別結果を与える質量イオン別の因子負荷量を導出することができる(E119)。
前記ような一連の過程は、前記因子負荷量計算手段(5300)を通じて実行することができる。
(3-5)判別式の適用
構成した判別式を判別対象試料に適用する過程を説明すると、次の通りである。
まず、MarkerViewTMには、これと類似する目的で使用することができる機能がある。すなわち、一緒にインポートした試料データの中から、いくつかの試料のみを対象にして主成分分析ベースの線形判別分析を適用することができ、このように構成された判別式で残りの試料を判別することができる。この機能を利用すれば、第1の訓練集合と判別対象試料を一緒にインポートした後、第1の訓練集合だけを選択して、主成分分析ベースの線形判別分析を実行し、判別対象試料がどのように判定されるか知ることができる。
しかし、MarkerViewTMのインポート過程においてピークをアライメントする機能(peak alignment)が実行されるが、第1の訓練集合に合わせて判別対象試料のピークをアライメントする機能がないため、第1の訓練集合だけをインポートしたときのピーク表(peak table、m/z列と試料別のピーク強度列からなる行列)と、第1の訓練集合と判別対象試料を一緒にインポートしたときに生成されるピーク表の第1の訓練集合部分は同一ではない。ピーク強度行列の部分も異なり、同じピーク強度の行に対応するm/zの値も常に同一ではない。したがって、第1の訓練集合から作成された判別式を判別対象試料に適用して判別スコアを計算するためには、第1の訓練集合と判別対象試料を一緒にインポートしたときに生成されるピーク表を第1の訓練集合だけをインポートしたときのピーク表に再調整(realignment)する作業が先行しなければならない。
複数の判別対象試料を第1の訓練集合と共にインポートする場合、ソートがずれる程度が一層酷くなる。したがって、本実施例においては、すべての判別の対象試料に対して第1の訓練集合に一つの判別対象試料を追加してインポートした後、再整列、正規化、パレート・スケーリングを行った。
図28を参照してより詳細に説明すると、次の通りである。
まず、判別対象試料の低質量イオン質量スペクトルを第1の訓練集合にソートしてインポートするステップを実行する(E211)。
ただし、本実施例においては、MarkerViewTMには、判別対象試料を第1の訓練集合にソートしてインポートする機能がないため、前述したように、判別対象試料の低質量イオン質量スペクトルを第1の訓練集合と共にインポートした後に作成されるピーク表を第1の訓練集合だけをインポートしたときに作成されるピーク表に再整列するプログラムを作成し、第1の訓練集合にソートされた判別対象試料の低質量イオン質量スペクトルを抽出した。しかし、再整列せずに、最初から判別対象試料を第1の訓練集合にソートしてインポートすることがより好ましく、これもプログラムを作成して具現可能である。
次に、インポートしたピーク強度を正規化し(E212)、正規化したピーク強度を163パレート・スケーリングした(E213)。
次に、パレート・スケーリングした低質量イオンのピーク強度と第1の訓練集合に対する主成分分析ベースの線形判別分析によって得られた質量イオン別の因子負荷量から判別スコアを計算した(E214)。
このように計算された判別スコアが基準値BSよりも大きいかどうかを判断し(E215)、基準値BSよりも大きい場合、陽性と判定し(E216)、基準値BSよりも小さい場合、陰性と判定した(E217)。本実施例においては、基準値BSは0であることが好ましい。
前記ような一連の過程は、前記第2の整列手段(5500)、第2の判別スコア計算手段(5600)、および乳がん判定手段(5700)を通じて実行することができる。
第1種の判別式のために集合C1から第1の訓練集合C01を構成するときに除外された15人の非患者群試料と第3種の判別式のために集合C1から第1の訓練集合C03を構成するときに除外された1人のGC患者群試料について前記(3-4)項で計算した質量イオン別の因子負荷量を適用して判別スコアを計算してみた。第1の訓練集合C01およびC03を構成するときにすでに除外された事例であったので、偽陽性または偽陰性事例であると判別されるものと予想されたが、計算結果、第1種の判別式に関連した正常対照群の一つの事例がされた真陰性と判定されたことを除いては、予想通り、偽陽性または偽陰性の事例であると判別された。前記(3-4)項で計算した質量イオン別の因子負荷量を適用して集合C1を判別した結果を図29と図30に示したが、図29は、第1種の判別式、図30は、第3種の判別式の結果を示す。
(3-6)予備判別式の構成
前述した従来技術では、主成分分析ベースの線形判別分析で考慮したすべての質量イオンを用いて判別スコアを計算した後、その判別スコアに基づいてBRC患者かどうかを判定したが、本発明では、ロバストな判別性能を示す判別式を導出するため、まず判別スコアに大きな貢献をする質量イオンのみを使用する予備判別式を構成した。「予備判別式」とは、本発明に基づいて、最終的に求めようとする判別式を導出する中間段階としての判別式を指し、これを構成する低質量イオンは、最終的な判別式を構成するBRC診断用低質量イオンの「予備候補群」となる。
図31のステップを用いて10,000個の質量のイオンのうち、判別スコアに大きな影響を与える所定の質量のイオンを選定した。本実施例においては、第1種の判別式の場合、選定された所定の質量のイオンの数は376個、第2種の判別式の場合は353個、第3種の判別式の場合は345個であった。
表203と共に前述したように、インポートの条件でピークの最大数を10,000個とし、十分に多くの試料を一緒にインポートしたので、MarkerViewTMの主成分分析ベースの線形判別分析方法を用いて構成した判別式は、10,000個の項から構成されている。しかし、BRCの患者および非患者を区分するにあたり、10,000個の項がすべて同等の重要性をわけではないため、図31のステップにしたがって、10,000個の質量のイオンのうち、判別スコアに大きな影響を与える質量イオンを2段階にかけて選定した。このステップは、10,000個の質量のイオンのうち、BRC患者と非患者を区分するにあたり、不必要な質量イオンを除去する過程であると言える。
10,000個の項の値のうち、ピーク強度と質量イオン別の因子負荷量の積の絶対値が閾値BT1よりも大きい質量イオンを事例別に一次的に選択した(E121)。本実施例においては閾値BT1は0.1であることが好ましい。
以下、事例別に一次的に選択された質量のイオンの中から第1の訓練集合全体事例のうち、閾値BT2パーセント以上の事例で共通じて表われる質量イオンを二次的に選択した(E122)。本実施例においては閾値BT2は50であることが好ましい。すなわち、第2種の判別式の場合を例に挙げて説明すると、第1の訓練集合である103個の事例の少なくとも52個以上の事例において共通に登場する質量イオンだけで予備判別式を構成した。
前記ような過程を経て選択した質量イオンだけで再度判別スコアを計算し、それによって感度および特異度を計算した(E123)。再度、感度の閾値BN3と特異度の閾値BN4を設定して(E124)、感度や特異度がそれぞれの閾値よりも小さい場合、E121段階で使用された閾値BT1および/またはE122段階で使用された閾値BT2を変更して(E125)、E121〜E124のステップを繰り返した。本実施例においては、感度の閾値BN3と特異度の閾値BN4がそれぞれ0.9であることが好ましい。
このような段階を通じて選択した質量のイオンからBRC診断用低質量イオンの予備候補群を構成したが(E126)、本実施例においては、10,000個の質量のイオンのうち、第1種の判別式の場合には376個、第2種の判別式の場合には353個、第3種の判別式の場合には345個の質量のイオンが選択された。表221、222、223に第1、2、3種予備判別式で第1の訓練集合C01、C02、C03を判別した結果を示したが、感度と特異度など判別性能が100%で低くなるが、全体の質量のイオン数の4%にもならない質量のイオンだけで計算した結果にもかかわらず、極めて優れた判別結果を示すことが確認できる。
また、予備判別式で集合C1を判別した結果を図32、33および34に示したが、図32は、第1種の予備判別式、図33は、第2種の予備判別式、図34は、第3種の予備判別式の結果を示す。計算に使用される質量イオンの数は、急激に減少したことに比べて判別スコアの範囲はそうではないことを知ることができるが、これからBRCの患者および非患者を区分するにあたり、10,000個の質量イオンがすべて必要なものではないことを確認することができる。
前記ような一連の過程は、前記候補イオン集合選択手段を含む乳がん診断用イオン選定手段(5400)を通じて実行することができる。
(3-7)最終判別式の構成
予備判別式を構成する過程では、インポートされた10,000個の質量イオンのうち、判別スコアに数値的に大きな貢献をする質量イオンを抽出した。しかし、この質量イオンの中には、第1の訓練集合C0では問題を発生させなかったが、同一のBRC患者群および非患者群の血清について再度測定した質量スペクトルに対する判別または新たなBRC患者群および非患者群に対する判別においては潜在的に判別性能を低下させることができる質量のイオンも含まれているので、これらも積極的に除去するステップが必要であり、最終的な判別式の構成過程では、この段階を経て最終的にBRC診断用低質量イオンを決定する。
判別式のロバスト性を検証するため、まず集合C1についてさらに5回反復測定実験をし、この独立的で、また互いに独立した集合C2および集合Dについても5回反復測定実験を行った。質量スペクトルの反復測定過程には、前記した説明の血清を凍結・凍解させる過程および血清を新たにメタノール/クロロホルムと混合して抽出する過程が介入されていることの外に、レーザービーム(laserbeam)を用いた気化(vaporization)、脱着(desorption)、イオン化(ionization)過程なども繰り返し実験時に同様に進行されるとは言えず、また、まだ明らかにされていない様々な原因からの外乱も介入される余地が多い。したがって、反復測定された個々の質量スペクトルの判別スコアある程度のばらつきが発生するのは排除することができないため、本実施例においては、5回反復測定した試料について、平均判別スコアを計算して判定を実施した。
表224は、従来技術であるMarkerViewTMの主成分分析ベースの線形判別分析の結果である10,000個の項の判別式で集合CとDを判別した結果を示し、表225は、376個の項を有する第1種の予備判別式、353個の項を有する第2種の予備判別式、345個の項を有する第3種の予備判別式で集合CとDを判別した結果を示す。
表で、BRC LOME(breast cancer low-mass ion discriminant equation)1は、第1種の判別式、BRC LOME2は、第2種の判別式、BRC LOME3は、第3種の判別式を表し、その後ろについている数字は、判別式に含まれている低質量イオンの数を意味する。また、表226には、検証集合である集合Dについてのみ判別性能を示したが、括弧内の数字は、OVC患者群を除外したときの判別性能である。
10,000個の質量イオンから構成された判別式は、第1の訓練集合C0で完璧な判別性能を見られたにもかかわらず、集合Dで特に陽性予測度が低く表示されることを表226から確認することができる。第1、2、3種の予備判別式も第1の訓練集合C0では極めて優れた判別性能(表221、222、223)を見られたにもかかわらず、集合Dでの判別結果は満足できなかった。
したがって、本発明の好適な一実施例では、予備判別式をロバストな判別式に改善するため、図35のステップを行った。
まず、予備候補群の質量イオンを、高感度集合と高特異度集合とに区分した(E131)。ここでは、高感度集合の質量イオンは、質量イオン別感度が特異度よりも高い質量イオンであり、高特異度集合の質量イオンは、その反対である。
次に、高感度集合の質量のイオンと高特異度集合の質量イオンをそれぞれ質量イオン別の感度と特異度の和の降順で並べ替えた後{Sns1、Sns2、Sns3...SnsI}{Spc1、Spc2、Spc3... SpcJ}、それぞれの上位2つの質量イオンをとって{Sns1、Sns2、Spc1、Spc2}、4つの質量イオンの2つ以上の質量のイオンから構成することができる組み合せ(11個)の中で最高の性能の組み合わせをバイオ・マーカーのグループに選定した(E132)。
ここでは、最高の性能の組み合わせであるかどうかは、次の基準により客観的で、普遍的に選択されうる。次の基準は、重要度の順に従う。
基準1)感度と特異度の和が大きい組み合わせが、より性能が高い。
基準2)質量イオンの数が少ない組み合わせが、より性能が高い。
基準3)真陽性事例の中で最小判別スコアと真陰性の事例の中で最大判別スコアの差が大きい組み合わせが、より性能が高い。
次に、高感度集合と高特異度集合それぞれの次の上位階層の1つの質量イオン{Sns3、Spc3}をさらにとり前記バイオ・マーカーグループおよび前記バイオ・マーカーのグループに前記質量イオン{Sns3、Spc3}のいずれか一つ以上を組み合わせた4つの集合{biomarker group}、{biomarker group、Sns3}、{biomarker group、Spc3}、{biomarker group、Sns3、Spc3}の中で最高の性能の集合を再バイオ・マーカーのグループとして選定する(E133)。
これらの過程は、高感度集合および高特異度集合の両方に追加する質量イオンがなくなるまで、繰り返される(E134)。
すなわち、高感度集合および高特異度集合の両方に追加する質量イオンがあるときは、前記ような方式(E133)を繰り返して、高感度集合と高特異度集合のいずれかに追加する質量イオンが残っていない場合には、残りの質量イオンがある集合のその次の上位階層の1つの質量のイオン{SnsiまたはSpcj}をさらにとり前記バイオ・マーカーのグループおよび前記バイオ・マーカーのグループに前記質量イオン{SnsiまたはSpcj}を組み合わせた2つの集合の{biomarker group}、{biomarker group、SeniまたはSpcj}のうち、最高性能の集合を再バイオ・マーカーのグループとして選定する。
これらの過程は、高感度集合と高特異度集合のうち、質量イオンが残った集合の質量イオンが残らなくなるまで繰り返され、高感度集合と高特異度集合のすべての残りの質量イオンが存在しない場合のバイオ・マーカーグループがバイオ・マーカーグループ1(BG)となる(E135)。
予備候補群からバイオ・マーカーグループ1(BG)を除き(E136)、残りの質量のイオンで再度高感度集合と高特異度集合を構成し、前記過程を繰り返す。この過程は、高感度集合と高特異度集合のいずれかの集合が二つ未満の質量イオンのみを持つことになるまで繰り返される(E137)。
前記反復過程を通じて得られたバイオ・マーカーのグループ1、2、...のうち、正確率の順にBK個のバイオ・マーカーのグループを組み合わせて、最終バイオ・マーカーのグループを形成する。ここで正確率とは、事例全体の中から真陽性および真陰性の事例の割合を意味する。本実施例においては、BKは、1ないし3の間の自然数であることが好ましい(E138)。
したがって、前記最終バイオ・マーカーグループの質量イオンがBRC診断用低質量イオンに決められる(E139)。
集合C1で、より正確には、その部分集合であるC0から質量イオンの予備候補群を選定したが、予備候補群から最終バイオ・マーカーグループを決定するときには、過剰適合 (overfitting)を解決するため、集合C1に独立の集合C2も追加して訓練集合を拡張した。
前記過程をBRC患者群と非患者群とに区分するための試料を対象に実行した結果、第1種のBRC診断用低質量イオンで29個が選択され、BRC患者群と正常対照群を区分するための試料を対象に実行した結果、第2種のBRC診断用低質量イオンで42個が選択され、BRC患者群と他のがん患者群を区分するための試料を対象に実行した結果、第3種のBRC診断用低質量イオンで75個が選択された。第1、2、3種BRC診断用低質量イオンの質量値は、表227、228、229に示した。このような低質量イオンを「第1種のBRC診断用低質量イオン」、「第2種のBRC診断用低質量イオン」および「第3種のBRC診断用低質量イオン」と称し、これを用いて、、最終的に求めた本発明にによる判別式を「第1種のBRC診断用の最終判別式 」、「第2種のBRC診断用の最終判別式 」および「第3種のBRC診断用の最終判別式」と称する。
前記ような一連の過程は、前記最終イオン集合選択手段を含む乳がん診断用イオン選定手段(5400)を通じて実行することができる。
(3-8)最終判別式の適用および分析
集合Dに対して第1種の、または第2種のおよび第3種のBRC診断用低質量イオンを用いた第1種の、または第2種のおよび第3種のBRC診断用の最終判別式を図28の方法により適用すると、その判定結果を得ることができる。
最終判別式で判定した結果を図36、37および表226、230に示した。図36および37は5回判別スコアの平均判別スコアで判定した結果を表すが、図36は、集合C、図37は、集合Dの判定結果を示す。
集合である集合Dでの判別性能で評価すると、第1種のBRC診断用の最終判別式の結果に比べて、第2種のおよび第3種のBRC診断用の最終判別式の結果がより優れたことを確認することができる。第2種のおよび第3種のBRC診断用の最終判別式を用いる場合には、訓練集合に含まれていなかったOVC患者群を検証集合に含む場合にも集合Dで感度、特異度、陽性予測度、音声予測度がすべて85%以上であった。
一方、第1種のBRC診断用の最終判別式を用いる場合には、訓練集合に含まれていなかったOVC患者群を検証集合から除外した場合にのみ集合Dで感度、特異度、陽性予測度、音声予測度ともに85%以上であった。しかし、第1種のBRC診断用の最終判別式もおおよそ優れた判別結果を見られたと言える。
本発明により、血清の低質量イオン質量スペクトルを分析してBRC患者と非患者を高い判別性能を持って判定することができた。
4.胃がんを診断するための癌診断装置の実施例
図38は、本発明のGCを診断するための図7の癌診断部をより詳細に示したブロック図である。
図示されたように、本発明に係る癌診断部は、訓練候補集合である前記胃がん患者および非患者事例の低質量イオン質量スペクトルをソートする第1の整列手段(6100)と、ソートされた前記質量スペクトルに対して生物統計学的分析を実行し、判別スコアを計算する第1の判別スコア計算手段(6200)と、前記判別スコアに応じて感度および特異度を計算し、これを基準に第1の訓練集合を選定して低質量イオン別の因子負荷量を計算する因子負荷量を計算する手段(6300)と、候補条件を満たす候補低質量イオンの中で判別性能に基づいて胃がん診断用低質量イオンを選択する胃がん診断用イオン選定手段(6400)と、判別対象生物学的試料の低質量イオン質量スペクトルを前記第1の訓練集合にソートする第2の整列手段(6500)と、前記判別対象の低質量イオンのピーク強度と前記因子負荷量から判別スコアを計算する第2の判別スコア計算手段(6600)と、前記判別スコアに基づいて前記判別対象を胃がんの陽性または陰性と判定する胃がん判定手段(6700)を含むが、前記胃がん診断用イオン選定手段(6400)は、前記複数の胃がん患者および非患者事例を、複数の胃がん患者の事例と複数の健常者の事例で構成されている第1種の判別事例と、前記複数の胃がん患者の事例と複数の大腸がん患者の事例で構成されている第2種の判別事例と、前記複数の胃がん患者の事例と複数の乳がん患者の事例で構成されている第3種の判別事例と、前記複数の胃がん患者の事例と複数の非ホジキンリンパ腫(non-Hodgkinlymphoma、NHL)患者の事例で構成されている第4種の判別事例に区分したり、前記複数の胃がん患者および非患者の事例を、前記第1種の判別事例と前記複数の胃がん患者および健常者の事例と複数の大腸がん、乳がんおよび非ホジキンリンパ腫の患者の事例で構成されている第5種の判別事例に区分し、前記第1種の判別事例、前記第2種の判別事例、前記第3種の判別事例、前記第4種の判別事例、および前記第5種の判別事例に対してそれぞれ行われて、前記胃がん診断用低質量イオンが、前記第1種の判別事例に対する第1種の胃がん診断用低質量イオン、前記第2種の判別事例に対する第2種の胃がん診断用低質量イオン、前記第3種の判別事例に対する第3種の胃がん診断用低質量イオン、前記第4種の判別事例に対する第4種の胃がん診断用低質量イオンおよび前記第5種の判別事例に対する第5種の胃がん診断用低質量イオンに区分されることを特徴とする。
このため、低質量イオン検出部(1000)は、複数の胃がん患者および非患者事例の生物学的試料から質量分析計を用いて、前記低質量イオンのピーク強度を検出して前記低質量イオンの質量スペクトルを抽出する。
さらに、前記GCを診断するための癌診断部のさらに細かい構成要素は、前述した前記癌診断装置での図9〜図13を介して説明した構成要素と大同小異のため、ここでこれに対する細かい構成の図示および説明は省略し、以下、本発明の一実施例について詳細に説明する。
本発明の癌診断装置は、図14に示すように、ハードウェアで構成されるか、またはプログラム構造によるソフトウェアで構成され得、以下では、一例として、添付されたフローチャートの過程を参照して、ソフトウェアで構成されたGCを診断するための癌診断装置について詳細に説明する。
(4-1)試料の準備 - 血清収集対象
前述した表301の49人のGC患者、前述した表302の84人の正常対照群、表305の77人のCRC患者群、表306の54人のBRC患者群および表307の24人の非ホジキンリンパ腫患者群から血清を収集した。
また、この288人を集合E1とし、後述するように、その部分集合E0で第1の訓練集合を構成し、この第1の訓練集合に対する生物統計学的分析を通し、質量イオン別の重み付け(因子負荷量)を計算し、予備判別式を得た。
また、この集合E1のほか、表308の48人のGC患者群、表309の83人の正常対照群、表310の175人のCRC患者群、表311の54人のBRC患者群および表312の22人のNHL患者群を集合E2(第2の訓練集合)にして訓練集合を拡張した。すなわち、予備判別式を構成する低質量イオンの予備候補群から後述する方法に応じて、GC診断用低質量イオンを確認する時は、互いに独立した集合である集合E1と集合E2との和の集合、すなわち集合Eを訓練集合として使用した。
また、集合Eと、独立した表313の44人のGC患者群、表314の81人の正常対照群、表315の168人のCRC患者群、表316の53人のBRC患者群、表317の20人のNHL患者群、表318の25人の卵巣がん(ovariancancer、OVC)患者群を集合Fとし、検証集合を構成した。OVC患者群は、質量イオン別の重み付けを求める時やGC診断用低質量イオンを確認する時、全く反映されない患者群であって、本発明にて構成した判別式でこの患者群がどのように判別されるか察し見るため、含ませた。
(4-2)試料の準備 - 血清の準備および質量スペクトル測定
4倍の大きさのメタノール/クロロホルム(2:1、v/v)を25■の血清と共に激しく混合した後、10分間室温で培養した。混合物は、4℃で10分間6000×gで遠心分離した。得られた上清液を1時間濃縮機(concentrator)で完全に乾燥させ、30分間攪拌機(vortexer)で30μlの50%アセトニトリル(acetonitrile)/0.1%トリフルオロ酢酸(trifluoroacetic acid、TFA)で溶解させた。
メタノール/クロロホルム抽出物を50%アセトニトリル/0.1% TFA中でアルファ - シアノ-4-ヒドロキシケイ皮酸(α-cyano-4-hydroxycinnamic acid)溶液と混合し(1:12、v/v)、1μlの混合物をMALDI-ターゲットプレート(target plate)に位置させた。GC患者および非患者の血清抽出物の質量スペクトルをProteomicsAnalyzer(Applied Biosystems、Foster City、CA、USA)を用いて測定した。
一つの試料に対して質量スペクトルデータは、20回反復測定されたスペクトルの平均に抽出される。すべての個々の試料の質量値区間は、最大質量値が約2500m/zとなるように調整した。実験的エラーを最小限に抑えるために、焦点質量(focusmass)、レーザー強度(laser intensity)、ターゲットプレート、データ収集時刻(dataacquisitiontime)を含む様々な要素を点検した。
好ましい焦点質量およびレーザー強度として500m/zおよび5000がそれぞれ固定して使用された。全ての試料は、固定された焦点質量およびレーザーの強さと共に、他の抽出および他のデータ収集時刻の下で少なくとも5回反復測定した。質量イオン別の重み付けを計算した集合E1の場合は、さらにもう一回測定した。
したがって、低質量イオン検出手段(6000)は、MALDI-TOF質量分析計を用いて、前記ような過程を経て血清試料から低質量イオン質量スペクトルを抽出することができる。
(4-3)判別戦略
構成した判別式が、GC特異的な式となるためには、GC患者群は、判別式により正常対照群ばかりでなく、他のがん患者群と区別されるべきである。本実施例においては、他のがん患者群としてCRC患者群、BRC患者群、およびNHL患者群を使用しようとする。一つの判別式でGC患者群と非患者群(正常対照群、CRC患者群、BRC患者群およびNHL患者群)を区分することができるかどうか、従来の主成分分析ベースの線形判別分析方法を適用した結果を表319に示した。特にNHL患者群の特異度が25.00%と低いことが確認できる。これから一つ判別式ではGC患者群と非患者群を区分することができないことを知ることができる。
図6および表304から分かるように、GC患者群と正常対照群に対しては優れた判別結果が得られたので、GC患者群と他のがん患者群とも個別に区分することができるかどうか察し見たところ、その結果を表320〜322に示した。
したがって、GC患者群と非患者群を区分することは、GC群群と正常対照群を区分する第1種の判別式、GC患者群とCRC患者群を区分する第2種の判別式、GC患者群とBRC患者群を区分する第3種の判別式、GC患者群とNHL患者群を区分する第4種の判別式を用いて、4つの判別式によりすべてGCと判別された場合をGC患者群と判定し、4つの判別式のいずれかの判別式でGC非患者と判別された場合には、GC非患者と判定する方法により行われうる。
また、判別式の個数が増加するにつれて、すべての判別式によりGCと判別されなければならないという条件は、必然的に感度の減少を生じさせるので、判別式の個数を削減する方法も必要である。表323は、GC患者群および正常対照群と他のがん患者群を区分する場合を示しているが、おおよそ優れた判別結果を示すと言える。
したがって、この判別式と第1種の判別式を組み合わせてGC患者群と正常対照群を他のがん患者群と区分した後、再度GC患者群と正常対照群を区分する方法でGC患者群を非患者群と区分することができる。GC患者群と正常対照群と他の癌患者群を区分する判別式を第5種の判別式であると称する。4つの判別式を使用する方法と、二つの判別式を使用する方法を採用することができるが、実施例の2つの場合をすべて説明する。
(4-4)第1の訓練集合E0の選定および質量イオン別の重み付けの計算
表304、320、321、323に示した判別結果が優れているものの、感度と特異度ともに100%ではない。本発明では、まず、感度と特異度が所定の値を有する第1の訓練集合E0を選定し、この第1の訓練集合E0に対して質量イオン別の重み付けを計算したが、本実施例においては、その所定の値は、感度と特異度ともに100%である。
図39を参照して、感度と特異度が所定の値を有する第1の訓練集合E0を選定する方法について説明する。
第1の判別スコア計算手段(6200)は、図示された図39のF111〜F114のステップを通じて、集合E1内のGC患者群および正常対照群の低質量イオン質量スペクトルをソートしてインポートし(F111)、インポートしたピーク強度を正規化し(F112)、正規化したピーク強度をパレート・スケーリングし(F113)、パレート・スケーリングしたピーク強度に対して生物統計学的分析を実行し、判別スコアを計算した(F114)。
多様な生物統計学的分析方法のいずれかを選択して判別スコアを計算することができるが、本実施例においては、主成分分析ベースの線形判別分析を行った。判別スコアに応じて感度および特異度を計算し(F115)、その結果は、前述した表304のとおりである。
次に、感度の閾値GN1と特異度の閾値GN2を設定し(F116)、感度や特異度がそれぞれの閾値よりも小さい場合、偽陽性(false positive)または偽陰性(false negative)の事例を除外した(F117)。
本実施例においては、感度の閾値GN1と特異度の閾値GN2をすべて1に設定することにより、感度と特異度ともに100%である第1の訓練集合E0を見出した。すなわち、表304に示された偽陰性の事例を排除し、排除した集合に対して再度F111〜F115のステップを行った。第1種の判別式の場合は、このようにして感度および特異度がすぐに100%となることを確認したが、排除した集合についてF111〜F115のステップを再度実行しても常にすぐに感度と特異度ともに100%ではなく、F111〜F117のステップを数回繰り返すことによって、初めて感度と特異度ともに100%である第1の訓練集合E0を見出すことができた(F118)。
GC患者群と正常対照群を区分する第1種の判別式の場合には、1つの偽陰性事例を排除した後に第1の訓練集合E01に到達し、GC患者群とCRC患者を区分する第2種の判別式の場合には、4つの偽陰性の事例および2つの偽陽性の事例を排除した後に、第1の訓練集合E02に到達し、GC患者群とBRC患者群を区分する第3種の判別式の場合には、4つの偽陰性の事例および1つの偽陽性の事例を排除した後に第1の訓練集合E03に到達し、GC患者群および正常対照群と他の癌患者群を区分する第5種の判別式の場合には11個の偽陰性の事例(GC5個およびCONT6個)および21個の偽陽性の事例(CRC20個およびBRC1個)を排除した後に、第1の訓練集合E05に到達したが、各第1の訓練集合は、感度と特異度ともに100%である判別結果を与える。
GC患者群とNHL患者群を区分する第4種の判別式の場合は、表322に示すように、すでに感度と特異度ともに100%であるため、該当事例をそのまま第1の訓練集合E04に使用した。この過程によって感度と特異度ともに100%である判別結果を与える質量イオン別の因子負荷量を導出することができる(F119)。
前記ような一連の過程は、前記因子負荷量計算手段(6300)を通じて実行することができる。
(4-5)判別式の適用
構成した判別式を判別対象試料に適用する過程を説明すると、次の通りである。
まず、MarkerViewTMには、これと類似する目的で使用することができる機能がある。すなわち、一緒にインポートした試料データの中からいくつかの試料のみを対象として主成分分析ベースの線形判別分析を適用することができ、このように構成された判別式で残りの試料を判別することができる。この機能を利用すれば、第1の訓練集合と判別対象試料を一緒にインポートした後、第1の訓練集合だけを選択して主成分分析ベースの線形判別分析を実行し、判別対象試料がどのように判定されるか知ることができる。
しかし、MarkerViewTMのインポート過程においてピークをアライメントする機能(peakalignment)が行われるが、第1の訓練集合に合わせて判別対象試料のピークをアライメントする機能がないため、第1の訓練集合だけをインポートしたときのピーク表(peak table、m/z列と試料別のピーク強度列からなる行列)と、第1の訓練集合と判別対象試料を一緒にインポートしたときに生成されるピーク表の第1の訓練集合部分は同じではない。ピーク強度行列の部分も異なり、同じピーク強度の行に対応するm/z値も常に同じではない。したがって、第1の訓練集合で作成された判別式を判別対象試料に適用して判別スコアを計算するためには、第1の訓練集合と判別対象試料を一緒にインポートしたときに生成されるピーク表を第1の訓練集合だけをインポートしたときのピーク表に再調整(relignment)する作業が先行されなければならない。も常に同じではない。
複数の判別対象試料を第1の訓練集合と共にインポートする場合は、ソートがずれる程度が一層酷くなる。したがって、本実施例においては、すべての判別対象の試料に対して第1の訓練集合に一つの判別対象試料を追加してインポートした後、再調整、正規化、パレート・スケーリングを行った。
図40を参照してより詳細に説明すると、次の通りである。
まず、判別対象試料の低質量イオン質量スペクトルを第1の訓練集合にソートしてインポートするステップを実行する(F211)。
ただし、本実施例においては、MarkerViewTMには、判別対象試料を第1の訓練集合にソートしてインポートする機能がないため、前述したように、判別対象試料の低質量イオン質量スペクトルを第1の訓練集合と共にインポートした後に作成されるピーク表を第1の訓練集合だけをインポートしたときに作成されるピーク表に再調整するプログラムを作成して第1の訓練集合にソートされた判別対象試料の低質量イオン質量スペクトルを抽出した。しかし、再調整せずに最初から判別対象試料を第1の訓練集合にソートしてインポートすることがより好ましく、これもプログラムを作成して具現可能である。
次に、インポートしたピーク強度を正規化し(F212)、正規化したピーク強度をパレート・スケーリングした(F213)。
次に、パレート・スケーリングした低質量イオンのピーク強度と第1の訓練集合に対する主成分分析ベースの線形判別分析によって得られた質量イオン別の因子負荷量から判別スコアを計算した(F214)。
このように計算された判別スコアが基準値GSよりも大きいかどうかを判断し(F215)、基準値GSよりも大きい場合、陽性と判定し(F216)、基準値GSよりも小さい場合、陰性と判定した(F217)。本実施例において基準値GSは0であることが好ましい。
前記ような一連の過程は、前記第2の整列手段(6500)、第2の判別スコア計算手段(6600)および胃がん判定手段(6700)を通じて実行することができる。
第1種の判別式のために集合E1で第1の訓練集合E01を構成するときに除外された1人のGC患者群試料、第2種の判別式のために集合E1で第1の訓練集合E02を構成するときに除外された4人のGC患者群試料および2人のCRC患者群試料、第3種の判別式のために集合E1で第1の訓練集合E03を構成するときに除外されていた4人のGC患者群試料および1人のBRC患者群試料、第5種の判別式のために集合E1から第1の訓練集合E05を構成するときに除外されていた5人のGC患者群試料、6人の正常対照群試料、20人のCRC患者群試料および1人のBRC患者群試料について、前記(4-4)で計算した質量イオン別の因子負荷量を適用して判別スコアを計算した。第1の訓練集合E01、E02、E03およびE05を構成するときに既に除外された事例であったので、偽陽性または偽陰性の事例と判別されるものと予想されたが、計算結果、第5種の判別式に関連したGC患者群の二つの事例と正常対照群の一つの事例が真陽性であると判定されたことを除いては、予想通り偽陽性または偽陰性事例であると判別された。前記(4-4)で計算した質量イオン別の因子負荷量を適用して、集合E1を判別した結果を図41〜図45に示したが、図41は、第1種の判別式、図42は、第2種の判別式、図43は、第3種の判別式、図44は、第4種の判別式、図45は、第5判別式の結果を示す。
(4-6)予備判別式の構成
前述した従来技術では、主成分分析ベースの線形判別分析で考慮したすべての質量イオンを用いて判別スコアを計算した後、その判別スコアに基づいてGC患者かどうかを判定したが、本発明では、ロバストな判別性能を示す判別式を導出するため、まず、判別スコアに大きな貢献をする質量イオンのみを使用する予備判別式を構成した。「予備判別式」とは、本発明により、最終的に求めようとする判別式を導出する中間段階としての判別式を指し、これを構成する低質量イオンは、最終的な判別式を構成するGC診断用低質量イオンの「予備候補群」となる。
図46のステップにより10,000個の質量のイオンのうち、判別スコアに大きな影響を与える所定の質量のイオンを選定した。本実施例においては、第1種の判別式の場合には選定された所定の質量のイオンの数は299個、第2種の判別式の場合には351個、第3種の判別式の場合には384個、第4種の判別式の場合には348個、第5種の判別式の場合には、383個であった。
表303と共に、前述したように、インポートの条件でピークの最大個数を10,000個として十分に多くの試料を一緒にインポートしたので、MarkerViewTMの主成分分析ベースの線形判別分析方法を用いて構成した判別式は、10,000個の項で構成されている。しかし、GC患者および非患者を区分するにあたり、10,000個の項がすべて同等の重要性をわけではないため、図46のステップにしたがって、10,000個の質量のイオンのうち、判別スコアに大きな影響を与える質量イオンを2段階にかけて選定した。このステップは、10,000個の質量のイオンのうち、GC患者と非患者を区分するにあたり、不必要な質量イオンを除去する過程であると言える。
10,000個の項の値のうち、ピーク強度と質量イオン別の因子負荷量の積の絶対値が閾値GT1よりも大きい質量イオンを事例別に一次的に選択した(F121)。本実施例においては閾値GT1は、0.1であることが好ましい。
以下、事例別に一次的に選択された質量のイオンの中から第1の訓練集合全体事例のうち、閾値GT2パーセント以上の事例において共通に表れる質量イオンを二次的に選択した(F122)。本実施例においては閾値GT2は50であることが好ましい。すなわち、第4種の判別式の場合を例に挙げて説明すると、第1の訓練集合である73個事例の中で、少なくとも37個以上の事例で 共通に登場する質量イオンだけで予備判別式を構成した。
前記ような過程を経て、選択した質量イオンだけで再度判別スコアを計算し、それに応じて感度および特異度を計算した(F123)。再度、感度の閾値GN3と特異度の閾値GN4を設定して(F124)、感度や特異度がそれぞれの閾値よりも小さい場合、F121段階で使用された閾値T1および/またはF122段階で使用された閾値T2を変更して(F125)F121ないしF124のステップを繰り返した。本実施例においては、感度の閾値N3と特異度の閾値N4がそれぞれ0.9であることが好ましい。
このような段階を経て選択した質量のイオンからGC診断用低質量イオンの予備候補群を構成したが(F126)、本実施例においては、10,000個の質量のイオンのうち第1種の判別式の場合には299個、第2種の判別式の場合には351個、第3種の判別式の場合には384個、第4種の判別式の場合には348個、第5種の判別式の場合には383個の質量イオンが選択された。表324〜328に第1〜5種の予備判別式で第1の訓練集合E01ないしE05を判別した結果を示したが、感度と特異度など判別性能が100%で低くなるが、全体の質量のイオン個数の4%にもならない質量イオンだけで計算した結果にもかかわらず、おおよそ極めて優れた判別結果を示すことを確認することができる。
また、予備判別式で集合E1を判別した結果を図47〜51に示したが、図47は、第1種の予備判別式、図48は、第2種の予備判別式、図49は、第3種の予備判別式、図50は、第4種の予備判別式、図51は、第5種の予備判別式の結果を示す。計算に使用される質量イオンの数は急激に減少したことに比べて判別スコアの範囲はそうではないことを知ることができるが、これからGC患者および非患者を区分するにあたり、10,000個の質量イオンがすべて必要ではないということを確認することができる。
前記ような一連の過程は、前記候補イオン集合選択手段を含む胃がん診断用イオン選定手段(6400)を通じて実行することができる。
(4-7)最終判別式の構成
予備判別式を構成する過程では、インポートした10,000個の質量のイオンのうち判別スコアに数値的に大きな貢献をする質量イオンを抽出した。しかし、この質量イオンの中には第1の訓練集合E0では問題を発生させなかったが、同じGC患者群および非患者群の血清について再度測定した質量スペクトルに対する判別または新たなGC患者群および非患者群の判別においては潜在的に判別性能を低下させることができる質量のイオンも含まれているので、これらも積極的に除去するステップが必要であるが、最終判別式の構成過程では、この段階を経て最終的にGC診断用低質量イオンを決定する。
判別式のロバスト性を検証するため、まず、集合E1に対してさらに5回反復測定実験をし、これとは独立しており、また互いに独立した集合E2および集合Fに対しても5回反復測定実験を行った。質量スペクトルの反復測定過程では、前記した説明の血清を凍結・凍解させる過程および血清を新たにメタノール/クロロホルムと混合して抽出する過程が介入されていることの外に、レーザービーム(laserbeam)を用いた気化(vaporization)、脱着(desorption)、イオン化(ionization)過程なども繰り返し実験した場合、同様に進行するとは限らず、また、まだ明らかにされていない様々な原因からの外乱も介入される余地が多い。したがって、反復測定された個々の質量スペクトルの判別スコアある程度のばらつきが発生するのは排除することができないため、本実施例においては、5回反復測定した試料について、平均判別スコアを計算して判定を実施した。
表329は、従来技術であるMarkerViewTMの主成分分析ベースの線形判別分析の結果である10,000個の項の判別式で集合EとFを判別した結果を示し、表330は、299個の項を有する第1種の予備判別式、351個の項を有する第2種の予備判別式、384個の項を有する第3種の予備判別式、348個の項を有する第4種の予備判別式、383個の項を有する第5種の予備判別式で集合EとFを判別した結果を示す。
表でGC LOME(gastric cancer low-mass ion discriminant equation)1〜5は、第1〜5種の判別式を表し、その後ろについている数字は、判別式に含まれている低質量イオンの数を意味する。また、表331には、検証集合である集合Fのみ判別性能を示した。
0,000個の質量イオンで構成された判別式は、第1の訓練集合E0で完璧な判別性能が見られたにもかかわらず、集合Fで、特に感度と陽性予測度が低く表示されることを表331で確認することができる。第1〜5種の予備判別式も第1の訓練集合E0にては、おおよそ極めて優れた判別性能(表324〜328)が見られたにもかかわらず、集合Fでの判別結果は満足できなかった。
したがって、本発明の好適な一実施例では、予備判別式をロバストな判別式に改善するために図52のステップを行った。
まず、予備候補群の質量イオンを、高感度集合と高特異度の集合とに区分した(F131)。ここでは、高感度集合の質量イオンは、質量イオン別の感度が特異度よりも高い質量イオンであり、高特異度集合の質量イオンは、その反対である。
次に、高感度集合の質量イオンと高特異度集合の質量イオンをそれぞれ質量イオン別の感度と特異度の和の降順でソートした後{Sns1、Sns2、Sns3...SnsI}{Spc1、Spc2、Spc3... SpcJ}、それぞれの上位2つの質量イオンを取って{Sns1、Sns2、Spc1、Spc2}、4つの質量イオンのうち2つ以上の質量イオンで構成することができる組み合せ(11個)の中で最高の性能の組み合わせをバイオ・マーカーのグループに選定した(F132)。
ここでは、最高の性能の組み合わせであるかどうかは、次の基準により客観的で、かつ普遍的に選択されうる。次の基準は、重要度の順に従う。
基準1)感度と特異度の和が大きい組み合わせが、より性能が高い。
基準2)質量イオンの数が少ない組み合わせが、より性能が高い。
基準3)真陽性事例の最小判別スコアと真陰性の事例の中で最大判別スコアの差が大きい組み合わせが、より性能が高い。
次に、高感度集合と高特異度集合それぞれの次の上位階層の1つの質量イオン{Sns3、Spc3}をさらにとり、前記バイオ・マーカーグループおよび前記バイオ・マーカーのグループに前記質量イオン{Sns3、Spc3}のいずれか一つ以上を組み合わせた4つの集合{biomarker group}、{biomarker group、Sns3}、{biomarker group、Spc3}、{biomarker group、Sns3、Spc3}の中で最高の性能の集合を再バイオ・マーカーのグループに選定する(F133)。
これらの過程は、高感度集合および高特異度集合の両方に追加する質量イオンがなくなるまで繰り返される(F134)。
すなわち、高感度集合および高特異度集合の両方に追加する質量イオンがあるときは前記ようなF133ステップを繰り返して、高感度集合と高特異度の集合のいずれかに追加する質量イオンが残っていない場合には、残りの質量イオンがある集合のその次の上位階層の1つの質量イオン{SnsiまたはSpcj}をさらにとり、前記バイオ・マーカーのグループおよび前記バイオ・マーカーのグループに前記質量イオン{SnsiまたはSpcj}を組み合わせた2つの集合{biomarker group}、{biomarker group、SeniまたはSpcj}のうち、最高性能の集合を再バイオ・マーカーのグループに選定する。
これらの過程は、高感度集合と特異度集合のうち質量イオンが残った集合の質量イオンが残らなくなるまで繰り返され、高感度集合と特異度集合のすべての残りの質量イオンが存在しない場合のバイオ・マーカーグループがバイオ・マーカーグループ1(GG)となる(F135)。
予備候補群からバイオ・マーカーグループ1(GG)を除き(F136)、残りの質量イオンで再度高感度集合と高特異度集合を構成し、前記過程を繰り返す。この過程は、高感度集合と高特異度の集合のいずれかの集合が二つ未満の質量イオンのみを有するまで繰り返される(F137)。
前記反復過程を通じて得られたバイオ・マーカーグループ1、2、...のうち、正確率の順にGK個のバイオ・マーカーグループを組み合わせ、最終バイオ・マーカーグループを形成する。ここで正確率とは、事例全体の中から真陽性および真陰性の事例の割合を意味する。本実施例においては、GKは1ないし3の間の自然数であることが好ましい(F138)。
したがって、前記最終バイオ・マーカーグループの質量のイオンがGC診断用低質量イオンに決定される(F139)。
集合E1で、より正確には、その部分集合であるE0から質量イオンの予備候補群を選定したが、予備候補群から最終バイオ・マーカーグループを決定するとき、過剰適合 (overfitting)の問題を解決するため、集合E1に独立の集合E2も追加して訓練集合を拡張した。
前記過程をGC患者群と正常対照群を区分するための試料を対象に実行した結果、第1種のGC診断用低質量イオンで14個が選択され、GC患者群とCRC患者群を区分するための試料を対象に実行した結果、第2種のGC診断用低質量イオンで36個が選択され、GC患者群とBRC患者群を区分するための試料を対象に実行した結果、第3種のGC診断用低質量イオンで50個が選択され、GC患者群とNHL患者群を区分するための試料を対象に実行した結果、第4種のGC診断用低質量イオンで46個が選択され、GC患者群および正常対照群と他の癌患者群を区分するための試料を対象に実行した結果、第5種のGC診断用低質量イオンで55個が選択された。
第1〜5種のGC診断用低質量イオンの質量値は、表332〜336に示した。このような低質量イオンを「第1種のGC診断用低質量イオン」、「第2種のGC診断用低質量イオン」、「第3種のGC診断用低質量イオン」、「第4種のGC診断用低質量イオン」、および「第5種のGC診断用低質量イオン」と称し、これを用いて、最終的に求めた本発明に係る判別式を「第1種のGC診断用最終的な判別式」、「第2種のGC診断用最終的な判別式」、「第3種のGC診断用最終的な判別式」、「第4種のGC診断用最終的な判別式」、および「第5種のGC診断用最終的な判別式」と称する。
前記ような一連の過程は、前記最終イオン集合選択手段を含む胃がん診断用イオン選定手段(6400)を通じて実行することができる。
(4-8)最終判別式の適用および分析
集合Fに対して第1〜4種の、または第1種のおよび第5種のGC診断用低質量イオンを用いた第1〜4種の、または第1種のおよび第5種のGC診断用最終判別式を図40の方法により適用すると、その判定結果を得ることができる。
最終判別式と判定した結果を図53、54および表331、337に示した。図53および図54は、5回判別スコアの平均判別スコアで判定した結果を示すが、図53は集合E、図54は集合Fの判定結果を示す。第1〜4種のGC診断用最終判別式を用いる場合は、4次元空間上に表現されなければならないので、図で表示せずに、第1種のおよび第5種のGC診断用最終判別式を用いた場合のみ示した。
検証集合である集合Fでの判別性能で評価すると、第1種のおよび第5種のGC診断用最終判別式の結果に比べて、第1〜4種のGC診断用最終判別式の結果がより優れたことを確認することができる。判別式の個数の増加は、通常、感度の減少を伴うことになるが、実施例の場合、第3種のおよび第4種の判別式で100%の感度を示したので、感度の減少の観点では、事実上、判別式の個数が2つであることと同じになるので、判別式の個数に比べて感度の低下が著しく表されなかった。
第1〜4種のGC診断用最終判別式を用いる場合には、集合Fで感度、特異度、陽性予測度、陰性予測度がすべて90%以上であった。第1種のおよび第5種のGC診断用最終判別式を用いる場合には、感度、特異度、陽性予測度、陰性予測度がすべて約80%以上であった。したがって、第1種のおよび第5種のGC診断用の最終判別式も優れた結果を見られたと判断される。
本発明により血清の低質量イオン質量スペクトルを分析してGC患者と非患者を高い判別性能を持って判定することができた。
本発明は、本実施例に類似した過程を経て大腸がん、乳がんおよび胃がんのほかに他の特定の癌患者群と正常対照群を判別する式を構成し、また、互いに異なる癌患者群を区別する判別式を構成することにより容易に拡張されることができる。また、がんだけでなく、どのような他の病気に対しても診断することができるように容易に拡張されることができることを、当業者は容易に分かるだろう。
本発明に係る癌診断装置は、CRC診断の場合にも分析コストが非常に低く、分析時間が短く、大規模な分析が可能で、CRCを対象とした場合の訓練集合だけでなく、検証集合の判別でも感度、特異度、陽性予測度、陰性予測度ともに85%以上であることを確認した。また、CRC患者および非患者の集合を他の病気の患者および非患者集合に変更することを介して様々な病気に有用に適用されうる。
本発明に係る癌診断装置は、BRC診断の場合にも分析コストが非常に低く、分析時間が短く、大規模な分析が可能で、BRCを対象とした場合、訓練集合だけでなく、検証集合の判別でも感度、特異度、陽性予測度、陰性予測度がすべて85%以上であることを確認した。また、BRCの患者および非患者の集合を他の病気の患者および非患者集合に変更することを介して、様々な病気に有用に適用されうる。
本発明に係る癌診断装置は、GC診断の場合にも分析コストが非常に低く、分析時間が短く、大規模な分析が可能で、GCを対象とした場合には訓練集合だけはなく、検証集合の判別でも感度、特異度、陽性予測度、陰性予測度がすべて約80〜90%以上であることを確認した。また、GC患者および非患者の集合を他の病気の患者および非患者集合に変更することを介して、様々な病気に有用に適用されうる。

Claims (24)

  1. 複数の癌患者および非患者の事例の生物学的試料から低質量イオン(low-mass ion)のピーク強度(peak intensity)を検出して前記低質量イオンの質量スペクトルを検出する低質量イオン検出部と、
    前記低質量イオンの質量スペクトル・パターンを比較分析し、癌の診断情報を判定する癌の診断部と、
    前記癌診断部から判定された癌の診断情報を出力可能な形式に切り換えて表示するディスプレイ部を含み、
    前記癌の診断部は、
    訓練候補集合である前記癌患者および非患者の事例の前記質量スペクトルをソートする第1の整列手段と、
    ソートされた前記質量スペクトルに対して生物統計学的分析を実行し、判別スコアを計算する第1の判別スコアの計算手段と、
    前記第1の判別スコアの計算手段の判別スコアに基づいて感度(sensitivity)と特異度(specificity)を計算し、これを基準に第1の訓練集合を選定し、低質量イオン別の因子負荷量(factor loading)を計算する因子負荷量の計算手段と、
    候補条件を満たす候補の低質量のイオンの中、判別性能をベースにして癌診断用低質量イオンを選択する癌診断イオンの選定手段と、
    判別対象の生物学的試料の低質量イオンの質量スペクトルを前記第1の訓練集合にソートする第2の整列手段と、
    前記判別対象の低質量イオンのピーク強度と前記因子負荷量から判別スコアを計算する第2の判別スコアの計算手段と、
    前記第2の判別スコアの計算手段の判別スコアに応じて前記判別対象を癌の陽性または陰性と判定する癌の判定手段を含むことを特徴とする癌診断装置。
  2. 前記第1の判別スコアの計算手段は、
    前記訓練候補集合の前記低質量イオンの質量スペクトルの前記ピーク強度を正規化(normalization)する正規化モジュールと、
    前記正規化したピーク強度をスケーリング(scaling)するスケーリング・モジュールと、
    前記スケーリングされたピーク強度に対して、前記生物統計学的分析を実行し、前記判別スコアを計算する判別スコアの計算モジュールを含み、
    前記判別スコアの計算モジュールは、
    主成分分析ベースの線形判別分析(principal component analysis-based linear disc
    riminant analysis、PCA-DA)を使用して前記生物統計学的分析を行い、
    前記主成分分析ベースの線形判別分析によって得られた因子負荷量と前記スケーリングされたピークの強度を共に使用して前記判別スコアを計算することを特徴とする請求項に記載の癌診断装置。
  3. 前記第2の判別スコアの計算手段は、
    前記判別対象の前記低質量イオンの質量スペクトルの前記ピーク強度を正規化(normalization)する正規化モジュールと、
    前記正規化したピーク強度をスケーリング(scaling)するスケーリング・モジュールと、
    前記スケーリングされたピーク強度と前記因子負荷量を通じて前記判別スコアを計算する判別スコアの計算モジュールを含み、
    前記判別スコアの計算モジュールは、
    前記癌診断用の低質量イオンの前記スケーリングされたピーク強度と前記因子負荷量を通じて前記判別スコアを計算することを特徴とする請求項に記載の癌診断装置。
  4. 前記スケーリング・モジュールは、
    パレート・スケーリングを実行することを特徴とする請求項またはに記載の癌診断装置。
  5. 前記癌診断用のイオン選定手段は、
    前記選択された前記第1の訓練集合から候補条件を満たす候補の低質量イオンを候補イオン集合として選択する候補イオン集合の選択手段と、
    前記選択された前記候補イオン集合の前記候補低質量イオンの個別または組み合わせ別の判別性能をベースにして癌診断用の低質量イオンを最終イオン集合として選択する最終イオン集合選択手段を含むことを特徴とする請求項に記載の癌診断装置。
  6. 前記最終イオン集合選択手段の前記判別性能の基準は、
    前記候補低質量イオン中、感度と特異度の和が基準値よりも大きいイオンを選択するか、または前記候補低質量イオンで構成されている組み合わせ別の感度と特異度の和が比較対象の組み合わせの中で最大の組み合わせを選択する第1の基準と、
    前記候補低質量イオンの組み合わせの中で、前記候補低質量イオンの数が比較対象の組み合わせの中で最も少ない組み合わせを選択する第2の基準と、
    前記候補低質量イオンの組み合わせの真陽性(true positive)事例の最小判別スコア
    と真陰性(ture negative)事例の最大判別スコアの差が比較対象の組み合わせの中で一番大きな組み合わせを選択する第3の基準とを含み、
    前記判別スコアは、前記候補低質量イオンのスケーリングされたピーク強度と前記因子負荷量を使用して計算され、癌の陽性または陰性を表すことを特徴とする請求項に記載の癌診断装置。
  7. 前記最終イオン集合選択手段は、
    前記候補イオン集合に含まれた前記候補低質量イオンを前記感度が前記特異度よりも高い高感度低質量イオンを含み、前記高感度低質量イオンを前記感度と前記特異度の和の降順でソートした高感度集合[Sns1、Sns2、Sns3 ... SnsI]と、前記特異度が前記感度よりも高い高特異度低質量イオンを含み、前記高特異度低質量イオンを前記感度と前記特異度の和の降順でソートした高特異度集合[Spc1、Spc2、Spc3 ... SpcJ]に区分するイオン区分モジュールと、
    前記高感度集合で上位階層のL個の前記高感度低質量のイオン[Sns1、Sns2、Sns3 ... SnsL]と、前記高特異度の集合で上位階層のL個の前記高特異度低質量イオン[Spc1、Spc2、Spc3 ... SpcL]のうち2つ以上の低質量イオンで構成される候補組み合わせの中、前記第1の基準、前記第2の基準および前記第3の基準のうち、少なくとも一つ以上による前記判別性能の基準により選択された組み合わせをバイオ・マーカーのグループに選定するバイオ・マーカーのグループの予備選定モジュールと、
    前記バイオ・マーカーのグループと、前記高感度集合から下位の階層のM個の前記高感度低質量のイオンと、前記高特異度の集合から下位の階層のM個の前記高特異度低質量イオンのうちの少なくとも一つ以上の低質量イオンを前記バイオ・マーカーのグループに追加された候補の組み合わせのうち、前記第1の基準、前記第2の基準および前記第3の基準のうち、少なくとも一つ以上による前記判別性能の基準によって選択された組み合わせを、前記バイオ・マーカーのグループに再選定するバイオ・マーカーグループの再選定モジュールと、
    前記高感度集合および前記高特異度の集合に下位の階層の低質量イオンが存在しなくなるまで、前記再選択過程を繰り返し、前記バイオ・マーカーのグループを最終選定するバイオ・マーカーのグループ最終選定モジュールと、
    前記候補イオン集合において、前記バイオ・マーカーのグループ最終選定モジュールから得られた前記バイオ・マーカーのグループに選定完了した組み合わせの低質量イオンを除いた残留候補イオンの集合を対象に、前記三つのバイオ・マーカーのグループの選択過程を反復実行し、追加のバイオ・マーカーのグループを選定するが、前記高感度集合、または前記高特異度の集合に、前記L個未満の質量イオンが残るまで前記追加のバイオ・マーカーのグループをさらに選定するバイオ・マーカーのグループの追加選定モジュールと、
    前記バイオ・マーカーのグループと前記追加のバイオ・マーカーの組み合わせのうち、
    真陽性および真陰性判定の正確さ(accuracy)を基準に上位階層のK個のバイオ・マーカーグループの組み合わせの低質量イオンを前記癌診断用低質量イオンに選択する癌診断用低質量イオンの最終選択モジュールとを含むことを特徴とする請求項に記載の癌診断装置。
  8. 前記Lの値は2であり、前記Mの値は1であり、前記Kの値は1〜3のいずれかの自然数であることを特徴とする請求項に記載の癌診断装置。
  9. 前記最終イオン集合選択手段は、
    前記第1の訓練集合について、独立的な第2の訓練集合を前記第1の訓練集合に追加した訓練集合を対象に低質量イオン選択過程を進行することを特徴とする請求項に記載の癌診断装置。
  10. 前記因子負荷量の計算手段は、
    前記ソートされた質量スペクトルに対して生物統計学的分析を実行し、前記生物統計学的分析の結果を基に、前記癌患者および非患者事例の中で訓練条件を満たす訓練事例を第
    1の訓練集合として選択する第1の訓練集合選択手段を含み、
    前記第1の訓練集合から因子負荷量を計算することを特徴とする請求項に記載の癌診断装置。
  11. 候補イオン集合の選択手段は、
    前記訓練事例のそれぞれに対する前記低質量イオンの前記ピーク強度と、前記生物統計学的分析を通じて得られた前記低質量イオン別の因子負荷量の積の絶対値が閾値T1よりも大きい第1の低質量イオンを前記訓練事例別に選択する第1の低質量イオン選択モジュールと、
    前記第1の低質量イオンのうち、前記訓練事例の全体の閾値T2パーセント以上の事例において共通に表れる第2の低質量イオンを前記候補イオンの集合として選択する候補イオン集合の予備選択モジュールと、
    前記第2の低質量イオンを利用し、前記訓練事例別に癌の陽性または陰性を表す判別スコアを計算し、前記判別スコアに基づく感度と特異度を計算する感度と特異度の計算モジュールと、
    前記感度が閾値N3よりも小さいか、または前記特異度が閾値N4よりも小さい場合、前記T1および前記T2のうち少なくとも一つを変更し、前記過程を繰り返し、前記候補イオン集合として選択する候補イオン集合最終選択とを含むことを特徴とする請求項10に記載の癌診断装置。
  12. 前記閾値T1は0.1であり、
    前記閾値T2は50であり、
    前記閾値N3とN4は0.9であることを特徴とする請求項11に記載の癌診断装置。
  13. 前記第1の訓練集合選択手段は、
    前記生物統計学的分析の結果に応じた感度が閾値(threshold)N1以上であり、特異度が閾値N2以上の時の癌患者および非患者の事例を前記第1の訓練集合として設定し、
    前記閾値N1とN2は、1であることを特徴とする請求項10に記載の癌診断装置。
  14. 前記癌の判定手段は、
    前記判別スコアに応じて前記判別対象を癌の陽性または陰性と判定するが、
    前記判別スコアが、基準値Sよりも大きい場合は、陽性であるとして前記判別対象の癌の情報を判断し、前記判別スコアが基準値Sよりも小さい場合は、陰性であるとして前記判別対象の癌の情報を判断し、
    前記判別対象の生物学的試料を反復測定して検出した複数の前記低質量イオンの質量スペクトルについて計算された複数の前記判別スコアの平均値で前記判別対象の前記癌の情報を判断し、
    前記基準値Sは0であることを特徴とする請求項に記載の癌診断装置。
  15. 前記低質量イオンの質量値は、18.0260、22.9797、74.0948、76.0763、102.0916、105. 1078、106.0899、107.0477、118.0822、123.0395、137.0423、137.0729、147.0573、147. 1058、169.0653、181.0656、190.0849、191.0848、191.3324、195.0785、212.3195、231. 0667、235.0053、256.0939、266.9557、267.9501、288.2033、291.0997、295.0663、300. 1297、301.1269、316.2288、317.2311、335.1862、340.2241、343.2451、345.2583、357. 0666、357.2784、366.2310、368.2551、369.3302、377.0570、379.1438、379.4765、383. 0529、384.1745、388.2688、401.0531、423.0313、428.1878、454.2090、465.3014、466. 1923、468.1851、469.2831、477.1721、478.1678、480.1715、482.3220、483.3258、496. 8683、497.7636、503.8719、508.3407、510.3265、512.3119、513.3177、518.2931、518. 8555、519.2967、519.8598、525.3449、534.2739、537.2800、538.3306、540.2629、540. 8144、542.8457、544.8692、548.2856、566.8375、581.1957、582.1888、583.2242、656. 0270、667.3291、709.3519、710.3581、711.3617、712.3683、713.3798、991.6196、992. 6209、1016.6113、1020.4817、1206.5305、1207.5571、1465.6184、1466.6096、1467.5969、2450.9701、2451.9662、及び2452.9546m/z(ただし、誤差範囲は±0.1m/z)からなるグループから選択された複数の質量値であることを特徴とする請求項に記載の癌診断装置。
  16. 前記癌診断用イオン選定手段は、
    複数の大腸癌患者および非患者の事例を、複数の大腸癌患者の事例と複数の健常者の事例で構成される第1種の判別事例と、前記複数の大腸癌患者事例と複数の大腸癌以外の癌患者の事例で構成される第2種の判別事例とに区分し、
    前記第1種の判別事例と前記第2種の判別事例に対してそれぞれ実行され、
    前記癌診断用低質量イオンが、前記第1種の判別事例の第1種の大腸癌診断用低質量イオンと、前記第2種の判別事例に対する第2種の大腸癌診断用低質量イオンに区分されることを特徴とする請求項に記載の癌診断装置。
  17. 前記判別スコアは、前記第1種の低質量イオンによる第1種の判別スコアと前記第2種の低質量イオンによる第2種の判別スコアを含み、
    前記第1種の判別スコアがCS11より大きく、前記第2種の判別スコアがCS21よりも大きい場合には、前記判別対象を大腸癌陽性と判断し、前記第1種の判別スコアがCS12よりも小さいか、または前記第2種の判別スコアがCS22よりも小さい場合には、前記判別対象を大腸癌陰性と判断し、
    前記CS11、CS12、CS21およびCS22は0であることを特徴とする請求項16に記載の癌診断装置。
  18. 前記癌診断用イオン選定手段を用いて取得した大腸癌患者と健常者とを区分する低質量イオン群には、フィブリノーゲン(fibrinogen)、フィブリノーゲンα鎖(fibrinogen alpha chain)、またはトランスサイレチン(transthyretin)が含まれることを特徴とする請求項16に記載の癌診断装置。
  19. 前記癌診断用イオン選定手段は
    複数の乳癌患者および非患者の事例を、第1種の判別事例で構成するか、複数の乳癌患者および非患者の事例を、複数の乳癌患者の事例と複数の健常者の事例で構成される第2種の判別事例と、複数の乳癌患者事例と複数の乳癌以外の癌患者の事例で構成される第3種の判別事例とに区分し、
    前記第1種の判別事例と、前記第2種の判別事例および前記第3種の判別事例に対してそれぞれ実行され、
    前記乳癌診断用低質量イオンが、前記第1種の判別事例に対する第1種の乳癌診断用低質量イオンと、前記第2種の判別事例に対する第2種の乳癌診断用低質量イオンおよび前記第3種の判別事例に対する第3種の乳癌診断用低質量のイオンとに区分されることを特徴とする請求項に記載の癌診断装置。
  20. 前記判別スコアは、前記第1種の低質量イオンによる第1種の判別スコアであり、
    前記判別スコアがBS11より大きい場合には、前記判別対象を乳癌陽性と判断し、
    前記判別スコアがBS12よりも小さい場合には、前記判別対象を乳癌陰性と判断し、
    前記BS11およびBS12は、0であることを特徴とする請求項19に記載の癌診断装置。
  21. 前記判別スコアは、前記第2種の低質量イオンによる第2種の判別スコアと前記第3種の低質量イオンによる第3種の判別スコアを含み、
    前記第2種の判別スコアがBS21より大きく、前記第3種の判別スコアがBS31よりも大きい場合には、前記判別対象を乳癌陽性と判断し、前記第2種の判別スコアがBS22よりも小さいか、または前記第2種の判別スコアがBS32よりも小さい場合には、前記判別対象を乳癌陰性と判断し、
    前記BS21、BS22、BS31およびBS32は、0であることを特徴とする請求項19に記載の癌診断装置。
  22. 前記胃癌診断用イオン選定手段は、
    複数の胃癌患者および非患者の事例を、複数の胃癌患者の事例と複数の健常者の事例で構成される第1種の判別事例と、複数の胃癌患者事例と複数の大腸癌患者の事例で構成される第2種の判別事例と、複数の胃癌患者の事例と複数の乳癌患者の事例で構成される第3種の判別事例と、前記複数の胃癌患者の事例と複数の非ホジキンリンパ腫(non-Hodgkin lymphoma、NHL)患者の事例で構成される第4種の判別事例に区分するか、または
    複数の胃癌患者と非患者の事例を、前記第1種の判別事例と前記複数の胃癌患者および健常者の事例と複数の大腸癌、乳癌および非ホジキンリンパ腫の患者の事例で構成される第5種の判別事例に区分し、
    前記第1種の判別事例、前記第2種の判別事例、前記第3種の判別事例、前記第4種の判別事例および前記第5種の判別事例に対してそれぞれ行われ、
    前記胃癌診断用低質量イオンが、前記第1種の判別事例の第1種の胃癌診断用低質量のイオン、前記第2種の判別事例の第2種の胃癌診断用低質量のイオン、前記第3種の判別事例の第3種の胃癌診断用低質量のイオン、前記第4種の判別事例の第4種の胃癌診断用低質量のイオンおよび前記第5種の判別事例の第5種の胃癌診断用低質量イオンに区分されることを特徴とする請求項に記載の癌診断装置。
  23. 前記判別スコアは、前記第1種の低質量イオンによる第1種の判別スコア、前記第2種の低質量イオンによる第2種の判別スコア、前記第3の種低質量イオンによる第3種の判別スコアおよび前記第4種の低質量イオンによる第4種の判別スコアを含み、
    前記第1種の判別スコアがGS11より大きく、前記第2種の判別スコアがGS21より大きく、前記第3種の判別スコアがGS31より大きく、前記第4種の判別スコアがGS41よりも大きい場合には、前記判別対象を胃癌陽性と判断し、
    前記第1種の判別スコアがGS12より小さいか、または前記第2種の判別スコアがGS22より小さいか、または前記第3種の判別スコアがGS32より小さいか、または前記第4種の判別スコアがGS42よりも小さい場合には、前記判別対象を胃癌陰性と判断し、
    前記GS11、GS12、GS21、GS22、GS31、GS32、GS41およびGS42は0であることを特徴とする請求項22に記載の癌診断装置。
  24. 前記判別スコアは、前記第1種の低質量イオンによる第1種の判別スコアと前記第5種の低質量イオンによる第5種の判別スコアを含み、
    前記第1種の判別スコアがGS11より大きく、前記第5種の判別スコアがGS51よりも大きい場合には、前記判別対象を胃癌陽性と判断し、前記第1種の判別スコアがGS12よりも小さいか、または前記第5種の判別スコアがGS52よりも小さい場合には、前記判別対象を胃癌陰性と判断し、
    前記GS11、GS12、GS51およびGS52は0であることを特徴とする請求項22に記載の癌診断装置。
JP2015549231A 2012-01-03 2012-12-03 癌診断装置 Expired - Fee Related JP6134809B2 (ja)

Applications Claiming Priority (15)

Application Number Priority Date Filing Date Title
KR10-2012-0000730 2012-01-03
KR20120000745 2012-01-03
KR10-2012-0000729 2012-01-03
KR20120000730 2012-01-03
KR20120000729 2012-01-03
KR10-2012-0000745 2012-01-03
KR10-2012-0129390 2012-11-15
KR1020120129390A KR101461615B1 (ko) 2012-01-03 2012-11-15 암 진단 장치
KR1020120134830A KR101439981B1 (ko) 2012-01-03 2012-11-26 유방암 진단 장치
KR1020120134825A KR101439975B1 (ko) 2012-01-03 2012-11-26 대장암 진단 장치
KR10-2012-0134825 2012-11-26
KR10-2012-0134830 2012-11-26
KR1020120134828A KR101439977B1 (ko) 2012-01-03 2012-11-26 위암 진단 장치
KR10-2012-0134828 2012-11-26
PCT/KR2012/010358 WO2013103197A1 (ko) 2012-01-03 2012-12-03 암 진단 장치

Publications (3)

Publication Number Publication Date
JP2016511821A JP2016511821A (ja) 2016-04-21
JP2016511821A5 JP2016511821A5 (ja) 2016-06-23
JP6134809B2 true JP6134809B2 (ja) 2017-05-24

Family

ID=48992271

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015549231A Expired - Fee Related JP6134809B2 (ja) 2012-01-03 2012-12-03 癌診断装置

Country Status (4)

Country Link
US (1) US10042983B2 (ja)
JP (1) JP6134809B2 (ja)
KR (1) KR101461615B1 (ja)
SG (1) SG11201502499UA (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101552011B1 (ko) 2013-08-21 2015-09-09 이화여자대학교 산학협력단 리소포스파티딜콜린 및 호모시스테인산을 포함하는 난소암 진단용 조성물 및 이를 사용하여 난소암을 진단하는 방법
JP6750140B2 (ja) * 2014-08-22 2020-09-02 アボット・ラボラトリーズAbbott Laboratories 直腸結腸がんを早期検出するための方法
KR20160104330A (ko) * 2015-02-26 2016-09-05 국립암센터 난소암 진단 장치와 난소암 진단 정보 제공 방법
CN108603859B (zh) * 2016-06-10 2021-06-18 株式会社日立制作所 尿中代谢物在制备癌的评价方法所使用的试剂盒中的用途
KR101835979B1 (ko) * 2016-06-13 2018-03-08 국립암센터 담도암 진단 정보 제공 방법과 담도암 진단 장치
WO2020204373A2 (ko) * 2019-04-01 2020-10-08 국립암센터 고형암 진단 장치와 고형암 진단 정보 제공 방법

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05265636A (ja) 1992-03-17 1993-10-15 Sharp Corp 打点入力の補正装置
JP3859248B2 (ja) 1995-07-05 2006-12-20 富士通株式会社 超音波座標入力装置
JPH0991080A (ja) 1995-09-25 1997-04-04 Alps Electric Co Ltd タッチ位置座標検出装置
KR100234990B1 (ko) 1997-09-26 2000-01-15 박세만 석탄재를 이용한 건자재 및 그의 제조방법
EP1426766A1 (en) 2002-11-29 2004-06-09 Christine König Differential diagnosis of breast cancer by protein profiling using mass spectrometry
WO2004102190A1 (en) 2003-05-15 2004-11-25 Europroteome Ag Differential diagnosis of colorectal cancer and other diseases of the colon
US7864161B2 (en) 2004-06-17 2011-01-04 Adrea, LLC Use of a two finger input on touch screens
US8466893B2 (en) 2004-06-17 2013-06-18 Adrea, LLC Use of a two finger input on touch screens
JP4453572B2 (ja) 2005-02-22 2010-04-21 ソニー株式会社 半導体集積回路の製造方法
JP4579176B2 (ja) 2006-03-15 2010-11-10 株式会社オリンピア メダル送り装置
US20090136960A1 (en) 2006-03-24 2009-05-28 The Regents Of The University Of Michigan Methods and compositions for the identification of cancer markers
EP2010895A2 (en) 2006-03-29 2009-01-07 Cangen Biotechnologies, Inc. Apparatus and method for predicting disease
EP2013800A2 (en) 2006-03-29 2009-01-14 Cangen Biotechnologies, Inc. Apparatus and method for filtration to enhance the detection of peaks
KR100803400B1 (ko) 2006-08-17 2008-02-14 김찬회 초음파 터치스크린용 보호패널 및 그 제조방법
KR20080042560A (ko) 2006-11-10 2008-05-15 정재호 진동파를 이용한 터치패널
US20090002328A1 (en) 2007-06-26 2009-01-01 Immersion Corporation, A Delaware Corporation Method and apparatus for multi-touch tactile touch panel actuator mechanisms
JP5151399B2 (ja) 2007-10-30 2013-02-27 セイコーエプソン株式会社 タッチパネル、表示装置、電子機器
EP2391886A4 (en) 2009-04-10 2013-04-17 Canon Kk METHOD FOR FORMING MASS IMAGE

Also Published As

Publication number Publication date
KR101461615B1 (ko) 2015-04-22
JP2016511821A (ja) 2016-04-21
KR20130079986A (ko) 2013-07-11
SG11201502499UA (en) 2015-05-28
US20130231869A1 (en) 2013-09-05
US10042983B2 (en) 2018-08-07

Similar Documents

Publication Publication Date Title
Backes et al. Histologic factors associated with need for surgery in patients with pedunculated T1 colorectal carcinomas
JP6134809B2 (ja) 癌診断装置
Srinivasan et al. Accurate diagnosis of acute graft-versus-host disease using serum proteomic pattern analysis
US20180011099A1 (en) Compositions, Methods and Kits for Diagnosis of Lung Cancer
Wang et al. Development and validation of a highly sensitive urine-based test to identify patients with colonic adenomatous polyps
CN110114680A (zh) 用于诊断肺癌的组合物、方法和试剂盒
US20240159753A1 (en) Methods for the detection and treatment of lung cancer
Shen et al. Circulating metabolite profiles to predict overall survival in advanced non-small cell lung cancer patients receiving first-line chemotherapy
US9640375B2 (en) Method for crystallizing low mass ions for diagnosing colorectal cancer and method for diagnosing colorectal cancer using same
Chen et al. Nomogram prediction of chronic postsurgical pain in patients with lung adenocarcinoma after video-assisted thoracoscopic surgery: a prospective study
Sazonova et al. Development and validation of diffuse idiopathic pulmonary neuroendocrine hyperplasia diagnostic criteria
Zeng et al. Development and validation of survival prediction model for gastric adenocarcinoma patients using deep learning: A SEER-based study
US9903878B2 (en) Biomarker for human prostate cancer
KR101439977B1 (ko) 위암 진단 장치
Cheng et al. Early signatures of breast cancer up to seven years prior to clinical diagnosis in plasma cell-free DNA methylomes
EP2623984B1 (en) Apparatus for screening cancer
KR101439975B1 (ko) 대장암 진단 장치
EP4357782A1 (en) Protein biomarker panel for the diagnosis of colorectal cancer
KR101439981B1 (ko) 유방암 진단 장치
US20080312514A1 (en) Serum Patterns Predictive of Breast Cancer
Kim et al. P2. 11-06 Serum Proteomic Signature as a Potential Biomarker for Survival in Patients with NSCLC Receiving Immunotherapy
Stephens Novel AI Blood Testing Technology Can ID Lung Cancers with High Accuracy
Zyla et al. Combining low-dose CT-based radiomics and metabolomics for early lung cancer screening support
Jiang et al. Protocol for identifying metabolite biomarkers in patient uterine fluid for early ovarian cancer detection
WO2024107923A1 (en) Methods for the detection and treatment of lung cancer

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151127

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160428

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160920

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170411

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170424

R150 Certificate of patent or registration of utility model

Ref document number: 6134809

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees