JP2018200322A - 分類システムおよびそのキットを使用した肺疾患の同定および診断方法 - Google Patents

分類システムおよびそのキットを使用した肺疾患の同定および診断方法 Download PDF

Info

Publication number
JP2018200322A
JP2018200322A JP2018153283A JP2018153283A JP2018200322A JP 2018200322 A JP2018200322 A JP 2018200322A JP 2018153283 A JP2018153283 A JP 2018153283A JP 2018153283 A JP2018153283 A JP 2018153283A JP 2018200322 A JP2018200322 A JP 2018200322A
Authority
JP
Japan
Prior art keywords
biomarkers
biomarker
factor
growth factor
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018153283A
Other languages
English (en)
Inventor
ストリーパー ロバート・ティー
T Streeper Robert
ストリーパー ロバート・ティー
イズビッカ エルジュビェタ
Izbicka Elzbieta
イズビッカ エルジュビェタ
マイカレック ジョエル
Michalek Joel
マイカレック ジョエル
ラウデン クリス
Louden Chris
ラウデン クリス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cancer Prevention and Cure Ltd
Original Assignee
Cancer Prevention and Cure Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cancer Prevention and Cure Ltd filed Critical Cancer Prevention and Cure Ltd
Publication of JP2018200322A publication Critical patent/JP2018200322A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57423Specifically defined cancers of lung
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/60Complex ways of combining multiple protein biomarkers for diagnosis

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Immunology (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Hematology (AREA)
  • Chemical & Material Sciences (AREA)
  • Urology & Nephrology (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Cell Biology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

【課題】分類システムおよびそのキットを使用した肺疾患の同定および診断方法を提供すること。
【解決手段】本発明は、肺疾患、例えば非小細胞肺癌または反応性気道疾患の診断に有用なバイオマーカーおよびバイオマーカーの組み合わせを提供する。これらバイオマーカーの測定値は、個人が肺疾患を患っていることに関する見込みの決定を補助するための分類システム、例えばサポートベクトルマシンまたはアダブーストに入力されている。これらのバイオマーカーおよびバイオマーカーの組み合わせを検出するための薬剤を含むキット、ならびに肺疾患の診断を補助するシステムもまた提供する。
【選択図】図1A

Description

発明の背景
(a) 技術分野
〔001〕 本発明は、バイオマーカーおよびそれらのキット、ならびにそれらのバイオマーカーに基づいて、疾患の有無の見込みの決定を補助するシステムを使用した、肺疾患の検出、同定、および診断に関する。より具体的には、本発明は、特定のバイオマーカーの発現レベルを測定し、これらの測定値を、サポートベクトルマシンなどの分類システムに入力することによる、非小細胞肺癌および反応性気道疾患の診断に関する。
(b)関連する文献の記載
ヒト肺組織の病理
〔002〕 何百万人もの米国人が、喘息や肺癌などの呼吸器系の症状に罹患している。実際のところ、米国肺協会(登録商標)は、2000万人もの米国人が喘息にかかっていると報告している。米国がん協会は、2007年の1年間だけでも、呼吸器系の癌の新規発症例が229,400件で、呼吸器系の癌による死亡例が164,840件だったと推定した。まだ癌が限局性である時に癌が検出されていれば、全癌例の5年生存率は46%であるが、肺癌患者の5年生存率は僅か13%である。それに対応して、肺癌は16%しか疾患が広がる前には発見されない。肺癌は癌細胞の病理に基づいて、通常、主に2種類に分類されている。それぞれの種類には、癌性に転換した細胞型に応じた名前が付けられている。小細胞肺癌はヒト胚組織の小細胞に由来し、非小細胞肺癌は通常、小細胞型でない肺癌全てを含む。一般的に、全ての非小細胞型に対する治療が同じであることから、非小細胞肺癌とまとめられている。また、非小細胞肺癌、すなわちNSCLCは肺癌全体の約75%を占めている。
〔003〕 肺癌患者の生存率が低いことは主に、肺癌を早期に診断することが難しいという事実による。肺癌を診断する、つまりあるヒトに肺癌が存在するかを同定するための現行の方法は、X線撮影法、コンピューター断層(CT)撮影法、および腫瘍の有無を物理的に確認するための同様の肺試験に限られている。そのため、肺癌の診断は、症状への反応だけによって行われることが多く、これは、疾患がヒトに存在してから十分な時間存在していたこと、および物理的に検出可能な量を生成するのに十分な時間が経過したことの証拠である。
〔004〕 同様に、喘息を検出するための現行の方法も、通常、再発性の喘鳴、咳、および胸苦しさなどの症状が顕在化してしばらく経ってから行われる。現在行われている喘息の検出方法は、一般的に、肺活量測定または負荷試験などの肺機能試験に限られている。さらにこれらの試験は、他の病理つまり反応性気道疾患、例えば慢性閉塞性肺疾患(COPD)、気管支炎、肺炎、およびうっ血性心不全を除くために、他の多くの試験と一緒に行われるよう、医師によって指示されることが多い。
分類システム
〔005〕 パターンを認識し、関係のないデータにすぎない他の情報をも含む大量のデータベースから重要な情報を抽出することを可能にするために、機械学習法のような、データ解析およびデータマイニングのための様々な分類システムが広く探索されている。学習機械は、汎化するために既知の分類を使用して学習させることが可能なアルゴリズムを含むものである。その後、訓練した学習機械アルゴリズムを結果が分かっていない事例に応用して、結果を予測することが、すなわち、学習したパターンに応じてデータを分類することができる。ニューラルネットワーク、隠れマルコフモデル、信念ネットワークおよびカーネル法に基づく分類器、例えばサポートベクトルマシンを含む機械学習法は、データが大量であること、パターンにノイズが多いことおよび一般理論がないことを特徴とする問題に有用である。
〔006〕 問題のパターン分類、回帰およびクラスタリングの成功例の多くは、パターンのペアの類似性を決定するためのカーネルに基づいている。これらのカーネルは通常、実数のベクトルとして表すことが可能なパターン用に定義される。例えば、線形カーネル、ラジアル基(radial basis)カーネルおよび多項カーネルは全て、実際のベクトルのペアの類似性を測定するものである。このようなカーネルは、データが実数の列として、この方法において最もよく表される場合に適している。カーネルの選択は、特徴空間におけるデータ表現の選択と対応している。使用法の多くで、パターンは様々な階層を有している。これらの階層を利用して、学習アルゴリズムの性能を改善することができる。機械学習法で一般的に生じる階層データの種類の例としては、文字列、文書、木、グラフ、例えばウェブサイトまたは化学分子、シグナル、例えばマイクロアレイ発現プロファイル、スペクトル、画像、時空的データ、関係型データおよび生化学的濃度などがある。
〔007〕 分類システムは医薬分野で使用されてきた。例えば、病状の発生を診断および予測する方法が、様々なコンピューターシステムや分類システム、例えばサポートベクトルマシンを利用して提唱されてきた。例えば、米国特許第7,321,881号;同第7,467,119号;同第7,505,948号;同第7,617,163号;同第7,676,442号;同第7,702,598号;同第7,707,134号;および同第7,747,547号を参照のこと。これらはここで参照することによりその全体が本明細書に組み込まれる。しかしながらこれらの方法の精度は、ヒトの胚組織での病理、例えば非小細胞肺癌および/または反応性気道疾患の診断および/または予測では、高いレベルではない。
〔008〕 このように当該分野では、ヒトの胚組織の病理を、特に発症の初期段階で診断するための単純で信頼のおける方法がない。さらに、特定の肺組織の病理の有無を示すことができる血液検査も今のところない。そのため、疾患の進行の初期に肺癌の存在を確認するための方法の開発が望まれている。同様に、臨床上明らかな症状が現れるよりも前に、喘息および非小細胞肺癌を診断するための方法、ならびに喘息や非小細胞肺癌と他の肺疾患、例えば感染を区別するための方法の開発も望まれている。
発明の好ましい態様の概要
〔009〕 本発明は、様々な分類システム、例えばサポートベクトルマシンを利用して、対象における特定のバイオマーカーを評価するための強固な方法を提供することで、これらの需要に対処する。
〔010〕 本発明は、対象を生理学的に特徴付ける方法を提供し、この方法は、最初に対象の生理学的試料を収集する工程;次いでその試料での複数のバイオマーカーのバイオマーカー測定値を決定する工程;および最後に、分類システムを利用し、バイオマーカー測定値に基づいて、試料を分類する工程を含み、ここでこの試料の分類は、この対象の生理的な状況もしくは状態、または疾患状況の変化と関係がある。通常、この分類システムは機械学習システムであり、好ましくはカーネルまたは分類および分類システムに基づく回帰木であり、より好ましくはサポートベクトルマシン(SVM)またはアダブーストである。
〔011〕 一態様では、この生理学的に特徴付ける方法は、対象における非小細胞肺癌の有無を示す診断、または非小細胞肺癌の発生段階を示す診断を提供する。別の態様では、この生理学的に特徴付ける方法は、対象における反応性気道疾患、例えば喘息または閉塞性肺疾患を示す診断を提供する。さらに別の態様では、この生理学的に特徴付ける方法は、対象における肺疾患を示す診断を提供し、ここで複数のバイオマーカーには、前記試料中の反応性気道疾患と非小細胞肺癌を示すもの、反応性気道疾患を示すものとなる複数のバイオマーカー、および非小細胞肺癌を示すものとなる複数のバイオマーカーの区別を補助するマーカーが含まれ、この複数バイオマーカーは同一のものではなく、かつ、試料は、試料を3通りに分類するシステム、すなわち、対象の(i)反応性気道疾患と非小細胞肺癌を示すもの;(ii)反応性気道疾患の有無を示すもの;および(iii)非小細胞肺癌の有無を示すものの区別を補助するシステムを使用して、バイオマーカー測定値に基づいて分類され、その結果、対象は、どの条件が3つの分類中の2つに見られるかに応じて、(1)反応性気道疾患であるか、(2)非小細胞肺癌であるか、または(3)疾患に罹患していないと決定される。
〔012〕 本発明はまた、バイオマーカーのセットそれぞれの複数のバイオマーカー測定値を含む試験データを分類する方法を提供し、この方法は、哺乳類の試験対象におけるバイオマーカーのセットに関する複数のバイオマーカー測定値を含む試験データを受信する工程;次いで、電子的に記憶させた学習データベクトルのセットで訓練したサポートベクトルマシンの電子表示を使って試験データを評価する工程、ここで各学習データベクトルは個々の哺乳動物を表し、かつ、対応する哺乳動物に関するバイオマーカーのセットの各バイオマーカーのバイオマーカー測定値を含み、さらに各学習データベクトルは対応する哺乳動物の病状に関する分類を含み、最後に、評価する工程に基づいて、哺乳類の試験対象の分類を出力する工程、を含む。好ましくは、哺乳類の試験対象はヒトである。別の形態では、評価する工程は、電子的に記憶されている学習データベクトルのセットにアクセスすることを含む。
〔013〕 別の形態において本発明は、バイオマーカーのセットそれぞれの複数のバイオマーカー測定値を含む試験データを分類するために、サポートベクトルマシンを訓練してモデルを生成する方法を提供し、この方法は、電子的に記憶されている学習データベクトルのセットにアクセスする工程、ここで各学習データベクトルは個々のヒトを表し、かつ、対応するヒトに関するバイオマーカーのセットの各バイオマーカーのバイオマーカー測定値を含み、各学習データベクトルはさらに対応するヒトの病状に関する分類を含み、および、電子的に記憶されている学習データベクトルのセットを使用して、サポートベクトルマシンの電子表示を訓練する工程、を含む。続いて、本発明は、ヒト試験対象におけるバイオマーカーのセットに関する複数のバイオマーカー測定値を含む試験データを受信する工程、および訓練したサポートベクトルマシンの電子表示(すなわち、訓練したサポートベクトルマシンによって生成されたモデル)を利用して試験データを評価する工程;および、最後に、評価する工程に基づいたヒト試験対象の分類を出力する工程、を提供する。
〔014〕 さらに別の態様では、本発明は、バイオマーカーのセットそれぞれの複数のバイオマーカー測定値を含む試験データを分類する方法を提供する。この方法は、ヒト試験対象に関する試験データを受信する工程を含み、ここで試験データは、バイオマーカーのセットの少なくとも各バイオマーカーのバイオマーカー測定値を含んでいる。この方法はまた、電子的に記憶されている、学習データベクトルの第一のセットを使用して訓練したサポートベクトルマシンの電子表示を使用して試験データを評価する工程を含み、ここで各学習データベクトルの第一のセットの学習データベクトルは個々のヒトを表し、かつ、対応するヒトに関するバイオマーカーのセットの少なくとも各バイオマーカーのバイオマーカー測定値を含んでいる。学習データベクトルの第一のセットの各学習データベクトルはまた、対応するヒトの病状に関する分類を含む。この方法はさらに、評価する工程に基づいたヒト試験対象の分類を出力する工程を含む。この態様では、バイオマーカーのセットに含まれているそれぞれのバイオマーカーは、(A)順序付けられたバイオマーカーの初期セグメントは、第二セットの学習データベクトルの補正済み分類のパーセンテージに関しては、順序付けられたバイオマーカーの他の初期セグメントの中の極大であり、およびここで第二セットの学習データベクトルの各学習データベクトルは個々のヒトを表し、かつ、対応するヒトのバイオマーカーのセットの少なくとも各バイオマーカーのバイオマーカー測定値を含み、第二セットの学習データベクトルの各学習データベクトルはさらに、対応するヒトの病状に関する分類を含んでいる、それぞれのバイオマーカーに関する2群の濃度測定値のマージン分布の中心傾向の関数によって最大から最小に順序付けられたバイオマーカーの該初期セグメントの中にあるか、または(B)(A)で同定したバイオマーカーの該初期セグメント中に含まれているバイオマーカーに関する一次相互作用器であるかのいずれかである。
〔015〕 通常、本発明の方法は、病状の有無、ここで病状は好ましくは肺疾患であり、より好ましくは非小細胞肺癌または反応性気道疾患、例えば喘息のいずれかである、に関して試験対象を分類する。バイオマーカー測定値は、実施例で記載のバイオマーカーから選択された、少なくとも1つのタンパク質の血漿濃度測定値を含んでいてもよい。好ましくは、バイオマーカー測定値は、少なくとも4種類の別個のバイオマーカーの血漿濃度を含むか、あるいはバイオマーカー測定値は、少なくとも6種類の別個のバイオマーカー、またはさらに少なくとも10種類の別個のバイオマーカー、または少なくとも18種類の別個のバイオマーカーの血漿濃度を含み得る。学習ベクトルのセットは、少なくとも30のベクトル、50のベクトル、またはさらに100のベクトルを含み得る。一形態では、分類器は、線形カーネル、ラジアル基底カーネル、多項カーネル、統一(uniform)カーネル、三角カーネル、Epanechnikovカーネル、四次多項(quartic)(二乗重み)カーネル、三次三乗(tricube)(三乗重み)カーネル、およびコサインカーネルから選択される1つまたは複数のカーネル関数を含むサポートベクトルマシンである。別の形態では、分類器は、アダブーストを使用して、例えば、ID3またはC4.5に基づく最初の分類器から発展させる。
〔016〕 本発明はまた、バイオマーカーのセットそれぞれの、複数のバイオマーカー測定値を含む試験データを分類するためのシステムを提供する。ここでこのシステムはコンピューターを含み、コンピューターは電子的に記憶されている学習データベクトルのセットを使って訓練することが可能なサポートベクトルマシンの電子表示を含んでおり、各学習データベクトルは個々のヒトを表し、かつ、対応するヒトに関するバイオマーカーのセットの、各バイオマーカーのバイオマーカー測定値を含み、各学習データベクトルはさらに、対応するヒトの病状に関する分類を含んでおり、電子的に記憶されている学習データベクトルのセットはコンピューターに操作可能に接続されている。コンピューターはまた、ヒト試験対象におけるバイオマーカーのセットに関する複数のバイオマーカー測定値を含む試験データを受け取るように構成されており、コンピューターはさらに、訓練後のサポートベクトルマシンの電子表示を使って試験データを評価するように、かつ、この評価に基づいたヒト試験対象の分類を出力するように構成されている。
〔017〕 別の態様において本発明は、バイオマーカーのセットそれぞれの、バイオマーカー測定値を含む試験データを分類するシステムを提供する。ここでこのシステムはコンピューターを含み、コンピューターは順に、試験対象の病状に関して試験データを分類ために訓練したサポートベクトルマシンの電子表示を含み、訓練は電子的に記憶されている学習データベクトルのセットに基づくものであり、各学習データベクトルは個々のヒトを表し、かつ、対応するヒトに関するバイオマーカーのセットの各バイオマーカーのバイオマーカー測定値を含み、各学習データベクトルはさらに、対応するヒトの病状に関する分類を含んでいる。コンピューターは、ヒト試験対象におけるバイオマーカーのセットに関する複数のバイオマーカー測定値を含む試験データを受け取るように構成されており、コンピューターはさらに、訓練したサポートベクトルマシンの電子表示を使って試験データを評価するように、かつ、この評価に基づいたヒト試験対象の分類を出力するように構成されている。
〔018〕 いずれの態様においても、本発明のこのシステムは、上述した方法のいずれを実施するのにも適している。特定の形態においては、システムのいずれの態様のコンピューターもさらに、(a)バイオマーカーの上位セットに含まれている各バイオマーカーに関して、それぞれのバイオマーカーに関する2群の濃度測定値のマージン分布間の距離を計算し、それによって複数の距離を生成し;(b)その距離に従って、バイオマーカーの上位セットに含まれているバイオマーカーを順序付け、それによって順序付けられたバイオマーカーのセットを生成し;(c)順序付けられたバイオマーカーのセットの、複数の初期セグメントのそれぞれに関して、学習データに基づいてモデルフィットの指標を計算し;(d)順序付けられたバイオマーカーのセットの好ましい初期セグメントが選択されるように、順序付けられたバイオマーカーのセットの初期セグメントを、モデルフィットの最大値型指標に従って選択し;(e)バイオマーカーの空集合から開始し、バイオマーカーの下位セットを生成するために、順序付けられたバイオマーカーのセットの、好ましい初期セグメントからさらなるバイオマーカーを再帰的に追加し、ここで各さらなるバイオマーカーは、(1)好ましい初期セグメントに含まれている残りのバイオマーカーの中でも、それを追加することで、モデルフィットが最大に改良される場合、および(2)それを追加することで、モデルフィットが少なくとも予め設定した閾値までは改良される場合に、既存のバイオマーカーの下位セットに追加され;および(f)それ以上バイオマーカーを追加しても、予め設定しておいた閾値より、そのモデルフィット指標を超えるモデルフィットの指標が得られない場合には、既存のバイオマーカーの下位セットへのバイオマーカーの追加を停止し、それにより、バイオマーカーの下位セットを選択する、ために構成されている論理を使用して、バイオマーカーの上位セットからバイオマーカーのセットを選択するために構成されていてもよい。
〔019〕 本明細書で提供する方法およびシステムは、一般的に90%を越える精度(例えば、感度および特異度)で、肺の病理(例えば、癌や喘息)を、診断および予測することができる。これらの結果は、非小細胞肺癌などの肺の病理を診断および予測するための、現在使用可能な方法に有意な進歩をもたらすものである。
実施例1の正常(NO)集団中のバイオマーカーの、蛍光強度レベルの平均、および標準偏差と相対的標準偏差を示している。 実施例1の非小細胞肺癌(LC)集団中のバイオマーカーの、蛍光強度レベルの平均、および標準偏差と相対的標準偏差を示している。 実施例1の喘息(AST)集団中のバイオマーカーの、蛍光強度レベルの平均、および標準偏差と相対的標準偏差を示している。 実施例1の、NO集団に対するAST集団中の、NO集団に対するLC集団中の、およびLC集団に対するAST集団中の、各バイオマーカーの蛍光強度の平均の変化(%)を示している。 実施例1の正常(NO)女性集団中のバイオマーカーの、蛍光強度レベルの平均、および標準偏差と相対的標準偏差を示している。 実施例1の非小細胞肺癌(LC)女性集団中のバイオマーカーの、蛍光強度レベルの平均、および標準偏差と相対的標準偏差を示している。 実施例1の喘息(AST)女性集団中のバイオマーカーの、蛍光強度レベルの平均、および標準偏差と相対的標準偏差を示している。 実施例1の、NO女性集団に対するAST集団中の、NO女性集団に対するLC集団中の、およびLC女性集団に対するAST集団中の、各バイオマーカーの蛍光強度の平均の変化(%)を示している。 実施例1の正常(NO)男性集団中のバイオマーカーの、蛍光強度レベルの平均、および標準偏差と相対的標準偏差を示している。 実施例1の非小細胞肺癌(LC)男性集団中のバイオマーカーの、蛍光強度レベルの平均、および標準偏差と相対的標準偏差を示している。 実施例1の喘息(AST)男性集団中のバイオマーカーの、蛍光強度レベルの平均、および標準偏差と相対的標準偏差を示している。 実施例1の、NO男性集団に対するAST集団中の、NO男性集団に対するLC集団中の、およびLC男性集団に対するAST集団中の、各バイオマーカーの蛍光強度の平均の変化(%)を示している。 実施例1の、AST女性集団と比較したAST男性集団中の、LC女性集団と比較したLC男性集団中の、およびNO女性集団と比較したNO男性集団中の、各バイオマーカーの蛍光強度の平均の変化(%)を示している。 様々な分子とHGF(肝細胞増殖因子)との関係を示している。この図はARIADNE PATHWAY STUDIO(登録商標)で作成した。 アダブーストのROC曲線を示している。 SVMのROC曲線を示している。 男性に限定したアダブーストのROC曲線を示している。 女性に限定したアダブーストのROC曲線を示している。 アダブーストモデルに基づく選択した様々なプロットを示している。 男性についてのアダブーストモデルに基づいた、選択した様々なプロットを示している。 女性についてのアダブーストモデルに基づいた、選択した様々なプロットを示している。 アダブーストモデルの精度分布を示している。 アダブーストモデルの感度の分布を示している。 アダブーストモデルの特異度の分布を示している。
〔044〕 本発明は、バイオマーカーを使用した、様々な肺疾患の検出、同定、および診断方法に関する。これらの方法は、特定のバイオマーカーのバイオマーカー測定値を決定する工程、および分類システム中のこれらバイオマーカー測定値を使用して、個人が非小細胞肺癌および/または反応性気道疾患(例えば、喘息、慢性閉塞性肺疾患など)を有する見込みを決定する工程を含む。本発明はまた、肺疾患の見込みの決定を補助するためのシステムの構成要素として、これらのバイオマーカーを検出するための検出剤を含むキット、またはこれらのバイオマーカーのバイオマーカー測定値を検出するための手段を提供する。
〔045〕 非小細胞肺癌または喘息であると診断された患者集団、ならびに非小細胞肺癌および/または喘息ではないことが、医師による確認によって診断された患者集団に由来する血漿中の、59種類の選択したバイオマーカーの発現レベルを測定することによって、代表的なバイオマーカーを同定した。この方法については実施例1で詳細に説明する。
定義
〔046〕 本明細書で使用する場合、「バイオマーカー」または「マーカー」とは、その生体システムの生理学的な状態の特徴を示すものとして、客観的に測定することが可能な生物学的な分子である。本開示の目的では、生物学的な分子には、イオン、低分子、ペプチド、タンパク質、翻訳後修飾を受けたペプチドおよびタンパク質、ヌクレオシド、RNAやDNAを含むヌクレオチドおよびポリヌクレオチド、糖タンパク質、リポタンパク質、ならびにこれらを共有的におよび非共有的に修飾した様々な分子が含まれる。生物学的な分子には、生物学的なシステムの機能にとって天然の、生物学的なシステムの機能の特徴、および/または生物学的なシステムの機能にとって必須の、これらの実体のいずれもが含まれる。バイオマーカーの多くはポリペプチドであるが、バイオマーカーはポリペプチドとして発現される遺伝子産物の翻訳前の形態を表すmRNAであってもまたは修飾されたmRNAであってもよく、あるいは、それらはポリペプチドの翻訳後修飾を含んでいてもよい。
〔047〕 本明細書で使用する場合、「バイオマーカー測定値」とは、疾患の有無を特徴付けるのに有用なバイオマーカーに関する情報である。そのような情報は、濃度もしくは濃度の割合である測定された値を含んでいてもよく、あるいは、組織もしくは体液中のバイオマーカーの発現の量であっても、もしくは発現を量的に示すものであってもよい。各バイオマーカーは、ベクトル空間中の次元として表すことができ、ここで各ベクトルは、特定の対象と関連する複数のバイオマーカー測定値から成り立っている。
〔048〕 本明細書で使用する場合、「下位セット(サブセット)」とは適切な下位セットであり、「上位セット(スーパーセット)」とは適切な上位セットである。
〔049〕 本明細書で使用する場合、「対象」は、いずれの動物も意味するが、好ましくは哺乳動物であり、例えば、ヒトなどである。多くの態様において対象は、肺疾患を罹患している、または肺疾患を罹患するリスクのあるヒト患者である。
〔050〕 本明細書で使用する場合、「生理学的な試料」には、体液および組織に由来する試料が含まれる。体液には、全血、血漿、血液血清、喀痰、尿、汗、リンパ液、および肺胞洗浄が含まれる。組織試料には、固形肺組織または他の固形組織由来の生検、リンパ節生検組織、転移性病巣の生検が含まれる。生理学的な試料の収集方法は良く知られている。
〔051〕 本明細書で使用する場合、「検出剤」には、本明細書に記載のバイオマーカーを特異的に検出する試薬およびシステムが含まれる。検出剤には、試薬、例えば抗体、核酸プローブ、アプタマー、レクチン、または特定のマーカーもしくは目的の試料に含まれている可能性のある特定のマーカーと他のマーカーとを区別するのに有効なマーカーに特に親和性を有する他の試薬、およびシステム、例えば、上述した結合させた試薬あるいは固定した試薬を使用するセンサーなどのセンサーを含む。
一次相互作用器
〔052〕 生命を維持するのに必要な、細胞のおよび有機的な、多くの生理学的な機能を促進し、制御するために、生物学的な分子は互いに相互作用しなくてはならない。これらの相互作用は、一種のコミュニケーションと考えることができる。このコミュニケーション中では、多種多様な生物学的な分子をメッセージと見なすことが可能である。これらの分子は、シグナル伝達機能に必須の部分として、他の種類の生物学的な分子を含む、多様な標的と必然的に相互作用する。
〔053〕 相互作用している分子の一種は一般に、受容体として知られている。それら受容体は、これも相互作用する分子であるリガンドと結合する。別の型の直接的な分子間相互作用には、コファクターまたはアロステリックエフェクターと酵素との結合がある。これらの分子間相互作用は、細胞および生物の必須の生命機能の実行および制御に一緒になって機能する、シグナル伝達分子のネットワークを形成する。本発明で使用する用語では、これらの相互作用分子はそれぞれバイオマーカーである。本発明の特定のバイオマーカーは、特定のバイオマーカーのレベルと協調して、そのレベルが上昇または低下する他のバイオマーカーと生理学的に関連している。これら他の関連のあるバイオマーカーは、本発明の特定のバイオマーカーについて、「一次相互作用器」と呼ばれる。
〔054〕 「一次相互作用器」は、特定の生物学的な分子と直接相互作用する分子実体である。例えば、薬物であるモルヒネはオピエート受容体と直接相互作用し、最終的に、疼痛の感覚を低減させる。従って、オピエート受容体は、「一次相互作用器」の定義の下では、一次相互作用器である。一次相互作用器は、前記バイオマーカーが相互作用するコミュニケーション経路中で、前記バイオマーカーのすぐ上流およびすぐ下流の両方で隣り合っている分子を含む。これらの実体には、直接的な(または間接的な)調節、発現、化学反応、分子合成、結合、プロモーター結合、タンパク質修飾および分子輸送を含むがこれらには限定されない関係によって結合され得るタンパク質、核酸および低分子が包含される。それらのレベルが協調しているバイオマーカーのグループは、当業者、ならびに生理学および細胞生物学に精通した人々には良く知られている。実際のところ、特定のバイオマーカーに関する一次相互作用器は当該分野で公知であり、かつ、様々なデータベースや、利用可能なバイオインフォマティクスのソフトウェア、例えばARIADNE PATHWAY STUDIO(登録商標)、ExPASY Proteomics Server Qlucore OmicsExplorer、Protein Prospector、PQuad、ChEMBLなどを利用して見出すことができる。(例えば、ARIADNE PATHWAYSTUDIO(登録商標)、Ariadne、Inc.、<www.ariadne.genomics.com>またはChEMBLデータベース、EuropeanBioinformatics Institute、European Molecular Biology Laboratory、<www.ebi.ac.uk>を参照のこと)。
〔055〕 一次相互作用器バイオマーカーとは、その発現レベルが別のバイオマーカーと協調しているバイオマーカーである。そのため、特定のバイオマーカーのレベルに関する情報(「バイオマーカー測定値」)を、特定のバイオマーカーと協調している一次相互作用器のレベルを測定することで導き出すことが可能である。当然のことながら、特定のバイオマーカーの挙動と一致する、定義され、かつ、再現性のある方法によって、当業者は、特定のバイオマーカーの代わりにまたは特定のバイオマーカーに加えて使用される一次相互作用器のレベルが多様になることを確認する。
〔056〕 本発明は、特定のバイオマーカーの一次相互作用器を利用して実施される可能性のある、あるいは実施される、本明細書に記載のいかなる方法をも提供する。例えば、本発明のいくつかの態様は、HGFのバイオマーカー測定値を決定する工程を含む、生理学的に特徴付ける方法を提供する。よって、本発明また、HGFの一次相互作用器のバイオマーカー測定値を決定する工程を含む、生理学的に特徴付ける方法を提供する。HGFの一次相互作用器には、図5で同定した一次相互作用器(例えば、INS、EGF、MIF)が含まれるがこれらには限定されない。従って、本発明の想定内では、特定のバイオマーカー測定値を、特定のバイオマーカーの一次相互作用器で置き換えてもよい。
バイオマーカー測定値の決定
〔057〕 通常、バイオマーカー測定値は典型的にはタンパク質またはポリペプチドである発現産物の定量的な測定に関する情報である。本発明は、バイオマーカー測定値をRNA(翻訳前)レベルでまたはタンパク質レベル(翻訳後修飾も含まれ得る)で決定することを想定している。具体的には、本発明は、転写、翻訳、翻訳後修飾のレベル、またはタンパク質分解の範囲もしくは程度の上昇または低下が反映されるバイオマーカー濃度の変化を決定することを想定しており、ここでこれらの変化は、特定の病状または疾患の進行と関連している。
〔058〕 正常な対象で発現している多くのタンパク質は、疾患または状態に応じて、例えば、非小細胞肺癌または喘息を呈している対象ではその発現がより多くまたはより少なくなる。当業者であれば、疾患の多くが、複数の異なるバイオマーカーに変化を及ぼすことを理解するだろう。よって疾患は、複数のマーカーの発現パターンによって特徴付けることができる。複数のバイオマーカーの発現レベルを決定することによって発現パターンの観測が容易になり、そのようなパターンは、個々のバイオマーカーを検出するよりも感度が高く、かつ、精度の高い診断を提供する。あるパターンでは、いくつかの特定のバイオマーカーが異常に亢進しており、同時に他の特定のバイオマーカーが異常に低下していてもよい。
〔059〕 本発明に従って、対象から、その試料におけるバイオマーカー測定値が、その試料を提供した対象におけるそのバイオマーカーの濃度に比例していることを確保する方法によって、生理学的な試料を採取する。測定された値が、試料中のバイオマーカーの濃度の比例となるように、測定を行う。これらの要件を満たす試料の採取方法および測定方法の選択は当該分野において一般的な技術の範囲内である。
〔060〕 当業者には当然のことであるが、個々のバイオマーカーについては、バイオマーカー測定値を決定するための様々な方法が当該分野で知られている。Instrumental Methods of Analysis, Seventh Edition、1988を参照のこと。それらの決定は、複合的なまたはマトリックスを使用した形態、例えばマルチプレックス免疫アッセイ(multiplexedimmunoassay)によって実施され得る。
〔061〕 バイオマーカー測定値を決定するための多数の方法が当該分野で知られている。そのような決定手段には、放射免疫アッセイ、酵素結合免疫吸着アッセイ(ELISA)、可視光または紫外光の吸光度を利用した放射検出もしくはスペクトル検出を伴う高速液体クロマトグラフィー、質量分析による定性的および定量的な解析、ウェスタンブロット、放射性プローブ、蛍光プローブ、もしくは化学発光プローブまたは核を検出する手段による定量的な可視化を伴う一次元もしくは二次元ゲル電気泳動、吸光度の測定もしくは蛍光の測定を利用した抗体を使用した検出法、いくつかの化学発光レポーターシステムのいずれかの発光を用いた定量、酵素アッセイ、免疫沈降または免疫捕捉アッセイ、固相および液相免疫アッセイ、タンパク質アレイもしくはチップ、DNAアレイもしくはチップ、プレートアッセイ、識別を可能にする結合親和性を有する分子、例えばアプタマーや分子インプリントポリマーを使用したアッセイ、ならびに、他の任意の好適な技術および記載した検出法に関するいずれもの遂行意志または器具操作による、バイオマーカーの濃度を定量的分析的に決定する他のいかなる方法も含まれるがこれらには限定されない。
〔062〕 バイオマーカー測定値を決定する工程は、当該分野で公知のいずれの手段によっても、特に本明細書で議論した手段によって実施することができる。好ましい態様では、バイオマーカー測定値を決定する工程は、抗体を利用した免疫アッセイを実施する工程を含む。当業者であれば、本発明で使用するのに適切な抗体を容易に選択することができる。選択される抗体は、好ましくは、目的の抗原に選択的(すなわち、特定のバイオマーカーに選択的)であり、前記抗原に高い結合特異度を有し、かつ、他の抗原との交差反応性が最小限のものである。抗体の目的の抗原へと結合する能力は、例えば、既知の方法によって、例えば酵素結合免疫吸着アッセイ(ELISA)、フローサイトメトリー、および免疫組織化学によって決定することができる。さらに、抗体は、目的の抗原に対して、相対的に高い結合特異度を有するべきである。抗体の結合特異度は、既知の方法によって、例えば免疫沈降によって、またはインビトロ結合アッセイ、例えば放射免疫アッセイ(RIA)もしくはELISAによって決定することができる。目的の抗原と高い結合特異度で結合することができ、かつ、交差反応性が最も小さい抗体を選択する方法は、例えば、参照により本明細書に組み込まれる、米国特許第7,288,249号で開示されている。肺疾患を示すバイオマーカーのバイオマーカー測定値は、サポートベクトルマシンなどの分類システムへの入力データとして使用することができる。
〔063〕 それぞれのバイオマーカーはベクトル空間における次元として表すことができ、ここで各ベクトルは、特定の対象と関連のある複数のバイオマーカー測定値から成り立っている。従って、ベクトル空間の次元性は、バイオマーカーのセットの大きさと対応する。複数のバイオマーカーのバイオマーカー測定値のパターンを、様々な診断法および予後方法に使用することができる。本発明は、そのような方法を提供する。代表的な方法には、分類システム、例えばサポートベクトルマシンが含まれる。
分類システム
〔064〕 本発明はとりわけ、継続的に分布している複数のバイオマーカーに基づいて、肺の病理を癌または喘息であると予測することに関する。いくつかの分類システム(例えば、サポートベクトルマシン)については、予測は3工程プロセスとなり得る。第一の工程では、予め設定しておいたデータセットの特徴を記述することによって分類器を構築する。これは「学習工程」であり、「学習」データについて行われる。
〔065〕 学習データベースは、各個人の病状についての分類と関係のある、複数のヒトに関する複数のバイオマーカー測定値を反映している、コンピューターに実装されたデータの記録である。記憶されるデータの形式は、単層ファイル、データベース、表、または当該分野で知られている、他のいずれの検索可能なデータ記憶形式であってよい。例示的な態様では、試験データは複数のベクトルとして記憶され、ここで各ベクトルは個々のヒトに対応し、各ベクトルは複数のバイオマーカーに関する複数のバイオマーカー測定値と、ヒトの病状についての分類を合わせて含んでいる。通常、各ベクトルは、各バイオマーカー測定値の見出しを複数のバイオマーカー測定値中に含んでいる。学習データベースは、認可された実体(例えば、ヒト使用者またはコンピュータープログラム)によって遠隔操作で検索できるように、ネットワーク、例えばインターネットと接続されていてもよい。あるいは、学習データベースは、ネットワークから独立したコンピューター中に配置されていてもよい。
〔066〕 第二の工程、これは任意であるが、では、分類器を「確認」データベースに適用し、感度や特異度などの、精度に関する様々な測定値を観測する。例示的な態様では、学習データベースの一部分のみを学習工程に使用し、学習データベースの残りの部分を確認データベースとして使用する。第三の工程では、ある対象に由来するバイオマーカー測定値を、対象に関する計算した分類(例えば、病状)を出力する分類システムにかける。
〔067〕 分類器を構築するための複数の方法が当該分野で知られており、これらには、決定木、ベイジアン分類器、ベイジアン信念ネットワーク、k−最近傍法、事例ベース推論、およびサポートベクトルマシン(Han J & Kamber M, 2006,第六章, Data Mining, Concepts and Techniques,第二版.Elsevierアムステルダム)が含まれる。好ましい態様では、本発明は、サポートベクトルマシンの使用に関する。しかしながら本明細書に記載したように、当該分野で知られているいずれの分類システムを使用してもよい。
サポートベクトルマシン
〔068〕 サポートベクトルマシン(SVM)は当該分野において公知である。例えば、サポートベクトルマシンを使用して、病態の発症を診断する方法および予測する方法が提唱されている。例えば、参照によりその全体が本明細書に組み込まれる、米国特許第7,505,948号;同第7,617,163号;および同第7,676,442号を参照のこと。
〔069〕 一般的にSVMは、各対象につき、バイオマーカーの1種類のk−次元ベクトル(k−タプルと呼ばれる)に基づいて、各n個の対象を2つ以上の疾患クラスに分類するのに使われるモデルを提供する。SVMでは最初に、カーネル関数を使用して、同じかより高次元の空間へとk−タプルを変換する。カーネル関数は、クラスが元々のデータ空間で分離されるよりも、超平面によってより大きく分離される空間にデータを写像する。クラスを分ける超平面を決定するためには、疾患クラス境界の最も近くにあるサポートベクトルのセットを選択してもよい。次いで超平面を、不適当な予測に罰金を科す費用関数の境界内でサポートベクトルと超平面との間の距離が最大になるように、既知のSVM技術で選択する。この超平面が予測の観点からデータを最適に分離する平面の1つである(Vapnik, 1998 Statistical Learning Theory. New York: Wiley)。その後、新たな観測はいずれも、観測されたデータの分布と超平面の関係に基づいて、目的のクラスのいずれか1つに属していると分類される。3つ以上のクラスについて検討する場合には、全てのクラスについてこのプロセスをペアワイズで行い、それらの結果を合わせて、全てのクラスを分離する規則を生成する。
〔070〕 例示的な態様では、ガウスのラジアル基底関数(RBF)(Vapnik、1998)として知られているカーネル関数を使用する(RBF関数は
であり、式中、
および
は2つのk−タプルである)。RBFは、いくつかの定義されている他のカーネル関数、例えば多項カーネルまたはシグモイドカーネルから選択するための前提知識がない場合に使用されることが多い(HanJ.&Kamber M.、343頁)。RBFでは、元々の空間を無限次元の新しい空間に写像する。この問題に関する議論および統計処理言語Rへのその実装は、Karatzoglouet al.に見られる(Support Vector Machines in R. Journal of Statistical Software, 2006)。本明細書に記載の全てのSVM統計計算は、統計処理用のソフトウェアプログラム用言語・環境であるR2.10.0(www.r-project.org)を使用して実施した。kernlabパッケージに含まれているksvm()関数を使用してSVMに適用した。
〔071〕 以下に、サポートベクトルマシンに関するいくつかの表記法(Cristianini N, Shawe-Taylor J. An Introduction to SupportVector Machines and other kernel-based learning methods, 2000, p. 106)、ならびに彼らが複数のクラスに由来する観測を区別した方法の概要を説明する。
〔072〕 以下のような学習試料または学習データベースを与えられたとする。
式中、
ならば、
はバイオマーカー測定値のベクトルであり、および
がどのクラス(例えば、正常、非小細胞肺癌、喘息)に属しているかを示すものであり、特徴空間はカーネル
によって暗黙的に定義されている。指標
が、
で表される二次の最適化問題を解決すると仮定すると、
であるため、
は、
の任意の
に関し、
となるように選択される。よって、
で得られる決定規則は、
で与えられる最適化問題を解決するカーネル
によって暗黙的に定義されている特徴空間中の超平面と等価になり、ここでスラック変数
は、幾何マージン
に対して定義され、ここで
は、
の指数の集合である(対応する
がサポートベクトルと呼ばれる)。
〔073〕 データを分類するクラスが2つ以上ある場合には、モデルにクラス間のペアワイズ(一連の下位モデル)を適用する。この場合、各下位モデルは特定のクラスに投票するものである。観測は、最も得票の多かったクラスに属していると判断される。
〔074〕 本発明の新規側面を形成する1つのカーネル関数は、
と定義され、ここで
はベクトル
の長さであり、かつ、
は予め設定しておいた定数(自由度)である。
〔075〕
式(8)が実際に有効なカーネルであることを確認するために、
で定義されている行列
を考える。
と注記することで、この行列が正定値(positive definite)であると示すことができる。この場合、
および
は、
に関する任意の二次元ベクトル
の要素である。帰納法および
の場合と同様の論理を用いることで、行列
が正定値であること、およびマーサーの定理によって、関数
が有効なカーネル関数であることが分かる。
〔076〕 他の適したカーネル関数には、線形カーネル、ラジアル基底カーネル、多項カーネル、統一カーネル、三角カーネル、Epanechnikovカーネル、四次多項(quartic)(二乗重み)カーネル、三次三乗(tricube)(三乗重み)カーネル、およびコサインカーネルが含まれるがこれらには限定されない。
他の分類システム
〔077〕 サポートベクトルマシンは、データについで使用することが可能な、多くの潜在性のある分類器のうちの1つである。非限定的な例として、そして以降で議論するように、例えばナイーブベイズ分類器、分類木、k−最近傍法などの他の方法を同じデータについて使用して学習させ、サポートベクトルマシンを検証してもよい。
ナイーブベイズ分類器
〔078〕 一連のベイズ分類器とは、ベイズの定理、
に基づく一連の分類器である。
〔079〕 この種の分類器は全て、ある観測に関するデータに基づいて、その観測があるクラスに属する確率を見出そうとするものである。最も高い確率を有するクラスに、それぞれの新しい観測が割り当てられる。
〔080〕 理論的には、ベイズ分類器の誤り率は一連の分類器の中で最も低い。実際には、ベイズ分類器を適用した場合にデータに関して作成される仮定の違反により、誤り率が常に最低であるということではない。
〔081〕 ナイーブベイズ分類器は、ベイズ分類器の一例である。ナイーブベイズでは、それぞれのクラスが、データを与えるその他のクラスから独立していると仮定することで、分類に使用される確率計算を単純化する。
〔082〕 ナイーブベイズ分類器は、実装が容易なこと、および分類速度が速いことから、多くの著名な反スパムフィルターに使用されているが、実際にはその仮定が満たされることが少ないという欠点をもつ。
〔083〕 本明細書で議論するように、ナイーブベイズ分類器を実装するためのツールは、統計処理用ソフトウェア計算言語・環境であるRに使用可能である。例えば、R言語のパッケージである「e1071」の第1.5−25版は、ナイーブベイズ分類器を作成・処理・利用するためのツールを含んでいる。
ニューラルネット
〔084〕 ニューラルネットは、辺とそれらの重みが、各頂点のそれらが結合しているその他の頂点に及ぼす影響を表している重みづき有向グラフとして考えることができる。ニューラルネットは、入力層(データで形成されている)と出力層(値。この例では予測されるクラス)の2つの部分から構成される。入力層と出力層の間は、隠れ頂点のネットワークとなっている。ニューラルネットを設計した方法にもよるが、入力層と出力層の間には複数の頂点がある場合がある。
〔085〕 ニューラルネットは人工知能やデータマイニングで広く利用されているが、ニューラルネットで作成されるモデルがデータを過剰適応させる(つまり、モデルが現在データを非常によく適応させるが、未来データはあまりよく適応しない)危険性がある。本明細書で議論するように、ニューラルネットを実装するためのツールは、統計処理用ソフトウェア計算言語・環境であるRに使用可能である。例えば、R言語のパッケージである「e1071」の第1.5−25版は、ニューラルネットを作成・処理・利用するためのツールを含んでいる。
k−最近傍法
〔086〕 最近傍法は、メモリーベースの分類器の一部である。これらは、新しい観測を分類するために、学習セットの中に何が入っていたかを「覚えて」おく必要のある分類器である。最近傍法は当てはめるためのモデルを必要としない。
〔087〕 k−近傍(knn)分類器を構築するためには、以下の工程がとられる。1.分類する観測から、学習セット中の各観測への距離を計算する。距離の計算には任意の妥当な尺度を使用してもよいが、ユークリッド距離およびマハラノビス距離が使用されることが多い(マハラノビス距離とは、観測の中に含まれる変数間の共分散を考慮する尺度である)。
2.各クラスに属すk最近傍観測の中にある観測の数を数える。
3.新しい観測を、最も数の多かったクラスに割り当てる。
〔088〕 最近傍アルゴリズムには、2点間の距離を計算する必要があるため、カテゴリカルデータを取り扱うという問題があるが、これは、任意の2クラス間の距離を人為的に定義することで克服することができる。この種のアルゴリズムはまた、スケールや尺度の変化に対して感度がよい。これらの問題を念頭においても、最近傍アルゴリズムは、特に大量のデータセットに対して非常に強力となり得る。
〔089〕 本明細書で議論するように、k−最近傍法を実装するためのツールは、統計処理用ソフトウェア計算言語・環境であるRに使用可能である。例えば、R言語のパッケージである「e1071」の第1.5−25版は、k−最近傍法を作成・処理・利用するためのツールを含んでいる。
分類木
〔090〕 分類木とは、特徴選択が組み込まれた翻訳処理が容易な分類器である。分類木は、各下位空間に含まれている1つのクラスからの観測の割合が最大となるような方法で、データ空間を再帰的に分割する。
〔091〕 データ空間を再帰的に分割するプロセスによって、それぞれの端点に試験される条件をもつ二分木が作成される。葉に到達するまで木の枝を追っていくことによって、新しい観測を分類する。それぞれの葉では、ある確率が、所定のクラスに属している観測に割り当てられる。新しい観測は、最も高い確率を有するクラスに分類される。
〔092〕 分類木は本質的に、その属性が統計処理言語で構成されている決定木である。これらは非常に柔軟であるが、ノイズが非常に多い(他の方法に比べて誤りの分散が大きい)。
〔093〕 本明細書で議論するように、分類木を実装するためのツールは、統計処理用ソフトウェア計算言語・環境であるRに使用可能である。例えば、R言語のパッケージである「tree」の第1.0−28版は、分類木を作成・処理・利用するためのツールを含んでいる。
ランダムフォレスト
〔094〕 分類木は一般的にノイズが多い。ランダムフォレストは、多くの木の平均をとることで、このノイズを低下させようとするものである。その結果、ある分類木と比較して、誤りの分散が小さくなった分類木が得られる。
〔095〕 以下のアルゴリズムを使用して、森を大きくする:
1.Bが森を構成する木の数である
について、
a.ブーストラップサンプルを生成する(ブーストラップサンプルとは、観測データと同じ数の観測を有する観測データからの置き換えによって導き出されたサンプルである)
b.このブーストラップサンプルについて分類木、
を作成する。
2.セット
を出力する。このセットがランダムフォレストである。
〔096〕 ランダムフォレストを使って新しい観測を分類するには、ランダムフォレストに含まれているそれぞれの分類木を使って新しい観測を分類する。分類木のうち、新しい観測が最も頻繁に分類されるクラスが、その新しい観測をランダムフォレストが分類するクラスである。
〔097〕 翻訳処理の評価においては、ランダムフォレストは分類木で見られる多くの問題を低減する。
〔098〕 本明細書で議論するように、ランダムフォレストを実装するためのツールは、統計処理用ソフトウェア計算言語・環境であるRに使用可能である。例えば、R言語のパッケージである「randomForest」の第4.6−2版は、ランダムフォレストを作成・処理・利用するためのツールを含んでいる。
アダブースト(適応的ブースティング)
〔099〕 アダブーストは、各対象につき、測定値の1種類のk−次元ベクトル(k−タプルと呼ばれる)に基づいて、各n個の対象を2つ以上の疾患クラスに分類するのに使われる方法を提供する(アダブーストは、技術的には、ある観測が属するクラスが2つの場合にのみ機能する。g>2の場合には、観測を「なし」のクラスに分類する(g/2)のモデルを生成する必要がある。その後、これらのモデルから得られた結果を合わせて、特定の観測が属すクラスを予測する)。アダブーストは、予測性能が良くないが、無作為よりはましな、一連の「弱い」分類器を利用し、それらを組み合わせて優れた分類器を生成する(この文脈における予測性能とは、誤って分類される観測として定義される)。アダブーストで使用される弱い分類器は、分類木および回帰木(CART)である。CARTはデータ空間を、その領域中に分布している新しい観測の全てが特定の分類名に割り当てられている領域に、再帰的に分割する。アダブーストは、重み付けられているデータセットに基づいて、一連のCARTを構築する。ここで重みは、直前の反復で使用された分類器の性能に依存する(Han J & Kamber M, 2006,第六章, Data Mining, Concepts andTechniques,第二版.Elsevierアムステルダム)。
データを分類する方法
〔0100〕 本発明は、個人から得たデータ(試験データ、すなわち、バイオマーカー測定値)を分類する方法を提供する。これらの方法は、学習データを準備または収集する工程、および個人から得た試験データを上述した分類システムのうちの1つを利用して評価する(学習データと比較して)工程を含む。好ましい分類システムは学習機械であり、例えば、サポートベクトルマシンまたはアダブースト分類器である。分類システムは、試験データに基づき、個人の分類を出力する。
〔0101〕 試験データは、いかなるバイオマーカー測定値であってもよく、例えば複数のバイオマーカーの血漿濃度の測定値であってよい。一態様において本発明は、それぞれのバイオマーカーのセットの、複数の血漿濃度の測定値であるバイオマーカー測定値を含んでいる試験データの分類方法を提供し、この方法は、(a)電子的に記憶されている学習データベクトルのセットにアクセスする工程、ここで各学習データベクトルまたはk−タプルは個々のヒトを表しており、かつ、バイオマーカー測定値、例えば、対応するヒトに関する各バイオマーカーのセットの、血漿濃度の測定値を含んでおり、学習データはさらに、対応するそれぞれのヒトの病状についての分類を含んでおり;(b)電子的に記憶されている学習データベクトルのセットを使用して、サポートベクトルマシンの電子表示を訓練する工程;(c)ヒト試験対象に関する複数の血漿濃度の測定値を含む試験データを受信する工程;(d)サポートベクトルマシンの電子表示を使用して、試験データを評価する工程;および(e)評価する工程に基づいたヒト試験対象の分類を出力する工程、を含む。別の態様では、本発明は、各バイオマーカーのセットの複数の血漿濃度の測定値であるバイオマーカー測定値を含む試験データを分類する方法を提供し、この方法は、(a)電子的に記憶されている学習データベクトルのセットにアクセスする工程、ここで各学習データベクトルまたはk−タプルは個々のヒトを表しており、かつ、バイオマーカー測定値、例えば対応するヒトに関する各バイオマーカーのセットの、血漿濃度の測定値を含み、学習データはさらに、対応するそれぞれのヒトの病状についての分類を含んでおり;(b)アダブーストを介した分類器を構築するために、電子的に記憶されている学習データベクトルのセットを使用する工程;(c)ヒト試験対象に関する複数の血漿濃度の測定値を含む試験データを受け取る工程;(d)アダブースト分類器を使用して試験データを評価する工程;および(e)評価する工程に基づいたヒト試験対象の分類を出力する工程、を含む。本発明による出力は、電子表示にヒトが読み取り可能な形式で表示する工程を含む。
〔0102〕 病状についての分類は、病状の有無であってよい。本発明による病状は、肺疾患、例えば非小細胞肺癌または反応性気道疾患(例えば、喘息)となり得る。
〔0103〕 学習ベクトルのセットは、少なくとも20、25、20、35、50、75、100、125、150、またはそれ以上のベクトルを含み得る。
〔0104〕 当然のことながら、データを分類する方法は、本明細書に記載のいずれの方法においても使用することができる。具体的には、本明細書に記載のデータを分類する方法は、生理学的に特徴付ける方法、および肺疾患、例えば非小細胞肺癌および反応性気道疾患(例えば、喘息)を診断するための方法において使用することができる。
少ない数のバイオマーカーを使用した、データの分類
〔0105〕 本発明はまた、減数したセットのバイオマーカーを含む、データ(例えば個人から得た試験データ)を分類する方法を提供する。つまり、選択したバイオマーカーの下位セットに関するバイオマーカー測定値の下位セットだけを含めることで学習データを少なくすることができる。同様に、試験データも、選択した同じセットのバイオマーカーに由来するバイオマーカー測定値の下位セットだけに限定することができる。
〔0106〕 一態様では、本発明は、各バイオマーカーのセットの複数の血漿濃度の測定値であるバイオマーカー測定値を含む試験データを分類する方法を提供し、この方法は、(a)電子的に記憶されている学習データベクトルのセットにアクセスする工程、ここで各学習データベクトルは個々のヒトを表しており、かつ、対応するヒトに関するバイオマーカーのセットの、各バイオマーカーのバイオマーカー測定値を含み、各学習データベクトルはさらに、対応するヒトの病状に関する分類を含んでおり;(b)バイオマーカーのセットから、バイオマーカーの下位セットを選択する工程;(c)学習機械、例えばサポートベクトルマシンの電子表示を、電子的に記憶されている学習データベクトルのセットのバイオマーカーの下位セットからのデータを使用して訓練する工程、;(d)ヒト試験対象に関する複数の血漿濃度の測定値を含む試験データを受け取る工程;(d)学習機械の電子表示を使用して試験データを評価する工程;および(e)評価する工程に基づいたヒト試験対象の分類を出力する工程、を含む。
〔0107〕 好ましい態様では、バイオマーカーの下位セットを選択する工程は、(i)バイオマーカーのセットに含まれているそれぞれのバイオマーカーについて、バイオマーカーの2群の濃度測定値のマージン分布間の距離を計算すること、それによって、複数の距離が生成され;(ii)その距離に従って、バイオマーカーのセットに含まれているバイオマーカーを順序付けること、それによって、順序付けられたバイオマーカーのセットが生成され;(iii)順序付けられたバイオマーカーのセットの複数の初期セグメントのそれぞれについて、学習データに基づいて、学習機械用のモデルフィットの指標を計算すること;(iv)モデルフィットの最大値型指標に従って、順序付けられたバイオマーカーのセットの初期セグメントを選択すること、それによって、順序付けられたバイオマーカーのセットの好ましい初期セグメントが選択され;(v)バイオマーカーの空集合から開始し、バイオマーカーの下位セットを生成するために、順序付けられたバイオマーカーのセットの、好ましい初期セグメントからさらなるバイオマーカーをモデルに再帰的に追加すること、ここで各さらなるバイオマーカーは、(a)好ましい初期セグメントに含まれている残りのバイオマーカーの中でも、それを追加することで、モデルフィットが最大に改良される場合、および(b)それを追加することで、モデルフィットが少なくとも予め設定した閾値までは改良される場合に、既存のバイオマーカーの下位セットに追加され;および(vi)それ以上バイオマーカーを追加しても、予め設定しておいた閾値より、そのモデルフィット指標を超えるモデルフィットの指標が得られない場合には、既存のバイオマーカーの下位セットへのバイオマーカーの追加を停止すること、それによって、バイオマーカーの下位セットが選択される、を含む。
〔0108〕 本明細書に記載の方法、キット、およびシステムは、選択した複数のバイオマーカーのバイオマーカー測定値を決定する工程を含む場合がある。好ましい形態では、この方法は、実施例に記載したバイオマーカーの、任意の3種類のバイオマーカーの下位セットのバイオマーカー測定値を決定する工程を含む。あるいは、この方法は、実施例に記載したバイオマーカーの、少なくとも4、5、6、または7種類の特定のバイオマーカーの下位セットのバイオマーカー測定値を決定する工程を含む。あるいは、この方法は、実施例に記載したバイオマーカーの、少なくとも8、9、10、11、12、または13種類の特定のバイオマーカーの下位セットのバイオマーカー測定値を決定する工程を含む。あるいは、この方法は、実施例に記載したバイオマーカーの、少なくとも14、15、16、17、18、19、20、またはそれ以上(例えば、59)の種類の特定のバイオマーカーの下位セットのバイオマーカー測定値を決定する工程を含む。無論、さらなるバイオマーカーのバイオマーカー測定値を、目的の疾患に関連があろうとなかろうと、同時に決定することも本発明の想定内であることを当業者は理解する。これらさらなるバイオマーカー測定値の決定は、本発明による対象の分類を妨害するものではない。
〔0109〕 バイオマーカーの下位セットは、本明細書に記載の減数方法によって決定することができる。例えば、本発明は、モデルフィットの最高値型指標に寄与し、それによって高い予測精度を維持するバイオマーカーの下位セットを見出すための、様々なモデル選択アルゴリズム(例えば、F_SSFS)を提供する。実施例7〜10に、減数した、特定のバイオマーカーの下位セットのモデルを示す。
〔0110〕 好ましい形態では、バイオマーカーは、モデルフィットの最大値型指標に寄与しているバイオマーカーを含む、コンピューターで計算した下位セットから選択される。これらのバイオマーカーが含まれている限り、本発明は、必ずしも貢献しない、少数のさらなるバイオマーカーを含むことを排除しない。モデルを本明細書に記載したように導き出す限り、そのようなさらなるバイオマーカー測定値を分類モデルに含めても、試験データの分類は妨害されない。他の態様では、対象に関し、4、5、6、7、8、9、10、12、15、20、25、30、35、40または50以下のバイオマーカーのバイオマーカー測定値を決定し、また、同じ数のバイオマーカーが学習段階でも使用される。
〔0111〕 別の形態では、選択バイオマーカーは、モデルフィットの指標への寄与が最も低かったバイオマーカーを除いた、コンピューターで計算したバイオマーカーの下位セットから選択される。これらの選択されたバイオマーカーが含まれている限り、本発明は、必ずしも貢献しない、少数のさらなるバイオマーカーを含むことを排除しない。モデルを本明細書に記載したように導き出す限り、そのようなさらなるバイオマーカー測定値を分類モデルに含めても、試験データの分類は妨害されない。他の態様では、対象に関し、4、5、6、7、8、9、10、12、15、20、25、30、35、40または50以下のバイオマーカーのバイオマーカー測定値を決定し、また、同じ数のバイオマーカーが学習段階でも使用される。
〔0112〕 また、本明細書に記載のバイオマーカーの様々な組み合わせを、本明細書に記載のキットの設計方法ならびにキットおよびシステムに適用可能であることも理解される。別の態様では、観測または試験データを訓練したモデルを使用して分類するために、学習機械、例えばサポートベクトルマシンで使用するバイオマーカーの数を、任意の数のクラスに拡張されたLeeのF_SSFS方法(Lee、2009)で減数する。F_SSFS方法は、(i)モデル中に保持されるのに適した候補である変数のセットを決定し;および(ii)クラス間の変数の値の分離を定量化するF−スコアに基づいて、候補を選択する。(ここで、
の変数のF−スコアは
として定義され、式中、
はクラスの数であり、
はクラス
に由来する観測の数である。)この変数のセットには、前向きモデル選択が、学習機械の精度の向上に基づいてモデルに加えられた変数とともに適用される。本明細書で例示するように、変数はバイオマーカーであり、クラスは肺病理の分類である。代表的な学習機械としては、SVMやアダブースト分類器が挙げられる。
〔0113〕 現在のところ、バイオマーカーの下位セットを選択するための別の技術も開示されている。この技術の代表的なアルゴリズムには以下の工程が含まれる。
1.以下の工程は、学習データベクトルのセットに関するものであり、それぞれのセットには分類が含まれる。バイオマーカーのセット
に含まれている各バイオマーカー
について、各学習データベクトル、と関連がある経験的な分類によって定義した2クラスのバイオマーカー
のマージン分布間の距離メトリックを、以下のように計算する。
式(11)の記号
は、検討中のクラスの数である。学習機械、例えばサポートベクトルマシンを使用する多くの例において、m=2である。記号
は、学習データベクトルのセットに含まれているgのバイオマーカー測定値の中央値を表す。記号
は、バイオマーカーgのs−番目のクラスの中央値を表し、ここで各クラスは、学習データベクトルの分類によって定義される。記号
および
はそれぞれ、s−番目のクラスの分布の第一および第三四分位数を示す(バイオマーカーgについて)。経験的な学習データベクトル分類を使用してsで表示される2つのクラスを定義することの代替法は、各学習ベクトルを別個のクラスに分類するための全てのバイオマーカーを含むサポートベクトルマシンの初回の実行を利用することであることに留意する。
2.式(11)に従って、最大から最小の順番でバイオマーカーを順序付ける。
3.式(12)によって、カットオフ指数のセットを定義する。
ここでpはベクトルの次元である。
4.それぞれの
について、訓練した学習機械に関連するモデル中の第一の
バイオマーカーを保持し、スコアに従って順序付け(降順に)、およびモデルフィットの指標(例えば感度または精度)を計算する。言い換えれば、バイオマーカーの初期セグメントを保持し、モデル中で(11)に従って順序付け、およびモデルフィットの使用、例えば正しく分類された試験ベクトルのパーセンテージを計算する(モデルフィットの他の指標としては、精度、感度、特異度、陽性予測値、および陰性予測値が挙げられる。例えば表2を参照のこと)。これを、Kに含まれている各
のバイオマーカーの各初期セグメントについて(すなわち、式(11)に従って第一のバイオマーカーから
番目のバイオマーカーまで)実行する。
にする。ここでは、その
に関係するモデルが、モデルフィットの最大値型指標を有するようにする。
5.セットを定義する。
6.バイオマーカーを含まないモデルから開始し、現在モデルには入っていない各
を加え、モデルフィットの選択指標を計算する。その後、このバイオマーカーを除き、セット中の次のバイオマーカーを加える。
7.工程6でモデルフィットを最もよく改善したバイオマーカーを、その改善が予め設定しておいた閾値を上回る場合に追加する。例えば、モデルフィットの指標を正しく分類された試験ベクトルのパーセンテージとすれば、閾値は、0.0005、0.0001、0.005、0.001、0.05、0.01、0.5、または0.1となり得る。直前の文では、数を絶対値として、つまり、パーセンテージ(%)なしで表した。そのため、例えば、0.0005は0.05%である。
8.工程7でバイオマーカーを追加した場合には工程5に戻る。そうでなければ、アルゴリズムの直前の反復からのセット、または工程7で定義した追加への基準をどのバイオマーカーも満たさない場合には空集合が、このモデルで使用される、減数されたバイオマーカーのセットである。従って、工程6および7の第一の反復では、単一のバイオマーカーがモデルに追加され(バイオマーカーがいずれも閾値の基準を満たさない場合を除いて)、次いで、閾値の基準に従ってプロセスが停止されるまで、さらなるバイオマーカーがその後の各反復で追加される。よって、工程6〜8は、減数されたバイオマーカーのセットを選択するための再帰的アルゴリズムを提供する。
〔0114〕 従って上記工程1および2は、マージン分布に従って、バイオマーカーに順序を付けることに向けられる。具体的には、学習ベクトルのセットに含まれている2クラスのバイオマーカー測定値のマージン分布の中心傾向(例えば、中央値)の間の距離に従って、バイオマーカーに順序を付けることができる(中央値の替わりに、別の中心傾向、例えば形態または手段を使用してもよい)。各クラスは分類に対応し、およびこれらの分類は、学習データ自体に含まれている経験的な分類から得てもよく、またはこれらの分類は、全てのバイオマーカーを使用した学習機械の初回の実行から得てもよい。従って、バイオマーカーは、経験的なものであっても、または学習機械の初回の実行によって生成されたものであったとしても、分類に対応する2つのクラス間のバイオマーカー測定値の識別性能の関数として順位付けられる。
〔0115〕 上記工程3、4および5は、選択された初期セグメントが、その他の初期セグメントの内で、学習ベクトルのセットに関する最もよいモデルフィットを有するように、マージン分布によって降順に順位付けられたバイオマーカーの初期セグメントを選択することに向けられている。この初期セグメントは、工程6、7および8に従って、最終的な減数されたバイオマーカーのセットをそこから選択するための、バイオマーカーの普遍集合として機能する。
〔0116〕 工程6、7および8は、バイオマーカーのない基本事例から開始して、再帰的にモデルにバイオマーカーを追加することに向けられている。順番に追加されたバイオマーカーは、マージン分布による順序を考慮せず、モデルフィットへの寄与に従って選択される。工程の基本は、モデルに加えられるバイオマーカーの空集合を考慮することである。再帰工程では、さらなるバイオマーカーを追加するかどうかを決定するために、モデルに含まれている現在のバイオマーカーのセットと一緒に、残りの各バイオマーカーについて学習機械が生成される。残りのバイオマーカーのうち、既存のバイオマーカーに追加した時に、もっとも正確な学習機械に対応するものが、続いて行う追加への候補である。候補バイオマーカーのモデルフィットへの寄与が閾値を上回る限り、それらは順次追加される。この連続的なバイオマーカーの追加プロセスは、残りのバイオマーカーのうちの最もよいものが、予め設定しておいた閾値を超えてモデルフィットを改善しなくなるまで続けられる。
〔0117〕 要約すると、このプロセスは工程1〜5でバイオマーカーの最初の普遍集合を選択することに始まり、次いで、工程6、7および8に従って、この普遍集合から、最終的な減数されたバイオマーカーのセットを選択することに続く。
〔0118〕 あるいは、工程5で定義する上位セットとなる工程6で定義する最初のモデルを変更し、上位セットから各バイオマーカーを追加する代わりに各バイオマーカーを1つずつ除き、次いでモデルフィットの指標を計算することで、減数されたバイオマーカーのセットを導き出すこともできる。従って、工程7を変更して、モデルフィットの指標が予め設定しておいた閾値を下回るまでは縮小されないように、モデルフィットの指標の縮小が最も小さいバイオマーカーを除く。その後、工程7で追加するバイオマーカーがなくなる代わりに、工程7で除くバイオマーカーがなくなることを停止条件とする工程8に従う。
〔0119〕 上述した、バイオマーカーの下位セット選択アルゴリズムは、データから予測される好ましいバイオマーカーのセットを含む学習機械を提供することに加えて、考慮するバイオマーカーの結合および相関を明らかにすることができる。これを達成するためには、上述したアルゴリズムの工程7における閾値を排除し、次いで、アルゴリズムの各反復の時点で、直前の反復によって示唆されているモデルと正確に関連しているマージン分布の改善によって付けられた順位またはそれぞれの反復と直前の反復との間の精度の向上に従って追加されたバイオマーカーを保持する。
〔0120〕 当然のことながら、減数したバイオマーカーのセットまたはバイオマーカーの下位セットを使用してデータを分類する方法は、本明細書に記載した方法のいずれにも使用することができる。具体的には、本明細書に記載の少ない数のバイオマーカーを使用してデータを分類する方法を、生理学的に特徴付ける方法および肺疾患、例えば非小細胞肺癌および反応性気道疾患(例えば、喘息)を診断する方法に使用してもよい。減らした数のバイオマーカー以外のバイオマーカーを追加してもよい。これらのさらなるバイオマーカーは、診断に寄与してもしなくても、または診断を強化してもしなくてもよい。
〔0121〕 診断的アッセイまたは予後アッセイで使用するためのバイオマーカーの選択は、特定のバイオマーカーとそれらの一次相互作用器との間の既知の相互作用によって容易になる可能性がある。本発明者らによって同定された多くのバイオマーカーは、全てではなくとも、細胞または器官の様々なコミュニケーション経路に関わっている。コミュニケーション経路中の1つの構成要素の正常からの逸脱は、そのコミュニケーション経路中の他のメンバーにおける関連する逸脱によってもたらされると予想される。当業者であれば容易に、様々なデータベースや使用可能なバイオインフォマティクスソフトウェアを使用して、コミュニケーション経路のメンバーを関連付けることができる(例えば、ARIADNE PATHWAY STUDIO(登録商標)、Ariadne、Inc.、<www.ariadne.genomics.com>またはChEMBLデータベース、EuropeanBioinformatics Institute、European Molecular Biology Laboratory、<www.ebi.ac.uk>を参照のこと)。複数のバイオマーカーのレベルを決定することに基づいた診断的方法、ここで複数のバイオマーカーには、他のものとは別のコミュニケーション経路に関わっているいくつかのバイオマーカーが含まれる、はバイオマーカーレベルを測定することによってもたらされる情報を最大化するだろう。代替的な態様では、選択した下位セット中の任意のバイオマーカーを、同じコミュニケーション経路中の別のバイオマーカー(すなわち、そのバイオマーカーの一次相互作用器)で置き換えてもよい。サポートベクトルマシンの態様では、バイオマーカーを一次相互作用器で置き換えることは、置き換えたバイオ測定値を使用してサポートベクトルマシンを再学習させることを含み得る。
生理学的に特徴付ける方法
〔0122〕 本発明は、以下に記載する様々な集団中に含まれている個々のヒトを、生理学的に特徴付ける方法に向けられている。本明細書で使用する場合、本発明による生理学的に特徴付ける方法には、特定の肺疾患を診断する方法、個々のヒトが治療的介入に反応する見込みを予測する方法、個々のヒトがそれぞれの肺疾患を発症するリスクを有しているか否かを決定する方法、患者の疾患重篤度を分類する方法、および共通したいくつかの症状を呈している患者を区別する方法が含まれる。これらの方法は通常、本明細書に記載の特定のバイオマーカーのバイオマーカー測定値を決定すること、および分類システム、例えばサポートベクトルマシン中のこれらの値を利用し、これらの生理的な特徴付けのうちの1つに従って個々のヒトを分類することに依存している。
A.母集団の特徴付け
〔0123〕 本発明は、対象を生理学的に特徴付ける方法を提供し、この方法は、対象の生理学的な試料中の複数のバイオマーカーのバイオマーカー測定値を決定する工程を含み、ここで、複数のマーカーの発現パターンと生理的な状況もしくは状態、または疾患状況の変化(例えば、非小細胞肺癌の期)もしくは状態には相関がある。好ましい態様では、複数のバイオマーカーの発現パターンは、肺疾患例えば非小細胞肺癌または反応性気道疾患を示すものであるか、または反応性気道疾患であるかまたは非小細胞肺癌であるかの区別を補助するものである。好ましくは、複数のバイオマーカーは、機械学習アルゴリズム、例えばサポートベクトルマシンを介した学習データの解析に基づいて選択される。学習データには、多数の対象についての複数のバイオマーカー、ならびに個々の対象に関する疾患の分類情報(例えば、式(1)のyi)、および場合により、対象の他の特徴、例えば性別、人種、年齢、喫煙歴、職歴などが含まれる。別の好ましい態様では、バイオマーカーの発現パターンと、対象が特定の疾患または状態を有しているまたは有する可能性があることについての見込みの高さには相関がある。より好ましい態様では、対象の複数のバイオマーカーのバイオマーカー測定値を決定する方法は、対象が、肺疾患、例えば非小細胞肺癌または反応性気道疾患(例えば、喘息)を発症している、罹患している、または罹患する可能性があることについての見込みの上昇を検出する。発現パターンは、パターン認識について当該分野で公知のいかなる技術によって特徴付けてもよい。複数のバイオマーカーには、実施例1に記載したバイオマーカーのいかなる組み合わせも含まれ得る。
〔0124〕 一態様では、対象は、非小細胞癌または反応性気道疾患(例えば、喘息、慢性閉塞性肺疾患など)の肺疾患のリスクを有している。「リスクを有している」対象には、無症状ではあるが、個人歴もしくは家族歴、行動、疾患原因物質への曝露(例えば、発癌物質)、または他の複数の原因によって、その集団の大部分よりも疾患を発症する可能性の高い個人が含まれる。「リスクを有している」個人は、これまで、個人について決定したリスク因子を統合することで同定されていた。本発明は、関連するバイオマーカーのバイオマーカー測定値を決定することで、「リスクを有している」個人の強力な特徴付けを提供する。
〔0125〕 上述した態様は、実施例で記載するバイオマーカーの一覧によって例示される。当然のことながら、これらのバイオマーカーの下位セット、例えば実施例1〜9で記載の下位セットを、記載したいずれの態様で使用してもよい。当業者の自由裁量で、他のバイオマーカーのバイオマーカー測定値を含めることもできる。
B.男性集団の特徴付け
〔0126〕 好ましい態様では、本発明は、男性対象を生理学的に特徴付ける方法を提供し、この方法は、男性対象の生理学的な試料中の複数のバイオマーカーのバイオマーカー測定値を決定する工程を含み、ここで、複数のマーカーの発現パターンと生理的な状況もしくは状態、または疾患状況の変化(例えば、非小細胞肺癌の期)もしくは状態には相関がある。別の好ましい態様では、複数のバイオマーカーの発現パターンは、肺疾患、例えば非小細胞肺癌または反応性気道疾患を示すものとなるか、または反応性気道疾患であるかもしくは非小細胞肺癌であるかの区別を補助するものである。好ましくは、問題となっている病状を有していると同定された多数の男性対象およびその疾患を有していないことが分かっている同程度の数の男性対象のバイオマーカー測定値を含む学習データの収集に基づいて、複数のバイオマーカーを選択する。次いで、この学習データを、機械学習アルゴリズム、例えばサポートベクトルマシンで解析する。発現パターンは、パターン認識について当該分野で公知のいかなる技術によって特徴付けてもよい。複数のバイオマーカーには、実施例、例えば実施例1〜5または7〜8に記載したバイオマーカーのいかなる組み合わせも含まれ得る。
〔0127〕 一態様では、男性対象は、非小細胞癌または反応性気道疾患(例えば、喘息、慢性閉塞性肺疾患など)の肺疾患のリスクを有している。「リスクを有している」対象および個人については上で説明した。
C.女性集団の特徴付け
〔0128〕 本発明はまた、女性対象を生理学的に特徴付ける方法を提供する。好ましい態様では、本発明は、女性対象の生理学的に特徴付ける方法を提供し、この方法は、女性対象の生理学的な試料中の複数のバイオマーカーのバイオマーカー測定値を決定する工程を含み、ここで、複数のマーカーの発現パターンと生理的な状況もしくは状態、または疾患状況の変化(例えば、非小細胞肺癌の期)もしくは状態には相関がある。別の好ましい態様では、複数のバイオマーカーの発現パターンは、肺疾患、例えば非小細胞肺癌または反応性気道疾患を示すものであるか、または反応性気道疾患であるかもしくは非小細胞肺癌であるかの区別を補助するものである。これらの態様での方法は、上述した方法と同様であるが、学習データセットに含まれる対象は女性となる。複数のバイオマーカーには、実施例、例えば実施例1〜4、6〜7、および9に記載したバイオマーカーのいかなる組み合わせも含まれ得る。
〔0129〕
一態様では、女性対象は、非小細胞癌または反応性気道疾患(例えば、喘息、慢性閉塞性肺疾患など)の肺疾患のリスクを有している。「リスクを有している」対象および個人については上で説明した。
肺疾患
〔0130〕 本発明は、肺疾患についての様々な診断方法および予後方法を提供する。具体的には、本発明は、反応性気道疾患、具体的には過剰応答性TH細胞およびTH17細胞と関連がある疾患を診断する方法を提供する。反応性気道疾患には、喘息、慢性閉塞性肺疾患、アレルギー性鼻炎、嚢胞性線維症、気管支炎、または、様々な生理的な刺激および/または環境刺激に対する過剰な反応を表している他の疾患が含まれる。具体的には、本発明は、喘息および慢性閉塞性肺疾患の診断方法、より具体的には喘息の診断方法を提供する。
〔0131〕 また、本発明は非小細胞肺癌の診断方法も提供する。この方法は、本明細書に記載の複数のバイオマーカーのバイオマーカー測定値を決定する工程を含み、ここでバイオマーカーは、非小細胞肺癌の有無または発達を示すものである。例えば、本明細書に記載のバイオマーカーのバイオマーカー測定値を使用して、非小細胞肺癌の進行の程度、前癌病変の有無、または非小細胞肺癌の期を決定することができる。
〔0132〕 具体的な態様では、対象は、非小細胞肺癌または反応性気道疾患の1つまたは複数の症状を呈している個人から選択される。症状には、咳、息切れ、喘鳴、胸痛、および喀血;腕の外側を走る肩痛または嗄声を引き起こす声帯の麻痺;嚥下を難しくする可能性のある食道の進入、が含まれ得る。大気道が閉塞すると、肺の一部が虚脱して感染を生じ、その結果、膿瘍または肺炎が引き起こされる可能性がある。骨への転移は強い痛みを生じ得る。脳への転移は、霧視、頭痛、痙攣、または、一般的に脳卒中に関連する症状、例えば身体の各部における知覚の弱まりまたは消失などの神経症状を引き起こす場合がある。肺癌では、腫瘍細胞からのホルモン様物質の生産による症状が引き起こされることが多い。NSCLCで多く見られる腫瘍随伴性症候群には、血中のカルシウムを上昇させる、副甲状腺ホルモン様物質の生産がある。喘息は通常、例えば咳、特に夜間の、喘鳴、息切れおよび胸苦しさ、疼痛または圧迫の症状を引き起こす。従って、喘息の症状の多くがNSCLCの症状と共通していることが明らかである。
反応性気道疾患を診断する方法
〔0133〕 本発明は、以下に記載する様々な集団中に含まれている、個々のヒトの反応性気道疾患を診断する方法に向けられている。これらの方法は通常、本明細書に記載したように、特定のバイオマーカーのバイオマーカー測定値を決定すること、および分類システム、例えばサポートベクトルマシンを使用して、バイオマーカー測定値を分類することに依存している。
A.母集団の決定
〔0134〕 本発明は、対象の反応性気道疾患を診断する方法を提供し、この方法は、(a)対象の生理学的試料を収集する工程;(b)前記試料中の複数のバイオマーカーのバイオマーカー測定値を本明細書に記載したように決定する工程;および(c)分類システムを利用し、バイオマーカー測定値に基づいて試料を分類する工程を含み、ここで試料の分類が、対象における反応性気道疾患を示すものとなる。
〔0135〕 好ましい態様では、本発明は、対象の反応性気道疾患を診断する方法を提供し、この方法は、対象の生理学的な試料中の複数のバイオマーカーのバイオマーカー測定値を決定する工程を含み、ここで複数のマーカーの発現パターンが、反応性気道疾患または反応性気道疾患の段階に関連する変化を示すものとなる。好ましくは、複数のバイオマーカーは、機械学習アルゴリズム、例えばサポートベクトルマシンを介した学習データの解析に基づいて選択される。学習データには、多数の対象についての複数のバイオマーカー、ならびに個々の対象に関する疾患の分類、および場合により、対象の他の特徴、例えば性別、人種、年齢、喫煙歴、職歴などが含まれる。別の好ましい態様では、バイオマーカーの発現パターンと、対象が反応性気道疾患を有しているまたは有する可能性があることについての見込みの高さには相関がある。発現パターンは、パターン認識について当該分野で公知のいかなる技術によって特徴付けてもよい。複数のバイオマーカーには、実施例1に記載したバイオマーカーのいかなる組み合わせも含まれ得る。
〔0136〕 少なくとも1つの態様では、対象は、反応性気道疾患のリスクを有している。一態様では、反応性気道疾患と関連がある特定のバイオマーカーのバイオマーカー測定値が個人について決定され、正常集団について予測されるレベルとは異なるレベルによって、その個人が「リスクを有している」ことが示唆される。別の態様では、対象は、反応性気道疾患の症状のうちの1つまたは複数を呈している個人から選択される。
B.男性集団の決定
〔0137〕 本発明は、男性対象の反応性気道疾患を診断する方法を提供する。これらの態様の方法は上述したものと同様であるが、学習データおよび試料の両方で、対象は男性である。
C.女性集団の決定
〔0138〕 本発明は、女性対象の反応性気道疾患を診断する方法を提供する。これらの態様の方法は上述したものと同様であるが、学習データおよび試料の両方で、対象は女性である。
非小細胞肺癌を診断する方法
〔0139〕 本発明は、以下に記載する様々な集団中に含まれている、個々のヒトの非小細胞肺癌を診断する方法に向けられている。これらの方法は通常、本明細書に記載したように、特定のバイオマーカーのバイオマーカー測定値を決定すること、および分類システム、例えばサポートベクトルマシンを使用して、バイオマーカー測定値を分類することに依存している。
A.母集団の決定
〔0140〕 本発明は、対象の非小細胞肺癌を診断する方法を提供し、この方法は、(a)対象の生理学的試料を収集する工程;(b)前記試料中の複数のバイオマーカーのバイオマーカー測定値を、本明細書に記載したように決定する工程;および(c)分類システムを利用し、バイオマーカー測定値に基づいて試料を分類する工程を含み、ここで試料の分類が、対象における非小細胞肺癌有無または発達を示すものとなる。
〔0141〕 好ましい態様では、本発明は、対象の非小細胞肺癌を診断する方法を提供し、この方法は、対象の生理学的な試料中の複数のバイオマーカーのバイオマーカー測定値を決定する工程を含み、ここで複数のマーカーの発現パターンが、非小細胞肺癌または非小細胞肺癌病状に関連する変化(すなわち、臨床的ステージまたは診断的ステージ)を示すものとなる。好ましくは、複数のバイオマーカーは、機械学習アルゴリズム、例えばサポートベクトルマシンを介した学習データの解析に基づいて選択される。学習データには、多数の対象についての複数のバイオマーカー、測定値ならびに個々の対象に関する疾患の分類、および場合により、対象の他の特徴、例えば性別、人種、年齢、喫煙歴、職歴などが含まれる。別の好ましい態様では、バイオマーカーの発現パターンと、対象が非小細胞肺癌を有しているまたは有する可能性があることについての見込みの高さには相関がある。発現パターンは、パターン認識について当該分野で公知のいかなる技術によって特徴付けてもよい。複数のバイオマーカーには、実施例1に記載したバイオマーカーのいかなる組み合わせも含まれ得る。
〔0142〕 一態様では、対象は、非小細胞肺癌のリスクを有している。別の態様では、対象は、非小細胞肺癌の症状のうちの1つまたは複数を呈している個人から選択される。
B.男性集団の決定
〔0143〕 本発明は、男性対象の非小細胞肺癌を診断する方法を提供する。これらの態様の方法は上述したものと同様であるが、学習データおよび試料の両方で、対象は男性である。
C.女性集団の決定
〔0144〕 本発明は、女性対象の非小細胞肺癌を診断する方法を提供する。これらの態様の方法は上述したものと同様であるが、学習データおよび試料の両方で、対象は女性である。
非小細胞肺癌と反応性気道疾患を区別する方法
〔0145〕 本発明は、以下に記載する様々な集団中に含まれている、個々のヒトの肺疾患を診断する方法に向けられている。これらの方法は通常、反応性気道疾患と非小細胞肺癌を示すものを区別する特定のバイオマーカーのバイオマーカー測定値を決定すること、および分類システム、例えばサポートベクトルマシンを使用して、バイオマーカー測定値を分類することに依存している。
A.母集団の決定
〔0146〕 本発明は、対象の肺疾患を診断する方法を提供し、この方法は、前記対象中の複数のバイオマーカーのバイオマーカー測定値を決定する工程を含み、ここで前記複数のバイオマーカーのバイオマーカー測定値は、反応性気道疾患と非小細胞肺癌を示すものの区別を補助するものである。一態様において対象は、反応性気道疾患および/または非小細胞肺癌を罹患していると診断されている対象である。例えば、その診断は、対象の生理学的な試料中の少なくとも1つのバイオマーカーのバイオマーカー測定値によって行われており、ここで少なくとも1つのバイオマーカーのバイオマーカー測定値は、反応性気道疾患および/または非小細胞肺癌を示すものである。
〔0147〕 また、本発明は、(a)対象の生理学的試料を収集する工程;(b)前記試料中の反応性気道疾患と非小細胞肺癌を示すもの、反応性気道疾患を示すものとなる複数のバイオマーカー、および非小細胞肺癌を示すものとなる複数のバイオマーカーの区別を補助する複数のバイオマーカーのバイオマーカー測定値を、本明細書に記載したように決定する工程、ここで前記複数のバイオマーカーは同一のものではなく;(c)分類システムを利用し、バイオマーカー測定値に基づいて試料を分類する工程、ここで試料の分類は、(i)反応性気道疾患と非小細胞肺癌を示すもの;(ii)反応性気道疾患の有無を示すもの;および(iii)対象における非小細胞肺癌の有無を示すもの区別を補助するものであり;ならびに(d)どの条件が3つの分類のうちの2つに見られるかに応じて、対象が、(1)反応性気道疾患に罹患している;(2)非小細胞肺癌に罹患している;または(3)疾患に罹患していないことを決定する工程を含む、対象の肺疾患を診断する方法も提供する。
〔0148〕 好ましくは、複数のバイオマーカーは、機械学習アルゴリズム、例えばサポートベクトルマシンを介した学習データの解析に基づいて選択される。学習データには、多数の対象についての複数のバイオマーカー測定値、ならびに個々の対象に関する疾患の分類、および場合により、対象の他の特徴、例えば性別、人種、年齢、喫煙歴、職歴などが含まれる。好ましい態様では、発現パターンと、対象が非小細胞肺癌または反応性気道疾患を有していることについての見込みの高さには相関がある。発現パターンは、パターン認識について当該分野で公知のいかなる技術によって特徴付けてもよい。複数のバイオマーカーには、実施例1に記載したバイオマーカーのいかなる組み合わせも含まれ得る。
〔0149〕 一態様では、対象は、非小細胞肺癌および/または反応性気道疾患のリスクを有している。別の態様では、対象は、非小細胞肺癌および/または反応性気道疾患の症状のうちの1つまたは複数を呈している個人から選択される。
〔0150〕 本発明はまた、対象が、非小細胞肺癌または反応性気道疾患を発症するまたはそれらに罹患するリスクに関する見込みの区別を補助する診断法も提供し、この方法は、(a)非小細胞肺癌または反応性気道疾患のリスクを有している対象の生理学的試料を収集する工程、(b)前記対象が非小細胞肺癌または反応性気道疾患を有するリスクの見込みの区別を補助する、前記試料中の、前記対象における複数のバイオマーカーのバイオマーカー測定値を、本明細書に記載したように決定する工程;(c)分類システムを利用し、バイオマーカー測定値に基づいて試料を分類する工程、ここで試料の分類は、(i)反応性気道疾患と非小細胞肺癌を示すもの;(ii)反応性気道疾患の有無;および(iii)対象における非小細胞肺癌の有無を示すものの区別を補助するものであり;ならびに(d)どの条件が3つの分類のうちの2つに見られるかに応じて、対象が、(1)反応性気道疾患の発症または罹患のリスクを有している;(2)非小細胞肺癌の発症または罹患のリスクを有している;または(3)疾患に罹患していないことを決定する工程を含む。
〔0151〕 好ましくは、複数のバイオマーカーは、機械学習アルゴリズム、例えばサポートベクトルマシンを介した学習データの解析に基づいて選択される。学習データには、多数の対象についての複数のバイオマーカー測定値、ならびに個々の対象に関する疾患の分類、および場合により、対象の他の特徴、例えば性別、人種、年齢、喫煙歴、職歴などが含まれる。好ましい態様では、発現パターンと、対象が非小細胞肺癌または反応性気道疾患を有していることについての見込みの高さには相関がある。発現パターンは、パターン認識について当該分野で公知のいかなる技術によって特徴付けてもよい。複数のバイオマーカーには、実施例1に記載したバイオマーカーのいかなる組み合わせも含まれ得る。
〔0152〕 一態様では、対象は、非小細胞肺癌または反応性気道疾患の症状のうちの1つまたは複数を呈している個人から選択される。「リスクを有している」対象に関連する方法については上述されており、かつ、本明細書ではそれらに関する方法が企図される。
B.男性集団の決定
〔0153〕 本発明は、男性対象の肺疾患を診断する方法を提供する。これらの態様の方法は上述したものと同様であるが、学習データおよび試料の両方で、対象は男性である。
C.女性集団の決定
〔0154〕 本発明は、女性対象の肺疾患を診断する方法を提供する。これらの態様の方法は上述したものと同様であるが、学習データおよび試料の両方で、対象は女性である。
特徴付けに関するシステムの設計方法
A.母集団
〔0155〕
本発明はさらに、対象の肺疾患を診断するためのシステムの設計方法を提供し、この方法は、(a)複数のバイオマーカーを選択する工程;(b)前記複数のバイオマーカーのバイオマーカー測定値を決定する手段を選択する工程;および(c)バイオマーカー測定値を決定するための前記手段と対象が肺疾患に罹患しているという見込みを決定するためのバイオマーカー測定値を解析するための手段とを含むシステムを設計する工程、を含む。
〔0156〕 本発明はまた、非小細胞肺癌を診断するためのシステムの設計方法を提供し、この方法は、(a)複数のバイオマーカーを選択する工程;(b)前記複数のバイオマーカーのバイオマーカー測定値を決定するための手段を選択する工程;および(c)バイオマーカー測定値を決定するための前記手段および対象が非小細胞肺癌に罹患しているという見込みを決定するための、バイオマーカー測定値を解析するための手段を含むシステムを設計する工程、を含む。
〔0157〕 本発明はまた、対象の反応性気道疾患を診断するためのシステムの設計方法を提供し、この方法は、(a)複数のバイオマーカーを選択する工程;(b)前記複数のバイオマーカーのバイオマーカー測定値を決定するための手段を選択する工程;および(c)バイオマーカー測定値を決定するための前記手段および対象が反応性気道疾患に罹患しているという見込みを決定するための、バイオマーカー測定値を解析するための手段を含むシステムを設計する工程、を含む。
〔0158〕 本発明はまた、対象の非小細胞肺癌または反応性気道疾患を診断するためのシステムの設計方法を提供し、この方法は、(a)複数のバイオマーカーを選択する工程;(b)前記複数のバイオマーカーのバイオマーカー測定値を決定する手段を選択する工程;および(c)バイオマーカー測定値を決定するための前記手段および対象が反応性気道疾患に罹患しているという見込みを決定するための、バイオマーカー測定値を解析するための手段を含むシステムを設計する工程、を含む。好ましい方法では、複数のバイオマーカーは、非小細胞肺癌を示すものとなるバイオマーカー、反応性気道疾患を示すものとなるバイオマーカー、および非小細胞肺癌と反応性気道疾患との区別を補助するバイオマーカーを含む。
〔0159〕 上述した方法において工程(b)および(c)は、(b)前記複数のバイオマーカーを検出するための検出剤を選択する工程、および(c)複数のバイオマーカーを検出するための前記検出剤を含むシステムを設計する工程、によって行ってもよく、あるいはこれらの工程によって行われる。
B.男性集団
〔0160〕 本発明はまた、男性対象の肺疾患の診断を補助するためのシステムの設計方法を提供する。これらの態様の方法は上述したものと同様である。
C.女性集団
〔0161〕 本発明はまた、女性対象の肺疾患の診断を補助するためのシステムの設計方法を提供する。これらの態様の方法は上述したものと同様である。
キット
〔0162〕 本発明は、本明細書に記載の複数のバイオマーカーのバイオマーカー測定値を決定するための手段を含むキットを提供する。本発明はさらに、本明細書に記載の複数のバイオマーカーを検出するための検出剤を含むキットも提供する。
〔0163〕 複数のバイオマーカーには、非小細胞肺癌を示すものとなるバイオマーカー、反応性気道疾患を示すものとなるバイオマーカー、および/または非小細胞肺癌と反応性気道疾患との区別を補助するバイオマーカーが含まれ得る。好ましくは、これらのバイオマーカーは、本明細書に記載の方法によって決定された、少ない数のバイオマーカーのセットである。
〔0164〕 本発明はまた、(a)非小細胞肺癌を示すものとなる複数のバイオマーカーのバイオマーカー測定値を決定するための第一の手段;および(b)反応性気道疾患を示すものとなる複数のバイオマーカーのバイオマーカー測定値を決定するための第二の手段を含むキットを提供し、ここで(a)および(b)における前記バイオマーカーは同一のものではない。
〔0165〕 本発明はまた、(a)非小細胞肺癌を示すものとなる複数のバイオマーカーを検出するための検出剤;および(b)反応性気道疾患を示すものとなる複数のバイオマーカーを検出するための検出剤を含むキットを提供し、ここで(a)および(b)における前記バイオマーカーは同一のものではない。
〔0166〕 本発明はまた、(a)非小細胞肺癌を示すものとなる複数のバイオマーカーのバイオマーカー測定値を決定するための第一の手段;(b)反応性気道疾患を示すものとなる複数のバイオマーカーのバイオマーカー測定値を決定するための第二の手段;および(c)非小細胞肺癌と反応性気道疾患との区別を補助する複数のバイオマーカーのバイオマーカー測定値を決定するための第三の手段を含むキットを提供し、ここで(a)、(b)、および(c)における前記バイオマーカーは同一のものではない。
〔0167〕 本発明はまた、(a)非小細胞肺癌を示すものとなる複数のバイオマーカーを検出するための検出剤;(b)反応性気道疾患を示すものとなる複数のバイオマーカーを検出するための検出剤;および(c)複数の非小細胞肺癌と反応性気道疾患との区別を補助するバイオマーカーを検出するための検出剤を含むキットを提供し、ここで(a)、(b)、および(c)における前記バイオマーカーは同一のものではない。
〔0168〕 当然のことながら、本発明が、特定の複数のバイオマーカーを検出することを必要とするいかなる方法のために、上述したバイオマーカーのいかなる特定の組み合わせを検出するための手段を含むキットを想定していることが理解される。
システム
〔0169〕 本発明は、本発明の方法の実施を補助するシステムを提供する。例示的なシステムには、学習データセットおよび/または試験データセットを記憶するための記憶装置、および学習機械、例えばアダブースト分類器またはSVMを実行するためのコンピューターが含まれる。コンピューターは、データベースから学習データセットを収集するため、学習データセットを前処理するため、前処理した試験データセットを使用して学習機械を訓練するため、および、訓練した学習機械の試験出力の受信に応答して、試験出力が最適解かどうかを決定するために、試験出力を後処理するためにも操作可能であってよい。そのような前処理には、例えば、明かに誤っている記載を検出・削除するために目視で点検すること、適切な標準量で割ることによってデータを正規化すること、およびそれぞれのアルゴリズムで使用するために、適切な形式のデータを確保することが含まれ得る。例示的なシステムにはまた、手元にない提供源から試験データセットと学習データセットを受信するためのコミュニケーション装置を含んでいてもよい。そのような場合には、コンピューターは、学習データセットを前処理する前に、学習データセットを記憶装置に記憶するために、また、試験データセットを前処理する前に、試験データセットを記憶装置に記憶するために、操作可能であってもよい。例示的なシステムはまた、後処理した試験データを表示するための表示装置を含んでいてもよい。例示的なシステムのコンピューターはさらに、上述したさらなるそれぞれの機能を実行するために操作可能であってもよい。
〔0170〕 本明細書で使用する場合、用語「コンピューター」は、少なくとも1つのメモリーを使用する、少なくとも1つのハードウェアプロセッサーを含むと理解される。少なくとも1つのメモリーは、一連の指示を記憶し得る。指示は、メモリーまたはコンピューターのメモリーに、恒久的にまたは一時的に記憶させることができる。プロセッサーは、データを処理するために、メモリーに記憶されている指示を実行する。一連の指示には、特定のタスク、例えば本明細書に記載のタスクを実施する、様々な指示が含まれ得る。そのような、特定のタスクを実施するための一連の指示は、プログラム、ソフトウェアプログラム、または単にソフトウェアとして特徴付けられ得る。
〔0171〕 上述したように、コンピューターは、メモリーに記憶されている指示を実行して、データを処理する。このデータの処理は、例えば、使用者またはコンピューターの使用者によるコマンドに応答したもの、その前の処理に応答したもの、別のコンピューターおよび/または他の任意の入力による要求に応答したものとなる可能性がある。
〔0172〕 態様を少なくとも部分的に実装するために使用されるコンピューターは、汎用コンピューターであってよい。しかしながら、コンピューターは、専用コンピューター、マイクロコンピューターを含むコンピューターシステム、ミニコンピューターまたはメインフレーム、例えば、プログラムしたマイクロプロセッサ、マイクロコントローラー、周辺用集積回路要素、CSIC(顧客仕様集積回路)もしくはASIC(特定用途向け集積回路)または他の集積回路、論理回路、デジタルシグナルプロセッサー、プログラム可能な論理装置、例えばFPGA、PLD、PLAもしくはPAL、あるいは、本発明の過程の少なくともいくつかの工程を実装することが可能な他の任意の装置もしくは構成などの、多種多様な他の技術のいずれを使用してもよい。
〔0173〕 当然のことながら、本発明の方法を実践するために、プロセッサーおよび/またはコンピューターのメモリーが、物理的に同じ地理学上の場所にある必要はない。つまり、コンピューターによって使用されるプロセッサーおよびメモリーはそれぞれ、地理学上の別の位置にあってもよく、かつ、任意の適切な方法によってコミュニケートするように接続されていてもよい。加えて、プロセッサーおよび/またはメモリーはそれぞれ、設備の物理的に異なる部品から構成されていてもよい。従ってプロセッサーは、1箇所にある、単一の部品の設備であって、かつ、メモリーが別の場所にある、別の単一の部品の設備である必要もない。つまり、例えば、プロセッサーが2箇所の物理的に別の場所にある、2つ以上の部品の設備であってもよいことが想定される。設備の2つ以上の別個の部品は、適切な様式で、例えばネットワークで接続され得る。加えて、メモリーは、2箇所以上の物理的位置にある2つ以上の部分を含んでいてもよい。
〔0174〕 様々なコンピューター、プロセッサーおよび/またはメモリー間のコミュニケーションを提供するために、ならびに本発明のプロセッサーおよび/またはメモリーを任意の他の実体とコミュニケートさせるために、例えば、さらなる指示を得るか、または、例えば遠隔にあるメモリー記憶にアクセスし、それらを使用するために、様々な技術を使用してもよい。そのようなコミュニケーションを提供するのに使われるそのような技術には、ネットワーク、インターネット、イントラネット、エクストラネット、LAN、イーサーネット、または例えば、コミュニケーションを提供する任意のクライアントサーバーシステムが含まれるだろう。そのようなコミュニケーション技術は、任意の好適なプロトコール例えばTCP/IP、UDP、またはOSIなどを使用し得る。
〔0175〕 さらに、本発明の実装および操作に使用されるコンピューターの指示または一連の指示は、コンピューターがその指示を読み込むのに適した形式である。
〔0176〕 いくつかの態様では、使用者が、態様を少なくとも部分的に実装するのに使用されるコンピューターまたは機械と連動することを可能にするための、様々なユーザーインターフェースを使用することができる。ユーザーインターフェースは、ダイアログスクリーンの形式であってもよい。ユーザーインターフェースはまた、マウス、タッチスクリーン、キーボード、音声読み取り装置、音声認識装置、ダイアログスクリーン、メニューボックス、リスト、チェックボックス、トグルスイッチ、押しボタン、または、コンピューターが一連の指示を処理するのに連れて、使用者がコンピューターの操作に関する情報を受信することを可能にする、および/または使用者がコンピューターに情報を提供することを可能にする他のいかなる装置を含んでいてもよい。従って、ユーザーインターフェースは、使用者とコンピューターとの間のコミュニケーションを提供する、任意の装置である。ユーザーインターフェースを解して使用者がコンピューターに提供する情報は、例えば、コマンド、データ選択、または他のいくつかの入力の形式であってよい。
〔0177〕 例えば、情報を伝搬・受信するために、本発明のユーザーインターフェースが、ヒト使用者と交流する以上に、別のコンピューターと交流するかもしれないことも想定される。従って、その他のコンピューターはユーザーとして特徴付けられる可能性もある。さらに、本発明のシステムおよび方法に含まれるユーザーインターフェースが、部分的には別のコンピューターと交流し、同時に、部分的にはヒト使用者と交流することも想定される。
〔0178〕 以下に記載する実施例は、本明細書で開示する本発明の様々な方法を例示するために提供するものであり、本発明を多少なりとも限定する目的で提供されるものではない。
実施例1−データの収集とサポートベクトルマシンを使用した解析
試料の採取
〔0179〕 ヒトの血液試料を志願者から採取した。非小細胞肺癌または喘息を罹患しているか分かっていない個人から、288の試料を採取した。これらの試料は正常な集団を含み、本明細書では「正常集団」と呼ぶ。喘息に罹患していることが分かっており、そのように医師によって診断された個人から180の血液試料を採取した。これらの試料は喘息の集団を含み、本明細書では「喘息集団」と呼ぶ。非小細胞肺癌に罹患していることが分かっており、そのように医師によって診断された個人から360の血液試料を採取した。これらは肺癌の集団を含み、本明細書では「肺癌集団」と呼ぶ。試料の人口統計学的および条件を以下の表に示す。
〔0180〕 発現レベルの変化が肺癌または喘息と関連するだろうと考えられるバイオマーカーを選択するための研究を行った。本明細書で使用する場合、「肺癌」は、非小細胞肺癌として知られる肺癌を包含することを意味する。研究、方法論および得られたデータはこれ以降に記載され、かつ、参照によりその全体が本明細書に組み込まれる国際公開第2010/105235号パンフレットに示されている。
〔0181〕 以下に示す59種類のバイオマーカーを選択し、これらについて試験を行った:CD40、肝細胞増殖因子(「HGF」)、I−TAC(「CXCL11」;「ケモカイン(C−X−Cモチーフ)リガンド11」、「インターフェロン誘導T細胞α化学誘引物質」)、レプチン(「LEP」)、マトリックスメタロプロテアーゼ(「MMP」)1、MMP2、MMP3、MMP7、MMP8、MMP9、MMP12、MMP13、CD40可溶性リガンド(「CD40リガンド」)、上皮増殖因子(「EFG」)、エオタキシン(「CCL11」)、フラクタルキン、顆粒球コロニー刺激因子(「G−CSF」)、顆粒球マクロファージコロニー刺激因子(「GM−CSF」)、インターフェロンγ(「IFNγ」)、インターロイキン(「IL」)1α、IL−1β、IL−1ra、IL−2、IL−4、IL−5、IL−6、IL−7、IL−8、IL−10、IL−12(p40)、IL−12(p70)、IL−13、IL−15、IL−17、IP−10、単球走化性タンパク質1(「MCP−1」)、マクロファージ炎症性タンパク質(「MIP」)1α、MIP−1β、トランスフォーミング増殖因子α(「TGFα」)、腫瘍壊死因子α(「TNFα」)、血管内皮成長因子(「VEGF」)、インスリン(「Ins」)、C−ペプチド、グルカゴン様タンパク質−1/アミリン(「GLP−1/アミリン」)、アミリン(全)、グルカゴン、アディポネクチン、プラスミノーゲン活性化因子阻害因子1(「PAI−1」;「セルピン」)(活性型/全)、レジスチン(「RETN」;「xcp1」)、sFas、可溶性Fasリガンド(「sFasL」)、マクロファージ遊走性阻止因子(「MIF」)、sE−セレクチン、可溶性血管細胞接着分子(「sVCAM」)、可溶性細胞間接着分子(「sICAM」)、ミエロペルオキシダーゼ(「MPO」)、C反応性タンパク質(「CRP」)、血清アミロイドA(「SAA」;「SAA1」)、および血清アミロイドP(「SAP」)。
データ収集
〔0182〕 血漿標本を、自動化され、ビーズを使用した定量的なマルチプレックス免疫アッセイであるLuminexのxMAP技術にかけることによって、正常、喘息および肺癌それぞれの集団の血漿標本について、59種類のバイオマーカーのスクリーニングを行った。
〔0183〕 バイオマーカーのスクリーニングには、LuminexのxMAP技術と共に、複数のその他のアッセイキット、すなわちMilliporeのヒトサイトカイン/ケモカイン(カタログ番号MPXHCYTO−60K、ヒトエンドクリン(カタログ番号HENDO−65K)、ヒト血清アディポカイン(カタログ番号HADKI−61K)、ヒトセプシス/アポトーシス(カタログ番号HSEP−63K)、ヒト心血管パネル1(カタログ番号HCVD1−67AK)およびヒト心血管パネル2(HCVD2−67BK)、R&D Systems,IncのヒトフルオロカインMAPプロファイリングベースキットB(カタログ番号LUB00)およびヒトフルオロカインMAP MMPプロファイリングベースキット(カタログ番号LMP000)を使用した。PanomicsのProcartaサイトカインキット(カタログ番号PC1017)も使用した。PAI−1およびレプチンに関する抗体は、2種類のキットのものを使用した。PAI−1およびLeptinについての抗体はMilliporeによって製造されているものを使用した。PAI−1についての抗体はPanomics製ものを使用した。
〔0184〕 マルチプレックス免疫アッセイで生じた蛍光強度レベルを、それぞれの集団の各血漿標本についての59種類のバイオマーカーに関するバイオマーカー測定値として記録した。記録された蛍光強度は、試料中の対応するバイオマーカーの濃度に比例し、かつ、試料が採取された時点での個人におけるその発現の度合にも比例している。それぞれの集団の各バイオマーカーと関連する蛍光強度レベルの平均、標準偏差、および相対的標準偏差を計算した。図1Aから1Cに、正常(NO)、非小細胞肺癌(LC)、および喘息(AST)集団における各バイオマーカー測定値の平均、標準偏差、および相対的標準偏差を示し、図1Dにはこれらの集団のうちの2つの集団における、特定のバイオマーカー測定値のレベルの変化の平均を示す。
〔0185〕 得られたデータを性別によっても分けた。
〔0186〕 図2A〜2Cでは、正常(NO)、非小細胞肺癌(LC)、および喘息(AST)の女性集団におけるバイオマーカーの蛍光強度レベルの平均を示している。図2Dは、喘息対正常の女性集団、肺癌対正常の女性集団、および喘息対肺癌の女性集団における各バイオマーカー測定値の平均の変化(%)を示す。
〔0187〕 男性集団に関する同様の情報を図3A〜3Dに示す。
〔0188〕 次に、女性集団と男性集団とを比較した。図4では、喘息の女性集団と比較した喘息の男性、肺癌の女性集団と比較した肺癌の男性集団、および正常な女性集団と比較した正常な男性集団における、各バイオマーカー測定値の平均の変化(%)を示している。
〔0189〕 Luminexアッセイから得られたデータを、医師の診断に基づく、患者の経験的な分類によって同定された、特定の患者の試料における各バイオマーカーの蛍光強度のデータと共に、データ記憶装置に電子的に記録した。
データ解析
〔0190〕 サポートベクトルマシンアルゴリズムを介したデータの解析は、以下の工程によって遂行された。
1.記憶装置から処理装置へデータセットを読み込んだ。
2.データを前処理し、モデル選択アルゴリズムおよびサポートベクトルマシンで使用するのに適したものにした。
3.データを無作為に2群、つまり学習セットと確認セットに分けた。
4.学習データセットについてサポートベクトルマシンアルゴリズムを実行し、モデルを生成した。本明細書に記載の全てのSVM統計的計算は、統計処理用のソフトウェアプログラム用言語・環境であるR2.10.0(www.r-project.org)を使用して行った。kernlabパッケージに含まれているksvm()関数を使ってSVMを当てはめた。
5.前の工程で生成したモデルを使って確認データセットを後処理し、予測分類を算出した。予測分類を、試験セット試料の経験的な分類と比較し、モデルフィットの指標、例えば精度、感度、特異度、陽性予測値および陰性予測値を算出した。ここで感度とは、対象が病気の場合にその対象が病気であると予測される確率であり、特異度とは、対象が病気でない場合にその対象が病気でないと予測される確率であり、陽性予測値とは、対象が病気であると予測される場合にその対象が病気である確率であり、陰性予測値とは、対象が病気でないと予測される場合にその対象が病気でない確率であり、および精度とは、正しい予測の確率である。
〔0191〕 787の対象が全データを有した。これらのデータは解析にのみ使用した。学習セットは398対象、試験セットは389対象であった。
〔0192〕 完全なデータセットについて解析を行った場合には、389対象のうち344対象が正しく分類され、その場合の精度は0.88(SE:0.017)であった(表1を参照のこと)。癌対象では、その他の対象との比較でみると、サポートベクトルマシンの感度は0.98(SE:0.007)であり、陰性予測値は0.99(SE:0.008)であった(表2を参照のこと)。
実施例2−肺癌データの解析
〔0193〕 喘息対象のデータを除いた実施例1からのデータセットにも、サポートベクトルマシンを当てはめた。癌対象および病気でない対象のデータのみを含むデータセットについて、実施例1で説明したように工程1〜5を行った。得られたサポートベクトルマシンの感度は0.92(SE:0.016)であり、特異度は0.92(SE:0.015)であった(表3および4を参照のこと)。
実施例3−別の試験セットを用いた解析
〔0194〕 実施例1でLuminexアッセイから収集したデータを、実施例1で説明した工程1〜5を使用して、再度解析した。個々の試料に由来するデータを、新しい学習セットと試験セットに無作為に割り当てた。学習セットには398対象、試験セット
〔0195〕 試料が喘息、癌、または正常であるかを予測するのに、実施例1に記載した59種類のバイオマーカーと、併せて性別について考慮した。結果を以下に示す。
実施例4−肺癌データの解析
〔0196〕 喘息対象のデータを除いた実施例3からの学習データセットにも、サポートベクトルマシンを当てはめた。サポートベクトルマシン。喘息患者のデータを除いた確認データセットを使用して、実施例1で説明したデータ解析プロトコールの工程1〜5を行うことで、以下の結果が得られた。
実施例5−肺癌データの解析(男性)
〔0197〕 実施例3のデータセットを使用して、男性試料が癌かまたは正常かを予測するために、59種類のバイオマーカーについての検討を行った。データを実施例1の5工程プロトコールによって解析した。結果を以下に示す。
〔0198〕 次いで、男性試料および女性試料が癌かまたは正常であるかの予測に関し、生成したモデルを検討した。結果を以下に示す。
実施例6−肺癌データの解析(女性)
〔0199〕 実施例3からのデータを使用して、女性試料が癌であるか、または正常であるかの予測について、59種類のバイオマーカーについての検討を行った。実施例1の解析プロトコールの工程1〜5を女性患者のみからのデータに適用した。結果を以下に示す。
〔0200〕 次に、男性試料および女性試料が癌かまたは正常であるかの予測に関し、同じモデルを検討した。結果を以下に示す。
実施例7−選択アルゴリズム(バイオマーカー;癌および正常)
〔0201〕 実施例1〜6の結果は、59種類のバイオマーカーを含むモデルに関するものである。本明細書で議論しているように、選択アルゴリズムを使用して、予測精度を有意に低下させることなく、バイオマーカーの数を減らすことができる。バイオマーカー選択アルゴリズムを実行して、サポートベクトルマシンで使用するバイオマーカーを見つけ出した。
〔0202〕 上述した8工程のバイオマーカー選択アルゴリズムを使用し、2つの肺病理分類(癌、正常)を特徴付けるための4種類のバイオマーカーモデル(EGF、sCD40リガンド、IL−8、およびMMP−8)を選択した。実施例1からのデータを5工程プロトコールに従って処理した。ただし、工程2の前処理工程では、選択アルゴリズムによって選抜された4種類のバイオマーカー以外のすべてのバイオマーカーを除いた。以下に記載したように、モデルフィットの指標は、95%の精度、93%の感度、および87%の特異度を示した。
実施例8−選択アルゴリズム(バイオマーカーおよび男性;癌および正常)
〔0203〕 実施例7に記載した、バイオマーカーの数を制限する過程を、実施例1からの、男性患者に関する値のみを含む下位セットに適用した。8工程のバイオマーカー選択アルゴリズムを使用して、以下に示すように、100%の精度、100%の感度、および100%の特異度で男性における2つの肺病理分類(癌および正常)を特徴づけるために、5つのバイオマーカーモデル(EGF、IL−8、Sfas、MMP−9、およびPAI−1)を選択した(もとのデータセットに含まれていた2つの変数をPAI−1と命名した。これはその内の2番目のもので、Panomics社のキットに由来するPAI−1バイオマーカーである)。
〔0204〕 次に、同様の考察(すなわち、5種類のバイオマーカーから構成される下位セット、男性)を、男性および女性の試料が癌であるかまたは正常であるかの予測に関して検討した。結果を以下に示す。
実施例9−選択アルゴリズム(バイオマーカーおよび女性;癌および正常)
〔0205〕 実施例7に記載した、バイオマーカーの数を制限する過程を、実施例1からの、女性患者に関する値のみを含む下位セットに適用した。8工程のバイオマーカー選択アルゴリズムを使用して、以下に示すように、100%の精度、100%の感度、および100%の特異度で女性における2つの肺病理分類(癌および正常)を特徴づけるために、3つのバイオマーカーモデル(EGF、sCD40リガンド、IL−8)を選択した。
〔0206〕 次に、同様の考察(すなわち、3種類のバイオマーカーから構成される下位セット、女性)を、男性および女性の試料が癌であるかまたは正常であるかの予測に関して検討した。結果を以下に示す。
実施例10−データの収集とアダブーストを使用した解析
データに関する問題
〔0207〕 受信したデータは、実施例1で記載した、Luminexからのバイオマーカー濃度に関する生の出力であった。Luminexから出力されたデータには、蛍光レベル、イベントの数、集計した蛍光レベル、調整した蛍光レベル、正規化したバイオマーカー濃度(この場合正規化とは、観測された蛍光を濃度の標準曲線に当てはめて、観測された蛍光を濃度に変換することを意味する)、集計し、正規化したバイオマーカー濃度、および調整したバイオマーカー濃度が含まれていた。本明細書に記載した解析には、正規化したバイオマーカー濃度を使用した。タンパク質の定量の試験から、試料はタンパク質の総量の点でほぼ矛盾がなく、そのため、バイオマーカーレベルをさらに正規化する必要はないことがわかった(この場合の正規化とは、試料間でのタンパク質レベルの差を調整するために、係数をかけることを意味している)。
〔0208〕 以下に記載する86種類のバイオマーカーのそれぞれについて、バイオマーカーの定量データを収集した:脳由来神経栄養因子(「BDNF」)、Bリンパ球化学誘引物質(「BLC」)、皮膚T細胞誘引ケモカイン(「CTACK」)、エオタキシン−2、エオタキシン−3、グランザイム−B、肝細胞増殖因子(「HGF」)、I−TAC(「CXCL11」;「ケモカイン(C−X−Cモチーフ)リガンド11」、「インターフェロン誘導T細胞α化学誘引物質」)、レプチン(「LEP」)、白血病抑制因子(「LIF」)、マクロファージコロニー刺激因子(「MCSF」)、γインターフェロン誘導性モノカイン(「MIG」)、マクロファージ炎症性タンパク質−3α(「MIP−3α」)、神経成長因子β(「NGF−β」)、可溶性リガンド(「CD40リガンド」)、上皮増殖因子(「EFG」)、エオタキシン(「CCL11」)、フラクタルキン、塩基性線維芽細胞増殖因子(「FGF−塩基性」)、顆粒球コロニー刺激因子(「G−CSF」)、顆粒球マクロファージコロニー刺激因子(「GM−CSF」)、インターフェロンγ(「IFNγ」)、IFN−ω、IFN−α2、IFN−β、インターロイキン(「IL」)1a、IL−1β、IL−1ra、IL−2、IL−2ra、IL−3、IL−4、IL−5、IL−6、IL−7、IL−8、IL−9、IL−10、IL−12(p40)、IL−12(p70)、IL−13、IL−15、IL−16、IL−17、IL−17a、IL−17F、IL−20、IL−21、IL−22、IL−23(p19)、IL−27、IL−31、IP−10、単球走化性タンパク質1(「MCP−1」)、マクロファージ炎症性タンパク質(「MIP」)1α、MIP−1β、好中球活性化ペプチド78(「ENA−78」)、オステオプロテゲリン(「OPG」)、胎盤増殖因子(「PIGF」)、血小板由来成長因子サブユニットBホモ二量体(「PDGFBB」)、T細胞由来の好酸球走化性物質(「RANTES」)、幹細胞成長因子(「SCGF」)、ストロマ細胞由来因子1(「SDF−1」)、可溶性Fasリガンド(「Sfas−リガンド」)、NFκ−B活性化可溶性受容体リガンド(「sRANKL」)、サバイビン、トランスフォーミング増殖因α(「TGFα」)、TGF−β、腫瘍壊死因子a(「TNFα」)、TNF−β、TNF受容体1(「TNFR−I」)、TNF関連性アポトーシス誘導性リガンド(「TRAIL」)、血管内皮成長因子(「VEGF」)、アディポネクチン、プラスミノーゲン活性化因子阻害因子1(「PAI−1」;「セルピン」)(活性型/全)、レジスチン(「RETN」;「xcp1」)、sFas、可溶性Fasリガンド(「sFasL」)、マクロファージ遊走性阻止因子(「MIF」)、sE−セレクチン、可溶性血管細胞接着分子(「sVCAM」)、可溶性細胞間接着分子(「sICAM」)、ミエロペルオキシダーゼ(「MPO」)、血清アミロイドA(「SAA」;「SAA1」)。
〔0209〕 それぞれの対象につき、計3試料について、86種類のバイオマーカーをそれぞれ測定した。分類する目的では、各試料に分類を割り当てるモデルを作成した。ある対象のいずれかの試料が癌であると見なされた場合には、その患者は癌を患っていると仮定した。病理を決定するこの方法は、他の可能な方法、例えば投票よりも控えめである。
〔0210〕 検出の上限を超えたバイオマーカー濃度は、検出の上限と等しいと設定した。検出の下限を下回るバイオマーカー濃度は、検出の下限と等しいと設定し、2の平方根で割った。この解はこの問題に限られるものであり、真のバイオマーカー分布の評価に偏りを生じるものではないと考えられる。これは適宜、検出の上限または下限でのバイオマーカーの値の分布に質点を生成する効果を有する。SVMがノンパラメトリックであり、アダブーストが一連の木に基づくものであることから、上述したこのその場しのぎの解の欠点は適用されない。性別、年齢、および喫煙は全ての分類モデルに含められた。
結果
〔0211〕 データ:肺病理分類、y(NSCLC、正常)、および86−タプルの連続的に分布しているバイオマーカー、x、が、3重複(計1634試料、癌:546、癌以外:1088)で行った各544人の対象(癌:180、癌以外:364)について使用可能であった。それぞれの試料についてのデータ(y、x)を観測と見なす。544対象(1634試料)を学習セット(N=209;626試料)と確認セット(N=335;1008試料)とに無作為に分けた(表5)。
〔0212〕 モデル:本試験では、第3a相にSVMおよびアダブーストを使用した。本明細書で示す結果は、全バイオマーカーと人口統計学的情報を使用するモデルに関する結果である(544対象、対象一人当たり3試料の1634試料、および86種類のバイオマーカー)。バイオマーカーのみ、またはバイオマーカー全体のパネルを含む下位セットとモデルについても検討した。SVMと比較するとアダブーストの性能が非常に優れていたため、精力的にアダブーストを探索した。
〔0213〕 統計学的手法:肺病理分類に伴う各バイオマーカーの分布の変化に関する統計的な有意差をクラスカル・ワリス検定で評価した。全ての統計検定は両側検定で、有意差レベルは5%であった。ジェフリーズ法を使用して、両方の割合に関する95%信頼区間の上限と下限を計算した。試料一つ当たりを基準として解析した場合には自己相関を無視し、全ての解析において、複数の比較に関する補正は行わなかった。
〔0214〕 モデル性能:モデル性能は、確認セット中に含まれている試料に関するモデルの予測を試験すること、または対象レベルでの試料の予測を集計することのいずれかによって決定することができる。試料レベルでの予測を集計するために、ある対象に由来する1つの試料が癌であると予測された場合には、その対象を癌であると予測した。データを集計するには他の方法もあるが、本実施例では、感度(真陽性率としても知られている)および特異度(偽陽性率としても知られている)を最大にする方法を選択した。
〔0215〕 1種類のバイオマーカー(IP−10)を除いて、全てのバイオマーカーで有意な変化が見られた。試料一つ当たりを基準とした性別に関するバイオマーカーの対比からは、22種類のバイオマーカー(アディポネクチン、IL.27、IL.2ra、IL.31、LIF、MPO、PIGF、SCF、sEセレクチン、sFas.リガンド、TNFR.II、ENA.78、エオタキシン、フラクタルキン、GCSF、GM.CSF、IL.15、I.TAC、レプチン、MIP.1b、レジスチン、IL.21)が有意な変化を表したことが示された。データベースに含まれている人種(白人、黒人)に関し、試料一つ当たりを基準としてバイオマーカーを生データで対比すると、53種類のバイオマーカーが有意な変化を示したことが明らかとなった。試料一つ当たりを基準として、データベース中の癌対象とそれ以外の対象を対比すると、1種類のバイオマーカー(IP.10)を除き、全てのバイオマーカーで有意な変化が認められた。
〔0216〕 試料一つ当たりを基準とした予測に関しては(表6〜9)、総体的に、SVMはアダブーストよりも低い性能しか示さなかった[SVM:感度=0.78(0.02)、95%信頼区間(0.74、0.82)、特異度=0.92(0.01)、95%CI(0.90、0.94)、アダブースト:感度=0.86(0.02)、95%CI(0.82、0.89)、特異度=0.93(0.01)、95%CI(0.90、0.94)]。アダブーストの性能は、男性のみ(表10および11)および女性のみ(表12および13)に限定した場合には同程度であった[男性のみ:感度=0.87(0.02)、95%CI(0.82、0.91)、特異度=0.95(0.01)、95%CI(0.92、0.97)、女性のみ:感度=0.82(0.03)、95%CI(0.76、0.87)、特異度=0.94(0.01)、95%CI(0.90、0.96)]。
〔0217〕 対象一人当たりについての予測(表14〜17)に関しては、総体的に、SVMはアダブーストよりも低い性能しか示さなかった[SVM:感度=0.79(0.04)、95%信頼区間(0.70、0.85)、特異度=0.92(0.02)、95%CI(0.88、0.95)、アダブースト:感度=0.87(0.03)、95%CI(0.80、0.92)、特異度=0.93(0.02)、95%CI(0.88、0.96)]。アダブーストの性能は、男性のみ(表18および19)および女性のみ(表20および21)に限定した場合でも同程度であった[男性のみ:感度=0.95(0.02)、95%CI(0.89、0.98)、特異度=0.87(0.04)、95%CI(0.76、0.93)、女性のみ:感度=0.95(0.02)、95%CI(0.90、0.98)、特異度=0.74(0.06)、95%CI(0.61、0.83)]。
〔0218〕 アダブーストおよびSVMの受信者特性(ROC)曲線および曲線下面積(AUC)を図1と2に示す。アダブーストのAUCは0.98であり、SVMのAUCは0.96である。アダブーストの男性のみおよび女性のみの場合のROC曲線を図3と4に示す。男性のみの場合のAUCは0.98であり、女性のみの場合のAUCは0.95である。アダブーストの変数重要度プロットを図5に示す。アダブーストモデルで最も重要な3つの変数は、CTACK、MSCF、およびエオタキシン.3である。男性に限定した場合のアダブーストの変数重要度プロットを図6に示す。最も重要な3つの変数は、MCSF、CTACK、およびエオタキシン.3であった。女性に限定した場合のアダブーストの変数重要度プロットを図7に示す。最も重要な3つの変数は、MCSF、FGF.塩基性、およびCTACKであった。
〔0219〕 アダブーストの性能が、データベースを無作為に学習セットと確認セットに分割したことによる人為的な結果でないことを確認するために、無作為に200個の画分を生成し、それぞれの画分にモデルを当てはめた。これら200個のモデルの性能分布のを図8〜10に要約した。アダブーストの性能は一定して良いように見え、このことから、アダブーストについて記載した性能統計が確認された。
考察
〔0220〕 これらのデータは、性別による制限を設けても設けなくても、アダブースト分類器の優れた予測に関する一貫したパターンを示している。他の分析は、a)バイオマーカーのみを使用して癌をモデル化する工程、b)バイオマーカーの最適な下位セットを生成する工程、ここでバイオマーカーは、好ましくは図5−7の結果に基づいて、より好ましくはこれらの図におけるスコアが0.004を上回る、より好ましくはスコアが0.006を上回る、さらに好ましくはスコアが0.008を上回る、一層さらに好ましくはスコアが0.01を上回るバイオマーカーを含み、数が少ないながらも優れた予測の質を有し、c)この実施例の結果を実施例1〜9の結果と比較する工程を含むはずである。
実施例11−非小細胞肺癌の診断試験
〔0221〕 診断情報が望まれている患者から体液試料を得る。試料は好ましくは、血清または血漿である。実施例1〜10のうちのいずれか1例からのバイオマーカーそれぞれの、試料中の濃度を決定する。試料中の各バイオマーカーについて測定した濃度を、サポートベクトルマシン中の学習データを使って決定した式に入力する。この式によって導き出された値が正であれば、これは非小細胞肺癌を示すものであり、値が負であれば、これは非小細胞肺癌でないことを示す。
実施例12−男性対象における非小細胞肺癌の診断試験
〔0222〕 診断情報が望まれている男性患者から体液試料を得る。試料は好ましくは、血清または血漿である。実施例1〜5、7〜8または10のうちのいずれか1例からのバイオマーカーそれぞれの、試料中の濃度を決定する。試料中の各バイオマーカーについて測定した濃度を、サポートベクトルマシン中の学習データを使って決定した式に入力する。この式によって導き出された値が正であれば、これは非小細胞肺癌を示すものであり、値が負であれば、これは非小細胞肺癌でないことを示す。
実施例13−男性対象における非小細胞肺癌の別の試験
〔0223〕 本明細書に記載する多くのバイオマーカーは、全てではなくても、上述した種類のコミュニケーション経路に関与している。バイオマーカーのいくつかは互いに一次相互作用器として関わり合っている。診断アッセイまたは予後アッセイで使用するためのマーカーの選択は、特定のバイオマーカー間およびそれらの一次相互作用器との間における既知の関係を使用することで容易になり得る。ARIADNE PATHWAY STUDIO(登録商標)で生成した、HGF(肝細胞増殖因子)と他のバイオマーカーとの間の既知のコミュニケーションを図5で見ることができる。図5は、sFasL(可溶性Fasリガンド)、PAI−1(セルピンプラスミノーゲン活性化因子阻害因子1)(活性型/全)、Ins(インスリン;C−ペプチドも含む)、EGF(上皮増殖因子)、MPO(ミエロペルオキシダーゼ)、およびMIF(マクロファージ遊走性阻止因子)を含む、HGF(肝細胞増殖因子)の一次相互作用器を示している。他の相互作用器(一次相互作用器ではない)としては、RETN(レジスチン、xcp1)、SAA1(血清アミロイドA、SAA)、CCL11(エオタキシン)、LEP(レプチン)およびCXCL11(ケモカイン(C−X−Cモチーフ)リガンド11、インターフェロン誘導T細胞α化学誘引物質(I−TAC)またはγインターフェロン誘導性タンパク質9(IP−9))が挙げられる。加えて、図5は、MMP1およびMMP−8(マトリックスメタロプロテアーゼ1および8)の2種類のバイオマーカーが、HGFを伴うコミュニケーション経路上にはないことを示している。
〔0224〕 診断情報が望まれている患者から体液試料を得る。試料は好ましくは、血清または血漿である。試料中の、選択したバイオマーカーだけの濃度を決定する。HGFがサポートベクトルマシン中で使用するための選択したバイオマーカーのうちの1つであると仮定すると、HGFのいずれかの一次相互作用器(例えば、MIF、EGFなど)の濃度を、HGFと置き換えることができる。そのため、HGFと置き換えた一次相互作用器を含む学習データについて、サポートベクトルマシンが再度実行される。次にこのモデルを患者の試料に適用する。この式によって導き出された値が正であれば、これは非小細胞肺癌を示すものであり、値が負であれば、これは非小細胞肺癌でないことを示す。
実施例14−非小細胞肺癌と反応性気道疾患との区別
〔0225〕 非小細胞肺癌と反応性気道疾患とを区別するためには、(1)非小細胞肺癌の有無の評価、(2)反応性気道疾患の有無の評価、および(3)非小細胞肺癌または反応性気道疾患の評価、の3つを決定する。これらの評価は以下に記載するように実施する。
〔0226〕 診断情報が望まれている患者から体液試料を得る。試料は好ましくは、血清または血漿である。実施例1〜10のうちのいずれか1例からのバイオマーカーの、試料中の濃度を決定する。試料中の各バイオマーカーについて測定した濃度を、サポートベクトルマシン中の学習データを使って決定した式に入力する。この式によって導き出された値が正であれば、これは非小細胞肺癌を示すものであり、値が負であれば、これは非小細胞肺癌でないことを示す。
〔0227〕 次に、実施例1〜10のうちのいずれか1例からのバイオマーカーの、試料中の濃度を決定する。試料中の各バイオマーカーについて測定した濃度を、サポートベクトルマシン中の学習データを使って決定した式に入力する。この式によって導き出された値が正であれば、これは反応性気道疾患を示すものであり、値が負であれば、これは反応性気道疾患でないことを示す。
〔0228〕 次に、実施例1〜10のうちのいずれか1例からのバイオマーカーの、試料中の濃度を決定する。試料中の各バイオマーカーについて測定した濃度を、サポートベクトルマシン中の学習データを使って決定した式に入力する。この式によって導き出された値が正であれば、これは非小細胞肺癌を示すものであり、値が負であれば、これは反応性気道疾患を示す。
〔0229〕 正のスコアおよび負のスコアを分析することによって、これらの結果をさらに評価する。具体的には、その患者が非小細胞肺癌であるか、反応性気道疾患であるか、または疾患に罹患していないかの決定は、どの条件が、3つのスコアのうちの2つで見られるかに依存する。例えば、第一の試験と第三の試験が正であった場合、その患者は非小細胞肺癌に罹患していると診断され得る。第一の試験と第二の試験が負であった場合には、そおの患者は非小細胞肺癌にも反応性気道疾患にも罹患していないと診断され得る。
〔0230〕 本開示に含まれる等式、式および関係は、例示的かつ代表的なものであり、本発明を限定することを意図しない。本明細書で開示した任意の所与の式によって説明されるものと同じ現象を表すために、別の式を使ってもよい。具体的には、本発明で開示する式を、誤り訂正タームを加えることで、高位タームを加えることで、または不正確さを考慮すること、別の名称の定数もしくは変数を使用すること、または別の表現を使用することで修正してもよい。式の他の修正、置換、置き換え、または変更を実施してもよい。
〔0231〕 本明細書中で言及している全ての出版物、特許、および公開されている特許出願は、その全体が、あたかも個々の出版物、特許または公開特許出願が具体的にかつ個別に参照することにより組み込まれると示されているのと同じように、参照することにより本明細書に組み込まれる。
本発明は、例えば、以下を提供する。
(項目1)
(a)対象の生理学的試料を収集する工程;(b)前記試料中の複数のバイオマーカーのバイオマーカー測定値を決定する工程;および(c)分類システムを利用し、該バイオマーカー測定値に基づいて該試料を分類する工程を含む、該対象を生理学的に特徴付ける方法であって、ここで該試料の該分類と、該対象の生理的な状況もしくは状態、または疾患状況の変化には相関がある、前記方法。
(項目2)
(a)対象の生理学的試料を収集する工程;(b)前記試料中の複数のバイオマーカーのバイオマーカー測定値を決定する工程;および(c)分類システムを利用し、該バイオマーカー測定値に基づいて該試料を分類する工程を含む、該対象における非小細胞肺癌の診断方法であって、ここで該試料の該分類は、該対象における非小細胞肺癌の存在または発生を示すものである、前記方法。
(項目3)
(a)対象の生理学的試料を収集する工程;(b)前記試料中の複数のバイオマーカーのバイオマーカー測定値を決定する工程;および(c)分類システムを利用し、該バイオマーカー測定値に基づいて該試料を分類する工程、を含む該対象における反応性気道疾患の診断方法であって、ここで該試料の該分類は、該対象における反応性気道疾患を示すものである、前記方法。(項目4)
(a)対象の生理学的試料を収集する工程;
(b)前記試料中の、反応性気道疾患の兆候と非小細胞肺癌の区別を補助する複数のバイオマーカー、反応性気道疾患を示す複数のバイオマーカー、および非小細胞肺癌を示す複数のバイオマーカーのバイオマーカー測定値を決定する工程、ここで前記複数のバイオマーカーは同一のものでなく;
(c)3つの分類システムを使用して、該バイオマーカー測定値に基づいて該試料を分類する工程、ここで該試料の該分類は、該対象における(i)反応性気道疾患および非小細胞肺癌;(ii)反応性気道疾患の有無;および(iii)非小細胞肺癌の有無をの兆候の区別を補助するものであり;
(d)どの条件が該3つの分類のうちの2つに見られるかに応じて、該対象が、(1)反応性気道疾患に罹患しているか;(2)非小細胞肺癌に罹患しているか、または(3)疾患に罹患していないか、を決定する工程、を含む該対象の肺疾患の診断方法。
(項目5)
該分類システムが機械学習システムである、項目1〜4のいずれか1項に記載の方法。
(項目6)
該機械学習システムがカーネルを使用する分類システムである、項目5の方法。
(項目7)
該カーネルを使用する分類システムがサポートベクトルマシンである、項目6の方法。
(項目8)
該機械学習システムが分類および回帰木システムである、項目5の方法。
(項目9)
該機械学習システムが分類および回帰木システムの集合である、項目8の方法。
(項目10)
該機械学習システムがアダブーストである、項目9の方法。
(項目11)
バイオマーカーのセットそれぞれの、複数のバイオマーカー測定値を含む試験データの分類方法であって、
ヒト試験対象における該バイオマーカーのセットのそれぞれのバイオマーカーに関するバイオマーカー測定値を含む試験データを受信する工程;
電子的に記憶されている学習データベクトルのセットを使って訓練したサポートベクトルマシンの電子表示を使用して該試験データを評価する工程、ここで各学習データベクトルは個々のヒトを表し、かつ、対応するヒトに関する該バイオマーカーのセットの各バイオマーカーのバイオマーカー測定値を含み、各学習データベクトルはさらに、対応するヒトの病状に関する分類を含んでおり;および
該評価する工程に基づいて、該ヒト試験対象の分類を出力する工程を含む、試験データの分類方法。
(項目12)
バイオマーカーのセットそれぞれの、複数のバイオマーカー測定値を含む試験データの分類方法であって、
ヒト試験対象における該バイオマーカーのセットの、各バイオマーカーに関するバイオマーカー測定値を含む該試験データを受信する工程;
電子的に記憶されている学習データベクトルのセットを使って訓練したアダブースト分類器の電子表示を使用して試験データを評価する工程、ここで、各学習データベクトルは個々のヒトを表し、かつ、対応するヒトに関する該バイオマーカーのセットの各バイオマーカーのバイオマーカー測定値を含み、各学習データベクトルはさらに、対応するヒトの病状に関する分類を含んでおり;および、
評価する工程に基づいたヒト試験対象の分類を出力する工程を含む、試験データの分類方法。
(項目13)
バイオマーカーのセットそれぞれの、複数のバイオマーカー測定値を含む試験データの分類方法であって、
電子的に記憶されている学習データベクトルのセットにアクセスする工程、ここで各学習データベクトルは個々のヒトを表し、かつ、対応するヒトに関する該バイオマーカーのセットの各バイオマーカーのバイオマーカー測定値を含み、各学習データベクトルはさらに、対応するヒトの病状に関する分類を含んでおり;
該電子的に記憶されている学習データベクトルのセットを使用して、サポートベクトルマシンの電子表示を訓練する工程;
ヒト試験対象における該バイオマーカーのセットに関する複数のバイオマーカー測定値を含む試験データを受信する工程;
該サポートベクトルマシンの該電子表示を使用して、該試験データを評価する工程;および、
該評価する工程に基づいて、該ヒト試験対象の分類を出力する工程を含む、試験データの分類方法。
(項目14)
バイオマーカーのセットそれぞれの、複数のバイオマーカー測定値を含む試験データの分類方法であって、
電子的に記憶されている学習データベクトルのセットにアクセスする工程、ここで各学習データベクトルは個々のヒトを表し、かつ、対応するヒトに関する該バイオマーカーのセットの各バイオマーカーのバイオマーカー測定値を含み、各学習データベクトルはさらに、対応するヒトの病状に関する分類を含んでおり;
該電子的に記憶されている学習データベクトルのセットを使用して、アダブースト分類器の電子表示を訓練する工程;
ヒト試験対象における該バイオマーカーのセットに関する複数のバイオマーカー測定値を含む試験データを受信する工程;
該アダブースト分類器の該電子表示を使用して、該試験データを評価する工程;および、
該評価する工程に基づいて、該ヒト試験対象の分類を出力する工程を含む、試験データの分類方法。
(項目15)
バイオマーカーのセットそれぞれの、複数のバイオマーカー測定値を含む試験データの分類方法であって、
電子的に記憶されている学習データベクトルのセットにアクセスする工程、ここで各学習データベクトルは個々のヒトを表し、かつ、対応するヒトに関する該バイオマーカーのセットの各バイオマーカーのバイオマーカー測定値を含み、各学習データベクトルはさらに、対応するヒトの病状に関する分類を含んでおり;
該バイオマーカーのセットから、バイオマーカーの下位セットを選択する工程;
該電子的に記憶されている学習データベクトルのセットの、バイオマーカーの該下位セットからのデータを使用して、サポートベクトルマシンの電子表示を訓練する工程;
ヒト試験対象に関する複数のバイオマーカー測定値を含む試験データを受信する工程;
該サポートベクトルマシンの該電子表示を使用して、該試験データを評価する工程;および、
該評価する工程に基づいて、該ヒト試験対象の分類を出力する工程を含む、試験データの分類方法であって、ここで、バイオマーカーの該下位セットを選択する工程には、
a.該バイオマーカーのセットに含まれているそれぞれのバイオマーカーについて、プログラムされているコンピューターを使用して、それぞれのバイオマーカーに関する2群の濃度測定値のマージン分布間の距離を計算すること、それによって、複数の距離が生成され;
b.該距離に従って、該バイオマーカーのセットに含まれている該バイオマーカーを順序付けること、それによって順序付けられたバイオマーカーのセットが生成され;
c.該順序付けられたバイオマーカーのセットの複数の初期セグメントのそれぞれについて、該学習データに基づいてモデルフィットの指標を計算すること;
d.モデルフィットの最大値型指標に従って、該順序付けられたバイオマーカーのセットの初期セグメントを選択すること、それによって、該順序付けられたバイオマーカーのセットの好ましい初期セグメントが選択され;
e.バイオマーカーの空集合から開始し、バイオマーカーの該下位セットを生成するために、該順序付けられたバイオマーカーのセットの好ましい初期セグメントから、該モデルにさらなるバイオマーカーを再帰的に追加すること、ここで各さらなるバイオマーカーは、(1)該好ましい初期セグメントに含まれている残りのバイオマーカーの中でも、それを追加することで、モデルフィットが最大に改良される場合、および(2)それを追加することで、モデルフィットが少なくとも予め設定した閾値までは改良される場合に、既存のバイオマーカーの下位セットに追加され;
f.それ以上バイオマーカーを追加しても、該予め設定しておいた閾値より、そのモデルフィット指標を超えるモデルフィットの指標が得られない場合には、既存のバイオマーカーの下位セットへのバイオマーカーの追加を停止すること、それによって、バイオマーカーの下位セットが選択される、が含まれる、前記方法。
(項目16)
バイオマーカーのセットそれぞれの、複数のバイオマーカー測定値を含む試験データの分類方法であって、
電子的に記憶されている学習データベクトルのセットにアクセスする工程、ここで各学習データベクトルは個々のヒトを表し、かつ、対応するヒトに関する該バイオマーカーのセットの各バイオマーカーのバイオマーカー測定値を含み、各学習データベクトルはさらに、対応するヒトの病状に関する分類を含んでおり;
該バイオマーカーのセットから、バイオマーカーの下位セットを選択する工程;
該電子的に記憶されている学習データベクトルのセットのバイオマーカーの該下位セットからの該データを使用して、アダブースト分類器の電子表示を訓練する工程;
ヒト試験対象に関する複数のバイオマーカー測定値を含む試験データを受信する工程;
該サポートベクトルマシンの該電子表示を使用して、該試験データを評価する工程;および、
該評価する工程に基づく該ヒト試験対象の分類を出力する工程を含む試験データの分類方法であって、ここで、バイオマーカーの該下位セットを選択する工程には:
a.該バイオマーカーのセットに含まれているそれぞれのバイオマーカーについて、プログラムされているコンピューターを使用して、それぞれのバイオマーカーに関する2群の濃度測定値のマージン分布間の距離を計算すること、それによって、複数の距離が生成され;
b.該距離に従って、該バイオマーカーのセットに含まれている該バイオマーカーを順序付けること、それによって順序付けられたバイオマーカーのセットが生成され;
c.該順序付けられたバイオマーカーのセットの複数の初期セグメントのそれぞれについて、該学習データに基づいてモデルフィットの指標を計算すること;
d.モデルフィットの最大値型指標に従って、該順序付けられたバイオマーカーのセットの初期セグメントを選択すること、それによって、該順序付けられたバイオマーカーのセットの好ましい初期セグメントが選択され;
e.バイオマーカーの空集合から開始し、バイオマーカーの該下位セットを生成するために、該順序付けられたバイオマーカーのセットの好ましい初期セグメントから、該モデルにさらなるバイオマーカーを再帰的に追加すること、ここで各さらなるバイオマーカーは、(1)該好ましい初期セグメントに含まれている残りのバイオマーカーの中でも、それを追加することで、モデルフィットが最大に改良される場合、および(2)それを追加することで、モデルフィットが少なくとも予め設定した閾値までは改良される場合に、既存のバイオマーカーの下位セットに追加され;
f.それ以上バイオマーカーを追加しても、該予め設定しておいた閾値より、そのモデルフィット指標を超えるモデルフィットの指標が得られない場合には、既存のバイオマーカーの下位セットへのバイオマーカーの追加を停止すること、それによって、バイオマーカーの該下位セットが選択される工程、が含まれる、前記方法。
(項目17)
バイオマーカーのセットそれぞれの、複数のバイオマーカー測定値を含む試験データの分類方法であって、
ヒト試験対象に関する該バイオマーカーのセットそれぞれのバイオマーカー測定値を含む試験データを受信する工程;
電子的に記憶されている学習データベクトルのセットを使って訓練したサポートベクトルマシンの電子表示を使用して、該試験データを評価する工程、ここで各学習データベクトルは個々のヒトを表し、かつ、対応するヒトに関する該バイオマーカーのセットの各バイオマーカーのバイオマーカー測定値を含み、各学習データベクトルはさらに、対応するヒトの病状に関する分類を含んでおり、該バイオマーカーのセットはバイオマーカーの上位セットから選択され;および、
該評価する工程に基づいた該ヒト試験対象の分類を出力する工程を含む、試験データの分類方法。
(項目18)
バイオマーカーのセットそれぞれの、複数のバイオマーカー測定値を含む該試験データの分類方法であって、
ヒト試験対象に関する該バイオマーカーのセットそれぞれの各バイオマーカー測定値を含む試験データを受信する工程;
電子的に記憶されている学習データベクトルのセットを使って訓練したアダブースト分類器の電子表示を使用して試験データを評価する工程、ここで、各学習データベクトルは個々のヒトを表し、かつ、対応するヒトに関するバイオマーカーのセットの各バイオマーカーのバイオマーカー測定値を含み、各学習データベクトルはさらに、対応するヒトの病状に関する分類を含んでおり、該バイオマーカーのセットはバイオマーカーの上位セットから選択され;および
該評価する工程に基づいた該ヒト試験対象の分類を出力する工程を含む、試験データの分類方法。
(項目19)
a.バイオマーカーの上位セットに含まれている各バイオマーカーについて、プログラムされているコンピューターを使用して、それぞれのバイオマーカーに関する2群の濃度測定値のマージン分布間の距離を計算すること、それによって、複数の距離が生成され;
b.該距離に従って、該バイオマーカーのセットに含まれている該バイオマーカーを順序付けること、それによって、順序付けられたバイオマーカーのセットが生成され;
c.該順序付けられたバイオマーカーのセットの複数の初期セグメントのそれぞれについて、該学習データに基づいてモデルフィットの指標を計算すること;
d.モデルフィットの最大値型指標に従って、該順序付けられたバイオマーカーのセットの初期セグメントを選択すること、それによって、該順序付けられたバイオマーカーのセットの好ましい初期セグメントが選択され;
e.バイオマーカーの空集合から開始し、バイオマーカーの該下位セットを生成するために、該順序付けられたバイオマーカーのセットの該好ましい初期セグメントから、さらなるバイオマーカーを再帰的に追加すること、ここで各さらなるバイオマーカーは、(1)該好ましい初期セグメントに含まれている残りのバイオマーカーの中でも、それを追加することで、モデルフィットが最大に改良される場合、および(2)それを追加することで、モデルフィットが少なくとも予め設定した閾値までは改良される場合に、既存のバイオマーカーの下位セットに追加され;
f.それ以上バイオマーカーを追加しても、該予め設定しておいた閾値より、そのモデルフィット指標を超えるモデルフィットの指標が得られない場合には、既存のバイオマーカーの下位セットへのバイオマーカーの追加を停止すること、それによって、バイオマーカーの下位セットが選択される、を含む方法を使用して、該バイオマーカーのセットの測定値を、バイオマーカーの該上位セットから選択する、項目17および18に記載の方法。
(項目20)
a.バイオマーカーの上位セットに含まれている各バイオマーカーに関して、それぞれのバイオマーカーに関する2群の濃度測定値のマージン分布間の距離を計算し、それによって、複数の距離を生成し;
b.該距離に従って、バイオマーカーの該上位セットに含まれている該バイオマーカーを順序付け、それによって、順序付けられたバイオマーカーのセットを生成し;
c.該順序付けられたバイオマーカーのセットの複数の初期セグメントのそれぞれについて、該学習データに基づいてモデルフィットの指標を計算し;
d.モデルフィットの最大値型指標に従って、該順序付けられたバイオマーカーのセットの初期セグメントを選択し、それによって、該順序付けられたバイオマーカーのセットの好ましい初期セグメントを選択し;
e.バイオマーカーの該初期セグメントから開始し、バイオマーカーの下位セットを生成するために、該順序付けられたバイオマーカーのセットの該好ましい初期セグメントから、バイオマーカーを再帰的に除去し、ここで、各バイオマーカーは、(1)該好ましい初期セグメントに含まれている残りのバイオマーカーのなかでも、それを除去することが、モデルフィットの縮小を最小限に抑える場合、および(2)それを除去することが、少なくとも、予め設定しておいた閾値まではモデルフィットを縮小させない場合に、バイオマーカーの既存の上位セットから除去され;
f.それ以上バイオマーカーを除去すると、モデルフィットの指標が、該予め設定しておいた閾値によってモデルフィットの指標を下回る低下を生じる場合には、バイオマーカーの既存の上位セットからのバイオマーカーの除去を停止し、それによって、バイオマーカーの該上位セットを選択する、ために構成されている論理を使用して、バイオマーカーの該上位セットから該バイオマーカーのセットを選択するために構成されているコンピューターをさらに含む、項目17および18に記載のシステム。
(項目21)
該評価する工程が、電子的に記憶されている学習データベクトルのセットにアクセスすることを含む、項目17〜20のいずれか1項に記載の方法。
(項目22)
該病状についての分類が前記病状の有無である、項目11〜21のいずれか1項に記載の方法。
(項目23)
該病状が肺疾患である、項目22の方法。
(項目24)
該肺疾患が非小細胞癌である、項目23の方法。
(項目25)
該肺疾患が反応性気道疾患である、項目23の方法。
(項目26)
該反応性気道疾患が喘息である、項目25の方法。
(項目27)
該バイオマーカー測定値が、アポリポタンパク質(「Apo」)A1、ApoA2、ApoB、ApoC2、ApoE、CD40、Dダイマー、第VII因子、第VIII因子、第X因子、プロテインC、組織プラスミノーゲン活性化因子(「TPA」)、脳由来神経栄養因子(「BDNF」)、Bリンパ球化学誘引物質(「BLC」)、ケモカイン(C−X−Cモチーフ)リガンド1(「GRO−1」)、皮膚T細胞誘引ケモカイン(「CTACK」)、エオタキシン−2、エオタキシン−3、グランザイム−B、肝細胞増殖因子(「HGF」)、I−TAC(「CXCL11」;「ケモカイン(C−X−Cモチーフ)リガンド11」、γインターフェロン誘導T細胞α化学誘引物質」)、レプチン(「LEP」)、白血病抑制因子(「LIF」)、単球特異的ケモカイン3(「MMP−3」)、マクロファージコロニー刺激因子(「MCSF」)、Γインターフェロン誘導性モノカイン(「MIG」)、マクロファージ炎症性タンパク質−3α(「MIP−3α」)、マトリックスメタロプロテアーゼ(「MMP」)1、MMP2、MMP3、MMP7、MMP8、MMP9、MMP12、MMP13、CD40、神経成長因子β(「NGF−β」)、可溶性リガンド(「CD40リガンド」)、上皮増殖因子(「EFG」)、エオタキシン(「CCL11」)、フラクタルキン、塩基性線維芽細胞増殖因子(「FGF−塩基性」)、顆粒球コロニー刺激因子(「G−CSF」)、顆粒球マクロファージコロニー刺激因子(「GM−CSF」)、インターフェロンγ(「IFNγ」)、IFN−ω、IFN−α2、IFN−β、インターロイキン(「IL」)1a、IL−1β、IL−1ra、IL−2、IL−2ra、IL−3、IL−4、IL−5、IL−6、IL−7、IL−8、IL−9、IL−10、IL−12(p40)、IL−12(p70)、IL−13、IL−15、IL−16、IL−17、IL−17a、IL−17F、IL−20、IL−21、IL−22、IL−23(p19)、IL−27、IL−31、IP−10、単球走化性タンパク質1(「MCP−1」)、マクロファージ炎症性タンパク質(「MIP」)1a、MIP−1β、好中球活性化ペプチド78(「ENA−78」)、オステオプロテゲリン(「OPG」)、胎盤増殖因子(「PIGF」)、血小板由来成長因子サブユニットBホモ二量体(「PDGFBB」)、T細胞由来の好酸球走化性物質(「RANTES」)、幹細胞成長因子(「SCGF」)、ストロマ細胞由来因子1(「SDF−1」)、可溶性Fasリガンド(「Sfas−リガンド」)、NFκ−B活性化可溶性受容体リガンド(「sRANKL」)、サバイビン、トランスフォーミング増殖因a(「TGFa」)、TGF−β、腫瘍壊死因子a(「TNFa」)、TNF−β、TNF受容体1(「TNFR−I」)、TNFR−II、TNF関連性アポトーシス誘導性リガンド(「TRAIL」)、トロンボポエチン(「TPO」)、血管内皮成長因子(「VEGF」)、インスリン(「Ins」)、C−ペプチド、グルカゴン様タンパク質−1/アミリン(「GLP−1/アミリン」)、アミリン(全)、グルカゴン、アディポネクチン、プラスミノーゲン活性化因子阻害因子1(「PAI−1」;「セルピン」)(活性型/全)、レジスチン(「RETN」;「xcp1」)、sFas、可溶性Fasリガンド(「sFasL」)、マクロファージ遊走性阻止因子(「MIF」)、sE−セレクチン、可溶性血管細胞接着分子(「sVCAM」)、可溶性細胞間接着分子(「sICAM」)、ミエロペルオキシダーゼ(「MPO」)、C反応性タンパク質(「CRP」)、血清アミロイドA(「SAA」;「SAA1」)、および血清アミロイドP(「SAP」)からなる群より選択される、少なくとも1つのタンパク質の血漿濃度の測定値を含む、項目11〜26のいずれか1項に記載の方法。
(項目28)
該バイオマーカー測定値が、少なくとも4種類の別個のバイオマーカーの血漿濃度を含む、項目27の方法。
(項目29)
該バイオマーカー測定値が、少なくとも6種類の別個のバイオマーカーの血漿濃度を含む、項目27の方法。
(項目30)
該バイオマーカー測定値が、少なくとも10種類の別個のバイオマーカーの血漿濃度を含む、項目27の方法。
(項目31)
該バイオマーカー測定値が、少なくとも18種類の別個のバイオマーカーの血漿濃度を含む、項目27の方法。
(項目32)
該学習ベクトルのセットが、少なくとも30ベクトル、50ベクトル、100ベクトルを含む、項目11〜31のいずれか1項に記載の方法。
(項目33)
該サポートベクトルマシンが、線形カーネル、ラジアル基底カーネル、多項カーネル、統一カーネル、三角カーネル、エパネクニコフ(Epanechnikov)カーネル、四次多項(二乗重み)カーネル、三次多項(三乗重み)カーネル、およびコサインカーネルから選択される、1つまたは複数のカーネル関数を含む、項目11、13、15、17、および19〜26のいずれか1項に記載の方法。
(項目34)
該アダブースト分類器が、5、10、15、20、25、30、40、50、75または100回の反復を含む、項目12、14、16、および18〜26のいずれか1項に記載の方法。
(項目35)
バイオマーカーのセットそれぞれのバイオマーカー測定値を含む試験データを分類するためのシステムであって、
個々のヒトを表し、かつ、対応するヒトに関するバイオマーカーのセットの各バイオマーカーのバイオマーカー測定値を含み、さらに、対応するヒトの病状に関する分類を含んでいる、電子的に記憶されている学習データベクトルのセット;ならびに、
該電子的に記憶されている学習データベクトルのセットを使用して訓練するのに適しているサポートベクトルマシンの電子表示を含んでおり、ヒト試験対象における該バイオマーカーのセットの複数のバイオマーカー測定値を含む試験データを受信するために構成されており、さらに、該サポートベクトルマシンの該電子表示を使用して該試験データを評価し、および、該評価に基づいて該ヒト試験対象の分類を出力するように構成されている、該電子的に記憶されている学習データベクトルのセットに操作可能に接続されているコンピューターを含む、試験データを分類するためのシステム。
(項目36)
バイオマーカーのセットそれぞれのバイオマーカー測定値を含む試験データを分類するためのシステムであって、
個々のヒトを表し、かつ、対応するヒトに関するバイオマーカーのセットの各バイオマーカーのバイオマーカー測定値を含み、各学習データベクトルはさらに、対応するヒトの病状に関する分類を含んでいる、電子的に記憶されている学習データベクトルのセット;ならびに、
該電子的に記憶されている学習データベクトルのセットを使用して訓練するのに適しているアダブースト分類器の電子表示を含み、ヒト試験対象における該バイオマーカーのセットの複数のバイオマーカー測定値を含む試験データを受信するように構成されており、さらに、該サポートベクトルマシンの該電子表示を使用して該試験データを評価し、および、該評価に基づいて該ヒト試験対象の分類を出力するために構成されている、該電子的に記憶されている学習データベクトルのセットに操作可能に接続されているコンピューターを含む、試験データを分類するためのシステム。
(項目37)
電子的に記憶されている学習データベクトルのセットを使用して訓練したサポートベクトルマシンの電子表示を含むコンピューターを含む、バイオマーカーのセットそれぞれの複数のバイオマーカー測定値を含む試験データを分類するためのシステムであって、各学習データベクトルは個々のヒトを表し、かつ、対応するヒトに関する該バイオマーカーのセットの各バイオマーカーのバイオマーカー測定値を含み、各学習データベクトルはさらに、対応するヒトの病状に関する分類を含んでおり、該コンピューターは、ヒト試験対象における該バイオマーカーのセットに関する複数のバイオマーカー測定値を含む試験データを受信するために構成されており、該コンピューターはさらに、該サポートベクトルマシンの該電子表示を使用して該試験データを評価し、および、該評価に基づいて該ヒト試験対象の分類を出力するように構成されている、試験データを分類するためのシステム。
(項目38)
電子的に記憶されている学習データベクトルのセットを使用して訓練したアダブースト分類器の電子表示を含むコンピューターを含む、バイオマーカーのセットそれぞれの複数のバイオマーカー測定値を含む試験データを分類するためのシステムであって、各学習データベクトルは個々のヒトを表し、かつ、対応するヒトに関する該バイオマーカーのセットの各バイオマーカーのバイオマーカー測定値を含み、各学習データベクトルはさらに、対応するヒトの病状に関する分類を含んでおり、該コンピューターは、ヒト試験対象における該バイオマーカーのセットに関する複数のバイオマーカー測定値を含む試験データを受信するために構成されており、該コンピューターはさらに、該サポートベクトルマシンの該電子表示を使用して該試験データを評価し、および、該評価に基づいて該ヒト試験対象の分類を出力するように構成されている、試験データを分類するためのシステム。
(項目39)
a.バイオマーカーの上位セットに含まれている各バイオマーカーに関して、それぞれのバイオマーカーに関する2群の濃度測定値のマージン分布間の距離を計算し、それによって、複数の距離を生成し;
b.該距離に従って、バイオマーカーの該上位セットに含まれている該バイオマーカーを順序付け、それによって、順序付けられたバイオマーカーのセットを生成し;
c.該順序付けられたバイオマーカーのセットの複数の初期セグメントのそれぞれについて、該学習データに基づいてモデルフィットの指標を計算し;
d.モデルフィットの最大値型指標に従って、該順序付けられたバイオマーカーのセットの初期セグメントを選択し、それによって、該順序付けられたバイオマーカーのセットの好ましい初期セグメントを選択し;
e.バイオマーカーの空集合から開始し、バイオマーカーの下位セットを生成するために、該順序付けられたバイオマーカーのセットの該好ましい初期セグメントから、さらなるバイオマーカーを再帰的に追加し、ここで各さらなるバイオマーカーは、(1)該好ましい初期セグメントに含まれている残りのバイオマーカーの中でも、それを追加することで、モデルフィットが改良される場合、および(2)それを追加することで、モデルフィットが少なくとも予め設定した閾値までは改良される場合に、既存のバイオマーカーの下位セットに追加され;
f.それ以上バイオマーカーを追加しても、該予め設定しておいた閾値より、そのモデルフィット指標を超えるモデルフィットの指標が得られない場合には、既存のバイオマーカーの下位セットへのバイオマーカーの追加を停止し、それによって、バイオマーカーの該下位セットを選択する、ために構成されている論理を使用して、バイオマーカーの該上位セットから該バイオマーカーのセットを選択するために構成されているコンピューターをさらに含む、項目37のシステム。
(項目40)
a.バイオマーカーの上位セットに含まれている各バイオマーカーに関して、それぞれのバイオマーカーに関する2群の濃度測定値のマージン分布間の距離を計算し、それによって、複数の距離を生成し;
b.該距離に従って、バイオマーカーの該上位セットに含まれている該バイオマーカーを順序付け、それによって、順序付けられたバイオマーカーのセットを生成し;
c.該順序付けられたバイオマーカーのセットの複数の初期セグメントのそれぞれについて、該学習データに基づいてモデルフィットの指標を計算し;
d.モデルフィットの最大値型指標に従って、該順序付けられたバイオマーカーのセットの初期セグメントを選択し、それによって、該順序付けられたバイオマーカーのセットの好ましい初期セグメントを選択し;
e.バイオマーカーの該初期セグメントから開始し、バイオマーカーの下位セットを生成するために、該順序付けられたバイオマーカーのセットの該好ましい初期セグメントから、バイオマーカーを再帰的に除去し、ここで、各バイオマーカーは、(1)該好ましい初期セグメントに含まれている残りのバイオマーカーのなかでも、それを除去することが、モデルフィットの縮小を最小限に抑える場合、および(2)それを除去することが、少なくとも、予め設定しておいた閾値まではモデルフィットを縮小させない場合に、バイオマーカーの既存の上位セットから除去され;
f.それ以上バイオマーカーを除去すると、モデルフィットの指標が、該予め設定しておいた閾値によってモデルフィット指標を下回る低下を生じる場合には、バイオマーカーの既存の上位セットからのバイオマーカーの除去を停止し、それによって、バイオマーカーの該上位セットを選択する、ために構成されている論理を使用して、バイオマーカーの該上位セットから該バイオマーカーのセットを選択するために構成されているコンピューターをさらに含む、項目37に記載のシステム。
(項目41)
a.バイオマーカーの上位セットに含まれている各バイオマーカーに関して、それぞれのバイオマーカーに関する2群の濃度測定値のマージン分布間の距離を計算し、それによって、複数の距離を生成し;
b.該距離に従って、バイオマーカーの該上位セットに含まれている該バイオマーカーを順序付け、それによって、順序付けられたバイオマーカーのセットを生成し;
c.該順序付けられたバイオマーカーのセットの複数の初期セグメントのそれぞれについて、該学習データに基づいてモデルフィットの指標を計算し;
d.モデルフィットの最大値型指標に従って、該順序付けられたバイオマーカーのセットの初期セグメントを選択し、それによって、該順序付けられたバイオマーカーのセットの好ましい初期セグメントを選択し;
e.バイオマーカーの空集合から開始し、バイオマーカーの下位セットを生成するために、該順序付けられたバイオマーカーのセットの該好ましい初期セグメントから、さらなるバイオマーカーを再帰的に追加し、ここで各さらなるバイオマーカーは、(1)該好ましい初期セグメントに含まれている残りのバイオマーカーの中でも、それを追加することで、モデルフィットが改良される場合、および(2)それを追加することで、モデルフィットが少なくとも予め設定した閾値までは改良される場合に、既存のバイオマーカーの下位セットに追加され;
f.それ以上バイオマーカーを追加しても、該予め設定しておいた閾値より、そのモデルフィット指標を超えるモデルフィットの指標が得られない場合には、既存のバイオマーカーの下位セットへのバイオマーカーの追加を停止し、それにより、バイオマーカーの該下位セットを選択する、ために構成されている論理を使用して、バイオマーカーの該上位セットから該バイオマーカーのセットを選択するために構成されているコンピューターをさらに含む、項目38のシステム。
(項目42)
a.バイオマーカーの上位セットに含まれている各バイオマーカーに関して、それぞれのバイオマーカーに関する2群の濃度測定値のマージン分布間の距離を計算し、それによって、複数の距離を生成し;
b.該距離に従って、バイオマーカーの該上位セットに含まれている該バイオマーカーを順序付け、それによって、順序付けられたバイオマーカーのセットを生成し;
c.該順序付けられたバイオマーカーのセットの複数の初期セグメントのそれぞれについて、該学習データに基づいてモデルフィットの指標を計算し;
d.モデルフィットの最大値型指標に従って、該順序付けられたバイオマーカーのセットの初期セグメントを選択し、それによって、該順序付けられたバイオマーカーのセットの好ましい初期セグメントを選択し;
e.バイオマーカーの該初期セグメントから開始し、バイオマーカーの下位セットを生成するために、該順序付けられたバイオマーカーのセットの該好ましい初期セグメントから、バイオマーカーを再帰的に除去し、ここで、各バイオマーカーは、(1)該好ましい初期セグメントに含まれている残りのバイオマーカーのなかでも、それを除去することが、モデルフィットの縮小を最小限に抑える場合、および(2)それを除去することが、少なくとも、予め設定しておいた閾値まではモデルフィットを縮小させない場合に、バイオマーカーの既存の上位セットから除去され;
f.それ以上バイオマーカーを除去すると、モデルフィットの指標が、該予め設定しておいた閾値によってモデルフィットの指標を下回る低下を生じる場合には、バイオマーカーの既存の上位セットからのバイオマーカーの除去を停止し、それによって、バイオマーカーの該上位セットを選択する、ために構成されている論理を使用して、バイオマーカーの該上位セットから該バイオマーカーのセットを選択するために構成されているコンピューターをさらに含む、項目38に記載のシステム。
(項目43)
該病状についての分類が前記病状の有無である、項目35〜42のいずれか1項に記載のシステム。
(項目44)
該病状が肺疾患である、項目43のシステム。
(項目45)
該肺疾患が非小細胞癌である、項目44のシステム。
(項目46)
該肺疾患が反応性気道疾患である、項目44のシステム。
(項目47)
該反応性気道疾患が喘息である、項目46のシステム。
(項目48)
該バイオマーカー測定値が、アポリポタンパク質(「Apo」)A1、ApoA2、ApoB、ApoC2、ApoE、CD40、Dダイマー、第VII因子、第VIII因子、第X因子、プロテインC、組織プラスミノーゲン活性化因子(「TPA」)、脳由来神経栄養因子(「BDNF」)、Bリンパ球化学誘引物質(「BLC」)、ケモカイン(C−X−Cモチーフ)リガンド1(「GRO−1」)、皮膚T細胞誘引ケモカイン(「CTACK」)、エオタキシン−2、エオタキシン−3、グランザイム−B、肝細胞増殖因子(「HGF」)、I−TAC(「CXCL11」;「ケモカイン(C−X−Cモチーフ)リガンド11」、「インターフェロン誘導T細胞α化学誘引物質」)、レプチン(「LEP」)、白血病抑制因子(「LIF」)、単球特異的ケモカイン3(「MMP−3」)、マクロファージコロニー刺激因子(「MCSF」)、γインターフェロン誘導性モノカイン(「MIG」)、マクロファージ炎症性タンパク質−3α(「MIP−3α」)、マトリックスメタロプロテアーゼ(「MMP」)1、MMP2、MMP3、MMP7、MMP8、MMP9、MMP12、MMP13、CD40、神経成長因子β(「NGF−β」)、可溶性リガンド(「CD40リガンド」)、上皮増殖因子(「EFG」)、エオタキシン(「CCL11」)、フラクタルキン、塩基性線維芽細胞増殖因子(「FGF−塩基性」)、顆粒球コロニー刺激因子(「G−CSF」)、顆粒球マクロファージコロニー刺激因子(「GM−CSF」)、インターフェロンγ(「IFNγ」)、IFN−ω、IFN−α2、IFN−β、インターロイキン(「IL」)1a、IL−1β、IL−1ra、IL−2、IL−2ra、IL−3、IL−4、IL−5、IL−6、IL−7、IL−8、IL−9、IL−10、IL−12(p40)、IL−12(p70)、IL−13、IL−15、IL−16、IL−17、IL−17a、IL−17F、IL−20、IL−21、IL−22、IL−23(p19)、IL−27、IL−31、IP−10、単球走化性タンパク質1(「MCP−1」)、マクロファージ炎症性タンパク質(「MIP」)1a、MIP−1β、好中球活性化ペプチド78(「ENA−78」)、オステオプロテゲリン(「OPG」)、胎盤増殖因子(「PIGF」)、血小板由来成長因子サブユニットBホモ二量体(「PDGFBB」)、T細胞由来の好酸球走化性物質(「RANTES」)、幹細胞成長因子(「SCGF」)、ストロマ細胞由来因子1(「SDF−1」)、可溶性Fasリガンド(「Sfas−リガンド」)、NFκ−B活性化可溶性受容体リガンド(「sRANKL」)、サバイビン、トランスフォーミング増殖因a(「TGFa」)、TGF−β、腫瘍壊死因子a(「TNFa」)、TNF−β、TNF受容体1(「TNFR−I」)、TNFR−II、TNF関連性アポトーシス誘導性リガンド(「TRAIL」)、トロンボポエチン(「TPO」)、血管内皮成長因子(「VEGF」)、インスリン(「Ins」)、C−ペプチド、グルカゴン様タンパク質−1/アミリン(「GLP−1/アミリン」)、アミリン(全)、グルカゴン、アディポネクチン、プラスミノーゲン活性化因子阻害因子1(「PAI−1」;「セルピン」)(活性型/全)、レジスチン(「RETN」;「xcp1」)、sFas、可溶性Fasリガンド(「sFasL」)、マクロファージ遊走性阻止因子(「MIF」)、sE−セレクチン、可溶性血管細胞接着分子(「sVCAM」)、可溶性細胞間接着分子(「sICAM」)、ミエロペルオキシダーゼ(「MPO」)、C反応性タンパク質(「CRP」)、血清アミロイドA(「SAA」;「SAA1」)、および血清アミロイドP(「SAP」)からなる群より選択される少なくとも1つのタンパク質の血漿濃度の測定値を含む、項目35〜47のいずれか1項に記載にシステム。
(項目49)
該バイオマーカー測定値が、少なくとも4種類の別個のバイオマーカーの血漿濃度を含む、項目48のシステム。
(項目50)
該バイオマーカー測定値が、少なくとも6種類の別個のバイオマーカーの血漿濃度を含む、項目48のシステム。
(項目51)
該バイオマーカー測定値が、少なくとも10種類の別個のバイオマーカーの血漿濃度を含む、項目48のシステム。
(項目52)
該バイオマーカー測定値が、少なくとも18種類の別個のバイオマーカーの血漿濃度を含む、項目48のシステム。
(項目53)
該学習ベクトルのセットが、少なくとも30ベクトル、50ベクトル、100ベクトルを含む、項目35〜52のいずれか1項に記載のシステム。
(項目54)
該サポートベクトルマシンが、線形カーネル、ラジアル基底カーネル、多項カーネル、統一カーネル、三角カーネル、エパネクニコフ(Epanechnikov)カーネル、四次多項(quartic)(二乗重み)カーネル、三次三乗(tricube)(三乗重み)カーネル、およびコサインカーネルから選択される、1つまたは複数のカーネル関数を含む、項目35、37、39、40、または43〜53のいずれか1項に記載のシステム。
(項目55)
該アダブースト分類器が、5、10、15、20、25、30、40、50、75または100回の反復を含む、項目36、38、または41〜53のいずれか1項に記載のシステム。
(項目56)
バイオマーカーのセットそれぞれの、複数のバイオマーカー測定値を含む試験データを分類する方法であって、
ヒト試験対象に関する試験データを受信する工程、ここで該試験データは、バイオマーカーのセットの少なくとも各バイオマーカーのバイオマーカー測定値を含んでおり;
電子的に記憶されている学習データベクトルの第一のセットを使用して訓練したサポートベクトルマシンの電子表示を使用して該試験データを評価する工程、ここで、学習データベクトルの該第一のセットの各学習データベクトルは個々のヒトを表し、かつ、対応するヒトの該バイオマーカーのセットの少なくとも各バイオマーカーのバイオマーカー測定値を含み、学習データベクトルの該第一のセットの各学習データベクトルはさらに、対応するヒトの病状に関する分類を含んでおり;および、
該評価する工程に基づいた該ヒト試験対象の分類を出力する工程;を含み、
ここで、該バイオマーカーのセットに含まれているそれぞれのバイオマーカーは、(A)順序付けられたバイオマーカーの初期セグメントが、第二セットの学習データベクトルの補正済み分類のパーセンテージに関しては、該順序付けられたバイオマーカーの他の初期セグメントの中の極大であり、およびここで第二セットの学習データベクトルの各学習データベクトルは個々のヒトを表し、かつ、対応するヒトの該バイオマーカーのセットの少なくとも各バイオマーカーのバイオマーカー測定値を含み、該第二セットの学習データベクトルの各学習データベクトルがさらに対応するヒトの病状に関する分類を含んでいる、それぞれのバイオマーカーに関する2群の濃度測定値のマージン分布の中心傾向の関数によって最大から最小に順序付けられたバイオマーカーの該初期セグメントの中にあるか、または(B)(A)で同定したバイオマーカーの該初期セグメント中に含まれているバイオマーカーに関する一次相互作用器であるかのいずれかである、試験データを分類する方法。
(項目57)
バイオマーカーのセットそれぞれの複数のバイオマーカー測定値を含む試験データを分類する方法であって、
ヒト試験対象に関する試験データを受信する工程、ここで該試験データは、バイオマーカーのセットの少なくとも各バイオマーカーのバイオマーカー測定値を含んでおり;
電子的に記憶されている学習データベクトルの第一のセットを使用して訓練したアダブースト分類器の電子表示を使用して該試験データを評価する工程、ここで、学習データベクトルの該第一のセットの各学習データベクトルは個々のヒトを表し、かつ、対応するヒトの該バイオマーカーのセットの少なくとも各バイオマーカーのバイオマーカー測定値を含み、学習データベクトルの該第一のセットの各学習データベクトルはさらに、対応するヒトの病状に関する分類を含んでおり;および、
該評価する工程に基づいた該ヒト試験対象の分類を出力する工程;を含み、
ここで、該バイオマーカーのセットに含まれているそれぞれのバイオマーカーは、(A)順序付けられたバイオマーカーの初期セグメントが、第二セットの学習データベクトルの補正済み分類のパーセンテージに関しては、該順序付けられたバイオマーカーの他の初期セグメントの中の極大であり、および、ここで第二セットの学習データベクトルの各学習データベクトルが個々のヒトを表し、かつ、対応するヒトの該バイオマーカーのセットの少なくとも各バイオマーカーのバイオマーカー測定値を含み、該第二セットの学習データベクトルの各学習データベクトルがさらに、対応するヒトの病状に関する分類を含んでいる、それぞれのバイオマーカーに関する2群の濃度測定値のマージン分布の中心傾向の関数によって最大から最小に順序付けられたバイオマーカーの該初期セグメントの中にあるか、または(B)(A)で同定したバイオマーカーの該初期セグメント中に含まれているバイオマーカーに関する一次相互作用器であるかのいずれかである、試験データを分類する方法。
(項目58)
該バイオマーカーのセットに含まれているそれぞれのバイオマーカーが、空集合から開始して、さらなるバイオマーカーを追加することが、該第二の学習データベクトルのセットの正しい分類のパーセンテージを少なくとも20%の閾値まで改良しなくなるまで、該第二の学習データベクトルのセットの正しい分類のパーセンテージを最大限に改良するバイオマーカーを前のセットに再帰的に追加することによって生成されるバイオマーカーのセットに含まれている、項目56または57に記載の方法。
(項目59)
該閾値が15%である、項目58の方法。
(項目60)
該閾値が10%である、項目58の方法。
(項目61)
該閾値が5%である、項目58の方法。
(項目62)
該閾値が2%である、項目58の方法。
(項目63)
該閾値が1%である、項目58の方法。
(項目64)
該閾値が0.5%である、項目58の方法。
(項目65)
該閾値が0.1%である、項目58の方法。
(項目66)
該閾値が0.01%である、項目58の方法。
(項目67)
学習データベクトルの該第一のセットが、学習データベクトルの該第二のセットと同じである、項目58の方法。
(項目68)
学習データベクトルの該第一のセットの各ベクトルおよび学習データベクトルの該第二のセットが無作為に選択される、項目58〜67のいずれか1項に記載の方法。
(項目69)
学習データベクトルの該第一のセットが、少なくとも50のベクトルを含む、項目58〜68のいずれか1項に記載の方法。
(項目70)
学習データベクトルの該第二のセットが少なくとも50のベクトルを含む、項目58〜69のいずれか1項に記載の方法。
(項目71)
電子記憶装置中の学習データベクトルの該第一のセットにアクセスする工程および電子記憶装置中の学習データベクトルの該第二のセットにアクセスする工程をさらに含む、項目58〜70のいずれか1項に記載の方法。
(項目72)
ヒト試験対象に関する試験データを受信するようにプログラムされている電子的なコンピューターを含む、バイオマーカーのセットそれぞれの複数のバイオマーカー測定値を含む該試験データを分類するためのシステムであって、該試験データは、該バイオマーカーのセットの少なくとも各バイオマーカーのバイオマーカー測定値を含んでおり、および電子的に記憶されている学習データベクトルの第一のセットを使って訓練したサポートベクトルマシンの電子表示を使用して該試験データを評価するために、学習データベクトルの第一のセットの各学習データベクトルは個々のヒトを表し、かつ、対応するヒトの該バイオマーカーのセットの少なくとも各バイオマーカーのバイオマーカー測定値を含み、学習データベクトルの第一のセットの各学習データベクトルは、対応するヒトの病状に関する分類を含み;
ここで、該コンピューターはさらに、該サポートベクトルマシンの該電子表示に基づいた該ヒト試験対象の分類を出力するためにさらにプログラムされており;
ここで、該バイオマーカーのセットに含まれているそれぞれのバイオマーカーは:(A)順序付けられたバイオマーカーの初期セグメントが、第二セットの学習データベクトルの補正済み分類のパーセンテージに関しては、該順序付けられたバイオマーカーの他の初期セグメントの中の極大であり、および、ここで第二セットの学習データベクトルの各学習データベクトルは個々のヒトを表し、かつ、対応するヒトのバイオマーカーのセットの少なくとも各バイオマーカーのバイオマーカー測定値を含み、第二セットの学習データベクトルの各学習データベクトルはさらに、対応するヒトの病状に関する分類を含んでいる、それぞれのバイオマーカーに関する2群の濃度測定値のマージン分布の中心傾向の関数によって最大から最小に順序付けられたバイオマーカーの該初期セグメントの中にあるか、または(B)(A)で同定したバイオマーカーの該初期セグメント中に含まれているバイオマーカーの一次相互作用器であるか、のいずれかである、前記システム。
(項目73)
ヒト試験対象に関する試験データを受信するようにプログラムされている電子的なコンピューターを含む、バイオマーカーのセットそれぞれの複数のバイオマーカー測定値を含む該試験データを分類するためのシステムであって、該試験データは、バイオマーカーのセットの少なくとも各バイオマーカーのバイオマーカー測定値を含んでおり、および電子的に記憶されている、学習データベクトルの第一のセットを使って訓練したアダブースト分類器の電子表示を使用して該試験データを評価するために、学習データベクトルの第一のセットの各学習データベクトルは個々のヒトを表し、かつ、対応するヒトの該バイオマーカーのセットの少なくとも各バイオマーカーのバイオマーカー測定値を含み、学習データベクトルの第一のセットの各学習データベクトルは、対応するヒトの病状に関する分類を含み;
ここで、該コンピューターはさらに、該アダブースト分類器の該電子表示に基づいた該ヒト試験対象の分類を出力するためにさらにプログラムされており;
ここで、該バイオマーカーのセットに含まれているそれぞれのバイオマーカーは:(A)順序付けられたバイオマーカーの初期セグメントが、第二セットの学習データベクトルの補正済み分類のパーセンテージに関しては、該順序付けられたバイオマーカーの他の初期セグメントの中の極大であり、および、ここで第二セットの学習データベクトルの各学習データベクトルは個々のヒトを表し、かつ、対応するヒトのバイオマーカーのセットの少なくとも各バイオマーカーのバイオマーカー測定値を含み、第二セットの学習データベクトルの各学習データベクトルがさらに、対応するヒトの病状に関する分類を含んでいる、それぞれのバイオマーカーに関する2群の濃度測定値のマージン分布の中心傾向の関数によって最大から最小に順序付けられたバイオマーカーの該初期セグメントの中にあるか、または(B)(A)で同定したバイオマーカーの該初期セグメント中に含まれているバイオマーカーの一次相互作用器であるか、のいずれかである、前記システム。
(項目74)
該バイオマーカーのセットに含まれているそれぞれのバイオマーカーが、空集合から開始して、さらなるバイオマーカーを追加することが、該第二の学習データベクトルのセットの正しい分類のパーセンテージを少なくとも20%の閾値まで改良しなくなるまで、該第二の学習データベクトルのセットの正しい分類のパーセンテージを最大限に改良するバイオマーカーを前のセットに再帰的に追加することによって生成されるバイオマーカーのセットに含まれている、項目72または73に記載のシステム。
(項目75)
該閾値が15%である、項目74のシステム。
(項目76)
該閾値が10%である、項目74のシステム。
(項目77)
該閾値が5%である、項目74のシステム。
(項目78)
該閾値が2%である、項目74のシステム。
(項目79)
該閾値が1%である、項目74のシステム。
(項目80)
該閾値が0.5%である、項目74のシステム。
(項目81)
該閾値が0.1%である、項目74のシステム。
(項目82)
該閾値が0.01%である、項目74のシステム。
(項目83)
学習データベクトルの第一のセットが、該学習データベクトルの第二のセットと同じである、項目74のシステム。
(項目84)
学習データベクトルの第一のセットの各ベクトルおよび該学習データベクトルの第二のセットが無作為に選択される、項目72〜83のいずれか1項に記載のシステム。
(項目85)
学習データベクトルの第一のセットが、少なくとも50のベクトルを含む、項目72〜84のいずれか1項に記載のシステム。
(項目86)
該学習データベクトルの第二のセットが少なくとも50のベクトルを含む、項目72〜85のいずれか1項に記載のシステム。
(項目87)
該電子的コンピューターに操作可能に接続されている電子記憶装置に含まれている学習データベクトルの第一のセットおよび該電子的コンピューターに操作可能に接続されている電子記憶装置に含まれている学習データベクトルの該第二のセットをさらに含む、項目72〜86のいずれか1項に記載のシステム。

Claims (9)

  1. 対象における非小細胞肺癌の有無の見込みの判定を補助する方法であって、以下の工程:
    (a)該対象由来の生理学的試料中の複数のバイオマーカーの発現レベルを測定する工程、であって、
    ここで、該バイオマーカーはペプチド、タンパク質、翻訳後修飾を受けたペプチド、翻訳後修飾を受けたタンパク質、またはそれらの組み合わせであり;ここで該複数のバイオマーカーは、肝細胞増殖因子(「HGF」)、レプチン(「LEP」)、IL−4、IL−5、IL−7、IL−8、IL−10、IL−12(p70)、単球走化性タンパク質1(「MCP−1」)、レジスチン(「RETN」;「xcp1」)、マクロファージ遊走性阻止因子(「MIF」)、ミエロペルオキシダーゼ(「MPO」)、血清アミロイドA(「SAA」;「SAA1」)、白血病抑制因子(「LIF」)、γインターフェロン誘導性モノカイン(「MIG」)、IL−9、IL−16、血小板由来成長因子サブユニットBホモ二量体(「PDGFBB」)、T細胞由来の好酸球走化性物質(「RANTES」)、可溶性Fasリガンド(「sFasL」)、TNFR−II、TNF受容体1(「TNFR−I」)、可溶性リガンド(「CD40リガンド」)、可溶性細胞間接着分子(「sICAM」)、アポリポタンパク質(「Apo」)A1、ApoA2、ApoB、ApoC2、ApoE、CD40、Dダイマー、第VII因子、第VIII因子、第X因子、プロテインC、組織プラスミノーゲン活性化因子(「TPA」)、脳由来神経栄養因子(「BDNF」)、Bリンパ球化学誘引物質(「BLC」)、ケモカイン(C−X−Cモチーフ)リガンド1(「GRO−1」)、皮膚T細胞誘引ケモカイン(「CTACK」)、エオタキシン−2、エオタキシン−3、グランザイム−B、I−TAC(「CXCL11」;「ケモカイン(C−X−Cモチーフ)リガンド11」、インターフェロン誘導T細胞α化学誘引物質、単球特異的ケモカイン3(「MMP−3」)、マクロファージコロニー刺激因子(「MCSF」)、マクロファージ炎症性タンパク質−3α(「MIP−3α」)、マトリックスメタロプロテアーゼ(「MMP」)1、MMP2、MMP3、MMP7、MMP8、MMP9、MMP12、MMP13、CD40、神経成長因子β(「NGF−β」)、上皮増殖因子(「EFG」)、エオタキシン(「CCL11」)、フラクタルキン、塩基性線維芽細胞増殖因子(「FGF−塩基性」)、顆粒球コロニー刺激因子(「G−CSF」)、顆粒球マクロファージコロニー刺激因子(「GM−CSF」)、インターフェロンγ(「IFNγ」)、IFN−ω、IFN−α2、IFN−β、インターロイキン(「IL」)1a、IL−1β、IL−1ra、IL−2、IL−2ra、IL−3、IL−6、IL−12(p40)、IL−13、IL−15、IL−17、IL−17a、IL−17F、IL−20、IL−21、IL−22、IL−23(p19)、IL−27、IL−31、IP−10、マクロファージ炎症性タンパク質(「MIP」)1a、MIP−1β、好中球活性化ペプチド78(「ENA−78」)、オステオプロテゲリン(「OPG」)、胎盤増殖因子(「PIGF」)、幹細胞成長因子(「SCGF」)、ストロマ細胞由来因子1(「SDF−1」)、NFκ−B活性化可溶性受容体リガンド(「sRANKL」)、サバイビン、トランスフォーミング増殖因a(「TGFa」)、TGF−β、腫瘍壊死因子a(「TNFa」)、TNF−β、TNF受容体1(「TNFR−I」)、TNFR−II、TNF関連性アポトーシス誘導性リガンド(「TRAIL」)、トロンボポエチン(「TPO」)、血管内皮成長因子(「VEGF」)、インスリン(「Ins」)、C−ペプチド、グルカゴン様タンパク質−1/アミリン(「GLP−1/アミリン」)、アミリン(全)、グルカゴン、アディポネクチン、プラスミノーゲン活性化因子阻害因子1(「PAI−1」;「セルピン」)(活性型/全)、sFas、sE−セレクチン、可溶性血管細胞接着分子(「sVCAM」)、C反応性タンパク質(「CRP」)、および、血清アミロイドP(「SAP」)からなる群から選択アルゴリズムによって選択され;
    該生理学的試料は、全血、血漿、血液血清、またはそれらの組み合わせである、工程;ならびに
    (b)分類システムを利用し、該バイオマーカー測定値に基づいて該試料を分類する工程であって、ここで該分類システムは、ランダムフォレストまたはアダブースト、あるいはランダムフォレストおよびアダブーストの集合から選択される機械学習システムであり、ここで該試料の該分類は、該対象における非小細胞肺癌の存在または発生の指標である、工程
    を包含する、方法。
  2. 対象における喘息の有無の見込みの判定を補助する方法であって、以下の工程:
    (a)該対象由来の生理学的試料中の複数のバイオマーカーの発現レベルを測定する工程、であって、
    ここで、該バイオマーカーはペプチド、タンパク質、翻訳後修飾を受けたペプチド、翻訳後修飾を受けたタンパク質、またはそれらの組み合わせであり;ここで該複数のバイオマーカーは、肝細胞増殖因子(「HGF」)、レプチン(「LEP」)、IL−4、IL−5、IL−7、IL−8、IL−10、IL−12(p70)、単球走化性タンパク質1(「MCP−1」)、レジスチン(「RETN」;「xcp1」)、マクロファージ遊走性阻止因子(「MIF」)、ミエロペルオキシダーゼ(「MPO」)、血清アミロイドA(「SAA」;「SAA1」)、白血病抑制因子(「LIF」)、γインターフェロン誘導性モノカイン(「MIG」)、IL−9、IL−16、血小板由来成長因子サブユニットBホモ二量体(「PDGFBB」)、T細胞由来の好酸球走化性物質(「RANTES」)、可溶性Fasリガンド(「sFasL」)、TNFR−II、TNF受容体1(「TNFR−I」)、可溶性リガンド(「CD40リガンド」)、可溶性細胞間接着分子(「sICAM」)、アポリポタンパク質(「Apo」)A1、ApoA2、ApoB、ApoC2、ApoE、CD40、Dダイマー、第VII因子、第VIII因子、第X因子、プロテインC、組織プラスミノーゲン活性化因子(「TPA」)、脳由来神経栄養因子(「BDNF」)、Bリンパ球化学誘引物質(「BLC」)、ケモカイン(C−X−Cモチーフ)リガンド1(「GRO−1」)、皮膚T細胞誘引ケモカイン(「CTACK」)、エオタキシン−2、エオタキシン−3、グランザイム−B、I−TAC(「CXCL11」;「ケモカイン(C−X−Cモチーフ)リガンド11」、インターフェロン誘導T細胞α化学誘引物質、単球特異的ケモカイン3(「MMP−3」)、マクロファージコロニー刺激因子(「MCSF」)、マクロファージ炎症性タンパク質−3α(「MIP−3α」)、マトリックスメタロプロテアーゼ(「MMP」)1、MMP2、MMP3、MMP7、MMP8、MMP9、MMP12、MMP13、CD40、神経成長因子β(「NGF−β」)、上皮増殖因子(「EFG」)、エオタキシン(「CCL11」)、フラクタルキン、塩基性線維芽細胞増殖因子(「FGF−塩基性」)、顆粒球コロニー刺激因子(「G−CSF」)、顆粒球マクロファージコロニー刺激因子(「GM−CSF」)、インターフェロンγ(「IFNγ」)、IFN−ω、IFN−α2、IFN−β、インターロイキン(「IL」)1a、IL−1β、IL−1ra、IL−2、IL−2ra、IL−3、IL−6、IL−12(p40)、IL−13、IL−15、IL−17、IL−17a、IL−17F、IL−20、IL−21、IL−22、IL−23(p19)、IL−27、IL−31、IP−10、マクロファージ炎症性タンパク質(「MIP」)1a、MIP−1β、好中球活性化ペプチド78(「ENA−78」)、オステオプロテゲリン(「OPG」)、胎盤増殖因子(「PIGF」)、幹細胞成長因子(「SCGF」)、ストロマ細胞由来因子1(「SDF−1」)、NFκ−B活性化可溶性受容体リガンド(「sRANKL」)、サバイビン、トランスフォーミング増殖因a(「TGFa」)、TGF−β、腫瘍壊死因子a(「TNFa」)、TNF−β、TNF受容体1(「TNFR−I」)、TNFR−II、TNF関連性アポトーシス誘導性リガンド(「TRAIL」)、トロンボポエチン(「TPO」)、血管内皮成長因子(「VEGF」)、インスリン(「Ins」)、C−ペプチド、グルカゴン様タンパク質−1/アミリン(「GLP−1/アミリン」)、アミリン(全)、グルカゴン、アディポネクチン、プラスミノーゲン活性化因子阻害因子1(「PAI−1」;「セルピン」)(活性型/全)、sFas、sE−セレクチン、可溶性血管細胞接着分子(「sVCAM」)、C反応性タンパク質(「CRP」)、および、血清アミロイドP(「SAP」)からなる群から選択アルゴリズムによって選択され;
    該生理学的試料は、全血、血漿、血液血清、またはそれらの組み合わせである、工程;ならびに
    (b)分類システムを利用し、該バイオマーカー測定値に基づいて該試料を分類する工程であって、ここで該分類システムは、ランダムフォレストまたはアダブースト、あるいはランダムフォレストおよびアダブーストの集合から選択される機械学習システムであり、ここで該試料の該分類は、該対象における喘息の指標である、工程
    を包含する、方法。
  3. 対象における肺疾患の有無の見込みの判定を補助する方法であって、以下の工程:
    (a)該対象由来の生理学的試料中において、反応性気道疾患の兆候と非小細胞肺癌の区別を補助する複数のバイオマーカー、反応性気道疾患の指標である複数のバイオマーカー、および、非小細胞肺癌の指標である複数のバイオマーカーの発現レベルを測定する工程、であって、
    ここで、該バイオマーカーはペプチド、タンパク質、翻訳後修飾を受けたペプチド、翻訳後修飾を受けたタンパク質、またはそれらの組み合わせであり;ここで該複数のバイオマーカーは、肝細胞増殖因子(「HGF」)、レプチン(「LEP」)、IL−4、IL−5、IL−7、IL−8、IL−10、IL−12(p70)、単球走化性タンパク質1(「MCP−1」)、レジスチン(「RETN」;「xcp1」)、マクロファージ遊走性阻止因子(「MIF」)、ミエロペルオキシダーゼ(「MPO」)、血清アミロイドA(「SAA」;「SAA1」)、白血病抑制因子(「LIF」)、γインターフェロン誘導性モノカイン(「MIG」)、IL−9、IL−16、血小板由来成長因子サブユニットBホモ二量体(「PDGFBB」)、T細胞由来の好酸球走化性物質(「RANTES」)、可溶性Fasリガンド(「sFasL」)、TNFR−II、TNF受容体1(「TNFR−I」)、可溶性リガンド(「CD40リガンド」)、可溶性細胞間接着分子(「sICAM」)、アポリポタンパク質(「Apo」)A1、ApoA2、ApoB、ApoC2、ApoE、CD40、Dダイマー、第VII因子、第VIII因子、第X因子、プロテインC、組織プラスミノーゲン活性化因子(「TPA」)、脳由来神経栄養因子(「BDNF」)、Bリンパ球化学誘引物質(「BLC」)、ケモカイン(C−X−Cモチーフ)リガンド1(「GRO−1」)、皮膚T細胞誘引ケモカイン(「CTACK」)、エオタキシン−2、エオタキシン−3、グランザイム−B、I−TAC(「CXCL11」;「ケモカイン(C−X−Cモチーフ)リガンド11」、インターフェロン誘導T細胞α化学誘引物質、単球特異的ケモカイン3(「MMP−3」)、マクロファージコロニー刺激因子(「MCSF」)、マクロファージ炎症性タンパク質−3α(「MIP−3α」)、マトリックスメタロプロテアーゼ(「MMP」)1、MMP2、MMP3、MMP7、MMP8、MMP9、MMP12、MMP13、CD40、神経成長因子β(「NGF−β」)、上皮増殖因子(「EFG」)、エオタキシン(「CCL11」)、フラクタルキン、塩基性線維芽細胞増殖因子(「FGF−塩基性」)、顆粒球コロニー刺激因子(「G−CSF」)、顆粒球マクロファージコロニー刺激因子(「GM−CSF」)、インターフェロンγ(「IFNγ」)、IFN−ω、IFN−α2、IFN−β、インターロイキン(「IL」)1a、IL−1β、IL−1ra、IL−2、IL−2ra、IL−3、IL−6、IL−12(p40)、IL−13、IL−15、IL−17、IL−17a、IL−17F、IL−20、IL−21、IL−22、IL−23(p19)、IL−27、IL−31、IP−10、マクロファージ炎症性タンパク質(「MIP」)1a、MIP−1β、好中球活性化ペプチド78(「ENA−78」)、オステオプロテゲリン(「OPG」)、胎盤増殖因子(「PIGF」)、幹細胞成長因子(「SCGF」)、ストロマ細胞由来因子1(「SDF−1」)、NFκ−B活性化可溶性受容体リガンド(「sRANKL」)、サバイビン、トランスフォーミング増殖因a(「TGFa」)、TGF−β、腫瘍壊死因子a(「TNFa」)、TNF−β、TNF受容体1(「TNFR−I」)、TNFR−II、TNF関連性アポトーシス誘導性リガンド(「TRAIL」)、トロンボポエチン(「TPO」)、血管内皮成長因子(「VEGF」)、インスリン(「Ins」)、C−ペプチド、グルカゴン様タンパク質−1/アミリン(「GLP−1/アミリン」)、アミリン(全)、グルカゴン、アディポネクチン、プラスミノーゲン活性化因子阻害因子1(「PAI−1」;「セルピン」)(活性型/全)、sFas、sE−セレクチン、可溶性血管細胞接着分子(「sVCAM」)、C反応性タンパク質(「CRP」)、および、血清アミロイドP(「SAP」)からなる群から選択アルゴリズムによって選択され;
    該生理学的試料は、全血、血漿、血液血清、またはそれらの組み合わせであり;
    該複数のバイオマーカーは同一ではない、工程;ならびに
    (b)分類システムを利用し、該バイオマーカー測定値に基づいて該試料を分類する工程であって、ここで該分類システムは、ランダムフォレストまたはアダブースト、あるいはランダムフォレストおよびアダブーストの集合から選択される機械学習システムであり、ここで該試料の該分類は、
    (i)該対象における喘息と非小細胞肺癌;
    (ii)該対象における喘息の有無;および
    (iii)該対象における非小細胞肺癌の有無;
    の兆候を区別することを補助する、工程;
    (c)該分類において見いだされた状態に基づいて、該対象が、喘息を有するか、非小細胞肺癌を有するか、または、疾患を有さないかを判定する、工程
    を包含する、方法。
  4. 前記機械学習システムは、ランダムフォレストおよびアダブーストの集合である、請求項1〜3のいずれか一項に記載の方法。
  5. 前記機械学習システムは、ランダムフォレストである、請求項1〜3のいずれか一項に記載の方法。
  6. 前記機械学習システムは、アダブーストである、請求項1〜3のいずれか一項に記載の方法。
  7. 前記複数のバイオマーカーは、肝細胞増殖因子(「HGF」)、レプチン(「LEP」)、IL−4、IL−5、IL−7、IL−8、IL−10、IL−12(p70)、単球走化性タンパク質1(「MCP−1」)、レジスチン(「RETN」;「xcp1」)、マクロファージ遊走性阻止因子(「MIF」)、ミエロペルオキシダーゼ(「MPO」)、血清アミロイドA(「SAA」;「SAA1」)、白血病抑制因子(「LIF」)、γインターフェロン誘導性モノカイン(「MIG」)、IL−9、IL−16、血小板由来成長因子サブユニットBホモ二量体(「PDGFBB」)、T細胞由来の好酸球走化性物質(「RANTES」)、可溶性Fasリガンド(「sFasL」)、TNFR−II、TNF受容体1(「TNFR−I」)、可溶性リガンド(「CD40リガンド」)、および可溶性細胞間接着分子(「sICAM」)からなる群から選択される、請求項1〜3のいずれか一項に記載の方法。
  8. 前記複数が、少なくとも4種類、少なくとも6種類、少なくとも10種類または少なくとも18種類のバイオマーカーを含む、請求項1〜3のいずれか一項に記載の方法。
  9. バイオマーカーが免疫アッセイにより測定される、請求項1〜3のいずれか1項に記載の方法。
JP2018153283A 2011-04-29 2018-08-16 分類システムおよびそのキットを使用した肺疾患の同定および診断方法 Pending JP2018200322A (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201161480802P 2011-04-29 2011-04-29
US61/480,802 2011-04-29
US201261619279P 2012-04-02 2012-04-02
US61/619,279 2012-04-02

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2014508183A Division JP2014514572A (ja) 2011-04-29 2012-04-30 分類システムおよびそのキットを使用した肺疾患の同定および診断方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2020002155A Division JP2020064078A (ja) 2011-04-29 2020-01-09 分類システムおよびそのキットを使用した肺疾患の同定および診断方法

Publications (1)

Publication Number Publication Date
JP2018200322A true JP2018200322A (ja) 2018-12-20

Family

ID=47072811

Family Applications (4)

Application Number Title Priority Date Filing Date
JP2014508183A Withdrawn JP2014514572A (ja) 2011-04-29 2012-04-30 分類システムおよびそのキットを使用した肺疾患の同定および診断方法
JP2018153283A Pending JP2018200322A (ja) 2011-04-29 2018-08-16 分類システムおよびそのキットを使用した肺疾患の同定および診断方法
JP2020002155A Withdrawn JP2020064078A (ja) 2011-04-29 2020-01-09 分類システムおよびそのキットを使用した肺疾患の同定および診断方法
JP2022114753A Withdrawn JP2022136138A (ja) 2011-04-29 2022-07-19 分類システムおよびそのキットを使用した肺疾患の同定および診断方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2014508183A Withdrawn JP2014514572A (ja) 2011-04-29 2012-04-30 分類システムおよびそのキットを使用した肺疾患の同定および診断方法

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2020002155A Withdrawn JP2020064078A (ja) 2011-04-29 2020-01-09 分類システムおよびそのキットを使用した肺疾患の同定および診断方法
JP2022114753A Withdrawn JP2022136138A (ja) 2011-04-29 2022-07-19 分類システムおよびそのキットを使用した肺疾患の同定および診断方法

Country Status (10)

Country Link
US (2) US9952220B2 (ja)
EP (3) EP3825693A1 (ja)
JP (4) JP2014514572A (ja)
KR (1) KR102136180B1 (ja)
CN (3) CN105005680B (ja)
AU (2) AU2012249288C1 (ja)
CA (2) CA2834383A1 (ja)
HK (1) HK1247286A1 (ja)
IL (3) IL278227B (ja)
WO (1) WO2012149550A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020137640A1 (ja) * 2018-12-27 2020-07-02 株式会社堀場製作所 血液分析装置、コンピュータープログラム、および血液分析方法

Families Citing this family (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102405296A (zh) 2009-03-12 2012-04-04 癌症预防和治疗有限公司 包括基于性别的疾病鉴定、评估、预防以及治疗的用于肺疾病的鉴定、评估、预防以及治疗的方法及其试剂盒
EP2427575B1 (en) 2009-05-07 2018-01-24 Veracyte, Inc. Methods for diagnosis of thyroid conditions
JP5905003B2 (ja) 2010-07-09 2016-04-20 ソマロジック・インコーポレーテッド 肺癌バイオマーカーとその使用
SG2014007454A (en) 2010-08-13 2014-07-30 Somalogic Inc Pancreatic cancer biomarkers and uses thereof
CN110289092A (zh) 2013-03-14 2019-09-27 奥特拉西斯公司 使用所测分析物改进疾病诊断的方法
US11976329B2 (en) 2013-03-15 2024-05-07 Veracyte, Inc. Methods and systems for detecting usual interstitial pneumonia
JP6250351B2 (ja) * 2013-09-30 2017-12-20 シスメックス株式会社 好酸球性気道炎症に関する情報の取得方法およびそのような情報を取得するためのマーカー
WO2015066564A1 (en) * 2013-10-31 2015-05-07 Cancer Prevention And Cure, Ltd. Methods of identification and diagnosis of lung diseases using classification systems and kits thereof
WO2015108863A1 (en) * 2014-01-14 2015-07-23 Rush University Medical Center Angiogenesis biomarkers associated with disease progression in lung cancer
EP2899543A1 (en) * 2014-01-28 2015-07-29 Predemtec GmbH Biomarker and methods for early diagnosis of Alzheimer's disease
WO2015164772A1 (en) * 2014-04-25 2015-10-29 Rush University Medical Center Circulating insulin-like growth factor (igf)-associated proteins for the detection of lung cancer
CN103954755B (zh) * 2014-04-30 2017-04-05 广东省结核病控制中心 一种结核分枝杆菌潜伏感染的诊断试剂盒
CN105306657B (zh) 2014-06-20 2019-07-26 中兴通讯股份有限公司 身份识别方法、装置及通讯终端
CN104198694A (zh) * 2014-09-18 2014-12-10 复旦大学附属华山医院 一种诊断试剂盒和使用该诊断试剂盒鉴别结核病与肿瘤的方法
WO2016048388A1 (en) 2014-09-26 2016-03-31 Somalogic, Inc. Cardiovascular risk event prediction and uses thereof
US20170335396A1 (en) * 2014-11-05 2017-11-23 Veracyte, Inc. Systems and methods of diagnosing idiopathic pulmonary fibrosis on transbronchial biopsies using machine learning and high dimensional transcriptional data
WO2016094330A2 (en) * 2014-12-08 2016-06-16 20/20 Genesystems, Inc Methods and machine learning systems for predicting the liklihood or risk of having cancer
US9870449B2 (en) * 2015-02-24 2018-01-16 Conduent Business Services, Llc Methods and systems for predicting health condition of human subjects
US20160283686A1 (en) * 2015-03-23 2016-09-29 International Business Machines Corporation Identifying And Ranking Individual-Level Risk Factors Using Personalized Predictive Models
CN104866713B (zh) * 2015-05-12 2018-02-13 南京霁云信息科技有限公司 基于增量局部鉴别子空间嵌入的川崎病和发烧诊断系统
CN104897893A (zh) * 2015-06-10 2015-09-09 复旦大学附属华山医院 一种基于结核特异性il-31检测的诊断结核分枝杆菌感染的试剂盒
CN105404887B (zh) * 2015-07-05 2019-04-09 中国计量大学 一种基于随机森林的白细胞五分类方法
EP3822977A1 (en) * 2015-08-26 2021-05-19 Viavi Solutions Inc. Identification using spectroscopy
CA2998349A1 (en) 2015-09-17 2017-03-23 Amgen Inc. Prediction of clinical response to il23-antagonists using il23 pathway biomarkers
US11972336B2 (en) 2015-12-18 2024-04-30 Cognoa, Inc. Machine learning platform and system for data analysis
EP3394825B1 (en) * 2015-12-18 2024-05-22 Cognoa, Inc. Platform and system for digital personalized medicine
US11694802B2 (en) * 2016-01-22 2023-07-04 Otraces Inc. Systems and methods for improving diseases diagnosis
CN105944082B (zh) * 2016-06-13 2017-08-25 浙江生创精准医疗科技有限公司 骨保护素单独或与其他细胞因子联合在治疗肝纤维化中的用途
EP3488366B1 (en) * 2016-07-22 2022-01-05 Case Western Reserve University Methods and apparatus for predicting benefit from immunotherapy using tumoral and peritumoral radiomic features
CN106645739B (zh) * 2016-08-22 2019-07-02 深圳华晓静生物科技有限公司 一种最优超平面的构建方法、动态优化系统和构建装置
KR101853118B1 (ko) * 2016-09-02 2018-04-30 주식회사 바이오인프라생명과학 피험체의 폐암 진단을 위한 복합 바이오마커군, 이를 이용하는 폐암 진단용 키트, 복합 바이오마커군의 정보를 이용하는 방법 및 이를 수행하는 컴퓨팅 시스템
CN106528668B (zh) * 2016-10-23 2018-12-25 哈尔滨工业大学深圳研究生院 一种基于可视化网络的二阶代谢质谱化合物检测方法
EP3539080B1 (en) * 2016-11-10 2022-03-23 F. Hoffmann-La Roche AG Distance-based tumor classification
JP7349727B2 (ja) * 2016-11-21 2023-09-25 センサム 生体構造の特徴づけおよび同定
CN106897570B (zh) * 2017-03-02 2021-05-11 山东师范大学 一种基于机器学习的慢性阻塞性肺疾病测试系统
US10546237B2 (en) * 2017-03-30 2020-01-28 Atomwise Inc. Systems and methods for correcting error in a first classifier by evaluating classifier output in parallel
CA3058481A1 (en) * 2017-04-04 2018-10-11 Lung Cancer Proteomics, Llc Plasma based protein profiling for early stage lung cancer prognosis
CA3072212A1 (en) * 2017-08-09 2019-02-14 Otraces, Inc. Systems and methods for improving disease diagnosis using measured analytes
AU2018351147A1 (en) * 2017-10-18 2020-05-07 Venn Biosciences Corporation Identification and use of biological parameters for diagnosis and treatment monitoring
KR101951727B1 (ko) * 2018-02-02 2019-02-26 (주)바이오인프라생명과학 멀티 암 판별을 위한 컴퓨팅 방법 및 이를 이용한 컴퓨팅 장치
SG11202009696WA (en) * 2018-04-13 2020-10-29 Freenome Holdings Inc Machine learning implementation for multi-analyte assay of biological samples
CN108802379B (zh) * 2018-06-14 2021-04-16 北京市心肺血管疾病研究所 一组用于判断主动脉夹层预后的分子标志物组
CN112970067A (zh) * 2018-06-30 2021-06-15 20/20基因系统股份有限公司 癌症分类器模型、机器学习系统和使用方法
KR20210111254A (ko) * 2018-11-30 2021-09-10 캐리스 엠피아이, 아이엔씨. 차세대 분자 프로파일링
WO2020131658A1 (en) * 2018-12-19 2020-06-25 University Of Pittsburgh-Of The Commonwealth System Of Higher Education Computational systems pathology spatial analysis platform for in situ or in vitro multi-parameter cellular and subcellular imaging data
MX2021008227A (es) * 2019-01-08 2021-09-10 Caris Mpi Inc Similitud de perfilado genomico.
CN112748191A (zh) * 2019-10-30 2021-05-04 深圳脉图精准技术有限公司 诊断急性疾病的小分子代谢物生物标志物及其筛选方法和应用
IL293489A (en) 2019-12-02 2022-08-01 Caris Mpi Inc predictor of pan-cancer platinum response
CN111351942B (zh) * 2020-02-25 2024-03-26 北京尚医康华健康管理有限公司 肺癌肿瘤标志物筛选系统及肺癌风险分析系统
CN111879940B (zh) * 2020-04-28 2022-02-01 中国科学院微生物研究所 肺结核标志物及应用
CN111505315B (zh) * 2020-05-07 2023-04-11 杭州师范大学 一种蛋白组合式标志物在制备儿童哮喘诊断试剂中的应用
CN112226503A (zh) * 2020-10-19 2021-01-15 西北大学 Cxcl10和hgf的组合作为肺炎及其感染源检测标志物的应用
CN113299388B (zh) * 2021-05-12 2023-09-29 吾征智能技术(北京)有限公司 基于发热伴皮疹的跨模态医学生物特征认知疾病的系统
CN117743957B (zh) * 2024-02-06 2024-05-07 北京大学第三医院(北京大学第三临床医学院) 一种基于机器学习的Th2A细胞的数据分选方法及相关设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006509186A (ja) * 2002-05-10 2006-03-16 イースタン バージニア メディカル スクール 前立腺癌バイオマーカー
WO2007026773A1 (ja) * 2005-08-31 2007-03-08 Kurume University 医用診断処理装置
JP2009501318A (ja) * 2005-06-24 2009-01-15 ザ ボード オブ トラスティーズ オブ ザ リーランド スタンフォード ジュニア ユニバーシティ アテローム動脈硬化性心血管疾患の診断およびモニタリングのための方法ならびに組成物
JP2009524008A (ja) * 2005-12-01 2009-06-25 プロメテウス ラボラトリーズ インコーポレイテッド 炎症性腸疾患を診断する方法
US20100009386A1 (en) * 2007-09-11 2010-01-14 Cancer Prevention And Cure, Ltd. Methods of identification, assessment, prevention and therapy of lung diseases and kits thereof
JP2011506917A (ja) * 2007-12-10 2011-03-03 エフ.ホフマン−ラ ロシュ アーゲー 結腸直腸癌のためのマーカーパネル

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7617163B2 (en) 1998-05-01 2009-11-10 Health Discovery Corporation Kernels and kernel methods for spectral data
US20070092917A1 (en) 1998-05-01 2007-04-26 Isabelle Guyon Biomarkers for screening, predicting, and monitoring prostate disease
SK287357B6 (sk) * 1999-02-12 2010-08-09 The Scripps Research Institute Použitie antagonistu alfa v beta 3 na prípravu farmaceutickej kompozície na liečbu tumorových buniek a terapeutická kompozícia a súprava na liečenie tumoru alebo tumorových metastáz
AU770952B2 (en) 1999-03-01 2004-03-11 Genentech Inc. Antibodies for cancer therapy and diagnosis
TW200413725A (en) * 2002-09-30 2004-08-01 Oncotherapy Science Inc Method for diagnosing non-small cell lung cancers
US7467119B2 (en) 2003-07-21 2008-12-16 Aureon Laboratories, Inc. Systems and methods for treating, diagnosing and predicting the occurrence of a medical condition
US7505948B2 (en) 2003-11-18 2009-03-17 Aureon Laboratories, Inc. Support vector regression for censored data
JP2005044330A (ja) 2003-07-24 2005-02-17 Univ Of California San Diego 弱仮説生成装置及び方法、学習装置及び方法、検出装置及び方法、表情学習装置及び方法、表情認識装置及び方法、並びにロボット装置
TW200532523A (en) 2004-02-27 2005-10-01 Aureon Biosciences Corp Methods and systems for predicting occurrence of an event
CA2561535A1 (en) * 2004-03-30 2005-10-20 Eastern Virginia Medical School Lung cancer biomarkers
GB0412301D0 (en) * 2004-06-02 2004-07-07 Diagenic As Product and method
WO2006060653A2 (en) 2004-11-30 2006-06-08 Veridex Llc Lung cancer prognostics
CN1300580C (zh) * 2004-12-31 2007-02-14 中国人民解放军第306医院 检测肝癌血清特征蛋白的质谱模型及其制备方法和应用
US7707134B2 (en) 2005-01-14 2010-04-27 Siemens Medical Solutions Usa, Inc. System and method for molecular diagnosis of depression based on boosting classification
EP1941276A1 (de) * 2005-10-29 2008-07-09 Bayer Technology Services GmbH Verfahren zur bestimmung eines oder mehrerer analyten in komplex zusammengesetzten proben biologischen ursprungs und dessen verwendung
US9347945B2 (en) 2005-12-22 2016-05-24 Abbott Molecular Inc. Methods and marker combinations for screening for predisposition to lung cancer
US20080133141A1 (en) * 2005-12-22 2008-06-05 Frost Stephen J Weighted Scoring Methods and Use Thereof in Screening
US7840505B2 (en) 2006-11-02 2010-11-23 George Mason Intellectual Properties, Inc. Classification tool
WO2008058384A1 (en) * 2006-11-15 2008-05-22 University Health Network Materials and methods for prognosing lung cancer survival
CA2679436C (en) 2007-04-05 2018-10-23 Aureon Laboratories, Inc. Systems and methods for treating, diagnosing and predicting the occurrence of a medical condition
US7888051B2 (en) 2007-09-11 2011-02-15 Cancer Prevention And Cure, Ltd. Method of identifying biomarkers in human serum indicative of pathologies of human lung tissues
JP5159242B2 (ja) 2007-10-18 2013-03-06 キヤノン株式会社 診断支援装置、診断支援装置の制御方法、およびそのプログラム
US7747547B1 (en) 2007-10-31 2010-06-29 Pathwork Diagnostics, Inc. Systems and methods for diagnosing a biological specimen using probabilities
CN107119108A (zh) * 2008-01-18 2017-09-01 哈佛大学校长及研究员协会 在体液中检测疾病或病症标志的方法
EP2329260A4 (en) * 2008-03-04 2011-08-03 Ridge Diagnostics Inc DIAGNOSIS AND MONITORING OF DEPRESSIVE DISORDERS BASED ON A PLURALITY OF BIOMARKER PANELS
CN101587125B (zh) * 2008-05-21 2013-07-24 林标扬 高表达癌症标记物和低表达组织器官标记物组合试剂盒
MX2011002322A (es) * 2008-09-09 2011-05-10 Somalogic Inc Biomarcadores de cancer de pulmon y uso de los mismos.
CN101475984A (zh) * 2008-12-15 2009-07-08 江苏命码生物科技有限公司 一种非小细胞肺癌检测标记物及其检测方法、相关生物芯片和试剂盒
CN102405296A (zh) 2009-03-12 2012-04-04 癌症预防和治疗有限公司 包括基于性别的疾病鉴定、评估、预防以及治疗的用于肺疾病的鉴定、评估、预防以及治疗的方法及其试剂盒
CN101988059B (zh) * 2009-07-30 2014-04-02 江苏命码生物科技有限公司 胃癌检测标记物及其检测试剂盒和生物芯片
CN101942502B (zh) * 2009-12-24 2014-09-17 北京命码生科科技有限公司 胰腺癌标记物及其检测方法、试剂盒和生物芯片
WO2015066564A1 (en) * 2013-10-31 2015-05-07 Cancer Prevention And Cure, Ltd. Methods of identification and diagnosis of lung diseases using classification systems and kits thereof

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006509186A (ja) * 2002-05-10 2006-03-16 イースタン バージニア メディカル スクール 前立腺癌バイオマーカー
JP2009501318A (ja) * 2005-06-24 2009-01-15 ザ ボード オブ トラスティーズ オブ ザ リーランド スタンフォード ジュニア ユニバーシティ アテローム動脈硬化性心血管疾患の診断およびモニタリングのための方法ならびに組成物
WO2007026773A1 (ja) * 2005-08-31 2007-03-08 Kurume University 医用診断処理装置
JP2009524008A (ja) * 2005-12-01 2009-06-25 プロメテウス ラボラトリーズ インコーポレイテッド 炎症性腸疾患を診断する方法
US20100009386A1 (en) * 2007-09-11 2010-01-14 Cancer Prevention And Cure, Ltd. Methods of identification, assessment, prevention and therapy of lung diseases and kits thereof
JP2011506917A (ja) * 2007-12-10 2011-03-03 エフ.ホフマン−ラ ロシュ アーゲー 結腸直腸癌のためのマーカーパネル

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020137640A1 (ja) * 2018-12-27 2020-07-02 株式会社堀場製作所 血液分析装置、コンピュータープログラム、および血液分析方法
JPWO2020137640A1 (ja) * 2018-12-27 2021-11-11 株式会社堀場製作所 血液分析装置、コンピュータープログラム、および血液分析方法
JP7557375B2 (ja) 2018-12-27 2024-09-27 株式会社堀場製作所 血液分析装置、コンピュータープログラム、および血液分析方法

Also Published As

Publication number Publication date
CA2834383A1 (en) 2012-11-01
JP2014514572A (ja) 2014-06-19
JP2022136138A (ja) 2022-09-15
IL229070B (en) 2018-08-30
CN110444287B (zh) 2024-02-06
AU2017245307A1 (en) 2017-10-26
EP3249408A1 (en) 2017-11-29
CN103703371A (zh) 2014-04-02
EP2702411A1 (en) 2014-03-05
US9952220B2 (en) 2018-04-24
WO2012149550A1 (en) 2012-11-01
EP3825693A1 (en) 2021-05-26
AU2012249288A1 (en) 2013-11-14
CA3120217A1 (en) 2012-11-01
IL229070A0 (en) 2013-12-31
CN105005680B (zh) 2019-08-02
KR102136180B1 (ko) 2020-07-22
AU2012249288C1 (en) 2017-12-21
HK1247286A1 (zh) 2018-09-21
IL278227A (ja) 2020-12-31
JP2020064078A (ja) 2020-04-23
AU2012249288B2 (en) 2017-07-06
AU2017245307B2 (en) 2019-10-10
EP2702411A4 (en) 2015-07-22
CN110444287A (zh) 2019-11-12
KR20140024916A (ko) 2014-03-03
IL261313A (en) 2018-10-31
IL278227B (en) 2022-07-01
IL261313B (en) 2020-11-30
US20190072554A1 (en) 2019-03-07
CN105005680A (zh) 2015-10-28
US20140024553A1 (en) 2014-01-23

Similar Documents

Publication Publication Date Title
JP2018200322A (ja) 分類システムおよびそのキットを使用した肺疾患の同定および診断方法
JP7250693B2 (ja) 初期ステージの肺がん診断のための血漿ベースのタンパク質プロファイリング
JP7431760B2 (ja) 癌分類子モデル、機械学習システム、および使用方法
WO2015066564A1 (en) Methods of identification and diagnosis of lung diseases using classification systems and kits thereof
US20170059581A1 (en) Methods for diagnosis and prognosis of inflammatory bowel disease using cytokine profiles
US20230263477A1 (en) Universal pan cancer classifier models, machine learning systems and methods of use
WO2009015398A1 (en) Methods for inflammatory disease management
US20230223145A1 (en) Methods and software systems to optimize and personalize the frequency of cancer screening blood tests

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180816

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190628

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190710

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20191004

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20191127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200109

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200610