JP6267687B2 - 消化器癌のリスクを評価する方法およびシステム - Google Patents

消化器癌のリスクを評価する方法およびシステム Download PDF

Info

Publication number
JP6267687B2
JP6267687B2 JP2015509566A JP2015509566A JP6267687B2 JP 6267687 B2 JP6267687 B2 JP 6267687B2 JP 2015509566 A JP2015509566 A JP 2015509566A JP 2015509566 A JP2015509566 A JP 2015509566A JP 6267687 B2 JP6267687 B2 JP 6267687B2
Authority
JP
Japan
Prior art keywords
test results
blood test
past
classifier
blood
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015509566A
Other languages
English (en)
Other versions
JP2015517653A5 (ja
JP2015517653A (ja
Inventor
ニル カルクステイン,
ニル カルクステイン,
ヤロン キナル,
ヤロン キナル,
ヴァルダ シャレフ,
ヴァルダ シャレフ,
ガブリエル チョディック,
ガブリエル チョディック,
インバル ゴールドシュテイン,
インバル ゴールドシュテイン,
Original Assignee
メディアル リサーチ リミテッド
メディアル リサーチ リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by メディアル リサーチ リミテッド, メディアル リサーチ リミテッド filed Critical メディアル リサーチ リミテッド
Publication of JP2015517653A publication Critical patent/JP2015517653A/ja
Publication of JP2015517653A5 publication Critical patent/JP2015517653A5/ja
Application granted granted Critical
Publication of JP6267687B2 publication Critical patent/JP6267687B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57446Specifically defined cancers of stomach or intestine
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7275Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57419Specifically defined cancers of colon
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/50Determining the risk of developing a disease
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5091Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing the pathological state of an organism
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57484Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
    • G01N33/57488Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites involving compounds identifable in body fluids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Chemical & Material Sciences (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Physics & Mathematics (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • General Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Oncology (AREA)
  • Microbiology (AREA)
  • Cell Biology (AREA)
  • Biotechnology (AREA)
  • Data Mining & Analysis (AREA)
  • Hospice & Palliative Care (AREA)
  • Databases & Information Systems (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Theoretical Computer Science (AREA)
  • Physiology (AREA)
  • Psychiatry (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Surgery (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Software Systems (AREA)

Description

本発明は、その一部の実施形態では癌診断に関し、さらに詳しくは、癌のリスクを評価する方法およびシステムに関するが、それに限定されない。
結腸直腸癌の診断は、免疫学的便潜血反応に基づく診断、結腸内視鏡検査による診断等を含む。しかし、便潜血検査に基づく診断は確定診断として役立たず、陽性所見者の大部分は偽陽性である。さらに早期結腸直腸癌に関しては、便潜血検査に基づく診断または結腸内視鏡検査による診断では、検出感度および検出特異度の両方とも低くなることが懸念される。特に右側結腸の早期癌は、便潜血検査によって診断される場合、頻繁に見過ごされる。CT(コンピュータ断層撮影法)、MRI(磁気共鳴映像法)、PET(陽電子放射コンピュータ断層撮影法)等による画像診断は、結腸直腸癌の診断には適さない。
他方、結腸内視鏡検査による直腸結腸生検は確定診断として役立つが、侵襲性の高い検査であり、スクリーニング段階で結腸内視鏡検査を実行することは現実的でない。さらに、結腸内視鏡検査のような侵襲性診断は、痛みを伴うなどの負担を個人に与え、かつ検査後に出血するリスク等もある。
近年、結腸直腸癌の診断のための新しい方法が幾つか開発された。例えば米国特許公報第2010/0009401号明細書は、評価対象の被検者から採取された血液中のアミノ酸の濃度値に関するアミノ酸濃度データを測定し、被検者の測定されたアミノ酸濃度データに含まれるArg、Cys、Om、Trp、Glu、ABA、Val、Phe、Leu、GIn、Ile、およびHisの少なくとも1つの濃度値に基づいて、被検者の結腸直腸癌状態を評価する、結腸直腸癌の評価方法を記載している。
本発明の一部の実施形態では、消化器癌リスクを評価するコンピュータ化された方法を提供する。該方法は、標的個人から採取した血液からの複数の現在の血液検査結果を構成する1組の特徴を生成するステップと、別の複数のサンプル採取された個人の各々の複数のそれぞれの過去の血液検査結果の解析に従って生成された少なくとも1つの分類器を提供するステップと、プロセッサを使用して、少なくとも1つの分類器を用いて特徴の組を分類することによって標的個人の消化器癌リスクを評価するステップとを含む。複数の過去および現在の血液検査結果の各々は、次の血液検査すなわち赤血球(RBC)、ヘモグロビン(HGB)、およびヘマトクリット(HCT)のうちの少なくとも1つの結果、ならびに次の血液検査すなわち平均赤血球ヘモグロビン(MCH)および平均赤血球ヘモグロビン濃度(MCHC)のうちの少なくとも1つの結果を含む。任意選択的に、血液検査結果は全血球計算値(CBC)試験から抽出される。
任意選択的に、特徴の組は標的個人の年齢を含み、少なくとも1つの分類器は、別の複数のサンプル採取された個人の各々の年齢の解析に従って生成される。
任意選択的に、複数の過去および現在の血液検査結果の各々は、赤血球分布幅(RDW)の結果を含む。
任意選択的に、複数の過去および現在の血液検査結果の各々は、血小板ヘマトクリット(PCT)の結果を含む。
任意選択的に、複数の過去および現在の血液検査結果の各々は、平均赤血球容積(MCV)の結果を含む。
任意選択的に、複数の過去および現在の血液検査結果の各々は、次の血液検査すなわち白血球数‐WBC(CBC)、平均血小板容積(MPV)、平均赤血球容積、血小板数(CBC)、好酸球数、好中球百分率、単球百分率、好酸球百分率、好塩基球百分率、および好中球数、単球数の少なくとも1つを含む。
任意選択的に、少なくとも1つの分類器は、加重線形回帰分類器、K最近傍(KNN)分類器、およびランダムフォレスト分類器から成る群の構成員を含む。
任意選択的に、特徴の組は、標的個人の少なくとも1つの人口統計学的特性、および複数のサンプル採取された個人の各々のそれぞれの少なくとも1つの人口統計学的特性の解析に従って生成された少なくとも1つの分類器を含む。
任意選択的に、方法はさらに、少なくとも1つの異なる人口統計学的特性を有するサンプル採取された個人の複数のそれぞれの過去の血液検査結果に従って各々生成された複数の分類器から、個人の少なくとも1つの人口統計学的特性に従って少なくとも1つの分類器を選択するステップを含む。
任意選択的に、複数の血液検査結果は、次の複数の血液検査からの少なくとも1つの結果を含み、生化学的血液検査結果は、次の血液検査結果、すなわちアルブミン、カルシウム、塩化物、コレステロール、クレアチニン、高密度リポタンパク質(HDL)、低密度リポタンパク質(LDL)、カリウム、ナトリウム、トリグリセリド、尿素、および/または尿酸のいずれかを含むことができる。
本発明の一部の実施形態では、消化器癌評価システムを提供する。該システムは、プロセッサと、別の複数のサンプル採取された個人の各々の複数の過去の血液検査結果の解析に従って生成された少なくとも1つの分類器を格納するメモリユニットと、標的個人の血液から得られた複数の現在の血液検査結果を受け取る入力ユニットと、プロセッサを使用して、少なくとも1つの分類器を用いて、複数の現在の血液検査結果から抽出された1組の特徴を分類することによって標的個人の消化器癌リスクを評価する消化器癌評価モジュールとを備える。複数の過去および現在の血液検査結果は、次の複数の血液検査すなわち赤血球(RBC)、ヘモグロビン(HGB)、およびヘマトクリット(HCT)のうちの少なくとも1つの結果、ならびに次の血液検査すなわち平均赤血球ヘモグロビン(MCH)および平均赤血球ヘモグロビン濃度(MCHC)のうちの少なくとも1つの結果を含む。
任意選択的に、複数の過去および現在の血液検査結果の各々は、赤血球分布幅(RDW)の結果を含む。
任意選択的に、複数の過去および現在の血液検査結果の各々は、血小板ヘマトクリット(PCT)の結果を含む。
任意選択的に、複数の過去および現在の血液検査結果の各々は、平均赤血球容積(MCV)の結果を含む。
本発明の一部の実施形態では、CRCリスク評価のための分類器を生成する方法を提供する。該方法は、別の複数のサンプル採取された個人の各々の複数の過去の血液検査結果を提供するステップと、複数の組の特徴を有するデータセットを生成するステップであって、各組の特徴が別の複数のサンプル採取された個人のそれぞれの複数の過去の血液検査結果に従って生成されて成るステップと、データセットの解析に従って少なくとも1つの分類器を生成するステップと、少なくとも1つの分類器を出力するステップとを含む。
任意選択的に、生成ステップは、それぞれの複数の過去の血液検査結果から得た過去の血液検査結果の少なくとも1つの操作バージョンを算出し、それを1つの特徴としてそれぞれの特徴の組に追加することを含む。
任意選択的に、生成ステップは、それぞれの複数の過去の血液検査結果の日付に従って各組の特徴を荷重することを含む。
任意選択的に、生成ステップは、標準偏差最大閾値に従って外れ値を除去するように複数の組の特徴を選別することを含む。
任意選択的に、複数の組の特徴は、それぞれの複数の過去の血液検査結果の日付に従って加重される。
任意選択的に、複数の血液検査結果の各々は、次の血液検査すなわち赤血球(RBC)、ヘモグロビン(HGB)、およびヘマトクリット(HCT)のうちの少なくとも1つの結果、ならびに次の血液検査すなわち平均赤血球ヘモグロビン(MCH)および平均赤血球ヘモグロビン濃度(MCHC)のうちの少なくとも1つの結果を含む。
任意選択的に、複数の過去および現在の血液検査結果の各々は、赤血球分布幅(RDW)の結果を含む。
任意選択的に、複数の過去および現在の血液検査結果の各々は、血小板ヘマトクリット(PCT)の結果を含む。
任意選択的に、複数の過去および現在の血液検査結果の各々は、平均赤血球容積(MCV)の結果を含む。
さらに任意選択的に、方法はさらに、複数のサンプル採取された個人の各々の少なくとも1つの人口統計学的パラメータを、それぞれの特徴の組に追加するステップを含む。
さらに任意選択的に、少なくとも1つの人口統計学的パラメータは、性別、年齢、居住区域、人種、および社会経済的特徴から成る群の構成員である。
さらに任意選択的に、生成ステップは、少なくとも1つの人口統計学的パラメータの少なくとも1つの操作バージョンを算出し、それを1つの特徴としてそれぞれの特徴の組に追加することを含む。
別途定義されない限り、本明細書で使用されるすべての技術的用語および/または科学的用語は、本発明が属する技術分野の当業者によって一般に理解されるのと同じ意味を有する。本明細書に記載される方法および材料と類似または同等である方法および材料を本発明の実施または試験において使用することができるが、例示的な方法および/または材料が下記に記載される。矛盾する場合には、定義を含めて、本特許明細書が優先する。加えて、材料、方法および実施例は例示にすぎず、限定であることは意図されない。
本発明の実施形態の方法および/またはシステムを実行することは、選択されたタスクを、手動操作で、自動的にまたはそれらを組み合わせて実行または完了することを含んでいる。さらに、本発明の方法および/またはシステムの実施形態の実際の機器や装置によって、いくつもの選択されたステップを、ハードウェア、ソフトウェア、またはファームウェア、あるいはオペレーティングシステムを用いるそれらの組合せによって実行できる。
例えば、本発明の実施形態による選択されたタスクを実行するためのハードウェアは、チップまたは回路として実施されることができる。ソフトウェアとして、本発明の実施形態により選択されたタスクは、コンピュータが適切なオペレーティングシステムを使って実行する複数のソフトウェアの命令のようなソフトウェアとして実施されることができる。本発明の例示的な実施形態において、本明細書に記載される方法および/またはシステムの例示的な実施形態による1つ以上のタスクは、データプロセッサ、例えば複数の命令を実行する計算プラットフォームで実行される。任意選択的に、データプロセッサは、命令および/またはデータを格納するための揮発性メモリ、および/または、命令および/またはデータを格納するための不揮発性記憶装置(例えば、磁気ハードディスク、および/または取り外し可能な記録媒体)を含む。任意選択的に、ネットワーク接続もさらに提供される。ディスプレイおよび/またはユーザ入力装置(例えば、キーボードまたはマウス)も、任意選択的にさらに提供される。
本明細書では本発明のいくつかの実施形態を単に例示し添付の図面を参照して説明する。特に詳細に図面を参照して、示されている詳細が例示として本発明の実施形態を例示考察することだけを目的としていることを強調するものである。この点について、図面について行う説明によって、本発明の実施形態を実施する方法は当業者には明らかになるであろう。
図1は、本発明の一部の実施形態に係る、複数の個人のレコードの解析に従って、消化器癌リスクスコアを推定するための1つ以上の分類器を生成する方法のフローチャートである。
図2は、例えば図1に示された方法を実行することによって、本発明の一部の実施形態に係る1つ以上の分類器を生成するためのシステムの概略図である。
図3は、本発明の一部の実施形態に係る受信動作特性(ROC)曲線グラフである。
図4A−4Cは、本発明の一部の実施形態に係る様々な例示的分類器の性能をまとめた表である。
図5Aは、男性のためのランダムフォレスト分類器におけるそれらの重要度に従ってリストされた、拡張された(expended)特徴の組の表である。
図5Bは、血液検査の結果の対間の相関を示す表である。
図6は、幾つかの時間窓に対する性能を示す表である。
図7は、ランダムフォレスト分類器の性能を示す表である。
図8は、本発明の一部の実施形態に従って、標的個人の消化器癌リスクスコアを推定するために分類器を使用する方法のフローチャートである。
図9は、本発明の一部の実施形態に従って、異なる集団群に対し異なる感度で、結腸癌、胃癌、直腸癌、および食道癌の各々に対する分類器の性能を示す表である。
図10は、本発明の一部の実施形態に従って、貧血のある個人および貧血の無い個人(白人アメリカ人)を分類するために上述した分類器を使用した結果の解析をまとめた1組の表である。
本発明は、その一部の実施形態では癌診断に関し、さらに詳しくは、癌のリスクを評価する方法およびシステムに関するが、それに限定されない。
本発明の一部の実施形態では、複数の個人の過去の血液検査結果の解析に従って生成された1つ以上の分類器を用いて、標的個人の1組の現在の血液検査結果を分類することによって、消化器癌リスクを評価する方法およびシステムを提供する。現在の血液検査結果の組は、次の血液検査すなわちヘモグロビン(HGB)、ヘマトクリット(HCT)、および赤血球(RBC)の少なくとも1つの結果、ならびに次の血液検査すなわち平均赤血球ヘモグロビン(MCH)および平均赤血球ヘモグロビン濃度(MCHC)の少なくとも1つの結果、ならびに標的個人の年齢を含む。任意選択的に、現在の血液検査結果の組はさらに、次の血液検査すなわち白血球数‐WBC(CBC)、平均血小板容積(MPV)、平均赤血球容積(MCV)、赤血球分布幅(RDW)、血小板数(CBC)、好酸球数、好中球百分率、単球百分率、好酸球百分率、好塩基球百分率、好中球数、単球数、および血小板ヘマトクリット(PCT)の1つ以上を含む。
任意選択的に、消化器癌リスクは、標的個人の生化学的血液検査結果を分類することによって評価される。そのような実施形態では、分類器は、複数の個人の過去の生化学的血液検査結果の解析に従って生成される。生化学的血液検査結果は、次の血液検査のいずれかの結果を含むことができる:アルブミン、カルシウム、塩化物、コレステロール、クレアチニン、高密度リポタンパク質(HDL)、低密度リポタンパク質(LDL)、カリウム、ナトリウム、トリグリセリド、尿素、および/または尿酸。
任意選択的に、消化器癌リスクは、標的個人の人口統計学的特性を分類することによって評価される。そのような実施形態では、分類器は複数の個人の人口統計学的特性の解析に従って生成される。
任意選択的に、標的個人の現在の血液検査結果およびサンプル採取された個人の過去の血液検査結果の両方が、操作値および/または加重値を含む拡張された特徴の組を生成するために使用される。任意選択的に、各々の拡張された特徴の組は、例えば下述する通り、それぞれの個人の人口統計学的特性に基づく。
任意選択的に、1つ以上の分類器は標的個人の1つ以上の人口統計学的特性に適応される。任意選択的に、分類器は標的個人の1つ以上の人口統計学的特性に合致するように選択される。そのような実施形態では、女性および男性に対し異なる分類器を使用することができる。
本発明の一部の実施形態では、消化器リスク評価のための1つ以上の分類器を生成する方法およびシステムを提供する。該方法およびシステムは、別の複数のサンプル採取された個人の各々の複数の過去の血液検査結果を解析し、それに従って複数の組の特徴を有するデータセットを生成することに基づき、各組の特徴はそれぞれの過去の血液検査結果に従って生成される。次いで、データセットは、K最近傍(KNN)分類器、ランダムフォレスト分類器、および加重線形回帰分類器のような1つ以上の分類器を生成しかつ出力するために使用される。分類器は、標的個人の消化器癌リスクを彼らの現在の血液検査結果に基づいて評価するために、クライアント端末で実行されるモジュールとして提供されるか、あるいはオンラインサーバとして使用することができる。
本発明の少なくとも1つの実施形態を詳しく説明する前に、本発明は、その適用において、下記の説明に示されるか、および/または図面および/または実施例において例示される構成要素および/または方法の組み立ておよび構成の細部に必ずしも限定されないことを理解しなければならない。本発明は他の実施形態が可能であり、または様々な方法で実施または実行されることが可能である。
次に図1を参照すると、それは、本発明の一部の実施形態に係る、複数の個人受診者の各々の複数の過去の検査結果の解析に従って、消化器癌リスクスコアを推定するための1つ以上の分類器を生成する方法100のフローチャートである。本書で使用する場合、消化器癌は、結腸、胃、直腸、または食道の癌とすることができる。また図2をも参照すると、それは、例えば図1に示された方法を実行することによって消化器癌リスクスコアを推定するための、本発明の一部の実施形態に係る分類器を生成するためのシステム200の略図である。
システム200は、1つ以上の医療レコードデータベース201を含み、かつ/または医療レコードデータベースインタフェースに接続される。データベース201は、別の複数のサンプル採取された個人の各々について、別の個人に1組ずつ1つ以上の組の複数の過去の検査結果、ならびに任意選択的に1つ以上の人口統計学的パラメータおよび消化器癌予後を記載する、複数の個人サンプルとも呼ばれる複数の個人レコードを含む。複数の過去の検査結果、年齢のような人口統計学的パラメータ、および/または消化器癌予後の組は、共通サンプルレコードに格納することができ、かつ/または多数の独立したかつ/または接続されたデータベースから収集することができる。任意選択的に、消化器癌予後は癌レジストリレコードに従って設定された二進指標である。異なる検査結果は、一般的に実行される血液検査および/または同一期間中に維持される血液検査の結果とすることができる。任意選択的に、複数の過去の検査結果の幾つかの組は、失われた血液検査結果を有する。これらの結果は任意選択的に、他の個人の利用可能な血液検査結果の加重平均によって補完することができる。方法はさらに、プロセッサ204、分類器生成モジュール205、およびネットワークインタフェースのようなインタフェースユニット206を含む。
本書で使用する場合、人口統計学的パラメータは年齢、性別、人種、体重、国籍、居住地の地理的領域等を含む。
最初に、101に示す通り、複数の個人サンプルの1つ以上のデータセットが提供される。
任意選択的に、102に示す通り、複数の個人サンプルは、照合基準に従ってスクリーニングおよび/または選択される。例えば、サンプルレコードは、年齢が40歳以上であり、結腸癌で癌レジストリに載っておりかつ任意選択的に他の種類の癌が無い個人、または癌レジストリに載っていない個人のものである。任意選択的に、癌レジストリに出現する個人のサンプルレコードは、それらが記録する複数の過去の検査結果の最新の組が取得されたのが、それぞれの個人の癌レジストリへの登録より前の特定の期間中である場合にだけ、例えば現在の日付から少なくとも30日前までの期間、および最長でも2年間である場合にだけ、取り込まれる。任意選択的に、癌レジストリに載っていない個人のサンプルレコードは、それらが陽性および陰性の消化器癌集団の場合と等しい時間分布(血液検査タイミング)を形成する1組の複数の過去の検査結果を含む場合にだけ、取り込まれる。陽性および陰性サンプルの時間分布を同等化するプロセスはまた、少なくとも一部の陰性(非登録)サンプルの除外、およびデータセットの消化器有病率の変化をも導く。
次に、103に示す通り、例えば分類器生成モジュール205によって、サンプルレコードから抽出されたサンプルデータに従って、マトリックスのような評価データセットが生成される。評価データセットは、任意選択的に拡張された、特徴の複数の組を含む。各組の特徴は、スクリーニングおよび/または選択されたサンプルレコードの各々から生成される。特徴の組は、実際の血液検査値および/または人口統計学的特性値を含む、任意選択的に未処理の特徴である。
上述の通り、各サンプルレコードは個人の1組以上の複数の過去の検査結果を含み、各組に、血液検査結果の組合せ、例えば10、15、20を超える、および/またはいずれかの中間数の血液検査結果の組合せが含まれる。一例では、抽出された未処理の特徴の各組は、少なくとも次の18の血液検査結果、すなわち赤血球(RBC)、白血球数‐WBC(CBC)、平均血小板容積(MPV)、ヘモグロビン(HGB)、ヘマトクリット(HCT)、平均赤血球容積(MCV)、平均赤血球ヘモグロビン(MCH)、平均赤血球ヘモグロビン濃度(MCHC)、赤血球分布幅(RDW)、血小板数(CBC)、好酸球数、好中球百分率、単球百分率、好酸球百分率、好塩基球百分率、好中球数、単球数、および血小板ヘマトクリット(PCT)を含む。別の例では、抽出された未処理特徴の各組は、少なくとも次の血液検査の結果、すなわちHGB、HCT、およびRBC、次の血液検査すなわちMCHおよびMCHCのうちの少なくとも1つの結果、ならびに標的個人の年齢を反映する追加データを含む。任意選択的に、この抽出された未処理の特徴の組はさらに、次の血液検査すなわちRDW、血小板、およびMCVのうちの1つ以上を含む。加えて、この抽出された未処理の特徴の組はさらに、次の血液検査すなわちWBC、好酸球数、好中球百分率および/または数、好塩基球百分率および/または数、ならびに単球百分率および/または数のうちの1つ以上を含むことができる。
任意選択的に、未処理の特徴の組は拡張される。拡張された特徴の組は、上記の未処理の血液検査結果および/または1つ以上の人口統計学的パラメータのような特徴、ならびに例えば下述するような任意選択的に操作された血液検査結果および/または血液検査結果の組合せを含む。例えば、拡張された特徴の組における各特徴は、血液検査結果、人口統計学的特性、血液検査結果および/または人口統計学的特性の組合せ、および/または血液検査結果および/または人口統計学的特性の操作に基づく。例えば未処理の特徴の組が18の検査結果を含む場合、114の特徴の拡張された組が以下に基づいて生成される。
1.各々が18の血液検査結果の別の1つを含む18の特徴。
2.各々が18の血液検査結果のうちの1つと第1仮想結果との間の差(例えば比)を含む、18の特徴。第1仮想結果は任意選択的に、サンプルレコードから入手可能なそれぞれの結果の加重平均によって算出される。任意選択的に、入手可能な各検査は、検査の実行から経過した期間および目標日、任意選択的に標的個人の複数の過去の検査結果の組の日付(本書で目標日と呼ぶ)に従って加重される。任意選択的に、利用可能な検査は、目標日以前の第1期間中、例えば540日間に行われた検査である。例えば重みは、その記録(例えば試験が行われたとき)から経過した時間から導出される絶対値として算出することができる。重みは二乗関数として、または絶対値に対し単調ないずれかの他の関数として算出することができる。
3.各々が18の血液検査結果のうちの1つと第2仮想結果との間の差(例えば比)を含む、18の特徴。第2仮想結果は、任意選択的に、目標日以前の第2期間中に、例えば1080日間に行われた利用可能な検査に基づいて、上述の第1仮想結果と同様に算出される。
4.1つの特徴‐目標日以前の1年の期間中にユーザが実行した複数の過去の検査結果の組の数。
5.1つの特徴‐目標日以前の180*6日と180*10日との間の期間中にユーザが実行した複数の過去の検査結果の組の数。
6.1つの特徴‐個人の年齢、例えば個人の誕生年。
7.(1項〜6項に詳述した)上記の特徴全部を二乗した値である57の特徴。
任意選択的に、各個人に対し1つ以上の生化学的血液検査結果を文書化し、任意選択的に1つの特徴として特徴の組に追加することができる。これらの特徴は、上記の血液検査結果として処理することができる。生化学的血液検査結果は、次の血液検査結果すなわちアルブミン、カルシウム、塩化物、コレステロール、クレアチニン、高密度リポタンパク質(HDL)、低密度リポタンパク質(LDL)、カリウム、ナトリウム、トリグリセリド、尿素、および/または尿酸のいずれかを含むことができる。
任意選択的に、異なる人口統計学的特性、例えば異なる性を有する標的個人を分類する異なる分類器を形成するために、異なる組の拡張された特徴を有する異なる評価データセット、例えばマトリックスが生成される。
任意選択的に、外れ値を反復的に除去するために、評価データセット、例えばマトリックスは選別される。任意選択的に、各特徴の平均偏差および/または標準偏差が算出され、標準偏差最大閾値、例えば10より例えば大きい例外値を有する特徴は、標準偏差最大閾値に切り捨てられる。例えば、このプロセスは10回(または切捨てが行われない場合、それより少ない回数)反復して繰り返される。クリーニングプロセスを記載する例示的擬似コードは次の通りである。
Repeat 10回
For各特徴―
Calculate 平均偏差および標準偏差(sdv)
For 各サンプル―
If(値{サンプル,特徴}>平均{特徴}+10*sdv{特徴})
値{サンプル,特徴}=平均{特徴}+9*sdv{特徴}
If(値{サンプル,特徴}<平均{特徴}−10*sdv{特徴})
値{サンプル,特徴}=平均{特徴}−9*sdv{特徴}
End サンプルループ
End 特徴ループ
Exit if 変更が行われない
End of Repeat
次に、104に示す通り、例えば分類器生成モジュール205によって、1つ以上の標的個人の人口統計学的特性および現在の複数の検査結果の組に基づいて各々が標的個人の消化器癌リスクを分類する分類器を生成するために、評価データセットが使用される。任意選択的に、評価データセットに基づいて、以下の分類器の1つ以上を生成することができる。
陽性サンプルレコードが陰性サンプルレコードのスコアの約100倍のスコアを受け取る加重線形回帰分類器
例えば陰性サンプルレコードを100分の1にダウンサンプリングするK最近傍(KNN)分類器
例えば、各ツリーが2:1の陰性対陽性サンプルレコード比率を使用して作製されるランダムフォレスト分類器
任意選択的に、各々の分類器の性能は10倍相互検証プロセスを用いて推定される。そこで、本書で集団と呼ばれる評価データセットは、同じ大きさの10個の部分に無作為に分割される。各部分に対し、以下の処理を実行することができる。
それぞれの部分以外の集団の90%から血液検査結果の受入れ可能な組を選択する
選択された組の血液検査結果に従って分類器を訓練する
それぞれの部分に存在する集団の10%から血液検査結果の組を選択する
集団の10%から選択された組の血液検査結果に対し分類器を使用する
次に、各分類器の性能を測定するために、予測とも呼ばれる分類が収集される。例えば、性能の尺度は、例えば図3に示すような受信動作特性(ROC)曲線に従って選択される。任意選択的に、尺度を識別するために、様々な(5%、10%、20%、50%、および70%)感度(リコール)値における特異度が使用される。様々な例示的分類器の性能は、それぞれ0.840±0.001、0.820±0.001、および0.833±0.001の曲線下の面積(AUC)を有する図4A〜図4Cに提示された表にまとめられている。図3および図4A〜図4Cは40歳を超える217246名の男性の全集団に基づいて計算され、1415名が陽性結腸直腸癌(CRC)を有すると識別されたことが注目される。任意選択的に、表内の各数字(リフト、予測精度、および特異度)は、異なる相互検証スキームに対して算出された平均±標準偏差(std)、例えば10を表す。
本書で使用する場合、リコールは、(TPおよび偽陰性(FN)の両方)のCRCの個人の百分率、例えばTP/(TP+FN)に等しい、TP分類された個人の真陽性(TP)率を表す。本書で使用する場合、精度は、CRCを有すると分類された集団の百分率、例えばTP/(TP+FP)を表す。本書で使用する場合、リフトは、集団における全CRC有病率に対する精度の比率を表す。例えば、217246名の40歳を超える男性の全集団のうち、1415名が陽性CRCを有すると識別された。この実施例では、有病率は0.65%である。正確な時間分布(上記参照)を形成するための陰性サンプルの選択は、学習および検査集団にバイアスを生じ、1.2%のCRC有病率を導く。したがって、リフトは直接求めることができるが、測定された精度を調整することによって、予測精度を決定するために間接的にしか使用することができない。
任意選択的に、分類のために特定の分類器によって使用される特徴の組は、分類の重要度に従って加重される。特徴の重要度は、ジニ係数(統計的分散)によって測定される分割によるノード不純度の低下のデータツリー全体に対する平均値として決定することができる。実施例として、図5Aは、男性のためのランダムフォレスト分類器におけるそれらの重要度に従ってリストされた、拡張された特徴の組の表を示す。
分類器の過去の血液検査結果および現在の血液検査は、性質が似ていると考えられる血液検査の血液検査結果の対を含むことができることが注目される。これらの対は、次の対すなわちヘモグロビン(HGB)とヘマトクリット(HCT)、(すなわちCBC検査から抽出された)好中球百分率/数とリンパ球百分率/数、MCVとMCH、RBCとヘマトクリット(HCT)、RBCとMCVの1つ以上を含む。当業者にとって、これらの血液結果は共通の徴候を有し、累積値を持たないので、そのような対の両方の血液結果を検査することは簡単ではなく、したがって当業者は、類似した血液検査の対の両方の構成員ではなく、類似した血液検査の対の一方の構成員の結果だけを使用してきた。発明者らは驚くことに、そのような対の構成員の間の相関が絶対的ではなく、上述した分類器の性能に対する寄与がかなり大きいことを見出した。例えば図5Bの表を参照されたい。
分類器の性能は、最後の血液検査結果の組の日と、例えば癌レジストリに登録された癌発見日との間の時間に依存することが注目される。この依存性は、陽性サンプルの受入れ可能な血液検査が限定された時間窓内(例えば癌レジストリより前の30〜90日間、90〜180日間など)にある分類器を考慮することによって捕捉される。例えば図6は、幾つかの時間窓に対する性能を示す表を表す。表は、CRC事例から診断の30〜720日前に取得された年齢調整後のCBCデータを健康な対照データと比較して示し、長期変動を示唆している。さらに、各事例について、選択されたパラメータ値/結果を、選択されたパラメータ値/結果の評価より1.5年前(デルタ1.5)および3年前(デルタ3)の同じパラメータ結果と比較した。図6の表によって示される通り、データが古くなると特異度は低下する。
貧血は幾つかの消化器の状態などによって生じることがあり、GI癌は最も稀であることが注目される。解明されていない貧血は高齢者のCRCの主要な前兆であり、痔疾患と共に、CRC診断が遅れる一般的な原因である。失血はCRC事例の60%に存在し、便における日常のわずか3mlの失血が鉄欠乏貧血を引き起こすことがあり得る。CRC事例のほぼ18%は診断14から1年以上前に貧血があったが、かなりの割合は貧血症1ではない。陽性潜血検査が存在することがある。しかし、現在のCRCスクリーニングに使用される便潜血では現在の失血しか検出されないが、CRCでは失血が慢性的である。
Spell DW,Jones DV,Jr.,Harper WF,David Bessman J.の「The value of a complete blood count in predicting cancer of the colon」、Cancer Detect Prev 2004;28(1):37〜42に、CRC患者の88%は少なくとも1つの血液異常を有したと報告されている。そういうものとして、全血球計算値(CBC)からCRCを予測する試みが活発に研究されている。診断から0〜122日前のCBCパラメータが入手可能である、新たに診断されたCRC患者に対する遡及的研究において、主として右側CRC事例の場合に、赤血球分布幅(RDW)が正常範囲より増加し、84%の感度および88%の特異度を有することが示された。RDW、ヘモグロビン、および平均赤血球容積(MCV)と組み合わされた感度の改善は実証されなかった。
本発明の一部の実施形態では、本書で記載するように生成された分類器の性能は、貧血状態を持つ個人および貧血状態を持たない個人の両方を分類するために使用することができる。例えば、図11は、貧血のある個人および貧血の無い個人(白人アメリカ人)を分類するために上述した分類器を使用した結果の解析をまとめた1組の表である。この組は複数の表を含み、各表は、特定の個人群の貧血のある個人の、別の個人群の貧血の無い個人に対する確率をまとめたものである。群は、血液結果の年齢と個人の年齢として間の組合せに基づいて、任意選択的に分割される。図10は、血球数パラメータの独立した尺度がCRCに関連し、かつCBCパラメータの正常範囲内の組み合わされた変化が、たとえわずかな変化であっても、例えば点数化することによって、貧血のある個人または貧血の無い個人に対しCRCスクリーニングプロセスの一部として使用することができるという証拠を示す。
次に、105に示す通り、分類器は、例えばインタフェースユニット206によって、任意選択的に標的個人の分類を可能にするモジュールとして出力される。任意選択的に、異なる人口統計学的特性を有する個人に対し異なる分類器が、例えば1つの分類器が男性用に、別の分類器が女性用に規定される。例えば、上記の18の特徴からの特徴群に基づく分類器は男性用に設定される一方、生化学的検査無しのランダムフォレスト分類器は女性に使用される。ランダムフォレスト分類器は0.833±0.001のAUCおよび図7に示す性能を有し、ここで精度は0.45%の全有病率に従って予測される。
次に図8を参照すると、それは、本発明の一部の実施形態に従って、標的個人の消化器癌リスクスコアを推定するために、上記分類器のような分類器を使用する方法のフローチャート400である。使用時に、分類器は、標的個人データを受信し、かつ分類器を使用する消化器癌評価モジュールを使用して評価対象の被検者の消化器癌リスクスコアを評価する、ウェブサーバにホスティングすることができる。標的個人データは、被検者の血液検査結果の組および人口統計学的特性、またはこの標的データへのリファレンスを提供する、ラップトップ、デスクトップ、スマートホン、タブレットなどのようなクライアント端末から、インターネットのような通信ネットワークを介して受信される。
最初に、401および402に示す通り、分類器および標的個人データが提供される。標的個人データは、1つ以上の人口統計学的パラメータおよび目標日に保持された1組の複数の現在の血液検査結果を含み、それは標的個人の複数の現在の検査結果を含む。標的個人データは、ユーザが例えばグラフィカルユーザインタフェース(GUI)を用いて手動で入力するか、ユーザが任意選択的にGUIを用い選択するか、かつ/または例えばコンピュータ支援診断(CAD)モジュールおよび/またはシステムによって自動的に提供することができる。任意選択的に、標的個人データは、ユーザが過去1年間、過去10年間、および/またはいずれかの中間的期間中に実施した複数の組の血液検査結果を含む。各組の血液検査結果は、例えば上記の18種類の血液検査結果から選択された群の血液検査結果を含む。
次に、403に示す通り、1組の標的個人の特徴が標的個人データから抽出され、任意選択的に上述の通り拡張される。
次いで、404に示す通り、分類器は、標的個人の特徴の組における各特徴を加重することによって、標的個人の消化器癌リスクスコアを算出するために使用される。次に、405に示す通り、消化器癌リスクスコアは出力される。
上述した分類器は、消化器癌の癌リスクスコアを推定するために使用することができることが注目され、消化器癌は結腸癌、胃癌、直腸癌、または食道癌であり得る。例えば、図9は、異なる集団群に対し異なる感度で、結腸癌、胃癌、直腸癌、および食道癌の各々に対する分類器の性能を示す表である。集団群は、それぞれの血液検査結果の期間(日数で表示、例えば90〜540日、90〜540日、30〜270日、および360〜720日)、と年齢の範囲、例えば40〜100および50〜75との間の組合せに従って規定される。図9の表は、図4Aおよび図4Bに関連して立証された分類器に使用された集団とは異なる集団に対する分類器の性能を示していることに注目されたい。図9において、データは全部で81641名の年齢40を超える英国人の血液検査の結果を含み、そのうちの3099名が結腸癌、1286名が直腸癌、578名が胃癌、1061名が食道癌と診断された。
本出願から成熟する特許の存続期間の期間中には、多くの関連するシステムおよび方法が開発されることが予想され、プロセッサ、ディスプレイ、およびユーザインターフェースの用語の範囲は、すべてのそのような新しい技術を先験的に包含することが意図される。
本明細書中で使用される用語「約」は、±10%を示す。
用語「含む/備える(comprises、comprising、includes、including)」、「有する(having)」、およびそれらの同根語は、「含むが、それらに限定されない(including but not limited to)」ことを意味する。この用語は、「からなる(consisting of)」および「から本質的になる(consisting essentially of)」を包含する。
表現「から本質的になる」は、さらなる成分および/または工程が、特許請求される組成物または方法の基本的かつ新規な特徴を実質的に変化させない場合にだけ、組成物または方法がさらなる成分および/または工程を含み得ることを意味する。
本明細書中で使用される場合、単数形態(「a」、「an」および「the」)は、文脈がそうでないことを明確に示さない限り、複数の参照物を包含する。例えば、用語「化合物(a compound)」または用語「少なくとも1つの化合物」は、その混合物を含めて、複数の化合物を包含し得る。
用語「例示的」は、本明細書では「例(example,instance又はillustration)として作用する」ことを意味するために使用される。「例示的」として記載されたいかなる実施形態も必ずしも他の実施形態に対して好ましいもしくは有利なものとして解釈されたりかつ/または他の実施形態からの特徴の組み入れを除外するものではない。
用語「任意選択的」は、本明細書では、「一部の実施形態に与えられるが、他の実施形態には与えられない」ことを意味するために使用される。本発明のいかなる特定の実施形態も対立しない限り複数の「任意選択的」な特徴を含むことができる。
本開示を通して、本発明の様々な態様が範囲形式で提示され得る。範囲形式での記載は単に便宜上および簡潔化のためであり、本発明の範囲に対する柔軟性のない限定として解釈すべきでないことを理解しなければならない。従って、範囲の記載は、具体的に開示された可能なすべての部分範囲、ならびに、その範囲に含まれる個々の数値を有すると見なさなければならない。例えば、1〜6などの範囲の記載は、具体的に開示された部分範囲(例えば、1〜3、1〜4、1〜5、2〜4、2〜6、3〜6など)、ならびに、その範囲に含まれる個々の数値(例えば、1、2、3、4、5および6)を有すると見なさなければならない。このことは、範囲の広さにかかわらず、適用される。
数値範囲が本明細書中で示される場合には常に、示された範囲に含まれる任意の言及された数字(分数または整数)を含むことが意味される。第1の示された数字および第2の示された数字「の範囲である/の間の範囲」という表現、および、第1の示された数字「から」第2の示された数「まで及ぶ/までの範囲」という表現は、交換可能に使用され、第1の示された数字と、第2の示された数字と、その間のすべての分数および整数とを含むことが意味される。
明確にするため別個の実施形態の文脈で説明されている本発明の特定の特徴が、単一の実施形態に組み合わせて提供されることもできることは分かるであろう。逆に、簡潔にするため単一の実施形態で説明されている本発明の各種の特徴は別個にまたは適切なサブコンビネーションで、あるいは本発明の他の記載される実施形態において好適なように提供することもできる。種々の実施形態の文脈において記載される特定の特徴は、その実施形態がそれらの要素なしに動作不能である場合を除いては、それらの実施形態の不可欠な特徴であると見なされるべきではない。
本発明はその特定の実施態様によって説明してきたが、多くの別法、変更および変形があることは当業者には明らかであることは明白である。従って、本発明は、本願の請求項の精神と広い範囲の中に入るこのような別法、変更および変形すべてを包含するものである。
本明細書で挙げた刊行物、特許および特許出願はすべて、個々の刊行物、特許および特許出願が各々あたかも具体的にかつ個々に引用提示されているのと同程度に、全体を本明細書に援用するものである。さらに、本願で引用または確認したことは本発明の先行技術として利用できるという自白とみなすべきではない。節の見出しが使用されている程度まで、それらは必ずしも限定であると解釈されるべきではない。

Claims (32)

  1. 標的個人の現在の血液検査結果に応答して消化器癌リスクを評価するコンピュータ化された方法であって、
    標的個人から採取した血液からの複数の現在の血液検査結果を構成する1組の特徴を生成するステップと、
    別の複数のサンプル採取された個人の各々の複数のそれぞれの過去の血液検査結果の解析に従って生成された少なくとも1つの分類器を提供するステップと、
    プロセッサを使用して、前記少なくとも1つの分類器を用いて前記特徴の組を分類することによって前記標的個人の消化器癌リスクを評価するステップと
    を含み、
    前記複数の過去および現在の血液検査結果の各々は、次の血液検査すなわち赤血球(RBC)、ヘモグロビン(HGB)、およびヘマトクリット(HCT)のうちの少なくとも1つの結果、ならびに次の血液検査すなわち平均赤血球ヘモグロビン(MCH)および平均赤血球ヘモグロビン濃度(MCHC)のうちの少なくとも1つの結果を含み、前記少なくとも1つの分類器の各々は、少なくとも0.820±0.001の曲線下の面積(AUC)を有し、前記少なくとも1つの分類器は、消化器癌リスクの評価を提供するために、前記複数の過去の検査結果に従って生成される、方法。
  2. 前記消化器癌リスクは、結腸癌、胃癌、直腸癌、および食道癌から成る群から選択された癌についてである、請求項1に記載の方法。
  3. 前記特徴の組は前記標的個人の年齢を含み、前記少なくとも1つの分類器は、別の複数のサンプル採取された個人の各々の年齢の解析に従って生成される、請求項1に記載の方法。
  4. 前記複数の過去および現在の血液検査結果の各々は、赤血球分布幅(RDW)の結果を含む、請求項1に記載の方法。
  5. 前記複数の過去および現在の血液検査結果の各々は、ヘマトクリットの結果を含む、請求項1に記載の方法。
  6. 前記複数の過去および現在の血液検査結果の各々は、MCHの結果を含む、請求項1に記載の方法。
  7. 前記複数の過去および現在の血液検査結果の各々は、HGBおよびHCTの両方の結果を含む、請求項1に記載の方法。
  8. 前記複数の過去および現在の血液検査結果の各々は、好中球百分率/数およびリンパ球百分率/数の両方の結果を含む、請求項1に記載の方法。
  9. 前記複数の過去および現在の血液検査結果の各々は、RBCおよびHCTの両方の結果を含む、請求項1に記載の方法。
  10. 前記複数の過去および現在の血液検査結果の各々は、RBCおよびMCHの両方の結果を含む、請求項1に記載の方法。
  11. 前記複数の過去および現在の血液検査結果の各々は、次の血液検査すなわち白血球数‐WBC(CBC)、平均血小板容積(MPV)、平均赤血球容積、血小板数(CBC)、好酸球数、好中球百分率、単球百分率、好酸球百分率、好塩基球百分率、および好中球数、単球数の少なくとも1つを含む、請求項1に記載の方法。
  12. 前記少なくとも1つの分類器は、加重線形回帰分類器、K最近傍(KNN)分類器、およびランダムフォレスト分類器から成る群の構成員を含む、請求項1に記載の方法。
  13. 前記特徴の組は、前記標的個人の少なくとも1つの人口統計学的特性、および前記複数のサンプル採取された個人の各々のそれぞれの前記少なくとも1つの人口統計学的特性の解析に従って生成された前記少なくとも1つの分類器を含む、請求項1に記載の方法。
  14. 少なくとも1つの異なる人口統計学的特性を有するサンプル採取された個人の複数のそれぞれの過去の血液検査結果に従って各々生成された複数の分類器から、前記個人の少なくとも1つの人口統計学的特性に従って前記少なくとも1つの分類器を選択するステップをさらに含む、請求項1に記載の方法。
  15. 前記複数の血液検査結果は、次の複数の血液検査からの少なくとも1つの結果を含み、生化学的血液検査結果は、次の血液検査結果のいずれかを含むことができる、請求項1に記載の方法:アルブミン、カルシウム、塩化物、コレステロール、クレアチニン、高密度リポタンパク質(HDL)、低密度リポタンパク質(LDL)、カリウム、ナトリウム、トリグリセリド、尿素、および/または尿酸。
  16. 請求項1に記載の方法を実行するために適合されたコンピュータ実施可能な命令を含むコンピュータ可読媒体。
  17. 標的個人の現在の血液検査結果に応答してリスクを評価して、消化器癌評価を提供するための癌診断システムであって、
    プロセッサと、
    別の複数のサンプル採取された個人の各々の複数の過去の血液検査結果の解析に従って生成された少なくとも1つの分類器を格納するメモリユニットと、
    標的個人の血液から得られた複数の現在の血液検査結果を受け取る入力ユニットと、
    前記プロセッサを使用して、前記少なくとも1つの分類器を用いて、前記複数の現在の血液検査結果から抽出された1組の特徴を分類することによって前記標的個人の消化器癌リスクを評価する消化器癌評価モジュールと
    を備え、
    前記複数の過去および現在の血液検査結果は、次の複数の血液検査すなわち赤血球(RBC)、ヘモグロビン(HGB)、およびヘマトクリット(HCT)のうちの少なくとも1つの結果、ならびに次の血液検査すなわち平均赤血球ヘモグロビン(MCH)および平均赤血球ヘモグロビン濃度(MCHC)のうちの少なくとも1つの結果を含み、前記少なくとも1つの分類器の各々は、少なくとも0.820±0.001の曲線下の面積(AUC)を有し、前記少なくとも1つの分類器は、消化器癌リスクの評価を提供するために、前記複数の過去の検査結果に従って生成される、消化器癌評価システム。
  18. 前記複数の過去および現在の血液検査結果の各々は、赤血球分布幅(RDW)の結果を含む、請求項17に記載の消化器癌評価システム。
  19. 前記複数の過去および現在の血液検査結果の各々は、ヘマトクリット(PCT)の結果を含む、請求項17に記載の消化器癌評価システム。
  20. 前記複数の過去および現在の血液検査結果の各々は、平均赤血球容積(MCV)の結果を含む、請求項17に記載の消化器癌評価システム。
  21. 標的個人の現在の血液検査結果に応答して消化器癌リスク評価を提供するための分類器を生成する方法であって、
    別の複数のサンプル採取された個人の各々の複数の過去の血液検査結果を提供するステップと、
    複数の組の特徴を有するデータセットを生成するステップであって、各組の特徴が別の前記複数のサンプル採取された個人のそれぞれの複数の過去の血液検査結果に従って生成されて成るステップと、
    前記データセットの解析に従って、標的個人の現在の血液検査結果に応答して消化器癌リスクの評価を提供するために少なくとも1つの分類器を生成するステップと、
    前記少なくとも1つの分類器を出力するステップと
    を含み、前記複数の過去および現在の血液検査結果の各々は、次の血液検査すなわち赤血球(RBC)、ヘモグロビン(HGB)、およびヘマトクリット(HCT)のうちの少なくとも1つの結果、ならびに次の血液検査すなわち平均赤血球ヘモグロビン(MCH)および平均赤血球ヘモグロビン濃度(MCHC)のうちの少なくとも1つの結果を含み、前記少なくとも1つの分類器の各々は、少なくとも0.820±0.001の曲線下の面積(AUC)を有し、前記少なくとも1つの分類器は、消化器癌リスクの評価を提供するために、前記複数の過去の検査結果に従って生成される、方法。
  22. 前記生成ステップは、それぞれの前記複数の過去の血液検査結果から得た過去の血液検査結果の少なくとも1つの操作バージョンを算出し、それを1つの特徴としてそれぞれの前記特徴の組に追加することを含む、請求項21に記載の方法。
  23. 前記生成ステップは、前記それぞれの複数の過去の血液検査結果の日付に従って前記各組の特徴を荷重することを含む、請求項21に記載の方法。
  24. 前記生成ステップは、標準偏差最大閾値に従って外れ値を除去するように前記複数の組の特徴を選別することを含む、請求項21に記載の方法。
  25. 前記複数の組の特徴は、前記それぞれの複数の過去の血液検査結果の日付に従って加重される、請求項21に記載の方法。
  26. 前記複数の血液検査結果は、次の血液検査すなわち赤血球(RBC)、ヘモグロビン(HGB)、およびヘマトクリット(HCT)のうちの少なくとも1つの結果、ならびに次の血液検査すなわち平均赤血球ヘモグロビン(MCH)および平均赤血球ヘモグロビン濃度(MCHC)のうちの少なくとも1つの結果を含む、請求項21に記載の方法。
  27. 前記複数の過去および現在の血液検査結果の各々は、赤血球分布幅(RDW)の結果を含む、請求項に記載の方法。
  28. 前記複数の過去および現在の血液検査結果の各々は、ヘマトクリットの結果を含む、請求項に記載の方法。
  29. 前記複数の過去および現在の血液検査結果の各々は、平均赤血球容積(MCV)の結果を含む、請求項に記載の方法。
  30. 前記複数のサンプル採取された個人の各々の少なくとも1つの人口統計学的パラメータを、それぞれの前記特徴の組に追加するステップをさらに含む、請求項21に記載の方法。
  31. 前記少なくとも1つの人口統計学的パラメータは、性別、年齢、居住区域、人種、および社会経済的特徴から成る群の構成員である、請求項30に記載の方法。
  32. 前記生成ステップは、前記少なくとも1つの人口統計学的パラメータの少なくとも1つの操作バージョンを算出し、それを1つの特徴としてそれぞれの前記特徴の組に追加することを含む、請求項30に記載の方法。
JP2015509566A 2012-05-03 2013-05-02 消化器癌のリスクを評価する方法およびシステム Active JP6267687B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261641979P 2012-05-03 2012-05-03
US61/641,979 2012-05-03
PCT/IL2013/050368 WO2013164823A1 (en) 2012-05-03 2013-05-02 Methods and systems of evaluating a risk of a gastrointestinal cancer

Publications (3)

Publication Number Publication Date
JP2015517653A JP2015517653A (ja) 2015-06-22
JP2015517653A5 JP2015517653A5 (ja) 2016-06-16
JP6267687B2 true JP6267687B2 (ja) 2018-01-24

Family

ID=49514271

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015509566A Active JP6267687B2 (ja) 2012-05-03 2013-05-02 消化器癌のリスクを評価する方法およびシステム

Country Status (14)

Country Link
US (3) US9474490B2 (ja)
EP (1) EP2844131B1 (ja)
JP (1) JP6267687B2 (ja)
KR (1) KR102094326B1 (ja)
CN (1) CN104271033B (ja)
AU (1) AU2013255401B2 (ja)
CA (1) CA2865892C (ja)
ES (1) ES2655184T3 (ja)
HK (1) HK1205448A1 (ja)
IN (1) IN2014MN01809A (ja)
MX (1) MX347850B (ja)
PL (1) PL2844131T3 (ja)
RU (1) RU2640568C2 (ja)
WO (1) WO2013164823A1 (ja)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9474490B2 (en) 2012-05-03 2016-10-25 Medial Research Ltd. Methods and systems of evaluating a risk of a gastrointestinal cancer
JP6503382B2 (ja) * 2014-06-16 2019-04-17 シーメンス・ヘルスケア・ダイアグノスティックス・インコーポレーテッドSiemens Healthcare Diagnostics Inc. 血液学用デジタルホログラフィ顕微鏡検査データ分析
US10614287B2 (en) 2014-06-16 2020-04-07 Siemens Healthcare Diagnostics Inc. Virtual staining of cells in digital holographic microscopy images using general adversarial networks
US20160110516A1 (en) * 2014-10-20 2016-04-21 Liwei Ma Dynamic monitoring early cancer risk
CN104573410A (zh) * 2015-01-20 2015-04-29 合肥工业大学 基于分子子网与随机森林分类器的癌症化疗敏感性预测方法
CN104615894B (zh) * 2015-02-13 2018-09-28 上海中医药大学 一种基于k近邻标签特定权重特征的中医诊断系统
CN106339569B (zh) * 2015-07-09 2021-01-05 深圳迈瑞生物医疗电子股份有限公司 判断样本检验结果异常的方法及装置
US10332638B2 (en) 2015-07-17 2019-06-25 Massachusetts Institute Of Technology Methods and systems for pre-symptomatic detection of exposure to an agent
JP6100867B1 (ja) * 2015-11-06 2017-03-22 振武 曽 免疫状態の分析のための検査方法
US20190148019A1 (en) * 2016-05-12 2019-05-16 Hoffmann-La Roche Inc. System for predicting efficacy of a target-directed drug to treat a disease
WO2017201323A1 (en) * 2016-05-18 2017-11-23 Massachusetts Institute Of Technology Methods and systems for pre-symptomatic detection of exposure to an agent
KR101747783B1 (ko) 2016-11-09 2017-06-15 (주) 바이오인프라생명과학 특정 항목이 속하는 클래스를 예측하기 위한 2-클래스 분류 방법 및 이를 이용하는 컴퓨팅 장치
US20170140115A1 (en) * 2017-01-24 2017-05-18 Liwei Ma Intelligent stroke risk prediction and monitoring system
US20170147768A1 (en) * 2017-02-06 2017-05-25 Liwei Ma System and method for detecting and monitoring acute myocardial infarction risk
US20210249136A1 (en) * 2018-08-17 2021-08-12 The Regents Of The University Of California Diagnosing hypoadrenocorticism from hematologic and serum chemistry parameters using machine learning algorithm
CN109670526A (zh) * 2018-11-09 2019-04-23 全球能源互联网研究院有限公司 一种电网的干扰源类型辨识方法、装置、设备及存储介质
CN113614537A (zh) * 2019-03-28 2021-11-05 豪夫迈·罗氏有限公司 癌症预后
US20210299339A1 (en) * 2020-03-31 2021-09-30 Fresenius Medical Care Holdings, Inc. Blood monitoring system for determining a calibrated hemoglobin concentration value for a patient based on patient-specific mean corpuscular hemoglobin concentration data
TWI763215B (zh) * 2020-12-29 2022-05-01 財團法人國家衛生研究院 篩選用於預測生理狀態的特徵的電子裝置和方法
CN112735606B (zh) * 2021-01-22 2023-04-25 张厚德 结直肠癌风险预测方法、设备及存储介质
CN112908470B (zh) * 2021-02-08 2023-10-03 深圳市人民医院 一种基于rna结合蛋白基因的肝细胞癌预后评分系统及其应用
CN112986446A (zh) * 2021-04-19 2021-06-18 生态环境部华南环境科学研究所 禽蛋类产品中有机磷酸酯及代谢物的同步检测方法及应用
GB202109560D0 (en) * 2021-07-01 2021-08-18 Chancellor Masters And Scholars Of The Univ Of Cambridge Anomaly detection based on complete blood counts
WO2023147472A1 (en) * 2022-01-28 2023-08-03 Freenome Holdings, Inc. Methods and systems for risk stratification of colorectal cancer
CN115620909B (zh) * 2022-11-04 2023-08-04 内蒙古卫数数据科技有限公司 一种基于全血细胞计数融合指标hbi的癌症风险评估系统
CN117524464B (zh) * 2024-01-04 2024-04-05 北京和兴创联健康科技有限公司 一种基于大数据的计算手术后目标血红蛋白的方法及系统

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5692220A (en) * 1993-09-02 1997-11-25 Coulter Corporation Decision support system and method for diagnosis consultation in laboratory hematopathology
US6059724A (en) * 1997-02-14 2000-05-09 Biosignal, Inc. System for predicting future health
US6881548B2 (en) 1997-05-23 2005-04-19 A&G Pharmaceutical, Inc. Methods and kits for diagnosing tumorigenicity and determining resistance to the antineoplastic effects of antiestrogen therapy
US7838296B2 (en) 2002-08-28 2010-11-23 Separation Technology, Inc. Methods and apparatus for ultrasonic determination of red blood cell indices
US20040122703A1 (en) * 2002-12-19 2004-06-24 Walker Matthew J. Medical data operating model development system and method
US7951078B2 (en) 2005-02-03 2011-05-31 Maren Theresa Scheuner Method and apparatus for determining familial risk of disease
US9075062B2 (en) * 2005-03-22 2015-07-07 The United States Of America, As Represented By The Secretary, Department Of Health & Human Services Identification of biomarkers by serum protein profiling
WO2007016367A2 (en) * 2005-07-29 2007-02-08 Bayer Healthcare Llc Neoplastic disease-related methods, kits, systems and databases
EP2096439A4 (en) * 2006-12-21 2011-01-05 Ajinomoto Kk METHOD, APPARATUS, METHOD, SYSTEM AND SOFTWARE FOR EVALUATING COLORECTAL CANCER, AND RECORDING MEDIUM
JP5025371B2 (ja) 2007-07-31 2012-09-12 シスメックス株式会社 血液分析装置
US8512240B1 (en) * 2007-11-14 2013-08-20 Medasense Biometrics Ltd. System and method for pain monitoring using a multidimensional analysis of physiological signals
US20100076787A1 (en) * 2008-09-11 2010-03-25 Stephen Naylor Method for preparing a medical data report
EP2340437A1 (en) 2008-09-15 2011-07-06 Herlev Hospital Ykl-40 as a marker for gastrointestinal cancers
US8355925B2 (en) 2008-10-21 2013-01-15 Perahealth, Inc. Methods of assessing risk based on medical data and uses thereof
CA2743211A1 (en) 2008-11-12 2010-05-20 Caris Life Sciences Luxembourg Holdings, S.A.R.L. Methods and systems of using exosomes for determining phenotypes
WO2011060098A1 (en) 2009-11-10 2011-05-19 Prometheus Laboratories Inc. Methods for predicting post-surgery risk associated with ileal pouch-anal anastomosis
AU2010321562A1 (en) 2009-11-23 2012-06-14 Children's Medical Center Corporation Normalization of platelet biomarkers
US9474490B2 (en) 2012-05-03 2016-10-25 Medial Research Ltd. Methods and systems of evaluating a risk of a gastrointestinal cancer

Also Published As

Publication number Publication date
ES2655184T3 (es) 2018-02-19
AU2013255401B2 (en) 2017-02-23
US11651189B2 (en) 2023-05-16
US20200050917A1 (en) 2020-02-13
EP2844131B1 (en) 2017-10-11
PL2844131T3 (pl) 2018-03-30
HK1205448A1 (en) 2015-12-18
CA2865892C (en) 2021-08-24
KR20150005909A (ko) 2015-01-15
KR102094326B1 (ko) 2020-03-30
CN104271033B (zh) 2017-05-24
US20170039334A1 (en) 2017-02-09
US20140235956A1 (en) 2014-08-21
AU2013255401A1 (en) 2014-09-18
RU2014140114A (ru) 2016-06-20
EP2844131A1 (en) 2015-03-11
JP2015517653A (ja) 2015-06-22
US10452970B2 (en) 2019-10-22
EP2844131A4 (en) 2015-11-18
MX2014011202A (es) 2014-11-21
CA2865892A1 (en) 2013-11-07
US9474490B2 (en) 2016-10-25
RU2640568C2 (ru) 2018-01-09
CN104271033A (zh) 2015-01-07
MX347850B (es) 2017-05-16
IN2014MN01809A (ja) 2015-07-03
WO2013164823A1 (en) 2013-11-07

Similar Documents

Publication Publication Date Title
JP6267687B2 (ja) 消化器癌のリスクを評価する方法およびシステム
Mesas et al. Predictors of in-hospital COVID-19 mortality: A comprehensive systematic review and meta-analysis exploring differences by age, sex and health conditions
Lagani et al. A systematic review of predictive risk models for diabetes complications based on large scale clinical studies
Saha et al. Time-dependent predictive accuracy in the presence of competing risks
JP6320999B2 (ja) ネットワークベースのバイオマーカシグネチャに関連するシステムおよび方法
Cai et al. Evaluating prognostic accuracy of biomarkers in nested case–control studies
JP2016535262A (ja) 肺癌のリスクを評価する方法およびシステム
Abadia et al. Diagnostic accuracy and performance of artificial intelligence in detecting lung nodules in patients with complex lung disease: a noninferiority study
Okuma et al. Quantitative evaluation of COVID-19 pneumonia severity by CT pneumonia analysis algorithm using deep learning technology and blood test results
Sutradhar et al. Repeated assessments of symptom severity improve predictions for risk of death among patients with cancer
JP2023156317A (ja) がんの予後
KR102467999B1 (ko) 위암의 다층 다요인 패널과 Computational biological network modeling을 통한 위암 발암에 대한 에티옴 모형
Pfeiffer Extensions of criteria for evaluating risk prediction models for public health applications
Sweeney et al. Mortality prediction in sepsis via gene expression analysis: a community approach
Lum et al. Accounting for length-bias and selection effects in estimating the distribution of menstrual cycle length
Yoo et al. Generative adversarial network for automatic quantification of Coronavirus disease 2019 pneumonia on chest radiographs
Gao et al. Multistage adaptive biomarker-directed targeted design for randomized clinical trials
Shen et al. Cohort research in “Omics” and preventive medicine
Sheng et al. A new synthesis analysis method for building logistic regression prediction models
Bello et al. Assessment of cumulative health risk in the World Trade Center general responder cohort
Dean et al. Designing optimal allocations for cancer screening using queuing network models
WO2016148155A1 (ja) 評価方法、評価装置、評価プログラム、評価システム、及び端末装置
Gao et al. Association of log odds of positive lymph nodes with survival in patients with small cell lung cancer: Results from the SEER database
Juhan et al. Identifying Risk Factors for Female Cardiovascular Disease Patients in Malaysia: A Bayesian Approach
CN115885350A (zh) 确定癌症患者的死亡风险的方法、评估抗癌疗法的方法、选择癌症患者以进行治疗的方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160422

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160422

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170327

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170407

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170629

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171124

R150 Certificate of patent or registration of utility model

Ref document number: 6267687

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250