CN104271033A - 一种评价胃肠癌风险的方法和系统 - Google Patents

一种评价胃肠癌风险的方法和系统 Download PDF

Info

Publication number
CN104271033A
CN104271033A CN201380022626.6A CN201380022626A CN104271033A CN 104271033 A CN104271033 A CN 104271033A CN 201380022626 A CN201380022626 A CN 201380022626A CN 104271033 A CN104271033 A CN 104271033A
Authority
CN
China
Prior art keywords
test results
blood test
grader
described multiple
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201380022626.6A
Other languages
English (en)
Other versions
CN104271033B (zh
Inventor
尼尔·卡尔克施泰因
亚龙·基纳
瓦尔达·沙莱夫
加夫列尔·霍迪克
英巴尔·戈尔德施泰因
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MEDIAL RES Ltd
Original Assignee
MEDIAL RES Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MEDIAL RES Ltd filed Critical MEDIAL RES Ltd
Publication of CN104271033A publication Critical patent/CN104271033A/zh
Application granted granted Critical
Publication of CN104271033B publication Critical patent/CN104271033B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57419Specifically defined cancers of colon
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57446Specifically defined cancers of stomach or intestine
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7275Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/50Determining the risk of developing a disease
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5091Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing the pathological state of an organism
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57484Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
    • G01N33/57488Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites involving compounds identifable in body fluids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Chemical & Material Sciences (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Physics & Mathematics (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • General Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Biochemistry (AREA)
  • Hospice & Palliative Care (AREA)
  • Microbiology (AREA)
  • Cell Biology (AREA)
  • Biotechnology (AREA)
  • Oncology (AREA)
  • Data Mining & Analysis (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physiology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Psychiatry (AREA)
  • Computational Linguistics (AREA)

Abstract

一种评估胃肠癌风险的方法。该方法包括通过对某目标个体采集血液获得的多个当前血液检测结果组合形成一个特征集,提供根据对多个样本个体各自的多次历史血液检测结果分析生成的至少一种分类器;处理器通过使用至少一种分类器对特征集进行分类后评估目标个体的胃肠癌风险。

Description

一种评价胃肠癌风险的方法和系统
技术领域和背景技术
本发明的一些实施例与癌症诊断相关,具体地但不限于是与癌症风险评估的方法和系统相关。
结肠直肠癌诊断方法包括基于免疫便隐血反应的诊断、结肠镜检查术诊断等类似方法。然而,基于免疫便隐血反应的诊断不能最终确诊,并且其大部分阳性结果患者为假阳性。此外,基于免疫便隐血反应的诊断或结肠镜检查术诊断在早期结肠直肠癌中的检测灵敏度和检测专属性都较低。便隐血检测的诊断尤其对于早期右侧结肠的癌变经常会发生漏诊。CT(计算机断层摄影)、MRI(磁共振成像)、PET(正电子发射计算机成像)及其他成像诊断法并不适合结肠直肠癌的诊断。
另一方面,通过结肠镜检查进行的结肠直肠活组织检查可以明确诊断。但此方法为有创性检查,且在窗口期结肠镜检查不具可操作性。此外,诸如结肠镜检查的有创性诊断方法会对个体造成伴发疼痛的负担,并且在检查时会有出血风险等问题。
在过去数年间,已经形成了一些新的结肠直肠癌诊断方法。例如,美国公开号2010/0009401专利描述了一种评估结肠直肠癌的方法。此方法通过对待评估受试者的血液氨基酸浓度值检测形成氨基酸浓度数据,此受试者已检测氨基酸浓度数据中包括Arg,Cys,Om,Trp,Glu,ABA,Val,Phe,Leu,GIn,Ile和His,基于其中至少一种氨基酸浓度值来评价受试者的结肠直肠癌状态。
发明内容
根据本发明的一些实施例,提供了一种评估胃肠癌风险的计算机化方法。此方法包括:生成根据对某目标个体采集血液获得的多个当前血液检测结果组成的特征集,提供根据对多个样本个体各自的多次历史血液检测结果分析形成的至少一种分类器;通过使用至少一种分类器对特征集进行分类后评估目标个体的胃肠癌风险。每一个历史和当前血液检测结果至少包括下述一种血液检测:红细胞(RBC)、血红蛋白(HGB)、血细胞比容(HCT)以及平均红细胞血红蛋白含量(MCH)红细胞平均血红蛋白浓度(MCHC)中的至少一种血液检测。任选地,从全血球计数(CBC)检测中提取获得此血液检测结果。
任选地,此特征集包括目标个体的年龄;其中至少一种分类器是根据对每一个样本个体的年龄进行分析而形成。
任选地,每一个历史和当前的血液检测结果包括红细胞分布宽度(RDW)结果。
任选地,每一个历史和当前的血液检测结果包括血小板压积(PCT)结果。
任选地,每一个历史和当前的血液检测结果包括平均细胞体积(MCV)结果。
任选地,每一个历史和当前的血液检测结果至少包括下述血液检测的一种:白血球计数-WBC(CBC)、血小板平均体积(MPV)、平均细胞、血小板数(CBC)、嗜酸粒细胞计数、中性粒细胞百分比、单核细胞百分比、嗜酸粒细胞百分比、嗜碱粒细胞百分比、中性粒细胞计数和单核细胞计数。
任选地,至少一种分类器包括下述一组中的一个:加权线性回归分类器、K最近邻法(KNN)分类器和随机森林分类器。
任选地,特征集包括至少一种目标个体的人口统计学特征和至少一种根据每一个样本个体的至少一个人口统计学特征分析形成的分类器。
任选地,本方法进一步包括基于至少一个人口统计学特征从多个分类器中选取至少一种分类器,这些分类器均是根据至少具有一种不同人口统计学特征样本个体的各自历史血液检测结果而生成。
任选地,多个血液检测结果包括下述多项血液检测的至少一种结果:生化血液检测结果可以包括白蛋白、钙、氯化物、胆固醇、肌酸酐、高密度脂蛋白(HDL)、低密度脂蛋白(LDL)、钾、钠、甘油三酯、尿素和/或尿酸等任意血液检测结果。
根据本发明的一些实施例,提供了一种胃肠癌评估系统。此系统包括一个处理器;一个存储单元,其中保存有根据每一个样本个体的多次历史血液检测结果分析而成的至少一种分类器;一个输入单元,其可以接收根据目标个体血液获取的多个当前血液检测结果;一个胃肠癌评估模块,其可以通过处理器采用至少一种分类器对由多个当前血液检测结果获得的特征集分类处理后评估目标个体的胃肠癌风险。多个历史和当前血液检测结果包括下述多个血液检测中的至少一种:红细胞(RBC)、血红蛋白(HGB)、血细胞比容(HCT)以及平均红细胞血红蛋白含量(MCH)红细胞平均血红蛋白浓度(MCHC)中的至少一种。
任选地,每一个历史和当前的血液检测结果包括红细胞分布宽度(RDW)结果。
任选地,每一个历史和当前的血液检测结果包括血小板压积(PCT)结果。
任选地,每一个历史和当前的血液检测结果包括平均细胞体积(MCV)结果。
根据本发明的一些实施例,提供了一种形成结肠直肠癌风险评估分类器的方法。此方法包括提供多个样本个体各自的多个历史血液检测结果;根据每个样本个体各自的多个历史血液检测结果形成单个特征集、形成拥有多个此类特征集的数据集;根据对数据集的分析生成至少一种分类器;以及至少一种分类器的输出。
任选地,此形成方法包括对来自多个历史血液检测结果的每一个历史血液检测结果计算和添加至少一种操纵版本,从而形成各自特征组成特征集。
任选地,此形成方法包括根据多个历史血液检测结果各自的日期对每个特征集进行加权。
任选地,此形成方法包括对多个特征集进行筛选以去除不符合标准偏差最大阈值的离群值。
任选地,根据多个历史血液检测结果的日期对多个特征集进行加权。
任选地,多个血液检测结果包括下述血液检测的至少一种:红细胞(RBC)、血红蛋白(HGB)、血细胞比容(HCT)以及平均红细胞血红蛋白含量(MCH)或红细胞平均血红蛋白浓度(MCHC)中的至少一种。
任选地,每一个历史和当前的血液检测结果包括红细胞分布宽度(RDW)结果。
任选地,每一个历史和当前的血液检测结果包括血小板压积(PCT)结果。
任选地,每一个历史和当前的血液检测结果包括平均细胞体积(MCV)结果。
更多可选地,此方法进一步包括将每个样本个体的至少一种人口统计学参数添加入各自的特征集中。
更多可选地,至少一种人口统计学参数为由性别、年龄、居住地、人种和社会-经济属性构成的组中的一个。
更多可选地,此形成方法包括对至少一种人口统计学参数计算和添加至少一种操纵版本,从而形成各自特征组成特征集。
除非另有定义,本文所用的所有技术和/或科学术语具有本发明涉及领域普通技术人员通常理解的相同含义。虽然在实践或本发明实施例的测试中可以使用本文描述的方法和类似或等同的材料,但下文仍对示例性方法和/或材料进行说明。在冲突的情况下,以本专利中的说明书及定义为准。此外,材料、方法和实施例仅是说明性的,而不是要进行必要的限制。
本发明实施例方法和/或系统的实现可涉及由手动、自动或它们的组合来执行或完成选择的任务。另外,根据本发明方法和/或系统实施例的实际仪器设备,若干所选择的任务可以由硬件、软件、固件或使用操作系统对它们的组合来实现。
例如,用于执行本发明实施例所选择任务的硬件可以是芯片或电路。至于软件,本发明实施例所选择的任务可以通过使用任何适当操作系统计算机执行的多个软件指令而实现。在一个示例性的本发明实施例中,一个或多个根据本文描述示例性方法和/或系统实施例描述的任务由一个数据处理器(如执行多个指令的计算平台)执行。任选地,数据处理器包括用于存储指令和/或数据的易失性存储器和/或例如磁性硬盘和/或可移动介质的非易失性存储器。任选地,也可使用网络连接。任选地,也可使用显示器和/或如键盘或鼠标的用户输入设备。
附图说明
本文中描述了本发明的一些实施例,仅作为示例的方式,参考附图。具体参照附图详图,它以例图的方式及示例讨论的目的强调了本发明实施例的细节特点。在这点上,本图例说明与那些说明发明实施例如何运作的图例有着显著区别。
附图中:
图1是本发明一些实施例生成一个或多个分类器方法的流程图。此分类器通过对多个个体记录进行分析从而估计胃肠癌的风险评分;
图2是生成一个或多个分类器系统的图表示意图。以本发明一些实施例执行图1描述的方法为例;
图3是根据本发明一些实施例的接收操作特征(ROC)曲线图;
图4A-4C是根据本发明一些实施例对不同示例性分类器性能的总结表;
图5A是根据在随机森林分类器中的重要性列出的男性扩展特征集表格图像;
图5B是成对血液检查结果之间相关性的指示表格;
图6是示出多个时间窗口的性能表;
图7是示出随机森林分类器的性能表;
图8是根据本发明一些实施例使用分类器评估目标个体胃肠风险分数方法的流程图;
图9是根据本发明一些实施例,对不同组群人群结肠、胃、直肠和食道癌在不同正例覆盖率的分类器性能表;
图10是一组本发明一些实施例使用所述分类器了对贫血和不贫血个体(美国白人)进行分类的分析结果总结表格。
具体实施方式
本发明中的一些实施例中涉及到癌症诊断,更具体地但不仅限于地是涉及评估癌症风险的方法和系统。
根据本发明的一些实施例,提供了一种用一种或多种分类器将目标个体当前血液检测结果集合进行分类来评估胃肠癌风险的方法和系统。所述分类器根据对多个样本个体各自的多次历史血液检测结果分析生成。当前血液检测结果集合包括下述血液检测的至少一种:血红蛋白(HGB)、血细胞比容(HCT)、红细胞(RBC)以及平均红细胞血红蛋白含量(MCH)红细胞平均血红蛋白浓度(MCHC)中的至少一种血液检测和目标个体的年龄。任选地,当前的血液检测结果集合可进一步包括下述血液检测的一种或多种:白血球计数-WBC(CBC)、血小板平均体积(MPV)、平均细胞体积(MCV)、红细胞分布宽度(RDW)、血小板数(CBC)、嗜酸粒细胞计数、中性粒细胞百分比、单核细胞百分比、嗜酸粒细胞百分比、嗜碱粒细胞百分比、中性粒细胞计数、单核细胞计数和血小板压积(PCT)。
任选地,可通过对目标个体的血液生化检测结果进行分类来评估胃肠道癌症风险。在这样的实施例中,根据对多个个体的历史血液生化检测结果进行分析生成分类器。血液生化检测结果可以包括任何下述血液检测:白蛋白、钙、氯、胆固醇、肌酐、高密度脂蛋白(HDL)、低密度脂蛋白(LDL)、钾、钠、甘油三酸酯、尿素和/或尿酸。
任选地,可通过对目标个体的人口统计特性进行分类来评估胃肠道癌症风险。在这样的实施例中,根据对多个个体的人口统计特性进行分析生成分类器。
任选地,目标个体的当前血液检测结果和采样个体的历史血液检测结果都被用来生成的包括调节值和/或加权值的扩展特征集。任选地,每个扩展特征集均以如下述例举的各自个体人口统计特性为基础。
任选地,一个或多个分类器可适用于目标个体的一个或多个人口统计特性。任选地,可选择分类器匹配目标个体的一个或多个人口统计特征。在这样的实施方案中,对男性和女性可使用不同的分类器。
根据本发明的一些实施例,提供了生成一种或多种分类器用于评估胃肠癌癌风险的方法和系统。该方法和系统基于对每一个采样个体的多个历史血液测试结果进行分析,并根据其各自的历史血液检测结果生成相应的具有多个特征集的数据集。此数据集随后用于生成和输出的一个或多个分类器,如K-最近邻(KNN)分类器、随机森林分类器和加权线性回归分类器。这些分类器可用于客户机终端的执行模块,或用于根据目标个体的当前血液检测结果评估其胃肠癌风险的在线服务。
之前说明的至少一种本发明详细实施例,其应理解为本发明并不局限于申请中后述和/或附图图解和/或示例中展示的组件和/或方法的构建和布置。本发明可由其他实施例或以各种方式实践或执行。
参考图1,这是本发明一些实施例生成一个或多个分类器的方法100流程图。这些分类器是通过对多个待诊断个体的多个历史检测结果进行分析生成。此处所指的胃肠癌可以是结肠、胃、直肠或食道癌症。参考图2,这是生成用于评估胃肠癌风险评分分类器的系统200图表示意图,以本发明一些实施例执行图1的方法为例。
系统200包括一个或多个医疗记录数据库201和/或一个连接到医疗记录数据库的接口。数据库201包括多个个体的记录,也被称为多个个体样本,其描述内容有每一个采样个体、每一个个体多个历史检测结果的一个或多个集合,以及任选的一个或多个人口统计参量和胃肠癌预后。多个历史检测结果集、诸如年龄的人口统计参量和/或胃肠癌预后可以被存储为一个普通的样本记录和/或收集入多个独立的和/或相连的数据库。任选地,根据癌症登记记录将胃肠癌预后生成二进制表示集。不同的检测结果可能来自常规检测的血液结果和/或同一时期检测的血液结果。任选地,一些多个历史检测结果集会有血液测试结果的缺失。这些结果可选由其他个体可用血液检测结果的平均值加权来弥补。该方法还包括处理器204、分类器生成模块205和诸如网络接口的接口单元206。
如本文中所使用的,人口统计学参数包括年龄、性别、种族、体重、国籍、住所的地理区域和/或类似因素。
首先,如图中所示,101处提供多个个体样本的一个或多个数据集。
任选地,如图所示在102处对多个个体样品根据匹配的标准进行筛选和/或选择。例如,样本记录年龄是在40岁及以上、癌症登记有结肠癌并可选没有其他类型癌症的个体;或者是未登记未出现登记癌症的个体。任选地,仅当进行癌症登记的个体在登记前的一段规定时段内(距当时日期30天至2年时间的时间段内)对其最新的多个历史检测结果集进行了归档记录时,方才采纳其发生需登记癌症中的个体样本记录。任选地,仅当个体记录中包括了在等时分布(血液检测时间)时间点时上阳性和阴性胃肠癌人群的一系列多个历史检测结果时,方才采纳其未发生需登记癌症中的个体样本记录。将阳性和阴性样本进行等时分布的过程也导致忽略掉至少一些阴性(未登记)样本,并导致该数据集中胃肠患病流行程度的变化。
如图所示在103,根据如分类器生成模块205从样本记录中提取样本数据生成诸如矩阵的评价数据集。此评价数据集包括多个特征集及可选的扩展集。每个特征集都从筛选和/或选择的样本记录生成。这些特征集是任选的未处理过的特征,其中包括实际的血液检测结果和/或人口统计特性值。
如上所述,每个样品记录包括一组或多组的多个个体历史检测结果,每个均为包括一组血液检测结果,其数量可超过10、15、20个和/或为任何中间数。在一个实例中,提取的每个未处理的特征集至少包括以下18个血液检测结果:红细胞(RBC)、白血球计数-WBC(CBC)、血小板平均体积(MPV)、血红蛋白(HGB)、血细胞比容(HCT)、平均细胞体积(MCV)、平均细胞血红蛋白(MCH)、红细胞平均血红蛋白浓度(MCHC)、红细胞分布宽度(RDW)、血小板数(CBC)、嗜酸粒细胞计数、中性粒细胞百分比、单核细胞百分比、嗜酸粒细胞百分比、嗜碱粒细胞百分比、中性粒细胞计数、单核细胞计数和血小板压积(PCT)。在另一个实例中,提取的每个未处理的特征集至少包括下述血液检测HGB、HCT和RBC,及MCH和MCHC中的至少一种和可反应目标个体年龄的其他数据。任选地,此提取的未处理特征集可进一步包括下述RDW、血小板和MCV中的一种或多种。此外,此提取的未处理特征集可以进一步包括下述WBC、嗜酸性粒细胞计数、中性粒细胞百分比和/或计数和/或、嗜碱性粒细胞百分比和/或计数、单核细胞百分比和/或计数中的一种或多种。
任选地,可对每组未处理的特征集进行扩展。扩展的特性集包括所述未处理的血液检测结果和/或一种或多种人口统计参数及任意操纵的血液检测结果和/或组合血液检测结果等特征,例如如下所述。例如,扩展特征集中的每个特征基于血液检测结果、人口统计特征、血液测试结果和/或人口统计特征的组合、和/或操纵的血液检测结果和/或人口统计特征。例如,当未处理的特征集包括18项检测结果时,可如下生成114个扩展特征集:
1.18个特征集,每个集各自只包括每一个18种血液检测结果。
2.18个特征集,每个集包括一种18种血液检测结果与第一虚拟结果之间的差值(如比值)。所述第一虚拟结果可以各自通过样本记录中可用结果平均值的加权计算获得。任选地,可根据有关执行和目标日期的时间段对每个可用检测结果进行加权。任选地,可将目标个体一系列多个历史检测结果的日期作为此处的目标日期。任选地,可用的检测是指在第一期间内进行的检测,如目标日期前540天。例如,以记录时间(如进行检测的时间)为始至此的绝对值进行加权计算。以与此绝对值成单调变换的平方函数或其他函数进行加权计算。
3.18个特征集,每个集包括一种18种血液检测结果与第二虚拟结果之间的差值(如比值)。第二虚拟结果可采用计算第一虚拟结果的方法,在诸如目标日期前1080天的第二时段对可用的检测结果计算获得。
4.1个特征集-在目标日期前一年内使用者多个历史检测结果的集合数目。
5.1个特征集-在目标日期前180×6至180×10的时间段内,使用者多个历史检测结果的集合数目。
6.1个特征集–个体年龄,如个体的出生年份。
7.57个特征集,所有所述(即1-6条)特征的平方值。
任选地,一种或多种生化血液检查结果可按照每个个体进行记录和任选作为特征加入特征集中。这些特征可以归为所述血液检测结果。生化血液检测结果可包括下列任何血液检测结果:白蛋白、钙、氯、胆固醇、肌酐、高密度脂蛋白(HDL)、低密度脂蛋白(LDL)、钾、钠、甘油三酸酯、尿素和/或尿酸。
任选地,具有不同扩展特征集的不同评估数据集(例如矩阵)生成不同的分类器,用以将具有如不同性别等人口统计特性的目标个体进行分类。
任选地,对所述评估数据集(例如矩阵)进行过滤以除去反复异常值。任选地,计算每个特征的平均偏差和/或标准偏差,将例如偏离10倍标准偏差最大阈值的例外特征值截短至标准偏差最大阈值。例如,此过程反复重复10次(如未被执行截短时或较少次数)。描述此清洗过程的示例性伪代码如下:
如图所示,在104中,基于一种或多种的目标个体人口统计特性和当前的多个检测结果使用根据评估数据集生成的分类器对每个目标个体的胃肠癌风险进行分类。例如通过分类器生成模块205。任选地,可以根据评估数据集生成以下一个或多个分类器:
加权线性回归分类器,其中阳性样品记录获得约阴性样本记录100倍的分数;
k最近邻(KNN)分类器,例如阴性样本记录的100倍下采样;
随机森林分类器,例如以2:1比例的阴性与阳性样本记录生成每棵树。
任选地,使用10折交叉验证方法对评估数据集的性能进行评价。将本评估数据集作为一个集合,随机分成十个大小相等的部分。对于每个部分,进行如下操作:
在不属于本部分的其他90%部分中选取可接受的血液检测结果集;
基于选择的血液检测结果集训练分类器;
在本10%部分中选取血液检测结果集;
基于10%部分的血液检测结果集测试分类器。
现在,收集分类方法(也称为预测)用以测量每个分类器的性能。例如,根据如图3的接收操作特性(ROC)曲线选择测量其性能。任选地,使用在不同(5%,10%,20%,50%和70%)正例覆盖率(查正率)时的负例覆盖率确定测量效果。图4A-4C表格中总结了不同示例性分类器的性能,其曲线下面积(AUC)分别为0.840±0.001、0.820±0.001和0.833±0.001。应当指出的是,图3和图4A-4C是基于从401415名患者中确诊出217246名为阳性结直肠癌(CRC)的数据集合计算得出。可选地,表中的每一个数值(Lift、预测查准率和负例覆盖率)均以平均值±标准差(std),是经过如10折的交叉验证方案计算而得。
如此处用到的,查正率表示个体被分类为真阳性(TP)之真阳性率,即CRC个体(TP和假阴性(FN))百分比的比例,例如TP/(TP+FN)。如此处用到的,查准率表示被分类为具有CRC的人数百分比,例如TP/(TP+FP)。如此处用到的,lift表示在全部CRC发病人群中的查准率比例。例如,从401415名患者中确诊出217246名为阳性结直肠癌(CRC)。在这个例子中,患病率为0.65%。为建立正确的时间分布(见上文)而选择的阴性样本,会导致学习和测试人群的偏差,导致1.2%的CRC发病率。因此,lift可以直接呈现,但其只间接用以通过调整测量的查准率来推断预测的查准率。
任选地,根据分类的重要性对特定分类器使用的特征集进行加权。特征的重要性可根据通过基尼系数(统计离散)测定的决策树中因为分裂导致的节点不纯度衰减平均值来确定。作为一个例子,图5A为根据男性用随机森林分类器中的重要性列出的扩展特征集表格。
应当指出的是,分类器的历史血液检测结果和当前血液检测均可包括成对的被认为在本质上相似的血液检查项目的血液检测结果。这些成对项目包括以下的一种或多种,血红蛋白(HGB)与红细胞压积(HCT)、中性粒细胞百分比/计数与淋巴细胞百分比/数(从CBC检测中提取)、MCV与MCH、RBC与红细胞压积(HCT)、RBC与MCV。对于本领域技术人员这些成对血液结果有共同的含义和不可累计的价值,因此本领域技术人员仅使用这些相似的成对血液检查项中的一个而不是同时使用相似的成对血液检查项目。然而检测这样的成对血液结果并非毫无价值。本发明人惊奇地发现,这样的一对检项之间的相关性并非绝对,并且于所述分类器性能的贡献巨大。例如,参见图5B中表格。
应当注意的是,一个分类器的性能依赖于最后一组血液测试结果的日期与发现癌症日期之间的时间,例如在癌症登记处的登记日期。这种依赖关系的发现与分类器相关,分类器中可接受的阳性样品血液检测是在有限时间窗内纳入(例如癌症登记前30-90天、90-180天和/或类似的时间)。例如,图6为几个时间窗的显示性能表。此表显示了与表明长期变动的健康对照组数据相比,在结直肠癌病例确诊前30-720天内的CBC调整数据。此外,对于每一个病例,所选择的参数值/结果均与所选参数值/结果评估前1.5年(△1.5)和3年(△3)相同参数结果进行对比。如图中箭头所示的表。如图6所示,数据越旧时负例覆盖率随之降低。
应当指出的是,血液贫血的可由多种胃肠道疾病和其它因素引发,胃肠癌是最少见的诱因。不明原因的贫血是中老年人患结肠直肠癌的主要预警,其在伴发痔疮时常导致结肠直肠癌诊断的延误。60%的结肠直肠癌患者会发生失血的情况,每日从粪便中损失低至3毫升的血液即可引起缺铁性贫血。接近18%的结肠直肠癌患者在确诊前14出现超过一年的贫血。但是,贫血1并不占显著比例。可能存在阳性隐血试验。然而,目前用于结肠直肠癌筛查的粪便血液检测只能检测出结肠直肠癌筛查当时的出血,而失血却是慢性的。
Spell DW,Jones DV,Jr.,Harper WF,David Bessman J等在《Cancer DetectPrev》2004;28(1):37-42发表了《全血细胞计数在预测结肠癌时的价值》。其中报道,88%结直肠癌患者至少有一项血液异常。因此,正在积极研究试图从全血细胞计数(CBC)预测结直肠癌。一项对具有确诊前0-122天可利用CBC参数的新诊断结直肠患者的回顾性研究,其结果表明红细胞分布宽度(RDW)高于正常范围,且具有84%的正例覆盖率和88%的负例覆盖率,主要针对右侧例结直肠癌患者。记录的RDW、血红蛋白和红细胞平均体积(MCV)的组合结果不具有改善的正例覆盖率。
根据本发明的一些实施例,本文中生成的分类器性能适用于有贫血状况的个体和无贫血状况的个体。例如,图11是一组表总结了使用所述分类器对贫血和非贫血个体(美洲白人)进行分类的分析结果。该组包括多个表格,每个总结了某一群个体的贫血个体相对于另一组个体非贫血个体的概率。任选地基于所述血液结果的年龄和个体的年龄之间的组合进行分组。图10示出的证据表明,血液计数参数独立测量与结直肠癌相关,在正常范围内即使是细微的结直肠癌参数组合变化也可用作结直肠癌筛选过程的一部分,例如通过计分。对贫血或无贫血的个体均适用。
现如图所示,在105中,任选的通过如接口单元206输出可将目标个体进行分类的分类器。任选地,可对具有不同人口统计学特性的个体指定使用不同的分类器。例如,对男性使用一种分类器和对女性使用另一种分类器。例如,根据所述18个特征中的一组特征,设置对男性使用一种分类器,而设置对女性使用无生化试验的随机森林分类器。随机森林分类器曲线下面积为0.833±0.001,其性能如图7所示,其中查准率按0.45%的总发病率估计。
参考图如图8所示。在此流程图中使用如所述分类器的使用方法400根据本发明的一些实施例对目标个体的胃肠癌风险分数进行评估。在使用时,分类器可位于网络服务器上接收目标个体个人数据,并使用含有此分类器的胃肠癌评估模块对待评估受试者的胃肠癌风险分数进行评估。可以通过如因特网的通信网络从诸如笔记本、台式计算机、智能电话、平板电脑和/或类似物的客户终端接收目标个体数据,其中包括血液检测结果集和受试者的人口统计学特性或可参考的目标数据。
首先,如图所示,由401和402部分提供分类器与目标个体数据。目标个体数据包括一个或多个人口统计参数和一组在目标日期内的多个当前血液检测结果,其包括一些目标个体的当前检测结果。目标个体的数据可以由用户手动输入,例如使用图形用户界面(GUI)。可由用户任意选择使用GUI和/或通过计算机辅助诊断(CAD)模块和/或系统提供的自动输入。任选地,目标个人数据,包括在去年、最近十年和/或任何中间段内使用者执行的血液检测结果集合数目。每一个血液检测结果集中包括从所述18种不同血液检测结果中选择的一组血液检测结果。
如图所示,在403中,从目标个体数据中提取一组目标个体特征集,并可任选地如上所述进行扩展。
然后,如图所示,在404中,使用分类对目标个体特征集的每个特征进行加权,从而计算处目标个体的胃肠癌风险分数。再从405输出胃肠癌风险分数。
但是应当注意,可用所述分类器评估癌症风险评分的胃肠癌可以是结肠、胃、直肠或食道癌症。例如,图9中表格为针对不同组群中结肠、胃、直肠、食道癌症在不同正例覆盖率的分类器性能。根据各自血液检测结果所在时间段的组合划分组群(以天为单位时,例如90-540、90-540、30-270和360-720天;年龄范围例如40-100和50-75)。应当指出的是,图4A和4B中记录了使用的分类器,图9中表格与之相比则表明了分类器在不同组群中的性能。图9中数据包括总数为81641名40岁以上英国个体的血检结果,其中诊断出3099名结肠癌、1286名直肠癌、578名胃癌和1061名食道癌患者。
据预计,自本申请至专利到期的生命周期中将开发处许多相关系统和方法本案中的术语处理器、显示器和用户界面旨在先验包括所有这样的新技术。
本文所用的术语“约”是指±10%。
术语“构成”、“由…构成”、“包括”、“包括”,“具有”和它们的同根词是指“包括但不限于”。该术语包括术语“由...组成”和“基本上由...组成”的条款。
“基本上由...组成”一词是指组合物或方法可包括另外的成分和/或步骤,但只有当另外的成分和/或步骤不实质上改变所要求保护的组合物或方法的基本和新颖特性。
如本文所使用的,单数形式“一”,“一个”和“该”包括复数引用,除非上下文另有明确说明。例如,术语“一种化合物”或“至少一种化合物”可以包括多种化合物,因此包括混合物。
词“示范性”在本文中用于表示“用作示例、实例或例证”。任何被描述为“示例性”实施例不一定被解释为优于或胜过其他实施例和/或排除来自其它实施例的特征结合。
词语“任选地”在本文中用于表示“在一些实施例中采用,而在其他实施例中不采用”。任何特定的本发明实施例可包括多个“可选的”特征,除非这些特征冲突。
在整个本申请中,以一系列形式呈现本发明的各种实施例。但应当理解,此系列形式的描述仅仅是为了方便和简洁,不应被解释为对本发明范围的硬性限制。因此,本系列描述应当被认为已经具体公开了所有可能的子范围以及该范围内的单个数值。例如,从1到6的范围描述应考虑到包括有具体公开的子范围如从1到3、从1到4、从1到5、从2到4、从2到6、从3到6等等,以及该范围内单个数值数,例如1、2、3、4、5和6。不论范围的宽度此规则均适用。
本文中标明的数值范围,是指包括在其标明范围内的任何引用数字(小数或整数)。短语在第一指示数字和第二指示数字的“范围/范围之间”以及第一指示数字“到”第二指示数字的“范围/从范围”在本文中可互换使用,并意指包括第一和第二指示数字以及其间的所有分数和整数数字。
可以理解,为了清楚起见,本发明的某些特征在单独实施例的上下文中进行描述,它们也可以在单个实施例中组合呈现。相反,为了简便起见,本发明的各种特征在单个实施例的上下文中进行描述,它们也可以单独地或以任何合适的子组合或在适用于本发明的任何其他实施例中得以呈现。在各种实施例上下文中描述的某些特征不应被认为是那些实施方案的必要特征,除非是该实施例没有这些元素就无法起作用。
虽然已结合了具体实施例对本发明进行了描述,但很明显,对于那些熟练的技术人员而言本案显然仍存在许多可替换、修改和变化之处。因此,以意在涵盖所有此类替换修改和变型为宗旨起草宽范围的所附权利要求。
在本说明书中提及的所有出版物、专利和专利申请以其整体作为参考在此引入到本说明书中,效果等同于将每个单独的出版物、专利或专利申请被具体地和单独地引入本文作为参考。此外,在本申请中引用或标识的任何参考不应被解释为承认这些参考是适用本发明的已有技术。使用标题中的范围不应该被解释为必要的限制。

Claims (33)

1.一种评估胃肠癌风险计算机化方法,包括:
生成一组特征集,所述特征集包括从目标个体采集的血液获得的多个当前血液检测结果;
提供至少一种分类器,所述分类器根据对多个样本个体的每个个体相应的多个历史血液检测结果的分析生成;和
使用处理器利用所述至少一种分类器对所述特征集进行分类,从而对所述目标个体的胃肠癌风险进行评估;
其中所述多个历史和当前的血液检测结果的每个包括:至少一种下述的血液检项:红细胞(RBC)、血红蛋白(HGB)、和血细胞比容(HCT);和至少一种下述的血液检测:血红蛋白(MCH)和红细胞平均血红蛋白浓度(MCHC)。
2.如权利要求1所述的方法,其特征在于:所述胃肠癌风险是选自结肠癌、胃癌、直肠癌和食道癌中的癌症。
3.如权利要求1所述的方法,其特征在于:所述的特征集包括所述目标个体的年龄;所述的至少一种分类器是根据多个样本个体的每一个个体的年龄进行分析生成。
4.如权利要求1所述的方法,其特征在于:所述的多个历史血液检测结果和当前血液检测结果均包括红细胞分布宽度(RDW)结果。
5.如权利要求1所述的方法,其特征在于所述的多个历史血液检测结果和当前血液检测结果均包括血小板压积(PCT)结果。
6.如权利要求1所述的方法,其特征在于:所述的多个历史血液检测结果和当前血液检测结果均包括平均细胞体积(MCV)结果。
7.如权利要求1所述的方法,其特征在于所述的多个历史血液检测结果和当前血液检测结果均包括HGB和HCT结果。
8.如权利要求1所述的方法,其特征在于:所述的多个历史血液检测结果和当前血液检测结果均包括中性粒细胞百分比/计数和淋巴细胞百分比/计数结果。
9.如权利要求1所述的方法,其特征在于:所述的多个历史血液检测结果和当前血液检测结果均包括MCV和MCH结果。
10.如权利要求1所述的方法,其特征在于:所述的多个历史血液检测结果和当前血液检测结果均包括RBC和HCT结果。
11.如权利要求1所述的方法,其特征在于:所述的多个历史血液检测结果和当前血液检测结果均包括RBC和MCV结果。
12.如权利要求1所述的方法,其特征在于每个所述的多个历史和当前血液检测结果均包括至少下述一项血液检测:白血球计数-WBC(CBC)、血小板平均体积(MPV)、平均细胞、血小板数(CBC)、嗜酸粒细胞计数、中性粒细胞百分比、单核细胞百分比、嗜酸粒细胞百分比、嗜碱粒细胞百分比、中性粒细胞计数和单核细胞计数。
13.如权利要求1所述的方法,其特征在于:所述的至少一个分类器包括由加权线性回归分类器、k最近邻(KNN)分类器和随机森林分类器所组成的组中的一个成员。
14.如权利要求1所述的方法,其特征在于:所述特征集包括所述目标个体的至少一种人口统计特性,和根据对所述多个样本个体的每个的所述至少一个人口学特性的各自分析而生成的至少一种分类器。
15.如权利要求1所述的方法,其特征在于进一步包括:从多个分类器中根据所述个体的至少一种人口统计特性来选择所述至少一个分类器;所述多个分类器中的每个均是根据样本个体各自的多个历史血液检测结果生成的,所述样本个体具有至少一种不同的人口统计特性。
16.如权利要求1所述的方法,其特征在于:所述的多个血液检测结果包括下述的多个血液检测结果中的至少一种结果:
生化血液检测结果可包括下述的血液检测结果中的任意种:白蛋白、钙、氯化物、胆固醇、肌酸酐、高密度脂蛋白(HDL)、低密度脂蛋白(LDL)、钾、钠、甘油三酯、尿素和/或尿酸等任意血液检测结果。
17.一种计算机可读介质,其包括用于执行权利要求1所述方法的计算机可执行指令。
18.一种胃肠癌评估系统包括:
处理器;
存储单元,其中保存有至少一个分类器,所述分类器根据多个样本个体的每个的多次历史血液检测结果分析而生成;
输入单元,其接收自目标个体的血液获取的多个当前血液检测结果;
胃肠癌评估模块,其利用所述处理器,通过使用至少一种分类器对由所述多个当前血液检测结果提取的特征集进行分类,评估目标个体的胃肠癌风险;
所述的多个历史和当前血液检测结果包括:下述多个血液检测中的至少一种:红细胞(RBC)、血红蛋白(HGB)、和血细胞比容(HCT);和下述血液检测的至少一种:血液检测血红蛋白(MCH)和红细胞平均血红蛋白浓度(MCHC)。
19.如权利要求18所述的胃肠癌评估系统,其特征在于:所述的多个历史血液检测结果和当前血液检测结果均包括红细胞分布宽度(RDW)结果。
20.如权利要求18所述的胃肠癌评估系统,其特征在于:所述的多个历史血液检测结果和当前血液检测结果均包括血小板压积(PCT)结果。
21.如权利要求18所述的胃肠癌评估系统,其特征在于:所述的多个历史血液检测结果和当前血液检测结果均包括平均细胞体积(MCV)结果。
22.用于胃肠癌风险评估的分类器生成方法,其包括:
提供多个样本个体的每个的多个历史血液检测结果;
生成具有多个特征集的数据集,每个特征集是根据所述多个样本个体的每个个体相应的多个历史血液检测结果生成的;
根据对所述数据集分析,生成至少一个分类器;和
输出所述至少一种分类器。
23.如权利要求22所述的方法,其特征在于:
所述生成包括:计算和将从相应的所述多个历史血液检测结果中提取的历史血液检测结果的至少一种操纵版本作为特征添加到相应的所述特征集中。
24.如权利要求22所述的方法,其特征在于:
所述生成包括:根据所述多个历史血液检测结果各自的日期,对每个所述特征集进行加权。
25.如权利要求22所述的方法,其特征在于:
所述生成包括:根据标准偏差最大阈值,对所述多个特征集进行筛选,以去除离群值。
26.如权利要求22所述的方法,其特征在于:
根据所述多个历史血液检测结果的日期,对所述多个特征集进行加权。
27.如权利要求22所述的方法,其特征在于:所述的多个血液检测结果包括下述血液检测的至少一种:红细胞(RBC)、血红蛋白(HGB)、和血细胞比容(HCT);和下述血液检测的至少一种:血红蛋白(MCH)和红细胞平均血红蛋白浓度(MCHC)。
28.如权利要求1所述的方法,其特征在于所述的多个历史血液检测结果和当前血液检测结果均包括红细胞分布宽度(RDW)结果。
29.如权利要求1所述的方法,其特征在于:所述的多个历史血液检测结果和当前血液检测结果均包括血小板压积(PCT)结果。
30.如权利要求1所述的方法,其特征在于其中每次所述的多个历史和当前血液检测结果中包括平均细胞体积(MCV)结果。
31.如权利要求22所述的方法,其特征在于:进一步包括将所述多个样本个体的每个的至少一种人口统计参数加入到相应的所述特征集中。
32.如权利要求31所述的方法,其特征在于:所述至少一个人口参数是性别、年龄、居住区域、种族和社会经济特征中的一个。
33.如权利要求31所述的方法,其特征在于:
所述生成包括:计算并将所述至少一种人口统计参数的至少一种操纵版本作为特征添加到相应的所述特征集中。
CN201380022626.6A 2012-05-03 2013-05-02 一种评价胃肠癌风险的系统 Active CN104271033B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261641979P 2012-05-03 2012-05-03
US61/641979 2012-05-03
PCT/IL2013/050368 WO2013164823A1 (en) 2012-05-03 2013-05-02 Methods and systems of evaluating a risk of a gastrointestinal cancer

Publications (2)

Publication Number Publication Date
CN104271033A true CN104271033A (zh) 2015-01-07
CN104271033B CN104271033B (zh) 2017-05-24

Family

ID=49514271

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380022626.6A Active CN104271033B (zh) 2012-05-03 2013-05-02 一种评价胃肠癌风险的系统

Country Status (14)

Country Link
US (3) US9474490B2 (zh)
EP (1) EP2844131B1 (zh)
JP (1) JP6267687B2 (zh)
KR (1) KR102094326B1 (zh)
CN (1) CN104271033B (zh)
AU (1) AU2013255401B2 (zh)
CA (1) CA2865892C (zh)
ES (1) ES2655184T3 (zh)
HK (1) HK1205448A1 (zh)
IN (1) IN2014MN01809A (zh)
MX (1) MX347850B (zh)
PL (1) PL2844131T3 (zh)
RU (1) RU2640568C2 (zh)
WO (1) WO2013164823A1 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104573410A (zh) * 2015-01-20 2015-04-29 合肥工业大学 基于分子子网与随机森林分类器的癌症化疗敏感性预测方法
CN106339569A (zh) * 2015-07-09 2017-01-18 深圳迈瑞生物医疗电子股份有限公司 判断样本检验结果异常的方法及装置
CN112735606A (zh) * 2021-01-22 2021-04-30 张厚德 结直肠癌风险预测方法、设备及存储介质
CN112908470A (zh) * 2021-02-08 2021-06-04 深圳市人民医院 一种基于rna结合蛋白基因的肝细胞癌预后评分系统及其应用
CN112986446A (zh) * 2021-04-19 2021-06-18 生态环境部华南环境科学研究所 禽蛋类产品中有机磷酸酯及代谢物的同步检测方法及应用
TWI763215B (zh) * 2020-12-29 2022-05-01 財團法人國家衛生研究院 篩選用於預測生理狀態的特徵的電子裝置和方法
CN115620909A (zh) * 2022-11-04 2023-01-17 内蒙古卫数数据科技有限公司 一种基于全血细胞计数融合指标hbi的癌症风险评估系统
CN117524464A (zh) * 2024-01-04 2024-02-06 北京和兴创联健康科技有限公司 一种基于大数据的计算手术后目标血红蛋白的方法及系统

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX347850B (es) 2012-05-03 2017-05-16 Medial Res Ltd Métodos y sistemas para evaluar un riesgo de un cáncer gastrointestinal.
US10614287B2 (en) 2014-06-16 2020-04-07 Siemens Healthcare Diagnostics Inc. Virtual staining of cells in digital holographic microscopy images using general adversarial networks
WO2015195609A1 (en) * 2014-06-16 2015-12-23 Siemens Healthcare Diagnostics Inc. Analyzing digital holographic microscopy data for hematology applications
US20160110516A1 (en) * 2014-10-20 2016-04-21 Liwei Ma Dynamic monitoring early cancer risk
CN104615894B (zh) * 2015-02-13 2018-09-28 上海中医药大学 一种基于k近邻标签特定权重特征的中医诊断系统
US10332638B2 (en) 2015-07-17 2019-06-25 Massachusetts Institute Of Technology Methods and systems for pre-symptomatic detection of exposure to an agent
JP6100867B1 (ja) * 2015-11-06 2017-03-22 振武 曽 免疫状態の分析のための検査方法
CN109074420B (zh) * 2016-05-12 2022-03-08 豪夫迈·罗氏有限公司 用于预测靶向药物治疗疾病的效果的系统
US20180000428A1 (en) * 2016-05-18 2018-01-04 Massachusetts Institute Of Technology Methods and Systems for Pre-Symptomatic Detection of Exposure to an Agent
KR101747783B1 (ko) * 2016-11-09 2017-06-15 (주) 바이오인프라생명과학 특정 항목이 속하는 클래스를 예측하기 위한 2-클래스 분류 방법 및 이를 이용하는 컴퓨팅 장치
US20170140115A1 (en) * 2017-01-24 2017-05-18 Liwei Ma Intelligent stroke risk prediction and monitoring system
US20170147768A1 (en) * 2017-02-06 2017-05-25 Liwei Ma System and method for detecting and monitoring acute myocardial infarction risk
WO2020037248A1 (en) * 2018-08-17 2020-02-20 The Regents Of The University Of California Diagnosing hypoadrenocorticism from hematologic and serum chemistry parameters using machine learning algorithm
CN109670526A (zh) * 2018-11-09 2019-04-23 全球能源互联网研究院有限公司 一种电网的干扰源类型辨识方法、装置、设备及存储介质
CN113614537A (zh) * 2019-03-28 2021-11-05 豪夫迈·罗氏有限公司 癌症预后
US20210299339A1 (en) * 2020-03-31 2021-09-30 Fresenius Medical Care Holdings, Inc. Blood monitoring system for determining a calibrated hemoglobin concentration value for a patient based on patient-specific mean corpuscular hemoglobin concentration data
GB202109560D0 (en) * 2021-07-01 2021-08-18 Chancellor Masters And Scholars Of The Univ Of Cambridge Anomaly detection based on complete blood counts
WO2023147472A1 (en) * 2022-01-28 2023-08-03 Freenome Holdings, Inc. Methods and systems for risk stratification of colorectal cancer

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5692220A (en) * 1993-09-02 1997-11-25 Coulter Corporation Decision support system and method for diagnosis consultation in laboratory hematopathology
CN1268033A (zh) * 1997-02-14 2000-09-27 拜奥马尔国际公司 用来预测未来健康的系统
CN1682111A (zh) * 2001-06-15 2005-10-12 A&G药品公司 诊断致瘤力以及确定对抗癌疗法的抗性
CN1681607A (zh) * 2002-08-28 2005-10-12 分离技术公司 用于超声确定红血球指数的方法和设备
US20090069639A1 (en) * 2007-07-31 2009-03-12 Sysmex Corporation Diagnosis assisting system, diagnosis assisting information providing device and computer program product
US20100009401A1 (en) * 2006-12-21 2010-01-14 Ajinomoto Co., Inc. Method of evaluating colorectal cancer, colorectal cancer-evaluating apparatus, colorectal cancer-evaluating method, colorectal cancer-evaluating system, colorectal cancer-evaluating program and recording medium

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040122703A1 (en) * 2002-12-19 2004-06-24 Walker Matthew J. Medical data operating model development system and method
US7951078B2 (en) 2005-02-03 2011-05-31 Maren Theresa Scheuner Method and apparatus for determining familial risk of disease
US9075062B2 (en) 2005-03-22 2015-07-07 The United States Of America, As Represented By The Secretary, Department Of Health & Human Services Identification of biomarkers by serum protein profiling
WO2007016367A2 (en) * 2005-07-29 2007-02-08 Bayer Healthcare Llc Neoplastic disease-related methods, kits, systems and databases
US8512240B1 (en) * 2007-11-14 2013-08-20 Medasense Biometrics Ltd. System and method for pain monitoring using a multidimensional analysis of physiological signals
US20100076787A1 (en) * 2008-09-11 2010-03-25 Stephen Naylor Method for preparing a medical data report
WO2010028658A1 (en) 2008-09-15 2010-03-18 Herlev Hospital, Region Hovedstaden Ykl-40 as a marker for gastrointestinal cancers
AU2009308500A1 (en) 2008-10-21 2010-04-29 PeraHealth, Inc Methods of assessing risk based on medical data and uses thereof
EP2350320A4 (en) 2008-11-12 2012-11-14 Caris Life Sciences Luxembourg Holdings METHODS AND SYSTEMS FOR USING EXOSOMES TO DETERMINE PHENOTYPES
WO2011060098A1 (en) * 2009-11-10 2011-05-19 Prometheus Laboratories Inc. Methods for predicting post-surgery risk associated with ileal pouch-anal anastomosis
CA2781549A1 (en) * 2009-11-23 2011-05-26 Children's Medical Center Corporation Normalization of platelet biomarkers
MX347850B (es) 2012-05-03 2017-05-16 Medial Res Ltd Métodos y sistemas para evaluar un riesgo de un cáncer gastrointestinal.

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5692220A (en) * 1993-09-02 1997-11-25 Coulter Corporation Decision support system and method for diagnosis consultation in laboratory hematopathology
CN1268033A (zh) * 1997-02-14 2000-09-27 拜奥马尔国际公司 用来预测未来健康的系统
CN1682111A (zh) * 2001-06-15 2005-10-12 A&G药品公司 诊断致瘤力以及确定对抗癌疗法的抗性
CN1681607A (zh) * 2002-08-28 2005-10-12 分离技术公司 用于超声确定红血球指数的方法和设备
US20100009401A1 (en) * 2006-12-21 2010-01-14 Ajinomoto Co., Inc. Method of evaluating colorectal cancer, colorectal cancer-evaluating apparatus, colorectal cancer-evaluating method, colorectal cancer-evaluating system, colorectal cancer-evaluating program and recording medium
US20090069639A1 (en) * 2007-07-31 2009-03-12 Sysmex Corporation Diagnosis assisting system, diagnosis assisting information providing device and computer program product

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104573410A (zh) * 2015-01-20 2015-04-29 合肥工业大学 基于分子子网与随机森林分类器的癌症化疗敏感性预测方法
CN106339569A (zh) * 2015-07-09 2017-01-18 深圳迈瑞生物医疗电子股份有限公司 判断样本检验结果异常的方法及装置
TWI763215B (zh) * 2020-12-29 2022-05-01 財團法人國家衛生研究院 篩選用於預測生理狀態的特徵的電子裝置和方法
CN112735606A (zh) * 2021-01-22 2021-04-30 张厚德 结直肠癌风险预测方法、设备及存储介质
CN112735606B (zh) * 2021-01-22 2023-04-25 张厚德 结直肠癌风险预测方法、设备及存储介质
CN112908470A (zh) * 2021-02-08 2021-06-04 深圳市人民医院 一种基于rna结合蛋白基因的肝细胞癌预后评分系统及其应用
CN112908470B (zh) * 2021-02-08 2023-10-03 深圳市人民医院 一种基于rna结合蛋白基因的肝细胞癌预后评分系统及其应用
CN112986446A (zh) * 2021-04-19 2021-06-18 生态环境部华南环境科学研究所 禽蛋类产品中有机磷酸酯及代谢物的同步检测方法及应用
CN115620909A (zh) * 2022-11-04 2023-01-17 内蒙古卫数数据科技有限公司 一种基于全血细胞计数融合指标hbi的癌症风险评估系统
CN117524464A (zh) * 2024-01-04 2024-02-06 北京和兴创联健康科技有限公司 一种基于大数据的计算手术后目标血红蛋白的方法及系统
CN117524464B (zh) * 2024-01-04 2024-04-05 北京和兴创联健康科技有限公司 一种基于大数据的计算手术后目标血红蛋白的方法及系统

Also Published As

Publication number Publication date
JP2015517653A (ja) 2015-06-22
PL2844131T3 (pl) 2018-03-30
CA2865892A1 (en) 2013-11-07
US20140235956A1 (en) 2014-08-21
AU2013255401B2 (en) 2017-02-23
EP2844131A4 (en) 2015-11-18
US11651189B2 (en) 2023-05-16
KR20150005909A (ko) 2015-01-15
RU2014140114A (ru) 2016-06-20
EP2844131A1 (en) 2015-03-11
MX2014011202A (es) 2014-11-21
CN104271033B (zh) 2017-05-24
RU2640568C2 (ru) 2018-01-09
EP2844131B1 (en) 2017-10-11
JP6267687B2 (ja) 2018-01-24
US9474490B2 (en) 2016-10-25
IN2014MN01809A (zh) 2015-07-03
WO2013164823A1 (en) 2013-11-07
HK1205448A1 (zh) 2015-12-18
AU2013255401A1 (en) 2014-09-18
CA2865892C (en) 2021-08-24
KR102094326B1 (ko) 2020-03-30
US20200050917A1 (en) 2020-02-13
US10452970B2 (en) 2019-10-22
MX347850B (es) 2017-05-16
ES2655184T3 (es) 2018-02-19
US20170039334A1 (en) 2017-02-09

Similar Documents

Publication Publication Date Title
CN104271033A (zh) 一种评价胃肠癌风险的方法和系统
Faraggi Adjusting receiver operating characteristic curves and related indices for covariates
US20130060775A1 (en) Spanning-tree progression analysis of density-normalized events (spade)
CN105814571A (zh) 评估肺癌风险的方法及系统
Moosmann et al. Age‐and sex‐specific pediatric reference intervals for neutrophil‐to‐lymphocyte ratio, lymphocyte‐to‐monocyte ratio, and platelet‐to‐lymphocyte ratio
McGregor et al. MDiNE: a model to estimate differential co-occurrence networks in microbiome studies
Inácio de Carvalho et al. Nonparametric Bayesian covariate-adjusted estimation of the Youden index
Li et al. Interval-censored data with repeated measurements and a cured subgroup
Chen et al. A hybrid model for combining case–control and cohort studies in systematic reviews of diagnostic tests
Pavlov et al. Reference interval computation: which method (not) to choose?
Aktas et al. Deep convolutional neural networks for detection of abnormalities in chest X-rays trained on the very large dataset
Pfeiffer Extensions of criteria for evaluating risk prediction models for public health applications
Nashwan et al. Using artificial intelligence to improve body iron quantification: A scoping review
Wang et al. Bivariate marker measurements and ROC analysis
Li et al. Multi-category diagnostic accuracy based on logistic regression
Pfeiffer et al. Combining assays for estimating prevalence of human herpesvirus 8 infection using multivariate mixture models
CN113096815A (zh) 一种基于logistic回归的慢性肾病预测方法
Loo et al. Strategy for improved characterization of human metabolic phenotypes using a COmbined Multi-block Principal components Analysis with Statistical Spectroscopy (COMPASS)
Chen et al. A Machine Learning Based Method to Identify Differentially Expressed Genes
Debon et al. Multipopulation mortality analysis: bringing out the unobservable with latent clustering
CA3223948A1 (en) Anomaly detection based on complete blood counts using machine learning
CA3193886A1 (en) System and method for generating augmented complete blood count reports
WO2023105249A1 (en) Automatic assessment of histological indices
Chen Assessing inter-rater agreement for compositional data
Nyangoma Package ‘clippda’

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1205448

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1205448

Country of ref document: HK