CN105814571B - 肺癌评估系统及计算机可读介质 - Google Patents

肺癌评估系统及计算机可读介质 Download PDF

Info

Publication number
CN105814571B
CN105814571B CN201480067921.8A CN201480067921A CN105814571B CN 105814571 B CN105814571 B CN 105814571B CN 201480067921 A CN201480067921 A CN 201480067921A CN 105814571 B CN105814571 B CN 105814571B
Authority
CN
China
Prior art keywords
lung cancer
test results
count
blood test
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201480067921.8A
Other languages
English (en)
Other versions
CN105814571A (zh
Inventor
尼尔·卡尔克施泰因
亚龙·基纳
瓦尔达·沙莱夫
加夫列尔·霍迪克
英巴尔·戈尔德施泰因
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MEDIAL RES Ltd
Original Assignee
MEDIAL RES Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MEDIAL RES Ltd filed Critical MEDIAL RES Ltd
Publication of CN105814571A publication Critical patent/CN105814571A/zh
Application granted granted Critical
Publication of CN105814571B publication Critical patent/CN105814571B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/08Detecting, measuring or recording devices for evaluating the respiratory organs
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/145Measuring characteristics of blood in vivo, e.g. gas concentration, pH value; Measuring characteristics of body fluids or tissues, e.g. interstitial fluid, cerebral tissue
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/145Measuring characteristics of blood in vivo, e.g. gas concentration, pH value; Measuring characteristics of body fluids or tissues, e.g. interstitial fluid, cerebral tissue
    • A61B5/14532Measuring characteristics of blood in vivo, e.g. gas concentration, pH value; Measuring characteristics of body fluids or tissues, e.g. interstitial fluid, cerebral tissue for measuring glucose, e.g. by tissue impedance measurement
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/145Measuring characteristics of blood in vivo, e.g. gas concentration, pH value; Measuring characteristics of body fluids or tissues, e.g. interstitial fluid, cerebral tissue
    • A61B5/14542Measuring characteristics of blood in vivo, e.g. gas concentration, pH value; Measuring characteristics of body fluids or tissues, e.g. interstitial fluid, cerebral tissue for measuring blood gases
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/145Measuring characteristics of blood in vivo, e.g. gas concentration, pH value; Measuring characteristics of body fluids or tissues, e.g. interstitial fluid, cerebral tissue
    • A61B5/1455Measuring characteristics of blood in vivo, e.g. gas concentration, pH value; Measuring characteristics of body fluids or tissues, e.g. interstitial fluid, cerebral tissue using optical sensors, e.g. spectral photometrical oximeters
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/48Other medical applications
    • A61B5/4842Monitoring progression or stage of a disease
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • G01N33/487Physical analysis of biological material of liquid biological material
    • G01N33/49Blood
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Optics & Photonics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Hematology (AREA)
  • Emergency Medicine (AREA)
  • Pulmonology (AREA)
  • Ecology (AREA)
  • Urology & Nephrology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Biochemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)

Abstract

一种评估肺癌风险的方法是通过下述达成:产生一特征组,所述特征组包括从一目标个体采集的一血液所获得的多个当前血液检测结果;提供至少一种分类器,所述分类器是根据对另外的多个样本个体中的每一个的多个各自的历史血液检测结果的一分析而产生的;及通过利用所述至少一种分类器对所述特征组进行分类,以使用一处理器来评估所述目标个体的一肺癌风险。所述多个历史与当前血液检测结果中的每一个包括:一或更多个选定的血液检测的多个结果,例如多个白血球血液检测结果;多个生化检测结果;多个血小板血液检测结果,包含血小板计数及平均血小板体积(MPV)中的至少一个;及/或抽烟历史及多个红细胞检测结果的一组合。

Description

肺癌评估系统及计算机可读介质
技术领域
在本发明的一些实施例中是有关于癌症诊断,及更具体但不排除的,是有关于评估一癌症风险的多个方法及多个系统。
背景技术
肺癌是全世界癌症死亡的首要原因。此外,肺癌具有所有癌症的最低生存结果之一,因为超过三分之二的病患在不可能进行根治性治疗的一后期阶段时被诊断出。一种有效的肺癌筛查将导致较早检测所述疾病(在病患具有症状之前及治疗时更可能是有效的),并会降低死亡率。目前,大多数的肺癌病例被临床诊断出是当多个病患出现多个症状时(例如咳嗽、胸痛、体重减轻);不幸的,具有这些症状的多个病患通常具有晚期的癌症。
直到最近,在全世界很少的实行肺癌筛查项目,及通过胸部X线片而零星的发生肺癌的早期检查。多个近期研究指出低剂量计算机断层扫描(Low Dose ComputedTomography;LDCT)可以用来筛查处于肺癌高风险的多个病患。所述全国肺癌筛查试验(National Lung Screening Trial;NLST)比较用于处于肺癌高风险的53454个病患的所述LDCT及胸部X线片的使用。所述研究表明相比较于胸部X线片筛查,使用LDCT降低20%来自肺癌的死亡率。在所述NLST及额外支持的多个研究之后,肺癌筛查新指南被发放来推荐基于肺癌筛查项目的LDCT的实行。
虽然被推荐,使用LDCT的肺癌筛查具有多个承受的风险:(A)高度假阳性结果,导致不需要的检测及多个侵入性手术、增加成本及由于精神上的痛苦而减少生活品质;(B)假阴性结果,可能延缓或阻止诊断及治疗;(C)无法检测小侵略性的肿瘤;(D)过度诊断;(E)辐射暴露。因此,有很大的需求以准确地识别所述多个高风险个体,并且从较低风险的多个个体防止潜在的危害。为此,肺癌筛查指南建议用在确定哪些患者在高风险的标准。这些标准是基于年龄、抽烟历史及额外风险因子的一组合。不幸的,这些标准无法准确识别在可治疗癌症阶段的病人。事实上,所述NLST的结果指出,为了避免一人死于肺癌(在美国),必须使用LDCT筛查320个高风险个体。这样相对低的比率的意义应当被研究以确定是否带来的多个好处是比这个筛选过程的危害更大。总体而言,有很大的需求以开发识别(在所述预筛阶段)处于肺癌高风险的多个病患的一模型,及通过只筛查具备有高机率癌症的多个个体来达成一有效且最小风险的筛查项目。
发明内容
根据本发明一些实施例,有提供一种肺癌评估系统。所述肺癌评估系统包括:一处理器;一存储单元,存储至少一种分类器,所述至少一种分类器是根据对另外的多个样本个体的每一个的多个历史血液检测结果的一分析而产生的;一输入单元,接收一目标个体的一血液的多个当前血液检测结果;及一肺癌评估模块,通过利用所述至少一种分类器对从所述多个当前血液检测结果撷取出的一特征组进行分类,以使用所述处理器来评估所述目标个体的一肺癌风险。所述多个历史与当前血液检测结果中的每一个包括至少一种下述血液检测的多个结果:多个白血球血液检测结果,包含:嗜中性粒细胞计数、嗜碱性粒细胞计数、嗜酸性粒细胞计数、淋巴细胞计数、单核细胞计数、白血球计数、中性粒细胞百分比、嗜碱性粒细胞百分率、嗜酸性粒细胞百分比、淋巴细胞百分比、及单核细胞百分比中的至少一个,其中所述特征组包括所述目标个体的所述血液的多个历史血液结果;多个生化检测结果;多个血小板血液检测结果,包含血小板计数及平均血小板体积(MPV)中的至少一个;及抽烟历史及多个红细胞检测结果的一组合,所述多个红细胞检测结果包含红细胞(RBC)、红细胞分布宽度(RDW)、平均细胞血红蛋白(MCH)、平均细胞体积(MCV)、红细胞平均血红蛋白浓度(MCHC)、血细胞比容及血红蛋白中的至少一个。
任选的,所述多个生化检测结果是选自于由红细胞沉降率(ESR)、葡萄糖、尿素、血中尿素氮(BUN)、肌酸酐、钠、钾、氯、钙、磷、尿酸、总胆红素、乳酸脱氢酶(LDH)、谷草转氨酶(GOT)、血清谷草转氨酶(SGOT)、谷氨酸草酰乙酸、天冬氨酸转氨酶(AST)、谷草转氨酶、谷氨酸丙酮酸转氨酶(GPT)、血清谷氨酸丙酮酸转氨酶(SGPT)、谷丙转氨酶(ALT)、碱性磷酸脢(Alk Phos/ALP)、γ-谷氨酰转肽酶(GGT)、白蛋白、肌酸激酶(CK)、铁、HbA1、B12、维生素D、G-6-PD、锂、叶酸、C反应蛋白(CRP)、低密度脂蛋白(LDL)、高密度脂蛋白(HDL)、甘油三酸酯、总胆固醇、淀粉酶、凝血酶原时间(PT)、部分凝血酶原时间(PTT)、活化部分凝血酶原时间(APPT)、国际标准化比值(INR)、纤维蛋白原、三磷酸胞苷(CPT)、铁蛋白、肾小球滤过率(GFR)、转铁蛋白、总铁结合能力(TIBC)及不饱和铁结合能力(UIBC)所组成的一群组。
任选的,所述至少一种分类器是根据一组合来产生,所述组合包含所述多个历史与当前血液检测结果及所述多个样本个体中的每一个的至少一人口参数。
更任选的,所述至少一人口参数是由性别、年龄、居住区域、种族及社会经济特征所组成的一族群中的一组成要素。
任选的,所述多个历史与当前血液检测结果中的每一个包括:多个白血球血液检测结果的多个结果,所述多个白血球血液检测结果包含:嗜中性粒细胞计数、嗜碱性粒细胞计数、嗜酸性粒细胞计数、淋巴细胞计数、单核细胞计数、白血球计数、中性粒细胞百分比、嗜碱性粒细胞百分率、嗜酸性粒细胞百分比、淋巴细胞百分比及单核细胞百分比中的至少一个。
更任选的,所述多个历史与当前血液检测结果中的每一个包括:抽烟历史。
任选的,所述多个历史与当前血液检测结果中的每一个包括:包含血小板计数及MPV中的至少一个的多个血小板血液检测结果。
更任选的,所述多个历史与当前血液检测结果中的每一个包括:抽烟历史。
任选的,所述多个历史与当前血液检测结果中的每一个包括:抽烟历史及多个红细胞检测结果的所述组合,所述多个红细胞检测结果包含RBC、RDW、MCH、MCV、MCHC、血细胞比容及血红蛋白中的至少一个。
任选的,所述多个历史与当前血液检测结果中的每一个包括:中性粒细胞百分比/计数及淋巴细胞百分比/计数的多个结果。
任选的,所述至少一种分类器包括:由一加权线性回归分类器、一K最近邻(K-Nearest neighbors;KNN)分类器及一随机森林(random forest)分类器所组成的一族群中的一组成要素。
任选的,所述多个历史与当前血液检测结果中的每一个包括:血小板血细胞比容(Platelets hematocrit;PCT)的多个结果。
任选的,所述多个历史与当前血液检测结果中的每一个包括:HGB及HCT的多个结果。
任选的,所述特征组包括所述目标个体的一年龄;其中所述至少一种分类器是根据另外的多个样本个体中的每一个的所述年龄的一分析而产生的。
任选的,所述多个历史与当前血液检测结果中的每一个包括下列多个血液检测中的至少一个:嗜酸性粒细胞计数;中性粒细胞百分比;单核细胞百分比;嗜酸性粒细胞百分比;嗜碱性粒细胞百分比;和中性粒细胞计数;及单核细胞计数。
任选的,所述特征组包括所述目标个体的一年龄;其中所述至少一种分类器是根据另外的多个样本个体中的每一个的所述年龄的一分析而产生的。
任选的,所述多个历史与当前血液检测结果中的每一个包括:红细胞分布宽度(RDW)的多个结果。
任选的,所述多个历史与当前血液检测结果中的每一个包括:多个生化检测结果,是选自于由红细胞沉降率(ESR)、葡萄糖、尿素、血中尿素氮(BUN)、肌酸酐、钠、钾、氯、钙、磷、尿酸、总胆红素、乳酸脱氢酶(LDH)、谷草转氨酶(GOT)、血清谷草转氨酶(SGOT)、谷氨酸草酰乙酸、天冬氨酸转氨酶(AST)、谷草转氨酶、谷氨酸丙酮酸转氨酶(GPT)、血清谷氨酸丙酮酸转氨酶(SGPT)、谷丙转氨酶(ALT)、碱性磷酸脢(Alk Phos/ALP)、γ-谷氨酰转肽酶(GGT)、白蛋白、肌酸激酶(CK)、铁、HbA1、B12、维生素D、G-6-PD、锂、叶酸、C反应蛋白(CRP)、低密度脂蛋白(LDL)、高密度脂蛋白(HDL)、甘油三酸酯、总胆固醇、淀粉酶、凝血酶原时间(PT)、部分凝血酶原时间(PTT)、活化部分凝血酶原时间(APPT)、国际标准化比值(INR)、纤维蛋白原、三磷酸胞苷(CPT)、铁蛋白、肾小球滤过率(GFR)、转铁蛋白、总铁结合能力(TIBC)及不饱和铁结合能力(UIBC)。
任选的,所述多个历史与当前血液检测结果中的每一个包括:血小板血细胞比容(PCT)的多个结果。
任选的,所述多个历史与当前血液检测结果中的每一个包括:平均细胞体积(MCV)的多个结果。
任选的,所述多个历史与当前血液检测结果中的每一个包括至少一种下述血液检测的多个结果:白血球计数-WBC(CBC);平均血小板体积(MPV);平均细胞;血小板计数(CBC);嗜酸性粒细胞计数;中性粒细胞百分比;单核细胞百分比;嗜酸性粒细胞百分比;嗜碱性粒细胞百分比;及中性粒细胞计数;单核细胞计数。
任选的,所述至少一种分类器包括:由一加权线性回归分类器、一K最近邻(KNN)分类器、一梯度提升机(GBM)分类器及一随机森林分类器所组成的一族群中的一组成要素。
任选的,所述特征组包括所述目标个体的至少一人口特性及所述至少一种分类器,所述至少一种分类器是根据所述多个样本个体的每一个中的各自的所述至少一人口特性的一分析而产生的。
任选的,所述方法还包括:根据来自多个分类器的所述个体的至少一人口特性,选择所述至少一种分类器,所述多个分类器中的每一个是根据多个样本个体的多个各自的历史血液检测结果而产生的,所述多个样本个体具有至少一种不同的人口特性。
任选的,所述多个血液检测结果包括来自下列多个血液检测的至少一结果:多个生化检测结果可包含下列多个血液检测结果中的任一个:白蛋白、钙、氯、胆固醇、肌酐、高密度脂蛋白(HDL)、低密度脂蛋白(LDL)、钾、钠、甘油三酸酯、尿素及/或尿酸。
根据本发明一些实施例,有提供一种产生用于一肺癌风险评估的一分类器的方法。所述方法包括:提供另外的多个样本个体的每一个的多个历史血液检测结果;产生具有多个特征组的一数据集,每一特征组是根据另外的所述多个样本个体的各自的多个历史血液检测结果而产生的;根据所述数据集的一分析来产生用在一肺癌风险评估的至少一种分类器;及输出所述至少一种分类器。
任选的,所述产生包括:计算及加入一历史血液检测的至少一操作版本,所述历史血液检测是从一各自的所述多个历史血液检测结果来当作相对于各自的所述特征组的一特征。
任选的,所述产生包括:根据所述各自的多个历史血液检测结果的一日期来加权所述特征组中的每一个。
任选的,所述产生包括:根据一标准偏差最大阈值来过滤所述多个特征组,以移除多个异常值。
任选的,根据所述各自的多个历史血液检测结果的一日期来加权所述多个特征组中的每一个。
任选的,下列多个血液检测中的至少一个的所述多个血液检测结果:红细胞(RBC)、血红蛋白(HGB)及血细胞比容(HCT),及下列多个平均细胞血红蛋白(MCH)及红细胞平均血红蛋白浓度(MCHC)中的至少一结果。
任选的,所述多个历史与当前血液检测结果中的每一个包括红细胞分布宽度(RDW)的多个结果。
任选的,所述多个历史与当前血液检测结果中的每一个包括:血小板血细胞比容(PCT)的多个结果。
任选的,所述多个历史与当前血液检测结果中的每一个包括:平均细胞体积(MCV)。
更任选的,所述方法还包括:将所述多个样本个体的每一个中的至少一人口参数加入到一各自的所述特征组。
更任选的,所述至少一人口参数是由性别、年龄、居住区域、种族及社会经济特征所组成的一族群中的一组成要素。
更任选的,所述产生包括:计算及加入所述至少一人口参数的至少一操作版本,所述至少一人口参数当作相对于各自的所述特征组的一特征。
除非另有定义,本文所用的所有技术及/或科学术语具有本发明涉及领域普通技术人员通常理解的相同含义。虽然在本发明实施例的实践或测试中可以使用本文描述的方法及类似或等同的材料,但下文仍对示例性方法及/或材料进行说明。在冲突的情况下,以本专利中的说明书及定义为准。此外,材料、方法及实施例仅是说明性的,而不是要进行必要的限制。
本发明实施例方法及/或系统的实现可涉及由手动、自动或它们的组合来执行或完成选择的任务。另外,根据本发明方法及/或系统实施例的实际仪器设备,若干所选择的任务可以由硬件、软件、固件或使用操作系统对它们的组合来实现。
例如,用于执行本发明实施例所选择任务的硬件可以是芯片或电路。至于软件,本发明实施例所选择的任务可以通过使用任何适当操作系统计算机执行的多个软件指令而实现。在一个示例性的本发明实施例中,一个或多个根据本文描述示例性方法及/或系统实施例描述的任务由一个数据处理器(如执行多个指令的计算平台)执行。任选的,数据处理器包括用于存储指令及/或数据的易失性存储器及/或例如磁性硬盘及/或可移动介质的非易失性存储器。任选的,也可使用网络连接。任选的,也可使用显示器及/或如键盘或鼠标的用户输入设备。
附图说明
本发明的一些实施例仅通过举例的方式并参照所附附图在此描述。现在具体参照附图详细的说,要强调的是所绘示的细节是通过举例的方式和为了本发明的多个实施例的说明性讨论的目的。在这方面上,结合所述多个附图的描述对于本领域技术人员如何可以实施本发明实施例变得明显。
在附图中:
图1是根据本发明一些实施例的产生用于根据多个个体记录的一分析进行一肺癌风险评分的估计的一或更多个分类器的一方法的一流程图;及
图2是根据本发明一些实施例的用于产生一或更多个分类器的一系统的一示意性说明,以实现图1中描绘的所述方法为例。
具体实施方式
根据本发明一些实施例,有提供评估肺癌风险的多个方法及多个系统,通过利用一或更多个分类器来分类一目标个体的多个当前血液检测结果组,所述一或更多个分类器是根据多个个体的多个历史血液检测结果的一分析而产生的。
现请参照图1,是根据本发明一些实施例的产生用于根据多个诊断个体的多个历史检测结果的一分析进行一肺癌风险评分的估计的一或更多个分类器的一方法100的一流程图。
也参照图2,是根据本发明一些实施例的用于产生用在估计肺癌风险评分的(多个)分类器的一系统200的一示意性说明,以实现图1中描绘的所述方法为例。
所述系统200包含一或更多个医药记录数据库201及/或连接到一医药记录数据库接口。所述(多个)数据库201包含多个个体记录,也被称为多个个体样本,是对于另外的多个样本个体中的每一个描述:每个另外的个体的多个历史检测结果中的一或更多个组;及任选的一或更多个人口参数及一肺癌诊断。所述多个历史检测结果组;(多个)人口参数,例如年龄;及/或肺癌预后(prognosis)可被存储在一普通的样本记录及/或从多个独立及/或相连的数据库收集。任选的,所述肺癌预后是根据一癌症登记记录的一种二进制指示组。所述不同的检测结果可能是多个常见实行的血液检测、多个生化检测及/或在相同周期的期间进行的多个血液检测。任选的,一些历史检测结果组具有遗失的血液检测结果。这些结果可任选的通过其他个体的所获得的多个血液检测结果的加权平均来完成。所述方法还包含一处理器204、一分类器产生模块205及一接口单元206,例如一网络接口。
如在本文中所使用,一人口参数包含年龄、性别、种族、体重、国籍、住所的地理区域及/或类似参数。
首先,如在101处所绘示,提供多个个体样本的一或更多个数据组。
任选的,如在102处所绘示,根据匹配标准进行所述多个个体样本的筛查及/或选择。例如所述多个样本记录是在30岁或以上的多个个体,是出现在具有肺癌的一癌症登记中,及任选的没有其他类型的癌症;或没有出现在所述癌症登记中。任选的,仅当在一各自的个体登记在所述癌症登记中之前的一定期间内,所述多个历史检测结果的最近组,他们文件被采用时,采用出现在所述癌症登记的多个个体的多个样本记录,例如在一目前日期之前的至少30天及最多2年的一期间内。任选的,仅当多个个体的样本记录包含创造对于阳性及阴性肺癌人群是一等时分布(血液检测时机)的一多个历史检测结果组时,采用未出现在所述癌症登记中的多个个体的样本记录。对所述阳性及阴性样本进行所述等时分布的所述过程也导致忽略至少一些阴性(未登记)样本及导致在所述数据组内的所述肺癌发病率的一改变。
现在,如103处所绘示,根据从多个样本记录撷取的所述样本数据所产生的例如一矩阵的一推导数据组,例如通过分类器产生模块205。所述推导数据组包含多个特征组、任选的被消耗。每个特征组是从所述筛查的及/或任选的多个样本记录中的每一个而产生的。所述特征组任选的是多个未处理的特征,包含实际的血液检测及/或多个人口特性值。
每个样本记录包含一个体的多个历史检测结果中的一或更多组,每个包含血液检测结果及/或生化检测结果的一组合,例如一组合是超过10、15、20及/或任意中间数目的血液检测结果或更少。在一范例中,每个撷取的未处理特征组包含至少以下18个血液检测结果:红细胞(RBC);白血球计数-WBC(CBC);平均血小板体积(MPV);血红蛋白(HGB);血细胞比容(HCT);平均细胞体积(MCV);平均细胞血红蛋白(MCH);红细胞平均血红蛋白浓度(MCHC);红细胞分布宽度(RDW);血小板计数(CBC);嗜酸性粒细胞计数;嗜中性粒细胞百分比;单核细胞百分比;嗜酸性粒细胞百分比;嗜碱性粒细胞百分比;嗜中性粒细胞计数;单核细胞计数;及血小板血细胞比容(PCT)。任选的,这个被撷取的未处理特征组还包含下述的多个血液检测中的一或更多个:RDW、血小板及MCV。这个被撷取的未处理特征组还可包含下述的多个血液检测中的一或更多个:白血球计数、嗜酸性粒细胞计数、嗜中性粒细胞百分比及/或计数、嗜碱性粒细胞百分比及/或计数、及单核细胞百分比及/或计数。
所述多个当前血液检测结果组包含下述多个生化检测结果中的一些或更多个:红细胞沉降率(ESR)、葡萄糖、尿素、血中尿素氮(BUN)、肌酸酐、钠、钾、氯、钙、磷、尿酸、总胆红素、乳酸脱氢酶(LDH)、谷草转氨酶(GOT)、血清谷草转氨酶(SGOT)、谷氨酸草酰乙酸、天冬氨酸转氨酶(AST)、谷草转氨酶、谷氨酸丙酮酸转氨酶(GPT)、血清谷氨酸丙酮酸转氨酶(SGPT)、谷丙转氨酶(ALT)、碱性磷酸脢(Alk Phos/ALP)、γ-谷氨酰转肽酶(GGT)、白蛋白、肌酸激酶(CK)、铁、HbA1、B12、维生素D、G-6-PD、锂、叶酸、C反应蛋白(CRP)、低密度脂蛋白(LDL)、高密度脂蛋白(HDL)、甘油三酸酯、总胆固醇、淀粉酶、凝血酶原时间(PT)、部分凝血酶原时间(PTT)、活化部分凝血酶原时间(APPT)、国际标准化比值(INR)、纤维蛋白原、三磷酸胞苷(CPT)、铁蛋白、肾小球滤过率(GFR)、转铁蛋白、总铁结合能力(TIBC)及不饱和铁结合能力(UIBC)。
任选的,消耗所述未处理特征组。所述消耗的特征组含有作为下面所描述的多个特征:上述多个未处理血液检测结果;及/或多个生化检测结果:及/或抽烟数据;及/或一或更多个人口参数;及任选的多个操纵血液检测结果;及/或多个血液检测结果的组合,例如如下所述。例如,在所述消耗特征组中的每个特征是基于一血液检测结果、一人口特性、一抽烟历史、多个生化检测结果、(多个)血液检测结果的一组合、及/或(多个)人口特性、及/或一操纵的(多个)血液检测结果、及/或(多个)人口特性。例如,当所述未处理特征组包含18个检测结果,95至190的一消耗组,例如可能产生114个特征。
任选的,具有不同消耗特征组的不同的推导数据组,例如多个矩阵,被产生来创造不同的分类器,进行具有(多个)不同人口特性的目标个体的分类,例如性别、不同抽烟历史及/或不同的当前数据。
任选的,所述推导数据组,例如所述矩阵,进行过滤以移除迭代异常值(iteratively outliers)。任选的,计算每个特征的一平均推导及/或一标准推导,及具有多个特殊值的多个特征,例如超过一标准推导最大阈值,例如10,被截断成标准偏差最大阈值。例如,所述过程反复重复10次(或较少的,如果没有实行截断)。现在,如104处所绘示,所述推导数据组是用来产生(多个)分类器,每个分类器分类一目标个体的一肺癌风险,是基于一或更多个目标个体人口特性及当前多个检测结果,例如通过所述分类器产生模块205。任选的,下列分类器中的一或更多个可基于所述推导数据组而产生:
一加权线性回归分类器,其中多个阳性样本记录接收一评分,大致上是多个阴性样本记录的所述评分的100倍;
一K最近邻(KNN)分类器,例如一阴性样本记录的向下100倍采样;
一随机森林分类器,例如其中每个树使用阴性对于阳性样本记录是2:1
比率而建构的;及
一梯度提升机(gradient boosting machine;GBM)分类器。
任选的,使用一种10折(10-fold)交叉验证方法对所述多个分类器中的每一个的所述性能进行评估,其中所述推导数据组,在本文被称为人口,是随机的分成10个相同尺寸的部分。对于每个部分,可实行下面的描述:
从不是在各自的部分内的人口的90%选择可接受的多个血液检测结果组;
根据所述选择的多个血液检测结果组训练一分类器;
从在各自的部分内的人口的10%选择多个血液检测结果组;及
使用所述分类器作用在来自所述10%人口的所述选择的多个血液检测结果组。
现在,如在105处所绘示,输出所述(多个)分类器,任选的作为允许分类多个目标个体的一模块,例如通过所述接口单元206。任选的,定义用于多个个体的多个不同的分类器,所述多个个体具有不同的人口特性,例如用于男性的一分类器及用于女性的另一分类器。在另一范例中,一分类器用在多个抽烟者及另一分类器用在非抽烟者。
任选的,所述多个分类器允许评估肺癌,是通过结合所述多个当前血液检测结果组及抽烟历史。所述多个当前血液检测结果组包含下列多个血液检测中的一些或更多个:嗜酸性粒细胞计数;嗜酸性粒细胞百分比;嗜中性粒细胞计数;嗜中性粒细胞百分比;单核细胞计数;单核细胞百分比;嗜碱性粒细胞计数;嗜碱性粒细胞百分比;淋巴细胞计数;淋巴细胞百分比;及白血球计数(WBC);或者下列的至少一结果:红细胞计数(RBC);红细胞分布宽度(RDW);平均细胞体积(MCV);平均细胞血红蛋白浓度(MCHC);血细胞比容(HCT);血红蛋白(HGB);平均细胞血红蛋白(MCH);或血小板计数及平均血小板体积(MPV)的至少一结果。
任选的,所述肺癌风险是通过至少2个上述指定的血液检测族群的结果来评估。
任选的,所述肺癌风险是通过分类所述目标个体的多个生化血液检测结果来评估。在这样的多个实施例中,所述多个分类器是根据所述多个个体的历史生化血液检测结果的一分析而产生的,例如如上所述。所述多个生化血液检测结果可包含任何上述多个生化检测的多个结果,例如包含下列的多个血液检测:白蛋白、钙、氯、胆固醇、肌酐、高密度脂蛋白(HDL)、低密度脂蛋白(LDL)、钾、钠、甘油三酸酯、尿素及/或尿酸。
任选的,所述肺癌风险是通过分类所述目标个体的多个人口特性而评估的。在这样的实施例中,所述分类器是根据所述多个个体的多个人口特性的一分析而产生的。
任选的,所述目标个体的所述多个当前血液检测结果及多个样本个体的所述多个历史血液检测结果是用在产生包含多个操纵及/或加权值的多个消耗特征组。任选的,每个消耗的特征组是基于一各自的个体的所述多个人口特性,例如如下所述。
任选的,所述一或更多个分类器适配于所述目标个体的一或更多个人口特性。任选的,所述多个分类器被选定以匹配所述目标个体的一或更多个人口特性。在这样的实施例中,不同的分类器可用在女性及男性及/或用在不同的年龄族群。
根据本发明一些实施例,有提供产生用于肺癌评估的一或更多个分类器的多个方法及多个系统。所述多个方法及多个系统是基于另外的多个样本个体的每一个中的多个历史血液检测结果的分析及因而产生具有多个特征组的一数据组,所述多个特征组中的每一个是根据各自的历史血液检测结果而产生的。所述数据组之后用在产生及输出一或更多个分类器,例如多个K最近邻(KNN)分类器、多个随机森林分类器及多个加权线性回归分类器,例如如上所述。所述多个分类器可以提供成多个模块,用在执行在客户终端机上或作为一线上服务使用,以评估多个目标个体基于它们的多个当前血液检测结果的肺癌风险。
分类器任选的是如2013年5月2日提交的国际专利申请号第PCT/IL2013/050368号所引述而产生的,其通过引用并入本文。
下表概括所述不同分类器的所述多个性能,每一个分类器是根据多个样本个体的多个各自的历史血液检测结果的一分析而产生的,其中根据本发明的一些实施例,所述多个血液检测结果包含来自一或二个族群的数据:
Figure GDA0002188371300000141
多个分类器是根据多个样本个体中的各自的历史血液检测结果的一分析而产生的,其中所述多个血液检测结果包含下列的至少一个:
(1)多个白血球血液检测结果,简称为白色及包含:嗜中性粒细胞计数、嗜碱性粒细胞计数、嗜酸性粒细胞计数、淋巴细胞计数、单核细胞计数、白血球计数、中性粒细胞百分比、嗜碱性粒细胞百分率、嗜酸性粒细胞百分比、淋巴细胞百分比、及单核细胞百分比中的至少一个;
(2)多个血小板血液检测结果,简称为Plts及包含计数及/或MPV中的至少一个;
(3)多个生化检测结果是选自于由红细胞沉降率(ESR)、葡萄糖、尿素、血中尿素氮(BUN)、肌酸酐、钠、钾、氯、钙、磷、尿酸、总胆红素、乳酸脱氢酶(LDH)、谷草转氨酶(GOT)、血清谷草转氨酶(SGOT)、谷氨酸草酰乙酸、天冬氨酸转氨酶(AST)、谷草转氨酶、谷氨酸丙酮酸转氨酶(GPT)、血清谷氨酸丙酮酸转氨酶(SGPT)、谷丙转氨酶(ALT)、碱性磷酸脢(Alk Phos/ALP)、γ-谷氨酰转肽酶(GGT)、白蛋白、肌酸激酶(CK)、铁、HbA1、B12、维生素D、G-6-PD、锂、叶酸、C反应蛋白(CRP)、低密度脂蛋白(LDL)、高密度脂蛋白(HDL)、甘油三酸酯、总胆固醇、淀粉酶、凝血酶原时间(PT)、部分凝血酶原时间(PTT)、活化部分凝血酶原时间(APPT)、国际标准化比值(INR)、纤维蛋白原、三磷酸胞苷(CPT)、铁蛋白、肾小球滤过率(GFR)、转铁蛋白、总铁结合能力(TIBC)及不饱和铁结合能力(UIBC)所组成的一群组;
(4)多个红细胞检测结果,简称为红色及包含下列参数中的至少一个:RBC、RDW、MCV、MCHC、血细胞比容、血红蛋白及MCH。
例如,多个分类器是仅基于白色或Plts。要提到的是,仅基于白色或Plts其中之一的一分类器产生优于仅基于Smx的一分类器的结果(见上表)。这是不寻常的,因为抽烟历史是有关联于肺癌的依据可查的。
任选的,多个分类器是仅基于2个上述的族群参数,例如Smx与白色、Smx与Plts、Smx与红色、红色与白色、Plts与白色、及Plts与红色。
多个分类器是根据每个个体的年龄及/或性别的一分析而产生的。
(多个)分类器产生多个分类,也被称为预报。所述多个分类是任选的被收集以测量每个分类器的效能。例如,所述效能的多个测量是根据一接收操作特征(ROC)曲线而选择的。任选的,在不同的(5%、10%、20%、50%及70%)敏感(召回)值的特异性是用在辨视所述多个测量。所述不同示例性分类器的所述多个效能被概括在各自具有不同的曲面下面积(AUC)的所述多个表格中。
任选的,在所述多个个体记录中的所述多个样本个体的每一个包含(多个)血液计数参数中的每一个的(多个)过去值与所述(多个)当前值。在这样的实施例中的示例性数据可以是:AUC=0.94[0.93,0.96],或敏感性(10%的SENS)SENS10=438[123,626],SENS在假阳性比率(FPR 10)=85.4%[80.7,89.8],SENS处于FPR1=41.8%[34.9,50.5]。本文下方的示例性数据是通过最佳的效能而支持的,所述最佳的效能是如来自0至30天的一时间窗口、处于50至75的年龄族群的多个病患的一纪念医疗系统(MHS)所给出的。所述多个记录是根据10%的FPR的敏感性而选择的。
任选的,在所述多个个体记录中的多个样本个体的每一个包含(多个)白血球参数的每一个的(多个)过去值与所述(多个)当前值。在这样的实施例中的示例性数据可以是:AUC=0.94[0.92,0.95],或处在SENS10=260[87,624],SENS处在FPR10=79.4%[74.7,84.0],SENS处在FPR1=38.0%[30.6,45.4]。
任选的,在所述多个个体记录中的多个样本个体的每一个包含(多个)红细胞参数的每一个的(多个)过去值与所述(多个)当前值。在这样的实施例中的示例性数据可以是:AUC=0.88[0.86,0.90],或处在SENS10=88[36,208],SENS处在FPR10=64.1%[58.8,70.0],SENS处在FPR1=27.4%[20.7,33.9]。
任选的,在所述多个个体记录中的多个样本个体的每一个包含(多个)血小板计数参数的每一个的(多个)过去值与所述(多个)当前值。在这样的实施例中的示例性数据可以是:AUC=0.91[0.89,0.92],或处在SENS10=149[41,614],SENS处在FPR10=72.9%[66.9,78.3],SENS处在FPR1=35.4%[28.1,42.3]。
任选的,在所述多个个体记录中的多个样本个体的每一个包含血小板信息的每一个的(多个)过去值与所述(多个)当前值。在这样的实施例中的示例性数据可以是:AUC=0.94[0.92,0.95],或处在SENS10=232[76,621],SENS处在FPR10=80.7%[75.6,85.2],SENS处在FPR1=37.7%[31.2,44.7]。
任选的,在所述多个个体记录中的多个样本个体的每一个包含多个白血球计数的每一个及所述红细胞计数的任意参数的(多个)过去值与所述(多个)当前值。在这样的实施例中的示例性数据可以是:AUC=0.93[0.92,0.95],或处在SENS10=326[77,625],SENS处在FPR10=80.1%[75.0,84.8],SENS处在FPR1=38.2%[32.3,45.2]。
任选的,在所述多个个体记录中的多个样本个体的每一个包含所述多个白血球计数的任意参数及所述血小板信息的任意参数或所述白线计数(white line counts)的任意参数和任意生化参数的(多个)过去值与所述(多个)当前值。
任选的,在所述多个个体记录中的多个样本个体的每一个包含所述红细胞计数的任意参数与所述血小板信息的任意参数的(多个)过去值与所述(多个)当前值。在这样的实施例中,AUC=0.92[0.90,0.93],或处在SENS10=194[57,619],SENS处在FPR10=76.6%[71.1,81.6],SENS处在FPR1=35.2%[27.4,42.2]。
任选的,在所述多个个体记录中的多个样本个体的每一个包含所述血小板信息及任意生化参数的(多个)过去值与所述(多个)当前值。
任选的,在所述多个个体记录中的多个样本个体的每一个包含所述红细胞计数及任意生化参数的(多个)过去值与所述(多个)当前值。
任选的,在所述多个个体记录中的多个样本个体的每一个包含嗜中性粒细胞计数的(多个)过去值与所述(多个)当前值。在这样的实施例中,AUC=0.90[0.89,0.92],或处在SENS10=44[23,89],SENS处在FPR10=69.2%[62.9,74.8],SENS处在FPR1=22.2%[16.9,28.6]。
任选的,在所述多个个体记录中的多个样本个体的每一个包含血细胞比容的(多个)过去值与所述(多个)当前值。在这样的实施例中的示例性数据可以是:AUC=0.88[0.86,0.90],或处在SENS10=88[36,208],SENS处在FPR10=64.1%[58.8,70.0],SENS处在FPR1=27.4%[20.7,33.9]。
任选的,在所述多个个体记录中的多个样本个体的每一个包含血小板计数的(多个)过去值与所述(多个)当前值。在这样的实施例中的示例性数据可以是:AUC=0.91[0.89,0.92],或处在SENS10=149[41,614],SENS处在FPR10=72.9%[66.9,78.3],SENS处在FPR1=35.4%[28.1,42.3]。
任选的,在所述多个个体记录中的多个样本个体的每一个包含白线计数与所述红线计数的任意参数及所述血小板信息的任意参数的(多个)过去值与所述(多个)当前值。在这样的实施例中的示例性数据可以是:AUC=0.94[0.93,0.96],或处在SENS10=438[123,626],SENS处在FPR10=85.4%[80.7,89.8],SENS处在FPR1=41.8%[34.9,50.5]。
任选的,在所述多个个体记录中的多个样本个体的每一个包含所述白线计数的任意参数、与所述红线计数的任意参数、及所述血小板信息的任意参数及任意生化参数的(多个)过去值与所述(多个)当前值。
任选的,在所述多个个体记录中的多个样本个体的每一个包含下列的(多个)过去值与(多个)当前值:来自CBC或生化的任意参数及肺癌家族历史;所述白血球计数的任意参数及肺癌家族历史;所述红细胞计数的任意信息及肺癌家族历史;来自CBC或生化的任意参数及身体质量指数(BMI);所述白血球计数的任意参数及BMI;所述红细胞计数的任意信息及BMI;来自CBC或生化的任意参数及合并症(如COPD);所述白血球计数的任意参数及合并症;所述红细胞计数的任意信息及合并症;来自CBC或生化的任意参数及多个社会经济指标(例如教育水平);所述白血球计数的任意参数及多个社会经济指标;及/或所述红细胞计数的任意信息及多个社会经济指标。
预期的是,在一专利从这个申请案成熟的所述寿命期间,许多相关的系统及方法将被研发及一处理器、一显示器及用户接口的所述用语的所述范围意欲预先包含所有这种新的技术。
如本文所使用,所述用语「大致(about)」是指±10%。
所述用语「包括(comprises)」、「包括(comprising)」、「包括(includes)」、「包含(including)」、「具有(having)」及它们的词形变化是指“包括但不限于”。这种用语包括所述多个用语「由...组成(consisting of)」及「基本上由......组成(essentiallyconsisting of)」。
所述片语「基本上由......组成(essentially consisting of)」是指组成物或方法可包括额外的成分及/或步骤,但只有当额外的成分及/或步骤实质上不改变所要求保护的组合物或方法的基本特征和新特征。
如本文所使用的,单数形式的「一(a,an,the)」除非上下文另有明确说明包含复数形式。例如,用语「一化合物(a compound)」或「至少一化合物(at least one compound)」可以包括多种化合物,包括其混合物。
所述单字「示例(exemplary)」在本文中用于表示作为「示例(serving as anexample),实例(instance)或例证(illustration)」。任何被描述为示例实施例不一定被解释为优于或胜过其他实施例及/或排除来自其它实施例的特征结合。
所述单字「任选的(optionally)」在本文中用于表示在一些实施例中提供的,而不是在其他实施例中提供的。任何特定的本发明的实施例可包括多个任选的特征,除非这些特征冲突。
在整个申请中,本发明各种实施例可呈现在一范围形式中。但应当理解是,范围形式的描述仅仅是为了方便和简化,不应被解释为对本发明的范围的强行限制。因此,范围的描述应当被认为已经具体公开了所有可能的子范围以及范围内的单个数值。例如,范围的描述,从1至6应考虑到具有具体公开的子范围,如从1至3,从1至4,从1至5,从2至4,从2至6,从3至6等,以及个数在所述范围内,例如1,2,3,4,5及6,不论范围的宽度皆适用。
每当数值范围在本文中指出的,它是指包括任何引用标号所指示的范围内(小数或整数)。所述片语「范围内/范围之间(ranging/ranges between)」在第一指示数字和第二指示数字,以及「测距/从范围(ranging/ranges from)」第一指示数字「至(to)」第二指示数字在本文中可互换使用,且为包括第一和第二指示数字其间的所有分数和整数数字。
可以理解的是,本发明的某些特征,为了清楚起见在单独实施例的上下文中描述,也可以组合在单一实施例中提供。相反地,本发明的各种特征,为了简便起见,在单个实施例的上下文中描述,也可以单独地或以任何合适的子组合,或如适用于本发明的任何其他描述的实施例提供。在各种实施例的上下文中描述的某些特征不应被认为是所述实施方案的必要特征,除非所述实施例没有所述元件是不能操作的。
虽然本发明已结合其具体实施方案进行了描述,但很明显的,许多替换、修改和变化对于那些熟悉的技术人员是显而易见的。因此,意欲涵盖落入附属权利要求的精神和范围内的所有此类替换、修改和变型。
在本说明书中提及的所有公开,专利及专利申请以其整体在此引入作为参考到本说明书中,相同程度的,就如同每个单独的公开,专利或专利申请被具体地和单独地表明被并入本文作为参考。此外,本发明引用或标识在本申请中的任何参考不应当被解释为承认这样的参考文献可作为现有技术。在一定程度上,章节标题的使用不应该被解释为必要限制。

Claims (15)

1.一种肺癌评估系统,其特征在于:所述肺癌评估系统包含:
一处理器;
一存储单元,存储至少一种分类器,所述至少一种分类器是根据对另外的多个样本个体的每一个的多个历史血液检测结果的一分析而产生的;
一输入单元,接收一目标个体的一血液的多个当前血液检测结果;及
一肺癌评估模块,通过利用所述至少一种分类器对从所述多个当前血液检测结果撷取出的多个不同的血液检测结果的多个实际血液检测值的多个特征的一组合进行分类,以使用所述处理器来评估所述目标个体的一肺癌风险;
其中所述至少一种分类器具有至少0.93的一曲面下面积(AUC)的一效能,用在50至75的一年龄族群的多个病患的0至30天的一时间窗口的多个医学测试的多个记录,其中所述多个记录是根据10%的一假阳性比率(FPR)的敏感性而选择的;
其中所述多个历史与当前血液检测结果中的每一个包括至少一生化检测及从下述血液检测的各个族群中所选出的所述多个实际血液检测值的多个结果:
(i)多个白血球血液检测结果,包含:嗜中性粒细胞计数、嗜碱性粒细胞计数、嗜酸性粒细胞计数、淋巴细胞计数、单核细胞计数、白血球计数、中性粒细胞百分比、嗜碱性粒细胞百分率、嗜酸性粒细胞百分比、淋巴细胞百分比、及单核细胞百分比中的至少一个;
(ii)多个血小板血液检测结果,包含血小板计数及平均血小板体积(MPV)中的至少一个;及
(iii)抽烟历史及(iv)多个红细胞检测结果的一组合,所述多个红细胞检测结果包含红细胞(RBC)、红细胞分布宽度(RDW)、平均细胞血红蛋白(MCH)、平均细胞体积(MCV)、红细胞平均血红蛋白浓度(MCHC)、血细胞比容及血红蛋白中的至少一个,
其中所述至少一生化检测的结果是选自于由红细胞沉降率(ESR)、葡萄糖、尿素、血中尿素氮(BUN)、肌酸酐、钠、钾、氯、钙、磷、尿酸、总胆红素、乳酸脱氢酶(LDH)、谷草转氨酶(GOT)、血清谷草转氨酶(SGOT)、谷氨酸草酰乙酸、天冬氨酸转氨酶(AST)、谷草转氨酶、谷氨酸丙酮酸转氨酶(GPT)、血清谷氨酸丙酮酸转氨酶(SGPT)、谷丙转氨酶(ALT)、碱性磷酸脢(Alk Phos/ALP)、γ-谷氨酰转肽酶(GGT)、白蛋白、肌酸激酶(CK)、铁、HbA1、B12、维生素D、G-6-PD、锂、叶酸、C反应蛋白(CRP)、低密度脂蛋白(LDL)、高密度脂蛋白(HDL)、甘油三酸酯、总胆固醇、淀粉酶、凝血酶原时间(PT)、部分凝血酶原时间(PTT)、活化部分凝血酶原时间(APPT)、国际标准化比值(INR)、纤维蛋白原、三磷酸胞苷(CPT)、铁蛋白、肾小球滤过率(GFR)、转铁蛋白、总铁结合能力(TIBC)及不饱和铁结合能力(UIBC)所组成的一群组。
2.如权利要求1所述的肺癌评估系统,其特征在于:所述至少一种分类器是根据一组合来产生,所述组合包含所述多个历史与当前血液检测结果及所述多个样本个体中的每一个的至少一人口参数。
3.如权利要求2所述的肺癌评估系统,其特征在于:所述至少一人口参数是由性别、年龄、居住区域、种族及社会经济特征所组成的一族群中的一组成要素。
4.如权利要求1所述的肺癌评估系统,其特征在于:所述多个历史与当前血液检测结果中的每一个包括:多个白血球血液检测结果的多个结果,所述多个白血球血液检测结果包含:嗜中性粒细胞计数、嗜碱性粒细胞计数、嗜酸性粒细胞计数、淋巴细胞计数、单核细胞计数、白血球计数、中性粒细胞百分比、嗜碱性粒细胞百分率、嗜酸性粒细胞百分比、淋巴细胞百分比及单核细胞百分比中的至少一个。
5.如权利要求4所述的肺癌评估系统,其特征在于:所述多个历史与当前血液检测结果中的所述每一个包括:抽烟历史。
6.如权利要求1所述的肺癌评估系统,其特征在于:所述多个历史与当前血液检测结果中的所述每一个包括:包含血小板计数及MPV中的至少一个的多个血小板血液检测结果。
7.如权利要求6所述的肺癌评估系统,其特征在于:所述多个历史与当前血液检测结果中的所述每一个包括:抽烟历史。
8.如权利要求1所述的肺癌评估系统,其特征在于:所述多个历史与当前血液检测结果中的所述每一个包括:抽烟历史及多个红细胞检测结果的所述组合,所述多个红细胞检测结果包含RBC、RDW、MCH、MCV、MCHC、血细胞比容及血红蛋白中的至少一个。
9.如权利要求1所述的肺癌评估系统,其特征在于:所述多个历史与当前血液检测结果中的每一个包括:中性粒细胞百分比/计数及淋巴细胞百分比/计数的多个结果。
10.如权利要求1所述的肺癌评估系统,其特征在于:所述至少一种分类器包括:由一加权线性回归分类器、一K最近邻(KNN)分类器及一随机森林分类器所组成的一族群中的一组成要素。
11.如权利要求1所述的肺癌评估系统,其特征在于:所述多个历史与当前血液检测结果中的每一个包括:血小板血细胞比容(PCT)的多个结果。
12.如权利要求1所述的肺癌评估系统,其特征在于:所述多个历史与当前血液检测结果中的每一个包括:HGB及HCT的多个结果。
13.如权利要求1所述的肺癌评估系统,其特征在于:所述多个特征的组合包括所述目标个体的一年龄;其中所述至少一种分类器是根据另外的多个样本个体中的每一个的所述年龄的一分析而产生的。
14.如权利要求1所述的肺癌评估系统,其特征在于:所述多个历史与当前血液检测结果中的每一个包括下列多个血液检测中的至少一个:嗜酸性粒细胞计数;中性粒细胞百分比;单核细胞百分比;嗜酸性粒细胞百分比;嗜碱性粒细胞百分比;和中性粒细胞计数;及单核细胞计数。
15.一种计算机可读介质,其特征在于:所述计算机可读介质包括存储在如权利要求1所述的肺癌评估系统中的多个计算机可执行指令。
CN201480067921.8A 2013-11-07 2014-11-05 肺癌评估系统及计算机可读介质 Active CN105814571B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361901059P 2013-11-07 2013-11-07
US61/901,059 2013-11-07
PCT/IL2014/050960 WO2015068157A1 (en) 2013-11-07 2014-11-05 Methods and systems of evaluating a risk of lung cancer

Publications (2)

Publication Number Publication Date
CN105814571A CN105814571A (zh) 2016-07-27
CN105814571B true CN105814571B (zh) 2020-01-07

Family

ID=53040982

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480067921.8A Active CN105814571B (zh) 2013-11-07 2014-11-05 肺癌评估系统及计算机可读介质

Country Status (11)

Country Link
US (2) US11031105B2 (zh)
EP (1) EP3065630B1 (zh)
JP (1) JP6645703B2 (zh)
KR (1) KR102310799B1 (zh)
CN (1) CN105814571B (zh)
AU (1) AU2014347669C1 (zh)
BR (1) BR112016010322A2 (zh)
CA (1) CA2928271C (zh)
MX (1) MX2016005825A (zh)
RU (1) RU2677742C2 (zh)
WO (1) WO2015068157A1 (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014186036A1 (en) 2013-03-14 2014-11-20 Allegro Diagnostics Corp. Methods for evaluating copd status
US11976329B2 (en) 2013-03-15 2024-05-07 Veracyte, Inc. Methods and systems for detecting usual interstitial pneumonia
KR102310799B1 (ko) 2013-11-07 2021-10-12 미디얼 리서치 리미티드 폐암 위험 평가 방법 및 시스템
EP3770274A1 (en) 2014-11-05 2021-01-27 Veracyte, Inc. Systems and methods of diagnosing idiopathic pulmonary fibrosis on transbronchial biopsies using machine learning and high dimensional transcriptional data
CN105232060A (zh) * 2015-08-31 2016-01-13 陈琼 基于独立风险因子组合筛查的预警系统
CN106974660B (zh) * 2017-04-20 2020-03-06 重庆邮电大学 基于脑功能活动检测中的血氧特征实现性别判定的方法
CN107133475B (zh) * 2017-05-10 2020-09-29 浙江省立同德医院 一种中药注射剂不良反应高危患者模式识别方法
WO2018223066A1 (en) * 2017-06-02 2018-12-06 Veracyte, Inc. Methods and systems for identifying or monitoring lung disease
WO2019023376A1 (en) * 2017-07-28 2019-01-31 Siemens Healthcare Diagnostics Inc. METHODS AND APPARATUS FOR QUANTIFYING DEEP LEARNING VOLUME
CN108245161A (zh) * 2017-12-26 2018-07-06 北京医拍智能科技有限公司 肺部常见疾病的辅助诊断系统
CN108717867A (zh) * 2018-05-02 2018-10-30 中国科学技术大学苏州研究院 基于梯度迭代树的疾病预测模型建立方法及装置
CN109585011A (zh) * 2018-10-26 2019-04-05 朱海燕 胸痛患者的病症诊断方法及机器可读存储介质
CN110825819A (zh) * 2019-09-24 2020-02-21 昆明理工大学 一种处理有缺失值和不平衡非小细胞肺癌数据的二分类方法
KR102487864B1 (ko) * 2020-02-10 2023-01-11 연세대학교 원주산학협력단 지역사회획득폐렴 환자의 예후를 예측하는 방법 및 이를 위한 예측시스템
CN111933287A (zh) * 2020-06-24 2020-11-13 四川省肿瘤医院 整合血液和富含血小板血浆中的血小板特征建立肺癌模型
CN114663330A (zh) * 2020-12-03 2022-06-24 富泰华工业(深圳)有限公司 干细胞密度确定方法、装置、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1268033A (zh) * 1997-02-14 2000-09-27 拜奥马尔国际公司 用来预测未来健康的系统
EP1969363A2 (en) * 2005-12-22 2008-09-17 Abbott Laboratories Methods and marker combinations for screening for predisposition to lung cancer

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4733354A (en) 1984-11-23 1988-03-22 Brian Potter Method and apparatus for automated medical diagnosis using decision tree analysis
AU1837495A (en) 1994-10-13 1996-05-06 Horus Therapeutics, Inc. Computer assisted methods for diagnosing diseases
US5687716A (en) * 1995-11-15 1997-11-18 Kaufmann; Peter Selective differentiating diagnostic process based on broad data bases
US7392199B2 (en) * 2001-05-01 2008-06-24 Quest Diagnostics Investments Incorporated Diagnosing inapparent diseases from common clinical tests using Bayesian analysis
CN101180408A (zh) * 2005-05-19 2008-05-14 西尼尔根茨生物科学有限公司 用遗传多态性分析评估发生肺癌的风险的方法
US20070118399A1 (en) * 2005-11-22 2007-05-24 Avinash Gopal B System and method for integrated learning and understanding of healthcare informatics
US9347945B2 (en) * 2005-12-22 2016-05-24 Abbott Molecular Inc. Methods and marker combinations for screening for predisposition to lung cancer
US20100179067A1 (en) * 2007-05-18 2010-07-15 Patz Jr Edward F Serum biomarkers for the early detection of lung cancer
WO2009065230A1 (en) * 2007-11-23 2009-05-28 British Columbia Cancer Agency Branch Methods for detecting lung cancer and monitoring treatment response
US10359425B2 (en) * 2008-09-09 2019-07-23 Somalogic, Inc. Lung cancer biomarkers and uses thereof
CN102209968B (zh) * 2008-09-09 2016-05-04 私募蛋白质体公司 肺癌生物标记蛋白的捕获剂在制备试剂盒中的用途
CN102985819B (zh) * 2010-07-09 2015-04-15 私募蛋白质体公司 肺癌生物标记及其用途
GB201021289D0 (en) * 2010-12-15 2011-01-26 Immatics Biotechnologies Gmbh Novel biomarkers for a prediction of the outcome of an immunotherapy against cancer
RU2011135615A (ru) * 2011-08-26 2013-03-10 Михаил Владимирович Кутушов Способ диагностики онкологических и соматических заболеваний
KR102310799B1 (ko) 2013-11-07 2021-10-12 미디얼 리서치 리미티드 폐암 위험 평가 방법 및 시스템

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1268033A (zh) * 1997-02-14 2000-09-27 拜奥马尔国际公司 用来预测未来健康的系统
EP1969363A2 (en) * 2005-12-22 2008-09-17 Abbott Laboratories Methods and marker combinations for screening for predisposition to lung cancer

Also Published As

Publication number Publication date
EP3065630A4 (en) 2017-07-19
US20160292379A1 (en) 2016-10-06
KR20160079086A (ko) 2016-07-05
AU2014347669B2 (en) 2019-11-21
BR112016010322A2 (pt) 2017-08-08
RU2016121682A3 (zh) 2018-06-22
WO2015068157A1 (en) 2015-05-14
US11031105B2 (en) 2021-06-08
RU2016121682A (ru) 2017-12-11
AU2014347669A1 (en) 2016-06-23
EP3065630A1 (en) 2016-09-14
MX2016005825A (es) 2016-12-09
CA2928271C (en) 2022-05-31
US20210295960A1 (en) 2021-09-23
JP6645703B2 (ja) 2020-02-14
CA2928271A1 (en) 2015-05-14
EP3065630B1 (en) 2020-09-09
JP2016535262A (ja) 2016-11-10
CN105814571A (zh) 2016-07-27
AU2014347669C1 (en) 2021-03-11
KR102310799B1 (ko) 2021-10-12
RU2677742C2 (ru) 2019-01-21

Similar Documents

Publication Publication Date Title
CN105814571B (zh) 肺癌评估系统及计算机可读介质
US10452970B2 (en) Methods and systems of evaluating a risk of a gastrointestinal cancer
Sundberg et al. Why is the gender gap in life expectancy decreasing? The impact of age-and cause-specific mortality in Sweden 1997–2014
Tatonetti et al. Data-driven prediction of drug effects and interactions
Yaranal et al. Hematological profile in pulmonary tuberculosis
Wang et al. Comorbidity and performance status as independent prognostic factors in patients with head and neck squamous cell carcinoma
McCrory et al. Epigenetic clocks and allostatic load reveal potential sex-specific drivers of biological aging
Pfeiffer et al. Trends in circulating concentrations of total homocysteine among US adolescents and adults: findings from the 1991–1994 and 1999–2004 National Health and Nutrition Examination Surveys
Sweeney et al. Multicohort analysis of whole-blood gene expression data does not form a robust diagnostic for acute respiratory distress syndrome
JP2017021727A (ja) イベント発生時期予測装置、イベント発生時期予測方法、及びイベント発生時期予測プログラム
Minutolo et al. New-onset anemia and associated risk of ESKD and death in non-dialysis CKD patients: a multicohort observational study
CN117672506A (zh) 培美曲塞化疗后肾脏与骨髓抑制风预测模型及其构建方法
Grasselli et al. DNA damage in circulating hematopoietic progenitor stem cells as promising biological sensor of frailty
Kandel et al. Pseudo-thrombotic thrombocytopenic purpura presenting as multi-organ dysfunction syndrome: a rare complication of pernicious anemia
WO2017136139A1 (en) Predictive test for melanoma patient benefit from interleukin-2 (il2) therapy
Kresovich et al. Changes in methylation-based aging in women who do and do not develop breast cancer
Liao et al. Use machine learning to help identify possible sarcopenia cases in maintenance hemodialysis patients
Xiang et al. Signatures of neuropsychological test results in the Long Life Family Study: A cluster analysis
Levine et al. Evidence of resiliency among long-lived smokers
Bernaola et al. Risk profiles of Covid-19 patients in Spain: Study and presentation of the importance of clinical features over six waves of the pandemic
Reichmann et al. Biomarker signatures associated with ageing free of major chronic diseases: results from a population-based sample of the EPIC-Potsdam cohort
SÂRBU et al. PROGNOSTIC FACTORS IN LIVER FAILURE IN CHILDREN BY DISCRIMINANT ANALYSIS OF CLINICAL DATA. A CHEMOMETRIC APPROACH.
Kolokotroni et al. In Silico Oncology: Developing and Clinically Adapting the Acute Lymphoblastic Leukemia (ALL) Oncosimulator

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant