CN113611420A - 一种基于血液检查指标的疾病筛查方法和系统 - Google Patents

一种基于血液检查指标的疾病筛查方法和系统 Download PDF

Info

Publication number
CN113611420A
CN113611420A CN202110917580.0A CN202110917580A CN113611420A CN 113611420 A CN113611420 A CN 113611420A CN 202110917580 A CN202110917580 A CN 202110917580A CN 113611420 A CN113611420 A CN 113611420A
Authority
CN
China
Prior art keywords
disease
blood
model
cancer
screening model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202110917580.0A
Other languages
English (en)
Inventor
季凯
王正
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202110917580.0A priority Critical patent/CN113611420A/zh
Publication of CN113611420A publication Critical patent/CN113611420A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30096Tumor; Lesion

Landscapes

  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Public Health (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biomedical Technology (AREA)
  • Physics & Mathematics (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Quality & Reliability (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开一种基于血液检查指标的疾病筛查方法和系统,属于医疗数据处理领域,包括数据获取模块,其用于获取血常规化验单、血生化化验单、肿瘤标志物化验单图片,识别血常规、血生化、肿瘤标志物化验单图片中检测指标、年龄、性别,或直接从电子数据中导入相关数据;疾病筛查模块,其用于基于健康初筛模型和疾病筛查模型,预测出相应待筛查者是否存在特定的疾病。其中,健康初筛模型的训练过程为:对健康人群与疾病人群建立分类学习样本,利用学习样本训练机器学习算法模型,得到健康初筛模型;疾病筛查模型的训练过程为:对特定疾病人群和其他疾病人群建立分类学习样本,利用学习样本训练机器学习算法模型,得到特定疾病筛查模型。本发明利用血常规、血生化指标、肿瘤标志物筛查特定疾病,创新了疾病筛查预警的模式。

Description

一种基于血液检查指标的疾病筛查方法和系统
技术领域
本发明属于医疗数据处理领域,一种基于血液检查指标的疾病筛查方法和系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
血常规、血生化、肿瘤标志物中包含了大量的人体健康信息,许多项具体指标都是一些常用的敏感指标,对机体内许多病理改变都有敏感反映,许多患者在病因不明时可以做血液检查对其进行辅助诊断。此外,血液还是观察治疗效果、用药或停药、继续治疗或停止治疗、疾病复发或痊愈的常用指标。
目前对血常规、血生化、肿瘤标志物的解读往往是较为单一的指标升高降低,在研究中我们发现有些疾病可以通过对大量指标的综合分析来计算出来。血液检查在日常的就诊中经常进行,如果能通过血常规、血生化、肿瘤标志物的结果准确预警一些健康风险,可以做到在不增加检查成本的前提下,发现并提示更多的健康风险。
发明内容
为了解决上述问题,本发明提供一种基于血液检查指标的疾病筛查方法和系统,利用血常规、血生化、肿瘤标志物检测指标来筛查特定疾病,创新了疾病筛查预警的模式。
为了实现上述目的,本发明采用如下技术方案:
数据获取模块,其用于获取血常规化验单、血生化化验单、肿瘤标志物化验单图片,识别血常规、血生化、肿瘤标志物化验单图片中检测指标、年龄、性别,或直接从电子数据中导入相关数据;
疾病筛查模块,其用于基于健康初筛模型和疾病筛查模型,预测出相应待筛查者是否存在特定的疾病;
其中,健康初筛模型的训练过程为:对健康人群与疾病人群建立学习样本,利用学习样本训练机器学习算法模型,得到健康初筛模型。疾病筛查模型的训练过程为:对特定疾病人群和其他疾病人群建立分类学习样本;利用学习样本训练机器学习算法模型,得到特定疾病筛查模型。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的基于血液检查指标的疾病筛查方法和系统结构示意图。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
图1给出了本实施例的一种基于血液检查指标的疾病筛查方法和系统,其包括:
(1) 数据获取模块,其用于获取血常规化验单、血生化化验单、肿瘤标志物化验单图片,识别血常规、血生化、肿瘤标志物化验单图片中检测指标、年龄、性别,或直接从电子数据中导入相关数据。
其中血常规指标包括白细胞计数(WBC),红细胞计数(RBC),血红蛋白(Hb),红细胞比容(Hct),平均红细胞体积(MCV),平均红细胞血红蛋白含量(MCH),平均红细胞血红蛋白浓度(MCHC),血小板计数(PLT),淋巴细胞百分比(Lymph%),单核细胞百分比(Mono%),中性粒细胞百分比(Neut%),嗜酸性粒细胞百分比(Eos%),嗜碱性粒细胞百分比(Baso%),淋巴细胞计数(Lymph),单核细胞计数(Mono),中性粒细胞计数(Neut),嗜酸性粒细胞计数(Eos),嗜碱性粒细胞计数(Baso),红细胞体积分布宽度CV(RDW-CV),红细胞体积分布宽度SD(RDW-SD),血小板分布宽度(PDW),平均血小板体积(MPV),大血小板百分比(P-LCR%),血小板比容(PCT)。
其中血生化指标包括谷草转氨酶(AST),谷丙转氨酶(ALT),谷草转氨酶/谷丙转氨酶(S/L),谷氨酰转肽酶(GGT),碱性磷酸酶(ALP),总蛋白(TP),白蛋白(ALB),球蛋白(GLO),白蛋白/球蛋白(A/G),总胆红素(TBIL),直接胆红素(DBIL),间接胆红素(IBIL),总胆固醇(CHOL),高密度脂蛋白(HDL-C),低密度脂蛋白(LDL/C),甘油三酯(TG),葡萄糖(GLU),尿素氮(BUN),肌酐(CREA),尿素氮/肌酐(BUN/CREA),尿酸(URIC)。
其中肿瘤标志物为AFP、CEA、Cyfra21-1、CA199、CA242、CA125、SCC、PSA。
利用图像采集装置采集血常规化验单、血生化化验单、肿瘤标志物化验单图片,将血常规化验单、血生化化验单、肿瘤标志物化验单图片上传到服务器;服务器会自动识别血常规指标、血生化指标、肿瘤标志物指标以及年龄与性别。
具体地,识别血常规化验单图片中血常规检测指标、血生化检查指标、肿瘤标志物指标、年龄和性别的方法可采用现有图像分割及语义识别方法来实现,此处不再累述。
(2) 疾病筛查模块,其用于基于健康初筛模型和疾病筛查模型,预测出相应待筛查者是否存在特定的疾病。
步骤1:健康初筛模型的训练过程为:对健康人群与疾病人群建立学习样本,利用学习样本训练机器学习算法模型,得到健康初筛模型。疾病筛查模型的训练过程为:对特定疾病人群和其他疾病人群建立分类学习样本;利用学习样本训练机器学习算法模型,得到特定疾病筛查模型。
其中,机器学习算法模型可以为预设的算法,SVM、随机森林算法、LightGBM算法或XGBoost算法。机器学习算法模型也可为经多个算法比较后筛选出的最优机器学习算法模型。
健康初筛模型和疾病筛查模型计算特征的选取,可以利用血常规数据、血生化、肿瘤标志物的部分指标或全部指标。
步骤2:计算特定疾病风险,首先使用健康初筛模型判断测验者是否具有待测疾病风险,然后使用多个特定疾病筛查模型逐一排查测验者特定疾病风险。
对于本领域的技术人员来说,本发明可以有各种更改和变化,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种基于血液检查指标的疾病筛查方法和系统,其特征在于,包括:
数据获取模块,其用于获取血常规化验单、血生化化验单、肿瘤标志物化验单图片,识别血常规、血生化、肿瘤标志物化验单图片中检测指标、年龄、性别,或直接从电子数据中导入相关数据;
疾病筛查模块,其用于基于健康初筛模型和疾病筛查模型,预测出相应待筛查者是否存在特定的疾病;
其中,健康初筛模型的训练过程为:对健康人群与疾病人群建立学习样本,利用学习样本训练机器学习算法模型,得到健康初筛模型;
疾病筛查模型的训练过程为:对特定疾病人群和其他疾病人群建立分类学习样本;利用学习样本训练机器学习算法模型,得到特定疾病筛查模型。
2.如权利要求1所述的一种基于血液检查指标的疾病筛查方法和系统,其特征在于,特定疾病人群包括妊娠、睡眠呼吸暂停、肾病综合征、慢性肾衰竭、乙型肝炎肝硬化、系统性红斑狼疮、1型糖尿病、2型糖尿病、急性胰腺炎、白血病、肺癌、肝癌、胃癌、食癌、结直肠癌、乳腺癌、宫颈癌、肾癌、胰腺癌、甲状腺癌、前列腺癌、卵巢癌、鼻咽癌。
3.如权利要求1所述的一种基于血液检查指标的疾病筛查方法和系统,其特征在于,其他疾病人群包括,排除了一个特定疾病人群后患有其他疾病的人群。
4.如权利要求1所述的一种基于血液检查指标的疾病筛查方法和系统,其特征在于,用于机器学习的训练数据可以利用血常规数据、血生化、肿瘤标志物的部分指标或全部指标进行训练,只要满足模型评价指标要求,就可以作为一个健康初筛模型和疾病筛查模型。
5.如权利要求4所述的一种基于血液检查指标的疾病筛查方法和系统,其特征在于,模型评价指标包括预测正确率、AUC、灵敏度、特异度。
6.如权利要求5所述的一种基于血液检查指标的疾病筛查方法和系统,其特征在于,健康初筛模型和疾病筛查模型的训练过程中,利用样本集合训练多种机器学习算法模型;利用预测值误差来比较所有训练的机器学习算法模型,利用准确性最高的机器学习算法模型生成最优健康初筛模型和疾病筛查模型。
CN202110917580.0A 2021-08-11 2021-08-11 一种基于血液检查指标的疾病筛查方法和系统 Withdrawn CN113611420A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110917580.0A CN113611420A (zh) 2021-08-11 2021-08-11 一种基于血液检查指标的疾病筛查方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110917580.0A CN113611420A (zh) 2021-08-11 2021-08-11 一种基于血液检查指标的疾病筛查方法和系统

Publications (1)

Publication Number Publication Date
CN113611420A true CN113611420A (zh) 2021-11-05

Family

ID=78340201

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110917580.0A Withdrawn CN113611420A (zh) 2021-08-11 2021-08-11 一种基于血液检查指标的疾病筛查方法和系统

Country Status (1)

Country Link
CN (1) CN113611420A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113889267A (zh) * 2021-11-15 2022-01-04 博奥生物集团有限公司 基于眼象识别的糖尿病诊断模型的构建方法和电子设备
CN115472292A (zh) * 2022-09-14 2022-12-13 重庆大学附属肿瘤医院 基于外周血标志物构建肺癌风险预测模型的方法
CN115527673A (zh) * 2022-09-19 2022-12-27 内蒙古卫数数据科技有限公司 一种基于大数据的心理健康风险筛查系统及其方法
CN115684570A (zh) * 2022-08-02 2023-02-03 首都医科大学附属北京朝阳医院 传染病检测装置、设备、系统、介质及程序产品
CN116106534A (zh) * 2023-04-11 2023-05-12 南京品生医学检验实验室有限公司 生物标志物组合在制备肺癌预测产品中的应用
CN118116579A (zh) * 2024-03-19 2024-05-31 内蒙古卫数数据科技有限公司 一种基于多维度检验数据的疾病早筛模型的构建方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113889267A (zh) * 2021-11-15 2022-01-04 博奥生物集团有限公司 基于眼象识别的糖尿病诊断模型的构建方法和电子设备
CN115684570A (zh) * 2022-08-02 2023-02-03 首都医科大学附属北京朝阳医院 传染病检测装置、设备、系统、介质及程序产品
CN115684570B (zh) * 2022-08-02 2024-04-12 首都医科大学附属北京朝阳医院 传染病检测装置、设备、系统、介质及程序产品
CN115472292A (zh) * 2022-09-14 2022-12-13 重庆大学附属肿瘤医院 基于外周血标志物构建肺癌风险预测模型的方法
CN115527673A (zh) * 2022-09-19 2022-12-27 内蒙古卫数数据科技有限公司 一种基于大数据的心理健康风险筛查系统及其方法
CN116106534A (zh) * 2023-04-11 2023-05-12 南京品生医学检验实验室有限公司 生物标志物组合在制备肺癌预测产品中的应用
CN118116579A (zh) * 2024-03-19 2024-05-31 内蒙古卫数数据科技有限公司 一种基于多维度检验数据的疾病早筛模型的构建方法

Similar Documents

Publication Publication Date Title
CN113611420A (zh) 一种基于血液检查指标的疾病筛查方法和系统
Oosterhuis et al. Total error vs. measurement uncertainty: revolution or evolution?
DeNicola Advances in hematology analyzers
Paltrinieri et al. Haematological and biochemical reference intervals of four feline breeds
Fleming et al. UF-1000 i: validation of the body fluid mode for counting cells in body fluids
CN114093517A (zh) 一种基于血液指标、cfDNA的癌症筛查方法和系统
Duhalde et al. Point-of-care hemolysis detection in blood gas specimens directly at the emergency department
L. van Pelt et al. Reference intervals for Sysmex XN hematological parameters as assessed in the Dutch Lifelines cohort
CN113643812A (zh) 一种基于血液检查指标的肿瘤风险倍数计算方法和系统
CN112768079A (zh) 一种基于机器学习的肝病认知模型构建方法和系统
Manel et al. Hepatic proteins and inflammatory markers in rheumatoid arthritis patients
Nikolac Gabaj et al. Ascorbic acid in urine still compromises urinalysis results
Hwang et al. Automated nucleated RBC measurement using the sysmex XE-5000 hematology analyzer: frequency and clinical significance of the nucleated RBCs
Tan et al. Impact of delta check time intervals on error detection capability
Kutter et al. Evaluation of two devices for point-of-care testing of haemoglobin in neonatal pigs
Thell et al. Standard blood laboratory values as a clinical support tool to distinguish between SARS-CoV-2 positive and negative patients
Lee et al. A comparison of complete blood count reference intervals in healthy elderly vs. younger Korean adults: a large population study
Davidson A survey of some pre-analytical errors identified from the Biochemistry Department of a Scottish hospital
Jeon et al. Establishment of sex-specific reference intervals for automated haematology analyser-delivered research parameters in healthy Korean adults: a retrospective database review
Alsaeed An analysis of hematological parameters to assess the prevalence of anemia in elderly subjects from Saudi Arabia
Bracho Reference intervals of automated reticulocyte count and immature reticulocyte fraction in a pediatric population
Lee et al. Narrowed reference intervals for complete blood count in a multiethnic population
Rodic et al. Relationship between plasma zinc and red blood cell zinc levels in hospitalized patients
Årving et al. Falsely low phosphatidylethanol may be associated with biomarkers of haemolytic disease
Huang et al. Serum N-glycan fingerprint nomogram predicts liver fibrosis: a multicenter study

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20211105

WW01 Invention patent application withdrawn after publication