CN113611420A - 一种基于血液检查指标的疾病筛查方法和系统 - Google Patents
一种基于血液检查指标的疾病筛查方法和系统 Download PDFInfo
- Publication number
- CN113611420A CN113611420A CN202110917580.0A CN202110917580A CN113611420A CN 113611420 A CN113611420 A CN 113611420A CN 202110917580 A CN202110917580 A CN 202110917580A CN 113611420 A CN113611420 A CN 113611420A
- Authority
- CN
- China
- Prior art keywords
- disease
- blood
- model
- cancer
- screening model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30096—Tumor; Lesion
Landscapes
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Public Health (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biomedical Technology (AREA)
- Physics & Mathematics (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Pathology (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Quality & Reliability (AREA)
- Evolutionary Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明公开一种基于血液检查指标的疾病筛查方法和系统,属于医疗数据处理领域,包括数据获取模块,其用于获取血常规化验单、血生化化验单、肿瘤标志物化验单图片,识别血常规、血生化、肿瘤标志物化验单图片中检测指标、年龄、性别,或直接从电子数据中导入相关数据;疾病筛查模块,其用于基于健康初筛模型和疾病筛查模型,预测出相应待筛查者是否存在特定的疾病。其中,健康初筛模型的训练过程为:对健康人群与疾病人群建立分类学习样本,利用学习样本训练机器学习算法模型,得到健康初筛模型;疾病筛查模型的训练过程为:对特定疾病人群和其他疾病人群建立分类学习样本,利用学习样本训练机器学习算法模型,得到特定疾病筛查模型。本发明利用血常规、血生化指标、肿瘤标志物筛查特定疾病,创新了疾病筛查预警的模式。
Description
技术领域
本发明属于医疗数据处理领域,一种基于血液检查指标的疾病筛查方法和系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
血常规、血生化、肿瘤标志物中包含了大量的人体健康信息,许多项具体指标都是一些常用的敏感指标,对机体内许多病理改变都有敏感反映,许多患者在病因不明时可以做血液检查对其进行辅助诊断。此外,血液还是观察治疗效果、用药或停药、继续治疗或停止治疗、疾病复发或痊愈的常用指标。
目前对血常规、血生化、肿瘤标志物的解读往往是较为单一的指标升高降低,在研究中我们发现有些疾病可以通过对大量指标的综合分析来计算出来。血液检查在日常的就诊中经常进行,如果能通过血常规、血生化、肿瘤标志物的结果准确预警一些健康风险,可以做到在不增加检查成本的前提下,发现并提示更多的健康风险。
发明内容
为了解决上述问题,本发明提供一种基于血液检查指标的疾病筛查方法和系统,利用血常规、血生化、肿瘤标志物检测指标来筛查特定疾病,创新了疾病筛查预警的模式。
为了实现上述目的,本发明采用如下技术方案:
数据获取模块,其用于获取血常规化验单、血生化化验单、肿瘤标志物化验单图片,识别血常规、血生化、肿瘤标志物化验单图片中检测指标、年龄、性别,或直接从电子数据中导入相关数据;
疾病筛查模块,其用于基于健康初筛模型和疾病筛查模型,预测出相应待筛查者是否存在特定的疾病;
其中,健康初筛模型的训练过程为:对健康人群与疾病人群建立学习样本,利用学习样本训练机器学习算法模型,得到健康初筛模型。疾病筛查模型的训练过程为:对特定疾病人群和其他疾病人群建立分类学习样本;利用学习样本训练机器学习算法模型,得到特定疾病筛查模型。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的基于血液检查指标的疾病筛查方法和系统结构示意图。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
图1给出了本实施例的一种基于血液检查指标的疾病筛查方法和系统,其包括:
(1) 数据获取模块,其用于获取血常规化验单、血生化化验单、肿瘤标志物化验单图片,识别血常规、血生化、肿瘤标志物化验单图片中检测指标、年龄、性别,或直接从电子数据中导入相关数据。
其中血常规指标包括白细胞计数(WBC),红细胞计数(RBC),血红蛋白(Hb),红细胞比容(Hct),平均红细胞体积(MCV),平均红细胞血红蛋白含量(MCH),平均红细胞血红蛋白浓度(MCHC),血小板计数(PLT),淋巴细胞百分比(Lymph%),单核细胞百分比(Mono%),中性粒细胞百分比(Neut%),嗜酸性粒细胞百分比(Eos%),嗜碱性粒细胞百分比(Baso%),淋巴细胞计数(Lymph),单核细胞计数(Mono),中性粒细胞计数(Neut),嗜酸性粒细胞计数(Eos),嗜碱性粒细胞计数(Baso),红细胞体积分布宽度CV(RDW-CV),红细胞体积分布宽度SD(RDW-SD),血小板分布宽度(PDW),平均血小板体积(MPV),大血小板百分比(P-LCR%),血小板比容(PCT)。
其中血生化指标包括谷草转氨酶(AST),谷丙转氨酶(ALT),谷草转氨酶/谷丙转氨酶(S/L),谷氨酰转肽酶(GGT),碱性磷酸酶(ALP),总蛋白(TP),白蛋白(ALB),球蛋白(GLO),白蛋白/球蛋白(A/G),总胆红素(TBIL),直接胆红素(DBIL),间接胆红素(IBIL),总胆固醇(CHOL),高密度脂蛋白(HDL-C),低密度脂蛋白(LDL/C),甘油三酯(TG),葡萄糖(GLU),尿素氮(BUN),肌酐(CREA),尿素氮/肌酐(BUN/CREA),尿酸(URIC)。
其中肿瘤标志物为AFP、CEA、Cyfra21-1、CA199、CA242、CA125、SCC、PSA。
利用图像采集装置采集血常规化验单、血生化化验单、肿瘤标志物化验单图片,将血常规化验单、血生化化验单、肿瘤标志物化验单图片上传到服务器;服务器会自动识别血常规指标、血生化指标、肿瘤标志物指标以及年龄与性别。
具体地,识别血常规化验单图片中血常规检测指标、血生化检查指标、肿瘤标志物指标、年龄和性别的方法可采用现有图像分割及语义识别方法来实现,此处不再累述。
(2) 疾病筛查模块,其用于基于健康初筛模型和疾病筛查模型,预测出相应待筛查者是否存在特定的疾病。
步骤1:健康初筛模型的训练过程为:对健康人群与疾病人群建立学习样本,利用学习样本训练机器学习算法模型,得到健康初筛模型。疾病筛查模型的训练过程为:对特定疾病人群和其他疾病人群建立分类学习样本;利用学习样本训练机器学习算法模型,得到特定疾病筛查模型。
其中,机器学习算法模型可以为预设的算法,SVM、随机森林算法、LightGBM算法或XGBoost算法。机器学习算法模型也可为经多个算法比较后筛选出的最优机器学习算法模型。
健康初筛模型和疾病筛查模型计算特征的选取,可以利用血常规数据、血生化、肿瘤标志物的部分指标或全部指标。
步骤2:计算特定疾病风险,首先使用健康初筛模型判断测验者是否具有待测疾病风险,然后使用多个特定疾病筛查模型逐一排查测验者特定疾病风险。
对于本领域的技术人员来说,本发明可以有各种更改和变化,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种基于血液检查指标的疾病筛查方法和系统,其特征在于,包括:
数据获取模块,其用于获取血常规化验单、血生化化验单、肿瘤标志物化验单图片,识别血常规、血生化、肿瘤标志物化验单图片中检测指标、年龄、性别,或直接从电子数据中导入相关数据;
疾病筛查模块,其用于基于健康初筛模型和疾病筛查模型,预测出相应待筛查者是否存在特定的疾病;
其中,健康初筛模型的训练过程为:对健康人群与疾病人群建立学习样本,利用学习样本训练机器学习算法模型,得到健康初筛模型;
疾病筛查模型的训练过程为:对特定疾病人群和其他疾病人群建立分类学习样本;利用学习样本训练机器学习算法模型,得到特定疾病筛查模型。
2.如权利要求1所述的一种基于血液检查指标的疾病筛查方法和系统,其特征在于,特定疾病人群包括妊娠、睡眠呼吸暂停、肾病综合征、慢性肾衰竭、乙型肝炎肝硬化、系统性红斑狼疮、1型糖尿病、2型糖尿病、急性胰腺炎、白血病、肺癌、肝癌、胃癌、食癌、结直肠癌、乳腺癌、宫颈癌、肾癌、胰腺癌、甲状腺癌、前列腺癌、卵巢癌、鼻咽癌。
3.如权利要求1所述的一种基于血液检查指标的疾病筛查方法和系统,其特征在于,其他疾病人群包括,排除了一个特定疾病人群后患有其他疾病的人群。
4.如权利要求1所述的一种基于血液检查指标的疾病筛查方法和系统,其特征在于,用于机器学习的训练数据可以利用血常规数据、血生化、肿瘤标志物的部分指标或全部指标进行训练,只要满足模型评价指标要求,就可以作为一个健康初筛模型和疾病筛查模型。
5.如权利要求4所述的一种基于血液检查指标的疾病筛查方法和系统,其特征在于,模型评价指标包括预测正确率、AUC、灵敏度、特异度。
6.如权利要求5所述的一种基于血液检查指标的疾病筛查方法和系统,其特征在于,健康初筛模型和疾病筛查模型的训练过程中,利用样本集合训练多种机器学习算法模型;利用预测值误差来比较所有训练的机器学习算法模型,利用准确性最高的机器学习算法模型生成最优健康初筛模型和疾病筛查模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110917580.0A CN113611420A (zh) | 2021-08-11 | 2021-08-11 | 一种基于血液检查指标的疾病筛查方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110917580.0A CN113611420A (zh) | 2021-08-11 | 2021-08-11 | 一种基于血液检查指标的疾病筛查方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113611420A true CN113611420A (zh) | 2021-11-05 |
Family
ID=78340201
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110917580.0A Withdrawn CN113611420A (zh) | 2021-08-11 | 2021-08-11 | 一种基于血液检查指标的疾病筛查方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113611420A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113889267A (zh) * | 2021-11-15 | 2022-01-04 | 博奥生物集团有限公司 | 基于眼象识别的糖尿病诊断模型的构建方法和电子设备 |
CN115472292A (zh) * | 2022-09-14 | 2022-12-13 | 重庆大学附属肿瘤医院 | 基于外周血标志物构建肺癌风险预测模型的方法 |
CN115527673A (zh) * | 2022-09-19 | 2022-12-27 | 内蒙古卫数数据科技有限公司 | 一种基于大数据的心理健康风险筛查系统及其方法 |
CN115684570A (zh) * | 2022-08-02 | 2023-02-03 | 首都医科大学附属北京朝阳医院 | 传染病检测装置、设备、系统、介质及程序产品 |
CN116106534A (zh) * | 2023-04-11 | 2023-05-12 | 南京品生医学检验实验室有限公司 | 生物标志物组合在制备肺癌预测产品中的应用 |
CN118116579A (zh) * | 2024-03-19 | 2024-05-31 | 内蒙古卫数数据科技有限公司 | 一种基于多维度检验数据的疾病早筛模型的构建方法 |
-
2021
- 2021-08-11 CN CN202110917580.0A patent/CN113611420A/zh not_active Withdrawn
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113889267A (zh) * | 2021-11-15 | 2022-01-04 | 博奥生物集团有限公司 | 基于眼象识别的糖尿病诊断模型的构建方法和电子设备 |
CN115684570A (zh) * | 2022-08-02 | 2023-02-03 | 首都医科大学附属北京朝阳医院 | 传染病检测装置、设备、系统、介质及程序产品 |
CN115684570B (zh) * | 2022-08-02 | 2024-04-12 | 首都医科大学附属北京朝阳医院 | 传染病检测装置、设备、系统、介质及程序产品 |
CN115472292A (zh) * | 2022-09-14 | 2022-12-13 | 重庆大学附属肿瘤医院 | 基于外周血标志物构建肺癌风险预测模型的方法 |
CN115527673A (zh) * | 2022-09-19 | 2022-12-27 | 内蒙古卫数数据科技有限公司 | 一种基于大数据的心理健康风险筛查系统及其方法 |
CN116106534A (zh) * | 2023-04-11 | 2023-05-12 | 南京品生医学检验实验室有限公司 | 生物标志物组合在制备肺癌预测产品中的应用 |
CN118116579A (zh) * | 2024-03-19 | 2024-05-31 | 内蒙古卫数数据科技有限公司 | 一种基于多维度检验数据的疾病早筛模型的构建方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113611420A (zh) | 一种基于血液检查指标的疾病筛查方法和系统 | |
Oosterhuis et al. | Total error vs. measurement uncertainty: revolution or evolution? | |
DeNicola | Advances in hematology analyzers | |
Paltrinieri et al. | Haematological and biochemical reference intervals of four feline breeds | |
Fleming et al. | UF-1000 i: validation of the body fluid mode for counting cells in body fluids | |
CN114093517A (zh) | 一种基于血液指标、cfDNA的癌症筛查方法和系统 | |
Duhalde et al. | Point-of-care hemolysis detection in blood gas specimens directly at the emergency department | |
L. van Pelt et al. | Reference intervals for Sysmex XN hematological parameters as assessed in the Dutch Lifelines cohort | |
CN113643812A (zh) | 一种基于血液检查指标的肿瘤风险倍数计算方法和系统 | |
CN112768079A (zh) | 一种基于机器学习的肝病认知模型构建方法和系统 | |
Manel et al. | Hepatic proteins and inflammatory markers in rheumatoid arthritis patients | |
Nikolac Gabaj et al. | Ascorbic acid in urine still compromises urinalysis results | |
Hwang et al. | Automated nucleated RBC measurement using the sysmex XE-5000 hematology analyzer: frequency and clinical significance of the nucleated RBCs | |
Tan et al. | Impact of delta check time intervals on error detection capability | |
Kutter et al. | Evaluation of two devices for point-of-care testing of haemoglobin in neonatal pigs | |
Thell et al. | Standard blood laboratory values as a clinical support tool to distinguish between SARS-CoV-2 positive and negative patients | |
Lee et al. | A comparison of complete blood count reference intervals in healthy elderly vs. younger Korean adults: a large population study | |
Davidson | A survey of some pre-analytical errors identified from the Biochemistry Department of a Scottish hospital | |
Jeon et al. | Establishment of sex-specific reference intervals for automated haematology analyser-delivered research parameters in healthy Korean adults: a retrospective database review | |
Alsaeed | An analysis of hematological parameters to assess the prevalence of anemia in elderly subjects from Saudi Arabia | |
Bracho | Reference intervals of automated reticulocyte count and immature reticulocyte fraction in a pediatric population | |
Lee et al. | Narrowed reference intervals for complete blood count in a multiethnic population | |
Rodic et al. | Relationship between plasma zinc and red blood cell zinc levels in hospitalized patients | |
Årving et al. | Falsely low phosphatidylethanol may be associated with biomarkers of haemolytic disease | |
Huang et al. | Serum N-glycan fingerprint nomogram predicts liver fibrosis: a multicenter study |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20211105 |
|
WW01 | Invention patent application withdrawn after publication |