CN112002412A - 一种基于血常规数据推导疾病的系统、设备、存储介质 - Google Patents
一种基于血常规数据推导疾病的系统、设备、存储介质 Download PDFInfo
- Publication number
- CN112002412A CN112002412A CN202010853268.5A CN202010853268A CN112002412A CN 112002412 A CN112002412 A CN 112002412A CN 202010853268 A CN202010853268 A CN 202010853268A CN 112002412 A CN112002412 A CN 112002412A
- Authority
- CN
- China
- Prior art keywords
- disease
- blood
- data
- blood routine
- routine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 210000004369 blood Anatomy 0.000 title claims abstract description 122
- 239000008280 blood Substances 0.000 title claims abstract description 122
- 201000010099 disease Diseases 0.000 title claims abstract description 112
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 112
- 239000013598 vector Substances 0.000 claims abstract description 29
- 230000002159 abnormal effect Effects 0.000 claims description 18
- 238000000034 method Methods 0.000 claims description 13
- 238000001514 detection method Methods 0.000 claims description 12
- 238000004891 communication Methods 0.000 claims description 9
- 238000012163 sequencing technique Methods 0.000 claims description 7
- 238000012216 screening Methods 0.000 claims description 5
- 230000005802 health problem Effects 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000003745 diagnosis Methods 0.000 abstract description 11
- 230000019771 cognition Effects 0.000 abstract description 3
- 102000001554 Hemoglobins Human genes 0.000 description 10
- 108010054147 Hemoglobins Proteins 0.000 description 10
- 210000000265 leukocyte Anatomy 0.000 description 9
- 210000000601 blood cell Anatomy 0.000 description 8
- 210000003743 erythrocyte Anatomy 0.000 description 8
- 210000001772 blood platelet Anatomy 0.000 description 7
- 210000000440 neutrophil Anatomy 0.000 description 6
- 208000035143 Bacterial infection Diseases 0.000 description 4
- 208000007502 anemia Diseases 0.000 description 4
- 208000022362 bacterial infectious disease Diseases 0.000 description 4
- 238000004820 blood count Methods 0.000 description 4
- 210000004698 lymphocyte Anatomy 0.000 description 4
- 210000003651 basophil Anatomy 0.000 description 3
- 210000003979 eosinophil Anatomy 0.000 description 3
- 208000032839 leukemia Diseases 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 210000001616 monocyte Anatomy 0.000 description 3
- 201000010000 Agranulocytosis Diseases 0.000 description 2
- 208000032467 Aplastic anaemia Diseases 0.000 description 2
- 206010018687 Granulocytopenia Diseases 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 208000014767 Myeloproliferative disease Diseases 0.000 description 2
- 230000001154 acute effect Effects 0.000 description 2
- OVBPIULPVIDEAO-LBPRGKRZSA-N folic acid Chemical compound C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-LBPRGKRZSA-N 0.000 description 2
- 238000011309 routine diagnosis Methods 0.000 description 2
- 238000013214 routine measurement Methods 0.000 description 2
- 206010000830 Acute leukaemia Diseases 0.000 description 1
- 208000032791 BCR-ABL1 positive chronic myelogenous leukemia Diseases 0.000 description 1
- 208000010833 Chronic myeloid leukaemia Diseases 0.000 description 1
- 206010014950 Eosinophilia Diseases 0.000 description 1
- 208000032843 Hemorrhage Diseases 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 208000029462 Immunodeficiency disease Diseases 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 206010024305 Leukaemia monocytic Diseases 0.000 description 1
- 206010025280 Lymphocytosis Diseases 0.000 description 1
- 206010025327 Lymphopenia Diseases 0.000 description 1
- 208000033761 Myelogenous Chronic BCR-ABL Positive Leukemia Diseases 0.000 description 1
- 201000007224 Myeloproliferative neoplasm Diseases 0.000 description 1
- OVBPIULPVIDEAO-UHFFFAOYSA-N N-Pteroyl-L-glutaminsaeure Natural products C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)NC(CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-UHFFFAOYSA-N 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 208000030852 Parasitic disease Diseases 0.000 description 1
- 206010037660 Pyrexia Diseases 0.000 description 1
- 206010053615 Thermal burn Diseases 0.000 description 1
- 208000005485 Thrombocytosis Diseases 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 229930003779 Vitamin B12 Natural products 0.000 description 1
- 206010047700 Vomiting Diseases 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000007815 allergy Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000009534 blood test Methods 0.000 description 1
- FDJOLVPMNUYSCM-WZHZPDAFSA-L cobalt(3+);[(2r,3s,4r,5s)-5-(5,6-dimethylbenzimidazol-1-yl)-4-hydroxy-2-(hydroxymethyl)oxolan-3-yl] [(2r)-1-[3-[(1r,2r,3r,4z,7s,9z,12s,13s,14z,17s,18s,19r)-2,13,18-tris(2-amino-2-oxoethyl)-7,12,17-tris(3-amino-3-oxopropyl)-3,5,8,8,13,15,18,19-octamethyl-2 Chemical compound [Co+3].N#[C-].N([C@@H]([C@]1(C)[N-]\C([C@H]([C@@]1(CC(N)=O)C)CCC(N)=O)=C(\C)/C1=N/C([C@H]([C@@]1(CC(N)=O)C)CCC(N)=O)=C\C1=N\C([C@H](C1(C)C)CCC(N)=O)=C/1C)[C@@H]2CC(N)=O)=C\1[C@]2(C)CCC(=O)NC[C@@H](C)OP([O-])(=O)O[C@H]1[C@@H](O)[C@@H](N2C3=CC(C)=C(C)C=C3N=C2)O[C@@H]1CO FDJOLVPMNUYSCM-WZHZPDAFSA-L 0.000 description 1
- 208000010877 cognitive disease Diseases 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 229960000304 folic acid Drugs 0.000 description 1
- 235000019152 folic acid Nutrition 0.000 description 1
- 239000011724 folic acid Substances 0.000 description 1
- 238000005534 hematocrit Methods 0.000 description 1
- 230000002949 hemolytic effect Effects 0.000 description 1
- 230000002008 hemorrhagic effect Effects 0.000 description 1
- 208000013403 hyperactivity Diseases 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 201000006747 infectious mononucleosis Diseases 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 229960003284 iron Drugs 0.000 description 1
- 231100001023 lymphopenia Toxicity 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 201000006894 monocytic leukemia Diseases 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 208000017520 skin disease Diseases 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 230000003393 splenic effect Effects 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 230000035900 sweating Effects 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 206010043554 thrombocytopenia Diseases 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 239000011715 vitamin B12 Substances 0.000 description 1
- 235000019163 vitamin B12 Nutrition 0.000 description 1
- 230000008673 vomiting Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24147—Distances to closest patterns, e.g. nearest neighbour classification
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Biology (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明公开一种基于血常规数据推导疾病的系统、设备及存储介质,所述系统包括:数据获取模块,用于获取血常规各项指标数据,并进行预处理;知识库模块,用于根据血常规各项指标数据的参考范围确定潜在的疾病名称和疾病知识,构建疾病知识库;模型建立模块,用于建立血常规各项指标参考范围与对应的疾病名称和疾病知识之间的关系的区间判断模型;样本获取模块,用于分别从各项指标对应的区间判断模型中随机选取多个离散数据点组成样本向量;初步判断模块,用于采用KNN算法对待测血常规各项指标数据进行判断,得到对应的疾病名称和疾病知识,生成疾病列表;智能推荐模块,用于结合病例库对疾病列表排序。本发明可实现疾病的智能认知和辅助诊断。
Description
技术领域
本发明涉及医疗辅助设备技术领域,尤其涉及一种血常规数据智能认知疾病的系统、设备及存储介质。
背景技术
血常规是最一般,最基本的血液检验。它主要是对红细胞系统、白细胞系统和血小板系统相关指标进性综合性分析,是诊断、治疗、随访疾病的常用指标。目前,血常规常用的是全自动血细胞分析仪,与传统方法相比,它不仅应用多项检测原理对各项血细胞检测参数进行分析检测,而且可与血涂片制备和染色仪有效结合,进而为临床不同层次需求提供更有效、精确的血细胞检测参数,对疾病的诊断与治疗有着重要的临床意义。但是,即使再先进的血细胞分析仪也存在着自身无法弥补的缺陷,存在着一定的局限性,一般来说,若不做镜检复查,则会出现漏诊、漏检的现象。上述这些方法只是一种血常规数据的测量,需要根据经验或相关诊断标准人为推测疾病,无法为医护人员提供辅助诊断帮助。
发明内容
有鉴于此,本发明提出了一种基于血常规数据推导疾病的系统、设备及存储介质,用于解决不能根据血常规数据的推测疾病的问题。
本发明第一方面,公开一种基于血常规数据推导疾病的系统,所述系统包括:
数据获取模块,用于获取血常规各项指标数据,并进行预处理;
知识库模块:用于根据血常规各项指标数据的参考范围确定潜在的疾病名称和疾病知识,构建疾病知识库;
模型建立模块:用于建立血常规各项指标数据的参考范围与对应的疾病名称和疾病知识之间的关系的区间判断模型;
样本获取模块:用于针对血常规各项指标,分别从对应的区间判断模型中随机选取多个离散数据点组成样本向量;
初步判断模块:用于结合所述样本向量,采用KNN算法对待测血常规各项指标数据进行判断,得到对应的疾病名称和疾病知识,获取判断结果并生成对应报告单。
智能推荐模块:用于根据血常规各项指标检测结果构建血常规向量,对每类疾病,分别从病例库中抽取多个病例,分别计算待测血常向量与各个病例的血常规向量的欧式距离,根据所述欧氏距离对疾病列表排序。优选的,所述数据获取模块中,所述预处理具体为:
按照国际、国内相关指标科学的确定的标准,确定血常规各项指标数据的正常参考范围区间值和异常参考范围区间值,并将血常规各项指标数据划分为正常和异常两个大类,其中异常包括偏高和偏低两个区间。
优选的,所述知识库模块具体用于:根据血常规各项指标数据正常参考范围区间、异常参考范围区间中的偏高和偏低两个区间,确定血常规各项指标数据各个区间对应的潜在的疾病名称和疾病知识,建立血常规各项指标数据各个区间与潜在的疾病名称和疾病知识的对应关系的疾病知识库。
优选的,所述模型建立模块中,所述区间判断模型是基于性别、年龄、各项指标数据区间的联合判断模型。
优选的,所述初步判断模块中,所述结合所述样本向量,采用KNN算法对待测血常规各项指标数据进行判断具体为:
对于血常规各项指标,分别从对应的样本向量中选取与待测血常规指标数据距离最近的K个元素,获取K个元素所属区间范围,统计的K个元素所属区间范围众数,将所述众数所在区间范围作为待测血常规指标数据的区间范围,其中K=3;
若待测血常规指标数据在正常范围内,则判断不存在疾病的风险;若不在正常范围内,则判断用户可能存在风险,并继续按照待测血常规指标数据偏高或偏低匹配判断出潜在的疾病或者健康问题。
优选的,所述智能推荐模块具体用于:
对每项检测指标,分别用-1、0、1表示偏低、正常、偏高,根据血常规各项指标检测结果构建血常规向量;获取所述疾病列表,对疾病列表中的各项疾病,分别从病例库中抽取与待测血常规各项指标数据的病人性别相同、年龄相近的多个病例,分别计算待测血常向量与各个病例的血常规向量的欧式距离,筛选出每类疾病中欧氏距离最小的病例,按照各类疾病欧式距离从小到大的顺序对疾病列表排序。
本发明第二方面,公开一种电子设备,包括:至少一个处理器、至少一个存储器、通信接口和总线;
其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令,以实现本发明第一方面所述的系统。
本发明第三方面,公开一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机实现本发明第一方面所述的系统。
本发明的相对于现有技术具有以下有益效果:
1)本发明基于现行的血常规诊断标准,建立血常规各项指标数据区间与所对应的疾病之间关联关系的知识库,为患者辅助诊断与准确识别提供可靠依据;
2)建立区间判断模型,采用KNN算法实现待判断血常规数据与血常规各项指标数据区间判断模型之间的匹配,实现疾病的智能认知和辅助诊断,根据血常规各项指标检测结果构建血常规向量,从病例库中筛选出与待测血常规数据最接近的病例,从而对疾病推荐列表排序,进一步为医护人员提供了可靠的辅助诊断结果,减少漏报与错报,同时能够提高推荐准确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于血常规数据推导疾病的系统结构示意图。
具体实施方式
下面将结合本发明实施方式,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
如图1所示,本发明提出一种基于血常规数据推导疾病的系统,所述系统包括数据获取模块1、知识库模块2、模型建立模块3、样本获取模块4、初步判断模块5、智能推荐模块6。
所述数据获取模块1,用于获取血常规各项指标数据,并进行预处理,提取血常规各项指标数据正常参考范围区间值和异常参考范围区间值;
血常规的检查一般通过指尖采血进行检验,通常包括的项目有白细胞、红细胞、血小板、血红蛋白、中性粒细胞、嗜酸性粒细胞、嗜碱性粒细胞、淋巴细胞、单核细胞等。具体包括红细胞计数(红细胞压积、平均红细胞体积、红细胞分布宽度)、血红蛋白测定(平均血红蛋白含量、平均血红蛋白浓度)、白细胞计数及其分类计数(中性粒细胞数及百分比、淋巴细胞数及百分比、单核细胞数及百分比、嗜酸性粒细胞数及百分比、嗜碱性粒细胞数及百分比)、血小板计数(血小板体积分布宽度、平均血小板体积、血小板压积、大血小板比率)等。
所述预处理方法为:按照《诊断学》和国际、国内相关指标科学的确定的标准,纳入相对统一的正常参考范围区间值和异常参考范围区间值,并划分为正常和异常二个大类,其中异常包括包括偏高和偏低二个区间。比如,血红蛋白是红细胞内参与氧气运输的一种蛋白质,铁、叶酸、维生素B12是其合成的重要原料。其正常参值为:成年男性一般为120~160g/L;成年女性一般为110~150g/L;新生儿一般为170~200g/L;儿童一般为110~160g/L,超出这个区间即为异常,也就是偏高或者偏低;
所述知识库模块2,用于根据血常规各项指标数据的参考范围确定潜在的疾病名称和疾病指数,构建疾病知识库。不同数据指标(状态)异常变化可能对应不同的疾病以及原因等,多个不同的指标异常也有可能是同一种疾病导致。对这些数据和知识进行预处理。比如白细胞分为中性、嗜酸性、嗜碱性粒细胞、淋巴及单核细胞。白细胞分类的值,均应与白细胞检查值相互配合:才能做出正确的诊断。具体来说,1)、中性粒细胞偏高:可能是细菌感染、炎症或骨髓增殖症;2)、中性粒细胞偏低:可能有再生障碍性贫血或某些药物的副作用;3)、嗜酸性粒细胞过多:可能有过敏、寄生虫感染、各种皮肤病、恶性肿瘤或白血病;4)、嗜碱性粒细胞过多:可能有慢性粒细胞性白血病、骨髓增殖疾病;5)、单核细胞增多:可能在急性细菌感染的恢复期、单核细胞性白血病;6)、淋巴细胞增多:可能感染滤过性病毒或结核菌;7)、淋巴细胞减少:可能有免疫缺乏病、再生障碍性贫血。而在急性感染症的初期,中性粒细胞增加时,淋巴细胞百分比会相对减少等。本发明基于现行的血常规诊断标准,建立血常规各项指标数据区间与所对应的疾病之间关联关系的知识库,为患者辅助诊断与准确识别提供可靠依据;
所述模型建立模块3,用于从疾病知识库中获取血常规各项指标数据的参考范围对应的疾病名称和疾病指数,建立血常规各项指标参考范围数据的区间范围与对应的疾病名称和疾病指数之间的关系的区间判断模型;
由于不同的性别、年龄等因素会直接影响血常规测量数据的结果,所以在建立判断模型时,还需将各项指标数据区间值与性别、年龄等区间结合起来,建立基于性别、年龄与数据区间的联合判断模型。以白细胞计数为例,其正常范围成人一般为(4.0~10.0)×10^9/L(4000~10000/mm3);新生儿一般为(15.0~20.0)×10^9/L(15000~20000/mm3);婴儿一般为(15.0~20.0)×10^9/L;儿童一般为(5.0~12.0)×10^9/L。其异常范围就是在上述范围之外的偏高或者偏低;再比如,我国规定,成年男性血红蛋白浓度是120-160g/L,低于正常范围就是贫血。成年女性血红蛋白是110-150g/L,低于110g/L就是有贫血的情况;
所述样本获取模块4,用于针对血常规各项指标,分别从对应的区间判断模型中随机选取多个离散数据点组成样本向量;
血常规的各项指标都对应一个区间判断模型,包括正常、偏高、偏低区间,每项指标的偏高和偏低区间都有对应的可能存在的疾病名称和相关疾病知识和解决方案,同时有多个不同的指标异常也有对应的可能存在的一个或多个疾病名称和相关疾病知识和解决方案。本发明从各项指标对应的各区间中随机选取一组离散数据,作为KNN算法中已分类的样本数据。
所述初步判断模块5,用于结合所述样本向量,采用KNN算法对待测血常规各项指标数据进行判断,得到对应的疾病名称和疾病知识,获取判断结果并生成对应报告单反馈至用户。
初步判断模块中主要利用采用KNN算法实现待判断血常规数据与血常规各项指标数据的区间判断模型之间的匹配,相较于机械匹配,当待判断数据较为复杂时亦可实现精准匹配。采用KNN算法对待测血常规各项指标数据进行判断具体为:分别计算血常规各项指标数据与对应的样本向量的元素之间的距离,分别从对应的样本向量中选取与待测血常规指标数据距离最近的K个元素,获取K个元素在区间判断模型中所属区间范围,统计的K个元素所属区间范围众数,将所述众数所在区间范围作为待测血常规指标数据的区间范围,其中K=3;若待测血常规指标数据在正常范围内,则判断不存在疾病的风险;若不在正常范围内,则判断用户可能存在风险,并继续按照待测血常规指标数据偏高或偏低匹配判断出潜在的疾病或者健康问题。对于同时有多个不同的指标异常情况,从知识库模块中获取对应的疾病名称和疾病知识。获取待测血常规各项指标数据经过初步判断模块判断后的疾病列表。
比如,如果白细胞出现异常,偏高考虑有细菌感染或者病毒感染;如果白细胞偏低,考虑有粒细胞减少症、白血病等疾病;如果血红蛋白偏低,提示贫血,血红蛋白越低,贫血越严重;红细胞如果偏高,考虑溶血性的指征或者是发热、烫伤、烧伤所导致的。血小板减少主要还是考虑脾功能亢进、白血病等;红细胞计数等增高,考虑是频繁呕吐、出汗、烧伤或者血液浓缩引起,而减少一般考虑是一些急性大出血等疾病引起;白细胞计数偏高,考虑是出现由各种细菌感染引起;血小板计数增高一般考虑是出血性血小板增多症,减少考虑是急性白血病或者脾功能亢进等疾病。
智能推荐模块6:对血常规每项检测指标,分别用-1、0、1表示偏低、正常、偏高,根据血常规各项指标检测结果构建血常规向量;获取所述疾病列表,对疾病列表中的各项疾病,分别从病例库中抽取与待测血常规各项指标数据的病人性别相同、年龄相近的多个病例,分别计算待测血常向量与各个病例的血常规向量的欧式距离,筛选出每类疾病中欧氏距离最小的病例,按照各类疾病欧式距离从小到大的顺序对疾病列表排序。结合实际的病例库,本发明为待测血常规数据筛选出与其性别相、同年龄相近、血常规数据最接近的疾病,进一步提高了疾病辅助诊断的准确度。
本发明提出的一种基于血常规数据推导疾病的系统,是通过上述血常规的测量,获取血常规各项指标数据,建立区间判断模型;然后利用KNN算法实现血常规待判断数据与血常规各项指标数据区间判断模型之间的匹配,产生推荐列表,结合病例库进一步筛选、匹配、排序,实现疾病的智能认知和辅助诊断,同时能够提高匹配准确度,提高用户体验。
本发明还公开一种电子设备,包括:至少一个处理器、至少一个存储器、通信接口和总线;
其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令,以实现本发明前述的基于现行的血常规诊断标准智能识别疾病的系统,包括数据获取模块、知识库模块、模型建立模块、样本获取模块、初步判断模块、智能推荐模块。
本发明还公开一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机实现本发明实施例所述的全部系统或部分系统,例如包括数据获取模块、知识库模块、模型建立模块、样本获取模块、初步判断模块、智能推荐模块。所述存储介质包括:U盘、移动硬盘、只议存储器ROM、随机存取存储器RAM、磁碟或者光盘等各种可以存储程序代码的介质。
此外,需要说明的是,以上所描述的系统实施例仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的,此处不做限制。另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的基于血常规测量数据智能推测疾病的系统,此处不再赘述。
以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种基于血常规数据推导疾病的系统,其特征在于,所述系统包括:
数据获取模块,用于获取血常规各项指标数据,并进行预处理;
知识库模块:用于根据血常规各项指标数据的参考范围确定潜在的疾病名称和疾病知识,构建疾病知识库;
模型建立模块:用于建立血常规各项指标数据的参考范围与对应的疾病名称和疾病知识之间的关系的区间判断模型;
样本获取模块:用于针对血常规各项指标,分别从对应的区间判断模型中随机选取多个离散数据点组成样本向量;
初步判断模块:用于结合所述样本向量,采用KNN算法对待测血常规各项指标数据进行判断,得到对应的疾病名称和疾病知识,生成疾病列表;
智能推荐模块:用于根据血常规各项指标检测结果构建血常规向量,对每类疾病,分别从病例库中抽取多个病例,分别计算待测血常向量与各个病例的血常规向量的欧式距离,根据所述欧氏距离对疾病列表排序。
2.根据权利要求1所述基于血常规数据推导疾病的系统,其特征在于,所述数据获取模块中,所述预处理具体为:
按照国际、国内相关指标科学的确定的标准,确定血常规各项指标数据的正常参考范围区间值和异常参考范围区间值,并将血常规各项指标数据划分为正常和异常两个大类,其中异常包括偏高和偏低两个区间。
3.根据权利要求1所述基于血常规数据推导疾病的系统,其特征在于,所述知识库模块具体用于:根据血常规各项指标数据的正常参考范围区间、异常参考范围区间中的偏高和偏低两个区间,确定血常规各项指标数据各个区间对应的潜在的疾病名称和疾病知识,建立血常规各项指标数据各个区间与潜在的疾病名称和疾病知识的对应关系的疾病知识库。
4.根据权利要求1所述基于血常规数据推导疾病的系统,其特征在于,所述模型建立模块中,所述区间判断模型是基于性别、年龄、各项指标数据区间范围的联合判断模型。
5.根据权利要求1所述基于血常规数据推导疾病的系统,其特征在于,所述初步判断模块中,所述结合所述样本向量,采用KNN算法对待测血常规各项指标数据进行判断具体为:
对于血常规各项指标,分别从对应的样本向量中选取与待测血常规指标数据距离最近的K个元素,获取K个元素在区间判断模型中所属区间范围,统计K个元素所属区间范围众数,将所述众数所在区间范围作为待测血常规指标数据的区间范围,其中K=3;
若待测血常规指标数据在正常范围内,则判断不存在疾病的风险;若不在正常范围内,则判断用户可能存在风险,并继续按照待测血常规指标数据偏高或偏低匹配判断出潜在的疾病或者健康问题。
6.根据权利要求1所述基于血常规数据推导疾病的系统,其特征在于,所述智能推荐模块具体用于:
对每项检测指标,分别用-1、0、1表示偏低、正常、偏高,根据血常规各项指标检测结果构建血常规向量;获取所述疾病列表,对疾病列表中的各项疾病,分别从病例库中抽取与待测血常规各项指标数据的病人性别相同、年龄相近的多个病例,分别计算待测血常向量与各个病例的血常规向量的欧式距离,筛选出每类疾病中欧氏距离最小的病例,按照各类疾病欧式距离从小到大的顺序对疾病列表排序。
7.一种电子设备,其特征在于,包括:至少一个处理器、至少一个存储器、通信接口和总线;
其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令,以实现如权利要求1~6任一项所述的系统。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机实现如权利要求1~6任一项所述的系统。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010853268.5A CN112002412A (zh) | 2020-08-23 | 2020-08-23 | 一种基于血常规数据推导疾病的系统、设备、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010853268.5A CN112002412A (zh) | 2020-08-23 | 2020-08-23 | 一种基于血常规数据推导疾病的系统、设备、存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112002412A true CN112002412A (zh) | 2020-11-27 |
Family
ID=73473758
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010853268.5A Pending CN112002412A (zh) | 2020-08-23 | 2020-08-23 | 一种基于血常规数据推导疾病的系统、设备、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112002412A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112768079A (zh) * | 2021-01-24 | 2021-05-07 | 武汉东湖大数据交易中心股份有限公司 | 一种基于机器学习的肝病认知模型构建方法和系统 |
CN112786191A (zh) * | 2021-01-18 | 2021-05-11 | 吾征智能技术(北京)有限公司 | 一种基于便常规的疾病认知系统、设备、存储介质 |
CN112967810A (zh) * | 2021-05-07 | 2021-06-15 | 四川大学华西医院 | 一种新冠病毒肺炎重症化预测系统及方法 |
CN113539474A (zh) * | 2021-05-14 | 2021-10-22 | 内蒙古卫数数据科技有限公司 | 一种基于常规检验数据的疾病识别方法 |
CN113539475A (zh) * | 2021-05-14 | 2021-10-22 | 内蒙古卫数数据科技有限公司 | 一种仅使用血常规检验数据的疾病筛查和诊断方法 |
CN113571176A (zh) * | 2021-06-19 | 2021-10-29 | 内蒙古卫数数据科技有限公司 | 一种基于血常规检验数据的抑郁症识别方法 |
CN114842978A (zh) * | 2022-07-04 | 2022-08-02 | 佛山科学技术学院 | 一种基于医疗大数据的血气分析智能检测系统及方法 |
CN115223721A (zh) * | 2022-07-12 | 2022-10-21 | 曜立科技(北京)有限公司 | 一种基于元数据的患者心脑血管疾病管数相似性分析系统 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090069639A1 (en) * | 2007-07-31 | 2009-03-12 | Sysmex Corporation | Diagnosis assisting system, diagnosis assisting information providing device and computer program product |
CN106227996A (zh) * | 2016-07-14 | 2016-12-14 | 浙江大学 | 一种临床信息量化系统的构建方法 |
US20170135645A1 (en) * | 2015-11-16 | 2017-05-18 | Samsung Electronics Co., Ltd. | Disease prediction model construction apparatus and method, and disease prediction apparatus |
CN106859618A (zh) * | 2017-03-21 | 2017-06-20 | 中国计量大学 | 一种基于人体状态的健康分析系统 |
CN108717867A (zh) * | 2018-05-02 | 2018-10-30 | 中国科学技术大学苏州研究院 | 基于梯度迭代树的疾病预测模型建立方法及装置 |
CN109346169A (zh) * | 2018-10-17 | 2019-02-15 | 长沙瀚云信息科技有限公司 | 一种人工智能辅助诊疗系统及其构建方法、设备和存储介质 |
CN110504030A (zh) * | 2019-07-12 | 2019-11-26 | 中国人民解放军总医院 | 一种创伤性凝血病预测方法 |
CN110957034A (zh) * | 2018-09-26 | 2020-04-03 | 金敏 | 疾病预测系统 |
CN111241148A (zh) * | 2018-11-29 | 2020-06-05 | 金敏 | 医疗数据整理方法、医疗数据整理装置和电子设备 |
CN111524594A (zh) * | 2020-06-12 | 2020-08-11 | 山东大学 | 目标人群血液系统恶性肿瘤筛查系统 |
CN111524599A (zh) * | 2020-04-24 | 2020-08-11 | 中国地质大学(武汉) | 一种基于机器学习的新冠肺炎数据处理方法及预测系统 |
-
2020
- 2020-08-23 CN CN202010853268.5A patent/CN112002412A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090069639A1 (en) * | 2007-07-31 | 2009-03-12 | Sysmex Corporation | Diagnosis assisting system, diagnosis assisting information providing device and computer program product |
US20170135645A1 (en) * | 2015-11-16 | 2017-05-18 | Samsung Electronics Co., Ltd. | Disease prediction model construction apparatus and method, and disease prediction apparatus |
CN106227996A (zh) * | 2016-07-14 | 2016-12-14 | 浙江大学 | 一种临床信息量化系统的构建方法 |
CN106859618A (zh) * | 2017-03-21 | 2017-06-20 | 中国计量大学 | 一种基于人体状态的健康分析系统 |
CN108717867A (zh) * | 2018-05-02 | 2018-10-30 | 中国科学技术大学苏州研究院 | 基于梯度迭代树的疾病预测模型建立方法及装置 |
CN110957034A (zh) * | 2018-09-26 | 2020-04-03 | 金敏 | 疾病预测系统 |
CN109346169A (zh) * | 2018-10-17 | 2019-02-15 | 长沙瀚云信息科技有限公司 | 一种人工智能辅助诊疗系统及其构建方法、设备和存储介质 |
CN111241148A (zh) * | 2018-11-29 | 2020-06-05 | 金敏 | 医疗数据整理方法、医疗数据整理装置和电子设备 |
CN110504030A (zh) * | 2019-07-12 | 2019-11-26 | 中国人民解放军总医院 | 一种创伤性凝血病预测方法 |
CN111524599A (zh) * | 2020-04-24 | 2020-08-11 | 中国地质大学(武汉) | 一种基于机器学习的新冠肺炎数据处理方法及预测系统 |
CN111524594A (zh) * | 2020-06-12 | 2020-08-11 | 山东大学 | 目标人群血液系统恶性肿瘤筛查系统 |
Non-Patent Citations (4)
Title |
---|
CHERIFA, MENYSSA,等: "Prediction of an Acute Hypotensive Episode During an ICU Hospitalization With a Super Learner Machine-Learning Algorithm", 《ANESTHESIA AND ANALGESIA》, vol. 130, no. 5, pages 1157 - 1166 * |
吴自华: "基于改进模糊支持向量机的哮喘病诊断模型研究与实现", 《中国优秀硕士学位论文全文数据库 医药卫生科技辑》, no. 5, pages 063 - 16 * |
葛小玲,等: "基于人工智能的儿童甲流和乙流辅助诊断模型研究", 《复旦学报(医学版) 》, vol. 48, no. 6, pages 810 - 818 * |
陈敏,等编: "《认知计算导论》", vol. 1, 30 April 2017, 华中科技大学出版社, pages: 293 - 294 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112786191A (zh) * | 2021-01-18 | 2021-05-11 | 吾征智能技术(北京)有限公司 | 一种基于便常规的疾病认知系统、设备、存储介质 |
CN112786191B (zh) * | 2021-01-18 | 2023-12-05 | 吾征智能技术(北京)有限公司 | 一种基于便常规的疾病认知系统、设备、存储介质 |
CN112768079A (zh) * | 2021-01-24 | 2021-05-07 | 武汉东湖大数据交易中心股份有限公司 | 一种基于机器学习的肝病认知模型构建方法和系统 |
CN112967810A (zh) * | 2021-05-07 | 2021-06-15 | 四川大学华西医院 | 一种新冠病毒肺炎重症化预测系统及方法 |
CN113539474A (zh) * | 2021-05-14 | 2021-10-22 | 内蒙古卫数数据科技有限公司 | 一种基于常规检验数据的疾病识别方法 |
CN113539475A (zh) * | 2021-05-14 | 2021-10-22 | 内蒙古卫数数据科技有限公司 | 一种仅使用血常规检验数据的疾病筛查和诊断方法 |
CN113571176A (zh) * | 2021-06-19 | 2021-10-29 | 内蒙古卫数数据科技有限公司 | 一种基于血常规检验数据的抑郁症识别方法 |
CN114842978A (zh) * | 2022-07-04 | 2022-08-02 | 佛山科学技术学院 | 一种基于医疗大数据的血气分析智能检测系统及方法 |
CN115223721A (zh) * | 2022-07-12 | 2022-10-21 | 曜立科技(北京)有限公司 | 一种基于元数据的患者心脑血管疾病管数相似性分析系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112002412A (zh) | 一种基于血常规数据推导疾病的系统、设备、存储介质 | |
Da Costa | Digital image analysis of blood cells | |
CN113053535B (zh) | 一种医疗信息预测系统及医疗信息预测方法 | |
CN104949944B (zh) | 血液分析装置 | |
CN109270281A (zh) | 提高白细胞分类结果准确性和计数结果重复性的方法及设备 | |
US20110077870A1 (en) | Blood cell counter, diagnosis support method and computer program product | |
CN108732338A (zh) | 一种可兼容白细胞五分类和白细胞三分群的血细胞分析仪及测试方法 | |
WO2023186051A1 (zh) | 辅助诊断方法及装置、构建装置、分析装置及相关产品 | |
Khodaiji | Newer CBC parameters of clinical significance | |
CN109545377B (zh) | 获取肾小球滤过率的模型的建立方法 | |
WO2021246334A1 (ja) | 多項目自動血球計数装置 | |
Tammis-Hadjopoulos et al. | Improved detection of β-thalassaemia carriers by a two-test method | |
CN113436739A (zh) | 一种利用血液大数据分析进行健康体检的方法和系统 | |
Tasneem et al. | Clinical utility of red blood cell count, red cell distribution width: will it provide more accurate differentiation of Beta thalassemia trait and iron deficiency anemia in pregnancy | |
Arroyo et al. | Evaluation of a CD61 MoAb method for enumeration of platelets in thrombocytopenic patients and its impact on the transfusion decision‐making process | |
Livshits et al. | Back to the “Gold Standard”: How Precise is Hematocrit Detection Today? | |
Genevieve et al. | Smear microscopy revision: propositions by the GFHC | |
Sasikala et al. | Curability prediction model for anemia using machine learning | |
Gajbhiye et al. | Blood Report Analysis-A Review | |
CN108254572A (zh) | 鞘内IgG的计算方法及设备、测定方法和计算机可读存储介质 | |
Gupta et al. | Relevance of peripheral blood smear examination in diagnosis of anemia in an era of automation | |
CN109948732B (zh) | 基于非平衡学习的异常细胞远处转移分类方法及系统 | |
Charache et al. | Accuracy and utility of differential white blood cell count in the neonatal intensive care unit | |
Fernández‐Suárez et al. | Immature granulocyte detection by the SE‐9000 haematology analyser during pregnancy | |
CN118275660A (zh) | 血液样本分析装置、血液样本分析系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |