CN112259220B - 一种基于鼻出血伴随症状预测疾病的系统、设备、存储介质 - Google Patents
一种基于鼻出血伴随症状预测疾病的系统、设备、存储介质 Download PDFInfo
- Publication number
- CN112259220B CN112259220B CN202011063688.XA CN202011063688A CN112259220B CN 112259220 B CN112259220 B CN 112259220B CN 202011063688 A CN202011063688 A CN 202011063688A CN 112259220 B CN112259220 B CN 112259220B
- Authority
- CN
- China
- Prior art keywords
- disease
- clustering
- data
- epistaxis
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 86
- 208000001780 epistaxis Diseases 0.000 title claims abstract description 77
- 201000010099 disease Diseases 0.000 title claims abstract description 75
- 208000024891 symptom Diseases 0.000 title claims abstract description 44
- 208000011309 nasal bleeding Diseases 0.000 title claims abstract description 39
- 241000283153 Cetacea Species 0.000 claims abstract description 33
- 208000032843 Hemorrhage Diseases 0.000 claims abstract description 19
- 208000034158 bleeding Diseases 0.000 claims abstract description 18
- 230000000740 bleeding effect Effects 0.000 claims abstract description 17
- 230000009885 systemic effect Effects 0.000 claims abstract description 13
- 239000013598 vector Substances 0.000 claims description 29
- 238000000034 method Methods 0.000 claims description 28
- 238000005457 optimization Methods 0.000 claims description 10
- 238000004891 communication Methods 0.000 claims description 9
- 230000006399 behavior Effects 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000007246 mechanism Effects 0.000 claims description 4
- 230000000694 effects Effects 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 3
- 238000000638 solvent extraction Methods 0.000 claims description 3
- 238000003745 diagnosis Methods 0.000 abstract description 8
- 210000003928 nasal cavity Anatomy 0.000 description 9
- 210000001331 nose Anatomy 0.000 description 7
- 239000008280 blood Substances 0.000 description 6
- 210000004369 blood Anatomy 0.000 description 6
- 210000000492 nasalseptum Anatomy 0.000 description 5
- 210000003695 paranasal sinus Anatomy 0.000 description 5
- 206010028748 Nasal obstruction Diseases 0.000 description 4
- 206010039101 Rhinorrhoea Diseases 0.000 description 4
- 208000010753 nasal discharge Diseases 0.000 description 4
- 206010028980 Neoplasm Diseases 0.000 description 3
- 206010036790 Productive cough Diseases 0.000 description 3
- 208000035475 disorder Diseases 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 208000014951 hematologic disease Diseases 0.000 description 3
- 230000002439 hemostatic effect Effects 0.000 description 3
- 210000001989 nasopharynx Anatomy 0.000 description 3
- 210000003802 sputum Anatomy 0.000 description 3
- 208000024794 sputum Diseases 0.000 description 3
- 206010001076 Acute sinusitis Diseases 0.000 description 2
- 206010003210 Arteriosclerosis Diseases 0.000 description 2
- 201000008283 Atrophic Rhinitis Diseases 0.000 description 2
- 206010011224 Cough Diseases 0.000 description 2
- 208000034507 Haematemesis Diseases 0.000 description 2
- 206010020772 Hypertension Diseases 0.000 description 2
- 206010062237 Renal impairment Diseases 0.000 description 2
- 206010039088 Rhinitis atrophic Diseases 0.000 description 2
- 206010047700 Vomiting Diseases 0.000 description 2
- 230000001154 acute effect Effects 0.000 description 2
- 208000011775 arteriosclerosis disease Diseases 0.000 description 2
- 208000027503 bloody stool Diseases 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 208000002173 dizziness Diseases 0.000 description 2
- 208000035861 hematochezia Diseases 0.000 description 2
- 208000014674 injury Diseases 0.000 description 2
- 230000009191 jumping Effects 0.000 description 2
- 230000005977 kidney dysfunction Effects 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 208000019423 liver disease Diseases 0.000 description 2
- 230000005976 liver dysfunction Effects 0.000 description 2
- 210000003800 pharynx Anatomy 0.000 description 2
- 230000008733 trauma Effects 0.000 description 2
- 206010000087 Abdominal pain upper Diseases 0.000 description 1
- 208000032467 Aplastic anaemia Diseases 0.000 description 1
- 206010003173 Arterial rupture Diseases 0.000 description 1
- 208000000412 Avitaminosis Diseases 0.000 description 1
- 208000019838 Blood disease Diseases 0.000 description 1
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- 206010008479 Chest Pain Diseases 0.000 description 1
- 206010008469 Chest discomfort Diseases 0.000 description 1
- 208000017667 Chronic Disease Diseases 0.000 description 1
- 206010009137 Chronic sinusitis Diseases 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 201000006306 Cor pulmonale Diseases 0.000 description 1
- 206010014080 Ecchymosis Diseases 0.000 description 1
- 206010014561 Emphysema Diseases 0.000 description 1
- 208000031220 Hemophilia Diseases 0.000 description 1
- 208000009292 Hemophilia A Diseases 0.000 description 1
- 208000017604 Hodgkin disease Diseases 0.000 description 1
- 101001018064 Homo sapiens Lysosomal-trafficking regulator Proteins 0.000 description 1
- 206010020880 Hypertrophy Diseases 0.000 description 1
- 206010021135 Hypovitaminosis Diseases 0.000 description 1
- 206010062717 Increased upper airway secretion Diseases 0.000 description 1
- 102100033472 Lysosomal-trafficking regulator Human genes 0.000 description 1
- 208000005450 Maxillary Sinus Neoplasms Diseases 0.000 description 1
- 235000010703 Modiola caroliniana Nutrition 0.000 description 1
- 244000038561 Modiola caroliniana Species 0.000 description 1
- 208000002454 Nasopharyngeal Carcinoma Diseases 0.000 description 1
- 208000001894 Nasopharyngeal Neoplasms Diseases 0.000 description 1
- 206010061306 Nasopharyngeal cancer Diseases 0.000 description 1
- 206010028813 Nausea Diseases 0.000 description 1
- 208000030880 Nose disease Diseases 0.000 description 1
- 208000005374 Poisoning Diseases 0.000 description 1
- 208000003251 Pruritus Diseases 0.000 description 1
- 208000004186 Pulmonary Heart Disease Diseases 0.000 description 1
- 206010037660 Pyrexia Diseases 0.000 description 1
- 206010039085 Rhinitis allergic Diseases 0.000 description 1
- 208000025865 Ulcer Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 201000010105 allergic rhinitis Diseases 0.000 description 1
- 230000010100 anticoagulation Effects 0.000 description 1
- 210000002565 arteriole Anatomy 0.000 description 1
- 230000000721 bacterilogical effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000004204 blood vessel Anatomy 0.000 description 1
- 208000001969 capillary hemangioma Diseases 0.000 description 1
- 210000004004 carotid artery internal Anatomy 0.000 description 1
- 235000019219 chocolate Nutrition 0.000 description 1
- 208000027157 chronic rhinosinusitis Diseases 0.000 description 1
- 230000015271 coagulation Effects 0.000 description 1
- 238000005345 coagulation Methods 0.000 description 1
- 238000002591 computed tomography Methods 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 206010013023 diphtheria Diseases 0.000 description 1
- 230000009429 distress Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 210000001198 duodenum Anatomy 0.000 description 1
- 230000003628 erosive effect Effects 0.000 description 1
- 210000003238 esophagus Anatomy 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 239000006260 foam Substances 0.000 description 1
- 239000010794 food waste Substances 0.000 description 1
- 210000004051 gastric juice Anatomy 0.000 description 1
- 210000001983 hard palate Anatomy 0.000 description 1
- 201000000615 hard palate cancer Diseases 0.000 description 1
- 201000011066 hemangioma Diseases 0.000 description 1
- 208000018706 hematopoietic system disease Diseases 0.000 description 1
- 208000021760 high fever Diseases 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000007803 itching Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 201000004488 maxillary sinus cancer Diseases 0.000 description 1
- 208000019303 maxillary sinus carcinoma Diseases 0.000 description 1
- 208000007106 menorrhagia Diseases 0.000 description 1
- 230000003821 menstrual periods Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000004877 mucosa Anatomy 0.000 description 1
- 239000007923 nasal drop Substances 0.000 description 1
- 229940100662 nasal drops Drugs 0.000 description 1
- 210000002850 nasal mucosa Anatomy 0.000 description 1
- 201000009240 nasopharyngitis Diseases 0.000 description 1
- 201000011216 nasopharynx carcinoma Diseases 0.000 description 1
- 230000008693 nausea Effects 0.000 description 1
- 231100000862 numbness Toxicity 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 208000026435 phlegm Diseases 0.000 description 1
- 231100000572 poisoning Toxicity 0.000 description 1
- 230000000607 poisoning effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 206010039083 rhinitis Diseases 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 230000008961 swelling Effects 0.000 description 1
- 208000004371 toothache Diseases 0.000 description 1
- 210000001944 turbinate Anatomy 0.000 description 1
- 231100000397 ulcer Toxicity 0.000 description 1
- 235000018648 unbalanced nutrition Nutrition 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 208000030401 vitamin deficiency disease Diseases 0.000 description 1
- 150000003722 vitamin derivatives Chemical class 0.000 description 1
- 230000008673 vomiting Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Primary Health Care (AREA)
- Evolutionary Biology (AREA)
- Epidemiology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Probability & Statistics with Applications (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
本发明公开一种基于鼻出血伴随症状预测疾病的系统、设备、存储介质,所述系统包括:数据获取模块,用于从病例库中获取病例鼻出血伴随症状以及对应的疾病名称,建立鼻出血疾病原始数据集;数据划分模块,用于将鼻出血分为局部疾病和全身疾病,并对鼻出血疾病原始数据集进行数据划分;向量化模块:用于对鼻出血伴随症状进行向量化表示;数据聚类模块,用于分别采用基于改进的鲸鱼算法优化的聚类算法对对局部疾病数据集和全身疾病数据集聚类;疾病预测模块,用于对待测病例进行数据划分和聚类,在聚类类别中通过计算语义相似度的方式进行疾病预测。本发明采用改进的鲸鱼算法对病例聚类,然后再进行疾病细分,提高辅助诊断速度。
Description
技术领域
本发明属于疾病辅助诊断设备,涉及一种基于鼻出血伴随症状预测疾病的系统、设备、存储介质。
背景技术
鼻出血(epistaxis)是鼻腔疾病的常见症状之一,也可由全身疾病引起,偶有鼻腔邻近病变出血经鼻腔流出者,后者称之为借道鼻出血。鼻出血是身体发出的求救信号。引起鼻出血的原因非常复杂,包括全身性和局部性两种,很多时候,鼻出血是疾病的一种表现。其中,全身性疾病包括:高血压、动脉硬化,老年人更常见,因体内血管脆度增加导致鼻部易出血;白血病、再生障碍性贫血、血友病等血液系统疾病;长期使用抗凝药物,例如支架手术后患者等,凝血机制遭到一定程度破坏;营养不均衡,平时摄入维生素较少;肝肾功能障碍等慢性病。局部性原因则包括鼻外伤,过敏性鼻炎,急慢性鼻窦炎,鼻中隔偏曲,鼻腔、鼻窦及鼻咽部肿瘤等。
目前,鼻出血诊断的方法一般有:局部一般详细检查鼻腔、鼻咽部,必要时进行X线平片、CT扫描、鼻及鼻窦内窥镜检查;对伴有高热者,一般通过血液及细菌学的检查,以排除血液病及急性传染病。现有的诊断方法仍然依靠繁琐的辅助筛查,缺乏一种简单实用的辅助诊断系统。
发明内容
有鉴于此,本发明提出了一种基于鼻出血伴随症状预测疾病的系统、设备、存储介质,用于解决现有鼻出血诊断筛查方式繁琐的问题,提供一种简单实用的鼻出血辅助诊断系统。
本发明第一方面,提出一种基于鼻出血伴随症状预测疾病的系统,所述系统包括:
数据获取模块:用于从病例库中获取以鼻出血作为临床第一主诉症状病例,获取病例鼻出血伴随症状以及对应的疾病名称,建立鼻出血疾病原始数据集;
数据划分模块:用于根据鼻出血发病的原因,将鼻出血分为局部疾病和全身疾病,并对鼻出血疾病原始数据集进行数据划分;
向量化模块:用于分别提取数据集中每类疾病对应的鼻出血伴随症状的关键特征,对鼻出血伴随症状进行向量化表示;
数据聚类模块:用于分别采用基于改进的鲸鱼算法优化的聚类算法对对局部疾病数据集和全身疾病数据集聚类;
疾病预测模块:用于对待测病例进行数据划分和聚类,在聚类类别中通过计算语义相似度的方式进行疾病预测。
优选的,所述聚类模块具体用于:
初始化鲸鱼优化算法所需参数和鲸群位置;
通过适应度函数计算鲸群个体的适应度,筛选出最佳位置;
基于当前最佳位置进行包围猎物、狩猎行为、搜索猎物,搜索猎物的过程中通过莱维飞行优化搜索位置;
若位置更新后的鲸群个体的适应度高于更新前的适应度,采用更新后的位置替代原位置,否则保留原位置;迭代更新直到达到设定迭代次数或者适应度值小于设定精度。
优选的,所述包围猎物和狩猎行为时,计算系数向量A、C:
A=2ar1-a,a=2-2t/Tmax
C=2r2
r1、r2均为取值范围在[0,1]之间的随机向量,t为当前迭代次数,Tmax为最大迭代次数;
当|A|<1,鲸鱼有Pi的概率选择收缩包围机制和1-Pi的概率选择螺旋狩猎行为来更新鲸鱼的位置,位置更新公式为:
p为[0,1]之间的一个随机数,Pi为(0,1)之间的常数,
优选的,当|A|≥1,搜索猎物,通过莱维飞行优化搜索位置的位置更新公式为:
其中,X*(t)为当前全局最优位置,X(t)为鲸鱼当前位置,为点对点乘法,Levy(β)表示参数为β的莱维分布,/>其中,
Γ为标准的gamma函数,u、v均服从正态分布。
优选的,所述预测模块具体包括:
数据划分单元:用于分别从向量化的局部疾病数据集和全身疾病数据集中随机选取多个向量,分别计算上述多个向量的均值向量,分别计算待测病例的鼻出血伴随症状特征向量与所述均值向量之间的欧式距离,选取距离最小的均指向量所在数据集作为待测病例的数据划分结果;
聚类单元:用于计算待测病例的鼻出血伴随症状特征向量与对应的数据集的聚类中心点之间的欧式距离,对待测疾病聚类;
相似度计算单元:用于计算待测病例的鼻出血伴随症状特征向量与待测疾病聚类类别中各个样本的余弦相似度,并将对应的疾病名称按照相似度降序排列作为疾病预测结果。
本发明第二方面,公开一种电子设备,包括:至少一个处理器、至少一个存储器、通信接口和总线;
其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令,以实现版本发明第一方面所述的系统。
本发明第三方面,公开一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机实现本发明第一方面所述的系统。
本发明相对于现有技术具有以下有益效果:
本发明在对数据集初步划分之后,在鲸鱼优化算法中引入莱维飞行策略并应用于数据集的K均值聚类,莱维飞行可以提高不确定环境下的搜索效率,莱维飞行具有更广泛的搜索能力,因此能够扩大搜索范围,应用于鲸鱼优化算法能够提高鲸群的活力和跳跃能力,避免陷入局部最优,提高算法的全局寻优能力,从而实现鼻出血相关疾病的高精度聚类,聚类之后再通过计算语义相似度的方式有针对性的进行疾病细分,可有效减少不必要计算,提高辅助诊断速度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明基于鼻出血伴随症状预测疾病的系统结构示意图。
具体实施方式
下面将结合本发明实施方式,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
如图1所示,本发明提出一种基于鼻出血伴随症状预测疾病的系统,所述系统包括数据获取模块100、数据划分模块200、数据聚类模块400、疾病预测模块500;
数据获取模块100:用于从病例库中获取以鼻出血作为临床第一主诉症状病例,获取病例鼻出血伴随症状以及对应的疾病名称,建立鼻出血疾病原始数据集;
首先进行鼻出血的鉴别,具体依据有,1)、出血前的先兆症状:鼻部热胀感,或鼻腔异物感上腹部疼痛,恶心呕吐咳嗽、胸闷,胸部不适,喉痒感等;2)、出血的排出形式:多从前鼻孔溢出,剧烈时常同时从口鼻涌出呕出,也可呈喷射状,凶猛时可同时从口鼻中涌出咳出,凶猛时亦可同时从口鼻涌出;3)、排出血液的性状:鲜红色,一般无混杂物,有时可混有鼻涕或痰液胃或十二指肠性呕血多为咖啡样或棕褐色,无泡沫,但常混有食物残渣和胃液,常呈酸性反应;食管性呕血则为鲜红或暗红色由暗红至鲜红色,混有气泡或痰液,常呈碱性;4)、出血后后续症状:一般出血后数日内可有鼻涕中带血丝有血便,很少有痰中带血痰中带血,可持续数日,除非血液咽下,一般无血便;在进行数据获取时应先鉴别病例样本是否是以鼻出血为临床第一主诉症状,筛选出相应病例组成原始数据集。
鼻出血常见症状,比如:鼻溢液、鼻塞排出脓性或血性分泌物、下鼻甲或中鼻甲肥大、恶心与呕吐、带血粘脓鼻涕、女性周期性鼻塞和鼻衄、鼻腔中后部出血、脉速而无力、反复鼻出血、咳巧克力色痰、呼吸异常、红鼻头、眩晕、鼻粘膜溃疡、鼻出血出血可发生在鼻腔的任何部位,但以鼻中隔前下区最为多见,有时可见喷射性或搏动性小动脉出血。鼻腔后部出血常迅速流入咽部,从口吐出。一般说来,局部疾患引起的鼻出血,多限于一侧鼻腔,而全身疾病引起者,可能两侧鼻腔内交替或同时出血等。
鼻出血的常见疾病有:急性鼻炎、急性鼻窦炎、干燥性鼻炎、萎缩性鼻炎、鼻中隔黏膜糜烂、白喉、鼻中隔偏曲、穿孔、鼻中隔毛细血管瘤、鼻腔鼻窦血管瘤、鼻腔鼻窦恶性肿瘤、恶性肉芽肿、鼻咽纤维血管瘤、鼻咽癌、高血压、动脉硬化、肺气肿、肺源性心脏病、颈内动脉破裂、维生素缺乏、中毒等。比如,鼻咽纤维血管瘤主要发生在男性、青年,好发部位在鼻咽顶部。本病的主要症状是一侧进行性鼻阻塞,反复大量鼻出血。检查鼻腔后、鼻咽顶部有紫红色、光滑、质硬、不活动的肿物;鼻腔鼻窦恶性肿瘤常发生于中年以上患者,症状表现为一侧鼻阻塞,少量鼻出血。上颌窦癌的早期限于下壁或上壁时,牙痛或面颊部麻木感是重要的症状。至于眼眶、硬腭或面部的隆起,则属晚期表现等;对于每一类鼻出血相关疾病,至少获取10个病例样本。
数据划分模块200:用于根据鼻出血发病的原因,将鼻出血分为局部疾病和全身疾病,并对鼻出血疾病原始数据集进行数据划分;将鼻出血疾病原始数据集划分成局部疾病数据集和全身疾病数据集。
鼻出血可能与全身系统疾病有关,如血液系统疾病、糖尿病、心血管疾病、肝肾功能异常、肿瘤等。当鼻出血患者遇到以下情况时,应考虑血液疾病的可能性:1)、鼻出血频繁或持续,经使用常规止血药或止血方法不能止血;2)、经治疗后能暂时止血,但随后反复出血;3)、牙龈无肿胀、发红、却有鼻出血;4)、鼻出血伴有头晕、疲乏等症状;5)、鼻出血伴有鼻出血;6)、外伤后鼻出血不止;7)、鼻出血伴有周身散发性出血点或瘀斑;8)、鼻出血伴有月经多、经期延长;9)、鼻出血伴有发热及淋巴结肿大。
向量化模块300:用于分别提取数据集中每个病例对应的鼻出血伴随症状的关键特征,对鼻出血伴随症状进行向量化表示;
具体的,利用TF-IDF选取特征项,构建向量空间模型,对鼻出血伴随症状进行向量化表示。
数据聚类模块400:用于分别采用基于改进的鲸鱼算法优化的聚类算法对局部疾病数据集和全身疾病数据集聚类;
所述聚类模块具体用于:
初始化鲸鱼优化算法(鲸鱼优化算法(whale optimization algorithm,WOA))所需参数和鲸群位置;
通过适应度函数计算鲸群个体的适应度,筛选出最佳位置;
基于当前最佳位置进行包围猎物、狩猎行为、搜索猎物,搜索猎物的过程中通过莱维飞行优化搜索位置;首先计算系数向量A、C:
A=2ar1-a,a=2-2t/Tmax
C=2r2
r1、r2均为取值范围在[0,1]之间的随机向量,t为当前迭代次数,Tmax为最大迭代次数;
当|A|<1,鲸鱼有Pi的概率选择收缩包围机制和1-Pi的概率选择螺旋狩猎行为来更新鲸鱼的位置,位置更新公式为:
p为[0,1]之间的一个随机数,Pi为(0,1)之间的常数,
当|A|≥1,搜索猎物,通过莱维飞行优化搜索位置的位置更新公式为:
其中,X*(t)为当前全局最优位置,X(t)为鲸鱼当前位置,为点对点乘法,Levy(β)表示参数为β的莱维分布,/>其中,
Γ为标准的gamma函数,u、v均服从正态分布。
若位置更新后的鲸群个体的适应度高于更新前的适应度,采用更新后的位置替代原位置,否则保留原位置;迭代更新直到达到设定迭代次数或者适应度值小于设定精度。
莱维飞行可以提高不确定环境下的搜索效率,具有更广泛的搜索能力,因此能够扩大搜索范围,应用于鲸鱼优化算法能够提高鲸群的活力和跳跃能力,避免陷入局部最优,从而提高算法的全局寻优能力,实现鼻出血相关疾病的高精度聚类,
疾病预测模块500:用于对待测病例进行数据划分和聚类,在聚类类别中通过计算语义相似度的方式进行疾病预测。所述预测模块具体包括:
数据划分单元:用于分别从向量化的局部疾病数据集和全身疾病数据集中随机选取多个向量,分别计算上述多个向量的均值向量,分别计算待测病例的鼻出血伴随症状特征向量与所述均值向量之间的欧式距离,选取距离最小的均指向量所在数据集作为待测病例的数据划分结果;
聚类单元:用于计算待测病例的鼻出血伴随症状特征向量与对应的数据集的聚类中心点之间的欧式距离,对待测疾病聚类;
相似度计算单元:用于计算待测病例的鼻出血伴随症状特征向量与待测疾病聚类类别中各个样本的余弦相似度,并将对应的疾病名称按照相似度降序排列作为疾病预测结果。
本发明还提出一种电子设备,包括:至少一个处理器、至少一个存储器、通信接口和总线;
其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令,以实现版本发明所述的系统。
本发明还提出一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机实现本发明所述的系统。所述存储介质包括:U盘、移动硬盘、只议存储器ROM、随机存取存储器RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以分布到多个网络单元上。可以根据实际的衙要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (5)
1.一种基于鼻出血伴随症状预测疾病的系统,其特征在于,所述系统包括:
数据获取模块:用于从病例库中获取以鼻出血作为临床第一主诉症状病例,获取病例鼻出血伴随症状以及对应的疾病名称,建立鼻出血疾病原始数据集;
数据划分模块:用于根据鼻出血发病的原因,将鼻出血分为局部疾病和全身疾病,并对鼻出血疾病原始数据集进行数据划分;
向量化模块:用于分别提取数据集中每个病例对应的鼻出血伴随症状的关键特征,对鼻出血伴随症状进行向量化表示;
数据聚类模块:用于分别采用基于改进的鲸鱼算法优化的聚类算法对局部疾病数据集和全身疾病数据集聚类;
疾病预测模块:用于对待测病例进行数据划分和聚类,在聚类类别中通过计算语义相似度的方式进行疾病预测;
所述数据聚类模块中,改进的鲸鱼算法具体为:
初始化鲸鱼优化算法所需参数和鲸群位置;
通过适应度函数计算鲸群个体的适应度,筛选出最佳位置;
基于当前最佳位置进行包围猎物、狩猎行为、搜索猎物,搜索猎物的过程中通过莱维飞行优化搜索位置;
当|A|≥1,通过莱维飞行优化搜索位置,位置更新公式为:
;
其中,A、C为系数向量,为当前全局最优位置,/>为鲸鱼当前位置,/>为点对点乘法,/>表示参数为/>的莱维分布,/>,其中,
;
为标准的gamma函数,u、v均服从正态分布;
若位置更新后的鲸群个体的适应度高于更新前的适应度,采用更新后的位置替代原位置,否则保留原位置;迭代更新直到达到设定迭代次数或者适应度值小于设定精度。
2.根据权利要求1所述基于鼻出血伴随症状预测疾病的系统,其特征在于,所述包围猎物和狩猎行为时,计算系数向量A、C:
;
均为取值范围在[0,1]之间的随机向量,t为当前迭代次数,T max 为最大迭代次数;
当|A|<1,鲸鱼有P i 的概率选择收缩包围机制和1−P i 的概率选择螺旋狩猎行为来更新鲸鱼的位置,位置更新公式为:
;
p为[0,1]之间的一个随机数,P i 为(0,1)之间的常数。
3.根据权利要求2所述基于鼻出血伴随症状预测疾病的系统,其特征在于,疾病预测模块具体包括:
数据划分单元:用于分别从向量化的局部疾病数据集和全身疾病数据集中随机选取多个向量,分别计算上述多个向量的均值向量,分别计算待测病例的鼻出血伴随症状特征向量与所述均值向量之间的欧式距离,选取距离最小的均指向量所在数据集作为待测病例的数据划分结果;
聚类单元:用于计算待测病例的鼻出血伴随症状特征向量与对应的数据集的聚类中心点之间的欧式距离,对待测疾病聚类;
相似度计算单元:用于计算待测病例的鼻出血伴随症状特征向量与待测疾病聚类类别中各个样本的余弦相似度,并将对应的疾病名称按照相似度降序排列作为疾病预测结果。
4.一种电子设备,包括:至少一个处理器、至少一个存储器、通信接口和总线;
其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令,以实现如权利要求1~3任一项所述的系统。
5.一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机实现权利要求1~3任一项所述的系统。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011063688.XA CN112259220B (zh) | 2020-09-30 | 2020-09-30 | 一种基于鼻出血伴随症状预测疾病的系统、设备、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011063688.XA CN112259220B (zh) | 2020-09-30 | 2020-09-30 | 一种基于鼻出血伴随症状预测疾病的系统、设备、存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112259220A CN112259220A (zh) | 2021-01-22 |
CN112259220B true CN112259220B (zh) | 2024-02-02 |
Family
ID=74234786
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011063688.XA Active CN112259220B (zh) | 2020-09-30 | 2020-09-30 | 一种基于鼻出血伴随症状预测疾病的系统、设备、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112259220B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113034489B (zh) * | 2021-04-16 | 2022-11-01 | 南方医科大学第五附属医院 | 基于深度学习的人工智能鼻窦ct图像处理系统 |
CN117197472B (zh) * | 2023-11-07 | 2024-03-08 | 四川农业大学 | 基于鼻出血内窥镜影像的高效师生半监督分割方法及装置 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2265394C1 (ru) * | 2004-11-29 | 2005-12-10 | Колесников Вадим Николаевич | Способ диагностики вазомоторного ринита |
CN101354390A (zh) * | 2008-02-28 | 2009-01-28 | 福建省肿瘤医院 | 鼻咽癌早期血清特异蛋白及其应用 |
KR101875306B1 (ko) * | 2017-01-11 | 2018-07-05 | 전북대학교산학협력단 | 의료용어 클러스터를 이용한 질병정보제공시스템 |
CN108615555A (zh) * | 2018-04-26 | 2018-10-02 | 山东师范大学 | 基于标记基因和混合核函数svm的结直肠癌预测方法和装置 |
CN110059875A (zh) * | 2019-04-12 | 2019-07-26 | 湖北工业大学 | 基于分布式鲸鱼优化算法的公共自行车需求量预测方法 |
CN110957034A (zh) * | 2018-09-26 | 2020-04-03 | 金敏 | 疾病预测系统 |
CN111062533A (zh) * | 2019-12-16 | 2020-04-24 | 国家能源集团谏壁发电厂 | 一种基于鲸鱼优化算法优化加权最小二乘支持向量机的风机故障预测方法 |
CN111161879A (zh) * | 2020-02-24 | 2020-05-15 | 梅里医疗科技(洋浦)有限责任公司 | 一种基于大数据的疾病预测系统 |
KR102127903B1 (ko) * | 2019-01-29 | 2020-06-29 | 연세대학교 산학협력단 | 염증성 호흡기 질환의 진단용 바이오마커 |
CN111599462A (zh) * | 2020-05-09 | 2020-08-28 | 吾征智能技术(北京)有限公司 | 基于认知学习的身体异常气味智能筛查系统 |
RU2732527C1 (ru) * | 2020-04-23 | 2020-09-18 | федеральное государственное бюджетное образовательное учреждение высшего образования «Тюменский государственный медицинский университет» Министерства здравоохранения Российской Федерации | Способ прогнозирования гнойно-септических риносинусогенных осложнений орбиты и век при воспалительных заболеваниях околоносовых пазух у детей |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110125525A1 (en) * | 2009-11-20 | 2011-05-26 | Lx1 Technology Ltd. | Method of anticipating an epidemic in a population, and a system thereof |
-
2020
- 2020-09-30 CN CN202011063688.XA patent/CN112259220B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2265394C1 (ru) * | 2004-11-29 | 2005-12-10 | Колесников Вадим Николаевич | Способ диагностики вазомоторного ринита |
CN101354390A (zh) * | 2008-02-28 | 2009-01-28 | 福建省肿瘤医院 | 鼻咽癌早期血清特异蛋白及其应用 |
KR101875306B1 (ko) * | 2017-01-11 | 2018-07-05 | 전북대학교산학협력단 | 의료용어 클러스터를 이용한 질병정보제공시스템 |
CN108615555A (zh) * | 2018-04-26 | 2018-10-02 | 山东师范大学 | 基于标记基因和混合核函数svm的结直肠癌预测方法和装置 |
CN110957034A (zh) * | 2018-09-26 | 2020-04-03 | 金敏 | 疾病预测系统 |
KR102127903B1 (ko) * | 2019-01-29 | 2020-06-29 | 연세대학교 산학협력단 | 염증성 호흡기 질환의 진단용 바이오마커 |
CN110059875A (zh) * | 2019-04-12 | 2019-07-26 | 湖北工业大学 | 基于分布式鲸鱼优化算法的公共自行车需求量预测方法 |
CN111062533A (zh) * | 2019-12-16 | 2020-04-24 | 国家能源集团谏壁发电厂 | 一种基于鲸鱼优化算法优化加权最小二乘支持向量机的风机故障预测方法 |
CN111161879A (zh) * | 2020-02-24 | 2020-05-15 | 梅里医疗科技(洋浦)有限责任公司 | 一种基于大数据的疾病预测系统 |
RU2732527C1 (ru) * | 2020-04-23 | 2020-09-18 | федеральное государственное бюджетное образовательное учреждение высшего образования «Тюменский государственный медицинский университет» Министерства здравоохранения Российской Федерации | Способ прогнозирования гнойно-септических риносинусогенных осложнений орбиты и век при воспалительных заболеваниях околоносовых пазух у детей |
CN111599462A (zh) * | 2020-05-09 | 2020-08-28 | 吾征智能技术(北京)有限公司 | 基于认知学习的身体异常气味智能筛查系统 |
Non-Patent Citations (1)
Title |
---|
"基于特征选择的结直肠癌预测模型研究";赵丹丹;《中国优秀硕士学位论文全文数据库 医药卫生科技辑》(第9期);E072-522 * |
Also Published As
Publication number | Publication date |
---|---|
CN112259220A (zh) | 2021-01-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112259220B (zh) | 一种基于鼻出血伴随症状预测疾病的系统、设备、存储介质 | |
Maki et al. | The oral and gut bacterial microbiomes: similarities, differences, and connections | |
JP7464800B2 (ja) | 小サンプル弱ラベル付け条件での医療イベント認識方法及びシステム | |
CN109935286A (zh) | 基于逻辑回归的人工授精成功率影响因素计算方法与系统 | |
CN110047567A (zh) | 一种基于病历关键信息提取技术的胆结石诊断模型 | |
CN112002419B (zh) | 一种基于聚类的疾病辅助诊断系统、设备、存储介质 | |
US20240105308A1 (en) | System and method for generating a gestational disorder nourishment program | |
GANIEVA et al. | The share of hereditary nephritis in the nozological structure of nephrological diseases among children in andijan region. | |
CN112786192A (zh) | 一种手足口病智能认知系统、设备、存储介质 | |
CN112086200B (zh) | 一种基于口苦预测疾病的系统、设备、存储介质 | |
CN115270715B (zh) | 一种面向电子病历的智能辅助icd自动编码方法及系统 | |
CN111973155B (zh) | 一种基于人体口味异常变化的疾病认知自学习系统 | |
Khashan | Labor epidural anesthesia associated with autism | |
CN114550910A (zh) | 基于人工智能的射血分数保留型心衰诊断及分型系统 | |
Tiwari et al. | Analysis of Ultrasound Images in Kidney Failure Diagnosis Using Deep Learning | |
CN112017774B (zh) | 一种基于口臭伴随症状的疾病预测模型的构建方法及系统 | |
Jiang et al. | Integrated learning model-based assessment of enteral nutrition support in neurosurgical intensive care patients | |
Taylor et al. | Dental caries, vitamin D, and mineral deficiencies | |
Kaushik et al. | Heart Failure Prediction using Voting Ensemble Classifier | |
US20240078451A1 (en) | Methods and systems for physiologically informed gestational inquiries | |
Dracopoulos et al. | Presence of Cervical Vertebral Anomalies with Concomitant Non-Communicating Hydrocephalus and Multicystic Kidney in a Female Fetus: Where VACTERL-H Meets MURCS | |
Gavidia | Automatic detection of obstructive sleep apnea based on physiological signals | |
McKnight | Basic Concepts and Analysis | |
CN116186262A (zh) | 月经失调的分型系统、方法、电子设备及存储介质 | |
Retamales et al. | Towards automatic home-based sleep apnea estimation using deep learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |