CN116628560A - 基于聚类算法的蛇伤病例数据识别方法、装置及电子设备 - Google Patents
基于聚类算法的蛇伤病例数据识别方法、装置及电子设备 Download PDFInfo
- Publication number
- CN116628560A CN116628560A CN202310910423.6A CN202310910423A CN116628560A CN 116628560 A CN116628560 A CN 116628560A CN 202310910423 A CN202310910423 A CN 202310910423A CN 116628560 A CN116628560 A CN 116628560A
- Authority
- CN
- China
- Prior art keywords
- snake
- snake bite
- bite
- case data
- case
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 241000270295 Serpentes Species 0.000 title claims description 7
- 208000004078 Snake Bites Diseases 0.000 claims abstract description 199
- 238000013145 classification model Methods 0.000 claims abstract description 25
- 238000012549 training Methods 0.000 claims abstract description 22
- 238000012216 screening Methods 0.000 claims abstract description 17
- 238000012545 processing Methods 0.000 claims abstract description 10
- 239000008155 medical solution Substances 0.000 claims description 20
- 210000002966 serum Anatomy 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 6
- 230000008859 change Effects 0.000 claims description 5
- 230000008569 process Effects 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000003064 k means clustering Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007721 medicinal effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于蛇伤数据处理技术领域,涉及基于聚类算法的蛇伤病例数据识别方法、装置与电子设备。该方法包括:获取历史蛇伤病例数据,构建蛇伤病例数据库;从历史蛇伤病例数据选择关键特征属性;从蛇伤病例数据库中筛选出蛇伤类型相同的历史蛇伤病例数据,得到模型训练数据集;采用聚类算法对模型训练数据集进行无监督聚类学习,构建蛇伤病例分类模型;获取当前蛇伤病例数据;输入蛇伤病例分类模型,得到蛇伤病例数据的分类结果。本发明采用聚类算法对模型训练数据集进行无监督聚类学习获得蛇伤病例分类模型,快速、准确的得到蛇伤患者蛇伤病例数据分类结果,从而有利于制定科学高效的医疗方案,有效降低蛇伤致死致残率。
Description
技术领域
本发明涉及蛇伤数据处理技术领域,具体而言,涉及基于聚类算法的蛇伤病例数据识别方法、装置及电子设备。
背景技术
我国每年蛇伤病例大约10万~20万人次,蛇伤致残率高,但接受过专业培训的医护人员占比仅为41%,不足50%的蛇伤患者到基层医院处理,即使到了基层医院,也因为基层医院医生蛇伤处理经验不足,无法对蛇伤病例数据进行准确的识别,以及无法找到最佳医疗方案,造成医疗效果差。数据表明我国蛇伤患者致死率与致残率都较高,因此迫切需要一种方法,对蛇伤病例数据进行准确的识别,辅助基层医生找到科学合理的蛇伤病例医疗方案,进而提升蛇伤治愈率。
发明内容
为了解决上述技术问题,本发明提供基于聚类算法的蛇伤病例数据识别方法、装置及电子设备。
第一方面,本发明提供了基于聚类算法的蛇伤病例数据识别方法,包括:
获取历史蛇伤病例数据,构建蛇伤病例数据库;每个所述历史蛇伤病例数据包括若干个特征属性;
从所述历史蛇伤病例数据选择关键特征属性;
根据所述关键特征属性,从所述蛇伤病例数据库中筛选出蛇伤类型相同的所述历史蛇伤病例数据,相同蛇伤类型的若干个所述历史蛇伤病例数据作为一个聚类,得到模型训练数据集;
采用聚类算法对所述模型训练数据集进行无监督聚类学习,构建蛇伤病例分类模型;
获取当前蛇伤病例数据;
将所述当前蛇伤病例数据输入所述蛇伤病例分类模型,得到所述当前蛇伤病例数据的聚类,作为所述当前蛇伤病例数据的分类结果。
第二方面,本发明提供了基于聚类算法的蛇伤病例数据识别装置, 包括第一获取单元、选择单元、筛选单元、模型构建单元、第二获取单元与处理单元:
所述第一获取单元,用于获取历史蛇伤病例数据,构建蛇伤病例数据库;每个所述历史蛇伤病例数据包括若干个特征属性;
所述选择单元,用于从所述历史蛇伤病例数据选择关键特征属性;
所述筛选单元,用于根据所述关键特征属性,从所述蛇伤病例数据库中筛选出蛇伤类型相同的所述历史蛇伤病例数据,相同蛇伤类型的若干个所述历史蛇伤病例数据作为一个聚类,得到模型训练数据集;
所述模型构建单元,用于采用聚类算法对所述模型训练数据集进行无监督聚类学习,构建蛇伤病例分类模型;
所述第二获取单元,用于获取当前蛇伤病例数据;
所述处理单元,用于将所述当前蛇伤病例数据输入所述蛇伤病例分类模型,得到所述当前蛇伤病例数据的聚类,作为所述当前蛇伤病例数据的分类结果。
第三方面,本发明提供了一种电子设备,包括:
处理器和存储器;
所述存储器,用于存储计算机操作指令;
所述处理器,用于通过调用所述计算机操作指令,执行所述的基于聚类算法的蛇伤病例数据识别方法。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,所述特征属性包括蛇伤部位图像、蛇伤严重等级、蛇伤患者生化指标、蛇伤患者生命体征、蛇伤患者住院时长、蛇伤血清类型与蛇伤处理费用。
进一步,采用聚类算法对所述模型训练数据集进行无监督聚类学习,构建蛇伤病例分类模型,包括:
从每个所述聚类中随机选取K个所述蛇伤病例数据作为样本,寻找所述样本初始的聚类中心;
计算每个所述样本与各个初始的所述聚类中心之间的距离作为特征向量,把所述样本分配给距离最近的所述聚类中心;
重新计算分配到所述样本的所述聚类的所述聚类中心;每分配一个所述样本,重新计算所述聚类的所述聚类中心,直到满足设定条件,得到构建蛇伤病例分类模型。
进一步,所述设定条件为所述样本与所述聚类中心之间的距离小于设定值或者分配次数达到设定值或者所有所述聚类的所述聚类中心每一次的变化值小于设定阈值。
进一步,该方法还包括从所述蛇伤病例数据库提取各个所述蛇伤类别对应的蛇伤医疗方案;每一个所述蛇伤类别对应若干个所述蛇伤医疗方案;
提取所述蛇伤类别对应的所述关键特征属性;
对各个所述关键特征属性的值进行离散化处理,得到若干个值域;
相同所述蛇伤类别的所述蛇伤医疗方案中各个所述关键特征属性按照所述值域进行赋值,得到每个所述蛇伤医疗方案中各个所述关键特征属性的评分;
设置各个所述关键特征属性的权重系数;
根据所述评分与所述权重系数,对所述每个所述蛇伤医疗方案中各个所述关键特征属性的所述评分进行求和,得到每个所述蛇伤医疗方案的总评分;
筛选出所述总评分最高的各个所述蛇伤医疗方案。
进一步,所述关键特征属性包括蛇伤患者住院时长、蛇伤血清类型与蛇伤处理费用数据。
本发明的有益效果是:本发明采用聚类算法,对模型训练数据集进行无监督聚类学习,不断迭代优化,获得蛇伤病例分类模型,有利于基层医生在当前蛇伤病例数据所在的蛇伤相似病例分类组别中,快速、准确的得到蛇伤患者蛇伤病例数据分类结果,解决基层医生蛇伤医疗经验不足问题,从而有利于根据该蛇伤病例数据分类结果制定科学高效的医疗方案,有效降低蛇伤致死致残率。
附图说明
图1为本发明实施例1提供的基于聚类算法的蛇伤病例数据识别方法的原理图;
图2为本发明实施例2提供的基于聚类算法的蛇伤病例数据识别装置的原理图;
图3为一种电子设备的原理图。
图标:30-电子设备;310-处理器;320-总线;330-存储器;340-收发器。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
实施例1
作为一个实施例,如附图1所示,为解决上述技术问题,本实施例提供基于聚类算法的蛇伤病例数据识别方法,包括:
获取历史蛇伤病例数据,构建蛇伤病例数据库;每个历史蛇伤病例数据包括若干个特征属性;
从历史蛇伤病例数据选择关键特征属性;
根据关键特征属性,从蛇伤病例数据库中筛选出蛇伤类型相同的历史蛇伤病例数据,相同蛇伤类型的若干个历史蛇伤病例数据作为一个聚类,得到模型训练数据集;
采用聚类算法对模型训练数据集进行无监督聚类学习,构建蛇伤病例分类模型;
获取当前蛇伤病例数据;
将当前蛇伤病例数据输入蛇伤病例分类模型,得到当前蛇伤病例数据的聚类,作为当前蛇伤病例数据的分类结果。
在实际应用过程中,本发明采用聚类算法,对模型训练数据集进行无监督聚类学习,不断迭代优化,获得蛇伤病例分类模型,有利于基层医生在当前蛇伤病例数据所在的蛇伤相似病例分类组别中,快速、准确的得到蛇伤患者蛇伤病例数据分类结果,解决基层医生蛇伤医疗经验不足问题,从而有利于根据该蛇伤病例数据分类结果制定科学高效的医疗方案,有效降低蛇伤致死致残率。
可选的,特征属性包括蛇伤部位图像、蛇伤严重等级、蛇伤患者生化指标、蛇伤患者生命体征、蛇伤患者住院时长、蛇伤血清类型与蛇伤处理费用。
可选的,采用聚类算法对模型训练数据集进行无监督聚类学习,构建蛇伤病例分类模型,包括:
从每个聚类中随机选取K个蛇伤病例数据作为样本,寻找样本初始的聚类中心;
计算每个样本与各个初始的聚类中心之间的距离作为特征向量,把样本分配给距离最近的聚类中心;
重新计算分配到样本的聚类的聚类中心;每分配一个样本,重新计算聚类的聚类中心,直到满足设定条件,得到构建蛇伤病例分类模型。
在实际应用过程中,K均值聚类算法(K-means clustering algorithm)是一种迭代求解的聚类分析算法,在上述采用K均值聚类算法对模型训练数据集进行无监督聚类学习的过程中,计算每个样本与各个初始的聚类中心之间的距离,并进行比较,样本与聚类中心的距离越近,则样本与该聚类中心的相似度越高,因此把样本分配给距离最近的聚类中心作为同一个聚类;重新计算分配到样本的聚类的聚类中心时,计算各个聚类中所有样本的坐标平均值,并将该坐标平均值作为新的聚类中心。
可选的,设定条件为样本与聚类中心之间的距离小于设定值或者分配次数达到设定值或者所有聚类的聚类中心每一次的变化值小于设定阈值。
在分配得到一个样本后样本与聚类中心之间的距离小于设定值,则说明聚类得到的分类结果趋于稳定,设定条件还可以是样本的分配次数达到设定值或者所有聚类的聚类中心每一次的变化值小于设定阈值即聚类中心移动范围小于设定值。
可选的,该方法还包括从蛇伤病例数据库提取各个蛇伤类别对应的蛇伤医疗方案;每一个蛇伤类别对应若干个蛇伤医疗方案;
提取蛇伤类别对应的关键特征属性;
对各个关键特征属性的值进行离散化处理,得到若干个值域;
相同蛇伤类别的蛇伤医疗方案中各个关键特征属性按照值域进行赋值,得到每个蛇伤医疗方案中各个关键特征属性的评分;
设置各个关键特征属性的权重系数;
根据评分与权重系数,对每个蛇伤医疗方案中各个关键特征属性的评分进行求和,得到每个蛇伤医疗方案的总评分;
筛选出总评分最高的各个蛇伤医疗方案。
在实际应用过程中,从蛇伤病例数据库提取各个蛇伤类别对应的蛇伤医疗方案的具体过程如下:
提取关键特征属性的字段,可选的,关键特征属性选择蛇伤患者住院时长、蛇伤血清类型与蛇伤处理费用数据。
对特征属性的字段值域离散化处理,可选的,将上述三个关键特征属性的字段离散化得到多个离散值域,例如对蛇伤处理费用数据进行值域离散化处理,得到4个值域:小于1000元、1000元~3000元、3000元~8000元以及8000元以上;
关键特征属性字段值域赋分:若关键特征属性字段的离散化值域为多个,若该关键特征属性的字段的值越小越好,则为最小值域赋予最高分,为最大值域赋予最低分;否则,最小值域赋予最低分,为最大值域赋予最高分。例如蛇伤住院天数越少越好,则为蛇伤住院天数对应的字段的最小值域赋予最高分,为最大值域赋予最低分。
根据实际需要对每个关键特征属性设置权重系数,对每个蛇伤医疗方案中各个关键特征属性的评分进行求和,得到每个蛇伤医疗方案的总评分,通过对比总评分值的大小筛选出总评分最高的各个蛇伤医疗方案。
基层医生在当前蛇伤病例数据所在的同类蛇伤相似病例分类组别中,从相同类型的蛇伤病例数据对应的医疗方案中择优选择医疗方案。
实施例2
基于与本发明的实施例1中所示的方法相同的原理,如附图2所示,本发明的实施例中还提供了基于聚类算法的蛇伤病例数据识别装置, 包括第一获取单元、选择单元、筛选单元、模型构建单元、第二获取单元与处理单元:
第一获取单元,用于获取历史蛇伤病例数据,构建蛇伤病例数据库;每个历史蛇伤病例数据包括若干个特征属性;
选择单元,用于从历史蛇伤病例数据选择关键特征属性;
筛选单元,用于根据关键特征属性,从蛇伤病例数据库中筛选出蛇伤类型相同的历史蛇伤病例数据,相同蛇伤类型的若干个历史蛇伤病例数据作为一个聚类,得到模型训练数据集;
模型构建单元,用于采用聚类算法对模型训练数据集进行无监督聚类学习,构建蛇伤病例分类模型;
第二获取单元,用于获取当前蛇伤病例数据;
处理单元,用于将当前蛇伤病例数据输入蛇伤病例分类模型,得到当前蛇伤病例数据的聚类,作为当前蛇伤病例数据的分类结果。
可选的,特征属性包括蛇伤部位图像、蛇伤严重等级、蛇伤患者生化指标、蛇伤患者生命体征、蛇伤患者住院时长、蛇伤血清类型与蛇伤处理费用。
可选的,采用聚类算法对模型训练数据集进行无监督聚类学习,构建蛇伤病例分类模型,包括:
从每个聚类中随机选取K个蛇伤病例数据作为样本,寻找样本初始的聚类中心;
计算每个样本与各个初始的聚类中心之间的距离作为特征向量,把样本分配给距离最近的聚类中心;
重新计算分配到样本的聚类的聚类中心;每分配一个样本,重新计算聚类的聚类中心,直到满足设定条件,得到构建蛇伤病例分类模型。
可选的,设定条件为样本与聚类中心之间的距离小于设定值或者分配次数达到设定值或者所有聚类的聚类中心每一次的变化值小于设定阈值。
可选的,该方法还包括从蛇伤病例数据库提取各个蛇伤类别对应的蛇伤医疗方案;每一个蛇伤类别对应若干个蛇伤医疗方案;
提取蛇伤类别对应的关键特征属性;
对各个关键特征属性的值进行离散化处理,得到若干个值域;
相同蛇伤类别的蛇伤医疗方案中各个关键特征属性按照值域进行赋值,得到每个蛇伤医疗方案中各个关键特征属性的评分;
设置各个关键特征属性的权重系数;
根据评分与权重系数,对每个蛇伤医疗方案中各个关键特征属性的评分进行求和,得到每个蛇伤医疗方案的总评分;
筛选出总评分最高的各个蛇伤医疗方案。
可选的,关键特征属性包括蛇伤患者住院时长、蛇伤血清类型与蛇伤处理费用数据。
实施例3
基于与本发明的实施例中所示的方法相同的原理,本发明的实施例中还提供了一种电子设备,如附图3所示,该电子设备可以包括但不限于:处理器和存储器;存储器,用于存储计算机程序;处理器,用于通过调用计算机程序执行本发明实施例所示的基于聚类算法的蛇伤病例数据识别方法。
在一个可选实施例中提供了一种电子设备,图3所示的电子设备30包括:处理器310和存储器330。其中,处理器310和存储器330相连,如通过总线320相连。
可选地,电子设备30还可以包括收发器340,收发器340可以用于该电子设备与其他电子设备之间的数据交互,如数据的发送和/或数据的接收等。需要说明的是,实际应用中收发器340不限于一个,该电子设备30的结构并不构成对本发明实施例的限定。
处理器310可以是CPU(Central Processing Unit,中央处理器),通用处理器,DSP(Digital Signal Processor,数据信号处理器),ASIC(Application SpecificIntegrated Circuit,专用集成电路),FPGA(Field Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本发明公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器310也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线320可包括一通路,在上述组件之间传送信息。总线320可以是PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。总线320可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器330可以是ROM(Read Only Memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,RAM(Random Access Memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM(Electrically ErasableProgrammable Read Only Memory,电可擦可编程只读存储器)、CD-ROM(Compact DiscRead Only Memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
存储器330用于存储执行本发明方案的应用程序代码(计算机程序),并由处理器310来控制执行。处理器310用于执行存储器330中存储的应用程序代码,以实现前述方法实施例所示的内容。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.基于聚类算法的蛇伤病例数据识别方法,其特征在于,包括:
获取历史蛇伤病例数据,构建蛇伤病例数据库;每个所述历史蛇伤病例数据包括若干个特征属性;
从所述历史蛇伤病例数据选择关键特征属性;
根据所述关键特征属性,从所述蛇伤病例数据库中筛选出蛇伤类型相同的所述历史蛇伤病例数据,相同蛇伤类型的若干个所述历史蛇伤病例数据作为一个聚类,得到模型训练数据集;
采用聚类算法对所述模型训练数据集进行无监督聚类学习,构建蛇伤病例分类模型;
获取当前蛇伤病例数据;
将所述当前蛇伤病例数据输入所述蛇伤病例分类模型,得到所述当前蛇伤病例数据的聚类,作为所述当前蛇伤病例数据的分类结果。
2.根据权利要求1所述基于聚类算法的蛇伤病例数据识别方法,其特征在于,所述特征属性包括蛇伤部位图像、蛇伤严重等级、蛇伤患者生化指标、蛇伤患者生命体征、蛇伤患者住院时长、蛇伤血清类型与蛇伤处理费用。
3.根据权利要求1所述基于聚类算法的蛇伤病例数据识别方法,其特征在于,采用聚类算法对所述模型训练数据集进行无监督聚类学习,构建蛇伤病例分类模型,包括:
从每个所述聚类中随机选取K个所述蛇伤病例数据作为样本,寻找所述样本初始的聚类中心;
计算每个所述样本与各个初始的所述聚类中心之间的距离作为特征向量,把所述样本分配给距离最近的所述聚类中心;
重新计算分配到所述样本的所述聚类的所述聚类中心;每分配一个所述样本,重新计算所述聚类的所述聚类中心,直到满足设定条件,得到构建蛇伤病例分类模型。
4.根据权利要求3所述基于聚类算法的蛇伤病例数据识别方法,其特征在于,所述设定条件为所述样本与所述聚类中心之间的距离小于设定值或者分配次数达到设定值或者所有所述聚类的所述聚类中心每一次的变化值小于设定阈值。
5.根据权利要求1所述基于聚类算法的蛇伤病例数据识别方法,其特征在于,还包括从所述蛇伤病例数据库提取各个所述蛇伤类别对应的蛇伤医疗方案;每一个所述蛇伤类别对应若干个所述蛇伤医疗方案;
提取所述蛇伤类别对应的所述关键特征属性;
对各个所述关键特征属性的值进行离散化处理,得到若干个值域;
相同所述蛇伤类别的所述蛇伤医疗方案中各个所述关键特征属性按照所述值域进行赋值,得到每个所述蛇伤医疗方案中各个所述关键特征属性的评分;
设置各个所述关键特征属性的权重系数;
根据所述评分与所述权重系数,对所述每个所述蛇伤医疗方案中各个所述关键特征属性的所述评分进行求和,得到每个所述蛇伤医疗方案的总评分;
筛选出所述总评分最高的各个所述蛇伤医疗方案。
6.根据权利要求5所述基于聚类算法的蛇伤病例数据识别方法,其特征在于,所述关键特征属性包括蛇伤患者住院时长、蛇伤血清类型与蛇伤处理费用数据。
7.基于聚类算法的蛇伤病例数据识别装置,其特征在于,包括第一获取单元、选择单元、筛选单元、模型构建单元、第二获取单元与处理单元:
所述第一获取单元,用于获取历史蛇伤病例数据,构建蛇伤病例数据库;每个所述历史蛇伤病例数据包括若干个特征属性;
所述选择单元,用于从所述历史蛇伤病例数据选择关键特征属性;
所述筛选单元,用于根据所述关键特征属性,从所述蛇伤病例数据库中筛选出蛇伤类型相同的所述历史蛇伤病例数据,相同蛇伤类型的若干个所述历史蛇伤病例数据作为一个聚类,得到模型训练数据集;
所述模型构建单元,用于采用聚类算法对所述模型训练数据集进行无监督聚类学习,构建蛇伤病例分类模型;
所述第二获取单元,用于获取当前蛇伤病例数据;
所述处理单元,用于将所述当前蛇伤病例数据输入所述蛇伤病例分类模型,得到所述当前蛇伤病例数据的聚类,作为所述当前蛇伤病例数据的分类结果。
8.一种电子设备,其特征在于,包括:
处理器和存储器;
所述存储器,用于存储计算机操作指令;
所述处理器,用于通过调用所述计算机操作指令,执行权利要求1至6中任一项所述的基于聚类算法的蛇伤病例数据识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310910423.6A CN116628560A (zh) | 2023-07-24 | 2023-07-24 | 基于聚类算法的蛇伤病例数据识别方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310910423.6A CN116628560A (zh) | 2023-07-24 | 2023-07-24 | 基于聚类算法的蛇伤病例数据识别方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116628560A true CN116628560A (zh) | 2023-08-22 |
Family
ID=87642219
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310910423.6A Pending CN116628560A (zh) | 2023-07-24 | 2023-07-24 | 基于聚类算法的蛇伤病例数据识别方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116628560A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117423476A (zh) * | 2023-12-18 | 2024-01-19 | 中国科学院地理科学与资源研究所 | 基于降尺度和贝叶斯模型的包虫病流行率预测方法 |
CN117558461A (zh) * | 2024-01-12 | 2024-02-13 | 四川互慧软件有限公司 | 不同地域的同类蛇伤医疗方案选择方法、装置及电子设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106202891A (zh) * | 2016-06-30 | 2016-12-07 | 电子科技大学 | 一种面向医疗质量评价的大数据挖掘方法 |
CN111414831A (zh) * | 2020-03-13 | 2020-07-14 | 深圳市商汤科技有限公司 | 监测方法及系统、电子设备和存储介质 |
CN112885481A (zh) * | 2021-03-09 | 2021-06-01 | 联仁健康医疗大数据科技股份有限公司 | 病例分组方法、装置、电子设备及存储介质 |
CN113506625A (zh) * | 2021-08-21 | 2021-10-15 | 江泽飞 | 一种基于csco指南的诊疗建议评分系统 |
CN113555086A (zh) * | 2021-07-26 | 2021-10-26 | 平安科技(深圳)有限公司 | 基于机器学习的辩证分析方法、装置、设备及介质 |
CN115083555A (zh) * | 2022-08-22 | 2022-09-20 | 四川省医学科学院·四川省人民医院 | 一种社区慢性病辅助决策系统 |
CN115952432A (zh) * | 2022-12-21 | 2023-04-11 | 四川大学华西医院 | 一种基于糖尿病数据的无监督聚类方法 |
-
2023
- 2023-07-24 CN CN202310910423.6A patent/CN116628560A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106202891A (zh) * | 2016-06-30 | 2016-12-07 | 电子科技大学 | 一种面向医疗质量评价的大数据挖掘方法 |
CN111414831A (zh) * | 2020-03-13 | 2020-07-14 | 深圳市商汤科技有限公司 | 监测方法及系统、电子设备和存储介质 |
CN112885481A (zh) * | 2021-03-09 | 2021-06-01 | 联仁健康医疗大数据科技股份有限公司 | 病例分组方法、装置、电子设备及存储介质 |
CN113555086A (zh) * | 2021-07-26 | 2021-10-26 | 平安科技(深圳)有限公司 | 基于机器学习的辩证分析方法、装置、设备及介质 |
CN113506625A (zh) * | 2021-08-21 | 2021-10-15 | 江泽飞 | 一种基于csco指南的诊疗建议评分系统 |
CN115083555A (zh) * | 2022-08-22 | 2022-09-20 | 四川省医学科学院·四川省人民医院 | 一种社区慢性病辅助决策系统 |
CN115952432A (zh) * | 2022-12-21 | 2023-04-11 | 四川大学华西医院 | 一种基于糖尿病数据的无监督聚类方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117423476A (zh) * | 2023-12-18 | 2024-01-19 | 中国科学院地理科学与资源研究所 | 基于降尺度和贝叶斯模型的包虫病流行率预测方法 |
CN117423476B (zh) * | 2023-12-18 | 2024-03-08 | 中国科学院地理科学与资源研究所 | 基于降尺度和贝叶斯模型的包虫病流行率预测方法 |
CN117558461A (zh) * | 2024-01-12 | 2024-02-13 | 四川互慧软件有限公司 | 不同地域的同类蛇伤医疗方案选择方法、装置及电子设备 |
CN117558461B (zh) * | 2024-01-12 | 2024-03-29 | 四川互慧软件有限公司 | 不同地域的同类蛇伤医疗方案选择方法、装置及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116628560A (zh) | 基于聚类算法的蛇伤病例数据识别方法、装置及电子设备 | |
CN116798646B (zh) | 基于聚类算法的蛇伤预后预测方法、装置及电子设备 | |
CN116386801B (zh) | 基于聚类算法构建患者身份标识的方法、装置及电子设备 | |
US20130254202A1 (en) | Parallelization of synthetic events with genetic surprisal data representing a genetic sequence of an organism | |
CN102214232A (zh) | 一种文本数据相似度的计算方法及装置 | |
US8972406B2 (en) | Generating epigenetic cohorts through clustering of epigenetic surprisal data based on parameters | |
CN109935337B (zh) | 一种基于相似性度量的病案查找方法及系统 | |
CN111710364B (zh) | 一种菌群标记物的获取方法、装置、终端及存储介质 | |
CN113111159A (zh) | 问答记录生成方法、装置、电子设备及存储介质 | |
CN111091907A (zh) | 基于相似病例库的健康医疗知识检索方法和系统 | |
CN115424691A (zh) | 病例匹配方法、系统、设备和介质 | |
CN109871866B (zh) | 用于医院内感染预测的模型训练方法、装置、设备及介质 | |
Boag et al. | Awe-cm vectors: Augmenting word embeddings with a clinical metathesaurus | |
US20200301949A1 (en) | System and method for determining data patterns using data mining | |
CN110957046B (zh) | 医疗健康案例知识匹配方法和系统 | |
CN111640517A (zh) | 病历编码方法、装置、存储介质及电子设备 | |
CN115472257A (zh) | 一种招募用户的方法、装置、电子设备及存储介质 | |
CN115631823A (zh) | 相似病例推荐方法及系统 | |
CN113590845B (zh) | 基于知识图谱的文献检索方法、装置、电子设备及介质 | |
Sharma et al. | Biomedical data classification using fuzzy clustering | |
CN110033862B (zh) | 一种基于加权有向图的中医量化诊断系统及存储介质 | |
Huda | Design of Istitaah classification system based on machine learning using imbalanced dataset | |
CN111063436A (zh) | 数据处理方法及装置、存储介质及电子终端 | |
CN112735596A (zh) | 一种相似患者的确定方法、装置、电子设备及存储介质 | |
CN116741373B (zh) | 基于神经网络模型的蛇伤类型识别方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20230822 |