CN113569996B - 病案信息的分类方法、装置、设备以及存储介质 - Google Patents

病案信息的分类方法、装置、设备以及存储介质 Download PDF

Info

Publication number
CN113569996B
CN113569996B CN202111005870.4A CN202111005870A CN113569996B CN 113569996 B CN113569996 B CN 113569996B CN 202111005870 A CN202111005870 A CN 202111005870A CN 113569996 B CN113569996 B CN 113569996B
Authority
CN
China
Prior art keywords
medical records
target
medical
type
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111005870.4A
Other languages
English (en)
Other versions
CN113569996A (zh
Inventor
闫二栓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Medical and Healthcare Management Co Ltd
Original Assignee
Ping An Medical and Healthcare Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Medical and Healthcare Management Co Ltd filed Critical Ping An Medical and Healthcare Management Co Ltd
Priority to CN202111005870.4A priority Critical patent/CN113569996B/zh
Publication of CN113569996A publication Critical patent/CN113569996A/zh
Application granted granted Critical
Publication of CN113569996B publication Critical patent/CN113569996B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/546Message passing systems or structures, e.g. queues
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明涉及数字医疗领域,提供了一种病案信息的分类方法、装置、设备以及存储介质,其中,方法包括:通过患者的病案信息,进行预处理,得到标准化病案信息,提取所述标准化病案信息中的各个标准化操作以及所对应的病案类型,根据病案类型划定所对应的目标病案类型,基于目标病案类型提取对应的多个病案类别,计算与各个所述病案类别的匹配度,在各个所述目标类别按照第三优先级规则选取优先级最高的目标类别进行分类。从而实现了无需对核心目录表中的每个病案类别都进行匹配度计算,而是只需要计算与目标病案类型下的各个病案类别的匹配度,进而节省了计算时间,能够有效的减小服务器端的计算压力。

Description

病案信息的分类方法、装置、设备以及存储介质
技术领域
本发明涉及数字医疗领域,特别涉及一种病案信息的分类方法、装置、设备以及存储介质。
背景技术
按病种分值付费是用大数据的技术进行病种分析的方法,这种分类方法以病案首页数据为基础,对数据中的疾病诊断和治疗方式进行穷举和聚类的方式进行分类,客观反映疾病严重程度、治疗复杂状态、消耗水平与临床行为规范,达到优化医疗资源、控制医保费用之目的。
按病种分值付费需要对患者的病案信息进行分类,目前,传统的分类的方式主要是通过在服务器端调取核心目录表中各个类别的数据,计算病案信息与每个类别的数据的匹配度,以对病案信息进行类别的划分,然而这种类别的划分方式导致每个病案信息分类都需要耗费较长的时间,无法及时对病案信息进行分类。
发明内容
本发明的主要目的为提供一种病案信息的分类方法、装置、设备以及存储介质,旨在解决传统的分类的方式导致每个病案信息分类都需要耗费较长的时间,无法及时对病案信息进行分类的问题。
本发明提供了一种病案信息的分类方法,包括:
获取患者的病案信息;所述病案信息包括对所述患者治疗所采用的操作代码集;
对所述病案信息进行预处理,得到标准化病案信息;
提取所述标准化病案信息中的各个标准化操作,获取各个标准化操作所对应的病案类型,并将各个所述标准化操作按照第一优先级规则进行排序,为每个所述标准化操作赋予对应的排序的优先级顺序标签;
根据获取到的所述病案类型按照第二优先级规则划定所述病案信息所对应的目标病案类型;
基于所述目标病案类型从预设的核心目录表中提取所述目标病案类型中对应的多个病案类别;其中,所述核心目录表预存有各个目标类型所对应的多个病案类别;
根据各个所述标准化操作以及对应的所述优先级顺序标签,计算所述病案信息与各个所述病案类别的匹配度;
从各个所述病案类别中获取所述匹配度大于预设匹配度的目标类别;
在各个所述目标类别中按照第三优先级规则选取优先级最高的目标类别进行分类,得到所述病案信息的最终分类结果。
进一步地,所述基于所述目标病案类型从预设的核心目录表中提取所述目标病案类型中对应的多个病案类别的步骤,包括:
向虚拟机发出所述目标病案类型查询命令;其中,所述虚拟机中预存有数据库的核心目标表;
接收所述虚拟机反馈的所述目标病案类型中对应的多个病案类别。
进一步地,所述根据各个所述标准化操作以及对应的所述优先级顺序标签,计算所述病案信息与各个所述病案类别的匹配度的步骤,包括:
基于各个所述标准化操作的优先级顺序标签获取每个所述标准化操作对应的病案类型;
将所述标准化操作按照其病案类型进行聚类处理,得到属于所述目标病案类型的第一标准化操作集,以及其他病案类型对应的第二标准化操作集;
将属于所述第一标准化操作集分别与各个所述第二标准化操作集进行不同的组合,得到操作代码集合集;
计算各个所述操作合集与各个所述病案类别之间的中间匹配度,并将所述操作合集与各个所述病案类别的所述中间匹配度,记为所述病案信息与各个所述病案类别的所述匹配度。
进一步地,所述计算各个所述操作合集与各个所述病案类别之间的匹配度的步骤,包括:
将所述操作合集中的各个操作进行向量化,得到各个操作对应的操作向量;
通过公式ot=softmax(Vst)计算得到合集向量ot;其中,st=f(Uxt+Wst-1+b),st为第t步的计算函数,所述xt为第t个操作向量,s0为0向量,V、U、W、b均为预设的参数;
根据公式计算合集向量与各个分类对应的类别向量之间的匹配度;其中,所述cosθ为匹配度,/>为类别向量。
进一步地,所述在各个所述目标类别中按照第三优先级规则选取优先级最高的目标类别进行分类的步骤,包括:
在各个所述目标类别中按照第三优先级规则选取优先级最高的目标类别;
将选取的所述目标类别的信息和所述病案信息存储在redis的MQ消息队列中;
将所述MQ消息队列发送给服务器进行选取优先级最高的目标类别进行分类的操作。
进一步地,所述根据获取到的所述病案类型按照第二优先级规则划定所述病案信息所对应的目标病案类型的步骤,包括:
获取第二优先级规则中优先级最高的第一病案类型;
检测各所述标准化操作所对应的病案类型中是否具有所述第一病案类型;
若具有所述第一病案类型,则认定所述第一病案类型为所述目标病案类型。
本发明还提供了一种病案信息的分类装置,包括:
接收模块,用于获取患者的病案信息;所述病案信息包括对所述患者治疗所采用的操作代码集;
预处理模块,用于对所述病案信息进行预处理,得到标准化病案信息;
排序模块,用于提取所述标准化病案信息中的各个标准化操作,获取各个标准化操作所对应的病案类型,并将各个所述标准化操作按照第一优先级规则进行排序,为每个所述标准化操作赋予对应的排序的优先级顺序标签;
划定模块,用于根据获取到的所述病案类型按照第二优先级规则划定所述病案信息所对应的目标病案类型;
提取模块,用于基于所述目标病案类型从预设的核心目录表中提取所述目标病案类型中对应的多个病案类别;其中,所述核心目录表预存有各个目标类型所对应的多个病案类别;
计算模块,用于根据各个所述标准化操作以及对应的所述优先级顺序标签,计算所述病案信息与各个所述病案类别的匹配度;
获取模块,用于从各个所述病案类别中获取所述匹配度大于预设匹配度的目标类别;
分类模块,用于在各个所述目标类别中按照第三优先级规则选取优先级最高的目标类别进行分类,得到所述病案信息的最终分类结果。
进一步地,所述提取模块,包括:
命令发出子模块,用于向虚拟机发出所述目标病案类型查询命令;其中,所述虚拟机中预存有数据库的核心目标表;
病案类别接收子模块,用于接收所述虚拟机反馈的所述目标病案类型中对应的多个病案类别。
本发明还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
本发明的有益效果:通过患者的病案信息,进行预处理,得到标准化病案信息,提取所述标准化病案信息中的各个标准化操作以及所对应的病案类型,根据病案类型划定所对应的目标病案类型,基于目标病案类型提取对应的多个病案类别,计算与各个所述病案类别的匹配度,在各个所述目标类别按照第三优先级规则选取优先级最高的目标类别进行分类。从而实现了无需对核心目录表中的每个病案类别都进行匹配度计算,而是只需要计算与目标病案类型下的各个病案类别的匹配度,进而节省了计算时间,能够有效的减小服务器端的计算压力。
附图说明
图1是本发明一实施例的一种病案信息的分类方法的流程示意图;
图2是本发明一实施例的一种病案信息的分类装置的结构示意框图;
图3为本申请一实施例的计算机设备的结构示意框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明,本发明实施例中所有方向性指示(诸如上、下、左、右、前、后等)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变,所述的连接可以是直接连接,也可以是间接连接。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
另外,在本发明中如涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
参照图1,本发明提出一种病案信息的分类方法,包括:
S1:获取患者的病案信息;所述病案信息包括对所述患者治疗所采用的操作代码集;
S2:对所述病案信息进行预处理,得到标准化病案信息;
S3:提取所述标准化病案信息中的各个标准化操作,获取各个标准化操作所对应的病案类型,并将各个所述标准化操作按照第一优先级规则进行排序,为每个所述标准化操作赋予对应的排序的优先级顺序标签;
S4:根据获取到的所述病案类型按照第二优先级规则划定所述病案信息所对应的目标病案类型;
S5:基于所述目标病案类型从预设的核心目录表中提取所述目标病案类型中对应的多个病案类别;其中,所述核心目录表预存有各个目标类型所对应的多个病案类别;
S6:根据各个所述标准化操作以及对应的所述优先级顺序标签,计算所述病案信息与各个所述病案类别的匹配度;
S7:从各个所述病案类别中获取所述匹配度大于预设匹配度的目标类别;
S8:在各个所述目标类别中按照第三优先级规则选取优先级最高的目标类别进行分类,得到所述病案信息的最终分类结果。
如上述步骤S1所述,获取患者的病案信息,其中接收的方式为相关人员上传的病案信息,一般为各个医院上传各个患者的病案信息,其中,该病案信息为对患者治疗的各种操作,一般包括手术操作、治疗操作以及诊断操作等类型的操作,接收的方式一般为通过无线或者有线的数据传输。
如上述步骤S2所述,对所述病案信息进行预处理,得到标准化病案信息。其中,预处理为对病案信息中的数据进行优化,例如将各个操作进行标准化的处理,标准化包括对各个操作进行同义词转化,剔除形容词,语气词等,以及还包括删除一些简单的手术操作,例如,包扎伤口、消毒等对判断病案信息没有帮助的操作。
如上述步骤S3所述,提取所述标准化病案信息中的各个标准化操作,获取各个标准化操作所对应的病案类型,并将各个所述标准化操作按照第一优先级规则进行排序,为每个所述标准化操作赋予对应的排序的优先级顺序标签。即将预处理后的标准化病案信息中的每个标准化操作提取出来进行分析,根据各个标准化操作可以获取到对应的病案类型,例如若只有手术组、治疗组以及诊断组三种类型时,则可以根据预先设置的标准化操作与病案类型的对应关系得到各个标准化操作的病案类型。并将各个标准化操作按照第一优先级规则进行排序,其中,第一优先级规则为各个病案类型和在病案信息中的顺序的优先级,例如设定手术组>治疗组>诊断组,若属于同一病案类型,则按照其在病案信息中的顺序进行排列即可,为每个标准化操作赋予对应的排序的优先级顺序标签,举例而言,该标签记录有该病案信息,例如该病案信息的序号为BZ1004,属于手术组,在手术组中的排序为第三,则对应的优先级顺序标签为BZ1004+1+0003,其中,中间的1表示手术组,0003表示手术组中排第三,从而完成标签的赋予。
如上述步骤S4所述,根据获取到的所述病案类型按照第二优先级规则划定所述病案信息所对应的目标病案类型。其中,第二优先级规则,为各个病案类型的顺序的优先级,例如设定手术组>治疗组>诊断组,若优先级最高的为手术组的病案类型,则将该病案信息归于手术组的类型,若优先级最高的为治疗组的病案类型(即无手术组的病案类型),则将该病案信息归于治疗组的类型,从而得到病案信息所对应的目标病案类型。
如上述步骤S5所述,基于所述目标病案类型从预设的核心目录表中提取所述目标病案类型中对应的多个病案类别。其中,预设的核心目录表一般认为存储于对应的服务器中,其包含了各个目标病案类型下的多个病案类别,即为病案信息划分类别的依据,在一些实施例中,也可以通过中间的虚拟机先获取到该核心目录表,后续就可以从虚拟机处提取该核心目录表进行比对,而无需占用服务器的接口,从而缓解了服务器端的压力。
如上述步骤S6所述,根据各个所述标准化操作以及对应的所述优先级顺序标签,计算与各个所述病案类别的匹配度。其中,具体地计算方法为根据标准化操作的优先级顺序标签按照优先级顺序进行不同的排列组合,例如选取优先级最高的标准化操作为一组,与各个病案类别进行匹配度计算,也可以将优先级最高的与优先级次高的标准化操作进行组合,需要说明的是,对各个标准化操作的各种组合不做限定,由于病案信息一般会与多个病案类别都相匹配,因此进行不同的排列组合并计算匹配度的目的是为了尽可能多的算出相匹配的病案类别,以便于后续挑选目标类别。
如上述步骤S7-S8所述,从各个所述病案类别中获取所述匹配度大于预设匹配度的目标类别,在各个所述目标类别中按照第三优先级规则选取优先级最高的目标类别进行分类。即先根据预设匹配度筛选出相匹配的目标类别,然后按照第三优先级规则选取优先级最高的目标类别进行分类,其中,该第三优先级规则为对各个病案类别所划分的优先级顺序,例如可以以各个病案类别报销的比例作为优先级顺序,例如,报销的比例多,其优先级越高。当然,也可以是事先由对应的人员进行设定的优先级顺序,从而完成了对病案信息进行分类。从而实现了无需对核心目录表中的每个分类都进行匹配度计算,只需要计算与目标病案类型下的各个病案类别的匹配度,进而节省了计算时间,能够有效的减小服务器端的计算压力。
在一个实施例中,所述基于所述目标病案类型从预设的核心目录表中提取所述目标病案类型中对应的多个病案类别的步骤S5,包括:
S501:向虚拟机发出所述目标病案类型查询命令;其中,所述虚拟机中预存有数据库的核心目标表;
S502:接收所述虚拟机反馈的所述目标病案类型中对应的多个病案类别。
如上述步骤S501-S502所述,实现了通过虚拟机进行数据的计算。其中,虚拟机一般为java虚拟机,以便于和服务器端进行数据连接,在该虚拟机中,预先存储各个核心目录表,操作目录表等相关的表格,后续只需要在虚拟机处进行计算,就可以得到各个病案信息所对应的病案类别,后续接收到虚拟机反馈的所述目标病案类型中对应的多个病案类别,即可得到对应的多个病案类别,以便于后续进行分析判断。从而实现了当病案调用分类接口进行分类时,无须每次都从数据库中查询,改从java虚拟机内存中取配置数据进行比对和运算,进一步减少了服务器端的运算压力,使服务器端可以正常运行其他功能。
在一个实施例中,所述根据各个所述标准化操作以及对应的所述优先级顺序标签,计算所述病案信息与各个所述病案类别的匹配度的步骤S6,包括:
S601:基于各个所述标准化操作的优先级顺序标签获取每个所述标准化操作对应的病案类型;
S602:将所述标准化操作按照其病案类型进行聚类处理,得到属于所述目标病案类型的第一标准化操作集,以及其他病案类型对应的第二标准化操作集;
S603:将属于所述第一标准化操作集分别与各个所述第二标准化操作集进行不同的组合,得到操作代码集合集;
S604:计算各个所述操作合集与各个所述病案类别之间的中间匹配度,并将所述操作合集与各个所述病案类别的所述中间匹配度,记为所述病案信息与各个所述病案类别的所述匹配度。
如上述步骤S601-S604所述,实现了病案信息与各个病案类别之间匹配度的计算,具体地,根据标准化操作的优先级顺序标签可以获取到对应的病案类型,再基于该病案类型进行聚类处理,得到各个病案类型对应的集合,以集合或者集合的组合计算与各个病案类别之间的匹配度,从而可以达到对匹配度的精准计算,因为集合中的元素为一种病案类型的操作,其包含的具体操作其对应的病案类型具有相当高的维度匹配,因此计算得到的值也更加准确,所以提高了计算的匹配度的精度,使分类更加合理。
在一个实施例中,所述计算各个所述操作合集与各个所述病案类别之间的匹配度的步骤S604,包括:
S6041:将所述操作合集中的各个操作进行向量化,得到各个操作对应的操作向量;
S6042:通过公式ot=softmax(Vst)计算得到合集向量ot;其中,st=f(Uxt+Wst-1+b),st为第t步的计算函数,所述xt为第t个操作向量,s0为0向量,V、U、W、b均为预设的参数;
S6043:根据公式计算合集向量与各个分类对应的类别向量之间的匹配度;其中,所述cosθ为匹配度,/>为类别向量。
如上述步骤S6041-S6043所述,实现了匹配度的计算,即先通过将各个操作进行向量化,得到各个向量化的操作向量,基于公式ot=softmax(Vst)得到合集向量,即通过该公式可以将所有的向量对应的信息进行累积,即最后得到的合集向量具有所有操作向量的信息,可以认为是对操作向量的融合,根据公式计算合集向量与各个病案类别对应的类别向量之间的匹配度,该匹配度即为病例信息与各个病案类别之间的匹配度。
在一个实施例中,所述在各个所述目标类别中按照第三优先级规则选取优先级最高的目标类别进行分类的步骤S8,包括:
S801:在各个所述目标类别中按照第三优先级规则选取优先级最高的目标类别;
S802:将选取的所述目标类别的信息和所述病案信息存储在redis的MQ消息队列中;
S803:将所述MQ消息队列发送给服务器进行选取优先级最高的目标类别进行分类的操作。
如上述步骤S801-S803所述,实现了与服务器的数据交互。即在选取了最终的目标类别后,将选取的所述目标类别的信息和所述病案信息存储在redis的MQ消息队列中,需要说明的是,通过MQ消息队列进行数据的传输,可以实现异步操作,服务器端只需要根据MQ消息的顺序将各个病案信息依据其选取的目标类别进行对应保存即可。其遵循先进先出规则,使各个医院无需专注于数据的反馈,实现了异步执行,减低了业务的响应时间,进一步降低了服务器端的计算压力。
在一个实施例中,所述根据获取到的所述病案类型按照第二优先级规则划定所述病案信息所对应的目标病案类型的步骤S4,包括:
S401:获取第二优先级规则中优先级最高的第一病案类型;
S402:检测各所述标准化操作所对应的病案类型中是否具有所述第一病案类型;
S403:若具有所述第一病案类型,则认定所述第一病案类型为所述目标病案类型。
如上述步骤S401-S403所述,实现了对病例信息所对应的病案类型的确定。即获取到第二优先级规则中优先级最高的第一病案类型,然后检测各个标准化操作所对应的病案类型中是否具有所述第一病案类型,若具有所述第一病案类型,则认定所述第一病案类型为所述目标病案类型。若无,则检测优先级次高的第二病案类型,若具有所述第二病案类型,则认定所述第二病案类型为所述目标病案类型,从而可以找出所对应的病案类型。
在一个实施例中,所述在各个所述目标类别中按照第三优先级规则选取优先级最高的目标类别进行分类,得到所述病案信息的最终分类结果的步骤S8之后,还包括:
S901:建立TOKEN列表,并为每个所述病案信息赋予一个TOKEN标签;
S902:获取每个所述病案信息的最终分类结果,并将所述最终分类结果附着于对应的所述TOKEN标签上,形成病案标签;
S903:将所述病案标签输入至数据库中,并根据所述病案标签进行归类处理。
如上述步骤S901-S903所述,为了更方便后续对各个病案信息进行划分,可以建立TOKEN列表,然后基于该TOKEN列表为每个病案信息都赋予一个TOKEN标签,由于TOKEN标签具有唯一性,且难以被仿制,所以用TOKEN标签来对每个病案信息进行标记,然后将获取到的病案信息和最终分类结果附着在TOKEN标签上,以建立病案信息-TOKEN标签-病案信息三者的对应关系,后续可以直接根据病案信息的TOKEN标签进行分类,需要说明的是,病案信息虽然附着在TOKEN标签上,但是在进行验证时只需要通过TOKEN标签的原有部分进行验证。
本发明还提供了一种病案信息的分类装置,其特征在于,包括:
接收模块10,用于获取患者的病案信息;所述病案信息包括对所述患者治疗所采用的操作代码集;
预处理模块20,用于对所述病案信息进行预处理,得到标准化病案信息;
排序模块30,用于提取所述标准化病案信息中的各个标准化操作,获取各个标准化操作所对应的病案类型,并将各个所述标准化操作按照第一优先级规则进行排序,为每个所述标准化操作赋予对应的排序的优先级顺序标签;
划定模块40,用于根据获取到的所述病案类型按照第二优先级规则划定所述病案信息所对应的目标病案类型;
提取模块50,用于基于所述目标病案类型从预设的核心目录表中提取所述目标病案类型中对应的多个病案类别;其中,所述核心目录表预存有各个目标类型所对应的多个病案类别;
计算模块60,用于根据各个所述标准化操作以及对应的所述优先级顺序标签,计算所述病案信息与各个所述病案类别的匹配度;
获取模块70,用于从各个所述病案类别中获取所述匹配度大于预设匹配度的目标类别;
分类模块80,用于在各个所述目标类别中按照第三优先级规则选取优先级最高的目标类别进行分类,得到所述病案信息的最终分类结果。
在一个实施例例中,所述提取模块50,包括:
命令发出子模块,用于向虚拟机发出所述目标病案类型查询命令;其中,所述虚拟机中预存有数据库的核心目标表;
病案类别接收子模块,用于接收所述虚拟机反馈的所述目标病案类型中对应的多个病案类别。
本发明的有益效果:通过患者的病案信息,进行预处理,得到标准化病案信息,提取所述标准化病案信息中的各个标准化操作以及所对应的病案类型,根据病案类型划定所对应的目标病案类型,基于目标病案类型提取对应的多个病案类别,计算与各个所述病案类别的匹配度,在各个所述目标类别按照第三优先级规则选取优先级最高的目标类别进行分类。从而实现了无需对核心目录表中的每个病案类别都进行匹配度计算,而是只需要计算与目标病案类型下的各个病案类别的匹配度,进而节省了计算时间,能够有效的减小服务器端的计算压力。
参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储各种病案信息等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时可以实现上述任一实施例所述的病案信息的分类方法。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。
本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时可以实现上述任一实施例所述的病案信息的分类方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储与一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM一多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

Claims (10)

1.一种病案信息的分类方法,其特征在于,包括:
获取患者的病案信息;所述病案信息包括对所述患者治疗所采用的操作代码集;
对所述病案信息进行预处理,得到标准化病案信息;
提取所述标准化病案信息中的各个标准化操作,获取各个标准化操作所对应的病案类型,并将各个所述标准化操作按照第一优先级规则进行排序,为每个所述标准化操作赋予对应的排序的优先级顺序标签;
根据获取到的所述病案类型按照第二优先级规则划定所述病案信息所对应的目标病案类型;
基于所述目标病案类型从预设的核心目录表中提取所述目标病案类型中对应的多个病案类别;其中,所述核心目录表预存有各个目标类型所对应的多个病案类别;
根据各个所述标准化操作以及对应的所述优先级顺序标签,计算所述病案信息与各个所述病案类别的匹配度;
从各个所述病案类别中获取所述匹配度大于预设匹配度的目标类别;
在各个所述目标类别中按照第三优先级规则选取优先级最高的目标类别进行分类,得到所述病案信息的最终分类结果;
其中,所述第一优先级规则为各个所述病案类型和在所述病案信息中的顺序的优先级,所述第二优先级规则为各个所述病案类型的顺序的优先级,所述第三优先级规则为对各个所述病案类别所划分的优先级顺序。
2.如权利要求1所述的病案信息的分类方法,其特征在于,所述基于所述目标病案类型从预设的核心目录表中提取所述目标病案类型中对应的多个病案类别的步骤,包括:
向虚拟机发出所述目标病案类型查询命令;其中,所述虚拟机中预存有数据库的核心目标表;
接收所述虚拟机反馈的所述目标病案类型中对应的多个病案类别。
3.如权利要求1所述的病案信息的分类方法,其特征在于,所述根据各个所述标准化操作以及对应的所述优先级顺序标签,计算所述病案信息与各个所述病案类别的匹配度的步骤,包括:
基于各个所述标准化操作的优先级顺序标签获取每个所述标准化操作对应的病案类型;
将所述标准化操作按照其病案类型进行聚类处理,得到属于所述目标病案类型的第一标准化操作集,以及其他病案类型对应的第二标准化操作集;
将属于所述第一标准化操作集分别与各个所述第二标准化操作集进行不同的组合,得到操作代码集合集;
计算各个所述操作合集与各个所述病案类别之间的中间匹配度,并将所述操作合集与各个所述病案类别的所述中间匹配度,记为所述病案信息与各个所述病案类别的所述匹配度。
4.如权利要求3所述的病案信息的分类方法,其特征在于,所述计算各个所述操作合集与各个所述病案类别之间的匹配度的步骤,包括:
将所述操作合集中的各个操作进行向量化,得到各个操作对应的操作向量;
通过公式ot=softmax(Vst)计算得到合集向量ot;其中,st=f(Uxt+Wst-1+b),st为第t步的计算函数,所述xt为第t个操作向量,s0为0向量,V、U、W、b均为预设的参数;
根据公式计算合集向量与各个分类对应的类别向量之间的匹配度;其中,所述cosθ为匹配度,/>为类别向量。
5.如权利要求1所述的病案信息的分类方法,其特征在于,所述在各个所述目标类别中按照第三优先级规则选取优先级最高的目标类别进行分类的步骤,包括:
在各个所述目标类别中按照第三优先级规则选取优先级最高的目标类别;
将选取的所述目标类别的信息和所述病案信息存储在redis的MQ消息队列中;
将所述MQ消息队列发送给服务器进行选取优先级最高的目标类别进行分类的操作。
6.如权利要求5所述的病案信息的分类方法,其特征在于,所述根据获取到的所述病案类型按照第二优先级规则划定所述病案信息所对应的目标病案类型的步骤,包括:
获取第二优先级规则中优先级最高的第一病案类型;
检测各所述标准化操作所对应的病案类型中是否具有所述第一病案类型;
若具有所述第一病案类型,则认定所述第一病案类型为所述目标病案类型。
7.如权利要求1所述的病案信息的分类方法,其特征在于,所述在各个所述目标类别中按照第三优先级规则选取优先级最高的目标类别进行分类,得到所述病案信息的最终分类结果的步骤之后,还包括:
建立TOKEN列表,并为每个所述病案信息赋予一个TOKEN标签;
获取每个所述病案信息的最终分类结果,并将所述最终分类结果附着于对应的所述TOKEN标签上,形成病案标签;
将所述病案标签输入至数据库中,并根据所述病案标签进行归类处理。
8.一种病案信息的分类装置,其特征在于,包括:
接收模块,用于获取患者的病案信息;所述病案信息包括对所述患者治疗所采用的操作代码集;
预处理模块,用于对所述病案信息进行预处理,得到标准化病案信息;
排序模块,用于提取所述标准化病案信息中的各个标准化操作,获取各个标准化操作所对应的病案类型,并将各个所述标准化操作按照第一优先级规则进行排序,为每个所述标准化操作赋予对应的排序的优先级顺序标签;
划定模块,用于根据获取到的所述病案类型按照第二优先级规则划定所述病案信息所对应的目标病案类型;
提取模块,用于基于所述目标病案类型从预设的核心目录表中提取所述目标病案类型中对应的多个病案类别;其中,所述核心目录表预存有各个目标类型所对应的多个病案类别;
计算模块,用于根据各个所述标准化操作以及对应的所述优先级顺序标签,计算所述病案信息与各个所述病案类别的匹配度;
获取模块,用于从各个所述病案类别中获取所述匹配度大于预设匹配度的目标类别;
分类模块,用于在各个所述目标类别中按照第三优先级规则选取优先级最高的目标类别进行分类,得到所述病案信息的最终分类结果;
其中,所述第一优先级规则为各个所述病案类型和在所述病案信息中的顺序的优先级,所述第二优先级规则为各个所述病案类型的顺序的优先级,所述第三优先级规则为对各个所述病案类别所划分的优先级顺序。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202111005870.4A 2021-08-30 2021-08-30 病案信息的分类方法、装置、设备以及存储介质 Active CN113569996B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111005870.4A CN113569996B (zh) 2021-08-30 2021-08-30 病案信息的分类方法、装置、设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111005870.4A CN113569996B (zh) 2021-08-30 2021-08-30 病案信息的分类方法、装置、设备以及存储介质

Publications (2)

Publication Number Publication Date
CN113569996A CN113569996A (zh) 2021-10-29
CN113569996B true CN113569996B (zh) 2024-05-07

Family

ID=78173148

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111005870.4A Active CN113569996B (zh) 2021-08-30 2021-08-30 病案信息的分类方法、装置、设备以及存储介质

Country Status (1)

Country Link
CN (1) CN113569996B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114886417B (zh) * 2022-05-10 2023-09-22 南京布尔特医疗技术发展有限公司 一种智能化安全护理监控系统及方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109801693A (zh) * 2018-12-14 2019-05-24 平安医疗健康管理股份有限公司 病案分组方法及装置、终端和计算机可读存储介质
CN111339126A (zh) * 2020-02-27 2020-06-26 平安医疗健康管理股份有限公司 医疗数据筛选方法、装置、计算机设备和存储介质
CN111951972A (zh) * 2020-08-12 2020-11-17 望海康信(北京)科技股份公司 病案分组方法、装置、计算机设备及存储介质
CN112035473A (zh) * 2020-08-28 2020-12-04 平安医疗健康管理股份有限公司 病案数据管理方法、装置、设备及存储介质
CN112035664A (zh) * 2020-08-28 2020-12-04 平安医疗健康管理股份有限公司 药品的归类方法、装置以及计算机设备
CN112035120A (zh) * 2020-08-31 2020-12-04 平安医疗健康管理股份有限公司 基于医疗数据的逻辑代码获取方法、装置以及计算机设备
WO2021032219A2 (zh) * 2019-08-20 2021-02-25 山东众阳健康科技集团有限公司 基于深度学习的疾病分类编码方法、系统、设备及介质
KR20210064630A (ko) * 2019-11-26 2021-06-03 인천대학교 산학협력단 클래스 연관 규칙을 이용한 질병 분류 시스템 및 방법

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110021439B (zh) * 2019-03-07 2023-01-24 平安科技(深圳)有限公司 基于机器学习的医疗数据分类方法、装置和计算机设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109801693A (zh) * 2018-12-14 2019-05-24 平安医疗健康管理股份有限公司 病案分组方法及装置、终端和计算机可读存储介质
WO2021032219A2 (zh) * 2019-08-20 2021-02-25 山东众阳健康科技集团有限公司 基于深度学习的疾病分类编码方法、系统、设备及介质
KR20210064630A (ko) * 2019-11-26 2021-06-03 인천대학교 산학협력단 클래스 연관 규칙을 이용한 질병 분류 시스템 및 방법
CN111339126A (zh) * 2020-02-27 2020-06-26 平安医疗健康管理股份有限公司 医疗数据筛选方法、装置、计算机设备和存储介质
CN111951972A (zh) * 2020-08-12 2020-11-17 望海康信(北京)科技股份公司 病案分组方法、装置、计算机设备及存储介质
CN112035473A (zh) * 2020-08-28 2020-12-04 平安医疗健康管理股份有限公司 病案数据管理方法、装置、设备及存储介质
CN112035664A (zh) * 2020-08-28 2020-12-04 平安医疗健康管理股份有限公司 药品的归类方法、装置以及计算机设备
CN112035120A (zh) * 2020-08-31 2020-12-04 平安医疗健康管理股份有限公司 基于医疗数据的逻辑代码获取方法、装置以及计算机设备

Also Published As

Publication number Publication date
CN113569996A (zh) 2021-10-29

Similar Documents

Publication Publication Date Title
CN108170759B (zh) 投诉案件处理的方法、装置、计算机设备及存储介质
CN112016279B (zh) 电子病历结构化方法、装置、计算机设备和存储介质
JP4311552B2 (ja) ドキュメントの自動分離
US9652695B2 (en) Label consistency for image analysis
CN112862024B (zh) 一种文本识别方法及系统
CN110060750B (zh) 医疗数据推送方法、系统、计算机设备及可读存储介质
CN113241138B (zh) 医疗事件信息的抽取方法、装置、计算机设备及存储介质
CN113569996B (zh) 病案信息的分类方法、装置、设备以及存储介质
CN112651392A (zh) 证件信息的获取方法及装置、存储介质、计算机设备
CN113420116B (zh) 医疗文档的分析方法、装置、设备及介质
JP6926032B2 (ja) 製造管理システム及び方法
CN112035664B (zh) 药品的归类方法、装置以及计算机设备
CN113626591A (zh) 一种基于文本分类的电子病历数据质量评价方法
CN116052848B (zh) 一种医学成像质控的数据编码方法及系统
CN112364857A (zh) 基于数值抽取的图像识别方法、装置及存储介质
CN113343699B (zh) 日志安全风险的监测方法、装置、电子设备及介质
JP2004171316A (ja) Ocr装置及び文書検索システム及び文書検索プログラム
CN110321431B (zh) 信息分析方法、装置、计算机设备及存储介质
CN113191141A (zh) 问诊正则表达式生成方法、装置、设备及存储介质
CN113095073A (zh) 语料标签生成方法、装置、计算机设备和存储介质
US20210027052A1 (en) Image-processing device, image processing method, and storage medium on which program is stored
CN113496365A (zh) 一种仓库合并方案确定方法、装置、设备及介质
CN111475657A (zh) 一种显示设备、显示系统及实体对齐方法
JPH0484366A (ja) 文書種別判別装置
CN113239128B (zh) 基于隐式特征的数据对分类方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant