CN115759040A - 一种电子病历解析方法、装置、设备和存储介质 - Google Patents

一种电子病历解析方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN115759040A
CN115759040A CN202211584827.2A CN202211584827A CN115759040A CN 115759040 A CN115759040 A CN 115759040A CN 202211584827 A CN202211584827 A CN 202211584827A CN 115759040 A CN115759040 A CN 115759040A
Authority
CN
China
Prior art keywords
medical record
electronic medical
analysis
preset
element information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211584827.2A
Other languages
English (en)
Inventor
吴登盛
于剑秋
夏玉师
才红波
石延平
白永申
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lianren Healthcare Big Data Technology Co Ltd
Original Assignee
Lianren Healthcare Big Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lianren Healthcare Big Data Technology Co Ltd filed Critical Lianren Healthcare Big Data Technology Co Ltd
Priority to CN202211584827.2A priority Critical patent/CN115759040A/zh
Publication of CN115759040A publication Critical patent/CN115759040A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明实施例公开了一种电子病历解析方法、装置、设备和存储介质,其中,方法包括:提取预设电子病历集合中每一个电子病历的语义特征和版式结构特征,并根据语义特征和版式结构特征对预设电子病历集合进行电子病历分组;针对每个电子病历组中的电子病历进行病历要素提取,得到各组病历的病历要素信息;建立各病历要素信息与预设病历解析模板的模板字段间的解析映射关系;根据解析映射关系对待解析电子病历进行病历解析。本发明实施例的技术方案可以将电子病历的语义特征和版式结构特征作为确定解析映射关系的因素,提高了电子病历解析的准确性。

Description

一种电子病历解析方法、装置、设备和存储介质
技术领域
本发明实施例涉及数据分析技术领域,尤其涉及一种电子病历解析方法、装置、设备和存储介质。
背景技术
近些年来,越来越多的医院开始引入电子病历系统,由于电子病历系统的供应商众多,电子病历系统会根据自身存储的模板生产电子病历,这会使生成的电子病历的语义和版式存在过大的差异,从而给电子病历的解析存档过程带来了诸多问题。现有技术往往是利用语言模型提取电子病历中的要素信息,再根据要素信息与模板字段间的语义相似度对要素信息进行映射,但是因为由不同模板撰写生成的电子病历的语义特征和版式特征存在较大差异,会影响病历中要素信息的语义,进而影响根据语义相似度确定要素信息与模板字段间映射关系的准确性。
发明内容
本发明实施例提供了一种电子病历解析方法、装置、设备和存储介质,可以将电子病历的语义特征和版式结构特征作为确定电子病历中要素信息与模型字段模板字段间解析映射关系的因素,提高解析映射关系的准确性,进而提高电子病历解析的准确性。
第一方面,本发明实施例提供了一种电子病历解析方法,该方法包括:
提取预设电子病历集合中每一个电子病历的语义特征和版式结构特征,并根据所述语义特征和版式结构特征对所述预设电子病历集合进行电子病历分组;
针对每个电子病历组中的电子病历进行病历要素提取,得到各组病历的病历要素信息;
建立各所述病历要素信息与预设病历解析模板的模板字段间的解析映射关系;
根据所述解析映射关系对待解析电子病历进行病历解析。
第二方面,本发明实施例提供了一种电子病历解析装置,该装置包括:
电子病历分组模块,用于提取预设电子病历集合中每一个电子病历的语义特征和版式结构特征,并根据所述语义特征和版式结构特征对所述预设电子病历集合进行电子病历分组;
病历要素信息提取模块,用于针对每个电子病历组中的电子病历进行病历要素提取,得到各组病历的病历要素信息;
解析映射关系建立模块,用于建立各所述病历要素信息与预设病历解析模板的模板字段间的解析映射关系;
电子病历解析模块,用于根据所述解析映射关系对待解析电子病历进行病历解析。
第三方面,本发明实施例提供了一种计算机设备,该计算机设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现任一实施例所述的电子病历解析方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现任一实施例所述的电子病历解析方法。
本发明实施例所提供的技术方案,通过提取预设电子病历集合中每一个电子病历的语义特征和版式结构特征,并根据所述语义特征和版式结构特征对所述预设电子病历集合进行电子病历分组;针对每个电子病历组中的电子病历进行病历要素提取,得到各组病历的病历要素信息;建立各所述病历要素信息与预设病历解析模板的模板字段间的解析映射关系;根据所述解析映射关系对待解析电子病历进行病历解析。本发明实施例的技术方案解决了现有技术进行电子病历解析时仅根据语义相似度确定病历中要素信息与模板字段间的映射关系,映射关系准确性不足的问题,可以将电子病历的语义特征和版式结构特征作为确定解析映射关系的因素,提高了电子病历解析的准确性。
附图说明
图1是本发明实施例提供的一种电子病历解析方法流程图;
图2是本发明实施例提供的一种电子病历解析方法流程图;
图3是本发明实施例提供的一种解析电子病历的工作流程图;
图4是本发明实施例提供的一种电子病历解析装置的结构示意图;
图5是本发明实施例提供的一种计算机设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明实施例提供的一种电子病历解析方法流程图,本发明实施例可适用于对电子病历进行解析映射的场景中,该方法可以由电子病历解析装置执行,该装置可以由软件和/或硬件的方式来实现。
如图1所示,电子病历解析方法包括以下步骤:
S110、提取预设电子病历集合中每一个电子病历的语义特征和版式结构特征,并根据所述语义特征和版式结构特征对所述预设电子病历集合进行电子病历分组。
其中,预设电子病历集合可以是预设的由多个科室或者多个病历系统中收集的电子病历的集合,预设电子病历集合中可以包括多个采用不同电子病历模板撰写的电子病历。语义特征可以是电子病历中的内容与标题的语义是否相同的特征,例如,当病历中的病症一栏中的内容描述的并非关于病症的信息时,可知该病历中病症项的语义特征为:内容与标题的语义不同;版式结构特征可以包括结构特征和行文特征,结构特征可以是电子病历的整体结构的特征,例如竖形结构,横形结构等,行文特征可以是电子病历的各个要素的撰写特征,例如行文特征可以包括电子病历各个要素的排序顺序、层级关系、总分总或者分总分的撰写布局特征。
进一步的,可以通过预设的特征提取算法对各个电子病历的语义特征和版式结构特征进行提取。随后,可以对比各个电子病历的语义特征和版式结构特征,将语义特征和版式结构特征相同的电子病历分为同组。
因为不同电子病历撰写时采用的电子病历模板不同,通过对电子病历中的语义特征和版式结构特征进行提取,并将对比各个电子病历的语义特征和版式结构特征,将语义特征和版式结构特征相同的电子病历分为同组,也即将撰写时使用相同电子病历模板的电子病历分为同组,方便后续制定针对性的解析策略,提高电子病历解析的准确性。
S120、针对每个电子病历组中的电子病历进行病历要素提取,得到各组病历的病历要素信息。
其中,病历要素可以是组成电子病历的多种要素,例如患者信息、病症信息、治疗信息、医生确认信息等,相应的,病历要素信息即是各病历要素对应的相关内容信息,例如病历要素信息可以包括病历要素名称以及病历要素具体内容。具体的,可以通过文字识别或预设的病历要素算法提取每个样本电子病历中的病历要素,得到各组病历的病历要素信息。
S130、建立各所述病历要素信息与预设病历解析模板的模板字段间的解析映射关系。
其中,预设病历解析模板可以是预设的用于解析电子病历的模板,预设病历解析模板中包括多项模板字段,解析电子病历可以是将电子病历中的病历要素信息映射到预设病历解析模板的对应的模板字段中。因为不同用户的关注点不同,例如肿瘤科的医生只需要关注患肿瘤疾病的患者相关信息,而不需要关注患其他疾病的患者相关信息,因此,需要从众多电子病历中解析出患肿瘤疾病的患者相关信息至预设病历解析模板中,提高医院的工作效率。
解析映射关系可以是病历要素信息与预设病历解析模板字段间之间的映射对应关系,示例性的,可以根据病历要素信息中病历要素名称与预设病历解析模板的模板字段间的语义相似程度,建立病历要素信息与预设病历解析模板的模板字段间的解析映射关系。
进一步的,由不同模板撰写的电子病历中的病历要素信息与模板字段间之间的解析映射关系可能不同,为了提高解析映射关系的准确性,在确定病历要素信息与预设病历解析模板的模板字段间的解析映射关系后,可以由相关管理人员或领域内专家等用户对解析映射关系进行校验,核实病历要素信息与模板字段间的对应关系是否正确,当对应关系不正确对,可以对解析映射关系进行修正。通过对病历要素信息与预设病历解析模板的模板字段间的解析映射关系进行修正,可以提高由不同模板撰写的电子病历中的病历要素信息与模板字段间之间解析映射关系的准确性。
S140、根据所述解析映射关系对待解析电子病历进行病历解析。
其中,待解析电子病历可以是需要进行解析的由多个科室或者多个病历系统中收集的多个电子病历,例如,待解析电子病历可以是预设电子病历集合中的各个电子病历。由于上述步骤已经确定了病历要素信息与预设病历解析模板的模板字段间的解析映射关系,因此可以首先提取待解析电子病历中的病历要素信息,再基于解析映射关系将待解析电子病历中的病历要素信息映射到预设病历解析模板的模板字段中,完成对待解析电子病历的解析过程。
本发明实施例所提供的技术方案,通过提取预设电子病历集合中每一个电子病历的语义特征和版式结构特征,并根据语义特征和版式结构特征对预设电子病历集合进行电子病历分组;针对每个电子病历组中的电子病历进行病历要素提取,得到各组病历的病历要素信息;建立各病历要素信息与预设病历解析模板的模板字段间的解析映射关系;根据解析映射关系对待解析电子病历进行病历解析。本发明实施例的技术方案解决了现有技术进行电子病历解析时仅根据语义相似度确定病历中要素信息与模板字段间的映射关系,映射关系准确性不足的问题,可以将电子病历的语义特征和版式结构特征作为确定解析映射关系的因素,提高了电子病历解析的准确性。
图2是本发明实施例提供的一种电子病历解析方法流程图,本发明实施例可适用于对电子病历进行解析映射的场景中,本实施例在上述实施例的基础上,进一步的说明如何提取预设电子病历集合中每一个电子病历的语义特征和版式结构特征,并根据语义特征和版式结构特征对预设电子病历集合进行电子病历分组、如何针对每个电子病历组中的电子病历进行病历要素提取,得到各组病历的病历要素信息、如何建立各病历要素信息与预设病历解析模板的模板字段间的解析映射关系以及如何根据解析映射关系对待解析电子病历进行病历解析,该装置可以由软件和/或硬件的方式来实现,集成于具有应用开发功能的计算机设备中。
如图2所示,电子病历解析方法包括以下步骤:
S210、根据预设特征提取算法提取预设电子病历集合中每一个电子病历的语义特征和版式结构特征。
其中,预设特征提取算法可以是预设的可以对电子病历中的语义特征和版式结构特征进行提取的算法,语义特征可以是电子病历中的内容与标题的语义是否相同的特征,例如,当病历中的病症一栏中的内容描述的并非关于病症的信息时,可知该病历中病症项的语义特征为:内容与标题的语义不同;版式结构特征又可以包括结构特征和行文特征,结构特征可以是电子病历的整体结构的特征,例如竖形结构,横形结构等,行文特征可以是电子病历的各个要素的撰写特征,例如行文特征可以包括电子病历各个要素的排序顺序、层级关系、总分总或者分总分的撰写特征。预设电子病历集合可以是预设的由多个科室或者多个病历系统中收集的电子病历的集合,预设电子病历集合中可以包括多个采用不同电子病历模板撰写的电子病历,通过预设特征提取算法提取预设电子病历集合中每一个电子病历的语义特征和版式结构特征,通过后续的分析可以确定预设电子病历集合中每一个电子病历撰写时采用的电子病历模板。
S220、根据所述语义特征和版式结构特征生成各所述电子病历的特征指纹编码,并根据所述特征指纹编码对所述预设电子病历集合进行电子病历分组。
其中,特征指纹编码可以是记录电子病历的语义特征和版式结构特征的标识,每一种特征指纹编码可以对应一种电子病历模板,因此,当两个电子病历的特征指纹编码相同时,可以确定两者撰写时采用的电子病历模板相同,可以将两者分为同组。同样的,可以将预设电子病历集合中特征指纹编码相同的电子病历分为同组,实现对预设电子病历集合进行电子病历分组。可选的,有可能存在不同科室或者不同业务使用类似或者相同电子病历模板的情况,因此,可以根据“文档类型-科室类别-特征指纹编码”的形式进行电子病历分组。
S230、从每个所述电子病历组中抽取预设数量的样本电子病历。
其中,样本电子病历可以是需要后续用于确定解析映射关系的电子病历,可以在每个电子病历组中抽取预设数量的电子病历作为样本电子病历,预设数量的取值可以进行预先进行设置,例如取每组电子病历数量的10%或者1%。从每个电子病历组中抽取预设数量的样本电子病历,一方面可以确保每组的电子病历都有涉及,提高后续确定解析映射关系的准确性,另一方便也不会使样本电子病历数量过多,提高后续确定解析映射关系的效率。
S240、在每个样本电子病历中提取病历要素,得到各组病历的病历要素信息。
其中,病历要素可以是组成电子病历的多种要素,例如患者信息、病症信息、治疗信息、医生确认信息等,相应的,病历要素信息即各个病历要素对应的相关内容信息,,例如病历要素信息可以包括病历要素名称以及病历要素具体内容。具体的,可以通过预设的病历要素算法提取每个样本电子病历中的病历要素,得到各组病历的病历要素信息。
S250、计算所述病历要素信息中病历要素名称与预设病历解析模板的模板字段间的语义相似度。
其中,预设病历解析模板可以是预设的用于解析电子病历的模板,预设病历解析模板中包括多项模板字段,解析电子病历也即将电子病历中的病历要素信息映射到对应的模板字段中。因为不同用户的关注点不同,例如肿瘤科的医生只需要关注患肿瘤疾病的患者相关信息,而不需要关注患其他疾病的患者相关信息,因此,需要从众多电子病历中解析出患肿瘤疾病的患者相关信息至预设病历解析模板中,提高医院的工作效率。
语义相似度可以是衡量病历要素名称与模板字段间相似程度的一种参数,当病历要素名称与模板字段相似时,可以将病历要素信息映射到该模板字段中。通过计算病历要素信息中病历要素名称与预设病历解析模板的模板字段间的语义相似度,可以方便后续确定病历要素信息与模板字段之间的对应关系。
S260、根据所述相似度的数值建立所述病历要素信息与预设病历解析模板的模板字段间的解析映射关系。
其中,解析映射关系可以是病历要素信息与模板字段间之间的映射对应关系,示例性的,当相似度的数值超过预设的相似度标准阈值时,可以建立病历要素信息与预设病历解析模板的模板字段间的解析映射关系。
进一步的,由不同模板撰写的电子病历中的病历要素信息与模板字段间之间的解析映射关系可能不同,为了提高解析映射关系的准确性,可以接收用户的映射关系修正指令,对病历要素信息与预设病历解析模板的模板字段间的解析映射关系进行修正。
其中,映射关系修正指令可以是对解析映射关系进行修正的指令,在确定病历要素信息与预设病历解析模板的模板字段间的解析映射关系后,可以由相关管理人员或领域内专家对解析映射关系进行校验,核实病历要素信息与模板字段间的对应关系是否正确,当对应关系不正确对,用户可以对解析映射关系进行修正。通过对病历要素信息与预设病历解析模板的模板字段间的解析映射关系进行修正,可以提高由不同模板撰写的电子病历中的病历要素信息与模板字段间之间解析映射关系的准确性。
S270、提取待解析电子病历中的病历要素信息,并基于所述解析映射关系将所述待解析电子病历中的病历要素信息映射到所述预设病历解析模板的模板字段中。
其中,待解析电子病历可以是需要进行解析的由多个科室或者多个病历系统中收集的多个电子病历,例如,待解析电子病历可以是预设电子病历集合中的各个电子病历。由于上述步骤已经确定了病历要素信息与预设病历解析模板的模板字段间的解析映射关系,因此可以提取待解析电子病历中的病历要素信息,并基于解析映射关系将待解析电子病历中的病历要素信息映射到预设病历解析模板的模板字段中,完成对待解析电子病历的解析过程。
可选的,可以基于解析映射关系将病历要素信息中的病历要素内容映射到模板字段对应的文本框中,生成病历要素信息解析表,并将病历要素信息解析表存储在预设数据库中。
其中,病历要素信息解析表可以由模板字段和对应的文本框组成的表格,通过病历要素信息解析表可以增加病历要素信息的可读性。预设数据库可以是预设的用于存储病历要素信息解析表的数据库,例如HDFS(Hadoop Distributed File System,Hadoop分布式文件系统)数据库、MongoDB数据库、MySql(关系型数据库)等。
进一步的,相关管理人员或领域内专家还可以对病历要素信息解析表进行校验,查看是否存在缺失病历要素信息、映射关系错误等异常情况,当病历要素信息解析表存在异常情况时,可以继续对解析映射关系进行修正。
示例性的,图3是本发明实施例提供的一种解析电子病历的工作流程图,如图3所示,解析电子病历的工作流程为:首先提取电子病历集合中每一个电子病历的语义特征和版式结构特征,并根据语义特征和版式结构特征对电子病历集合进行电子病历分组;随后提取每个电子病历组中的样本电子病历的病历要素信息;根据病历要素信息与模板字段间的语义相似度建立解析映射关系;根据解析映射关系对样本电子病历的病历要素信息进行映射,得到样本病历解析表;随后人工检验样本病历解析表是否映射正确,例如当样本病历解析表中缺少样本电子病历的病历要素信息时,可以确定没有映射正确;当没有映射正确时,需要对解析映射关系进行修正,再重新根据修正后的解析映射关系对样本电子病历的病历要素信息进行映射,并继续检验修正后的解析映射关系是否正确;当映射正确时,根据解析映射关系对待解析电子病历进行病历解析,生成病历解析表;随后人工检验病历解析表是否映射正确,例如当病历解析表中缺少电子病历的病历要素信息时,可以确定没有映射正确;当没有映射正确时,需要再对解析映射关系进行修正,再重新根据修正后的解析映射关系对待解析电子病历进行病历解析,并继续检验修正后的解析映射关系是否正确;当映射正确时,将病历要素信息解析表存储在数据库中,结束病历解析工作。
本发明实施例所提供的技术方案,通过根据预设特征提取算法提取预设电子病历集合中每一个电子病历的语义特征和版式结构特征;根据语义特征和版式结构特征生成各电子病历的特征指纹编码,并根据特征指纹编码对预设电子病历集合进行电子病历分组;从每个电子病历组中抽取预设数量的样本电子病历;在每个样本电子病历中提取病历要素,得到各组病历的病历要素信息;计算病历要素信息中病历要素名称与预设病历解析模板的模板字段间的语义相似度;根据相似度的数值建立病历要素信息与预设病历解析模板的模板字段间的解析映射关系;提取待解析电子病历中的病历要素信息,并基于解析映射关系将待解析电子病历中的病历要素信息映射到预设病历解析模板的模板字段中。本发明实施例的技术方案解决了现有技术进行电子病历解析时仅根据语义相似度确定病历中要素信息与模板字段间的映射关系,映射关系准确性不足的问题,可以将电子病历的语义特征和版式结构特征作为确定解析映射关系的因素,提高了电子病历解析的准确性。
图4是本发明实施例提供的一种电子病历解析装置的结构示意图,本发明实施例可适用于对电子病历进行解析映射的场景中,该装置可以由软件和/或硬件的方式来实现,集成于具有应用开发功能的计算机设备中。
如图4所示,电子病历解析装置包括:电子病历分组模块310、病历要素信息提取模块320、解析映射关系建立模块330、和电子病历解析模块340。
其中,电子病历分组模块310,用于提取预设电子病历集合中每一个电子病历的语义特征和版式结构特征,并根据语义特征和版式结构特征对预设电子病历集合进行电子病历分组;病历要素信息提取模块320,用于针对每个电子病历组中的电子病历进行病历要素提取,得到各组病历的病历要素信息;解析映射关系建立模块330,用于建立各病历要素信息与预设病历解析模板的模板字段间的解析映射关系;电子病历解析模块340,用于根据解析映射关系对待解析电子病历进行病历解析。
本发明实施例所提供的技术方案,通过提取预设电子病历集合中每一个电子病历的语义特征和版式结构特征,并根据语义特征和版式结构特征对预设电子病历集合进行电子病历分组;针对每个电子病历组中的电子病历进行病历要素提取,得到各组病历的病历要素信息;建立各病历要素信息与预设病历解析模板的模板字段间的解析映射关系;根据解析映射关系对待解析电子病历进行病历解析。本发明实施例的技术方案解决了现有技术进行电子病历解析时仅根据语义相似度确定病历中要素信息与模板字段间的映射关系,映射关系准确性不足的问题,可以将电子病历的语义特征和版式结构特征作为确定解析映射关系的因素,提高了电子病历解析的准确性。
在一种可选的实施方式中,电子病历分组模块310具体用于:根据预设特征提取算法提取预设电子病历集合中每一个电子病历的语义特征和版式结构特征;根据语义特征和版式结构特征生成各电子病历的特征指纹编码,并根据特征指纹编码对预设电子病历集合进行电子病历分组。
在一种可选的实施方式中,病历要素信息提取模块320具体用于:从每个电子病历组中抽取预设数量的样本电子病历;在每个样本电子病历中提取病历要素,得到各组病历的病历要素信息。
在一种可选的实施方式中,解析映射关系建立模块330具体用于:计算病历要素信息中病历要素名称与预设病历解析模板的模板字段间的语义相似度,根据相似度的数值建立病历要素信息与预设病历解析模板的模板字段间的解析映射关系。
在一种可选的实施方式中,电子病历解析模块340具体用于:提取待解析电子病历中的病历要素信息,并基于解析映射关系将待解析电子病历中的病历要素信息映射到预设病历解析模板的模板字段中。
在一种可选的实施方式中,电子病历解析模块340还用于:基于解析映射关系将病历要素信息中的病历要素内容映射到模板字段对应的文本框中,生成病历要素信息解析表,并将病历要素信息解析表存储在预设数据库中。
在一种可选的实施方式中,电子病历解析装置还包括:解析映射关系修正模块,用于接收用户的映射关系修正指令,对病历要素信息与预设病历解析模板的模板字段间的解析映射关系进行修正。
本发明实施例所提供的电子病历解析装置可执行本发明任意实施例所提供的电子病历解析方法,具备执行方法相应的功能模块和有益效果。
图5为本发明实施例提供的一种计算机设备的结构示意图。图5示出了适于用来实现本发明实施方式的示例性计算机设备12的框图。图5显示的计算机设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。计算机设备12可以任意具有计算能力的终端设备,可以与配置于电子病历解析设备中。
如图5所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18可以是几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。系统存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如系统存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机设备12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图5中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发实施例所提供的电子病历解析方法,该方法包括:
提取预设电子病历集合中每一个电子病历的语义特征和版式结构特征,并根据所述语义特征和版式结构特征对所述预设电子病历集合进行电子病历分组;
针对每个电子病历组中的电子病历进行病历要素提取,得到各组病历的病历要素信息;
建立各所述病历要素信息与预设病历解析模板的模板字段间的解析映射关系;
根据所述解析映射关系对待解析电子病历进行病历解析。
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任意实施例所提供的电子病历解析方法,包括:
提取预设电子病历集合中每一个电子病历的语义特征和版式结构特征,并根据所述语义特征和版式结构特征对所述预设电子病历集合进行电子病历分组;
针对每个电子病历组中的电子病历进行病历要素提取,得到各组病历的病历要素信息;
建立各所述病历要素信息与预设病历解析模板的模板字段间的解析映射关系;
根据所述解析映射关系对待解析电子病历进行病历解析。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于:电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言,诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
本领域普通技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个计算装置上,或者分布在多个计算装置所组成的网络上,可选地,他们可以用计算机装置可执行的程序代码来实现,从而可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件的结合。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种电子病历解析方法,其特征在于,所述方法包括:
提取预设电子病历集合中每一个电子病历的语义特征和版式结构特征,并根据所述语义特征和版式结构特征对所述预设电子病历集合进行电子病历分组;
针对每个电子病历组中的电子病历进行病历要素提取,得到各组病历的病历要素信息;
建立各所述病历要素信息与预设病历解析模板的模板字段间的解析映射关系;
根据所述解析映射关系对待解析电子病历进行病历解析。
2.根据权利要求1所述的方法,其特征在于,所述提取预设电子病历集合中每一个电子病历的语义特征和版式结构特征,并根据所述语义特征和版式结构特征对所述预设电子病历集合进行电子病历分组,包括:
根据预设特征提取算法提取所述预设电子病历集合中每一个电子病历的语义特征和版式结构特征;
根据所述语义特征和版式结构特征生成各所述电子病历的特征指纹编码,并根据所述特征指纹编码对所述预设电子病历集合进行电子病历分组。
3.根据权利要求1所述的方法,其特征在于,所述针对每个电子病历组中的电子病历进行病历要素提取,得到各组病历的病历要素信息,包括:
从每个所述电子病历组中抽取预设数量的样本电子病历;
在每个样本电子病历中提取病历要素,得到各组病历的病历要素信息。
4.根据权利要求3所述的方法,其特征在于,所述建立各所述病历要素信息与预设病历解析模板的模板字段间的解析映射关系,包括:
计算所述病历要素信息中病历要素名称与预设病历解析模板的模板字段间的语义相似度,
根据所述相似度的数值建立所述病历要素信息与预设病历解析模板的模板字段间的解析映射关系。
5.根据权利要求1所述的方法,其特征在于,所述根据所述解析映射关系对待解析电子病历进行病历解析,包括:
提取待解析电子病历中的病历要素信息,并基于所述解析映射关系将所述待解析电子病历中的病历要素信息映射到所述预设病历解析模板的模板字段中。
6.根据权利要求5所述的方法,其特征在于,所述基于所述解析映射关系将所述待解析电子病历中的病历要素信息映射到所述预设病历解析模板的模板字段中,包括:
基于所述解析映射关系将所述病历要素信息中的病历要素内容映射到所述模板字段对应的文本框中,生成病历要素信息解析表,并将所述病历要素信息解析表存储在预设数据库中。
7.根据权利要求1-6中任一所述的方法,所述方法还包括:
接收用户的映射关系修正指令,对所述病历要素信息与预设病历解析模板的模板字段间的解析映射关系进行修正。
8.一种电子病历解析装置,其特征在于,所述装置包括:
电子病历分组模块,用于提取预设电子病历集合中每一个电子病历的语义特征和版式结构特征,并根据所述语义特征和版式结构特征对所述预设电子病历集合进行电子病历分组;
病历要素信息提取模块,用于针对每个电子病历组中的电子病历进行病历要素提取,得到各组病历的病历要素信息;
解析映射关系建立模块,用于建立各所述病历要素信息与预设病历解析模板的模板字段间的解析映射关系;
电子病历解析模块,用于根据所述解析映射关系对待解析电子病历进行病历解析。
9.一种计算机设备,其特征在于,所述计算机设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的电子病历解析方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的电子病历解析方法。
CN202211584827.2A 2022-12-09 2022-12-09 一种电子病历解析方法、装置、设备和存储介质 Pending CN115759040A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211584827.2A CN115759040A (zh) 2022-12-09 2022-12-09 一种电子病历解析方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211584827.2A CN115759040A (zh) 2022-12-09 2022-12-09 一种电子病历解析方法、装置、设备和存储介质

Publications (1)

Publication Number Publication Date
CN115759040A true CN115759040A (zh) 2023-03-07

Family

ID=85345720

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211584827.2A Pending CN115759040A (zh) 2022-12-09 2022-12-09 一种电子病历解析方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN115759040A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117558392A (zh) * 2024-01-12 2024-02-13 富纳德科技(北京)有限公司 一种电子病历共享协作方法与系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117558392A (zh) * 2024-01-12 2024-02-13 富纳德科技(北京)有限公司 一种电子病历共享协作方法与系统
CN117558392B (zh) * 2024-01-12 2024-04-05 富纳德科技(北京)有限公司 一种电子病历共享协作方法与系统

Similar Documents

Publication Publication Date Title
CN107833603B (zh) 电子病历文档分类方法、装置、电子设备及存储介质
CN109522552B (zh) 一种医疗信息的归一化方法、装置、介质及电子设备
CN109634941B (zh) 医疗数据处理方法、装置、电子设备及存储介质
CN111144210B (zh) 图像的结构化处理方法及装置、存储介质及电子设备
CN109524070B (zh) 数据处理方法及装置、电子设备、存储介质
CN111090641B (zh) 数据处理方法及装置、电子设备、存储介质
CN111291049A (zh) 一种创建表的方法、装置、设备和存储介质
CN111081329A (zh) 临床数据自动录入方法及装置、电子设备、存储介质
CN114490642A (zh) 患者主索引生成方法、装置和介质
CN111143556A (zh) 软件功能点自动计数方法、装置、介质及电子设备
CN115759040A (zh) 一种电子病历解析方法、装置、设备和存储介质
CN114330272A (zh) 一种病历模板生成方法、装置、电子设备及存储介质
CN114005498A (zh) 临床试验数据逻辑核查方法和装置、设备、存储介质
CN115762704A (zh) 一种处方审核方法、装置、设备和存储介质
CN109545319B (zh) 基于知识关系分析的处方告警方法及终端设备
CN111063445A (zh) 基于医疗数据的特征提取方法及装置、设备和介质
CN115761778A (zh) 一种文献重构方法、装置、设备和存储介质
CN113792138B (zh) 报表生成方法、装置、电子设备及存储介质
CN109299475B (zh) 一种医学文档的处理方法、装置、介质及电子设备
CN113393295A (zh) 服务数据的推送方法、装置、电子设备及存储介质
CN113806556A (zh) 基于电网数据的知识图谱的构建方法、装置、设备及介质
CN109597847B (zh) 医疗数据回沉方法及装置、存储介质、电子终端
CN113641714A (zh) 医疗数据矫正方法、装置、计算机设备及存储介质
CN112699872A (zh) 表单审核处理方法及装置、电子设备和存储介质
CN111401009A (zh) 一种数字表情符识别转换方法、装置、服务器及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination