CN116386063A

CN116386063A - 纸质病历的内容识别方法及装置

Info

Publication number: CN116386063A
Application number: CN202310663066.8A
Authority: CN
Inventors: 于红刚; 姚理文; 吴志丰; 罗侪杰
Original assignee: Renmin Hospital of Wuhan University
Current assignee: Renmin Hospital of Wuhan University
Priority date: 2023-06-06
Filing date: 2023-06-06
Publication date: 2023-07-04
Anticipated expiration: 2043-06-06
Also published as: CN116386063B

Abstract

本申请提供一种纸质病历的内容识别方法及装置，该纸质病历的内容识别方法包括：获取第一病历图像；预处理得到第二病历图像；分别计算各个病历版面分区对应的第一图像相似度；确定待识别分区图像；得到各个待识别分区图像的文本字体类别；将文本字体类别属于印刷字体类别的待识别印刷分区图像输入预设印刷体文字识别模型进行识别，得到各个待识别印刷分区图像的印刷字体识别结果；将手写字体类别的待识别分区图像输入预设手写体文字识别模型进行识别，得到各个待识别手写分区图像的手写字体识别结果；将识别结果添加至预设空白病历模板图像上对应的病历版面分区中。本申请能够提高纸质病历的内容识别准确率。

Description

纸质病历的内容识别方法及装置

技术领域

本申请主要涉及图像处理技术领域，具体涉及一种纸质病历的内容识别方法及装置。

背景技术

临床上医生会将患者的主诉、现病史、既往史、个人史、体格检查等重要信息记录于入院大病历或门诊手写病历中，其中很大一部分可以作为其诊断与治疗的依据。此外，在医疗系统中有很多文件是以纸质病历形式存在，医生无法快速准确的对其信息进行归纳总结，并且为了提取其中的信息,需要人工录入，或者使用机器识别，这需要消耗大量的人力物力。光学字符识别(OCR,Optical Character Recognition)的发展有几十年的时间,目前已经有很多可以实用的系统，但是传统光学字符识别会机械的对整个版面进行识别，不能根据各个区域的特点进行不同的检测，导致识别准确率较低。

也即，现有技术中纸质病历的内容识别准确率不高。

发明内容

本申请提供一种纸质病历的内容识别方法及装置，旨在解决现有技术中纸质病历的内容识别准确率不高的问题。

第一方面，本申请提供一种纸质病历的内容识别方法，所述纸质病历的内容识别方法包括：

获取对纸质病历进行拍摄得到的第一病历图像和所述纸质病历的病历模板类型；

对所述第一病历图像进行预处理，得到第二病历图像；

获取所述病历模板类型的预设空白病历模板图像，其中，所述预设空白病历模板图像上预先标注有多个病历版面分区；

将所述预设空白病历模板图像与所述第二病历图像对齐，获取所述第二病历图像上位于各个所述病历版面分区内的各个第一病历分区图像和所述预设空白病历模板图像上位于所述病历版面分区内的各个第二病历分区图像；

分别计算各个所述第一病历分区图像和对应的所述第二病历分区图像的第一图像相似度，得到各个病历版面分区对应的第一图像相似度；

将第一图像相似度低于第一相似度阈值的病历版面分区对应的第一病历分区图像确定为待识别分区图像；

将各个待识别分区图像输入预设字体分类模型，得到各个待识别分区图像的文本字体类别，其中，各个待识别分区图像的文本字体类别包括印刷字体类别和手写字体类别；

将文本字体类别属于印刷字体类别的待识别印刷分区图像输入预设印刷体文字识别模型进行识别，得到各个待识别印刷分区图像的印刷字体识别结果；

将文本字体类别属于手写字体类别的待识别分区图像输入预设手写体文字识别模型进行识别，得到各个待识别手写分区图像的手写字体识别结果；

将各个待识别印刷分区图像的印刷字体识别结果、各个待识别手写分区图像的手写字体识别结果添加至预设空白病历模板图像上对应的病历版面分区中。

进一步的，所述将文本字体类别属于印刷字体类别的待识别印刷分区图像输入预设印刷体文字识别模型进行识别，得到各个待识别印刷分区图像的印刷字体识别结果，包括：

获取多个历史病历图像位于所述待识别印刷分区图像所在病历版面分区的历史病历分区图像，其中，各个历史病历分区图像已经被识别且具有对应的历史分区图像识别结果；

计算各个所述历史病历分区图像与对应的所述待识别印刷分区图像的第二图像相似度，得到多个第二图像相似度；

若多个第二图像相似度均小于第二相似度阈值，则将所述待识别印刷分区图像输入预设印刷体文字识别模型进行识别，得到待识别印刷分区图像的印刷字体识别结果。

进一步的，所述纸质病历的内容识别方法，包括：

若多个第二图像相似度存在大于第二相似度阈值的值，将高于第二相似度阈值的第二图像相似度中最大的第二图像相似度对应的所述历史病历分区图像确定为目标历史病历分区图像；

将目标历史病历分区图像的历史分区图像识别结果确定为待识别印刷分区图像的印刷字体识别结果。

进一步的，所述预设印刷体文字识别模型为CRNN+CTC模型，所述预设手写体文字识别模型为TensorFlow模型。

进一步的，所述对所述第一病历图像进行预处理，得到第二病历图像，包括：

对第一病历图像进行二值化、图像降噪、倾斜校正，得到第二病历图像。

获取待识别印刷分区图像对应的病历版面分区的分区类别，其中，所述分区类别包括主诉分区、病史分区、家族史分区、体格检查分区、辅助检查分区；

根据待识别印刷分区图像对应的病历版面分区的分区类别确定待识别印刷分区图像对应的预设印刷体文字识别模型，其中，不同的分区类别对应的不同的预设印刷体文字识别模型，不同的预设印刷体文字识别模型通过对应分区类别的分区类别训练集得到；

将各个待识别印刷分区图像输入对应的预设印刷体文字识别模型，得到各个待识别印刷分区图像的印刷字体识别结果。

进一步的，所述多个病历版面分区包括多个固定印刷文本分区，所述将第一图像相似度低于第一相似度阈值的病历版面分区对应的第一病历分区图像确定为待识别分区图像，包括：

获取多个固定印刷文本分区对应的第一图像相似度和面积大小；

基于多个固定印刷文本分区的面积大小对多个固定印刷文本分区对应的第一图像相似度加权平均，得到加权平均相似度；

若加权平均相似度大于第三相似度阈值，则将第一图像相似度低于第一相似度阈值的病历版面分区对应的第一病历分区图像确定为待识别分区图像。

第二方面，本申请提供一种纸质病历的内容识别装置，所述纸质病历的内容识别装置包括：

第一获取单元，用于获取对纸质病历进行拍摄得到的第一病历图像和所述纸质病历的病历模板类型；

预处理单元，用于对所述第一病历图像进行预处理，得到第二病历图像；

第二获取单元，用于获取所述病历模板类型的预设空白病历模板图像，其中，所述预设空白病历模板图像上预先标注有多个病历版面分区；

图像对齐单元，用于将所述预设空白病历模板图像与所述第二病历图像对齐，获取所述第二病历图像上位于各个所述病历版面分区内的各个第一病历分区图像和所述预设空白病历模板图像上位于所述病历版面分区内的各个第二病历分区图像；

计算单元，用于分别计算各个所述第一病历分区图像和对应的所述第二病历分区图像的第一图像相似度，得到各个病历版面分区对应的第一图像相似度；

确定单元，用于将第一图像相似度低于第一相似度阈值的病历版面分区对应的第一病历分区图像确定为待识别分区图像；

字体分类单元，用于将各个待识别分区图像输入预设字体分类模型，得到各个待识别分区图像的文本字体类别，其中，各个待识别分区图像的文本字体类别包括印刷字体类别和手写字体类别；

第一识别单元，用于将文本字体类别属于印刷字体类别的待识别印刷分区图像输入预设印刷体文字识别模型进行识别，得到各个待识别印刷分区图像的印刷字体识别结果；

第二识别单元，用于将文本字体类别属于手写字体类别的待识别分区图像输入预设手写体文字识别模型进行识别，得到各个待识别手写分区图像的手写字体识别结果；

添加单元，用于将各个待识别印刷分区图像的印刷字体识别结果、各个待识别手写分区图像的手写字体识别结果添加至预设空白病历模板图像上对应的病历版面分区中。

第三方面，本申请提供一种计算机设备，所述计算机设备包括：

一个或多个处理器；

存储器；以及

一个或多个应用程序，其中所述一个或多个应用程序被存储于所述存储器中，并配置为由所述处理器执行以实现第一方面中任一项所述的纸质病历的内容识别方法。

第四方面，本申请提供一种计算机可读存储介质，所述计算机可读存储介质存储有多条指令，所述指令适于处理器进行加载，以执行第一方面中任一项所述的纸质病历的内容识别方法中的步骤。

本申请提供一种纸质病历的内容识别方法及装置，该纸质病历的内容识别方法包括：获取对纸质病历进行拍摄得到的第一病历图像和所述纸质病历的病历模板类型；对所述第一病历图像进行预处理，得到第二病历图像；获取所述病历模板类型的预设空白病历模板图像，其中，所述预设空白病历模板图像上预先标注有多个病历版面分区；将所述预设空白病历模板图像与所述第二病历图像对齐，获取所述第二病历图像上位于各个所述病历版面分区内的各个第一病历分区图像和所述预设空白病历模板图像上位于所述病历版面分区内的各个第二病历分区图像；分别计算各个所述第一病历分区图像和对应的所述第二病历分区图像的第一图像相似度，得到各个病历版面分区对应的第一图像相似度；将第一图像相似度低于第一相似度阈值的病历版面分区对应的第一病历分区图像确定为待识别分区图像；将各个待识别分区图像输入预设字体分类模型，得到各个待识别分区图像的文本字体类别，其中，各个待识别分区图像的文本字体类别包括印刷字体类别和手写字体类别；将文本字体类别属于印刷字体类别的待识别印刷分区图像输入预设印刷体文字识别模型进行识别，得到各个待识别印刷分区图像的印刷字体识别结果；将文本字体类别属于手写字体类别的待识别分区图像输入预设手写体文字识别模型进行识别，得到各个待识别手写分区图像的手写字体识别结果；将各个待识别印刷分区图像的印刷字体识别结果、各个待识别手写分区图像的手写字体识别结果添加至预设空白病历模板图像上对应的病历版面分区中。本申请能够提高纸质病历的内容识别准确率。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的纸质病历的内容识别系统的场景示意图；

图2是本申请实施例提供的纸质病历的内容识别方法一实施例的流程示意图；

图3是本申请实施例中提供的纸质病历的内容识别装置的一个实施例结构示意图；

图4是本申请实施例中提供的计算机设备的一个实施例结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

在本申请的描述中，需要理解的是，术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本申请和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本申请的限制。此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个特征。在本申请的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

在本申请中，“示例性”一词用来表示“用作例子、例证或说明”。本申请中被描述为“示例性”的任何实施例不一定被解释为比其它实施例更优选或更具优势。为了使本领域任何技术人员能够实现和使用本申请，给出了以下描述。在以下描述中，为了解释的目的而列出了细节。应当明白的是，本领域普通技术人员可以认识到，在不使用这些特定细节的情况下也可以实现本申请。在其它实例中，不会对公知的结构和过程进行详细阐述，以避免不必要的细节使本申请的描述变得晦涩。因此，本申请并非旨在限于所示的实施例，而是与符合本申请所公开的原理和特征的最广范围相一致。

本申请实施例提供一种纸质病历的内容识别方法及装置，以下分别进行详细说明。

请参阅图1，图1为本申请实施例所提供的纸质病历的内容识别系统的场景示意图，该纸质病历的内容识别系统可以包括计算机设备100，计算机设备100中集成有纸质病历的内容识别装置。

本申请实施例中，该计算机设备100可以是独立的服务器，也可以是服务器组成的服务器网络或服务器集群，例如，本申请实施例中所描述的计算机设备100，其包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云服务器。其中，云服务器由基于云计算(Cloud Computing)的大量计算机或网络服务器构成。

本申请实施例中，上述的计算机设备100可以是一个通用计算机设备或者是一个专用计算机设备。在具体实现中计算机设备100可以是台式机、便携式电脑、网络服务器、掌上电脑（Personal Digital Assistant，PDA）、移动手机、平板电脑、无线终端设备、通信设备、嵌入式设备等，本实施例不限定计算机设备100的类型。

本领域技术人员可以理解，图1中示出的应用环境，仅仅是本申请方案的一种应用场景，并不构成对本申请方案应用场景的限定，其他的应用环境还可以包括比图1中所示更多或更少的计算机设备，例如图1中仅示出1个计算机设备，可以理解的，该纸质病历的内容识别系统还可以包括一个或多个可处理数据的其他计算机设备，具体此处不作限定。

另外，如图1所示，该纸质病历的内容识别系统还可以包括存储器200，用于存储数据。

需要说明的是，图1所示的纸质病历的内容识别系统的场景示意图仅仅是一个示例，本申请实施例描述的纸质病历的内容识别系统以及场景是为了更加清楚的说明本申请实施例的技术方案，并不构成对于本申请实施例提供的技术方案的限定，本领域普通技术人员可知，随着纸质病历的内容识别系统的演变和新业务场景的出现，本申请实施例提供的技术方案对于类似的技术问题，同样适用。

首先，本申请实施例中提供一种纸质病历的内容识别方法，纸质病历的内容识别方法包括：获取对纸质病历进行拍摄得到的第一病历图像和所述纸质病历的病历模板类型；对所述第一病历图像进行预处理，得到第二病历图像；获取所述病历模板类型的预设空白病历模板图像，其中，所述预设空白病历模板图像上预先标注有多个病历版面分区；将所述预设空白病历模板图像与所述第二病历图像对齐，获取所述第二病历图像上位于各个所述病历版面分区内的各个第一病历分区图像和所述预设空白病历模板图像上位于所述病历版面分区内的各个第二病历分区图像；分别计算各个所述第一病历分区图像和对应的所述第二病历分区图像的第一图像相似度，得到各个病历版面分区对应的第一图像相似度；将第一图像相似度低于第一相似度阈值的病历版面分区对应的第一病历分区图像确定为待识别分区图像；将各个待识别分区图像输入预设字体分类模型，得到各个待识别分区图像的文本字体类别，其中，各个待识别分区图像的文本字体类别包括印刷字体类别和手写字体类别；将文本字体类别属于印刷字体类别的待识别印刷分区图像输入预设印刷体文字识别模型进行识别，得到各个待识别印刷分区图像的印刷字体识别结果；将文本字体类别属于手写字体类别的待识别分区图像输入预设手写体文字识别模型进行识别，得到各个待识别手写分区图像的手写字体识别结果；将各个待识别印刷分区图像的印刷字体识别结果、各个待识别手写分区图像的手写字体识别结果添加至预设空白病历模板图像上对应的病历版面分区中。

如图2所示，图2是本申请实施例中纸质病历的内容识别方法的一个实施例流程示意图，该纸质病历的内容识别方法包括如下步骤S201~S210：

S201、获取对纸质病历进行拍摄得到的第一病历图像和纸质病历的病历模板类型。

本申请实施例中，纸质病历是人工填写或者打印机打印出来的病历，纸质病历的病历模板类型可以包括急诊病历、住院病历等等。

S202、对第一病历图像进行预处理，得到第二病历图像。

具体的，对第一病历图像进行二值化、图像降噪、倾斜校正，得到第二病历图像。

S203、获取病历模板类型的预设空白病历模板图像，其中，预设空白病历模板图像上预先标注有多个病历版面分区。

本申请实施例中，多个病历版面分区包括多个固定印刷文本分区。固定印刷文本分区为预先印刷有印刷字体的区域。例如，固定印刷文本分区中预先印刷有主诉固定印刷分区、病史固定印刷分区等。主诉固定印刷分区中印刷有“主诉”等标题字样。多个病历版面分区包括多个待填写文本分区，多个待填写文本分区的分区类别包括主诉分区、病史分区、家族史分区、体格检查分区、辅助检查分区，用于供工作人员填入对应的具体内容。

S204、将预设空白病历模板图像与第二病历图像对齐，获取第二病历图像上位于各个病历版面分区内的各个第一病历分区图像和预设空白病历模板图像上位于病历版面分区内的各个第二病历分区图像。

S205、分别计算各个第一病历分区图像和对应的第二病历分区图像的第一图像相似度，得到各个病历版面分区对应的第一图像相似度。

病历版面分区对应的第一图像相似度为第一病历分区图像和对应的第二病历分区图像的图像相似度，第一图像相似度可以为PSNR、SSIM等。

进一步的，为了提高第一图像相似度计算的准确性，分别计算各个第一病历分区图像和对应的第二病历分区图像的第一图像相似度，得到各个病历版面分区对应的第一图像相似度之前可以包括：获取各个第一病历分区图像中像素值大于预设像素值的像素点的第一像素点数量和第二病历分区图像中像素值大于预设像素值的像素点的第二像素点数量，计算第一像素点数量和第二像素点数量的数量差与第一像素点数量之间的像素点数量之比，得到各个第一病历分区图像和对应的第二病历分区图像之间的像素点数量之比，即可得到多个第一病历分区图像对应的像素点数量之比，若各个第一病历分区图像对应的像素点数量之比均小于预设比值，说明各个第一病历分区图像和对应的第二病历分区图像确认对齐，则分别计算各个第一病历分区图像和对应的第二病历分区图像的第一图像相似度，得到各个病历版面分区对应的第一图像相似度。可以避免版面没有完全对齐造成的误差。

S206、将第一图像相似度低于第一相似度阈值的病历版面分区对应的第一病历分区图像确定为待识别分区图像。

其中，第一相似度阈值可以根据具体情况设定，例如，第一相似度阈值为95%。第一图像相似度不低于第一相似度阈值，表明第二病历图像位于该分区内的图像与预设空白病历模板图像相同，该分区为未填写的空白分区或者固定印刷文本分区，那么第一图像相似度低于第一相似度阈值，说明该分区填写有内容需要进行识别。

在一个具体的实施例中，将第一图像相似度低于第一相似度阈值的病历版面分区对应的第一病历分区图像确定为待识别分区图像，可以包括：

（1）获取多个固定印刷文本分区对应的第一图像相似度和面积大小。

（2）基于多个固定印刷文本分区的面积大小对多个固定印刷文本分区对应的第一图像相似度加权平均，得到加权平均相似度。

（3）若加权平均相似度大于第三相似度阈值，则将第一图像相似度低于第一相似度阈值的病历版面分区对应的第一病历分区图像确定为待识别分区图像。

由于在固定印刷文本分区内，第二病历图像和预设空白病历模板图像的内容应该是相同的，若加权平均相似度大于第三相似度阈值，说明第二病历图像和预设空白病历模板图像是同一病历模板，可以进行比对，将第一图像相似度低于第一相似度阈值的病历版面分区对应的第一病历分区图像确定为待识别分区图像。

S207、将各个待识别分区图像输入预设字体分类模型，得到各个待识别分区图像的文本字体类别，其中，各个待识别分区图像的文本字体类别包括印刷字体类别和手写字体类别。

本申请实施例中，预设字体分类模型为训练过的支持向量机，支持向量机（Support Vector Machine, SVM）是一类按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），其决策边界是对学习样本求解的最大边距超平面（maximum-margin hyperplane）。SVM使用铰链损失函数（hinge loss）计算经验风险（empirical risk）并在求解系统中加入了正则化项以优化结构风险（structural risk），是一个具有稀疏性和稳健性的分类器。SVM可以通过核方法（kernel method）进行非线性分类，是常见的核学习（kernel learning）方法之一。

人工对分割出来各个病历版面分区的图像进行分类并标注印刷字体类别和手写字体类别，得到数据集，将数据集按8:1:1比例分为训练集、验证集和测试集对预设字体分类模型进行训练验证。

S208、将文本字体类别属于印刷字体类别的待识别印刷分区图像输入预设印刷体文字识别模型进行识别，得到各个待识别印刷分区图像的印刷字体识别结果。

其中，预设印刷体文字识别模型为CRNN+CTC模型。CRNN+CTC模型主要分为三个部分：图像特征提取模块CNN、图像上下文信息提取模型RNN（双向LSTM）、解码模块CTC。图像特征提取模块一般使用主流的卷积网络，如ResNet、MobileNet等。由于文本图像的特殊性，输入数据中存在大量的上下文信息，而卷积神经网络特性使其更关注局部特征，缺乏长依赖的建模能力，因此使用卷积网络很难挖掘到文本之间的上下文关系。为了解决这个问题，CRNN引入双向LSTM（Long Short-Term Memory）可以有效的提取图片中的上下文信息。

在一个具体的实施例中，将文本字体类别属于印刷字体类别的待识别印刷分区图像输入预设印刷体文字识别模型进行识别，得到各个待识别印刷分区图像的印刷字体识别结果，包括：

（1）获取多个历史病历图像位于待识别印刷分区图像所在病历版面分区的历史病历分区图像，其中，各个历史病历分区图像已经被识别且具有对应的历史分区图像识别结果。

（2）计算各个历史病历分区图像与对应的待识别印刷分区图像的图像相似度，得到多个第二图像相似度。

各个历史病历分区图像对应的待识别印刷分区图像为与病历分区图像位于同一病历版面分区中的待识别印刷分区图像。

（3）若多个第二图像相似度均小于第二相似度阈值，则将待识别印刷分区图像输入预设印刷体文字识别模型进行识别，得到待识别印刷分区图像的印刷字体识别结果。

第二相似度阈值可以为95%，根据具体情况设定即可。

若多个第二图像相似度均小于第二相似度阈值，说明无法从历史数据中获取到与之匹配的历史病历分区图像，则将待识别印刷分区图像输入预设印刷体文字识别模型进行识别，得到待识别印刷分区图像的印刷字体识别结果。

进一步的，若多个第二图像相似度存在大于第二相似度阈值的值，将高于第二相似度阈值的第二图像相似度中最大的第二图像相似度对应的历史病历分区图像确定为目标历史病历分区图像；将目标历史病历分区图像的历史分区图像识别结果确定为待识别印刷分区图像的印刷字体识别结果。将相似度最高的目标历史病历分区图像的历史分区图像识别结果确定为待识别印刷分区图像的印刷字体识别结果，可以通过图片匹配的方式快速找到印刷字体识别结果，减小计算量，提高计算速度。

进一步的，将文本字体类别属于印刷字体类别的待识别印刷分区图像输入预设印刷体文字识别模型进行识别，得到各个待识别印刷分区图像的印刷字体识别结果，还包括：

（1）获取待识别印刷分区图像对应的病历版面分区的分区类别，其中，分区类别包括主诉分区、病史分区、家族史分区、体格检查分区、辅助检查分区。

（2）根据待识别印刷分区图像对应的病历版面分区的分区类别确定待识别印刷分区图像对应的预设印刷体文字识别模型，其中，不同的分区类别对应的不同的预设印刷体文字识别模型，不同的预设印刷体文字识别模型通过对应分区类别的分区类别训练集得到。

预先根据不同分区类别的分区类别训练集对不同的预设印刷体文字识别模型进行训练。由于各个分区内的文字语义不同，训练不同的预设印刷体文字识别模型，可以提高识别准确度。

（3）将各个待识别印刷分区图像输入对应的预设印刷体文字识别模型，得到各个待识别印刷分区图像的印刷字体识别结果。

S209、将文本字体类别属于手写字体类别的待识别分区图像输入预设手写体文字识别模型进行识别，得到各个待识别手写分区图像的手写字体识别结果。

其中，预设手写体文字识别模型为Transformer模型。预设手写体文字识别模型可以为基于TensorFlow的DCNN模型。利用TensorFlow搭建模型，验证模型能力，评价指标包括拒识率、误识率、识别速度等。

S210、将各个待识别印刷分区图像的印刷字体识别结果、各个待识别手写分区图像的手写字体识别结果添加至预设空白病历模板图像上对应的病历版面分区中。

将识别结果填充至预设空白病历模板图像上对应的病历版面分区中，即可得到识别后的病历信息，从而完成对纸质病历的识别。

为了更好实施本申请实施例中纸质病历的内容识别方法，在纸质病历的内容识别方法基础之上，本申请实施例中还提供一种纸质病历的内容识别装置，如图3所示，纸质病历的内容识别装置300包括：

第一获取单元301，用于获取对纸质病历进行拍摄得到的第一病历图像和所述纸质病历的病历模板类型；

预处理单元302，用于对所述第一病历图像进行预处理，得到第二病历图像；

第二获取单元303，用于获取所述病历模板类型的预设空白病历模板图像，其中，所述预设空白病历模板图像上预先标注有多个病历版面分区；

图像对齐单元304，用于将所述预设空白病历模板图像与所述第二病历图像对齐，获取所述第二病历图像上位于各个所述病历版面分区内的各个第一病历分区图像和所述预设空白病历模板图像上位于所述病历版面分区内的各个第二病历分区图像；

计算单元305，用于分别计算各个所述第一病历分区图像和对应的所述第二病历分区图像的第一图像相似度，得到各个病历版面分区对应的第一图像相似度；

确定单元306，用于将第一图像相似度低于第一相似度阈值的病历版面分区对应的第一病历分区图像确定为待识别分区图像；

字体分类单元307，用于将各个待识别分区图像输入预设字体分类模型，得到各个待识别分区图像的文本字体类别，其中，各个待识别分区图像的文本字体类别包括印刷字体类别和手写字体类别；

第一识别单元308，用于将文本字体类别属于印刷字体类别的待识别印刷分区图像输入预设印刷体文字识别模型进行识别，得到各个待识别印刷分区图像的印刷字体识别结果；

第二识别单元309，用于将文本字体类别属于手写字体类别的待识别分区图像输入预设手写体文字识别模型进行识别，得到各个待识别手写分区图像的手写字体识别结果；

添加单元310，用于将各个待识别印刷分区图像的印刷字体识别结果、各个待识别手写分区图像的手写字体识别结果添加至预设空白病历模板图像上对应的病历版面分区中。

本申请实施例还提供一种计算机设备，其集成了本申请实施例所提供的任一种纸质病历的内容识别装置，计算机设备包括：

一个或多个处理器；

存储器；以及

一个或多个应用程序，其中一个或多个应用程序被存储于存储器中，并配置为由处理器执行上述纸质病历的内容识别方法实施例中任一实施例中的纸质病历的内容识别方法中的步骤。

如图4所示，其示出了本申请实施例所涉及的计算机设备的结构示意图，具体来讲：

该计算机设备可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解，图中示出的计算机设备结构并不构成对计算机设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：

处理器401是该计算机设备的控制中心，利用各种接口和线路连接整个计算机设备的各个部分，通过运行或执行存储在存储器402内的软件程序和/或模块，以及调用存储在存储器402内的数据，执行计算机设备的各种功能和处理数据，从而对计算机设备进行整体监控。可选的，处理器401可包括一个或多个处理核心；处理器401可以是中央处理单元（Central Processing Unit，CPU），还可以是其他通用处理器、数字信号处理器（DigitalSignal Processor，DSP）、专用集成电路（Application Specific Integrated Circuit，ASIC）、现成可编程门阵列（Field-Programmable Gate Array，FPGA）或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等，优选的，处理器401可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器401中。

存储器402可用于存储软件程序以及模块，处理器401通过运行存储在存储器402的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序（比如声音播放功能、图像播放功能等）等；存储数据区可存储根据计算机设备的使用所创建的数据等。此外，存储器402可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器402还可以包括存储器控制器，以提供处理器401对存储器402的访问。

计算机设备还包括给各个部件供电的电源403，优选的，电源403可以通过电源管理系统与处理器401逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

该计算机设备还可包括输入单元404，该输入单元404可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

尽管未示出，计算机设备还可以包括显示单元等，在此不再赘述。具体在本实施例中，计算机设备中的处理器401会按照如下的指令，将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中，并由处理器401来运行存储在存储器402中的应用程序，从而实现各种功能，如下：

获取对纸质病历进行拍摄得到的第一病历图像和所述纸质病历的病历模板类型；对所述第一病历图像进行预处理，得到第二病历图像；获取所述病历模板类型的预设空白病历模板图像，其中，所述预设空白病历模板图像上预先标注有多个病历版面分区；将所述预设空白病历模板图像与所述第二病历图像对齐，获取所述第二病历图像上位于各个所述病历版面分区内的各个第一病历分区图像和所述预设空白病历模板图像上位于所述病历版面分区内的各个第二病历分区图像；分别计算各个所述第一病历分区图像和对应的所述第二病历分区图像的第一图像相似度，得到各个病历版面分区对应的第一图像相似度；将第一图像相似度低于第一相似度阈值的病历版面分区对应的第一病历分区图像确定为待识别分区图像；将各个待识别分区图像输入预设字体分类模型，得到各个待识别分区图像的文本字体类别，其中，各个待识别分区图像的文本字体类别包括印刷字体类别和手写字体类别；将文本字体类别属于印刷字体类别的待识别印刷分区图像输入预设印刷体文字识别模型进行识别，得到各个待识别印刷分区图像的印刷字体识别结果；将文本字体类别属于手写字体类别的待识别分区图像输入预设手写体文字识别模型进行识别，得到各个待识别手写分区图像的手写字体识别结果；将各个待识别印刷分区图像的印刷字体识别结果、各个待识别手写分区图像的手写字体识别结果添加至预设空白病历模板图像上对应的病历版面分区中。

本领域普通技术人员可以理解，上述实施例的各种方法中的全部或部分步骤可以通过指令来完成，或通过指令控制相关的硬件来完成，该指令可以存储于一计算机可读存储介质中，并由处理器进行加载和执行。

为此，本申请实施例提供一种计算机可读存储介质，该存储介质可以包括：只读存储器（ROM，Read Only Memory）、随机存取记忆体（RAM，Random Access Memory）、磁盘或光盘等。其上存储有计算机程序，计算机程序被处理器进行加载，以执行本申请实施例所提供的任一种纸质病历的内容识别方法中的步骤。例如，计算机程序被处理器进行加载可以执行如下步骤：

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见上文针对其他实施例的详细描述，此处不再赘述。

具体实施时，以上各个单元或结构可以作为独立的实体来实现，也可以进行任意组合，作为同一或若干个实体来实现，以上各个单元或结构的具体实施可参见前面的方法实施例，在此不再赘述。

以上各个操作的具体实施可参见前面的实施例，在此不再赘述。

以上对本申请实施例所提供的一种纸质病历的内容识别方法及装置进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上，本说明书内容不应理解为对本申请的限制。

Claims

1.一种纸质病历的内容识别方法，其特征在于，所述纸质病历的内容识别方法包括：

对所述第一病历图像进行预处理，得到第二病历图像；

2.根据权利要求1所述的纸质病历的内容识别方法，其特征在于，所述将文本字体类别属于印刷字体类别的待识别印刷分区图像输入预设印刷体文字识别模型进行识别，得到各个待识别印刷分区图像的印刷字体识别结果，包括：

3.根据权利要求2所述的纸质病历的内容识别方法，其特征在于，所述纸质病历的内容识别方法，包括：

4.根据权利要求1所述的纸质病历的内容识别方法，其特征在于，所述预设印刷体文字识别模型为CRNN+CTC模型，所述预设手写体文字识别模型为TensorFlow模型。

5.根据权利要求1所述的纸质病历的内容识别方法，其特征在于，所述对所述第一病历图像进行预处理，得到第二病历图像，包括：

6.根据权利要求1所述的纸质病历的内容识别方法，其特征在于，所述将文本字体类别属于印刷字体类别的待识别印刷分区图像输入预设印刷体文字识别模型进行识别，得到各个待识别印刷分区图像的印刷字体识别结果，包括：

7.根据权利要求1所述的纸质病历的内容识别方法，其特征在于，所述多个病历版面分区包括多个固定印刷文本分区，所述将第一图像相似度低于第一相似度阈值的病历版面分区对应的第一病历分区图像确定为待识别分区图像，包括：

8.一种纸质病历的内容识别装置，其特征在于，所述纸质病历的内容识别装置包括：

9.一种计算机设备，其特征在于，所述计算机设备包括：

一个或多个处理器；

存储器；以及

一个或多个应用程序，其中所述一个或多个应用程序被存储于所述存储器中，并配置为由所述处理器执行以实现权利要求1至7中任一项所述的纸质病历的内容识别方法。

10.一种计算机可读存储介质，其特征在于，其上存储有计算机程序，所述计算机程序被处理器进行加载，以执行权利要求1至7任一项所述的纸质病历的内容识别方法中的步骤。