CN112308062B

CN112308062B - 一种复杂背景图像中的医疗影像访问号识别方法

Info

Publication number: CN112308062B
Application number: CN202011324359.6A
Authority: CN
Inventors: 林铭强; 陈集房; 麻元兴
Original assignee: Zhejiang Keyi Intelligent Medical Technology Co ltd
Current assignee: Zhejiang Keyi Intelligent Medical Technology Co ltd
Priority date: 2020-11-23
Filing date: 2020-11-23
Publication date: 2022-08-23
Anticipated expiration: 2040-11-23
Also published as: CN112308062A

Abstract

本发明公开了一种复杂背景图像中的医疗影像访问号识别方法，涉及医疗影像识别技术领域；该方法基于深度学习的目标检测技术构建目标检测模型，采用目标检测模型定位访问号的位置；采用构建的字体标签模板和特征模板，将定位的访问号位置的区域截图与特征模板相乘过滤掉复杂背景，然后与标签模板与对应字体的模板依次比对，确定访问号类型从而快速获取访问号的内容识别出医疗影像类型。

Description

一种复杂背景图像中的医疗影像访问号识别方法

技术领域

本发明涉及医疗影像识别技术领域，尤其涉及一种复杂背景图像中的医疗影像访问号识别方法。

背景技术

访问号是用于区别医疗影像所属检查序列，对应病患信息的识别符，是医疗系统中传递影像信息时绑定的区别标签。

在实际工作环境中由于影像设备与电子系统的兼容性等原因，许多时候存在访问号无法直接从影像设备中获取的情况，只能通过OCR识别技术直接从图像上识别出访问号，访问号的正确识别关系着影像数据的正确匹配与归档，意义重大。

目前的医疗影像大多采用常规OCR识别技术，通常使用深度学习技术完成对访问号的识别，但是许多情况下，访问号会与医疗影像背景重叠，导致难以区分，一般的深度学习模型很难正确识别。

现在常用方法具体过程为：将医疗影像文件传入目标检测模型，检测出访问号所在位置，再由分类模型识别出访问号的具体内容。但上述方法主要存在以下问题：

访问号和医疗影像背景重叠时，由于背景十分复杂，导致一般模型很难正确识别访问号，错误率较高。

现有基于深度学习技术的访问号识别争取率并不能达到100％，可能会造成影像文件和病患信息的错误匹配，后果严重，为了避免上述错误出现，需要找到一种能够在复杂背景图像中准确识别医疗影像访问号的方法。

发明内容

本发明的目的在于提供一种复杂背景图像中的医疗影像访问号识别方法，从而解决现有技术中存在的前述问题。

为了实现上述目的，本发明采用的技术方案如下：

一种复杂背景图像中的医疗影像访问号识别方法，包括以下步骤：

S1,建立访问号字体模板：针对不同设备的医疗影像访问号字体构建字体模板；

S2,基于卷积神经网络深度学习构建目标检测模型：选择训练数据，以常规单通道图像文件作为输入内容，以访问号位置信息和访问号所使用的字体类别作为输出结果，采用神经网络深度学习过程构建目标检测模型；

S3，采用构建的目标检测模型进行访问号位置确定：首先对访问号的位置进行检测，然后截取出访问号字体所在位置区域；

S4，采用字体模板进行访问号识别：将步骤S3中截取出的访问号字体所在位置区域提取与字体模板相对应的二维矩阵，然后将所述二维矩阵进行字体模板和标签模板的对比，直到识别出所有访问号字体。

优选地，步骤S1之前还包括步骤S0：医疗影像的预处理：原始数据为常规单通道图像，对于原始数据像素值除以255进行归一化。

优选地，步骤S1中所述字体模板包括特征模块与标签模块，所述标签模板是该字体在黑色背景中的像素显示模板；所述特征模板是该字体在白色背景中的像素显示，同时与标签模板的像素显示相加得到的即是特征模板。

优选地，步骤S2中具体包括：

S21,以能够确定访问号的医疗影像为训练数据集，将训练数据集中的医疗影像的访问号位置信息和访问号的字体类别作为训练输入数据，同时将访问号前的标签共同标记也输入神经网络训练模型中；

S22，神经网络训练模型通过76层的卷积与池化，采用yolo-v3得到三种不同尺寸的目标位置预测结果，每个尺寸的预测结果都对应21个通道；

S23，然后通过比较每个预测结果中的位置信息和真实位置的差距，寻找最佳匹配的预测结果作为输出。

优选地，步骤S22中三种不同尺寸的目标位置预测结果具体为13x13,26x26,52x52；

21个通道包括3个图片通道数+4个预测框的坐标通道+1个置信度通道+2个类别数通道。

优选地，步骤S3具体包括：

S31，首先采用已构建的目标检测模型中的yolo-v3用于访问号的位置检测，输入数据为待识别访问号的常规单通道图像数据，通过76层的卷积与池化，通过darknet网络得到三种不同尺度的预测结果，然后检测出访问号在图像中所在的位置并识别访问号所使用的字体类别；

S32,截取目标检测模型框选出的区域图像，从左上角开始，遍历每个像素点，以当前像素点为左上角顶点，截取与字体特征模板相应大小的二维矩阵。

优选地，步骤S4中具体包括：

S41，将该二维矩阵与该字体类别的每个特征模板依次进行点乘得到过滤复杂背景后的访问号字体；

S42,将得到的过滤复杂背景后的访问号字体结果依次与该类别字体的所有标签模板进行比对，如果完全相同，则判定为当前标签模板对应数字，确认识别号的具体数字。

优选地，所述步骤S42中，当检测出第一个识别号数字时跳出该循环重复步骤S41-S42。

本发明的有益效果是：

本发明公开了一种复杂背景图像中的医疗影像访问号识别方法，该方法基于深度学习的目标检测技术定位访问号的位置，采用构建的字体标签模板和特征模板，将定位的访问号位置的区域截图与特征模板相乘过滤掉复杂背景，然后与标签模板与对应字体的模板依次比对，确定访问号类型从而快速获取访问号的内容识别出医疗影像类型。

附图说明

图1是实施例1提供的复杂背景图像中的医疗影像访问号识别方法流程图；

图2是实施例1中采用yolo-v3进行位置检测的原理图；

图3是实施例1中使用的字体特征模板示意图；

图4是实施例1中使用的字体标签模板示意图；

图5是实施例1中需要识别的原图访问号区域截图；

图6是图5经过和对应的特征模板相乘后得到的过滤复杂背景后的区域截图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施方式仅仅用以解释本发明，并不用于限定本发明。

实施例1

本实施例提供了一种复杂背景中的医疗影像访问号识别方法，如图1所示，包括以下步骤：

步骤S0：医疗影像的预处理：原始数据为常规单通道图像，将原始数据像素值除以255进行归一化处理。

S4，采用字体模板进行访问号识别：将步骤S3中截取出的访问号字体所在位置区域提取与字体模板相对应的二维矩阵，然后将所述二维矩阵与字体模板进行对比，直到识别出所有访问号。

本实施例中步骤S1中所述字体模板包括特征模块与标签模块，所述标签模板是该字体在黑色背景中的像素显示模板，如图4所示；所述特征模板是该字体在白色背景中的像素显示，同时与标签模板的像素显示相加得到的即是特征模板，如图3所示。

本实施例中步骤S2中具体包括：

本实施例中步骤S22中三种不同尺寸的目标位置预测结果具体为13x13,26x26,52x52；

本实施例中具体的卷积池化过程包括以下内容：

第1层，卷积层，使用一个3x3的卷积核，步长为1，对图像数据进行卷积操作，得到尺寸为416x416通道数为32的图像数据；

第2层，卷积层，使用一个3x3的卷积核对数据进行最大池化操作，步长为2，通道数为64，这一层主要为了提取图像特征图，输出图像尺寸变为208x208；

第3层，卷积层，使用一个1x1的卷积核，步长为1，对上一层的数据进行卷积操作，之后的到与原数据纬度相同的32通道特征图；

第4层，卷积层，使用一个3x3的卷积核，步长为1，对上一层的数据进行卷积操作，之后的到与原数据纬度相同的64通道特征图；

第5层，卷积层，使用一个3x3的卷积核，步长为2，对上一层的数据进行卷积操作，之后得到尺寸为104x104的128通道特征图；

第6层，卷积层，使用一个1x1的卷积核对数据进行最大池化操作，步长为1，通道数为64不变，之后得到一个图像尺寸不变的64通道特征图；

第7层，卷积层，使用一个3x3的卷积核，步长为1，对上一层的数据进行卷积操作，之后的到与原数据纬度相同的128通道特征图；

第8层-第9层，重复第6层和第7层的操作，左右的到一个图像尺寸为104x104的128通道特征图；

第10层，卷积层，使用一个3x3的卷积核对数据进行最大池化操作，步长为2，通道数为256，之后的到一个尺寸为52x52的256通道特征图；

第11层，卷积层，使用一个1x1的卷积核，步长为1，通道数为128，对上一层的数据进行卷积操作，之后的到与原数据纬度相同的128通道特征图；

第12层，卷积层，使用一个3x3的卷积核，步长为1，对上一层的数据进行卷积操作，之后的到与原数据纬度相同的256通道特征图；

第13层-第26层，将第11层和第12层的操作重复7次，之后的到一个尺寸为52x52的256通道特征图；

第27层，卷积层，使用一个3x3的卷积核对数据进行最大池化操作，步长为2，通道数为512，之后的到一个尺寸为26x26的512通道特征图；

第28层，卷积层，使用一个1x1的卷积核，步长为1，通道数为256，对上一层的数据进行卷积操作，之后得到一个尺寸为26x26的256通道特征图；

第29层，卷积层，使用一个3x3的卷积核，步长为1，通道数为512，对上一层的数据进行卷积操作，之后得到一个尺寸为26x26的512通道特征图；

第30层-第43层，卷积层，重复第28层和29层的操作7次，之后的到一个尺寸为26x26的512通道特征图；

第44层，卷积层，使用一个3x3的卷积核，步长为2，通道数为1024，对上一层的数据进行卷积操作，之后得到一个尺寸为13x13的1024通道特征图；

第45层，卷积层，使用一个1x1的卷积核，步长为1，通道数为512，对上一层的数据进行卷积操作，之后得到一个尺寸为13x13的512通道特征图；

第46层，卷积层，使用一个3x3的卷积核，步长为1，通道数为1024，对上一层的数据进行卷积操作，之后得到一个尺寸为13x13的1024通道特征图；

第47层-第52层，卷积层，重复第45层和46层的操作3次，之后的到一个尺寸为13x13的1024通道特征图；

第53层，卷积层，使用一个1x1的卷积核，步长为1，通道数为512，对上一层的数据进行卷积操作，之后得到一个尺寸为13x13的512通道特征图；

第54层，卷积层，使用一个3x3的卷积核，步长为1，通道数为1024，对上一层的数据进行卷积操作，之后得到一个尺寸为13x13的1024通道特征图；

第55层，卷积层，使用一个1x1的卷积核，步长为1，通道数为512，对上一层的数据进行卷积操作，之后得到一个尺寸为13x13的512通道特征图；

第56层，卷积层，使用一个3x3的卷积核，步长为1，通道数为1024，对上一层的数据进行卷积操作，之后得到一个尺寸为13x13的1024通道特征图；

第57层，卷积层，使用一个1x1的卷积核，步长为1，通道数为512，对上一层的数据进行卷积操作，之后得到一个尺寸为13x13的512通道特征图；

第58层，卷积层，使用一个3x3的卷积核，步长为1，通道数为1024，对上一层的数据进行卷积操作，之后得到一个尺寸为13x13的1024通道特征图；

第59层，卷积层，使用一个1x1的卷积核，步长为1，通道数为21，对上一层的数据进行卷积操作，之后得到一个尺寸为13x13的21通道特征图；

第60层，卷积层，使用一个1x1的卷积核，步长为1，通道数为256，对第58层的数据进行卷积操作，之后得到一个尺寸为13x13的256通道特征图；

第61层，上采样，扩充特征图，之后得到一个尺寸为26x26的256通道特征图，将得到的新特征图与第43层的特征图进行拼接，得到一个尺寸为26x26x768的特征图；

第62层～第66层，重复53层到57层的操作，之后得到一个尺寸为26x26的256通道特征图；

第67层，卷积层，使用一个3x3的卷积核，步长为1，通道数为512，对上一层的数据进行卷积操作，之后得到一个尺寸为26x26的256通道特征图；

第68层，卷积层，使用一个1x1的卷积核，步长为1，通道数为21，对上一层的数据进行卷积操作，之后得到一个尺寸为26x26的21通道特征图；

第69层，卷积层，使用一个1x1的卷积核，步长为1，通道数为128，对第66层的数据进行卷积操作，之后得到一个尺寸为26x26的128通道特征图；

第70层，上采样，扩充特征图，之后得到一个尺寸为52x52的128通道特征图，将得到的新特征图与第13层的特征图进行拼接，得到一个尺寸为52x52x384的特征图；

第71层～第74层，重复62层到66层的操作，之后得到一个尺寸为52x52的128通道特征图，输出52*52的特征图；

第75层，卷积层，使用一个3x3的卷积核，步长为1，通道数为256，对上一层的数据进行卷积操作，之后得到一个尺寸为52x52的256通道特征图；

第76层，卷积层，使用一个1x1的卷积核，步长为1，通道数为21，对第74层的数据进行卷积操作，之后得到一个尺寸为52x52的21通道特征图。

本实施例中的步骤S3具体包括：

S32,截取目标检测模型框选出的区域图像，如图5所示，从左上角开始，遍历每个像素点，以当前像素点为左上角顶点，截取与字体特征模板相应大小的二维矩阵。

本实施例中步骤S4中具体包括：

S41，将该二维矩阵与该字体类别的每个特征模板依次进行点乘，从而得到过滤复杂背景后的访问号字体，如图6所示；

S42,将得到的过滤复杂背景后的访问号字体结果依次与该类别字体的所有标签模板进行比对，如果完全相同，则判定为当前标签模板对应数字，确认识别号的具体数字；当检测出第一个识别号数字时跳出该循环重复步骤S41-S42。

值得注意到的是，图5是原图中截取的访问号区域图像，由于图像背景较为复杂，一般的字体识别方法很难正确识别。因此需要过滤复杂背景。具体方式为：图6a为从图5截取的最后一位数字，将该数字区域可以看成是一个7*4的矩阵，经过二值化处理后，白色部分值为1，黑色部分值为0；图6b为数字8的特征模板，把这两个矩阵各元素相乘，可以得到图6c的最终结果，由此背景单一化，相当于是把背景过滤掉了。

通过采用本发明公开的上述技术方案，得到了如下有益的效果：

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视本发明的保护范围。

Claims

1.一种复杂背景图像中的医疗影像访问号识别方法，其特征在于，包括以下步骤：

S3，采用构建的目标检测模型确定访问号位置：首先对访问号的位置进行检测，然后截取出访问号字体所在位置区域；

S4，采用字体模板进行访问号识别：将步骤S3中截取出的访问号字体所在位置区域提取与字体模板相对应的二维矩阵，然后将所述二维矩阵进行字体模板和标签模板的对比，直到识别出所有访问号字体；

步骤S1中所述字体模板包括特征模板与标签模板，所述标签模板是该字体在黑色背景中的像素显示模板；所述特征模板是该字体在白色背景中的像素显示，同时与标签模板的像素显示相加得到的即是特征模板；

步骤S3具体包括：

S32,截取目标检测模型框选出的区域图像，从左上角开始，遍历每个像素点，以当前像素点为左上角顶点，截取与字体特征模板相应大小的二维矩阵；

步骤S4中具体包括：

2.根据权利要求1所述的复杂背景图像中的医疗影像访问号识别方法，其特征在于，步骤S1之前还包括步骤S0：医疗影像的预处理：原始数据为常规单通道图像，对于原始数据像素值除以255进行归一化。

3.根据权利要求1所述的复杂背景图像中的医疗影像访问号识别方法，其特征在于，步骤S2中具体包括：

4.根据权利要求3所述的复杂背景图像中的医疗影像访问号识别方法，其特征在于，步骤S22中三种不同尺寸的目标位置预测结果具体为13x13,26x26,52x52；

5.根据权利要求1所述的复杂背景图像中的医疗影像访问号识别方法，其特征在于，所述步骤S42中，当检测出第一个识别号数字时重复步骤S41-S42。