CN112308062B - 一种复杂背景图像中的医疗影像访问号识别方法 - Google Patents

一种复杂背景图像中的医疗影像访问号识别方法 Download PDF

Info

Publication number
CN112308062B
CN112308062B CN202011324359.6A CN202011324359A CN112308062B CN 112308062 B CN112308062 B CN 112308062B CN 202011324359 A CN202011324359 A CN 202011324359A CN 112308062 B CN112308062 B CN 112308062B
Authority
CN
China
Prior art keywords
access number
font
template
image
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011324359.6A
Other languages
English (en)
Other versions
CN112308062A (zh
Inventor
林铭强
陈集房
麻元兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Keyi Intelligent Medical Technology Co ltd
Original Assignee
Zhejiang Keyi Intelligent Medical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Keyi Intelligent Medical Technology Co ltd filed Critical Zhejiang Keyi Intelligent Medical Technology Co ltd
Priority to CN202011324359.6A priority Critical patent/CN112308062B/zh
Publication of CN112308062A publication Critical patent/CN112308062A/zh
Application granted granted Critical
Publication of CN112308062B publication Critical patent/CN112308062B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/20ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Epidemiology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Image Analysis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种复杂背景图像中的医疗影像访问号识别方法,涉及医疗影像识别技术领域;该方法基于深度学习的目标检测技术构建目标检测模型,采用目标检测模型定位访问号的位置;采用构建的字体标签模板和特征模板,将定位的访问号位置的区域截图与特征模板相乘过滤掉复杂背景,然后与标签模板与对应字体的模板依次比对,确定访问号类型从而快速获取访问号的内容识别出医疗影像类型。

Description

一种复杂背景图像中的医疗影像访问号识别方法
技术领域
本发明涉及医疗影像识别技术领域,尤其涉及一种复杂背景图像中的医疗影像访问号识别方法。
背景技术
访问号是用于区别医疗影像所属检查序列,对应病患信息的识别符,是医疗系统中传递影像信息时绑定的区别标签。
在实际工作环境中由于影像设备与电子系统的兼容性等原因,许多时候存在访问号无法直接从影像设备中获取的情况,只能通过OCR识别技术直接从图像上识别出访问号,访问号的正确识别关系着影像数据的正确匹配与归档,意义重大。
目前的医疗影像大多采用常规OCR识别技术,通常使用深度学习技术完成对访问号的识别,但是许多情况下,访问号会与医疗影像背景重叠,导致难以区分,一般的深度学习模型很难正确识别。
现在常用方法具体过程为:将医疗影像文件传入目标检测模型,检测出访问号所在位置,再由分类模型识别出访问号的具体内容。但上述方法主要存在以下问题:
访问号和医疗影像背景重叠时,由于背景十分复杂,导致一般模型很难正确识别访问号,错误率较高。
现有基于深度学习技术的访问号识别争取率并不能达到100%,可能会造成影像文件和病患信息的错误匹配,后果严重,为了避免上述错误出现,需要找到一种能够在复杂背景图像中准确识别医疗影像访问号的方法。
发明内容
本发明的目的在于提供一种复杂背景图像中的医疗影像访问号识别方法,从而解决现有技术中存在的前述问题。
为了实现上述目的,本发明采用的技术方案如下:
一种复杂背景图像中的医疗影像访问号识别方法,包括以下步骤:
S1,建立访问号字体模板:针对不同设备的医疗影像访问号字体构建字体模板;
S2,基于卷积神经网络深度学习构建目标检测模型:选择训练数据,以常规单通道图像文件作为输入内容,以访问号位置信息和访问号所使用的字体类别作为输出结果,采用神经网络深度学习过程构建目标检测模型;
S3,采用构建的目标检测模型进行访问号位置确定:首先对访问号的位置进行检测,然后截取出访问号字体所在位置区域;
S4,采用字体模板进行访问号识别:将步骤S3中截取出的访问号字体所在位置区域提取与字体模板相对应的二维矩阵,然后将所述二维矩阵进行字体模板和标签模板的对比,直到识别出所有访问号字体。
优选地,步骤S1之前还包括步骤S0:医疗影像的预处理:原始数据为常规单通道图像,对于原始数据像素值除以255进行归一化。
优选地,步骤S1中所述字体模板包括特征模块与标签模块,所述标签模板是该字体在黑色背景中的像素显示模板;所述特征模板是该字体在白色背景中的像素显示,同时与标签模板的像素显示相加得到的即是特征模板。
优选地,步骤S2中具体包括:
S21,以能够确定访问号的医疗影像为训练数据集,将训练数据集中的医疗影像的访问号位置信息和访问号的字体类别作为训练输入数据,同时将访问号前的标签共同标记也输入神经网络训练模型中;
S22,神经网络训练模型通过76层的卷积与池化,采用yolo-v3得到三种不同尺寸的目标位置预测结果,每个尺寸的预测结果都对应21个通道;
S23,然后通过比较每个预测结果中的位置信息和真实位置的差距,寻找最佳匹配的预测结果作为输出。
优选地,步骤S22中三种不同尺寸的目标位置预测结果具体为13x13,26x26,52x52;
21个通道包括3个图片通道数+4个预测框的坐标通道+1个置信度通道+2个类别数通道。
优选地,步骤S3具体包括:
S31,首先采用已构建的目标检测模型中的yolo-v3用于访问号的位置检测,输入数据为待识别访问号的常规单通道图像数据,通过76层的卷积与池化,通过darknet网络得到三种不同尺度的预测结果,然后检测出访问号在图像中所在的位置并识别访问号所使用的字体类别;
S32,截取目标检测模型框选出的区域图像,从左上角开始,遍历每个像素点,以当前像素点为左上角顶点,截取与字体特征模板相应大小的二维矩阵。
优选地,步骤S4中具体包括:
S41,将该二维矩阵与该字体类别的每个特征模板依次进行点乘得到过滤复杂背景后的访问号字体;
S42,将得到的过滤复杂背景后的访问号字体结果依次与该类别字体的所有标签模板进行比对,如果完全相同,则判定为当前标签模板对应数字,确认识别号的具体数字。
优选地,所述步骤S42中,当检测出第一个识别号数字时跳出该循环重复步骤S41-S42。
本发明的有益效果是:
本发明公开了一种复杂背景图像中的医疗影像访问号识别方法,该方法基于深度学习的目标检测技术定位访问号的位置,采用构建的字体标签模板和特征模板,将定位的访问号位置的区域截图与特征模板相乘过滤掉复杂背景,然后与标签模板与对应字体的模板依次比对,确定访问号类型从而快速获取访问号的内容识别出医疗影像类型。
附图说明
图1是实施例1提供的复杂背景图像中的医疗影像访问号识别方法流程图;
图2是实施例1中采用yolo-v3进行位置检测的原理图;
图3是实施例1中使用的字体特征模板示意图;
图4是实施例1中使用的字体标签模板示意图;
图5是实施例1中需要识别的原图访问号区域截图;
图6是图5经过和对应的特征模板相乘后得到的过滤复杂背景后的区域截图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不用于限定本发明。
实施例1
本实施例提供了一种复杂背景中的医疗影像访问号识别方法,如图1所示,包括以下步骤:
步骤S0:医疗影像的预处理:原始数据为常规单通道图像,将原始数据像素值除以255进行归一化处理。
S1,建立访问号字体模板:针对不同设备的医疗影像访问号字体构建字体模板;
S2,基于卷积神经网络深度学习构建目标检测模型:选择训练数据,以常规单通道图像文件作为输入内容,以访问号位置信息和访问号所使用的字体类别作为输出结果,采用神经网络深度学习过程构建目标检测模型;
S3,采用构建的目标检测模型进行访问号位置确定:首先对访问号的位置进行检测,然后截取出访问号字体所在位置区域;
S4,采用字体模板进行访问号识别:将步骤S3中截取出的访问号字体所在位置区域提取与字体模板相对应的二维矩阵,然后将所述二维矩阵与字体模板进行对比,直到识别出所有访问号。
本实施例中步骤S1中所述字体模板包括特征模块与标签模块,所述标签模板是该字体在黑色背景中的像素显示模板,如图4所示;所述特征模板是该字体在白色背景中的像素显示,同时与标签模板的像素显示相加得到的即是特征模板,如图3所示。
本实施例中步骤S2中具体包括:
S21,以能够确定访问号的医疗影像为训练数据集,将训练数据集中的医疗影像的访问号位置信息和访问号的字体类别作为训练输入数据,同时将访问号前的标签共同标记也输入神经网络训练模型中;
S22,神经网络训练模型通过76层的卷积与池化,采用yolo-v3得到三种不同尺寸的目标位置预测结果,每个尺寸的预测结果都对应21个通道;
S23,然后通过比较每个预测结果中的位置信息和真实位置的差距,寻找最佳匹配的预测结果作为输出。
本实施例中步骤S22中三种不同尺寸的目标位置预测结果具体为13x13,26x26,52x52;
21个通道包括3个图片通道数+4个预测框的坐标通道+1个置信度通道+2个类别数通道。
本实施例中具体的卷积池化过程包括以下内容:
第1层,卷积层,使用一个3x3的卷积核,步长为1,对图像数据进行卷积操作,得到尺寸为416x416通道数为32的图像数据;
第2层,卷积层,使用一个3x3的卷积核对数据进行最大池化操作,步长为2,通道数为64,这一层主要为了提取图像特征图,输出图像尺寸变为208x208;
第3层,卷积层,使用一个1x1的卷积核,步长为1,对上一层的数据进行卷积操作,之后的到与原数据纬度相同的32通道特征图;
第4层,卷积层,使用一个3x3的卷积核,步长为1,对上一层的数据进行卷积操作,之后的到与原数据纬度相同的64通道特征图;
第5层,卷积层,使用一个3x3的卷积核,步长为2,对上一层的数据进行卷积操作,之后得到尺寸为104x104的128通道特征图;
第6层,卷积层,使用一个1x1的卷积核对数据进行最大池化操作,步长为1,通道数为64不变,之后得到一个图像尺寸不变的64通道特征图;
第7层,卷积层,使用一个3x3的卷积核,步长为1,对上一层的数据进行卷积操作,之后的到与原数据纬度相同的128通道特征图;
第8层-第9层,重复第6层和第7层的操作,左右的到一个图像尺寸为104x104的128通道特征图;
第10层,卷积层,使用一个3x3的卷积核对数据进行最大池化操作,步长为2,通道数为256,之后的到一个尺寸为52x52的256通道特征图;
第11层,卷积层,使用一个1x1的卷积核,步长为1,通道数为128,对上一层的数据进行卷积操作,之后的到与原数据纬度相同的128通道特征图;
第12层,卷积层,使用一个3x3的卷积核,步长为1,对上一层的数据进行卷积操作,之后的到与原数据纬度相同的256通道特征图;
第13层-第26层,将第11层和第12层的操作重复7次,之后的到一个尺寸为52x52的256通道特征图;
第27层,卷积层,使用一个3x3的卷积核对数据进行最大池化操作,步长为2,通道数为512,之后的到一个尺寸为26x26的512通道特征图;
第28层,卷积层,使用一个1x1的卷积核,步长为1,通道数为256,对上一层的数据进行卷积操作,之后得到一个尺寸为26x26的256通道特征图;
第29层,卷积层,使用一个3x3的卷积核,步长为1,通道数为512,对上一层的数据进行卷积操作,之后得到一个尺寸为26x26的512通道特征图;
第30层-第43层,卷积层,重复第28层和29层的操作7次,之后的到一个尺寸为26x26的512通道特征图;
第44层,卷积层,使用一个3x3的卷积核,步长为2,通道数为1024,对上一层的数据进行卷积操作,之后得到一个尺寸为13x13的1024通道特征图;
第45层,卷积层,使用一个1x1的卷积核,步长为1,通道数为512,对上一层的数据进行卷积操作,之后得到一个尺寸为13x13的512通道特征图;
第46层,卷积层,使用一个3x3的卷积核,步长为1,通道数为1024,对上一层的数据进行卷积操作,之后得到一个尺寸为13x13的1024通道特征图;
第47层-第52层,卷积层,重复第45层和46层的操作3次,之后的到一个尺寸为13x13的1024通道特征图;
第53层,卷积层,使用一个1x1的卷积核,步长为1,通道数为512,对上一层的数据进行卷积操作,之后得到一个尺寸为13x13的512通道特征图;
第54层,卷积层,使用一个3x3的卷积核,步长为1,通道数为1024,对上一层的数据进行卷积操作,之后得到一个尺寸为13x13的1024通道特征图;
第55层,卷积层,使用一个1x1的卷积核,步长为1,通道数为512,对上一层的数据进行卷积操作,之后得到一个尺寸为13x13的512通道特征图;
第56层,卷积层,使用一个3x3的卷积核,步长为1,通道数为1024,对上一层的数据进行卷积操作,之后得到一个尺寸为13x13的1024通道特征图;
第57层,卷积层,使用一个1x1的卷积核,步长为1,通道数为512,对上一层的数据进行卷积操作,之后得到一个尺寸为13x13的512通道特征图;
第58层,卷积层,使用一个3x3的卷积核,步长为1,通道数为1024,对上一层的数据进行卷积操作,之后得到一个尺寸为13x13的1024通道特征图;
第59层,卷积层,使用一个1x1的卷积核,步长为1,通道数为21,对上一层的数据进行卷积操作,之后得到一个尺寸为13x13的21通道特征图;
第60层,卷积层,使用一个1x1的卷积核,步长为1,通道数为256,对第58层的数据进行卷积操作,之后得到一个尺寸为13x13的256通道特征图;
第61层,上采样,扩充特征图,之后得到一个尺寸为26x26的256通道特征图,将得到的新特征图与第43层的特征图进行拼接,得到一个尺寸为26x26x768的特征图;
第62层~第66层,重复53层到57层的操作,之后得到一个尺寸为26x26的256通道特征图;
第67层,卷积层,使用一个3x3的卷积核,步长为1,通道数为512,对上一层的数据进行卷积操作,之后得到一个尺寸为26x26的256通道特征图;
第68层,卷积层,使用一个1x1的卷积核,步长为1,通道数为21,对上一层的数据进行卷积操作,之后得到一个尺寸为26x26的21通道特征图;
第69层,卷积层,使用一个1x1的卷积核,步长为1,通道数为128,对第66层的数据进行卷积操作,之后得到一个尺寸为26x26的128通道特征图;
第70层,上采样,扩充特征图,之后得到一个尺寸为52x52的128通道特征图,将得到的新特征图与第13层的特征图进行拼接,得到一个尺寸为52x52x384的特征图;
第71层~第74层,重复62层到66层的操作,之后得到一个尺寸为52x52的128通道特征图,输出52*52的特征图;
第75层,卷积层,使用一个3x3的卷积核,步长为1,通道数为256,对上一层的数据进行卷积操作,之后得到一个尺寸为52x52的256通道特征图;
第76层,卷积层,使用一个1x1的卷积核,步长为1,通道数为21,对第74层的数据进行卷积操作,之后得到一个尺寸为52x52的21通道特征图。
本实施例中的步骤S3具体包括:
S31,首先采用已构建的目标检测模型中的yolo-v3用于访问号的位置检测,输入数据为待识别访问号的常规单通道图像数据,通过76层的卷积与池化,通过darknet网络得到三种不同尺度的预测结果,然后检测出访问号在图像中所在的位置并识别访问号所使用的字体类别;
S32,截取目标检测模型框选出的区域图像,如图5所示,从左上角开始,遍历每个像素点,以当前像素点为左上角顶点,截取与字体特征模板相应大小的二维矩阵。
本实施例中步骤S4中具体包括:
S41,将该二维矩阵与该字体类别的每个特征模板依次进行点乘,从而得到过滤复杂背景后的访问号字体,如图6所示;
S42,将得到的过滤复杂背景后的访问号字体结果依次与该类别字体的所有标签模板进行比对,如果完全相同,则判定为当前标签模板对应数字,确认识别号的具体数字;当检测出第一个识别号数字时跳出该循环重复步骤S41-S42。
值得注意到的是,图5是原图中截取的访问号区域图像,由于图像背景较为复杂,一般的字体识别方法很难正确识别。因此需要过滤复杂背景。具体方式为:图6a为从图5截取的最后一位数字,将该数字区域可以看成是一个7*4的矩阵,经过二值化处理后,白色部分值为1,黑色部分值为0;图6b为数字8的特征模板,把这两个矩阵各元素相乘,可以得到图6c的最终结果,由此背景单一化,相当于是把背景过滤掉了。
通过采用本发明公开的上述技术方案,得到了如下有益的效果:
本发明公开了一种复杂背景图像中的医疗影像访问号识别方法,该方法基于深度学习的目标检测技术定位访问号的位置,采用构建的字体标签模板和特征模板,将定位的访问号位置的区域截图与特征模板相乘过滤掉复杂背景,然后与标签模板与对应字体的模板依次比对,确定访问号类型从而快速获取访问号的内容识别出医疗影像类型。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。

Claims (5)

1.一种复杂背景图像中的医疗影像访问号识别方法,其特征在于,包括以下步骤:
S1,建立访问号字体模板:针对不同设备的医疗影像访问号字体构建字体模板;
S2,基于卷积神经网络深度学习构建目标检测模型:选择训练数据,以常规单通道图像文件作为输入内容,以访问号位置信息和访问号所使用的字体类别作为输出结果,采用神经网络深度学习过程构建目标检测模型;
S3,采用构建的目标检测模型确定访问号位置:首先对访问号的位置进行检测,然后截取出访问号字体所在位置区域;
S4,采用字体模板进行访问号识别:将步骤S3中截取出的访问号字体所在位置区域提取与字体模板相对应的二维矩阵,然后将所述二维矩阵进行字体模板和标签模板的对比,直到识别出所有访问号字体;
步骤S1中所述字体模板包括特征模板与标签模板,所述标签模板是该字体在黑色背景中的像素显示模板;所述特征模板是该字体在白色背景中的像素显示,同时与标签模板的像素显示相加得到的即是特征模板;
步骤S3具体包括:
S31,首先采用已构建的目标检测模型中的yolo-v3用于访问号的位置检测,输入数据为待识别访问号的常规单通道图像数据,通过76层的卷积与池化,通过darknet网络得到三种不同尺度的预测结果,然后检测出访问号在图像中所在的位置并识别访问号所使用的字体类别;
S32,截取目标检测模型框选出的区域图像,从左上角开始,遍历每个像素点,以当前像素点为左上角顶点,截取与字体特征模板相应大小的二维矩阵;
步骤S4中具体包括:
S41,将该二维矩阵与该字体类别的每个特征模板依次进行点乘得到过滤复杂背景后的访问号字体;
S42,将得到的过滤复杂背景后的访问号字体结果依次与该类别字体的所有标签模板进行比对,如果完全相同,则判定为当前标签模板对应数字,确认识别号的具体数字。
2.根据权利要求1所述的复杂背景图像中的医疗影像访问号识别方法,其特征在于,步骤S1之前还包括步骤S0:医疗影像的预处理:原始数据为常规单通道图像,对于原始数据像素值除以255进行归一化。
3.根据权利要求1所述的复杂背景图像中的医疗影像访问号识别方法,其特征在于,步骤S2中具体包括:
S21,以能够确定访问号的医疗影像为训练数据集,将训练数据集中的医疗影像的访问号位置信息和访问号的字体类别作为训练输入数据,同时将访问号前的标签共同标记也输入神经网络训练模型中;
S22,神经网络训练模型通过76层的卷积与池化,采用yolo-v3得到三种不同尺寸的目标位置预测结果,每个尺寸的预测结果都对应21个通道;
S23,然后通过比较每个预测结果中的位置信息和真实位置的差距,寻找最佳匹配的预测结果作为输出。
4.根据权利要求3所述的复杂背景图像中的医疗影像访问号识别方法,其特征在于,步骤S22中三种不同尺寸的目标位置预测结果具体为13x13,26x26,52x52;
21个通道包括3个图片通道数+4个预测框的坐标通道+1个置信度通道+2个类别数通道。
5.根据权利要求1所述的复杂背景图像中的医疗影像访问号识别方法,其特征在于,所述步骤S42中,当检测出第一个识别号数字时重复步骤S41-S42。
CN202011324359.6A 2020-11-23 2020-11-23 一种复杂背景图像中的医疗影像访问号识别方法 Active CN112308062B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011324359.6A CN112308062B (zh) 2020-11-23 2020-11-23 一种复杂背景图像中的医疗影像访问号识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011324359.6A CN112308062B (zh) 2020-11-23 2020-11-23 一种复杂背景图像中的医疗影像访问号识别方法

Publications (2)

Publication Number Publication Date
CN112308062A CN112308062A (zh) 2021-02-02
CN112308062B true CN112308062B (zh) 2022-08-23

Family

ID=74335450

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011324359.6A Active CN112308062B (zh) 2020-11-23 2020-11-23 一种复杂背景图像中的医疗影像访问号识别方法

Country Status (1)

Country Link
CN (1) CN112308062B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112883312B (zh) * 2021-02-05 2023-06-20 浙江卡易智慧医疗科技有限公司 一种支持跨平台的Nginx可视化配置系统及方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008081886A1 (ja) * 2006-12-27 2008-07-10 Panasonic Corporation 印刷媒体、画像形成装置、画像情報入力装置及びデジタル複合機
CN104463195A (zh) * 2014-11-08 2015-03-25 沈阳工业大学 基于模板匹配的印刷体数字识别方法
CN105588440A (zh) * 2014-10-20 2016-05-18 宝山钢铁股份有限公司 烧结机台车位置检测方法及装置
CN109961553A (zh) * 2017-12-26 2019-07-02 航天信息股份有限公司 发票号码识别方法、装置及税务自助终端系统
WO2019144575A1 (zh) * 2018-01-24 2019-08-01 中山大学 一种快速行人检测方法及装置
CN110503112A (zh) * 2019-08-27 2019-11-26 电子科技大学 一种增强特征学习的小目标检测及识别方法
CN111178352A (zh) * 2019-12-13 2020-05-19 中国建设银行股份有限公司 一种验证码字符识别的方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008081886A1 (ja) * 2006-12-27 2008-07-10 Panasonic Corporation 印刷媒体、画像形成装置、画像情報入力装置及びデジタル複合機
CN105588440A (zh) * 2014-10-20 2016-05-18 宝山钢铁股份有限公司 烧结机台车位置检测方法及装置
CN104463195A (zh) * 2014-11-08 2015-03-25 沈阳工业大学 基于模板匹配的印刷体数字识别方法
CN109961553A (zh) * 2017-12-26 2019-07-02 航天信息股份有限公司 发票号码识别方法、装置及税务自助终端系统
WO2019144575A1 (zh) * 2018-01-24 2019-08-01 中山大学 一种快速行人检测方法及装置
CN110503112A (zh) * 2019-08-27 2019-11-26 电子科技大学 一种增强特征学习的小目标检测及识别方法
CN111178352A (zh) * 2019-12-13 2020-05-19 中国建设银行股份有限公司 一种验证码字符识别的方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
面向对象的协同模板分类模型研究;刘晓平等;《工程图学学报》;20070228(第01期);全文 *

Also Published As

Publication number Publication date
CN112308062A (zh) 2021-02-02

Similar Documents

Publication Publication Date Title
CN110046529B (zh) 二维码识别方法、装置及设备
CN110705405B (zh) 目标标注的方法及装置
CN103955694B (zh) 图像识别抄表系统及方法
EP2783328B1 (en) Text detection using multi-layer connected components with histograms
CN110348439B (zh) 一种自动识别价签的方法、计算机可读介质及系统
CN112669515B (zh) 票据图像识别方法、装置、电子设备和存储介质
CN109299663A (zh) 手写字体识别方法、系统以及终端设备
CN109446873A (zh) 手写字体识别方法、系统以及终端设备
CN112446363A (zh) 一种基于视频抽帧的图像拼接与去重方法及装置
CN109947273B (zh) 一种点读定位方法及装置
CN112819748B (zh) 一种带钢表面缺陷识别模型的训练方法及装置
CN112364807B (zh) 图像识别方法、装置、终端设备及计算机可读存储介质
CN110765795A (zh) 二维码识别方法、装置及电子设备
CN112381092B (zh) 跟踪方法、装置及计算机可读存储介质
CN116311214B (zh) 车牌识别方法和装置
CN112001200A (zh) 识别码识别方法、装置、设备、存储介质和系统
CN111737478A (zh) 文本检测方法、电子设备及计算机可读介质
CN113486715A (zh) 图像翻拍识别方法、智能终端以及计算机存储介质
CN112308062B (zh) 一种复杂背景图像中的医疗影像访问号识别方法
CN111914706A (zh) 一种文字检测输出结果质量检测和控制的方法与装置
CN104598289A (zh) 一种识别方法及一种电子设备
CN107330470B (zh) 识别图片的方法和装置
CN114842492A (zh) 一种关键信息抽取方法、装置、存储介质与电子设备
CN113159193B (zh) 模型训练方法、图像识别方法、存储介质及程序产品
CN115457585A (zh) 作业批改的处理方法、装置、计算机设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant