CN109241962A - 一种字符识别方法及装置 - Google Patents
一种字符识别方法及装置 Download PDFInfo
- Publication number
- CN109241962A CN109241962A CN201811006811.7A CN201811006811A CN109241962A CN 109241962 A CN109241962 A CN 109241962A CN 201811006811 A CN201811006811 A CN 201811006811A CN 109241962 A CN109241962 A CN 109241962A
- Authority
- CN
- China
- Prior art keywords
- character
- picture
- recognition
- precise
- binaryzation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Abstract
本发明提供了一种字符识别方法及装置,涉及图像识别技术领域。所述字符识别方法包括:对包含设备字符图像的设备图片进行二值化处理以获得二值化图片,基于所述二值化图片的连通域特性从所述二值化图片中确定所述字符图像;采用边框精修神经网络确定所述字符图像的字符边界框,以从所述字符图像中提取精确字符图像;对所述精确字符图像进行字符识别。所述字符识别方法在二值化图片中确定字符图像后再采用边框精修神经网络精确提取精确字符图像,提高了字符图像提取的精度,从而在具备广泛适用性的同时提高了字符识别的准确度。
Description
技术领域
本发明涉及图像识别技术领域,具体而言,涉及一种字符识别方法及装置。
背景技术
传统的电力行业进行电力仪表设备等的电力标签(读数)识别都是通过人工进行,其识别效率低下,且对于工作人员来说在电力布置复杂的地区靠近电力仪表设备还存在安全风险。随着图像采集电子设备以及图像处理算法的迅速发展,为了减少人力成本、减少电力作业风险,许多电力设备的标签和读数需要采用拍摄设备图像,然后从图像上获取设备的标签及读数。
但是现有的基于图像识别的电力标签识别通常是对同一类型的电力设备上的读数和标签进行预设匹配规则的识别,应用到其他类型的电力设备时读数或标签的识别准确率就会大幅减低,同时传统电力标签图像识别技术的识别精度也无法满足如今的需求。
发明内容
有鉴于此,本发明实施例的目的在于提供一种字符识别方法及装置,以解决上述现有技术中传统电力设备读数图像识别的适用性差、识别准确率低的问题。
第一方面,本发明实施例提供了一种字符识别方法,所述字符识别方法包括:对包含设备字符图像的设备图片进行二值化处理以获得二值化图片,基于所述二值化图片的连通域特性从所述二值化图片中确定所述字符图像;采用边框精修神经网络确定所述字符图像的字符边界框,以从所述字符图像中提取精确字符图像;对所述精确字符图像进行字符识别。
综合第一方面,所述对所述精确字符图像进行字符识别,包括:采用深度卷积神经网络对所述精确字符图像进行字符识别。
综合第一方面,所述对所述精确字符图像进行字符识别,包括:采用模板匹配算法对所述精确字符图像进行字符识别。
综合第一方面,所述对所述精确字符图像进行字符识别,包括:采用深度卷积神经网络对所述精确字符图像进行字符识别,获得第一识别结果;采用模板匹配算法对所述精确字符图像进行字符识别,获得第二识别结果;选取所述第一识别结果和所述第二识别结果中识别准确率较高的单个字符识别结果组合为完整的字符识别结果。
综合第一方面,所述对包含设备字符图像的设备图片进行二值化处理以获得二值化图片,包括:通过最大类间方差法获得包含设备字符图像的设备图片的二值化阈值,将灰度大于所述二值化阈值的像素点的灰度设置为1,将灰度小于所述二值化阈值的像素点的灰度设置为0,获得所述设备图片的二值化图片。
综合第一方面,所述基于所述二值化图片的连通域特性从所述二值化图片中确定所述字符图像,包括:对所述二值化图片进行连通域分析,根据所述二值化图片的连通域外界边框的位置进行连通域合并,从而从所述二值化图片中初步确定所述字符图像。
第二方面,本发明实施例提供了一种字符识别装置,所述字符识别装置包括:二值化模块,用于对包含设备字符图像的设备图片进行二值化处理以获得二值化图片,基于所述二值化图片的连通域特性从所述二值化图片中确定所述字符图像;边界框精修模块,用于采用边框精修神经网络确定所述字符图像的字符边界框,以从所述字符图像中提取精确字符图像;识别模块,用于对所述精确字符图像进行字符识别。
综合第二方面,所述识别模块包括:神经网络识别单元,用于采用深度卷积神经网络对所述精确字符图像进行字符识别,获得第一识别结果;模板识别单元,用于采用模板匹配算法对所述精确字符图像进行字符识别,获得第二识别结果。
综合第二方面,所述识别模块还包括:比较单元,用于选取所述第一识别结果和所述第二识别结果中识别准确率较高的单个字符识别结果组合为完整的字符识别结果。
第三方面,本发明实施例还提供了一种计算机可读取存储介质,所述计算机可读取存储介质中存储有计算机程序指令,所述计算机程序指令被一处理器读取并运行时,执行上述任一方面所述方法中的步骤。
本发明提供的有益效果是:
本发明提供了一种字符识别方法及装置,所述字符识别方法通过二值化处理和连通域特性处理先对包含设备字符图像的设备图片进行字符图像的初步确定,具备较快的处理速度;再采用边框精修神经网络从字符图像中提取精确字符图像,通过神经网络提高了边界框精修的速度和准确度,从而将需要进行字符识别的字符图像区域确定在一个更加小而精确的范围,提高了字符识别的效率和准确率。
本发明的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明实施例了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明第一实施例提供的一种字符识别方法的流程示意图;
图2为本发明第一实施例提供的一种深度卷积神经网络的结构示意图;
图3为本发明第一实施例提供的一种字符识别步骤的流程示意图;
图4为本发明第二实施例提供的一种字符识别装置的模块示意图;
图5为本发明第三实施例提供的一种可应用于本申请实施例中的电子设备的结构框图。
图标:100-字符识别装置;110-二值化模块;120-边界框精修模块;130-识别模块;200-电子设备;201-存储器;202-存储控制器;203-处理器;204-外设接口;205-输入输出单元;206-音频单元;207-显示单元。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
第一实施例
经本申请人研究发现,目前,电网企业如果想读取图像上的设备标签和读数信息,要么是人工,要么是采用传统图像处理技术。大部分情况下,传统图像处理技术会先分析设备上文字和读数的特点,然后基于特点设计规则,再通过规则去定位字符位置,最后根据字符模板匹配结果完成识别。但是基于规则的传统图像处理技术泛化性不强,对一种类型的电力设备上的读数和标签定位准确,但应用到其他类型的电力设备上就不那么准确;单纯通过模板匹配的识别精度较差,无法满足现在的电力设备读数和标签识别的需求。为了解决上述问题,本发明第一实施例提供了一种字符识别方法,应当理解的是,所述字符识别方法可以应用于个人电脑、云服务器、智能手机等具备图像处理和逻辑运算能力的处理设备中。
请参考图1,图1为本发明第一实施例提供的一种字符识别方法的流程示意图。所述字符识别方法的具体步骤可以如下:
步骤S10:对包含设备字符图像的设备图片进行二值化处理以获得二值化图片,基于所述二值化图片的连通域特性从所述二值化图片中确定所述字符图像。
所述设备字符图像可以是电表的用电度数、变压器的电压和电流或蓄电池温度等读数的字符图像,同时,该设备字符图像可以是通过设置在电力设备附近的监控摄像头获取或者是通过人工拍摄获取。
步骤S20:采用边框精修神经网络确定所述字符图像的字符边界框,以从所述字符图像中提取精确字符图像。
可选地,所述边框精修神经网络可以是用于物体检测的卷积神经网络,该用于物体检测的卷积神经网络中的边框回归能够从所述字符图像中提取精确字符图像。其中,所述边框回归即将输入的原始窗口(所述字符图像)经过映射得到一个跟真实窗口(实际字符图像)更接近的回归窗口(所述精确字符图像)。
步骤S30:对所述精确字符图像进行字符识别。
本实施例通过步骤S10-S30通过二值化处理和连通域特性处理先对包含设备字符图像的设备图片进行字符图像的初步确定,具备较快的处理速度;再采用边框精修神经网络从字符图像中提取精确字符图像,通过神经网络提高了边界框精修的速度和准确度,从而将需要进行字符识别的字符图像区域确定在一个更加小而精确的范围,提高了字符识别的效率和准确率。
针对步骤S10,所述“对包含设备字符图像的设备图片进行二值化处理以获得二值化图片”的具体步骤可以为:通过最大类间方差法获得包含设备字符图像的设备图片的二值化阈值,将灰度大于所述二值化阈值的像素点的灰度设置为1,将灰度小于所述二值化阈值的像素点的灰度设置为0,获得所述设备图片的二值化图片。其中,所述最大类间方差法是由日本学者大津于1979年提出的,是一种自适应的阈值确定的方法,又叫大津法,简称OTSU,它是按图像的灰度特性,将图像分成背景和目标两部分,背景和目标之间的类间方差越大,说明构成图像的两部分的差别越大,当部分目标错分为背景或部分背景错分为目标都会导致两部分差别变小,因此使类间方差最大的分割意味着错分概率最小从而确定阈值。
继续对步骤S10进行解释,所述“基于所述二值化图片的连通域特性从所述二值化图片中确定所述字符图像”的步骤可以具体为:对所述二值化图片进行连通域分析,根据所述二值化图片的连通域外界边框的位置进行连通域合并,从而从所述二值化图片中初步确定所述字符图像。应当理解的是,二值图像的图像亮度值只有两个状态:黑(灰度为0)和白(灰度为255),二值图像在图像分析与识别中有着举足轻重的地位,因为其模式简单,对像素在空间上的关系有着极强的表现力,而二值图像在图像分析与识别中有着举足轻重的地位,因为其模式简单,对像素在空间上的关系有着极强的表现力,因此通过二值化图像对字符图像进行分析具有速度快、计算资源需求量小、准确率较高的优点。
进一步地,连通区域(Connected Component)一般是指图像中具有相同像素值且位置相邻的前景像素点组成的图像区域(Region,Blob)。连通区域分析(ConnectedComponent Analysis,Connected Component Labeling)是指将图像中的各个连通区域找出并标记。本实施例中通过连通域分析确定二值化图片中满足外界边框条件的区域,并对该区域进行连通域合并,从而从所述二值化图片中初步确定外界边框中的所述字符图像。可选地,所述外界边框条件可以根据外界边框的具体形状进行具体的规定,例如对矩形、圆形等外界边框设定的具体形状的外界边框条件,其能够在识别出连通域中的矩形或圆形边界框。
作为一种实施方式,针对步骤S30,所述“对所述精确字符图像进行字符识别”的步骤可以具体为:采用深度卷积神经网络对所述精确字符图像进行字符识别。所述深度卷积神经网络可以是通常使用的普通深度卷积神经网络,其包括卷积、池化、全连接以及输出步骤。请参考图2,图2为本发明第一实施例提供的一种深度卷积神经网络的结构示意图,可选地,本实施例中的深度卷积神经网络可以包括三个滑动窗口stride数值为2的卷积层,即卷积层1:7*7*1(7*7为卷积核的大小,1表示卷积核的数量)、卷积层2:5*5*12、卷积层3:3*3*32,全连接层连接叠加所有卷积层的特征输出一个128维的值给分类器,以使分类器在输出步骤在该128维值中精确输出表示字符边界框的上下左右四角坐标的四维数值,从而准确地完成字符边界框的精修,从所述字符图像中提取精确字符图像。应当理解的是,上述滑动窗口值、卷积层的卷积核大小和个数以及全连接层输出维数等数值均可以根据具体需求进行调整,并不会对本实施例造成限定。
作为一种实施方式,步骤S30还可以具体为:采用模板匹配算法对所述精确字符图像进行字符识别。应当理解的是,在进行模板匹配算法之前,还需要在处理设备中输入用于比较的数字、字母、汉字等字符作为模板,其具体输入内容可根据需要进行字符识别的电力设备的读数字符类型确定。可选地,所述模板匹配算法可以是相关法、误差法等常用的模板匹配算法。
作为一种实施方式,请参考图3,图3为本发明第一实施例提供的一种字符识别步骤的流程示意图,所述步骤S30的具体步骤如下:
步骤S31:采用深度卷积神经网络对所述精确字符图像进行字符识别,获得第一识别结果。
步骤S32:采用模板匹配算法对所述精确字符图像进行字符识别,获得第二识别结果。
步骤S33:选取所述第一识别结果和所述第二识别结果中识别准确率较高的单个字符识别结果组合为完整的字符识别结果。
本实施例通过步骤S31-S33分别采用深度卷积神经网络和模板匹配算法对所述精确字符图像进行字符识别,并将两者的识别结果进行准确率的比较,针对每一个字符选取两种识别结果中准确率更高的识别结果组合作为最终的完整的字符识别结果,在字符图像不适合采用某种图像识别方式时能够有其他图像识别结果进行参考,从而提高了字符识别的准确率,同时改善了本实施例提供的所述字符识别方法的适用性。
本实施例提供的字符识别方法的工作原理为:
处理设备接收图像采集设备传输来的包含电量表的设备字符图像的设备图片,所述电量表的外界边框为矩形,对所述二值化图片进行连通域分析,根据所述二值化图片的连通域的矩形外界边框的位置进行连通域合并,从而从所述二值化图片中初步确定所述字符图像;然后采用边框精修神经网络确定所述字符图像的字符边界框,从所述字符图像中提取精确字符图像;再采用深度卷积神经网络对所述精确字符图像进行字符识别,获得第一识别结果,采用模板匹配算法对所述精确字符图像进行字符识别,获得第二识别结果,例如该第一识别结果为82,该第二识别结果为67,获得该第一识别结果的百位数识别准确率为91%、个位数识别准确率为92%,该第二识别结果的百位数识别准确率为86%、个位数识别准确率为98%,则完整的字符识别结果为87。
第二实施例
为了配合本发明第一实施例提供的所述字符识别方法,本发明第二实施例还提供了一种字符识别装置100。
请参考图4,图4为本发明第二实施例提供的一种字符识别装置的模块示意图。
字符识别装置100包括二值化模块110、边界框精修模块120和识别模块130。
二值化模块110,用于对包含设备字符图像的设备图片进行二值化处理以获得二值化图片,基于所述二值化图片的连通域特性从所述二值化图片中确定所述字符图像。
边界框精修模块120,用于采用边框精修神经网络确定所述字符图像的字符边界框,以从所述字符图像中提取精确字符图像。
识别模块130,用于对所述精确字符图像进行字符识别。
作为一种实施方式,识别模块130包括神经网络识别单元和模板识别单元。所述神经网络识别单元,用于采用深度卷积神经网络对所述精确字符图像进行字符识别,获得第一识别结果。所述模板识别单元,用于采用模板匹配算法对所述精确字符图像进行字符识别,获得第二识别结果。
可选地,识别模块130还包括比较单元,所述比较单元用于选取所述第一识别结果和所述第二识别结果中识别准确率较高的单个字符识别结果组合为完整的字符识别结果。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法中的对应过程,在此不再过多赘述。
第三实施例
请参考图5,图5为本发明第三实施例提供的一种可应用于本申请实施例中的电子设备的结构框图。本实施例提供的电子设备200可以包括字符识别装置100、存储器201、存储控制器202、处理器203、外设接口204、输入输出单元205、音频单元206、显示单元207。
所述存储器201、存储控制器202、处理器203、外设接口204、输入输出单元205、音频单元206、显示单元207各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述字符识别装置100包括至少一个可以软件或固件(firmware)的形式存储于所述存储器201中或固化在字符识别装置100的操作系统(operating system,OS)中的软件功能模块。所述处理器203用于执行存储器201中存储的可执行模块,例如字符识别装置100包括的软件功能模块或计算机程序。
其中,存储器201可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器201用于存储程序,所述处理器203在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的服务器所执行的方法可以应用于处理器203中,或者由处理器203实现。
处理器203可以是一种集成电路芯片,具有信号的处理能力。上述的处理器203可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器203也可以是任何常规的处理器等。
所述外设接口204将各种输入/输出装置耦合至处理器203以及存储器201。在一些实施例中,外设接口204,处理器203以及存储控制器202可以在单个芯片中实现。在其他一些实例中,他们可以分别由独立的芯片实现。
输入输出单元205用于提供给用户输入数据实现用户与所述服务器(或本地终端)的交互。所述输入输出单元205可以是,但不限于,鼠标和键盘等设备。
音频单元206向用户提供音频接口,其可包括一个或多个麦克风、一个或者多个扬声器以及音频电路。
显示单元207在所述电子设备200与用户之间提供一个交互界面(例如用户操作界面)或用于显示图像数据给用户参考。在本实施例中,所述显示单元207可以是液晶显示器或触控显示器。若为触控显示器,其可为支持单点和多点触控操作的电容式触控屏或电阻式触控屏等。支持单点和多点触控操作是指触控显示器能感应到来自该触控显示器上一个或多个位置处同时产生的触控操作,并将该感应到的触控操作交由处理器203进行计算和处理。
可以理解,图5所示的结构仅为示意,所述电子设备200还可包括比图5中所示更多或者更少的组件,或者具有与图5所示不同的配置。图5中所示的各组件可以采用硬件、软件或其组合实现。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法中的对应过程,在此不再过多赘述。
综上所述,本发明实施例提供了一种字符识别方法及装置,所述字符识别方法通过二值化处理和连通域特性处理先对包含设备字符图像的设备图片进行字符图像的初步确定,具备较快的处理速度;再采用边框精修神经网络从字符图像中提取精确字符图像,通过神经网络提高了边界框精修的速度和准确度,从而将需要进行字符识别的字符图像区域确定在一个更加小而精确的范围,提高了字符识别的效率和准确率。。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
Claims (10)
1.一种字符识别方法,其特征在于,所述字符识别方法包括:
对包含设备字符图像的设备图片进行二值化处理以获得二值化图片,基于所述二值化图片的连通域特性从所述二值化图片中确定所述字符图像;
采用边框精修神经网络确定所述字符图像的字符边界框,以从所述字符图像中提取精确字符图像;
对所述精确字符图像进行字符识别。
2.根据权利要求1所述的字符识别方法,其特征在于,所述对所述精确字符图像进行字符识别,包括:
采用深度卷积神经网络对所述精确字符图像进行字符识别。
3.根据权利要求1所述的字符识别方法,其特征在于,所述对所述精确字符图像进行字符识别,包括:
采用模板匹配算法对所述精确字符图像进行字符识别。
4.根据权利要求1所述的字符识别方法,其特征在于,所述对所述精确字符图像进行字符识别,包括:
采用深度卷积神经网络对所述精确字符图像进行字符识别,获得第一识别结果;
采用模板匹配算法对所述精确字符图像进行字符识别,获得第二识别结果;
选取所述第一识别结果和所述第二识别结果中识别准确率较高的单个字符识别结果组合为完整的字符识别结果。
5.根据权利要求1所述的字符识别方法,其特征在于,所述对包含设备字符图像的设备图片进行二值化处理以获得二值化图片,包括:
通过最大类间方差法获得包含设备字符图像的设备图片的二值化阈值,将灰度大于所述二值化阈值的像素点的灰度设置为1,将灰度小于所述二值化阈值的像素点的灰度设置为0,获得所述设备图片的二值化图片。
6.根据权利要求1所述的字符识别方法,其特征在于,所述基于所述二值化图片的连通域特性从所述二值化图片中确定所述字符图像,包括:
对所述二值化图片进行连通域分析,根据所述二值化图片的连通域外界边框的位置进行连通域合并,从而从所述二值化图片中初步确定所述字符图像。
7.一种字符识别装置,其特征在于,所述字符识别装置包括:
二值化模块,用于对包含设备字符图像的设备图片进行二值化处理以获得二值化图片,基于所述二值化图片的连通域特性从所述二值化图片中确定所述字符图像;
边界框精修模块,用于采用边框精修神经网络确定所述字符图像的字符边界框,以从所述字符图像中提取精确字符图像;
识别模块,用于对所述精确字符图像进行字符识别。
8.根据权利要求7所述的字符识别装置,其特征在于,所述识别模块包括:
神经网络识别单元,用于采用深度卷积神经网络对所述精确字符图像进行字符识别,获得第一识别结果;
模板识别单元,用于采用模板匹配算法对所述精确字符图像进行字符识别,获得第二识别结果。
9.根据权利要求8所述的字符识别装置,其特征在于,所述识别模块还包括:
比较单元,用于选取所述第一识别结果和所述第二识别结果中识别准确率较高的单个字符识别结果组合为完整的字符识别结果。
10.一种计算机可读取存储介质,其特征在于,所述计算机可读取存储介质中存储有计算机程序指令,所述计算机程序指令被一处理器读取并运行时,执行权利要求1-6任一项所述方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811006811.7A CN109241962A (zh) | 2018-08-30 | 2018-08-30 | 一种字符识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811006811.7A CN109241962A (zh) | 2018-08-30 | 2018-08-30 | 一种字符识别方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109241962A true CN109241962A (zh) | 2019-01-18 |
Family
ID=65069080
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811006811.7A Pending CN109241962A (zh) | 2018-08-30 | 2018-08-30 | 一种字符识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109241962A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111199194A (zh) * | 2019-12-25 | 2020-05-26 | 吉林大学 | 基于机器视觉和深度学习的汽车智能座舱仪表测试方法 |
CN111340040A (zh) * | 2020-02-26 | 2020-06-26 | 五八有限公司 | 一种纸张字符识别方法、装置、电子设备及存储介质 |
CN111695550A (zh) * | 2020-03-26 | 2020-09-22 | 遥相科技发展(北京)有限公司 | 一种文字提取方法、图像处理设备和计算机可读存储介质 |
CN112395909A (zh) * | 2019-08-14 | 2021-02-23 | 华晨宝马汽车有限公司 | 字符识别系统和方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005063056A (ja) * | 2003-08-08 | 2005-03-10 | Ricoh Co Ltd | 画像認識装置、画像認識プログラムおよびこのプログラムが記録された記録媒体 |
CN105761351A (zh) * | 2016-01-08 | 2016-07-13 | 东方通信股份有限公司 | 基于结构特征的字符识别方法 |
CN106203415A (zh) * | 2016-06-30 | 2016-12-07 | 三峡大学 | 一种基于数字图像处理的银行卡号自动识别装置 |
CN107273896A (zh) * | 2017-06-15 | 2017-10-20 | 浙江南自智能科技股份有限公司 | 一种基于图像识别的车牌检测识别方法 |
CN107403130A (zh) * | 2017-04-19 | 2017-11-28 | 北京粉笔未来科技有限公司 | 一种字符识别方法及字符识别装置 |
CN107451602A (zh) * | 2017-07-06 | 2017-12-08 | 浙江工业大学 | 一种基于深度学习的果蔬检测方法 |
CN107480665A (zh) * | 2017-08-09 | 2017-12-15 | 北京小米移动软件有限公司 | 文字检测方法、装置及计算机可读存储介质 |
CN108345880A (zh) * | 2018-01-26 | 2018-07-31 | 金蝶软件(中国)有限公司 | 发票识别方法、装置、计算机设备和存储介质 |
CN108427946A (zh) * | 2018-03-16 | 2018-08-21 | 福州大学 | 复杂场景下基于内特征和文本域布局的驾驶证检测识别方法 |
-
2018
- 2018-08-30 CN CN201811006811.7A patent/CN109241962A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005063056A (ja) * | 2003-08-08 | 2005-03-10 | Ricoh Co Ltd | 画像認識装置、画像認識プログラムおよびこのプログラムが記録された記録媒体 |
CN105761351A (zh) * | 2016-01-08 | 2016-07-13 | 东方通信股份有限公司 | 基于结构特征的字符识别方法 |
CN106203415A (zh) * | 2016-06-30 | 2016-12-07 | 三峡大学 | 一种基于数字图像处理的银行卡号自动识别装置 |
CN107403130A (zh) * | 2017-04-19 | 2017-11-28 | 北京粉笔未来科技有限公司 | 一种字符识别方法及字符识别装置 |
CN107273896A (zh) * | 2017-06-15 | 2017-10-20 | 浙江南自智能科技股份有限公司 | 一种基于图像识别的车牌检测识别方法 |
CN107451602A (zh) * | 2017-07-06 | 2017-12-08 | 浙江工业大学 | 一种基于深度学习的果蔬检测方法 |
CN107480665A (zh) * | 2017-08-09 | 2017-12-15 | 北京小米移动软件有限公司 | 文字检测方法、装置及计算机可读存储介质 |
CN108345880A (zh) * | 2018-01-26 | 2018-07-31 | 金蝶软件(中国)有限公司 | 发票识别方法、装置、计算机设备和存储介质 |
CN108427946A (zh) * | 2018-03-16 | 2018-08-21 | 福州大学 | 复杂场景下基于内特征和文本域布局的驾驶证检测识别方法 |
Non-Patent Citations (4)
Title |
---|
CHENGHUI YANG等: "Based on Artificial Neural Networks for voice recognition word segment", 《2011 IEEE 3RD INTERNATIONAL CONFERENCE ON COMMUNICATION SOFTWARE AND NETWORKS》 * |
冯莹莹,郭常山著: "《智能监控视频中运动目标跟踪方法研究》", 30 June 2018, 长春:吉林大学出版社 * |
白培瑞等: "一种通用的基于图像分割的验证码识别方法", 《山东科技大学学报(自然科学版)》 * |
赖特: "基于模板匹配及人工神经网络算法的图像识别应用", 《技术与应用》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112395909A (zh) * | 2019-08-14 | 2021-02-23 | 华晨宝马汽车有限公司 | 字符识别系统和方法 |
CN111199194A (zh) * | 2019-12-25 | 2020-05-26 | 吉林大学 | 基于机器视觉和深度学习的汽车智能座舱仪表测试方法 |
CN111340040A (zh) * | 2020-02-26 | 2020-06-26 | 五八有限公司 | 一种纸张字符识别方法、装置、电子设备及存储介质 |
CN111340040B (zh) * | 2020-02-26 | 2023-09-12 | 五八有限公司 | 一种纸张字符识别方法、装置、电子设备及存储介质 |
CN111695550A (zh) * | 2020-03-26 | 2020-09-22 | 遥相科技发展(北京)有限公司 | 一种文字提取方法、图像处理设备和计算机可读存储介质 |
CN111695550B (zh) * | 2020-03-26 | 2023-12-08 | 深圳市新良田科技股份有限公司 | 一种文字提取方法、图像处理设备和计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI746674B (zh) | 識別圖像中物件的類型預測方法、裝置及電子設備 | |
CN109241962A (zh) | 一种字符识别方法及装置 | |
CN107016387B (zh) | 一种识别标签的方法及装置 | |
CN110378420A (zh) | 一种图像检测方法、装置及计算机可读存储介质 | |
CN108549870A (zh) | 一种对物品陈列进行鉴别的方法及装置 | |
CN108399386A (zh) | 饼图中的信息提取方法及装置 | |
CN109345553B (zh) | 一种手掌及其关键点检测方法、装置和终端设备 | |
CN107808120A (zh) | 眼镜定位方法、装置及存储介质 | |
CN110929617B (zh) | 一种换脸合成视频检测方法、装置、电子设备及存储介质 | |
CN109446328A (zh) | 一种文本识别方法、装置及其存储介质 | |
CN106778813B (zh) | 深度图像的自适应聚类分割算法 | |
CN109858570A (zh) | 图像分类方法及系统、计算机设备及介质 | |
CN109145846A (zh) | 材料微观结构智能识别分析系统及分析方法 | |
CN114549993A (zh) | 实验中线段图像的评分方法、系统、设备及可读存储介质 | |
CN113763348A (zh) | 图像质量确定方法、装置、电子设备及存储介质 | |
CN104679967B (zh) | 一种判断心理测试可靠性的方法 | |
CN110796039B (zh) | 一种面部瑕疵检测方法、装置、电子设备及存储介质 | |
Khodaskar et al. | Human face detection & recognition using raspberry Pi | |
US20200160090A1 (en) | Method and system for determining physical characteristics of objects | |
CN111199240A (zh) | 银行卡识别模型的训练方法、银行卡识别方法以及装置 | |
CN111310531A (zh) | 图像分类方法、装置、计算机设备及存储介质 | |
CN113591884B (zh) | 字符识别模型的确定方法、装置、设备及存储介质 | |
JP6405603B2 (ja) | 情報処理装置、情報処理システム及びプログラム | |
CN112613367A (zh) | 票据信息文本框获取方法、系统、设备及存储介质 | |
CN111753618A (zh) | 图像识别方法、装置、计算机设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190118 |