CN111639643A

CN111639643A - 字符识别方法、装置、计算机设备及存储介质

Info

Publication number: CN111639643A
Application number: CN202010441181.7A
Authority: CN
Inventors: 肖娟; 王秋阳; 郑博超; 李德民
Original assignee: Shenzhen Sunwin Intelligent Co Ltd
Current assignee: Shenzhen Sunwin Intelligent Co Ltd
Priority date: 2020-05-22
Filing date: 2020-05-22
Publication date: 2020-09-08
Anticipated expiration: 2040-05-22
Also published as: CN111639643B

Abstract

本发明涉及字符识别方法、装置、计算机设备及存储介质，该方法包括对所有字符进行分类，以得到字符信息表格；获取带有所有字符的图像，对带有所有字符的图像进行字符编码的标注，以得到训练图像、模板图像及感兴趣区域；获取待识别图像；对待识别图像进行字符检测，以得到所有字符矩形框；根据矩形框、模板图像以及感兴趣区域获取感兴趣区域内的字符矩形框，以得到感兴趣字符矩形框；根据字符矩形框对待识别图像进行处理和字符分类，以得到目标编号；以目标编号作为搜索条件在字符信息表格内进行搜索，以得到目标字符；反馈目标字符至终端。本发明实现在实际应用中只检测到感兴趣的字符，且字符的种类具有唯一的表示，简单方便，且标注的时间成本低。

Description

字符识别方法、装置、计算机设备及存储介质

技术领域

本发明涉及字符识别方法，更具体地说是指字符识别方法、装置、计算机设备及存储介质。

背景技术

近年来随着电力巡检机器人的普及，字符式仪表自动读数识别研究虽然取得了一些成绩，但是仍然存在一些问题减缓了其推广与应用。

目前，变电站的字符式仪表种类繁多，可分为四类：8字段数显字符，米字数显字符，LCD(液晶显示屏，Liquid Crystal Display)显示字符以及印刷体字符，在现有的方案中很难用一种方法将所有的字符进行检测与识别，特别是8字段数显字符的字母显示不是正常的印刷体字母显示，而是根据不同的数显管组成字符显示。但是行业也没有唯一标准规定哪一种数显管的组合方式就是表示唯一一种字母，这使得在识别过程中不能很好地进行分类。而印刷体类型字符，每个巡检点不仅仅只有待检测识别的字符，仪表上还有其他字符，如仪表编号等。那么在实际应用中，怎样才能只检测到感兴趣的字符。

在现有的针对字符识别的方案与方法中，大都是针对数字的检测与识别，并不能识别所有的字符，目前在基于深度学习的字符识别方法中，待识别的字符类别都是唯一的，即数字“0，1，2，3，4，5，6，7，8，9”，就是分成了10种类别即可。但是在数显字符中，字符的表示不只是一种，例如数字“7”与“9”分别有两种显示方式，对于识别来说，就是4种类别。另外数显的一种显示方式，可能表示两种字符，比如字符“S”与“Z”，数显上的显示都是以“三横”来表示，那么怎样才能识别出数显字符“S”与“Z”。那么对于字符识别来说，不同的种类用不用的编号即可，但是在数据标注的时候，标注信息也按着编号进行填写，如果字符类别有几百种，每次填写一个标注信息就要核对一下字符对应的编号，非常耗时。其中，数据标注是指在深度学习中，要对图像样本进行信息标注作为训练样本。比如标注字符“H0007”，那么需要在图像的字符所在区画上矩形框，标注信息就是标注字符对应的类别号，正常情况下，上述的“H0007”，标注信息为“HOO07”即可。但是对于数显字符“7”有两种显示，那么两种不同显示的数显字符“7”的标注信息上不能用同一个字符或者编号表示，则会增加标注的复杂程度和时间成本。

因此，有必要设计一种新的方法，实现在实际应用中只检测到感兴趣的字符，且字符的种类具有唯一的表示，简单方便，且标注的时间成本低。

发明内容

本发明的目的在于克服现有技术的缺陷，提供字符识别方法、装置、计算机设备及存储介质。

为实现上述目的，本发明采用以下技术方案：字符识别方法，包括：

对所有字符进行分类，以得到字符信息表格；

获取带有所有字符的图像，并对带有所有字符的图像进行字符编码的标注，以得到训练图像、模板图像以及感兴趣区域；

获取待识别图像；

对待识别图像进行字符检测，以得到所有字符矩形框；

根据所有字符矩形框、所述模板图像以及感兴趣区域获取感兴趣区域内的字符矩形框，以得到感兴趣字符矩形框；

根据所述感兴趣字符矩形框对待识别图像进行处理和字符分类，以得到目标编号；

以目标编号作为搜索条件在字符信息表格内进行搜索，以得到目标字符；

反馈所述目标字符至终端，以在终端进行显示。

其进一步技术方案为：所述对所有字符进行分类，以得到字符信息表格，包括：

对数显字符进行编码，以得到编码字符相关信息；

对特殊字符进行编码，以得到特殊字符相关信息；

整合编码字符相关信息、特殊字符相关信息、印刷体字符、LCD显示字符以及米字数显字符，以得到字符信息表格。

其进一步技术方案为：所述字符信息表格包括字符、字符编码与编号对应的表格。

其进一步技术方案为：所述获取带有所有字符的图像，并对带有所有字符的图像进行字符编码的标注，以得到训练图像、模板图像以及感兴趣区域，包括：

获取带有所有字符的图像；

对带有所有字符的图像标记出字符所在的四边框，并对四边框标注对应的字符编码，以形成训练图像、模板图像以及感兴趣区域。

其进一步技术方案为：所述对待识别图像进行字符检测，以得到所有字符矩形框，包括：

采用深度学习算法对待识别图像进行字符检测，以得到所有字符矩形框。

其进一步技术方案为：所述根据所有字符矩形框、所述模板图像以及感兴趣区域获取感兴趣区域内的字符矩形框，以得到感兴趣字符矩形框，包括：

对模板图像的特征点以及待识别图像的特征点进行提取，以得到模板图像的特征点以及待识别图像的特征点；

对模板图像的特征点以及待识别图像的特征点进行特征点匹配，以得到特征匹配对；

剔除位于所有字符矩形框之内的特征匹配对，并对剔除后的特征匹配对计算投影矩阵；

根据所述投影矩阵获取待识别的字符的感兴趣区域中心位置，以得到感兴趣区域中心位置，并计算字符矩形框的中心位置与感兴趣区域中心位置之间的距离，筛选距离满足要求的字符矩形框，以得到感兴趣字符矩形框。

其进一步技术方案为：所述根据所述感兴趣字符矩形框对待识别图像进行处理和字符分类，以得到目标编号，包括：

根据所述感兴趣字符矩形框对待识别图像进行裁剪，以得到目标图像；

采用深度学习端对端识别的方法对目标图像进行字符分类，以得到目标编号。

本发明还提供了字符识别装置，包括：

分类单元，用于对所有字符进行分类，以得到字符信息表格；

模板图像获取单元，用于获取带有所有字符的图像，并对带有所有字符的图像进行字符编码的标注，以得到训练图像、模板图像以及感兴趣区域；

待识别图像获取单元，用于获取待识别图像；

字符检测单元，用于对待识别图像进行字符检测，以得到所有字符矩形框；

字符矩形框获取单元，用于根据所有字符矩形框、所述模板图像以及感兴趣区域获取感兴趣区域内的字符矩形框，以得到感兴趣字符矩形框；

编号获取单元，用于根据所述感兴趣字符矩形框对待识别图像进行处理和字符分类，以得到目标编号；

字符获取单元，用于以目标编号作为搜索条件在字符信息表格内进行搜索，以得到目标字符；

字符反馈单元，用于反馈所述目标字符至终端，以在终端进行显示。

本发明还提供了一种计算机设备，所述计算机设备包括存储器及处理器，所述存储器上存储有计算机程序，所述处理器执行所述计算机程序时实现上述的方法。

本发明还提供了一种存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时可实现上述的方法。

本发明与现有技术相比的有益效果是：本发明通过对所有的字符进行分类，特别是对数显字符的不唯一性显示进行了唯一性编码，并将字符编码作为标注信息，且结合设定的感兴趣区域对应的特征点匹配方式将不感兴趣的字符排除在外，仅需要标注对应的字符编码即可，操作简单，实现在实际应用中只检测到感兴趣的字符，且字符的种类具有唯一的表示，简单方便，且标注的时间成本低。

下面结合附图和具体实施例对本发明作进一步描述。

附图说明

为了更清楚地说明本发明实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的字符识别方法的应用场景示意图；

图2为本发明实施例提供的字符识别方法的流程示意图；

图3为本发明实施例提供的字符识别方法的子流程示意图；

图4为本发明实施例提供的字符识别方法的子流程示意图；

图5为本发明实施例提供的字符识别方法的子流程示意图；

图6为本发明实施例提供的字符识别方法的子流程示意图；

图7为本发明实施例提供的字符识别装置的示意性框图；

图8为本发明实施例提供的字符识别装置的分类单元的示意性框图；

图9为本发明实施例提供的字符识别装置的模板图像获取单元的示意性框图；

图10为本发明实施例提供的字符识别装置的字符矩形框获取单元的示意性框图；

图11为本发明实施例提供的字符识别装置的编号获取单元的示意性框图；

图12为本发明实施例提供的计算机设备的示意性框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应当理解，当在本说明书和所附权利要求书中使用时，术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当进一步理解，在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

请参阅图1和图2，图1为本发明实施例提供的字符识别方法的应用场景示意图。图2为本发明实施例提供的字符识别方法的示意性流程图。该字符识别方法应用于服务器，该服务器与终端以及摄像头进行数据交互，通过摄像头获取待识别图像，服务器先对所有的字符进行分类，再创建模板图像，利用模板图像以及分类后形成相关表格进行字符识别，实现在实际应用中只检测到感兴趣的字符，且字符的种类具有唯一的表示，简单方便，且标注的时间成本低。

图2是本发明实施例提供的字符识别方法的流程示意图。如图2所示，该方法包括以下步骤S110至S180。

S110、对所有字符进行分类，以得到字符信息表格。

在本实施例中，字符信息表格是指所有字符按照类别进行编码或直接字符标识的方式所构成的相对应的表格。

在一实施例中，请参阅图3，上述的步骤S110可包括步骤S111～S113。

S111、对数显字符进行编码，以得到编码字符相关信息。

在本实施例中，编码字符相关信息是指数显字符编码后的表示方式。

对数显字符的每段数显管按顺序进行编号，将点亮的数显管对应的编号数字按顺序组合，形成具有唯一性的编码。为区分印刷体的数字字母，将这段编码用小括号包括起来。在实际应用中，一个数字或者字母可能会对应多个编码。但对于目标分类，编码是唯一的。

先将7段数显管进行编号，分别为1，2，3，4，5，6，7，那么将亮的数显管对应的编号取出来进行组合就形成了编码。例如数显字符0，其编码为(123567)。在实际应用中，一个数字或者字母可能会对应多个编码，例如数显字符7就有两种显示，但是编码是唯一的，一种字符“7”的编码为(1237)，另一种字符“7”的编码为(237)。

S112、对特殊字符进行编码，以得到特殊字符相关信息。

在本实施例中，特殊字符相关信息是指特殊字符编码后的表示方式。比如摄氏度符号的编码，用多字符组合的形式对其进行编码，例如摄氏度的编码为(^C)，其他特殊字符用对应的字符表示即可，如“％”，用“％”表示即可。

S113、整合编码字符相关信息、特殊字符相关信息、印刷体字符、LCD显示字符以及米字数显字符，以得到字符信息表格。

印刷体字符、LCD显示字符以及米字数显字符从特征上没有多大区别，都可看成是印刷体字符，可直接用对应的字符表示即可，不需要用其他方式进行编码。

最后生成字符、字符编码与编号对应表，用于分类建模以及标注信息。

在本实施例中，所述字符信息表格包括字符、字符编码与编号对应的表格。

其中字符是指印刷体字符0-9，a-z，A-Z，数显字符0-9，a-z，A-Z，以及特殊符号(如：“：”，“.”,“％”，“℃”等)。字符编码是上述所说的对每个字符进行对应的编码，编号是按顺序对每个字符的编码进行编号，即0，1，2，3...。因为一个字符可能对应多个编码，所以这里的编号是按照编码的顺序进行，编码是唯一的，所以此处的编号也是唯一的。在本实施例中最终分类有137种字符。

对电力仪表中的所有相关的数字、字母、特殊符号进行了整体方案的设计，特别是针对数显字符的不唯一性显示进行了唯一性编码，那么在字符识别过程中最终分类结果也具有了唯一性的编号，同时也解决了在实际应用中会有不感兴趣字符也被检测到的问题。

S120、获取带有所有字符的图像，并对带有所有字符的图像进行字符编码的标注，以得到训练图像、模板图像以及感兴趣区域。

在本实施例中，训练图像是用来作为深度学习的训练样本以及测试样本，并且将字符所在位置画出来。模板图像是指在应用中根据实际应用在现场选择一张字符端正，没有倾斜，字符大小合适且清晰的图像作为模板图像，并将所有字符的位置画出来，并将位置信息以及目标字符的个数保存到对应的配置文件中。

在一实施例中，请参阅图4，上述的步骤S120可包括步骤S121～S122。

S121、获取带有所有字符的图像；

S122、对带有所有字符的图像标记出字符所在的四边框，并对四边框标注对应的字符编码，以形成训练图像、模板图像以及感兴趣区域。

对带有所有字符的图像中的所有字符画出按字符表示的意义标注矩形框或者任意四边形，其对应的标注信息为字符编码。

在各种字符仪表中，有的字符和字符之前的距离比较远，但是其表示的意义是应该合在一起，例如H 0001，H与数字0001隔的距离比较远，但是表示的意义是一个整体，所以标注的时候应该用一个矩形框进行标注。

上述标注的图像还可以作为训练深度学习算法的训练数据。

具体地，对于模板图像而言，对每个巡检点保存一张模板图像，并对模板图像进行ROI(感兴趣区域，region of interest)区域标注。首先，在每个巡检点选择一张待识别的字符清晰，且字符没有倾斜的图片作为模板图像。其次标注待识别的字符的ROI区域，此区域包含了所有待识别的字符，不包含其他相似且不感兴趣的字符。将模板图像、标注的信息以及当前待识别字符的行数n按巡检点保存在文件中，如果当前巡检点待识别的字符行数是3，则n＝3。标注的信息是指上述的字符编码。

S130、获取待识别图像。

在本实施例中，待识别图像是指摄像头拍摄所得的现场的图像。

S140、对待识别图像进行字符检测，以得到所有字符矩形框。

在本实施例中，所有字符矩形框是指包含字符的四边框。

具体地，采用深度学习算法对待识别图像进行字符检测，以得到所有字符矩形框。

采用深度学习的方法进行字符检测，得到所有字符的矩形框，在本实施例中采用Advanced EAST(场景图像文本检测，EAST:An Efficient and Accurate Scene TextDetector)方法进行字符检测。

S150、根据所有字符矩形框、所述模板图像以及感兴趣区域获取感兴趣区域内的字符矩形框，以得到感兴趣字符矩形框。

在本实施例中，感兴趣字符矩形框是指在设定的感兴趣区域内的字符所在的矩形框，也就是说仅仅落入在感兴趣区域内的字符矩形框，以去除其他不感兴趣的地方，避免在实际应用中会有不感兴趣字符也被检测到的问题。

在一实施例中，请参阅图5，上述的步骤S150可包括步骤S151～S154。

S151、对模板图像的特征点以及待识别图像的特征点进行提取，以得到模板图像的特征点以及待识别图像的特征点。

具体地，利用ORB(快速特征点提取和描述的算法，Oriented FAST and RotatedBRIEF)特征提取的方法获取模板图像与当前待识别图像的特征点。

S152、对模板图像的特征点以及待识别图像的特征点进行特征点匹配，以得到特征匹配对。

在本实施例中，特征匹配对是指待识别图像以及模板图像内两个特征点相似度满足要求的特征点组合。

特征的匹配是针对特征描述子进行的，特征描述子通常是一个向量，两个特征描述子的之间的距离可以反应出其相似的程度，也就是这两个特征点是不是同一个。根据特征描述子的不同，可以选择不同的距离度量。如果是浮点类型的特征描述子，可以使用其欧式距离；对于二进制的特征描述子可以使用其汉明距离，即两个不同二进制之间的汉明距离指的是两个二进制串不同位的个数。

有了计算描述子相似度的方法，那么在特征点的集合中如何寻找和其最相似的特征点，这就是特征点的匹配了。具体可用下述方法进行匹配：

暴力匹配方法，即计算某一个特征点描述子与其他所有特征点描述子之间的距离，然后将得到的距离进行排序，取距离最近的一个作为匹配点；

过滤错误匹配方法；

汉明距离小于最小距离的两倍，即选择已经匹配的点对的汉明距离小于最小距离的两倍作为判断依据，如果小于该值则认为是一个错误的匹配，过滤掉；大于该值则认为是一个正确的匹配；

交叉匹配，即交叉过滤的是想很简单，再进行一次匹配，反过来使用被匹配到的点进行匹配，如果匹配到的仍然是第一次匹配的点的话，就认为这是一个正确的匹配。举个例子，假如第一次特征点A使用暴力匹配的方法，匹配到的特征点是特征点B；反过来，使用特征点B进行匹配，如果匹配到的仍然是特征点A，则就认为这是一个正确的匹配，否则就是一个错误的匹配。

KNN匹配，即K近邻匹配，在匹配的时候选择K个和特征点最相似的点，如果这K个点之间的区别足够大，则选择最相似的那个点作为匹配点，通常选择K＝2，也就是最近邻匹配。对每个匹配返回两个最近邻的匹配，如果第一匹配和第二匹配距离比率足够大，即向量距离足够远，则认为这是一个正确的匹配，比率的阈值通常在2左右。

随机采样一致性方法，该方法利用匹配点计算两个图像之间单应矩阵，然后利用重投影误差来判定某一个匹配是不是正确的匹配。

计算待识别图像的特征点以及模板图像的特征点的相似度，以得到相似度集合；筛选相似度集合中不低于设定阈值的相似度所对应的待识别图像的特征点以及模板图像的特征点，以形成特征匹配对。

在本实施例中，相似度集合是指待识别图像的所有特征点以及模板图像的所有特征点的相似度组成的一个集合。

通过knnMatch(K最近邻匹配，k-Nearest Neighbor Match)算法进行特征点匹配，得到特征点匹配对。在实际应用往往会存在错误匹配对，这些错误的匹配对带入最终的运动模型当中，会引起很大的误差，因此需使用ransac(随机抽样一致，RANdom SAmpleConsensus)算法进行错误匹配对的剔除。

S153、剔除位于所有字符矩形框之内的特征匹配对，并对剔除后的特征匹配对计算投影矩阵。

在本实施例中，投影矩阵是指特征匹配对投影变换所得的矩阵。在实际应用中，因为字符是随着时间变化的，那么字符对应的特征点位置信息也会产生变化，所以需将他们的特征点删除。

S154、根据所述投影矩阵获取待识别的字符的感兴趣区域中心位置，以得到感兴趣区域中心位置，并计算字符矩形框的中心位置与感兴趣区域中心位置之间的距离，筛选距离满足要求的字符矩形框，以得到感兴趣字符矩形框。

从文件中获取待识别点对应的模板图像以及感兴趣区域的坐标。然后获取模板图像以及待识别图像的特征点，并进行特征点匹配，获得特征匹配对；把落在待识别的字符区域的匹配对去除，求剩下的匹配对的投影矩阵；根据投影矩阵获得当前图像的中识别字符的ROI区域的中心位置R1，最后求当前图像中所有字符矩形框的中心位置到R1的距离，取最近的n个作为待识别字符的矩形框，也就是字符矩形框。

S160、根据所述感兴趣字符矩形框对待识别图像进行处理和字符分类，以得到目标编号。

在本实施例中，目标编号是指待识别字符的编号。

在一实施例中，请参阅图6，上述的步骤S160可包括步骤S161～S162。

S161、根据所述感兴趣字符矩形框对待识别图像进行裁剪，以得到目标图像。

在本实施例中，目标图像是指仅具备待识别且感兴趣的字符的图像。

S162、采用深度学习端对端识别的方法对目标图像进行字符分类，以得到目标编号。

感兴趣字符矩形框内的每一行字符的识别采用深度学习端对端的方法进行识别，对字符的识别实际上也就是分类，所以最终的分类输出为字符相关表格内的编号。在本实施例中采用的深度学习端对端的识别方法是CRNN(卷积循环神经网络，ConvolutionalRecurrent Neural Network)，主要用于端到端地对不定长的文本序列进行识别，不用先对单个文字进行切割，而是将文本识别转化为时序依赖的序列学习问题，就是基于图像的序列识别。

该CRNN是通过上述的训练图像或者带有上述的字符信息表格内容的标注的图像作为训练数据训练所得的。

S170、以目标编号作为搜索条件在字符信息表格内进行搜索，以得到目标字符。

根据目标编号以及字符信息表格，找到对应的字符，输出最终的字符识别结果。最终结果只检测到待识别的字符，其他字符已经排除在外。特别是如果输出的字符是一种显示两种字符，要根据实际表示的意义选择对应的字符作为最终输出结果。

S180、反馈所述目标字符至终端，以在终端进行显示。

首先用编码的方式对8字段数显字符进行编码，将编码作为标注信息，标注信息对应的编号作为深度学习的最终输出的字符类别号。对于两种不同的字符同一种显示，对于识别来说是一种类别，但是有了字符，编码，编号对应表，可以根据现场数显字符实际表示的意义输出对应的字符即可。再采用ROI(感兴趣区域，region of interest)区域特征点匹配的方法将其他字符排除，只获得巡检点感兴趣区域的字符。

上述的字符识别方法，通过对所有的字符进行分类，特别是对数显字符的不唯一性显示进行了唯一性编码，并将字符编码作为标注信息，且结合设定的感兴趣区域对应的特征点匹配方式将不感兴趣的字符排除在外，仅需要标注对应的字符编码即可，操作简单，实现在实际应用中只检测到感兴趣的字符，且字符的种类具有唯一的表示，简单方便，且标注的时间成本低。

图7是本发明实施例提供的一种字符识别装置300的示意性框图。如图7所示，对应于以上字符识别方法，本发明还提供一种字符识别装置300。该字符识别装置300包括用于执行上述字符识别方法的单元，该装置可以被配置于服务器中。具体地，请参阅图7，该字符识别装置300包括分类单元301、模板图像获取单元302、待识别图像获取单元303、字符检测单元304、字符矩形框获取单元305、编号获取单元306、字符获取单元307以及字符反馈单元308。

分类单元301，用于对所有字符进行分类，以得到字符信息表格；模板图像获取单元302，用于获取带有所有字符的图像，并对带有所有字符的图像进行字符编码的标注，以得到训练图像、模板图像以及感兴趣区域；待识别图像获取单元303，用于获取待识别图像；字符检测单元304，用于对待识别图像进行字符检测，以得到所有字符矩形框；字符矩形框获取单元305，用于根据所有字符矩形框、所述模板图像以及感兴趣区域获取感兴趣区域内的字符矩形框，以得到感兴趣字符矩形框；编号获取单元306，用于根据所述感兴趣字符矩形框对待识别图像进行处理和字符分类，以得到目标编号；字符获取单元307，用于以目标编号作为搜索条件在字符信息表格内进行搜索，以得到目标字符；字符反馈单元308，用于反馈所述目标字符至终端，以在终端进行显示。

具体地，上述的字符检测单元304，用于采用深度学习算法对待识别图像进行字符检测，以得到所有字符矩形框。

在一实施例中，如图8所示，所述分类单元301包括第一编码子单元3011、第二编码子单元3012以及整合子单元3013。

第一编码子单元3011，用于对数显字符进行编码，以得到编码字符相关信息；

第二编码子单元3012，用于对特殊字符进行编码，以得到特殊字符相关信息；

整合子单元3013，用于整合编码字符相关信息、特殊字符相关信息、印刷体字符、LCD显示字符以及米字数显字符，以得到字符信息表格。

在一实施例中，如图9所示，所述模板图像获取单元302包括获取子单元3021以及标记子单元3022。

获取子单元3021，用于获取带有所有字符的图像；标记子单元3022，用于对带有所有字符的图像标记出字符所在的四边框，并对四边框标注对应的字符编码，以形成训练图像、模板图像以及感兴趣区域。

在一实施例中，如图10所示，所述字符矩形框获取单元305包括提取子单元3051、匹配子单元3052、剔除子单元3053以及计算子单元3054。

提取子单元3051，用于对模板图像的特征点以及待识别图像的特征点进行提取，以得到模板图像的特征点以及待识别图像的特征点；匹配子单元3052，用于对模板图像的特征点以及待识别图像的特征点进行特征点匹配，以得到特征匹配对；剔除子单元3053，用于剔除位于所有字符矩形框之内的特征匹配对，并对剔除后的特征匹配对计算投影矩阵；计算子单元3054，用于根据所述投影矩阵获取待识别的字符的感兴趣区域中心位置，以得到感兴趣区域中心位置，并计算字符矩形框的中心位置与感兴趣区域中心位置之间的距离，筛选距离满足要求的字符矩形框，以得到感兴趣字符矩形框。

在一实施例中，如图11所示，所述编号获取单元306包括裁剪子单元3061以及分类子单元3062。

裁剪子单元3061，用于根据所述感兴趣字符矩形框对待识别图像进行裁剪，以得到目标图像；分类子单元3062，用于采用深度学习端对端识别的方法对目标图像进行字符分类，以得到目标编号。

需要说明的是，所属领域的技术人员可以清楚地了解到，上述字符识别装置300和各单元的具体实现过程，可以参考前述方法实施例中的相应描述，为了描述的方便和简洁，在此不再赘述。

上述字符识别装置300可以实现为一种计算机程序的形式，该计算机程序可以在如图12所示的计算机设备上运行。

请参阅图12，图12是本申请实施例提供的一种计算机设备的示意性框图。该计算机设备500可以是服务器，其中，服务器可以是独立的服务器，也可以是多个服务器组成的服务器集群。

参阅图12，该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505，其中，存储器可以包括非易失性存储介质503和内存储器504。

该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032包括程序指令，该程序指令被执行时，可使得处理器502执行一种字符识别方法。

该处理器502用于提供计算和控制能力，以支撑整个计算机设备500的运行。

该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境，该计算机程序5032被处理器502执行时，可使得处理器502执行一种字符识别方法。

该网络接口505用于与其它设备进行网络通信。本领域技术人员可以理解，图12中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备500的限定，具体的计算机设备500可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

其中，所述处理器502用于运行存储在存储器中的计算机程序5032，以实现如下步骤：

对所有字符进行分类，以得到字符信息表格；获取带有所有字符的图像，并对带有所有字符的图像进行字符编码的标注，以得到训练图像、模板图像以及感兴趣区域；获取待识别图像；对待识别图像进行字符检测，以得到所有字符矩形框；根据所有字符矩形框、所述模板图像以及感兴趣区域获取感兴趣区域内的字符矩形框，以得到感兴趣字符矩形框；根据所述感兴趣字符矩形框对待识别图像进行处理和字符分类，以得到目标编号；以目标编号作为搜索条件在字符信息表格内进行搜索，以得到目标字符；反馈所述目标字符至终端，以在终端进行显示。

在一实施例中，处理器502在实现所述对所有字符进行分类，以得到字符信息表格步骤时，具体实现如下步骤：

对数显字符进行编码，以得到编码字符相关信息；对特殊字符进行编码，以得到特殊字符相关信息；整合编码字符相关信息、特殊字符相关信息、印刷体字符、LCD显示字符以及米字数显字符，以得到字符信息表格。

其中，所述字符信息表格包括字符、字符编码与编号对应的表格。

在一实施例中，处理器502在实现所述获取带有所有字符的图像，并对带有所有字符的图像进行字符编码的标注，以得到训练图像、模板图像以及感兴趣区域步骤时，具体实现如下步骤：

获取带有所有字符的图像；对带有所有字符的图像标记出字符所在的四边框，并对四边框标注对应的字符编码，以形成训练图像、模板图像以及感兴趣区域。

在一实施例中，处理器502在实现所述对待识别图像进行字符检测，以得到所有字符矩形框步骤时，具体实现如下步骤：

在一实施例中，处理器502在实现所述根据所有字符矩形框、所述模板图像以及感兴趣区域获取感兴趣区域内的字符矩形框，以得到感兴趣字符矩形框步骤时，具体实现如下步骤：

对模板图像的特征点以及待识别图像的特征点进行提取，以得到模板图像的特征点以及待识别图像的特征点；对模板图像的特征点以及待识别图像的特征点进行特征点匹配，以得到特征匹配对；剔除位于所有字符矩形框之内的特征匹配对，并对剔除后的特征匹配对计算投影矩阵；根据所述投影矩阵获取待识别的字符的感兴趣区域中心位置，以得到感兴趣区域中心位置，并计算字符矩形框的中心位置与感兴趣区域中心位置之间的距离，筛选距离满足要求的字符矩形框，以得到感兴趣字符矩形框。

在一实施例中，处理器502在实现所述根据所述感兴趣字符矩形框对待识别图像进行处理和字符分类，以得到目标编号步骤时，具体实现如下步骤：

根据所述感兴趣字符矩形框对待识别图像进行裁剪，以得到目标图像；采用深度学习端对端识别的方法对目标图像进行字符分类，以得到目标编号。

应当理解，在本申请实施例中，处理器502可以是中央处理单元(CentralProcessing Unit，CPU)，该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中，通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成。该计算机程序包括程序指令，计算机程序可存储于一存储介质中，该存储介质为计算机可读存储介质。该程序指令被该计算机系统中的至少一个处理器执行，以实现上述方法的实施例的流程步骤。

因此，本发明还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序，其中该计算机程序被处理器执行时使处理器执行如下步骤：

在一实施例中，所述处理器在执行所述计算机程序而实现所述对所有字符进行分类，以得到字符信息表格步骤时，具体实现如下步骤：

在一实施例中，所述处理器在执行所述计算机程序而实现所述获取带有所有字符的图像，并对带有所有字符的图像进行字符编码的标注，以得到训练图像、模板图像以及感兴趣区域步骤时，具体实现如下步骤：

在一实施例中，所述处理器在执行所述计算机程序而实现所述对待识别图像进行字符检测，以得到所有字符矩形框步骤时，具体实现如下步骤：

在一实施例中，所述处理器在执行所述计算机程序而实现所述根据所有字符矩形框、所述模板图像以及感兴趣区域获取感兴趣区域内的字符矩形框，以得到感兴趣字符矩形框步骤时，具体实现如下步骤：

在一实施例中，所述处理器在执行所述计算机程序而实现所述根据所述感兴趣字符矩形框对待识别图像进行处理和字符分类，以得到目标编号步骤时，具体实现如下步骤：

所述存储介质可以是U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

在本发明所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的。例如，各个单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。

本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以是两个或两个以上单元集成在一个单元中。

该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，终端，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.字符识别方法，其特征在于，包括：

对所有字符进行分类，以得到字符信息表格；

获取待识别图像；

对待识别图像进行字符检测，以得到所有字符矩形框；

反馈所述目标字符至终端，以在终端进行显示。

2.根据权利要求1所述的字符识别方法，其特征在于，所述对所有字符进行分类，以得到字符信息表格，包括：

对数显字符进行编码，以得到编码字符相关信息；

对特殊字符进行编码，以得到特殊字符相关信息；

3.根据权利要求2所述的字符识别方法，其特征在于，所述字符信息表格包括字符、字符编码与编号对应的表格。

4.根据权利要求3所述的字符识别方法，其特征在于，所述获取带有所有字符的图像，并对带有所有字符的图像进行字符编码的标注，以得到训练图像、模板图像以及感兴趣区域，包括：

获取带有所有字符的图像；

5.根据权利要求1所述的字符识别方法，其特征在于，所述对待识别图像进行字符检测，以得到所有字符矩形框，包括：

6.根据权利要求1所述的字符识别方法，其特征在于，所述根据所有字符矩形框、所述模板图像以及感兴趣区域获取感兴趣区域内的字符矩形框，以得到感兴趣字符矩形框，包括：

7.根据权利要求1所述的字符识别方法，其特征在于，所述根据所述感兴趣字符矩形框对待识别图像进行处理和字符分类，以得到目标编号，包括：

8.字符识别装置，其特征在于，包括：

待识别图像获取单元，用于获取待识别图像；

9.一种计算机设备，其特征在于，所述计算机设备包括存储器及处理器，所述存储器上存储有计算机程序，所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的方法。

10.一种存储介质，其特征在于，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时可实现如权利要求1至7中任一项所述的方法。