CN109977935A

CN109977935A - 一种文本识别方法及装置

Info

Publication number: CN109977935A
Application number: CN201910146626.6A
Authority: CN
Inventors: 许洋; 刘鹏; 王健宗
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2019-02-27
Filing date: 2019-02-27
Publication date: 2019-07-05
Anticipated expiration: 2039-02-27
Also published as: CN109977935B; WO2020173008A1

Abstract

本发明公开了一种文本识别方法和装置，其中，所述方法包括：根据预设的锚点区域及其对应的文本区域，生成图片识别模板；所述锚点区域与所述文本区域存在位置对应关系，所述文本区域包括定义了文本含义的文本信息；在目标图片匹配有所述图片识别模板的锚点区域的情况下，通过所述图片识别模板中所述锚点区域与所述文本区域的位置对应关系，确定所述目标图片中进行识别的目标文本区域；根据定义的所述文本含义得到所述目标文本区域中文本信息的文本含义。采用本发明实施例，可以快速高效地获得待识别图片中文本信息的文本含义。

Description

一种文本识别方法及装置

技术领域

本发明涉及计算机技术领域，尤其涉及一种文本识别方法及装置。

背景技术

目前，常见的光学字符识别业务分为两种：通用OCR和特定场景的OCR。在理论上，通用OCR可以识别出图片包含的所有字符，然而它的识别精度低；由于通用OCR本身的特性，不能获得图片中字符的具体含义。虽然特定场景的OCR针对特定图片的识别效果优于通用OCR，而且可以获得图中字符的含义，但是特定场景的OCR仅支持包含指定文本载体的图片(例如包含身份证、驾驶证或者增值税发票等内容的图片)，并且使用特定场景的OCR需要针对目标类型的图片进行模板的定制，并需要根据大量该类型图片进行模型的训练，导致生成模板的周期较长。同时，文本载体种类丰富，制作多个识别模板囊括多种文本载体的成本过高，而且有些识别模板市场需求量低，导致成本回收困难。

因此，如何快速有效地识别待识别图片中文本载体的文本含义，是本发明需要解决的问题。

发明内容

本发明实施例提供一种文本识别方法及装置，可以快速有效地识别待识别图片中文本载体的文本含义。

第一方面，本发明实施例提供了一种文本识别方法，该方法包括：

根据预设的锚点区域及其对应的文本区域，生成图片识别模板；所述锚点区域与所述文本区域存在位置对应关系，所述文本区域包括定义了文本含义的文本信息；

在目标图片匹配有所述图片识别模板的锚点区域的情况下，通过所述图片识别模板中所述锚点区域与所述文本区域的位置对应关系，确定所述目标图片中进行识别的目标文本区域；

根据定义的所述文本含义得到所述目标文本区域中文本信息的文本含义。

实施本发明实施例，通过结合通用OCR识别以及特定场景OCR识别的特性，利用预先定义好的锚点区域选择图片识别模板，然后根据确定的锚点区域进行目标文本区域的定位，还可以进行图像的矫正；结合预先设定的文本含义获得目标图片中目标文本区域内的文本含义，既解决通用OCR识别不能获得图片文本含义的问题，同时也免去了对特定文本载体的深度定制以及大量该文本载体训练数据的需求，利用较短的开发周期支持没有现成模板的样式，又能快速地获得具有一定规律和形式的文本含义。

在一种可能的实现方式中，所述在目标图片匹配有所述图片识别模板的锚点区域的情况下，通过所述图片识别模板中所述锚点区域与所述文本区域的位置对应关系，确定所述目标图片中进行识别的目标文本区域之前，还包括：根据通用光学字符识别OCR识别所述目标图片，确认所述目标图片的文本信息；通过判断所述目标图片的文本信息是否匹配有所述图片识别模板的锚点区域。

在一种可能的实现方式中，当生成有多个图片识别模板的情况下，所述在目标图片匹配有所述图片识别模板的锚点区域的情况下，通过所述图片识别模板中所述锚点区域与所述文本区域的位置对应关系，确定所述目标图片中进行识别的目标文本区域，包括：根据通用光学字符识别OCR识别所述目标图片，确认所述目标图片的文本信息；从所述多个图片识别模板中找到目标图片识别模板的锚点区域匹配所述目标图片；通过所述目标图片识别模板中所述锚点区域与所述文本区域的位置对应关系，确定所述目标图片中进行识别的目标文本区域。

在一种可能的实现方式中，所述目标图片匹配有所述图片识别模板的锚点区域之后，还包括：判断所述目标图片是否需要进行图像矫正；若所述目标图片需要进行图像矫正，则对所述目标图片进行图像矫正。

在一种可能的实现方式中，所述根据定义的所述文本含义得到所述目标文本区域中文本信息的文本含义，包括：在所述目标文本区域与所述目标图片识别模板的文本区域的重合率达到预设值的情况下，确认所述目标文本区域中文本信息的含义。

第二方面，本发明实施例提供了一种文本识别装置，该装置包括：

生成单元，用于根据预设的锚点区域及其对应的文本区域，生成图片识别模板；所述锚点区域与所述文本区域存在位置对应关系，所述文本区域包括定义了文本含义的文本信息；

定位单元，用于在目标图片匹配有所述图片识别模板的锚点区域的情况下，通过所述图片识别模板中所述锚点区域与所述文本区域的位置对应关系，确定所述目标图片中进行识别的目标文本区域；

读取单元，用于根据定义的所述文本含义得到所述目标文本区域中文本信息的文本含义。

在一种可能的实现方式中，所述装置还包括：匹配单元，用于在所述定位单元在目标图片匹配有所述图片识别模板的锚点区域的情况下，通过所述图片识别模板中所述锚点区域与所述文本区域的位置对应关系，确定所述目标图片中进行识别的目标文本区域之前，根据通用光学字符识别OCR识别所述目标图片，确认所述目标图片的文本信息；通过判断所述目标图片的文本信息是否匹配有所述图片识别模板的锚点区域。

在一种可能的实现方式中，在生成有多个图片识别模板的情况下，所述定位单元还用于：根据通用光学字符识别OCR识别所述目标图片，确认所述目标图片的文本信息；从所述多个图片识别模板中找到目标图片识别模板的锚点区域匹配所述目标图片；通过所述目标图片识别模板中所述锚点区域与所述文本区域的位置对应关系，确定所述目标图片中进行识别的目标文本区域。

在一种可能的实现方式中，所述装置还包括:矫正单元，用于判断所述目标图片是否需要进行图像矫正；若所述目标图片需要进行图像矫正，则对所述目标图片进行图像矫正。

在一种可能的实现方式中，所述读取单元具体用于在所述目标文本区域与所述目标图片识别模板的文本区域的重合率达到预设值的情况下，确认所述目标文本区域中文本信息的含义。

第三方面，本发明实施例提供了一种网络设备，包括处理器和存储器，所述处理器和所述存储器相互连接，其中，所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行第一方面所述的方法。

第四方面，本发明实施例提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行第一方面所述的方法。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍。

图1是本发明实施例提供的一种文本识别的系统架构示意图；

图2是本发明实施例提供的一种文本识别方法的流程示意图；

图3是本发明实施例提供的一种透视变换示意图；

图4是本发明实施例提供的一种文本识别装置的结构示意图；

图5是本发明实施例提供的一种网络设备的结构示意图。

具体实施方式

本发明说明书、权利要求书和附图中出现的术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。此外，术语“第一”、“第二”和“第三”等是用于区别不同的对象，而并非用于描述特定的顺序。下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行描述。

首先，对本发明中的部分用语进行解释说明，以便于本领域技术人员理解。

(1)光学字符识别(Optical Character Recognition，OCR)，是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程；即，针对印刷体字符，采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件，并通过识别软件将图像中的文字转换成文本格式，供文字处理软件进一步编辑加工的技术。如何除错或利用辅助信息提高识别正确率，是OCR最重要的课题，ICR(Intelligent Character Recognition)的名词也因此而产生。衡量一个OCR系统性能好坏的主要指标有：拒识率、误识率、识别速度、用户界面的友好性，产品的稳定性，易用性及可行性等。

(2)透视变换(Perspective Transformation),是指利用透视中心、像点、目标点三点共线的条件，按透视旋转定律使承影面(透视面)绕迹线(透视轴)旋转某一角度，破坏原有的投影光线束，仍能保持承影面上投影几何图形不变的变换。

下面先对本发明实施例所基于的其中一种系统架构进行描述，本发明提出的文本识别方法可以应用于该系统架构。请参见图1，图1是本发明实施例提供的一种文本识别的系统架构示意图，如图1所示，该系统架构包含了终端、目标图片和文本含义；本发明实施例中提及的终端可为手机、平板电脑、笔记本电脑、掌上电脑、移动互联网设备或其他移动终端；其中，

终端，可以是计算机网络中处于网络最外围的设备，也可以用于信息的输入以及处理结果的输出等。也可以称为系统、用户单元、用户站、移动站、移动台、远方站、远程终端、移动设备、用户终端、移动终端、无线通信设备、用户代理、用户装置、可安装插件的服务设备或用户设备(user equipment，UE)。例如，终端可以是蜂窝电话、移动电话、无绳电话、智能手表、可穿戴设备(wearable device)、平板设备、会话启动协议(session initiationprotocol，SIP)电话、无线本地环路(wireless local loop，WLL)站、个人数字助手(personal digital assistant，PDA)、具备无线通信功能的手持设备、计算设备、车载通信模块、智能电表或连接到无线调制解调器的其它处理设备。

目标图片，是需要识别出文本含义的图片；图片中包括了文本载体。其中，文本载体为文本信息的实物载体。获得目标图片中文本信息的含义是本发明实施例的目的。图片类型可以包括身份证照片、发票照片、驾驶证照片等；图中以身份证照片为目标图片为例进行说明，身份证照片中的身份证为文本载体，姓名和身份证号码为文本信息；通过本发明实施例识别能够得到文本含义，即通过识别目标图片，直接获得了该身份证拥有人的姓名以及该拥有人的身份证号码。

文本含义，是通过本发明实施例识别，期望获得的目标图片中文本信息的实际含义。识别出的文本含义不仅是一串数字或者字符，同时还反映该数字或者字符表达的内容。例如，从企业的发票照片中识别出该企业的统一社会信用代码。

可以理解的是，图1所示的内容只是本发明实施例中的一种示例性的实施方式。本发明实施例中的系统架构可以包括但不仅限于以上系统架构。

下面结合上述系统架构和本发明中提供的文本识别方法的实施例，对本发明中提出的技术问题进行具体分析和解决。

请参见图2，图2是本发明实施例提供的一种文本识别方法的流程示意图，文本识别方法可以应用于文本识别系统(包括上述架构)。下面将结合图2，以终端为执行主体为例，从单侧进行描述，该方法可以包括以下步骤S201-步骤S204；其中，可选的步骤可以包括步骤S202。

步骤S201：根据预设的锚点区域及其对应的文本区域，生成图片识别模板。

具体地，在生成一个图片识别模板的情况下，预设模板的锚点区域以及对应的文本区域，生成相应的识别模板。模板的锚点区域可以是一个或者多个。所述锚点区域与所述文本区域存在位置对应关系，所述文本区域包括定义了文本含义的文本信息。在生成多个图片识别模板的情况下，根据预设的锚点区域和预设的文本区域，分别生成M个图片识别模板，M为大于0的整数。其中，每个图片识别模板都有相应的锚点区域和文本区域，本发明对图片识别模板的锚点区域以及文本区域数量不做限定。

在一种可能的实现方式中，根据M张标准图片生成所述M个图片识别模板。以身份证图片为例，身份证图片识别模板的标准图片中，图片清晰且没有严重的形变，符合以其为识别标准对其他目标图片进行识别的要求。

在一种可能的实现方式中，锚点区域可以包括文本区域内若干个文字或者若干个符号等文本内容，比如：增值税发票的“增值税专用发票”，身份证的“姓名”，行驶证的“中华人民共和国机动车行驶证”等。可以理解的是，预设的锚点区域可以为一个或者多个；预设多个分散的锚点区域有利于准确定位目标文本区域。

在一种可能的实现方式中，文本区域可以包括文本所在的区域；文本区域形状可以由用户选择和设置；可以理解的是，预设的文本区域数量可以为一个或者多个；在图片识别模板中，预先设定的文本区域内的文本含义，比如文本载体为银行卡的图片识别模板中目标文本区域内的16位至19位数字代表该银行卡的卡号，目标文本区域内的汉字“XXXX银行”代表银行名称等。

为了便于理解本发明实施例，以下示例性列举本发明中文本识别方法所应用的场景，下面以生成用于识别身份证的图片识别模板为例进行描述。

首先，在一张标准身份证图片上，由用户选择锚点区域，比如“姓名”所在的区域和“公民身份号码”所在的区域；其中，所述标准身份证图片，包括清晰度、形变程度符合识别要求的模板图片；可以理解的是，每个锚点区域至少需要包括关键文本内容，如“姓名”区域需要包含了“姓名”字符；预设的锚点区域大小、形状为合理的，比如锚点区域的形状可以是合适大小的矩形，即该矩形区域至少包括了目标文本，但不会过大而导致包括了其他不必要的字符等文本内容。

其次，由用户选择文本区域，并可以由用户设置文本区域内的文本含义。可以理解的是，在用户选择目标文本区域之后，确认目标文本区域相对于锚点区域的位置。

最后，在设置锚点区域和设置目标文本区域之后，生成相应的图片识别模板并保存所述图片识别模板。

可以理解的是，上述的应用场景只是本发明实施例中的示例性的实施方式，本发明实施例中的应用场景包括但不仅限于以上应用场景。

步骤S202：根据通用光学字符识别OCR识别所述目标图片，确认所述目标图片的文本信息；通过判断所述目标图片的文本信息是否匹配有所述图片识别模板的锚点区域。

具体地，利用通用光学字符识别目标图片中的文本信息；根据获得目标图片的文本信息，判断其文本信息是否与图片识别模板的锚点区域中文本信息是否一致。以身份证识别为例，通过通用OCR识别获得目标图片中所有的文字或者字符的信息以及相对位置；以识别出特定位置的“姓名”和“身份证号码”去匹配图片识别模板的锚点区域，判断模板的锚点区域内是否有相同的信息。

步骤S203：在目标图片匹配有所述图片识别模板的锚点区域的情况下，通过所述图片识别模板中所述锚点区域与所述文本区域的位置对应关系，确定所述目标图片中进行识别的目标文本区域。

具体地，根据所述目标图片的锚点区域匹配所述M个图片识别模板的锚点区域；如果目标锚点区域与M个图片识别模板中的某一个图片识别模板的锚点区域匹配，则确认该图片识别模板识别该目标图片，否则判断没有合适的图片识别模板可以识别。如果只有一个图片识别模板，根据唯一的图片识别模板匹配目标图片，判断是否可以进行识别。可以理解的是，匹配的过程可以包括检测锚点区域内信息是否一致，检测锚点区域大小是否一致等。

为了便于理解本发明实施例，以下示例性列举本发明中文本识别方法所应用的场景，下面以识别身份证的识别模板为例进行描述。

在保存的M个图片识别模板中，用于识别身份证的图片识别模板的锚点区域1为包含“姓名”的区域，锚点区域2为包含“公民身份号码”的区域；当目标图片是文本载体为身份证的图片，且目标图片中的文本信息包括了“姓名”和“公民身份号码”的情况下，确定该图片识别模板进行图像识别，并进行后续操作。否则，结束识别操作。在确定了前述图片识别模板能够识别目标图片(即前述图片识别模板匹配该目标图片)之后，可以对目标图片进行图像矫正。可以理解，矫正图片的方法可以包括矫正目标图片的形变、矫正目标图片的清晰度等。可以理解的是，在图像矫正之前，可以判断待识别的目标图片是否需要进行图片矫正。若所述目标文本区域与所述目标模板的文本区域的重合率达到预设值，确认所述目标文本区域中文本信息的含义是，所述重合率用于反映所述目标文本区域与所述目标模板的文本区域的重合程度。

在一种可能的实现方式中，在目标图片经过通用光学字符识别OCR识别之后，获得目标图片的文本信息；根据M个图片识别模板中的每一个模板预设的锚点区域检测是否文本信息中的关键文本域锚点区域的文本信息匹配。其中，文本信息可以包括文字、符号、文字或者符号在目标图中的位置等。

在一种可能的实现方式中，图片识别模板的锚点区域与目标图片的目标锚点区域的重合率超过预设的数值(比如90％)，判断该图片识别模板可以识别该目标图片。

可选地，图像矫正方法中改变图片形变的方法，可以包括透视变换、仿射变换等；其中，透视变换的具体步骤可以包括：通过选取的点进行透视变换；或者，通过霍夫变换确定文本载体的边界，再进行透视变换。由于对文本载体拍摄的照片都存在一定角度的透视从而对载体造成形变，将这些透视形变还原(即通过将原图投影到新的正向的视平面上)能够比较好地确定将目标文本区域。

以通过选取的点进行透视变换为例进行描述，如下：

先在原始图片(即待识别的目标图片)上建立坐标系；本发明对建立坐标系的过程(如选取原点以及确定x轴、y轴等)不做限定。

在原始图片上，需要选取四个点以及在目标空间(即用于识别该目标图片的图片识别模板)选取与原始图片的点相对应的四个点，进行后续变换矩阵的计算。前述选取的四个点越分散，造成的误差影响越小。可以理解的是，变换矩阵的求算，需要上述原始图片的四个点以及目标空间与其对应的四个点；求得变换矩阵后，就可以将原始图片映射成一个矫正后的正向图片。

可选地，在原始图片中，选取四个坐标点的方法可以包括随机选择，或者从原始图片的文本中选择四个点。

下面以原始图片中的一个点的坐标为例进行描述：

其中，(u,v)是原始图片的一个点的坐标，为了不影响三维空间中点的坐标，将(u,v)表示为[u,v,1]；x是经过透视变换后该点的横坐标，y是经过透视变换后该点的纵坐标；[x′,y′,z′]表示为三维空间；为3×3变换矩阵；

通过式(1)将点(u,v)投影映射到三维空间(x′,y′,z′)中，从三维空间中再映射到新的二维空间中，完成点坐标的透视变换。其中，3×3变换矩阵的第一行、第二行用于仿射变换(线性变换与平移)，第三行用于透视变换。

联立公式(1)、公式(2)，可以得到公式(3)，如下：

在公式(3)中，得到新的二维空间中该点的坐标(x′,y′)。

上述的例子对一个点的坐标进行计算，以此类推，可以计算选取的四个点的坐标；请参见图3，图3是本发明实施例提供的一种透视变换示意图，图中反映了将形变通过透视变换进行矫正。

步骤S204：根据定义的所述文本含义得到所述目标文本区域中文本信息的文本含义。

具体地，根据符合识别要求的目标图片以及目标图片的锚点区域，利用目标图片对应的图片识别模板中锚点区域和目标文本区域的相对位置，确定目标图片的文本区域；其中，识别要求可以包括图像清晰度，形变程度、偏移程度等；在确定了目标文本区域之后，结合预设的文本信息的文本含义，得到所述目标文本信息的文本含义。

可以理解的是，当待识别的目标图片的目标文本区域与识别模板的目标文本区域的重合率达到预设值时，则可以进行文本含义识别。比如：两个文本区域有90％以上的重合率；则拼接目标图片中文本区域内识别出的文本，并根据图片识别模板中该文本含义的解释，输出该目标文本区域的识别结果。以身份证识别为例进行描述，经检测图片识别模板和目标图片两者的身份证号码区域的重合率达到预设的数值之后，拼接文本区域内的每个数字文本，结合模板中预设文本的含义，输出该数字串为身份证号码。

实施本发明的方法实施例，通过预先定义好的锚点区域选择图片识别模板，然后根据确定的锚点区域进行目标文本区域的定位，结合预先设定的文本含义获得目标图片中目标文本区域内的文本含义，既解决通用OCR识别不能获得图片文本含义的问题，同时也免去了对特定文本载体的深度定制以及大量该文本载体训练数据的需求，利用较短的开发周期支持识别没有现成识别模板的目标图片，能快速地获得目标图片的文本含义。

上述详细阐述了本发明实施例的方法，下面提供了本发明实施例的相关装置。

请参见图4，图4是本发明实施例提供的一种文本识别装置40的结构示意图，可以包括生成单元401、定位单元402、读取单元403、匹配单元404和矫正单元405。其中，可选的单元包括匹配单元404和矫正单元405。

生成单元401，用于根据预设的锚点区域及其对应的文本区域，生成图片识别模板；所述锚点区域与所述文本区域存在位置对应关系，所述文本区域包括定义了文本含义的文本信息；

定位单元402，用于在目标图片匹配有所述图片识别模板的锚点区域的情况下，通过所述图片识别模板中所述锚点区域与所述文本区域的位置对应关系，确定所述目标图片中进行识别的目标文本区域；

读取单元403，用于根据定义的所述文本含义得到所述目标文本区域中文本信息的文本含义。

在一种可能的实现方式中，所述装置还包括：匹配单元404，用于在所述定位单元在目标图片匹配有所述图片识别模板的锚点区域的情况下，通过所述图片识别模板中所述锚点区域与所述文本区域的位置对应关系，确定所述目标图片中进行识别的目标文本区域之前，根据通用光学字符识别OCR识别所述目标图片，确认所述目标图片的文本信息；通过判断所述目标图片的文本信息是否匹配有所述图片识别模板的锚点区域。

在一种可能的实现方式中，在生成有多个图片识别模板的情况下，所述定位单元402还用于：根据通用光学字符识别OCR识别所述目标图片，确认所述目标图片的文本信息；从所述多个图片识别模板中找到目标图片识别模板的锚点区域匹配所述目标图片；通过所述目标图片识别模板中所述锚点区域与所述文本区域的位置对应关系，确定所述目标图片中进行识别的目标文本区域。

在一种可能的实现方式中，所述装置还包括:矫正单元405，用于判断所述目标图片是否需要进行图像矫正；若所述目标图片需要进行图像矫正，则对所述目标图片进行图像矫正。

在一种可能的实现方式中，所述读取单元403具体用于在所述目标文本区域与所述目标图片识别模板的文本区域的重合率达到预设值的情况下，确认所述目标文本区域中文本信息的含义。

需要说明的是，本发明装置实施例中所描述的文本识别装置40的各功能单元的功能，可参见上述图2所述的方法实施例中文本识别方法的相关描述，此处不再赘述。

本发明实施例提供了一种网络设备50，请参见图5，图5是本发明实施例提供的一种网络设备的结构示意图，如图5所示，文本识别装置能以图5的结构实现，网络设备50可以包括至少一个存储部件501、至少一个处理部件502、至少一个通信部件503。此外，该设备还可以包括天线、电源等通用部件，在此不再详述。

存储部件501可以包括一个或多个存储单元，每个单元可以包括一个或多个存储器，存储部件可用于存储程序和各种数据，并能在通用设备70运行过程中高速、自动地完成程序或数据的存取。可以采用具有两种稳定状态的物理器件来存储信息，所述两种稳定状态分别表示为“0”和“1”。前述存储部件701，可以是只读存储器(read-only memory，ROM)或可存储静态信息和指令的其他类型的静态存储设备，随机存取存储器(random accessmemory，RAM)或者可存储信息和指令的其他类型的动态存储设备，也可以是电可擦可编程只读存储器(Electrically Erasable Programmable Read-Only Memory，EEPROM)、只读光盘(Compact Disc Read-Only Memory，CD-ROM)或其他光盘存储、光碟存储(可以包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。存储器可以是独立存在，通过总线与处理器相连接。存储器也可以和处理器集成在一起。

处理部件502，也可以称为处理器，处理单元，处理单板，处理模块、处理装置等。处理部件可以是中央处理器(central processing unit，CPU)，网络处理器(networkprocessor，NP)或者CPU和NP的组合，也可以是微处理器，特定应用集成电路(application-specific integrated circuit，ASIC)，或一个或多个用于控制以上方案程序执行的集成电路。

通信部件503，也可以称为收发机，或收发器等，可以是用于与其他设备或通信网络通信，其中可以包括用来进行无线、有线或其他通信方式的单元。

当网络设备50为图1所述终端时，所述处理部件502用于调用所述存储部件501的数据执行上述图2所述方法的相关描述，此处不再赘述。

本发明实施例还提供一种计算机存储介质，其中，该计算机存储介质可存储有程序，该程序执行时包括上述方法实施例中记载的任意一种的部分或全部步骤。

本发明实施例还提供一种计算机程序，该计算机程序包括指令，当该计算机程序被计算机执行时，使得计算机可以执行任意一种车载设备升级方法的部分或全部步骤。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line，DSL)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如数字多功能光盘(digital versatile disc，DVD)、半导体介质(例如固态硬盘solid state disk，SSD)等。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(read-only memory，ROM)、随机存取存储器(random access memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

在本发明中，所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。

另外，在本发明各个实施例中的各功能组件可以集成在一个组件也可以是各个组件单独物理存在，也可以是两个或两个以上组件集成在一个组件中。上述集成的组件既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

应理解，在本发明的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。尽管在此结合各实施例对本发明进行了描述，然而，在实施例所要求保护的本发明过程中，本领域技术人员可理解并实现公开实施例的其他变化。

Claims

1.一种文本识别方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述在目标图片匹配有所述图片识别模板的锚点区域的情况下，通过所述图片识别模板中所述锚点区域与所述文本区域的位置对应关系，确定所述目标图片中进行识别的目标文本区域之前，还包括：

根据通用光学字符识别OCR识别所述目标图片，确认所述目标图片的文本信息；

通过判断所述目标图片的文本信息是否匹配有所述图片识别模板的锚点区域。

3.根据权利要求1所述的方法，其特征在于，当生成有多个图片识别模板的情况下，所述在目标图片匹配有所述图片识别模板的锚点区域的情况下，通过所述图片识别模板中所述锚点区域与所述文本区域的位置对应关系，确定所述目标图片中进行识别的目标文本区域，包括：

从所述多个图片识别模板中找到目标图片识别模板的锚点区域匹配所述目标图片；

通过所述目标图片识别模板中所述锚点区域与所述文本区域的位置对应关系，确定所述目标图片中进行识别的目标文本区域。

4.根据权利要求1所述的方法，其特征在于，所述目标图片匹配有所述图片识别模板的锚点区域之后，还包括：

判断所述目标图片是否需要进行图像矫正；

若所述目标图片需要进行图像矫正，则对所述目标图片进行图像矫正。

5.根据权利要求1-4任一项所述的方法，其特征在于，所述根据定义的所述文本含义得到所述目标文本区域中文本信息的文本含义，包括：

在所述目标文本区域与所述目标图片识别模板的文本区域的重合率达到预设值的情况下，确认所述目标文本区域中文本信息的含义。

6.一种文本识别装置，其特征在于，包括：

7.根据权利要求6所述的装置，其特征在于，所述装置还包括：

匹配单元，用于在所述定位单元在目标图片匹配有所述图片识别模板的锚点区域的情况下，通过所述图片识别模板中所述锚点区域与所述文本区域的位置对应关系，确定所述目标图片中进行识别的目标文本区域之前，根据通用光学字符识别OCR识别所述目标图片，确认所述目标图片的文本信息；通过判断所述目标图片的文本信息是否匹配有所述图片识别模板的锚点区域。

8.根据权利要求6或7所述的装置，其特征在于，在生成有多个图片识别模板的情况下，所述定位单元还用于：

根据通用光学字符识别OCR识别所述目标图片，确认所述目标图片的文本信息；从所述多个图片识别模板中找到目标图片识别模板的锚点区域匹配所述目标图片；通过所述目标图片识别模板中所述锚点区域与所述文本区域的位置对应关系，确定所述目标图片中进行识别的目标文本区域。

9.一种网络设备，其特征在于，包括存储部件、通信部件和处理部件，存储部件、通信部件和处理部件相互连接，其中，存储部件用于存储数据处理代码，通信部件用于与外部设备进行信息交互；处理部件被配置用于调用程序代码，执行上述权利要求1-5任意一项所述的方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行如权利要求1-5任一项所述的方法。