CN110291527B

CN110291527B - 信息处理方法、系统、云处理设备以及计算机程序产品

Info

Publication number: CN110291527B
Application number: CN201880000059.7A
Authority: CN
Inventors: 廉士国; 南一冰
Original assignee: Cloudminds Shanghai Robotics Co Ltd
Current assignee: Cloudminds Robotics Co Ltd
Priority date: 2018-01-19
Filing date: 2018-01-19
Publication date: 2023-03-24
Anticipated expiration: 2038-01-19
Also published as: WO2019140641A1; CN110291527A

Abstract

本发明实施例提供一种信息处理方法、系统、云处理设备以及计算机程序产品，涉及信息处理技术领域，在一定程度上提高了对图像信息的识别效率与准确性。本发明实施例提供的信息处理方法，包括：获取终端采集的图像信息；基于模板匹配关系，为所述图像信息匹配第一模板；根据所述第一模板，提取所述图像信息中的文字区域；识别所述文字区域内的文字。

Description

信息处理方法、系统、云处理设备以及计算机程序产品

技术领域

本发明涉及信息处理技术领域，尤其涉及一种信息处理方法、系统、云处理设备以及计算机程序产品。

背景技术

随着车联网相关技术的不断成熟，传感器技术、移动通信技术、大数据技术和智能计算技术等均开始与车联网深度融合。在市场需求带动下，区别于传统的交通系统，车联网更加注重车与车、车与路、车与人之间的交互通信，可以说车联网的出现重新定义了车辆交通的运行方式。

现有技术中，基于车联网的应用主要体现在如下几个领域：保险领域—保险公司通过从车联网中获取到的车辆的相关信息，实现对车辆的风险评估，车辆保费计算、在线定损等相关业务处理；交通管理领域—公安交通管理部门通过从车联网中获取到的车辆的相关信息，对车辆的行驶状况进行分析，对交通违法行为进行及时发现和治理，以及对交通事故进行相应处理。

用户将于车辆相关的单据等文件上传指定系统后，系统需要对文件内容进行识别，然而，现有技术中，对文件内容识别的准确率较低。

发明内容

本发明实施例提供一种信息处理方法、系统、云处理设备以及计算机程序产品，提高了对图像信息的识别效率与准确性。

第一方面，本发明实施例提供了一种信息处理方法，包括：

获取终端采集的图像信息；

基于模板匹配关系，为所述图像信息匹配第一模板；

根据所述第一模板，提取所述图像信息中的文字区域；

识别所述文字区域内的文字。

第二方面，本发明实施例还提供了一种信息处理系统，包括：

获取单元，用于获取终端采集的图像信息；

匹配单元，用于基于模板匹配关系，为所述图像信息匹配第一模板；

提取单元，用于根据所述第一模板，提取所述图像信息中的文字区域；

识别单元，用于识别所述文字区域内的文字。

第三方面，本发明实施例还提供了一种云处理设备，所述设备包括处理器以及存储器；所述存储器用于存储指令，所述指令被所述处理器执行时，使得所述设备执行如第一方面中任一种所述的方法。

第四方面，本发明实施例还提供了一种计算机程序产品，可直接加载到计算机的内部存储器中，并含有软件代码，所述计算机程序经由计算机载入并执行后能够实现如第一方面中任一种所述的方法。

本发明实施例提供的信息处理方法、系统、云处理设备以及计算机程序产品，通过基于模板匹配关系，对获取到的终端采集的图像信息进行处理，为图像信息匹配第一模板，并根据第一模板提取图像信息中的文字区域，最后识别文字区域内的文字，通过采用本发明实施例提供的技术方案，在对图像信息识别之前先为图像信息匹配模板，依靠模板的内容对图像信息进行识别，提高了对图像信息的识别效率与准确性，解决了现有技术中对文件内容识别的准确率较低的问题。同时通过自适应地引入人工介入，解决较难识别的“模板匹配”、“文字识别”问题，并且能够通过人工介入获取的样本数据来持续提升文字识别算法。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的信息处理方法实施例的流程图；

图2为本发明实施例提供的第一场景示意图；

图3为本发明实施例提供的第二场景示意图；

图4为本发明实施例提供的信息处理方法实施例的另一流程图；

图5为本发明实施例提供的信息处理方法实施例的另一流程图；

图6为本发明实施例提供的信息处理系统实施例的结构示意图；

图7为本发明实施例提供的信息处理系统实施例的另一结构示意图；

图8为本发明实施例提供的信息处理系统实施例的另一结构示意图；

图9为本发明实施例提供的云处理设备实施例的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。

应当理解，本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地，取决于语境，短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。

随着家用汽车的普及，汽车数量不断增加，车辆出现事故的几率也在不断的增加，这给保险行业的工作带来了巨大压力。通常情况下，车辆出险的具体操作是由保险理赔业务员将维修厂/4S店的报价单、维修清单等录入理赔系统中。由于报价单、维修清单等多为纸质材料，由人工手写相关的内容，因此，就需要人工手动将报价单、维修清单等录入理赔系统。而手动录入的工作量大、很耗时、也耗人力。由于车联网相关技术，将保险公司与汽车联系起来，使得用户自行将报价单、维修清单等上传至理赔系统成为可能。但是，由于不同的维修厂/4S店的报价单、维修清单等均会不同，使用现有技术中的方法，在将报价单、维修清单等录入理赔系统后，对报价单、维修清单等中的内容进行识别的识别效率很低。因此，本发明实施例提供了一种信息处理方法，通过模板来初步对终端采集到的图像进行识别后，再进行内容的识别，提高了识别效率，具体的，图1为本发明实施例提供的信息处理方法实施例的流程图，如图1所示，本实施例的信息处理方法，具体可以包括如下步骤：

101、获取终端采集的图像信息。

在本发明实施例中，首先由用户使用终端采集图像信息，采集的过程可以是使用终端的摄像头或者传感器采集报价单、维修清单等内容的图像信息，采集的方式可以是扫描报价单、维修清单等，还可以是为报价单、维修清单等进行拍照。

由于用户在采集图像信息的过程中，可能会出现光照过亮、光照过暗、不聚焦、摄像头或者传感器表面有污渍等情况，因此，优选使用安装在终端中的指定应用来采集图像信息，在指定应用中，可以显示图像采集区域，例如，一个采集框。为了进一步的提高图像识别效率，在指定应用中，还可以输出提示信息，确保用户能够采集到高质量、高清晰度的图像信息。

需要说明的是，本发明实施例中所涉及的终端可以包括但不限于个人计算机(Personal Computer，PC)、个人数字助理(Personal Digital Assistant，PDA)、无线手持设备、平板电脑(Tablet Computer)、手机、MP3播放器、MP4播放器等。

可以理解的是，应用可以是安装在终端上的应用程序(nativeApp)，或者还可以是终端上的浏览器的一个网页程序(webApp)，本发明实施例对此不进行限定。

终端在采集图像信息后，可以上传至云处理设备中，使得云处理设备可以获取到终端采集的图像信息。

在本发明实施例中，在获取终端采集的图像的同时，还可以采集终端的定位信息，即图像信息包括终端采集的图片和终端的定位信息，采集定位信息的目的，在于可以缩小检索模板的数量。由于不同的维修厂/4S店具有不同的地理位置，相应的，可以根据终端的地理位置，快速确定对应的维修厂/4S店的模板。

102、基于模板匹配关系，为图像信息匹配第一模板。

在本发明实施例中，会预先采集不同的维修厂/4S店的报价单、维修清单等的图像信息，制作成预定义模板。设定预定义模板的目的在于可以预先对模板内容进行处理，例如，划分区域、确定部分文字信息等，在后续识别文字的过程中，能够缩小识别范围，提高识别速度，起到显著的提高识别效率的效果。

具体的，首先，根据模板匹配关系将图像信息与预定义模板进行对比，确定相似度；在本发明实施例中，模板匹配关系可以是模板匹配算法，匹配过程可以是将采集到的图像信息逐一与预定义模板进行对比，在一个具体的实现过程中，模板匹配算法可以是图像拷贝检测或以图搜图的方法，通过模板匹配算法来确定相似度，例如，采用快速图像拷贝检测算法，具体的，首先提取图像特征点的二维位置信息，通过计算各个特征点与图像中心点的距离、角度，分块统计各区间的特征点数量，依据数量关系量化生成二值哈希序列，构成一级鲁棒特征；然后，根据特征点一维方向分布特征分块统计各方向子区间特征点数量，依据数量关系构成二级图像特征。最后，拷贝检测时采用级联式过滤框架，确定相似度。在一个具体的实现过程中，相似度可以用数字表示，相似度从0到1取浮点数值，值越大相似度越高，例如，采集到的图像信息与模板A的相似度为0.9。

其次，当相似度大于或者等于第一阈值时，确定预定义模板为与图像信息匹配的第一模板。在本发明实施例中，第一阈值用于表示图像信息与预定义模板的相似度高，当相似度大于或者等于第一阈值时，即可以认为图像信息对应的内容与预定义模板的内容相一致。

当相似度小于第二阈值时，确定预定义模板与图像信息不匹配，将图像信息发送至人工模块。在本发明实施例中，第二阈值用于表示图像信息与预定义模板的相似度低，图像信息对应的内容与任意一个预定义模板的内容均不匹配，当相似度小于第二阈值时，即可以认为预定义模板没有与图像信息相匹配的，则需要人工协助进行处理，云处理设备将图像信息发送至人工模块，操控人工模块的用户则查看图像信息，对图像信息进行模板定义处理，定义的过程包括，确定模板名称、将模板分解成文字区域等。

当相似度大于或者等于第二阈值，且小于第一阈值时，将图像信息以及第一模板一并发送至人工模块。在本发明实施例中，当相似度大于或者等于第二阈值，且小于第一阈值时，即可以认为云处理设备对图像相似度的识别存在不确定性，需要人工协助进行处理。云处理设备将图像信息以及第一模板发送至人工模块，操控人工模块的用户则查看图像信息，如果云处理设备为图像信息匹配的预定义模板正确，则返回正确信息，如果云处理设备为图像信息匹配的预定义模板不正确，则，对图像信息进行模板定义处理，定义的过程包括，确定模板名称、将模板分解成文字区域等。

系统将接收人工模板返回的确认消息，以及更新模板匹配关系。这样做的目的，可以由人工的辅助下，为算法增加新的训练集，使得算法自训练，得到更加精准的匹配关系。

103、根据第一模板，提取图像信息中的文字区域。

在本发明实施例中，当确定了第一模板后，为了提高提取的准确性，首先，根据第一模板对图像信息进行倾斜校正处理；然后，根据第一模板中预定义的提取区域，提取校正后的图像信息中的文字区域。

具体的，倾斜校正的过程可以通过比对待识别的图像信息和第一模板间的关键特征点来获得对应关系，然后基于此对应关系对待识别图像信息做变换来逼近模板，其中，第一模板是标准正向角度，通过倾斜校正，可以将非正向角度的待识别图像调整为第一模板的方向，更有利于提取图像信息中的文字区域。在倾斜校正之后，提取图像信息中的文字区域，由于在本发明实施例中，模板已经预先划分了提取区域，因此，在提取图像信息中的文字区域时，基于模板中的提取区域，从图像信息中切分出对应的文字区域。图2为本发明实施例提供的第一场景示意图，图3为本发明实施例提供的第二场景示意图，如图2所示，其为校正前的图像信息，如图3所示，其为校正后的图像信息。

104、识别文字区域内的文字。

在本发明实施例中，识别文字区域内的文字可以通过如下方式来完成：

首先，对文字区域进行二值化处理得到第一图像；具体的，可以对文字区域的灰度进行调整，使其转化为黑色和白色，然后，将白色去掉，黑色保留，得到第一图像。

其次，对第一图像进行字符分割处理，得到至少一个第二图像；具体的，将第一图像在垂直方向做投影，根据灰度值区分每一个字符。

最后，对每个第二图像进行文字识别，得到对应的文字。具体的，在识别过程中，对于每个字符的识别，都会给出识别结果和识别置信度，其中，识别置信度从0到1取浮点数值，值越大识别的可靠性越高，并且当置信度低于某个阈值时，识别结果不可靠，则云处理设备将该字符发送至人工模块，由人工模块辅助给出识别结果，可以解决“能够匹配上模板但无法识别出细节文字”的问题。此人工给出的识别结果将作为对对应文字区域的标注数据，用于重新训练提升文字识别(基于“文字区域图片”-“对应的文字标注”数据样本对)。

本发明实施例提供的信息处理方法，通过基于模板匹配关系，对获取到的终端采集的图像信息进行处理，为图像信息匹配第一模板，并根据第一模板提取图像信息中的文字区域，最后识别文字区域内的文字，通过采用本发明实施例提供的技术方案，在对图像信息识别之前先为图像信息匹配模板，依靠模板的内容对图像信息进行识别，提高了对图像信息的识别效率与准确性，解决了现有技术中对文件内容识别的准确率较低的问题。同时通过自适应地引入人工介入，解决较难识别的“模板匹配”、“文字识别”问题，并且能够通过人工介入获取的样本数据来持续提升文字识别算法。

由于人工书写存在连字、简笔、不规整等情况，对于文字的识别正确性具有一定的误差率，因此，在前述内容的基础上，本发明实施例还可以具有如下方式来解决这个问题，具体的，图4为本发明实施例提供的信息处理方法实施例的另一流程图，如图4所示，本发明实施例提供的信息处理方法，还可以包括如下步骤：

105、对文字进行校正。

在本发明实施例中，云处理设备中会预先存储文字库，例如，针对车辆维修的文字库中存储大量零部件名词，在实际应用中基于字符串的相似度的方式，利用文字库对文字进行校正，在已定义的文字库中搜索与当前文字最相似的，并用最相似的文字替代识别出的文字。例如，当识别出的文字是“车前保脸杠”时，通过文字库可以将其校正为“车前保险杠”。

在本发明实施例中，当文字识别置信度小于第三阈值时，发送所述文字至人工模块；由人工模块辅助对文字进行识别，并给出文字识别结果或者正确的文字信息，然后，人工模块将文字识别结果或者正确的文字信息发送至云处理设备，云处理设备接收人工模块返回的文字信息，将该文字以及对应的文字信息一并作为新的训练样本，更新文字识别训练集，以用于后续更新文字识别算法。通过采用本发明实施例的技术方案，进一步的提高识别图像信息中文字的准确率。

在前述内容的基础上，本发明实施例提供的技术方案中，还可以包括如下步骤，具体的，图5为本发明实施例提供的信息处理方法实施例的另一流程图，如图5所示，本发明实施例提供的信息处理方法，还可以包括如下步骤：

106、当未能为图像信息匹配第一模板时，将图像信息发送至人工模块。

107、接收人工模块返回的第二模板。

108、更新模板匹配关系。

可以理解的是，人工增加的新的模板，并根据模板相应的调整模板匹配关系，对于本发明实施例提供的方法来说，相当于增加了更多的样本，通过更多的样本对算法进行训练，能够有利于提高算法的精度和准确性。

在本发明实施例中，人工模块的参与，可以帮助完善各种数据库，以及模板库，在辅助人工智能算法做出识别判断的同时还能增加对算法的训练样本，能够不断的提高识别效率和准确性。

为了实现前述内容中的方法，本发明实施例还提供一种信息处理系统，图6为本发明实施例提供的信息处理系统实施例的结构示意图，如图6所示，本实施例的系统可以包括：获取单元11、匹配单元12、提取单元13和识别单元14。

获取单元11，用于获取终端采集的图像信息。

匹配单元12，用于基于模板匹配关系，为图像信息匹配第一模板。

提取单元13，用于根据第一模板，提取图像信息中的文字区域。

识别单元14，用于识别文字区域内的文字。

在一个具体的实现过程中，匹配单元12，具体用于：

根据模板匹配关系将图像信息与预定义模板进行对比，确定相似度；

当相似度大于或者等于第一阈值时，确定预定义模板为与图像信息匹配的第一模板。

在一个具体的实现过程中，图像信息包括终端采集的图片和终端的定位信息；

基于模板匹配关系，为图像信息匹配第一模板包括：

基于定位信息和模板匹配关系，为所采集的图片匹配第一模板。

图7为本发明实施例提供的信息处理系统实施例的另一结构示意图，如图7所示，本实施例的系统在前述内容的基础上，还可以包括：接收单元15和更新单元16。

在一个具体的实现过程中，匹配单元12，还用于：

当相似度小于第一阈值，且大于或者等于第二阈值时，将图像信息以及第一模板一并发送至人工模块；

接收单元15，用于接收人工模块返回的确认信息。

更新单元16，用于更新模板匹配关系。

在另一个具体的实现过程中，匹配单元12，还用于：

当未能为图像信息匹配第一模板时，将图像信息发送至人工模块；

接收单元15，还用于接收人工模块返回的第二模板；

更新单元16，用于更新模板匹配关系。

在另一个具体的实现过程中，匹配单元12，还用于：

当相似度小于第二阈值时，确定预定义模板与图像信息不匹配，将图像信息发送至人工模块。

图8为本发明实施例提供的信息处理系统实施例的另一结构示意图，如图8所示，本实施例的系统在前述内容的基础上，还可以包括：校正单元17。

校正单元17，用于对文字进行校正。

在一个具体的实现过程中，提取单元13，具体用于：

根据第一模板对图像信息进行倾斜校正处理；

根据第一模板中预定义的提取区域，提取校正后的图像信息中的文字区域。

在一个具体的实现过程中，识别单元14，具体用于：

对文字区域进行二值化处理得到第一图像；

对第一图像进行字符分割处理，得到至少一个第二图像；

对每个第二图像进行文字识别，得到对应的文字。

在一个具体的实现过程中，识别单元14，还用于：

当文字识别置信度小于第三阈值时，发送所述文字至人工模块；

接收所述人工模块返回的文字信息；

更新文字识别训练集。

图9为本发明实施例提供的云处理设备实施例的结构示意图，如图9所示，本发明实施例提供的云处理设备，具体可以包括：处理器21以及存储器22。

其中，存储器21用于存储指令，指令被处理器22执行时，使得设备执行如图1至图5所示任意一种方法。

本发明实施例还提供一种计算机程序产品，可直接加载到计算机的内部存储器中，并含有软件代码，计算机程序经由计算机载入并执行后能够实现如图1至图5所示任意一种方法。

本实施例的信息处理系统、云处理设备以及计算机程序产品，可以用于执行图1至图5所示方法实施例的技术方案，其实现原理和技术效果类似，此处不再赘述。

本领域普通技术人员可以理解：实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时，执行包括上述各方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所描述的装置实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到至少两个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种信息处理方法，其特征在于，包括：

获取终端采集的图像信息；所述图像信息包括终端采集的图片和所述终端的定位信息；

基于所述定位信息和模板匹配关系，为所采集的图片匹配第一模板，包括：根据模板匹配关系将所述图像信息与预定义模板进行对比，确定相似度；当所述相似度大于或者等于第一阈值时，确定所述预定义模板为与所述图像信息匹配的第一模板；

根据所述第一模板，提取所述图像信息中的文字区域；

识别所述文字区域内的文字；

当所述相似度小于第一阈值，且大于或者等于第二阈值时，将所述图像信息以及所述第一模板一并发送至人工模块；接收所述人工模块返回的确认信息；更新所述模板匹配关系；

当所述相似度小于第二阈值时，确定所述预定义模板与所述图像信息不匹配，将所述图像信息发送至人工模块；接收所述人工模块返回的第二模板；更新所述模板匹配关系。

2.根据权利要求1所述的方法，其特征在于，所述根据所述第一模板，提取所述图像信息中的文字区域，包括：

根据所述第一模板对所述图像信息进行倾斜校正处理；

根据所述第一模板中预定义的提取区域，提取校正后的所述图像信息中的文字区域。

3.根据权利要求1所述的方法，其特征在于，所述识别所述文字区域内的文字，包括：

对所述文字区域进行二值化处理得到第一图像；

对所述第一图像进行字符分割处理，得到至少一个第二图像；

对每个所述第二图像进行文字识别，得到对应的文字。

4.根据权利要求3所述的方法，其特征在于，所述方法还包括：

接收所述人工模块返回的文字信息；

更新文字识别训练集。

5.根据权利要求1所述的方法，其特征在于，所述方法还包括：

对所述文字进行校正。

6.一种信息处理系统，其特征在于，包括：

获取单元，用于获取终端采集的图像信息；所述图像信息包括终端采集的图片和所述终端的定位信息；

匹配单元，基于所述定位信息和模板匹配关系，为所采集的图片匹配第一模板，包括：根据模板匹配关系将所述图像信息与预定义模板进行对比，确定相似度；当所述相似度大于或者等于第一阈值时，确定所述预定义模板为与所述图像信息匹配的第一模板；

识别单元，用于识别所述文字区域内的文字；

所述匹配单元，还用于：根据模板匹配关系将所述图像信息与预定义模板进行对比，确定相似度；当所述相似度小于第一阈值，且大于或者等于第二阈值时，将所述图像信息以及所述第一模板一并发送至人工模块；

所述匹配单元，还用于：当所述相似度小于第二阈值时，确定所述预定义模板与所述图像信息不匹配，将所述图像信息发送至人工模块；

接收单元，用于接收所述人工模块返回的确认信息或接收所述人工模块返回的第二模板；

更新单元，用于更新所述模板匹配关系。

7.根据权利要求6所述的系统，其特征在于，所述系统还包括：

校正单元，用于对所述文字进行校正。

8.根据权利要求6所述的系统，其特征在于，所述提取单元，具体用于：

根据所述第一模板对所述图像信息进行倾斜校正处理；

9.根据权利要求6所述的系统，其特征在于，所述识别单元，具体用于：

对所述文字区域进行二值化处理得到第一图像；

对每个所述第二图像进行文字识别，得到对应的文字。

10.根据权利要求9所述的系统，其特征在于，所述识别单元，还用于：

接收所述人工模块返回的文字信息；

更新文字识别训练集。

11.一种云处理设备，其特征在于，所述设备包括处理器以及存储器；所述存储器用于存储指令，所述指令被所述处理器执行时，使得所述设备执行如权利要求1～5中任一种所述的方法。