CN108830133A

CN108830133A - 合同影像图片的识别方法、电子装置及可读存储介质

Info

Publication number: CN108830133A
Application number: CN201810343634.5A
Authority: CN
Inventors: 郑佳
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2018-04-17
Filing date: 2018-04-17
Publication date: 2018-11-16
Anticipated expiration: 2038-04-17
Also published as: CN108830133B; WO2019200802A1

Abstract

本发明涉及一种合同影像图片的识别方法、电子装置及可读存储介质，该方法包括：收到待识别的合同影像图片后，对待识别的合同影像图片进行预设的去躁处理；按预设的椭圆轮廓检测规则确定出经去躁处理后的合同影像图片中的椭圆轮廓，并将确定出的椭圆轮廓作为合同影像图片中的红章轮廓；对合同影像图片中红章轮廓内的图片进行白平衡处理，并去除红色分量；对去除红色分量后的合同影像图片进行OCR识别。本发明能够较好的支持合同影像图片中红章部分的准确识别，从而提高对非纯文字类型合同的OCR识别适应性，有效地提高合同影像图片的识别率。

Description

合同影像图片的识别方法、电子装置及可读存储介质

技术领域

本发明涉及计算机技术领域，尤其涉及一种合同影像图片的识别方法、电子装置及可读存储介质。

背景技术

在现有金融领域中，经常需要对合同影像图片进行识别以将合同影像图片中的信息进行提取并进行其中的内容分析。现有的合同影像图片识别方案一般都是基于传统的OCR识别技术对原始的合同影像图片直接进行识别，对非纯文字类型合同适应性较差，识别率较低。

发明内容

本发明的目的在于提供一种合同影像图片的识别方法、电子装置及可读存储介质，旨在提高合同影像图片的识别率。

为实现上述目的，本发明提供一种电子装置，所述电子装置包括存储器、处理器，所述存储器上存储有可在所述处理器上运行的合同影像图片的识别系统，所述合同影像图片的识别系统被所述处理器执行时实现如下步骤：

收到待识别的合同影像图片后，对待识别的合同影像图片进行预设的去躁处理；

按预设的椭圆轮廓检测规则确定出经去躁处理后的合同影像图片中的椭圆轮廓，并将确定出的椭圆轮廓作为合同影像图片中的红章轮廓；

对合同影像图片中红章轮廓内的图片进行白平衡处理，并去除红色分量；

对去除红色分量后的合同影像图片进行OCR识别。

优选地，所述按预设的椭圆轮廓检测规则确定出经去躁处理后的合同影像图片中的椭圆轮廓，并将确定出的椭圆轮廓作为合同影像图片中的红章轮廓的步骤包括：

检测经去躁处理后的合同影像图片中的RGB红色分量集中区域；

提取出RGB红色分量集中区域图像并对提取出的RGB红色分量集中区域图像进行边缘检测，得到二值化的边缘轮廓图；

将二值化的边缘轮廓图上的点坐标存入预设数组；

计算所述RGB红色分量集中区域图像上的每一点与所述预设数组中点的距离，得到所述RGB红色分量集中区域图像上的每一点距离所述预设数组中点的最大距离，找出各个最大距离中的最小值，将所述最小值对应的所述RGB红色分量集中区域图像上的点作为椭圆中心，找出各个最大距离中的最大值，将所述最大值作为椭圆长轴长度；

基于所述椭圆中心、所述椭圆长轴长度和所述预设数组建立椭圆轮廓，并将建立的椭圆轮廓作为合同影像图片中的红章轮廓。

优选地，所述基于所述椭圆中心、所述椭圆长轴长度和所述预设数组构造椭圆轮廓，并将构造出的椭圆轮廓作为合同影像图片中的红章轮廓的步骤包括：

将椭圆中心坐标(P，Q)，椭圆长轴长度a，及预设数组中每一点的坐标(x，y)代入如下椭圆方程：

求得参数b、θ的值，在预设的二维参数空间上对参数b、θ的值进行统计，得到参数b、θ的统计值，将统计值的最大值超过预设阈值的一组参数b、θ作为椭圆轮廓参数，根据所述椭圆轮廓参数来建立椭圆轮廓，并将建立的椭圆轮廓作为合同影像图片中的红章轮廓。

优选地，在所述对去除红色分量后的合同影像图片进行OCR识别的步骤之前，所述处理器还用于执行所述合同影像图片的识别系统，以实现以下步骤：

对待识别的合同影像图片进行直线检测并拟合，以检测待识别的合同影像图片中的封闭直线框；

若检测到待识别的合同影像图片中的封闭直线框，则对检测到的封闭直线框进行独立提取做表格化处理，在提取的表格中最大封闭直线框内检测小的封闭直线框，将检测到的小的封闭直线框作为表格项处理；

所述对去除红色分量后的合同影像图片进行OCR识别的步骤包括：

利用OCR分别识别出合同影像图片中检测的表格中各表格项的文字内容。

此外，为实现上述目的，本发明还提供一种合同影像图片的识别方法，所述合同影像图片的识别方法包括：

对去除红色分量后的合同影像图片进行OCR识别。

将二值化的边缘轮廓图上的点坐标存入预设数组；

优选地，在所述对去除红色分量后的合同影像图片进行OCR识别的步骤之前，还包括：

优选地，所述收到待识别的合同影像图片后，对待识别的合同影像图片进行预设的去躁处理的步骤包括：

收到待识别的合同影像图片后，对待识别的合同影像图片进行高斯模糊处理；

建立经高斯模糊处理后的合同影像图片的灰度直方图，根据所述灰度直方图检测出预设灰度值像素点成片状分布的部分为合同影像图片中的背景部分，去除合同影像图片中的背景部分，以去除掉合同影像图片中的背景部分对合同影像图片中文字部分识别产生的干扰。

进一步地，为实现上述目的，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质存储有合同影像图片的识别系统，所述合同影像图片的识别系统可被至少一个处理器执行，以使所述至少一个处理器执行如上述的合同影像图片的识别方法的步骤。

本发明提出的合同影像图片的识别方法、系统及可读存储介质，在对待识别的合同影像图片进行去躁处理后，通过预设的椭圆轮廓检测规则确定出经去躁处理后的合同影像图片中的椭圆轮廓，并将确定出的椭圆轮廓作为合同影像图片中的红章轮廓，对合同影像图片中红章轮廓内的图片进行白平衡处理，并去除红色分量，对去除红色分量后的合同影像图片进行OCR识别。由于能针对合同影像图片的特征，通过椭圆轮廓检测的方式来对合同影像图片进行红章检测，并对合同影像图片中的红章去除红色分量后再进行OCR识别，能够较好的支持合同影像图片中红章部分的准确识别，从而提高对非纯文字类型合同的OCR识别适应性，有效地提高合同影像图片的识别率。

附图说明

图1为本发明合同影像图片的识别系统10较佳实施例的运行环境示意图；

图2为本发明合同影像图片的识别方法一实施例的流程示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，在本发明中涉及“第一”、“第二”等的描述仅用于描述目的，而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外，各个实施例之间的技术方案可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在，也不在本发明要求的保护范围之内。

本发明提供一种合同影像图片的识别系统。请参阅图1，是本发明合同影像图片的识别系统10较佳实施例的运行环境示意图。

在本实施例中，所述的合同影像图片的识别系统10安装并运行于电子装置1中。该电子装置1可包括，但不仅限于，存储器11、处理器12及显示器13。图1仅示出了具有组件11-13的电子装置1，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

所述存储器11为至少一种类型的可读计算机存储介质，所述存储器11在一些实施例中可以是所述电子装置1的内部存储单元，例如该电子装置1的硬盘或内存。所述存储器11在另一些实施例中也可以是所述电子装置1的外部存储设备，例如所述电子装置1上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。进一步地，所述存储器11还可以既包括所述电子装置1的内部存储单元也包括外部存储设备。所述存储器11用于存储安装于所述电子装置1的应用软件及各类数据，例如所述合同影像图片的识别系统10的程序代码等。所述存储器11还可以用于暂时地存储已经输出或者将要输出的数据。

所述处理器12在一些实施例中可以是一中央处理器(Central ProcessingUnit,CPU)，微处理器或其他数据处理芯片，用于运行所述存储器11中存储的程序代码或处理数据，例如执行所述合同影像图片的识别系统10等。

所述显示器13在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode，有机发光二极管)触摸器等。所述显示器13用于显示在所述电子装置1中处理的信息以及用于显示可视化的用户界面，例如待识别的合同影像图片、检测出的合同影像图片中的红章轮廓、最终对合同影像图片的OCR识别结果等。所述电子装置1的部件11-13通过系统总线相互通信。

合同影像图片的识别系统10包括至少一个存储在所述存储器11中的计算机可读指令，该至少一个计算机可读指令可被所述处理器12执行，以实现本申请各实施例。

其中，上述合同影像图片的识别系统10被所述处理器12执行时实现如下步骤：

步骤S1，收到待识别的合同影像图片后，对待识别的合同影像图片进行预设的去躁处理。

本实施例中，电子装置接收用户发出的包含待识别的合同影像图片的OCR识别请求，例如，接收用户通过手机、平板电脑、自助终端设备等终端发送的OCR识别请求，如接收用户在手机、平板电脑、自助终端设备等终端中预先安装的客户端上发送来的OCR识别请求，或接收用户在手机、平板电脑、自助终端设备等终端中的浏览器系统上发送来的OCR识别请求。

收到待识别的合同影像图片后，对待识别的合同影像图片进行预设的去躁处理，如对待识别的合同影像图片进行高斯模糊处理，以初步去除待识别的合同图片中的噪声、杂点干扰。

步骤S2，按预设的椭圆轮廓检测规则确定出经去躁处理后的合同影像图片中的椭圆轮廓，并将确定出的椭圆轮廓作为合同影像图片中的红章轮廓。

本实施例中，检测经过去躁处理后的合同影像图片中RGB红色分量集中区域，提取出检测出的RGB红色分量集中区域图像并进行椭圆轮廓检测。具体步骤为：

首先，对提取出的RGB红色分量集中区域图像进行边缘检测，得到二值化的边缘轮廓图，将二值化的边缘轮廓图上的点坐标存入预设的数组A。

对提取出的RGB红色分量集中区域图像上的每一点(包括RGB红色分量集中区域图像边缘上的点以及RGB红色分量集中区域图像内即图像中间位置的点)，计算RGB红色分量集中区域图像上的每一点与上述所得数组A中点的距离，得到所述RGB红色分量集中区域图像上的每一点距离数组A中点的最大距离，找出各个最大距离中的最小值，将所述最小值对应的所述RGB红色分量集中区域图像上的点作为椭圆中心，该椭圆中心坐标记为(P，Q)，找出各个最大距离中的最大值，将所述最大值作为椭圆长轴长度a。

将得到的椭圆中心坐标(P，Q)，椭圆长轴长度a，及数组A中每一点的坐标(x，y)代入如下椭圆方程：

求得参数b、θ的值，在预设的二维参数空间上对参数b、θ的值进行统计，得到参数b、θ的统计值，将统计值的最大值超过预设阈值的一组参数b、θ作为椭圆轮廓参数，并以所述椭圆轮廓参数b、θ来建立椭圆轮廓，将建立的椭圆轮廓作为合同影像图片中的红章轮廓。

步骤S3，对合同影像图片中红章轮廓内的图片进行白平衡处理，并去除红色分量。

步骤S4，对去除红色分量后的合同影像图片进行OCR识别。

本实施例中在对待识别的合同影像图片进行去躁处理后，通过预设的椭圆轮廓检测规则确定出经去躁处理后的合同影像图片中的椭圆轮廓，并将确定出的椭圆轮廓作为合同影像图片中的红章轮廓，对合同影像图片中红章轮廓内的图片进行白平衡处理，并去除红色分量，对去除红色分量后的合同影像图片进行OCR识别。由于能针对合同影像图片的特征，通过椭圆轮廓检测的方式来对合同影像图片进行红章检测，并对合同影像图片中的红章去除红色分量后再进行OCR识别，能够较好的支持合同影像图片中红章部分的准确识别，从而提高对非纯文字类型合同的OCR识别适应性，有效地提高合同影像图片的识别率。

在一可选的实施例中，在上述图1的实施例的基础上，所述合同影像图片的识别系统10被所述处理器12执行实现所述步骤S4之前，还包括：

对经过去躁处理或红章轮廓检测处理后的合同影像图片进行直线检测，并进行适当拟合，若检测到图片中的封闭直线框，则对封闭直线框进行预设的表格处理流程；对图片中没有检测到封闭直线框的部分，进行段落文本分块处理流程。

在进行表格处理流程时，对图片中检测到的封闭直线框进行独立提取做表格化处理；在表格中最大封闭直线框内检测小的封闭直线框，将检测到的小的封闭直线框作为表格项处理。例如，当检测到小的封闭直线框内存在斜线时，对斜线内容进行分块处理，即对斜线分开的内容进行分块识别，并进行方向校验，对识别出的文字块分行进行展示，以按原始格式位置进行文字展示。依此，通过OCR分别识别出表格中各表格项的文字内容，已完成对合同影像图片中的表格文字识别。

在进行段落文本分块处理流程时，对文本图片进行像素特征分块，对分块的文字块进行进一步处理。包括：

针对特殊格式进行检测与处理。例如，针对预设位置(如图片顶端末端)来检测出页眉页脚，利用行间距的不同识别出标题，针对去除红色分量后的红章，识别出红章的文字，等等。针对这些特殊格式分别进行OCR识别。

对于图片中除特殊格式之外的其他图片部分，检测像素宽高值，对于宽高像素值较低(低于某一阈值)导致文字块像素体积较小的部分进行插值处理，以增加像素分辨率，提高后续的识别精度。对插值处理后图片中的文本块进行分行分割，对分割的不同文字段分别进行OCR识别，最后对分块识别的文字段按原始文本块位置进行组装处理。

将OCR识别出特殊格式的文字和其他图片中分段的文字之后，再综合表格文字识别，即可最终得到对整个合同影像图片的识别结果。

本实施例中通过对合同影像图片进行红章检测、表格检测和段落文本分块等处理后，对合同影像图片综合进行OCR识别，能够较好的支持合同影像图片中红章、表格的准确识别，相比于对合同进行传统的OCR识别，本实施例对非纯文字类型合同的OCR识别适应性较好，能有效提高合同影像图片的OCR识别率。

在一可选的实施例中，所述合同影像图片的识别系统10被所述处理器12执行实现所述步骤S1时，进一步包括：

本实施例中，可对合同影像图片进行预处理，如对待识别的合同影像图片进行高斯模糊处理，以初步去除待识别的合同影像图片中的噪声、杂点干扰。高斯模糊(GaussianBlur)，也叫高斯平滑，是根据高斯曲线调节像素色值，有选择地模糊图像，从而减少图像噪声以及降低细节层次。还可检测出合同影像图片的背景和文字，并去除合同影像图片中的背景部分。具体地，可建立合同影像图片的灰度直方图，则图片在低灰度区域的峰值和高灰度区域的峰值为图片背景和文字颜色。即在检测到某种主要灰度值像素点(高灰度值像素点)的连续性高，成片状分布时，则检测出其为图片中的背景；当某种主要灰度值的像素点(低灰度值像素点)成散状均匀分布时，则检测出其为图片中的文字。去除掉检测出的图片中的背景部分，以去除掉图片中的背景部分对图片中文字部分识别产生的干扰。

进一步地，还可对合同影像图片进行校正处理，对经过预处理后的合同影像图片进行膨胀处理，即给图像中的对象边缘添加像素，以模糊合同影像图片中的文字细节，并同时增加文字的像素体积。例如，一种膨胀算法如下：用3*3的结构元素扫描图像的每一个像素，用结构元素与其覆盖的二值图像做“与”操作，如果都为0，结果图像的该像素点为0，否则为1。膨胀算法的效果是使二值图像扩大一圈。其中，膨胀处理的原理如下：把结构元素B平移a后得到Ba，若Ba击中X，则记下这个a点，D(X)＝{a|Ba↑X}。对经过膨胀处理的合同影像图片进行文本区检测。具体地，对经过膨胀处理的合同影像图片中文字所在区域进行最外边缘检测，并进行直线边缘连接，得到长方形或平行四边形或梯形的外框。长方形的外框为正常状态下的文本框，平行四边形或梯形的外框则是在扫描成合同影像图片时可能没有将原始文件摆正，造成合同影像图片中文字角度不正，则需要对平行四边形和梯形的外框图片进行仿射变换校正处理，以将合同影像图片中文字摆正，以便后续对合同影像图片中文字OCR识别更加准确。例如，仿射变换校正处理的公式为：[x,y,1]＝[u,v,1]T，其中，T为仿射矩阵。

还可对仿射变换校正后的合同影像图片检测文字方向。具体地，可对于仿射变换校正后的合同影像图片中每隔一定像素划一条横线和一条竖线，得到每条线的像素值分布曲线，当某一类(如横向的或纵向的)曲线存在周期性的背景像素，且末端或开头为连续背景像素时，则判定该方向为段落结尾处，认定该方向(如横向或纵向)为文本方向。若垂直方向和水平方向均仅存在周期性背景像素分布，则判定周期性间隔较小的作为文本方向。检测出的文字方向可供后续对合同影像图片中文字进行OCR识别时进行参考。

如图2所示，图2为本发明合同影像图片的识别方法一实施例的流程示意图，该合同影像图片的识别方法包括以下步骤：

步骤S10，收到待识别的合同影像图片后，对待识别的合同影像图片进行预设的去躁处理。

步骤S20，按预设的椭圆轮廓检测规则确定出经去躁处理后的合同影像图片中的椭圆轮廓，并将确定出的椭圆轮廓作为合同影像图片中的红章轮廓。

步骤S30，对合同影像图片中红章轮廓内的图片进行白平衡处理，并去除红色分量。

步骤S40，对去除红色分量后的合同影像图片进行OCR识别。

在一可选的实施例中，在上述实施例的基础上，在所述步骤S40之前，该方法还包括：

在一可选的实施例中，所述步骤S10包括：

此外，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质存储有合同影像图片的识别系统，所述合同影像图片的识别系统可被至少一个处理器执行，以使所述至少一个处理器执行如上述实施例中的合同影像图片的识别方法的步骤，该合同影像图片的识别方法的步骤S10、S20、S30等具体实施过程如上文所述，在此不再赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件来实现，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上参照附图说明了本发明的优选实施例，并非因此局限本发明的权利范围。上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。另外，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

本领域技术人员不脱离本发明的范围和实质，可以有多种变型方案实现本发明，比如作为一个实施例的特征可用于另一实施例而得到又一实施例。凡在运用本发明的技术构思之内所作的任何修改、等同替换和改进，均应在本发明的权利范围之内。

Claims

1.一种电子装置，其特征在于，所述电子装置包括存储器、处理器，所述存储器上存储有可在所述处理器上运行的合同影像图片的识别系统，所述合同影像图片的识别系统被所述处理器执行时实现如下步骤：

对去除红色分量后的合同影像图片进行OCR识别。

2.如权利要求1所述的电子装置，其特征在于，所述按预设的椭圆轮廓检测规则确定出经去躁处理后的合同影像图片中的椭圆轮廓，并将确定出的椭圆轮廓作为合同影像图片中的红章轮廓的步骤包括：

将二值化的边缘轮廓图上的点坐标存入预设数组；

3.如权利要求2所述的电子装置，其特征在于，所述基于所述椭圆中心、所述椭圆长轴长度和所述预设数组构造椭圆轮廓，并将构造出的椭圆轮廓作为合同影像图片中的红章轮廓的步骤包括：

4.如权利要求1、2或3所述的电子装置，其特征在于，在所述对去除红色分量后的合同影像图片进行OCR识别的步骤之前，所述处理器还用于执行所述合同影像图片的识别系统，以实现以下步骤：

5.一种合同影像图片的识别方法，其特征在于，所述合同影像图片的识别方法包括：

对去除红色分量后的合同影像图片进行OCR识别。

6.如权利要求5所述的合同影像图片的识别方法，其特征在于，所述按预设的椭圆轮廓检测规则确定出经去躁处理后的合同影像图片中的椭圆轮廓，并将确定出的椭圆轮廓作为合同影像图片中的红章轮廓的步骤包括：

将二值化的边缘轮廓图上的点坐标存入预设数组；

7.如权利要求6所述的合同影像图片的识别方法，其特征在于，所述基于所述椭圆中心、所述椭圆长轴长度和所述预设数组构造椭圆轮廓，并将构造出的椭圆轮廓作为合同影像图片中的红章轮廓的步骤包括：

8.如权利要求5、6或7所述的合同影像图片的识别方法，其特征在于，在所述对去除红色分量后的合同影像图片进行OCR识别的步骤之前，还包括：

9.如权利要求5、6或7所述的合同影像图片的识别方法，其特征在于，所述收到待识别的合同影像图片后，对待识别的合同影像图片进行预设的去躁处理的步骤包括：

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有合同影像图片的识别系统，所述合同影像图片的识别系统被处理器执行时实现如权利要求5至9中任一项所述的合同影像图片的识别方法的步骤。