CN111401110A - 用于提取信息的方法和装置 - Google Patents
用于提取信息的方法和装置 Download PDFInfo
- Publication number
- CN111401110A CN111401110A CN201910005179.2A CN201910005179A CN111401110A CN 111401110 A CN111401110 A CN 111401110A CN 201910005179 A CN201910005179 A CN 201910005179A CN 111401110 A CN111401110 A CN 111401110A
- Authority
- CN
- China
- Prior art keywords
- circumscribed
- geometry
- certificate image
- image
- geometric
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/418—Document matching, e.g. of document images
Abstract
本申请实施例公开了用于提取信息的方法和装置。该方法的一具体实施方式包括:获取第一证书图像,其中,第一证书图像中显示有目标字段;从第一证书图像中确定显示有目标字段的区域的外接几何图形作为第一外接几何图形;基于第一外接几何图形所围成的区域,提取目标字段。该实施方式降低了第一证书图像中所包括的其他区域对提取目标字段的影响。
Description
技术领域
本申请实施例涉及计算机技术领域,具体涉及用于提取信息的方法和装置。
背景技术
为了核实证书的真伪,往往需要获取证书中的文字信息。目前,主要通过人工的方式获取证书中的文字信息。
发明内容
本申请实施例提出了用于提取信息的方法和装置。
第一方面,本申请实施例提供了一种用于提取信息的方法,该方法包括:获取第一证书图像,其中,第一证书图像中显示有目标字段;从第一证书图像中确定显示有目标字段的区域的外接几何图形作为第一外接几何图形;基于第一外接几何图形所围成的区域,提取目标字段。
在一些实施例中,第一证书图像中还显示有目标图案;上述方法还包括:从第一证书图像中确定显示有目标图案的区域的外接几何图形作为第二外接几何图形。
在一些实施例中,上述从第一证书图像中确定显示有目标图案的区域的外接几何图形作为第二外接几何图形,包括:对第一证书图像提取特征点,得到第一特征点集合;将第一特征点集合中的特征点与预设特征点集合中的特征点进行匹配;根据第一特征点集合中的、与预设特征点集合中的特征点匹配的至少一个特征点,生成第二特征点集合;从第一证书图像中确定第二特征点集合中的特征点所在的区域的外接几何图形作为第二外接几何图形。
在一些实施例中,上述从第一证书图像中确定显示有目标字段的区域的外接几何图形作为第一外接几何图形,包括:基于第二外接几何图形和目标规则,从第一证书图像中确定显示有目标字段的区域的外接几何图形作为第三外接几何图形;响应于确定第三外接几何图形的宽高比与目标比例之间的差距小于预设差距,将第三外接几何图形确定为第一外接几何图形。
在一些实施例中,上述从第一证书图像中确定显示有目标字段的区域的外接几何图形作为第一外接几何图形,还包括:响应于确定第三外接几何图形的宽高比与目标比例之间的差距大于等于预设差距,对第一证书图像进行膨胀腐蚀处理,生成第二证书图像;根据膨胀腐蚀处理结果,在第二证书图像中划分出至少一个第一区域;对于至少一个第一区域中的第一区域,将该第一区域的外接几何图形确定为第四外接几何图形;从所确定的第四外接几何图形集合中选取满足预设条件的至少一个第四外接几何图形;确定包围至少一个第四外接几何图形的外接几何图形作为第五外接几何图形;将第五外接几何图形映射到第一证书图像作为第一外接几何图形。
在一些实施例中,上述从第一证书图像中确定显示有目标字段的区域的外接几何图形作为第一外接几何图形,包括:对第一证书图像进行膨胀腐蚀处理,生成第三证书图像;根据膨胀腐蚀处理结果,在第三证书图像中划分出至少一个第二区域;对于至少一个第二区域中的第二区域,将该第二区域的外接几何图形确定为第六外接几何图形;从所确定的第六外接几何图形集合中选取满足所述预设条件的至少一个第六外接几何图形;确定包围至少一个第六外接几何图形的外接几何图形作为第七外接几何图形;将第七外接几何图形映射到第一证书图像作为第一外接几何图形。
在一些实施例中,上述基于第一外接几何图形所围成的区域,提取目标字段,包括:基于第一外接几何图形,对第一证书图像进行裁剪,得到第四证书图像;对第四证书图像进行行切割,得到至少一个行文本图像;从至少一个行文本图像中选取行文本图像,以及执行如下信息提取步骤:对选取的行文本图像进行列切割,得到文字图像集合;对文字图像集合中的文字图像进行识别,得到选取的行文本图像中的行文字信息;响应于确定存在未选取过的行文本图像,从至少一个行文本图像中选取未选取过的行文本图像,以及继续执行信息提取步骤。
在一些实施例中,在上述得到至少一个行文本图像之后,上述方法还包括:对于至少一个行文本图像中的行文本图像,使用目标滑动窗口在该行文本图像上进行滑动,以及对该行文本图像中的、目标滑动窗口所在的区域进行识别,得到至少一条文字信息;根据至少一条文字信息,生成文字信息集合。
在一些实施例中,上述方法还包括:对于所得到的至少一条行文字信息中的行文字信息,使用该行文字信息到对应的文字信息集合中进行匹配;根据匹配结果,对该行文字信息进行更新。
在一些实施例中,在上述获取第一证书图像之前,上述方法还包括:获取初始证书图像;确定初始证书图像中显示有证书的区域的外接几何图形作为第八外接几何图形;根据第八外接几何图形,确定旋转角度;基于所确定的旋转角度,对初始证书图像进行旋转处理。
在一些实施例中,上述获取第一证书图像,包括:调整旋转处理后的初始证书图像的尺寸;对调整尺寸后的初始证书图像进行二值化处理;对二值化处理后的初始证书图像进行滤波,以及将滤波后的初始证书图像确定为第一证书图像。
第二方面,本申请实施例提供了一种用于提取信息的装置,该装置包括:第一获取单元,被配置成获取第一证书图像,其中,第一证书图像中显示有目标字段;第一确定单元,被配置成从第一证书图像中确定显示有目标字段的区域的外接几何图形作为第一外接几何图形;提取单元,被配置成基于第一外接几何图形所围成的区域,提取目标字段。
在一些实施例中,第一证书图像中还显示有目标图案;上述装置还包括:第二确定单元,被配置成从第一证书图像中确定显示有目标图案的区域的外接几何图形作为第二外接几何图形。
在一些实施例中,上述第二确定单元包括:提取模块,被配置成对第一证书图像提取特征点,得到第一特征点集合;匹配模块,被配置成将第一特征点集合中的特征点与预设特征点集合中的特征点进行匹配;第一生成模块,被配置成根据第一特征点集合中的、与预设特征点集合中的特征点匹配的至少一个特征点,生成第二特征点集合;第一确定模块,被配置成从第一证书图像中确定第二特征点集合中的特征点所在的区域的外接几何图形作为第二外接几何图形。
在一些实施例中,上述第一确定单元包括:第二确定模块,被配置成基于第二外接几何图形和目标规则,从第一证书图像中确定显示有目标字段的区域的外接几何图形作为第三外接几何图形;第三确定模块,被配置成响应于确定第三外接几何图形的宽高比与目标比例之间的差距小于预设差距,将第三外接几何图形确定为第一外接几何图形。
在一些实施例中,上述第一确定单元还包括:第二生成模块,被配置成响应于确定第三外接几何图形的宽高比与目标比例之间的差距大于等于预设差距,对第一证书图像进行膨胀腐蚀处理,生成第二证书图像;第一划分模块,被配置成根据膨胀腐蚀处理结果,在第二证书图像中划分出至少一个第一区域;第四确定模块,被配置成对于至少一个第一区域中的第一区域,将该第一区域的外接几何图形确定为第四外接几何图形;第一选取模块,被配置成从所确定的第四外接几何图形集合中选取满足预设条件的至少一个第四外接几何图形;第五确定模块,被配置成确定包围至少一个第四外接几何图形的外接几何图形作为第五外接几何图形;第一映射模块,被配置成将第五外接几何图形映射到第一证书图像作为第一外接几何图形。
在一些实施例中,上述第一确定单元包括:第三生成模块,被配置成对第一证书图像进行膨胀腐蚀处理,生成第三证书图像;第二划分模块,被配置成根据膨胀腐蚀处理结果,在第三证书图像中划分出至少一个第二区域;第六确定模块,被配置成对于至少一个第二区域中的第二区域,将该第二区域的外接几何图形确定为第六外接几何图形;第二选取模块,被配置成从所确定的第六外接几何图形集合中选取满足预设条件的至少一个第六外接几何图形;第七确定模块,被配置成确定包围至少一个第六外接几何图形的外接几何图形作为第七外接几何图形;第二映射模块,被配置成将第七外接几何图形映射到第一证书图像作为第一外接几何图形。
在一些实施例中,上述提取单元包括:裁剪模块,被配置成基于第一外接几何图形,对第一证书图像进行裁剪,得到第四证书图像;切割模块,被配置成对第四证书图像进行行切割,得到至少一个行文本图像;执行模块,被配置成从至少一个行文本图像中选取行文本图像,以及执行如下信息提取步骤:对选取的行文本图像进行列切割,得到文字图像集合;对文字图像集合中的文字图像进行识别,得到选取的行文本图像中的行文字信息;第三选取模块,被配置成响应于确定存在未选取过的行文本图像,从至少一个行文本图像中选取未选取过的行文本图像,以及继续执行信息提取步骤。
在一些实施例中,上述装置还包括:生成单元,被配置成对于至少一个行文本图像中的行文本图像,使用目标滑动窗口在该行文本图像上进行滑动,以及对该行文本图像中的、所述目标滑动窗口所在的区域进行识别,得到至少一条文字信息;根据至少一条文字信息,生成文字信息集合。
在一些实施例中,上述装置还包括:更新单元,被配置成对于所得到的至少一条行文字信息中的行文字信息,使用该行文字信息到对应的文字信息集合中进行匹配;根据匹配结果,对该行文字信息进行更新。
在一些实施例中,上述装置还包括:第二获取单元,被配置成获取初始证书图像;第三确定单元,被配置成确定初始证书图像中显示有证书的区域的外接几何图形作为第八外接几何图形;第四确定单元,被配置成根据第八外接几何图形,确定旋转角度;处理单元,被配置成基于所确定的旋转角度,对初始证书图像进行旋转处理。
在一些实施例中,上述第一获取单元包括:调整模块,被配置成调整旋转处理后的初始证书图像的尺寸;处理模块,被配置成对调整尺寸后的初始证书图像进行二值化处理;滤波模块,被配置成对二值化处理后的初始证书图像进行滤波,以及将滤波后的初始证书图像确定为第一证书图像。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括:一个或多个处理器;存储装置,其上存储有一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。
第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面中任一实现方式描述的方法。
本申请实施例提供的用于提取信息的方法和装置,首先,可以获取第一证书图像。然后,可以从第一证书图像中确定显示有目标字段的区域的外接几何图形作为第一外接几何图形。而后,可以基于第一外接几何图形所围成的区域,提取目标字段。总体来说,可以确定出第一证书图像中显示有目标字段的区域的外接几何图形,进而基于所确定的外接几何图形,提取目标字段。从而降低了第一证书图像中所包括的其他区域(例如显示有图案、边框、背景、杂质等的区域)对提取目标字段的影响。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请的一个实施例可以应用于其中的示例性系统架构图;
图2是根据本申请的用于提取信息的方法的一个实施例的流程图;
图3是根据本申请的用于提取信息的方法的又一个实施例的流程图;
图4是根据本申请实施例的用于提取信息的方法的一个应用场景的示意图;
图5是根据本申请的用于提取信息的装置的一个实施例的结构示意图;
图6是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的用于提取信息的方法或用于提取信息的装置的示例性架构100。
如图1所示,系统架构100可以包括终端设备101、102,网络103和服务器104。网络103用以在终端设备101、102和服务器104之间提供通信链路的介质。网络103可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
终端设备101、102通过网络103与服务器104交互,以接收或发送消息等。终端设备101、102上可以安装有各种通讯客户端应用,例如文字识别类应用、图像处理类应用。
终端设备101、102可以是硬件,也可以是软件。当终端设备101、102为硬件时,可以是具有显示屏并且支持文字识别的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、膝上型便携计算机和台式计算机等等。当终端设备101、102为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。
服务器104可以是提供各种服务的服务器。例如,服务器104可以是终端设备101、102上所安装的文字识别应用的后台服务器。作为示例,首先,终端设备可以将证书图像发送至后台服务器。然后,后台服务器可以从证书图像中提取文字信息。而后,后台服务器可以将提取到的文字信息返回至终端设备。
服务器104可以是硬件,也可以是软件。当服务器104为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器104为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。
需要说明的是,本申请实施例所提供的用于提取信息的方法可以由服务器104执行,此时,用于提取信息的装置一般设置于服务器104中。本申请实施例所提供的用于提取信息的方法还可以由终端设备101、102执行,此时,用于提取信息的装置一般设置于终端设备101、102中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本申请的用于提取信息的方法的一个实施例的流程200。该用于提取信息的方法包括以下步骤:
步骤201,获取第一证书图像。
在本实施例中,用于提取信息的方法的执行主体(如图1所示的服务器104)可以通过各种方法获取第一证书图像。其中,证书可以是各种证书,例如营业执照、毕业证书、许可证等。可以理解,第一证书图像可以是显示有这些证书的图像。
在本实施例中,第一证书图像中可以显示有目标字段。其中,目标字段可以通过各种规则筛选得到。例如,包含预设文字信息的字段。例如,第一证书图像中的某一个区域所显示的字段。
作为示例,若第一证书图像存储于本地,上述执行主体可以直接从本地获取第一证书图像。作为示例,上述执行主体还可以从通信连接的数据库服务器(图中未示出)或者终端设备(如图中所示的终端设备101、102)获取第一证书图像。
在本实施例的一些可选的实现方式中,在获取第一证书图像之前,上述执行主体还可以执行如下步骤。
第一步,获取初始证书图像。其中,初始证书图像可以通过图像拍摄设备拍摄得到,也可以通过图像扫描设备扫描得到。实践中,上述执行主体可以从本地获取初始证书图像。也可以从通信连接的数据库服务器或者终端设备获取初始证书图像。
第二步,确定初始证书图像中显示有证书的区域的外接几何图形作为第八外接几何图形。此处,外接几何图像可以是矩形,也可以是其他的几何图形(例如圆形、椭圆形或者矩形之外的其他多边形)。
作为示例,技术人员可以搜集大量的证书图像,然后标识出这些证书图像中显示的证书的区域的外接几何图形,而后可以存储这些标识后的证书图像,得到证书图像集合。由此,上述执行主体可以将初始证书图像输入至该证书图像集合中,进而匹配到与初始证书图像相同或者相似(例如相似度大于90%)的证书图像,从而,上述执行主体可以将匹配得到的证书图像中的外接几何图形映射到初始证书图像中,得到初始证书图像中显示有证书的区域的外接几何图形。
作为示例,上述执行主体还可以将初始证书图像输入至预先训练的证书识别模型,进而确定初始证书图像中显示有证书的区域的外接几何图形。其中,上述证书识别模型可以用于表征证书图像和证书图像图中显示有证书的区域的外接几何图形之间的对应关系。实践中,上述证书识别模型可以是使用各种用于物体识别的初始模型训练得到。此处,初始模型可以是R-CNN(Region-based Convolutional Neural Networks,基于区域的卷积神经网络)、Fast R-CNN、Faster R-CNN等。还可以是其他的使用神经网络所搭建的模型。需要说明的是,使用机器学习方法训练上述证书识别模型是目前广泛研究和应用的公知技术,在此不再赘述。
作为示例,首先,上述执行主体可以提取初始证书图像中显示有证书的区域的轮廓。然后,可以进一步确定出所提取的轮廓的外接几何图形,即确定出显示有证书的区域的外接几何图形。实践中,上述执行主体可以使用各种轮廓提取算法进行轮廓提取。
第三步,根据第八外接几何图形,确定旋转角度。确定第八外接几何图形之后,上述执行主体可以通过各种方法确定旋转角度。
作为示例,若第八外接几何图形为矩形,上述执行主体可以进一步确定该矩形的宽与水平方向的夹角(小于90度)作为旋转角度。若第八外接几何图形不是矩形,首先上述执行主体可以确定该几何图形的外接矩形,然后将该外接矩形的宽与水平方向的夹角(小于90度)确定为旋转角度。需要说明的是,此处所说的矩形的宽并非长度较小的边,而是与水平方向的夹角较小的边。下述内容中涉及到的矩形的宽的含义亦是如此。
作为示例,实践中,初始证书图像中显示有证书的区域中显示的文字信息成行排列。由此,首先,上述执行主体可以确定出第八外接几何图形所围成的区域中每行文字信息的大致区域。实践中,上述执行主体可以使用各种文字区域提取算法确定每行文字信息的大致区域。然后,上述执行主体可以确定出每行文字信息所在的区域的外接矩形,得到至少一个外接矩形。而后,上述执行主体可以分别确定这些外接矩形的宽与水平方向之间的夹角。进一步,上述执行主体可以将所得到的夹角中占多数的夹角确定为旋转角度。
第四步,基于所确定的旋转角度,对初始证书图像进行旋转处理。此处,所说的旋转处理,可以包括对初始证书图像的旋转操作。也可以包括对旋转后的初始证书图像的其他操作,例如,对旋转后的初始证书图像进行裁剪。
作为示例,若第八外接几何图形为矩形,上述执行主体可以以所确定的旋转角度对初始证书图像进行旋转,以使该矩形的宽与水平方向的夹角小于等于预设角度。若第八外接几何图形不是矩形,可以以所确定的旋转角度对初始证书图像进行旋转,以使第八外接几何图形的外接矩形的宽与水平方向的夹角小于等于预设角度。
作为示例,若第八外接几何图形为矩形,旋转之后,上述执行主体还可以将该矩形围成的区域裁剪出来作为旋转处理后的初始图像。若第八外接几何图形不是矩形,旋转之后,上述执行主体还可以将第八外接几何图形的外接矩形围成的区域裁剪出来作为旋转处理后的初始图像。
需要说明的是,实践中,也可以将矩形的高与垂直方向的夹角确定为旋转角度。由此,上述执行主体可以以所确定的旋转角度对初始证书图像进行旋转,直至矩形的高与垂直方向的夹角小于等于预设角度。此处,所说的矩形的高可以是与垂直方向的夹角较小的边。下述内容中涉及到的矩形的高的含义亦是如此。
在本实施例的一些可选的实现方式中,上述执行主体可以对上述旋转处理后的初始证书图像进行如下步骤的处理,进而得到第一证书图像。第一步,调整旋转处理后的初始证书图像的尺寸。实践中,上述执行主体可以将旋转处理后的初始证书图像的尺寸调整为目标尺寸。其中,目标尺寸可以是预设的尺寸,也可以是根据实际需求而定的尺寸。第二步,对调整尺寸后的初始证书图像进行二值化处理。第三步,对二值化处理后的初始证书图像进行滤波,以及将滤波后的初始证书图像确定为第一证书图像。
步骤202,从第一证书图像中确定显示有目标字段的区域的外接几何图形作为第一外接几何图形。
在本实施例中,上述执行主体可以通过各种方法,从第一证书图像中确定显示有目标字段的区域的外接几何图形。
作为示例,上述执行主体可以将第一证书图像输入至预先训练的字段区域识别模型,进而确定第一证书图像中显示有目标字段的区域的外接几何图形。其中,上述字段区域识别模型可以用于表征证书图像和证书图像图中显示有目标字段的区域的外接几何图形之间的对应关系。实践中,上述字段区域识别模型可以是使用各种用于物体识别的初始模型训练得到。此处,初始模型可以是现有的各种用于物体识别的模型,例如R-CNN、Fast R-CNN、Faster R-CNN等。初始模型还可以是其他的使用神经网络所搭建的模型。需要说明的是,使用机器学习方法训练上述字段区域识别模型是目前广泛研究和应用的公知技术,在此不再赘述。
在本实施例的一些可选的实现方式中,第一证书图像中还可以显示有目标图案。其中,目标图案可以是预先指定的图案。此处,预先指定的图案可以是国徽图案、校徽图案或者其他机构的标志图案。目标图案也可以是通过一定规则筛选的图案。例如,与证书的类别对应的图案。作为示例,证书为营业执照,目标图案可以是国徽。作为示例,证书为毕业证书,目标图案可以是校徽。
此时,上述执行主体可以从第一证书图像中确定显示有目标图案的区域的外接几何图形作为第二外接几何图形。
作为示例,上述执行主体可以将第一证书图像输入至预先训练的图案区域识别模型,进而确定第一证书图像中显示有目标图案的区域的外接矩形。其中,上述图案区域识别模型可以用于表征证书图像和证书图像图中显示有目标图案的区域的外接几何图形之间的对应关系。实践中,上述图案区域识别模型可以是使用各种用于物体识别的初始模型训练得到。此处,初始模型可以是现有的各种用于物体识别的模型,例如R-CNN、Fast R-CNN、Faster R-CNN等。初始模型还可以是其他的使用神经网络所搭建的模型。需要说明的是,使用机器学习方法训练上述字段区域识别模型是目前广泛研究和应用的公知技术,在此不再赘述。
在本实施例的一些可选的实现方式中,上述执行主体还可以通过如下步骤,从第一证书图像中确定显示有目标图案的区域的外接几何图形。第一步,对第一证书图像提取特征点,得到第一特征点集合。实践中,上述执行主体可以使用各种特征点提取算法,对第一证书图像提取特征点。第二步,将第一特征点集合中的特征点与预设特征点集合中的特征点进行匹配。其中,预设特征点集合中的特征点可以是对大量的预设图案提取特征点而得到。第三步,根据第一特征点集合中的、与预设特征点集合中的特征点匹配的至少一个特征点,生成第二特征点集合。此处,所说的匹配可以是特征点之间的相似度在预设相似度范围内。由此,上述执行主体可以将第一特征点集合中的、与预设特征点集合中的特征点匹配的至少一个特征点所组成的集合确定为第二特征点集合。第四步,从第一证书图像中确定第二特征点集合中的特征点所在的区域的外接几何图形作为第二外接几何图形。
在本实施例的一些可选的实现方式中,从第一证书图像中确定第二外接几何图形之后,上述执行主体还可以通过如下步骤,从第一证书图像中确定显示有目标字段的区域的外接几何图形作为第一外接几何图形。
第一步,基于第二外接几何图形和目标规则,从第一证书图像中确定显示有目标字段的区域的外接几何图形作为第三外接几何图形。其中,目标规则可以预先指定。具体地,若第二外接几何图形和第三外接几何图形均为矩形,可以预先指定第二外接几何图形和第三外接几何图形的宽与宽之间的比例作为横边比例,以及预先指定第二外接几何图形和第三外接几何图形的高与高之间的比例作为纵边比例,还可以预先指定第二外接几何图形的宽和第三外接几何图形的对应的宽之间的垂直距离。若第二外接几何图形和第三外接几何图形均不是矩形,可以预先指定第二外接几何图形的外接矩形和第三外接几何图形的外接矩形的宽与宽之间的比例作为横边比例,以及预先指定第二外接几何图形的外接矩形和第三外接几何图形的外接矩形的高与高之间的比例作为纵边比例,还预先指定第二外接几何图形的外接矩形的宽和第三外接几何图形的外接矩形的对应的宽之间的垂直距离。目标规则还可以根据实际需求而定。例如,上述横边比例、纵边比例和垂直距离可以根据证书的类别而定。
由此,确定显示有目标图案的区域的外接几何图形之后,上述执行主体可以根据目标规则所指示的横边比例、纵边比例和垂直距离,进一步确定出第三外接几何图形。需要说明的是,上述垂直距离通常是两个矩形的对应的宽的中点之间的距离。
第二步,响应于确定第三外接几何图形的宽高比与目标比例之间的差距小于预设差距,将第三外接几何图形确定为第一外接几何图形。其中,目标比例可以是预先指定的比例。也可以是根据证书的类别而定的比例。实践中,若第三外接几何图形为矩形,第三外接几何图形的宽高比可以是该矩形的宽与高的比值。若第三外接几何图形不是矩形,第三外接几何图形的宽高比可以是第三外接几何图形的外接矩形的宽与高的比值。
在本实施例的一些可选的实现方式中,上述执行主体还可以通过如下步骤,从第一证书图像中确定显示有目标字段的区域的第一外接几何图形。
第一步,响应于确定第三外接几何图形的宽高比与目标比例之间的差距大于等于预设差距,对第一证书图像进行膨胀腐蚀处理,生成第二证书图像。具体地,首先,上述执行主体可以对第一证书图像进行膨胀。膨胀之后,第一证书图像中显示的每个文字的笔画所占的区域会增大,相应的,每个文字中的间隙会减小。然后,上述执行主体可以对膨胀之后的第一证书图像进行腐蚀。腐蚀之后,可以减小每个文字的边缘所带来的噪声。接着,上述执行主体可以对腐蚀之后的第一证书图像再次进行膨胀,进而生成第二证书图像。再次膨胀之后,每一行文字信息中文字与文字之间的间距会减小,通常,每一行文字信息中相邻的文字可以连接在一起,也就是说,每一行文字信息可以形成一个连通的区域。实践中,可以通过设置合适尺寸的卷积核和滑动步长,来实现不同程度的膨胀和腐蚀。
第二步,根据膨胀腐蚀处理结果,在第二证书图像中划分出至少一个第一区域。
可以看出,经过膨胀腐蚀处理之后,第二证书图像中可以包括多个连通的区域。由此,上述执行主体可以划分出这些连通的区域,即划分出至少一个第一区域。
第三步,对于上述至少一个第一区域中的第一区域,将该第一区域的外接几何图形确定为第四外接几何图形。划分出至少一个第一区域之后,上述执行主体可以确定这些第一区域中每个第一区域的外接几何图形作为第四外接几何图形,得到第四外接几何图形集合。
第四步,从所确定的第四外接几何图形集合中选取满足预设条件的至少一个第四外接几何图形。若第四外接几何图形为矩形,预设条件可以是宽的长度大于等于预设宽度,以及高的长度大于等于预设高度。此时,对于每个第四外接几何图形,上述执行主体可以分别确定该第四外接几何图形的宽和高的长度。响应于确定该第四外接几何图形的宽的长度大于等于预设宽度,以及高的长度大于等于预设高度,上述执行主体可以确定该第四外接几何图形满足预设条件。若第四外接几何图形不是矩形,预设条件可以是第四外接几何图形的外接矩形的宽的长度大于等于预设宽度,以及第四外接几何图形的外接矩形的高的长度大于等于预设高度。此时,对于每个第四外接几何图形,上述执行主体可以确定该第四外接几何图形的外接矩形,然后,响应于确定该第四外接几何图形的外接矩形的宽的长度大于等于预设宽度,以及高的长度大于等于预设高度,上述执行主体可以确定该第四外接几何图形满足预设条件。
第五步,确定包围至少一个第四外接几何图形的外接几何图形作为第五外接几何图形。确定满足预设条件的至少一个第四外接几何图形之后,上述执行主体可以进一步确定出能够包围上述至少一个第四外接几何图形的外接几何图形作为第五外接几何图形。
第六步,将第五外接几何图形映射到第一证书图像作为第一外接几何图形。
在第二证书图像中确定第五外接几何图形之后,上述执行主体可以将第五外接几何图形映射到第一证书图像。然后,可以将映射到第一证书图像中的第五外接几何图形确定为第一外接几何图形。
在本实施例的一些可选的实现方式中,不需要预先从第一证书图像中确定显示有目标图案的区域的外接几何图形,上述执行主体可以直接按照类似上一个实现方式中的方法,从第一证书图像中确定显示有目标字段的区域的外接几何图形。具体地,首先,上述执行主体可以对第一证书图像进行膨胀腐蚀处理,生成第三证书图像;然后,可以根据膨胀腐蚀处理结果,在第三证书图像中划分出至少一个第二区域;接着,对于至少一个第二区域中的第二区域,可以将该第二区域的外接几何图形确定为第六外接几何图形;而后,可以从所确定的第六外接几何图形集合中选取满足所述预设条件的至少一个第六外接几何图形;进一步,可以确定包围上述至少一个第六外接几何图形的外接几何图形作为第七外接几何图形;从而,可以将第七外接几何图形映射到第一证书图像作为第一外接几何图形。由于此实现方式中所描述的方法与上一个实现方式中的方法类似,具体的实现过程可以参考上一个实现方式中的描述,在此不再赘述。
在本实施例的一些可选的实现方式中,第一证书图像中显示有目标字段和目标图案之外,还显示有目标边框。其中,目标边框可以通过各种规则筛选得到。例如,筛选得到的与显示有证书的区域的外接矩形的距离在预设距离范围内的边框。例如,筛选得到的与显示有目标字段的区域的外接矩形的距离最近的边框。实践中,显示有边框的区域的特征(例如纹理特征、颜色特征、轮廓特征、位置特征)不同于显示有目标字段的区域的特征,也不同于显示有目标图案的区域的特征。
在这些实现方式中,确定第一外接几何图形之后,上述执行主体可以通过如下步骤对第一外接几何图形进行调整。首先,上述执行主体可以将第一证书图像划分成大量较小的区域。然后,对这些较小的区域提取特征。接着,可以将特征相匹配的较小的区域组合成一个较大的区域。可以理解,可以得到多个较大的区域。而后,可以从这些较大的区域中选取与显示有证书的区域的外接矩形的距离在预设距离范围内的区域作为显示有目标边框的区域。进一步,上述执行主体可以确定第一外接几何图形所围成的区域是否与显示有目标边框的区域有重叠部分。若第一外接几何图形为矩形,当有重叠部分时,上述执行主体可以将该矩形的相应的边长延长或者缩短,直至没有重叠部分。若第一外接几何图形不是矩形,当有重叠部分时,上述执行主体可以将第一外接几何图形的外接矩形的相应的边长延长或者缩短,直至没有重叠部分。从而,上述执行主体可以使用调整后的第一外接几何图形作为第一外接几何图形。
步骤203,基于第一外接几何图形所围成的区域,提取目标字段。
在本实施例中,确定第一外接几何图形之后,上述执行主体可基于第一外接几何图形所围成的区域,提取目标字段。
作为示例,技术人员可以搜集大量的包含目标字段的文本图像,然后,从这些文本图像中提取目标字段,而后,统计得到文本图像和目标字段之间的对应关系表。可以理解,该对应关系表中,文本图像和目标字段关联存储。由此,上述执行主体可以使用各种抠图工具,将第一证书图像中第一外接几何图形所围成的区域之外的区域抠除,得到第一外接几何图形所围成的区域作为文本图像。从而,上述执行主体可以将得到的文本图像输入至上述对应关系表中,进而获取与输入的文本图像相同或者相似(例如相似度大于95%)的文本图像对应的目标字段。由此,上述执行主体可以将所获取的目标字段确定为提取到的目标字段。
作为示例,上述执行主体还可以使用各种文字识别算法,对第一外接几何图形所围成的区域进行识别,进而从第一外接几何图形所围成的区域中提取文字信息作为目标字段。
本申请的上述实施例提供的方法,首先,可以获取第一证书图像。然后,可以从第一证书图像中确定显示有目标字段的区域的外接几何图形。而后,可以基于所确定的外接几何图形所围成的区域,提取目标字段。可以看出,本申请的上述实施例,并非直接从第一证书图像中提取目标字段。而是先确定出第一证书图像中显示有目标字段的区域的外接几何图形,再根据所确定的外接几何图形,提取目标字段。从而降低了第一证书图像中所包括的其他区域对提取目标字段的影响,进而提高了提取目标字段的准确率。
进一步参考图3,其示出了用于提取信息的方法的又一个实施例的流程300。该用于提取信息的方法的流程300,包括以下步骤:
步骤301,获取第一证书图像。
步骤302,从第一证书图像中确定显示有目标字段的区域的外接几何图形作为第一外接几何图形。
上述步骤301到步骤302分别与前述实施例中的步骤201到步骤202一致,上文针对步骤201到步骤202的描述也适用于步骤301到
步骤302,此处不再赘述。
步骤303,基于第一外接几何图形,对第一证书图像进行裁剪,得到第四证书图像。
在本实施例中,用于提取信息的方法的执行主体(例如图1所示的服务器104)可以基于所确定的第一外接几何图形,对第一证书图像进行裁剪,进而得到第四证书图像。
作为示例,若第一外接几何图形为矩形,上述执行主体可以通过各种方法得到第四证书图像。例如,上述执行主体可以沿该矩形的每条边,将该矩形所围成的区域裁剪出来,然后,将裁剪出来的图像确定为第四证书图像。例如,上述执行主体还可以确定出与该矩形的每条边的距离为预设距离的新的外接矩形。然后,可以沿着该新的外接矩形的每条边,将该新的外接矩形所围成的区域裁剪出来。而后,可以将裁剪出来的图像确定为第四证书图像。需要说明的是,上述执行主体可以使用各种抠图工具或者抠图算法,实现对第一证书图像的裁剪。
作为示例,若第一外接几何图形不是矩形,上述执行主体可以确定第一外接几何图形的外接矩形。进而,可以通过各种方法得到第四证书图像。例如,上述执行主体可以沿该外接矩形的每条边,将该外接矩形所围成的区域裁剪出来,然后,可以将裁剪出来的图像确定为第四证书图像。例如,上述执行主体还可以确定出与该外接矩形的每条边的距离为预设距离的新的外接矩形。然后,可以沿着该新的外接矩形的每条边,将该新的外接矩形所围成的区域裁剪出来。而后,可以将裁剪出来的图像确定为第四证书图像。
步骤304,对第四证书图像进行行切割,得到至少一个行文本图像。
在本实施例中,上述执行主体可以通过各种方法对第四证书图像进行行切割,进而得到至少一个行文本图像。
作为示例,上述执行主体可以使用各种文字区域提取算法,确定出第四证书图像中每行文字信息的大致区域。然后,可以确定出每行文字信息所在的区域的外接矩形,得到至少一个外接矩形。而后,对于每一个外接矩形,可以沿着该外接矩形的宽所在的直线进行切割,以及将包括该外接矩形所围成的区域的图像确定为行文本图像。可以理解,可以得到至少一个行文本图像。
作为示例,实践中,第四证书图像中,显示有文字信息的区域的特征与相邻两行文字信息之间所间隔的区域的特征不同。由此,确定出第四证书图像中每行文字信息的大致区域之后,上述执行主体可以沿着相邻两行文字信息之间所间隔的区域,对第四证书图像进行切割。从而,可以将切割所得到的每个图像确定为一个行文本图像。可以理解,可以得到至少一个行文本图像。
步骤305,从至少一个行文本图像中选取行文本图像,以及执行如下信息提取步骤。
在本实施例中,得到至少一个行文本图像之后,上述执行主体可以从中选取行文本图像,然后执行下述步骤3051到步骤3052。
步骤3051,对选取的行文本图像进行列切割,得到文字图像集合。
首先,上述执行主体可以使用各种文字区域提取算法,确定出该行文本图像中每个文字的大致区域。然后,可以沿着相邻两个文字之间所间隔的区域,对该行文本图像进行切割。而后,可以将切割所得到的每个图像确定为一个文字图像。也就是说,可以得到多个文字图像所组成的文字图像集合。
步骤3052,对文字图像集合中的文字图像进行识别,得到选取的行文本图像中的行文字信息。
首先,上述执行主体可以使用各种文字识别算法,对所得到的文字图像集合中的文字图像进行识别,即识别出每个文字图像中显示的文字。然后,可以按照文字图像在所选取的行文本图像中的顺序,将识别出的至少一个文字进行组合。而后,可以将组合后的文字信息确定为所选取的行文本图像中的行文字信息。
步骤306,响应于确定存在未选取过的行文本图像,从上述至少一个行文本图像中选取未选取过的行文本图像,以及继续执行上述信息提取步骤。
响应于确定存在未选取过的行文本图像,上述执行主体可以选取未选取过的行文本图像。然后,可以继续执行上述步骤3051到步骤3052,直至不存在未选取过的行文本图像。也就是说,可以得到至少一条行文字信息。
在本实施例的一些可选的实现方式中,在得到至少一个行文本图像之后,上述执行主体还可以执行如下步骤S1到步骤S2。
步骤S1,对于至少一个行文本图像中的行文本图像,使用目标滑动窗口在该行文本图像上进行滑动,以及对该行文本图像中的、目标滑动窗口所在的区域进行识别,得到至少一条文字信息。
其中,目标滑动窗口可以是预先设置的具有预设尺寸和预设滑动步长的滑动窗口。目标滑动窗口还可以根据一定规则筛选得到。例如,事先可以为不同种类的证书图像设置相应的滑动窗口,那么,目标滑动窗口可以是选取的与第一证书图像的类别对应的滑动窗口。
具体地,首先,上述执行主体可以从至少一个行文本图像中选取行文本图像。然后,可以使用目标滑动窗口在该行文本图像上由左至右进行滑动。同时,可以使用各种文字识别算法,对目标滑动窗口所在的区域进行识别。可以理解,可以得到至少一条文字信息。
步骤S2,根据至少一条文字信息,生成文字信息集合。
得到至少一条文字信息之后,上述执行主体可以将至少一条文字信息所组成的集合确定为文字信息集合。
可以理解,对于每一个行文本图像,都可以得到一个对应的文字信息集合。
在本实施例的一些可选的实现方式中,上述执行主体还可以通过如下步骤,对所得到的每条行文字信息进行更新。
第一步,对于所得到的至少一条行文字信息中的行文字信息,使用该行文字信息到对应的文字信息集合中进行匹配。
此处,所说的对应,可以是与行文字信息所在的行文本图像对应的文字信息集合。
首先,上述执行主体可以从至少一条行文字信息中选取行文字信息。然后,对于选取的行文字信息,上述执行主体可以从该行文字信息中选取部分文字信息(至少包括三个文字)。然后,对于对应的文字信息集合中的每条文字信息,上述执行主体可以确定该文字信息中是否包括与上述选取的部分文字信息的首端和尾端均相同的部分文字信息。此处,首端可以是选取的部分文字信息的第一个字,尾端可以是选取的部分文字信息的最后一个字。首端还可以由选取的部分文字信息的第一个字和第二个字组成,相应地,尾端可以由选取的部分文字信息的最后一个字和倒数第二个字组成。以此类推。
若该文字信息中包括与上述选取的部分文字信息的首端和尾端均相同的部分文字信息,上述执行主体可以从该文字信息中获取该部分文字信息。可以理解,对于上述选取的部分文字信息,可以从对应的文字信息集合中,获取到至少一条部分文字信息。而后,上述执行主体可以从上述至少一条部分文字信息中确定出占多数的部分文字信息,作为上述选取的部分文字信息的匹配文字信息。
第二步,根据匹配结果,对该行文字信息进行更新。
得到匹配文字信息之后,上述执行主体可以比较上述选取的部分文字信息和匹配文字信息是否相同。若不同,可以将选取的部分文字信息中与匹配文字信息中不同的部分进行修改,进而实现对选取的行文字信息的更新。应该理解,上述执行主体可以从选取的行文字信息中选取多条部分文字信息,得到多条匹配文字信息。进而,对选取的行文字信息中不同的部分文字信息进行修改。从而,实现对选取的行文字信息的更新。
可以理解,上述执行主体可以通过上述步骤,实现对每一条行文字信息的更新。
继续参见图4,图4是根据本实施例的用于提取信息的方法的应用场景的一个示意图。在图4的应用场景中,以服务器(图中未示出)为执行主体。可选的,上述执行主体可以从智能手机(图中未示出)获取初始证书图像401。其中,初始证书图像401中显示有证书4011。此处,证书4011为XX许可证。可以看出,初始证书图像401中还显示有目标图案4012。可选的,初始证书图像401中还显示有目标边框4013。
获取初始证书图像401之后,首先,上述执行主体可以从初始证书图像401中确定显示有证书4011的区域的外接几何图形402。此处,外接几何图形402为矩形。然后,上述执行主体可以确定外接几何图形402的宽与水平方向的夹角。接着,上述执行主体可以根据所确定的夹角对初始证书图像401进行旋转,以使初始证书图像401的宽与水平方向平行。而后,上述执行主体可以通过以下步骤,得到第一证书图像403:调整初始证书图像401的尺寸,对初始证书图像401进行二值化处理,对初始证书图像401进行滤波。
得到第一证书图像403之后,首先,上述执行主体可以对第一证书图像403提取特征点,得到第一特征点集合。接着,上述执行主体可以将第一特征点集合中的特征点与预设特征点集合中的特征点进行匹配。实践中,可以通过对各种目标图案提取特征点,得到预设特征点集合。然后,上述执行主体可以根据第一特征点集合中的与预设特征点集合中的特征点匹配的特征点,得到第二特征点集合。而后,上述执行主体可以从第一证书图像403中确定第二特征点集合中的特征点所在的区域的外接几何图形404。此处,外接几何图形404为矩形。可以理解,第二特征点集合中的特征点所在的区域为目标图案4012所在的区域。进而,上述执行主体可以根据预先指定的横边比例、纵边比例和垂直距离,确定出显示有目标字段的区域的外接几何图形405。此处,外接几何图形405为矩形。
确定外接几何图形405之后,首先,上述执行主体可以沿外接几何图形405的各边,对第一证书图像403进行裁剪,得到第四证书图像406。然后,上述执行主体可以识别第四证书图像406中显示的行文字信息之间的间隙。而后,上述执行主体可以沿识别出来的间隙,对第四证书图像406进行行切割,得到行文本图像4071、4072、4073、4074、4075、4076、4077。下面以提取行文本图像4072中显示的行文字信息为例。首先,上述执行主体可以识别行文本图像4072中显示的行文字信息中每个文字之间的间隙。然后,可以沿识别出来的间隙,对行文本图像4072进行列切割,得到文字图像集合408。而后,可以对文字图像集合408中的每个文字图像进行识别,得到行文本图像4072中显示的行文字信息409。
从图3中可以看出,与图2对应的实施例相比,本实施例中的用于提取信息的方法的流程300体现了得到第四证书图像的步骤,得到至少一个行文本图像的步骤,以及得到行文字信息的步骤。由此,本实施例描述的方案,首先,可以对第一证书图像进行裁剪,得到第四证书图像。然后,可以对第四证书图像进行行切割,得到至少一个行文本图像。而后,对于每一个行文本图像,可以进行列切割,得到文字图像集合,以及对文字图像集合中的文字图像进行识别,得到该行文本图像中的行文字信息。可以看出,本实施例中,并非直接从第四证书图像中提取目标字段。而是先将第四证书图像切割成至少一个行文本图像,然后,再将每一个行文本图像切割成至少一个文字图像。由此,可以通过识别至少一个文字图像,从每一个行文本图像中提取行文字信息。进一步,实现从第四证书图像中提取目标字段。从而,降低了第四证书图像中所包括的其他区域对提取目标字段的影响,进一步提高了提取目标字段的准确率。
进一步参考图5,作为对上述各图所示方法的实现,本申请提供了用于提取信息的装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例提供的用于提取信息的装置500包括第一获取单元501、第一确定单元502和提取单元503。第一获取单元501,被配置成获取第一证书图像,其中,第一证书图像中显示有目标字段;第一确定单元502,被配置成从第一证书图像中确定显示有目标字段的区域的外接几何图形作为第一外接几何图形;提取单元503,被配置成:基于第一外接几何图形所围成的区域,提取目标字段。
在本实施例中,用于提取信息的装置500中:第一获取单元501、第一确定单元502和提取单元503的具体处理及其所带来的技术效果可分别参考图2对应实施例中的步骤201、步骤202和步骤203的相关说明,在此不再赘述。
在本实施例的一些可选的实现方式中,第一证书图像中还显示有目标图案。上述用于提取信息的装置500还包括第二确定单元(图中未示出)。其中,第二确定单元可以被配置成从第一证书图像中确定显示有目标图案的区域的外接几何图形作为第二外接几何图形。
在本实施例的一些可选的实现方式中,上述第二确定单元可以包括:提取模块(图中未示出)、匹配模块(图中未示出)、第一生成模块(图中未示出)和第一确定模块(图中未示出)。其中,提取模块可以被配置成:对第一证书图像提取特征点,得到第一特征点集合;匹配模块可以被配置成将第一特征点集合中的特征点与预设特征点集合中的特征点进行匹配;第一生成模块可以被配置成:根据第一特征点集合中的、与预设特征点集合中的特征点匹配的至少一个特征点,生成第二特征点集合;第一确定模块可以被配置成从第一证书图像中确定第二特征点集合中的特征点所在的区域的外接几何图形作为第二外接几何图形。
在本实施例的一些可选的实现方式中,上述第一确定单元502可以包括:第二确定模块(图中未示出)和第三确定模块(图中未示出)。其中,第二确定模块可以被配置成:基于第二外接几何图形和目标规则,从第一证书图像中确定显示有目标字段的区域的外接几何图形作为第三外接几何图形;第三确定模块可以被配置成:响应于确定第三外接几何图形的宽高比与目标比例之间的差距小于预设差距,将第三外接几何图形确定为第一外接几何图形。
在本实施例的一些可选的实现方式中,上述第一确定单元502还可以包括:第二生成模块(图中未示出)、第一划分模块(图中未示出)、第四确定模块(图中未示出)、第一选取模块(图中未示出)、第五确定模块(图中未示出)和第一映射模块(图中未示出)。其中,第二生成模块可以被配置成:响应于确定第三外接几何图形的宽高比与目标比例之间的差距大于等于预设差距,对第一证书图像进行膨胀腐蚀处理,生成第二证书图像;第一划分模块可以被配置成:根据膨胀腐蚀处理结果,在第二证书图像中划分出至少一个第一区域;第四确定模块可以被配置成:对于至少一个第一区域中的第一区域,将该第一区域的外接几何图形确定为第四外接几何图形;第一选取模块,被配置成从所确定的第四外接几何图形集合中选取满足预设条件的至少一个第四外接几何图形;第五确定模块可以被配置成确定包围至少一个第四外接几何图形的外接几何图形作为第五外接几何图形;第一映射模块可以被配置成将第五外接几何图形映射到第一证书图像作为第一外接几何图形。
在本实施例的一些可选的实现方式中,上述第一确定单元502可以包括:第三生成模块(图中未示出)、第二划分模块(图中未示出)、第六确定模块(图中未示出)、第二选取模块(图中未示出)、第七确定模块(图中未示出)和第二映射模块(图中未示出)。其中,第三生成模块可以被配置成:对第一证书图像进行膨胀腐蚀处理,生成第三证书图像;第二划分模块可以被配置成:根据膨胀腐蚀处理结果,在第三证书图像中划分出至少一个第二区域;第六确定模块可以被配置成:对于至少一个第二区域中的第二区域,将该第二区域的外接几何图形确定为第六外接几何图形;第二选取模块可以被配置成:从所确定的第六外接几何图形集合中选取满足预设条件的至少一个第六外接几何图形;第七确定模块可以被配置成:确定包围至少一个第六外接几何图形的外接几何图形作为第七外接几何图形;第二映射模块可以被配置成:将第七外接几何图形映射到第一证书图像作为第一外接几何图形。
在本实施例的一些可选的实现方式中,上述提取单元503可以包括:裁剪模块(图中未示出)、切割模块(图中未示出)、执行模块(图中未示出)和第三选取模块(图中未示出)。其中,裁剪模块可以被配置成:基于第一外接几何图形,对第一证书图像进行裁剪,得到第四证书图像;切割模块可以被配置成:对第四证书图像进行行切割,得到至少一个行文本图像;执行模块可以被配置成:从至少一个行文本图像中选取行文本图像,以及执行如下信息提取步骤:对选取的行文本图像进行列切割,得到文字图像集合;对文字图像集合中的文字图像进行识别,得到选取的行文本图像中的行文字信息;第三选取模块可以被配置成:响应于确定存在未选取过的行文本图像,从至少一个行文本图像中选取未选取过的行文本图像,以及继续执行信息提取步骤。
在本实施例的一些可选的实现方式中,上述用于提取信息的装置500还可以包括生成单元(图中未示出)。其中,生成单元可以被配置成:对于至少一个行文本图像中的行文本图像,使用目标滑动窗口在该行文本图像上进行滑动,以及对该行文本图像中的、所述目标滑动窗口所在的区域进行识别,得到至少一条文字信息;根据至少一条文字信息,生成文字信息集合。
在本实施例的一些可选的实现方式中,上述用于提取信息的装置500还可以包括更新单元(图中未示出)。其中,更新单元可以被配置成:对于所得到的至少一条行文字信息中的行文字信息,使用该行文字信息到对应的文字信息集合中进行匹配;根据匹配结果,对该行文字信息进行更新。
在本实施例的一些可选的实现方式中,上述用于提取信息的装置500还可以包括:第二获取单元(图中未示出)、第三确定单元(图中未示出)、第四确定单元(图中未示出)和处理单元(图中未示出)。其中,第二获取单元可以被配置成获取初始证书图像;第三确定单元可以被配置成确定初始证书图像中显示有证书的区域的外接几何图形作为第八外接几何图形;第四确定单元可以被配置成:根据第八外接几何图形,确定旋转角度;处理单元可以被配置成:基于所确定的旋转角度,对初始证书图像进行旋转处理。
在本实施例的一些可选的实现方式中,上述第一获取单元501可以包括:调整模块(图中未示出)、处理模块(图中未示出)和滤波模块(图中未示出)。其中,调整模块可以被配置成:调整旋转处理后的初始证书图像的尺寸;处理模块可以被配置成对调整尺寸后的初始证书图像进行二值化处理;滤波模块可以被配置成:对二值化处理后的初始证书图像进行滤波,以及将滤波后的初始证书图像确定为第一证书图像。
本申请的上述实施例提供的装置,首先,可以通过第一获取单元501获取第一证书图像。然后,可以通过第一确定单元502确定第一证书图像中显示有目标字段的区域的外接几何图形作为第一外接几何图形。而后,可以通过提取单元503,基于第一外接几何图形所围成的区域,提取目标字段。从而降低了第一证书图像中所包括的其他区域对提取目标字段的影响。
下面参考图6,其示出了适于用来实现本申请实施例的电子设备计算机系统600的结构示意图。图6示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的方法中限定的上述功能。
需要说明的是,本申请的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器,包括第一获取单元、第一确定单元和提取单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取第一证书图像的单元”。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取第一证书图像,其中,第一证书图像中显示有目标字段;从第一证书图像中确定显示有目标字段的区域的外接几何图形作为第一外接几何图形;基于第一外接几何图形所围成的区域,提取目标字段。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (24)
1.一种用于提取信息的方法,包括:
获取第一证书图像,其中,所述第一证书图像中显示有目标字段;
从所述第一证书图像中确定显示有所述目标字段的区域的外接几何图形作为第一外接几何图形;
基于所述第一外接几何图形所围成的区域,提取所述目标字段。
2.根据权利要求1所述的方法,其中,所述第一证书图像中还显示有目标图案;以及
所述方法还包括:
从所述第一证书图像中确定显示有所述目标图案的区域的外接几何图形作为第二外接几何图形。
3.根据权利要求2所述的方法,其中,所述从所述第一证书图像中确定显示有所述目标图案的区域的外接几何图形作为第二外接几何图形,包括:
对所述第一证书图像提取特征点,得到第一特征点集合;
将所述第一特征点集合中的特征点与预设特征点集合中的特征点进行匹配;
根据所述第一特征点集合中的、与所述预设特征点集合中的特征点匹配的至少一个特征点,生成第二特征点集合;
从所述第一证书图像中确定所述第二特征点集合中的特征点所在的区域的外接几何图形作为第二外接几何图形。
4.根据权利要求2所述的方法,其中,所述从所述第一证书图像中确定显示有所述目标字段的区域的外接几何图形作为第一外接几何图形,包括:
基于所述第二外接几何图形和目标规则,从所述第一证书图像中确定显示有所述目标字段的区域的外接几何图形作为第三外接几何图形;
响应于确定所述第三外接几何图形的宽高比与目标比例之间的差距小于预设差距,将所述第三外接几何图形确定为第一外接几何图形。
5.根据权利要求4所述的方法,其中,所述从所述第一证书图像中确定显示有所述目标字段的区域的外接几何图形作为第一外接几何图形,还包括:
响应于确定所述第三外接几何图形的宽高比与所述目标比例之间的差距大于等于所述预设差距,对所述第一证书图像进行膨胀腐蚀处理,生成第二证书图像;
根据膨胀腐蚀处理结果,在所述第二证书图像中划分出至少一个第一区域;
对于所述至少一个第一区域中的第一区域,将该第一区域的外接几何图形确定为第四外接几何图形;
从所确定的第四外接几何图形集合中选取满足预设条件的至少一个第四外接几何图形;
确定包围所述至少一个第四外接几何图形的外接几何图形作为第五外接几何图形;
将所述第五外接几何图形映射到所述第一证书图像作为第一外接几何图形。
6.根据权利要求1所述的方法,其中,所述从所述第一证书图像中确定显示有所述目标字段的区域的外接几何图形作为第一外接几何图形,包括:
对所述第一证书图像进行膨胀腐蚀处理,生成第三证书图像;
根据膨胀腐蚀处理结果,在所述第三证书图像中划分出至少一个第二区域;
对于所述至少一个第二区域中的第二区域,将该第二区域的外接几何图形确定为第六外接几何图形;
从所确定的第六外接几何图形集合中选取满足所述预设条件的至少一个第六外接几何图形;
确定包围所述至少一个第六外接几何图形的外接几何图形作为第七外接几何图形;
将所述第七外接几何图形映射到所述第一证书图像作为第一外接几何图形。
7.根据权利要求1-6中任一所述的方法,其中,所述基于所述第一外接几何图形所围成的区域,提取所述目标字段,包括:
基于所述第一外接几何图形,对所述第一证书图像进行裁剪,得到第四证书图像;
对所述第四证书图像进行行切割,得到至少一个行文本图像;
从所述至少一个行文本图像中选取行文本图像,以及执行如下信息提取步骤:对选取的行文本图像进行列切割,得到文字图像集合;对文字图像集合中的文字图像进行识别,得到选取的行文本图像中的行文字信息;
响应于确定存在未选取过的行文本图像,从所述至少一个行文本图像中选取未选取过的行文本图像,以及继续执行所述信息提取步骤。
8.根据权利要求7所述的方法,其中,在所述得到至少一个行文本图像之后,所述方法还包括:
对于所述至少一个行文本图像中的行文本图像,使用目标滑动窗口在该行文本图像上进行滑动,以及对该行文本图像中的、所述目标滑动窗口所在的区域进行识别,得到至少一条文字信息;根据至少一条文字信息,生成文字信息集合。
9.根据权利要求8所述的方法,其中,所述方法还包括:
对于所得到的至少一条行文字信息中的行文字信息,使用该行文字信息到对应的文字信息集合中进行匹配;根据匹配结果,对该行文字信息进行更新。
10.根据权利要求1-6中任一所述的方法,其中,在所述获取第一证书图像之前,所述方法还包括:
获取初始证书图像;
确定所述初始证书图像中显示有证书的区域的外接几何图形作为第八外接几何图形;
根据所述第八外接几何图形,确定旋转角度;
基于所确定的旋转角度,对所述初始证书图像进行旋转处理。
11.根据权利要求10所述的方法,其中,所述获取第一证书图像,包括:
调整旋转处理后的初始证书图像的尺寸;
对调整尺寸后的初始证书图像进行二值化处理;
对二值化处理后的初始证书图像进行滤波,以及将滤波后的初始证书图像确定为第一证书图像。
12.一种用于提取信息的装置,包括:
第一获取单元,被配置成获取第一证书图像,其中,所述第一证书图像中显示有目标字段;
第一确定单元,被配置成从所述第一证书图像中确定显示有所述目标字段的区域的外接几何图形作为第一外接几何图形;
提取单元,被配置成基于所述第一外接几何图形所围成的区域,提取所述目标字段。
13.根据权利要求12所述的装置,其中,所述第一证书图像中还显示有目标图案;
所述装置还包括:
第二确定单元,被配置成从所述第一证书图像中确定显示有所述目标图案的区域的外接几何图形作为第二外接几何图形。
14.根据权利要求13所述的装置,其中,所述第二确定单元包括:
提取模块,被配置成对所述第一证书图像提取特征点,得到第一特征点集合;
匹配模块,被配置成将所述第一特征点集合中的特征点与预设特征点集合中的特征点进行匹配;
第一生成模块,被配置成根据所述第一特征点集合中的、与所述预设特征点集合中的特征点匹配的至少一个特征点,生成第二特征点集合;
第一确定模块,被配置成从所述第一证书图像中确定所述第二特征点集合中的特征点所在的区域的外接几何图形作为第二外接几何图形。
15.根据权利要求13所述的装置,其中,所述第一确定单元包括:
第二确定模块,被配置成基于所述第二外接几何图形和目标规则,从所述第一证书图像中确定显示有所述目标字段的区域的外接几何图形作为第三外接几何图形;
第三确定模块,被配置成响应于确定所述第三外接几何图形的宽高比与目标比例之间的差距小于预设差距,将所述第三外接几何图形确定为第一外接几何图形。
16.根据权利要求15所述的装置,其中,所述第一确定单元还包括:
第二生成模块,被配置成响应于确定所述第三外接几何图形的宽高比与所述目标比例之间的差距大于等于所述预设差距,对所述第一证书图像进行膨胀腐蚀处理,生成第二证书图像;
第一划分模块,被配置成根据膨胀腐蚀处理结果,在所述第二证书图像中划分出至少一个第一区域;
第四确定模块,被配置成对于所述至少一个第一区域中的第一区域,将该第一区域的外接几何图形确定为第四外接几何图形;
第一选取模块,被配置成从所确定的第四外接几何图形集合中选取满足预设条件的至少一个第四外接几何图形;
第五确定模块,被配置成确定包围所述至少一个第四外接几何图形的外接几何图形作为第五外接几何图形;
第一映射模块,被配置成将所述第五外接几何图形映射到所述第一证书图像作为第一外接几何图形。
17.根据权利要求12所述的装置,其中,所述第一确定单元包括:
第三生成模块,被配置成对所述第一证书图像进行膨胀腐蚀处理,生成第三证书图像;
第二划分模块,被配置成根据膨胀腐蚀处理结果,在所述第三证书图像中划分出至少一个第二区域;
第六确定模块,被配置成对于所述至少一个第二区域中的第二区域,将该第二区域的外接几何图形确定为第六外接几何图形;
第二选取模块,被配置成从所确定的第六外接几何图形集合中选取满足预设条件的至少一个第六外接几何图形;
第七确定模块,被配置成确定包围所述至少一个第六外接几何图形的外接几何图形作为第七外接几何图形;
第二映射模块,被配置成将所述第七外接几何图形映射到所述第一证书图像作为第一外接几何图形。
18.根据权利要求12-17中任一所述的装置,其中,所述提取单元包括:
裁剪模块,被配置成基于所述第一外接几何图形,对所述第一证书图像进行裁剪,得到第四证书图像;
切割模块,被配置成对所述第四证书图像进行行切割,得到至少一个行文本图像;
执行模块,被配置成从所述至少一个行文本图像中选取行文本图像,以及执行如下信息提取步骤:对选取的行文本图像进行列切割,得到文字图像集合;对文字图像集合中的文字图像进行识别,得到选取的行文本图像中的行文字信息;
第三选取模块,被配置成响应于确定存在未选取过的行文本图像,从所述至少一个行文本图像中选取未选取过的行文本图像,以及继续执行所述信息提取步骤。
19.根据权利要求18所述的装置,其中,所述装置还包括:
生成单元,被配置成对于所述至少一个行文本图像中的行文本图像,使用目标滑动窗口在该行文本图像上进行滑动,以及对该行文本图像中的、所述目标滑动窗口所在的区域进行识别,得到至少一条文字信息;根据至少一条文字信息,生成文字信息集合。
20.根据权利要求19所述的装置,其中,所述装置还包括:
更新单元,被配置成对于所得到的至少一条行文字信息中的行文字信息,使用该行文字信息到对应的文字信息集合中进行匹配;根据匹配结果,对该行文字信息进行更新。
21.根据权利要求12-17中任一所述的装置,其中,所述装置还包括:
第二获取单元,被配置成获取初始证书图像;
第三确定单元,被配置成确定所述初始证书图像中显示有证书的区域的外接几何图形作为第八外接几何图形;
第四确定单元,被配置成根据所述第八外接几何图形,确定旋转角度;
处理单元,被配置成基于所确定的旋转角度,对所述初始证书图像进行旋转处理。
22.根据权利要求21所述的装置,其中,所述第一获取单元包括:
调整模块,被配置成调整旋转处理后的初始证书图像的尺寸;
处理模块,被配置成对调整尺寸后的初始证书图像进行二值化处理;
滤波模块,被配置成对二值化处理后的初始证书图像进行滤波,以及将滤波后的初始证书图像确定为第一证书图像。
23.一种电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-11中任一所述的方法。
24.一种计算机可读介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如权利要求1-11中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910005179.2A CN111401110A (zh) | 2019-01-03 | 2019-01-03 | 用于提取信息的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910005179.2A CN111401110A (zh) | 2019-01-03 | 2019-01-03 | 用于提取信息的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111401110A true CN111401110A (zh) | 2020-07-10 |
Family
ID=71430204
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910005179.2A Pending CN111401110A (zh) | 2019-01-03 | 2019-01-03 | 用于提取信息的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111401110A (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0757045A (ja) * | 1993-08-17 | 1995-03-03 | Matsushita Electric Ind Co Ltd | 運転免許証認識装置 |
CN101038686A (zh) * | 2007-01-10 | 2007-09-19 | 北京航空航天大学 | 一种基于信息融合的机读旅行证件识别方法 |
JP2008011484A (ja) * | 2006-06-02 | 2008-01-17 | Nippon Telegr & Teleph Corp <Ntt> | 文字図形列抽出装置,文字図形列抽出方法,その方法を実行するプログラム,そのプログラムを記録した記録媒体 |
WO2008060022A1 (en) * | 2006-11-13 | 2008-05-22 | Electronics And Telecommunications Research Institute | System and method for evaluating and certifying image identifier |
US20130058575A1 (en) * | 2011-09-06 | 2013-03-07 | Qualcomm Incorporated | Text detection using image regions |
WO2017140233A1 (zh) * | 2016-02-18 | 2017-08-24 | 腾讯科技(深圳)有限公司 | 文字检测方法及系统、设备、存储介质 |
US20180253602A1 (en) * | 2015-03-04 | 2018-09-06 | Au10Tix Limited | Methods for categorizing input images for use e.g. as a gateway to authentication systems |
CN108875451A (zh) * | 2017-05-10 | 2018-11-23 | 腾讯科技(深圳)有限公司 | 一种定位图像的方法、装置、存储介质和程序产品 |
WO2020062804A1 (zh) * | 2018-09-25 | 2020-04-02 | 平安科技(深圳)有限公司 | 自然场景中行驶证拍照影像的识别方法、装置及电子设备 |
-
2019
- 2019-01-03 CN CN201910005179.2A patent/CN111401110A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0757045A (ja) * | 1993-08-17 | 1995-03-03 | Matsushita Electric Ind Co Ltd | 運転免許証認識装置 |
JP2008011484A (ja) * | 2006-06-02 | 2008-01-17 | Nippon Telegr & Teleph Corp <Ntt> | 文字図形列抽出装置,文字図形列抽出方法,その方法を実行するプログラム,そのプログラムを記録した記録媒体 |
WO2008060022A1 (en) * | 2006-11-13 | 2008-05-22 | Electronics And Telecommunications Research Institute | System and method for evaluating and certifying image identifier |
CN101038686A (zh) * | 2007-01-10 | 2007-09-19 | 北京航空航天大学 | 一种基于信息融合的机读旅行证件识别方法 |
US20130058575A1 (en) * | 2011-09-06 | 2013-03-07 | Qualcomm Incorporated | Text detection using image regions |
US20180253602A1 (en) * | 2015-03-04 | 2018-09-06 | Au10Tix Limited | Methods for categorizing input images for use e.g. as a gateway to authentication systems |
WO2017140233A1 (zh) * | 2016-02-18 | 2017-08-24 | 腾讯科技(深圳)有限公司 | 文字检测方法及系统、设备、存储介质 |
CN108875451A (zh) * | 2017-05-10 | 2018-11-23 | 腾讯科技(深圳)有限公司 | 一种定位图像的方法、装置、存储介质和程序产品 |
WO2020062804A1 (zh) * | 2018-09-25 | 2020-04-02 | 平安科技(深圳)有限公司 | 自然场景中行驶证拍照影像的识别方法、装置及电子设备 |
Non-Patent Citations (3)
Title |
---|
卢均溢: ""牌照证件光学字符识别研究"" * |
吴遹 等: "一种机读旅行证件信息自动识别方法" * |
陈笑 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110705583B (zh) | 细胞检测模型训练方法、装置、计算机设备及存储介质 | |
CN108229299A (zh) | 证件的识别方法和装置、电子设备、计算机存储介质 | |
KR101769918B1 (ko) | 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치 | |
KR102211763B1 (ko) | 글자 검출 장치, 방법 및 시스템 | |
CN110084172B (zh) | 文字识别方法、装置和电子设备 | |
CN112085022B (zh) | 一种用于识别文字的方法、系统及设备 | |
US20210200971A1 (en) | Image processing method and apparatus | |
CN110211195B (zh) | 生成图像集合的方法、装置、电子设备和计算机可读存储介质 | |
CN108717744B (zh) | 识别金融单据上的印章序号的方法、装置及终端设备 | |
CN107545223B (zh) | 图像识别方法及电子设备 | |
CN109766885A (zh) | 一种文字检测方法、装置、电子设备及存储介质 | |
CN112801232A (zh) | 一种应用于处方录入的扫描识别方法及系统 | |
CN111523531A (zh) | 文字处理方法、装置、电子设备及计算机可读存储介质 | |
CN110796130A (zh) | 用于文字识别的方法、装置及计算机存储介质 | |
EP3869398A2 (en) | Method and apparatus for processing image, device and storage medium | |
WO2015074405A1 (en) | Methods and devices for obtaining card information | |
CN114445825A (zh) | 文字检测方法、装置、电子设备和存储介质 | |
CN112380978B (zh) | 基于关键点定位的多人脸检测方法、系统及存储介质 | |
CN111400524B (zh) | 一种基于ai的可变尺度地质图文本矢量化方法及系统 | |
CN108664948B (zh) | 用于生成信息的方法和装置 | |
CN110321854B (zh) | 用于检测目标对象的方法和装置 | |
KR20180126352A (ko) | 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치 | |
CN114998897B (zh) | 生成样本图像的方法以及文字识别模型的训练方法 | |
CN111401110A (zh) | 用于提取信息的方法和装置 | |
US20230005171A1 (en) | Visual positioning method, related apparatus and computer program product |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |