具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实 施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅 用以解释本申请,并不用于限定本申请。
本申请提供的印章图像识别分类方法,可以应用于如图1所示的应用环境 中。其中,终端101通过网络与数据处理设备102进行通信。其中,终端101 可以是各种摄像或扫描装置,用于拍摄或扫描带有印章的图像,包括各种有价 文件如发票、存单、支票等,数据处理设备102可以个人计算机、笔记本电脑、 智能手机、平板电脑和便携式可穿戴设备、还可以用独立的服务器或者是多个 服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种印章图像识别分类方法,以该 方法应用于图1中的数据处理设备102为例进行说明,包括以下步骤:
步骤S201,获取包含印章的图像。
具体地,数据处理设备102从终端101获取包含印章的图像,该图像可以 是扫描装置扫描有价文件或其他加盖印章的文档后获取的。在本实施例中,例 如数据处理设备102获取的图像A,宽度为W,高度为H。
步骤S202,针对图像中的印章区域求取印章连通域。
其中,连通域,也称为连通区域,一般是指图像中具有相同像素值且位置 相邻的前景像素点组成的图像区域。印章连通域是指对上述图像中的印章进行 连通域分析后得到的带有标记的联通区域。连通区域分析是指将图像中的各个 连通区域找出并标记。
具体地,对上述图像A进行连通域分析得到印章连通域B0,其中,连通域 分析方法可使用Two-Pass方法。
可选地,通常是将原图像进行二值化处理后得到二值图像,再在二值图像 的基础上进行连通域分析,以便得到更准确的印章连通域。例如,可对上述图 像A进行二值化处理得到二值图像C,二值图像C的高度与宽度与图像A相同, 二值化方法可采用平均灰度阈值法。
步骤S203,将印章连通域以预设角度,且以固定的方向旋转多次,每次求 取旋转后的印章连通域的外接矩形,得到多个外接矩形。
具体地,对上述印章连通域B0求取外接矩形,并得到外接矩形几何特征G0, 其中G0包含(x,y)、宽度w、高度h和面积信息area=w*h,数据结构表达为:坐 标G0.x、坐标G0.y、宽度G0.w、高度G0.h和面积G0.area=G0.w*G0.h,以下同理。
对B0按θ角度进行固定方向(例如可以是顺时针或逆时针)旋转得到B1,对B1求取外接矩形几何特征G1;对B0按2θ角度进行顺时针旋转得到B2,对B2求取外 接矩形几何特征G2,以此类推,最终会得到N个连通域图像,记为Bi,i=0,1,...,N-1 和N个连通域的外接矩形特征,记为Gi,i=0,1,...,N-1。其中,θ∈(0,90],较好的经 验值为θ=0.5度,对应的N=90/θ。
步骤S204,计算各个外接矩形的面积;
具体地,各个外接矩形的面积已包含于上述外接矩形几何特征 Gi,i=0,1,...,N-1中,因此,可从中获取各个外接矩形的面积。
步骤S205,根据各个外接矩形的面积的大小关系,对所述印章进行分类。
具体地,对于圆章而言,外接矩形的面积不会随着连通域的旋转而变化, 即连通域旋转后对应的外接矩形面积恒等,因此,可根据各个外接矩形的面积 大小关系,对印章进行分类。
上述实施例,通过获取包含印章的图像;针对图像中的印章区域求取印章 连通域;将印章连通域以预设角度,且以固定的方向旋转多次,每次求取旋转 后的印章连通域的外接矩形,得到多个外接矩形;计算各个外接矩形的面积; 根据各个外接矩形的面积的大小关系,对印章进行分类。该方法能够基于印章 连通域的外接矩形的旋转变化情况,分类出不同印章,同时实现印章的校正处 理,相比于传统的基于边缘检测的分类方法,该方法不需要对先验数据进行采 集训练,简化了分类流程,容易实现,进一步提高了印章图像分类的效率。
在一实施例中,上述步骤S205,包括:若各个外接矩形的面积恒等,则判 断印章为圆章。
具体地,对于圆章而言,外接矩形的面积不会随着连通域的旋转而变化, 即连通域旋转后对应的外接矩形面积恒等。因此,可根据各个外接矩形的面积 大小关系区分出圆章。即上述各个外接矩形的面积若恒定,则判定对应的印章 为圆章。
上述实施例,通过判断外接矩形的面积大小区分出圆章,不需要对先验数 据进行采集训练,简化了分类流程,容易实现,进一步提高了印章图像分类的 效率。
在一实施例中,上述步骤S205,还包括:若各个外接矩形的面积不恒等, 则判断印章为方章。
具体地,对于方章而言,由于印章连通域每次旋转后对应的外接矩形不同, (注意,此处的外接矩形的边为水平边或垂直边,即均为正立的矩形),导致外 接矩形的面积也不相同。因此,当判断上述多个外接矩形的面积不恒等时,则 判断印章为方章。上述实施例,通过方章的外接矩形面积不恒等这一特性区分 出方章,不需要对先验数据进行采集训练,简化了分类流程,容易实现,进一 步提高了印章图像分类的效率。
在一实施例中,上述判断印章为方章之后,还包括:获取方章对应的多个 外接矩形中面积最小的最小矩形;获取最小矩形对应的旋转次数和旋转角度; 根据旋转角度和固定的方向对方章进行旋转校正,得到并输出校正后的方章。
具体地,对于方章而言,当印章连通域的外接矩形与印章连通域本身重合 时,其外接矩形的面积最小。因此,对外接矩形特征G
i中的面积进行求最小值,
在最小值时为方章正立放置的方位,据此可对方章 进行校正处理。外接矩形最小时对应的印章连通域B
id,id∈[0,N)即为印章的最佳 校正效果,即得到方章的最佳校正旋转角度为id*θ,id∈[0,N)。根据上述旋转方 向对印章连通域进行反方向地旋转校正即可。
上述实施例,利用最小外接矩形对应的旋转角度对方章进行旋转校正,能 够实现对方章的校正处理。
在一实施例中,上述多个外接矩形包括基准外接矩形;基准外接矩形是未 对所述印章连通域以所述预设角度、固定的方向旋转时对应的外接矩形。
具体地,由于印章连通域未旋转时对应的外接矩形可能为最小外接矩形, 因此需要计算未开始旋转时的外接矩形面积。
上述实施例,通过计入未开始旋转时的外接矩形的面积,能够实现更全面、 准确的计算和校正处理。
下面以上述印章图像识别分类方法在一具体应用场景中的应用进行说明:
第一、采集文件得到图像A,宽度为W,高度为H,作为数据处理设备的输入;
第二、将输入的图像A进行二值化处理得到图像C,宽度和高度与图像A相 同,二值化方法可采用平均灰度阈值法;
第三、对图像C中的连通域特征提取。得到连通域特征区域B0,对G0求取 外接矩形几何特征G0,其中G0包含坐标(x,y)、宽度w、高度h和面积信息 area=w*h,数据结构表达为:坐标G0.x、坐标G0.y、宽度G0.w、高度G0.h和面积 G0.area=G0.w*G0.h,以下同理;
第四、对B0按θ角度进行顺时针旋转得到B1,对B1求取外接矩形几何特征G1; 对B0按2θ角度进行顺时针旋转得到B2,对B2求取外接矩形几何特征G2,以此类 推,最终会得到N个连通域图像,记为Bi,i=0,1,...,N-1和N个连通域的外接矩形 特征,记为Gi,i=0,1,...,N-1。其中,θ∈(0,90],较好的经验值为θ=0.5度,对应的 N=90/θ。
第五、对外接矩形特征Gi中的面积进行求最小值,
显而易见,对于圆章而言,外接矩形的面积不会随 着连通域的旋转而变化,即连通域旋转后对应的外接矩形面积恒等。由此,对 G
id,id∈[0,N)与G
i,i=0,1,...,N-1内的面积进行比较统计,当得到面积恒等的结果 时,即可分类为圆章,反之,分类为方章。进一步地,对于方章而言,当其连 通域的外接矩形与连通域本身重合时,其外接矩形的面积最小。由此,可以推 断出B
id,id∈[0,N)即为印章的最佳校正效果,即得到方章的最佳校正旋转角度为 id*θ,id∈[0,N)。
第六、输出印章的分类信息,根据得到的最佳旋转角度,对方章进行旋转 校正输出,圆章则不用旋转。
至此,方法结束。
上述实施例,在有价文件实物以任意方向放入扫描装置中时,获取影像信 息,根据影像信息,提取印章的初始连通域,同时求取对应连通域的外接矩形 特征,然后,对初始连通域依次以一定的倍数角度按顺时针方向旋转,对应得 到不同旋转角度下的外接矩形特征,最终求最小外接矩形特征作为分类特征, 回归推断出印章的类别。进而根据最佳旋转角度信息,对印章的进行旋转校正。 最终完成了对有价文件验证分类。本实施例中的分类方法,不需要先验图像数 据进行学习训练,成本非常低。同时相比于传统的边缘检测和边界拟合方法, 本发明的验印分类系统,可以更好适用于有价文件印章角度随机性和印章边缘 残缺等难点场景。因此,本实施例提供的方案极大地提升了有价文件验印分类 性能。进一步地,相对于传统的使用边缘检测的算法,本实施例提供的方法, 不需要事先采集标注大量印章连通域对模型进行训练,简化了识别过程,容易 实现、速度快及鲁棒性好。
应该理解的是,虽然图2的流程图中的各个步骤按照箭头的指示依次显示, 但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的 说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执 行。而且,图2中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步 骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这 些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其 它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图3所示,提供了一种印章图像识别分类装置300,包 括:图像获取模块301、连通域求取模块302、外接矩形旋转模块303、面积计 算模块304和印章分类模块305,其中:
图像获取模块301,用于获取包含印章的图像;
连通域求取模块302,用于针对所述图像中的印章区域求取印章连通域;
外接矩形旋转模块303,用于将所述印章连通域以预设角度,且以固定的方 向旋转多次,每次求取旋转后的印章连通域的外接矩形,得到多个外接矩形;
面积计算模块304,用于计算各个外接矩形的面积;
印章分类模块305,用于根据所述各个外接矩形的面积的大小关系,对所述 印章进行分类。
在一实施例中,上述印章分类模块305,进一步用于:若所述各个外接矩形 的面积恒等,则判断所述印章为圆章。
在一实施例中,上述印章分类模块305,进一步用于:若所述各个外接矩形 的面积不恒等,则判断所述印章为方章。
在一实施例中,还包括印章校正单元,用于:获取所述方章对应的多个外 接矩形中面积最小的最小矩形;获取所述最小矩形对应的旋转次数和旋转角度; 根据所述旋转角度和所述固定的方向对所述方章进行旋转校正,得到并输出校 正后的方章。
在一实施例中,所述多个外接矩形包括基准外接矩形;所述基准外接矩形 是未对所述印章连通域以所述预设角度、固定的方向旋转时对应的外接矩形。
在一实施例中,上述连通域求取模块302,还用于:针对所述图像进行二值 化处理,得到二值图像;针对所述二值图像中的印章区域求取印章连通域。
在一实施例中,上述连通域求取模块302,进一步用于:利用平均灰度阈值 法针对所述包含印章的图像中的像素进行处理,得到所述二值图像。
关于印章图像识别分类装置的具体限定可以参见上文中对于印章图像识别 分类方法的限定,在此不再赘述。上述印章图像识别分类装置中的各个模块可 全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于 或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的 存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器, 其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、 存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。 该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介 质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中 的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储印 章连通域、外接矩形特征以及印章分类信息。该计算机设备的网络接口用于与 外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种印章 图像识别分类方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其 内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、 存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提 供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。 该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存 储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口 用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商 网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种印章图像识别分类方法。该计算机设备的显示屏可以是液晶显示屏或者 电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也 可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、 触控板或鼠标等。
本领域技术人员可以理解,图4-5中示出的结构,仅仅是与本申请方案相关 的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定, 具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件, 或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器 中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取包含印章的图像;
针对所述图像中的印章区域求取印章连通域;
将所述印章连通域以预设角度,且以固定的方向旋转多次,每次求取旋转 后的印章连通域的外接矩形,得到多个外接矩形;
计算各个外接矩形的面积;
根据所述各个外接矩形的面积的大小关系,对所述印章进行分类。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
若所述各个外接矩形的面积恒等,则判断所述印章为圆章。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
若所述各个外接矩形的面积不恒等,则判断所述印章为方章。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取所述方章对应的多个外接矩形中面积最小的最小矩形;
获取所述最小矩形对应的旋转次数和旋转角度;
根据所述旋转角度和所述固定的方向对所述方章进行旋转校正,得到并输 出校正后的方章。
在一个实施例中,所述多个外接矩形包括基准外接矩形;所述基准外接矩 形是未对所述印章连通域以所述预设角度、固定的方向旋转时对应的外接矩形。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
对所述图像进行二值化处理,得到二值图像;
针对所述二值图像中的印章区域求取印章连通域。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
利用平均灰度阈值法针对所述包含印章的图像中的像素进行处理,得到所 述二值图像。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程 序,计算机程序被处理器执行时实现以下步骤:
获取包含印章的图像;
针对所述图像中的印章区域求取印章连通域;
将所述印章连通域以预设角度,且以固定的方向旋转多次,每次求取旋转 后的印章连通域的外接矩形,得到多个外接矩形;
计算各个外接矩形的面积;
根据所述各个外接矩形的面积的大小关系,对所述印章进行分类。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
若所述各个外接矩形的面积恒等,则判断所述印章为圆章。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
若所述各个外接矩形的面积不恒等,则判断所述印章为方章。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取所述方章对应的多个外接矩形中面积最小的最小矩形;
获取所述最小矩形对应的旋转次数和旋转角度;
根据所述旋转角度和所述固定的方向对所述方章进行旋转校正,得到并输 出校正后的方章。
在一个实施例中,所述多个外接矩形包括基准外接矩形;所述基准外接矩 形是未对所述印章连通域以所述预设角度、固定的方向旋转时对应的外接矩形。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
针对所述图像进行二值化处理,得到二值图像;
针对所述二值图像中的印章区域求取印章连通域。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
利用平均灰度阈值法针对所述包含印章的图像中的像素进行处理,得到所 述二值图像。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程, 是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于 一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述 各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、 存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的 至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁 带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory, SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述 实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特 征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细, 但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的 普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改 进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权 利要求为准。