CN111860536A - 一种图像识别方法、装置及存储介质 - Google Patents

一种图像识别方法、装置及存储介质 Download PDF

Info

Publication number
CN111860536A
CN111860536A CN202010584667.6A CN202010584667A CN111860536A CN 111860536 A CN111860536 A CN 111860536A CN 202010584667 A CN202010584667 A CN 202010584667A CN 111860536 A CN111860536 A CN 111860536A
Authority
CN
China
Prior art keywords
image
seal
detected
standard
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010584667.6A
Other languages
English (en)
Other versions
CN111860536B (zh
Inventor
朱鹏飞
钱钢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Nanshen Audit Big Data Research Institute Co Ltd
Original Assignee
Nanjing Nanshen Audit Big Data Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Nanshen Audit Big Data Research Institute Co Ltd filed Critical Nanjing Nanshen Audit Big Data Research Institute Co Ltd
Priority to CN202010584667.6A priority Critical patent/CN111860536B/zh
Publication of CN111860536A publication Critical patent/CN111860536A/zh
Priority to PCT/CN2020/132197 priority patent/WO2021258634A1/zh
Application granted granted Critical
Publication of CN111860536B publication Critical patent/CN111860536B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/30Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种图像识别方法、装置及存储介质,涉及图像处理技术领域,将归一化处理后的标准印章图像进行灰度化处理、特征向量化处理和训练样本集,得到训练好的样本集并对训练好的样本集按照预定规则进行分类,得到分类识别模型;分类识别模型对归一化处理后的待检测印章图像进行识别,并根据颜色矩阵,采用Match算法,计算出标准印章图像与待检测印章图像的匹配度。本申请技术方案是针对识别印章而提出的,印章具有相似性,便于训练模型,且训练出的模型识别度较高,不需要通过大量的实验获得经验数据,或者通过专家系统技术来获得,节省了时间,本技术方案能代替人工鉴别印章真伪,且识别目标图像的过程速度相对较快、技术简单、识别准确率高。

Description

一种图像识别方法、装置及存储介质
技术领域
本发明涉及图像处理技术领域,具体而言,涉及一种图像识别方法、装置及存储介质。
背景技术
一些场景中,需要对印章(公章、法人章、财务章等)进行鉴别真伪,对于相关人员来说,鉴别较多数量的印章,需要付出很大的精力,且识别效率低。
因此,目前急需一种便于鉴别印章真伪的方案,以节省人力,提高工作效率。
发明内容
为了克服上述问题或者至少部分地解决上述问题,本发明实施例提供一种图像识别方法、装置及存储介质。
本发明的实施例是这样实现的:
一种图像识别方法,包括以下步骤:
对标准印章图像进行处理:采集多个标准印章图像并对多个标准印章图像进行归一化处理生成图像原料库;将图像原料库中的图像进行灰度化处理、特征向量化处理和训练样本集,得到训练好的样本集并对训练好的样本集按照预定规则进行分类,得到至少一个分类识别模型;
对待检测印章图像进行处理:采集待检测印章图像并将待检测印章图像进行归一化处理;
识别待检测印章图像:包括将归一化处理后的待检测印章图像交给训练好的样本集进行机器识别,识别后打上对应标签,生成标签待检测印章图像;
匹配度计算:将标签待检测印章图像与对应的分类识别模型中的已处理标准印章图像进行匹配度对比,根据颜色矩阵,采用Match算法,计算出标准印章图像与待检测印章图像的匹配度;
识别结果:若标准印章图像与待检测印章图像的匹配度大于预设值,则判定待检测印章图像合格,反之为不合格。
在本发明的一些实施例中,一种图像识别方法,识别结果的步骤中,包括可视化输出:将标准印章图像与待检测印章图像的匹配度以图形方式展示出匹配度百分比,并呈现出标准印章图像与待检测印章图像的异常点,以矩阵图的方式展示标准印章图像与待检测印章图像的颜色空间不同点。
在本发明的一些实施例中,一种图像识别方法,采集多个标准印章图像并对多个标准印章图像进行归一化处理的步骤包括:
电子扫描:扫描标准纸质化文件得到电子扫描件,以印章类别命名文件名,并在名称后加序号表示同一个类型图像的多个样本;
获取红色图章层,将电子扫描件通过图像的RGB通道,打开红滤色镜既Red滤色镜后,除去背景,保留前景色,得到电子扫描件中的红色图章层;
图像边界检测与剪切,将红色图章层基于傅里叶变换实现的旋转校正、读入原图、灰度化、高斯模糊、二值化、检测物体边界、计算出红色图章层被旋转的角度、将红色图章层旋转特定的角度,再通过物体颜色边界识别,标注图像长宽,截去空白区域并保留图像图形大小;
将经过图像边界检测与剪切的图像进行归一化格式输出。
在本发明的一些实施例中,一种图像识别方法,将图像原料库中的图像进行灰度化处理、特征向量化处理的步骤包括:
提取归一化处理后的标准印章图像的特征向量后进行灰度化处理,提取256阶数字。
在本发明的一些实施例中,一种图像识别方法,训练样本集包括以下步骤:通过对每个类别100个以上的样本进行PCA机器学习,并生成分类识别模型,保存到磁盘,需要时直接载入使用。
在本发明的一些实施例中,一种图像识别方法,采用直方图颜色空间样点距离比较法得到颜色矩阵。
在本发明的一些实施例中,一种图像识别方法,标准印章图像与待检测印章图像的匹配度的比较就是通过提取其直方颜色空间图,形成颜色矩阵,计算两个直方图颜色矩阵点的距离依照公式1进行直方图相似匹配度的定量度量,公式1如下:
Figure BDA0002553617190000031
公式1中:
Match:获得原图和对比图的匹配度
M为直方图,P为对比原图,M为需要比较的直方颜色矩阵图;
N为颜色空间样点数,以及为图的像素集;
Max(pi,mi):遍历所有颜色空间样点差值,取最大值。
在本发明的一些实施例中,一种图像识别方法,将公式1平方差后再开根号,得到公式2,公式2如下:
Figure BDA0002553617190000041
公式2与公式1不同点在于计算像素点距离差的方法,进行平方差后开根累计,以凸显细微误差;
公式2中的Max(pi,mi):此处遍历所有颜色空间样点方差开方值,取最大值。
一种图像识别装置,包括:一个或多个处理器;
存储装置,用于存储一个或多个程序;
当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现图像识别方法。
一种存储介质,其存储有计算机程序,该程序被处理器执行时实现图像识别的方法。
本发明实施例至少具有如下优点或有益效果:
一种图像识别方法,将归一化处理后的标准印章图像进行灰度化处理、特征向量化处理和训练样本集,得到训练好的样本集并对训练好的样本集按照预定规则进行分类,得到分类识别模型;分类识别模型对归一化处理后的待检测印章图像进行识别,并根据颜色矩阵,采用Match算法,计算出标准印章图像与待检测印章图像的匹配度,根据匹配度则判定待检测印章图像合格,反之为不合格。本申请技术方案是针对识别印章而提出的,印章具有相似性,例如:印章大都为圆形、椭圆形,为红色,直径为4.2cm,中央一律刊五角星,星尖直径为1.4cm,圆边宽为0.12cm,五角星外刊单位名称,自左而右环行,或者名称的前段自左而右环行、后段自左而右横行,即单位部门名称放在星下方作横排,印文使用简化的宋体字;印章具有相似性,便于训练模型,且训练出的模型识别度较高,不需要通过大量的实验获得经验数据,或者通过专家系统技术来获得,节省了时间,本技术方案能代替人工鉴别印章真伪,且识别目标图像的过程速度相对较快、技术简单、识别准确率高。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明一种图像识别方法一实施例的流程图;
图2为本发明一种图像识别方法另一实施例的流程图;
图3为本发明一种图像识别方法、装置及存储介质一实施例的匹配度计算过程示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本发明实施例的描述中,“多个”代表至少2个。
在本发明实施例的描述中,还需要说明的是,除非另有明确的规定和限定,若出现术语“设置”、“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
实施例
印章规格介绍,国有企业、国营股份制企业等印章(包括公司章、部门章)一律为圆形,直径为4.2cm,中央一律刊五角星,星尖直径为1.4cm,圆边宽为0.12cm,五角星外刊单位名称,自左而右环行,或者名称的前段自左而右环行、后段自左而右横行,即单位部门名称放在星下方作横排,印文使用简化的宋体字。其他图像类似。
PIL介绍,PIL(Python Image Library)是python的第三方图像处理库,但是由于其强大的功能与众多的使用人数,已经被认为是python官方图像处理库了。其官方主页为:PIL,http://pythonware.com/products/pil/。
scikit-learn PCA算法介绍,PCA(Principal Component Analysis,简称PCA),在scikit-learn中,PCA是一种无参数的数据降维方法,PCA是从方差角度,特征值和特征向量以及SVD奇异值降维。
请参照图1,本实施例提供一种图像识别方法,基于PIL技术处理图像,包括以下步骤:
S10:对标准印章图像进行处理:采集多个标准印章图像并对多个标准印章图像进行归一化处理生成图像原料库;将图像原料库中的图像进行灰度化处理、特征向量化处理和训练样本集,得到训练好的样本集并对训练好的样本集按照预定规则进行分类,得到至少一个分类识别模型;
S11:对待检测印章图像进行处理:采集待检测印章图像并将待检测印章图像进行归一化处理;
S12:识别待检测印章图像:包括将归一化处理后的待检测印章图像交给训练好的样本集进行机器识别,识别后打上对应标签,生成标签待检测印章图像;
S13:匹配度计算:将标签待检测印章图像与对应的分类识别模型中的已处理标准印章图像进行匹配度对比,根据颜色矩阵,采用Match算法,计算出标准印章图像与待检测印章图像的匹配度;
S14:识别结果:若标准印章图像与待检测印章图像的匹配度大于预设值,则判定待检测印章图像合格,反之为不合格。
需要说明的是:本实施例采用PCA算法训练模型,PCA算法降维减少内存或者硬盘的使用,加快机器学习的速度。
设计原理:经过长期的研究和实践,发明人发现,现有技术中,在一些场景中,需要对印章(公章、法人章、财务章等)进行鉴别真伪,对于相关人员来说,鉴别较多数量的印章,需要付出很大的精力,且识别效率低。鉴于此,本申请提供一种图像识别方法,将归一化处理后的标准印章图像进行灰度化处理、特征向量化处理和训练样本集,得到训练好的样本集并对训练好的样本集按照预定规则进行分类,得到分类识别模型;分类识别模型对归一化处理后的待检测印章图像进行识别,并根据颜色矩阵,采用Match算法,计算出标准印章图像与待检测印章图像的匹配度,根据匹配度则判定待检测印章图像合格,反之为不合格。本申请技术方案是针对识别印章而提出的,印章具有相似性,例如:印章大都为圆形、椭圆形,为红色,直径为4.2cm,中央一律刊五角星,星尖直径为1.4cm,圆边宽为0.12cm,五角星外刊单位名称,自左而右环行,或者名称的前段自左而右环行、后段自左而右横行,即单位部门名称放在星下方作横排,印文使用简化的宋体字;印章具有相似性,便于训练模型,且训练出的模型识别度较高,不需要通过大量的实验获得经验数据,或者通过专家系统技术来获得,节省了时间,本技术方案能代替人工鉴别印章真伪,且识别目标图像的过程速度相对较快、技术简单、识别准确率高。
在本发明的一些实施例中,一种图像识别方法,所述识别结果的步骤中,包括可视化输出:将标准印章图像与待检测印章图像的匹配度以图形方式展示出匹配度百分比,并呈现出标准印章图像与待检测印章图像的异常点,以矩阵图的方式展示标准印章图像与待检测印章图像的颜色空间不同点。
请参考图2,进一步的,考虑到印章图像一般覆盖不同文档不同位置,要将纯粹的印章图像从复杂的背景中剥离出来,需要通过一系列的图形转换和算法处理,并且要实现自动化完成,采集多个所述标准印章图像并对多个所述标准印章图像进行归一化处理的步骤包括:
S100:电子扫描:扫描标准纸质化文件得到电子扫描件,电子扫描件优选JPG格式,以印章类别命名文件名,并在名称后加序号表示同一个类型图像的多个样本,例如财务章001-200;
S101:获取红色图章层,将电子扫描件通过图像的RGB通道,打开红滤色镜既Red滤色镜后,除去背景,保留前景色,得到电子扫描件中的红色图章层;
S102:图像边界检测与剪切,将红色图章层基于傅里叶变换实现的旋转校正、读入原图、灰度化、高斯模糊、二值化、检测物体边界、计算出红色图章层被旋转的角度、将红色图章层旋转特定的角度,再通过物体颜色边界识别,标注图像长宽,截去空白区域并保留图像图形大小;
S103:将经过图像边界检测与剪切的图像进行归一化格式输出,本实施例优选图形长*宽为160*160。
进一步的,所述将所述图像原料库中的图像进行灰度化处理、特征向量化处理的步骤包括:
提取归一化处理后的标准印章图像的特征向量后进行灰度化处理,提取256阶数字。通过Stamps2vector技术提取图像的特征向量,灰度化处理后提取256阶数字,本实施例优化算法,降噪降维,提高标识度;训练样本库形如:
审计公章,某某公司;0,0,0,12,14,15,……;
审计公章,某某公司;0,0,0,12……;
审计财务章,某某公司;0,0,0,12……;
审计财务章,某某公司;0,0,0,12……;
第一栏:标签,公司名;后续160*160个图像灰度化的像素点,并将大于180的都定义为白色,置值零,其他值保留,并256-原值,定义黑色灰度。
优选的,所述训练样本集包括以下步骤:通过对每个类别100个以上的样本进行PCA机器学习,并生成分类识别模型,保存到磁盘,需要时直接载入使用。
优选的,采用直方图颜色空间样点距离比较法得到所述颜色矩阵。
进一步的,考虑到印章特点是图像色彩单一、去背景降噪、深化细节特征点,因此采用直方图颜色空间样点距离比较法His-Matching。两个图的匹配度比较就是通过提取其直方颜色空间图,形成颜色矩阵,计算两个直方图颜色矩阵点的距离,本实施例依照如公式1进行直方图相似匹配度的定量度量,公式如下:
Figure BDA0002553617190000111
公式1中:
Match:获得原图和对比图的匹配度
M为直方图,P为对比原图,M为需要比较的直方颜色矩阵图;
N为颜色空间样点数,以及为图的像素集;
Max(pi,mi):遍历所有颜色空间样点差值,取最大值。
在本发明的一些实施例中,一种图像识别方法,将公式1平方差后再开根号,得到公式2,公式2如下:
Figure BDA0002553617190000112
所述公式2与公式1不同点在于计算像素点距离差的方法,进行平方差后开根累计,以凸显细微误差;
公式2中的Max(pi,mi):此处遍历所有颜色空间样点方差开方值,取最大值。
请参考图3,载入标准印章图像和待检测印章图像,进行图像灰度化、归一化,提取图像特征颜色矩阵,提取整副图像的直方颜色空间图,形成颜色矩阵,计算图像直方图颜色矩阵点的距离,与原始图像的参数进行对比,计算出匹配度。进行颜色空间直方图矩阵点距离计算,距累计计算。
优化方案:
将整幅图像进行图像切分,再对相应的每个小块分别进行匹配度计算,最后根据各小块的累计平均匹配度来反映整个图片的相似度。即,把规则图像分为n*n块,每块的分辨率为160/n*160/n,本案将n设定为4。
采用公式2,扩大细微误差值,也可进行改进公式1,采用平方差,再开根号,与不同点在于计算像素点距离差的方法,进行平方差后开根累计,可以凸显细微误差。
一种图像识别装置,包括:一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现图像识别方法,例如识别,S10:对标准印章图像进行处理:采集多个标准印章图像并对多个标准印章图像进行归一化处理生成图像原料库;将图像原料库中的图像进行灰度化处理、特征向量化处理和训练样本集,得到训练好的样本集并对训练好的样本集按照预定规则进行分类,得到至少一个分类识别模型;S11:对待检测印章图像进行处理:采集待检测印章图像并将待检测印章图像进行归一化处理;S12:识别待检测印章图像:包括将归一化处理后的待检测印章图像交给训练好的样本集进行机器识别,识别后打上对应标签,生成标签待检测印章图像;S13:匹配度计算:将标签待检测印章图像与对应的分类识别模型中的已处理标准印章图像进行匹配度对比,根据颜色矩阵,采用Match算法,计算出标准印章图像与待检测印章图像的匹配度;S14:识别结果:若标准印章图像与待检测印章图像的匹配度大于预设值,则判定待检测印章图像合格,反之为不合格。
一种存储介质,其存储有计算机程序,该程序被处理器执行时实现图像识别方法。例如识别,S10:对标准印章图像进行处理:采集多个标准印章图像并对多个标准印章图像进行归一化处理生成图像原料库;将图像原料库中的图像进行灰度化处理、特征向量化处理和训练样本集,得到训练好的样本集并对训练好的样本集按照预定规则进行分类,得到至少一个分类识别模型;S11:对待检测印章图像进行处理:采集待检测印章图像并将待检测印章图像进行归一化处理;S12:识别待检测印章图像:包括将归一化处理后的待检测印章图像交给训练好的样本集进行机器识别,识别后打上对应标签,生成标签待检测印章图像;S13:匹配度计算:将标签待检测印章图像与对应的分类识别模型中的已处理标准印章图像进行匹配度对比,根据颜色矩阵,采用Match算法,计算出标准印章图像与待检测印章图像的匹配度;S14:识别结果:若标准印章图像与待检测印章图像的匹配度大于预设值,则判定待检测印章图像合格,反之为不合格。
综上,本发明的实施例提供一种图像识别方法、装置及存储介质,将归一化处理后的标准印章图像进行灰度化处理、特征向量化处理和训练样本集,得到训练好的样本集并对训练好的样本集按照预定规则进行分类,得到分类识别模型;分类识别模型对归一化处理后的待检测印章图像进行识别,并根据颜色矩阵,采用Match算法,计算出标准印章图像与待检测印章图像的匹配度,根据匹配度则判定待检测印章图像合格,反之为不合格。本申请技术方案是针对识别印章而提出的,印章具有相似性,便于训练模型,且训练出的模型识别度较高,不需要通过大量的实验获得经验数据,或者通过专家系统技术来获得,节省了时间,本技术方案能代替人工鉴别印章真伪,且识别目标图像的过程速度相对较快、技术简单、识别准确率高。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种图像识别方法,其特征在于,包括以下步骤:
对标准印章图像进行处理:
采集多个所述标准印章图像并对多个所述标准印章图像进行归一化处理生成图像原料库;
将所述图像原料库中的图像进行灰度化处理、特征向量化处理和训练样本集,得到训练好的样本集并对训练好的样本集按照预定规则进行分类,得到至少一个分类识别模型;
对待检测印章图像进行处理:
采集所述待检测印章图像并将所述待检测印章图像进行归一化处理;
识别待检测印章图像:
将归一化处理后的待检测印章图像交给所述训练好的样本集进行机器识别,识别后打上对应标签,生成标签待检测印章图像;
匹配度计算:
将所述标签待检测印章图像与对应的分类识别模型中的已处理标准印章图像进行匹配度对比,根据颜色矩阵,采用Match算法,计算出标准印章图像与待检测印章图像的匹配度;
识别结果:
若标准印章图像与待检测印章图像的匹配度大于预设值,则判定待检测印章图像合格,反之为不合格。
2.根据权利要求1所述的一种图像识别方法,其特征在于,所述识别结果的步骤中,包括可视化输出:将标准印章图像与待检测印章图像的匹配度以图形方式展示出匹配度百分比,并呈现出标准印章图像与待检测印章图像的异常点,以矩阵图的方式展示标准印章图像与待检测印章图像的颜色空间不同点。
3.根据权利要求1所述的一种图像识别方法,其特征在于,所述采集多个所述标准印章图像并对多个所述标准印章图像进行归一化处理的步骤包括:
电子扫描:扫描标准纸质化文件得到电子扫描件,以印章类别命名文件名,并在名称后加序号表示同一个类型图像的多个样本;
获取红色图章层,将电子扫描件通过图像的RGB通道,打开红滤色镜既Red滤色镜后,除去背景,保留前景色,得到电子扫描件中的红色图章层;
图像边界检测与剪切,将红色图章层基于傅里叶变换实现的旋转校正、读入原图、灰度化、高斯模糊、二值化、检测物体边界、计算出红色图章层被旋转的角度、将红色图章层旋转特定的角度,再通过物体颜色边界识别,标注图像长宽,截去空白区域并保留图像图形大小;
将经过图像边界检测与剪切的图像进行归一化格式输出。
4.根据权利要求1所述的一种图像识别方法,其特征在于,所述将所述图像原料库中的图像进行灰度化处理、特征向量化处理的步骤包括:
提取归一化处理后的标准印章图像的特征向量后进行灰度化处理,提取256阶数字。
5.根据权利要求1所述的一种图像识别方法,其特征在于,所述训练样本集包括以下步骤:通过对每个类别100个以上的样本进行PCA机器学习,并生成分类识别模型,保存到磁盘,需要时直接载入使用。
6.根据权利要求1所述的一种图像识别方法,其特征在于,采用直方图颜色空间样点距离比较法得到所述颜色矩阵。
7.根据权利要求1所述的一种图像识别方法,其特征在于,所述标准印章图像与待检测印章图像的匹配度的比较就是通过提取其直方颜色空间图,形成颜色矩阵,计算两个直方图颜色矩阵点的距离依照公式1进行直方图相似匹配度的定量度量,公式1如下:
Figure FDA0002553617180000031
公式1中:
Match:获得原图和对比图的匹配度
M为直方图,P为对比原图,M为需要比较的直方颜色矩阵图;
N为颜色空间样点数,以及为图的像素集;
Max(pi,mi):遍历所有颜色空间样点差值,取最大值。
8.根据权利要求7所述的一种图像识别方法,其特征在于,将公式1平方差后再开根号,得到公式2,公式2如下:
Figure FDA0002553617180000041
所述公式2与公式1不同点在于计算像素点距离差的方法,进行平方差后开根累计,以凸显细微误差;
公式2中的Max(pi,mi):此处遍历所有颜色空间样点方差开方值,取最大值。
9.一种图像识别装置,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至8中任一项所述的方法。
10.一种存储介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至8中任一项所述的方法。
CN202010584667.6A 2020-06-23 2020-06-23 一种图像识别方法、装置及存储介质 Active CN111860536B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010584667.6A CN111860536B (zh) 2020-06-23 2020-06-23 一种图像识别方法、装置及存储介质
PCT/CN2020/132197 WO2021258634A1 (zh) 2020-06-23 2020-11-27 一种图像审计识别方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010584667.6A CN111860536B (zh) 2020-06-23 2020-06-23 一种图像识别方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN111860536A true CN111860536A (zh) 2020-10-30
CN111860536B CN111860536B (zh) 2024-01-23

Family

ID=72988470

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010584667.6A Active CN111860536B (zh) 2020-06-23 2020-06-23 一种图像识别方法、装置及存储介质

Country Status (2)

Country Link
CN (1) CN111860536B (zh)
WO (1) WO2021258634A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113705571A (zh) * 2021-08-31 2021-11-26 平安银行股份有限公司 基于rgb阈值去红章的方法、装置、可读介质及电子设备
WO2021258634A1 (zh) * 2020-06-23 2021-12-30 南京南审审计大数据研究院有限公司 一种图像审计识别方法、装置及存储介质
CN114419655A (zh) * 2022-03-31 2022-04-29 北京惠朗时代科技有限公司 一种印章验证方法、装置、介质及设备

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113689423A (zh) * 2021-09-09 2021-11-23 深圳新致软件有限公司 基于灰度和色彩鉴别算法的保险审核材料鉴定方法、系统以及设备
CN115186303B (zh) * 2022-09-13 2022-11-18 北京惠朗时代科技有限公司 一种基于大数据云平台的金融签章安全管理方法及系统
CN117373030A (zh) * 2023-06-19 2024-01-09 上海简答数据科技有限公司 一种基于ocr的用户材料识别方法、系统、装置及介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030108232A1 (en) * 1999-08-25 2003-06-12 Xuguang Yang Detection and deterrence of counterfeiting of documents with a seal having characterisitc color, size, shape and radial density profile
CN101894260A (zh) * 2010-06-04 2010-11-24 北京化工大学 基于匹配特征点随机生成特征线的伪造印章识别方法
CN108596197A (zh) * 2018-05-15 2018-09-28 汉王科技股份有限公司 一种印章匹配方法及装置
CN109299744A (zh) * 2018-10-19 2019-02-01 合肥非度信息技术有限公司 合同公章分类模型的训练方法、系统和识别方法、系统
CN109949333A (zh) * 2019-03-20 2019-06-28 北京暴雷科技有限公司 一种基于颜色解混的文字图章分离技术
CN110751139A (zh) * 2019-09-16 2020-02-04 深圳市国信合成科技有限公司 发票印章识别的方法、装置、计算机设备和存储介质
CN111291757A (zh) * 2020-02-17 2020-06-16 江苏诚印科技有限公司 一种印章唯一性识别的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111860536B (zh) * 2020-06-23 2024-01-23 南京南审审计大数据研究院有限公司 一种图像识别方法、装置及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030108232A1 (en) * 1999-08-25 2003-06-12 Xuguang Yang Detection and deterrence of counterfeiting of documents with a seal having characterisitc color, size, shape and radial density profile
CN101894260A (zh) * 2010-06-04 2010-11-24 北京化工大学 基于匹配特征点随机生成特征线的伪造印章识别方法
CN108596197A (zh) * 2018-05-15 2018-09-28 汉王科技股份有限公司 一种印章匹配方法及装置
CN109299744A (zh) * 2018-10-19 2019-02-01 合肥非度信息技术有限公司 合同公章分类模型的训练方法、系统和识别方法、系统
CN109949333A (zh) * 2019-03-20 2019-06-28 北京暴雷科技有限公司 一种基于颜色解混的文字图章分离技术
CN110751139A (zh) * 2019-09-16 2020-02-04 深圳市国信合成科技有限公司 发票印章识别的方法、装置、计算机设备和存储介质
CN111291757A (zh) * 2020-02-17 2020-06-16 江苏诚印科技有限公司 一种印章唯一性识别的方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021258634A1 (zh) * 2020-06-23 2021-12-30 南京南审审计大数据研究院有限公司 一种图像审计识别方法、装置及存储介质
CN113705571A (zh) * 2021-08-31 2021-11-26 平安银行股份有限公司 基于rgb阈值去红章的方法、装置、可读介质及电子设备
CN114419655A (zh) * 2022-03-31 2022-04-29 北京惠朗时代科技有限公司 一种印章验证方法、装置、介质及设备

Also Published As

Publication number Publication date
WO2021258634A1 (zh) 2021-12-30
CN111860536B (zh) 2024-01-23

Similar Documents

Publication Publication Date Title
CN111860536A (zh) 一种图像识别方法、装置及存储介质
US8315465B1 (en) Effective feature classification in images
CN110298376B (zh) 一种基于改进b-cnn的银行票据图像分类方法
US20020067857A1 (en) System and method for classification of images and videos
CN111353491B (zh) 一种文字方向确定方法、装置、设备及存储介质
US9202146B2 (en) Duplicate check image resolution
US8027978B2 (en) Image search method, apparatus, and program
CN110738236A (zh) 图像匹配方法、装置、计算机设备及存储介质
CN115346227B (zh) 一种基于版式文件对电子文件矢量化的方法
CN112434555B (zh) 键值对区域识别方法、装置、存储介质和电子设备
CN111950566A (zh) 一种旋转不变的hog红外图像电力设备识别方法
US20230147685A1 (en) Generalized anomaly detection
CN111738979A (zh) 证件图像质量自动检查方法及系统
CN114581928A (zh) 一种表格识别方法及系统
Wenhong et al. Application of support vector machine (SVM) on serial number identification of RMB
CN115147855A (zh) 票据进行批量ocr识别方法及系统
CN111881923A (zh) 一种基于特征匹配的票据要素提取方法
EP4105825A1 (en) Generalised anomaly detection
CN114663899A (zh) 金融票据的处理方法、装置、设备及介质
CN113255674A (zh) 字符识别方法、装置、电子设备及计算机可读存储介质
Bhardwaj et al. Identification of Currency via Image Recognition
CN110781812A (zh) 一种基于机器学习的安检仪自动识别目标物体的方法
CN116403232B (zh) 一种基于像素值波动的图书信息提取方法
Shiravale et al. Text region identification in Indian street scene images using stroke width transform and support vector machine
Feldmann et al. Histogram of Oriented Gradients for Maya Glyph Retrieval.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant