CN111860536B - 一种图像识别方法、装置及存储介质 - Google Patents
一种图像识别方法、装置及存储介质 Download PDFInfo
- Publication number
- CN111860536B CN111860536B CN202010584667.6A CN202010584667A CN111860536B CN 111860536 B CN111860536 B CN 111860536B CN 202010584667 A CN202010584667 A CN 202010584667A CN 111860536 B CN111860536 B CN 111860536B
- Authority
- CN
- China
- Prior art keywords
- image
- seal
- detected
- seal image
- standard
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000012545 processing Methods 0.000 claims abstract description 45
- 239000011159 matrix material Substances 0.000 claims abstract description 28
- 238000010606 normalization Methods 0.000 claims abstract description 24
- 238000012549 training Methods 0.000 claims abstract description 16
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 14
- 230000008569 process Effects 0.000 claims abstract description 8
- 239000002994 raw material Substances 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000009825 accumulation Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 claims description 4
- 238000010801 machine learning Methods 0.000 claims description 4
- 239000013598 vector Substances 0.000 claims description 4
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 3
- 238000001514 detection method Methods 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 2
- 238000010008 shearing Methods 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 11
- 238000002474 experimental method Methods 0.000 abstract description 4
- 230000009467 reduction Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/30—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种图像识别方法、装置及存储介质,涉及图像处理技术领域,将归一化处理后的标准印章图像进行灰度化处理、特征向量化处理和训练样本集,得到训练好的样本集并对训练好的样本集按照预定规则进行分类,得到分类识别模型;分类识别模型对归一化处理后的待检测印章图像进行识别,并根据颜色矩阵,采用Match算法,计算出标准印章图像与待检测印章图像的匹配度。本申请技术方案是针对识别印章而提出的,印章具有相似性,便于训练模型,且训练出的模型识别度较高,不需要通过大量的实验获得经验数据,或者通过专家系统技术来获得,节省了时间,本技术方案能代替人工鉴别印章真伪,且识别目标图像的过程速度相对较快、技术简单、识别准确率高。
Description
技术领域
本发明涉及图像处理技术领域,具体而言,涉及一种图像识别方法、装置及存储介质。
背景技术
一些场景中,需要对印章(公章、法人章、财务章等)进行鉴别真伪,对于相关人员来说,鉴别较多数量的印章,需要付出很大的精力,且识别效率低。
因此,目前急需一种便于鉴别印章真伪的方案,以节省人力,提高工作效率。
发明内容
为了克服上述问题或者至少部分地解决上述问题,本发明实施例提供一种图像识别方法、装置及存储介质。
本发明的实施例是这样实现的:
一种图像识别方法,包括以下步骤:
对标准印章图像进行处理:采集多个标准印章图像并对多个标准印章图像进行归一化处理生成图像原料库;将图像原料库中的图像进行灰度化处理、特征向量化处理和训练样本集,得到训练好的样本集并对训练好的样本集按照预定规则进行分类,得到至少一个分类识别模型;
对待检测印章图像进行处理:采集待检测印章图像并将待检测印章图像进行归一化处理;
识别待检测印章图像:包括将归一化处理后的待检测印章图像交给训练好的样本集进行机器识别,识别后打上对应标签,生成标签待检测印章图像;
匹配度计算:将标签待检测印章图像与对应的分类识别模型中的已处理标准印章图像进行匹配度对比,根据颜色矩阵,采用Match算法,计算出标准印章图像与待检测印章图像的匹配度;
识别结果:若标准印章图像与待检测印章图像的匹配度大于预设值,则判定待检测印章图像合格,反之为不合格。
在本发明的一些实施例中,一种图像识别方法,识别结果的步骤中,包括可视化输出:将标准印章图像与待检测印章图像的匹配度以图形方式展示出匹配度百分比,并呈现出标准印章图像与待检测印章图像的异常点,以矩阵图的方式展示标准印章图像与待检测印章图像的颜色空间不同点。
在本发明的一些实施例中,一种图像识别方法,采集多个标准印章图像并对多个标准印章图像进行归一化处理的步骤包括:
电子扫描:扫描标准纸质化文件得到电子扫描件,以印章类别命名文件名,并在名称后加序号表示同一个类型图像的多个样本;
获取红色图章层,将电子扫描件通过图像的RGB通道,打开红滤色镜既Red滤色镜后,除去背景,保留前景色,得到电子扫描件中的红色图章层;
图像边界检测与剪切,将红色图章层基于傅里叶变换实现的旋转校正、读入原图、灰度化、高斯模糊、二值化、检测物体边界、计算出红色图章层被旋转的角度、将红色图章层旋转特定的角度,再通过物体颜色边界识别,标注图像长宽,截去空白区域并保留图像图形大小;
将经过图像边界检测与剪切的图像进行归一化格式输出。
在本发明的一些实施例中,一种图像识别方法,将图像原料库中的图像进行灰度化处理、特征向量化处理的步骤包括:
提取归一化处理后的标准印章图像的特征向量后进行灰度化处理,提取256阶数字。
在本发明的一些实施例中,一种图像识别方法,训练样本集包括以下步骤:通过对每个类别100个以上的样本进行PCA机器学习,并生成分类识别模型,保存到磁盘,需要时直接载入使用。
在本发明的一些实施例中,一种图像识别方法,采用直方图颜色空间样点距离比较法得到颜色矩阵。
在本发明的一些实施例中,一种图像识别方法,标准印章图像与待检测印章图像的匹配度的比较就是通过提取其直方颜色空间图,形成颜色矩阵,计算两个直方图颜色矩阵点的距离依照公式1进行直方图相似匹配度的定量度量,公式1如下:
公式1中:
Match:获得原图和对比图的匹配度
M为直方图,P为对比原图,M为需要比较的直方颜色矩阵图;
N为颜色空间样点数,以及为图的像素集;
Max(pi,mi):遍历所有颜色空间样点差值,取最大值。
在本发明的一些实施例中,一种图像识别方法,将公式1平方差后再开根号,得到公式2,公式2如下:
公式2与公式1不同点在于计算像素点距离差的方法,进行平方差后开根累计,以凸显细微误差;
公式2中的Max(pi,mi):此处遍历所有颜色空间样点方差开方值,取最大值。
一种图像识别装置,包括:一个或多个处理器;
存储装置,用于存储一个或多个程序;
当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现图像识别方法。
一种存储介质,其存储有计算机程序,该程序被处理器执行时实现图像识别的方法。
本发明实施例至少具有如下优点或有益效果:
一种图像识别方法,将归一化处理后的标准印章图像进行灰度化处理、特征向量化处理和训练样本集,得到训练好的样本集并对训练好的样本集按照预定规则进行分类,得到分类识别模型;分类识别模型对归一化处理后的待检测印章图像进行识别,并根据颜色矩阵,采用Match算法,计算出标准印章图像与待检测印章图像的匹配度,根据匹配度则判定待检测印章图像合格,反之为不合格。本申请技术方案是针对识别印章而提出的,印章具有相似性,例如:印章大都为圆形、椭圆形,为红色,直径为4.2cm,中央一律刊五角星,星尖直径为1.4cm,圆边宽为0.12cm,五角星外刊单位名称,自左而右环行,或者名称的前段自左而右环行、后段自左而右横行,即单位部门名称放在星下方作横排,印文使用简化的宋体字;印章具有相似性,便于训练模型,且训练出的模型识别度较高,不需要通过大量的实验获得经验数据,或者通过专家系统技术来获得,节省了时间,本技术方案能代替人工鉴别印章真伪,且识别目标图像的过程速度相对较快、技术简单、识别准确率高。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明一种图像识别方法一实施例的流程图;
图2为本发明一种图像识别方法另一实施例的流程图;
图3为本发明一种图像识别方法、装置及存储介质一实施例的匹配度计算过程示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本发明实施例的描述中,“多个”代表至少2个。
在本发明实施例的描述中,还需要说明的是,除非另有明确的规定和限定,若出现术语“设置”、“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
实施例
印章规格介绍,国有企业、国营股份制企业等印章(包括公司章、部门章)一律为圆形,直径为4.2cm,中央一律刊五角星,星尖直径为1.4cm,圆边宽为0.12cm,五角星外刊单位名称,自左而右环行,或者名称的前段自左而右环行、后段自左而右横行,即单位部门名称放在星下方作横排,印文使用简化的宋体字。其他图像类似。
PIL介绍,PIL(Python Image Library)是python的第三方图像处理库,但是由于其强大的功能与众多的使用人数,已经被认为是python官方图像处理库了。其官方主页为:PIL,http://pythonware.com/products/pil/。
scikit-learn PCA算法介绍,PCA(Principal Component Analysis,简称PCA),在scikit-learn中,PCA是一种无参数的数据降维方法,PCA是从方差角度,特征值和特征向量以及SVD奇异值降维。
请参照图1,本实施例提供一种图像识别方法,基于PIL技术处理图像,包括以下步骤:
S10:对标准印章图像进行处理:采集多个标准印章图像并对多个标准印章图像进行归一化处理生成图像原料库;将图像原料库中的图像进行灰度化处理、特征向量化处理和训练样本集,得到训练好的样本集并对训练好的样本集按照预定规则进行分类,得到至少一个分类识别模型;
S11:对待检测印章图像进行处理:采集待检测印章图像并将待检测印章图像进行归一化处理;
S12:识别待检测印章图像:包括将归一化处理后的待检测印章图像交给训练好的样本集进行机器识别,识别后打上对应标签,生成标签待检测印章图像;
S13:匹配度计算:将标签待检测印章图像与对应的分类识别模型中的已处理标准印章图像进行匹配度对比,根据颜色矩阵,采用Match算法,计算出标准印章图像与待检测印章图像的匹配度;
S14:识别结果:若标准印章图像与待检测印章图像的匹配度大于预设值,则判定待检测印章图像合格,反之为不合格。
需要说明的是:本实施例采用PCA算法训练模型,PCA算法降维减少内存或者硬盘的使用,加快机器学习的速度。
设计原理:经过长期的研究和实践,发明人发现,现有技术中,在一些场景中,需要对印章(公章、法人章、财务章等)进行鉴别真伪,对于相关人员来说,鉴别较多数量的印章,需要付出很大的精力,且识别效率低。鉴于此,本申请提供一种图像识别方法,将归一化处理后的标准印章图像进行灰度化处理、特征向量化处理和训练样本集,得到训练好的样本集并对训练好的样本集按照预定规则进行分类,得到分类识别模型;分类识别模型对归一化处理后的待检测印章图像进行识别,并根据颜色矩阵,采用Match算法,计算出标准印章图像与待检测印章图像的匹配度,根据匹配度则判定待检测印章图像合格,反之为不合格。本申请技术方案是针对识别印章而提出的,印章具有相似性,例如:印章大都为圆形、椭圆形,为红色,直径为4.2cm,中央一律刊五角星,星尖直径为1.4cm,圆边宽为0.12cm,五角星外刊单位名称,自左而右环行,或者名称的前段自左而右环行、后段自左而右横行,即单位部门名称放在星下方作横排,印文使用简化的宋体字;印章具有相似性,便于训练模型,且训练出的模型识别度较高,不需要通过大量的实验获得经验数据,或者通过专家系统技术来获得,节省了时间,本技术方案能代替人工鉴别印章真伪,且识别目标图像的过程速度相对较快、技术简单、识别准确率高。
在本发明的一些实施例中,一种图像识别方法,所述识别结果的步骤中,包括可视化输出:将标准印章图像与待检测印章图像的匹配度以图形方式展示出匹配度百分比,并呈现出标准印章图像与待检测印章图像的异常点,以矩阵图的方式展示标准印章图像与待检测印章图像的颜色空间不同点。
请参考图2,进一步的,考虑到印章图像一般覆盖不同文档不同位置,要将纯粹的印章图像从复杂的背景中剥离出来,需要通过一系列的图形转换和算法处理,并且要实现自动化完成,采集多个所述标准印章图像并对多个所述标准印章图像进行归一化处理的步骤包括:
S100:电子扫描:扫描标准纸质化文件得到电子扫描件,电子扫描件优选JPG格式,以印章类别命名文件名,并在名称后加序号表示同一个类型图像的多个样本,例如财务章001-200;
S101:获取红色图章层,将电子扫描件通过图像的RGB通道,打开红滤色镜既Red滤色镜后,除去背景,保留前景色,得到电子扫描件中的红色图章层;
S102:图像边界检测与剪切,将红色图章层基于傅里叶变换实现的旋转校正、读入原图、灰度化、高斯模糊、二值化、检测物体边界、计算出红色图章层被旋转的角度、将红色图章层旋转特定的角度,再通过物体颜色边界识别,标注图像长宽,截去空白区域并保留图像图形大小;
S103:将经过图像边界检测与剪切的图像进行归一化格式输出,本实施例优选图形长*宽为160*160。
进一步的,所述将所述图像原料库中的图像进行灰度化处理、特征向量化处理的步骤包括:
提取归一化处理后的标准印章图像的特征向量后进行灰度化处理,提取256阶数字。通过Stamps2vector技术提取图像的特征向量,灰度化处理后提取256阶数字,本实施例优化算法,降噪降维,提高标识度;训练样本库形如:
审计公章,某某公司;0,0,0,12,14,15,……;
审计公章,某某公司;0,0,0,12……;
审计财务章,某某公司;0,0,0,12……;
审计财务章,某某公司;0,0,0,12……;
第一栏:标签,公司名;后续160*160个图像灰度化的像素点,并将大于180的都定义为白色,置值零,其他值保留,并256-原值,定义黑色灰度。
优选的,所述训练样本集包括以下步骤:通过对每个类别100个以上的样本进行PCA机器学习,并生成分类识别模型,保存到磁盘,需要时直接载入使用。
优选的,采用直方图颜色空间样点距离比较法得到所述颜色矩阵。
进一步的,考虑到印章特点是图像色彩单一、去背景降噪、深化细节特征点,因此采用直方图颜色空间样点距离比较法His-Matching。两个图的匹配度比较就是通过提取其直方颜色空间图,形成颜色矩阵,计算两个直方图颜色矩阵点的距离,本实施例依照如公式1进行直方图相似匹配度的定量度量,公式如下:
公式1中:
Match:获得原图和对比图的匹配度
M为直方图,P为对比原图,M为需要比较的直方颜色矩阵图;
N为颜色空间样点数,以及为图的像素集;
Max(pi,mi):遍历所有颜色空间样点差值,取最大值。
在本发明的一些实施例中,一种图像识别方法,将公式1平方差后再开根号,得到公式2,公式2如下:
所述公式2与公式1不同点在于计算像素点距离差的方法,进行平方差后开根累计,以凸显细微误差;
公式2中的Max(pi,mi):此处遍历所有颜色空间样点方差开方值,取最大值。
请参考图3,载入标准印章图像和待检测印章图像,进行图像灰度化、归一化,提取图像特征颜色矩阵,提取整副图像的直方颜色空间图,形成颜色矩阵,计算图像直方图颜色矩阵点的距离,与原始图像的参数进行对比,计算出匹配度。进行颜色空间直方图矩阵点距离计算,距累计计算。
优化方案:
将整幅图像进行图像切分,再对相应的每个小块分别进行匹配度计算,最后根据各小块的累计平均匹配度来反映整个图片的相似度。即,把规则图像分为n*n块,每块的分辨率为160/n*160/n,本案将n设定为4。
采用公式2,扩大细微误差值,也可进行改进公式1,采用平方差,再开根号,与不同点在于计算像素点距离差的方法,进行平方差后开根累计,可以凸显细微误差。
一种图像识别装置,包括:一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现图像识别方法,例如识别,S10:对标准印章图像进行处理:采集多个标准印章图像并对多个标准印章图像进行归一化处理生成图像原料库;将图像原料库中的图像进行灰度化处理、特征向量化处理和训练样本集,得到训练好的样本集并对训练好的样本集按照预定规则进行分类,得到至少一个分类识别模型;S11:对待检测印章图像进行处理:采集待检测印章图像并将待检测印章图像进行归一化处理;S12:识别待检测印章图像:包括将归一化处理后的待检测印章图像交给训练好的样本集进行机器识别,识别后打上对应标签,生成标签待检测印章图像;S13:匹配度计算:将标签待检测印章图像与对应的分类识别模型中的已处理标准印章图像进行匹配度对比,根据颜色矩阵,采用Match算法,计算出标准印章图像与待检测印章图像的匹配度;S14:识别结果:若标准印章图像与待检测印章图像的匹配度大于预设值,则判定待检测印章图像合格,反之为不合格。
一种存储介质,其存储有计算机程序,该程序被处理器执行时实现图像识别方法。例如识别,S10:对标准印章图像进行处理:采集多个标准印章图像并对多个标准印章图像进行归一化处理生成图像原料库;将图像原料库中的图像进行灰度化处理、特征向量化处理和训练样本集,得到训练好的样本集并对训练好的样本集按照预定规则进行分类,得到至少一个分类识别模型;S11:对待检测印章图像进行处理:采集待检测印章图像并将待检测印章图像进行归一化处理;S12:识别待检测印章图像:包括将归一化处理后的待检测印章图像交给训练好的样本集进行机器识别,识别后打上对应标签,生成标签待检测印章图像;S13:匹配度计算:将标签待检测印章图像与对应的分类识别模型中的已处理标准印章图像进行匹配度对比,根据颜色矩阵,采用Match算法,计算出标准印章图像与待检测印章图像的匹配度;S14:识别结果:若标准印章图像与待检测印章图像的匹配度大于预设值,则判定待检测印章图像合格,反之为不合格。
综上,本发明的实施例提供一种图像识别方法、装置及存储介质,将归一化处理后的标准印章图像进行灰度化处理、特征向量化处理和训练样本集,得到训练好的样本集并对训练好的样本集按照预定规则进行分类,得到分类识别模型;分类识别模型对归一化处理后的待检测印章图像进行识别,并根据颜色矩阵,采用Match算法,计算出标准印章图像与待检测印章图像的匹配度,根据匹配度则判定待检测印章图像合格,反之为不合格。本申请技术方案是针对识别印章而提出的,印章具有相似性,便于训练模型,且训练出的模型识别度较高,不需要通过大量的实验获得经验数据,或者通过专家系统技术来获得,节省了时间,本技术方案能代替人工鉴别印章真伪,且识别目标图像的过程速度相对较快、技术简单、识别准确率高。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种图像识别方法,其特征在于,包括以下步骤:
对标准印章图像进行处理:
采集多个所述标准印章图像并对多个所述标准印章图像进行归一化处理生成图像原料库;所述归一化处理的步骤包括:电子扫描,扫描标准纸质化文件得到电子扫描件,以印章类别命名文件名,并在名称后加序号表示同一个类型图像的多个样本;获取红色图章层,将电子扫描件通过图像的RGB通道,打开红滤色镜既Red滤色镜后,除去背景,保留前景色,得到电子扫描件中的红色图章层;图像边界检测与剪切,将红色图章层基于傅里叶变换实现的旋转校正、读入原图、灰度化、高斯模糊、二值化、检测物体边界、计算出红色图章层被旋转的角度、将红色图章层旋转特定的角度,再通过物体颜色边界识别,标注图像长宽,截去空白区域并保留图像图形大小;将经过图像边界检测与剪切的图像进行归一化格式输出;
将所述图像原料库中的图像进行灰度化处理、特征向量化处理和训练样本集,得到训练好的样本集并对训练好的样本集按照预定规则进行分类,得到至少一个分类识别模型;
对待检测印章图像进行处理:
采集所述待检测印章图像并将所述待检测印章图像进行归一化处理;
识别待检测印章图像:
将归一化处理后的待检测印章图像交给所述训练好的样本集进行机器识别,识别后打上对应标签,生成标签待检测印章图像;
匹配度计算:
将所述标签待检测印章图像与对应的分类识别模型中的已处理标准印章图像进行匹配度对比,根据颜色矩阵,采用Match算法,计算出标准印章图像与待检测印章图像的匹配度;
识别结果:
若标准印章图像与待检测印章图像的匹配度大于预设值,则判定待检测印章图像合格,反之为不合格;
所述标准印章图像与待检测印章图像的匹配度的比较是通过提取其直方颜色空间图,形成颜色矩阵,计算两个直方图颜色矩阵点的距离依照公式1或公式2进行直方图相似匹配度的定量度量,公式2与公式1不同点在于计算像素点距离差的方法,进行平方差后开根累计;
公式1如下:
公式2如下:
其中,Match:获得原图和对比图的匹配度;
M为直方图,P为对比原图,M为需要比较的直方颜色矩阵图;
N为颜色空间样点数,以及为图的像素集;
公式1中,Max(pi,mi):遍历所有颜色空间样点差值,取最大值;
公式2中,Max(pi,mi):遍历所有颜色空间样点方差开方值,取最大值。
2.根据权利要求1所述的一种图像识别方法,其特征在于,所述识别结果的步骤中,包括可视化输出:将标准印章图像与待检测印章图像的匹配度以图形方式展示出匹配度百分比,并呈现出标准印章图像与待检测印章图像的异常点,以矩阵图的方式展示标准印章图像与待检测印章图像的颜色空间不同点。
3.根据权利要求1所述的一种图像识别方法,其特征在于,所述将所述图像原料库中的图像进行灰度化处理、特征向量化处理的步骤包括:
提取归一化处理后的标准印章图像的特征向量后进行灰度化处理,提取256阶数字。
4.根据权利要求1所述的一种图像识别方法,其特征在于,所述训练样本集包括以下步骤:通过对每个类别100个以上的样本进行PCA机器学习,并生成分类识别模型,保存到磁盘,需要时直接载入使用。
5.根据权利要求1所述的一种图像识别方法,其特征在于,采用直方图颜色空间样点距离比较法得到所述颜色矩阵。
6.一种图像识别装置,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至5中任一项所述的方法。
7.一种存储介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至5中任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010584667.6A CN111860536B (zh) | 2020-06-23 | 2020-06-23 | 一种图像识别方法、装置及存储介质 |
PCT/CN2020/132197 WO2021258634A1 (zh) | 2020-06-23 | 2020-11-27 | 一种图像审计识别方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010584667.6A CN111860536B (zh) | 2020-06-23 | 2020-06-23 | 一种图像识别方法、装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111860536A CN111860536A (zh) | 2020-10-30 |
CN111860536B true CN111860536B (zh) | 2024-01-23 |
Family
ID=72988470
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010584667.6A Active CN111860536B (zh) | 2020-06-23 | 2020-06-23 | 一种图像识别方法、装置及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111860536B (zh) |
WO (1) | WO2021258634A1 (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111860536B (zh) * | 2020-06-23 | 2024-01-23 | 南京南审审计大数据研究院有限公司 | 一种图像识别方法、装置及存储介质 |
CN113705571B (zh) * | 2021-08-31 | 2024-07-02 | 平安银行股份有限公司 | 基于rgb阈值去红章的方法、装置、可读介质及电子设备 |
CN113689423A (zh) * | 2021-09-09 | 2021-11-23 | 深圳新致软件有限公司 | 基于灰度和色彩鉴别算法的保险审核材料鉴定方法、系统以及设备 |
CN114419655A (zh) * | 2022-03-31 | 2022-04-29 | 北京惠朗时代科技有限公司 | 一种印章验证方法、装置、介质及设备 |
CN115186303B (zh) * | 2022-09-13 | 2022-11-18 | 北京惠朗时代科技有限公司 | 一种基于大数据云平台的金融签章安全管理方法及系统 |
CN117373030B (zh) * | 2023-06-19 | 2024-06-25 | 上海简答数据科技有限公司 | 一种基于ocr的用户材料识别方法、系统、装置及介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101894260A (zh) * | 2010-06-04 | 2010-11-24 | 北京化工大学 | 基于匹配特征点随机生成特征线的伪造印章识别方法 |
CN108596197A (zh) * | 2018-05-15 | 2018-09-28 | 汉王科技股份有限公司 | 一种印章匹配方法及装置 |
CN109299744A (zh) * | 2018-10-19 | 2019-02-01 | 合肥非度信息技术有限公司 | 合同公章分类模型的训练方法、系统和识别方法、系统 |
CN109949333A (zh) * | 2019-03-20 | 2019-06-28 | 北京暴雷科技有限公司 | 一种基于颜色解混的文字图章分离技术 |
CN110751139A (zh) * | 2019-09-16 | 2020-02-04 | 深圳市国信合成科技有限公司 | 发票印章识别的方法、装置、计算机设备和存储介质 |
CN111291757A (zh) * | 2020-02-17 | 2020-06-16 | 江苏诚印科技有限公司 | 一种印章唯一性识别的方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6731784B2 (en) * | 1999-08-25 | 2004-05-04 | Hewlett-Packard Development Company, L.P. | Detection and deterrence of counterfeiting of documents with a seal having characteristic color, size, shape and radial density profile |
CN111860536B (zh) * | 2020-06-23 | 2024-01-23 | 南京南审审计大数据研究院有限公司 | 一种图像识别方法、装置及存储介质 |
-
2020
- 2020-06-23 CN CN202010584667.6A patent/CN111860536B/zh active Active
- 2020-11-27 WO PCT/CN2020/132197 patent/WO2021258634A1/zh active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101894260A (zh) * | 2010-06-04 | 2010-11-24 | 北京化工大学 | 基于匹配特征点随机生成特征线的伪造印章识别方法 |
CN108596197A (zh) * | 2018-05-15 | 2018-09-28 | 汉王科技股份有限公司 | 一种印章匹配方法及装置 |
CN109299744A (zh) * | 2018-10-19 | 2019-02-01 | 合肥非度信息技术有限公司 | 合同公章分类模型的训练方法、系统和识别方法、系统 |
CN109949333A (zh) * | 2019-03-20 | 2019-06-28 | 北京暴雷科技有限公司 | 一种基于颜色解混的文字图章分离技术 |
CN110751139A (zh) * | 2019-09-16 | 2020-02-04 | 深圳市国信合成科技有限公司 | 发票印章识别的方法、装置、计算机设备和存储介质 |
CN111291757A (zh) * | 2020-02-17 | 2020-06-16 | 江苏诚印科技有限公司 | 一种印章唯一性识别的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111860536A (zh) | 2020-10-30 |
WO2021258634A1 (zh) | 2021-12-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111860536B (zh) | 一种图像识别方法、装置及存储介质 | |
Li et al. | Characterness: An indicator of text in the wild | |
CN105389593B (zh) | 基于surf特征的图像物体识别方法 | |
CN109002851B (zh) | 一种基于图像多特征融合的水果分类方法及应用 | |
US20080310721A1 (en) | Method And Apparatus For Recognizing Characters In A Document Image | |
US20080222113A1 (en) | Image search method, apparatus, and program | |
US20230147685A1 (en) | Generalized anomaly detection | |
Forczmański et al. | Two-stage approach to extracting visual objects from paper documents | |
CN112926592A (zh) | 一种基于改进Fast算法的商标检索方法及装置 | |
Pan et al. | Improving scene text detection by scale-adaptive segmentation and weighted CRF verification | |
EP4105825A1 (en) | Generalised anomaly detection | |
Chatbri et al. | Shape matching using keypoints extracted from both the foreground and the background of binary images | |
Sreelakshmy et al. | An improved method for copy-move forgery detection in digital forensic | |
Zhuge et al. | Robust video text detection with morphological filtering enhanced MSER | |
Pallavi et al. | A conglomerate of multiple OCR table detection and extraction | |
Padma et al. | Entropy based texture features useful for automatic script identification | |
CN107392225A (zh) | 基于椭圆傅立叶描述符和加权稀疏表示的植物识别方法 | |
Thilagavathi et al. | Application of Image Processing in Detection of Plant Diseases: A Review | |
CN116403232B (zh) | 一种基于像素值波动的图书信息提取方法 | |
Zweng et al. | Improved relational feature model for people detection using histogram similarity functions | |
Beirami et al. | Fractal-Based Ensemble Classification System for Hyperspectral Images | |
CN112704259B (zh) | 一种密集烟叶识别的打叶质量评价方法及系统 | |
CN117877037B (zh) | 一种ocr单字符定位识别方法、系统及计算机存储介质 | |
Prasanna et al. | KANNADA TEXT EXTRACTION FROM IMAGES AND VIDEOS FORVISION IMPAIRED PERSONS | |
JP6060638B2 (ja) | 対象物識別装置、学習サンプル作成装置、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |