CN113392856B - 图像伪造检测装置和方法 - Google Patents

图像伪造检测装置和方法 Download PDF

Info

Publication number
CN113392856B
CN113392856B CN202110940038.7A CN202110940038A CN113392856B CN 113392856 B CN113392856 B CN 113392856B CN 202110940038 A CN202110940038 A CN 202110940038A CN 113392856 B CN113392856 B CN 113392856B
Authority
CN
China
Prior art keywords
image
point
feature
scale
points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110940038.7A
Other languages
English (en)
Other versions
CN113392856A (zh
Inventor
王帅
唐文忠
林晓琦
唐红梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN202110940038.7A priority Critical patent/CN113392856B/zh
Publication of CN113392856A publication Critical patent/CN113392856A/zh
Application granted granted Critical
Publication of CN113392856B publication Critical patent/CN113392856B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种图像伪造检测装置和方法,首先接收两个参数T和R,分别表示Low’s算法的阈值和匹配特征点对数占全部特征数的比例;对图像进行预处理,即将原图像转换为灰度图;计算该图像的尺度不变特征变换特征,包括特征点坐标信息和特征向量;紧接着对提取出的特征作特征匹配;然后根据一定的过滤策略对匹配好的特征点对进行过滤,统计符合过滤策略的匹配点对数量;最后判断匹配点对数量占特征点总数的比例是否大于等于参数R,若是,则认为该图像是伪造的,否则认为是非伪造的,对于认为是伪造的图像,在原图像上绘制匹配点对的连接线。该装置和方法可以主动地、批量地筛查学术期刊中复用、旋转、翻转、缩放等图像篡改行为。

Description

图像伪造检测装置和方法
技术领域
本发明涉及图像伪造检测技术领域,特别是涉及一种图像伪造检测装置和方法。
背景技术
随着社会进步和技术发展,照相机、手机等设备的使用越来越普遍,数字图像已经成为现实生活中随处可见且必不可少的一种多媒体资源。与此同时,图像编辑软件的盛行也导致人们越来越容易对图像进行篡改,并且随着技术的发展,这种篡改越来越不易察觉,数字图像的安全问题日益严重。图像伪造检测技术(Image Forgery Detection)能够通过计算机,运用一定的方法,实现对伪造图像的自动化检测。
图像伪造检测技术广泛应用于自然场景图上,可以对普通相机拍摄出的现实场景进行检测,也可以用于特殊事件,特别是人脸图像的伪造识别。但是,此类检测方法仅在自然场景图上可以保持良好的检测有效性。目前,国内外仍在推进图像伪造检测技术的研究,许多研究人员通过使用传统手动设计特征的方法或者深度学习方法对复制移动、拼接、修饰等多种造假方式进行检测,以提高检测的有效率。
在学术造假检测领域,采用图像伪造检测技术对学术图像进行自动化、批量化的有效检测,已成为学术成果例行筛查的一个重要环节。目前对这一方面的研究并不多,部分研究仅针对被放大篡改行为的检测,检测方式较为局限;也有一些研究在检测自然场景图的基础上,对学术图像进行检测。然而,对学术图像伪造检测的研究不是简单地运用现有方法进行检测,更重要的是,要分析学术图像和自然场景图的差异性,针对学术图像的特殊性,研究新的方法,提高检测有效率。此外,目前对于学术造假检测的技术主要集中在文字抄袭的检测上,学术图像的造假检测目前仍主要以人工筛查为主。针对学术图像篡改检测的这种现实需要,目前已有部分研究成功,一些解决方案是可行的,但是对于不同种类的学术图像,这些方法尚存在一定的局限性。一是可检测的伪造方式单一。通常,学术图像的造假方式包括复用、旋转、翻转、缩放等多种方式,需要尽可能地检测出不同造假方式,但目前的一些解决方法尚不能很好地支持这种需求。二是无法主动地、批量式地检测。对于大批量地论文期刊数据,能够支持主动地、批量地检测显得至关重要,这在目前已有的方法中解决得还不够理想。三是在生物医学领域常用的条带图往往存在“残影”,专业术语叫“拖尾”,这种图像特征会严重影响现有方法的检测效果。四是现有的特征提取匹配技术在学术图像检测上会生成很多无用匹配,严重影响最终的结果判断。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供一种图像伪造检测装置和方法,能够主动地、批量地筛查学术期刊中复用、旋转、翻转、缩放等图像篡改行为。
本发明采用如下的技术方案:
一种图像伪造检测装置,其特征在于,包括:
获取模块,接收两个参数,T为Lowe’s算法的阈值,R为匹配特征点对数占全部特征数的比例;
预处理模块,读取原图像,并将原图像转换为灰度图;
特征提取模块,计算图像的尺度不变特征变换特征(SIFT),得到特征点坐标信息和特征向量;对该图像的特征数进行判断;
特征匹配模块,遍历每一个特征,计算其与剩余特征之间的距离,取欧式距离最小和第二小的特征向量,距离分别记为d1和d2,根据Lowe’s算法,如果d1<d2*T,则认为这两个特征高度相似,保留该特征的特征匹配点对,否则不保留;
特征过滤模块,对所有特征匹配点对进行筛选,依次进行边缘缩进判断、去除一对多关系、聚类,并统计最终保留的匹配点对数量;
可视化模块,判断匹配点对数量占特征点总数的比例是否大于等于参数R,在原图像上绘制过滤后的特征匹配点对,每对匹配点通过直线相连。
进一步的,所述预处理模块,当原图像为条带图时,对所述条带图进行图像增强,包括以下步骤:
1)计算图像的直方图,将图像所有的像素点按照0~255共256个bin,统计落在每个bin的像素点数量;
2)归一化直方图,将每个bin中像素点数量除以总的像素点,使其限制在0~1之间;
3)设置灰度级阈值i,从0开始迭代,通过归一化的直方图,统计0~i 灰度级的前景像素所占整幅图像的比例w 0,并统计前景像素的平均灰度u 0;统计i~255灰度级的背景像素所占整幅图像的比例w 1,并统计背景像素的平均灰度u 1;设图像的总平均灰度为u 2,前景像素和背景像素的类间方差记为g
Figure 388117DEST_PATH_IMAGE001
不断迭代,直到找到g最大值,此时的i作为图像的全局阈值,用于划分背景和目标,得到进行图像增强后的条带图。
进一步的,所述特征提取模块,计算图像的尺度不变特征变换特征,包括构建尺度空间、检测空间极值点、定位关键点、指定关键点方向、生成关键点描述子五个子步骤:
1)构建尺度空间,尺度空间由高斯核尺度决定,
Figure 55859DEST_PATH_IMAGE002
其中,I(x,y)是原图像,σ是尺度坐标, *是卷积符号,L(x,y,σ)是对应尺度下的尺度图像,G(x,y,σ)是高斯核;
高斯差分尺度空间为
Figure 990317DEST_PATH_IMAGE003
σ的大小决定图像的平滑程度,大尺度对应图像的概貌特征,小尺度对应图像的细节特征;σ越大表示尺度越粗糙,分辨率越低;
2)检测空间极值点,将每一个采样点与它所有的相邻点比较,看其是否比它的图像域和尺度域的相邻点大或者小;当这个点在所述尺度空间本层以及上下两层的所有领域中是最大或最小值时,认为该点是图像在该尺度下的一个特征点;
3)定位关键点,对空间尺度函数求导,并令其为0,可得到精确的位置:
Figure 580086DEST_PATH_IMAGE004
4)指定关键点方向,利用关键点邻域像素的梯度方向分布特性为每个关键点指定方向参数,使算子具备旋转不变性,以关键点为中心的邻域窗口内采样,并用直方图统计邻域像素的梯度方向,直方图的峰值代表该关键点处邻域梯度的主方向,其他的达到最大值80%的方向可作为辅助方向:
Figure 537678DEST_PATH_IMAGE005
m(x,y)和θ(x,y)分别是(x,y)处梯度的模值和方向公式,其中L所用的尺度为每个关键点各自所在的尺度;
5)生成关键点描述子,将坐标轴旋转为步骤4)得到的关键点方向,以关键点为中心取16×16的窗口,窗口的每个小格代表关键点邻域所在尺度空间的一个像素,利用公式求得每个像素的梯度幅值与梯度方向,箭头方向代表该像素的梯度方向,箭头长度代表梯度模值,然后用高斯窗口对其进行加权运算。
进一步的,所述特征匹配模块,遍历每一个特征,计算其与剩余特征之间的距离,具体为:
对于任意两个特征向量X=(x1, x2, ……, xn)和Y=(y1, y2, ……, yn),其欧氏距离为d1:
Figure 868165DEST_PATH_IMAGE006
采用Kd树搜索二近邻,对于128维特征向量集T={a1, a2, ……, aN},其中ai =(ai(1), ai(2), ……, ai(128)),i=1, 2, ……,N,首先需要构造kd树,构造方法如下:
a)选取x(1)为坐标轴,以T中的所有数据x(1)坐标中的中位数作为切分点,将超矩形区域切割成两个子区域。将该切分点作为根结点,由根结点生出深度为1的左右子结点,左节点对应x(1)坐标小于切分点,右结点对应x(1)坐标大于切分点;
b)对深度为j的结点,选择x(r)为切分坐标轴,r=j(mod 128)+1,以该结点区域中训练数据x(r)坐标的中位数作为切分点,将区域分为两个子区域,且生成深度为j+1的左、右子结点。左节点对应x(k)坐标小于切分点,右结点对应x(k)坐标大于切分点;
重复b),直到j=2时停止,此时就获得了二近邻d2。
进一步的,所述特征过滤模块,所述边缘缩进判断通过设定一个边缘缩进阈值,判断特征点的位置是否处于缩进范围,进行匹配点对过滤;所述去除一对多关系,去除单个特征点与多个特征点连接的匹配点对结果;所述聚类,对剩余的匹配点对进行层次聚类。
一种图像伪造检测方法,采用所述图像检测装置进行检测,其特征在于,包括以下步骤:
S101:获取参数,接收两个参数,T为Low’s算法的阈值,R为匹配特征点对数占全部特征数的比例;
S102:图像预处理,读取原图像,并将原图像转换为灰度图;
S103:提取特征,计算该图像的尺度不变特征变换特征(SIFT),得到特征点坐标信息和特征向量;判断该图像的特征数是否大于3,如果是,则继续以下流程,如果不是,则直接结束;
S104:特征匹配,遍历每一个特征,计算其与剩余特征之间的距离,取欧式距离最小和第二小的特征向量,距离分别记为d1和d2,根据Lowe’s算法,如果d1<d2*T,则认为这两个特征高度相似,保留该特征的特征匹配点对,否则不保留;
S105:特征过滤,对S104计算结束后的所有特征匹配点对进行筛选,依次进行边缘缩进判断、去除一对多关系、聚类,并统计最终保留的匹配点对数量;
S106:可视化,判断匹配点对数量占特征点总数的比例是否大于等于参数R,如果满足,则在原图像中绘制匹配点,并以直线连接,如果不满足,则直接结束。
本发明与现有技术相比所具有的有益效果:
1)本发明通过程序运行可自动完成对大量学术图像进行检测,检测过程中不需要人工参与。
2)本发明可以成功检测出复用、旋转、翻转、缩放等多种图像伪造方式。
3)本发明可以主动地、批量式地完成对大量学术图像的检测,不需要用户事先挑选可能存在问题的图片后再手动上传进行检测。且不局限于两张图像的对比,对于任何一篇论文,都可以对该论文中的所有图片进行盲查。
4)本发明有效提升了对于生物医学领域条带图“拖尾”现象的检测效果。
5)本发明有效去除了部分无用的匹配,以得到更干净更直观的结果。
附图说明
图1是学术图像伪造检测流程图。
图2是图像增强前后的对比图,其中,图2(a)是图像增强前的匹配结果,图2(b)是图像增强后的匹配结果。
图3是高斯金字塔, Octave表示一幅图像可产生的图像组数,σ表示尺度坐标。
图4是不同σ下的图像尺度空间,同一组内,不同层图像的尺寸相同,不同组内,后一组第一个图像是前一组倒数第三个图像的二分之一采样。
图5是检测点与相邻点,中间的检测点和它同尺度的8个相邻点和上下相邻尺度对应的9×2个点共26个点比较,以确保在尺度空间和二维图像空间都检测到极值点。
图6的左半部分为16*16的图中1/4的特征点梯度方向及尺度,右半部分为其加权到8个主方向后的效果。
图7是过滤前后的对比图,其中,图7(a)是不采用本发明的过滤策略得到的结果,图7(b)是采用本发明的过滤策略得到的结果。
图8是是两组生物医学领域的学术论文图片的灰度图,其中,图8(a)是论文中的实物图的灰度图,图8(b)论文中的染色图的灰度图。
图9是只有中心点的关键点,其中,图9(a)和图9(b)分别是与图8(a)和图8(b)对应的只有中心点的关键点。
图10是带有关键点大小和方向的关键点,其中,图10(a)和图10(b)分别是与图8(a)和图8(b)对应的带有关键点大小和方向的关键点。
图11是将匹配点对连线后的结果,其中,图11(a)和图11(b)分别是与图8(a)和图8(b)对应的将匹配点对连线后的结果。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例与附图,对本发明作进一步详细说明。
本发明提供一种图像伪造检测装置,用于对图像进行检测,判断学图像是否为伪造,如图1所示,首先接收两个参数T和R,分别表示Low’s算法的阈值和匹配特征点对数占全部特征数的比例;对图像进行预处理,即将原图像转换为灰度图,对条带图应用一种图像增强方法;计算该图像的尺度不变特征变换特征(Scale-Invariant Feature Transform,SIFT),包括特征点坐标信息和特征向量;紧接着对提取出的特征作特征匹配;然后根据一定的过滤策略对匹配好的特征点对进行过滤,统计符合过滤策略的匹配点对数量;最后判断匹配点对数量占特征点总数的比例是否大于等于参数R,若是,则认为该图像是伪造的,否则认为是非伪造的,对于认为是伪造的图像,在原图像上绘制匹配点对的连接线。
该图像伪造检测装置,包括:获取模块;预处理模块;特征提取模块;特征匹配模块;特征过滤模块;可视化模块。
获取模块:接收两个参数,T为特征匹配过程中的Lowe’s算法的阈值,R为匹配特征点对数占全部特征数的比例。这两个参数的设置可以使用户根据不同种类的图像灵活调整参数,从而提升检测有效率。
预处理模块:使用opencv读取原图像,得到一个RGB三通道图像数组,为了减小图像原始数据量,便于后续处理时计算量更少,将原图像转换为灰度图。
特别的,对于条带图,对其使用一种自适应的阈值确定图像增强方法,该方法按图像的灰度特性,将图像分成背景和目标两部分。具体步骤如下:
1)计算图像的直方图,即将图像所有的像素点按照0~255共256个bin,统计落在每个bin的像素点数量;
2)归一化直方图,即将每个bin中像素点数量除以总的像素点,使其限制在0~1之间;
3)设置一个灰度级阈值i,从0开始迭代,通过归一化的直方图,统计0~i 灰度级的像素(即前景像素) 所占整幅图像的比例w 0,并统计前景像素的平均灰度u 0;统计i~255灰度级的像素(即背景像素) 所占整幅图像的比例w 1,并统计背景像素的平均灰度u 1;设图像的总平均灰度为u 2,前景像素和背景像素的类间方差记为g
Figure 657129DEST_PATH_IMAGE007
不断迭代,直到找到g最大值,此时的i即作为图像的全局阈值,用来划分背景和目标。最终得到一个图像增强后的图像用于后续的特征提取和匹配。图像增强可以有效提升对于条带图的匹配效果,现有图像伪造检测方法均没有使用图像增强,图2展示了不使用图像增强方法和本发明图像增强方法后的匹配效果对比,其中图2(a)是图像增强前的匹配结果,图2(b)是图像增强后的匹配结果。图中第一个条带和第四个条带为复用,不使用图像增强直接进行特征匹配得不到任何匹配点对,图像增强后得到了第一个条带和第四个条带的对应匹配点对连线。
特征提取模块:特征提取模块主要用于提取图像特征点,使用SIFT特征,即尺度不变特征变换,是用于图像处理领域的一种描述。这种描述具有尺度不变性,可在图像中检测出关键点,是一种局部特征描述子。
SIFT特征提取有5个子步骤:
1.构建尺度空间
构建尺度空间的目的是模拟图像数据的多尺度特征,高斯卷积核是实现尺度变换的唯一线性核,尺度空间由高斯核尺度决定,
Figure 290236DEST_PATH_IMAGE008
其中,I(x,y)是原图像,σ是尺度坐标, *是卷积符号,L(x,y,σ)是对应尺度下的尺度图像,G(x,y,σ)是高斯核。
将原始图像不断降阶采样,得到一系列大小不一的图像,由大到小,从下到上构成的塔状模型。原图像为金子塔的第一层,每次降采样所得到的新图像为金字塔的一层(每层一张图像),每个金字塔共n层。为了让尺度体现其连续性,高斯金字塔在简单降采样的基础上加上了高斯滤波。如图3所示,将图像金字塔每层的一张图像使用不同参数做高斯模糊,Octave表示一幅图像可产生的图像组数,每一组图像包含若干层图像。另外,降阶采样时,高斯金字塔上一组图像的初始图像(底层图像)是由前一组图像的倒数第三张图像隔点采样得到的。σ的大小决定图像的平滑程度,大尺度对应图像的概貌特征,小尺度对应图像的细节特征。σ越大表示尺度越粗糙,分辨率越低。
为了有效的在尺度空间检测到稳定的关键点,又提出了高斯差分尺度空间(DOGscale-space),利用不同尺度的高斯差分核与图像卷积生成:
Figure 125337DEST_PATH_IMAGE009
其中,D(x,y,σ)是高斯差分尺度空间;k表示比例系数,常用取值为1.5-1.6。
图4表示不同σ下的DOG尺度空间,使用高斯金字塔每组中相邻上下两层图像相减,得到高斯差分图像。同一组内,不同层图像的尺寸是一样的,后一层图像的尺度坐标是前一层图像尺度坐标的k倍;在不同组内,后一组第一个图像是前一组倒数第三个图像的二分之一采样,图像大小是前一组的一半。
2.检测空间极值点
寻找尺度空间的极值点,需要将每一个采样点与它所有的相邻点比较,看其是否比它的图像域和尺度域的相邻点大或者小。如图5所示,中间的检测点和它同尺度的8个相邻点和上下相邻尺度对应的9×2个点共26个点比较,以确保在尺度空间和二维图像空间都检测到极值点。这个点如果在DOG尺度空间本层以及上下两层的26个领域中是最大或最小值时,就认为该点是图像在该尺度下的一个特征点。
在极值比较的过程中,每一组图像的首末两层是无法进行极值比较的,为了满足尺度变化的连续性,需要在每一组图像的顶层继续用高斯模糊生成了 3 幅图像,高斯金字塔每组有S+3层图像,DOG金字塔每组有S+2层图像。
3.定位关键点
通过拟合三维二次函数以精确确定关键点的位置和尺度,同时去除低对比度的关键点和不稳定的边缘相应点,以增强匹配稳定性,提高抗噪声能力。
为了提高关键点的稳定性,需要对尺度空间DOG函数进行曲线拟合。利用DOG函数在尺度空间的Taylor展开式(拟合函数)为:
Figure 869302DEST_PATH_IMAGE010
其中,
Figure 778352DEST_PATH_IMAGE011
。求导并让方程等于零,可以得到极值点的偏移量为:
Figure 706994DEST_PATH_IMAGE012
对应极值点,方程的值为:
Figure 904757DEST_PATH_IMAGE013
其中,
Figure 577047DEST_PATH_IMAGE014
代表相对插值中心的偏移量,当它在任一维度上的偏移量大于0.5时(即x或y或σ),意味着插值中心已经偏移到它的邻近点上,所以必须改变当前关键点的位置。同时在新的位置上反复插值直到收敛;也有可能超出所设定的迭代次数或者超出图像边界的范围,此时这样的点应该删除。另外,
Figure 278286DEST_PATH_IMAGE015
过小的点易受噪声的干扰而变得不稳定,所以将
Figure 315513DEST_PATH_IMAGE016
小于某个经验值(比如0.03)的极值点删除。同时,在此过程中获取特征点的精确位置(原位置加上拟合的偏移量)以及尺度。
4.指定关键点方向
上一步中确定了每幅图中的特征点,为每个特征点计算一个方向,依照这个方向做进一步的计算,利用关键点邻域像素的梯度方向分布特性为每个关键点指定方向参数,使算子具备旋转不变性。以关键点为中心的邻域窗口内采样,并用直方图统计邻域像素的梯度方向。梯度直方图的范围是0~360度,其中每45度一个柱,总共8个柱, 或者每10度一个柱,总共36个柱。Lowe论文中还提到要使用高斯函数对直方图进行平滑,以减少突变的影响。直方图的峰值代表该关键点处邻域梯度的主方向,其他的达到最大值80%的方向可作为辅助方向。
Figure 859626DEST_PATH_IMAGE017
其中,m(x,y)和θ(x,y)分别是(x,y)处梯度的模值和方向公式,L所用的尺度为每个关键点各自所在的尺度。至此,图像的关键点已经检测完毕,每个关键点有三个信息:位置、所处尺度、方向,由此可以确定一个SIFT特征区域。
5.生成关键点描述子
首先将坐标轴旋转为关键点的方向,以确保旋转不变性。以关键点为中心取8×8的窗口。图6左半部分的中央为当前关键点的位置,每个小格代表关键点邻域所在尺度空间的一个像素,利用公式求得每个像素的梯度幅值与梯度方向,箭头方向代表该像素的梯度方向,箭头长度代表梯度模值,然后用高斯窗口对其进行加权运算。
如图6左半部分所示,图中圆圈代表高斯加权的范围(越靠近关键点的像素梯度方向信息贡献越大)。然后在每个4×4的小块上计算8个方向的梯度方向直方图,绘制每个梯度方向的累加值,即可形成一个种子点。如图6右半部分所示,此图中一个关键点由2×2共4个种子点组成,每个种子点有8个方向向量信息。这种邻域方向性信息联合的思想增强了算法抗噪声的能力,同时对于含有定位误差的特征匹配也提供了较好的容错性。在实际计算过程中,为了增强匹配的稳健性,对每个关键点使用4×4共16个种子点来描述,这样对于一个关键点就可以产生128个数据,即最终形成128维的SIFT特征向量。此时SIFT特征向量已经去除了尺度变化、旋转等几何变形因素的影响,再继续将特征向量的长度归一化,则可以进一步去除光照变化的影响。
统计根据上述五个子步骤提取出的特征数,判断该图像的特征数是否大于3,如果是,则继续下一模块,否则直接结束。
特征匹配模块:现有的技术普遍使用两张图像分别计算SIFT特征进行匹配,本发明只生成单张图像的SIFT特征向量,采用关键点特征向量的欧式距离来作为单张图像中关键点的相似性判定度量。对于任意两个特征向量X=(x1, x2, ……, xn)和Y=(y1, y2, ……,yn),其欧氏距离为dist(X,Y):
Figure 945394DEST_PATH_IMAGE018
考虑到关键点较多的情况下,暴力求解两两向量之间的二近邻时间复杂度可达O(n2),因此本发明采用Kd树搜索二近邻,对于128维特征向量集T={a1, a2, ……, aN},其中ai = (ai (1), ai (2), ……, ai (128)),i=1, 2, ……,N,首先需要构造kd树,构造方法如下:
a)选取x(1)为坐标轴,以T中的所有数据x(1)坐标中的中位数作为切分点,将超矩形区域切割成两个子区域。将该切分点作为根结点,由根结点生出深度为1的左右子结点,左节点对应x(1)坐标小于切分点,右结点对应x(1)坐标大于切分点;
b)对深度为j的结点,选择x(r)为切分坐标轴,r=j(mod 128)+1,以该结点区域中训练数据x(r)坐标的中位数作为切分点,将区域分为两个子区域,且生成深度为j+1的左、右子结点。左节点对应x(k)坐标小于切分点,右结点对应x(k)坐标大于切分点;
重复b),直到j=2时停止,此时就获得了二近邻。
得到二近邻后采用Lowe’s算法,即比较最近邻距离d1与次近邻距离d2的比值是否小于参数T的方法来判断是否接受匹配点对,其中参数T由用户输入,若是,则接受,否则不接受。这样可以排除因为图像遮挡和背景混乱而产生的无匹配关系的关键点,因为对于错误匹配,由于特征空间的高维性,相似的距离可能有大量其他的错误匹配,从而它的最近邻距离d1与次近邻距离d2比值比较高。
本发明推荐参数T为0.7。经过大量实验表明,该比值在0. 6~0.8 之间最佳,建议参数T的取值原则如下:
T=0. 6,希望检测结果较为精准;
T=0. 8,希望检测出尽可能多的疑似伪造区域;
T=0. 7,一般情况下。
特征过滤模块:现有的SIFT特征匹配技术在自然场景中的应用在图像匹配结束后即可输出结果,但由于学术图像的特殊性,例如学术图像往往是由多张矩形小图组成、图像内部本身存在合理的相同区域等,直接将SIFT特征匹配结果应用在学术图像的伪造检测上得到的结果往往不佳。因此加入特征过滤模块,用于过滤不合适的特征匹配点对。
具体分为三种过滤策略:
1.边缘缩进策略
现有方法往往直接忽略图像边缘像素的处理,实际上,边缘计算出的SIFT特征点容易匹配到较多不符合要求的特征点,因此采用边缘缩进策略,设定一个边缘缩进阈值,通过判断特征点的位置是否处于缩进范围进行过滤,可以等到更干净的结果。
2.去除一对多关系
现有方法往往直接保留一个特征点与多个特征点匹配的情况,导致图像上出现“单点放射性连线”现象,即匹配结果只有单个特征点与多个特征点的连线,这会影响其他特征点的配对,去除此类一对多关系,可以提高其他特征的匹配成功率。
3.聚类
图像伪造的区域往往是局部而不是单点,因此对剩余的匹配点进行层次聚类,可以有效定位伪造区域,去除离散匹配点对带来的影响。
采用以上三种过滤策略可以有效提升伪造检测的效果,图7展示了过滤前后的效果对比,图7(b)的结果明显比图7(a)更干净更直观。
可视化模块:判断匹配点对数量占特征点总数的比例是否大于等于参数R,在原图上绘制过滤后的特征匹配点对,每对匹配点通过直线相连。
本发明提供一种图像伪造检测方法,采用上述图像伪造装置进行检测,具体步骤包括:
S101:获取参数,该方法接收两个参数,T为Low’s算法的阈值,R为匹配特征点对数占全部特征数的比例;
S102:图像预处理,读取原图像,并将原图像转换为灰度图,图8为两组生物医学领域的学术论文图片的灰度图,其中图8(a)为论文中的实物图的灰度图,图8(b)为论文中的染色图的灰度图;对条带图计算直方图、迭代寻找自适应阈值,以进行图像增强;
S103:提取特征,计算该图像的尺度不变特征变换特征(Scale-InvariantFeature Transform, SIFT),得到特征点坐标信息和特征向量,其中包括构建尺度空间、检测空间极值点、定位关键点、指定关键点方向、生成关键点描述子五个子步骤。图9表示绘制只有中心点的关键点,其中,图9(a)和图9(b)分别是与图8(a)和图8(b)对应的只有中心点的关键点。图10表示绘制带有关键点大小和方向的关键点,其中,图10(a)和图10(b)分别是与图8(a)和图8(b)对应的带有关键点大小和方向的关键点。判断该图像的特征数是否大于3,如果是,则继续以下流程,如果不是,则直接结束;
S104:特征匹配,遍历每一个特征,计算其与剩余特征之间的距离,取欧式距离最小和第二小的特征向量,距离分别记为d1和d2,根据Lowe’s算法,如果d1<d2*T,则认为这两个特征高度相似,保留该特征匹配点对,否则不保留;
S105:特征过滤,对S104计算结束后的所有特征匹配点对进行筛选,依次进行边缘缩进判断、去除一对多关系、聚类三个操作,并统计最终保留的匹配点对数量;
S106:可视化,判断匹配点对数量占特征点总数的比例是否大于等于参数R,如果满足,则在原图像中绘制匹配点,并以直线连接,如果不满足,则直接结束。图11表示将匹配点对连线后的结果,其中,图11(a)和图11(b)分别是与图8(a)和图8(b)对应的将匹配点对连线后的结果。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (3)

1.一种学术图像条带图伪造检测装置,其特征在于,包括:
获取模块,接收两个参数,T为Lowe’s算法的阈值,R为匹配特征点对数占全部特征数的比例;
预处理模块,读取原图像,并将原图像转换为灰度图;
特征提取模块,计算图像的尺度不变特征变换特征(SIFT),得到特征点坐标信息和特征向量;对该图像的特征数进行判断;
特征匹配模块,遍历每一个特征,计算其与剩余特征之间的距离,取欧式距离最小和第二小的特征向量,距离分别记为d1和d2,根据Lowe’s算法,如果d1<d2*T,T取值为0.7~0.8,则认为这两个特征高度相似,保留该特征的特征匹配点对,否则不保留;
特征过滤模块,对所有特征匹配点对进行筛选,依次进行边缘缩进判断、去除一对多关系、聚类,并统计最终保留的匹配点对数量;
可视化模块,判断匹配点对数量占特征点总数的比例是否大于等于参数R,在原图像上绘制过滤后的特征匹配点对,每对匹配点通过直线相连;
所述预处理模块,对所述条带图进行图像增强,包括以下步骤:
1)计算图像的直方图,将图像所有的像素点按照0~255共256个bin,统计落在每个bin的像素点数量;
2)归一化直方图,将每个bin中像素点数量除以总的像素点,使其限制在0~1之间;
3)设置灰度级阈值i,从0开始迭代,通过归一化的直方图,统计0~i 灰度级的前景像素所占整幅图像的比例w 0,并统计前景像素的平均灰度u 0;统计i~255灰度级的背景像素所占整幅图像的比例w 1,并统计背景像素的平均灰度u 1;设图像的总平均灰度为u 2,前景像素和背景像素的类间均值差记为g
Figure 800320DEST_PATH_IMAGE001
不断迭代,直到找到g最大值,此时的i作为图像的全局阈值,用于划分背景和目标,得到进行图像增强后的条带图;
所述特征过滤模块,所述边缘缩进判断通过设定一个边缘缩进阈值,判断特征点的位置是否处于缩进范围,进行匹配点对过滤;所述去除一对多关系,去除单个特征点与多个特征点连接的匹配点对结果;所述聚类,对剩余的匹配点对进行层次聚类。
2.根据权利要求1所述的装置,其特征在于,所述特征提取模块,计算图像的尺度不变特征变换特征,包括构建尺度空间、检测空间极值点、定位关键点、指定关键点方向、生成关键点描述子五个子步骤:
1)构建尺度空间,尺度空间由高斯核尺度决定,
Figure 186302DEST_PATH_IMAGE002
其中,I(x,y)是原图像,σ是尺度坐标, *是卷积符号,L(x,y,σ)是对应尺度下的尺度图像, G(x,y,σ)是高斯核;
高斯差分尺度空间为
Figure 434881DEST_PATH_IMAGE003
其中,k表示比例系数,σ的大小决定图像的平滑程度,大尺度对应图像的概貌特征,小尺度对应图像的细节特征;σ越大表示尺度越粗糙,分辨率越低;
2)检测空间极值点,将每一个采样点与它所有的相邻点比较,看其是否比它的图像域和尺度域的相邻点大或者小;当这个点在所述尺度空间本层以及上下两层的所有领域中是最大或最小值时,认为该点是图像在该尺度下的一个特征点;
3)定位关键点,对高斯差分尺度空间函数求导,并令其为零,得到极值点的偏移量:
Figure 33352DEST_PATH_IMAGE004
其中,
Figure 113304DEST_PATH_IMAGE005
为极值点的偏移量;D为高斯差分尺度空间函数
Figure 653875DEST_PATH_IMAGE006
x为图像x轴坐标;
4)指定关键点方向,利用关键点邻域像素的梯度方向分布特性为每个关键点指定方向参数,使算子具备旋转不变性,以关键点为中心的邻域窗口内采样,并用直方图统计邻域像素的梯度方向,直方图的峰值代表该关键点处邻域梯度的主方向,其他的达到最大值80%的方向可作为辅助方向:
Figure 124171DEST_PATH_IMAGE007
其中,(x,y)为图像坐标,m(x,y)和θ(x,y)分别是(x,y)处梯度的模值和方向公式,其中L所用的尺度为每个关键点各自所在的尺度;
5)生成关键点描述子,将坐标轴旋转为步骤4)得到的关键点方向,以关键点为中心取16×16的窗口,窗口的每个小格代表关键点邻域所在尺度空间的一个像素,利用公式求得每个像素的梯度幅值与梯度方向,箭头方向代表该像素的梯度方向,箭头长度代表梯度模值,然后用高斯窗口对其进行加权运算。
3.根据权利要求1所述的装置,其特征在于,所述特征匹配模块,遍历每一个特征,计算其与剩余特征之间的距离,具体为:
对于任意两个特征向量X=(x 1, x 2, ……, x n)和Y=(y 1, y 2, ……, y n),其欧氏距离为dist(X,Y):
Figure 791913DEST_PATH_IMAGE008
采用Kd树搜索二近邻,对于128维特征向量集T={a1, a2, ……, aN},其中ai = (ai(1), ai(2), ……, ai(128)),i=1, 2, ……,N,首先需要构造kd树,构造方法如下:
a) 选取x(1)为坐标轴,以T中的所有数据x(1)坐标中的中位数作为切分点,将超矩形区域切割成两个子区域;将该切分点作为根结点,由根结点生出深度为1的左右子结点,左节点对应x(1)坐标小于切分点,右结点对应x(1)坐标大于切分点;
b) 对深度为j的结点,选择x(r)为切分坐标轴,r=j(mod 128)+1,以该结点区域中训练数据x(r)坐标的中位数作为切分点,将区域分为两个子区域,且生成深度为j+1的左、右子结点;左节点对应x(k)坐标小于切分点,右结点对应x(k)坐标大于切分点;
重复b),直到j=2时停止,此时就获得了二近邻d2。
CN202110940038.7A 2021-08-17 2021-08-17 图像伪造检测装置和方法 Active CN113392856B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110940038.7A CN113392856B (zh) 2021-08-17 2021-08-17 图像伪造检测装置和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110940038.7A CN113392856B (zh) 2021-08-17 2021-08-17 图像伪造检测装置和方法

Publications (2)

Publication Number Publication Date
CN113392856A CN113392856A (zh) 2021-09-14
CN113392856B true CN113392856B (zh) 2021-11-23

Family

ID=77622726

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110940038.7A Active CN113392856B (zh) 2021-08-17 2021-08-17 图像伪造检测装置和方法

Country Status (1)

Country Link
CN (1) CN113392856B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114782715B (zh) * 2022-04-08 2024-04-16 宁波芯然科技有限公司 一种基于统计信息的静脉识别方法
CN115439479B (zh) * 2022-11-09 2023-02-03 北京航空航天大学 一种基于强化学习的学术图像复用检测方法
CN117058432B (zh) * 2023-10-11 2024-01-30 北京万方数据股份有限公司 图像查重方法、装置、电子设备及可读存储介质
CN117576425B (zh) * 2024-01-17 2024-04-16 南京掌控网络科技有限公司 一种窜拍图像检测的方法和系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL226219A (en) * 2013-05-07 2016-10-31 Picscout (Israel) Ltd Efficient comparison of images for large groups of images
CN106709928B (zh) * 2016-12-22 2019-12-10 湖北工业大学 一种快速的含噪图像二维最大类间方差阈值法
CN111767956B (zh) * 2020-06-30 2022-07-15 苏州科达科技股份有限公司 图像篡改检测方法、电子设备、存储介质

Also Published As

Publication number Publication date
CN113392856A (zh) 2021-09-14

Similar Documents

Publication Publication Date Title
CN113392856B (zh) 图像伪造检测装置和方法
CN110298376B (zh) 一种基于改进b-cnn的银行票据图像分类方法
CN110443128B (zh) 一种基于surf特征点精确匹配的指静脉识别方法
CN112686812B (zh) 银行卡倾斜矫正检测方法、装置、可读存储介质和终端
CN110334762B (zh) 一种基于四叉树结合orb和sift的特征匹配方法
CN107967482A (zh) 图标识别方法及装置
CN104809731B (zh) 一种基于梯度二值化的旋转尺度不变场景匹配方法
CN109919960B (zh) 一种基于多尺度Gabor滤波器的图像连续边缘检测方法
CN107292869B (zh) 基于各向异性高斯核和梯度搜索的图像斑点检测方法
CN108197644A (zh) 一种图像识别方法和装置
CN104182973A (zh) 基于圆形描述算子csift的图像复制粘贴检测方法
CN110414571A (zh) 一种基于特征融合的网站报错截图分类方法
CN105718552A (zh) 基于服装手绘草图的服装图像检索方法
Daixian SIFT algorithm analysis and optimization
CN113837037A (zh) 一种植物种类识别方法、系统、电子设备及存储介质
CN113011426A (zh) 一种识别证件的方法和装置
CN115311746A (zh) 一种基于多特征融合的离线签名真伪检测方法
CN108876776B (zh) 一种分类模型生成方法、眼底图像分类方法及装置
CN104268550A (zh) 特征提取方法及装置
CN112101283A (zh) 一种交通标志智能识别方法及系统
CN110070626B (zh) 一种基于多视角分类的三维物体检索方法
CN111797832A (zh) 一种图像感兴趣区域自动生成方法及系统及图像处理方法
CN116503622A (zh) 基于计算机视觉图像的数据采集读取方法
CN115035281B (zh) 一种快速的红外全景图像拼接方法
CN115511928A (zh) 多光谱图像的匹配方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant