CN101853384B - 一种彩色激光打印文档中黄色斑点阵列信息提取方法 - Google Patents
一种彩色激光打印文档中黄色斑点阵列信息提取方法 Download PDFInfo
- Publication number
- CN101853384B CN101853384B CN2010101544654A CN201010154465A CN101853384B CN 101853384 B CN101853384 B CN 101853384B CN 2010101544654 A CN2010101544654 A CN 2010101544654A CN 201010154465 A CN201010154465 A CN 201010154465A CN 101853384 B CN101853384 B CN 101853384B
- Authority
- CN
- China
- Prior art keywords
- information
- yellow
- image
- row
- barycenter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000007648 laser printing Methods 0.000 title claims abstract description 10
- 238000000605 extraction Methods 0.000 title abstract description 7
- 238000000034 method Methods 0.000 claims abstract description 17
- 239000000284 extract Substances 0.000 claims abstract description 16
- 238000012937 correction Methods 0.000 claims abstract description 14
- 238000007639 printing Methods 0.000 claims abstract description 11
- 238000002474 experimental method Methods 0.000 claims description 9
- 239000004744 fabric Substances 0.000 claims description 4
- 238000001228 spectrum Methods 0.000 claims description 4
- 238000010183 spectrum analysis Methods 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 238000001914 filtration Methods 0.000 claims description 2
- 230000001915 proofreading effect Effects 0.000 claims 1
- 238000011840 criminal investigation Methods 0.000 abstract description 2
- 230000010365 information processing Effects 0.000 abstract description 2
- 238000004891 communication Methods 0.000 abstract 2
- 238000005516 engineering process Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 125000002950 monocyclic group Chemical group 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 241000234435 Lilium Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000005242 forging Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000002386 leaching Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000010008 shearing Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Landscapes
- Image Processing (AREA)
- Editing Of Facsimile Originals (AREA)
Abstract
一种彩色激光打印文档中黄色斑点阵列信息提取方法,属于信号与信息处理技术领域。其特征是利用某些彩色激光打印机的打印文档存在与打印机型号一一对应的黄色斑点信息。通过对黄色斑点进行连通区域的标记,确定连通区域的质心,并对质心图像进行倾斜校正,提取黄色斑点栅格信息,最后通过迭代比较获得打印文档中单个周期的黄色斑点信息。本发明的效果和益处是帮助刑侦司法部门从彩色激光打印机打印的文档中自动提取出黄色斑点信息,对部分彩色激光打印机的来源进行准确的鉴别和取证。
Description
技术领域
本发明属于信号与信息处理技术领域,涉及到彩色激光打印文档中黄色斑点阵列信息提取方法。
背景技术
激光打印机的制造商很早就考虑到其高性能的办公设备会给伪造文件者提供方便,于是在打印机输出文件中嵌入了供追查文件来源的水印信息。在电子先锋(EFF,Electronic Frontier Foundation)的网站http://w2.eff.org/Privacy/printers/docucolor/,2009.9.26上,报道了施乐彩色激光打印机在输出文档中嵌入规则的黄色斑点阵列,如图1所示,以此记录文档的打印机型、打印时间等信息。刘宁、裴蕾、陈春涛等针对彩色激光打印机的黄点嵌入机制给予了一些实验性研究工作的总结。图1(a)为实际扫描的带有黄色斑点灰度图像,其尺寸要大于实际;图1(b)为人工绘制的带有黄色斑点灰度图像,用以说明斑点阵列的编码格式。
EFF统计了18个厂商的209种型号的彩色打印机,具体如表1所示。其中141种型号含有能够追踪来源的黄色斑点,57种型号不含有,剩余的11种型号未知。能够看出,有67%的彩色激光打印机嵌入了黄色斑点阵列信息,其它没有嵌入黄色斑点阵列的打印机可能采用了其它未知的技术嵌入了水印。
对于含有黄色斑点的彩色打印文档,通过提取黄点阵列信息准确的找到其来源打印机型号。但是,占据市场上份额非常大的黑白激光打印机和喷墨打印机是不可能嵌入“黄色”的墨点水印的。所以这种可靠且简易的方法存在很大的局限性。
目前国内有些文献针对于实际刑事案件的需要,对上述黄色斑点阵列信息进行了相关的研究工作。具体包括:刘宁,裴雷收集了11种不同品牌和型号的电子成像技术的14台机器(包括彩色激光打印机、彩色模拟复印机、彩色数码复印机)制作的文件,对这些文件是否有黄点阵列进行了研究,并用人工的方式对有黄点阵列的文件进行了信息提取。陈春涛,裴雷对施乐DocuColor系列彩色激光打印机的隐写点阵进行了详尽的分析,阐述了点阵解码的方法,并给出了一个利用Excel获取打印机信息的方法。李江春利用专业设备VSC25000文检仪等对待检文档进行黄点阵列的检验。
表1各品牌彩色激光打印机是否嵌入黄色斑点型号统计表
上述方法均是依靠人工手动提取黄色斑点阵列信息。依靠人工提取黄色斑点阵列信息存在成本高、准确率较低、提取效率较低的缺点。
发明内容
本发明要解决的技术问题是如何自动提取彩色激光打印机的黄色斑点阵列信息,以弥补目前依靠手动提取的不足。本发明旨在实现从彩色激光打印文档中,提取出黄色斑点阵列信息,以帮助实现追踪文档的打印机来源。
本发明的技术方案如下:
1.算法的具体框图
对文档图像使用算法提取出黄色斑点阵列,算法具体的框图如图2所示。
针对文档图像,首先要检测黄色斑点的质心,然后对质心阵列进行行向和列向倾斜校正,使用频谱分析方法获得阵列的栅格信息,从而得到全体斑点阵列,最后对全体阵列各周期求平均值得到单周期的斑点阵列。
2.检测黄色斑点区域的质心
黄色斑点区域的质心提取过程根据打印文档内容而不相同。
对于纯白色文档图像,在RGB三个通道中分别进行基于阈值的二值化处理,选取阈值为0.9,得到三幅二值图像Ir,Ig,Ib。通过Iyd=IrandIgand(~Ib)得到黄色斑点二值图像。
对于纯淡蓝色文档图像,将图像从RGB色彩空间转换至HSV色彩空间,对H分量进行基于阈值的二值化,选取阈值为0.5,得到二值图像Ih。实验发现存在很多单像素噪声斑点,所以需要滤除所有面积为1的连通区域,得到斑点二值图像Iyd。
将斑点二值图像Iyd标记连通区域,并提取各连通区域质心。生成另一幅二值图像,此图像在斑点区域的质心处为1,其他区域均为0,称为斑点质心图像。
实验中得到的斑点二值图像和斑点质心图像分别如图3(a)和图3(b)所示。为便于观察,对斑点质心图像3(b)中的质心进行了放大处理。
3.对斑点质心阵列进行行向和列向倾斜校正
文档扫描过程中不可避免的存在倾斜角度,需要进行倾斜校正。针对斑点质心图像,采用经典的行列投影方法进行倾斜校正。
斑点质心图像中仅含有单像素点,通过最大化行列投影向量中0元素的个数确定最佳旋转角度。由于平行线畸变为相交线失真的存在,由行和列投影向量确定的最佳旋转角度往往并不相等,取两者的均值也并不能明显改善倾斜校正效果。
针对上述问题,实验中对行列坐标分别进行旋转。根据行投影向量确定最佳旋转角度,每次进行图像旋转对行坐标进行处理时,列坐标保持不变;而对列坐标进行处理时,行坐标保持不变。旋转角度步进为仅使坐标产生单像素变化的角度,搜索范围在实验中视情况确定。搜索最优旋转角度的示例如图4所示,其中列、行向最优旋转角度分别在第55和43个步进角度处出现。
4.提取斑点阵列栅格信息
使用频谱分析方法获得黄色斑点阵列的栅格步长信息。对倾斜校正斑点质心图像的行、列投影向量进行傅立叶变换,其幅度谱中峰值频率所对应的时域值代表了行、列向栅格步长。步长R使用公式进行计算,其中N为离散傅立叶变换的点数,fmax为基频频率值。所谓的基频就是指在傅立叶变换幅度谱中具有最大幅值的频率。举例说明如图5所示,5(a)为质心在行投影向量中的累积数值,图5(b)为傅里叶变换幅度,其中峰值点所对应的数字频率为183,得到对应的行向栅格步长为Rrow=3300/183=18个像素。利用此方法得到相应的列向栅格步长Rcol。
依据栅格步长,对图像中的质心进行对齐。首先按照先行后列的顺序寻找质心点,将第一个黄点称为基准点,行列坐标分别为x和y,然后以该基准点为中心,以Rrow和Rcol为长和宽取其栅格块,以此栅格块大小为基础,在图像上按照先行后列的顺序无重叠的移动,假设移动到第m行,第n列个栅格块,当有黄点出现在栅格块中时,将其行坐标修改为x+(m-1)×Rrow,列坐标改为y+(n-1)×Rcol。循环直至所有质心均处理完毕。这种对齐操作使属于同一行(列)质心的行(列)坐标统一为相同的值。
针对对齐的质心图像,标记栅格信息。寻找列投影向量中不为零的元素,其坐标再加上半个列栅格步长即是行栅格坐标,所有的列栅格坐标构成列栅格信息;对行投影向量进行同样处理得到行栅格信息。标记栅格的质心图像如图3(c)所示。
5.获得全体斑点阵列
在获得栅格信息后,通过判断栅格间的方块图像中是否存在斑点来确定该栅格处的是否含有斑点。得到页面图像整体的斑点阵列,1号打印机部分斑点阵列如图6所示。由图6中可知,黄色斑点阵列在行和列方向均存在以周期进行循环的状况,图中在行方向存在三个周期,在列方向存在两个周期。观察可知,单个周期中有时存在误码。
6.获取单周期的黄点阵列信息
首先要求出阵列周期所包含栅格的行数L和列数W,采用迭代比较的算法,在行方向上以l×w为栅格大小的周期无重叠的移动并与所覆盖的栅格信息比较,计算其与所经历栅格信息的重叠率,其中w=1,2,3…,在行方向移动栅格求W与l的选择无关,因此本算法里l=20,由于全体斑点阵列中存在误码,w从1开始迭代,直至总重叠率大于等于90%,所得到的w为所求的周期列数W,同理求出周期行数L,图6中,求得L=22,W=18。为获得单周期的黄点阵列信息,将全体斑点阵列信息累加到一个栅格周期当中,如果周期斑点阵列中某处的累积量大于周期信号个数的50%,则确定该处有斑点;否则,该处没有斑点。
综上所述,本发明对彩色激光打印文档中的黄色斑点阵列信息提取的具体步骤如下:首先,检测黄色斑点区域的质心;其次,对斑点质心阵列进行行向和列向倾斜校正;第三步,提取斑点阵列栅格信息;第四步,获得全体黄点阵列;最后,获取单周期的黄点阵列信息。
本发明的效果和益处是:
目前刑侦司法部门均依靠人工提取黄色斑点阵列信息,而本发明则是帮助他们更快更准确的提取出黄色斑点阵列信息。本发明充分考虑到实际的打印和扫描过程中文档页面存在的倾斜现象,在提取特征点之后对斑点阵列信息进行了倾斜校正,使得能够准确地提取出黄色斑点阵列信息。本发明适用于信息安全领域,可以有效地提取出彩色激光打印文档中的黄色斑点阵列信息。
附图说明
图1是实际彩色激光打印文档中的黄色斑点局部图和一种黄点阵列编码格式图。
图中:图1(a)是黄色斑点观察图的局部灰度图像,图1(b)是一种黄色斑点阵列编码格式观察图。
图2是黄色斑点提取算法框图。
图3是斑点区域检测图、斑点质心检测图及倾斜校正并标记栅格斑点质心图。
图中:图3(a)是斑点区域检测图,图3(b)是斑点质心检测图,图3(c)是倾斜校正并标记栅格斑点质心图。
图4是不同旋转角度下投影向量中0元素个数分布图。
图中:图4(a)是列向投影向量中0元素个数;图4(b)是行向投影向量中0元素个数。
图5是行投影向量显示图及傅立叶变换幅度谱图。
图中:图5(a)是行投影向量显示图,图5(b)是该投影向量的傅立叶变换幅度谱的显示图。
图6是来自1号打印机的黄色斑点阵列的周期性观察图。
图7是实际彩色激光打印文档中的黄色斑点观察图。
图中:图7(a)是纯白色背景下的黄色斑点观察图的灰度图,图7(b)是纯淡蓝色背景下的黄色斑点观察图的灰度图。其中圆圈标记之处为黄点。
图8是1号、2号、3号打印机所包含的黄点阵列信息图。
图中:图8(a)是1号打印机所包含的黄点阵列信息图,图8(b)是2号打印机所包含的黄点阵列信息图,图8(c)是3号打印机所包含的黄点阵列信息图。
具体实施方式
以下结合技术方案和附图详细叙述本发明的具体实施方式。
实际中需要提取打印机黄色斑点阵列信息,以检验某文档中的黄点阵列是否与其吻合。本节中介绍的算法能够帮助提取出黄色斑点阵列信息。使用纯白色或纯淡蓝色均匀图像进行打印,可以使提取算法简单准确。如何从内容任意的打印文档中提取黄点技术还有待探索,其难点在如何检测出黄点所在的位置,而后续的处理技术可以借鉴本算法。
实验选用型号分别为Hp1518、Hp2025、Hp5500的三台彩色激光打印机,打印机个体信息如表2所示,它们的彩色打印文档中均包含黄色斑点阵列信息。
表2 3台彩色激光打印机的详细信息
1号和3号打印机使用底部含有彩色其余为纯白色的图像;2号打印机使用纯淡蓝色图像。2号打印机仅在图像中含有彩色的区域及附近产生黄色斑点。各打印机图像经过打印扫描后,对文档图像剪切得到上半部分。部分截图如图7所示,从中观察到圆圈内的黄色斑点。
实验表明,型号分别为Hp1518、Hp2025、Hp5500的三台打印机所打印文档中均包含黄点阵列,而且均呈现18列×22列的周期性,该编码中不包含时间信息,推测仅包含打印机个体的序列号。
经过上述处理,3台打印机的黄点阵列如图8所示。实验中各打印机均间隔几分钟打印了4张样本,每台打印机的4个样本中提取出的黄点阵列均相同,仅在打印机之间存在差异。由此可知,Hp的3种型号打印机的黄点阵列中不包含打印时间信息。
分析图8中的三个黄点阵列可知,前6行信号一致,它可能代表了用于信号同步。第7行为空白行,第8到22行各不相同,推测其可能为打印机的序列号信息。在第8到22行中,三台打印机在第1和第10列均不包含黄色斑点;在第8到22行中,不存在行或列方向相邻的黄色斑点。由于打印机数量较少,打印机个体的序列号差异较大,所以未能对黄点阵列信息解码。虽然未能解码,但是由于黄点阵列并不随打印时间和内容发生变化,可以直接比较提取出的黄色斑点阵列,就可以实现打印文档的来源认证。
Claims (1)
1.一种彩色激光打印文档中黄色斑点阵列信息提取方法,其特征是利用部分彩色激光打印机的打印文档存在与打印机型号一一对应的黄色斑点信息,通过对黄色斑点进行连通区域的标记,确定连通区域的质心,并对质心图像进行倾斜校正,提取黄色斑点栅格信息,最后通过迭代比较获得打印文档中单个周期的黄色斑点信息;对质心图像分别进行行向和列向的倾斜校正,实验中对行列坐标分别进行旋转,通过最大化行列投影向量中0元素的个数确定最佳旋转角度;通过校正来消除扫描文档时所造成的倾斜;提取黄色斑点栅格信息,使用频谱分析方法获得黄色斑点阵列的栅格步长,对倾斜校正斑点质心图像的行、列投影向量进行傅立叶变换,其幅度谱中峰值频率所对应的时域值代表了行、列向栅格步长,通过对栅格的标记获得扫描文档的全体斑点阵列;通过迭代比较获得打印文档中单个周期的黄色斑点信息,通过迭代比较的方法获得栅格信息的周期,再将全体斑点信息累加到一个周期中获得单个周期的黄点信息;对于纯白色文档图像,在RGB三个通道中分别进行基于阈值的二值化处理,选取阈值为0.9,得到三幅二值图像Ir,Ig,Ib;通过Iyd=IrandIgand(~Ib)得到黄色斑点二值图像;对于纯淡蓝色文档图像,将图像从RGB色彩空间转换至HSV色彩空间,对H分量进行基于阈值的二值化,选取阈值为0.5,得到二值图像Ih;实验发现存在很多单像素噪声斑点,所以需要滤除所有面积为1的连通区域,得到斑点二值图像Iyd;将斑点二值图像Iyd标记连通区域,并提取各连通区域质心;生成另一幅二值图像,此图像在斑点区域的质心处为1,其他区域均为0,称为斑点质心图像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010101544654A CN101853384B (zh) | 2010-04-20 | 2010-04-20 | 一种彩色激光打印文档中黄色斑点阵列信息提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010101544654A CN101853384B (zh) | 2010-04-20 | 2010-04-20 | 一种彩色激光打印文档中黄色斑点阵列信息提取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101853384A CN101853384A (zh) | 2010-10-06 |
CN101853384B true CN101853384B (zh) | 2012-07-04 |
Family
ID=42804864
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010101544654A Expired - Fee Related CN101853384B (zh) | 2010-04-20 | 2010-04-20 | 一种彩色激光打印文档中黄色斑点阵列信息提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101853384B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107169459A (zh) * | 2017-05-18 | 2017-09-15 | 湖北警官学院 | 基于暗记点阵形态的打印复印文件鉴别系统及方法 |
CN108460381B (zh) * | 2018-03-13 | 2022-06-10 | 南京邮电大学 | 基于图像识别的发票报销信息定位及截取方法 |
CN109241821B (zh) * | 2018-07-11 | 2021-06-29 | 湖北警官学院 | 一种彩色激光打印复印文件类别鉴别方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6826688B1 (en) * | 1999-03-27 | 2004-11-30 | Sharp Laboratories Of America, Inc. | Method and apparatus for determining the identity of a digital printer from its output |
US20070115510A1 (en) * | 2005-11-18 | 2007-05-24 | International Business Machines Corporation | Marking images of text with speckle patterns for theft deterrence |
CN101587540B (zh) * | 2009-04-16 | 2011-08-03 | 大连理工大学 | 一种利用页面文档几何失真检测文档来源的打印机取证方法 |
-
2010
- 2010-04-20 CN CN2010101544654A patent/CN101853384B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN101853384A (zh) | 2010-10-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4187749B2 (ja) | ハーフトーンウォーターマーキングおよび関連アプリケーション | |
JP4708186B2 (ja) | 2次元コード解読プログラム | |
US6760464B2 (en) | Halftone watermarking and related applications | |
US8792128B2 (en) | Apparatus, system, and method of inspecting image, and recording medium storing image inspection control program | |
US7545541B2 (en) | Systems and methods for embedding metadata in a color measurement target | |
US6694041B1 (en) | Halftone watermarking and related applications | |
CN101958989B (zh) | 图像处理装置、图像处理系统及图像处理方法 | |
CN103559473A (zh) | 利用特征图像来实现承印物防伪的方法和系统 | |
US8175323B2 (en) | Image processing method and image processing apparatus | |
JP4977103B2 (ja) | 印刷文書認証方法、コンピュータプログラムプロダクト及びデータ処理システム | |
KR20080095743A (ko) | 화상 처리 프로그램 및 화상 처리 장치 | |
CN101853384B (zh) | 一种彩色激光打印文档中黄色斑点阵列信息提取方法 | |
JP2009111980A5 (ja) | 印刷文書認証方法、コンピュータプログラムプロダクト及びデータ処理システム | |
US7911653B2 (en) | Device using low visibility encoded image to manage copy history | |
US8976428B2 (en) | Image information managing method, image information managing apparatus and image information managing system for preparing and measuring an evaluation chart | |
JP2007026428A (ja) | 2次元コード生成方法、読取方法、および実行プログラム | |
CN1767587B (zh) | 用于复色激光打印机的数据嵌入方法和数据恢复方法 | |
Rabah et al. | The supatlantique scanned documents database for digital image forensics purposes | |
JP2019047441A (ja) | 画像処理装置、読取装置、画像処理方法、およびプログラム | |
CN114580589A (zh) | 一种双通道二维码与用于防复印和信息隐藏的控制方法 | |
WO2020089984A1 (ja) | 画像処理装置、制御方法及び制御プログラム | |
CN111428796A (zh) | 一种基于深度学习的通用物品检测方法及系统 | |
Simske et al. | Document imaging security and forensics ecosystem considerations | |
JP6025803B2 (ja) | 画像処理装置 | |
JP2016025420A (ja) | 画像処理装置、画像処理方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120704 Termination date: 20160420 |
|
CF01 | Termination of patent right due to non-payment of annual fee |