CN101853384B - 一种彩色激光打印文档中黄色斑点阵列信息提取方法 - Google Patents

一种彩色激光打印文档中黄色斑点阵列信息提取方法 Download PDF

Info

Publication number
CN101853384B
CN101853384B CN2010101544654A CN201010154465A CN101853384B CN 101853384 B CN101853384 B CN 101853384B CN 2010101544654 A CN2010101544654 A CN 2010101544654A CN 201010154465 A CN201010154465 A CN 201010154465A CN 101853384 B CN101853384 B CN 101853384B
Authority
CN
China
Prior art keywords
information
yellow
image
row
barycenter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2010101544654A
Other languages
English (en)
Other versions
CN101853384A (zh
Inventor
孔祥维
吴玉宝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian University of Technology
Original Assignee
Dalian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian University of Technology filed Critical Dalian University of Technology
Priority to CN2010101544654A priority Critical patent/CN101853384B/zh
Publication of CN101853384A publication Critical patent/CN101853384A/zh
Application granted granted Critical
Publication of CN101853384B publication Critical patent/CN101853384B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

一种彩色激光打印文档中黄色斑点阵列信息提取方法,属于信号与信息处理技术领域。其特征是利用某些彩色激光打印机的打印文档存在与打印机型号一一对应的黄色斑点信息。通过对黄色斑点进行连通区域的标记,确定连通区域的质心,并对质心图像进行倾斜校正,提取黄色斑点栅格信息,最后通过迭代比较获得打印文档中单个周期的黄色斑点信息。本发明的效果和益处是帮助刑侦司法部门从彩色激光打印机打印的文档中自动提取出黄色斑点信息,对部分彩色激光打印机的来源进行准确的鉴别和取证。

Description

一种彩色激光打印文档中黄色斑点阵列信息提取方法
技术领域
本发明属于信号与信息处理技术领域,涉及到彩色激光打印文档中黄色斑点阵列信息提取方法。
背景技术
激光打印机的制造商很早就考虑到其高性能的办公设备会给伪造文件者提供方便,于是在打印机输出文件中嵌入了供追查文件来源的水印信息。在电子先锋(EFF,Electronic Frontier Foundation)的网站http://w2.eff.org/Privacy/printers/docucolor/,2009.9.26上,报道了施乐彩色激光打印机在输出文档中嵌入规则的黄色斑点阵列,如图1所示,以此记录文档的打印机型、打印时间等信息。刘宁、裴蕾、陈春涛等针对彩色激光打印机的黄点嵌入机制给予了一些实验性研究工作的总结。图1(a)为实际扫描的带有黄色斑点灰度图像,其尺寸要大于实际;图1(b)为人工绘制的带有黄色斑点灰度图像,用以说明斑点阵列的编码格式。
EFF统计了18个厂商的209种型号的彩色打印机,具体如表1所示。其中141种型号含有能够追踪来源的黄色斑点,57种型号不含有,剩余的11种型号未知。能够看出,有67%的彩色激光打印机嵌入了黄色斑点阵列信息,其它没有嵌入黄色斑点阵列的打印机可能采用了其它未知的技术嵌入了水印。
对于含有黄色斑点的彩色打印文档,通过提取黄点阵列信息准确的找到其来源打印机型号。但是,占据市场上份额非常大的黑白激光打印机和喷墨打印机是不可能嵌入“黄色”的墨点水印的。所以这种可靠且简易的方法存在很大的局限性。
目前国内有些文献针对于实际刑事案件的需要,对上述黄色斑点阵列信息进行了相关的研究工作。具体包括:刘宁,裴雷收集了11种不同品牌和型号的电子成像技术的14台机器(包括彩色激光打印机、彩色模拟复印机、彩色数码复印机)制作的文件,对这些文件是否有黄点阵列进行了研究,并用人工的方式对有黄点阵列的文件进行了信息提取。陈春涛,裴雷对施乐DocuColor系列彩色激光打印机的隐写点阵进行了详尽的分析,阐述了点阵解码的方法,并给出了一个利用Excel获取打印机信息的方法。李江春利用专业设备VSC25000文检仪等对待检文档进行黄点阵列的检验。
表1各品牌彩色激光打印机是否嵌入黄色斑点型号统计表
Figure GSB00000749887400021
上述方法均是依靠人工手动提取黄色斑点阵列信息。依靠人工提取黄色斑点阵列信息存在成本高、准确率较低、提取效率较低的缺点。
发明内容
本发明要解决的技术问题是如何自动提取彩色激光打印机的黄色斑点阵列信息,以弥补目前依靠手动提取的不足。本发明旨在实现从彩色激光打印文档中,提取出黄色斑点阵列信息,以帮助实现追踪文档的打印机来源。
本发明的技术方案如下:
1.算法的具体框图
对文档图像使用算法提取出黄色斑点阵列,算法具体的框图如图2所示。
针对文档图像,首先要检测黄色斑点的质心,然后对质心阵列进行行向和列向倾斜校正,使用频谱分析方法获得阵列的栅格信息,从而得到全体斑点阵列,最后对全体阵列各周期求平均值得到单周期的斑点阵列。
2.检测黄色斑点区域的质心
黄色斑点区域的质心提取过程根据打印文档内容而不相同。
对于纯白色文档图像,在RGB三个通道中分别进行基于阈值的二值化处理,选取阈值为0.9,得到三幅二值图像Ir,Ig,Ib。通过Iyd=IrandIgand(~Ib)得到黄色斑点二值图像。
对于纯淡蓝色文档图像,将图像从RGB色彩空间转换至HSV色彩空间,对H分量进行基于阈值的二值化,选取阈值为0.5,得到二值图像Ih。实验发现存在很多单像素噪声斑点,所以需要滤除所有面积为1的连通区域,得到斑点二值图像Iyd
将斑点二值图像Iyd标记连通区域,并提取各连通区域质心。生成另一幅二值图像,此图像在斑点区域的质心处为1,其他区域均为0,称为斑点质心图像。
实验中得到的斑点二值图像和斑点质心图像分别如图3(a)和图3(b)所示。为便于观察,对斑点质心图像3(b)中的质心进行了放大处理。
3.对斑点质心阵列进行行向和列向倾斜校正
文档扫描过程中不可避免的存在倾斜角度,需要进行倾斜校正。针对斑点质心图像,采用经典的行列投影方法进行倾斜校正。
斑点质心图像中仅含有单像素点,通过最大化行列投影向量中0元素的个数确定最佳旋转角度。由于平行线畸变为相交线失真的存在,由行和列投影向量确定的最佳旋转角度往往并不相等,取两者的均值也并不能明显改善倾斜校正效果。
针对上述问题,实验中对行列坐标分别进行旋转。根据行投影向量确定最佳旋转角度,每次进行图像旋转对行坐标进行处理时,列坐标保持不变;而对列坐标进行处理时,行坐标保持不变。旋转角度步进为仅使坐标产生单像素变化的角度,搜索范围在实验中视情况确定。搜索最优旋转角度的示例如图4所示,其中列、行向最优旋转角度分别在第55和43个步进角度处出现。
4.提取斑点阵列栅格信息
使用频谱分析方法获得黄色斑点阵列的栅格步长信息。对倾斜校正斑点质心图像的行、列投影向量进行傅立叶变换,其幅度谱中峰值频率所对应的时域值代表了行、列向栅格步长。步长R使用公式
Figure GSB00000749887400041
进行计算,其中N为离散傅立叶变换的点数,fmax为基频频率值。所谓的基频就是指在傅立叶变换幅度谱中具有最大幅值的频率。举例说明如图5所示,5(a)为质心在行投影向量中的累积数值,图5(b)为傅里叶变换幅度,其中峰值点所对应的数字频率为183,得到对应的行向栅格步长为Rrow=3300/183=18个像素。利用此方法得到相应的列向栅格步长Rcol
依据栅格步长,对图像中的质心进行对齐。首先按照先行后列的顺序寻找质心点,将第一个黄点称为基准点,行列坐标分别为x和y,然后以该基准点为中心,以Rrow和Rcol为长和宽取其栅格块,以此栅格块大小为基础,在图像上按照先行后列的顺序无重叠的移动,假设移动到第m行,第n列个栅格块,当有黄点出现在栅格块中时,将其行坐标修改为x+(m-1)×Rrow,列坐标改为y+(n-1)×Rcol。循环直至所有质心均处理完毕。这种对齐操作使属于同一行(列)质心的行(列)坐标统一为相同的值。
针对对齐的质心图像,标记栅格信息。寻找列投影向量中不为零的元素,其坐标再加上半个列栅格步长即是行栅格坐标,所有的列栅格坐标构成列栅格信息;对行投影向量进行同样处理得到行栅格信息。标记栅格的质心图像如图3(c)所示。
5.获得全体斑点阵列
在获得栅格信息后,通过判断栅格间的方块图像中是否存在斑点来确定该栅格处的是否含有斑点。得到页面图像整体的斑点阵列,1号打印机部分斑点阵列如图6所示。由图6中可知,黄色斑点阵列在行和列方向均存在以周期进行循环的状况,图中在行方向存在三个周期,在列方向存在两个周期。观察可知,单个周期中有时存在误码。
6.获取单周期的黄点阵列信息
首先要求出阵列周期所包含栅格的行数L和列数W,采用迭代比较的算法,在行方向上以l×w为栅格大小的周期无重叠的移动并与所覆盖的栅格信息比较,计算其与所经历栅格信息的重叠率,其中w=1,2,3…,在行方向移动栅格求W与l的选择无关,因此本算法里l=20,由于全体斑点阵列中存在误码,w从1开始迭代,直至总重叠率大于等于90%,所得到的w为所求的周期列数W,同理求出周期行数L,图6中,求得L=22,W=18。为获得单周期的黄点阵列信息,将全体斑点阵列信息累加到一个栅格周期当中,如果周期斑点阵列中某处的累积量大于周期信号个数的50%,则确定该处有斑点;否则,该处没有斑点。
综上所述,本发明对彩色激光打印文档中的黄色斑点阵列信息提取的具体步骤如下:首先,检测黄色斑点区域的质心;其次,对斑点质心阵列进行行向和列向倾斜校正;第三步,提取斑点阵列栅格信息;第四步,获得全体黄点阵列;最后,获取单周期的黄点阵列信息。
本发明的效果和益处是:
目前刑侦司法部门均依靠人工提取黄色斑点阵列信息,而本发明则是帮助他们更快更准确的提取出黄色斑点阵列信息。本发明充分考虑到实际的打印和扫描过程中文档页面存在的倾斜现象,在提取特征点之后对斑点阵列信息进行了倾斜校正,使得能够准确地提取出黄色斑点阵列信息。本发明适用于信息安全领域,可以有效地提取出彩色激光打印文档中的黄色斑点阵列信息。
附图说明
图1是实际彩色激光打印文档中的黄色斑点局部图和一种黄点阵列编码格式图。
图中:图1(a)是黄色斑点观察图的局部灰度图像,图1(b)是一种黄色斑点阵列编码格式观察图。
图2是黄色斑点提取算法框图。
图3是斑点区域检测图、斑点质心检测图及倾斜校正并标记栅格斑点质心图。
图中:图3(a)是斑点区域检测图,图3(b)是斑点质心检测图,图3(c)是倾斜校正并标记栅格斑点质心图。
图4是不同旋转角度下投影向量中0元素个数分布图。
图中:图4(a)是列向投影向量中0元素个数;图4(b)是行向投影向量中0元素个数。
图5是行投影向量显示图及傅立叶变换幅度谱图。
图中:图5(a)是行投影向量显示图,图5(b)是该投影向量的傅立叶变换幅度谱的显示图。
图6是来自1号打印机的黄色斑点阵列的周期性观察图。
图7是实际彩色激光打印文档中的黄色斑点观察图。
图中:图7(a)是纯白色背景下的黄色斑点观察图的灰度图,图7(b)是纯淡蓝色背景下的黄色斑点观察图的灰度图。其中圆圈标记之处为黄点。
图8是1号、2号、3号打印机所包含的黄点阵列信息图。
图中:图8(a)是1号打印机所包含的黄点阵列信息图,图8(b)是2号打印机所包含的黄点阵列信息图,图8(c)是3号打印机所包含的黄点阵列信息图。
具体实施方式
以下结合技术方案和附图详细叙述本发明的具体实施方式。
实际中需要提取打印机黄色斑点阵列信息,以检验某文档中的黄点阵列是否与其吻合。本节中介绍的算法能够帮助提取出黄色斑点阵列信息。使用纯白色或纯淡蓝色均匀图像进行打印,可以使提取算法简单准确。如何从内容任意的打印文档中提取黄点技术还有待探索,其难点在如何检测出黄点所在的位置,而后续的处理技术可以借鉴本算法。
实验选用型号分别为Hp1518、Hp2025、Hp5500的三台彩色激光打印机,打印机个体信息如表2所示,它们的彩色打印文档中均包含黄色斑点阵列信息。
表2 3台彩色激光打印机的详细信息
Figure GSB00000749887400071
1号和3号打印机使用底部含有彩色其余为纯白色的图像;2号打印机使用纯淡蓝色图像。2号打印机仅在图像中含有彩色的区域及附近产生黄色斑点。各打印机图像经过打印扫描后,对文档图像剪切得到上半部分。部分截图如图7所示,从中观察到圆圈内的黄色斑点。
实验表明,型号分别为Hp1518、Hp2025、Hp5500的三台打印机所打印文档中均包含黄点阵列,而且均呈现18列×22列的周期性,该编码中不包含时间信息,推测仅包含打印机个体的序列号。
经过上述处理,3台打印机的黄点阵列如图8所示。实验中各打印机均间隔几分钟打印了4张样本,每台打印机的4个样本中提取出的黄点阵列均相同,仅在打印机之间存在差异。由此可知,Hp的3种型号打印机的黄点阵列中不包含打印时间信息。
分析图8中的三个黄点阵列可知,前6行信号一致,它可能代表了用于信号同步。第7行为空白行,第8到22行各不相同,推测其可能为打印机的序列号信息。在第8到22行中,三台打印机在第1和第10列均不包含黄色斑点;在第8到22行中,不存在行或列方向相邻的黄色斑点。由于打印机数量较少,打印机个体的序列号差异较大,所以未能对黄点阵列信息解码。虽然未能解码,但是由于黄点阵列并不随打印时间和内容发生变化,可以直接比较提取出的黄色斑点阵列,就可以实现打印文档的来源认证。

Claims (1)

1.一种彩色激光打印文档中黄色斑点阵列信息提取方法,其特征是利用部分彩色激光打印机的打印文档存在与打印机型号一一对应的黄色斑点信息,通过对黄色斑点进行连通区域的标记,确定连通区域的质心,并对质心图像进行倾斜校正,提取黄色斑点栅格信息,最后通过迭代比较获得打印文档中单个周期的黄色斑点信息;对质心图像分别进行行向和列向的倾斜校正,实验中对行列坐标分别进行旋转,通过最大化行列投影向量中0元素的个数确定最佳旋转角度;通过校正来消除扫描文档时所造成的倾斜;提取黄色斑点栅格信息,使用频谱分析方法获得黄色斑点阵列的栅格步长,对倾斜校正斑点质心图像的行、列投影向量进行傅立叶变换,其幅度谱中峰值频率所对应的时域值代表了行、列向栅格步长,通过对栅格的标记获得扫描文档的全体斑点阵列;通过迭代比较获得打印文档中单个周期的黄色斑点信息,通过迭代比较的方法获得栅格信息的周期,再将全体斑点信息累加到一个周期中获得单个周期的黄点信息;对于纯白色文档图像,在RGB三个通道中分别进行基于阈值的二值化处理,选取阈值为0.9,得到三幅二值图像Ir,Ig,Ib;通过Iyd=IrandIgand(~Ib)得到黄色斑点二值图像;对于纯淡蓝色文档图像,将图像从RGB色彩空间转换至HSV色彩空间,对H分量进行基于阈值的二值化,选取阈值为0.5,得到二值图像Ih;实验发现存在很多单像素噪声斑点,所以需要滤除所有面积为1的连通区域,得到斑点二值图像Iyd;将斑点二值图像Iyd标记连通区域,并提取各连通区域质心;生成另一幅二值图像,此图像在斑点区域的质心处为1,其他区域均为0,称为斑点质心图像。
CN2010101544654A 2010-04-20 2010-04-20 一种彩色激光打印文档中黄色斑点阵列信息提取方法 Expired - Fee Related CN101853384B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010101544654A CN101853384B (zh) 2010-04-20 2010-04-20 一种彩色激光打印文档中黄色斑点阵列信息提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010101544654A CN101853384B (zh) 2010-04-20 2010-04-20 一种彩色激光打印文档中黄色斑点阵列信息提取方法

Publications (2)

Publication Number Publication Date
CN101853384A CN101853384A (zh) 2010-10-06
CN101853384B true CN101853384B (zh) 2012-07-04

Family

ID=42804864

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010101544654A Expired - Fee Related CN101853384B (zh) 2010-04-20 2010-04-20 一种彩色激光打印文档中黄色斑点阵列信息提取方法

Country Status (1)

Country Link
CN (1) CN101853384B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107169459A (zh) * 2017-05-18 2017-09-15 湖北警官学院 基于暗记点阵形态的打印复印文件鉴别系统及方法
CN108460381B (zh) * 2018-03-13 2022-06-10 南京邮电大学 基于图像识别的发票报销信息定位及截取方法
CN109241821B (zh) * 2018-07-11 2021-06-29 湖北警官学院 一种彩色激光打印复印文件类别鉴别方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6826688B1 (en) * 1999-03-27 2004-11-30 Sharp Laboratories Of America, Inc. Method and apparatus for determining the identity of a digital printer from its output
US20070115510A1 (en) * 2005-11-18 2007-05-24 International Business Machines Corporation Marking images of text with speckle patterns for theft deterrence
CN101587540B (zh) * 2009-04-16 2011-08-03 大连理工大学 一种利用页面文档几何失真检测文档来源的打印机取证方法

Also Published As

Publication number Publication date
CN101853384A (zh) 2010-10-06

Similar Documents

Publication Publication Date Title
JP4187749B2 (ja) ハーフトーンウォーターマーキングおよび関連アプリケーション
JP4708186B2 (ja) 2次元コード解読プログラム
US6760464B2 (en) Halftone watermarking and related applications
US8792128B2 (en) Apparatus, system, and method of inspecting image, and recording medium storing image inspection control program
US7545541B2 (en) Systems and methods for embedding metadata in a color measurement target
US6694041B1 (en) Halftone watermarking and related applications
CN101958989B (zh) 图像处理装置、图像处理系统及图像处理方法
CN103559473A (zh) 利用特征图像来实现承印物防伪的方法和系统
US8175323B2 (en) Image processing method and image processing apparatus
JP4977103B2 (ja) 印刷文書認証方法、コンピュータプログラムプロダクト及びデータ処理システム
KR20080095743A (ko) 화상 처리 프로그램 및 화상 처리 장치
CN101853384B (zh) 一种彩色激光打印文档中黄色斑点阵列信息提取方法
JP2009111980A5 (ja) 印刷文書認証方法、コンピュータプログラムプロダクト及びデータ処理システム
US7911653B2 (en) Device using low visibility encoded image to manage copy history
US8976428B2 (en) Image information managing method, image information managing apparatus and image information managing system for preparing and measuring an evaluation chart
JP2007026428A (ja) 2次元コード生成方法、読取方法、および実行プログラム
CN1767587B (zh) 用于复色激光打印机的数据嵌入方法和数据恢复方法
Rabah et al. The supatlantique scanned documents database for digital image forensics purposes
JP2019047441A (ja) 画像処理装置、読取装置、画像処理方法、およびプログラム
CN114580589A (zh) 一种双通道二维码与用于防复印和信息隐藏的控制方法
WO2020089984A1 (ja) 画像処理装置、制御方法及び制御プログラム
CN111428796A (zh) 一种基于深度学习的通用物品检测方法及系统
Simske et al. Document imaging security and forensics ecosystem considerations
JP6025803B2 (ja) 画像処理装置
JP2016025420A (ja) 画像処理装置、画像処理方法、及びプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120704

Termination date: 20160420

CF01 Termination of patent right due to non-payment of annual fee