CN104067604A - 打印样本特征集 - Google Patents

打印样本特征集 Download PDF

Info

Publication number
CN104067604A
CN104067604A CN201280068662.1A CN201280068662A CN104067604A CN 104067604 A CN104067604 A CN 104067604A CN 201280068662 A CN201280068662 A CN 201280068662A CN 104067604 A CN104067604 A CN 104067604A
Authority
CN
China
Prior art keywords
feature set
roi
printer
extractor
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201280068662.1A
Other languages
English (en)
Inventor
S.J.辛斯克
M.M.斯特吉尔
J.S.阿罗诺夫
G.亚当斯
P.S.埃弗里斯特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hewlett Packard Development Co LP
Original Assignee
Hewlett Packard Development Co LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Development Co LP filed Critical Hewlett Packard Development Co LP
Publication of CN104067604A publication Critical patent/CN104067604A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K15/00Arrangements for producing a permanent visual presentation of the output data, e.g. computer output printers
    • G06K15/02Arrangements for producing a permanent visual presentation of the output data, e.g. computer output printers using printers
    • G06K15/18Conditioning data for presenting it to the physical printing elements
    • G06K15/1867Post-processing of the composed and rasterized print image
    • G06K15/1872Image enhancement
    • G06K15/1881Halftoning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40062Discrimination between different image types, e.g. two-tone, continuous tone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32144Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/405Halftoning, i.e. converting the picture signal of a continuous-tone original into a corresponding signal showing only two levels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3271Printing or stamping

Abstract

一种系统可以包括存储机器可读指令的存储器和访问存储器并运行机器可读指令的处理单元。机器可读指令可以包括从打印样本的多个数字图像中的每一个提取特征集的特征集提取器。特征集可以是包括表征打印了打印样本中的给定打印样本的打印机的特征集的经过滤的特征集。机器可读指令还可以包括基于打印样本的多个扫描图像中的每一个的特征集而确定打印样本的聚类的聚类组件。机器可读指令还可以包括基于打印样本的聚类而识别打印样本的打印机的打印机识别器。

Description

打印样本特征集
背景技术
打印机是使以电子形式存储的文档的文本和/或图形在诸如纸张或透明物之类的物理打印介质上产生的外围设备。打印机可以通过打印半色调打印图像。半色调是通过使用在尺寸上、形状上或间隔上变化的点而模拟连续色调成像的复印技术。“半色调”还可以被用于特别地指由该过程产生的图像。
附图说明
图1图示了用于确定打印样本的打印机的系统的示例。
图2图示了打印样本的示例。
图3图示了减法特征集提取器的示例。
图4图示了快速傅里叶变换(FFT)特征集提取器的示例。
图5图示了基于分布的特征集提取器的示例。
图6图示了感兴趣的区域的示例。
图7图示了感兴趣的区域的周界(perimeter)的示例。
图8图示了感兴趣的区域的显著(salient)搜索区的示例。
图9图示了打印文本特征集提取器的示例。
图10图示了用于确定打印样本的打印机的打印机分析器的示例。
图11图示了用于确定打印样本的打印机的示例方法的流程图的示例。
图12图示了用于确定打印样本的打印机的示例方法的流程图的另一个示例。
图13图示了可以被用于实现图1-12中图示的系统和方法的计算机系统的示例。
具体实施方式
图1图示了用于分析数目为N的打印样本4以识别打印了数目为N的打印样本4中的给定打印样本6的打印机的系统2的一个示例,其中N是大于或等于一的整数。可以将数目为N的打印样本4中的每个打印样本6实现为例如彩色打印样本、黑白打印样本等。在一些示例中,可以将每个打印样本6实现为包装(例如墨盒或调色剂盒的包装)上的印刷物。
数目为N的打印样本4中的每一个可以由扫描仪8进行扫描。可以将扫描仪8实现为例如具有大约600点每英寸(dpi)或更多的扫描分辨率的高分辨率彩色图像扫描仪。在一些示例中,可以将扫描仪8实现为线性成像阵列,诸如平板扫描仪。在其它示例中,可以将扫描仪8实现为二维阵列,诸如相机。在一些示例中,可以将相机与智能电话集成。扫描仪8可以将数目为N的打印样本4中的每一个的数字图像提供给打印机分析器10。例如,可以将打印机分析器10实现为计算机。
为了简化解释的目的,在本示例中,将系统2的不同组件图示和描述为执行不同的功能。然而,在其它示例中,所描述的组件的功能可以由不同组件执行,并且若干组件的功能性可以组合和运行在单个组件上。可以将组件实现为例如机器可读指令、硬件(例如专用集成电路)或实现为二者的组合(例如固件)。在其它示例中,组件可以跨网络(例如外部web(网络)服务)分布在远程设备之中。
在一些示例中,打印机分析器10可以与扫描仪8集成,其中可以将打印机分析器10实现在智能电话上。在其它示例中,可以使打印机分析器10从扫描仪8分离地实现,并且实现为个人计算机、服务器等。打印机分析器10可以包括用于存储机器可读指令的存储器14。打印机分析器10还可以包括用于访问存储器14和运行机器可读指令的处理单元15。例如,可以将处理单元15实现为处理器核。存储器14可以包括特征集提取器16。
特征集提取器16可以分析给定打印样本6的数字图像。图2图示了诸如图1中图示的给定打印样本6之类的给定打印样本50的数字图像的示例。给定打印样本50的数字图像可以包括文本和图形部分52。要理解的是在一些示例中,文本部分和图形部分可以分开(例如分割)成不同部分。可以识别数字图像上的区域(例如通过图1的特征集提取器16),该区域可以被称为感兴趣的区域(ROI)54。
参考回到图1,特征集提取器16可以识别ROI中的特征集。特征集可以是从ROI提取的特征的集合。在一些示例中,特征集可以包括诸如长轴/短轴之类的几何特征、圆度、形心、色域、光密度和对比度等。在其它示例中,特征集可以包括差分特征(例如做减法后的图像)。在又其它示例中,特征集可以包括基于分布的特征,诸如伴线(satellite)和多孔(porosity)。在再一些示例中,特征集可以是不同类型的特征的组合。为了提取特征集,特征集提取器16可以采用例如图像减法、快速傅里叶变换(FFT)等。可以将特征集实现为包括表征数目为N的打印样本4的给定打印样本6的打印机的特征的经过滤的特征集。
在一些示例中,特征集提取器16可以从数据储存18检索主图像。例如,可以将数据储存18实现为物理存储器,诸如RAM、硬盘等。例如,可以将主图像实现为从已知源(例如受信任的源、已知伪造者等)提供的ROI的数字图像。以这种方式,可以将主图像实现为ROI的“原始”数字版本。在这样的情形中,ROI中的特征集可以例如通过从ROI中减去主图像来识别。在其它示例中,特征集提取器16可以基于数目为N的打印样本4中的每一个的ROI而生成模态(modal)图像。可以将模态图像实现为具有与剩余图像的最低均方误差的图像。以这种方式,ROI的特征集可以例如通过从ROI减去模态图像来识别。
特征集提取器16可以将特征记录提供给存储器14中的聚类(cluster)组件20。特征记录可以包括例如表征特征集的数据。特征记录还可以包括例如打印样本识别器。打印样本识别器可以被例如用于识别从中得到特征集的特定打印样本6。特征集提取器16可以提供针对数目为N的打印样本4中的每一个的特征记录,使得特征集提取器16可以提供数目为N的特征记录,其中每个特征记录对应于给定打印样本。
聚类组件20可以检查数目为N的特征记录中的每一个中的数据。聚类组件20可以在数据空间(例如聚类空间)中为数目为N的打印样本4中的每一个绘制点,其中每个点基于与对应特征记录相关联的特征集。聚类组件20可以聚合(例如聚类)聚类空间中的点以识别打印样本4的群组(例如聚类)。聚类组件20可以例如采用k均值或最近邻技术在聚类空间中绘制点并且识别打印样本4的聚类。聚类组件20可以向存储在存储器14中的打印机识别器22提供聚类数据。聚类数据可以包括例如表征打印样本4的聚类的数据。聚类数据还可以包括用于识别对应于聚类空间中的给定点的打印样本6的数据。
打印机识别器22可以分析聚类数据以识别打印了数目为N的打印样本4中的给定打印样本6的打印机,因为给定聚类中的每个点(例如,成员)对应于由相同打印机打印的打印样本6。在一些示例中,打印机识别器22可以给每个聚类分配打印机标识(ID)。打印机识别器22可以以这种方式确定对应于给定聚类中的成员的打印样本6对应于给定打印机ID。
在一些示例中,打印机识别器22可以访问数据储存18以检索历史数据。历史数据可以包括例如从过去(历史)使用得到的特征集。例如,在一个示例中,特征集可以表示从由特定类型的打印机(诸如柔版印刷(flexo)打印机、胶印打印机、凹版打印机、喷墨打印机、激光打印机等)生成的打印样本6提取的特征。在这样的情形中,打印机识别器22可以将对应于聚类空间中的给定点的特征集与历史数据中的特征集比较以确定被用于打印与聚类空间中的给定点相关联的打印样本6的打印机类型。在一些示例中,历史数据还可以包括特征列表以排除针对特定类型的打印机的特征集。例如,涉及柔版印刷打印机的度量可能不适用于激光打印机。
通过采用系统2,可以识别打印特定打印样本6的打印机。此外,还可以识别与打印了特定打印样本6的打印机相关联的诸如打印机类型之类的特征。以这种方式,系统2的用户可以确定给定打印样本6是否源自经授权的源。例如,在一些示例中,打印样本6可以是打印机墨盒或调色剂盒的包装。通过采用系统2,用户可以确定打印样本4的集合(该集合对应于聚类空间中的聚类)已经源自经授权的源,诸如原始设备制造商(OEM)。此外,用户可以确定源自诸如伪造者之类的未经授权的打印样本4的集合。
图3图示了可以被用作图1中所示的特征集提取器16或其组件的减法特征集提取器100的一个示例。可以将减法特征集提取器100实现成例如通过采用减法技术而确定打印样本的图像的特征集。减法特征集提取器100可以提供来自诸如图1中图示的给定打印样本6之类的打印样本的图像的被提取的ROI 102。减法特征集提取器100可以确定参考ROI 104。可以例如从诸如图1中图示的数据储存18之类的数据储存提供参考ROI 104。在这样的情形中,可以将参考ROI 104实现为从已知源提供的ROI(例如原始ROI)的数字图像。可替换地,可以将参考ROI 104实现为平均ROI。在这样的情形中,可以基于打印样本(例如图1中图示的数目为N的打印样本)的图像的平均而生成平均ROI。
减法特征集提取器100可以提供来自打印样本的图像的被提取的ROI 102。减法特征集提取器100可以从参考ROI 104中减去被提取的ROI 102以提供差异ROI 106。可以针对特征集而搜索差异106。因此,减法特征集提取器100可以提供包括差异ROI 106的特征记录108和识别从其中得到被提取的ROI 102的打印样本的打印样本识别器。
图4图示了可以被用作图1中图示的特征集提取器或其组件的FFT特征集提取器150的示例。FFT特征集提取器150可以通过采用FFT而从打印样本提取特征集。FFT特征集提取器150可以以类似于关于图3所描述的方式提供参考ROI 152和被提取的ROI 154。
FFT特征集提取器150可以基于参考ROI 152中的像素强度而计算针对参考ROI 152的FFT。可以将参考ROI 152和被提取的ROI 154实现为一系列点,其可以被称为ROI的半色调。参考ROI 152的FFT可以表征参考ROI 152的半色调的图案以及ROI的半色调的分辨率和可能存在于ROI中的伪像(artifact)/缺陷。换言之,ROI的半色调可以具有根据以下各项变化的载波频率(i)半色调的图案(ii)打印分辨率和(iii)参考ROI 152中的伪像/缺陷。此外,FFT特征集提取器150可以针对参考ROI 156的FFT计算能量谱密度(ESD)。ESD可以从FFT计算,使得在ESD中,系数的总和(通常在删除DC系数之后)被归一化成总和为1.0。参考ROI 156的FFT的ESD可以表征FFT的方差随频率如何分布。
此外,FFT特征集提取器150可以基于被提取的ROI 154中的像素强度而计算被提取的ROI 154的FFT。类似于参考ROI 152的FFT,被提取的ROI 154的FFT可以根据半色调图案、打印分辨率和被提取的ROI 154中的伪像/缺陷而变化。特别地,被提取的ROI 154的半色调的图案(例如点的尺寸)可以根据墨水铺展而变化。也就是说,被提取的ROI 154的FFT可以基于被用于打印与被提取的ROI 154相关联的打印样本的墨水类型而变化。例如,一些墨水比其它墨水干得快。因此,较慢干的墨水可以比较快干的墨水具有更多的时间铺展,使得用较慢干的墨水打印的半色调的点可能大于用较快干的墨水打印的那些。此外,FFT特征集提取器可以计算被提取的ROI 158的FFT的ESD。
可以从被提取的ROI 158的FFT的ESD中减去参考ROI 156的FFT的ESD以提供针对被提取的ROI的差分系数160。在一些示例中,减法可以在多个通道之上发生。针对被提取的ROI 160的差分系数可以表征被提取的ROI 154中的差分内容。在一些示例中,可以存在针对被提取的ROI 160的大于一个的差分系数。FFT特征集提取器150可以提供包括针对被提取的ROI 160的差分系数的特征记录162和针对从其中得到被提取的ROI 154的打印样本的识别器。
图5图示了可以被用作图1中图示的特征集提取器16或其组件的基于分布的特征集提取器200的示例。基于分布的特征集提取器200可以通过采用显著周界搜索技术从打印样本提取特征。在一个示例中,基于分布的特征集提取器200可以处理从打印样本得到的被提取的ROI 202。被提取的ROI 202可以例如以类似于图6中图示的ROI 250的方式实现。图6图示了包括文本字符(即小写字母“a”)的扫描图像的ROI 250的示例。
参考回图5,可以确定被提取的ROI的周界204。可以将被提取的ROI 204的周界实现为例如文本字符的背景(例如亮区)和文本字符的内部(例如暗区)之间的边界。图7图示了已经针对图6中图示的ROI 250的文本字符确定的周界260的示例。在一些示例中,可以将差分特征从模态字符中减去,所述模态字符与来自图1中图示的数目为N的打印样本4中的每一个的具有最小平均和平方误差(minimum mean sum square error)的字符相对应。
参考回图5,可以基于被提取的ROI 202的周界而确定显著周界搜索区206。基于分布的特征集提取器200可以识别对应于最外部显著周界搜索区206中的像素的伴线。基于分布的特征集提取器200还可以识别对应于中间显著周界搜索区206中的像素的多孔。图8图示了图6中图示的ROI 250的文本字符270的示例,其中显著周界搜索区被高亮。最外部显著周界搜索区272包括伴线并且中间显著搜索区274包括多孔。
参考回图5,可以将被提取的ROI 202的伴线和多孔提供给特征选择器208。特征选择器208可以确定有关特征以提供作为特征记录210中的特征集。在一些示例中,特征选择器208可以访问数据储存并且将被提取的ROI 202的伴线和多孔与训练数据集比较。可以将训练数据集实现为例如提取自从已知源(例如受信任的源、已知的伪造者等)提供的参考ROI的伴线和多孔的集合。例如,特征选择器208可以基于训练数据集的准确率以及被提取的ROI 202的伴线和多孔与从参考ROI提取的伴线和多孔匹配得多接近来选择特征。
在其它示例中,为了确定有关特征以提供作为特征记录210中的特征集,特征选择器208可以基于模态聚类而选择被提取的ROI 202的伴线和/或多孔。模态聚类可以被用于确定哪个特征属于在聚类中具有类似行为的群组。例如,如果基于分布的特征集提取器200从图1中图示的N个样本中的每一个接收被提取的ROI 202(在一个示例中,其中N等于1000),通过采用聚类技术(例如K均值或最近邻)基于分布的特征集提取器200以及每个被提取的ROI 202具有大约100个特征,基于分布的特征集提取器200可以找到在它们的聚类中提供类似行为的聚类。例如,在一个示例中,基于分布的特征集提取器200可以单独地检查100个特征中的每一个以确定每个特征产生的聚类的数目。在其中存在1000个不同打印样本的情形中,并且单独考虑100个特征,20个特征的给定集合可以产生两个聚类,其中例如700个打印样本在第一聚类中并且300个打印样本在第二聚类中,使得两个聚类将被20个不同特征定义。类似地,在这样的情形中,在检查100个特征的每一个之后,基于分布的特征集提取器200还可能找到被40个不同特征定义的3个聚类、被20个不同特征定义的4个聚类、被10个不同特征定义的5个聚类和被10个不同特征定义的6个或更多聚类。因此,在本示例中,基于分布的特征集提取器200可以选择定义3个聚类的40个不同特征作为特征集以包括在特征记录210中,因为当单独分析每个特征时3个聚类是所形成的最常见或模态化的聚类数目。
图9图示了可以被用作图1中图示的特征集提取器16或其组件的打印文本特征集提取器300的示例。打印文本特征集提取器300可以通过采用几何比较技术从打印样本的被提取的ROI 302提取特征。被提取的ROI 302可以例如以类似于图6中图示的ROI 250的方式实现。
参考回图9,可以检查被提取的ROI 302的几何特征。例如,打印文本特征集提取器300可以检查被提取的ROI 302的长轴/短轴,被提取的ROI 302的圆度和ROI的形心的位置等。附加地或可替换地,在一些示例中,打印文本特征集提取器300可以检查被提取的ROI 302的色域、光密度、被提取的ROI 302的对比度等。由打印文本特征集提取器300检查的特征集可以被称为被提取的ROI 302的检查的特征304。
可以将被提取的ROI 302的检查的特征304提供给特征选择器306。特征选择器306可以确定有关特征以提供作为特征记录308中的特征集。在一些示例中,特征选择器306可以访问数据储存并且将被提取的ROI 302的检查的特征304与训练数据集比较。可以将训练数据集实现为例如来自从已知源提供的参考ROI的检查的特征的集合。例如,特征选择器306可以基于针对训练数据集的准确率以及被提取的ROI 302的检查的特征304与从参考ROI提取的检查的特征匹配得多接近来选择特征。
在其它示例中,为了确定有关特征以提供作为特征记录308中的特征集,特征选择器306可以基于模态聚类而选择被提取的ROI 302的几何特征。模态聚类可以被用于确定哪个特征属于在聚类中具有类似行为的群组。例如,如果打印文本特征集提取器300从图1中图示的N个样本中的每一个接收被提取的ROI 302,并且每个被提取的ROI 302具有大约100个特征和大约1000个打印样本,通过采用聚类技术(例如K均值或最近邻)打印文本特征集提取器300可以利用共同聚类找到具有最大数目的不同样本的聚类,以使得样本的阈值百分比(例如98%)内含地属于针对不同特征中的每一个的相同聚类,以使得这些不同特征的所识别的集合可以用这样的紧密相关的聚类行为被选择作为特征记录308中的特征集。
图10图示了可以被例如用作图1中图示的打印机分析器10的打印机分析器350的示例。打印机分析器350可以包括用于存储机器可读指令的存储器352(例如RAM和/或硬盘)。打印机分析器350还可以包括用以访问存储器352并运行机器可读指令的处理单元354(例如处理器核)。在一些示例中,打印机分析器350可以是在扫描仪外部的系统。在这样的情形中,可以将I/O接口356实现为网络或通用串行总线(USB)端口。在其它示例中,可以将打印机分析器350实现为与扫描仪集成的系统。在这样的情形中,I/O接口356可以包括用于与扫描仪进行通信的数据总线。
打印机分析器350可以接收(例如在I/O接口356处)已经被扫描仪扫描的数目为N的打印样本的数字图像。在这样的情形中,可以将数目为N的打印样本的数字图像提供给存储器352的特征集提取器358。
特征集提取器358可以包括可以提取与数目为N的打印样本中的给定打印样本的ROI的打印文本有关的特征集的打印文本特征集提取器360。打印文本特征集提取器360可以例如以类似于关于图9描述的那些中说明的打印文本特征集提取器300的方式实现。特征集提取器358还可以包括可以基于图像减法从数目为N的打印样本中的给定打印样本的ROI提取特征集以提取差分特征的减法特征集提取器362。在一些示例中,减法特征集提取器362可以以类似于图3中图示的减法特征集提取器100的方式实现。特征集提取器358还可以包括可以基于对数目为N的打印样本中的给定打印样本的ROI的FFT的计算而提取特征集的FFT特征集提取器364。FFT特征集提取器364可以例如以类似于图4中图示的FFT特征集提取器150的方式实现。特征集提取器358又另外可以包括可以确定给定打印样本的ROI的基于分布的特征的基于分布的特征集提取器366。基于分布的特征集提取器366可以例如以类似于图5中图示的基于分布的特征集提取器200的方式实现。在一些示例中,可以将特征集提取器358实现为打印文本特征集提取器360、减法特征集提取器362、FFT特征集提取器364和基于分布的特征集提取器366的子集。
特征集提取器358可以组合从打印文本特征集提取器360、减法特征集提取器362、FFT特征集提取器364和基于分布的特征集提取器366(或其某个子集)中的每一个提供的所提取的特征集以提供所提取的特征集。特征集提取器358可以向聚类组件368提供特征记录,所述聚类组件368可以包括所提取的特征集和可以识别从其中提取特征集的打印样本的样本识别器。在一些示例中,特征集提取器358可以通过采用利用特定类型的打印机(例如喷墨和激光、柔版印刷、凹版等)做出的已知打印样本来预训练所提取的特征集。在这样的情形中,可以从特征集确定最佳地区分特定类型的打印机的最佳特征集并且测试每个特征集直到可以确定最佳聚类行为为止。可以将最佳聚类行为实现为由“聚合间”方差除以“聚合内”方差的最佳比例(例如统计的F-比)。
聚类组件368可以接收针对数目为N的打印样本中的每一个的特征记录。聚类组件368可以采用聚类技术(例如K均值或最近邻技术)以确定具有对应于打印样本的聚类的聚类空间。可以将聚类空间和聚类标识提供到打印机识别器370作为聚类数据。打印机识别器370可以采用聚类数据以确定被用于打印数目为N的打印样本中的每一个的打印机。在一些示例中,打印机识别器370可以访问数据储存372以将与给定聚类相关联的特征集和从数据储存372提取的与来自已知来源的聚类相关联的特征集相比较以确定被用于打印每个打印样本的打印机类型(例如柔版印刷打印机、胶印打印机、凹版打印机、喷墨打印机、激光打印机等)。例如,在一些示例中,如果存在五种不同类型的打印机(柔版印刷、胶印、凹版、喷墨和激光),通过使用基于识别两种特定类型的打印机的成对度量的聚类行为可以形成十个成对聚类。
采用打印机分析器350允许打印机分析器350的用户识别被用于打印给定打印样本的打印机。在一些情形中,给定打印样本的打印机的标识可以被用于确定打印样本是否源自诸如OEM之类的可信源,或者打印样本是否源自伪造者。
鉴于以上描述的上述结构和功能特征,参考图11和12将更好领会示例方法。虽然出于简化解释的目的,将图11和12的示例方法示出和描述为串行运行,但是要理解和领会到本示例不受所图示的次序的限制,因为在其它示例中一些动作可以以不同于本文所示和描述的那些的次序发生和/或同时发生。此外,不一定执行所有所描述的动作来实现方法。
图11图示了用于识别诸如图1中图示的数目为N的打印样本4的打印样本6之类的打印样本的打印机的示例方法400的流程图的示例。方法400可以例如由诸如图1中图示的打印机分析器10和/或图10中图示的打印机分析器350之类的打印机分析器实现。
在410处,可以由诸如图1中图示的扫描仪8之类的扫描仪扫描数目为N的打印样本以提供每个打印样本的数字图像。在420处,可以例如由图9中图示的打印文本特征集提取器300从数目为N的打印样本的数字图像中的给定数字图像的ROI提取打印文本特征集,所述ROI可以被称为给定打印样本的给定ROI。在430处,可以由图3中图示的减法特征集提取器100和/或图4中图示的FFT特征集提取器150从给定打印样本的给定ROI提取差分特征集。在440处,可以例如由图5中图示的基于分布的特征集提取器200从给定打印样本的给定ROI提取基于分布的特征集。
在450处,打印机分析器的特征集提取器可以向聚类组件(例如图1中图示的聚类组件20)提供对应于给定打印样本的给定ROI的特征记录。特征记录可以包括动作420-440中的所提取的特征集(或其某个子集)以及识别从其中得到所提取的特征集的给定打印样本的数据。
在460处,聚类组件可以确定映射数目为N的打印样本中的每一个的特征集的聚类空间。在470处,聚类组件可以基于聚类空间而确定聚类。聚类组件可以使用诸如K均值、最近邻算法等之类的聚类技术。在480处,打印机分析器的打印机识别器可以检查聚类和聚类空间以识别数目为N的打印样本中的每个打印样本的打印机。在490处,打印机识别器可以识别被用于打印每一个打印样本的打印机的类型。
图12图示了用于确定多个打印样本中的每一个的打印机的示例方法500的另一个流程图。在510处,特征集提取器可以从打印样本的多个数字图像中的每一个提取特征集。在520处,聚类组件可以基于打印样本的数字图像中的每一个的特征集而确定对应于打印样本的聚类。所述聚类中的给定聚类的每个成员可以对应于用共同打印机打印的打印样本中的打印样本。特征集可以是表征给定打印样本的打印机的经过滤的特征集。
图13是图示了能够实现图1-12中公开的示例的硬件组件的示例系统600的示意性框图,诸如图1和10中图示的打印机分析器10、350以及图1中图示的扫描仪8的部分。系统600可以包括各种系统和子系统。系统600可以是个人计算机、膝上型计算机、工作站、计算机系统、装置、专用集成电路(ASIC)、服务器、刀片服务器中心、服务器场、移动设备、诸如智能电话、个人数字助理、交互式电视机、因特网装置、打印机的部分等。
系统600可以包括系统总线602、处理单元604、系统存储器606、存储器设备608和610、通信接口612(例如网络接口)、通信链路614、显示器616(例如视频屏)和输入设备618(例如键盘和/或鼠标)。系统总线602可以与处理单元604和系统存储器606进行通信。诸如硬盘驱动器、服务器、独立数据库或其它非易失性存储器之类的附加存储器设备608和610也可以与系统总线602进行通信。系统总线602操作地互连处理单元604、存储器设备606-610、通信接口612、显示器616和输入设备618。在一些示例中,系统总线602还操作地互连附加端口(未示出),诸如通用串行总线(USB)端口。
处理单元604可以是计算设备并且可以包括专用集成电路(ASIC)。处理单元604运行指令集以实现本文所公开的示例的操作。处理单元可以包括处理器核。
附加存储器设备606、608和610可以以文本或编译形式存储数据、程序、指令、数据库查询以及操作计算机可能需要的任何其它信息。可以将存储器606、608和610实现为计算机可读介质(集成的或可移除的),诸如存储器卡、盘驱动器、压缩盘(CD)或通过网络可访问的服务器。在某些示例中,存储器606、608和610可以包括文本、图像、视频和/或音频。
此外,存储器设备608和610可以充当数据库或数据储存,诸如图10中图示的数据储存370和/或图1和10中图示的存储器14或352。附加地或可替换地,系统600可以通过通信接口612访问外部系统(例如web服务),所述通信接口612可以与系统总线602和通信链路614进行通信。
在操作中,系统600可以被用于实现例如打印机分析器和/或扫描仪。依照某些示例,用于实现该系统的机器(例如计算机)可执行逻辑,诸如图1中图示的打印机分析器10的存储器14和/或图10中图示的打印机分析器350的存储器352,可以驻留在系统存储器606中和/或存储器设备608和/或610中。处理单元604运行源自系统存储器606和存储器设备608和610的机器可读指令。在这样的示例中,系统存储器606和/或存储器设备608和/或610可以例如被用于实现图1中图示的存储器14和/或图10中图示的存储器352。如本文中使用的术语“计算机可读介质”是指参与向处理单元604提供指令以供运行的介质。
在本公开或权利要求记载“一”、“一个”、“第一”或“另一个”元件或其等价物的地方,其应当被解释为包括一个或多于一个的这样的元件,而不是必需也不是排除两个或更多这样的元件。此外,以上已经描述的是示例。描述组件或方法的每一个可想到的组合当然是不可能的,但是本领域普通技术人员将认识到许多另外的组合和置换是可能的。因此,本发明旨在涵盖落入包括随附的权利要求在内的本申请的范围内的所有这样的变化、修改和变型。

Claims (15)

1.一种系统包括:
存储器,其存储机器可读指令;以及
处理单元,其访问存储器并运行所述机器可读指令,所述机器可读指令包括:
特征集提取器,其从打印样本的多个数字图像中的每一个提取特征集,其中所述特征集是包括表征打印了打印样本中的给定打印样本的打印机的特征集的经过滤的特征集;
聚类组件,其基于打印样本的多个扫描图像中的每一个的特征集而确定打印样本的聚类;以及
打印机识别器,其基于打印样本的聚类而识别打印样本的打印机。
2.权利要求1的系统,其中所述特征集提取器从给定打印样本的给定数字图像的感兴趣的区域(ROI)提取给定特征集。
3.权利要求2的系统,其中所述特征集提取器包括基于ROI的几何特性从ROI提取特征集的打印文本特征集提取器。
4.权利要求2的系统,其中所述特征集提取器包括基于来自ROI的参考图像的减法从ROI提取特征集的减法特征集提取器。
5.权利要求4的系统,其中所述参考图像基于从已知源提供的ROI的图像。
6.权利要求5的系统,其中所述参考图像基于从来自多个打印样本的图像中的每一个的ROI的平均得到的模态图像。
7.权利要求2的系统,其中所述特征集提取器包括基于ROI的FFT从ROI提取特征集的快速傅里叶变换(FFT)特征集提取器。
8.权利要求7的系统,其中所述FFT特征集提取器基于ROI的FFT的能量谱密度(ESD)并且基于参考ROI的FFT的ESD而确定针对ROI的差分系数。
9.权利要求2的系统,其中所述特征集提取器包括基于对ROI中的定义的搜索区的搜索而从ROI提取特征集的基于分布的特征集提取器。
10.权利要求1的系统,其中所述聚类组件还确定映射对应于多个打印样本中的每一个的特征集的聚类空间。
11.权利要求1的系统,其中所述打印机识别器还确定被用于打印多个打印样本中的每一个的打印机的类型。
12.一种方法包括:
从打印样本的多个数字图像中的每一个提取特征集,其中所述特征集是表征给定打印样本的打印机的经过滤的特征集;以及
基于打印样本的数字图像中的每一个的特征集而确定对应于打印样本的聚类,其中所述聚类中的给定聚类的每个成员对应于利用共同打印机打印的打印样本中的打印样本。
13.权利要求12的方法,还包括识别针对共同打印机的打印机类型。
14.权利要求12的方法,还包括扫描多个打印样本以提供打印样本的数字图像。
15.一种系统包括:
扫描仪,其提供多个打印样本的数字图像;以及
打印机分析器,其包括:
存储器,其存储机器可读指令;以及
处理单元,其访问存储器并且运行所述机器可读指令,所述机器可读指令包括:
特征集提取器,其包括:
打印文本特征集提取器,其基于打印样本的多个数字图像中的给定数字图像的感兴趣的区域(ROI)的几何特征而提取第一特征集;
减法特征集提取器,其基于通过给定数字图像的ROI的减法确定的差分特征而提取第二特征集;
快速傅里叶变换(FFT)提取器,其基于通过给定数字图像的ROI的FFT确定的差分特征而提取第三特征集;以及
基于分布的特征集提取器,其基于对给定数字图像的ROI中的搜索区的搜索而提取第四特征集;
其中所述特征集提取器组合第一、第二、第三和第四特征集以提供所提取的特征集;
聚类组件,其进行以下动作:
绘制对应于每个打印样本的所提取的特征集以形成聚类空间;并且
确定聚类空间中的聚类;以及
打印机识别器,其进行以下动作:
基于聚类空间中的聚类而识别被用于打印每个打印样本的打印机以提供多个经识别的打印机;并且
识别多个打印机中的每一个的打印机类型。
CN201280068662.1A 2012-01-31 2012-01-31 打印样本特征集 Pending CN104067604A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2012/023254 WO2013115788A1 (en) 2012-01-31 2012-01-31 Print sample feature set

Publications (1)

Publication Number Publication Date
CN104067604A true CN104067604A (zh) 2014-09-24

Family

ID=48905647

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280068662.1A Pending CN104067604A (zh) 2012-01-31 2012-01-31 打印样本特征集

Country Status (4)

Country Link
US (1) US9147141B2 (zh)
EP (1) EP2810427A4 (zh)
CN (1) CN104067604A (zh)
WO (1) WO2013115788A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110239232A (zh) * 2019-04-08 2019-09-17 上海泰威技术发展股份有限公司 一种针对板材多图案变化打印的智能识别方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10628934B2 (en) * 2016-08-11 2020-04-21 Videojet Technologies Inc Printer device, printer marking system and method with multi-stage production print inspection

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1051632A (ja) * 1996-02-20 1998-02-20 Seiko Epson Corp 複合モードの文書の品質を向上させるための方法及び装置
JP2004234406A (ja) * 2003-01-31 2004-08-19 Canon Inc 帳票処理方法
JP2005208005A (ja) * 2004-01-26 2005-08-04 Fuji Xerox Co Ltd 傾き検出機能付き画像検査装置
US20060197962A1 (en) * 2005-03-07 2006-09-07 Chen-Chung Chen Dual-resolution printing method
CN101292259A (zh) * 2005-08-23 2008-10-22 株式会社理光 用于混合介质环境中的图像匹配的方法和系统

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6533385B1 (en) * 2001-12-14 2003-03-18 Pitney Bowes Inc. Method for determining a printer's signature and the number of dots per inch printed in a document to provide proof that the printer printed a particular document
US6612684B2 (en) * 2001-12-14 2003-09-02 Pitney Bowes Inc. Method for determining a printer's signature to provide proof that the printer printed a particular document
US7054461B2 (en) * 2002-02-15 2006-05-30 Pitney Bowes Inc. Authenticating printed objects using digital watermarks associated with multidimensional quality metrics
JP4067957B2 (ja) * 2002-12-20 2008-03-26 富士通株式会社 境界検出方法、プログラム、及び画像処理装置
US8086038B2 (en) 2007-07-11 2011-12-27 Ricoh Co., Ltd. Invisible junction features for patch recognition
US7643181B2 (en) 2004-12-14 2010-01-05 Pitney Bowes Inc. Method and system for printing an original image and for determining if a printed image is an original or has been altered
US8094344B2 (en) * 2006-02-28 2012-01-10 Konica Minolta Laboratory U.S.A., Inc. Optimum noise filter setting for a scanner in a closed loop system
JP4804204B2 (ja) * 2006-04-13 2011-11-02 キヤノン株式会社 記録材量測定方法、画像形成方法、記録材量測定装置、及び画像形成装置
US20080013113A1 (en) 2006-07-13 2008-01-17 Hewlett-Packard Development Company, L.P. Printers and printing
US8953795B2 (en) 2007-11-30 2015-02-10 Sony Corporation Forensic decryption tools
US8280905B2 (en) 2007-12-21 2012-10-02 Georgetown University Automated forensic document signatures
JP4844606B2 (ja) 2008-09-11 2011-12-28 富士ゼロックス株式会社 画像分類装置及びプログラム
AU2008259730B2 (en) * 2008-12-18 2011-10-27 Canon Kabushiki Kaisha Method of producing probabilities of being a template shape
JP2012080520A (ja) * 2010-09-09 2012-04-19 Canon Inc 文書管理システムおよび文書管理システムを構成する画像形成装置、サーバ並びにその方法及びプログラム。
ITFI20110207A1 (it) 2011-09-27 2013-03-28 Viditrust Srl Procedimento di marcatura anticontraffazione di prodotti a stampa e relativo sistema
WO2013119235A1 (en) * 2012-02-09 2013-08-15 Hewlett-Packard Development Company, L.P. Forensic verification from halftone images
WO2013119234A1 (en) * 2012-02-09 2013-08-15 Hewlett - Packard Development Company, L.P. Forensic verification utilizing forensic markings inside halftones
US9361516B2 (en) * 2012-02-09 2016-06-07 Hewlett-Packard Development Company, L.P. Forensic verification utilizing halftone boundaries

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1051632A (ja) * 1996-02-20 1998-02-20 Seiko Epson Corp 複合モードの文書の品質を向上させるための方法及び装置
JP2004234406A (ja) * 2003-01-31 2004-08-19 Canon Inc 帳票処理方法
JP2005208005A (ja) * 2004-01-26 2005-08-04 Fuji Xerox Co Ltd 傾き検出機能付き画像検査装置
US20060197962A1 (en) * 2005-03-07 2006-09-07 Chen-Chung Chen Dual-resolution printing method
CN101292259A (zh) * 2005-08-23 2008-10-22 株式会社理光 用于混合介质环境中的图像匹配的方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ARAVIND K. MIKKILINENI ET AL: "Printer Identification Based on Graylevel Co-occurrence Features for Security and Forensic Applications", 《PROCEEDINGS OF THE SPIE》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110239232A (zh) * 2019-04-08 2019-09-17 上海泰威技术发展股份有限公司 一种针对板材多图案变化打印的智能识别方法

Also Published As

Publication number Publication date
EP2810427A4 (en) 2015-10-14
EP2810427A1 (en) 2014-12-10
WO2013115788A1 (en) 2013-08-08
US9147141B2 (en) 2015-09-29
US20140333969A1 (en) 2014-11-13

Similar Documents

Publication Publication Date Title
US10762343B2 (en) Form type learning system and image processing apparatus
US8488181B2 (en) Preserving user applied markings made to a hardcopy original document
Denemark et al. Improving selection-channel-aware steganalysis features
US20170287252A1 (en) Counterfeit Document Detection System and Method
US8462388B2 (en) Identifying a color separation wherein a banding defect originates
US9247080B2 (en) Information processing apparatus for acquiring a variation region between image data and read data
EP2106599A2 (en) Feature matching method
van Beusekom et al. Automatic authentication of color laser print-outs using machine identification codes
Tsai et al. Digital forensics of printed source identification for Chinese characters
Choi et al. Color laser printer forensic based on noisy feature and support vector machine classifier
CN111950557A (zh) 错题处理方法、图像形成装置及电子设备
WO2010134919A1 (en) Generation of an individual glyph, and system and method for inspecting individual glyphs
Jain et al. Passive classification of source printer using text-line-level geometric distortion signatures from scanned images of printed documents
US20200387701A1 (en) On-device partial recognition systems and methods
JP2013109773A (ja) 特徴マッチング方法及び商品認識システム
US20220060591A1 (en) Automated diagnoses of issues at printing devices based on visual data
JP2004336282A (ja) 画像処理装置、画像処理プログラム及び該プログラムを記録した記録媒体
CN103748866A (zh) 取证鉴定系统和方法
Tsai et al. Digital forensics of microscopic images for printed source identification
EP3547209A1 (en) System and method of identifying an image containing an identification document
CN104067604A (zh) 打印样本特征集
Scheidat et al. Biometric authentication based on 2D/3D sensing of forensic handwriting traces
Mehta et al. Near-duplicate detection for LCD screen acquired images using edge histogram descriptor
Yang et al. Effective geometric restoration of distorted historical document for large‐scale digitisation
US20190197304A1 (en) Identifying versions of a form

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140924