CN111738898B - 文本数字水印嵌入\提取方法及装置 - Google Patents

文本数字水印嵌入\提取方法及装置 Download PDF

Info

Publication number
CN111738898B
CN111738898B CN202010555469.7A CN202010555469A CN111738898B CN 111738898 B CN111738898 B CN 111738898B CN 202010555469 A CN202010555469 A CN 202010555469A CN 111738898 B CN111738898 B CN 111738898B
Authority
CN
China
Prior art keywords
black pixel
characters
character
pixel quantity
embedded part
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010555469.7A
Other languages
English (en)
Other versions
CN111738898A (zh
Inventor
黄岩
张升平
杨吉云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Youhong Beijing Technology Co ltd
Original Assignee
Youhong Beijing Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Youhong Beijing Technology Co ltd filed Critical Youhong Beijing Technology Co ltd
Priority to CN202010555469.7A priority Critical patent/CN111738898B/zh
Publication of CN111738898A publication Critical patent/CN111738898A/zh
Application granted granted Critical
Publication of CN111738898B publication Critical patent/CN111738898B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/147Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0062Embedding of the watermark in text images, e.g. watermarking text documents using letter skew, letter distance or row distance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0065Extraction of an embedded watermark; Reliable detection

Abstract

本发明公开了一种文本数字水印嵌入\提取方法及装置,所述文本数字水印嵌入方法包括:计算OFD电子文档的字符位置区域的所有字符的平均黑色像素量和从所有字符中划分出的嵌入部分字符的字符黑色像素量;根据平均黑色像素量和字符黑色像素量得到打印扫描不变量系数,根据提取的嵌入部分字符的黑色像素特征值和用户选择的水印信息,生成近似特征值矩阵;根据打印扫描不变量系数和近似特征值矩阵,计算嵌入部分字符的所需翻转的黑色像素量,根据所需翻转的黑色像素量,将嵌入部分字符的图像进行像素翻转,得到翻转后的字符图像,并将翻转后的字符图像嵌入至OFD电子文档中,完成文本数字水印的嵌入。

Description

文本数字水印嵌入\提取方法及装置
技术领域
本发明涉及文本水印技术领域,尤其是涉及一种文本数字水印嵌入\提取方法及装置。
背景技术
在网络平台不断发展的今天,政府、企业等机构的重要文件大都以电子档的形式进行流转,例如,公文、票据、档案、合同、协议等。在文档流转过程中,随着打印机、扫描仪等高质量输入输出设备的广泛应用,许多电子文档极易被任意的复制和传播,从而造成政府、企业的机密信息泄露,给用户带来重大损失。同时,也难以根据泄露的文档快速定位信息泄露者,为政府、企业挽回损失,弥补制度疏漏。
现有文档保护的技术,通常将这些电子文档附加上访问密码,或者将电子文档转为文本图像并附加上可见的底纹信息。但是,附加访问密码的方式无法对打印后的文档进行保护,附加可见底纹的方式一方面影响打印后文档的阅读体验,同时可见底纹很容易通过PS图片处理的方式进行去除,跟踪性能很差。
数字水印技术是一种信息隐藏技术,思想源于古代隐写术,是目前国内外学术界研究的前沿热点方向。数字水印技术研究始于20世纪90年代初,1994年,Maxemchuk首次提出在文档中嵌入水印信息,以对文档的保护,标志着文本数字水印的开始。
数字水印技术根据使用的载体不同,主要可以归纳为文本水印、图像水印、视频水印等几个研究领域。现阶段关于数字水印的研究工作大部分都集中在图像、视频和音频等方面。在图像和视频等数字载体中,两者都包含一定量的冗余数据,通过这些不能被人眼视觉系统觉察的冗余数据来嵌入水印,不会影响数字载体的本身价值,在嵌入水印前后,载体数据的感官变化量很小,不会被轻易感知。但是,对于文本信息,由于文本图像包含的冗余信息过少,嵌入较少的数据就会对文本信息产生很大的影响,因为图像和视频的数字水印技术往往很难应用到文本图像中。
现有的文本数字水印技术方案,主要通过改变文档结构、改变文档内容、改变图像像素等集中方式来实现文。通过改变文档结构的水印方案,主要是通过改变文档的行间距、字间距的方式来嵌入水印编码,此种方案往往水印信息容量较少,且在一定程度上影响阅读体验;通过改变文档内容的水印方案,主要是通过改变文档中的特殊标点或字符,或者改变文档的句式结构来嵌入水印编码,此种方案改变了原有文档格式,当某些场景下不允许改变文档内容的时候,无法使用此方案。而改变图像像素的实现方案,通常具有较好的水印信息容量,并且不影响阅读体验。因此,目前亟须一种基于改变图像像素的文本数字水印嵌入\提取方法。
发明内容
本发明的目的在于提供一种文本数字水印嵌入\提取方法及装置,旨在解决现有技术中的上述问题。
本发明提供一种文本数字水印嵌入方法,包括:
计算OFD电子文档的字符位置区域的所有字符的平均黑色像素量和从所有字符中划分出的嵌入部分字符的字符黑色像素量;
根据平均黑色像素量和字符黑色像素量得到打印扫描不变量系数,根据提取的嵌入部分字符的黑色像素特征值和用户选择的水印信息,生成近似特征值矩阵;
根据打印扫描不变量系数和近似特征值矩阵,计算嵌入部分字符的所需翻转的黑色像素量,根据所需翻转的黑色像素量,将嵌入部分字符的图像进行像素翻转,得到翻转后的字符图像,并将翻转后的字符图像嵌入至OFD电子文档中,完成文本数字水印的嵌入。
本发明还提供了一种文本数字水印提取方法,用于对使用上述方法嵌入的文本数字水印进行提取,方法具体包括:
对含有文本数字水印的OFD电子文档进行分割,计算分割后的文本图像中含有的平均黑色像素量,根据平均黑色像素量和获取的打印扫描不变量系数,确定嵌入部分字符;
计算嵌入部分字符的特征值,得到特征值矩阵,将特征值矩阵进行DCT变换,得到DCT系数矩阵,从DCT系数矩阵中提取出含有加密水印信息的比特序列,对含有加密水印信息的比特序列进行解码解密,得到签名的水印信息。
本发明还提供一种文本数字水印嵌入装置,包括:
计算模块,用于计算OFD电子文档的字符位置区域的所有字符的平均黑色像素量和从所有字符中划分出的嵌入部分字符的字符黑色像素量;
生成模块,用于根据平均黑色像素量和字符黑色像素量得到打印扫描不变量系数,根据提取的嵌入部分字符的黑色像素特征值和用户选择的水印信息,生成近似特征值矩阵;
嵌入模块,用于根据打印扫描不变量系数和近似特征值矩阵,计算嵌入部分字符的所需翻转的黑色像素量,根据所需翻转的黑色像素量,将嵌入部分字符的图像进行像素翻转,得到翻转后的字符图像,并将翻转后的字符图像嵌入至OFD电子文档中,完成文本数字水印的嵌入。
本发明还提供一种文本数字水印提取装置,用于对使用上述装置嵌入的文本数字水印进行提取,装置具体包括:
分割模块,用于对含有文本数字水印的OFD电子文档进行分割,计算分割后的文本图像中含有的平均黑色像素量,根据平均黑色像素量和获取的打印扫描不变量系数,确定嵌入部分字符;
提取模块,用于计算嵌入部分字符的特征值,得到特征值矩阵,将特征值矩阵进行DCT变换,得到DCT系数矩阵,从DCT系数矩阵中提取出含有加密水印信息的比特序列,对含有加密水印信息的比特序列进行解码解密,得到签名的水印信息。
本发明实施例还提供了一种文本数字水印嵌入提取装置,包括上述文本数字水印嵌入装置和上述文本数字水印提取装置。
采用本发明实施例,在电子文档的文本图像中,嵌入数字水印信息,即使电子文档经过打印和/或扫描后,通过提取数字水印信息,仍可追查文档源头,以此实现对文本信息的保护。采用本发明实施例的技术方案,嵌入水印后的文本图像具有较好的视觉效果,能够抵抗缩放和旋转等一系列攻击,能够在打印和/或扫描的情况下,仍能成功提取水印信息,具有较好的使用价值与前景。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的文本数字水印嵌入方法的流程图;
图2是本发明实施例的文本数字水印提取方法的流程图;
图3是本发明实施例的文本数字水印嵌入装置的示意图;
图4是本发明实施例的文本数字水印提取装置的示意图;
图5是本发明实施例的文本数字水印嵌入提取装置的示意图。
具体实施方式
下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“坚直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。此外,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
方法实施例一
根据本发明实施例,提供了一种文本数字水印嵌入方法,图1是本发明实施例的文本数字水印嵌入方法的流程图,如图1所示,根据本发明实施例的文本数字水印嵌入方法具体包括:
步骤101,计算OFD电子文档的字符位置区域的所有字符的平均黑色像素量和从所有字符中划分出的嵌入部分字符的字符黑色像素量;
步骤101具体包括如下处理:
对OFD电子文档进行内容解析,获取字符位置区域;在本发明实施例中,可以采用多种方式对OFD电子文档的内容进行解析,从而获取字符位置区域。
计算字符位置区域的所有字符的平均黑色像素量;
对字符位置区域内的所有字符,根据筛选算法进行筛选,得到嵌入部分字符和去除部分字符;在本发明实施例中,筛选算法可以包括多种。通过筛选算法可以将字符位置区域内的所有字符分为两组,即嵌入部分字符和去除部分字符。
计算嵌入部分字符的字符黑色像素量。
步骤102,根据平均黑色像素量和字符黑色像素量得到打印扫描不变量系数,根据提取的嵌入部分字符的黑色像素特征值和用户选择的水印信息,生成近似特征值矩阵;步骤102具体包括如下处理:
提取嵌入部分字符的黑色像素特征值,构建特征值矩阵;
使用用户授权的私钥对用户选择的水印信息进行签名;此处的水印信息为输入的参数。
对签名的水印信息进行加密,形成加密水印信息;
对加密水印信息进行编码,转为比特序列;
对特征值矩阵进行离散余弦变换DCT,得到DCT系数矩阵;
将比特序列信息嵌入到DCT系数矩阵,得到近似特征值矩阵。
步骤103,根据打印扫描不变量系数和近似特征值矩阵,计算嵌入部分字符的所需翻转的黑色像素量,根据所需翻转的黑色像素量,将嵌入部分字符的图像进行像素翻转,得到翻转后的字符图像,并将翻转后的字符图像嵌入至OFD电子文档中,完成文本数字水印的嵌入。
以下对本发明实施例的上述技术方案进行详细说明。
步骤1:对原始OFD格式电子文档进行内容解析,获取字符位置区域。
步骤2:计算字符位置区域内字符的平均黑色像素量。
步骤3:对所有字符位置区域内的字符,根据筛选算法进行筛选,分组为嵌入部分字符和去除部分字符。
步骤4:计算嵌入部分的字符黑色像素量,根据字符黑色像素量和平均黑色像素量,得到打印扫描不变量系数。
步骤5:提取嵌入部分的黑色像素特征值,构建特征值矩阵。
步骤6:使用用户授权的私钥对输入的水印信息进行签名。
步骤7:对签名信息进行加密,形成加密水印信息。
步骤8:对加密水印信息进行编码,转为比特序列。
步骤9:对特征值矩阵进行DCT变换,得到DCT系数矩阵。
步骤10:将比特序列信息,嵌入至DCT系数矩阵,得到近似特征值矩阵。
步骤11:基于打印扫描不变量系数,根据近似特征值矩阵,计算嵌入部分字符的所需翻转的黑色像素量。
步骤12:根据优化的MinWu像素翻转方案,将嵌入部分字符的图像进行像素翻转,得到翻转后的字符图像。需要说明的是,MinWu像素翻转方案是一种通过计算平滑度和连通性来计算翻转分数的像素翻转策略,是对文本二值图像进行像素翻转的通用策略,具有较大的优化提升空间。在实际应用中,可以根据需要对其进行相应的优化,以达到更好的使用效果。
步骤13:将翻转后的字符图像,嵌入至OFD电子文档中,得到含水印信息的电子文档图像。
综上所述,通过上述处理,可以将文本数字水印嵌入到OFD电子文档中,即使电子文档经过打印和/或扫描后,通过提取数字水印信息,仍可追查文档源头,以此实现对文本信息的保护。
方法实施例二
根据本发明的实施例,提供了一种文本数字水印提取方法,用于对使用方法实施例一所述方法嵌入的文本数字水印进行提取,图2是本发明实施例的文本数字水印提取方法的流程图,如图2所示,根据本发明实施例的文本数字水印提取方法具体包括:
步骤201,对含有文本数字水印的OFD电子文档进行分割,计算分割后的文本图像中含有的平均黑色像素量,根据平均黑色像素量和获取的打印扫描不变量系数,确定嵌入部分字符;
步骤201具体包括如下处理:
将含有文本数字水印的OFD电子文档进行二值化,并进行字符分割,得到分割后的文本图像;
计算分割后的文本图像中含有的平均黑色像素量;
根据平均黑色像素量和获取的打印扫描不变量系数,得到嵌入部分字符的字符黑色像素量;
根据嵌入部分字符的字符黑色像素量,使用筛选算法,计算出嵌入部分字符。
步骤202,计算嵌入部分字符的特征值,得到特征值矩阵,将特征值矩阵进行DCT变换,得到DCT系数矩阵,从DCT系数矩阵中提取出含有加密水印信息的比特序列,对含有加密水印信息的比特序列进行解码解密,得到签名的水印信息。
执行了步骤202之后,还可以包括如下处理:使用用户授权的公钥,对签名的水印信息进行验签,以确认水印信息的准确性。
以下对本发明实施例的上述技术方案进行详细说明。
步骤1:将含有水印信息的OFD文本图像进行二值化,并进行字符分割,得到分割后的OFD文本图像。
步骤2:计算分割后的OFD文本图像中含有的黑色像素量的平均值。
步骤3:以黑色像素平均值和打印扫描不变量系数作为输入参数,得到嵌入部分字符的黑色像素量,并使用筛选算法,计算出嵌入部分字符。
步骤4:计算嵌入部分字符的特征值,得到特征值矩阵。
步骤5:将特征值矩阵,进行DCT变换,得到DCT系数矩阵。
步骤6:从DCT系数矩阵中,提取出含有加密水印信息的比特序列。
步骤7:对含有加密水印信息的比特序列进行解码解密,得到签名的水印信息。
步骤8:使用用户授权的公钥,对签名的水印信息进行验签,以确认水印信息是否准确,从而就可以判断该OFD电子文档是否被修改。
综上所述,借助于本发明实施例的技术方案,可以从OFD电子文档中提取出文本数字水印,即使电子文档经过打印-扫描后,通过提取数字水印信息,仍可追查文档源头,以此实现对文本信息的保护。使用本发明,嵌入水印后的文本图像要具有较好的视觉效果,能够抵抗缩放和旋转等一系列攻击,能够在打印-扫描的情况下,仍能成功提取水印信息。
装置实施例一
根据本发明实施例,提供了一种文本数字水印嵌入装置,图3是本发明实施例的文本数字水印嵌入装置的示意图,如图3所示,根据本发明实施例的文本数字水印嵌入装置具体包括:
计算模块30,用于计算OFD电子文档的字符位置区域的所有字符的平均黑色像素量和从所有字符中划分出的嵌入部分字符的字符黑色像素量;计算模块30具体用于:
对OFD电子文档进行内容解析,获取字符位置区域;
计算字符位置区域的所有字符的平均黑色像素量;
对字符位置区域内的所有字符,根据筛选算法进行筛选,得到嵌入部分字符和去除部分字符;
计算嵌入部分字符的字符黑色像素量;
生成模块32,用于根据平均黑色像素量和字符黑色像素量得到打印扫描不变量系数,根据提取的嵌入部分字符的黑色像素特征值和用户选择的水印信息,生成近似特征值矩阵;生成模块32具体用于:
提取嵌入部分字符的黑色像素特征值,构建特征值矩阵;
使用用户授权的私钥对用户选择的水印信息进行签名;
对签名的水印信息进行加密,形成加密水印信息;
对加密水印信息进行编码,转为比特序列;
对特征值矩阵进行离散余弦变换DCT,得到DCT系数矩阵;
将比特序列信息嵌入到DCT系数矩阵,得到近似特征值矩阵。
嵌入模块34,用于根据打印扫描不变量系数和近似特征值矩阵,计算嵌入部分字符的所需翻转的黑色像素量,根据所需翻转的黑色像素量,将嵌入部分字符的图像进行像素翻转,得到翻转后的字符图像,并将翻转后的字符图像嵌入至OFD电子文档中,完成文本数字水印的嵌入。
本发明实施例是与上述方法实施例一对应的装置实施例,各个模块的具体操作可以参照方法实施例的描述进行理解,在此不再赘述。
装置实施例二
根据本发明的实施例,提供了一种文本数字水印提取装置,用于对上述装置实施例一嵌入的文本数字水印进行提取,图4是本发明实施例的文本数字水印提取装置的示意图,如图4所示,根据本发明实施例的文本数字水印提取装置具体包括:
分割模块40,用于对含有文本数字水印的OFD电子文档进行分割,计算分割后的文本图像中含有的平均黑色像素量,根据所述平均黑色像素量和获取的打印扫描不变量系数,确定嵌入部分字符;
分割模块40具体用于:
将含有文本数字水印的OFD电子文档进行二值化,并进行字符分割,得到分割后的文本图像;
计算分割后的文本图像中含有的平均黑色像素量。
根据所述平均黑色像素量和获取的打印扫描不变量系数,得到嵌入部分字符的字符黑色像素量;
根据所述嵌入部分字符的字符黑色像素量,使用筛选算法,计算出嵌入部分字符;
提取模块42,用于计算所述嵌入部分字符的特征值,得到特征值矩阵,将所述特征值矩阵进行DCT变换,得到DCT系数矩阵,从所述DCT系数矩阵中提取出含有加密水印信息的比特序列,对含有加密水印信息的比特序列进行解码解密,得到签名的水印信息。
提取模块42进一步用于:使用用户授权的公钥,对签名的水印信息进行验签,以确认水印信息的准确性。
本发明实施例是与上述方法实施例二对应的装置实施例,各个模块的具体操作可以参照方法实施例的描述进行理解,在此不再赘述。
装置实施例三
根据本发明实施例,提供了一种文本数字水印嵌入提取装置,图5是本发明实施例的文本数字水印嵌入提取装置的示意图,如图5所示,根据本发明实施例的文本数字水印嵌入提取装置具体包括:
计算模块30,用于计算OFD电子文档的字符位置区域的所有字符的平均黑色像素量和从所有字符中划分出的嵌入部分字符的字符黑色像素量;计算模块30具体用于:
对OFD电子文档进行内容解析,获取字符位置区域;
计算字符位置区域的所有字符的平均黑色像素量;
对字符位置区域内的所有字符,根据筛选算法进行筛选,得到嵌入部分字符和去除部分字符;
计算嵌入部分字符的字符黑色像素量;
生成模块32,用于根据平均黑色像素量和字符黑色像素量得到打印扫描不变量系数,根据提取的嵌入部分字符的黑色像素特征值和用户选择的水印信息,生成近似特征值矩阵;生成模块32具体用于:
提取嵌入部分字符的黑色像素特征值,构建特征值矩阵;
使用用户授权的私钥对用户选择的水印信息进行签名;
对签名的水印信息进行加密,形成加密水印信息;
对加密水印信息进行编码,转为比特序列;
对特征值矩阵进行离散余弦变换DCT,得到DCT系数矩阵;
将比特序列信息嵌入到DCT系数矩阵,得到近似特征值矩阵。
嵌入模块34,用于根据打印扫描不变量系数和近似特征值矩阵,计算嵌入部分字符的所需翻转的黑色像素量,根据所需翻转的黑色像素量,将嵌入部分字符的图像进行像素翻转,得到翻转后的字符图像,并将翻转后的字符图像嵌入至OFD电子文档中,完成文本数字水印的嵌入。
分割模块40,用于对含有文本数字水印的OFD电子文档进行分割,计算分割后的文本图像中含有的平均黑色像素量,根据所述平均黑色像素量和获取的打印扫描不变量系数,确定嵌入部分字符;
分割模块40具体用于:
将含有文本数字水印的OFD电子文档进行二值化,并进行字符分割,得到分割后的文本图像;
计算分割后的文本图像中含有的平均黑色像素量。
根据所述平均黑色像素量和获取的打印扫描不变量系数,得到嵌入部分字符的字符黑色像素量;
根据所述嵌入部分字符的字符黑色像素量,使用筛选算法,计算出嵌入部分字符;
提取模块42,用于计算所述嵌入部分字符的特征值,得到特征值矩阵,将所述特征值矩阵进行DCT变换,得到DCT系数矩阵,从所述DCT系数矩阵中提取出含有加密水印信息的比特序列,对含有加密水印信息的比特序列进行解码解密,得到签名的水印信息。
提取模块42进一步用于:使用用户授权的公钥,对签名的水印信息进行验签,以确认水印信息的准确性。
综上所述,采用本发明实施例,在电子文档的文本图像中,嵌入数字水印信息,即使电子文档经过打印和/或扫描后,通过提取数字水印信息,仍可追查文档源头,以此实现对文本信息的保护。采用本发明实施例的技术方案,嵌入水印后的文本图像具有较好的视觉效果,能够抵抗缩放和旋转等一系列攻击,能够在打印和/或扫描的情况下,仍能成功提取水印信息,具有较好的使用价值与前景。
本实施例所述计算机可读存储介质包括但不限于为:ROM、RAM、磁盘或光盘等。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (5)

1.一种文本数字水印嵌入方法,其特征在于,包括:
计算OFD电子文档的字符位置区域的所有字符的平均黑色像素量和从所述所有字符中划分出的嵌入部分字符的黑色像素量,具体包括:
对所述OFD电子文档进行内容解析,获取字符位置区域;
计算字符位置区域的所有字符的平均黑色像素量;
对字符位置区域内的所有字符,根据筛选算法进行筛选,得到嵌入部分字符和去除部分字符;
计算嵌入部分字符的黑色像素量;
根据所述平均黑色像素量和所述嵌入部分字符黑色像素量得到打印扫描不变量系数,根据提取的嵌入部分字符的黑色像素特征值和用户选择的水印信息,生成近似特征值矩阵,具体包括:
提取嵌入部分字符的黑色像素特征值,构建特征值矩阵;
使用用户授权的私钥对用户选择的水印信息进行签名;
对签名的水印信息进行加密,形成加密水印信息;
对加密水印信息进行编码,转为比特序列;
对特征值矩阵进行离散余弦变换DCT,得到DCT系数矩阵;
将比特序列信息嵌入到所述DCT系数矩阵,得到近似特征值矩阵;
根据所述打印扫描不变量系数和所述近似特征值矩阵,计算嵌入部分字符的所需翻转的黑色像素量,根据所述所需翻转的黑色像素量,将嵌入部分字符的图像进行像素翻转,得到翻转后的字符图像,并将所述翻转后的字符图像嵌入至OFD电子文档中,完成文本数字水印的嵌入。
2.一种文本数字水印提取方法,其特征在于,用于对使用权利要求1中所述方法嵌入的文本数字水印进行提取,所述方法具体包括:
对含有文本数字水印的OFD电子文档进行分割,计算分割后的文本图像中含有的平均黑色像素量,根据所述平均黑色像素量和获取的打印扫描不变量系数,确定嵌入部分字符,具体包括:
将含有文本数字水印的OFD电子文档进行二值化,并进行字符分割,得到分割后的文本图像;
计算分割后的文本图像中含有的平均黑色像素量;
根据所述平均黑色像素量和获取的打印扫描不变量系数,得到嵌入部分字符的字符黑色像素量;
根据所述嵌入部分字符的字符黑色像素量,使用筛选算法,计算出嵌入部分字符;
所述方法进一步包括:
使用用户授权的公钥,对签名的水印信息进行验签,以确认水印信息的准确性;
计算所述嵌入部分字符的特征值,得到特征值矩阵,将所述特征值矩阵进行DCT变换,得到DCT系数矩阵,从所述DCT系数矩阵中提取出含有加密水印信息的比特序列,对含有加密水印信息的比特序列进行解码解密,得到签名的水印信息。
3.一种文本数字水印嵌入装置,其特征在于,包括:
计算模块,用于计算OFD电子文档的字符位置区域的所有字符的平均黑色像素量和从所述所有字符中划分出的嵌入部分字符的字符黑色像素量;
所述计算模块具体用于:
对所述OFD电子文档进行内容解析,获取字符位置区域;
计算字符位置区域的所有字符的平均黑色像素量;
对字符位置区域内的所有字符,根据筛选算法进行筛选,得到嵌入部分字符和去除部分字符;
计算嵌入部分字符的字符黑色像素量;
生成模块,用于根据所述平均黑色像素量和所述字符黑色像素量得到打印扫描不变量系数,根据提取的嵌入部分字符的黑色像素特征值和用户选择的水印信息,生成近似特征值矩阵;
所述生成模块具体用于:
提取嵌入部分字符的黑色像素特征值,构建特征值矩阵;
使用用户授权的私钥对用户选择的水印信息进行签名;
对签名的水印信息进行加密,形成加密水印信息;
对加密水印信息进行编码,转为比特序列;
对特征值矩阵进行离散余弦变换DCT,得到DCT系数矩阵;
将比特序列信息嵌入到所述DCT系数矩阵,得到近似特征值矩阵;
嵌入模块,用于根据所述打印扫描不变量系数和所述近似特征值矩阵,计算嵌入部分字符的所需翻转的黑色像素量,根据所述所需翻转的黑色像素量,将嵌入部分字符的图像进行像素翻转,得到翻转后的字符图像,并将所述翻转后的字符图像嵌入至OFD电子文档中,完成文本数字水印的嵌入。
4.一种文本数字水印提取装置,其特征在于,用于对使用权利要求3中所述装置嵌入的文本数字水印进行提取,所述装置具体包括:
分割模块,用于对含有文本数字水印的OFD电子文档进行分割,计算分割后的文本图像中含有的平均黑色像素量,根据所述平均黑色像素量和获取的打印扫描不变量系数,确定嵌入部分字符;
所述分割模块具体用于:
将含有文本数字水印的OFD电子文档进行二值化,并进行字符分割,得到分割后的文本图像;
计算分割后的文本图像中含有的平均黑色像素量;
根据所述平均黑色像素量和获取的打印扫描不变量系数,得到嵌入部分字符的字符黑色像素量;
根据所述嵌入部分字符的字符黑色像素量,使用筛选算法,计算出嵌入部分字符;
提取模块,用于计算所述嵌入部分字符的特征值,得到特征值矩阵,将所述特征值矩阵进行DCT变换,得到DCT系数矩阵,从所述DCT系数矩阵中提取出含有加密水印信息的比特序列,对含有加密水印信息的比特序列进行解码解密,得到签名的水印信息;
所述提取模块进一步用于:
使用用户授权的公钥,对签名的水印信息进行验签,以确认水印信息的准确性。
5.一种文本数字水印嵌入提取装置,其特征在于,包括权利要求3中所述的文本数字水印嵌入装置和权利要求4中所述的文本数字水印提取装置。
CN202010555469.7A 2020-06-17 2020-06-17 文本数字水印嵌入\提取方法及装置 Active CN111738898B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010555469.7A CN111738898B (zh) 2020-06-17 2020-06-17 文本数字水印嵌入\提取方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010555469.7A CN111738898B (zh) 2020-06-17 2020-06-17 文本数字水印嵌入\提取方法及装置

Publications (2)

Publication Number Publication Date
CN111738898A CN111738898A (zh) 2020-10-02
CN111738898B true CN111738898B (zh) 2023-09-22

Family

ID=72649624

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010555469.7A Active CN111738898B (zh) 2020-06-17 2020-06-17 文本数字水印嵌入\提取方法及装置

Country Status (1)

Country Link
CN (1) CN111738898B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111768328B (zh) * 2020-07-07 2021-08-13 中国科学院自动化研究所 文本图像水印嵌入方法及系统、提取方法及系统
CN113012018B (zh) * 2021-04-12 2022-02-25 中船重工汉光科技股份有限公司 一种隐形办公打印文本加密及解密方法
CN116127916A (zh) * 2022-11-18 2023-05-16 百望股份有限公司 一种动态添加水印的方法和装置
CN116956168B (zh) * 2023-09-18 2024-01-02 云粒智慧科技有限公司 文本水印处理方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1945622A (zh) * 2006-10-25 2007-04-11 北京北大方正电子有限公司 一种数字水印嵌入与提取方法及装置
JP2010258627A (ja) * 2009-04-22 2010-11-11 Canon Inc 画像処理装置、画像処理方法、プログラム及び記憶媒体
CN102615972A (zh) * 2011-01-25 2012-08-01 佳能株式会社 图像处理设备和图像处理方法
CN104217388A (zh) * 2014-01-22 2014-12-17 河南师范大学 一种基于fssvm的图像水印嵌入、提取的方法与装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003230001A (ja) * 2002-02-01 2003-08-15 Canon Inc 文書用電子透かし埋め込み装置及び文書用電子透かし抽出装置並びにそれらの制御方法
JP4164463B2 (ja) * 2003-06-03 2008-10-15 キヤノン株式会社 情報処理装置及びその制御方法
US8090146B2 (en) * 2009-01-15 2012-01-03 Google Inc. Image watermarking

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1945622A (zh) * 2006-10-25 2007-04-11 北京北大方正电子有限公司 一种数字水印嵌入与提取方法及装置
JP2010258627A (ja) * 2009-04-22 2010-11-11 Canon Inc 画像処理装置、画像処理方法、プログラム及び記憶媒体
CN102615972A (zh) * 2011-01-25 2012-08-01 佳能株式会社 图像处理设备和图像处理方法
CN104217388A (zh) * 2014-01-22 2014-12-17 河南师范大学 一种基于fssvm的图像水印嵌入、提取的方法与装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
"打印-扫描不变量结合双域的文本水印算法";姚寒冰等;《华中科技大学学报(自然科学版)》;第46卷(第6期);第122-127页 *
Watermark Embedding and Extraction Based on LSB and Four-Step Phase Shift Method;Xin Kuang et al.;《 Information Technology: IoT and Smart City》;243-247 *
基于JPEG压缩不变量和数字水印的图像认证方法;解皎虹;李诺;严浩;吴彦民;;现代电子技术(第21期);88-92 *
抗打印扫描攻击的大容量文本水印;郭承青;徐国爱;钮心忻;李洋;;应用科学学报(第02期);34-40 *

Also Published As

Publication number Publication date
CN111738898A (zh) 2020-10-02

Similar Documents

Publication Publication Date Title
CN111738898B (zh) 文本数字水印嵌入\提取方法及装置
Tkachenko et al. Two-level QR code for private message sharing and document authentication
Shih Digital watermarking and steganography: fundamentals and techniques
Wu et al. Data hiding in binary image for authentication and annotation
CN106529637B (zh) 一种二维码的防拷贝实现方法及实现系统
US7394573B1 (en) System for authenticating hardcopy documents
Wu et al. Multimedia data hiding
US8189863B1 (en) Watermarking digital documents
Tsai et al. Reversible data hiding and lossless reconstruction of binary images using pair-wise logical computation mechanism
US8595503B2 (en) Method of self-authenticating a document while preserving critical content in authentication data
Daraee et al. Watermarking in binary document images using fractal codes
CN1882026B (zh) 信息埋入网屏编码的生成方法
Fang et al. A camera shooting resilient watermarking scheme for underpainting documents
US20100142756A1 (en) Document security method
CN109190340A (zh) 一种网页数字水印生成、识别、打印方法及装置
Wu et al. SVD-based self-embedding image authentication scheme using quick response code features
Tan et al. Print-scan invariant text image watermarking for hardcopy document authentication
CN109190339A (zh) 一种网页数字水印图像生成、识别、打印方法及装置
Cu et al. A robust watermarking approach for security issue of binary documents using fully convolutional networks
Villán et al. Tamper-proofing of electronic and printed text documents via robust hashing and data-hiding
Kise et al. Backgrounds as information carriers for printed documents
Nguyen et al. Stable Messenger: Steganography for Message-Concealed Image Generation
Erlangga et al. Increasing Secret Data Hiding Capacity in QR Code Using Subcells
CN110648271A (zh) 一种使用特殊网点在半色调图像中嵌入数字水印的方法
Alexander et al. Secret sharing in visual cryptography using NVSS and data hiding techniques

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant