CN116127419A - 数据处理方法、数据识别方法、字体文件生成方法及装置 - Google Patents
数据处理方法、数据识别方法、字体文件生成方法及装置 Download PDFInfo
- Publication number
- CN116127419A CN116127419A CN202211227726.XA CN202211227726A CN116127419A CN 116127419 A CN116127419 A CN 116127419A CN 202211227726 A CN202211227726 A CN 202211227726A CN 116127419 A CN116127419 A CN 116127419A
- Authority
- CN
- China
- Prior art keywords
- data
- page
- block
- value
- blocks
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 95
- 238000003672 processing method Methods 0.000 title claims abstract description 17
- 238000009877 rendering Methods 0.000 claims abstract description 10
- 230000008569 process Effects 0.000 claims description 36
- 238000012545 processing Methods 0.000 claims description 30
- 238000010586 diagram Methods 0.000 claims description 26
- 230000015654 memory Effects 0.000 claims description 26
- 239000003086 colorant Substances 0.000 claims description 22
- 239000003550 marker Substances 0.000 claims description 22
- 238000004590 computer program Methods 0.000 claims description 12
- 230000004044 response Effects 0.000 claims description 4
- 230000009466 transformation Effects 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 3
- 239000007787 solid Substances 0.000 claims description 2
- 238000000638 solvent extraction Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002224 dissection Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/10—Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
- G06F21/16—Program or content traceability, e.g. by watermarking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Technology Law (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Editing Of Facsimile Originals (AREA)
- Storage Device Security (AREA)
Abstract
本申请实施方式提供了一种数据处理方法、数据识别方法、字体文件生成方法及装置。数据处理方法包括:在接收到针对目标页面的页面数据获取请求时,生成用于标识目标页面中文本数据的水印数据;构建字体文件;其中,字体文件包括多个表示文字或符号的字形图;至少一个字形图被划分为多个区块,依照区块排列顺序的各个区块的背景色用于表征水印数据;根据目标页面的页面数据和字体文件响应页面数据请求,字体文件用于渲染所述目标页面的页面数据中的文本数据,以使渲染后的文本数据包括所述水印数据。本申请可以提升水印数据的鲁棒性。
Description
技术领域
本申请涉及计算机数据处理领域,尤其涉及一种数据处理方法、数据识别方法、字体文件生成方法及装置。
背景技术
目前,随着互联网技术的发展,社会大众已经习惯于通过计算机设备浏览网页页面。网页页面可以向用户提供图片、视频或文字等内容资源。
为了保护内容资源的发布者的合法权益,可以在网页页面上设置数字水印。如此,可以通过数字水印追踪网页页面的内容资源是否被非法的转载。
现有技术中,通常将数字水印标记在一张图片中,并作为网页页面的背景之一。然而,通常网页页面中会包括的内容较多,可能导致具有数字水印的图片被其他图片覆盖。可能导致网页页面的内容资源无法得到有效的保护。
发明内容
本申请中多个实施方式提供一种数据处理方法、数据识别方法、字体文件生成方法及装置,可以提升水印数据的鲁棒性。
第一方面,本申请的一个实施方式提供一种数据处理方法,所述方法包括:
在接收到针对目标页面的页面数据获取请求时,生成用于标识所述目标页面中文本数据的水印数据;构建字体文件;其中,所述字体文件包括多个表示文字或符号的字形图;至少一个所述字形图被划分为多个区块,依照所述区块排列顺序的各个区块的背景色用于表征所述水印数据;根据所述目标页面的页面数据和所述字体文件响应所述页面数据请求,所述字体文件用于渲染所述目标页面的页面数据中的文本数据,以使所述渲染后的文本数据包括所述水印数据。
第二方面,本申请的一个实施方式提供一种数据识别方法,所述方法包括:
获取前述实施方式所述的渲染后的目标页面的页面图像;其中,所述页面图像包括文本区域;在所述文本区域中确定标记像素;其中,所述文本区域中包括所述标记像素的文字或符号所在区域为目标区域;将所述目标区域的像素划分至包括多个区块的指定网格;其中,所述指定网格的多个区块与所述字形图的多个区块相对应;所述指定网格的每个区块对应多个所述目标区域的像素;根据每个区块对应的像素为所述每个区块设置区块取值,按照所述多个区块的排列顺序的所述多个区块的区块取值表示所述水印数据;其中,所述多个区块中,包括所述标记像素的区块的区块取值为第一取值,不包括所述标记像素的区块的区块取值为第二取值;其中,所述第一取值和所述第二取值不同。
第三方面,本申请的一个实施方式提供一种字体文件生成方法,包括:
生成水印数据;生成包括多个区块的字形网格;其中,所述字形网格承载有表示文字或符号的字形;根据所述水印数据为所述字形网格的多个区块设置背景色,得到字体文件;其中,依照所述多个区块排列顺序的各个区块的背景色用于表征所述水印数据。
第四方面,本申请的一个实施方式提供一种数据处理装置,包括:
水印生成单元,用于在接收到针对目标页面的页面数据获取请求时,生成用于标识所述目标页面中文本数据的水印数据;构建单元,用于构建字体文件;其中,所述字体文件包括多个表示文字或符号的字形图;至少一个所述字形图被划分为多个区块,依照所述区块排列顺序的各个区块的背景色用于表征所述水印数据;响应单元,用于根据所述目标页面的页面数据和所述字体文件响应所述页面数据请求,所述字体文件用于渲染所述目标页面的页面数据中的文本数据,以使所述渲染后的文本数据包括所述水印数据。
第五方面,本申请的一个实施方式提供一种数据识别装置,包括:
获取单元,用于获取前述实施方式所述的渲染后的目标页面的页面图像;其中,所述页面图像包括文本区域;标记像素确定单元,用于在所述文本区域中确定标记像素;其中,所述文本区域包括所述标记像素的文字或符号作为目标区域;划分单元,用于将所述目标区域的像素划分至包括多个区块的指定网格;其中,所述指定网格的多个区块与所述字形图的多个区块相对应;所述指定网格的每个区块对应多个所述目标区域的像素;取值设置单元,用于根据每个区块对应的像素为所述每个区块设置区块取值,按照所述多个区块的排列顺序的所述多个区块的区块取值表示所述水印数据;其中,所述多个区块中,包括所述标记像素的区块的区块取值为第一取值,不包括所述标记像素的区块的区块取值为第二取值;其中,所述第一取值和所述第二取值不同。
第六方面,本申请的一个实施方式提供一种字体文件生成装置,包括:
数据生成单元,用于生成水印数据;网格生成单元,用于生成包括多个区块的字形网格;其中,所述字形网格承载有表示文字或符号的字形;设置单元,用于根据所述水印数据为所述字形网格的多个区块设置背景色,得到字体文件;其中,依照所述多个区块排列顺序的各个区块的背景色用于表征所述水印数据。
第七方面,本申请的一个实施方式提供一种一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现前述任一实施方式所述的数据处理方法、前述任一实施方式所述的数据识别方法以及前述任一实施方式所述的字体文件生成方法。
第八方面,本申请的一个实施方式提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现前述任一实施方式所述的数据处理方法、前述任一实施方式所述的数据识别方法以及前述任一实施方式所述的字体文件生成方法。
本申请提供的多个实施方式,在字体文件的字形图中,采用区块的背景色表示水印数据。采用该字体文件的页面数据被渲染之后,由于通常情况下页面中的文本数据都不会被覆盖,而文本数据采用了所述字体文件,使得文本数据隐藏了水印数据,且水印数据在被页面中不会被覆盖。如此,实现可以有效减少页面的水印数据被覆盖,带来的水印数据丢失问题。
附图说明
图1为本申请的一个实施方式提供的页面数据处理系统的示意图。
图2为本申请的一个实施方式提供的数据处理方法的流程示意图。
图3为本申请的一个实施方式提供的字形网格的示意图。
图4为本申请的一个实施方式提供的字形网格中区块设置水印数据的示意图。
图5为本申请的一个实施方式提供的字形网格中区块对应水印数据设置背景色的示意图。
图6为本申请的一个实施方式提供的数据识别方法的流程示意图。
图7为本申请的一个实施方式提供的字体文件生成方法的流程示意图。
图8为本申请的一个实施方式提供的数据处理装置的模块示意图。
图9为本申请的一个实施方式提供的数据识别装置的模块示意图。
图10为本申请的一个实施方式提供的字体文件生成装置的模块示意图。
图11为本申请的一个实施方式提供的一种计算机设备的架构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应理解,这样使用的数据在适当的情况下可以互换,以便本申请实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,本申请和权利要求书中“和/或”表示所连接对象的至少其中之一,字符“/”一般表示前后关联对象是一种“或”的关系。
数字水印是将特定的数据信息嵌入数字产品中,以保护版权的完整性、防复制或去向追踪的技术。
具体的,例如,针对一些页面中的内容资源,添加水印数据。常见的是在图像的边缘区域,添加水印数据,使得图像被转载时,会在被转载后的页面显示图像时,图像带着水印数据。该水印数据可以表明图像的来源,具体的,例如,水印数据可以是“XXX制作”。针对一些文章,由于主要构成为文字,会采用将文字与图像相结合,在图像中增加水印数据。或者,在页面渲染时,直接将文字渲染在一张图像中,进而可以在包括文本区域的图像中添加水印数据即可。这些水印数据通常会比较直观的显示在图像上。
然而,相关技术的水印数据容易发生丢失。具体的,例如,页面中存在多个图像,多个图像之间可能发生一定的层叠,而将水印数据覆盖。在一些情况下,将图像转载的一方,也可能发现图像上存在水印数据之后,对图像进行编辑之后再发布。例如,针对图像进行截图,去除水印数据。
因此,有必要提供一种可以提升水印数据的鲁棒性的技术方案。
请参阅图1。本申请实施方式提供一种页面数据处理系统。所述页面数据处理系统可以包括客户端和服务器。所述客户端可以是具有网络访问能力的计算机设备。具体的,例如,客户端可以是台式电脑、平板电脑、笔记本电脑、智能手机、数字助理、智能可穿戴设备、导购终端、电视机、智能音箱、麦克风等。其中,智能可穿戴设备包括但不限于智能手环、智能手表、智能眼镜、智能头盔、智能项链等。或者,客户端也可以为能够运行于所述计算机设备中的软件。服务器可以是具有一定运算处理能力的计算机设备。其可以具有网络通信模块、处理器和存储器等。当然,所述服务器也可以是指运行于所述计算机设备中的软体。所述服务器可以为分布式服务器,可以是具有多个处理器、存储器、网络通信模块等协同运作的系统。或者,服务器还可以为若干服务器形成的服务器集群。或者,随着科学技术的发展,服务器还可以是能够实现说明书实施方式相应功能的新的技术手段。例如,可以是基于量子计算实现的新形态的“服务器”。
在本申请提供的数据处理方法中,客户端向服务器发送针对目标页面的数据获取请求时,服务器在接收到该数据获取请求后,先生成用于标识目标页面中文本数据的水印数据,再构建字体文件,字体文件包括字形图,字形图中隐藏了水印数据,然后服务器再将目标页面的页面数据和字体文件发送给客户端,以响应客户端发送的页面数据请求,客户端在接收到页面数据和字体文件后,使用字体文件来渲染页面数据中的文本数据,从而得到了在文本数据中隐藏有水印数据的页面数据,如此,实现了对目标页面的产权保护。
请参阅图2。本申请的一个实施方式提供一种数据处理方法。所述数据处理方法可以应用于服务器。所述数据处理方法可以包括以下步骤。
步骤S101:在接收到针对目标页面的页面数据获取请求时,生成用于标识所述目标页面中文本数据的水印数据。
用户可以操作客户端向服务器发送页面数据获取请求,以向服务器指示需要访问的页面。页面数据获取请求中可以具有目标页面的访问地址,或者,访问标识。如此,服务器接收到页面数据获取请求之后,便可以确定页面数据获取请求指向的目标页面,进而可以准备目标页面的页面数据。
在本实施方式中,水印数据可以用于标识目标页面中的文本数据。使得,文本数据在被转载的情况下,可以通过水印数据进行追踪,以及确定文本数据的版权归属等。
水印数据可以作为文本数据的整体标识,二者之间存在对应关系。如此,获得水印数据之后,便可以根据水印数据确定所标识的文本数据。水印数据可以是在基础信息的基础上采用算法生成的数值序列。在一些实施方式中,水印数据的基础信息可以包括:基于文本数据的版权归属方的用户信息;或,文本数据的内容;或,发出所述页面数据获取请求的请求方的用户信息。该数值序列可以具有预设的长度。在一些实施方式中,优选的,数值序列可以是二进制数值序列。数值序列的长度可以为2个字节、3个字节或4个字节等等。
生成水印数据的算法可以包括哈希函数。具体的,例如,生成水印数据的算法可以为加密散列函数。例如,信息摘要算法。
步骤S102:构建字体文件;其中,所述字体文件包括多个表示文字或符号的字形图;至少一个所述字形图被划分为多个区块,依照所述区块排列顺序的各个区块的背景色用于表征所述水印数据。
在本实施方式中,可以针对目标页面的文本数据构建字体文件。所述字体文件表示的字体可是矢量字体。如此,所述字体文件便可以可应用与目标页面。字体文件中可以包括表示文字或符号的字形图。具体的,图形图中可以有表示文字或符号的字形。其中,文字可以为任意语种的文字。文字可以包括但不限于中文、英文或拉丁文等。符号可以为任意采用输入法输入的符号。具体的,符号可以包括但不限于数学符号、标点符号等等。如此,在目标页面被展示时,就会使用所述字体文件展示相应的文本数据。本实施方式中,将水印数据隐含在字体文件的字形图中,使得目标页面可以显示目标页面的文本数据。通常情况下,目标页面中的文本数据需要展示给读者,因此不会被任何图形、符号或网页中的其他元素覆盖或遮挡,因此将水印数据隐藏在网页的文本数据中时,水印数据也会得到正常展示,从而实现了在目标页面中保留水印数据。
在一些实施方式中,字形图中区块的背景具有较高的透明度,如此,使用所述字体文件展示文本数据时,降低了为字形图的区块设置背景色给最终显示效果带来的影响。
在一些实施方式中,字形图中区块的数量可以与表示水印数据的数值序列的长度相对应。具体的,例如,区块的数量可以为64个,数值序列的长度也可以为64位。当然,区块的数量与数值序列的长度也可以不同。具体的,例如,区块的数量可以为128个,而数值序列的长度为64位。
在一些实施方式中,字体文件中包括的多个表示文字或符号的字形图通过以下方式获取:生成包括多个区块的字形网格;根据所述水印数据为所述字形网格的多个区块设置背景色;向设置背景色后的字形网格添加表示文字或符号的字形,得到字形图,所述表示文字或符号的字形为基于所述目标页面的文本数据确定的。具体的,例如,可以参阅图3、图4和图5。可以构建粒度为256*256像素的字形图。字形图可以依照像素的坐标(0,0)开始,依次创建32*32像素的区块,共得到64个区块。可以分别针对每个区块设置背景色。在一些实施方式中,水印数据的数值序列中可以具有多个数值,每个数值可以对应区块的一个背景色。如此,依照区块和数值序列的排列顺序,对应数值序列的数值为区块设置背景色。具体的,例如,水印数据的数值序列为二进制数值序列,其中,数值1对应的背景色可以设置为#00000001或#FFFFFF01,数值0对应的背景色可以设置为#00000003。当然,也可以仅仅针对数值1对应的区块设置背景色,而维持数值0对应的区块的背景色不变。
在一些实施方式中,字体文件中可以包括有多个字形图,不同字形图可以承载不同的文字或符号。可以针对每个字形图都划分区块,以及对应水印数据设置区块的背景色。也可以仅仅针对多个字形图中的部分字形图划分区块,以及对应水印数据设置区块的背景色。在一些实施方式中,优先选择所述目标页面中的文本数据对应的字形图划分区块,以及对应水印数据设置区块的背景色。在本实施方式中,表示文字或符号的字形为基于所述目标页面的文本数据确定的。即,字形表示的文字或符号是所述文本数据所包括的文字或符号。如此,在最终显示的目标页面的文本数据中,可以具有携带有水印数据的字形图。进而,使得在目标页面中可以显示出水印数据。
步骤S103:根据所述目标页面的页面数据和所述字体文件响应所述页面数据请求,所述字体文件用于渲染所述目标页面的页面数据中的文本数据,以使所述渲染后的文本数据包括所述水印数据。
可以将所述页面数据和字体文件作为页面获取请求的响应数据,发送给发出所述页面获取请求的客户端。如此,使得客户端在显示所述目标页面时,在渲染页面数据的过程中,针对文本数据采用所述字体文件。如此,在最终显示的目标页面中的文本数据中,已经包括了水印数据。
本实施方式中,通过巧妙的将水印数据隐含在字体文件中的多个字形图中,并用字体文件来渲染目标页面中的文本数据,由于利用了页面中通常不会将文字进行覆盖的特性,使得页面的文本数据中隐藏的水印数据也不会被这样,如此,减少了水印数据被覆盖或者丢失的几率。此外,为了保护作者的版权,通常在初始发布的页面中,可以将文本数据渲染为页面中的图像。如此,带有水印数据的文本数据作为图像的一部分,在该文本数据被其他网页或网站转载的情况下,也会携带水印数据一同被转载。可见,本实施方式提供的数据处理方法中,目标页面的水印数据不容易丢失或被覆盖,提升了水印数据的鲁棒性。
在一些实施方式中,生成用于标识所述目标页面中文本数据的水印数据,包括:获取用户信息;其中,所述用户信息包括发布所述目标页面的用户的用户信息,和/或,发出所述页面数据获取请求的用户的用户信息;根据所述用户信息生成标识码,其中,所述标识码作为所述水印数据。
在一些情况下,水印数据可以基于用户信息生成,用户信息可以包括发布目标页面的用户的用户信息,和/或,发出页面数据获取请求的用户的用户信息。具体的,水印数据可以基于发布目标页面的用户的用户信息生成。如此,在目标页面中的文本数据被转载之后,通过在转载页面中识别出水印数据,便可以得出转载页面的版权归属。水印数据可以基于发出页面数据获取请求的用户的用户信息生成。如此,在转载页面中识别出水印数据,便可以通过水印数据确定最初从目标页面进行转载的用户的用户信息,可以便于对转载行为的追踪。
标识码可以用于与目标页面的文本数据相对应,并标识所述文本数据。标识码可以根据用户信息生成。不同页面的文本数据可以对应有不同的标识码。具体的,生成标识码的算法可以包括单向散列函数。具体的,例如,生成标识码的算法可以为加密散列函数。例如,信息摘要算法。
在一些实施方式中,所述水印数据为包括第一数值和/或第二数值的数值序列;其中,所述第一数值与所述第二数值不同;所述根据所述水印数据为所述字形网格的多个区块设置背景色,包括:依照所述字形网格中各个区块的排列顺序,依次读取所述数值序列中的各个数值,其中,每个数值对应一个区块;根据所述各个区块的数值,为所述各个区块设置背景色,其中,数值为第一数值的区块具有第一背景色,数值为第二数值的区块具有第二背景色。
在一些情况下,如果水印数据包括的数值较多,可能需要针对区块设置多种背景色。相对来说,增加了一些复杂度。
本实施方式中,表示水印数据的数值序列中的数值可以包括第一取值和/或第二取值。具体的,例如,数值序列可以为二进制数值序列。所述第一取值可以为1,所述第二取值可以为0。如此,可以对应于取值1和0,对应区块的背景色不同,便可以通过字形图中区块表示所述水印数据。具体的,例如,第一取值和第二取值对应的颜色不同。
在一些情况下,可以顺次读取所述数值序列的数据位的取值,为区块设置背景色;其中,所述第一数值和所述第二数值分别对应的区块的背景色不同。可以仅仅针对第一取值和第二取值中的一个取值,明确设置对应的颜色,另一个取值,可以维持原字形图区块的状态不变。如此,便已经可以通过字形图的区块颜色进行区分出第一取值和第二取值。当然,也可以针对第一取值和第二取值,分别设置对应的颜色。在一些实施方式中,例如,第一背景色可以设置为#00000001或#FFFFFF01,第二背景色可以设置为#00000003。
请参阅图6。本申请实施方式还提供一种页面数据识别方法。所述页面数据识别方法可以应用于服务器。所述页面数据识别方法可以包括以下步骤。
步骤S201:获取如前述任意实施方式所述的渲染后的目标页面的页面图像;其中,所述页面图像包括文本区域。
在一些情况下,如果仅仅获取页面图像中文本区域的文本数据,并放置到其他编辑页面时,所使用的字体文件可能会发生改变。此时,隐藏在页面的文字或符号中的水印数据可能已经丢失。所以,需要获取页面的页面图像,以维持页面显示的内容状态。将页面图像进行基准,进一步识别出水印数据。
在本实施方式中,获取目标页面的页面图像的方式,可以采用下载页面数据之后,将页面数据转换为页面图像。还可以为针对指定的页面,获得页面数据之后,将页面数据转换为页面图像。
在本实施方式中,页面图像中的文本区域可以显示有文字或符号。具体的,例如,文本区域可以是指页面图像中显示有文章的部分。
步骤S202:在所述文本区域中确定标记像素;其中,所述文本区域中包括所述标记像素的文字或符号作为目标区域。
在本实施方式中,在文字或符号的字形图中隐藏了水印数据。在一些情况下,可能仅仅针对一部分文字或符号的字形图添加了水印数据。所以,需要首先在文本区域中确定标记像素,进而进一步从包括标记像素的文字或符号中解析出水印数据。
标记像素可以用于表示该部分像素隐含了水印数据。如此,可以进一步根据标记像素得到水印数据。在一些实施方式中,可以采用先确定标记像素的位置的方式,再进一步确定目标区域。具体的,例如,在页面渲染时,文字或符号会采用特定的字体文件,使得文字或符号的字形图中通过区块的背景色表示水印数据。可以将包括标记像素的文字或符号作为目标区域。具体的,例如,每个包括了标记像素的文字或符号,都可以独立作为一个目标区域。当然,在一些情况下,连续的多个文字或符号的像素中,都包含了标记像素,此时,也可以将该多个文字或符号整体作为目标区域。
在最终渲染出的页面中,该部分隐含水印数据的字形图对应的文字或符号的像素值会与未隐含水印数据的字形图对应的文字或符号的像素值存在差异。具体的,例如,隐含水印数据的字形图在渲染到页面时,字形图的区块的背景色会与页面中背景的背景色出现一定叠加,导致实质上渲染得到页面中,发生区块的背景色与页面的背景色相叠加的像素值,与未发生叠加的像素值存在差异。可以利用这种差异,确定出标记像素。进一步的,在确定标记像素之后,可以将包括标记像素的文字或符号,确定为目标区域。目标区域中包括所述标记像素,和一部分非标记像素。在一些实施方中,目标区域可以用于与前述实施方式中的字形网格整体具有相似或相同的形状。
在一些实施方式中,在所述文本区域中确定标记像素,可以包括:针对所述页面图像进行灰度处理,得到所述页面图像的灰度图;以所述页面图像的灰度图的背景灰度作为基准,对所述页面图像进行二值化处理,得到第一过程图;以所述文本区域中文字或符号的灰度作为基准,对所述页面图像进行二值化处理,得到第二过程图;将所述第一过程图和所述第二过程图中具有相同坐标,且具有不同灰度值的像素作为所述标记像素。
在一些实施方式中,可以先针对所述页面图像进行灰度处理,得到所述页面图像的灰度图。进而可以在所述页面图像的灰度图的文本区域中确定目标区域。
在本实施方式中,所述页面图像的背景色可以为纯色。可以以所述页面图像的灰度图的背景灰度作为基准,对所述页面图像的灰度图进行二值化处理,得到第一过程图。以所述文本区域中文字或符号的灰度作为基准,对所述页面图像的灰度图进行二值化处理,得到第二过程图。将所述第一过程图和所述第二过程图中具有相同坐标,且具有不同灰度值的像素作为所述标记像素,以及所述标记像素所处于的区域作为所述目标区域。
在本实施方式中,首先将页面图像进行灰度处理。如此,使得进一步运算可以基于灰度图中的灰度值。如此,降低了运算的复杂度。
在本实施方式中,通过分别基于页面图像的背景灰度,以及文字或符号的灰度,对页面图像进行二值化处理,得到第一过程图和第二过程图。第一过程图和第二过程图中的像素的灰度值均可以包括第一灰度值和第二灰度值,且所述第一灰度值与所述第二灰度值不相同。第一过程图中,以页面图像的背景灰度的灰度值为基准灰度值,当一个像素的灰度值等于所述基准灰度值,此时第一过程图与所述像素相对应的灰度值可以为所述第一像素值。当一个像素的灰度值不等于所述基准灰度值,此时所述第一过程图中与所述像素相对应的灰度值可以为所述第二灰度值。由于,隐含了水印数据的字形图在渲染到页面时,字形图中区块的背景色会与页面图像的背景色发生叠加。因此,在以页面图像的背景灰度作为基准,进行二值化处理时,隐含了水印数据的字形图中,字形图的至少部分背景,会被认定为为非页面图像的背景,在第一过程图相应部分的像素的灰度值为所述第二灰度值。
第二过程图以文本区域中文字或符号的灰度作为基准。第二过程图中,会维持页面图像中的文字或符号,即该部分像素的灰度值可以为第二灰度值,并将隐含有水印数据的字形图的背景与整个页面图像的背景处理成相同颜色。即第二过程图的背景部分的像素的灰度值为第二灰度值。
如此,通过对第一过程图和第二过程图的灰度值比较,便可以得出,第一过程图与第二过程图存在部分灰度值不同。这部分不同灰度值,是由于隐含了水印数据的字形图的区块背景色导致的。该第一过程图与第二过程图中,具有相同坐标,但不同灰度值的像素即为所述标记像素。
在一些实施方式中,在所述文本区域中确定标记像素,可以包括:获取所述页面图像对应的原始图;其中,所述原始图中的文本区域中不具有所述水印数据;将所述页面图像与所述原始图进行对比,确定所述页面图像中的标记像素;其中,所述标记像素为所述页面图像与所述原始图中具有相同坐标但像素值不同的像素。
在本实施方式中,原始图可以为所述页面图像对应的不具有水印数据的图像。具体的,例如,可以获取一个初始字体文件,该初始字体文件中的字形图可以不划分区块,并且,初始字体文件中字形图中的字形,与前述实施方式中的字体文件中划分区块的字形图中字形相同。根据该初始字体文件渲染页面数据。如此,渲染后的页面的页面图像作为原始图,所述原始图不具有水印数据。
可以将所述页面图像与所述原始图进行对比,得出页面图像中的标记像素。具体的,例如,可以将所述页面图像与所述原始图进行逐像素对比,将所述页面图像中与所述原始图之间像素值不同的像素,作为标记像素。
步骤S203:将所述目标区域的像素划分至包括多个区块的指定网格;其中,所述指定网格的多个区块与所述字形图的多个区块相对应;所述指定网格的每个区块对应多个所述目标区域的像素。
在本实施方式中,确定目标区域之后,可以明确目标区域中的文字或符号的背景中具有标记像素。也可以理解为,所述文字或符号所处的文本数据被初次渲染成页面时,所述文字或符号被渲染使用的字体文件中至少部分字形图被划分为多个区块,所述多个区块的背景色依照排列顺序表示水印数据。目标区域中所述水印数据对应的像素为所述标记像素。
可以通过构建指定网格,以模拟字形图的多个区块。指定网格包括的多个区块可以与字形图的多个区块相对应。如此,将指定网格与目标区域之间进行对比。使得目标区域的像素可以按照尺寸的比例,划分至指定网格的区块中。在一些实施方式中,可以针对目标区域的尺寸可以进行放大或缩小,以使得目标区域的尺寸与指定网格相匹配。
在一些实施方式中,将目标区域的像素划分至指定网格,可以理解为,将目标区域与所述指定网格相层叠在一起。使得,通过指定网格将所述目标区域划分多个区块。在一些实施方式中,还可以为将指定网格映射至所述目标区域,如此实现目标区域的像素被划分至指定网格的区块中。当然,也可以将目标区域的像素向所述指定网格进行映射,将像素划分至指定网格的区块中。
在一些实施方式中,所述将所述目标区域的像素划分至指定网格,可以包括:对所述目标区域进行变换操作以使所述目标区域的尺寸与所述指定网格的尺寸相匹配;依照所述目标区域的像素在所述指定网格的投影,确定所述目标区域的像素与所述指定网格的区块的对应关系。
在本实施方式中,对所述目标区域进行变换操作以使所述目标区域的尺寸与所述指定网格的尺寸相匹配。具体的,例如,指定网格可以具有网格粒度。可以首先计算目标区中中文字的尺寸与网格粒度的比值。具体的,例如,对应每个文字可以构建正方形区域,网格粒度可以为边长为256个像素的区块。该正方形区域变成与所述网格粒度之间的比值可以为N,进一步的,针对标记像素的坐标,分别除以N,以变更标记像素的坐标。进一步的,标记像素具有起始坐标和结束坐标,可以将起始坐标与所述比值N相除的结果向上取整,将结束坐标与所述比值N相除的结果向下取值。如此,标记像素调整后的起始坐标和结束坐标之间围成的区域可以用于定位所述指定网格。
步骤S204:根据每个区块对应的像素为所述每个区块设置区块取值,按照所述多个区块的排列顺序的所述多个区块的区块取值表示所述水印数据;其中,所述多个区块中,包括所述标记像素的区块的区块取值为第一取值,不包括所述标记像素的区块的区块取值为第二取值;其中,所述第一取值和所述第二取值不同。
在本实施方式中,标记像素可以是用于表示水印数据中第一取值的像素。将目标区域的像素划分至区块之后,便可以明确标记像素所处的区块。可以根据区块是否包括标记像素,确定每个区块对应的区块取值。其中,可以将包括标记像素的区块的区块取值设置为第一取值,将没有包括标记像素的区块的区块取值设置为第二取值。其中,所述第一取值可以为1,第二取值可以为0。如此,依照区块的排列顺序,区块取值形成一个二进制数值序列。该二进制数值序列可以用于表示水印数据。当然,在一些实施方式中,也可以为第一取值为0,第二取值为1,具体的可以根据具体实现方式设置。
在一些实施方式中,可以针对二进制数值序列进行进一步的转换,得出所述二进制数据表达的水印数据。通过水印数据可以进一步明确用户信息。如此,可以进一步明确页面图像中文本区域中的文字或符号的版权归属。
请参阅图7。在一些实施方式中,本申请实施方式还提供一种字体文件生成方法。所述字体文件生成方法可以应用于服务器。所述字体文件生成方法可以包括以下步骤。
步骤S301:生成水印数据。
步骤S302:生成包括多个区块的字形网格;其中,所述字形网格承载有表示文字或符号的字形。
步骤S303:根据所述水印数据为所述字形网格的多个区块设置背景色,得到字体文件;其中,依照所述多个区块排列顺序的各个区块的背景色用于表征所述水印数据。
在本实施方式中,可以通过字体文件的字形网格隐藏水印数据。如此,使用该字体文件的文本数据,都可以携带水印数据。如此,提升了添加水印数据的便捷性。再者,本实施方式中的水印数据应用于文本数据之后,水印数据具有较好的鲁棒性。
在本实施方式中,字形网格中可以作为文字或符号的字形的载体。如此,设置背景色的多个区块可以作为字形的背景。在一些实施方式中,背景色可以为较浅的颜色。再者,字形图的背景可以具有较好的透明度。如此,可以减少依照所述字体文件渲染的页面中,应用所述字体文件的字体或符号中区块的背景色对整个页面视觉效果的影响。
本实施方式提供的字体文件,可以应用于多个页面。如此,便于针对多个页面添加水印数据。在一些实施方式中,字体文件的水印数据可以根据内容资源的创作者的用户信息生成。如此,水印数据可以用于表示创作者的用户信息,并可以标识所述创作者创作的文本数据。
请参阅图8,图8为本申请的一个实施方式还提供一种数据处理装置,包括:水印生成单元,用于在接收到针对目标页面的页面数据获取请求时,生成用于标识所述目标页面中文本数据的水印数据;构建单元,用于构建字体文件;其中,所述字体文件包括多个表示文字或符号的字形图;至少一个所述字形图被划分为多个区块,依照所述区块排列顺序的各个区块的背景色用于表征所述水印数据;响应单元,用于根据所述目标页面的页面数据和所述字体文件响应所述页面数据请求,所述字体文件用于渲染所述目标页面的页面数据中的文本数据,以使所述渲染后的文本数据包括所述水印数据。
在一些实施方式中,水印生成单元可以包括:获取模块,用于获取用户信息;其中,所述用户信息包括发布所述目标页面的用户的用户信息,和/或,发出所述页面数据获取请求的用户的用户信息;标识码生成模块,用于根据所述用户信息生成标识码,其中,所述标识码作为所述水印数据。
在一些实施方式中,所述构建单元可以包括:网格生成模块,用于生成包括多个区块的字形网格;背景色设置模块,用于根据所述水印数据为所述字形网格的多个区块设置背景色;添加模块,用于向设置背景色后的字形网格添加表示文字或符号的字形,得到字形图,所述表示文字或符号的字形为基于所述目标页面的文本数据确定的。
在一些实施方式中,所述水印数据为包括第一数值和/或第二数值的数值序列;其中,所述第一数值与所述第二数值不同。背景色设置单元可以包括:数值读取模块,用于依照所述字形网格中各个区块的排列顺序,依次读取所述数值序列中的各个数值,其中,每个数值对应一个区块;背景色设置模块,用于根据所述各个区块的数值,为所述各个区块设置背景色,其中,数值为第一数值的区块具有第一背景色,数值为第二数值的区块具有第二背景色。
请参阅图9,图为本申请实施方式还提供一种数据识别装置,包括:获取单元,用于获取如前述任意实施方式所述的渲染后的目标页面的页面图像;其中,所述页面图像包括文本区域;标记像素确定单元,用于在所述文本区域中确定标记像素;其中,所述文本区域包括所述标记像素的文字或符号作为目标区域;划分单元,用于将所述目标区域的像素划分至包括多个区块的指定网格;其中,所述指定网格的多个区块与所述字形图的多个区块相对应;所述指定网格的每个区块对应多个所述目标区域的像素;取值设置单元,用于根据每个区块对应的像素为所述每个区块设置区块取值,按照所述多个区块的排列顺序的所述多个区块的区块取值表示所述水印数据;其中,所述多个区块中,包括所述标记像素的区块的区块取值为第一取值,不包括所述标记像素的区块的区块取值为第二取值;其中,所述第一取值和所述第二取值不同。
在一些实施方式中,标记像素确定单元可以包括:灰度处理模块,用于针对所述页面图像进行灰度处理,得到所述页面图像的灰度图;第一处理模块,用于以所述页面图像的灰度图的背景灰度作为基准,对所述页面图像进行二值化处理,得到第一过程图;第二处理模块,用于以所述文本区域中文字或符号的灰度作为基准,对所述灰度图进行二值化处理,得到第二过程图;比较模块,用于将所述第一过程图和所述第二过程图中具有相同坐标,且具有不同灰度值的像素作为所述标记像素。
在一些实施方式中,区域确定单元可以包括:获取模块,用于获取所述页面图像对应的原始图;其中,所述原始图中的文本区域中不具有所述水印数据;对比模块,用于将所述页面图像与所述原始图进行对比,确定所述页面图像中的标记像素;其中,所述标记像素为所述页面图像与所述原始图中具有相同坐标但像素值不同的像素。
在一些实施方式中,划分单元可以包括:匹配模块,用于对所述目标区域进行变换操作以使所述目标区域的尺寸与所述指定网格的尺寸相匹配;确定模块,用于依照所述目标区域的像素在所述指定网格的投影,确定所述目标区域的像素与所述指定网格的区块的对应关系。
请参阅图10,图10为本申请实施方式还提供一种字体文件生成装置,包括:数据生成单元,用于生成水印数据;网格生成单元,用于生成包括多个区块的字形网格;其中,所述字形网格承载有表示文字或符号的字形;设置单元,用于根据所述水印数据为所述字形网格的多个区块设置背景色,得到字体文件;其中,依照所述多个区块排列顺序的各个区块的背景色用于表征所述水印数据。
请参阅图11,图11为本申请实施方式还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一实施方式所述的方法。
本申请实施方式还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被计算机执行时使得,该计算机执行上述任一实施方式所述的方法。
本申请实施方式还提供一种包含指令的计算机程序产品,该指令被计算机执行时使得计算机执行上述任一实施方式所述的方法。
可以理解,本文中的具体的例子只是为了帮助本领域技术人员更好地理解本申请实施方式,而非限制本发明的范围。
可以理解,在本申请中的各种实施方式中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施方式的实施过程构成任何限定。
可以理解,本申请中描述的各种实施方式,既可以单独实施,也可以组合实施,本申请实施方式对此并不限定。
除非另有说明,本申请实施方式所使用的所有技术和科学术语与本申请的技术领域的技术人员通常理解的含义相同。本申请中所使用的术语只是为了描述具体的实施方式的目的,不是旨在限制本申请的范围。本申请所使用的术语“和/或”包括一个或多个相关的所列项的任意的和所有的组合。在本申请实施方式和所附权利要求书中所使用的单数形式的“一种”、“上述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
可以理解,本申请实施方式的处理器可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法实施方式的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、数字信号处理器(DigitalSignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施方式中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施方式所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
可以理解,本申请实施方式中的存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM)、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasable PROM,EPROM)、电可擦除可编程只读存储器(EEPROM)或闪存。易失性存储器可以是随机存取存储器(RAM)。应注意,本文描述的系统和方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
本领域普通技术人员可以意识到,结合本文中所公开的实施方式描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施方式中的对应过程,在此不再赘述。
在本申请所提供的几个实施方式中,应所述理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
另外,在本申请各个实施方式中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者所述技术方案的部分可以以软件产品的形式体现出来,所述计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施方式所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM)、随机存取存储器(RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (16)
1.一种数据处理方法,其特征在于,所述方法包括:
在接收到针对目标页面的页面数据获取请求时,生成用于标识所述目标页面中文本数据的水印数据;
构建字体文件;其中,所述字体文件包括多个表示文字或符号的字形图;至少一个所述字形图被划分为多个区块,依照所述区块排列顺序的各个区块的背景色用于表征所述水印数据;
根据所述目标页面的页面数据和所述字体文件响应所述页面数据请求,所述字体文件用于渲染所述目标页面的页面数据中的文本数据,以使所述渲染后的文本数据包括所述水印数据。
2.根据权利要求1所述的方法,其特征在于,所述生成用于标识所述目标页面中文本数据的水印数据,包括:
获取用户信息;其中,所述用户信息包括发布所述目标页面的用户的用户信息,和/或,发出所述页面数据获取请求的用户的用户信息;
根据所述用户信息生成标识码,其中,所述标识码作为所述水印数据。
3.根据权利要求1所述的方法,其特征在于,所述字体文件中包括的多个表示文字或符号的字形图通过以下方式获取:
生成包括多个区块的字形网格;
根据所述水印数据为所述字形网格的多个区块设置背景色;
向设置背景色后的字形网格添加表示文字或符号的字形,得到字形图,所述表示文字或符号的字形为基于所述目标页面的文本数据确定的。
4.根据权利要求3所述的方法,其特征在于,所述水印数据为包括第一数值和/或第二数值的数值序列;其中,所述第一数值与所述第二数值不同;所述根据所述水印数据为所述字形网格的多个区块设置背景色,包括:
依照所述字形网格中各个区块的排列顺序,依次读取所述数值序列中的各个数值,其中,每个数值对应一个区块;
根据所述各个区块的数值,为所述各个区块设置背景色,其中,数值为第一数值的区块具有第一背景色,数值为第二数值的区块具有第二背景色。
5.一种数据识别方法,其特征在于,所述方法包括:
获取如权利要求1所述的渲染后的目标页面的页面图像;其中,所述页面图像包括文本区域;
在所述文本区域中确定标记像素;其中,所述文本区域中包括所述标记像素的文字或符号所在区域为目标区域;
将所述目标区域的像素划分至包括多个区块的指定网格;其中,所述指定网格的多个区块与所述字形图的多个区块相对应;所述指定网格的每个区块对应多个所述目标区域的像素;
根据每个区块对应的像素为所述每个区块设置区块取值,按照所述多个区块的排列顺序的所述多个区块的区块取值表示所述水印数据;其中,所述多个区块中,包括所述标记像素的区块的区块取值为第一取值,不包括所述标记像素的区块的区块取值为第二取值;其中,所述第一取值和所述第二取值不同。
6.根据权利要求5所述的方法,其特征在于,所述在所述文本区域中确定标记像素,包括:
针对所述页面图像进行灰度处理,得到所述页面图像的灰度图;
以所述页面图像的灰度图的背景灰度作为基准,对所述页面图像进行二值化处理,得到第一过程图;
以所述文本区域中文字或符号的灰度作为基准,对所述灰度图进行二值化处理,得到第二过程图;
将所述第一过程图和所述第二过程图中具有相同坐标,且具有不同灰度值的像素作为所述标记像素。
7.根据权利要求6所述的方法,其特征在于,所述页面图像的背景色为纯色。
8.根据权利要求5所述的方法,其特征在于,在所述文本区域中确定标记像素,包括:
获取所述页面图像对应的原始图;其中,所述原始图中的文本区域中不具有所述水印数据;
将所述页面图像与所述原始图进行对比,确定所述页面图像中的标记像素;其中,所述标记像素为所述页面图像与所述原始图中具有相同坐标但像素值不同的像素。
9.根据权利要求5所述的方法,其特征在于,所述将所述目标区域的像素划分至指定网格,包括:
对所述目标区域进行变换操作以使所述目标区域的尺寸与所述指定网格的尺寸相匹配;
依照所述目标区域的像素在所述指定网格的投影,确定所述目标区域的像素与所述指定网格的区块的对应关系。
10.一种字体文件生成方法,其特征在于,包括:
生成水印数据;
生成包括多个区块的字形网格;其中,所述字形网格承载有表示文字或符号的字形;
根据所述水印数据为所述字形网格的多个区块设置背景色,得到字体文件;其中,依照所述多个区块排列顺序的各个区块的背景色用于表征所述水印数据。
11.根据权利要求10所述的方法,其特征在于,所述水印数据为包括第一数值和/或第二数值的数据序列;其中,所述第一数值与所述第二数值不同;根据所述水印数据为所述字形网格的多个区块设置背景色包括:
依照所述字形网格中各个区块的排列顺序,依次读取所述数值序列中的各个数值,其中,每个数值对应一个区块;
根据所述各个区块的数值,为所述各个区块设置背景色,其中,数值为第一数值的区块具有第一背景色,数值为第二数值的区块具有第二背景色。
12.一种数据处理装置,其特征在于,包括:
水印生成单元,用于在接收到针对目标页面的页面数据获取请求时,生成用于标识所述目标页面中文本数据的水印数据;
构建单元,用于构建字体文件;其中,所述字体文件包括多个表示文字或符号的字形图;至少一个所述字形图被划分为多个区块,依照所述区块排列顺序的各个区块的背景色用于表征所述水印数据;
响应单元,用于根据所述目标页面的页面数据和所述字体文件响应所述页面数据请求,所述字体文件用于渲染所述目标页面的页面数据中的文本数据,以使所述渲染后的文本数据包括所述水印数据。
13.一种数据识别装置,其特征在于,包括:
获取单元,用于获取如权利要求1所述的渲染后的目标页面的页面图像;其中,所述页面图像包括文本区域;
标记像素确定单元,用于在所述文本区域中确定标记像素;其中,所述文本区域包括所述标记像素的文字或符号作为目标区域;
划分单元,用于将所述目标区域的像素划分至包括多个区块的指定网格;其中,所述指定网格的多个区块与所述字形图的多个区块相对应;所述指定网格的每个区块对应多个所述目标区域的像素;
取值设置单元,用于根据每个区块对应的像素为所述每个区块设置区块取值,按照所述多个区块的排列顺序的所述多个区块的区块取值表示所述水印数据;其中,所述多个区块中,包括所述标记像素的区块的区块取值为第一取值,不包括所述标记像素的区块的区块取值为第二取值;其中,所述第一取值和所述第二取值不同。
14.一种字体文件生成装置,其特征在于,包括:
数据生成单元,用于生成水印数据;
网格生成单元,用于生成包括多个区块的字形网格;其中,所述字形网格承载有表示文字或符号的字形;
设置单元,用于根据所述水印数据为所述字形网格的多个区块设置背景色,得到字体文件;其中,依照所述多个区块排列顺序的各个区块的背景色用于表征所述水印数据。
15.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-4中任一项所述的数据处理方法、5-9中任一项所述的数据识别方法以及10或11所述的字体文件生成方法。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-4中任一项所述的数据处理方法、5-9中任一项所述的数据识别方法以及10或至11中任一项所述的字体文件生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211227726.XA CN116127419A (zh) | 2022-10-09 | 2022-10-09 | 数据处理方法、数据识别方法、字体文件生成方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211227726.XA CN116127419A (zh) | 2022-10-09 | 2022-10-09 | 数据处理方法、数据识别方法、字体文件生成方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116127419A true CN116127419A (zh) | 2023-05-16 |
Family
ID=86297993
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211227726.XA Pending CN116127419A (zh) | 2022-10-09 | 2022-10-09 | 数据处理方法、数据识别方法、字体文件生成方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116127419A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117237177A (zh) * | 2023-11-15 | 2023-12-15 | 杭州海康威视数字技术股份有限公司 | 一种水印处理方法、装置及电子设备 |
-
2022
- 2022-10-09 CN CN202211227726.XA patent/CN116127419A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117237177A (zh) * | 2023-11-15 | 2023-12-15 | 杭州海康威视数字技术股份有限公司 | 一种水印处理方法、装置及电子设备 |
CN117237177B (zh) * | 2023-11-15 | 2024-03-19 | 杭州海康威视数字技术股份有限公司 | 一种水印处理方法、装置及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107239713B (zh) | 一种敏感内容数据信息防护方法和系统 | |
CN107330306B (zh) | 文本水印嵌入及提取方法、装置、电子设备及存储介质 | |
Zhang et al. | Viscode: Embedding information in visualization images using encoder-decoder network | |
EP3410685B1 (en) | Image processing device, image processing method, and program | |
US20040001606A1 (en) | Watermark fonts | |
CN110245469B (zh) | 网页的水印生成方法、水印解析方法、装置及存储介质 | |
CN111680273A (zh) | 水印嵌入方法、装置、电子设备及可读存储介质 | |
CN110968847A (zh) | 一种文件水印隐藏、解析方法、装置、设备及存储介质 | |
CN109785222B (zh) | 一种用于网页的信息快速嵌入和提取的方法 | |
CN114417226A (zh) | 页面生成方法、显示方法、装置、电子设备和存储介质 | |
CN110120003B (zh) | 一种获取带水印网页的方法和系统 | |
CN114332895A (zh) | 文本图像合成方法、装置、设备、存储介质和程序产品 | |
CN116127419A (zh) | 数据处理方法、数据识别方法、字体文件生成方法及装置 | |
CN113810375B (zh) | webshell检测方法、装置、设备及可读存储介质 | |
EP3410686B1 (en) | Image processing device, image processing method, and program | |
WO2020237881A1 (zh) | 加注防伪信息的方法、装置、计算机设备及存储介质 | |
CN117725333A (zh) | 用于浏览器网页的文本隐写方法及装置、电子设备 | |
EP3316173A1 (en) | System and method for cheque image data masking | |
US20140049802A1 (en) | System and method for digital analysis of authenticity and integrity of documents using portable devices | |
CN110543749A (zh) | 一种为客户端添加隐形水印的方法及装置 | |
CN112004148B (zh) | 视频处理方法、装置、计算机设备及存储介质 | |
US12075014B2 (en) | Data embedding and data extraction in image | |
KR100988309B1 (ko) | 문서식별자의 삽입방법 및 그의 해독방법 | |
CN118277972B (zh) | 基于glyph字形数据的校验和执行变体字形嵌入的方法及系统 | |
Zhou et al. | Secure map legends based on just noticeable distortion and watermark bit recovery |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |