CN115495694B - 一种网页数据的处理方法及装置 - Google Patents

一种网页数据的处理方法及装置 Download PDF

Info

Publication number
CN115495694B
CN115495694B CN202211417579.2A CN202211417579A CN115495694B CN 115495694 B CN115495694 B CN 115495694B CN 202211417579 A CN202211417579 A CN 202211417579A CN 115495694 B CN115495694 B CN 115495694B
Authority
CN
China
Prior art keywords
watermark
file
text data
service platform
page text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211417579.2A
Other languages
English (en)
Other versions
CN115495694A (zh
Inventor
李公宝
张信
陈子洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Guoyin Technology Co ltd
Original Assignee
Beijing Guoyin Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Guoyin Technology Co ltd filed Critical Beijing Guoyin Technology Co ltd
Priority to CN202211417579.2A priority Critical patent/CN115495694B/zh
Publication of CN115495694A publication Critical patent/CN115495694A/zh
Application granted granted Critical
Publication of CN115495694B publication Critical patent/CN115495694B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/986Document structures and storage, e.g. HTML extensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • G06F21/16Program or content traceability, e.g. by watermarking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Technology Law (AREA)
  • Multimedia (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供一种网页数据的处理方法及装置。涉及计算机信息处理技术领域。其中,应用于终端侧的网页数据的处理方法,包括:获取终端上安装的浏览器请求的页面文本数据;获取对所述页面文本数据进行渲染处理的水印字库文件,所述水印字库文件根据与所述终端关联的标识信息生成;根据所述水印字库文件对所述页面文本数据进行渲染处理,得到目标页面文本数据,并显示所述目标页面文本数据。本发明的方案能够实现网页数据泄露源头的精准追溯。

Description

一种网页数据的处理方法及装置
技术领域
本发明涉及计算机信息处理技术领域,特别是指一种网页数据的处理方法及装置。
背景技术
目前主流的OA(Office Auotmation,办公自动化)系统和各类在线业务平台系统大多都是基于B/S(Browser/Server,浏览器/服务器模式)架构设计开发的,服务端管理着大量的基于网页的业务数据、表单数据、图片资料等数据信息,并通过网络浏览器提供在线数据编辑、浏览以及打印等服务。
当不同的用户通过不同的终端系统同时访问服务器上的同一个网页文件时,后台服务器会将相同的网页数据内容发送至每个用户终端,此时用户屏幕显示的网页数据内容是完全相同的。当某个终端访问者通过手机截屏、屏幕截屏、屏幕拍照、打印纸张拍照等方式发生失泄密时,很难从截获的网页图像文件中进行泄密源头追溯,并快速锁定信息泄露的终端用户。
现有技术一般通过在终端系统部署客户端防护软件来解决上述问题,即当用户访问在线业务平台上的重要网页内容数据时,客户端防护软件在终端屏幕上显示带有用户个人信息的明文水印标识,比如用户账号、姓名、工号等等。当泄密事件发生后,通过可视的明文标识信息进行来源追溯。但此类方法存在以下缺点:1、明文水印信息的视觉效果较差,通常会影响正常的网页阅读效果;2、安全性能低,明文水印信息极易被人工或批量自动去除;3、实施成本高,需要在每个客户端系统安装部署相应的监控软件。
发明内容
本发明提供一种网页数据的处理方法及装置,能够解决难以追溯网页数据泄露源头的问题。
为解决上述技术问题,本发明的技术方案如下:
一种网页数据的处理方法,应用于终端,所述方法包括:
获取终端上安装的浏览器请求的页面文本数据;
获取对所述页面文本数据进行渲染处理的水印字库文件,所述水印字库文件根据与所述终端关联的标识信息生成;
根据所述水印字库文件对所述页面文本数据进行渲染处理,得到目标页面文本数据,并显示所述目标页面文本数据。
可选的,获取终端上安装的浏览器请求的页面文本数据,包括:
向在线应用系统服务器发送网页的页面文本数据读取请求;
接收所述在线应用系统服务器根据所述读取请求反馈的页面文本数据,其中,所述页面文本数据渲染所用的字库的地址为:水印字库服务平台中的所述水印字库文件的网络地址。
可选的,获取对所述页面文本数据进行渲染处理的水印字库文件,包括:
根据所述页面文本数据渲染所用的字库的地址,通过与水印字库服务平台通过进行协商交互,获取所述水印字库文件;或者
根据所述页面文本数据渲染所用的字库的地址,向水印字库服务平台发送连接请求,接收所述水印字库服务平台根据所述连接请求推送的所述水印字库文件。
可选的,根据所述页面文本数据渲染所用的字库的地址,通过与水印字库服务平台通过进行协商交互,获取所述水印字库文件,包括:
根据所述页面文本数据渲染所用的字库的地址,向水印字库服务平台发送水印字库文件下载请求;
接收所述水印字库服务平台根据所述水印字库文件下载请求反馈的所述水印字库文件。
可选的,根据所述页面文本数据渲染所用的字库的地址,向水印字库服务平台发送水印字库文件下载请求,包括:
根据所述页面文本数据渲染所用的字库的地址,检查本地缓存中是否存在所述地址对应的水印字库文件:若不存在,向水印字库服务平台发送超文本传输协议HTTP请求,在所述HTTP请求中不携带预设目标值;若存在,向水印字库服务平台发送超文本传输协议HTTP请求,所述HTTP请求中携带预设目标值,所述预设目标值用于使得水印字库服务平台判断终端当前缓存中的水印字库文件和水印字库服务平台当前保存的水印字库文件是否满足下载要求,并在满足下载要求的情况下向终端返回新的水印字库文件。
可选的,根据所述水印字库文件对所述页面文本数据进行渲染处理,得到所述目标页面文本数据,包括:
将本地的目标地址修改为所述页面文本数据渲染所用的字库的地址,根据所述页面文本数据渲染所用的字库的地址,自动加载水印字库文件,根据所述水印字库文件对所述页面文本数据进行渲染处理,得到所述目标页面文本数据;或者,
将所述水印字库文件的二进制数据流转换为文件对象,将浏览器中的字库文件的地址指向所述文件对象,将所述页面文本数据用所述文件对象渲染处理,得到所述目标页面文本数据。
本发明还提供一种网页数据的处理方法,应用于水印字库服务平台,所述方法包括:
接收在线应用系统服务器同步的与终端关联的标识信息;
根据所述标识信息,生成水印字库文件;
与终端进行交互,将所述水印字库文件返回终端,使得所述终端利用所述水印字库文件对页面文本数据进行渲染处理,得到目标页面文本数据,并显示所述目标页面文本数据。
本发明还提供一种网页数据的处理装置,应用于终端,所述装置包括:
获取模块,用于获取终端上安装的浏览器请求的页面文本数据以及获取对所述页面文本数据进行渲染处理的水印字库文件,所述水印字库文件根据与所述终端关联的标识信息生成;
第一处理模块,用于根据所述水印字库文件对所述页面文本数据进行渲染处理,得到目标页面文本数据,并显示所述目标页面文本数据。
本发明还提供一种网页数据的处理装置,应用于水印字库服务平台,所述装置包括:
收发模块,用于接收在线应用系统服务器同步的与终端关联的标识信息;
第二处理模块,用于根据所述标识信息,生成水印字库文件;
所述收发模块还用于与终端进行交互,将所述水印字库文件返回终端,使得所述终端利用所述水印字库文件对页面文本数据进行渲染处理,得到目标页面文本数据,并显示所述目标页面文本数据。
本发明还提供一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如上所述的方法的步骤。
本发明的上述方案至少包括以下有益效果:
本发明的上述方案,通过获取终端上安装的浏览器请求的页面文本数据;获取对所述页面文本数据进行渲染处理的水印字库文件,所述水印字库文件根据与所述终端关联的标识信息生成;根据所述水印字库文件对所述页面文本数据进行渲染处理,得到目标页面文本数据,并显示所述目标页面文本数据。可以实现网页数据泄露源头的精准追溯。
附图说明
图1是本发明实施例的应用于终端侧的网页数据的处理方法的流程示意图;
图2是本发明实施例的终端向水印字库服务平台请求水印字库文件的流程示意图;
图3是本发明实施例的网页数据的处理方法的又一具体的流程示意图;
图4是本发明实施例的应用于水印字库服务平台侧的网页数据的处理方法的流程示意图;
图5是本发明实施例的应用于终端侧的网页数据的处理装置的模块示意图;
图6是本发明实施例的应用于水印字库服务平台侧的网页数据的处理装置的模块示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
如图1所示,本发明的实施例提供一种网页数据的处理方法,应用于终端,所述方法包括:
步骤11,获取终端上安装的浏览器请求的页面文本数据;
步骤12,获取对所述页面文本数据进行渲染处理的水印字库文件,所述水印字库文件根据与所述终端关联的标识信息生成;
步骤13,根据所述水印字库文件对所述页面文本数据进行渲染处理,得到目标页面文本数据,并显示所述目标页面文本数据。
其中,所述终端包括但不限于:计算机、平板电脑以及手机APP(Application,应用软件)移动端;
所述标识信息包括但不限于:身份标识信息、账号信息、用户名称、组织架构。
本发明的该实施例中,终端通过获取的水印字库文件对页面文本数据进行渲染处理,得到目标网页文本数据。这样可以在所述页面文本数据发生泄露时,根据所述目标网页文本数据的图像中嵌入的与终端关联的标识信息,实现泄露源头的追溯和责任的划定。
需要说明的是,所述水印字库文件的类型支持Web(World Wide Web,全球广域网)字体格式,可以包括:TTF(True Type Font,字体格式)、EOT(Embedded Open Type,嵌入式开放式字体格式)、OTF(Open Type Font,可缩放字体格式)、WOFF(Web Open Font Format,网页开放字体格式)、SVG(Scalable Vector Graphics,可缩放矢量图形字体格式)等。其中,WOFF(Web Open Font Format,网页开放字体格式)是为了Web设计的字体格式标准,是对于TTF、OTF等字体格式的封装,每个字体文件中含有字体以及针对字体的元数据,字体文件被压缩,以便于网络传输。因此,本申请优选以WOFF格式为例说明水印字库文件的生成和使用过程。
本发明一可选的实施例中,所述步骤11,可以包括:
步骤111,向在线应用系统服务器发送网页的页面文本数据读取请求;
步骤112,接收所述在线应用系统服务器根据所述读取请求反馈的页面文本数据,其中,所述页面文本数据渲染所用的字库的地址为:水印字库服务平台中的所述水印字库文件的网络地址。
本实施例中,终端打开浏览器,通过账号和密码信息登录在线应用系统服务器,向在线应用系统服务器发送网页的页面文本数据读取请求,请求访问网页的页面文本数据;并接收所述在线应用系统服务器根据所述读取请求反馈的页面文本数据,通过解析所述页面文本数据,可以得到用于渲染所述页面文本数据的水印字库文件的地址,所述地址为:水印字库服务平台中的所述水印字库文件的网络地址。这样可以使得终端根据所述网络地址获得水印字库文件,并通过所述水印字库文件对页面文本数据进行渲染处理。
值得注意的是,所述在线应用系统服务器根据终端的账号信息即可获取与终端关联的标识信息,并通过调用服务接口将所述标识信息传送至水印字库服务平台,水印字库服务平台可以实时与所述在线应用系统服务器完成终端的标识信息的同步。这样能够使得用于溯源取证的信息更加完善和全面。
需要说明的是,由于会出现多个不同的终端同时访问同一个页面文本数据的情况,因此,为了在页面文本数据发生泄露后,能够有效的进行泄密源头的追溯,可以在每个终端显示的页面数据中隐藏与终端关联的标识信息。
本发明又一可选的实施例中,所述步骤12,可以包括:
步骤121,根据所述页面文本数据渲染所用的字库的地址,通过与水印字库服务平台通过进行协商交互,获取所述水印字库文件;或者
步骤122,根据所述页面文本数据渲染所用的字库的地址,向水印字库服务平台发送连接请求,接收所述水印字库服务平台根据所述连接请求推送的所述水印字库文件。
其中,所述连接请求是终端采用被动接收的方式获得水印字库文件时发送的请求,即:终端使用WEBSOCKET协议(基于传输控制协议的全双工通信协议)连接水印字库服务平台时发送的请求。
本实施例中,终端从水印字库服务平台获取水印字库文件时,可以通过调用水印字库服务平台接口函数,并返回所述页面文本数据渲染所用的字库的地址,终端可以使用HTTP协议,从水印字库服务平台下载水印字库文件;
终端从水印字库服务平台获取水印字库文件时,终端还可以使用WEBSOCKET连接水印字库服务平台,向水印字库服务平台发送连接请求,水印字库服务器接收到终端的连接请求后,会主动将相应的水印字库文件推送至终端的网页浏览器缓存区。
本发明又一可选的实施例中,所述步骤121,可以包括:
步骤1211,根据所述页面文本数据渲染所用的字库的地址,向水印字库服务平台发送水印字库文件下载请求;
步骤1212,接收所述水印字库服务平台根据所述水印字库文件下载请求反馈的所述水印字库文件。
其中,所述水印字库文件下载请求是终端采用主动获取的方式获得水印字库文件时发送的请求,即:终端采用HTTP协议(Hyper Text Transfer Protocol,超文本传输协议)从水印字库服务平台下载水印字库文件时发送的请求。
具体实现时,所述步骤1211,可以包括:
步骤12111,根据所述页面文本数据渲染所用的字库的地址,检查本地缓存中是否存在所述地址对应的水印字库文件:若不存在,向水印字库服务平台发送超文本传输协议HTTP请求,在所述HTTP请求中不携带预设目标值;若存在,向水印字库服务平台发送超文本传输协议HTTP请求,所述HTTP请求中携带预设目标值,所述预设目标值用于使得水印字库服务平台判断终端当前缓存中的水印字库文件和水印字库服务平台当前保存的水印字库文件是否满足下载要求,并在满足下载要求的情况下向终端返回新的水印字库文件。
其中,所述预设目标值可以包括:Last-Modified(属性标记值)、ETag(EntityTag,被请求变量的实体值);
所述下载要求包括但不限于:终端当前缓存中的水印字库文件和水印字库服务平台当前保存的水印字库文件是否一致;例如:水印字库服务平台根据所述预设目标值,判断终端当前缓存中的水印字库文件,和水印字库服务平台当前保存的水印字库文件是否一致,并在一致的情况下向终端返回新的水印字库文件。
本实施例中,当网页数据信息泄露后,用于溯源取证的信息中不仅包含终端的身份标识信息,还包括日期或者其他动态变化的特征信息,水印字库服务平台会按照时间间隔或者特定规则定期为终端生成水印字库文件。当终端通过HTTP协议向水印字库服务平台发起水印字库文件下载请求时,可以利用HTTP协商缓存机制来决定水印字库服务平台是否向终端发送水印字库文件,可以通过但不限于通过设置HTTP请求头中的Last-Modified值和被请求变量的实体值来实现。
如图2所示,本发明一可选的具体实施例中,所述步骤121的具体实现过程可以包括:
步骤21,终端向在线应用系统服务器发送网页的页面文本数据读取请求;所述页面文本数据读取请求携带终端的身份标识信息;
步骤22,在线应用系统服务器携带终端的身份标识信息,向水印字库服务平台发送水印字库文件的网络地址读取请求,所述水印字库文件的网络地址,即:所述页面文本数据渲染所用的字库的地址;
这里,需要说明的是,为了便于管理,水印字库文件的命名可以与终端的身份标识信息相关,若用于溯源取证的信息仅包含终端的身份标识信息,则水印字库文件的网络地址,即:所述页面文本数据渲染所用的字库的地址也可以固定,且可以由终端根据自身的规则,自动生成和维护水印字库文件的文件名,而不需要调用水印字库平台调取。
也就是说,终端可以根据水印字库文件的网络地址,在本地查找水印字库文件的文件名,若查找到同名的水印字库文件,即可用该水印字库文件对页面文本数据进行渲染处理,不需要从水印字库服务平台调取。
步骤23,水印字库服务平台收到在线应用系统服务器的水印字库文件的网络地址读取请求,并进行水印字库文件的加工与发送;
其中,步骤23包括:
步骤231,水印字库服务平台解析终端的身份标识信息,并在服务器后台数据库中检索是否存在与该终端相关的水印信息编码记录,若有,则直接读取该终端的水印信息编码,否则,针对所述身份标识信息生成新的水印信息编码,并保存在水印字库服务平台后台的数据库中,以供该用户后续请求使用;
步骤232,水印字库服务平台在文件服务器上检索是否存在与该终端相关的水印字库文件,若不存在,则水印字库服务平台的后台启动水印字库文件生成模块,将该终端的水印信息编码嵌入原始字库文件中,生成WOFF格式的水印字库文件,并保存在水印字库服务平台的文件服务器中;
步骤233,水印字库服务平台向在线应用系统服务平台发送包含该终端的身份标识信息的网络地址;
步骤24,在线应用系统服务器通过JavaScript(JS,计算机编程语言),将页面文本数据中的字库地址,修改为水印字库服务平台发送的水印字库文件的网络地址;
步骤25,终端的浏览器接收到在线应用系统服务器发送的页面文本数据并进行渲染处理;
其中,步骤25包括:
步骤251,终端的网页浏览器解析页面文本数据,获取用于渲染页面文本数据的水印字库文件的网络地址;
步骤252,终端的浏览器在本地缓存区中检查同名的水印字库文件是否存在且有效,若是,终端的浏览器则加载该水印字库文件对页面文本数据进行渲染处理,否则,终端的浏览器则使用HTTP协议向水印字库服务平台发起水印字库文件下载请求;
步骤253,水印文件服务平台接收终端使用HTTP协议发送的水印字库文件下载请求,在HTTP协议的响应头中设置Cache-Control(缓存控制规则)字段为:max-age=xxxx,并将终端请求的水印字库文件发送至终端,其中,“xxxx”表示秒数,本实施例中,“xxxx”可以为2626560,有效期可以为1个月;
步骤254,终端的浏览器接收水印字库服务平台发送的水印字库文件,并保存至本地缓存区中,以供终端对页面文本数据进行渲染处理。
本实施例中,在HTTP协议中,通过在响应头中设置Cache-Control的值,来确定浏览器的缓存策略,当终端的页面文本数据泄露后,用于溯源取证的信息仅需定位到终端的身份信息时,隐藏的水印信息相对固定,则水印字库服务平台仅需为终端生成一份永久的水印字库文件,其中隐藏了终端的身份标识信息,利用终端的浏览器的缓存机制,该水印字库文件被终端下载到浏览器的本地缓存区后,可以随时供终端对页面文本数据进行渲染处理,且没有任何处理性能问题,只有当用户手工清除缓存时,该水印字库文件才会被删除,终端的浏览器需要使用该水印字库文件时,可以通过HTTP协议再次从水印字库服务平台进行下载。
如图3所示,所述步骤122的具体实现过程可以包括:
步骤31,终端向在线应用系统服务器发送网页的页面文本数据读取请求;所述页面文本数据读取请求携带终端的身份标识信息;
步骤32,在线应用系统服务器携带终端的身份标识信息,向水印字库服务平台发送水印字库文件的网络地址读取请求,所述水印字库文件的网络地址,即:所述页面文本数据渲染所用的字库的地址;
步骤33,水印字库服务平台收到在线应用系统服务器的水印字库文件的网络地址读取请求,并进行水印字库文件的加工与发送;
步骤34,在线应用系统服务器通过JavaScript将动态的页面文本数据中的字库地址,修改为水印字库服务平台返回的网络路径地址,并将页面文本数据,以及修改后的页面文本数据的网络地址返回终端的浏览器;
步骤35,终端的浏览器接收在线应用系统服务器返回的页面文本数据,并进行渲染处理。
需要说明的是,在HTTP协商缓存机制下,水印字库服务平台会根据预设策略定期为终端生成不同的水印字库文件,其中隐藏了固定信息和动态特征信息。水印字库服务平台根据终端的HTTP请求头中的预设目标值(Last-Modified值或Etag值),来判断终端的浏览器缓存区中的水印字库文件是否需要更新,进而决定是否发送新的水印字库文件供终端下载使用。
作为本发明的具体实现方式,通过HTTP请求头中的Etag值,判断终端的浏览器缓存区中的水印字库文件,跟水印字库服务平台当前保存的水印字库文件是否一致,例如:将Etag值设置为水印字库文件的MD5值(Message-DigestAlgorithm 5),具体过程可以包括:
步骤A,终端的浏览器解析在线应用系统服务器发送的页面文本数据,获取水印字库文件的网络地址;
步骤B,终端的浏览器在本地缓存区中检查同名的水印字库文件是否存在,若存在,终端的浏览器则从浏览器缓存区中,获取上次水印字库服务平台返回的Etag值,并将该值写入HTTP请求头中的If-None-Match(条件式请求首部)字段中,向水印字库服务平台发起HTTP请求,若同名的水印字库文件不存在或者该终端首次向水印字库服务平台发起针对水印字库文件的HTTP请求,终端的浏览器则不设置HTTP请求头中的If-None-Match,直接向水印字库服务平台发起HTTP请求;
步骤C,水印字库服务平台接收到终端发送的HTTP请求,根据所述HTTP请求的水印字库文件名称,计算本地同名文件的MD5值,并与HTTP请求头中的If-None-Match字段值进行比较,若相同,则说明终端的浏览器缓存区中的水印字库文件和水印字库服务平台的服务器中的水印字库文件是相同的,不需要再次下载更新,水印字库服务平台将HTTP请求的响应状态修改为304,并返回给终端;若不相同或者HTTP请求头中无If-None-Match字段值时,水印字库服务平台依次将HTTP请求的响应状态修改为200,将HTTP响应头里的Cache-Control字段设置为no-cache,将Etag字段值设置为所请求水印字库文件的MD5值,然后连同终端所请求的水印字库文件一起返回给终端;
步骤D,当终端的浏览器收到的HTTP请求的返回值为304时,说明终端的浏览器缓存区中存储的水印字库文件与水印字库服务平台中的相同,终端则继续使用浏览器缓存区中的水印字库文件进行页面文本数据的渲染处理,不需要更新浏览器缓存区中的水印字库文件;当终端的浏览器收到的HTTP请求的返回值为200时,说明终端的浏览器缓存区中存储的水印字库文件与水印字库服务平台中的不同,终端的浏览器则接收HTTP请求返回的新的水印字库文件,并利用新的水印字库文件对页面文本数据进行渲染处理,并将新的水印字库文件保存至浏览区缓存区中。作为本发明又一具体的实现方式,通过HTTP请求头中的Last-Modified字段值判断终端的浏览器缓存区中的水印字库文件是否为最新版本文件,其中,所述Last-Modified设置为水印字库文件的生成时间,具体实现过程可以包括:
步骤a,终端的浏览器解析在线应用系统服务器发送的页面文本数据,获取水印字库文件的网络地址;
步骤b,终端的浏览器在本地缓存区中检查同名的水印字库文件是否存在,若存在,终端的浏览器则从浏览器缓存区中,获取上次水印字库服务平台返回的Last-Modified值,并将该值写入HTTP请求头中的If-Modified-Since(标准HTTP请求头标签)字段中,向水印字库服务平台发起HTTP请求,若同名的水印字库文件不存在或者该终端首次向水印字库服务平台发起针对水印字库文件的HTTP请求,终端的浏览器则不设置HTTP请求头中的If-Modified-Since,直接向水印字库服务平台发起HTTP请求;
步骤c,水印字库服务平台接收到终端发送的HTTP请求,读取HTTP请求头中的If-Modified-Since字段值,并与水印字库服务平台中的同名水印字库文件的生成日期进行比较,若该值相等,则说明终端的浏览器缓存区中的水印字库文件与水印字库服务平台的水印字库文件相同,不需要再次下载更新,水印字库服务平台将HTTP请求的响应状态修改为304,并返回给终端;若水印字库服务平台中的同名水印字库文件的生成日期相对较新或者HTTP请求头中无If-Modified-Since字段值时,水印字库服务平台依次将HTTP请求的响应状态修改为200,将HTTP响应头里的Cache-Control字段设置为no-cache,将Last-Modified字段值设置为所请求水印字库文件的生成日期,然后连同终端所请求的水印字库文件一起返回给终端;
步骤d,当终端的浏览器收到的HTTP请求的返回值为304时,说明终端的浏览器缓存区中存储的水印字库文件与水印字库服务平台中的相同,终端则继续使用浏览器缓存区中的水印字库文件进行页面文本数据的渲染处理,不需要更新浏览器缓存区中的水印字库文件;当终端的浏览器收到的HTTP请求的返回值为200时,说明终端的浏览器缓存区中存储的水印字库文件与水印字库服务平台中的不同,终端的浏览器则接收HTTP请求返回的新的水印字库文件,并利用新的水印字库文件对页面文本数据进行渲染处理,并将新的水印字库文件保存至浏览区缓存区中。
本发明又一可选的实施例中,所述步骤13,可以包括:
步骤131,将本地的目标地址修改为所述页面文本数据渲染所用的字库的地址,根据所述页面文本数据渲染所用的字库的地址,自动加载水印字库文件,根据所述水印字库文件对所述页面文本数据进行渲染处理,得到所述目标页面文本数据;或者,
步骤132,将所述水印字库文件的二进制数据流转换为文件对象,将浏览器中的字库文件的地址指向所述文件对象,将所述页面文本数据用所述文件对象渲染处理,得到所述目标页面文本数据。
本实施例中,通过将所述水印字库文件的二进制数据流转换为文件对象,再将终端的浏览器中的字库文件的地址指向所述文件对象,根据所述文件对象对所述页面文本数据进行渲染处理,得到目标页面文本数据。这样通过水印字库文件对所述页面文本数据进行渲染处理,可以在目标页面文本数据发生泄露时,通过所述目标页面文本数据的图像,实现泄露源头的追溯和责任划定。
需要说明的是,终端的浏览器也可以利用本地系统的字库文件完成页面文本数据的渲染,但为了能够进行终端的页面文本数据发生泄露后的溯源取证,强制终端的浏览器使用水印字库文件完成页面文本数据的渲染。具体的渲染过程可以包括:
通过JavaScript动态修改终端访问网页文本数据渲染所用的字库地址,将本地的URL(Unifrom Resource Locator,统一资源定位系统)地址修改为水印字库服务平台返回的网络地址,终端的浏览器会根据自身的缓存机制自动下载水印字库文件,并根据具体设置完成水印字库文件的更新和加载;
可以利用CSS(Cascading Style Sheets,层叠样式表)属性完成水印字库文件的加载。在线应用系统服务器调用水印字库文件服务平台的接口,获得水印字库文件的网络地址,使用JavaScript创建CSS属性,并通过CSS将网页页面中的页面文本数据的字库地址指向水印字库文件的网络地址。
本发明一可选的具体实施例中,根据层叠样式表CSS属性的水印字库文件的加载过程可以包括:
除了使用终端的浏览器缓存机制完成水印字库文件的加载外,还可以通过JavaScript创建CSS,修改其中水印字库文件的URL地址,并通过CSS使得全部网页中的页面文本数据使用URL指向的水印字库文件;具体的实现步骤可以包括:
步骤1,终端向在线应用系统服务器发送网页的页面文本数据读取请求;所述页面文本数据读取请求携带终端的身份标识信息;
步骤2,在线应用系统服务器携带终端的身份标识信息,向水印字库服务平台发送水印字库文件的网络地址读取请求,所述水印字库文件的网络地址,即:所述页面文本数据渲染所用的字库的地址;
步骤3,水印字库服务平台收到在线应用系统服务器的水印字库文件的网络地址读取请求,并进行水印字库文件的加工与发送;
步骤4,终端的浏览器接收水印字库服务平台发送的水印字库文件,并以二进制流的方式保存在本地缓存区或者IndexedDB数据库(由浏览器提供的本地数据库);
步骤5,终端用户的浏览器初始化或者刷新页面文件时,首先读取本地缓存区或者IndexedDB数据库中的水印字库文件的二进制数据流,并将二进制数据流转换为File对象,然后设置CSS中的字库文件URL地址指向File对象;
步骤6,终端的浏览器使用JavaScript加载CSS水印字库文件,并使用所述水印字库文件对页面文本数据进行渲染处理,得到目标页面文本数据。
作为本发明的一种可变形的实施例,终端使用水印字库文件对页面文本数据进行渲染处理的过程可以包括:
终端的浏览器进行页面文本数据渲染的水印字库文件不是从水印字库服务平台的服务器上下载得到的,而是通过JavaScript按照相同的规则在终端的浏览器本地动态生成水印字库文件,这样可以减少水印字库服务平台的压力;
终端可以包括但不限于:计算机、平板电脑以及手机APP(Application,应用软件)移动端等,其中,手机APP移动端可以在本地集成水印字库生成模板实现页面文本数据的加载,也可以通过水印字库服务平台统一下载使用;
在基于HTTP缓存机制的水印字库文件推送方法中,强制缓存和协商缓存并行使用,强制缓存优先于协商缓存进行,若强制缓存(Expires和Cache-Control)生效则直接使用缓存,若不生效则进行协商缓存(Last-Modified/If-Modified-Since和Etag/If-None-Match)。
本发明又一可选的实施例中,所述网页数据的处理方法,还可以包括:
步骤14,获取所述目标页面文本数据,根据所述目标页面文本数据追溯泄露源头。
本实施例中,当所述目标页面文本数据通过手机截屏、屏幕拍照、手机拍照等方式发生泄露时,可以利用专用的提取工具从截获的目标页面文本数据的图像中提取隐藏的水印信息。这样可以实现目标页面文本数据的泄露源头的追溯和责任划定。
如图4所示,本发明的实施例还提供一种网页数据的处理方法,应用于水印字库服务平台,所述方法包括:
步骤41,接收在线应用系统服务器同步的与终端关联的标识信息;
步骤42,根据所述标识信息,生成水印字库文件;
步骤43,与终端进行交互,将所述水印字库文件返回终端,使得所述终端利用所述水印字库文件对页面文本数据进行渲染处理,得到目标页面文本数据,并显示所述目标页面文本数据。
本实施例中,水印字库服务平台根据接收的在线应用系统服务器同步的与终端关联的标识信息,生成水印字库文件,并通过与终端进行交互,将所述水印字库文件返回至终端的浏览器缓存区中,以供终端对页面文本数据进行渲染处理,得到目标页面文本数据。以使得在目标页面文本数据发生泄露时,能够根据所述目标页面文本数据的图像中嵌入的终端的标识信息,实现泄露源头的追溯和责任划定。
本发明又一可选的实施例中,根据所述标识信息,生成水印字库文件的情况,可以包括:
情况1,当终端仅需追溯到页面文本数据泄露者的身份标识信息时,水印字库服务平台只需为终端生成一次水印字库文件。具体的生成水印字库文件的方式可以包括:
方式1,水印字库服务平台记录了所有终端的身份标识,水印字库服务平台预先一次性为每个终端生成各自的水印字库文件,并保存在水印字库服务平台服务器后台的预设位置,供终端每次请求访问时重复使用;
方式2,水印字库服务平台没有预先存储终端的身份标识信息,当终端第一访问水印字库服务平台时,水印字库服务平台会实时动态的为该终端生成水印字库文件,并将该水印字库文件保存至水印字库服务平台服务器后台的预设位置,供该终端后续任何时刻访问请求时的使用。
情况2,当终端的泄露溯源取证需要包含日期或者其他动态的标识信息时,水印字库服务平台需实时动态或者定时预转生成批量的水印字库文件。例如,当需要追溯的标识信息包括终端的身份标识信息和日期信息时,水印字库服务平台需要根据日期间隔设置,定期为每个终端自动生成多个字库水印文件,以供终端随时的访问请求,若用户的并发访问量相对较少时,也可以在终端访问请求网页文件数据时,水印字库服务平台实时动态生成相应的水印字库文件,该水印字库文件在日期设置有效期内会一直保存在水印字库服务的后台服务器上;
当需要追溯的信息包含动态的标识信息时,水印字库服务平台需要启动定时预转机制,批量生成多个水印字库文件,并保存在水印字库服务平台的后台服务器上,供终端随时发起的访问请求使用,具体的生成水印字库文件的方式可以包括:
方式1,当终端的数量较多,但每个终端访问请求的概率分布相对随机时,若水印字库服务平台定时为所有终端都重复生成水印字库文件,则会造成计算资源和存储成本的极大浪费,因此,水印字库服务平台的后台会根据自身的预转机制,定期生成批量的水印字库文件,这些水印字库文件嵌入的水印信息包含编码信息,但不直接嵌入终端的身份标识信息。当某个终端在某一时刻实时发起访问请求时,系统会自动把终端的身份标识信息、访问审计日志信息,例如:访问时间、访问设备、访问文件名称等信息跟所述编码信息绑定,并将关联关系保存在水印字库服务平台的后台数据库中,供日后溯源取证时进行查证展示;
方式2,当终端的数据较少,动态的标识信息的变化频率相对较低时,水印字库服务平台的后台根据既定的预转机制,定期为每个终端生成水印字库文件,其中预先隐藏了终端的身份标识信息和动态的标识信息。
本实施例中,水印字库服务平台可以通过发起访问请求的终端数量,以及终端发起访问请求的情况、访问请求中所携带的标识信息,判断如何为终端生成对应的水印字库文件。这样不仅能够满足不同的终端的需要,而且节省计算机资源和存储成本。
本发明的上述实施例中,水印字库服务平台可以根据终端的标识信息生成用于渲染页面文本数据的水印字库文件,即将终端的标识信息隐藏至水印字库文件中,当终端的浏览器使用水印字库文件显示页面文本数据时,水印信息自动嵌入页面文本数据中,在页面文本数据发生泄露时,可以通过其中嵌入的表示信息,实现泄露源头的追溯;在线应用系统服务器通过简单的水印字库服务平台接口调用,即可获取终端所需要的水印字库文件,为了终端提供了客户端零安装方案,不仅实现方式简单,而且实施成本低。
如图5所示,本发明的实施例还提供一种网页数据的处理装置60,应用于终端,所述装置50包括:
获取模块51,用于获取终端上安装的浏览器请求的页面文本数据以及获取对所述页面文本数据进行渲染处理的水印字库文件,所述水印字库文件根据与所述终端关联的标识信息生成;
第一处理模块52,用于根据所述水印字库文件对所述页面文本数据进行渲染处理,得到所述目标页面文本数据,并显示所述目标页面文本数据。
可选的,获取终端上安装的浏览器请求的页面文本数据,包括:
向在线应用系统服务器发送网页的页面文本数据读取请求;
接收所述在线应用系统服务器根据所述读取请求反馈的页面文本数据,其中,所述页面文本数据渲染所用的字库的地址为:水印字库服务平台中的所述水印字库文件的网络地址。
可选的,获取对所述页面文本数据进行渲染处理的水印字库文件,包括:
根据所述页面文本数据渲染所用的字库的地址,通过与水印字库服务平台通过进行协商交互,获取所述水印字库文件;或者
根据所述页面文本数据渲染所用的字库的地址,向水印字库服务平台发送连接请求,接收所述水印字库服务平台根据所述连接请求推送的所述水印字库文件。
可选的,根据所述页面文本数据渲染所用的字库的地址,通过与水印字库服务平台进行协商交互,获取所述水印字库文件,包括:
根据所述页面文本数据渲染所用的字库的地址,向水印字库服务平台发送水印字库文件下载请求;
接收所述水印字库服务平台根据所述水印字库文件下载请求反馈的所述水印字库文件。
可选的,根据所述页面文本数据渲染所用的字库的地址,向水印字库服务平台发送水印字库文件下载请求,包括:
根据所述页面文本数据渲染所用的字库的地址,检查本地缓存中是否存在所述地址对应的水印字库文件:若不存在,向水印字库服务平台发送超文本传输协议HTTP请求,在所述HTTP请求中不携带预设目标值;若存在,向水印字库服务平台发送超文本传输协议HTTP请求,所述HTTP请求中携带预设目标值,所述预设目标值用于使得水印字库服务平台判断终端当前缓存中的水印字库文件和水印字库服务平台当前保存的水印字库文件是否满足下载要求,并在满足下载要求的情况下向终端返回新的水印字库文件。
可选的,根据所述水印字库文件对所述页面文本数据进行渲染处理,得到所述目标页面文本数据,包括:
将本地的目标地址修改为所述页面文本数据渲染所用的字库的地址,根据所述页面文本数据渲染所用的字库的地址,自动加载水印字库文件,根据所述水印字库文件对所述页面文本数据进行渲染处理,得到所述目标页面文本数据;或者,
将所述水印字库文件的二进制数据流转换为文件对象;将浏览器中的字库文件的地址指向所述文件对象;将所述页面文本数据用所述文件对象渲染处理,得到所述目标页面文本数据。
需要说明的是,该应用于终端侧的装置是与上述应用于终端侧的方法对应的装置,上述应用于终端侧的方法实施例中的所有实现方式均适用于该应用于终端侧的装置的实施例中,也能达到相同的技术效果。
如图6所示,本发明的实施例还提供一种网页数据的处理装置60,应用于水印字库服务平台,所述装置60包括:
收发模块61,用于接收在线应用系统服务器同步的与终端关联的标识信息;
第二处理模块62,用于根据所述标识信息,生成水印字库文件;
所述收发模块61还用于与终端进行交互,将所述水印字库文件返回终端,使得所述终端利用所述水印字库文件对所述页面文本数据进行渲染处理,得到所述目标页面文本数据,并显示所述目标页面文本数据。
需要说明的是,该应用于水印字库服务平台侧的装置是与上述应用于水印字库服务平台侧的方法对应的装置,上述应用于水印字库服务平台侧的方法实施例中的所有实现方式均适用于该应用于水印字库服务平台侧的装置的实施例中,也能达到相同的技术效果。
本发明的实施例还提供一种处理设备,包括:处理器、存储有计算机程序的存储器,所述计算机程序被处理器运行时,执行如上所述的方法。上述方法实施例中的所有实现方式均适用于该实施例中,也能达到相同的技术效果。
本发明的实施例还提供一种计算机可读存储介质,包括指令,当所述指令在计算机上运行时,使得计算机执行如上所述的方法。上述方法实施例中的所有实现方式均适用于该实施例中,也能达到相同的技术效果。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
此外,需要指出的是,在本发明的装置和方法中,显然,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。并且,执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行,某些步骤可以并行或彼此独立地执行。对本领域的普通技术人员而言,能够理解本发明的方法和装置的全部或者任何步骤或者部件,可以在任何计算装置(包括处理器、存储介质等)或者计算装置的网络中,以硬件、固件、软件或者它们的组合加以实现,这是本领域普通技术人员在阅读了本发明的说明的情况下运用他们的基本编程技能就能实现的。
因此,本发明的目的还可以通过在任何计算装置上运行一个程序或者一组程序来实现。所述计算装置可以是公知的通用装置。因此,本发明的目的也可以仅仅通过提供包含实现所述方法或者装置的程序代码的程序产品来实现。也就是说,这样的程序产品也构成本发明,并且存储有这样的程序产品的存储介质也构成本发明。显然,所述存储介质可以是任何公知的存储介质或者将来所开发出来的任何存储介质。还需要指出的是,在本发明的装置和方法中,显然,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。并且,执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行。某些步骤可以并行或彼此独立地执行。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (8)

1.一种网页数据的处理方法,其特征在于,应用于终端,所述方法包括:
获取终端上安装的浏览器请求的页面文本数据;
获取对所述页面文本数据进行渲染处理的水印字库文件,所述水印字库文件根据与所述终端关联的标识信息生成;
根据所述水印字库文件对所述页面文本数据进行渲染处理,得到目标页面文本数据,并显示所述目标页面文本数据;
其中,获取对所述页面文本数据进行渲染处理的水印字库文件,包括:
根据所述页面文本数据渲染所用的字库的地址,通过与水印字库服务平台进行协商交互,获取所述水印字库文件;或者
根据所述页面文本数据渲染所用的字库的地址,向水印字库服务平台发送连接请求,接收所述水印字库服务平台根据所述连接请求推送的所述水印字库文件;
根据所述页面文本数据渲染所用的字库的地址,通过与水印字库服务平台进行通过协商交互,获取所述水印字库文件,包括:
根据所述页面文本数据渲染所用的字库的地址,向水印字库服务平台发送水印字库文件下载请求;
接收所述水印字库服务平台根据所述水印字库文件下载请求反馈的所述水印字库文件;
根据所述页面文本数据渲染所用的字库的地址,向水印字库服务平台发送水印字库文件下载请求,包括:
根据所述页面文本数据渲染所用的字库的地址,检查本地缓存中是否存在所述地址对应的水印字库文件:若不存在,向水印字库服务平台发送超文本传输协议HTTP请求,在所述HTTP请求中不携带预设目标值;若存在,向水印字库服务平台发送超文本传输协议HTTP请求,所述HTTP请求中携带预设目标值,所述预设目标值用于使得水印字库服务平台判断终端当前缓存中的水印字库文件和水印字库服务平台当前保存的水印字库文件是否满足下载要求,并在满足下载要求的情况下向终端返回新的水印字库文件。
2.根据权利要求1所述的网页数据的处理方法,其特征在于,获取终端上安装的浏览器请求的页面文本数据,包括:
向在线应用系统服务器发送网页的页面文本数据读取请求;
接收所述在线应用系统服务器根据所述读取请求反馈的页面文本数据,其中,所述页面文本数据渲染所用的字库的地址为:水印字库服务平台中的所述水印字库文件的网络地址。
3.根据权利要求1所述的网页数据的处理方法,其特征在于,根据所述页面文本数据渲染所用的字库的地址,向水印字库服务平台发送连接请求,接收所述水印字库服务平台根据所述连接请求推送的所述水印字库文件,包括:
终端向在线应用系统服务器发送网页的页面文本数据读取请求;所述页面文本数据读取请求携带终端的身份标识信息;
在线应用系统服务器携带终端的身份标识信息,向水印字库服务平台发送水印字库文件的网络地址读取请求;
水印字库服务平台收到在线应用系统服务器的水印字库文件的网络地址读取请求,并进行水印字库文件的加工与发送;
在线应用系统服务器通过JavaScript将动态的页面文本数据中的字库地址,修改为水印字库服务平台返回的网络路径地址,并将页面文本数据,以及修改后的页面文本数据的网络地址返回终端的浏览器。
4.根据权利要求1所述的网页数据的处理方法,其特征在于,根据所述水印字库文件对所述页面文本数据进行渲染处理,得到所述目标页面文本数据,包括:
将本地的目标地址修改为所述页面文本数据渲染所用的字库的地址,根据所述页面文本数据渲染所用的字库的地址,自动加载水印字库文件,根据所述水印字库文件对所述页面文本数据进行渲染处理,得到所述目标页面文本数据;或者,
将所述水印字库文件的二进制数据流转换为文件对象,将浏览器中的字库文件的地址指向所述文件对象,将所述页面文本数据用所述文件对象渲染处理,得到所述目标页面文本数据。
5.一种网页数据的处理方法,其特征在于,应用于水印字库服务平台,所述方法包括:
接收在线应用系统服务器同步的与终端关联的标识信息;
根据所述标识信息,生成水印字库文件;
与终端进行交互,将所述水印字库文件返回终端,使得所述终端利用所述水印字库文件对页面文本数据进行渲染处理,得到目标页面文本数据,并显示所述目标页面文本数据;
其中,所述水印字库是终端通过以下过程获取的:
根据所述页面文本数据渲染所用的字库的地址,通过与水印字库服务平台进行协商交互,获取所述水印字库文件;或者
根据所述页面文本数据渲染所用的字库的地址,向水印字库服务平台发送连接请求,接收所述水印字库服务平台根据所述连接请求推送的所述水印字库文件;
根据所述页面文本数据渲染所用的字库的地址,通过与水印字库服务平台进行通过协商交互,获取所述水印字库文件,包括:
根据所述页面文本数据渲染所用的字库的地址,向水印字库服务平台发送水印字库文件下载请求;
接收所述水印字库服务平台根据所述水印字库文件下载请求反馈的所述水印字库文件;
根据所述页面文本数据渲染所用的字库的地址,向水印字库服务平台发送水印字库文件下载请求,包括:
根据所述页面文本数据渲染所用的字库的地址,检查本地缓存中是否存在所述地址对应的水印字库文件:若不存在,向水印字库服务平台发送超文本传输协议HTTP请求,在所述HTTP请求中不携带预设目标值;若存在,向水印字库服务平台发送超文本传输协议HTTP请求,所述HTTP请求中携带预设目标值,所述预设目标值用于使得水印字库服务平台判断终端当前缓存中的水印字库文件和水印字库服务平台当前保存的水印字库文件是否满足下载要求,并在满足下载要求的情况下向终端返回新的水印字库文件。
6.一种网页数据的处理装置,其特征在于,应用于终端,所述装置包括:
获取模块,用于获取终端上安装的浏览器请求的页面文本数据以及获取对所述页面文本数据进行渲染处理的水印字库文件,所述水印字库文件根据与所述终端关联的标识信息生成;
第一处理模块,用于根据所述水印字库文件对所述页面文本数据进行渲染处理,得到目标页面文本数据,并显示所述目标页面文本数据;
其中,获取对所述页面文本数据进行渲染处理的水印字库文件,包括:
根据所述页面文本数据渲染所用的字库的地址,通过与水印字库服务平台进行协商交互,获取所述水印字库文件;或者
根据所述页面文本数据渲染所用的字库的地址,向水印字库服务平台发送连接请求,接收所述水印字库服务平台根据所述连接请求推送的所述水印字库文件;
根据所述页面文本数据渲染所用的字库的地址,通过与水印字库服务平台进行通过协商交互,获取所述水印字库文件,包括:
根据所述页面文本数据渲染所用的字库的地址,向水印字库服务平台发送水印字库文件下载请求;
接收所述水印字库服务平台根据所述水印字库文件下载请求反馈的所述水印字库文件;
根据所述页面文本数据渲染所用的字库的地址,向水印字库服务平台发送水印字库文件下载请求,包括:
根据所述页面文本数据渲染所用的字库的地址,检查本地缓存中是否存在所述地址对应的水印字库文件:若不存在,向水印字库服务平台发送超文本传输协议HTTP请求,在所述HTTP请求中不携带预设目标值;若存在,向水印字库服务平台发送超文本传输协议HTTP请求,所述HTTP请求中携带预设目标值,所述预设目标值用于使得水印字库服务平台判断终端当前缓存中的水印字库文件和水印字库服务平台当前保存的水印字库文件是否满足下载要求,并在满足下载要求的情况下向终端返回新的水印字库文件。
7.一种网页数据的处理装置,其特征在于,应用于水印字库服务平台,所述装置包括:
收发模块,用于接收在线应用系统服务器同步的与终端关联的标识信息;
第二处理模块,用于根据所述标识信息,生成水印字库文件;
所述收发模块还用于与终端进行交互,将所述水印字库文件返回终端,使得所述终端利用所述水印字库文件对页面文本数据进行渲染处理,得到目标页面文本数据,并显示所述目标页面文本数据;
其中,所述水印字库是终端通过以下过程获取的:
根据所述页面文本数据渲染所用的字库的地址,通过与水印字库服务平台进行协商交互,获取所述水印字库文件;或者
根据所述页面文本数据渲染所用的字库的地址,向水印字库服务平台发送连接请求,接收所述水印字库服务平台根据所述连接请求推送的所述水印字库文件;
根据所述页面文本数据渲染所用的字库的地址,通过与水印字库服务平台进行通过协商交互,获取所述水印字库文件,包括:
根据所述页面文本数据渲染所用的字库的地址,向水印字库服务平台发送水印字库文件下载请求;
接收所述水印字库服务平台根据所述水印字库文件下载请求反馈的所述水印字库文件;
根据所述页面文本数据渲染所用的字库的地址,向水印字库服务平台发送水印字库文件下载请求,包括:
根据所述页面文本数据渲染所用的字库的地址,检查本地缓存中是否存在所述地址对应的水印字库文件:若不存在,向水印字库服务平台发送超文本传输协议HTTP请求,在所述HTTP请求中不携带预设目标值;若存在,向水印字库服务平台发送超文本传输协议HTTP请求,所述HTTP请求中携带预设目标值,所述预设目标值用于使得水印字库服务平台判断终端当前缓存中的水印字库文件和水印字库服务平台当前保存的水印字库文件是否满足下载要求,并在满足下载要求的情况下向终端返回新的水印字库文件。
8.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1-4任一项所述的方法的步骤或者如权利要求5所述的方法的步骤。
CN202211417579.2A 2022-11-14 2022-11-14 一种网页数据的处理方法及装置 Active CN115495694B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211417579.2A CN115495694B (zh) 2022-11-14 2022-11-14 一种网页数据的处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211417579.2A CN115495694B (zh) 2022-11-14 2022-11-14 一种网页数据的处理方法及装置

Publications (2)

Publication Number Publication Date
CN115495694A CN115495694A (zh) 2022-12-20
CN115495694B true CN115495694B (zh) 2023-03-24

Family

ID=85115584

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211417579.2A Active CN115495694B (zh) 2022-11-14 2022-11-14 一种网页数据的处理方法及装置

Country Status (1)

Country Link
CN (1) CN115495694B (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6724914B2 (en) * 2001-10-16 2004-04-20 Digimarc Corporation Progressive watermark decoding on a distributed computing platform
CN102662926B (zh) * 2012-03-29 2015-09-30 常州华文文字技术有限公司 字库的存储与访问方法
CN107423629B (zh) * 2017-04-12 2020-10-27 北京溯斐科技有限公司 一种文件信息输出防泄密和溯源追踪的方法和系统
CN113095995B (zh) * 2021-04-28 2023-08-01 深圳赛安特技术服务有限公司 网页水印添加方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN115495694A (zh) 2022-12-20

Similar Documents

Publication Publication Date Title
WO2016026384A1 (zh) 一种客户端页面显示方法、装置及系统
CN109634925A (zh) 资源文件下载方法、装置、计算机设备和存储介质
CN104572843B (zh) 一种页面的加载方法及装置
CN106951270B (zh) 一种代码处理方法、系统及服务器
CN102882974A (zh) 一种通过网站识别版本号节省网站访问资源的方法
CN112256990B (zh) 一种图像处理方法及装置、计算机可读存储介质
CN110928767A (zh) 网页分析方法、装置、设备及存储介质
US20150067037A1 (en) Communication apparatus and communication method
CN110688596A (zh) 静态网页更新方法、装置、计算机设备和存储介质
CN107844488B (zh) 数据查询方法和装置
US8195762B2 (en) Locating a portion of data on a computer network
CN112631564A (zh) 基于内容管理系统界面生成方法、装置、设备和存储介质
US10116726B2 (en) Methods for bundling images and devices thereof
CN113469866A (zh) 数据处理方法、装置和服务器
CN114547564B (zh) 一种文档处理方法、装置及设备
US10574773B2 (en) Method, device, terminal, server and storage medium of processing network request and response
CN111431767A (zh) 多浏览器资源同步方法、装置、计算机设备和存储介质
US20080168229A1 (en) Method of Caching Data Assets
CN114297544A (zh) 一种远程浏览方法、装置、设备及存储介质
CN115495694B (zh) 一种网页数据的处理方法及装置
JP4405695B2 (ja) 更新情報の自動表示方法、装置、媒体およびプログラム
CN111273964A (zh) 一种数据加载方法及装置
CN113448649B (zh) 一种基于Redis的首页数据加载的服务器及方法
CN114186148A (zh) 页面加载方法、装置、电子设备及存储介质
CN113127788B (zh) 页面处理方法、对象处理方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant