CN110502711A - 页面展示方法、装置、电子设备及可读存储介质 - Google Patents
页面展示方法、装置、电子设备及可读存储介质 Download PDFInfo
- Publication number
- CN110502711A CN110502711A CN201910646295.2A CN201910646295A CN110502711A CN 110502711 A CN110502711 A CN 110502711A CN 201910646295 A CN201910646295 A CN 201910646295A CN 110502711 A CN110502711 A CN 110502711A
- Authority
- CN
- China
- Prior art keywords
- target text
- page
- background picture
- text
- coordinate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
- G06F16/986—Document structures and storage, e.g. HTML extensions
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- User Interface Of Digital Computer (AREA)
- Document Processing Apparatus (AREA)
Abstract
本公开的实施例提供了一种页面展示方法、装置、电子设备及可读存储介质,所述方法包括:在待展示的页面中确定目标文本;将所述目标文本写入预置格式的背景图片中;在所述页面对应的层叠样式表中记录所述目标文本在所述背景图片中的第一坐标;在展示所述页面的过程中,根据所述层叠样式表中记录的所述目标文本在所述背景图片中的所述第一坐标,定位所述背景图片中的所述目标文本。本公开的实施例可以增加获取页面信息的难度,减少页面信息的泄露。
Description
技术领域
本公开的实施例涉及网络技术领域,尤其涉及一种页面展示方法、装置、电子设备及可读存储介质。
背景技术
网络爬虫,是一种按照一定规则自动提取互联网中页面内容的程序或者脚本。随着网络爬虫的滥用,互联网中出现太多互相抄袭的内容,导致原创内容得不到保护。于是,为了保护互联网中的原创内容,出现了各种反网络爬虫技术。
例如,可以通过在页面中添加JavaScript(简称JS)代码,对页面进行JS渲染的方式,防止网络爬虫获取页面中的有效数据。然而,网络爬虫包括静态爬虫和动态爬虫,静态爬虫不能解析JS代码,因此,该方法可以有效防止静态爬虫。但是,动态爬虫可以通过解析页面中的JS代码,获取解码后的目标数据。
或者,还可以在页面的源码中添加噪声数据,该噪声数据对正常用户不可见,以达到干扰网络爬虫的目的。然而,添加噪声数据虽然可以在一定程度上迷惑网络爬虫,但是当网络爬虫推测出噪声数据的特征后,即可轻易的除去噪声数据从中提取目标数据。
可以看出,目前的反网络爬虫技术无法有效防止动态爬虫。
发明内容
本公开的实施例提供一种页面展示方法、装置、电子设备及可读存储介质,用以有效地防止网络中的动态爬虫。
根据本公开的实施例的第一方面,提供了一种页面展示方法,所述方法包括:
在待展示的页面中确定目标文本;
将所述目标文本写入预置格式的背景图片中;
在所述页面对应的层叠样式表中记录所述目标文本在所述背景图片中的第一坐标;
在展示所述页面的过程中,根据所述层叠样式表中记录的所述目标文本在所述背景图片中的所述第一坐标,定位所述背景图片中的所述目标文本。
根据本公开的实施例的第二方面,提供了一种页面展示装置,所述装置包括:
文本确定模块,用于在待展示的页面中确定目标文本;
图片写入模块,用于将所述目标文本写入预置格式的背景图片中;
样式更新模块,用于在所述页面对应的层叠样式表中记录所述目标文本在所述背景图片中的第一坐标;
目标定位模块,用于在展示所述页面的过程中,根据所述层叠样式表中记录的所述目标文本在所述背景图片中的所述第一坐标,定位所述背景图片中的所述目标文本。
根据本公开的实施例的第三方面,提供了一种电子设备,包括:
处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现前述页面展示方法。
根据本公开的实施例的第四方面,提供了一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行前述页面展示方法。
本公开的实施例提供了一种页面展示方法、装置、电子设备及可读存储介质,所述方法包括:
在待展示的页面中确定目标文本;将所述目标文本写入预置格式的背景图片中;在所述页面对应的层叠样式表中记录所述目标文本在所述背景图片中的第一坐标;在展示所述页面的过程中,根据所述层叠样式表中记录的所述目标文本在所述背景图片中的所述第一坐标,定位所述背景图片中的所述目标文本。
这样,在展示该页面时,可以不显示目标文本的原始数据,而是通过CSS样式定位到背景图片中对应的目标文本的第一坐标,实际显示的是预先在背景图片中写入的目标文本的图像信息。由此,爬虫只能爬取到目标文本的图像信息,如果想要获取该图像对应的文本内容,需要对图像执行文字识别等复杂操作,增加了获取页面信息的难度,可以减少页面信息的泄露。
附图说明
为了更清楚地说明本公开的实施例的技术方案,下面将对本公开的实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1示出了本公开的一个实施例中的页面展示方法的步骤流程图;
图2示出了在本公开的一个实施例中的页面展示装置的结构图;
图3示出了本公开的一个实施例提供的电子设备的结构图。
具体实施方式
下面将结合本公开的实施例中的附图,对本公开的实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开的实施例一部分实施例,而不是全部的实施例。基于本公开的实施例中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开的实施例保护的范围。
实施例一
参照图1,其示出了本公开的一个实施例中的页面展示方法的步骤流程图,包括:
步骤101、在待展示的页面中确定目标文本;
步骤102、将所述目标文本写入预置格式的背景图片中;
步骤103、在所述页面对应的层叠样式表中记录所述目标文本在所述背景图片中的第一坐标;以及
步骤104、在展示所述页面的过程中,根据所述层叠样式表中记录的所述目标文本在所述背景图片中的所述第一坐标,定位所述背景图片中的所述目标文本。
本公开实施例提供的页面展示方法可用于防止静态爬虫以及动态爬虫对网站中网页内容的爬取,以减少页面信息的泄露。本公开实施例中的页面可以为网站中的网页,如HTML(Hyper Text Markup Language,超文本标记语言)页面。
具体地,本公开的实施例可以在待展示的页面中确定目标文本,将目标文本写入预置格式的背景图片中,并且在该页面的CSS(Cascading Style Sheets,层叠样式表)中记录目标文本在背景图片中的第一坐标。这样,在展示该页面时,可以不显示目标文本的原始数据,而是通过CSS样式定位到背景图片中对应的目标文本的第一坐标,实际显示的是预先在背景图片中写入目标文本的图像信息。
由此,爬虫只能爬取到目标文本的图像信息,如果想要获取该图像对应的文本内容,需要对图像执行文字识别等复杂操作,增加了获取页面信息的难度,可以减少页面信息的泄露。
可选地,本公开的实施例在待展示的页面中确定目标文本之后,还可以根据目标文本在所述页面中的位置,确定目标文本写入背景图片的第一坐标,以使目标文本在背景图片中的显示位置与在所述页面中的显示位置保持一致。
可以理解,本公开的实施例对背景图片的格式不加以限制,所述预置格式的背景图片可以包括矢量图、或者非矢量图等任意格式的图片,如JPEG(Joint PhotographicExperts Group,图像格式)图片、PNG(Portable Network Graphics,便携式网络图形)图片等。在本公开的一种可选实施例中,所述预置格式可以包括:可缩放矢量图形。
SVG(Scalable Vector Graphics,可缩放矢量图形)是一种基于可扩展标记语言、用于描述二维矢量图形的图形格式。与常用的JPEG、PNG等非矢量图像格式相比,使用SVG的优势在于:第一、SVG的尺寸更小,在网页上运行速度更快,因此可以提高页面展示的速度;第二、SVG具有可伸缩性,在放大的情况下可以保证图像的质量不下降,而JPEG、PNG等非矢量图像被放大后,边缘会出现很明显的锯齿;第三、SVG是一种XML(Extensible MarkupLanguage,可扩展标记语言),易于编程处理,可以提高将目标文本写入图片的效率。
在本公开的一种可选实施例中,在所述将所述目标文本写入预置格式的背景图片中的步骤之前,所述方法还可以包括:获取所述目标文本在所述页面中的字体属性;其中,所述字体属性具体可以包括:字体名称、字体大小、以及字体颜色中的至少一项;
所述将所述目标文本写入预置格式的背景图片中,具体可以包括:将所述目标文本按照所述字体属性,写入预置格式的背景图片中。
为了使得待展示的页面可以保持原有的展示效果,增强用户体验,本公开的实施例在将目标文本写入背景图片之前,获取所述目标文本在所述页面中的字体属性,例如字体名称、字体大小、以及字体颜色等,并且按照目标文本在页面中的字体属性,将目标文本写入背景图片,使得目标文本在背景图片中显示的字体名称、字体大小、以及字体颜色等与在待展示的页面中保持一致。
在本公开的一种可选实施例中,所述目标文本可以为根据预置的随机选择算法,从所述页面的所有文本中,随机选择所得到;或者,所述目标文本还可以包括所述页面中的所有文本。
其中,所述目标文本可以包括字、词、短语、句子、段落等任意文本内容。可以理解,本公开的实施例对于从待展示的页面中选择目标文本的具体方式不加以限制,可以根据预置的随机选择算法,从待展示的页面中,随机选择部分文本作为目标文本;或者,还可以直接将待展示页面中的所有文本作为目标文本。
可选地,还可以设置预置词库,预置词库用于保存页面中可被替换的预置文本,所述预置文本可以包括字、词、短语、句子、段落等任意文本内容。在具体应用中,可以对随机选择的目标文本与预置词库进行匹配,如果预置词库中存在与随机选择的目标文本相匹配的预置文本,则将匹配的目标文本写入背景图片。或者,也可以将待展示页面中的所有文本与预置词库进行匹配,将待展示页面中与预置词库中的预置文本相匹配的文本确定为目标文本,写入背景图片,如果待展示的页面中不存在与预置词库中的预置词相匹配的文本,则按照现有的页面展示方式进行展示。
可选地,本公开的实施例可以统计网络中爬虫爬取的高频词汇,将这些高频词汇作为预置文本加入预置词库,不仅可以提高反爬虫的效果,而且可以减少将所有文本作为目标文本写入背景图片所需的操作成本。
在本公开的一种可选实施例中,所述将所述目标文本写入预置格式的背景图片中,具体可以包括:
步骤S11、根据待展示的页面中的所述目标文本,查询预置词库,以得到筛选后的目标文本;其中,所述筛选后的目标文本在所述预置词库中存在相匹配的预置文本;
步骤S12、根据所述筛选后的目标文本的字体大小、以及所述背景图片的大小,确定所述筛选后的目标文本在所述背景图片中的第一坐标;以及
步骤S13、根据所述筛选后的目标文本在所述背景图片中的第一坐标,将所述筛选后的目标文本,按照所述预置格式,写入所述背景图片中。
具体地,在待展示的页面中确定目标文本之后,首先根据确定的目标文本查询预置词库,以对目标文本进行筛选,如果目标文本在所述预置词库中存在对应的预置文本,则保留该目标文本,否则,过滤掉该目标文本。
然后,根据所述筛选后的目标文本的字体大小、以及所述背景图片的大小,确定所述筛选后的目标文本在所述背景图片中的第一坐标。例如,根据SVG背景图片的大小、目标文本在页面中的字体大小等文字属性,计算出目标文本在SVG背景图片中的x轴坐标和y轴坐标,按照该x轴坐标和y轴坐标,将目标文本写入SVG背景图片,使得目标文本显示在SVG背景图片中的预设位置。
在本公开的一种可选实施例中,在将所述目标文本写入预置格式的背景图片中的步骤之后,所述方法还可以包括:
步骤S21、将所述目标文本编码为随机文本字符串,并存储所述目标文本与所述随机文本字符串之间的映射关系;以及
步骤S22、根据所述目标文本与所述随机文本字符串之间的所述映射关系、以及所述目标文本在所述背景图片中的所述第一坐标,确定所述随机文本字符串在所述背景图片中的第二坐标;
其中,所述在所述页面对应的层叠样式表中记录所述目标文本在所述背景图片中的第一坐标的步骤,具体可以包括:在所述页面对应的所述层叠样式表中记录所述随机文本字符串在所述背景图片中的所述第二坐标;
其中,所述定位所述背景图片中的所述目标文本的步骤,具体可以包括:定位所述背景图片中的所述目标文本对应的所述随机文本字符串。
为了进一步增加爬虫获取页面信息的难度,本公开的实施例在将目标文本按照第一坐标写入预置格式的背景图片中之后,将目标文本编码为随机文本字符串,并且存储所述目标文本与所述随机文本字符串之间的映射关系,根据所述目标文本与所述随机文本字符串之间的所述映射关系、以及所述目标文本在所述背景图片中的所述第一坐标,确定所述随机文本字符串在所述背景图片中的第二坐标,将所述第二坐标写入页面的层叠样式表,可以理解,所述第一坐标和所述第二坐标可以为相同的坐标或者不同的坐标。这样,在展示页面的过程中,定位的是随机文本字符串的第二坐标。由此,本公开实施例在展示页面的过程中,页面中的目标文本仅以背景图片中的图像形式、或者随机文本字符串的形式所存在,爬虫无法获取目标文本的原始数据,可以进一步提高反爬虫的效果。
可选地,本公开的实施例可以将所述目标文本与所述随机文本字符串之间的映射关系保存在加密服务器中,以进一步提高目标文本的安全性。
在本公开的一种应用示例中,首先,根据预置的随机选择算法,从待展示的页面中,选择目标文本,对随机选择的目标文本与预置词库进行匹配,保留与预置词库中的预置文本相匹配的目标文本。然后,根据SVG背景图片的大小、目标文本在页面中的字体大小等文字属性,计算出目标文本在SVG背景图片中的第一坐标,如x轴坐标和y轴坐标,按照该x轴坐标和y轴坐标,将目标文本写入SVG背景图片。接下来,将写入SVG背景图片的目标文本编码为随机文本字符串,并保存目标文本与随机文本字符串之间的映射关系,将随机文本字符串作为CSS的类名,SVG背景图片作为待展示页面的背景图,x轴坐标和y轴坐标作为偏移量,按照CSS规范写入到CSS样式文件中,以更新待展示的页面的CSS样式文件。
例如,待展示页面中包含文本“你我他”,假设确定目标文本为“我”,对目标文本“我”生成的随机文本字符串为“asdf”,text.svg文件为SVG背景图片,目标文本“我”的第一坐标为(a,b),其中,x轴坐标和y轴坐标分别为a和b,则可以将第一坐标(a,b)作为随机文本字符串为“asdf”的第二坐标,则待展示页面对应的CSS表中可以包括如下内容:.asdf{background-image:text.svg;background:apx bpx;}。
最后,后端在输出待展示页面时,对每一个目标文本可以创建对应的HTML DOM(Document Object Model,文档对象模型)元素,将目标文本对应的随机字符串作为CSS类名。如目标文本“我”对应的随机文本字符串为“asdf”,创建的HTML DOM元素可以为<spanclass=“asdf”></span>;如果目标文本在预置词库中不存在相匹配的预置文本,则可以不进行替换。对于待展示页面中的文本“你我他”,替换后的待展示页面源码中的信息为“你<span class=“asdf”></span>他”,浏览器通过待展示页面的CSS表定位到SVG背景图片中随机文本字符串“asdf”对应的第二坐标(a,b),根据随机文本字符串与目标文本之间的映射关系,使得用户可以看到的页面显示结果仍然为“你我他”,只不过用户看到的“我”字实际上是SVG背景图片中“我”字的图像信息,爬虫只能获取到包含HTML DOM元素的数据,或者SVG背景的图像信息,无法直接获取页面中目标文本的原始数据,可以提高目标文本的保密性,减少页面信息的泄露。
在本公开的一种可选实施例中,在所述将所述目标文本写入预置格式的背景图片中的步骤之后,所述方法还可以包括:
步骤S31、将所述目标文本在所述背景图片中的所述第一坐标编码为随机坐标字符串,并存储所述第一坐标与所述随机坐标字符串之间的映射关系;以及
步骤S32、在所述页面对应的所述层叠样式表中记录所述目标文本对应的所述随机坐标字符串;
其中,所述定位所述背景图片中的所述目标文本的步骤,具体可以包括:
步骤S41、根据所述第一坐标与所述随机坐标字符串之间的映射关系,对所述随机坐标字符串进行解码,以得到所述目标文本在所述背景图片中的所述第一坐标;以及
步骤S42、根据所述目标文本在所述背景图片中的所述第一坐标,定位所述背景图片中的所述目标文本。
在本公开的实施例中,在将目标文本写入SVG背景图片中之后,可以保存目标文本与目标文本在SVG背景图片中的第一坐标之间的对应关系,后端输出页面时将预置词库中存在的目标文本替换为HTML DOM元素,通过可逆算法将目标文本在SVG背景图片中的第一坐标编码为随机坐标字符串,使用该随机坐标字符串作为DOM元素的类名,前端页面可以通过JavaScript(脚本语言)对随机坐标字符串进行解码,以获取目标文本在SVG背景图片中的第一坐标,根据该第一坐标,定位SVG背景图片中的目标文本。
通过本公开的实施例,可以对目标文本在SVG背景图片中的第一坐标进行编码得到对应的随机坐标字符串,将随机坐标字符串写入CSS中,而不是直接将目标文本在SVG背景图片中的第一坐标写入CSS中,在页面展示过程中,通过JavaScript来完成随机坐标字符串的解码,得到目标文本在SVG背景图片中的第一坐标,进而实现在SVG背景图片中对目标文本的定位。由此,即使爬虫获取到页面的CSS文件,也只能获取目标文本的第一坐标对应的随机坐标字符串,无法获取目标文本的真实坐标,可以进一步提高目标文本的安全性,减少页面信息的泄露。
综上,本公开的实施例在待展示的页面中确定目标文本,并且将所述目标文本写入预置格式的背景图片中,以及在所述页面对应的层叠样式表中记录所述目标文本在所述背景图片中的第一坐标;进而在展示所述页面的过程中,可以根据所述页面的层叠样式表中记录的所述目标文本在所述背景图片中的所述第一坐标,定位所述背景图片中的所述目标文本。这样,在展示该页面时,可以不显示目标文本的原始数据,而是通过CSS样式定位到背景图片中对应的目标文本的第一坐标,实际显示的是预先在背景图片中写入的目标文本的图像信息。由此,爬虫只能爬取到目标文本的图像信息,如果想要获取该图像对应的文本内容,需要对图像执行文字识别等复杂操作,增加了获取页面信息的难度,可以减少页面信息的泄露。
实施例二
参照图2,其示出了在本公开的一个实施例中的页面展示装置的结构图,具体如下。
文本确定模块201,用于在待展示的页面中确定目标文本;
图片写入模块202,用于将所述目标文本写入预置格式的背景图片中;
样式更新模块203,用于在所述页面对应的层叠样式表中记录所述目标文本在所述背景图片中的第一坐标;以及
目标定位模块204,用于在展示所述页面的过程中,根据所述层叠样式表中记录的所述目标文本在所述背景图片中的所述第一坐标,定位所述背景图片中的所述目标文本。
可选地,所述装置还可以包括:
第一编码模块,用于将所述目标文本编码为随机文本字符串,并存储所述目标文本与所述随机文本字符串之间的映射关系;以及
第一确定模块,用于根据所述目标文本与所述随机文本字符串之间的所述映射关系、以及所述目标文本在所述背景图片中的所述第一坐标,确定所述随机文本字符串在所述背景图片中的第二坐标;
其中,所述样式更新模块203,具体用于在所述页面对应的所述层叠样式表中记录所述随机文本字符串在所述背景图片中的所述第二坐标;
其中,所述目标定位模块204,具体可以包括:
第一定位子模块,用于定位所述背景图片中的所述目标文本对应的所述随机文本字符串。
可选地,所述装置还可以包括:
第二编码模块,用于将所述目标文本在所述背景图片中的所述第一坐标编码为随机坐标字符串,并存储所述第一坐标与所述随机坐标字符串之间的映射关系;以及
所述样式更新模块203,具体用于在所述页面对应的所述层叠样式表中记录所述目标文本对应的所述随机坐标字符串;
其中,所述目标定位模块204,具体可以包括:
坐标解析子模块,用于根据所述第一坐标与所述随机坐标字符串之间的映射关系,对所述随机坐标字符串进行解码,以得到所述目标文本在所述背景图片中的所述第一坐标;以及
第二定位子模块,用于根据所述目标文本在所述背景图片中的所述第一坐标,定位所述背景图片中的所述目标文本。
可选地,所述目标文本可以为根据预置的随机选择算法,从所述页面的所有文本中,随机选择所得到;或者,所述目标文本可以包括所述页面中的所有文本。
可选地,所述图片写入模块202,具体可以包括:
目标过滤子模块,用于根据待展示的页面中的所述目标文本,查询预置词库,以得到筛选后的目标文本;其中,所述筛选后的目标文本在所述预置词库中存在相匹配的预置文本;
坐标确定子模块,用于根据所述筛选后的目标文本的字体大小、以及所述背景图片的大小,确定所述筛选后的目标文本在所述背景图片中的第一坐标;以及
文本写入子模块,用于根据所述筛选后的目标文本在所述背景图片中的第一坐标,将所述筛选后的目标文本,按照所述预置格式,写入所述背景图片中。
可选地,所述装置还可以包括:
属性获取模块,用于获取所述目标文本在所述页面中的字体属性;其中,所述字体属性包括:字体名称、字体大小、以及字体颜色中的至少一项;
所述图片生成模块,用于将所述目标文本按照所述字体属性,写入预置格式的背景图片中。
可选地,所述预置格式具体可以包括:可缩放矢量图形。
综上所述,本公开的实施例提供了一种页面展示装置,所述装置包括:文本确定模块201,用于在待展示的页面中确定目标文本;图片写入模块202,用于将所述目标文本写入预置格式的背景图片中;样式更新模块203,用于在所述页面对应的层叠样式表中记录所述目标文本在所述背景图片中的第一坐标;以及目标定位模块204,用于在展示所述页面的过程中,根据所述层叠样式表中记录的所述目标文本在所述背景图片中的所述第一坐标,定位所述背景图片中的所述目标文本。这样,在展示该页面时,可以不显示目标文本的原始数据,而是通过CSS样式定位到背景图片中对应的目标文本的第一坐标,实际显示的是预先在背景图片中写入的目标文本的图像信息。由此,爬虫只能爬取到目标文本的图像信息,如果想要获取该图像对应的文本内容,需要对图像执行文字识别等复杂操作,增加了获取页面信息的难度,可以减少页面信息的泄露。
本公开的实施例还提供了一种电子设备,参见图3,包括:处理器301、存储器302以及存储在所述存储器上并可在所述处理器上运行的计算机程序3021,所述处理器执行所述程序时实现前述实施例的页面展示方法。
本公开的实施例还提供了一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行前述实施例的页面展示方法。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本公开的实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本公开的实施例的内容,并且上面对特定语言所做的描述是为了披露本公开的实施例的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本公开的实施例的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本公开的实施例的示例性实施例的描述中,本公开的实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本公开的实施例要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本公开的实施例的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
本公开的实施例的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本公开的实施例的排序设备中的一些或者全部部件的一些或者全部功能。本公开的实施例还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序。这样的实现本公开的实施例的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本公开的实施例进行说明而不是对本公开的实施例进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本公开的实施例可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
以上所述仅为本公开的实施例的较佳实施例而已,并不用以限制本公开的实施例,凡在本公开的实施例的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本公开的实施例的保护范围之内。
以上所述,仅为本公开的实施例的具体实施方式,但本公开的实施例的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开的实施例揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本公开的实施例的保护范围之内。因此,本公开的实施例的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种页面展示方法,其特征在于,所述方法包括:
在待展示的页面中确定目标文本;
将所述目标文本写入预置格式的背景图片中;
在所述页面对应的层叠样式表中记录所述目标文本在所述背景图片中的第一坐标;以及
在展示所述页面的过程中,根据所述层叠样式表中记录的所述目标文本在所述背景图片中的所述第一坐标,定位所述背景图片中的所述目标文本。
2.根据权利要求1所述的方法,其特征在于,在所述将所述目标文本写入预置格式的背景图片中的步骤之后,所述方法还包括:
将所述目标文本编码为随机文本字符串,并存储所述目标文本与所述随机文本字符串之间的映射关系;以及
根据所述目标文本与所述随机文本字符串之间的所述映射关系、以及所述目标文本在所述背景图片中的所述第一坐标,确定所述随机文本字符串在所述背景图片中的第二坐标;
其中,所述在所述页面对应的层叠样式表中记录所述目标文本在所述背景图片中的第一坐标的步骤,包括:在所述页面对应的所述层叠样式表中记录所述随机文本字符串在所述背景图片中的所述第二坐标;
其中,所述定位所述背景图片中的所述目标文本的步骤,包括:定位所述背景图片中的所述目标文本对应的所述随机文本字符串。
3.根据权利要求1所述的方法,其特征在于,在所述将所述目标文本写入预置格式的背景图片中的步骤之后,所述方法还包括:
将所述目标文本在所述背景图片中的所述第一坐标编码为随机坐标字符串,并存储所述第一坐标与所述随机坐标字符串之间的映射关系;以及
在所述页面对应的所述层叠样式表中记录所述目标文本对应的所述随机坐标字符串;
其中,所述定位所述背景图片中的所述目标文本的步骤,包括:
根据所述第一坐标与所述随机坐标字符串之间的映射关系,对所述随机坐标字符串进行解码,以得到所述目标文本在所述背景图片中的所述第一坐标;以及
根据所述目标文本在所述背景图片中的所述第一坐标,定位所述背景图片中的所述目标文本。
4.根据权利要求1所述的方法,其特征在于,所述目标文本为根据预置的随机选择算法,从所述页面的所有文本中,随机选择所得到;或者,所述目标文本包括所述页面中的所有文本。
5.根据权利要求1所述的方法,其特征在于,所述将所述目标文本写入预置格式的背景图片中,包括:
根据待展示的页面中的所述目标文本,查询预置词库,以得到筛选后的目标文本;其中,所述筛选后的目标文本在所述预置词库中存在相匹配的预置文本;
根据所述筛选后的目标文本的字体大小、以及所述背景图片的大小,确定所述筛选后的目标文本在所述背景图片中的第一坐标;以及
根据所述筛选后的目标文本在所述背景图片中的第一坐标,将所述筛选后的目标文本,按照所述预置格式,写入所述背景图片中。
6.根据权利要求1所述的方法,其特征在于,在所述将所述目标文本写入预置格式的背景图片中的步骤之前,所述方法还包括:
获取所述目标文本在所述页面中的字体属性;其中,所述字体属性包括:字体名称、字体大小、以及字体颜色中的至少一项;
所述将所述目标文本写入预置格式的背景图片中,包括:
将所述目标文本按照所述字体属性,写入预置格式的背景图片中。
7.根据权利要求1至6任一所述的方法,其特征在于,所述预置格式包括:可缩放矢量图形。
8.一种页面展示装置,其特征在于,所述装置包括:
文本确定模块,用于在待展示的页面中确定目标文本;
图片写入模块,用于将所述目标文本写入预置格式的背景图片中;
样式更新模块,用于在所述页面对应的层叠样式表中记录所述目标文本在所述背景图片中的第一坐标;以及
目标定位模块,用于在展示所述页面的过程中,根据所述层叠样式表中记录的所述目标文本在所述背景图片中的所述第一坐标,定位所述背景图片中的所述目标文本。
9.一种电子设备,其特征在于,包括:
处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中一个或多个所述的页面展示方法。
10.一种可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如方法权利要求1-7中一个或多个所述的页面展示方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910646295.2A CN110502711B (zh) | 2019-07-17 | 2019-07-17 | 页面展示方法、装置、电子设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910646295.2A CN110502711B (zh) | 2019-07-17 | 2019-07-17 | 页面展示方法、装置、电子设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110502711A true CN110502711A (zh) | 2019-11-26 |
CN110502711B CN110502711B (zh) | 2022-08-26 |
Family
ID=68585327
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910646295.2A Active CN110502711B (zh) | 2019-07-17 | 2019-07-17 | 页面展示方法、装置、电子设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110502711B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111506917A (zh) * | 2020-03-31 | 2020-08-07 | 北京三快在线科技有限公司 | 页面展示方法、展示装置、可读存储介质及电子设备 |
CN112016267A (zh) * | 2020-08-05 | 2020-12-01 | 北京达佳互联信息技术有限公司 | 一种图标字体处理方法、装置及存储介质 |
CN112613270A (zh) * | 2020-12-22 | 2021-04-06 | 百色学院 | 基于预训练的绘画创作模型对目标文本进行样式推荐的方法、系统、设备及存储介质 |
CN112817568A (zh) * | 2021-02-02 | 2021-05-18 | 中国工商银行股份有限公司 | 微框架下的子应用样式设置方法及装置 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006122164A2 (en) * | 2005-05-09 | 2006-11-16 | Riya, Inc. | System and method for enabling the use of captured images through recognition |
CN101776991A (zh) * | 2009-12-28 | 2010-07-14 | 金蝶软件(中国)有限公司 | 一种控件的显示文本的替换方法和装置 |
CN101814118A (zh) * | 2009-07-02 | 2010-08-25 | 西安电子科技大学 | 基于图片的网页文本保护方法 |
CN102314409A (zh) * | 2010-06-30 | 2012-01-11 | 深圳市易万卷文化产业有限公司 | 一种下载页面信息的方法及其装置、一种服务端 |
CN104281626A (zh) * | 2013-07-12 | 2015-01-14 | 阿里巴巴集团控股有限公司 | 基于图片化处理的网页展示方法及网页展示装置 |
WO2015092934A1 (ja) * | 2013-12-20 | 2015-06-25 | 池田 秀樹 | 情報配信システム、情報配信方法及び情報配信プログラム |
CN105577684A (zh) * | 2016-01-25 | 2016-05-11 | 北京京东尚科信息技术有限公司 | 防爬虫抓取的方法、服务端、客户端和系统 |
CN107220291A (zh) * | 2017-04-25 | 2017-09-29 | 深圳中兴网信科技有限公司 | 网页数据防抓取的方法及系统 |
CN107357921A (zh) * | 2017-07-21 | 2017-11-17 | 北京奇艺世纪科技有限公司 | 一种小文件存储定位方法及系统 |
US20180004845A1 (en) * | 2015-10-16 | 2018-01-04 | Carlos A. Munoz | Web Based Information Search Method |
US10007776B1 (en) * | 2017-05-05 | 2018-06-26 | Mastercard Technologies Canada ULC | Systems and methods for distinguishing among human users and software robots |
US20190073342A1 (en) * | 2016-03-11 | 2019-03-07 | Eric Cameron Wilson | Presentation of electronic information |
CN109446490A (zh) * | 2018-09-13 | 2019-03-08 | 杭州索骥数据科技有限公司 | Pdf文件的预览方法、生成方法及处理方法 |
CN109871667A (zh) * | 2019-02-18 | 2019-06-11 | 北京创鑫旅程网络技术有限公司 | 数据内容保护方法、装置、服务器及计算机可读介质 |
-
2019
- 2019-07-17 CN CN201910646295.2A patent/CN110502711B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006122164A2 (en) * | 2005-05-09 | 2006-11-16 | Riya, Inc. | System and method for enabling the use of captured images through recognition |
CN101814118A (zh) * | 2009-07-02 | 2010-08-25 | 西安电子科技大学 | 基于图片的网页文本保护方法 |
CN101776991A (zh) * | 2009-12-28 | 2010-07-14 | 金蝶软件(中国)有限公司 | 一种控件的显示文本的替换方法和装置 |
CN102314409A (zh) * | 2010-06-30 | 2012-01-11 | 深圳市易万卷文化产业有限公司 | 一种下载页面信息的方法及其装置、一种服务端 |
CN104281626A (zh) * | 2013-07-12 | 2015-01-14 | 阿里巴巴集团控股有限公司 | 基于图片化处理的网页展示方法及网页展示装置 |
WO2015092934A1 (ja) * | 2013-12-20 | 2015-06-25 | 池田 秀樹 | 情報配信システム、情報配信方法及び情報配信プログラム |
US20180004845A1 (en) * | 2015-10-16 | 2018-01-04 | Carlos A. Munoz | Web Based Information Search Method |
CN105577684A (zh) * | 2016-01-25 | 2016-05-11 | 北京京东尚科信息技术有限公司 | 防爬虫抓取的方法、服务端、客户端和系统 |
US20190073342A1 (en) * | 2016-03-11 | 2019-03-07 | Eric Cameron Wilson | Presentation of electronic information |
CN107220291A (zh) * | 2017-04-25 | 2017-09-29 | 深圳中兴网信科技有限公司 | 网页数据防抓取的方法及系统 |
US10007776B1 (en) * | 2017-05-05 | 2018-06-26 | Mastercard Technologies Canada ULC | Systems and methods for distinguishing among human users and software robots |
CN107357921A (zh) * | 2017-07-21 | 2017-11-17 | 北京奇艺世纪科技有限公司 | 一种小文件存储定位方法及系统 |
CN109446490A (zh) * | 2018-09-13 | 2019-03-08 | 杭州索骥数据科技有限公司 | Pdf文件的预览方法、生成方法及处理方法 |
CN109871667A (zh) * | 2019-02-18 | 2019-06-11 | 北京创鑫旅程网络技术有限公司 | 数据内容保护方法、装置、服务器及计算机可读介质 |
Non-Patent Citations (2)
Title |
---|
刘可: "移动通信中的金融类钓鱼网页检测方法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
董枫: "移动应用广告生态系统安全分析关键技术研究", 《中国博士学位论文全文数据库 信息科技辑》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111506917A (zh) * | 2020-03-31 | 2020-08-07 | 北京三快在线科技有限公司 | 页面展示方法、展示装置、可读存储介质及电子设备 |
CN112016267A (zh) * | 2020-08-05 | 2020-12-01 | 北京达佳互联信息技术有限公司 | 一种图标字体处理方法、装置及存储介质 |
CN112613270A (zh) * | 2020-12-22 | 2021-04-06 | 百色学院 | 基于预训练的绘画创作模型对目标文本进行样式推荐的方法、系统、设备及存储介质 |
CN112613270B (zh) * | 2020-12-22 | 2024-05-28 | 百色学院 | 对目标文本进行样式推荐的方法、系统、设备及存储介质 |
CN112817568A (zh) * | 2021-02-02 | 2021-05-18 | 中国工商银行股份有限公司 | 微框架下的子应用样式设置方法及装置 |
CN112817568B (zh) * | 2021-02-02 | 2024-01-26 | 中国工商银行股份有限公司 | 微框架下的子应用样式设置方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110502711B (zh) | 2022-08-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110502711A (zh) | 页面展示方法、装置、电子设备及可读存储介质 | |
US9558402B2 (en) | Data processing systems, devices, and methods for content analysis | |
CN105577684B (zh) | 防爬虫抓取的方法、服务端、客户端和系统 | |
CN110235122B (zh) | 用于将web内容转化为可重复使用的模板和组件的系统和方法 | |
Hazzard | Openlayers 2.10 beginner's guide | |
CN103946836B (zh) | 使用非光栅地图数据的修改来渲染地图图像的方法和设备 | |
CN101796543B (zh) | 数据系统和方法 | |
KR20150079867A (ko) | Html5-프로토콜 기반 웹페이지 표시 방법 및 장치 | |
KR20100057089A (ko) | 큰 오브젝트를 작은 디스플레이 위에 표현 | |
WO2016095502A1 (zh) | 数学公式处理方法、装置、设备和计算机存储介质 | |
CN106897251A (zh) | 富文本展示方法及装置 | |
CN109165357A (zh) | 图片生成方法、服务器、电子设备及可读存储介质 | |
CN105989126A (zh) | 一种网页显示方法及装置 | |
ES2266185T3 (es) | Procesamiento de documentos digitales. | |
CN104794174A (zh) | 用于显示网页标记信息的方法与装置 | |
CN117093386B (zh) | 页面截图方法、装置、计算机设备和存储介质 | |
US9015851B2 (en) | Electronic book content protection | |
EP3491536A1 (en) | Scalable vector graphics bundles | |
Gustafson | HTML5 Web Application Development By Example Beginner's guide | |
US20070206022A1 (en) | Method and apparatus for associating text with animated graphics | |
CN110362790A (zh) | 字体文件的处理方法、装置、电子设备及可读存储介质 | |
CN111914226A (zh) | 背景图片的生成方法和装置 | |
Sikora | Dart Essentials | |
CN109948123A (zh) | 一种图像合并方法及装置 | |
Zant | Hands-on prototyping in system analysis and design |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |