CN110674444A - 一种动态网页下载的方法及终端 - Google Patents

一种动态网页下载的方法及终端 Download PDF

Info

Publication number
CN110674444A
CN110674444A CN201910891169.3A CN201910891169A CN110674444A CN 110674444 A CN110674444 A CN 110674444A CN 201910891169 A CN201910891169 A CN 201910891169A CN 110674444 A CN110674444 A CN 110674444A
Authority
CN
China
Prior art keywords
webpage
dynamic
generating
web page
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910891169.3A
Other languages
English (en)
Other versions
CN110674444B (zh
Inventor
孙永强
许文佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hisense Mobile Communications Technology Co Ltd
Original Assignee
Hisense Mobile Communications Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hisense Mobile Communications Technology Co Ltd filed Critical Hisense Mobile Communications Technology Co Ltd
Priority to CN201910891169.3A priority Critical patent/CN110674444B/zh
Publication of CN110674444A publication Critical patent/CN110674444A/zh
Application granted granted Critical
Publication of CN110674444B publication Critical patent/CN110674444B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/972Access to data in other repository systems, e.g. legacy data or dynamic Web page generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9562Bookmark management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种动态网页下载的方法及终端,用于将动态网页下载到本地便于用户查看。该方法包括:响应动态网页下载指令,将应用中动态网页的信息资源地址发送给服务器;通过所述服务器获取所述信息资源地址对应的动态网页信息;对所述动态网页信息中的网页内容对应的字符串进行解析,得到所述动态网页中网页内容对应的超文本标记语言格式的字符串;根据所述超文本标记语言格式的字符串生成本地网页。

Description

一种动态网页下载的方法及终端
技术领域
本发明涉及技术计算机技术领域,尤其涉及一种动态网页下载的方法及终端。
背景技术
现在处于网络信息、网络文章爆炸的时代,在使用手机上网时会阅读各种文章,有时候遇到喜欢的文章没有时间阅读,但是过后又找不到该篇文章;或者在一些没有网络的环境下想阅读查看一些网络文章,因此需要把文章离线收藏到本机进行阅读。
一般的,网页分为静态网页和动态网页,静态网页是一次性写好放在服务器上进行浏览,进行收藏比较简单,可以直接联网下载网页内容;动态网页是网页脚本将网页内容动态存储到数据库中,用户访问网页内容通过读取数据库来动态生成网页的方法,如果直接联网下载是无法下载到网页内容的,只会下载到一些javaScript脚本。
因此,对于动态网页,用户无法将动态网页离线收藏到本机,无法下载动态网页。
发明内容
本发明提供一种动态网页下载的方法及终端,用于将动态网页下载到本地便于用户查看。
第一方面,本发明提供一种动态网页下载的方法,应用于终端,该方法包括:
响应动态网页下载指令,将应用中动态网页的信息资源地址发送给服务器;
通过所述服务器获取所述信息资源地址对应的动态网页信息;
对所述动态网页信息中的网页内容对应的字符串进行解析,得到所述动态网页中网页内容对应的超文本标记语言格式的字符串;
根据所述超文本标记语言格式的字符串生成本地网页。
针对终端的应用APP中的动态网页是使用网页脚本语言例如php、asp、asp.net等的文件信息,通过使用网页脚本语言的文件将网页内容动态存储到数据库,用户访问网站时通过读取数据库来动态生成网页,因此即使用户可以从服务器下载动态网页,由于动态网页是通过网页脚本语言存储在数据库中的,因此无法直接获取动态网页的内容,只可能返回该动态网页的脚本信息;
本发明提出一种从服务器获取动态网页信息,从而将所述动态网页信息中的网页内容对应的字符串进行解析,从而从所述动态网页的脚本信息中解析出网页内容,并转化为超文本标记语言格式的字符串,根据所述超文本标记语言格式的字符串便可以生成本地网页,便于用户查看。
在一种可能的实现方式中,通过如下方式获取所述应用中动态网页的信息资源地址,包括:
通过底层接口获取应用中当前显示的动态网页的标识信息;
根据所述动态网页所在的应用的地址格式和获取的所述标识信息,生成所述动态网页的信息资源地址。
由于动态网页的脚本信息是存储于服务器侧的数据库中,终端无法从当前的动态网页中直接得到动态网页中的脚本信息,因此需要首先生成当前动态网页的信息资源地址,然后将该信息资源地址发送给服务器,从服务器侧获取所述信息资源地址对应的动态网页信息,所述动态网页信息包括动态网页的脚本信息。而一般的终端的应用中的动态网页的信息资源地址大都具有特定的格式,不同的应用APP中的动态网页的信息资源地址的格式不同,因此通过底层接口首先获取应用中当前显示的动态网页的标识信息,该标识信息可以是全局属性item_id,理解为该动态网页的ID,然后通过该标识信息以及当前动态网页所在的应用的地址格式,进行拼接生成该动态网页的信息资源地址。
在一种可能的实现方式中,对所述动态网页信息中的网页内容对应的字符串进行解析,得到所述动态网页中网页内容对应的超文本标记语言格式的字符串,包括:
通过解析引擎获取所述动态网页中网页内容对应的转义字符串;
对所述转义字符串进行反转义,得到所述动态网页中网页内容对应的超文本标记语言格式的字符串。
由于动态网页的网页内容都是通过转义字符的形式写在脚本中,因此可以通过解析引擎获取所述动态网页中网页内容对应的转义字符串,同时对所述转义字符串进行反转义,得到所述动态网页中网页内容对应的超文本标记语言格式的字符串,便于生成本地网页。
在一种可能的实现方式中,所述解析引擎为JavaScript引擎或正则表达式引擎。
本发明中的JavaScript引擎或正则表达式引擎都可以通过调用第三方jar包(第三方解析引擎)的方式,将一些网页内容转成超文本标记语言html格式中的字符。
在一种可能的实现方式中,所述超文本标记语言格式的字符串包括如下任一或任多个:
网页内容标题对应的字符串、网页内容正文对应的字符串、网页标签对应的字符串、网页图标的信息资源地址对应的字符串。
本实施例能够对动态网页中的所有内容进行下载,包括标题、文字、图片等。
第二方面,本发明提供一种动态网页下载的终端,该终端包括:处理器以及存储器,其中,所述存储器存储有程序代码,当所述存储器存储的一个或多个计算机程序被所述处理器执行时,使得所述终端执行下列过程:
响应动态网页下载指令,将应用中动态网页的信息资源地址发送给服务器;
通过所述服务器获取所述信息资源地址对应的动态网页信息;
对所述动态网页信息中的网页内容对应的字符串进行解析,得到所述动态网页中网页内容对应的超文本标记语言格式的字符串;
根据所述超文本标记语言格式的字符串生成本地网页。
在一种可能的实现方式中,所述处理器具体用于:
通过底层接口获取应用中当前显示的动态网页的标识信息;
根据所述动态网页所在的应用的地址格式和获取的所述标识信息,生成所述动态网页的信息资源地址。
在一种可能的实现方式中,所述处理器具体用于:
通过解析引擎获取所述动态网页中网页内容对应的转义字符串;
对所述转义字符串进行反转义,得到所述动态网页中网页内容对应的超文本标记语言格式的字符串。
在一种可能的实现方式中,所述解析引擎为JavaScript引擎或正则表达式引擎。
在一种可能的实现方式中,所述超文本标记语言格式的字符串包括如下任一或任多个:
网页内容标题对应的字符串、网页内容正文对应的字符串、网页标签对应的字符串、网页图标的信息资源地址对应的字符串。
第三方面,本发明提供另一种动态网页下载的终端,该终端包括:响应下载模块、获取动态网页模块、解析模块、生成本地网页模块,其中:
响应下载模块,用于响应动态网页下载指令,将应用中动态网页的信息资源地址发送给服务器;
获取动态网页模块,用于通过所述服务器获取所述信息资源地址对应的动态网页信息;
解析模块,用于对所述动态网页信息中的网页内容对应的字符串进行解析,得到所述动态网页中网页内容对应的超文本标记语言格式的字符串;
生成本地网页模块,用于根据所述超文本标记语言格式的字符串生成本地网页。
在一种可能的实现方式中,所述响应下载模块具体用于:
通过底层接口获取应用中当前显示的动态网页的标识信息;
根据所述动态网页所在的应用的地址格式和获取的所述标识信息,生成所述动态网页的信息资源地址。
在一种可能的实现方式中,所述解析模块具体用于:
通过解析引擎获取所述动态网页中网页内容对应的转义字符串;
对所述转义字符串进行反转义,得到所述动态网页中网页内容对应的超文本标记语言格式的字符串。
在一种可能的实现方式中,所述解析引擎为JavaScript引擎或正则表达式引擎。
在一种可能的实现方式中,所述超文本标记语言格式的字符串包括如下任一或任多个:
网页内容标题对应的字符串、网页内容正文对应的字符串、网页标签对应的字符串、网页图标的信息资源地址对应的字符串。
第四方面,本发明提供一种计算机存储介质,其上存储有计算机程序,该程序被处理单元执行时实现第一方面所述方法的步骤。
另外,第二方面至第四方面中任一种实现方式所带来的技术效果可参见第一方面中不同实现方式所带来的技术效果,此处不再赘述。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1A为本发明实施例提出的一种终端显示页面的示意图;
图1B-1D为本发明实施例提出的一种用户下载应用中动态网页的示意图;
图1E-1G为本发明实施例提出的一种下载动态网页过程中终端与服务器交互的示意图;
图1H、图1J、图1K为本发明实施例提出的一种用户查看已下载的动态网页的示意图;
图2为本发明实施例提出的一种动态网页下载的方法流程示意图;
图3为本发明实施例提出的一种动态网页下载的方法的具体实施流程示意图;
图4A为本发明实施例提出的一种响应动态网页进行本地收藏指令的示意图;
图4B为本发明实施例提出的一种终端和服务器进行信息的交互的示意图;
图5为本发明实施例提出的第一种动态网页下载的终端示意图;
图6为本发明实施例提出的第二种动态网页下载的终端示意图;
图7为本发明实施例提出的第三种动态网页下载的终端示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
下面对文中出现的一些词语进行解释:
本发明实施例中术语“终端”,或者叫“终端设备”,是计算机网络中处于网络最外围的设备,能够接入无线局域网络WLAN进行用户信息的输入以及处理结果的输出,包括台式电脑、手机、笔记本、平板电脑、POS机、车载电脑。
本发明的执行主体为终端,该终端包括多个应用APP,用户能够对任一应用中的动态网页进行本地收藏或下载。动态网页是指网页内容可以在服务器侧进行更新的网页,如今日头条APP页面。本发明提供的终端能够在接收到用户的下载指令或本地收藏的指令时,从服务器获取所述动态网页的信息,通过对所述动态网页的信息进行解析,从而将所述动态网页的信息转换为能够在本地网页显示的页面信息,从而将该转换后的动态页面下载到本地。
本发明实施例描述的应用场景是为了更加清楚的说明本发明实施例的技术方案,并不构成对于本发明实施例提供的技术方案的限定,本领域普通技术人员可知,随着新应用场景的出现,本发明实施例提供的技术方案对于类似的技术问题,同样适用。其中,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
下面首先对本发明实施例中提出的动态网页以及动态网页所用的脚本进行说明。
对本发明实施例提出的动态网页进行说明:
本实施例的动态网页,是指跟静态网页相对的一种网页编程技术。与静态网页相对应的,能与后台数据库进行交互,数据传递。也就是说,网页信息资源地址URL的后缀不是.htm、.html、.shtml、.xml等静态网页的常见格式,而是以.aspx、.asp、.jsp、.php、.perl、.cgi等形式为后缀。静态网页的页面的内容和显示效果基本上不会发生变化,除非修改页面代码,而动态网页则不然,页面代码虽然没有变,但是显示的内容却是可以随着时间、环境或者数据库操作的结果而发生改变的。
值得强调的是,这里说的动态网页,与网页上的各种动画、滚动字幕等视觉上的动态效果没有直接关系,动态网页也可以是纯文字内容的,也可以是包含各种动画的内容,这些只是网页具体内容的表现形式,无论网页是否具有动态效果,只要是采用了动态网站技术生成的网页都可以称为动态网页。
总之,动态网页是基本的html语法规范与Java、VB、VC等高级程序设计语言、数据库编程等多种技术的融合,以期实现对网站内容和风格的高效、动态和交互式的管理。因此,从这个意义上来讲,凡是结合了HTML以外的高级程序设计语言和数据库技术进行的网页编程技术生成的网页都是动态网页。
对本发明实施例提出的动态网页使用的脚本语言进行说明:
本实施例中的动态网页通常使用JavaScript脚本,通过JavaScript脚本将网站内容动态存储到数据库中,其中,JavaScript是一种动态类型的脚本语言,在1995年时,由Netscape公司的Brendan Eich,在网景导航者浏览器上首次设计实现而成,因为Netscape管理层希望它外观看起来像Java,因此取名为JavaScript。
JavaScript脚本语言具有以下特点:
1)JavaScript是一种解释型的脚本语言,是在程序的运行过程中逐行进行解释执行,不需要预编译,而Java、C++等语言需要先编译后执行;
2)JavaScript能够动态修改对象的属性,没有办法在编译的时候知道变量的类型,只有在运行的时候才能确定,而Java、C++等都是静态类型语言,他们在编译的时候就能够知道每个变量的类型;
3)JavaScript脚本语言不依赖于操作系统,仅需要浏览器的支持,可以在多种平台下运行,如Windows、Linux、Mac、Android、IOS等;
最后,对本实施例提出的一种JavaScript解析引擎进行说明:
JavaScript解析引擎(简称JavaScript引擎),是一个程序,是浏览器引擎的一部分,每个浏览器的JavaScript解析引擎都不一样,这是由于每个浏览器编写JavaScript解析引擎的语言(C或者C++)以及解析原理都不相同。标准的JavaScript解析引擎会按照ECMAScript文档来实现,虽然每个浏览器的JavaScript解析引擎不同,但JavaScript的语言性质决定了JavaScript关键都在于动态执行JavaScript字符串,只是词法分析、语法分析、变量赋值、字符串拼接的实现方式有所不同。
JavaScript解析引擎就是根据ECMAScript定义的语言标准来动态执行JavaScript字符串。JavaScript引擎的解析过程主要分成两个阶段:语法检查阶段和运行阶段。语法检查包括词法分析和语法分析,运行阶段又包括预解析和运行阶段。其中,词法分析阶段的作用是JavaScript解释器把JavaScript代码(字符串)的字符流按照ECMAScript标准转换为记号流;语法分析阶段的作用是JavaScript语法分析器在经过词法分析后,按照ECMAScript标准把词法分析所产生的记号生成语法树,当语法检查正确无误之后,就可以进入运行阶段了;预解析阶段的作用是将语法检查正确后生成的语法树复制到当前执行的上下文中,然后对语法树当中的变量声明、函数声明以及函数的形参进行属性填充;执行代码阶段的作用是真正进入执行阶段,JavaScript引擎会一行一行的读取并运行代码。
目前手机中新闻网页内容加载方式分为静态网页及动态网页两种加载方式,静态页面是一次性写好后存储在服务器上的,用户联网访问服务器后,服务器将该静态网页的内容直接反馈给终端以使用户可直接对静态网页进行下载保存,但动态网页与静态网页不同,动态网页是随时可以改动的,动态网页采用区别于静态网页的脚本语言编写,动态网页脚本存储在服务器侧的数据库中,服务器收到用户针对动态网页的访问请求后,服务器从数据库中读取该动态网页的脚本内容并根据该脚本内容生成动态网页反馈给终端,其中,动态网页使用的网页脚本语言包括如下类型:php、asp、asp.net等,动态网页通过网页脚本的形式将网页内容动态存储到服务器的数据库,用户访问网页时通过读取数据库来动态生成网页的方法,因此通过访问服务器下载动态网页的方式,无法直接获取动态网页的具体内容,只会返回该动态网页的脚本信息,其中动态网页的脚本一般用script脚本来表示。
为了解决无法下载动态网页的技术问题,本实施例通过分析从服务器返回动态网页的script脚本内容,得到动态网页的script脚本内容大都是以转义字符的形式保存在script脚本中,因此通过分析script脚本的结构,可以通过一定方式提取script脚本中的内容、标题、图片等,这些内容、标题、图片在script脚本中大都以转义字符的形式存在,不能直接在最终看到的HTML网页中使用,因此本实施例能够将所述script脚本中的转义字符进行解析得到符合HTML网页格式的字符,然后将该字符保存到HTML网页中,最终生成本地HTML网页,这样就可以实现将动态网页下载保存到本地,实现了动态网页的离线收藏工作。
实施例1
本发明实施例提供了一种动态网页下载的方法,应用于终端,针对终端上的应用APP中的动态网页的离线收藏、下载的需求,为用户提供一种可以将动态网页下载或收藏到本地的方法,从而实现用户对动态网页的本地查看。
本实施例中首先对动态网页下载的过程中,用户、终端以及服务器三者之间的交互流程进行详细说明。
如图1A所示,该终端显示页面显示多个应用APP,且所述任一应用APP中显示的网页为动态网页;
如图1B-1D所示,用户点击APP,显示动态网页,若用户想下载当前显示的动态网页的内容时,点击下载;可选的,若用户想收藏当前显示的动态网页的内容时,点击收藏,需要说明的是,本实施例中的收藏是指将所述动态网页进行本地收藏,在进行动态网页的收藏时,仍需要将所述动态网页下载到本地保存。
如图1E-1G所示,终端接收到下载指令后,响应该下载指令,向服务器10发送下载请求,所述下载请求中携带了所述动态网页的信息资源地址,服务器10接收到请求指令后,从服务器侧10的数据库11中获取所述信息资源地址对应的动态网页信息,将所述动态网页信息发送给终端;终端接收所述动态网页信息后,对所述动态网页信息中的网页内容对应的字符串进行解析,得到所述动态网页中网页内容对应的超文本标记语言格式的字符串;根据所述超文本标记语言格式的字符串生成本地网页。
如图1H、图1J、图1K所示,当用户想要查看下载的动态网页时,可以点击已下载,终端收到用户需要查看已下载的动态网页指令时,从本地数据库中存储的动态网页内容中,选择用户需要查看的动态网页进行显示。
下面,对本实施例中提出的一种动态网页下载的具体实施方式进行说明,如图2所示,本实施例提供的一种动态网页下载的方法的具体流程如下所示:
步骤200、响应动态网页下载指令,将应用中动态网页的信息资源地址发送给服务器;
由于目前动态网页的脚本信息是存储于服务器侧的数据库中,终端无法从当前的动态网页中直接得到动态网页中的脚本信息,因此需要首先生成当前动态网页的信息资源地址URL,然后将该信息资源地址URL发送给服务器,从服务器侧获取所述信息资源地址对应的动态网页信息。
在一种可能的实现方式中,通过如下方式获取所述应用中动态网页的信息资源地址,包括:
通过底层接口获取应用中当前显示的动态网页的标识信息;
根据所述动态网页所在的应用的地址格式和获取的所述标识信息,生成所述动态网页的信息资源地址。
实施中,所述底层接口为系统代码中的接口,在程序架构framework中,从底层代码可以获取该网页的一些附加信息,通过提取这些附加信息,可以过滤到这个网页的标识信息即某个应用APP中的当前网页的item_id(即ID)。
又由于一般的终端的应用中的动态网页的信息资源地址URL大都具有特定的格式,不同的应用APP中的动态网页的信息资源地址的格式不同,因此通过底层接口首先获取应用中当前显示的动态网页的标识信息,该标识信息可以理解为该动态网页的ID,包括但不限于全局属性item_id或group_id,然后通过该标识信息以及当前动态网页所在的应用的地址格式,进行拼接生成该动态网页的信息资源地址。
例如,今日头条地址格式包括两个部分,一部分为http://m.toutiaocdn.com/,这部分的格式是固定的,即对于不同的应用APP,地址格式中一部分的格式都是针对该应用定义的固定的格式,另一部分为当前网页的标识信息即当前网页的ID如ixxxxxx,根据所述动态网页所在的应用的地址格式和获取的所述标识信息,则生成所述动态网页的信息资源地址为http://m.toutiaocdn.com/ixxxxxx。
步骤201、通过所述服务器获取所述信息资源地址对应的动态网页信息;
本实施例中,从服务器获取所述信息资源地址对应的动态网页信息包括该动态网页的脚本信息,所述动态网页的脚本信息包括但不限于JavaScript脚本、Script脚本。
步骤202、对所述动态网页信息中的网页内容对应的字符串进行解析,得到所述动态网页中网页内容对应的超文本标记语言格式的字符串。
在一种可能的实现方式中,对所述动态网页信息中的网页内容对应的字符串进行解析,得到所述动态网页中网页内容对应的超文本标记语言格式的字符串,包括:
通过解析引擎获取所述动态网页中网页内容对应的转义字符串;
对所述转义字符串进行反转义,得到所述动态网页中网页内容对应的超文本标记语言格式的字符串。
实施中,对获取的所述动态网页的脚本中的字符串进行解析,由于动态网页的脚本都是通过转义字符的形式写在脚本中,因此可以通过解析引擎获取所述动态网页的脚本中的转义字符串,同时对所述转义字符串进行反转义,得到所述动态网页中网页内容对应的超文本标记语言HTTP格式的字符串,便于生成本地网页。
可以理解的是,对所述动态网页信息中的网页内容对应的字符串进行解析的具体过程的目的,是为了获取该网页内容,包括该网页内容中的标题title、正文,其中所述正文包括正文文字和图片等。
在一种可能的实现方式中,所述解析引擎为JavaScript引擎或正则表达式引擎。
本发明中的JavaScript引擎或正则表达式引擎都可以通过调用第三方jar包(第三方解析引擎)的方式,将一些网页内容转成超文本标记语言html格式中的字符。
若通过正则表达式引擎对所述动态网页信息中的网页内容对应的字符串进行解析时,可以生成筛选条件,从而根据该筛选条件筛选该网页内容中的标题、正文、图片等,所述正则表达式引擎可以作为第三方jar包进行使用。
步骤203、根据所述超文本标记语言格式的字符串生成本地网页。
作为一种可选的实施方式,所述超文本标记语言格式的字符串包括如下任一或任多个:
网页内容标题对应的字符串、网页内容正文对应的字符串、网页标签对应的字符串、网页图标的信息资源地址IconUrl对应的字符串。
实施例2
如图3所示,下面对本实施例提出的一种动态网页下载的方法的具体实施流程进行详细说明:
步骤300、响应动态网页下载指令;
实施中,如图4A所示,用户在查看的当前APP的动态页面中点击下载或收藏后,终端开始响应动态网页下载指令。
步骤301、通过底层接口获取应用中当前显示的动态网页的标识信息;
步骤302、根据所述动态网页所在的应用的地址格式和获取的所述标识信息,生成所述动态网页的信息资源地址。
实施中,步骤301、步骤302都可以在终端内部进行执行。
步骤303、将应用中动态网页的信息资源地址发送给服务器;
步骤304、通过所述服务器获取所述信息资源地址对应的动态网页信息;
实施中,如图4B所示,终端联网后和服务器10进行信息的交互,向服务器10发送请求消息,请求获取所述信息资源地址对应的动态网页信息;
服务器10响应所述请求消息,将所述信息资源地址对应的动态网页信息发送给终端。
步骤305、通过JavaScript引擎获取所述动态网页中网页内容对应的转义字符串;对所述转义字符串进行反转义,得到所述动态网页中网页内容对应的超文本标记语言格式的字符串。
步骤306、通过正则表达式引擎获取所述动态网页中网页内容对应的转义字符串;对所述转义字符串进行反转义,得到所述动态网页中网页内容对应的超文本标记语言格式的字符串。
其中,步骤305、步骤306可选其中任一种进行实施。
步骤307、根据所述超文本标记语言格式的字符串生成本地网页。
实施例3
基于相同的发明构思,本发明实施例还提供了第一种动态网页下载的终端,由于该终端即是本发明实施例中的方法中的终端,并且该设备解决问题的原理与该方法相似,因此该设备的实施可以参见方法的实施,重复之处不再赘述。
如图5所示,该终端包括:处理器以及存储器,其中,所述存储器存储有程序代码,当所述存储器存储的一个或多个计算机程序被所述处理器执行时,使得所述终端执行下列过程:
响应动态网页下载指令,将应用中动态网页的信息资源地址发送给服务器;
通过所述服务器获取所述信息资源地址对应的动态网页信息;
对所述动态网页信息中的网页内容对应的字符串进行解析,得到所述动态网页中网页内容对应的超文本标记语言格式的字符串;
根据所述超文本标记语言格式的字符串生成本地网页。
在一种可能的实现方式中,所述处理器具体用于:
通过底层接口获取应用中当前显示的动态网页的标识信息;
根据所述动态网页所在的应用的地址格式和获取的所述标识信息,生成所述动态网页的信息资源地址。
在一种可能的实现方式中,所述处理器具体用于:
通过解析引擎获取所述动态网页中网页内容对应的转义字符串;
对所述转义字符串进行反转义,得到所述动态网页中网页内容对应的超文本标记语言格式的字符串。
在一种可能的实现方式中,所述解析引擎为JavaScript引擎或正则表达式引擎。
在一种可能的实现方式中,所述超文本标记语言格式的字符串包括如下任一或任多个:
网页内容标题对应的字符串、网页内容正文对应的字符串、网页标签对应的字符串、网页图标的信息资源地址对应的字符串。
实施例4
基于相同的发明构思,本发明实施例还提供了第二种动态网页下载的终端,由于该终端即是本发明实施例中的方法中的终端,并且该设备解决问题的原理与该方法相似,因此该设备的实施可以参见方法的实施,重复之处不再赘述。
如图6所示,该终端包括:响应下载模块、获取动态网页模块、解析模块、生成本地网页模块,其中:
响应下载模块,用于响应动态网页下载指令,将应用中动态网页的信息资源地址发送给服务器;
获取动态网页模块,用于通过所述服务器获取所述信息资源地址对应的动态网页信息;
解析模块,用于对所述动态网页信息中的网页内容对应的字符串进行解析,得到所述动态网页中网页内容对应的超文本标记语言格式的字符串;
生成本地网页模块,用于根据所述超文本标记语言格式的字符串生成本地网页。
在一种可能的实现方式中,所述响应下载模块具体用于:
通过底层接口获取应用中当前显示的动态网页的标识信息;
根据所述动态网页所在的应用的地址格式和获取的所述标识信息,生成所述动态网页的信息资源地址。
在一种可能的实现方式中,所述解析模块具体用于:
通过解析引擎获取所述动态网页中网页内容对应的转义字符串;
对所述转义字符串进行反转义,得到所述动态网页中网页内容对应的超文本标记语言格式的字符串。
在一种可能的实现方式中,所述解析引擎为JavaScript引擎或正则表达式引擎。
在一种可能的实现方式中,所述超文本标记语言格式的字符串包括如下任一或任多个:
网页内容标题对应的字符串、网页内容正文对应的字符串、网页标签对应的字符串、网页图标的信息资源地址对应的字符串。
基于相同的发明构思,本发明实施例还提供了第三种动态网页下载的终端,由于该终端即是本发明实施例中的方法中的终端,并且该设备解决问题的原理与该方法相似,因此该设备的实施可以参见方法的实施,重复之处不再赘述。
如图7所示,该终端700包括:射频(Radio Frequency,RF)电路710、电源720、处理器730、存储器740、输入单元750、显示单元760、摄像头770、通信接口780、以及无线保真(Wireless Fidelity,Wi-Fi)模块790等部件。本领域技术人员可以理解,图7中示出的终端的结构并不构成对终端的限定,本申请实施例提供的终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图7对所述终端700的各个构成部件进行具体的介绍:
所述RF电路710可用于通信或通话过程中,数据的接收和发送。特别地,所述RF电路710在接收到基站的下行数据后,发送给所述处理器730处理;另外,将待发送的上行数据发送给基站。通常,所述RF电路710包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low Noise Amplifier,LNA)、双工器等。
此外,RF电路710还可以通过无线通信与网络和其他终端通信。所述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(Global System of Mobilecommunication,GSM)、通用分组无线服务(General Packet Radio Service,GPRS)、码分多址(Code Division Multiple Access,CDMA)、宽带码分多址(Wideband Code DivisionMultiple Access,WCDMA)、长期演进(Long Term Evolution,LTE)、电子邮件、短消息服务(Short Messaging Service,SMS)等。
Wi-Fi技术属于短距离无线传输技术,所述终端700通过Wi-Fi模块790可以连接接入点(Access Point,AP),从而实现数据网络的访问。所述Wi-Fi模块790可用于通信过程中,数据的接收和发送。
所述终端700可以通过所述通信接口780与其他终端实现物理连接。可选的,所述通信接口780与所述其他终端的通信接口通过电缆连接,实现所述终端700和其他终端之间的数据传输。
由于在本申请实施例中,所述终端700能够实现通信业务,向其他联系人发送信息,因此所述终端700需要具有数据传输功能,即所述终端700内部需要包含通信模块。虽然图7示出了所述RF电路710、所述Wi-Fi模块790、和所述通信接口780等通信模块,但是可以理解的是,所述终端700中存在上述部件中的至少一个或者其他用于实现通信的通信模块(如蓝牙模块),以进行数据传输。
例如,当所述终端700为手机时,所述终端700可以包含所述RF电路710,还可以包含所述Wi-Fi模块790;当所述终端700为计算机时,所述终端700可以包含所述通信接口780,还可以包含所述Wi-Fi模块790;当所述终端700为平板电脑时,所述终端700可以包含所述Wi-Fi模块。
所述存储器740可用于存储软件程序以及模块。所述处理器730通过运行存储在所述存储器740的软件程序以及模块,从而执行所述终端700的各种功能应用以及数据处理,并且当处理器730执行存储器740中的程序代码后,可以实现本发明实施例1中的部分或全部过程。
可选的,所述存储器740可以主要包括存储程序区和存储数据区。其中,存储程序区可存储操作系统、各种应用程序等;存储数据区可存储根据所述终端的使用所创建的数据(比如应用中的动态网页信息、将动态网页生成的本地网页信息)等。
此外,所述存储器740可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
所述输入单元750可用于接收用户输入的数字或字符信息,以及产生与所述终端700的用户设置以及功能控制有关的键信号输入。
可选的,输入单元750可包括触控面板751以及其他输入终端752。
其中,所述触控面板751,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在所述触控面板751上或在所述触控面板751附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,所述触控面板751可以包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给所述处理器730,并能接收所述处理器730发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现所述触控面板751。
可选的,所述其他输入终端752可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
所述显示单元760可用于显示由用户输入的信息或提供给用户的信息以及所述终端700的各种菜单。所述显示单元760即为所述终端700的显示系统,用于呈现界面,实现人机交互。
所述显示单元760可以包括显示面板761。可选的,所述显示面板761可以采用液晶显示屏(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-EmittingDiode,OLED)等形式来配置。
进一步的,所述触控面板751可覆盖所述显示面板761,当所述触控面板751检测到在其上或附近的触摸操作后,传送给所述处理器730以确定触摸事件的类型,随后所述处理器730根据触摸事件的类型在所述显示面板761上提供相应的视觉输出。
虽然在图7中,所述触控面板751与所述显示面板761是作为两个独立的部件来实现所述终端700的输入和输入功能,但是在某些实施例中,可以将所述触控面板751与所述显示面板761集成而实现所述终端700的输入和输出功能。
所述处理器730是所述终端700的控制中心,利用各种接口和线路连接各个部件,通过运行或执行存储在所述存储器740内的软件程序和/或模块,以及调用存储在所述存储器740内的数据,执行所述终端700的各种功能和处理数据,从而实现基于所述终端的多种业务。
可选的,所述处理器730可包括一个或多个处理单元。可选的,所述处理器730可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到所述处理器730中。
所述摄像头770,用于实现所述终端700的拍摄功能,拍摄图片或视频。所述摄像头770还可以用于实现终端700的扫描功能,对扫描对象(二维码/条形码)进行扫描。
所述终端700还包括用于给各个部件供电的电源720(比如电池)。可选的,所述电源720可以通过电源管理系统与所述处理器730逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗等功能。
需要说明的是,本发明实施例处理器730可以执行如下内容:
响应动态网页下载指令,将应用中动态网页的信息资源地址发送给服务器;
通过所述服务器获取所述信息资源地址对应的动态网页信息;
对所述动态网页信息中的网页内容对应的字符串进行解析,得到所述动态网页中网页内容对应的超文本标记语言格式的字符串;
根据所述超文本标记语言格式的字符串生成本地网页。
在一种可能的实现方式中,所述处理器具体用于:
通过底层接口获取应用中当前显示的动态网页的标识信息;
根据所述动态网页所在的应用的地址格式和获取的所述标识信息,生成所述动态网页的信息资源地址。
在一种可能的实现方式中,所述处理器具体用于:
通过解析引擎获取所述动态网页中网页内容对应的转义字符串;
对所述转义字符串进行反转义,得到所述动态网页中网页内容对应的超文本标记语言格式的字符串。
在一种可能的实现方式中,所述解析引擎为JavaScript引擎或正则表达式引擎。
在一种可能的实现方式中,所述超文本标记语言格式的字符串包括如下任一或任多个:
网页内容标题对应的字符串、网页内容正文对应的字符串、网页标签对应的字符串、网页图标的信息资源地址对应的字符串。
本发明实施例还提供一种计算机可读非易失性存储介质,包括程序代码,当所述程序代码在计算终端上运行时,所述程序代码用于使所述计算终端执行如下步骤:
响应动态网页下载指令,将应用中动态网页的信息资源地址发送给服务器;
通过所述服务器获取所述信息资源地址对应的动态网页信息;
对所述动态网页信息中的网页内容对应的字符串进行解析,得到所述动态网页中网页内容对应的超文本标记语言格式的字符串;
根据所述超文本标记语言格式的字符串生成本地网页。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的设备。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令设备的制造品,该指令设备实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种动态网页下载的方法,其特征在于,应用于终端,该方法包括:
响应动态网页下载指令,将应用中动态网页的信息资源地址发送给服务器;
通过所述服务器获取所述信息资源地址对应的动态网页信息;
对所述动态网页信息中的网页内容对应的字符串进行解析,得到所述动态网页中网页内容对应的超文本标记语言格式的字符串;
根据所述超文本标记语言格式的字符串生成本地网页。
2.根据权利1所述的方法,其特征在于,通过如下方式获取所述应用中动态网页的信息资源地址,包括:
通过底层接口获取应用中当前显示的动态网页的标识信息;
根据所述动态网页所在的应用的地址格式和获取的所述标识信息,生成所述动态网页的信息资源地址。
3.根据权利要求1所述的方法,其特征在于,对所述动态网页信息中的网页内容对应的字符串进行解析,得到所述动态网页中网页内容对应的超文本标记语言格式的字符串,包括:
通过解析引擎获取所述动态网页中网页内容对应的转义字符串;
对所述转义字符串进行反转义,得到所述动态网页中网页内容对应的超文本标记语言格式的字符串。
4.根据权利要求3所述的方法,其特征在于,所述解析引擎为JavaScript引擎或正则表达式引擎。
5.根据权利要求1所述的方法,其特征在于,所述超文本标记语言格式的字符串包括如下任一或任多个:
网页内容标题对应的字符串、网页内容正文对应的字符串、网页标签对应的字符串、网页图标的信息资源地址对应的字符串。
6.一种动态网页下载的终端,其特征在于,该终端包括:处理器以及存储器,其中,所述存储器存储有程序代码,当所述存储器存储的一个或多个计算机程序被所述处理器执行时,使得所述终端执行下列过程:
响应动态网页下载指令,将应用中动态网页的信息资源地址发送给服务器;
通过所述服务器获取所述信息资源地址对应的动态网页信息;
对所述动态网页信息中的网页内容对应的字符串进行解析,得到所述动态网页中网页内容对应的超文本标记语言格式的字符串;
根据所述超文本标记语言格式的字符串生成本地网页。
7.根据权利6所述的终端,其特征在于,所述处理器具体用于:
通过底层接口获取应用中当前显示的动态网页的标识信息;
根据所述动态网页所在的应用的地址格式和获取的所述标识信息,生成所述动态网页的信息资源地址。
8.根据权利要求6所述的终端,其特征在于,所述处理器具体用于:
通过解析引擎获取所述动态网页中网页内容对应的转义字符串;
对所述转义字符串进行反转义,得到所述动态网页中网页内容对应的超文本标记语言格式的字符串。
9.根据权利要求8所述的终端,其特征在于,所述解析引擎为JavaScript引擎或正则表达式引擎。
10.根据权利要求6所述的终端,其特征在于,所述超文本标记语言格式的字符串包括如下任一或任多个:
网页内容标题对应的字符串、网页内容正文对应的字符串、网页标签对应的字符串、网页图标的信息资源地址对应的字符串。
CN201910891169.3A 2019-09-20 2019-09-20 一种动态网页下载的方法及终端 Active CN110674444B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910891169.3A CN110674444B (zh) 2019-09-20 2019-09-20 一种动态网页下载的方法及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910891169.3A CN110674444B (zh) 2019-09-20 2019-09-20 一种动态网页下载的方法及终端

Publications (2)

Publication Number Publication Date
CN110674444A true CN110674444A (zh) 2020-01-10
CN110674444B CN110674444B (zh) 2023-04-07

Family

ID=69078471

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910891169.3A Active CN110674444B (zh) 2019-09-20 2019-09-20 一种动态网页下载的方法及终端

Country Status (1)

Country Link
CN (1) CN110674444B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112073405A (zh) * 2020-09-03 2020-12-11 中国平安财产保险股份有限公司 网页数据加载方法、装置、计算机设备及存储介质
CN113051502A (zh) * 2021-03-11 2021-06-29 北京顶象技术有限公司 网页保存方法、装置、设备及存储介质
CN115086206A (zh) * 2022-06-14 2022-09-20 工银科技有限公司 一种客户端软件调试方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103092936A (zh) * 2013-01-08 2013-05-08 华北电力大学(保定) 一种物联网动态页面实时信息采集方法
CN106126693A (zh) * 2016-06-29 2016-11-16 微梦创科网络科技(中国)有限公司 一种网页的相关数据的发送方法及装置
CN106649810A (zh) * 2016-12-29 2017-05-10 山东舜网传媒股份有限公司 基于Ajax的新闻网页动态数据的抓取方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103092936A (zh) * 2013-01-08 2013-05-08 华北电力大学(保定) 一种物联网动态页面实时信息采集方法
CN106126693A (zh) * 2016-06-29 2016-11-16 微梦创科网络科技(中国)有限公司 一种网页的相关数据的发送方法及装置
CN106649810A (zh) * 2016-12-29 2017-05-10 山东舜网传媒股份有限公司 基于Ajax的新闻网页动态数据的抓取方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112073405A (zh) * 2020-09-03 2020-12-11 中国平安财产保险股份有限公司 网页数据加载方法、装置、计算机设备及存储介质
CN112073405B (zh) * 2020-09-03 2024-02-06 中国平安财产保险股份有限公司 网页数据加载方法、装置、计算机设备及存储介质
CN113051502A (zh) * 2021-03-11 2021-06-29 北京顶象技术有限公司 网页保存方法、装置、设备及存储介质
CN115086206A (zh) * 2022-06-14 2022-09-20 工银科技有限公司 一种客户端软件调试方法和装置

Also Published As

Publication number Publication date
CN110674444B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
KR102436987B1 (ko) 웹페이지 콘텐츠를 추출하기 위한 방법 및 단말 장치
CN107040609B (zh) 一种网络请求处理方法和装置
CN109857403B (zh) 一种页面更新、页面处理方法及装置
CN107247691B (zh) 一种文本信息的显示方法、装置、移动终端及存储介质
US10109079B2 (en) Method and apparatus for processing tab in graphical interface
CN107741844B (zh) 一种应用安装包的生成方法和装置
CN110674444B (zh) 一种动态网页下载的方法及终端
CN108287918B (zh) 基于应用页面的音乐播放方法、装置、存储介质和电子设备
US20150301991A1 (en) Webapp startup method and device
US20180293210A1 (en) Method and device for processing web page content
CN108536594B (zh) 页面测试方法、装置及存储设备
US20110078593A1 (en) Web browser transmission server and method of controlling operation of same
CN112882772B (zh) 移动终端应用界面的配置方法、移动终端及存储介质
CN110020293B (zh) 多媒体数据展示方法、装置及存储介质
CN107766358B (zh) 一种页面分享的方法及相关装置
CN108073647B (zh) 网页显示方法及装置
CN110869907A (zh) 一种浏览应用页面的方法及终端
CN109800030B (zh) 一种应用程序运行方法、装置及终端
CN108763297B (zh) 网页资源处理方法、装置以及移动终端
US9582584B2 (en) Method, apparatus and system for filtering data of web page
CN108182090B (zh) 基于blink内核的Flash插件加载方法及装置
CN110198324B (zh) 数据监控方法、装置、浏览器及终端
CN110020338B (zh) 浏览器、网页打开方法及设备
Rodrigues et al. New trends on ubiquitous mobile multimedia applications
CN106230919B (zh) 一种文件上传的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant