CN113505271A - Html文档的解析方法、发送方法、解析装置以及发送装置 - Google Patents

Html文档的解析方法、发送方法、解析装置以及发送装置 Download PDF

Info

Publication number
CN113505271A
CN113505271A CN202110794080.2A CN202110794080A CN113505271A CN 113505271 A CN113505271 A CN 113505271A CN 202110794080 A CN202110794080 A CN 202110794080A CN 113505271 A CN113505271 A CN 113505271A
Authority
CN
China
Prior art keywords
target
html document
tag
html
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110794080.2A
Other languages
English (en)
Inventor
王一旋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Longbu Technology Co ltd
Original Assignee
Hangzhou Longbu Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Longbu Technology Co ltd filed Critical Hangzhou Longbu Technology Co ltd
Priority to CN202110794080.2A priority Critical patent/CN113505271A/zh
Publication of CN113505271A publication Critical patent/CN113505271A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/84Mapping; Conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/81Indexing, e.g. XML tags; Data structures therefor; Storage structures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请公开了一种HTML文档的解析方法、发送方法、解析装置以及发送装置,所述解析方法包括接收来自服务端的目标HTML文档,其中,所述目标HTML文档中包含自定义标签;在支持所述自定义标签的情况下,读取所述目标HTML文档中的目标标签的类型属性;按照所述类型属性指示的类型,对所述目标标签的值进行解析,以得到所述目标标签的各个节点。

Description

HTML文档的解析方法、发送方法、解析装置以及发送装置
技术领域
本申请属于计算机技术领域,具体涉及一种HTML文档的解析方法、发送方法、解析装置以及发送装置。
背景技术
目前,获取信息的渠道大多是通过图文资讯及视频流媒体,从而产生了无数资讯类阅读软件,为了保证编辑和阅读的一致性,大部分都会采用富文本编辑器来进行文章的标记,最后输出超文本标记语言(Hypertext Markup Language,HTML)格式,以字符串的形式存储在数据库,客户端可以直接利用浏览器的特性在不对HTML做任何处理的情况下直接进行渲染。
然而,传统的HTML格式,不适用于文档复杂的场景,当需要渲染一些HTML支持标签以外的内容时,传统HTML无法支持。也就是说,当多媒体内容比较复杂时,客户端无法解析传统HTML支持标签以外的内容。
发明内容
本申请实施例的目的是提供一种HTML文档的解析方法,能够解决客户端无法解析传统HTML支持标签以外的内容的问题。
第一方面,本申请实施例提供了一种HTML文档的解析方法,该方法包括:接收来自服务端的目标HTML文档,其中,所述目标HTML文档中包含自定义标签;在支持所述自定义标签的情况下,读取所述目标HTML文档中的目标标签的类型属性;按照所述类型属性指示的类型,对所述目标标签的值进行解析,以得到所述目标标签的各个节点。
第二方面,本申请实施例提供了一种HTML文档的发送方法,该方法包括:获取目标HTML文档,其中,所述目标HTML文档中包含自定义标签,其中,所述自定义标签的属性包括指示所述自定义标签的类型的类型属性;过滤掉所述目标HTML文档中的非法标签;将过滤掉非法标签的所述目标HTML文档发送至客户端。
第三方面,本申请实施例提供了一种HTML文档的解析装置,该装置包括:接收模块,用于接收来自服务端的目标HTML文档,其中,所述目标HTML文档中包含自定义标签;读取模块,用于在支持所述自定义标签的情况下,读取所述目标HTML文档中的目标标签的类型属性;解析模块,用于按照所述类型属性指示的类型,对所述目标标签的值进行解析,以得到所述目标标签的各个节点。
第四方面,本申请实施例提供了一种HTML文档的发送装置,该装置包括;获取模块,用于获取目标HTML文档,其中,所述目标HTML文档中包含自定义标签,其中,所述自定义标签的属性包括指示所述自定义标签的类型的类型属性;过滤模块,用于过滤掉所述目标HTML文档中的非法标签;发送模块,用于将过滤掉非法标签的所述目标HTML文档发送至客户端。
第五方面,本申请实施例提供了一种终端设备,该终端设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面和第二方面所述的方法的步骤。
第六方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面和第二方面所述的方法的步骤。
在本申请实施例中,通过接收来自服务端的目标HTML文档,其中,所述目标HTML文档中包含自定义标签;在支持自定义标签的情况下,读取所述目标HTML文档中的目标标签的类型属性;按照所述类型属性指示的类型,对所述目标标签的值进行解析,以得到所述目标标签的各个节点,从而解决客户端无法解析传统HTML支持标签以外的内容的问题。
附图说明
图1是本申请实施例提供的HTML文档的解析方法的一种流程示意图;
图2是本申请实施例提供的HTML文档的发送方法的一种流程示意图;
图3是本申请实施例提供的HTML文档的解析装置的一种结构示意图;
图4是本申请实施例提供的HTML文档的发送装置的一种结构示意图;
图5是本申请实施例提供的终端设备的一种结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的疲劳驾驶提醒装置和方法进行详细地说明。
图1是本申请实施例提供的HTML文档的解析方法的一种流程示意图,该方法100可以由客户端执行。如图1所示,该方法100可以包括以下步骤。
S110:接收来自服务端的目标HTML文档。
其中,所述目标HTML文档中包含自定义标签。
在具体应用中,客户端在接收来自服务端的目标HTML文档之前,可以先编辑包含自定义标签的HTML文档。具体的,可以先基于HTML自定义一种标签属性,例如Type属性,基于Type属性可以扩展各种标签,不同的标签应用于不同的业务场景。这里我们把基于Type属性扩展得到的各种标签称为自定义标签。需要说明的是,Type属性可以支持标签无限扩展,例如,security-tag、mention、hashtag等。具体的,在进行HTML文档编辑时,自定义标签可以表示为Type=“security-tag”、Type=“mention”、Type=“hashtag”等。在实际应用中,根据不同的业务场景定义好自定义标签后,可以使用Value数据格式来存储各自定义标签对应的具体数据,当数据复杂度较高时,可以使用JSON格式来存储,例如:数字和字符串类型的ID、复杂的订单数据等。之后,将HTML文档以字符串的形式输出。
S120:在支持所述自定义标签的情况下,读取所述目标HTML文档中的目标标签的类型属性。
在该步骤中,客户端首先会判断是否支持目标HTML文档中的自定义标签,在支持自定义标签的情况下,读取目标HTML文档中的目标标签的类型属性,例如,客户端在获取到HTML文档后,会读取目标HTML文档中的Type属性。
S130:按照所述类型属性指示的类型,对所述目标标签的值进行解析,以得到所述目标标签的各个节点。
例如,客户端读取到目标HTML文档中的目标标签的类型属性为Type属性,然后根据Type属性指示的类型,对目标标签的值进行DOM解析,从而得到目标标签的各个节点。
本申请实施例通过接收来自服务端的目标HTML文档,在支持目标HTML文档中的自定义标签的情况下,读取目标HTML文档中的目标标签的类型属性,然后按照所述类型属性指示的类型,对目标标签的值进行解析,以得到目标标签的各个节点,从而解决了传统HTML对一些自定义媒体标签不支持、无法解析的问题。
在一种可能的实现方式中,在步骤S130后,所述方法100还可以包括S140:采用与所述目标标签的类型对应的渲染方式,对解析得到的所述目标标签的各个节点进行渲染。
在一种可能的实现方式中,在步骤S140后,所述方法100还可以包括S150:对渲染后的所述目标HTML文档中的各个目标标签进行HTML渲染并显示渲染后的界面。
在实际应用中,由于传统HTML不支持一些自定义媒体标签,导致客户端无法渲染一些复杂的多媒体内容,从而导致客户端最终展示的网页内容不够丰富。采用上述申请实施例,能够使客户端提取HTML文档中的自定义标签,通过结合Type和Value实现最终的HTML渲染,从而使客户端能够展示自定义标签所对应的值的内容,满足多媒体内容较复杂时,传统的HTML无法满足复杂场景自定义的需求。
在具体应用中,有些客户端可以支持自定义标签,而有些客户端不支持自定义标签。因此,在一种可能的实现方式中,在不支持所述自定义标签的情况下,获取所述目标HTML文档中的HTML文本;对获取的所述HTML文本进行HTML渲染并显示渲染后的界面。
通过该可能的实现方式,客户端不支持一些自定义标签时,即不对自定义标签进行解析,直接对HTML文档进行渲染,并显示渲染后的界面。即该渲染后展示的界面无自定义标签对应的渲染内容,以普通文本的方式展示出来。由于客户端在不支持部分自定义标签时,不对该部分自定义标签进行解析,即没有破坏原有的客户端与HTML的协议,因而在不支持自定义标签的客户端也可以对非自定义标签进行渲染。
图2是本申请实施例提供的HTML文档的发送方法的一种流程示意图,该方法200可以由服务端执行。如图2所示,该方法200可以包括以下步骤。
S210:获取目标HTML文档,其中,所述目标HTML文档中包含自定义标签,其中,所述自定义标签的属性包括指示所述自定义标签的类型的类型属性。
在该步骤中,指示所述自定义标签的类型的类型属性可以为Type属性。
S220:过滤掉所述目标HTML文档中的非法标签。
由于客户端内嵌入有HTML文档编辑器,因此,经常有人在HTML文档中添加一些非法标签,例如,广告对应的标签、各种公众号对应的标签等。因此过滤掉目标HTML文档中的非法标签,能够使用户的使用体验更好。
S230:将过滤掉非法标签的所述目标HTML文档发送至客户端。
该步骤中,服务端将过滤掉非法标签的目标HTML文档发送至客户端后,客户端进行方法100中的步骤。
图3是本申请实施例提供的HTML文档的解析装置的一种结构示意图,如图3所示,解析装置300可以包括:
接收模块310,用于接收来自服务端的目标HTML文档,其中,所述目标HTML文档中包含自定义标签;
读取模块320,用于在支持所述自定义标签的情况下,读取所述目标HTML文档中的目标标签的类型属性;
解析模块330,用于按照所述类型属性指示的类型,对所述目标标签的值进行解析,以得到所述目标标签的各个节点。
在一种可能的实现方式中,所述解析装置300还可以包括渲染模块,用于采用与所述目标标签的类型对应的渲染方式,对解析得到的所述目标标签的各个节点进行渲染。
在一种可能的实现方式中,所述渲染模块还用于对渲染后的所述目标HTML文档中的各个目标标签进行HTML渲染并显示渲染后的界面。
在一种可能的实现方式中,所述渲染模块还用于在不支持所述自定义标签的情况下,获取所述目标HTML文档中的HTML文本;对获取的所述HTML文本进行HTML渲染并显示渲染后的界面。
图4是本申请实施例提供的HTML文档的发送装置的一种结构示意图,如图4所示,发送装置400可以包括:
获取模块410,用于获取目标HTML文档,其中,所述目标HTML文档中包含自定义标签,其中,所述自定义标签的属性包括指示所述自定义标签的类型的类型属性;
过滤模块420,用于过滤掉所述目标HTML文档中的非法标签;
发送模块430,用于将过滤掉非法标签的所述目标HTML文档发送至客户端。
可选地,如图5所示,本申请实施例还提供一种终端设备500,包括处理器510,存储器520,存储在存储器520上并可在所述处理器510上运行的程序或指令,该程序或指令被处理器510执行时实现上述HTML文档的解析方法和HTML文档的发送方法的实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本申请实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述HTML文档的解析方法和HTML文档的发送方法的实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。

Claims (10)

1.一种HTML文档的解析方法,其特征在于,包括:
接收来自服务端的目标HTML文档,其中,所述目标HTML文档中包含自定义标签;
在支持所述自定义标签的情况下,读取所述目标HTML文档中的目标标签的类型属性;
按照所述类型属性指示的类型,对所述目标标签的值进行解析,以得到所述目标标签的各个节点。
2.根据权利要求1所述的解析方法,其特征在于,在按照所述类型属性指示的类型,对所述目标标签的值进行解析之后,所述方法还包括:
采用与所述目标标签的类型对应的渲染方式,对解析得到的所述目标标签的各个节点进行渲染。
3.根据权利要求2所述的解析方法,其特征在于,在对解析得到的所述目标标签的各个节点进行渲染之后,所述方法还包括:
对渲染后的所述目标HTML文档中的各个目标标签进行HTML渲染并显示渲染后的界面。
4.根据权利要求1-3任一项所述的解析方法,其特征在于,还包括:
在不支持所述自定义标签的情况下,获取所述目标HTML文档中的HTML文本;
对获取的所述HTML文本进行HTML渲染并显示渲染后的界面。
5.一种HTML文档的发送方法,其特征在于,包括:
获取目标HTML文档,其中,所述目标HTML文档中包含自定义标签,其中,所述自定义标签的属性包括指示所述自定义标签的类型的类型属性;
过滤掉所述目标HTML文档中的非法标签;
将过滤掉非法标签的所述目标HTML文档发送至客户端。
6.一种HTML文档的解析装置,其特征在于,包括:
接收模块,用于接收来自服务端的目标HTML文档,其中,所述目标HTML文档中包含自定义标签;
读取模块,用于在支持所述自定义标签的情况下,读取所述目标HTML文档中的目标标签的类型属性;
解析模块,用于按照所述类型属性指示的类型,对所述目标标签的值进行解析,以得到所述目标标签的各个节点。
7.根据权利要求6所述的解析装置,其特征在于,还包括:渲染模块,用于采用与所述目标标签的类型对应的渲染方式,对解析得到的所述目标标签的各个节点进行渲染。
8.根据权利要求7所述的解析装置,其特征在于,所述渲染模块还用于对渲染后的所述目标HTML文档中的各个目标标签进行HTML渲染并显示渲染后的界面。
9.根据权利要求6-8任一项所述的解析装置,其特征在于,所述渲染模块还用于在不支持所述自定义标签的情况下,获取所述目标HTML文档中的HTML文本;对获取的所述HTML文本进行HTML渲染并显示渲染后的界面。
10.一种HTML文档的发送装置,其特征在于,包括:
获取模块,用于获取目标HTML文档,其中,所述目标HTML文档中包含自定义标签,其中,所述自定义标签的属性包括指示所述自定义标签的类型的类型属性;
过滤模块,用于过滤掉所述目标HTML文档中的非法标签;
发送模块,用于将过滤掉非法标签的所述目标HTML文档发送至客户端。
CN202110794080.2A 2021-07-14 2021-07-14 Html文档的解析方法、发送方法、解析装置以及发送装置 Pending CN113505271A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110794080.2A CN113505271A (zh) 2021-07-14 2021-07-14 Html文档的解析方法、发送方法、解析装置以及发送装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110794080.2A CN113505271A (zh) 2021-07-14 2021-07-14 Html文档的解析方法、发送方法、解析装置以及发送装置

Publications (1)

Publication Number Publication Date
CN113505271A true CN113505271A (zh) 2021-10-15

Family

ID=78013049

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110794080.2A Pending CN113505271A (zh) 2021-07-14 2021-07-14 Html文档的解析方法、发送方法、解析装置以及发送装置

Country Status (1)

Country Link
CN (1) CN113505271A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101702160A (zh) * 2009-10-28 2010-05-05 深圳市同洲电子股份有限公司 一种互联网主题信息采集方法及装置
CN104050190A (zh) * 2013-03-14 2014-09-17 腾讯科技(上海)有限公司 一种关系链数据处理的方法和系统、客户端
CN107368487A (zh) * 2016-05-12 2017-11-21 阿里巴巴集团控股有限公司 一种页面组件动态布局方法、装置及客户端
CN109582899A (zh) * 2018-10-26 2019-04-05 平安科技(深圳)有限公司 页面加载方法、装置、计算机设备及存储介质
CN111708535A (zh) * 2020-06-17 2020-09-25 网易(杭州)网络有限公司 图文显示控制方法、装置及电子设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101702160A (zh) * 2009-10-28 2010-05-05 深圳市同洲电子股份有限公司 一种互联网主题信息采集方法及装置
CN104050190A (zh) * 2013-03-14 2014-09-17 腾讯科技(上海)有限公司 一种关系链数据处理的方法和系统、客户端
CN107368487A (zh) * 2016-05-12 2017-11-21 阿里巴巴集团控股有限公司 一种页面组件动态布局方法、装置及客户端
CN109582899A (zh) * 2018-10-26 2019-04-05 平安科技(深圳)有限公司 页面加载方法、装置、计算机设备及存储介质
CN111708535A (zh) * 2020-06-17 2020-09-25 网易(杭州)网络有限公司 图文显示控制方法、装置及电子设备

Similar Documents

Publication Publication Date Title
US10261983B2 (en) Method and device for webpage browsing, and mobile terminal
DE60116343T2 (de) Webserver
US20160283606A1 (en) Method for performing webpage loading, device and browser thereof
CN108337528A (zh) 一种预览视频的方法及设备
US20060271859A1 (en) Method and system for visualizing Weblog social network communities
CN108334508B (zh) 网页信息的提取方法和装置
CN109492177B (zh) 一种基于网页语义结构的网页分块方法
CN102779167A (zh) 在移动终端中显示网页的方法及系统
CN104243273A (zh) 即时通讯客户端显示信息的方法及设备和信息显示系统
CN108470302B (zh) 客户端、服务器的交互方法和装置
CN110245069A (zh) 页面版本的测试方法和装置、页面的展示方法和装置
US20200007637A1 (en) Methods and apparatus to identify sponsored media in a document object model
CN112764795B (zh) 一种面向服务的跨平台跨终端信息发布系统和方法
JP2001195391A (ja) フォーマット変換・ページ分割中継サーバ
CN104899212A (zh) 网页展示方法、服务器及系统
CN104602119A (zh) 视频转码、解码方法和装置及相关的信息发布控制方法和系统
CN116954450A (zh) 针对前端网页的截图方法以及装置、存储介质、终端
JP2008134906A (ja) 業務プロセス定義生成方法、装置及びプログラム
CN106934047B (zh) 一种将发帖内容在小程序中展示的方法及装置
CN104077323A (zh) 一种网页内容转换彩信的方法和装置
US20040060008A1 (en) Displaying statistical data for a web page by dynamically modifying the document object model in the HTML rendering engine
CN113505271A (zh) Html文档的解析方法、发送方法、解析装置以及发送装置
CN108399167B (zh) 网页信息提取方法和装置
CN115904167A (zh) 网页图标的处理方法、装置、存储介质及电子设备
CN115795212A (zh) 一种页面显示方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20211015