CN104408208A - 一种html5布局检测方法及系统 - Google Patents
一种html5布局检测方法及系统 Download PDFInfo
- Publication number
- CN104408208A CN104408208A CN201410823045.9A CN201410823045A CN104408208A CN 104408208 A CN104408208 A CN 104408208A CN 201410823045 A CN201410823045 A CN 201410823045A CN 104408208 A CN104408208 A CN 104408208A
- Authority
- CN
- China
- Prior art keywords
- html5
- layout
- webpage
- source code
- detection method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明提供一种HTML5布局检测方法及系统。所述HTML5布局检测方法包括:接收待检测的网站地址;访问所述网站地址对应的网页并获取所述网页的源代码;在所述源代码中查找HTML5相关标签;当查找到所述HTML5相关标签时,确定所述网页是HTML5布局。所述HTML5布局检测系统包括:网站地址输入模块用于接收待检测的网站地址;网页源码获取模块用于获取所述网站地址,访问所述网站地址对应的网页并获取所述网页的源代码;网站布局确定模块用于在所述源代码中查找HTML5相关标签;当查找到所述HTML5相关标签时,确定所述网页是HTML5布局。本发明的技术方案能够自动检测网站页面是否采用HTML5结构布局。
Description
技术领域
本发明涉及一种网络技术,特别是涉及一种HTML5布局检测方法及系统。
背景技术
随着互联网的发展,互联网的宣传作用和商业价值不断增长。为了提高在互联网的宣传能力,就要通过完善互联网上产品的相关网页,以让一些权威的搜索引擎愿意爬取到该产品网页上,从而让更多的用户知道、了解进而购买使用所述产品,更大程度的发掘和留住用户,进而创造更大的商业价值。
HTML5规范是万维网联盟(W3C)由2012年12月17日正式宣布定稿的第五版超级文本标记(HyperText Markup language)。采用HTML5布局能够更好得迎合搜索引擎优化,更精美的动画效果,更快的图片下载速度和WEB应用开发更容易,尤其是移动应用,所以采用HTML5布局对完善互联网上产品相关网页的重要性显而易见。通过确定网页界面是不是HTML5,可以在一定程度上明确看清楚产品的相关网页是否存在优化和完善的空间,更好的维护互联网产品的相关网页。但是对于互联网上产品的相关网页是否采用HTML5布局并不能直观确定,如果需要确定网站界面是不是HTML5结构,通常采用的办法为:打开网页后,通过点击右键查看源代码,然后在所述源代码中手动搜索跟HTML5相关的标签,这种方法不仅工作量大而且还可能不准确。
鉴于此,如何找到一种能够自动检测网站页面是否采用HTML5结构布局的方法成为了本领域技术人员亟待解决的问题。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种HTML5布局检测方法及系统,用于解决现有技术中确定网站界面是不是HTML5结构的方法不仅工作量大而且还可能不准确的问题。
为实现上述目的及其他相关目的,本发明提供一种HTML5布局检测方法,所述HTML5布局检测方法包括:接收待检测的网站地址;访问所述网站地址对应的网页并获取所述网页的源代码;在所述源代码中查找HTML5相关标签;当查找到所述HTML5相关标签时,确定所述网页是HTML5布局。
可选地,所述访问所述网站地址对应的网页并获取所述网页的源代码是通过后台执行完成的。
可选地,所述HTML5相关标签包括abbr、article、aside、audio、bdi、canvas、data、datalist、details、figcaption、figure、footer、header、hgroupmark、meter、nav、output、progress、section、summary、time、或video中的至少一种。
可选地,所述HTML5布局检测方法还包括:当未查找到所述HTML5相关标签时,确定所述网页不是HTML5布局。
可选地,所述HTML5布局检测方法还包括:将所述网页是否是HTML5布局以消息框显示。
本发明提供一种HTML5布局检测系统,所述HTML5布局检测系统包括:网站地址输入模块,用于接收待检测的网站地址;网页源码获取模块,与所述网站输入模块相连,用于从所述网站输入模块中获取所述网站地址,访问所述网站地址对应的网页并获取所述网页的源代码;网站布局确定模块,与所述网页源码获取模块相连,用于在所述源代码中查找HTML5相关标签;当查找到所述HTML5相关标签时,确定所述网页是HTML5布局。
可选地,所述网页源码获取模块中的访问所述网站地址对应的网页并获取所述网页的源代码是通过后台执行完成的。
可选地,所述HTML5相关标签包括abbr、article、aside、audio、bdi、canvas、data、datalist、details、figcaption、figure、footer、header、hgroupmark、meter、nav、output、progress、section、summary、time、video中的至少一种。
可选地,所述网站布局确定模块还用于:当未查找到所述HTML5相关标签时,确定所述网页不是HTML5布局。
可选地,所述网站布局确定模块还用于:将所述网页是否是HTML5布局以消息框显示。
如上所述,本发明的一种HTML5布局检测方法及系统,具有以下有益效果:能够自动检测网站页面是否采用HTML5结构布局。
附图说明
图1显示为本发明的一种HTML5布局检测方法的一实施例的流程示意图。
图2显示为本发明的一种HTML5布局检测系统的一实施例的模块示意图。
元件标号说明
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。
需要说明的是,本实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
一种HTML5布局检测方法。在一个实施例中,如图1所示,所述HTML5布局检测方法包括:
步骤S1,接收待检测的网站地址。在一个实施例中,接收用户输入的待检测的网站地址。
步骤S2,访问所述网站地址对应的网页并获取所述网页的源代码。在一个实施例中,所述访问所述网站地址对应的网页并获取所述网页的源代码是通过后台执行完成的。
步骤S3,在所述源代码中查找HTML5相关标签。在一个实施例中,所述HTML5相关标签包括abbr、article、aside、audio、bdi、canvas、data、datalist、details、figcaption、figure、footer、header、hgroupmark、meter、nav、output、progress、section、summary、time、video中的至少一种。即判断源代码中是否包含abbr、article、aside、audio、bdi、canvas、data、datalist、details、figcaption、figure、footer、header、hgroup mark、meter、nav、output、progress、section、summary、time、video这些标签中的一个或者多个。这些标签都是HTML5布局所用的特有标签。
步骤S4,当查找到所述HTML5相关标签时,确定所述网页是HTML5布局。具体地,当在所述源代码中查找到abbr、article、aside、audio、bdi、canvas、data、datalist、details、figcaption、figure、footer、header、hgroup mark、meter、nav、output、progress、section、summary、time、video这些标签中的一个或者多个时,判断所述网页采用的是HTML5布局。
在一个实施例中,所述HTML5布局检测方法还包括:当未查找到所述HTML5相关标签时,确定所述网页不是HTML5布局。具体地,当在所述源代码中未查找到abbr、article、aside、audio、bdi、canvas、data、datalist、details、figcaption、figure、footer、header、hgroup mark、meter、nav、output、progress、section、summary、time、video这些标签中的任一个时,判断所述网页采用的不是HTML5布局。
在一个实施例中,所述HTML5布局检测方法还包括:将所述网页是否是HTML5布局以消息框显示。具体地,当确定所述网页是HTML5布局时,以消息框显示所述网站网址的网页布局是HTML5布局。当确定所述网页不是HTML5布局时,以消息框显示所述网站网址的网页布局不是HTML5布局。
本发明提供一种HTML5布局检测系统。在一个实施例中,如图2所示,所述HTML5布局检测系统1包括网站地址输入模块11、网页源码获取模块12以及网站布局确定模块13,其中:
网站地址输入模块11用于接收待检测的网站地址。在一个实施例中,接收用户输入的待检测的网站地址。
网页源码获取模块12与所述网站输入模块11相连,用于从所述网站输入模块中获取所述网站地址,访问所述网站地址对应的网页并获取所述网页的源代码。在一个实施例中,所述网页源码获取模块中的访问所述网站地址对应的网页并获取所述网页的源代码是通过后台执行完成的。
网站布局确定模块13与所述网页源码获取模块12相连,用于在所述源代码中查找HTML5相关标签;当查找到所述HTML5相关标签时,确定所述网页是HTML5布局。在一个实施例中,所述HTML5相关标签包括abbr、article、aside、audio、bdi、canvas、data、datalist、details、figcaption、figure、footer、header、hgroupmark、meter、nav、output、progress、section、summary、time、video中的至少一种。当在所述源代码中查找到abbr、article、aside、audio、bdi、canvas、data、datalist、details、figcaption、figure、footer、header、hgroup mark、meter、nav、output、progress、section、summary、time、video这些标签中的一个或者多个时,判断所述网页采用的是HTML5布局。
在一个实施例中,网站布局确定模块13还用于:当未查找到所述HTML5相关标签时,确定所述网页不是HTML5布局。具体地,当在所述源代码中未查找到abbr、article、aside、audio、bdi、canvas、data、datalist、details、figcaption、figure、footer、header、hgroupmark、meter、nav、output、progress、section、summary、time、video这些标签中的任一个时,判断所述网页采用的不是HTML5布局。
在一个实施例中,网站布局确定模块13还用于:将所述网页是否是HTML5布局以消息框显示。具体地,当确定所述网页是HTML5布局时,以消息框显示所述网站网址的网页布局是HTML5布局。当确定所述网页不是HTML5布局时,以消息框显示所述网站网址的网页布局不是HTML5布局。
综上所述,本发明的一种HTML5布局检测方法及系统能够自动检测网站页面是否采用HTML5结构布局。所以,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
Claims (10)
1.一种HTML5布局检测方法,其特征在于,所述HTML5布局检测方法包括:
接收待检测的网站地址;
访问所述网站地址对应的网页并获取所述网页的源代码;
在所述源代码中查找HTML5相关标签;
当查找到所述HTML5相关标签时,确定所述网页是HTML5布局。
2.根据权利要求1所述的HTML5布局检测方法,其特征在于:所述访问所述网站地址对应的网页并获取所述网页的源代码是通过后台执行完成的。
3.根据权利要求1所述的HTML5布局检测方法,其特征在于:所述HTML5相关标签包括abbr、article、aside、audio、bdi、canvas、data、datalist、details、figcaption、figure、footer、header、hgroupmark、meter、nav、output、progress、section、summary、time或video中的至少一种。
4.根据权利要求1所述的HTML5布局检测方法,其特征在于:所述HTML5布局检测方法还包括:当未查找到所述HTML5相关标签时,确定所述网页不是HTML5布局。
5.根据权利要求1或4所述的HTML5布局检测方法,其特征在于:所述HTML5布局检测方法还包括:将所述网页是否是HTML5布局以消息框显示。
6.一种HTML5布局检测系统,其特征在于:所述HTML5布局检测系统包括:
网站地址输入模块,用于接收待检测的网站地址;
网页源码获取模块,与所述网站输入模块相连,用于从所述网站输入模块中获取所述网站地址,访问所述网站地址对应的网页并获取所述网页的源代码;
网站布局确定模块,与所述网页源码获取模块相连,用于在所述源代码中查找HTML5相关标签;当查找到所述HTML5相关标签时,确定所述网页是HTML5布局。
7.根据权利要求6所述的HTML5布局检测系统,其特征在于:所述网页源码获取模块中的访问所述网站地址对应的网页并获取所述网页的源代码是通过后台执行完成的。
8.根据权利要求6所述的HTML5布局检测系统,其特征在于:所述HTML5相关标签包括abbr、article、aside、audio、bdi、canvas、data、datalist、details、figcaption、figure、footer、header、hgroupmark、meter、nav、output、progress、section、summary、time、video中的至少一种。
9.根据权利要求6所述的HTML5布局检测系统,其特征在于:所述网站布局确定模块还用于:当未查找到所述HTML5相关标签时,确定所述网页不是HTML5布局。
10.根据权利要求6或9所述的HTML5布局检测系统,其特征在于:所述网站布局确定模块还用于:将所述网页是否是HTML5布局以消息框显示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410823045.9A CN104408208A (zh) | 2014-12-22 | 2014-12-22 | 一种html5布局检测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410823045.9A CN104408208A (zh) | 2014-12-22 | 2014-12-22 | 一种html5布局检测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104408208A true CN104408208A (zh) | 2015-03-11 |
Family
ID=52645839
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410823045.9A Pending CN104408208A (zh) | 2014-12-22 | 2014-12-22 | 一种html5布局检测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104408208A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106874193A (zh) * | 2017-01-09 | 2017-06-20 | 深圳市赛亿科技开发有限公司 | 一种检测flex布局属性完整性的方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020156803A1 (en) * | 1999-08-23 | 2002-10-24 | Vadim Maslov | Method for extracting digests, reformatting, and automatic monitoring of structured online documents based on visual programming of document tree navigation and transformation |
CN103383695A (zh) * | 2013-06-24 | 2013-11-06 | 百度在线网络技术(北京)有限公司 | 一种用于识别wap页面的方法与设备 |
CN103745003A (zh) * | 2014-01-24 | 2014-04-23 | 北京京东尚科信息技术有限公司 | Html片段的检测方法 |
CN103809940A (zh) * | 2012-11-07 | 2014-05-21 | 江苏仕德伟网络科技股份有限公司 | 一种判断div+css结构的方法 |
-
2014
- 2014-12-22 CN CN201410823045.9A patent/CN104408208A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020156803A1 (en) * | 1999-08-23 | 2002-10-24 | Vadim Maslov | Method for extracting digests, reformatting, and automatic monitoring of structured online documents based on visual programming of document tree navigation and transformation |
CN103809940A (zh) * | 2012-11-07 | 2014-05-21 | 江苏仕德伟网络科技股份有限公司 | 一种判断div+css结构的方法 |
CN103383695A (zh) * | 2013-06-24 | 2013-11-06 | 百度在线网络技术(北京)有限公司 | 一种用于识别wap页面的方法与设备 |
CN103745003A (zh) * | 2014-01-24 | 2014-04-23 | 北京京东尚科信息技术有限公司 | Html片段的检测方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106874193A (zh) * | 2017-01-09 | 2017-06-20 | 深圳市赛亿科技开发有限公司 | 一种检测flex布局属性完整性的方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104699704B (zh) | 内容推送及接收方法、装置和系统 | |
US9639631B2 (en) | Converting XML to JSON with configurable output | |
US10713324B2 (en) | Search results for native applications | |
US20180191798A1 (en) | Methods and systems for server-side rendering of native content for presentation | |
TWI670611B (zh) | 網頁文件發送方法、網頁渲染方法及裝置、網頁渲染系統 | |
US20130132422A1 (en) | System and method for creating and controlling an application operating on a plurality of computer platform types | |
US10536354B1 (en) | Methods and systems for identifying styles of properties of document object model elements of an information resource | |
TW201437826A (zh) | 網頁樣式位址合併的方法和裝置 | |
JP2018524723A (ja) | 無限スクロールグラフィカルユーザインターフェース内のスクロールイベントを帰属させるシステムおよび方法 | |
EP3249554A1 (en) | Systems and methods for client-side dynamic information resource activation and deactivation | |
CN103678511A (zh) | 根据可视化模板进行网页内容抽取的方法及装置 | |
CN103678509A (zh) | 生成网页模板的方法及装置 | |
CN102955850A (zh) | 加载排序网址的方法和装置 | |
US9465814B2 (en) | Annotating search results with images | |
CN110309386B (zh) | 一种网页爬取的方法和装置 | |
CN104133870A (zh) | 一种网页相似度计算方法及装置 | |
CN102902784B (zh) | 网页分类存储系统及方法 | |
CN110955803A (zh) | 基于图数据库的关系图谱的绘制方法、装置、设备及介质 | |
CN106033387B (zh) | 测试flash内部控件的方法和装置 | |
CN102880707A (zh) | 网页主体内容识别方法和装置 | |
CN103678510A (zh) | 对网页提供可视化标注的方法及装置 | |
US20150169567A1 (en) | Search result image display environment and background | |
US9665617B1 (en) | Methods and systems for generating a stable identifier for nodes likely including primary content within an information resource | |
CN107391175B (zh) | 控件数据配置方法及计算机可读存储介质 | |
CN104408208A (zh) | 一种html5布局检测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
EXSB | Decision made by sipo to initiate substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20150311 |