CN104408208A - 一种html5布局检测方法及系统 - Google Patents

一种html5布局检测方法及系统 Download PDF

Info

Publication number
CN104408208A
CN104408208A CN201410823045.9A CN201410823045A CN104408208A CN 104408208 A CN104408208 A CN 104408208A CN 201410823045 A CN201410823045 A CN 201410823045A CN 104408208 A CN104408208 A CN 104408208A
Authority
CN
China
Prior art keywords
html5
layout
webpage
source code
detection method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410823045.9A
Other languages
English (en)
Inventor
唐芬芬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Feixun Data Communication Technology Co Ltd
Original Assignee
Shanghai Feixun Data Communication Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Feixun Data Communication Technology Co Ltd filed Critical Shanghai Feixun Data Communication Technology Co Ltd
Priority to CN201410823045.9A priority Critical patent/CN104408208A/zh
Publication of CN104408208A publication Critical patent/CN104408208A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供一种HTML5布局检测方法及系统。所述HTML5布局检测方法包括:接收待检测的网站地址;访问所述网站地址对应的网页并获取所述网页的源代码;在所述源代码中查找HTML5相关标签;当查找到所述HTML5相关标签时,确定所述网页是HTML5布局。所述HTML5布局检测系统包括:网站地址输入模块用于接收待检测的网站地址;网页源码获取模块用于获取所述网站地址,访问所述网站地址对应的网页并获取所述网页的源代码;网站布局确定模块用于在所述源代码中查找HTML5相关标签;当查找到所述HTML5相关标签时,确定所述网页是HTML5布局。本发明的技术方案能够自动检测网站页面是否采用HTML5结构布局。

Description

一种HTML5布局检测方法及系统
技术领域
本发明涉及一种网络技术,特别是涉及一种HTML5布局检测方法及系统。
背景技术
随着互联网的发展,互联网的宣传作用和商业价值不断增长。为了提高在互联网的宣传能力,就要通过完善互联网上产品的相关网页,以让一些权威的搜索引擎愿意爬取到该产品网页上,从而让更多的用户知道、了解进而购买使用所述产品,更大程度的发掘和留住用户,进而创造更大的商业价值。
HTML5规范是万维网联盟(W3C)由2012年12月17日正式宣布定稿的第五版超级文本标记(HyperText Markup language)。采用HTML5布局能够更好得迎合搜索引擎优化,更精美的动画效果,更快的图片下载速度和WEB应用开发更容易,尤其是移动应用,所以采用HTML5布局对完善互联网上产品相关网页的重要性显而易见。通过确定网页界面是不是HTML5,可以在一定程度上明确看清楚产品的相关网页是否存在优化和完善的空间,更好的维护互联网产品的相关网页。但是对于互联网上产品的相关网页是否采用HTML5布局并不能直观确定,如果需要确定网站界面是不是HTML5结构,通常采用的办法为:打开网页后,通过点击右键查看源代码,然后在所述源代码中手动搜索跟HTML5相关的标签,这种方法不仅工作量大而且还可能不准确。
鉴于此,如何找到一种能够自动检测网站页面是否采用HTML5结构布局的方法成为了本领域技术人员亟待解决的问题。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种HTML5布局检测方法及系统,用于解决现有技术中确定网站界面是不是HTML5结构的方法不仅工作量大而且还可能不准确的问题。
为实现上述目的及其他相关目的,本发明提供一种HTML5布局检测方法,所述HTML5布局检测方法包括:接收待检测的网站地址;访问所述网站地址对应的网页并获取所述网页的源代码;在所述源代码中查找HTML5相关标签;当查找到所述HTML5相关标签时,确定所述网页是HTML5布局。
可选地,所述访问所述网站地址对应的网页并获取所述网页的源代码是通过后台执行完成的。
可选地,所述HTML5相关标签包括abbr、article、aside、audio、bdi、canvas、data、datalist、details、figcaption、figure、footer、header、hgroupmark、meter、nav、output、progress、section、summary、time、或video中的至少一种。
可选地,所述HTML5布局检测方法还包括:当未查找到所述HTML5相关标签时,确定所述网页不是HTML5布局。
可选地,所述HTML5布局检测方法还包括:将所述网页是否是HTML5布局以消息框显示。
本发明提供一种HTML5布局检测系统,所述HTML5布局检测系统包括:网站地址输入模块,用于接收待检测的网站地址;网页源码获取模块,与所述网站输入模块相连,用于从所述网站输入模块中获取所述网站地址,访问所述网站地址对应的网页并获取所述网页的源代码;网站布局确定模块,与所述网页源码获取模块相连,用于在所述源代码中查找HTML5相关标签;当查找到所述HTML5相关标签时,确定所述网页是HTML5布局。
可选地,所述网页源码获取模块中的访问所述网站地址对应的网页并获取所述网页的源代码是通过后台执行完成的。
可选地,所述HTML5相关标签包括abbr、article、aside、audio、bdi、canvas、data、datalist、details、figcaption、figure、footer、header、hgroupmark、meter、nav、output、progress、section、summary、time、video中的至少一种。
可选地,所述网站布局确定模块还用于:当未查找到所述HTML5相关标签时,确定所述网页不是HTML5布局。
可选地,所述网站布局确定模块还用于:将所述网页是否是HTML5布局以消息框显示。
如上所述,本发明的一种HTML5布局检测方法及系统,具有以下有益效果:能够自动检测网站页面是否采用HTML5结构布局。
附图说明
图1显示为本发明的一种HTML5布局检测方法的一实施例的流程示意图。
图2显示为本发明的一种HTML5布局检测系统的一实施例的模块示意图。
元件标号说明
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。
需要说明的是,本实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
一种HTML5布局检测方法。在一个实施例中,如图1所示,所述HTML5布局检测方法包括:
步骤S1,接收待检测的网站地址。在一个实施例中,接收用户输入的待检测的网站地址。
步骤S2,访问所述网站地址对应的网页并获取所述网页的源代码。在一个实施例中,所述访问所述网站地址对应的网页并获取所述网页的源代码是通过后台执行完成的。
步骤S3,在所述源代码中查找HTML5相关标签。在一个实施例中,所述HTML5相关标签包括abbr、article、aside、audio、bdi、canvas、data、datalist、details、figcaption、figure、footer、header、hgroupmark、meter、nav、output、progress、section、summary、time、video中的至少一种。即判断源代码中是否包含abbr、article、aside、audio、bdi、canvas、data、datalist、details、figcaption、figure、footer、header、hgroup mark、meter、nav、output、progress、section、summary、time、video这些标签中的一个或者多个。这些标签都是HTML5布局所用的特有标签。
步骤S4,当查找到所述HTML5相关标签时,确定所述网页是HTML5布局。具体地,当在所述源代码中查找到abbr、article、aside、audio、bdi、canvas、data、datalist、details、figcaption、figure、footer、header、hgroup mark、meter、nav、output、progress、section、summary、time、video这些标签中的一个或者多个时,判断所述网页采用的是HTML5布局。
在一个实施例中,所述HTML5布局检测方法还包括:当未查找到所述HTML5相关标签时,确定所述网页不是HTML5布局。具体地,当在所述源代码中未查找到abbr、article、aside、audio、bdi、canvas、data、datalist、details、figcaption、figure、footer、header、hgroup mark、meter、nav、output、progress、section、summary、time、video这些标签中的任一个时,判断所述网页采用的不是HTML5布局。
在一个实施例中,所述HTML5布局检测方法还包括:将所述网页是否是HTML5布局以消息框显示。具体地,当确定所述网页是HTML5布局时,以消息框显示所述网站网址的网页布局是HTML5布局。当确定所述网页不是HTML5布局时,以消息框显示所述网站网址的网页布局不是HTML5布局。
本发明提供一种HTML5布局检测系统。在一个实施例中,如图2所示,所述HTML5布局检测系统1包括网站地址输入模块11、网页源码获取模块12以及网站布局确定模块13,其中:
网站地址输入模块11用于接收待检测的网站地址。在一个实施例中,接收用户输入的待检测的网站地址。
网页源码获取模块12与所述网站输入模块11相连,用于从所述网站输入模块中获取所述网站地址,访问所述网站地址对应的网页并获取所述网页的源代码。在一个实施例中,所述网页源码获取模块中的访问所述网站地址对应的网页并获取所述网页的源代码是通过后台执行完成的。
网站布局确定模块13与所述网页源码获取模块12相连,用于在所述源代码中查找HTML5相关标签;当查找到所述HTML5相关标签时,确定所述网页是HTML5布局。在一个实施例中,所述HTML5相关标签包括abbr、article、aside、audio、bdi、canvas、data、datalist、details、figcaption、figure、footer、header、hgroupmark、meter、nav、output、progress、section、summary、time、video中的至少一种。当在所述源代码中查找到abbr、article、aside、audio、bdi、canvas、data、datalist、details、figcaption、figure、footer、header、hgroup mark、meter、nav、output、progress、section、summary、time、video这些标签中的一个或者多个时,判断所述网页采用的是HTML5布局。
在一个实施例中,网站布局确定模块13还用于:当未查找到所述HTML5相关标签时,确定所述网页不是HTML5布局。具体地,当在所述源代码中未查找到abbr、article、aside、audio、bdi、canvas、data、datalist、details、figcaption、figure、footer、header、hgroupmark、meter、nav、output、progress、section、summary、time、video这些标签中的任一个时,判断所述网页采用的不是HTML5布局。
在一个实施例中,网站布局确定模块13还用于:将所述网页是否是HTML5布局以消息框显示。具体地,当确定所述网页是HTML5布局时,以消息框显示所述网站网址的网页布局是HTML5布局。当确定所述网页不是HTML5布局时,以消息框显示所述网站网址的网页布局不是HTML5布局。
综上所述,本发明的一种HTML5布局检测方法及系统能够自动检测网站页面是否采用HTML5结构布局。所以,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (10)

1.一种HTML5布局检测方法,其特征在于,所述HTML5布局检测方法包括:
接收待检测的网站地址;
访问所述网站地址对应的网页并获取所述网页的源代码;
在所述源代码中查找HTML5相关标签;
当查找到所述HTML5相关标签时,确定所述网页是HTML5布局。
2.根据权利要求1所述的HTML5布局检测方法,其特征在于:所述访问所述网站地址对应的网页并获取所述网页的源代码是通过后台执行完成的。
3.根据权利要求1所述的HTML5布局检测方法,其特征在于:所述HTML5相关标签包括abbr、article、aside、audio、bdi、canvas、data、datalist、details、figcaption、figure、footer、header、hgroupmark、meter、nav、output、progress、section、summary、time或video中的至少一种。
4.根据权利要求1所述的HTML5布局检测方法,其特征在于:所述HTML5布局检测方法还包括:当未查找到所述HTML5相关标签时,确定所述网页不是HTML5布局。
5.根据权利要求1或4所述的HTML5布局检测方法,其特征在于:所述HTML5布局检测方法还包括:将所述网页是否是HTML5布局以消息框显示。
6.一种HTML5布局检测系统,其特征在于:所述HTML5布局检测系统包括:
网站地址输入模块,用于接收待检测的网站地址;
网页源码获取模块,与所述网站输入模块相连,用于从所述网站输入模块中获取所述网站地址,访问所述网站地址对应的网页并获取所述网页的源代码;
网站布局确定模块,与所述网页源码获取模块相连,用于在所述源代码中查找HTML5相关标签;当查找到所述HTML5相关标签时,确定所述网页是HTML5布局。
7.根据权利要求6所述的HTML5布局检测系统,其特征在于:所述网页源码获取模块中的访问所述网站地址对应的网页并获取所述网页的源代码是通过后台执行完成的。
8.根据权利要求6所述的HTML5布局检测系统,其特征在于:所述HTML5相关标签包括abbr、article、aside、audio、bdi、canvas、data、datalist、details、figcaption、figure、footer、header、hgroupmark、meter、nav、output、progress、section、summary、time、video中的至少一种。
9.根据权利要求6所述的HTML5布局检测系统,其特征在于:所述网站布局确定模块还用于:当未查找到所述HTML5相关标签时,确定所述网页不是HTML5布局。
10.根据权利要求6或9所述的HTML5布局检测系统,其特征在于:所述网站布局确定模块还用于:将所述网页是否是HTML5布局以消息框显示。
CN201410823045.9A 2014-12-22 2014-12-22 一种html5布局检测方法及系统 Pending CN104408208A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410823045.9A CN104408208A (zh) 2014-12-22 2014-12-22 一种html5布局检测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410823045.9A CN104408208A (zh) 2014-12-22 2014-12-22 一种html5布局检测方法及系统

Publications (1)

Publication Number Publication Date
CN104408208A true CN104408208A (zh) 2015-03-11

Family

ID=52645839

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410823045.9A Pending CN104408208A (zh) 2014-12-22 2014-12-22 一种html5布局检测方法及系统

Country Status (1)

Country Link
CN (1) CN104408208A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874193A (zh) * 2017-01-09 2017-06-20 深圳市赛亿科技开发有限公司 一种检测flex布局属性完整性的方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020156803A1 (en) * 1999-08-23 2002-10-24 Vadim Maslov Method for extracting digests, reformatting, and automatic monitoring of structured online documents based on visual programming of document tree navigation and transformation
CN103383695A (zh) * 2013-06-24 2013-11-06 百度在线网络技术(北京)有限公司 一种用于识别wap页面的方法与设备
CN103745003A (zh) * 2014-01-24 2014-04-23 北京京东尚科信息技术有限公司 Html片段的检测方法
CN103809940A (zh) * 2012-11-07 2014-05-21 江苏仕德伟网络科技股份有限公司 一种判断div+css结构的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020156803A1 (en) * 1999-08-23 2002-10-24 Vadim Maslov Method for extracting digests, reformatting, and automatic monitoring of structured online documents based on visual programming of document tree navigation and transformation
CN103809940A (zh) * 2012-11-07 2014-05-21 江苏仕德伟网络科技股份有限公司 一种判断div+css结构的方法
CN103383695A (zh) * 2013-06-24 2013-11-06 百度在线网络技术(北京)有限公司 一种用于识别wap页面的方法与设备
CN103745003A (zh) * 2014-01-24 2014-04-23 北京京东尚科信息技术有限公司 Html片段的检测方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874193A (zh) * 2017-01-09 2017-06-20 深圳市赛亿科技开发有限公司 一种检测flex布局属性完整性的方法及系统

Similar Documents

Publication Publication Date Title
CN104699704B (zh) 内容推送及接收方法、装置和系统
US9639631B2 (en) Converting XML to JSON with configurable output
US10713324B2 (en) Search results for native applications
US20180191798A1 (en) Methods and systems for server-side rendering of native content for presentation
TWI670611B (zh) 網頁文件發送方法、網頁渲染方法及裝置、網頁渲染系統
US20130132422A1 (en) System and method for creating and controlling an application operating on a plurality of computer platform types
US10536354B1 (en) Methods and systems for identifying styles of properties of document object model elements of an information resource
TW201437826A (zh) 網頁樣式位址合併的方法和裝置
JP2018524723A (ja) 無限スクロールグラフィカルユーザインターフェース内のスクロールイベントを帰属させるシステムおよび方法
EP3249554A1 (en) Systems and methods for client-side dynamic information resource activation and deactivation
CN103678511A (zh) 根据可视化模板进行网页内容抽取的方法及装置
CN103678509A (zh) 生成网页模板的方法及装置
CN102955850A (zh) 加载排序网址的方法和装置
US9465814B2 (en) Annotating search results with images
CN110309386B (zh) 一种网页爬取的方法和装置
CN104133870A (zh) 一种网页相似度计算方法及装置
CN102902784B (zh) 网页分类存储系统及方法
CN110955803A (zh) 基于图数据库的关系图谱的绘制方法、装置、设备及介质
CN106033387B (zh) 测试flash内部控件的方法和装置
CN102880707A (zh) 网页主体内容识别方法和装置
CN103678510A (zh) 对网页提供可视化标注的方法及装置
US20150169567A1 (en) Search result image display environment and background
US9665617B1 (en) Methods and systems for generating a stable identifier for nodes likely including primary content within an information resource
CN107391175B (zh) 控件数据配置方法及计算机可读存储介质
CN104408208A (zh) 一种html5布局检测方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20150311