CN103810178A

CN103810178A - 一种计算网页完整率的方法

Info

Publication number: CN103810178A
Application number: CN201210439700.1A
Authority: CN
Inventors: 陈德阳; 黄国建; 李建中; 高涵毅; 张峰; 汪张宪; 范锋华; 朱平; 亓明敬
Original assignee: JIANGSU SHIDEWEI NETWORK TECHNOLOGY Co Ltd
Current assignee: JIANGSU SHIDEWEI NETWORK TECHNOLOGY Co Ltd
Priority date: 2012-11-07
Filing date: 2012-11-07
Publication date: 2014-05-21

Abstract

本发明公开了一种计算网页完整率的方法，包括以下步骤：据网站地址，通过虚拟请求的方式获取到网站页面的html源码，接着可以根据html源码抓取到指向自己本网站的链接，以此类推获取到整个站点所有的网页，然后分析所有网页的html源码，找到meta标签，分析其meta标签的keywords和description属性是否已经设置，并且不是空的，最后对meta标签是否完整作出统计，计算出meta标签完整率，(公式：meta标签不完整的页面个数/网站的网页个数)；计算出完整率，通过网页的显示出来。采用本发明技术方案，很方便得检查出网站meta标签设置是否完整以及对搜索引擎的收录效果。

Description

一种计算网页完整率的方法

技术领域

本发明涉及网络软件技术领域，具体涉及一种计算网页完整率的方法。

背景技术

Meta标签是HTML标记HEAD区的一个关键标签，它提供的信息虽然用户不可见，但却是文档的最基本的元信息，除了提供文档字符集、使用语言、作者等基本信息外，还涉及对关键词和网页等级的设定。

各大主流搜索引擎，对于Meta标签的重视程度也是相当高，基本上搜索引擎通过蜘蛛收录网页时，都是通过meta标签内设置的关键词以及页面描述信息来进行分析，并分类收录。

所以保证每张页面的meta标签的完整性，对于网站的完整度、专业度以及推广度是极为重要的。

发明内容

本发明的目的在于克服现有技术存在的以上问题，提供一种计算网页完整率的方法，本发明很方便得检查出网站meta标签设置是否完整以及对搜索引擎的收录效果。

为实现上述技术目的，达到上述技术效果，本发明通过以下技术方案实现：

一种计算网页完整率的方法，包括以下步骤：

步骤1)输入网址，并触发检测；

步骤2)获取到页面源码，并对页面源码进行分析；

步骤3)获取到所有的站内链接，通过站内链接再次深入抓取站内链接，直到抓取到所有站内链接；

步骤4)获取并分析所有站内链接的html源码，判断每一页的meta标签是否完整，并统计出meta标签设置不完整的页面个数和总的页面个数；

步骤5)通过公式meta标签设置不完整的页面个数/总的页面个数计算出meta标签完整率；

步骤6)通过页面显示出来。

本发明的有益效果是：

本发明很方便得检查出网站meta标签设置是否完整以及对搜索引擎的收录效果。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，并可依照说明书的内容予以实施，以下以本发明的较佳实施例并配合附图详细说明如后。本发明的具体实施方式由以下实施例及其附图详细给出。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是本发明的流程示意图。

具体实施方式

下面将参考附图并结合实施例，来详细说明本发明。

参照图1所示，一种计算网页完整率的方法，包括以下步骤：

步骤1)输入网址，并触发检测；

步骤2)获取到页面源码，并对页面源码进行分析；

步骤6)通过页面显示出来。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种计算网页完整率的方法，其特征在于：包括以下步骤：

步骤1)输入网址，并触发检测；

步骤2)获取到页面源码，并对页面源码进行分析；

步骤6)通过页面显示出来。