CN106815277B - 搜索引擎优化的评估方法及装置 - Google Patents

搜索引擎优化的评估方法及装置 Download PDF

Info

Publication number
CN106815277B
CN106815277B CN201510894504.7A CN201510894504A CN106815277B CN 106815277 B CN106815277 B CN 106815277B CN 201510894504 A CN201510894504 A CN 201510894504A CN 106815277 B CN106815277 B CN 106815277B
Authority
CN
China
Prior art keywords
search engine
webpage link
link address
index rate
total number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510894504.7A
Other languages
English (en)
Other versions
CN106815277A (zh
Inventor
姜世豪
杨韬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201510894504.7A priority Critical patent/CN106815277B/zh
Publication of CN106815277A publication Critical patent/CN106815277A/zh
Application granted granted Critical
Publication of CN106815277B publication Critical patent/CN106815277B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请公开了一种搜索引擎优化的评估方法及装置。该方法包括:通过预设提取工具提取目标网站源代码中的网页链接地址,得到网页链接地址集合;分别查询网页链接地址集合中每个网页链接地址是否被搜索引擎索引,统计被搜索引擎索引的网页链接地址的总数;根据网页链接地址集合中网页链接地址的总数和被搜索引擎索引的网页链接地址的总数计算索引率,其中,索引率为被搜索引擎索引的网页链接地址的总数与网页链接地址集合中网页链接地址的总数的比值;以及根据索引率评估目标网站在搜索引擎优化中的提升空间。通过本申请,解决了相关技术中无法评估网站在搜索引擎优化中的提升空间的问题。

Description

搜索引擎优化的评估方法及装置
技术领域
本申请涉及互联网领域,具体而言,涉及一种搜索引擎优化的评估方法及装置。
背景技术
目前,为了提升网站在自然搜索结果中的关键词排名,通过搜索引擎优化(SearchEngine Optimization,简称SEO)对网站进行的调整,包括了站内的链接结构、代码、内容质量等的优化,以及站外的环境优化和链接建设。SEO是一个长期的工作,优化过程的各个阶段都需要制定阶段性指标来监测优化效果。因此需要监测哪些指标需要从搜索引擎优化所处的阶段出发来合理制定。从搜索引擎工作原理来分析优化过程,大致分为两大阶段:第一阶段是对网站各页面抓取并将符合要求的页面存放在索引库中;第二阶段是将高质量的页面匹配用户的搜索关键词进行排名。对于第一阶段的指标来说,当前大多数搜索引擎都提供了站点索引量查询来衡量一个网站有多少页面被存放在搜索引擎索引库中,也就意味着该网站有机会参与排名的页面数量;第二阶段的衡量指标可以是关键词排名,来直观反映一个页面的内容质量。然而,对于一个网站来说,第一阶段指标索引量可以反映出各搜索引擎对网站认可的页面数量,但是,索引量指标目前无法评估提升潜力。仅仅是从绝对数量上的对比,仍然无法得知一个网站被搜索引擎索引的潜力有多大。如果站长对网站总页面数有多少没有准确统计,仅根据网站索引量,并不能评估网站在搜索引擎优化中的提升空间有多大。因此导致无法评估网站在搜索引擎优化中的提升空间。
针对相关技术中无法评估网站在搜索引擎优化中的提升空间的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种搜索引擎优化的评估方法及装置,以解决相关技术中无法评估网站在搜索引擎优化中的提升空间的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种搜索引擎优化的评估方法。该方法包括:通过预设提取工具提取目标网站源代码中的网页链接地址,得到网页链接地址集合;分别查询网页链接地址集合中每个网页链接地址是否被搜索引擎索引,统计被搜索引擎索引的网页链接地址的总数;根据网页链接地址集合中网页链接地址的总数和被搜索引擎索引的网页链接地址的总数计算索引率,其中,索引率为被搜索引擎索引的网页链接地址的总数与网页链接地址集合中网页链接地址的总数的比值;以及根据索引率评估目标网站在搜索引擎优化中的提升空间。
进一步地,在得到网页链接地址集合之后,在分别查询网页链接地址集合中每个网页链接地址是否被搜索引擎索引之前,该方法还包括:根据预设筛选条件对所述网页链接地址集合进行筛选,得到目标网页链接地址,分别查询网页链接地址集合中每个网页链接地址是否被搜索引擎索引,统计被搜索引擎索引的网页链接地址的总数包括:分别查询目标网页链接地址是否被搜索引擎索引,统计被搜索引擎索引的目标网页链接地址的总数,根据网页链接地址集合中网页链接地址的总数和被搜索引擎索引的网页链接地址的总数计算索引率包括:根据网页链接地址集合中目标网页链接地址的总数和被搜索引擎索引的目标网页链接地址的总数计算索引率。
进一步地,根据索引率评估目标网站在搜索引擎优化中的提升空间包括:判断索引率是否大于预设索引率;如果索引率大于预设索引率,判定目标网站中的目标网页链接地址在搜索引擎优化中的提升值小于预设提升值;如果索引率小于或等于预设索引率,判定目标网站中的目标网页链接地址在搜索引擎优化中的提升值大于预设提升值,调整目标网站源代码中目标网页链接地址的代码信息以降低目标网页链接地址在搜索引擎优化中的提升值。
进一步地,根据索引率评估目标网站在搜索引擎优化中的提升空间包括:判断索引率是否大于预设索引率;如果索引率大于预设索引率,判定目标网站在搜索引擎优化中的提升值小于预设提升值;以及如果索引率小于或等于预设索引率,判定目标网站在搜索引擎优化中的提升值大于预设提升值。
进一步地,分别查询网页链接地址集合中每个网页链接地址是否被搜索引擎索引,统计被搜索引擎索引的网页链接地址的总数包括:分别查询网页链接地址集合中每个网页链接地址是否被搜索引擎索引,得到查询结果列表,其中,查询结果列表包括每个网页链接地址和每个网页链接地址对应的查询结果;以及根据查询结果列表中存储的数据统计被搜索引擎索引的网页链接地址的总数。
为了实现上述目的,根据本申请的另一方面,提供了一种搜索引擎优化的评估装置。该装置包括:提取单元,用于通过预设提取工具提取目标网站源代码中的网页链接地址,得到网页链接地址集合;统计单元,用于分别查询网页链接地址集合中每个网页链接地址是否被搜索引擎索引,统计被搜索引擎索引的网页链接地址的总数;计算单元,用于根据网页链接地址集合中目标网页链接地址的总数和被搜索引擎索引的网页链接地址的总数计算索引率。
进一步地,该装置还包括:筛选单元,用于根据预设筛选条件对所述网页链接地址集合进行筛选,得到目标网页链接地址,统计单元还用于分别查询目标网页链接地址是否被搜索引擎索引,统计被搜索引擎索引的目标网页链接地址的总数,计算单元还用于根据网页链接地址集合中网页链接地址的总数和被搜索引擎索引的目标网页链接地址的总数计算索引率。
进一步地,评估单元包括:第一判断模块,用于判断索引率是否大于预设索引率;第一确定模块,用于在索引率大于预设索引率的情况下,判定目标网站中的目标网页链接地址在搜索引擎优化中的提升值小于预设提升值;第二确定模块,用于在索引率小于或等于预设索引率的情况下,判定目标网站中的目标网页链接地址在搜索引擎优化中的提升值大于预设提升值,调整目标网站源代码中目标网页链接地址的代码信息以降低目标网页链接地址在搜索引擎优化中的提升值。
进一步地,评估单元包括:第二判断模块,用于判断索引率是否大于预设索引率;第三确定模块,用于在索引率大于预设索引率的情况下,判定目标网站在搜索引擎优化中的提升值小于预设提升值;以及第四确定模块,用于在索引率小于或等于预设索引率的情况下,判定目标网站在搜索引擎优化中的提升值大于预设提升值。
进一步地,统计单元包括:获取模块,用于分别查询网页链接地址集合中每个网页链接地址是否被搜索引擎索引,得到查询结果列表,其中,查询结果列表包括每个网页链接地址和每个网页链接地址对应的查询结果;以及统计模块,用于根据查询结果列表中存储的数据统计被搜索引擎索引的网页链接地址的总数。
通过本申请,采用以下步骤:通过预设提取工具提取目标网站源代码中的网页链接地址,得到网页链接地址集合;分别查询网页链接地址集合中每个网页链接地址是否被搜索引擎索引,统计被搜索引擎索引的网页链接地址的总数;根据网页链接地址集合中网页链接地址的总数和被搜索引擎索引的网页链接地址的总数计算索引率,其中,索引率为被搜索引擎索引的网页链接地址的总数与网页链接地址集合中网页链接地址的总数的比值;以及根据索引率评估目标网站在搜索引擎优化中的提升空间,解决了相关技术中无法评估网站在搜索引擎优化中的提升空间的问题,通过引入索引率,帮助了解目标网站的整体索引情况,明确目标网站页面质量提升空间,进而实现了更精确的搜索引擎优化的效果。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的搜索引擎优化的评估方法的流程图;以及
图2是根据本申请实施例的搜索引擎优化的评估装置的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为了便于描述,以下对本申请实施例涉及的术语进行说明:
搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。
根据本申请的实施例,提供了一种搜索引擎优化的评估方法。
图1是根据本申请实施例的搜索引擎优化的评估方法的流程图。如图1所示,该方法包括以下步骤:
步骤S101,通过预设提取工具提取目标网站源代码中的网页链接地址,得到网页链接地址集合。
本申请中的预设提取工具为网站与搜索引擎优化分析工具,为用户提供一种检测用户自身网站质量以及搜索引擎检索质量的分析方法。借助该工具,可以提取目标网站源代码中的网页链接地址,用户还可以对自己的网站进行综合评价,发现网站的不足之处加以改进。同时该工具能够通过关键词检索,提供整个网站在搜索引擎中的自然搜索排名情况,为用户提供全方位的质量分析报告,使用户能够更精准更有效的对自身网站做出优化。
例如,目标网站的站点域名为www.abc.com;提取目标网站源代码中的网页链接地址,得到多个网页链接地址,例如:www.abc.com;www.abc.com/1;www.abc.com/2;www.abc.com/3;a.abc.com;a.abc.com/1等等,多个网页链接地址组成网页链接地址集合。
步骤S102,分别查询网页链接地址集合中每个网页链接地址是否被搜索引擎索引,统计被搜索引擎索引的网页链接地址的总数。
可选地,在本申请实施例提供的搜索引擎优化的评估方法中,分别查询网页链接地址集合中每个网页链接地址是否被搜索引擎索引,统计被搜索引擎索引的网页链接地址的总数包括:分别查询网页链接地址集合中每个网页链接地址是否被搜索引擎索引,得到查询结果列表,其中,查询结果列表包括每个网页链接地址和每个网页链接地址对应的查询结果;以及根据查询结果列表中存储的数据统计被搜索引擎索引的网页链接地址的总数。
分别查询上述得到的网页链接地址集合中的每个网页链接地址是否被搜索引擎索引,例如,如果网页链接地址被索引(即收录),会显示快照信息,如果网页链接地址未被收录或不存在,则会显示没有找到该网页链接地址。分别查询上述例子中的多个网页链接地址,得到结果如下表1所示:
表1
网页链接地址列表 是否被索引
www.abc.com
www.abc.com/1
www.abc.com/2
www.abc.com/3
www.abc.com/4
a.abc.com
a.abc.com/1
b.abc.com
b.abc.com/1
b.abc.com/2
…… ……
…… ……
根据表1中信息,可以统计出被搜索引擎索引的网页链接地址的总数。
步骤S103,根据网页链接地址集合中网页链接地址的总数和被搜索引擎索引的网页链接地址的总数计算索引率,其中,索引率为被搜索引擎索引的网页链接地址的总数与网页链接地址集合中网页链接地址的总数的比值。
例如,以表1中的数据为例,统计出被搜索引擎索引的网页链接地址的总数为m;表1(网页链接地址集合)中网页链接地址总数n;计算索引率=m/n*100%。
步骤S104,根据索引率评估目标网站在搜索引擎优化中的提升空间。
根据上述计算出的索引率评估目标网站在搜索引擎优化中的提升空间。
可选地,在本申请实施例提供的搜索引擎优化的评估方法中,根据索引率评估目标网站在搜索引擎优化中的提升空间包括:判断索引率是否大于预设索引率;如果索引率大于预设索引率,判定目标网站在搜索引擎优化中的提升值小于预设提升值;以及如果索引率小于或等于预设索引率,判定目标网站在搜索引擎优化中的提升值大于预设提升值。
本申请通过网站与搜索引擎优化分析工具可以模拟搜索引擎蜘蛛抓取网站页面的特点,其中的页面包含被搜索引擎索引的和未被索引的,因此可以通过此方式大体反映出网站整体页面被搜索引擎索引的比例,在无需统计站点总页面数量的情况下,仍然可以通过较精确的样本来计算网站的索引率,从而根据网站的索引率评估网站在搜索引擎优化中的提升空间。
可选地,在本申请实施例提供的搜索引擎优化的评估方法中,在得到网页链接地址集合之后,在分别查询网页链接地址集合中每个网页链接地址是否被搜索引擎索引之前,该方法还包括:根据预设筛选条件对所述网页链接地址集合进行筛选,得到目标网页链接地址,分别查询网页链接地址集合中每个网页链接地址是否被搜索引擎索引,统计被搜索引擎索引的网页链接地址的总数包括:分别查询目标网页链接地址是否被搜索引擎索引,统计被搜索引擎索引的目标网页链接地址的总数,根据网页链接地址集合中网页链接地址的总数和被搜索引擎索引的网页链接地址的总数计算索引率包括:根据网页链接地址集合中目标网页链接地址的总数和被搜索引擎索引的目标网页链接地址的总数计算索引率。
可选地,在本申请实施例提供的搜索引擎优化的评估方法中,根据索引率评估目标网站在搜索引擎优化中的提升空间包括:判断索引率是否大于预设索引率;如果索引率大于预设索引率,判定目标网站中的目标网页链接地址在搜索引擎优化中的提升值小于预设提升值;如果索引率小于或等于预设索引率,判定目标网站中的目标网页链接地址在搜索引擎优化中的提升值大于预设提升值,调整目标网站源代码中目标网页链接地址的代码信息以降低目标网页链接地址在搜索引擎优化中的提升值。
例如,从网页链接地址集合中筛选部分网页链接地址,得到目标网页链接地址为:www.abc.com;www.abc.com/1;www.abc.com/2等等,其中,目标网页链接地址的总数为n1,n1<n;分别查询目标网页链接地址是否被搜索引擎索引,统计被搜索引擎索引的目标网页链接地址的总数为m1≤m;计算索引率=m1/n1*100%,从而根据索引率去评估目标网站在搜索引擎优化中的提升空间。需要说明的是,目标网页链接地址中可以包括目标网站站点下的二级域名或特定域名和其下提取的多个网页链接地址,也可以包括在网页链接地址集合中特定挑选出的网页链接地址(即用户或者站长关心的网页链接地址)。以目标网页链接地址中包括目标网站站点下的二级域名或特定域名和其下提取的多个网页链接地址为例,通过以上步骤,可以获知目标网站站点下的二级域名或特定域名的索引情况,从而根据计算出的索引率精确的获知导致目标网站站点下的二级域名或特定域名的索引率,从而针对性的对该域名的源代码进行优化。
综上所述,对于一个确定站点的索引量分析,首先通过在搜索引擎的搜索框中输入索引量查询命令“site:”+站点域名,来明确站点在各搜索引擎的索引量。然后,在网站与搜索引擎优化分析工具中为站点建立文件,模拟搜索引擎蜘蛛进行爬取。网站与搜索引擎优化分析工具爬虫通过站点内部的链接进行爬取并记录爬取结果。只要时间允许,爬虫会尽可能统计所有爬取到的页面,对于搜索引擎来说,抓取到的页面中不符合质量要求的部分不会存放在索引库中,但对网站与搜索引擎优化分析工具来说,爬虫抓取的页面中既包含高质量的被搜索引擎放入索引库的页面,又包含了质量较低未被计入索引量的页面。因此,将网站与搜索引擎优化分析工具中统计到的数据以单个页面为单位,查询每个页面是否被索引,则可以得到网站与搜索引擎优化分析工具抓取页面总数中有多少是被搜索引擎索引的页面,得到“索引率”指标。从而根据得到的“索引率”指标评估目标网站在搜索引擎优化中的提升空间,对指导后续搜索引擎优化工作,实现更精确的搜索引擎优化。
本申请实施例提供的搜索引擎优化的评估方法,通过预设提取工具提取目标网站源代码中的网页链接地址,得到网页链接地址集合;分别查询网页链接地址集合中每个网页链接地址是否被搜索引擎索引,统计被搜索引擎索引的网页链接地址的总数;根据网页链接地址集合中网页链接地址的总数和被搜索引擎索引的网页链接地址的总数计算索引率,其中,索引率为被搜索引擎索引的网页链接地址的总数与网页链接地址集合中网页链接地址的总数的比值;以及根据索引率评估目标网站在搜索引擎优化中的提升空间,解决了相关技术中无法评估网站在搜索引擎优化中的提升空间的问题,通过引入索引率,帮助了解目标网站的整体索引情况,明确目标网站页面质量提升空间,进而实现了更精确的搜索引擎优化的效果。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例还提供了一种搜索引擎优化的评估装置,需要说明的是,本申请实施例的搜索引擎优化的评估装置可以用于执行本申请实施例所提供的用于搜索引擎优化的评估方法。以下对本申请实施例提供的搜索引擎优化的评估装置进行介绍。
图2是根据本申请实施例的搜索引擎优化的评估装置的示意图。如图2所示,该装置包括:提取单元10、统计单元20、计算单元30和评估单元40。
提取单元10,用于通过预设提取工具提取目标网站源代码中的网页链接地址,得到网页链接地址集合。
统计单元20,用于分别查询网页链接地址集合中每个网页链接地址是否被搜索引擎索引,统计被搜索引擎索引的网页链接地址的总数。
计算单元30,用于根据网页链接地址集合中网页链接地址的总数和被搜索引擎索引的网页链接地址的总数计算索引率,其中,索引率为被搜索引擎索引的网页链接地址的总数与网页链接地址集合中网页链接地址的总数的比值。
评估单元40,用于根据索引率评估目标网站在搜索引擎优化中的提升空间。
本申请实施例提供的搜索引擎优化的评估装置,通过提取单元10通过预设提取工具提取目标网站源代码中的网页链接地址,得到网页链接地址集合;统计单元20分别查询网页链接地址集合中每个网页链接地址是否被搜索引擎索引,统计被搜索引擎索引的网页链接地址的总数;计算单元30根据网页链接地址集合中网页链接地址的总数和被搜索引擎索引的网页链接地址的总数计算索引率,其中,索引率为被搜索引擎索引的网页链接地址的总数与网页链接地址集合中网页链接地址的总数的比值;以及评估单元40根据索引率评估目标网站在搜索引擎优化中的提升空间,解决了相关技术中无法评估网站在搜索引擎优化中的提升空间的问题,通过引入索引率,帮助了解目标网站的整体索引情况,明确目标网站页面质量提升空间,进而实现了更精确的搜索引擎优化的效果。
可选地,在本申请实施例提供的搜索引擎优化的评估装置中,该装置还包括:筛选单元,用于根据预设筛选条件对所述网页链接地址集合进行筛选,得到目标网页链接地址,统计单元20还用于分别查询目标网页链接地址是否被搜索引擎索引,统计被搜索引擎索引的目标网页链接地址的总数,计算单元30还用于根据网页链接地址集合中目标网页链接地址的总数和被搜索引擎索引的目标网页链接地址的总数计算索引率。
可选地,在本申请实施例提供的搜索引擎优化的评估装置中,评估单元40包括:第一判断模块,用于判断索引率是否大于预设索引率;第一确定模块,用于在索引率大于预设索引率的情况下,判定目标网站中的目标网页链接地址在搜索引擎优化中的提升值小于预设提升值;第二确定模块,用于在索引率小于或等于预设索引率的情况下,判定目标网站中的目标网页链接地址在搜索引擎优化中的提升值大于预设提升值,调整目标网站源代码中目标网页链接地址的代码信息以降低目标网页链接地址在搜索引擎优化中的提升值。
可选地,在本申请实施例提供的搜索引擎优化的评估装置中,评估单元40包括:第二判断模块,用于判断索引率是否大于预设索引率;第三确定模块,用于在索引率大于预设索引率的情况下,判定目标网站在搜索引擎优化中的提升值小于预设提升值;以及第四确定模块,用于在索引率小于或等于预设索引率的情况下,判定目标网站在搜索引擎优化中的提升值大于预设提升值。
可选地,在本申请实施例提供的搜索引擎优化的评估装置中,统计单元20包括:获取模块,用于分别查询网页链接地址集合中每个网页链接地址是否被搜索引擎索引,得到查询结果列表,其中,查询结果列表包括每个网页链接地址和每个网页链接地址对应的查询结果;以及统计模块,用于根据查询结果列表中存储的数据统计被搜索引擎索引的网页链接地址的总数。
所述搜索引擎优化的评估装置包括处理器和存储器,上述提取单元、统计单元、计算单元和评估单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元实现相应功能。上述预设索引率、预设提升值都可以存储在存储器中。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数检测网站在搜索引擎优化中提升空间。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本申请还提供了一种计算机程序产品的实施例,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:通过预设提取工具提取目标网站源代码中的网页链接地址,得到网页链接地址集合;分别查询网页链接地址集合中每个网页链接地址是否被搜索引擎索引,统计被搜索引擎索引的网页链接地址的总数;根据网页链接地址集合中网页链接地址的总数和被搜索引擎索引的网页链接地址的总数计算索引率,其中,索引率为被搜索引擎索引的网页链接地址的总数与网页链接地址集合中网页链接地址的总数的比值;以及根据索引率评估目标网站在搜索引擎优化中的提升空间。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (8)

1.一种搜索引擎优化的评估方法,其特征在于,包括:
通过预设提取工具提取目标网站源代码中的网页链接地址,得到网页链接地址集合;
分别查询所述网页链接地址集合中每个网页链接地址是否被搜索引擎索引,统计被所述搜索引擎索引的网页链接地址的总数;
根据所述网页链接地址集合中网页链接地址的总数和被所述搜索引擎索引的网页链接地址的总数计算索引率,其中,所述索引率为被所述搜索引擎索引的网页链接地址的总数与所述网页链接地址集合中网页链接地址的总数的比值;以及
根据所述索引率评估所述目标网站在所述搜索引擎优化中的提升空间;
其中,根据所述索引率评估所述目标网站在所述搜索引擎优化中的提升空间包括:
判断所述索引率是否大于预设索引率;
如果所述索引率大于所述预设索引率,判定所述目标网站在所述搜索引擎优化中的提升值小于预设提升值;以及
如果所述索引率小于或等于所述预设索引率,判定所述目标网站在所述搜索引擎优化中的提升值大于所述预设提升值。
2.根据权利要求1所述的方法,其特征在于,
在得到网页链接地址集合之后,在分别查询所述网页链接地址集合中每个网页链接地址是否被搜索引擎索引之前,所述方法还包括:根据预设筛选条件对所述网页链接地址集合进行筛选,得到目标网页链接地址,
分别查询所述网页链接地址集合中每个网页链接地址是否被搜索引擎索引,统计被所述搜索引擎索引的网页链接地址的总数包括:分别查询所述目标网页链接地址是否被搜索引擎索引,统计被所述搜索引擎索引的目标网页链接地址的总数,
根据所述网页链接地址集合中网页链接地址的总数和被所述搜索引擎索引的网页链接地址的总数计算索引率包括:根据所述网页链接地址集合中目标网页链接地址的总数和被所述搜索引擎索引的目标网页链接地址的总数计算索引率。
3.根据权利要求2所述的方法,其特征在于,根据所述索引率评估所述目标网站在所述搜索引擎优化中的提升空间包括:
判断所述索引率是否大于预设索引率;
如果所述索引率大于所述预设索引率,判定所述目标网站中的目标网页链接地址在所述搜索引擎优化中的提升值小于预设提升值;
如果所述索引率小于或等于所述预设索引率,判定所述目标网站中的目标网页链接地址在所述搜索引擎优化中的提升值大于所述预设提升值,调整所述目标网站源代码中目标网页链接地址的代码信息以降低所述目标网页链接地址在所述搜索引擎优化中的提升值。
4.根据权利要求1所述的方法,其特征在于,分别查询所述网页链接地址集合中每个网页链接地址是否被搜索引擎索引,统计被所述搜索引擎索引的网页链接地址的总数包括:
分别查询所述网页链接地址集合中每个网页链接地址是否被搜索引擎索引,得到查询结果列表,其中,所述查询结果列表包括每个网页链接地址和所述每个网页链接地址对应的查询结果;以及
根据所述查询结果列表中存储的数据统计被所述搜索引擎索引的网页链接地址的总数。
5.一种搜索引擎优化的评估装置,其特征在于,包括:
提取单元,用于通过预设提取工具提取目标网站源代码中的网页链接地址,得到网页链接地址集合;
统计单元,用于分别查询所述网页链接地址集合中每个网页链接地址是否被搜索引擎索引,统计被所述搜索引擎索引的网页链接地址的总数;
计算单元,用于根据所述网页链接地址集合中网页链接地址的总数和被所述搜索引擎索引的网页链接地址的总数计算索引率,其中,所述索引率为被所述搜索引擎索引的网页链接地址的总数与所述网页链接地址集合中网页链接地址的总数的比值;以及
评估单元,用于根据所述索引率评估所述目标网站在所述搜索引擎优化中的提升空间;
其中,所述评估单元包括:
第二判断模块,用于判断所述索引率是否大于预设索引率;
第三确定模块,用于在所述索引率大于所述预设索引率的情况下,判定所述目标网站在所述搜索引擎优化中的提升值小于预设提升值;以及
第四确定模块,用于在所述索引率小于或等于所述预设索引率的情况下,判定所述目标网站在所述搜索引擎优化中的提升值大于所述预设提升值。
6.根据权利要求5所述的装置,其特征在于,
所述装置还包括:筛选单元,用于根据预设筛选条件对所述网页链接地址集合进行筛选,得到目标网页链接地址,
所述统计单元还用于分别查询所述目标网页链接地址是否被搜索引擎索引,统计被所述搜索引擎索引的目标网页链接地址的总数,
所述计算单元还用于根据所述网页链接地址集合中网页链接地址的总数和被所述搜索引擎索引的目标网页链接地址的总数计算索引率。
7.根据权利要求6所述的装置,其特征在于,所述评估单元包括:
第一判断模块,用于判断所述索引率是否大于预设索引率;
第一确定模块,用于在所述索引率大于所述预设索引率的情况下,判定所述目标网站中的目标网页链接地址在所述搜索引擎优化中的提升值小于预设提升值;
第二确定模块,用于在所述索引率小于或等于所述预设索引率的情况下,判定所述目标网站中的目标网页链接地址在所述搜索引擎优化中的提升值大于所述预设提升值,调整所述目标网站源代码中目标网页链接地址的代码信息以降低所述目标网页链接地址在所述搜索引擎优化中的提升值。
8.根据权利要求5所述的装置,其特征在于,所述统计单元包括:
获取模块,用于分别查询所述网页链接地址集合中每个网页链接地址是否被搜索引擎索引,得到查询结果列表,其中,所述查询结果列表包括每个网页链接地址和所述每个网页链接地址对应的查询结果;以及
统计模块,用于根据所述查询结果列表中存储的数据统计被所述搜索引擎索引的网页链接地址的总数。
CN201510894504.7A 2015-11-27 2015-11-27 搜索引擎优化的评估方法及装置 Active CN106815277B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510894504.7A CN106815277B (zh) 2015-11-27 2015-11-27 搜索引擎优化的评估方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510894504.7A CN106815277B (zh) 2015-11-27 2015-11-27 搜索引擎优化的评估方法及装置

Publications (2)

Publication Number Publication Date
CN106815277A CN106815277A (zh) 2017-06-09
CN106815277B true CN106815277B (zh) 2020-03-03

Family

ID=59106006

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510894504.7A Active CN106815277B (zh) 2015-11-27 2015-11-27 搜索引擎优化的评估方法及装置

Country Status (1)

Country Link
CN (1) CN106815277B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108256112B (zh) * 2018-02-09 2021-01-01 浙江省测绘科学技术研究院 基于地理语义的地名地址检索质量评价方法
CN109582751B (zh) * 2018-11-29 2021-01-01 百度在线网络技术(北京)有限公司 一种检索效果的度量方法及服务器
CN113238920A (zh) * 2021-05-14 2021-08-10 杭州志卓科技股份有限公司 一种搜索引擎优化结果量化评估的数据分析系统及方法
CN114625950A (zh) * 2022-03-18 2022-06-14 北京字节跳动网络技术有限公司 网站搜索引擎优化处理方法、装置、电子设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6470330B1 (en) * 1998-11-05 2002-10-22 Sybase, Inc. Database system with methods for estimation and usage of index page cluster ratio (IPCR) and data page cluster ratio (DPCR)
CN102999549A (zh) * 2012-09-25 2013-03-27 金博 一种实现网络爬虫任务的方法
CN103902725A (zh) * 2014-04-10 2014-07-02 百度在线网络技术(北京)有限公司 搜索引擎优化信息的获取方法和装置
US9026521B1 (en) * 2011-08-19 2015-05-05 Isaac S. Daniel System and method for conducting company searches and lead generation using company code index
CN104699830A (zh) * 2015-03-30 2015-06-10 北京奇虎科技有限公司 衡量搜索引擎排序算法有效性的方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8577911B1 (en) * 2010-03-23 2013-11-05 Google Inc. Presenting search term refinements

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6470330B1 (en) * 1998-11-05 2002-10-22 Sybase, Inc. Database system with methods for estimation and usage of index page cluster ratio (IPCR) and data page cluster ratio (DPCR)
US9026521B1 (en) * 2011-08-19 2015-05-05 Isaac S. Daniel System and method for conducting company searches and lead generation using company code index
CN102999549A (zh) * 2012-09-25 2013-03-27 金博 一种实现网络爬虫任务的方法
CN103902725A (zh) * 2014-04-10 2014-07-02 百度在线网络技术(北京)有限公司 搜索引擎优化信息的获取方法和装置
CN104699830A (zh) * 2015-03-30 2015-06-10 北京奇虎科技有限公司 衡量搜索引擎排序算法有效性的方法和装置

Also Published As

Publication number Publication date
CN106815277A (zh) 2017-06-09

Similar Documents

Publication Publication Date Title
CN107526807B (zh) 信息推荐方法及装置
US20190310988A1 (en) Systems and methods for identifying documents based on citation history
JP5575902B2 (ja) クエリのセマンティックパターンに基づく情報検索
WO2018028099A1 (zh) 搜索质量评估方法及装置
CN106815277B (zh) 搜索引擎优化的评估方法及装置
US20160277259A1 (en) Traffic quality analysis method and apparatus
IL234134A (en) Machine learning method of search query types
CN105183873A (zh) 恶意点击行为检测方法及装置
CN107844595B (zh) 一种求职网站职位智能推荐方法
CN104217031A (zh) 一种根据服务器搜索日志数据进行用户分类的方法和装置
CN106874335B (zh) 行为数据处理方法、装置及服务器
CN103530364A (zh) 提供下载链接的方法及系统
CN104391953B (zh) 检测网页更新的方法及装置
CN106021418A (zh) 新闻事件的聚类方法及装置
CN103617241A (zh) 搜索信息处理方法、浏览器终端与服务器
CN111506727A (zh) 文本内容类别获取方法、装置、计算机设备和存储介质
CN109033286B (zh) 数据统计方法和装置
CN104199945A (zh) 数据存储方法和装置
CN110689211A (zh) 网站服务能力的评估方法及装置
Zhou et al. On the reliability and intuitiveness of aggregated search metrics
CN103530390A (zh) 网页抓取的方法及设备
CN103605744A (zh) 网站搜索引擎流量数据的分析方法及装置
CN104951476B (zh) 确定网站内链接等级的方法及装置
CN103530392A (zh) 确定抓取流量的方法及设备
CN109064067B (zh) 基于互联网的金融风险运营主体判定方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Applicant after: Beijing Guoshuang Technology Co.,Ltd.

Address before: 100086 Cuigong Hotel, 76 Zhichun Road, Shuangyushu District, Haidian District, Beijing

Applicant before: Beijing Guoshuang Technology Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant