发明内容
本发明提供了一种网站分析方法及装置,以至少解决相关技术中只对搜索结果简单的爬取和展示所导致的问题。
根据本发明的一个方面,提供了一种网站分析方法,包括:爬取预先设定的一个或多个关键词在搜索引擎中的搜索结果,其中,所述搜索结果包括:自然排名搜索结果和竞价排名搜索结果;对预先设定的网站域名在所述搜索结果中出现的情况进行分析,并得到分析结果。
优选地,爬取所述一个或多个关键词在所述搜索引擎中的搜索结果包括:一次或多次爬取所述一个或多个关键词在所述搜索引擎中的搜索结果,其中,每次爬取预定数量的搜索结果。
优选地,在多次爬取所述搜索结果的情况下,每次爬取之间间隔预定时间。
优选地,在对所述网站域名在所述搜索结果中出现的情况进行分析并得到所述分析结果之后,所述方法还包括:根据所述分析结果提供建议,其中所述建议包括一下至少之一:所述关键词选取、所述关键词投放价格的合理性、竞争对手的排名情况。
优选地,所述分析结果包括以下至少之一:所述网站域名在所述搜索结果中出现的次数、所述网站域名在所述搜索结果中的排名。
根据本发明的另一个方面,还提供了一种网站分析的装置,包括:爬取模块,用于爬取预先设定的一个或多个关键词在搜索引擎中的搜索结果,其中,所述搜索结果包括:自然排名搜索结果和竞价排名搜索结果;分析模块,用于对预先设定的网站域名在所述搜索结果中出现的情况进行分析,并得到分析结果。
优选地,所述爬取模块,用于一次或多次爬取所述一个或多个关键词在所述搜索引擎中的搜索结果,其中,每次爬取预定数量的搜索结果。
优选地,所述爬取模块在多次爬取所述搜索结果的情况下,每次爬取之间间隔预定时间。
优选地,所述装置还包括:建议提供模块,用于根据所述分析结果提供建议,其中所述建议包括一下至少之一:所述关键词选取、所述关键词投放价格的合理性、竞争对手的排名情况。
优选地,所述分析结果包括以下至少之一:所述网站域名在所述搜索结果中出现的次数、所述网站域名在所述搜索结果中的排名。
通过本发明,采用了爬取预先设定的一个或多个关键词在搜索引擎中的搜索结果,其中,所述搜索结果包括:自然排名搜索结果和竞价排名搜索结果;对预先设定的网站域名在所述搜索结果中出现的情况进行分析,并得到分析结果的方式,解决了相关技术中只对搜索结果简单的爬取和展示所导致的问题,使得对关键词搜索结果的分析更合理。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本实施例提供了一种网站分析方法,图1是根据本发明实施例的网站分析方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,爬取预先设定的一个或多个关键词在搜索引擎中的搜索结果,其中,搜索结果包括:自然排名搜索结果和竞价排名搜索结果。
步骤S104,对预先设定的网站域名在搜索结果中出现的情况进行分析,并得到分析结果。
本实施例上述步骤,通过爬取预先设定的一个或多个关键词在搜索引擎中的自然排名搜索结果和竞价排名搜索结果的分析,从而实现了对自然排名和竞价排名结果的综合分析,进而得到分析结果。相对于相关技术中仅仅是对搜索结果进行简单的爬取和展示,或者对自然排名或者竞价排名单一种类的结果进行简单的分析的方式,本实施例提供的对自然排名和竞价排名结果综合分析并得到分析结果的方法,解决了相关技术中只进行简单的爬取和展示,或者只对单一种类的结果进行分析的方式的问题。
本实施例中,搜索结果包括:自然排名和竞价排名。作为一个优选实施方式,影响自然排名搜索结果有两大类:关键词匹配度和网站综合因素。例如,关键词匹配度可以包括:关键词的设置及分布、描述的设置,标题的设置等因素;网站综合因素可以包括:域名、空间、网站系统、网站内容质量、网站更新频率、链接等因素。而影响竞价排名的搜索结果是网站付费的高低。因此,对每一次的搜索结果进行自然排名和竞价排名可以对搜索结果进行一次综合的评估。
本实施例中,对搜索结果的爬取可以是通过网页的链接地址来找寻网页,从搜索结果中的每一个页面开始,提取搜索结果中的网页的内容,找到该网页所属于的网站的域名,然后再进行统计即可。
优选地,在步骤S102中,在爬取一个或多个关键词在搜索引擎中的结果中,每次爬取预定数量的搜索结果。例如,在搜索引擎中一般在某个页面中显示一定数量的搜索结果,例如,每页显示20个,可以根据实际的需要来设定每次爬取多少页的搜索结果。
优选地,在多次爬取搜索结果的情况下,每次爬取时间间隔预定时间,在爬取的次数小于预定次数时,在间隔预定时间之后继续进行爬取,直到爬取次数等于预定次数时,则停止爬取。
上述两个优选实施例中的每次爬取的个数、爬取的次数和/或每次爬取的时间间隔是可以预先设置的。
在上述步骤中涉及到了分析结果,在一个优选实施方式中,该分析结果包括可以以下至少之一:网站域名在搜索结果中出现的次数、所述网站域名在所述搜索结果中的排名。更优的,出现的次数可以包括在竞价排名搜索结果中出现的次数以及在自然排名搜索结果中出现的次数;该域名的具体排名也可以是在自然排名搜索结果中的排名以及在竞价排名结果中的排名。
提供的分析结果可以是将在竞价排名和自然排名中的出现次数和/或排名分别作为结果提供,也可以采用公式对竞价排名和自然排名中的结果进行计算之后提供一个结果作为分析的结果。例如,可以对竞价排名和自然排名中的出现的次数进行加权平均。在竞价排名中的出现次数是A1,在自然排名中出现的次数是A2,竞价排名的权值是B1,自然排名的权值是B2,其中B1和B2可以是整数,那么最终的分析结果中的出现次数可以是:(B1/(B1+B2))*A1+(B2/(B1+B2))*A2。对于排名的结果也可以采用这种方式计算。这其中的权值是可以预先设置的,用户可以根据实际的需要来设置该权值,从而更好的对搜索结果进行评估。通过上述分析结果,可以使得用户网站的分析在自然排名结果和竞价排名结果综合对比中更合理全面。
优选地,根据分析结果提供建议,其中,提供的建议可以包括以下至少之一:关键词选取、关键词投放价格的合理性、竞争对手的排名情况、网站情况以及投放力度。例如,关键词在自然排名中靠前,则没有必要加大投放此关键词的在竞价排名中的价钱;关键词没有在自然排名中出现,则需要根据关键词优化网站,从而提升网站的自然排名,还需要分析关键词在竞价排名的什么位置,比如百度竞价排名:在百度竞价排名的左侧还是右侧,根据排名的位置确定是否需提高关键词投放价钱;一个或多个关键词的搜索结果之下,给出竞争对手的自然排名结果和竞价排名结果;竞争对手竞价排名情况包含了根据付费的高低影响在搜索引擎投放的广告在搜索结果中的位置,还包含了在搜索引擎搜索结果显示的所有付费广告;例如:在百度的搜索结果页面,根据投放价格的高低,可以显示在左侧,也可以显示在右侧,可以以文字描述的形式显示(普通的竞价广告),也可以以图片和文字结合的形式显示(百度的品牌专区);在Google的搜索结果页的左侧广告,右侧广告,左侧广告有搜索结果上方的和下方的等;了解竞争对手搜索引擎广告的投放力度和情况,进行关注,也可以相应的调整策略,可以选择直接竞争,或者错开锋芒等。
对应于上述方法,本实施例中还提供了一种网站分析装置。
如图2所述,该装置包括爬取模块22,用于爬取预先设定的一个或多个关键词在搜索引擎中的搜索结果,其中,所述搜索结果包括:自然排名搜索结果和竞价排名搜索结果;分析模块24,用于对预先设定的网站域名在所述搜索结果中出现的情况进行分析,并得到分析结果。
本实施例上述装置,通过爬取预先设定的一个或多个关键词在搜索引擎中的自然排名搜索结果和竞价排名搜索结果的分析,从而实现了对自然排名和竞价排名结果的综合分析,进而得到分析结果。相对于相关技术中仅仅是对搜索结果进行简单的爬取和展示,或者对自然排名或者竞价排名单一种类的结果进行简单的分析的方式,本实施例提供的对自然排名和竞价排名结果综合分析并得到分析结果的方法,解决了相关技术中只进行简单的爬取和展示,或者只对单一种类的结果进行分析的方式的问题。
本实施例中,搜索结果包括:自然排名和竞价排名。作为一个优选实施方式,影响自然排名搜索结果有两大类:关键词匹配度和网站综合因素。例如,关键词匹配度可以包括:关键词的设置及分布、描述的设置,标题的设置等因素;网站综合因素可以包括:域名、空间、网站系统、网站内容质量、网站更新频率、链接等因素。而影响竞价排名的搜索结果是网站付费的高低。因此,对每一次的搜索结果进行自然排名和竞价排名可以对搜索结果进行一次综合的评估。
本实施例中,对搜索结果的爬取可以是通过网页的链接地址来找寻网页,从搜索结果中的每一个页面开始,提取搜索结果中的网页的内容,找到该网页所属于的网站的域名,然后再进行统计即可。
优选地,爬取模块22在爬取一个或多个关键词在搜索引擎中的结果中,每次爬取预定数量的搜索结果。例如,在搜索引擎中一般在某个页面中显示一定数量的搜索结果,例如,每页显示20个,可以根据实际的需要来设定每次爬取多少页的搜索结果。
优选地,爬取模块22在多次爬取搜索结果的情况下,每次爬取之间间隔预定时间,在爬取的次数小于预定数量时,在间隔预定时间之后继续进行爬取,直到爬取次数等于预定数量时,则停止爬取。
上述模块中涉及到了分析结果,在一个优选实施例中,该分析的结果包括可以以下至少之一:网站域名在搜索结果中出现的次数、所述网站域名在所述搜索结果中的排名。更优的,出现的次数可以包括在竞价排名搜索结果中出现的次数以及在自然排名搜索结果中出现的次数;该域名的具体排名也可以是在自然排名搜索结果中的排名以及在竞价排名结果中的排名。
图3是本实施例的网站分析装置的优选结构示意图,如图3所示,爬取模块22,用于爬取预先设定的一个或多个关键词在搜索引擎中的搜索结果,其中,所述搜索结果包括:自然排名搜索结果和竞价排名搜索结果;分析模块24,用于对预先设定的网站域名在所述搜索结果中出现的情况进行分析,并得到分析结果。上述装置还包括:建议提供模块26,用于根据分析结果提供建议,其中建议包括一下至少之一:所述关键词选取、所述关键词投放价格的合理性、竞争对手的排名情况;
其中,具体建议包括:关键词在自然排名中靠前,则没有必要加大投放此关键词的在竞价排名中的价钱;关键词没有在自然排名中出现,则需要优化关键词,提升自然排名,还需要分析关键词在竞价排名的什么位置,比如百度竞价排名:在百度竞价排名的左侧还是右侧,根据排名的位置确定是否需提高关键词投放价钱;同一或多个关键词的搜索结果之下,给出竞争对手的自然排名结果和竞价排名结果。通过上述分析结果,可以使得用户网站的分析在自然排名结果和竞价排名结果中更合理全面。
以下结合优选实施例进行说明,下述优选实施例结合了上述实施例及其优选实施方式。
在下述优选实施例中,提供了一种网站分析方法及其装置。通过网站的分析,爬取预先设定的一个或多个关键词在搜索引擎中的搜索结果,其中,所述搜索结果包括:自然排名搜索结果和竞价排名搜索结果;对预先设定的网站域名在所述搜索结果中出现的情况进行分析,并得到分析结果。解决了现有技术中仅仅是对搜索结果进行简单的爬取和展示,或者对自然排名或者竞价排名单一种类的结果,进行简单分析的问题。
图4是根据本发明优选实施例的网站分析方法的流程图。如图4所示,该方法包括如下步骤:
步骤S302:提供一个或多个关键词、设置预定的爬取次数n、爬取时间间隔t、以及指定网站域名以及预定分析搜索结果页p。
步骤S304:每隔预定时间间隔t爬取关键词在搜索引擎中的搜索结果;
步骤S306:将爬取次数进行累加,判断爬取次数是否等于预定爬取次数n;
其中,当爬取次数不等于预定爬取次数n时,执行步骤S308;当爬取次数等于预定爬取次数n时,执行步骤S310。
步骤S308:继续爬取分析搜索结果页p,获取一个或多个关键词的自然排名和竞价排名结果。
其中,执行完步骤S308之后继续执行步骤S306。
步骤S310:对指定网站域名在搜索结果中出现的情况进行分析并得到分析结果。
步骤S312:根据分析结果,提供建议。
从以上的描述中,可以看出通过网站的分析,爬取预先设定的一个或多个关键词在搜索引擎中的搜索结果,其中,所述搜索结果包括:自然排名搜索结果和竞价排名搜索结果;对预先设定的网站域名在所述搜索结果中出现的情况进行分析,并得到分析结果。解决了现有技术中仅仅是对搜索结果进行简单的爬取和展示,或者对自然排名或者竞价排名单一种类的结果,进行简单的分析的问题。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。