CN103744941A - 一种基于网站属性信息确定网站评测结果的方法和装置 - Google Patents

一种基于网站属性信息确定网站评测结果的方法和装置 Download PDF

Info

Publication number
CN103744941A
CN103744941A CN201310753186.3A CN201310753186A CN103744941A CN 103744941 A CN103744941 A CN 103744941A CN 201310753186 A CN201310753186 A CN 201310753186A CN 103744941 A CN103744941 A CN 103744941A
Authority
CN
China
Prior art keywords
website
targeted
targeted website
evaluation result
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310753186.3A
Other languages
English (en)
Inventor
李化东
朱亮
郝超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201310753186.3A priority Critical patent/CN103744941A/zh
Publication of CN103744941A publication Critical patent/CN103744941A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明的目的是提供一种基于网站属性信息确定网站评测结果的方法与装置;通过对目标网站的站点分析,获取所述目标网站的网站相关信息;根据所述网站相关信息,并结合预定属性阈值,确定所述目标网站的网站属性信息;根据对所述网站属性信息的站点评估,确定所述目标网站的网站评测结果。与现有技术相比,本发明提高了网站评测的准确率与效率,提升了用户的使用体验,进一步地,本发明基于网站评测结果,为站长提供网站优化建议,从而提升目标网站的总体网站质量。在搜索结果页上显示网站评测结果的方式也更多地吸引搜索用户的点击,提升其使用体验,并且,有利于站长不断提升自己网站的质量。

Description

一种基于网站属性信息确定网站评测结果的方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种用于基于网站属性信息确定网站评测结果的技术。
背景技术
目前,现有的对网站的评测主要从网站的加载项的加载时长、是否压缩等方面进行性能上的评测,所考虑的因素不够全面,因此,对网站的评测结果准确率不够,并且,也缺乏对网站整体的评估。
因此,如何高效、准确地确定一个网站的评测结果,成为本领域技术人员亟需解决的问题之一。
发明内容
本发明的目的是提供一种基于网站属性信息确定网站评测结果的方法与装置。
根据本发明的一个方面,提供了一种用于基于网站属性信息确定网站评测结果的方法,其中,该方法包括以下步骤:
a通过对目标网站的站点分析,获取所述目标网站的网站相关信息;
b根据所述网站相关信息,并结合预定属性阈值,确定所述目标网站的网站属性信息;
c根据对所述网站属性信息的站点评估,确定所述目标网站的网站评测结果。
根据本发明的另一方面,还提供了一种用于基于网站属性信息确定网站评测结果的装置,其中,该装置包括:
获取装置,用于通过对目标网站的站点分析,获取所述目标网站的网站相关信息;
属性确定装置,用于根据所述网站相关信息,并结合预定属性阈值,确定所述目标网站的网站属性信息;
评测装置,用于根据对所述网站属性信息的站点评估,确定所述目标网站的网站评测结果。
与现有技术相比,本发明通过对目标网站的站点分析,获取所述目标网站的网站相关信息,根据所述网站相关信息,并结合预定属性阈值,确定所述目标网站的网站属性信息,根据对所述网站属性信息的站点评估,确定所述目标网站的网站评测结果,提高了网站评测的准确率与效率,提升了用户的使用体验。
进一步地,本发明在搜索结果页上的创意中显示网站评测结果,告知搜索用户此网站的评测结果,即网站的质量,从而更多的吸引搜索用户的点击,提升搜索用户的使用体验,并且,有利于站长不断提升自己网站的质量。
进一步地,本发明基于网站评测结果,为站长提供网站优化建议,从而提升目标网站的总体网站质量,进一步提升目标网站整体的转化能力。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本发明一个方面的用于基于网站属性信息确定网站评测结果的装置示意图;
图2示出根据本发明一个优选实施例的用于基于网站属性信息确定网站评测结果的装置示意图;
图3示出根据本发明另一个方面的用于基于网站属性信息确定网站评测结果的方法流程图;
图4示出根据本发明一个优选实施例的用于基于网站属性信息确定网站评测结果的方法流程图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1示出根据本发明一个方面的用于基于网站属性信息确定网站评测结果的装置示意图。装置1包括获取装置101、属性确定装置102和评测装置103。
其中,获取装置101通过对目标网站的站点分析,获取所述目标网站的网站相关信息。具体地,获取装置101例如通过与站点库的交互,或者,通过其他约定的获取方式,获取了待处理的目标网站,进而,该获取装置101例如通过抓取网站js代码、网站连通测试、网站分析器等,或其他约定的分析方式,对该目标网站进行站点分析,获取该目标网站的网站相关信息。
在此,该站点库中存储了大量待处理的目标网站,其可以是目标网站对应的站长所上传的,也可以是网站爬取工具,如spider,定期或应事件触发,所爬取到的待处理的目标网站。该站点库既可以位于该装置1中,也可以位于与该装置1通过网络相连接的第三方设备中。
在此,目标网站的网站相关信息包括但不限于该目标网站在预定时间周期内的流量,该目标网站的网站连通速度、网站页面大小、网站死链情况,该目标网站的在线咨询窗口的数量、是否披露地址与联系方式、页面核心内容是否清晰明确,该目标网站安装的脚本工具,是否涉及虚假欺诈、挂马,是否ICP备案,是否涉及敏感业务,是否存在安全漏洞等相关信息。
例如,获取装置1通过与站点库的交互,获取了待处理的目标网站,进而,该获取装置101从该目标网站的自然搜索点击日志中获取该目标网站在预定时间周期内的自然搜索流量,或者,通过网站连通测试,抓取该目标网站所有页面的打开时间,进而算得平均值以作为该目标网站的平均加载时长。
本领域技术人员应能理解上述对目标网站进行站点分析的方式仅为举例,其他现有的或今后可能出现的对目标网站进行站点分析的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。本领域技术人员还应能理解上述目标网站的网站相关信息仅为举例,其他现有的或今后可能出现的目标网站的网站相关信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
属性确定装置102根据所述网站相关信息,并结合预定属性阈值,确定所述目标网站的网站属性信息。具体地,属性确定装置102根据获取装置101所获取的该目标网站的上述一个或多个网站相关信息,并结合预定属性阈值,确定该目标网站的诸如网站流量信息、网站连通性信息、网站内容信息、网站安全状态信息等网站属性信息。
例如,获取装置101从目标网站的自然搜索点击日志中获取该目标网站在预定时间周期内的,如每天的,自然搜索流量,从推广点击日志中获取该目标网站在预定时间周期内的,如每天的,推广流量。进而,该装置1例如利用核心词行业分类算法,将推广网站按行业进行分类,并算出每个行业的自然搜索流量和推广流量的平均值,进而算出每个行业流量的总值,并将该总值或平均值作为预定属性阈值。随后,该属性确定装置102将该目标网站的流量与该预定属性阈值进行比较,例如,分别将该目标网站的全部流量、自然搜索流量、推广流量与该行业的流量的平均值进行比较,评测出该目标网站全部流量、自然搜索流量、推广流量在行业中的位置,即,确定该目标网站的网站属性信息,如网站流量信息。或者,该属性确定装置102根据该目标网站的流量行业占比的升高或降低,确定该目标网站的网站流量信息,如,计算该目标网站的流量占全行业流量总和的比值,如果占比上升或下降,证明该目标网站在行业内的流量份额上升或下降,是宏观角度评测网站流量的指标。
在此,核心词行业分类算法例如通过机器抓取目标网站全部页面的meta标签里的title、keywords、description以及网页内容,将抽出去的所有词按照所占权重和出现频率交叉后进行排序,并对照每个词在行业表中对应的行业,算出权重最大的行业作为客户网站所在的行业。
又如,获取装置101抓取该目标网站所有页面的打开时间,计算平均值以作为该目标网站的平均加载时长,例如,首页实测加载时长可以通过在各地IDC机房中的真实电脑实时测试,以获得最真实的加载时间。
获取装置101抓取该目标网站所有页面得到页面大小并取平均值,得到该目标网站页面的平均大小,以供后续装置判断该目标网站的抵达页面大小是否正常。
获取装置101还通过访问该目标网站的每一个链接,以判断该目标网站的抵达链接是否存在死链,如果存在链接无法访问的情况,则将该链接记录为死链,以为该目标网站的站长发现该目标网站存在的死链。
随后,属性确定装置102根据上述获取装置101所确定的网站连通速度、网站页面大小和网站死链情况等网站相关信息,以确定该目标网站的网站连通性信息。
再如,获取装置101通过抓取该目标网站的js代码,以识别该目标网站安装的在线咨询工具,以及该在线咨询工具的各窗口类型和数量,或者,识别该目标网站安装的网站分析工具、分享工具、个性化推荐工具等。
该获取装置101还可以通过预定平台获取该目标网站的地址和联系方式。
该获取装置101还可以通过获取该目标网站的首页的标题、meta信息,如网站首页的meta_kw(关键词)信息、meta_desc(摘要描述)信息、网站是否有导航信息、导航条,网站页面文字按字节计算的平均大小等。
随后,属性确定装置102根据上述获取装置101所确定的在线咨询窗口的数量情况、地址与联系方式、页面核心内容及网站安装的脚本工具等网站相关信息,确定该目标网站的网站内容信息。
再如,属性确定装置102根据该目标网站的虚假欺诈信息,如历史虚假欺诈信息、挂马信息、ICP备案信息、敏感业务信息、安全漏洞等网站相关信息,确定该目标网站的网站安全状态信息。
在此,所述网站属性信息包括以下至少任一项:
-网站流量信息;
-网站连通性信息;
-网站内容信息;
-网站安全状态信息。
本领域技术人员应能理解上述对确定网站属性信息的方式仅为举例,其他现有的或今后可能出现的确定网站属性信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。本领域技术人员还应能理解上述网站属性信息仅为举例,其他现有的或今后可能出现的网站属性信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
评测装置103根据对所述网站属性信息的站点评估,确定所述目标网站的网站评测结果。具体地,评测装置103根据属性确定装置102所确定的该目标网站的网站属性信息,通过对该目标网站的网站属性信息的站点评估,确定该目标网站的网站评测结果。例如,当属性确定装置102确定该目标网站的自然搜索流量低于预定属性阈值,如低于行业自然搜索的平均流量,则评测装置103将该目标网站评测为质量差。
又如,当属性确定装置102确定该目标网站的网站内容信息,如该目标网站的在线咨询窗口多于预定阈值,即,该目标网站未合理使用在线咨询,则该评测装置103评测该目标网站的网站内容质量较差,即,将该目标网站评测为质量差。
或进一步地,该评测装置103对该网站属性信息的站点评估采用打分值或扣分制,并基于目标网站的最终得分,确定该目标网站的网站评测结果。例如,当该目标网站的在线咨询窗口数量大于预定阈值,该目标网站未披露地址和联系方式等,对该目标网站扣去相应的分数。
较佳地,该评测装置103综合考虑目标网站的上述网站流量信息、网站连通性信息、网站内容信息、网站安全状态信息中的至少一个,确定所述目标网站的网站评测结果。
本领域技术人员应能理解上述确定目标网站的网站评测结果的方式仅为举例,其他现有的或今后可能出现的确定目标网站的网站评测结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,装置1的各个装置之间是持续不断工作的。具体地,获取装置101通过对目标网站的站点分析,获取所述目标网站的网站相关信息;属性确定装置102根据所述网站相关信息,并结合预定属性阈值,确定所述目标网站的网站属性信息;评测装置103根据对所述网站属性信息的站点评估,确定所述目标网站的网站评测结果。在此,本领域技术人员应理解“持续”是指装置1的各装置分别按照设定的或实时调整的工作模式要求,对目标网站进行站点分析、确定其网站属性信息及确定网站评测结果。
在此,装置1通过对目标网站的站点分析,获取所述目标网站的网站相关信息,根据所述网站相关信息,并结合预定属性阈值,确定所述目标网站的网站属性信息,根据对所述网站属性信息的站点评估,确定所述目标网站的网站评测结果,提高了网站评测的准确率与效率,提升了用户的使用体验。
优选地,该装置1还包括排序装置(未示出)和提供装置(未示出)。其中,该排序装置当搜索用户的搜索结果包括所述目标网站,结合所述网站评测结果,确定所述目标网站在所述搜索结果中的排序位置;提供装置根据所述排序位置,将所述目标网站提供给所述搜索用户。
具体地,当搜索用户的搜索结果包括该目标网站,则该排序装置结合该目标网站的网站评测结果,及这些搜索结果对应的排序值,确定该目标网站在搜索结果中的排序位置。例如,当采用打分制时,根据该目标网站的得分,即,该目标网站的网站评测结果,及该搜索结果中其他网站对应的得分,按照得分倒序排列的方式,确定该目标网站在该搜索结果中的排序位置。
随后,提供装置根据该搜索结果的排序位置,例如通过调用诸如JSP、ASP或PHP等动态页面技术,或者其他约定的呈现方式,将该搜索结果提供给该搜索用户,其中,该目标网站在该搜索结果中。
更优选地,提供装置根据所述排序位置,将所述网站评测结果与所述目标网站一起提供给所述搜索用户。具体地,提供装置根据该排序装置所确定搜索结果的排序,通过调用诸如JSP、ASP或PHP等动态页面技术,或者其他约定的呈现方式,将该网站评测结果与目标网站,一起提供给该搜索用户,如将该网站评测结果,以图标、高亮等形式,或其他约定的显示方式,提供给搜索用户。例如,当采用打分制时,该提供装置将该目标网站所获得的打分值,与该目标网站一起提供给该搜索用户。
进一步地,装置1在搜索结果页上的创意中显示网站评测结果,告知搜索用户此网站的评测结果,即网站的质量,从而更多的吸引搜索用户的点击,提升搜索用户的使用体验,并且,有利于站长不断提升自己网站的质量。
图2示出根据本发明一个优选实施例的用于基于网站属性信息确定网站评测结果的装置示意图。该装置1还包括优化确定装置204和优化处理装置205。以下参照图2对该优选实施例进行详细描述:具体地,获取装置201通过对目标网站的站点分析,获取所述目标网站的网站相关信息;属性确定装置202根据所述网站相关信息,并结合预定属性阈值,确定所述目标网站的网站属性信息;评测装置203根据对所述网站属性信息的站点评估,确定所述目标网站的网站评测结果;优化确定装置204根据所述网站评测结果,并结合所述网站相关信息,为所述目标网站确定网站优化建议;优化处理装置205根据所述网站优化建议,对所述目标网站进行优化处理。其中,获取装置201、属性确定装置202和评测装置203与图1所示对应装置相同或基本相同,故此处不再赘述,并通过引用的方式包含于此。
其中,优化确定装置204根据所述网站评测结果,并结合所述网站相关信息,为所述目标网站确定网站优化建议。具体地,优化确定装置204根据评测装置203所获得的网站评测结果,并结合该网站相关信息,为该目标网站确定网站优化建议。
例如,评测装置203评测该目标网站的质量差,该目标网站的在线咨询窗口数量大于预定阈值,则优化确定装置204根据该网站评测结果,再结合该目标网站的在线咨询窗口数量这一网站相关信息,为该目标网站确定减少在线咨询窗口数量的网站优化建议,或较佳地,为该目标网站确定减少在线咨询窗口数量以小于等于预定阈值的网站优化建议。
优化处理装置205根据所述网站优化建议,对所述目标网站进行优化处理。具体地,优化处理装置205根据优化确定装置204所确定的网站优化建议,对该目标网站进行与该网站优化建议相对应的优化处理。接上例,优化确定装置204建议目标网站减少在线咨询窗口数量以小于等于预定阈值,则该优化处理装置205通过对该目标网站的优化处理,减少该目标网站的在线咨询窗口数量,以使该数量小于等于预定阈值。
进一步地,本发明基于网站评测结果,确定网站优化建议并自动对该目标网站进行优化处理,从而提升该目标网站的总体网站质量,进一步提升目标网站整体的转化能力。
优选地,优化处理装置205将所述网站优化建议提供给所述目标网站对应的站长,以供所述站长对所述目标网站进行优化处理。具体地,优化处理装置205将该优化确定装置204所确定的网站优化建议,通过调用诸如JSP、ASP或PHP等动态页面技术,或通过其他约定的通信方式,提供给该目标网站对应的站长,以供该站长对该目标网站进行优化处理。
例如,优化确定装置204为该目标网站确定减少在线咨询窗口数量以小于等于预定阈值的网站优化建议,则该优化处理装置205通过调用诸如JSP、ASP或PHP等动态页面技术,将该优化建议提供给该目标网站对应的站长,站长在获取该优化建议后,即对该目标网站进行优化处理,减少该目标网站的在线咨询窗口数量,以使该数量小于等于预定阈值。
又如,该装置1还可以扫描该目标网站的页面中的所有图片,通过图像处理技术,在不影响质量的情况下将每张图片的大小压缩,并将所有优化后的图片生成压缩包,以供站长下载并替换原图。
较佳地,装置1还可将该目标网站的网站评测结果与网站优化建议一起提供给该目标网站的站长,或更进一步地,当以打分制来确定该目标网站的网站评测结果时,该装置1将该目标网站的网站相关信息的各项得分或扣分情况及原因,与对应的网站优化建议,一起提供给该目标网站对应的站长。
进一步地,装置1基于网站评测结果,为站长提供网站优化建议,从而提升目标网站的总体网站质量,进一步提升目标网站整体的转化能力。
图3示出根据本发明另一个方面的用于基于网站属性信息确定网站评测结果的方法流程图。
在步骤S301中,装置1通过对目标网站的站点分析,获取所述目标网站的网站相关信息。具体地,在步骤S301中,装置1例如通过与站点库的交互,或者,通过其他约定的获取方式,获取了待处理的目标网站,进而,装置1例如通过抓取网站js代码、网站连通测试、网站分析器等,或其他约定的分析方式,对该目标网站进行站点分析,获取该目标网站的网站相关信息。
在此,该站点库中存储了大量待处理的目标网站,其可以是目标网站对应的站长所上传的,也可以是网站爬取工具,如spider,定期或应事件触发,所爬取到的待处理的目标网站。该站点库既可以位于该装置1中,也可以位于与该装置1通过网络相连接的第三方设备中。
在此,目标网站的网站相关信息包括但不限于该目标网站在预定时间周期内的流量,该目标网站的网站连通速度、网站页面大小、网站死链情况,该目标网站的在线咨询窗口的数量、是否披露地址与联系方式、页面核心内容是否清晰明确,该目标网站安装的脚本工具,是否涉及虚假欺诈、挂马,是否ICP备案,是否涉及敏感业务,是否存在安全漏洞等相关信息。
例如,在步骤S301中,装置1通过与站点库的交互,获取了待处理的目标网站,进而,装置1从该目标网站的自然搜索点击日志中获取该目标网站在预定时间周期内的自然搜索流量,或者,通过网站连通测试,抓取该目标网站所有页面的打开时间,进而算得平均值以作为该目标网站的平均加载时长。
本领域技术人员应能理解上述对目标网站进行站点分析的方式仅为举例,其他现有的或今后可能出现的对目标网站进行站点分析的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。本领域技术人员还应能理解上述目标网站的网站相关信息仅为举例,其他现有的或今后可能出现的目标网站的网站相关信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在步骤S302中,装置1根据所述网站相关信息,并结合预定属性阈值,确定所述目标网站的网站属性信息。具体地,在步骤S302中,装置1根据在步骤S301中所获取的该目标网站的上述一个或多个网站相关信息,并结合预定属性阈值,确定该目标网站的诸如网站流量信息、网站连通性信息、网站内容信息、网站安全状态信息等网站属性信息。
例如,在步骤S301中,装置1从目标网站的自然搜索点击日志中获取该目标网站在预定时间周期内的,如每天的,自然搜索流量,从推广点击日志中获取该目标网站在预定时间周期内的,如每天的,推广流量。进而,该装置1例如利用核心词行业分类算法,将推广网站按行业进行分类,并算出每个行业的自然搜索流量和推广流量的平均值,进而算出每个行业流量的总值,并将该总值或平均值作为预定属性阈值。随后,在步骤S302中,装置1将该目标网站的流量与该预定属性阈值进行比较,例如,分别将该目标网站的全部流量、自然搜索流量、推广流量与该行业的流量的平均值进行比较,评测出该目标网站全部流量、自然搜索流量、推广流量在行业中的位置,即,确定该目标网站的网站属性信息,如网站流量信息。或者,在步骤S302中,装置1根据该目标网站的流量行业占比的升高或降低,确定该目标网站的网站流量信息,如,计算该目标网站的流量占全行业流量总和的比值,如果占比上升或下降,证明该目标网站在行业内的流量份额上升或下降,是宏观角度评测网站流量的指标。
在此,核心词行业分类算法例如通过机器抓取目标网站全部页面的meta标签里的title、keywords、description以及网页内容,将抽出去的所有词按照所占权重和出现频率交叉后进行排序,并对照每个词在行业表中对应的行业,算出权重最大的行业作为客户网站所在的行业。
又如,在步骤S301中,装置1抓取该目标网站所有页面的打开时间,计算平均值以作为该目标网站的平均加载时长,例如,首页实测加载时长可以通过在各地IDC机房中的真实电脑实时测试,以获得最真实的加载时间。
在步骤S301中,装置1抓取该目标网站所有页面得到页面大小并取平均值,得到该目标网站页面的平均大小,以供后续步骤判断该目标网站的抵达页面大小是否正常。
在步骤S301中,装置1还通过访问该目标网站的每一个链接,以判断该目标网站的抵达链接是否存在死链,如果存在链接无法访问的情况,则将该链接记录为死链,以为该目标网站的站长发现该目标网站存在的死链。
随后,在步骤S302中,装置1根据在步骤S301中所确定的网站连通速度、网站页面大小和网站死链情况等网站相关信息,以确定该目标网站的网站连通性信息。
再如,在步骤S301中,装置1通过抓取该目标网站的js代码,以识别该目标网站安装的在线咨询工具,以及该在线咨询工具的各窗口类型和数量,或者,识别该目标网站安装的网站分析工具、分享工具、个性化推荐工具等。
在步骤S301中,装置1还可以通过预定平台获取该目标网站的地址和联系方式。
在步骤S301中,装置1还可以通过获取该目标网站的首页的标题、meta信息,如网站首页的meta_kw(关键词)信息、meta_desc(摘要描述)信息、网站是否有导航信息、导航条,网站页面文字按字节计算的平均大小等。
随后,在步骤S302中,装置1根据在步骤S301中所确定的在线咨询窗口的数量情况、地址与联系方式、页面核心内容及网站安装的脚本工具等网站相关信息,确定该目标网站的网站内容信息。
再如,在步骤S302中,装置1根据该目标网站的虚假欺诈信息,如历史虚假欺诈信息、挂马信息、ICP备案信息、敏感业务信息、安全漏洞等网站相关信息,确定该目标网站的网站安全状态信息。
在此,所述网站属性信息包括以下至少任一项:
-网站流量信息;
-网站连通性信息;
-网站内容信息;
-网站安全状态信息。
本领域技术人员应能理解上述对确定网站属性信息的方式仅为举例,其他现有的或今后可能出现的确定网站属性信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。本领域技术人员还应能理解上述网站属性信息仅为举例,其他现有的或今后可能出现的网站属性信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在步骤S303中,装置1根据对所述网站属性信息的站点评估,确定所述目标网站的网站评测结果。具体地,在步骤S303中,装置1根据在步骤S302中所确定的该目标网站的网站属性信息,通过对该目标网站的网站属性信息的站点评估,确定该目标网站的网站评测结果。例如,当在步骤S302中,装置1确定该目标网站的自然搜索流量低于预定属性阈值,如低于行业自然搜索的平均流量,则在步骤S303中,装置1将该目标网站评测为质量差。
又如,当在步骤S302中,装置1确定该目标网站的网站内容信息,如该目标网站的在线咨询窗口多于预定阈值,即,该目标网站未合理使用在线咨询,则在步骤S303中,装置1评测该目标网站的网站内容质量较差,即,将该目标网站评测为质量差。
或进一步地,在步骤S303中,装置1对该网站属性信息的站点评估采用打分值或扣分制,并基于目标网站的最终得分,确定该目标网站的网站评测结果。例如,当该目标网站的在线咨询窗口数量大于预定阈值,该目标网站未披露地址和联系方式等,对该目标网站扣去相应的分数。
较佳地,在步骤S303中,装置1综合考虑目标网站的上述网站流量信息、网站连通性信息、网站内容信息、网站安全状态信息中的至少一个,确定所述目标网站的网站评测结果。
本领域技术人员应能理解上述确定目标网站的网站评测结果的方式仅为举例,其他现有的或今后可能出现的确定目标网站的网站评测结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,装置1的各个步骤之间是持续不断工作的。具体地,在步骤S301中,装置1通过对目标网站的站点分析,获取所述目标网站的网站相关信息;在步骤S302中,装置1根据所述网站相关信息,并结合预定属性阈值,确定所述目标网站的网站属性信息;在步骤S303中,装置1根据对所述网站属性信息的站点评估,确定所述目标网站的网站评测结果。在此,本领域技术人员应理解“持续”是指装置1的各步骤分别按照设定的或实时调整的工作模式要求,对目标网站进行站点分析、确定其网站属性信息及确定网站评测结果。
在此,装置1通过对目标网站的站点分析,获取所述目标网站的网站相关信息,根据所述网站相关信息,并结合预定属性阈值,确定所述目标网站的网站属性信息,根据对所述网站属性信息的站点评估,确定所述目标网站的网站评测结果,提高了网站评测的准确率与效率,提升了用户的使用体验。
优选地,该方法还包括步骤S306(未示出)和步骤S307(未示出)。其中,在步骤S306中,装置1当搜索用户的搜索结果包括所述目标网站,结合所述网站评测结果,确定所述目标网站在所述搜索结果中的排序位置;在步骤S307中,装置1根据所述排序位置,将所述目标网站提供给所述搜索用户。
具体地,当搜索用户的搜索结果包括该目标网站,则在步骤S306中,装置1结合该目标网站的网站评测结果,及这些搜索结果对应的排序值,确定该目标网站在搜索结果中的排序位置。例如,当采用打分制时,根据该目标网站的得分,即,该目标网站的网站评测结果,及该搜索结果中其他网站对应的得分,按照得分倒序排列的方式,确定该目标网站在该搜索结果中的排序位置。
随后,在步骤S307中,装置1根据该搜索结果的排序位置,例如通过调用诸如JSP、ASP或PHP等动态页面技术,或者其他约定的呈现方式,将该搜索结果提供给该搜索用户,其中,该目标网站在该搜索结果中。
更优选地,在步骤S307中,装置1根据所述排序位置,将所述网站评测结果与所述目标网站一起提供给所述搜索用户。具体地,在步骤S307中,装置1根据在步骤S306中所确定的搜索结果的排序,通过调用诸如JSP、ASP或PHP等动态页面技术,或者其他约定的呈现方式,将该网站评测结果与目标网站,一起提供给该搜索用户,如将该网站评测结果,以图标、高亮等形式,或其他约定的显示方式,提供给搜索用户。例如,当采用打分制时,在步骤S307中,装置1将该目标网站所获得的打分值,与该目标网站一起提供给该搜索用户。
进一步地,装置1在搜索结果页上的创意中显示网站评测结果,告知搜索用户此网站的评测结果,即网站的质量,从而更多的吸引搜索用户的点击,提升搜索用户的使用体验,并且,有利于站长不断提升自己网站的质量。
图4示出根据本发明一个优选实施例的用于基于网站属性信息确定网站评测结果的方法流程图。以下参照图4对该优选实施例进行详细描述:具体地,在步骤S401中,装置1通过对目标网站的站点分析,获取所述目标网站的网站相关信息;在步骤S402中,装置1根据所述网站相关信息,并结合预定属性阈值,确定所述目标网站的网站属性信息;在步骤S403中,装置1根据对所述网站属性信息的站点评估,确定所述目标网站的网站评测结果;在步骤S404中,装置1根据所述网站评测结果,并结合所述网站相关信息,为所述目标网站确定网站优化建议;在步骤S405中,装置1根据所述网站优化建议,对所述目标网站进行优化处理。其中,步骤S401-S403与图3所示对应步骤相同或基本相同,故此处不再赘述,并通过引用的方式包含于此。
其中,在步骤S404中,装置1根据所述网站评测结果,并结合所述网站相关信息,为所述目标网站确定网站优化建议。具体地,在步骤S404中,装置1根据在步骤S403中所获得的网站评测结果,并结合该网站相关信息,为该目标网站确定网站优化建议。
例如,在步骤S403中,装置1评测该目标网站的质量差,该目标网站的在线咨询窗口数量大于预定阈值,则在步骤S404中,装置1根据该网站评测结果,再结合该目标网站的在线咨询窗口数量这一网站相关信息,为该目标网站确定减少在线咨询窗口数量的网站优化建议,或较佳地,为该目标网站确定减少在线咨询窗口数量以小于等于预定阈值的网站优化建议。
在步骤S405中,装置1根据所述网站优化建议,对所述目标网站进行优化处理。具体地,在步骤S405中,装置1根据在步骤S404中所确定的网站优化建议,对该目标网站进行与该网站优化建议相对应的优化处理。接上例,在步骤S404中,装置1建议目标网站减少在线咨询窗口数量以小于等于预定阈值,则在步骤S405中,装置1通过对该目标网站的优化处理,减少该目标网站的在线咨询窗口数量,以使该数量小于等于预定阈值。
进一步地,本发明基于网站评测结果,确定网站优化建议并自动对该目标网站进行优化处理,从而提升该目标网站的总体网站质量,进一步提升目标网站整体的转化能力。
优选地,在步骤S405中,装置1将所述网站优化建议提供给所述目标网站对应的站长,以供所述站长对所述目标网站进行优化处理。具体地,在步骤S405中,装置1将在步骤S404中所确定的网站优化建议,通过调用诸如JSP、ASP或PHP等动态页面技术,或通过其他约定的通信方式,提供给该目标网站对应的站长,以供该站长对该目标网站进行优化处理。
例如,在步骤S404中,装置1为该目标网站确定减少在线咨询窗口数量以小于等于预定阈值的网站优化建议,则在步骤S405中,装置1通过调用诸如JSP、ASP或PHP等动态页面技术,将该优化建议提供给该目标网站对应的站长,站长在获取该优化建议后,即对该目标网站进行优化处理,减少该目标网站的在线咨询窗口数量,以使该数量小于等于预定阈值。
又如,该装置1还可以扫描该目标网站的页面中的所有图片,通过图像处理技术,在不影响质量的情况下将每张图片的大小压缩,并将所有优化后的图片生成压缩包,以供站长下载并替换原图。
较佳地,装置1还可将该目标网站的网站评测结果与网站优化建议一起提供给该目标网站的站长,或更进一步地,当以打分制来确定该目标网站的网站评测结果时,该装置1将该目标网站的网站相关信息的各项得分或扣分情况及原因,与对应的网站优化建议,一起提供给该目标网站对应的站长。
进一步地,装置1基于网站评测结果,为站长提供网站优化建议,从而提升目标网站的总体网站质量,进一步提升目标网站整体的转化能力。
需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
另外,本发明的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本发明的方法和/或技术方案。而调用本发明的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此,根据本发明的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本发明的多个实施例的方法和/或技术方案。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (12)

1.一种用于基于网站属性信息确定网站评测结果的方法,其中,该方法包括以下步骤:
a通过对目标网站的站点分析,获取所述目标网站的网站相关信息;
b根据所述网站相关信息,并结合预定属性阈值,确定所述目标网站的网站属性信息;
c根据对所述网站属性信息的站点评估,确定所述目标网站的网站评测结果。
2.根据权利要求1所述的方法,其中,该方法还包括:
-当搜索用户的搜索结果包括所述目标网站,结合所述网站评测结果,确定所述目标网站在所述搜索结果中的排序位置;
x根据所述排序位置,将所述目标网站提供给所述搜索用户。
3.根据权利要求2所述的方法,其中,所述步骤x包括:
-根据所述排序位置,将所述网站评测结果与所述目标网站一起提供给所述搜索用户。
4.根据权利要求1至3中任一项所述的方法,其中,该方法还包括:
-根据所述网站评测结果,并结合所述网站相关信息,为所述目标网站确定网站优化建议;
r根据所述网站优化建议,对所述目标网站进行优化处理。
5.根据权利要求4所述的方法,其中,所述步骤r包括:
-将所述网站优化建议提供给所述目标网站对应的站长,以供所述站长对所述目标网站进行优化处理。
6.根据权利要求1至5中任一项所述的方法,其中,所述网站属性信息包括以下至少任一项:
-网站流量信息;
-网站连通性信息;
-网站内容信息;
-网站安全状态信息。
7.一种用于基于网站属性信息确定网站评测结果的装置,其中,该装置包括:
获取装置,用于通过对目标网站的站点分析,获取所述目标网站的网站相关信息;
属性确定装置,用于根据所述网站相关信息,并结合预定属性阈值,确定所述目标网站的网站属性信息;
评测装置,用于根据对所述网站属性信息的站点评估,确定所述目标网站的网站评测结果。
8.根据权利要求7所述的装置,其中,该装置还包括:
排序装置,用于当搜索用户的搜索结果包括所述目标网站,结合所述网站评测结果,确定所述目标网站在所述搜索结果中的排序位置;
提供装置,用于根据所述排序位置,将所述目标网站提供给所述搜索用户。
9.根据权利要求8所述的装置,其中,所述提供装置用于:
-根据所述排序位置,将所述网站评测结果与所述目标网站一起提供给所述搜索用户。
10.根据权利要求7至9中任一项所述的装置,其中,该装置还包括:
优化确定装置,用于根据所述网站评测结果,并结合所述网站相关信息,为所述目标网站确定网站优化建议;
优化处理装置,用于根据所述网站优化建议,对所述目标网站进行优化处理。
11.根据权利要求10所述的装置,其中,所述优化处理装置用于:
-将所述网站优化建议提供给所述目标网站对应的站长,以供所述站长对所述目标网站进行优化处理。
12.根据权利要求7至11中任一项所述的装置,其中,所述网站属性信息包括以下至少任一项:
-网站流量信息;
-网站连通性信息;
-网站内容信息;
-网站安全状态信息。
CN201310753186.3A 2013-12-31 2013-12-31 一种基于网站属性信息确定网站评测结果的方法和装置 Pending CN103744941A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310753186.3A CN103744941A (zh) 2013-12-31 2013-12-31 一种基于网站属性信息确定网站评测结果的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310753186.3A CN103744941A (zh) 2013-12-31 2013-12-31 一种基于网站属性信息确定网站评测结果的方法和装置

Publications (1)

Publication Number Publication Date
CN103744941A true CN103744941A (zh) 2014-04-23

Family

ID=50501959

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310753186.3A Pending CN103744941A (zh) 2013-12-31 2013-12-31 一种基于网站属性信息确定网站评测结果的方法和装置

Country Status (1)

Country Link
CN (1) CN103744941A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105049301A (zh) * 2015-08-31 2015-11-11 北京奇虎科技有限公司 一种提供网站综合评价服务的方法和装置
WO2017059778A1 (zh) * 2015-10-08 2017-04-13 阿里巴巴集团控股有限公司 检测空壳网站的方法、装置及系统
CN107679170A (zh) * 2017-09-29 2018-02-09 肖丽媛 一种基于用户行为分析的网站优化方法及系统
CN108090124A (zh) * 2017-11-13 2018-05-29 深圳市华阅文化传媒有限公司 阅读app对源网站进行排序的方法及装置
CN108170856A (zh) * 2018-01-20 2018-06-15 深圳市小满科技有限公司 信息显示方法及装置、计算机装置及存储介质
JP2019504411A (ja) * 2015-12-31 2019-02-14 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited データ処理方法及び装置
CN110287434A (zh) * 2019-07-02 2019-09-27 郑州悉知信息科技股份有限公司 网站处理方法、装置及存储介质

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105049301A (zh) * 2015-08-31 2015-11-11 北京奇虎科技有限公司 一种提供网站综合评价服务的方法和装置
WO2017059778A1 (zh) * 2015-10-08 2017-04-13 阿里巴巴集团控股有限公司 检测空壳网站的方法、装置及系统
CN106571971A (zh) * 2015-10-08 2017-04-19 阿里巴巴集团控股有限公司 检测空壳网站的方法、装置及系统
CN106571971B (zh) * 2015-10-08 2020-12-29 阿里巴巴集团控股有限公司 检测空壳网站的方法、装置及系统
JP2019504411A (ja) * 2015-12-31 2019-02-14 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited データ処理方法及び装置
CN107679170A (zh) * 2017-09-29 2018-02-09 肖丽媛 一种基于用户行为分析的网站优化方法及系统
CN108090124A (zh) * 2017-11-13 2018-05-29 深圳市华阅文化传媒有限公司 阅读app对源网站进行排序的方法及装置
CN108170856A (zh) * 2018-01-20 2018-06-15 深圳市小满科技有限公司 信息显示方法及装置、计算机装置及存储介质
CN110287434A (zh) * 2019-07-02 2019-09-27 郑州悉知信息科技股份有限公司 网站处理方法、装置及存储介质
CN110287434B (zh) * 2019-07-02 2022-02-25 郑州悉知信息科技股份有限公司 网站处理方法、装置及存储介质

Similar Documents

Publication Publication Date Title
CN103744941A (zh) 一种基于网站属性信息确定网站评测结果的方法和装置
CN110275958B (zh) 网站信息识别方法、装置和电子设备
US9661360B2 (en) Systems and methods for evaluating online videos
CN110442712B (zh) 风险的确定方法、装置、服务器和文本审理系统
CN109345417B (zh) 基于身份认证的业务人员的在线考核方法及终端设备
CN105989268A (zh) 一种人机识别的安全访问方法和系统
CN105868256A (zh) 处理用户行为数据的方法和系统
CN107729368A (zh) 一种用于poi数据校验的方法和装置
CN104133618B (zh) 进行终端设备推荐页面展示的方法及系统
CN107294919A (zh) 一种水平权限漏洞的检测方法及装置
CN103366121A (zh) 安全检测方法、装置和系统
CN107784205B (zh) 一种用户产品审核的方法、装置、服务器和存储介质
JP2014502753A (ja) ウェブページ情報の検出方法及びシステム
CN103631828A (zh) 确定访问路径的方法和装置、确定页面流失率的方法和系统
CN105718533A (zh) 信息推送方法和装置
CN103631787A (zh) 网页类型识别方法以及网页类型识别装置
CN110798445A (zh) 公共网关接口测试方法、装置、计算机设备及存储介质
CN107784551A (zh) 股票舆情数据处理方法、装置、计算机设备和存储介质
CN102982048A (zh) 一种用于评估垃圾信息挖掘规则的方法与设备
CN107766224B (zh) 测试方法和测试装置
CN112035205A (zh) 数据处理方法、装置、设备和存储介质
CN103577426A (zh) 用于提供搜索建议的附加应用信息的方法、装置与系统
CN114221988A (zh) 一种内容分发网络热点分析方法和系统
CN115314424B (zh) 一种快速检测网络信号方法及装置
CN110110197B (zh) 信息获取方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140423