CN113139146A - 网站质量评估方法、装置及计算设备 - Google Patents
网站质量评估方法、装置及计算设备 Download PDFInfo
- Publication number
- CN113139146A CN113139146A CN202010052880.2A CN202010052880A CN113139146A CN 113139146 A CN113139146 A CN 113139146A CN 202010052880 A CN202010052880 A CN 202010052880A CN 113139146 A CN113139146 A CN 113139146A
- Authority
- CN
- China
- Prior art keywords
- access data
- website
- data
- correlation result
- domain name
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明实施例涉及互联网技术领域,公开了一种网站质量评估方法、装置及计算设备,该方法包括:获取目标域名所在的网站中包含的所有域名;对第一域名进行域名解析,得到第一域名对应的第一访问数据;将各域名对应的第一访问数据组合,得到网站的第一访问数据;根据网站的第一访问数据获取城域网出口的第二访问数据以及骨干网出口的第三访问数据,第二访问数据和第三访问数据均与第一访问数据为同一种访问数据;确定网站的第一访问数据与第二访问数据的第一相关性结果,以及,第一访问数据与第三访问数据的第二相关性结果;根据第一相关性结果和第二相关性结果对网站质量进行评估。通过上述方式,本发明实施例实现了对网站质量的评估。
Description
技术领域
本发明实施例涉及互联网技术领域,具体涉及一种网站质量评估方法、装置及计算设备。
背景技术
目前家庭宽带用户通过各类浏览器访问各种网站,以获取访问信息。网站的访问质量直接影响用户的上网感知。
现有技术中通过运维人员对网站进行访问以分析网站的访问质量。当某个网站存在大量的二三级域名时,运维人员网站分析进度缓慢,从而使网站访问质量的分析成本较高。
发明内容
鉴于上述问题,本发明实施例提供了一种网站质量评估方法、装置及计算设备,用于解决现有技术中存在的人工分析成本高的问题。
根据本发明实施例的一个方面,提供了一种网站质量评估方法,所述方法包括:
获取目标域名所在的网站中包含的所有域名;
对第一域名进行域名解析,得到所述第一域名对应的第一访问数据,所述第一域名为所述目标域名所在的网站中包含的所有域名中任一个域名,所述第一访问数据为所述第一域名的所有的访问数据中任一种访问数据;
将各域名对应的第一访问数据组合,得到所述网站的第一访问数据;
根据所述网站的第一访问数据获取城域网出口的第二访问数据以及骨干网出口的第三访问数据,所述第二访问数据和所述第三访问数据均与所述第一访问数据为同一种访问数据;
确定所述网站的第一访问数据与所述第二访问数据的第一相关性结果,以及,所述第一访问数据与所述第三访问数据的第二相关性结果;
根据所述第一相关性结果和所述第二相关性结果对所述网站质量进行评估。
可选的,所述根据所述网站的第一访问数据获取城域网出口的第二访问数据以及骨干网出口的第三访问数据,包括:
确定所述网站的第一访问数据对应的访问时间;
获取所述访问时间对应的城域网出口的第二访问数据以及骨干网出口的第三访问数据。
可选的,所述确定所述网站的第一访问数据与所述第二访问数据的第一相关性结果,包括:
计算所述第一数据点和所述第二访问数据的协方差,将所述协方差作为所述网站的第一访问数据与所述第二访问数据的第一相关性结果,所述第一数据点为所述网站的第一访问数据包含的数据点,所述第二数据点为所述第二访问数据包含的数据点。
可选的,在根据所述网站的第一访问数据获取城域网出口的第二访问数据以及骨干网出口的第三访问数据之前,所述方法还包括:
剔除所述网站的第一访问数据中的异常数据。
可选的,所述剔除所述网站的第一访问数据中的异常数据,包括:
计算所述网站的第一访问数据中所有数据点的平均值和方差;
根据所述平均值和方差确定所述网站的第一访问数据中正常数据所在的区间;
将所述区间之外的所述网站的第一访问数据确定为异常数据;
将所述异常数据从所述网站的第一访问数据中删除。
可选的,所述根据所述第一相关性结果和所述第二相关性结果对所述网站质量进行评估,包括:
如果所述第一相关性结果小于所述第二相关性结果,则确定所述城域网出口影响所述网站质量,否则,则确定所述骨干网出口影响所述网站质量。
可选的,所述根据所述第一相关性结果和所述第二相关性结果对所述网站质量进行评估,包括:
确定所述网站的各种访问数据对应的第一相关性结果和第二相关性结果;
将各种访问数据对应的第一相关性结果按照各种访问数据对应的预设权重进行加权,得到第三相关性结果,以及,将各种访问数据对应的第二相关性结果按照各种访问数据对应的预设权重进行加权,得到第四相关性结果;
根据所述第三相关性结果和所述第四相关性结果对所述网站质量进行评估。
根据本发明实施例的另一方面,提供了一种网站质量评估装置,所述装置包括:
获取模块,用于获取目标域名所在的网站中包含的所有域名;
解析模块,用于对第一域名进行域名解析,得到所述第一域名对应的第一访问数据,所述第一域名为所述目标域名所在的网站中包含的所有域名中任一个域名,所述第一访问数据为所有的访问数据中任一种访问数据;
组合模块,用于将各域名对应的第一访问数据组合,得到所述网站的第一访问数据;
第一确定模块,用于根据所述网站的第一访问数据获取城域网出口的第二访问数据以及骨干网出口的第三访问数据,所述第二访问数据和所述第三访问数据均与所述第一访问数据为同一种访问数据;
第二确定模块,用于确定所述网站的第一访问数据与所述第二访问数据的第一相关性结果,以及,所述第一访问数据与所述第三访问数据的第二相关性结果;
评估模块,用于根据所述第一相关性结果和所述第二相关性结果对所述网站质量进行评估。
根据本发明实施例的又一方面,提供了一种计算设备,所述计算设备包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述的一种网站质量评估方法对应的操作。
根据本发明实施例的还一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一可执行指令,该可执行指令用于执行上述的一种网站质量评估方法对应的操作。
通过本发明实施例,对目标域名所在的网站中包含的所有域名进行解析,得到网站的第一访问数据,根据第一访问数据分别得到了网站与城域网出口的第一相关性结果,以及,网站与骨干网出口的第二相关性结果,根据第一相关性结果和第二相关性结果对网站进行了质量分析,从而确定了影响网站质量的因素,上述对网站质量的评估方式相较于人工对网站进行分析,提高了网站质量的分析速度,节省了人力成本。
上述说明仅是本发明实施例技术方案的概述,为了能够更清楚了解本发明实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
附图仅用于示出实施方式,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种网站质量的评估方法的流程示意图;
图2示出了本发明另一实施例提供的一种网站质量的评估方法的流程图;
图3示出了本发明又一实施例提供的一种网站质量的评估方法的流程图;
图4示出了本发明实施例提供的一种网站质量的评估装置的功能框图;
图5示出了本发明实施例提供的一种计算设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。
图1示出了本发明实施例的一种网站质量评估方法的流程图。如图1所示,该方法包括以下步骤:
步骤110:获取目标域名所在的网站中包含的所有域名。
其中,目标域名是用户投诉的域名。根据目标域名可以定位目标域名所在的网站,并对该网站的全量URL地址进行域名挖掘。在进行域名挖掘时,可以通过任一种域名挖掘工具进行域名挖掘,例如,网站地图生成工具等。以网站地图生成工具为例,在该网站地图生成工具的搜索框中输入目标域名,即可得到该目标域名所在网站中包含的所有URL地址。从各URL地址中提取相应的域名字段,即可得到目标域名所在的网站中包含的所有域名。
步骤120:对第一域名进行域名解析,得到第一域名对应的第一访问数据。
其中,第一域名是目标域名所在的网站中包含的所有域名中任一个域名。第一访问数据是第一域名的所有访问数据中任一种访问数据。其中访问数据为用于衡量网站的访问质量。在本发明实施例中,访问数据包括:时延数据、丢包数据等。在对第一域名进行解析时,可以使用任何一种域名解析工具进行域名解析。例如,使用Nodejs中的DNS模块进行域名解析。在具体实施方式中,直接调用dns.lookup(域名),即可得到对域名的解析结果。
步骤130:将各域名对应的第一访问数据组合,得到网站的第一访问数据。
其中,将各域名对应的第一访问数据按照访问数据发生的时间点顺序进行组合,得到网站的第一访问数据。在进行组合时,如果同一时间点对应的第一访问数据的数据点有多个,则将多个数据点的均值作为网站的第一访问数据。
步骤140:根据网站的第一访问数据获取城域网出口的第二访问数据以及骨干网出口的第三访问数据。
其中,第二访问数据和第三访问数据均与第一访问数据为同一种访问数据。例如,第一访问数据为时延数据,则第二访问数据为城域网出口的时延数据,第三访问数据为骨干网出口的时延数据。在获取第二访问数据和第三访问数据时,根据网站的第一访问数据对应的访问时间获取与访问时间相对应的城域网出口的第二访问数据以及骨干网出口的第三访问数据。例如,网站的第一访问数据中各数据点的对应时间分别为10:00am、10.15am、10.20am,则分别获取10:00am、10.15am、10.20am的城域网出口访问数据作为第二访问数据,分别获取10:00am、10.15am、10.20am的骨干网出口访问数据作为第三访问数据。
步骤150:确定网站的第一访问数据与第二访问数据的第一相关性结果,以及,第一访问数据与第三访问数据的第二相关性结果。
其中,第一相关性结果和第二相关性结果为同一种类型的相关性结果。例如,如果第一相关性结果为网站的第一访问数据与第二访问数据的协方差,则第二相关性结果为网站的第一访问数据与第三访问数据的协方差。本发明实施例并不限定第一相关性结果和第二相关性结果的具体类型,例如,第一相关性结果和第二相关性结果可以均为协方差,也可以为相关性系数。以第一相关性结果和第二相关性结果均为协方差为例,第一相关性结果的计算过程如下,Cov(X,Y)=E(X×Y)-E(X)E(Y),其中,X表示网站的第一访问数据,Y表示第二访问数据,X×Y表示同一时间点的第一访问数据的数据点和第二访问数据的数据点相乘,E表示均值。例如,X为1.1、1.9、3,Y为5.0、10.4、14.6,则E(X)=(1.1+1.9+3)/3=2,E(Y)=(5.0+10.4+14.6)/3=10,E(XY)=(1.1×5.0+1.9×10.4+3×14.6)/3=23.02,Cov(X,Y)=E(XY)-E(X)E(Y)=23.02-2×10=3.02。第二相关性结果的计算过程与第一相关性结果的计算过程相同。
步骤160:根据第一相关性结果和第二相关性结果对网站质量进行评估。
在本步骤中,对网站质量进行评估的目的是定位影响网站质量的因素。在用户访问一个网站时,该网站经过城域网、骨干网到达访问的网站所对应的服务器。因此,网站的访问质量受城域网或骨干网的影响。如果一个网站的访问质量差,则问题点在城域网或骨干网。在本发明实施例中,通过一种访问数据对网站质量进行评估,例如,通过时延对网站质量进行评估。如果第一相关性结果小于第二相关性结果,则说明城域网出口和该网站的时延较类似,则确定城域网出口影响网站质量。如果第一相关性结果大于第二相关性结果,则说明骨干网出口影响网站质量。通过上述方式,可以快速准确定位影响网站质量的网络出口。
通过本发明实施例,对目标域名所在的网站中包含的所有域名进行解析,得到网站的第一访问数据,根据第一访问数据分别得到了网站与城域网出口的第一相关性结果,以及,网站与骨干网出口的第二相关性结果,根据第一相关性结果和第二相关性结果对网站进行了质量分析,从而确定了影响网站质量的因素,上述对网站质量的评估方式相较于人工对网站进行分析,提高了网站质量的分析速度,节省了人力成本。
图2示出了本发明另一个实施例的一种网站质量的评估方法流程图,本发明实施例包括以下流程:
步骤210:获取目标域名所在的网站中包含的所有域名。
步骤220:对第一域名进行域名解析,得到第一域名对应的第一访问数据。
步骤230:将各域名对应的第一访问数据组合,得到网站的第一访问数据。
步骤240:剔除网站的第一访问数据中的异常数据。
其中,异常数据是非网站本身的质量问题产生的数据。以第一访问数据为时延数据为例,如果时延数据过长,则有可能是用户端网络中断导致的,则该数据对网站质量评估没有参考价值,将该数据确定为异常数据。在一些实施方式中,将计算得到的区间之外的数据确定为异常数据。区间的计算是根据第一访问数据中所有数据点的平均值和方差确定的。第一访问数据的方差为第一访问数据中所有数据点的方差。根据计算得到的平均值和方差确定的区间的下限为平均值与方差的差值,区间的上限为平均值与方差的加和。
步骤250:根据剔除异常数据后的网站的第一访问数据获取城域网出口的第二访问数据以及骨干网出口的第三访问数据。
步骤260:确定网站的第一访问数据与第二访问数据的第一相关性结果,以及,第一访问数据与第三访问数据的第二相关性结果。
步骤270:根据第一相关性结果和第二相关性结果对网站质量进行评估。
通过本发明实施例,从网站的第一访问数据中剔除了异常数据,从而使网站质量的评估结果更加可靠。
图3示出了本发明又一个实施例的一种网站质量的评估方法流程图,本发明实施例包括以下流程:
步骤310:获取目标域名所在的网站中包含的所有域名。
步骤320:对第一域名进行域名解析,得到第一域名对应的第一访问数据。
步骤330:将各域名对应的第一访问数据组合,得到网站的第一访问数据。
步骤340:根据网站的第一访问数据获取城域网出口的第二访问数据以及骨干网出口的第三访问数据。
步骤350:确定网站的第一访问数据与第二访问数据的第一相关性结果,以及,第一访问数据与第三访问数据的第二相关性结果。
步骤360:确定网站的各种访问数据对应的第一相关性结果和第二相关性结果。
在本步骤中,各种访问数据对应的第一相关性结果和第二相关性结果的确定方法与第一访问数据的确定方法相同,请参阅图1中步骤150的说明,在此不做赘述。
步骤370:将各种访问数据对应的第一相关性结果按照各种访问数据对应的预设权重进行加权,得到第三相关性结果,以及,将各种访问数据对应的第二相关性结果按照各种访问数据对应的预设权重进行加权,得到第四相关性结果。
其中,预设权重用于表示每一种访问数据对网站质量的影响比重。每一种访问数据对应的权重之和为1。每一种访问数据对应的权重可以设置为相同,也可以设置为不同,本发明实施例并不以此为限。例如,访问数据共有两类,分别为时延数据和丢包数据,其中时延数据对网站质量的影响较大,将其权重设置为0.6,丢包数据对网站的影响较小,将其权重设置为0.4,则第三相关性结果为:0.6×(时延数据对应的第一相关性结果)+0.4×(丢包数据对应的第一相关性结果)。第四相关性的计算过程与第三相关性的计算过程相同,在此不做赘述。
步骤380:根据第三相关性结果和第四相关性结果对网站质量进行评估。
在本步骤中,如果第三相关性结果小于第四相关性结果,则说明城域网出口和该网站的时延较类似,则确定城域网出口影响网站质量。如果第三相关性结果大于第四相关性结果,则说明骨干网出口影响网站质量。通过上述方式,可以快速准确定位影响网站质量的网络出口。
本发明实施例可以结合图2实施例一起实施。
本发明实施例在对网站质量进行评估时,综合考虑了各种访问数据,根据各种访问数据对网站质量进行评估,从而使网站质量的评估结果更加可靠。
图4示出了本发明实施例的一种网站质量评估装置的功能框图。如图4所示,该装置包括:
获取模块410,用于获取目标域名所在的网站中包含的所有域名。
解析模块420,用于对第一域名进行域名解析,得到所述第一域名对应的第一访问数据,所述第一域名为所述目标域名所在的网站中包含的所有域名中任一个域名,所述第一访问数据为所有的访问数据中任一种访问数据。
组合模块430,用于将各域名对应的第一访问数据组合,得到所述网站的第一访问数据。
第一确定模块440,用于根据所述网站的第一访问数据获取城域网出口的第二访问数据以及骨干网出口的第三访问数据,所述第二访问数据和所述第三访问数据均与所述第一访问数据为同一种访问数据。
第二确定模块450,用于确定所述网站的第一访问数据与所述第二访问数据的第一相关性结果,以及,所述第一访问数据与所述第三访问数据的第二相关性结果。
评估模块460,用于根据所述第一相关性结果和所述第二相关性结果对所述网站质量进行评估。
在一种可选的方式中,第一确定模块440进一步用于:
确定所述网站的第一访问数据对应的访问时间;
获取所述访问时间对应的城域网出口的第二访问数据以及骨干网出口的第三访问数据。
在一种可选的方式中,第二确定模块450进一步用于:
计算所述第一数据点和所述第二访问数据的协方差,将所述协方差作为所述网站的第一访问数据与所述第二访问数据的第一相关性结果,所述第一数据点为所述网站的第一访问数据包含的数据点,所述第二数据点为所述第二访问数据包含的数据点。
在一种可选的方式中,所述装置还包括:剔除模块470,用于剔除所述网站的第一访问数据中的异常数据。
在一种可选的方式中,剔除模块470进一步用于:
计算所述网站的第一访问数据中所有数据点的平均值和方差;
根据所述平均值和方差确定所述网站的第一访问数据中正常数据所在的区间;
将所述区间之外的所述网站的第一访问数据确定为异常数据;
将所述异常数据从所述网站的第一访问数据中删除。
在一种可选的方式中,评估模块460进一步用于:
如果所述第一相关性结果小于所述第二相关性结果,则确定所述城域网出口影响所述网站质量,否则,则确定所述骨干网出口影响所述网站质量。
在一种可选的方式中,评估模块460进一步用于:
确定所述网站的各种访问数据对应的第一相关性结果和第二相关性结果;
将各种访问数据对应的第一相关性结果按照各种访问数据对应的预设权重进行加权,得到第三相关性结果,以及,将各种访问数据对应的第二相关性结果按照各种访问数据对应的预设权重进行加权,得到第四相关性结果;
根据所述第三相关性结果和所述第四相关性结果对所述网站质量进行评估。
通过本发明实施例,对目标域名所在的网站中包含的所有域名进行解析,得到网站的第一访问数据,根据第一访问数据分别得到了网站与城域网出口的第一相关性结果,以及,网站与骨干网出口的第二相关性结果,根据第一相关性结果和第二相关性结果对网站进行了质量分析,从而确定了影响网站质量的因素,上述对网站质量的评估方式相较于人工对网站进行分析,提高了网站质量的分析速度,节省了人力成本。
图5示出了本发明实施例的一种计算设备的结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。
如图5所示,该计算设备可以包括:处理器(processor)502、通信接口(Communications Interface)504、存储器(memory)506、以及通信总线508。
其中:处理器502、通信接口504、以及存储器506通过通信总线508完成相互间的通信。通信接口504,用于与其它设备比如客户端或其它服务器等的网元通信。处理器502,用于执行程序510,具体可以执行上述任一网站质量评估方法实施例中的相关步骤。
具体地,程序510可以包括程序代码,该程序代码包括计算机可执行指令。
处理器502可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器506,用于存放程序510。存储器506可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序510具体可以被处理器502调用使计算设备执行图1中的步骤110~步骤160,图2中的步骤210~步骤270,图3中的步骤310~步骤380,以及实现图4中的模块410~模块470的功能。
本发明实施例提供了一种计算机可读存储介质,所述存储介质存储有至少一可执行指令,该可执行指令在计算设备上运行时,使得所述计算设备执行上述任意方法实施例中的一种网站质量的评估方法。
本发明实施例提供了一种计算机程序,所述计算机程序可被处理器调用使计算设备执行上述任意方法实施例中的一种网站质量的评估方法。
本发明实施例提供了一种计算机程序产品,计算机程序产品包括存储在计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令在计算机上运行时,使得所述计算机执行上述任意方法实施例中的一种网站质量的评估方法。
在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。
Claims (10)
1.一种网站质量评估方法,其特征在于,所述方法包括:
获取目标域名所在的网站中包含的所有域名;
对第一域名进行域名解析,得到所述第一域名对应的第一访问数据,所述第一域名为所述目标域名所在的网站中包含的所有域名中任一个域名,所述第一访问数据为所述第一域名的所有的访问数据中任一种访问数据;
将各域名对应的第一访问数据组合,得到所述网站的第一访问数据;
根据所述网站的第一访问数据获取城域网出口的第二访问数据以及骨干网出口的第三访问数据,所述第二访问数据和所述第三访问数据均与所述第一访问数据为同一种访问数据;
确定所述网站的第一访问数据与所述第二访问数据的第一相关性结果,以及,所述第一访问数据与所述第三访问数据的第二相关性结果;
根据所述第一相关性结果和所述第二相关性结果对所述网站质量进行评估。
2.根据权利要求1所述的方法,其特征在于,所述根据所述网站的第一访问数据获取城域网出口的第二访问数据以及骨干网出口的第三访问数据,包括:
确定所述网站的第一访问数据对应的访问时间;
获取所述访问时间对应的城域网出口的第二访问数据以及骨干网出口的第三访问数据。
3.根据权利要求1所述的方法,其特征在于,所述确定所述网站的第一访问数据与所述第二访问数据的第一相关性结果,包括:
计算所述第一数据点和所述第二访问数据的协方差,将所述协方差作为所述网站的第一访问数据与所述第二访问数据的第一相关性结果,所述第一数据点为所述网站的第一访问数据包含的数据点,所述第二数据点为所述第二访问数据包含的数据点。
4.根据权利要求1所述的方法,其特征在于,在根据所述网站的第一访问数据获取城域网出口的第二访问数据以及骨干网出口的第三访问数据之前,所述方法还包括:
剔除所述网站的第一访问数据中的异常数据。
5.根据权利要求3所述的方法,其特征在于,所述剔除所述网站的第一访问数据中的异常数据,包括:
计算所述网站的第一访问数据中所有数据点的平均值和方差;
根据所述平均值和方差确定所述网站的第一访问数据中正常数据所在的区间;
将所述区间之外的所述网站的第一访问数据确定为异常数据;
将所述异常数据从所述网站的第一访问数据中删除。
6.根据权利要求1所述的方法,其特征在于,所述根据所述第一相关性结果和所述第二相关性结果对所述网站质量进行评估,包括:
如果所述第一相关性结果小于所述第二相关性结果,则确定所述城域网出口影响所述网站质量,否则,则确定所述骨干网出口影响所述网站质量。
7.根据权利要求1所述的方法,其特征在于,所述根据所述第一相关性结果和所述第二相关性结果对所述网站质量进行评估,包括:
确定所述网站的各种访问数据对应的第一相关性结果和第二相关性结果;
将各种访问数据对应的第一相关性结果按照各种访问数据对应的预设权重进行加权,得到第三相关性结果,以及,将各种访问数据对应的第二相关性结果按照各种访问数据对应的预设权重进行加权,得到第四相关性结果;
根据所述第三相关性结果和所述第四相关性结果对所述网站质量进行评估。
8.一种网站质量评估装置,其特征在于,所述装置包括:
获取模块,用于获取目标域名所在的网站中包含的所有域名;
解析模块,用于对第一域名进行域名解析,得到所述第一域名对应的第一访问数据,所述第一域名为所述目标域名所在的网站中包含的所有域名中任一个域名,所述第一访问数据为所有的访问数据中任一种访问数据;
组合模块,用于将各域名对应的第一访问数据组合,得到所述网站的第一访问数据;
第一确定模块,用于根据所述网站的第一访问数据获取城域网出口的第二访问数据以及骨干网出口的第三访问数据,所述第二访问数据和所述第三访问数据均与所述第一访问数据为同一种访问数据;
第二确定模块,用于确定所述网站的第一访问数据与所述第二访问数据的第一相关性结果,以及,所述第一访问数据与所述第三访问数据的第二相关性结果;
评估模块,用于根据所述第一相关性结果和所述第二相关性结果对所述网站质量进行评估。
9.一种计算设备,其特征在于,所述计算设备包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-7任意一项所述的一种网站质量评估方法对应的操作。
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一可执行指令,该可执行指令用于执行如权利要求1-7任意一项所述的一种网站质量评估方法对应的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010052880.2A CN113139146B (zh) | 2020-01-17 | 2020-01-17 | 网站质量评估方法、装置及计算设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010052880.2A CN113139146B (zh) | 2020-01-17 | 2020-01-17 | 网站质量评估方法、装置及计算设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113139146A true CN113139146A (zh) | 2021-07-20 |
CN113139146B CN113139146B (zh) | 2023-07-21 |
Family
ID=76808608
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010052880.2A Active CN113139146B (zh) | 2020-01-17 | 2020-01-17 | 网站质量评估方法、装置及计算设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113139146B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080247325A1 (en) * | 2007-04-05 | 2008-10-09 | Arturas Vaitaitis | System and method of determining data latency over a network |
JP2008546349A (ja) * | 2005-06-10 | 2008-12-18 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 無線通信受信機における障害相関評価方法及び装置 |
CN102137425A (zh) * | 2011-02-24 | 2011-07-27 | 华为技术有限公司 | 链路质量评估方法和装置 |
WO2013044559A1 (zh) * | 2011-09-26 | 2013-04-04 | 中国科学院计算机网络信息中心 | 网站推荐方法和系统以及网络服务器 |
CN105471620A (zh) * | 2015-11-12 | 2016-04-06 | 广州市柏特科技有限公司 | 宽带智能终端嵌入式网络分析与诊断装置及其方法 |
CN106972986A (zh) * | 2017-04-14 | 2017-07-21 | 福建省天晴互动娱乐有限公司 | Idc机房网络质量的检测方法及其系统 |
CN107528749A (zh) * | 2017-08-28 | 2017-12-29 | 杭州安恒信息技术有限公司 | 基于云防护日志的网站可用性检测方法、装置及系统 |
CN107567047A (zh) * | 2017-09-28 | 2018-01-09 | 北京邮电大学 | 一种异构网络中基于网络流量时空动态变化的负载均衡方法 |
CN108121741A (zh) * | 2016-11-30 | 2018-06-05 | 百度在线网络技术(北京)有限公司 | 网站质量评估方法及装置 |
WO2018121237A1 (zh) * | 2016-12-29 | 2018-07-05 | 中兴通讯股份有限公司 | 网络质量检测方法及装置 |
CN108259532A (zh) * | 2016-12-29 | 2018-07-06 | 中国电信股份有限公司 | 云资源的调度方法以及装置 |
CN109412892A (zh) * | 2018-10-23 | 2019-03-01 | 株洲中车时代电气股份有限公司 | 一种网络通信质量评估系统及方法 |
-
2020
- 2020-01-17 CN CN202010052880.2A patent/CN113139146B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008546349A (ja) * | 2005-06-10 | 2008-12-18 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 無線通信受信機における障害相関評価方法及び装置 |
US20080247325A1 (en) * | 2007-04-05 | 2008-10-09 | Arturas Vaitaitis | System and method of determining data latency over a network |
CN102137425A (zh) * | 2011-02-24 | 2011-07-27 | 华为技术有限公司 | 链路质量评估方法和装置 |
WO2013044559A1 (zh) * | 2011-09-26 | 2013-04-04 | 中国科学院计算机网络信息中心 | 网站推荐方法和系统以及网络服务器 |
CN105471620A (zh) * | 2015-11-12 | 2016-04-06 | 广州市柏特科技有限公司 | 宽带智能终端嵌入式网络分析与诊断装置及其方法 |
CN108121741A (zh) * | 2016-11-30 | 2018-06-05 | 百度在线网络技术(北京)有限公司 | 网站质量评估方法及装置 |
WO2018121237A1 (zh) * | 2016-12-29 | 2018-07-05 | 中兴通讯股份有限公司 | 网络质量检测方法及装置 |
CN108259532A (zh) * | 2016-12-29 | 2018-07-06 | 中国电信股份有限公司 | 云资源的调度方法以及装置 |
CN106972986A (zh) * | 2017-04-14 | 2017-07-21 | 福建省天晴互动娱乐有限公司 | Idc机房网络质量的检测方法及其系统 |
CN107528749A (zh) * | 2017-08-28 | 2017-12-29 | 杭州安恒信息技术有限公司 | 基于云防护日志的网站可用性检测方法、装置及系统 |
CN107567047A (zh) * | 2017-09-28 | 2018-01-09 | 北京邮电大学 | 一种异构网络中基于网络流量时空动态变化的负载均衡方法 |
CN109412892A (zh) * | 2018-10-23 | 2019-03-01 | 株洲中车时代电气股份有限公司 | 一种网络通信质量评估系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113139146B (zh) | 2023-07-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9954886B2 (en) | Method and apparatus for detecting website security | |
CN104615760B (zh) | 钓鱼网站识别方法和系统 | |
CN109241343B (zh) | 一种刷量用户识别系统、方法及装置 | |
CN106302350B (zh) | Url监测方法、装置及设备 | |
CN110175278B (zh) | 网络爬虫的检测方法及装置 | |
US20160277259A1 (en) | Traffic quality analysis method and apparatus | |
EP3146698A1 (en) | Method and system for acquiring web pages | |
CN110602045A (zh) | 一种基于特征融合和机器学习的恶意网页识别方法 | |
CN109145585B (zh) | 一种检测网站存在弱口令的方法及装置 | |
CN111435393A (zh) | 对象漏洞的检测方法、装置、介质及电子设备 | |
CN111130845A (zh) | 基于视觉信息的网站页面IPv6支持度测试方法及装置 | |
CN109558547A (zh) | 一种数据的过滤方法、装置、电子设备及存储介质 | |
CN103455492B (zh) | 一种搜索网页的方法和装置 | |
CN106874340B (zh) | 一种网页地址分类方法及装置 | |
CN105515882B (zh) | 网站安全检测方法及装置 | |
CN113139146B (zh) | 网站质量评估方法、装置及计算设备 | |
CN111125704B (zh) | 一种网页挂马识别方法及系统 | |
CN110457900B (zh) | 一种网站监测方法、装置、设备及可读存储介质 | |
CN113055420A (zh) | Https业务识别方法、装置及计算设备 | |
CN110825976B (zh) | 网站页面的检测方法、装置、电子设备及介质 | |
EP2937801A1 (en) | Harmful site collection device and method | |
JP2018018523A (ja) | ユーザアクセスログの関連付け方法、装置、システム、プログラム及び記録媒体 | |
CN107239704A (zh) | 恶意网页发现方法及装置 | |
CN113723720B (zh) | 页面浏览质量评估方法及装置 | |
CN114765599A (zh) | 子域名采集方法、装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |