CN113315670A - 网络流量分析方法、装置及存储介质 - Google Patents
网络流量分析方法、装置及存储介质 Download PDFInfo
- Publication number
- CN113315670A CN113315670A CN202110856692.XA CN202110856692A CN113315670A CN 113315670 A CN113315670 A CN 113315670A CN 202110856692 A CN202110856692 A CN 202110856692A CN 113315670 A CN113315670 A CN 113315670A
- Authority
- CN
- China
- Prior art keywords
- access data
- access
- target
- data
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/142—Network analysis or design using statistical or mathematical methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/147—Network analysis or design for predicting network behaviour
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/02—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Pure & Applied Mathematics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本申请涉及互联网技术领域,本申请实施例公开了一种网络流量分析方法、装置及存储介质,获取目标网站的预设时间段的第一访问数据,所述第一访问数据包括用户信息以及该用户信息对应的访问数据;根据所述用户信息对所述第一访问数据进行分类,得到多类访问数据;获取所述多类访问数据中每一类访问数据的权重,得到多个权重值;根据所述多类访问数据和所述多个权重值确定所述目标网站的目标流量值。采用本申请实施例可以对流量进行深入分析,以提升流量监控效率。
Description
技术领域
本申请涉及互联网技术领域,具体涉及一种网络流量分析方法、装置及存储介质。
背景技术
伴随网络技术快速发展以及终端设备的快速普及,网络已成为用户获取消息的主要方式,对于门户网站而言,流量的监控对网站的运营非常重要,例如,通过流量的监控,可以了解网站的热度,当然,还可以对用户群体进行维护,目前来看,流量的监控往往只是简单统计访问量,并未对流量进行深入分析,因此,如何提升流量监控效率的问题亟待解决。
发明内容
本申请实施例提供了一种网络流量分析方法、装置及存储介质,可以对流量进行深入分析,以提升流量监控效率。
第一方面,本申请实施例提供一种网络流量分析方法,所述方法包括:
获取目标网站的预设时间段的第一访问数据,所述第一访问数据包括用户信息以及该用户信息对应的访问数据;
根据所述用户信息对所述第一访问数据进行分类,得到多类访问数据;
获取所述多类访问数据中每一类访问数据的权重,得到多个权重值;
根据所述多类访问数据和所述多个权重值确定所述目标网站的目标流量值。
第二方面,本申请实施例提供了一种网络流量分析装置,所述装置包括:第一获取单元、分类单元、第二获取单元和确定单元,其中,
所述第一获取单元,用于获取目标网站的预设时间段的第一访问数据,所述第一访问数据包括用户信息以及该用户信息对应的访问数据;
所述分类单元,用于根据所述用户信息对所述第一访问数据进行分类,得到多类访问数据;
所述第二获取单元,用于获取所述多类访问数据中每一类访问数据的权重,得到多个权重值;
所述确定单元,用于根据所述多类访问数据和所述多个权重值确定所述目标网站的目标流量值。
第三方面,本申请实施例提供一种服务器,包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行本申请实施例第一方面中的步骤的指令。
第四方面,本申请实施例提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。
第五方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
实施本申请实施例,具备如下有益效果:
可以看出,本申请实施例中所描述的网络流量分析方法、装置及存储介质,获取目标网站的预设时间段的第一访问数据,第一访问数据包括用户信息以及该用户信息对应的访问数据,根据用户信息对第一访问数据进行分类,得到多类访问数据,获取多类访问数据中每一类访问数据的权重,得到多个权重值,根据多类访问数据和多个权重值确定目标网站的目标流量值,可以对访问数据进行分类,并对每一类赋予不同的权重,进而,实现了对流量进行深入分析,以提升流量监控效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种网络流量分析方法的流程示意图;
图2是本申请实施例提供的另一种网络流量分析方法的流程示意图;
图3是本申请实施例提供的一种服务器的结构示意图;
图4是本申请实施例提供的一种网络流量分析装置的功能单元组成框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
下面对本申请实施例进行详细介绍。
请参阅图1,图1是本申请实施例提供的一种网络流量分析方法的流程示意图,如图所示,本网络流量分析方法包括:
101、获取目标网站的预设时间段的第一访问数据,所述第一访问数据包括用户信息以及该用户信息对应的访问数据。
其中,目标网站可以为任一网站,该任一网站可以包括一个或者多个网页,例如,目标网站可以为个人网站或者门户网站,又例如,目标网站可以为微博。预设时间段可以预先设置或者系统默认。具体实现中,用户可以终端设备(例如手机)、台式机、笔记本访问目标网站,目标网站则可以通过服务器对用户的访问行为进行记录。本申请实施例中,则可以由服务器完成步骤101-步骤104。
本申请实施例中,用户信息可以理解为访问用户的个人信息,用户信息可以包括以下至少一种:IP地址、MAC地址、用户名、用户年龄、用户职业、用户等级、用户公司名称等等,在此不作限定。访问数据可以包括以下至少一种:访问时间点、访问位置、访问时长、访问频率、访问时候的注视时长、访问设备类型等等,在此不作限定。在用户访问之后,则后台可以记录用户的访问数据。
102、根据所述用户信息对所述第一访问数据进行分类,得到多类访问数据。
其中,具体实现中,不同用户信息,则其对应不同的群体,例如,可以依据用户年龄实现对第一访问数据进行分类,又例如,可以依据用户职业对第一访问数据进行分类。
可选的,在所述用户信息为用户年龄时,上述步骤102,根据所述用户信息对所述第一访问数据进行分类,得到多类访问数据,可以包括如下步骤:
21、从所述第一访问数据中筛选出访问时长处于预设范围的访问数据,得到第二访问数据;
22、根据所述用户年龄对所述第二访问数据进行分类,得到多类访问数据。
其中,预设范围可以预先设置或者系统默认。
具体实现中,有时候访问时长过短可能是误操作,其带来的流量很有可能是用户误操作造成的,在统计网站流量过程中,这部分流量对流量统计的贡献很小,因此,可以对这部分访问数据加以筛选。预设范围可以预先设置或者系统默认。
进而,可以从第一访问数据中筛选出访问时长处于预设范围的访问数据,得到第二访问数据,这样很大程度上得到的访问数据是有访问需求的用户的访问数据,还可以根据用户年龄对所述第二访问数据进行分类,得到多类访问数据,例如,不同的年龄阶段,可以对应不同类的访问数据,不同类的用户,其用户对应的权重不一样。不同的网站,其针对的用户群体不一样,例如,游戏的话,年轻人相对于老年人而言,其对游戏业务的贡献更大,其对应的权重更大。
103、获取所述多类访问数据中每一类访问数据的权重,得到多个权重值。
其中,不同的访问数据其对应的权重不一样,不同类的访问数据可以对应不同的类别标签,以年龄分类为例,16~20对应一个类别标签,21~25对应一个类别标签。可以预先设置类别标签与权重值之间的映射关系,进而,可以确定多类访问数据中每一类访问数据的权重,得到多个权重值。
104、根据所述多类访问数据和所述多个权重值确定所述目标网站的目标流量值。
具体实现中,多类访问数据中的每一类访问数据对应一个流量值,可以根据多类访问数据和多个权重值进行加权运算,进而,可以得到目标网站的目标流量值。
可选的,上述步骤104,根据所述多类访问数据和所述多个权重值确定所述目标网站的目标流量值,可以包括如下步骤:
A41、获取所述多类访问数据中每一访问数据对应的注视数据,得到多个注视数据;
A42、确定所述多个注视数据中每一注视数据对应的影响因子,得到多个影响因子;
A43、根据所述多类访问数据、所述多个权重值以及所述多个影响因子确定所述目标网站的目标流量值。
其中,注视数据可以理解为用户注视目标网站相关信息的注视数据,注视数据可以包括以下至少一种:注视时长、注视位置等等,在此不作限定。可以确定多类访问数据中每一访问数据对应的注视数据,得到多个注视数据,不同的注视数据则说明用户关注的内容不一样,当然,通过注视数据来确定影响因子也可以在一定程度上实现防刷,例如,在用户不在屏幕前,则用户很有可能只是挂机行为,这种行为则有可能会导致实际流量分析不精准,因而,通过注视数据,则可以在一定程度上实现防刷,具体实现中,例如,可以预先存储注视时长与影响因子之间的映射关系,进而,可以确定多个注视数据中每一注视数据对应的影响因子,得到多个影响因子,影响因子的取值范围可以为0~1。进一步地,可以根据多类访问数据、多个权重值以及多个影响因子确定目标网站的目标流量值,具体地,可以确定多类访问数据中每一访问数据与其对应的权重值以及影响因子之间的乘积,再将得到乘积后的多类访问数据中所有访问数据进行求和,得到最终的目标流量值,其中,多类访问数据中每一访问数据可以记录为1。
可选的,上述步骤104,根据所述多类访问数据和所述多个权重值确定所述目标网站的目标流量值,可以包括如下步骤:
B41、将所述第一访问数据对应的每一用户的位置投影到访问地图中,得到多个投影点;
B42、将所述访问地图划分为P个区域,所述P为大于1的整数;
B43、根据所述多个投影点确定所述P个区域中每一区域的访问密度,得到P个访问密度;
B44、确定所述目标网站的业务区域,得到Q个区域,所述Q个区域为所述P个区域中的部分或者全部区域;
B45、从所述P个访问密度中获取与所述Q个区域对应的访问密度,得到Q个访问密度;
B46、根据所述Q个访问密度确定目标均方差;
B47、根据所述多类访问数据和所述多个权重值确定参考流量值;
B48、根据所述目标均方差优化所述参考流量值,得到所述目标流量值。
具体实现中,访问地图可以为实际地图或者虚拟地图,虚拟地图可以为网络拓扑图,由于每一访问数据可以对应一个访问位置,进而,可以将第一访问数据对应的每一用户的位置投影到访问地图中,得到多个投影点,还可以将访问地图划分为P个区域,P为大于1的整数,P个区域可以为虚拟区域或者实体区域,在P个区域为实体区域时,P个区域的大小可以相同,进而,可以根据多个投影点确定P个区域中每一区域的访问密度,得到P个访问密度,访问密度可以理解为访问量与区域大小之间的比值。
进一步的,还可以确定目标网站的业务区域,得到Q个区域,Q个区域为P个区域中的部分或者全部区域,进而,可以从P个访问密度中获取与Q个区域对应的访问密度,得到Q个访问密度,再根据Q个访问密度确定目标均方差,均方差则在一定程度上反应了区域之间的波动程度,进而,可以根据多类访问数据和多个权重值确定参考流量值,还可以预先存储均方差与优化参数之间的映射关系,进而,确定目标均方差对应的目标优化参数,优化参数的取值范围可以为-0.14~0.14,可以根据目标均方差优化参考流量值,得到目标流量值,具体如下:
目标流量值=(1+目标优化参数)*参考流量值
如此,可以根据网站的业务区域来约束其访问数据,再考虑访问数据在不同业务区域之间的波动情况来优化整体流量,进而,在一定程度上提升流量统计精度。
可选的,在步骤104根据所述多类访问数据和所述多个权重值确定所述目标网站的目标流量值之后,还可以包括如下步骤:
A1、确定所述第一访问数据对应的访问数据曲线,所述访问数据曲线的横轴为时间,纵轴为访问数据;
A2、根据所述访问数据曲线确定预设预测时段的第一参考数据曲线;
A3、获取所述预设预测时段对应的历史参考访问数据;
A4、根据所述历史参考访问数据确定用户活跃因子;
A5、获取所述目标网站对应的目标关键词对应的目标热度衰减曲线;
A6、根据所述用户活跃因子、所述目标热度衰减曲线对所述第一参考数据曲线进行调节,得到第二参考数据曲线;
A7、根据所述第二参考数据曲线确定所述预设预测时段的预测流量值。
其中,预设预测时段可以为一个未来时间段,该预设预测时段的起点可以为当前时间,或者,也可以不为当前时间。
具体的,可以确定第一访问数据对应的访问数据曲线,访问数据曲线的横轴为时间,纵轴为访问数据,访问数据的单位可以为用户数量,基于访问数据曲线可以实现预测功能,即将访问数据曲线延伸到预设预测时段,将该预设预测时段对应的访问数据曲线作为第一参考数据曲线。
进而,还可以获取预设预测时段对应的历史参考访问数据,即可以分析历史中预设预测时段的历史参考访问数据,例如,可以为一个月以内的预设预测时段的历史参考访问数据,基于预设预测时段的历史参考访问数据确定每一天在预设预测时段的用户数量,按照预设的用户数量与活跃因子之间的映射关系,可以确定历史参考访问数据确定用户活跃因子。
另外,在目标网站被访问的情况下,目标网站的关键词也对其访问有一定的影响,进而,可以获取目标网站对应的目标关键词对应的目标热度衰减曲线,该目标关键词对应的目标热度衰减曲线可以通过预测模型进行模拟实现,该预测模型可以是点击率(click-through rate,CTR)预测模型。
进一步的,可以根据用户活跃因子、目标热度衰减曲线对第一参考数据曲线进行调节,得到第二参考数据曲线,再根据第二参考数据曲线确定预设预测时段的预测流量值,进而,在预测应用中,基于用户活跃情况以及关键词的热度衰减情况对参考数据曲线进行调节,有助于提升预测流量统计精度。
进一步的,上述步骤A6,根据所述用户活跃因子、所述目标热度衰减曲线对所述第一参考数据曲线进行调节,得到第二参考数据曲线,可以包括如下步骤:
A61、对所述第一参考数据曲线进行采样,得到至少一个采样点;
A62、根据所述用户活跃因子对所述至少一个采样点中的每一采样点进行左右移动操作;
A63、根据所述目标热度衰减曲线对所述至少一个采样点中的每一采样点进行上下移动操作;
A64、将移动后的所述至少一个采样点进行重新拟合,得到所述第二参考数据曲线。
其中,可以对第一参考数据曲线进行采样,得到至少一个采样点,再根据用户活跃因子对至少一个采样点中的每一采样点进行左右移动操作,每一采样点的移动幅度可以相同,通过用户活跃因子与前一个时间段的用户活跃因子进行比较,通过两者之间的比较结果来确定左右移动操作的移动参数。接着,可以根据目标热度衰减曲线对至少一个采样点中的每一采样点进行上下移动操作,例如,可以确定目标热度衰减曲线在预设预测时段的热度均值,基于热度均值与上一时间段的热度均值进行比较,再通过两者之间的比较结果来确定上下移动操作的移动参数,再将移动后的至少一个采样点进行重新拟合,得到第二参考数据曲线,例如,可以将第二参考数据曲线进行微积分运算,得到预测流量值。
可选的,上述步骤A63,根据所述用户活跃因子对所述至少一个采样点中的每一采样点进行左右移动操作,可以包括如下步骤:
A631、获取所述预设预测时段前一个时间段的参考用户活跃因子;
A632、根据所述用户活跃因子、所述参考用户活跃因子确定第一移动参数;
A633、根据所述第一移动参数对所述至少一个采样点中的每一采样点进行左右移动操作。
具体实现中,基于上述方法可以获取预设预测时段前一个时间段的参考用户活跃因子,进而,可以确定用户活跃因子与参考用户活跃因子之间的第一目标差值,按照预设的差值与移动参数之间的映射关系,确定第一目标差值对应的第一移动参数,再根据第一移动参数对至少一个采样点中的每一采样点进行左右移动操作。
可选的,上述步骤A64,根据所述目标热度衰减曲线对所述至少一个采样点中的每一采样点进行上下移动操作,可以包括如下步骤:
A641、获取所述预设预测时段前一个时间段的参考热度均值;
A642、根据所述目标热度衰减曲线对应的热度均值、所述参考热度均值确定第二移动参数;
A643、根据所述第二移动参数对所述至少一个采样点中的每一采样点进行上下移动操作。
具体实现中,基于上述方法可以获取预设预测时段前一个时间段的参考热度均值,进而,可以确定目标热度衰减曲线对应的热度均值与参考热度均值之间的第二目标差值,按照预设的差值与移动参数之间的映射关系,确定第二目标差值对应的第二移动参数,再根据第二移动参数对至少一个采样点中的每一采样点进行上下移动操作。
可以看出,本申请实施例中所描述的网络流量分析方法,获取目标网站的预设时间段的第一访问数据,第一访问数据包括用户信息以及该用户信息对应的访问数据,根据用户信息对第一访问数据进行分类,得到多类访问数据,获取多类访问数据中每一类访问数据的权重,得到多个权重值,根据多类访问数据和多个权重值确定目标网站的目标流量值,可以对访问数据进行分类,并对每一类赋予不同的权重,进而,实现了对流量进行深入分析,以提升流量监控效率。
与上述图1所示的实施例一致地,请参阅图2,图2是本申请实施例提供的一种网络流量分析方法的流程示意图,如图所示,本网络流量分析方法包括:
201、获取目标网站的预设时间段的第一访问数据,所述第一访问数据包括用户信息以及该用户信息对应的访问数据。
202、在所述用户信息为用户年龄时,从所述第一访问数据中筛选出访问时长处于预设范围的访问数据,得到第二访问数据。
203、根据所述用户年龄对所述第二访问数据进行分类,得到多类访问数据。
204、获取所述多类访问数据中每一类访问数据的权重,得到多个权重值。
205、根据所述多类访问数据和所述多个权重值确定所述目标网站的目标流量值。
其中,上述步骤201-步骤205的具体描述可以参照上述图1所描述的网络流量分析方法的相应步骤,在此不再赘述。
可以看出,本申请实施例中所描述的网络流量分析方法,获取目标网站的预设时间段的第一访问数据,第一访问数据包括用户信息以及该用户信息对应的访问数据,在用户信息为用户年龄时,从第一访问数据中筛选出访问时长处于预设范围的访问数据,得到第二访问数据,根据用户年龄对第二访问数据进行分类,得到多类访问数据,获取多类访问数据中每一类访问数据的权重,得到多个权重值,根据多类访问数据和多个权重值确定目标网站的目标流量值,可以对访问数据依据用户年龄进行分类,不同的年龄对网站的流量贡献程度不一样,进而可以对每一类赋予不同的权重,进而,实现了对流量进行深入分析,以提升流量监控效率。
与上述实施例一致地,请参阅图3,图3是本申请实施例提供的一种服务器的结构示意图,如图所示,该服务器包括处理器、存储器、通信接口以及一个或多个程序,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,本申请实施例中,上述程序包括用于执行以下步骤的指令:
获取目标网站的预设时间段的第一访问数据,所述第一访问数据包括用户信息以及该用户信息对应的访问数据;
根据所述用户信息对所述第一访问数据进行分类,得到多类访问数据;
获取所述多类访问数据中每一类访问数据的权重,得到多个权重值;
根据所述多类访问数据和所述多个权重值确定所述目标网站的目标流量值。
可选的,在所述用户信息为用户年龄时,在所述根据所述用户信息对所述第一访问数据进行分类,得到多类访问数据方面,上述程序包括用于执行以下步骤的指令:
从所述第一访问数据中筛选出访问时长处于预设范围的访问数据,得到第二访问数据;
根据所述用户年龄对所述第二访问数据进行分类,得到多类访问数据。
可选的,在所述根据所述多类访问数据和所述多个权重值确定所述目标网站的目标流量值方面,上述程序包括用于执行以下步骤的指令:
获取所述多类访问数据中每一访问数据对应的注视数据,得到多个注视数据;
确定所述多个注视数据中每一注视数据对应的影响因子,得到多个影响因子;
根据所述多类访问数据、所述多个权重值以及所述多个影响因子确定所述目标网站的目标流量值。
可选的,在所述根据所述多类访问数据和所述多个权重值确定所述目标网站的目标流量值方面,上述程序包括用于执行以下步骤的指令:
将所述第一访问数据对应的每一用户的位置投影到访问地图中,得到多个投影点;
将所述访问地图划分为P个区域,所述P为大于1的整数;
根据所述多个投影点确定所述P个区域中每一区域的访问密度,得到P个访问密度;
确定所述目标网站的业务区域,得到Q个区域,所述Q个区域为所述P个区域中的部分或者全部区域;
从所述P个访问密度中获取与所述Q个区域对应的访问密度,得到Q个访问密度;
根据所述Q个访问密度确定目标均方差;
根据所述多类访问数据和所述多个权重值确定参考流量值;
根据所述目标均方差优化所述参考流量值,得到所述目标流量值。
可选的,在所述根据所述多类访问数据和所述多个权重值确定所述目标网站的目标流量值之后,上述程序还包括用于执行以下步骤的指令:
确定所述第一访问数据对应的访问数据曲线,所述访问数据曲线的横轴为时间,纵轴为访问数据;
根据所述访问数据曲线确定预设预测时段的第一参考数据曲线;
获取所述预设预测时段对应的历史参考访问数据;
根据所述历史参考访问数据确定用户活跃因子;
获取所述目标网站对应的目标关键词对应的目标热度衰减曲线;
根据所述用户活跃因子、所述目标热度衰减曲线对所述第一参考数据曲线进行调节,得到第二参考数据曲线;
根据所述第二参考数据曲线确定所述预设预测时段的预测流量值。
可选的,在所述根据所述用户活跃因子、所述目标热度衰减曲线对所述第一参考数据曲线进行调节,得到第二参考数据曲线方面,上述程序包括用于执行以下步骤的指令:
对所述第一参考数据曲线进行采样,得到至少一个采样点;
根据所述用户活跃因子对所述至少一个采样点中的每一采样点进行左右移动操作;
根据所述目标热度衰减曲线对所述至少一个采样点中的每一采样点进行上下移动操作;
将移动后的所述至少一个采样点进行重新拟合,得到所述第二参考数据曲线。
可以看出,本申请实施例中所描述的服务器,获取目标网站的预设时间段的第一访问数据,第一访问数据包括用户信息以及该用户信息对应的访问数据,根据用户信息对第一访问数据进行分类,得到多类访问数据,获取多类访问数据中每一类访问数据的权重,得到多个权重值,根据多类访问数据和多个权重值确定目标网站的目标流量值,可以对访问数据进行分类,并对每一类赋予不同的权重,进而,实现了对流量进行深入分析,以提升流量监控效率。
图4是本申请实施例中所涉及的网络流量分析装置400的功能单元组成框图。该网络流量分析装置400,所述装置400包括:第一获取单元401、分类单元402、第二获取单元403和确定单元404,其中,
所述第一获取单元401,用于获取目标网站的预设时间段的第一访问数据,所述第一访问数据包括用户信息以及该用户信息对应的访问数据;
所述分类单元402,用于根据所述用户信息对所述第一访问数据进行分类,得到多类访问数据;
所述第二获取单元403,用于获取所述多类访问数据中每一类访问数据的权重,得到多个权重值;
所述确定单元404,用于根据所述多类访问数据和所述多个权重值确定所述目标网站的目标流量值。
可选的,在所述用户信息为用户年龄时,在所述根据所述用户信息对所述第一访问数据进行分类,得到多类访问数据方面,所述分类单元402具体用于:
从所述第一访问数据中筛选出访问时长处于预设范围的访问数据,得到第二访问数据;
根据所述用户年龄对所述第二访问数据进行分类,得到多类访问数据。
可选的,在所述根据所述多类访问数据和所述多个权重值确定所述目标网站的目标流量值方面,所述确定单元404具体用于:
获取所述多类访问数据中每一访问数据对应的注视数据,得到多个注视数据;
确定所述多个注视数据中每一注视数据对应的影响因子,得到多个影响因子;
根据所述多类访问数据、所述多个权重值以及所述多个影响因子确定所述目标网站的目标流量值。
可选的,在所述根据所述多类访问数据和所述多个权重值确定所述目标网站的目标流量值方面,所述确定单元404具体用于:
将所述第一访问数据对应的每一用户的位置投影到访问地图中,得到多个投影点;
将所述访问地图划分为P个区域,所述P为大于1的整数;
根据所述多个投影点确定所述P个区域中每一区域的访问密度,得到P个访问密度;
确定所述目标网站的业务区域,得到Q个区域,所述Q个区域为所述P个区域中的部分或者全部区域;
从所述P个访问密度中获取与所述Q个区域对应的访问密度,得到Q个访问密度;
根据所述Q个访问密度确定目标均方差;
根据所述多类访问数据和所述多个权重值确定参考流量值;
根据所述目标均方差优化所述参考流量值,得到所述目标流量值。
可选的,在所述根据所述多类访问数据和所述多个权重值确定所述目标网站的目标流量值之后,所述装置400还具体用于:
确定所述第一访问数据对应的访问数据曲线,所述访问数据曲线的横轴为时间,纵轴为访问数据;
根据所述访问数据曲线确定预设预测时段的第一参考数据曲线;
获取所述预设预测时段对应的历史参考访问数据;
根据所述历史参考访问数据确定用户活跃因子;
获取所述目标网站对应的目标关键词对应的目标热度衰减曲线;
根据所述用户活跃因子、所述目标热度衰减曲线对所述第一参考数据曲线进行调节,得到第二参考数据曲线;
根据所述第二参考数据曲线确定所述预设预测时段的预测流量值。
可选的,在所述根据所述用户活跃因子、所述目标热度衰减曲线对所述第一参考数据曲线进行调节,得到第二参考数据曲线方面,所述装置400还具体用于:
对所述第一参考数据曲线进行采样,得到至少一个采样点;
根据所述用户活跃因子对所述至少一个采样点中的每一采样点进行左右移动操作;
根据所述目标热度衰减曲线对所述至少一个采样点中的每一采样点进行上下移动操作;
将移动后的所述至少一个采样点进行重新拟合,得到所述第二参考数据曲线。
可以看出,本申请实施例中所描述的网络流量分析装置,获取目标网站的预设时间段的第一访问数据,第一访问数据包括用户信息以及该用户信息对应的访问数据,根据用户信息对第一访问数据进行分类,得到多类访问数据,获取多类访问数据中每一类访问数据的权重,得到多个权重值,根据多类访问数据和多个权重值确定目标网站的目标流量值,可以对访问数据进行分类,并对每一类赋予不同的权重,进而,实现了对流量进行深入分析,以提升流量监控效率。
可以理解的是,本实施例的网络流量分析装置的各程序模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。
本申请实施例还提供一种计算机程序产品,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例上述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory ,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种网络流量分析方法,其特征在于,所述方法包括:
获取目标网站的预设时间段的第一访问数据,所述第一访问数据包括用户信息以及该用户信息对应的访问数据;
根据所述用户信息对所述第一访问数据进行分类,得到多类访问数据;
获取所述多类访问数据中每一类访问数据的权重,得到多个权重值;
根据所述多类访问数据和所述多个权重值确定所述目标网站的目标流量值。
2.根据权利要求1所述的方法,其特征在于,在所述用户信息为用户年龄时,所述根据所述用户信息对所述第一访问数据进行分类,得到多类访问数据,包括:
从所述第一访问数据中筛选出访问时长处于预设范围的访问数据,得到第二访问数据;
根据所述用户年龄对所述第二访问数据进行分类,得到多类访问数据。
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述多类访问数据和所述多个权重值确定所述目标网站的目标流量值,包括:
获取所述多类访问数据中每一访问数据对应的注视数据,得到多个注视数据;
确定所述多个注视数据中每一注视数据对应的影响因子,得到多个影响因子;
根据所述多类访问数据、所述多个权重值以及所述多个影响因子确定所述目标网站的目标流量值。
4.根据权利要求1或2所述的方法,其特征在于,所述根据所述多类访问数据和所述多个权重值确定所述目标网站的目标流量值,包括:
将所述第一访问数据对应的每一用户的位置投影到访问地图中,得到多个投影点;
将所述访问地图划分为P个区域,所述P为大于1的整数;
根据所述多个投影点确定所述P个区域中每一区域的访问密度,得到P个访问密度;
确定所述目标网站的业务区域,得到Q个区域,所述Q个区域为所述P个区域中的部分或者全部区域;
从所述P个访问密度中获取与所述Q个区域对应的访问密度,得到Q个访问密度;
根据所述Q个访问密度确定目标均方差;
根据所述多类访问数据和所述多个权重值确定参考流量值;
根据所述目标均方差优化所述参考流量值,得到所述目标流量值。
5.根据权利要求1或2所述的方法,其特征在于,在所述根据所述多类访问数据和所述多个权重值确定所述目标网站的目标流量值之后,所述方法还包括:
确定所述第一访问数据对应的访问数据曲线,所述访问数据曲线的横轴为时间,纵轴为访问数据;
根据所述访问数据曲线确定预设预测时段的第一参考数据曲线;
获取所述预设预测时段对应的历史参考访问数据;
根据所述历史参考访问数据确定用户活跃因子;
获取所述目标网站对应的目标关键词对应的目标热度衰减曲线;
根据所述用户活跃因子、所述目标热度衰减曲线对所述第一参考数据曲线进行调节,得到第二参考数据曲线;
根据所述第二参考数据曲线确定所述预设预测时段的预测流量值。
6.根据权利要求5所述的方法,其特征在于,所述根据所述用户活跃因子、所述目标热度衰减曲线对所述第一参考数据曲线进行调节,得到第二参考数据曲线,包括:
对所述第一参考数据曲线进行采样,得到至少一个采样点;
根据所述用户活跃因子对所述至少一个采样点中的每一采样点进行左右移动操作;
根据所述目标热度衰减曲线对所述至少一个采样点中的每一采样点进行上下移动操作;
将移动后的所述至少一个采样点进行重新拟合,得到所述第二参考数据曲线。
7.一种网络流量分析装置,其特征在于,所述装置包括:第一获取单元、分类单元、第二获取单元和确定单元,其中,
所述第一获取单元,用于获取目标网站的预设时间段的第一访问数据,所述第一访问数据包括用户信息以及该用户信息对应的访问数据;
所述分类单元,用于根据所述用户信息对所述第一访问数据进行分类,得到多类访问数据;
所述第二获取单元,用于获取所述多类访问数据中每一类访问数据的权重,得到多个权重值;
所述确定单元,用于根据所述多类访问数据和所述多个权重值确定所述目标网站的目标流量值。
8.根据权利要求7所述的装置,其特征在于,在所述用户信息为用户年龄时,在所述根据所述用户信息对所述第一访问数据进行分类,得到多类访问数据方面,所述分类单元具体用于:
从所述第一访问数据中筛选出访问时长处于预设范围的访问数据,得到第二访问数据;
根据所述用户年龄对所述第二访问数据进行分类,得到多类访问数据。
9.一种服务器,其特征在于,包括处理器、存储器,所述存储器用于存储一个或多个程序,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1-6任一项所述的方法中的步骤的指令。
10.一种计算机可读存储介质,其特征在于,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1-6任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110856692.XA CN113315670B (zh) | 2021-07-28 | 2021-07-28 | 网络流量分析方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110856692.XA CN113315670B (zh) | 2021-07-28 | 2021-07-28 | 网络流量分析方法、装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113315670A true CN113315670A (zh) | 2021-08-27 |
CN113315670B CN113315670B (zh) | 2021-10-01 |
Family
ID=77381870
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110856692.XA Active CN113315670B (zh) | 2021-07-28 | 2021-07-28 | 网络流量分析方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113315670B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114817820A (zh) * | 2022-06-30 | 2022-07-29 | 深圳希施玛数据科技有限公司 | 网站数据升级的预警方法及相关装置 |
CN118101498A (zh) * | 2024-04-29 | 2024-05-28 | 深圳市海域达赫科技有限公司 | 基于大数据的网络流量预测方法、设备、系统及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040158429A1 (en) * | 2003-02-10 | 2004-08-12 | Bary Emad Abdel | Method and system for classifying content and prioritizing web site content issues |
CN102541892A (zh) * | 2010-12-22 | 2012-07-04 | 北京凯思昊鹏软件工程技术有限公司 | 记录和分析用户行为特征的方法 |
US8782166B1 (en) * | 2011-07-20 | 2014-07-15 | Google Inc. | System for generating a site pathing report based on real-time analytics data |
US20150201031A1 (en) * | 2012-01-27 | 2015-07-16 | Compete, Inc. | Dynamic normalization of internet traffic |
US20160203211A1 (en) * | 2013-02-18 | 2016-07-14 | PlaceIQ, Inc. | Geolocation data analytics on multi-group populations of user computing devices |
CN106664254A (zh) * | 2014-08-21 | 2017-05-10 | 七网络有限责任公司 | 优化移动网络中的网络流量管理 |
-
2021
- 2021-07-28 CN CN202110856692.XA patent/CN113315670B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040158429A1 (en) * | 2003-02-10 | 2004-08-12 | Bary Emad Abdel | Method and system for classifying content and prioritizing web site content issues |
CN102541892A (zh) * | 2010-12-22 | 2012-07-04 | 北京凯思昊鹏软件工程技术有限公司 | 记录和分析用户行为特征的方法 |
US8782166B1 (en) * | 2011-07-20 | 2014-07-15 | Google Inc. | System for generating a site pathing report based on real-time analytics data |
US20150201031A1 (en) * | 2012-01-27 | 2015-07-16 | Compete, Inc. | Dynamic normalization of internet traffic |
US20160203211A1 (en) * | 2013-02-18 | 2016-07-14 | PlaceIQ, Inc. | Geolocation data analytics on multi-group populations of user computing devices |
CN106664254A (zh) * | 2014-08-21 | 2017-05-10 | 七网络有限责任公司 | 优化移动网络中的网络流量管理 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114817820A (zh) * | 2022-06-30 | 2022-07-29 | 深圳希施玛数据科技有限公司 | 网站数据升级的预警方法及相关装置 |
CN114817820B (zh) * | 2022-06-30 | 2022-10-14 | 深圳希施玛数据科技有限公司 | 网站数据升级的预警方法及相关装置 |
CN118101498A (zh) * | 2024-04-29 | 2024-05-28 | 深圳市海域达赫科技有限公司 | 基于大数据的网络流量预测方法、设备、系统及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113315670B (zh) | 2021-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107273489B (zh) | 内容推送方法、电子设备及计算机存储介质 | |
US11463476B2 (en) | Character string classification method and system, and character string classification device | |
CN113315670B (zh) | 网络流量分析方法、装置及存储介质 | |
CN107862022B (zh) | 文化资源推荐系统 | |
US8849798B2 (en) | Sampling analysis of search queries | |
CN106022505A (zh) | 一种预测用户离网的方法及装置 | |
US9256692B2 (en) | Clickstreams and website classification | |
US20220383427A1 (en) | Method and apparatus for group display | |
US20080195609A1 (en) | Method and System for Generating a Population Representative of a Set of Users of a Communication Network | |
CN105095411B (zh) | 一种基于app质量的app排名预测方法及系统 | |
CN108416616A (zh) | 投诉举报类别的排序方法和装置 | |
CN105224691B (zh) | 一种信息处理方法及装置 | |
WO2007127957A2 (en) | System and method for flagging information content | |
CN108763274A (zh) | 访问请求的识别方法、装置、电子设备及存储介质 | |
CN113383362A (zh) | 用户识别方法及相关产品 | |
CN109446431A (zh) | 用于信息推荐的方法、装置、介质、和计算设备 | |
CN112131507A (zh) | 网站内容处理方法、装置、服务器和计算机可读存储介质 | |
US20140129490A1 (en) | Image url-based junk detection | |
CN111949397A (zh) | 虚拟机资源配置方法及装置 | |
US8719934B2 (en) | Methods, systems and media for detecting non-intended traffic using co-visitation information | |
CN107526748A (zh) | 一种识别用户点击行为的方法和设备 | |
CN105989019B (zh) | 一种清洗数据的方法及装置 | |
CN117596621A (zh) | 上网满意度预测方法、装置、电子设备及计算机存储介质 | |
CN108694171A (zh) | 信息推送的方法及装置 | |
CN114039944A (zh) | 网站访问地址选取方法、设备、存储介质及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |