CN113420906A - 流量预测方法、装置及存储介质 - Google Patents

流量预测方法、装置及存储介质 Download PDF

Info

Publication number
CN113420906A
CN113420906A CN202110572395.2A CN202110572395A CN113420906A CN 113420906 A CN113420906 A CN 113420906A CN 202110572395 A CN202110572395 A CN 202110572395A CN 113420906 A CN113420906 A CN 113420906A
Authority
CN
China
Prior art keywords
flow data
target
sample
information
dimension
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110572395.2A
Other languages
English (en)
Inventor
肖翔
李宗尚
孙孝雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Wodong Tianjun Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN202110572395.2A priority Critical patent/CN113420906A/zh
Publication of CN113420906A publication Critical patent/CN113420906A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24575Query processing with adaptation to user needs using context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/01Customer relationship services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Theoretical Computer Science (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明提供了一种流量预测方法、装置及存储介质;通过获取多个第一时间段分别对应的样本流量数据;采用预测模型对多个样本流量数据进行预测,得到目标时间段的预测流量数据;提取预测流量数据的目标特征信息,并基于目标特征信息确定出与预测流量数据相似度最大的目标参考流量数据;基于目标参考流量数据在至少一个维度上的流量占比信息,确定预测流量数据分别对应至少一个维度的目标流量信息,由于目标参考流量数据是与预测流量数据在各个维度上都相似度最大的流量数据,再根据目标参考流量数据在至少一个维度上的流量分布信息来对应确定预测流量数据对应维度上的流量数据,进而可以提高的预测流量数据在对应维度上的流量数据预测精度。

Description

流量预测方法、装置及存储介质
技术领域
本发明实施例涉及互联网技术领域,尤其涉及一种流量预测方法、装置及存储介质。
背景技术
目前,随着互联网行业的高速发展,用户在网络上的行为已经做到了可监督、可记录、可回溯。通过一次次的点击、浏览行为,用户流转变成了信息流,而对于企业而言,如何最小成本的应对信息流,成为了降本增效的关键。这就催生了时序流量预测在行业内的发展,包括在客服、广告、物流等多个业务场景下,流量预测已经展开应用。
现有技术中,一个大的整体流量下有较多细分方向的流量,不仅需要知道整体的流量,也需要知道小的流量。目前主流办法有两种,一种自顶向下,预测整体的流量,然后根据预设置好的比例将整体流量拆分成为小的流量,这种不能很好的应对每日比例变化的情况,误差较大。一种是自底向上,通过预测每个细分方向的小流量,最终加起来成为整体流量,这种的缺点在于,小流量量级太小,预测误差极大,累加后会放大误差。现有技术中的问题是对整体流量下的细分方向的流量预测误差较大。
发明内容
本发明实施例提供的一种流量预测方法、装置及存储介质,可以提高整体流量下的细分方向的流量预测精度。
本发明的技术方案是这样实现的:
本发明实施例提供了一种流量预测方法,包括:
获取第一预设时间段内的多个第一时间段对应的多个样本流量数据;每个样本流量数据表征对应的第一时间段在至少一个维度上的流量分布信息;
采用预测模型对所述多个样本流量数据进行预测,得到目标时间段的预测流量数据;所述预测流量数据表征所述目标时间段在所述至少一个维度上的预测流量分布信息;
提取所述预测流量数据的目标特征信息,并基于所述目标特征信息,在多个参考流量数据中,确定出与所述预测流量数据相似度最大的目标参考流量数据;所述多个参考流量数据为第二预设时间段内的多个第二时间段对应的流量数据;所述第二预设时间段包含所述第一预设时间段;
基于所述目标参考流量数据在所述至少一个维度上的流量占比信息,确定所述预测流量数据分别对应所述至少一个维度的目标流量信息。
上述方案中,所述提取所述预测流量数据的目标特征信息,并基于所述目标特征信息,在多个参考流量数据中,确定出与所述预测流量数据相似度最大的目标参考流量数据,包括:
从所述预测流量数据中提取目标特征信息,并基于所述目标特征信息,在所述多个样本流量数据中,确定与所述预测流量数据相似度最大的目标样本流量数据;
从所述目标样本流量数据中提取目标样本特征信息,并基于所述目标样本特征信息,在所述多个参考流量数据中,确定所述目标参考流量数据。
上述方案中,所述目标特征信息包括:目标维度特征信息;
所述从所述预测流量数据中提取目标特征信息,并基于所述目标特征信息,在所述多个样本流量数据中确定,与所述预测流量数据相似度最大的目标样本流量数据,包括:
提取所述预测流量数据在任意一个维度上的目标维度特征信息;
提取所述多个样本流量数据在所述预测流量数据的对应维度上对应的多个样本特征信息;
对所述目标维度特征信息分别和所述多个样本特征信息进行相似计算,确定与所述预测流量数据相似度最大的所述目标样本流量数据。
上述方案中,所述至少一个维度包括:时间维度和业务维度;所述目标维度特征信息包括:目标时间向量和目标业务向量中的任意一个;
所述提取所述预测流量数据在任意一个维度上的目标维度特征信息,包括以下之一:
将所述预测流量数据在所述时间维度上的多个时间段的流量数据比上,预设时间段的预设时间流量数据,得到对应所述多个时间段的多个预设时间点信息;
将所述多个预设时间点信息结合,得到所述目标时间向量;
将所述预测流量数据在所述业务维度上的多个业务对应的流量数据比上,预设业务对应的预设业务流量数据,得到对应所述多个业务的多个预设业务点信息;
将所述多个预设业务点信息结合,得到所述目标业务向量。
上述方案中,所述样本特征向量包括:样本时间向量和样本业务向量中的任意一个;
所述提取所述多个样本流量数据在所述预测流量数据的对应维度上对应的多个样本特征信息,包括以下之一:
在所述时间维度上,将所述多个样本流量数据中的每个样本流量数据在多个时间段的流量数据比上,预设时间段的预设时间流量数据,得到对应所述多个时间段的多个预设样本时间点信息;
将所述多个预设样本时间点信息结合,得到所述多个样本流量数据对应的多个样本时间向量;
在所述业务维度上,将所述多个样本流量数据中的每个样本流量数据在多个业务对应的流量数据比上,预设业务的预设业务流量数据,得到对应所述多个业务的多个预设样本业务点信息;
将所述多个预设样本业务点信息结合,得到所述多个样本流量数据对应的所述多个样本业务向量。
上述方案中,所述对所述目标维度特征信息分别和所述多个样本特征信息进行相似计算,确定与所述预测流量数据相似度最大的所述目标样本流量数据,包括以下之一:
对所述目标时间向量分别和所述多个样本时间向量进行相似计算,得到所述目标时间向量分别和所述多个样本时间向量之间的第一余弦距离,确定对应最大所述第一余弦距离对应的所述目标样本流量数据;
对所述目标业务向量分别和所述多个样本业务向量进行相似计算,得到所述目标业务向量分别和所述多个样本业务向量之间的第二余弦距离,确定对应最大所述第二余弦距离对应的所述目标样本流量数据。
上述方案中,所述从所述目标样本流量数据中提取目标样本特征信息,并基于所述目标样本特征信息,在所述多个参考流量数据中确定所述目标参考流量数据,包括:
基于第三预设时间段内的多个流量数据,计算得到所述目标样本特征信息;所述第三预设时间段为所述目标样本流量数据对应的所述第一时间段之前的时间段;所述多个流量数据为所述第三预设时间段内的多个第三时间段分别对应的流量数据;
对所述目标样本特征信息分别和所述多个参考特征信息进行相似计算,确定与所述目标样本流量数据相似度最大的所述目标参考流量数据;所述多个参考特征信息为预存的所述多个参考流量数据对应的参考信息。
上述方案中,所述基于第三预设时间段内的多个流量数据,计算得到所述目标样本特征信息,包括:
将所述多个流量数据分别比上所述多个流量数据中的预设流量数据,得到分别对应所述多个流量数据的目标样本点信息;所述预设流量数据表征所述多个流量数据中的最大或者最小流量数据;
获取所述第三预设时间段中的所述多个第三时间段分别对应的外部点信息;所述外部点信息表征所述多个第三时间段分别对应的交易活动数量信息;
将多个目标样本点信息和多个外部点信息结合,得到所述目标样本特征信息。
上述方案中,所述对所述目标样本特征信息分别和所述多个参考特征信息进行相似计算,确定与所述目标样本流量数据相似度最大的所述目标参考流量数据,包括:
对所述目标样本特征信息分别和所述多个参考特征信息进行相似计算,得到所述目标样本特征信息分别和所述多个参考特征信息之间的第三余弦距离,确定对应最大所述第三余弦距离对应的目标参考流量数据。
上述方案中,所述至少一个维度包括:时间维度和业务维度;所述流量占比信息包括:时间流量占比信息和业务流量占比信息;所述目标流量信息包括:目标时间流量信息和目标业务流量信息;
所述基于所述目标参考流量数据在所述至少一个维度上的流量占比信息,确定所述预测流量数据分别对应所述至少一个维度的目标流量信息,包括以下至少一个:
获取所述目标参考流量数据在所述时间维度上的多个时间段的多个所述时间流量占比信息,并将多个所述时间流量占比信息乘以所述预测流量数据,得到所述预测流量数据在所述时间维度上的多个时间段内的目标时间流量信息;
获取所述目标参考流量数据在所述业务维度上的多个业务对应的多个业务流量占比信息,并将多个所述业务流量占比信息乘以所述预测流量数据,得到所述预测流量数据在所述业务维度上的多个业务对应的目标业务流量信息。
本发明实施例还提供了一种流量预测装置,包括:
数据获取单元,用于获取第一预设时间段内的多个第一时间段分别对应的样本流量数据;所述样本流量数据表征对应的第一时间段在至少一个维度上的流量分布信息;
预测单元,用于采用预测模型对多个样本流量数据进行预测,得到目标时间段的预测流量数据;所述预测流量数据表征所述目标时间段在所述至少一个维度上的预测流量分布信息;
第一处理单元,用于提取所述预测流量数据的目标特征信息,并基于所述目标特征信息,在多个参考流量数据中,确定出与所述预测流量数据相似度最大的目标参考流量数据;所述多个参考流量数据为第二预设时间段内的多个第二时间段分别对应的参考流量数据;所述第二预设时间段包含所述第一预设时间段;
第二处理单元,用于基于所述目标参考流量数据在所述至少一个维度上的所述流量占比信息,确定所述预测流量数据分别对应所述至少一个维度的目标流量信息。
本发明实施例还提供了一种流量预测装置,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行上述方法中的步骤。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述方法中的步骤。
本发明实施例中,通过获取第一预设时间段内的多个第一时间段分别对应的样本流量数据;采用预测模型对多个样本流量数据进行预测,得到目标时间段的预测流量数据;提取预测流量数据的目标特征信息,并基于目标特征信息确定出与预测流量数据相似度最大的目标参考流量数据;基于目标参考流量数据在至少一个维度上的流量占比信息,确定预测流量数据分别对应至少一个维度的目标流量信息,由于目标参考流量数据是与预测流量数据在各个维度上都相似度最大的流量数据,再根据目标参考流量数据在至少一个维度上的流量分布信息来对应确定预测流量数据对应维度上的流量数据,进而可以提高的预测流量数据在对应维度上的流量数据预测精度。
附图说明
图1为现有技术流量预测方法的效果示意图一;
图2为现有技术流量预测方法的效果示意图二;
图3为本发明实施例提供的流量预测方法的一个可选的流程示意图;
图4为本发明实施例提供的流量预测方法的一个可选的效果示意图;
图5为本发明实施例提供的流量预测方法的一个可选的流程示意图;
图6为本发明实施例提供的流量预测方法的一个可选的流程示意图;
图7为本发明实施例提供的流量预测方法的一个可选的流程示意图;
图8为本发明实施例提供的流量预测方法的一个可选的效果示意图;
图9为本发明实施例提供的流量预测方法的一个可选的流程示意图;
图10为本发明实施例提供的流量预测方法的一个可选的流程示意图;
图11为本发明实施例提供的流量预测方法的一个可选的流程示意图;
图12为本发明实施例提供的流量预测方法的一个可选的流程示意图;
图13为本发明实施例提供的流量预测方法的一个可选的效果示意图;
图14为本发明实施例提供的流量预测方法的一个可选的流程示意图;
图15为本发明实施例提供的流量预测装置的结构示意图;
图16为本发明实施例提供的流量预测装置的一种硬件实体示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和实施例对本发明的技术方案进一步详细阐述,所描述的实施例不应视为对本发明的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
如果发明文件中出现“第一/第二”的类似描述则增加以下的说明,在以下的描述中,所涉及的术语“第一\第二\第三”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本发明实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本发明实施例的目的,不是旨在限制本发明。
现有技术中流量预测方法包括两种,一种是单步滚动式预测,另一种是多步输出预测。结合图1,为现有技术流量预测方法的效果示意图一。其中,单步滚动式预测模型会训练一个单步预测模型,即单步滚动式预测模型的一次预测只输出一个时间点的流量预测值。在服务器需要预测时间N+1和时间N+2对应的流量预测值时。服务器将时间1、时间2、…、和时间N对应的流量值输入单步滚动式预测模型,然后单步滚动式预测模型会输出时间N+1对应的流量预测值。服务器再根据时间N+1对应的预设比例确定时间N+1对应的细分流量值。服务器再将时间2、时间3、…、时间N、时间N+1对应的流量值输入单步滚动式预测模型,然后单步滚动式预测模型会输出时间N+2对应的流量预测值。服务器再根据时间N+1对应的预设比例确定时间N+1对应的细分流量值。单步滚动式预测每次只预测未来一个时间点的流量值,然后以预测出的时间点的预测值为新特征,继续预测下一个时间点的流量值。在这种情况下,预测来的时序特征点就都没有真实数据了,因此误差也会累积较大。整体流量的细分流量的预测误差也较大。结合图2,为现有技术流量预测方法的效果示意图二。多步输出预测是相当于训练了x个模型,x为需要预测的时间点的个数。服务器将时间1、时间2…和时间N对应的流量值输入时间N+1对应的多步输出预测模型。然后该多步输出预测模型会输出时间N+1对应的流量预测值。服务器再根据时间N+1对应的预设比例确定时间N+1对应的细分流量值。服务器再将时间1、时间2…和时间N对应的流量值输入时间N+2对应的多步输出预测模型。然后该多步输出预测模型会输出时间N+2对应的流量预测值。服务器再根据时间N+2对应的预设比例确定时间N+2对应的细分流量值。
上述技术方案中,服务器是根据预设比例确定细分流量的,这种方案不能很好的应对每日比例变化的情况,误差较大。
为了解决上述技术问题,本发明实施例提供了一种流量预测方法。图3为本发明实施例提供的流量预测方法的一个可选的流程示意图,将结合图3示出的步骤进行说明。
S101、获取第一预设时间段内的多个第一时间段对应的多个样本流量数据。
本发明实施例中,服务器在自身的数据库中提取第一预设时间段内的多个第一时间段分别对应的样本流量数据。其中,样本流量数据表征对应的第一时间段在至少一个维度上的流量分布信息。
本发明实施例中,服务器可以承载多个客户端。多个客户端在第一预设时间段内的多个第一时间段都会将自身的流量数据上传至服务器的数据库。服务器在对应的数据库内提取出第一预设时间段内的多个第一时间段内的多个客户端的流量数据。服务器将多个客户端的流量数据汇总形成了对应每个第一时间段的样本流量数据。其中,样本流量数据表征对应的第一时间段内多个客户端在至少一个维度上的流量分布信息。
本发明实施例中,服务器通过多个样本流量数据预测目标时间段的预测流量数据。其中,第一预设时间段为目标时间段之前的时间段。第一时间段和目标时间段的长度周期相同。
示例性的,目标时间段可以为星期一,第一预设时间段可以为上周的星期一至上周的星期天,其中,第一时间段可以为上周的星期一或者上周的星期二等。
S102、采用预测模型对多个样本流量数据进行预测,得到目标时间段的预测流量数据。
本发明实施例中,服务器将多个第一时间段对应的多个样本流量数据输入已经训练好的预测模型。服务器通过预测模型输出目标时间段的预测流量数据。
本发明实施例中,服务器可以将多个样本流量数据输入渐进梯度回归树模型(Gradient BoostRegression Tree,GBRT)。服务器通过GBRT输出目标时间段的预测流量数据。
本发明实施例中,服务器可以将多个样本流量数据输入渐进梯度决策树模型(Gradient BoostDecision Tree,GBDT)。服务器通过GBDT输出目标时间段的预测流量数据。
本发明实施例中,服务器可以将多个样本流量数据输入多决策回归树模型(MultipleAdditive Regression Tree,MART),服务器通过MART输出目标时间段的预测流量数据。
其中,预测流量数据表征目标时间段的多个客户端在至少一个维度上的预测流量分布信息。示例性的,预测流量数据可以表征目标时间段的多个客户端在时间维度上的多个时间段内的预测流量分布信息。预测流量数据也可以表征目标时间端的多个客户端在业务维度上的多个业务对应的预测流量分布信息。
示例性的,结合图4,为本发明实施例提供的流量预测方法的一个可选的效果示意图。服务器得到周三的预测流量数据。服务器首先在数据库内提取样本流量数据,也就是周一和周二的样本流量数据。
其中,周一的样本流量数据包括:周一的流量数据在0点、1点、2点、…、24点各个时间段内的流量数据或者周一的流量数据对应业务1、业务2、业务3、…、业务n的流量数据。
其中,周二的样本流量数据包括:周二的流量数据在0点、1点、2点、…、24点各个时间段内的流量数据或者周二的流量数据对应业务1、业务2、业务3、…、业务n的流量数据。服务器将周一的样本流量数据和二的样本流量数据输入预测模型可以得到周三的预测流量数据。周三的预测流量数据包括:周三的预测流量数据在0点、1点、2点、…、24点各个时间段内的流量数据或者周三的预测流量数据对应业务1、业务2、业务3、…、业务n的流量数据。
S103、提取预测流量数据的目标特征信息,并基于目标特征信息,在多个参考流量数据中,确定出与预测流量数据相似度最大的目标参考流量数据。
本发明实施例中,首先,服务器需要计算出第二预设时间段内的多个第二时间段分别对应的参考流量数据对应的参考特征信息。服务器计算出预测流量数据对应的目标特征信息。服务器对目标特征信息分别和多个参考特征信息进行相似性计算,得到了分别对应多个参考流量数据的相似度。服务器确定对应最小相似度的目标参考流量数据。
其中,第二预设时间段可以包含第一预设时间段。示例性的,第一预设时间段可以为目标时间段之前的一个星期,那么,相应的第二预设时间段可以为目标时间段之前的一个月或者一年。
其中,参考流量数据可以为对应的第二时间段内多个客户端的流量在至少一个维度上的流量分布信息。
本发明实施例中,服务器首先计算出多个样本流量数据对应的样本特征信息。服务器再计算出预测流量数据的目标特征信息。服务器对目标特征信息分别和多个样本特征信息进行相似性计算,得到了预测流量数据分别对应多个样本流量数据的相似度。服务器确定最大的相似度对应的样本流量数据为目标样本流量数据。服务器将目标样本流量数据对应的目标样本特征信息分别和预存的多个参考特征信息进行相似性计算,得到了目标样本流量数据分别对应多个参考流量数据的相似度。服务器确定最大的相似度对应的参考流量数据为目标参考流量数据。
S104、基于目标参考流量数据在至少一个维度上的流量占比信息,确定预测流量数据分别对应至少一个维度的目标流量信息。
本发明实施例中,服务器获取目标参考流量数据在至少一个维度上的流量分布信息。其中,流量分布信息可以为目标参考流量数据在至少一个维度上的流量占比信息。服务器通过流量分布信息和预测流量数据计算得到,预测流量数据分别对应至少一个维度上的各个分段的目标流量信息。
其中,至少一个维度可以包括时间维度和业务维度。
本发明实施例中,服务器可以获取目标参考流量数据在时间维度上的各个时间段的流量占比信息。示例性的,一个时间段的流量占比信息可以为:1%。服务器将预测流量数据乘以各个时间段对应的流量占比信息可以得到预测流量数据分别对应各个时间段的目标流量信息。
本发明实施例中,服务器可以获取目标参考流量数据在业务维度上对应各个业务的流量占比信息。服务器将预测流量数据乘以各个业务对应的流量占比信息可以得到预测流量数据分别对应各个业务的目标流量信息。
本发明实施例中,通过获取多个第一时间段分别对应的样本流量数据;采用预测模型对多个样本流量数据进行预测,得到目标时间段的预测流量数据;提取预测流量数据的目标特征信息,并基于目标特征信息确定出与预测流量数据相似度最大的目标参考流量数据;基于目标参考流量数据在至少一个维度上的流量占比信息,确定预测流量数据分别对应至少一个维度的目标流量信息,由于目标参考流量数据是与预测流量数据在各个维度上都相似度最大的流量数据,再根据目标参考流量数据在至少一个维度上的流量分布信息来对应确定预测流量数据对应维度上的流量数据,进而可以提高的预测流量数据在对应维度上的流量数据预测精度。
在一些实施例中,参见图5,图5为本发明实施例提供的流量预测方法的一个可选的流程示意图,图3示出的S103可以通过S105至S106实现,将结合各步骤进行说明。
S105、从预测流量数据中提取目标特征信息,并基于目标特征信息,在多个样本流量数据中,确定与预测流量数据相似度最大的目标样本流量数据。
本发明实施例中,服务器可以在预测流量数据中提取出对应的目标特征信息。其中目标特征信息可以为预测流量数据对应的多维向量。服务器再计算出多个样本流量数据分别对应样本特征信息。服务器对目标特征信息和多个样本特征信息进行相似性计算,得到了预测流量数据分别对应多个样本流量数据的相似度。服务器确定最大相似度对应的样本流量数据为目标样本流量数据。
本发明实施例中,服务器获取到预测流量数据在时间维度上的多个时间段的流量数据。服务器对多个时间段的流量数据进行归一化计算,将多个时间段的流量数据统一到一个量级,得到了对应多个时间段的预设时间点信息。服务器可以结合多个预设时间点信息得到预测流量数据的目标特征信息。相应的,服务器可以通过相似的方法计算得到样本流量数据的样本特征信息。
S106、从目标样本流量数据中提取目标样本特征信息,并基于目标样本特征信息,在多个参考流量数据中,确定目标参考流量数据。
本发明实施例中,服务器首先需要从多个参考流量数据中提取出对应的参考特征信息。服务器将多个参考特征信息进行存储。服务器再提取出目标样本流量数据的目标样本特征信息。服务器将标样本特征信息分别对应多个参考特征信息进行相似性计算。服务器得到了目标样本特征数据分别对应多个参考流量数据的相似度。服务器确定最大相似度对应的参考流量数据为目标参考流量数据。
本发明实施例中,服务器可以提取得到目标样本流量数据对应的第一时间段之前的第三预设时间段内的多个第三时间段对应的多个流量数据。服务器将该多个流量数据进行计算处理得到对应目标样本流量数据的目标样本特征信息。相应的,服务器可以通过相同的方法计算得到参考流量数据对应的参考特征信息。需要说明的是。服务器在计算参考特征信息时,需要对应提取每个参考流量数据对应的第二时间段之前的第三预设时间段内的多个流量数据。
本发明实施例中,服务器首先通过预测流量数据的目标特征信息在多个样本流量数据中确定出目标样本流量数据,并基于目标样本流量数据的目标样本特征信息,在多个参考流量数据中确定出与预测流量最相似的目标参考流量数据,由于参考流量数据所属的时间段大于第一预设时间段,则本方案确定的目标参考流量数据与预测流量数据的相似度更加接近。
在一些实施例中,参见图6,图6为本发明实施例提供的流量预测方法的一个可选的流程示意图,图5示出的S105可以通过S107至S109实现,将结合各步骤进行说明。
S107、提取预测流量数据在任意一个维度上的目标维度特征信息。
本发明实施例中,服务器可以通过计算预测流量数据在任意一个维度上的多个节点的流量数据,得到预测流量数据在任意一个维度上的目标特征信息。
本发明实施例中,至少一个维度可以包括时间维度和业务维度。服务器可以通过计算预测流量数据在时间维度上的多个时间段上的流量数据,得到预测流量数据在时间维度上的目标特征信息。
本发明实施例中,服务器可以通过计算预测流量数据在业务维度上对应多个业务的流量数据,得到预测流量数据在业务维度上的目标特征信息。
S108、提取多个样本流量数据在预测流量数据的对应维度上对应的多个样本特征信息。
本发明实施例中,服务器若在S107中计算得到了预测流量数据在时间维度上的目标特征信息,则服务器就在S108中计算得到多个样本流量数据在时间维度上分别对应的样本特征信息。
本发明实施例中,服务器若在S107中计算得到了预测流量数据在业务维度上的目标特征信息,则服务器就在S108中计算得到多个样本流量数据在业务维度上分别对应的样本特征信息。
S109、对目标维度特征信息分别和多个样本特征信息进行相似计算,确定与预测流量数据相似度最大的目标样本流量数据。
本发明实施例中,服务器可以将时间维度上的目标特征信息分别和时间维度上的多个样本特征信息进行相似性计算,得到了预测流量数据分别和多个样本流量数据对应的相似度。服务器确定多个相似度中的最大相似度对应的样本流量数据为目标样本流量数据。
本发明实施例中,服务器可以将业务维度上的目标特征信息分别和业务维度上的多个样本特征信息进行相似性计算,得到了预测流量数据分别和多个样本流量数据对应的相似度。服务器确定多个相似度中的最大相似度对应的样本流量数据为目标样本流量数据。
其中,服务器对目标特征信息分别和多个样本特征信息进行相似性计算,以通过计算目标特征信息分别和多个样本特征信息之间的余弦距离或者欧式距离实现。
本发明实施例中,服务器通过计算出预测流量数据对应的目标特征信息,再计算出多个样本流量数据分别对应的样本特征信息。服务器通过计算目标特征信息分别和多个样本特征信息之间的相似度,可以准确的确定预测流量数据分别和多个样本流量数据之间的相似度。
在一些实施例中,参见图7,图7为本发明实施例提供的流量预测方法的一个可选的流程示意图,图6示出的S107至S109可以通过S110至S114实现,将结合各步骤进行说明。
S110、将预测流量数据在时间维度上的多个时间段的流量数据比上,预设时间段的预设时间流量数据,得到对应多个时间段的多个预设时间点信息。
本发明实施例中,服务器之前获取到了预测流量数据,同时也获取到了预测流量数据在时间维度上的多个时间段的流量数据。服务器将多个时间段的流量数据比上预设时间段的预设流量数据。进而,服务器可以得到多个流量数据在同一个量级上的多个预设时间点信息。
其中,预设流量数据可以为最大的流量数据也可以为最小的流量数据。
S111、将多个预设时间点信息结合,得到目标时间向量。
本发明实施例中,服务器将预测流量数据对应多个时间段的预设时间点信息按照顺序进行罗列,得到了预测流量数据对应的目标时间向量。其中,目标时间向量是一个多维向量。
示例性的,结合图8。服务器获取到了周三预测流量数据在周三内的0点、1点、2点、…、24点各个时间段的流量数据分别为1000、2000、3000.....10000。服务器将各个时间段的流量数据比上最大的流量数据值10000,进而得到了预测流量数据对应0点、1点、2点、…、24点各个时间段的预设时间点信息0.1、0.2、0.3.....1。服务器结合0.1、0.2、0.3.....1得到了预测流量数据的目标时间向量。
S112、在时间维度上,将多个样本流量数据中的每个样本流量数据在多个时间段的流量数据比上,预设时间段的预设时间流量数据,得到对应多个时间段的多个预设样本时间点信息。
本发明实施例中,服务器之前获取到了多个样本流量数据,同时也获取到了每个样本流量数据在时间维度上的多个时间段内的流量数据。服务器将每个样本流量数据的多个时间段的流量数据比上每个样本流量数据的预设时间段的预设流量数据。进而,服务器可以得到每个样本流量数据的多个流量数据在同一个量级上的多个预设样本时间点信息。
其中,预设流量数据可以为样本流量数据的多个流量数据中最大的流量数据也可以为最小的流量数据。
S113、将多个预设样本时间点信息结合,得到多个样本流量数据对应的多个样本时间向量。
本发明实施例中,服务器将每个样本流量数据对应多个时间段的预设样本时间点信息按照顺序进行罗列,得到了每个样本流量数据对应的样本时间向量。进而可以通过同样的方法,得到多个样本流量数据分别对应的样本时间向量。其中,样本时间向量是一个多维向量。
示例性的,结合图8。服务器获取到了周一样本流量数据在周一内的0点、1点、2点、…、24点各个时间段的流量数据分别为100、200、300.....1000。
服务器将各个时间段的流量数据比上最大的流量数据值1000,进而得到了周一样本流量数据对应0点、1点、2点、…、24点各个时间段的样本时间点信息0.1、0.2、0.3.....1。服务器结合0.1、0.2、0.3.....1得到了周一样本流量数据的样本时间向量。
示例性的,结合图8。服务器获取到了周二样本流量数据在周二内的0点、1点、2点、…、24点各个时间段的流量数据分别为300、400、500.....1000。服务器将各个时间段的流量数据比上最大的流量数据值1000,进而得到了周二样本流量数据对应0点、1点、2点、…、24点各个时间段的样本时间点信息0.3、0.4、0.5.....1。服务器结合0.3、0.4、0.5.....1得到了周二样本流量数据的样本时间向量。
S114、对目标时间向量分别和多个样本时间向量进行相似计算,得到目标时间向量分别和多个样本时间向量之间的第一余弦距离,确定对应最大第一余弦距离对应的目标样本流量数据。
本发明实施例中,服务器计算目标时间向量分别和多个样本时间向量之前的第一余弦距离。服务器可以得到分别对应多个样本流量数据的第一余弦距离。服务器确定最大的第一余弦距离对应的样本流量数据为目标样本流量数据。
示例性的,结合图8。服务器可以通过公式(1)计算得到目标时间向量分别和多个样本时间向量的第一余弦距离cosθ。
Figure BDA0003083200010000161
其中,目标时间向量为a,样本时间向量为b。服务器可以将目标时间向量和样本时间向量相乘,再比上目标时间向量的模长和样本时间向量的模长的乘积。得到了样本时间向量对应的第一余弦距离。
本发明实施例中,服务器通过在时间维度上将预测流量数据和样本流量的多个时间段上的流量数据进行计算归一化到统一的量级,进而服务器可以快速的计算得到预测流量数据分别和多个样本流量数据之间的相似度。
在一些实施例中,参见图9,图9为本发明实施例提供的流量预测方法的一个可选的流程示意图,图7示出的S110至S114可以通过S115至S119实现,将结合各步骤进行说明。
S115、将预测流量数据在业务维度上的多个业务对应的流量数据比上,预设业务对应的预设业务流量数据,得到对应多个业务的多个预设业务点信息。
本发明实施例中,服务器之前获取到了预测流量数据,同时也获取到了预测流量数据在业务维度上对应多个业务的流量数据。服务器将多个业务的流量数据比上预设业务对应的预设业务流量数据。进而,服务器可以得到多个流量数据在同一个量级上的多个预设业务点信息。
其中,预设业务流量数据可以为最大的业务流量数据也可以为最小的业务流量数据。
S116、将多个预设业务点信息结合,得到目标业务向量。
本发明实施例中,服务器将预测流量数据对应多个业务预设业务点信息按照顺序进行罗列,得到了预测流量数据对应的目标业务向量。其中,目标业务向量是一个多维向量。
S117、在业务维度上,将多个样本流量数据中的每个样本流量数据在多个业务对应的流量数据比上,预设业务的预设业务流量数据,得到对应多个业务的多个预设样本业务点信息。
本发明实施例中,服务器之前获取到了多个样本流量数据,同时也获取到了每个样本流量数据在业务维度上对应多个业务的流量数据。服务器将每个样本流量数据的多个业务对应的流量数据比上每个样本流量数据的预设业务的预设业务流量数据。进而,服务器可以得到每个样本流量数据的多个流量数据在同一个量级上的多个预设样本业务点信息。
S118、将多个预设样本业务点信息结合,得到多个样本流量数据对应的多个样本业务向量。
本发明实施例中,服务器将每个样本流量数据对应多个业务的预设样本业务点信息按照顺序进行罗列,得到了每个样本流量数据对应的样本业务向量。进而可以通过同样的方法,得到多个样本流量数据分别对应的样本业务向量。其中,样本业务向量是一个多维向量。
S119、对目标业务向量分别和多个样本业务向量进行相似计算,得到目标业务向量分别和多个样本业务向量之间的第二余弦距离,确定对应最大第二余弦距离对应的目标样本流量数据。
本发明实施例中,服务器计算目标业务向量分别和多个样本业务向量之前的第二余弦距离。服务器可以得到分别对应多个样本流量数据的第二余弦距离。服务器确定最大的第二余弦距离对应的样本流量数据为目标样本流量数据。
本发明实施例中,服务器通过在时间维度上将预测流量数据和样本流量的多个业务对应的流量数据进行计算归一化到统一的量级,进而服务器可以快速的计算得到预测流量数据分别和多个样本流量数据之间的相似度。
在一些实施例中,参见图10,图10为本发明实施例提供的流量预测方法的一个可选的流程示意图,图6示出的S106可以通过S120至S121实现,将结合各步骤进行说明。
S120、基于第三预设时间段内的多个流量数据,计算得到目标样本特征信息;第三预设时间段为目标样本流量数据对应的第一时间段之前的时间段;多个流量数据为第三预设时间段内的多个第三时间段分别对应的流量数据。
本发明实施例中,服务器首先需要提取出目标样本流量数据对应的第一时间段之前的第三预设时间段内的多个流量数据。其中,多个流量数据是第三预设时间段内的多个第三时间段分别对应的流量数据。服务器根据多个流量数据的数值归一化处理得到了目标样本特征信息。
示例性的,服务器可以将每个流量数据比上最大的流量数据,得到了分别对应多个流量数据的点信息。服务器将多个点信息按照顺序进行排列,得到了目标样本特征信息。
S121、对目标样本特征信息分别和多个参考特征信息进行相似计算,确定与目标样本流量数据相似度最大的目标参考流量数据。
本发明实施例中,服务器首先需要按照和计算目标样本特征信息相同的方法计算得到多个参考流量数据分别对应的参考特征信息。服务器再计算目标样本特征信息分别和多个参考特征信息之间的相似度。进而服务器得到了对应多个参考流量数据的相似度,服务器确定最大的相似度对应的目标参考流量数据。
本发明实施例中,服务器通过目标样本流量数据对应的第一时间段之前的第三预设时间段内的多个流量数据,确定对应的目标样本特征信息。同时,服务器也采用相同的方法去确定参考流量数据对应的参考特征信息。由于上述两种信息都是基于对应的一段时间段内的流量确定的,统一了特征信息的确定标准,进而服务器可以准确的确定目标样本流量数据分别和多个参考流量数据之前的相似度。
在一些实施例中,参见图11,图11为本发明实施例提供的流量预测方法的一个可选的流程示意图,图10示出的S120至S121可以通过S122至S125实现,将结合各步骤进行说明。
S122、将多个流量数据分别比上多个流量数据中的预设流量数据,得到分别对应多个流量数据的目标样本点信息。
本发明实施例中,服务器将目标样本流量数据对应的第三预设时间段内的多个流量数据分别比上多个流量数据中的最大流量数据或者最小流量数据,得到了分别对应多个流量数据的目标样本点信息。
S123、获取第三预设时间段中的多个第三时间段分别对应的外部点信息。
本发明实施例中,服务器获取目标样本流量数据对应的第三预设时间段内的多个第三时间段分别对应的外部点信息。
其中,外部点信息可以为对应的第三时间段内的多个客户端对应的活动数量值。
S124、将多个目标样本点信息和多个外部点信息结合,得到目标样本特征信息。
本发明实施例中,服务器将多个目标样本点信息和多个外部点信息按照顺序排列,得到了目标样本特征信息。
需要说明的是,服务器可以通过相同的方法计算得到多个参考流量数据对应的多个参考特征信息。
S125、对目标样本特征信息分别和多个参考特征信息进行相似计算,得到目标样本特征信息分别和多个参考特征信息之间的第三余弦距离,确定对应最大第三余弦距离对应的目标参考流量数据。
本发明实施例中,服务器计算目标样本特征信息分别和多个参考特征信息之间的第三余弦距离。服务器确定最大的第三余弦距离对应的参考流量数据为目标流量数据。
其中,第三余弦距离的数值范围在(-1,1)之间。第三余弦距离越接近1,则说明目标样本流量数据和对应的参考流量数据之间的相似度越大。
在一些实施例中,参见图12,图12为本发明实施例提供的流量预测方法的一个可选的流程示意图,图3示出的S104可以通过S126至S127实现,将结合各步骤进行说明。
S126、获取目标参考流量数据在时间维度上的多个时间段的多个时间流量占比信息,并将多个时间流量占比信息乘以预测流量数据,得到预测流量数据在时间维度上的多个时间段内的目标时间流量信息。
本发明实施例中,服务器获取目标参考流量数据在时间维度上的多个时间段内的流量占比信息。服务器将多个流量占比信息乘以预测流量数据,进而可以得到预测流量数据在目标时间段内的对应的多个时间段内的目标时间流量信息。
S127、获取目标参考流量数据在业务维度上的多个业务对应的多个业务流量占比信息,并将多个业务流量占比信息乘以预测流量数据,得到预测流量数据在业务维度上的多个业务对应的目标业务流量信息。
本发明实施例中,服务器获取目标参考流量数据在业务维度上多个业务对应的流量占比信息。服务器将多个流量占比信息乘以预测流量数据,进而可以得到预测流量数据在目标时间段内的对应的多个业务对应的目标业务流量信息。
示例性的,结合图13。服务器获取目标参考流量数据为100,服务器获取预测流量数据为1000。同时,服务器获取到目标参考流量数据的多个业务对应的流量占比信息为10%、20%、30%和40%。服务器将多个业务对应的流量占比信息为10%、20%、30%和40%乘以预测流量数据1000,可以得到预测流量数据对应多个业务对应的目标业务流量信息分别为:100、200、300和400。
在一些实施例中,参见图14,图14为本发明实施例提供的流量预测方法的一个可选的流程示意图,将结合各步骤进行说明。
S128、服务器获取预测流量数据。
本发明实施例中,服务器首先获取多个样本流量数据,服务器通过将多个样本流量数据输入预测模型得到预测流量数据。
S129、服务器计算预测流量数据分别和多个样本流量数据的相似度。
本发明实施例中,服务器首先计算得到预测流量数据的目标特征信息。服务器再将目标特征信息分别和多个样本特征信息进行相似性计算,服务器得到了对应多个样本流量数据的相似度。
S130、服务器确定相似度最大的目标样本流量数据。
本发明实施例中,服务器确定相似度样本流量数据为目标样本流量数据。
S131、服务器基于目标样本流量数据的各个维度的流量占比信息,对预测流量数据进行流量下钻。
本发明实施例中,服务器获取目标样本流量数据在各个维度上的每个节点的流量占比信息。服务器将多个流量占比信息乘以预测流量数据,得到了预测流量数据在各个维度上的每个节点的目标流量信息。
参见图15,图15为本发明实施例提供的流量预测装置的结构示意图。
本发明实施例还提供了一种流量预测装置800,包括:数据获取单元803、预测单元804、第一处理单元805和第二处理单元806。
数据获取单元803,用于获取第一预设时间段内的多个第一时间段对应的多个样本流量数据;每个样本流量数据表征对应的第一时间段在至少一个维度上的流量分布信息;
预测单元804,用于采用预测模型对多个样本流量数据进行预测,得到目标时间段的预测流量数据;预测流量数据表征目标时间段在至少一个维度上的预测流量分布信息;
第一处理单元805,用于提取预测流量数据的目标特征信息,并基于目标特征信息,在多个参考流量数据中,确定出与预测流量数据相似度最大的目标参考流量数据;多个参考流量数据为第二预设时间段内的多个第二时间段对应的流量数据;第二预设时间段包含第一预设时间段;
第二处理单元806,用于基于目标参考流量数据在至少一个维度上的流量占比信息,确定预测流量数据分别对应至少一个维度的目标流量信息。
本发明实施例中,流量预测装置800中的第一处理单元805用于从预测流量数据中提取目标特征信息,并基于目标特征信息,在多个样本流量数据中,确定与预测流量数据相似度最大的目标样本流量数据;从目标样本流量数据中提取目标样本特征信息,并基于目标样本特征信息,在多个参考流量数据中,确定目标参考流量数据。
本发明实施例中,流量预测装置800中的第一处理单元805用于提取预测流量数据在任意一个维度上的目标维度特征信息;提取多个样本流量数据在预测流量数据的对应维度上对应的多个样本特征信息;对目标维度特征信息分别和多个样本特征信息进行相似计算,确定与预测流量数据相似度最大的目标样本流量数据。
本发明实施例中,流量预测装置800中的第一处理单元805用于将预测流量数据在时间维度上的多个时间段的流量数据比上,预设时间段的预设时间流量数据,得到对应多个时间段的多个预设时间点信息;将多个预设时间点信息结合,得到目标时间向量;将预测流量数据在业务维度上的多个业务对应的流量数据比上,预设业务对应的预设业务流量数据,得到对应多个业务的多个预设业务点信息;将多个预设业务点信息结合,得到目标业务向量。
本发明实施例中,流量预测装置800中的第一处理单元805用于在时间维度上,将多个样本流量数据中的每个样本流量数据在多个时间段的流量数据比上,预设时间段的预设时间流量数据,得到对应多个时间段的多个预设样本时间点信息;将多个预设样本时间点信息结合,得到多个样本流量数据对应的多个样本时间向量;在业务维度上,将多个样本流量数据中的每个样本流量数据在多个业务对应的流量数据比上,预设业务的预设业务流量数据,得到对应多个业务的多个预设样本业务点信息;将多个预设样本业务点信息结合,得到多个样本流量数据对应的多个样本业务向量。
本发明实施例中,流量预测装置800中的第一处理单元805用于对目标时间向量分别和多个样本时间向量进行相似计算,得到目标时间向量分别和多个样本时间向量之间的第一余弦距离,确定对应最大第一余弦距离对应的目标样本流量数据;对目标业务向量分别和多个样本业务向量进行相似计算,得到目标业务向量分别和多个样本业务向量之间的第二余弦距离,确定对应最大第二余弦距离对应的目标样本流量数据。
本发明实施例中,流量预测装置800中的第一处理单元805用于基于第三预设时间段内的多个流量数据,计算得到目标样本特征信息;第三预设时间段为目标样本流量数据对应的第一时间段之前的时间段;多个流量数据为第三预设时间段内的多个第三时间段分别对应的流量数据;
对目标样本特征信息分别和多个参考特征信息进行相似计算,确定与目标样本流量数据相似度最大的目标参考流量数据;多个参考特征信息为预存的多个参考流量数据对应的参考信息。
本发明实施例中,流量预测装置800中的第一处理单元805用于将多个流量数据分别比上多个流量数据中的预设流量数据,得到分别对应多个流量数据的目标样本点信息;预设流量数据表征多个流量数据中的最大或者最小流量数据;
获取第三预设时间段中的多个第三时间段分别对应的外部点信息;外部点信息表征多个第三时间段分别对应的交易活动数量信息;
将多个目标样本点信息和多个外部点信息结合,得到目标样本特征信息。
本发明实施例中,流量预测装置800中的第一处理单元805用于对目标样本特征信息分别和多个参考特征信息进行相似计算,得到目标样本特征信息分别和多个参考特征信息之间的第三余弦距离,确定对应最大第三余弦距离对应的目标参考流量数据。
本发明实施例中,流量预测装置800中的第二处理单元806用于获取目标参考流量数据在时间维度上的多个时间段的多个时间流量占比信息,并将多个时间流量占比信息乘以预测流量数据,得到预测流量数据在时间维度上的多个时间段内的目标时间流量信息;
获取目标参考流量数据在业务维度上的多个业务对应的多个业务流量占比信息,并将多个业务流量占比信息乘以预测流量数据,得到预测流量数据在业务维度上的多个业务对应的目标业务流量信息。
本发明实施例中,通过数据获取单元803获取第一预设时间段内的多个第一时间段分别对应的样本流量数据;再通过预测单元804采用预测模型对多个样本流量数据进行预测,得到目标时间段的预测流量数据;通过第一处理单元805提取预测流量数据的目标特征信息,并基于目标特征信息确定出与预测流量数据相似度最大的目标参考流量数据;通过第二处理单元806基于目标参考流量数据在至少一个维度上的流量占比信息,确定预测流量数据分别对应至少一个维度的目标流量信息,由于目标参考流量数据是与预测流量数据在各个维度上都相似度最大的流量数据,再根据目标参考流量数据在至少一个维度上的流量分布信息来对应确定预测流量数据对应维度上的流量数据,进而可以提高的预测流量数据在对应维度上的流量数据预测精度。
需要说明的是,本发明实施例中,如果以软件功能模块的形式实现上述的流量预测方法,并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台流量预测装置(可以是个人计算机等)执行本发明各个实施例方法的全部或部分。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本发明实施例不限制于任何特定的硬件和软件结合。
对应地,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述方法中的步骤。
对应地,本发明实施例提供一种流量预测装置800,包括存储器802和处理器801,存储器802存储有可在处理器801上运行的计算机程序,处理器801执行程序时实现上述方法中的步骤。
这里需要指出的是:以上存储介质和装置实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本发明存储介质和装置实施例中未披露的技术细节,请参照本发明方法实施例的描述而理解。
需要说明的是,图16为本发明实施例提供的流量预测装置的一种硬件实体示意图,如图16所示,该流量预测装置800的硬件实体包括:处理器801和存储器802,其中;
处理器801通常控制流量预测装置800的总体操作。
存储器802配置为存储由处理器801可执行的指令和应用,还可以缓存待处理器801以及流量预测装置800中各模块待处理或已经处理的数据(例如,图像数据、音频数据、语音通信数据和视频通信数据),可以通过闪存(FLASH)或随机访问存储器(Random AccessMemory,RAM)实现。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解,在本发明的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储装置、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机、服务器、或者网络装置等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储装置、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (13)

1.一种流量预测方法,其特征在于,包括:
获取第一预设时间段内的多个第一时间段对应的多个样本流量数据;每个样本流量数据表征对应的第一时间段在至少一个维度上的流量分布信息;
采用预测模型对所述多个样本流量数据进行预测,得到目标时间段的预测流量数据;所述预测流量数据表征所述目标时间段在所述至少一个维度上的预测流量分布信息;
提取所述预测流量数据的目标特征信息,并基于所述目标特征信息,在多个参考流量数据中,确定出与所述预测流量数据相似度最大的目标参考流量数据;所述多个参考流量数据为第二预设时间段内的多个第二时间段对应的流量数据;所述第二预设时间段包含所述第一预设时间段;
基于所述目标参考流量数据在所述至少一个维度上的流量占比信息,确定所述预测流量数据分别对应所述至少一个维度的目标流量信息。
2.根据权利要求1所述的流量预测方法,其特征在于,所述提取所述预测流量数据的目标特征信息,并基于所述目标特征信息,在多个参考流量数据中,确定出与所述预测流量数据相似度最大的目标参考流量数据,包括:
从所述预测流量数据中提取目标特征信息,并基于所述目标特征信息,在所述多个样本流量数据中,确定与所述预测流量数据相似度最大的目标样本流量数据;
从所述目标样本流量数据中提取目标样本特征信息,并基于所述目标样本特征信息,在所述多个参考流量数据中,确定所述目标参考流量数据。
3.根据权利要求2所述的流量预测方法,其特征在于,所述目标特征信息包括:目标维度特征信息;
所述从所述预测流量数据中提取目标特征信息,并基于所述目标特征信息,在所述多个样本流量数据中,确定与所述预测流量数据相似度最大的目标样本流量数据,包括:
提取所述预测流量数据在任意一个维度上的目标维度特征信息;
提取所述多个样本流量数据在所述预测流量数据的对应维度上对应的多个样本特征信息;
对所述目标维度特征信息分别和所述多个样本特征信息进行相似计算,确定与所述预测流量数据相似度最大的所述目标样本流量数据。
4.根据权利要求3所述的流量预测方法,其特征在于,所述至少一个维度包括:时间维度和业务维度;所述目标维度特征信息包括:目标时间向量和目标业务向量中的任意一个;
所述提取所述预测流量数据在任意一个维度上的目标维度特征信息,包括以下之一:
将所述预测流量数据在所述时间维度上的多个时间段的流量数据比上,预设时间段的预设时间流量数据,得到对应所述多个时间段的多个预设时间点信息;
将所述多个预设时间点信息结合,得到所述目标时间向量;
将所述预测流量数据在所述业务维度上的多个业务对应的流量数据比上,预设业务对应的预设业务流量数据,得到对应所述多个业务的多个预设业务点信息;
将所述多个预设业务点信息结合,得到所述目标业务向量。
5.根据权利要求4所述的流量预测方法,其特征在于,所述样本特征向量包括:样本时间向量和样本业务向量中的任意一个;
所述提取所述多个样本流量数据在所述预测流量数据的对应维度上对应的多个样本特征信息,包括以下之一:
在所述时间维度上,将所述多个样本流量数据中的每个样本流量数据在多个时间段的流量数据比上,预设时间段的预设时间流量数据,得到对应所述多个时间段的多个预设样本时间点信息;
将所述多个预设样本时间点信息结合,得到所述多个样本流量数据对应的多个样本时间向量;
在所述业务维度上,将所述多个样本流量数据中的每个样本流量数据在多个业务对应的流量数据比上,预设业务的预设业务流量数据,得到对应所述多个业务的多个预设样本业务点信息;
将所述多个预设样本业务点信息结合,得到所述多个样本流量数据对应的所述多个样本业务向量。
6.根据权利要求5所述的流量预测方法,其特征在于,所述对所述目标维度特征信息分别和所述多个样本特征信息进行相似计算,确定与所述预测流量数据相似度最大的所述目标样本流量数据,包括以下之一:
对所述目标时间向量分别和所述多个样本时间向量进行相似计算,得到所述目标时间向量分别和所述多个样本时间向量之间的第一余弦距离,确定对应最大所述第一余弦距离对应的所述目标样本流量数据;
对所述目标业务向量分别和所述多个样本业务向量进行相似计算,得到所述目标业务向量分别和所述多个样本业务向量之间的第二余弦距离,确定对应最大所述第二余弦距离对应的所述目标样本流量数据。
7.根据权利要求2-6任一项所述的流量预测方法,其特征在于,所述从所述目标样本流量数据中提取目标样本特征信息,并基于所述目标样本特征信息,在所述多个参考流量数据中,确定所述目标参考流量数据,包括:
基于第三预设时间段内的多个流量数据,计算得到所述目标样本特征信息;所述第三预设时间段为所述目标样本流量数据对应的所述第一时间段之前的时间段;所述多个流量数据为所述第三预设时间段内的多个第三时间段分别对应的流量数据;
对所述目标样本特征信息分别和所述多个参考特征信息进行相似计算,确定与所述目标样本流量数据相似度最大的所述目标参考流量数据;所述多个参考特征信息为预存的所述多个参考流量数据对应的参考信息。
8.根据权利要求7所述的流量预测方法,其特征在于,所述基于第三预设时间段内的多个流量数据,计算得到所述目标样本特征信息,包括:
将所述多个流量数据分别比上所述多个流量数据中的预设流量数据,得到分别对应所述多个流量数据的目标样本点信息;所述预设流量数据表征所述多个流量数据中的最大或者最小流量数据;
获取所述第三预设时间段中的所述多个第三时间段分别对应的外部点信息;所述外部点信息表征所述多个第三时间段分别对应的交易活动数量信息;
将多个目标样本点信息和多个外部点信息结合,得到所述目标样本特征信息。
9.根据权利要求7或8所述的流量预测方法,其特征在于,所述对所述目标样本特征信息分别和所述多个参考特征信息进行相似计算,确定与所述目标样本流量数据相似度最大的所述目标参考流量数据,包括:
对所述目标样本特征信息分别和所述多个参考特征信息进行相似计算,得到所述目标样本特征信息分别和所述多个参考特征信息之间的第三余弦距离,确定对应最大所述第三余弦距离对应的目标参考流量数据。
10.根据权利要求1-9任一项所述的流量预测方法,其特征在于,所述至少一个维度包括:时间维度和业务维度;所述流量占比信息包括:时间流量占比信息和业务流量占比信息;所述目标流量信息包括:目标时间流量信息和目标业务流量信息;
所述基于所述目标参考流量数据在所述至少一个维度上的流量占比信息,确定所述预测流量数据分别对应所述至少一个维度的目标流量信息,包括以下至少一个:
获取所述目标参考流量数据在所述时间维度上的多个时间段的多个所述时间流量占比信息,并将多个所述时间流量占比信息乘以所述预测流量数据,得到所述预测流量数据在所述时间维度上的多个时间段内的目标时间流量信息;
获取所述目标参考流量数据在所述业务维度上的多个业务对应的多个业务流量占比信息,并将多个所述业务流量占比信息乘以所述预测流量数据,得到所述预测流量数据在所述业务维度上的多个业务对应的目标业务流量信息。
11.一种流量预测装置,其特征在于,包括:
数据获取单元,用于获取第一预设时间段内的多个第一时间段分别对应的样本流量数据;所述样本流量数据表征对应的第一时间段在至少一个维度上的流量分布信息;
预测单元,用于采用预测模型对多个样本流量数据进行预测,得到目标时间段的预测流量数据;所述预测流量数据表征所述目标时间段在所述至少一个维度上的预测流量分布信息;
第一处理单元,用于提取所述预测流量数据的目标特征信息,并基于所述目标特征信息,在多个参考流量数据中,确定出与所述预测流量数据相似度最大的目标参考流量数据;所述多个参考流量数据为第二预设时间段内的多个第二时间段分别对应的参考流量数据;所述第二预设时间段包含所述第一预设时间段;
第二处理单元,用于基于所述目标参考流量数据在所述至少一个维度上的所述流量占比信息,确定所述预测流量数据分别对应所述至少一个维度的目标流量信息。
12.一种流量预测装置,其特征在于,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1至10任一项所述方法中的步骤。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至10任一项所述方法中的步骤。
CN202110572395.2A 2021-05-25 2021-05-25 流量预测方法、装置及存储介质 Pending CN113420906A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110572395.2A CN113420906A (zh) 2021-05-25 2021-05-25 流量预测方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110572395.2A CN113420906A (zh) 2021-05-25 2021-05-25 流量预测方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN113420906A true CN113420906A (zh) 2021-09-21

Family

ID=77712843

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110572395.2A Pending CN113420906A (zh) 2021-05-25 2021-05-25 流量预测方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN113420906A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190228329A1 (en) * 2017-03-24 2019-07-25 Hitachi, Ltd. Prediction system and prediction method
WO2019196210A1 (zh) * 2018-04-10 2019-10-17 平安科技(深圳)有限公司 数据分析方法、计算机可读存储介质、终端设备及装置
CN110929962A (zh) * 2019-12-13 2020-03-27 中国科学院深圳先进技术研究院 一种基于深度学习的交通流量预测方法及装置
CN111740865A (zh) * 2020-06-23 2020-10-02 北京奇艺世纪科技有限公司 一种流量波动趋势预测方法、装置及电子设备
CN111769985A (zh) * 2020-06-29 2020-10-13 中国联合网络通信集团有限公司 一种数据流量预测方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190228329A1 (en) * 2017-03-24 2019-07-25 Hitachi, Ltd. Prediction system and prediction method
WO2019196210A1 (zh) * 2018-04-10 2019-10-17 平安科技(深圳)有限公司 数据分析方法、计算机可读存储介质、终端设备及装置
CN110929962A (zh) * 2019-12-13 2020-03-27 中国科学院深圳先进技术研究院 一种基于深度学习的交通流量预测方法及装置
CN111740865A (zh) * 2020-06-23 2020-10-02 北京奇艺世纪科技有限公司 一种流量波动趋势预测方法、装置及电子设备
CN111769985A (zh) * 2020-06-29 2020-10-13 中国联合网络通信集团有限公司 一种数据流量预测方法及装置

Similar Documents

Publication Publication Date Title
US10410138B2 (en) System and method for automatic generation of features from datasets for use in an automated machine learning process
CN110162695B (zh) 一种信息推送的方法及设备
CN107451832B (zh) 推送信息的方法和装置
CN110569427B (zh) 一种多目标排序模型训练、用户行为预测方法及装置
WO2019174423A1 (zh) 实体情感分析方法及相关装置
TWI658420B (zh) 融合時間因素之協同過濾方法、裝置、伺服器及電腦可讀存儲介質
CN107358247B (zh) 一种确定流失用户的方法及装置
CN105956628B (zh) 数据分类方法和用于数据分类的装置
CN110472154B (zh) 一种资源推送方法、装置、电子设备及可读存储介质
US20190114711A1 (en) Financial analysis system and method for unstructured text data
CN108846097B (zh) 用户的兴趣标签表示方法、文章推荐方法、及装置、设备
CN110647683B (zh) 一种信息推荐方法、装置
CN111258593B (zh) 应用程序预测模型的建立方法、装置、存储介质及终端
JP2016212547A (ja) 情報提供プログラム、情報提供装置、及び情報提供方法
US20220188286A1 (en) Data Catalog Providing Method and System for Providing Recommendation Information Using Artificial Intelligence Recommendation Model
CN106033455B (zh) 一种处理用户操作信息的方法与设备
US9324026B2 (en) Hierarchical latent variable model estimation device, hierarchical latent variable model estimation method, supply amount prediction device, supply amount prediction method, and recording medium
CN115115265A (zh) 一种基于rfm模型的消费者评估方法、装置及介质
CN116823409A (zh) 一种基于目标搜索数据的智能筛选方法及系统
CN110688565A (zh) 基于多维霍克斯过程和注意力机制的下一个物品推荐方法
CN112070559A (zh) 状态获取方法和装置、电子设备和存储介质
CN116362823A (zh) 用于行为稀疏场景的推荐模型训练方法、推荐方法及装置
WO2017201905A1 (zh) 资料分发方法、装置和存储介质
CN111611228B (zh) 一种基于分布式数据库的负载均衡调整方法及装置
Guan et al. Enhanced SVD for collaborative filtering

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination