CN115359654B - 流量预测系统的更新方法及装置 - Google Patents
流量预测系统的更新方法及装置 Download PDFInfo
- Publication number
- CN115359654B CN115359654B CN202210924959.9A CN202210924959A CN115359654B CN 115359654 B CN115359654 B CN 115359654B CN 202210924959 A CN202210924959 A CN 202210924959A CN 115359654 B CN115359654 B CN 115359654B
- Authority
- CN
- China
- Prior art keywords
- graph
- node
- flow
- data
- fusion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 84
- 238000012512 characterization method Methods 0.000 claims abstract description 130
- 239000011159 matrix material Substances 0.000 claims abstract description 121
- 238000000547 structure data Methods 0.000 claims abstract description 104
- 230000004927 fusion Effects 0.000 claims abstract description 80
- 238000012545 processing Methods 0.000 claims abstract description 70
- 238000013528 artificial neural network Methods 0.000 claims abstract description 57
- 238000007499 fusion processing Methods 0.000 claims abstract description 23
- 239000013598 vector Substances 0.000 claims description 38
- 230000008569 process Effects 0.000 claims description 34
- 230000009466 transformation Effects 0.000 claims description 22
- 230000006870 function Effects 0.000 claims description 13
- 230000004913 activation Effects 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 4
- 230000015654 memory Effects 0.000 claims description 4
- 238000012549 training Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 6
- 238000013459 approach Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006386 memory function Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/147—Network analysis or design for predicting network behaviour
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
- G08G1/0129—Traffic data processing for creating historical data or processing based on historical data
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0137—Measuring and analyzing of parameters relative to traffic conditions for specific applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/16—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Databases & Information Systems (AREA)
- Economics (AREA)
- Analytical Chemistry (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Chemical & Material Sciences (AREA)
- Algebra (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
Abstract
本说明书实施例提供一种流量预测系统的更新方法及装置。其中流量预测系统包括图生成模块、时序网络和两个图神经网络,该方法包括:先基于图生成模块中用于表征N个对象节点的节点表征参数生成第一图结构数据,其指示挖掘出的节点间连接关系;再利用第一图神经网络处理第一图结构数据和节点流量数据,得到N个第一节点嵌入表征,并利用第二图神经网络处理预先构建的第二图结构数据和所述节点流量数据,得到N个第二节点嵌入表征;之后,利用时序网络处理所述节点流量数据,以及对上述两部分节点嵌入表征进行融合处理而得到的融合表征矩阵,得到各个对象节点在节点流量数据之后时刻下的预测流量值,用于结合真实流量值更新流量预测系统中的参数。
Description
技术领域
本说明书一个或多个实施例涉及机器学习技术领域,尤其涉及一种流量预测系统的更新方法及装置,以及一种指标预测系统的更新方法及装置。
背景技术
构建机器学习模型进行多变量时序预测,已成为当下的一大研究热点,其中涉及的多个变量通常为某个业务场景下具有一些关联关系的变量,时序预测涉及利用该多个变量中各个变量的历史序列数据预测未来时刻下的数据。比如说,在云服务场景中,多个业务变量为不同应用(Applications)中多个页面对应的多个流量变量,此时,可以认为对应相同应用的页面之间具有关联关系,从而基于此关联关系以及针对各个页面采集的历史流量序列,预测各个页面在未来某个时刻的数据流量,进而使得云服务平台能够根据预测结果提前对相关服务资源的调度进行决策,以更好地服务用户。
然而,目前进行多变量时序预测的方式难以满足日益提升的实际应用需求。因此,需要一种方案,可以有效提高多变量时序预测结果的准确度,从而实现用户体验的提升。
发明内容
本说明书实施例描述了一种流量预测系统的更新方法及装置,以及一种指标预测系统的更新方法及装置。通过对基于先验知识确定出的显式的图结构数据,以及挖掘出的图结构数据进行融合,从而将融合结果用于流量等指标的预测,进而有效提高对流量等指标的预测准确度。
根据第一方面,提供一种流量预测系统的更新方法,所述流量预测系统包括图生成模块、时序网络和两个图神经网络;所述方法包括:基于所述图生成模块中用于表征N个对象节点的节点表征参数,生成第一图结构数据,其指示针对所述N个对象节点挖掘出的连接关系;利用第一图神经网络处理第一图结构数据和节点流量数据,得到所述N个对象节点的N个第一嵌入表征;所述节点流量数据包括各个对象节点在T个时刻下的T个流量值;利用第二图神经网络处理第二图结构数据和所述节点流量数据,得到所述N个对象节点的N个第二嵌入表征;所述第二图结构数据指示针对所述N个对象节点预先构建的原始连接关系;基于所述N个第一嵌入表征和N个第二嵌入表征进行融合处理,得到融合表征矩阵;利用所述时序网络处理所述融合表征矩阵和所述T个流量值,确定所述各个对象节点在所述T个时刻之后时刻下的预测流量值;根据所述预测流量值和对应的真实流量值,更新所述流量预测系统中的参数。
在一个实施例中,所述N个对象节点对应的业务对象为应用软件,流量为数据流量;或者,所述业务对象为兴趣点POI,流量为交通流量。
在一个实施例中,基于所述图生成模块中用于表征N个对象节点的节点表征参数,生成第一图结构数据,包括:基于所述节点表征参数,确定相似度矩阵,其中第i行第j列的矩阵元素表示第i个对象节点和第j个对象节点之间的相似度;基于所述相似度矩阵,确定所述第一图结构数据。
在一个实施例中,基于所述相似度矩阵,确定所述第一图结构数据,包括:对所述相似度矩阵进行稀疏化处理,得到所述第一图结构数据。
在一个具体的实施例中,所述稀疏化处理包括:利用Gumbel-softmax函数处理所述相似度矩阵。
在一个实施例中,所述流量预测系统还包括第一自注意力网络和第二自注意力网络;其中,基于所述N个第一嵌入表征和N个第二嵌入表征进行融合处理,得到融合表征矩阵,包括:将所述N个第一嵌入表征共同输入所述第一自注意力网络,得到N个第一编码向量;将所述N个第二嵌入表征共同输入所述第二自注意力网络,得到N个第二编码向量;对与同一对象节点对应的第一编码向量和第二编码向量进行融合处理,得到融合向量,用以形成所述融合表征矩阵。
在一个实施例中,利用所述时序网络处理所述融合表征矩阵和所述T个流量值,确定所述各个对象节点在所述T个时刻之后时刻下的预测流量值,包括:将基于所述T个流量值确定出的T个流量数据依次输入所述时序网络,并在所述时序网络中利用所述融合表征矩阵处理所述输入,从而得到所述预测流量值。
在一个具体的实施例中,所述T个流量数据中的第t个流量数据包括,所述T个流量值中第1个流量值至第t个流量值按时序形成的序列。
在一个具体的实施例中,在所述时序网络中利用所述融合表征矩阵处理所述输入,包括:在所述时序网络的隐层中,利用所述融合表征矩阵对当前时刻输入的流量数据和上一时刻的隐层状态进行线性变换处理,并基于所述线性变换处理的结果和所述上一时刻的隐层状态,确定当前隐层状态。
进一步,在一个更具体的实施例中,确定当前隐层状态,包括:对所述线性变换处理的结果进行非线性激活处理,基于激活处理结果和所述上一时刻的隐层状态,确定所述当前隐层状态。
根据第二方面,提供一种指标预测系统的更新方法,所述指标预测系统包括图生成模块、时序网络和两个图神经网络;所述方法包括:基于所述图生成模块中用于表征N个对象节点的节点表征参数,生成第一图结构数据,其指示针对所述N个对象节点挖掘出的连接关系;利用第一图神经网络处理第一图结构数据和节点指标数据,得到所述N个对象节点的N个第一嵌入表征;所述节点指标数据包括各个对象节点在T个时刻下的T个指标值;利用第二图神经网络处理第二图结构数据和所述节点指标数据,得到所述N个对象节点的N个第二嵌入表征;所述第二图结构数据指示针对所述N个对象节点预先构建的原始连接关系;基于所述N个第一嵌入表征和N个第二嵌入表征进行融合处理,得到融合表征矩阵;利用所述时序网络处理所述融合表征矩阵和所述T个指标值,确定所述各个对象节点在所述T个时刻之后时刻下的预测指标值;根据所述预测指标值和对应的真实指标值,更新所述指标预测系统中的参数。
在一个实施例中,所述N个对象节点对应的业务对象为用户或商品,指标为交易额或交易笔数。
根据第三方面,提供一种流量预测系统的更新装置,所述流量预测系统包括图生成模块、时序网络和两个图神经网络;所述装置包括:图数据生成单元,配置为基于所述图生成模块中用于表征N个对象节点的节点表征参数,生成第一图结构数据,其指示针对所述N个对象节点挖掘出的连接关系;第一图嵌入单元,配置为利用第一图神经网络处理第一图结构数据和节点流量数据,得到所述N个对象节点的N个第一嵌入表征;所述节点流量数据包括各个对象节点在T个时刻下的T个流量值;第二图嵌入单元,配置为利用第二图神经网络处理第二图结构数据和所述节点流量数据,得到所述N个对象节点的N个第二嵌入表征;所述第二图结构数据指示针对所述N个对象节点预先构建的原始连接关系;表征融合单元,配置为基于所述N个第一嵌入表征和N个第二嵌入表征进行融合处理,得到融合表征矩阵;流量预测单元,配置为利用所述时序网络处理所述融合表征矩阵和所述T个流量值,确定所述各个对象节点在所述T个时刻之后时刻下的预测流量值;参数更新单元,配置为根据所述预测流量值和对应的真实流量值,更新所述流量预测系统中的参数。
根据第四方面,提供一种指标预测系统的更新装置,所述指标预测系统包括图生成模块、时序网络和两个图神经网络;所述装置包括:图数据生成单元,配置为基于所述图生成模块中用于表征N个对象节点的节点表征参数,生成第一图结构数据,其指示针对所述N个对象节点挖掘出的连接关系;第一图嵌入单元,配置为利用第一图神经网络处理第一图结构数据和节点指标数据,得到所述N个对象节点的N个第一嵌入表征;所述节点指标数据包括各个对象节点在T个时刻下的T个指标值;第二图嵌入单元,配置为利用第二图神经网络处理第二图结构数据和所述节点指标数据,得到所述N个对象节点的N个第二嵌入表征;所述第二图结构数据指示针对所述N个对象节点预先构建的原始连接关系;表征融合单元,配置为基于所述N个第一嵌入表征和N个第二嵌入表征进行融合处理,得到融合表征矩阵;指标预测单元,配置为利用所述时序网络处理所述融合表征矩阵和所述T个指标值,确定所述各个对象节点在所述T个时刻之后时刻下的预测指标值;参数更新单元,配置为根据所述预测指标值和对应的真实指标值,更新所述指标预测系统中的参数。
根据第五方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面或第二方面的方法。
根据第六方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,该处理器执行所述可执行代码时,实现第一方面或第二方面的方法。
采用本说明书实施例提供的方法和装置,通过对基于先验知识确定出的显式的图结构数据以及挖掘出的隐式的图结构数据进行融合,并将融合结果用于流量等指标的预测,可以有效提高流量等指标的预测结果准确度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1示出本说明书实施例披露的流量预测系统的更新方法实施架构图;
图2示出本说明书实施例披露的流量预测系统的更新方法流程示意图;
图3示出本说明书实施例披露的指标预测系统的更新方法流程示意图;
图4示出本说明书实施例披露的流量预测系统的更新装置结构示意图;
图5示出本说明书实施例披露的指标预测系统的更新装置结构示意图。
具体实施方式
下面结合附图,对本说明书提供的方案进行描述。
如前所述,需要一种方案,可以提高多变量时序预测结果的准确度。可以理解,在特定的业务场景所涉及多个业务变量(或称业务对象、对象、实体)之间,通常存在一些关联关系,而具有关联关系的业务变量之间的具有相近的数据模式,因此,希望可以将此关联关系用于业务变量值的预测。通常,将多个业务对象作为多个图节点(文中或称为多个对象节点),并在具有关联关系的两个图节点之间建立连接边,从而形成表达业务对象之间关联关系的关系网络图。另外,关系网络图中连接关系(或称关联关系)的存储形式通常为邻接矩阵(或称图结构数据),示例性地,对于包含N个对象节点的关系网络图,对于其邻接矩阵中的第i行第j列元素,若元素值为0,则表示第i个节点和第j个节点之间没有连接边,或者说不存在关联关系,若元素值为1,则表示有连接边,或者说存在关联关系。
可以理解,获取到的图结构数据越准确,对业务变量值的预测结果也会越准确。然而,实际根据专家经验预先确定出的图结构数据(文中或将此种图结构数据称为先验图结构、显式图结构)往往是不全面的,具有一定的局限性。比如说,在预测多条道路交通流量的业务场景中,可以人工快速判别出相接的两条路之间具有关联关系,但是,还有很多其他可能被遗漏、或者难以准确评估的道路属性同样会影响道路流量之间的相似性,比如,对于没有相接甚至距离较远的两条道路,如果二者具有相同数量的车道且路旁都有加油站和学校,此时,这两条道路的交通模式很可能是相近的,因而存在关联关系。
进一步,提出采用机器学习技术对多个对象节点之间的图结构数据进行全面、准确的挖掘,然而,如果单纯依赖挖掘出的图结构数据(文中或将此种图结构数据称为隐式图结构),而对有局限性但准确率高的先验图结构数据弃之不用,最终得到的多变量时序预测结果的准确度也是有限的。因而,考虑同时对挖掘出的图结构数据和先验图结构数据进行利用,那么,如何对二者进行有效融合则触发了新的挑战。
发明人通过以上观察和分析,设计一种新的流量预测系统,并提出对该流量预测系统的训练方案,从而实现对上述两部分图结构数据进行有效的融合使用,从而实现对多个业务对象所对应多个流量变量的精准预测。
图1示出本说明书实施例披露的流量预测系统的更新方法实施架构图。如图1所示,流量预测系统10中设计有图生成模块11、第一图神经网络12、第二图神经网络13和时序网络14;在流量预测系统10的训练阶段,先利用图生成模块11挖掘N个对象节点之间的连接关系,作为隐式结构图数据;接着,利用第一图神经网络12处理隐式图结构数据和N个对象节点的流量时序数据,得到N个对象节点的N个第一嵌入表征,以及,利用第二图神经网络13处理预先确定出的显式图结构数据和流量时序数据,得到N个对象节点的N个第二嵌入表征;然后,对两部分嵌入表征进行融合,得到融合表征矩阵;之后,利用时序网络14处理融合表征矩阵和流量时序数据,得到N个对象节点在后续时刻的预测流量值,进而根据预测流量值和对应的真实流量值训练确定训练损失,用于更新流量预测系统10中的参数,可以理解,流量预测系统的参数中包括超级参数和可优化参数,前者的参数值是人工设定的,后者的参数值会在模型训练过程中不断自动学习、调整、更新或者说优化。如此,可以实现对流量预测系统10的迭代训练。
下面结合更多的实施例,对上述方案的实施步骤进行描述。
图2示出本说明书实施例披露的流量预测系统的更新方法流程示意图,所述方法的执行主体可以为任何具有计算、处理能力的服务器、装置、平台或设备集群等。如图2所示,所述方法包括以下步骤:
步骤S210,基于流量预测系统的图生成模块中用于表征N个对象节点的节点表征参数,生成第一图结构数据,其指示针对所述N个对象节点挖掘出的连接关系。
为便于理解,下面先介绍N个对象节点。其中N为大于1的整数,N个对象节点对应N个业务对象。在一个实施例中,N个业务对象为N个应用软件。在另一个实施例中,N个业务对象为N个应用页面,此N个应用页面属于同一应用软件或分属于不同应用软件。在又一个实施例中,N个业务对象为N个服务器或N个设备集群。在本段的这些实施例中,业务对象的流量可以为数据流量。
在再一个实施例中,N个业务对象可以为N个兴趣点(Point of Interest,简称POI),示例性的,POI具体可以是道路、商铺、车站等,此时,流量相应可以是道路的车流量、商铺的人流量、车站的人流量等。
进一步,图生成模块(可参见图1中的图生成模块11)中配置有针对上述N个对象节点的节点表征参数,模块用于实现的功能为:通过处理节点表征参数挖掘N个对象节点之间隐式的连接关系,或称为第一图结构数据。其中节点表征参数被设置为可更新、优化的参数,也就是在训练过程中需要被调整的参数。
对隐式图结构进行挖掘的原理主要是:足够相似、相近的对象节点之间通常具有类似的流量模式,因而具有关联关系,可以建立连接边。基于此,本步骤可以实施为:先基于节点表征参数确定相似度矩阵,其中第i行第j列的矩阵元素表示第i个对象节点和第j个对象节点之间的相似度;再基于此相似度矩阵,确定第一图结构数据。
在一个实施例中,节点表征参数的数学形式为N*N维的表征参数矩阵,矩阵中的N行或N列为对应上述N个对象节点的N个表征参数向量,此时,可以采用下式计算相似度矩阵:
θ=EET (1)
在公式(1)中,θ表示相似度矩阵,E表示上述N*N维的表征参数矩阵,T表示转置运算符。
如此,可以确定出相似度矩阵θ。进一步,在一个实施例中,可以直接将相似度矩阵θ作为上述第一图结构数据。在另一个实施例中,考虑到相似度矩阵θ十分稠密,意味着其中包含大量冗余信息,由此提出对相似度矩阵θ进行稀疏化处理,以去除其中包含的冗余信息,从而提高后续计算的准确度并降低计算量。
在一个具体的实施例中,可以对相似度矩阵θ中的矩阵元素进行随机置零,然而,此种方式可能会同时消除部分有效信息。在另一个具体的实施例中,提出引入Gumbel-softmax函数处理相似度矩阵θ,从而实现对冗余信息、无用噪声信息的去除和对有效信息的充分保留,得到稀疏、离散的、可解释性更高的图结构,作为上述第一图结构数据。示例性地,利用Gumbel-softmax函数处理相似度矩阵θ可以通过计算下式实现:
在上式(2)中,A(l)表示第一图结构数据,θij表示相似度矩阵θ中的第i行第j列元素;σ表示softmax函数;和/>表示针对θij从Gumbel(0,1)分布中进行两次采样得到的采样结果;符号s.t.表示约束于;s表示温度参数,可以是取值人工设定的超级参数,参数s的取值越小,A(l)中的元素越趋于两级化,也即,越逼近0或逼近1。
由上,可以利用图生成模块挖掘出第一图结构数据。从而在步骤S220,利用流量预测系统中的第一图神经网络处理该第一图结构数据和节点流量数据,得到N个对象节点的N个第一嵌入表征。
需说明,上述节点流量数据中包括各个对象节点在T个时刻下的T个流量值。具体,对于上述N个对象节点中的每个对象节点,可以采集该节点在多个历史时刻下的流量数据,然后根据训练样本的长度(文中记作T个时刻)和标签长度(文中记作τ个时刻)进行截取,得到多个训练样本及其中各个训练样本对应的标签。比如说,假定采集到某个节点在15个历史时刻下的流量数据,T和τ的取值分别为6和2,此时,可以采用长度为8的滑窗对长度为15的流量序列进行滑窗处理,得到(15-8+1)=8个流量子序列,并利用每个流量子序列中的前6个组成训练样本,后2个组成对应的流量标签。如此,可以得到N个对象节点的节点流量数据和对应的流量标签,可以理解,T为大于1的整数,τ为正整数。
基于此,可以利用第一图神经网络(可参见图1中的第一图神经网络12)处理得到的节点流量数据和挖掘出的第一图结构数据。可以理解,图神经网络(Graph NeuralNetworks,简称GNN)适用于处理图数据,包括基于关系网络图的图结构数据和图节点的原始特征进行图嵌入处理,从而得到融合了关系网络图空间结构信息的节点表征或图表征。
进一步,上述节点流量数据可以被归为图节点的原始特征,具体,各个对象节点的原始特征包括其在上述T个时刻下的T个流量值。需要理解,节点原始特征还可以包括除流量数据以外的其他特征,在一个示例中,节点表示的业务对象为道路,此时,原始特征还可以包括流量数据的采集时段(如上午、下午或晚上等),路旁的商圈等;在另一个示例中,节点表示的业务对象为应用软件,此时,原始特征还可以包括应用软件所提供服务的名称、应用软件中的界面内容等。
由此,可以利用第一图神经网络处理上述第一图结构数据和各个对象节点的原始特征。在一个实施例中,第一图神经网络可以实现为图卷积网络(Graph ConvolutionalNetworks,简称GCN)、图注意力网络(Graph Attention Networks,简称GAT)等。示例性地,第一图神经网络实现为GCN网络,相应,本步骤的实施可以通过计算下式实现:
在上式(3)中,表示由N个对象节点的N个第一嵌入表征构成的第一表征矩阵;I表示单位矩阵;D表示第一图结构数据对应的度矩阵,可以理解,度矩阵中的第i个对角线元素指示第i个对象节点的一阶邻居节点数量,非对角线元素为0;A(l)表示第一图结构数据;X表示N个节点对象的原始特征,例如,可以为N*T维的流量矩阵,其中第i行中的向量元素为第i个对象节点的T个流量值;W(l)和/>表示第一图神经网络中的网络参数。
如此,在步骤S220中可以得到N个对象节点的N个第一嵌入表征(或称N个第一嵌入向量)。
在执行步骤S220的之前、之后或同时,还可以执行步骤S230,利用流量预测系统中的第二图神经网络处理第二图结构数据和所述节点流量数据,得到N个对象节点的N个第二嵌入表征;所述第二图结构数据指示针对所述N个对象节点预先构建的原始连接关系。
需要理解,第二图结构数据是先验图结构数据。第一图神经网络和第二图神经网络(可参见图1中的第二图神经网络13)的实现算法可以相同,也可以不同,例如,均采用GCN网络,或者,一个采用GCN网络,另一个采用GAT网络。示例性地,第二图神经网络实现为GCN网络,相应,本步骤的实施可以通过计算下式实现:
在上式(3)中,表示由N个对象节点的N个第二嵌入表征构成的第二表征矩阵;I表示单位矩阵;D表示第二图结构数据对应的度矩阵;A(0)表示第二图结构数据;X表示N个节点对象的原始特征,例如,可以为N*T维的流量矩阵,其中第i行中的向量元素为第i个对象节点的T个流量值;W(0)和/>表示第一图神经网络中的网络参数。
需说明,对步骤S230的描述还可以参见对步骤S220的描述。
如此,在步骤S230中可以得到N个对象节点的N个第二嵌入表征(或称N个第二嵌入向量)。
在以上得到N个对象节点的N个第一嵌入表征和N个第二嵌入表征后,执行步骤S240,对这两部分嵌入表征进行融合处理,得到融合表征矩阵。
在一个实施例中,可以先引入自注意力(Self-Attention)机制对各个嵌入表征进行编码,再对编码结果进行融合处理,得到融合表征矩阵。可以理解,一个自注意力模块接收n个输入,然后对应返回n个输出;自注意力机制中的“自”是指每个输入都会彼此交互,“注意力”指的是计算每个输入为n个输入分配的n个注意力(可以理解为关注度),从而可以利用每个输入对应的n个注意力对n个输入进行加权处理,实现对每个输入的自注意力编码。
对于自注意力编码,在一个具体的实施例中,首先,将N个第一嵌入表征共同输入第一自注意力网络,得到N个第一编码向量,以及,将N个第二嵌入表征共同输入第二自注意力网络,得到N个第二编码向量。示例性地,两个自注意力网络都可以实现为Transformer网络。在另一个具体的实施例中,针对各个第一嵌入表征,计算该第一嵌入表征与N个第一嵌入表征之间的N个相似度,对该N个相似度进行归一化处理后作为N个注意力权重,从而将利用该N个注意力权重对N个第一嵌入表征进行加权求和的结果,作为该第一嵌入表征对应的第一编码向量;类似地,可以得到各个第二嵌入表征对应的第二编码向量。
在以上得到N个第一编码向量和N个第二编码向量后,可以对其中与同一对象节点对应的第一编码向量和第二编码向量进行融合处理,得到融合向量,从而利用N个融合向量构建融合表征矩阵。在一个具体地实施例中,融合处理可以采用求和、求平均、对位相乘等融合方式。
根据一个例子,引入两个自注意力网络实现对嵌入表征的自注意力编码,并采用求和的方式实现对编码结果的融合处理。此时,本步骤的实施可以记作下式:
上式(5)中,M(m)(X)表示融合表征矩阵,fa表示第一自注意力网络;θa表示第一自注意力网络中的网络参数;表示由N个第一嵌入表征构成的第一表征矩阵;fb表示第二自注意力网络;θb表示第二自注意力网络中的网络参数;/>表示由N个第二嵌入表征构成的第二表征矩阵。
由上,通过引入自注意力编码可以实现对节点流量序列更全面、高阶、准确的表征,从而使得融合表征矩阵包括的信息更加深入、准确。
在另一个实施例中,可以不引入自注意力机制,而是直接对N个第一嵌入表征和N个第二嵌入表征进行融合处理,包括对其中与同一对象节点对应的第一嵌入表征和第二嵌入表征进行融合处理,得到融合向量,从而利用N个融合向量构建融合表征矩阵。在一个具体地实施例中,融合处理可以采用求和、求平均、对位相乘等融合方式。
由上,可以得到融合表征矩阵。可以理解,其中融合了显式图结构和隐式图结构蕴含的信息。
之后,在步骤S250,利用流量预测系统中的时序网络处理该融合表征矩阵和上述节点流量数据,确定各个对象节点在T个时刻之后时刻下的预测流量值。
具体,本步骤中可以利用上述时序网络(可参见图1中的时序网络14)处理上述融合表征矩阵和基于各个对象节点的T个流量值确定出的T个流量数据。在一个实施例中,T个流量数据中任意的第t个流量数据包括T个流量值中第1个流量值至第t个流量值按时序形成的流量序列。在另一个具体的实施例中,可以直接将T个流量值作为T个流量数据。
可以理解,时序网络跟其他神经网络一样,包括输入层、隐藏层(或称隐层)和输出层,隐藏层用于对输入其中的数据进行线性变换等处理。另外,时序网络用于处理时间序列数据,具有独特的“记忆功能”,这体现在:在计算当前时刻的隐层状态时,不仅考虑当前时刻输入层的输入,还考虑上一时刻的隐藏状态。
基于此,在本步骤的实施中,设计利用上述融合表征矩阵,完成隐层中部分或全部的线性变换处理,其中至少包括对当前时刻输入的流量数据进行线性变换处理,从而基于线性变换处理的结果和上一时刻的隐层状态,确定当前隐层状态。进一步,在一个实施例中,其中线性变换处理还包括利用融合表征矩阵对上一时刻的隐层状态进行的线性变换。可以理解,若设计利用融合表征矩阵完成部分的线性变换处理,那其他部分的线性变换处理可以采用参数矩阵实现,其中参数矩阵是指组成元素为可优化参数的矩阵。
另一方面,在一个实施例中,对上述当前隐层状态的确定包括:对上述线性变换处理的结果进行非线性激活处理,从而基于激活处理结果和上一时刻的隐层状态,确定当前隐层状态。
根据一个例子,在时序网络的隐层,设计利用上述融合表征矩阵进行所有乘法形式的线性变换处理,并且,上述时序网络基于门控循环单元(Gated Recurrent Unit,简称GRU)实现,此时,可以将隐层中,基于当前时刻t输入的流量数据Xt和上一时刻t-1的隐层状态ht-1计算当前时刻t的隐层状态ht的过程记作下式:
zt=σ(M(m)([Xt,ht-1]))
rt=σ(M(m)([Xt,ht-1]))
上式(6)中,σ表示激活函数;M(m)表示融合表征矩阵;符号[,]表示对括号[]内逗号前后的两部分数据进行拼接;⊙表示张量之间的对位相乘运算;zt、rt和可简单视作计算过程产生的中间变量。
可以理解,公式(6)中针对zt和rt的计算表达式中通常还各自涉及其他参数项,如偏置矩阵等Wz和Wr。另外,时序网络的实现还可以基于循环神经网络(Recurrent NeuralNetworks,简称RNN)、长短期记忆网络(Long Short-Term Memory,简称LSTM)等。
如此,可以得到当前时刻t对应的当前隐层状态ht-1,依次类推,可以得到对应上述T个时刻的T个隐层状态。进一步,在时序网络中的输出层,可以利用此T个隐层状态中的部分或全部,确定T个时刻之后第T+1个时刻的预测流量值。示例性地,在输出层,利用该层中的参数向量对第T个时刻的隐层状态hT进行点积,再利用sigomid函数处理点积结果,得到预测流量值。
需说明的是,还可以继续确定T+1个时刻之后的若干时刻(一个或多个)的若干预测流量值,其中若干时刻的具体个数可以根据实际需要设定。另外,在此确定过程中,对于该若干时刻中的某个时刻,可以将针对在前时刻输出的流量预测值作为输入层的输入,从而得到该某个时刻下的预测流量值,例如,可以将第T+1个时刻的预测流量值作为输入层在第T+1个时刻的输入,从而在隐层利用此输入和第T个时刻的隐层状态确定第T+1个时刻的隐层状态,然后,在输出层基于该第T+1个时刻的隐层状态确定第T+2时刻下的预测流量值。
由上,可以确定出N个节点中各个对象节点在T个时刻之后的τ个(一个或多个)时刻下的预测流量值。另外需说明的是,本说明书实施例中的图生成模块和用于根据显式图结构、隐式图结构和节点流量序列生成融合表征矩阵的功能模块,都具有通用性,与具体的时空预测网络结构无关,也就是说,这两个模块可以适用于常见的时空预测网络,例如经典的STGCN和AGCRN。
之后,在步骤S260,根据N个对象节点中各个对象节点的预测流量值和对应的真实流量值(也即上述流量标签),更新上述流量预测系统中的参数。
具体地,针对各个对象节点,利用其预测流量值和对应的真实流量值确定训练损失。可以理解,预测流量值和真实流量值对应相同的τ个时刻,另外,训练损失的计算可以采用均方误差(Mean Square Error)或均方绝对误差(Mean Absolute Error)等损失函数。示例性地,可以采用下式计算损失:
上式(7)中,L(Wθ)表示训练损失;Wθ表示流量预测系统中的可优化参数;XT+1:T+τ表示从第T+1个时刻到第T+τ个时刻的真实流量值;表示从第T+1个时刻到第T+τ个时刻的预测流量值。
进一步,基于计算出的训练损失,采用反向传播法,更新流量预测系统中的可优化参数。
以上,可以实现对流量预测系统的参数更新。由此,可以基于训练样本集重复执行上述方法流程,完成对流量预测系统的多次迭代更新,直至达到预设收敛标准,如迭代轮次达到预设次数,或者,在验证集上的损失小于预设阈值,等等,从而得到训练好的流量预测系统,用于实际使用阶段的流量预测。
综上,采用本说明书实施例披露的流量预测系统的更新方法,基于先验的显式图结构数据以及挖掘出的隐式图结构数据进行时空预测,同时考虑了时间的相关性和空间的依赖,可以有效提高流量预测结果的准确度。
以上主要对流量预测系统的更新方法进行介绍,实际此方法还可以拓展到针对其他业务指标,如交易额、交易笔数、温度等,的预测系统。对此,图3示出本说明书实施例披露的指标预测系统的更新方法流程示意图,所述方法的执行主体可以为任何具有计算、处理能力的装置、平台、服务器或设备集群等。
与上述流量预测系统类似地,指标预测系统中包括图生成模块、时序网络和两个图神经网络,如图3所示,所述方法包括以下步骤:
步骤S310,基于指标预测系统中的图生成模块中用于表征N个对象节点的节点表征参数,生成第一图结构数据,其指示针对所述N个对象节点挖掘出的连接关系。
在一个实施例中,N个对象节点对应的业务对象为用户(包括个人用户或企业用户),对应的业务指标可以是交易额、交易笔数等。在另一个实施例中,N个对象节点对应的业务对象为商品,对应的业务指标可以是点击量、销量等。在还一个实施例中,N个对象节点对应的业务对象为事件(如交易事件、登录事件、访问事件),对应的业务指标可以是成功率、投诉率等。
步骤S320,利用指标预测系统中的第一图神经网络处理第一图结构数据和节点指标数据,得到所述N个对象节点的N个第一嵌入表征;所述节点指标数据包括各个对象节点在T个时刻下的T个指标值。
步骤S330,利用指标预测系统中的第二图神经网络处理第二图结构数据和所述节点指标数据,得到所述N个对象节点的N个第二嵌入表征;所述第二图结构数据指示针对所述N个对象节点预先构建的原始连接关系。
步骤S340,基于所述N个第一嵌入表征和N个第二嵌入表征进行融合处理,得到融合表征矩阵;
步骤S350,利用指标预测系统中的时序网络处理所述融合表征矩阵和所述T个指标值,确定所述各个对象节点在所述T个时刻之后时刻下的预测指标值;
步骤S360,根据上述预测指标值和对应的真实指标值,更新指标预测系统中的参数。
需要说明,对图3中步骤的描述,还可以参见前述对图2中步骤的介绍,在合理情况下,可以直接用词语“指标”去替换词语“流量”。
综上,采用本说明书实施例披露的指标预测系统的更新方法,通过对基于先验知识确定出的显式的图结构数据以及挖掘出的隐式的图结构数据进行融合,并将融合结果用于指标预测,可以有效提高指标预测结果的准确度。
与上述预测系统更新方法相对应地,本说明书实施例还披露预测系统更新装置。图4示出本说明书实施例披露的流量预测系统的更新装置结构示意图,所述流量预测系统包括图生成模块、时序网络和两个图神经网络;所述装置400包括:
图数据生成单元410,配置为基于所述图生成模块中用于表征N个对象节点的节点表征参数,生成第一图结构数据,其指示针对所述N个对象节点挖掘出的连接关系。第一图嵌入单元420,配置为利用第一图神经网络处理第一图结构数据和节点流量数据,得到所述N个对象节点的N个第一嵌入表征;所述节点流量数据包括各个对象节点在T个时刻下的T个流量值。第二图嵌入单元430,配置为利用第二图神经网络处理第二图结构数据和所述节点流量数据,得到所述N个对象节点的N个第二嵌入表征;所述第二图结构数据指示针对所述N个对象节点预先构建的原始连接关系。表征融合单元440,配置为基于所述N个第一嵌入表征和N个第二嵌入表征进行融合处理,得到融合表征矩阵。流量预测单元450,配置为利用所述时序网络处理所述融合表征矩阵和所述T个流量值,确定所述各个对象节点在所述T个时刻之后时刻下的预测流量值。参数更新单元460,配置为根据所述预测流量值和对应的真实流量值,更新所述流量预测系统中的参数。
在一个实施例中,所述N个对象节点对应的业务对象为应用软件,流量为数据流量;或者,所述业务对象为兴趣点POI,流量为交通流量。
在一个实施例中,图数据生成单元410包括:相似度确定子单元411,配置为基于所述节点表征参数,确定相似度矩阵,其中第i行第j列的矩阵元素表示第i个对象节点和第j个对象节点之间的相似度;图结构确定子单元412,配置为基于所述相似度矩阵,确定所述第一图结构数据。
在一个具体的实施例中,图结构确定子单元412具体配置为:对所述相似度矩阵进行稀疏化处理,得到所述第一图结构数据。
在一个更具体的实施例中,图结构确定子单元412进一步配置为:利用Gumbel-softmax函数处理所述相似度矩阵,得到第一图结构数据。
在一个实施例中,所述流量预测系统还包括第一自注意力网络和第二自注意力网络;其中,表征融合单元440具体配置为:将所述N个第一嵌入表征共同输入所述第一自注意力网络,得到N个第一编码向量;将所述N个第二嵌入表征共同输入所述第二自注意力网络,得到N个第二编码向量;对与同一对象节点对应的第一编码向量和第二编码向量进行融合处理,得到融合向量,用以形成所述融合表征矩阵。
在一个实施例中,流量预测单元450包括:输入子单元451,配置为将基于所述T个流量值确定出的T个流量数据依次输入所述时序网络,处理子单元452,配置为在所述时序网络中利用所述融合表征矩阵处理所述输入,从而得到所述预测流量值。
在一个具体的实施例中,所述T个流量数据中的第t个流量数据包括,所述T个流量值中第1个流量值至第t个流量值按时序形成的序列。
在一个具体的实施例中,处理子单元452具体配置为:在所述时序网络的隐层中,利用所述融合表征矩阵对当前时刻输入的流量数据和上一时刻的隐层状态进行线性变换处理,并基于所述线性变换处理的结果和所述上一时刻的隐层状态,确定当前隐层状态。
在一个更具体的实施例中,处理子单元452进一步配置为:对所述线性变换处理的结果进行非线性激活处理,基于激活处理结果和所述上一时刻的隐层状态,确定所述当前隐层状态。
综上,采用本说明书实施例披露的流量预测系统的更新装置,通过对基于先验知识确定出的显式的图结构数据以及挖掘出的隐式的图结构数据进行融合,并将融合结果用于流量预测,可以有效提高流量预测结果的准确度。
图5示出本说明书实施例披露的指标预测系统的更新装置结构示意图,所述指标预测系统包括图生成模块、时序网络和两个图神经网络。如图5所示,所述装置500包括:
图数据生成单元510,配置为基于所述图生成模块中用于表征N个对象节点的节点表征参数,生成第一图结构数据,其指示针对所述N个对象节点挖掘出的连接关系。第一图嵌入单元520,配置为利用第一图神经网络处理第一图结构数据和节点指标数据,得到所述N个对象节点的N个第一嵌入表征;所述节点指标数据包括各个对象节点在T个时刻下的T个指标值。第二图嵌入单元530,配置为利用第二图神经网络处理第二图结构数据和所述节点指标数据,得到所述N个对象节点的N个第二嵌入表征;所述第二图结构数据指示针对所述N个对象节点预先构建的原始连接关系。表征融合单元540,配置为基于所述N个第一嵌入表征和N个第二嵌入表征进行融合处理,得到融合表征矩阵。指标预测单元550,配置为利用所述时序网络处理所述融合表征矩阵和所述T个指标值,确定所述各个对象节点在所述T个时刻之后时刻下的预测指标值。参数更新单元560,配置为根据所述预测指标值和对应的真实指标值,更新所述指标预测系统中的参数。
在一个实施例中,N个对象节点对应的业务对象为用户(包括个人用户或企业用户),对应的业务指标可以是交易额、交易笔数等。在另一个实施例中,N个对象节点对应的业务对象为商品,对应的业务指标可以是点击量、销量、交易额、交易笔数等。在还一个实施例中,N个对象节点对应的业务对象为事件(如交易事件、登录事件、访问事件),对应的业务指标可以是成功率、投诉率等。
在一个实施例中,图数据生成单元510包括:相似度确定子单元511,配置为基于所述节点表征参数,确定相似度矩阵,其中第i行第j列的矩阵元素表示第i个对象节点和第j个对象节点之间的相似度;图结构确定子单元512,配置为基于所述相似度矩阵,确定所述第一图结构数据。
在一个具体的实施例中,图结构确定子单元512具体配置为:对所述相似度矩阵进行稀疏化处理,得到所述第一图结构数据。
在一个更具体的实施例中,图结构确定子单元512进一步配置为:利用Gumbel-softmax函数处理所述相似度矩阵,得到第一图结构数据。
在一个实施例中,所述指标预测系统还包括第一自注意力网络和第二自注意力网络;其中,表征融合单元540具体配置为:将所述N个第一嵌入表征共同输入所述第一自注意力网络,得到N个第一编码向量;将所述N个第二嵌入表征共同输入所述第二自注意力网络,得到N个第二编码向量;对与同一对象节点对应的第一编码向量和第二编码向量进行融合处理,得到融合向量,用以形成所述融合表征矩阵。
在一个实施例中,指标预测单元550包括:输入子单元551,配置为将基于所述T个指标值确定出的T个指标数据依次输入所述时序网络,处理子单元552,配置为在所述时序网络中利用所述融合表征矩阵处理所述输入,从而得到所述预测指标值。
在一个具体的实施例中,所述T个指标数据中的第t个指标数据包括,所述T个指标值中第1个指标值至第t个指标值按时序形成的序列。
在一个具体的实施例中,处理子单元552具体配置为:在所述时序网络的隐层中,利用所述融合表征矩阵对当前时刻输入的指标数据和上一时刻的隐层状态进行线性变换处理,并基于所述线性变换处理的结果和所述上一时刻的隐层状态,确定当前隐层状态。
在一个更具体的实施例中,处理子单元552进一步配置为:对所述线性变换处理的结果进行非线性激活处理,基于激活处理结果和所述上一时刻的隐层状态,确定所述当前隐层状态。
综上,采用本说明书实施例披露的指标预测系统的更新装置,通过对基于先验知识确定出的显式的图结构数据以及挖掘出的隐式的图结构数据进行融合,并将融合结果用于业务指标预测,可以有效提高指标预测结果的准确度。
根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图2或图3所描述的方法。
根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图2或图3所描述的方法。本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。
Claims (14)
1.一种流量预测系统的更新方法,所述流量预测系统包括图生成模块、时序网络和两个图神经网络;所述方法包括:
基于所述图生成模块中用于表征N个对象节点的节点表征参数,确定相似度矩阵,其中第i行第j列的矩阵元素表示第i个对象节点和第j个对象节点之间的相似度;基于所述相似度矩阵,生成第一图结构数据,其指示针对所述N个对象节点挖掘出的连接关系;
利用第一图神经网络处理第一图结构数据和节点流量数据,得到所述N个对象节点的N个第一嵌入表征;所述节点流量数据包括各个对象节点在T个时刻下的T个流量值;
利用第二图神经网络处理第二图结构数据和所述节点流量数据,得到所述N个对象节点的N个第二嵌入表征;所述第二图结构数据指示针对所述N个对象节点预先构建的原始连接关系;
基于所述N个第一嵌入表征和N个第二嵌入表征进行融合处理,得到融合表征矩阵;
将基于所述T个流量值确定出的T个流量数据依次输入所述时序网络,并在所述时序网络中利用所述融合表征矩阵处理所述输入,从而得到所述各个对象节点在所述T个时刻之后时刻下的预测流量值;
根据所述预测流量值和对应的真实流量值,更新所述流量预测系统中的参数。
2.根据权利要求1所述的方法,其中,所述N个对象节点对应的业务对象为应用软件,流量为数据流量;或者,所述业务对象为兴趣点POI,流量为交通流量。
3.根据权利要求1所述的方法,其中,基于所述相似度矩阵,生成第一图结构数据,包括:
对所述相似度矩阵进行稀疏化处理,得到所述第一图结构数据。
4.根据权利要求3所述的方法,其中,所述稀疏化处理包括:
利用Gumbel-softmax函数处理所述相似度矩阵。
5.根据权利要求1所述的方法,其中,所述流量预测系统还包括第一自注意力网络和第二自注意力网络;其中,基于所述N个第一嵌入表征和N个第二嵌入表征进行融合处理,得到融合表征矩阵,包括:
将所述N个第一嵌入表征共同输入所述第一自注意力网络,得到N个第一编码向量;
将所述N个第二嵌入表征共同输入所述第二自注意力网络,得到N个第二编码向量;
对与同一对象节点对应的第一编码向量和第二编码向量进行融合处理,得到融合向量,用以形成所述融合表征矩阵。
6.根据权利要求1所述的方法,其中,所述T个流量数据中的第t个流量数据包括,所述T个流量值中第1个流量值至第t个流量值按时序形成的序列。
7.根据权利要求1所述的方法,其中,在所述时序网络中利用所述融合表征矩阵处理所述输入,包括:
在所述时序网络的隐层中,利用所述融合表征矩阵对当前时刻输入的流量数据和上一时刻的隐层状态进行线性变换处理,并基于所述线性变换处理的结果和所述上一时刻的隐层状态,确定当前隐层状态。
8.根据权利要求7所述的方法,其中,确定当前隐层状态,包括:
对所述线性变换处理的结果进行非线性激活处理,基于激活处理结果和所述上一时刻的隐层状态,确定所述当前隐层状态。
9.一种指标预测系统的更新方法,所述指标预测系统包括图生成模块、时序网络和两个图神经网络;所述方法包括:
基于所述图生成模块中用于表征N个对象节点的节点表征参数,确定相似度矩阵,其中第i行第j列的矩阵元素表示第i个对象节点和第j个对象节点之间的相似度;基于所述相似度矩阵,生成第一图结构数据,其指示针对所述N个对象节点挖掘出的连接关系;
利用第一图神经网络处理第一图结构数据和节点指标数据,得到所述N个对象节点的N个第一嵌入表征;所述节点指标数据包括各个对象节点在T个时刻下的T个指标值;
利用第二图神经网络处理第二图结构数据和所述节点指标数据,得到所述N个对象节点的N个第二嵌入表征;所述第二图结构数据指示针对所述N个对象节点预先构建的原始连接关系;
基于所述N个第一嵌入表征和N个第二嵌入表征进行融合处理,得到融合表征矩阵;
将基于所述T个指标值确定出的T个指标数据依次输入所述时序网络,并在所述时序网络中利用所述融合表征矩阵处理所述输入,从而得到所述各个对象节点在所述T个时刻之后时刻下的预测指标值;
根据所述预测指标值和对应的真实指标值,更新所述指标预测系统中的参数。
10.根据权利要求9所述的方法,其中,所述N个对象节点对应的业务对象为用户或商品,指标为交易额或交易笔数。
11.一种流量预测系统的更新装置,所述流量预测系统包括图生成模块、时序网络和两个图神经网络;所述装置包括:
图数据生成单元,配置为基于所述图生成模块中用于表征N个对象节点的节点表征参数,确定相似度矩阵,其中第i行第j列的矩阵元素表示第i个对象节点和第j个对象节点之间的相似度;基于所述相似度矩阵,生成第一图结构数据,其指示针对所述N个对象节点挖掘出的连接关系;
第一图嵌入单元,配置为利用第一图神经网络处理第一图结构数据和节点流量数据,得到所述N个对象节点的N个第一嵌入表征;所述节点流量数据包括各个对象节点在T个时刻下的T个流量值;
第二图嵌入单元,配置为利用第二图神经网络处理第二图结构数据和所述节点流量数据,得到所述N个对象节点的N个第二嵌入表征;所述第二图结构数据指示针对所述N个对象节点预先构建的原始连接关系;
表征融合单元,配置为基于所述N个第一嵌入表征和N个第二嵌入表征进行融合处理,得到融合表征矩阵;
流量预测单元,配置为将基于所述T个流量值确定出的T个流量数据依次输入所述时序网络,并在所述时序网络中利用所述融合表征矩阵处理所述输入,从而得到所述各个对象节点在所述T个时刻之后时刻下的预测流量值;
参数更新单元,配置为根据所述预测流量值和对应的真实流量值,更新所述流量预测系统中的参数。
12.一种指标预测系统的更新装置,所述指标预测系统包括图生成模块、时序网络和两个图神经网络;所述装置包括:
图数据生成单元,配置为基于所述图生成模块中用于表征N个对象节点的节点表征参数,确定相似度矩阵,其中第i行第j列的矩阵元素表示第i个对象节点和第j个对象节点之间的相似度;基于所述相似度矩阵,生成第一图结构数据,其指示针对所述N个对象节点挖掘出的连接关系;
第一图嵌入单元,配置为利用第一图神经网络处理第一图结构数据和节点指标数据,得到所述N个对象节点的N个第一嵌入表征;所述节点指标数据包括各个对象节点在T个时刻下的T个指标值;
第二图嵌入单元,配置为利用第二图神经网络处理第二图结构数据和所述节点指标数据,得到所述N个对象节点的N个第二嵌入表征;所述第二图结构数据指示针对所述N个对象节点预先构建的原始连接关系;
表征融合单元,配置为基于所述N个第一嵌入表征和N个第二嵌入表征进行融合处理,得到融合表征矩阵;
指标预测单元,配置为将基于所述T个指标值确定出的T个指标数据依次输入所述时序网络,并在所述时序网络中利用所述融合表征矩阵处理所述输入,从而得到所述各个对象节点在所述T个时刻之后时刻下的预测指标值;
参数更新单元,配置为根据所述预测指标值和对应的真实指标值,更新所述指标预测系统中的参数。
13.一种计算机可读存储介质,其上存储有计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-10中任一项所述的方法。
14.一种计算设备,包括存储器和处理器,其中,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-10中任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210924959.9A CN115359654B (zh) | 2022-08-02 | 2022-08-02 | 流量预测系统的更新方法及装置 |
US18/364,247 US20240048456A1 (en) | 2022-08-02 | 2023-08-02 | Methods and apparatuses for updating traffic prediction system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210924959.9A CN115359654B (zh) | 2022-08-02 | 2022-08-02 | 流量预测系统的更新方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115359654A CN115359654A (zh) | 2022-11-18 |
CN115359654B true CN115359654B (zh) | 2023-09-08 |
Family
ID=84001142
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210924959.9A Active CN115359654B (zh) | 2022-08-02 | 2022-08-02 | 流量预测系统的更新方法及装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20240048456A1 (zh) |
CN (1) | CN115359654B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110889546A (zh) * | 2019-11-20 | 2020-03-17 | 浙江省交通规划设计研究院有限公司 | 一种基于注意力机制的交通流量模型训练方法 |
CN112766500A (zh) * | 2021-02-07 | 2021-05-07 | 支付宝(杭州)信息技术有限公司 | 图神经网络的训练方法及装置 |
WO2021179834A1 (zh) * | 2020-03-10 | 2021-09-16 | 支付宝(杭州)信息技术有限公司 | 基于异构图进行业务处理的方法及装置 |
CN114006826A (zh) * | 2022-01-04 | 2022-02-01 | 南京信息工程大学 | 一种融合流量特征的网络流量预测方法 |
CN114399027A (zh) * | 2022-01-04 | 2022-04-26 | 支付宝(杭州)信息技术有限公司 | 利用神经网络进行序列处理的方法及序列处理的装置 |
CN114422382A (zh) * | 2022-01-28 | 2022-04-29 | 湖南大学 | 网络流量预测方法、计算机装置、产品及存储介质 |
CN114519610A (zh) * | 2022-02-16 | 2022-05-20 | 支付宝(杭州)信息技术有限公司 | 信息预测方法以及装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017015672A1 (en) * | 2015-07-23 | 2017-01-26 | Ayasdi, Inc. | Topological data analysis for identification of market regimes for prediction |
US11501137B2 (en) * | 2019-06-28 | 2022-11-15 | International Business Machines Corporation | Feature engineering in neural networks optimization |
US20210383228A1 (en) * | 2020-06-05 | 2021-12-09 | Deepmind Technologies Limited | Generating prediction outputs using dynamic graphs |
-
2022
- 2022-08-02 CN CN202210924959.9A patent/CN115359654B/zh active Active
-
2023
- 2023-08-02 US US18/364,247 patent/US20240048456A1/en active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110889546A (zh) * | 2019-11-20 | 2020-03-17 | 浙江省交通规划设计研究院有限公司 | 一种基于注意力机制的交通流量模型训练方法 |
WO2021179834A1 (zh) * | 2020-03-10 | 2021-09-16 | 支付宝(杭州)信息技术有限公司 | 基于异构图进行业务处理的方法及装置 |
CN112766500A (zh) * | 2021-02-07 | 2021-05-07 | 支付宝(杭州)信息技术有限公司 | 图神经网络的训练方法及装置 |
CN114006826A (zh) * | 2022-01-04 | 2022-02-01 | 南京信息工程大学 | 一种融合流量特征的网络流量预测方法 |
CN114399027A (zh) * | 2022-01-04 | 2022-04-26 | 支付宝(杭州)信息技术有限公司 | 利用神经网络进行序列处理的方法及序列处理的装置 |
CN114422382A (zh) * | 2022-01-28 | 2022-04-29 | 湖南大学 | 网络流量预测方法、计算机装置、产品及存储介质 |
CN114519610A (zh) * | 2022-02-16 | 2022-05-20 | 支付宝(杭州)信息技术有限公司 | 信息预测方法以及装置 |
Non-Patent Citations (1)
Title |
---|
基于分层注意力的信息级联预测模型;张志扬;张凤荔;陈学勤;王瑞锦;;计算机科学(第06期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN115359654A (zh) | 2022-11-18 |
US20240048456A1 (en) | 2024-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113535984B (zh) | 一种基于注意力机制的知识图谱关系预测方法及装置 | |
CN111475637B (zh) | 用于推送知识点的数据处理、训练方法及装置 | |
CN111079931A (zh) | 一种基于图神经网络的状态空间概率性多时间序列预测方法 | |
CN114492992B (zh) | 一种基于Transformer的自适应时空图神经网络交通流预测方法及系统 | |
US20140214735A1 (en) | Method for an optimizing predictive model using gradient descent and conjugate residuals | |
CN110138595A (zh) | 动态加权网络的时间链路预测方法、装置、设备及介质 | |
CN113190688B (zh) | 基于逻辑推理和图卷积的复杂网络链接预测方法及系统 | |
CN116010684A (zh) | 物品推荐方法、装置及存储介质 | |
WO2020211611A1 (zh) | 用于语言处理的循环神经网络中隐状态的生成方法和装置 | |
Tang et al. | A fast inference networks for SAR target few-shot learning based on improved siamese networks | |
WO2022134926A1 (en) | Multi-level multi-objective automated machine learning | |
CN110232151B (zh) | 一种混合概率分布检测的QoS预测模型的构建方法 | |
CN115080795A (zh) | 一种多充电站协同负荷预测方法及装置 | |
CN117574915A (zh) | 基于多方数据源的公共数据平台及其数据分析方法 | |
CN113705402B (zh) | 视频行为预测方法、系统、电子设备及存储介质 | |
Wei et al. | Diff-rntraj: A structure-aware diffusion model for road network-constrained trajectory generation | |
Du et al. | Structure tuning method on deep convolutional generative adversarial network with nondominated sorting genetic algorithm II | |
CN114298290A (zh) | 一种基于自监督学习的神经网络编码方法及编码器 | |
CN114338416A (zh) | 一种时空多指标预测方法、装置和存储介质 | |
CN115359654B (zh) | 流量预测系统的更新方法及装置 | |
Hoffmann et al. | Minimizing the expected posterior entropy yields optimal summary statistics | |
CN116401372A (zh) | 知识图谱表示学习方法、装置、电子设备及可读存储介质 | |
CN111125541B (zh) | 面向多用户的可持续多云服务组合的获取方法 | |
CN114092269A (zh) | 基于改进广义网络向量模型的时序数据预测方法及装置 | |
Vardhan et al. | A Comparative Analysis of Hold Out, Cross and Re-Substitution Validation in Hyper-Parameter Tuned Stochastic Short Term Load Forecasting |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |