CN110909942A - 训练模型的方法及系统和预测序列数据的方法及系统 - Google Patents

训练模型的方法及系统和预测序列数据的方法及系统 Download PDF

Info

Publication number
CN110909942A
CN110909942A CN201911180700.2A CN201911180700A CN110909942A CN 110909942 A CN110909942 A CN 110909942A CN 201911180700 A CN201911180700 A CN 201911180700A CN 110909942 A CN110909942 A CN 110909942A
Authority
CN
China
Prior art keywords
sequence
prediction
sequence data
graph
graph convolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911180700.2A
Other languages
English (en)
Other versions
CN110909942B (zh
Inventor
姚权铭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
4Paradigm Beijing Technology Co Ltd
Original Assignee
4Paradigm Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 4Paradigm Beijing Technology Co Ltd filed Critical 4Paradigm Beijing Technology Co Ltd
Priority to CN202211073426.0A priority Critical patent/CN115423190A/zh
Priority to CN201911180700.2A priority patent/CN110909942B/zh
Publication of CN110909942A publication Critical patent/CN110909942A/zh
Application granted granted Critical
Publication of CN110909942B publication Critical patent/CN110909942B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Software Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Primary Health Care (AREA)
  • Educational Administration (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

提供了一种训练模型的方法及系统和预测序列数据的方法及系统。预测序列数据的方法包括:获取对象的序列预测样本,其中,所述序列预测样本包括按时间顺序排列的多个序列数据;利用所述机器学习模型,针对所述序列预测样本执行预测来提供关于所述多个序列数据之后的下一序列数据的预测结果,其中,所述机器学习模型被事先训练为针对按时间顺序排列的一系列序列数据来预测所述一系列序列数据之后的下一序列数据,并且所述机器学习模型至少包括多个图卷积网络,其中,所述多个图卷积网络包括利用基于所述对象的历史序列数据构建的动态图训练出的第一图卷积网络以及利用基于与所述对象有关的静态数据构建的静态图训练出的第二图卷积网络。

Description

训练模型的方法及系统和预测序列数据的方法及系统
技术领域
本申请总体说来涉及人工智能领域,更具体地讲,涉及一种训练用于预测序列数据的基于图卷积网络的机器学习模型的方法及系统、以及利用基于图卷积网络的机器学习模型预测序列数据的方法及系统。
背景技术
随着海量数据的出现,人工智能技术迅速发展,而机器学习是人工智能发展到一定阶段的必然产物,其致力于通过计算的手段,从大量数据中挖掘有价值的潜在信息。通过机器学习对(例如,按时间顺序排列的交通流量)进行建模来挖掘序列数据背后的规律对于各种应用场景(例如,交通预测场景)非常重要。
图卷积网络(GCN)是对卷积神经网络(CNN)的扩展。CNN仅能处理规整的数据结构,如二维图片、三维视频。而GCN通过图谱理论或空间局部定义图形卷积,实现了在不规则的网络数据结构(诸如,社交网络、交通图网络)上定义卷积,从而更好的利用关系信息来挖掘序列数据背后的规律。
然而,目前的GCN无法处理多图融合尤其是动态图和静态图融合的情况。由于现有GCN方法中没有能够处理动态图和静态图融合的方法,因此以下三个关键问题无法被处理:
·图中的点随承担的角色不同,关系不同。例如,在交通图网络中,一个地区可看为一个点,随交通车辆在地区间往来产生边。同一个地区既可以看成起点,也可以看成终点。而起点间的关系和终点间的关系往往是不同的。然而,现有的方法无法处理这种双重关系图网络。
·动态性。图上的点之间的关系(边)通常是随时间变化的。
·由于不能利用额外信息构建静态图并将静态图和动态图融合,因此模型预测准确度不高。
发明内容
本发明在于解决目前的GCN无法处理动态图和静态图融合而导致模型预测准确性欠佳的问题,例如,在交通预测场景中,提高交通流量预测的准确性。
根据本申请示例性实施例,提供了一种利用基于图卷积网络的机器学习模型预测序列数据的方法,包括:获取对象的序列预测样本,其中,所述序列预测样本包括按时间顺序排列的多个序列数据;利用所述机器学习模型,针对所述序列预测样本执行预测来提供关于所述多个序列数据之后的下一序列数据的预测结果,其中,所述机器学习模型被事先训练为针对按时间顺序排列的一系列序列数据来预测所述一系列序列数据之后的下一序列数据,并且所述机器学习模型至少包括多个图卷积网络,其中,所述多个图卷积网络包括利用基于所述对象的历史序列数据构建的动态图训练出的第一图卷积网络以及利用基于与所述对象有关的静态数据构建的静态图训练出的第二图卷积网络。
可选地,针对所述序列预测样本执行预测来提供关于所述多个序列数据之后的下一序列数据的预测结果的步骤可包括:将所述序列预测样本分别输入第一图卷积网络和第二图卷积网络;利用第一图卷积网络获得针对所述序列预测样本的第一预测结果并利用第二图卷积网络获得针对所述序列预测样本的第二预测结果;按照预定规则将第一预测结果和第二预测结果进行融合来提供关于所述多个序列数据之后的下一序列数据的预测结果。
可选地,按照预定规则将第一预测结果和第二预测结果进行融合来提供关于所述多个序列数据之后的下一序列数据的预测结果可包括:将第一预测结果和第二预测结果取平均来获得关于所述多个序列数据之后的下一序列数据的预测结果。
可选地,所述机器学习模型还可包括基于所述多个图卷积网络的输出执行预测的子预测模型,其中,针对所述序列预测样本执行预测来提供关于所述多个序列数据之后的下一序列数据的预测结果的步骤可包括:将所述序列预测样本分别输入第一图卷积网络和第二图卷积网络;利用第一图卷积网络获得针对所述序列预测样本的第一预测结果并利用第二图卷积网络获得针对所述序列预测样本的第二预测结果;基于获得的第一预测结果和第二预测结果构建子预测样本;利用子预测模型,针对构建的子预测样本执行预测来提供关于所述多个序列数据之后的下一序列数据的预测结果。
可选地,所述机器学习模型还可包括用于提取序列数据的时间特征的回溯神经网络,其中,针对所述序列预测样本执行预测来提供关于所述多个序列数据之后的下一序列数据的预测结果的步骤包括:将所述序列预测样本输入所述回溯神经网络,并利用所述回溯神经网络提取所述序列预测样本的时间特征;将提取的时间特征分别输入第一图卷积网络和第二图卷积网络,利用第一图卷积网络获得针对所述序列预测样本的第一预测结果并利用第二图卷积网络获得针对所述序列预测样本的第二预测结果;按照预定规则将第一预测结果和第二预测结果进行融合来提供关于所述多个序列数据之后的下一序列数据的预测结果。
可选地,所述机器学习模型还可包括用于提取序列数据的时间特征的回溯神经网络、以及基于所述多个图卷积网络的输出执行预测的子预测模型,其中,针对所述序列预测样本执行预测来提供关于所述多个序列数据之后的下一序列数据的预测结果的步骤包括:将所述序列预测样本输入所述回溯神经网络,并利用所述回溯神经网络提取所述序列预测样本的时间特征;将提取的时间特征分别输入第一图卷积网络和第二图卷积网络,利用第一图卷积网络获得针对所述序列预测样本的第一预测结果并利用第二图卷积网络获得针对所述序列预测样本的第二预测结果;基于获得的第一预测结果和第二预测结果构建子预测样本;利用子预测模型,针对构建的子预测样本执行预测来提供关于所述多个序列数据之后的下一序列数据的预测结果。
可选地,所述回溯神经网络可以是长短期记忆LSTM网络,第一图卷积网络和第二图卷积网络可以是二维图卷积网络。
可选地,所述子预测模型可以是逻辑回归模型和决策树模型中的一个。
可选地,所述动态图是直接利用所述对象的历史序列数据构建的,或者所述动态图是利用从所述历史序列数据提取出的时间特征构建的。
可选地,所述对象可以是交通车辆,序列数据可以是在不同时隙交通图网络中区域之间的交通流量数据,所述静态数据可以是反映交通图网络中区域的属性的静态数据。
可选地,所述静态数据可包括交通图网络中每个区域的地理信息以及交通图网络中每个区域的感兴趣点信息,所述静态图可包括基于所述地理信息构建的第一静态图和基于所述感兴趣点信息构建的第二静态图,第二图卷积网络可包括利用第一静态图训练出的第二图卷积网络和利用第二静态图训练出的第二图卷积网络,针对所述序列预测样本执行预测来提供关于所述多个序列数据之后的下一序列数据的预测结果的步骤可包括:利用所述机器学习模型,针对按时间顺序排列的不同时隙的一系列交通流量数据来预测下一时隙的交通流量数据。
根据本申请另一示例性实施例,提供了一种存储指令的计算机可读存储介质,其中,当所述指令被至少一个计算装置运行时,促使所述至少一个计算装置执行如上所述的预测序列数据的方法。
根据本申请另一示例性实施例,提供了一种包括至少一个计算装置和存储指令的至少一个存储装置的系统,其中,所述指令在被所述至少一个计算装置运行时,促使所述至少一个计算装置执行如上所述的预测序列数据的方法。
根据本申请另一示例性实施例,提供了一种利用基于图卷积网络的机器学习模型预测序列数据的系统,所述系统可包括:预测样本获取装置,被配置为获取对象的序列预测样本,其中,所述序列预测样本包括按时间顺序排列的多个序列数据;预测装置,被配置为利用所述机器学习模型,针对所述序列预测样本执行预测来提供关于所述多个序列数据之后的下一序列数据的预测结果,其中,所述机器学习模型被事先训练为针对按时间顺序排列的一系列序列数据来预测所述一系列序列数据之后的下一序列数据,并且所述机器学习模型至少包括多个图卷积网络,其中,所述多个图卷积网络包括利用基于所述对象的历史序列数据构建的动态图训练出的第一图卷积网络以及利用基于与所述对象有关的静态数据构建的静态图训练出的第二图卷积网络。
可选地,预测装置被配置为:将所述序列预测样本分别输入第一图卷积网络和第二图卷积网络;利用第一图卷积网络获得针对所述序列预测样本的第一预测结果并利用第二图卷积网络获得针对所述序列预测样本的第二预测结果;按照预定规则将第一预测结果和第二预测结果进行融合来提供关于所述多个序列数据之后的下一序列数据的预测结果。
可选地,按照预定规则将第一预测结果和第二预测结果进行融合来提供关于所述多个序列数据之后的下一序列数据的预测结果可包括:将第一预测结果和第二预测结果取平均来获得关于所述多个序列数据之后的下一序列数据的预测结果。
可选地,所述机器学习模型还可包括基于所述多个图卷积网络的输出执行预测的子预测模型,其中,预测装置可被配置为:将所述序列预测样本分别输入第一图卷积网络和第二图卷积网络;利用第一图卷积网络获得针对所述序列预测样本的第一预测结果并利用第二图卷积网络获得针对所述序列预测样本的第二预测结果;基于获得的第一预测结果和第二预测结果构建子预测样本;利用子预测模型,针对构建的子预测样本执行预测来提供关于所述多个序列数据之后的下一序列数据的预测结果。
可选地,所述机器学习模型还可包括用于提取序列数据的时间特征的回溯神经网络,其中,预测装置可被配置为:将所述序列预测样本输入所述回溯神经网络,并利用所述回溯神经网络提取所述序列预测样本的时间特征;将提取的时间特征分别输入第一图卷积网络和第二图卷积网络,利用第一图卷积网络获得针对所述序列预测样本的第一预测结果并利用第二图卷积网络获得针对所述序列预测样本的第二预测结果;按照预定规则将第一预测结果和第二预测结果进行融合来提供关于所述多个序列数据之后的下一序列数据的预测结果。
可选地,所述机器学习模型还可包括用于提取序列数据的时间特征的回溯神经网络、以及基于所述多个图卷积网络的输出执行预测的子预测模型,其中,预测装置可被配置为:将所述序列预测样本输入所述回溯神经网络,并利用所述回溯神经网络提取所述序列预测样本的时间特征;将提取的时间特征分别输入第一图卷积网络和第二图卷积网络,利用第一图卷积网络获得针对所述序列预测样本的第一预测结果并利用第二图卷积网络获得针对所述序列预测样本的第二预测结果;基于获得的第一预测结果和第二预测结果构建子预测样本;利用子预测模型,针对构建的子预测样本执行预测来提供关于所述多个序列数据之后的下一序列数据的预测结果。
可选地,所述回溯神经网络可以是长短期记忆LSTM网络,第一图卷积网络和第二图卷积网络可以是二维图卷积网络。
可选地,所述子预测模型可以是逻辑回归模型和决策树模型中的一个。
可选地,所述动态图是直接利用所述对象的历史序列数据构建的,或者所述动态图是利用从所述历史序列数据提取出的时间特征构建的。
可选地,所述对象可以是交通车辆,序列数据可以是在不同时隙交通图网络中区域之间的交通流量数据,所述静态数据可以是反映交通图网络中区域的属性的静态数据。
可选地,所述静态数据可包括交通图网络中每个区域的地理信息以及交通图网络中每个区域的感兴趣点信息,所述静态图可包括基于所述地理信息构建的第一静态图和基于所述感兴趣点信息构建的第二静态图,第二图卷积网络可包括利用第一静态图训练出的第二图卷积网络和利用第二静态图训练出的第二图卷积网络,预测装置可被配置为利用所述机器学习模型,针对按时间顺序排列的不同时隙的一系列交通流量数据来预测下一时隙的交通流量数据。
根据本公开另一示例性实施例,提供了一种训练用于预测序列数据的基于图卷积网络的机器学习模型的方法,包括:获取对象的序列训练样本集,其中,所述序列训练样本集包括多个序列训练样本,并且每个序列训练样本包括按时间顺序排列的多个序列数据;基于所述序列训练样本集,训练所述机器学习模型,其中,所述机器学习模型至少包括多个图卷积网络,其中,所述多个图卷积网络包括将利用基于所述对象的历史序列数据构建的动态图训练的第一图卷积网络以及将利用基于与所述对象有关的静态数据构建的静态图训练的第二图卷积网络。
可选地,训练所述机器学习模型的步骤可包括:基于所述序列训练样本集中的每个序列训练样本构建动态图,并基于与所述对象有关的静态数据构建静态图;将所述序列训练样本集中的每个序列训练样本分别输入第一图卷积网络和第二图卷积网络;基于每个序列训练样本,利用所述动态图训练第一图卷积网络并利用所述静态图训练第二图卷积网络。
可选地,所述机器学习模型还可包括基于所述多个图卷积网络的输出执行预测的子预测模型,其中,训练所述机器学习模型的步骤还可包括:基于第一图卷积网络和第二图卷积网络分别针对每个序列训练样本的输出来构建子训练样本,并利用所述子训练样本训练子预测模型。
可选地,所述机器学习模型还可包括用于提取序列数据的时间特征的回溯神经网络,其中,训练所述机器学习模型的步骤可包括:基于所述序列训练样本集中的每个序列训练样本构建动态图,并基于与所述对象有关的静态数据构建静态图;将所述序列训练样本集中的每个序列训练样本输入所述回溯神经网络,并利用所述回溯神经网络提取每个序列训练样本的时间特征;将提取的每个序列训练样本的时间特征分别输入第一图卷积网络和第二图卷积网络;基于每个序列训练样本的时间特征,训练所述回溯神经网络并且利用所述动态图训练第一图卷积网络并利用所述静态图训练第二图卷积网络。
可选地,所述机器学习模型还可包括基于所述多个图卷积网络的输出执行预测的子预测模型,其中,训练所述机器学习模型的步骤还可包括:基于第一图卷积网络和第二图卷积网络分别针对每个序列训练样本的时间特征的输出来构建子训练样本,并利用所述子训练样本训练子预测模型。
可选地,所述回溯神经网络可以是长短期记忆LSTM网络,第一图卷积网络和第二图卷积网络可以是二维图卷积网络。
可选地,所述子预测模型可以是逻辑回归模型和决策树模型中的一个。
可选地,基于所述序列训练样本集中的每个序列训练样本构建动态图可包括:直接利用每个序列训练样本构建动态图,或者利用从每个序列训练样本提取出的时间特征构建动态图。
可选地,所述对象可以是交通车辆,序列数据可以是在不同时隙交通图网络中区域之间的交通流量数据,所述静态数据可以是反映交通图网络中区域的属性的静态数据。
可选地,所述静态数据可包括交通图网络中每个区域的地理信息以及交通图网络中每个区域的感兴趣节点信息,所述静态图可包括基于所述地理信息构建的第一静态图和基于所述感兴趣点信息构建的第二静态图,第二图卷积网络可包括利用第一静态图训练的第二图卷积网络和利用第二静态图训练的第二图卷积网络,所述机器学习模型可被训练为针对按时间顺序排列的不同时隙的一系列交通流量数据来预测下一时隙的交通流量数据。
根据另一示例性实施例,提供了一种存储指令的计算机可读存储介质,其中,当所述指令被至少一个计算装置运行时,促使所述至少一个计算装置执行如上所述的训练机器学习模型的方法。
根据另一示例性实施例,提供了一种包括至少一个计算装置和存储指令的至少一个存储装置的系统,其中,所述指令在被所述至少一个计算装置运行时,促使所述至少一个计算装置执行如上所述的训练机器学习模型的方法。
根据另一示例性实施例,提供了一种训练用于预测序列数据的基于图卷积网络的机器学习模型的系统,所述系统可包括:训练样本获取装置,被配置为获取对象的序列训练样本集,其中,所述序列训练样本集包括多个序列训练样本,并且每个序列训练样本包括按时间顺序排列的多个序列数据;训练装置,被配置为基于所述序列训练样本集,训练所述机器学习模型,其中,所述机器学习模型至少包括多个图卷积网络,其中,所述多个图卷积网络包括将利用基于所述对象的历史序列数据构建的动态图训练的第一图卷积网络以及将利用基于与所述对象有关的静态数据构建的静态图训练的第二图卷积网络。
可选地,训练装置可被配置为:基于所述序列训练样本集中的每个序列训练样本构建动态图,并基于与所述对象有关的静态数据构建静态图;将所述序列训练样本集中的每个序列训练样本分别输入第一图卷积网络和第二图卷积网络;基于每个序列训练样本,利用所述动态图训练第一图卷积网络并利用所述静态图训练第二图卷积网络。
可选地,所述机器学习模型还可包括基于所述多个图卷积网络的输出执行预测的子预测模型,其中,训练装置还可被配置为:基于第一图卷积网络和第二图卷积网络分别针对每个序列训练样本的输出来构建子训练样本,并利用所述子训练样本训练子预测模型。
可选地,所述机器学习模型还可包括用于提取序列数据的时间特征的回溯神经网络,其中,训练装置可被配置为:基于所述序列训练样本集中的每个序列训练样本构建动态图,并基于与所述对象有关的静态数据构建静态图;将所述序列训练样本集中的每个序列训练样本输入所述回溯神经网络,并利用所述回溯神经网络提取每个序列训练样本的时间特征;将提取的每个序列训练样本的时间特征分别输入第一图卷积网络和第二图卷积网络;基于每个序列训练样本的时间特征,训练所述回溯神经网络并且利用所述动态图训练第一图卷积网络并利用所述静态图训练第二图卷积网络。
可选地,所述机器学习模型还可包括基于所述多个图卷积网络的输出执行预测的子预测模型,其中,训练装置还可被配置为:基于第一图卷积网络和第二图卷积网络分别针对每个序列训练样本的时间特征的输出来构建子训练样本,并利用所述子训练样本训练子预测模型。
可选地,所述回溯神经网络可以是长短期记忆LSTM网络,第一图卷积网络和第二图卷积网络可以是二维图卷积网络。
可选地,所述子预测模型可以是逻辑回归模型和决策树模型中的一个。
可选地,基于所述序列训练样本集中的每个序列训练样本构建动态图可包括:直接利用每个序列训练样本构建动态图,或者利用从每个序列训练样本提取出的时间特征构建动态图。
可选地,所述对象可以是交通车辆,序列数据可以是在不同时隙交通图网络中区域之间的交通流量数据,所述静态数据可以是反映交通图网络中区域的属性的静态数据。
可选地,所述静态数据可包括交通图网络中每个区域的地理信息以及交通图网络中每个区域的感兴趣节点信息,所述静态图可包括基于所述地理信息构建的第一静态图和基于所述感兴趣点信息构建的第二静态图,第二图卷积网络可包括利用第一静态图训练的第二图卷积网络和利用第二静态图训练的第二图卷积网络,所述机器学习模型可被训练为针对按时间顺序排列的不同时隙的一系列交通流量数据来预测下一时隙的交通流量数据。
根据本申请示例性实施例的训练机器学习模型的方法及系统可训练出能够有效处理动态图和静态图融合的机器学习模型,从而使得训练出的机器学习模型可提供更加准确的序列数据预测结果。
根据本申请示例性实施例的利用机器学习模型预测序列数据的方法可有效处理动态图和静态图的融合,进而可提供更加准确的序列数据预测结果,例如,在交通流量预测场景中可更加准确地预测下一时隙的交通流量。
附图说明
从下面结合附图对本申请实施例的详细描述中,本申请的这些和/或其他方面和优点将变得更加清楚并更容易理解,其中:
图1是示出根据本申请示例性实施例的训练用于预测序列数据的基于图卷积网络的机器学习模型的系统的框图;
图2是示出根据本申请示例性实施例的机器学习模型的示例的示意图;
图3是根据本申请示例性实施例的训练用于预测序列数据的基于图卷积网络的机器学习模型的方法的流程图;
图4是示出根据本申请示例性实施例的利用基于图卷积网络的机器学习模型预测序列数据的系统的框图;
图5是示出根据本申请示例性实施例的利用基于图卷积网络的机器学习模型预测序列数据的过程的示意图;
图6是示出根据本申请示例性实施例的利用基于图卷积网络的机器学习模型预测序列数据的方法的流程图。
具体实施方式
为了使本领域技术人员更好地理解本申请,下面结合附图和具体实施方式对本申请的示例性实施例作进一步详细说明。
图1是示出根据本申请示例性实施例的训练用于预测序列数据的基于图卷积网络的机器学习模型的系统(在下文中,为描述方便,将其简称为“模型训练系统”)100的框图。如图1所示,模型训练系统100可包括训练样本获取装置110和训练装置120。
具体地,训练样本获取装置110可获取对象的序列训练样本集。这里,序列训练样本集可包括多个序列训练样本,并且每个序列训练样本可包括按时间顺序排列的多个序列数据。作为示例,在交通流量预测场景中,对象可以是交通车辆,序列数据可以是在不同时隙交通图网络中区域之间的交通流量数据。在交通图网络中,一个区域可看作一个节点,车辆在不同区域间往来产生边,并且同一区域既可以看作起点,也可以看作终点。
在下文中,为简洁起见,将以交通流量预测场景为例对本发明构思进行介绍,然而,本领域技术人员清楚的是,无论是以上提及的对象,还是相应的序列数据均不限于以上示例。对象和序列数据可根据不同应用场景而变化,例如,在人流量预测场景中,对象可以是人,序列数据可以是在不同时隙交通图网络中区域之间的人流量数据。再例如,在鸟类迁徙预测场景中,对象可以是鸟类,序列数据可以是在不同时隙各区域之间的迁徙情况,等等。
此外,按时间顺序排列的多个序列数据可以是不同时隙的多个序列数据,并且相邻时隙之间的间隔可以相同或不同,本申请对此并无限制。例如,按时间顺序排列的多个序列数据可以被表示为[Xt-24×7,Xt-24,Xt-3,Xt-2,Xt-1],它们分别是一个星期前的序列数据(即,第(t-24×7)个时隙的序列数据)、一天前的序列数据(即,第(t-24)个时隙的序列数据)以及最近三个时隙的序列数据(即,第(t-3)、(t-2)和(t-1)个时隙的序列数据),其中,每个序列数据都可以被表示为一个矩阵。例如,在交通流量预测场景中,每个时隙的序列数据可被表示为由xij组成的矩阵,其中,xij表示从交通图网络中的第i区域至第j区域的交通流量。
训练样本获取装置110既可以获取与序列数据有关的信息,并通过对信息进行处理来获得对应的序列数据并构建序列训练样本,也可以直接获取序列数据并构建序列训练样本,或者也可以直接从外部获取由其他装置产生的序列训练样本集。例如,训练样本获取装置110可通过手动、半自动或全自动的方式来获取与序列数据有关的信息,并进行统计分析来获得对应的序列数据。这里,训练样本获取装置110可通过输入装置(例如,工作站)接收用户手动输入的序列数据或与序列数据有关的信息,或者,训练样本获取装置110可通过全自动的方式从数据源获取序列数据或与序列数据有关的信息,例如,通过以软件、固件、硬件或其组合实现的定时器机制来系统地请求数据源将序列数据或与序列数据有关的信息发送给训练样本获取装置110,或者,也可在有人工干预的情况下自动进行数据或信息的获取,例如,在接收到特定的用户输入的情况下请求获取序列数据或与序列数据有关的信息。每次获取到序列数据或与序列数据有关的信息时,优选地,训练样本获取装置110可将捕获的数据存储在非易失性存储器中。作为示例,可利用数据仓库来存储获取的序列数据或与序列数据有关的信息。
这里,多个序列数据可以是不同时隙的序列数据。训练样本获取装置110可通过在获得的全部序列数据之中按照时间顺序抽取对应时隙的序列数据来得到所述多个序列数据,并利用所述多个序列数据构建序列训练样本。
在获取了对象的序列训练样本集之后,训练装置120可基于序列训练样本集训练机器学习模型。这里,所述机器学习模型可至少包括多个图卷积网络。所述多个图卷积网络可包括将利用基于所述对象的历史序列数据构建的动态图训练的第一图卷积网络以及将利用基于与所述对象有关的静态数据构建的静态图训练的第二图卷积网络。
图2是示出根据本申请示例性实施例的机器学习模型的示例的示意图。接下来,参照图2对机器学习模型的训练过程进行介绍。
具体地,根据示例性实施例,机器学习模型200可至少包括第一图卷积网络210和第二图卷积网络220。在这种情况下,训练装置120可基于所述序列训练样本集中的每个序列训练样本构建动态图,并基于与所述对象有关的静态数据构建静态图。这里,动态图可反映序列数据之间的动态相关性,随时间发生变化。静态图可反映序列数据之间的静态相关性,不随时间发生变化。例如,在交通预测场景中,动态图和静态图可被分别表示为
Figure BDA0002291182580000111
和Gs=(V,E,A),其中,V表示交通图网络中的区域的集合(即,图中节点的集合),E表示节点之间的边的集合,
Figure BDA0002291182580000112
表示与边相关的值(例如,区域之间的交通流量)的集合,此外,A可表示与边相关的值的集合,只是其不随时间变化。
根据示例性实施例,以上提及的基于所述序列训练样本集中的每个序列训练样本构建动态图可以包括:直接利用每个序列训练样本构建动态图,或者利用从每个序列训练样本提取出的时间特征构建动态图。这里,时间特征可以反映序列数据之间的时间相关性。此外,在利用每个序列训练样本构建动态图时,训练装置120可以利用每个序列训练样本中包括的多个序列数据中的每个序列数据(即,利用每个时隙的序列数据)分别构建一个动态图。另外,在交通流量预测场景中,以上提及的静态数据可以是反映交通图网络中区域的属性的静态数据。例如,静态数据可包括交通图网络中每个区域的地理信息以及交通图网络中每个区域的感兴趣节点信息,相应地,静态图可包括基于所述地理信息构建的第一静态图和基于所述感兴趣点信息构建的第二静态图。在图的构建过程中,由于图中节点承担的不同作用(例如,起点或终点),可以分别构建边来记录对应关系(例如,起点间的关系和终点间的关系)。根据示例性实施例,这样包含双重关系的图可用张量结构来表示,并且以交通图网络为例,张量结构可表示为点数(代表起点)*点数(代表终点)*时间戳数(代表时隙的个数)。此外,需要说明的是,以上提及的静态图的来源可以有很多,构建方式也可以不一样,不一定是基于地理信息构建的第一静态图和基于感兴趣点信息构建的第二静态图,而是可以利用其他静态数据(例如,每个区域附近的人口密度)来构建静态图,本申请对此并无限制。
在构建了动态图和静态图之后,训练装置120可将序列训练样本集中的每个序列训练样本分别输入第一图卷积网络210和第二图卷积网络220,并且基于每个序列训练样本,利用所述动态图训练第一图卷积网络210并利用所述静态图训练第二图卷积网络220。如上所述,静态图可包括基于地理信息构建的第一静态图和基于感兴趣点信息构建的第二静态图,相应地,第二图卷积网络220可包括利用第一静态图训练的第二图卷积网络和利用第二静态图训练的第二图卷积网络。需要说明的是,在本申请中,第二图卷积网络的数量不限于一个,而是可以是多个。此外,在本申请中,第一图卷积网络和第二图卷积网络可以是二维图卷积网络(2D-GCN),但不限于此。
根据另一示例性实施例,参照图2,机器学习模型200除了包括第一图卷积网络210和第二图卷积网络220之外,还可包括基于所述多个图卷积网络的输出执行预测的子预测模型230。在这种情况下,训练装置120还可基于第一图卷积网络和第二图卷积网络分别针对每个序列训练样本的输出来构建子训练样本,并利用所述子训练样本训练子预测模型230。这里,子预测模型可以是逻辑回归模型和决策树模型中的一个,但不限于此。例如,在子训练模型是逻辑回归模型时,训练装置120可将第一图卷积网络针对每个序列训练样本的第一输出和第二图卷积网络针对训练样本的第二输出分别作为子训练样本的特征来构建子训练样本,并利用子训练样本来训练逻辑回归模型以确定该逻辑回归模型的参数。这里,子训练样本的标记可以是每个序列训练样本中的最后一个序列数据所对应的时隙之后的下一时隙的序列数据。可选地,训练装置120也可将第一输出和第二输出的平均值作为子训练样本的特征来构建子训练样本,本发明对子训练样本的构建方式并无限制,只要其能够融合多个图卷积网络的输出即可。
根据另一示例性实施例,机器学习模型200除了包括多个图卷积网络之外,还可包括用于提取序列数据的时间特征的回溯神经网络205。这里,回溯神经网络205可以是长短期记忆LSTM网络,但不限于此,而是可以是任何适于处理序列数据的回溯神经网络。在机器学习模型200包括回溯神经网络的情况下,训练装置120可首先基于所述序列训练样本集中的每个序列训练样本构建动态图,并基于与所述对象有关的静态数据构建静态图;随后,训练装置120可将所述序列训练样本集中的每个序列训练样本输入回溯神经网络205,并利用回溯神经网络205提取每个序列训练样本的时间特征。例如,当将序列训练样本(Xt-24×7,Xt-24,Xt-3,Xt-2,Xt-1)输入LSTM时,最终提取的时间特征可被表示为:
Figure BDA0002291182580000131
最后,训练装置120可将提取的每个序列训练样本的时间特征分别输入第一图卷积网络和第二图卷积网络,并且基于每个序列训练样本的时间特征,训练所述回溯神经网络并且利用所述动态图训练第一图卷积网络并利用所述静态图训练第二图卷积网络。也就是说,在这种情况下,训练装置120可以基于利用回溯神经网络205提取的时间特征来构建动态图,并且在利用构建的图训练后续模型时也可以使用提取的时间特征。例如,当提取的时间特征通过每个图卷积网络时,每个图卷积网络可执行以下计算:
Figure BDA0002291182580000132
其中,×n表示对张量的第n维的矩阵乘法,L是拉普拉斯矩阵,
Figure BDA0002291182580000133
是图卷积网络的第l层的可学习的权重矩阵,
Figure BDA0002291182580000141
是地l层的隐藏状态,σ(·)是激活函数,Ti代表切比雪夫多项式。
此外,根据本申请另一示例性实施例,机器学习模型200除了包括回溯神经网络205以及第一图卷积网络210和第二图卷积网络230之外,还可包括子预测模型230。在这种情况下,训练装置120还可基于第一图卷积网络和第二图卷积网络分别针对每个序列训练样本的时间特征的输出来构建子训练样本,并利用子训练样本训练子预测模型230。
针对以上提及的机器学习模型,可定义合适的损失函数,并最终在损失函数的取值最小时确定机器学习模型的参数。例如,可使用均方误差(MSE)损失函数J,J可被表示如下:
Figure BDA0002291182580000142
其中,xij是序列数据的真实值(例如,在交通流量预测场景中,xij为第i区域与第j区域之间的交通流量),
Figure BDA0002291182580000143
是序列数据的预测值,yij是与xij对应的指示值(例如,当xij是非零值时,yij=1;当xij是零值时,yij=0)。
最终,机器学习模型200可被训练为针对按时间顺序排列的一系列序列数据来预测所述一系列序列数据之后的下一序列数据。例如,在交通流量预测场景中,机器学习模型200可被训练为针对按时间顺序排列的不同时隙的一系列交通流量数据来预测下一时隙的交通流量数据。
以上已经参照图1和图2对根据本发明示例性实施例的训练系统100和机器学习模型200进行了描述。根据以上示例性实施例训练的基于图卷积网络的机器学习模型可以有效地处理动态图和静态图的融合,从而能够提供更准确的预测效果。
需要说明的是,尽管以上在描述模型训练系统100时将其划分为用于分别执行相应处理的装置(例如,训练样本获取装置110和训练装置120),然而,本领域技术人员清楚的是,上述各装置执行的处理也可以在模型训练系统100不进行任何具体装置划分或者各装置之间并无明确划界的情况下执行。此外,以上参照图1所描述的模型训练系统100并不限于包括以上描述的装置,而是还可以根据需要增加一些其他装置(例如,存储装置、数据处理装置等),或者以上装置也可被组合。
图3是示出根据本申请示例性实施例的训练用于预测序列数据的机器学习模型的方法(以下,为描述方便,将其简称为“模型训练方法”)的流程图。
这里,作为示例,图3所示的模型训练方法可由图1所示的模型训练系统100来执行,也可完全通过计算机程序或指令以软件方式实现,还可通过特定配置的计算系统或计算装置来执行,例如,可通过包括至少一个计算装置和至少一个存储指令的存储装置的系统来执行,其中,所述指令在被所述至少一个计算装置运行时,促使所述至少一个计算装置执行上述模型训练方法。为了描述方便,假设图3所示的模型训练方法由图1所示的模型训练系统100来执行,并假设模型训练系统100可具有图1所示的配置。
参照图3,在步骤S310,训练样本获取装置110可获取对象的序列训练样本集。这里,序列训练样本集可包括多个序列训练样本,并且每个序列训练样本可包括按时间顺序排列的多个序列数据。作为示例,对象可以是交通车辆,序列数据可以是在不同时隙交通图网络中区域之间的交通流量数据,但不限于此。以上已经参照图1对序列数据和序列数据的获取等进行了描述,这里不再赘述,参照图1所描述的相关内容同样适用于此。
接下来,在步骤S320,训练装置120可基于序列训练样本集训练机器学习模型。具体地,这里的机器学习模型可至少包括多个图卷积网络。所述多个图卷积网络可包括将利用基于所述对象的历史序列数据构建的动态图训练的第一图卷积网络以及将利用基于与所述对象有关的静态数据构建的静态图训练的第二图卷积网络。由于已经参照图2对机器学习模型的结构示例以及在各种示例情况下如何训练机器学习模型等进行了描述,因此,这里不再赘述,相关内容可参见关于图2的描述。
另外,以上参照图1在描述模型训练系统中包括的各个装置时所提及的内容均适用于这里,故关于以上步骤中所涉及的相关细节,可参见关于图1的相应描述,这里均不再赘述。
在下文中,将参照图4至图6对利用训练出的机器学习模型预测序列数据的过程进行描述。
图4是示出根据本申请示例性实施例的利用基于图卷积网络的机器学习模型预测序列数据的系统(以下,为描述方便,将其简称为“预测系统”)400的框图。
参照图4,预测系统400可包括预测样本获取装置410和预测装置420。具体地,预测样本获取装置410可被配置为获取对象的序列预测样本。这里,序列预测样本可包括按时间顺序排列的多个序列数据。预测装置420可利用基于图卷积网络的机器学习模型,针对序列预测样本执行预测来提供关于所述多个序列数据之后的下一序列数据的预测结果。如以上参照图1至图3所述,所述机器学习模型已经被事先训练为针对按时间顺序排列的一系列序列数据来预测所述一系列序列数据之后的下一序列数据,并且所述机器学习模型至少包括多个图卷积网络。所述多个图卷积网络包括利用基于所述对象的历史序列数据构建的动态图训练出的第一图卷积网络以及利用基于与所述对象有关的静态数据构建的静态图训练出的第二图卷积网络。作为示例,动态图可以是直接利用所述对象的历史序列数据构建的,或者动态图可以是利用从所述历史序列数据提取出的时间特征构建的。关于图的构建以及机器学习模型的训练的相关描述已经参照图1至图3进行了描述,这里不再赘述。
作为示例,在交通流量预测场景中,以上提及的对象可以是交通车辆,序列数据可以是在不同时隙交通图网络中区域之间的交通流量数据,静态数据可以是反映交通图网络中区域的属性的静态数据。根据示例性实施例,静态数据可包括交通图网络中每个区域的地理信息以及交通图网络中每个区域的感兴趣点信息,但不限于此。相应地,以上提及的静态图可包括基于所述地理信息构建的第一静态图和基于所述感兴趣点信息构建的第二静态图,但不限于此。相应地,第二图卷积网络可包括利用第一静态图训练出的第二图卷积网络和利用第二静态图训练出的第二图卷积网络,但不限于此。在交通流程预测场景中,预测装置可被配置为利用上述机器学习模型,针对按时间顺序排列的不同时隙的一系列交通流量数据来预测下一时隙的交通流量数据。
以下,将对预测装置420执行预测的过程进行详细描述。
根据示例性实施例,在执行预测时,预测装置420可首先将序列预测样本分别输入第一图卷积网络和第二图卷积网络,然后,利用第一图卷积网络获得针对所述序列预测样本的第一预测结果并利用第二图卷积网络获得针对所述序列预测样本的第二预测结果,最后,预测装置420可按照预定规则将第一预测结果和第二预测结果进行融合来提供关于所述多个序列数据之后的下一序列数据的预测结果。作为示例,按照预定规则将第一预测结果和第二预测结果进行融合来提供关于所述多个序列数据之后的下一序列数据的预测结果可以是将第一预测结果和第二预测结果取平均来获得关于所述多个序列数据之后的下一序列数据的预测结果。然而,本领域技术人员清楚的是,预定规则不限于对第一预测结果和第二预测结果取平均,而是可以由用户预先定义对第一预测结果和第二预测结果进行融合的任何适当的计算手段。
如以上参照图2所述,机器学习模型还可包括基于所述多个图卷积网络的输出执行预测的子预测模型,关于该子预测模型的训练已经在之前的描述中提及,这里不再赘述。在机器学习模型除了包括第一图卷积网络和第二图卷积网络之外还包括子预测模型的情况下,在执行预测时,预测装置420可首先将序列预测样本分别输入第一图卷积网络和第二图卷积网络,利用第一图卷积网络获得针对所述序列预测样本的第一预测结果并利用第二图卷积网络获得针对所述序列预测样本的第二预测结果,然后,基于获得的第一预测结果和第二预测结果构建子预测样本,最后,预测装置420可利用子预测模型,针对构建的子预测样本执行预测来提供关于所述多个序列数据之后的下一序列数据的预测结果。这里,构建子预测样本的方式与以上参照图1和图2所提及的构建子训练样本的方式相同,这里不再赘述。
如以上参照图2所述,根据另一示例性实施例,机器学习模型除了包括第一图卷积网络和第二图卷积网络之外还可包括用于提取序列数据的时间特征的回溯神经网络。在这种情况下,当执行预测时,预测装置420可首先将所述序列预测样本输入所述回溯神经网络,并利用所述回溯神经网络提取所述序列预测样本的时间特征,然后,将提取的时间特征分别输入第一图卷积网络和第二图卷积网络,利用第一图卷积网络获得针对所述序列预测样本的第一预测结果并利用第二图卷积网络获得针对所述序列预测样本的第二预测结果。最后,预测装置420可按照预定规则将第一预测结果和第二预测结果进行融合来提供关于所述多个序列数据之后的下一序列数据的预测结果。关于按照预定规则对第一预测结果和第二预测结果进行融合的方式,以上已经提及,这里不再赘述。
根据另一示例性实施例,机器学习模型除了包括第一图卷积网络和第二图卷积网络以及用于提取序列数据的时间特征的回溯神经网络之外,还可包括基于所述多个图卷积网络的输出执行预测的子预测模型。在这种情况下,当执行预测时,预测装置420可通过以下方式来获得关于下一序列数据的预测结果:将序列预测样本输入所述回溯神经网络,并利用所述回溯神经网络提取序列预测样本的时间特征;将提取的时间特征分别输入第一图卷积网络和第二图卷积网络,利用第一图卷积网络获得针对所述序列预测样本的第一预测结果并利用第二图卷积网络获得针对所述序列预测样本的第二预测结果;基于获得的第一预测结果和第二预测结果构建子预测样本;利用子预测模型,针对构建的子预测样本执行预测来提供关于所述多个序列数据之后的下一序列数据的预测结果。
作为示例,以上提及的回溯神经网络可以是长短期记忆LSTM网络,但不限于此,只要该回溯神经网络是适于处理序列数据的回溯神经网络即可。第一图卷积网络和第二图卷积网络可以是二维图卷积网络,但不限于此。另外,子预测模型可以是逻辑回归模型和决策树模型中的一个,但不限于此。
为了便于更直观地理解本发明构思,以下参照图5对利用基于图卷积网络的机器学习模型预测序列数据的示例性过程进行描述。图5中示出机器学习模型包括LSTM、三个二维图卷积网络以及LR模型,然而,根据以上参照图1至图4的描述可知,机器学习模型的结构不限于图5的示例。
参照图5,在执行预测时,预测装置420可将包括多个历史序列数据的序列预测样本输入到LSTM,通过LSTM可提取序列预测样本的时间特征,进而可学习序列数据的时间相关性。随后,预测装置420可将时间特征分别输入利用动态图训练的2D-GCN、利用第一静态图(例如,第一静态图可以是基于交通图网络中每个区域的地理信息构建的)训练的2D-GCN以及利用第二静态图(例如,第二静态图可以是基于交通图网络中每个区域的感兴趣点信息构建的)训练的2D-GCN,从而可学习序列数据的空间相关性。随后,预测装置420可基于每个2D-GCN的输出构建子预测样本,并将子预测样本输入LR模型,即,利用LR模型将每个2D-GCN针对序列预测样本的预测结果进行融合,最终预测出下一序列数据。
以上,已经参照图4和图5描述了根据示例性实施例的预测系统。根据示例性实施例的预测系统可利用基于图卷积网络的机器学习模型有效地处理动态图和静态图的融合,因此能够处理双重关系图网络以及图中点之间的关系的动态性,并且可提高预测的准确性。例如,在交通预测场景中,利用根据示例性实施例的预测系统可有效地提高交流流量预测的准确性。
需要说明的是,尽管以上在描述预测系统400时将其划分为用于分别执行相应处理的装置(例如,预测样本获取装置410和预测装置420),然而,本领域技术人员清楚的是,上述各装置执行的处理也可以在预测系统400不进行任何具体装置划分或者各装置之间并无明确划界的情况下执行。此外,以上参照图4所描述的预测系统400并不限于包括以上描述的装置,而是还可以根据需要增加一些其他装置(例如,存储装置、数据处理装置等),或者以上装置也可被组合。而且,作为示例,以上参照图1描述的模型训练系统100和预测系统400也可被组合为一个系统,或者是彼此独立的系统,本申请对此并无限制。
图6是示出根据本申请示例性实施例的利用基于图卷积网络的机器学习模型预测序列数据的方法(以下,为描述方便,将其简称为“预测方法”)的流程图。
这里,作为示例,图6所示的预测方法可由图4所示的预测系统400来执行,也可完全通过计算机程序或指令以软件方式实现,还可通过特定配置的计算系统或计算装置来执行,例如,可通过包括至少一个计算装置和至少一个存储指令的存储装置的系统来执行,其中,所述指令在被所述至少一个计算装置运行时,促使所述至少一个计算装置执行上述预测方法。为了描述方便,假设图6所示的预测方法由图4所示的预测系统400来执行,并假设预测系统400可具有图4所示的配置。
参照图6,在步骤S610,预测样本获取装置410可获取对象的序列预测样本。这里,序列预测样本可包括按时间顺序排列的多个序列数据。关于预测样本获取装置410获取对象的序列预测样本所涉及的内容(例如,关于对象、序列数据等的描述)可参见图5的描述,这里不再赘述。
在步骤S620,预测装置420可利用基于图卷积网络的机器学习模型,针对在步骤S610获取的序列预测样本执行预测来提供关于所述多个序列数据之后的下一序列数据的预测结果。这里,所述机器学习模型被事先训练为针对按时间顺序排列的一系列序列数据来预测所述一系列序列数据之后的下一序列数据,并且所述机器学习模型至少包括多个图卷积网络。具体地,所述多个图卷积网络可包括利用基于所述对象的历史序列数据构建的动态图训练出的第一图卷积网络以及利用基于与所述对象有关的静态数据构建的静态图训练出的第二图卷积网络。关于机器学习模型的相关细节以及在机器学习模型的不同结构下执行预测的过程,已经参照图4至图5进行了描述,这里不再赘述。
此外,由于图6所示的预测方法可由图4所示的预测系统400来执行,因此,故关于以上步骤中所涉及的任何相关细节,可参见图4的相应描述,为简洁起见,这里均不再赘述。
以上已参照图1至图6描述了根据本申请示例性实施例模型训练系统和训练方法以及预测系统和预测方法。
然而,应理解的是:图1和图4所示出的系统及其装置可被分别配置为执行特定功能的软件、硬件、固件或上述项的任意组合。例如,这些系统或装置可对应于专用的集成电路,也可对应于纯粹的软件代码,还可对应于软件与硬件相结合的模块。此外,这些系统或装置所实现的一个或多个功能也可由物理实体设备(例如,处理器、客户端或服务器等)中的组件来统一执行。
此外,上述方法可通过记录在计算机可读存储介质上的指令来实现,例如,根据本申请的示例性实施例,可提供一种存储指令的计算机可读存储介质,其中,当所述指令被至少一个计算装置运行时,促使所述至少一个计算装置执行以下步骤:获取对象的序列训练样本集,其中,所述序列训练样本集包括多个序列训练样本,并且每个序列训练样本包括按时间顺序排列的多个序列数据;基于所述序列训练样本集,训练所述机器学习模型,其中,所述机器学习模型至少包括多个图卷积网络,其中,所述多个图卷积网络包括将利用基于所述对象的历史序列数据构建的动态图训练的第一图卷积网络以及将利用基于与所述对象有关的静态数据构建的静态图训练的第二图卷积网络。
此外,根据本申请的另一示例性实施例,可提供一种存储指令的计算机可读存储介质,其中,当所述指令被至少一个计算装置运行时,促使所述至少一个计算装置执行以下步骤:获取对象的序列预测样本,其中,所述序列预测样本包括按时间顺序排列的多个序列数据;利用所述机器学习模型,针对所述序列预测样本执行预测来提供关于所述多个序列数据之后的下一序列数据的预测结果,其中,所述机器学习模型被事先训练为针对按时间顺序排列的一系列序列数据来预测所述一系列序列数据之后的下一序列数据,并且所述机器学习模型至少包括多个图卷积网络,其中,所述多个图卷积网络包括利用基于所述对象的历史序列数据构建的动态图训练出的第一图卷积网络以及利用基于与所述对象有关的静态数据构建的静态图训练出的第二图卷积网络。
上述计算机可读存储介质中存储的指令可在诸如客户端、主机、代理装置、服务器等计算机设备中部署的环境中运行,应注意,所述指令还可在执行上述步骤时执行更为具体的处理,这些进一步处理的内容已经在参照图3和图6描述的过程中提及,因此这里为了避免重复将不再进行赘述。
应注意,根据本公开示例性实施例的模型训练系统和预测系统可完全依赖计算机程序或指令的运行来实现相应的功能,即,各个装置在计算机程序的功能架构中与各步骤相应,使得整个系统通过专门的软件包(例如,lib库)而被调用,以实现相应的功能。
另一方面,当图1和图4所示的系统和装置以软件、固件、中间件或微代码实现时,用于执行相应操作的程序代码或者代码段可以存储在诸如存储介质的计算机可读介质中,使得至少一个处理器或至少一个计算装置可通过读取并运行相应的程序代码或者代码段来执行相应的操作。
例如,根据本申请示例性实施例,可提供一种包括至少一个计算装置和存储指令的至少一个存储装置的系统,其中,所述指令在被所述至少一个计算装置运行时,促使所述至少一个计算装置执行下述步骤:获取对象的序列训练样本集,其中,所述序列训练样本集包括多个序列训练样本,并且每个序列训练样本包括按时间顺序排列的多个序列数据;基于所述序列训练样本集,训练所述机器学习模型,其中,所述机器学习模型至少包括多个图卷积网络,其中,所述多个图卷积网络包括将利用基于所述对象的历史序列数据构建的动态图训练的第一图卷积网络以及将利用基于与所述对象有关的静态数据构建的静态图训练的第二图卷积网络。
例如,根据本申请另一示例性实施例,可提供一种包括至少一个计算装置和存储指令的至少一个存储装置的系统,其中,所述指令在被所述至少一个计算装置运行时,促使所述至少一个计算装置执行下述步骤:获取对象的序列预测样本,其中,所述序列预测样本包括按时间顺序排列的多个序列数据;利用所述机器学习模型,针对所述序列预测样本执行预测来提供关于所述多个序列数据之后的下一序列数据的预测结果,其中,所述机器学习模型被事先训练为针对按时间顺序排列的一系列序列数据来预测所述一系列序列数据之后的下一序列数据,并且所述机器学习模型至少包括多个图卷积网络,其中,所述多个图卷积网络包括利用基于所述对象的历史序列数据构建的动态图训练出的第一图卷积网络以及利用基于与所述对象有关的静态数据构建的静态图训练出的第二图卷积网络。
具体说来,上述系统可以部署在服务器或客户端中,也可以部署在分布式网络环境中的节点上。此外,所述系统可以是PC计算机、平板装置、个人数字助理、智能手机、web应用或其他能够执行上述指令集合的装置。此外,所述系统还可包括视频显示器(诸如,液晶显示器)和用户交互接口(诸如,键盘、鼠标、触摸输入装置等)。另外,所述系统的所有组件可经由总线和/或网络而彼此连接。
这里,所述系统并非必须是单个系统,还可以是任何能够单独或联合执行上述指令(或指令集)的装置或电路的集合体。所述系统还可以是集成控制系统或系统管理器的一部分,或者可被配置为与本地或远程(例如,经由无线传输)以接口互联的便携式电子装置。
在所述系统中,所述至少一个计算装置可包括中央处理器(CPU)、图形处理器(GPU)、可编程逻辑装置、专用处理器系统、微控制器或微处理器。作为示例而非限制,所述至少一个计算装置还可包括模拟处理器、数字处理器、微处理器、多核处理器、处理器阵列、网络处理器等。计算装置可运行存储在存储装置之一中的指令或代码,其中,所述存储装置还可以存储数据。指令和数据还可经由网络接口装置而通过网络被发送和接收,其中,所述网络接口装置可采用任何已知的传输协议。
存储装置可与计算装置集成为一体,例如,将RAM或闪存布置在集成电路微处理器等之内。此外,存储装置可包括独立的装置,诸如,外部盘驱动、存储阵列或任何数据库系统可使用的其他存储装置。存储装置和计算装置可在操作上进行耦合,或者可例如通过I/O端口、网络连接等互相通信,使得计算装置能够读取存储在存储装置中的指令。
以上描述了本申请的各示例性实施例,应理解,上述描述仅是示例性的,并非穷尽性的,本申请不限于所披露的各示例性实施例。在不偏离本申请的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。因此,本申请的保护范围应该以权利要求的范围为准。

Claims (10)

1.一种利用基于图卷积网络的机器学习模型预测序列数据的方法,包括:
获取对象的序列预测样本,其中,所述序列预测样本包括按时间顺序排列的多个序列数据;
利用所述机器学习模型,针对所述序列预测样本执行预测来提供关于所述多个序列数据之后的下一序列数据的预测结果,
其中,所述机器学习模型被事先训练为针对按时间顺序排列的一系列序列数据来预测所述一系列序列数据之后的下一序列数据,并且所述机器学习模型至少包括多个图卷积网络,其中,所述多个图卷积网络包括利用基于所述对象的历史序列数据构建的动态图训练出的第一图卷积网络以及利用基于与所述对象有关的静态数据构建的静态图训练出的第二图卷积网络。
2.如权利要求1所述的方法,其中,针对所述序列预测样本执行预测来提供关于所述多个序列数据之后的下一序列数据的预测结果的步骤包括:
将所述序列预测样本分别输入第一图卷积网络和第二图卷积网络;
利用第一图卷积网络获得针对所述序列预测样本的第一预测结果并利用第二图卷积网络获得针对所述序列预测样本的第二预测结果;
按照预定规则将第一预测结果和第二预测结果进行融合来提供关于所述多个序列数据之后的下一序列数据的预测结果。
3.如权利要求2所述的方法,其中,按照预定规则将第一预测结果和第二预测结果进行融合来提供关于所述多个序列数据之后的下一序列数据的预测结果包括:将第一预测结果和第二预测结果取平均来获得关于所述多个序列数据之后的下一序列数据的预测结果。
4.一种存储指令的计算机可读存储介质,其中,当所述指令被至少一个计算装置运行时,促使所述至少一个计算装置执行如权利要求1至3中的任一权利要求所述的方法。
5.一种包括至少一个计算装置和存储指令的至少一个存储装置的系统,其中,所述指令在被所述至少一个计算装置运行时,促使所述至少一个计算装置执行如权利要求1至3中的任一权利要求所述的方法。
6.一种利用基于图卷积网络的机器学习模型预测序列数据的系统,包括:
预测样本获取装置,被配置为获取对象的序列预测样本,其中,所述序列预测样本包括按时间顺序排列的多个序列数据;
预测装置,被配置为利用所述机器学习模型,针对所述序列预测样本执行预测来提供关于所述多个序列数据之后的下一序列数据的预测结果,
其中,所述机器学习模型被事先训练为针对按时间顺序排列的一系列序列数据来预测所述一系列序列数据之后的下一序列数据,并且所述机器学习模型至少包括多个图卷积网络,其中,所述多个图卷积网络包括利用基于所述对象的历史序列数据构建的动态图训练出的第一图卷积网络以及利用基于与所述对象有关的静态数据构建的静态图训练出的第二图卷积网络。
7.一种训练用于预测序列数据的基于图卷积网络的机器学习模型的方法,包括:
获取对象的序列训练样本集,其中,所述序列训练样本集包括多个序列训练样本,并且每个序列训练样本包括按时间顺序排列的多个序列数据;
基于所述序列训练样本集,训练所述机器学习模型,
其中,所述机器学习模型至少包括多个图卷积网络,其中,所述多个图卷积网络包括将利用基于所述对象的历史序列数据构建的动态图训练的第一图卷积网络以及将利用基于与所述对象有关的静态数据构建的静态图训练的第二图卷积网络。
8.一种存储指令的计算机可读存储介质,其中,当所述指令被至少一个计算装置运行时,促使所述至少一个计算装置执行如权利要求7所述的方法。
9.一种包括至少一个计算装置和存储指令的至少一个存储装置的系统,其中,所述指令在被所述至少一个计算装置运行时,促使所述至少一个计算装置执行如权利要求7所述的方法。
10.一种训练用于预测序列数据的基于图卷积网络的机器学习模型的系统,包括:
训练样本获取装置,被配置为获取对象的序列训练样本集,其中,所述序列训练样本集包括多个序列训练样本,并且每个序列训练样本包括按时间顺序排列的多个序列数据;
训练装置,被配置为基于所述序列训练样本集,训练所述机器学习模型,
其中,所述机器学习模型至少包括多个图卷积网络,其中,所述多个图卷积网络包括将利用基于所述对象的历史序列数据构建的动态图训练的第一图卷积网络以及将利用基于与所述对象有关的静态数据构建的静态图训练的第二图卷积网络。
CN201911180700.2A 2019-11-27 2019-11-27 训练模型的方法及系统和预测序列数据的方法及系统 Active CN110909942B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202211073426.0A CN115423190A (zh) 2019-11-27 2019-11-27 训练模型的方法及系统和预测序列数据的方法及系统
CN201911180700.2A CN110909942B (zh) 2019-11-27 2019-11-27 训练模型的方法及系统和预测序列数据的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911180700.2A CN110909942B (zh) 2019-11-27 2019-11-27 训练模型的方法及系统和预测序列数据的方法及系统

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202211073426.0A Division CN115423190A (zh) 2019-11-27 2019-11-27 训练模型的方法及系统和预测序列数据的方法及系统

Publications (2)

Publication Number Publication Date
CN110909942A true CN110909942A (zh) 2020-03-24
CN110909942B CN110909942B (zh) 2022-07-19

Family

ID=69819842

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201911180700.2A Active CN110909942B (zh) 2019-11-27 2019-11-27 训练模型的方法及系统和预测序列数据的方法及系统
CN202211073426.0A Pending CN115423190A (zh) 2019-11-27 2019-11-27 训练模型的方法及系统和预测序列数据的方法及系统

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202211073426.0A Pending CN115423190A (zh) 2019-11-27 2019-11-27 训练模型的方法及系统和预测序列数据的方法及系统

Country Status (1)

Country Link
CN (2) CN110909942B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111429185A (zh) * 2020-03-27 2020-07-17 京东城市(北京)数字科技有限公司 人群画像预测方法、装置、设备及存储介质
CN111428147A (zh) * 2020-03-25 2020-07-17 合肥工业大学 结合社交和兴趣信息的异源图卷积网络的社交推荐方法
CN111537831A (zh) * 2020-04-01 2020-08-14 华中科技大学鄂州工业技术研究院 一种配电网线路故障定位方法及装置
CN111931859A (zh) * 2020-08-28 2020-11-13 中国科学院深圳先进技术研究院 一种多标签图像识别方法和装置
CN113077043A (zh) * 2021-03-17 2021-07-06 华中科技大学 基于改进图卷积网络的机床刀尖动力学特征预测方法
CN113822316A (zh) * 2020-06-18 2021-12-21 香港科技大学 一种在交互式在线题库中预测学生表现的方法及设备
CN116319110A (zh) * 2023-05-24 2023-06-23 保定思齐智科信息科技有限公司 针对工业多源异构时序数据的数据采集与治理方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107169573A (zh) * 2017-05-05 2017-09-15 第四范式(北京)技术有限公司 利用复合机器学习模型来执行预测的方法及系统
CN109636049A (zh) * 2018-12-19 2019-04-16 浙江工业大学 一种结合道路网络拓扑结构与语义关联的拥堵指数预测方法
CN109754605A (zh) * 2019-02-27 2019-05-14 中南大学 一种基于注意力时态图卷积网络的交通预测方法
CN110276947A (zh) * 2019-06-05 2019-09-24 中国科学院深圳先进技术研究院 一种交通融合分析预测方法、系统及电子设备
CN110415516A (zh) * 2019-07-15 2019-11-05 厦门大学 基于图卷积神经网络的城市交通流预测方法及介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107169573A (zh) * 2017-05-05 2017-09-15 第四范式(北京)技术有限公司 利用复合机器学习模型来执行预测的方法及系统
CN109636049A (zh) * 2018-12-19 2019-04-16 浙江工业大学 一种结合道路网络拓扑结构与语义关联的拥堵指数预测方法
CN109754605A (zh) * 2019-02-27 2019-05-14 中南大学 一种基于注意力时态图卷积网络的交通预测方法
CN110276947A (zh) * 2019-06-05 2019-09-24 中国科学院深圳先进技术研究院 一种交通融合分析预测方法、系统及电子设备
CN110415516A (zh) * 2019-07-15 2019-11-05 厦门大学 基于图卷积神经网络的城市交通流预测方法及介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
DI CHAI等: "Bike Flow Prediction with Multi-Graph Convolutional Networks", 《ARXIV.ORG》 *
徐冰冰等: "图卷积神经网络综述", 《计算机学报》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111428147A (zh) * 2020-03-25 2020-07-17 合肥工业大学 结合社交和兴趣信息的异源图卷积网络的社交推荐方法
CN111428147B (zh) * 2020-03-25 2021-07-27 合肥工业大学 结合社交和兴趣信息的异源图卷积网络的社交推荐方法
CN111429185A (zh) * 2020-03-27 2020-07-17 京东城市(北京)数字科技有限公司 人群画像预测方法、装置、设备及存储介质
CN111429185B (zh) * 2020-03-27 2023-06-02 京东城市(北京)数字科技有限公司 人群画像预测方法、装置、设备及存储介质
CN111537831A (zh) * 2020-04-01 2020-08-14 华中科技大学鄂州工业技术研究院 一种配电网线路故障定位方法及装置
CN111537831B (zh) * 2020-04-01 2022-06-24 华中科技大学鄂州工业技术研究院 一种配电网线路故障定位方法及装置
CN113822316A (zh) * 2020-06-18 2021-12-21 香港科技大学 一种在交互式在线题库中预测学生表现的方法及设备
CN113822316B (zh) * 2020-06-18 2024-01-12 香港科技大学 一种在交互式在线题库中预测学生表现的方法及设备
CN111931859A (zh) * 2020-08-28 2020-11-13 中国科学院深圳先进技术研究院 一种多标签图像识别方法和装置
CN111931859B (zh) * 2020-08-28 2023-10-24 中国科学院深圳先进技术研究院 一种多标签图像识别方法和装置
CN113077043B (zh) * 2021-03-17 2022-05-20 华中科技大学 基于改进图卷积网络的机床刀尖动力学特征预测方法
CN113077043A (zh) * 2021-03-17 2021-07-06 华中科技大学 基于改进图卷积网络的机床刀尖动力学特征预测方法
CN116319110A (zh) * 2023-05-24 2023-06-23 保定思齐智科信息科技有限公司 针对工业多源异构时序数据的数据采集与治理方法
CN116319110B (zh) * 2023-05-24 2023-08-11 保定思齐智科信息科技有限公司 针对工业多源异构时序数据的数据采集与治理方法

Also Published As

Publication number Publication date
CN110909942B (zh) 2022-07-19
CN115423190A (zh) 2022-12-02

Similar Documents

Publication Publication Date Title
CN110909942B (zh) 训练模型的方法及系统和预测序列数据的方法及系统
US11836576B2 (en) Distributed machine learning at edge nodes
JP6913695B2 (ja) スタックトレース情報を符号化するための圧縮技術
US11068658B2 (en) Dynamic word embeddings
CN110476172A (zh) 用于卷积神经网络的神经架构搜索
WO2019114423A1 (zh) 对模型预测值进行融合的方法、装置和设备
CN111783810B (zh) 用于确定用户的属性信息的方法和装置
CN110413867B (zh) 用于内容推荐的方法及系统
US11574259B2 (en) Parking lot free parking space predicting method, apparatus, electronic device and storage medium
US20210012191A1 (en) Performing multivariate time series prediction with three-dimensional transformations
CN115427967A (zh) 确定多变量时间序列数据依赖性
US20220198278A1 (en) System for continuous update of advection-diffusion models with adversarial networks
US20220138537A1 (en) Probabilistic nonlinear relationships cross-multi time series and external factors for improved multivariate time series modeling and forecasting
CN116438555A (zh) 用于具有用户交互的时间序列预测的自动深度学习架构选择
CN107729473B (zh) 文章推荐方法及其装置
CN112288483A (zh) 用于训练模型的方法和装置、用于生成信息的方法和装置
WO2019212570A1 (en) Transition regularized matrix factorization for sequential recommendation
CN115186738B (zh) 模型训练方法、装置和存储介质
CN110633596A (zh) 预测车辆方向角的方法和装置
US20230408726A1 (en) Weather forecasting using teleconnections
CN110633707A (zh) 预测速度的方法和装置
US20230185791A1 (en) Prioritized data cleaning
CN114866845B (zh) 一种基于短视频发布的信息检测方法及系统
CN116107666B (zh) 程序业务流信息生成方法、装置、电子设备和计算机介质
CN114792258B (zh) 信息生成方法、装置、电子设备和计算机可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant